[go: up one dir, main page]

JP7250693B2 - 初期ステージの肺がん診断のための血漿ベースのタンパク質プロファイリング - Google Patents

初期ステージの肺がん診断のための血漿ベースのタンパク質プロファイリング Download PDF

Info

Publication number
JP7250693B2
JP7250693B2 JP2019555107A JP2019555107A JP7250693B2 JP 7250693 B2 JP7250693 B2 JP 7250693B2 JP 2019555107 A JP2019555107 A JP 2019555107A JP 2019555107 A JP2019555107 A JP 2019555107A JP 7250693 B2 JP7250693 B2 JP 7250693B2
Authority
JP
Japan
Prior art keywords
classifier
biomarkers
classification system
biomarker
system comprises
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019555107A
Other languages
English (en)
Other versions
JP2020515993A (ja
Inventor
シェリル ゴーベル,
クリストファー ルーデン,
トーマス シー. ロング,
Original Assignee
ラング キャンサー プロテオミクス, エルエルシー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ラング キャンサー プロテオミクス, エルエルシー filed Critical ラング キャンサー プロテオミクス, エルエルシー
Publication of JP2020515993A publication Critical patent/JP2020515993A/ja
Application granted granted Critical
Publication of JP7250693B2 publication Critical patent/JP7250693B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • C12Q1/6825Nucleic acid detection involving sensors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/15Correlation function computation including computation of convolution operations
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/042Knowledge-based neural networks; Logical representations of neural networks
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/086Learning methods using evolutionary algorithms, e.g. genetic algorithms or genetic programming
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/40ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Theoretical Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Databases & Information Systems (AREA)
  • Biomedical Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Software Systems (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • Analytical Chemistry (AREA)
  • Mathematical Physics (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Primary Health Care (AREA)
  • Genetics & Genomics (AREA)
  • Immunology (AREA)
  • Evolutionary Biology (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Computation (AREA)
  • Biochemistry (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Microbiology (AREA)
  • Mathematical Analysis (AREA)

Description

発明の背景
発明の分野
本発明は、バイオマーカーおよびそのキットを使用した肺疾患の検出、同定、および診断、ならびにバイオマーカーに基づいて肺疾患の存在または非存在の可能性を決定することを補助するシステムに関する。より詳細には、本発明は、特定のバイオマーカーの発現レベルを測定し、これらの測定値をランダムフォレストなどの分類システムに入力することによる非小細胞肺がん(NSCLC)の診断に関する。
関連技術の説明
ヒト肺組織の病状
American Cancer Society,Inc.により、2007年だけで、呼吸器系のがんの新しい症例は229,400件、呼吸器系のがんによる死は164,840件になると推定された。がんが検出されたがまだ限局性である場合の全てのがんの症例の5年生存率は46%であるが、肺がん患者の5年生存率はたった13%である。対応して、疾患が拡散する前に発見される肺がんはたった16%である。肺がんは、一般に、がん細胞の病状に基づいて2つの主要な型にカテゴリー化される。各型の名称は、がん性に転換した細胞の型に由来する。小細胞肺がんはヒト肺組織内の小細胞に由来し、非小細胞肺がんは、一般に、小細胞型ではない全ての肺がんを包含する。一般に処置が全ての非小細胞型に対して同じであるので、非小細胞肺がんはまとめて群分けされる。まとめると、非小細胞肺がん(NSCLC)は全ての肺がんの約75%を占める。
肺がん患者の低生存率に関する主要な因子は、肺がんは初期に診断することが難しいという事実である。肺がんを診断するまたはヒトにおけるその存在を同定する現行の方法は、X線、コンピュータ断層撮影(CT)スキャンを取得すること、および腫瘍の存在または非存在を物理的に決定するための同様の肺の検査に制限されている。肺がんの診断は、多くの場合、有意な期間にわたって明らかであったまたは存在した症状に応答して、および疾患がヒトにおいて物理的に検出可能な腫瘤が生じるのに十分に長く存在した後にしかなされない。
肺がんの診断
喀痰細胞診も胸部X線も、肺がんを早期検出するためのスクリーニングに有用であるとは見いだされていない。他方では、低線量コンピュータ断層撮影は、高リスク集団(例えば、ヘビースモーカー)に適用する場合に見込みが示されている。Aberleら、N. Engl. J. Med.(2011年)365巻:395~409頁。しかし、この種のスクリーニングが有益であり得る、リスクにある集団を定義するための判断基準は未だに容易に利用可能ではなく、より一般的な集団のスクリーニングに対するこの技法の有用性は明確でない。CTスキャンによって検出される大きな肺小結節は悪性腫瘍の可能性に明白に関連付けられるが、小さな小結節(<7mm)の大部分は良性であると思われる。MacMahonら、Radiology(2005年)237巻:395~400頁。したがって、早期検出および肺がんの診断を補助するための補足的なスクリーニング方法が必要とされている。
多変量医学的データの解析
1980年代後半および1990年代前半には、ロジスティック回帰が医学に使用され始めた。医学におけるロジスティック回帰の使用の例は、Trauma Revised Injury Severity Score(TRISS)である。Evaluating Trauma Care: The TRISS Method. Boyd, CR、Tolson, MAおよびCopes, WS、1987年、Journal of Trauma、27巻、370~378頁を参照されたい。TRISSは、米国の病院において、外傷後の院内死亡率を予測するため、および外傷外科手術の質の病院間での比較を行うためのやり方として使用されている。TRISSは、傷害重症度スコア、修正外傷スコアおよび年齢を共変量として用いる、外傷性事象後の死亡率のロジスティック回帰モデルに基づく。
ロジスティック回帰は、事象の確率のロジットのモデルであり、事象の対数オッズとも称され、
Figure 0007250693000001
(式中、pは、事象が起こる確率である)
と定義される。
Figure 0007250693000002
とすると、ロジスティック回帰モデルは、y=β’x(式中、xは、共変量のベクトルであり、βは、各共変量に対する影響のベクトルである)と表すことができる。モデルについての尤度関数の極大化により、βの推定値が得られる。ロジスティック識別モデルは、予測された確率をグループラベルに変換するロジスティック回帰モデルである。
ロジスティック回帰モデルは、各共変量の影響が事象の対数オッズに関して直線的であるという仮定に基づく。Harrell, Frank. Regression Modeling Strategies. New York:Springer、2001年、217頁。分類の観点からすると、事象の対数オッズに関する各共変量の直線性は、試験セットであっても高い正確度を実現するために十分であり得る;しかし、この仮定が破られることにより、このモデルがひどく評価を誤るものになり、したがって、動作が不十分になる可能性がある。
安定な推定および信頼できる正確な分類のためには多数の変量当たりの事象(EPV)が必要とされる(Performance of logistic regression modeling: beyond the number of events per variable, the role of data structure. Courvoisier, DSら、2011年、Journal of Clinical Epidemiology、64巻、993~1000頁)。必要なEPVは、変量の数が増加するに従って、および、オッズ比(eβによって推定される)が1に近づくに従って変動する。変量の数が25と等しい場合、例えば、Courvoisierら(同文献、997頁)により、共変量と事象の確率の関係に応じて、EPV=25では適切な検出力を生成するために十分でない可能性があることが示され、ロジスティック回帰パラメータの正確な推定が保証されるEPVに基づく単一の規則は存在しないことが結論づけられる(同文献、1000頁)。
分類システム
大きなデータベースに含有される重要な情報について、無関連のデータでしかない可能性がある他の情報が存在する中で、パターンを認識し、抽出を可能にするために、データ解析およびデータマイニングのための機械学習手法などの種々の分類システムが探究されてきた。学習機械は、分類が分かっているデータを使用して訓練して一般化することができるアルゴリズムを含む。次いで、訓練された学習機械アルゴリズムを適用して、転帰が分かっていない症例における転帰を予測すること、すなわち、学習されたパターンに従ってデータを分類することができる。ニューラルネットワーク、隠れマルコフモデル、信念ネットワークおよびサポートベクターマシンなどの分類器に基づくカーネルを含む機械学習方法は、大量のデータ、ノイズの多いパターンおよび一般理論の欠如を特徴とする問題に対して有用である。
問題のパターン分類、回帰およびクラスタリングのための多くの上首尾の手法は、パターンの対の類似性を決定するためのカーネルに依拠する。これらのカーネルは、通常、実数のベクトルとして表すことができるパターンに関して定義される。例えば、線形カーネル、放射基底カーネルおよび多項式カーネルは全て、実ベクトルの対の類似性を測定するものである。そのようなカーネルは、データをこのように一連の実数として表すことが最良であり得る場合に妥当である。カーネル選択は、特徴空間内のデータの表示の選択に対応する。多くの適用において、パターンは大きな程度の構造を有する。これらの構造を、学習アルゴリズムの性能を改善するために活用することができる。機械学習適用において一般に生じる構造化されたデータの型の例は、とりわけ、記号列、ドキュメント、木、ウェブサイトまたは化学分子などのグラフ、マイクロアレイ発現プロファイルなどのシグナル、スペクトル、画像、時空間データ、リレーショナルデータおよび生化学的濃度である。
分類システムは医学分野において使用されている。例えば、種々のコンピュータシステムおよびサポートベクターマシンなどの分類システムを使用して医学的状態の発生を診断および予測する方法が提唱されてきた。例えば、米国特許第7,321,881号;同第7,467,119号;同第7,505,948号;同第7,617,163号;同第7,676,442号;同第7,702,598号;同第7,707,134号;および同第7,747,547号を参照されたい。これらの特許に記載されている方法は未だ、非小細胞肺がん(non-small lung cancer)などの肺疾患の診断および/または予測において一貫した高レベルの正確度を生成することは示されていない。肺がんの存在を疾患進行の初期に決定するための方法を開発することが望ましい。非小細胞肺がんを、臨床的に明らかな症状の初出前に診断するための方法を開発することが同様に望ましい。
Aberleら、N. Engl. J. Med.(2011年)365巻:395~409頁 MacMahonら、Radiology(2005年)237巻:395~400頁 Evaluating Trauma Care: The TRISS Method. Boyd, CR、Tolson, MA Copes, WS、1987年、Journal of Trauma、27巻、370~378頁 Harrell, Frank. Regression Modeling Strategies. New York:Springer、2001年、217頁 Courvoisier, DSら、2011年、Journal of Clinical Epidemiology、64巻、993~1000頁
発明の好ましい実施形態の要旨
本発明は、ランダムフォレストなどの種々の分類器を使用して対象におけるバイオマーカーのセットを評価するロバストな方法を使用する分類システムを提供する。本発明者らは、対象における、本発明による分類に一部基づく生理的特徴付けの方法であって、まず、対象の生理学的サンプルを得るステップと、次いで、そのサンプル中の複数のバイオマーカーのバイオマーカー定量値を決定するステップと、最終的に、サンプルを、分類システムを使用し、バイオマーカー定量値に基づいて分類するステップであって、サンプルの分類が、対象の生理的な様子もしくは状態または病態の変化と相関する、ステップとを含む方法を開発した。一般には、分類システムは、classification and regression treeに基づく分類システムなどの機械学習システムを含む。本発明者らの、本発明による分類に一部基づく生理的特徴付けの方法により、対象における非小細胞肺がんの存在もしくは非存在、または非小細胞肺がんの発症のステージ、例えば、発症の初期(ステージI)を示す診断がもたらされる。
バイオマーカー定量値は、一般には、バイオマーカー定量値を得る各対象についてベクトル中に配置される。特定のバイオマーカー定量値に加えて、各ベクトルは、性別、年齢、喫煙歴、追加的なバイオマーカー定量値、対象の健康歴の他の特徴などを含めた、対象に関連する他の情報を含み得る。訓練ベクトルのセットは、少なくとも30ベクトル、少なくとも50ベクトル、または少なくとも100ベクトルを含み得る。
本明細書に記載の好ましい方式の任意の実施形態(単数または複数)では、ヒト対象は、対象由来の反復実験サンプルのいずれかが任意の1種、任意の2種、任意の3種、任意の4種、任意の5種、任意の6種、任意の7種、または任意の8種の分類器(最大で全ての分類器)によって陽性に分類された場合、NSCLCについて陽性であるとみなされる。本明細書に記載の好ましい方式の任意の実施形態(単数または複数)では、対象を、単一の分類器について多数の反復実験(例えば、各分類器について全ての反復実験、単一の分類器について2つもしくはそれよりも多くの反復実験、単一の分類器について3つの反復実験)が陽性に分類された場合、または使用した全ての分類器にわたって多数の反復実験(例えば、分類器のアンサンブルで使用した分類器の数にわたって2つの反復実験、分類器のアンサンブルで使用した分類器の数にわたって3つの反復実験、分類器のアンサンブルで使用した分類器の数にわたって4つの反復実験)が陽性に分類された場合、陽性であるとみなすことができる。本明細書に記載の好ましい方式の任意の実施形態(単数または複数)では、テストデータセットについて、ならびに可能性のある陽性の総数(すなわち、ゼロ~分類器の数×反復実験の数)のそれぞれについて、正確度、感度、特異度、ならびに陽性値および陰性値を調査した。本明細書に記載の好ましい方式の任意の実施形態(単数または複数)では、次いで、陽性に戻るのに必要な陽性反復実験および/または分類器の数を、調査された正確度、感度、特異度、ならびに陽性値および陰性値に基づいて決定することができる。本明細書に記載の好ましい方式の任意の実施形態(単数または複数)では、正確度、感度、特異度、陽性的中率および/または陰性的中率は0.7を上回る。本明細書に記載の好ましい方式の任意の実施形態(単数または複数)では、正確度、感度、特異度、陽性的中率および/または陰性的中率は0.8を上回る。本明細書に記載の好ましい方式の任意の実施形態(単数または複数)では、正確度、感度、陽性的中率および陰性的中率のうちの少なくとも1つ、より好ましくは2つまたはそれよりも多くが0.9を上回る。本明細書に記載の好ましい方式の任意の実施形態(単数または複数)では、正確度、感度、陽性的中率および陰性的中率のうちの少なくとも1つ、より好ましくは2つまたはそれよりも多くが0.95を上回る。本明細書に記載の好ましい方式の任意の実施形態(単数または複数)では、正確度、感度、陽性的中率および陰性的中率のうちの少なくとも1つ、より好ましくは2つまたはそれよりも多くが0.98を上回る。
本発明の実施形態は、ヒト対象をスクリーニングして、当該ヒトがNSCLCに罹患している可能性があるか否かを決定するための増強された方法であって、増強が、ヒト対象のテストデータを本発明の実施形態のいずれか1つによる方法を使用して分類することを含み、ヒト対象が、コンピュータ断層撮影スキャンによって検出可能な少なくとも1つの肺小結節を示している対象である、方法において使用することができる。本発明の実施形態の代替使用により、ヒト対象をスクリーニングして、当該ヒトがNSCLCに罹患している可能性があるか否かを決定するための別の増強された方法であって、本発明の方法を使用してNSCLCについて陽性に分類されたヒト対象を、低線量コンピュータ断層撮影によって肺小結節についてさらに検査する方法がもたらされる。
1つの方式では、本発明は、バイオマーカーのセットそれぞれの複数のバイオマーカー定量値を含むテストデータを分類する方法であって、(a)少なくとも1つのプロセッサに、ヒト検査対象由来の生理学的サンプル中のバイオマーカーのセットの各バイオマーカーについてのバイオマーカー定量値を含むテストデータを受信するステップと、(b)少なくとも1つのプロセッサを使用して、テストデータを、分類システムの電子表示である分類器を使用して評価するステップであって、各分類器が、電子的に保存された訓練データベクトルのセットを使用して訓練され、各訓練データベクトルが、個々のヒトを表し、かつ、それぞれのヒトについてのバイオマーカーのセットの各バイオマーカーのバイオマーカー定量値を含み、各訓練データベクトルが、それぞれのヒトにおける診断されたNSCLCの存在または非存在に関する分類をさらに含む、ステップと、(c)少なくとも1つのプロセッサを使用して、評価するステップに基づいた対象におけるNSCLCの存在または発症の可能性に関するヒト検査対象由来のサンプルの分類を出力するステップとを含み、バイオマーカーのセットが、IL-8、MMP-9、sTNFRII、TNFRI、MMP7、IL-5、レジスチン、IL-10、MPO、NSE、MCP-1、GRO、CEA、レプチン、CXCL9、HGF、sCD40L、CYFRA-21-1、sFasL、RANTES、IL-7、MIF、sICAM-1、IL-2、SAA、IL-16、IL-9、PDFG-AB/BB、sEFGR、LIF、IL-12p70、CA125、およびIL-4からなる群から選択される少なくとも9種のバイオマーカーを含む、方法を提供する。
別の方式では、本発明は、バイオマーカーのセットそれぞれの複数のバイオマーカー定量値を含むテストデータを分類する方法であって、(i)少なくとも1つのプロセッサを使用して、電子的に保存された訓練データベクトルのセットにアクセスするステップであって、各訓練データベクトルが、個々のヒトを表し、かつ、それぞれのヒトについてのバイオマーカーのセットの各バイオマーカーのバイオマーカー定量値を含み、各訓練データベクトルが、それぞれのヒトにおける診断されたNSCLCの存在または非存在に関する分類をさらに含む、ステップと、(ii)分類システムの電子表示を、電子的に保存された訓練データベクトルのセットを使用して訓練するステップと、(iii)少なくとも1つのプロセッサで、ヒト検査対象におけるバイオマーカーのセットについての複数のバイオマーカー定量値を含むテストデータを受信するステップと、(iv)少なくとも1つのプロセッサを使用して、テストデータを、分類システムの電子表示を使用して評価するステップと、(v)評価するステップに基づいた対象における非小細胞肺がんの存在または発症の可能性に関するヒト検査対象の分類を出力するステップとを含み、バイオマーカーのセットが、IL-8、MMP-9、sTNFRII、TNFRI、MMP7、IL-5、レジスチン、IL-10、MPO、NSE、MCP-1、GRO、CEA、レプチン、CXCL9、HGF、sCD40L、CYFRA-21-1、sFasL、RANTES、IL-7、MIF、sICAM-1、IL-2、SAA、IL-16、IL-9、PDFG-AB/BB、sEFGR、LIF、IL-12p70、CA125、およびIL-4からなる群から選択される少なくとも9種のバイオマーカーを含む、方法を提供する。
好ましい実施形態では、テストデータは、ヒト対象由来の生理学的サンプル中の複数のバイオマーカーについてのバイオマーカー定量値の個々の決定をそれぞれが含む2つまたはそれよりも多くの反復実験データベクトルを含み、その場合、反復実験データベクトルのいずれか1つが、分類システム内の分類器のいずれか1つに従ってNSCLCについて陽性に分類される場合、サンプルをNSCLCの存在または発症の可能性が高いとして分類することができる。必要に応じて、テストデータおよび各訓練データベクトルは、個々のヒトの性別、人種、民族性、および/または国籍、年齢および喫煙状況からなる群から選択される少なくとも1つの追加的な特性をさらに含む。
本発明の種々の方式のためのバイオマーカーのセットは、4種、5種、6種、7種、8種、9種、10種、11種、12種、13種、14種、15種、16種、17種、18種、19種、20種、21種、22種、23種、24種、25種、26種、27種、28種、29種、30種、31種、32種、または33種のバイオマーカーを含み得る。
バイオマーカー定量値は、生体液である生理学的サンプル中のIL-8、MMP-9、sTNFRII、TNFRI、MMP7、IL-5、レジスチン、IL-10、MPO、NSE、MCP-1、GRO、CEA、レプチン、CXCL9、CYFRA-21-1、MIF、sICAM-1、SAA、またはこれらの組合せからなる群から選択されるバイオマーカーのそれぞれの濃度レベルに比例する。あるいは、バイオマーカー定量値は、IL-8、sTNFRII、MMP-9、TNFRI、CXCL9-MIG、レジスチン、SAA、MPO、PDGF-AB-BB、MMP-7、GRO、MIF、MCP-1、CEA、CYFRA-21-1、レプチン、IL-2、IL-10、およびNSEからなる群から選択されるバイオマーカーのそれぞれの濃度レベルに比例し得る。別の代替の実施形態では、バイオマーカー定量値は、IL-8、sTNFRII、MMP-9、TNFRI、CXCL9-MIG、レジスチン、SAA、MPO、PDGF-AB-BB、MMP-7、GRO、MIF、MCP-1、CEA、CYFRA-21-1、レプチン、IL-2、およびIL-10からなる群から選択されるバイオマーカーのそれぞれの濃度レベルに比例する。さらに別の代替的な実施形態では、バイオマーカー定量値は、IL-8、MMP-9、sTNFRII、TNFRI、MMP7、レジスチン、MPO、NSE、GRO、CEA、CXCL9、MIF、IL-2、SAA、IL-16、IL-9、PDFG-AB/BB、またはこれらの組合せからなる群から選択されるバイオマーカーのそれぞれの濃度レベルに比例し、生理学的サンプルは、生体液である。なお別の代替的な実施形態では、バイオマーカー定量値は、IL-8、sTNFRII、MMP-9、TNFRI、CXCL9-MIG、レジスチン、SAA、MPO、PDGF-AB-BB、MMP-7、GRO、MIF、MCP-1、CEA、CYFRA-21-1、レプチン、およびIL-2からなる群から選択されるバイオマーカーのそれぞれの濃度レベルに比例する。さらに別の代替的な実施形態では、バイオマーカー定量値は、IL-8、sTNFRII、MMP-9、TNFRI、CXCL9-MIG、レジスチン、SAA、MPO、PDGF-AB-BB、MMP-7、GRO、MIF、MCP-1、CEA、CYFRA-21-1、およびレプチンからなる群から選択されるバイオマーカーのそれぞれの濃度レベルに比例する。なお別の代替的な実施形態では、バイオマーカー定量値は、IL-8、MMP-9、sTNFRII、TNFRI、レジスチン、MPO、NSE、GRO、CEA、CXCL9、IL-2、SAA、PDFG-AB/BB、またはこれらの組合せからなる群から選択されるバイオマーカーのそれぞれの濃度レベルに比例し、生理学的サンプルは、生体液である。さらに別の代替的な実施形態では、バイオマーカー定量値は、IL-8、sTNFRII、MMP-9、TNFRI、CXCL9-MIG、レジスチン、SAA、MPO、PDGF-AB-BB、およびMMP-7からなる群から選択されるバイオマーカーのそれぞれの濃度レベルに比例する。
本発明の方法は、対象由来の生理学的サンプル中のバイオマーカー定量値を決定するステップをさらに含み得る。一般には、種々のバイオマーカーは、ペプチド、タンパク質、翻訳後修飾を有するペプチドおよびタンパク質、またはこれらの組合せであり、生体液は、血液、血清(serum)、血漿、またはこれらの混合物である。本発明の任意の方式の好ましいバージョンでは、分類システムはランダムフォレストであり、ランダムフォレスト分類器は、5、10、15、20、25、30、40、50、75または100の個々の木を含むことが好ましい。
一般には、本発明の方法では、対象は、ヒト女性であってもよくヒト男性であってもよいヒトである。本発明の好ましい実施形態では、対象は、コンピュータ断層撮影スキャンによって検出可能な少なくとも1つの肺小結節を示す。例えば、方法は、低線量コンピュータ断層撮影によって肺小結節を検査するステップをさらに含み得る。代替の実施形態では、対象は、NSCLCのリスクにあり、かつ/または、方法は、対象をNSCLCに関して処置するステップをさらに含み得る。本発明の特に好ましい実施形態では、対象(または患者)は、45歳またはそれよりも上であるか、長期間喫煙者であるか、肺内の不定小結節と診断されているか、またはこれらの組合せである。
特に好ましい方式では、本発明は、バイオマーカーのセットそれぞれの複数のバイオマーカー定量値を含むテストデータを分類する方法であって、(a)少なくとも1つのプロセッサに、ヒト検査対象由来の生理学的サンプル中のバイオマーカーのセットの各バイオマーカーについてのバイオマーカー定量値を含むテストデータを受信するステップと、(b)少なくとも1つのプロセッサを使用して、テストデータを、分類システムの電子表示である分類器を使用して評価するステップであって、各前記分類器が、電子的に保存された訓練データベクトルのセットを使用して訓練され、各訓練データベクトルが、個々のヒトを表し、かつ、それぞれのヒトについてのバイオマーカーのセットの各バイオマーカーのバイオマーカー定量値を含み、各訓練データベクトルが、それぞれのヒトにおける診断されたNSCLCの存在または非存在に関する分類をさらに含む、ステップと、(c)少なくとも1つのプロセッサを使用して、評価するステップに基づいた対象におけるNSCLCの存在または発症の可能性に関するヒト検査対象由来のサンプルの分類を出力するステップとを含み、前記バイオマーカーのセットが、IL-8、sTNFRII、MMP-9、TNFRI、CXCL9-MIG、レジスチン、SAA、MPO、PDGF-AB-BB、MMP-7、GRO、MIF、MCP-1、CEA、CYFRA-21-1、レプチン、IL-2、IL-10、およびNSEからなる群から選択される少なくとも8種のバイオマーカーを含む、方法を提供する。
代替的な方式では、本発明は、バイオマーカーのセットそれぞれの複数のバイオマーカー定量値を含むテストデータを分類するためのシステムであって、分類器の電子表示を含む電子保存手段とカップリングした少なくとも1つのプロセッサを含み、前記分類器が、前記請求項のいずれか一項に記載の電子的に保存された訓練データベクトルのセットを使用して訓練され、前記プロセスが、ヒト検査対象におけるバイオマーカーのセットについての複数のバイオマーカー定量値を含むテストデータを受信するように構成されたものであり、少なくとも1つのプロセッサが、1つまたは複数の分類器の電子表示を使用してテストデータを評価し、評価に基づいてヒト検査対象の分類を出力するようにさらに構成されたものであり、前記バイオマーカーのセットが、IL-8、MMP-9、sTNFRII、TNFRI、MMP7、IL-5、レジスチン、IL-10、MPO、NSE、MCP-1、GRO、CEA、レプチン、CXCL9、HGF、sCD40L、CYFRA-21-1、sFasL、RANTES、IL-7、MIF、sICAM-1、IL-2、SAA、IL-16、IL-9、PDFG-AB/BB、sEFGR、LIF、IL-12p70、CA125、およびIL-4からなる群から選択される少なくとも9種のバイオマーカーを含む、システムを提供する。あるいは、本発明は、実行可能なプログラムが保存された非一時的コンピュータ可読記憶媒体であって、プログラムが、マイクロプロセッサに、(i)対象の生理学的サンプル中の複数のバイオマーカーのバイオマーカー定量値を受信するステップと、(ii)サンプルを、分類システムおよび少なくとも1つのプロセッサを使用して、バイオマーカー定量値に基づいて分類するステップであって、サンプルの分類が、対象における非小細胞肺がん(NSCLC)の存在または発症の可能性を示す、ステップとを実施するように指示し、前記バイオマーカーのセットが、IL-8、MMP-9、sTNFRII、TNFRI、MMP7、IL-5、レジスチン、IL-10、MPO、NSE、MCP-1、GRO、CEA、レプチン、CXCL9、HGF、sCD40L、CYFRA-21-1、sFasL、RANTES、IL-7、MIF、sICAM-1、IL-2、SAA、IL-16、IL-9、PDFG-AB/BB、sEFGR、LIF、IL-12p70、CA125、およびIL-4からなる群から選択される少なくとも9種のバイオマーカーを含む、非一時的コンピュータ可読記憶媒体を提供する。
本発明の方法は、(a)対象由来の生理学的サンプルを得るステップと、(b)サンプルにおいてIL-8、MMP-9、sTNFRII、TNFRI、MMP7、IL-5、レジスチン、IL-10、MPO、NSE、MCP-1、GRO、CEA、レプチン、CXCL9、HGF、sCD40L、CYFRA-21-1、sFasL、RANTES、IL-7、MIF、sICAM-1、IL-2、SAA、IL-16、IL-9、PDFG-AB/BB、sEFGR、LIF、IL-12p70、CA125、およびIL-4からなる群から選択される少なくとも4種のバイオマーカーのセットを測定して、バイオマーカー定量値を生成するステップとをさらに含み得る。方法は、サンプルにおいてバイオマーカーのうちの少なくとも4種、5種、6種、7種、8種、9種、10種、11種、12種、13種、14種、15種、16種、17種、18種、19種、または21種のセットを測定するステップを含み得る。バイオマーカー定量値は、非小細胞肺がんを示すものであり得る。バイオマーカー定量値は、初期の非小細胞肺がん、好ましくはステージIを示すものであり得る。いくつかの実施形態では、対象は、非小細胞肺がんのリスクにあり得る。
本発明の方法は、対象から得た生理学的サンプルにおいてサンプル中のIL-8、MMP-9、sTNFRII、TNFRI、MMP7、IL-5、レジスチン、IL-10、MPO、NSE、MCP-1、GRO、CEA、レプチン、CXCL9、HGF、sCD40L、CYFRA-21-1、sFasL、RANTES、IL-7、MIF、sICAM-1、IL-2、SAA、IL-16、IL-9、PDFG-AB/BB、sEFGR、LIF、IL-12p70、CA125、およびIL-4からなる群から選択される少なくとも4種のバイオマーカーのセットを測定して、バイオマーカー定量値を生成するステップをさらに含み得る。方法は、サンプルにおいてバイオマーカーのうちの少なくとも4種、5種、6種、7種、8種、9種、10種、11種、12種、13種、14種、15種、16種、17種、18種、19種、または21種のセットを測定するステップを含み得る。バイオマーカー定量値は、非小細胞肺がんを示すものであり得る。バイオマーカー定量値は、初期の非小細胞肺がん、好ましくはステージIを示すものであり得る。いくつかの実施形態では、対象は、非小細胞肺がんのリスクにあり得る。
いくつかの実施形態では、バイオマーカー定量値は、ラジオイムノアッセイ、酵素結合免疫吸着検定法(ELISA)、Q-Plex(商標)マルチプレックスアッセイ、液体クロマトグラフィー-質量分析(LCMS)、フローサイトメトリーマルチプレックスイムノアッセイ、可視光線もしくは紫外線の吸光度を通じた放射測定もしくは分光測定による検出を伴う高圧液体クロマトグラフィー、質量分析による定性的分析および定量的分析、ウエスタンブロッティング、放射性、蛍光もしくは化学発光プローブもしくは核の検出による定量的可視化を伴う1次元もしくは2次元ゲル電気泳動、吸収もしくは蛍光側光法を用いた抗体に基づく検出、いくつもの化学発光レポーター系のうちのいずれかの発光による定量化、酵素的アッセイ、免疫沈降もしくは免疫捕捉アッセイ、固相および液相イムノアッセイ、定量的マルチプレックスイムノアッセイ、タンパク質アレイもしくはチップ、プレートアッセイ、プリントアレイイムノアッセイ、またはこれらの組合せによって測定することができる。好ましい実施形態では、バイオマーカー定量値は、イムノアッセイによって測定することができる。
本発明は、ステージIの非小細胞肺がんを診断するための方法であって、(a)対象由来の生理学的サンプルを得るステップと、(b)サンプルにおいて、IL-8、MMP-9、sTNFRII、TNFRI、MMP7、IL-5、レジスチン、IL-10、MPO、NSE、MCP-1、GRO、CEA、レプチン、CXCL9、HGF、sCD40L、CYFRA-21-1、sFasL、RANTES、IL-7、MIF、sICAM-1、IL-2、SAA、IL-16、IL-9、PDFG-AB/BB、sEFGR、LIF、IL-12p70、CA125、およびIL-4からなる群から選択される4種から33種までのバイオマーカーのセットをイムノアッセイによって測定して、バイオマーカー定量値を生成するステップと、(c)少なくとも1つのプロセッサに、ヒト検査対象由来の生理学的サンプル中のバイオマーカーのセットの各バイオマーカーについてのバイオマーカー定量値を含むテストデータを受信するステップと、(d)少なくとも1つのプロセッサを使用して、テストデータを、分類システムの電子表示である分類器を使用して評価するステップであって、各分類器が、電子的に保存された訓練データベクトルのセットを使用して訓練され、各訓練データベクトルが、個々のヒトを表し、かつ、それぞれのヒトについてのバイオマーカーのセットの各バイオマーカーのバイオマーカー定量値を含み、各訓練データベクトルが、それぞれのヒトにおける診断されたNSCLCの存在または非存在に関する分類をさらに含む、ステップと、(e)少なくとも1つのプロセッサを使用して、評価するステップに基づいた対象におけるNSCLCの存在または発症の可能性に関するヒト検査対象由来のサンプルの分類を出力するステップとを含む方法も提供する。いくつかの実施形態では、分類システムは、ランダムフォレスト、AdaBoost、ナイーブベイズ、サポートベクターマシン、LASSO、リッジ回帰(Ridge Regression)、ニューラルネット(Neural Net)、遺伝的アルゴリズム(Genetic Algorithm)、弾性ネット(Elastic Net)、勾配ブースティング木(Gradient Boosting Tree)、ベイズニューラルネットワーク(Bayesian Neural Network)、k-最近傍(k-Nearest Neighbo)、またはそのアンサンブルからなる群から選択することができる。バイオマーカーは、ペプチド、タンパク質、翻訳後修飾を有するペプチド、翻訳後修飾を有するタンパク質、またはこれらの組合せであり得る。生理学的サンプルは、全血、血漿(blood plasma)、血清(blood serum)、またはこれらの組合せであり得る。
本発明は、ステージIの非小細胞肺がんを診断するための方法であって、対象から得た生理学的サンプルにおいてサンプル中のIL-8、MMP-9、sTNFRII、TNFRI、MMP7、IL-5、レジスチン、IL-10、MPO、NSE、MCP-1、GRO、CEA、レプチン、CXCL9、HGF、sCD40L、CYFRA-21-1、sFasL、RANTES、IL-7、MIF、sICAM-1、IL-2、SAA、IL-16、IL-9、PDFG-AB/BB、sEFGR、LIF、IL-12p70、CA125、およびIL-4からなる群から選択される少なくとも4種のバイオマーカーのセットをイムノアッセイによって測定して、バイオマーカー定量値を生成するステップと、(c)少なくとも1つのプロセッサに、ヒト検査対象由来の生理学的サンプル中のバイオマーカーのセットの各バイオマーカーについてのバイオマーカー定量値を含むテストデータを受信するステップと、(d)少なくとも1つのプロセッサを使用して、テストデータを、分類システムの電子表示である分類器を使用して評価するステップであって、各分類器が、電子的に保存された訓練データベクトルのセットを使用して訓練され、各訓練データベクトルが、個々のヒトを表し、かつ、それぞれのヒトについてのバイオマーカーのセットの各バイオマーカーのバイオマーカー定量値を含み、各訓練データベクトルが、それぞれのヒトにおける診断されたNSCLCの存在または非存在に関する分類をさらに含む、ステップと、(e)少なくとも1つのプロセッサを使用して、評価するステップに基づいた対象におけるNSCLCの存在または発症の可能性に関するヒト検査対象由来のサンプルの分類を出力するステップとを含む方法も提供する。いくつかの実施形態では、分類システムは、ランダムフォレスト、AdaBoost、ナイーブベイズ、サポートベクターマシン、LASSO、リッジ回帰、ニューラルネット、遺伝的アルゴリズム、弾性ネット、勾配ブースティング木、ベイズニューラルネットワーク、k-最近傍、またはそのアンサンブルからなる群から選択することができる。バイオマーカーは、ペプチド、タンパク質、翻訳後修飾を有するペプチド、翻訳後修飾を有するタンパク質、またはこれらの組合せであり得る。生理学的サンプルは、全血、血漿(blood plasma)、血清(blood serum)、またはこれらの組合せであり得る。
多くの実施形態では、複数のバイオマーカーを検出するための方法は、(a)対象由来の生理学的サンプルを得るステップと、(b)サンプルにおいてIL-8、MMP-9、sTNFRII、TNFRI、MMP7、IL-5、レジスチン、IL-10、MPO、NSE、MCP-1、GRO、CEA、レプチン、CXCL9、HGF、sCD40L、CYFRA-21-1、sFasL、RANTES、IL-7、MIF、sICAM-1、IL-2、SAA、IL-16、IL-9、PDFG-AB/BB、sEFGR、LIF、IL-12p70、CA125、およびIL-4からなる群から選択される少なくとも4種のバイオマーカーのセットを測定して、バイオマーカー定量値を生成するステップを含み得る。バイオマーカー定量値は、非小細胞肺がんを示すものであり得る。バイオマーカー定量値は、初期の非小細胞肺がん、必要に応じてステージIの非小細胞肺がんを示すものであり得る。バイオマーカー定量値は、喘息、乳がん、前立腺がん、膵がん、またはこれらの組合せを示さない場合がある。多くの実施形態では、対象は、非小細胞肺がんのリスクにあり得る。
多くの実施形態では、複数のバイオマーカーを検出するための方法は、対象から得た生理学的サンプルにおいてサンプル中のIL-8、MMP-9、sTNFRII、TNFRI、MMP7、IL-5、レジスチン、IL-10、MPO、NSE、MCP-1、GRO、CEA、レプチン、CXCL9、HGF、sCD40L、CYFRA-21-1、sFasL、RANTES、IL-7、MIF、sICAM-1、IL-2、SAA、IL-16、IL-9、PDFG-AB/BB、sEFGR、LIF、IL-12p70、CA125、およびIL-4からなる群から選択される少なくとも4種のバイオマーカーのセットを測定して、バイオマーカー定量値を生成するステップを含み得る。バイオマーカー定量値は、非小細胞肺がんを示すものであり得る。バイオマーカー定量値は、初期の非小細胞肺がん、必要に応じてステージIの非小細胞肺がんを示すものであり得る。バイオマーカー定量値は、喘息、乳がん、前立腺がん、膵がん、またはこれらの組合せを示さない場合がある。多くの実施形態では、対象は、非小細胞肺がんのリスクにあり得る。
少なくとも4種のバイオマーカーのセットは、IL-8、MMP-9、sTNFRII、TNFRI、MMP-7、IL-5、レジスチン、IL-10、MPO、NSE、MCP-1、GRO-Pan、CEA、レプチン、CXCL9/MIG、CYFRA 21-1、MIF、sICAM-1、SAA、IL-2、およびPDGF-AB/BBからなる群から選択することができる。少なくとも4種のバイオマーカーのセットは、IL-8、MMP-9、sTNFRII、TNFRI、MMP-7、IL-5、レジスチン、IL-10、MPO、NSE、MCP-1、GRO-Pan、CEA、レプチン、CXCL9/MIG、CYFRA 21-1、MIF、sICAM-1、およびSAAからなる群から選択することができる。少なくとも4種のバイオマーカーのセットは、IL-8、MMP-9、sTNFRII、TNFRI、レジスチン、MPO、NSE、GRO-Pan、CEA、CXCL9/MIG、SAA、IL-2、およびPDGF-AB/BBからなる群から選択することができる。
いくつかの実施形態では、セットは、少なくとも4種、5種、6種、7種、8種、9種、10種、11種、12種、13種、14種、15種、16種、17種、18種、19種、20種、または21種のバイオマーカーを含み得る。
いくつかの実施形態では、バイオマーカーは、ペプチド、タンパク質、翻訳後修飾を有するペプチド、翻訳後修飾を有するタンパク質、またはこれらの組合せであり得る。
いくつかの実施形態では、生理学的サンプルは、全血、血漿(blood plasma)、血清(blood serum)、またはこれらの組合せであり得る。
いくつかの実施形態では、方法は、(a)少なくとも1つのプロセッサに、ヒト検査対象由来の生理学的サンプル中のバイオマーカーのセットの各バイオマーカーについてのバイオマーカー定量値を含むテストデータを受信するステップと、(b)少なくとも1つのプロセッサを使用して、テストデータを、分類システムの電子表示である分類器を使用して評価するステップであって、各分類器が、電子的に保存された訓練データベクトルのセットを使用して訓練され、各訓練データベクトルが、個々のヒトを表し、かつ、それぞれのヒトについてのバイオマーカーのセットの各バイオマーカーのバイオマーカー定量値を含み、各訓練データベクトルが、それぞれのヒトにおける診断されたNSCLCの存在または非存在に関する分類をさらに含む、ステップと、(c)少なくとも1つのプロセッサを使用して、評価するステップに基づいた対象におけるNSCLCの存在または発症の可能性に関するヒト検査対象由来のサンプルの分類を出力するステップとをさらに含み得る。
多くの好ましい実施形態では、分類システムは、ランダムフォレスト、AdaBoost、ナイーブベイズ、サポートベクターマシン、LASSO、リッジ回帰、ニューラルネット、遺伝的アルゴリズム、弾性ネット、勾配ブースティング木、ベイズニューラルネットワーク、k-最近傍、またはそのアンサンブルからなる群から選択される1つまたは複数のアルゴリズムであり得る。
本発明は、対象におけるバイオマーカーのセットの発現レベルを測定することによって疾患進行の初期に非小細胞肺がんの存在を決定する方法であって、生理学的サンプル中のバイオマーカーのセットのバイオマーカー定量値をイムノアッセイによって決定するステップであって、バイオマーカーのセットが、IL-8、MMP-9、sTNFRII、TNFRI、MMP7、IL-5、レジスチン、IL-10、MPO、NSE、MCP-1、GRO、CEA、レプチン、CXCL9、HGF、sCD40L、CYFRA-21-1、sFasL、RANTES、IL-7、MIF、sICAM-1、IL-2、SAA、IL-16、IL-9、PDFG-AB/BB、sEFGR、LIF、IL-12p70、CA125、およびIL-4からなる群から選択される少なくとも4種のバイオマーカーを含む、ステップと、サンプルを、分類システムにおいてバイオマーカー定量値のセットを使用して対象における非小細胞肺がんの存在または発症に関して分類するステップとを含む方法も提供する。
多くの実施形態では、少なくとも4種のバイオマーカーのセットは、IL-8、MMP-9、sTNFRII、TNFRI、MMP-7、IL-5、レジスチン、IL-10、MPO、NSE、MCP-1、GRO-Pan、CEA、レプチン、CXCL9/MIG、CYFRA 21-1、MIF、sICAM-1、SAA、IL-2、およびPDGF-AB/BBからなる群から選択することができる。
多くの実施形態では、少なくとも4種のバイオマーカーのセットは、IL-8、MMP-9、sTNFRII、TNFRI、MMP-7、IL-5、レジスチン、IL-10、MPO、NSE、MCP-1、GRO-Pan、CEA、レプチン、CXCL9/MIG、CYFRA 21-1、MIF、sICAM-1、およびSAAからなる群から選択することができる。
多くの実施形態では、少なくとも4種のバイオマーカーのセットは、IL-8、MMP-9、sTNFRII、TNFRI、レジスチン、MPO、NSE、GRO-Pan、CEA、CXCL9/MIG、SAA、IL-2、およびPDGF-AB/BBからなる群から選択することができる。
前述の実施形態のいずれかでは、セットは、少なくとも4種、5種、6種、7種、8種、9種、10種、11種、12種、13種、14種、15種、16種、17種、18種、または19種のバイオマーカーを含み得る。
前述の実施形態のいずれかでは、分類システムは、ランダムフォレスト、AdaBoost、ナイーブベイズ、サポートベクターマシン、LASSO、リッジ回帰、ニューラルネット、遺伝的アルゴリズム、弾性ネット、勾配ブースティング木、ベイズニューラルネットワーク、k-最近傍、またはそのアンサンブルからなる群から選択することができる。
本発明の前述の実施形態のいずれかでは、バイオマーカーは、ペプチド、タンパク質、翻訳後修飾を有するペプチド、翻訳後修飾を有するタンパク質、またはこれらの組合せであり得る。
本発明の前述の実施形態のいずれかでは、生理学的サンプルは、全血、血漿(blood plasma)、血清(blood serum)、またはこれらの組合せであり得る。
本発明の前述の実施形態のいずれかでは、生体液は、全血、血漿(blood plasma)、血清(blood serum)、喀痰、尿、汗、リンパ液、および肺胞洗浄液であり得る。
本明細書に提示されている方法およびシステムは、肺の病状(例えば、がん性の)を、一般には、90%を超える正確度(例えば、試験総数に対する正確総数)で診断および予測することが可能なものである。これらの結果により、非小細胞肺がんを診断および予測するための現在利用可能な方法からの著しい前進がもたらされる。
図1A~Bは、33種、19種および13種のバイオマーカーのROC曲線を示す。これにより、2つのモデルがNSCLC(図1A)と非NSCLCがん(図1B)の間の良好な識別能を有することが示される。
発明の詳細な説明
本発明は、バイオマーカーを使用して肺疾患を検出、同定、および診断する種々の方法に関する。これらの方法は、特定のバイオマーカーのバイオマーカー定量値を決定し、これらのバイオマーカー定量値を分類システムで使用して、個体が非小細胞肺がんを有する可能性を決定することを伴う。本発明は、これらのバイオマーカーを検出するための検出剤、または、これらのバイオマーカーのバイオマーカー定量値を決定するための手段を非小細胞肺がんの可能性の決定を補助するためのシステムの構成要素として含むキットも提供する。例示的なバイオマーカーは、初期の肺がんに関して診断的潜在性が示された集団由来の患者の血漿中の82種の選択されたバイオマーカーの発現レベルを測定することによって同定された。この方法は実施例1で詳述している。
初期の非小細胞肺がんの存在について「存在する(Yes)」または「存在しない(No)」のいずれかである定性的な単一のスコア分類器を得るために多数のタンパク質バイオマーカーおよび患者の人口統計データを使用するアルゴリズムを利用するin vitro Diagnostic Multivariate Index Assay(IVDMIA)が本明細書に記載されている。この実施例に記載されているIVDMIA Testは、一次診断検査、すなわち、CTスキャンの間に肺内に小結節が発見され、その時点では小結節ががん性であるか否かに関しては不明である患者に関する付属的なリスク層別化モデルにおいて使用することができる。この検査により、その後の非小細胞肺がん(NSCLC)の診断的手順に関する医師の適正な選択を補助することができる。例えば、45歳を超えた喫煙者などのNSCLCが発症するリスクが高い個体を、この検査を使用してスクリーニングすることができる。
定義
本明細書で使用される場合、「バイオマーカー」または「マーカー」は、広範には、生物系の生理的状態の特徴的なインジケーターとして客観的に測定することができる生体分子を指す。本開示の目的に関しては、生体分子は、イオン、小分子、ペプチド、タンパク質、翻訳後修飾を有するペプチドおよびタンパク質、ヌクレオシド、RNAおよびDNAを含めたヌクレオチドおよびポリヌクレオチド、糖タンパク質、リポタンパク質、ならびに、これらの型の分子の種々の共有結合性の修飾および非共有結合性の修飾を含む。生体分子は、生物系の機能に対してネイティブである、それに特徴的である、および/またはそれに必須であるこれらの実体のいずれも含む。大多数のバイオマーカーは、ポリペプチドであるが、ポリペプチドとして発現される遺伝子産物の翻訳前の形態であるmRNAまたは修飾されたmRNAの場合もあり、ポリペプチドの翻訳後修飾を含む場合もある。
本明細書で使用される場合、「バイオマーカー定量値」は、広範には、疾患の存在または非存在を特徴付けるために有用であるバイオマーカーに関する情報を指す。そのような情報は、組織または生体液中のバイオマーカーの濃度であるもしくはそれに比例する、または他のやり方でその発現の定性的もしくは定量的指標を生成する、測定された値を含み得る。各バイオマーカーは、ベクトル空間の次元として表すことができ、ここで、各ベクトルはベクトル空間内の多次元ベクトルであり、特定の対象に関連付けられる複数のバイオマーカー定量値を含む。
本明細書で使用される場合、「分類器」は、広範には、サポートベクターマシン(support vector machine)、AdaBoost分類器、ペナルティー付加ロジスティック回帰(penalized logistic regression)、弾性ネット(elastic nets)、回帰木システム(regression tree system)、勾配木ブースティングシステム(gradient tree boosting system)、ナイーブベイズ分類器(naive Bayes classifier)、ニューラルネット(neural nets)、ベイズニューラルネット(Bayesian neural net)、k-最近傍分類器(k-nearest neighbor classifier)、およびランダムフォレストなどの機械学習アルゴリズムを指す。本発明は、列挙した分類器のいずれかを使用する方法、ならびに2種以上の分類器を組み合わせた使用を意図している。
本明細書で使用される場合、「分類システム」は、広範には、少なくとも1つの分類器を実行する機械学習システムを指す。
本明細書で使用される場合、「サブセット」は、妥当なサブセットであり、「スーパーセット」は、妥当なスーパーセットである。
本明細書で使用される場合、「対象」は、広範には、任意の動物であるが、好ましくは例えばヒトなどの哺乳動物を指す。多くの実施形態では、対象は、肺疾患を有するまたは有するリスクにあるヒト患者であった。
本明細書で使用される場合、「生理学的サンプル」は、広範には、生体液および組織由来のサンプルを指す。生体液は、全血、血漿(blood plasma)、血清(blood serum)、喀痰、尿、汗、リンパ液、および肺胞洗浄液を含む。組織サンプルは、固形肺組織または他の固形組織由来の生検材料、リンパ節生検組織、転移病巣の生検材料を含む。生理学的サンプルを得る方法は、当技術分野において記載されている。
本明細書で使用される場合、「検出剤」は、広範には、本明細書に記載のバイオマーカーを特異的に検出する試薬およびシステムを指す。検出剤は、抗体、核酸プローブ、アプタマー、レクチンなどの試薬、または特定のマーカー(単数または複数)に対して、特定のマーカーと目的のサンプル中に存在し得る他のマーカーを識別するのに十分な特異的親和性を有する他の試薬、および、結合させたまたは他のやり方で固定化した上記の試薬を使用するセンサーを含めたセンサーなどのシステムを含む。
本明細書で使用される場合、「Classification and Regression Trees(CART)」は、広範には、いくつかの計量の、通常はモデル性能を最適化するために、データ空間を再帰的に分割することに基づいて決定木を創出するための方法を指す。
本明細書で使用される場合、「AdaBoost」は、広範には、前の繰り返し時になされた間違いによりCART再重み付け観察結果を繰り返し適合させるバギング法を指す。
本明細書で使用される場合、「偽陽性(FP)」は、広範には、アルゴリズムテスト結果により、実際には疾患が存在しない場合に疾患が存在することが示される間違いを指す。
本明細書で使用される場合、「偽陰性(FN)」は、広範には、アルゴリズムテスト結果により、実際には疾患が存在する場合に疾患が存在しないことが示される間違いを指す。
本明細書で使用される場合、「遺伝的アルゴリズム(Genetic Algorithm)」は、広範には、機能(例えば、モデル性能)を最適化するために使用される、遺伝子突然変異を模倣するアルゴリズムを指す。
本明細書で使用される場合、「アッセイ内精度」は、各個の血漿サンプルについてプレート内での測定を使用するアッセイの繰り返し精度を反映する。アッセイ内%CVを、個々の血漿について全ての反復実験のアベレージ平均(M)MFIを取得し、全ての反復実験の標準偏差(SD)で割り、100を掛けること、%CV=(SD/M)*100によって算出した。濃度が低いほど精度が不十分になり得る。
本明細書で使用される場合、「アッセイ間精度」は、各個の血漿サンプルについて異なるプレート、日数、およびオペレーターでの測定を使用するアッセイの再現精度を反映する。アッセイ間%CVを、全ての実行からの個々の血漿について全ての反復実験のアベレージMFIを取得し、全ての反復実験の標準偏差(SD)で割り、100を掛けること、%CV=(SD/M)*100によって算出した。濃度が低いほど精度が不十分になり得る。
本明細書で使用される場合、「L1 Norm」は、ベクトルの要素の絶対値の合計である。
本明細書で使用される場合、「L2 Norm」は、ベクトルの要素の二乗和の平方根である。
本明細書で使用される場合、「検出限界(LOD)」は、ブランクの測定された値の平均中央値(Average Median Measured Value of the Blanks)プラス2SD、LOD=M+2SDとして算出される。この値は、LLOQよりも小さいかまたは等しく、必ずしも数量化できるものではない。
本明細書で使用される場合、「定量下限(LLOQ)」は、適切な精度および正確度で定量的に決定することができるサンプル中の分析物の最低濃度である。ほとんどの場合、LLOQはLODを超えるが、これら2つの値が等しくなる可能性はある。LLOQを決定するためのパラメータは、20%CV以内および±20%(80~120%)の回収範囲である。
本明細書で使用される場合、「変動係数のパーセント(%CV)」は、以下の通り算出される:標準偏差(SD)を平均値(M)で割り、パーセンテージで表す。
本明細書で使用される場合、「陰性的中率(NPV)」は、真陰性(TN)の数を真陰性(TN)の数プラス偽陰性(FP)の数で割ったもの、TP/(TN+FN)である。
本明細書で使用される場合、「陽性的中率(PPV)」は、真陽性(TP)の数を真陽性(TP)の数プラス偽陽性(FP)の数で割ったもの、TP/(TP+FP)である。
本明細書で使用される場合、「精度」は、一連の測定間の広がりを表すために使用され、繰り返し精度(アッセイ内)および再現精度(アッセイ間)を含む。
本明細書で使用される場合、「パーセプトロン」は、観察結果群を重みのセットおよび観察値のベクトルのドット積に基づいて分離する方法を指す。
本明細書で使用される場合、「ニューラルネット」は、パーセプトロン様オブジェクトをつなぎ合わせて分類器を創出する分類法である。
本明細書で使用される場合、「LASSO」は、広範には、回帰係数のベクトルのL1 normに対する制約条件を用いて線形回帰を実施するための方法を指す。
本明細書で使用される場合、「ランダムフォレスト」は、広範には、モデルを訓練するデータセット由来のサンプルに基づいてCARTに当てはめるバギング方法を指す。
本明細書で使用される場合、「リッジ回帰」は、広範には、回帰係数のベクトルのL2 normに対する制約条件を用いて線形回帰を実施するための方法を指す。
本明細書で使用される場合、「弾性ネット(Elastic Net)」は、広範には、回帰係数のベクトルのL1 normとL2 normの線形結合で構成される制約条件を用いて線形回帰を実施するための方法を指す。
本明細書で使用される場合、「感度」は、NSCLCを有する患者についての陽性結果の確率である。感度は、真陽性(TP)の数を実際NSCLC患者の総数、または真陽性(TP)の数プラス偽陰性(FN)の数で割ったものとして算出される;感度=TP/(TP+FN)。
本明細書で使用される場合、「特異度」は、患者がNSCLCを有さない確率である。特異度は、真陰性(TN)の数を実際非NSCLC患者の総数、または真陰性(TN)の数プラス偽陽性(FP)の数で割ったものとして算出される;特異度=TN/(TN+FP)。
本明細書で使用される場合、「標準偏差(SD)」は、単一の測定の不確実性を反映する個々のデータ点の広がり(すなわち、反復実験群内の)である。
本明細書で使用される場合、「訓練セット」は、本発明のアルゴリズムなどの機械学習システムを訓練および展開するために使用されるサンプルのセットである。
本明細書で使用される場合、「真陰性(TN)」は、実際に疾患が存在しない場合に疾患が存在しないことが示されるアルゴリズムテスト結果である。
本明細書で使用される場合、「真陽性(TP)」は、実際に疾患が存在する場合に疾患が存在することが示されるアルゴリズムテスト結果である。
本明細書で使用される場合、「定量上限(ULOQ)」は、適切な精度および正確度で定量的に決定することができるサンプル中の分析物の最高濃度である。ULOQを決定するためのパラメータは、20%CV以内および±20%(80~120%)の回収範囲である。
本明細書で使用される場合、「検証セット」は、ブラインドされ、本発明に従って展開されたアルゴリズムの機能性を確認するために使用されるサンプルのセットである。これは、ブラインドセットとしても公知である。
バイオマーカー定量値の決定
バイオマーカー定量値は、一般に、一般にはタンパク質またはポリペプチドである発現産物の定量的測定に関する情報である。本発明は、バイオマーカー定量値をタンパク質レベル(翻訳後修飾を含み得る)で決定することを意図している。特に、本発明は、転写、翻訳、転写後修飾のレベル、またはタンパク質の分解の範囲または程度の増大または低減に反映されるバイオマーカー濃度の変化を決定することを意図しており、これらの変化は、特定の病態または疾患進行に関連付けられる。
正常な対象によって発現される多くのタンパク質が、非小細胞肺がんなどの肺疾患を有する対象では異なる程度で(より多くまたはより少なく)発現された。大多数の疾患で多数の異なるバイオマーカーの変化が顕在化することが当業者には理解されよう。そのように、疾患は、複数のマーカーの発現パターンを特徴とし得る。複数のバイオマーカーについて発現レベルを決定することにより、発現パターンの観察が容易になり、そのようなパターンにより、個々のバイオマーカーの検出よりも感度が高く正確な診断がもたらされる。パターンは、いくつかの特定のバイオマーカーの異常な上昇、それと同時に他の特定のバイオマーカーの異常な低下を含み得る。
本発明に従って、対象から生理学的サンプルを、サンプル中のバイオマーカー定量値がサンプルを採取する対象におけるそのバイオマーカーの濃度に比例することが確実になるように採取する。測定は、測定された値がサンプル中のバイオマーカーの濃度に比例するように行う。これらの要件を満たすサンプリング技法および測定技法の選択は当技術分野の通常の技術の範囲内に入る。
バイオマーカー定量値を決定するための種々の方法は、個々のバイオマーカーについて当技術分野で公知であることが当業者には理解されよう。Instrumental Methods of Analysis、第7版、1988年を参照されたい。そのような決定は、マルチプレックス化イムノアッセイなどのマルチプレックスまたはマトリックスに基づく形式で実施することができる。
バイオマーカー定量値を決定する多数の方法が当技術分野で公知である。そのような決定のための手段としては、これだけに限定されないが、ラジオイムノアッセイ、酵素結合免疫吸着検定法(ELISA)、Q-Plex(商標)マルチプレックスアッセイ、液体クロマトグラフィー-質量分析(LCMS)、フローサイトメトリーマルチプレックスイムノアッセイ、可視光線もしくは紫外線の吸光度を通じた放射測定もしくは分光測定による検出を伴う高圧液体クロマトグラフィー、質量分析による定性的分析および定量的分析、ウエスタンブロッティング、放射性、蛍光もしくは化学発光プローブもしくは核の検出による定量的可視化を伴う1次元もしくは2次元ゲル電気泳動、吸収もしくは蛍光側光法を用いた抗体に基づく検出、いくつもの化学発光レポーター系のうちのいずれかの発光による定量化、酵素的アッセイ、免疫沈降もしくは免疫捕捉アッセイ、固相および液相イムノアッセイ、タンパク質アレイもしくはチップ、プレートアッセイ、アプタマーおよび分子インプリントポリマーなどの識別を可能にする結合親和性を有する分子を使用するアッセイ、ならびに、任意の他の適切な技法によるバイオマーカーの濃度の任意の他の定量的分析による決定、ならびに記載の検出技法または器械使用のいずれかの計器作動が挙げられる。バイオマーカー定量値を決定するための特に好ましい方法として、プリントアレイイムノアッセイが挙げられる。
バイオマーカー定量値を決定するステップは、当技術分野で公知の任意の手段、特に本明細書で考察されている手段によって実施することができる。好ましい実施形態では、バイオマーカー定量値を決定するステップは、抗体を用いてイムノアッセイを実施することを含む。当業者は、本発明において使用するための適正な抗体を容易に選択することができよう。選択された抗体は、目的の抗原に対して選択的(すなわち、特定のバイオマーカーに対して選択的)であり、前記抗原に対して高い結合特異性を有し、他の抗原との交差反応性が最小であることが好ましい。目的の抗原に結合する抗体の能力は、例えば、酵素結合免疫吸着検定法(ELISA)、フローサイトメトリー、および免疫組織化学的検査などの公知の方法によって決定することができる。さらに、抗体は、目的の抗原に対して比較的高い結合特異性を有するべきである。抗体の結合特異性は、免疫沈降などの公知の方法によって、またはラジオイムノアッセイ(RIA)もしくはELISAなどのin vitro結合アッセイによって決定することができる。目的の抗原に高い結合特異性および最小の交差反応性で結合することができる抗体を選択するための方法の開示は、例えば、米国特許第7,288,249号においてもたらされる。
好ましい実施形態では、単一分子アレイ形式を使用することができる。この方法では、単一のタンパク質分子を捕捉し、標準の免疫吸着アッセイ試薬を使用してビーズ上で標識する。何千ものビーズ(免疫コンジュゲートを伴うまたは伴わない)を酵素基質と混合し、個々のフェムトリットルサイズのウェルにローディングし、油で密閉する。各ビーズのフルオロフォア濃度をデジタルで計数して、標的分析物に結合するか否かを決定する。そのような方法の開示は、例えば、米国特許第8,236,574号においてもたらされる。
肺疾患を示すバイオマーカーのバイオマーカー定量値を、本明細書に記載の分類器を単独でまたは組合せで含む分類システムに対する入力として使用することができる。各バイオマーカーは、ベクトル空間の次元として表すことができ、ここで、各ベクトルは、特定の対象に関連付けられる複数のバイオマーカー定量値で構成される。したがって、ベクトル空間の次元性は、バイオマーカーのセットのサイズに対応する。複数のバイオマーカーのバイオマーカー定量値のパターンを種々の診断および予後判定方法において使用することができる。本発明は、そのような方法を提供する。例示的な方法としては、サポートベクターマシン、AdaBoost、ペナルティー付加ロジスティック回帰、回帰木システム、ナイーブベイズ分類器、ニューラルネット、k-最近傍分類器、ランダムフォレスト、またはこれらの任意の組合せなどの分類器の使用が挙げられる。
分類システム
本発明は、とりわけ、多数の連続的に分布したバイオマーカーに基づいて、肺の病状ががん性であると予測することに関する。分類器(例えば、サポートベクターマシン、AdaBoost、ペナルティー付加ロジスティック回帰、回帰木システム、ナイーブベイズ分類器、ニューラルネット、k-最近傍分類器、ランダムフォレスト、またはこれらの任意の組合せ)を使用する一部の分類システムに関しては、予測は多段階プロセス(例えば、2ステッププロセス、3ステッププロセスなど)であり得る。
本明細書で使用される場合、記載されている分類システムは、コンピュータにより実行可能なソフトウェア、ファームウェア、ハードウェア、またはそれらの様々な組合せを含み得る。例えば、分類システムは、プロセッサの参照およびデータ記憶装置の支持を含み得る。さらに、分類システムは、互いにローカルまたはリモートである多数のデバイスまたは他の構成要素にわたって実行することができる。分類システムは、集中型システムで実行することもでき、さらなるスケーラビリティのために分布型システムとして実行することもできる。さらに、ソフトウェアへの参照はいずれも、コンピュータ上で実行されると、コンピュータに一連のステップを実施させる非一時的コンピュータ可読媒体を含み得る。
本明細書に記載の分類システムは、ネットワークアクセス可能ストレージ、ローカルストレージ、リモートストレージ、またはこれらの組合せなどのデータ記憶装置を含み得る。データ記憶装置には、redundant array of inexpensive disks(「RAID」)、テープ、ディスク、ストレージエリアネットワーク(「SAN」)、internet small computer systems interface(「iSCSI」)SAN、ファイバーチャンネルSAN、common Internet File System(「CIFS」)、ネットワーク接続ストレージ(「NAS」)、ネットワークファイルシステム(「NFS」)、または他のコンピュータアクセス可能ストレージを利用することができる。1つまたは複数の実施形態では、データ記憶装置は、Oracleデータベース、Microsoft SQLサーバーデータベース、DB2データベース、MySQLデータベース、Sybaseデータベース、オブジェクト指向データベース、階層型データベース、または他のデータベースなどのデータベースであり得る。データ記憶装置では、データの記憶にフラットファイル構造を利用することができる。
第1のステップでは、分類器を使用して所定のデータのセットを記述する。これは、「学習ステップ」であり、「訓練」データに対して行われる。
訓練データベースは、複数のヒトについての複数のバイオマーカー定量値を反映するデータの、それぞれのヒトの病態に関する分類と関連した、コンピュータにより実行される保存である。保存されたデータの形式は、フラットファイル、データベース、表、または当技術分野で公知の任意の他の検索可能なデータ記憶装置形式であってよい。例示的な実施形態では、テストデータは複数のベクトルとして保存され、各ベクトルは個々のヒトに対応し、各ベクトルは、複数のバイオマーカーについての複数のバイオマーカー定量値をヒトの病態に関する分類と共に含む。一般には、各ベクトルは、複数のバイオマーカー定量値の中の各バイオマーカー定量値についてのエントリーを含有する。訓練データベースは、インターネットなどのネットワークに連結することができ、したがって、その内容を公認の実体(例えば、ヒト使用者またはコンピュータプログラム)によって遠隔操作で検索することができる。あるいは、訓練データベースはネットワークから隔離されたコンピュータ内に置くこともできる。
必要に応じた第2のステップでは、分類器を「検証」データベースに適用し、感度および特異度を含めた種々の正確度の尺度を観察する。例示的な実施形態では、訓練データベースの一部のみを学習ステップに使用し、訓練データベースの残りの部分を検証データベースとして使用する。第3のステップでは、対象由来のバイオマーカー定量値を分類システムに投入し、分類システムにより、算出された対象についての分類(例えば、病態)が出力される。
サポートベクターマシン、AdaBoost、決定木、ベイズ法分類器、ベイズ信念ネットワーク、ナイーブベイズ分類器、k-最近傍分類器、事例に基づく推論、ペナルティー付加ロジスティック回帰、ニューラルネット、ランダムフォレスト、またはこれらの任意の組合せなどの分類器の使用を含めた、分類のためのいくつかの方法が当技術分野で公知である(例えば、Han JおよびKamber M、2006年、第6章、Data Mining, Concepts and Techniques、第2版、Elsevier:Amsterdam.を参照されたい)。本明細書に記載の通り、任意の分類器または分類器の組合せを分類システムに使用することができる。
分類器
データに対して使用することができる多くの可能な分類器が存在する。非限定的な例として、また、以下に考察する通り、サポートベクターマシン、遺伝的アルゴリズム、ペナルティー付加ロジスティック回帰、LASSO、リッジ回帰、ナイーブベイズ分類器、分類木、k-最近傍分類器、ニューラルネット、弾性ネット、ベイズニューラルネットワーク、ランダムフォレスト、勾配ブースティング木、および/またはAdaBoostなどの分類器を使用してデータを分類することができる。本明細書で考察する通り、データを使用して分類器を訓練することができる。
分類木
分類木は、特徴選択が組み込まれた、容易に解釈可能な分類器である。分類木では、各部分空間内の1つのクラスからの観察結果の割合が最大になるようにデータ空間を再帰的に分割する。
データ空間を再帰的に分割するプロセスにより、各頂点においてテストされる条件で二分木が創出される。新しい観察結果を、木の枝を葉に到達するまでたどることによって分類する。各葉において、所与のクラスに属する観察結果に確率を割り当てる。確率が最も高いクラスが、新しい観察結果が分類されるクラスである。
分類木は、基本的に、その属性が統計値の言語で構成される決定木である。これらは、高度に柔軟であるが、非常にノイズが多い(他の方法と比較して間違いの分散が大きい)。
本明細書で考察される分類木を実行するためのツールが統計学的ソフトウェアコンピューティング原語および環境、Rに利用可能である。例えば、Rパッケージ「木」、バージョン1.0-28は、分類木を創出し、処理し、および利用するためのツールを含む。
ランダムフォレスト
分類木は、一般には、ノイズが多い。ランダムフォレストは、多くの木のアベレージを取ることによってこのノイズを低減しようとするものである。結果は、分類木と比較して間違いの分散が低減された分類器である。
フォレストを成長させるために、以下のアルゴリズムを使用する:
1.b=1~B(ここで、Bは、フォレスト内で成長させる木の数である)について、
a.ブートストラップサンプルを作成する。
b.ブートストラップサンプルに対して分類木、Tを成長させる。
2.セット
Figure 0007250693000003
を出力する。このセットがランダムフォレストである。
ブートストラップサンプルは、観察データと同数の観察結果を用いた観察データからの置換えで作成されるサンプルである。
ランダムフォレストを使用して新しい観察結果を分類するために、新しい観察結果をランダムフォレスト内の各分類木を使用して分類する。分類木の間で最も多く新しい観察結果が分類されるクラスが、ランダムフォレストにより新しい観察結果が分類されるクラスである。
ランダムフォレストでは、分類木において見いだされる問題の多くが低減されるが、解釈性が犠牲になる。
本明細書で考察されるランダムフォレストを実行するためのツールは、統計学的ソフトウェアコンピューティング言語および環境、Rに利用可能である。例えば、Rパッケージ「ランダムフォレスト」、バージョン4.6-2は、ランダムフォレストを創出し、処理し、利用するためのツールを含む。
AdaBoost(適応的ブースティング)
AdaBoostにより、n対象のそれぞれを、対象ごとに1つの測定値のk次元ベクトル(kタプルと称される)に基づいて2つまたはそれよりも多くの疾患カテゴリーに分類するやり方がもたらされる。AdaBoostでは、不十分であるがランダムよりは良好な予測性能を有する一連の「弱い」分類器を取得し、それらを組み合わせて優れた分類器を創出する。AdaBoostで使用する弱い分類器は、classification and regression trees(CART)である。CARTでは、データ空間を、その領域内に入る全ての新しい観察結果がある特定のカテゴリー標識に割り当てられるような領域に再帰的に分割する。AdaBoostでは、重みが前の繰り返しにおける分類器の性能に依存する重み付けされたバージョンのデータセットに基づいて一連のCARTを築く(Han JおよびKamber M、(2006年)。Data Mining, Concepts and Techniques、第2版、Elsevier:Amsterdam)。
AdaBoostは、観察結果が属し得るカテゴリーが2つある場合にのみ技術的に機能する。g>2カテゴリーに関しては、観察結果をnotの群に属するものと分類する(g/2)モデルを創出しなければならない。次いで、これらのモデルからの結果を組み合わせて、特定の観察結果の群メンバーシップを予測することができる。
この状況における予測性能は、誤分類された観察結果の割合と定義される。
分類システムを使用してデータを分類する方法
本発明は、個体から得たデータ(テストデータ、すなわち、バイオマーカー定量値)を分類する方法を提供する。これらの方法は、訓練データを準備するまたは得ること、ならびに、個体から得たテストデータを、上記の少なくとも1つの分類器を含む分類システムの1つを使用して評価すること(訓練データと比較して)を伴う。好ましい分類システムでは、例えば、サポートベクターマシン(SVM)、AdaBoost、ペナルティー付加ロジスティック回帰、ナイーブベイズ分類器、分類木、k-最近傍分類器、ニューラルネット、ランダムフォレスト、および/またはこれらの組合せを含めた学習機械などの分類器を使用する。分類システムにより、テストデータに基づく個体の分類が出力される。
本発明に関して特に好ましいのは、多数の分類器を組み合わせる、分類システムに対して使用されるアンサンブル法である。例えば、アンサンブル法では、疾患病状に関する予測(例えば、NSCLCまたは正常)を行うために、SVM、AdaBoost、ペナルティー付加ロジスティック回帰、ナイーブベイズ分類器、分類木、k-最近傍分類器、ニューラルネット、ランダムフォレスト、またはこれらの任意の組合せを含めることができる。アンサンブル法は、分類器のそれぞれによってもたらされる利点、および各血漿検体の反復実験測定値を活用するために開発された。
各対象の血漿中のバイオマーカーのそれぞれについてのバイオマーカー定量値を多数のサンプルに関して得る。一般には、血漿サンプルを採取し、各サンプルについてバイオマーカー定量値の必要全数を得る。各対象を、少なくとも1つの分類器を含む分類システムを使用し、反復実験測定値(例えば、2連、3連)のそれぞれに基づいて病態(例えば、NSCLCまたは正常)を有すると予測し、それにより、多数の予測(例えば、4つの予測、6つの予測)を得ることができる。本発明の好ましい方式では、アンサンブル法体系により、予測の少なくとも1つがNSCLCであり、他の予測の全てが、対象が正常であると予測するものである場合、対象がNSCLCを有すると予測することができる。アンサンブル法体系をできるだけ保存的にするために、分類器からの予測のうちの1つのみがNSCLCについて陽性である場合に対象がNSCLCを有すると予測するための決定を行った。言い換えれば、このテストは、偽陽性という間違いよりも重大な間違いである偽陰性の数を最小限にするために、対象がNSCLCを有すると同定しすぎるくらいに設計された。アンサンブル法体系では、予測の少なくとも2つ、または少なくとも3つ、または少なくとも4つ、または少なくとも5つ、最大で全てがNSCLCについて陽性である場合に、対象が、例えばNSCLCを有すると予測することができる。
テストデータは、複数のバイオマーカーの血漿中濃度測定値などの任意のバイオマーカー定量値であってよい。一実施形態では、本発明は、バイオマーカーのセットそれぞれの複数の血漿中濃度定量値であるバイオマーカー定量値を含むテストデータを分類する方法であって、(a)電子的に保存された訓練データベクトルのセットにアクセスするステップであって、各訓練データベクトルまたはkタプルが、個々のヒトを表し、かつ、各反復実験について、それぞれのヒトについてのバイオマーカー定量値(すなわち、バイオマーカーのセットそれぞれの血漿中濃度定量値)を含み、訓練データベクトルが、それぞれのヒトの病態に関する分類をさらに含む、ステップと、(b)本明細書に記載の分類器または分類器のアンサンブルの電子表示を、電子的に保存された訓練データベクトルのセットを使用して訓練するステップと、(c)ヒト検査対象についての複数の血漿中濃度定量値を含むテストデータを受信するステップと、(d)テストデータを本明細書に記載の分類器および/または分類器のアンサンブルの電子表示を使用して評価するステップと、(e)評価するステップに基づいてヒト検査対象の分類を出力するステップとを含む方法を提供する。別の実施形態では、本発明は、バイオマーカーのセットそれぞれの複数の血漿中濃度定量値であるバイオマーカー定量値を含むテストデータを分類する方法であって、(a)電子的に保存された訓練データベクトルのセットにアクセスするステップであって、各訓練データベクトルまたはkタプルが、個々のヒトを表し、かつ、各反復実験について、それぞれのヒトについてのバイオマーカーのセットそれぞれの血漿中濃度定量値などのバイオマーカー定量値を含み、訓練データが、それぞれのヒトの病態に関する分類をさらに含む、ステップと、(b)電子的に保存された訓練データベクトルのセットを使用して、分類器および/または分類器のアンサンブルを築くステップと、(c)ヒト検査対象についての複数の血漿中濃度定量値を含むテストデータを受信するステップと、(d)テストデータを、分類器を使用して評価するステップと、(e)評価するステップに基づいてヒト検査対象の分類を出力するステップとを含む方法を提供する。あるいは、反復実験の全て(または任意の組合せ)をアベレージして、各対象について各バイオマーカーについての単一の値を生成することができる。本発明に従って出力するステップは、ヒト検査対象の分類に関する情報を電子ディスプレイにヒト可読形態でディスプレイすることを含む。
病態に関する分類は、病態の存在または非存在であり得る。本発明による病態は、非小細胞肺がんなどの肺疾患であり得る。
訓練ベクトルのセットは、少なくとも20、25、30、35、50、75、100、125、150、またはそれよりも多くのベクトルを含み得る。
データを分類する方法を本明細書に記載の方法のいずれにも使用することができることが理解された。特に、本明細書に記載のデータを分類する方法を本発明による分類に一部基づく生理的特徴付けのための方法、および非小細胞肺がんなどの肺疾患を診断する方法において使用することができる。
縮小された数のバイオマーカーを使用するデータの分類
本発明は、縮小されたバイオマーカーのセットを伴うデータ(例えば、個体から得たテストデータなど)を分類する方法も提供する。すなわち、訓練データを間引いて、選択されたバイオマーカーのサブセットについてのバイオマーカー定量値のサブセット以外の全てを除外することができる。同様に、テストデータを、同じ選択されたバイオマーカーのセットからのバイオマーカー定量値のサブセットに制限することができる。
バイオマーカーは、bNGF、CA-125、CEA、CYFRA21-1、EGFR/HER1/ErBB1、GM-CSF、グランザイムB、Gro-アルファ、ErbB2/HER2、HGF、IFN-a2、IFN-b、IFN-g、IL-10、IL-12p40、IL-12p70、IL-13、IL-15、IL-16、IL-17A、IL-17F、IL-1a、IL-1b、IL-1ra、IL-2、IL-20、IL-21、IL-22、IL-23p19、IL-27、IL-2ra、IL-3、IL-31、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IP-10、I-TAC、レプチン、LIF、MCP-1、MCP-3、M-CSF、MIF、MIG、MIP-1a、MIP-1b、MIP-3a、MMP-7、MMP9、MPO、NSE、OPG、PAI-1、PDGF-AB/BB、PDGF、RANTES、レジスチン、SAA、sCD40-リガンド、SCF、SDF-1、SE-セレクチン、sFasリガンド、sICAM-1、RANKL、TNFRI、TNFRII、sVCAM-1、TGF-α、TGF-β、TNF-α、TNF-β、TPO、TRAIL、TSP1、TSP2、VEGF-A、VEGF-C、およびこれらの組合せからなる群から選択することができる。
バイオマーカーは、IL-4、sEGFR、レプチン、NSE、MCP-1、GRO-pan、IL-10、IL-12P70、sCD40L、IL-7、IL-9、IL-2、IL-5、IL-8、IL-16、LIF、CXCL9/MIG、HGF、MIF、MMP-7、MMP-9、sFasL、CYFRA21-1、CA125、CEA、sICAM-1、MPO、RANTES、PDGF-AB/BB、レジスチン、SAA、TNFRI、sTNFRII、およびこれらの組合せからなる群から選択することができる。
バイオマーカーは、IL-8、MMP-9、sTNFRII、TNFRI、MMP-7、IL-5、レジスチン、IL-10、MPO、NSE、MCP-1、GRO-Pan、CEA、レプチン、CXCL9/MIG、CYFRA 21-1、MIF、sICAM-1、SAA、およびこれらの組合せからなる群から選択することができる。
バイオマーカーは、IL-8、MMP-9、sTNFRII、TNFRI、レジスチン、MPO、NSE、GRO-Pan、CEA、CXCL9/MIG、IL-2、SAA、PDGF-AB/BB、およびこれらの組合せからなる群から選択することができる。
一実施形態では、本発明は、バイオマーカーのセットそれぞれの複数の血漿中濃度定量値であるバイオマーカー定量値を含むテストデータを分類する方法であって、(a)電子的に保存された訓練データベクトルのセットにアクセスするステップであって、各訓練データベクトルが、個々のヒトを表し、かつ、それぞれのヒトについてのバイオマーカーのセットの各バイオマーカーのバイオマーカー定量値を含み、各訓練データベクトルが、それぞれのヒトの病態に関する分類をさらに含む、ステップと、(b)バイオマーカーのセットからバイオマーカーのサブセットを選択するステップと、(c)本明細書に記載の分類器または分類器のアンサンブルなどの学習機械の電子表示を、電子的に保存された訓練データベクトルのセットのバイオマーカーのサブセットからのデータを使用して訓練するステップと、(d)ステップ(a)のバイオマーカーのセットに関連するヒト検査対象についての複数の血漿中濃度定量値を含むテストデータを受信するステップと、(e)テストデータを、学習機械の電子表示を使用して評価するステップと、(f)評価するステップに基づいてヒト検査対象の分類を出力するステップとを含む方法を提供する。
本明細書に記載の方法、キット、およびシステムは、選択された複数のバイオマーカーのバイオマーカー定量値を決定することを伴い得る。好ましい方式では、方法は、実施例に記載のバイオマーカーの特定のバイオマーカーのサブセットのバイオマーカー定量値を決定することを含む。あるいは、方法は、実施例に記載のバイオマーカーのうちの少なくとも2種、3種、4種、5種、6種、7種、8種、9種、10種、11種、12種、13種、14種、15種、16種、17種、18種、19種、20種、21種、22種、23種、24種、25種、26種、27種、28種、29種、31種、32種、または33種の特定のバイオマーカーのサブセットのバイオマーカー定量値を決定することを含む。あるいは、方法は、実施例に記載のバイオマーカーのうちの少なくとも8種、9種、10種、11種、12種、または13種の特定のバイオマーカーのサブセットのバイオマーカー定量値を決定することを含む。あるいは、方法は、実施例に記載のバイオマーカーのうちの少なくとも14種、15種、16種、17種、18種、19種、20種、またはそれよりも多く(例えば、33種)の特定のバイオマーカーのサブセットのバイオマーカー定量値を決定することを含む。あるいは、本明細書に記載の方法、キット、およびシステムでは、特定のバイオマーカーのサブセット(例えば、少なくとも13種、15種、19種、もしくは33種のバイオマーカー)、および別のバイオマーカーのサブセットからの1つまたは複数のバイオマーカー(例えば、13種、15種、19種、もしくは33種のバイオマーカー)を使用することができる。
目的の疾患に関連するか否かにかかわらず追加的なバイオマーカーのバイオマーカー定量値を同時に決定することは本発明の意図の範囲内である。これらの追加的なバイオマーカー定量値の決定により本発明に従った対象の分類は妨げられない。しかし、定量値が本発明の方法のいずれかの訓練データおよびテストデータに含まれるバイオマーカーの最大数は、例えば、6種の別個のバイオマーカー、10種の別個のバイオマーカー、13種の別個のバイオマーカー、15種の別個のバイオマーカー、18種の別個のバイオマーカー、20種の別個のバイオマーカー、または33種の別個のバイオマーカーであり得る。バイオマーカーの数は、過剰適合に起因する不正確な予測が回避されるように限定すべきであることが当業者には理解されよう。バイオマーカーのサブセットは、本明細書に記載の縮小方法を使用することによって決定することができる。特定のバイオマーカーのサブセットの縮小モデルを実施例に記載する。
好ましい方式では、バイオマーカーは、モデル適合の最も高い定量値に寄与するバイオマーカーを含有するコンピュータ処理されたサブセットから選択される。これらのバイオマーカーが含まれる限りは、本発明では、必ずしも寄与しない少数の追加的なバイオマーカーを含めることは排除されない。また、このモデルが本明細書に記載の通り考案されたものである限りは、そのような追加的なバイオマーカー定量値を分類モデルに含めることによりテストデータの分類は排除されない。他の実施形態では、4種以下、5種以下、6種以下、7種以下、8種以下、9種以下、10種以下、12種以下、15種以下、20種以下、25種以下、30種以下、35種以下、40種以下または50種以下のバイオマーカーのバイオマーカー定量値を対象について決定し、同じ数のバイオマーカーを訓練フェーズにおいて使用する。
別の方式では、選択されたバイオマーカーは、モデル適合の定量値に最小に寄与するバイオマーカーが除去された、コンピュータ処理されたサブセットから選択される。これらの選択されたバイオマーカーが含まれる限りは、本発明では、必ずしも寄与しない少数の追加的なバイオマーカーを含めることは排除されない。また、このモデルが本明細書に記載の通り考案されたものである限りは、そのような追加的なバイオマーカー定量値を分類モデルに含めることによりテストデータの分類は排除されない。他の実施形態では、4種以下、5種以下、6種以下、7種以下、8種以下、9種以下、10種以下、11種以下、12種以下、13種以下、14種以下、15種以下、16種以下、17種以下、18種以下、19種以下、20種以下、21種以下、22種以下、23種以下、24種以下、25種以下、30種以下、31種以下、32種以下、33種以下、34種以下、35種以下、40種以下または50種以下のバイオマーカーのバイオマーカー定量値を対象について決定し、同じ数のバイオマーカーを訓練フェーズにおいて使用する。
縮小されたバイオマーカーのセットまたはサブセットを使用してデータを分類する方法を本明細書に記載の方法のいずれにも使用することができることが理解された。特に、縮小された数の本明細書に記載のバイオマーカーを使用してデータを分類する方法を、本発明による分類に一部基づく生理的特徴付けのための方法、および非小細胞肺がんなどの肺疾患を診断する方法において使用することができる。縮小された数のバイオマーカー以外のバイオマーカーを追加することもできる。これらの追加的なバイオマーカーは、診断に寄与するまたはそれを増強するものであってもそうでなくてもよい。
肺疾患
本発明は、非小細胞肺がんを診断する方法を提供する。これらの方法は、本明細書に記載の複数のバイオマーカーのバイオマーカー定量値を決定するステップであって、バイオマーカーが、非小細胞肺がんの存在または発症を示す、ステップを含む。例えば、本明細書に記載のバイオマーカーのバイオマーカー定量値を使用して、非小細胞肺がんの進行の程度、前がん病変の存在、または非小細胞肺がんの病期分類の決定を補助することができる。例えば、本明細書に記載のバイオマーカー定量値を使用する方法を使用して、初期の(ステージI)非小細胞肺がんを診断することができる。また、バイオマーカー定量値は、喘息、乳がん、前立腺がん、膵がん、またはこれらの組合せを示さない場合がある。
特定の実施形態では、対象は、非小細胞肺がんの1つまたは複数の症状を示す個体から選択される。症状としては、咳、息切れ、喘鳴、胸痛、および喀血;腕の外側に放散する肩痛または嗄声につながる声帯の麻痺;嚥下困難につながる可能性がある食道浸潤を挙げることができる。大気道が閉塞すると、肺の一部の崩壊が起こり、膿瘍または肺炎につながる感染が引き起こされる可能性がある。骨への転移により、耐え難い疼痛が生じ得る。脳への転移により、霧視、頭痛、発作、または、衰弱もしくは体の一部の感覚喪失などの一般に脳卒中に関連する症状を含めた神経症状が引き起こされる可能性がある。肺がんでは、多くの場合、腫瘍細胞によるホルモン様物質の産生に起因する症状が生じる。NSCLCにおいて見られる共通の腫瘍随伴症候群は、血流中のカルシウムの上昇を引き起こす副甲状腺ホルモン様物質の産生である。
非小細胞肺がんを診断する方法
本発明は、下記の種々の集団内の個体における非小細胞肺がんを診断する方法に関する。一般に、これらの方法は、本明細書に記載の特定のバイオマーカーのバイオマーカー定量値を決定し、本明細書に記載の分類器または分類器のアンサンブルを含む分類システムを使用してバイオマーカー定量値を分類することに依拠する。
A.母集団の決定
本発明は、対象における非小細胞肺がんを診断する方法であって、(a)対象の生理学的サンプルを得るステップと、(b)前記サンプル中の本明細書に記載の複数のバイオマーカーのバイオマーカー定量値を決定するステップと、(c)サンプルを、分類システムを使用し、バイオマーカー定量値に基づいて分類するステップであって、サンプルの分類により、対象における非小細胞肺がんの存在または発症が示される、ステップとを含む方法を提供する。
好ましい実施形態では、本発明は、対象における非小細胞肺がんを診断する方法であって、対象の生理学的サンプル中の複数のバイオマーカーのバイオマーカー定量値を決定するステップであって、複数のマーカーの発現パターンが、非小細胞肺がんを示すか、または非小細胞肺がん病態変化と相関する(すなわち、臨床的または診断的段階)、ステップを含む方法を提供する。複数のバイオマーカーは、本明細書に記載の分類器または分類器のアンサンブルなどの機械学習アルゴリズムによる訓練データの解析に基づいて選択されることが好ましい。訓練データは、多数の対象についての複数のバイオマーカー定量値、ならびに個々の対象についての疾患カテゴリー化、および必要に応じて、性別、人種、民族性、国籍、年齢、喫煙歴、および/または使用歴などの対象の他の特性を含む。別の好ましい実施形態では、発現のパターンは、対象が非小細胞肺がんを有するまたは有し得る可能性の増大と相関する。発現のパターンは、本明細書において分類器および/または分類器のアンサンブルとして記載されているものなどの、パターン認識のための当技術分野で公知の任意の技法によって特徴付けることができる。複数のバイオマーカーは、実施例に記載のバイオマーカーの組合せのいずれかを含み得る。
一実施形態では、対象は、非小細胞肺がんのリスクにある。別の実施形態では、対象は、非小細胞肺がんの1つまたは複数の症状を示す個体から選択される。
B.男性集団についての決定
本発明は、男性対象における非小細胞肺がんを診断する方法を提供する。これらの実施形態の方法は、訓練データおよびサンプルのどちらに関しても対象が男性であること以外は上記の方法と同様である。
C.女性集団についての決定
本発明は、女性対象における非小細胞肺がんを診断する方法を提供する。これらの実施形態の方法は、訓練データおよびサンプルのどちらに関しても対象が女性であること以外は上記の方法と同様である。
D.肺小結節の補足的分析および処置方法
好ましい方式では、本発明の分類法をコンピュータ断層撮影と併せて使用して、NSCLCのスクリーニングの手順の増強および早期検出を生成することができる。一部の実施形態では、本明細書に記載の分類方法のうちの1つを、CTスキャンによって少なくとも1つの肺小結節が検出された対象由来の1つまたは複数の生理学的サンプル中の複数のバイオマーカーについてのバイオマーカー定量値に適用する。特定の実施形態では、対象は、直径が6mmから20mmの間の肺小結節を少なくとも1つ有する。サンプルをNSCLCまたは正常に分類することにより、そのような患者の最終的な診断的特徴付けを補助することができる。代替の実施形態では、分類法をサンプルに適用した後、サンプルがNSCLCに分類される対象をCTスキャンによるさらなる検査のために選択し、そのような患者において検出されたあらゆる小結節を、「低リスク」の患者ではなく「高リスク」の患者についてのプロトコールに従って処置する。スクリーニングの増強のための好ましい分類プロトコールは、反復実験サンプリング(例えば、2連、3連)を使用したアンサンブル分類システムであり、反復実験サンプルの少なくとも1つが本明細書に記載の分類器または分類器のアンサンブルによって「NSCLC」に分類される患者を「高リスク」とみなす。
他の実施形態では、本発明は、本明細書に記載の分類方法のいずれかの出力に基づく処置方法を提供する。例えば、一実施形態では、本発明は、本明細書に記載の分類方法のいずれかを使用した「NSCLC」への分類後に、対象をNSCLCについて処置する方法を提供する。さらに、前の段落において考察されている通り、本発明は、追加的な分析(例えば、CTスキャン)と併せて、本明細書に記載の分類方法を使用して生じた診断に基づく処置方法を含む。
特徴付けのためのシステムを設計する方法
E.母集団
本発明は、非小細胞肺がんを診断するためのシステムを設計するための方法であって、(a)複数のバイオマーカーを選択するステップと、(b)前記複数のバイオマーカーのバイオマーカー定量値を決定するための手段を選択するステップと、(c)対象が非小細胞肺がんに罹患している可能性を決定するための、前記バイオマーカー定量値を決定するための手段およびバイオマーカー定量値を分析するための手段を含むシステムを設計するステップとを含む方法も提供する。さらに、本明細書に記載のバイオマーカー定量値は、喘息、乳がん、前立腺がん、膵がん、またはこれらの組合せを示すことを回避し得る。
本発明は、対象における非小細胞肺がんを診断するためのシステムを設計するための方法であって、(a)複数のバイオマーカーを選択するステップと、(b)前記複数のバイオマーカーのバイオマーカー定量値を決定するための手段を選択するステップと、(c)対象が非小細胞肺がんに罹患している可能性を決定するための、前記バイオマーカー定量値を決定するための手段およびバイオマーカー定量値を分析するための手段を含むシステムを設計するステップとを含む方法も提供する。
上記の方法では、ステップ(b)および(c)は、その代わりに、(b)前記複数のバイオマーカーを検出するための検出剤を選択するステップと、(c)複数のバイオマーカーを検出するための前記検出剤を含むシステムを設計するステップによって実施することができる。
F.男性集団
本発明は、男性対象における肺疾患の診断を補助するためのシステムを設計するための方法も提供する。これらの実施形態の方法は、上記の方法と同様である。
G.女性集団
本発明は、女性対象における肺疾患の診断を補助するためのシステムを設計するための方法も提供する。これらの実施形態の方法は、上記の方法と同様である。
分類システム
本発明は、本発明の方法の実施を補助するシステムを提供する。例示的な分類システムは、訓練データセットおよび/またはテストデータセットを保存するためのストレージデバイスならびに本明細書に記載の分類器または分類器のアンサンブルなどの学習機械を実行するためのコンピュータを含む。コンピュータは、データベースから訓練データセットを収集するため、訓練データセットを前処理するため、前処理されたテストデータセットを使用し、訓練された学習機械のテスト出力の受信に応答して学習機械を訓練するため、テスト出力を後処理して、テスト出力が最適な解であるかどうかを決定するためにも動作可能であり得る。そのような前処理は、例えば、データを目視検査して、明らかに間違ったエントリーを検出し、除去すること、データを、適正な標準の分量に分けることによって正規化すること、およびデータを確実にそれぞれのアルゴリズムに使用するのに妥当な形態にすることを含み得る。例示的なシステムは、リモートソースからテストデータセットおよび訓練データセットを受信するための通信デバイスも含み得る。そのような場合では、コンピュータは、訓練データセットを前処理する前に訓練データセットをストレージデバイスに保存するため、およびテストデータセットを前処理する前にテストデータセットをストレージデバイスに保存するために動作可能であり得る。例示的なシステムは、処理後のテストデータをディスプレイするためのディスプレイデバイスも含み得る。例示的なシステムのコンピュータは、さらに、上記の追加的な機能のそれぞれを実施するためにも動作可能であり得る。
本明細書で使用される場合、「コンピュータ」という用語は、少なくとも1つのメモリを使用する少なくとも1つのハードウェアプロセッサを含むものと理解されるべきである。少なくとも1つのメモリは、指示のセットを保存することができるものである。指示は、コンピュータのメモリ(単数または複数)に恒久的かまたは一時的に保存することができる。プロセッサにより、データを処理するために、メモリ(単数または複数)に保存されている指示が実行される。指示のセットは、本明細書に記載の課題などの特定の課題(単数または複数)を実施する種々の指示を含み得る。特定の課題を実施するためのそのような指示のセットは、プログラム、ソフトウェアプログラム、または単にソフトウェアとして特徴付けることができる。
上記の通り、コンピュータにより、データを処理するために、メモリ(単数または複数)に保存されている指示が実行される。このデータの処理は、例えば、コンピュータの使用者(単数または複数)によるコマンドに応答するもの、前の処理に応答するもの、別のコンピュータおよび/または任意の他の入力による要求に応答するものであり得る。
実施形態を少なくとも部分的に実行するために使用するコンピュータは、汎用コンピュータであってよい。しかし、コンピュータは、専用コンピュータ、例えばマイクロコンピュータ、ミニコンピュータもしくはメインフレーム、プログラミングされたマイクロプロセッサ、マイクロコントローラー、周辺集積回路素子、CSIC(Customer Specific Integrated Circuit)またはASIC(Application Specific Integrated Circuit)または他の集積回路、論理回路、デジタルシグナルプロセッサ、FPGA、PLD、PLAもしくはPALなどのプログラム可能論理デバイス、または本発明のプロセスのステップの少なくとも一部を実行することが可能な任意の他のデバイスもしくはデバイスの配置を含むコンピュータシステムを含めた多種多様な他の技術のいずれを利用することもできる。
本発明の方法を実施するためには、コンピュータのプロセッサおよび/またはメモリが同じ地理的な場所に物理的に位置する必要はないことが理解される。すなわち、コンピュータに使用されるプロセッサおよびメモリのそれぞれは、地理的に別個の位置に位置し、任意の適切な様式で通信するように接続することができる。さらに、プロセッサおよび/またはメモリのそれぞれは、装置の異なる物理的部品で構成され得ることが理解される。したがって、プロセッサが、1つの位置にある1つの単一の装置である必要はなく、また、メモリが別の位置にある別の単一の装置である必要はない。すなわち、例えば、プロセッサが2つの異なる物理的位置にある2つまたはそれよりも多くの装置であり得ることが意図されている。2つまたはそれよりも多くの別個の装置をネットワークなどの任意の適切な様式で接続することができる。さらに、メモリは、2つまたはそれよりも多くの物理的位置にメモリの2つまたはそれよりも多くの部分を含み得る。
種々のコンピュータ、プロセッサおよび/またはメモリ間の通信を生成するため、ならびに本発明のプロセッサおよび/またはメモリと任意の他の実体との通信を可能にするため;例えば、さらなる指示を得るため、または例えばリモートメモリストアにアクセスし、それを使用するために、種々の技術を使用することができる。そのような通信を生成するために使用されるそのような技術は、例えば、ネットワーク、インターネット、イントラネット、エクストラネット、LAN、イーサネット(登録商標)、または通信を提供する任意のクライアントサーバーシステムを含み得る。そのような通信技術では、例えばTCP/IP、UDP、またはOSIなどの任意の適切なプロトコールを使用することができる。
さらに、本発明の実行および操作に使用されるコンピュータ指示または指示のセットは、コンピュータが指示を読み取ることができるような適切な形態であることが理解される。
一部の実施形態では、ヒト使用者が、実施形態を少なくとも部分的に実行するために使用されるコンピュータまたは機械とインタフェースで接続することを可能にするために、種々のユーザインタフェースを利用することができる。ユーザインタフェースは、ダイアログスクリーンの形態であってよい。ユーザインタフェースはまた、マウス、タッチスクリーン、キーボード、音声読み上げ装置、音声認識装置、対話画面、メニューボックス、リスト、チェックボックス、トグルスイッチ、プッシュボタン、または、使用者が、指示のセットを処理し、かつ/もしくはコンピュータに情報を提供したらコンピュータの操作に関する情報を受信することを可能にする任意の他のデバイスも含み得る。したがって、ユーザインタフェースは、使用者とコンピュータの間の通信を生成する任意のデバイスである。使用者によりユーザインタフェースを通じてコンピュータに提供される情報は、例えばコマンド、データの選択、またはいくつかの他の入力の形態であってよい。
本発明のユーザインタフェースは、ヒト使用者ではなく別のコンピュータと相互作用する、例えば、情報を伝達および受信できることも意図されている。したがって、他のコンピュータを使用者として特徴付けることができる。さらに、本発明のシステムおよび方法において利用されるユーザインタフェースは、別のコンピュータ(単数または複数)と部分的に相互作用し得ると同時に、ヒト使用者とも部分的に相互作用し得ることが意図されている。
以下の実施例は、本明細書に開示される本発明の種々の方式を例証するために提示されるが、本発明をどのようにも限定するものではない。
(実施例1)
非小細胞肺がんを検出するためのアルゴリズムの選択
実施例1は、異なるアルゴリズムの展開および評価を例示する。
バイオマーカーの選択
この実施例では、非線形分類器を使用して患者が疾患に罹患している可能性があるかどうかを決定する非小細胞肺がんの診断方法において有用であると思われるバイオマーカーのサブセットを同定するために、82種のバイオマーカーのセットをスクリーニングするために使用した手順を記載する。スクリーニングに供された82種のバイオマーカーのセットは、以前の試験の結果に基づくものと、それに加えて、初期の肺がんに対して診断的な潜在力を有することが報告されている10~15種の追加的なバイオマーカーであった。82種のバイオマーカーは、bNGF、CA-125、CEA、CYFRA21-1、EGFR/HER1/ErBB1、GM-CSF、グランザイムB、Gro-アルファ、ErbB2/HER2、HGF、IFN-a2、IFN-b、IFN-g、IL-10、IL-12p40、IL-12p70、IL-13、IL-15、IL-16、IL-17A、IL-17F、IL-1a、IL-1b、IL-1ra、IL-2、IL-20、IL-21、IL-22、IL-23p19、IL-27、IL-2ra、IL-3、IL-31、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IP-10、I-TAC、レプチン、LIF、MCP-1、MCP-3、M-CSF、MIF、MIG、MIP-1a、MIP-1b、MIP-3a、MMP-7、MMP9、MPO、NSE、OPG、PAI-1、PDGF-AB/BB、PDGF、RANTES、レジスチン、SAA、sCD40-リガンド、SCF、SDF-1、SE-セレクチン、sFasリガンド、sICAM-1、RANKL、TNFRI、TNFRII、sVCAM-1、TGF-α、TGF-β、TNF-α、TNF-β、TPO、TRAIL、TSP1、TSP2、VEGF-A、およびVEGF-Cである。
この実施例に示されているアルゴリズムの展開には、82種のセットから実施例2に例示されているプロセスによって選択された33種のバイオマーカーを使用した。生物学的主題専門知識と統計学的重要度の組合せ(GINIの平均低減によって測定される各バイオマーカーの重要度に関しては表6を参照されたい)をランダムフォレストモデルに使用し、33種のバイオマーカーをNSCLCの診断的決定のために使用するものとして選択した。文献および生理学的-臨床的経路検索により、大多数の選択されたバイオマーカーが、肺がん、具体的にはNSCLCと直接の生物学的相関を有することまたは生理学的-臨床的経路内に入ることが示された。以下のバイオマーカーを最終的なアルゴリズム展開における分析のために使用した:IL-4、sEGFR、レプチン、NSE、MCP-1、GRO-pan、IL-10、IL-12P70、sCD40L、IL-7、IL-9、IL-2、IL-5、IL-8、IL-16、LIF、CXCL9/MIG、HGF、MIF、MMP-7、MMP-9、sFasL、CYFRA21-1、CA125、CEA、sICAM-1、MPO、RANTES、PDGF-AB/BB、レジスチン、SAA、TNFRI、およびsTNFRII。NSCLCと他の病状の識別において人種は重要な因子ではなく、性別の重要度はごくわずかであった。
試験集団の判断基準
以下の表1中の以下の組み入れ基準を、この試験のための試験集団内の対象を選択するために使用した。
Figure 0007250693000004
サンプルサイズ選択
試験サンプルサイズは仮説を検定するために必要に応じて決定した:
:Se<0.8またはSp<0.8
:Se≧0.8およびSp≧0.8
ここで、Seは、アルゴリズムの感度であり(1-偽陽性率と等しい)、Spはアルゴリズムの特異度(1-偽陰性率と等しい)であった。第1種の過誤を0.05、および第2種の過誤を0.2とすると、検証セットのNSCLCコホートおよび非NSCLCコホートのそれぞれに83名の対象が必要であった(表2)。訓練セットのサンプルサイズは、マルチプレックスイムノアッセイデータに対してSVMおよびAdaBoostモデルに過去の経験を適合させることによって決定した。
試験サンプル
合計1,000名の対象由来のサンプルについて2連で行って訓練および検証セットのためのN=2,000の測定値を得た。アルゴリズムの性能を評価するために、1,000名の対象から、合計554名の対象(N=1,108)を訓練セットにランダム化し、合計446名の対象(N=892)をブラインドした検証セットにランダム化した。アルゴリズム展開者は、検証セット内のサンプルの病状に関してブラインドされた。全てのサンプルを訓練セットまたは検証セットのいずれか、それらが分析されたプレート、およびプレート上の位置にランダム化した。試験の全プレートにわたってコホートを一様に分布させた。サンプルは、アフリカ系アメリカ人、コーカサス人、およびラテンアメリカ系集団の混合からなる。表2は、種々のコホートが訓練セットと検証セットの間にどのように分布するかを示す。
Figure 0007250693000005
サンプルの調達、取扱い、および保存
二ナトリウムEDTA管(Na-EDTA)中に採取したヒト血漿サンプルを使用した。血液サンプルを、採取後最大1時間にわたって氷上で保存し、4℃/39°F、1500×gで10分間遠心分離した。次いで血漿を15mlの円錐管に移し、再度遠心分離した。血漿サンプルを-80℃で一回使用用の一定分量中に保存して、多数の凍結融解サイクルを回避した。この手順によって調製された血漿サンプルをAsterand、BioReclammation、BioSource、Geneticist、およびProteogenexから入手した。
対照取扱い手順
Millipore Quality Control 1およびQuality Control 2を凍結乾燥形式で展開し、2~8℃で保存した。各対照バイアルを、脱イオン水100μL中に再構成し、数回反転させ、ボルテックスし、氷上で5~10分間インキュベートした。使用しなかった部分を-20℃以下で最大1カ月間保存した。
装置および条件
FLEXMAP 3D Luminex計器を使用してデータを収集した。Integra ViaFlo 96ロボットをプレート中のサンプルおよび試薬の移行のために使用した。
試験方法体系
生理学的サンプル中の種々のバイオマーカーについてのバイオマーカー定量値を、捕捉サンドイッチイムノアッセイ形式を使用する、磁気ビーズ上に設計されたアッセイによって得た。捕捉抗体とカップリングしたビーズを、アッセイ緩衝剤、血清(serum)/血漿マトリックス溶液および抗原標準物質、サンプル、ブランク、または対照と一緒に終夜インキュベートした。終夜インキュベーション(16~18時間)は、2~8℃、プレート振とう機、500~800rpmで行った。翌日、ビーズを2回洗浄した。全ての洗浄および試薬の移行をIntegraからのViaFlo96による半自動化プロセスを使用して行った。翌日いっぱい、インキュベーションを室温(20~25℃)、500~800rpmで行った。洗浄後、検出用抗体を添加し、60分間インキュベートした。次いで、ビーズをレポーターストレプトアビジン-フィコエリトリンコンジュゲート(SA-PE)と一緒に30分間インキュベートした。ビーズを2回洗浄して過剰な検出用抗体およびSA-PEを除去した。シース液をビーズに添加し、振とう機中に5分間置いた。ビーズの蛍光および結合したSA-PEの蛍光を測定するFlexMap 3Dを使用してプレートを読み取った。Exponentソフトウェアを使用してデータを取得し、次いで、低PMT設定でのデータ解析のためにBio-Plex Manager 6.1にインポートした。
コンピュータ化システムおよびソフトウェア
Luminex xPONENT取得ソフトウェアを使用してデータ収集を実施した。Bio-Rad Bio-Plex Manager(商標)6.1 Standard Edition Softwareからのデータを解析に使用した。
データ解析のためのパラメータ
以下のパラメータをデータ解析プロセスに適用した。以下の判定基準はFDA Guidance for the Industry:Bioanalytical Method Validation[2013年]に準拠するものであった。
以下のアッセイ判定基準を全てのプレート実行および全てのアッセイウェルの各個のバイオマーカーに適用した。同じ規則を標準/較正曲線、サンプル、および対照に適用した。
1)用量回収範囲100±20%(80%~120%)
2)回帰型ロジスティック5PL(非線形)
3)最低6標準点が必要
4)バックグラウンドMFI<200
5)ビーズ計数≧50
6)Conc In RangeおよびFI値を使用してアッセイ内<15%(LLOQの値に対して≦20%)
7)Conc In RangeおよびFI値を使用してアッセイ間<20%(LLOQの値に対して≦25%)
8)サンプルデータについての外れ値は、外れ値が2連で検出できなかったので取り除かれていない
濃度分析方法
マルチプレックスイムノアッセイ標準曲線は非線形であり、濃度-応答関係をこの試験のための5-パラメータロジスティックモデルに適合させた。この回帰法には最低6つの標準点が必要であった。Bio-Plex Manager Software6.1を使用し、ロジスティック5PL回帰法を使用して標準曲線を算出した。5-PLロジスティック算出は以下の通りであった:
Y=d+(a-d)/[1+(x/c)、ここで、
xは濃度であり
yは応答であり
aは無限濃度における推定応答であり
bは中点における接線の傾きであり
cは中間の濃度または中点であり
dはゼロ濃度において推定される応答であり
gは非対称因子である。
アッセイの精度を、全ての実行のアベレージおよび標準偏差(SD)からの変動係数(CV)、%CV=(SD/平均値)を決定することによって評価し、パーセンテージとして表した。
回収率を、次式:R=(観察値/予測値)×100%を使用して算出した。観察濃度としても公知の観察値(OV)は、定量化された分析物の測定された値であり、pg/mLで報告された。予測濃度としても公知の予測値(EV)は、標準の抗原を使用して希釈物に関して測定されると予測された分析物のpg/mL単位の値であった。
アルゴリズム法解析
アルゴリズムモデルの展開
この実施例では、アルゴリズムモデルを選択するために6種の異なるアルゴリズム形態を試験した。データ解析では、対象由来の生理学的サンプル中の33種のバイオマーカーの2連の測定値、ならびに対象の性別および喫煙状況を考慮し、各測定値を、NSCLCを有するとしてまたは有さないとして分類した。アルゴリズムモデルを訓練セットに対して展開した。アルゴリズムが十分に訓練されたら、その性能を、ブラインドした検証セットに対して解析した。最終的なアルゴリズムモデルを以下のアルゴリズム(またはこれらの組合せ)のうちの、10倍交差検証の下でそれらの感度および特異度によって決定される性能が最良のものから選択した:
(1)遺伝的アルゴリズム-SVM
(2)ランダムフォレスト
(3)LASSO
(4)リッジ回帰
(5)AdaBoost
上記のモデルのうち、ランダムフォレストモデルが最良の性能を有した。したがって、ランダムフォレストを本発明によるバイオマーカー定量値のその後の解析における分類器アルゴリズムとして使用する[表3]。この実施例による解析モデルの感度は0.982(95%CI:0.921~0.998)であり、特異度は0.865(95%CI:0.802~0.914)である。NSCLCのほかに他のがんをデータセットから除いた場合、特異度は0.967(95%CI:0.916~0.991)まで上昇する。各対象を1つのセットに割り当てた:(1)モデルを構築した訓練セット、または(2)モデル性能を測定した検証セット。
Figure 0007250693000006
(実施例1a)
NSCLC検出のためのアルゴリズムについての総説
実施例1aでは、追加的なアルゴリズム:弾性ネット、勾配木ブースティング、k-最隣接点、およびベイズニューラルネットワークを再調査することによって最終的なアルゴリズムの選択を前進させる。
以下のバイオマーカーを最終的なアルゴリズム展開における分析のために使用した:IL-4、sEGFR、レプチン、NSE、MCP-1、GRO-pan、IL-10、IL-12P70、sCD40L、IL-7、IL-9、IL-2、IL-5、IL-8、IL-16、LIF、CXCL9/MIG、HGF、MIF、MMP-7、MMP-9、sFasL、CYFRA21-1、CA125、CEA、sICAM-1、MPO、RANTES、PDGF-AB/BB、レジスチン、SAA、TNFRI、およびsTNFRII。NSCLCと他の病状の識別において人種は重要な因子ではなく、性別の重要度はごくわずかであった。
試験サンプル
実施例1aのための試験サンプルは実施例1に記載の通りである。
試験集団の判断基準
この試験の試験集団サンプルを選択するために実施例1の組み入れ基準を使用した。
サンプルサイズ選択
サンプルサイズ選択の判断基準は実施例1で使用した判断基準と同じであった。
手順および装置
サンプルの調達、取扱いおよび保存は実施例1で使用したものと同じであった。
試験方法体系
スクリーニングアッセイを実施例1に記載の通り実施した。
アルゴリズムモデル評価
この実施例では、実施例1で選択されたランダムフォレストモデルと比較するために別の6種の異なるアルゴリズム形態を試験した。データ解析では、対象由来の生理学的サンプル中の33種のバイオマーカーの2連の測定値、ならびに対象の性別および喫煙状況を考慮し、各測定値を、NSCLCを有するとしてまたは有さないとして分類した。アルゴリズムモデルを訓練セットに対して展開した。アルゴリズムが十分に訓練されたら、その性能を、ブラインドした検証セットに対して解析した。調査したアルゴリズムモデル(またはこれらの組合せ)は、
〇 弾性ネット
〇 勾配ブースティング木
〇 ニューラルネットワーク
〇 ベイズニューラルネットワーク
〇 k-最近傍
〇 ナイーブベイズ
である。
いずれの追加的なモデルもランダムフォレストアルゴリズムを使用したモデル適合に勝らなかった。ニューラルネットワークに基づくアルゴリズムの場合では、モデルが、モデルをうまく適合させるために十分なデータを有していなかった可能性がある。しかし、より多くのデータを追加することにより、モデル適合が改善されるはずである。
Figure 0007250693000007
(実施例2)
バイオマーカーのサブグループの選択
実施例2では、ランダムフォレストを分類アルゴリズムとして使用して33種のバイオマーカーの選択を例証する。
バイオマーカーの選択
この試験では、初期の肺がんに対して診断的な潜在力を有するとして33種のバイオマーカーを選択した。33種のバイオマーカーは、CA-125、CEA、CYFRA21-1、EGFR/HER1/ErBB1、Gro-Pan、HGF、IL-10、IL-12p70、IL-16、IL-2、IL-4、IL-5、IL-7、IL-8、IL-9、レプチン、LIF、MCP-1、MIF、MIG、MMP-7、MMP9、MPO、NSE、PDGF-AB/BB、RANTES、レジスチン、sFasL、SAA、sCD40-リガンド、sICAM-1、TNFRI、およびTNFRIIである。
アルゴリズム
分類器に対するアルゴリズムモデルでは、対象由来の33種のバイオマーカーの2連の測定値、ならびにそれらの性別および喫煙状況を考慮し、各測定値を病態によって分類する。ランダムフォレストアルゴリズムを使用し、対象についての2連の測定値のそれぞれを、NSCLCを有するとしてまたはNSCLCを有さないとして分類した。測定値のいずれかが、NSCLCを有する対象に由来するものと分類された場合、対象を、NSCLCを有するとして分類した。このアルゴリズムは、対象がNSCLCを有すると予測しすぎる傾向がある。これは、処置しなければ疾患の進行を許すという固有の代償に起因する。
試験サンプル
合計1,258名の対象(2,516サンプル)を2連で処理し、N=2,514の測定値を得た。全てのサンプルをランダム化し、試験の全プレートにわたってコホートを一様に分布させた。
試験集団の判断基準
この試験の試験集団サンプルを選択するために実施例1の組み入れ基準を使用した。
サンプルサイズ選択
サンプルサイズ選択の判断基準は実施例1で使用したものと判断基準と同じであった。この試験のサンプルコホートを表4に記載する。
Figure 0007250693000008
手順および装置
サンプルの調達、取扱いおよび保存は実施例1で使用したものと同じであった。
試験方法体系
スクリーニングアッセイを実施例1に記載の通り実施した。
アルゴリズムモデル評価
この試験ではランダムフォレストモデルを使用してアルゴリズムを構築した。このモデルは、NSCLCに関して感度が0.982(95%CI:0.921~0.998)であり、特異度が0.865(95%CI:0.802~0.914)である。非NSCLCがんをデータセットから除いた場合、アルゴリズムの特異度は0.967(95%CI:0.916~0.991)まで上昇する。
アルゴリズムを使用したバイオマーカー選択
アルゴリズムを評価した後、NSCLCを示す9~33種のバイオマーカーを診断用キットの構成成分として使用することができる。この選択は、変数重要度統計値、またはアルゴリズムの繰り返しの数およびCARTにおいて特定のバイオマーカーが出現する位置、ならびに生物学的関連性に基づき得る。
臨床的正確度
臨床的参照を使用した診断的正確度
診断的正確度を、NSCLCを有すると予測されるNSCLCを有する対象の数とNSCLCを有さずNSCLCを有さないと予測された対象の数を足し、対象総数で割ることで算出した。サンプルの病状は、サンプル提供者によって報告された通り医学病理医によって決定された。
診断検査の性能は陽性的中率(PPV)および陰性的中率(NPV)として表すことができる。陽性的中率(PPV)は、真陽性(TP)の数を真陽性(TP)の数プラス偽陽性(FP)の数で割ったもの、PPV=TP/(TP+FP)である。陰性的中率(NPV)は、真陰性(TN)の数を真陰性(TN)の数プラス偽陰性(FP)の数で割ったもの、NPV=TN/(TN+FN)である。
感度は、NSCLCを有する患者についての陽性結果の確率と定義される。感度は、真陽性(TP)の数を、実際NSCLC患者の総数、または真陽性(TP)の数プラス偽陰性(FN)の数で割ったものとして算出される;感度=TP/(TP+FN)。
特異度は、患者がNSCLCを有さない確率と定義される。特異度は、真陰性(TN)の数を実際非NSCLC患者の総数、または真陰性(TN)の数プラス偽陽性(FP)の数で割ったものとして算出される;特異度=TN/(TN+FP)。
特異度
テストの臨床的特異度は、アルゴリズムが目的の疾患を有さない患者を正確に同定する能力の尺度である。本発明のテストがNSCLCに特異的であるかどうかを実証するために、NSCLC以外の他の型のがん由来の合計144サンプル(N=288)をテストした。これらの非NSCLCがんのうち90を訓練セットに含めた。以下のがんを含めた:
(1)乳がん(26F)
(2)結腸直腸がん(colon-rectal cancer)(26F、22M)
(3)卵巣がん(25F)
(4)膵がん(15F、15M)
(5)前立腺がん(15M)
アルゴリズムにより、サンプルを、NSCLCを有する患者に属するとして、またはNSCLCを有さない患者に属するとして分類した;テスト結果には別の型のがんが存在するかどうかは考慮にいれない。他のがんとNSCLCの交差反応性を決定するために、特定のがんそれぞれについての間違い率を調査した。
アルゴリズムにより、サンプルを、別の型のがんを有するかどうかは考慮せずに、NSCLCを有する患者に属するとして、またはNSCLCを有さない患者に属するとして分類することができる。他のがんとNSCLCの交差反応性を決定するために、特定のがんそれぞれについての偽陽性率(FPR)ならびに全ての非NSCLCがんについての偽陰性率(FNR)を調査した。
Figure 0007250693000009
アルゴリズムの偽陰性率はNSCLCについて0.02であり、偽陽性率は0.13である。これは、NSCLC患者100名のうち2名が疾患を有することが検出されず、非NSCLC患者100名のうち13名が疾患について陽性結果を有することを意味する。
アルゴリズムにより、サンプルを、別の型のがんを有するかどうかは考慮せずに、NSCLCを有する患者に属するとして、またはNSCLCを有さない患者に属するとして分類することができる。他のがんとNSCLCの交差反応性を決定するために、特定のがんそれぞれについての偽陽性率(FPR)ならびに全ての非NSCLCがんについての偽陰性率(FNR)を調査した。
アルゴリズムモデル評価結果
3セットのバイオマーカー(33種、19種、および13種)についてのアルゴリズムを、US対象由来のサンプルを用い、ランダムフォレストモデルを使用して構築した。これらのアルゴリズムのための訓練セットについての結果を表6に示す。第1のモデルには33種のバイオマーカーを使用し、NSCLCに関して感度が0.928(CI:0.879、0.961)であり、特異度が0.972(CI:0.955、0.988)であった。第2のモデルには19種のバイオマーカーを使用し、NSCLCに関して感度が0.924(CI:0.892、0.943)であり、特異度が0.969(CI:0.952、0.980)であった。第3のモデルには13種のバイオマーカーを使用し、NSCLCに関する感度が0.890(CI:0.861、0.918)であり、特異度が0.958(CI:0.941、0.972)であった。
Figure 0007250693000010
(実施例3)
US集団に限定された最終的なアルゴリズムモデルの性能の検証
この実施例では、33種の選択されたバイオマーカーならびに実施例1および2において展開された33種、19種および13種のバイオマーカーを用いたアルゴリズムを使用したブラインド試験の結果を示す。
この実施例のために、実施例1および2において使用したものと同じ試薬および方法を使用してサンプルを処理した。合計228名の対象を2連で処理し、456の測定値を得た(表7)。サンプルは、アフリカ系アメリカ人、コーカサス人、およびラテンアメリカ系からなり、米国を起源とした(表8)。サンプルをブラインドし、ランダム化し、試験の全プレートにわたってコホートを一様に分布させた。
Figure 0007250693000011
Figure 0007250693000012
アルゴリズムモデル評価
実施例2において異なる数のバイオマーカー(33種、19種、および13種)について展開した、ランダムフォレストモデルを使用して構築された3つの異なるサイズのアルゴリズムを、US対象からの検証サンプルに対してテストした(表9)。228名の対象からのデータをブラインドし、33種、19種、および13種のバイオマーカーを使用した本発明のアルゴリズムの性能を検証するために使用した。結果を総計した後、病状を公開し、セットをアルゴリズムの再訓練のために使用した。各対象から得た全てのデータポイントをアルゴリズム性能の評価に利用した。バイオマーカーの濃度の基礎をなす分布は対数正規型であると仮定することができるので、LLOQを下回る検閲される値を、LLOQを2の平方根で割ることによって推定することができる。同様に、ULOQを上回る検閲される値を、ULOQに2の平方根を掛けることによって推定することができる。したがって、全ての対象を解析に含めた。
Figure 0007250693000013
臨床的パラメータおよび結果
臨床の場では、PPVおよびNPVは、目的の集団における疾患の有病率を示す尺度であるので、テストの値の決定においてより有用である。感度が高いテストは、当該テストが、重篤であるが処置可能な疾患を同定するために使用される場合に重要であり、また、特異度が高いテストにより、患者がさらなる不必要なフォローアップ医学的手技をさらに受けることが回避される。ブラインドテストの要約された結果を表10に見いだすことができる。ブラインドセットサンプルは、228名の対象(N=456)からなり、分布は以下の通りであった:喘息11名、乳がん40名、結腸直腸がん(colorectal cancer)5名、非喫煙者57名、ステージI NSCLC 55名、膵がん3名、前立腺がん9名、および喫煙者48名。
Figure 0007250693000014
バイオマーカーによるROC
受信者動作特性(ROC)曲線には、分類器の全ての可能性のあるカットオフ値について偽陽性率(1-特異度)と真陽性率(感度)が対照してプロットされる。図1AおよびBは、19種のバイオマーカーおよび13種のバイオマーカーを使用したランダムフォレストモデルについてのROC曲線を示す。曲線下面積(AUC)は、ROC曲線の曲線下面積を表す。申し分のないテストのAUCは1.0であり、ランダムな推測のAUCは0.5である。一般に、AUCが0.8を上回れば十分であるが、我々の適用に関しては、AUCが0.9またはそれよりも大きいことを標的とする。33種、19種および13種のバイオマーカーを用いたアルゴリズムのAUCは、それぞれ0.963、0.960、および0.951である。図1A~Bは、33種、19種および13種のバイオマーカーについてのROC曲線を例示する。これにより、2つのモデルが、NSCLCと非NSCLCの良好な識別能を有することが示される。さらに、解析データから非NSCLCがんを除外した場合、AUCがわずかに改善されることが示される。
診断的正確度および臨床的特異度
テストの臨床的特異度は、アルゴリズムが目的の疾患を有さない患者を正確に同定する能力の尺度である。本発明によるテストがNSCLCに特異的であることを実証するために、NSCLC以外の他の型のがんからの合計57サンプル(N=114)をテストした。以下のがんを含めた:
(1)乳がん(40)
(2)結腸直腸がん(colon-rectal cancer)(5)
(3)膵がん(3)
(4)前立腺がん(9)
アルゴリズムにより、サンプルを、NSCLCを有する患者に属するとして、またはNSCLCを有さない患者に属するとして分類した;テスト結果には、別の型のがんが存在するかどうかは考慮にいれない。他のがんとNSCLCの交差反応性を決定するために、特定のがんそれぞれについての間違い率を調査した。
33種、19種および13種のバイオマーカーを用いた本発明のテストの間違い率は、NSCLCに関して、それぞれ10.91%、10.91%および12.73%である。例として、NSCLC対象55名のうち6名が、33または19種のバイオマーカーモデルを使用する本発明によるテストによってNSCLCを有するとして検出されない。結果は以下の通りである:
Figure 0007250693000015
Figure 0007250693000016
Figure 0007250693000017
表14、15および16は、他の非NSCLCがんサンプルをデータセットから除外した場合の結果を表す。
Figure 0007250693000018
Figure 0007250693000019
Figure 0007250693000020
21種のバイオマーカーを使用したランダムなアルゴリズムサンプリング
13種および19種のバイオマーカーを用いたアルゴリズムによる結果に基づいて、最終的な21種のバイオマーカーのセットを選択した。これらのバイオマーカーのロバスト性をテストするために、21種のセットから10~21種のバイオマーカーの組合せをランダムに選択した。そのアルゴリズムはブラインドセットに対して実行した。表19の結果から、このバイオマーカーのセットがロバストであり、アルゴリズムに使用されるバイオマーカーの数に柔軟性がもたらされることが示される。21種のバイオマーカー(0.964)、20種のバイオマーカー(0.963)、19種のバイオマーカー(0.966)、および13種のバイオマーカー(0.955)を用いたアルゴリズムについてAUCを算出した。21種のバイオマーカーを使用した20回のランダムなサンプリングについてのアベレージ統計値は、92%正確度、81%感度、および96%特異度である。
Figure 0007250693000021
モデル「10~21」は、33種のサブセット内の10~21種のバイオマーカーを使用したモデルである。「ランダム10、12、15、および20」は、最終的なバイオマーカーの一覧からの、それぞれ10種、12種、15種、および20種のバイオマーカーの追加的なランダム選択であった。「AUC<0.8、<0.9、および>0.9」は、AUCがそれぞれ0.8未満であった、0.9未満であった、および0.9を超えたバイオマーカーのみで創出されたモデルである。
結論
13種のバイオマーカーを用いた本発明のアルゴリズムの感度および特異度は0.873および0.954である。33種のバイオマーカーおよび19種のバイオマーカーを用いたアルゴリズムはどちらも感度が0.891であり、特異度が0.977である。これらのアルゴリズムでは、NSCLCを有する患者の87~89%が検出される(またはNSCLCを有する患者100名のうち11~13名が検出されない可能性がある)。これらのアルゴリズムの特異度は0.954および0.977である、つまり、疾患を有する患者の95~97%がNSCLCについて陽性と診断される(または、疾患を有さない患者100名のうち5名または3名が疾患についてテスト陽性になる可能性がある)。33種、19種および13種のバイオマーカーについてのROC曲線のAUCはそれぞれ0.963、0.960および0.951である。33種のバイオマーカー、19種のバイオマーカーおよび13種のバイオマーカーを用いたアルゴリズムには、臨床使用に関して大きな潜在性がある。他の非NSCLCがんを解析から除いた場合、33種のバイオマーカー、19種のバイオマーカーおよび13種のバイオマーカーを用いたアルゴリズムの特異度は0.991%または99.1%に改善された。感度は影響を受けなかった。33種のバイオマーカー、19種のバイオマーカーおよび13種のバイオマーカーを用いたアルゴリズムのAUCはそれぞれ0.974、0.970および0.964に改善された。
考察
臨床の場では、PPVおよびNPVは、これらの尺度は目的の集団における疾患の有病率を示すので、テストの値の決定においてより有用である。この試験におけるモデルでは、USを起源とするサンプルを使用した。感度が高いことは、当該テストが、重篤であるが処置可能な疾患を同定するために使用される場合に重要であり、また、テストの特異度が高いことにより、患者がさらなる不必要なフォローアップ医学的手技をさらに受けることが回避される。肺がんの場合では、LDCT法は感度が高いが特異度が低い。可能性のある経路は、最初に高感度/低特異度のテスト(LDCT)で陽性であった患者を、低(または高)感度/高特異度の第2のテストに供することである。この手法により、偽陽性のほぼ全てについて、疾患がないことが正確に同定される。
一次診断検査として、医師は、感度がはるかに高く、特異度を犠牲にしたテストの方を選ぶ場合がある。その論拠は、「1つの(a)」がんが検出されないことが偽陰性よりも有害であることである。アルゴリズム、高感度/中間の特異度または中間の感度/特異度の組合せは、CPCテストの選択肢であり、探究される。初期の非小細胞肺がんの存在について「陽性」または「陰性」のいずれかという定性的な単一スコア分類器の代替は、臨床医にカットオフ限定を伴う連続変数の結果を提供することである。
アルゴリズムを使用して選択されるバイオマーカーおよびバイオマーカーのサブセットにより、NSCLCの早期診断に予想外の改善が示される。
本開示に含有される方程式、式および関係は、例示的かつ代表的なものであり、限定的なものではない。本明細書に開示される任意の所与の方程式によって記述される同じ現象を表すために代替の方程式を使用することができる。特に、本明細書に開示される方程式は、誤差修正項、高次項を加えること、またはそうでなければ、定数もしくは変数に別の名称を使用してもしくは異なる表現を使用して不正確さを説明することによって改変することができる。方程式の他の改変、置換、置換え、または変更を行うことができる。
本明細書において言及される刊行物、特許、および公開特許出願は全て、それらの全体が、各個の刊行物、特許、または公開特許出願が具体的にかつ個別に参照により組み込まれることが示されたものと同程度に参照により本明細書に組み込まれる。
(項目1)
バイオマーカーのセットそれぞれの複数のバイオマーカー定量値を含むテストデータを分類する方法であって、
・少なくとも1つのプロセッサに、ヒト検査対象由来の生理学的サンプル中のバイオマーカーのセットの各バイオマーカーについてのバイオマーカー定量値を含むテストデータを受信するステップと、
・前記少なくとも1つのプロセッサを使用して、前記テストデータを、分類システムの電子表示である分類器を使用して評価するステップであって、各前記分類器が、電子的に保存された訓練データベクトルのセットを使用して訓練され、各訓練データベクトルが、個々のヒトを表し、かつ、それぞれのヒトについてのバイオマーカーのセットの各バイオマーカーのバイオマーカー定量値を含み、各訓練データベクトルが、それぞれのヒトにおける診断されたNSCLCの存在または非存在に関する分類をさらに含む、ステップと、
・前記少なくとも1つのプロセッサを使用して、前記評価するステップに基づいた前記対象におけるNSCLCの存在または発症の可能性に関する前記ヒト検査対象由来の前記サンプルの分類を出力するステップと
を含み、前記バイオマーカーのセットが、IL-8、MMP-9、sTNFRII、TNFRI、MMP7、IL-5、レジスチン、IL-10、MPO、NSE、MCP-1、GRO、CEA、レプチン、CXCL9、HGF、sCD40L、CYFRA-21-1、sFasL、RANTES、IL-7、MIF、sICAM-1、IL-2、SAA、IL-16、IL-9、PDFG-AB/BB、sEFGR、LIF、IL-12p70、CA125、およびIL-4からなる群から選択される少なくとも9種のバイオマーカーを含む、方法。
(項目2)
バイオマーカーのセットそれぞれの複数のバイオマーカー定量値を含むテストデータを分類する方法であって、
・少なくとも1つのプロセッサを使用して、電子的に保存された訓練データベクトルのセットにアクセスするステップであって、各訓練データベクトルが、個々のヒトを表し、かつ、それぞれのヒトについてのバイオマーカーのセットの各バイオマーカーのバイオマーカー定量値を含み、各訓練データベクトルが、それぞれのヒトにおける診断されたNSCLCの存在または非存在に関する分類をさらに含む、ステップと、
・分類システムの電子表示を、電子的に保存された訓練データベクトルのセットを使用して訓練するステップと、
・前記少なくとも1つのプロセッサで、ヒト検査対象におけるバイオマーカーのセットについての複数のバイオマーカー定量値を含むテストデータを受信するステップと、
・前記少なくとも1つのプロセッサを使用して、前記テストデータを、前記分類システムの前記電子表示を使用して評価するステップと、
・前記評価するステップに基づいた対象における非小細胞肺がんの存在または発症の可能性に関する前記ヒト検査対象の分類を出力するステップと
を含み、前記バイオマーカーのセットが、IL-8、MMP-9、sTNFRII、TNFRI、MMP7、IL-5、レジスチン、IL-10、MPO、NSE、MCP-1、GRO、CEA、レプチン、CXCL9、HGF、sCD40L、CYFRA-21-1、sFasL、RANTES、IL-7、MIF、sICAM-1、IL-2、SAA、IL-16、IL-9、PDFG-AB/BB、sEFGR、LIF、IL-12p70、CA125、およびIL-4からなる群から選択される少なくとも9種のバイオマーカーを含む、方法。
(項目3)
前記分類システムが、ランダムフォレスト、AdaBoost、ナイーブベイズ、サポートベクターマシン、LASSO、リッジ回帰、ニューラルネット、遺伝的アルゴリズム、弾性ネット、勾配ブースティング木、ベイズニューラルネットワーク、k-最近傍、またはそのアンサンブルからなる群から選択される、項目1または2に記載の方法。
(項目4)
前記分類システムが、ランダムフォレストを含む、項目1から3までのいずれか一項に記載の方法。
(項目5)
前記分類システムが、AdaBoostを含む、項目1から3までのいずれか一項に記載の方法。
(項目6)
前記分類システムが、ナイーブベイズを含む、項目1から3までのいずれか一項に記載の方法。
(項目7)
前記分類システムが、サポートベクターマシンを含む、項目1から3までのいずれか一項に記載の方法。
(項目8)
前記分類システムが、LASSOを含む、項目1から3までのいずれか一項に記載の方法。
(項目9)
前記分類システムが、リッジ回帰を含む、項目1から3までのいずれか一項に記載の方法。
(項目10)
前記分類システムが、ニューラルネットを含む、項目1から3までのいずれか一項に記載の方法。
(項目11)
前記分類システムが、遺伝的アルゴリズムを含む、項目1から3までのいずれか一項に記載の方法。
(項目12)
前記分類システムが、弾性ネットを含む、項目1から3までのいずれか一項に記載の方法。
(項目13)
前記分類システムが、勾配ブースティング木を含む、項目1から3までのいずれか一項に記載の方法。
(項目14)
前記分類システムが、ベイズニューラルネットワークを含む、項目1から3までのいずれか一項に記載の方法。
(項目15)
前記分類システムが、k-最近傍を含む、項目1から3までのいずれか一項に記載の方法。
(項目16)
前記テストデータおよび各訓練データベクトルが、前記個々のヒトの性別、年齢および喫煙状況からなる群から選択される少なくとも1つの追加的な特性をさらに含む、項目1から15までのいずれか一項に記載の方法。
(項目17)
前記テストデータが、ヒト対象由来の生理学的サンプル中の前記複数のバイオマーカーについてのバイオマーカー定量値の個々の決定をそれぞれが含む2つまたはそれよりも多くの反復実験データベクトルを含む、項目1から16までのいずれか一項に記載の方法。
(項目18)
前記反復実験データベクトルのいずれか1つが、前記分類システム内の前記分類器のいずれか1つに従ってNSCLCについて陽性に分類される場合、前記サンプルが、NSCLCの存在または発症の可能性が高いとして分類される、項目17に記載の方法。
(項目19)
前記バイオマーカーのセットが、4種、5種、6種、7種、8種、9種、10種、11種、12種、13種、14種、15種、16種、17種、18種、19種、20種、21種、22種、23種、24種、25種、26種、27種、28種、29種、30種、31種、32種、または33種のバイオマーカーを含む、項目1から18までのいずれか一項に記載の方法。
(項目20)
前記バイオマーカー定量値が、IL-8、MMP-9、sTNFRII、TNFRI、MMP7、IL-5、レジスチン、IL-10、MPO、NSE、MCP-1、GRO、CEA、レプチン、CXCL9、CYFRA-21-1、MIF、sICAM-1、SAA、またはこれらの組合せからなる群から選択されるバイオマーカーのそれぞれの濃度レベルに比例し、前記生理学的サンプルが、生体液である、項目1から19までのいずれか一項に記載の方法。
(項目21)
前記バイオマーカー定量値が、IL-8、sTNFRII、MMP-9、TNFRI、CXCL9-MIG、レジスチン、SAA、MPO、PDGF-AB-BB、MMP-7、GRO、MIF、MCP-1、CEA、CYFRA-21-1、レプチン、IL-2、IL-10、およびNSEからなる群から選択されるバイオマーカーのそれぞれの濃度レベルに比例する、項目1から19までのいずれか一項に記載の方法。
(項目22)
前記バイオマーカー定量値が、IL-8、sTNFRII、MMP-9、TNFRI、CXCL9-MIG、レジスチン、SAA、MPO、PDGF-AB-BB、MMP-7、GRO、MIF、MCP-1、CEA、CYFRA-21-1、レプチン、IL-2、およびIL-10からなる群から選択されるバイオマーカーのそれぞれの濃度レベルに比例する、項目1から19までのいずれか一項に記載の方法。
(項目23)
前記バイオマーカー定量値が、IL-8、MMP-9、sTNFRII、TNFRI、MMP7、レジスチン、MPO、NSE、GRO、CEA、CXCL9、MIF、IL-2、SAA、IL-16、IL-9、PDFG-AB/BB、またはこれらの組合せからなる群から選択されるバイオマーカーのそれぞれの濃度レベルに比例し、前記生理学的サンプルが、生体液である、項目1から19までのいずれか一項に記載の方法。
(項目24)
前記バイオマーカー定量値が、IL-8、sTNFRII、MMP-9、TNFRI、CXCL9-MIG、レジスチン、SAA、MPO、PDGF-AB-BB、MMP-7、GRO、MIF、MCP-1、CEA、CYFRA-21-1、レプチン、およびIL-2からなる群から選択されるバイオマーカーのそれぞれの濃度レベルに比例する、項目1から19までのいずれか一項に記載の方法。
(項目25)
前記バイオマーカー定量値が、IL-8、sTNFRII、MMP-9、TNFRI、CXCL9-MIG、レジスチン、SAA、MPO、PDGF-AB-BB、MMP-7、GRO、MIF、MCP-1、CEA、CYFRA-21-1、およびレプチンからなる群から選択されるバイオマーカーのそれぞれの濃度レベルに比例する、項目1から19までのいずれか一項に記載の方法。
(項目26)
前記バイオマーカー定量値が、IL-8、MMP-9、sTNFRII、TNFRI、レジスチン、MPO、NSE、GRO、CEA、CXCL9、IL-2、SAA、PDFG-AB/BB、またはこれらの組合せからなる群から選択されるバイオマーカーのそれぞれの濃度レベルに比例し、前記生理学的サンプルが、生体液である、項目1から19までのいずれか一項に記載の方法。
(項目27)
前記バイオマーカー定量値が、IL-8、sTNFRII、MMP-9、TNFRI、CXCL9-MIG、レジスチン、SAA、MPO、PDGF-AB-BB、およびMMP-7からなる群から選択されるバイオマーカーのそれぞれの濃度レベルに比例する、項目1から19までのいずれか一項に記載の方法。
(項目28)
前記バイオマーカーが、ペプチド、タンパク質、翻訳後修飾を有するペプチドおよびタンパク質、またはこれらの組合せである、項目1から27までのいずれか一項に記載の方法。
(項目29)
前記生理学的サンプルが、生体液である、項目28に記載の方法。
(項目30)
前記生体液が、血液、血清、血漿、またはこれらの混合物である、項目29に記載の方法。
(項目31)
前記分類器が、5、10、15、20、25、30、40、50、75または100の個々の木を含むランダムフォレスト分類器である、項目1から30までのいずれか一項に記載の方法。
(項目32)
前記分類器が、50、100、150、200、250、300、400、500、750または1,000の繰り返しを含むAdaBoost分類器である、項目1から30までのいずれか一項に記載の方法。
(項目33)
前記分類器が、多項式関数、ガウス放射基底関数、双曲線正接関数または三角形関数であるカーネルを含むサポートベクターマシン分類器である、項目1から30までのいずれか一項に記載の方法。
(項目34)
前記分類器が、0.1、0.5、1、2、10、100の制約条件を含むLASSO分類器である、項目1から30までのいずれか一項に記載の方法。
(項目35)
前記分類器が、0.1、0.5、1、2、10、100の制約条件を含むリッジ回帰分類器である、項目1から30までのいずれか一項に記載の方法。
(項目36)
前記分類器が、1、2、4、または5の隠れ層を含むニューラルネット分類器である、項目1から30までのいずれか一項に記載の方法。
(項目37)
前記分類器が、畳み込みニューラルネットワークまたは再帰型ニューラルネットワークを含むニューラルネット分類器である、項目1から30までのいずれか一項に記載の方法。
(項目38)
前記分類器が、0.1、0.5、1、2、10、100の制約条件を含む弾性ネット分類器である、項目1から30までのいずれか一項に記載の方法。
(項目39)
前記分類器が、5、10、15、20、25、30、40、50、75または100の個々の木を含む勾配ブースティング木分類器である、項目1から30までのいずれか一項に記載の方法。
(項目40)
前記分類器が、1、2、4、または5の隠れ層を含むベイズニューラルネット分類器である、項目1から30までのいずれか一項に記載の方法。
(項目41)
前記分類器が、1、2、4、5、8、または10の近傍を含むk-最近傍分類器である、項目1から30までのいずれか一項に記載の方法。
(項目42)
対象由来の生理学的サンプル中のバイオマーカーレベルを決定するステップをさらに含む、項目1から41までのいずれか一項に記載の方法。
(項目43)
患者が、45歳またはそれよりも上であるか、長期間喫煙者であるか、肺内の不定小結節と診断されているか、またはこれらの組合せである、項目1から42までのいずれか一項に記載の方法。
(項目44)
対象から得た生理学的サンプル中の各バイオマーカー定量値を決定するステップをさらに含む、項目1から43までのいずれか一項に記載の方法。
(項目45)
前記対象が、コンピュータ断層撮影スキャンによって検出可能な少なくとも1つの肺小結節を示す、項目1から44までのいずれか一項に記載の方法。
(項目46)
低線量コンピュータ断層撮影によって肺小結節を検査するステップをさらに含む、項目1から45までのいずれか一項に記載の方法。
(項目47)
前記対象が、NSCLCのリスクにある、前記項目のいずれか一項に記載の方法。
(項目48)
前記対象をNSCLCに関して処置するステップをさらに含む、前記項目のいずれか一項に記載の方法。
(項目49)
前記対象が、ヒトである、前記項目のいずれか一項に記載の方法。
(項目50)
前記対象が、女性である、前記項目のいずれか一項に記載の方法。
(項目51)
前記対象が、男性である、前記項目のいずれか一項に記載の方法。
(項目52)
前記患者が、45歳またはそれよりも上であるか、長期間喫煙者であるか、肺内の不定小結節と診断されているか、またはこれらの組合せである、前記項目のいずれか一項に記載の方法。
(項目53)
(a)対象由来の生理学的サンプルを得るステップと、
(b)前記サンプルにおいて、IL-8、MMP-9、sTNFRII、TNFRI、MMP7、IL-5、レジスチン、IL-10、MPO、NSE、MCP-1、GRO、CEA、レプチン、CXCL9、HGF、sCD40L、CYFRA-21-1、sFasL、RANTES、IL-7、MIF、sICAM-1、IL-2、SAA、IL-16、IL-9、PDFG-AB/BB、sEFGR、LIF、IL-12p70、CA125、およびIL-4からなる群から選択される少なくとも4種のバイオマーカーのセットを測定するステップであって、バイオマーカー定量値のセットを生成するステップと
をさらに含む、項目1から52までのいずれか一項に記載の方法。
(項目54)
前記サンプルにおいて、前記バイオマーカーのうちの少なくとも4種、5種、6種、7種、8種、9種、10種、11種、12種、13種、14種、15種、16種、17種、18種、19種、または21種のセットを測定するステップを含む、項目53に記載の方法。
(項目55)
前記バイオマーカー定量値が、非小細胞肺がんを示す、項目1から54までのいずれか一項に記載の方法。
(項目56)
前記バイオマーカー定量値が、初期の非小細胞肺がん、好ましくはステージIを示す、項目1から55までのいずれか一項に記載の方法。
(項目57)
前記対象が、非小細胞肺がんのリスクにある、項目1から56までのいずれか一項に記載の方法。
(項目58)
前記バイオマーカー定量値が、ラジオイムノアッセイ、酵素結合免疫吸着検定法(ELISA)、Q-Plex(商標)マルチプレックスアッセイ、液体クロマトグラフィー-質量分析(LCMS)、フローサイトメトリーマルチプレックスイムノアッセイ、可視光線もしくは紫外線の吸光度を通じた放射測定もしくは分光測定による検出を伴う高圧液体クロマトグラフィー、質量分析による定性的分析および定量的分析、ウエスタンブロッティング、放射性、蛍光もしくは化学発光プローブもしくは核の検出による定量的可視化を伴う1次元もしくは2次元ゲル電気泳動、吸収もしくは蛍光側光法を用いた抗体に基づく検出、いくつもの化学発光レポーター系のうちのいずれかの発光による定量化、酵素的アッセイ、免疫沈降もしくは免疫捕捉アッセイ、固相および液相イムノアッセイ、定量的マルチプレックスイムノアッセイ、タンパク質アレイもしくはチップ、プレートアッセイ、プリントアレイイムノアッセイ、またはこれらの組合せによって測定される、項目1から57までのいずれか一項に記載の方法。
(項目59)
前記バイオマーカー定量値が、イムノアッセイによって測定される、項目1から58までのいずれか一項に記載の方法。
(項目60)
ステージIの非小細胞肺がんを診断するための方法であって、
(a)対象由来の生理学的サンプルを得るステップと、
(b)前記サンプルにおいて、IL-8、MMP-9、sTNFRII、TNFRI、MMP7、IL-5、レジスチン、IL-10、MPO、NSE、MCP-1、GRO、CEA、レプチン、CXCL9、HGF、sCD40L、CYFRA-21-1、sFasL、RANTES、IL-7、MIF、sICAM-1、IL-2、SAA、IL-16、IL-9、PDFG-AB/BB、sEFGR、LIF、IL-12p70、CA125、およびIL-4からなる群から選択される少なくとも4種のバイオマーカーのセットをイムノアッセイによって測定するステップであって、バイオマーカー定量値を生成するステップと、
(c)少なくとも1つのプロセッサに、ヒト検査対象由来の生理学的サンプル中のバイオマーカーのセットの各バイオマーカーについてのバイオマーカー定量値を含むテストデータを受信するステップと、
(d)前記少なくとも1つのプロセッサを使用して、前記テストデータを、分類システムの電子表示である分類器を使用して評価するステップであって、各分類器が、電子的に保存された訓練データベクトルのセットを使用して訓練され、各訓練データベクトルが、個々のヒトを表し、かつ、それぞれのヒトについての前記バイオマーカーのセットの各バイオマーカーのバイオマーカー定量値を含み、各訓練データベクトルが、前記それぞれのヒトにおける診断されたNSCLCの存在または非存在に関する分類をさらに含む、ステップと、
(e)前記少なくとも1つのプロセッサを使用して、前記評価するステップに基づいた前記対象におけるNSCLCの存在または発症の可能性に関する前記ヒト検査対象由来の前記サンプルの分類を出力するステップと
を含む方法。
(項目61)
前記分類システムが、ランダムフォレスト、AdaBoost、ナイーブベイズ、サポートベクターマシン、LASSO、リッジ回帰、ニューラルネット、遺伝的アルゴリズム、弾性ネット、勾配ブースティング木、ベイズニューラルネットワーク、k-最近傍、またはそのアンサンブルからなる群から選択される、項目60に記載の方法。
(項目62)
前記分類システムが、ランダムフォレストを含む、項目60に記載の方法。
(項目63)
前記分類システムが、AdaBoostを含む、項目60に記載の方法。
(項目64)
前記分類システムが、ナイーブベイズを含む、項目60に記載の方法。
(項目65)
前記分類システムが、サポートベクターマシンを含む、項目60に記載の方法。
(項目66)
前記分類システムが、LASSOを含む、項目60に記載の方法。
(項目67)
前記分類システムが、リッジ回帰を含む、項目60に記載の方法。
(項目68)
前記分類システムが、ニューラルネットを含む、項目60に記載の方法。
(項目69)
前記分類システムが、遺伝的アルゴリズムを含む、項目60に記載の方法。
(項目70)
前記分類システムが、弾性ネットを含む、項目60に記載の方法。
(項目71)
前記分類システムが、勾配ブースティング木を含む、項目60に記載の方法。
(項目72)
前記分類システムが、ベイズニューラルネットワークを含む、項目60に記載の方法。
(項目73)
前記分類システムが、k-最近傍を含む、項目60に記載の方法。
(項目74)
前記分類器が、5、10、15、20、25、30、40、50、75または100の個々の木を含むランダムフォレスト分類器である、項目60から73までのいずれか一項に記載の方法。
(項目75)
前記分類器が、50、100、150、200、250、300、400、500、750または1,000の繰り返しを含むAdaBoost分類器である、項目60から73までのいずれか一項に記載の方法。
(項目76)
前記分類器が、多項式関数、ガウス放射基底関数、双曲線正接関数または三角形関数であるカーネルを含むサポートベクターマシン分類器である、項目60から73までのいずれか一項に記載の方法。
(項目77)
前記分類器が、0.1、0.5、1、2、10、100の制約条件を含むLASSO分類器である、項目60から73までのいずれか一項に記載の方法。
(項目78)
前記分類器が、0.1、0.5、1、2、10、100の制約条件を含むリッジ回帰分類器である、項目60から73までのいずれか一項に記載の方法。
(項目79)
前記分類器が、1、2、4、または5の隠れ層を含むニューラルネット分類器である、項目60から73までのいずれか一項に記載の方法。
(項目80)
前記分類器が、畳み込みニューラルネットワークまたは再帰型ニューラルネットワークを含むニューラルネット分類器である、項目60から73までのいずれか一項に記載の方法。
(項目81)
前記分類器が、0.1、0.5、1、2、10、100の制約条件を含む弾性ネット分類器である、項目60から73までのいずれか一項に記載の方法。
(項目82)
前記分類器が、5、10、15、20、25、30、40、50、75または100の個々の木を含む勾配ブースティング木分類器である、項目60から73までのいずれか一項に記載の方法。
(項目83)
前記分類器が、1、2、4、または5の隠れ層を含むベイズニューラルネット分類器である、項目60から73までのいずれか一項に記載の方法。
(項目84)
前記分類器が、1、2、4、5、8、または10の近傍を含むk-最近傍分類器である、項目60から73までのいずれか一項に記載の方法。
(項目85)
前記バイオマーカーが、ペプチド、タンパク質、翻訳後修飾を有するペプチド、翻訳後修飾を有するタンパク質、またはこれらの組合せである、項目60から84までのいずれか一項に記載の方法。
(項目86)
前記生理学的サンプルが、生体液である、項目60から85までのいずれか一項に記載の方法。
(項目87)
前記生体液が、全血、血漿、血清、またはこれらの組合せである、項目86に記載の方法。
(項目88)
複数のバイオマーカーを検出するための方法であって、
(a)対象由来の生理学的サンプルを得るステップと、
(b)前記サンプルにおいて、IL-8、MMP-9、sTNFRII、TNFRI、MMP7、IL-5、レジスチン、IL-10、MPO、NSE、MCP-1、GRO、CEA、レプチン、CXCL9、HGF、sCD40L、CYFRA-21-1、sFasL、RANTES、IL-7、MIF、sICAM-1、IL-2、SAA、IL-16、IL-9、PDFG-AB/BB、sEFGR、LIF、IL-12p70、CA125、およびIL-4からなる群から選択される少なくとも4種のバイオマーカーのセットを測定するステップであって、バイオマーカー定量値を生成するステップと
を含む方法。
(項目89)
前記少なくとも4種のバイオマーカーのセットが、IL-8、MMP-9、sTNFRII、TNFRI、MMP-7、IL-5、レジスチン、IL-10、MPO、NSE、MCP-1、GRO-Pan、CEA、レプチン、CXCL9/MIG、CYFRA 21-1、MIF、sICAM-1、SAA、IL-2、およびPDGF-AB/BBからなる群から選択される、項目88に記載の方法。
(項目90)
前記少なくとも4種のバイオマーカーのセットが、IL-8、MMP-9、sTNFRII、TNFRI、MMP-7、IL-5、レジスチン、IL-10、MPO、NSE、MCP-1、GRO-Pan、CEA、レプチン、CXCL9/MIG、CYFRA 21-1、MIF、sICAM-1、およびSAAからなる群から選択される、項目88または89に記載の方法。
(項目91)
前記少なくとも4種のバイオマーカーのセットが、IL-8、MMP-9、sTNFRII、TNFRI、レジスチン、MPO、NSE、GRO-Pan、CEA、CXCL9/MIG、SAA、IL-2、およびPDGF-AB/BBからなる群から選択される、項目88から90までのいずれか一項に記載の方法。
(項目92)
前記セットが、少なくとも4種、5種、6種、7種、8種、9種、10種、11種、12種、13種、14種、15種、16種、17種、18種、19種、20種、または21種のバイオマーカーを含む、項目88から91までのいずれか一項に記載の方法。
(項目93)
前記対象が、非小細胞肺がんのリスクにある、項目88から92までのいずれか一項に記載の方法。
(項目94)
前記バイオマーカー定量値が、非小細胞肺がんを示す、項目88から93までのいずれか一項に記載の方法。
(項目95)
前記バイオマーカー定量値が、初期の非小細胞肺がん、必要に応じてステージIの非小細胞肺がんを示す、項目88から94までのいずれか一項に記載の方法。
(項目96)
前記バイオマーカーが、ペプチド、タンパク質、翻訳後修飾を有するペプチド、翻訳後修飾を有するタンパク質、またはこれらの組合せである、項目88から95までのいずれか一項に記載の方法。
(項目97)
前記生理学的サンプルが、全血、血漿、血清、またはこれらの組合せである、項目88から96までのいずれか一項に記載の方法。
(項目98)
前記バイオマーカー定量値が、喘息、乳がん、前立腺がん、結腸直腸がん、膵がん、またはこれらの組合せを示さない、項目1から97までのいずれか一項に記載の方法。
(項目99)
(a)少なくとも1つのプロセッサに、ヒト検査対象由来の生理学的サンプル中のバイオマーカーのセットの各バイオマーカーについてのバイオマーカー定量値を含むテストデータを受信するステップと、
(b)前記少なくとも1つのプロセッサを使用して、前記テストデータを、分類システムの電子表示である分類器を使用して評価するステップであって、各分類器が、電子的に保存された訓練データベクトルのセットを使用して訓練され、各訓練データベクトルが、個々のヒトを表し、かつ、前記それぞれのヒトについての前記バイオマーカーのセットの各バイオマーカーのバイオマーカー定量値を含み、各訓練データベクトルが、前記それぞれのヒトにおける診断されたNSCLCの存在または非存在に関する分類をさらに含む、ステップと、
(c)前記少なくとも1つのプロセッサを使用して、前記評価するステップに基づいた前記対象におけるNSCLCの存在または発症の可能性に関する前記ヒト検査対象由来の前記サンプルの分類を出力するステップと
をさらに含む、項目88から98までのいずれか一項に記載の方法。
(項目100)
前記分類システムが、ランダムフォレスト、AdaBoost、ナイーブベイズ、サポートベクターマシン、LASSO、リッジ回帰、ニューラルネット、遺伝的アルゴリズム、弾性ネット、勾配ブースティング木、ベイズニューラルネットワーク、k-最近傍、またはそのアンサンブルからなる群から選択される、項目99に記載の方法。
(項目101)
前記分類システムが、ランダムフォレストを含む、項目99または100に記載の方法。
(項目102)
前記分類システムが、AdaBoostを含む、項目99または100に記載の方法。
(項目103)
前記分類システムが、ナイーブベイズを含む、項目99または100に記載の方法。
(項目104)
前記分類システムが、サポートベクターマシンを含む、項目99または100に記載の方法。
(項目105)
前記分類システムが、LASSOを含む、項目99または100に記載の方法。
(項目106)
前記分類システムが、リッジ回帰を含む、項目99または100に記載の方法。
(項目107)
前記分類システムが、ニューラルネットを含む、項目99または100に記載の方法。
(項目108)
前記分類システムが、遺伝的アルゴリズムを含む、項目99または100に記載の方法。
(項目109)
前記分類システムが、弾性ネットを含む、項目99または100に記載の方法。
(項目110)
前記分類システムが、勾配ブースティング木を含む、項目99または100に記載の方法。
(項目111)
前記分類システムが、ベイズニューラルネットワークを含む、項目99または100に記載の方法。
(項目112)
前記分類システムが、k-最近傍を含む、項目99または100に記載の方法。
(項目113)
前記分類器が、5、10、15、20、25、30、40、50、75または100の個々の木を含むランダムフォレスト分類器である、項目99から112までのいずれか一項に記載の方法。
(項目114)
前記分類器が、50、100、150、200、250、300、400、500、750または1,000の繰り返しを含むAdaBoost分類器である、項目99から113までのいずれか一項に記載の方法。
(項目115)
前記分類器が、多項式関数、ガウス放射基底関数、双曲線正接関数または三角形関数であるカーネルを含むサポートベクターマシン分類器である、項目99から113までのいずれか一項に記載の方法。
(項目116)
前記分類器が、0.1、0.5、1、2、10、100の制約条件を含むLASSO分類器である、項目99から113までのいずれか一項に記載の方法。
(項目117)
前記分類器が、0.1、0.5、1、2、10、100の制約条件を含むリッジ回帰分類器である、項目99から113までのいずれか一項に記載の方法。
(項目118)
前記分類器が、1、2、4、または5の隠れ層を含むニューラルネット分類器である、項目99から113までのいずれか一項に記載の方法。
(項目119)
前記分類器が、畳み込みニューラルネットワークまたは再帰型ニューラルネットワークを含むニューラルネット分類器である、項目99から113までのいずれか一項に記載の方法。
(項目120)
前記分類器が、0.1、0.5、1、2、10、100の制約条件を含む弾性ネット分類器である、項目99から113までのいずれか一項に記載の方法。
(項目121)
前記分類器が、5、10、15、20、25、30、40、50、75または100の個々の木を含む勾配ブースティング木分類器である、項目99から113までのいずれか一項に記載の方法。
(項目122)
前記分類器が、1、2、4、または5の隠れ層を含むベイズニューラルネット分類器である、項目99から113までのいずれか一項に記載の方法。
(項目123)
前記分類器が、1、2、4、5、8、または10の近傍を含むk-最近傍分類器である、項目99から113までのいずれか一項に記載の方法。
(項目124)
対象におけるバイオマーカーのセットの発現レベルを測定することによって疾患進行の初期に非小細胞肺がんの存在を決定する方法であって、
生理学的サンプルにおいてバイオマーカーのセットのバイオマーカー定量値をイムノアッセイによって決定するステップであって、
前記バイオマーカーのセットが、IL-8、MMP-9、sTNFRII、TNFRI、MMP7、IL-5、レジスチン、IL-10、MPO、NSE、MCP-1、GRO、CEA、レプチン、CXCL9、HGF、sCD40L、CYFRA-21-1、sFasL、RANTES、IL-7、MIF、sICAM-1、IL-2、SAA、IL-16、IL-9、PDFG-AB/BB、sEFGR、LIF、IL-12p70、CA125、およびIL-4からなる群から選択される少なくとも4種のバイオマーカーを含む、ステップと、
前記サンプルを、分類システムにおいて前記バイオマーカー定量値のセットを使用して前記対象における非小細胞肺がんの存在または発症に関して分類するステップと
を含む方法。
(項目125)
前記バイオマーカーが、ペプチド、タンパク質、翻訳後修飾を有するペプチド、翻訳後修飾を有するタンパク質、またはこれらの組合せである、項目124に記載の方法。
(項目126)
前記生理学的サンプルが、全血、血漿、血清、またはこれらの組合せである、項目124または125に記載の方法。
(項目127)
前記少なくとも4種のバイオマーカーのセットが、IL-8、MMP-9、sTNFRII、TNFRI、MMP-7、IL-5、レジスチン、IL-10、MPO、NSE、MCP-1、GRO-Pan、CEA、レプチン、CXCL9/MIG、CYFRA 21-1、MIF、sICAM-1、SAA、IL-2、およびPDGF-AB/BBからなる群から選択される、項目124から126までのいずれか一項に記載の方法。
(項目128)
前記少なくとも4種のバイオマーカーのセットが、IL-8、MMP-9、sTNFRII、TNFRI、MMP-7、IL-5、レジスチン、IL-10、MPO、NSE、MCP-1、GRO-Pan、CEA、レプチン、CXCL9/MIG、CYFRA 21-1、MIF、sICAM-1、およびSAAからなる群から選択される、項目124から126までのいずれか一項に記載の方法。
(項目129)
前記少なくとも4種のバイオマーカーのセットが、IL-8、MMP-9、sTNFRII、TNFRI、レジスチン、MPO、NSE、GRO-Pan、CEA、CXCL9/MIG、SAA、IL-2、およびPDGF-AB/BBからなる群から選択される、項目124から126までのいずれか一項に記載の方法。
(項目130)
前記セットが、少なくとも4種、5種、6種、7種、8種、9種、10種、11種、12種、13種、14種、15種、16種、17種、18種、または19種のバイオマーカーを含む、項目124から126までのいずれか一項に記載の方法。
(項目131)
前記分類システムが、ランダムフォレスト、AdaBoost、ナイーブベイズ、サポートベクターマシン、LASSO、リッジ回帰、ニューラルネット、遺伝的アルゴリズム、弾性ネット、勾配ブースティング木、ベイズニューラルネットワーク、k-最近傍、またはそのアンサンブルからなる群から選択される、項目52から58までのいずれか一項に記載の方法。
(項目132)
前記分類システムが、ランダムフォレストを含む、項目1または2に記載の方法。
(項目133)
前記分類システムが、AdaBoostを含む、項目1または2に記載の方法。
(項目134)
前記分類システムが、ナイーブベイズを含む、項目1または2に記載の方法。
(項目135)
前記分類システムが、サポートベクターマシンを含む、項目1または2に記載の方法。
(項目136)
前記分類システムが、LASSOを含む、項目1または2に記載の方法。
(項目137)
前記分類システムが、リッジ回帰を含む、項目1または2に記載の方法。
(項目138)
前記分類システムが、ニューラルネットを含む、項目1または2に記載の方法。
(項目139)
前記分類システムが、遺伝的アルゴリズムを含む、項目1または2に記載の方法。
(項目140)
前記分類システムが、弾性ネットを含む、項目1または2に記載の方法。
(項目141)
前記分類システムが、勾配ブースティング木を含む、項目1または2に記載の方法。
(項目142)
前記分類システムが、ベイズニューラルネットワークを含む、項目1または2に記載の方法。
(項目143)
前記分類システムが、k-最近傍を含む、項目1または2に記載の方法。
(項目144)
前記分類器が、5、10、15、20、25、30、40、50、75または100の個々の木を含むランダムフォレスト分類器である、項目99から113までのいずれか一項に記載の方法。
(項目145)
前記分類器が、50、100、150、200、250、300、400、500、750または1,000の繰り返しを含むAdaBoost分類器である、項目99から113までのいずれか一項に記載の方法。
(項目146)
前記分類器が、多項式関数、ガウス放射基底関数、双曲線正接関数または三角形関数であるカーネルを含むサポートベクターマシン分類器である、項目99から113までのいずれか一項に記載の方法。
(項目147)
前記分類器が、0.1、0.5、1、2、10、100の制約条件を含むLASSO分類器である、項目99から113までのいずれか一項に記載の方法。
(項目148)
前記分類器が、0.1、0.5、1、2、10、100の制約条件を含むリッジ回帰分類器である、項目99から113までのいずれか一項に記載の方法。
(項目149)
前記分類器が、1、2、4、または5の隠れ層を含むニューラルネット分類器である、項目99から113までのいずれか一項に記載の方法。
(項目150)
前記分類器が、畳み込みニューラルネットワークまたは再帰型ニューラルネットワークを含むニューラルネット分類器である、項目99から113までのいずれか一項に記載の方法。
(項目151)
前記分類器が、0.1、0.5、1、2、10、100の制約条件を含む弾性ネット分類器である、項目99から113までのいずれか一項に記載の方法。
(項目152)
前記分類器が、5、10、15、20、25、30、40、50、75または100の個々の木を含む勾配ブースティング木分類器である、項目99から113までのいずれか一項に記載の方法。
(項目153)
前記分類器が、1、2、4、または5の隠れ層を含むベイズニューラルネット分類器である、項目99から113までのいずれか一項に記載の方法。
(項目154)
前記分類器が、1、2、4、5、8、または10の近傍を含むk-最近傍分類器である、項目99から113までのいずれか一項に記載の方法。
(項目155)
バイオマーカーのセットそれぞれの複数のバイオマーカー定量値を含むテストデータを分類する方法であって、
・少なくとも1つのプロセッサに、ヒト検査対象由来の生理学的サンプル中のバイオマーカーのセットの各バイオマーカーについてのバイオマーカー定量値を含むテストデータを受信するステップと、
・前記少なくとも1つのプロセッサを使用して、前記テストデータを、分類システムの電子表示である分類器を使用して評価するステップであって、各分類器が、電子的に保存された訓練データベクトルのセットを使用して訓練され、各訓練データベクトルが、個々のヒトを表し、かつ、前記それぞれのヒトについてのバイオマーカーのセットの各バイオマーカーのバイオマーカー定量値を含み、各訓練データベクトルが、前記それぞれのヒトにおける診断されたNSCLCの存在または非存在に関する分類をさらに含む、ステップと、
・前記少なくとも1つのプロセッサを使用して、前記評価するステップに基づいた前記対象におけるNSCLCの存在または発症の可能性に関する前記ヒト検査対象由来の前記サンプルの分類を出力するステップと
を含み、前記バイオマーカーのセットが、IL-8、sTNFRII、MMP-9、TNFRI、CXCL9-MIG、レジスチン、SAA、MPO、PDGF-AB-BB、MMP-7、GRO、MIF、MCP-1、CEA、CYFRA-21-1、レプチン、IL-2、IL-10、およびNSEからなる群から選択される少なくとも8種のバイオマーカーを含む、方法。
(項目156)
バイオマーカーのセットそれぞれの複数のバイオマーカー定量値を含むテストデータを分類するためのシステムであって、
分類器の電子表示を含む電子保存手段とカップリングした少なくとも1つのプロセッサを含み、前記分類器が、前記項目のいずれか一項に記載の電子的に保存された訓練データベクトルのセットを使用して訓練され、前記プロセッサが、ヒト検査対象における前記バイオマーカーのセットについての複数のバイオマーカー定量値を含むテストデータを受信するように構成され、前記少なくとも1つのプロセッサが、前記1つまたは複数の分類器の前記電子表示を使用して前記テストデータを評価し、前記評価に基づいて前記ヒト検査対象の分類を出力するようにさらに構成され、
前記バイオマーカーのセットが、IL-8、MMP-9、sTNFRII、TNFRI、MMP7、IL-5、レジスチン、IL-10、MPO、NSE、MCP-1、GRO、CEA、レプチン、CXCL9、HGF、sCD40L、CYFRA-21-1、sFasL、RANTES、IL-7、MIF、sICAM-1、IL-2、SAA、IL-16、IL-9、PDFG-AB/BB、sEFGR、LIF、IL-12p70、CA125、およびIL-4からなる群から選択される少なくとも9種のバイオマーカーを含む、システム。
(項目157)
実行可能なプログラムが保存された非一時的コンピュータ可読記憶媒体であって、前記プログラムが、マイクロプロセッサに、
対象の生理学的サンプル中の複数のバイオマーカーのバイオマーカー定量値を受信するステップと、
前記サンプルを、分類システムおよび前記少なくとも1つのプロセッサを使用して、バイオマーカー定量値に基づいて分類するステップであって、前記サンプルの前記分類が、前記対象における非小細胞肺がん(NSCLC)の存在または発症の可能性を示す、ステップと
を実施するように指示し、
前記バイオマーカーのセットが、IL-8、MMP-9、sTNFRII、TNFRI、MMP7、IL-5、レジスチン、IL-10、MPO、NSE、MCP-1、GRO、CEA、レプチン、CXCL9、HGF、sCD40L、CYFRA-21-1、sFasL、RANTES、IL-7、MIF、sICAM-1、IL-2、SAA、IL-16、IL-9、PDFG-AB/BB、sEFGR、LIF、IL-12p70、CA125、およびIL-4からなる群から選択される少なくとも9種のバイオマーカーを含む、非一時的コンピュータ可読記憶媒体。

Claims (156)

  1. バイオマーカーのセットそれぞれの複数のバイオマーカー定量値を含むテストデータを分類する方法であって、
    ・少なくとも1つのプロセッサに、ヒト検査対象由来の生理学的サンプル中のバイオマーカーのセットの各バイオマーカーについてのバイオマーカー定量値を含むテストデータを受信するステップと、
    ・前記少なくとも1つのプロセッサを使用して、前記テストデータを、分類システムの電子表示である分類器を使用して評価するステップであって、各前記分類器が、電子的に保存された訓練データベクトルのセットを使用して訓練され、各訓練データベクトルが、個々のヒトを表し、かつ、それぞれのヒトについてのバイオマーカーのセットの各バイオマーカーのバイオマーカー定量値を含み、各訓練データベクトルが、それぞれのヒトにおける診断されたNSCLCの存在または非存在に関する分類をさらに含む、ステップと、
    ・前記少なくとも1つのプロセッサを使用して、前記評価するステップに基づいた前記ヒト検査対象におけるNSCLCの存在または発症の可能性に関する前記ヒト検査対象由来の前記サンプルの分類を出力するステップと
    を含み、前記バイオマーカーのセットが、NSE、CXCL9、CEA、CYFRA-21-1と、IL-8、MMP-9、sTNFRII、TNFRI、MMP7、IL-5、レジスチン、IL-10、MPOMCP-1、GRO-Pan、レプチンMIF、sICAM-1、IL-2、SAA、およびPDFG-AB/BBからなる群から選択される少なくとも9種のバイオマーカーを含む、方法。
  2. バイオマーカーのセットそれぞれの複数のバイオマーカー定量値を含むテストデータを分類する方法であって、
    ・少なくとも1つのプロセッサを使用して、電子的に保存された訓練データベクトルのセットにアクセスするステップであって、各訓練データベクトルが、個々のヒトを表し、かつ、それぞれのヒトについてのバイオマーカーのセットの各バイオマーカーのバイオマーカー定量値を含み、各訓練データベクトルが、それぞれのヒトにおける診断されたNSCLCの存在または非存在に関する分類をさらに含む、ステップと、
    ・分類システムの電子表示を、電子的に保存された訓練データベクトルのセットを使用して訓練するステップと、
    ・前記少なくとも1つのプロセッサで、ヒト検査対象におけるバイオマーカーのセットについての複数のバイオマーカー定量値を含むテストデータを受信するステップと、
    ・前記少なくとも1つのプロセッサを使用して、前記テストデータを、前記分類システムの前記電子表示を使用して評価するステップと、
    ・前記評価するステップに基づいたヒト検査対象における非小細胞肺がんの存在または発症の可能性に関する前記ヒト検査対象の分類を出力するステップと
    を含み、前記バイオマーカーのセットが、NSE、CXCL9、CEA、CYFRA-21-1と、IL-8、MMP-9、sTNFRII、TNFRI、MMP7、IL-5、レジスチン、IL-10、MPOMCP-1、GRO-Pan、レプチンMIF、sICAM-1、IL-2、SAA、およびPDFG-AB/BBからなる群から選択される少なくとも9種のバイオマーカーを含む、方法。
  3. 前記分類システムが、ランダムフォレスト、AdaBoost、ナイーブベイズ、サポートベクターマシン、LASSO、リッジ回帰、ニューラルネット、遺伝的アルゴリズム、弾性ネット、勾配ブースティング木、ベイズニューラルネットワーク、k-最近傍、またはそのアンサンブルからなる群から選択される、請求項1または2に記載の方法。
  4. 前記分類システムが、ランダムフォレストを含む、請求項1から3までのいずれか一項に記載の方法。
  5. 前記分類システムが、AdaBoostを含む、請求項1から3までのいずれか一項に記載の方法。
  6. 前記分類システムが、ナイーブベイズを含む、請求項1から3までのいずれか一項に記載の方法。
  7. 前記分類システムが、サポートベクターマシンを含む、請求項1から3までのいずれか一項に記載の方法。
  8. 前記分類システムが、LASSOを含む、請求項1から3までのいずれか一項に記載の方法。
  9. 前記分類システムが、リッジ回帰を含む、請求項1から3までのいずれか一項に記載の方法。
  10. 前記分類システムが、ニューラルネットを含む、請求項1から3までのいずれか一項に記載の方法。
  11. 前記分類システムが、遺伝的アルゴリズムを含む、請求項1から3までのいずれか一項に記載の方法。
  12. 前記分類システムが、弾性ネットを含む、請求項1から3までのいずれか一項に記載の方法。
  13. 前記分類システムが、勾配ブースティング木を含む、請求項1から3までのいずれか一項に記載の方法。
  14. 前記分類システムが、ベイズニューラルネットワークを含む、請求項1から3までのいずれか一項に記載の方法。
  15. 前記分類システムが、k-最近傍を含む、請求項1から3までのいずれか一項に記載の方法。
  16. 前記テストデータおよび各訓練データベクトルが、前記個々のヒトの性別、年齢および喫煙状況からなる群から選択される少なくとも1つの追加的な特性をさらに含む、請求項1から15までのいずれか一項に記載の方法。
  17. 前記テストデータが、ヒト対象由来の生理学的サンプル中の前記複数のバイオマーカーについてのバイオマーカー定量値の個々の決定をそれぞれが含む2つまたはそれよりも多くの反復実験データベクトルを含む、請求項1から16までのいずれか一項に記載の方法。
  18. 前記反復実験データベクトルのいずれか1つが、前記分類システム内の前記分類器のいずれか1つに従ってNSCLCについて陽性に分類される場合、前記サンプルが、NSCLCの存在または発症の可能性が高いとして分類される、請求項17に記載の方法。
  19. 前記バイオマーカーのセットが13種、14種、15種、16種、17種、18種、19種、20種、21種、22種、23種、24種、25種、26種、27種、28種、29種、30種、31種、32種、または33種のバイオマーカーを含む、請求項1から18までのいずれか一項に記載の方法。
  20. 前記バイオマーカー定量値が、IL-8、MMP-9、sTNFRII、TNFRI、MMP7、IL-5、レジスチン、IL-10、MPO、NSE、MCP-1、GRO、CEA、レプチン、CXCL9、CYFRA-21-1、MIF、sICAM-1、SAA、またはこれらの組合せからなる群から選択されるバイオマーカーのそれぞれの濃度レベルに比例し、前記生理学的サンプルが、生体液である、請求項1から19までのいずれか一項に記載の方法。
  21. 前記バイオマーカー定量値が、IL-8、sTNFRII、MMP-9、TNFRI、CXCL9-MIG、レジスチン、SAA、MPO、PDGF-AB-BB、MMP-7、GRO、MIF、MCP-1、CEA、CYFRA-21-1、レプチン、IL-2、IL-10、およびNSEからなる群から選択されるバイオマーカーのそれぞれの濃度レベルに比例する、請求項1から19までのいずれか一項に記載の方法。
  22. 前記バイオマーカー定量値が、IL-8、sTNFRII、MMP-9、TNFRI、CXCL9-MIG、レジスチン、SAA、MPO、PDGF-AB-BB、MMP-7、GRO、MIF、MCP-1、CEA、CYFRA-21-1、レプチン、IL-2、およびIL-10からなる群から選択されるバイオマーカーのそれぞれの濃度レベルに比例する、請求項1から19までのいずれか一項に記載の方法。
  23. 前記バイオマーカー定量値が、IL-8、MMP-9、sTNFRII、TNFRI、MMP7、レジスチン、MPO、NSE、GRO、CEA、CXCL9、MIF、IL-2、SAA、IL-16、IL-9、PDFG-AB/BB、またはこれらの組合せからなる群から選択されるバイオマーカーのそれぞれの濃度レベルに比例し、前記生理学的サンプルが、生体液である、請求項1から19までのいずれか一項に記載の方法。
  24. 前記バイオマーカー定量値が、IL-8、sTNFRII、MMP-9、TNFRI、CXCL9-MIG、レジスチン、SAA、MPO、PDGF-AB-BB、MMP-7、GRO、MIF、MCP-1、CEA、CYFRA-21-1、レプチン、およびIL-2からなる群から選択されるバイオマーカーのそれぞれの濃度レベルに比例する、請求項1から19までのいずれか一項に記載の方法。
  25. 前記バイオマーカー定量値が、IL-8、sTNFRII、MMP-9、TNFRI、CXCL9-MIG、レジスチン、SAA、MPO、PDGF-AB-BB、MMP-7、GRO、MIF、MCP-1、CEA、CYFRA-21-1、およびレプチンからなる群から選択されるバイオマーカーのそれぞれの濃度レベルに比例する、請求項1から19までのいずれか一項に記載の方法。
  26. 前記バイオマーカー定量値が、IL-8、MMP-9、sTNFRII、TNFRI、レジスチン、MPO、NSE、GRO、CEA、CXCL9、IL-2、SAA、PDFG-AB/BB、またはこれらの組合せからなる群から選択されるバイオマーカーのそれぞれの濃度レベルに比例し、前記生理学的サンプルが、生体液である、請求項1から19までのいずれか一項に記載の方法。
  27. 前記バイオマーカー定量値が、IL-8、sTNFRII、MMP-9、TNFRI、CXCL9-MIG、レジスチン、SAA、MPO、PDGF-AB-BB、およびMMP-7からなる群から選択されるバイオマーカーのそれぞれの濃度レベルに比例する、請求項1から19までのいずれか一項に記載の方法。
  28. 前記バイオマーカーが、ペプチド、タンパク質、翻訳後修飾を有するペプチドおよびタンパク質、またはこれらの組合せである、請求項1から27までのいずれか一項に記載の方法。
  29. 前記生理学的サンプルが、生体液である、請求項28に記載の方法。
  30. 前記生体液が、血液、血清、血漿、またはこれらの混合物である、請求項29に記載の方法。
  31. 前記分類器が、5、10、15、20、25、30、40、50、75または100の個々の木を含むランダムフォレスト分類器である、請求項1から30までのいずれか一項に記載の方法。
  32. 前記分類器が、50、100、150、200、250、300、400、500、750または1,000の繰り返しを含むAdaBoost分類器である、請求項1から30までのいずれか一項に記載の方法。
  33. 前記分類器が、多項式関数、ガウス放射基底関数、双曲線正接関数または三角形関数であるカーネルを含むサポートベクターマシン分類器である、請求項1から30までのいずれか一項に記載の方法。
  34. 前記分類器が、0.1、0.5、1、2、10、100の制約条件を含むLASSO分類器である、請求項1から30までのいずれか一項に記載の方法。
  35. 前記分類器が、0.1、0.5、1、2、10、100の制約条件を含むリッジ回帰分類器である、請求項1から30までのいずれか一項に記載の方法。
  36. 前記分類器が、1、2、4、または5の隠れ層を含むニューラルネット分類器である、請求項1から30までのいずれか一項に記載の方法。
  37. 前記分類器が、畳み込みニューラルネットワークまたは再帰型ニューラルネットワークを含むニューラルネット分類器である、請求項1から30までのいずれか一項に記載の方法。
  38. 前記分類器が、0.1、0.5、1、2、10、100の制約条件を含む弾性ネット分類器である、請求項1から30までのいずれか一項に記載の方法。
  39. 前記分類器が、5、10、15、20、25、30、40、50、75または100の個々の木を含む勾配ブースティング木分類器である、請求項1から30までのいずれか一項に記載の方法。
  40. 前記分類器が、1、2、4、または5の隠れ層を含むベイズニューラルネット分類器である、請求項1から30までのいずれか一項に記載の方法。
  41. 前記分類器が、1、2、4、5、8、または10の近傍を含むk-最近傍分類器である、請求項1から30までのいずれか一項に記載の方法。
  42. 対象由来の生理学的サンプル中のバイオマーカーレベルを決定するステップをさらに含む、請求項1から41までのいずれか一項に記載の方法。
  43. 前記ヒト検査対象が、45歳またはそれよりも上であるか、長期間喫煙者であるか、肺内の不定小結節と診断されているか、またはこれらの組合せである、請求項1から42までのいずれか一項に記載の方法。
  44. 前記ヒト検査対象から得た生理学的サンプル中の各バイオマーカー定量値を決定するステップをさらに含む、請求項1から43までのいずれか一項に記載の方法。
  45. 前記ヒト検査対象が、コンピュータ断層撮影スキャンによって検出可能な少なくとも1つの肺小結節を示す、請求項1から44までのいずれか一項に記載の方法。
  46. 低線量コンピュータ断層撮影によって肺小結節を検査するステップをさらに含む、請求項1から45までのいずれか一項に記載の方法。
  47. 前記ヒト検査対象が、NSCLCのリスクにある請求項1から46のいずれか一項に記載の方法。
  48. 前記ヒト検査対象をNSCLCに関して処置するステップをさらに含む請求項1から47のいずれか一項に記載の方法。
  49. 前記ヒト検査対象が、女性である請求項1から48のいずれか一項に記載の方法。
  50. 前記ヒト検査対象が、男性である請求項1から48のいずれか一項に記載の方法。
  51. 前記ヒト検査対象が、45歳またはそれよりも上であるか、長期間喫煙者であるか、肺内の不定小結節と診断されているか、またはこれらの組合せである請求項1から50のいずれか一項に記載の方法。
  52. (a)対象由来の生理学的サンプルを得るステップと、
    (b)前記サンプルにおいて、IL-8、MMP-9、sTNFRII、TNFRI、MMP7、IL-5、レジスチン、IL-10、MPOMCP-1、GROレプチンHGF、sCD40LsFasL、RANTES、IL-7、MIF、sICAM-1、IL-2、SAA、IL-16、IL-9、PDFG-AB/BB、sEFGR、LIF、IL-12p70、CA125、およびIL-4からなる群から選択される少なくとも4種のバイオマーカーのセットを測定するステップであって、バイオマーカー定量値のセットを生成するステップと
    をさらに含む、請求項1から5までのいずれか一項に記載の方法。
  53. 前記サンプルにおいて、前記バイオマーカーのうちの少なくとも13種、14種、15種、16種、17種、18種、19種、または21種のセットを測定するステップを含む、請求項5に記載の方法。
  54. 前記バイオマーカー定量値が、非小細胞肺がんを示す、請求項1から5までのいずれか一項に記載の方法。
  55. 前記バイオマーカー定量値が、初期の非小細胞肺がん、好ましくはステージIを示す、請求項1から5までのいずれか一項に記載の方法。
  56. 前記ヒト検査対象が、非小細胞肺がんのリスクにある、請求項1から5までのいずれか一項に記載の方法。
  57. 前記バイオマーカー定量値が、ラジオイムノアッセイ、酵素結合免疫吸着検定法(ELISA)、Q-Plex(商標)マルチプレックスアッセイ、液体クロマトグラフィー-質量分析(LCMS)、フローサイトメトリーマルチプレックスイムノアッセイ、可視光線もしくは紫外線の吸光度を通じた放射測定もしくは分光測定による検出を伴う高圧液体クロマトグラフィー、質量分析による定性的分析および定量的分析、ウエスタンブロッティング、放射性、蛍光もしくは化学発光プローブもしくは核の検出による定量的可視化を伴う1次元もしくは2次元ゲル電気泳動、吸収もしくは蛍光側光法を用いた抗体に基づく検出、いくつもの化学発光レポーター系のうちのいずれかの発光による定量化、酵素的アッセイ、免疫沈降もしくは免疫捕捉アッセイ、固相および液相イムノアッセイ、定量的マルチプレックスイムノアッセイ、タンパク質アレイもしくはチップ、プレートアッセイ、プリントアレイイムノアッセイ、またはこれらの組合せによって測定される、請求項1から5までのいずれか一項に記載の方法。
  58. 前記バイオマーカー定量値が、イムノアッセイによって測定される、請求項1から5までのいずれか一項に記載の方法。
  59. ステージIの非小細胞肺がんを診断するための方法であって、
    (a)対象由来の生理学的サンプルを得るステップと、
    (b)前記サンプルにおいて、NSE、CXCL9、CEA、CYFRA-21-1と、IL-8、MMP-9、sTNFRII、TNFRI、MMP7、IL-5、レジスチン、IL-10、MPO、MCP-1、GRO-Pan、レプチン、MIF、sICAM-1、IL-2、SAA、およびPDFG-AB/BBからなる群から選択される少なくとも9種のバイオマーカーとを含むバイオマーカーのセットをイムノアッセイによって測定するステップであって、バイオマーカー定量値を生成するステップと、
    (c)少なくとも1つのプロセッサに、ヒト検査対象由来の生理学的サンプル中のバイオマーカーのセットの各バイオマーカーについてのバイオマーカー定量値を含むテストデータを受信するステップと、
    (d)前記少なくとも1つのプロセッサを使用して、前記テストデータを、分類システムの電子表示である分類器を使用して評価するステップであって、各分類器が、電子的に保存された訓練データベクトルのセットを使用して訓練され、各訓練データベクトルが、個々のヒトを表し、かつ、それぞれのヒトについての前記バイオマーカーのセットの各バイオマーカーのバイオマーカー定量値を含み、各訓練データベクトルが、前記それぞれのヒトにおける診断されたNSCLCの存在または非存在に関する分類をさらに含む、ステップと、
    (e)前記少なくとも1つのプロセッサを使用して、前記評価するステップに基づいた前記対象におけるNSCLCの存在または発症の可能性に関する前記ヒト検査対象由来の前記サンプルの分類を出力するステップと
    を含む方法。
  60. 前記分類システムが、ランダムフォレスト、AdaBoost、ナイーブベイズ、サポートベクターマシン、LASSO、リッジ回帰、ニューラルネット、遺伝的アルゴリズム
    、弾性ネット、勾配ブースティング木、ベイズニューラルネットワーク、k-最近傍、またはそのアンサンブルからなる群から選択される、請求項59に記載の方法。
  61. 前記分類システムが、ランダムフォレストを含む、請求項59に記載の方法。
  62. 前記分類システムが、AdaBoostを含む、請求項59に記載の方法。
  63. 前記分類システムが、ナイーブベイズを含む、請求項59に記載の方法。
  64. 前記分類システムが、サポートベクターマシンを含む、請求項59に記載の方法。
  65. 前記分類システムが、LASSOを含む、請求項59に記載の方法。
  66. 前記分類システムが、リッジ回帰を含む、請求項59に記載の方法。
  67. 前記分類システムが、ニューラルネットを含む、請求項59に記載の方法。
  68. 前記分類システムが、遺伝的アルゴリズムを含む、請求項59に記載の方法。
  69. 前記分類システムが、弾性ネットを含む、請求項59に記載の方法。
  70. 前記分類システムが、勾配ブースティング木を含む、請求項59に記載の方法。
  71. 前記分類システムが、ベイズニューラルネットワークを含む、請求項59に記載の方法。
  72. 前記分類システムが、k-最近傍を含む、請求項59に記載の方法。
  73. 前記分類器が、5、10、15、20、25、30、40、50、75または100の個々の木を含むランダムフォレスト分類器である、請求項59から7までのいずれか一項に記載の方法。
  74. 前記分類器が、50、100、150、200、250、300、400、500、750または1,000の繰り返しを含むAdaBoost分類器である、請求項59から7までのいずれか一項に記載の方法。
  75. 前記分類器が、多項式関数、ガウス放射基底関数、双曲線正接関数または三角形関数であるカーネルを含むサポートベクターマシン分類器である、請求項59から7までのいずれか一項に記載の方法。
  76. 前記分類器が、0.1、0.5、1、2、10、100の制約条件を含むLASSO分類器である、請求項59から7までのいずれか一項に記載の方法。
  77. 前記分類器が、0.1、0.5、1、2、10、100の制約条件を含むリッジ回帰分類器である、請求項59から7までのいずれか一項に記載の方法。
  78. 前記分類器が、1、2、4、または5の隠れ層を含むニューラルネット分類器である、請求項59から7までのいずれか一項に記載の方法。
  79. 前記分類器が、畳み込みニューラルネットワークまたは再帰型ニューラルネットワーク
    を含むニューラルネット分類器である、請求項59から7までのいずれか一項に記載の方法。
  80. 前記分類器が、0.1、0.5、1、2、10、100の制約条件を含む弾性ネット分類器である、請求項59から7までのいずれか一項に記載の方法。
  81. 前記分類器が、5、10、15、20、25、30、40、50、75または100の個々の木を含む勾配ブースティング木分類器である、請求項59から7までのいずれか一項に記載の方法。
  82. 前記分類器が、1、2、4、または5の隠れ層を含むベイズニューラルネット分類器である、請求項59から7までのいずれか一項に記載の方法。
  83. 前記分類器が、1、2、4、5、8、または10の近傍を含むk-最近傍分類器である、請求項59から7までのいずれか一項に記載の方法。
  84. 前記バイオマーカーが、ペプチド、タンパク質、翻訳後修飾を有するペプチド、翻訳後修飾を有するタンパク質、またはこれらの組合せである、請求項59から8までのいずれか一項に記載の方法。
  85. 前記生理学的サンプルが、生体液である、請求項59から8までのいずれか一項に記載の方法。
  86. 前記生体液が、全血、血漿、血清、またはこれらの組合せである、請求項8に記載の方法。
  87. 複数のバイオマーカーを検出するための方法であって、
    (a)対象由来の生理学的サンプルを得るステップと、
    (b)前記サンプルにおいて、NSE、CXCL9、CEA、CYFRA-21-1と、IL-8、MMP-9、sTNFRII、TNFRI、MMP7、IL-5、レジスチン、IL-10、MPO、MCP-1、GRO-Pan、レプチン、MIF、sICAM-1、IL-2、SAA、およびPDFG-AB/BBからなる群から選択される少なくとも9種のバイオマーカーとを含むバイオマーカーのセットを測定するステップであって、バイオマーカー定量値を生成するステップと
    を含む方法。
  88. 前記少なくとも4種のバイオマーカーのセットが、IL-8、MMP-9、sTNFRII、TNFRI、MMP-7、IL-5、レジスチン、IL-10、MPO、NSE、MCP-1、GRO-Pan、CEA、レプチン、CXCL9/MIG、CYFRA 21-1、MIF、sICAM-1、SAA、IL-2、およびPDGF-AB/BBからなる群から選択される、請求項8に記載の方法。
  89. 前記少なくとも4種のバイオマーカーのセットが、IL-8、MMP-9、sTNFRII、TNFRI、MMP-7、IL-5、レジスチン、IL-10、MPO、NSE、MCP-1、GRO-Pan、CEA、レプチン、CXCL9/MIG、CYFRA 21-1、MIF、sICAM-1、およびSAAからなる群から選択される、請求項8または8に記載の方法。
  90. 前記少なくとも4種のバイオマーカーのセットが、IL-8、MMP-9、sTNFR
    II、TNFRI、レジスチン、MPO、NSE、GRO-Pan、CEA、CXCL9/MIG、SAA、IL-2、およびPDGF-AB/BBからなる群から選択される、請求項8から89までのいずれか一項に記載の方法。
  91. 前記セットが、少なくとも13種、14種、15種、16種、17種、18種、19種、20種、または21種のバイオマーカーを含む、請求項8から9までのいずれか一項に記載の方法。
  92. 前記対象が、非小細胞肺がんのリスクにある、請求項8から9までのいずれか一項に記載の方法。
  93. 前記バイオマーカー定量値が、非小細胞肺がんを示す、請求項8から9までのいずれか一項に記載の方法。
  94. 前記バイオマーカー定量値が、初期の非小細胞肺がん、必要に応じてステージIの非小細胞肺がんを示す、請求項8から9までのいずれか一項に記載の方法。
  95. 前記バイオマーカーが、ペプチド、タンパク質、翻訳後修飾を有するペプチド、翻訳後修飾を有するタンパク質、またはこれらの組合せである、請求項8から9までのいずれか一項に記載の方法。
  96. 前記生理学的サンプルが、全血、血漿、血清、またはこれらの組合せである、請求項8から9までのいずれか一項に記載の方法。
  97. 前記バイオマーカー定量値が、喘息、乳がん、前立腺がん、結腸直腸がん、膵がん、またはこれらの組合せを示さない、請求項1から9までのいずれか一項に記載の方法。
  98. (a)少なくとも1つのプロセッサに、ヒト検査対象由来の生理学的サンプル中のバイオマーカーのセットの各バイオマーカーについてのバイオマーカー定量値を含むテストデータを受信するステップと、
    (b)前記少なくとも1つのプロセッサを使用して、前記テストデータを、分類システムの電子表示である分類器を使用して評価するステップであって、各分類器が、電子的に保存された訓練データベクトルのセットを使用して訓練され、各訓練データベクトルが、個々のヒトを表し、かつ、前記それぞれのヒトについての前記バイオマーカーのセットの各バイオマーカーのバイオマーカー定量値を含み、各訓練データベクトルが、前記それぞれのヒトにおける診断されたNSCLCの存在または非存在に関する分類をさらに含む、ステップと、
    (c)前記少なくとも1つのプロセッサを使用して、前記評価するステップに基づいた前記ヒト検査対象におけるNSCLCの存在または発症の可能性に関する前記ヒト検査対象由来の前記サンプルの分類を出力するステップと
    をさらに含む、請求項8から9までのいずれか一項に記載の方法。
  99. 前記分類システムが、ランダムフォレスト、AdaBoost、ナイーブベイズ、サポートベクターマシン、LASSO、リッジ回帰、ニューラルネット、遺伝的アルゴリズム、弾性ネット、勾配ブースティング木、ベイズニューラルネットワーク、k-最近傍、またはそのアンサンブルからなる群から選択される、請求項9に記載の方法。
  100. 前記分類システムが、ランダムフォレストを含む、請求項9または99に記載の方法。
  101. 前記分類システムが、AdaBoostを含む、請求項9または99に記載の方法。
  102. 前記分類システムが、ナイーブベイズを含む、請求項9または99に記載の方法。
  103. 前記分類システムが、サポートベクターマシンを含む、請求項9または99に記載の方法。
  104. 前記分類システムが、LASSOを含む、請求項9または99に記載の方法。
  105. 前記分類システムが、リッジ回帰を含む、請求項9または99に記載の方法。
  106. 前記分類システムが、ニューラルネットを含む、請求項9または99に記載の方法。
  107. 前記分類システムが、遺伝的アルゴリズムを含む、請求項9または99に記載の方法。
  108. 前記分類システムが、弾性ネットを含む、請求項9または99に記載の方法。
  109. 前記分類システムが、勾配ブースティング木を含む、請求項9または99に記載の方法。
  110. 前記分類システムが、ベイズニューラルネットワークを含む、請求項9または99に記載の方法。
  111. 前記分類システムが、k-最近傍を含む、請求項9または99に記載の方法。
  112. 前記分類器が、5、10、15、20、25、30、40、50、75または100の個々の木を含むランダムフォレスト分類器である、請求項9から11までのいずれか一項に記載の方法。
  113. 前記分類器が、50、100、150、200、250、300、400、500、750または1,000の繰り返しを含むAdaBoost分類器である、請求項9から11までのいずれか一項に記載の方法。
  114. 前記分類器が、多項式関数、ガウス放射基底関数、双曲線正接関数または三角形関数であるカーネルを含むサポートベクターマシン分類器である、請求項9から11までのいずれか一項に記載の方法。
  115. 前記分類器が、0.1、0.5、1、2、10、100の制約条件を含むLASSO分類器である、請求項9から11までのいずれか一項に記載の方法。
  116. 前記分類器が、0.1、0.5、1、2、10、100の制約条件を含むリッジ回帰分類器である、請求項9から11までのいずれか一項に記載の方法。
  117. 前記分類器が、1、2、4、または5の隠れ層を含むニューラルネット分類器である、請求項9から11までのいずれか一項に記載の方法。
  118. 前記分類器が、畳み込みニューラルネットワークまたは再帰型ニューラルネットワーク
    を含むニューラルネット分類器である、請求項9から11までのいずれか一項に記載の方法。
  119. 前記分類器が、0.1、0.5、1、2、10、100の制約条件を含む弾性ネット分類器である、請求項9から11までのいずれか一項に記載の方法。
  120. 前記分類器が、5、10、15、20、25、30、40、50、75または100の個々の木を含む勾配ブースティング木分類器である、請求項9から11までのいずれか一項に記載の方法。
  121. 前記分類器が、1、2、4、または5の隠れ層を含むベイズニューラルネット分類器である、請求項9から11までのいずれか一項に記載の方法。
  122. 前記分類器が、1、2、4、5、8、または10の近傍を含むk-最近傍分類器である、請求項9から11までのいずれか一項に記載の方法。
  123. ヒト検査対象におけるバイオマーカーのセットの発現レベルを測定することによって疾患進行の初期に非小細胞肺がんの存在を決定する方法であって、
    生理学的サンプルにおいてバイオマーカーのセットのバイオマーカー定量値をイムノアッセイによって決定するステップであって、
    前記バイオマーカーのセットが、NSE、CXCL9、CEA、CYFRA-21-1と、IL-8、MMP-9、sTNFRII、TNFRI、MMP7、IL-5、レジスチン、IL-10、MPOMCP-1、GRO-Pan、レプチンMIF、sICAM-1、IL-2、SAA、およびPDFG-AB/BBからなる群から選択される少なくとも種のバイオマーカーを含む、ステップと、
    前記サンプルを、分類システムにおいて前記バイオマーカー定量値のセットを使用して前記ヒト検査対象における非小細胞肺がんの存在または発症に関して分類するステップと
    を含む方法。
  124. 前記バイオマーカーが、ペプチド、タンパク質、翻訳後修飾を有するペプチド、翻訳後修飾を有するタンパク質、またはこれらの組合せである、請求項12に記載の方法。
  125. 前記生理学的サンプルが、全血、血漿、血清、またはこれらの組合せである、請求項12または12に記載の方法。
  126. 前記少なくとも4種のバイオマーカーのセットが、IL-8、MMP-9、sTNFRII、TNFRI、MMP-7、IL-5、レジスチン、IL-10、MPO、NSE、MCP-1、GRO-Pan、CEA、レプチン、CXCL9/MIG、CYFRA 21-1、MIF、sICAM-1、SAA、IL-2、およびPDGF-AB/BBからなる群から選択される、請求項12から12までのいずれか一項に記載の方法。
  127. 前記少なくとも4種のバイオマーカーのセットが、IL-8、MMP-9、sTNFRII、TNFRI、MMP-7、IL-5、レジスチン、IL-10、MPO、NSE、MCP-1、GRO-Pan、CEA、レプチン、CXCL9/MIG、CYFRA 21-1、MIF、sICAM-1、およびSAAからなる群から選択される、請求項12から12までのいずれか一項に記載の方法。
  128. 前記少なくとも4種のバイオマーカーのセットが、IL-8、MMP-9、sTNFR
    II、TNFRI、レジスチン、MPO、NSE、GRO-Pan、CEA、CXCL9/MIG、SAA、IL-2、およびPDGF-AB/BBからなる群から選択される、請求項12から12までのいずれか一項に記載の方法。
  129. 前記セットが、少なくとも13種、14種、15種、16種、17種、18種、または19種のバイオマーカーを含む、請求項12から12までのいずれか一項に記載の方法。
  130. 前記分類システムが、ランダムフォレスト、AdaBoost、ナイーブベイズ、サポートベクターマシン、LASSO、リッジ回帰、ニューラルネット、遺伝的アルゴリズム、弾性ネット、勾配ブースティング木、ベイズニューラルネットワーク、k-最近傍、またはそのアンサンブルからなる群から選択される分類器を含む、請求項12から129までのいずれか一項に記載の方法。
  131. 前記分類システムが、ランダムフォレストを含む、請求項13に記載の方法。
  132. 前記分類システムが、AdaBoostを含む、請求項13に記載の方法。
  133. 前記分類システムが、ナイーブベイズを含む、請求項13に記載の方法。
  134. 前記分類システムが、サポートベクターマシンを含む、請求項13に記載の方法。
  135. 前記分類システムが、LASSOを含む、請求項13に記載の方法。
  136. 前記分類システムが、リッジ回帰を含む、請求項13に記載の方法。
  137. 前記分類システムが、ニューラルネットを含む、請求項13に記載の方法。
  138. 前記分類システムが、遺伝的アルゴリズムを含む、請求項13に記載の方法。
  139. 前記分類システムが、弾性ネットを含む、請求項13に記載の方法。
  140. 前記分類システムが、勾配ブースティング木を含む、請求項13に記載の方法。
  141. 前記分類システムが、ベイズニューラルネットワークを含む、請求項13に記載の方法。
  142. 前記分類システムが、k-最近傍を含む、請求項13に記載の方法。
  143. 前記分類器が、5、10、15、20、25、30、40、50、75または100の個々の木を含むランダムフォレスト分類器である、請求項12から13までのいずれか一項に記載の方法。
  144. 前記分類器が、50、100、150、200、250、300、400、500、750または1,000の繰り返しを含むAdaBoost分類器である、請求項12から13までのいずれか一項に記載の方法。
  145. 前記分類器が、多項式関数、ガウス放射基底関数、双曲線正接関数または三角形関数であるカーネルを含むサポートベクターマシン分類器である、請求項12から13までのいずれか一項に記載の方法。
  146. 前記分類器が、0.1、0.5、1、2、10、100の制約条件を含むLASSO分類器である、請求項12から13までのいずれか一項に記載の方法。
  147. 前記分類器が、0.1、0.5、1、2、10、100の制約条件を含むリッジ回帰分類器である、請求項12から13までのいずれか一項に記載の方法。
  148. 前記分類器が、1、2、4、または5の隠れ層を含むニューラルネット分類器である、請求項12から13までのいずれか一項に記載の方法。
  149. 前記分類器が、畳み込みニューラルネットワークまたは再帰型ニューラルネットワークを含むニューラルネット分類器である、請求項12から13までのいずれか一項に記載の方法。
  150. 前記分類器が、0.1、0.5、1、2、10、100の制約条件を含む弾性ネット分類器である、請求項12から13までのいずれか一項に記載の方法。
  151. 前記分類器が、5、10、15、20、25、30、40、50、75または100の個々の木を含む勾配ブースティング木分類器である、請求項12から13までのいずれか一項に記載の方法。
  152. 前記分類器が、1、2、4、または5の隠れ層を含むベイズニューラルネット分類器である、請求項12から13までのいずれか一項に記載の方法。
  153. 前記分類器が、1、2、4、5、8、または10の近傍を含むk-最近傍分類器である、請求項12から13までのいずれか一項に記載の方法。
  154. バイオマーカーのセットそれぞれの複数のバイオマーカー定量値を含むテストデータを分類する方法であって、
    ・少なくとも1つのプロセッサに、ヒト検査対象由来の生理学的サンプル中のバイオマーカーのセットの各バイオマーカーについてのバイオマーカー定量値を含むテストデータを受信するステップと、
    ・前記少なくとも1つのプロセッサを使用して、前記テストデータを、分類システムの電子表示である分類器を使用して評価するステップであって、各分類器が、電子的に保存された訓練データベクトルのセットを使用して訓練され、各訓練データベクトルが、個々のヒトを表し、かつ、前記それぞれのヒトについてのバイオマーカーのセットの各バイオマーカーのバイオマーカー定量値を含み、各訓練データベクトルが、前記それぞれのヒトにおける診断されたNSCLCの存在または非存在に関する分類をさらに含む、ステップと、
    ・前記少なくとも1つのプロセッサを使用して、前記評価するステップに基づいた前記ヒト検査対象におけるNSCLCの存在または発症の可能性に関する前記ヒト検査対象由来の前記サンプルの分類を出力するステップと
    を含み、前記バイオマーカーのセットが、NSE、CXCL9、CEA、CYFRA-21-1と、IL-8、MMP-9、sTNFRII、TNFRI、MMP7、IL-5、レジスチン、IL-10、MPOMCP-1、GRO-Pan、レプチンMIF、sICAM-1、IL-2、SAA、およびPDFG-AB/BBからなる群から選択される少なくとも種のバイオマーカーを含む、方法。
  155. バイオマーカーのセットそれぞれの複数のバイオマーカー定量値を含むテストデータを分類するためのシステムであって、
    分類器の電子表示を含む電子保存手段とカップリングした少なくとも1つのプロセッサを含み、前記分類器が請求項1から154のいずれか一項に記載の電子的に保存された訓練データベクトルのセットを使用して訓練され、前記プロセッサが、ヒト検査対象における前記バイオマーカーのセットについての複数のバイオマーカー定量値を含むテストデータを受信するように構成され、前記少なくとも1つのプロセッサが、前記1つまたは複数の分類器の前記電子表示を使用して前記テストデータを評価し、前記評価に基づいて前記ヒト検査対象の分類を出力するようにさらに構成され、
    前記バイオマーカーのセットが、NSE、CXCL9、CEA、CYFRA-21-1と、IL-8、MMP-9、sTNFRII、TNFRI、MMP7、IL-5、レジスチン、IL-10、MPOMCP-1、GRO-Pan、レプチンMIF、sICAM-1、IL-2、SAA、およびPDFG-AB/BBからなる群から選択される少なくとも9種のバイオマーカーを含む、システム。
  156. 実行可能なプログラムが保存された非一時的コンピュータ可読記憶媒体であって、前記プログラムが、マイクロプロセッサに、
    対象の生理学的サンプル中の複数のバイオマーカーのバイオマーカー定量値を受信するステップと、
    前記サンプルを、分類システムおよび前記少なくとも1つのプロセッサを使用して、バイオマーカー定量値に基づいて分類するステップであって、前記サンプルの前記分類が、前記対象における非小細胞肺がん(NSCLC)の存在または発症の可能性を示す、ステップと
    を実施するように指示し、
    前記バイオマーカーのセットが、NSE、CXCL9、CEA、CYFRA-21-1と、IL-8、MMP-9、sTNFRII、TNFRI、MMP7、IL-5、レジスチン、IL-10、MPOMCP-1、GRO-Pan、レプチンMIF、sICAM-1、IL-2、SAA、およびPDFG-AB/BBからなる群から選択される少なくとも9種のバイオマーカーを含む、非一時的コンピュータ可読記憶媒体。
JP2019555107A 2017-04-04 2018-04-04 初期ステージの肺がん診断のための血漿ベースのタンパク質プロファイリング Active JP7250693B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762481474P 2017-04-04 2017-04-04
US62/481,474 2017-04-04
PCT/US2018/026119 WO2018187496A2 (en) 2017-04-04 2018-04-04 Plasma based protein profiling for early stage lung cancer prognosis

Publications (2)

Publication Number Publication Date
JP2020515993A JP2020515993A (ja) 2020-05-28
JP7250693B2 true JP7250693B2 (ja) 2023-04-03

Family

ID=63712345

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019555107A Active JP7250693B2 (ja) 2017-04-04 2018-04-04 初期ステージの肺がん診断のための血漿ベースのタンパク質プロファイリング

Country Status (7)

Country Link
US (2) US11769596B2 (ja)
EP (1) EP3607089A4 (ja)
JP (1) JP7250693B2 (ja)
CN (1) CN110709936A (ja)
AU (1) AU2018248293B2 (ja)
CA (1) CA3058481A1 (ja)
WO (1) WO2018187496A2 (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3151629A1 (en) * 2019-11-07 2021-05-14 Laura E. BENJAMIN Classification of tumor microenvironments
CN111351942B (zh) * 2020-02-25 2024-03-26 北京尚医康华健康管理有限公司 肺癌肿瘤标志物筛选系统及肺癌风险分析系统
CN111312392B (zh) * 2020-03-13 2023-08-22 中南大学 一种基于集成法的前列腺癌辅助分析方法、装置及电子设备
JP7614598B2 (ja) * 2020-04-21 2025-01-16 国立大学法人横浜国立大学 ベクトル場情報生成装置、状態判定支援システム、状態予測システム、ベクトル場情報生成方法およびプログラム
CN111636932A (zh) * 2020-04-23 2020-09-08 天津大学 基于叶尖定时和集成学习算法的叶片裂纹在线测量方法
EP4163385A4 (en) * 2020-06-03 2023-08-02 Fujitsu Limited DIAGNOSTIC ASSISTANCE PROGRAM, DEVICE AND METHOD
EP3933850A1 (en) * 2020-06-29 2022-01-05 Koa Health B.V. Method, apparatus and computer programs for early symptom detection and preventative healthcare
CN112259221A (zh) * 2020-10-21 2021-01-22 北京大学第一医院 基于多种机器学习算法的肺癌诊断系统
CN112289455A (zh) * 2020-10-21 2021-01-29 王智 一种人工智能神经网络学习模型构建系统、构建方法
WO2022140116A1 (en) 2020-12-21 2022-06-30 Freenome Holdings, Inc. Markers for the early detection of colon cell proliferative disorders
US20220208375A1 (en) * 2020-12-29 2022-06-30 Kpn Innovations, Llc. System and method for generating a digestive disease functional program
CN112858686B (zh) * 2020-12-30 2022-07-01 北京积水潭医院 一组用于预测口腔种植体周围炎的龈沟液标志物及其应用和试剂盒
CN113034434B (zh) * 2021-02-03 2022-09-02 深圳市第三人民医院(深圳市肝病研究所) 一种预测covid-19严重程度的多因素人工智能分析方法
US11676726B2 (en) * 2021-06-22 2023-06-13 David Haase Apparatus and method for generating a treatment plan for salutogenesis
CN113628697A (zh) * 2021-07-28 2021-11-09 上海基绪康生物科技有限公司 一种针对分类不平衡数据优化的随机森林模型训练方法
CN113322327A (zh) * 2021-08-02 2021-08-31 北京泱深生物信息技术有限公司 基于生物标志物的预测肺癌预后的产品及相关应用
JP2023023327A (ja) * 2021-08-05 2023-02-16 国立大学法人大阪大学 腫瘍のサブタイプ決定方法及びその応用、並びにサブタイプ決定のための方法
CN115575635A (zh) * 2022-09-28 2023-01-06 兰州大学第一医院 一种胆管癌诊断标志物及其筛选方法和应用
CN116312800A (zh) * 2023-03-08 2023-06-23 中山大学附属第八医院(深圳福田) 一种基于血浆中循环rna全转录组测序的肺癌特征识别方法、装置和存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015066564A1 (en) 2013-10-31 2015-05-07 Cancer Prevention And Cure, Ltd. Methods of identification and diagnosis of lung diseases using classification systems and kits thereof

Family Cites Families (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69837529T2 (de) 1997-02-12 2007-07-26 Electrophoretics Ltd., Cobham Proteinmarker für lungenkrebs und deren verwendung
US20070092917A1 (en) 1998-05-01 2007-04-26 Isabelle Guyon Biomarkers for screening, predicting, and monitoring prostate disease
ATE412433T1 (de) 1999-02-12 2008-11-15 Scripps Research Inst Methoden zur behandlung von tumoren und metastasen unter verwendung einer anti-angiogenen und immun-therapien
EP1157041B1 (en) 1999-03-01 2005-06-01 Genentech, Inc. Antibodies for cancer therapy and diagnosis
FI990888A0 (fi) 1999-04-20 1999-04-20 Medix Biochemica Ab Oy Menetelmä ja testikittejä respiratorisen alueen tulehduksen läsnäolon ja vaikeusasteen arvioimiseksi
US20030190602A1 (en) 2001-03-12 2003-10-09 Monogen, Inc. Cell-based detection and differentiation of disease states
CN1554025A (zh) 2001-03-12 2004-12-08 Īŵ���ɷ����޹�˾ 患病状态的细胞为基础的检测和鉴别
US20030134339A1 (en) 2002-01-14 2003-07-17 Thomas Brown Proteomics based method for toxicology testing
US20060088537A1 (en) 2002-04-11 2006-04-27 Terrett Jonathan A Protein involved in cancer
WO2004030511A2 (en) 2002-05-10 2004-04-15 Eastern Virginia Medical School Prostate cancer biomarkers
WO2003101283A2 (en) 2002-06-04 2003-12-11 Incyte Corporation Diagnostics markers for lung cancer
CN101586155A (zh) 2002-09-30 2009-11-25 肿瘤疗法科学股份有限公司 非小细胞肺癌的诊断方法
US20060024692A1 (en) 2002-09-30 2006-02-02 Oncotherapy Science, Inc. Method for diagnosing non-small cell lung cancers
TW200413725A (en) 2002-09-30 2004-08-01 Oncotherapy Science Inc Method for diagnosing non-small cell lung cancers
CA2517684A1 (en) 2003-03-04 2005-01-13 Wyeth Compositions and methods for diagnosing and treating asthma or other allergic or inflammatory diseases
JP2005044330A (ja) 2003-07-24 2005-02-17 Univ Of California San Diego 弱仮説生成装置及び方法、学習装置及び方法、検出装置及び方法、表情学習装置及び方法、表情認識装置及び方法、並びにロボット装置
DE10360900A1 (de) 2003-12-23 2005-07-21 BSH Bosch und Siemens Hausgeräte GmbH Wärmetauscher und Herstellungsverfahren dafür
ES2360073T3 (es) 2004-03-23 2011-05-31 Oncotherapy Science, Inc. Método para diagnosticar cáncer de pulmón de células no pequeñas.
EP1735620A4 (en) 2004-03-30 2008-04-09 Eastern Virginia Med School LUNG CANCER BIOMARKERS
US20060154276A1 (en) 2004-05-13 2006-07-13 Prometheus Laboratories Inc. Methods of diagnosing inflammatory bowel disease
EP1805513A4 (en) 2004-10-20 2009-06-10 Onco Detectors International L FACTOR FOR INHIBITING MIGRATION OF MACROPHAGES IN THE SERUM AS A TUMOR MARKER FOR PROSTATE, BLADDER, BREAST, OVARY, KIDNEY AND LUNG CANCER
WO2006045318A2 (en) 2004-10-27 2006-05-04 Aarhus Universitet Diagnosis and treatment of immune-related diseases
JP2008521412A (ja) 2004-11-30 2008-06-26 ベリデックス・エルエルシー 肺癌予後判定手段
CN1300580C (zh) 2004-12-31 2007-02-14 中国人民解放军第306医院 检测肝癌血清特征蛋白的质谱模型及其制备方法和应用
GB0508863D0 (en) 2005-04-29 2005-06-08 Astrazeneca Ab Peptide
US20070099239A1 (en) 2005-06-24 2007-05-03 Raymond Tabibiazar Methods and compositions for diagnosis and monitoring of atherosclerotic cardiovascular disease
CN101273144B (zh) 2005-07-27 2011-12-28 肿瘤疗法科学股份有限公司 诊断食道癌的方法
US7612181B2 (en) 2005-08-19 2009-11-03 Abbott Laboratories Dual variable domain immunoglobulin and uses thereof
JPWO2007026773A1 (ja) 2005-08-31 2009-03-12 学校法人 久留米大学 医用診断処理装置
US7955837B2 (en) 2005-10-29 2011-06-07 Bayer Technology Services Gmbh Process for determining one or more analytes in samples of biological origin having complex composition, and use thereof
US20080133141A1 (en) 2005-12-22 2008-06-05 Frost Stephen J Weighted Scoring Methods and Use Thereof in Screening
US9347945B2 (en) 2005-12-22 2016-05-24 Abbott Molecular Inc. Methods and marker combinations for screening for predisposition to lung cancer
KR100760518B1 (ko) 2006-07-18 2007-09-20 삼성정밀공업 주식회사 가구용 도어의 닫힘 충격 완충 장치
US7840505B2 (en) 2006-11-02 2010-11-23 George Mason Intellectual Properties, Inc. Classification tool
US20100184034A1 (en) 2006-11-13 2010-07-22 SOURCE PRECISION MEDICINE, INC d/b/a SOURCE MDX Gene Expression Profiling for Identification, Monitoring and Treatment of Lung Cancer
EP2139919A2 (en) 2007-02-28 2010-01-06 Novimmune Sa Human anti-ip-10 antibodies and uses thereof
ES2808569T3 (es) 2007-04-05 2021-03-01 Fund D Anna Sommer Champalimaud E Dr Carlos Montez Champalimaud Sistema y método para manejar, diagnosticar y predecir la aparición de una afección médica
WO2009036123A1 (en) 2007-09-11 2009-03-19 Cancer Prevention And Cure, Ltd. Method of identifying biomarkers in human serum indicative of pathologies of human lung tissues
KR101541206B1 (ko) 2007-09-11 2015-08-03 캔서 프리벤션 앤 큐어, 리미티드 인간 폐조직 병변의 지표가 되는 인간 혈청 내 단백질의 동정
US8541183B2 (en) 2007-09-11 2013-09-24 Cancer Prevention And Cure, Ltd. Methods of identification, assessment, prevention and therapy of lung diseases and kits thereof
JP5159242B2 (ja) 2007-10-18 2013-03-06 キヤノン株式会社 診断支援装置、診断支援装置の制御方法、およびそのプログラム
EP2223116B1 (en) 2007-12-10 2014-11-19 Roche Diagnostics GmbH Marker panel for colorectal cancer
CN101978269A (zh) 2008-01-18 2011-02-16 哈佛大学校长及研究员协会 在体液中检测疾病或病症标志的方法
CA2717763A1 (en) 2008-03-04 2009-09-11 John Bilello Diagnosing and monitoring depression disorders based on multiple biomarker panels
CN101587125B (zh) 2008-05-21 2013-07-24 林标扬 高表达癌症标记物和低表达组织器官标记物组合试剂盒
EP2340506B1 (en) 2008-09-09 2015-11-11 Somalogic, Inc. Lung cancer biomarkers and uses thereof
US10359425B2 (en) * 2008-09-09 2019-07-23 Somalogic, Inc. Lung cancer biomarkers and uses thereof
CN101988059B (zh) 2009-07-30 2014-04-02 江苏命码生物科技有限公司 胃癌检测标记物及其检测试剂盒和生物芯片
CA2828119A1 (en) * 2011-02-24 2012-08-30 Vermillion, Inc. Biomarker panels, diagnostic methods and test kits for ovarian cancer
JP2014514572A (ja) * 2011-04-29 2014-06-19 キャンサー・プリヴェンション・アンド・キュア,リミテッド 分類システムおよびそのキットを使用した肺疾患の同定および診断方法
WO2015088947A1 (en) * 2013-12-09 2015-06-18 Rush University Medical Center Biomarkers of rapid progression in advanced non-small cell lung cancer
WO2015138769A1 (en) * 2014-03-12 2015-09-17 The Board Of Trustees Of The Leland Stanford Junior University Methods and compositions for assessing patients with non-small cell lung cancer

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015066564A1 (en) 2013-10-31 2015-05-07 Cancer Prevention And Cure, Ltd. Methods of identification and diagnosis of lung diseases using classification systems and kits thereof

Also Published As

Publication number Publication date
WO2018187496A8 (en) 2019-05-02
WO2018187496A3 (en) 2018-11-15
EP3607089A2 (en) 2020-02-12
WO2018187496A4 (en) 2018-12-27
US20240087754A1 (en) 2024-03-14
CN110709936A (zh) 2020-01-17
US20190221316A1 (en) 2019-07-18
US11769596B2 (en) 2023-09-26
EP3607089A4 (en) 2020-12-30
JP2020515993A (ja) 2020-05-28
WO2018187496A2 (en) 2018-10-11
AU2018248293B2 (en) 2024-11-28
CA3058481A1 (en) 2018-10-11
AU2018248293A1 (en) 2019-10-31

Similar Documents

Publication Publication Date Title
JP7250693B2 (ja) 初期ステージの肺がん診断のための血漿ベースのタンパク質プロファイリング
JP2024150710A (ja) 分類システムおよびそのキットを使用した肺疾患の同定および診断方法
US20250316339A1 (en) Cancer classifier models, machine learning systems and methods of use
WO2015066564A1 (en) Methods of identification and diagnosis of lung diseases using classification systems and kits thereof
US20250224400A1 (en) Markers for the early detection of colon cell proliferative disorders
US20230223145A1 (en) Methods and software systems to optimize and personalize the frequency of cancer screening blood tests
CN116709971A (zh) 通用泛癌分类器模型、机器学习系统和使用方法
Zhou et al. Multiple Organ Scoring Systems for Predicting In-Hospital Mortality of Sepsis Patients in the Intensive Care Unit

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210402

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220608

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20220907

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221108

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230222

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230322

R150 Certificate of patent or registration of utility model

Ref document number: 7250693

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350