[go: up one dir, main page]

CN105051206B - 用于指示侵袭性前列腺癌的存在或不存在的方法 - Google Patents

用于指示侵袭性前列腺癌的存在或不存在的方法 Download PDF

Info

Publication number
CN105051206B
CN105051206B CN201380069472.6A CN201380069472A CN105051206B CN 105051206 B CN105051206 B CN 105051206B CN 201380069472 A CN201380069472 A CN 201380069472A CN 105051206 B CN105051206 B CN 105051206B
Authority
CN
China
Prior art keywords
pca
biomarker
snppc
data
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201380069472.6A
Other languages
English (en)
Other versions
CN105051206A (zh
Inventor
H.格伦贝格
M.埃克伦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Phadia AB
Original Assignee
Phadia AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Phadia AB filed Critical Phadia AB
Priority claimed from PCT/EP2013/074259 external-priority patent/WO2014079865A1/en
Publication of CN105051206A publication Critical patent/CN105051206A/zh
Application granted granted Critical
Publication of CN105051206B publication Critical patent/CN105051206B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明总体涉及具有作为诊断标志物的潜在效用的各种形式的遗传标志物和各种形式的蛋白的检测和鉴定。通过测定患者样品中多种生物标志物和遗传标志物的水平,且根据预定的公式组合获得的值,可以确定患者是否可能患有侵袭性前列腺癌。本发明特别仅适用于具有大于25的体重指数值的患者。

Description

用于指示侵袭性前列腺癌的存在或不存在的方法
发明领域
本发明总体涉及具有作为诊断标志物的潜在效用的各种形式的遗传标志物和各种形式的蛋白的检测和鉴定。具体而言,本发明涉及同时使用多种诊断标志物用于改进检测前列腺癌的侵袭性形式。更具体地,本发明涉及同时使用多种诊断标志物用于改进检测具有高于25的体重指数(BMI)的男性的侵袭性前列腺癌。
发明背景
血清前列腺特异性抗原(PSA)的测量广泛用于筛选和早期检测前列腺癌(PCa)。如EUROPEAN UROLOGY 60 (2011) 21-28中公开的Markus Aly和共同作者的公共报告中“Polygenic Risk Score Improves Prostate Cancer Risk Prediction:Results fromthe Stockholm-1 Cohort Study”(其通过引用并入本文)所讨论,可通过目前的临床免疫测定测量的血清PSA主要作为游离的“非复合”形式(游离PSA)或作为与a-抗胰凝乳蛋白酶(a-lantichymotrypsin, ACT)的复合物存在。血清中游离PSA与总PSA的比率已被证明显著改善PCa的检测。其他因素,如年龄和记录的家族史还可以进一步改善前列腺癌的检测。与PCa相关的遗传标志物、特别是单核苷酸多态性(SNP)的测量是用于筛选和早期检测前列腺癌的新兴方式。多种PCa相关的SNP的分析可以,与生物标志物如PSA和与关于患者的一般信息组合,通过将几种SNP组合为遗传评分而改善风险评估。
前列腺癌的筛选和早期检测是一项复杂的任务,并且迄今为止,已经证明没有单一生物标志物足够好,足以用于男性群体的特异性和灵敏性定位。因此,已经在组合生物标志物水平上花费尝试,以便产生在PCa的筛选和早期检测中表现更好的公式(formula)。最常见实例是常规的PSA测试,这实际上是“游离”PSA和“总”PSA的评估。PSA作为一种“非复合物”形式和其中PSA与α-抗胰凝乳蛋白酶形成复合物的一种形式存在。另一种此类实例是使用游离PSA、总PSA和PSA的一种或多种酶原形式的浓度的组合用于诊断目的,如WO03100079(METHOD OF ANALYZING PROENZYME FORMS OF PROSTATE SPECIFIC ANTIGEN IN SERUM TOIMPROVE PROSTATE CANCER DETECTION)(其通过引用并入本文)中所述。可以导致PCa的筛选和早期检测的改进性能的PSA浓度和酶原浓度的一种可能组合是φ(phi)指标。开发φ作为PSA、游离PSA和PSA前体形式[-2]proPSA的组合以便用边界线PSA测试(例如,PSA 2-10ng/mL)和非可疑的数字直肠检查更好地检测男性的PCa,如BJU Int.2011 Nov 11. doi:10.1111/j.1464-410X.2011.10751.x中公开的Nichol MB和共同作者的报告“Cost-effectiveness of Prostate Health Index for prostate cancer detection”(其通过引用并入本文)所公开。另一种此类实例是psp94和PSA的组合,如US2012021925(DIAGNOSTIC ASSAYS FOR PROSTATE CANCER USING PSP94 AND PSA BIOMARKERS)中所述。
存在用于评估患者是否患有PCa的具有潜在的诊断或预后价值的其他生物标志物,包括MIC-1,如Clin Cancer Res 2009;15(21):OF1–7中公开的David A. Brown和共同作者的报告“Macrophage Inhibitory Cytokine 1:A New Prognostic Marker inProstate Cancer”(其通过引用并入本文)中所述。
过去已经公开了将来自多个来源的信息组合为一种算法模型用于预测PCa风险的尝试。在如Cancer Prev Res (2010), 3(5):611-619中公开的Robert Klein和共同作者的公开报告“Blood Biomarker Levels to Aid Discovery of Cancer-Related Single-Nucleotide Polymorphisms:Kallikreins and Prostate Cancer”(其通过引用并入本文)中,作者讨论了血液生物标志物可以如何帮助发现新颖SNP,而且还表明,对于将基因型和生物标志物水平两者并入预测模型存在潜在作用。此外,该报告提供了证据证明,遗传标志物和生物标志物一致的非累加组合可以具有估算PCa风险的预测价值。后来,Xu和共同发明人公开了用于将遗传标志物与高级前列腺癌关联的方法,其主要用于鉴定适合用于使用专利申请WO2012031207(其通过引用并入本文)中的5-α还原酶抑制剂药物(例如,度他雄胺或非那雄胺)的化学预防治疗的受试者的目的。一致地,这两篇公开内容总结了组合遗传信息和生物标志物浓度用于估算PCa风险、还有高级癌症的目的的现有技术。
PSA筛选和早期检测的当前性能是约80%的灵敏度和30%的特异性。据估计,约65%将经历不必要的前列腺活组织检查,且在当前筛选中将错过15-20%的临床相关的前列腺癌。仅在美国,每年进行约100万次活组织检查,这导致约192 000个新病例被诊断。因此,还有诊断性能的小改进将导致由于较少活组织检查导致的医疗保健费用的大量节约以及遭受侵入性诊断程序的人较少。
目前的临床实践(在瑞典)是使用总PSA作为生物标志物用于检测无症状的和早期前列腺癌。对于用前列腺活组织检查的进一步评估的一般截止值是3 ng/mL。然而,由于PSA筛选的消极后果,现在在欧洲或北美没有推荐任何有组织的PSA筛选。
准确地鉴定个体中的侵袭性前列腺癌(aPCa)是特别重要的,因为为个体提供治疗越早,治愈癌症的可能性越大。然而,aPCa的鉴定是困难的,这部分因为需要较大组群以便在开发统计模型中提供足够数目的病例和对照。因此,aPCa的预测模型的可用性低。然而,本发明提供了预测模型用于通过分析个体的生物标志物和遗传概况而鉴定aPCa。
发明概述
本发明基于这样的发现:不同来源的诊断标志物的组合可以改善检测一般群体中的aPCa的能力。具体而言,本发明改善检测具有高体重指数(BMI)的个体中的aPCa的能力。这可以导致对社会的重大节约,因为早期鉴定的侵袭性癌症可更容易治疗。
因此,基于本发明的发现,本发明的一个方面提供了基于用于指示个体中侵袭性前列腺癌(PCa)存在或不存在的数据的冗余设计组合的方法,其包括以下步骤:
1. 提供来自所述个体的至少一种生物样品;
2. 在所述生物样品中,分析
a. 一类PCa生物标志物,其通过测量所述类别的PCa生物标志物的多种PCa相关的生物标志物中每种的存在或浓度而实施;
b. 一类与PCa相关的SNP(SNPpc),其通过测量所述类别的SNPpc的多种SNPpc中每种的存在或不存在而实施;
3. 组合关于所述类别的PCa生物标志物的数据,以形成代表与PCa生物标志物相关的发生PCa风险的生物标志物复合值;
4. 组合所述类别的SNPpc的数据,以形成代表与SNPpc相关的发生PCa风险的SNPpc复合值,其中所述方法允许当形成SNPpc复合值时忽略SNPpc类别的SNPpc的至少5%的子集;
5. 组合生物标志物复合值和SNPpc复合值,以形成总体复合值;
6. 通过将所述总体复合值与用已知的侵袭性PCa和良性疾病诊断的对照样品建立的预定的截止值进行比较而将所述总体复合值与所述个体中侵袭性PCa的存在或不存在相关联。
根据本发明的一个方面,当在包含处理器和存储器的计算机中执行时,借助计算机程序产品提供方法步骤中的一个或多个,通常为步骤3、4、5和/或6。
通常,上述方法的步骤3用经编程以便从步骤2a的数据形成或计算生物标志物复合值的计算机进行;上述方法的步骤4用经编程以便从步骤2b的数据形成或计算SNPpc复合值的计算机进行;步骤5用经编程以便从步骤3和4的数据形成或计算总体复合值的计算机进行;和/或上述方法的步骤6用计算机进行,所述计算机经编程以便通过将所述总体复合值与用已知的侵袭性PCa和良性疾病诊断的对照样品建立的预定的截止值进行比较而将所述总体复合值与所述个体中侵袭性PCa的存在或不存在相关联。此外,本发明涉及非临时性的有形的计算机可读存储介质,其具有可执行指令,以进行此类计算或形成此类复合值和/或进行如上所述的相关步骤。
截止值(或截止水平)的选择取决于许多因素,包括但不限于疾病本身的风险和与将没有所述疾病的个体不准确诊断为阳性(假阳性)相关的风险。下面进一步详细描述了截止值的选择。
在本发明的一个优选实施方案中,上述方法的步骤2(a)包括测量至少部分冗余的PCa生物标志物的存在或浓度,并且其中所述PCa生物标志物中的至少一种,诸如两种,选自(i) PSA、(ii) 总PSA (tPSA)、(iii) 完整PSA (iPSA)、(iv) 游离PSA (fPSA)和(v) hK2。
更具体地,所述方法允许当形成所述生物标志物复合值时忽略PCa标志物类别的所述PCa生物标志物(i)-(v)中的至少一种的子集,诸如所述PCa生物标志物(i)-(v)中的一种、两种、三种或四种的子集。
进一步,在一个实施方案中,上述方法允许当形成SNPpc复合值时忽略所述SNPpc类别的SNPpc中的至少10%,诸如15%,诸如20%,诸如30%。
优选地,根据预定方程组合关于PCa生物标志物的类别的数据以形成所述生物标志物复合值,和/或根据预定方程组合关于SNPpc的类别的数据以形成所述SNPpc复合值。此外,优选根据预定方程组合所述生物标志物复合值和所述SNPpc复合值以形成所述总体复合值。
在一个实施方案中,如果总体复合值大于截止值,则上述方法进一步包括推荐个体进行活组织检查的步骤。
在又一个实施方案中,如果总体复合值大于截止值,则上述方法进一步包括推荐个体改变饮食习惯、减肥、达到低于30的BMI值、定期锻炼和/或停止吸烟的步骤。
在本发明的一个实施方案中,与PCa相关的SNP (SNPpc)包括
rs
中的至少一种。
在一个实施方案中,所述方法进一步包括通过测量至少一种与PCa生物标志物浓度相关的SNP(SNPbm)的存在或不存在而分析一类SNPbm;组合关于所述SNPbm的数据以形成SNPbm复合值,且在所述总体复合值中包括所述SNPbm复合值。
在一个实施方案中,所述至少一种SNPbm包括
中的至少一种。
在本发明的一个实施方案中,所述方法进一步包括通过测量至少一种与体重指数相关的SNP(SNPbmi)的存在或不存在而分析所述个体的一类SNPbmi;组合关于所述SNPbmi的数据以形成SNPbmi复合值;且在所述总体复合值中包括所述SNPbmi复合值。
在一个实施方案中,所述至少一种SNPbmi包括
中的至少一种。
在本发明的另一个实施方案中,所述方法进一步包括从所述个体收集关于PCa的家族史、治疗史和身体数据;且其中将所述家族史、治疗史和/或身体数据包括在形成所述总体复合值的组合数据中。
在本发明的又一个实施方案中,所述方法进一步包括通过测量额外生物标志物类别的多种PCa生物标志物中的一种或每种的存在或浓度而分析所述额外类别的PCa生物标志物;组合关于所述额外PCa生物标志物类别的数据以形成所述额外PCa生物标志物类别的额外生物标志物复合值;并且在总体复合值中包括所述额外生物标志物复合值;其中冗余设计数据的组合以形成额外生物标志物复合值,其中额外类别的PCa生物标志物包含多于一种PCa生物标志物。
在一个优选的实施方案中,额外类别的PCa生物标志物包含生物标志物MIC-1和任选其他MIC-1相关的生物标志物,或生物标志物MSMB和任选其他MSMB相关生物标志物。
在另一个实施方案中,所述方法包括分析多种额外类别的PCa生物标志物中的每一种,且根据上述程序形成所述PCa生物标志物类别中的每一种的额外生物标志物复合值。优选地,分析至少两种额外类别的PCa生物标志物,其中一种额外类别的PCa生物标志物包含生物标志物MIC-1和任选其他MIC-1相关的生物标志物,并且另一种额外类别包含生物标志物MSMB和任选其他MSMB相关生物标志物。
在一个实施方案中,所述生物样品是血液样品。
在本发明的一个实施方案中,总体复合值使用这样的方法计算,其中利用与PCa生物标志物浓度相关的SNP(SNPbm)和相应的PCa生物标志物浓度的非累加效应。
在根据本发明的方法的一个优选实施方案中,所述个体具有大于25、诸如大于30的BMI值。
在所述方法的一个实施方案中,SNP的存在或不存在的测量通过使用MALDI质谱进行。
在所述方法的一个实施方案中,PCa生物标志物的存在或浓度的测量通过使用微阵列技术进行。
在所述方法的一个优选实施方案中,SNP(属于任何类别的SNP)的存在或不存在的测量包括测量所述SNP的等位基因的数目。在一个实施方案中,一个或两个等位基因对应于所述个体中所述SNP的存在,且零个等位基因对应于所述个体中所述SNP的不存在;其中零个等位基因对应于所述SNP的纯合阴性,一个等位基因对应于杂合阳性,且两个等位基因对应于纯合阳性。
在一个实施方案中,上述方法包括使用ELISA测定装置,微阵列测定装置,免疫沉淀测定装置,免疫荧光测定装置,放射免疫测定装置,或使用基质辅助激光解吸/电离(MALDI)的质谱装置,用于测量PCa生物标志物的存在或浓度。
在可以与上述实施方案组合的一个实施方案中,上述方法包括使用利用基质辅助激光解吸/电离(MALDI)的质谱装置,用于测量SNP的存在或不存在。
本发明的另一个方面提供了用于进行用于指示所述个体中侵袭性前列腺癌的存在或不存在的上述方法的步骤2a(即,测量至少一种PCa生物标志物的存在或浓度)和步骤2b(即,测量至少一种SNPpc的存在或不存在)的测定装置,所述测定装置包含具有固定在其上的至少两种不同类别的配体的固相,其中:
- 所述配体的第一类别特异性结合PCa生物标志物,并且包括特异性结合多种不同PCa生物标志物中的每一种,优选PSA、iPSA、tPSA、fPSA、hK2中的至少一种和任选MSMB和/或MIC-1的多种不同配体;且
- 所述配体的第二类别特异性结合SNPpc,并且包括特异性结合多种不同SNPpc中的每一种,诸如
中的至少一种的多种不同配体。
在一个实施方案中,所述测定装置进一步适配于测量SNPbm的存在或不存在,在所述情况下,所述测定装置的固相进一步具有固定的第三类配体,所述配体特异性结合SNPbm,并且包括特异性结合多种不同SNPbm中的一种或每种,诸如 中的至少一种的一种或多种不同配体。
在一个实施方案中,所述测定装置适配于测量SNPbmi的存在或不存在,在所述情况下,所述固相进一步具有固定的第四类配体,所述配体特异性结合SNPbmi,并且包括特异性结合一种或多种不同SNPbmi,诸如
中的至少一种的一种或多种不同配体。
在一个实施方案中,上述测定装置包括ELISA测定装置,微阵列测定装置,免疫沉淀测定装置,免疫荧光测定装置,放射免疫测定装置,或使用基质辅助激光解吸/电离(MALDI)的质谱装置,用于测量PCa生物标志物的存在或浓度。
在可以与上述实施方案组合的一个实施方案中,上述测定装置包括使用基质辅助激光解吸/电离(MALDI)的质谱装置,用于测量SNP的存在或不存在。
根据本发明的一个进一步方面,提供了用于进行用于指示所述个体中侵袭性前列腺癌的存在或不存在的上述方法的步骤2a(即,测量至少一种PCa生物标志物的存在或浓度)和步骤2b(即,测量至少一种SNPpc的存在或不存在)的测试试剂盒,所述测试试剂盒包含如上所述的相应测定装置和至少两类检测分子,其中:
- 所述检测分子的第一类别能够检测PCa生物标志物,优选PSA、iPSA、tPSA、fPSA和hK2中的至少一种和任选MSMB和/或MIC-1;且
- 所述检测分子的第二类别能够检测SNPpc,诸如
中的至少一种。
在一个实施方案中,所述测试试剂盒包含测定装置,所述测定装置进一步适配于测量至少一种SNPbm的存在或不存在,和第三类检测分子,其能够检测SNPbmi,诸如 中的至少一种。
在一个实施方案中,所述测试试剂盒包含测定装置,所述测定装置适配于测量SNPbmi的存在或不存在,和第四类检测分子,其能够检测SNPbmi,诸如
中的至少一种。
本发明的又另一个方面提供了包含具有固定在其上的至少两种不同类别的配体的固相的测定装置,其中:
- 所述配体的第一类别特异性结合PCa生物标志物,并且包括特异性结合多种不同PCa生物标志物中的每一种的多种不同配体,所述PCa生物标志物选自PSA、iPSA、tPSA、fPSA和hK2中的至少一种和任选MSMB和/或MIC-1;且
- 所述配体的第二类别特异性结合SNPpc,并且包括特异性结合多种不同SNPpc中的每一种的多种不同配体,所述SNPpc选自
中的至少一种。
在所述测定装置的一个实施方案中,所述固相进一步具有固定的第三类配体,所述配体特异性结合SNPbm,并且包括特异性结合多种不同SNPbm中的一种或每种的一种或多种不同配体,所述SNPbm 选自
中的至少一种。
在所述测定装置的一个进一步实施方案中,所述固相进一步具有固定的第四类配体,所述配体特异性结合SNPbmi,并且包括特异性结合多种不同SNPbmi中的一种或每种的一种或多种不同配体,所述SNPbmi选自
中的至少一种。
本发明的又另一个方面提供了可直接加载至数字计算机的内存储器的计算机程序产品,其中所述计算机程序产品包含软件代码构件,所述软件代码构件用于进行用于指示个体中侵袭性前列腺癌的存在或不存在的上述方法的至少步骤3(即,组合关于PCa生物标志物的所述类别的数据以形成生物标志物复合值)、步骤4(即,组合关于SNPpc的所述类别的数据以形成SNPpc复合值)、步骤5(即,组合生物标志物复合值和SNPpc复合值以形成总体复合值)和/或步骤6(通过将总体复合值与用已知的侵袭性PCa和良性疾病诊断的对照样品建立的预定的截止值进行比较而将所述总体复合值与所述个体中侵袭性PCa的存在或不存在相关联);诸如所述方法的步骤1(即,提供来自所述个体的至少一种生物样品)、步骤2(在生物样品中,通过测量多种PCa生物标志物中的每种的存在或浓度而分析一类PCa生物标志物,和通过测量多种SNPpc中的每种的存在或不存在而分析一类SNPpc)、步骤3、4、5和6。
在一个实施方案中,所述计算机程序产品进一步包含软件代码构件,其用于通过测量至少一种SNPbm的存在或不存在而分析一类SNPbm。
在另一个实施方案中,所述计算机程序产品进一步包含软件代码构件,其用于通过测量至少一种SNPbmi的存在或不存在而分析一类SNPbmi。
本发明的一个进一步方面提供了包含如上所述的测定装置和如上所述的相应的计算机程序产品的设备。
附图简述
图1显示了实施例1的线性模型的ROC曲线,其说明PSA(101)和多参数模型(102)之间在aPCa的预测中的性能的差异。
图2显示了预测受试者是否应当转诊至活组织检查的决策树的一个实例。
图3显示了实施例1的线性模型的ROC曲线,其说明PSA(301)和多参数模型(302)之间在预测具有大于25的BMI值的个体的aPCa中的性能的差异。
发明详述
为了本申请的目的和为了清楚,进行以下定义:
术语“PSA”通常是指血清前列腺特异性抗原。PSA以不同形式存在,其中术语“游离PSA”是指未结合或不结合至另一种分子的PSA,术语“结合的PSA”是指结合或复合至另一种分子的PSA,最后,术语“总PSA ”是指游离的PSA和结合(复合)的PSA的总和。术语“F/T PSA”是未结合的PSA与总PSA的比率。还存在PSA的分子衍生物,其中术语“proPSA”是指PSA的前体非活性形式,且“完整PSA”是指以完整和非活性形式发现的proPSA的额外形式。
术语“诊断测定”是指病理状况的存在或性质的检测。它可以与 “诊断方法” 互换使用。诊断测定在它们的灵敏度和特异性方面不同。
诊断工具的有用性的一种量度是“受试者工作特征曲线下面积(area under thereceiver – operator characteristic curve)”,其通常被称为ROC-AUC统计。这种广泛接受的量度考虑工具的灵敏度和特异性两者。ROC-AUC量度通常范围为0.5至1.0,其中0.5的值表明该工具不具有诊断价值,且1.0的值表明该工具具有100%灵敏度和100%特异性。
术语“灵敏度”是指因此正确鉴定的所有具有PCa的受试者的比例(其等于真阳性的数目除以真阳性和假阴性的数目的总和)。
术语“特异性”是指因此正确鉴定的就PCa而言健康(即不具有PCa)的所有受试者的比例(其等于真阴性的数目除以真阴性和假阳性的数目的总和)。
术语“生物标志物”是指蛋白、蛋白部分、肽或多肽,其可以用作生物标志物,例如用于诊断目的。
术语“激肽释放酶样生物标志物”是指属于蛋白的激肽释放酶家族或与蛋白的激肽释放酶家族相关的蛋白生物标志物,包括但不限于游离形式或复合形式的前列腺特异性抗原(PSA),pro PSA(PSA的同种型的集合),及具体而言截短形式(−2) pro PSA,完整PSA,人前列腺酸性磷酸酶(PAP)和人激肽释放酶2(在本申请中缩写为hK2或HK2或hk2)。
术语“单核苷酸多态性”(SNP)是指个体的遗传密码中的定义基因座的遗传特性。SNP可以与PCa的增加风险相关,并且因此可以用于个体的诊断或预后评价。单核苷酸多态性数据库(dbSNP)是由国家生物技术信息中心(NCBI)与国家人类基因组研究所(NHGRI)(均位于美国)合作开发和主持的不同物种之内和之间的遗传变异的档案。尽管数据库的名称暗示仅一类多态性的集合(即,单核苷酸多态性(SNP)),但其实际上含有一定范围的分子变异。每个独特提交的SNP记录接受参考SNP ID编号(“rs#”;"refSNP簇")。在本申请中,主要使用rs#编号鉴定SNP。因此,在本申请内,SNP用来指如dbSNP中包括的一定范围的分子变异,而不是仅单核苷酸多态性。为了本申请的目的,术语“一种SNP”或“多种SNP”可以互换使用,并且可以用于描述单数和/或复数的“单核苷酸多态性”。
术语“体重指数”(BMI)是指根据公式BMI =体重/(身高* 身高)的基于个体的体重和身高的人体脂肪的启发式代理(heuristic proxy),其中体重是以千克表示的个体的体重,且身高是以米表示的个体的身高。正常健康的BMI值通常被认为是18.5至25的范围内,且具有BMI>30的个体通常被认为是肥胖的。
术语“侵袭性前列腺癌”(aPCa)是指比平均前列腺癌疾病更严重的状况。aPCa可以以不同方式定义,包括但不限于(a) Gleason评分7或更高的前列腺癌,(b) 三期或更高的肿瘤阶段中的前列腺癌,(c) 具有大于10 ng/mL的PSA值的个体中的前列腺癌,(d) 具有渐增PSA值(小于一年的倍增时间)的个体,和(e) 计算机辅助图像分析(例如,正电子发射断层摄影(PET)或单光子发射计算机化断层摄影(SPECT)或计算机化x射线断层摄影(CT)或磁共振成像(MRI)或超声成像或任何其他计算机辅助图像分析)指示患者群体的较高四分位数中的肿瘤大小。
术语“医疗史”是指对于任何癌症疾病与历史检查、诊断和/或治疗相关的信息。医疗史的一个非限制性实例是,受试者是否已经先前通过前列腺的活组织检查检查PCa的存在。
术语“参数类别”是指一组或一个家族的相关参数,诸如相关的生物标志物或相关的SNP,这在预测性能的方面是部分或完全冗余的。参数类别的一个实例是“激肽释放酶样生物标志物”,即包括例如PSA、总PSA(tPSA)、完整PSA (iPSA)、游离PSA (fPSA)和hk2的类别。参数类别的另一个实例是“与BMI相关的SNP”,即包括与个体的BMI相关的SNP的类别。在本发明的预测模型中,其可足以具有每个类别的成员的子集的测量结果(数据),以使制备预测模型中代表的每个类别,虽然仅使用各自类别的成员的子集。术语“参数类别”有时在本申请中被称为唯一“类别”。
术语“复合值(composite value)”是指将与参数类别相关的数据组合成所述参数类别的代表值。数据组合通常可以根据一个或多个预定方程进行。复合值是根据一个或多个预定方程组合数据的输出。不同方程适用于不同测量结果(即数据),这取决于对于参数类别的成员的何种子集可用该数据。形成特定参数类别的复合值的方法的一个非限制性实例是使用所述类别的成员的可用结果的平均值。术语“复合值”有时在本申请中被称为 “评分”。复合值的一个非限制性实例是“生物标志物复合值”。复合值的另一个非限制性实例是“遗传学复合值”(或“遗传评分”),更具体地“SNP复合值”。
术语“数据的冗余设计组合”是指通过多次测量获得的数据的组合,以形成一个或多个参数类别或其子集的复合值,其中进行数据的组合,使得可以基于所述类别的数据的子集(例如,其中一些数据丢失或错误)或所述类别的数据的完整集合产生代表一个参数类别的复合值。
如本申请中使用的术语“多个/种”是指“两个/种或更多个/种”。
本发明提供了辅助指示、估计、检测和/或测定受试者中侵袭性前列腺癌的存在或不存在的诊断方法。本发明可以,如果需要,针对定义亚群进行调整,以增加本发明在所述亚群内的性能和有用性。尽管本发明可应用于男性个体的普通人群,但可以构建诊断方法用于对于定义亚群以增强的性能检测aPCa。定义亚群的一个非限制性实例是具有高体重指数(BMI),例如BMI > 25或BMI > 30或BMI > 35的个体。定义亚群的另一个非限制性实例是具有低PSA值,例如PSA < 4 ng/mL或PSA < 3 ng/mL或PSA < 2 ng/mL或PSA < 1 ng/mL的个体。
本发明的基本原理是,以一定方式使用生物标志物和遗传信息的组合,所述方式使得关于个体的评估信息的组合使用改善诊断的质量。
● 从所述患者收集关于PCa的家族史(类别HIST)。
● 收集患者身体数据,诸如体重、BMI、年龄和类似数据(类别PPD)
● 从所述患者获取许多生物样品。
● 在所述生物样品中,测量或定量多种定义生物标志物(类别生物标志物)的存在或浓度,随后组合关于所述生物标志物的数据,以形成生物标志物复合值。
● 在所述生物样品中,通过测量或定量多种定义的与PCa相关的SNP(SNPpc)的存在或不存在,随后组合获得的关于与PCa相关的SNP的数据,测量或定量就多种定义的与PCa相关的SNP(类别SNPpc)而言所述患者的遗传状态,以形成SNPpc复合值。
● 在所述生物样品中,通过测量或定量多种定义的与生物标志物表达水平或生物标志物浓度相关的SNP(SNPbm)的存在或不存在,测量或定量就多种定义的与生物标志物表达水平或生物标志物浓度相关的SNP (类别SNPbm)而言所述患者的遗传状态,以形成SNPbm复合值。
● 在所述生物样品中,通过测量或定量多种定义的与体重指数(BMI)相关的SNP(SNPbmi)的存在或不存在,测量或定量就所述个体的多种定义的与BMI相关的SNP (类别SNPbmi)而言所述患者的遗传状态,以形成SNPbmi复合值。
● 组合来自上述定义的类别中的至少两种的数据,以形成总体复合值,其用于检测早期侵袭性前列腺癌。
● 通过单独或与进一步数据组合使用所述总体复合值确定所述患者是否可能患有aPCa。
更详细地,包括收集家族史的步骤包括,但不限于,鉴定任何密切相关的男性家庭成员(诸如患者的父亲、兄弟或儿子)是否患有或已经患有PCa。
关于所述患者的身体信息通常通过定期体检获得,其中收集年龄、体重、身高、BMI和类似身体数据。
从患者收集生物样品包括但不限于血浆、血清、来自外周血白细胞的DNA和尿液。
生物样品中生物标志物的存在或浓度的定量可以以许多不同的方式进行。一种常用方法是使用酶联免疫吸附测定(ELISA),其使用抗体和校准曲线来评价所选生物标志物的存在和(如果可能)浓度。ELISA测定是本领域中常用且已知的,如从Shiiki N和共同作者在Biomarkers.2011 Sep;16(6):498-503中公开的出版物“Association between salivaPSA and serum PSA in conditions with prostate adenocarcinoma.”(其通过引用并入本文)所明显。另一种常用方法是使用微阵列测定用于定量生物样品中生物标志物的存在或浓度。典型微阵列测定包含平面载玻片,所述平面载玻片上在其载片的一面上的非重叠区域中结合多种不同的捕获试剂(通常是抗体),各自经选择以特异性捕获一种类型的生物标志物。允许生物样品接触所述捕获试剂定位的区域持续定义时间段,随后洗涤捕获试剂的区域。在该点,在生物样品中存在所寻求的生物标志物的情况下,相应的捕获试剂将已经捕获一部分所寻求的生物标志物,并且使之在洗涤后也结合至载玻片。接下来,将一组检测试剂添加至捕获试剂的区域(其现在可能保持结合的生物标志物),所述检测试剂能够(i)结合至如载玻片上呈现的生物标志物和(ii)产生可检测信号(通常通过缀合至荧光染料)。通常要求将一种检测试剂/生物标志物添加至载玻片。存在能够定量生物标志物的存在或浓度的许多其他方法,包括但不限于,免疫沉淀测定、免疫荧光测定、放射免疫测定、和使用基质辅助激光解吸/电离(MALDI)的质谱,仅举几例。
通过分析生物样品定量SNP的存在通常涉及基于等位基因特异性引物延伸的MALDI质谱分析,尽管其他方法同样适用。这适用于任何类型的SNP,即与PCa相关的SNP(SNPpc),与BMI相关的SNP (SNPbmi),和与生物标志物表达/浓度相关的SNP (SNPbm)。
数据的组合可以是结果的任何种类的算法组合,诸如数据的线性组合,其中所述线性组合改善了诊断性能(例如,如使用ROC-AUC测量)。另一种可能的组合包括非线性多项式关系。
用于诊断aPCa的合适生物标志物包括,但不限于,游离形式或复合形式的前列腺特异性抗原(PSA),pro PSA(PSA的同种型的集合),及具体而言截短形式(−2) pro PSA,完整PSA,人前列腺酸性磷酸酶(PAP),人激肽释放酶2(hK2),早期前列腺癌抗原(EPCA),前列腺分泌蛋白(PSP94;也称为β-微精原蛋白和MSMB),谷胱甘肽S-转移酶π(GSTP1),和α-甲基酰基辅酶A消旋酶(AMACR)。可用于改善方法的诊断准确性的相关生物标志物包括巨噬细胞抑制细胞因子1(MIC-1;也称为GDF-15)。
合适的与PCa相关的SNP包括但不限于rs12621278 (染色体2,基因座2q31.1)、rs9364554 (染色体6,基因座6q25.3)、rs10486567 (染色体7,基因座7p15.2)、rs6465657(染色体7,基因座7q21.3)、rs2928679 (染色体8,基因座8p21)、rs6983561 (染色体8,基因座8q24.21)、rs16901979 (染色体8,基因座8q24.21)、rs16902094 (染色体8,基因座8q24.21)、rs12418451 (染色体11,基因座11q13.2)、rs4430796 (染色体17,基因座17q12)、rs11649743 (染色体17,基因座17q12)、rs2735839 (染色体19,基因座19q13.33)、rs9623117 (染色体22,基因座22q13.1)和rs138213197 (染色体17,基因座17q21)。
合适的与PCa相关的SNP进一步包括,但不限于
合适的与PCa相关的SNP进一步包括,但不限于,如N Engl J Med. 2012 Jan 12;366(2):141-9中公开的Ewing CM和共同作者的报告“Germline mutations in HOXB13 andprostate-cancer risk.” (其通过引用并入本文)中所述的rs138213197,如CancerRes.2004 Apr 15;64(8):2677-9中公开的Cybulski C和共同作者的报告“A novelfounder CHEK2 mutation is associated with increased prostate cancer risk.”(其通过引用并入本文)中所述的1100delC (22q12.1)和I157T (22q12.1),和如CancerRes.2004 Feb 15;64(4):1215-9中公开的Cybulski C和共同作者的报告“NBS1 is aprostate cancer susceptibility gene” (其通过引用并入本文)中所述的657del5(8q21)。
可将参数类别定义为“与PCa相关的SNP”,其包括与PCa相关的SNP。合适的成员包括(但不限于)上面所列的SNP。该类别的成员的子集将足以代表预测模型中的类别本身。
合适的与除了PCa以外的其他过程相关的SNP包括但不限于rs3213764、rs1354774、rs2736098、rs401681、rs10788160、rs11067228,所有都与PSA的表达水平相关。可将参数类别定义为“与PSA的浓度相关的SNP”或“与PSA的表达水平相关的SNP”,其包括与PSA的浓度或表达水平相关的SNP。该类别的成员的子集将足以代表预测模型中的类别本身。SNP rs3213764和rs1354774特别与游离PSA的表达水平相关。
合适的与除了PCa以外的其他过程相关的SNP进一步包括但不限于rs1363120、rs888663、rs1227732、rs1054564,所有都与炎症细胞因子生物标志物MIC1的表达水平相关。可将参数类别定义为“与MIC1的浓度相关的SNP”或“与MIC1的表达水平相关的SNP”,其包括与MIC1的浓度或表达水平相关的SNP。该类别的成员的子集将足以代表预测模型中的类别本身。
可将参数类别定义为“与PCa生物标志物浓度相关的SNP”或“与PCa生物标志物表达水平相关的SNP”,其包括与相关生物标志物的浓度或表达水平相关的SNP,所述相关生物标志物诸如游离形式或复合形式的前列腺特异性抗原(PSA),pro PSA(PSA的同种型的集合),及具体而言截短形式(−2) pro PSA,完整PSA,人前列腺酸性磷酸酶(PAP),人激肽释放酶2(hK2),早期前列腺癌抗原(EPCA),前列腺分泌蛋白(PSP94;也称为β-微精原蛋白和MSMB),谷胱甘肽S-转移酶π(GSTP1),α-甲基酰基辅酶A消旋酶(AMACR)和巨噬细胞抑制细胞因子-1(MIC-1;也称为GDF-15)。该类别的成员的子集将足以代表预测模型中的类别本身。
合适的与除了PCa以外的其他过程相关的SNP进一步包括但不限于
,所有都与个体的BMI相关。如PLoS One.2013 Aug 7;8(8):e70735中公开的Mägi和共同作者的报告“Contribution of 32 GWAS-identified common variants to severe obesityin European adults referred for bariatric surgery” (其通过引用并入本文)中公开了其他合适的与BMI相关的SNP。可将参数类别定义为“与BMI的表达水平相关的SNP”,其包括与个体的BMI相关的SNP。该类别的成员的子集将足以代表预测模型中的类别本身。
用于评价受试者中侵袭性前列腺癌的存在或不存在的SNP的优选集合是
。即使使用完整列表是优选的,该列表的任意子集适用于评价受试者中侵袭性前列腺癌的存在或不存在。该列表中的SNP(该列表中的所有SNP,或包含该列表中的SNP的约95%、或90%、或85%、或80%、或75%、或70%的子集)可以被置于相同的固体支持物上,例如相同载玻片,用于在合适的分析仪器中同时检测。
如先前已经讨论,PCa筛选效率的性能的评价是困难的。尽管ROC-AUC特征提供关于性能的一些见解,额外的方法是期望的。用于评价PCa筛选的性能的一种替代方法是以给定灵敏度水平计算阳性活组织检查的百分比和比较使用单独的PSA的筛选与用于筛选的任何新型方法的性能。然而,这要求精确定义PSA的性能。
如J Natl Cancer Inst. 2006 Apr 19;98(8):529-34中公开的报告“Assessingprostate cancer risk:results from the Prostate Cancer Prevention Trial.” (其通过引用并入本文)中IM Thompson和共同作者已经公开PSA筛选的评价性能的一个实例。在该报告中,来自参与前列腺癌预防试验(PCPT)的男性的前列腺活组织检查数据用于测定PSA的灵敏度。总体而言,来自经历前列腺活组织检查的PCPT的安慰剂组的5519个男性,在活组织检查前一年期间进行至少一次PSA测量和数字直肠检查(DRE),并且在包括前列腺活组织检查之前3年期间进行至少两次PSA测量。该报告公开,当使用3 ng/mL的PSA值作为截止值时,将错过约41%的高等级癌症(即,具有Gleason评分为7或以上的癌症)。
如JAMA.2005 Jul 6;294(1):66-70中公开的“Operating characteristics ofprostate-specific antigen in men with an initial PSA level of 3.0 ng/ml orlower”(其通过引用并入本文)中IM Thompson和共同作者已经公开使用相同研究群体的第二次分析。在该报告中,作者呈现了所有前列腺癌(Gleason 7+和Gleason 8+)的PSA的灵敏度和特异性的估算值。当使用3.1 ng/mL作为用于活组织检查的PSA截止值时,估算出对于Gleason 7+肿瘤的56.7%的灵敏度和82.3%的特异性。在该报告中,作者得出结论,不存在对于监测健康男性的前列腺癌同时具有高灵敏度和高特异性的PSA的切点(cut point),而是在PSA的所有值处的前列腺癌风险的连续区(continuum)。这说明使用PSA作为筛选测试的复杂性,但仍承认PSA与前列腺癌的关联。
在获得任何给定的诊断或预后模型在筛选PCa中的预测性能的准确和相当的估算值的困难的一个必然结果是,当计算新型方法与使用单独的PSA相比的相对改善时,计算的相对改善将根据许多因素而变化。影响计算的相对改善的一个重要因素是如何获得对照组(即已知阴性物)。由于对其中没有任何PCa的迹象的受试者上进行活组织检查是不道德的,所以将偏见地选择对照组。因此,新型方法的相对改善将取决于如何选择对照组,且存在多种公知的方法来选择控制组。因此必须鉴于此类方差看到任何报告的估算的改善。就我们的经验所及,我们估算,如果新型方法与使用用于选择对照组的一种公知的方法的单独的PSA值相比的相对改善被报告为15%,则所述新颖方法比使用用于选择对照组的任何其他公知的方法的单独的PSA值将好至少10%。
为了在社会中以广泛方式变得可使用,筛选的性能必须满足合理的健康经济优势。粗略估算是,在相同灵敏度水平(即在群体中检测相同数目的前列腺癌)比PSA表现好15%(即,避免了15%的不必要的活组织检查)的筛选方法将具有以广泛方式在公共卫生系统的目前成本水平使用的机会。然而,对于个体的定义亚群,新型筛选方法可以具有与PSA值表现相比更小改善的经济学优势。值得注意的是,即使在发现用于估算PCa风险的组合模型上已经付出显著努力(如本专利申请中的几个引用文件所例举),在欧洲目前没有经常使用此类组合方法。因此,先前已知的多参数方法不符合可用于现代医疗保健中的社会经济标准。本发明的方法具有比先前呈现的组合方法更好的性能,并且符合由卫生保健系统完全考虑的社会经济性能要求。
符合广泛使用的要求的用于获得aPCa的筛选方法的一种可能方法是组合来自多个来源的信息。从概述水平来看,这包括组合从生物标志物分析(例如PSA值)、遗传概况(例如SNP概况)、家族史和其他来源获得的值。组合因此具有产生比任何单独的所包括因素更好的诊断陈述的可能性。过去已经公开了将值组合成多参数模型以产生更好的诊断陈述的试图,如本申请中别处所述。
数据的组合可以是结果的任何种类的算法组合,诸如数据的线性组合,其中所述线性组合改善了诊断性能(例如,如使用ROC-AUC测量)。用于组合成能够产生诊断估算值的模型的其他可能的方法包括(但不限于)非线性多项式、支持向量机、神经网络分类器、判别分析、随机森林、梯度加强、偏最小二乘法、岭回归(ridge regression)、套索法(lasso)、弹性网(elastic nets)、k-最近邻算法。此外,由Springer Series in Statistics, ISBN978-0387848570出版的T Hastie, R Tibshirani和J Friedman的书本“The Elements ofStatistical Learning:Data Mining, Inference, and Prediction, Second Edition”(其通过引用并入本文)描述了许多合适方法,其用于组合数据以便预测或分类特定结果。
将来自不同类别的数据转换成指示患者是否可能患有aPCa的单一值的算法优选是非线性函数,其中不同类别的依赖性用于进一步增加所述方法的诊断性能。例如,一种重要的依赖性是和与所选生物标志物的预期表达水平相关的任何相关遗传标志物组合的所述生物标志物的测量水平。在患者样品中发现升高浓度的生物标志物且同时所述患者遗传倾向于具有较低水平的所述生物标志物的情况下,升高的生物标志物水平的重要性增加。同样地,如果在遗传倾向于具有高水平的所述生物标志物的患者中的生物标志物水平明显低于正常值,则矛盾的发现增加了生物标志物水平解释的重要性。用于预测侵袭性PCa的风险的算法可受益于使用转换的变量,例如通过使用log10(PSA)值。转换对于具有明显偏离正态分布的分布的变量是特别有利的。可能的变量转换包括,但不限于,对数、倒数、平方和平方根。将每个变量集中于零平均值和单位方差是更常见的。
尽管可以以不同的方式进行数据的组合,但可以以以下非限制性方式说明根据本发明的典型程序。
在典型情况下,关于属于参数类别的生物标志物的数据将根据预定的方程组合,以形成和与参数类别本身相关的风险相关的复合值。一个非限制性实例是计算生物标志物类别的成员的所有可用测量值(数据)的平均值,并且使用所述平均值作为代表所述生物标志物类别的复合值。该程序可以清楚地应用,而无论多少生物标志物成员属于该类别。如果类别中包括的生物标志物之一的唯一数据是可用的,则它本身可以用于代表生物标志物类别。对于生物标志物,组合数据的步骤中常用的测量值是生物样品中发现的所述生物标志物的浓度。例如,对于生物标志物PSA和HK2,这最常见地是以单位ng/mL表示的血液样品中生物标志物的浓度。
遗传评分(即遗传学复合值,或更具体地SNP复合值)计算通常基于参数类别中包括的各单独SNP的预定比值比(odds ratio)。对于各SNP,预先确定比值比,即携带SNP(即,具有由SNP定义的风险等位基因)的个体具有所研究的疾病或状况的可能性。对于SNP的比值比的确定通常在大型前瞻性研究中进行,所述大型前瞻性研究涉及数千个具有已知状况或疾病的受试者。
个体的遗传评分,作为非限制性实例,可以根据以下算法计算:对于测试的个体,各SNP以以下方式处理。对于各SNP,个体可以携带两个SNP风险等位基因(对于所述SNP纯合阳性),或者一个风险等位基因(对于所述SNP杂合阳性)或零个风险等位基因(对于所述SNP纯合阴性)。SNP的等位基因的数目乘以所述SNP的比值比的自然对数,以形成该特定SNP的风险评估值。这意味着,对于特定SNP阴性(即具有零个SNP风险等位基因)的个体将不具有来自所述特定SNP的任何风险贡献。对于测量数据可用的所有SNP重复该程序。当已经计算出所有风险评估值时,计算测量数据可用的SNP的风险贡献的平均值,并且将其用作所述个体的遗传评分,即关于SNP的特定类别的遗传学复合值。该程序可以清楚地应用,而无论多少SNP成员属于该SNP类别。
为了根据本发明进一步说明典型程序,当应用于个体时,进行以下假设。定义两个参数类别,首先蛋白生物标志物类别(或生物标志物类别)具有成员Prot1和Prot2,其次遗传类别(或更具体地,SNP类别)具有成员Snp1、Snp2和Snp3。在涉及具有已知状况C的100个个体和已知不具有状况C的100个个体的实验中,确立Prot1、Prot2、Snp1、Snp2和Snp3与状况C的关联,并且用公式表示为Prot1和Prot2的一种蛋白生物标志物复合值,和Snp1、Snp2和Snp3的一种遗传复合值,以及还有进而与具有状况C的风险相关的一种总体复合值。蛋白生物标志物类别的复合值使用以下预定方程计算:
P = (Prot1 + 2*Prot2) / 3 [如果关于Prot1和Prot2的数据(即,Prot1值和Prot2值两者)可用]
P’ = Prot1 [在仅关于Prot1的数据(即,Prot1值)可用的情况下]
P’’ = Prot2 [在仅关于Prot2的数据(即,Prot2值)可用的情况下]
因此,在该假设情况下,在实验中发现,(a) Prot1和Prot2具有相同的尺度,且(b)Prot2的值对于评价个体是否具有状况C的重要性是Prot1的两倍。
如果蛋白生物标志物之一的唯一数据是可用的,则它本身可以用于代表蛋白生物标志物类别。
对于遗传类别的成员的比值比已经预先测定,并且如下:Snp1 = 1.1;Snp2 =1.2;和Snp3 = 1.3. 对于遗传类别的复合值计算为如上所述的遗传评分。
然后将蛋白生物标志物复合值和遗传评分(其在该情况下等于遗传类别复合值,或SNP复合值)根据以下预定方程组合为总体复合值:
Y = P + 10 * 评分
其中Y与具有状况C的风险相关,P是蛋白生物标志物复合值(并且P可以用如上定义的P’或P’’取代),并且评分是遗传评分。所有方程需要基于大群个体(在该假设情况下,100 + 100个个体)进行开发,其中推导Y和所研究的疾病或状况之间的关系。在该假设情况下,假设如果Y> 5,则个体具有状况C的风险升高,并且如果Y> 10,则风险非常高。
现在假设测试第一个体A的Prot1、Prot2、Snp1、Snp2和Snp3。在该特定情况下,所有测量都是成功的,并且产生以下结果:
Prot1 = 3 ng/mL
Prot2 = 6 ng/mL
Snp1 = 纯合阴性,即,无风险等位基因 = 0
Snp2 = 杂合阳性,即,一个风险等位基因 = 1
Snp3 = 纯合阳性,即,两个风险等位基因 = 2
蛋白生物标志物类别的复合值在这种情况下将是P = (3 + 2*6 ) /3 = 5。也称为遗传评分的对于遗传类别的复合值变为评分 = (0*log(1.1)+1*log(1.2)+2*log(1.3))/3 = 0.2357。总体复合值变为Y = 5 + 10 * 0.2357 = 7.357。因此,个体A具有状况C的风险被估算为升高,但不是非常高。
现在进一步假设测试第二个体B的Prot1、Prot2、Snp1、Snp2和Snp3。在该特定情况下,三种测量都是成功的,并且产生以下结果:
Prot1 = 2 ng/mL
Prot2 = 缺失数据
Snp1 = 纯合阳性,即两个风险等位基因 = 2
Snp2 = 缺失数据
Snp3 = 杂合阳性,即,一个风险等位基因 = 1
蛋白生物标志物类别的复合值在这种情况下将是P’ = 2,因为只有Prot1结果是可用的。也称为遗传评分的对于遗传类别的复合值变为评分 = (2*log(1.1)+1*log(1.3))/2 = 0.2264。总体复合值变为Y = 2 + 10 * 0.2264 = 4.264。因此,个体B具有状况C的风险被估算为低的。
通常,在预测发生aPCa的风险的模型中,经常存在一种或多种定义的截止值。截止值(或截止水平)的选择取决于许多因素,包括但不限于疾病本身的风险和与将没有所述疾病的个体不准确诊断为阳性(假阳性)相关的风险。在通常情况下,预测模型通常是单调函数Y = f(x1, x2, … ,xN),其中具有疾病的估算风险与Y的增加值相关。这意味着,如果截止值被设定在低水平,则该测试将产生大量的假阳性结果,但另一方面将检测到实际上具有疾病的大部分个体。如果截止水平被设定在高值,出现相反情况,其中具有高于截止水平的Y值的个体将以非常高概率具有疾病,但大量具有疾病的个体将收到阴性测试结果(即大量的假阴性结果)。截止水平的选择取决于许多因素,包括平衡(a)错过具有疾病的个体和(b)治疗不具有疾病的个体的社会经济结果。
当在实践中应用时,将偶尔发生一次或几次测量失败,这是由于例如不可预见的技术问题、人为错误或任何其他意外和不常见的原因。在这种情况下,对于个体获得的数据集将是不完整的。通常,此类不完整的数据集将难以评估,或者甚至不可能评估。然而,本发明依赖于大量其中许多是部分冗余的特征的测量。这意味着,还对于数据集是不完整的个体,在许多情况下将可能根据本发明产生高质量评估。这在类别内是特别真实的,其中例如激肽释放酶样生物标志物是相关且部分冗余的。在技术上,因此可能应用算法两步法,其中将激肽释放酶生物标志物贡献总结为激肽释放酶评分(或激肽释放酶值)。该激肽释放酶评分然后在第二步骤中,将其与其他数据(诸如遗传评分、年龄和家族史,举几个非限制性实例)组合,以便对PCa产生诊断或预后论断。可以对其他类的标志物,诸如与BMI相关的遗传标志物或与转化生长因子β超家族(结构上相关的细胞调节蛋白的大家族,包括MIC-1)相关的蛋白生物标志物(举两个非限制性实例)实施类似的两步程序。
可以以许多不同的方式体现冗余方面。实施冗余方面的一种可能的方式是定义一组代表与通用领域或家族相关的生物标志物的生物标志物。此类领域或家族的一种非限制性实例是激肽释放酶样生物标志物。可以确定多于一种定义集合(或类别)的生物标志物,并且此外,可以在此类集合之外应用还有其他生物标志物。通常,该类别是不重叠的,即任何定义的生物标志物是一种定义类别的唯一成员或以单独方式使用。接下来,对于所有生物标志物,进行确定存在或浓度的尝试。在大多数情况下,所有生物标志物的确定将成功,但偶尔一个或几个值将缺失。为了针对缺失值诱导模型稳健性,可能定义可以使用定义类别所有成员或成员子集来确定的生物标志物类别复合值。为了在实践中起作用,这要求定义的生物标志物类别的成员是至少部分冗余的。在下一步骤中,将生物标志物类别复合值与其他生物标志物值、其他生物标志物类别复合值(如果定义两个或更多类别的生物标志物)、与PCa风险相关的遗传评分、与其他特征相关的遗传评分(诸如BMI或生物标志物浓度,举两个非限制性实例)、家族史、年龄和与aPCa风险相关的其他信息载体组合成总体复合值。总体复合值最终用于估算aPCa风险。
生物标志物类别复合值的目的因此充当可以使用不完整的数据估算的中间值。假设生物标志物的定义类别包含表示为B1、B2、B3, … BN的N个不同生物标志物,所有都与生物标志物家族B相关。在该情况下,可以存在可用于计算家族B生物标志物复合值C的N种不同的模型:
C = f1(B1, B2, B3, … BN)
C = f2(B2, B3, … BN)
C = f3(B1, B3, … BN)
C = fN(B1, B2, B3, … BN-1)
其中f1()、f2() … fN()是使用生物标志物B1, … BN的值作为输入且以某种方式产生代表家族B生物标志物复合值的单一输出C的数学函数。函数f1(), … fN()的一种非限制性实例包括本讨论的线性组合。用能够对于丢失的一种单一生物标志物值的所有种类计算C的此类多重函数的集合,总体复合值的计算变得对于丢失数据不那么敏感。理解的是,当不是所有数据都存在时,C的估算值可能质量不是那么好,但仍可能足够好以用于评价PCa风险。因此,使用此类策略,只有N-1生物标志物测定必须成功,以便产生C的估算值。进一步可能开发任何数量的丢失数据的估算值,即,如果N-2生物标志物测定必须成功,则可以开发函数f()的另一集合且应用以估算C。
因此,关于PCa生物标志物,本发明涉及基于如本申请中别处定义的数据的冗余设计组合的方法。更具体地,所述方法包括测量至少部分冗余的PCa生物标志物的存在或浓度,并且其中所述PCa生物标志物中的至少一种,诸如两种,选自(i) PSA、(ii) 总PSA(tPSA)、(iii) 完整PSA (iPSA)、(iv) 游离PSA (fPSA)和(v) hK2。所述方法允许当形成生物标志物复合值时忽略PCa生物标志物(i)-(v)中的至少一种的子集。换言之,所述方法允许从关于少于生物标志物类别的所有PCa生物标志物的数据、更具体地关于所述PCa生物标志物中的至多四种的子集的数据形成生物标志物复合值。如技术人员将理解,这将等同于这样的方法,其中需要关于所述PCa生物标志物中的至多四种的子集的数据以形成所述生物标志物复合值。根据本发明的方法的优点是,当形成生物标志物复合值时,关于关于所述PCa生物标志物的子集的数据的遗漏、缺少或丢失是可以接受的。
如技术人员将理解,本发明包括:所述方法包括从关于生物标志物类别的所有生物标志物的数据形成生物标志物复合值,条件是关于所有生物标志物的数据是可用的。
在一个实施方案中,所述方法允许忽略PCa生物标志物(i) PSA、(ii)总PSA(tPSA)、(iii) 完整PSA (iPSA)、(iv)游离PSA (fPSA)和(v) hK2中的一种、两种、三种或四种的子集。换言之,所述方法允许分别从关于PCa生物标志物(i)-(v)中的四种、三种、两种或一种的子集的数据形成所述生物标志物复合值。
如本申请中较前面所提到,所述方法可以进一步包括分析PCa生物标志物的多种附加类别中的一种或每种,其中冗余设计数据的组合以形成各额外生物标志物复合值,其中PCa生物标志物的额外类别包含多于一种PCa生物标志物。所述方法允许当形成生物标志物复合值时忽略PCa生物标志物的子集。换言之,所述方法允许从关于少于额外生物标志物类别的所有PCa生物标志物的数据、诸如关于额外PCa生物标志物类别中的10%、20%、30%、40%、50%、60%、70%、80%或90%的PCa生物标志物的子集的数据形成生物标志物复合值。如技术人员将理解,本发明包括:所述方法包括从关于PCa生物标志物类别的所有PCa生物标志物的数据形成各额外生物标志物复合值,条件是关于所有PCa生物标志物的数据是可用的。
遗传风险评分(即,遗传评分,或遗传学复合值,更具体地SNP复合值)对于数据的小量丢失也是不敏感的,这是由于例如不可预见的技术问题、人为错误或任何其他意外和不常见的原因。一个snp对风险评分的贡献通常与任何其他snp是不相关的。在snp的情况下,由于各snp导致的风险变化是小的,但通过一致使用多个与状况相关的snp,对于所述状况的风险变化变得大得足以对模型性能具有影响。形成遗传评分的snp的优选数目为至少3个snp,优选10 个snp,更优选25 个snp,还更优选50 个snp,更优选,60 个snp,还更优选70个snp,还更优选80 个snp,更优选90 个snp,又更优选100 个snp,还更优选150 个snp,又更优选200 个snp,还更优选250,且还甚至更优选300个snp。这意味着,任何单一SNP对总结果的影响通常小,并且省略几个snp将通常不以任何大的方式改变总体遗传评分风险评估,即通常不以显著程度改变SNP复合值。在本领域的当前状态下,大规模遗传测量的典型数据丢失是1-2%的数量级,这意味着如果遗传评分由100个不同的snp构成,个体的典型遗传表征将提供关于这些snp中的约98-99个的信息。本模型本身,如本发明的工作中所发现,然而可以承受数据的较大损失或缺少,诸如信息的5-7%损失,或7-15%,或甚至15-30%。在该意义上,关于SNPpc的数据的组合是至少部分冗余的。
因此,还关于遗传标志物(SNP),本发明涉及基于如本申请中别处定义的数据的冗余设计组合的方法。所述方法允许当形成SNP复合值时忽略至少5%的SNPpc。换言之,所述方法允许从关于少于SNPpc类别的所有SNPpc的数据、更具体地关于所述SNPpc的至多95%的子集的数据形成所述SNPpc复合值。如技术人员将理解,这将等同于这样的方法,其中需要关于所述SNPpc的至多95%的子集的数据以形成所述SNPpc复合值。根据本发明的方法的优点是,当形成SNPpc复合值时,关于所述SNPpc的子集的数据的遗漏、缺少或丢失是可接受的。
如技术人员将理解,本发明包括:所述方法包括从关于SNPpc类别的所有SNPpc的数据形成SNPpc复合值,如果关于所有SNPpc的数据是可用的。类似地,本发明包括:所述方法包括从关于所述SNPpc的99%、98%、97%或96%的子集的数据形成SNPpc复合值。
在一个实施方案中,所述方法允许当形成SNPpc复合值时忽略所述SNPpc中的6%、7%、8%、9%、10%、15%、20%、25%或30%。换言之,所述方法允许分别从关于SNPpc中的94%、93%、92%、91%、90%、85%、80%、75%或70%的子集的数据形成所述SNPpc复合值。
数据的此类冗余设计组合的一个非限制性实例是计算与存在测量数据的各SNP相关的风险的平均值。数据的此类冗余设计组合的另一个非限制性实例是提供多个独立方程以计算复合值,一个方程用于可用于产生所述复合值的各数据子集。
如Cancer Prev Res 2010;3:611-619中公开的Robert Klein和共同作者的公开报告“Blood Biomarker Levels to Aid Discovery of Cancer-Related Single-Nucleotide Polymorphisms:Kallikreins and Prostate Cancer”(其通过引用并入本文)已经描述了用于将SNP与状况(例如PCa,或BMI>25,或血液中升高的hk2生物标志物浓度)关联的一种合适的方法。在该报告中,作者描述了他们可以如何将SNP rs2735839与(游离PSA)/(总PSA)的升高值关联。此外,他们可以将SNP rs10993994与升高的PCa风险、升高的总PSA值、升高的游离PSA值和升高的hk2值关联,并且最终将SNP rs198977与升高的PCa风险、(游离PSA)/(总PSA)的升高值和升高的hk2值关联。
在实践中,用于将SNP与状况关联的一种通用方法依赖于进入病例-对照临床试验,其比较两个大组的个体,一个健康对照组和一个病例组具有所研究的状况。对于大多数通常已知的SNP,对于各组中的所有个体进行基因分型。当所有基因分型数据可用时,研究病例组和对照组之间是否显著改变等位基因频率。在此类设置中,用于报道影响大小的典型单位是比值比。比值比报道两个比例之间的比率:病例组中具有特定等位基因的个体的比例,和对照组中具有相同等位基因的个体的比例。如果病例组中的等位基因频率显著高于对照组中的等位基因频率,则比值比将高于1。如果病例组中的等位基因频率显著低于对照组中的等位基因频率,则比值比将低于1。
如EUROPEAN UROLOGY 60 (2011) 21 – 28中公开的Markus Aly和共同作者的公开报告“Polygenic Risk Score Improves Prostate Cancer Risk Prediction:Resultsfrom the Stockholm-1 Cohort Study”(其通过引用并入本文)中已经描述了用于组合来自多个来源的信息一种优选的方法。各SNP和活组织检查时的PCa之间的关联使用Cochran-Armitage趋势检验评估。具有95%置信区间的等位基因比值比(OR)使用逻辑回归模型计算。对于每个患者,遗传风险评分通过加和每个SNP的风险等位基因的数目(0、1或2)乘以该SNP的OR的对数而生成。在逻辑回归分析中探索PCa诊断和评估的风险因素之间的关联。关于非遗传信息的模型的部分包括对数转换的总PSA、对数转换的游离PSA与总PSA比率、活组织检查时的年龄和PCa的家族史(是或否)。重复的10倍交叉验证用于估算活组织检查时PCa的预测概率。ROC-AUC值的百分之九十五置信区间使用正态近似法构建。所有报道的p值基于双侧假设。
对于区分一般前列腺癌和侵袭性前列腺癌存在许多合理的原因。在大多数情况下,前列腺癌是缓慢进展的疾病。大多数男性在生命中晚期确诊的事实意味着,被诊断为前列腺癌的大部分男性死于其他原因。因此,在活组织检查前估计个体是否处于具有侵袭性前列腺癌的升高风险的能力使得可能例如激励个体改变生活方式。戒烟、达到低于30的BMI值和定期锻炼(约30分钟,一周3-6天)是通常促进严重疾病(包括前列腺癌)的状况中存活的所有因素。因此,如果发现个体具有aPCa的升高风险,有理由建议所述个体戒烟,试图达到BMI <30且开始锻炼。另一个重要方面是膳食问题。通过改变饮食,可以减少或延迟PCa发生。如J Nutr.2013 Feb;143(2):189-96中公开的出版物“Whole milk intake isassociated with prostate cancer-specific mortality among U.S. malephysicians.”(其通过引用并入本文)中Song和共同作者所报道,有证据表明,减少的奶制品摄入可以降低PCa发作的风险。对于绿茶的摄入和大豆制品的摄入的积极影响存在类似的证据。因此,如果发现个体具有aPCa的升高风险,有理由建议所述个体减少乳制品的摄入和/或增加绿茶和基于大豆的产品的摄入。
实施例1
为了说明本发明,从STHLM2数据集提取包含215个病例(已知患有Gleason分级为7或更高的aPCa的受试者)和627个对照(已知未患有aPCa的受试者)的数据集。该STHLM2数据集已在公共领域中讨论,如网页http://sthlm2.se/上可见。总之,在2010 - 2012年期间,STHLM2研究中包括在斯德哥尔摩地区进行PSA测试的约26000人。关于以下生物标志物和SNP表征215+627=842个受试者。
生物标志物:
总前列腺特异性抗原(tPSA) [ng/mL]
完整前列腺特异性抗原(iPSA) [ng/mL]
游离前列腺特异性抗原(fPSA) [ng/mL]
人激肽释放酶2(hK2) [ng/mL]
巨噬细胞抑制细胞因子-1 (MIC-1) [ng/mL]
β-微精原蛋白(MSMB) [ng/mL]
收集对于每个受试者的背景信息,包括年龄和家族史(是或否)。年龄以年单位表示。
为了决定哪些受试者应当被转诊至活组织检查,需要预测每个测试的受试者与所述受试者具有Gleason分级为7或更高的前列腺癌的概率相关的值。这可以通过在以下预定方程中组合生物标志物的测量值而进行:
y = -0.4366579+0.0577639 *评分-0.1026622 * HK2-0.0312050 * fPSA+0.0640730 * iPSA+0.0256631 * MIC1-0.0069049 * MSMB+0.0012231 * tPSA+0.0069759*年龄
在该方程中,‘评分’此处是如Markus Aly和共同作者在EUROPEAN UROLOGY 60(2011) 21-28中出版的公开报告“Polygenic Risk Score Improves Prostate CancerRisk Prediction:Results from the Stockholm-1 Cohort Study” (其通过引用并入本文中)中所述计算的遗传评分变量,其含有本实施例中列出的经验证的前列腺癌易患性SNP(所述SNP与前列腺癌易患性相关或与PSA、游离PSA、MSMB和MIC-1生物标志物血浆水平相关)。参数‘HK2’、‘fPSA’、‘iPSA’、‘MIC1’、‘MSMB’、‘tPSA’是指这些生物标志物的分别的测量值(未转化),且‘年龄’是受试者的年龄。所述方程使用普通最小二乘估计量推导(其他线性估计量也可直接使用,例如逻辑回归估计量)。在该特定模式中,省略关于家族史的信息。
所得值‘y’将与具有Gleason分级为7或更高的前列腺癌的风险强烈相关,如图1中所示。图1中的ROC曲线代表单独的PSA(101)和本实施例中描述的模型(102)。如果y高于截止值,则男性应当被推荐转诊至泌尿科医师用于使用活组织检查检查前列腺。该模型预测侵袭性的高等级PCa的事实含蓄地意味着,如果所得值‘y’小,则仍存在患者具有PCa的风险,尽管是非侵袭性形式。小的所得值‘y’也可表明该患者不具有PCa。
截止值取决于测试灵敏度和特异性之间的折衷。如果,例如,使用0.166的截止值时,该特定测试将导致0.9的测试灵敏度和0.38的特异性。这可以与使用单独的PSA值作为筛选测试比较,这导致为0.9的灵敏度和0.22的特异性。在实践中,这意味着,该特定模型当应用于827个受试者的群体时将导致与PSA测试相同数量的检测到的高风险癌症(Gleason分级7和以上),但其中少于100个受试者被转诊至活组织检查,这对应于与单独的PSA测试相比改善约15%。如果,作为第二个实例,使用0.201的截止值时,该特定测试将导致0.8的测试灵敏度和0.52的特异性。在灵敏度水平0.8,将节省如使用PSA预测的约20%的活组织检查。
实施例2
为了进一步说明本发明,应用用于获得预测的替代计算方法。方程诸如实施例1中呈现的方程不是其中可以组合生物标志物以预测aPCa的唯一方式。事实上,用于计算y以便预测aPCa的方法可以是复杂的,并且甚至不可能在一张纸上写下。可以如何组合生物标志物的一个更复杂、但非常强大的实例是使用决策树森林。图2中描绘了决策树(200)的实例。假设81岁受试者测试生物标志物和SNP,结果为HK2 = 0.2425且PSA = 84.1。当如图2中例举应用决策树(200)时,顶节点(201)与hk2值相关。由于受试者具有HK2值,这确实满足节点条件,所以遵循从该节点的左侧分支。第二节点(202)也与hk2值相关,并且在这种情况下,受试者具有不满足节点条件的hk2值,然后遵循从该节点的右侧分支。第三水平节点(203)与年龄相关。由于受试者年龄不满足节点条件,所以遵循从该节点的右侧分支。第四水平节点(204)与PSA值相关,并且由于受试者的PSA值确实满足节点条件,所以遵循从该节点的左侧分支。在该点,不再存在更多节点,意味着已经达到决策树的叶。每叶都具有相应的输出,在该特定实例中,“1”的叶值意指“转诊至活组织检查”,且“0”的叶值意指“不转诊至活组织检查”。示例性受试者在这种情况下确实在值“0”的叶中结束,意味着由该决策树提供的预测是“不转诊至活组织检查”。
仅仅依靠一个决策树用于计算y以预测aPCa的问题是单个决策树具有非常高的方差(即如果数据稍微变化,则y的计算值也可能变化,导致aPCa的预测的方差),尽管其偏差(bias)非常低。用于降低高方差的一种可能的方法是如Leo Breiman在Machine Learning45 (1):5–32 (2001)中公开的报告"Random Forests"(其通过引用并入本文)中所述使用随机森林算法构建去相关树的森林。生长大量树,并且在每个树生长之前,以使得其预测的预期值不变的方式随机扰动数据。为了预测aPCa,所有树投票以决定受试者是否应当转诊至活组织检查。此类投票预测保留了决策树的无偏差特性,然而相当降低了方差(类似于平均值的方差如何低于用于计算平均值的个别测量值的方差)。由于随机森林算法取决于随机数目生成,所以它是以封闭形式写下所得预测算法的一种复杂程序。
当如实施例1中所述应用至数据集时,与单独的PSA相比,该模型可以以灵敏度0.9节约约20%的数量的活组织检查。
实施例3
为了甚至进一步说明本发明,从STHLM2数据集提取包含51个病例(已知患有Gleason分级为7或更高的aPCa的受试者)和195个对照(已知未患有aPCa的受试者)的数据集。所有这些病例和对照都具有大于25的BMI值。关于以下生物标志物表征51+195=246个受试者。
生物标志物:
总前列腺特异性抗原(tPSA) [ng/mL]
完整前列腺特异性抗原(iPSA) [ng/mL]
游离前列腺特异性抗原(fPSA) [ng/mL]
人激肽释放酶2(hK2) [ng/mL]
巨噬细胞抑制细胞因子-1 (MIC-1) [ng/mL]
β-微精原蛋白(MSMB) [ng/mL]。
本实施例中还应用与前面实施例1中定义相同的SNP。收集对于每个受试者的背景信息,包括所述受试者是否已经经历前列腺的先前活组织检查(prevBiop)、年龄和家族史(是或否)。年龄以年单位表示,身高以米表示,且体重以千克表示。
为了决定哪些受试者应当被转诊至活组织检查,需要预测每个测试的受试者与所述受试者具有Gleason分级为7或更高的前列腺癌的概率相关的值。这可以通过使用以下预定方程将生物标志物的测量值组合为总体复合值而进行:
y = 21.487704 + 0.548938 * prevBiop + 0.014242 * GenScore + 0.311481* hk2 -0.043471 * fPSA + 0.047176 * iPSA + 0.068407 * mic1 - 0.008860 * msmb+ 0.002693 * tPSA + 0.006325 * 年龄 - 0.121356 * 身高 + 0.119005 * 体重 -0.388930 * bmi
在该方程中,‘评分’此处是如先前实施例1中所述计算的遗传评分变量。参数‘HK2’、‘fPSA’、‘iPSA’、‘MIC1’、‘MSMB’、‘tPSA’是指这些生物标志物的分别的测量值(未转化),且‘年龄’、‘身高’、‘体重’和‘bmi’是受试者的年龄、身高、体重和bmi。参数‘prevBiops’表示受试者是否先前已经经历前列腺活组织检查,反映所述受试者的医疗史。所述方程使用普通最小二乘估计量推导(其他线性估计量也可直接使用,例如逻辑回归估计量)。在该特定模式中,省略关于家族史的信息。
所得值‘y’将与具有Gleason分级为7或更高的侵袭性前列腺癌的风险强烈相关,如图3中所示。图3中的ROC曲线代表单独的PSA(301)和本实施例中描述的模型(302)。如果y高于截止值,则男性应当被推荐转诊至泌尿科医师用于使用活组织检查检查前列腺。
截止值取决于测试灵敏度和特异性之间的折衷。如果,例如,使用0.201的截止值时,则该特定测试将导致0.8的测试灵敏度,并且该测试与使用单独的PSA相比将节约约44%的活组织检查。
实施例4
为了甚至进一步说明参数类别的方面和类别内的冗余度,关于以下表征实施例1的数据集:
生物标志物:
总前列腺特异性抗原(tPSA) [ng/mL]
完整前列腺特异性抗原(iPSA) [ng/mL]
游离前列腺特异性抗原(fPSA) [ng/mL]
人激肽释放酶2 (HK2) [ng/mL]
巨噬细胞抑制细胞因子1 (MIC-1) [ng/mL]
β-微精原蛋白(MSMB) [ng/mL]
SNP;属于与PCa相关的类别SNP(SNPpc):
收集对于每个受试者的背景信息,包括年龄和是否已经进行先前活组织检查(是或否)。年龄以年单位表示。
对于总体复合值的方程(其用作预测模型)根据预定方程设计:
Y = -0.632820 + 0.118107 * K + 0.139045 * prevBiopsy + 0.051609 * 评分 + 0.048033 * MIC1 - 0.001368 * MSMB + 0.008002 * 年龄
其中评分是遗传评分,即从与PCa相关的SNP获得的复合值(即,SNPpc复合值),如先前所述,且K是用于激肽释放酶样生物标志物的参数类别的复合值,MIC1是MIC1的浓度,MSMB是MSMB的浓度,年龄是个体的年龄,并且如果个体先前曾进行活组织检查,则PrevBiopsy为1 (并且如果不,则为0)。取决于激肽释放酶数据对于特定个体的可用性,以不同的方式计算类别激肽释放酶样生物标志物K的复合值。
K = (0.6122516 + 0.0012714 * fPSA + 0.0001864 * PSA + 0.0200385 *iPSA - 0.0377976 * HK2 - 1.3108243 f/tPSA) / 0.1559314
K' = (0.3961801 + 0.0001864 * PSA + 0.0200385 * iPSA - 0.0377976 *HK2) / 0.109478
K''' = (0.3961967 + 0. 0012714 * fPSA + 0.0200385 * iPSA - 0.0377976* HK2) / 0.1090876
K''' = (0.3987352 + 0.0200385 * iPSA - 0.0377976 * HK2) / 0.1033296
K'''' = (0.6548828 + 0.0012714 * fPSA + 0.0001864 * PSA - 1.3108243f/tPSA) / 0.1068742
在这些方程中,PSA是PSA的浓度,fPSA是游离PSA的浓度,iPSA是完整PSA的浓度,HK2是HK2的浓度,且f/tPSA是游离PSA与总PSA的商。K是适合于当所有所述激肽释放酶数据可用时使用的参数值。参数K’、K’’、K’’’和K’’’’是适合于在激肽释放酶数据中的一个或几个丢失的情况下使用的K的近似值。
当测试上面讨论的模型时,获得以下结果:
● 全模型,包括的所有数据:ROC-AUC = 0.77
● 使用所有SNP和K’近似:ROC-AUC = 0.70
● 使用所有SNP和K’’近似:ROC-AUC = 0.70
● 使用所有SNP和K’’’近似:ROC-AUC = 0.70
● 使用所有SNP和K’’’’近似:ROC-AUC = 0.75
● 使用K’’’’数据且随机离开SNP数据的10%:ROC-AUC = 0.74
● 使用K’’’’ 数据且随机离开SNP数据的30%:ROC-AUC = 0.73。
作为参考点,当仅使用PSA来预测aPCa的风险时,ROC-AUC = 0.65。因此,本实施例中的模型(a)比当使用所有数据的参考模型更好,而且(b)对于输入数据的丢失是稳健的,这是由于参数类别内的冗余性。可以省略激肽释放酶样生物标志物的一个或多个测量结果(即数据),还组合有SNP信息的10%(或甚至30%)丢失,并且仍然产生比其中已经单独使用PSA的参考模型更好的有用结果。在实际设置中,此类稳健操作使得可能估算个体具有aPCa的风险,甚至在由于技术失败、样品材料的缺乏、人为错误或任何其他原因导致丢失一些数据的情况下。这具有降低健康护理提供者的成本的潜能,因为会降低重复检测的数量。它也使得个体的状况更方便和更快速响应,并且缓解个体前往健康护理提供者以便供应进一步样品用于重新测试程序的需要。
虽然本发明已经关于其优选实施方案(其构成本发明人目前已知的最佳模式)进行描述,但是应当理解,可以进行对于本领域普通技术人员显而易见的各种变化和修改,而不脱离所附权利要求所记载的本发明的范围。

Claims (22)

1.第一类别特异性结合前列腺癌(PCa)生物标志物的配体和第二类别特异性结合与PCa相关的SNP (SNPpc)的配体在制备用于基于用于指示个体中侵袭性PCa的存在或不存在的数据的冗余设计组合的方法的试剂盒中的用途,其中所述方法包括以下步骤:
1.提供来自所述个体的至少一种生物样品;
2.在所述生物样品中,分析
a. 一类PCa生物标志物,其通过测量至少三种激肽释放酶样PCa生物标志物中每种的存在或浓度而实施;和
b. 一类SNPpc,其通过测量所述类别的SNPpc的至少80种SNPpc中每种的存在或不存在而实施;
3.组合关于至少三种激肽释放酶样PCa生物标志物的数据,以形成代表与PCa生物标志物相关的发生PCa风险的生物标志物复合值,其中所述方法允许当形成所述生物标志物复合值时忽略所述PCa生物标志物子集的数据,其中当形成至少三种PCa生物标志物的所述生物标志物复合值时,所述子集包含至少一种激肽释放酶样PCa生物标志物;
4.组合关于所述类别的SNPpc的数据,以形成代表与SNPpc相关的发生PCa风险的SNPpc复合值,其中所述方法允许当形成SNPpc复合值时忽略SNPpc类别的SNPpc的10%且高至30%的子集的数据;
5.组合所述生物标志物复合值和所述SNPpc复合值,以形成总体复合值;
6.通过将所述总体复合值与用已知存在侵袭性PCa和不存在侵袭性PCa的对照样品建立的预定的截止值进行比较而将所述总体复合值与所述个体中侵袭性PCa的存在或不存在相关联。
2.权利要求1的用途,其中在所述方法的步骤4中,所述方法允许当形成SNPpc复合值时忽略SNPpc类别的SNPpc的15%、20%或30%的子集的数据。
3.权利要求1的用途,其中所述方法进一步包括使用第一类别能够检测前列腺癌(PCa)生物标志物的检测分子和第二类别能够检测与PCa相关的SNP (SNPpc)的检测分子。
4.权利要求1-3中任一项的用途,其中所述方法的步骤2(a)包括测量至少部分冗余的激肽释放酶样PCa生物标志物的存在或浓度,并且其中所述PCa生物标志物中的至少一种选自(i) PSA、(ii) 总PSA (tPSA)、(iii) 完整PSA (iPSA)、(iv) 游离PSA (fPSA)和(v)hK2。
5.权利要求4的用途,其中所述方法允许当形成所述生物标志物复合值时忽略PCa生物标志物类别的所述PCa生物标志物(i)-(v)中的至少一种的子集。
6.权利要求5的用途,其中所述方法允许当形成所述生物标志物复合值时忽略PCa生物标志物类别的所述PCa生物标志物(i)-(v)中的一种、两种、三种或四种的子集。
7.前述权利要求中任一项的用途,其中根据预定方程组合关于PCa生物标志物的所述类别的数据以形成所述生物标志物复合值。
8.前述权利要求中任一项的用途,其中根据预定方程组合关于SNPpc的所述类别的数据以形成所述SNPpc复合值。
9.前述权利要求中任一项的用途,其中根据预定方程组合所述生物标志物复合值和所述SNPpc复合值以形成所述总体复合值。
10.前述权利要求中任一项的用途,其中所述方法进一步包括,如果总体复合值大于截止值,则推荐所述个体进行活组织检查。
11.前述权利要求中任一项的用途,其中所述方法进一步包括,如果总体复合值大于截止值,则推荐所述个体改变饮食习惯、减肥、达到低于30的BMI值、定期锻炼和/或停止吸烟。
12.前述权利要求中任一项的用途,其中所述至少80种SNP选自657del5、rs10086908、rs1016343、rs10187424、rs1041449、rs10486567、rs1054564、rs10875943、rs10896449、rs10934853、rs10993994、rs11067228、rs11135910、rs11228565、rs11568818、rs11649743、rs11650494、rs11672691、rs11704416、rs12130132、rs12409639、rs12418451、rs12500426、rs12543663、rs12621278、rs12653946、rs1270884、rs130067、rs13252298、rs13385191、rs1354774、rs1363120、rs137853007、rs138213197、rs1447295、rs1465618、rs1512268、rs1571801、rs16901979、rs16902094、rs17021918、rs17632542、rs17879961、rs1859962、rs1894292、rs1933488、rs1983891、rs2018334、rs2121875、rs2242652、rs2273669、rs2292884、rs2405942、rs2660753、rs2735839、rs2736098、rs2928679、rs3213764、rs339331、rs3771570、rs3850699、rs3863641、rs401681、rs4245739、rs4430796、rs445114、rs4643253、rs4857841、rs4962416、rs5759167、rs5919432、rs5945619、rs6062509、rs620861、rs6465657、rs6763931、rs684232、rs6869841、rs6983267、rs6983561、rs7127900、rs7210100、rs721048、rs7241993、rs7611694、rs7679673、rs7931342、rs8008270、rs8102476、rs888663、rs902774、rs9364554、rs9600079和rs9623117。
13.权利要求1-11中任一项的用途,其中所述至少80种SNP选自rs582598、rs439378、rs2207790、rs1046011、rs10458360、rs7525167、rs10489871、rs7529518、rs4245739、rs4512641、rs10178804、rs11900952、rs1873555、rs10191478、rs6755901、rs6545962、rs721048、rs2710647、rs12612891、rs2028900、rs1009、rs12233245、rs6760417、rs10496470、rs10199796、rs12475433、rs16860513、rs12151618、rs3765065、rs13017302、rs12988652、rs871688、rs749264、rs3771570、rs4346531、rs6770955、rs12637074、rs2660753、rs13319878、rs6437715、rs2162185、rs1515542、rs2270785、rs9830294、rs1439024、rs6762443、rs888507、rs6794467、rs12490248、rs1477886、rs4833103、rs3796547、rs17779822、rs2366711、rs16849146、rs1894292、rs12640320、rs3805284、rs12500426、rs4699312、rs17021918、rs7679673、rs2047408、rs2647262、rs12506850、rs7658048、rs2078277、rs12505546、rs13113975、rs4246742、 rs2736098、rs401681、rs11134144、rs10060513、rs40485、rs2087724、rs1482679、rs16901841、rs1295683、rs2070874、rs7752029、rs2018334、rs9358913、rs1140809、rs409558、rs3096702、rs9267911、rs2025645、rs9359428、rs6569371、rs2813532、rs1933488、rs712242、rs6934898、rs9456490、rs651164、rs3120137、rs9364554、rs9457937、rs10486562、rs10807843、rs7801918、rs6962297、rs2465796、rs6957416、rs7777631、rs2272316、rs6961773、rs2132276、rs13265330、rs16887736、rs2911756、rs2272668、rs2339654、rs1380862、rs9297746、rs12543663、rs10086908、rs16901922、rs1016343、rs17832285、rs16901979、rs4871779、rs10107982、rs16902094、rs620861、rs17467139、rs6983267、rs9297756、rs10094059、rs7818556、rs1992833、rs986472、rs12552397、rs4273907、rs4237185、rs753032、rs11253002、rs2386841、rs10795841、rs10508422、rs7075945、rs10508678、rs539357、rs10826398、rs3818714、rs7090755、rs10993994、rs4382847、rs1891158、rs10887926、rs10788160、rs6579002、rs10832514、rs7358335、rs1944047、rs3019779、rs10896437、rs12793759、rs7106762、rs7102758、rs2449600、rs585197、rs2509867、rs11568818、rs7125415、rs11601037、rs11222496、rs4570588、rs6489721、rs3213764、rs17395631、rs4423250、rs11168936、rs10875943、rs3759129、rs902774、rs1827611、rs4760442、rs11610799、rs6539333、rs11067228、rs7485441、rs6489794、rs4119478、rs17070292、rs2293710、rs17256058、rs1950198、rs2331780、rs7141529、rs12880777、rs17123359、rs785437、rs524908、rs12903579、rs7178085、rs7164364、rs896615、rs11634741、rs9972541、rs12594014、rs11631109、rs1558902、rs8044335、rs2738571、rs885479、rs385894、rs684232、rs4925094、rs17138478、rs11649743、rs2107131、rs7213769、rs12946864、rs306801、rs138213197、rs1863610、rs17224342、rs9911515、rs12947919、rs966304、rs17744022、rs7234917、rs1943821、rs2227270、rs1363120、rs888663、rs1227732、rs1054564、rs4806120、rs11672691、rs758643、rs3745233、rs6509345、rs2659051、rs2735839、rs1354774、rs2691274、rs6090461、rs2297434、rs6062509、rs2315654、rs2823118、rs2838053、rs398146、rs16988279、rs2269640、rs4822763、rs132774、rs747745、rs5978944、rs6530238、rs5934705、rs5935063、rs4830488、rs17318620、rs5945619、rs5945637、rs11091768、rs2473057、rs5918762、rs4844228、 rs6625760和rs17324573。
14.前述权利要求中任一项的用途,其中所述方法进一步包括从所述个体收集关于PCa的家族史、治疗史和身体数据;且其中将所述家族史、治疗史和/或身体数据包括在形成所述总体复合值的组合数据中。
15.权利要求4-14中任一项的用途,其中所述方法进一步包括通过测量额外生物标志物类别的多种PCa生物标志物中的一种或每种的存在或浓度而分析所述额外类别的PCa生物标志物;组合关于所述额外PCa生物标志物类别的数据以形成所述额外PCa生物标志物类别的额外生物标志物复合值;并且在总体组合值中包括所述额外生物标志物复合值;其中冗余设计数据的组合以形成额外生物标志物复合值,其中额外类别的PCa生物标志物包含多于一种PCa生物标志物,优选地,其中额外类别的PCa生物标志物包含生物标志物MIC-1和任选其他MIC-1相关的生物标志物,或生物标志物MSMB和任选其他MSMB相关生物标志物。
16.前述权利要求中任一项的用途,其中所述个体具有大于25的BMI值。
17.前述权利要求中任一项的用途,其中所述SNP的存在或不存在的测量通过使用MALDI质谱进行。
18.前述权利要求中任一项的用途,其中所述PCa生物标志物的存在或浓度的测量通过使用微阵列技术进行。
19.测定装置,所述测定装置包含具有固定在其上的至少两种不同类别的配体的固相,其中:
- 所述配体的第一类别特异性结合PCa生物标志物,并且包括特异性结合多种不同PCa生物标志物中的每一种,包括至少三种激肽释放酶样PCa生物标志物,其至少一种为PSA、iPSA、tPSA、fPSA或hK2和任选包括MSMB和/或MIC-1的多种不同配体;且
- 所述配体的第二类别特异性结合至少80种SNP,并且包括特异性结合所述SNP中的每一种的多种不同配体,其中所述SNP选自权利要求12或13的SNP列表。
20.测试试剂盒,所述测试试剂盒包含根据权利要求19的测定装置和至少两类检测分子,其中:
- 所述检测分子的第一类别能够检测PCa生物标志物,包括至少三种激肽释放酶样PCa生物标志物,其至少一种为PSA、iPSA、tPSA、fPSA或hK2和任选包括MSMB和/或MIC-1;且
- 所述检测分子的第二类别能够检测至少80种SNP,其中所述SNP选自权利要求12或13的SNP列表。
21.用于基于数据的冗余设计组合指示个体中侵袭性前列腺癌(PCa)的存在或不存在的装置,其特征在于所述装置至少包括:
1)构件,所述构件用于组合关于至少三种激肽释放酶样PCa生物标志物的数据,以形成代表与PCa生物标志物相关的发生PCa风险的生物标志物复合值,其中所述构件允许当形成所述生物标志物复合值时忽略所述PCa生物标志物子集的数据,其中当形成至少三种PCa生物标志物的所述生物标志物复合值时,所述子集包含至少一种激肽释放酶样PCa生物标志物;
2)构件,所述构件用于组合关于与PCa相关的SNP (SNPpc)的类别的数据,以形成代表与SNPpc相关的发生PCa风险的SNPpc复合值,其中所述构件允许当形成SNPpc复合值时忽略SNPpc类别的SNPpc的10%且高至30%的子集的数据;
3)构件,所述构件用于组合所述生物标志物复合值和所述SNPpc复合值,以形成总体复合值。
22.权利要求21的装置,其中所述构件2)允许当形成SNPpc复合值时忽略SNPpc类别的SNPpc的15%、20%或30%的子集的数据。
CN201380069472.6A 2012-11-20 2013-11-20 用于指示侵袭性前列腺癌的存在或不存在的方法 Expired - Fee Related CN105051206B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
SE1251312 2012-11-20
SE1251312-3 2012-11-20
SE1350600-1 2013-05-16
SE1350600 2013-05-16
PCT/EP2013/074259 WO2014079865A1 (en) 2012-11-20 2013-11-20 Method for indicating a presence or non-presence of aggressive prostate cancer

Publications (2)

Publication Number Publication Date
CN105051206A CN105051206A (zh) 2015-11-11
CN105051206B true CN105051206B (zh) 2016-11-30

Family

ID=

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010012823A1 (fr) * 2008-08-01 2010-02-04 Commissariat A L'energie Atomique Procede de prediction pour le depistage, le pronostic, le diagnostic ou la reponse therapeutique du cancer de la prostate et dispositif permettant la mise en oeuvre du procede
WO2010081240A1 (en) * 2009-01-19 2010-07-22 Miraculins Inc. Diagnostic assays for prostate cancer using psp94 and psa biomarkers
WO2012031207A3 (en) * 2010-09-03 2012-06-14 Wake Forest University Health Sciences Methods and compositions for correlating genetic markers with prostate cancer risk

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010012823A1 (fr) * 2008-08-01 2010-02-04 Commissariat A L'energie Atomique Procede de prediction pour le depistage, le pronostic, le diagnostic ou la reponse therapeutique du cancer de la prostate et dispositif permettant la mise en oeuvre du procede
WO2010081240A1 (en) * 2009-01-19 2010-07-22 Miraculins Inc. Diagnostic assays for prostate cancer using psp94 and psa biomarkers
WO2012031207A3 (en) * 2010-09-03 2012-06-14 Wake Forest University Health Sciences Methods and compositions for correlating genetic markers with prostate cancer risk

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Polygenic risk score improves prostate cancer risk prediction: results from the stockholm-1 cohort study;MARKUS ALY et al;《EUROPEAN UROLOGY》;20110111;第60卷(第1期);全文 *

Similar Documents

Publication Publication Date Title
AU2013349801B2 (en) Method for indicating a presence or non-presence of aggressive prostate cancer
RU2720148C9 (ru) Способ обнаружения солидной злокачественной опухоли
US20200010912A1 (en) Prognostic method for individuals with prostate cancer
US20150094221A1 (en) Method for Indicating the Presence or Non-Presence of Prostate Cancer
JP2022179483A (ja) 特定の特徴を有する個体において前立腺癌の存在または不存在を示すための方法
CN105051206B (zh) 用于指示侵袭性前列腺癌的存在或不存在的方法
HK1215594B (zh) 用於指示侵袭性前列腺癌的存在或不存在的方法

Legal Events

Date Code Title Description
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20161130