CN118374600B - 引物组、试剂盒、用于诊断胃肠道肿瘤的装置及存储介质 - Google Patents
引物组、试剂盒、用于诊断胃肠道肿瘤的装置及存储介质 Download PDFInfo
- Publication number
- CN118374600B CN118374600B CN202410789057.8A CN202410789057A CN118374600B CN 118374600 B CN118374600 B CN 118374600B CN 202410789057 A CN202410789057 A CN 202410789057A CN 118374600 B CN118374600 B CN 118374600B
- Authority
- CN
- China
- Prior art keywords
- gene
- seq
- probe
- model
- genes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6858—Allele-specific amplification
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
- G16B25/20—Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/10—Signal processing, e.g. from mass spectrometry [MS] or from PCR
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/154—Methylation markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/16—Primer sets for multiplex assays
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/166—Oligonucleotides used as internal standards, controls or normalisation probes
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/27—Regression, e.g. linear or logistic regression
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Organic Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medical Informatics (AREA)
- Biotechnology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Wood Science & Technology (AREA)
- Molecular Biology (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Analytical Chemistry (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Immunology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Pathology (AREA)
- Evolutionary Computation (AREA)
- Epidemiology (AREA)
- Databases & Information Systems (AREA)
- Microbiology (AREA)
- Bioethics (AREA)
- Public Health (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Hospice & Palliative Care (AREA)
- Oncology (AREA)
- Signal Processing (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明提供一种引物组、试剂盒、用于诊断胃肠道肿瘤的装置及存储介质,属于生物信息学技术领域,包括第一引物,所述第一引物如SEQ ID No:1和SEQ ID No:3所示;第二引物,所述第二引物选择下述至少两组:第一组引物如SEQ ID No:4和SEQ ID No:6所示、第二组引物如SEQ ID No:10和SEQ ID No:12所示、第三组引物如SEQ ID No:16和SEQ ID No:18所示、第四组引物如SEQ ID No:13和SEQ ID No:15所示、第五组引物如SEQ ID No:19和SEQ ID No:21。通过选择特定的基因和基因序列实现对胃肠道肿瘤的高灵敏度和特异性检测。
Description
技术领域
本发明属于生物信息学技术领域,具体涉及引物组、试剂盒、用于诊断胃肠道肿瘤的装置及存储介质。
背景技术
胃肠道恶性肿瘤是最常见的消化系统肿瘤,其高发病率和高死亡率严重威胁着民众的健康。胃癌和结直肠癌是最常见的消化道恶性肿瘤,胃癌发病率和死亡率分列癌症第5和第3位,而结直肠癌则分别高居第2和第4位,且近85%患者在确诊时属于中晚期。
胃镜和肠镜是公认的诊断胃癌和结直肠癌的金标准,但资源分配有限且胃镜和肠镜是有创检查,患者依从性较差,难以实现大规模筛查。而传统消化道肿瘤标志物包括CEA、CA19-9、CA72-4,综合国内外报道和临床实际情况发现灵敏度普遍较低,如CEA在胃癌中的灵敏度低于30%,CA19-9对胃癌诊断的灵敏度约20%,即使联合CA19-9、CA72-4和CEA检测,其对于胃癌诊断的灵敏度也仅能达到48.2%。结直肠癌筛查以粪便隐血检测为主,若为阳性,再进行结肠镜检查。基于抗体的免疫化学法粪便隐血检测(fecal immunochemical test,FIT)对结直肠癌的灵敏度虽然能够达到79%,但仍有较大的漏检风险。且粪便样本在采集时受检者体验感不佳,普遍存在依从性较差的问题,综合国内外报道和临床实际情况发现,在接受无创筛查的人群中,80%以上的受检者选择血液检测,仅有不到20%的受检者选择粪便检测。因此,鉴于胃肠镜的有创性、传统肿瘤标志物和FIT灵敏度不足以及结直肠癌筛查使用粪便样本面临的依从性差等问题,需要迫切研发新的胃肠道恶性肿瘤标志物。
人的体液样本中含有来自于不同组织(包括肿瘤)的无细胞DNA(cfDNA)、蛋白质、细胞、囊泡(如外泌体)等各种成分,液体活检就是一种从体液样本中检测疾病相关信号标志物的非侵入性技术,目前最常用的是检测血液中的cfDNA,被麻省理工科技综述杂志(MITTechnology Review)评为2015年度十大突破技术之一。相比传统的胃肠镜检测,液体活检技术侵入性和副作用都要小得多,患者依从性大大提高;而与传统肿瘤标志物和FIT等常规检查相比,其又具有高灵敏度和高特异性的特点,极大地避免漏检和误诊给患者带来的额外负担,具有无创、实时、前瞻和高灵敏等优点,非常适合用于辅助临床肿瘤的早期筛查与诊断。
DNA或基因甲基化是一种重要的表观遗传学标记信息,甲基化水平的改变会影响基因的表达;基因甲基化异常主要包括抑癌基因的高甲基化和原癌基因的低甲基化;若抑癌基因启动子区域发生高甲基化,则抑癌基因的表达受到抑制,会使细胞停留在低分化增殖阶段,进而可能导致正常细胞发生癌变;同理,若原癌基因启动子区域发生低甲基化,则原癌基因会被激活,同样会使细胞停留在低分化增殖阶段,进而可能导致正常细胞发生癌变。在胃肠道恶性肿瘤发生过程中,DNA甲基化水平改变是一个非常早期的事件,该变化早于驱动基因的突变。且由于甲基化过程具有组织特异性及较高的检测丰度,同时不受年龄影响,因此为胃肠道恶性肿瘤早期诊断提供了新的筛查窗口。
发明内容
为解决上述问题,本发明提供一种引物组、试剂盒、用于诊断胃肠道肿瘤的装置及存储介质。通过选择特定的基因和基因序列实现对胃肠道肿瘤的高灵敏度和特异性检测。
为了实现上述目的,本发明所采用的技术方案如下:
一种引物组,所述引物组用于检测生物标志物,所述生物标志物包括SPN基因目的区域的甲基化位点和CNRIP1、GDNF、TFPI2、ITGA4、ZNF304中的至少两个基因目的区域的甲基化位点;以hg19为参考基因组,所述SPN基因目的区域选自chr16:29675824-29675917,所述CNRIP1基因目的区域选自chr2:68546535-68546605,所述GDNF基因目的区域选自chr5:37840060-37840160,所述TFPI2基因目的区域选自chr7:93520070-93520146,所述ITGA4基因目的区域选自chr2:182321974-182322059,所述ZNF304基因目的区域选择chr19:57862558-57862660;所述引物组包括:第一引物,所述第一引物如SEQ ID No:1和SEQ IDNo:3所示;第二引物,所述第二引物选择下述至少两组:第一组引物如SEQ ID No:4和SEQID No:6所示、第二组引物如SEQ ID No:10和SEQ ID No:12所示、第三组引物如SEQ ID No:16和SEQ ID No:18所示、第四组引物如SEQ ID No:13和SEQ ID No:15所示、第五组引物如SEQ ID No:19和SEQ ID No:21。
本发明还提供了一种试剂盒,所述试剂盒用于检测生物标志物,所述生物标志物包括SPN基因目的区域的甲基化位点和CNRIP1、GDNF、TFPI2、ITGA4、ZNF304中的至少两个基因目的区域的甲基化位点;以hg19为参考基因组,所述SPN基因目的区域选自chr16:29675824-29675917,所述CNRIP1基因目的区域选自chr2:68546535-68546605,所述GDNF基因目的区域选自chr5:37840060-37840160,所述TFPI2基因目的区域选自chr7:93520070-93520146,所述ITGA4基因目的区域选自chr2:182321974-182322059,所述ZNF304基因目的区域选择chr19:57862558-57862660;所述试剂盒包括:探针组以及上述引物组。
进一步的,所述探针组包括:第一探针,所述第一探针如SEQ ID No:2所示;第二探针,所述第二探针选择下述至少两种:第一种探针如SEQ ID No:5所示、第二种探针如SEQID No:11所示、第三种探针如SEQ ID No:17所示、第四种探针如SEQ ID No:14所示、第五种探针如SEQ ID No:20所示;所述引物组与探针组的选择适配:第一探针与第一引物适配,第一种探针与第一组引物适配,第二种探针与第二组引物适配,第三种探针与第三组引物适配,第四种探针与第四组引物适配,第五种探针与第五组引物适配。
进一步的,所述第一探针和第二探针的5’端标记有第一荧光报告基团,3’端标记有BHQ1荧光淬灭基团。
进一步的,所述试剂盒还包括下列至少一种:样本收集容器、DNA提取试剂,甲基化转化试剂、荧光定量PCR检测试剂、检测GAPDH基因的引物和检测GAPDH基因的探针。
进一步的,所述检测GAPDH基因的探针的5’端标记有VIC荧光报告基团,3’端标记有BHQ1荧光淬灭基团。
进一步的,所述GAPDH基因的引物如SEQ ID No:7和SEQ ID No:9所示;所述GAPDH基因的探针如SEQ ID No:8所示。
本发明还提供了一种用于诊断胃肠道肿瘤的装置,包括:检测单元,所述检测单元用于检测生物标志物中甲基化水平,得到检测结果;分析单元,所述分析单元用于针对所述检测结果诊断胃肠道肿瘤;所述生物标志物包括SPN基因目的区域的甲基化位点和CNRIP1、GDNF、TFPI2、ITGA4、ZNF304中的至少两个基因目的区域的甲基化位点;以hg19为参考基因组,所述SPN基因目的区域选自chr16:29675824-29675917,所述CNRIP1基因目的区域选自chr2:68546535-68546605,所述GDNF基因目的区域选自chr5:37840060-37840160,所述TFPI2基因目的区域选自chr7:93520070-93520146,所述ITGA4基因目的区域选自chr2:182321974-182322059,所述ZNF304基因目的区域选择chr19:57862558-57862660。
进一步的,所述检测单元包括荧光定量PCR仪。
进一步的,所述分析单元根据SPN基因ΔCt值以及其他至少两种基因所建立的模型进行判读,判断是否患有胃肠道肿瘤;其中ΔCt值为相应基因Ct值减去内参基因Ct值;若某基因扩增曲线不成S型或Ct值为空白,则所述某基因的Ct值为45。
进一步的,所述模型的输入包括年龄和所述至少两种基因的ΔCt值。
进一步的,所述模型采用随机森林算法或逻辑回归算法,将数据集划分为训练集和验证集,采用训练集对所述模型进行训练,所述验证集用于验证模型的准确性。
进一步的,当SPN基因的ΔCt不大于2.61,则可判定结果为阳性;当SPN基因的ΔCt大于2.61,采用逻辑回归的方式进行拟合,得到模型公式,并计算阈值;相应模型分数不小于所述阈值时,则判定结果为阳性,反之为阴性。
进一步的,基于CNRIP1和GDNF基因的ΔCt构建模型时,采用逻辑回归算法得到模型为:
G3Mscan=34.70281-0.23476Age-1.02096ΔCt(CNRIP1)-0.34176ΔCt(GDNF),当G3Mscan不小于-1.257,则判断结果为阳性,反之为阴性;
基于ITGA4、TFPI2和ZNF304基因的ΔCt构建模型时,采用逻辑回归算法得到模型为:
G4Mscan=26.99644-0.12047Age-0.93628ΔCt(ITGA4)-0.15256ΔCt(TFPI2)-0.21633ΔCt(ZNF304),当G4Mscan不小于-1.083,则判断结果为阳性,反之为阴性;
基于ITGA4、CNRIP1、TFPI2、GDNF和ZNF304基因的ΔCt构建模型时,采用逻辑回归算法得到模型为:
G6Mscan=37.44462-0.26821Age+0.11936ΔCt(ITGA4)-1.51298ΔCt(CNRIP1)+0.57912ΔCt(TFPI2)-0.40047ΔCt(GDNF)-0.17587ΔCt(ZNF304),当G6Mscan不小于-1.174,则判断结果为阳性,反之为阴性。
本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现基于生物样本中生物标志物中甲基化水平诊断胃肠道肿瘤;所述生物标志物包括SPN基因目的区域的甲基化位点和CNRIP1、GDNF、TFPI2、ITGA4、ZNF304中的至少两个基因目的区域的甲基化位点;以hg19为参考基因组,所述SPN基因目的区域选自chr16:29675824-29675917,所述CNRIP1基因目的区域选自chr2:68546535-68546605,所述GDNF基因目的区域选自chr5:37840060-37840160,所述TFPI2基因目的区域选自chr7:93520070-93520146,所述ITGA4基因目的区域选自chr2:182321974-182322059,所述ZNF304基因目的区域选择chr19:57862558-57862660。
进一步的,根据SPN基因ΔCt值以及其他至少两种基因所建立的模型进行判读,判断是否患有胃肠道肿瘤;其中ΔCt值为相应基因Ct值减去内参基因Ct值;若某基因扩增曲线不成S型或Ct值为空白,则所述某基因的Ct值为45。
进一步的,所述模型的输入包括年龄和所述至少两种基因的ΔCt值。
进一步的,当SPN基因的ΔCt大于2.61,采用逻辑回归的方式进行拟合,得到模型公式,并计算阈值;相应模型分数不小于所述阈值时,则判定结果为阳性,反之为阴性。
进一步的,基于CNRIP1和GDNF基因的ΔCt构建模型时,采用逻辑回归算法得到模型为:
G3Mscan=34.70281-0.23476Age-1.02096ΔCt(CNRIP1)-0.34176ΔCt(GDNF),当G3Mscan不小于-1.257,则判断结果为阳性,反之为阴性;
基于ITGA4、TFPI2和ZNF304基因的ΔCt构建模型时,采用逻辑回归算法得到模型为:
G4Mscan=26.99644-0.12047Age-0.93628ΔCt(ITGA4)-0.15256ΔCt(TFPI2)-0.21633ΔCt(ZNF304),当G4Mscan不小于-1.083,则判断结果为阳性,反之为阴性;
基于ITGA4、CNRIP1、TFPI2、GDNF和ZNF304基因的ΔCt构建模型时,采用逻辑回归算法得到模型为:
G6Mscan=37.44462-0.26821Age+0.11936ΔCt(ITGA4)-1.51298ΔCt(CNRIP1)+0.57912ΔCt(TFPI2)-0.40047ΔCt(GDNF)-0.17587ΔCt(ZNF304),当G6Mscan不小于-1.174,则判断结果为阳性,反之为阴性。
本发明实施例提供的技术方案带来的有益效果包括:
(1)本发明通过检测SPN基因和CNRIP1、GDNF、TFPI2、ITGA4和ZNF304中至少两种基因甲基化水平可以实现胃肠道肿瘤的诊断,有效降低胃肠道肿瘤的病死率。
(2)本发明通过血液样本检测SPN基因和ITGA4、CNRIP1、TFPI2、GDNF和ZNF304中至少两种基因甲基化水平的方法,患者依从性高。
(3)本发明设计了特异性的引物和探针,采用联合检测SPN基因和ITGA4、CNRIP1、TFPI2、GDNF和ZNF304中至少两种基因甲基化的方法,极大地提高了检测准确性、灵敏度和特异性,且本申请的胃肠道肿瘤的判定方法相较于现有技术,大大降低了检测难度,提高了检测效率。
(4)本发明采用的胃肠道肿瘤靶基因中,SPN基因和ITGA4、CNRIP1、TFPI2、GDNF和ZNF304中至少两种基因探针采用第一荧光报告基团进行标记,对照GAPDH基因探针采用VIC标记,可实现多重单管检测,相比单重检测,减少试剂消耗,降低耗材成本,减少实验人员操作步骤,降低实验错误率。
(5)受限于设备的检测通量,本申请最多可以将上述四个基因的引物和探针加入同一反应管中,满足在检测结果准确度要求的前提下,提高了检测效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例1所提供的G3Mscan模型在训练集和验证集中的ROC曲线;
图2为本发明实施例2所提供的G4Mscan模型在训练集和验证集中的ROC曲线;
图3为本发明实施例3所提供的G6Mscan模型在训练集和验证集中的ROC曲线。
具体实施方式
下面通过具体实施方式对本发明作进一步详细说明。但本领域技术人员将会理解,下列实施例仅用于说明本发明,而不应视为限定本发明的范围。实施例中未注明具体技术或条件者,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品。
本文使用的词语“包括”、“包含”、“具有”或其任何其他变体意欲涵盖非排它性的包括。例如,包括列出要素的工艺、方法、物品或设备不必受限于那些要素,而是可以包括其他没有明确列出或属于这种工艺、方法、物品或设备固有的要素。除非上下文明确规定,否则单数形式“一个/种”和“所述(该)”包括复数个讨论对象。
本发明提出了引物组、试剂盒、用于诊断胃肠道肿瘤的装置及存储介质,下面将分别对其进行详细描述。
本发明的第一方面提供了一种引物组,其特征在于,所述引物组用于检测生物标志物,所述生物标志物包括SPN基因目的区域的甲基化位点和CNRIP1、GDNF、TFPI2、ITGA4、ZNF304中的至少两个基因目的区域的甲基化位点;以hg19为参考基因组,所述SPN基因目的区域选自chr16:29675824-29675917,所述CNRIP1基因目的区域选自chr2:68546535-68546605,所述GDNF基因目的区域选自chr5:37840060-37840160,所述TFPI2基因目的区域选自chr7:93520070-93520146,所述ITGA4基因目的区域选自chr2:182321974-182322059,所述ZNF304基因目的区域选择chr19:57862558-57862660;所述引物组包括:第一引物,所述第一引物如SEQ ID No:1和SEQ ID No:3所示;第二引物,所述第二引物选择下述至少两组:第一组引物如SEQ ID No:4和SEQ ID No:6所示、第二组引物如SEQ ID No:10和SEQ IDNo:12所示、第三组引物如SEQ ID No:16和SEQ ID No:18所示、第四组引物如SEQ ID No:13和SEQ ID No:15所示、第五组引物如SEQ ID No:19和SEQ ID No:21。本申请的发明人发现,SPN基因与胃肠道肿瘤患病显著相关,该基因甲基化位点的甲基化程度与胃肠道肿瘤的发生有较强的相关性,且目前尚未发现将SPN基因在胃肠道肿瘤检测方面的相关研究,本发明首次将SPN基因作为胃肠道肿瘤检测的生物标志物。但采用单一的SPN基因作为胃肠道肿瘤检测的生物标志物存在相应的问题,如当SPN的ΔCt值不大于预设值,则可以直接判定为阳性,而ΔCt值大于预设值,则判定得到的结果准确度差、灵敏度和特异性无法达到要求,基于上述考虑本申请的发明人通过研究发现采用CNRIP1、GDNF、TFPI2、ITGA4、ZNF304中的至少两个基因与SPN基因配合可以同时实现准确性高、灵敏度高和特异性高的特点;上述引物特异性地识别和结合前述目的区域的甲基化位点,进而通过甲基化位点的甲基化水平进行检测,可以实现准确诊断胃肠道肿瘤的目的。
需要指出的是,本申请中的SPN、CNRIP1、GDNF和ITGA4基因的目的区域为DNA正链,TFPI2和ZNF304基因的目的区域为DNA负链。
SPN-F :GTTGTGTTTGTGGTTTTGTTGGC (SEQ ID No:1)
SPN-R :ACACGAAAACCCCAATCCG (SEQ ID No:3)
CNRIP1-F :TTCGGTAGGTTTTTTATGTTTGGGC (SEQ ID No:4)
CNRIP1-R :AACCGACGCTATCCTCCG(SEQ ID No:6)
GDNF-F :TTTTGTTTGGAGATTCGAACGAGATATTAC (SEQ ID No:10)
GDNF-R :CCGAACTCTAAAAAACCAACCTACG (SEQ ID No:12)
ITGA4-F :GGGAGGTTCGGGTTAGGAC (SEQ ID No:13)
ITGA4-R :CGAACTCCGTCTCTACCTACG (SEQ ID No:15)
TFPI2-F :AGTTATTTTTTAGGTTTCGTTTCGGC (SEQ ID No:16)
TFPI2-R :CAAACGACCCGAATACCCG (SEQ ID No:18)
ZNF304-F :GGATCGGGTATAGGAAAAATACGTTAC (SEQ ID No:19)
ZNF304-R :CAACCAATAACAACCCAAAAACTAAACG (SEQ ID No:21)
本发明另一方面还提供了一种试剂盒,根据本发明实施例,试剂盒用于检测前述生物标志物,所述试剂盒包括探针组和前述引物组,由此,利用本发明的试剂盒检测SPN基因和CNRIP1、GDNF、TFPI2、ITGA4、ZNF304中至少两个基因的甲基化程度以诊断胃肠道肿瘤。
所述探针组包括:第一探针,所述第一探针如SEQ ID No:2所示;第二探针,所述第二探针选择下述至少两种:第一种探针如SEQ ID No:5所示、第二种探针如SEQ ID No:11所示、第三种探针如SEQ ID No:17所示、第四种探针如SEQ ID No:14所示、第五种探针如SEQID No:20所示;
所述引物组与探针组的选择适配:第一探针与第一引物适配,第一种探针与第一组引物适配,第二种探针与第二组引物适配,第三种探针与第三组引物适配,第四种探针与第四组引物适配,第五种探针与第五组引物适配。适配为所述探针与引物配合对单个基因目的区域的甲基化程度进行测量,如第一探针与第一引物适配可以对SPN基因目的区域的甲基化程度进行测量,如第一种探针和第一组引物适配可以对CNRIP1基因目的区域的甲基化程度进行测量,类似的,第二种探针与第二组引物针对GDNF基因,第三种探针与第三组引物针对TFPI2基因,第四种探针与第四组引物针对ITGA4基因,第五种探针与第五组引物针对ZNF304基因。
所述第一探针和第二探针的5’端标记有第一荧光报告基团,3’端标记有BHQ1荧光淬灭基团。需要指出的是,所述第一荧光报告基团可以为FAM、Cy5、ROX、TAMRA中的一种或多种,所述第一荧光报告基团的选取基于具体的反应系统,当针对每个基因采用单管进行检测时,则第一探针和第二探针的第一荧光报告基团可以采用一种或多种荧光基团用以标记;当至多四个基因在同一反应管中进行检测时,则第一探针和第二探针的第一荧光报告基团分别采用不同的荧光报告基团对相应基因进行检测。
SPN-P:CGCTTCTACCGCCGACGCCAC (SEQ ID No:2)
CNRIP1-P :CCCGAAACCGCCGCGCCAAA (SEQ ID No:5)
GDNF-P:CCTAACGCCCTCATATCTTCACG (SEQ ID No:11)
ITGA4-P:CGAGTTTTGCGTAGTCGAGGTTT(SEQ ID No:14)
TFPI2-P:TTTATACGAAACGAACGTCCGACCGACCC (SEQ ID No:17)
ZNF304-P:ACGGCGACGTTAGAAGTTTC (SEQ ID No:20)
需要指出的是,本申请提供的上述引物和探针可以放在一个反应管中进行反应,不会产生影响检测结果的发卡结构或引物二聚体等,提高了检测效率。
根据本发明实施例,所述试剂盒还包括下列至少一种:样本收集容器、DNA提取试剂,甲基化转化试剂、荧光定量PCR检测试剂、检测GAPDH基因的引物和检测GAPDH基因的探针。
所述检测GAPDH基因的探针的5’端标记有VIC荧光报告基团,3’端标记有BHQ1荧光淬灭基团。
所述GAPDH基因的引物如SEQ ID No.7和SEQ ID No.9所示;
所述GAPDH基因的探针如SEQ ID No.8所示。
GAPDH-F:TGGGTGGTTATTGTGAAAAGTT (SEQ ID No:7)
GAPDH-R:CTCCAATCCCTAACCCTACCTT (SEQ ID No:9)
GAPDH-P:CCTTTCCTACTAAAACCCAAAACCAAAC (SEQ ID No:8)
样本收集容器用于收集样本,样本可以为尿液、唾液、脑脊液、血液(全血)、血浆、血清、粪便、组织等,优选血液。
DNA提取试剂用于提取DNA,具体可以为本领域常规DNA提取试剂。
甲基化转化试剂可以使核酸片段中胞嘧啶(C)转化为尿嘧啶(U),而5-甲基胞嘧啶(5mC)不发生转变。进而,通过设计针对甲基化序列的引物对甲基化位点进行PCR扩增,若可以得到扩增片段,则表明核酸片段的位点上存在甲基化,若未得到扩增片段,则表明核酸片段的位点上不存在甲基化,从而实现诊断胃肠肿瘤。具体地,甲基化转化试剂可以为重亚硫酸盐转化试剂。
荧光定量PCR检测试剂可以包括PCR缓冲液、dNTP、DNA聚合酶等荧光定量PCR检测常用试剂。检测GAPDH基因的引物和探针可以包含本领域常规序列,用于检测GAPDH对照基因表达水平。检测GAPDH基因的探针5’端标记有VIC荧光报告基团,可实现多重单管检测。
本发明提出的前述试剂盒的使用方法,包括:
(1)提取待测生物样本基因组DNA。
使用南科征途公司的Apostle使徒 MiniMaxTM游离 DNA(cfDNA)分离富集试剂盒(Cat#: A17622-10, Version: P.27)提取纯化外周血中的游离cfDNA。
(2)将待测生物样本基因组DNA进行重亚硫酸盐转化。
使用ZYMO公司的EZ DNA Methylation-Lightning™ Kit对提取得到的cfDNA进行重亚硫酸盐转化,重亚硫酸盐转化反应体系如表1所示。
表1 重亚硫酸盐转化反应体系
注:cfDNA的体积视具体情况而定,若浓度低于0.5 ng/μL(qubit定量)需浓缩样本,使上样量达到10-20 ng,体积总和不超过20 μL。
混合均匀后,将PCR管放入PCR仪(TaKaRa TP600, TaKaRa大连宝生物有限公司),进行重亚硫酸盐转化(此步是控温过程,没有扩增循环)。重亚硫酸盐转化反应程序如表2所示。反应结束后进行纯化。
表2 重亚硫酸盐转化反应程序
注:需使用带热盖的PCR仪,转化后的DNA产物可以在PCR仪内过夜存放,但不可放置超过20h。
(3)采用前述试剂盒中的引物组和探针组对亚硫酸盐转化后的DNA进行甲基化定量PCR检测。
包括模板预扩增及胃肠道恶性肿瘤qPCR检测流程。
(1)模板预扩增
准备预扩增引物mix,将SPN、ITGA4、CNRIP1、TFPI2、GDNF、ZNF304及内参基因GAPDH上下游引物分别稀释为50μM,按等摩尔比配制。然后将转化后模板取6 μL样本用于预扩增,使用NEB公司OneTaq® 热启动2X 预混液,预扩增整体反应体系如表3和预扩增反应程序如表4所示。预扩增完成后进行纯化。
表3 预扩增整体反应体系
表4 预扩增反应程序
(2)胃肠道恶性肿瘤qPCR检测流程
根据6个胃肠道恶性肿瘤特征基因SPN、CNRIP1、GDNF、TFPI2、ITGA4、ZNF304及内参基因GAPDH的相关序列,以预扩增纯化后的产物为扩增模板,使用NEB公司Luna UniversalProbe qPCR Master Mix ®探针进行qPCR反应,获得该6个基因标志物在外周血样本中的甲基化的水平,qPCR样本检测体系如表5所示,qPCR样本检测程序如表6所示。
表5 qPCR样本检测体系
表6 qPCR样本检测程序(罗氏Cobas z480)
(4)对检测结果进行分析。
本发明还提供了一种用于诊断胃肠道肿瘤的装置,包括:检测单元,所述检测单元用于检测前述生物标志物中甲基化水平,得到检测结果;分析单元,所述分析单元用于针对所述检测结果诊断胃肠道肿瘤。
检测单元中含有检测装置。检测装置用于检测SPN基因目的区域的甲基化位点和CNRIP1、GDNF、TFPI2、ITGA4、ZNF304中至少两个基因目的区域的甲基化位点甲基化水平,包括荧光定量PCR仪等。检测单元中进一步含有DNA提取装置。DNA提取装置用于提取生物样本中的DNA,包括离心机、混合器等。
所述分析单元根据SPN基因ΔCt值以及其他至少两种基因所建立的模型进行判读,判断是否患有胃肠道肿瘤;其中ΔCt值为相应基因Ct值减去内参基因Ct值;若某基因扩增曲线不成S型或Ct值为空白,则所述某基因的Ct值为45。本发明提出了将SPN基因ΔCt值与其他至少两种基因所建立的模型进行判读,提高了检测结果的准确性,灵敏度和特异性。
所述模型的输入包括年龄和所述至少两种基因的ΔCt值。本申请的发明人发现,除了相应基因目的区域的甲基化程度影响检测结果外,还包括了年龄,且患者年龄也会对检测结果产生一定的影响。
而模型的建立可以采用随机森林算法或逻辑回归算法,将数据集划分为训练集和验证集,采用训练集对所述模型进行训练,所述验证集用于验证模型的准确性。需要指出的是,训练集的样本数量越多则模型越准确,为了使得检测结果的灵敏度和特异性达到70%以上,对测试样本按照3:1-2划分训练集和验证集,且训练集的最小样本数量应大于30。
本发明实施例采用逻辑回归算法,使用R 4.3.2版本的逻辑回归模型包{glmnet}开发本逻辑回归模型。
当SPN基因的ΔCt不大于2.61,则可判定结果为阳性;当SPN基因的ΔCt大于2.61,采用逻辑回归的方式进行拟合,得到模型公式,并计算阈值;相应模型分数不小于所述阈值时,则判定结果为阳性,反之为阴性。所述阈值为不确定的数值,基于样本数量的增加,模型更加准确,阈值会发生变化。此外当SPN基因的ΔCt不大于2.61,可以直接判定为阳性,提高了检测效率。
具体的,基于CNRIP1和GDNF基因的ΔCt构建模型时,采用逻辑回归算法得到模型为:
G3Mscan=34.70281-0.23476Age-1.02096ΔCt(CNRIP1)-0.34176ΔCt(GDNF),当G3Mscan不小于-1.257,则判断结果为阳性,反之为阴性;
基于ITGA4、TFPI2和ZNF304基因的ΔCt构建模型时,采用逻辑回归算法得到模型为:
G4Mscan=26.99644-0.12047Age-0.93628ΔCt(ITGA4)-0.15256ΔCt(TFPI2)-0.21633ΔCt(ZNF304),当G4Mscan不小于-1.083,则判断结果为阳性,反之为阴性;
基于ITGA4、CNRIP1、TFPI2、GDNF和ZNF304基因的ΔCt构建模型时,采用逻辑回归算法得到模型为:
G6Mscan=37.44462-0.26821Age+0.11936ΔCt(ITGA4)-1.51298ΔCt(CNRIP1)+0.57912ΔCt(TFPI2)-0.40047ΔCt(GDNF)-0.17587ΔCt(ZNF304),当G6Mscan不小于-1.174,则判断结果为阳性,反之为阴性。
本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现基于生物样本中生物标志物中甲基化水平诊断胃肠道肿瘤。
一个或者多个程序可被一个或者多个处理器执行时,采用下述判断方式诊断胃肠道肿瘤:根据SPN基因ΔCt值以及其他至少两种基因所建立的模型进行判读,判断是否患有胃肠道肿瘤;其中ΔCt值为相应基因Ct值减去内参基因Ct值;若某基因扩增曲线不成S型或Ct值为空白,则所述某基因的Ct值为45。本发明提出了将SPN基因ΔCt值与其他至少两种基因所建立的模型进行判读,提高了检测结果的准确性、灵敏度和特异性。
所述模型的输入包括年龄和所述至少两种基因的ΔCt值。本申请的发明人发现,除了相应基因目的区域的甲基化程度影响检测结果外,还包括了年龄,且患者年龄也会对检测结果产生一定的影响。
而模型的建立可以采用随机森林算法或逻辑回归算法,将数据集划分为训练集和验证集,采用训练集对所述模型进行训练,所述验证集用于验证模型的准确性。需要指出的是,训练集的样本数量越多则模型越准确,为了使得检测结果的灵敏度和特异性达到70%以上,对测试样本按照3:1-2划分训练集和验证集,且训练集的最小样本数量应大于30。
本发明实施例采用逻辑回归算法,使用R 4.3.2版本的逻辑回归模型包{glmnet}开发本逻辑回归模型。
当SPN基因的ΔCt不大于2.61,则可判定结果为阳性;当SPN基因的ΔCt大于2.61,采用逻辑回归的方式进行拟合,得到模型公式,并计算阈值;相应模型分数不小于所述阈值时,则判定结果为阳性,反之为阴性。所述阈值为不确定的数值,基于样本数量的增加,模型更加准确,阈值会发生变化。此外当SPN基因的ΔCt不大于2.61,可以直接判定为阳性,提高了检测效率。
具体的,基于CNRIP1和GDNF基因的ΔCt构建模型时,采用逻辑回归算法得到模型为:
G3Mscan=34.70281-0.23476Age-1.02096ΔCt(CNRIP1)-0.34176ΔCt(GDNF),当G3Mscan不小于-1.257,则判断结果为阳性,反之为阴性;
基于ITGA4、TFPI2和ZNF304基因的ΔCt构建模型时,采用逻辑回归算法得到模型为:
G4Mscan=26.99644-0.12047Age-0.93628ΔCt(ITGA4)-0.15256ΔCt(TFPI2)-0.21633ΔCt(ZNF304),当G4Mscan不小于-1.083,则判断结果为阳性,反之为阴性;
基于ITGA4、CNRIP1、TFPI2、GDNF和ZNF304基因的ΔCt构建模型时,采用逻辑回归算法得到模型为:
G6Mscan=37.44462-0.26821Age+0.11936ΔCt(ITGA4)-1.51298ΔCt(CNRIP1)+0.57912ΔCt(TFPI2)-0.40047ΔCt(GDNF)-0.17587ΔCt(ZNF304),当G6Mscan不小于-1.174,则判断结果为阳性,反之为阴性。
在本文中,计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质(例如,高密度数字视频光盘(digital video disc,DVD))、或者半导体介质(例如,固态硬盘(solid state disk,SSD))等。
需要说明的是,前面针对生物标志物、引物组和探针组所描述的特征和优点,同样适用于该装置、系统、电子设备和计算机可读存储介质,在此不再赘述。
实施例1
胃肠道恶性肿瘤(胃癌GC和结直肠癌CRC)3基因诊断模型G3Mscan(Gastrointestinal tumor 3 gene Methylation Scan)的建立。
选取39例临床诊断为胃癌患者的血浆样本、59例临床诊断为结直肠癌患者的血浆样本和111例健康人的血浆样本,将样本按照约3:1的比例划分训练集和验证集,并按本发明的方法进行检测。
使用南科征途公司的高效游离DNA 富集分离试剂盒提取、纯化待测样本血浆中的游离cfDNA。
将纯化的cfDNA按照步骤说明中所描述,进行转化、预扩增和qPCR检测。
对样本的检测结果进行分析,样本划分及检测数据见表7和图1。
首先分析训练集样本的ΔCt(SPN),ΔCt(SPN)≤2.61的样本判定为阳性(胃癌或结直肠癌),然后使用训练集ΔCt(SPN)>2.61的样本数据构建逻辑回归模型。使用R 4.3.2版本的逻辑回归模型包{glmnet}开发本逻辑回归模型G3Mscan,模型公式为:
G3Mscan=34.70281-0.23476Age-1.02096ΔCt(CNRIP1)-0.34176ΔCt(GDNF)
如图1所示,在训练集ΔCt(SPN)>2.61的样本中, G3Mscan模型的AUC(曲线下面积)为0.925,最佳cut off = -1.257。当G3Mscan 分数≥-1.257时,样本判定为阳性。
在分析模型性能表现时,采用如下公式:
灵敏度(%)=真阳性/(真阳性+假阴性)
特异性(%)=真阴性/(真阴性+假阳性)
阳性预测值(PPV)=真阳性/(真阳性+假阳性)
阴性预测值(NPV)=真阴性/(真阴性+假阴性)
综上,训练集中使用ΔCt(SPN)联合G3Mscan模型综合判定的灵敏度为73/(73+2)=97.33%,特异性为67/(67+17)=79.76%,阳性预测值为73/(73+17)=81.11%,阴性预测值为67/(67+2)=97.10%。
使用验证集数据对逻辑回归模型G3Mscan进行性能验证。在验证集ΔCt(SPN)>2.61的样本中,如图1所示, G3Mscan模型的AUC为0.990。使用ΔCt(SPN)联合G3Mscan模型综合判定的灵敏度为22/(22+1)= 95.65%,特异性为24/(24+3)= 88.89%,阳性预测值为22/(22+3)=88%,阴性预测值为24/(24+1)=96%。
表7实施例1样本划分及检测数据
;
;
;
;
实施例2
胃肠道恶性肿瘤4基因诊断模型G4Mscan的建立。
选取39例临床诊断为胃癌患者的血浆样本、59例临床诊断为结直肠癌患者的血浆样本、111例健康人的血浆样本,将样本按照约3:2的比例划分训练集和验证集,并按本发明的方法进行检测。
使用南科征途公司的高效游离DNA 富集分离试剂盒提取、纯化待测样本血浆中的游离cfDNA。
将纯化的cfDNA按照步骤说明中所描述,进行转化、预扩增和qPCR检测。
对样本的检测结果进行分析,样本划分及检测数据见表8和图2。
首先分析训练集样本的ΔCt(SPN),ΔCt(SPN)≤2.61的样本判定为阳性(胃癌或结直肠癌),然后使用训练集ΔCt(SPN)>2.61的样本数据用于构建逻辑回归模型。使用R4.3.2版本的逻辑回归模型包{glmnet}开发本逻辑回归模型G4Mscan,模型公式为:
G4Mscan=26.99644-0.12047Age-0.93628ΔCt(ITGA4)-0.15256ΔCt(TFPI2)-0.21633ΔCt(ZNF304)
如图2所示,在训练集ΔCt(SPN)>2.61的样本中, G4Mscan模型的AUC为0.888,最佳cut off = -1.083。当G4Mscan 分数≥-1.083时,样本判定为阳性。
综上,训练集中使用ΔCt(SPN)联合G4Mscan模型综合判定的灵敏度为56/(56+4)=93.33%,特异性为51/(51+16)=76.12%,阳性预测值为56/(56+16)=77.78%,阴性预测值为51/(51+4)=92.73%。
使用验证集数据对逻辑回归模型G4Mscan进行性能验证。在验证集ΔCt(SPN)>2.61的样本中,如图2所示, G4Mscan模型的AUC为0.909。使用ΔCt(SPN)联合G4Mscan模型综合判定的灵敏度为35/(35+3)=92.11%,特异性为37/(37+7)=84.09%,阳性预测值为35/(35+7)=83.33%,阴性预测值为37/(37+3)=92.5%。
表8 实施例2样本划分及检测数据
;
;
;
;
实施例3
胃肠道恶性肿瘤6基因诊断模型G6Mscan的建立。
选取39例临床诊断为胃癌患者的血浆样本、59例临床诊断为结直肠癌患者的血浆样本、111例健康人的血浆样本,将样本按照约3:1的比例划分训练集和验证集,并按本发明的方法进行检测。
使用南科征途公司的高效游离DNA 富集分离试剂盒提取、纯化待测样本血浆中的游离cfDNA。
将纯化的cfDNA按照步骤说明中所描述,进行转化、预扩增和qPCR检测。
对样本的检测结果进行分析,样本划分及检测数据见表9和图3。
首先分析训练集样本的ΔCt(SPN),ΔCt(SPN)≤2.61的样本判定为阳性(胃癌或结直肠癌),然后使用训练集ΔCt(SPN)>2.61的样本数据用于构建逻辑回归模型。使用R4.3.2版本的逻辑回归模型包{glmnet}开发本逻辑回归模型G6Mscan,模型公式为:
G6Mscan=37.44462-0.26821Age+0.11936ΔCt(ITGA4)-1.51298ΔCt(CNRIP1)+0.57912ΔCt(TFPI2)-0.40047ΔCt(GDNF)-0.17587ΔCt(ZNF304)
如图3所示,在训练集ΔCt(SPN)>2.61的样本中, G6Mscan模型的AUC为0.932,最佳cut off =-1.174。当G3Mscan分数≥-1.174时,样本判定为阳性。
综上,训练集中使用ΔCt(SPN)联合G6Mscan模型综合判定的灵敏度为72/(72+3)=96.00%,特异性为67/(67+17)=79.76%,阳性预测值为72/(72+17)=80.90%,阴性预测值为67/(67+3)=95.71%。
使用验证集数据对逻辑回归模型G6Mscan进行性能验证。在验证集ΔCt(SPN)>2.61的样本中,如图3所示, G6Mscan模型 的AUC为0.953。使用ΔCt(SPN)联合模型G6Mscan综合判定的灵敏度为22/(22+1)=95.65%,特异性为22/(22+5)=81.48%,阳性预测值为22/(22+5)=81.48%,阴性预测值为22/(22+1)=95.65%。
表9 实施例3样本划分及检测数据
;
;
;
;
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种引物组在制备胃肠道肿瘤的诊断试剂盒中的应用,其特征在于,
所述引物组用于检测生物标志物,所述生物标志物由SPN基因目的区域的甲基化位点和选自CNRIP1、GDNF、TFPI2、ITGA4、ZNF304中的至少两个基因目的区域的甲基化位点组成;
以hg19为参考基因组,
所述SPN基因目的区域选自chr16:29675824-29675917,所述CNRIP1基因目的区域选自chr2:68546535-68546605,所述GDNF基因目的区域选自chr5:37840060-37840160,所述TFPI2基因目的区域选自chr7:93520070-93520146,所述ITGA4基因目的区域选自chr2:182321974-182322059,所述ZNF304基因目的区域选择chr19:57862558-57862660;
所述引物组包括:
第一引物,所述第一引物如SEQ ID No:1和SEQ ID No:3所示;
第二引物,所述第二引物选择下述至少两组:
第一组引物如SEQ ID No:4和SEQ ID No:6所示、第二组引物如SEQ ID No:10和SEQ IDNo:12所示、第三组引物如SEQ ID No:16和SEQ ID No:18所示、第四组引物如SEQ ID No:13和SEQ ID No:15所示、第五组引物如SEQ ID No:19和SEQ ID No:21。
2.一种试剂盒在制备胃肠道肿瘤诊断产品中的应用,其特征在于,
所述试剂盒用于检测生物标志物,所述生物标志物由SPN基因目的区域的甲基化位点和选自CNRIP1、GDNF、TFPI2、ITGA4、ZNF304中的至少两个基因目的区域的甲基化位点组成;
以hg19为参考基因组,
所述SPN基因目的区域选自chr16:29675824-29675917,所述CNRIP1基因目的区域选自chr2:68546535-68546605,所述GDNF基因目的区域选自chr5:37840060-37840160,所述TFPI2基因目的区域选自chr7:93520070-93520146,所述ITGA4基因目的区域选自chr2:182321974-182322059,所述ZNF304基因目的区域选择chr19:57862558-57862660;
所述试剂盒包括:探针组以及引物组;
所述引物组包括:
第一引物,所述第一引物如SEQ ID No:1和SEQ ID No:3所示;
第二引物,所述第二引物选择下述至少两组:
第一组引物如SEQ ID No:4和SEQ ID No:6所示、第二组引物如SEQ ID No:10和SEQ IDNo:12所示、第三组引物如SEQ ID No:16和SEQ ID No:18所示、第四组引物如SEQ ID No:13和SEQ ID No:15所示、第五组引物如SEQ ID No:19和SEQ ID No:21。
3.根据权利要求2所述的应用,其特征在于,
所述探针组包括:
第一探针,所述第一探针如SEQ ID No:2所示;
第二探针,所述第二探针选择下述至少两种:
第一种探针如SEQ ID No:5所示、第二种探针如SEQ ID No:11所示、第三种探针如SEQID No:17所示、第四种探针如SEQ ID No:14所示、第五种探针如SEQ ID No:20所示;
所述引物组与探针组的选择适配:第一探针与第一引物适配,第一种探针与第一组引物适配,第二种探针与第二组引物适配,第三种探针与第三组引物适配,第四种探针与第四组引物适配,第五种探针与第五组引物适配。
4.根据权利要求3所述的应用,其特征在于,
所述第一探针和第二探针的5’端标记有第一荧光报告基团,3’端标记有BHQ1荧光淬灭基团。
5.根据权利要求2所述的应用,其特征在于,
所述试剂盒还包括下列至少一种:样本收集容器、DNA提取试剂,甲基化转化试剂、荧光定量PCR检测试剂、检测GAPDH基因的引物和检测GAPDH基因的探针。
6.根据权利要求5所述的应用,其特征在于,
所述检测GAPDH基因的探针的5’端标记有VIC荧光报告基团,3’端标记有BHQ1荧光淬灭基团。
7.根据权利要求5或6所述的应用,其特征在于,
所述GAPDH基因的引物如SEQ ID No:7和SEQ ID No:9所示;
所述GAPDH基因的探针如SEQ ID No:8所示。
8.一种用于诊断胃肠道肿瘤的装置,其特征在于,包括:
检测单元,所述检测单元用于检测生物标志物中甲基化水平,得到检测结果;
分析单元,所述分析单元用于针对所述检测结果诊断胃肠道肿瘤;
所述生物标志物由SPN基因目的区域的甲基化位点和选自CNRIP1、GDNF、TFPI2、ITGA4、ZNF304中的至少两个基因目的区域的甲基化位点组成;
以hg19为参考基因组,
所述SPN基因目的区域选自chr16:29675824-29675917,所述CNRIP1基因目的区域选自chr2:68546535-68546605,所述GDNF基因目的区域选自chr5:37840060-37840160,所述TFPI2基因目的区域选自chr7:93520070-93520146,所述ITGA4基因目的区域选自chr2:182321974-182322059,所述ZNF304基因目的区域选择chr19:57862558-57862660;
所述分析单元根据SPN基因ΔCt值以及其他至少两种基因所建立的模型进行判读,判断是否患有胃肠道肿瘤;
其中ΔCt值为相应基因Ct值减去内参基因Ct值;
若某基因扩增曲线不成S型或Ct值为空白,则所述某基因的Ct值为45;
所述模型的输入包括年龄和所述至少两种基因的ΔCt值;
所述模型采用随机森林算法或逻辑回归算法,将数据集划分为训练集和验证集,采用训练集对所述模型进行训练,所述验证集用于验证模型的准确性;
当SPN基因的ΔCt不大于2.61,则可判定结果为阳性;
当SPN基因的ΔCt大于2.61,
采用逻辑回归的方式进行拟合,得到模型公式,并计算阈值;
相应模型分数不小于所述阈值时,则判定结果为阳性,反之为阴性;
基于CNRIP1和GDNF基因的ΔCt构建模型时,
采用逻辑回归算法得到模型为:
G3Mscan=34.70281-0.23476Age-1.02096ΔCt(CNRIP1)-0.34176ΔCt(GDNF),
当G3Mscan不小于-1.257,则判断结果为阳性,反之为阴性;
基于ITGA4、TFPI2和ZNF304基因的ΔCt构建模型时,
采用逻辑回归算法得到模型为:
G4Mscan=26.99644-0.12047Age-0.93628ΔCt(ITGA4)-0.15256ΔCt(TFPI2)-0.21633ΔCt(ZNF304),
当G4Mscan不小于-1.083,则判断结果为阳性,反之为阴性;
基于ITGA4、CNRIP1、TFPI2、GDNF和ZNF304基因的ΔCt构建模型时,
采用逻辑回归算法得到模型为:
G6Mscan=37.44462-0.26821Age+0.11936ΔCt(ITGA4)-1.51298ΔCt(CNRIP1)+0.57912ΔCt(TFPI2)-0.40047ΔCt(GDNF)-0.17587ΔCt(ZNF304),
当G6Mscan不小于-1.174,则判断结果为阳性,反之为阴性。
9.根据权利要求8所述的装置,其特征在于,
所述检测单元包括荧光定量PCR仪。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现基于生物样本中生物标志物中甲基化水平诊断胃肠道肿瘤;
所述生物标志物由SPN基因目的区域的甲基化位点和选自CNRIP1、GDNF、TFPI2、ITGA4、ZNF304中的至少两个基因目的区域的甲基化位点组成;
以hg19为参考基因组,
所述SPN基因目的区域选自chr16:29675824-29675917,所述CNRIP1基因目的区域选自chr2:68546535-68546605,所述GDNF基因目的区域选自chr5:37840060-37840160,所述TFPI2基因目的区域选自chr7:93520070-93520146,所述ITGA4基因目的区域选自chr2:182321974-182322059,所述ZNF304基因目的区域选择chr19:57862558-57862660;
根据SPN基因ΔCt值以及其他至少两种基因所建立的模型进行判读,判断是否患有胃肠道肿瘤;
其中ΔCt值为相应基因Ct值减去内参基因Ct值;
若某基因扩增曲线不成S型或Ct值为空白,则所述某基因的Ct值为45;
所述模型的输入包括年龄和所述至少两种基因的ΔCt值;
当SPN基因的ΔCt大于2.61,
采用逻辑回归的方式进行拟合,得到模型公式,并计算阈值;
相应模型分数不小于所述阈值时,则判定结果为阳性,反之为阴性;
基于CNRIP1和GDNF基因的ΔCt构建模型时,
采用逻辑回归算法得到模型为:
G3Mscan=34.70281-0.23476Age-1.02096ΔCt(CNRIP1)-0.34176ΔCt(GDNF),
当G3Mscan不小于-1.257,则判断结果为阳性,反之为阴性;
基于ITGA4、TFPI2和ZNF304基因的ΔCt构建模型时,
采用逻辑回归算法得到模型为:
G4Mscan=26.99644-0.12047Age-0.93628ΔCt(ITGA4)-0.15256ΔCt(TFPI2)-0.21633ΔCt(ZNF304),
当G4Mscan不小于-1.083,则判断结果为阳性,反之为阴性;
基于ITGA4、CNRIP1、TFPI2、GDNF和ZNF304基因的ΔCt构建模型时,
采用逻辑回归算法得到模型为:
G6Mscan=37.44462-0.26821Age+0.11936ΔCt(ITGA4)-1.51298ΔCt(CNRIP1)+0.57912ΔCt(TFPI2)-0.40047ΔCt(GDNF)-0.17587ΔCt(ZNF304),
当G6Mscan不小于-1.174,则判断结果为阳性,反之为阴性。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202410789057.8A CN118374600B (zh) | 2024-06-19 | 2024-06-19 | 引物组、试剂盒、用于诊断胃肠道肿瘤的装置及存储介质 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202410789057.8A CN118374600B (zh) | 2024-06-19 | 2024-06-19 | 引物组、试剂盒、用于诊断胃肠道肿瘤的装置及存储介质 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN118374600A CN118374600A (zh) | 2024-07-23 |
| CN118374600B true CN118374600B (zh) | 2024-09-17 |
Family
ID=91910063
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN202410789057.8A Active CN118374600B (zh) | 2024-06-19 | 2024-06-19 | 引物组、试剂盒、用于诊断胃肠道肿瘤的装置及存储介质 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN118374600B (zh) |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN106232833A (zh) * | 2014-01-30 | 2016-12-14 | 加利福尼亚大学董事会 | 用于非侵入性诊断的甲基化单体型分析(monod) |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP2626435B1 (en) * | 2008-03-21 | 2016-06-01 | MDxHealth S.A. | Detection and prognosis of cervical cancer |
| CN117737250B (zh) * | 2024-02-21 | 2024-07-09 | 上海金翌生物科技有限公司 | 一种膀胱癌生物标志物甲基化水平检测的方法及试剂盒 |
-
2024
- 2024-06-19 CN CN202410789057.8A patent/CN118374600B/zh active Active
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN106232833A (zh) * | 2014-01-30 | 2016-12-14 | 加利福尼亚大学董事会 | 用于非侵入性诊断的甲基化单体型分析(monod) |
Also Published As
| Publication number | Publication date |
|---|---|
| CN118374600A (zh) | 2024-07-23 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN107435062B (zh) | 甄别肺部微小结节良恶性的外周血基因标志物及其用途 | |
| CN116144782A (zh) | 一种用于肺癌检测的组合标志物及其应用 | |
| CN115896281A (zh) | 甲基化生物标记物、试剂盒及用途 | |
| CN118374600B (zh) | 引物组、试剂盒、用于诊断胃肠道肿瘤的装置及存储介质 | |
| CN120026105A (zh) | Mir129-2启动子甲基化在胰腺癌诊断和预后中的应用 | |
| CN116356027B (zh) | 一种用于食管鳞癌或癌前病变检测的试剂、试剂盒及应用 | |
| CN117106918A (zh) | 基因甲基化鉴别诊断肺良性结节和恶性肿瘤方法及其试剂盒 | |
| CN117106899A (zh) | 一种用于检测肺结节良恶性的引物对、引物探针组合、试剂盒及应用 | |
| CN118166097A (zh) | 用于结直肠癌及癌前病变诊断的dna甲基化水平检测试剂盒 | |
| CN116042830A (zh) | 消化道恶性肿瘤诊断产品及其应用 | |
| CN119855922A (zh) | 差异性甲基化区域组合、试剂盒和用途 | |
| CN116121387A (zh) | 一种用于结直肠癌检测的组合标志物及其应用 | |
| JP6103866B2 (ja) | 大腸ガン検出方法、診断用キット及びdnaチップ | |
| CN116987787B (zh) | 检测膀胱癌是否复发的装置和计算机可读存储介质 | |
| CN115927644B (zh) | 一种新型多靶点胃癌检测的标志物组合及其应用 | |
| US11807908B2 (en) | Genetic markers used for identifying benign and malignant pulmonary micro-nodules and the application thereof | |
| CN115961048B (zh) | 一种基因甲基化检测引物组合、试剂及其应用 | |
| CN118531117B (zh) | 尿路上皮癌标志物及应用、引物组、高特异性的试剂盒和检测方法 | |
| CN118006781B (zh) | 用于检测尿路上皮癌的标志物、引物组、高敏感性和高特异性的试剂盒及检测方法 | |
| CN118932057B (zh) | 检测膀胱癌或者尿路上皮癌的核酸组合产品及其应用 | |
| CN115948561B (zh) | 一种用于食管鳞癌诊断或辅助诊断的试剂、检测试剂盒及其应用 | |
| CN118186078A (zh) | 一种新型多靶点肺癌辅助诊断的标志物组合及其应用 | |
| CN116814790A (zh) | Pitx2基因作为标志物在检测肺癌中的应用 | |
| CN119530383A (zh) | 一种新型多靶点胃癌检测的标志物组合及其应用 | |
| CN117187388A (zh) | Grik2基因作为标志物在制备肺癌检测试剂盒中的应用 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| GR01 | Patent grant | ||
| GR01 | Patent grant |