CN109390034B - 一种检测肿瘤组织中正常组织含量和肿瘤拷贝数的方法 - Google Patents
一种检测肿瘤组织中正常组织含量和肿瘤拷贝数的方法 Download PDFInfo
- Publication number
- CN109390034B CN109390034B CN201811097661.5A CN201811097661A CN109390034B CN 109390034 B CN109390034 B CN 109390034B CN 201811097661 A CN201811097661 A CN 201811097661A CN 109390034 B CN109390034 B CN 109390034B
- Authority
- CN
- China
- Prior art keywords
- baf
- cnv
- value
- tumor
- content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 206010028980 Neoplasm Diseases 0.000 title claims abstract description 54
- 238000000034 method Methods 0.000 title claims abstract description 14
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 13
- 238000012217 deletion Methods 0.000 claims description 21
- 230000037430 deletion Effects 0.000 claims description 21
- 239000012634 fragment Substances 0.000 claims description 15
- 108700028369 Alleles Proteins 0.000 claims description 4
- 238000001514 detection method Methods 0.000 abstract description 8
- 238000007405 data analysis Methods 0.000 abstract description 2
- 210000001519 tissue Anatomy 0.000 description 48
- 238000007481 next generation sequencing Methods 0.000 description 8
- 238000012360 testing method Methods 0.000 description 5
- 230000000875 corresponding effect Effects 0.000 description 4
- 210000001766 X chromosome Anatomy 0.000 description 3
- 210000000349 chromosome Anatomy 0.000 description 3
- 239000000523 sample Substances 0.000 description 3
- 210000002593 Y chromosome Anatomy 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000001353 Chip-sequencing Methods 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 231100000504 carcinogenesis Toxicity 0.000 description 1
- 230000000739 chaotic effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Engineering & Computer Science (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Analytical Chemistry (AREA)
- Zoology (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Physics & Mathematics (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Hospice & Palliative Care (AREA)
- Biophysics (AREA)
- Oncology (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明属于基因组学数据分析领域,尤其涉及一种检测肿瘤组织中正常组织含量和肿瘤拷贝数的方法,其特征在于经过获取BAF值步骤、确定BAF值的条件步骤,再根据公式得到所需要正常组织含量和肿瘤拷贝数值。本发明中检测方法用BAF值推算出CNV重复和缺失区域的肿瘤组织或正常组织含量,并可同时获得肿瘤的CNV值。公式简单,该检测方法很容易在临床基因检测中使用,易于推广。
Description
技术领域
本发明属于基因组学数据分析领域,尤其涉及一种检测肿瘤组织中正常组织含量和肿瘤拷贝数的方法。
背景技术
实体肿瘤的组织样本中,绝大多数情况下都含有一些正常组织,这是在活检取样过程中一个经常遇到的问题。在癌症的临床基因检测中,就有必要知道其正常组织的含量。同时,正常组织的含量的多少也会影响对肿瘤的拷贝数(Copy Number Variants, CNV)的计算。这是一个所有临床基因检测实验室需要解决的困难。
DNA拷贝数的变化(CNV)是癌症的一个主要治病原因,因此成为基因检测的一个重要指标。CNV目前的常用检测平台和金标准是基因芯片(microarray)。随着DNA二代测序(NGS)在基因组学领域的广泛应用,直接从NGS数据获得CNV结果已经逐渐在科研和临床检测中使用,并有最终取代基因芯片的势头。不论使用基因芯片还是NGS,CNV的计算都是来自于两种数据,log2Ratio和B-Allele Frequency(BAF)。log2Ratio用于计算CNV片段,BAF则用于计算杂合体的缺失( Loss of heterozygosity, LOH)和等位基因的失衡(AllelicImbalance)。
发明内容
针对上述问题,本发明提供一种检测肿瘤组织中正常组织含量和肿瘤拷贝数的方法,用BAF值推算出CNV重复和缺失区域的肿瘤组织或正常组织含量,并可同时获得肿瘤的CNV值。公式简单,该检测方法很容易在临床基因检测中使用,易于推广。
解决以上技术问题的本发明中的一种检测肿瘤组织中正常组织含量和肿瘤拷贝数的方法,其特征在于:包括以下步骤:
(1)获取BAF值;根据基因芯片或NGS数据得到BAF值;
(2)确定BAF值的条件:CNV一个缺失片段的BAF值,CNV 重复片段的BAF值;
(3)根据公式得到所需要正常组织含量和肿瘤拷贝数值:
a)当肿瘤组织有一个CNV缺失时(CN Loss = 1, 而且假定缺失的是nB),
(其中,BAF值采用两条代表杂合体的BAF带的下端一条带(0 < BAF < 0.5 );c是肿瘤组织的含量(正常组织含量因此是 1 –c),nA和nB分别是等位基因A和B的CNV 值);
b)当肿瘤组织的CNV重复时(CN Gain >=1),
假定nB = 1,只有nA重复,这样下端的BAF一条带(0 < BAF < 0.5 )就反映了nA的变化。
定义:(Total Copy Number),
其中,nt为总拷贝数;
优化方案中,所述当CNV重复区域的nt出现多个可能值时,比较其对应的c值与CNV缺失区域的c值,同时参考其log2Ratio值。
本发明提出一种精确简便的新算法解决这个难题,这将会对实体肿瘤的基因检测及科研带来积极的作用。本发明利用基因芯片或DNA测序(NGS)数据中的B-AlleleFrequency(BAF)值对肿瘤组织中正常组织含量和肿瘤拷贝数(CNV)进行简单方便的检测计算。另外,BAF比log2Ratio对变化更加敏感,这比单纯使用log2Ratio的算法更有价值。
附图说明
下面结合附图及具体实施方式对本发明做更进一步详细说明:
图1为本发明中肿瘤CNV和BAF的案例图
图2为本发明中肿瘤组织中不同正常组织含量对在CNV一个缺失时BAF带分布的影响图
图3为本发明中用CNV缺失片段的BAF值图
图4为本发明中CNV重复区域的nt出现多个可能值时结果图
具体实施方式
下面结合具体实施方式对本发明进行进一步说明:
实施例1
(1)获取BAF值;根据基因芯片或NGS数据得到BAF值;
(2)确定BAF值的条件:CNV一个缺失片段的BAF值,CNV 重复片段的BAF值;
(3)根据公式得到所需要值:
a)当肿瘤组织有一个CNV缺失时(CN Loss = 1, 而且假定缺失的是nB),
(其中,BAF值采用两条代表杂合体的BAF带的下端一条带(0 < BAF < 0.5 );c是肿瘤组织的含量(正常组织含量因此是 1 –c),nA和nB分别是等位基因A和B的CNV 值);
b)当肿瘤组织的CNV重复时(CN Gain >=1),
假定nB = 1,只有nA重复,这样下端的BAF一条带(0 < BAF < 0.5 )就反映了nA的变化。
定义:(Total Copy Number),
其中,nt为总拷贝数;
实施例2
(1)获取BAF值;根据基因芯片或NGS数据得到BAF值;
(2)确定BAF值的条件:CNV一个缺失片段的BAF值,CNV 重复片段的BAF值;
(3)根据公式得到所需要值:
a)当肿瘤组织有一个CNV缺失时(CN Loss = 1, 而且假定缺失的是nB),
(其中,BAF值采用两条代表杂合体的BAF带的下端一条带(0 < BAF < 0.5 );c是肿瘤组织的含量(正常组织含量因此是 1 –c),nA和nB分别是等位基因A和B的CNV 值);
b)当肿瘤组织的CNV重复时(CN Gain >=1),
假定nB = 1,只有nA重复,这样下端的BAF一条带(0 < BAF < 0.5 )就反映了nA的变化。
定义:(Total Copy Number),
其中,nt为总拷贝数;
所述当CNV重复区域的nt出现多个可能值时,比较其对应的c值与CNV缺失区域的c值,同时参考其log2Ratio值。
试验一
如图1是一个肿瘤CNV和BAF的案例。
图中上半部是log2Ratio在22个常染色体及X和Y染色体上的分布,其中每一个数据点反映探针的log2Ratio值,由此计算出CNV片段值。log2Ratio零值基线(log2Ratio =0)代表CNV的正常值(CN = 2),CNV值大于零的片段代表CNV重复(CN Gain),CNV值小于零的片段则代表CNV缺失(CN Loss)。图中的高于或低于零值基线的阈值线分别决定CNV重复或缺失的数目。高于第一条CNV重复阈值线(从零值基线算起)CNV重复为1(CN Gain = 1,总CN值为3),高于第二条CNV重复阈值线表示CNV重复为2 或更多(CN Gain >= 2,总CN值 >=4);低于第一条CNV缺失阈值线(从零值基线算起)CNV缺失为1(CN Loss = 1,总CN值为1),低于第二条CNV缺失阈值线表示CNV缺失为2(CN Loss = 2,总CN值 = 0)。
图1中的下半部是BAF在22个常染色体及X和Y染色体上的分布,其中每一个数据点反映探针的BAF值,由此显示出BAF带(BAF Band),进而决定该区域是LOH还是AllelicImbalance。BAF带是以0.5中线呈镜像对称分布。当CNV片段正常时(CN = 2,log2Ratio =0),相对的BAF显示3条带(BAF = 0, 0.5,1.0),如图中整个第2染色体;当CNV片段重复时,相对的BAF显示4条带(上下两条带表示纯合,BAF = 0 或1;中间两条带表示杂合),如图中整个第5染色体;当CNV片段缺失为1时(CN Loss = 1),相对的BAF只有表示纯合的上下两条带,BAF = 0 或1),如图中的X染色体;当CNV片段缺失为2时(CN Loss = 2),由于两个等位基因区域都缺失,探针的信号与背景信号相同,相对的BAF就会呈现杂乱无章的分布,图中没有这种例子显示。
但是,当肿瘤组织中混有正常组织时,CNV重复和缺失相对的BAF带的分布将会受到影响。显著的变化是CNV缺失也会让BAF呈现4条带,而不是两条带,如图中的第3染色体。CNV重复虽然还是显示4条BAF带,但BAF带值将会与纯肿瘤组织的情形时不同,log2Ratio值也会相对低一些。这使得对数据的分析变得复杂起来。然而,正是由于BAF带型出现了不同的分布,也给计算正常组织在肿瘤组织中的含量和准确计算肿瘤的CNV值带来了希望。
试验二
图2中显示肿瘤组织中不同正常组织含量对在CNV一个缺失时BAF带分布的影响。左边是纯正常组织,BAF显示3条带,右边是纯肿瘤组织,BAF显示2条带,中间三例分别显示10%,50%,75%的肿瘤组织(90%,50%,25%的正常组织)时的BAF 4条带的分布。由此可见,不同的正常组织含量实际上只影响代表杂合体的BAF两个中间带,当肿瘤组织含量增加时(正常组织含量相应降低时),两条BAF中间带的间距增大。
当肿瘤组织有一个CNV缺失时(CN Loss = 1, 而且假定缺失的是nB),
注:BAF值采用两条代表杂合体的BAF带的下端一条带(0 < BAF < 0.5 )。
当肿瘤组织的CNV重复时(CN Gain >=1),
假定nB = 1,只有nA重复,这样下端的BAF一条带(0 < BAF < 0.5 )就反映了nA的变化。
定义:nt为总拷贝数(Total Copy Number)
此时:
将公式1,2,3用于实践,如图3中所示。
如图3显示,无论用CNV缺失片段的BAF值(BAF = 0.33)而使用公式1或用CNV重复片段的BAF值(BAF = 0.40)而使用公式2,该案例都得到肿瘤组织的含量为0.5或50%。
从公式2或3可以看出,当处理CNV重复(CN Gain)时,c与nt是相互关联的。nt值可能是3,4或更大值,这样c也会相应有不同的值。
如图4右边CNV重复的区域,c和nt有两个解。但比较左边CNV缺失区域的c值,并参考CNV重复的log2Ratio值(logR = 0.36),只有c = 0.471和nt = 4才是正确答案。
因此,当CNV重复区域的nt出现多个可能值时,比较其对应的c值与CNV缺失区域的c值,同时参考其log2Ratio值,最终得到满意的结果。
以上显示和描述了本发明的基本原理和主要特征以及本发明的优点,上述实施例和说明书所描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都将落入要求保护的本发明范围内。本发明要求保护的范围由所附的权利要求书及其等效物界定。
Claims (2)
1.一种检测肿瘤组织中正常组织含量和肿瘤拷贝数的方法,其特征在于:包括以下步骤:
(1)获取BAF值;根据基因芯片或NGS数据得到BAF值;
(2)确定BAF值的条件:CNV一个缺失片段的BAF值,CNV重复片段的BAF值;
(3)根据公式得到所需要正常组织含量和肿瘤拷贝数值:
当肿瘤组织有一个CNV缺失时,CN Loss=1,而且假定缺失的是nB,
其中,BAF值采用两条代表杂合体的BAF带的下端一条带0<BAF<0.5;c是肿瘤组织的含量,正常组织含量因此是1–c,nA和nB分别是等位基因A和B的CNV值;
当肿瘤组织的CNV重复时CN Gain>=1,
假定nB=1,只有nA重复,这样下端的BAF一条带0<BAF<0.5就反映了nA的变化;
定义:
nt=nA+nB
其中,nt为总拷贝数;
2.根据权利要求1所示的一种检测肿瘤组织中正常组织含量和肿瘤拷贝数的方法,其特征在于:当CNV重复区域的nt出现多个可能值时,比较其对应的c值与CNV缺失区域的c值,同时参考其log2Ratio值。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201811097661.5A CN109390034B (zh) | 2018-09-20 | 2018-09-20 | 一种检测肿瘤组织中正常组织含量和肿瘤拷贝数的方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201811097661.5A CN109390034B (zh) | 2018-09-20 | 2018-09-20 | 一种检测肿瘤组织中正常组织含量和肿瘤拷贝数的方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN109390034A CN109390034A (zh) | 2019-02-26 |
| CN109390034B true CN109390034B (zh) | 2021-07-27 |
Family
ID=65418874
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201811097661.5A Active CN109390034B (zh) | 2018-09-20 | 2018-09-20 | 一种检测肿瘤组织中正常组织含量和肿瘤拷贝数的方法 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN109390034B (zh) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN110106063B (zh) * | 2019-05-06 | 2022-07-08 | 臻和精准医学检验实验室无锡有限公司 | 基于二代测序的用于神经胶质瘤1p/19q联合缺失检测的系统 |
| CN112980961B (zh) * | 2021-05-11 | 2021-08-27 | 上海思路迪医学检验所有限公司 | 联合检测snv、cnv和fusion变异的方法和装置 |
Family Cites Families (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2016097251A1 (en) * | 2014-12-19 | 2016-06-23 | Danmarks Tekniske Universitet | Method for identification of tissue or organ localization of a tumour |
| CN107423534B (zh) * | 2016-05-24 | 2021-08-06 | 郝柯 | 基因组拷贝数变异的检测方法和系统 |
| CN106650312B (zh) * | 2016-12-29 | 2022-05-17 | 浙江安诺优达生物科技有限公司 | 一种用于循环肿瘤dna拷贝数变异检测的装置 |
| CN106676178B (zh) * | 2017-01-19 | 2020-03-24 | 北京吉因加科技有限公司 | 一种评估肿瘤异质性的方法及系统 |
| CN108319813B (zh) * | 2017-11-30 | 2020-12-25 | 无锡臻和生物科技有限公司 | 循环肿瘤dna拷贝数变异的检测方法和装置 |
-
2018
- 2018-09-20 CN CN201811097661.5A patent/CN109390034B/zh active Active
Also Published As
| Publication number | Publication date |
|---|---|
| CN109390034A (zh) | 2019-02-26 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Danielsen et al. | Revisiting tumour aneuploidy—the place of ploidy assessment in the molecular era | |
| Vachani et al. | A 10-gene classifier for distinguishing head and neck squamous cell carcinoma and lung squamous cell carcinoma | |
| TWI636255B (zh) | 癌症檢測之血漿dna突變分析 | |
| Ikeda et al. | Germline PARP4 mutations in patients with primary thyroid and breast cancers | |
| CN106676178B (zh) | 一种评估肿瘤异质性的方法及系统 | |
| JP2015510757A5 (zh) | ||
| Mittempergher et al. | MammaPrint and BluePrint molecular diagnostics using targeted RNA next-generation sequencing technology | |
| CN111968701A (zh) | 检测指定基因组区域体细胞拷贝数变异的方法和装置 | |
| Yang et al. | Targeted deep sequencing of cell‐free DNA in serous body cavity fluids with malignant, suspicious, and benign cytology | |
| CN114292912A (zh) | 一种变体核酸的检测方法 | |
| CN112088220B (zh) | 替代标志物及用于肿瘤突变负荷测定的方法 | |
| CN110060733B (zh) | 基于单样本的二代测序肿瘤体细胞变异检测装置 | |
| Moerland et al. | Detection of HER2 amplification in breast carcinomas: comparison of multiplex ligation‐dependent probe amplification (MLPA) and fluorescence in situ hybridization (FISH) combined with automated spot counting | |
| CN112365922A (zh) | 用于检测msi的微卫星位点、其筛选方法及应用 | |
| Chen et al. | Clinicopathological characteristics and mutation spectrum of colorectal adenocarcinoma with mucinous component in a Chinese cohort: comparison with classical adenocarcinoma | |
| CN113789371A (zh) | 一种基于批次矫正的拷贝数变异的检测方法 | |
| CN109390034B (zh) | 一种检测肿瘤组织中正常组织含量和肿瘤拷贝数的方法 | |
| Udomruk et al. | Characterization of cell-free dna size distribution in osteosarcoma patients | |
| CN114517223B (zh) | 一种用于筛选snp位点的方法及其应用 | |
| Yang et al. | Microsatellite instability and high tumor mutational burden detected by next generation sequencing are concordant with loss of mismatch repair proteins by immunohistochemistry | |
| Vellichirammal et al. | The mutational landscape of a US Midwestern breast cancer cohort reveals subtype-specific cancer drivers and prognostic markers | |
| CN114067908B (zh) | 一种评估单样本同源重组缺陷的方法、装置和存储介质 | |
| Wilmott et al. | Tumour procurement, DNA extraction, coverage analysis and optimisation of mutation-detection algorithms for human melanoma genomes | |
| CN117497047B (zh) | 基于外显子测序筛选肿瘤基因标志物的方法、设备和介质 | |
| Yu et al. | Tumour purity as an underlying key factor in tumour mutation detection in colorectal cancer |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| GR01 | Patent grant | ||
| GR01 | Patent grant |