[go: up one dir, main page]

CN105296606A - 确定生物样本中游离核酸比例的方法、装置及其用途 - Google Patents

确定生物样本中游离核酸比例的方法、装置及其用途 Download PDF

Info

Publication number
CN105296606A
CN105296606A CN201510444722.0A CN201510444722A CN105296606A CN 105296606 A CN105296606 A CN 105296606A CN 201510444722 A CN201510444722 A CN 201510444722A CN 105296606 A CN105296606 A CN 105296606A
Authority
CN
China
Prior art keywords
chromosome
predetermined
proportion
nucleic acid
free
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510444722.0A
Other languages
English (en)
Other versions
CN105296606B (zh
Inventor
蒋馥蔓
袁玉英
王威
尹烨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BGI Shenzhen Co Ltd
Original Assignee
BGI Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BGI Shenzhen Co Ltd filed Critical BGI Shenzhen Co Ltd
Priority to CN201510444722.0A priority Critical patent/CN105296606B/zh
Publication of CN105296606A publication Critical patent/CN105296606A/zh
Application granted granted Critical
Publication of CN105296606B publication Critical patent/CN105296606B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/10Nucleic acid folding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Organic Chemistry (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明公开了确定生物样本中预定来源的游离核酸比例的方法、装置及其用途,其中,该方法包括:(1)对含有游离核酸的生物样本进行核酸测序,以便获得多个测序数据的测序结果;(2)基于所述测序结果,确定所述样本中长度落入预定范围的核酸分子的数目;以及(3)基于所述长度落入预定范围的核酸分子的数目,确定所述生物样本中所述游离核酸的比例。利用该方法能够准确高效地确定生物样本中预定来源的游离核酸的比例,尤其适用于确定孕妇外周血中的胎儿核酸,以及肿瘤患者外周血中肿瘤核酸的比例。

Description

确定生物样本中游离核酸比例的方法、装置及其用途
技术领域
本发明涉及生物技术领域,具体地涉及确定生物样本中游离核酸比例的方法、装置及其用途。
背景技术
自1977年,研究者先后在肿瘤患者的外周血中发现了癌源性DNA,还证实了孕妇血浆中存在cff-DNA,而检测估算出肿瘤患者的外周血中的癌源性DNA,以及孕妇血浆中游离的胎儿DNA比例,即确定生物样本中预定来源的游离核酸比例,意义重大。
然而,目前确定生物样本中游离核酸比例的方法仍有待改进。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明的一个目的在于提出一种能够准确高效地确定生物样本中预定来源的游离核酸比例的方法。
需要说明的是,本发明是基于发明人的下列发现而完成的:
目前,用来估算外周血中胎儿游离的DNA比例主要有两个方向:1)利用母体外周血单核细胞中来自母体和来自游离胎儿DNA片段对特定标记物甲基化的不同反应进行估算;2)利用单核苷酸多态性(SNPs)位点表现的差异性,选择多个具有代表性的SNPs位点进行估算。这两种方法都存在一定的局限性:方法1)需要的血浆量比较大,方法2)需要探针捕获和高测序深度或是需要获得父源性信息。然而,至今未发现有报告是基于低覆盖深度的全基因组测序条件下对游离的胎儿DNA比例进行估算。有研究表明,母血循环中游离胎儿DNA片段一般比游离母体DNA片段要短,绝大部分小于313bp。受此启发,发明人发明了一套基于孕妇血浆测序估算游离的胎儿DNA比例的流程,并且,该方法应用性广,能应用到游离的不同来源DNA的领域。例如还可以用于估算肿瘤患者的外周血中的癌源性DNA的比例。
根据本发明的一个方面,本发明提供了一种确定生物样本中预定来源的游离核酸比例的方法。根据本发明的实施例,该方法包括:(1)对含有游离核酸的生物样本进行核酸测序,以便获得多个测序数据的测序结果;(2)基于所述测序结果,确定所述样本中长度落入预定范围的核酸分子的数目;以及(3)基于所述长度落入预定范围的核酸分子的数目,确定所述生物样本中所述游离核酸的比例。发明人惊奇地发现,利用本发明的方法能够准确高效地确定生物样本中预定来源的游离核酸比例,尤其适用于确定孕妇外周血中的游离胎儿核酸,以及肿瘤患者、疑似肿瘤患者或者肿瘤筛查者外周血中游离肿瘤核酸的比例。
根据本发明的实施例,所述生物样本为外周血。
根据本发明的实施例,所述预定来源的游离核酸为孕妇外周血中的游离胎儿核酸或母亲来源的游离核酸,或者肿瘤患者、疑似肿瘤患者或者肿瘤筛查者外周血中的游离肿瘤核酸或非肿瘤来源的游离核酸。由此,能够容易地确定孕妇外周血中的游离胎儿核酸的比例,后者肿瘤患者外周血中游离肿瘤核酸的比例。
根据本发明的一些具体示例,所述核酸为DNA。
根据本发明的实施例,所述测序结果包括所述游离核酸的长度。
根据本发明的实施例,所述测序为双末端测序、单末端测序或单分子测序。由此,容易得到游离核酸的长度,有利于后续步骤的进行。
根据本发明的实施例,所述核酸为DNA。
根据本发明的实施例,步骤(2)进一步包括:(2-1)将所述测序结果与参考基因组进行比对,以便构建唯一比对测序数据集,所述唯一比对测序数据集中的每一个测序数据仅能够与所述参考基因组的一个位置匹配;(2-2)确定所述唯一比对测序数据集中各测序数据所对应的核酸分子的长度;以及(2-3)确定长度落入所述预定范围的核酸分子的数目。由此,能够容易地确定样本中长度落入预定范围的核酸分子的数目,且结果准确可靠,重复性好。
根据本发明的实施例,其中,在步骤(2-2)中,将所述测序数据能够与所述参考基因组匹配的序列长度作为与所述测序数据对应的核酸分子的长度。由此,能够准确地确定唯一比对测序数据集中各测序数据所对应的核酸分子的长度。
根据本发明的实施例,所述测序为双末端测序,其中,在步骤(2-2)中,包括:(2-2-1)基于所述双末端测序数据的一侧测序数据,在所述参考基因组上,确定所述核酸的5’末端位置;(2-2-2)基于所述双末端测序数据的另一侧测序数据,在所述参考基因组上,确定所述核酸的3’末端位置;以及(2-2-3)基于所述核酸的5’末端位置以及所述核酸的3’末端位置,确定所述核酸的长度。由此,能够准确地确定唯一比对测序数据集中各测序数据所对应的核酸分子的长度。
根据本发明的实施例,所述预定范围是基于多个对照样品确定的,其中,所述对照样品中预定来源的游离核酸比例是已知的。由此,确定的预定范围结果准确可靠。
根据本发明的实施例,所述预定范围是基于至少20个对照样品确定的。
根据本发明的实施例,所述预定范围是通过下列步骤确定的:(a)确定所述多个对照样品中所包含游离核酸分子的长度;(b)设定多个候选长度范围,并分别确定所述多个对照样品在各候选长度范围内出现游离核酸分子的频率;(c)基于所述多个对照样品在各候选长度范围内出现游离核酸分子的频率以及所述对照样品中预定来源的游离核酸比例,确定各所述候选长度范围与所述预定来源的核酸比例的相关性系数;以及(d)选择相关性系数最大的候选长度范围作为所述预定范围。由此,能够准确有效地确定预定范围。
根据本发明的实施例,所述候选长度的跨度为5~20bp。
根据本发明的实施例,步骤(3)进一步包括:(3-1)基于所述长度落入预定范围的核酸分子的数目,确定在所述预定范围内出现游离核酸分子的频率;以及(3-2)基于在所述预定范围内出现游离核酸分子的频率,根据预定的函数,确定所述生物样本中预定来源的游离核酸的比例,其中,所述预定的函数是基于所述多个对照样品确定的。由此,能够有效地确定生物样本中所述游离核酸的比例,且结果准确可靠,可重复性好。
根据本发明的实施例,所述预定的函数是通过下列步骤获得的:(i)分别在所述多个对照样品中,确定在所述预定范围内出现游离核酸分子的频率;以及(ii)将所述多个对照样品中在所述预定范围内出现游离核酸分子的频率与已知的预定来源的游离核酸比例进行拟合,以便确定所述预定的函数。由此,确定的预定的函数准确可靠,有利于后续步骤的进行。
根据本发明的实施例,所述拟合为线性拟合。
根据本发明的实施例,所述预定来源的游离核酸为孕妇外周血中的游离胎儿核酸,所述预定范围是185~204bp。由此,基于该预定范围,能够准确地确定生物样本中游离核酸的比例。根据本发明的实施例,所述预定的函数为d=0.0334*p+1.6657,其中,d表示游离胎儿核酸比例,p表示在所述预定范围内出现游离核酸分子的频率。基于该预定的函数,能够有效地确定生物样本中所述游离核酸的比例,且结果准确可靠,可重复性好。
根据本发明的实施例,所述对照样品为已知游离胎儿核酸比例的孕妇外周血样本。由此,预定范围确定准确。
根据本发明的实施例,所述对照样品为已知游离胎儿核酸比例的怀有正常男胎的孕妇外周血样本,并且所述已知游离胎儿核酸比例是利用Y染色体确定的。由此,预定范围确定准确。
根据本发明的实施例,所述对照样品的游离核酸比例为游离胎儿DNA比例,并且所述游离胎儿DNA比例是利用Y染色体估测得到的。由此,能够有效利用对照样品的游离核酸比例,确定预定范围,进而确定待测孕妇样本中长度落入预定范围的核酸分子的数目以及待测孕妇样本中游离胎儿DNA比例。
根据本发明的另一方面,本发明还提供了一种用于确定生物样本中预定来源的游离核酸比例的设备。根据本发明的实施例,该设备包括:测序装置,所述测序装置用于对含有游离核酸的生物样本进行核酸测序,以便获得多个测序数据的测序结果;计数装置,所述计数装置与所述测序装置相连,并且用于基于所述测序结果,确定所述样本中长度落入预定范围的核酸分子的数目;以及游离核酸比例确定装置,所述游离核酸比例确定装置与所述计数装置相连,并且用于基于所述长度落入预定范围的核酸分子的数目,确定所述生物样本中所述预定来源的游离核酸的比例。发明人惊奇地发现,本发明的设备适于实施前面所述的本发明的确定生物样本中预定来源的游离核酸比例的方法,进而利用本发明的设备能够准确高效地确定生物样本中预定来源的游离核酸的比例,尤其适用于确定孕妇外周血中的游离胎儿核酸,以及肿瘤患者、疑似肿瘤患者或者肿瘤筛查者外周血中的游离肿瘤核酸的比例。
根据本发明的实施例,所述生物样本为外周血。
根据本发明的实施例,所述预定来源的游离核酸为孕妇外周血中的游离胎儿核酸或母亲来源的游离核酸,或者肿瘤患者、疑似肿瘤患者或者肿瘤筛查者外周血中的游离肿瘤核酸或非肿瘤来源的游离核酸。由此,能够容易地确定孕妇外周血中的游离胎儿核酸的比例,或者肿瘤患者、疑似肿瘤患者或者肿瘤筛查者外周血中游离肿瘤核酸的比例。
根据本发明的实施例,所述核酸为DNA。
根据本发明的实施例,所述测序结果包括所述游离核酸的长度。
根据本发明的实施例,所述测序为双末端测序、单末端测序或单分子测序。由此,容易得到游离核酸的长度,有利于后续步骤的进行。
根据本发明的实施例,所述计数装置进一步包括:比对单元,所述比对单元用于将所述测序结果与参考基因组进行比对,以便构建唯一比对测序数据集,所述唯一比对测序数据集中的每一个测序数据仅能够与所述参考基因组的一个位置匹配;第一长度确定单元,所述第一长度确定单元与所述比对单元相连,用于确定所述唯一比对测序数据集中各测序数据所对应的核酸分子的长度;以及数目确定单元,所述数目确定单元与所述第一长度确定单元相连,用于确定长度落入所述预定范围的核酸分子的数目。由此,能够容易地确定样本中长度落入预定范围的核酸分子的数目,且结果准确可靠,重复性好。
根据本发明的实施例,其中,所述第一长度确定单元将所述测序数据能够与所述参考基因组匹配的序列长度作为与所述测序数据对应的核酸分子的长度。由此,能够准确地确定唯一比对测序数据集中各测序数据所对应的核酸分子的长度。
根据本发明的实施例,所述测序为双末端测序,其中,所述第一长度确定单元进一步包括:5’末端位置确定模块,所述5’末端位置确定模块用于基于所述双末端测序数据的一侧测序数据,在所述参考基因组上,确定所述核酸的5’末端位置;3’末端位置确定模块,所述3’末端位置确定模块与所述5’末端位置确定模块相连,用于基于所述双末端测序数据的另一侧测序数据,在所述参考基因组上,确定所述核酸的3’末端位置;以及长度计算模块,所述长度计算模块与所述3’末端位置确定模块相连,用于基于所述核酸的5’末端位置以及所述核酸的3’末端位置,确定所述核酸的长度。由此,能够准确地确定唯一比对测序数据集中各测序数据所对应的核酸分子的长度。
根据本发明的实施例,进一步包括预定范围确定装置,所述预定范围确定装置用于基于多个对照样品确定所述预定范围,其中,所述对照样品中预定来源的游离核酸比例是已知的,任选地,所述预定范围是基于至少20个对照样品确定的。
根据本发明的实施例,所述预定范围确定装置进一步包括:第二长度确定单元,所述第二长度确定单元用于确定所述多个对照样品中所包含游离核酸分子的长度;第一比例确定单元,所述第一比例确定单元与所述第二长度确定单元相连,用于设定多个候选长度范围,并分别确定所述多个对照样品在各所述候选长度范围内出现游离核酸分子的频率;相关性系数确定单元,所述相关性系数确定单元与所述第一比例确定单元相连,用于基于所述多个对照样品在各候选长度范围内出现游离核酸分子的频率以及所述对照样品中预定来源的游离核酸比例,确定各所述候选长度范围与所述预定来源的游离核酸比例的相关性系数;以及预定范围确定单元,所述预定范围确定单元与所述相关性系数确定单元相连,用于选择相关性系数最大的候选长度范围作为所述预定范围。由此,能够准确有效地确定预定范围。
根据本发明的实施例,所述候选长度的跨度为1~20bp。
根据本发明的实施例,所述多个候选长度范围的步长为1~2bp。
根据本发明的实施例,所述游离核酸比例确定装置进一步包括:第二比例确定单元,所述第二比例确定单元用于基于所述长度落入预定范围的核酸分子的数目,确定在所述预定范围内出现游离核酸分子的频率;以及游离核酸比例计算单元,所述游离核酸比例计算单元与所述第二比例确定单元相连,用于基于在所述预定范围内出现游离核酸分子的频率,根据预定的函数,确定所述生物样本中预定来源的游离核酸的比例,其中,所述预定的函数是基于所述多个对照样品确定的。由此,能够有效地确定生物样本中所述游离核酸的比例,且结果准确可靠,可重复性好。
根据本发明的实施例,进一步包括预定函数确定装置,所述预定函数确定装置包括:第三比例确定单元,所述第三比例确定单元用于分别在所述多个对照样品中,确定在所述预定范围内出现游离核酸分子的频率;以及拟合单元,所述拟合单元与所述第三比例确定单元相连,用于将所述多个对照样品中在所述预定范围内出现游离核酸分子的频率与已知的预定来源的游离核酸比例进行拟合,以便确定所述预定的函数。由此,确定的预定的函数准确可靠,有利于后续步骤的进行。
根据本发明的实施例,所述拟合为线性拟合。
根据本发明的实施例,所述预定来源的游离核酸为孕妇外周血中的游离胎儿核酸,所述预定范围是185~204bp。由此,基于该预定范围,能够准确地确定生物样本中游离核酸的比例。
根据本发明的实施例,所述预定的函数为d=0.0334*p+1.6657,其中,d表示游离胎儿核酸比例,p表示在所述预定范围内出现游离核酸分子的频率。基于该预定的函数,能够有效地确定生物样本中所述游离核酸的比例,且结果准确可靠,可重复性好。
根据本发明的实施例,所述对照样品为已知游离胎儿核酸比例的孕妇外周血样本。
根据本发明的实施例,所述对照样品为已知游离胎儿核酸比例的怀有正常男胎的孕妇外周血样本,并且所述已知游离胎儿核酸比例是利用Y染色体确定的。由此,预定范围确定准确。
根据本发明的实施例,所述对照样品的游离核酸比例为游离胎儿DNA比例,并且所述游离胎儿DNA比例是利用适于进行Y染色体估测的设备得到的。由此,能够有效利用对照样品的游离核酸比例,确定预定范围,进而确定待测孕妇样本中长度落入预定范围的核酸分子的数目以及待测孕妇样本中游离胎儿DNA比例。
需要说明的是,本发明的确定生物样本中游离核酸比例的方法和装置至少具有以下有点:
1)普遍性:可以估算出所有通过质控样品的游离游离胎儿DNA的比率,特别是女胎。
2)可提高NIPT检测的准确度。
3)操作简易性:只需用下机数据直接估算游离的来源游离胎儿DNA比例。
根据本发明的又一方面,本发明提供了一种检测双胞胎染色体非整倍性的方法。根据本发明的实施例,该方法包括:(1)对怀有双胞胎的孕妇的外周血进行游离核酸测序,以便获得由多个测序数据构成的测序结果;(2)基于所述测序数据,根据前面所述的确定生物样本中游离核酸比例的方法,确定第一游离胎儿DNA比例;(3)基于所述测序结果中来源于预定染色体的测序数据,确定第三游离胎儿DNA比例;以及(4)基于所述第一游离胎儿DNA比例与所述第三游离胎儿DNA比例,确定所述双胞胎中针对所述预定染色体是否存在非整倍性。由此,能够准确有效地进行双胞胎染色体非整倍性检测。
根据本发明的实施例,所述第三游离胎儿DNA比例是基于下列公式确定的:fra.chri=2*(chri.ER%/adjust.chri.ER%-1)*100%,其中,fra.chri表示所述第三游离胎儿DNA比例,i为所述预定染色体的编号,并且i为1~22范围内的任意整数;chri.ER%表示所述测序结果中来源于所述预定染色体的测序数据占总测序数据的百分比;adjust.chri.ER%表示预先确定的怀有正常双胞胎的孕妇外周血样本中的来源于所述预定染色体的游离核酸的测序数据占总测序数据的百分比平均值。由此,能够准确确定第三游离胎儿DNA比例。
根据本发明的实施例,在步骤(4)中,包括:(a)确定所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值;以及(b)将步骤(a)中所得到的比值与预定的第三阈值和第四阈值进行比较,以便确定所述双胞胎针对所述预定染色体是否存在非整倍性。由此,能够有效实现双胞胎染色体非整倍性检测。
根据本发明的实施例,所述第三阈值是基于多个已知双胞胎针对所述预定染色体均不存在非整倍性的参照样本确定的,所述第四阈值是基于多个已知双胞胎针对所述预定染色体均为非整倍性的参照样本确定的。
根据本发明的实施例,所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值小于所述第三阈值表示所述双胞胎针对所述预定染色体均不存在非整倍性,所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值大于所述第四阈值表示所述双胞胎均针对所述预定染色体均为非整倍性,所述第二游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值等于所述第三阈值或者第四阈值,或者介于所述第三阈值与所述第四值之间表示所述双胞胎其中一个针对所述预定染色体具有非整倍性,另外一个针对所述预定染色体不具有非整倍性。
根据本发明的实施例,所述第三阈值为0.35,所述第四阈值为0.7。
根据本发明的实施例,所述预定染色体为18、21和23号染色体至少之一。
根据本发明的再一方面,本发明提供了一种确定双胞胎染色体非整倍性的系统。根据本发明的实施例,该系统包括:第一游离胎儿DNA比例确定设备,所述第一游离胎儿DNA比例确定设备为前面所述的确定生物样本中游离核酸比例的设备,用于对怀有双胞胎的孕妇的外周血进行游离核酸测序,以便获得由多个测序数据构成的测序结果,并且基于所述测序数据,确定第一游离胎儿DNA比例;第三游离胎儿DNA比例确定设备,所述第三游离胎儿DNA比例确定设备适于基于所述测序结果中来源于预定染色体的测序数据,确定第三游离胎儿DNA比例;以及第一非整倍性确定设备,所述第一非整倍性确定设备适于基于所述第一游离胎儿DNA比例与所述第三游离胎儿DNA比例,确定所述双胞胎中针对所述预定染色体是否存在非整倍性。发明人惊奇地发现,利用本发明的系统能够准确有效地实现双胞胎染色体非整倍性检测。
根据本发明的实施例,所述第三游离胎儿DNA比例是基于下列公式确定的:fra.chri=2*(chri.ER%/adjust.chri.ER%-1)*100%,其中,fra.chri表示所述第三游离胎儿DNA比例,i为所述预定染色体的编号,并且i为1~22范围内的任意整数;chri.ER%表示所述测序结果中来源于所述预定染色体的测序数据占总测序数据的百分比;adjust.chri.ER%表示预先确定的怀有正常双胞胎的孕妇外周血样本中来源于所述预定染色体的游离核酸的测序数据占总测序数据的百分比平均值。由此,能够准确确定第三游离胎儿DNA比例。
根据本发明的实施例,非整倍性确定设备进一步包括:比值确定单元,所述比值确定单元用于确定所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值;以及比较单元,将所得到的比值与预定的第三阈值和第四阈值进行比较,以便确定所述双胞胎针对所述预定染色体是否存在非整倍性。由此,能够有效实现双胞胎染色体非整倍性检测。
根据本发明的实施例,所述第三阈值是基于多个已知双胞胎针对所述预定染色体均不存在非整倍性的参照样本确定的,所述第四阈值是基于多个已知双胞胎针对所述预定染色体均为非整倍性的参照样本确定的。
根据本发明的实施例,所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值小于所述第三阈值表示所述双胞胎针对所述预定染色体均不存在非整倍性,所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值大于所述第四阈值表示所述双胞胎均针对所述预定染色体均为非整倍性,所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值等于所述第三阈值或者第四阈值,或者介于所述第三阈值与所述第四值之间表示所述双胞胎其中一个针对所述预定染色体具有非整倍性,另外一个针对所述预定染色体不具有非整倍性。由此,能够有效实现双胞胎染色体非整倍性检测。
根据本发明的实施例,所述第三阈值为0.35,所述第四阈值为0.7。
根据本发明的实施例,所述预定染色体为18、21和23号染色体至少之一。
根据本发明的另一方面,本发明提供了一种确定双胞胎染色体非整倍性的方法。根据本发明的实施例,该方法包括:(1)对怀有双胞胎的孕妇的外周血进行游离核酸测序,以便获得由多个测序数据构成的测序结果;(2)确定所述测序结果中来源于染色体i的测序数据数目占总测序数据的比例xi,其中,i表示染色体编号,并且i为1~22范围内的任意整数;(3)基于公式Ti=(xii)/σi,确定针对染色体i的T值,其中,i表示染色体编号,并且i为1~22范围内的任意整数,μi表示在参考数据库中被选为参照系的第i条染色体的测序数据占总测序数据的百分含量的均值,σi:在参考数据库中被选为参照系的第i条染色体的测序数据占总测序数据的百分含量的标准差;(4)基于公式Li=log(d(Ti,a))/log(d(T2i,a))确定针对染色体i的L值,其中,i表示染色体编号,并且i为1~22范围内的任意整数,T2i=(xii*(1+fra/2))/σi;d(Ti,a)和d(T2i,a)为t分布概率密度函数,a为自由度,fra是根据前面所述的确定生物样本中游离核酸比例的方法确定的第一游离胎儿DNA比例,或者是使用Y染色体估算的胎儿浓度fra.chrY%,其中,
fra.chry=(chry.ER%-Female.chr.ER%)/(Man.chry.UR%-Female.chry.ER%)*100%,其中,fra.chry表示游离胎儿DNA比例,chry.ER%表示所述测序结果中来源于染色体Y的测序数据占总测序数据的百分比;Female.chry.ER%表示预先确定的怀有正常女胎的孕妇外周血样本中来源于染色体Y的游离核酸的测序数据占总测序数据的百分比的平均值;以及Man.chry.ER%表示预先确定的正常男性外周血样本中来源于染色体Y的游离核酸的测序数据占总测序数据的百分比的平均值;(5)根据T值和L值作四象限图,横坐标为L值,纵坐标为T值,按照直线T=预定的第五阈值,L=预定的第六阈值,将所述四象限图进行划分区域,其中,当待测样本落在第一象限,则双胎中两个胎儿都判定为三体;当待测样本落在第二象限,则双胎中有一个胎儿都判定为三体,一个正常;当待测样本落在第三象限,则双胎中两个胎儿都判定为正常;当待测样本落在第四象限,则双胎中判定为胎儿浓度比较低的样本,不采用其结果。发明人惊奇地发现,利用本发明的确定双胞胎染色体非整倍性的方法,能够准确高效地实现对孕妇双胞胎染色体非整倍性的检测,确定双胞胎预定染色体是否存在非整倍性。
根据本发明的另一方面,本发明还提供了一种确定双胞胎染色体非整倍性的系统。根据本发明的实施例,该系统包括:xi值确定设备,所述xi值确定设备用于对怀有双胞胎的孕妇的外周血进行游离核酸测序,以便获得由多个测序数据构成的测序结果,并且确定所述测序结果中来源于染色体i的测序数据数目占总测序数据的比例xi,其中,i表示染色体编号,并且i为1~22范围内的任意整数;T值确定设备,所述T值确定设备用于基于公式Ti=(xii)/σi,确定针对染色体i的T值,其中,i表示染色体编号,并且i为1~22范围内的任意整数,μi表示在参考数据库中被选为参照系的第i条染色体的测序数据占总测序数据的百分含量的均值,σi:在参考数据库中被选为参照系的第i条染色体的测序数据占总测序数据的百分含量的标准差;L值确定设备,所述L值确定设备用于基于公式Li=log(d(Ti,a))/log(d(T2i,a))确定针对染色体i的L值,其中,i表示染色体编号,并且i为1~22范围内的任意整数,T2i=(xii*(1+fra/2))/σi;d(Ti,a)和d(T2i,a)为t分布概率密度函数,a为自由度,fra是根据前面所述确定的第一游离胎儿DNA比例,或者是使用Y染色体估算的胎儿浓度fra.chrY%,其中,
fra.chry=(chry.ER%-Female.chr.ER%)/(Man.chry.UR%-Female.chry.ER%)*100%,其中,fra.chry表示第二游离胎儿DNA比例,chry.ER%表示所述测序结果中来源于染色体Y的测序数据占总测序数据的百分比;Female.chry.ER%表示预先确定的怀有正常女胎的孕妇外周血样本中来源于染色体Y的游离核酸的测序数据占总测序数据的百分比的平均值;以及Man.chry.ER%表示预先确定的正常男性外周血样本中来源于染色体Y的游离核酸的测序数据占总测序数据的百分比的平均值;第二非整倍性确定设备,所述第二非整倍性确定设备适于根据T值和L值作四象限图,横坐标为L值,纵坐标为T值,按照直线T=预定的第五阈值,L=预定的第六阈值,将所述四象限图进行划分区域,其中,当待测样本落在第一象限,则双胎中两个胎儿都判定为三体;当待测样本落在第二象限,则双胎中有一个胎儿都判定为三体,一个正常;当待测样本落在第三象限,则双胎中两个胎儿都判定为正常;当待测样本落在第四象限,则双胎中判定为胎儿浓度比较低的样本,不采用其结果。发明人发现,利用本发明的确定双胞胎染色体非整倍性的系统,能够准确高效地实现对孕妇双胞胎染色体非整倍性的检测,确定双胞胎预定染色体是否存在非整倍性。
在本发明的又一方面,本发明提出了一种检测胎儿嵌合体的方法。根据本发明的实施例,该方法包括:(1)对怀有胎儿孕妇的外周血进行游离核酸测序,以便获得由多个测序数据构成的测序结果,任选地,所述胎儿为男胎;(2)基于所述测序数据,根据前面所述的方法,确定第一游离胎儿DNA比例,或者,基于下列公式,使用Y染色体估算胎儿浓度fra.chrY%作为第一游离胎儿DNA比例:
fra.chry=(chry.ER%-Female.chr.ER%)/(Man.chry.UR%-Female.chry.ER%)*100%,其中,fra.chry表示第一游离胎儿DNA比例,chry.ER%表示所述测序结果中来源于染色体Y的测序数据占总测序数据的百分比;Female.chry.ER%表示预先确定的怀有正常女胎的孕妇外周血样本中来源于染色体Y的游离核酸的测序数据占总测序数据的百分比的平均值;以及Man.chry.ER%表示预先确定的正常男性外周血样本中来源于染色体Y的游离核酸的测序数据占总测序数据的百分比的平均值;(3)基于所述测序结果中来源于预定染色体的测序数据,确定第三游离胎儿DNA比例;以及(4)基于所述第一游离胎儿DNA比例与所述第三游离胎儿DNA比例,确定所述胎儿中针对所述预定染色体是否存在嵌合体。由此,能够准确地对胎儿中是否存在特定染色体的嵌合体情况进行分析。
根据本发明的实施例,该方法还可以进一步具有下列附加技术特征:
根据本发明的实施例,所述第三游离胎儿DNA比例是基于下列公式确定的:
fra.chri=2*(chri.ER%/adjust.chri.ER%-1)*100%
其中,
fra.chri表示所述第三游离胎儿DNA比例,i为所述预定染色体的编号,并且i为1~22范围内的任意整数;
chri.ER%表示所述测序结果中来源于所述预定染色体的测序数据占总测序数据的百分比;
adjust.chri.ER%表示预先确定的怀有正常胎儿的孕妇外周血样本中来源于所述预定染色体的游离核酸的测序数据占总测序数据的百分比平均值。由此,可以进一步提高对胎儿中是否存在特定染色体的嵌合体情况进行分析的效率。
根据本发明的实施例,在步骤(4)中,包括:
(a)确定所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值;以及
(b)将步骤(a)中所得到的比值与预定的多个阈值进行比较,以便确定所述胎儿针对所述预定染色体是否存在嵌合体。由此,可以进一步提高对胎儿中是否存在特定染色体的嵌合体情况进行分析的效率。
根据本发明的实施例,所述预定的多个阈值包括选自下列的至少之一:
第七阈值,所述第七阈值是基于多个已知针对所述预定染色体为完全单体的参照样本确定的,
第八阈值,所述第八阈值是基于多个已知针对所述预定染色体为单体嵌合的参照样本确定的,
第九阈值,所述第九阈值是基于多个已知针对所述预定染色体为正常的参照样本确定的,
第十阈值,所述第十阈值是基于多个已知针对所述预定染色体为完全三体的参照样本确定的。
根据本发明的实施例,所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值小于所述第七阈值表示所述胎儿针对所述预定染色体表示所述胎儿针对所述预定染色体为完全单体;
所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值不小于所述第七阈值并且不大于所述第八阈值表示所述胎儿针对所述预定染色体表示所述胎儿针对所述预定染色体为单体嵌合;
所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值大于所述第八阈值并且小于所述第九阈值表示所述胎儿针对所述预定染色体表示所述胎儿针对所述预定染色体为正常;
所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值不小于所述第九阈值并且不大于所述第十阈值表示所述胎儿针对所述预定染色体表示所述胎儿针对所述预定染色体为三体嵌合;
所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值大于所述第十阈值表示所述胎儿针对所述预定染色体表示所述胎儿针对所述预定染色体为完全三体。
根据本发明的实施例,所述第七阈值为至少-1并且所述第七阈值小于0,任选地所述第五阈值为-0.85;
所述第八阈值大于所述第七阈值并且所述第八阈值小于0,任选地所述第八阈值为-0.3;
所述第九阈值大于0并且所述第九阈值小于1,任选地所述第九阈值为0.3;
所述第十阈值大于所述第九阈值并且所述第十阈值小于1,任选地所述第十阈值为0.85。由此,可以进一步提高对胎儿中是否存在特定染色体的嵌合体情况进行分析的效率。
在本发明的又一方面,本发明提出了一种检测胎儿嵌合体的系统。根据本发明的实施例,该系统包括:
第一游离胎儿DNA比例确定设备,所述第一游离胎儿DNA比例确定设备为前面所述的确定生物样本中游离核酸比例的设备,用于对胎儿的孕妇的外周血进行核酸测序,以便获得由多个测序数据构成的测序结果,并且基于所述测序数据,确定第一游离胎儿DNA比例,或者,所述第一游离胎儿DNA比例确定设备适于基于下列公式,使用Y染色体估算胎儿浓度fra.chrY%作为第一游离胎儿DNA比例:
fra.chry=(chry.ER%-Female.chr.ER%)/(Man.chry.UR%-Female.chry.ER%)*100%,其中,fra.chry表示第一游离胎儿DNA比例,chry.ER%表示所述测序结果中来源于染色体Y的测序数据占总测序数据的百分比;Female.chry.ER%表示预先确定的怀有正常女胎的孕妇外周血样本中来源于染色体Y的游离核酸的测序数据占总测序数据的百分比的平均值;以及Man.chry.ER%表示预先确定的正常男性外周血样本中来源于染色体Y的游离核酸的测序数据占总测序数据的百分比的平均值;第三游离胎儿DNA比例确定设备,所述第三游离胎儿DNA比例确定设备适于基于所述测序结果中来源于预定染色体的测序数据,确定第三游离胎儿DNA比例;以及嵌合体确定设备,所述嵌合体确定设备适于基于所述第一游离胎儿DNA比例与所述第三游离胎儿DNA比例,确定所述双胞胎中针对所述预定染色体是否存在嵌合体。根据本发明的实施例,上述用于确定胎儿嵌合体的系统可以有效地实施前面所述的确定胎儿嵌合体的方法,从而能够有效地对胎儿嵌合体情况进行分析。
根据本发明的实施例,上述确定胎儿嵌合体的系统还可以具有下列附加技术特征:
根据本发明的实施例,所述第三游离胎儿DNA比例是基于下列公式确定的:
fra.chri=2*(chri.ER%/adjust.chri.ER%-1)*100%
其中,
fra.chri表示所述第三游离胎儿DNA比例,i为所述预定染色体的编号,并且i为1~22范围内的任意整数;
chri.ER%表示所述测序结果中来源于所述预定染色体的测序数据占总测序数据的百分比;
adjust.chri.ER%表示预先确定的怀有正常胎儿的孕妇外周血样本中来源于所述预定染色体的游离核酸测序数据占总测序数据的百分比平均值。由此,可以进一步提高对胎儿中是否存在特定染色体的嵌合体情况进行分析的效率。
根据本发明的实施例,在步骤(4)中,包括:
(a)确定所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值;以及
(b)将步骤(a)中所得到的比值与预定的多个阈值进行比较,以便确定所述胎儿针对所述预定染色体是否存在嵌合体。由此,可以进一步提高对胎儿中是否存在特定染色体的嵌合体情况进行分析的效率。
根据本发明的实施例,所述预定的多个阈值包括选自下列的至少之一:
第七阈值,所述第七阈值是基于多个已知针对所述预定染色体为完全单体的参照样本确定的,
第八阈值,所述第八阈值是基于多个已知针对所述预定染色体为单体嵌合的参照样本确定的,
第九阈值,所述第九阈值是基于多个已知针对所述预定染色体为正常的参照样本确定的,
第十阈值,所述第十阈值是基于多个已知针对所述预定染色体为完全三体的参照样本确定的。
根据本发明的实施例,所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值小于所述第七阈值表示所述胎儿针对所述预定染色体表示所述胎儿针对所述预定染色体为完全单体;
所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值不小于所述第七阈值并且不大于所述第八阈值表示所述胎儿针对所述预定染色体表示所述胎儿针对所述预定染色体为单体嵌合;
所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值大于所述第八阈值并且小于所述第九阈值表示所述胎儿针对所述预定染色体表示所述胎儿针对所述预定染色体为正常;
所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值不小于所述第九阈值并且不大于所述第十阈值表示所述胎儿针对所述预定染色体表示所述胎儿针对所述预定染色体为三体嵌合;
所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值大于所述第十阈值表示所述胎儿针对所述预定染色体表示所述胎儿针对所述预定染色体为完全三体。
根据本发明的实施例,所述第七阈值大于-1并且所述第七阈值小于0,任选地所述第五阈值为-0.85;
所述第八阈值大于所述第七阈值并且所述第八阈值小于0,任选地所述第八阈值为-0.3;
所述第九阈值大于0并且所述第九阈值小于1,任选地所述第九阈值为0.3;
所述第十阈值大于所述第九阈值并且所述第十阈值小于1,任选地所述第十阈值为0.85。由此,可以进一步提高对胎儿中是否存在特定染色体的嵌合体情况进行分析的效率。
在本发明的又一方面,本发明提出了一种检测胎儿嵌合体的方法,根据本发明的实施例,该确定胎儿嵌合体的方法包括:
(1)对怀有胎儿的孕妇的外周血进行游离核酸测序,以便获得由多个测序数据构成的测序结果;
(2)确定所述测序结果中来源于染色体i的测序数据数目占总测序数据的比例xi,其中,i表示染色体编号,并且i为1~22范围内的任意整数;
(3)基于公式Ti=(xii)/σi,确定针对染色体i的T值,其中,i表示染色体编号,并且i为1~22范围内的任意整数,μi表示在参考数据库中被选为参照系的第i条染色体的测序数据占总测序数据的百分含量的均值,σi:在参考数据库中被选为参照系的第i条染色体的测序数据占总测序数据的百分含量的标准差;
(4)基于公式Li=log(d(Ti,a))/log(d(T2i,a))确定针对染色体i的L值,其中,i表示染色体编号,并且i为1~22范围内的任意整数,
T2i=(xii*(1+fra/2))/σi
d(Ti,a)和d(T2i,a)为t分布概率密度函数,a为自由度,fra是根据前面所述的确定生物样本中游离核酸比例的方法确定的游离胎儿DNA比例;
(5)如果T不大于0,则根据T值和L值作四象限图,横坐标为L值,纵坐标为T值,按照直线T=预定的第十一阈值,L=预定的第十二阈值,将所述四象限图进行划分区域,
其中,
当待测样本落在第一象限,则将所述胎儿判定为针对所述预定染色体为完全单体或单体嵌合;
当待测样本落在第二象限,则将所述胎儿判定为针对所述预定染色体为单体嵌合;
当待测样本落在第三象限,则将所述胎儿判定为针对所述预定染色体为正常;
当待测样本落在第四象限,则将所述胎儿判定为胎儿浓度比较低的样本,不采用其结果,
如果T大于0,则根据T值和L值作四象限图,横坐标为L值,纵坐标为T值,按照直线T=预定的第十三阈值,L=预定的第十四阈值,将所述四象限图进行划分区域,
其中,
当待测样本落在第一象限,则将所述胎儿判定为针对所述预定染色体为完全三体或三体嵌合;
当待测样本落在第二象限,则将所述胎儿判定为针对所述预定染色体为三体嵌合;
当待测样本落在第三象限,则将所述胎儿判定为针对所述预定染色体为正常;
当待测样本落在第四象限,则将所述胎儿判定为胎儿浓度比较低的样本,不采用其结果,
任选地,所述第十一阈值和所述第十三阈值分别独立地为3,所述第十二阈值和所述十四阈值分别独立地为1。
由此,可以有效地对胎儿嵌合体情况进行分析。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是根据本发明一个实施例的确定生物样本中游离核酸比例的方法的流程示意图;
图2是根据本发明一个实施例的确定落入预定范围的核酸分子的数目的方法的流程示意图;
图3是根据本发明一个实施例的确定核酸分子的长度的方法的流程示意图;
图4是根据本发明一个实施例的确定预定范围的方法的流程示意图;
图5是根据本发明一个实施例的确定预定来源的游离核酸比例的方法的流程示意图;
图6是根据本发明一个实施例的确定预定函数的方法的流程示意图;
图7是根据本发明一个实施例的用于确定生物样本中预定来源的游离核酸比例的设备的结构示意图;
图8是根据本发明一个实施例的计数装置的结构示意图;
图9是根据本发明一个实施例的第一长度确定单元的结构示意图;
图10是根据本发明一个实施例的预定范围确定装置的结构示意图;
图11是根据本发明一个实施例的游离核酸比例确定装置的结构示意图;
图12是根据本发明一个实施例的预定函数确定装置的结构示意图;
图13是根据本发明一个实施例,37例已知怀有正常男胎的孕妇样本由Y染色体估测得到的游离胎儿DNA游离胎儿DNA比例,及DNA片段长度在185bp~204bp内的DNA分子出现的频率的相关性系数线性拟合图;以及
图14-16是根据本发明一个实施例,11例待测样本的T值&L值四象限图。
具体实施方式
下面详细描述本发明的实施例。下面描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
确定生物样本中游离核酸比例的方法
根据本发明的一个方面,本发明提供了一种确定生物样本中预定来源的游离核酸比例的方法。发明人惊奇地发现,利用本发明的方法能够准确高效地确定生物样本中游离核酸的比例,尤其适用于确定孕妇外周血中的胎儿核酸,以及肿瘤患者外周血中肿瘤核酸的比例。
需要说明的是,在本文中所采用的表达方式“生物样本中预定来源的游离核酸比例”是指在生物样本中特定来源的游离核酸分子数占总游离核酸分子数的比例。例如,当所述生物样本为孕妇外周血,所述预定来源的游离核酸为游离胎儿核酸时,“生物样本中预定来源的游离核酸比例”即游离胎儿核酸比例,表示孕妇外周血中含有的游离胎儿核酸分子数占总游离核酸分子数的比例,有时,也可以称之为“孕妇外周血中的游离胎儿DNA浓度”或者游离胎儿DNA比例。再例如,当所述生物样本为肿瘤患者、疑似肿瘤患者或者肿瘤筛查者外周血,所述预定来源的游离核酸为游离肿瘤核酸时,“生物样本中预定来源的游离核酸比例”即游离肿瘤核酸比例,表示肿瘤患者、疑似肿瘤患者或者肿瘤筛查者外周血中含有的游离肿瘤核酸分子数占总游离核酸分子数的比例。根据本发明的实施例,参照图1,该方法包括:
S100:核酸测序
对含有游离核酸的生物样本进行核酸测序,以便获得多个测序数据的测序结果。根据本发明的实施例,所述生物样本为外周血。根据本发明的实施例,所述预定来源的游离核酸为孕妇外周血中的游离胎儿核酸,或者游离肿瘤核酸。由此,能够容易地确定孕妇外周血中的游离胎儿核酸的比例,或者者肿瘤患者、疑似肿瘤患者或者肿瘤筛查者外周血中游离肿瘤核酸的比例。根据本发明的一些具体示例,所述核酸为DNA。需要说明的是,本文中所使用的术语“测序数据”即sequencereads,对应测序的核酸分子。
根据本发明的实施例,所述测序结果包括所述游离核酸的长度。
根据本发明的实施例,所述测序为双末端测序、单末端测序或单分子测序。由此,容易得到游离核酸的长度,有利于后续步骤的进行。
S200:确定落入预定范围的核酸分子数目
基于所述测序结果,确定所述样本中长度落入预定范围的核酸分子的数目。
其中,需要说明的是,这里所使用的术语“长度”是指核酸分子(reads)的长度,可以用碱基对即bp作为单位。
根据本发明的实施例,参照图2,S200进一步包括:
S210:将测序结果与参考基因组进行比对。具体地,将所述测序结果与参考基因组进行比对,以便构建唯一比对测序数据集,所述唯一比对测序数据集中的每一个测序数据仅能够与所述参考基因组的一个位置匹配,优选没有错配或者至多有1个或者至多2个错配的测序数据。
S220:确定核酸分子的长度。具体地,确定所述唯一比对测序数据集中各测序数据所对应的核酸分子的长度。
S230:确定落入预定范围的核酸分子数目。具体地,确定长度落入所述预定范围的核酸分子的数目。
由此,能够容易地确定样本中长度落入预定范围的核酸分子的数目,且结果准确可靠,重复性好。
其中,根据本发明一些具体示例,其中,在步骤S220中,将所述测序数据能够与所述参考基因组匹配的序列长度作为与所述测序数据对应的核酸分子的长度。由此,能够准确地确定唯一比对测序数据集中各测序数据所对应的核酸分子的长度。
根据本发明的实施例,所述测序为双末端测序,其中,参照图3,步骤S220包括:
S2210:确定5’末端位置。具体地,基于所述双末端测序数据的一侧测序数据,在所述参考基因组上,确定所述核酸的5’末端位置。
S2220:确定3’末端位置。具体地,基于所述双末端测序数据的另一侧测序数据,在所述参考基因组上,确定所述核酸的3’末端位置。
S2230:确定核酸的长度。具体地,基于所述核酸的5’末端位置以及所述核酸的3’末端位置,确定所述核酸的长度。
由此,能够准确地确定唯一比对测序数据集中各测序数据所对应的核酸分子的长度。
S300:确定游离核酸比例
基于所述长度落入预定范围的核酸分子的数目,确定所述生物样本中所述游离核酸的比例。
进而,本发明的方法进一步包括确定预定范围的步骤S400(图中未示出)。根据本发明的实施例,所述预定范围是基于多个对照样品确定的,其中,所述对照样品中游离核酸比例是已知的。由此,确定的预定范围结果准确可靠。根据本发明的一些实施例,所述预定范围是基于至少20个对照样品确定的。根据本发明的实施例,参照图4,确定预定范围的步骤S400包括:
S410:确定多个对照样品中游离核酸分子的长度。具体地,确定所述多个对照样品中所包含游离核酸分子的长度。
S420:确定在各候选长度出现游离核酸的频率。具体地,设定多个候选长度范围,并分别确定所述多个对照样品在各候选长度范围内出现游离核酸分子的频率。
S430:确定相关性系数。具体地,基于所述多个对照样品在各候选长度范围内出现游离核酸分子的频率以及所述对照样品的胎儿核酸比例,确定各所述候选长度范围与所述胎儿比例的相关性系数。
S440:选择预定范围。具体地,选择相关性系数最大的候选长度范围作为所述预定范围。
由此,能够准确有效地确定预定范围。
根据本发明的实施例,所述候选长度的跨度为1~20bp。
根据本发明的实施例,所述多个候选长度范围的步长为1~2bp。
根据本发明的实施例,参照图5,步骤S300进一步包括:
S310:确定预定范围内出现游离核酸分子的频率。具体地,基于所述长度落入预定范围的核酸分子的数目,确定在所述预定范围内出现游离核酸分子的频率。
S320:确定游离核酸的比例。具体地,基于在所述预定范围内出现游离核酸分子的频率,根据预定的函数,确定所述生物样本中游离核酸的比例,其中,所述预定的函数是基于所述多个对照样品确定的。
由此,能够有效地确定生物样本中所述游离核酸的比例,且结果准确可靠,可重复性好。
根据本发明的实施例,本发明的方法进一步包括确定预定函数的步骤S500(图中未示出)。根据本发明的一些具体示例,参照图6,确定预定函数的步骤S500包括:
S510:确定对照样品预定范围内出现游离核酸的频率。具体地,分别在所述多个对照样品中,确定在所述预定范围内出现游离核酸分子的频率。
S520:拟合。具体地,将所述多个对照样品中在所述预定范围内出现游离核酸分子的频率与已知的游离核酸比例进行拟合,以便确定所述预定的函数。
由此,确定的预定的函数准确可靠,有利于后续步骤的进行。
根据本发明的实施例,所述拟合为线性拟合。
根据本发明的实施例,所述预定来源的游离核酸为孕妇外周血中的游离胎儿核酸,所述预定范围是185~204bp。由此,基于该预定范围,能够准确地确定生物样本中游离核酸的比例。
根据本发明的实施例,所述预定的函数为d=0.0334*p+1.6657,其中,d表示游离胎儿核酸比例,p表示在所述预定范围内出现游离核酸分子的频率。基于该预定的函数,能够有效地确定生物样本中所述游离核酸的比例,且结果准确可靠,可重复性好。需要说明的是,本文中所采用的表达方式“在所述预定范围内出现游离核酸分子的频率”表示,生物样本中分布在某一预定长度范围内的游离核酸的分子数占总核酸分子数的比例。
根据本发明的实施例,所述对照样品为已知游离胎儿核酸比例的孕妇外周血样本。由此,预定范围确定准确。
根据本发明的实施例,所述对照样品为已知游离胎儿核酸比例的怀有正常男胎的孕妇外周血样本,并且所述已知游离胎儿核酸比例是利用Y染色体确定的。由此,预定范围确定准确。
根据本发明的实施例,所述对照样品为怀有正常胎的孕妇外周血样本。由此,预定范围确定准确。
根据本发明的实施例,所述对照样品的游离核酸比例为游离胎儿DNA比例,并且所述游离胎儿DNA比例是利用Y染色体估测得到的。由此,能够有效利用对照样品的游离核酸比例,确定预定范围,进而确定待测孕妇样本中长度落入预定范围的核酸分子的数目以及待测孕妇样本中游离胎儿DNA比例。
根据本发明的另一些实施例,本发明的方法,还可以包括以下步骤:
1)全基因组测序(WGS):利用高通量平台对待测样本进行全基因组测序。其中,血浆中游离胎儿DNA比较短,超过300bp的很少,因需要获得所有游离DNA分子的长度,从而单末端测序需测通整条游离DNA分子,或者采用双末端测序。
2)获取唯一比对序列(UniqueReads):将检测样本的测序序列与参考基因组序列进行比对。
3)通过UniqueReads的比对信息,统计该UniqueReads所代表的每条DNA分子的长度:统计待测样本中所有能唯一比对到参考基因组序列的长度。
4)选出一个或者多个相关性较强的长度区域:根据DNA分子长度的分布情况,找出相关性较强的一个或者多个区域。
5)得到函数关系式:通过步骤4得到相关性较强的一个或多个长度区域里的DNA分子频率与已知的游离游离胎儿DNA比例的函数关系式。
6)统计出选定区域的DNA分子出现的频率,即该长度或多个长度下DNA分子出现的频率。
7)通过函数关系式,代入待测样品在一个或多个长度区域里的DNA分子频率,得到待测样本的游离游离胎儿DNA比例。
其中上述步骤4),具体包括下面几个步骤:
I.选出参照样品,即包含已知的游离游离胎儿DNA比例的样品。
II.对所有样品进行WGS测序,通过将UniqueReads比对到染色体的唯一比对信息,获取UniqueReads所代表的每一DNA分子片段的长度信息。
III.统计出所有的参照样品里从0bp到Mbp(M表示DNA分子的最长的值,游离DNA分子长度可以保护到400bp)范围内,每个长度下出现DNA分子的条数。
IV.以某个长度为窗口长度,按照某个步长挪动划分多个窗口,统计出每个窗口下出现DNA分子的频率,即DNA分子在该长度下出现的频率。需要说明的是,在每个窗口下的,即分布在窗口规定长度范围内的DNA分子条数除以总分子条数,被定义为每个窗口下出现DNA分子的频率。例如可以1bp、5bp、10bp、15bp,…为窗口,步长范围从1bp到窗口长度,具体地,比如以5bp为一个窗口,以2bp为步长,则可以统计[1bp,5bp],[2bp,6bp],[4bp,8bp],[6bp,10bp],…各窗口下的DNA分子的分布情况;比如以5bp为一个窗口,以5bp为步长,则可统计[1bp,5bp],[6bp,10bp],[11bp,15bp],…各窗口下的DNA分子的分布情况。其中,前述的“总分子条数”是指所有长度的DNA分子的总条数。
V.找出各个窗口下DNA分子出现的频率与已知游离游离胎儿DNA比例样品相关性比较强的窗口或窗口组合:建立函数关系式,选出相关性比较强的窗口或对窗口进行组合,即选定相关性比较强的一个或者是多个长度区域。
用于确定生物样本中游离核酸比例的设备
根据本发明的另一方面,本发明还提供了一种用于确定生物样本中预定来源的游离核酸比例的设备。发明人惊奇地发现,本发明的设备适于实施前面所述的本发明的确定生物样本中预定来源的游离核酸比例的方法,进而利用本发明的设备能够准确高效地确定生物样本中预定来源的游离核酸的比例,尤其适用于确定孕妇外周血中的游离胎儿核酸,以及肿瘤患者、疑似肿瘤患者或者肿瘤筛查者外周血中游离肿瘤核酸的比例。
根据本发明的实施例,参照图7,该设备包括:测序装置100、计数装置200和游离核酸比例确定装置300。
具体地,测序装置100用于对含有游离核酸的生物样本进行核酸测序,以便获得多个测序数据的测序结果;计数装置200与所述测序装置100相连,并且用于基于所述测序结果,确定所述样本中长度落入预定范围的核酸分子的数目;游离核酸比例确定装置300与所述计数装置200相连,并且用于基于所述长度落入预定范围的核酸分子的数目,确定所述生物样本中所述预定来源的游离核酸的比例。
根据本发明的实施例,所述生物样本的种类不受特别限制。根据本发明的具体示例,所述生物样本为外周血。根据本发明的实施例,所述游离核酸为孕妇外周血中的游离胎儿核酸或母亲来源的游离核酸,或者肿瘤患者外周血中的游离肿瘤核酸或非肿瘤来源的游离核酸。由此,能够容易地确定孕妇外周血中的游离胎儿核酸的比例,或者肿瘤患者、疑似肿瘤患者或者肿瘤筛查者外周血中游离肿瘤核酸的比例。根据本发明的实施例,所述核酸为DNA。
根据本发明的实施例,所述测序结果包括所述游离核酸的长度。
根据本发明的实施例,所述测序为双末端测序、单末端测序或单分子测序。由此,容易得到游离核酸的长度,有利于后续步骤的进行。
根据本发明的实施例,参照图8,所述计数装置200进一步包括:比对单元210、第一长度确定单元220和数目确定单元230。具体地,比对单元210用于将所述测序结果与参考基因组进行比对,以便构建唯一比对测序数据集,所述唯一比对测序数据集中的每一个测序数据仅能够与所述参考基因组的一个位置匹配;第一长度确定单元220与所述比对单元210相连,用于确定所述唯一比对测序数据集中各测序数据所对应的核酸分子的长度;数目确定单元230与所述第一长度确定单元220相连,用于确定长度落入所述预定范围的核酸分子的数目。由此,能够容易地确定样本中长度落入预定范围的核酸分子的数目,且结果准确可靠,重复性好。
根据本发明的实施例,其中,所述第一长度确定单元220将所述测序数据能够与所述参考基因组匹配的序列长度作为与所述测序数据对应的核酸分子的长度。由此,能够准确地确定唯一比对测序数据集中各测序数据所对应的核酸分子的长度。
根据本发明的实施例,所述测序为双末端测序,其中,参照图9,所述第一长度确定单元220进一步包括:5’末端位置确定模块2210、3’末端位置确定模块2220和长度计算模块2230。具体地,5’末端位置确定模块2210用于基于所述双末端测序数据的一侧测序数据,在所述参考基因组上,确定所述核酸的5’末端位置;3’末端位置确定模块2220与所述5’末端位置确定模块2210相连,用于基于所述双末端测序数据的另一侧测序数据,在所述参考基因组上,确定所述核酸的3’末端位置;长度计算模块2230与所述3’末端位置确定模块2220相连,用于基于所述核酸的5’末端位置以及所述核酸的3’末端位置,确定所述核酸的长度。由此,能够准确地确定唯一比对测序数据集中各测序数据所对应的核酸分子的长度。
根据本发明的实施例,本发明的设备进一步包括预定范围确定装置400,所述预定范围确定装置400用于基于多个对照样品确定所述预定范围,其中,所述对照样品中预定来源的游离核酸比例是已知的,任选地,所述预定范围是基于至少20个对照样品确定的。
根据本发明的实施例,参照图10,所述预定范围确定装置400进一步包括:第二长度确定单元410、第一比例确定单元420、相关性系数确定单元430和预定范围确定单元440。具体地,第二长度确定单元410用于确定所述多个对照样品中所包含游离核酸分子的长度;第一比例确定单元420与所述第二长度确定单元410相连,用于设定多个候选长度范围,并分别确定所述多个对照样品在各所述候选长度范围内出现游离核酸分子的频率;相关性系数确定单元430与所述第一比例确定单元420相连,用于基于所述多个对照样品在各候选长度范围内出现游离核酸分子的频率以及所述对照样品中预定来源的游离核酸比例,确定各所述候选长度范围与所述中预定来源的游离核酸比例的相关性系数;预定范围确定单元440与所述相关性系数确定单元430相连,用于选择相关性系数最大的候选长度范围作为所述预定范围。由此,能够准确有效地确定预定范围。
根据本发明的实施例,所述候选长度的跨度为1~20bp。
根据本发明的实施例,所述多个候选长度范围的步长为1~2bp。
根据本发明的实施例,参照图11,所述游离核酸比例确定装置300进一步包括:第二比例确定单元310和游离核酸比例计算单元320。具体地,第二比例确定单元310用于基于所述长度落入预定范围的核酸分子的数目,确定在所述预定范围内出现游离核酸分子的频率;游离核酸比例计算单元320与所述第二比例确定单元310相连,用于基于在所述预定范围内出现游离核酸分子的频率,根据预定的函数,确定所述生物样本中游离核酸的比例,其中,所述预定的函数是基于所述多个对照样品确定的。由此,能够有效地确定生物样本中所述游离核酸的比例,且结果准确可靠,可重复性好。
根据本发明的实施例,本发明的设备进一步包括预定函数确定装置500,参照图12,所述预定函数确定装置500包括:第三比例确定单元510和拟合单元520。具体地,第三比例确定单元510用于分别在所述多个对照样品中,确定在所述预定范围内出现游离核酸分子的频率;拟合单元520与所述第三比例确定单元510相连,用于将所述多个对照样品中在所述预定范围内出现游离核酸分子的频率与已知的游离核酸比例进行拟合,以便确定所述预定的函数。由此,确定的预定的函数准确可靠,有利于后续步骤的进行。根据本发明的实施例,所述拟合为线性拟合。
根据本发明的实施例,所述预定来源的游离核酸为孕妇外周血中的游离胎儿核酸,所述预定范围是185~204bp。由此,基于该预定范围,能够准确地确定生物样本中游离核酸的比例。
根据本发明的实施例,所述预定的函数为d=0.0334*p+1.6657,其中,d表示游离胎儿核酸比例,p表示在所述预定范围内出现游离核酸分子的频率。基于该预定的函数,能够有效地确定生物样本中所述游离核酸的比例,且结果准确可靠,可重复性好。
根据本发明的实施例,所述对照样品为已知游离胎儿核酸比例的孕妇外周血样本。
根据本发明的实施例,所述对照样品为已知游离胎儿核酸比例的怀有正常男胎的孕妇外周血样本,并且所述已知游离胎儿核酸比例是利用Y染色体确定的。由此,预定范围确定准确。
根据本发明的实施例,所述对照样品为怀有正常男胎的孕妇外周血样本。由此,预定范围确定准确。
根据本发明的实施例,所述对照样品的游离核酸比例为游离胎儿DNA比例,并且所述游离胎儿DNA比例是利用适于进行Y染色体估测的设备得到的。由此,能够有效利用对照样品的游离核酸比例,确定预定范围,进而确定待测孕妇样本中长度落入预定范围的核酸分子的数目以及待测孕妇外周血样本中游离胎儿DNA比例。
检测双胞胎染色体非整倍性的方法、系统
根据本发明的又一方面,本发明提供了一种检测双胞胎染色体非整倍性的方法。根据本发明的实施例,该方法包括:(1)对怀有双胞胎的孕妇的外周血进行游离核酸测序,以便获得由多个测序数据构成的测序结果;(2)基于所述测序数据,根据前面所述的确定生物样本中游离核酸比例的方法,确定第一游离胎儿DNA比例。根据本发明的实施例,也可以基于下列公式,使用Y染色体估算胎儿浓度fra.chrY%作为第一游离胎儿DNA比例:
fra.chry=(chry.ER%-Female.chr.ER%)/(Man.chry.UR%-Female.chry.ER%)*100%,
其中,fra.chry表示第一游离胎儿DNA比例,chry.ER%表示所述测序结果中来源于染色体Y的测序数据占总测序数据的百分比;Female.chry.ER%表示预先确定的怀有正常女胎的孕妇外周血样本中来源于染色体Y的游离核酸的测序数据占总测序数据的百分比的平均值;以及Man.chry.ER%表示预先确定的正常男性外周血样本中来源于染色体Y的游离核酸的测序数据占总测序数据的百分比的平均值;(3)基于所述测序结果中来源于预定染色体的测序数据,确定第三游离胎儿DNA比例;以及(4)基于所述第一游离胎儿DNA比例与所述第三游离胎儿DNA比例,确定所述双胞胎中针对所述预定染色体是否存在非整倍性。由此,能够准确有效地进行双胞胎染色体非整倍性检测。
根据本发明的实施例,所述第三游离胎儿DNA比例是基于下列公式确定的:fra.chri=2*(chri.ER%/adjust.chri.ER%-1)*100%,其中,fra.chri表示所述第三游离胎儿DNA比例,i为所述预定染色体的编号,并且i为1~22范围内的任意整数;chri.ER%表示所述测序结果中来源于所述预定染色体的测序数据占总测序数据的百分比;adjust.chri.ER%表示预先确定的怀有正常双胞胎孕妇外周血样本中来源于所述预定染色体的游离核酸测序数据占总测序数据的百分比平均值。由此,能够准确确定第三游离胎儿DNA比例。
根据本发明的实施例,在步骤(4)中,包括:(a)确定所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值;以及(b)将步骤(a)中所得到的比值与预定的第三阈值和第四阈值进行比较,以便确定所述双胞胎针对所述预定染色体是否存在非整倍性。由此,能够有效实现双胞胎染色体非整倍性检测。
根据本发明的实施例,所述第一阈值是基于多个已知双胞胎针对所述预定染色体均不存在非整倍性的参照样本确定的,所述第二阈值是基于多个已知双胞胎针对所述预定染色体均为非整倍性的参照样本确定的。
根据本发明的实施例,所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值小于所述第三阈值表示所述双胞胎针对所述预定染色体均不存在非整倍性,所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值大于所述第四阈值表示所述双胞胎均针对所述预定染色体均为非整倍性,所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值等于所述第三阈值或者第四阈值,或者介于所述第三阈值与所述第四值之间表示所述双胞胎其中一个针对所述预定染色体具有非整倍性,另外一个针对所述预定染色体不具有非整倍性。
根据本发明的实施例,所述第一阈值为0.35,所述第二阈值为0.7。
根据本发明的实施例,所述预定染色体为18、21和23号染色体至少之一。
根据本发明的再一方面,本发明提供了一种确定双胞胎染色体非整倍性的系统。根据本发明的实施例,该系统包括:第一游离胎儿DNA比例确定设备,所述第一游离胎儿DNA比例确定设备为前面所述的确定生物样本中游离核酸比例的设备,用于对怀有双胞胎的孕妇的外周血进行游离核酸测序,以便获得由多个测序数据构成的测序结果,并且基于所述测序数据,确定第一游离胎儿DNA比例。根据本发明的实施例,所述第一游离胎儿DNA比例确定设备适于基于下列公式,使用Y染色体估算胎儿浓度fra.chrY%作为第一游离胎儿DNA比例:
fra.chry=(chry.ER%-Female.chr.ER%)/(Man.chry.UR%-Female.chry.ER%)*100%,其中,fra.chry表示第一游离胎儿DNA比例,chry.ER%表示所述测序结果中来源于染色体Y的测序数据占总测序数据的百分比;Female.chry.ER%表示预先确定的怀有正常女胎的孕妇外周血样本中来源于染色体Y的游离核酸的测序数据占总测序数据的百分比的平均值;以及Man.chry.ER%表示预先确定的正常男性外周血样本中来源于染色体Y的游离核酸的测序数据占总测序数据的百分比的平均值;第三游离胎儿DNA比例确定设备,所述第三游离胎儿DNA比例确定设备适于基于所述测序结果中来源于预定染色体的测序数据,确定第三游离胎儿DNA比例;以及第一非整倍性确定设备,所述第一非整倍性确定设备适于基于所述第一游离胎儿DNA比例与所述第三游离胎儿DNA比例,确定所述双胞胎中针对所述预定染色体是否存在非整倍性。发明人惊奇地发现,利用本发明的系统能够准确有效地实现双胞胎染色体非整倍性检测。
根据本发明的实施例,所述第三游离胎儿DNA比例是基于下列公式确定的:fra.chri=2*(chri.ER%/adjust.chri.ER%-1)*100%,其中,fra.chri表示所述第三游离胎儿DNA比例,i为所述预定染色体的编号,并且i为1~22范围内的任意整数;chri.ER%表示所述测序结果中来源于所述预定染色体的测序数据占总测序数据的百分比;adjust.chri.ER%表示预先确定的怀有正常双胞胎孕妇外周血样本中来源于所述预定染色体的游离核酸测序数据占总测序数据的百分比平均值。由此,能够准确确定第三游离胎儿DNA比例。
根据本发明的实施例,非整倍性确定设备进一步包括:比值确定单元,所述比值确定单元用于确定所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值;以及比较单元,将所得到的比值与预定的第三阈值和第四阈值进行比较,以便确定所述双胞胎针对所述预定染色体是否存在非整倍性。由此,能够有效实现双胞胎染色体非整倍性检测。
根据本发明的实施例,所述第一阈值是基于多个已知双胞胎针对所述预定染色体均不存在非整倍性的参照样本确定的,所述第二阈值是基于多个已知双胞胎针对所述预定染色体均为非整倍性的参照样本确定的。
根据本发明的实施例,所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值小于所述第三阈值表示所述双胞胎针对所述预定染色体均不存在非整倍性,所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值大于所述第四阈值表示所述双胞胎均针对所述预定染色体均为非整倍性,所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值等于所述第三阈值或者第四阈值,或者介于所述第三阈值与所述第四值之间表示所述双胞胎其中一个针对所述预定染色体具有非整倍性,另外一个针对所述预定染色体不具有非整倍性。由此,能够有效实现双胞胎染色体非整倍性检测。
根据本发明的实施例,所述第一阈值为0.35,所述第二阈值为0.7。
根据本发明的实施例,所述预定染色体为18、21和23号染色体至少之一。
根据本发明的另一方面,本发明还提供了一种确定双胞胎染色体非整倍性的方法。根据本发明的实施例,该方法包括:(1)对怀有双胞胎的孕妇的外周血进行游离核酸测序,以便获得由多个测序数据构成的测序结果;(2)确定所述测序结果中来源于染色体i的测序数据数目占总测序数据的比例Xi,其中,i表示染色体编号,并且i为1~22范围内的任意整数;(3)基于公式Ti=(xii)/σi,确定针对染色体i的T值,其中,i表示染色体编号,并且i为1~22范围内的任意整数,μi表示在参考数据库中被选为参照系的第i条染色体的测序数据占总测序数据的百分含量的均值,σi:在参考数据库中被选为参照系的第i条染色体的测序数据占总测序数据的百分含量的标准差;(4)基于公式Li=log(d(Ti,a))/log(d(T2i,a))确定针对染色体i的L值,其中,i表示染色体编号,并且i为1~22范围内的任意整数,T2i=(xii*(1+fra/2))/σi;d(Ti,a)和d(T2i,a)为t分布概率密度函数,a为自由度,fra是根据前面所述的确定生物样本中游离核酸比例的方法确定的游离胎儿DNA比例,或者是使用Y染色体估算的胎儿浓度fra.chrY%,其中,
fra.chry=(chry.ER%-Female.chr.ER%)/(Man.chry.UR%-Female.chry.ER%)*100%,其中,fra.chry表示游离胎儿DNA比例,chry.ER%表示所述测序结果中来源于染色体Y的测序数据占总测序数据的百分比;Female.chry.ER%表示预先确定的怀有正常女胎的孕妇外周血样本中来源于染色体Y的游离核酸的测序数据占总测序数据的百分比的平均值;以及Man.chry.ER%表示预先确定的正常男性外周血样本中来源于染色体Y的游离核酸的测序数据占总测序数据的百分比的平均值;(5)根据T值和L值作四象限图,横坐标为L值,纵坐标为T值,按照直线T=预定的第五阈值,L=预定的第六阈值,将所述四象限图进行划分区域,其中,当待测样本落在第一象限,则双胎中两个胎儿都判定为三体;当待测样本落在第二象限,则双胎中有一个胎儿都判定为三体,一个正常;当待测样本落在第三象限,则双胎中两个胎儿都判定为正常;当待测样本落在第四象限,则双胎中判定为胎儿浓度比较低的样本,不采用其结果。发明人惊奇地发现,利用本发明的确定双胞胎染色体非整倍性的方法,能够准确高效地实现对孕妇双胞胎染色体非整倍性的检测,确定双胞胎预定染色体是否存在非整倍性。
根据本发明的另一方面,本发明提供了一种确定双胞胎染色体非整倍性的系统。根据本发明的实施例,该系统包括:xi值确定设备,所述xi值确定设备用于对怀有双胞胎的孕妇的外周血进行游离核酸测序,以便获得由多个测序数据构成的测序结果,并且确定所述测序结果中来源于染色体i的测序数据数目占总测序数据的比例xi,其中,i表示染色体编号,并且i为1~22范围内的任意整数;T值确定设备,所述T值确定设备用于基于公式Ti=(xii)/σi,确定针对染色体i的T值,其中,i表示染色体编号,并且i为1~22范围内的任意整数,μi表示在参考数据库中被选为参照系的第i条染色体的测序数据占总测序数据的百分含量的均值,σi:在参考数据库中被选为参照系的第i条染色体的测序数据占总测序数据的百分含量的标准差;L值确定设备,所述L值确定设备用于基于公式Li=log(d(Ti,a))/log(d(T2i,a))确定针对染色体i的L值,其中,i表示染色体编号,并且i为1~22范围内的任意整数,T2i=(xii*(1+fra/2))/σi;d(Ti,a)和d(T2i,a)为t分布概率密度函数,a为自由度,fra是根据权利要求1~20所述的方法确定的游离胎儿DNA比例,或者是使用Y染色体估算的胎儿浓度fra.chrY%,其中,
fra.chry=(chry.ER%-Female.chr.ER%)/(Man.chry.UR%-Female.chry.ER%)*100%,其中,fra.chry表示游离胎儿DNA比例,chry.ER%表示所述测序结果中来源于染色体Y的测序数据占总测序数据的百分比;Female.chry.ER%表示预先确定的怀有正常女胎的孕妇外周血样本中来源于染色体Y的游离核酸的测序数据占总测序数据的百分比的平均值;以及Man.chry.ER%表示预先确定的正常男性外周血样本中来源于染色体Y的游离核酸的测序数据占总测序数据的百分比的平均值;第二非整倍性确定设备,所述第二非整倍性确定设备适于根据T值和L值作四象限图,横坐标为L值,纵坐标为T值,按照直线T=预定的第五阈值,L=预定的第六阈值,将所述四象限图进行划分区域,其中,当待测样本落在第一象限,则双胎中两个胎儿都判定为三体;当待测样本落在第二象限,则双胎中有一个胎儿都判定为三体,一个正常;当待测样本落在第三象限,则双胎中两个胎儿都判定为正常;当待测样本落在第四象限,则双胎中判定为胎儿浓度比较低的样本,不采用其结果。发明人发现,利用本发明的确定双胞胎染色体非整倍性的系统,能够准确高效地实现对孕妇双胞胎染色体非整倍性的检测,确定双胞胎预定染色体是否存在非整倍性。
其中,需要说明的是:
“μi表示在参考数据库中被选为参照系的第i条染色体的测序数据占总测序数据的百分含量的均值”中所述的“参考数据库”是指,怀有正常胎儿(男胎、女胎,单胎或双胎均可)的孕妇外周血游离核酸、测序数据;
前面所使用的表达方式“来源于染色体Y的测序数据”所述的“测序数据”即为测序获得的read。
根据本发明的一些具体示例,在本文中,术语“xi”、“ERi”与“Chri.ER%”可以互换使用,也即xi可以为经过GC修正的结果。具体地,可以利用已知正常样本数据对每条染色体的UR和GC含量进行拟合,得到关系式:ERi=fi(GCi)+εi,并计算UR均值对于待分析样品,根据以上关系式及样品的ER和GC计算修正后的ER值:
ER ‾ ‾ ij = ER ‾ i + ϵ i = ER ‾ i + ER ij - f i ( GC ij ) .
检测胎儿嵌合体的方法、系统
在本发明的又一方面,本发明提出了一种检测胎儿嵌合体的方法。根据本发明的实施例,该方法包括:(1)对怀有胎儿孕妇的外周血进行核酸测序,以便获得由多个测序数据构成的测序结果,任选地,所述胎儿为男胎;(2)基于所述测序数据,根据前面所述的方法,确定第一游离胎儿DNA比例,或者,基于下列公式,使用Y染色体估算胎儿浓度fra.chrY%作为第一游离胎儿DNA比例:
fra.chry=(chry.ER%-Female.chr.ER%)/(Man.chry.UR%-Female.chry.ER%)*100%,其中,fra.chry表示第一游离胎儿DNA比例,chry.ER%表示所述测序结果中来源于染色体Y的测序数据占总测序数据的百分比;Female.chry.ER%表示预先确定的怀有正常女胎的孕妇外周血样本中来源于染色体Y的游离核酸的测序数据占总测序数据的百分比的平均值;以及Man.chry.ER%表示预先确定的正常男性外周血样本中来源于染色体Y的游离核酸的测序数据占总测序数据的百分比的平均值;(3)基于所述测序结果中来源于预定染色体的测序数据,确定第三游离胎儿DNA比例;以及(4)基于所述第一游离胎儿DNA比例与所述第三游离胎儿DNA比例,确定所述胎儿中针对所述预定染色体是否存在嵌合体。由此,能够准确地对胎儿中是否存在特定染色体的嵌合体情况进行分析。
根据本发明的实施例,该方法还可以进一步具有下列附加技术特征:
根据本发明的实施例,所述第三游离胎儿DNA比例是基于下列公式确定的:
fra.chri=2*(chri.ER%/adjust.chri.ER%-1)*100%
其中,
fra.chri表示所述第三游离胎儿DNA比例,i为所述预定染色体的编号,并且i为1~22范围内的任意整数;
chri.ER%表示所述测序结果中来源于所述预定染色体的测序数据占总测序数据的百分比;
adjust.chri.ER%表示预先确定的怀有正常胎儿的孕妇外周血样本中来源于所述预定染色体的游离核酸测序数据占总测序数据的百分比平均值。由此,可以进一步提高对胎儿中是否存在特定染色体的嵌合体情况进行分析的效率。
根据本发明的实施例,在步骤(4)中,包括:
(a)确定所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值;以及
(b)将步骤(a)中所得到的比值与预定的多个阈值进行比较,以便确定所述胎儿针对所述预定染色体是否存在嵌合体。由此,可以进一步提高对胎儿中是否存在特定染色体的嵌合体情况进行分析的效率。
根据本发明的实施例,所述预定的多个阈值包括选自下列的至少之一:
第七阈值,所述第七阈值是基于多个已知针对所述预定染色体为完全单体的参照样本确定的,
第八阈值,所述第八阈值是基于多个已知针对所述预定染色体为单体嵌合的参照样本确定的,
第九阈值,所述第九阈值是基于多个已知针对所述预定染色体为正常的参照样本确定的,
第十阈值,所述第十阈值是基于多个已知针对所述预定染色体为完全三体的参照样本确定的。
根据本发明的实施例,所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值小于所述第七阈值表示所述胎儿针对所述预定染色体表示所述胎儿针对所述预定染色体为完全单体;
所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值不小于所述第七阈值并且不大于所述第八阈值表示所述胎儿针对所述预定染色体表示所述胎儿针对所述预定染色体为单体嵌合;
所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值大于所述第八阈值并且小于所述第九阈值表示所述胎儿针对所述预定染色体表示所述胎儿针对所述预定染色体为正常;
所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值不小于所述第九阈值并且不大于所述第十阈值表示所述胎儿针对所述预定染色体表示所述胎儿针对所述预定染色体为三体嵌合;
所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值大于所述第十阈值表示所述胎儿针对所述预定染色体表示所述胎儿针对所述预定染色体为完全三体。
根据本发明的实施例,所述第七阈值为至少-1并且所述第七阈值小于0,任选地所述第五阈值为-0.85;
所述第八阈值大于所述第七阈值并且所述第八阈值小于0,任选地所述第八阈值为-0.3;
所述第九阈值大于0并且所述第九阈值小于1,任选地所述第九阈值为0.3;
所述第十阈值大于所述第九阈值并且所述第十阈值小于1,任选地所述第十阈值为0.85。由此,可以进一步提高对胎儿中是否存在特定染色体的嵌合体情况进行分析的效率。
在本发明的又一方面,本发明提出了一种检测胎儿嵌合体的系统。根据本发明的实施例,该系统包括:
第一游离胎儿DNA比例确定设备,所述第一游离胎儿DNA比例确定设备为前面所述的确定生物样本中游离核酸比例的设备,用于对胎儿的孕妇的外周血进行核酸测序,以便获得由多个测序数据构成的测序结果,并且基于所述测序数据,确定第一游离胎儿DNA比例,或者,所述第一游离胎儿DNA比例确定设备适于基于下列公式,使用Y染色体估算胎儿浓度fra.chrY%作为第一游离胎儿DNA比例:
fra.chry=(chry.ER%-Female.chr.ER%)/(Man.chry.UR%-Female.chry.ER%)*100%,其中,fra.chry表示第一游离胎儿DNA比例,chry.ER%表示所述测序结果中来源于染色体Y的测序数据占总测序数据的百分比;Female.chry.ER%表示预先确定的怀有正常女胎的孕妇外周血样本中来源于染色体Y的游离核酸的测序数据占总测序数据的百分比的平均值;以及Man.chry.ER%表示预先确定的正常男性外周血样本中来源于染色体Y的游离核酸的测序数据占总测序数据的百分比的平均值;第三游离胎儿DNA比例确定设备,所述第三游离胎儿DNA比例确定设备适于基于所述测序结果中来源于预定染色体的测序数据,确定第三游离胎儿DNA比例;以及嵌合体确定设备,所述嵌合体确定设备适于基于所述第一游离胎儿DNA比例与所述第三游离胎儿DNA比例,确定所述双胞胎中针对所述预定染色体是否存在嵌合体。根据本发明的实施例,上述用于确定胎儿嵌合体的系统可以有效地实施前面所述的确定胎儿嵌合体的方法,从而能够有效地对胎儿嵌合体情况进行分析。
根据本发明的实施例,上述确定胎儿嵌合体的系统还可以具有下列附加技术特征:
根据本发明的实施例,所述第三游离胎儿DNA比例是基于下列公式确定的:
fra.chri=2*(chri.ER%/adjust.chri.ER%-1)*100%
其中,
fra.chri表示所述第三游离胎儿DNA比例,i为所述预定染色体的编号,并且i为1~22范围内的任意整数;
chri.ER%表示所述测序结果中来源于所述预定染色体的测序数据占总测序数据的百分比;
adjust.chri.ER%表示预先确定的怀有正常胎儿的孕妇外周血样本中来源于所述预定染色体的游离核酸测序数据占总测序数据的百分比平均值。由此,可以进一步提高对胎儿中是否存在特定染色体的嵌合体情况进行分析的效率。
根据本发明的实施例,在步骤(4)中,包括:
(a)确定所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值;以及
(b)将步骤(a)中所得到的比值与预定的多个阈值进行比较,以便确定所述胎儿针对所述预定染色体是否存在嵌合体。由此,可以进一步提高对胎儿中是否存在特定染色体的嵌合体情况进行分析的效率。
根据本发明的实施例,所述预定的多个阈值包括选自下列的至少之一:
第七阈值,所述第七阈值是基于多个已知针对所述预定染色体为完全单体的参照样本确定的,
第八阈值,所述第八阈值是基于多个已知针对所述预定染色体为单体嵌合的参照样本确定的,
第九阈值,所述第九阈值是基于多个已知针对所述预定染色体为正常的参照样本确定的,
第十阈值,所述第十阈值是基于多个已知针对所述预定染色体为完全三体的参照样本确定的。
根据本发明的实施例,所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值小于所述第七阈值表示所述胎儿针对所述预定染色体表示所述胎儿针对所述预定染色体为完全单体;
所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值不小于所述第七阈值并且不大于所述第八阈值表示所述胎儿针对所述预定染色体表示所述胎儿针对所述预定染色体为单体嵌合;
所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值大于所述第八阈值并且不大于所述第九阈值表示所述胎儿针对所述预定染色体表示所述胎儿针对所述预定染色体为正常;
所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值大于所述第九阈值并且不大于所述第十阈值表示所述胎儿针对所述预定染色体表示所述胎儿针对所述预定染色体为三体嵌合;
所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值大于所述第十阈值表示所述胎儿针对所述预定染色体表示所述胎儿针对所述预定染色体为完全三体。
根据本发明的实施例,所述第七阈值大于-1并且所述第七阈值小于0,任选地所述第五阈值为-0.85;
所述第八阈值大于所述第七阈值并且所述第八阈值小于0,任选地所述第八阈值为-0.3;
所述第九阈值大于0并且所述第九阈值小于1,任选地所述第九阈值为0.3;
所述第十阈值大于所述第九阈值并且所述第十阈值小于1,任选地所述第十阈值为0.85。由此,可以进一步提高对胎儿中是否存在特定染色体的嵌合体情况进行分析的效率。
在本发明的又一方面,本发明提出了一种检测胎儿嵌合体的方法,根据本发明的实施例,该确定胎儿嵌合体的方法包括:
(1)对怀有胎儿的孕妇的外周血进行游离核酸测序,以便获得由多个测序数据构成的测序结果;
(2)确定所述测序结果中来源于染色体i的测序数据数目占总测序数据的比例xi,其中,i表示染色体编号,并且i为1~22范围内的任意整数;
(3)基于公式Ti=(xii)/σi,确定针对染色体i的T值,其中,i表示染色体编号,并且i为1~22范围内的任意整数,μi表示在参考数据库中被选为参照系的第i条染色体的测序数据占总测序数据的百分含量的均值,σi:在参考数据库中被选为参照系的第i条染色体的测序数据占总测序数据的百分含量的标准差;
(4)基于公式Li=log(d(Ti,a))/log(d(T2i,a))确定针对染色体i的L值,其中,i表示染色体编号,并且i为1~22范围内的任意整数,
T2i=(xii*(1+fra/2))/σi
d(Ti,a)和d(T2i,a)为t分布概率密度函数,a为自由度,fra是根据前面所述的确定生物样本中游离核酸比例的方法确定的游离胎儿DNA比例;
(5)如果T不大于0,则根据T值和L值作四象限图,横坐标为L值,纵坐标为T值,按照直线T=预定的第十一阈值,L=预定的第十二阈值,将所述四象限图进行划分区域,
其中,
当待测样本落在第一象限,则将所述胎儿判定为针对所述预定染色体为完全单体或单体嵌合;
当待测样本落在第二象限,则将所述胎儿判定为针对所述预定染色体为单体嵌合;
当待测样本落在第三象限,则将所述胎儿判定为针对所述预定染色体为正常;
当待测样本落在第四象限,则将所述胎儿判定为胎儿浓度比较低的样本,不采用其结果,
如果T大于0,则根据T值和L值作四象限图,横坐标为L值,纵坐标为T值,按照直线T=预定的第十三阈值,L=预定的第十四阈值,将所述四象限图进行划分区域,
其中,
当待测样本落在第一象限,则将所述胎儿判定为针对所述预定染色体为完全三体或三体嵌合;
当待测样本落在第二象限,则将所述胎儿判定为针对所述预定染色体为三体嵌合;
当待测样本落在第三象限,则将所述胎儿判定为针对所述预定染色体为正常;
当待测样本落在第四象限,则将所述胎儿判定为胎儿浓度比较低的样本,不采用其结果,
任选地,所述第十一阈值和所述第十三阈值分别独立地为3,所述第十二阈值和所述十四阈值分别独立地为1。
由此,可以有效地对胎儿嵌合体情况进行分析。
需要说明的是,在本文中所使用的表达方式“正常男胎/女胎/胎”是指胎儿染色体正常,例如,“正常男胎”是指染色体正常的男胎。并且,“正常男胎/女胎/胎”可以为单胎或者双胎,例如,“正常男胎”可以是正常单男胎,也可以为正常双男胎;“正常胎儿”则不限定胎儿的性别,也不限定是单胎还是双胎。
下面将结合实施例对本发明的实施方案进行详细描述,但是本领域技术人员将会理解,下列实施例仅用于说明本发明,而不应视为限定本发明的范围。实施例中未注明具体条件者,按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者,均为可以通过市场获得的常规产品。
实施例1:
根据本发明的确定生物样本中游离核酸比例的方法,对11例待测孕妇血浆样本进行游离胎儿DNA比例进行估算,具体如下:
1)样品收集及处理
分别提取11个待测孕妇和37个已知怀有男胎的孕妇的孕期外周血2ml进行血浆分离,以便获得各待测孕妇的外周血样本和已知怀有男胎的孕妇外周血样本。
2)文库构建
根据CompleteGenomicsInc.公司的血浆文库构建要求进行文库构建。
3)测序
测序过程严格按照CompleteGenomicsInc.的标准操作流程进行上机操作。
4)数据分析
通过双末端测序得到的序列,对样本进行DNA片段长度分布的分析,其流程如图1所示,步骤如下:
a)分别计算11例待测样本和37个已知怀有正常男胎的孕妇样本的DNA片段长度:参考唯一比对序列长度选双向测序reads一端19bp,另一端12bp,统计参考唯一比对序列的位置,通过序列的起始位置和终止位置得到DNA片段长度。
b)针对37个已知怀有男胎的孕妇样本中的每一个样本,均以某个长度为窗口长度,按照某个步长挪动划分多个窗口,统计出每个窗口下出现DNA分子的频率,即DNA分子在该长度下出现的频率。需要说明的是,在每个窗口下的,即分布在窗口规定长度范围内的DNA分子条数除以总分子条数,被定义为每个窗口下出现DNA分子的频率。例如可以1bp、5bp、10bp、15bp,…为窗口,步长范围从1bp到窗口长度,具体地,比如以5bp为一个窗口,以2bp为步长,则可以统计[1bp,5bp],[2bp,6bp],[4bp,8bp],[6bp,10bp],…各窗口下的DNA分子的分布情况;比如以5bp为一个窗口,以5bp为步长,则可统计[1bp,5bp],[6bp,10bp],[11bp,15bp],…各窗口下的DNA分子的分布情况。
c)找出上述37个已知怀有男胎的孕妇样本的某长度DNA分子出现的频率与已知胎儿比例相关性比较强的一个或者多个区域。其中,对于某个长度范围,利用37例已知怀有男胎的孕妇样本由Y染色体估测(具体估测方法请参照:FumanJiang,JinghuiRen,etal.NoninvasiveFetalTrisomy(NIFTY)test:anadvancednoninvasiveprenataldiagnosismethodologyforfetalautosomalandsexchromosomalaneuploidies.BMCMedGenomics.2012Dec1;5:57.doi:10.1186/1755-8794-5-57.,通过参照将其全文并入本文)得到的游离胎儿DNA比例及DNA片段长度在M内的DNA分子出现的频率,并计算二者的相关性系数。进而,选出相关性系数绝对值最大的长度区域M,如M=185~204bp,相关性系数R=-0.87,见附图13;或者,M=121~150bp,相关性系数为R=-0.6199。
d)确定孕妇外周血中长度范围在M里的DNA分子出现的频率与游离的游离胎儿DNA比例(记作d)的函数关系:针对上述37例游离胎儿DNA片段比例d已知的样品(即37个已知怀有男胎的孕妇样本),利用DNA分子在185~204bp范围内出现的频率pi(i=1,2,…,48)和游离胎儿DNA比例di(i=1,2,..,48)作线性拟合图(如图13),得到二者的关系式:d=a*p+b,d=0.0334*p+1.6657。
e)分别统计11个待测孕妇样本的DNA片段长度分布及处于M区间的DNA分子出现的频率:统计待测孕妇样本DNA片段在185bp~204bp范围内出现的频率p,结果见下表1。
f)估测测试样本的游离胎儿DNA片段比例:根据上述统计获得的各待测孕妇样本DNA片段在185bp~204bp范围内出现的频率pj(j为测试样本标记)及关系式d=a*p+b直接计算出测试样本的游离胎儿DNA片段比例dj
g)待测样本的游离胎儿DNA比例的估算结果见下表1(其中,37个已知怀有男胎的孕妇的chrY估测和通过本发明的方法估测获得的游离胎儿DNA比例基本一致)。
表1
实施例2:
根据本发明的的方法,基于实施例1中确定的游离胎儿DNA比例的结果,对实施例1中所述的11例怀有双胎孕妇血浆进行染色体非整倍性的检测:
基于实施例1中确定的游离的来源游离胎儿DNA比例的结果,按照以下步骤,通过胎儿浓度确定11例待测样本的胎儿染色体非整倍性:
a)通过第i(i=13,18,21)条染色体计算出胎儿浓度fra.chri;
b)通过片段估算胎儿浓度fra.size;
c)判定标准:
I.当fra.chri/fra.size的值小于0.35,双胎中两个胎儿第i条染色体都正常;
II.当fra.chri/fra.size的值不小于0.35且不大于0.7,双胎中一个胎儿为第i条染色体为三体,一个胎儿第i条染色体正常;
III.当fra.chri/fra.size的值大于0.7,双胎中两个胎儿的第i条染色体都为三体。
结果如下表所示:
通过胎儿浓度检测11例待测样本胎儿染色体非整倍性的结果
2、通过T值&L值判定待测样本的染色体非整倍性情况:
基于实施例1中确定的游离的来源游离胎儿DNA比例的结果,按照以下步骤,通过T值&L值确定11例待测样本的胎儿染色体非整倍性:
a)全基因组测序(WGS):利用高通量平台Illumina对待测样本进行全基因组测序。
b)获取有效比对序列(EffectiveReads)的位置信息:将检测样本的测序序列与参考基因组序列hg19进行比对,获取能唯一比对上参考序列的位置信息。
c)统计EffectiveReads的百分含量:对步骤(2)获得的序列,统计每条染色体的EffectiveReads占总的EffectiveReads的比例。
d)GC修正:
利用已知正常样本数据对每条染色体的UR和GC含量进行拟合,得到关系式:
ERi=fi(GCi)+εi,并计算UR均值对于待分析样品,根据以上关系式及样品的ER和GC计算修正后的ER值: ER ‾ ‾ ij = ER ‾ i + ϵ i = ER ‾ i + ER ij - f i ( GC ij ) .
e)计算T值:Ti=(xii)/σi,其中,
i:染色体编号(i=13,18,21);
xi:分析样品中第i条染色体的EffectiveReads的百分含量;
μi:在参考数据库中被选为参照系的第i条染色体的EffectiveReads的百分含量的均值;
σi:在参考数据库中被选为参照系的第i条染色体的EffectiveReads的百分含量标准差;
f)计算L值:
基于公式Li=log(d(Ti,a))/log(d(T2i,a))确定针对染色体i的L值,其中,i表示染色体编号,T2i=(xii*(1+fra/2))/σi;d(Ti,a)和d(T2i,a)为t分布概率密度函数,a为自由度,fra是根据实施例1中所述的方法确定的游离胎儿DNA比例;
g)根据T值和L值作四象限图,横坐标为L值,纵坐标为T值以T=3和L=0.8为cutoff值进行划分区域(胎儿浓度<5%判定为质控不过),具体如下:
I.当待测样本落在第一象限(T>3,L>0.8),则双胎中两个胎儿都判定为三体;
II.当待测样本落在第二象限(T>3,L≤0.8),则双胎中有一个胎儿都判定为三体,一个正常;
III.当待测样本落在第三象限(T≤3,L≤0.8),则双胎中两个胎儿都判定为正常;
IV.当待测样本落在第四象限(T≤3,L>0.8),则双胎中判定为胎儿浓度比较低的样本,质控不过。
11例待测样本的T值&L值四象限图结果见图14-16。由图14-16可知,通过T值&L值确定的11例待测样本的胎儿染色体非整倍性情况,与步骤2中通过胎儿浓度确定的胎儿染色体非整倍性结果一致。
实施例3:嵌合体检测
在下面的实施例中,采用是流产组织的打断DNA与未怀孕女性血浆按照一定比例进行混合作为模拟孕妇样本。按照下列方法检测胎儿(男胎)染色体数目异常(包括完全三体、完全单体、三体中的嵌合体以及单体中的嵌合体),其包括以下步骤:
1)全基因组测序(WGS):利用高通量平台对待测样本进行全基因组测序。
2)获取有效比对序列(EffectiveReads)的位置信息:将检测样本的测序序列与参考基因组序列进行比对,获取能唯一比对上参考序列的位置信息。
3)统计每条染色体的唯一比对序列的百分含量和每条染色体的唯一比对序列的G、C碱基占总的碱基的百分含量:通过EffectiveReads的位置信息和EffectiveReads的碱基信息,统计待测样本中每条染色体的EffectiveReads数目占总的EffectiveReads的百分含量;同时统计每条染色体的所有EffectiveReads中G、C碱基与所有碱基百分含量。
4)通过第i条染色体计算出来DNA含量,标为fra.chri;
fra.chri=2*(chri.ER%/adjust.chri.ER%-1)*100%
其中,
fra.chri表示游离胎儿DNA比例,i为预定染色体的编号,并且i为1~22范围内的任意整数;
chri.ER%:样品染色体i的ER%(EffectiveReadsRate的简称,唯一比对序列的百分比);
adjust.chri.ER%:样品正常时染色体i的ER%理论值;
5)通过Y染色体的方法计算胎儿浓度,标为fra.chry;
fra.chry=(chry.ER%-Female.chr.ER%)/(Man.chry.UR%-Female.chry.ER%)*100%
其中:
chry.ER%:待测样本染色体Y的ER%(EffectiveReads率的简称,唯一比对序列的百分比);
Female.chry.ER%:女胎样本染色体Y的ER%均值,Man.chry.ER%:男性样本染色体Y的ER%均值
6)判定标准:
I.当fra.chri/fra.chry<A1(A1为某常量,且A1>-1,如-0.85),胎儿为第i条染色体为完全单体;
II.当fra.chri/fra.chry∈[A1,A2](A1,A2为某常量,且-1<A1<A2<0如[-0.85,-0.3]),胎儿为第i条染色体为单体嵌合;
III.当fra.chri/fra.chry∈[A2,A3](A2,A3为某常量,且A2<0<A3如[-0.3,0.3]),胎儿为第i条染色体为正常;
IV.当fra.chri/fra.chry∈[A3,A4](A3,A4为某常量,且0<A3<A4<1如[0.3,0.85]),胎儿为第i条染色体为三体嵌合;
V.当fra.chri/fra.chry>A4(A4为某常量,如0.85),胎儿为第i条染色体为完全三体。
3.1对19例(M1```M19)打断DNA混女性血浆(详情如表a)的样本和2例(N1,N2)怀有男胎孕妇的血浆样本(分别是T18嵌合体,T21嵌合体)进行染色体非整倍性的检测。
1)样品收集及处理
提取外周血2ml进行血浆分离。
2)文库构建
根据CompleteGenomicsInc.公司的血浆文库构建要求进行文库构建。
3)测序
测序过程严格按照CompleteGenomicsInc.的标准操作流程进行上机操作。
4)数据分析
a)全基因组测序(WGS):利用高通量平台对待测样本进行全基因组测序。(需要获得所有游离DNA分子的长度,如:单末端测序需测通整条游离DNA分子,或者是双末端测序,这点很重要)
b)获取有效比对序列(EffectiveReads)的位置信息:将检测样本的测序序列与参考基因组序列进行比对,获取能唯一比对上参考序列的位置信息。
c)统计EffectiveReads的百分含量:对步骤(2)获得的序列,统计每条染色体的EffectiveReads占总的EffectiveReads的比例。
d)GC修正
利用已知正常样本数据对每条染色体的UR和GC含量进行拟合,得到关系式:ERi=fi(GCi)+εi,并计算UR均值对于待分析样品,根据以上关系式及样品的ER和GC计算修正后的ER值:
e)通过第i(i=13,18,21)条染色体计算出胎儿浓度fra.chri;
f)通过Y染色体的方法计算胎儿浓度fra.chry;
g)通过片段的方法(即本发明的确定游离胎儿DNA比例的方法)计算胎儿浓度fra.size;
h)计算T值:Ti=(xii)/σi
i:染色体编号(i=1、2…22);
xi:分析样品中第i条染色体的EffectiveReads的百分含量;
μi:在参考数据库中被选为参照系的第i条染色体的EffectiveReads的百分含量的均值;
σi:在参考数据库中被选为参照系的第i条染色体的EffectiveReads的百分含量标准差;
i)计算L值
先计算T2值:T2i=(xii*(1+fra/2))/σi
再计算L值:Li=log(d(Ti,a))/log(d(T2i,a)),d(Ti,a)和d(T2i,a)为t分布概率密度函数,a为自由度,fra表示fra.chry或者是fra.size。
◆通过胎儿浓度(胎儿浓度fra.chry用的是Y染色体估算的方法进行估算)判定待测样本的染色体非整倍性情况(如表A)
a)判定标准:
I.当fra.chri/fra.chry<-0.85,胎儿为第i条染色体为完全单体;
II.当fra.chri/fra.chry∈[-0.85,-0.3],胎儿为第i条染色体为单体嵌合;
III.当fra.chri/fra.chry∈[-0.3,0.3],胎儿为第i条染色体为正常;
IV.当fra.chri/fra.chry∈[0.3,0.85],胎儿为第i条染色体为三体嵌合;
V.当fra.chri/fra.chry>0.85,胎儿为第i条染色体为完全三体;
◆通过T值&L值判定待测样本的染色体非整倍性情况(胎儿浓度fra.chry估算的方法是通过Y染色体进行估算)(如表B)
a)根据T值和L值作四象限图;
b)当T≤0时,根据T值的绝对值和L值作四象限图,横坐标为L值的绝对值,纵坐标为T值。以T=3和L=1为cutoff值进行划分区域(胎儿浓度<5%判定为质控不过)
I.当待测样本落在第一象限(T>3,L>1),则为单体或单体嵌合;
II.当待测样本落在第二象限(T>3,L≤1),则单体嵌合
III.当待测样本落在第三象限(T≤3,L≤1),则正常;
IV.当待测样本落在第四象限(T≤3,L>1),则则判定为胎儿浓度比较低的样本,质控不过;
当T>0时,T值和L值作四象限图,横坐标为L值,纵坐标为T值。以T=3和L=0.8为cutoff值进行划分区域(胎儿浓度<5%判定为质控不过)
I.当待测样本落在第一象限(T>3,L>1),则为三体或者三体嵌合
II.当待测样本落在第二象限(T>3,L≤1,则三体嵌合
III.当待测样本落在第三象限(T≤3,L≤1),则正常;
IV.当待测样本落在第四象限(T≤3,L>1),则则判定为胎儿浓度比较低的样本,质控不过;
◆通过胎儿浓度(胎儿浓度fra.size用的是片段估算的方法进行估算)判定待测样本的染色体非整倍性情况(如表C)
b)判定标准:
I.当fra.chri/fra.size<-0.85,胎儿为第i条染色体为完全单体;
II.当fra.chri/fra.size∈[-0.85,-0.3],胎儿为第i条染色体为单体嵌合;
III.当fra.chri/fra.size∈[-0.3,0.3],胎儿为第i条染色体为正常;
IV.当fra.chri/fra.size∈[0.3,0.85],胎儿为第i条染色体为三体嵌合;
V.当fra.chri/fra.size>0.85,胎儿为第i条染色体为完全三体;
◆通过T值&L值判定待测样本的染色体非整倍性情况(胎儿浓度fra.size估算的方法是通过片段进行估算)(如表D,图2)
a)根据T值和L值作四象限图;
b)当T≤0时,根据T值的绝对值和L值作四象限图,横坐标为L值的绝对值,纵坐标为T值。以T=3和L=1为cutoff值进行划分区域(胎儿浓度<5%判定为质控不过)
I.当待测样本落在第一象限(T>3,L>1),则为单体或者单体嵌合;
II.当待测样本落在第二象限(T>3,L≤1),则单体嵌合
III.当待测样本落在第三象限(T≤3,L≤1),则正常;
IV.当待测样本落在第四象限(T≤3,L>1),则则判定为胎儿浓度比较低的样本,质控不过;
当T>0时,T值和L值作四象限图,横坐标为L值,纵坐标为T值。以T=3和L=1为cutoff值进行划分区域(胎儿浓度<5%判定为质控不过)
I.当待测样本落在第一象限(T>3,L>1),则为三体或者三体嵌合
II.当待测样本落在第二象限(T>3,L≤1),则三体嵌合
III.当待测样本落在第三象限(T≤3,L≤1),则正常;
IV.当待测样本落在第四象限(T≤3,L>1),则则判定为胎儿浓度比较低的样本,质控不过;
在本实施例中,采用的阴性样本为正常未怀孕的女性血浆样本;阳性样本为利用流产组织的DNA按照150bp到200bp随机打断与正常未怀孕的女性血浆混合制备;(T21、T18为男胎;T13为女胎);阳性嵌合样本为用胎盘组织DNA(150bp到200bp随机打断)、炎黄细胞系DNA(150bp到200bp随机打断)混合正常女性和血浆制备;(T21、T18为男胎;T13为女胎);
样本编号 流产组织核型 胎儿浓度 嵌合比率 表达形式
M1 13三体 3.5% 0 T13-3.5%
M2 13三体 5% 0 T13-5%
M3 13三体 8% 0 T13-8%
M4 13三体 8% 0 T13-8%
M5 18三体 10% 30% T18-10%-30%
M6 18三体 10% 70% T18-10%-70%
M7 18三体 10% 70% T18-10%-70%
M8 18三体 10% 70% T18-10%-70%
M9 18三体 3.5% 0 T18-3.5%
M10 18三体 5% 0 T18-5%
M11 18三体 5% 0 T18-5%
M12 18三体 8% 0 T18-8%
M13 21三体 10% 30% T21-10%-30%
M14 21三体 10%- 70% T21-10%-70%
M15 21三体 10% 70% T21-10%-70%
M16 21三体 10% 70% T21-10%-70%
M17 21三体 3.5% 0 T21-3.5%
M18 21三体 5% 0 T21-5%
M19 21三体 8% 0 T21-8%
样本编号 核型结果
N1 47,XN+18[3]/46,XN[20]
N2 47,XN+21[30]/46,XN[18]
表A通过Y染色体估算混合DNA浓度检测染色体非整倍性
注:
fra.chr13:表示通过13号染色体反估出来的混合DNA浓度;
fra.chr18:表示通过18号染色体反估出来的混合DNA浓度;
fra.chr21:表示通过21号染色体反估出来的混合DNA浓度;
fra.chry:表示通过Y染色体计算出来的混合DNA浓度;
T21-10%-30%:用21三体的细胞系打断的DNA按照10%的浓度,30%的嵌合比例配到女性血浆中;
表B通过T&L值检测染色体非整倍性(通过Y染色体估算混合DNA浓度方法)
注:
T.chr13:13号染色体的T值;
L.chr13:13号染色体的L值;
T.chr18:18号染色体的T值;
L.chr18:18号染色体的L值;
T.chr21:21号染色体的T值;
L.chr21:21号染色体的L值;
fra.chry:表示通过Y染色体估算出来的混合DNA胎儿浓度;
T21-10%-30%:用21三体的细胞系打断的DNA按照10%的浓度,30%的嵌合比例配到女性血浆中;
表C通过片段估算胎儿浓度检测染色体非整倍性
注:
fra.chr13:表示通过13号染色体反估出来的混合DNA浓度;
fra.chr18:表示通过18号染色体反估出来的混合DNA浓度;
fra.chr21:表示通过21号染色体反估出来的混合DNA浓度;
fra.size:表示通过片段估算出来的混合DNA浓度;
T21-10%-30%:用21三体的细胞系打断的DNA按照10%的浓度,30%的嵌合比例配到女性血浆中;
表D通过T&L值检测染色体非整倍性(片段估算胎儿浓度方法)
注:
T.chr13:13号染色体的T值;
L.chr13:13号染色体的L值;
T.chr18:18号染色体的T值;
L.chr18:18号染色体的L值;
T.chr21:21号染色体的T值;
L.chr21:21号染色体的L值;
fra.size:表示通过片段估算出来的混合DNA浓度;
T21-10%-30%:用21三体的细胞系打断的DNA按照10%的浓度,30%的嵌合比例配到女性血浆中;
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。

Claims (9)

1.一种确定生物样本中预定来源的游离核酸比例的方法,其特征在于,包括:
(1)对含有游离核酸的生物样本进行核酸测序,以便获得由多个测序数据构成的测序结果;
(2)基于所述测序结果,确定所述样本中长度落入预定范围的核酸分子的数目;以及
(3)基于所述长度落入预定范围的核酸分子的数目,确定所述生物样本中所述预定来源的游离核酸比例
可选的,所述生物样本为外周血,可选的,所述预定来源的游离核酸为孕妇外周血中的游离胎儿核酸或母亲来源的游离核酸,或者肿瘤患者、疑似肿瘤患者或者肿瘤筛查者外周血中的游离肿瘤核酸或非肿瘤来源的游离核酸,可选的,所述测序为双末端测序、单末端测序或单分子测序,可选的,所述核酸为DNA,
可选的,步骤(2)进一步包括:
(2-1)将所述测序结果与参考基因组进行比对,以便构建唯一比对测序数据集,所述唯一比对测序数据集中的每一个测序数据仅能够与所述参考基因组的一个位置匹配;
(2-2)确定所述唯一比对测序数据集中各测序数据所对应的核酸分子的长度;以及
(2-3)确定长度落入所述预定范围的核酸分子的数目,
可选的,在步骤(2-2)中,将所述测序数据中能够与所述参考基因组匹配的序列长度作为与所述测序数据对应的核酸分子的长度,
可选的,所述测序为双末端测序,并且步骤(2-2)中,包括:
(2-2-1)基于所述双末端测序数据的一侧测序数据,在所述参考基因组上,确定所述核酸的5’末端位置;
(2-2-2)基于所述双末端测序数据的另一侧测序数据,在所述参考基因组上,确定所述核酸的3’末端位置;以及
(2-2-3)基于所述核酸的5’末端位置以及所述核酸的3’末端位置,确定所述核酸的长度,
可选的,所述预定范围是基于多个对照样品确定的,其中,所述对照样品中预定来源的游离核酸比例是已知的,
可选的,所述预定范围是基于至少20个对照样品确定的,
可选的,所述预定范围是通过下列步骤确定的:
(a)确定所述多个对照样品中所包含游离核酸分子的长度;
(b)设定多个候选长度范围,并分别确定所述多个对照样品在各候选长度范围内出现游离核酸分子的频率;
(c)基于所述多个对照样品在各候选长度范围内出现游离核酸分子的频率以及所述对照样品中预定来源的游离核酸比例,确定各所述候选长度范围与所述预定来源的游离核酸比例的相关性系数;以及
(d)基于所述相关性系数的数值,确定至少一个候选长度范围或者候选长度范围组合作为所述预定范围,
可选的,所述候选长度范围的跨度为1~20bp,
可选的,所述多个候选长度范围的步长为1~2bp,
可选的,步骤(3)进一步包括:
(3-1)基于所述长度落入预定范围的核酸分子的数目,确定在所述预定范围内出现游离核酸分子的频率;以及
(3-2)基于在所述预定范围内出现游离核酸分子的频率,根据预定的函数,确定所述生物样本中预定来源的游离核酸的比例,
其中,
所述预定的函数是基于所述多个对照样品确定的,
可选的,所述预定的函数是通过下列步骤获得的:
(i)分别在所述多个对照样品中,确定在所述预定范围内出现游离核酸分子的频率;以及
(ii)将所述多个对照样品中在所述预定范围内出现游离核酸分子的频率与已知的预定来源的游离核酸比例进行拟合,以便确定所述预定的函数,可选的,所述拟合为线性拟合,
可选的,所述预定来源的游离核酸为孕妇外周血中的游离胎儿核酸,所述预定范围是185~204bp,
可选的,所述预定的函数为d=0.0334*p+1.6657,其中,d表示游离胎儿核酸比例,p表示在所述预定范围内出现游离核酸分子的频率,
可选的,所述对照样品为已知游离胎儿核酸比例的孕妇外周血样本,
可选的,所述对照样品为已知游离胎儿核酸比例的怀有正常男胎的孕妇外周血样本,并且所述已知游离胎儿核酸比例是利用Y染色体确定的。
2.一种用于确定生物样本中预定来源的游离核酸比例的设备,其特征在于,包括:
测序装置,所述测序装置用于对含有游离核酸的生物样本进行核酸测序,以便获得由多个测序数据构成的测序结果;
计数装置,所述计数装置与所述测序装置相连,并且用于基于所述测序结果,确定所述样本中长度落入预定范围的核酸分子的数目;以及
游离核酸比例确定装置,所述游离核酸比例确定装置与所述计数装置相连,并且用于基于所述长度落入预定范围的核酸分子的数目,确定所述生物样本中所述预定来源的游离核酸比例,
可选的,所述生物样本为外周血,
可选的,所述预定来源的游离核酸为孕妇外周血中的游离胎儿核酸或母亲来源的游离核酸,或者肿瘤患者、疑似肿瘤患者或者肿瘤筛查者外周血中的游离肿瘤核酸或非肿瘤来源的游离核酸,
可选的,所述测序为双末端测序、单末端测序或单分子测序,
可选的,所述核酸为DNA,
可选的,所述计数装置进一步包括:
比对单元,所述比对单元用于将所述测序结果与参考基因组进行比对,以便构建唯一比对测序数据集,所述唯一比对测序数据集中的每一个测序数据仅能够与所述参考基因组的一个位置匹配;
第一长度确定单元,所述第一长度确定单元与所述比对单元相连,用于确定所述唯一比对测序数据集中各测序数据所对应的核酸分子的长度;以及
数目确定单元,所述数目确定单元与所述第一长度确定单元相连,用于确定长度落入所述预定范围的核酸分子的数目,
可选的,所述第一长度确定单元将所述测序数据能够与所述参考基因组匹配的序列长度作为与所述测序数据对应的核酸分子的长度,
可选的,所述测序为双末端测序,
其中,
所述第一长度确定单元进一步包括:
5’末端位置确定模块,所述5’末端位置确定模块用于基于所述双末端测序数据的一侧测序数据,在所述参考基因组上,确定所述核酸的5’末端位置;
3’末端位置确定模块,所述3’末端位置确定模块与所述5’末端位置确定模块相连,用于基于所述双末端测序数据的另一侧测序数据,在所述参考基因组上,确定所述核酸的3’末端位置;以及
长度计算模块,所述长度计算模块与所述3’末端位置确定模块相连,用于基于所述核酸的5’末端位置以及所述核酸的3’末端位置,确定所述核酸的长度,
可选的,进一步包括预定范围确定装置,所述预定范围确定装置用于基于多个对照样品确定所述预定范围,其中,所述对照样品中预定来源的游离核酸比例是已知的,
任选地,所述预定范围是基于至少20个对照样品确定的,
可选的,所述预定范围确定装置进一步包括:
第二长度确定单元,所述第二长度确定单元用于确定所述多个对照样品中所包含游离核酸分子的长度;
第一比例确定单元,所述第一比例确定单元与所述第二长度确定单元相连,用于设定多个候选长度范围,并分别确定所述多个对照样品在各所述候选长度范围内出现游离核酸分子的频率;
相关性系数确定单元,所述相关性系数确定单元与所述第一比例确定单元相连,用于基于所述多个对照样品在各候选长度范围内出现游离核酸分子的频率以及所述对照样品中预定来源的游离核酸比例,确定各所述候选长度范围与所述预定来源的游离核酸比例的相关性系数;以及
预定范围确定单元,所述预定范围确定单元与所述相关性系数确定单元相连,用于选择相关性系数最大的候选长度范围作为所述预定范围,
可选的,所述候选长度的跨度为1~20bp,
任选地,所述多个候选长度范围的步长为1~2bp,
可选的,所述游离核酸比例确定装置进一步包括:
第二比例确定单元,所述第二比例确定单元用于基于所述长度落入预定范围的核酸分子的数目,确定在所述预定范围内出现游离核酸分子的频率;以及
游离核酸比例计算单元,所述游离核酸比例计算单元与所述第二比例确定单元相连,用于基于在所述预定范围内出现游离核酸分子的频率,根据预定的函数,确定所述生物样本中预定来源的游离核酸的比例,
其中,
所述预定的函数是基于所述多个对照样品确定的,
可选的,进一步包括预定函数确定装置,所述预定函数确定装置包括:
第三比例确定单元,所述第三比例确定单元用于分别在所述多个对照样品中,确定在所述预定范围内出现游离核酸分子的频率;以及
拟合单元,所述拟合单元与所述第三比例确定单元相连,用于将所述多个对照样品中在所述预定范围内出现游离核酸分子的频率与已知的预定来源的游离核酸比例进行拟合,以便确定所述预定的函数,
可选的,所述拟合为线性拟合,
可选的,所述预定来源的游离核酸为孕妇外周血中的游离胎儿核酸,所述预定范围是185~204bp,
可选的,所述预定的函数为d=0.0334*p+1.6657,其中,d表示游离胎儿核酸比例,p表示在所述预定范围内出现游离核酸分子的频率,
可选的,所述对照样品为已知游离胎儿核酸比例的孕妇外周血样本,
可选的,所述对照样品为已知游离胎儿核酸比例的怀有正常男胎的孕妇外周血样本,并且所述已知游离胎儿核酸比例是利用Y染色体确定的。
3.一种检测双胞胎染色体非整倍性的方法,其特征在于,包括:
(1)对怀有双胞胎的孕妇的外周血进行游离核酸测序,以便获得由多个测序数据构成的测序结果;
(2)基于所述测序数据,根据权利要求1所述的方法,确定第一游离胎儿DNA比例,
(3)基于所述测序结果中来源于预定染色体的测序数据,确定第三游离胎儿DNA比例;以及
(4)基于所述第一游离胎儿DNA比例与所述第三游离胎儿DNA比例,确定所述双胞胎中针对所述预定染色体是否存在非整倍性,
可选的,所述第三游离胎儿DNA比例是基于下列公式确定的:
fra.chri=2*(chri.ER%/adjust.chri.ER%-1)*100%
其中,
fra.chri表示所述第三游离胎儿DNA比例,i为所述预定染色体的编号,并且i为1~22范围内的任意整数;
chri.ER%表示所述测序结果中来源于所述预定染色体的测序数据占总测序数据的百分比;
adjust.chri.ER%表示预先确定的怀有正常双胞胎的孕妇外周血样本中来源于所述预定染色体的游离核酸的测序数据占总测序数据的百分比平均值,
可选的,在步骤(4)中,包括:
(a)确定所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值;以及
(b)将步骤(a)中所得到的比值与预定的第三阈值和第四阈值进行比较,以便确定所述双胞胎针对所述预定染色体是否存在非整倍性,
可选的,所述第三阈值是基于多个已知双胞胎针对所述预定染色体均不存在非整倍性的参照样本确定的,所述第四阈值是基于多个已知双胞胎针对所述预定染色体均为非整倍性的参照样本确定的,
可选的,其特征在于,所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值小于所述第三阈值表示所述双胞胎针对所述预定染色体均不存在非整倍性,
所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值大于所述第四阈值表示所述双胞胎均针对所述预定染色体均为非整倍性,
所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值等于所述第三三阈值或者第四阈值,或者介于所述第三阈值与所述第四值之间表示所述双胞胎其中一个针对所述预定染色体具有非整倍性,另外一个针对所述预定染色体不具有非整倍性,
可选的,所述第三阈值为0.35,所述第四阈值为0.7,
可选的,所述预定染色体为18、21和23号染色体至少之一。
4.一种确定双胞胎染色体非整倍性的系统,其特征在于,包括:
第一游离胎儿DNA比例确定设备,所述第一游离胎儿DNA比例确定设备为权利要求21~45所述的确定生物样本中游离核酸比例的设备,用于对怀有双胞胎的孕妇的外周血进行游离核酸测序,以便获得由多个测序数据构成的测序结果,并且基于所述测序数据,确定第一游离胎儿DNA比例,
第三游离胎儿DNA比例确定设备,所述第三游离胎儿DNA比例确定设备适于基于所述测序结果中来源于预定染色体的测序数据,确定第三游离胎儿DNA比例;以及
第一非整倍性确定设备,所述第一非整倍性确定设备适于基于所述第一游离胎儿DNA比例与所述第三游离胎儿DNA比例,确定所述双胞胎中针对所述预定染色体是否存在非整倍性,
可选的,所述第三游离胎儿DNA比例是基于下列公式确定的:
fra.chri=2*(chri.ER%/adjust.chri.ER%-1)*100%
其中,
fra.chri表示所述第三游离胎儿DNA比例,i为所述预定染色体的编号,并且i为1~22范围内的任意整数;
chri.ER%表示所述测序结果中来源于所述预定染色体的测序数据占总测序数据的百分比;
adjust.chri.ER%表示预先确定的怀有正常双胞胎的孕妇外周血样本中来源于所述预定染色体的游离核酸的测序数据占总测序数据的百分比平均值,
可选的,非整倍性确定设备进一步包括:
比值确定单元,所述比值确定单元用于确定所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值;以及
比较单元,将所得到的比值与预定的第三阈值和第四阈值进行比较,以便确定所述双胞胎针对所述预定染色体是否存在非整倍性,
可选的,所述第三阈值是基于多个已知双胞胎针对所述预定染色体均不存在非整倍性的参照样本确定的,所述第四阈值是基于多个已知双胞胎针对所述预定染色体均为非整倍性的参照样本确定的,
可选的,所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值小于所述第三阈值表示所述双胞胎针对所述预定染色体均不存在非整倍性,
所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值大于所述第四阈值表示所述双胞胎均针对所述预定染色体均为非整倍性,
所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值等于所述第三阈值或者第四阈值,或者介于所述第三阈值与所述第四值之间表示所述双胞胎其中一个针对所述预定染色体具有非整倍性,另外一个针对所述预定染色体不具有非整倍性,
可选的,所述第三阈值为0.35,所述第四阈值为0.7,
可选的,所述预定染色体为18、21和23号染色体至少之一。
5.一种确定双胞胎染色体非整倍性的方法,其特征在于,包括:
(1)对怀有双胞胎的孕妇的外周血进行游离核酸测序,以便获得由多个测序数据构成的测序结果;
(2)确定所述测序结果中来源于染色体i的测序数据数目占总测序数据的比例xi,其中,i表示染色体编号,并且i为1~22范围内的任意整数;
(3)基于公式Ti=(xii)/σi,确定针对染色体i的T值,其中,i表示染色体编号,并且i为1~22范围内的任意整数,μi表示在参考数据库中被选为参照系的第i条染色体的测序数据占总测序数据的百分含量的均值,σi:在参考数据库中被选为参照系的第i条染色体的测序数据占总测序数据的百分含量的标准差;
(4)基于公式Li=log(d(Ti,a))/log(d(T2i,a))确定针对染色体i的L值,其中,i表示染色体编号,并且i为1~22范围内的任意整数,
T2i=(xii*(1+fra/2))/σi
d(Ti,a)和d(T2i,a)为t分布概率密度函数,a为自由度,fra是根据权利要求1~20所述的方法确定的第一游离胎儿DNA比例,
(5)根据T值和L值作四象限图,横坐标为L值,纵坐标为T值,按照直线T=预定的第五阈值,L=预定的第六阈值,将所述四象限图进行划分区域,
其中,
当待测样本落在第一象限,则双胎中两个胎儿都判定为三体;
当待测样本落在第二象限,则双胎中有一个胎儿都判定为三体,一个正常;
当待测样本落在第三象限,则双胎中两个胎儿都判定为正常;
当待测样本落在第四象限,则双胎中判定为胎儿浓度比较低的样本,不采用其结果。
6.一种检测胎儿嵌合体的方法,其特征在于,包括:
(1)对怀有胎儿孕妇的外周血进行游离核酸测序,以便获得由多个测序数据构成的测序结果,任选地,所述胎儿为男胎;
(2)基于所述测序数据,根据权利要求1所述的方法,确定第一游离胎儿DNA比例,
或者,基于下列公式,使用Y染色体估算胎儿浓度fra.chrY%作为第一游离胎儿DNA比例:
fra.chry=(chry.ER%-Female.chr.ER%)/(Man.chry.UR%-Female.chry.ER%)*100%,
其中,
fra.chry表示第一游离胎儿DNA比例,
chry.ER%表示所述测序结果中来源于染色体Y的测序数据占总测序数据的百分比;
Female.chry.ER%表示预先确定的怀有正常女胎的孕妇外周血样本中来源于染色体Y的游离核酸的测序数据占总测序数据的百分比的平均值;以及
Man.chry.ER%表示预先确定的正常男性外周血样本中来源于染色体Y的游离核酸的测序数据占总测序数据的百分比的平均值;
(3)基于所述测序结果中来源于预定染色体的测序数据,确定第三游离胎儿DNA比例;以及
(4)基于所述第一游离胎儿DNA比例与所述第三游离胎儿DNA比例,确定所述胎儿中针对所述预定染色体是否存在嵌合体,
可选的,所述第三游离胎儿DNA比例是基于下列公式确定的:
fra.chri=2*(chri.ER%/adjust.chri.ER%-1)*100%
其中,
fra.chri表示所述第三游离胎儿DNA比例,i为所述预定染色体的编号,并且i为1~22范围内的任意整数;
chri.ER%表示所述测序结果中来源于所述预定染色体的测序数据占总测序数据的百分比;
adjust.chri.ER%表示预先确定的怀有正常胎儿的孕妇外周血样本中来源于所述预定染色体的游离核酸的测序数据占总测序数据的百分比平均值,
可选的,在步骤(4)中,包括:
(a)确定所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值;以及
(b)将步骤(a)中所得到的比值与预定的多个阈值进行比较,以便确定所述胎儿针对所述预定染色体是否存在嵌合体,
可选的,所述预定的多个阈值包括选自下列的至少之一:
第七阈值,所述第七阈值是基于多个已知针对所述预定染色体为完全单体的参照样本确定的,
第八阈值,所述第八阈值是基于多个已知针对所述预定染色体为单体嵌合的参照样本确定的,
第九阈值,所述第九阈值是基于多个已知针对所述预定染色体为正常的参照样本确定的,
第十阈值,所述第十阈值是基于多个已知针对所述预定染色体为完全三体的参照样本确定的,
任选地,所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值小于所述第七阈值表示所述胎儿针对所述预定染色体表示所述胎儿针对所述预定染色体为完全单体;
所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值不小于所述第七阈值并且不大于所述第八阈值表示所述胎儿针对所述预定染色体表示所述胎儿针对所述预定染色体为单体嵌合;
所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值大于所述第八阈值并且小于于所述第九阈值表示所述胎儿针对所述预定染色体表示所述胎儿针对所述预定染色体为正常;
所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值不小于所述第九阈值并且不大于所述第十阈值表示所述胎儿针对所述预定染色体表示所述胎儿针对所述预定染色体为三体嵌合;
所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值大于所述第十阈值表示所述胎儿针对所述预定染色体表示所述胎儿针对所述预定染色体为完全三体,
可选的,所述第七阈值大于-1并且所述第七阈值小于0,任选地所述第七阈值为-0.85;
所述第八阈值大于所述第七阈值并且所述第八阈值小于0,任选地所述第八阈值为-0.3;
所述第九阈值大于0并且所述第九阈值小于1,任选地所述第九阈值为0.3;
所述第十阈值大于所述第九阈值并且所述第十阈值小于1,任选地所述第十阈值为0.85。
7.一种检测胎儿嵌合体的系统,其特征在于,包括:
第一游离胎儿DNA比例确定设备,所述第一游离胎儿DNA比例确定设备为权利要求21~45所述的确定生物样本中游离核酸比例的设备,用于对胎儿的孕妇的外周血进行核酸测序,以便获得由多个测序数据构成的测序结果,并且基于所述测序数据,确定第一游离胎儿DNA比例,
或者,所述第一游离胎儿DNA比例确定设备适于基于下列公式,使用Y染色体估算胎儿浓度fra.chrY%作为第一游离胎儿DNA比例:
fra.chry=(chry.ER%-Female.chr.ER%)/(Man.chry.UR%-Female.chry.ER%)*100%,
其中,
fra.chry表示第一游离胎儿DNA比例,
chry.ER%表示所述测序结果中来源于染色体Y的测序数据占总测序数据的百分比;
Female.chry.ER%表示预先确定的怀有正常女胎的孕妇外周血样本中来源于染色体Y的游离核酸的测序数据占总测序数据的百分比的平均值;以及
Man.chry.ER%表示预先确定的正常男性外周血样本中来源于染色体Y的游离核酸的测序数据占总测序数据的百分比的平均值;
第三游离胎儿DNA比例确定设备,所述第三游离胎儿DNA比例确定设备适于基于所述测序结果中来源于预定染色体的测序数据,确定第三游离胎儿DNA比例;以及
嵌合体确定设备,所述嵌合体确定设备适于基于所述第一游离胎儿DNA比例与所述第三游离胎儿DNA比例,确定所述双胞胎中针对所述预定染色体是否存在嵌合体,
可选的,所述第三游离胎儿DNA比例是基于下列公式确定的:
fra.chri=2*(chri.ER%/adjust.chri.ER%-1)*100%
其中,
fra.chri表示所述第三游离胎儿DNA比例,i为所述预定染色体的编号,并且i为1~22范围内的任意整数;
chri.ER%表示所述测序结果中来源于所述预定染色体的测序数据占总测序数据的百分比;
adjust.chri.ER%表示预先确定的怀有正常胎儿的孕妇外周血样本中来源于所述预定染色体的游离核酸的测序数据占总测序数据的百分比平均值,
可选的,非整倍性确定设备进一步包括:
比值确定单元,所述比值确定单元用于确定所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值;以及
比较单元,将所得到的比值与预定的多个阈值进行比较,以便确定所述胎儿针对所述预定染色体是否存在嵌合体,
可选的,所述预定的多个阈值包括选自下列的至少之一:
第七阈值,所述第七阈值是基于多个已知针对所述预定染色体为完全单体的参照样本确定的,
第八阈值,所述第八阈值是基于多个已知针对所述预定染色体为单体嵌合的参照样本确定的,
第九阈值,所述第九阈值是基于多个已知针对所述预定染色体为正常的参照样本确定的,
第十阈值,所述第十阈值是基于多个已知针对所述预定染色体为完全三体的参照样本确定的,
任选地,所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值小于所述第七阈值表示所述胎儿针对所述预定染色体表示所述胎儿针对所述预定染色体为完全单体;
所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值不小于所述第七阈值并且不大于所述第八阈值表示所述胎儿针对所述预定染色体表示所述胎儿针对所述预定染色体为单体嵌合;
所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值大于所述第八阈值并且小于所述第九阈值表示所述胎儿针对所述预定染色体表示所述胎儿针对所述预定染色体为正常;
所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值不小于所述第九阈值并且不大于所述第十阈值表示所述胎儿针对所述预定染色体表示所述胎儿针对所述预定染色体为三体嵌合;
所述第三游离胎儿DNA比例与所述第一游离胎儿DNA比例的比值大于所述第十阈值表示所述胎儿针对所述预定染色体表示所述胎儿针对所述预定染色体为完全三体,
可选的,所述第七阈值大于-1并且所述第七阈值小于0,任选地所述第五阈值为-0.85;
所述第八阈值大于所述第七阈值并且所述第八阈值小于0,任选地所述第八阈值为-0.3;
所述第九阈值大于0并且所述第九阈值小于1,任选地所述第九阈值为0.3;
所述第十阈值大于所述第九阈值并且所述第十阈值小于1,任选地所述第十阈值为0.85。
8.一种检测胎儿嵌合体的方法,其特征在于,包括:
(1)对怀有胎儿的孕妇的外周血进行游离核酸测序,以便获得由多个测序数据构成的测序结果;
(2)确定所述测序结果中来源于染色体i的测序数据数目占总测序数据的比例xi,其中,i表示染色体编号,并且i为1~22范围内的任意整数;
(3)基于公式Ti=(xii)/σi,确定针对染色体i的T值,其中,i表示染色体编号,并且i为1~22范围内的任意整数,μi表示在参考数据库中被选为参照系的第i条染色体的测序数据占总测序数据的百分含量的均值,σi:在参考数据库中被选为参照系的第i条染色体的测序数据占总测序数据的百分含量的标准差;
(4)基于公式Li=log(d(Ti,a))/log(d(T2i,a))确定针对染色体i的L值,其中,i表示染色体编号,并且i为1~22范围内的任意整数,
T2i=(xii*(1+fra/2))/σi
d(Ti,a)和d(T2i,a)为t分布概率密度函数,a为自由度,fra是根据权利要求1~20所述的方法确定的游离胎儿DNA比例,或者是使用Y染色体估算的胎儿浓度fra.chrY%,其中,
fra.chry=(chry.ER%-Female.chr.ER%)/(Man.chry.UR%-Female.chry.ER%)*100%,
其中,
fra.chry表示游离胎儿DNA比例,
chry.ER%表示所述测序结果中来源于染色体Y的测序数据占总测序数据的百分比;
Female.chry.ER%表示预先确定的怀有正常女胎的孕妇外周血样本中来源于染色体Y的游离核酸的测序数据占总测序数据的百分比的平均值;以及
Man.chry.ER%表示预先确定的正常男性外周血样本中来源于染色体Y的游离核酸的测序数据占总测序数据的百分比的平均值;
(5)如果T不大于0,则根据T值和L值作四象限图,横坐标为L值,纵坐标为T值,按照直线T=预定的第十一阈值,L=预定的第十二阈值,将所述四象限图进行划分区域,
其中,
当待测样本落在第一象限,则将所述胎儿判定为针对所述预定染色体为完全单体或单体嵌合;
当待测样本落在第二象限,则将所述胎儿判定为针对所述预定染色体为单体嵌合;
当待测样本落在第三象限,则将所述胎儿判定为针对所述预定染色体为正常;
当待测样本落在第四象限,则将所述胎儿判定为胎儿浓度比较低的样本,不采用其结果,
如果T大于0,则根据T值和L值作四象限图,横坐标为L值,纵坐标为T值,按照直线T=预定的第十三阈值,L=预定的第十四阈值,将所述四象限图进行划分区域,
其中,
当待测样本落在第一象限,则将所述胎儿判定为针对所述预定染色体为完全三体或三体嵌合;
当待测样本落在第二象限,则将所述胎儿判定为针对所述预定染色体为三体嵌合;
当待测样本落在第三象限,则将所述胎儿判定为针对所述预定染色体为正常;
当待测样本落在第四象限,则将所述胎儿判定为胎儿浓度比较低的样本,不采用其结果,
任选地,所述第十一阈值和所述第十三阈值分别独立地为3,所述第十二阈值和所述十四阈值分别独立地为1。
9.一种确定双胞胎染色体非整倍性的系统,其特征在于,包括:
xi值确定设备,所述xi值确定设备用于对怀有双胞胎的孕妇的外周血进行游离核酸测序,以便获得由多个测序数据构成的测序结果,并且确定所述测序结果中来源于染色体i的测序数据数目占总测序数据的比例xi,其中,i表示染色体编号,并且i为1~22范围内的任意整数;
T值确定设备,所述T值确定设备用于基于公式Ti=(xii)/σi,确定针对染色体i的T值,其中,i表示染色体编号,并且i为1~22范围内的任意整数,μi表示在参考数据库中被选为参照系的第i条染色体的测序数据占总测序数据的百分含量的均值,σi:在参考数据库中被选为参照系的第i条染色体的测序数据占总测序数据的百分含量的标准差;
L值确定设备,所述L值确定设备用于基于公式Li=log(d(Ti,a))/log(d(T2i,a))确定针对染色体i的L值,其中,i表示染色体编号,并且i为1~22范围内的任意整数,
T2i=(xii*(1+fra/2))/σi
d(Ti,a)和d(T2i,a)为t分布概率密度函数,a为自由度,fra是根据权利要求1~20所述的方法确定的游离胎儿DNA比例,
第二非整倍性确定设备,所述第二非整倍性确定设备适于根据T值和L值作四象限图,横坐标为L值,纵坐标为T值,按照直线T=预定的第五阈值,L=预定的第六阈值,将所述四象限图进行划分区域,
其中,
当待测样本落在第一象限,则双胎中两个胎儿都判定为三体;
当待测样本落在第二象限,则双胎中有一个胎儿都判定为三体,一个正常;
当待测样本落在第三象限,则双胎中两个胎儿都判定为正常;
当待测样本落在第四象限,则双胎中判定为胎儿浓度比较低的样本,不采用其结果。
CN201510444722.0A 2014-07-25 2015-07-24 确定生物样本中游离核酸比例的方法、装置及其用途 Active CN105296606B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510444722.0A CN105296606B (zh) 2014-07-25 2015-07-24 确定生物样本中游离核酸比例的方法、装置及其用途

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201410359726 2014-07-25
CN2014103597264 2014-07-25
CN201510444722.0A CN105296606B (zh) 2014-07-25 2015-07-24 确定生物样本中游离核酸比例的方法、装置及其用途

Publications (2)

Publication Number Publication Date
CN105296606A true CN105296606A (zh) 2016-02-03
CN105296606B CN105296606B (zh) 2019-08-09

Family

ID=55162536

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510444722.0A Active CN105296606B (zh) 2014-07-25 2015-07-24 确定生物样本中游离核酸比例的方法、装置及其用途

Country Status (16)

Country Link
US (1) US20180082012A1 (zh)
EP (1) EP3178941B1 (zh)
KR (1) KR102018444B1 (zh)
CN (1) CN105296606B (zh)
AU (1) AU2015292020B2 (zh)
CA (1) CA2956105C (zh)
DK (1) DK3178941T3 (zh)
ES (1) ES2903103T3 (zh)
HR (1) HRP20220045T1 (zh)
HU (1) HUE059031T2 (zh)
PL (1) PL3178941T3 (zh)
RS (1) RS62803B1 (zh)
RU (1) RU2699728C2 (zh)
SG (1) SG11201700602WA (zh)
SI (1) SI3178941T1 (zh)
WO (1) WO2016011982A1 (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107239676A (zh) * 2017-05-17 2017-10-10 东莞博奥木华基因科技有限公司 一种针对胚胎染色体的序列数据处理装置
CN108060218A (zh) * 2017-11-14 2018-05-22 广州精科医学检验所有限公司 核酸测序文库中预定范围的核酸片段的筛选方法
WO2018137496A1 (zh) * 2017-01-24 2018-08-02 深圳华大基因股份有限公司 确定生物样本中预定来源的游离核酸比例的方法及装置
CN108733979A (zh) * 2017-10-30 2018-11-02 成都凡迪医疗器械有限公司 Nipt的gc含量校准方法、装置及计算机可读存储介质
CN110291212A (zh) * 2017-01-25 2019-09-27 香港中文大学 使用核酸片段的诊断应用
CN110914456A (zh) * 2017-03-31 2020-03-24 普莱梅沙有限公司 检测胎儿染色体异常的方法
CN114945685A (zh) * 2020-01-17 2022-08-26 深圳华大生命科学研究院 确定胎儿核酸浓度的方法以及胎儿基因分型方法
WO2023010242A1 (zh) * 2021-08-02 2023-02-09 深圳华大生命科学研究院 估计无创产前基因检测数据中胎儿核酸浓度的方法和系统
US12234515B2 (en) 2017-07-26 2025-02-25 The Chinese University Of Hong Kong Enhancement of cancer screening using cell-free viral nucleic acids

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9260753B2 (en) 2011-03-24 2016-02-16 President And Fellows Of Harvard College Single cell nucleic acid detection and analysis
US11913065B2 (en) 2012-09-04 2024-02-27 Guardent Health, Inc. Systems and methods to detect rare mutations and copy number variation
US10876152B2 (en) 2012-09-04 2020-12-29 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
US20160040229A1 (en) 2013-08-16 2016-02-11 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
EP4036247B1 (en) 2012-09-04 2024-04-10 Guardant Health, Inc. Methods to detect rare mutations and copy number variation
SG10201804519RA (en) 2013-12-28 2018-07-30 Guardant Health Inc Methods and systems for detecting genetic variants
CN117174167A (zh) 2015-12-17 2023-12-05 夸登特健康公司 通过分析无细胞dna确定肿瘤基因拷贝数的方法
US9850523B1 (en) 2016-09-30 2017-12-26 Guardant Health, Inc. Methods for multi-resolution analysis of cell-free nucleic acids
WO2018064629A1 (en) 2016-09-30 2018-04-05 Guardant Health, Inc. Methods for multi-resolution analysis of cell-free nucleic acids
WO2018210877A1 (en) * 2017-05-15 2018-11-22 Katholieke Universiteit Leuven Method for analysing cell-free nucleic acids
DE202019005627U1 (de) 2018-04-02 2021-05-31 Grail, Inc. Methylierungsmarker und gezielte Methylierungssondenpanels
AU2019351130B2 (en) 2018-09-27 2025-10-23 GRAIL, Inc Methylation markers and targeted methylation probe panel
ES3013495T3 (en) 2019-01-31 2025-04-14 Guardant Health Inc Method for isolating and sequencing cell-free dna
US11211147B2 (en) 2020-02-18 2021-12-28 Tempus Labs, Inc. Estimation of circulating tumor fraction using off-target reads of targeted-panel sequencing
US11211144B2 (en) 2020-02-18 2021-12-28 Tempus Labs, Inc. Methods and systems for refining copy number variation in a liquid biopsy assay
US11475981B2 (en) 2020-02-18 2022-10-18 Tempus Labs, Inc. Methods and systems for dynamic variant thresholding in a liquid biopsy assay

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013132305A1 (en) * 2012-03-08 2013-09-12 The Chinese University Of Hong Kong Size-based analysis of fetal dna fraction in maternal plasma
CN103534591A (zh) * 2010-10-26 2014-01-22 利兰·斯坦福青年大学托管委员会 通过测序分析进行的非侵入性胎儿遗传筛选
CN103525939A (zh) * 2013-10-28 2014-01-22 广州爱健生物技术有限公司 无创检测胎儿染色体非整倍体的方法和系统
WO2014068075A1 (en) * 2012-10-31 2014-05-08 Genesupport Sa Non-invasive method for detecting a fetal chromosomal aneuploidy
WO2014075228A1 (zh) * 2012-11-13 2014-05-22 深圳华大基因医学有限公司 确定生物样本中染色体数目异常的方法、系统和计算机可读介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7645576B2 (en) * 2005-03-18 2010-01-12 The Chinese University Of Hong Kong Method for the detection of chromosomal aneuploidies
CA2786916A1 (en) * 2010-01-15 2011-07-21 The University Of British Columbia Multiplex amplification for the detection of nucleic acid variations
CN103923987A (zh) * 2014-04-01 2014-07-16 中山大学达安基因股份有限公司 一种基于高通量测序检测13、18、21三体综合征的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103534591A (zh) * 2010-10-26 2014-01-22 利兰·斯坦福青年大学托管委员会 通过测序分析进行的非侵入性胎儿遗传筛选
WO2013132305A1 (en) * 2012-03-08 2013-09-12 The Chinese University Of Hong Kong Size-based analysis of fetal dna fraction in maternal plasma
WO2014068075A1 (en) * 2012-10-31 2014-05-08 Genesupport Sa Non-invasive method for detecting a fetal chromosomal aneuploidy
WO2014075228A1 (zh) * 2012-11-13 2014-05-22 深圳华大基因医学有限公司 确定生物样本中染色体数目异常的方法、系统和计算机可读介质
CN103525939A (zh) * 2013-10-28 2014-01-22 广州爱健生物技术有限公司 无创检测胎儿染色体非整倍体的方法和系统

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018137496A1 (zh) * 2017-01-24 2018-08-02 深圳华大基因股份有限公司 确定生物样本中预定来源的游离核酸比例的方法及装置
CN110191964A (zh) * 2017-01-24 2019-08-30 深圳华大基因股份有限公司 确定生物样本中预定来源的游离核酸比例的方法及装置
CN110191964B (zh) * 2017-01-24 2023-12-05 深圳华大基因股份有限公司 确定生物样本中预定来源的游离核酸比例的方法及装置
CN110291212A (zh) * 2017-01-25 2019-09-27 香港中文大学 使用核酸片段的诊断应用
CN110914456A (zh) * 2017-03-31 2020-03-24 普莱梅沙有限公司 检测胎儿染色体异常的方法
CN107239676A (zh) * 2017-05-17 2017-10-10 东莞博奥木华基因科技有限公司 一种针对胚胎染色体的序列数据处理装置
CN107239676B (zh) * 2017-05-17 2018-04-17 东莞博奥木华基因科技有限公司 一种针对胚胎染色体的序列数据处理装置
US12234515B2 (en) 2017-07-26 2025-02-25 The Chinese University Of Hong Kong Enhancement of cancer screening using cell-free viral nucleic acids
CN108733979A (zh) * 2017-10-30 2018-11-02 成都凡迪医疗器械有限公司 Nipt的gc含量校准方法、装置及计算机可读存储介质
CN108060218A (zh) * 2017-11-14 2018-05-22 广州精科医学检验所有限公司 核酸测序文库中预定范围的核酸片段的筛选方法
CN114945685A (zh) * 2020-01-17 2022-08-26 深圳华大生命科学研究院 确定胎儿核酸浓度的方法以及胎儿基因分型方法
WO2023010242A1 (zh) * 2021-08-02 2023-02-09 深圳华大生命科学研究院 估计无创产前基因检测数据中胎儿核酸浓度的方法和系统

Also Published As

Publication number Publication date
BR112017001481A2 (pt) 2017-12-05
US20180082012A1 (en) 2018-03-22
EP3178941A1 (en) 2017-06-14
EP3178941B1 (en) 2021-10-13
SG11201700602WA (en) 2017-03-30
CN105296606B (zh) 2019-08-09
RS62803B1 (sr) 2022-02-28
ES2903103T3 (es) 2022-03-31
HK1213601A1 (zh) 2016-07-08
KR20170036734A (ko) 2017-04-03
WO2016011982A1 (zh) 2016-01-28
HRP20220045T1 (hr) 2022-04-15
CA2956105A1 (en) 2016-01-28
KR102018444B1 (ko) 2019-09-04
AU2015292020A1 (en) 2017-02-16
PL3178941T3 (pl) 2022-02-14
DK3178941T3 (da) 2022-01-17
EP3178941A4 (en) 2017-12-06
HUE059031T2 (hu) 2022-10-28
RU2017105504A3 (zh) 2018-08-27
RU2017105504A (ru) 2018-08-27
RU2699728C2 (ru) 2019-09-09
CA2956105C (en) 2021-04-27
SI3178941T1 (sl) 2022-04-29
AU2015292020B2 (en) 2018-07-05

Similar Documents

Publication Publication Date Title
CN105296606B (zh) 确定生物样本中游离核酸比例的方法、装置及其用途
US11031100B2 (en) Size-based sequencing analysis of cell-free tumor DNA for classifying level of cancer
KR101795124B1 (ko) 복제 수 변이를 검측하기 위한 방법 및 시스템
JP5837622B2 (ja) 多胎妊娠の分子検査
IL249095B1 (en) Detection of subchromosomal aneuploidy in the fetus and variations in the number of copies
JP2013509870A5 (zh)
CN111073962A (zh) 快速非整倍性检测
JP2014507158A5 (zh)
CN108256296A (zh) 数据处理方法及装置
CN104789466B (zh) 检测染色体非整倍性的试剂盒和装置
CN109461473B (zh) 胎儿游离dna浓度获取方法和装置
US11710565B2 (en) Method of detecting fetal chromosomal aneuploidy
CN112712853A (zh) 一种无创产前检测装置
CN117095745B (zh) 用于检测孕妇血浆游离dna中胎儿非整倍体和拷贝数变异的方法和装置及应用
HK1213601B (zh) 确定生物样本中游离核酸比例的方法、装置及其用途
EP3907739A1 (en) Method for determining fetal fraction in maternal sample
HK40029003A (zh) 快速非整倍性检测
BR112017001481B1 (pt) Método e dispositivo para a determinação de uma fração de ácidos nucleicos fetal livres de células em uma amostra de sangue periférico de uma mulher grávida, sistema para determinar o sexo de gêmeos, e sistema para determinação de uma aneuploidia cromossômica de gêmeos, sistema para detectar quimera fetal

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1213601

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant