[go: up one dir, main page]

CN113906146A - 优化的超低体积液体活检方法、系统和设备 - Google Patents

优化的超低体积液体活检方法、系统和设备 Download PDF

Info

Publication number
CN113906146A
CN113906146A CN202080039518.XA CN202080039518A CN113906146A CN 113906146 A CN113906146 A CN 113906146A CN 202080039518 A CN202080039518 A CN 202080039518A CN 113906146 A CN113906146 A CN 113906146A
Authority
CN
China
Prior art keywords
biological sample
cases
cell
nucleic acid
cfdna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080039518.XA
Other languages
English (en)
Inventor
迪尔克·万登博姆
马蒂亚斯·埃里克
保罗·厄特
吉姆·肖瓦普恩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Juno Diagnostics Inc
Original Assignee
Juno Diagnostics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Juno Diagnostics Inc filed Critical Juno Diagnostics Inc
Publication of CN113906146A publication Critical patent/CN113906146A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1003Extracting or separating nucleic acids from biological samples, e.g. pure separation or isolation methods; Conditions, buffers or apparatuses therefor
    • C12N15/1006Extracting or separating nucleic acids from biological samples, e.g. pure separation or isolation methods; Conditions, buffers or apparatuses therefor by means of a solid support carrier, e.g. particles, polymers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/50Other enzymatic activities
    • C12Q2521/501Ligase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2527/00Reactions demanding special reaction conditions
    • C12Q2527/101Temperature
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/143Multiplexing, i.e. use of multiple primers or probes in a single reaction, usually for simultaneously analyse of multiple analysis

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Immunology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

本文提供了用于从超低量生物样品中的无细胞胎儿核酸获得遗传信息的设备、系统、试剂盒和方法。由于获得超低量样品的便利性,可在需求点处至少部分地使用设备、系统、试剂盒和方法。

Description

优化的超低体积液体活检方法、系统和设备
交叉引用
本国际申请要求于2019年3月27日提交的美国临时申请序列号62/824,757的权益,其全部内容通过引用并入本文。
背景技术
基因测试是获得关于受试者的DNA和/或该DNA的表达的信息的手段。为获得关于受试者的生物信息,基因测试正在不断发展。该生物信息有许多用途,包括确定个体的健康状态、诊断个体患有感染或疾病、确定适合于个体的治疗方法、解决犯罪问题以及确定亲子关系。目前,基因测试主要由经训练的人员使用昂贵且庞大的设备在诊所和实验室进行,这些设备需要技术训练和专业知识才能使用。从获得来自患者的生物样品的时间开始,通常需要几天至几周来为患者提供基因测试的结果。
作为实例,许多意识到妊娠的人都渴望尽快知道婴儿的性别(在本申请中称为性别)。有些测试可以从母体血液中的DNA中获得性别信息。从母亲获得的血液必须由高度培训的技术人员用复杂的设备来分析。如果血液是在远离进行DNA分析的实验室的地点获得的,则必须及时储存、运输和分析样品,否则可能会导致样品降解。
无细胞核酸源自各种组织类型,并释放到个体的循环中。循环中的无细胞核酸库通常代表贡献组织类型的遗传构造。对于一个健康的个体,它可能是一个非常同质的库,没有太多的变异。但是,当组织包含明显不同的基因组时,可以观察到更加异质的无细胞核酸库。组织中具有明显不同的基因组的的受试者的常见实例包括但不限于:(a)癌症患者,其中肿瘤DNA包含突变位点;(b)移植患者,其中移植器官将供体DNA释放到无细胞DNA库中;以及(c)妊娠女性,其中胎盘贡献了无细胞DNA,该无细胞DNA在很大程度上代表了胎儿的DNA。在一些情况下,由于表观遗传修饰,基因组可能会明显不同。来自不同组织、器官和细胞类型的DNA已显示具有不同的表观遗传模式。因此,有可能检测来自组织、器官和细胞的无细胞核酸,该组织、器官和细胞包括但不限于脑、肝、脂肪、胰腺、内皮和免疫细胞。另外,当个体的组织或细胞类型受到疾病或感染的影响时,来自该组织或细胞类型的更多无细胞DNA可能在该个体中循环。
发明内容
本文公开了用于分析生物样品的组分(例如,核酸、蛋白质)的设备、系统、试剂盒和方法,该生物样品包含来自动物(人类或非人类)的样品。通常,本文公开的设备、系统、试剂盒和方法能够通过利用无细胞DNA片段化,从超低体积的样品提供遗传信息。为简便起见,这可以称为“超低体积液体活检”。在本公开内容之前,人们并不期望能够从超低体积的样品中获得可靠和有用的遗传信息,因为人们不认为超低体积的样品能够提供足够量的来自感兴趣的特定组织(例如,脑、肝、胎盘、肿瘤)的无细胞核酸以进行检测或提供信息。此外,由于来自其他无细胞核酸(特别是来自血细胞的无细胞核酸)的大量背景信号,以及受试者与受试者之间的背景差异,在测试受试者与对照受试者之间的再现性和可靠比较似乎几乎是不可能的。在本公开之前,也没有预料到从超低体积的样品中提取的DNA的相对量和大小分布特征能够与先前已经描述的显著不同。
与细胞DNA相比,无细胞DNA是片段化的。为了分析来自超低体积样品的无细胞DNA,本文公开的方法、设备、系统和试剂盒利用来自重复区域(例如,具有共同序列的区域)和/或多个区域的无细胞DNA片段作为统计上独立的标志物。本文公开的方法、设备、系统和试剂盒是可能的,因为来自重复区域(例如,包含多个拷贝的相同或相似序列的基因组区域)或许多区域合计的无细胞DNA片段在样品中的有效浓度高于非片段化的DNA序列。因此,包含足以获得有用遗传信息的许多分析物的样品体积低于先前所想的体积。有利地,来自重复区域的片段可以用单对引物扩增或用单个探针检测。备选地或附加地,可以以小体积检测不共有相似序列的多个检测区域,例如,用通用引物将其标记并扩增或用多个引物对(例如,以多重化形式)扩增。
由于其能够从超低体积的生物样品获得有用的遗传信息的能力,所述设备、系统、试剂盒和方法具有以下优势:(1)微创,(2)适用于很少或没有技术训练的家庭(例如,不需要复杂的设备);以及(3)在状况(例如,妊娠、感染)的早期阶段提供信息。这些优势减少或消除了对实验室或技术人员的需求,从而提高了患者的可及性、依从性和监控能力。这最终会以较低的医疗保健系统成本改善健康状态。
无细胞循环核酸的分析面临许多技术挑战。例如,血液中循环核酸的扩增可以被全血中的一些组分(例如,血红蛋白)抑制。本发明的方法、系统和设备解决这个技术挑战的方式之一是通过以避免损坏样品或来自全血或周围组织的组分(由于例如皮肤的经皮穿刺导致皮肤中的DNA污染获得的全血样品)污染样品的方式从毛细血管血液中获得血浆(包含无细胞核酸)。
小样品体积中无细胞循环核酸的分析特别具有挑战性。尽管过去曾试图实现这一目标,但由于本文所述的原因,在该领域中对于能否从可在需求点处收集的小样品体积(例如,来自手指针刺的毛细血管血液)中的无细胞DNA获得有用且准确的遗传信息仍有疑问。本文公开的方法、系统和设备不仅克服了这些技术挑战,而且可以在需求点处使用,这在现有技术水平下实际上是不可想象的。
例如,在过去尝试分析五毫升或更多毫升血液中的循环无细胞肿瘤DNA时,仅在样品具有相对较高的肿瘤负荷(例如15-20%)并且改变的基因组部分(FGA)为15%或更多以使得改变更容易检测时才提供有用信息。但是,在大多数患者中,肿瘤负荷要低得多。因此,过去的尝试排除了很大一部分患者群体。本文公开的方法、系统、设备和试剂盒能够检测在具有较低肿瘤负荷(例如,低于15%)的样品中的来自肿瘤的无细胞核酸。
在进一步的尝试中,由于白细胞污染或核酸损伤,分析更少量的生物样品是不成功的。在一些实施方案中,本文公开了在测量从母亲获得的样品中胎儿的无细胞核酸的组分的情况下DNA损伤或污染的影响的实例。如本文所示(参见实施例19),经皮穿刺部位(例如手指针刺(prick))的DNA损伤和/或污染导致样品中存在片段长度的核酸,在一些情况下,将其错误地认为是无细胞核酸片段。事实上,如本文所示,较短片段长度的高表现度源于来自周围皮肤的DNA,并且由刺血针引起的DNA损伤,由经皮穿刺以获得样品引起。当收集少量样品时,本文所述的DNA损伤和污染首次带来重大挑战。例如,根据这些发现,在20微升血液抽取中,胎儿分数将从10%下降至约5%。本文公开的方法、系统、设备和试剂盒提供通过经皮穿刺引入的污染和DNA损伤的解决方案,包括:(1)丢弃第一滴血,并获得后续血滴用于分析;(2)针对较长DNA片段选择的捕获方法;(3)电泳法;(4)按大小选择文库产物;(5)或基于大小信息使用解释/去除或差异性分析的生物信息学方法。
另外,从个体获得五毫升或更多毫升的血液需要实验室技术人员,这增加了基因分析的成本并且给患者带来的不便(例如,由于时间、不适和基因分析的花费而引起的不便)。本方法、设备和系统被配置为通过分析可在需求点处收集的生物样品如毛细血管血液(例如,来自手指针刺的毛细血管血液)来提供有用且准确的遗传信息,该生物样品的量远低于五毫升。
即使过去尝试分析了较小的样品体积,其产生的也是人造结果。例如,过去一些分析少量样品的尝试将来自细胞系的基因组DNA稀释并剪切基因组DNA以产生和检测无细胞(cfDNA)替代物(surrogate)。对细胞系DNA/剪切的DNA的下采样或稀释以及计算机模拟方法会产生人造结果,因为它们不能反映具有低输入分子数目的个体样品中的大小和长度分布以及区块(bin)信息。在另一个实例中,过去尝试分析少量生物样品产生人造结果,因为它们依赖于检测预定的突变,这也称为“已知事件”。本公开内容提供了以从非替代性cfDNA提供准确且非预定的遗传信息的方式从少量毛细血管血液(例如,手指针刺)中获得血浆(包含无细胞核酸)的方法、系统和设备。
本文所述的过去尝试将不得不在初始检测步骤中使用低通/低覆盖全基因组测序的组合,然后再进行更详细的附加分析以准确地进行遗传分析。低通/低覆盖的全基因组序列并不是高灵敏度检测未知事件的最佳方法,并且可能需要更详细的后续测定。使用多种测定方法提供遗传分析的成本高、效率低,并且在需求点处并不是可替代的解决方案。相比之下,本发明的方法、设备和系统通过提供一种方法来解决上述问题,该方法是通过使用多个无细胞DNA片段从超低样品体积获得精确的遗传分析,所述多个无细胞DNA片段合计以甚至在小样品中也可检测到的高浓度存在。
本文公开的设备、系统、试剂盒和方法总结如下。
本文公开的方面提供方法,其包括:(a)从受试者获得生物样品,其中所述生物样品包括无细胞脱氧核糖核酸(cfDNA),并且其中所述生物样品当从所述受试者获得时具有至多120微升(μl)的体积;(b)通过以下步骤标记至少一部分所述cfDNA以产生标记的cfDNA:(i)通过一个或多个步骤生成可连接的cfDNA,包括:(1)生成cfDNA的平端,其中使用一种或多种聚合酶和一种或多种核酸外切酶去除5’突出端或3’凹陷端;(2)使所述cfDNA的平端去磷酸化;(3)使所述cfDNA与群集剂接触,从而增强一种或多种聚合酶、一种或多种核酸外切酶与所述cfDNA之间的反应;或(4)使用连接酶修复或去除所述cfDNA中的DNA损伤;和(ii)在连接酶和一种或多种群集剂和小分子增强剂的存在下,通过将可连接的cfDNA与衔接子寡核苷酸接触,将可连接的cfDNA与所述衔接子寡核苷酸连接;和(c)任选地,扩增所述标记的cfDNA;和(d)测序至少一部分所述标记的cfDNA。在一些实施方案中,当从受试者获得时,所述体积至多为100微升。在一些实施方案中,当从受试者获得时,所述体积至多为55微升。在一些实施方案中,当从受试者获得时,所述体积至多为50微升。在一些实施方案中,当从受试者获得时,所述体积至多为40微升。在一些实施方案中,当从受试者获得时,所述体积在约10微升和约40微升之间。在一些实施方案中,从受试者获得的生物样品是毛细血管血液。在一些实施方案中,所述生物样品不是来自血液的血浆样品。在一些实施方案中,所述生物样品包含约25皮克(pg)至约250pg的总的循环cfDNA分子。在一些实施方案中,所述生物样品包含约104至约109个cfDNA分子。在一些实施方案中,所述生物样品包含约104至约107个cfDNA分子。在一些实施方案中,所述生物样品中的cfDNA是约10个基因组当量。在一些实施方案中,所述生物样品中的cfDNA是至多10个基因组当量。在一些实施方案中,所述生物样品中的cfDNA在5-6、6-7、7-8、8-9、9-10、10-11、11-12、12-13、13-14或14-15个基因组当量之间。在一些实施方案中,通过以下方法从受试者获得生物样品:(a)诱导第一次经皮穿刺以产生第一部分生物样品;(b)丢弃第一部分生物样品;(c)收集第二部分生物样品,从而减少或消除由于白细胞裂解造成的生物样品的污染。在一些实施方案中,方法还包括检测至少一部分标记的cfDNA中的至少一个靶序列的正常表现度、高表现度或低表现度。在一些实施方案中,所述受试者是妊娠有胎儿的。在一些实施方案中,cfDNA的组分是来自胎儿的胎儿cfDNA组分。在一些实施方案中,方法包括分析来自个体的基因型信息和胎儿cfDNA组分,以通过鉴定胎儿cfDNA组分和基因型信息之间的基因型匹配来确定所述个体是否对胎儿有父系贡献。在一些实施方案中,方法还包括在(c)中扩增,并且其中生成可连接的cfDNA包括:(a)生成所述cfDNA的平端,其中使用一种或多种聚合酶和一种或多种核酸外切酶去除5’突出端或3’凹陷端;(b)使所述cfDNA的平端去磷酸化;(c)使所述cfDNA与群集剂接触,从而增强所述一种或多种聚合酶、一种或多种核酸外切酶和所述cfDNA之间的反应;和(d)使用所述连接酶修复或去除所述cfDNA中的DNA损伤。在一些实施方案中,所述cfDNA选自受试者体内的肿瘤、移植组织或器官或一种或多种病原体。在一些实施方案中,所述一种或多种病原体包括细菌或其组分。在一些实施方案中,所述一种或多种病原体包括病毒或其组分。在一些实施方案中,所述一种或多种病原体包括真菌或其组分。在一些实施方案中,方法包括通过大规模多重扩增进行扩增。在一些实施方案中,大规模多重扩增测定是等温扩增。在一些实施方案中,所述大规模多重扩增测定是大规模多重聚合酶链反应(mmPCR)。在一些实施方案中,方法还包括合并两个或更多个生物样品,每个样品从不同的受试者获得。在一些实施方案中,方法还包括在从受试者获得生物样品后,使所述生物样品与白细胞稳定剂接触。在一些实施方案中,从受试者获得的生物样品是使用被配置为裂解受试者表皮的细胞间连接的设备收集的。在一些实施方案中,当通过以下步骤制备文库时,所述标记以至少0.5的效率产生标记的cfDNA的文库:(a)进行末端修复、5’磷酸化和A-加尾,在20摄氏度下孵育30分钟,然后在65摄氏度下孵育30分钟;(b)将所述cfDNA与衔接子寡核苷酸连接,在20摄氏度下孵育15分钟;(c)从所述衔接子寡核苷酸切割连接的衔接子环,在37摄氏度下孵育15分钟,以产生可连接的cfDNA;(d)通过以下步骤扩增可连接的cfDNA:(i)使所述可连接的cfDNA在98摄氏度下变性1分钟,然后在98摄氏度下进行10秒钟13个循环;(ii)将所述变性的可连接的cfDNA与来自(i)的一个或多个互补引物在65摄氏度下退火75秒钟;和(iii)将所述可连接的cfDNA在65摄氏度下延伸5分钟,以产生可连接的cfDNA的扩增文库;和(iv)使用SPRI珠纯化所述可连接的cfDNA的扩增文库。在一些实施方案中,所述标记以至少0.55、0.60、0.65、0.70、0.75、0.80、0.85、0.90、0.95、0.96、0.97、0.98、0.99或1.00的效率产生标记的cfDNA文库。
本文公开的方面提供方法,其包括:(a)从有胎儿的妊娠受试者获得生物样品,其中所述生物样品包括无细胞脱氧核糖核酸(cfDNA),并且其中所述生物样品当从受试者获得时具有不大于约120微升的体积;(b)使所述生物样品中的至少一种cfDNA与扩增试剂和退火至对应于目标序列的序列的多核苷酸引物接触以产生扩增产物;和(c)检测扩增产物存在或不存在。在一些实施方案中,方法还包括将具有可检测标记的寡核苷酸探针与所述至少一种cfDNA退火。在一些实施方案中,方法还包括检测所述cfDNA的表观遗传修饰。在一些实施方案中,所述表观遗传修饰包括在cfDNA遗传基因座处的甲基化。在一些实施方案中,检测所述扩增产物的存在指示胎儿的性别。在一些实施方案中,所述cfDNA的组分来自胎儿。在一些实施方案中,方法包括在从受试者获得生物样品之后,使所述生物样品与白细胞稳定剂接触。在一些实施方案中,当从受试者获得时,所述体积至多为100微升。在一些实施方案中,当从受试者获得时,所述体积至多为55微升。在一些实施方案中,当从受试者获得时,所述体积至多为50微升。在一些实施方案中,当从受试者获得时,所述体积至多为40微升。在一些实施方案中,当其从受试者获得时,所述体积在约10微升和约40微升之间。在一些实施方案中,从受试者获得的生物样品是毛细血管血液。在一些实施方案中,所述生物样品不是来自血液的血浆样品。在一些实施方案中,所述生物样品包含约25皮克(pg)至约250pg的总的循环cfDNA分子。在一些实施方案中,所述生物样品包含约104至约109个cfDNA分子。在一些实施方案中,所述生物样品包含约104至约107个cfDNA分子。在一些实施方案中,所述生物样品中的cfDNA是约10个基因组当量。在一些实施方案中,所述生物样品中的cfDNA是至多10个基因组当量。在一些实施方案中,所述生物样品中的cfDNA在5-6、6-7、7-8、8-9、9-10、10-11、11-12、12-13、13-14或14-15个基因组当量之间。在一些实施方案中,通过以下方法收集生物样品:(a)诱导第一次经皮穿刺以产生第一部分生物样品;(b)丢弃所述第一部分生物样品;(c)收集第二部分生物样品,从而减少或消除由于白细胞裂解造成的生物样品的污染。
本文公开的方面提供增加从受试者获得的生物样品中的靶核酸的相对量的方法,其包括:(a)在受试者的某一部位诱导经皮穿刺以产生第一部分生物样品和第二部分生物样品;(b)丢弃所述第一部分生物样品;和(c)收集所述第二部分生物样品,从而减少或消除生物样品的污染或核酸损伤,其中与第二部分中的靶核酸部分相比,第一部分包括较少的靶核酸部分。在一些实施方案中,方法还包括在诱导经皮穿刺之前清洁该部位,从而除去或减少不需要的污染物。在一些实施方案中,所述不需要的污染物包括来自经皮穿刺部位的DNA。在一些实施方案中,所述核酸损伤包括对生物样品中的非凋亡DNA的损伤。在一些实施方案中,所述生物样品是毛细血管血液。在一些实施方案中,方法还包括使用选自大规模多重聚合酶链反应(mmPCR)或核酸测序的测定法检测第二部分生物样品中的靶核酸。在一些实施方案中,当从受试者获得时,第一部分或第二部分生物样品或其组合具有至多300微升的体积。在一些实施方案中,当从受试者获得时,所述体积为至多100微升。在一些实施方案中,当从受试者获得时,所述体积为至多55微升。在一些实施方案中,当从受试者获得时,所述体积为至多50微升。在一些实施方案中,当从受试者获得时,所述体积为至多40微升。在一些实施方案中,当从受试者获得时,所述体积在约10微升和约40微升之间。在一些实施方案中,从受试者获得的生物样品是毛细血管血液。在一些实施方案中,所述生物样品不是来自血液的血浆样品。在一些实施方案中,所述靶核酸是循环无细胞核酸分子。在一些实施方案中,所述生物样品包含约25皮克(pg)至约250pg的总的循环无细胞核酸分子。在一些实施方案中,所述生物样品包含约104至约109个无细胞核酸分子。在一些实施方案中,所述生物样品包含约104至约107个无细胞核酸分子。在一些实施方案中,所述生物样品中的无细胞核酸为约10个基因组当量。在一些实施方案中,所述生物样品中的无细胞核酸为至多10个基因组当量。在一些实施方案中,所述生物样品中的无细胞核酸在5-6、6-7、7-8、8-9、9-10、10-11、11-12、12-13、13-14或14-15个基因组当量之间。在一些实施方案中,所述无细胞核酸分子是无细胞DNA分子。
本文公开的方面提供设备,其包括:(a)样品收集器,其用于从受试者获得包括至多120微升体积的生物样品,其中所述生物样品包括靶无细胞DNA(cfDNA);(b)样品纯化器,其用于从所述生物样品中去除细胞以产生去细胞样品;和(c)核酸检测器,其被配置为检测所述去细胞样品中的所述靶cfDNA。在一些实施方案中,设备还包括核酸连接剂(ligator),所述核酸连接剂包括:(a)连接制剂,其用于产生可连接的靶cfDNA,所述连接制剂包括以下一种或多种:(i)一种或多种核酸外切酶,其适于生成所述靶cfDNA的平端并去除所述靶cfDNA的平端的5’突出端或3’凹陷端;(ii)平端cfDNA去磷酸化剂;(iii)群集剂;(iv)DNA损伤修复剂;或(v)DNA连接酶;和(b)一个或多个衔接子寡核苷酸,其连接到可连接的靶cfDNA。在一些实施方案中,设备还包括白细胞稳定剂。在一些实施方案中,所述核酸检测器是大规模多重PCR设备(mmPCR)。在一些实施方案中,所述连接制剂包括:(a)所述一种或多种核酸外切酶,其适于生成所述靶cfDNA的平端并去除所述靶cfDNA的平端的5’突出端或3’凹陷端;(i)平端cfDNA去磷酸化剂;(ii)DNA损伤修复剂;和(iii)DNA连接酶。在一些实施方案中,所述核酸检测器包括核酸测序器或侧向流条带(lateral flow strip)。在一些实施方案中,所述核酸测序器包括信号检测器。在一些实施方案中,所述样品纯化器包括过滤器,并且其中所述过滤器具有约0.05微米至约2微米的孔径。在一些实施方案中,所述过滤器是垂直过滤器。在一些实施方案中,所述样品纯化器包括选自抗体、抗原结合抗体片段、配体、受体、肽、小分子及其组合的结合部分。在一些实施方案中,所述样品收集器被配置为裂解受试者表皮的细胞间连接以获得生物样品。在一些实施方案中,当从受试者获得时,所述体积为至多100微升。在一些实施方案中,当从受试者获得时,所述体积为至多55微升。在一些实施方案中,当从受试者获得时,所述体积为至多50微升。在一些实施方案中,当从受试者获得时,所述体积为至多40微升。在一些实施方案中,当从受试者获得时,所述体积在约10微升和约40微升之间。在一些实施方案中,从受试者获得的生物样品是毛细血管血液。在一些实施方案中,所述生物样品不是来自血液的血浆样品。在一些实施方案中,所述靶核酸是循环无细胞核酸分子。在一些实施方案中,所述生物样品包含约25皮克(pg)至约250pg的总的循环无细胞核酸分子。在一些实施方案中,所述生物样品包含约104至约109个无细胞核酸分子。在一些实施方案中,所述生物样品包含约104至约107个无细胞核酸分子。在一些实施方案中,所述生物样品中的无细胞核酸为约10个基因组当量。在一些实施方案中,所述生物样品中的无细胞核酸为至多10个基因组当量。在一些实施方案中,所述生物样品中的无细胞核酸在5-6、6-7、7-8、8-9、9-10、10-11、11-12、12-13、13-14或14-15个基因组当量之间。在一些实施方案中,所述无细胞核酸分子是无细胞DNA分子。
在一些实施方案中,本文公开的方面是方法,其包括:(a)从受试者获得生物样品;(b)任选地,标记至少一部分所述无细胞核酸以产生任选标记的无细胞核酸的文库;(c)任选地,扩增所述任选标记的无细胞核酸;(d)测序至少一部分所述任选标记的无细胞核酸的;和(e)检测至少一部分所述任选标记的无细胞核酸的中的至少一个靶序列的正常表现度、高表现度或低表现度。在一些实施方案中,所述生物样品包括血液、血浆、血清、尿液、间质液、阴道细胞、阴道液、宫颈细胞、口腔细胞或唾液。在一些实施方案中,所述血液包括毛细血管血液。在一些实施方案中,方法还包括合并两个或更多个生物样品,每个样品从不同的受试者获得。在一些实施方案中,方法还包括从受试者获得生物样品后,使所述生物样品与白细胞稳定剂接触。在一些实施方案中,从受试者获得的生物样品是通过经皮穿刺收集的。在一些实施方案中,从受试者获得的生物样品不是通过经皮穿刺收集的。在一些实施方案中,从受试者获得的生物样品是使用被配置为裂解受试者表皮的细胞间连接的设备收集的。在一些实施方案中,通过以下方法收集从受试者获得的生物样品:(a)诱导第一次经皮穿刺以产生第一部分生物样品;(b)丢弃所述第一部分生物样品;和(c)收集第二部分生物样品,从而减少或消除由于白细胞裂解而引起的生物样品的污染。在一些实施方案中,(c)的所述标记包括:(a)通过一个或多个步骤生成可连接的无细胞DNA,所述步骤包括:(i)生成所述无细胞DNA的平端。在一些实施方案中,使用一种或多种聚合酶和一种或多种核酸外切酶去除5’突出端或3’凹陷端;(ii)使所述无细胞DNA的平端去磷酸化;(iii)使所述无细胞DNA与群集剂接触,从而增强所述一种或多种聚合酶、一种或多种核酸外切酶和所述无细胞DNA之间的反应;或(iv)使用连接酶修复或去除无细胞DNA中的DNA损伤;和(b)在连接酶、群集剂和/或小分子增强子的存在下,通过将所述可连接的无细胞DNA与衔接子寡核苷酸接触,将所述可连接的无细胞DNA与衔接子寡核苷酸连接。在一些实施方案中,所述一种或多种聚合酶包括T4 DNA聚合酶或DNA聚合酶I。在一些实施方案中,所述一种或多种核酸外切酶包括T4多核苷酸激酶或核酸外切酶III。在一些实施方案中,所述连接酶包括T3 DNA连接酶、T4 DNA连接酶、T7 DNA连接酶、Taq连接酶、Ampligase、大肠杆菌连接酶或Sso7-连接酶融合蛋白。在一些实施方案中,所述群集剂包括聚乙二醇(PEG)、糖原、或葡聚糖或其组合。在一些实施方案中,所述小分子增强剂包括二甲亚砜(DMSO)、聚山梨醇酯20、甲酰胺或二醇或其组合。在一些实施方案中,在(b)中的连接包括平端连接或单核苷酸突出端连接。在一些实施方案中,所述衔接子寡核苷酸包括Y形衔接子、发夹衔接子、茎环衔接子、可降解衔接子、封闭性自连接衔接子(blocked self-ligati ng adaptor)或条形码衔接子(barcodedadaptor)或其组合。在一些实施方案中,在(c)中的所述文库以至少0.5的效率产生。在一些实施方案中,所述靶无细胞核酸是来自肿瘤的无细胞核酸。在一些实施方案中,所述靶无细胞核酸是来自胎儿的无细胞核酸。在一些实施方案中,所述靶无细胞核酸是来自移植组织或器官的无细胞核酸。在一些实施方案中,所述靶无细胞核酸是来自一种或多种病原体的基因组核酸。在一些实施方案中,所述病原体包括细菌或其组分。在一些实施方案中,所述病原体包括病毒或其组分。在一些实施方案中,所述病原体包括真菌或其组分。在一些实施方案中,所述无细胞核酸包括一种或多种单核苷酸多态性(SNP)、插入或缺失(indel)或其组合。在一些实施方案中,所述大规模多重扩增测定是等温扩增。在一些实施方案中,所述大规模多重扩增测定是聚合酶链反应(mmPCR)。在一些实施方案中,所述生物样品包括与外周血相比胎儿无细胞核酸低的细胞类型或组织类型。在一些实施方案中,方法不由进行静脉切开术,或从受试者的静脉血获得生物样品组成。在一些实施方案中,当从受试者获得时,所述生物样品具有至多100微升的体积。在一些实施方案中,当从受试者获得时,所述体积为至多55微升。在一些实施方案中,当从受试者获得时,所述体积为至多50微升。在一些实施方案中,当从受试者获得时,所述体积为至多40微升。在一些实施方案中,当从受试者获得时,所述体积在约10微升和约40微升之间。在一些实施方案中,从受试者获得的生物样品是毛细血管血液。在一些实施方案中,所述生物样品不是来自血液的血浆样品。在一些实施方案中,所述生物样品包括循环无细胞核酸。在一些实施方案中,所述生物样品包含约25皮克(pg)至约250pg的总的循环无细胞核酸分子。在一些实施方案中,所述生物样品包含约104至约109个无细胞核酸分子。在一些实施方案中,所述生物样品包含约104至约107个无细胞核酸分子。在一些实施方案中,所述生物样品中的无细胞核酸为约10个基因组当量。在一些实施方案中,所述生物样品中的无细胞核酸为至多10个基因组当量。在一些实施方案中,所述生物样品中的无细胞核酸在5-6、6-7、7-8、8-9、9-10、10-11、11-12、12-13、13-14或14-15个基因组当量之间。在一些实施方案中,所述无细胞核酸分子是无细胞DNA分子。
在一些实施方案中,本文公开的方面是产前亲子鉴定方法,其包括:(a)从妊娠有胎儿的受试者获得生物样品;(b)任选地,标记至少一部分所述无细胞核酸以产生任选标记的无细胞核酸的文库;(c)任选地,扩增所述任选标记的无细胞核酸;(d)测序至少一部分所述任选标记的无细胞核酸;(e)从疑是胎儿父亲的个体接收父本基因型信息;和(f)将所述父本基因型信息与所述无细胞核酸的胎儿组分进行比较,以确定所述胎儿组分与父本基因型之间是否存在基因型匹配。在一些实施方案中,所述生物样品包括无细胞核酸。在一些实施方案中,所述生物样品包括血液、血浆、血清、尿液、间质液、阴道细胞、阴道液、宫颈细胞、口腔细胞或唾液。在一些实施方案中,所述血液包括毛细血管血液。在一些实施方案中,所述毛细血管血液包括不大于40微升的血液。在一些实施方案中,所述方法还包括合并两个或更多个生物样品,每个样品从不同的受试者获得。在一些实施方案中,所述方法还包括从受试者获得生物样品后,使所述生物样品与白细胞稳定剂接触。在一些实施方案中,从受试者获得的生物样品是通过经皮穿刺收集的。在一些实施方案中,从受试者获得的生物样品不是通过经皮穿刺收集的。在一些实施方案中,从受试者获得的生物样品是使用被配置为裂解受试者表皮的细胞间连接的设备收集的。在一些实施方案中,通过以下方法收集从受试者获得的生物样品:(a)诱导第一次经皮穿刺以产生第一部分生物样品;(b)丢弃所述第一部分生物样品;和(c)收集第二部分生物样品,从而减少或消除由于白细胞裂解造成的生物样品的污染。在一些实施方案中,方法还包括在从受试者获得生物样品之前清洁经皮穿刺部位(例如,皮肤)的表面。在一些情况下,所述清洁包括去除或减少不需要的污染物。在一些情况下,所述不需要的污染物包括来自经皮穿刺部位的DNA。在一些情况下,所述不需要的污染物包括来自经皮穿刺部位周围的细胞或组织的DNA。在一些情况下,DNA是损伤的。在一些情况下,DNA未损伤的。在一些情况下,所述经皮穿刺部位是手指的皮肤。在一些实施方案中,(c)的所述包括:(a)通过一个或多个步骤生成可连接的无细胞DNA,所述步骤包括:(i)生成无细胞DNA的平端。在一些实施方案中,使用一种或多种聚合酶和一种或多种核酸外切酶去除5’突出端或3’凹陷端;(ii)使所述无细胞DNA的平端去磷酸化;(iii)使所述无细胞DNA与群集剂接触,从而增强所述一种或多种聚合酶、一种或多种核酸外切酶和所述无细胞DNA之间的反应;或(iv)使用连接酶修复或去除无细胞DNA中的DNA损伤;和(b)在连接酶、群集剂和/或小分子增强子的存在下,通过将所述可连接的无细胞DNA与衔接子寡核苷酸接触,将所述可连接的无细胞DNA与衔接子寡核苷酸连接。在一些实施方案中,所述一种或多种聚合酶包括T4 DNA聚合酶或DNA聚合酶I。在一些实施方案中,所述一种或多种核酸外切酶包括T4多核苷酸激酶或核酸外切酶III。在一些实施方案中,所述连接酶包括T3 DNA连接酶、T4 DNA连接酶、T7 DNA连接酶、Taq连接酶、Ampligase、大肠杆菌连接酶或Sso7-连接酶融合蛋白。在一些实施方式中,所述群集剂包括聚乙二醇(PEG)、糖原、或葡聚糖或其组合。在一些实施方案中,所述小分子增强剂包括二甲亚砜(DMSO)、聚山梨醇酯20、甲酰胺或二醇或其组合。在一些实施方案中,在(b)中的连接包括平端连接或单核苷酸突出端连接。在一些实施方案中,所述衔接子寡核苷酸包括Y形衔接子、发夹衔接子、茎环衔接子、可降解衔接子、封闭性自连接衔接子或条形码衔接子或其组合。在一些实施方案中,在(c)中的所述文库以至少0.5的效率产生。在一些实施方案中,所述靶无细胞核酸是来自肿瘤的无细胞核酸。在一些实施方案中,所述靶无细胞核酸是来自胎儿的无细胞核酸。在一些实施方案中,所述靶无细胞核酸是来自移植组织或器官的无细胞核酸。在一些实施方案中,所述靶无细胞核酸是来自一种或多种病原体的基因组核酸。在一些实施方案中,所述病原体包括细菌或其组分。在一些实施方案中,所述病原体包括病毒或其组分。在一些实施方案中,所述病原体包括真菌或其组分。在一些实施方案中,所述无细胞核酸包括一种或多种单核苷酸多态性(SNP)、插入或缺失(indel)或其组合。在一些实施方案中,所述大规模多重扩增测定是等温扩增。在一些实施方案中,所述大规模多重扩增测定是聚合酶链反应(mmPCR)。在一些实施方案中,所述生物样品包括与外周血相比胎儿无细胞核酸低的细胞类型或组织类型。在一些实施方案中,方法不由进行静脉切开术,或从受试者的静脉血获得生物样品组成。在一些实施方案中,当从受试者获得时,所述生物样品具有至多100微升的体积。在一些实施方案中,当从受试者获得时,所述体积为至多55微升。在一些实施方案中,当从受试者获得时,所述体积为至多50微升。在一些实施方案中,当从受试者获得时,所述体积为至多40微升。在一些实施方案中,当从受试者获得时,所述体积在约10微升和约40微升之间。在一些实施方案中,从受试者获得的生物样品是毛细血管血液。在一些实施方案中,所述生物样品不是来自血液的血浆样品。在一些实施方案中,所述生物样品包括循环无细胞核酸。在一些实施方案中,所述生物样品包含约25皮克(pg)至约250pg的总的循环无细胞核酸分子。在一些实施方案中,所述生物样品包含约104至约109个无细胞核酸分子。在一些实施方案中,所述生物样品包含约104至约107个无细胞核酸分子。在一些实施方案中,所述生物样品中的无细胞核酸为约10个基因组当量。在一些实施方案中,所述生物样品中的无细胞核酸为至多10个基因组当量。在一些实施方案中,所述生物样品中的无细胞核酸在5-6、6-7、7-8、8-9、9-10、10-11、11-12、12-13、13-14或14-15个基因组当量之间。在一些实施方案中,所述无细胞核酸分子是无细胞DNA分子。
在一些实施方案中,本文公开的方面是分析从受试者获得的生物样品的方法,所述方法包括:(a)从受试者获得生物样品;(b)任选地,标记至少一部分所述无细胞核酸以产生标记的无细胞核酸的文库;(c)通过大规模多重扩增测定法扩增任选标记的无细胞核酸;(d)任选地,合并所述扩增的任选标记的无细胞核酸;(e)测序至少一部分所述扩增的任选标记的无细胞核酸;和(f)检测至少一部分任选标记的无细胞核酸中的至少一个靶序列的正常表现度、高表现度或低表现度。在一些实施方案中,所述生物样品包括血液、血浆、血清、尿液、间质液、阴道细胞、阴道液、宫颈细胞、口腔细胞或唾液。在一些实施方案中,所述血液包括毛细血管血液。在一些实施方案中,所述方法还包括合并两个或更多个生物样品,每个样品从不同的受试者获得。在一些实施方案中,所述方法还包括从受试者获得生物样品后,使所述生物样品与白细胞稳定剂接触。在一些实施方案中,从受试者获得的生物样品是通过经皮穿刺收集的。在一些实施方案中,从受试者获得的生物样品不是通过经皮穿刺收集的。在一些实施方案中,从受试者获得的生物样品是使用被配置为裂解受试者表皮的细胞间连接的设备收集的。在一些实施方案中,通过以下方法收集从受试者获得的生物样品:(a)诱导第一次经皮穿刺以产生第一部分生物样品;(b)丢弃所述第一部分生物样品;和(c)收集第二部分生物样品,从而减少或消除由于白细胞裂解造成的生物样品的污染。在一些实施方案中,方法还包括在从受试者获得生物样品之前清洁经皮穿刺部位(例如,皮肤)的表面。在一些情况下,所述清洁包括去除或减少不需要的污染物。在一些情况下,所述不需要的污染物包括来自经皮穿刺部位的DNA。在一些情况下,所述不需要的污染物包括来自经皮穿刺部位周围的细胞或组织的DNA。在一些情况下,DNA是损伤的。在一些情况下,DNA是未损伤的。在一些情况下,所述经皮穿刺部位是手指的皮肤。在一些实施方案中,(c)的所述标记包括:(a)通过一个或多个步骤生成可连接的无细胞DNA,所述步骤包括:(i)生成无细胞DNA的平端。在一些实施方案中,使用一种或多种聚合酶和一种或多种核酸外切酶去除5’突出端或3’凹陷端;(ii)使所述无细胞DNA的平端去磷酸化;(iii)使所述无细胞DNA与群集剂接触,从而增强所述一种或多种聚合酶、一种或多种核酸外切酶和所述无细胞DNA之间的反应;或(iv)使用连接酶修复或去除无细胞DNA中的DNA损伤;和(b)在连接酶、群集剂和/或小分子增强子的存在下,通过将所述可连接的无细胞DNA与衔接子寡核苷酸接触,将所述可连接的无细胞DNA与衔接子寡核苷酸连接。在一些实施方案中,一种或多种聚合酶包括T4DNA聚合酶或DNA聚合酶I。在一些实施方案中,一种或多种核酸外切酶包括T4多核苷酸激酶或核酸外切酶III。在一些实施方案中、所述连接酶包括T3 DNA连接酶、T4 DNA连接酶、T7DNA连接酶、Taq连接酶、Ampligase、大肠杆菌连接酶或Sso7-连接酶融合蛋白。在一些实施方案中,所述群集剂包括聚乙二醇(PEG)、糖原、或葡聚糖或其组合。在一些实施方案中,所述小分子增强剂包括二甲亚砜(DMSO)、聚山梨醇酯20、甲酰胺或二醇或其组合。在一些实施方案中,在(b)中的连接包括平端连接或单核苷酸突出端连接。在一些实施方案中,所述衔接子寡核苷酸包括Y形衔接子、发夹衔接子、茎环衔接子、可降解衔接子、封闭性自连接衔接子或条形码衔接子或其组合。在一些实施方案中,在(c)中的所述文库以至少0.5的效率产生。在一些实施方案中,所述靶无细胞核酸是来自肿瘤的无细胞核酸。在一些实施方案中,所述靶无细胞核酸是来自胎儿的无细胞核酸。在一些实施方案中,所述靶无细胞核酸是来自移植组织或器官的无细胞核酸。在一些实施方案中,所述靶无细胞核酸是来自一种或多种病原体的基因组核酸。在一些实施方案中,所述病原体包括细菌或其组分。在一些实施方案中,所述病原体包括病毒或其组分。在一些实施方案中,所述病原体包括真菌或其组分。在一些实施方案中,所述无细胞核酸包括一种或多种单核苷酸多态性(SNP)、插入或缺失(indel)或其组合。在一些实施方案中,所述大规模多重扩增测定是等温扩增。在一些实施方案中,所述大规模多重扩增测定是聚合酶链反应(mmPCR)。在一些实施方案中,所述生物样品包括与外周血相比胎儿无细胞核酸低的细胞类型或组织类型。在一些实施方案中,方法不由进行静脉切开术,或从受试者的静脉血获得生物样品组成。在一些实施方案中,当从受试者获得时,所述生物样品具有至多100微升的体积。在一些实施方案中,当从受试者获得时,所述体积为至多55微升。在一些实施方案中,当从受试者获得时,所述体积为至多50微升。在一些实施方案中,当从受试者获得时,所述体积为至多40微升。在一些实施方案中,当从受试者获得时,所述体积在约10微升和约40微升之间。在一些实施方案中,从受试者获得的生物样品是毛细血管血液。在一些实施方案中,所述生物样品不是来自血液的血浆样品。在一些实施方案中,所述生物样品包括循环无细胞核酸。在一些实施方案中,所述生物样品包含约25皮克(pg)至约250pg的总的循环无细胞核酸分子。在一些实施方案中,所述生物样品包含约104至约109个无细胞核酸分子。在一些实施方案中,所述生物样品包含约104至约107个无细胞核酸分子。在一些实施方案中,所述生物样品中的无细胞核酸为约10个基因组当量。在一些实施方案中,所述生物样品中的无细胞核酸为至多10个基因组当量。在一些实施方案中,所述生物样品中的无细胞核酸在5-6、6-7、7-8、8-9、9-10、10-11、11-12、12-13、13-14或14-15个基因组当量之间。在一些实施方案中,所述无细胞核酸分子是无细胞DNA分子。
在一些实施方案中,本文公开的方面是方法,其包括:(a)从受试者获得约1-100微升(μl)的包括脱氧核糖核酸(DNA)的生物样品;和(b)检测所述DNA的表观遗传修饰。在一些实施方案中,所述表观遗传修饰包括在遗传基因座处的DNA甲基化、组蛋白甲基化、组蛋白泛素化、组蛋白乙酰化、组蛋白磷酸化、微小RNA(miRNA)。在一些实施方案中,所述DNA甲基化包括CpG甲基化或CpH甲基化。在一些实施方案中,所述遗传基因座包括基因的启动子或调节元件。在一些实施方案中,所述遗传基因座包括可变长末端重复序列(LTR)。在一些实施方案中,所述遗传基因座包括无细胞DNA或其片段。在一些实施方案中,所述遗传基因座包括单核苷酸多态性(SNP)。在一些实施方案中,组蛋白乙酰化由组蛋白脱乙酰酶存在或组蛋白脱乙酰酶水平指示。在一些实施方案中,所述组蛋白修饰是在选自组蛋白2A(H2A)、组蛋白2B(H2B)、组蛋白3(H3)和组蛋白4(H4)的组蛋白处。在一些实施方案中,所述组蛋白甲基化是H3赖氨酸4(H3K4me2)的甲基化。在一些实施方案中,所述组蛋白乙酰化是在H4处的脱乙酰化。在一些实施方案中,所述miRNA选自miR-21、miR-126、mi-R142、mi-R146a、mi-R12a、mi-R181a、miR-29c、miR-29a、miR-29b、miR-101、miRNA-155和miR-148a。在一些实施方案中,所述生物样品包括血液、血浆、血清、尿液、间质液、阴道细胞、阴道液、宫颈细胞、口腔细胞或唾液。在一些实施方案中,所述方法还包括合并两个或更多个生物样品,每个样品从不同的受试者获得。在一些实施方案中,从受试者获得的生物样品是通过经皮穿刺收集的。在一些实施方案中,从受试者获得的生物样品不是通过经皮穿刺收集的。在一些实施方案中,从受试者获得的生物样品是使用被配置为裂解受试者表皮的细胞间连接的设备收集的。在一些实施方案中,从受试者获得的生物样品通过以下方法收集:(a)诱导第一次经皮穿刺以产生第一部分生物样品;(b)丢弃所述第一部分生物样品;和(c)收集第二部分生物样品,从而减少或消除由于白细胞裂解而引起的生物样品的污染。在一些实施方案中,方法还包括在从受试者获得生物样品之前清洁经皮穿刺部位(例如,皮肤)的表面。在一些情况下,所述清洁包括去除或减少不需要的污染物。在一些情况下,所述不需要的污染物包括来自经皮穿刺部位的DNA。在一些情况下,不需要的污染物包括来自经皮穿刺部位周围的细胞或组织的DNA。在一些情况下,DNA是损伤的。在一些情况下,DNA是未损伤的。在一些情况下,所述经皮穿刺部位是手指的皮肤。在一些实施方案中,所述方法还包括从受试者获得生物样品后,使所述生物样品与白细胞稳定剂接触。在一些实施方案中,方法不由进行静脉切开术,或从受试者的静脉血获得生物样品组成。在一些实施方案中,当从受试者获得时,所述生物样品具有至多100微升的体积。在一些实施方案中,当从受试者获得时,所述体积为至多55微升。在一些实施方案中,当从受试者获得时,所述体积为至多50微升。在一些实施方案中,当从受试者获得时,所述体积为至多40微升。在一些实施方案中,当从受试者获得时,所述体积在约10微升和约40微升之间。在一些实施方案中,从受试者获得的生物样品是毛细血管血液。在一些实施方案中,所述生物样品不是来自血液的血浆样品。在一些实施方案中,所述生物样品包括循环无细胞核酸。在一些实施方案中,所述生物样品包含约25皮克(pg)至约250pg的总的循环无细胞核酸分子。在一些实施方案中,所述生物样品包含约104至约109个无细胞核酸分子。在一些实施方案中,所述生物样品包含约104至约107个无细胞核酸分子。在一些实施方案中,所述生物样品中的无细胞核酸为约10个基因组当量。在一些实施方案中,所述生物样品中的无细胞核酸为至多10个基因组当量。在一些实施方案中,所述生物样品中的无细胞核酸在5-6、6-7、7-8、8-9、9-10、10-11、11-12、12-13、13-14或14-15个基因组当量之间。在一些实施方案中,所述无细胞核酸分子是无细胞DNA分子。
在一些实施方案中,本文公开的方面是方法,其包括:(a)从受试者获得生物样品,并且其中所述生物样品包括多达约109个无细胞核酸分子;(b)测序至少一部分所述无细胞核酸分子以产生测序读段;(c)测定对应于至少一个染色体区域的至少一部分测序读段;和(d)检测所述至少一个染色体区域的正常表现度、高表现度或低表现度。在一些实施方案中,所述方法还包括标记所述至少一部分无细胞核酸分子。在一些实施方案中,所述标记包括:(a)通过一个或多个步骤生成可连接的无细胞DNA,所述步骤包括:(i)生成无细胞DNA的平端。在一些实施方案中,使用一种或多种聚合酶和一种或多种核酸外切酶去除5’突出端或3’凹陷端;(ii)使所述无细胞DNA的平端去磷酸化;(iii)使所述无细胞DNA与群集剂接触,从而增强所述一种或多种聚合酶、一种或多种核酸外切酶和所述无细胞DNA之间的反应;或(iv)使用连接酶修复或去除无细胞DNA中的DNA损伤;和(b)在连接酶、群集剂和/或小分子增强子的存在下,通过将所述可连接的无细胞DNA与衔接子寡核苷酸接触,将所述可连接的无细胞DNA与衔接子寡核苷酸连接。在一些实施方案中,所述方法还包括合并两个或更多个生物样品,每个样品从不同的受试者获得。在一些实施方案中,所述方法还包括从受试者获得生物样品后,使所述生物样品与白细胞稳定剂接触。在一些实施方案中,所述一种或多种聚合酶包括T4 DNA聚合酶或DNA聚合酶I。在一些实施方案中,所述一种或多种核酸外切酶包括T4多核苷酸激酶或核酸外切酶III。在一些实施方案中,所述连接酶包括T3 DNA连接酶、T4 DNA连接酶、T7 DNA连接酶、Taq连接酶、Ampligase、大肠杆菌连接酶或Sso7-连接酶融合蛋白。在一些实施方案中,所述群集剂包括聚乙二醇(PEG)、糖原、或葡聚糖或其组合。在一些实施方案中,所述小分子增强剂包括二甲亚砜(DMSO)、聚山梨醇酯20、甲酰胺或二醇或其组合。在一些实施方案中,在(b)中的连接包括平端连接或单核苷酸突出端连接。在一些实施方案中,所述衔接子寡核苷酸包括Y形衔接子、发夹衔接子、茎环衔接子、可降解衔接子、封闭性自连接衔接子或条形码衔接子或其组合。在一些实施方案中,所述生物样品是体积小于约500微升(μl)的生物样品。在一些实施方案中,所述生物样品是具有约1μl至约100μl体积的生物样品。在一些实施方案中,所述生物样品是具有约5μl至约80μl体积的生物样品。在一些实施方案中,所述生物样品包括血液、血浆、血清、尿液、间质液、阴道细胞、阴道液、宫颈细胞、口腔细胞或唾液。在一些实施方案中,当从受试者获得时,所述生物样品具有至多100微升的体积。在一些实施方案中,当从受试者获得时,所述体积为至多55微升。在一些实施方案中,当从受试者获得时,所述体积为至多50微升。在一些实施方案中,当从受试者获得时,所述体积为至多40微升。在一些实施方案中,当从受试者获得时,所述体积在约10微升和约40微升之间。在一些实施方案中,从受试者获得的生物样品是毛细血管血液。在一些实施方案中,所述生物样品不是来自血液的血浆样品。在一些实施方案中,所述生物样品包括循环无细胞核酸。在一些实施方案中,所述生物样品包含约25皮克(pg)至约250pg的总的循环无细胞核酸分子。在一些实施方案中,所述生物样品包含小于300pg的无细胞核酸分子。在一些实施方案中,所述生物样品包含小于3ng的无细胞核酸分子。在一些实施方案中,所述生物样品包含约104至约109个无细胞核酸分子。在一些实施方案中,所述生物样品包含约104至约107个无细胞核酸分子。在一些实施方案中,所述生物样品中的无细胞核酸为约10个基因组当量。在一些实施方案中,所述生物样品中的无细胞核酸为至多10个基因组当量。在一些实施方案中,所述生物样品中的无细胞核酸在5-6、6-7、7-8、8-9、9-10、10-11、11-12、12-13、13-14或14-15个基因组当量之间。在一些实施方案中,所述无细胞核酸分子是无细胞DNA分子。在一些实施方案中,所述方法还包括从血液样品中分离血浆或血清。在一些实施方案中,分离包括过滤血液样品以从血液样品中去除细胞,细胞碎片,微泡或其组合以产生血浆样品。在一些实施方案中,获得血液样品包括针刺手指。在一些实施方案中,从受试者获得的生物样品是使用被配置为裂解受试者表皮的细胞间连接的设备收集的。在一些实施方案中,通过以下方法收集从受试者获得的生物样品:(a)诱导第一次经皮穿刺以产生第一部分生物样品;(b)丢弃所述第一部分生物样品;和(c)收集第二部分生物样品,从而减少或消除由于白细胞裂解造成的生物样品的污染。在一些实施方案中,方法还包括在从受试者获得生物样品之前清洁经皮穿刺部位(例如,皮肤)的表面。在一些情况下,所述清洁包括去除或减少不需要的污染物。在一些情况下,所述不需要的污染物包括来自经皮穿刺部位的DNA。在一些情况下,所述不需要的污染物包括来自经皮穿刺部位周围的细胞或组织的DNA。在一些情况下,DNA是损伤的。在一些情况下,DNA是未损伤的。在一些实施方案中,所述受试者是妊娠受试者,并且无细胞核酸分子包括无细胞胎儿核酸分子。在一些实施方案中,所述无细胞核酸包括来自组织中肿瘤的核酸。在一些实施方案中,所述靶无细胞核酸是来自胎儿的无细胞核酸。在一些实施方案中,所述靶无细胞核酸是来自移植组织或器官的无细胞核酸。在一些实施方案中,所述靶无细胞核酸是来自一种或多种病原体的基因组核酸。在一些实施方案中,所述病原体包括细菌或其组分。在一些实施方案中,所述病原体包括病毒或其组分。在一些实施方案中,所述病原体包括真菌或其组分。在一些实施方案中,所述无细胞核酸包括一种或多种单核苷酸多态性(SNP)、插入或缺失(indel)或其组合。在一些实施方案中,所述大规模多重扩增测定法是等温扩增。在一些实施方案中,所述大规模多重扩增测定法是聚合酶链反应(mmPCR)。在一些实施方案中,所述生物样品包括与外周血相比胎儿无细胞核酸低的细胞类型或组织类型。在一些实施方案中,方法不由进行静脉切开术,或从受试者的静脉血获得生物样品组成。
在一些实施方案中,本文公开的方面是产前亲子鉴定方法,其包括:(a)从妊娠有胎儿的受试者获得生物样品。在一些实施方案中,所述生物样品包含多达约109个无细胞核酸分子;(b)测序至少一部分所述无细胞核酸分子以产生测序读段;(c)测定对应于至少一个染色体区域的至少一部分测序读段;(d)从疑是胎儿父亲的个体接收父本基因型信息;和(e)将所述父本基因型信息与所述无细胞核酸的胎儿组分进行比较,以确定所述胎儿组分与父本基因型之间是否存在基因型匹配。在一些实施方案中,所述方法还包括扩增所述无细胞核酸。在一些实施方案中,所述方法还包括标记至少一部分所述无细胞核酸以产生标记的无细胞核酸的文库。在一些实施方案中,所述方法还包括扩增所述标记的无细胞核酸。在一些实施方案中,所述标记包括:(a)通过一个或多个步骤生成可连接的无细胞DNA,所述步骤包括:(i)生成无细胞DNA的平端。在一些实施方案中,使用一种或多种聚合酶和一种或多种核酸外切酶去除5’突出端或3’凹陷端;(ii)使所述无细胞DNA的平端去磷酸化;(iii)使所述无细胞DNA与群集剂接触,从而增强所述一种或多种聚合酶、一种或多种核酸外切酶和所述无细胞DNA之间的反应;或(iv)使用连接酶修复或去除无细胞DNA中的DNA损伤;和(b)在连接酶、群集剂和/或小分子增强子的存在下,通过将所述可连接的无细胞DNA与衔接子寡核苷酸接触,将所述可连接的无细胞DNA与衔接子寡核苷酸连接。在一些实施方案中,所述方法还包括合并两个或更多个生物样品,每个样品从不同的受试者获得。在一些实施方案中,所述方法还包括从受试者获得生物样品后,使所述生物样品与白细胞稳定剂接触。在一些实施方案中,所述一种或多种聚合酶包括T4 DNA聚合酶或DNA聚合酶I。在一些实施方案中,所述一种或多种核酸外切酶包括T4多核苷酸激酶或核酸外切酶III。在一些实施方案中,所述连接酶包括T3 DNA连接酶、T4 DNA连接酶、T7 DNA连接酶、Taq连接酶、Ampligase、大肠杆菌连接酶或Sso7-连接酶融合蛋白。在一些实施方式中,所述群集剂包括聚乙二醇(PEG)、糖原、或葡聚糖、或其组合。在一些实施方案中,所述小分子增强剂包括二甲亚砜(DMSO)、聚山梨醇酯20、甲酰胺或二醇或其组合。在一些实施方案中,在(b)中的连接包括平端连接或单核苷酸突出端连接。在一些实施方案中,所述衔接子寡核苷酸包括Y形衔接子、发夹衔接子、茎环衔接子、可降解衔接子、封闭性自连接衔接子或条形码衔接子或其组合。在一些实施方案中,所述生物样品包括血液,血浆,血清,尿液,间质液,阴道细胞,阴道液,宫颈细胞,口腔细胞或唾液。在一些实施方案中,当从受试者获得时,所述生物样品具有至多500微升的体积。在一些实施方案中,当从受试者获得时,所述体积为至多300微升。在一些实施方案中,当从受试者获得时,所述体积为至多100微升。在一些实施方案中,当从受试者获得时,所述体积为至多55微升。在一些实施方案中,当从受试者获得时,所述体积为至多50微升。在一些实施方案中,当从受试者获得时,所述体积为至多40微升。在一些实施方案中,当从受试者获得时,所述体积在约10微升和约40微升之间。在一些实施方案中,当从受试者获得时,所述体积在约10微升和约100微升之间。在一些实施方案中,从受试者获得的生物样品是毛细血管血液。在一些实施方案中,所述生物样品不是来自血液的血浆样品。在一些实施方案中,所述生物样品包括循环无细胞核酸。在一些实施方案中,所述生物样品包含约25皮克(pg)至约250pg的总的循环无细胞核酸分子。在一些实施方案中,所述生物样品包含小于300pg的无细胞核酸分子。在一些实施方案中,所述生物样品包含小于3ng的无细胞核酸分子。在一些实施方案中,所述生物样品包含约104至约109个无细胞核酸分子。在一些实施方案中,所述生物样品包含约104至约107个无细胞核酸分子。在一些实施方案中,所述生物样品中的无细胞核酸为约10个基因组当量。在一些实施方案中,所述生物样品中的无细胞核酸为至多10个基因组当量。在一些实施方案中、所述生物样品中的无细胞核酸在5-6、6-7、7-8、8-9、9-10、10-11、11-12、12-13、13-14或14-15个基因组当量之间。在一些实施方案中,所述无细胞核酸分子是无细胞DNA分子。在一些实施方案中,所述方法还包括从血液样品中分离血浆或血清。在一些实施方案中,分离包括过滤血液样品以从血液样品中去除细胞,细胞碎片,微泡或其组合以产生血浆样品。在一些实施方案中,获得血液样品包括针刺手指。在一些实施方案中,从受试者获得的生物样品是使用被配置为裂解受试者表皮的细胞间连接的设备收集的。在一些实施方案中,通过以下方法收集从受试者获得的生物样品:(a)诱导第一次经皮穿刺以产生第一部分生物样品;(b)丢弃所述第一部分生物样品;和(c)收集第二部分生物样品,从而减少或消除由于白细胞裂解造成的生物样品的污染。在一些实施方案中,方法还包括在从受试者获得生物样品之前清洁经皮穿刺部位(例如,皮肤)的表面。在一些情况下,所述清洁包括去除或减少不需要的污染物。在一些情况下,所述不需要的污染物包括来自经皮穿刺部位的DNA。在一些情况下,所述不需要的污染物包括来自经皮穿刺部位周围的细胞或组织的DNA。在一些情况下,DNA是损伤的。在一些情况下,DNA是未损伤的。在一些情况下,所述经皮穿刺部位是手指的皮肤。在一些实施方案中,所述生物样品包含约104至约109个无细胞核酸分子。在一些实施方案中,所述受试者是妊娠受试者,并且所述无细胞核酸分子包括无细胞胎儿核酸分子。在一些实施方案中,所述无细胞核酸包括来自组织中肿瘤的核酸。在一些实施方案中,所述靶无细胞核酸是来自胎儿的无细胞核酸。在一些实施方案中,所述靶无细胞核酸是来自移植组织或器官的无细胞核酸。在一些实施方案中,所述靶无细胞核酸是来自一种或多种病原体的基因组核酸。在一些实施方案中,所述病原体包括细菌或其组分。在一些实施方案中,所述病原体包括病毒或其组分。在一些实施方案中,所述病原体包括真菌或其组分。在一些实施方案中,所述无细胞核酸包括一种或多种单核苷酸多态性(SNP)、插入或缺失(indel)或其组合。在一些实施方案中,所述大规模多重扩增测定是等温扩增。在一些实施方案中,所述大规模多重扩增测定法是聚合酶链反应(mmPCR)。在一些实施方案中,所述生物样品包括与外周血相比胎儿无细胞核酸低的细胞类型或组织类型。在一些实施方案中,方法不由进行静脉切开术,或从受试者的静脉血获得生物样品组成。
在一些实施方案中,本文公开的方面是方法,其包括:(a)从受试者获得生物样品;(b扩增所述无细胞核酸;(c)任选地,标记至少一部分所述无细胞核酸以产生标记的无细胞核酸的文库;(d)通过大规模多重扩增测定法扩增任选标记的无细胞核酸;(e)任选地,合并所述扩增的任选标记的无细胞核酸;(f)测序至少一部分所述扩增的任选标记的无细胞核酸分子以产生测序读段;(g)测定对应于至少一个染色体区域的至少一部分测序读段;和(h)检测所述至少一个染色体区域的正常表现度、高表现度或低表现度。在一些实施方案中,所述标记包括:(a)通过一个或多个步骤生成可连接的无细胞DNA,所述步骤包括:(i)生成无细胞DNA的平端。在一些实施方案中,使用一种或多种聚合酶和一种或多种核酸外切酶去除5’突出端或3’凹陷端;(ii)使所述无细胞DNA的平端去磷酸化;(iii)使所述无细胞DNA与群集剂接触,从而增强所述一种或多种聚合酶、一种或多种核酸外切酶和所述无细胞DNA之间的反应;或(iv)使用连接酶修复或去除无细胞DNA中的DNA损伤;和(b)在连接酶、群集剂和/或小分子增强子的存在下,通过将所述可连接的无细胞DNA与衔接子寡核苷酸接触,将所述可连接的无细胞DNA与衔接子寡核苷酸连接。在一些实施方案中,所述方法还包括合并两个或更多个生物样品,每个样品从不同的受试者获得。在一些实施方案中,所述方法还包括从受试者获得生物样品后,使所述生物样品与白细胞稳定剂接触。在一些实施方案中,所述一种或多种聚合酶包括T4 DNA聚合酶或DNA聚合酶I。在一些实施方案中,所述一种或多种核酸外切酶包括T4多核苷酸激酶或核酸外切酶III。在一些实施方案中,所述连接酶包括T3 DNA连接酶,T4 DNA连接酶,T7 DNA连接酶,Taq连接酶,Ampligase,大肠杆菌连接酶或Sso7-连接酶融合蛋白。在一些实施方案中,所述群集剂包括聚乙二醇(PEG)、糖原、或葡聚糖或其组合。在一些实施方案中,所述小分子增强剂包括二甲亚砜(DMSO)、聚山梨醇酯20、甲酰胺或二醇或其组合。在一些实施方案中,在(b)中的连接包括平端连接或单核苷酸突出端连接。在一些实施方案中,所述衔接子寡核苷酸包括Y形衔接子、发夹衔接子、茎环衔接子、可降解衔接子、封闭性自连接衔接子或条形码衔接子或其组合。在一些实施方案中,所述生物样品包括血液、血浆、血清、尿液、间质液、阴道细胞、阴道液、宫颈细胞、口腔细胞或唾液。在一些实施方案中,当从受试者获得时,所述生物样品具有至多300微升的体积。在一些实施方案中,当从受试者获得时,所述体积为至多100微升。在一些实施方案中,当从受试者获得时,所述体积为至多55微升。在一些实施方案中,当从受试者获得时,所述体积为至多50微升。在一些实施方案中,当从受试者获得时,所述体积为至多40微升。在一些实施方案中,当从受试者获得时,所述体积在约10微升和约40微升之间。在一些实施方案中,当从受试者获得时,所述体积在约10微升和约100微升之间。在一些实施方案中,从受试者获得的生物样品是毛细血管血液。在一些实施方案中,所述生物样品不是来自血液的血浆样品。在一些实施方案中,所述生物样品包括循环无细胞核酸。在一些实施方案中,所述生物样品包含约25皮克(pg)至约250pg的总的循环无细胞核酸分子。在一些实施方案中,所述生物样品包含小于300pg的无细胞核酸分子。在一些实施方案中,所述生物样品包含小于3ng的无细胞核酸分子。在一些实施方案中,所述生物样品包含约104至约109个无细胞核酸分子。在一些实施方案中,所述生物样品包含约104至约107个无细胞核酸分子。在一些实施方案中,所述生物样品中的无细胞核酸为约10个基因组当量。在一些实施方案中,所述生物样品中的无细胞核酸为至多10个基因组当量。在一些实施方案中,所述生物样品中的无细胞核酸在5-6、6-7、7-8、8-9、9-10、10-11、11-12、12-13、13-14或14-15个基因组当量之间。在一些实施方案中,所述方法还包括从血液样品中分离血浆或血清。在一些实施方案中,分离包括过滤血液样品以从血液样品中去除细胞,细胞碎片,微泡或其组合以产生血浆样品。在一些实施方案中,获得血液样品包括针刺手指。在一些实施方案中,从受试者获得的生物样品是使用被配置为裂解受试者表皮的细胞间连接的设备收集的。在一些实施方案中,通过以下方法收集从受试者获得的生物样品:(a)诱导第一次经皮穿刺以产生第一部分生物样品;(b)丢弃所述第一部分生物样品;和(c)收集第二部分生物样品,从而减少或消除由于白细胞裂解造成的生物样品的污染。在一些实施方案中,方法还包括在从受试者获得生物样品之前清洁经皮穿刺部位(例如,皮肤)的表面。在一些情况下,所述清洁包括去除或减少不需要的污染物。在一些情况下,所述不需要的污染物包括来自经皮穿刺部位的DNA。在一些情况下,所述不需要的污染物包括来自经皮穿刺部位周围的细胞或组织的DNA。在一些情况下,DNA是损伤的。在一些情况下,DNA是未损伤的。在一些情况下,所述经皮穿刺部位是手指的皮肤。在一些实施方案中,所述受试者是妊娠受试者,并且所述无细胞核酸分子包括无细胞胎儿核酸分子。在一些实施方案中,所述无细胞核酸包括来自组织中肿瘤的核酸。在一些实施方案中,所述靶无细胞核酸是来自胎儿的无细胞核酸。在一些实施方案中,所述靶无细胞核酸是来自移植组织或器官的无细胞核酸。在一些实施方案中,所述靶无细胞核酸是来自一种或多种病原体的基因组核酸。在一些实施方案中,所述病原体包括细菌或其组分。在一些实施方案中,所述病原体包括病毒或其组分。在一些实施方案中,所述病原体包括真菌或其组分。在一些实施方案中,所述无细胞核酸包括一种或多种单核苷酸多态性(SNP)、插入或缺失(indel)或其组合。在一些实施方案中,所述大规模多重扩增测定法是等温扩增。在一些实施方案中,所述大规模多重扩增测定法是聚合酶链反应(mmPCR)。在一些实施方案中,所述生物样品包括与外周血相比胎儿无细胞核酸低的细胞类型或组织类型。在一些实施方案中,方法不由进行静脉切开术,或从受试者的静脉血获得生物样品组成。
在一些实施方案中,本文公开的方面是方法,其包括:(a)从受试者获得生物样品;(b)使用对胎儿滋养层细胞表面抗原特异的抗体从生物样品中分离胎儿滋养层;(c)裂解胎儿滋养层细胞中的胎儿滋养层细胞核;(e)从所述裂解胎儿滋养层中提取胎儿基因组DNA(gDNA);(f)将胎儿gDNA与扩增试剂和退火至对应于目标序列的序列的寡核苷酸引物接触以产生扩增产物;和(g)检测(i)所述的扩增产物存在或不存在,或(ii)检测至少一部分所述胎儿gDNA中至少一个靶序列的正常表现度、高表现度或低表现度。在一些实施方案中,存在或不存在指示胎儿的健康状况。在一些实施方案中,所述方法还包括从受试者获得生物样品后,使所述生物样品与白细胞稳定剂接触。在一些实施方案中,所述生物样品包括血液、血浆、血清、尿液、间质液、阴道细胞、阴道液、宫颈细胞、口腔细胞或唾液。在一些实施方案中,从受试者获得的生物样品是通过手指针刺的受试者收集的。在一些实施方案中,从受试者获得的生物样品是通过没有手指针刺的受试者收集的。在一些实施方案中,从受试者获得的生物样品是通过受试者使用被配置为裂解受试者表皮的细胞间连接的设备收集的。在一些实施方案中,通过以下方法收集从受试者获得的生物样品:(a)诱导第一次经皮穿刺以产生第一部分生物样品;(b)丢弃所述第一部分生物样品;和(c)收集第二部分生物样品,从而减少或消除由于白细胞裂解造成的生物样品的污染。在一些实施方案中,方法还包括在从受试者获得生物样品之前清洁经皮穿刺部位(例如,皮肤)的表面。在一些情况下,所述清洁包括去除或减少不需要的污染物。在一些情况下,所述不需要的污染物包括来自经皮穿刺部位的DNA。在一些情况下,所述不需要的污染物包括来自经皮穿刺部位周围的细胞或组织的DNA。在一些情况下,DNA是损伤的。在一些情况下,DNA是未损伤的。在一些情况下,所述经皮穿刺部位是手指的皮肤。在一些实施方案中,接触包括进行等温扩增。在一些实施方案中,接触在室温下发生。在一些实施方案中,所述方法包括在扩增发生时将标记掺入扩增产物中,并且还包括检测包括标记的扩增产物的存在。在一些实施方案中,所述标记不包括核苷酸。在一些实施方案中,检测扩增产物包括使扩增产物与能够与标记相互作用的结合部分接触。在一些实施方案中,方法还包括使扩增产物与侧流设备上的结合部分接触。在一些实施方案中,步骤(a)至(c)在小于15分钟内进行。在一些实施方案中,所述方法由受试者执行。在一些实施方案中,该方法由未接收执行该方法的技术培训的个人执行。在一些实施方案中,获得,接触和检测是用单个手持设备执行的。在一些实施方案中,所述健康状况选自妊娠的存在和不存在。在一些实施方案中,所述健康状况选自神经紊乱、代谢紊乱、癌症、自身免疫紊乱、过敏反应和感染的存在和不存在。在一些实施方案中,所述健康状况是对药物或治疗的响应。在一些实施方案中,方法不由进行静脉切开术,或从受试者的静脉血获得生物样品组成。在一些实施方案中,当从受试者获得时,所述生物样品具有至多300微升的体积。在一些实施方案中,当从受试者获得时,所述体积为至多100微升。在一些实施方案中,当从受试者获得时,所述体积为至多55微升。在一些实施方案中,当从受试者获得时,所述体积为至多50微升。在一些实施方案中,当从受试者获得时,所述体积为至多40微升。在一些实施方案中,当从受试者获得时,所述体积在约10微升和约40微升之间。在一些实施方案中,当从受试者获得时,所述体积在约10微升和约100微升之间。在一些实施方案中,从受试者获得的生物样品是毛细血管血液。在一些实施方案中,所述生物样品不是来自血液的血浆样品。在一些实施方案中,所述生物样品包括循环无细胞核酸。在一些实施方案中,所述生物样品包含约25皮克(pg)至约250pg的总的循环无细胞核酸分子。在一些实施方案中,所述生物样品包含小于300pg的无细胞核酸分子。在一些实施方案中,所述生物样品包含小于3ng的无细胞核酸分子。在一些实施方案中,所述生物样品包含约104至约109个无细胞核酸分子。在一些实施方案中,所述生物样品包含约104至约107个无细胞核酸分子。在一些实施方案中,所述生物样品中的无细胞核酸为约10个基因组当量。在一些实施方案中,所述生物样品中的无细胞核酸为至多10个基因组当量。在一些实施方案中,所述生物样品中的无细胞核酸在5-6、6-7、7-8、8-9、9-10、10-11、11-12、12-13、13-14或14-15个基因组当量之间。
本文公开的方面提供方法,其包括:(a)从妊娠有胎儿的受试者获得生物样品;(b)使所述生物样品中的至少一种无细胞核酸与扩增试剂和与对应于性染色体的序列退火的寡核苷酸引物接触;和(c)检测扩增产物存在或不存在。在一些实施方案中,存在或不存在指示胎儿的性别。在一些实施方案中,所述方法还包括从受试者获得生物样品后,使所述生物样品与白细胞稳定剂接触。在一些实施方案中,所述生物样品是血液、血浆、血清、尿液、间质液、阴道细胞、阴道液、宫颈细胞、口腔细胞或唾液。在一些实施方案中,当从受试者获得时,所述生物样品具有至多300微升的体积。在一些实施方案中,当从受试者获得时,所述体积为至多100微升。在一些实施方案中,当从受试者获得时,所述体积为至多55微升。在一些实施方案中,当从受试者获得时,所述体积为至多50微升。在一些实施方案中,当从受试者获得时,所述体积为至多40微升。在一些实施方案中,当从受试者获得时,所述体积在约10微升和约40微升之间。在一些实施方案中,当从受试者获得时,所述体积在约10微升和约100微升之间。在一些实施方案中,从受试者获得的生物样品是毛细血管血液。在一些实施方案中,所述生物样品不是来自血液的血浆样品。在一些实施方案中,所述生物样品包括循环无细胞核酸。在一些实施方案中,所述生物样品包含约25皮克(pg)至约250pg的总的循环无细胞核酸分子。在一些实施方案中,所述生物样品包含小于300pg的无细胞核酸分子。在一些实施方案中,所述生物样品包含小于3ng的无细胞核酸分子。在一些实施方案中,所述生物样品包含约104至约109个无细胞核酸分子。在一些实施方案中,所述生物样品包含约104至约107个无细胞核酸分子。在一些实施方案中,所述生物样品中的无细胞核酸为约10个基因组当量。在一些实施方案中,所述生物样品中的无细胞核酸为至多10个基因组当量。在一些实施方案中,所述生物样品中的无细胞核酸在5-6、6-7、7-8、8-9、9-10、10-11、11-12、12-13、13-14或14-15个基因组当量之间。在一些实施方案中,从受试者获得的生物样品是通过手指针刺的受试者收集的。在一些实施方案中,从受试者获得的生物样品是通过没有手指针刺的受试者收集的。在一些实施方案中,从受试者获得的生物样品是通过受试者使用被配置为裂解受试者表皮的细胞间连接的设备收集的。在一些实施方案中,通过以下方法收集从受试者获得的生物样品:(a)诱导第一次经皮穿刺以产生第一部分生物样品;(b)丢弃所述第一部分生物样品;和(c)收集第二部分生物样品,从而减少或消除由于白细胞裂解造成的生物样品的污染。在一些实施方案中,方法不由进行静脉切开术,或从受试者的静脉血获得生物样品组成。
在一些实施方案中,本文公开的方面是方法,其包括:(a)从受试者获得生物样品,其中所述样品的体积不大于约300微升,并且其中所述生物样品包括胎儿滋养层;(b)使用对胎儿滋养层细胞表面抗原具有特异性的单克隆抗体从生物样品中分离胎儿滋养层;(c)裂解胎儿滋养层;(d)任选地,纯化所述胎儿滋养层细胞核;任选地,裂解胎儿滋养层细胞核;(f)从所述裂解的胎儿滋养层中提取胎儿基因组DNA(gDNA);(g)将胎儿gDNA与扩增试剂和退火至对应于目标序列的序列的寡核苷酸引物接触以产生扩增产物;和(h)检测扩增产物存在或不存在。在一些实施方案中,存在或不存在指示胎儿的性别。在一些实施方案中,所述方法还包括从受试者获得生物样品后,使所述生物样品与白细胞稳定剂接触。在一些实施方案中,所述生物样品是血液、血浆、血清、尿液、间质液、阴道细胞、阴道液、宫颈细胞、口腔细胞或唾液。在一些实施方案中,所述血液样品的体积不大于120μl。在一些实施方案中,所述生物样品是来自血液的血浆样品。在一些实施方案中,所述血浆样品的体积不大于50μl。在一些实施方案中,所述血浆样品的体积为约10μl至约40μl。在一些实施方案中,从受试者获得的生物样品是通过手指针刺的受试者收集。在一些实施方案中,从受试者获得的生物样品是通过没有手指针刺的受试者收集的。在一些实施方案中,从受试者获得的生物样品是由受试者使用被配置为裂解受试者表皮的细胞间连接的设备收集的。在一些实施方案中,通过以下方法收集从受试者获得的生物样品:(a)诱导第一次经皮穿刺以产生第一部分生物样品;(b)丢弃所述第一部分生物样品;和(c)收集第二部分生物样品,从而减少或消除由于白细胞裂解造成的生物样品的污染。在一些实施方案中,方法不由进行静脉切开术,或从受试者的静脉血获得生物样品组成。在一些实施方案中,本文公开的方面是方法,其包括:(a)从受试者获得生物样品,其中所述生物样品包括无细胞核酸;(b)通过使所述无细胞核酸与核酸内切酶接触生成片段化核酸分子的文库,从而使所述无细胞核酸中的至少一种片段化;(c)任选地,扩增所述标记的无细胞核酸;和(d)测序至少一部分所述标记的无细胞核酸以检测目标序列。在一些实施方案中,所述核酸内切酶是Cas酶。在一些实施方案中,所述Cas酶是Cas9、Cas12、Cascade和Cas13或其一种或多种亚型或直系同源物。在一些实施方案中,通过与至少一个无细胞核酸互补的引导链将核酸内切酶引导至无细胞核酸。在一些实施方案中,所述方法还包括通过核酸内切酶使无细胞核酸片段化。在一些实施方案中,所述方法还包括从受试者获得生物样品后,使所述生物样品与白细胞稳定剂接触。在一些实施方案中,所述生物样品是血液、血浆、血清、尿液、间质液、阴道细胞、阴道液、宫颈细胞、口腔细胞或唾液。在一些实施方案中,所述血液样品的体积不大于300μl。在一些实施方案中,所述血液样品的体积不大于120μl。在一些实施方案中,所述生物样品是来自血液的血浆样品。在一些实施方案中,所述血浆样品的体积不大于50μl。在一些实施方案中,所述血浆样品的体积为约10μl至约40μl。在一些实施方案中,所述生物样品包含约25皮克(pg)至约250pg的总的循环无细胞DNA。在一些实施方案中,所述生物样品包含约104至约109个无细胞核酸分子。在一些实施方案中,所述生物样品包含约104至约107个无细胞核酸分子。
在一些实施方案中,本文公开的方面是方法,其包括:(a)从受试者获得生物样品,其中所述生物样品包括无细胞核酸;(b)通过使所述无细胞核酸与转座酶接触生成片段化核酸分子的文库,从而使所述无细胞核酸中的至少一种片段化并且用合成标记来标记所述片段化的无细胞核酸;(c)任选地,扩增所述标记的无细胞核酸;和(d)测序至少一部分所述标记的无细胞核酸。在一些实施方案中,所述转座酶使用切割和粘贴机制将无细胞核酸片段化。在一些实施方案中,所述转座酶是Tn5转座酶。在一些实施方案中,所述标记长度为约9个碱基对。在一些实施方案中,所述方法还包括通过转座酶使无细胞核酸片段化。在一些实施方案中,所述方法还包括通过转座酶标记片段化的无细胞核酸。在一些实施方案中,所述方法还包括从受试者获得生物样品后,使所述生物样品与白细胞稳定剂接触。在一些实施方案中,所述生物样品是血液、血浆、血清、尿液、间质液、阴道细胞、阴道液、宫颈细胞、口腔细胞或唾液。在一些实施方案中,所述血液样品的体积不大于300μl。在一些实施方案中,所述血液样品的体积不大于120μl。在一些实施方案中,所述生物样品是来自血液的血浆样品。在一些实施方案中,所述血浆样品的体积不大于50μl。在一些实施方案中,所述血浆样品的体积为约10μl至约40μl。在一些实施方案中,所述生物样品包含约25皮克(pg)至约250pg的总的循环无细胞DNA。在一些实施方案中,所述生物样品包含约104至约109个无细胞核酸分子。在一些实施方案中,所述生物样品包含约104至约107个无细胞核酸分子。在一些实施方案中,所述生物样品包含约5至约100个拷贝的目的序列。在一些实施方案中,从受试者获得的生物样品是通过手指针刺的受试者收集的。在一些实施方案中,从受试者获得的生物样品是通过没有手指针刺的受试者收集的。在一些实施方案中,从受试者获得的生物样品是由受试者使用被配置为裂解受试者表皮的细胞间连接的设备收集的。在一些实施方案中,通过以下方法收集从受试者获得的生物样品:(a)诱导第一次经皮穿刺以产生第一部分生物样品;(b)丢弃所述第一部分生物样品;和(c)收集第二部分生物样品,从而减少或消除由于白细胞裂解造成的生物样品的污染。在一些实施方案中,方法还包括在从受试者获得生物样品之前清洁经皮穿刺部位(例如,皮肤)的表面。在一些情况下,所述清洁包括去除或减少不需要的污染物。在一些情况下,所述不需要的污染物包括来自经皮穿刺部位的DNA。在一些情况下,所述不需要的污染物包括来自经皮穿刺部位周围的细胞或组织的DNA。在一些情况下,DNA是损伤的。在一些情况下,DNA是未损伤的。在一些情况下,所述经皮穿刺部位是手指的皮肤。在一些实施方案中,方法不由进行静脉切开术,或从受试者的静脉血获得生物样品组成。在一些实施方案中,检测目标序列包括检测(i)目标的序列存在或不存在,或(ii)目标序列的正常表现度、高表现度或低表现度。在一些实施方案中,检测包括大规模多重扩增。在一些实施方案中,所述大规模多重扩增测定法是等温扩增。在一些实施方案中,所述大规模多重扩增测定法是聚合酶链反应(mmPCR)。在一些实施方案中,所述受试者是妊娠受试者,并且无细胞核酸分子包括无细胞胎儿核酸分子。在一些实施方案中,所述无细胞核酸包括来自组织中肿瘤的核酸。在一些实施方案中,所述无细胞核酸是来自胎儿的无细胞核酸。在一些实施方案中,所述无细胞核酸是来自移植组织或器官的无细胞核酸。在一些实施方案中,所述无细胞核酸是来自一种或多种病原体的基因组核酸。在一些实施方案中,所述病原体包括细菌或其组分。在一些实施方案中,所述病原体包括病毒或其组分。在一些实施方案中,所述病原体包括真菌或其组分。在一些实施方案中,所述无细胞核酸包括一种或多种单核苷酸多态性(SNP)、插入或缺失(indel)或其组合。
在一些实施方案中,本文公开的方面是系统,其包括:(a)样品收集器,其被配置为收集受试者的生物样品;(b)样品处理器,所述样品处理器被配置为从所述生物样品中分离样品组分;(c)核酸检测器,其被配置为检测生物样品或样品组分中的核酸;和(d)核酸信息输出端。在一些实施方案中,所述系统还包括白细胞稳定剂。在一些实施方案中,所述样品收集器包括经皮穿刺设备。在一些实施方案中,所述经皮穿刺设备包括针、刺血针、微针、真空设备和微针阵列中的至少一种。在一些实施方案中,所述样品收集器包括被配置为用于裂解所述受试者的表皮的细胞间连接的设备。在一些实施方案中,所述样品组分选自细胞、碳水化合物、磷脂、蛋白质、核酸和微泡。在一些实施方案中,所述样品组分是血细胞。在一些实施方案中,所述样品组分不包括无细胞核酸。在一些实施方案中,所述样品组分包括无细胞核酸。在一些实施方案中,所述无细胞核酸来自肿瘤。在一些实施方案中,所述无细胞核酸来自胎儿。在一些实施方案中,所述无细胞核酸来自移植的组织或器官。在一些实施方案中,所述无细胞核酸来自一种或多种病原体。在一些实施方案中,所述无细胞核酸来自与外周血相比具有低丰度的无细胞核酸的细胞类型或组织类型。在一些实施方案中,所述病原体包括细菌或其组分。在一些实施方案中,病原体包括病毒或其组分。在一些实施方案中,所述病原体包括真菌或其组分。在一些实施方案中,所述样品组分包括一种或多种单核苷酸多态性(SNP)、一种或多种插入或缺失(indel)或其组合。在一些实施方案中,所述核酸检测器被配置为进行基因分型测定。在一些实施方案中,所述基因型分析包括定量实时聚合酶链反应(qPCR),基因型阵列或自动测序。在一些实施方案中,qPCR包括多重聚合酶链反应(mmPCR)。在一些实施方案中,所述样品组分是血浆或血清。在一些实施方案中,所述样品净化器被配置为从小于1毫升的血液中分离血浆。在一些实施方案中,所述样品纯化器被配置为从小于250μl的血液中分离血浆。在一些实施方案中,所述生物样品的体积不大于50μl。在一些实施方案中,所述生物样品的体积为约10μl至约40μl。在一些实施方案中,所述生物样品包含约25pg至约250pg的总的循环无细胞DNA。在一些实施方案中,所述样品包含生物样品或样品组分中目标序列的约5至约100个拷贝。在一些实施方案中,所述生物样品包含约104至约109个无细胞核酸分子。在一些实施方案中,所述生物样品包含约104至约107个无细胞核酸分子。在一些实施方案中,所述生物样品包含小于300pg的无细胞核酸分子。在一些实施方案中,所述生物样品包含小于3ng的无细胞核酸分子。在一些实施方案中,所述核酸检测器包括核酸测序器。在一些实施方案中,系统还包括至少一种核酸扩增试剂和至少一种群集剂。在一些实施方案中,所述系统还包括至少第一标记和至少一种扩增试剂,所述第一标记用于从生物样品产生无细胞核酸文库。在一些实施方案中,所述至少一种核酸扩增试剂包括引物,聚合酶及其组合。在一些实施方案中,所述核酸检测器被配置为通过以下步骤生成标记的核酸的文库:(a)通过一个或多个步骤生成可连接的核酸,所述步骤包括:(i)生成核酸的平端。在一些实施方案中,使用一种或多种聚合酶和一种或多种核酸外切酶去除5’突出端或3’凹陷端;(ii)使所述核酸的平端去磷酸化;(iii)使所述核酸与群集剂接触,从而增强所述一种或多种聚合酶、一种或多种核酸外切酶和所述核酸之间的反应;或(iv)使用连接酶修复或去除核酸中损伤的核酸;和通过在连接酶、群集剂和/或小分子增强子的存在下,使所述可连接的核酸与衔接子寡核苷酸接触,将所述可连接的核酸与衔接子寡核苷酸连接。在一些实施方案中,所述一种或多种聚合酶包括T4 DNA聚合酶或DNA聚合酶I。在一些实施方案中,所述一种或多种核酸外切酶包括T4多核苷酸激酶或核酸外切酶III。在一些实施方案中,所述连接酶包括T3 DNA连接酶、T4 DNA连接酶、T7 DNA连接酶、Taq连接酶、Ampligase、大肠杆菌连接酶或Sso7-连接酶融合蛋白。在一些实施方案中,所述群集剂包括聚乙二醇(PEG)、糖原、或葡聚糖或其组合。在一些实施方案中,所述小分子增强剂包括二甲亚砜(DMSO),聚山梨醇酯20,甲酰胺或二醇或其组合。在一些实施方案中,(b)中的连接包括平端连接或单核苷酸突出端连接。在一些实施方案中,衔衔接子寡核苷酸包括Y形衔接子、发夹衔接子、茎环衔接子、可降解衔接子、封闭性自连接衔接子或条形码衔接子或其组合。在一些实施方案中,所述系统还被配置为合并两个或更多个生物样品,每个样品从不同的受试者获得。在一些实施方案中,所述核酸检测器还被配置为对标记计数以检测样品中目标核酸的表现度。在一些实施方案中,所述核酸序列输出端选自无线通信设备、有线通信设备、电缆端口和电子显示器。在一些实施方案中,系统的所有组件存在于单个位置。在一些实施方案中,系统的所有部件容纳在单个设备中。在一些实施方案中,所述样品收集器位于第一位置,并且所述样品纯化器和核酸检测器中的至少一个位于第二位置。在一些实施方案中,所述样品收集器与所述样品纯化器和核酸检测器中至少一个在相同位置。在一些实施方案中,所述样品纯化器包括过滤器。在一些实施方案中,所述过滤器具有约0.05微米至约2微米的孔径。在一些实施方案中,系统还包括用于运输或储存至少一部分生物样品的运输或储存隔室。在一些实施方案中,所述运输或储存隔室包括吸收垫、液体容器、样品防腐剂或其组合。在一些实施方案中,所述系统还包括核酸扩增器,所述核酸扩增器被配置为扩增来自所述样品组分或所述生物样品的核酸,并且在一些实施方案中,所述核酸检测器还被配置为检测所述生物样品或所述样品组分中的扩增的核酸。在一些实施方案中,所述核酸扩增器是聚合酶链反应(PCR)设备。在一些实施方案中,所述PCR设备是大规模多重PCR设备(mmPCR)。在一些实施方案中,所述生物样品不是来源于受试者的静脉血。
在一些实施方案中,本文公开的方面是系统,其包括:(a)样品收集器,其被配置为收集受试者的约1-100微升(μl)生物样品;(b)样品处理器,所述样品处理器被配置为从所述生物样品中分离样品组分;(c)检测器,其被配置为检测所述生物样品或所述样品组分中的表观遗传修饰;以及(d)信息输出端。在一些实施方案中,所述表观遗传修饰包括在遗传基因座处的DNA甲基化、组蛋白甲基化、组蛋白泛素化、组蛋白乙酰化、组蛋白磷酸化、微小RNA(miRNA)。在一些实施方案中,所述DNA甲基化包括CpG甲基化或CpH甲基化。在一些实施方案中,所述遗传基因座包括基因的启动子或调节元件。在一些实施方案中,所述遗传基因座包括可变长末端重复序列(LTR)。在一些实施方案中,所述遗传基因座包括无细胞DNA或其片段。在一些实施方案中,所述遗传基因座包括单核苷酸多态性(SNP)。在一些实施方案中,组蛋白乙酰化通过组蛋白脱乙酰酶的存在或水平来指示。在一些实施方案中,所述组蛋白修饰是在选自组蛋白2A(H2A)、组蛋白2B(H2B)、组蛋白3(H3)和组蛋白4(H4)的组蛋白处。在一些实施方案中,所述组蛋白甲基化是H3赖氨酸4(H3K4me2)的甲基化。在一些实施方案中,所述组蛋白乙酰化是在H4处的脱乙酰化。在一些实施方案中,所述miRNA选自miR-21、miR-126、mi-R142、mi-R146a、mi-R12a、mi-R181a、miR-29c、miR-29a、miR-29b、miR-101、miRNA-155和miR-148a。在一些实施方案中,所述生物样品包括血液、血浆、血清、尿液、间质液、阴道细胞、阴道液、宫颈细胞、口腔细胞或唾液。在一些实施方案中,所述血液包括毛细血管血液。在一些实施方案中,所述毛细血管血液包括不大于40微升的血液。在一些实施方案中,从受试者获得的生物样品是通过经皮穿刺收集的。在一些实施方案中,从受试者获得的生物样品不是通过经皮穿刺收集的。在一些实施方案中,从受试者获得的生物样品是使用被配置为裂解受试者表皮的细胞间连接的设备收集的。在一些实施方案中,所述样品收集器被配置为允许通过以下方法收集从该受试者获得的生物样品:(a)诱导第一次经皮穿刺以产生第一部分生物样品;(b)丢弃所述第一部分生物样品;和(c)收集第二部分生物样品,从而减少或消除由于白细胞裂解造成的生物样品的污染。在一些实施方案中,所述样品收集器被配置为在从受试者获得生物样品之前清洁经皮穿刺部位(例如,皮肤)的表面。在一些情况下,所述清洁包括去除或减少不需要的污染物。在一些情况下,所述不需要的污染物包括来自经皮穿刺部位的DNA。在一些情况下,所述不需要的污染物包括来自经皮穿刺部位周围的细胞或组织的DNA。在一些情况下,DNA是损伤的。在一些情况下,DNA是未损伤的。在一些情况下,所述经皮穿刺部位是手指的皮肤。在一些实施方案中,所述系统还包括白细胞稳定剂。在一些实施方案中,所述生物样品不是来源于受试者的静脉血。
在一些实施方案中,本文公开的方面是设备,其包括:(a)样品收集器,其用于从有此需要的受试者获得生物样品;(b)样品纯化器,其用于从所述生物样品中去除细胞以产生去细胞样品;和(c)核酸检测器,其被配置为检测所述去细胞样品中的多个无细胞DNA片段。在一些实施方案中,所述设备还包括白细胞稳定剂。在一些实施方案中,所述样品收集器被配置为用于裂解所述受试者的表皮的细胞间连接。在一些实施方案中,所述样品收集器被配置为收集来自经皮穿刺的样品。在一些实施方案中,第一序列存在于所述多个无细胞DNA片段的第一无细胞DNA片段上,并且第二序列存在于所述多个无细胞DNA片段的第二无细胞DNA片段上,并且在一些实施方案中,所述第一序列与所述第二序列有至少80%的同一性。在一些实施方案中,第一序列和第二序列中的至少一个在受试者的基因组中重复至少两次。在一些实施方案中,第一序列和第二序列各自的长度为至少10个核苷酸。在一些实施方案中,第一序列在第一染色体上,第二序列在第二染色体上。在一些实施方案中,第一序列和第二序列在相同染色体上,但间隔至少1个核苷酸。在一些实施方案中,第一序列和第二序列是功能性连接。在一些实施方案中,所述核酸检测器包括至少一种检测试剂。在一些实施方案中,所述至少一种检测试剂包括寡核苷酸探针,寡核苷酸探针能够检测所述多个DNA片段中的至少一个无细胞DNA片段。在一些实施方案中,所述至少一种检测试剂能够检测胎儿的表观遗传特征。在一些实施方案中,所述胎儿的表观遗传特征包括核酸甲基化。在一些实施方案中,所述甲基化是等位基因特异性的。在一些实施方案中,所述设备还包括核酸扩增器,所述核酸扩增器被配置为扩增来自所述样品组分或所述生物样品的核酸,并且在一些实施方案中,所述核酸检测器还被配置为检测所述生物样品或所述样品组分中的扩增的核酸。在一些实施方案中,所述核酸扩增设备是等温聚合酶链式反应(PCR)设备。在一些实施方案中,所述等温PCR设备是大规模多重PCR设备(mmPCR)。在一些实施方案中,所述设备还包括基因型分析仪,其被配置为将检测到的多个无细胞DNA片段与已知基因型比较。在一些实施方案中,所述多个无细胞DNA片段包括胎儿组分,并且已知基因型是父本基因型。在一些实施方案中,所述核酸扩增器包括至少一种核酸扩增试剂和单对引物以扩增第一序列和第二序列。在一些实施方案中,所述核酸检测器包括核酸测序器。在一些实施方案中,所述核酸序列包括信号检测器。在一些实施方案中,所述核酸检测器是侧向流条带。在一些实施方案中,所述无细胞DNA包括一种或多种单核苷酸多态性(SNP)、插入或缺失(indel)或其组合。在一些实施方案中,所述无细胞DNA来自肿瘤。在一些实施方案中,所述无细胞DNA来自胎儿。在一些实施方案中,无细胞DNA来自移植的组织或器官。在一些实施方案中,所述无细胞核酸来自与外周血相比具有低丰度的无细胞核酸的细胞类型或组织类型。在一些实施方案中,所述无细胞DNA来自一种或多种病原体。在一些实施方案中,所述病原体包括细菌或其组分。在一些实施方案中,所述病原体包括病毒或其组分。在一些实施方案中,所述病原体包括真菌或其组分。在一些实施方案中,所述样品纯化器包括过滤器,并且在一些实施方案中,所述过滤器具有约0.05微米至约2微米的孔径。在一些实施方案中,所述过滤器是垂直过滤器。在一些实施方案中,所述样品纯化器包括选自抗体、抗原结合抗体片段、配体、受体、肽、小分子及其组合的结合部分。在一些实施方案中,所述结合部分能够结合细胞外囊泡。在一些实施方案中,所述核酸检测器被配置为通过以下步骤生成标记的无细胞DNA片段的文库:(a)通过一个或多个步骤产生可连接的无细胞DNA片段,所述步骤包括:(i)生成所述无细胞DNA片段的平端。在一些实施方案中,使用一种或多种聚合酶和一种或多种核酸外切酶去除5’突出端或3’凹陷端;(ii)使所述无细胞DNA片段的平端去磷酸化;(iii)使所述无细胞DNA片段与群集剂接触,从而增强所述一种或多种聚合酶、一种或多种核酸外切酶和所述无细胞DNA片段之间的反应;或(iv)使用连接酶修复或去除无细胞DNA片段中的DNA损伤;和(v)在连接酶、群集剂和/或小分子增强子的存在下,通过将所述可连接的无细胞DNA片段与衔接子寡核苷酸接触,将所述可连接的无细胞DNA片段与衔接子寡核苷酸连接。在一些实施方案中,所述一种或多种聚合酶包括T4 DNA聚合酶或DNA聚合酶I。在一些实施方案中,所述一种或多种核酸外切酶包括T4多核苷酸激酶或核酸外切酶III。在一些实施方案中,所述连接酶包括T3 DNA连接酶、T4 DNA连接酶、T7 DNA连接酶、Taq连接酶、Ampligase、大肠杆菌连接酶或Sso7-连接酶融合蛋白。在一些实施方案中,所述群集剂包括聚乙二醇(PEG)、糖原、或葡聚糖或其组合。在一些实施方案中,所述小分子增强剂包括二甲亚砜(DMSO),聚山梨醇酯20,甲酰胺或二醇或其组合。在一些实施方案中,(b)中的连接包括平端连接或单核苷酸突出端连接。在一些实施方案中,所述衔接子寡核苷酸包括Y形衔接子、发夹衔接子、茎环衔接子、可降解衔接子、封闭性自连接衔接子或条形码衔接子或其组合。在一些实施方案中,所述设备还被配置为合并两个或更多个生物样品,每个样品从不同的受试者获得。在一些实施方案中,所述核酸检测器还被配置为对标记计数以检测样品中目标核酸的表现度。在一些实施方案中,所述设备还包括核酸序列输出端,所述核酸序列输出端包括无线通信设备、有线通信设备、电缆端口或电子显示器。在一些实施方案中,所述设备包括在单个壳体中。在一些实施方案中,所述设备在室温下操作。在一些实施方案中,所述设备能够在接受所述生物液体的约5分钟至约20分钟内检测所述去细胞样品中的所述多种生物标志物。在一些实施方案中,所述设备还包括通信连接。在一些实施方案中,所述生物样品包括血液、血浆、血清、尿液、间质液、阴道细胞、阴道液、宫颈细胞、口腔细胞或唾液。在一些实施方案中,所述血液包括毛细血管血液。在一些实施方案中,所述样品净化器被配置为从小于250μl的血液中分离血浆。在一些实施方案中,所述生物样品的体积不大于50μl。在一些实施方案中,所述生物样品的体积为约10μl至约40μl。在一些实施方案中,所述生物样品包含约25pg至约250pg的总的循环无细胞DNA。在一些实施方案中,所述生物样品包含生物样品或样品组分中目标序列的约5至约100个拷贝。在一些实施方案中,所述生物样品包含约104至约109个无细胞核酸分子。在一些实施方案中,所述生物样品包含约104至约107个无细胞核酸分子。在一些实施方案中,所述生物样品包含小于300pg的无细胞核酸分子。在一些实施方案中,所述生物样品包含小于3ng的无细胞核酸分子。在一些实施方案中,所述样品收集器被配置为允许通过以下方法收集从所述受试者获得的生物样品:(a)诱导第一次经皮穿刺以产生第一部分生物样品;(b)丢弃所述第一部分生物样品;和(c)收集第二部分生物样品,从而减少或消除由于白细胞裂解造成的生物样品的污染。在一些实施方案中,所述样品收集器被配置为在从受试者获得生物样品之前清洁经皮穿刺部位(例如,皮肤)的表面。在一些情况下,所述清洁包括去除或减少不需要的污染物。在一些情况下,所述不需要的污染物包括来自经皮穿刺部位的DNA。在一些情况下,所述不需要的污染物包括来自经皮穿刺部位周围的细胞或组织的DNA。在一些情况下,DNA是损伤的。在一些情况下,DNA是未损伤的。在一些情况下,所述经皮穿刺部位是手指的皮肤。在一些实施方案中,本文公开的方面是设备,其包括:(a)样品收集器,其被配置为收集受试者的约1-100微升(μl)生物样品;(b)样品处理器,其被配置为从所述生物样品中分离样品组分;(c)检测器,其被配置为检测所述生物样品或所述样品组分中的表观遗传修饰;以及(d)信息输出端。在一些实施方案中,所述样品收集器被配置为收集来自经皮穿刺的样品。在一些实施方案中,所述表观遗传修饰包括在遗传基因座处的DNA甲基化、组蛋白甲基化、组蛋白泛素化、组蛋白乙酰化、组蛋白磷酸化、微小RNA(miRNA)。在一些实施方案中,所述DNA甲基化包括CpG甲基化或CpH甲基化。在一些实施方案中,所述遗传基因座包括基因的启动子或调节元件。在一些实施方案中,所述遗传基因座包括可变长末端重复序列(LTR)。
在一些实施方案中,所述遗传基因座包括无细胞DNA或其片段。在一些实施方案中,所述遗传基因座包括单核苷酸多态性(SNP)。在一些实施方案中,组蛋白乙酰化通过组蛋白脱乙酰酶的存在或水平来指示。在一些实施方案中,所述组蛋白修饰是在选自组蛋白2A(H2A)、组蛋白2B(H2B)、组蛋白3(H3)和组蛋白4(H4)的组蛋白处。在一些实施方案中,所述组蛋白甲基化是H3赖氨酸4(H3K4me2)的甲基化。在一些实施方案中,所述组蛋白乙酰化是在H4处的脱乙酰化。在一些实施方案中,所述miRNA选自miR-21、miR-126、mi-R142、mi-R146a、mi-R12a、mi-R181a、miR-29c、miR-29a、miR-29b、miR-101、miRNA-155和miR-148a。在一些实施方案中,所述生物样品包括血液、血浆、血清、尿液、间质液、阴道细胞、阴道液、宫颈细胞、口腔细胞或唾液。在一些实施方案中,所述血液包括毛细血管血液。在一些实施方案中,所述毛细血管血液包括不超过40微升的血液。在一些实施方案中,所述设备还包括合并两个或更多个生物样品,每个样品从不同的受试者获得。在一些实施方案中,从受试者获得的生物样品是通过经皮穿刺收集的。在一些实施方案中,从受试者获得的生物样品不是通过经皮穿刺收集的。在一些实施方案中,从受试者获得的生物样品是使用配置为裂解受试者表皮的细胞间连接的设备收集的。在一些实施方案中,通过以下方法收集从受试者获得的生物样品:(a)诱导第一次经皮穿刺以产生第一部分生物样品;(b)丢弃所述第一部分生物样品;和(c)收集第二部分生物样品,从而减少或消除液体的污染。在一些实施方案中,所述设备还包括白细胞稳定剂。在一些实施方案中,所述样品收集器被配置成允许通过以下方法收集从所述受试者获得的生物样品:(a)诱导第一次经皮穿刺以产生第一部分生物样品;(b)丢弃所述第一部分生物样品;和(c)收集第二部分生物样品,从而减少或消除由于白细胞裂解造成的生物样品的污染。在一些实施方案中,所述样品收集器被配置为在从受试者获得生物样品之前清洁经皮穿刺部位(例如,皮肤)的表面。在一些情况下,所述清洁包括去除或减少不需要的污染物。在一些情况下,所述不需要的污染物包括来自经皮穿刺部位的DNA。在一些情况下,所述不需要的污染物包括来自经皮穿刺部位周围的细胞或组织的DNA。在一些情况下,DNA是损伤的。在一些情况下,DNA是未损伤的。在一些情况下,所述经皮穿刺部位是手指的皮肤。在一些实施方案中,所述生物样品不是来源于受试者的静脉血。
本文公开的方面包括增加从受试者获得的生物样品中的靶核酸的相对量的方法,其包括:(a)在某一部位诱导经皮穿刺以产生第一部分生物样品和第二部分生物样品;(b)丢弃所述第一部分生物样品;和(c)收集第二部分生物样品,从而减少或消除生物样品的污染或核酸损伤,其中与第二部分生物样品中的靶核酸的成分相比,第一部分包括较低的靶核酸的成分。在一些实施方案中,所述方法还包括在诱导经皮穿刺之前清洁所述部位,从而除去或减少不需要的污染物。在一些实施方案中,所述不需要的污染物包括来自经皮穿刺部位的DNA。在一些情况下,所述不需要的污染物包括来自经皮穿刺部位周围的细胞或组织的DNA。在一些情况下,DNA是损伤的。在一些情况下,DNA是未损伤的。在一些实施方案中,所述经皮穿刺部位是手指的皮肤。在一些实施方案中,所述污染包括来自部位周围组织的核酸。在一些实施方案中,所述核酸损伤包括对生物样品中非凋亡DNA的损伤。在一些实施方案中,所述生物样品不是来源于受试者的静脉血。
根据以下详细描述,本公开内容的其他目的、特征和优点对于本领域技术人员将变得显而易见。然而,应当理解,详细说明和特定实例在说明本公开内容的一些实施方案时是通过示例而非限制的方式给出的。在不脱离本公开内容的精神的情况下,可以在本公开内容的范围内进行许多改变和修改,并且本公开内容包括所有这样的修改。此外,一个实施方案的各方面可以用于其他不同的实施方案中。
援引并入
本说明书中提到的所有出版物、专利和专利申请均通过引用并入本文,其程度如同明确且单独地指出每个单独的出版物、专利或专利申请通过引用并入。
附图说明
本文公开的方法、设备、系统和试剂盒的新颖特征在所附的权利要求书中具体阐述。通过参考以下对利用到本文公开的设备、系统和试剂盒的原理的说明性实施方案加以阐述的详细描述和附图,将会获得对本文公开的发明设备、系统和试剂盒的特征和优点的更好的理解,在这些附图中:
图1示出了本文公开的方法的可选工作流程。
图2示出了本文公开的方法和系统的组件如何可以分布在多个位置(物理和/或电子位置)或主要集中在一个物理位置的图解。
图3示出了从由低覆盖全基因组合成测序产生的超低样品量得到的三体性检测结果。描述了来自参考样品和测试样品的21号染色体表现度的Z评分。虚线表示Z评分3。测试样品的Z评分等于或高于3意味着该样品中21号染色体具有更高表现度,并认为其21号染色体具有三体性。如果样品来自妊娠女性,则检测到的多余量的21号染色体由胎儿贡献,因此可以得出结论,胎儿的21号染色体具有三体性。
图4A示出了连接到远程系统和个人的设备的过程概述。图4B示出了连接到远程系统和个人的设备的示例性界面。
图5示出了移动设备以及如何将移动应用程序配置为与本文公开的设备、系统和试剂盒连接、通信并从其接收遗传信息和其他信息。图5A示出了移动应用程序提供的各种功能。图5B示出了指导用户使用本文公开的设备、系统和试剂盒的逐步流程。图5C示出了允许用户启动测试,查看和共享测试结果,以及与其他人交互的界面元素。图5D示出了用于监控测试状态的界面。图5E示出了如何可以共享结果。
图6示出了使用8-10ml静脉血作为起始量进行的低覆盖全基因组测序的不同处理步骤中预期的cfDNA片段的典型量。
图7示出了提高测序文库效率对于显著提高使用超低cfDNA输入量的应用的灵敏度的重要性。
图8A-C示出了从减少的无细胞(cfDNA)输入量产生的测序文库的电泳图。无细胞DNA的输入量从图8A中的20个基因组当量(20GE)降至图8C中的1个基因组当量(1GE)。尽管文库的总产量下降,但衔接子二聚体的量并没有显著增加,并且仍然有足够的数目和质量可用于成功的序列分析。
图9示出了使用低覆盖全基因组合成测序,采用从静脉血中分离的超低量cfDNA(10个基因组当量)进行的低比例Y染色体检测(2.5%或更高)。
图10示出了使用低覆盖全基因组合成测序,采用从女性和男性DNA的毛细血管血液/血浆混合物中分离的超低输入量cfDNA进行的低比例Y染色体检测(2.5%或更高)。
图11示出了基于配对末端测序数据,在来自毛细血管血液的cfDNA与来自静脉血的cfDNA之间的cfDNA片段大小分布比较。
图12示出了使用低覆盖全基因组合成测序,采用超低输入量的源自妊娠女性血液/血浆的cfDNA进行的胎儿染色体非整倍性检测。超低输入量的来自非三体性的参考样品的cfDNA被用于确定21号染色体表现度的中值和中值绝对偏差。测试样品是来自怀有正常胎儿(无三体性)或具有21号染色体三体性的胎儿的妊娠女性的超低量cfDNA(10GE)。
图13示出了使用低覆盖全基因组合成测序,采用超低输入量的源自妊娠女性血液/血浆的cfDNA进行的胎儿染色体非整倍性检测。使用确定21三体性状态的样品内部方法,在没有参考样品的情况下进行了分析。测试样品是来自怀有正常胎儿(无三体性)或具有21号染色体三体性的胎儿的妊娠女性的超低量cfDNA(10GE)。
图14A-14C显示当测试十(10)个基因组当量时,与低输入量的优化方案相比,标准文库制备和测序方法导致胎儿无细胞DNA的低表现度。图14A和图14B显示标准与优化方案数据集的中值区块(bin)计数和每个区块的中值绝对偏差(MAD)之间的关系。图14C显示以不同文库制备效率使测序读段和基因组当量关联的矩阵。图14D以黄色显示优化方案的数据点,以蓝色显示标准方案的点。与本公开的优化方案相比,使用标准方案的文库制备和测序在测序中产生更少的有效取样基因组当量(Life的中值=1.355,ILMN的中值=6.065)。图14E显示标准方案数据示出良好的特异性(0假阳性,100%特异性)但差的灵敏度(2假阴性,50%灵敏度)。图14F显示来自标准方案文库制备和测序的数据是有噪声的,并且无法容易地描绘携带男性与女性胎儿的样品。图14G显示使用标准方案(左)和优化方案(右),所有样品的组合的胎儿分数测量与chr21引入的观察到的效果很好地相关。图14H显示与标准方案相比,优化方案产生更高的有效拷贝数,甚至导致标准方案的胎儿性别结果错误。图14I提供对标准方案的低灵敏度(2个假阴性)的解释,红线模拟50%灵敏度,使用估计90%的PCR效率,仅5%的文库效率和36M的测序读段,与从用标准方案分析的4个样品绘制的实际数据一致(图14I)。
图15显示在治疗之前和治疗之后从患有晚期癌症的患者中获得的基于毛细血管血液的循环无细胞DNA测序数据。
图16显示从患有血流感染(BSI)的住院患者获得的患者毛细血管血液中检测来自肺炎克雷伯氏菌循环无细胞DNA的预期结果。
图17A-17B显示通过cfDNA片段测序测定的来自静脉血(图17A)和毛细血管血液(图17B)的cfDNA的大小分布图。
图18A显示静脉和毛细血管血液cfDNA片段分布的比较。图18B:静脉血和表面结合DNA之间DNA大小分布的比较。图18C显示来自静脉血和具有损伤细胞的毛细血管血液的cfDNA之间的DNA片段大小分布。图18D显示来自静脉血和毛细血管血液的cfDNA与损伤细胞之间的DNA片段大小分布,片段大小放大到500bp以下。
图19显示“擦除”和“未擦除”的毛细血管血液收集样品的DNA片段大小分布差异的比较。
图20显示对照整倍性样品或对照三体性样品的Z评分,使用本文所述的方法以100%的准确度将其分类为整倍性或三体性。Z评分为3.5和更高的样品被分类为三体性,而Z评分小于3.5的样品被分类为整倍体。
某些术语
提供以下描述以帮助理解本文公开的方法、系统和试剂盒。本文使用的以下术语描述并非旨在限制这些术语的定义。这些术语在整个本申请中被进一步描述和例示。
通常,术语“无细胞多核苷酸”、“无细胞核酸”在本文可互换使用,是指可以在不从细胞提取多核苷酸或核酸的情况下从样品分离的多核苷酸和核酸。无细胞核酸可以包含DNA。无细胞核酸可以包含RNA。无细胞核酸是不包含在细胞膜内的核酸,即它未被包封在细胞区室内。在一些实施方案中,无细胞核酸是不受细胞膜限制并且在血液或其他流体中循环或存在的核酸。在一些实施方案中,无细胞核酸在收集含有它的生物样品之前和/或之后是无细胞的,并且不会由于人为、有意或其他方式的样品操作,包括在收集样品时或之后的操作,而从细胞释放。在一些情况下,无细胞核酸在细胞中产生,并通过生理手段从细胞释放,该生理手段包括例如,凋亡和非凋亡性细胞死亡、坏死、自噬、自发释放(例如,DNA/RNA-脂蛋白复合物的自发释放)、分泌和/或有丝分裂崩溃。在一些实施方案中,无细胞核酸包括通过生物机制(例如,凋亡、细胞分泌、囊泡释放)从细胞释放的核酸。在进一步或附加的实施方案中,无细胞核酸不是通过细胞或样品处理的人为操作(例如,细胞膜破坏、裂解、涡旋、剪切等)从细胞提取的核酸。
在一些情况下,无细胞核酸是无细胞胎儿核酸。通常,如本文所用的术语“无细胞胎儿核酸”是指如本文所述的无细胞核酸,其中所述无细胞核酸来自包含胎儿DNA的细胞。在妊娠女性中,源自胎盘的无细胞DNA可以占无细胞DNA总量的显著部分。胎盘DNA通常是胎儿DNA的良好替代物,因为在大多数情况下,胎盘DNA与胎儿DNA非常相似。绒毛膜绒毛取样等应用已利用这一事实建立了诊断应用。通常,由于在妊娠受试者的妊娠期间胎盘组织定期脱落,因此在母体生物样品中发现很大一部分无细胞胎儿核酸。通常,胎盘组织脱落物中的许多细胞都是含有胎儿DNA的细胞。从胎盘脱落的细胞释放出胎儿核酸。因此,在一些情况下,本文公开的无细胞胎儿核酸是从胎盘细胞释放的核酸。
如本文所用,术语“细胞核酸”是指包含在细胞中的多核苷酸或由于操作生物样品而从细胞释放的多核苷酸。生物样品的操作的非限制性实例包括离心、涡旋、剪切、混合、裂解,以及向生物样品添加在获得时不存在于生物样品中的试剂(例如,洗涤剂、缓冲液、盐、酶)。在一些情况下,细胞核酸是由于机械、人或机器人对细胞的破坏或裂解而从细胞释放的核酸。在一些情况下,通过本文公开的设备和方法有意或无意地将细胞核酸(细胞所含的核酸)从细胞释放。然而,这些不被认为是在本文所用的“无细胞核酸”。在一些情况下,本文公开的设备、系统、试剂盒和方法允许分析生物样品中的无细胞核酸,并且还在此过程中分析细胞核酸。
如本文所用,术语“生物标志物”通常是指受试者的生物学或状况的任何标志物。生物标志物可以是疾病或病况的指示物或结果。生物标志物可以是健康的指示物。生物标志物可以是遗传异常或遗传病况的指示物。生物标志物可以是循环生物标志物(例如,在生物流体如血液中发现)。生物标志物可以是组织生物标志物(例如,在实体器官如肝脏或骨髓中发现)。生物标志物的非限制性实例包括核酸、表观遗传修饰、蛋白质、肽、抗体、抗体片段、脂质、脂肪酸、甾醇、多糖、碳水化合物、病毒颗粒、微生物颗粒。在一些情况下,生物标志物甚至可以包括整个细胞或细胞片段。
如本文所用,术语“标签”通常是指可用于鉴定、检测或分离感兴趣的核酸的分子。除非另有说明,否则术语“标签”可以与诸如“标记”、“衔接子”、“寡核苷酸”和“条形码”之类的其他术语互换使用。但是,应注意,术语“衔接子”可用于连接核酸的两端或多个核酸而不充当标签。
如本文所用,术语“遗传信息”通常是指一个或多个核酸序列。在一些情况下,遗传信息可以是单个核苷酸或氨基酸。例如,遗传信息可以是单核苷酸多态性的存在(或不存在)。除非另有说明,否则术语“遗传信息”也可以指表观遗传修饰模式、基因表达数据和蛋白质表达数据。在一些情况下,生物标志物的存在、不存在或数量提供遗传信息。例如,胆固醇水平可以指示高胆固醇血症的遗传形式。因此,遗传信息不应限于核酸序列。
如本文所用,术语“遗传突变”通常是指基因组核苷酸序列的改变。遗传突变不同于自然变异或等位基因差异。遗传突变可能在小于10%的受试者物种中发现。遗传突变可能在小于5%的受试者物种中发现。遗传突变可能在小于1%的受试者物种中发现。受试者中的遗传突变可导致受试者中的疾病或病况。遗传突变可导致蛋白质编码序列移码。遗传突变可导致蛋白质编码序列的至少一部分的缺失。遗传突变可导致蛋白质编码序列中的终止密码子丢失。遗传突变可导致蛋白质编码序列中的提前终止密码子。遗传突变可导致编码错误折叠的蛋白质的序列。遗传突变可导致编码功能失调的蛋白质或非功能性蛋白质(例如,结合或酶活性的丧失)的序列。遗传突变可导致编码过度活性蛋白质(例如,结合或酶活性增加)的序列。遗传突变可影响单个核苷酸(例如,单核苷酸变异或单核苷酸多态性)。遗传突变可影响多个核苷酸(例如移码、易位)。
如本文所用,术语“特异于”是指仅在序列或生物标志物所特异于的事物之中,之上或之处发现的序列或生物标志物。例如,如果序列特异于Y染色体,这意味着它仅在Y染色体上发现而不在另一个染色体上发现。
如本文所用,术语“正常个体”和“正常受试者”是指不具有所关注的症状或紊乱的受试者。例如,如果所描述的方法或设备用于检测癌症的类型,所述正常受试者不具有那种类型的癌症。所述正常受试者可能根本没有癌症。在一些情况下,所述正常受试者未被诊断为患有任何疾病或症状。在一些情况下,所述正常受试者不具有已知的遗传突变。在一些情况下,所述正常受试者不具有导致可检测表型的遗传突变,所述表型将受试者与不具有已知遗传突变的正常受试者区分开。在一些情况下,所述正常受试者不被病原体感染。在一些情况下,所述正常受试者被病原体感染,但没有已知的遗传突变。
如本文所用,术语“基因组当量”通常是指为了保证所有基因都将存在而在纯化样品中必须存在的DNA量。
如本文所用,术语“组织特异性”或短语“对组织特异性”通常是指主要在特定组织中表达的多核苷酸。通常,本文公开的方法、系统和试剂盒利用无细胞的组织特异性多核苷酸。本文所述的无细胞的组织特异性多核苷酸是在一定水平下表达的多核苷酸,该水平可在表达它们的组织或器官受损或病变后在生物流体中定量。在一些情况下,本文公开的无细胞的组织特异性多核苷酸在生物流体中的存在是由于组织或器官的损伤或病变时释放的无细胞的组织特异性多核苷酸,而不是由于无细胞的组织特异性多核苷酸的表达改变。本文公开的无细胞的组织特异性多核苷酸的水平升高可以指示对相应组织或器官的损伤。在一些情况下,本文公开的无细胞多核苷酸在几种组织中表达/产生,但是在那些组织中的至少一种中以组织特异性水平表达。在这些情况下,无细胞的组织特异性多核苷酸的绝对或相对数量指示特定组织或器官或组织或器官的集合的损伤或疾病。备选地或附加地,组织特异性多核苷酸是具有组织特异性修饰的核酸。组织特异性多核苷酸可以包含RNA。组织特异性多核苷酸可以包含DNA。举非限制性实例而言,本文公开的组织特异性多核苷酸或标志物包括具有组织特异性甲基化模式的DNA分子(例如,基因或非编码区的一部分)。换言之,多核苷酸和标志物可以在许多组织中相似地表达,或者甚至在整个受试者中普遍表达,但是修饰是组织特异性的。通常,本文公开的组织特异性多核苷酸或其水平对疾病不是特异性的。通常,本文公开的组织特异性多核苷酸不编码涉及疾病机制的蛋白质。
在一些情况下,组织特异性多核苷酸在感兴趣的组织中的存在量大于其在受试者血液中的存在量。在一些情况下,RNA在感兴趣的组织中的存在量大于其在血细胞中的存在量。在一些情况下,血细胞不表达组织特异性多核苷酸。在一些情况下,组织中存在的组织特异性多核苷酸比在血液中存在的组织特异性多核苷酸至少高两倍。在一些情况下,组织中存在的组织特异性多核苷酸比在血液中存在的组织特异性多核苷酸至少高五倍。在一些情况下,组织中存在的组织特异性多核苷酸比在血液中存在的组织特异性多核苷酸至少高十倍。
在一些情况下,组织中存在的组织特异性多核苷酸比在受试者的任何其他组织中存在的组织特异性多核苷酸至少高三倍。在一些情况下,组织中存在的组织特异性多核苷酸比任何其他组织中存在的组织特异性多核苷酸至少高五倍。在一些情况下,组织中存在的组织特异性多核苷酸比任何其他组织中存在的组织特异性多核苷酸至少高十倍。在一些情况下,不超过两个组织中存在的组织特异性多核苷酸比任何其他组织中存在的组织特异性多核苷酸至少高三倍。在一些情况下,不超过两个组织中存在的组织特异性多核苷酸比任何其他组织中存在的组织特异性多核苷酸至少高五倍。在一些情况下,不超过两个组织中存在的组织特异性多核苷酸比任何其他组织中存在的组织特异性多核苷酸至少高十倍。在一些情况下,不超过三个组织中存在的组织特异性多核苷酸比任何其他组织中存在的组织特异性多核苷酸至少高三倍。在一些情况下,不超过三个组织中存在的组织特异性多核苷酸比任何其他组织中存在的组织特异性多核苷酸至少高五倍。在一些情况下,不超过三个组织中存在的组织特异性多核苷酸比任何其他组织中存在的组织特异性多核苷酸至少高十倍。
在一些情况下,组织特异性多核苷酸对靶细胞类型具有特异性。在一些情况下,靶细胞类型中存在的组织特异性多核苷酸比非靶细胞类型中存在的组织特异性多核苷酸至少高三倍。在一些情况下,靶细胞类型中存在的组织特异性多核苷酸比非靶细胞类型中存在的组织特异性多核苷酸至少高五倍。在一些情况下,靶细胞类型中存在的组织特异性多核苷酸比非靶细胞类型中存在的组织特异性多核苷酸至少高十倍。在一些情况下,不超过两种靶细胞类型中存在的组织特异性多核苷酸比非靶细胞类型中存在的组织特异性多核苷酸至少高三倍。在一些情况下,不超过两种靶细胞类型中存在的组织特异性多核苷酸比非靶细胞类型中存在的组织特异性多核苷酸至少高五倍。在一些情况下,不超过两种靶细胞类型中的RNA表达比非靶细胞类型中的RNA表达至少高十倍。在一些情况下,不超过三种靶细胞类型中存在的组织特异性多核苷酸比非靶细胞类型中存在的组织特异性多核苷酸至少高三倍。在一些情况下,不超过三种靶细胞类型中存在的组织特异性多核苷酸比非靶细胞类型中存在的组织特异性多核苷酸至少高五倍。在一些情况下,不超过三种靶细胞类型中存在的组织特异性多核苷酸比非靶细胞类型中存在的组织特异性多核苷酸至少高十倍。
如本文所用,除非另外说明,否则术语“分离”、“纯化”、“去除”、“捕获”和“隔开”都可以互换使用。
如本文所用,术语“临床”、“临床环境”、“实验室”或“实验室环境”是指医院、诊所、药房、研究机构、病理实验室、或者其他在该处聘请经训练的人员以处理和/或分析生物和/或环境样品的商业环境。这些术语与照护点(point of care)、远程位置、家庭、学校以及其他非商业、非机构的环境形成对比。
如本文所用,术语“约”一个数字是指该数字加上或减去该数字的10%。在范围的上下文中使用术语“约”是指该范围的最低值减去10%并且最大值加上10%。
如本文所用,除非上下文另有明确指示,否则单数形式“一个”、“一种”和“该”包括复数指代物。例如,术语“样品”包括多个样品,包括其混合物。
术语“准确度”应根据说明书给予其最广泛的定义。然而,术语“准确度”可以用来指二进制分类测试鉴定或排除一个条件的正确程度的统计量度。如本文所用,术语“准确度”也可以指所有被检测样品中真实结果(真实阳性和真实阴性)的比例。如本文所用,术语“准确度”可包括“Rand准确度”或由“Rand指数”确定的准确度。
如本文所用,术语“同源的”、“同源性”或“同源性百分比”描述了第一氨基酸序列或核酸序列相对于第二氨基酸序列或核酸序列的序列相似性。在一些情况下,可以使用Karlin和Altschul(Proc.Natl.Acad.Sci.USA 87:2264-2268,1990,如在Proc.Natl.Acad.Sci.USA 90:5873-5877,1993中修改)描述的公式确定同源性。这样的公式被并入Altschul等人的基本局部比对搜索工具(BLAST)程序中(J.Mol.Biol.215:403-410,1990)。序列的同源性百分比可以使用截至本申请提交日期的最新版本的BLAST确定。在一些情况下,当两个或更多个序列在比较窗口或指定区域比较或比对最大对应时,如使用以下序列比较算法之一或通过手动比对和目视检查所测量的,如果它们共享至少20%、25%、30%、35%、40%、45%、50%、55%、60%的同一性、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性,则它们可以是同源的。在一些情况下,如果两个或更多个序列共享至多20%、25%、30%、35%、40%、45%、50%、55%、60%的同一性、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性,则它们可以是同源的。优选地,%同一性或同源性存在于长度为至少16个氨基酸或核苷酸的区域上,或在一些情况下,%同一性或同源性存在于长度为约50至约100个氨基酸或核苷酸的区域上。在一些情况下,%同一性或同源性存在于长度为约100至约1000个氨基酸或核苷酸的区域上。在一些情况下,两个或更多个序列可以是同源的,并且在序列中的至少100个氨基酸上共享至少20%的同一性。为了进行序列比较,通常一个序列用作参考序列,测试序列可以与之进行比较。当使用序列比较算法时,可以将测试序列和参考序列输入计算机,必要时可以指定后续坐标,并可以指定序列算法程序参数。可以使用任何合适的算法,包括但不限于Smith-Waterman比对算法、维特比(Viterbi)、贝叶斯(Bayesians)、隐马尔可夫(Hidden Markov)等。可以使用默认程序参数,也可以指定替代参数。然后,基于程序参数,可以使用序列比较算法计算测试序列相对于参考序列的序列同一性百分比。可以使用任何合适的算法,由此计算同一性百分比。例如,一些程序将同一性百分比计算为相同残基的比对位置的数目除以比对位置的总数目。如本文所用,“比较窗口”包括对可在10至600个位置的范围内的一段任意数目的连续或非连续位置的引用。在一些情况下,比较窗口可以包含至少10、20、50、100、200、300、400、500或600个位置。在一些情况下,比较窗口可以包含至多10、20、50、100、200、300、400、500或600个位置。在一些情况下,比较窗口可以包含至少50至200个位置,或者至少100至至少150个位置,其中在两个序列最佳比对之后,可以将序列与具有相同数目的连续或非连续位置的参考序列进行比较。用于比较的序列比对方法是本领域公知的。用于比较的序列的最佳比对可以例如通过Smith和Waterman,Adv.Appl.Math.2:482(1981)的局部同源性算法,通过Needleman和Wunsch,J.MoI.Biol.48:443(1970)的同源性比对算法,通过Pearson和Lipman,Proc.Nat’l.Acad.Sci.USA 85:2444(1988)的搜索相似性方法,通过这些算法的计算机实现(Wisconsin遗传软件包,Genetics Computer Group,575Science Dr.,Madison,Wis中的GAP、BESTFIT、FASTA和TFASTA),或者通过手动比对和目视检查(参见例如,CurrentProtocols in Molecular Biology(Ausubel等人编著.1995补编))来进行。在一些情况下,比较窗口可以包含总比对的任何子集,即一级序列中的连续位置、在三级空间中相邻但在一级序列中不连续的位置,或者是比对中1个至所有残基的任何其他子集。
如本文所用,术语高表现度和低表现度通常是指样品与靶核酸的对照表现度之间的差异。表现度可能显著低于对照表现度,因此是低表现的。表现度可能显著超过对照表现度,因此是低表现的。显著性可能是统计上的显著性。确定统计显著性的方法是本领域众所周知的。举非限制性实例而言,使用标准的双尾t检验确定统计显著性(*:p<0.05;**p<0.01)。
如本文所用,术语“云”是指电子数据的共享或可共享存储。云可用于存档电子数据、共享电子数据以及分析电子数据。
在整个申请中,叙述了短语“与染色体相对应的核酸”和“与染色体相对应的序列”。如本文所用,这些短语旨在表达,“与染色体相对应的核酸”由与该染色体中发现的序列相同或同源的核酸序列表示。术语“同源的”在前面的说明书中描述。
如本文所用,“单核苷酸多态性(SNP)”是指相同物种的两个成员的基因组之间可能不同的单核苷酸。术语的使用不应暗示对每个变体出现的频率的任何限制。在一些情况下,SNP是单等位基因,双等位基因,三等位基因或四等位基因。
如本文所用,术语“插入或缺失(indel)”是指在相同物种的两个成员的基因组之间可能不同的核碱基的插入或缺失。在一些情况下,插入或缺失的是单等位基因、双等位基因、三等位基因或四等位基因。在一些情况下、所述插入包括一个核碱基、两个核碱基、三个核碱基、四个核碱基、五个核碱基或更多。
在整个申请中,有染色体位置的叙述。这些位置编号参考基因组构建体hg38(UCSC)和GRCh38(NCBI)。基因组构建体(genome build)在本领域中也可称为参考基因组或参考集合。它可能来自多个受试者。应当理解,有多个可用的参考集合,并且随着时间的推移可以生产更多的参考集合。然而,本领域技术人员将能够确定本文提供的在另一基因组构建体或参考基因组中的相对位置。
具体实施方式
基因测试传统上是在实验室或临床环境中进行的。然而,在基因测试可能有用的许多情况下,进入实验室或诊所无法进行或不切实际。高复杂度的测试如分析循环肿瘤DNA或胎儿DNA测试仍然罕见,这是由于进行此类检测的机会有限(例如,对静脉切开术、时间、所需的设备、距诊所/实验室的距离的要求)以及此类检测的费用(例如,进行静脉切开术、处理毫升样品、样品管和试剂、运输(特别是冷运输)的费用)。因此,期望在需求点(pointof need)(例如,远离实验室和诊所的位置)处可操作的基因测试。用于在需求点(例如,家庭、学校、农场)处操作的基因测试优选是有成本效益的,并且对于未经训练的人员的操作而言是简单的。在需求点处的基因测试优选只需要少量的生物样品。传统上,基因测试需要静脉抽血(静脉切开术)以获得含有足够DNA的血液毫升数以进行分析。然而,静脉切开术在需求点处是不切实际的。理想地,基因测试仅需要通过提取毛细血管血液,例如通过经皮穿刺设备而获得的血量。这意味着需要设计用于基因测试的需求点设备和方法,以在样品的输入超低且打算进行检测的靶分子丰度较低时发挥作用。
遗传测试传统上也需要经皮穿刺。然而,不管样品体积如何,经皮穿刺可能对受试者造成不便,不适以及在一些情况下的疼痛。因此,无需经皮穿刺的基因检测设备是所需要的。
除了适应样品的超低输入之外,还期望基因测试能够分析循环无细胞核酸(DNA和RNA),例如,循环无细胞胎儿DNA、循环肿瘤DNA、来自移植的供体器官的循环DNA、以及作为健康相关问题、疾病进展或治疗响应的一部分从特定组织释放的循环DNA。然而,由于循环无细胞核酸较短的半衰期和随之而来的较低丰度,对循环无细胞核酸的分析具有挑战性。此外,如果没有注意样品以避免白细胞裂解,白细胞释放的DNA可能稀释血液中的循环无细胞核酸。白细胞DNA在检测循环无细胞核酸的过程中产生背景噪音,这降低了测定的灵敏度和特异性。
本文公开的设备、系统、试剂盒和方法通过将对小样品体积(例如,小于1ml)的温和且有效的处理与独特的靶区域选择和测定设计相结合来克服这些挑战,该测定设计利用了循环无细胞DNA(cfDNA)的高度片段化性质。例如,本文公开的设备、系统、试剂盒和方法可从单次手指针刺提供可靠的遗传信息。在一些实施方案中,在毛细血管血液的初始灌注被丢弃后,可靠的遗传信息从单次手指针刺获得。在其他实施方案中,所述设备、系统、试剂盒和方法提供可靠的遗传信息而不需要经皮穿刺,由于例如裂解皮肤的紧密连接处使得可以从皮肤中提取包含可靠遗传信息的液体而不需要经皮穿刺。
本文公开的设备、系统、试剂盒和方法提供了沿靶基因的多个靶区域的分析,该靶区域间隔足够远以使得当靶基因在循环中片段化时,靶区域可以在物理上分离。因此,对于在基因测试中传统分析的单个长DNA片段存在上述统计采样的限制,而对于cfDNA片段,采样统计的变化是有利的。尽管在毛细血管血液样品中可能总共仅存在1个基因组当量,但仍有许多个体的cfDNA片段。因此,可以从超低输入量实现灵敏的扩增。
作为实例,如果沿基因组区域存在二十个靶区域,并且它们间隔开足够远,使得它们在区域被片段化时可以被独立地分析和检测,则在所有样品的99%中至少有1个靶区域所需的输入体积从140μl变为25μl,显著提高了灵敏度。在一些情况下,靶区域含有相同序列或相似序列。这些靶区域可以被称为拷贝。
在其他情况下,靶区域可以不共享相似的序列,但共享另一特性如相似的表观遗传状态。例如,靶区域可以具有不同的序列,然而它们都被过度甲基化。无论区域之间相似性的依据如何,它们都被适当间隔开,以利用循环无细胞DNA的片段化模式,该片段化模式产生许多循环cfDNA片段,其中至少一个片段可以在小体积中被检测到。举非限制性实例而言,可以用亚硫酸氢盐测序检测选择的靶区域,该靶区域彼此足够远以位于分开的cfDNA片段上,并且在受试者患有癌症时全部被过度甲基化。在小样品体积(例如,手指针刺血液)中,存在所有这些片段(等同于未片段化的DNA)的可能性较低,然而存在至少一个片段的可能性较高,并且可以检测到癌症。
在其他情况下,靶区域可以不含相似的序列,并且可以不含相似的表观遗传状态。在这种情况下,检测可能需要多个引物组或文库制备,然后用通用引物扩增以检测几个不同的靶区域。举非限制性实例而言,通过使用多组引物检测无细胞胎儿DNA片段中RHD基因的多个不同外显子,可以实现从手指针刺量的血液检测RHD阴性妊娠女性体内的胎儿RHD基因。通过选择能扩增在RHD基因中物理上较远并因此可能存在于不同的无细胞DNA片段上的区域的引物可以提高灵敏度。检测RHD阴性妊娠女性中的胎儿RHD基因对防止母亲对孩子血液具有抗体而导致的新生儿溶血性疾病很重要。目前,RHD测试现今由全血抽取(八毫升血液)进行,以实现适当的可靠结果。该体积被认为是实现可靠结果所必需的,因为其基于整个RHD基因将存在于样品中的可能性。基于该假设,在手指针刺量的血液中获取完整的RHD基因的可能性很低,并且将容易导致假阴性结果。
无论如何选择靶区域,当对无细胞片段化DNA执行扩增或检测时,这些区域作为单独的生物标志物存在于样品中。含有靶区域的片段的浓度大于相应的未片段化DNA或无法成组测定的片段的浓度。因此,相比于将从未片段化DNA或从测定靶区域的一个拷贝获得的信号,将会有更多来自靶区域的信号。相比于未重复或与另一区域不共享一些共性的非靶区域,靶区域的存在更有可能在超低体积的样品中检测到。通过测定多个DNA片段中的多个靶区域,测定灵敏度相对于传统测试得以提高。血液是无细胞核酸的可靠来源。本文公开的用于分析来自血液的无细胞核酸的方法涉及分离含有无细胞核酸的血浆或血清组分。本文公开的设备、系统、试剂盒和方法允许在需求点处温和处理血液样品。这可以避免、防止或减少白细胞裂解。本文公开的设备、系统、试剂盒和方法允许在需求点处快速处理血液样品。在一些实施方案中,本文公开的设备、系统、试剂盒和方法还允许仅在丢弃血液的初始灌注之后,在经皮穿刺(例如,手指针刺)后获得血液样品,从而去除由经皮穿刺引起的损伤白细胞(如果有的话)。在其他实施方案中,方法,设备和系统允许裂解皮肤中的紧密连接处,使得能够从皮肤提取包含与毛细血管血液中相同的无细胞核酸的液体,而不需要经皮穿刺。这些方法,系统和设备可以避免,防止或减少白细胞裂解。在一些实施方案中,本文公开的设备、系统、试剂盒和方法还使得从受试者获得的生物样品能够通过以下方法收集:(a)诱导第一次经皮穿刺以产生第一部分生物样品;(b)丢弃所述第一部分生物样品;和(c)收集第二部分生物样品,从而减少或消除由于白细胞裂解造成的生物样品的污染。在一些实施方案中,本文提供了在从受试者获得生物样品之前清洁经皮穿刺部位(例如,皮肤)的表面。在一些情况下,所述清洁包括去除或减少不需要的污染物。在一些情况下,所述不需要的污染物包括来自经皮穿刺部位的DNA。在一些情况下,所述经皮穿刺部位是手指的皮肤。
本文公开的设备、系统、试剂盒和方法允许在需求点处快速处理血液样品。这避免了可能导致血细胞裂解的样品的延长的储存和装运。在一些情况下,本文公开的设备执行集成分离,例如,通过过滤立即分离血浆,以避免、减少或防止细胞裂解。当试剂(例如,探针、引物、抗体)或检测方法不提供太多特异性时,可能期望立即将细胞与cfDNA分离。在一些情况下,用全血执行方法以避免任何白细胞裂解。当可以实现相对较高的特异性时,从全血进行分析可能更为理想。
除了仅需要较小体积的样品之外,本文公开的设备、系统、试剂盒和方法出于至少以下原因是高度期望的。本文公开的设备、系统、试剂盒和方法通常只需要很少或不需要技术训练。因此,相对于由经训练的人员执行的测试成本,执行基因测试的成本降低,并且该测试可用于无法接触经训练人员的受试者。此外,可以在几分钟(例如,小于一小时)内获得结果。这在测试感染时可能尤其重要。可以快速隔离和治疗对感染测试呈阳性的个体或动物,以防止感染扩散。此外,可以私下获得结果。在一些情况下,只有接受检测的患者才能获知所获得的遗传信息。本文公开的设备、系统和试剂盒通常是轻量级的和手持式的,使它们适合并可用于远程位置。因此,它们可以在家里、学校、工作场所、战场上、农场上或任何其他无法或不便于访问实验室或临床环境的地点使用。此外,由于样品可以在照护点处进行分析,因此不需要存储或装运样品,降低了样品降解和错误识别(例如,样品调换)的风险。
图1示出了具有本文公开的方法、设备和系统可以遵循的各种路线的总体流程图。最初,在步骤110中获得样品。必须获得达最少量的样品以从样品收集有用的信息。所述样品可以通过经皮穿刺获得。所述样品可以通过提取有用的遗传信息的方式获得,而不需要经皮穿刺,诸如本文所述的那些方式。样品可以是本文公开的生物样品。样品可以是原始的、未加工的样品(例如,全血、组织间液)。样品可以是经处理的样品(例如,血浆)。样品量可能基于样品类型。通常,在步骤120中,处理样品或从样品纯化分析物(例如,核酸或其他生物标志物),以产生可以被扩增和/或检测的分析物。处理可以包括过滤样品、结合含有分析物的样品的组分、结合分析物、稳定分析物、纯化分析物或其组合。样品组分的非限制性实例是细胞、病毒颗粒、细菌颗粒、外来体和核小体。在一些情况下,分析物是核酸,并且在步骤130中将其扩增以产生扩增子以供分析。在其他情况下,分析物可以是或可以不是核酸,但无论如何都不被扩增。在进行检测和分析之前,可选地对分析物或扩增子进行修饰(140)。在一些情况下,修饰在扩增期间发生(未示出)。例如,分析物或扩增子可以被加上标签或标记。检测可以涉及测序、靶特异性探针、等温扩增和检测方法、定量PCR或单分子检测。提供图1作为本文公开的设备和方法的宽泛概述,但本文公开的设备和方法不受图1的限制。设备和方法可以分别包含在图1中未示出的附加组件和步骤。
在一些情况下,本文公开的设备、系统、试剂盒和方法是期望的,因为遗传信息可以为用户保密。实际上,甚至设备的使用也可以保密。备选地,设备、系统、试剂盒和方法被配置为与他方共享信息,或者可以被用户容易地调整以共享信息(例如,打开蓝牙信号)。例如,信息可以容易地与护士或医生共享。在一些情况下,设备或系统可以通过安全门户或应用编程接口(API)向办公室或医院处的医疗从业者或工作人员发送/共享测试结果。在一些情况下,用户可以选择在接收结果后亲自与医疗从业者共享信息。在一些情况下,信息甚至可以实时共享。这种通信对于例如因军事任务、就业义务、移民政策或健康问题而分离的夫妇或家庭而言是期望的。
本文公开的设备、系统、试剂盒和方法有许多应用。本文公开的设备、系统、试剂盒和方法允许诊断和监测医疗状况。医疗状况的非限制性实例包括自身免疫性病况、代谢性病况、癌症和神经性病况。本文公开的设备、系统、试剂盒和方法允许个性化用药,包括微生物组测试、确定适当的个人医疗剂量以及/或者检测对药物或其剂量的反应。本文公开的设备、系统、试剂盒和方法提供对病原体的感染和/或受试者对可用于治疗感染的药物的耐药性的检测。在几乎所有情况下,很少需要或不需要技术训练或者大型、昂贵的实验室仪器。
图1示出了使用本文公开的设备、系统、试剂盒或方法的个体可以以来自受试者的微体积(例如,小于毫升)的生物样品开始。生物样品通常包含少于5000个基因组当量的无细胞DNA。样品可以通过过滤、稳定、纯化或其组合进行处理,以允许进行分析。在一些情况下,样品不需要处理,例如过滤、稳定或纯化。样品中有几种不同分析物可以提供信息,例如无细胞DNA、无细胞RNA、微泡相关核酸以及无细胞DNA上的表观遗传标志物。可以分析这些分析物中的一种或多种。在一些情况下,分析物不会被扩增。在一些情况下,无需对分析物进行扩增或修饰即可对分析物进行测序。在一些情况下,分析物被扩增(例如,聚合酶介导的核酸扩增)以产生分析物的扩增子。在一些情况下,对扩增子进行测序。在一些情况下,无需进一步制备或修饰即可对扩增子进行测序。在一些情况下,将扩增子或靶区域内的诸如多态性、突变、表观遗传标记或畸变等特征用于进一步分析。
在一些情况下,通过用标记、条形码或标签来标记分析物,将分析物、扩增子或其组合转化为文库。除非另有说明,术语标记、条形码和标签在本文可互换使用。在一些情况下,对文库成员进行扩增以产生扩增的文库成员。在一些情况下,对文库成员进行全基因组扩增。在一些情况下,文库成员是全基因组扩增的产物。在一些情况下,不扩增文库成员以产生扩增的文库成员。在一些情况下,文库成员不进行全基因组扩增。在一些情况下,文库成员不是全基因组扩增的产物。在一些情况下,捕获文库成员以产生捕获的文库成员。在一些情况下,捕获并扩增文库成员以产生捕获的、扩增的文库成员。在一些情况下,对文库成员进行测序。在一些情况下,对扩增的文库成员进行测序。在一些情况下,对捕获的文库成员进行测序。在一些情况下,对捕获的、扩增的文库成员进行测序。在一些情况下,文库成员未进行测序。例如,可以通过探针阵列或通过单分子计数来检测或定量文库成员。在一些情况下,通过探针阵列或通过单分子计数来检测或定量扩增的文库成员。在一些情况下,通过探针阵列或通过单分子计数来检测或定量捕获的文库成员。在一些情况下,通过探针阵列或通过单分子计数来检测或定量捕获的、扩增的文库成员。
图2示出了本文公开的方法、系统、设备和试剂盒可以分布在多个位置。例如,本文公开的方法可以完全在家庭环境或其他需求点执行。这对于不能(例如,在物理上、经济上)访问实验室、核酸处理和分析设备、或技术人员或医生的受试者而言尤其重要。在一些情况下,样品可以在实验室(例如,所需的实验室装备)中处理。然而,本文公开的方法、系统、设备和试剂盒仍可以允许在家中收集样品和报告。举例来说,样品可以在家中收集,运送到进行处理的实验室,并且结果通过电子通信被递送到家中的受试者。因此,即使当需要在实验室中进行处理时,本文公开的方法、系统、设备和试剂盒对于用户仍然是方便的,仅要求他们具有运送/运输其样品的手段。在一些情况下,可以方便地在可将测试结果传递到受试者的云或服务器上进行数据处理。在一些情况下,可以方便地在实验室中进行数据处理,并将结果报告给在家中的受试者,而无需依靠云或互联网服务器。
方法
本文提供了包括获得生物样品和检测其组分的方法。在一些情况下,本文公开的方法用本文描述的设备,系统或试剂盒进行。在一些情况下,所述组分包括无细胞核酸,例如无细胞DNA或无细胞RNA。在一些情况下,所述生物样品包括母体血液,诸如从母亲获得的毛细血管血液。在一些情况下,检测的组分是母体血液的无胎儿细胞的DNA组分。
获得生物样品可以在临床或实验室环境中发生,例如,举非限制性实例而言,医疗诊所、医院、科学研究实验室、病理实验室或临床测试实验室。或者,获得可以发生在远离临床或实验室环境的位置,举非限制性实例而言,家庭、计划生育中心、工作场所、学校、农场或战场。在一些情况下,获得是使用本文描述的设备或系统来进行的。
在一些情况下,通过分析生物样品以检测生物样品中组分(例如生物标志物,无细胞DNA)的存在,不存在或水平来进行组分的检测。在一些情况下,方法包括确定相对于至少一个对照受试者中目标基因组区域的表现度,所述组分中目标基因组区域是否存在高表现度或低表现度。
本文公开的方法包括获得和分析相对较小体积的生物样品,而不管收集是在临床环境中还是在远程位置进行。在一些情况下,检测发生在临床或实验室环境中。在其他情况下,检测发生在远离临床或实验室环境的位置。本文公开的方法的其他步骤(例如,扩增核酸)可以发生在临床/实验室环境中或远程位置处。在一些情况下,该方法可以由受试者执行。在一些情况下,本文公开的方法由未接受执行该方法所必需的任何技术训练的用户执行。
获得样品
在一些情况下,本文公开的方法包括获得本文所述的生物样品。可以直接获得样品(例如,医生从受试者收集血液样品)。样品可以间接获得(例如,通过运输,由技术人员从医生或受试者获得)。在一些情况下,生物样品是生物流体。在一些情况下,生物样品是拭子样品(例如,颊拭子、阴道和/或宫颈拭子)。在一些情况下,本文公开的方法包括获得全血、血浆、血清、尿液、唾液、组织液或阴道液。在一些情况下,本文公开的方法包括通过手指针刺获得血液样品。在一些情况下,本文公开的方法包括通过单次手指针刺获得血液样品。在一些情况下,本文公开的方法包括通过不超过单次手指针刺获得血液样品。在一些情况下,所述血液样品仅在血液的初始灌注被丢弃之后,经由手指针刺来获得(例如,手指被针刺,擦除干净初始血液样品,并且收集第二次血液样品)。在一些实施方案中,通过以下方法收集从受试者获得的生物样品:(a)诱导第一次经皮穿刺以产生第一部分生物样品;(b)丢弃所述第一部分生物样品;和(c)收集第二部分生物样品,从而减少或消除由于白细胞裂解造成的生物样品的污染。在一些实施方案中,在从受试者获得生物样品之前清洁经皮穿刺部位(例如皮肤)的表面。在一些情况下,所述清洁包括去除或减少不需要的污染物。在一些情况下,所述不需要的污染物包括来自经皮穿刺部位的DNA。在一些情况下,所述经皮穿刺部位是手指的皮肤。在一些情况下,本文公开的方法包括获得毛细血管血液(例如,从手指或皮肤针刺获得的血液)。在一些情况下,方法包括从针刺压出或挤出血液以获得期望的血液体积。在其他情况下,方法不包括从针刺压出或挤出血液以获得所需的血液体积。尽管手指针刺是获得毛细血管血液的常用方法,但是身体上的其他部位也将是合适的,例如,脚趾、脚后跟、手臂、手掌、肩膀、耳垂。在一些情况下,本文公开的方法包括不经静脉切开术获得血液样品。在一些情况下,本文公开的方法包括获得毛细血管血液。在一些情况下,本文公开的方法包括获得静脉血。在一些情况下,本文公开的方法不包括获得静脉血(例如,从静脉获得的血液)。在一些情况下,方法包括通过活检获得生物样品。在一些情况下,方法包括通过液体活检获得生物流体。
在一些情况下,本文所述的方法,系统和设备包括获得包含可靠遗传信息的生物样品,而不需要经皮穿刺。在一些实施方案中,所述受试者皮肤中的紧密连接处被裂解,使得它们可渗透液体,所述液体可被推入细胞间隙并在毛细血管中被再吸收,并且可以从可渗透的皮肤中提取而无需经皮穿刺。
在一些情况下,方法包括获得具有片段化核酸的样品。样品可能已经经历不利于保留核酸完整性的条件。举非限制性实例而言,样品可以是法医样品。法医样品经常被污染,暴露在空气、热、光等中。样品可能已经冷冻并解冻。样品可能已暴露于降解核酸的化学物质或酶。在一些情况下,方法包括获得组织样品,其中组织样品包含片段化的核酸。在一些情况下,方法包括获得组织样品,其中组织样品包含核酸,以及将核酸片段化以产生片段化的核酸。在一些情况下,组织样品是冷冻样品。在一些情况下,样品是保存的样品。在一些情况下,组织样品是固定样品(例如甲醛固定的)。方法可以包括从样品中分离(片段化的)核酸。方法可以包括在溶液中提供片段化的核酸用于遗传分析。
在一些情况下,本文公开的方法用不超过50μl的生物流体样品进行。在一些情况下,本文公开的方法用不超过75μl的生物流体样品进行。在一些情况下,本文公开的方法用不超过100μl的生物流体样品进行。在一些情况下,本文公开的方法用不超过125μl的生物流体样品进行。在一些情况下,本文公开的方法用不超过150μl的生物流体样品进行。在一些情况下,本文公开的方法用不超过200μl的生物流体样品进行。在一些情况下,本文公开的方法用不超过300μl的生物流体样品进行。在一些情况下,本文公开的方法用不超过400μl的生物流体样品进行。在一些情况下,本文公开的方法用不超过500μl的生物流体样品进行。
在一些情况下,本文公开的方法包括获得超低体积的生物流体样品,其中该超低体积在样品体积的范围内。在一些情况下,样品体积的范围为约5μl至约1毫升。在一些情况下,样品体积的范围为约5μl至约900μl。在一些情况下,样品体积的范围为约5μl至约800μl。在一些情况下,样品体积的范围为约5μl至约700μl。在一些情况下,样品体积的范围为约5μl至约600μl。在一些情况下,样品体积的范围为约5μl至约500μl。在一些情况下,样品体积的范围为约5μl至约400μl。在一些情况下,样品体积的范围为约5μl至约300μl。在一些情况下,样品体积的范围为约5μl至约200μl。在一些情况下,样品体积的范围为约5μl至约150μl。在一些情况下,样品体积的范围为5μl至约100μl。在一些情况下,样品体积的范围为约5μl至约90μl。在一些情况下,样品体积的范围为约5μl至约85μl。在一些情况下,样品体积的范围为约5μl至约80μl。在一些情况下,样品体积的范围为约5μl至约75μl。在一些情况下,样品体积的范围为约5μl至约70μl。在一些情况下,样品体积的范围为约5μl至约65μl。在一些情况下,样品体积的范围为约5μl至约60μl。在一些情况下,样品体积的范围为约5μl至约55μl。在一些情况下,样品体积的范围为约5μl至约50μl。在一些情况下,样品体积的范围为约15μl至约150μl。在一些情况下,样品体积的范围为约15μl至约120μl。在一些情况下,样品体积的范围为15μl至约100μl。在一些情况下,样品体积的范围为约15μl至约90μl。在一些情况下,样品体积的范围为约15μl至约85μl。在一些情况下,样品体积的范围为约15μl至约80μl。在一些情况下,样品体积的范围为约15μl至约75μl。在一些情况下,样品体积的范围为约15μl至约70μl。在一些情况下,样品体积的范围为约15μl至约65μl。在一些情况下,样品体积的范围为约15μl至约60μl。在一些情况下,样品体积的范围为约15μl至约55μl。在一些情况下,样品体积的范围为约15μl至约50μl。
在一些情况下,本文公开的方法包括获得超低体积的生物流体样品,其中超低体积为约100μl至约500μl。在一些情况下,本文公开的方法包括获得超低体积的生物流体样品,其中该超低体积为约100μl至约1000μl。在一些情况下,超低体积为约500μl至约1ml。在一些情况下,超低体积为约500μl至约2ml。在一些情况下,超低体积为约500μl至约3ml。在一些情况下,超低体积为约500μl至约5ml。
在一些情况下,本文公开的方法包括获得超低体积的生物样品,其中生物样品是全血。超低体积可以为约1μl至约250μl。超低体积可以为约5μl至约250μl。超低体积可以为约10μl至约25μl。超低体积可以为约10μl至约35μl。超低体积可以为约10μl至约45μl。超低体积可以为约10μl至约50μl。超低体积可以为约10μl至约60μl。超低体积可以为约10μl至约80μl。超低体积可以为约10μl至约100μl。超低体积可以为约10μl至约120μl。超低体积可以为约10μl至约140μl。超低体积可以为约10μl至约150μl。超低体积可以为约10μl至约160μl。超低体积可以为约10μl至约180μl。超低体积可以为约10μl至约200μl。
在一些情况下,本文公开的方法包括获得超低体积的生物样品,其中生物样品是血浆或血清。超低体积可以为约1μl至约200μl。超低体积可以为约1μl至约190μl。超低体积可以为约1μl至约180μl。超低体积可以为约1μl至约160μl。超低体积可以为约1μl至约150μl。超低体积可以为约1μl至约140μl。超低体积可以为约5μl至约15μl。超低体积可以为约5μl至约25μl。超低体积可以为约5μl至约35μl。超低体积可以为约5μl至约45μl。超低体积可以为约5μl至约50μl。超低体积可以为约5μl至约60μl。超低体积可以为约5μl至约70μl。超低体积可以为约5μl至约80μl。超低体积可以为约5μl至约90μl。超低体积可以为约5μl至约100μl。超低体积可以为约5μl至约125μl。超低体积可以为约5μl至约150μl。超低体积可以为约5μl至约175μl。超低体积可以为约5μl至约200μl。
在一些情况下,本文公开的方法包括获得超低体积的生物样品,其中生物样品是尿液。通常,尿液中DNA的浓度为约40ng/ml至约200ng/ml。在一些情况下,尿液的超低体积约为0.25μl至1毫升。在一些情况下,尿液的超低体积约为0.25μl至约1毫升。在一些情况下,尿液的超低体积至少约为0.25μl。在一些情况下,尿液的超低体积最多约为1毫升。在一些情况下,尿液的超低体积为约0.25μl至约0.5μl、约0.25μl至约0.75μl、约0.25μl至约1μl、约0.25μl至约5μl、约0.25μl至约10μl、约0.25μl至约50μl、约0.25μl至约100μl、约0.25μl至约150μl、约0.25μl至约200μl、约0.25μl至约500μl、约0.25μl至约1毫升、约0.5μl至约0.75μl、约0.5μl至约1μl、约0.5μl至约5μl、约0.5μl至约10μl、约0.5μl至约50μl、约0.5μl至约100μl、约0.5μl至约150μl、约0.5μl至约200μl、约0.5μl至约500μl、约0.5μl至约1毫升、约0.75μl至约1μl、约0.75μl至约5μl、约0.75μl至约10μl、约0.75μl至约50μl、约0.75μl至约100μl、约0.75μl至约150μl、约0.75μl至约200μl、约0.75μl至约500μl、约0.75μl至约1毫升、约1μl至约5μl、约1μl至约10μl、约1μl至约50μl、约1μl至约100μl、约1μl至约150μl、约1μl至约200μl、约1μl至约500μl、约1μl至约1毫升、约5μl至约10μl、约5μl至约50μl、约5μl至约100μl、约5μl至约150μl、约5μl至约200μl、约5μl至约500μl、约5μl至约1毫升、约10μl至约50μl、约10μl至约100μl、约10μl至约150μl、约10μl至约200μl、约10μl至约500μl、约10μl至约1毫升、约50μl至约100μl、约50μl至约150μl、约50μl至约200μl、约50μl至约500μl、约50μl至约1毫升、约100μl至约150μl、约100μl至约200μl、约100μl至约500μl、约100μl至约1毫升、约150μl至约200μl、约150μl至约500μl、约150μl至约1毫升、约200μl至约500μl、约200μl至约1毫升或约500μl至约1毫升。在一些情况下,所用尿液的体积为约0.25μl、约0.5μl、约0.75μl、约1μl、约5μl、约10μl、约50μl、约100μl、约150μl、约200μl、约500μl或约1毫升。
在一些情况下,本文公开的方法包括获得至少约5μl的血液从而以至少约90%的置信度或准确度提供测试结果。在一些情况下,本文公开的方法包括获得至少约10μl的血液从而以至少约90%的置信度或准确度提供测试结果。在一些情况下,本文公开的方法包括获得至少约15μl的血液从而以至少约90%的置信度或准确度提供测试结果。在一些情况下,本文公开的方法包括获得至少约20μl的血液从而以至少约90%的置信度或准确度提供测试结果。在一些情况下,本文公开的方法包括获得至少约20μl的血液从而以至少约90%的置信度或准确度提供测试结果。在一些情况下,本文公开的方法包括获得至少约20μl的血液从而以至少约95%的置信度或准确度提供测试结果。在一些情况下,本文公开的方法包括获得至少约20μl的血液从而以至少约98%的置信度或准确度提供测试结果。在一些情况下,本文公开的方法包括获得至少约20μl的血液从而以至少约99%的置信度或准确度提供测试结果。在一些情况下,本文公开的方法包括仅获得约20μL至约120μL的血液从而以至少约90%的置信度或准确度提供测试结果。在一些情况下,本文公开的方法包括仅获得约20μL至约120μL的血液从而以至少约95%的置信度或准确度提供测试结果。在一些情况下,本文公开的方法包括仅获得约20μL至约120μL的血液从而以至少约97%的置信度或准确度提供测试结果。在一些情况下,本文公开的方法包括仅获得约20μL至约120μL的血液从而以至少约98%的置信度或准确度提供测试结果。在一些情况下,本文公开的方法包括仅获得约20μL至约120μL的血液从而以至少约99%的置信度或准确度提供测试结果。在一些情况下,本文公开的方法包括仅获得约20μL至约120μL的血液从而以至少约99.5%的置信度或准确度提供测试结果。
在一些情况下,生物流体样品是血浆或血清。血浆或血清约占全血的55%。在一些情况下,本文公开的方法包括获得至少约10μl的血浆或血清从而以至少约90%的置信度或准确度提供测试结果。在一些情况下,本文公开的方法包括获得至少约10μl的血浆或血清从而以至少约98%的置信度或准确度提供测试结果。在一些情况下,本文公开的方法包括获得至少约12μl的血浆或血清从而以至少约90%的置信度或准确度提供测试结果。在一些情况下,本文公开的方法包括获得至少约12μl的血浆或血清从而以至少约95%的置信度或准确度提供测试结果。在一些情况下,本文公开的方法包括获得至少约12μl的血浆或血清从而以至少约98%的置信度或准确度提供测试结果。在一些情况下,本文公开的方法包括获得至少约12μl的血浆或血清从而以至少约99%的置信度或准确度提供测试结果。在一些情况下,本文公开的方法包括仅获得约10μL至约60μL的血浆或血清从而以至少约90%的置信度或准确度提供测试结果。在一些情况下,本文公开的方法包括仅获得约10μL至约60μL的血浆或血清从而以至少约95%的置信度或准确度提供测试结果。在一些情况下,本文公开的方法包括仅获得约10μL至约60μL的血浆或血清从而以至少约97%的置信度或准确度提供测试结果。在一些情况下,本文公开的方法包括仅获得约10μL至约60μL的血浆或血清从而以至少约98%的置信度或准确度提供测试结果。在一些情况下,v仅约10μL至约60μL的血浆或血清从而以至少约99%的置信度或准确度提供测试结果。在一些情况下,本文公开的方法包括仅获得约10μL至约60μL的血浆或血清从而以至少约99.5%的置信度或准确度提供测试结果。
在一些情况下,本文公开的方法包括从受试者获得生物样品,其中生物样品含有一定量的无细胞核酸分子。在一些情况下,获得生物样品导致破坏或裂解生物样品中的细胞。因此,在一些情况下,生物样品包含细胞核酸分子。在一些情况下,细胞核酸分子占生物样品中总细胞核酸分子的少于约1%。在一些情况下,细胞核酸分子占生物样品中总细胞核酸分子的少于约5%。在一些情况下,细胞核酸分子占生物样品中总细胞核酸分子的少于约10%。在一些情况下,细胞核酸分子占生物样品中总细胞核酸分子的少于约20%。在一些情况下,细胞核酸分子占生物样品中总细胞核酸分子的超过约50%。在一些情况下,细胞核酸分子占生物样品中总细胞核酸分子的少于约90%。
在一些情况下,本文公开的方法包括从受试者获得超低体积的生物流体样品,其中生物流体样品包含超低量的无细胞核酸。在一些情况下,超低量在约4pg至约100pg之间。在一些情况下,超低量在约4pg至约150pg之间。在一些情况下,超低量在约4pg至约200pg之间。在一些情况下,超低量在约4pg至约300pg之间。在一些情况下,超低量在约4pg至约400pg之间。在一些情况下,超低量在约4pg至约500pg之间。在一些情况下,超低量在约4pg至约1ng之间。在一些情况下,超低量在约10pg至约100pg之间。在一些情况下,超低量在约10pg至约150pg之间。在一些情况下,超低量在约10pg至约200pg之间。在一些情况下,超低量在约10pg至约300pg之间。在一些情况下,超低量在约10pg至约400pg之间。在一些情况下,超低量在约10pg至约500pg之间。在一些情况下,超低量在约10pg至约1ng之间。在一些情况下,超低量在约20pg至约100pg之间。在一些情况下,超低量在约20pg至约200pg之间。在一些情况下,超低量在约20pg至约500pg之间。在一些情况下,超低量在约20pg至约1ng之间。在一些情况下,超低量在约30pg至约150pg之间。在一些情况下,超低量在约30pg至约180pg之间。在一些情况下,超低量在约30pg至约200pg之间。在一些情况下,超低量在约30pg至约300pg之间。在一些情况下,超低量在约30pg至约400pg之间。在一些情况下,超低量在约30pg至约500pg之间。在一些情况下,超低量在约30pg至约1ng之间。在一些情况下,受试者是妊娠受试者,并且无细胞核酸包括无细胞胎儿DNA。在一些情况下,受试者患有肿瘤,并且无细胞核酸包括无细胞肿瘤DNA。在一些情况下,受试者是器官移植接受者,并且无细胞核酸包括器官供体DNA。
在一些情况下,方法包括获得少于约1ng的无细胞胎儿核酸。在一些情况下,方法包括获得少于约500pg的无细胞胎儿核酸。在一些情况下,方法包括获得少于约100pg的无细胞胎儿核酸。在一些情况下,方法包括获得至少3.5pg的无细胞胎儿核酸。在一些情况下,方法包括获得至少10pg的无细胞胎儿核酸。在一些情况下,方法包括获得不超过约100pg的无细胞胎儿核酸。在一些情况下,方法包括获得不超过约500pg的无细胞胎儿核酸。在一些情况下,方法包括获得不超过约1ng的无细胞胎儿核酸。
在一些情况下,本文公开的方法包括从受试者获得生物流体样品,其中生物流体样品包含至少1个基因组当量的无细胞DNA。本领域技术人员理解,基因组当量是样品中需要存在以保证所有基因都将存在的DNA量。本文公开的超低体积的生物流体样品可以包含超低数目的基因组当量。在一些情况下,生物流体样品包含少于1个基因组当量的无细胞核酸。在一些情况下,生物流体样品包含至少5个基因组当量的无细胞核酸。在一些情况下,生物流体样品包含至少10个基因组当量的无细胞核酸。在一些情况下,生物流体样品包含至少15个基因组当量的无细胞核酸。在一些情况下,生物流体样品包含至少20个基因组当量的无细胞核酸。在一些情况下,生物流体样品包含约5至约50个基因组当量。在一些情况下,生物流体样品包含约10至约50个基因组当量。在一些情况下,生物流体样品包含约10至约100个基因组当量。在一些情况下,生物流体样品包含不超过50个基因组当量的无细胞核酸。在一些情况下,生物流体样品包含不超过60个基因组当量的无细胞核酸。在一些情况下,生物流体样品包含不超过80个基因组当量的无细胞核酸。在一些情况下,生物流体样品包含不超过100个基因组当量的无细胞核酸。
本文公开的超低体积的生物流体样品可以包含超低数目的细胞当量。在一些情况下,本文公开的方法包括从受试者获得生物流体样品,其中生物流体样品包含至少1个细胞当量的无细胞DNA。在一些情况下,生物流体样品包含至少2个细胞当量的无细胞核酸。在一些情况下,生物流体样品包含至少5个细胞当量的无细胞核酸。在一些情况下,生物流体样品包含约5个细胞当量至约40个细胞当量的无细胞核酸。在一些情况下,生物流体样品包含至少5个细胞当量至约100个细胞当量的无细胞核酸。在一些情况下,生物流体样品包含不超过30个细胞当量的无细胞核酸。在一些情况下,生物流体样品包含不超过50个细胞当量的无细胞核酸。在一些情况下,生物流体样品包含不超过80个细胞当量的无细胞核酸。在一些情况下,生物流体样品包含不超过100个细胞当量的无细胞核酸。
在一些情况下,本文公开的方法包括从受试者获得生物样品,其中生物样品包含至少一种感兴趣的无细胞核酸。举非限制性实例而言,感兴趣的无细胞核酸可以是无细胞胎儿核酸、无细胞肿瘤DNA或来自移植器官的DNA。在一些情况下,本文公开的方法包括从受试者获得生物样品,其中生物样品包含约1至约5种无细胞核酸。在一些情况下,本文公开的方法包括从受试者获得生物样品,其中生物样品包含约1至约15种无细胞核酸。在一些情况下,本文公开的方法包括从受试者获得生物样品,其中生物样品包含约1至约25种无细胞核酸。在一些情况下,本文公开的方法包括从受试者获得生物样品,其中生物样品包含约1至约100种无细胞核酸。在一些情况下,本文公开的方法包括从受试者获得生物样品,其中生物样品包含约5至约100种无细胞核酸。在一些情况下,至少一种无细胞核酸由对于本文公开的靶染色体独特的序列表示。
在一些情况下,本文公开的方法包括从受试者获得生物样品,其中生物样品包含约102个无细胞核酸至约1010个无细胞核酸。在一些情况下,生物样品包含约102个无细胞核酸至约109个无细胞核酸。在一些情况下,生物样品包含约102个无细胞核酸至约108个无细胞核酸。在一些情况下,生物样品包含约102个无细胞核酸至约107个无细胞核酸。在一些情况下,生物样品包含约102个无细胞核酸至约106个无细胞核酸。在一些情况下,生物样品包含约102个无细胞核酸至约105个无细胞核酸。
在一些情况下,本文公开的方法包括从受试者获得生物样品,其中生物样品包含约103个无细胞核酸至约1010个无细胞核酸。在一些情况下,生物样品包含约103个无细胞核酸至约109个无细胞核酸。在一些情况下,生物样品包含约103个无细胞核酸至约108个无细胞核酸。在一些情况下,生物样品包含约103个无细胞核酸至约107个无细胞核酸。在一些情况下,生物样品包含约103个无细胞核酸至约106个无细胞核酸。在一些情况下,生物样品包含约103个无细胞核酸至约105个无细胞核酸。
在一些情况下,本文公开的方法包括从受试者获得生物样品,其中生物样品具有对应于典型样品类型体积的许多无细胞核酸。举非限制性实例而言,来自妊娠受试者的4ml人血液通常包含约1010个无细胞胎儿核酸。但是,样品中无细胞胎儿核酸的浓度以及因此提供有关胎儿遗传学的信息所需的样品体积将取决于样品类型。本文提供的实施例7还证明了本领域技术人员如何可以确定获得足够数目的无细胞胎儿核酸所需的最小体积。
样品处理
在一些情况下,本文公开的方法包括从生物样品分离或纯化无细胞核酸分子。在一些情况下,本文公开的方法包括从生物样品分离或纯化核无细胞胎儿核酸分子。在一些情况下,本文公开的方法包括从本文所述的生物样品去除非核酸组分。
在一些情况下,分离或纯化包括从生物样品中减少或除去不需要的非核酸组分。在一些情况下,分离或纯化包括从生物样品去除至少5%、至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%或至少90%的不需要的非核酸组分。在一些情况下,分离或纯化包括从生物样品去除至少95%的不需要的非核酸组分。在一些情况下,分离或纯化包括从生物样品去除至少97%的不需要的非核酸组分。在一些情况下,分离或纯化包括从生物样品去除至少98%的不需要的非核酸组分。在一些情况下,分离或纯化包括从生物样品去除至少99%的不需要的非核酸组分。在一些情况下,分离或纯化包括从生物样品去除至少95%的不需要的非核酸组分。在一些情况下,分离或纯化包括从生物样品去除至少97%的不需要的非核酸组分。在一些情况下,分离或纯化包括从生物样品去除至少98%的不需要的非核酸组分。在一些情况下,分离或纯化包括从生物样品去除至少99%的不需要的非核酸组分。
在一些情况下,本文公开的方法包括从生物样品的一种或多种非核酸组分分离或纯化核酸。非核酸组分也可以被认为是不需要的物质。非核酸组分的非限制性实例包括细胞(例如,血细胞)、细胞片段、细胞外囊泡、脂质、蛋白质或其组合。另外的非核酸组分在此处和全文中描述。应当注意,尽管方法可以包括分离/纯化核酸,但它们也可以包括分析样品的在核酸纯化步骤中被认为是不需要的物质的非核酸组分。分离或纯化可以包括去除将会抑制、干扰或以其他方式对诸如核酸扩增或检测等后续处理步骤有害的生物样品的组分。
分离或纯化可以用本文公开的设备或系统进行。分离或纯化可以在本文公开的设备或系统内进行。分离和/或纯化可以通过使用本文公开的样品纯化器进行。在一些情况下,分离或纯化核酸包括从本文所述的生物样品去除非核酸组分。在一些情况下,分离或纯化核酸包括从生物样品丢弃非核酸组分。在一些情况下,分离或纯化包括收集、处理和分析非核酸组分。在一些情况下,非核酸组分可以被认为是生物标志物,因为它们提供了有关受试者的附加信息。
在一些情况下,分离或纯化核酸包括裂解细胞。在一些情况下,分离或纯化核酸避免细胞裂解。在一些情况下,分离或纯化核酸不包括裂解细胞。在一些情况下,分离或纯化核酸不包括旨在裂解细胞的主动步骤。在一些情况下,分离或纯化核酸不包括有意裂解细胞。有意裂解细胞可以包括机械破坏细胞膜(例如,剪切)。有意裂解细胞可以包括使细胞与裂解试剂接触。本文描述了示例性裂解试剂。
在一些情况下,分离或纯化核酸包括在溶液中裂解并用“诱饵”执行靶核酸的序列特异性捕获,然后将“诱饵”结合至固体支持物如磁珠,例如,Legler等人,Specificmagnetic bead-based capture of free fetal DNA from maternal plasma,Transfusion and Apheresis Science 40(2009),153-157。在一些情况下,方法包括在重组酶或解旋酶存在下执行序列特异性捕获。重组酶或解旋酶的使用可以避免核酸热变性的需要,并且加快检测步骤。
在一些情况下,分离或纯化包括分离本文公开的生物样品的组分。举非限制性实例而言,分离或纯化可以包括从血液分离血浆。在一些情况下,分离或纯化包括离心生物样品。在一些情况下,分离或纯化包括过滤生物样品,以分离生物样品的组分。在一些情况下,分离或纯化包括过滤生物样品,以从生物样品去除非核酸组分。在一些情况下,分离或纯化包括过滤生物样品,以从生物样品捕获核酸。
在一些情况下,生物样品是血液,并且分离或纯化核酸包括从血液获得或分离血浆。获得血浆可以包括从血液样品的细胞组分分离血浆。获得血浆可以包括离心血液、过滤血液或其组合。获得血浆可以包括使血液经受重力(例如,沉降)。获得血浆可以包括使血液经历从血液的非核酸组分芯吸走血液的一部分的材料。在一些情况下,方法包括使血液经历垂直过滤。在一些情况下,方法包括使血液经历样品纯化器,该纯化器包含用于接收全血的过滤基质,该过滤基质具有阻止细胞通过的孔径,而血浆可以不受约束地通过该过滤基质。针对本文公开的设备描述了这样的垂直过滤和过滤基质。
在一些情况下,分离或纯化包括使生物样品或其部分或其修饰形式经历结合部分。结合部分可以能够结合生物样品的组分并将其去除以产生修饰的样品,该样品去除了不需要或不感兴趣的细胞、细胞片段、核酸或蛋白质。在一些情况下,分离或纯化包括使生物样品经历结合部分,以减少生物样品不需要的物质或非核酸组分。在一些情况下,分离或纯化包括使生物样品经历结合部分,以产生富集了靶细胞、靶细胞片段、靶核酸或靶蛋白质的修饰的样品。举非限制性实例而言,分离或纯化可以包括使生物样品经历用于捕获胎盘培养的血小板的结合部分,该血小板可以含有胎儿DNA或RNA片段。所得的细胞结合的结合部分可以用抗体或其他方法捕获/富集,例如,低速离心。
分离或纯化可以包括用结合部分捕获生物样品中的细胞外囊泡或细胞外微粒。在一些情况下,细胞外囊泡含有DNA和RNA中的至少一种。在一些情况下,细胞外囊泡起源于胎儿/胎盘。方法可以包括捕获来自母体细胞的生物样品中的细胞外囊泡或细胞外微粒。在一些情况下,本文公开的方法包括从母体细胞捕获和丢弃细胞外囊泡或细胞外微粒,以富集样品的胎儿/胎盘核酸。
在一些情况下,方法包括捕获生物样品中的核小体并分析附接至核小体的核酸。在一些情况下,方法包括捕获生物样品中的外来体并分析附接至外来体的核酸。捕获核小体和/或外来体可以排除对裂解步骤或试剂的需要,从而简化方法并减少从样品收集到检测的时间。
在一些情况下,方法包括使生物样品经历细胞结合部分,以捕获胎盘培养的血小板,其可含有胎儿DNA或RNA片段。捕获可以包括使胎盘培养的血小板与结合部分(例如,针对细胞表面标志物的抗体)接触,使生物样品经受低速离心,或其组合。在一些情况下,结合部分附接至本文公开的固体支持物,并且方法包括在结合部分与生物样品接触后,将固体支持物与其余的生物样品分离。
在一些情况下,本文公开的方法包括从生物样品去除不需要的非核酸组分。在一些情况下,本文公开的方法包括从生物样品去除和丢弃非核酸组分。非核酸组分的非限制性实例包括细胞(例如,血细胞)、细胞片段、细胞外囊泡、脂质、蛋白质或其组合。在一些情况下,去除非核酸组分可以包括离心生物样品。在一些情况下,去除非核酸组分可以包括过滤生物流体样品。在一些情况下,去除非核酸组分可以包括使生物样品与本文所述的结合部分接触。
在一些实施方案中,本文公开的方法包括纯化样品中的核酸。在一些情况下,纯化不包括用洗涤缓冲液洗涤核酸。在一些情况下,核酸是无细胞胎儿核酸。在一些实施方案中,纯化包括用核酸捕获部分捕获核酸以产生捕获的核酸。核酸捕获部分的非限制性实例是二氧化硅颗粒和顺磁性颗粒。在一些实施方案中,纯化包括使含有捕获的核酸的样品通过疏水相(例如,液体或蜡)。疏水相将杂质保留在样品中,否则该杂质将抑制核酸的进一步操作(例如,扩增、测序)。
在一些情况下,本文公开的方法包括从本文所述的生物样品去除核酸组分。在一些情况下,丢弃去除的核酸组分。举非限制性实例而言,方法可以包括仅分析DNA。因此,RNA是不需要的,并且产生不期望的背景噪音或对DNA的污染。在一些情况下,本文公开的方法包括从生物样品去除RNA。在一些情况下,本文公开的方法包括从生物样品去除mRNA。在一些情况下,本文公开的方法包括从生物样品去除微小RNA。在一些情况下,本文公开的方法包括从生物样品去除母体RNA。在一些情况下,本文公开的方法包括从生物样品去除DNA。在一些情况下,本文公开的方法包括从妊娠受试者的生物样品去除母体DNA。在一些情况下,去除核酸组分包括使核酸组分与能够与核酸杂交的寡核苷酸接触,其中寡核苷酸缀合、附接或结合至捕获设备(例如,珠子、柱、基质、纳米颗粒、磁性颗粒等)。在一些情况下,丢弃去除的核酸组分。
在一些情况下,去除核酸组分包括按大小分离凝胶上的核酸组分。例如,循环无细胞胎儿DNA片段的长度通常小于200个碱基对。在一些情况下,本文公开的方法包括从生物样品去除无细胞DNA。在一些情况下,本文公开的方法包括从生物样品捕获无细胞DNA。在一些情况下,本文公开的方法包括从生物样品选择无细胞DNA。在一些情况下,无细胞DNA具有最小长度。在一些情况下,最小长度为约50个碱基对。在一些情况下,最小长度为约100个碱基对。在一些情况下,最小长度为约110个碱基对。在一些情况下,最小长度为约120个碱基对。在一些情况下,最小长度为约140个碱基对。在一些情况下,无细胞DNA具有最大长度。在一些情况下,最大长度为约180个碱基对。在一些情况下,最大长度为约200个碱基对。在一些情况下,最大长度为约220个碱基对。在一些情况下,最大长度为约240个碱基对。在一些情况下,最大长度为约300个碱基对。基于大小的分离对于具有有限的大小范围的其他类别的核酸将是有用的,这些核酸是在本领域公知的(例如,微小RNA)。
在一些情况下,处理包括在生物样品中富集包含目标胎儿基因组DNA的胎儿滋养层。在一些情况下,所述胎儿滋养层通过形态(例如大小)或标记抗原(例如细胞表面抗原)或两者来富集。在一些情况下,使用上皮肿瘤细胞大小分离(ISET)来进行滋养层的富集。在一些情况下,富集生物样品中的滋养层包括使生物样品与对滋养层的细胞表面抗原具有特异性的抗体或抗原结合片段接触。滋养层细胞表面抗原的非限制性实例包括原肌球蛋白-1(Trop1)、原肌球蛋白-2(Trop2)、细胞和合胞体滋养层标志物、GB25、人胎盘催乳素(HPL)和α人绒毛膜促性腺激素(αHCG)。在一些情况下,纯化或分离胎儿滋养层包括使用荧光激活细胞分选法(FACS),柱层析或磁性分选法(例如Dynabeads)。在一些情况下,使用任何合适的DNA提取方法,例如本文所述的方法,从富集和/或纯化的滋养层中提取胎儿的遗传信息。
扩增核酸
在一些情况下,本文公开的方法包括扩增样品中的至少一种核酸以产生至少一种扩增产物。至少一种核酸可以是无细胞核酸。样品可以是本文公开的生物样品或者其级分或部分。在一些情况下,方法包括产生样品中核酸的拷贝并且扩增该拷贝以产生至少一种扩增产物。在一些情况下,方法包括产生样品中核酸的逆转录物并且扩增该逆转录物以产生至少一种扩增产物。
在一些情况下,方法包括执行全基因组扩增。在一些情况下,方法不包括执行全基因组扩增。术语“全基因组扩增”可以指扩增生物样品中的所有无细胞核酸。术语“全基因组扩增”可以指扩增生物样品中的至少90%的无细胞核酸。全基因组可以指多个基因组。全基因组扩增可以包括扩增来自受试者的生物样品的无细胞核酸,其中生物样品包含来自受试者和外来组织的无细胞核酸。例如,全基因组扩增可以包括扩增来自受试者(宿主基因组)和已经移植到受试者中的器官或组织(供体基因组)的无细胞核酸。同样举非限制性实例而言,全基因组扩增可以包括扩增来自妊娠受试者的生物样品的无细胞核酸,其中生物样品包含来自妊娠受试者及其胎儿的无细胞核酸。全基因组扩增可以包括扩增来自患有癌症的受试者的生物样品的无细胞指核酸,其中生物样品包含来自受试者的良性组织和受试者中的肿瘤的无细胞核酸。全基因组扩增可以包括扩增来自患有感染的受试者的生物样品的无细胞核酸,其中生物样品包含来自受试者和病原体的无细胞核酸。
在一些情况下,本文公开的方法包括扩增核酸,其中扩增包括对核酸进行等温扩增。等温扩增的非限制性实例如下:环介导等温扩增(LAMP)、链置换扩增(SDA)、解旋酶依赖性扩增(HDA)、切口酶扩增反应(NEAR)和重组酶聚合酶扩增(RPA)。
考虑到将本领域已知的任何适当的核酸扩增方法用于本文所述的设备和方法。在一些情况下,使用等温扩增。在一些情况下,除了等温扩增开始之前的初始加热步骤之外,扩增是等温的。许多等温扩增方法是本领域已知的,每种方法具有不同的考虑因素并提供不同的优势,并且在文献中进行了讨论,例如,Zanoli和Spoto,2013,“IsothermalAmplification Methods for the Detection of Nucleic Acids in MicrofluidicDevices,”Biosensors 3:18-43,以及Fakruddin,等人,2013,“Alternative Methods ofPolymerase Chain Reaction(PCR),”Journal of Pharmacy and Bioallied Sciences 5(4):245-252,其各自通过引用整体并入本文。在一些情况下,使用任何适当的等温扩增方法。在一些情况下,所用的等温扩增方法选自:环介导等温扩增(LAMP);基于核酸序列的扩增(NASBA);多重置换扩增(MDA);滚环扩增(RCA);解旋酶依赖性扩增(HDA);链置换扩增(SDA);切口酶扩增反应(NEAR);分支扩增法(RAM);以及重组酶聚合酶扩增(RPA)。
在一些情况下,所用的扩增方法是LAMP(参见例如,Notomi,等人,2000,“LoopMediated Isothermal Amplification”NAR 28(12):e63 i-vii,以及美国专利号6,410,278,“Process for synthesizi ng nucleic acid”,其各自通过引用整体并入本文)。LAMP是使用自动循环链置换脱氧核糖核酸(DNA)合成的一步扩增系统。在一些情况下,LAMP在热稳定的聚合酶例如嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)(Bst)DNA聚合酶I、脱氧核糖核苷三磷酸(dNTP)、特异性引物和靶DNA模板的存在下于60-65℃执行45-60min。在一些情况下,模板是RNA,并且使用具有逆转录酶活性和链置换型DNA聚合酶活性的聚合酶,例如Bca DNA聚合酶,或者将具有逆转录酶活性的聚合酶用于逆转录酶步骤,并且将不具有逆转录酶活性的聚合酶用于链置换-DNA合成步骤。
在一些情况下,扩增方法是基于核酸序列的扩增(NASBA)。NASBA(也称为3SR和转录介导扩增)是基于等温转录的RNA扩增系统。使用三种酶(禽成髓细胞瘤病毒逆转录酶、RNA酶H和T7 DNA依赖性RNA聚合酶)生成单链RNA。在某些情况下,NASBA可以用于扩增DNA。扩增反应在41℃下进行,保持恒温,通常持续约60至约90分钟(例如,参见,Fakruddin,等人,2012,“Nucleic Acid Sequence Based Amplification(NASBA)Prospects andApplications,”Int.J.of Life Science and Pharma Res.2(1):L106-L121,通过引用并入本文)。
在一些情况下,NASBA反应在约40℃至约42℃下进行。在一些情况下,NASBA反应在约41℃下进行。在一些情况下,NASBA反应在至多约42℃下进行。在一些情况下,NASBA反应在约40℃至约41℃、约40℃至约42℃或约41℃至约42℃进行。在一些情况下,NASBA反应在约40℃、约41℃或约42℃下进行。
在一些情况下,扩增方法是链置换扩增(SDA)。SDA是使用四种不同引物的等温扩增方法。将含有限制酶切位点(HincII外切核酸酶的识别序列)的引物与DNA模板退火。大肠杆菌(Eschericia coli)DNA聚合酶1的外切核酸酶缺陷片段(exo-Klenow)使引物伸长。每个SDA循环由以下组成:(1)引物与置换的靶片段结合,(2)通过exo-Klenow延伸引物/靶复合物,(3)切开生成的半硫代磷酸酯HincII位点,(4)HincII与切口位点解离,以及(5)切口延伸和通过exo-Klenow置换下游链。
在一些情况下,方法包括使样品中的DNA与解旋酶接触。在一些情况下,扩增方法是解旋酶依赖性扩增(HDA)。HDA是等温反应,因为使用解旋酶使DNA变性,而不是加热。
在一些情况下,扩增方法是多重置换扩增(MDA)。MDA是一种等温的链置换方法,其基于使用来自噬菌体
Figure BDA0003377807820000831
的高度持续合成和链置换的DNA聚合酶,结合修饰的随机引物,以高保真性扩增整个基因组。其已被开发用于从非常少量的起始材料扩增样品中的所有DNA。在MDA中,将
Figure BDA0003377807820000832
DNA聚合酶与dNTP、随机六聚体和变性的模板DNA在30℃下温育16至18小时,并且酶必须在高温(65℃)下灭活10分钟。不需要重复循环,但需要短的初始变性步骤、扩增步骤和酶的最终灭活。
在一些情况下,扩增方法是滚环扩增(RCA)。RCA是一种等温核酸扩增方法,允许在单个温度(通常约30℃)下将探针DNA序列扩增超过109倍。多轮的等温酶促合成由
Figure BDA0003377807820000833
DNA聚合酶进行,该聚合酶通过在环状DNA探针周围不断持续合成来延伸环-杂交引物。在一些情况下,扩增反应使用RCA在约28℃至约32℃下进行。
可以在本领域中发现可以并入本文公开的设备和方法中的附加扩增方法。理想地,扩增方法是等温的,并且相对于传统PCR而言是快速的。在一些情况下,扩增包括进行指数扩增反应(EXPAR),这是等温分子链反应,其中一个反应的产物催化产生相同产物的进一步反应。在一些情况下,扩增在内切核酸酶存在下发生。内切核酸酶可以是切口内切核酸酶。参见例如,Wu等人,“Aligner-Mediated Cleavage of Nucleic Acids,”ChemicalScience(2018)。在一些情况下,扩增不需要靶DNA的初始热变性。参见例如,Toley等人,“Isothermal strand displacement amplification(iSDA):a rapid and sensitivemethod of nucleic acid amplification for point-of-care diagnosis,”The Analyst(2015)。超快速扩增方法中的脉冲控制扩增由GNA Biosolutions GmbH开发。
在一些情况下,方法包括用一对引物进行多个核酸扩增循环。扩增循环的数目很重要,因为扩增可能会将偏差引入区域表现度中。输入量极低时,扩增甚至更容易产生偏差,因此在扩增之前提高效率对于高准确度至关重要。并非所有区域都以相同的效率扩增,因此总体表现度可能不均匀,这会影响分析的准确度。如果需要扩增,通常较少的循环是理想的。在一些情况下,方法包括执行少于30个扩增循环。在一些情况下,方法包括执行少于25个扩增循环。在一些情况下,方法包括执行少于20个扩增循环。在一些情况下,方法包括执行少于15个扩增循环。在一些情况下,方法包括执行少于12个扩增循环。在一些情况下,方法包括执行少于11个扩增循环。在一些情况下,方法包括执行少于10个扩增循环。在一些情况下,方法包括执行至少3个扩增循环。在一些情况下,方法包括执行至少5个扩增循环。在一些情况下,方法包括执行至少8个扩增循环。在一些情况下,方法包括执行至少10个扩增循环。
在一些情况下,扩增反应进行约30至约90分钟。在一些情况下,扩增反应进行至少约30分钟。在一些情况下,扩增反应进行至多约90分钟。在一些情况下,扩增反应进行约30分钟至约35分钟、约30分钟至约40分钟、约30分钟至约45分钟、约30分钟至约50分钟、约30分钟至约55分钟、约30分钟至约60分钟、约30分钟至约65分钟、约30分钟至约70分钟、约30分钟至约75分钟、约30分钟至约80分钟、约30分钟至约90分钟、约35分钟至约40分钟、约35分钟至约45分钟、约35分钟至约50分钟、约35分钟至约55分钟、约35分钟至约60分钟、约35分钟至约65分钟、约35分钟至约70分钟、约35分钟至约75分钟、约35分钟至约80分钟、约35分钟至约90分钟、约40分钟至约45分钟、约40分钟至约50分钟、约40分钟至约55分钟、约40分钟至约60分钟、约40分钟至约65分钟、约40分钟至约70分钟、约40分钟至约75分钟、约40分钟至约80分钟、约40分钟至约90分钟、约45分钟至约50分钟、约45分钟至约55分钟、约45分钟至约60分钟、约45分钟至约65分钟、约45分钟至约70分钟、约45分钟至约75分钟、约45分钟至约80分钟、约45分钟至约90分钟、约50分钟至约55分钟、约50分钟至约60分钟、约50分钟至约65分钟、约50分钟至约70分钟、约50分钟至约75分钟、约50分钟至约80分钟、约50分钟至约90分钟、约55分钟至约60分钟、约55分钟至约65分钟、约55分钟至约70分钟、约55分钟至约75分钟、约55分钟至约80分钟、约55分钟至约90分钟、约60分钟至约65分钟、约60分钟至约70分钟、约60分钟至约75分钟、约60分钟至约80分钟、约60分钟至约90分钟、约65分钟至约70分钟、约65分钟至约75分钟、约65分钟至约80分钟、约65分钟至约90分钟、约70分钟至约75分钟、约70分钟至约80分钟、约70分钟至约90分钟、约75分钟至约80分钟、约75分钟至约90分钟或约80分钟至约90分钟。在一些情况下,扩增反应进行约30分钟、约35分钟、约40分钟、约45分钟、约50分钟、约55分钟、约60分钟、约65分钟、约70分钟、约75分钟、约80分钟或约90分钟。
在一些情况下,本文公开的方法包括至少在一个温度下扩增核酸。在一些情况下,本文公开的方法包括在单个温度下扩增核酸(例如,等温扩增)。在一些情况下,本文公开的方法包括扩增核酸,其中扩增发生在不超过两个温度下。扩增可以发生在一个步骤或多个步骤中。扩增步骤的非限制性实例包括双链变性、引物杂交和引物延伸。
在一些情况下,扩增的至少一个步骤发生在室温下。在一些情况下,扩增的所有步骤发生在室温下。在一些情况下,扩增的至少一个步骤发生在温度范围内。在一些情况下,扩增的所有步骤发生在温度范围内。在一些情况下,温度范围为约0℃至约100℃。在一些情况下,温度范围为约15℃至约100℃。在一些情况下,温度范围为约25℃至约100℃。在一些情况下,温度范围为约35℃至约100℃。在一些情况下,温度范围为约55℃至约100℃。在一些情况下,温度范围为约65℃至约100℃。在一些情况下,温度范围为约15℃至约80℃。在一些情况下,温度范围为约25℃至约80℃。在一些情况下,温度范围为约35℃至约80℃。在一些情况下,温度范围为约55℃至约80℃。在一些情况下,温度范围为约65℃至约80℃。在一些情况下,温度范围为约15℃至约60℃。在一些情况下,温度范围为约25℃至约60℃。在一些情况下,温度范围为约35℃至约60℃。在一些情况下,温度范围为约15℃至约40℃。在一些情况下,温度范围为约-20℃至约100℃。在一些情况下,温度范围为约-20℃至约90℃。在一些情况下,温度范围为约-20℃至约50℃。在一些情况下,温度范围为约-20℃至约40℃。在一些情况下,温度范围为约-20℃至约10℃。在一些情况下,温度范围为约0℃至约100℃。在一些情况下,温度范围为约0℃至约40℃。在一些情况下,温度范围为约0℃至约30℃。在一些情况下,温度范围为约0℃至约20℃。在一些情况下,温度范围为约0℃至约10℃。在一些情况下,温度范围为约15℃至约100℃。在一些情况下,温度范围为约15℃至约90℃。在一些情况下,温度范围为约15℃至约80℃。在一些情况下,温度范围为约15℃至约70℃。在一些情况下,温度范围为约15℃至约60℃。在一些情况下,温度范围为约15℃至约50℃。在一些情况下,温度范围为约15℃至约30℃。在一些情况下,温度范围为约10℃至约30℃。在一些情况下,本文公开的方法在室温下执行,不需要冷却、冷冻或加热。在一些情况下,扩增包括使样品与随机寡核苷酸引物接触。在一些情况下,扩增包括使本文公开的无细胞核酸分子与随机寡核苷酸引物接触。在一些情况下,扩增包括使本文公开的无细胞胎儿核酸分子与随机寡核苷酸引物接触。在一些情况下,扩增包括使本文公开的标记的核酸分子与随机寡核苷酸引物接触。用多个随机引物扩增通常导致不同序列的多个核酸的非靶向扩增或样品中大多数核酸的整体扩增。
在一些情况下,扩增包括靶向扩增(例如,选择器方法(在US6558928中描述)、分子倒置探针)。在一些情况下,扩增核酸包括使核酸与具有与靶染色体序列相对应的序列的至少一种引物接触。本文公开了示例性的染色体序列。在一些情况下,扩增包括使核酸与具有与非靶染色体序列相对应的至少一种序列的引物接触。在一些情况下,扩增包括使核酸与不超过一对引物接触,其中该对引物中的每个引物包含与本文公开的靶染色体上的序列相对应的序列。在一些情况下,扩增包括使核酸与多组引物接触,其中第一组中的第一对中的每一个和第二组中的对中的每一个均不同。
在一些情况下,扩增包括使样品与至少一种引物接触,所述引物具有与本文公开的靶染色体上的序列相对应的序列。在一些情况下,扩增包括使样品与至少一种引物接触,所述引物具有与本文公开的非靶染色体上的序列相对应的序列。在一些情况下,扩增包括使样品与不超过一对引物接触,其中该对引物中的每个引物包含与本文公开的靶染色体上的序列相对应的序列。在一些情况下,扩增包括使样品与多组引物接触,其中第一组中的第一对中的每一个和第二组中的对中的每一个均不同。
在一些情况下,扩增包括多重化(在一个反应中对多个核酸进行核酸扩增)。在一些情况下,多重化包括使生物样品的核酸与多个寡核苷酸引物对接触。在一些情况下,多重化包括接触第一核酸和第二核酸,其中第一核酸对应于第一序列,第二核酸对应于第二序列。在一些情况下,第一序列和第二序列是相同的。在一些情况下,第一序列和第二序列是不同的。在一些情况下,扩增不包括多重化。在一些情况下,扩增不需要多重化。在一些情况下,扩增包括嵌套式引物扩增。方法可以包括多个区域的多重PCR,其中每个区域包含单核苷酸多态性(SNP)。多重化可以单个管中发生。在一些情况下,方法包括超过100个区域的多重PCR,其中每个区域包含SNP。在一些情况下,方法包括超过500个区域的多重PCR,其中每个区域包含SNP。在一些情况下,方法包括超过1000个区域的多重PCR,其中每个区域包含SNP。在一些情况下,方法包括超过2000个区域的多重PCR,其中每个区域包含SNP。在一些情况下,方法包括超过300个区域的多重PCR,其中每个区域包含SNP。
在一些情况下,方法包括扩增样品中的核酸,其中扩增包括使样品与至少一种寡核苷酸引物接触,其中至少一种寡核苷酸引物直到与样品接触才是活性的或可延伸的。在一些情况下,扩增包括使样品与至少一种寡核苷酸引物接触,其中至少一种寡核苷酸引物直到暴露于选定温度才是活性的或可延伸的。在一些情况下,扩增包括使样品与至少一种寡核苷酸引物接触,其中至少一种寡核苷酸引物直到与活化试剂接触才是活性的或可延伸的。举非限制性实例而言,至少一种寡核苷酸引物可以包含封闭基团。使用这样的寡核苷酸引物可以使引物二聚体最少化,允许识别未使用的引物,以及/或者避免未使用的引物造成的错误结果。在一些情况下,扩增包括使样品与至少一种寡核苷酸引物接触,该寡核苷酸引物包含与本文公开的靶染色体上的序列相对应的序列。
在一些情况下,本文公开的方法包括使用一个或多个标签。一个或多个标签的使用可以增加本文公开的方法的效率、速度和准确度中的至少一种。在一些情况下,寡核苷酸引物包含标签,其中标签对靶序列不是特异性的。这种标签可以被称为通用标签。在一些情况下,方法包括用对靶序列非特异性的标签标记样品中的靶序列或其片段。在一些情况下,标签对人类染色体上的序列不是特异性的。备选地或附加地,方法包括使样品与标签和包含与靶序列相对应的序列的至少一种寡核苷酸引物接触,其中标签与寡核苷酸引物分离。在一些情况下,在寡核苷酸引物与靶序列杂交后,通过延伸寡核苷酸引物将标签掺入扩增产物中。标签可以是寡核苷酸、小分子或肽。在一些情况下,标签不包含核苷酸。
在一些情况下,标签不包含寡核苷酸。在一些情况下,标签不包含氨基酸。在一些情况下,标签不包含肽。在一些情况下,标签不是序列特异性的。在一些情况下,标签包括不对应于任何特定靶序列的通用序列。在一些情况下,当产生扩增产物时,无论扩增的序列如何,标签都是可检测的。在一些情况下,寡核苷酸引物和标签中的至少一个包含肽核酸(PNA)。在一些情况下,寡核苷酸引物和标签中的至少一个包含锁核酸(LNA)。
在一些情况下,本文公开的方法包括使用多个标签,从而增加方法的准确度、方法的速度和通过该方法获得的信息中的至少一种。在一些情况下,本文公开的方法包括使用多个标签,从而减少获得可靠结果所需的样品体积。在一些情况下,多个标签包括至少一个捕获标签。在一些情况下,多个标签包括至少一个检测标签。在一些情况下,多个标签包括至少一个捕获标签和至少一个检测标签的组合。捕获标签通常用于将特定序列或区域与其他区域分离或分开。捕获标签的典型实例是生物素(可以使用例如链霉亲和素包被的表面捕获生物素)。检测标签的实例是洋地黄毒苷和荧光标签。检测标签可以直接检测(例如,激光照射和/或测量发射的光)或者通过携带次级检测体系如发光测定或酶促测定或与该体系相互作用的抗体间接检测。在一些情况下,多个标签包括至少一个捕获标签(用于分离分析物的标签)和至少一个检测标签(用于检测分析物的标签)的组合。在一些情况下,单个标签作为检测标签和捕获标签。
在一些情况下,方法包括使样品中的至少一种循环无细胞核酸与第一标签和第二标签接触,其中第一标签包括与循环无细胞核酸的有义链互补的第一寡核苷酸,并且第二捕获标签包括与循环无细胞核酸的反义链互补的第二寡核苷酸。在一些情况下,方法包括使样品中的至少一种循环细胞无细胞核酸与第一标签和第二标签接触,其中第一标签携带与第二标签相同的标记。在一些情况下,方法包括使样品中的至少一种循环细胞无细胞核酸与第一标签和第二标签接触,其中第一标签携带与第二标签不同的标记。在一些情况下,标签是相同的,并且存在单个定性或定量信号,所述信号是检测到的所有探针/区域的集合。在一些情况下,标签是不同的。一种标签可以用于纯化,并且一种标签可以用于检测。在一些情况下,第一寡核苷酸标签对区域(例如,cfDNA片段)具有特异性且携带荧光标记,而第二寡核苷酸对相邻区域具有特异性且携带相同的荧光标记,因为仅需要总的信号。在其他情况下,第一寡核苷酸标签对区域(例如,cfDNA片段)具有特异性且携带荧光标记,而第二寡核苷酸对相邻区域具有特异性且携带不同的荧光标记,以检测两个不同的区域。
在一些情况下,方法包括检测扩增产物,其中扩增产物通过扩增本文公开的靶染色体的至少一部分或其片段而产生。靶染色体的部分或片段可以包含至少5个核苷酸。靶染色体的部分或片段可以包含至少约10个核苷酸。靶染色体的部分或片段可以包含至少约15个核苷酸。在一些情况下,检测本文公开的扩增产物不包括对扩增产物加标签或标记。在一些情况下,方法基于扩增产物的量检测扩增产物。例如,该方法可以检测样品中双链DNA量的增加。在一些情况下,检测扩增产物至少部分基于其大小。在一些情况下,扩增产物具有约50个碱基对至约500个碱基对的长度。
在一些情况下,检测扩增产物包括使扩增产物与标签接触。在一些情况下,标签包含与扩增产物的序列互补的序列。在一些情况下,标签不包含与扩增产物的序列互补的序列。标签的非限制性实例在前述和以下公开内容中描述。
在一些情况下,检测标记的或未标记的扩增产物包括使扩增产物经历本文公开的设备、系统或试剂盒的信号检测器或测定组装件。在一些情况下,方法包括在本文公开的设备、系统或试剂盒的测定组装件上扩增和检测。在一些情况下,测定组装件包含扩增试剂。在一些情况下,方法包括将仪器或试剂应用于本文公开的测定组装件(例如,侧流测定),以通过侧流测定来控制生物样品、溶液或其组合的流动。在一些情况下,仪器是真空、移液管、泵或其组合。
测序
在一些情况下,本文公开的方法包括对核酸进行测序。核酸可以是本文公开的核酸,如标记的核酸、扩增的核酸、无细胞核酸、无细胞的胎儿核酸、具有对应于靶染色体的序列的核酸、具有对应于靶染色体区域的序列的核酸、具有对应于非靶染色体序列的核酸或其组合。在一些情况下,核酸是DNA。在一些情况下,核酸是RNA。在一些情况下,核酸包括DNA。在一些情况下,核酸包括RNA。
在一些情况下,测序包括靶向测序。在一些情况下,测序包括全基因组测序。在一些情况下,测序包括靶向测序和全基因组测序。在一些情况下,全基因组测序包括大规模平行测序,在本领域也称为下一代测序或第二代测序。在一些情况下,全基因组测序包括随机大规模平行测序。在一些情况下,测序包括从整个基因组文库捕获的靶区域的随机大规模平行测序。
在一些情况下,方法包括对本文公开的扩增核酸进行测序。在一些情况下,扩增的核酸通过靶向扩增产生(例如,使用对感兴趣的靶序列具有特异性的引物)。在一些情况下,扩增的核酸通过非靶向扩增产生(例如,使用随机寡核苷酸引物)。在一些情况下,方法包括对扩增的核酸进行测序,其中测序包括大规模平行测序。
在一些情况下,方法包括使用算法进行基因组序列比对。举非限制性实例而言,算法可以被设计为识别染色体拷贝数。算法可以被设计为揭示在各个SNP基因座处与每个相关等位基因相关的观察到的序列读取数目。算法可以使用母体基因型和杂交频率数据来通过计算机模拟在测量的基因座处创建单体、二体和三体胎儿基因型,然后将其用于预测每种基因型的测序数据。使用贝叶斯模型,选择具有最大似然率的测序数据作为拷贝数和胎儿分数,并且似然率是计算出的准确度。对于每个SNP的两个可能的等位基因中的每一个,可能预期会有不同的概率分布,并比较观察到的等位基因。Zimmermann等人在PrenatDiagn(2012)32:1233-1241中对此进行了描述。但是,Zimmermann等人认为,胎儿分数含量低于4.0%的样品不能提供有用的信息,至少需要有20ml血液才能获得足够的无细胞DNA来进行此类分析。相反,本申请的方法可以用胎儿分数少于4%的样品进行这种分析,并且几乎不需要如此多的样品。
文库制备
在一些情况下,本文公开的方法包括修饰生物样品中的无细胞核酸,以产生用于检测的无细胞核酸文库。在一些情况下,方法包括修饰用于核酸测序的无细胞核酸。在一些情况下,方法包括修饰用于检测的无细胞核酸,其中检测不包含核酸测序。在一些情况下,方法包括修饰用于检测的无细胞核酸,其中检测包含基于标签检测的发生对标记的无细胞核酸进行计数。在一些情况下,本文公开的方法包括修饰生物样品中的无细胞核酸,以产生无细胞核酸文库,其中方法包括扩增无细胞核酸。在一些情况下,修饰发生在扩增之前。在一些情况下,修饰发生在扩增之后。
在一些情况下,修饰无细胞核酸包括修复作为核酸片段的无细胞核酸的末端。举非限制性实例而言,修复末端可以包括将5’磷酸基团、3’羟基基团或其组合恢复成无细胞核酸。在一些情况下,修复包括5’磷酸化、A加尾、缺口填充、闭合切口位点或其组合。在一些情况下,修复可以包括去除突出端。在一些情况下,修复可以包括用互补核苷酸填充突出端。在一些情况下,为制备文库而修饰无细胞核酸包括衔接子的使用。衔接子在本文也可以称为测序衔接子。在一些情况下,衔接子有助于测序。通常,衔接子包括寡核苷酸。举非限制性实例而言,衔接子可以简化方法中的其他步骤,如扩增、纯化和测序,因为它是修饰后样品中多种(如非全部)无细胞核酸的普遍序列。在一些情况下,修饰无细胞核酸包括将衔接子与无细胞核酸连接。连接可以包括平端连接。在一些情况下,修饰无细胞核酸包括使衔接子与核酸杂交。在一些情况下,测序衔接子包括发夹或茎环衔接子。在一些情况下,修饰无细胞核酸包括将发夹或茎环衔接子与核酸杂交,从而生成测序或分析的环状文库产物。在一些情况下,测序衔接子包括封闭的5’端,在3’端留切口。这种构型的优点包括但不限于提高文库效率和减少不需要的副产物诸如衔接子二聚体。在另外的情况下,衔接子具有可切割的复制终止物以线性化模板。
文库制备步骤(例如,末端修复、加尾和衔接子的连接)和扩增的效率可受益于向样品或扩增反应中添加群集剂。在其自然环境中的酶促过程(例如,细胞中的DNA复制)通常在稠密环境中进行。这些酶促过程中的一些在稠密环境中更有效。例如,稠密环境可能会增强DNA解旋酶的活性和DNA聚合酶的敏感性。因此,可以添加群集剂以模仿稠密环境。群集剂可以是聚合物。群集剂可以是蛋白质。群集剂可以是多糖。群集剂的非限制性实例是聚乙二醇、葡聚糖和Ficoll。通常需要模拟体内稠密的浓度。例如,4%(40mg/ml)PEG 1kDa提供体内发现的近似稠密效果。在一些情况下,在扩增反应中群集剂的浓度为约2%至约20%w/v。在一些情况下,在扩增反应中群集剂的浓度为约2%至约15%w/v。在一些情况下,在扩增反应中群集剂的浓度为约2%至约10%w/v。在一些情况下,在扩增反应中群集剂的浓度为约2%至约8%w/v。在一些情况下,在扩增反应中群集剂的浓度为约3%至约6%w/v。
在一些情况下,为制备文库而修饰无细胞核酸包括标签的使用。标签在本文中也可以称为条形码。在一些情况下,本文公开的方法包括用对应于感兴趣的染色体区域的标签修饰无细胞核酸。在一些情况下,本文公开的方法包括用对不感兴趣的染色体区域具有特异性的标签修饰无细胞核酸。在一些情况下,本文公开的方法包括用对应于至少一个感兴趣的染色体区域的第一标签修饰无细胞核酸的第一部分,并且用对应于至少一个不感兴趣的染色体区域的第二标签修饰无细胞核酸的第二部分。在一些情况下,修饰无细胞核酸包括将标签与无细胞核酸连接。连接可以包括平端连接。在一些情况下,修饰无细胞核酸包括使标签与核酸杂交。在一些情况下,标签包括寡核苷酸。在一些情况下,标签包括可以通过除核酸分析以外的手段检测的非寡核苷酸标志物或标记。举非限制性实例而言,非寡核苷酸标志物或标记可以包括荧光分子、纳米颗粒、染料、肽或其他可检测/可定量的小分子。
在一些实施方案中,(c)的所述标记包括:(a)通过一个或多个步骤生成可连接的无细胞DNA,所述步骤包括:(i)生成无细胞DNA的平端。在一些实施方案中,使用一种或多种聚合酶和一种或多种核酸外切酶去除5’突出端或3’凹陷端;(ii)使所述无细胞DNA的平端去磷酸化;(iii)使所述无细胞DNA与群集剂接触,从而增强所述一种或多种聚合酶、一种或多种核酸外切酶和所述无细胞DNA之间的反应;或(iv)使用连接酶修复或去除无细胞DNA中的DNA损伤;和(b)在连接酶、群集剂和/或小分子增强子的存在下,通过将所述可连接的无细胞DNA与衔接子寡核苷酸接触,将所述可连接的无细胞DNA与衔接子寡核苷酸连接。在一些实施方案中,所述一种或多种聚合酶包括T4 DNA聚合酶或DNA聚合酶I。在一些实施方案中,所述一种或多种核酸外切酶包括T4多核苷酸激酶或核酸外切酶III。在一些实施方案中,所述连接酶包括T3 DNA连接酶、T4 DNA连接酶、T7 DNA连接酶、Taq连接酶、Ampligase、大肠杆菌连接酶或Sso7-连接酶融合蛋白。在一些实施方案中,所述群集剂包括聚乙二醇(PEG),糖原,或葡聚糖或其组合。在一些实施方案中,所述小分子增强剂包括二甲亚砜(DMSO)、聚山梨醇酯20、甲酰胺或二醇或其组合。在一些实施方案中,(b)中的连接包括平端连接或单核苷酸突出端连接。在一些实施方案中,所述衔接子寡核苷酸包含Y形衔接子、发夹衔接子、茎环衔接子、可降解衔接子、封闭性自连接衔接子或条形码衔接子或其组合。
在一些情况下,为制备文库而修饰无细胞核酸包括样品索引的使用,在本文也简称为索引。举非限制性实例而言,索引可以包括寡核苷酸、小分子、纳米颗粒、肽、荧光分子、染料或其他可检测/可定量的部分。在一些情况下,来自第一生物样品的第一组无细胞核酸用第一索引标记,并且来自第一生物样品的第一组无细胞核酸用第二索引标记,其中第一索引和第二索引不同。因此,当一次分析多个样品时,多个索引允许区分来自多个样品的无细胞核酸。在一些情况下,方法公开了扩增无细胞核酸,其中用于扩增无细胞核酸的寡核苷酸引物包含索引。
虽然DNA丢失可能发生在DNA分离和分析的每个步骤中,但最大的丢失通常出现在文库制备步骤中。传统方法显示出80%到90%的材料丢失。通常,通过后续的扩增步骤可以补偿这种损失,以使DNA的浓度达到下一代测序所需的必要水平,但是扩增不能补偿先前步骤中发生的信息丢失。样品中的原始DNA丢失80%的文库可以描述为效率为20%或效率为0.2的文库。在一些情况下,本文公开的方法包括获得效率为至少约0.2、至少约0.3、至少约0.4、至少约0.5、至少约0.6或至少约0.8的文库。在一些情况下,本文公开的方法包括获得效率为至少约0.4的文库。在一些情况下,本文公开的方法包括获得效率为至少约0.5的文库。如本文所述,通过使用群集剂和修复无细胞DNA片段末端、连接方法、纯化方法、循环参数和化学计量比,产生具有这样的效率的文库的方法可以达到这些效率。在一些情况下,文库制备方法不需要无细胞核酸的核酸扩增。在一些情况下,使用体外CRISPR-cas靶向切割方法生成无细胞核酸的文库,其中指导RNA(gRNA)结合至互补DNA靶位点并且与例如Cas9组合可以产生平端,双链断裂或单链切口,如果使用工程化蛋白质的话。所述DNA断裂可用于修饰切割的DNA,使其能够进行连接和/或扩增过程以及随后对这些靶区域的分析。因此,CRISPR是被用作DNA分析或测序的靶富集过程。用于此目的的天然和改造的CRISPR-cas组合的非限制性实例包括Cas9,Cas12,Cascade和Cas13或其亚型。在一些情况下,Cas酶是Cas直系同源物,诸如Adrian Pickar-Oliver等人,The next generation of CRISPR-Castechnologies and applications,Nat Rev Mol Cell Biol.2019 Aug;20(8):490-507中描述的那些物质,其全文并入本文。
在另一个实施例中,将RNA改造以增加靶片段化和减少脱靶片段化,由此增加文库效率而不扩增。在一些情况下,用核酸外切酶处理文库,从而排除文库中的非靶DNA片段并富集靶片段。
在一些情况下,本文所述的核酸内切酶通过引发单链或双链DNA断裂而发挥功能。在一些情况下,单链或双链DNA断裂紧邻指导RNA结合位点,在指导RNA结合位点内或在指导RNA结合位点的任一侧。以这种方式,本文所述的核酸内切酶可被设计为针对手上分析的问题提供特定的解决方案。在一些情况下,文库制备由转座酶介导,所述转座酶使双链DNA片段化并在所述片段的3’和5’端连接合成标记(例如寡核苷酸)。在一些情况下,所述方法是基于标记的文库构建。在一些情况下,所述转座酶以“切割-粘贴”机制操作。在一些情况下,所述转座酶是Tn5转座酶或其变体。在一些情况下,所述标记是长度为约5、6、7、8、9、10、11、12、13、14或15个碱基对的寡核苷酸。在一些情况下,所述标记是游离的合成ME衔接子,诸如NExteraDNA试剂盒(Illumina)中提供的那些衔接子。在一些情况下,通过本文所述的方法扩增片段化的DNA。
检测遗传信息
通常,本文公开的方法包括检测生物标志物、分析物或其修饰形式。在一些情况下,方法包括检测核酸。在一些情况下,方法包括检测无细胞核酸。在一些情况下,方法包括检测核酸的标签。在一些情况下,方法包括检测核酸的扩增子。备选地或附加地,方法包括检测非核酸组分。举非限制性实例而言,非核酸组分可以选自蛋白质、肽、脂质、脂肪酸、甾醇、磷脂、碳水化合物、病毒组分、微生物组分及其组合。在病毒组分或微生物组分的情况下,方法可以包括在检测之前从病毒或细菌释放、纯化和/或扩增核酸。
检测可以包括对感兴趣的核酸进行测序。检测可以包括检测感兴趣的核酸上的标签。检测可以包括检测感兴趣的生物标志物上的标签。生物标志物可以是表观遗传修饰。生物标志物可以是表观遗传谱(多个表观遗传修饰)。生物标志物可以是经表观遗传修饰的核酸。检测可以包括亚硫酸氢盐测序。检测可以包括执行染色质免疫沉淀(ChIP)测定。检测可以包括对感兴趣的生物标志物上的标签进行测序。
如本文所述,检测可以包括扩增。例如,扩增可以包括qPCR,其中基于靶分析物的存在或不存在生成信号。在一些情况下,扩增包括PCR。在一些情况下,扩增不包括PCR。在一些情况下,扩增包括滚环扩增(RCA)。在一些情况下,使cfDNA与DNA连接酶和被设计为与cfDNA杂交的探针接触。在一些情况下,首先切割cfDNA(例如,使其经历限制酶)以产生cfDNA片段,并且使cfDNA片段与连接酶和探针接触。连接酶产生标记有探针的环化cfDNA。任选地使用骨架寡核苷酸将cfDNA或cfDNA片段环化。这些环化的片段被RCA复制以产生多联体。探针可以用可检测的寡核苷酸(例如,具有荧光)识别并成像。
方法可以包括检测生物样品的核酸中的遗传突变。方法可以包括检测生物样品的核酸中的多个遗传突变。方法可以包括检测生物样品的多个核酸的每一个中的遗传突变。方法可以包括检测生物样品的多个核酸中的多个遗传突变。
方法可以包括检测生物样品的核酸的表观遗传修饰。在一些情况下,检测表观遗传修饰包括执行亚硫酸氢盐测序。在一些情况下,检测表观遗传修饰包括执行染色质免疫沉淀(ChIP)测定。在一些情况下,表观遗传修饰是可遗传的改变。在一些情况下,表观遗传修饰是允许细胞响应于一种或多种环境刺激而影响转录的改变。举非限制性实例而言,表观遗传修饰可以是胞嘧啶或腺嘌呤残基的甲基化。在一些情况下,表观遗传修饰不存在甲基基团。通常,甲基化促进基因沉默。表观遗传修饰还包括组蛋白的乙酰化、甲基化、泛素化和磷酸化。表观遗传修饰可以促进、抑制、阻止或减少生物学过程(例如,免疫应答、细胞增殖)。方法可以包括检测生物样品的核酸的多个表观遗传修饰。方法可以包括检测生物样品的多个核酸的每一个中的表观遗传修饰。方法可以包括检测生物样品的多个核酸的表观遗传修饰。方法可以包括对表观遗传修饰进行全基因组分析,以鉴定测试样品与对照/参考样品之间的差异甲基化区域。
方法可以包括检测组织特有的一种或多种表观遗传修饰。例如,组织具有独特的甲基化谱,可用于追踪无细胞核酸的来源。这在确定无细胞核酸来源时可能是有用的。举非限制性实例而言,表观遗传修饰可以是脑特有的,并且带有该表观遗传修饰的无细胞核酸可以指示神经退行性疾病或脑肿瘤。如果检测到这种无细胞核酸,则方法还可以包括测试、活检、成像或处理组织。方法可以包括检测仅两种组织特有的一种或多种表观遗传修饰。方法可以包括检测少于三种组织特有的一种或多种表观遗传修饰。方法可以包括检测少于五种组织特有的一种或多种表观遗传修饰。
方法可以包括检测核酸或非核酸组分的可检测标记或可检测信号。方法可以包括检测与核酸或非核酸组分结合的结合部分(例如,小分子、肽、适体、抗体或其抗原结合片段)的可检测标记或可检测信号。举非限制性实例而言,可检测标记或信号可以是荧光分子、生物发光分子、发光分子、放射性信号、磁信号、电信号或染料。例如,方法可以包括检测结合部分与感兴趣蛋白质之间的相互作用。举非限制性实例而言,检测可以包括执行IPCR或PLA。
检测可以包括查看本文公开的设备或系统的界面,其中显示测试结果。参见例如,图4和图5A-E。检测可以包括在侧流设备上查看颜色外观或荧光信号。检测可以包括在本文公开的设备上接收测试结果。检测可以包括在与本文公开的系统的设备通信的移动设备、计算机、笔记本或其他电子设备上接收测试结果。
通常,本文公开的方法、试剂盒、系统和设备能够在短时间内提供遗传信息。在一些情况下,本文公开的方法可以在少于约1分钟内执行。在一些情况下,本文公开的方法可以在少于约2分钟内执行。在一些情况下,本文公开的方法可以在少于约5分钟内执行。在一些情况下,本文公开的方法可以在少于约10分钟内执行。在一些情况下,本文公开的方法可以在少于约15分钟内执行。在一些情况下,本文公开的方法可以在少于约20分钟内执行。在一些情况下,本文公开的方法可以在少于约30分钟内执行。在一些情况下,本文公开的方法可以在少于约45分钟内执行。在一些情况下,本文公开的方法可以在少于约60分钟内执行。在一些情况下,本文公开的方法可以在少于约90分钟内执行。在一些情况下,本文公开的方法可以在少于约2小时内执行。在一些情况下,本文公开的方法可以在少于约3小时内执行。在一些情况下,本文公开的方法可以在少于约4小时内执行。
在一些情况下,本文公开的方法需要很少的技术训练。在一些情况下,本文公开的方法不需要任何技术训练。在一些情况下,本文公开的方法仅要求实施本文公开的方法的个体遵循转移和混合样品和溶液的简单方案。例如,本文公开的方法可以由妊娠受试者在其家中使用,而无需技术人员或医疗提供者的帮助。在一些情况下,本文公开的方法可以由没有经过医学培训或技术训练的用户执行。在一些情况下,本文公开的方法、试剂盒、系统和设备仅要求用户将生物样品添加至系统或设备,并查看结果以获得遗传信息。
方法可以包括根据检测来检测疾病或病况的存在。方法可以包括根据检测来检测疾病或病况的风险。方法可以包括根据检测来检测疾病或病况的状态。方法可以包括根据检测来监测疾病或病况的状态。方法可以包括根据检测来施用疗法。方法可以包括根据检测来改变正被施用于受试者的药物的剂量。方法可以包括根据检测来监测受试者对疗法的反应。例如,疾病可以是癌症,而疗法可以是化学疗法。其他癌症疗法包括但不限于抗体、抗体-药物缀合物、反义分子、工程化的T细胞和辐射。方法可以包括根据检测进一步对受试者进行测试。例如,疾病可以是癌症,并且进一步的测试可以包括但不限于成像(例如,CAT-SCAN、PET-SCAN)以及进行活检。
在一些情况下,本文公开的方法包括检测至少一个靶染色体的胎儿非整倍性。在一些情况下,本文公开的方法包括当在本文公开的样品中检测到一定数量的测序读取时,检测至少一个靶染色体的胎儿非整倍性。在一些情况下,如本文所述,测序读取的数量对应于来自已知在人类群体中呈现非整倍性的染色体或染色体区域的序列。
在一些情况下,本文公开的方法包括:当对应于至少一个靶染色体的测序读取与对应于至少一个非靶染色体的测序读取的比率不同于来自怀有整倍体胎儿的对照妊娠受试者的对照生物样品的相应比率时,检测出至少一个靶染色体存在胎儿非整倍性。在一些情况下,本文公开的方法包括检测出至少一个靶染色体存在胎儿非整倍性,因为对应于至少一个靶染色体的测序读取与对应于至少一个非靶染色体的测序读取的比率不同于来自怀有整倍体胎儿的对照妊娠受试者的对照生物样品的相应比率。在一些情况下,本文公开的方法包括检测出至少一个靶染色体不存在胎儿非整倍性,因为对应于至少一个靶染色体的测序读取与对应于至少一个非靶染色体的测序读取的比率没有不同于来自怀有整倍体胎儿的对照妊娠受试者的对照生物样品的相应比率。
在一些情况下,对应于至少一个靶染色体的测序读取包含对应于至少一个靶染色体的染色体区域的测序读取。在一些情况下,对应于至少一个非靶染色体的测序读取包含对应于非靶染色体的染色体区域的测序读取。在一些情况下,染色体区域的长度为至少约10个碱基对。在一些情况下,染色体区域的长度为至少约20个碱基对。在一些情况下,染色体区域的长度为至少约50个碱基对。
在一些情况下,至少一个靶染色体是13号染色体、16号染色体、18号染色体、21号染色体、22号染色体、X染色体或Y染色体中的至少一个。在一些情况下,至少一个靶染色体是13号染色体、18号染色体和21号染色体中的至少一个。在一些情况下,至少一个靶染色体是13号染色体、18号染色体、21号染色体和X染色体中的至少一个。在一些情况下,至少一个靶染色体是13号染色体、18号染色体、21号染色体和Y染色体中的至少一个。在一些情况下,至少一个靶染色体是13号染色体、18号染色体、21号染色体、X染色体和Y染色体中的至少一个。在一些情况下,至少一个靶染色体是13号染色体。在一些情况下,至少一个靶染色体是16号染色体。在一些情况下,至少一个靶染色体是18号染色体。在一些情况下,至少一个靶染色体是21号染色体。在一些情况下,靶染色体是22号染色体。在一些情况下,至少一个靶染色体是性染色体。在一些情况下,至少一个靶染色体是X染色体。在一些情况下,至少一个靶染色体是Y染色体。
在一些情况下,至少一个非靶染色体是除13号染色体、16号染色体、18号染色体、21号染色体、22号染色体、X染色体或Y染色体以外的染色体中的至少一个。在一些情况下,至少一个非靶染色体不是13号染色体、16号染色体、18号染色体、21号染色体、22号染色体、X染色体和Y染色体。在一些情况下,至少一个非靶染色体选自1号染色体、2号染色体、3号染色体、4号染色体、5号染色体、6号染色体、7号染色体、8号染色体、9号染色体、10号染色体、11号染色体、12号染色体、14号染色体、15号染色体、17号染色体、19号染色体和20号染色体。在一些情况下,非靶染色体是1号染色体。在一些情况下,至少一个非靶染色体是2号染色体。在一些情况下,至少一个非靶染色体是3号染色体。在一些情况下,非靶染色体是4号染色体。在一些情况下,至少一个非靶染色体是5号染色体。在一些情况下,至少一个非靶染色体是6号染色体。在一些情况下,至少一个非靶染色体是7号染色体。在一些情况下,至少一个非靶染色体是8号染色体。在一些情况下,至少一个非靶染色体是9号染色体。在一些情况下,至少一个非靶染色体是10号染色体。在一些情况下,至少一个非靶染色体是11号染色体。在一些情况下,至少一个非靶染色体是12号染色体。在一些情况下,至少一个非靶染色体是14号染色体。在一些情况下,至少一个非靶染色体是15号染色体。在一些情况下,至少一个非靶染色体是17号染色体。在一些情况下,至少一个非靶染色体是19号染色体。在一些情况下,至少一个非靶染色体是20号染色体。
在一些情况下,至少一个靶染色体是13号染色体,并且至少一个非靶染色体是除了13号染色体以外的染色体。在一些情况下,至少一个靶染色体是16号染色体,并且至少一个非靶染色体是除了16号染色体以外的染色体。在一些情况下,至少一个靶染色体是18号染色体,并且至少一个非靶染色体是除了18号染色体以外的染色体。在一些情况下,至少一个靶染色体是21号染色体,并且至少一个非靶染色体是除了21号染色体以外的染色体。在一些情况下,至少一个靶染色体是22号染色体,并且至少一个非靶染色体是除了22号染色体以外的染色体。在一些情况下,至少一个靶染色体是X染色体,并且至少一个非靶染色体是除了X染色体以外的染色体。在一些情况下,至少一个靶染色体是Y染色体,并且至少一个非靶染色体是除了Y染色体以外的染色体。
在一些情况下,本文公开的方法包括检测妊娠受试者的胎儿具有遗传异常。在一些情况下,遗传异常是由于在靶染色体区域中插入至少一个核苷酸。在一些情况下,遗传异常是由于靶染色体区域中至少一个核苷酸的缺失。在一些情况下,遗传异常是由于核苷酸在第一靶染色体区域与第二染色体靶区域之间的易位。通常,第一靶染色体区域和第二染色体靶区域位于不同的染色体上。
在一些情况下,靶染色体区域由最小长度定义。在一些情况下,靶染色体区域的长度为至少约50个碱基对。在一些情况下,靶染色体区域的长度为至少约100个碱基对。在一些情况下,靶染色体区域的长度为至少约200个碱基对。在一些情况下,靶染色体区域的长度为至少约300个碱基对。在一些情况下,靶染色体区域的长度为至少约500个碱基对。在一些情况下,靶染色体区域的长度为至少约1000个碱基对。
在一些情况下,靶染色体区域由最大长度定义。在一些情况下,靶染色体区域长约100,000个碱基对。在一些情况下,靶染色体区域长约500,000个碱基对。在一些情况下,靶染色体区域长约1,000,000个碱基对。在一些情况下,靶染色体区域长约10,000,000个碱基对。在一些情况下,靶染色体区域长约100,000,000个碱基对。在一些情况下,靶染色体区域长约200,000,000个碱基对。
在一些情况下,遗传异常是拷贝数变异。在一些情况下,拷贝数变异包括至少一个染色体上基因的缺失。在一些情况下,拷贝数变异包括至少一个染色体上基因的重复。在一些情况下,拷贝数变异包括至少一个染色体上基因的三份复制。在一些情况下,拷贝数变异包括基因的超过三次拷贝。在一些情况下,拷贝数变异包括在至少一个染色体上的非蛋白质编码序列的重复。在一些情况下,拷贝数变异包括至少一个染色体上非编码区的三份复制。在一些情况下,拷贝数变异包括至少一个染色体上非编码区的重复。
在一些情况下,遗传异常导致至少约0.001%的染色体臂被复制。在一些情况下,遗传异常导致至少约0.01%的染色体臂被复制。在一些情况下,遗传异常导致至少约0.1%的染色体臂被复制。在一些情况下,遗传异常导致至少约1%的染色体臂被复制。在一些情况下,遗传异常导致至少约10%的染色体臂被复制。在一些情况下,至少约20%的染色体臂被复制。在一些情况下,至少约30%的染色体臂被复制。在一些情况下,至少约50%的染色体臂被复制。在一些情况下,至少约70%的染色体臂被复制。在一些情况下,至少约90%的染色体臂被复制。在一些情况下,整个染色体臂被复制。
在一些情况下,遗传异常导致至少约0.001%的染色体臂被删除。在一些情况下,遗传异常导致至少约0.01%的染色体臂被删除。在一些情况下,遗传异常导致至少约0.1%的染色体臂被删除。在一些情况下,遗传异常导致至少约1%的染色体臂被删除。在一些情况下,遗传异常导致至少约10%的染色体臂被删除。在一些情况下,至少约20%的染色体臂被删除。在一些情况下,至少约30%的染色体臂被删除。在一些情况下,至少约50%的染色体臂被删除。在一些情况下,至少约70%的染色体臂被删除。在一些情况下,至少约90%的染色体臂被删除。在一些情况下,整个染色体臂被删除。
在一些情况下,方法包括当检测到对应于靶染色体区域的一定数量的测序读取时检测出胎儿具有遗传异常,其中该数量指示遗传异常。
在一些情况下,本文公开的方法包括对核酸进行测序。在一些情况下,核酸是无细胞核酸。在一些情况下,核酸包括无细胞胎儿核酸。在一些情况下,核酸是无细胞胎儿核酸。在一些情况下,本文公开的方法包括产生至少最小量的测序读取。在一些情况下,最小量的测序读取约为100。在一些情况下,最小量的测序读取约为1000。在一些情况下,最小量的测序读取约为2000。在一些情况下,最小量的测序读取约为3000。在一些情况下,最小量的测序读取约为4000。在一些情况下,最小量的测序读取约为5000。在一些情况下,最小量的测序读取约为6000。在一些情况下,最小量的测序读取约为7000。在一些情况下,最小量的测序读取约为8000。在一些情况下,最小量的测序读取约为9000。在一些情况下,最小量的测序读取约为10,000。
在一些情况下,方法包括当(1)对应于靶染色体区域的测序读取与(2)对应于至少一个非靶染色体区域的测序读取的比率不同于来自胎儿没有遗传异常的对照妊娠受试者的对照生物样品的相应比率时,检测胎儿具有遗传异常。在一些情况下,方法包括检测出胎儿具有遗传异常,因为(1)对应于靶染色体区域的测序读取与(2)对应于至少一个非靶染色体区域的测序读取的比率不同于来自胎儿没有遗传异常的对照妊娠受试者的对照生物样品的相应比率。在一些情况下,方法包括当(1)对应于靶染色体区域的测序读取与(2)对应于至少一个非靶染色体区域的测序读取的比率与来自胎儿没有遗传异常的对照妊娠受试者的对照生物样品的相应比率没有不同时,检测出胎儿不具有遗传异常。在一些情况下,染色体区域和非靶染色体区域位于相同染色体上。在一些情况下,染色体区域和非靶染色体区域位于不同的染色体上。
在一些情况下,遗传信息的检测具有一定的准确度。遗传信息的非限制性实例包括胎儿非整倍性、遗传异常、肿瘤DNA的存在/数量以及移植的器官/组织DNA的存在/数量。在一些情况下,以至少约95%的准确度检测遗传信息。在一些情况下,以至少约96%的准确度检测遗传信息。在一些情况下,以至少约97%的准确度检测遗传信息。在一些情况下,以至少约98%的准确度检测遗传信息。在一些情况下,以至少约99%的准确度检测遗传信息。在一些情况下,以至少约99.5%的准确度检测遗传信息。在一些情况下,以至少约99.9%的准确度检测遗传信息。在一些情况下,以至少约99.99%的准确度检测遗传信息。
来自每个染色体的读取大致根据染色体的长度来表现。大多数读取源自1号染色体,而来自常染色体的最少读取源自21号染色体。检测三体样品的常用方法是测量整倍体样品的群体中源自染色体的读取百分比。接下来,计算这组染色体百分比值的平均值和标准偏差。截断值是通过在平均值上加三个标准偏差确定的。如果新样品的染色体百分比值高于截断值,则可以认为该染色体具有高表现度,这通常与染色体的三体性相符。实施例13给出了检测染色体高表现的一个预示性实例。
在一些情况下,当(1)对应于至少一个靶染色体的测序读取与(2)对应于至少一个非靶染色体的测序读取的比率与来自怀有整倍体胎儿的对照妊娠受试者的对照生物样品的相应比率相差至少约0.1%时,检测出胎儿非整倍性。在一些情况下,比率相差至少1%。
在一些情况下,对照妊娠受试者是整倍体妊娠受试者。在一些情况下,对照是一组妊娠受试者的平均值或中值。在一些情况下,对照是来自妊娠受试者的血浆样品库的平均值或中值。在一些情况下,对照是类似地从模拟怀有整倍体胎儿的妊娠受试者的核酸人工混合物中获得的值。在一些情况下,对照妊娠受试者是怀有具有整倍体染色体组的胎儿的整倍体妊娠受试者。在一些情况下,对照妊娠受试者没有遗传异常,例如,拷贝数变异。在一些情况下,对照妊娠受试者所怀的胎儿不具有遗传异常,例如,拷贝数变异。在一些情况下,对照妊娠受试者在本文公开的靶染色体中不具有遗传异常。在一些情况下,对照妊娠受试者所怀的胎儿在本文公开的靶染色体中不具有遗传异常。在一些情况下,对照妊娠受试者和她的胎儿中的至少一个具有非整倍性。在一些情况下,对照妊娠受试者和她的胎儿中的至少一个具有本文公开的遗传异常。在一些情况下,对照妊娠受试者和她的胎儿中的至少一个在本文公开的靶染色体中具有遗传异常。在一些情况下,本文公开的方法包括使用来自对照妊娠群体的对照生物样品的相应比例。在一些情况下,相应比例来自对照妊娠群体的相应平均比例。在一些情况下,相应比例来自对照妊娠群体的相应中值比例。
检测胎儿性别的方法
在一些实施方案中,本文公开的方法包括从女性受试者获得生物样品,其中所述生物样品包含至少一种包括独特于Y染色体的序列的无细胞胎儿核酸。在一些情况下,独特于Y染色体的序列指示胎儿是男性。在一些情况下,本文公开的方法包括从女性受试者获得生物样品,其中所述生物样品包含约1至约5种无细胞胎儿核酸,所述无细胞胎儿核酸包含独特于Y染色体序列。在一些情况下,本文公开的方法包括从女性受试者获得生物样品,其中所述生物样品包含约1至约15种无细胞胎儿核酸,所述无细胞胎儿核酸包括独特于Y染色体的序列。在一些情况下,本文公开的方法包括从女性受试者获得生物样品,其中所述生物样品包含约1至约25种无细胞胎儿核酸,所述无细胞胎儿核酸包括独特于Y染色体的序列。在一些情况下,本文公开的方法包括从女性受试者获得生物样品,其中所述生物样品包含约1至约100种无细胞胎儿核酸,所述无细胞胎儿核酸包括独特于Y染色体序列。在一些情况下,本文公开的方法包括从女性受试者获得生物样品,其中所述生物样品包含约5至约100种无细胞胎儿核酸,所述无细胞胎儿核酸包括独特于Y染色体序列。
作为非限制性实例,方法可以包括用手持设备从妊娠女性受试者获得液体样品,其中液体样品的体积不大于约300μl;用所述手持设备测序所述液体样品中的至少一种无细胞核酸;通过所述手持设备中的显示器检测与Y染色体对应的序列存在或不存在,从而确定所述女性妊娠受试者中胎儿的性别;和与所述手持设备将所述性别传达给另一受试者。在一些情况下,所述生物样品的体积不大于约120μl。在一些情况下,所述方法包括检测对应于Y染色体的测序读段。
还作为非限制性实例,方法可以包括从女性受试者获得生物样品,其中生物样品的体积不大于约120μl;将所述样品与包括对应于Y染色体的序列的寡核苷酸引物接触以扩增所述样品中的至少一种循环无细胞核酸;检测扩增产物不存在,从而表明胎儿是女性。获得,接触和检测可以用单个设备进行。
在一些情况下,本文公开的设备、系统和试剂盒包括至少一种核酸扩增试剂和至少一种能够扩增基因组中的第一序列和基因组中的第二序列的寡核苷酸引物,其中所述第一序列和所述第二序列是相似的,并且其中所述第一序列与所述第二序列在物理上足够远,使得所述第一序列存在于所述受试者的第一无细胞核酸上,并且所述第二序列存在于所述受试者的第二无细胞核酸上。在一些情况下,所述至少两个序列是紧邻的。在一些情况下,至少两个序列被至少一个核苷酸分隔。在一些情况下,所述至少两个序列被至少两个核苷酸分隔。在一些情况下,所述至少两个序列被至少约5个、至少约10个、至少约15个、至少约20个、至少约30个、至少约40个、至少约50个或至少约100个核苷酸分隔。在一些情况下,所述至少两个序列至少约50%相同。在一些情况下,所述至少两种序列至少约60%相同、至少约60%相同、至少约60%、至少约70%、至少约80%、至少约90%、至少约95%、至少约99%或100%相同。在一些情况下,所述第一序列和第二序列各自的长度为至少10个核苷酸。在一些情况下,所述第一序列和第二序列各自的长度为至少约10个、至少约15个、至少约20个、至少约30个、至少约50个或至少约100个核苷酸。在一些情况下,所述第一序列和第二序列在相同的染色体上。在一些情况下,第一序列在第一染色体上并且第二序列在第二染色体上。在一些情况下,第一序列和第二序列是功能性连接的。例如,基因AOX1的启动子区域中的所有CpG位点在前列腺癌中显示出相同的高甲基化,因此这些位点是功能性连接的,因为它们在功能上携带相同的信息,但相距一个或多个核苷酸。
在一些情况下,本文公开的设备、系统和试剂盒包括能够与无细胞核酸的链退火的寡核苷酸探针或寡核苷酸引物中的至少一种,其中所述无细胞核酸包括对应于目标区域或其部分的序列。在一些情况下,所述目标区域是Y染色体的区域。在一些情况下,所述目标区域是X染色体的区域。在一些情况下,所述目标区域是常染色体的区域。在一些情况下,如本文所述,目标区域或其部分包括存在于基因组中多于一次的重复序列。
在一些情况下,本文公开的目标区域的长度为约10个核苷酸至约1000000个核苷酸。在一些情况下,所述目标区域的长度为至少10个核苷酸。在一些情况下,目标区域的长度为至少100个核苷酸。在一些情况下,所述区域的长度为至少1000个核苷酸。在一些情况下,所述目标区域的长度为约10个核苷酸至约500000个核苷酸。在一些情况下,所述目标区域的长度为约10个核苷酸至约300000个核苷酸。在一些情况下,所述目标区域的长度为约100个核苷酸至约1000000个核苷酸。在一些情况下,所述目标区域的长度为约100个核苷酸至约500000个核苷酸。在一些情况下,所述目标区域的长度为约100个核苷酸至约300000个碱基对。在一些情况下,所述目标区域的长度为约1000个核苷酸至约1000000个核苷酸。在一些情况下,所述目标区域的长度为约1000个核苷酸至约500000个核苷酸。在一些情况下,所述目标区域的长度为约1000个核苷酸至约300000个核苷酸。在一些情况下,所述目标区域的长度为约10000个核苷酸至约1000000个核苷酸。在一些情况下,所述目标区域的长度为约10000个核苷酸至约500000个核苷酸。在一些情况下,所述目的区域的长度为约10000个核苷酸至约300000个核苷酸。在一些情况下,所述目标区域的长度为约300000个核苷酸。
在一些情况下,所述对应于目标区域的序列长度为至少约5个核苷酸。在一些情况下,所述对应于目标区域的序列长度为至少约8个核苷酸。在一些情况下,所述对应于目标区域的序列长度为至少约10个核苷酸。在一些情况下,所述对应于目标区域的序列长度为至少约15个核苷酸。在一些情况下,所述对应于目标区域的序列长度为至少约20个核苷酸。在一些情况下,所述对应于目标区域的序列长度为至少约50个核苷酸。在一些情况下,所述对应于目标区域的序列长度为至少约100个核苷酸。在一些情况下,所述序列长度为约5个核苷酸至约1000个核苷酸。在一些情况下,所述序列长度为约10个核苷酸至约1000个核苷酸。在一些情况下,所述序列长度为约10个核苷酸至约500个核苷酸。在一些情况下,所述序列长度为约10个核苷酸至约400个核苷酸。在一些情况下,所述序列长度为约10个核苷酸至约300个核苷酸。在一些情况下,所述序列长度为约50个核苷酸至约1000个核苷酸。在一些情况下,所述序列长度为约50个核苷酸至约500个核苷酸。
在一些情况下,本文公开的设备、系统和试剂盒包括能够与无细胞核酸的链退火的寡核苷酸探针和寡核苷酸引物中的至少一种,其中所述无细胞核酸包括对应于本文公开的目标子区域的序列。在一些情况下,所述子区域由存在于目标区域中多于一次的序列表示。在一些情况下,所述子区域的长度为约10至约1000个核苷酸。在一些情况下,所述子区域的长度为约50至约500个核苷酸。在一些情况下,所述子区域的长度为约50至约250个核苷酸。在一些情况下,所述子区域的长度为约50至约150个核苷酸。在一些情况下,所述子区域的长度为约100个核苷酸。
在一些情况下,本文公开的设备、系统和试剂盒包括至少一种寡核苷酸引物,其中所述寡核苷酸引物具有与Y染色体序列互补或对应的序列。在一些情况下,本文公开的设备、系统和试剂盒包括寡核苷酸引物对,其中所述寡核苷酸引物对具有与Y染色体序列互补或对应的序列。在一些情况下,本文公开的设备、系统和试剂盒包括至少一种寡核苷酸引物,其中所述寡核苷酸引物包括与Y染色体序列互补或对应的序列。在一些情况下,本文公开的设备、系统和试剂盒包括寡核苷酸引物对,其中所述寡核苷酸引物对包括与Y染色体序列互补或对应的序列。在一些情况下,本文公开的设备、系统和试剂盒包括至少一种寡核苷酸引物,其中所述寡核苷酸引物由与Y染色体序列互补或对应的序列组成。在一些情况下,本文公开的设备、系统和试剂盒包括寡核苷酸引物对,其中所述寡核苷酸引物对由与Y染色体序列互补或对应的序列组成。在一些情况下,所述与Y染色体序列互补或对应的序列与野生型人Y染色体序列有至少75%的同一性。在一些情况下,所述与Y染色体序列互补或对应的序列与野生型人Y染色体序列有至少80%的同一性。在一些情况下,所述与Y染色体序列互补或对应的序列与野生型人Y染色体序列有至少85%的同一性。在一些情况下,所述与Y染色体序列互补或对应的序列与野生型人Y染色体序列有至少80%的同一性。在一些情况下,所述与Y染色体序列互补或对应的序列与野生型人Y染色体序列有至少90%的同一性。在一些情况下,所述与Y染色体序列互补或对应的序列与野生型人Y染色体序列有至少95%的同一性。在一些情况下,所述与Y染色体序列互补或对应的序列与野生型人Y染色体序列有至少97%的同一性。在一些情况下,所述与Y染色体序列互补或对应的序列与野生型人Y染色体序列有100%的同一性。
检测单核苷酸多态性
在一些情况下,本文所述的方法包括(a)从妊娠受试者获得包括无细胞胎儿核酸的生物样品;(b)任选地,离体富集可能在混合样品中的无细胞胎儿核酸;(c)任选地,离体扩增所述无细胞核酸;(d)优先离体富集无细胞胎儿核酸中的特定位点;(e)离体测量所述无细胞核酸以生成基因型数据;和(f)分析在计算机上离体获得的基因型数据。在一些实施方案中,所述基因型数据包括染色体异常。在一些实施方案中,所述基因型数据包括基因组中的一个或多个遗传突变或天然变异。在一些实施方案中,通过计算最大似然算法来进行分析步骤(f)。在一些实施方案中,最大似然算法使用与每个假设相关的等位基因分布以估计以每个假设为条件的数据的似然性。在一些情况下,无细胞核酸包括一种或多种单核苷酸多态性(SNP)或者插入或缺失(indel)或其组合。
在一些情况下,本文公开的方法采用以下设备、系统和试剂盒。
设备、系统和试剂盒
本文公开的方面提供用于从生物样品获得遗传信息的设备、系统和试剂盒。如本文所述,本文公开的设备、系统和试剂盒允许用户在选择的位置收集和测试生物样品,以检测样品中靶分析物的存在和/或数量。在一些情况下,本文公开的设备、系统和试剂盒用于前述方法中。在一些情况下,本文公开的设备、系统和试剂盒包含样品纯化器,其从受试者的生物样品去除至少一种组分(例如,细胞、细胞片段、蛋白质);核酸测序仪,其用于对生物样品中的至少一种核酸进行测序;以及核酸序列输出,其用于将序列信息转发给设备、系统或试剂盒的用户。
通常,本公开内容的设备、系统和试剂盒整合了多种功能,例如,对靶分析物(例如,包括其扩增产物)的纯化、扩增和检测及其组合。在一些情况下,多种功能在单个测定组装件单元或单个设备中执行。在一些情况下,所有功能都发生在单个单元或设备之外。在一些情况下,至少一种功能发生在单个单元或设备之外。在一些情况下,仅一种功能发生在单个单元或设备之外。在一些情况下,样品纯化器、核酸扩增试剂、寡核苷酸和检测试剂或组件被容纳在单个设备中。通常,本公开内容的设备、系统和试剂盒包含显示器,与显示器的连接或与显示器的通信,用于将关于生物样品的信息转发给一个或多个人。
在一些情况下,设备、系统和试剂盒包含本文公开的附加组件。附加组件的非限制性实例包括样品运输隔室、样品储存隔室、样品和/或试剂接受器、温度指示器、电子端口、通信连接、通信设备、样品收集设备和壳体单元。在一些情况下,附加组件与设备集成。在一些情况下,附加组件不与设备集成。在一些情况下,附加组件与样品纯化器、核酸扩增试剂、寡核苷酸以及检测试剂或组件被容纳在单个设备中。在一些情况下,附加组件不被容纳在单个设备中。
在一些情况下,本文公开的设备、系统和试剂盒包含用于获得样品、提取无细胞核酸和纯化无细胞核酸的组件。在一些情况下,本文公开的设备、系统和试剂盒包含用于获得样品、提取无细胞核酸、纯化无细胞核酸以及制备无细胞核酸的文库的组件。在一些情况下,本文公开的设备、系统和试剂盒包含用于获得样品、提取无细胞核酸、纯化无细胞核酸以及测序无细胞核酸的组件。在一些情况下,本文公开的设备、系统和试剂盒包含用于获得样品、提取无细胞核酸、纯化无细胞核酸、制备无细胞核酸的文库以及测序无细胞核酸的组件。举非限制性实例而言,用于获得样品的组件是经皮穿刺设备和用于从血液获得血浆的过滤器。同样,举非限制性实例而言,用于提取和纯化无细胞核酸的组件包含缓冲液、珠子和磁体。缓冲液、珠子和磁体的供应量应可以适合于从手指针刺中获得常见样品体积(例如,50-150μl的血液)。
在一些情况下,设备、系统和试剂盒包含用于接收生物样品的接受器。接受器可以被配置为容纳1μl至1ml的生物样品。接受器可以被配置为容纳1μl至500μl的生物样品。接受器可以被配置为容纳1μl至200μl的生物样品。接受器可以具有与用于由其余设备/系统组件进行处理和分析的样品的合适体积相同的限定体积。这将排除对设备、系统或试剂盒的用户测量出样品的指定体积的需要。用户将仅需要填充接受器,由此确保适当体积的样品被递送至设备/系统。在一些情况下,设备、系统和试剂盒不包含用于接收生物样品的接受器。在一些情况下,样品纯化器直接接收生物样品。与上述对接受器的描述相似,样品纯化器可具有适于由其余设备/系统组件进行处理和分析的限定体积。通常,本文公开的设备、系统和试剂盒旨在完全在照护点处使用。然而,在一些情况下,用户可能希望将经分析的样品保存或送至另一个位置(例如,实验室、诊所)以对在照护点处获得的结果进行附加的分析或确认。举非限制性实例而言,设备/系统可以从血液分离血浆。可以在照护点处分析血浆,并将血液中的细胞运送到另一个位置进行分析。在一些情况下,出于这些目的,设备、系统和试剂盒包含运输隔室或储存隔室。运输隔室或储存隔室可以能够容纳生物样品、其组分或其部分。运输隔室或储存隔室在运送到远离直接用户的地点期间可以能够容纳生物样品、其部分或其组分。运输隔室或储存隔室可以能够容纳从生物样品取出的细胞,从而可以将细胞发送到远离直接用户的地点进行测试。当直接用户在家时,远离直接用户的地点的非限制性实例可以是实验室或诊所。在一些情况下,家庭没有机器或另外的设备来对生物样品执行另外的其他分析。运输隔室或储存隔室可以能够容纳由将生物样品添加至设备而产生的反应或过程的产物。在一些情况下,反应或过程的产物是核酸扩增产物或逆转录产物。在一些情况下,反应或过程的产物是与本文所述的结合部分结合的生物样品组分。生物样品组分可以包括核酸、细胞片段、细胞外囊泡、蛋白质、肽、甾醇、脂质、维生素或葡萄糖,其任一种都可以在用户的远程位置处进行分析。在一些情况下,运输隔室或储存隔室包含吸收垫、纸、玻璃容器、塑料容器、聚合物基体、液体溶液、凝胶、防腐剂或其组合。吸收垫或纸可用于稳定和运输具有用于筛选的蛋白质或其他生物标志物的干燥的生物流体。
在一些情况下,本文公开的设备和系统提供了对样品的无细胞核酸(例如,循环RNA和/或DNA)和非核酸样品组分的分析。对无细胞核酸和非核酸组分的分析都可以在需求点处进行。在一些情况下,系统和设备提供在需求点处对无细胞核酸的分析,以及对样品的至少一部分或组分的保存,以用于在远离需求点的地点分析非核酸组分。在一些情况下,系统和设备提供在需求点处对非核酸组分的分析以及对样品的至少一部分或组分的保存,以用于在远离需求点的地点分析无细胞核酸。这些设备和系统可用于载体测试和检测遗传性疾病,例如本文公开的那些。
在一些情况下,运输隔室或储存隔室包含防腐剂。防腐剂在本文中也可以称为稳定剂或生物稳定剂。在一些情况下,设备、系统或试剂盒包含在储存和/或运输过程中降低酶活性的防腐剂。在一些情况下,防腐剂是全血防腐剂。全血防腐剂或其组分的非限制性实例是葡萄糖、腺嘌呤、柠檬酸、柠檬酸三钠、右旋糖、二磷酸钠和磷酸二氢钠。在一些情况下,防腐剂包含EDTA。EDTA可以降低酶活性,否则该酶活性会降解核酸。在一些情况下,防腐剂包含甲醛。在一些情况下,防腐剂是已知的甲醛衍生物。甲醛或其衍生物可以使蛋白质交联,因此可以稳定细胞并防止细胞裂解。
通常,本文公开的设备和系统对于单个人而言是便携式的。在一些情况下,设备和系统是手持式的。在一些情况下,设备和系统具有最大长度、最大宽度或最大高度。在一些情况下,设备和系统被容纳在具有最大长度、最大宽度或最大高度的单个单元中。在一些情况下,最大长度不大于12英寸。在一些情况下,最大长度不大于10英寸。在一些情况下,最大长度不大于8英寸。在一些情况下,最大长度不大于6英寸。在一些情况下,最大宽度不大于12英寸。在一些情况下,最大宽度不大于10英寸。在一些情况下,最大宽度不大于8英寸。在一些情况下,最大宽度不大于6英寸。在一些情况下,最大宽度不大于4英寸。在一些情况下,最大高度不大于12英寸。在一些情况下,最大高度不大于10英寸。在一些情况下,最大高度不大于8英寸。在一些情况下,最大高度不大于6英寸。在一些情况下,最大高度不大于4英寸。在一些情况下,最大高度不大于2英寸。在一些情况下,最大高度不大于1英寸。
样品收集
在一些情况下,本文公开的设备、系统和试剂盒包含样品收集器。在一些情况下,样品收集器相对于设备、系统或试剂盒的其余部分单独提供。在一些情况下,样品收集器与设备、系统或试剂盒或其组件物理集成。在一些情况下,样品收集器与本文所述的接受器集成。在一些情况下,样品收集器可以是用于施加生物流体的杯、管、毛细管或孔。在一些情况下,样品收集器可以是用于施加尿液的杯。在一些情况下,样品收集器可以包含用于将杯中的尿液施加到设备、系统或试剂盒的移液管。在一些情况下,样品收集器可以是与本文公开的设备集成的用于施加血液的毛细管。在一些情况下,样品收集器可以是与本文公开的设备集成的用于施加唾液的管、孔、垫或纸。在一些情况下,样品收集器可以是用于施加汗液的垫或纸。
在一些情况下,本文公开的设备、系统和试剂盒包含经皮穿刺设备。经皮穿刺设备的非限制性实例是针和刺血针。在一些情况下,样品收集器包含经皮穿刺设备。在一些情况下,本文公开的设备、系统和试剂盒包含微针、微针阵列或微针贴片。在一些情况下,本文公开的设备、系统和试剂盒包含中空微针。举非限制性实例而言,经皮穿刺设备与孔或毛细管集成,使得当受试者针刺其手指时,血液被释放到孔或毛细管中,在该孔或毛细管中血液将可用于系统或设备以分析其组分。在一些情况下,经皮穿刺设备是在凹表面中具有针或刺血针的按钮设备。在一些情况下,针是微针。在一些情况下,经皮穿刺设备包含微针阵列。通过按压凹表面的非针侧上的致动器、按钮或位置,针以比刺血针更受控的方式针刺受试者的皮肤。此外,按钮设备可以包含真空源或柱塞,以帮助从穿刺部位抽血。
在一些情况下,本文公开的设备、系统和试剂盒包括不需要经皮穿刺的设备,由于例如裂解皮肤的紧密连接处使得液体包含可靠的遗传信息。
样品处理器和纯化器
本文公开了包含样品处理器的设备、系统和试剂盒,其中样品处理器修饰生物样品以去除样品的组分或将样品分成多个部分(例如,血细胞部分和血浆或血清)。样品处理器可以包含样品纯化器,其中样品纯化器被配置为去除生物样品的不需要的物质或非靶组分,从而修饰样品。根据生物样品的来源,不需要的物质可以包括但不限于蛋白质(例如,抗体、激素、酶、血清白蛋白、脂蛋白)、游离氨基酸和其他代谢物、微泡、核酸、脂质、电解质、尿素、尿胆素、药物、粘液、细菌和其他微生物及其组合。在一些情况下,样品纯化器分离本文公开的生物样品的组分。在一些情况下,本文公开的样品纯化器去除将会抑制、干扰或以其他方式对诸如核酸扩增或检测等后续处理步骤有害的样品组分。在一些情况下,所得的修饰样品富集靶分析物。这可以被认为是靶分析物的间接富集。备选地或附加地,可以直接捕获靶分析物,这被认为是靶分析物的直接富集。
在一些情况下,所述生物样品包括胎儿滋养层,其在一些情况下包含胎儿的遗传信息(例如RNA,DNA)。在一些情况下,所述样品处理器被配置为富集生物样品中的胎儿滋养层,例如通过形态学(例如,大小)或标记抗原(例如,细胞表面抗原)。在一些情况下,所述样品处理器被配置为使用上皮肿瘤细胞大小分离(ISET)的方法富集滋养层。在一些情况下,所述样品处理器被配置为通过使生物样品与对滋养层的细胞表面抗原具有特异性的抗体或抗原结合片段接触来富集生物样品中的滋养层。滋养层细胞表面抗原的非限制性实例包括原肌球蛋白-1(Trop1)、原肌球蛋白-2(Trop2)、细胞和合胞体滋养层标志物、GB25、人胎盘催乳素(HPL)和α人绒毛膜促性腺激素(αHCG)。在一些情况下,所述样品纯化器被配置为使用荧光激活细胞分选法(FACS)、柱层析或磁性分选法(例如Dynabeads)从生物样品中纯化或分离胎儿滋养层。使用任何合适的DNA提取方法,例如本文所述的方法,通过样品纯化器从富集和/或纯化的滋养层中提取胎儿基因组DNA。
在一些情况下,所述样品处理器被配置为通过步骤处理胎儿滋养层:(1)从生物样品中分离滋养层;(2)裂解分离的滋养层;(3)裂解分离的胎儿滋养层;和(4)从分离的胎儿滋养层中纯化基因组DNA。在一些情况下,在裂解或分离之前用DNA酶处理胎儿细胞核。在非限制性实例中,将包含胎儿和母体细胞(例如滋养层)的生物样品离心并重悬于培养基中。然后,使用磁性分离程序(例如,与细胞表面抗原特异性单克隆抗体缀合的磁性纳米颗粒)机械分离细胞。洗涤细胞并悬浮于培养基中。使用DynaMagTM旋转磁体(Life Technologies)将母体细胞(例如,细胞表面抗原阴性)与磁化的(细胞表面抗原阳性)胎儿滋养层细胞分离。使用磁体多次洗涤胎儿滋养层细胞以去除残留的母体细胞。将分离的胎儿滋养层细胞重悬于溶液中。通过加入裂解缓冲液裂解分离的胎儿滋养层细胞,然后低速离心沉淀完整的胎儿滋养层细胞核。去除上清液,并洗涤细胞核多次。通过向胎儿滋养层细胞核中加入25微升3X浓缩的DNA提取缓冲液,从胎儿滋养层细胞核中提取基因组DNA,并孵育约3小时。任选地,DNA被进一步纯化,例如使用商业的DNA纯化和浓缩试剂盒。
在一些情况下,样品纯化器包含分离材料,用于从生物样品去除患者细胞以外的不需要的物质。有用的分离材料可以包括与物质结合或缔合的特定结合部分。结合可以是共价的或非共价的。可以使用本领域已知的用于去除特定物质的任何合适的结合部分。例如,通常使用抗体及其片段从样品去除蛋白质。在一些情况下,本文公开的样品纯化器包含结合部分,该结合部分与生物样品中的核酸、蛋白质、细胞表面标志物或微泡表面标志物结合。在一些情况下,结合部分包括抗体、抗原结合抗体片段、配体、受体、肽、小分子或其组合。
在一些情况下,本文公开的样品纯化器包含过滤器。在一些情况下,本文公开的样品纯化器包含膜。通常,过滤器或膜能够从本文公开的生物样品分离或去除细胞、细胞颗粒、细胞片段、除无细胞核酸之外的血液组分或其组合。
在一些情况下,样品纯化器有助于从血液样品的细胞组分分离血浆或血清。在一些情况下,样品纯化器有助于在开始分子扩增反应或测序反应之前从血液样品的细胞组分分离血浆或血清。血浆或血清分离可以通过几种不同的方法来实现,例如离心、沉降或过滤。在一些情况下,样品纯化器包含用于接收全血的过滤基质,该过滤基质具有阻止细胞通过的孔径,而血浆或血清可以不受抑制地通过该过滤基质。在一些情况下,过滤基质将过滤器顶部处的大孔径与过滤器底部处的小孔径相结合,这导致对细胞非常温和的处理,从而防止过滤过程中的细胞降解或裂解。这是有利的,因为细胞降解或裂解将导致核酸从血细胞或母体细胞释放,这将污染靶无细胞核酸。这样的过滤器的非限制性实例包括PallVividTM GR膜、Munktell Ahlstrom滤纸(参见例如,WO2017017314)、TeraPore过滤器。
在一些情况下,本文公开的设备、系统和试剂盒采用垂直过滤,垂直过滤由毛细管力驱动以从样品中分离组分或级分(例如,从血液分离血浆)。举非限制性实例而言,垂直过滤可以包括重力辅助的血浆分离。高效超疏水性血浆分离器在例如Liu等人,A HighEfficiency Superhydrophobic Plasma Separation,Lab Chip 2015中描述。
样品纯化器可以包含侧向过滤器(例如,样品不沿重力方向移动或样品垂直于重力方向移动)。样品纯化器可以包含垂直过滤器(例如,样品在重力方向上移动)。样品纯化器可以包含垂直过滤器和侧向过滤器。样品纯化器可被配置为通过垂直过滤器,随后通过侧向过滤器来接收样品或其部分。样品纯化器可被配置为通过侧向过滤器,随后通过垂直过滤器来接收样品或其部分。在一些情况下,垂直过滤器包含过滤基质。在一些情况下,垂直过滤器的过滤基质包含孔,该孔具有阻止细胞通过的孔径,而血浆可以不受抑制地通过该过滤基质。在一些情况下,过滤基质包含特别适合于该应用的膜,因为其将过滤器顶部处的大孔径与过滤器底部处的小孔径相结合,这导致对细胞非常温和的处理,从而防止在过滤过程中的细胞降解。
在一些情况下,样品纯化器包含适当的分离材料,例如过滤器或膜,其从生物样品去除不需要的物质而不去除无细胞核酸。在一些情况下,分离材料基于大小分离生物样品的物质,例如,分离材料具有排除细胞但可渗透无细胞核酸的孔径。因此,当生物样品是血液时,血浆或血清可以比血细胞更快地移动通过样品纯化器中的分离材料,并且含有任何无细胞核酸的血浆或血清渗透分离材料的孔。在一些情况下,生物样品是血液,并且在分离材料中减慢和/或捕获的细胞是红细胞、白细胞或血小板。在一些情况下,细胞来自与体内的生物样品接触的组织,包括但不限于膀胱或尿道上皮细胞(尿液的情况)或口腔细胞(唾液的情况)。在一些情况下,细胞是细菌或其他微生物。
在一些情况下,样品纯化器能够减慢和/或捕获细胞而不损伤细胞,从而避免释放包括细胞核酸和其他蛋白质或细胞片段在内的细胞内容物,这些内容物可能会干扰无细胞核酸的后续评估。这可以例如通过沿侧流条的路径将孔径逐渐、渐进地减小或其他合适的测定形式来实现,以允许细胞移动温和地减慢,从而使对细胞的力最小化。在一些情况下,当在分离材料中捕获时,生物样品至少95%、至少98%、至少99%或至多100%的细胞保持完整。除大小分离之外或独立于大小分离,分离材料可以基于除大小以外的细胞性质捕获或分离不需要的物质,例如,分离材料可以包含与细胞表面标志物结合的结合部分。在一些情况下,结合部分是抗体或抗原结合抗体片段。在一些情况下,结合部分是针对血细胞或微泡上受体的配体或受体结合蛋白。
在一些情况下,本文公开的系统和设备包含分离材料,该分离材料通过样品纯化器、过滤器和/或膜来移动、抽取、推动或拉动生物样品。在一些情况下,该材料是芯吸材料。在样品纯化器中用于去除细胞的适当分离材料的实例包括但不限于聚偏二氟乙烯、聚四氟乙烯、乙酸纤维素、硝化纤维素、聚碳酸酯、聚对苯二甲酸乙二醇酯、聚乙烯、聚丙烯、玻璃纤维、硼硅酸盐、氯乙烯、银。合适的分离材料的特征可以在于防止细胞通过。在一些情况下,分离材料不受限制,只要其具有可以防止红细胞通过的特性即可。在一些情况下,分离材料是疏水过滤器,例如玻璃纤维过滤器、复合材料过滤器,例如Cytosep(例如,AhlstromFiltration,或Pall Specialty Materials,Port Washi ngton,NY),或亲水过滤器,例如纤维素(例如,Pall Specialty Materials)。在一些情况下,可以使用可商购的试剂盒(例如,Arrayit血卡血清分离试剂盒,Cat.ABCS,Arrayit Corporation,Sunnyvale,CA)根据本公开内容的方法将全血分为红细胞、白细胞和血清组分,以供进一步处理。
在一些情况下,样品纯化器包含以至少一种孔径为特征的至少一个过滤器或至少一个膜。在一些情况下,样品纯化器包含多个过滤器和/或膜,其中至少第一过滤器或膜的孔径不同于第二过滤器或膜的孔径。在一些情况下,至少一个过滤器/膜的至少一种孔径为约0.05微米至约10微米。在一些情况下,孔径为约0.05微米至约8微米。在一些情况下,孔径为约0.05微米至约6微米。在一些情况下,孔径为约0.05微米至约4微米。在一些情况下,孔径为约0.05微米至约2微米。在一些情况下,孔径为约0.05微米至约1微米。在一些情况下,至少一个过滤器/膜的至少一种孔径为约0.1微米至约10微米。在一些情况下,孔径为约0.1微米至约8微米。在一些情况下,孔径为约0.1微米至约6微米。在一些情况下,孔径为约0.1微米至约4微米。在一些情况下,孔径为约0.1微米至约2微米。在一些情况下,孔径为约0.1微米至约1微米。
在一些情况下,样品纯化器的特征在于温和的样品纯化器。温和的样品纯化器,如包含过滤基质、垂直过滤器、芯吸材料或带有不允许细胞通过的孔的膜的那些纯化器,特别适用于分析无细胞核酸。例如,母体血液中无细胞胎儿核酸的产前应用面临着额外挑战,即,在存在无细胞母体核酸的情况下分析无细胞胎儿核酸,无细胞母体核酸对无细胞胎儿核酸产生较大的背景信号。举非限制性实例而言,当在不因样品收集方法引起细胞裂解或其他细胞破坏的情况下获得样品时,母体血液样品可含有每毫升全血约500至750个基因组当量的总无细胞DNA(母体和胎儿)。从妊娠女性采样的血液中的胎儿分数可以为约10%,约每毫升50至75个基因组当量。获得无细胞核酸的过程通常涉及从血液获得血浆。如果不仔细操作,母体白细胞可能被破坏,向样品中释放额外的细胞核酸,对胎儿无细胞核酸产生大量背景噪音。典型的白细胞计数为每毫升血液约4*10^6至10*10^6个细胞,并且因此可用的核DNA比总无细胞DNA(cfDNA)多约4,000至10,000倍。因此,即使仅一小部分母体白细胞被破坏而向血浆中释放核DNA,胎儿分数也会大幅降低。例如,0.01%的白细胞降解可以将胎儿分数从10%降低至约5%。本文公开的设备、系统和试剂盒旨在减少这些背景信号。
在一些情况下,样品处理器被配置为从全血中分离血细胞。在一些情况下,样品处理器被配置为从全血中分离血浆。在一些情况下,样品处理器被配置为从全血中分离血清。在一些情况下,样品处理器被配置为从少于1毫升的全血中分离血浆或血清。在一些情况下,样品处理器被配置为从少于1毫升的全血中分离血浆或血清。在一些情况下,样品处理器被配置为从少于500μl的全血中分离血浆或血清。在一些情况下,样品处理器被配置为从少于400μl的全血中分离血浆或血清。在一些情况下,样品处理器被配置为从少于300μl的全血中分离血浆或血清。在一些情况下,样品处理器被配置为从少于200μl的全血中分离血浆或血清。在一些情况下,样品处理器被配置为从少于150μl的全血中分离血浆或血清。在一些情况下,样品处理器被配置为从少于100μl的全血中分离血浆或血清。
在一些情况下,本文公开的设备、系统和试剂盒包含用于产生修饰的样品的结合部分,所述修饰的样品去除了不需要或不感兴趣的细胞、细胞片段、核酸或蛋白质。在一些情况下,本文公开的设备、系统和试剂盒包含用于减少生物样品中的不需要或不感兴趣的细胞、细胞片段、核酸或蛋白质的结合部分。在一些情况下,本文公开的设备、系统和试剂盒包含用于产生修饰的样品的结合部分,所述修饰的样品富集了靶细胞、靶细胞片段、靶核酸或靶蛋白。
在一些情况下,本文公开的设备、系统和试剂盒包含能够结合核酸、蛋白质、肽、细胞表面标志物或微泡表面标志物的结合部分。在一些情况下,本文公开的设备、系统和试剂盒包含用于捕获生物样品的细胞外囊泡或细胞外微粒的结合部分。在一些情况下,细胞外囊泡含有DNA和RNA中的至少一种。在一些情况下,本文公开的设备、系统和试剂盒包含用于分析细胞外囊泡中含有的DNA或RNA的试剂或组件。在一些情况下,结合部分包含抗体、抗原结合抗体片段、配体、受体、蛋白质、肽、小分子或其组合。
在一些情况下,本文公开的设备、系统和试剂盒包含能够与细胞释放的细胞外囊泡相互作用或捕获该细胞外囊泡的结合部分。在一些情况下,该细胞是胎儿细胞。在一些情况下,该细胞是胎盘细胞。胎儿细胞或胎盘细胞可以在女性妊娠受试者的生物流体(例如,血液)中循环。在一些情况下,细胞外囊泡从器官、腺体或组织释放。举非限制性实例而言,器官、腺体或组织可以是患病的、衰老的、感染的或生长的。器官、腺体和组织的非限制性实例是脑、肝脏、心脏、肾脏、结肠、胰腺、肌肉、脂肪、甲状腺、前列腺、乳腺组织和骨髓。
举非限制性实例而言,本文公开的设备、系统和试剂盒可以能够捕获和丢弃来自母体样品的细胞外囊泡或细胞外微粒,以富集样品中的胎儿/胎盘核酸。在一些情况下,细胞外囊泡起源于胎儿/胎盘。在一些情况下,细胞外囊泡起源于胎儿细胞。在一些情况下,细胞外囊泡由胎儿细胞释放。在一些情况下,细胞外囊泡由胎盘细胞释放。胎盘细胞可以是滋养层细胞。在一些情况下,本文公开的设备、系统和试剂盒包含用于捕获胎盘培养的血小板的细胞结合部分,其可以含有胎儿DNA或RNA片段。这些可以用抗体或其他方法(低速离心)捕获/富集。在这种情况下,可以如本文所述分析胎儿DNA或RNA片段,以检测或指示染色体信息(例如,性别)。备选地或附加地,本文公开的设备、系统和试剂盒包含用于捕获来自母体细胞的生物样品的细胞外囊泡或细胞外微粒的结合部分。
在一些情况下,结合部分附接至固体支持物,其中在结合部分已经与生物样品接触后,可以将固体支持物与其余的生物样品分离,或者可以将生物样品与固体支持物分离。固体支持物的非限制性实例包括珠子、纳米颗粒、磁性颗粒、芯片、微芯片、纤维条、聚合物条、膜、基质、柱、板或其组合。
本文公开的设备、系统和试剂盒可以包含细胞裂解试剂。细胞裂解试剂的非限制性实例包括洗涤剂如NP-40,十二烷基硫酸钠以及包含铵、氯化物或钾的盐溶液。本文公开的设备、系统和试剂盒可以具有细胞裂解组分。细胞裂解组分可以是结构的或机械的,并且能够裂解细胞。举非限制性实例而言,细胞裂解组分可以剪切细胞以释放细胞内组分,如核酸。在一些情况下,本文公开的设备、系统和试剂盒不包含细胞裂解试剂。本文公开的一些设备、系统和试剂盒旨在分析无细胞核酸。
核酸扩增
通常,本文公开的设备、系统和试剂盒能够扩增核酸。本文公开的设备、系统和试剂盒通常包含DNA聚合酶。在一些情况下,本文公开的设备、系统和试剂盒包含逆转录酶,以从本文公开的生物样品的RNA产生互补DNA(cDNA),其中该cDNA可以与本文所述的基因组DNA类似地扩增和/或分析。本文公开的设备、系统和试剂盒通常还包含群集剂,其可以提高酶(例如DNA聚合酶和解旋酶)的效率。如本文其他地方所述,群集剂可以提高文库的效率。群集剂可以包含聚合物、蛋白质、多糖或其组合。可以在本文公开的设备、系统和试剂盒中使用的群集剂的非限制性实例是葡聚糖、聚(乙二醇)和葡聚糖。
传统的聚合酶链反应需要热循环。这将是可能的,但对于没有热循环仪机器的典型家庭用户而言不方便。在一些情况下,本文公开的设备、系统和试剂盒能够在不改变设备或系统或其组件的温度的情况下扩增核酸。在一些情况下,本文公开的设备、系统和试剂盒能够等温扩增核酸。等温扩增的非限制性实例如下:环介导等温扩增(LAMP)、链置换扩增(SDA)、解旋酶依赖性扩增(HDA)、切口酶扩增反应(NEAR)和重组酶聚合酶扩增(RPA)。因此,本文公开的设备、系统和试剂盒可以包括执行等温扩增所必需的试剂。等温扩增试剂的非限制性实例包括重组酶聚合酶、单链DNA结合蛋白和链置换聚合酶。通常,使用重组酶聚合酶扩增(RPA)的等温扩增采用三种核心酶,即重组酶、单链DNA结合蛋白和链置换聚合酶,以(1)将寡核苷酸引物与DNA中的同源序列配对,(2)稳定置换的DNA链以防止引物置换,以及(3)使用链置换DNA聚合酶延伸寡核苷酸引物。使用配对的寡核苷酸引物,可通过在室温下(最佳在37℃下)温育而发生指数DNA扩增。
在一些情况下,本文公开的设备、系统和试剂盒能够在一定温度下扩增核酸。在一些情况下,本文公开的设备、系统和试剂盒能够在不超过两个温度下扩增核酸。在一些情况下,本文公开的设备、系统和试剂盒能够在不超过三个温度下扩增核酸。在一些情况下,本文公开的设备、系统和试剂盒仅需要对设备、系统或试剂盒的一种试剂或组件进行初始加热。
在一些情况下,本文公开的设备、系统和试剂盒能够在一定温度范围内扩增核酸。在一些情况下,温度范围为约-50℃至约100℃。在一些情况下,温度范围为约-50℃至约90℃。在一些情况下,温度范围为约-50℃至约80℃。在一些情况下,温度范围为约-50℃至约70℃。在一些情况下,温度范围为约-50℃至约60℃。在一些情况下,温度范围为约-50℃至约50℃。在一些情况下,温度范围为约-50℃至约40℃。在一些情况下,温度范围为约-50℃至约30℃。在一些情况下,温度范围为约-50℃至约20℃。在一些情况下,温度范围为约-50℃至约10℃。在一些情况下,温度范围为约0℃至约100℃。在一些情况下,温度范围为约0℃至约90℃。在一些情况下,温度范围为约0℃至约80℃。在一些情况下,温度范围为约0℃至约70℃。在一些情况下,温度范围为约0℃至约60℃。在一些情况下,温度范围为约0℃至约50℃。在一些情况下,温度范围为约0℃至约40℃。在一些情况下,温度范围为约0℃至约30℃。在一些情况下,温度范围为约0℃至约20℃。在一些情况下,温度范围为约0℃至约10℃。在一些情况下,温度范围为约15℃至约100℃。在一些情况下,温度范围为约15℃至约90℃。在一些情况下,温度范围为约15℃至约80℃。在一些情况下,温度范围为约15℃至约70℃。在一些情况下,温度范围为约15℃至约60℃。在一些情况下,温度范围为约15℃至约50℃。在一些情况下,温度范围为约15℃至约40℃。在一些情况下,温度范围为约15℃至约30℃。在一些情况下,温度范围为约10℃至约30℃。在一些情况下,本文公开的设备、系统、试剂盒,包括其所有组件及其所有试剂,在室温下完全可操作,不需要冷却、冷冻或加热。
在一些情况下,本文公开的设备、系统和试剂盒的至少一部分在约20℃至约50℃下操作。在一些情况下,本文公开的设备、系统和试剂盒的至少一部分在约37℃下操作。在一些情况下,本文公开的设备、系统和试剂盒的至少一部分在约42℃下操作。在一些情况下,本文公开的设备、系统和试剂盒有利地在室温下操作。在一些情况下,本文公开的设备、系统和试剂盒的至少一部分能够在约20℃至约30℃下等温扩增核酸。在一些情况下,本文公开的设备、系统和试剂盒的至少一部分能够在约23℃至约27℃下等温扩增核酸。
在一些情况下,本文公开的设备、系统、试剂盒和方法包括带有脱碱基位点的杂交探针、荧光团和猝灭剂,以监测扩增。可以包含外切核酸酶III以切割脱碱基位点并释放猝灭剂,以允许荧光激发。在一些情况下,通过将捕获分子(例如,生物素)附接至扩增引物之一上并用供捕获的5’-抗原分子(例如,荧光素衍生物FAM)标记杂交引物以允许检测,从而通过侧流来检测或监测扩增产物。这样,在一些情况下,本文公开的设备、系统、试剂盒和方法提供了在侧流设备上的核酸和扩增产物的检测。本文描述了侧流设备。
在一些情况下,本文公开的设备、系统和试剂盒包含能够扩增基因组中的第一序列和基因组中的第二序列的至少一种核酸扩增试剂和至少一种寡核苷酸引物,其中第一序列和第二序列相似,并且其中第一序列与第二序列在物理上足够远,使得第一序列存在于受试者的第一无细胞核酸上,并且第二序列存在于受试者的第二无细胞核酸上。在一些情况下,所述至少两个序列紧邻。在一些情况下,所述至少两个序列被至少一个核苷酸隔开。在一些情况下,所述至少两个序列被至少两个核苷酸隔开。在一些情况下,所述至少两个序列被至少约5个、至少约10个、至少约15个、至少约20个、至少约30个、至少约40个、至少约50个或至少约100个核苷酸隔开。在一些情况下,所述至少两个序列至少约50%相同。在一些情况下,所述至少两个序列至少约60%相同、至少约60%相同、至少约60%、至少约70%、至少约80%、至少约90%、至少约95%、至少约99%或100%相同。在一些情况下,第一序列和第二序列的长度各自为至少10个核苷酸。在一些情况下,第一序列和第二序列的长度各自为至少约10个、至少约15个、至少约20个、至少约30个、至少约50个或至少约100个核苷酸。在一些情况下,第一序列和第二序列在同一染色体上。在一些情况下,第一序列在第一染色体上,并且第二序列在第二染色体上。在一些情况下,第一序列和第二序列功能连接。例如,基因AOX1的启动子区域中的所有CpG位点在前列腺癌中均显示相同的过度甲基化,因此这些位点功能连接,因为它们在功能上携带相同的信息但位置间隔一个或多个核苷酸。
在一些情况下,本文公开的设备、系统和试剂盒包含能够与无细胞核酸链退火的寡核苷酸探针或寡核苷酸引物中的至少一种,其中无细胞核酸包含对应于感兴趣区域或其部分的序列。在一些情况下,感兴趣区域是Y染色体的区域。在一些情况下,感兴趣区域是X染色体的区域。在一些情况下,感兴趣区域是常染色体的区域。在一些情况下,感兴趣区域或其部分包含如本文所述的重复序列,其在基因组中存在多于一次。在一些情况下,感兴趣区域的长度为约10个核苷酸至约1,000,000个核苷酸。在一些情况下,感兴趣区域的长度为至少10个核苷酸。在一些情况下,感兴趣区域的长度为至少100个核苷酸。在一些情况下,该区域的长度为至少1000个核苷酸。在一些情况下,感兴趣区域的长度为约10个核苷酸至约500,000个核苷酸。在一些情况下,感兴趣区域的长度为约10个核苷酸至约300,000个核苷酸。在一些情况下,感兴趣区域的长度为约100个核苷酸至约1,000,000个核苷酸。在一些情况下,感兴趣区域的长度为约100个核苷酸至约500,000个核苷酸。在一些情况下,感兴趣区域的长度为约100个核苷酸至约300,000个碱基对。在一些情况下,感兴趣区域的长度为约1000个核苷酸至约1,000,000个核苷酸。在一些情况下,感兴趣区域的长度为约1000个核苷酸至约500,000个核苷酸。在一些情况下,感兴趣区域的长度为约1000个核苷酸至约300,000个核苷酸。在一些情况下,感兴趣区域的长度为约10,000个核苷酸至约1,000,000个核苷酸。在一些情况下,感兴趣区域的长度为约10,000个核苷酸至约500,000个核苷酸。在一些情况下,感兴趣区域的长度为约10,000个核苷酸至约300,000个核苷酸。在一些情况下,感兴趣区域的长度为约300,000个核苷酸。
在一些情况下,对应于感兴趣区域的序列的长度为至少约5个核苷酸。在一些情况下,对应于感兴趣区域的序列的长度为至少约8个核苷酸。在一些情况下,对应于感兴趣区域的序列的长度为至少约10个核苷酸。在一些情况下,对应于感兴趣区域的序列的长度为至少约15个核苷酸。在一些情况下,对应于感兴趣区域的序列的长度为至少约20个核苷酸。在一些情况下,对应于感兴趣区域的序列的长度为至少约50个核苷酸。在一些情况下,对应于感兴趣区域的序列的长度为至少约100个核苷酸。在一些情况下,该序列的长度为约5个核苷酸至约1000个核苷酸。在一些情况下,该序列的长度为约10个核苷酸至约1000个核苷酸。在一些情况下,该序列的长度为约10个核苷酸至约500个核苷酸。在一些情况下,该序列的长度为约10个核苷酸至约400个核苷酸。在一些情况下,该序列的长度为约10个核苷酸至约300个核苷酸。在一些情况下,该序列的长度为约50个核苷酸至约1000个核苷酸。在一些情况下,该序列的长度为约50个核苷酸至约500个核苷酸。
在一些情况下,本文公开的设备、系统和试剂盒包含能够与无细胞核酸链退火的寡核苷酸探针和寡核苷酸引物中的至少一种,其中无细胞核酸包含对应于本文公开的感兴趣子区域的序列。在一些情况下,该子区域由在感兴趣区域中存在多于一次的序列表示。在一些情况下,该子区域的长度为约10至约1000个核苷酸。在一些情况下,该子区域的长度为约50至约500个核苷酸。在一些情况下,该子区域的长度为约50至约250个核苷酸。在一些情况下,该子区域的长度为约50至约150个核苷酸。在一些情况下,该子区域的长度为约100个核苷酸。
考虑到将本领域已知的任何适当的核酸扩增方法用于本文所述的设备和方法。在一些情况下,使用等温扩增。在一些情况下,除了等温扩增开始之前的初始加热步骤之外,扩增是等温的。许多等温扩增方法是本领域已知的,每种方法具有不同的考虑因素并提供不同的优势,并且在文献中进行了讨论,例如,Zanoli和Spoto,2013,“IsothermalAmplification Methods for the Detection of Nucleic Acids in MicrofluidicDevices,”Biosensors 3:18-43,以及Fakruddin,等人,2013,“Alternative Methods ofPolymerase Chain Reaction(PCR),”Journal of Pharmacy and Bioallied Sciences 5(4):245-252,其各自通过引用整体并入本文。在一些情况下,使用任何适当的等温扩增方法。在一些情况下,所用的等温扩增方法选自:环介导等温扩增(LAMP);基于核酸序列的扩增(NASBA);多重置换扩增(MDA);滚环扩增(RCA);解旋酶依赖性扩增(HDA);链置换扩增(SDA);切口酶扩增反应(NEAR);分支扩增法(RAM);以及重组酶聚合酶扩增(RPA)。
在一些情况下,所用的扩增方法是LAMP(参见例如,Notomi,等人,2000,“LoopMediated Isothermal Amplification”NAR 28(12):e63 i-vii,以及美国专利号6,410,278,“Process for synthesizi ng nucleic acid”,其各自通过引用整体并入本文)。LAMP是使用自动循环链置换脱氧核糖核酸(DNA)合成的一步扩增系统。在一些情况下,LAMP在热稳定的聚合酶例如嗜热脂肪芽孢杆菌(Bst)DNA聚合酶I、脱氧核糖核苷三磷酸(dNTP)、特异性引物和靶DNA模板的存在下于60-65℃执行45-60min。在一些情况下,模板是RNA,并且使用具有逆转录酶活性和链置换型DNA聚合酶活性的聚合酶,例如Bca DNA聚合酶,或者将具有逆转录酶活性的聚合酶用于逆转录酶步骤,并且将不具有逆转录酶活性的聚合酶用于链置换-DNA合成步骤。
在一些情况下,在本文所述的温度或温度范围内使用LAMP进行扩增反应。在一些情况下,使用LAMP进行本文所述的时间量或时间范围的扩增反应。
在一些情况下,扩增方法是基于核酸序列的扩增(NASBA)。NASBA(也称为3SR和转录介导扩增)是基于等温转录的RNA扩增系统。使用三种酶(禽成髓细胞瘤病毒逆转录酶、RNA酶H和T7 DNA依赖性RNA聚合酶)生成单链RNA。在某些情况下,NASBA可以用于扩增DNA。扩增反应在41℃下进行,维持恒温,通常持续约60至约90分钟(参见例如,Fakruddin,等人,2012,“Nucleic Acid Sequence Based Amplification(NASBA)Prospects andApplications,”Int.J.of Life Science and Pharma Res.2(1):L106-L121,通过引用并入本文)。
在一些情况下,NASBA反应在约40℃至约42℃下进行。在一些情况下,NASBA反应在约41℃下进行。在一些情况下,NASBA反应在至多约42℃下进行。在一些情况下,NASBA反应在约40℃至约41℃、约40℃至约42℃或约41℃至约42℃下进行。在一些情况下,NASBA反应在约40℃、约41℃或约42℃下进行。
在一些情况下,使用NASBA进行本文所述的时间量或时间范围的扩增反应。
在一些情况下,扩增方法是链置换扩增(SDA)。SDA是使用四种不同引物的等温扩增方法。将含有限制酶切位点(HincII外切核酸酶的识别序列)的引物与DNA模板退火。大肠杆菌DNA聚合酶1的外切核酸酶缺陷片段(exo-Klenow)使引物伸长。每个SDA循环由以下组成:(1)引物与置换的靶片段结合,(2)通过exo-Klenow延伸引物/靶复合物,(3)切开生成的半硫代磷酸酯HincII位点,(4)HincII与切口位点解离,以及(5)切口延伸和通过exo-Klenow置换下游链。
在一些情况下,扩增方法是多重置换扩增(MDA)。MDA是一种等温的链置换方法,其基于使用来自噬菌体
Figure BDA0003377807820001281
的高度持续合成和链置换的DNA聚合酶,结合修饰的随机引物,以高保真性扩增整个基因组。其已被开发用于从非常少量的起始材料扩增样品中的所有DNA。在MDA中,将
Figure BDA0003377807820001282
DNA聚合酶与dNTP、随机六聚体和变性的模板DNA在30℃下温育16至18小时,并且酶必须在高温(65℃)下灭活10分钟。不需要重复循环,但需要短的初始变性步骤、扩增步骤和酶的最终灭活。
在一些情况下,扩增方法是滚环扩增(RCA)。RCA是一种等温核酸扩增方法,允许在单个温度(通常约30℃)下将探针DNA序列扩增超过109倍。多轮的等温酶促合成由
Figure BDA0003377807820001283
DNA聚合酶进行,该聚合酶通过在环状DNA探针周围不断持续合成来延伸环-杂交引物。在一些情况下,扩增反应使用RCA在约28℃至约32℃下进行。
在一些情况下,本文公开的设备、系统和试剂盒包含至少一种寡核苷酸引物,其中寡核苷酸引物具有与Y染色体序列互补或相对应的序列。在一些情况下,本文公开的设备、系统和试剂盒包含寡核苷酸引物对,其中寡核苷酸引物对具有与Y染色体序列互补或相对应的序列。在一些情况下,本文公开的设备、系统和试剂盒包含至少一种寡核苷酸引物,其中寡核苷酸引物包含与Y染色体序列互补或相对应的序列。在一些情况下,本文公开的设备、系统和试剂盒包含寡核苷酸引物对,其中寡核苷酸引物对包含与Y染色体序列互补或相对应的序列。在一些情况下,本文公开的设备、系统和试剂盒包含至少一种寡核苷酸引物,其中寡核苷酸引物由与Y染色体序列互补或相对应的序列组成。在一些情况下,本文公开的设备、系统和试剂盒包含寡核苷酸引物对,其中寡核苷酸引物对由与Y染色体序列互补或相对应的序列组成。在一些情况下,与Y染色体序列互补或相对应的序列与野生型人Y染色体序列至少75%同源。在一些情况下,与Y染色体序列互补或相对应的序列与野生型人Y染色体序列至少80%同源。在一些情况下,与Y染色体序列互补或相对应的序列与野生型人Y染色体序列至少85%同源。在一些情况下,与Y染色体序列互补或相对应的序列与野生型人Y染色体序列至少80%同源。在一些情况下,与Y染色体序列互补或相对应的序列与野生型人Y染色体序列至少90%同源。在一些情况下,与Y染色体序列互补或相对应的序列与野生型人Y染色体序列至少95%同源。在一些情况下,与Y染色体序列互补或相对应的序列与野生型人Y染色体序列至少97%同源。在一些情况下,与Y染色体序列互补或相对应的序列与野生型人Y染色体序列100%同源。
核酸连接剂
在一些情况下,本文公开的设备、系统和试剂盒能够制备用于检测的核酸文库。在一些情况下,所述核酸任选地由本文所述的核酸扩增器和/或扩增试剂扩增。在一些情况下,本文所述的设备或系统包括能够产生用于检测的可连接文库的靶核酸的核酸连接剂。
在一些实施方案中,所述核酸连接剂包括用于产生可连接的靶核酸(例如,无细胞核酸)的连接制剂。所述连接制剂包括以下的一种或多种:(i)一种或多种核酸外切酶,其适于生成所述靶无细胞核酸的平端并去除所述靶无细胞核酸的平端的5’突出端或3’凹陷端;(ii)平端无细胞核酸去磷酸化剂;(iii)群集剂;(iv)核酸损伤修复剂;或(v)核酸连接酶。在一些情况下,所述连接制剂包括(i)-(v)中的两种或多种,(i)-(v)中的三种或多种,或(i)-(v)中的全部四种。核酸连接剂还包括一个或多个连接到可连接的靶无细胞核酸的衔接子寡核苷酸。
在一些实施方案中,所述核酸损伤修复剂包括一种或多种聚合酶。在一些情况下,所述一种或多种聚合酶包括T4 DNA聚合酶或DNA聚合酶I。在一些实施方案中,所述一种或多种核酸外切酶包括T4多核苷酸激酶或核酸外切酶III。在一些实施方案中,所述连接酶包括T3 DNA连接酶、T4 DNA连接酶、T7 DNA连接酶、Taq连接酶、Ampligase、大肠杆菌连接酶或Sso7-连接酶融合蛋白。在一些实施方案中,所述群集剂包括聚乙二醇(PEG)、糖原、或葡聚糖或其组合。在一些实施方案中,所述小分子增强剂包含二甲亚砜(DMSO)、聚山梨醇酯20、甲酰胺或二醇或其组合。在一些实施方案中,所述连接剂被设计为进行平端连接或单核苷酸突出端连接。在一些实施方案中,所述衔接子寡核苷酸包含Y形衔接子、发夹衔接子、茎环衔接子、可降解衔接子、封闭性自连接衔接子或条形码衔接子或其组合。
在一些情况下,所述连接制剂包括核酸内切酶,例如成簇的规则间隔的短回文重复序列(CRISPR)-cas组合。在一些情况下,所述Cas酶包括Cas9、Cas12、Cascade和Cas13或其亚型。在一些情况下,Cas酶是Cas直系同源物,诸如在Nat Rev Mol Cell Biol.2019Aug;20(8):490-507所述的那些物质。在一些情况下,所述连接制剂包括转座酶。在一些情况下,所述转座酶具有“切割和粘贴(cut-and-paste)”机制,诸如Tn5转座酶或其变体。
核酸检测器
在一些情况下,本文公开的设备、系统和试剂盒包含核酸检测器。在一些情况下,核酸检测器包含核酸测序仪。在一些情况下,本文公开的设备、系统和试剂盒被配置为扩增核酸并测序来自核酸扩增器所得扩增的核酸或来自核酸连接剂的可连接的靶核酸或两者。在一些情况下,本文公开的设备、系统和试剂盒被配置为用于对核酸进行测序而不扩增核酸。在一些情况下,本文公开的设备、系统和试剂盒包含核酸测序仪,但不包含核酸扩增试剂或核酸扩增组件。在一些情况下,核酸测序仪包含信号检测器,其检测反映成功扩增或不成功扩增的信号。在一些情况下,核酸测序仪是信号检测器。在一些情况下,信号检测器包含核酸测序仪。
在一些情况下,核酸测序仪与分析来自核酸测序仪的测序读取的电子设备具有通信连接。在一些情况下,通信连接是硬连线的。在一些情况下,通信连接是无线的。例如,如本文公开的那些移动设备应用或计算机软件可以接收测序读取,并且基于测序读取显示或报告关于样品的遗传信息(例如,疾病/感染的存在、对药物的响应、遗传异常或胎儿突变)。
在一些情况下,核酸测序仪包括纳米孔测序仪。在一些情况下,纳米孔测序仪包含纳米孔。在一些情况下,纳米孔测序仪包含膜和溶液,溶液产生跨膜的电流并驱动带电荷分子(例如,核酸)移动通过纳米孔。在一些情况下,纳米孔测序仪包含跨膜蛋白、其部分或其修饰。在一些情况下,跨膜蛋白是细菌蛋白。在一些情况下,跨膜蛋白不是细菌蛋白。在一些情况下,纳米孔是合成的。在一些情况下,纳米孔执行固态纳米孔测序。在一些情况下,纳米孔测序仪被描述为口袋大小的、便携式的或大致为蜂窝电话大小的。在一些情况下,纳米孔测序仪被配置用于对RNA和DNA中的至少一种进行测序。纳米孔测序设备的非限制性实例包括Oxford Nanopore Technologies MinION和SmidgION纳米孔测序USB设备。这两种设备都足够小,可以手持。纳米孔测序设备和组件在Howorka(Nat Nanotechnol.2017年7月6日;12(7):619-630)和Garrido-Cardenas等人(Sensors(Basel).2017年3月14日;17(3))的综述中进一步描述,两者均通过引用并入本文。纳米孔测序设备的其他非限制性实例由Electronic Biosciences、Two Pore Guys、Stratos和Agilent(最初来自Genia的技术)提供。
在一些情况下,核酸检测器包含亚硫酸氢盐测序所必需的试剂和组件,以检测表观遗传修饰。例如,具有许多甲基化标志物的长区域可以被片段化。此处,每个携带甲基化标志物的片段可以是独立的信号。来自所有片段的信号的组合足以获得有用的遗传信息。
在一些情况下,核酸检测器不包含核酸测序仪。在一些情况下,核酸检测器被配置为对标记的核酸进行计数,其中核酸检测器量化来自一个或多个标签的集合信号。
捕获与检测
在一些情况下,本文公开的设备、系统和试剂盒包含用于检测生物样品中的核酸的核酸检测器、捕获组件、信号检测器、检测试剂或其组合中的至少一种。在一些情况下,捕获组件和信号检测器是集成的。在一些情况下,捕获组件包含固体支持物。在一些情况下,固体支持物包括珠子、芯片、条、膜、基质、柱、板或其组合。
在一些情况下,本文公开的设备、系统和试剂盒包含针对染色体或其片段的表观遗传修饰区域的至少一种探针。在一些情况下,染色体的表观遗传修饰区域的表观遗传修饰指示性别或性别的标志物。在一些情况下,本文公开的设备、系统和试剂盒包含针对在母体DNA中不存在的父体遗传序列的至少一种探针。在一些情况下,本文公开的设备、系统和试剂盒包含针对父体遗传的单核苷酸多态性的至少一种探针。在一些情况下,染色体是Y染色体。在一些情况下,染色体是X染色体。在一些情况下,染色体是Y染色体。在一些情况下,染色体是常染色体。在一些情况下,探针包括肽、抗体、抗原结合抗体片段、核酸或小分子。
在一些情况下,设备、系统和试剂盒包含本文公开的样品纯化器和本文公开的捕获组件。在一些情况下,样品纯化器包含捕获组件。在一些情况下,样品纯化器和捕获组件是集成的。在一些情况下,样品纯化器和捕获组件是隔开的。
在一些情况下,捕获组件包含本文所述的结合部分。在一些情况下,结合部分存在于侧流测定中。在一些情况下,在将样品添加至侧流测定之前将结合部分添加至样品。在一些情况下,结合部分包含信号分子。在一些情况下,结合部分与信号分子物理缔合。在一些情况下,结合部分能够与信号分子物理缔合。在一些情况下,结合部分连接至信号分子。信号分子的非限制性实例包括金颗粒、荧光颗粒、发光颗粒和染料分子。在一些情况下,捕获组件包含能够与本文所述的扩增产物相互作用的结合部分。在一些情况下,捕获组件包含能够与本文所述的扩增产物上的标签相互作用的结合部分。
在一些情况下,本文公开的设备、系统和试剂盒包含检测系统。在一些情况下,检测系统包含信号检测器。信号检测器的非限制性实例包括荧光读取器、比色计、传感器、电线、电路、接收器。在一些情况下,检测系统包含检测试剂。检测试剂的非限制性实例包括荧光团、化学物质、纳米颗粒、抗体和核酸探针。在一些情况下,检测系统包含pH传感器和互补金属氧化物半导体,可用于检测pH的变化。在一些情况下,通过本文公开的设备、系统、试剂盒或方法产生扩增产物改变pH,从而指示遗传信息。
在一些情况下,检测系统包含信号检测器。在一些情况下,信号检测器是检测光子的光检测器。在一些情况下,信号检测器检测荧光。在一些情况下,信号检测器检测化学物质或化合物。在一些情况下,信号检测器检测在产生扩增产物时释放的化学物质。在一些情况下,信号检测器检测在将扩增产物添加至检测系统时释放的化学物质。在一些情况下,信号检测器检测在产生扩增产物时产生的化合物。在一些情况下,信号检测器检测在将扩增产物添加至检测系统时产生的化合物。
在一些情况下,信号检测器检测电信号。在一些情况下,信号检测器包含电极。在一些情况下,信号检测器包含电路、电流或电流发生器。在一些情况下,电路或电流由两种或更多种溶液或聚合物的梯度提供。在一些情况下,电路或电流由能量源(例如,电池、蜂窝电话、电源插座的电线)提供。在一些情况下,本文公开的核酸、扩增产物、化学物质或化合物通过干扰电流提供电信号,并且信号检测器检测电信号。
在一些情况下,信号检测器检测光。在一些情况下,信号检测器包含光传感器。在一些情况下,信号检测器包含照相机。在一些情况下,信号检测器包含蜂窝电话照相机或其组件。
在一些情况下,信号检测器包含检测核酸中不同碱基的电荷的纳米线。在一些情况下,纳米线具有约1nm至约99nm的直径。在一些情况下,纳米线具有约1nm至约999nm的直径。在一些情况下,纳米线包含无机分子,例如镍、铂、硅、金、锌、石墨烯或钛。在一些情况下,纳米线包含有机分子(例如,核苷酸)。
在一些情况下,检测系统包含测定组装件,其中测定组装件能够检测靶分析物(例如,核酸扩增产物)。在一些情况下,测定组装件包含侧流条,在本文以及在本领域中也被称为侧流测定、侧流测试或侧流设备。在一些情况下,侧流测定提供了快速、廉价且技术简单的方法来检测本文公开的扩增产物。通常,本文公开的侧流测定包含运输流体的多孔材料或多孔基质,以及当存在扩增产物时对其进行检测的检测器。多孔材料可以包括多孔纸、聚合物结构、烧结聚合物或其组合。在一些情况下,侧流测定运输生物流体或其部分(例如,血液样品的血浆)。在一些情况下,侧流测定运输含有生物流体或其部分的溶液。例如,方法可包括在将样品添加至设备或系统之前或期间向生物流体添加溶液。溶液可以包含盐、聚合物或促进样品和/或扩增产物通过侧流测定运输的任何其他组分。在一些情况下,核酸在行进通过侧流条后被扩增。
在一些情况下,设备、检测系统包含侧流设备,其中侧流设备包含多个区段或区域,其中每个期望的功能可存在于单独的区段或区域中。通常,在侧流设备中,含有靶分析物的液体样品例如本文所述的体液样品在有或没有外力帮助的情况下移动通过侧流设备的区段或区域。在一些情况下,靶分析物在没有外力帮助的情况下移动,例如,通过毛细管作用。在一些情况下,靶分析物在外力帮助的情况下移动,例如,通过侧流设备的移动对毛细管作用的促进。移动可以包括由外部输入引起的任何运动,例如,晃动、转动、离心、施加电场或磁场、施加泵、施加真空或侧流设备的摇摆。
在一些情况下,侧流设备是侧流测试条,包含位于侧向的区域或区段,例如,在彼此的后面或前面的区域或区段。通常,由于每个功能区域或区段的较大表面积的暴露,侧流测试条允许从测试条的每一侧(例如,上方和下方)进入功能区域或区段。这有助于添加试剂,包含用于样品纯化或者靶分析物扩增和/或检测的那些试剂。
考虑将本领域技术人员已知的任何合适的侧流测试条检测格式用于本公开内容的测定组装件中。侧流测试条检测格式是公知的,并且已经在文献中描述。侧流测试条测定格式由例如Sharma等人,(2015)Biosensors 5:577-601大体描述,其通过引用整体并入本文。使用侧流测试条夹心测定格式的核酸检测由例如美国专利号9,121,849,“LateralFlow Assays”描述,其通过引用整体并入本文。使用侧流测试条竞争测定格式的核酸检测由例如美国专利号9,423,399,“Lateral Flow Assays for Tagged Analytes”描述,其通过引用整体并入本文。
在一些情况下,侧流测试条使用夹心格式、竞争格式或多重检测格式来检测测试样品中的靶分析物。在传统的夹心测定格式中,检测到的信号与样品中存在的靶分析物的量成正比,因此靶分析物的量增加导致信号强度增加。在传统的竞争测定格式中,检测到的信号与存在的分析物的量呈相反关系,并且增加分析物的量导致信号强度降低。
在侧流夹心格式中,也称为“夹心测定”,通常将测试样品施加于测试条一端的样品施加垫。所施加的测试样品从样品施加垫流过测试条,到达位置邻近样品施加垫的缀合垫,其中缀合垫在样品流动方向的下游。在一些情况下,缀合垫包含标记的、可逆固定的探针,例如,用例如染料、酶或纳米颗粒标记的抗体或适体。如果测试样品中存在靶分析物,则形成标记探针-靶分析物复合物。然后,该复合物流至包含对靶分析物具有特异性的固定的第二探针的第一测试区域或区段(例如,测试线),从而捕获任何标记探针-靶分析物复合物。在一些情况下,使用第一测试区域或区段处的信号(例如,颜色)的强度或大小来指示测试样品中靶分析物的存在或不存在、数量或者存在和数量。第二测试区域或区段可以包含与过量的标记探针结合的第三探针。如果所施加的测试样品包含靶分析物,则在靶分析物在缀合垫上被标记探针捕获后,测试条上将存在很少或不存在过量的标记探针。因此,第二测试区域或区段将不结合任何标记探针,并且预计在第二测试区域或区段观察到很少信号或没有信号(例如,颜色)。因此,在第二测试区域或区段处不存在信号可以确保在第一测试区域或区段中观察到的信号是由于靶分析物的存在。
在一些情况下,本文公开的设备和系统包含夹心测定。在一些情况下,夹心测定被配置为接收本文公开的生物样品并保留样品组分(例如,核酸、细胞、微粒)。在一些情况下,夹心测定被配置为接收流动溶液,该流动溶液冲洗生物样品的非核酸组分(例如,蛋白质、细胞、微粒),留下生物样品的核酸。在一些情况下,夹心测定包含与核酸结合的膜,以在施加流动溶液时帮助保留核酸。与核酸结合的膜的非限制性实例包括壳聚糖修饰的硝化纤维素。
类似地,在侧流竞争格式中,将测试样品施加于测试条一端的样品施加垫,并且在样品施加垫下游的缀合垫中,靶分析物与标记探针结合以形成探针-靶分析物复合物。在竞争格式中,第一测试区域或区段通常包含靶分析物或靶分析物的类似物。第一测试区域或区段的靶分析物与在缀合垫中未结合测试分析物的任何游离的标记探针结合。因此,当施加的测试样品中不存在靶分析物时,与存在靶分析物时相比,在第一测试区域或区段中观察到的信号量更高。第二测试区域或区段包含与探针-靶分析物复合物特异性结合的探针。当靶分析物存在于施加的测试样品中时,在该第二测试区域或区段中观察到的信号量更高。
在侧流测试条多重检测格式中,通过使用包含例如对每种靶分析物具有特异性的探针的额外的测试区域或区段,使用测试条检测多于一种靶分析物。
在一些情况下,侧流设备是层状侧流设备,包含存在于位于中间(例如,在彼此的上方或下方)的各层中的区域或区段。在一些情况下,给定层中存在一个或多个区域或区段。在一些情况下,每个区域或区段存在于单独的层中。在一些情况下,层包含多个区域或区段。在一些情况下,层是层压的。在层状侧流设备中,受扩散控制且受浓度梯度引导的过程是可能的驱动力。例如,用于对样品液体中含有的分析物进行荧光测定或荧光定量分析的多层分析元件在EP0097952“Multilayer analytical element”中描述,其通过引用并入本文。
侧流设备可包含一个或多个功能区域或区段。在一些情况下,测试组装件包含1至20个功能区域或区段。在一些情况下,功能区域或区段包含至少一个样品纯化区域或区段、至少一个靶分析物扩增区域或区段、至少一个靶分析物检测区域或区段、以及至少一个靶分析物检测区域或区段。
在一些情况下,靶分析物是核酸序列,并且侧流设备是核酸侧流测定。在一些情况下,本文公开的设备、系统和试剂盒包含核酸侧流测定,其中核酸侧流测定包含核酸扩增功能。在一些情况下,通过核酸扩增功能执行的靶核酸扩增在扩增的核酸种类的检测之前或同时进行。在一些情况下,检测包含对靶分析物的存在的定性、半定量或定量检测中的一种或多种。
在一些情况下,本文公开的设备、系统和试剂盒包含测定组装件,其中在侧流测试条中扩增靶核酸分析物以生成标记的扩增产物,或者可以在扩增后被标记的扩增产物。在一些情况下,标记存在于一种或多种扩增引物上,或者在扩增后随后与一种或多种扩增引物缀合。在一些情况下,在侧流测试条上检测到至少一种靶核酸扩增产物。例如,侧流测试条上的一个或多个区域或区段可以包含对靶核酸扩增产物具有特异性的探针。
在一些情况下,本文公开的设备、系统和试剂盒包含检测器,其中检测器包含石墨烯生物传感器。石墨烯生物传感器由例如Afsahi等人在题为“Novel graphene-basedbiosensor for early detection of Zika virus infection,Biosensor andBioelectronics,”(2018)100:85-88的文章中进行了描述。
在一些情况下,本文公开的检测器包含纳米孔、纳米传感器或纳米开关。例如,检测器可以能够进行纳米孔测序,纳米孔测序是基于跨膜电流将核酸运输通过纳米孔的方法,该检测器测量对应于特定核苷酸的电流的干扰。纳米开关或纳米传感器在暴露于可检测信号时经历结构变化。参见例如,Koussa等人,“DNA nanoswitches:A quantitativeplatform for gel-based biomolecular interaction analysis,”(2015)NatureMethods,12(2):123-126。
在一些情况下,检测器包含快速多重生物标志物测定,其中针对感兴趣分析物的探针在用于实时检测的芯片上产生。因此,不需要标签、标记或报道分子。分析物与这些探针的结合引起对应于分析物浓度的折射率的变化。所有步骤可以是自动化的。可以不必要进行温育。结果可以在小于一小时(例如,10-30分钟)内获得。这样的检测器的非限制性实例是Genalyte Maverick检测系统。
附加测试
在一些情况下,本文公开的设备、系统和试剂盒包含用于检测或分析除核酸以外的生物组分的附加特征、试剂、测试或测定。举非限制性实例而言,生物组分可以选自肽、脂质、脂肪酸、甾醇、碳水化合物、病毒组分、微生物组分及其组合。生物组分可以是抗体。生物组分可以是响应于受试者中的肽而产生的抗体。这些附加测定可以能够检测或分析此处以及全文公开的小体积或样品大小中的生物组分。附加测试可以包含能够与感兴趣的生物组分相互作用的试剂。这样的试剂的非限制性实例包括抗体、肽、寡核苷酸、适体和小分子,及其组合。试剂可以包含可检测标记。试剂可以能够与可检测标记相互作用。试剂可以能够提供可检测信号。
附加测试可能需要一种或多种抗体。例如,附加测试可以包含提供用于执行免疫PCR(IPCR)的试剂或组件。IPCR是这样的方法,其中将针对感兴趣蛋白质的第一抗体固定并暴露于样品。如果样品含有感兴趣的蛋白质,则它将被第一抗体捕获。然后将所捕获的感兴趣蛋白质暴露于与感兴趣蛋白质结合的第二抗体。该第二抗体已与能够被实时PCR检测的多核苷酸偶联。备选地或附加地,附加测试可以包含提供用于执行邻位连接技术(PLA)的试剂或组件,其中样品暴露于对感兴趣蛋白质具有特异性的两种抗体,每种抗体包含寡核苷酸。如果两种抗体均与感兴趣蛋白质结合,则每种抗体的寡核苷酸将足够接近以被扩增和/或检测。
在一些情况下,本文公开的设备、系统和试剂盒包含妊娠测试,以确认受试者妊娠。在一些情况下,本文公开的设备、系统和试剂盒包含对Y染色体存在或Y染色体不存在的测试(性别测试)。在一些情况下,本文公开的设备、系统和试剂盒包含孕龄测试。
在一些情况下,本文公开的设备、系统和试剂盒包含对多个妊娠(例如双胞胎或三胞胎)的测试。在一些情况下,本文公开的方法定量(绝对或相对地)母体样品中胎儿核酸的总量以及由各种常染色体、X和Y染色体代表的序列的量,以检测一个、两个或全部胎儿是男性或是女性、是整倍体或是非整倍体等。
在一些情况下,本文公开的设备、系统和试剂盒包含妊娠测试,用于指示、检测或验证受试者妊娠。在一些情况下,妊娠测试包含用于测量妊娠相关因子的试剂或组件。举非限制性实例而言,妊娠相关因子可以是人绒毛膜促性腺激素蛋白(hCG)以及包含抗hCG抗体的针对hCG的试剂或组件。同样举非限制性实例而言,妊娠相关因子可以是hCG转录物,并且用于测量hCG转录物的试剂或组件是与hCG转录物杂交的寡核苷酸探针或引物。在一些情况下,妊娠相关因子是热休克蛋白10kDa蛋白1,也称为早孕因子(EPF)。
在一些情况下,本文公开的设备、系统和试剂盒能够传达胎儿的年龄。例如,可以从设备或系统生成信号,其中信号的水平对应于来自受试者的样品中hCG的量。该信号的水平或强度可以用表示样品中hCG量的数值来翻译或另外表示(equivocate)。hCG的量可以指示胎儿的大致年龄。
在一些情况下,本文公开的设备、系统和试剂盒提供妊娠的指示或验证、孕龄的指示或验证以及性别的指示或验证。在一些情况下,本文公开的设备、系统和试剂盒以至少约90%的置信度(例如,在90%的情况下,指示是准确的)提供妊娠、孕龄和/或性别的指示。在一些情况下,本文公开的设备、系统和试剂盒以至少约95%的置信度提供妊娠、孕龄和/或性别的指示。在一些情况下,本文公开的设备、系统和试剂盒以至少约99%的置信度提供妊娠、孕龄和/或性别的指示。
性能参数
在一些情况下,本文公开的设备、系统和试剂盒在一个或多个温度下可操作。在一些情况下,需要改变设备系统或试剂盒的组件或试剂的温度,以使设备系统或试剂盒可操作。通常,当设备、系统和试剂盒能够提供由生物样品中的生物标志物(例如,RNA/DNA、肽)传达的信息时,则认为其是“可操作的”。在一些情况下,设备、系统、试剂盒、其组件或其试剂可操作的温度在普通家庭中获得。举非限制性实例而言,在普通家庭中获得的温度可以由室温、冷藏区块、冷冻区块、微波炉、火炉、电火锅、热/冷水浴或烤区块提供。
在一些情况下,本文所述的设备、系统、试剂盒、其组件或其试剂在单一温度下可操作。在一些情况下,本文所述的设备、系统、试剂盒、其组件或其试剂仅需要单个温度即可操作。在一些情况下,本文所述的设备、系统、试剂盒、其组件或其试剂仅需要两个温度即可操作。在一些情况下,本文所述的设备、系统、试剂盒、其组件或其试剂仅需要三个温度即可操作。
在一些情况下,本文公开的设备、系统、试剂盒包含加热设备或冷却设备,以允许用户获得至少一个温度。加热设备和冷却设备的非限制性实例是材料的小袋或包,其可以在冷藏区块或冷冻区块中冷却,或微波或在炉面上煮沸,或插入电源插座,并且随后施加于本文公开的设备或其组件,从而将热量传递至设备或其组件或冷却该设备或其组件。加热设备的另一非限制性实例是穿过该设备或其部分行进的电线或线圈。电线或线圈可以由外部(例如,太阳能、插座)或内部(例如,电池、蜂窝电话)电源激活,以将热量传送至设备或其部分。在一些情况下,本文公开的设备、系统、试剂盒包含温度计或温度指示器,以帮助用户评估温度范围内的温度。备选地或附加地,用户使用在典型家庭环境中的设备(例如,温度计、蜂窝电话等)来评估温度。
在一些情况下,设备、系统、试剂盒、其组件或其试剂可操作的温度在一定温度范围内或在温度范围内的至少一个温度。在一些情况下,温度范围为约-50℃至约100℃。在一些情况下,温度范围为约-50℃至约90℃。在一些情况下,温度范围为约-50℃至约80℃。在一些情况下,温度范围为约-50℃至约70℃。在一些情况下,温度范围为约-50℃至约60℃。在一些情况下,温度范围为约-50℃至约50℃。在一些情况下,温度范围为约-50℃至约40℃。在一些情况下,温度范围为约-50℃至约30℃。在一些情况下,温度范围为约-50℃至约20℃。在一些情况下,温度范围为约-50℃至约10℃。在一些情况下,温度范围为约0℃至约100℃。在一些情况下,温度范围为约0℃至约90℃。在一些情况下,温度范围为约0℃至约80℃。在一些情况下,温度范围为约0℃至约70℃。在一些情况下,温度范围为约0℃至约60℃。在一些情况下,温度范围为约0℃至约50℃。在一些情况下,温度范围为约0℃至约40℃。在一些情况下,温度范围为约0℃至约30℃。在一些情况下,温度范围为约0℃至约20℃。在一些情况下,温度范围为约0℃至约10℃。在一些情况下,温度范围为约15℃至约100℃。在一些情况下,温度范围为约15℃至约90℃。在一些情况下,温度范围为约15℃至约80℃。在一些情况下,温度范围为约15℃至约70℃。在一些情况下,温度范围为约15℃至约60℃。在一些情况下,温度范围为约15℃至约50℃。在一些情况下,温度范围为约15℃至约40℃。在一些情况下,温度范围为约15℃至约30℃。在一些情况下,温度范围为约10℃至约30℃。在一些情况下,本文公开的设备、系统、试剂盒,包括其所有组件及其所有试剂,在室温下完全可操作,不需要冷却、冷冻或加热。
在一些情况下,本文公开的设备、系统和试剂盒在接收生物样品的时间范围内检测生物样品或其产物(例如,扩增产物、缀合产物、结合产物)的组分。在一些情况下,检测通过本文所述的信号分子发生。在一些情况下,时间范围为约1秒至约1分钟。在一些情况下,时间范围为约10秒至约1分钟。在一些情况下,时间范围为约10秒至约1分钟。在一些情况下,时间范围为约30秒至约1分钟。在一些情况下,时间范围为约10秒至约2分钟。在一些情况下,时间范围为约10秒至约3分钟。在一些情况下,时间范围为约10秒至约5分钟。在一些情况下,时间范围为约10秒至约10分钟。在一些情况下,时间范围为约10秒至约15分钟。在一些情况下,时间范围为约10秒至约20分钟。在一些情况下,时间范围为约30秒至约2分钟。在一些情况下,时间范围为约30秒至约5分钟。在一些情况下,时间范围为约30秒至约10分钟。在一些情况下,时间范围为约30秒至约15分钟。在一些情况下,时间范围为约30秒至约20分钟。在一些情况下,时间范围为约30秒至约30分钟。在一些情况下,时间范围为约1分钟至约2分钟。在一些情况下,时间范围为约1分钟至约3分钟。在一些情况下,时间范围为约1分钟至约5分钟。在一些情况下,时间范围为约1分钟至约10分钟。在一些情况下,时间范围为约1分钟至约20分钟。在一些情况下,时间范围为约1分钟至约30分钟。在一些情况下,时间范围为约5分钟至约10分钟。在一些情况下,时间范围为约5分钟至约15分钟。在一些情况下,时间范围为约5分钟至约20分钟。在一些情况下,时间范围为约5分钟至约30分钟。在一些情况下,时间范围为约5分钟至约60分钟。在一些情况下,时间范围为约30分钟至约60分钟。在一些情况下,时间范围为约30分钟至约2小时。在一些情况下,时间范围为约1小时至约2小时。在一些情况下,时间范围为约1小时至约4小时。
在一些情况下,本文公开的设备、系统和试剂盒在少于给定的时间量内检测生物样品或其产物(例如,扩增产物、缀合产物、结合产物)的组分。在一些情况下,本文公开的设备、系统和试剂盒在少于给定的时间量内提供对生物样品或其产物的组分的分析。在一些情况下,时间量少于1分钟。在一些情况下,时间量少于5分钟。在一些情况下,时间量少于10分钟。在一些情况下,时间量为15分钟。在一些情况下,时间量少于20分钟。在一些情况下,时间量少于30分钟。在一些情况下,时间量少于60分钟。在一些情况下,时间量少于2小时。在一些情况下,时间量少于8小时。
通信与信息存储
通常,本文公开的设备、系统和试剂盒包含核酸信息输出。核酸信息输出被配置为将遗传信息从样品传递给用户。在一些情况下,核酸信息输出包含通信连接或接口,使得获得的遗传信息可以与物理上不在场的其他人(例如,家庭成员、医师或遗传顾问)共享。通信连接或接口也可以允许来自其他来源的输入。在一些情况下,本文公开的设备、系统和试剂盒包含用于接收基于获得的遗传信息的信息的接口。接口或通信连接还可以接收来自用户的非遗传信息(例如,病史、医疗状况、年龄、体重、心率、血压、体力活动等)。接口或通信连接还可以接收除用户之外的其他人或其他事物提供的信息。举非限制性实例而言,这包括基于网络的信息、来自医疗从业者的信息以及来自保险公司的信息。在一些情况下,本文公开的设备、系统和试剂盒包含用于传递基于获得的遗传信息的信息的接口。在一些情况下,接口提供对遗传或染色体异常的描述。在一些情况下,接口提供本地联系人的列表,例如医生、支持组、商店和服务提供商,这些联系人支持患有遗传或染色体异常的儿童家庭。在一些情况下,接口提供对具有遗传或染色体异常的儿童有用的产品或服务的在线列表。在一些情况下,本文公开的设备、系统和试剂盒包含信息存储单元,例如,计算机芯片。在一些情况下,本文公开的设备、系统和试剂盒包含安全存储遗传信息的手段。例如,本文公开的设备、系统和试剂盒可以包含数据芯片或与硬盘、服务器、数据库或云的连接(有线的或无线的)。在图4B和图5A-E中示出了本文公开的设备和系统的接口的非限制性实例。
在一些情况下,本文公开的设备、系统和试剂盒能够以安全的方式收集、加密和/或存储来自用户的信息。此类信息的非限制性实例包含健康信息、来自其可穿戴设备的信息、其已经或将要进行的其他测试、人口统计信息等。
在一些情况下,本文公开的设备、系统和试剂盒能够将关于生物样品中的生物标志物的信息传递至通信设备。在一些情况下,通信设备能够连接至互联网(例如,通过端口或无线连接)。在一些情况下,通信设备连接至互联网。在一些情况下,通信设备未连接至互联网。在一些情况下,本文公开的设备、系统和试剂盒能够通过通信设备将关于生物样品中的生物标志物的信息传递至互联网。通信设备的非限制性实例是蜂窝电话、电子笔记本和计算机。
在一些情况下,本文公开的设备、系统和试剂盒包含通信连接或通信接口。在一些实施方案中,通信接口提供有线接口。在进一步的实施方案中,有线通信接口利用通用串行总线(USB)(包括迷你USB、微型USB、USB A型、USB B型和USB C型)、IEEE 1394(火线)、Thunderbolt、以太网和光纤互连。
在一些实施方案中,通信接口提供无线接口。参见例如图5A-E。在进一步的实施方案中,无线通信接口利用无线通信协议,如红外、近场通信(NFC)(包括RFID)、蓝牙、低功耗蓝牙(BLE)、ZigBee、ANT、IEEE 802.11(Wi-Fi)、无线局域网(WLAN)、无线个人局域网(WPAN)、无线广域网(WWAN)、WiMAX、IEEE 802.16(微波接入全球互通(WiMAX))或3G/4G/LTE/5G蜂窝通信方法。
在一些实施方案中,本文所述的设备、系统、试剂盒和方法包括数字处理设备或其使用。在进一步的实施方案中,数字处理设备包括执行设备功能的一个或多个硬件中央处理单元(CPU)或通用图形处理单元(G pgPU)。在进一步的实施方案中,数字处理设备还包括配置用于执行可执行指令的操作系统。在一些实施方案中,数字处理设备包含用于与一个或多个外围设备、一个或多个不同的数字处理设备、一个或多个计算系统、一个或多个计算机网络以及/或者一个或多个通信网络进行通信的通信接口(例如,网络适配器)。
在一些实施方案中,数字处理设备借助于通信接口通信耦合至计算机网络(“网络”)。合适的网络包括个人局域网(PAN)、局域网(LAN)、广域网(WAN)、内联网、外联网、因特网(提供对万维网的访问)及其组合。在一些情况下,网络是电信和/或数据网络。在各种情况下,网络包括一个或多个计算机服务器,这些服务器实现分布式计算,诸如云计算。在一些情况下,网络借助于设备实现对等网络,该对等网络使与该设备耦合的设备能够充当客户端或服务器。
根据本文的描述,举非限制性实例而言,合适的数字处理设备包括,服务器计算机、台式计算机、膝上型计算机、笔记本计算机、小型笔记本计算机、上网本计算机、上网平板计算机、机顶盒计算机、媒体流设备、掌上计算机、因特网设备、健身追踪器、智能手表、移动智能电话、平板计算机和个人数字助理。本领域技术人员将认识到,许多智能电话适于在本文所述的系统中使用。本领域技术人员还将认识到,具有可选的计算机网络连通性的选定电视、视频播放器和数字音乐播放器适于在本文所述的系统中使用。合适的平板计算机包括本领域技术人员已知的具有手册、平板和可转换配置的那些平板计算机。
在一些实施方案中,数字处理设备包括被配置用于执行可执行指令的操作系统。操作系统是例如包括程序和数据的软件,该软件管理设备的硬件并为应用程序的执行提供服务。本领域技术人员将认识到,举非限制性实例而言,合适的服务器操作系统包括FreeBSD、OpenBSD、
Figure BDA0003377807820001451
Linux、
Figure BDA0003377807820001452
Mac OS X
Figure BDA0003377807820001453
Windows
Figure BDA0003377807820001454
Figure BDA0003377807820001455
本领域技术人员将认识到,举非限制性实例而言,合适的个人计算机操作系统包括
Figure BDA0003377807820001456
Mac OS
Figure BDA0003377807820001457
和类似UNIX的操作系统,如
Figure BDA0003377807820001458
在一些实施方案中,操作系统由云计算提供。本领域技术人员还将认识到,举非限制性实例而言,合适的移动智能电话操作系统包括
Figure BDA0003377807820001459
OS、
Figure BDA00033778078200014510
Research In
Figure BDA00033778078200014511
BlackBerry
Figure BDA00033778078200014512
Figure BDA00033778078200014513
Windows
Figure BDA00033778078200014514
OS、
Figure BDA00033778078200014515
Windows
Figure BDA00033778078200014516
OS、
Figure BDA00033778078200014517
Figure BDA00033778078200014518
本领域技术人员还将认识到,举非限制性实例而言,合适的媒体流设备操作系统包括Apple
Figure BDA00033778078200014519
Google
Figure BDA00033778078200014520
Google
Figure BDA00033778078200014521
Amazon
Figure BDA00033778078200014522
Figure BDA00033778078200014523
Figure BDA00033778078200014524
在一些情况下,操作系统包含物联网(IoT)设备。IoT设备的非限制性实例包括Amazon的
Figure BDA00033778078200014525
Microsoft的
Figure BDA00033778078200014526
Apple Home
Figure BDA00033778078200014527
和Google
Figure BDA00033778078200014528
在一些情况下,本文公开的设备、系统和试剂盒包含虚拟现实和/或增强现实系统。
在一些实施方案中,本文公开的设备、系统和试剂盒包含存储和/或存储器设备。该存储和/或存储器设备是一个或多个物理设备,用于临时或永久地存储数据或程序。在一些实施方案中,该设备是易失性存储器,并且需要电力来维持存储的信息。在一些实施方案中,该设备是非易失性存储器,并且在数字处理设备不通电时保留存储的信息。在进一步的实施方案中,非易失性存储器包括闪存。在一些实施方案中,非易失性存储器包括动态随机存取存储器(DRAM)。在一些实施方案中,非易失性存储器包括铁电随机存取存储器(FRAM)。在一些实施方案中,非易失性存储器包括相变随机存取存储器(PRAM)。在其他实施方案中,该设备是存储设备,举非限制性实例而言,包括CD-ROM、DVD、闪存设备、磁盘驱动器、磁带驱动器、光盘驱动器和基于云计算的存储。在进一步的实施方案中,存储和/或存储器设备是诸如本文所公开的那些设备的组合。
在一些实施方案中,数字处理设备包括显示器,以将视觉信息发送至用户。在一些实施方案中,显示器是液晶显示器(LCD)。在进一步的实施方案中,显示器是薄膜晶体管液晶显示器(TFT-LCD)。在一些实施方案中,显示器是有机发光二极管(OLED)显示器。在各种进一步实施方案中,在OLED显示器上是无源矩阵OLED(PMOLED)或有源矩阵OLED(AMOLED)显示器。在一些实施方案中,显示器是等离子显示器。在其他实施方案中,显示器是视频投影仪。在其他实施方案中,显示器是与数字处理设备通信的头戴式显示器,如VR头戴式耳机。
在一些实施方案中,数字处理设备包括用于从用户接收信息的输入设备。在一些实施方案中,输入设备是键盘。在一些实施方案中,输入设备是定点设备(pointingdevice),举非限制性实例而言,包括鼠标、轨迹球、轨迹板、操纵杆、游戏控制器或触控笔。在一些实施方案中,输入设备是触摸屏或多点触摸屏。在其他实施方案中,输入设备是麦克风,以捕获语音或其他声音输入。在其他实施方案中,输入设备是摄像机或其他传感器,以捕获运动或视觉输入。在进一步的实施方案中,输入设备是Kinect、Leap Motion等。在进一步的实施方案中,输入设备是诸如本文所公开的那些设备的组合。
移动应用程序
在一些实施方案中,本文公开的设备、系统、试剂盒和方法包含数字处理设备或其使用,其中数字处理设备提供有移动应用程序形式的可执行指令。在一些实施方案中,移动应用程序在制造时被提供给移动数字处理设备。在其他实施方案中,通过本文所述的计算机网络将移动应用程序提供给移动数字处理设备。本文公开的移动应用程序可以被配置为定位、加密、索引和/或访问信息。本文公开的移动应用程序可以被配置为获得、加密、创建、操作、索引和细读数据。
参考图5A,在特定实施方案中,移动应用程序被配置为与本文公开的设备、系统和试剂盒连接、通信并从其接收遗传信息和其他信息。图5A是描绘移动应用程序可选地提供给用户的各种功能的图。在该实施方案中,移动应用程序可选地提供:1)基于用户的个人信息和偏好的个性化、定制的用户体验(UX);2)交互式的文本、音频和/或视频驱动的教学经历,以告知用户如何使用设备、系统和试剂盒;3)内容平台,向用户提供对文章、新闻、媒体、游戏等的访问;以及4)用于跟踪和共享信息、测试结果和事件的工具。
参考图5B,在特定实施方案中,移动应用程序可选地包括交互式界面,其提供逐步流程以指导用户使用本文公开的设备、系统和试剂盒。在各种实施方案中,交互式流程包括文本、图像、动画、音频、视频等,以告知和指导用户。
参考图5C,在特定实施方案中,移动应用程序可选地包括主屏幕,其允许用户访问本文公开的移动应用程序功能。在该实施方案中,主屏幕包括个性化的问候以及允许用户启动测试、查看当前和历史测试结果、共享测试结果以及与更大的用户社区交互的界面元素。
参考图5D,在特定实施方案中,移动应用程序可选地包括进度图,其告知用户用于连接至本文公开的设备、系统或试剂盒的过程的状态。在该实施方案中,该图示出所有步骤并指示当前步骤。这些步骤是:1)通过例如蓝牙与设备配对;2)检测设备中的样品;以及3)等待样品被处理。在一些实施方案中,该图是交互式的、动画的或者用媒体或其他内容增强的。
参考图5E,在特定实施方案中,移动应用程序可选地包括社交共享屏幕,其允许用户访问特征以共享测试结果。许多服务、平台和网络适合于共享测试结果以及其他信息和事件。举非限制性实例而言,合适的社交网络和共享平台包括Facebook、YouTube、Twitter、LinkedIn、Pinterest、Google Plus+、Tumblr、Instagram、Reddit、VK、Snapchat、Flickr、Vine、Meetup、Ask.fm、Classmates、QQ、WeChat、Foursquare的Swarm、Kik、Yik Yak、Shots、Periscope、Medium、Soundcloud、Tinder、WhatsApp、Snap Chat、Slack、Musical.ly、Peach、Blab、Renren、Sina Weibo、Renren、Line和Momo。在一些实施方案中,测试结果由SMS、MMS或即时消息共享。在一些实施方案中,测试结果通过电子邮件共享。
在一些实施方案中,移动应用程序可选地包括主屏幕,其允许用户访问附加功能,如可选地被共享的与测试结果相关的重要信息和事件的网络日志和时间线。在各种实施方案中,合适的信息和事件包括与临床试验结果、新上市的疗法、营养、锻炼、胎儿发育、健康等相关的那些信息和事件。在该实施方案中,主屏幕还包括对用户偏好和设置的访问。
在一些情况下,本文公开的设备和系统与移动应用程序通信。移动应用可以允许获得患者身份和电子健康记录(EHR)、安排设备运输(去往和/或来自用户)、在线订购测试结果。移动应用程序可以允许从一个点到另一点跟踪设备或其部分(例如,运输/存储室)或用该设备获得的信息。可以从运输、家庭、样品处理实验室和医师办公室中选择不同的点。
鉴于本文提供的公开内容,通过本领域技术人员已知的技术使用本领域已知的硬件、语言和开发环境创建移动应用程序。本领域技术人员将认识到,移动应用程序用若干语言编写的。举非限制性实例而言,合适的编程语言包括C、C++、C#、Objective-C、JavaTM、Javascript、Pascal、Object Pascal、PythonTM、Ruby、VB.NET、WML和带有或不带有CSS的XHTML/HTML,或其组合。
合适的移动应用程序开发环境可以从若干来源获得。举非限制性实例而言,可商购的开发环境包括AirplaySDK、alcheMo、
Figure BDA0003377807820001481
Celsius、Bedrock、FlashLite、.NET Compact Framework、Rhomobile和WorkLight Mobile Platform。其他开发环境可免费获得,举非限制性实例而言,包括Lazarus、MobiFlex、MoSync和Phonegap。此外,移动设备制造商分配软件开发人员工具包,举非限制性实例而言,包括iPhone和iPad(iOS)SDK、AndroidTM SDK、
Figure BDA0003377807820001491
SDK、BREW SDK、
Figure BDA0003377807820001492
OS SDK、Symbian SDK、webOS SDK和
Figure BDA0003377807820001493
Mobile SDK。
本领域技术人员将认识到,可以使用若干商业论坛来分配移动应用程序,举非限制性实例而言,包括
Figure BDA0003377807820001494
App Store、
Figure BDA0003377807820001495
Play、Chrome WebStore、
Figure BDA0003377807820001496
App World、用于Palm设备的App Store、用于webOS的App Catalog、用于Mobile的
Figure BDA0003377807820001497
Marketplace、用于
Figure BDA0003377807820001498
设备的Ovi Store和Samsu
Figure BDA0003377807820001499
Apps。
与设备、系统、试剂盒和方法有关的方面
以下方面涉及本文公开的设备、系统、试剂盒和方法。本文公开的设备、系统、试剂盒和方法通常被设计用于处理和分析女性受试者的生物样品中的无细胞核酸。无细胞核酸、生物样品和受试者的以下描述可以帮助理解本文公开的设备、系统、试剂盒和方法的效用。
疾病和病况
本文公开了用于检测受试者中疾病或病况的存在、不存在或严重程度的设备、系统、试剂盒和方法。在一些情况下,疾病或病况是由于遗传突变引起的。遗传突变可以是遗传的(例如,突变存在于祖先或亲属中)。遗传突变可以是自发突变(例如,DNA复制或修复中的错误)。遗传突变可以是由于暴露于环境因素(例如紫外线、致癌物)引起的。举非限制性实例而言,遗传突变可以选自移码突变、插入突变、缺失突变、置换突变、单核苷酸多态性、拷贝数变异和染色体易位。
在一些情况下,疾病或病况是由于环境因素(例如致癌物、饮食、压力、病原体)引起的。在一些情况下,环境因素导致遗传突变。在其他情况下,环境因素不会引起遗传突变。在一些情况下,相对于健康个体,环境因素导致受试者的一种或多种表观遗传修饰的变化。在一些情况下,相对于受试者在较早时间点的一种或多种表观遗传修饰,环境因素导致受试者的一种或多种表观遗传修饰的变化。
组织或细胞类型特异性疾病
本文公开的设备、系统、试剂盒和方法可用于检测或监测影响一种或多种组织、器官或细胞类型的疾病或病况。该疾病或病况可能导致核酸从一种或多种组织、器官或细胞类型释放。相对于健康个体中发生的相应释放,该疾病或病况可能增加核酸从一种或多种组织、器官或细胞类型的释放。组织可以分类为上皮、结缔组织、肌肉或神经组织。组织的非限制性实例是脂肪、肌肉、结缔组织、乳腺组织和骨髓。器官的非限制性实例是脑、胸腺、甲状腺、肺、心脏、脾脏、肝、肾、胰腺、胃、小肠、大肠、结肠、前列腺、卵巢、子宫和膀胱。细胞类型的非限制性实例是内皮细胞、血管平滑肌细胞、心肌细胞、肝细胞、胰腺β细胞、脂肪细胞、神经元、子宫内膜细胞、免疫细胞(T细胞、B细胞、树突细胞、单核细胞、巨噬细胞、枯否细胞、小胶质)。
器官移植监测
本文公开的设备、系统、试剂盒和方法可用于检测或监测总体健康。本文公开的设备、系统、试剂盒和方法可用于检测或监测体格。本文公开的设备、系统、试剂盒和方法可用于检测或监测器官移植接受者的健康和/或移植器官的健康。
增殖性疾病(癌症)
在肿瘤学领域,在许多情况下,液体活检是基于组织的活检方法的可行性替代。特别地,当手术过于昂贵、对患者存在不合理的风险、对患者不方便,或者在转移性疾病、神经疾病和监测环境中没有待活检组织的情况下不切实际时,液体活检是有利的。
在一些实施方案中,本文公开了可用于早期癌症检测(筛查),疾病监测和表征,以及确定疾病负荷,获得精确治疗方案的设备、系统、试剂盒和方法,如实施例15中所示。
疾病或病况可以包括异常细胞的生长或增殖。疾病或病况可以包括白血病。白血病的非限制性类型包括急性成淋巴细胞白血病(ALL)、慢性淋巴细胞性白血病(CLL)、急性骨髓性白血病(AML)、慢性骨髓性白血病(CML)和多毛细胞白血病(HCL)。疾病或病况可以包括淋巴瘤。淋巴瘤可以是非霍奇金淋巴瘤(例如,B细胞淋巴瘤、弥漫性大B细胞淋巴瘤、T细胞淋巴瘤、Waldenstrom巨球蛋白血症)或霍奇金淋巴瘤。疾病或病况可以包括癌症。癌症可以是乳腺癌。癌症可以是肺癌。癌症可以是食道癌。癌症可以是胰腺癌。癌症可以是卵巢癌。癌症可以是子宫癌。癌症可以是子宫颈癌。癌症可以是睾丸癌。癌症可以是前列腺癌。癌症可以是膀胱癌。癌症可以是结肠癌。癌症可以是肉瘤。癌症可以是腺癌。癌症可以是孤立的,也就是说,它没有扩散到癌症起源的器官或组织以外的其他组织。癌症可以是转移性的。癌症可以已经扩散到邻近组织。癌症可以已经扩散到与癌症起源的器官或组织物理接触的细胞、组织或器官。癌症可以已经扩散到与癌症起源的器官或组织没有物理接触的细胞、组织或器官。癌症可以处于早期阶段,例如0期(可能会变成癌症的异常细胞)或1期(较小且局限于一个组织内)。癌症可以处于中间状态,例如2期或3期,生长到与原始肿瘤组织物理接触的组织和淋巴结中。癌症可以是晚期的,例如4期或5期,其中癌症已经转移到远离(例如,不相邻或不物理接触)原始肿瘤组织的组织。在一些情况下,癌症不是晚期的。在一些情况下,癌症不是转移性的。在一些情况下,癌症是转移性的。
自身免疫性疾病
疾病或病况可以包括自身免疫病症。自身免疫和免疫病症包括但不限于1型糖尿病、类风湿性关节炎、银屑病、多发性硬化症、狼疮、炎性肠病、艾迪生氏病、格雷夫斯病、克罗恩病和乳糜泻。
代谢性疾病
疾病或病况可以包括代谢紊乱。代谢病况和疾病包括但不限于肥胖症、甲状腺疾病、高血压、1型糖尿病、2型糖尿病、非酒精性脂肪性肝炎、冠状动脉疾病和动脉粥样硬化。
疾病或病况可以包括心血管病症。心血管疾病的非限制性实例是动脉粥样硬化、心肌梗塞、心包炎、心肌炎、缺血性中风、高血压心脏病、风湿性心脏病、心肌病、先天性心脏病、瓣膜性心脏病、心脏炎、主动脉瘤、外周动脉疾病、血栓栓塞病和静脉血栓形成。
神经疾病
疾病或病况可以包括神经性病症。神经性病症可以包括神经退行性疾病。神经退行性病症和神经性病症的非限制性实例是阿尔茨海默病、帕金森病、亨廷顿病、脊髓小脑共济失调、肌萎缩性侧索硬化症(ALS)、运动神经元疾病、慢性疼痛和脊髓性肌萎缩。本文公开的设备、系统、试剂盒和方法可用于测试、检测和/或监测受试者的精神障碍和/或对治疗精神障碍的药物的反应。
传染病
疾病或病况可以包括感染。疾病或病况可以是由感染引起的。感染可能使疾病或病况恶化。感染可以是病毒感染。感染可以是细菌感染。感染可以是真菌感染。
衰老
疾病或病况可能与衰老相关。与衰老相关的疾病和病况包括但不限于癌症、骨质疏松、痴呆、黄斑变性、代谢病况和神经退行性病症。
血液疾病或紊乱
疾病或病况可以是血液病症。血液病症的非限制性实例是贫血、血友病、凝血和血栓形成倾向。例如,检测血栓形成倾向可以包括检测选自因子V Leiden(FVL)、凝血酶原基因(PT G20210A)和亚甲基四氢叶酸还原酶(MTHFR)的基因中存在的多态性。
过敏或耐受不良
疾病或病况可以是对食物、液体或药物的变态反应或不耐受。举非限制性实例而言,受试者可能对乳糖、小麦、大豆、乳制品、咖啡因、酒精、坚果、贝类和鸡蛋具有变应性或不耐受。受试者还可能对药物、补品或化妆品具有变应性或不耐受。在一些情况下,方法包括分析预测皮肤类型或皮肤健康的遗传标志物。
在一些情况下,病况与变态反应有关。在一些情况下,受试者未诊断患有疾病或病况,而是正在经历指示存在疾病或病况的症状。在其他情况下,受试者已经被诊断患有疾病或病况,并且本文公开的设备、系统、试剂盒和方法可用于监测疾病或病况,或者药物对疾病或病况的作用。
染色体异常
本文公开了用于检测染色体异常的设备、系统、试剂盒和方法。本领域技术人员还可以将染色体异常称为染色体畸变。在一些情况下,染色体异常是染色体重复。在一些情况下,染色体异常是染色体缺失。在一些情况下,染色体异常是染色体臂的缺失。在一些情况下,染色体异常是染色体臂的部分缺失。在一些情况下,染色体异常包含基因的至少一次拷贝。在一些情况下,染色体异常是由于染色体断裂引起的。在一些情况下,染色体异常是由于第一染色体的一部分易位到第二染色体的一部分引起的。
许多已知的染色体异常会导致染色体病症。因此,本文公开的设备、系统、试剂盒和方法可用于检测染色体病症。举非限制性实例而言,染色体疾病包括唐氏综合征(21三体性)、Edward综合征(18三体性)、Patau综合征(13三体性)、Cri du chat综合征(5号染色体短臂的部分缺失)、Wolf-Hirschhorn综合征(4号染色体的短臂缺失)、Jacobsen综合征(11号染色体的长臂缺失)、diGeorge综合征(22号染色体的少量缺失)、Klinefelter综合征(男性有额外的X染色体存在)和特纳综合征(女性中只有一个X染色体存在)。
生物样品
本文公开了用于分析生物样品的无细胞核酸的设备、系统、试剂盒和方法。生物样品的非限制性实例包括全血、血浆、血清、唾液、尿液、汗液、泪液、阴道液和宫颈液或活检的样品。在一些情况下,生物样品包含全血。在一些情况下,生物样品是包含生物物质的环境样品。例如,生物样品可以是包含病毒、细菌或其片段/颗粒的食物样品或水样品。
本文所述的方法、系统和试剂盒通常检测和定量无细胞核酸。由于这个原因,本文所述的生物样品通常是基本上无细胞的生物流体或可以被修饰为无细胞生物流体。举非限制性实例而言,来自受试者的样品可以是去除了细胞的血液、血浆、血清、尿液、唾液或阴道液。例如,无细胞核酸可以在受试者的血流中循环,因此检测试剂可以用于检测或定量来自受试者的血液或血清样品中的标志物。除非另有说明,否则术语“血浆”和“血清”在本文可互换使用。然而,在一些情况下,它们被包含在单个样品种类列表中,以表明这二者都包含在说明书或权利要求书中。在一些情况下,生物流体不包含羊水。
在一些情况下,本文公开的设备、系统、试剂盒和方法能够从生物样品去除细胞。所得样品可以被称为细胞去除样品。细胞去除样品可具有比生物样品少至少95%的完全、完整细胞。细胞去除样品可具有比生物样品少至少90%的完全、完整细胞。细胞去除样品可具有比生物样品少至少80%的完全、完整细胞。细胞去除样品可具有比生物样品少至少约75%、至少约70%、至少约60%、至少约50%、至少约40%或至少约25%的完全、完整细胞。细胞去除样品可完全不含任何完全、完整细胞。
从毛细血管(例如,诸如手指、脚趾等末端的血管)获得的血液在本文可以被称为“毛细血管血液”。从静脉(例如,手臂、手的中部)获得的血液在本文可以被称为“静脉血”。用于静脉穿刺以获得静脉血的常见静脉是肘正中静脉、头静脉、贵要静脉和掌背静脉。在一些情况下,生物样品包含毛细血管血液。在一些情况下,生物样品基本上由毛细血管血液组成。在一些情况下,生物样品由毛细血管血液组成。在一些实施方案中,生物样品不包含静脉血。在一些情况下,生物样品包含血浆。在一些情况下,生物样品基本上由血浆组成。在一些情况下,生物样品由血浆组成。在一些情况下,生物样品包含血清。在一些情况下,生物样品基本上由血清组成。在一些情况下,生物样品由血清组成。在一些情况下,生物样品包含尿液。在一些情况下,生物样品基本上由尿液组成。在一些情况下,生物样品由尿液组成。在一些情况下,生物样品包含唾液。在一些情况下,生物样品基本上由唾液组成。在一些情况下,生物样品由唾液组成。在一些情况下,生物流体包含阴道液。在一些情况下,生物流体基本上由阴道液组成。在一些情况下,生物流体由阴道液组成。在一些情况下,通过对妊娠受试者进行阴道擦除获得阴道液。在一些情况下,生物流体包含组织液。在一些情况下,生物流体基本上由组织液组成。在一些情况下,生物流体包含滑液。在一些情况下,生物流体基本上由滑液组成。在一些情况下,生物流体包含来自液体活检的流体。在一些情况下,生物流体基本上由来自液体活检的流体组成。液体活检的实例是从癌症患者获得血液,并测试已经从肿瘤或癌细胞释放到血流中的核酸。由于坏死、凋亡、自噬和导致癌细胞死亡/损坏的癌症疗法,核酸可能从肿瘤或癌细胞中释放出来。
在一些情况下,生物样品是全血。通常,本文公开的设备、系统、试剂盒和方法能够从非常小的全血样品分析无细胞核酸。在一些情况下,可以用手指针刺获得较小的全血样品,诸如用刺血针或大头针/针进行。在一些情况下,可以在不进行静脉切开术的条件下获得较小的全血样品。
在一些情况下,本文公开的设备、系统、试剂盒和方法需要至少约1μl血液从而以至少约95%的置信度或准确度提供测试结果。在一些情况下,本文公开的设备、系统、试剂盒和方法需要至少约10μl血液从而以至少约95%的置信度或准确度提供测试结果。在一些情况下,本文公开的设备、系统、试剂盒和方法需要至少约20μl血液从而以至少约95%的置信度或准确度提供测试结果。在一些情况下,本文公开的设备、系统和试剂盒需要至少约30μL血液从而以至少约95%的置信度或准确度提供测试结果。在一些情况下,本文公开的设备、系统和试剂盒需要至少约40μL血液从而以至少约95%的置信度或准确度提供测试结果。在一些情况下,本文公开的设备、系统和试剂盒需要至少约50μL血液从而以至少约95%的置信度或准确度提供测试结果。在一些情况下,本文公开的设备、系统和试剂盒需要至少约60μL血液从而以至少约95%的置信度或准确度提供测试结果。在一些情况下,本文公开的设备、系统和试剂盒需要至少约70μL血液从而以至少约95%的置信度或准确度提供测试结果。
在一些情况下,本文公开的设备、系统和试剂盒需要至少约1μL血液从而以至少约99%的置信度或准确度提供测试结果。在一些情况下,本文公开的设备、系统和试剂盒需要至少约10μL血液从而以至少约99%的置信度或准确度提供测试结果。在一些情况下,本文公开的设备、系统和试剂盒需要至少约20μL血液从而以至少约99%的置信度或准确度提供测试结果。在一些情况下,本文公开的设备、系统和试剂盒需要至少约30μL血液从而以至少约99%的置信度或准确度提供测试结果。在一些情况下,本文公开的设备、系统和试剂盒需要至少约40μL血液从而以至少约99%的置信度或准确度提供测试结果。在一些情况下,本文公开的设备、系统和试剂盒需要至少约60μL血液从而以至少约99%的置信度或准确度提供测试结果。在一些情况下,本文公开的设备、系统和试剂盒需要至少约80μL血液从而以至少约99%的置信度或准确度提供测试结果。在一些情况下,本文公开的设备、系统和试剂盒需要至少约100μL血液从而以至少约90%的置信度或准确度提供测试结果。
在一些情况下,该方法包括仅获得约1μL至约500μL血液从而以至少约95%的置信度或准确度提供测试结果。在一些情况下,该方法包括仅获得约10μL至约200μL血液从而以至少约95%的置信度或准确度提供测试结果。在一些情况下,该方法包括仅获得约15μL至约150μL血液从而以至少约95%的置信度或准确度提供测试结果。在一些情况下,该方法包括仅获得约20μL至约100μL血液从而以至少约95%的置信度或准确度提供测试结果。在一些情况下,本文公开的设备、系统和试剂盒仅需要约20μl至约100μl血液从而以至少约98%的置信度或准确度提供测试结果。在一些情况下,本文公开的设备、系统和试剂盒仅需要约20μl至约100μl血液从而以至少约99%的置信度或准确度提供测试结果。在一些情况下,本文公开的设备、系统和试剂盒仅需要约20μl至约100μl血液从而以约99.5%的置信度或准确度提供测试结果。在一些情况下,本文公开的设备、系统和试剂盒仅需要约20μl至约100μl血液从而以约99.9%的置信度或准确度提供测试结果。
在一些情况下,生物样品是血浆或血清。血浆或血清约占全血的55%。在一些情况下,本文公开的设备、系统、试剂盒和方法需要至少约1μl血浆或血清从而以至少约95%的置信度或准确度提供测试结果。在一些情况下,本文公开的设备、系统、试剂盒和方法需要至少约10μl血浆或血清从而以至少约95%的置信度或准确度提供测试结果。在一些情况下,本文公开的设备、系统和试剂盒需要至少约20μl血浆或血清从而以至少约95%的置信度或准确度提供测试结果。在一些情况下,本文公开的设备、系统和试剂盒需要至少约30μl血浆或血清从而以至少约95%的置信度或准确度提供测试结果。在一些情况下,本文公开的设备、系统和试剂盒需要至少约40μl血浆或血清从而以至少约95%的置信度或准确度提供测试结果。在一些情况下,本文公开的设备、系统和试剂盒需要至少约50μl血浆或血清从而以至少约95%的置信度或准确度提供测试结果。在一些情况下,本文公开的设备、系统和试剂盒需要至少约10μl血浆或血清从而以至少约99%的置信度或准确度提供测试结果。在一些情况下,本文公开的设备、系统和试剂盒需要至少约20μl血浆或血清从而以至少约99%的置信度或准确度提供测试结果。在一些情况下,本文公开的设备、系统和试剂盒需要至少约30μl血浆或血清从而以至少约99%的置信度或准确度提供测试结果。在一些情况下,本文公开的设备、系统和试剂盒需要至少约40μl血浆或血清从而以至少约99%的置信度或准确度提供测试结果。在一些情况下,本文公开的设备、系统和试剂盒需要至少约50μl血浆或血清从而以至少约99%的置信度或准确度提供测试结果。在一些情况下,本文公开的设备、系统和试剂盒仅需要约10μl至约50μl的血浆或血清从而以至少约95%的置信度或准确度提供测试结果。在一些情况下,本文公开的设备、系统和试剂盒仅需要约20μl至约60μl的血浆或血清从而以至少约95%的置信度或准确度提供测试结果。在一些情况下,本文公开的设备、系统和试剂盒仅需要约10μl至约50μl的血浆或血清从而以至少约99%的置信度或准确度提供测试结果。
在一些情况下,生物样品是唾液。在一些情况下,本文公开的设备、系统、试剂盒和方法需要至少约100μl唾液从而以至少约95%的置信度或准确度提供测试结果。在一些情况下,本文公开的设备、系统、试剂盒和方法需要至少约200μl唾液从而以至少约95%的置信度或准确度提供测试结果。在一些情况下,本文公开的设备、系统、试剂盒和方法需要至少约500μl唾液从而以至少约95%的置信度或准确度提供测试结果。在一些情况下,本文公开的设备、系统、试剂盒和方法需要至少约1ml唾液从而以至少约95%的置信度或准确度提供测试结果。在一些情况下,本文公开的设备、系统、试剂盒和方法需要至少约2ml唾液从而以至少约95%的置信度或准确度提供测试结果。在一些情况下,本文公开的设备、系统、试剂盒和方法需要至少约3ml唾液从而以至少约95%的置信度或准确度提供测试结果。
在一些情况下,生物样品是阴道液。在一些情况下,本文公开的设备、系统、试剂盒和方法需要至少约50μl阴道液从而以至少约95%的置信度或准确度提供测试结果。在一些情况下,本文公开的设备、系统、试剂盒和方法需要至少约100μl阴道液从而以至少约95%的置信度或准确度提供测试结果。在一些情况下,本文公开的设备、系统、试剂盒和方法需要至少约200μl阴道液从而以至少约95%的置信度或准确度提供测试结果。在一些情况下,本文公开的设备、系统、试剂盒和方法需要至少约500μl阴道液从而以至少约95%的置信度或准确度提供测试结果。在一些情况下,本文公开的设备、系统、试剂盒和方法需要至少约1ml阴道液从而以至少约95%的置信度或准确度提供测试结果。在一些情况下,本文公开的设备、系统、试剂盒和方法需要至少约2ml阴道液从而以至少约95%的置信度或准确度提供测试结果。在一些情况下,本文公开的设备、系统、试剂盒和方法需要至少约3ml阴道液从而以至少约95%的置信度或准确度提供测试结果。
在一些情况下,本文公开的生物样品包含无细胞核酸,其中一部分无细胞核酸来自外来组织或异常组织。该部分中的无细胞核酸可以称为“外来无细胞核酸”或“外来无细胞核酸”。举非限制性实例而言,外来或异常组织可以包含已经被移植到受试者中的组织或器官。外来或异常组织可以被称为供体组织,并且受试者可以被称为宿主组织。同样举非限制性实例而言,异常组织可以包含肿瘤。在一些情况下,该部分是生物样品中所有(总)无细胞核酸的一部分,其中该部分包含外来或异常的无细胞核酸。在一些情况下,该部分基本上由外源或异常的无细胞核酸组成。在一些情况下,外来或异常的无细胞核酸包括DNA。在一些情况下,外来或异常的无细胞核酸包括RNA。在一些情况下,外来或异常的无细胞核酸基本上由DNA组成。在一些情况下,外来或异常的无细胞核酸基本上由RNA组成。
来自外来或异常组织的无细胞核酸的部分可以表征为样品中总无细胞核酸的百分比。在一些情况下,来自外来或异常组织的无细胞核酸的部分小于25%。在一些情况下,来自外来或异常组织的无细胞核酸的部分小于20%。在一些情况下,该部分小于15%。在一些情况下,该部分小于10%。在一些情况下,该部分小于8%。在一些情况下,该部分小于6%。在一些情况下,该部分小于5%。在一些情况下,该部分小于4%。在一些情况下,该部分小于2%。在一些情况下,该部分至少为1%。在一些情况下,该部分为约1.5%至约15%。在一些情况下,该部分为约2%至约12%。在一些情况下,该部分为约4%至约10%。在一些情况下,该部分为约4%至约9%。在一些情况下,该胎儿分数为约4%至约8%。在一些情况下,该胎儿分数为约1%至约5%。在一些情况下,该胎儿分数为约1%至约4%。
在一些情况下,本文公开的生物样品包含无细胞核酸,其中一部分无细胞核酸来自胎儿。该部分可以被称为胎儿分数。在一些情况下,胎儿分数是生物样品中所有(总)核酸的部分,其中该部分由胎儿核酸组成。在一些情况下,核酸和/或胎儿核酸包括DNA。在一些情况下,核酸和/或胎儿核酸包括RNA。在一些情况下,核酸和/或胎儿核酸基本上由DNA组成。在一些情况下,核酸和/或胎儿核酸包括DNA和RNA。
在一些情况下,胎儿分数是生物样品中总无细胞核酸的约1.5%至约15%。在一些情况下,胎儿分数是生物样品中总无细胞核酸的约2%至约12%。在一些情况下,胎儿分数是生物样品中总无细胞核酸的约4%至约10%。在一些情况下,胎儿分数是生物样品中总无细胞核酸的约4%至约9%。
在一些情况下,胎儿分数是生物样品中总无细胞核酸的约4%至约8%。
在一些情况下,胎儿分数是生物样品中总无细胞核酸的约1%至约5%。
在一些情况下,胎儿分数是生物样品中总无细胞核酸的约1%至约4%。
在一些情况下,至少一部分胎儿核酸来自胎儿。在一些情况下,至少一部分胎儿核酸来自胎盘。在一些情况下,至少一部分胎儿核酸来自胎儿,并且至少一部分胎儿核酸来自胎盘。在一些情况下,胎儿核酸仅来自胎儿。在一些情况下,胎儿核酸仅来自胎盘。在一些情况下,胎儿核酸全部是来自胎儿和胎盘的核酸。在一些情况下,胎儿核酸不是来自母体组织或母体流体。在一些情况下,母体组织是除了胎盘以外的母体组织。在一些情况下,母体流体是除了羊水以外的母体流体。
在一些情况下,本文公开的方法包括修饰生物流体以使生物样品与扩增或测序相容。在一些情况下,本文公开的方法可以包括向生物样品添加缓冲液、盐、蛋白质或核酸。举非限制性实例而言,可以将EDTA添加到血液样品中以防止凝结。为简单起见,这种经过修饰的生物样品仍被称为“生物样品”。
无细胞核酸
在一些情况下,本公开内容的组合物和方法可用于评估生物样品中的无细胞核酸。无细胞核酸可以来自动物。无细胞核酸可以来自哺乳动物。无细胞核酸可以来自人类受试者。无细胞核酸可以来自植物。无细胞核酸可以来自病原体。无细胞核酸可以来自存在于生物样品中的病原体,其中生物样品来自动物。无细胞核酸可以来自存在于生物样品的病原体,其中生物样品来自人类受试者。病原体可以包含细菌或其组分。病原体可以是病毒或其组分。病原体可以是真菌或其组分。
在一些情况下,无细胞核酸是DNA(cf-DNA)。在一些情况下,无细胞核酸是基因组DNA。在一些情况下,无细胞核酸是RNA(cf-RNA)。在一些情况下,无细胞核酸是来自胎儿细胞的核酸,在本文中称为无细胞胎儿核酸。在一些情况下,无细胞胎儿核酸是无细胞胎儿DNA(无细胞DNA)或无细胞胎儿RNA(cff-RNA)。在一些情况下,cf-DNA或无细胞DNA是基因组DNA。在一些情况下,无细胞核酸为互补DNA(cDNA)的形式,其通过cf-RNA或cff-RNA的逆转录产生。在一些情况下,cf-DNA包括线粒体DNA。在一些情况下,所述cf-RNA或cff-RNA是信使RNA(mRNA)、微小RNA(miRNA)、线粒体RNA或天然反义RNA(NAS-RNA)。在一些情况下,所述无细胞核酸序列包括选自以下各项的RNA分子或片段化的RNA分子(RNA片段):小干扰RNA(siRNA)、微小RNA(miRNA)、pre-miRNA、pri-miRNA、mRNA、pre-mRNA、病毒RNA、类病毒RNA(aviral RNA)、拟病毒RNA(a virusoid RNA)、环状RNA(circRNA)、核糖体RNA(rRNA)、转移RNA(tRNA)、pre-tRNA、长非编码RNA(lncRNA)、小核RNA(snRNA)、循环RNA、无细胞RNA、外体RNA(exosomal RNA)、载体表达的RNA、RNA转录物及其组合。在一些情况下,无细胞核酸是母体核酸和胎儿核酸的混合物。在母体血流中循环无细胞胎儿核酸可以被称为“循环无细胞核酸”或“循环性细胞外DNA”。在一些情况下,无细胞核酸包含表观遗传修饰。在一些情况下,无细胞核酸包含表观遗传修饰的模式,其对应于性别或感兴趣的其他遗传信息。在一些情况下,无细胞核酸包含甲基化胞嘧啶。在一些情况下,无细胞核酸包含胞嘧啶甲基化模式,其对应于性别或感兴趣的其他遗传信息。
在一些情况下,本文公开的方法、设备、系统和试剂盒被配置用于检测或定量细胞核酸,诸如来自破坏的细胞或裂解的细胞的核酸。在一些情况下,细胞核酸来自有意地破坏或裂解的细胞。在一些情况下,细胞核酸来自无意地破坏或裂解的细胞。本文公开的方法、设备、系统和试剂盒可以被配置用于分析有意地破坏或裂解的细胞,而不是无意破坏或裂解的细胞。在一些情况下,生物样品中少于约0.1%的总核酸是细胞核酸。在一些情况下,生物样品中少于约1%的总核酸是细胞核酸。在一些情况下,生物样品中少于约5%的总核酸是细胞核酸。在一些情况下,生物样品中少于约10%的总核酸是细胞核酸。在一些情况下,生物样品中少于约20%的总核酸是细胞核酸。在一些情况下,生物样品中少于约30%的总核酸是细胞核酸。在一些情况下,生物样品中少于约40%的总核酸是细胞核酸。在一些情况下,生物样品中少于约50%的总核酸是细胞核酸。在一些情况下,生物样品中少于约60%的总核酸是细胞核酸。在一些情况下,生物样品中少于约70%的总核酸是细胞核酸。在一些情况下,生物样品中少于约80%的总核酸是细胞核酸。在一些情况下,生物样品中少于约90%的总核酸是细胞核酸。在一些情况下,设备、系统、试剂盒和方法包含实验对照或其使用。在一些情况下,实验对照包括核酸、蛋白质、肽、抗体、抗原结合抗体片段、结合部分。在一些情况下,实验对照包含用于检测实验对照的信号。信号的非限制性实例是荧光分子、染料分子、纳米颗粒和比色指示剂。在一些情况下,实验对照包括无细胞核酸。在一些情况下,无细胞核酸包括无细胞胎儿核酸。在一些情况下,无细胞核酸包括母体无细胞核酸。在一些情况下,无细胞核酸包括母体无细胞核酸(例如,以评估在样品处理期间发生的细胞破坏/裂解的量)。在一些情况下,无细胞核酸包括对应于常染色体的序列。在一些情况下,无细胞核酸包括对应于性染色体的序列。在一些情况下,无细胞核酸包括对应于可能是非整倍性的染色体(例如,染色体13、16、18、21、22、X、Y)的序列。在一些情况下,无细胞核酸包括对应于非常不可能是非整倍性的染色体(例如,染色体1-12、14、15、17、19或20)的序列。
在一些情况下,生物样品包含母体体液样品。在一些情况下,母体体液样品包括血液,例如全血、外周血样品或血液部分(血浆、血清)。在一些情况下,母体体液样品包括汗液、泪液、痰液、尿液、耳液、淋巴液、唾液、脑脊液、骨髓悬浮液、阴道液、经宫颈灌洗液、脑液、腹水或乳汁。在一些情况下,母体体液样品包含呼吸道、肠道和泌尿生殖道的分泌物、羊水或白细胞样品。在一些情况下,生物流体样品是可以通过非侵入性程序容易地获得的母体体液样品,例如血液、血浆、血清、汗液、泪液、痰液、尿液、耳液或唾液。在一些情况下,样品是至少两种体液样品的组合。在一些情况下,无细胞胎儿核酸源自母体胎盘,例如来自凋亡的胎盘细胞。在一些情况下,生物样品是胎盘血液。
在一些情况下,通过本文公开的设备、系统、试剂盒和方法评估或分析的核酸具有优选的长度。在一些情况下,核酸是无细胞胎儿DNA片段。在一些情况下,无细胞胎儿DNA片段来自Y染色体。在一些情况下,核酸的长度为约15bp至约500bp。在一些情况下,核酸的长度为约50bp至约200bp。在一些情况下,核酸的长度为至少约15bp。在一些情况下,核酸的长度为至多约500bp。在情况下,核酸的长度为约15bp至约50bp、约15bp至约75bp、约15bp至约100bp、约15bp至约150bp、约15bp至约200bp、约15bp至约250bp、约15bp至约300bp、约15bp至约350bp、约15bp至约400bp、约15bp至约450bp、约15bp至约500bp、约50bp至约75bp、约50bp至约100bp、约50bp至约150bp、约50bp至约200bp、约50bp至约250bp、约50bp至约300bp、约50bp至约350bp、约50bp至约400bp、约50bp至约450bp、约50bp至约500bp、约75bp至约100bp、约75bp至约150bp、约75bp至约200bp、约75bp至约250bp、约75bp至约300bp、约75bp至约350bp、约75bp至约400bp、约75bp至约450bp、约75bp至约500bp、约100bp至约150bp、约100bp至约200bp、约100bp至约250bp、约100bp至约300bp、约100bp至约350bp、约100bp至约400bp、约100bp至约450bp、约100bp至约500bp、约150bp至约200bp、约150bp至约250bp、约150bp至约300bp、约150bp至约350bp、约150bp至约400bp、约150bp至约450bp、约150bp至约500bp、约200bp至约250bp、约200bp至约300bp、约200bp至约350bp、约200bp至约400bp、约200bp至约450bp、约200bp至约500bp、约250bp至约300bp、约250bp至约350bp、约250bp至约400bp、约250bp至约450bp、约250bp至约500bp、约300bp至约350bp、约300bp至约400bp、约300bp至约450bp、约300bp至约500bp、约350bp至约400bp、约350bp至约450bp、约350bp至约500bp、约400bp至约450bp、约400bp至约500bp或约450bp至约500bp。在一些情况下,核酸的长度为约15bp、约50bp、约75bp、约100bp、约150bp、约200bp、约250bp、约300bp、约350bp、约400bp、约450bp或约500bp。
使用本公开内容的设备、系统、试剂盒和方法评估的无细胞核酸的大小可以根据例如使用的特定体液样品而变化。例如,已经观察到无细胞DNA序列比母体无细胞DNA序列更短,并且尿液中的无细胞DNA和母体无细胞DNA都比血浆样品中的更短。
在一些情况下,尿液中评估的无细胞DNA序列的长度为约20bp至约300bp。在一些情况下,尿液样品中评估的无细胞DNA序列的长度为约15bp至约300bp。在一些情况下,尿液样品中评估的无细胞DNA序列的长度为至少约15bp。在一些情况下,尿液样品中评估的无细胞DNA序列的长度为至多约300bp。在一些情况下,尿液样品中评估的无细胞DNA序列的长度为约15bp至约20bp、约15bp至约30bp、约15bp至约60bp、约15bp至约90bp、约15bp至约120bp、约15bp至约150bp、约15bp至约180bp、约15bp至约210bp、约15bp至约240bp、约15bp至约270bp、约15bp至约300bp、约20bp至约30bp、约20bp至约60bp、约20bp至约90bp、约20bp至约120bp、约20bp至约150bp、约20bp至约180bp、约20bp至约210bp、约20bp至约240bp、约20bp至约270bp、约20bp至约300bp、约30bp至约60bp、约30bp至约90bp、约30bp至约120bp、约30bp至约150bp、约30bp至约180bp、约30bp至约210bp、约30bp至约240bp、约30bp至约270bp、约30bp至约300bp、约60bp至约90bp、约60bp至约120bp、约60bp至约150bp、约60bp至约180bp、约60bp至约210bp、约60bp至约240bp、约60bp至约270bp、约60bp至约300bp、约90bp至约120bp、约90bp至约150bp、约90bp至约180bp、约90bp至约210bp、约90bp至约240bp、约90bp至约270bp、约90bp至约300bp、约120bp至约150bp、约120bp至约180bp、约120bp至约210bp、约120bp至约240bp、约120bp至约270bp、约120bp至约300bp、约150bp至约180bp、约150bp至约210bp、约150bp至约240bp、约150bp至约270bp、约150bp至约300bp、约180bp至约210bp、约180bp至约240bp、约180bp至约270bp、约180bp至约300bp、约210bp至约240bp、约210bp至约270bp、约210bp至约300bp、约240bp至约270bp、约240bp至约300bp或约270bp至约300bp。在一些情况下,尿液样品中评估的无细胞DNA序列的长度为约15bp、约20bp、约30bp、约60bp、约90bp、约120bp、约150bp、约180bp、约210bp、约240bp、约270bp或约300bp。
在一些情况下,血浆或血清样品中评估的无细胞DNA序列的长度为至少约20bp。在一些情况下,血浆或血清样品中评估的无细胞DNA序列的长度为至少约40bp。在一些情况下,血浆或血清样品中评估的无细胞DNA序列的长度为至少约80bp。在一些情况下,血浆或血清样品中评估的无细胞DNA序列的长度为至多约500bp。在一些情况下,血浆或血清中评估的无细胞DNA序列的长度为约100bp至约500bp。在一些情况下,血浆或血清样品中评估的无细胞DNA序列的长度为约50bp至约500bp。在一些情况下,血浆或血清样品中评估的无细胞DNA序列的长度为约80bp至约100bp、约80bp至约125bp、约80bp至约150bp、约80bp至约175bp、约80bp至约200bp、约80bp至约250bp、约80bp至约300bp、约80bp至约350bp、约80bp至约400bp、约80bp至约450bp、约80bp至约500bp、约100bp至约125bp、约100bp至约150bp、约100bp至约175bp、约100bp至约200bp、约100bp至约250bp、约100bp至约300bp、约100bp至约350bp、约100bp至约400bp、约100bp至约450bp、约100bp至约500bp、约125bp至约150bp、约125bp至约175bp、约125bp至约200bp、约125bp至约250bp、约125bp至约300bp、约125bp至约350bp、约125bp至约400bp、约125bp至约450bp、约125bp至约500bp、约150bp至约175bp、约150bp至约200bp、约150bp至约250bp、约150bp至约300bp、约150bp至约350bp、约150bp至约400bp、约150bp至约450bp、约150bp至约500bp、约175bp至约200bp、约175bp至约250bp、约175bp至约300bp、约175bp至约350bp、约175bp至约400bp、约175bp至约450bp、约175bp至约500bp、约200bp至约250bp、约200bp至约300bp、约200bp至约350bp、约200bp至约400bp、约200bp至约450bp、约200bp至约500bp、约250bp至约300bp、约250bp至约350bp、约250bp至约400bp、约250bp至约450bp、约250bp至约500bp、约300bp至约350bp、约300bp至约400bp、约300bp至约450bp、约300bp至约500bp、约350bp至约400bp、约350bp至约450bp、约350bp至约500bp、约400bp至约450bp、约400bp至约500bp或约450bp至约500bp。在一些情况下,血浆或血清样品中评估的无细胞DNA序列的长度为约80bp、约100bp、约125bp、约150bp、约175bp、约200bp、约250bp、约300bp、约350bp、约400bp、约450bp或约500bp。
受试者
本文公开了用于分析来自受试者的样品中的生物组分的设备、系统、试剂盒和方法。受试者可以是人类。受试者可以是非人类。受试者可以是非哺乳动物(例如,鸟、爬行动物、昆虫)。在一些情况下,受试者是哺乳动物。在一些情况下,哺乳动物是雌性。在一些情况下,受试者是人类受试者。在一些情况下,哺乳动物是灵长类动物(例如,人类、大猿、小猿、猴)。在一些情况下,哺乳动物是犬科动物(例如,狗、狐狸、狼)。在一些情况下,哺乳动物是猫科动物(例如,家猫、大型猫科动物)。在一些情况下,哺乳动物是马科动物(例如,马)。在一些情况下,哺乳动物是牛科动物(例如,奶牛、水牛、野牛)。在一些情况下,哺乳动物是绵羊。在一些情况下,哺乳动物是山羊。在一些情况下,哺乳动物是猪。在一些情况下,哺乳动物是啮齿动物(例如,小鼠、大鼠、兔、豚鼠)。
在一些情况下,本文所述的受试者受疾病或病况的影响。本文公开的设备、系统、试剂盒和方法可用于测试疾病或病况、检测疾病或病况以及/或者监测疾病或病况。本文公开的设备、系统、试剂盒和方法可用于测试遗传性状的存在、监测体格和检测家庭联系。
本文公开的设备、系统、试剂盒和方法可用于测试、检测和/或监测受试者中的癌症。癌症的非限制性实例包括乳腺癌、前列腺癌、皮肤癌、肺癌、结直肠癌/结肠癌、膀胱癌、胰腺癌、淋巴瘤和白血病。
本文公开的设备、系统、试剂盒和方法可用于测试、检测和/或监测受试者中的免疫病症或自身免疫病症。自身免疫和免疫病症包括但不限于1型糖尿病、类风湿性关节炎、银屑病、多发性硬化症、狼疮、炎性肠病、艾迪生病、格雷夫斯病、克罗恩病和乳糜泻。
本文公开的设备、系统、试剂盒和方法可用于测试、检测和/或监测与受试者的衰老相关的疾病或病况。与衰老相关的疾病和病况包括但不限于癌症、骨质疏松、痴呆、黄斑变性、代谢病况和神经退行性病症。
本文公开的设备、系统、试剂盒和方法可用于测试、检测和/或监测血液病症。血液病症的非限制性实例是贫血、血友病、凝血和血栓形成倾向。例如,检测血栓形成倾向可以包括检测选自因子V Leiden(FVL)、凝血酶原基因(PT G20210A)和亚甲基四氢叶酸还原酶(MTHFR)的基因中存在的多态性。
本文公开的设备、系统、试剂盒和方法可用于测试、检测和/或监测受试者中的神经性病症或神经退行性病症。神经退行性病症和神经性病症的非限制性实例是阿尔茨海默病、帕金森病、亨廷顿病、脊髓小脑共济失调、肌萎缩性侧索硬化症(ALS)、运动神经元疾病、慢性疼痛和脊髓性肌萎缩。本文公开的设备、系统、试剂盒和方法可用于测试、检测和/或监测受试者中的精神障碍和/或对治疗精神障碍的药物的反应。
本文公开的设备、系统、试剂盒和方法可用于测试、检测和/或监测代谢病况或疾病。代谢病况和疾病包括但不限于肥胖症、甲状腺病症、高血压、1型糖尿病、2型糖尿病、非酒精性脂肪肝炎、冠状动脉疾病和动脉粥样硬化。
本文公开的设备、系统、试剂盒和方法可用于测试、检测和/或监测对食物、液体或药物的变态反应或不耐受。举非限制性实例而言,受试者可能对乳糖、小麦、大豆、乳制品、咖啡因、酒精、坚果、贝类和鸡蛋具有变应性或不耐受。受试者还可能对药物、补品或化妆品具有变应性或不耐受。在一些情况下,方法包括分析预测皮肤类型或皮肤健康的遗传标志物。
在一些情况下,病况与变态反应有关。在一些情况下,受试者未诊断患有疾病或病况,而是正在经历指示存在疾病或病况的症状。在其他情况下,受试者已经被诊断患有疾病或病况,并且本文公开的设备、系统、试剂盒和方法可用于监测疾病或病况,或者药物对疾病或病况的作用。
本文公开了用于分析来自妊娠受试者的母体生物样品中来自胎儿的无细胞核酸的设备、系统、试剂盒和方法。通常,妊娠受试者是人类妊娠受试者。然而,本领域技术人员将理解,本公开内容可以应用于其他哺乳动物,这可能是出于农场或动物园中的繁殖目的。在一些情况下,妊娠受试者是整倍体。在一些情况下,妊娠受试者包含非整倍性。在一些情况下,妊娠受试者具有基因或其部分的拷贝变异。在一些情况下,妊娠受试者具有遗传插入突变。在一些情况下,妊娠受试者具有遗传缺失突变。在一些情况下,妊娠受试者具有遗传错义突变。在一些情况下,妊娠受试者具有单核苷酸多态性。在一些情况下,妊娠受试者具有单核苷酸多态性。在一些情况下,妊娠受试者具有导致融合基因的易位突变。举非限制性实例而言,BCR-ABL基因是可以在许多白血病患者的22号染色体上发现的融合基因。改变的22号染色体称为费城染色体。
在一些情况下,妊娠受试者妊娠约2周至妊娠约42周。在一些情况下,妊娠受试者妊娠约3周至妊娠约42周。在一些情况下,妊娠受试者妊娠约4周至妊娠约42周。在一些情况下,妊娠受试者妊娠约5周至妊娠约42周。在一些情况下,妊娠受试者妊娠约6周至妊娠约42周。在一些情况下,妊娠受试者妊娠约7周至妊娠约42周。在一些情况下,妊娠受试者妊娠约8周至妊娠约42周。
在一些情况下,妊娠受试者处于妊娠期的少于约6周、约7周、约8周、约9周、约10周、约12周、约16周、约20周、约21周、约22周、约24周、约26周或约28周。在一些情况下,妊娠受试者妊娠仅5周。在一些情况下,人类受试者是妊娠期已达至少约5周、至少约6周、至少约7周或至少约8周的妊娠人类女性。在一些情况下,人类受试者是妊娠期已达至少约5至约8周的妊娠人类女性。在一些情况下,人类受试者是妊娠的人类女性,其妊娠期已达至少约5至约8周、至少约5至约12周、至少约5至约16周、至少约5至约20周、至少约6至约21周、至少约6至约22周、至少约6至约24周、至少约6至约26周、至少约6至约28周、至少约6至约9周、至少约6至约12周、至少约6至约16周、至少约6至约20周、至少约6至约21周、至少约6至约22周、至少约6至约24周、至少约6至约26周或至少约6至约28周。在一些情况下,人类受试者是妊娠的人类女性,其妊娠期已达至少约7至约8周、至少约7至约12周、至少约7至约16周、至少约7至约20周、至少约7至约21周、至少约7至约22周、至少约7至约24周、至少约7至约26周、至少约7至约28周、至少约8至约9周、至少约8至约12周、至少约6至约16周、至少约8至约20周、至少约8至约21周、至少约6至约22周、至少约8至约24周、至少约8至约26周或至少约8至约28周。在一些情况下,通过从最后一次月经期的第一天开始测量妊娠期时间来检测妊娠期时间。
在一些情况下,生物样品是从妊娠受试者、疑似妊娠受试者或最近(例如,在过去一天之内)生育的受试者获得的母体体液样品。在一些情况下,受试者是哺乳动物。在一些情况下,受试者是哺乳动物。在一些情况下,哺乳动物是灵长类动物(例如人、大猿、小猿、猴)、犬类(例如狗、狐狸、狼)、猫科动物(例如家猫、大猫)、马(例如马)、牛科动物(例如牛、水牛、野牛)、羊(例如绵羊)、山羊(例如山羊)、猪(例如猪)、犀牛或啮齿动物(例如小鼠、大鼠、兔、豚鼠)。在一些情况下,受试者是处于妊娠的第一、第二或第三个月的妊娠的人类女性。在一些情况下,人类受试者是妊娠的人类女性,其处于小于约6周、约7周、约8周、约9周、约10周、约11周、约12周、约13周、约14周、约15周、约16周、约17周、约18周、约19周、约20周、约21周、约22周、约23周、约24周、约25周、约26周、约27周、约28周、约29周、约30周、约31周、约32周、约33周、约34周、约35周、约36周、约37周、约38周、约39周或约40周的妊娠期。
亲子鉴定
本文公开的方法、设备和系统的一个应用是非侵入性亲子鉴定。出于若干原因,确定儿童的亲子关系是重要的,包括为儿童建立法律和社会(经济)福利(例如社会保障、继承福利、退伍军人福利),以及准确地提供病史以更好地管理儿童的健康。此外,确定其他非人类生物后代的父系贡献者对于阐明某些物种的分子生态学和进化是重要的。
目前的亲子鉴定涉及侵入性过程,诸如羊膜穿刺术或绒毛膜绒毛取样,每一种都会对胎儿造成多种风险。已出现的用于确定亲子关系的非侵入性方法具有显著缺点,即需要来自妊娠受试者的数毫升外周血以及口腔拭子,唾液或来自声称父亲的数毫升外周血。这些缺点通常导致需要静脉切开者并且经常很需要医生,这使得该方法昂贵且耗时。此外,目前确定亲子关系的非侵入性方法缺乏许多妊娠受试者和声称的父亲所需的隐私水平,这在某些情况下阻碍了此类测试的使用。
在一些实施方案中,本文公开的用于分析从儿童或胎儿获得的生物样品以确定儿童或胎儿的亲子关系的方法,系统和设备。在一些实施方案中,所述方法,系统和设备包括从儿童获得生物样品,其中所述生物样品包括儿童的遗传信息(例如DNA)。在一些实施方案中,所述方法,系统和设备包括从妊娠受试者获得生物样品,其中所述生物样品包括胎儿的遗传信息(例如,无细胞胎儿DNA)。在一些实施方案中,从疑是儿童或胎儿的父亲的受试者获得生物样品。
与现有亲子鉴定相比,本文公开的方法,系统和设备使精确亲子鉴定所需的DNA(例如,父本DNA、儿童DNA和/或胎儿无细胞DNA)的量最小化,从而避免需要大的样品体积。在样品是从儿童,妊娠受试者或疑是父亲的受试者获得的血液的情况下,可以通过手指针刺获得足够量的血液。因此,本文公开的方法和系统消除对静脉穿刺的需要,从而在护理点提供亲子鉴定,显著降低测试成本。
本文公开的设备、系统、试剂盒和方法可以获得家庭隐私中的遗传信息,而无需实验室设备并且没有样品交换的风险。可以使用本文公开的设备、系统、试剂盒和方法在几分钟或几秒钟内检测遗传信息。此外,确定儿童或胎儿亲子关系的设备、系统、试剂盒和方法提供以下优点:(1)微创,(2)很少或无需技术培训即可应用于家庭;和(3)一般不需要复杂或昂贵的设备。
本文公开的用于确定胎儿亲子关系的方法,设备、系统和试剂盒,其包括:(a)从妊娠有胎儿的受试者获得生物样品,其中所述生物样品包括胎儿的无细胞核酸;(b)任选地,标记至少一部分所述胎儿的无细胞核酸以产生任选标记的胎儿的无细胞核酸的文库;(c)任选地,扩增所述任选标记的无细胞核酸;(d)测序至少一部分所述任选标记的胎儿的无细胞核酸;和(e)从疑是胎儿的父亲的个体接收父本基因型信息;(f)比较所述父本基因型信息与所述胎儿的无细胞核酸以确定是否匹配。
在一些方面,所述设备、系统、试剂盒和方法包括(a)分析从疑是儿童或胎儿的生物学父亲的受试者获得的生物样品;(b)确定一个或多个父本DNA签名;(c)从为儿童的受试者获得生物样品,其中所述生物样品为DNA;(d)任选地,扩增所述DNA;(e)标记至少一部分所述DNA以产生标记的DNA的文库;(f)任选地,扩增所述标记的DNA;和(g)测序至少一部分所述标记的DNA;和(h)在所述至少一部分标记的DNA中检测所述一个或多个父本DNA签名。
在一些方面,所述设备、系统、试剂盒和方法包括(a)分析从疑是儿童或胎儿的生物学父亲的受试者获得的生物样品;(b)确定一个或多个父本DNA签名;(c)从妊娠受试者获得生物样品,其中所述生物样品包括无细胞胎儿核酸;(d)任选地,扩增所述无细胞核酸;(e)标记至少一部分所述无细胞核酸以产生标记的无细胞核酸的文库;(f)任选地,扩增所述标记的无细胞核酸;和(g)测序至少一部分所述标记的无细胞核酸;和(h)检测所述至少一部分标记的无细胞核酸中的所述一个或多个父本DNA签名。
在一些方面,所述设备、系统、试剂盒和方法包括(a)分析从疑是儿童或胎儿的生物学父亲的受试者获得的生物样品;(b)确定一个或多个父本DNA签名;(c)从妊娠受试者获得生物样品,其中所述生物样品包含多达约109个无细胞胎儿核酸分子;(d)测序至少一部分所述无细胞胎儿核酸以产生测序读段;(e)测定对应于至少一个靶核酸的测序读段;(f)以大于98%的准确度测定所述父本DNA签名存在于所述至少一个靶核酸中。
在一些方面,本文所述的方法包括:(a)分析从疑是儿童或胎儿的生物学父亲的受试者获得的生物样品;(b)确定一个或多个父本DNA签名;(c)从妊娠受试者获得生物样品,其中所述生物样品包含多达约109个无细胞胎儿核酸分子;(d)测序至少2000个所述无细胞胎儿核酸以产生测序读段;(e)测定对应于至少一个靶核酸的至少1000个测序读段;以及(f)以大于98%的准确度测定存在于所述至少一个靶核酸中的父本DNA签名。即使当生物样品的总无细胞核酸分子中无细胞胎儿核酸分子的比例较低,这些测序读取的数目也是足够的。
在一些方面,本文描述了方法,其包括:(a)分析从疑是儿童或胎儿的生物学父亲的受试者获得的生物样品;(b)确定一个或多个父系DNA签名;(c)从妊娠受试者获得生物样品,其中所述生物样品包含多达约109个无细胞胎儿核酸分子;(d)测序至少8000个所述无细胞胎儿核酸以产生测序读段;(e)测定对应于至少一个靶核酸的至少4000个测序读段;以及(f)以大于98%的准确度测定存在于所述至少一个靶核酸中的父本DNA签名。即使当生物样品的总无细胞核酸分子中无细胞胎儿核酸分子的比例较低,这些测序读取的数目也是足够的。在一些情况下,所述方法包括在测序至少8000个标记的无细胞核酸分子之前扩增标记的无细胞DNA片段。
如本文所用,“DNA签名”是指生物样品的核酸组成,其可用于区分生物样品的来源与另一个推定的来源。在一些实施方案中,所述DNA签名包括生物样品来源的基因组中的一个或多个遗传突变或天然变异。在一些实施方案中,遗传突变或天然变异包括单核苷酸变异(SNV)或indel(例如,一个或多个核酸的缺失或插入)。在一些实施方案中,使用计算机实施的方法确定DNA签名,所述方法包括(a)通过进行统计分析计算疑是生物学父亲的受试者是生物学父亲的概率。在一些实施方案中,所述统计分析包括最大似然估计(MLE)或最大后验算法。
非侵入性产前测试(NIPT)
胎儿染色体或遗传畸变风险的评估是许多国家妊娠管理的护理标准。用于在母亲妊娠时确定来自胎儿的遗传信息的传统方法通常是不确定的,在妊娠期早期具有有限的灵敏度,是侵入性的(例如绒毛膜绒毛取样(胎盘组织取样)),并且对母亲和胎儿构成风险(例如羊膜穿刺术)。此外,使用传统产前测试是有限的,因为它们需要具有临床环境中技术培训的医疗提供者。
尽管最近在非侵入性产前测试(NIPT)方面取得了进展,但目前的NIPT方法需要静脉穿刺(例如,静脉切开术)以获得足以实现适当筛选性能的大量(例如,16毫升)母体血液/血浆。使用静脉切开术需要医务人员来进行,这对于许多母亲减少使用并增加当前NIPT测试的成本。
本文公开的使用超低体积的初始生物样品进行NIPT测试的方法,设备、系统和试剂盒。与现有的NIPT相比,本文公开的方法,系统和设备使准确筛选胎儿染色体畸变所需的无细胞胎儿DNA的量最小化,从而避免了对静脉切开术的需要。在样品是血液的情况下,可以通过手指针刺获得足够量的血液。
本文公开的设备、系统、试剂盒和方法可以有利地能够在妊娠的非常早期获得遗传信息。本文公开的设备、系统、试剂盒和方法可以以家庭隐私的形式获得胎儿的遗传信息,而不需要实验室装备并且没有样品调换的风险。利用本文公开的设备、系统、试剂盒和方法,可以在数分钟或数秒内检测遗传信息。
在一些方面,本文公开的方法包括:从妊娠受试者获得生物样品,其中所述生物样品包含多达至少或约10个基因组当量的无细胞胎儿DNA;测序至少一部分所述无细胞胎儿核酸分子以产生测序读段;测定对应于至少一个染色体区域的至少一部分测序读段;以及检测所述至少一个染色体区域的正常表现度、高表现度或低表现度。参见实施例21。在一些情况下,本文所述的方法以至少或约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的准确度进行。参见实施例21。
在一些情况下,高表现度或低表现度是相对于至少一个对照妊娠受试者中染色体或染色体区域的表现度。在一些情况下,至少一个对照妊娠受试者是妊娠整倍体受试者。在一些情况下,至少一个对照妊娠受试者是妊娠非整倍体受试者。在一些情况下,至少一个对照妊娠受试者是没有染色体异常的妊娠受试者。在一些情况下,至少一个对照妊娠受试者是具有至少一个染色体异常的妊娠受试者。在一些情况下,对照妊娠受试者怀有整倍体胎儿。在一些情况下,对照妊娠受试者怀有非整倍体胎儿。在一些情况下,对照妊娠受试者的胎儿没有遗传异常。在一些情况下,对照妊娠受试者的胎儿有至少一种遗传异常。在一些情况下,至少一个对照妊娠受试者包含具有相同存在或缺少染色体异常的多个妊娠受试者。
在一些情况下,本文公开的方法、设备、系统和试剂盒利用另外的对照。在一些情况下,对照是如果胎儿是整倍体则期望的染色体的表现度。在一些情况下,对照是如果胎儿是非整倍体则期望的染色体的表现度。在一些情况下,对照是如果胎儿是整倍体则期望的染色体的数量。在一些情况下,对照是如果胎儿是非整倍体则期望的染色体的数量。在一些情况下,对照是对应于如果胎儿是整倍体则期望的染色体的测序读取的数量。在一些情况下,对照是对应于如果胎儿是非整倍体则期望的染色体的测序读取的数量。在一些情况下,方法包括分析和检测对照样品中的遗传信息。在一些情况下,方法包括分析和检测对照样品中的遗传信息,而是使用从对照参考数据获得的预定对照参考值。当妊娠受试者在家中对她的样品进行分析且无法获得对照样品时,这将特别有用。然而,通常,妊娠受试者也可以容易地获得对照样品(例如,来自亲戚、配偶、朋友)。此外,如本文所述,系统和方法允许通过索引每个样品来同时分析多个样品。
实施例
给出以下实施例是为了说明本文公开的设备、系统和试剂盒的各种实施方案的目的,而不意在以任何方式限制本发明的设备、系统和试剂盒。本实施例以及本文所述的方法是目前代表性的优选实施方案,是示例性的,并且不旨在限制本文中所描述的发明构思的范围。本领域技术人员将想到其变化和其他用途,这些变化和用途包含在由权利要求的范围所定义的本文公开的设备、系统和试剂盒的精神内。
实施例1:在超低(约20μl)量的母体血液中进行三体性检测。
三体性检测依赖于来源于染色体的遗传物质相对于来源于其他染色体的遗传物质的准确表现度。将该比率与整倍体群体中比率的分布进行比较。当((chr21/chr.all)-MEDIAN(chr21))/MAD(chr21)的比率在统计上与该分布充分不同时,判定为三体性。
虽然10%的胎儿分数是9周及以上孕龄的典型群体的中值,但并非所有样品的胎儿分数水平都与10%一样高,有些甚至可能更高。胎儿分数的典型截断值为4%。考虑到典型群体中胎儿分数的分布并且要求特异性(99.9%)和灵敏度(99%)的更常见截断值的模型可以帮助说明该方法的输入要求。通过约500万个标志物计数(序列读取),可以实现这种灵敏度。然而,如果每个染色体分析一个标志物,则将需要30,000个细胞当量,这是不可行的。
本文公开的方法和系统基于以下事实:通过凋亡过程,每个基因组当量基本上被分成2000万个cfDNA片段(每个基因组30亿个碱基对除以cfDNA的150个碱基对的平均大小)。这意味着如果每一个cfDNA分子均可从血液转移到测序仪,则整倍体基因组的四分之一的当量就足以进行分析。
然而,实际上,过程中的每个步骤都会受到不同量的DNA丢失所困扰。因此,在文库生成和测序过程中,要取样并转移大得多的量。虽然DNA丢失发生在过程的每个步骤中,但最大的丢失通常出现在文库制备步骤中。传统方法显示出80%到90%的材料丢失。通常,这样的丢失可以通过后续的扩增步骤(通用PCR)进行补偿,以使DNA浓度达到下一代测序所需的必要水平。虽然扩增是增加可用于测序的总核酸材料的好方法,但在特定条件下,扩增不能补偿在先前步骤中发生的信息丢失。要了解信息的丢失,进行简单的思想实验可能是有帮助的。假设以1000个基因组当量开始,这代表20*109个cfDNA片段。如果假设存在巨大的丢失,并且只有两个片段可用于扩增。一个片段来自参考区域,一个片段来自靶区域。仅两个片段不足以加载测序设备,但是通过扩增(PCR),每个片段可容易地复制数十亿次。现在,扩增后,有足够的材料可用于开始测序过程,但样品中的信息已减少为保留在这两个拷贝中的信息。在这种情况下,信息不足以对整倍体样品和三体样品进行分类,因为两种样品类型将显示出无法区分的50%部分。
典型的下一代测序仪的规格要求在995μl NaOH中稀释5μl的4nM溶液以制成20pM的溶液,其中600μl装入测序仪。因此,总共需要1.2*1010个DNA片段来产生2000万个测序计数。如上所述,2000万个计数足以用于4个样品,因此每个样品必须贡献约3*109个DNA片段(因为每个基因组当量贡献2000万个DNA片段,所以在没有丢失和没有扩增的情况下总共需要150个基因组当量)。这在图6中概述。
典型NIPT方案以大量的cfDNA(6000个基因组当量)开始,这允许在文库制备过程中有大量丢失。然后将物质扩增并高度稀释至适合测序。典型NIPT方案的问题是随后被高度稀释的在文库制备过程中的大量丢失导致源自染色体的遗传材料的表现度不准确。
例如,典型的样品在ml血浆中含有1500个基因组当量的cfDNA。常规抽取的8至10ml血液产生约4ml血浆,产生6000个可用基因组当量的cfDNA。假设DNA提取效率(90%)和文库制备效率(10%)的典型数目,约540个基因组当量进入扩增(通常为8至10个循环,此处实例为1000倍扩增)。扩增后,共有540000个基因组当量或1.08*1013个DNA片段可用于测序。进行超过1000倍的稀释以将扩增的文库调节至所需的4nM。参见表1。
表1.标准8-10ml抽血
Figure BDA0003377807820001761
Figure BDA0003377807820001771
这些数据可能会错误地暗示,由于在过程中产生了大量过量的DNA片段,可以简单地按比例缩小反应以适应小于100μl的血液量。然而,由于上述信息丢失,这是不可能的。参见表2。在考虑到DNA提取(效率90%)和文库制备(效率10%)以及PCR扩增(约10个循环)期间的丢失的情况下,在胎儿分数的下限(4%)下进行的模拟显示,灵敏度在输入DNA材料低于25个拷贝(拐点为10)时是降低的。10个拷贝下的灵敏度降低到89%,并且5个拷贝下的灵敏度降低到81%,在对胎儿分数为4%的样品需要约95%的理论灵敏度的市场中,这两个值都不可接受。参见图7。
表2.将标准方案按比例缩小至20μl抽血
Figure BDA0003377807820001772
相比之下,本公开内容提供了提高文库制备效率、防止文库制备期间的大量丢失并且避免对过度扩增和高稀释的需要的方法、系统和设备。因此,本公开内容通过保持来源于染色体的遗传物质的准确表现度,解决了与典型NIPT方案相关的问题。根据本发明的实施方案(例如,使用群集剂、末端修复)提高文库效率和减少扩增使得保留了更多的遗传信息并且即使拷贝数(基因组当量)低于5,敏感性也高于95%。参见表3和图7。
表3.具有提高的文库效率和低扩增的方案
Figure BDA0003377807820001781
实施例2.使用超低输入量(1-20个基因组当量)的ccfDNA进行低覆盖全基因组合 成测序的可行性。
通过静脉穿刺将男性全血(10ml)收集到Streck无细胞DNA BCT中,并且通过双旋转离心将其处理为血浆,如下所示:
旋转1–1330rpm 20分钟,无制动
旋转2–3300rpm 10分钟
血浆储存在4℃或-80℃直至使用。按照制造商的方案,使用Qiagen循环核酸提取试剂盒的4ml方案,从血浆中提取循环无细胞DNA,在55μl EB中洗脱。使用Quantstudio 6实时仪器上的SRY/RNA酶PTaqman biplex qPCR测定(Life Technologies)来确定每个样品的基因组当量。使用NEBNext Ultra II DNA文库制备试剂盒和用于Illumina的NEBNext多重化寡核苷酸(索引集引物1)(New E ngland Biolabs)制备DNA文库。用于文库制备的模板ccfDNA以1:5的比例从每个文库的96个GE滴定至1个GE。使用减少的体积生成文库以达成较低模板量的化学计量学。所使用的体积取决于模板的输入量。文库制备由以下步骤组成:
1.末端修复、5’磷酸化和A加尾,伴随在20℃下温育30分钟,然后在65℃下温育30分钟。
2.衔接子连接,伴随在20℃下温育15分钟,然后切割连接的衔接子环,伴随在37℃下温育15分钟。将衔接子以1:25的比例稀释至0.6μM的工作浓度。然后使用SPRISelect珠子对切割的、衔接子连接的文库进行基于珠子的纯化。衔接子连接后,将珠子的体积增加到116μl以进一步增强高度片段化的低浓度ccfDNA的结合。
3.文库扩增/索引,首先在98℃变性1分钟,然后在98℃变性10秒持续13个循环,并在65℃退火/延伸75秒,最后在65℃延伸5分钟。然后使用SPRISelect珠子(45μl)纯化扩增的文库。
所有文库均采用具有高灵敏度DNA芯片的Agilent Bioanalyzer 2100(AgilentTechnologies)进行大小分类和表征。在测序之前,使用Qubit v3.0(Life Technologies)确定文库稀释液的浓度。将每个文库归一化至浓度为2nM,并在测序前合并以进行变性和稀释。使用Illumina NextSeq 550以1.5pM的加载浓度进行合成测序。对每个索引/样品进行75个循环的配对末端测序(2x75)。通常,每个样品在每个方向上生成约400万个通过过滤器的读取。使用带有比对参数“-k 1-n 0”的Bowtie将所有测序数据(fasta.gz文件)与人类参考基因组hg38版进行比对。为了进一步分析,将人类基因组划分为连续50,000个碱基对的区域,也称为50kb区块,并且计算每个区块中碱基“G”和“C”的比例,精确到至多小数点后3位。对于每个区块,对从区块中开始的对齐的序列读取进行计数。为了进一步分析,通过滤除不在1至22号染色体(例如,不包含X和Y染色体)上的区块来减少数据。经过此过滤后,在GC含量与每个区块的读取计数之间进行Loess回归,并计算区块计数中值。Loess回归为每个GC含量值提供了预期的区块计数(也称为期望值)。将该期望值除以区块计数中值以得到校正因子。然后将测得的区块计数除以校正因子,得到GC校正的区块计数,并计算GC校正的区块计数的中值。将所有50kb区块除以GC校正的区块计数的中值以产生GC归一化的区块计数,并为每个区块计算中值和中值绝对偏差(MAD)。选择具有低MAD且中值在预期值1附近的区块(滤除MAD>=0.25或中值<0.7或中值>1.3的区块)。
文库的电泳图由递减的ccfDNA输入量产生,并显示总文库产物随输入减少而减少,但衔接子二聚体的量并未显著增加。参见图8A-8C。y轴显示相对荧光单位(强度),x轴显示时间(以秒为单位)。70秒时的主峰是期望的300bp文库产物。从图8A至图8B至图8C,从20GE开始以1:5的比例滴定输入的基因组当量。与具有高得多的模板输入的其他整倍体样品相比,低至1GE的输入产生的文库足以用于具有可接受的测序指标的可行的合成测序。
实施例3.使用低覆盖全基因组合成测序和从毛细血管血液中分离的超低输入量 的ccfDNA(10个基因组当量)进行低比例Y染色体检测(2.5%或更高)。
使用接触激活的刺血针(BD Microtainer)通过指尖毛细管床穿刺来收集女性或男性全血,并将血液收集到SAFE-T_FILL毛细管收集设备(KABE Labortechnik,GMBH)中。通过双旋转离心将毛细血管血液处理为血浆,该离心如下所示:
旋转1–1330rpm 20分钟
旋转2–3300rpm 10分钟
血浆储存在4℃直至使用。男性血浆以2.5%-20%(体积)的不同百分比掺入女性血浆中。然后使用MagMax无细胞DNA分离试剂盒(Life Technologies)采用针对10ul血浆的改良方案从血浆中提取循环的无细胞DNA。分离由以下步骤组成:
1.在60℃下将血浆与蛋白酶K(体积取决于起始输入)温育20分钟。
2.血浆裂解/与DynaBeads MyOne Silane顺磁珠(2.5-5ul)结合,结合在室温下持续10分钟。
3.洗涤珠子/ccfDNA复合物(体积取决于起始输入)。
4.用80%乙醇(体积取决于起始输入)冲洗珠子/ccfDNA复合物。
5.从珠子上洗脱ccfDNA(体积取决于起始输入),伴随在室温下温育2分钟。
基于以前在10μl-4000μl体积范围内的提取和公布的数据,每个样品的基因组当量估计为1GE/μl血浆。将所有洗脱的ccfDNA用作文库生成的输入。使用NEBNext Ultra IIDNA文库制备试剂盒和用于Illumina的NEBNext多重化寡核苷酸(索引集引物1)(New England Biolabs)制备DNA文库。使用减少的体积生成文库以达成较低模板量的化学计量学。所使用的体积取决于模板的输入量。文库制备由以下步骤组成:
1.末端修复、5’磷酸化和A加尾,伴随在20℃下温育30分钟,然后在65℃下温育30分钟。
2.衔接子连接,伴随在20℃下温育15分钟,然后切割连接的衔接子环,伴随在37℃下温育15分钟。将衔接子以1:25的比例稀释至0.6μM的工作浓度。然后使用SPRISelect珠子对切割的、衔接子连接的文库进行基于珠子的纯化。衔接子连接后,将珠子的体积增加到116μl以进一步增强高度片段化的低浓度ccfDNA的结合。
3.文库扩增/索引,首先在98℃变性1分钟,然后98℃变性10秒持续13个循环,并在65℃退火/延伸75秒,最后在65℃延伸5分钟。然后使用SPRISelect珠子(45ul)纯化扩增的文库。
所有文库均采用具有高灵敏度DNA芯片的Agilent Bioanalyzer 2100(AgilentTechnologies)进行大小分类和表征。在测序之前,使用Qubit v3.0(Life Technologies)确定文库稀释液的浓度。将每个文库归一化至浓度为2nM,并在测序前合并以进行变性和稀释。使用Illumina NextSeq 550以1.5pM的加载浓度进行合成测序。对每个索引/样品进行75个循环的配对末端测序(2x75)。通常,每个样品生成约400万个滤过者。使用带有比对参数“-k 1-n 0”的Bowtie将所有测序数据(fasta.gz文件)与人类参考基因组hg38版进行比对。为了进一步分析,将人类基因组划分为连续50,000个碱基对的区域,也称为50kb区块,并且计算每个区块中碱基“G”和“C”的比例,精确到至多小数点后3位。对于每个区块,对从区块中开始的对齐的序列读取进行计算。为了进一步分析,通过滤除不在1至22号染色体(例如,不包含X和Y染色体)上的区块来减少数据。经过此过滤后,在GC含量与每个区块的读取计数之间进行Loess回归,并计算区块计数中值。Loess回归为每个GC含量值提供了预期的区块计数(也称为期望值)。将该期望值除以区块计数中值以得到校正因子。然后将测得的区块计数除以校正因子,得到GC校正的区块计数,并计算GC校正的区块计数的中值。将所有50kb区块除以GC校正的区块计数的中值以产生GC归一化的区块计数,并为每个区块计算中值和中值绝对偏差(MAD)。选择具有低MAD且中值在预期值1附近的区块(滤除MAD>=0.25或中值<0.7或中值>1.3的区块)。特别是对于Y染色体表现度的计算,对来源于Y染色体的区块进行LOESS回归。参见图10和图11。图10示出了使用低覆盖全基因组合成测序,采用从女性和男性DNA的毛细血管血液/血浆混合物中分离的超低输入量cfDNA进行的低比例Y染色体检测(2.5%或更高)。尽管来源于通过手指针刺收集的毛细血管血液的女性/男性血浆混合物中的cfDNA的量超低,我们仍然发现随着来源于血浆的男性毛细血管血液的量增加,Y染色体的表现度也相应增加。图11示出了基于配对末端测序数据,在来自毛细血管血液的cfDNA与来自静脉血的cfDNA之间的cfDNA片段大小分布比较。来源于静脉血和毛细血管血液的超低量的血浆中cfDNA的大小曲线看起来相似。源自染色体Y的序列读取的百分比表现度通过将源自染色体Y的区块的所有GC归一化值相加,并除以所有GC归一化值的总和来计算,不包含源自21号和19号染色体的该归一化值。
实施例4.使用低覆盖全基因组合成测序和超低输入量的ccfDNA(10个基因组当 量)进行低比例Y染色体检测(2.5%或更高)。
通过静脉穿刺将女性或男性全血(10ml)收集到Streck无细胞DNA BCT中,并且通过双旋转离心将其处理为血浆,该离心如下所示:
旋转1–1330rpm 20分钟,无制动
旋转2–3300rpm 10分钟
血浆储存在4℃直至使用。男性血浆以2.5%-20%(体积)的不同百分比掺入女性血浆中。然后使用MagMax无细胞DNA分离试剂盒(Life Technologies)采用针对10μl或20μl血浆的改良方案从血浆中提取循环的无细胞DNA。分离由以下步骤组成:
6.在60℃下将血浆与蛋白酶K(体积取决于起始输入量)温育20分钟。
7.血浆裂解/与DynaBeads MyOne Silane顺磁珠(2.5-5μl)结合,结合在室温下持续10分钟。
8.洗涤珠子/ccfDNA复合物(体积取决于起始输入)。
9.用80%乙醇(体积取决于起始输入)冲洗珠子/ccfDNA复合物。
10.从珠子上洗脱ccfDNA(体积取决于起始输入),伴随在室温下温育2分钟。
基于以前在10ul-4000ul体积范围内的提取和公布的数据,每个样品的基因组当量估计为1GE/ul血浆。将所有洗脱的ccfDNA用作文库生成的输入。使用NEBNext Ultra IIDNA文库制备试剂盒和用于Illumina的NEBNext多重化寡核苷酸(索引集引物1)(New England Biolabs)制备DNA文库。使用减少的体积生成文库以达成较低模板量的化学计量学。所使用的体积取决于模板的输入量。文库制备由以下步骤组成:
4.末端修复、5’磷酸化和A加尾,伴随在20℃下温育30分钟,然后在65℃下温育30分钟。
5.衔接子连接,伴随在20℃下温育15分钟,然后切割连接的衔接子环,伴随在37℃下温育15分钟。将衔接子以1:25的比例稀释至0.6uM的工作浓度。然后使用SPRISelect珠子对切割的、衔接子连接的文库进行基于珠子的纯化。衔接子连接后,将珠子的体积增加到116ul以进一步增强高度片段化的低浓度ccfDNA的结合。
6.文库扩增/索引,首先在98℃变性1分钟,然后98℃变性10秒持续13个循环,并在65℃退火/延伸75秒,最后在65℃延伸5分钟。然后使用SPRISelect珠子(45ul)纯化扩增的文库。
所有文库均采用具有高灵敏度DNA芯片的Agilent Bioanalyzer2100(AgilentTechnologies)进行大小分类和表征。在测序之前,使用Qubit v3.0(Life Technologies)确定文库稀释液的浓度。将每个文库归一化至浓度为2nM,并在测序前合并以进行变性和稀释。使用Illumina NextSeq 550以1.5pM的加载浓度进行合成测序。对每个索引/样品进行75个循环的配对末端测序(2x75)。通常,每个样品生成约400万个滤过者。使用带有比对参数“-k 1-n 0”的Bowtie将所有测序数据(fasta.gz文件)与人类参考基因组hg38版进行比对。为了进一步分析,将人类基因组划分为连续50,000个碱基对的区域,也称为50kb区块,并且计算每个区块中碱基“G”和“C”的比例,精确到至多小数点后3位。对于每个区块,对从区块中开始的对齐的序列读取进行计数。为了进一步分析,通过滤除不在1至22号染色体(例如,不包含X和Y染色体)上的区块来减少数据。经过此过滤后,在GC含量与每个区块的读取计数之间进行Loess回归,并计算区块计数中值。Loess回归为每个GC含量值提供了预期的区块计数(也称为期望值)。将该期望值除以区块计数中值以得到校正因子。然后将测得的区块计数除以校正因子,得到GC校正的区块计数,并计算GC校正的区块计数的中值。将所有50kb区块除以GC校正的区块计数的中值以产生GC归一化的区块计数,并为每个区块计算中值和中值绝对偏差(MAD)。选择具有低MAD且中值在预期值1附近的区块(滤除MAD>=0.25或中值<0.7或中值>1.3的区块)。
特别是对于Y染色体表现度的计算,对来源于Y染色体的区块也进行LOESS回归。源自染色体Y的序列读取的百分比表现度通过将源自染色体Y的区块的所有GC归一化值相加,并除以所有GC归一化值的总和来计算,不包含源自21号和19号染色体的该归一化值。参见图9。图9示出了使用低覆盖全基因组合成测序,采用从静脉血中分离的超低量cfDNA(10个基因组当量)进行的低比例Y染色体检测(2.5%或更高)。将男性血浆以固定的量混合到女性血浆中以产生女性/男性血浆混合物。从血浆混合物中提取cfDNA并进行测序。确定了Y染色体的表现度,显示随着混合到女性血浆中的男性血浆的量增加,仍然可从超低输入量的cfDNA中精确检测到Y染色体表现度的相应增加。
实施例5.使用低覆盖全基因组合成测序和超低输入量的ccfDNA(10个基因组当 量)进行胎儿染色体非整倍性检测
通过静脉穿刺将全血(10ml)收集到Streck无细胞DNA BCT中,并且通过双旋转离心将其处理为血浆。将血浆新鲜处理,储存在4℃或-80℃直至使用。然后使用顺磁珠采用针对1.2ml血浆的改良方案从血浆中提取循环的无细胞DNA。分离包括以下步骤:
1.在室温下将血浆与蛋白酶K、糖原和裂解缓冲液和珠子温育20分钟以进行裂解/结合。
2.珠子/ccfDNA复合物的洗涤。
3.从珠子(42μl)洗脱ccfDNA,伴随在55℃下温育10分钟。
将提取的DNA定量以用于上游应用。将所有样品归一化为每个文库33pg(10GE)的总输入。使用NEBNext Ultra II DNA文库制备试剂盒和用于Illumina的NEBNext多重化寡核苷酸(索引集引物1)(New E ngland Biolabs)制备DNA文库。使用减少的体积生成文库以达成较低模板量的化学计量学。所使用的体积取决于模板的输入量。文库制备由以下步骤组成:
1.末端修复、5’磷酸化和A加尾,伴随在20℃下温育30分钟,然后在65℃下温育30分钟。
2.衔接子连接,伴随在20℃下温育15分钟,然后切割连接的衔接子环,伴随在37℃下温育15分钟。将衔接子以1:25的比例稀释至0.6uM的工作浓度。然后使用SPRISelect珠子对切割的、衔接子连接的文库进行基于珠子的纯化。衔接子连接后,将珠子的体积增加到116ul以进一步增强高度片段化的低浓度ccfDNA的结合。
3.文库扩增/索引,首先在98℃变性1分钟,然后98℃变性10秒持续13个循环,并在65℃退火/延伸75秒,最后在65℃延伸5分钟。然后使用SPRISelect珠子(45ul)纯化扩增的文库。
所有文库均采用具有高灵敏度DNA芯片的Agilent Bioanalyzer 2100(AgilentTechnologies)进行大小分类和表征。在测序之前,使用Qubit v3.0(Life Technologies)确定文库稀释液的浓度。将每个文库归一化至浓度为2nM,并在测序前合并以进行变性和稀释。使用Illumina NextSeq 550以1.5pM的加载浓度进行合成测序。对每个索引/样品进行75个循环的配对末端测序(2x75)。通常,每个样品生成约400万个滤过者。使用带有比对参数“-k 1-n 0”的Bowtie将所有测序数据(fasta.gz文件)与人类参考基因组hg38版进行比对。为了进一步分析,将人类基因组划分为连续50,000个碱基对的区域,也称为50kb区块,并且计算每个区块中碱基“G”和“C”的比例,精确到至多小数点后3位。对于每个区块,对从区块中开始的对齐的序列读取进行计数。为了进一步分析,通过滤除不在1至22号染色体(例如,不包含X和Y染色体)上的区块来减少数据。经过此过滤后,在GC含量与每个区块的读取计数之间进行Loess回归,并计算区块计数中值。Loess回归为每个GC含量值提供了预期的区块计数(也称为期望值)。将该期望值除以区块计数中值以得到校正因子。然后将测得的区块计数除以校正因子,得到GC校正的区块计数,并计算GC校正的区块计数的中值。将所有50kb区块除以GC校正的区块计数的中值以产生GC归一化的区块计数,并为每个区块计算中值和中值绝对偏差(MAD)。选择具有低MAD且中值在预期值1附近的区块(滤除MAD>=0.25或中值<0.7或中值>1.3的区块)。
从减少和归一化的数据中,鉴定源自21号染色体的所有序列区块。源自21号染色体的序列读取的百分比表现度的计算是通过对源自21号染色体的区块的所有GC归一化值求和,并除以除源自21号染色体和19号染色体(以及先前步骤中已经排除的其他染色体,例如,除了1-22号染色体之外的X和Y染色体)的区块的GC归一化值之外的所有GC归一化值之和。然后从一组已知的整倍体样品(参考样品)中计算出21号染色体表现度的中值和MAD。对于每个样品,从样品特有的21号染色体表现度中减去21号染色体的中值表现度,得到导致样品特有的差值。将该样品特有的差值除以21号染色体表现度MAD,从而提供被称为Z评分的值。然后基于它们的Z评分对测试样品进行分类,其中Z评分为3和更高的样品被分类为三体性的,并且Z评分小于3的样品被分类为整倍体。参见图12。所使用的参考样品组总共由36个测序结果组成。从一位男性个体中获得了20个。使用不同量的超低输入量的循环无细胞DNA(cfDNA)生成文库:从1个基因组当量(GE)的cfDNA输入量(约3.5pg cfDNA)生成2个测序文库;从4GE的cfDNA(约14pg cfDNA)生成2个测序文库;从10GE的cfDNA(约35pg cfDNA)生成4个测序文库;在19GE的cfDNA下的2个测序文库;在25GE的cfDNA下的3个测序文库;在50GE的CfDNA下的3个测序文库;在96GE的cfDNA下的1个测序文库;在100GE的cfDNA下的2个测序文库;在2000GE的cfDNA下的1个测序文库。
还对数据进行分析以建立独立于参考样品的方法,用于从来自妊娠女性血液的超低输入循环无细胞DNA确定胎儿三体性的存在。使用带有比对参数“-k 1-n 0”的Bowtie将所有测序数据(fasta.gz文件)与人类参考基因组hg38版进行比对。为了进一步分析,将人类基因组划分为连续50,000个碱基对的区域,也称为50kb区块,并且计算每个区块中碱基“G”和“C”的比例,精确到至多小数点后3位均。对于每个区块,对从区块中开始的对齐的序列读取进行计数。
为了进一步分析,通过滤除不在1至22号染色体(例如,不包含X和Y染色体)上的区块来减少数据。经过此过滤后,在GC含量与每个区块的读取计数之间进行Loess回归,并计算区块计数中值。Loess回归为每个GC含量值提供了预期的区块计数(也称为期望值)。将该期望值除以区块计数中值以得到校正因子。然后将测得的区块计数除以校正因子,得到GC校正的区块计数,并计算GC校正的区块计数的中值。
将所有50kb区块除以GC校正的区块计数的中值,以产生GC归一化的区块计数,并为每个区块计算中值和中值绝对偏差(MAD)。选择具有低MAD且中值在预期值1附近的区块(滤除MAD>=0.25或中值<0.7或中值>1.3的区块)。
为了检测潜在的染色体畸变(例如三体性),对于每个测试样品,选择源自一个染色体的所有区块,并减去校正因子。此分析中使用的具体校正值为:
Chr1 0.018246891、Chr2 0.020434185、Chr3 0.011982353、Chr4 0.001049686、Chr5 0.020581150、Chr6 0.009152075、Chr7 0.005677261、Chr8 0.022754399、Chr90.015059119、Chr10 0.021188753、Chr11 0.017143964、Chr12 0.007069202、Chr130.002157471、Chr14 0.010356892、Chr15 0.019037573、Chr16 0.009929239、Chr170.004990359、Chr18 0.023177486、Chr19-0.063998368、Chr20 0.042335516、Chr210.00498782、Chr22 0.025008553。
然后,对在该滤过组中源自21号染色体的区块的数目(该数据组中为657个)进行计数,然后从所有可用的区块中随机选择相同量的区块(657个),使得它们包含来自各种不同染色体的区块。然后,为该组随机选择的区块计算百分比表现度。将这组随机选择的区块的所有GC归一化值相加,然后除以所有GC归一化值的总和。将最后的步骤重复一万次,并存储每个值。然后通过对源自21号染色体的区块的所有GC归一化值求和,并将该数字除以所有GC归一化值的总和,来计算源自21号染色体的序列读取的百分比表现度。计算出源自21号染色体的区块的百分比表现度比来自随机选择的区块的一万次重复的染色体表现度高多少倍。参见图13。该总和除以10,000是0到1之间的值,在本文中称为“比率(percentile)”。基于样品的比率值对样品进行分类:值为一万(比率为1)的样品分类为三体性;值低于一万(比率为1以下)的样品分类为整倍体。
实施例6.家用式非侵入性产前测试
一位有流产史的妊娠女性怀疑自己再次妊娠,并且妊娠期可能已经约6周。她想尽快知道自己是否真的妊娠以及胎儿是否有任何可能使其处于风险之中的遗传异常。她购买了本文公开的非侵入性产前测试设备,并将其带回家。在最亲密的家人和朋友的情感支持下,她通过将手指按压抵靠设备孔中的微针阵列来启动测试。该设备中的纳米孔测序仪对她的血液样品中的足够量的核酸(少于109个胎儿核酸)进行测序,在小于约一小时的时间内揭示出期望的遗传信息。USB端口或无线技术将序列信息转发到其电话上的应用程序或其计算机上的网站。该应用程序或网站使用软件从测序读取中获得遗传信息,揭示出一组结果供该女性查阅。或者,设备本身具有读取序列并在设备的窗口中产生面板的软件。该面板确认该女性已妊娠,并包括关于该胎儿是否具有已知的染色体畸变(例如,染色体13、16、18、21、22和/或X/Y的三体性)或其他遗传异常的信息。该面板还确认她已妊娠并且预期是一个男孩。
实施例7:利用微体积的母体样品进行非侵入性产前测试。
在考虑到DNA提取(效率90%)和文库制备(效率10%)以及PCR扩增(约10个循环)期间标准方法造成的丢失的情况下,在胎儿分数的下限(4%)下进行了模拟,显示准确度在输入DNA材料低于25个拷贝(拐点为10)时是降低的。10个拷贝数下的准确度降低到89%,并且5个拷贝数下的准确度降低到81%,在需要对胎儿分数为4%的样品具有约95%的理论准确度的市场中,这两个值都不可接受。参见图7浅灰线。
当提高文库效率(到50%,相对于10%)并减少扩增时,即使拷贝数(基因组当量)低于5,也可以保留更多信息,并可以实现95%以上的灵敏度。参见图7,深灰线。
表4.从20μl血浆中获得胎儿遗传信息的工作流程
Figure BDA0003377807820001891
Figure BDA0003377807820001901
实施例8:通过来自妊娠女性的无细胞DNA的全基因组测序对胎儿染色体异常的分 析。
从妊娠女性的生物流体中获得180pg无细胞DNA,该量相当于约100μl血液中的无细胞DNA量。用DNA修复试剂盒纯化无细胞DNA,并将其包含在缓冲溶液中以保持其完整性。
为了准备用于测序的无细胞DNA,用DNA片段末端修复试剂盒修复无细胞DNA片段的末端。接下来,将修复的末端与衔接子连接以产生衔接子连接的DNA。
通过将衔接子连接的DNA与可结合DNA的珠子一起温育来纯化衔接子连接的DNA。使用磁体捕获珠子,在衔接子连接的DNA从珠子中洗脱之前,将带有DNA的珠子用乙醇溶液洗涤几次。
衔接子连接的DNA的循环扩增如下进行:98℃下30秒的初始变性步骤,随后98℃下10秒和65℃下75秒的10个循环,随后65℃下5分钟的最终延伸。任选地,可使用索引引物扩增衔接子连接的DNA,这在同一测序仪上运行多个样品的情况下很有用。这些不同于在文库扩增之前引入的独特条形码/标签。与衔接子连接的DNA相似,扩增的DNA用珠子和磁体系统纯化。使所得的纯化的扩增DNA经历测序。
用高通量测序仪进行测序,该高通量测序仪生成数百万个测序读取,读取长度为30至500个碱基对。该索引允许同时从多个样品获得测序读取。每个测序运行中每个样品获得约400万个读取。
对于每个样品,执行以下步骤:
进行序列比对以检测所有序列读取的基因组来源。
将基因组的子集放入长度为50kb的非重叠区块中。基于参考基因组计算每个区块的GC含量。对位于每个区块区域中的序列读取的数目进行计数。根据y=ax+b(y:期望计数,a:斜率,x:GC含量,b:截距)计算GC含量与区块计数之间关系的线性模型。基于线性模型调整每个区块的计数以减少GC偏差。对于每个区块,计算所有区块的中值计数之间的差值,并从线性拟合中减去预期的计数值。将该差值加到每个相应区块的观察计数值。计算源自感兴趣的染色体的序列读取的百分比。在此实施例中,感兴趣的染色体是21号染色体。
将一组参考样品用于计算源自21号染色体的序列读取的百分比(称为ref.p21)。计算中值(称为ref.med),以及一组ref.p21样品的中值绝对偏差(MAD)(称为ref.mad)。
在至少一个测试样品中测量了相似的值(如上所述的相同方案)。计算源自21号染色体的序列读取的百分比(称为test.p21)。对于每个样品,通过计算源自21号染色体的序列读取的测试样品百分比与参考的中值之间的差值(test.p21-ref.med),并将该差值除以参考组的中值绝对偏差([test.p21-ref.med]/mad.ref)来计算Z评分。结果参见图3。
如果发现Z评分值高于预定的截断值(通常该截断值等于3),则可以将样品解释为具有源自21号染色体的基因组物质的高表现度。该高表现度表明胎儿21号三体性。相反,如果Z评分低于预定的截断值,则可以将样品解释为基因组物质的正常或低表现度。该分析可以适用于其他染色体或染色体区域。
实施例9.通过对母体血浆中的无细胞胎儿核酸进行测序来检测遗传异常。
从妊娠受试者收集血液样品。妊娠受试者可能妊娠仅5周。在一些情况下,她妊娠仅7周。在一些情况下,妊娠受试者通过在家中的设备上对手指进行针刺来自己收集血液。妊娠受试者将她的样品(在设备中或在容器中)送到具有样品处理和测序设备的实验室。或者,该设备执行样品处理(例如,纯化、靶富集)和/或测序,因此,妊娠受试者不需要将她的样品送到实验室。手指针刺获得约100μl血液,其中获得约50μl血浆或血清。50μl血浆含有约1.5 x 10^8个无细胞胎儿核酸,因为采样时无细胞胎儿核酸在血浆样品的总无细胞核酸中的百分比平均为10%。在一些情况下,胎儿分数仅为4%,并且100μl血液样品含有约6 x10^7个无细胞胎儿核酸。因为无细胞胎儿核酸在血浆样品的总无细胞核酸中的百分比可低至1%,所以应该从受试者获得的最小血液体积为约2μl,以确保在妊娠的任何阶段有可靠的信息。
实施例10.通过对母体尿液中的无细胞胎儿核酸进行测序来检测遗传异常。
从妊娠受试者收集尿液样品。妊娠受试者可能妊娠仅5周。在一些情况下,她妊娠仅7周。在一些情况下,妊娠受试者自己在家收集尿液。妊娠受试者将她的样品(在设备中或在容器中)送到具有样品处理和测序设备的实验室。或者,妊娠受试者将尿液样品放入执行样品处理(例如,纯化、靶富集)和/或测序的家用设备中,因此,妊娠受试者不需要将她的样品送到实验室。在一些情况下,尿液样品的体积约为100μl。100μl尿液含有约8 x 10^10个无细胞胎儿核酸,因为采样时无细胞胎儿核酸在尿液样品的总无细胞核酸中的百分比为4%,并且尿液中无细胞核酸的典型浓度为每毫升8 x 10^11个片段。在一些情况下,胎儿分数为4%,并且尿液样品中含有约3.2 x 10^9个无细胞胎儿核酸。因为无细胞胎儿核酸在尿液样品的总无细胞核酸中的百分比可低至1%,所以应该从受试者获得的最小尿液体积为约2μl,以确保在妊娠的任何阶段有可靠的信息。
实施例11.通过在实验室中对来自家中收集样品的母体血浆中的无细胞胎儿核酸 进行计数来检测遗传异常。
从妊娠受试者收集血液样品。妊娠受试者可能妊娠仅5周。在一些情况下,她妊娠仅7周。在一些情况下,妊娠受试者例如通过在家中的设备上对手指进行针刺来自己收集毛细血管血液。在一些情况下,设备将血液分离成血浆。妊娠受试者将其在设备或容器中的血液(或血浆样品)送到实验室,该实验室具有用于样品处理、核酸文库制备和测序的试剂和设备。在一些情况下,文库制备涉及用标记或信号来标记无细胞胎儿核酸,对该标记或信号进行计数或定量。在一些情况下,标记或信号连接至与特定的无细胞胎儿核酸杂交的寡核苷酸。
特定的无细胞胎儿核酸的量通过信号或标记转化为数量,并由妊娠受试者、执行分析的设备或技术人员进行检测。手指针刺获得约100μl血液,其中获得约50μl血浆或血清。50μl血浆含有约1.5 x 10^8个无细胞胎儿核酸,因为采样时无细胞胎儿核酸在血浆样品的总无细胞核酸中的百分比约为10%。在一些情况下,胎儿分数约为4%,并且100μl血液样品中含有约6 x 10^7个无细胞胎儿核酸。因为无细胞胎儿核酸在血浆样品的总无细胞核酸中的百分比可低至1%,所以应该从受试者获得的最小血液体积为约2μl,以确保在妊娠的任何阶段有可靠的信息。
实验室中的分析结果以电子方式发送给妊娠受试者。
实施例12.通过在实验室中对来自家中处理的样品的母体血浆中的无细胞胎儿核 酸进行计数来检测遗传异常。
从妊娠受试者收集血液样品。妊娠受试者可能妊娠仅5周。在一些情况下,她妊娠仅7周。在一些情况下,妊娠受试者通过在家中的设备上对手指进行针刺来自己收集血液。该设备执行样品处理(例如纯化、靶富集)和文库制备。因此,妊娠受试者仅需要将其经处理和准备的样品送至测序设施或能够进行核酸测序的设施。
特定的无细胞胎儿核酸的量通过信号或标记转化为数量,并由妊娠受试者、执行分析的设备或技术人员进行检测。手指针刺获得约100μl血液,其中获得约50μl血浆或血清。50μl血浆含有约1.5 x 10^8个无细胞胎儿核酸,因为采样时无细胞胎儿核酸在血浆样品的总无细胞核酸中的百分比约为10%。在一些情况下,胎儿分数约为4%,并且100μl血液样品中含有约6 x 10^7个无细胞胎儿核酸。因为无细胞胎儿核酸在血浆样品的总无细胞核酸中的百分比可低至1%,所以应该从受试者获得的最小血液体积为约2μl,以确保在妊娠的任何阶段有可靠的信息。
实验室中的分析结果以电子方式发送给妊娠受试者。
实施例13.检测胎儿三体性。
来自每个染色体的读取大致根据染色体的长度来表现。大多数读取源自1号染色体,而来自常染色体的最少读取将源自21号染色体。检测三体样品的常用方法是测量整倍体样品群体中源自染色体的读取百分比。接下来,计算该组染色体百分比值的平均值和标准偏差。截断值是通过在平均值上加三个标准偏差确定的。如果新样品的染色体百分比值高于截断值,则可以认为该染色体的高表现度,这通常与染色体的三体性相符。
对于怀有整倍体胎儿的妊娠受试者,从21号染色体获得的读取百分比的平均值为1.27%,标准偏差为0.01%。因此,表明三体性的截断值为1.30%。该理论实施例示出了三体性样品,其胎儿分数为10%,21号染色体百分比为1.34。该样品在截断值以上,可以准确分类为三体性样品。表5显示了在怀有整倍体胎儿的整倍体受试者样品中所有染色体的示例性染色体百分比的平均值,以及在怀有非整倍体胎儿的整倍体受试者样品中所有染色体的百分比。
表5.染色体的染色体百分比平均值
Figure BDA0003377807820001941
Figure BDA0003377807820001951
*对于性染色体没有类似的截断值,因为该示例性方法仅适用于常染色体。
实施例14:用于分析来自母体血液的胎儿无细胞核酸的设备
用于为了分析无细胞核酸的目的而从全血分离血浆的设备包含6层。从下到上分别是:
(1)下粘合片
(2)下分离盘:粘合片材料(对DNA或血浆呈惰性的聚合物材料)的16mm直径的圆盘,面向下粘合片的一侧带有胶。
(3)各种大小的聚醚砜(PES)膜,通常在6至16mm之间,优选设计特征为10mm PES膜。该膜用作芯吸材料,其通过毛细管力从过滤器吸引血浆。
(4)滤盘(例如,Pall VividTM膜),直径16mm,粗糙面向上,光面朝向PES膜。
(5)上分离盘:与下分离盘的材料相同,大小为12或14mm直径,中间含有4mm孔。当使用粘合片材料时,则使胶面向上以与上粘合片接触。上分离盘的直径小于滤盘的直径。这允许来自上粘合片的胶与滤盘的边缘相互作用,从而在边缘处将其密封。
(6)上粘合片,在设备中心将位于的位置穿刺有6mm的孔。
所有层在其中心对准,然后使用标准的办公室层压机进行层压。
将该设备配置同于执行实施例6中所述的测试。
对该设备进行血液施加和过滤的步骤如下:
通过上粘合片的孔和上分离盘的孔将100μl全血施加于设备的中央。血液通过毛细管力向心分布在整个滤盘上。血浆也通过毛细管力被芯吸穿过滤盘进入PES膜。约两分钟后,最大量的血浆已转移到PES膜中。带有PES膜的设备或其部分被运送到实验室进行DNA测试。
含有无细胞核酸的PES膜如下回收:
从设备上取下PES膜。例如,将设备在PES膜的边缘周围切开。膜很容易地与过滤器和下盘分离。
DNA如下从膜洗脱:
将含有血浆的PES膜转移到Eppendorf管(0.5ml)中,并添加100μl洗脱缓冲液(洗脱缓冲液可以是H2O、EB缓冲液(QGEN)、PBS、TE或其他适合于后续分子分析的缓冲液)。在从膜上洗脱DNA后,对含有洗脱的cfDNA的缓冲液进行遗传分析,该分析涉及核酸扩增、标签、测序或其组合。
实施例15.使用非侵入性超低体积液体活检测试检测基因组改变以监测癌症疾病 进展
通过使用接触激活的刺血针(BD Microtainer)穿刺指尖毛细管床收集全血并将血液收集到SAFE-T_FILL毛细管收集设备(KABE Labortechnik,GMBH)中。通过如下双旋离心将毛细血管血液处理成血浆:
1.以1-1330rpm旋转20分钟
2.以2-3300rpm旋转10分钟
3.血浆在4℃下储存直至使用。
然后使用MagMax无细胞DNA分离试剂盒(Life Technologies),针对10ul血浆使用修改方案从血浆中提取循环无细胞DNA。分离包括以下步骤:
1.血浆与蛋白酶K(体积取决于起始输入量)在60℃下孵育20分钟。
2.血浆裂解/结合于DynaBeads MyOne硅烷顺磁珠(2.5-5ul),在室温下结合10分钟。
3.珠/ccfDNA复合物原位杂交(体积取决于起始输入量)。
4.用80%乙醇冲洗珠/ccfDNA复合物(体积取决于起始输入量)。
5.从珠洗脱ccfDNA(体积取决于起始输入量),在室温下孵育2分钟。
基于先前在10ul-4000ul体积范围内的提取量和公布的数据,每个样品的基因组当量估计为1GE/ul血浆。所有洗脱的ccfDNA都作为文库生成的输入量。使用NEBNext UltraII DNA文库制备试剂盒和用于Illumina的NEBNext多重寡核苷酸(索引组引物1)(NewEngland Biolabs)制备DNA文库。使用减少的体积生成文库以占有较低模板量的化学计量。使用的体积取决于模板的输入量。
文库制备由以下步骤组成:
1.进行末端修复,5-磷酸化和A-加尾,在20℃下孵育30分钟,然后在65℃下孵育30分钟。
2.进行衔接子连接,在20℃下孵育15分钟,然后切割连接的衔接子环,在37℃下孵育15分钟。将衔接子以1:25稀释至0.6uM作用浓度。然后使用SPRISelect珠对切割的连接衔接子的文库进行基于珠的纯化。将珠的体积增加至116ul,以进一步增强衔接子连接后高度片段化的低浓度ccfDNA的结合。
3.文库扩增/索引,其中在98℃下初始变性1分钟,然后进行10秒钟98℃变性的13个循环,以及在65℃下退火/延伸75秒钟,最后在65℃下延伸5分钟。然后用SPRISelect珠(45ul)纯化扩增的文库。
使用具有高灵敏度DNA芯片的安捷伦生物分析仪2100(Agilent Technologies)确定所有文库的大小和特征。在测序之前,使用Qubit v3.0(Life Technologies)测定文库稀释液的浓度。将每个文库都归一化为2nM的浓度,并在测序前合并用于变性和稀释。
边合成边测序是使用Illumina NextSeq 550以1.5pM的装载浓度进行的。对每个索引/样品进行75个循环的配对末端测序(2x75)。一般来说,每个样品生成大约2000万个通过筛选的(passed-filter)。
使用具有比对参数“-k 1-n 0”的Bowtie,将所有测序数据(fasta.gz文件)与人类参考基因组构建体hg38比对。为了进一步分析,人类基因组被划分为连续的50000个碱基对区域,也称为50kb区块(bin),并计算每个区块的碱基“G”和“C”的分数,精度多达3位小数。然后,对于每个区块,我们计算有多少比对的测序读段在区块中开始。为了进一步分析,我们通过过滤掉不在1号至22号染色体的区块来减少数据(例如,排除了X和Y染色体)。在此过滤之后,进行GC含量和每个区块的读段计数之间的Loess回归,并计算中值区块计数。Loess回归提供了每个GC含量值的预期区块计数,也称为预期值。该预期值除以中值区块计数以获得校正因子。然后将测得的区块计数除以校正因子,得到GC校正区块计数,并计算GC校正区块计数的中值。所有50kb的区块除以中值GC校正区块计数以得到GC归一化的区块计数,并且对于每个区块计算中值和中值绝对偏差(MAD)。选择具有低MAD和中值在预期值大约1的区块(过滤掉MAD>=0.25或中值<0.7或中值>1.3的区块)。
图15显示在治疗之前和治疗之后从患有晚期癌症的患者中获得的基于毛细血管血液的循环无细胞DNA测序数据。该样品显示来自14号染色体的p-臂读段的量显著增加(以黑色表示)。部分14号染色体的这种高表现度是由携带额外的14号染色体物质的循环肿瘤DNA进入整个循环无细胞DNA的大量贡献引起的。手术切除癌组织后,接收并分析毛细血管血液样品。14号染色体的相对表现度已经正常化,因为构成额外14号染色体物质的循环肿瘤DNA的来源,即癌组织,已经通过手术被有效地去除(黑色表示的区域现在被正常表达)。
实施例16.使用超低液体活检测试检测病毒基因组
通过食指的经皮穿刺从受试者身上采集毛细血管血液样品。穿刺部位先用水清洗,再用酒精垫清洗。食指穿刺后获得的第一滴血液被丢弃。然后通过“挤压”手指将总共100ul的毛细血管血液收集到含有凝血剂的微管中。然后将毛细血管血液立即离心以产生血浆并使白细胞裂解最小化(以防止背景基因组DNA的进一步增加),并通过移液小心去除血浆。
DNA提取
使用修改的MagMax珠的方案从血浆(45ul)中提取循环无细胞DNA。
文库制备
使用NEB Ultra 2试剂盒(提供方案的详细信息)用索引(详细信息)引物从提取的cfDNA生成测序文库。
测序文库
测序文库在Illumina NextSeq500测序仪上使用配对末端测序(添加有关读段长度和索引的详细信息)进行测序。样品获得了2500万个读段。
1.通过使用接触激活的刺血针(BD Microtainer)穿刺指尖毛细血管床收集全血并将血液收集到SAFE-T_FILL毛细管收集设备(KABE Labortechnik,GMBH)中。通过如下双旋离心将毛细血管血液处理为血浆:
2.以1-1330rpm旋转20分钟
3.以2-3300rpm旋转10分钟
4.血浆在4℃下储存直到使用。
5.然后,使用MagMax无细胞DNA分离试剂盒(Life Technologies),针对10ul血浆使用修改方案从血浆中提取循环无细胞DNA。分离包括以下步骤:
a.血浆与蛋白酶K(体积取决于起始输入量)在60℃下孵育20分钟。
b.血浆裂解/结合于DynaBeads MyOne硅烷顺磁珠(2.5-5ul),在室温结合10分钟。
c.珠/ccfDNA复合物原位杂交(体积取决于起始输入量)。
d.用80%乙醇冲洗珠/ccfDNA复合物(体积取决于起始输入量)。
e.从珠洗脱ccfDNA(体积取决于起始输入量),在室温下孵育2分钟。
6.根据先前在10ul-4000ul体积范围内的提取量和公布的数据,每个样品的基因组当量估计为1GE/ul血浆。所有洗脱的ccfDNA都作为文库生成的输入量。使用NEBNextUltra II DNA文库制备试剂盒和用于Illumina的NEBNext多重寡核苷酸(索引组引物1)(New England Biolabs)制备DNA文库。使用减少的体积生成文库以占有较低模板量的化学计量。使用的体积取决于模板的输入量。
7.文库制备由以下步骤组成:
a.进行末端修复、5-磷酸化和A-加尾,在20℃下孵育30分钟,然后在65℃下孵育30分钟。
b.进行衔接子连接,在20℃下孵育15分钟,然后切割连接的衔接子环,在37℃孵育15分钟。将衔接子以1:25稀释至0.6uM作用浓度。然后使用SPRISelect珠对切割的连接衔接子的文库进行基于珠的纯化。将珠的体积增加到116ul,以进一步增强衔接子连接后高度片段化的低浓度ccfDNA的结合。
c.文库扩增/索引,其中在98℃下初始变性1分钟,然后进行10秒钟98℃变性的13个循环,以及在65℃下退火/延伸75秒钟,最后在65℃下延伸5分钟。然后使用SPRISelect珠(45ul)纯化扩增的文库。
使用具有高灵敏度的DNA芯片的安捷伦生物分析仪2100(Agilent Technologies)确定所有文库的大小和特征。在测序之前,使用Qubit v3.0(Life Technologies)进行文库稀释来确定浓度。每个文库都归一化为2nM的浓度,并在测序前合并用于变性和稀释。
边合成边测序是使用Illumina NextSeq 550以1.5pM的装载浓度进行的。对每个索引/样品进行75个循环的配对末端测序(2x75)。一般来说,每个样品生成大约2000万个通过筛选的。
数据处理:用默认参数通过bcl2fastq v2.17.1.14对测序数据解复用。对读段进行质量微调,并用Trimmomatic v0.32过滤短于20碱基的读段。使用Bowtie v2.2.4将通过筛选的读段与人类参考比对并搁置。过滤掉可能源自重复区域诸如人微卫星DNA的读段。剩余读段用BLAST v2.2.30与微生物参考数据库比对。保留与任何参考数据库序列显示高同一性的读段。基于比对数据去除与线粒体DNA和PCR重复比对的读段。
微生物和分类群丰度的相对量的确定基于比对结果(测序读段量和比对分数以补偿参考序列数据和测序读段之间由遗传漂移引起的潜在错配)。从国家生物技术信息中心ftp站点检索用于比对智人和微生物的参考基因组。
预期结果
从来自患有血流感染(BSI)的住院患者的毛细血管血液中提取循环无细胞DNA。cfDNA测序数据确定了高相对丰度的肺炎克雷伯氏菌(K.pneumoniae)。连续采集超过10天的毛细血管血液样品可以监测患者使用抗生素头孢他啶的治疗成功情况。治疗开始后第3天,肺炎克雷伯氏菌的相对丰度随着治疗时间的增加而显著减少。图16提供该实验的示例性结果。
实施例17.用于离子半导体测序技术的现有未优化方案未能充分表示母体样品中 总DNA以及胎儿的无细胞DNA部分
比较了用于检测母体样品中无细胞DNA的标准方案(例如文库制备和测序方法)和如本文所述的优化方案。在三体性检测的情况下分析来自两种方案的测序数据,以便评估标准文库制备方案是否将提供与本公开的优化方案等效的准确度。
在此研究中,分析了8个cfDNA样品,包括从携带整倍体胎儿的妇女获得的4个样品和从携带21三体性胎儿的妇女获得的4个样品。使用两组实验条件处理这8个样品。在第一组中,使用优化的文库制备试剂盒(NEB next ultra II文库试剂盒),对于低输入cfDNA量具有优化的体积和比例以产生测序文库,并使用基于荧光的下一代测序仪进行测序。在第二组中,使用未优化的文库制备试剂盒(NEB Next DNA library prep set forIonTorrent试剂盒)产生测序文库,并使用离子半导体测序仪进行测序。在这两种条件下,使用10个基因组当量(GE)的cfDNA作为文库制备过程的输入量。
方法
使用顺磁珠从血浆中分离循环无细胞DNA以捕获cfDNA。简而言之,通过离心从全血中分离血浆,并且血浆在蛋白酶K,盐酸胍,珠和糖原的溶液中裂解/结合于珠。然后用TritonX-100,盐酸胍和氯化钠分三步洗涤珠。用包含叠氮化钠的水进行cfDNA的洗脱。然后定量所有样品以确定用于下游测试的cfDNA的产量。
在测序文库生成之前,将所有样品归一化为10GE的cfDNA作为文库反应中的输入量。
方法1:标准方案
使用用于离子激流的NEBNext Fast DNA文库制备组修改标准方案来生成用于离子半导体测序仪的文库。文库生成由以下组成:末端修复,IonTorrent-特异性衔接子连接,用AmpureXP珠进行反应清除,用IonTorrent-特异性引物进行文库扩增,用AmpureXP珠纯化扩增的文库和最后洗脱扩增的文库。所有文库的衔接子以1:10稀释,扩增以15个循环进行,所有文库在25ul分子级水中洗脱。文库生成后,使用安捷伦生物分析仪2100高灵敏度DNA芯片测定所有样品的大小并定量。然后使用ThermoFisher Qubit 3.0重复定量。进一步对文库进行大小选择以从测序过程中消除衔接子-二聚体产物。如上证实大小选择的文库的纯度和浓度。
使用具有Ion540试剂盒和Ion540芯片的Ionchef进行离子激流S5测序模板和芯片。通常运行生成大约1亿读段,数据中所生成的每个样品至少有2000万读段。
方法2:低输入量优化
使用NEBNext Ultra II DNA文库制备试剂盒与用于Illumina的NEBNext多重寡核苷酸(索引组引物1)(New England Biolabs)制备DNA文库。使用减少的体积产生文库以占有较低模板量的化学计量。所用的体积取决于模板的输入量。文库制备由以下组成:
1.进行末端修复,5-磷酸化和A-加尾,在20℃下孵育30分钟,然后在65℃下孵育30分钟。
2.进行衔接子连接,在20℃下孵育15分钟,然后切割连接的衔接子环,在37℃下孵育15分钟。将衔接子以1:25稀释至0.6uM作用浓度。然后使用SPRISelect珠对切割的衔接子连接的文库进行基于珠的纯化。将珠的体积增加至116ul,以进一步增强衔接子连接后高度片段化的低浓度ccfDNA的结合。
3.文库扩增/索引,其中在98℃下初始变性1分钟,然后进行10秒钟98℃变性的13个循环,和在65℃退火/延伸75秒钟,最后在65℃下延伸5分钟。然后用SPRISelect珠(45ul)纯化扩增的文库。
使用具有高灵敏度DNA芯片的安捷伦生物分析仪2100(Agilent Technologies)确定所有文库的大小和特征。测序前使用Qubitv3.0(Life Technologies)测定文库稀释液的浓度。将每个文库归一化至2nM的浓度,并在测序前合并用于变性和稀释。使用Illuminanextseq 550以1.5pM的加载浓度进行边合成边测序。对每个索引/样品进行75个循环配对末端测序(2x75)。通常每个样品生成大约400万个通过筛选的。
基于输入材料的量(归一化为10个基因组当量的循环无细胞DNA),可用于分析的cfDNA片段的理论下限为约10M(或0.5GE)。为了使10M的cfDNA片段可用于测序,需要从血液中取样更多的数量,因为在样品制备期间的大多数处理步骤将伴随一些样品损失。一般认为,文库制备效率是最受影响/最低效的处理步骤之一。控制有多少cfDNA片段参与反应并最终被测序是重要的。简而言之,1GE由约20M的cfDNA片段(3B碱基对;150bp片段长度)来表达。当从血液抽取的衔接子连接的效率仅为1%时,则PCR之前的起始材料仅为200000个cfDNA片段。在PCR步骤期间,这200000个片段可以被扩增到足以用于下一代测序的程度。当这200000个cfDNA片段被测序2M次时,大多数cfDNA片段被测序多次。相反,以100%效率处理的相同样品提供用于测序的20M潜在cfDNA片段,并且在相同的2M测序读段下,仅有一个小的子集将被测序多于一次。
在三体性检测的情况下分析测序数据,以便评价先前在离子半导体测序仪上使用的标准文库制备方案是否能够提供用于超低输入量优化的方法等同的准确度。
中值和中值方差
研究了两个数据集的中值区块计数和每个区块的中值绝对偏差(MAD)之间的关系。中值与MAD呈正相关。此外,存在具有较高MAD的区块的子集。这种结果存在于原始和GC校正的数据中,表明较高的MAD不是由处理过程中引入的GC偏差引起的,而是代表真实的生物学变化。比较两种文库制备/测序的方法证实了先前的观察结果(图14A,14B)。两个不同数据集之间的中值归一化GC校正区块计数相似(p值=0.31,t检验)。区块特异性MAD在标准方案数据集中较低(p值<2.2e-16,t检验),可能表明标准方案数据的CNV分类性能更好。较低的区块特异性中值可能是标准方案数据集中可获得的显著较高的测序计数的结果。
图14A-14B显示标准与优化的方案数据集的中值区块计数和每个区块的中值绝对偏差(MAD)之间的关系。两个不同数据集之间的中值归一化GC校正区块计数相似(p值=0.31,t检验)。区块特异性MAD在标准方案数据集中较低(p值<2.2e-16,t检验),可能表明标准方案数据的CNV分类性能更好。较低的区块特异性中值可能是标准方案数据集中可获得的显著较高的测序计数的结果。
重复
重复测序读段的分析用于估计在文库制备后可用于测序的基因组当量(以及因此cfDNA片段)的数量。计算很复杂并将在下文中概述。理论上,重复读段的数量取决于:a)有多少cfDNA片段参与了反应,和b)生成了多少测序读段。
为了计算预期值,确定泊松分布的预期λ值,其为测序读段/cfDNA片段。预期的重复率不仅仅是观察到两个或更多的概率。因为我们没有0计数的度量,我们需要排除这些。因此,我们的预期重复率是观察到2个或更多个计数的概率超过观察到1个或更多个计数的概率[(1-P(0)-P(1))/(1-P(0))]。然后,我们可以使用该期望值矩阵作为查找表,通过将测序读段的数目与复制速率匹配来鉴定输入的基因组当量。
poom<-1-dpois(0,seq.count.vec/cpy.tmp)#P(>=1)probability one or more
peo<-dpois(1,seq.count.vec/cpy.tmp)#P(1)probability exactly one
ptom<-poom-peo#P(>=2)probability two or more
mat.dup.rate[i,]<-ptom/poom#/#(peo+ptom)#bit unclean could also beptom/poom
图14C显示与本公开的优化方案相比,使用文库制备和测序的标准方案产生更少用于测序的基因组当量(Life的中值=1.355,ILMN的中值=6.065)。
每个样品的文库制备使用10GE的起始量。图14C显示与本公开的优化方案相比,使用文库制备和测序的标准方案产生更少用于测序的基因组当量(Life的中值=1.355,ILMN的中值=6.065)。
可获得的cfDNA片段的数量是分类准确性的决定因素,并且该数据显示使用标准方案的标准处理导致可获得的cfDNA片段的显著减少。
图14D以黄色显示优化方案的数据点,以蓝色显示标准方案的点。
染色体表现度百分比和Z评分
对于两种方案,计算来源于21号染色体的片段相对于所有合格常染色体(排除21号和19号染色体)的表现度的百分比表示。还计算了chrY和chrX的百分比。性染色体的百分比表现度可用于确定胎儿的性别。对于男性样品,性染色体表现度的百分比也可用于估计源自胎儿的cfDNA的分数(胎儿分数)。对于21号染色体,我们根据成熟的方法计算Z评分。计算整倍体组的参考样品的中值和MAD。然后,计算每个样品的中值与参比中值的差值。最后,将差值除以参考MAD以得到Z评分。分数大于3表示存在21三体性。
图14E显示来自标准方案文库制备和测序的数据是有噪声的,并且无法容易地描绘携带男性与女性胎儿的样品。
然而,来自本公开的优化的且更有效的文库制备和测序方案用于chrY表现度的数据是清楚的,并且显示该组包括三(3)个男性样品和五(5)个女性样品。此外,在用于chrY测量的两个数据集之间没有良好的一致性。因此,使用chrX表现度估计男性样品中的胎儿分数用于剩余的分析。
标准文库制备和测序方案与优化文库制备和测序方案的数据之间的性能比较
对异常值区块校正后,Z评分分析显示优化的文库制备和ILMN测序数据按预期进行。图14F显示标准方案数据示出的良好特异性(0假阳性,100%特异性),但差的灵敏度(2假阴性,50%灵敏度)。两个数据集包含完全相同的样品,并给出完全相同量的输入材料。每个样品的标准方案数据具有显著更多的测序读段。然而,如上所述,测序读段的数量不一定与原始样品中无细胞DNA准确的表现度相关。然后,检查了可用的cfDNA片段、胎儿分数和Z评分之间的关系。
为了研究胎儿分数,拷贝数和Z评分之间的关系,计算了chr21和chrY的百分比表现度。这些百分比用于估计样品中胎儿遗传物质的分数(本文称为胎儿分数)。女性样品不会具有升高的chrY表现度。对于那些显示chr21高表现度的女性样品,根据chr21高表现度计算胎儿分数。如果优化方案数据集中样品的chrY表现度小于8.2*10-4,则样品被识别为女性。
图14G显示指示具有胎儿三体性(红色)和整倍体胎儿(黑色)的样品的图。
将染色体表现度百分比测量值转换为胎儿分数估计值后,chrY,chrX和chr21的值在相同的标度上。所有男性样品具有可用的胎儿分数估计值。此外,所有21三体性均有可用的估计。如前所述,优化方案数据清楚地描绘了男性/女性和整倍体/三体性样品之间的数据。标准方案数据是有噪声的并且不可以清晰的分离。然后我们构建了胎儿分数测量,其对所有男性样品使用chrX测量并对所有具有21三体性的女性样品使用chr21测量。女性整倍体样品的胎儿分数不可用。
图14G显示使用标准方案(左)与优化方案(右)相比,所有样品的组合的胎儿分数测量值与由chr21引入观察的结果很好地相关。
Z评分、拷贝数和胎儿分数
绘制拷贝数,胎儿分数和Z评分之间的关系。整倍体样品分布在拷贝数/胎儿分数平面上,但它们的z评分与这些参数不相关。这种表现是预期的,但使可视化复杂化。方案数据在拷贝数方面不同于标准方案数据。
图14H显示对于两种方案,正确分类的样品(真阳性,TP)区别于不正确分类的样品(假阴性,FN)。还显示了与标准方案相比,由优化方案产生的更多的拷贝数。
使用计算机模拟,其将文库制备过程的所有阶段的取样误差考虑在内,我们可以构建模型以预测可用cfDNA片段和胎儿分数的每种组合的性能。在估计的PCR效率为90%,文库效率为5%和36M的测序读段下,产生的曲线指示50%灵敏度完美地将真阳性样品区别于假阴性样品(图14I)。
结论
本文所公开的是证明当使用相同的低输入量时,与优化方案相比,未优化的低输入量标准文库制备和测序方法确实导致无细胞DNA的拷贝数降低。降低的拷贝数表现度是染色体表现度中较高噪声的结果,并因此在检测畸变方面性能较低。
实施例18.确定基线片段长度分布
在血液收集和DNA提取过程中存在可导致较低胎儿分数的人为因素。这些人为因素包括机械应力,污染,最显著的是白细胞(WBC)降解。例如,通过针刺手指取样的血液在收集到容器中之前与皮肤表面接触。在这种接触过程中,来自例如脱落的皮肤细胞的额外DNA可能被收集并加入到总的母体DNA池中。此外,在静脉血抽取和针刺手指之间的皮肤穿刺的方法也非常不同。静脉血抽取中的针被设计为通过皮肤切片并定位在静脉内。在皮肤穿刺过程中受损的细胞不太可能对母体背景有显著贡献,因为针的开口尖端远离皮肤穿刺定位。在针刺手指期间,取样的血液冲出直接通过穿刺的皮肤以在表面上收集。在该通过过程中,它可以从穿刺皮肤时已损伤的细胞收集DNA。虽然这些DNA污染可能小,但当收集少量血液时它们变得有影响。例如,假定相同的10%胎儿分数和1000GE的cfDNA/ml血浆,我们预期在20ul毛细血管血液抽取中总共有10GE的cfDNA(9个母体和1个胎儿)。在一个实施例中,我们假定10个细胞是损伤的并有助于血液收集。在20ul的毛细血管血液抽取中,胎儿分数将从10%下降至5%。
未经历细胞凋亡的DNA,诸如机械细胞损伤后释放的核小体DNA或脱落皮肤表面细胞的DNA显示不同的片段长度分布。通过分析来自静脉血抽取的cfDNA片段的大小长度分布图并将它们与来自其它来源的cfDNA片段长度分布图进行比较,我们可以描述非cfDNA的影响。在NIPT的情况下,该非cfDNA可被认为是母体背景污染,其导致胎儿分数降低。
静脉血
已经从静脉血中提取的cfDNA的长度分布图已经在本领域中描述,并且本领域技术人员理解为约166-168bp的倍数。这可通过凋亡过程来解释,其中核小体DNA包裹在核小体周围并在这些核小体之间切割。得到的图案是从血浆中分离的cfDNA的特征性大小分布(图17A)。不经历凋亡的基因组DNA不显示特征性的大小分布,而是显示偏向于较小片段长度的大小分布。
毛细血管血液
进行标准的毛细管血液抽取,包括用一次性使用的刺血针针刺手指以穿透手指外侧远端的皮肤,并在EDTA收集管中的切口部位收集血液。在收集的20分钟内分离血浆,并进行标准cfDNA提取。提取的DNA的测序揭示了与来自静脉血的cfDNA相比不同的片段长度分布(图17A)。为了使片段长度分布在不同样品之间可比较,将每个长度的计数除以分布众数。图17B显示了毛细血管血液的分布图,其特征在于小于168bp的峰的片段和大于168bp的片段的高表现度。
为了确定收集过程(例如,通过添加DNA的污染或机械应力)是否引起短片段长度的高表现度,分析从皮肤提取的DNA。
来自皮肤表面的DNA
为了测量来自皮肤表面的DNA,我们将水施加到指尖的表面并随后将其收集。在施加水的过程中,位于表面上的DNA溶解在水中。收集水后,提取DNA并测序。尺寸分布显示在小片段长度处的最高表现度,随着片段长度增加稳定下降(图18A)。这种片段化大小模式代表未被保护以免受核小体消化的DNA,诸如来自脱落皮肤细胞的核小体DNA。
来自细胞损伤的DNA
为了对包含无细胞DNA和损伤的DNA(作为小于168bp峰的片段和大于168bp的片段的可能来源)的样品建模,我们对第5位的远端诱导局部血氧不足以引入细胞损伤。通过检查常规毛细血管抽血和诱导细胞损伤的毛细血管抽血之间的片段长度差异之间的差异来估计来自损伤的细胞的DNA组分。将每个片段长度区块的比较分析归一化为该区块在静脉血中的表现度。损伤的细胞的片段长度分布显示高表现度在来自静脉血的片段长度分布的局部最小值处最大化。(图18C和18D)。
不受特定理论的束缚,与静脉血相比,毛细血管血液中片段长度的高表现度与假定常规cfDNA和非凋亡基因组DNA的混合物一致。非凋亡基因组DNA的来源可能是由于用刺血针针刺皮肤而引起的细胞损伤。
实施例20.用于减少污染的示例性方法
为了研究不同收集方法对非凋亡基因组DNA的贡献的影响,我们比较了标准的针刺手指血液收集方案和我们已经优化的方案。标准方案包括用乙醇彻底清洁指尖,用一次性使用的刺血针穿刺皮肤并将血液收集到EDTA容器中(下文称为“未擦除”条件)。在优化方案中,在收集血液之前进行另外的步骤。在用一次性使用的刺血针穿刺皮肤后,用纱布垫擦去第一滴血液(下文称为“擦除”条件)。只有此第一滴之后的血液被收集在EDTA容器中。
方法
将收集的血液处理成血浆并在收集的2小时内提取DNA。使用实时PCR评估DNA数量。在ILMN Next-seq上通过配对末端测序建立片段长度分布。使用标准方法收集静脉血作为参考。
DNA数量
在未擦除的条件下收集的样品的DNA数量比擦除的收集方案高大约50%。更高的DNA产量通常被认为有利于NIPT分析。然而,片段长度分布的分析揭示了在未擦除的条件下指示细胞损伤的片段长度的更强高表现度(图19)。
不受任何特定理论的束缚,擦去第一滴血液减少来自细胞损伤的DNA的贡献。替代地或另外地,对源于损伤和污染的DNA问题的解决方案包括:(1)针对较长DNA片段选择的捕获方法,(2)电泳方法,(3)根据大小选择文库产物,和(4)基于大小信息解释/去除或差异性分析的生物信息学方法。
实施例21.用循环cfDNA的超低输入量(10个基因组当量)使用低覆盖率全基因组 边合成边测序检测胎儿染色体非整倍性
使用接触激活的刺血针(BD Microtainer)通过指尖毛细管床穿刺收集全血并将血液收集到SAFE-T_FILL毛细管收集设备(KABE Labortechnik,GMBH)中。如下通过双旋离心将毛细血管血液处理成血浆:
1.以1-1330rpm旋转20分钟
2.以2-3300rpm旋转10分钟
处理新鲜血浆,在4℃或-80℃下储存直至使用。
然后使用顺磁珠方案从10ul血浆中提取循环无细胞DNA。分离由以下步骤组成:
1.将血浆与裂解缓冲液和珠在室温下孵育10分钟,同时搅动以进行裂解/结合。
2.用洗涤溶液1洗涤珠/ccfDNA复合物。
3.用洗涤溶液2洗涤珠/ccfDNA复合物。
4.从珠(20μl)洗脱ccfDNA,在室温下孵育5分钟。
提取的DNA用作文库生成的输入。使用NEBNext Ultra II DNA文库制备试剂盒与用于Illumina的NEBNext多重寡核苷酸(索引组引物1)(新英格兰生物实验室)制备DNA文库。文库制备由以下步骤组成:
1.末端修复,5-磷酸化和A-加尾,在20℃下孵育30分钟,然后在65℃下孵育30分钟。
2.衔接子连接,在20℃下孵育15分钟,然后裂解连接的衔接子环,在37℃下孵育15分钟。将衔接子以1:25稀释至0.6uM作用浓度。然后使用SPRISelect珠对切割的衔接子连接的文库进行基于珠的纯化。将珠的体积增加至116ul,以进一步增强衔接子连接后高度片段化的低浓度ccfDNA的结合。
3.文库扩增/索引,在98℃下初始变性1分钟,然后进行10秒98℃变性的15个循环,以及在65℃下退火/延伸75秒钟,最后在65℃下延伸5分钟。然后用SPRISelect珠(45ul)纯化扩增的文库。
使用具有高灵敏度DNA芯片的安捷伦生物分析仪2100(Agilent Technologies)确定所有文库的大小和特征。测序前使用Qubitv3.0(Life Technologies)测定文库稀释液的浓度。将每个文库归一化至2nM的浓度,并在测序前合并用于变性和稀释。使用Illuminanextseq 550以1.5pM的装载浓度进行边合成边测序。对每个索引/样品进行75个循环配对末端测序(2x75)。该样品组的中值测序计数为6.4M通过筛选的成对测序读段。使用具有比对参数“-k 1-n 0”的Bowtie将所有测序数据(fasta.gz文件)与人参考基因组构建体hg38比对。为了进一步分析,将人基因组分成连续50000个碱基对区域,也称为50kb区块,并且对于每个区块计算碱基“G”和“C”的分数,精确度多达3位小数。对于每个区块,计数在区块中开始的比对测序读段。为了进一步分析,通过过滤掉不在1至22号染色体上的区块来减少数据(例如,排除X和Y染色体)。在此过滤之后,进行GC含量和每个区块读数计数之间的Loess回归,并计算中值区块计数。Loess回归为每个GC含量值提供了预期的区块计数,也称为预期值。将该预期值除以中值区块计数以得到校正因子。然后将测量的区块计数除以校正因子,得到GC校正的区块计数,并计算GC校正的区块计数的中值。将所有50kb区块除以中值GC校正的区块计数以产生GC归一化的区块计数,并且对于每个区块计算中值和中值绝对偏差(MAD)。选择具有低MAD和大约1的预期值的中值的区块(过滤掉所有MAD区块值中具有MAD>=第95个百分位的区块;过滤掉所有中值的区块值中具有<=第5个百分位或>=第95个百分位的中值的区块)。
从简化和归一化的数据中,鉴定了所有源自21号染色体的序列区块。源自21号染色体的测序读段的百分比表现度是通过将源自21号染色体的区块的所有GC归一化值相加并将总和除以所有GC归一化值的总和来计算的,排除源自21号染色体和19号染色体的区块的GC归一化值(以及在早期步骤中已经排除的其他染色体,例如X和Y,除1-22号之外的染色体)。然后从已知的整倍体样品(参考样品)组计算出21号染色体表现度的中值和MAD。对于每个样品,从样品特定的21号染色体表现度中减去中值21号染色体表现度(从参考组获得),得到样品特异性差值。该样品特异性差值除以21号染色体表现度MAD(从参考组获得),提供称为Z评分的值。然后根据它们的Z评分分类测试样品,其中Z评分为3.5及更高的样品被归类为三体性,而Z评分小于3.5的样品被归类为整倍体。参见图20。16个样品是从假定为整倍体妊娠的个体获得的,8个样品是从确认怀有21三体性胎儿的妇女获得的。所有16个假定为整倍体的样品均被归类为整倍体,所有8个已确认为21三体性的样品均被归类为21三体性。这导致该数据集的灵敏度为100%,特异性为100%。
虽然本文已经示出并描述了本文公开的本发明方法、设备、系统和试剂盒的优选实施方案,但对于本领域技术人员将会显而易见的是,这些实施方案仅以示例的方式提供。本领域技术人员在不脱离本文公开的方法、设备、系统和试剂盒的情况下现将想到多种变化、改变和替换。应当理解,本文所述的方法、设备、系统和试剂盒的实施方案的各种替代方案可以用于实践使用本文公开的设备、系统和试剂盒的方法。旨在涵盖这些权利要求范围内的方法和结构及其等同项。

Claims (50)

1.一种方法,包括:
a)从受试者获得生物样品,其中所述生物样品包括无细胞脱氧核糖核酸(cfDNA),并且其中所述生物样品当从所述受试者获得时具有至多120微升的体积;
b)通过以下步骤标记至少一部分所述cfDNA以产生标记的cfDNA:
a.通过一个或多个步骤生成可连接的cfDNA,包括:
i.生成所述cfDNA的平端,其中使用一种或多种聚合酶和一种或多种核酸外切酶去除5’突出端或3’凹陷端;
ii.使所述cfDNA的平端去磷酸化;
iii.使所述cfDNA与群集剂接触,从而增强一种或多种聚合酶、一种或多种核酸外切酶与所述cfDNA之间的反应;或
iv.使用连接酶修复或去除所述cfDNA中的DNA损伤;和
b.在所述连接酶和一种或多种群集剂和小分子增强剂存在下,通过将所述可连接的cfDNA与衔接子寡核苷酸接触,将所述可连接的cfDNA与所述衔接子寡核苷酸连接;和
c)任选地,扩增所述标记的cfDNA;和
d)测序至少一部分所述标记的cfDNA的。
2.根据权利要求1所述的方法,其中当从所述受试者获得所述体积时,所述体积至多为100微升。
3.根据权利要求2所述的方法,其中当从所述受试者获得所述体积时,所述体积至多为40微升。
4.根据权利要求1的方法,其中从所述受试者获得的所述生物样品是毛细血管血液。
5.根据权利要求4所述的方法,其中当从所述受试者获得所述体积时,所述体积至多为40微升。
6.根据权利要求4所述的方法,其中通过以下方法从所述受试者获得所述生物样品:
a)诱导第一次经皮穿刺以产生第一部分生物样品;
b)丢弃所述第一部分生物样品;和
c)收集第二部分生物样品,从而减少或消除由于白细胞裂解造成的所述生物样品的污染。
7.根据权利要求1所述的方法,还包括检测所述至少一部分标记的cfDNA中的至少一个靶序列的正常表现度、高表现度或低表现度。
8.根据权利要求1所述的方法,其中所述受试者是妊娠有胎儿的。
9.根据权利要求8所述的方法,其中所述cfDNA的组分是来自胎儿的胎儿cfDNA组分。
10.根据权利要求9所述的方法,其中所述生物样品中的所述cfDNA是约10个基因组当量。
11.根据权利要求9所述的方法,还包括分析来自个体的基因型信息和所述胎儿cfDNA组分,以通过鉴定所述胎儿cfDNA组分和所述基因型信息之间的基因型匹配来确定个体是否对胎儿有父系贡献。
12.根据权利要求1所述的方法,包括在(c)中扩增,并且其中生成所述可连接的cfDNA包括:
d)生成所述cfDNA的平端,其中使用一种或多种聚合酶和一种或多种核酸外切酶去除5’突出端或3’凹陷端;
e)使cfDNA的所述平端去磷酸化;
f)使所述cfDNA与群集剂接触,从而增强一种或多种聚合酶、一种或多种核酸外切酶和所述cfDNA之间的反应;和
g)使用所述连接酶修复或去除所述cfDNA中的DNA损伤。
13.根据权利要求1所述的方法,其中所述cfDNA选自受试者体内的肿瘤、移植组织或器官或一种或多种病原体。
14.根据权利要求13所述的方法,其中所述一种或多种病原体包括细菌或其组分。
15.根据权利要求13所述的方法,其中所述一种或多种病原体包括病毒或其组分。
16.根据权利要求13所述的方法,其中所述一种或多种病原体包括真菌或其组分。
17.根据权利要求1所述的方法,包括通过大规模多重扩增在(c)中扩增。
18.根据权利要求17所述的方法,其中所述大规模多重扩增测定是等温扩增。
19.根据权利要求17所述的方法,其中所述大规模多重扩增测定是大规模多重聚合酶链反应(mmPCR)。
20.根据权利要求1所述的方法,还包括合并两个或更多个生物样品,每个样品从不同的受试者获得。
21.根据权利要求1所述的方法,还包括在从受试者获得所述生物样品后,使所述生物样品与白细胞稳定剂接触。
22.根据权利要求1所述的方法,其中从所述受试者获得的所述生物样品是使用被配置为裂解所述受试者表皮的细胞间连接的设备收集的。
23.根据权利要求1所述的方法,其中当通过以下步骤制备文库时,在(b)中所述标记以至少0.5的效率产生标记的cfDNA的文库:
h)进行末端修复、5’磷酸化和A-加尾,在20摄氏度下孵育30分钟,然后在65摄氏度下孵育30分钟;
i)将所述cfDNA与衔接子寡核苷酸连接,在20摄氏度下孵育15分钟;
j)从所述衔接子寡核苷酸切割连接的衔接子环,在37摄氏度下孵育15分钟,以产生可连接的cfDNA;
k)通过以下步骤扩增所述可连接的cfDNA:
i.使所述可连接的cfDNA在98摄氏度下变性1分钟,然后在98摄氏度下进行10秒钟13个循环;
ii.将所述变性的可连接的cfDNA与来自(i)的一个或多个互补引物在65摄氏度下退火75秒钟;和
iii.将所述可连接的cfDNA在65摄氏度下延伸5分钟,以产生可连接的cfDNA的扩增文库;和
l)使用SPRI珠纯化所述可连接的cfDNA的扩增文库。
24.一种方法,包括:
a)从有胎儿的妊娠受试者获得生物样品,其中所述生物样品包括无细胞脱氧核糖核酸(cfDNA),并且其中所述生物样品当从所述受试者获得时具有不大于约120微升的体积;
b)使所述生物样品中的至少一种cfDNA与扩增试剂和退火至对应于目标序列的序列的多核苷酸引物接触以产生扩增产物;和
c)检测所述扩增产物存在或不存在。
25.根据权利要求24所述的方法,还包括将具有可检测标记的寡核苷酸探针与所述至少一种cfDNA退火。
26.根据权利要求25所述的方法,还包括检测所述cfDNA的表观遗传修饰。
27.根据权利要求26所述的方法,其中所述表观遗传修饰包括在所述cfDNA的遗传基因座处的甲基化。
28.根据权利要求24所述的方法,其中检测所述扩增产物的存在指示胎儿的性别。
29.根据权利要求28所述的方法,其中所述cfDNA的组分来自胎儿。
30.根据权利要求24所述的方法,还包括在从所述受试者获得所述生物样品之后,使所述生物样品与白细胞稳定剂接触。
31.根据权利要求24所述的方法,其中所述生物样品的体积不大于50微升。
32.根据权利要求31所述的方法,其中所述生物样品的体积在约10微升和约40微升之间。
33.根据权利要求24所述的方法,其中通过以下方法收集所述生物样品:
m)诱导第一次经皮穿刺以产生第一部分生物样品;
n)丢弃所述第一部分生物样品;和
o)收集第二部分生物样品,从而减少或消除由于白细胞裂解造成的所述生物样品的污染。
34.一种增加从受试者获得的生物样品中靶核酸的相对量的方法,包括:
m)在所述受试者的某一部位诱导经皮穿刺以产生第一部分生物样品和第二部分生物样品;
n)丢弃所述第一部分生物样品;和
o)收集所述第二部分生物样品,从而减少或消除所述生物样品的污染或核酸损伤,其中与所述第二部分中的靶核酸部分相比,所述第一部分包括较少的靶核酸部分。
35.根据权利要求34所述的方法,还包括在诱导所述经皮穿刺之前清洁所述部位,从而去除或减少不需要的污染物。
36.根据权利要求35所述的方法,其中所述不需要的污染物包括来自经皮穿刺部位的DNA。
37.根据权利要求34所述的方法,其中所述核酸损伤包括对所述生物样品中的非凋亡DNA的损伤。
38.根据权利要求34所述的方法,其中所述生物样品是毛细血管血液。
39.根据权利要求34所述的方法,还包括使用选自大规模多重聚合酶链反应(mmPCR)或核酸测序的测定法检测所述第二部分生物样品中的所述靶核酸。
40.一种设备,包括:
a)样品收集器,其用于从受试者获得包括至多120微升体积的生物样品,其中所述生物样品包括靶无细胞DNA(cfDNA);
b)样品纯化器,其用于从所述生物样品去除细胞以产生去细胞样品;和
c)核酸检测器,其被配置为检测所述去细胞样品中的所述靶cfDNA。
41.根据权利要求40所述的设备,还包括核酸连接剂,所述核酸连接剂包括:
a)连接制剂,其用于产生可连接的靶cfDNA,所述连接制剂包括以下一种或多种:
1)一种或多种核酸外切酶,其适于生成所述靶cfDNA的平端并去除所述靶cfDNA的平端的5’突出端或3’凹陷端;
2)平端cfDNA去磷酸化剂;
3)群集剂;
4)DNA损伤修复剂;或
5)DNA连接酶;和
b)一个或多个衔接子寡核苷酸,其连接到所述可连接的靶cfDNA。
42.根据权利要求40所述的设备,还包括白细胞稳定剂。
43.根据权利要求40所述的设备,其中所述核酸检测器是大规模多重PCR设备(mmPCR)。
44.根据权利要求40所述的设备,其中所述连接制剂包括:
p)所述一种或多种核酸外切酶,其适于生成所述靶cfDNA的平端并去除所述靶cfDNA的平端的5’突出端或3’凹陷端;
q)所述平端cfDNA去磷酸化剂;
r)所述DNA损伤修复剂;和
s)所述DNA连接酶。
45.根据权利要求40所述的设备,其中所述核酸检测器包括核酸测序器或侧向流条带。
46.根据权利要求45所述的设备,其中所述核酸测序器包括信号检测器。
47.根据权利要求40所述的设备,其中所述样品纯化器包括过滤器,并且其中所述过滤器具有约0.05微米至约2微米的孔径。
48.根据权利要求47所述的设备,其中所述过滤器是垂直过滤器。
49.根据权利要求40所述的设备,其中所述样品纯化器包括选自抗体、抗原结合抗体片段、配体、受体、肽、小分子及其组合的结合部分。
50.根据权利要求40所述的设备,其中所述样品收集器被配置为裂解受试者表皮的细胞间连接以获得所述生物样品。
CN202080039518.XA 2019-03-27 2020-03-25 优化的超低体积液体活检方法、系统和设备 Pending CN113906146A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962824757P 2019-03-27 2019-03-27
US62/824,757 2019-03-27
PCT/US2020/024638 WO2020198312A1 (en) 2019-03-27 2020-03-25 Optimized ultra-low volume liquid biopsy methods, systems, and devices

Publications (1)

Publication Number Publication Date
CN113906146A true CN113906146A (zh) 2022-01-07

Family

ID=72612098

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080039518.XA Pending CN113906146A (zh) 2019-03-27 2020-03-25 优化的超低体积液体活检方法、系统和设备

Country Status (8)

Country Link
US (1) US20220162591A1 (zh)
EP (1) EP3947672A4 (zh)
JP (2) JP2022525953A (zh)
KR (1) KR20220004645A (zh)
CN (1) CN113906146A (zh)
AU (1) AU2020245532A1 (zh)
CA (1) CA3134941A1 (zh)
WO (1) WO2020198312A1 (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021500883A (ja) 2017-10-27 2021-01-14 ジュノ ダイアグノスティックス,インク. 超微量リキッドバイオプシーのためのデバイス、システム、および方法
AU2019244115A1 (en) 2018-03-30 2020-11-19 Juno Diagnostics, Inc. Deep learning-based methods, devices, and systems for prenatal testing
US20240018585A1 (en) * 2020-12-15 2024-01-18 Gateway Genomics, Llc Methods, compositions, and devices for the rapid determination of fetal sex
WO2022197659A2 (en) * 2021-03-15 2022-09-22 Board Of Regents, The University Of Texas System Fluorescence detection of circulating cell free dna including within extracellualr vesicles in biospecimens and liquid biopsies
CN113549674B (zh) * 2021-04-22 2023-11-03 福建和瑞基因科技有限公司 一种检测样本中目标序列整合和突变的方法及其引物的设计方法和试剂盒
WO2023004419A1 (en) * 2021-07-23 2023-01-26 The Johns Hopkins University Systems and methods for capture of circulating free dna
WO2023004203A1 (en) * 2021-07-23 2023-01-26 Georgetown University Use of genetic and epigenetic markers to detect cell death
KR20230108922A (ko) 2022-01-12 2023-07-19 주식회사 엘지에너지솔루션 전고체 전지용 전극의 제조방법 및 이에 의해 제조된 전극
WO2024072775A1 (en) * 2022-09-26 2024-04-04 The Johns Hopkins University Devices and systems for dna capture
US12435357B2 (en) 2022-12-22 2025-10-07 Kanso Diagnostics Ltd. Diagnostic device for detecting a target nucleic acid molecule in a biological sample
WO2024258237A1 (ko) * 2023-06-14 2024-12-19 솔바이오 주식회사 국소적 엑소좀 이질성 변화 측정 기반 액체생검
GB2635305A (en) * 2023-07-21 2025-05-14 Tailor Bio Ltd Genomic sequencing analysis

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030036710A1 (en) * 2001-08-20 2003-02-20 Matriano James A. Method for transdermal nucleic acid sampling
US20150147815A1 (en) * 2013-09-27 2015-05-28 Natera, Inc. Cell free dna diagnostic testing standards
US20180030528A1 (en) * 2011-10-06 2018-02-01 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
CN108138209A (zh) * 2015-08-12 2018-06-08 环基因治疗诊断有限责任公司 通过原位扩增制备细胞游离核酸分子的方法
CN108431233A (zh) * 2015-11-11 2018-08-21 分析生物科学有限公司 Dna文库的高效率构建
US20180288982A1 (en) * 2012-08-13 2018-10-11 InnoGenomics Technologies, LLC Method for measuring tumor burden in patient derived xenograft (pdx) mice

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5977356A (ja) 1982-06-30 1984-05-02 Fuji Photo Film Co Ltd 螢光アツセイ用多層分析要素およびそれを用いる螢光アツセイ法
EP1066414B1 (en) 1998-03-25 2009-06-10 Olink AB Rolling circle replication of padlock probes
WO2000028082A1 (fr) 1998-11-09 2000-05-18 Eiken Kagaku Kabushiki Kaisha Procede de synthese d'acide nucleique
WO2008018839A1 (en) * 2006-08-09 2008-02-14 National University Of Singapore Method for molecular biology applications
US20110086359A1 (en) 2008-06-10 2011-04-14 Rapid Pathogen Screening, Inc. Lateral flow assays
EP2684954A1 (en) * 2012-07-10 2014-01-15 Lexogen GmbH 5´ protection dependent amplification
WO2014051998A1 (en) 2012-09-28 2014-04-03 Clontech Laboratories, Inc. Lateral flow assays for tagged analytes
US10262755B2 (en) * 2014-04-21 2019-04-16 Natera, Inc. Detecting cancer mutations and aneuploidy in chromosomal segments
WO2015140218A1 (en) * 2014-03-18 2015-09-24 Qiagen Gmbh Stabilization and isolation of extracellular nucleic acids
CN108463279B (zh) 2015-07-24 2021-02-12 奥斯龙-明士克公司 用于血液样品的血液分离介质和侧向流动设备
GB201515557D0 (en) * 2015-09-02 2015-10-14 14M Genomics Ltd Method of sequencing
AU2017246318B2 (en) * 2016-04-07 2023-07-27 The Board Of Trustees Of The Leland Stanford Junior University Noninvasive diagnostics by sequencing 5-hydroxymethylated cell-free DNA
EP3631010A4 (en) * 2017-06-01 2021-02-24 Myriad Women's Health, Inc. PRODUCTION OF CHAINED POLYNUCLEOTIDES

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030036710A1 (en) * 2001-08-20 2003-02-20 Matriano James A. Method for transdermal nucleic acid sampling
US20180030528A1 (en) * 2011-10-06 2018-02-01 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US20180288982A1 (en) * 2012-08-13 2018-10-11 InnoGenomics Technologies, LLC Method for measuring tumor burden in patient derived xenograft (pdx) mice
US20150147815A1 (en) * 2013-09-27 2015-05-28 Natera, Inc. Cell free dna diagnostic testing standards
CN108138209A (zh) * 2015-08-12 2018-06-08 环基因治疗诊断有限责任公司 通过原位扩增制备细胞游离核酸分子的方法
CN108431233A (zh) * 2015-11-11 2018-08-21 分析生物科学有限公司 Dna文库的高效率构建

Also Published As

Publication number Publication date
EP3947672A4 (en) 2023-01-11
JP2025093956A (ja) 2025-06-24
AU2020245532A1 (en) 2021-11-11
CA3134941A1 (en) 2020-10-01
WO2020198312A1 (en) 2020-10-01
EP3947672A1 (en) 2022-02-09
KR20220004645A (ko) 2022-01-11
US20220162591A1 (en) 2022-05-26
JP2022525953A (ja) 2022-05-20

Similar Documents

Publication Publication Date Title
US11525134B2 (en) Devices, systems and methods for ultra-low volume liquid biopsy
CN113906146A (zh) 优化的超低体积液体活检方法、系统和设备
US20220119801A1 (en) Devices, systems and methods for biomarker analysis
US12462935B2 (en) Deep learning-based methods, devices, and systems for prenatal testing
US20220170915A1 (en) Digital health ecosystem
AU2015289414A1 (en) Non-invasive prenatal diagnosis of fetal genetic condition using cellular DNA and cell free DNA
CN107893116B (zh) 用于检测基因突变的引物对组合、试剂盒以及构建文库的方法
CN112203648A (zh) 用于产前检查的基于深度学习的方法、设备和系统
KR20210116718A (ko) 자간전증에 특이적인 순환 rna 시그니처
Ishida et al. Molecular genetics testing
CN112970068B (zh) 用于检测样品之间的污染的方法和系统
Liu et al. Primer-introduced restriction analysis polymerase chain reaction method for non-invasive prenatal testing of β-thalassemia
Cheng Sequencing and Molecular Technique-powered Profiling of DNA Biomarkers in Biomedical Applications

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20220107