WO2013056640A1

WO2013056640A1 - 核酸文库的制备方法及其应用以及试剂盒

Info

Publication number: WO2013056640A1
Application number: PCT/CN2012/083036
Authority: WO
Inventors: 殷旭阳; 张春雷; 蒋慧; 张秀清; 陈盛培
Original assignee: BGI Shenzhen Co Ltd
Current assignee: BGI Shenzhen Co Ltd
Priority date: 2011-10-18
Filing date: 2012-10-16
Publication date: 2013-04-25
Anticipated expiration: 2014-04-18
Also published as: EP2770090A4; EP2770090B1; US20140296084A1; CN103060924A; TW201321518A; EP2770090A1; CN103060924B; HK1183698A1; US9359642B2

Abstract

提供了制备核酸文库的方法、确定核酸样本的核酸序列的方法以及试剂盒。其中，制备核酸文库的方法包括以下步骤：对核酸样本进行DOP-PCR扩增，以便获得第一PCR扩增产物；利用DOP-Amp引物对第一PCR扩增产物进行第二PCR扩增，以便获得第二PCR扩增产物；以及对第二PCR扩增产物进行接头连接PCR，以便获得第三PCR扩增产物，该第三PCR扩增产物构成该核酸文库。

Description

核酸文库的制备方法及其应用以及试剂盒优先权信息

本申请请求 201 1 年 10 月 18 日向中国国家知识产权局提交的、专利申请号为 201110316066.8的专利申请的优先权和权益，并且通过参照将其全文并入此处。技术领域

本发明属于基因工程技术领域，具体地涉及核酸文库的制备方法及其应用以及试剂盒。背景技术究领域中必不可少的研究工具。新一代测序技术是通过对上百万条 DNA短片段的同时的平行测序，使得在短时间内就能够完成每个碱基的测序，且成本大幅度降低。 NGS 技术在很多方面得到应用，如基因组学、转录组学、表观基因组学、临床诊断等。

目前市场上新一代测序技术 NGS 平台有好几种，包括 Illumina公司的 Genome Analyzer、 Hiseq、 Miseq系列测序平台， Roche公司的 454测序平台， Life Technologies 公司的 SOLID测序平台、 Ion Torrent测序平台等等。

但是无论何种 NGS平台，在测序前都需对 DNA/RNA样本进行处理，制备成 DNA 片段文库。通常情况下，文库的制备需要微克级的起始 DNA/RNA量，虽然经优化可以将建库起始量降低，但对于单细胞或极微量的核酸样本，仍无法直接进行文库制备，因此严重阻碍了对单细胞和量核酸测序的应用。

因此本领域迫切需要开发针对单细胞和微量核酸样本的文库构建方法。发明内容

本发明旨在至少解决现有技术中存在的技术问题之一。

本发明的目的是提供一种对单细胞或微量核酸样本进行文库制备的方法和用途。

本发明的另一目的是提供一种适用于上述方法的试剂盒。

根据本发明的一个方面，本发明提供了一种制备核酸文库的方法。根据本发明的实施例，该方法包括以下步骤：对核酸样本进行 DOP-PCR扩增，以便获得第一 PCR扩增产物；利用 DOP-Amp引物对第一 PCR扩增产物进行第二 PCR扩增，以便获得第二 PCR扩增产物；以及对第二 PCR扩增产物进行接头连接 PCR, 以便获得第三 PCR扩增产物，该第三 PC 扩增产物构成该核酸文库。根据本发明的实施例，利用该方法能够高效地制备核酸样本，尤其是单细胞和微量核酸样本的核酸文库，并且获得的核酸文库能够有效地应用于高通量测序平台，进而能够有效地确定该核酸样本的核酸序列信息。另外，发明人惊奇地发现，本发明的制备核酸文库的方法，过程筒单，极易操作，操作流程极易标准化，易于推广，并且费用低、灵敏度高、精确度高、可重复性好。

根据本发明的另一方面，本发明还提供了一种确定核酸样本的核酸序列的方法。根据本发明的实施例，该方法包括以下步骤：（i)利用根据本发明实施例的制备核酸文库的方法，构建核酸样本的核酸文库；以及 (ii)对该核酸文库进行测序和数据分析，以便确定该核酸样本的核酸序列。发明人发现，利用该方法能够高效地确定核酸样本尤其是单细胞和微量核酸样本的核酸序列信息，并且操作筒单、灵敏度高、精确度高、可重复性好、成本低。

根据本发明的又一方面，本发明还提供了一种试剂盒。根据本发明的实施例，该试剂盒包括：（l) DOP引物；（2) DOP-Amp引物；以及 (3)接头连接引物。根据本发明的实施例，该试剂盒适用于上述制备核酸文库的方法和确定核酸样本的核酸序列的方法。发明人发现，利用本发明的试剂盒，结合上述制备核酸文库的方法或确定核酸样本的核酸序列的方法，能够有效地制备核酸样本，尤其是单细胞和微量核酸样本的核酸文库，并且获得的核酸文库能够有效地应用于高通量测序平台，进而能够有效地确定该核酸样本的核酸序列信息，且获得的信息精确度高、可重复性好。

具体地，根据本发明的实施例，本发明的制备核酸文库的方法、确定核酸样本的核酸序列的方法以及试剂盒的特征还可以描述如下：

在本发明的第一方面，本发明提供了一种制备核酸文库的方法。根据本发明的实施例，该方法包括步骤：

a. 提供一待测样本，所述样本含有的核酸总量为 2皮克〜 1微克；

b. 对待测样本进行 DOP-PC (Degenerate Oligonucleotide Primed PC )扩增，获得第一 PCR扩增产物；

c. 用 DOP-Amp引物对第一 PCR扩增产物进行第二次 PCR扩增，获得第二 PCR扩增产物；

d. 对获得的第二 PCR扩增产物进行接头连接 PCR (adaptor-ligation PCR),获得第三 PCR 扩增产物，即为核酸文库。

根据本发明的实施例，所述的第三 PCR扩增产物的 5'端具有接头，且 3'端具有接头。根据本发明的实施例，还包括步骤 (e): 对第三 PCR扩增产物依据片段大小进行选择。才艮据本发明的实施例，步骤 (a)中所述的样本选自下组：

1-200个单细胞构成的样本，或

含有 1-200个单细胞的核酸样本，或

核酸总含量为 2皮克〜 1 克的核酸样本。

根据本发明的实施例，所述样本选自下组：

ί量基因组 DNA、免疫共沉淀产物 DNA、游离 DNA、 cDNA、或其组合。

根据本发明的实施例，所述 DNA来自环境，更佳地，来自土壤和 /或水体。

根据本发明的实施例，所述 DNA来自体液或排泄物，更佳地，来自血浆和 /或尿液。才艮据本发明的实施例，所述的 DNA经化学或物理方法处理，更佳地，经亚石直酸氢盐处理。根据本发明的实施例，步骤 (b)使用带有筒并寡核苷酸区的 DOP？ I物对样本 DNA进行随机扩增。

才艮据本发明的实施例，所述的 DOP引物具有位于 5'端的非筒并寡核苷酸区和位于中部的筒并寡核苷酸区和 3'端的锚定区；或者位于 5'端的非筒并寡核苷酸区和位于中部和 3'端的筒并寡核苷酸区。

根据本发明的实施例，所述 DOP引物的 3'端锚定区的序列长度为 2-12个核苷酸，较佳地 4-8个核苷酸。

根据本发明的实施例，所述 DOP引物的 3'端锚定区任选自下组： TG、 ATGTGG、TGTGG, 或 GTCT。

根据本发明的实施例，所述 DOP引物的 5'端非筒并寡核苷酸序列如 SEQ ID NO: 2所示，或与 SEQ ID NO: 2所示序列的同源性 > 50%。

根据本发明的实施例，所述的 DOP引物的 5'端非筒并寡核苷酸长度为 5-30bp, 较佳地 5-20bp, 更佳地 6-13bp。

根据本发明的实施例，所述的筒并寡核苷酸序列如 (N)m所示，其中每个碱基位置上的 N包括 A、 T、 G和 C, m为 3-20的正整数。

根据本发明的实施例，步骤 (c)所述的 DOP-Amp引物与步骤 (b)所述的 5'端非筒并寡核苷酸互补或基本上互补。

根据本发明的实施例， DOP-Amp引物序列结合于 DOP引物 5'端非筒并寡核苷酸区。根据本发明的实施例， DOP-Amp弓 I物序列如 SEQ ID NO: 2所示。

根据本发明的实施例，步骤 (d)用接头引物进行接头连接 PCR扩增。

根据本发明的实施例，所述的接头引物为 P5和 P7, 且 P5和 P7的 3'端都具有可结合于 DOP-Amp 引物序列的非筒并寡核苷酸区，所述的非筒并寡核苷酸区的序列与 SEQ ID NO: 2所示序列相同或完全互补，或者与 SEQ ID NO: 2所示序列有 > 80%的同源性。

根据本发明的实施例，所述的接头引物 P7还具有标签 (barcode或 index)序列。

根据本发明的实施例，步骤 (e)中所述的依据片段大小进行选择为：在第三 PCR扩增产物中选择 100-lOOObp长度的片段。

根据本发明的实施例，所述的依据片段大小进行选择为：在第三 PCR扩增产物中选择 200-500bp长度的片段。

在本发明的第二方面，本发明还提供了一种检测微量核酸样本中核苷酸序列的方法。根据本发明的实施例，该方法包括步骤：

(i) 对于所提供的单细胞及微量核酸样本，用本发明第一方面任一所述的方法制备所述样本的核酸文库；

(ii)对所述核酸文库中的片段进行测序和数据分析。

根据本发明的实施例，所述的测序为第二代高通量测序法，所述第二代高通量测序法可选择但不限于在 Roche454 FLX、 Illumina Solexa或 ABI SOLID测序平台上进行。

根据本发明的实施例，所述的测序包括步骤：将需要测序的核酸文库与测序芯片（flow cell)上固定的测序探针进行杂交，并进行固相桥式 PCR扩增，形成测序簇；对所述测序簇用"边合成-边测序"法进行测序，获得样本中核苷酸序列信息。

在本发明的第三方面，本发明还提供了一种可用于本发明第一方面和第二方面任一方法的试剂盒。才艮据本发明的实施例，该试剂盒包括：

(1)第一容器以及位于容器内的用于进行第一 PCR扩增的 DOP引物；

(2)第二容器以及位于容器内的用于进行第二 PCR扩增的 DOP-Amp引物；

(3)第三容器以及位于容器内的用于进行第三 PCR扩增的接头连接引物；

(4)说明书。

根据本发明的实施例，所述试剂盒还包括：用于进行 PCR扩增所需的试剂、用于核酸纯化的试剂、用于进行高通量测序的测序芯片（flow cell), 或其组合。本发明的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。附图说明

本发明的上述和 /或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解，其中：

图 1 显示了根据本发明一个实施例的本发明的确定核酸样本的核酸序列的方法的流程示意图；

图 2显示了根据本发明一个实施例的本发明的制备核酸文库的方法的流程示意图；图 3显示了根据本发明的一个实施例，利用本发明的制备核酸文库的方法制备单细胞基因组 DNA文库时各接头连接 PCR产物的电泳检测结果；

图 4显示了根据本发明的一个实施例，利用本发明的制备核酸文库的方法制备核酸文库时，经片段选择和纯化后四个样本 (YH1 , YH2 , YH3 , T21)的接头连接 PCR产物的片段检测结果，其中，图 4A为样本 YH1 的检测结果，需要的主带位于 377bp; 图 4B为样本 YH2的检测结果，需要的主带位于 326bp; 图 4C为样本 YH3的检测结果，需要的主带位于 339bp; 图 4D为样本 T21的检测结果，需要的主带位于 360bp;

图 5显示了根据本发明的一个实施例，利用本发明的制备核酸文库的方法制备微量核酸样本 (IP产物 DNA, Plasma DNA, cDNA, gDNA)的核酸文库时，各接头连接 PCR产物的电泳检测结果；以及

图 6显示了根据本发明的一个实施例，利用本发明的制备核酸文库的方法制备微量 DNA/cDNA样本的核酸文库时，经片段选择和纯化后的核酸文库的片段检测结果，其中，图 6A为微量基因组 DNA-200pg检测结果，图 6B为微量基因组 DNA-40pg检测结果，图 6C为免疫沉淀 (IP)DNA-200pg检测结果，图 6D为免疫沉淀 (IP)DNA-40pg检测结果，图 6E 为 cDNA-原浓度检测结果，图 6F为 cDNA-5-¹检测结果，图 6G为血浆游离 DNA-200pg检测结果。发明详细描述

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。

需要说明的是，术语 "第一，，、 "第二，，、 "第三，，仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有 "第一"、 "第二，，、 "第三，，的特征可以明示或者隐含地包括一个或者更多个该特征。进一步地，在本发明的描述中，除非另有说明， "多个，，的含义是两个或两个以上。

本发明的目的之一在于提供一种对单细胞或微量核酸样本进行文库制备的方法和用途。

本发明的另一目在于提供一种适用于上述方法的试剂盒。制备核酸文库的方法

根据本发明的一个方面，本发明提供了一种制备核酸文库的方法。根据本发明的实施例，参照图 2, 该方法包括以下步骤：

首先，对核酸样本进行 DOP-PCR扩增，以便获得第一 PCR扩增产物。根据本发明的实施例，本发明的制备核酸文库的方法尤其适用于单细胞和微量核酸样本，其中，核酸样本中的核酸含量不受特别限制。根据本发明的具体示例，核酸样本包含 2皮克〜 1微克的核酸。才艮据本发明的实施例，核酸样本的来源也不受特别限制。才艮据本发明的一些实施例，核酸样本可以来自 1-200个单细胞。根据本发明的一些具体示例，核酸样本可以为选自微量基因组 DNA、免疫共沉淀产物 DNA、游离 DNA和 cDNA的至少一种。根据本发明的一些实施例，核酸样本可以来源于环境、体液和排泄物的至少一种。 #>据本发明的一些具体示例，核酸样本可以来源于土壤和水体的至少一种。根据本发明的另一些具体示例，核酸样本可以来源于血浆和尿液的至少一种。

根据本发明的实施例，对核酸样本进行 DOP-PC 扩增之前，可以将核酸样本进行处理，例如当核酸样本为单细胞时，可以将其进行细胞裂解，以便使其释放基因组 DNA, 进而能够提高核酸样本进行 DOP-PC 扩增的效率，从而有利于后续步骤的进行。根据本发明的一个具体示例，当核酸样本为单细胞时，对核酸样本进行 DOP-PCR扩增之前，可以进一步包括利用碱性细胞裂解液将单细胞进行处理。

根据本发明的一些实施例，对核酸样本进行 DOP-PCR扩增之前，可以进一步包括将核酸样本进行化学处理或物理处理。根据本发明的一些具体示例，前述化学处理为亚硫酸氢盐处理。由此，该核酸样本能够适用于甲基化文库构建。

根据本发明的实施例，进行 DOP-PCR扩增的条件不受特别限制。根据本发明的一些实施例，利用 DOP引物进行 DOP-PCR扩增，其中 DOP引物具有筒并寡核苷酸区， DOP引物具有位于 5'端的非筒并寡核苷酸区、位于中部的筒并寡核苷酸区和位于 3'端的锚定区。根据本发明的另一些实施例， DOP引物具有位于 5'端的非筒并寡核苷酸区，以及位于中部和 3'端的筒并寡核苷酸区。其中， DOP引物的 3'端的锚定区、 5'端的非筒并寡核苷酸区以及筒并寡核苷酸区的具体结构不受特别限制。才艮据本发明的实施例， DOP引物的 3'端锚定区具有 2-12个核苷酸。才艮据本发明的另一些实施例， DOP引物的 3'端锚定区具有 4-8个核苷酸。根据本发明的实施例， DOP引物的 3'端锚定区具有选自 TG、 ATGTGG、 TGTGG和 GTCT 的至少一种的核苷酸序列。才艮据本发明的一些实施例， DOP引物的 5'端非筒并寡核苷酸区具有 SEQ ID NO: 2所示的核苷酸序列。根据本发明的另一些实施例， DOP引物的 5'端非筒并寡核苷酸区的核苷酸序列与 SEQ ID NO: 2所示核苷酸序列的同源性 > 50%。根据本发明的实施例， DOP引物的 5'端非筒并寡核苷酸区的核苷酸序列长度为 5-30bp,优选 5-20bp, 更优选 6-13bp。才艮据本发明的实施例，筒并寡核苷酸区具有 3-20个核苷酸。由此，能够有效地提高 DOP-PCR扩增的效率，从而能够有效地提高制备核酸文库的效率。

接着，利用 DOP-Amp引物对第一 PCR扩增产物进行第二 PCR扩增，以便获得第二 PCR 扩增产物。根据本发明的实施例， DOP-Amp引物的具体结构不受特别限制。根据本发明的一些具体示例， DOP-Amp引物与前述的 DOP引物的 5'端非筒并寡核苷酸区的核苷酸序列互补或基本上互补。由此，能够有效地对第一 PCR扩增产物进行第二 PCR扩增。根据本发明的另一些实施例， DOP-Amp引物能够与前述的 DOP引物的 5'端非筒并寡核苷酸区结合。根据本发明的一些具体示例， DOP-Amp引物具有如 SEQ ID NO: 2所示的核苷酸序列。由此，能够有效地提高第二 PCR扩增的效率。

然后，对第二 PCR扩增产物进行接头连接 PC , 以便获得第三 PCR扩增产物，该第三 PC 扩增产物构成该核酸文库。根据本发明的实施例，进行接头连接 PC 的条件不受特别限制。根据本发明的一些实施例，利用接头连接引物进行接头连接 PC , 其中接头连接引物的 3'端具有能够与前述的 DOP-Amp 引物匹配的核苷酸序列。根据本发明的另一些实施例，接头连接引物包含标签序列。由此，能够有效地制备包含标签序列的核酸文库。进而，当利用本发明的制备核酸文库的方法分别构建多个核酸样本的核酸文库，且使各文库的标签序列相互不同时，可以将多个核酸样本的核酸文库同时进行高通量测序，从而能够在保证结果准确和可重复性的前提下，有效地降低测序成本，提高测序效率。

根据本发明的实施例，获得的第三 PCR扩增产物的 5'端和 3'端均具有接头。

根据本发明的实施例，本发明的制备核酸文库的方法可以进一步包括：对第三 PCR扩增产物进行片段选择。由此，可以依据片段大小，将第三扩增产物进行选择，以便去除干扰。根据本发明的实施例，片段选择的具体条件不受特别限制，可以根据具体实验情况选取适宜长度范围的第三扩增产物，例如，当制备的核酸文库是用于 Illumina Hiseq2000测序系统时，可以选择长度为 200-800bp的第三扩增产物。根据本发明的具体示例，片段选择可以进一步包括：选择长度为 100-lOOObp的第三 PCR扩增产物。根据本发明的另一些实施例，片段选择可以进一步包括：选择长度为 200-500bp的第三 PCR扩增产物。

根据本发明的实施例，利用该方法能够高效地制备核酸样本，尤其是单细胞和微量核酸样本的核酸文库，并且获得的核酸文库能够有效地应用于高通量测序平台，进而能够有效地确定该核酸样本的核酸序列信息。另外，发明人惊奇地发现，本发明的制备核酸文库的方法，过程筒单，极易操作，操作流程极易标准化，易于推广，并且费用低、灵敏度高、精确度高、可重复性好。

此外，需要说明的是，可以根据核酸文库的用途选择是否对第二 PCR扩增产物进行接头连接 PCR。具体地，例如当预制备的核酸文库是用于进行 Sanger法测序时，可以不进行接头连接 PCR, 而将第二 PCR扩增产物直接进行电泳或浓度检测后进行 Sanger法测序，或者制备成质粒后进行 Sanger 法测序。而当预制备的核酸文库是用于进行高通量测序例如 Illlumina测序时，可以对第二 PCR扩增产物进行接头连接 PC , 以便使获得的核酸文库携带测序接头，便于后续测序的进行。确定核酸样本的核酸序列的方法

根据本发明的另一方面，本发明还提供了一种确定核酸样本的核酸序列的方法。根据本发明的实施例，参照图 1和图 2, 该方法可以包括以下步骤：

(i)利用根据本发明实施例的制备核酸文库的方法，构建核酸样本的核酸文库。根据本发明的实施例，核酸样本的种类不受特别限制，可以为未处理过的单细胞，也可以为量的 DNA或 cDNA等核酸。根据本发明的实施例，核酸样本可以为选自单细胞和微量核酸样本的至少一种。

(ii)对该核酸文库进行测序和数据分析，以便确定该核酸样本的核酸序列。根据本发明的实施例，进行测序的方法和装置不受特别限制。根据本发明的一些实施例，可以利用高通量测序平台进行测序。根据本发明的一些具体示例，可以利用选自 Roche454 FLX. Illumina Solexa和 ABI SOLID测序平台的至少一种进行测序。由此，能够提高测序效率，高效地确定核酸样本的核酸序列。

发明人发现，利用该方法能够高效地确定核酸样本尤其是单细胞和微量核酸样本的核酸序列信息，并且操作筒单、灵敏度高、精确度高、可重复性好、成本低。

根据本发明的又一方面，本发明还提供了一种试剂盒。根据本发明的实施例，该试剂盒包括：（l) DOP引物；（2) DOP-Amp引物；以及 (3)接头连接引物。

根据本发明的实施例，在本发明的试剂盒中， DOP引物、 DOP-Amp引物和接头连接引物分别设置于不同容器。

才艮据本发明的实施例，在本发明的试剂盒中， DOP 引物的序列及结构不受特别限制。才艮据本发明的一些实施例， DOP引物具有筒并寡核苷酸区，其中 DOP引物具有位于 5'端的非筒并寡核苷酸区、位于中部的筒并寡核苷酸区和位于 3'端的锚定区。根据本发明的另一些实施例， DOP引物具有位于 5'端的非筒并寡核苷酸区，以及位于中部和 3'端的筒并寡核苷酸区。根据本发明的实施例， DOP引物的 3'端的锚定区、 5'端的非筒并寡核苷酸区以及筒并寡核苷酸区的具体结构不受特别限制。才艮据本发明的一些实施例， DOP引物的 3'端锚定区具有 2-12个核苷酸。才艮据本发明的另一些实施例， DOP引物的 3'端锚定区具有 4-8个核苷酸。根据本发明的一些实施例， DOP引物的 3'端锚定区具有选自 TG、 ATGTGG、 TGTGG 和 GTCT的至少一种的核苷酸序列。才艮据本发明的一些具体示例， DOP引物的 5'端非筒并寡核苷酸区具有 SEQ ID NO: 2所示的核苷酸序列。才艮据本发明的一些实施例， DOP引物的 5'端非筒并寡核苷酸区的核苷酸序列与 SEQ ID NO: 2所示核苷酸序列的同源性 > 50%。根据本发明的一些实施例， DOP引物的 5'端非筒并寡核苷酸区的核苷酸序列长度为 5-30bp, 优选 5-20bp, 更优选 6-13bp。根据本发明的另一些实施例，筒并寡核苷酸区具有 3-20个核苷酸。由此，利用本发明的试剂盒制备单细胞或微量核酸样本的核酸文库时，能够有效地提高 DOP-PCR扩增的效率，从而能够有效地提高制备核酸文库的效率。

才艮据本发明的实施例，在本发明的试剂盒中， DOP-Amp引物的具体结构不受特别限制。根据本发明的一些具体示例， DOP-Amp引物与前述的 DOP引物的 5'端非筒并寡核苷酸区的核苷酸序列互补或基本上互补。由此，利用本发明的试剂盒制备单细胞或微量核酸样本的核酸文库时，能够有效地对第一 PCR扩增产物进行第二 PCR扩增，从而能够有效地制备核酸文库才艮据本发明的另一些实施例， DOP-Amp引物能够与所述 DOP引物的 5'端非筒并寡核苷酸区结合。根据本发明的一些具体示例， DOP-Amp引物具有如 SEQ ID NO: 2所示的核苷酸序列。由此，利用本发明的试剂盒制备单细胞或微量核酸样本的核酸文库时，能够有效地提高第二 PCR扩增的效率，从而能够有效地提高制备核酸文库的效率。

根据本发明的实施例，在本发明的试剂盒中，接头连接引物的具体结构不受特别限制。根据本发明的一些具体示例，接头连接引物的 3'端具有能够与 DOP-Amp引物匹配的核苷酸序列。根据本发明的另一些实施例，接头连接引物包含标签序列。由此，利用本发明的试剂盒能够有效地制备包含标签序列的核酸文库。进而，当利用本发明的试剂盒分别构建多个核酸样本的核酸文库，且使各文库的标签序列相互不同时，可以将多个核酸样本的核酸文库同时进行高通量测序，从而能够在保证结果准确和可重复性的前提下，有效地降低测序成本，提高测序效率。

根据本发明的实施例，该试剂盒适用于上述制备核酸文库的方法和确定核酸样本的核酸序列的方法。发明人发现，利用本发明的试剂盒，结合上述制备核酸文库的方法或确定核酸样本的核酸序列的方法，能够有效地制备核酸样本，尤其是单细胞和 ί量核酸样本的核酸文库，并且获得的核酸文库能够有效地应用于高通量测序平台，进而能够有效地确定该核酸样本的核酸序列信息，且获得的信息精确度高、可重复性好。

需要说明的是，上述对单细胞或微量核酸样本进行核酸文库制备的方法，是本发明的发明人经过广泛而深入的研究，首次建立的。利用本发明的方法，可以针对患者的体液制备核酸文库并测序，进而能够有效得到样本中与患者疾病相关的基因信息，从而能够为人类疾病的预防和治疗提供重要的信息。此外，本文中所使用的术语及表达方式的具体含义如下：

在本文中所用的术语 "含有，，可以表示 "具有 (comprise)"、 "基本上由…构成"和 "由… 构成" 的含义。

在本文中所用的术语 "以上，，和 "以下，，包括本数，例如 "80%以上" 指> 80%, "2% 以下" 指< 2%。引物

在本文中所用的术语 "引物"是能与模板互补配对，在 DNA聚合酶的作用下能够合成与模板互补的 DNA链的寡聚核苷酸的总称。引物可以是天然的 RNA、 DNA, 也可以是任何形式的天然核苷酸，甚至可以是非天然的核苷酸如 LNA或 ZNA等。

DOP-PCR (Degenerate Oligonucleotide Primed PCR)

DOP-PC , 即筒并寡核苷酸引物 PCR, 是一种对微量 DNA或单细胞进行扩增的方法，包括 (但不限于)：低严谨度预扩增和高严谨度扩增两个步骤。低严谨度扩增基于 DOP 引物进行，目的是在 DNA片段加上了一段固定序列作为 PCR引物结合区；再用 DOP-Amp引物对低严谨度扩增产物进行高严谨度扩增。

DOP引物，即筒并寡核苷酸引物，其至少包括两部分，从 5'到 3'分别为： 5'端非筒并寡核苷酸区及其下游的筒并寡核苷酸区。根据本发明的实施例， DOP 引物序列如 SEQ ID NO: 1所示： GCTCTTCCGATCT N N, 其中， GCTCTTCCGATCT为 5'端的非筒并寡核苷酸区， N NN 为筒并寡核苷酸区，筒并寡核苷酸区的序列可记为： (N)m, m为任选自 3-20的正整数， N独立地任选自 A、 T、 G和 C。根据本发明的一个实施例， DOP引物序列还可以包括 3'端锚定序列，如 "TG" , " ATGTGG" , "TGTGG" , "GTCT" 等。利用 DOP引物进行 PCR扩增，能够通过碱基互补配对使 DOP引物与样本随机结合，以便对样本进行随机片段化的扩增。在本发明的制备核酸文库的方法中，利用 DOP引物对核酸样本进行 DOP-PCR扩增，获得第一 PCR扩增产物。

DOP-Amp引物，其与 DOP引物的特定核苷酸序列基本上互补，从而能够对采用 DOP 引物进行 PCR扩增的产物进行进一步扩增。根据本发明的实施例， DOP-Amp 引物序列与上述 DOP 引物的 5' 端非筒并核苷酸区互补或基本上互补。根据本发明的一个实施例， DOP-Amp引物序列与 DOP引物的 5'端非筒并核苷酸区的核苷酸序列相同或完全互补或至少覆盖了其 5'端非筒并核苷酸区核苷酸序列的 50%区域或与其 5'端非筒并核苷酸区核苷酸序列的同源性 > 80%。根据本发明的另一个实施例， DOP-Amp引物的核苷酸序列如 SEQ ID NO: 2所示： 5'-GCTCTTCCGATCT-3'。在本发明的制备核酸文库的方法中，利用 DOP-Amp 引物对第一 PCR扩增产物进行第二 PCR扩增，获得第二 PCR扩增产物。接头连接 PCR (Adaptor-Ligation PCR)

接头连接 PCR(Adaptor-Ligation PCR), 是指在进行 PC 的同时将接头加到模板 DNA 片段两端，其中，这里的 "接头" 为高通量测序文库的接头序列，接头连接引物是接头连接 PCR的重要组成部分。

根据本发明的一个实施例，上述接头连接引物包括 (但不限于)： P5和 P7 , 其中 P5具有 ^口 SEg ID NO: 3所示的序歹' h AATGATACGGCGACCACCGAGATCTACACTCTTTCCCT AC ACGACGCTCTTCCGATCT； P7具有 SEQ ID NO: 4-7任一项所示的序列，其可表示为

CCGATCT , 其中 XXXXXX为标签 (barcode)序列，用于区分不同的核酸样本。此外，需要说明的是，本发明的制备核酸文库的方法以及确定核酸样本的核酸序列的方法至少具有以下优点：

1. 本发明的制备核酸文库的方法，通过 DOP弓 I物对核酸样本中的 DNA进行 DOP-PCR 扩增，能够全面覆盖核酸样本的 DNA片段；

2. 在本发明的制备核酸文库的方法中， DOP引物序列具有至少 5'端的非筒并核苷酸区及其下游的筒并寡核苷酸区，则获得的第一 PCR扩增产物带有特定的核苷酸序列，在加入 DOP-Amp引物后，能够对第一 PCR扩增产物进行第二 PCR扩增，获得第二 PCR扩增产物，且第二 PCR扩增为高严谨性扩增，能够大大提高扩增的灵敏度；

3. 在本发明的制备核酸文库的方法中，接头连接 PC 使用接头连接引物在第二 PCR 扩增产物两端加上接头，获得第三 PCR扩增产物，从而能够直接用于下一步的测序；

4. 利用本发明的制备核酸文库的方法以及确定核酸样本的核酸序列的方法，可以同时对多个样品进行建库和测序，且没有荧光背景的干扰；

5. 本发明的制备核酸文库的方法以及确定核酸样本的核酸序列的方法，不受物种的限制，人、动物、微生物、植物等均可以利用本发明的制备核酸文库的方法以及确定核酸样本的核酸序列的方法，进行个体式建库和测序；

6. 本发明的制备核酸文库的方法以及确定核酸样本的核酸序列的方法，试验费用低，灵敏度高、精确度高、重复性好。

下面将结合实施例对本发明的方案进行解释。本领域技术人员将会理解，下面的实施例仅用于说明本发明，而不应视为限定本发明的范围。实施例中未注明具体技术或条件的，按照本领域内的文献所描述的技术或条件（例如参考 J.萨姆布鲁克等著，黄培堂等译的《分子克隆实验指南》，第三版，科学出版社）或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者，均为可以通过市购获得的常规产品，例如可以采购自 Illumina公司。实施例 1: 单细胞基因组 DNA文库的制备及测序

本实施例以人血液中的单个淋巴细胞为样本，利用本发明的制备核酸文库的方法，分别制备各样本的单细胞基因组 DNA文库，具体步骤如下：

1. 样本来源：血液单细胞样本分别来自于一个正常人 (YH, 炎黄计划样本)和一个唐氏综合症患者 (T21)的外周血。

2. 单细胞分离：

用口吸管方法共分离出 3个 YH ( YH1、 YH2、 YH3 )和 1个 T21外周血单个淋巴细胞，分别置于含 2μ1碱性细胞裂解液 (200mM KOH, 50mM DTT)的 PC 管中， -80°C冻存 30分钟以上，备用。

3. DOP-PCR扩增（即低严谨度扩增、预扩增)：

将上述各 PC 管分别于 65 °C下处理 15分钟，以便分别获得 4份单细胞 DNA, 然后分别按照表 1中的配比配置各单细胞 DNA的 DOP反应体系。表 1

组分终浓度

lOx Pfx扩增緩冲液 lx

10x Enhancer Solution lx

10mM dNTP混合液各 ImM

50mM MgS0₄ ImM

DOP引物 0.3 ~ 2μΜ

pfx DNA聚合酶 1 ~ 2.5单位

单细胞 DNA (按需要）

灭菌蒸馏水至目标总体积其中，配置 DOP反应体系时，应将表 1中的上述各组分混合，并覆盖适量的矿物油，盖上管盖后，瞬时离心。此外，在各 DOP反应体系中， DOP引物序列为 GCTCTTCCGAT CT N(SEQ ID NO: 1)。其中，其 5'非筒并寡核苷酸序列为 GCTCTTCCGAT CT, 3'筒并寡核苷酸序列为 N N, N可以任意为 A、 T、 G和 C。

然后，按照表 2所示的反应条件，将上述配置获得的各 DOP反应体系进行 DOP-PC 扩增，以便获得第一 PCR扩增产物。表 2

温度时间循环数

94~98°C 2~5分钟 1

94~98°C 20秒 ~ 2分钟

10~ 19°C 5~30分钟

20~30°C 5~30分钟 1 - 10

31 ~40°C 5~30分钟

65~72°C 15秒 ~ 3分钟

4~ 12°C 保持由于 DOP引物含 5 '非筒并寡核苷酸序列和 3 '筒并寡核苷酸序列， DOP-PCR扩增即可将 DOP引物的 5'非筒并寡核苷酸序列加在第一 PCR扩增产物片段的两端。

4. 第二 PCR扩增（即高严谨度扩增）

将能够与上述 DOP引物的 5'非筒并寡核苷酸序列结合的 DOP-Amp引物分别加入经过 DOP-PC 扩增的各 DOP反应体系中，并使 DOP-Amp引物的终浓度为 2μΜ, 以便分别获得各第二 PCR扩增反应体系。其中， DOP-Amp弓 |物序列为 GCTCTTCCGATCT( SEQ ID NO: 2), 即 DOP-Amp引物序列为上述 DOP引物的 5'端非筒并寡核苷酸序列部分。

然后，按照表 3的反应条件，将各第二 PCR扩增反应体系进行第二 PCR扩增反应，以便获得第二 PCR扩增产物。

表 3

温度时间循环数

94~98°C 2~5分钟 1

94~98°C 15秒~2分钟

50~60°C 15秒~2分钟 5~30

65~72°C 15秒~2分钟

4~ 12°C 保持

然后，将上述获得的各第二 PCR扩增产物分别进行电泳及浓度检测，合格后备用。 5. 接头连接 PC (Adaptor-Ligation PCR)

按照表 4中的配比，分别配制步骤 (4)获得的各第二 PCR扩增产物的接头连接 PCR反应体系。其中，所采用的 DNA聚合酶为耐热的 DNA聚合酶 pfx酶。表 4

组分终浓度

lOx Pfx扩增緩冲液 2x

10x Enhancer Solution lx

lOmM dNTP混合液各 OlmM

50mM MgS0₄ ImM

P5接头连接引物 2μΜ

P7接头连接引物 2μΜ

pfx DNA聚合酶 2U

DOP-PCR产物模板 (按需要）

灭菌蒸馏水至目标总体积

其中， Ρ5接头连接引物和 Ρ7接头连接引物的序列分别为：

Ρ5接头连接引物：

CGCTCTTCCGATCT ( SEQ ID NO: 3 )„

P7接头连接引物：

CAGACGTGTGCTCTTCCGATCT。

其中，各接头连接 PCR反应体系中， P5接头连接引物序列相同，均为 SEQ ID NO: 3 所示的 Illumina Hiseq2000文库构建中的接头序列，其包括结合 Flowcell和测序的接头。如前所述的 P7接头连接引物的序列，其具有标签序列 XXXXXX, 并且在各接头连接 PC 反应体系中，标签不同。并且， P5和 P7接头序列的最后 13bp均与 DOP-Amp引物序列一致。

具体地，各接头连接 PC 反应体系的 P7序列如下：

YH1的接头连接 PC 反应体系的 P7序列：

CTTCCGATCT ( SEQ ID NO: 4 );

YH2的接头连接 PC 反应体系的 P7序列

CTTCCGATCT ( SEQ ID NO: 5 );

YH3的接头连接 PC 反应体系的 P7序列

CTTCCGATCT ( SEQ ID NO: 6 );

T21的接头连接 PC 反应体系的 P7序列： CTTCCGATCT ( SEQ ID NO: 7 )„

其中，在 SEQ ID NO: 4-7中，加粗斜体的 6个序列为标签序列。

然后，按照下表 5中的反应条件，将各接头连接 PCR反应体系分别进行接头连接 PCR 反应，以便分别获得各第三 PCR扩增产物，各第三 PCR扩增产物分别构成各样本的核酸文库： YH1文库、 YH2文库、 YH3文库和 T21文库。表 5

温度时间循环数

94~98°C 2~5分钟 1

94~98°C 15秒〜 •2分钟

50~60°C 15秒〜 •2分钟 0~10

65~72°C 15秒〜 •2分钟

94~98°C 15秒〜 •2分钟

58~65°C 15秒〜 •2分钟 5~20

65~72°C 15秒〜 •2分钟

4~ 12°C 保持将上述各核酸文库进行电泳检测，其电泳胶图见图 3。如图 3所示，泳道从左到右分别为： Marker(D2000)、 YH1文库、 YH2文库、 YH3文库、 T21文库和阴性对照。

6.片段选择和纯化

上述各核酸文库，即第三 PCR扩增产物，均含引物二聚体等杂质，且片段大小分布较分散，因此需进行片段选择和纯化，具体步骤如下：

切取 300bp-500bp大小范围的胶块，然后利用 Qiagen公司的 QIAquick Gel Extraction Kit 进行 DNA片段回收和纯化。具体操作参见试剂盒说明书。

然后，将上述经片段选择和纯化的各核酸文库进行 Agilent 2100 bioanalyzer检测，检测结果见图 4。如图 4所示，图 4A为 YH1文库的检测结果，需要的主带位于 377bp; 图 4B 为 YH2文库的检测结果，需要的主带位于 326bp; 图 4C为 YH3文库的检测结果，需要的主带位于 339bp; 图 4D为 T21文库的检测结果，需要的主带位于 360bp。结果表明，选择和纯化的片段合格。

由此，制备获得 4个单细胞样本的血液淋巴单细胞基因组 DNA文库。

7. Illumina Hiseq2000测序利用 Single-End测序法，通过一个测序通道，将上述获得的各核酸文库同时进行测序, 其中，读长 50bp。测序数据统计结果见表 6。

表 6

样品名文库编号 Read数比对率 (％) 唯一比对率 (％)

YH1 YH1AADPPEI-1 20673324(20.7M) 93.86% 89.80%

YH2 YH2ABDPPEI-2 21352924(21.4M) 94.32% 90.03%

YH3 YH3ACDPPEI-3 21290934(21.3M) 93.46% 89.61%

T21 T21ADDPPEI-5 20980937(21.0M) 94.36% 90.27% 进一步，分别统计 4 个核酸文库中，每条常染色体的数据量占常染色体总数据量的比例，其中以 read数进行统计，统计结果见表 7。

^7

染色体 YH1 YH2 YH3 T21

chrl 0.085 0.084 0.083 0.083

chr2 0.096 0.094 0.093 0.093

chr3 0.082 0.078 0.078 0.076

chr4 0.079 0.079 0.076 0.075

chr5 0.070 0.071 0.071 0.070

chr6 0.071 0.067 0.069 0.068

chr7 0.057 0.057 0.058 0.057

chr8 0.057 0.054 0.058 0.056

chr9 0.039 0.042 0.043 0.042

chrlO 0.047 0.046 0.045 0.046

chrll 0.048 0.050 0.050 0.049

chrl2 0.048 0.049 0.051 0.049

chrl 3 0.038 0.038 0.039 0.038

chrl4 0.031 0.034 0.034 0.034

chrl 5 0.026 0.029 0.029 0.028

chrl 6 0.025 0.023 0.023 0.024

chrl 7 0.021 0.021 0.021 0.021

chrl 8 0.029 0.031 0.028 0.029 chrl9 0.011 0.011 0.011 0.012

chr20 0.019 0.020 0.020 0.020

chr21 0.013 0.013 0.014 0.020

chr22 0.008 0.008 0.008 0.008 如表 7所示， T21文库的测序结果显示了 21三体单细胞 (T21)的 21号染色体数据量比例明显高于 YH单细胞 (YH1, YH2, YH3, 均为核型正常）， JLT21: YH接近 3: 2的比率。表明利用本发明的制备核酸文库的方法能够有效地制备单细胞的基因组 DNA文库，并且制备获得的单细胞基因组 DNA文库可以有效地用于染色体数目异常的检测。实施例 2

重复实施例 1, 其中与实施例 1的不同之处在于： DOP-PCR扩增的反应条件不同，本实施例的 DOP-PCR扩增的反应条件见下表 8: 表 8

温度时间循环数

94~98°C 2~5分钟 1

94~98°C 15秒~2分钟

10~ 19°C 20秒 ~ 5分钟

20~30°C 20秒 ~ 5分钟 5~25

31 ~40°C 20秒 ~ 5分钟

65~72°C 15秒~3分钟

4~ 12°C 保持

结果表明，采用本实施例中的 DOP-PCR扩增反应条件，同样能够达到构建核酸文库并用于下一步测序及检测的目的。实施例 3微量 DNA/cDNA样本的核酸文库的制备

本实施例的样本为微量 DNA/cDNA样本，分别为微量的基因组 DNA, 免疫共沉淀 (IP) 产物 DNA, 血浆游离 DNA(PlasmaDNA), 以及 RNA反转录的 cDNA产物。其中， IP产物 DNA、血浆游离 DNA、基因组 DNA(gDNA)样本均需进行 5倍梯度稀释，然后分别以 200pg、 40pg、 8pg的起始量进行文库制备。 cDNA样本则是由 1μ_β的小鼠总 RNA用六核苷酸随机引物经 Superscript II反转录酶进行反转录而获得的，经过 5倍梯度稀释后分别以原浓度、 5—¹、 5—²、 5—³的起始浓度进行文库制备。

本实施例利用本发明的制备核酸文库的方法，按照以下步骤，分别制备各微量 DNA/cDNA样本的核酸文库：

1、 DOP-PCR扩增

分别按照表 9中的配比配置各量 DNA/cDNA样本的 DOP反应体系。

表 9

组分终浓度

lOx Pfx扩增緩冲液 2x

10x Enhancer Solution lx

10mM dNTP混合液各 0.5mM

50mM MgS0₄ ImM

DOP引物 0.8μΜ

pfx DNA聚合酶 2U

微量 DNA/cDNA (按需要）

灭菌蒸馏水至目标总体积其中，配置 DOP反应体系时，应将表 9中的上述各组分混合，并覆盖适量的矿物油，盖上管盖后，瞬时离心。

然后，按照下表 10 所示的反应条件，将上述配置获得的各 DOP反应体系分别进行 DOP-PC 扩增，以便获得第一 PC 扩增产物。

表 10

温度时间循环数

95 V 5分钟 1

95 V 1分钟

15 V 20分钟

25 V 20分钟 1 ~ 5

35 V 20分钟

68 V 1分钟

4V 保持

2、第二 PCR扩增

将 DOP-Amp引物分别加入经过 DOP-PCR扩增的各 DOP反应体系中，并使 DOP-Amp 引物的终浓度为 0.4μΜ, 以便分别获得各第二 PCR扩增反应体系。然后，按照表 11的反应条件 , 将各第二 PCR扩增反应体系进行第二 PCR扩增反应 , 以便获得第二 PCR扩增产物。

表 11

温度时间循环数

95 V 5分钟 1

95 V 1分钟

54V 30秒 15 - 20

68 V 30秒 ~ 1分钟

4V 保持

然后，将上述获得的各第二 PCR扩增产物分别进行电泳及浓度检测，合格后备用。 3、接头连接 PCR

按照表 12中的配比，分别配制上述获得的各第二 PCR扩增产物的接头连接 PCR反应体系。其中，所采用的 DNA聚合酶为耐热的 DNA聚合酶 pfx酶。

表 12

组分终浓度

lOx Pfx扩增緩冲液 2x

10x Enhancer Solution lx

10mM dNTP混合液各 0.5mM

50mM MgS0₄ ImM

P5接头连接引物 0.4μΜ

P7接头连接引物 0.4μΜ

pfx DNA聚合酶 1单位

DOP-PCR产物模板 ΙΟμΙ

灭菌蒸馏水至目标总体积其中，表 12中的 Ρ5接头连接引物与实施例 1中的 Ρ5接头连接引物的序列相同。各接头连接 PC 反应体系的 Ρ7接头连接引物分别为：

IP产物 DNA样本的接头连接 PC 反应体系的 P7接头连接引物：

CTTCCGATCT ( SEQ ID NO: 4 );

Plasma DNA样本的接头连接 PCR反应体系的 P7接头连接引物: CTTCCGATCT ( SEQ ID NO: 5 );

cDNA样本的接头连接 PCR反应体系的 P7接头连接引物:

CAAGCAGAAGACGGCATAC CTTCCGATCT ( SEQ ID NO: 6 );

gDNA样本的接头连接 PCR反应体系的 P7接头连接引物:

CTTCCGATCT ( SEQ ID NO: 7 )„

其中，在 SEQ ID NO: 4-7中，加粗斜体的 6个序列为标签序列。

然后，按照下表 13中的反应条件，将各接头连接 PCR反应体系分别进行接头连接 PC

R反应，以便分别获得各第三 PCR扩增产物，各第三 PCR扩增产物分别构成各样本的核酸文库。

表 13

温度时间循环数

95 V 5分钟 1

95 V 1分钟

54V 30秒 3 ~ 10

68 V 30秒 ~ 1分钟

95 V 1分钟

62 V 30秒 5 ~ 10

68 V 30秒 ~ 1分钟

4V 保持将上述各核酸文库进行电泳检测，其电泳胶图见图 5。如图 5所示，其中，上图从左至右的泳道分别为：起始量分别为 200pg、 40pg、 8pg 的 IP 产物 DNA 的核酸文库、 Marker(D2000)、起始量分别为 200pg、 40pg、 8pg的 Plasma DNA (血浆游离 DNA )的核酸文库、 Marker(D2000); 下图从左至右的泳道分别为： Marker(D2000)、起始浓度分别为原浓度、 5人 5 5^-3的 cDNA样本的核酸文库、 Marker(D2000)、起始量分别为 200pg、 40pg、 8pg的 gDNA (基因组 DNA )样本的核酸文库、阴性对照。

图 5表明，本实施例成功制备了四种微量 DNA/cDNA样本的核酸文库。

5、片段选择和纯化

按照以下步骤，对上述各核酸文库进行片段选择和纯化：切取 200bp-500bp大小范围的胶块，然后利用 Qiagen公司的 QIAquick Gel Extraction Kit进行 DNA片段回收和纯化。具体操作见试剂盒说明书。

然后，将上述经片段选择和纯化的各核酸文库进行 Agilent 2100 bioanalyzer检测，检测结果见图 6。如图 6所示，图 6 A为微量基因组 DN A-200pg检测结果，图 6B为微量基因组 DNA-40pg检测结果，图 6C 为免疫沉淀 (IP)DNA-200pg检测结果，图 6D 为免疫沉淀 IP)DNA-40pg检测结果，图 6E为 cDNA-原浓度检测结果，图 6F为 cDNA-5— ¹检测结果，图 6G为血浆游离 DNA-200pg检测结果。

由此，制备获得 4个微量 DNA/cDNA样本的核酸文库。

然后，利用实施例 1 的测序方法分别对上述制备获得的各文库进行测序，结果表明，利用本发明的制备核酸文库的方法能够有效地制备微量 DNA/cDNA样本的核酸文库，并且制备获得的核酸文库可以用来进行疾病的检测和确诊。实施例 4试剂盒

一种用于制备单细胞及微量核酸的文库的试剂盒，其包括以下组分：

(1)第一容器以及位于容器内的 DOP引物；

(2)第二容器以及位于容器内的 DOP-Amp引物；

(3)第三容器以及位于容器内的接头连接引物；

(4)第四容器以及位于容器内的用于进行 DOP-PCR扩增所需的试剂；

(5)第五容器以及位于容器内的用于核酸纯化的试剂；

(6)第六容器以及位于容器内的用于进行高通量测序的测序芯片（flow cell);

(7)说明书。工业实用性

本发明的制备核酸文库的方法、确定核酸样本的核酸序列的方法以及试剂盒，能够有效地用于单细胞及 ί核酸样本的核酸文库的制备和测序，并且灵敏度高、准确度高、可重复性好，从而能够有效地用于疾病的检测和确诊。尽管本发明的具体实施方式已经得到详细的描述，本领域技术人员将会理解。根据已经公开的所有教导，可以对那些细节进行各种修改和替换，这些改变均在本发明的保护范围之内。本发明的全部范围由所附权利要求及其任何等同物给出。

在本说明书的描述中，参考术语 "一个实施例"、 "一些实施例"、 "示意性实施例"、 "示例"、 "具体示例"、或 "一些示例" 等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

Claims

权利要求书

1、一种制备核酸文库的方法，其特征在于，包括以下步骤：

对核酸样本进行 DOP-PC 扩增，以便获得第一 PCR扩增产物；

利用 DOP-Amp引物对所述第一 PCR扩增产物进行第二 PCR扩增，以便获得第二 PCR 扩增产物；以及

对所述第二 PCR扩增产物进行接头连接 PCR, 以便获得第三 PCR扩增产物，所述第三 PC 扩增产物构成所述核酸文库。

2、根据权利要求 1所述的方法，其特征在于，所述核酸样本包含 2皮克〜 1微克的核酸。

3、根据权利要求 1所述的方法，其特征在于，所述第三 PCR扩增产物的 5'端和 3'端均具有接头。

4、根据权利要求 1所述的方法，其特征在于，进一步包括：

对所述第三 PCR扩增产物进行片段选择。

5、根据权利要求 1所述的方法，其特征在于，所述核酸样本来自 1-200个单细胞。

6、根据权利要求 1所述的方法，其特征在于，所述核酸样本为选自微量基因组 DNA、免疫共沉淀产物 DNA、游离 DNA和 cDNA的至少一种。

7、根据权利要求 1所述的方法，其特征在于，所述核酸样本来源于环境、体液和排泄物的至少一种。

8、根据权利要求 7所述的方法，其特征在于，所述核酸样本来源于土壤和水体的至少一种。

9、根据权利要求 7所述的方法，其特征在于，所述核酸样本来源于血浆和尿液的至少一种。

10、根据权利要求 1所述的方法，其特征在于，对所述核酸样本进行 DOP-PCR扩增之前，进一步包括将所述核酸样本进行化学处理或物理处理。

11、根据权利要求 10所述的方法，其特征在于，所述化学处理为亚硫酸氢盐处理。

12、根据权利要求 1所述的方法，其特征在于，利用 DOP引物进行所述 DOP-PCR扩增，其中所述 DOP引物具有筒并寡核苷酸区，所述 DOP引物具有位于 5'端的非筒并寡核苷酸区、位于中部的筒并寡核苷酸区和位于 3'端的锚定区。

13、根据权利要求 12所述的方法，其特征在于，所述 DOP引物具有位于 5'端的非筒并寡核苷酸区，以及位于中部和 3'端的筒并寡核苷酸区。

14、根据权利要求 12所述的方法，其特征在于，所述 DOP引物的 3'端锚定区具有 2-12 个核苷酸。

15、根据权利要求 14所述的方法，其特征在于，所述 DOP引物的 3'端锚定区具有 4-8 个核苷酸。

16、根据权利要求 12所述的方法，其特征在于，所述 DOP引物的 3'端锚定区具有选自 TG、 ATGTGG、 TGTGG和 GTCT的至少一种的核苷酸序列。

17、根据权利要求 12或 13所述的方法，其特征在于，所述 DOP引物的 5'端非筒并寡核苷酸区具有 SEQ ID NO: 2所示的核苷酸序列。

18、根据权利要求 12或 13所述的方法，其特征在于，所述 DOP引物的 5'端非筒并寡核苷酸区的核苷酸序列与 SEQ ID NO: 2所示核苷酸序列的同源性 > 50%。

19、根据权利要求 12或 13所述的方法，其特征在于，所述 DOP引物的 5'端非筒并寡核苷酸区的核苷酸序列长度为 5-30bp, 优选 5-20bp, 更优选 6-13bp。

20、根据权利要求 12所述的方法，其特征在于，所述筒并寡核苷酸区具有 3-20个核苷酸。

21、根据权利要求 12或 13所述的方法，其特征在于，所述 DOP-Amp引物与所述 DOP 引物的 5'端非筒并寡核苷酸区的核苷酸序列互补或基本上互补。

22、根据权利要求 12或 13所述的方法，其特征在于，所述 DOP-Amp引物能够与所述 DOP引物的 5'端非筒并寡核苷酸区结合。

23、根据权利要求 12或 13所述的方法，其特征在于，所述 DOP-Amp引物具有如 SEQ ID NO: 2所示的核苷酸序列。

24、根据权利要求 1、 22或 23所述的方法，其特征在于，利用接头连接引物进行所述接头连接 PCR, 其中所述接头连接引物的 3'端具有能够与所述 DOP-Amp引物匹配的核苷酸序列。

25、根据权利要求 24所述的方法，其特征在于，所述接头连接引物包含标签序列。

26、根据权利要求 4 所述的方法，其特征在于，所述片段选择进一步包括：选择长度为 100-lOOObp的第三 PCR扩增产物。

27、根据权利要求 4 所述的方法，其特征在于，所述片段选择进一步包括：选择长度为 200-500bp的第三 PCR扩增产物。

28、一种确定核酸样本的核酸序列的方法，其特征在于，包括以下步骤：

(i)利用权利要求 1-27任一所述的方法，构建所述核酸样本的核酸文库；以及

(ii)对所述核酸文库进行测序和数据分析，以便确定所述核酸样本的核酸序列。

29、根据权利要求 28所述的方法，其特征在于，所述核酸样本为选自单细胞和微量核酸样本的至少一种。

30、根据权利要求 28所述的方法，其特征在于，利用高通量测序平台进行所述测序。

31、根据权利要求 30所述的方法，其特征在于，利用选自 Roche454 FLX. Illumina Solexa 和 ABI SOLID测序平台的至少一种进行所述测序。

32、一种试剂盒，其特征在于，包括：

(1) DOP引物；

(2) DOP-Amp引物；以及

(3)接头连接引物。

33、根据权利要求 32所述的试剂盒，其特征在于，所述 DOP引物、 DOP-Amp引物和接头连接？ I物分别设置于不同容器。

34、根据权利要求 32所述的试剂盒，其特征在于，所述 DOP引物具有筒并寡核苷酸区，其中所述 DOP引物具有位于 5'端的非筒并寡核苷酸区、位于中部的筒并寡核苷酸区和位于 3'端的锚定区。

35、根据权利要求 32所述的试剂盒，其特征在于，所述 DOP引物具有位于 5'端的非筒并寡核苷酸区，以及位于中部和 3'端的筒并寡核苷酸区。

36、根据权利要求 34所述的方法，其特征在于，所述 DOP引物的 3'端锚定区具有 2-12 个核苷酸。

37、根据权利要求 36所述的试剂盒，其特征在于，所述 DOP引物的 3'端锚定区具有 4-8个核苷酸。

38、根据权利要求 34所述的试剂盒，其特征在于，所述 DOP引物的 3'端锚定区具有选自 TG、 ATGTGG、 TGTGG和 GTCT的至少一种的核苷酸序列。

39、根据权利要求 34或 35所述的试剂盒，其特征在于，所述 DOP引物的 5'端非筒并寡核苷酸区具有 SEQ ID NO: 2所示的核苷酸序列。

40、根据权利要求 34或 35所述的试剂盒，其特征在于，所述 DOP引物的 5'端非筒并寡核苷酸区的核苷酸序列与 SEQ ID NO: 2所示核苷酸序列的同源性 > 50%。

41、根据权利要求 34或 35所述的试剂盒，其特征在于，所述 DOP引物的 5'端非筒并寡核苷酸区的核苷酸序列长度为 5-30bp, 优选 5-20bp, 更优选 6-13bp。

42、根据权利要求 34或 35所述的试剂盒，其特征在于，所述筒并寡核苷酸区具有 3-20 个核苷酸。

43、根据权利要求 34或 35所述的试剂盒，其特征在于，所述 DOP-Amp引物与所述

DOP引物的 5'端非筒并寡核苷酸区的核苷酸序列互补或基本上互补。

44、根据权利要求 34或 35所述的试剂盒，其特征在于，所述 DOP-Amp引物能够与所述 DOP引物的 5'端非筒并寡核苷酸区结合。

45、根据权利要求 34或 35所述的试剂盒，其特征在于，所述 DOP-Amp引物具有如 SEQ ID NO: 2所示的核苷酸序列。

46、根据权利要求 43或 44所述的试剂盒，其特征在于，所述接头连接引物的 3'端具有能够与所述 DOP-Amp引物匹配的核苷酸序列。

47、根据权利要求 32所述的试剂盒，其特征在于，所述接头连接引物包含标签序列。