[go: up one dir, main page]

CN107058310A - 一种提高基因低频突变检测灵敏度的扩增子文库构建方法 - Google Patents

一种提高基因低频突变检测灵敏度的扩增子文库构建方法 Download PDF

Info

Publication number
CN107058310A
CN107058310A CN201710382858.2A CN201710382858A CN107058310A CN 107058310 A CN107058310 A CN 107058310A CN 201710382858 A CN201710382858 A CN 201710382858A CN 107058310 A CN107058310 A CN 107058310A
Authority
CN
China
Prior art keywords
sequence
sequences
primer
hairpin structure
dna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710382858.2A
Other languages
English (en)
Inventor
易建明
屈武斌
蔡万世
王瑞超
杭兴宜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Igenetech Co Ltd
Original Assignee
Igenetech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Igenetech Co Ltd filed Critical Igenetech Co Ltd
Publication of CN107058310A publication Critical patent/CN107058310A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/06Biochemical methods, e.g. using enzymes or whole viable microorganisms

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及一种用于扩增子文库扩增和富集时使用的多重上游发卡结构引物及使用所述多重上游发卡结构引物提高基因低频突变检测灵敏度的扩增子文库构建方法,所述引物从3’端至5’端包括:与目标区域序列互补配对的特异性序列A1;发卡结构的稳定序列A2;与5’端A7序列的反向互补序列A3;发卡结构的去稳定序列A4;条码序列A5;接头序列A6;5’端序列A7;A3和A7互补配对,形成所述多重上游发卡结构引物的茎结构;A4、A5和A6形成所述多重上游发卡结构引物的环部分。

Description

一种提高基因低频突变检测灵敏度的扩增子文库构建方法
技术领域
本发明属于高通量测序领域,具体而言,本发明涉及一种提高基因突变检测灵敏度的扩增子文库构建方法。
背景技术
扩增子捕获测序技术是一种靶向捕获测序技术,主要利用多重PCR技术同时对多个目标区域序列进行特异性扩增和富集,得到扩增子文库,然后采用二代测序技术对扩增子文库进行测序,从而获取目标区域的序列信息。扩增子捕获测序技术因组合(panel)设计灵活、通量高、经济快速等优势,已经成为靶向捕获测序领域的主流技术,广泛应用于生物基础研究和临床疾病诊断。
尽管扩增子捕获测序技术应用广泛,但是它在基因低频突变检测领域的表现却差强人意,检测结果易出现假阳性,因此面临着严峻挑战。大量研究结果表明,出现假阳性的结果主要由以下两个原因造成:第一,Illumina测序平台测序过程中单个碱基的读取错误率为0.2%,DNA聚合酶引入错误碱基的错误率为10-7-10-5,基于此原因,扩增子捕获测序技术检测突变基因的灵敏度约为1%;第二,肿瘤gDNA或者ctDNA,因为含有大量异质性的DNA,导致突变基因的占比极低,突变频率通常介于0.01%-1%之间。因此,扩增子捕获测序技术因检测灵敏度低于目标位点突变的频率,导致检测结果极易出现假阳性。为了解决该问题,科研人员借鉴液相捕获测序技术解决该问题的思路,在目标区域序列与测序接头序列(adapter)之间引入一段12个简并碱基组成的条码序列(barcode),作为分子标签来辨别真正的自然突变,力求提高检测的灵敏度,降低假阳性。相关实验结果显示,该策略的确提高了检测的灵敏度,但是由于12个简并碱基的存在,导致引物序列之间互补配对形成大量的引物二聚体以及非特异性扩增条带,致使文库的测序质量下降、比对率下降、捕获率下降、均一性下降、测序噪音增加、测序成本增高,反而制约了扩增子捕获测序技术在该领域的应用。
因此,基因低频突变检测领域急需灵敏度更高的扩增子捕获测序技术。
发明内容
为了解决现有技术存在的问题,本发明改进了条码序列引入到扩增子文库的方式,提供了一种提高基因低频突变检测灵敏度的扩增子文库构建方法。该方法在提高基因突变检测灵敏度的同时,仍然可以保持扩增子文库的通量高、覆盖率高、捕获率高、均一性好等优势。
本发明的内容包含两个方面,第一方面是设计了一种用于扩增子文库扩增和富集时使用的多重上游发卡结构引物,所述引物从3’端至5’端包括序列A1-A7:
A1序列为特异性序列,与目标区域序列互补配对,引发扩增子的特异性扩增和富集;
A2序列为发卡结构的稳定序列,由两个以上连续的C和G碱基构成;
A3序列为5’端A7序列的反向互补序列;
A4序列为发卡结构的去稳定序列,碱基个数为2-8个,碱基序列中A和T多于G和C;
A5序列为条码序列,由8-16个简并碱基构成;
A6序列为测序接头序列;
A7序列为5’端序列,与A3序列反向互补;
A3和A7互补配对,形成所述多重上游发卡结构引物的茎结构;
A4、A5和A6形成所述多重上游发卡结构引物的环部分。
在优选实施方案中,所述A1特异性序列依照引物设计原则进行设计。
在优选实施方案中,在所述A2序列中,稳定序列通常由两个以上连续的C和G碱基构成,但碱基的个数和序列不受限制,优选20个以下,更优选10个以下,最优选5个以下。
在优选实施方案中,A3序列和A7序列形成局部双链的5’端可以为单链,也可以为封闭的双链(在局部双链的5’端为封闭的双链的情况下,A2序列与A7序列的5’端互补),所述双链为所述多重上游发卡结构引物的茎部分。A3和A7形成局部双链的碱基和个数没有要求,但是局部双链结构在55℃-67℃,例如59-64℃之间稳定,优选62℃时稳定,在70℃-78℃,例如70-76℃之间解链,优选71℃-74℃时能够解链为单链。
在优选实施方案中,在所述A4序列中,去稳定序列的碱基个数通常优选为2-4个,碱基序列中A和T多于G和C,优选全部为A或T。
在优选实施方案中,在所述A5序列中,条码序列通常由12个碱基(NNNNNNNNNNNN,N表示A、T、G、C中的任何一种)序列构成,但是碱基的个数可以根据扩增子的通量进行增减。
在优选实施方案中,所述A6序列是Illumina测序接头P5序列的全长序列或去除部分5’序列的Illumina测序接头P5序列。
在优选实施方案中,所述A7序列可以是A6序列5’的部分序列,或者是其他序列。
在优选实施方案中,A5和A6形成所述多重上游发卡结构引物的环部分。
本发明的第二方面提供了一种提高基因低频突变检测灵敏度的扩增子文库构建方法,所述方法包括以下步骤:
S1:采用多重上游发卡结构引物和带通用序列的多重下游引物进行第1轮多重PCR反应,得到扩增子,同时将A5条码序列和A6序列引入到扩增子序列的5’端;将下一轮PCR中P7接头引物识别的互补序列引入到扩增子序列的3’端;
S2:向上一轮反应体系中加入蛋白酶,62℃孵育15min,灭活DNA聚合酶,然后在94℃下孵育15min,灭活蛋白酶;
S3:进行第2轮接头序列PCR反应,以第1轮扩增产物为模板,以Illumina P5接头序列为上游引物,P7接头序列为下游引物,将P5和P7序列分别引入到扩增子的两侧,得到扩增子文库;
S4:采用磁珠对S3步骤的文库进行纯化,定量后进行二代测序。
在优选实验方案中,在所述方法的步骤S1中,PCR反应体系中所用的上游引物为本发明第1部分设计的发卡结构引物,下游引物序列分为两个部分,其3’端序列为特异性序列,能够与目标区域序列互补配对;其5’端序列为通用序列,能够被第2轮PCR反应中的P7引物互补配对。上下游引物在反应体系中的终浓度通常在20nM-120nM之间,具体浓度与扩增子通量相关。PCR反应体系中所用模板通常为DNA,DNA聚合酶为市售的高保真聚合酶。
在优选实施方案中,在所述方法的步骤S1中,PCR反应的循环数通常为2-4个,反应条件如下:95℃预变性3min30s;98℃变性20s,64℃退火6min 30s,72℃延伸45s;最后一步72℃延伸5min。反应条件根据模板的起始量和文库的通量可以做相应的调整。
在优选实施方案中,在所述方法的步骤S2中,蛋白酶通常采用市售的蛋白酶K。
在优选实施方案中,在所述方法的步骤S3中,PCR反应体系中以部分第1轮的扩增产物为模板,测序接头P5和P7序列作为引物,DNA酶采用市售的高保真DNA聚合酶。PCR的反应条件如下:95℃预变性3min 30s;98℃变性20s,72℃退火4min,扩增18-25个循环;最后72℃延伸5min。反应条件根据模板的起始量和文库的通量做相应的调整。
附图说明
通过以下附图对本发明内容进行说明:
图1示出多重上游发卡引物的序列组成和结构;
图2示出扩增子文库的构建流程;
图3示出示例性多重上游发卡引物A2-A7的序列信息;
图4示出50重扩增子文库的质检结果。
具体实施方式
为了解决现有技术存在的问题,本发明改进了条码序列引入到扩增子文库的方式,提供了一种提高基因低频突变检测灵敏度的扩增子文库构建方法。该方法在提高基因突变检测灵敏度的同时,仍然可以保持扩增子文库的通量高、覆盖率高、捕获率高、均一性好等优势。
本发明的内容包含两个方面,第一方面是设计了一种用于扩增子文库扩增和富集时使用的多重上游发卡结构引物,所述引物从3’端至5’端包括序列A1-A7(参见图1):
A1序列特异性序列,与目标区域序列互补配对,引发扩增子的特异性扩增和富集;
A2序列为发卡结构的稳定序列;
A3序列为5’端A7序列的互补序列;
A4序列为发卡结构的去稳定序列;
A5序列为条码序列,通常由12个简并碱基构成;
A6序列为Illumina测序平台中使用的P5接头序列;
A7序列为5’端序列,与A3序列反向互补;
A3序列为A7的5’端序列的反向互补序列,A3与A7互补配对,形成发卡结构引物中的局部双链结构;
对于所述A1特异性序列,引物的设计原则和方式优选如下文所述;
在所述A2序列中,稳定序列通常由两个连续的C和G碱基构成,但碱基的个数和序列不受限制;
在所述A3序列中,A3序列为5’端A7序列的反向互补序列,两者形成局部双链的5’端可以为单链,也可以为封闭的双链(在局部双链的5’端为封闭的双链的情况下,A2序列与A7序列的5’端互补),所述双链为所述多重上游发卡结构引物的茎部分。A3和A7形成局部双链的碱基和个数没有要求,但是局部双链的结构在55℃-67℃稳定,优选62℃时稳定,在70℃-78℃解链,优选70℃-74℃时能够解链为单链;
在所述A4序列中,去稳定序列的碱基个数通常为2-4个,碱基序列通常为A或T;
在所述A5序列中,条码序列通常由12个碱基序列(NNNNNNNNNNNN,N表示A、T、G、C中的任何一种)构成,但是碱基的个数可以根据扩增子的通量进行增减;
所述A6序列是Illumina测序接头P5序列的全长序列或去除部分5’序列的Illumina测序接头P5序列
在优选实施方案中,所述A7序列可以是A6序列5’的部分序列,或者是其他序列。
A4、A5和A6形成所述多重上游发卡结构引物的环部分。
本发明的第二方面提供了一种提高基因低频突变检测灵敏度的扩增子文库构建方法,所述方法包括以下步骤:
S1:采用多重上游发卡结构引物和带通用序列的多重下游引物进行第1轮多重PCR反应,得到扩增子,同时将A5条码序列和A6序列引入到扩增子序列的5’端;将下一轮PCR中P7接头引物识别的互补序列引入到扩增子序列的3’端;
S2:向上一轮反应体系中加入蛋白酶灭活第1轮多重PCR反应的DNA聚合酶,然后将所述蛋白酶灭活;
S3:进行第2轮接头序列PCR反应,以第1轮扩增产物为模板,以Illmuna P5接头序列为上游引物,P7接头序列为下游引物,将P5和P7序列分别引入到扩增子的两侧,得到扩增子文库;
S4:采用磁珠对S3步骤的文库进行纯化进行测序。
在一个具体的实施方案中,所述特异性引物包括针对目标序列的特异性序列,所有特异性序列之间满足如下条件:(1)每个特异性序列与目标序列之外的序列不发生扩增,(2)特异性序列之间不形成二聚体,(3)特异性序列不形成发卡结构;
在一个具体的实施方案中,所述特异性序列之间满足如下条件:(1)所述特异性序列与目标区域的Tm–与非目标区域的Tm≥5℃,优选≥10℃;(2)所述特异性序列与目标区域的Tm–与其他特异性序列形成二聚体的Tm≥5℃,优选≥10℃;(3)所述特异性序列与目标区域的Tm–形成发卡结构的Tm≥5℃,优选≥10℃,优选Tm的值基于SantaLucia2007热力学参数表的最邻近法计算。
在一个具体的实施方案中,在所述特异性序列的3’端的碱基处有增加空间位阻的修饰,所述修饰不阻断其与所述特异性序列完全匹配的模板的结合与延伸,但基本阻断其与不完全匹配的模板的结合与延伸。优选地,所述特异性序列的3’端的碱基处修饰包括在所述特异性序列的3’端-2、-3位碱基、核糖或磷酸二酯键上;在优选的实施方案中,所述特异性序列的3’端的5个碱基的GC含量大于50%,即有三个或三个以上的碱基为C或G,所述特异性序列的3’端的碱基处修饰还包括在所述特异性序列的3’端-4位碱基、核糖或磷酸二酯键处。即,在优选的实施方案中,在所述特异性序列的3’端的5个碱基的GC含量大于50%的情况下,即有三个或三个以上的碱基为C或G,所述特异性序列的3’端的碱基处修饰还包括在所述特异性序列的3’端-2、-3、-4处位碱基、核糖或磷酸二酯键处。
在一个具体的实施方案中,所述增加空间位阻的修饰选自:脱氧次黄嘌呤(dI)、脱氧尿嘧啶(dU)、5-Methyl dC、2'-O-Me-dC、磷酸基团、硫代基团、地高辛、生物素、AminolinkerC7、BHQ1、BHQ2、Dabcyl、JOE、ROX、FAM、TAMRA、烷基基团、氟代基团、氨基基团和Thiol-C3S-S。
在一个具体的实施方案中,所述3’端的碱基处增加空间位阻的修饰包括3’端-1、-2、-3位碱基处的硫代修饰。
在一个具体的实施方案中,所述特异性序列的3’端的5个碱基的GC含量大于50%,在所述特异性序列的3’端-4位碱基处有硫代修饰。
在一个具体的实施方案中,所述特异性引物序列有一致的热力学参数,优选Tm标准差≤5℃;更优选Tm标准差≤2℃;最优选Tm标准差≤1℃。Tm标准差是所述所有特异性引物序列与相应目标DNA序列之间的Tm的标准差。
在优选实施方案中,在所述方法的步骤S1中,PCR反应体系中所用的上游引物为本发明第1部分设计的发卡结构引物,下游引物序列分为两个部分,其3’端序列为特异性序列,能够与目标区域序列互补配对;其5’端序列为通用序列,能够被第2轮PCR反应中的P7引物互补配对。上下游引物在反应体系中的终浓度通常在20nM-120nM之间,具体浓度与扩增子通量相关。PCR反应体系中所用模板通常为DNA,DNA聚合酶为市售的高保真聚合酶。
在优选实施方案中,在所述方法的步骤S1中,PCR反应的循环数通常为2-4个,反应条件如下:95℃预变性3min 30s;98℃变性20s,64℃退火6min 30s,72℃延伸45s;最后一步72℃延伸5min。反应条件根据模板的起始量和文库的通量可以做相应的调整。
在优选实施方案中,在所述方法的步骤S2中,蛋白酶通常采用市售的蛋白酶K。
在优选实施方案中,在所述方法的步骤S3中,PCR反应体系中以部分第1轮的扩增产物为模板,测序接头P5和P7序列作为引物,DNA酶采用市售的高保真DNA聚合酶。PCR的反应条件如下:95℃预变性3min 30s;98℃变性20s,72℃退火4min,扩增18-25个循环;最后72℃延伸5min。反应条件根据模板的起始量和文库的通量做相应的调整。
实施例
利用该方法构建单个反应管50重扩增子文库的实施例1如下所示。
第1步:50重PCR反应扩增靶向产物
1.1 50重PCR的反应体系如下表1所示:DNA聚合酶,缓冲液和dNTP均为NEB的产品(货号M0493L);模板是Horizon公司的标准品(货号HD728)与野生型gDNA混合制备的gDNA;多重引物的浓度为0.188μM/条,终浓度为30nM/条。所有多重上游引物均为发卡引物(如图1所示),它们的A1序列(3’端特异性序列)如表2所示,A2-A7序列一致,如下图3所示,其中A5序列由10个简并碱基组成。所有多重下游引物的序列由5’端通用序列和3’端的特异性序列组成;5’端通用序列为
5’GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT3’,3’端的特异性序列如下表2所示。
表1 50重PCR的反应体系
试剂 体积(μl)
无核酸酶水 10.3
5×Q5Reaction Buffer 5
dNTPs(10mM) 0.5
引物混合物(0.188μM/条) 4
模板DNA(10ng/μl) 5
Q5 Hot Start High-Fidelity DNA聚合酶(2U/μl) 0.2
表2 50重引物的序列信息(SEQID NO.1-100)
1.2 50重PCR反应按照下表3进行操作
表3 50重PCR的反应条件
第2步:蛋白酶消化DNA聚合酶,终止多重PCR反应
第1轮多重PCR反应结束后,向PCR反应体系内加入5μl蛋白酶K(180μg/ml),振荡混匀后,64℃孵育15min,消化DNA聚合酶;94℃孵育15min,使蛋白酶失活。
第3步:第2轮接头PCR反应
3.1第2轮接头PCR的反应体系如下表4所示,DNA聚合酶为KAPA Biosystems公司的产品(货号KK2600);上下游引物分别为Illumina测序平台的接头序列P5和P7;DNA模板为第2步的反应产物,即被蛋白酶K消化后得到的多重PCR产物;
表4第2轮接头PCR的反应体系
试剂 体积(μl)
KAPA HiFi HotStart ReadyMix(2X) 12.5
正向引物P5(10μM) 1
反向引物P7(10μM) 1
DNA模板 10.5
3.2接头PCR反应按照下表的条件运行:
表5接头PCR的反应条件
第4步:磁珠纯化第2轮PCR产物
4.1向25μl PCR产物中加入25μl室温平衡后的AMPure XP磁珠,用移液器吸打混匀数次;
4.2室温孵育10min后,将PCR管置于DynaMag-96Side磁力架上3min;
4.3移除上清,PCR管继续放置在磁力架上,向管内加入180μl 80%乙醇溶液,静置30s;
4.4移除上清,再加入180μl 80%乙醇溶液,静置30s后彻底移除上清(使用10μl移液器移除底部残留乙醇溶液);
4.5室温静置10min,使残留乙醇彻底挥发;
4.6将PCR管从磁力架取下,加入22μl无核酸酶水,移液器轻轻吸打重悬磁珠,避免产生气泡,室温静置2min;
4.7将PCR管重新置于磁力架上,静置4min;
4.8用移液器吸取20μl上清液,转移到新的200μl PCR管内,管内上清液为构建好的多重文库。
第5步:对扩增子文库进行浓度测量
取2μl文库使用3.0Fluorometer(Qubit dsDNA HS Assay Kit)进行浓度测量,得到的文库浓度为6.12ng/μl;
第6步:对扩增子文库的片段分布进行质检
取2μl扩增子文库使用Qsep100全自动核酸蛋白分析系统(厚泽生物)进行质检,得到的质检峰图如图4所示:文库的靶条带位置正确,分布250-400bp之间,主峰位置在301bp;文库中在150bp处有微量引物二聚体;在500bp以后存在微量的杂峰,两者基本上均不影响文库的测序质量。
第7步:对文库进行二代测序并进行数据分析
采用Illumina公司的Next-seq 500测序平台对上述文库进行二代测序,对得到的测序数据进行统计分析,结果如下表6所示:文库的碱基质量评分(%)为85.72%,比对率为93.42%,覆盖率为100%,20%平均测序深度为96.75%,均一性高。文库的各项数据指标表现优异。
表6 50重扩增子文库的测序数据统计结果
第8步:突变位点的频率分析
本实施例使用的模板为Horizon标准品(货号HD728)与野生型gDNA混合得到的gDNA。该gDNA中有12个突变位点被本次的50重文库Panel所覆盖。12个突变位点的理论突变频率与本次的检测频率如表7所示。检出的突变频率基本上与理论的突变频率一致,结果准确,没有假阳性。
表7 12个突变位点的理论突变频率和检出的突变频率
SEQUENCE LISTING
<110> 艾吉泰康生物科技(北京)有限公司
<120> 一种提高基因低频突变检测灵敏度的扩增子文库构建方法
<130> CP20170623
<150> 2016106597621
<151> 2016-08-12
<160> 100
<170> PatentIn version 3.5
<210> 1
<211> 29
<212> DNA
<213> 人工序列
<400> 1
atcagtggaa aaatagcctc aattcttac 29
<210> 2
<211> 28
<212> DNA
<213> 人工序列
<400> 2
actgttttcc tttacttact acacctca 28
<210> 3
<211> 23
<212> DNA
<213> 人工序列
<400> 3
caaaaagatc aaagtgctgg gct 23
<210> 4
<211> 18
<212> DNA
<213> 人工序列
<400> 4
aaggactctg ggctcccc 18
<210> 5
<211> 18
<212> DNA
<213> 人工序列
<400> 5
accgtgcagc tcatcacg 18
<210> 6
<211> 22
<212> DNA
<213> 人工序列
<400> 6
tgtgaggatc ctggctcctt at 22
<210> 7
<211> 23
<212> DNA
<213> 人工序列
<400> 7
gacccttgtc tctgtgttct tgt 23
<210> 8
<211> 23
<212> DNA
<213> 人工序列
<400> 8
tgccagggac cttaccttat aca 23
<210> 9
<211> 19
<212> DNA
<213> 人工序列
<400> 9
ccacactgac gtgcctctc 19
<210> 10
<211> 22
<212> DNA
<213> 人工序列
<400> 10
ttgtctttgt gttcccggac at 22
<210> 11
<211> 26
<212> DNA
<213> 人工序列
<400> 11
cgacacaaca caaaatagcc gtataa 26
<210> 12
<211> 25
<212> DNA
<213> 人工序列
<400> 12
attcttgaca gtgtgttcac agaga 25
<210> 13
<211> 27
<212> DNA
<213> 人工序列
<400> 13
catgcaaaat cacattattg ccaacat 27
<210> 14
<211> 22
<212> DNA
<213> 人工序列
<400> 14
atcaccaaat ggcaccatac ga 22
<210> 15
<211> 23
<212> DNA
<213> 人工序列
<400> 15
gcctcccttt ccaatggact att 23
<210> 16
<211> 24
<212> DNA
<213> 人工序列
<400> 16
tttaattgcc cgtgatgttc catg 24
<210> 17
<211> 24
<212> DNA
<213> 人工序列
<400> 17
gaggtgacat tttcaaagca gtgt 24
<210> 18
<211> 30
<212> DNA
<213> 人工序列
<400> 18
catcgtcatt caagagaata ttttccctaa 30
<210> 19
<211> 31
<212> DNA
<213> 人工序列
<400> 19
aatcattaaa atcgtttttg acagtttgac a 31
<210> 20
<211> 25
<212> DNA
<213> 人工序列
<400> 20
caaagtacat gaacttgtct tcccg 25
<210> 21
<211> 19
<212> DNA
<213> 人工序列
<400> 21
cagaggaagc cttcgcctg 19
<210> 22
<211> 31
<212> DNA
<213> 人工序列
<400> 22
attcttacag aaaacaagtg gttatagatg g 31
<210> 23
<211> 30
<212> DNA
<213> 人工序列
<400> 23
agtatttcat gaaacaaatg aatgatgcac 30
<210> 24
<211> 26
<212> DNA
<213> 人工序列
<400> 24
ctttgcctgc tgagagttat taacag 26
<210> 25
<211> 23
<212> DNA
<213> 人工序列
<400> 25
atccttccag gttctgaagc atc 23
<210> 26
<211> 22
<212> DNA
<213> 人工序列
<400> 26
atagctgaaa acccatccca cc 22
<210> 27
<211> 27
<212> DNA
<213> 人工序列
<400> 27
caaatagcac agtaaacatg tggctat 27
<210> 28
<211> 22
<212> DNA
<213> 人工序列
<400> 28
aacagtgcct ggcatatagt gg 22
<210> 29
<211> 25
<212> DNA
<213> 人工序列
<400> 29
catctttaga ccagaacctc tcctg 25
<210> 30
<211> 24
<212> DNA
<213> 人工序列
<400> 30
tcattctccc ctaaccgatg tcta 24
<210> 31
<211> 22
<212> DNA
<213> 人工序列
<400> 31
ccagcagggt ctaagtattc cg 22
<210> 32
<211> 18
<212> DNA
<213> 人工序列
<400> 32
aggagggtgc ggaaagga 18
<210> 33
<211> 26
<212> DNA
<213> 人工序列
<400> 33
tacagaaggt cattgatcag tttgga 26
<210> 34
<211> 18
<212> DNA
<213> 人工序列
<400> 34
ctcggactac cagcgtgc 18
<210> 35
<211> 23
<212> DNA
<213> 人工序列
<400> 35
gtgctgagca gaggatgaac ata 23
<210> 36
<211> 22
<212> DNA
<213> 人工序列
<400> 36
aaacccacac tcatcttgtg ct 22
<210> 37
<211> 19
<212> DNA
<213> 人工序列
<400> 37
ccagctctgc tttggggag 19
<210> 38
<211> 25
<212> DNA
<213> 人工序列
<400> 38
tcccctactt ttgtttttct ccctt 25
<210> 39
<211> 24
<212> DNA
<213> 人工序列
<400> 39
aagaataaga aatggggccc tctc 24
<210> 40
<211> 25
<212> DNA
<213> 人工序列
<400> 40
ttatattcac atgcaggtag gccaa 25
<210> 41
<211> 25
<212> DNA
<213> 人工序列
<400> 41
gcttcttgtc ttaggaagtt catgc 25
<210> 42
<211> 28
<212> DNA
<213> 人工序列
<400> 42
tacagaaata tgcatttgga aagtggag 28
<210> 43
<211> 29
<212> DNA
<213> 人工序列
<400> 43
agacttaccc attttggaat tcctatagt 29
<210> 44
<211> 19
<212> DNA
<213> 人工序列
<400> 44
gcctggtttg ccctctacc 19
<210> 45
<211> 30
<212> DNA
<213> 人工序列
<400> 45
ttcaagagag gtgagatttt tcaaatgatt 30
<210> 46
<211> 28
<212> DNA
<213> 人工序列
<400> 46
tctacccttc attccatctc taacattc 28
<210> 47
<211> 21
<212> DNA
<213> 人工序列
<400> 47
cagcttctca ggggtccaat c 21
<210> 48
<211> 17
<212> DNA
<213> 人工序列
<400> 48
tggcggcatg ctgaagg 17
<210> 49
<211> 23
<212> DNA
<213> 人工序列
<400> 49
agttccctcc aaaaatcagt gct 23
<210> 50
<211> 29
<212> DNA
<213> 人工序列
<400> 50
accaacatcc aagataccag atttatagt 29
<210> 51
<211> 24
<212> DNA
<213> 人工序列
<400> 51
cctaagggag taacatgagc aaca 24
<210> 52
<211> 20
<212> DNA
<213> 人工序列
<400> 52
agggagcaga cagatgacga 20
<210> 53
<211> 16
<212> DNA
<213> 人工序列
<400> 53
gcaggtgcag ctgcca 16
<210> 54
<211> 22
<212> DNA
<213> 人工序列
<400> 54
tctccatccc ccacatttga ac 22
<210> 55
<211> 17
<212> DNA
<213> 人工序列
<400> 55
agagagcccg ctggagg 17
<210> 56
<211> 22
<212> DNA
<213> 人工序列
<400> 56
taccaagcca acttctttgc ct 22
<210> 57
<211> 25
<212> DNA
<213> 人工序列
<400> 57
gatcacacct aatccgaact tctca 25
<210> 58
<211> 30
<212> DNA
<213> 人工序列
<400> 58
ataaatctgt actaggaatc agctctttca 30
<210> 59
<211> 29
<212> DNA
<213> 人工序列
<400> 59
caagataaat aagattccac ttgtgagca 29
<210> 60
<211> 24
<212> DNA
<213> 人工序列
<400> 60
attcaaggat ggagaagctt cctc 24
<210> 61
<211> 20
<212> DNA
<213> 人工序列
<400> 61
gccaggttgc atttgggttc 20
<210> 62
<211> 24
<212> DNA
<213> 人工序列
<400> 62
caaggaaaca agcagaagcc taag 24
<210> 63
<211> 20
<212> DNA
<213> 人工序列
<400> 63
ggacaccagc tgacacttcc 20
<210> 64
<211> 20
<212> DNA
<213> 人工序列
<400> 64
gcccatacgt ctggcagatc 20
<210> 65
<211> 20
<212> DNA
<213> 人工序列
<400> 65
agggctctat gggaaggacc 20
<210> 66
<211> 24
<212> DNA
<213> 人工序列
<400> 66
caagaagccc ctttctttgt tcag 24
<210> 67
<211> 29
<212> DNA
<213> 人工序列
<400> 67
tagctgaaag atgaggagtc aagaaatat 29
<210> 68
<211> 23
<212> DNA
<213> 人工序列
<400> 68
catgatgtgg tccaaggatc cat 23
<210> 69
<211> 29
<212> DNA
<213> 人工序列
<400> 69
gtgtagagtc tgtattctta aatacccca 29
<210> 70
<211> 24
<212> DNA
<213> 人工序列
<400> 70
tacagtcttg ccttttccag aaca 24
<210> 71
<211> 20
<212> DNA
<213> 人工序列
<400> 71
cctcagtacg caccatggtc 20
<210> 72
<211> 21
<212> DNA
<213> 人工序列
<400> 72
actctgttcc ctccccaaag a 21
<210> 73
<211> 21
<212> DNA
<213> 人工序列
<400> 73
tcttacctgt gagtcctgcc a 21
<210> 74
<211> 22
<212> DNA
<213> 人工序列
<400> 74
caggctgtca accaacttct ct 22
<210> 75
<211> 28
<212> DNA
<213> 人工序列
<400> 75
ggttaattga ctcatcattt tgcaatgg 28
<210> 76
<211> 30
<212> DNA
<213> 人工序列
<400> 76
cagtaatcac aataacaaga tgaagatggt 30
<210> 77
<211> 16
<212> DNA
<213> 人工序列
<400> 77
ggcccgggtt gctgac 16
<210> 78
<211> 22
<212> DNA
<213> 人工序列
<400> 78
cccttgaccc cagatttctg ag 22
<210> 79
<211> 20
<212> DNA
<213> 人工序列
<400> 79
ggggtaggga gatggagctt 20
<210> 80
<211> 23
<212> DNA
<213> 人工序列
<400> 80
acttgtccac attctcaaag cct 23
<210> 81
<211> 25
<212> DNA
<213> 人工序列
<400> 81
ttggatatgc actaaatgag gggag 25
<210> 82
<211> 20
<212> DNA
<213> 人工序列
<400> 82
ttgctatgct agtggtggcg 20
<210> 83
<211> 25
<212> DNA
<213> 人工序列
<400> 83
gttgatgatg atgaaaactc acccc 25
<210> 84
<211> 28
<212> DNA
<213> 人工序列
<400> 84
actaaacttc tttgggcttc aattttct 28
<210> 85
<211> 30
<212> DNA
<213> 人工序列
<400> 85
taaagtcaaa gtaagaacag aaaactggag 30
<210> 86
<211> 27
<212> DNA
<213> 人工序列
<400> 86
ctcctgtgtt tctgtacatg ctaaatc 27
<210> 87
<211> 24
<212> DNA
<213> 人工序列
<400> 87
cagatgtccc ctatgtgtaa tgca 24
<210> 88
<211> 27
<212> DNA
<213> 人工序列
<400> 88
aactcagtga aaccctgtca ctaaata 27
<210> 89
<211> 21
<212> DNA
<213> 人工序列
<400> 89
tgtggaaggg gaagctgttt c 21
<210> 90
<211> 30
<212> DNA
<213> 人工序列
<400> 90
aaattgtgga aaaatagaca cgagttctta 30
<210> 91
<211> 30
<212> DNA
<213> 人工序列
<400> 91
cactgagaca ttggaagatt aaaaattgtg 30
<210> 92
<211> 25
<212> DNA
<213> 人工序列
<400> 92
aaacaagagg aaagaaaacg agcag 25
<210> 93
<211> 21
<212> DNA
<213> 人工序列
<400> 93
agaggacaca caaaacacgc t 21
<210> 94
<211> 28
<212> DNA
<213> 人工序列
<400> 94
tagtatgttt taatagctgg tagggcaa 28
<210> 95
<211> 27
<212> DNA
<213> 人工序列
<400> 95
tttctgcgtc aagactgata tcttact 27
<210> 96
<211> 19
<212> DNA
<213> 人工序列
<400> 96
accctccctc tgatgcctc 19
<210> 97
<211> 20
<212> DNA
<213> 人工序列
<400> 97
ccgtcacctc caatccaagg 20
<210> 98
<211> 28
<212> DNA
<213> 人工序列
<400> 98
tcagcaagct agagaaatac tccaaata 28
<210> 99
<211> 27
<212> DNA
<213> 人工序列
<400> 99
cacctggcct aaagacattt taaaact 27
<210> 100
<211> 27
<212> DNA
<213> 人工序列
<400> 100
ctctgttctc cttgtcctca tatcaat 27

Claims (10)

1.一种用于扩增子文库扩增和富集时使用的多重上游发卡结构引物,所述引物从3’端至5’端包括序列A1-A7:
A1序列为特异性序列,与目标区域序列互补配对,引发扩增子的特异性扩增和富集;
A2序列为发卡结构的稳定序列,由两个以上连续的C和G碱基构成;
A3序列为5’端A7序列的反向互补序列;
A4序列为发卡结构的去稳定序列,碱基个数为2-8个,碱基序列中A和T多于G和C;
A5序列为条码序列,由8-16个简并碱基构成;
A6序列为测序接头序列;
A7序列为5’端序列,与A3序列反向互补;
A3和A7互补配对,形成所述多重上游发卡结构引物的茎结构;
A4、A5和A6形成所述多重上游发卡结构引物的环部分。
2.权利要求1的多重上游发卡结构引物,所述A2序列由C和G碱基构成,碱基个数优选20个以下,更优选10个以下,最优选5个以下。
3.权利要求1或2的多重上游发卡结构引物,A3序列与A7序列形成局部双链的5’端为单链,或者A2和A3序列与A7序列形成局部双链的5’端为封闭的双链,所述双链为所述多重上游发卡结构引物的茎部分。
4.权利要求1-3任一项的多重上游发卡结构引物,所述茎结构的稳定温度是62℃-66℃,例如59-64℃,优选63℃-65℃;所述茎结构的解链稳定是70℃-78℃,例如70-76℃,优选71℃-74℃。
5.权利要求1-4任一项的多重上游发卡结构引物,所述A4序列的碱基个数为2-4个。
6.权利要求1-5任一项的多重上游发卡结构引物,所述A5序列由12个碱基序列构成,但是碱基的个数可以根据扩增子的通量进行增减。
7.权利要求1-6任一项的多重上游发卡结构引物,所述A6序列是Illumina测序接头P5序列的全长序列或去除部分5’序列的Illumina测序接头P5序列。
8.一种使用权利要求1-7任一项的多重上游发卡结构引物提高基因低频突变检测灵敏度的扩增子文库构建方法,所述方法包括以下步骤:
S1:采用多重上游发卡结构引物和带通用序列的多重下游引物进行第1轮多重PCR反应,得到扩增子,同时将A5条码序列和A6序列引入到扩增子序列的5’端;将下一轮PCR中P7接头引物识别的互补序列引入到扩增子序列的3’端;
S2:向上一轮反应体系中加入蛋白酶灭活第1轮多重PCR反应的DNA聚合酶,然后将所述蛋白酶灭活;
S3:进行第2轮接头序列PCR反应,以第1轮扩增产物为模板,以Illumuna P5接头序列为上游引物,P7接头序列为下游引物,将P5和P7序列分别引入到扩增子的两侧,得到扩增子文库;
S4:采用磁珠对S3步骤的文库进行纯化,定量后进行二代测序。
9.权利要求10的方法,在所述方法的步骤S1中,PCR反应体系中所用的上游引物为权利要求1-7任一项的多重上游发卡结构引物,下游引物序列分为两个部分,其3’端序列为特异性序列,能够与目标区域序列互补配对;其5’端序列为通用序列,能够被第2轮PCR反应中的P7引物互补配对。
10.权利要求8或9的方法,在步骤S2中,所述蛋白酶为蛋白酶K。
CN201710382858.2A 2016-08-12 2017-05-26 一种提高基因低频突变检测灵敏度的扩增子文库构建方法 Pending CN107058310A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201610659762 2016-08-12
CN2016106597621 2016-08-12

Publications (1)

Publication Number Publication Date
CN107058310A true CN107058310A (zh) 2017-08-18

Family

ID=59610673

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710382858.2A Pending CN107058310A (zh) 2016-08-12 2017-05-26 一种提高基因低频突变检测灵敏度的扩增子文库构建方法

Country Status (1)

Country Link
CN (1) CN107058310A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107217052A (zh) * 2017-07-07 2017-09-29 上海交通大学 一种定量高通量测序文库的制备方法及其配套试剂盒
CN108929901A (zh) * 2018-07-27 2018-12-04 博奥生物集团有限公司 一种用于痕量dna的多重扩增建库方法及其专用试剂盒
WO2019076018A1 (zh) * 2017-10-19 2019-04-25 北京泛生子基因科技有限公司 一种用于检测目的基因低频突变的扩增子文库的构建方法
CN109797197A (zh) * 2019-02-11 2019-05-24 杭州纽安津生物科技有限公司 一种单链分子标签接头及单链dna建库方法及其在检测循环肿瘤dna中应用
CN109797196A (zh) * 2019-01-30 2019-05-24 艾吉泰康生物科技(北京)有限公司 一种拉链式可延伸探针在cfDNA文库构建中的应用
CN110656156A (zh) * 2019-10-14 2020-01-07 湖南大地同年生物科技有限公司 一种超低频突变核酸片段检测方法、文库构建方法、引物设计方法和试剂
CN111699269A (zh) * 2018-01-12 2020-09-22 纳特拉公司 新引物及其用途
CN112011599A (zh) * 2020-09-07 2020-12-01 苏州贝康医疗器械有限公司 用于减少非特异性扩增的pcr引物组及其应用

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1496413A (zh) * 2003-05-09 2004-05-12 清华大学 用于多重pcr条件优化的方法和组分
CN104736722A (zh) * 2012-05-21 2015-06-24 斯克利普斯研究所 样品制备方法
CN105531375A (zh) * 2012-12-10 2016-04-27 分析生物科学有限公司 靶向基因组分析的方法
CN105705659A (zh) * 2013-08-28 2016-06-22 赛卢拉研究公司 大规模平行单细胞分析

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1496413A (zh) * 2003-05-09 2004-05-12 清华大学 用于多重pcr条件优化的方法和组分
CN104736722A (zh) * 2012-05-21 2015-06-24 斯克利普斯研究所 样品制备方法
CN105531375A (zh) * 2012-12-10 2016-04-27 分析生物科学有限公司 靶向基因组分析的方法
CN105705659A (zh) * 2013-08-28 2016-06-22 赛卢拉研究公司 大规模平行单细胞分析

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ANDERS ST˚AHLBERG ET AL.: "Simple, multiplexed, PCR-based barcoding of DNA enables sensitive mutation detection in liquid biopsies using sequencing", 《NUCLEIC ACIDS RESEARCH》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107217052A (zh) * 2017-07-07 2017-09-29 上海交通大学 一种定量高通量测序文库的制备方法及其配套试剂盒
WO2019076018A1 (zh) * 2017-10-19 2019-04-25 北京泛生子基因科技有限公司 一种用于检测目的基因低频突变的扩增子文库的构建方法
CN111699269A (zh) * 2018-01-12 2020-09-22 纳特拉公司 新引物及其用途
CN108929901A (zh) * 2018-07-27 2018-12-04 博奥生物集团有限公司 一种用于痕量dna的多重扩增建库方法及其专用试剂盒
CN108929901B (zh) * 2018-07-27 2022-02-01 博奥生物集团有限公司 一种用于痕量dna的多重扩增建库方法及其专用试剂盒
CN109797196A (zh) * 2019-01-30 2019-05-24 艾吉泰康生物科技(北京)有限公司 一种拉链式可延伸探针在cfDNA文库构建中的应用
CN109797196B (zh) * 2019-01-30 2022-06-07 艾吉泰康生物科技(北京)有限公司 一种拉链式可延伸探针在cfDNA文库构建中的应用
CN109797197A (zh) * 2019-02-11 2019-05-24 杭州纽安津生物科技有限公司 一种单链分子标签接头及单链dna建库方法及其在检测循环肿瘤dna中应用
CN110656156A (zh) * 2019-10-14 2020-01-07 湖南大地同年生物科技有限公司 一种超低频突变核酸片段检测方法、文库构建方法、引物设计方法和试剂
CN112011599A (zh) * 2020-09-07 2020-12-01 苏州贝康医疗器械有限公司 用于减少非特异性扩增的pcr引物组及其应用

Similar Documents

Publication Publication Date Title
CN107058310A (zh) 一种提高基因低频突变检测灵敏度的扩增子文库构建方法
JP6842450B2 (ja) 標的化ゲノム解析のための方法
CN102648295B (zh) 用于多重基因分型的多样品索引
JP2021168659A (ja) 次世代ゲノムウォーキングのための方法ならびに関連する組成物およびキット
JP7240337B2 (ja) ライブラリー調製方法ならびにそのための組成物および使用
CN110036118A (zh) 用于识别核酸分子的组合物和方法
EP3568493B1 (en) Methods and compositions for reducing redundant molecular barcodes created in primer extension reactions
CN101395280A (zh) 基于测序的高通量SNPs连接检测技术
CN111278974B (zh) 钩状探针、核酸连接方法以及测序文库的构建方法
CN107760772A (zh) 用于核酸配对末端测序的方法、组合物、系统、仪器和试剂盒
JP2024099616A (ja) ゲノム再編成検出のための配列決定方法
WO2017185766A1 (zh) 一种用于扩增低浓度突变靶序列的引物和探针的设计方法
CN107058573A (zh) 一种利用Cas9/gRNA系统构建扩增子文库的方法
CN106661636A (zh) 衔接子连接的扩增子的制备
WO2013173774A2 (en) Molecular inversion probes
CN107058361A (zh) 基于核糖核苷酸修饰引物的连接酶非依赖性基因克隆方法
US20240384261A1 (en) Methods, compositions, and kits for preparing sequencing library
US11920190B2 (en) Method of amplifying and determining target nucleotide sequence
WO2022144003A1 (zh) 一种用于高通量靶向测序的多重pcr文库构建方法
JP7760607B2 (ja) 核酸の濃縮及び検出
US20230220475A1 (en) Compositions and methods for dna methylation analysis
CN105256030B (zh) 一种基于两核苷酸合成焦测序寻找新突变/snp位点的方法
CN119570908B (zh) 肺癌靶向治疗多基因多突变类型测序文库构建方法与试剂盒
US12091715B2 (en) Methods and compositions for reducing base errors of massive parallel sequencing using triseq sequencing
JP2020096564A (ja) Rna検出方法、rna検出用核酸及びrna検出用キット

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170818

WD01 Invention patent application deemed withdrawn after publication