[go: up one dir, main page]

CN113136416B - 一种用于PacBio测序的文库构建方法 - Google Patents

一种用于PacBio测序的文库构建方法 Download PDF

Info

Publication number
CN113136416B
CN113136416B CN202110042549.7A CN202110042549A CN113136416B CN 113136416 B CN113136416 B CN 113136416B CN 202110042549 A CN202110042549 A CN 202110042549A CN 113136416 B CN113136416 B CN 113136416B
Authority
CN
China
Prior art keywords
dna
sequencing
fragment
library
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110042549.7A
Other languages
English (en)
Other versions
CN113136416A (zh
Inventor
张勇
贾行星
谭生军
蔡英傲
张雅琼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Zoology of CAS
Original Assignee
Institute of Zoology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Zoology of CAS filed Critical Institute of Zoology of CAS
Publication of CN113136416A publication Critical patent/CN113136416A/zh
Application granted granted Critical
Publication of CN113136416B publication Critical patent/CN113136416B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/06Biochemical methods, e.g. using enzymes or whole viable microorganisms

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Analytical Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Immunology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种用于PacBio测序的文库构建方法。本发明提供了一种PacBio测序文库构建方法,为将含有发卡结构的测序接头通过转座酶插入目标DNA分子,实现DNA环化,得到PacBio测序文库。本发明的实验证明,本发明的PacBio测序文库构建方法,通过有效选择反应缓冲液,使整个反应在从转座插入片段化到文库环化完成均在同一反应管中完成,尤其在低DNA用量的测序文库构建过程中有效地避免了常规片段化步骤后的纯化回收导致的DNA样品损失,提高了模板的利用率,减少了实验的复杂性和时间消耗,可以实现最快在2小时内完成PacBio测序文库的构建与回收。

Description

一种用于PacBio测序的文库构建方法
技术领域
本发明属于生物技术领域,涉及一种用于PacBio测序的文库构建方法。
背景技术
PacBio等三代测序技术推动了基因组组装、结构变异鉴定等领域的快速发展。PacBio测序需要用到环化的DNA文库,现有的文库构建方案均基于DNA平末端或TA连接来实现;在文库构建前,这两种连接方法常需要先将长片段DNA进行片段化并重新纯化回收后再连接测序接头。但纯化回收操作不仅造成DNA样品的损失,也使得测序文库构建的时间消耗显著增加。这些不足使常规PacBio测序文库构建方法无法有效应用到珍贵人类样品、小型动植物样本等少量DNA输入的场合。因此避免建库过程中片段化后纯化回收操作对少量DNA输入的测序文库构建而言至关重要。
因此,目前需要开发一种快速、中间过程无DNA回收、操作简单且高效的PacBio测序文库构建方法。
发明内容
本发明的一个目的是提供一种PacBio测序文库构建方法。
本发明提供的方法(图1),包括如下步骤:
1)制备含有发卡结构测序接头的转座酶复合物(图1A);
所述含有发卡结构测序接头的转座酶复合物由含有发卡结构测序接头与转座酶组装得到;
所述含有发卡结构测序接头为将发卡结构测序接头序列退火形成;
所述发卡结构测序接头序列从5'端起依次由片段a、片段b和片段c组成;所述片段a和所述片段c反向互补;
所述片段a包括转座酶识别序列;
所述片段b包括PacBio测序文库的测序接头序列,且所述片段b不与所述片段a相同或互补;所述测序接头序列自身含有或不含有互补序列;
2)将所述含有发卡结构测序接头的转座酶复合物通过转座反应插入目标DNA分子中,得到转座反应产物;
3)将所述转座反应产物依次进行环化连接和DNA损伤修复,得到环化的DNA测序文库;即为PacBio测序文库。
上述方法中,所述环化连接所需的酶为DNA连接酶和DNA聚合酶;
或,所述DNA损伤修复所需的酶为DNA修复酶。
所述步骤2)和步骤3)均在同一缓冲液中进行。
上述方法中,所述缓冲液为T4 DNA连接酶缓冲液或其他缓冲液。
上述方法中,若所述目标DNA分子为多个目标DNA样品且高通量同时测序,则在所述方法中进行如下改变:
步骤1)中,在每个所述发卡结构测序接头序列的片段a中引入用于区分不同目标DNA样品的DNA条形码序列;同时在所述发卡结构测序接头的片段c中引入该DNA条形码的反向互补序列。
每个所述目标DNA样品对应一个所述发卡结构测序接头序列;每个所述发卡结构测序接头序列中仅所述DNA条形码序列不同;
步骤3)得到的多个目标DNA样品对应的环化的DNA测序文库混匀,得到混合的PacBio测序文库。
若所述目标DNA测序文库为多个目标DNA样品,且不需要高通量同时测序,则上述方法无需改变,可以每次测序一个文库。
上述方法中,所述DNA条形码序列位于其所在片段a中转座酶识别序列的3'末端;且所述DNA条形码序列由数量大于2的随机碱基组成,随机碱基为ATCG任一种。
上述方法中,在步骤2)和步骤3)之间还包括如下步骤:将所述转座反应产物依次进行DNA外切酶消化和处理使转座酶脱离含有测序接头序列DNA的步骤;
或,在所述步骤3)得到环化的DNA测序文库后,还包括如下步骤:将所述环化的DNA测序文库加入外切酶消化未环化DNA,得到PacBio测序文库。
上述方法中,所述转座酶为Tn5转座酶或其突变体。
上述方法中,所述目标DNA分子为长片段DNA;
或,所述长片段DNA长度大于等于1kb、大于等于2kb、大于等于3kb、大于等于5kb、大于等于10kb、大于等于20kb或大于等于50kb;
或,步骤2)中,所述目标DNA分子在所述转座反应的体系中的量如下:大于等于20ng、大于等于50ng、大于等于100ng、大于等于200ng、大于等于300ng、大于等于500ng或大于等于1μg。
上述方法在长片段PacBio测序中的应用也是本发明保护的范围;
或,上述方法在滚环复制扩增环化DNA中的应用也是本发明保护的范围。
本发明还有一个目的是提供一种对目标DNA分子进行PacBio测序的方法。
本发明提供的测序方法,对第一个目的方法得到的PacBio测序文库进行PacBio测序。
本发明还有一个目的是提供一种长片段PacBio测序的试剂盒。
本发明提供的试剂盒,包括上述方法中的所述发卡结构测序接头序列和能与其结合的转座酶。
上述试剂盒还包括用于环化连接的DNA聚合酶和DNA连接酶以及用于DNA损伤修复的DNA修复酶;还包括DNA外切酶;还包括测序仪。
上述方法可在同一反应管中完成,中间无需任何纯化回收操作过程。反应得到的环化DNA可进一步进行滚环复制或多重置换DNA扩增、测序文库构建等,用于测序、芯片杂交、PCR等不同类型的实验。
本发明提供一种用于PacBio平台的测序文库构建方法,通过有效选择反应缓冲液使整个反应从转座酶复合物插入实现片段化到文库构建结束均在同一反应管中完成。该方法在低DNA用量的测序文库构建过程中有效避免了片段化后回收纯化引起的DNA样品损失,提高了模板的利用率,同时减少了实验的复杂性和时间消耗,使PacBio文库构建与回收最快可在2个小时内快速完成。
本发明的PacBio测序文库构建方法至少实现并拥有如下三方面的优势:首先,该方法可用于常量DNA测序文库构建(大于等于1μg),也可以用于少量DNA(小于1μg)的测序文库构建;本发明通过Tn5转座酶将发卡结构的测序接头插入到目标DNA上,在实现目标DNA片段化的同时、测序接头通过转座插入反应可高效连接到目标DNA上,也有效地保证了DNA使用效率,降低了环化建库过程中的DNA总量需求;其次,本发明采用体外转座的方式环化少量DNA,只要发生转座酶复合物的转座插入,含有发卡结构的PacBio测序接头即可将DNA高效环化,很好地规避了传统DNA酶连接方法片段越长环化效率越低的弊端,实现了不依赖于DNA片段大小的环化方法;最后,整个文库构建过程通过有效选择反应缓冲液,实现了在同一反应管中完成包括长DNA片段化在内的所有建库操作步骤,避免了因为片段化之后纯化操作引起额外的DNA损失,减少了实验的复杂性和时间消耗,实现最快2小时内完成PacBio测序文库的构建与回收。
附图说明
图1为PacBio测序建库流程图。
图2为发卡结构测序接头序列结构示意图。
具体实施方式
下述实例中所使用的实验方法如无特殊说明,均为常规方法。
下述实例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
实施例1、基于Tn5转座酶的PacBio测序文库构建方法的建立
一、含有发卡结构测序接头的转座酶复合物的制备(图1A)
1、发卡结构测序接头序列的设计合成
发卡结构测序接头的序列从5'端起依次由片段a、片段b和片段c组成(图2),其中,片段a和片段c完全反向互补。
片段a包括转座酶识别序列,且片段a自5'末端第一位碱基磷酸化修饰;
在片段a中还可以引入用于区分不同样本的DNA条形码序列,该DNA条形码位于所述转座酶识别序列的3'末端;DNA条形码序列由大于2个的随机碱基组成,随机碱基为ATCG任一种;
多个样本对应多个发卡结构测序接头序列,每个发卡结构测序接头序列对应一个样本,其中每个发卡结构测序接头序列中仅DNA条形码序列不同;
片段b自5'端起包括PacBio测序文库的测序接头序列。
人工合成上述发卡结构测序接头的序列。
2、含有发卡结构测序接头
将上述人工合成上述发卡结构测序接头的序列退火形成含有发卡结构测序接头。
3、制备含有发卡结构测序接头的转座酶复合物
将上述含有发卡结构测序接头与转座酶组装,得到含有发卡结构测序接头的转座酶复合物(图1A)。
二、环化(过程如图1B)
1、修复后环化DNA文库
1)转座插入反应
将上述步骤一得到的含有发卡结构测序接头的转座酶复合物通过转座反应插入位于T4 DNA连接酶缓冲液中的待环化DNA(小于100ng DNA或单细胞裂解后的基因组DNA)中,得到转座反应产物;
将转座反应产物加入DNA外切酶消化除去多余的测序接头序列及未被Tn5转座酶复合体保护的DNA;再加入SDS至终浓度0.05%失活DNA外切酶,且使Tn5转座酶释放含有测序接头序列的DNA;加入Triton X-100至终浓度1%来淬灭SDS,得到含有测序接头序列的DNA;
2)环化连接反应
向1)中含有测序接头序列的DNA中加入T4 DNA聚合酶和T4 DNA连接酶消除缺口完成连接环化,得到含有测序接头序列的环化DNA;
3)DNA损伤修复酶修复
将上述2)得到的含有测序接头序列的环化DNA加入各种DNA损伤修复酶修复不同类型的DNA损伤,得到修复后的DNA环化产物。
2、消化未环化的DNA文库(如果待环化DNA小于100ng,则此步骤也可省去)。
向上述步骤1得到的DNA环化产物中加入外切酶消化产物中未环化的DNA,得到完全环化的DNA测序文库。
三、测序
将上述二得到的完全环化的DNA测序文库进行测序。
实施例2、基于Tn5转座酶的常量(1μg)DNA输入的PacBio测序文库构建
一、含有发卡结构测序接头的转座酶复合物PC0的制备(图1A)
1、发卡结构测序接头序列的设计合成
人工合成发卡结构测序接头序列PC0如下:
PC0:
5'-pCTGTCTCTTATACACATCTATCTCTCTCTTTTCCTCCTCCTCCGTTGTTGTTGTTGAGAGAGATAGATGTGTATAAGAGACAG-3'(序列1)
其中,5'端末端加粗的19个碱基(图2,片段a)能与3'端末端加粗的19个碱基(片段c)以反向互补的方式形成发卡结构;5'端末端的19个碱基(片段a),3'端末端的19个碱基(片段c)的反向互补序列均为Tn5转座酶识别序列;中间45个碱基序列(片段b)为PacBio测序接头(其中互补的用下划线标出);片段a的5'末端第一位碱基磷酸化修饰。
人工合成上述发卡结构测序接头的序列。
2、含有发卡结构测序接头
将上述发卡结构测序接头的序列退火形成含有发卡结构测序接头PC0,具体条件如下:
退火体系:由2μM发卡结构测序接头的序列PC0和退火缓冲液组成;
退火缓冲液由10mM Tris-HCl(pH8.0)、1mM EDTA和水组成。
退火条件:94℃热变性5min,以每秒钟降低0.1℃的速度逐渐降温至15℃;
退火后含有发卡结构测序接头PC0的浓度为2μM。
3、制备含有发卡结构测序接头的转座酶复合物
将上述2得到的含有发卡结构测序接头PC0与Tn5转座酶组装成为含有发卡结构测序接头PC0的转座酶复合物,具体组装体系如下:
PC0(2μM):2μl
10X TPS缓冲液(Mei5 Biotechnology MF650-01):2μl
Tn5转座酶(Mei5 Biotechnology MF650-01):2μl(1U/μl)
双蒸水:至20μl
总计:20μl
组装条件:25℃反应30min
二、环化(图1B)
将上述步骤一得到的含有发卡结构测序接头的转座酶复合物通过转座反应分别插入待环化的1μg人GM12878细胞系(Coriell#:GM12878)和黑腹果蝇参考基因组品系iso1(Bloomington Drosophila Stock Center#:2057)的基因组DNA,依次采用T4 DNA聚合酶和连接酶消除缺口并完成连接环化,最后加入各种DNA损伤修复酶修复不同类型的DNA损伤,得到修复后环化DNA文库。
1、修复后的环化DNA文库
1)转座插入反应:目的DNA片段化及测序接头插入连接。
体系如下:
上述步骤一得到的含有发卡结构测序接头的转座酶复合物:5μl
10x T4 DNA ligase buffer(NEB Catalog#:B0202S):3μl
DNA(1μg):20μl
双蒸水:至30μl
总计:30μl
上述DNA为待环化的1μg人GM12878细胞系(Coriell#:GM12878)和黑腹果蝇参考基因组品系iso1(Bloomington Drosophila Stock Center#:2057)的基因组DNA中任一种。
上述转座插入反应体系置于55℃反应10min,得到转座反应产物;
再将转座反应产物加入1μl Exonuclease I(E.coli,NEB Catalog#:M0568L)和1μl Lambda Exonuclease(NEB Catalog#:M0262S)在37℃消化10min(DNA外切酶消化除去多余的测序接头序列及未被Tn5转座酶复合体保护的DNA);再加入1.5μl 1%SDS溶液室温25℃反应5min(使Tn5转座酶释放含有测序接头序列的DNA);再加入1.5μl20%Triton X-100在室温25℃反应5min淬灭SDS,得到从Tn5转座酶复合物中释放的含有PacBio测序接头的未环化DNA,即为含有测序接头序列的DNA。
2)环化连接反应:目的是填补缺口,连接酶连接环化,修复DNA损伤。
DNA聚合酶反应体系如下:
步骤1)的含有测序接头序列的DNA:35μl
10x T4 DNA ligase buffer:2μl
T4 DNA polymerase(NEB Catalog#:M0203L):2μl
T4 DNA ligase(NEB Catalog#:M0202L):4μl
10mM dNTP:0.5μl
双蒸水:6.5μl
总计:50μl
将上述DNA聚合酶反应体系在如下条件反应:12℃反应15min,随后25℃反应30min,得到含有测序接头序列的环化DNA;
3)DNA损伤修复酶修复
再将上述2)得到的50μl含有测序接头序列的环化DNA中加入如下各种DNA损伤修复酶:0.2μl DNA Polymerase I(E.coli,NEB Catalog#:M0209S),0.5μl UDG(NEBCatalog#:M0280S),0.3μl Fpg(NEB Catalog#:M0240S),0.3μl Endonuclease VIII(NEBCatalog#:M0299S),0.3μl Endonuclease IV(NEB Catalog#:M0304S)和0.3μl T4 PDG(NEBCatalog#:M0308S),37℃反应20min,得到修复后的DNA环化产物。
2、消化未环化的DNA文库
将上述步骤1得到的修复后的DNA环化产物后续操作分为两部分,一部分不进行处理,记作未经过外切酶消化DNA环化文库;
另一部分的DNA环化产物在75℃热失活20min后,向热失活处理后产物中加入外切酶进行消化未环化的DNA,得到完全环化的DNA测序文库。
上述消化体系如下:
上述热失活处理后产物:52μl
T7 Exonuclease(NEB Catalog#:M0263L):0.25μl
Exonuclease III(E.coli;NEB Catalog#:M0206):0.25μl
RecJf(NEB Catalog#:M0264L):0.25μl
Exonuclease I:0.25μl
总计:53μl
37℃反应30min;得到完全环化的DNA测序文库。
将未经过外切酶消化DNA环化文库和经过外切酶消化的完全环化的DNA测序文库分别添加双蒸水47μl至总体积为100μl后用Genomic DNA Clean&Concentrator-10(ZYMORESEARCH Catalog#:D4010)DNA回收纯化试剂盒回收,得到纯化的未经过外切酶消化DNA环化文库和纯化的完全环化的DNA测序文库。
得到人GM12878细胞系纯化的未经过外切酶消化DNA环化文库、人GM12878细胞系纯化的完全环化的DNA测序文库、黑腹果蝇的基因组DNA纯化的未经过外切酶消化DNA环化文库和黑腹果蝇的基因组DNA纯化的完全环化的DNA测序文库。
三、测序文库检测
将上述各种纯化的未经过外切酶消化DNA环化文库和纯化的完全环化的DNA测序文库分别使用Qubit高灵敏度DNA浓度测量试剂(ThermoFisher Scientific Catalog#:Q33230)测量文库浓度并计算建库环化效率。
建库环化效率=(纯化的完全环化的DNA测序文库/纯化的未经过外切酶消化DNA环化文库)x100%
将人GM12878细胞系和黑腹果蝇iso1参考品系的基因组DNA多次重复步骤一至三,唯一区别在于Tn5转座酶的用量不同;建库环化效率有些许差异,39.6%-51.7%(表1)。
表1常量基因组DNA(1μg)输入建库环化效率
不同建库实验组 人细胞系文库1 人细胞系文库2 果蝇文库1 果蝇文库2
Tn5转座酶复合物用量(μl) 2 4 4 6
建库环化效率 42.9% 51.7% 39.6% 44.9%
输入DNA长度越长,DNA损失越少,建库环化效率越高。在输入DNA长度有限的条件下,转座插入介导的DNA片段化过程中Tn5转座酶用量下降会导致最终测序文库长度增加;但转座反应后两侧均被Tn5转座酶复合物结合的DNA片段占比下降,导致建库过程中的DNA损失增加同时建库环化效率也下降。具体说来,提取的果蝇基因组DNA平均长度为50kb左右,低于人GM12878细胞系大于200kb的基因组DNA平均长度,所以在同样Tn5转座酶用量且最终文库长度较长(大于5kb)的条件下,黑腹果蝇基因组DNA的环化效率会低于人细胞系基因组DNA的建库环化效率。当黑腹果蝇的测序文库平均长度大于5kb时,建库环化效率随着文库长度的增加显著降低,而当文库平均长度为10kb时建库环化效率降低到20%左右,而人GM12878细胞系基因组DNA的10kb文库建库环化效率则依旧保持在40%以上。
实施例3、基于Tn5转座酶的少量(100ng)DNA输入的PacBio测序文库构建
一、含有发卡结构测序接头的转座酶复合物PC0的制备(图1A)
1、发卡结构测序接头序列的设计合成
人工合成发卡结构测序接头序列PC0如下:
PC0:
5'-pCTGTCTCTTATACACATCTATCTCTCTCTTTTCCTCCTCCTCCGTTGTTGTTGTTGAGAGAGATAGATGTGTATAAGAGACAG-3'(序列1)
其中,5'端末端加粗的19个碱基(图2,片段a)能与3'端末端加粗的19个碱基(片段c)以反向互补的方式形成发卡结构;5'端末端的19个碱基(片段a),3'端末端的19个碱基(片段c)的反向互补序列均为Tn5转座酶识别序列;中间45个碱基序列(片段b)为PacBio测序接头(其中互补的用下划线标出);片段a的5'末端第一位碱基磷酸化修饰。
人工合成上述发卡结构测序接头的序列。
2、含有发卡结构测序接头
将上述发卡结构测序接头的序列退火形成含有发卡结构测序接头PC0,具体条件如下:
退火体系:由2μM发卡结构测序接头的序列PC0和退火缓冲液组成;
退火缓冲液由10mM Tris-HCl(pH8.0)、1mM EDTA和水组成。
退火条件:94℃热变性5min,以每秒钟降低0.1℃的速度逐渐降温至15℃;
退火后含有发卡结构测序接头PC0的浓度为2μM。
3、制备含有发卡结构测序接头的转座酶复合物
将上述步骤2得到的含有发卡结构测序接头的转座酶复合物PC0与Tn5转座酶组装成为含有发卡结构测序接头PC0的转座酶复合物,具体组装体系如下:
PC0(2μM):2μl
10X TPS缓冲液:2μl
Tn5转座酶:2μl(1U/μl)
双蒸水:14μl
总计:20μl
组装条件:25℃反应30min
二、环化(图1B)
将上述步骤一得到的含有发卡结构测序接头的转座酶复合物通过转座反应分别插入待环化的3组100ng人GM12878细胞系的基因组DNA和2组100ng黑腹果蝇的基因组DNA,依次采用T4 DNA聚合酶和连接酶消除缺口并完成连接环化,最后加入各种DNA损伤修复酶修复不同类型的DNA损伤,得到修复后环化DNA文库。
1、修复后的环化DNA文库
1)转座插入反应:目的DNA片段化及测序接头插入连接。
体系如下:
上述步骤一得到的含有发卡结构测序接头的转座酶复合物:0.5μl
10x T4 DNA ligase buffer:2μl
DNA(100ng):10μl
双蒸水:至20μl
总计:20μl
上述DNA为待环化的3组100ng人GM12878细胞系的基因组DNA和2组100ng黑腹果蝇的基因组DNA中任一种。
上述转座插入反应体系置于55℃反应10min,得到转座反应产物;
再将转座反应产物加入0.5μl Exonuclease I和0.5μl Lambda Exonuclease在37℃消化10min;再加入1μl 1%SDS溶液室温25℃反应5min;再加入1μl 20%Triton X-100在室温25℃反应5min淬灭SDS,得到从Tn5转座酶复合物中释放的含有PacBio测序接头的未环化DNA,即为含有测序接头序列的DNA。
2)环化连接反应:目的是填补缺口,连接酶连接环化,修复DNA损伤。
DNA聚合酶反应体系如下:
步骤1)的含有测序接头序列的DNA:23μl
10x T4 DNA ligase buffer:1μl
T4 DNA polymerase:1μl
T7 DNA ligase(NEB Catalog#:M0318L):2μl
10mM dNTP:0.3μl
双蒸水:2.7μl
总计:30μl
上述连接条件:12℃反应15min;随后25℃反应30min,得到含有测序接头序列的环化DNA;
3)DNA损伤修复酶修复
再将上述2)得到的30μl含有测序接头序列的环化DNA中加入如下各种DNA损伤修复酶:0.1μl DNA Polymerase I,0.3μl UDG,0.15μl Fpg,0.15μl Endonuclease VIII,0.15μl Endonuclease IV和0.15μl T4 PDG,37℃反应20min,得到修复后的DNA测序文库。
2、消化未环化的DNA文库(此步骤可选择性跳过直接进入文库回收操作步骤)。
将上述步骤1得到的修复后的DNA环化产物后续操作分为两部分,一部分不作处理,记作未经外切酶消化的DNA环化文库;另一部分的DNA环化产物在75℃热失活20min后,向热失活处理后产物中加入外切酶进行消化未环化的DNA,得到完全环化的DNA测序文库。
上述消化体系如下:
上述热失活处理后产物:31μl
T7 Exonuclease:0.25μl
Exonuclease III:0.25μl
RecJf:0.25μl
Exonuclease I:0.25μl
总计:32μl
37℃反应30min;得到完全环化的DNA测序文库。
将未经过外切酶消化DNA环化文库和经过外切酶消化的完全环化的DNA测序文库分别添加双蒸水68μl至总体积为100μl后用Genomic DNA Clean&Concentrator-10(ZYMORESEARCH Catalog#:D4010)DNA回收纯化试剂盒回收,得到纯化的未经过外切酶消化DNA环化文库和纯化的完全环化的DNA测序文库。
得到3组人GM12878细胞系纯化的未经过外切酶消化DNA环化文库和2组黑腹果蝇的基因组DNA纯化的未经过外切酶消化DNA环化文库。
三、测序文库检测
对最终环化后未经外切酶消化直接回收的5组样品的PacBio测序文库分别采用PacBio Sequel II测序平台进行HiFi测序,数据产量均超过200Gb(表2),与常规大量(大于等于5ug)DNA输入的酶连接PacBio建库方法测序的数据产出量相仿。另外还对一个外切酶消化后的文库进行HiFi测序后数据产量达到306Gb。
表2测序数据产量
PacBio Sequel II平台HiFi测序文库 数据产量(Gb)
单只iso1雄性黑腹果蝇(约100ngDNA输入)HiFi文库1 279.8
单只iso1雄性黑腹果蝇(约100ngDNA输入)HiFi文库2 289.4
人GM12878细胞系100ng DNA输入HiFi文库1 245.4
人GM12878细胞系100ng DNA输入HiFi文库2 208.3
人GM12878细胞系100ng DNA输入HiFi文库3 364.1
实施例4、基于Tn5转座酶的多样品混合于同一测序芯片中进行PacBio测序的文库构建方法
一、多个含有不同DNA条形码的发卡结构测序接头转座酶复合物制备(图1A)
1.多个含有不同DNA条形码发卡结构测序接头序列的设计合成
人工合成多个发卡结构测序接头序列PC1-PC6(序列2-序列7)如下:PC1:
5'-pCTGTCTCTTATACACATCTTATGCTAATCTCTCTCTTTTCCTCCTCCTCCGTTGTTGTTGTTGA GAGAGATTAGCATAAGATGTGTATAAGAGACAG-3'
PC2:
5'-pCTGTCTCTTATACACATCTACACGTATCTCTCTCTTTTCCTCCTCCTCCGTTGTTGTTGTTGAG AGAGATACGTGTAGATGTGTATAAGAGACAG-3'
PC3:
5'-pCTGTCTCTTATACACATCTACATGCGATCTCTCTCTTTTCCTCCTCCTCCGTTGTTGTTGTTGA GAGAGATCGCATGTAGATGTGTATAAGAGACAG-3'
PC4:
5'-pCTGTCTCTTATACACATCTGACAGTGATCTCTCTCTTTTCCTCCTCCTCCGTTGTTGTTGTTGA GAGAGATCACTGTCAGATGTGTATAAGAGACAG-3'
PC5:
5'-pCTGTCTCTTATACACATCTGATCTCGATCTCTCTCTTTTCCTCCTCCTCCGTTGTTGTTGTTGA GAGAGATCGAGATCAGATGTGTATAAGAGACAG-3'
PC6:
5'-pCTGTCTCTTATACACATCTAGTCGCTATCTCTCTCTTTTCCTCCTCCTCCGTTGTTGTTGTTGA GAGAGATAGCGACTAGATGTGTATAAGAGACAG-3'
PC1-PC6中的每条序列5'末端加粗19个碱基(片段a的部分序列)与3'末端加粗的19个碱基(片段c的部分序列)以反向互补的方式形成发卡结构;且5'末端加粗的19个碱基(片段a的部分序列),3'末端加粗的19个碱基(片段c的部分序列)的反向互补序列均为Tn5转座酶识别序列;5'末端加粗的19个碱基(片段a的部分序列)之后与3'末端的加粗19个碱基(片段c的部分序列)之前部分序列(斜体)为全部或部分DNA条形码序列,DNA条形码序列可以包含部分Tn5识别序列(如PC2中,TACACGT);中间45个碱基序列(片段b)为PacBio测序接头(其中互补的用下划线标出),此处PC1-PC6序列为含有Tn5转座酶识别序列、不同DNA条形码和PacBio测序接头的发卡结构序列。
人工合成上述发卡结构测序接头的序列。
2、含有发卡结构测序接头
将上述发卡结构测序接头的序列分别退火形成含有发卡结构测序接头PC1-PC6,具体条件如下:
退火体系:2μM的PC1-PC6分别退火,退火缓冲液为由10mM Tris-HCl(pH 8.0)、1mMEDTA和水组成。
退火条件:94℃热变性5min,以每秒钟降低0.1℃的速度逐渐降温至15℃,得到PC1-PC6的浓度为2μM。
3、制备含有发卡结构测序接头的转座酶复合物
将上述步骤2得到的各种含有发卡结构测序接头PC1-PC6与Tn5转座酶分别组装成为含有不同DNA条形码序列发卡结构测序接头的转座酶复合物,具体组装体系如下:
PC1-PC6中任一种(2μM):2μl
10X TPS缓冲液:2μl
Tn5转座酶:2μl(1U/μl)
双蒸水:14μl
总计:20μl
组装条件:25℃反应30min
二、环化(图1B)
将上述步骤一得到的每种携带不同DNA条形码发卡结构测序接头的转座酶复合物分别插入不同单只黑腹果蝇的100ng基因组DNA,依次采用DNA聚合酶和连接酶消除缺口完成连接环化,最后加入各种DNA损伤修复酶修复不同类型的DNA损伤,得到6个含有不同DNA条形码的修复后环化DNA文库。
1.修复后环化DNA文库
1)转座插入反应:目的是DNA片段化及测序接头插入连接。
6个反应体系相同,体系如下:
上述步骤一得到的6种不同转座酶复合物之一:1μl
10x T4 DNA ligase buffer:2μl
DNA(100ng):10μl
双蒸水:7μl
总计:20μl
上述DNA为不同单只黑腹果蝇的100ng基因组DNA,且每个单只黑腹果蝇的100ng基因组DNA对应一个反应体系,对应一种转座酶复合物;
上述转座插入反应体系55℃反应10min,得到转座反应产物;
再将转座反应产物加入0.5μl Exonuclease I和0.5μl Lambda Exonuclease在37℃消化10min;再加入1μl 1%SDS溶液25℃反应5min;再用0.45x AMpure XP beads(BECMANCatalog#:A63881)回收,筛除掉小片段后得到6种20μl含有测序接头序列的DNA。
2)环化连接反应:目的是填补缺口,连接酶连接环化,修复DNA损伤。
共6管第一步反应,
DNA聚合酶反应体系如下:
每管步骤1)的含有测序接头序列的DNA:20μl
10x T4 DNA ligase buffer:3μl
T4 DNA polymerase:1μl
T4 DNA ligase:2μl
10mM dNTP:0.3μl
双蒸水:3.7μl
总计:30μl
上述连接条件:12℃反应15min,16℃反应30min,得到6种含有测序接头序列的环化DNA;
3)DNA损伤修复酶修复
再将上述2)得到的30μl含有测序接头序列的环化DNA中加入如下各种DNA损伤修复酶:0.1μl DNA Polymerase I,0.3μl UDG,0.15μl Fpg,0.15μl Endonuclease VIII,0.15μl Endonuclease IV和0.15μl T4 PDG,37℃反应20min,得到修复后的6个DNA文库。
2、消化未环化的DNA
将上述步骤1得到的6管修复后的DNA环化产物先在75℃热失活20min,得到热失活处理后产物;向热失活处理后产物中加入如下酶消化未环化的DNA,得到6管完全环化的DNA文库。
上述消化体系如下:
每管上述第二步产物热失活处理后产物:31μl
T7 Exonuclease:0.25μl
Exonuclease III:0.25μl
RecJf:0.25μl
Exonuclease I:0.25μl
总计:32μl
37℃反应30min。
三、测序文库检测
将含有不同DNA条形码序列标记的6个完全环化的PacBio测序文库混合,用Genomic DNA Clean&Concentrator-10回收纯化试剂盒得到高纯度的PacBio测序文库,可直接应用于PacBio的HiFi测序。得到了大于242.5Gb的测序数据,处理得到高精度CCS序列。之后根据合成的CCS读长序列两端的DNA条形码序列,区分来自不同样品的读长序列,进而实现数据分离。
按照不同的DNA条形码可以将其区分为6组不同的数据集,分别对应于6只黑腹果蝇的基因组DNA,分配率为91.6%,与大量DNA输入的多样品合并测序的分配率(大于90%)接近。
综上所述,本发明的方法实现了对常量(1μg人细胞系及果蝇基因组DNA)及少量DNA(100ng人细胞系及100ng单只黑腹果蝇基因组DNA)的PacBio测序文库构建,并对100ng人细胞系及100ng单只黑腹果蝇基因组DNA输入的建库结果进行PacBio HiFi测序,其数据产出量接近于常规大量DNA输入的PacBio测序建库方法。
以上所述实例仅是为充分说明本发明而所举的少数实例,本发明的保护范围不限于此;本技术领域相关人员在本发明基础上所作的等同或类似替代或变换,均在本发明的保护范围之内。
SEQUENCE LISTING
<110>中国科学院动物研究所
<120> 一种用于PacBio测序的文库构建方法
<160> 7
<170> PatentIn version 3.5
<210> 1
<211> 83
<212> DNA
<213> Artificial sequence
<400> 1
ctgtctctta tacacatcta tctctctctt ttcctcctcc tccgttgttg ttgttgagag 60
agatagatgt gtataagaga cag 83
<210> 2
<211> 97
<212> DNA
<213> Artificial sequence
<400> 2
ctgtctctta tacacatctt atgctaatct ctctcttttc ctcctcctcc gttgttgttg 60
ttgagagaga ttagcataag atgtgtataa gagacag 97
<210> 3
<211> 95
<212> DNA
<213> Artificial sequence
<400> 3
ctgtctctta tacacatcta cacgtatctc tctcttttcc tcctcctccg ttgttgttgt 60
tgagagagat acgtgtagat gtgtataaga gacag 95
<210> 4
<211> 97
<212> DNA
<213> Artificial sequence
<400> 4
ctgtctctta tacacatcta catgcgatct ctctcttttc ctcctcctcc gttgttgttg 60
ttgagagaga tcgcatgtag atgtgtataa gagacag 97
<210> 5
<211> 97
<212> DNA
<213> Artificial sequence
<400> 5
ctgtctctta tacacatctg acagtgatct ctctcttttc ctcctcctcc gttgttgttg 60
ttgagagaga tcactgtcag atgtgtataa gagacag 97
<210> 6
<211> 97
<212> DNA
<213> Artificial sequence
<400> 6
ctgtctctta tacacatctg atctcgatct ctctcttttc ctcctcctcc gttgttgttg 60
ttgagagaga tcgagatcag atgtgtataa gagacag 97
<210> 7
<211> 97
<212> DNA
<213> Artificial sequence
<400> 7
ctgtctctta tacacatcta gtcgctatct ctctcttttc ctcctcctcc gttgttgttg 60
ttgagagaga tagcgactag atgtgtataa gagacag 97

Claims (10)

1.一种PacBio测序文库构建方法,包括如下步骤:
1)制备含有发卡结构测序接头的转座酶复合物;
所述含有发卡结构测序接头的转座酶复合物由含有发卡结构测序接头与转座酶组装得到;
所述含有发卡结构测序接头为将发卡结构测序接头序列退火形成;
所述发卡结构测序接头序列从5'端起依次由片段a、片段b和片段c组成;所述片段a和所述片段c反向互补;
所述片段a包括转座酶识别序列;
所述片段b包括PacBio测序文库的测序接头序列,且所述片段b不与所述片段a相同或互补;
2)将所述含有发卡结构测序接头的转座酶复合物通过转座反应插入目标DNA分子中,得到转座反应产物;
3)将所述转座反应产物依次进行环化连接和DNA损伤修复,得到环化的DNA测序文库;即为PacBio测序文库。
2.根据权利要求1所述的方法,其特征在于:所述步骤2)和步骤3)均在同一缓冲液中进行。
3.根据权利要求2所述的方法,其特征在于:所述缓冲液为T4 DNA连接酶缓冲液或其他缓冲液。
4.根据权利要求1-3中任一所述的方法,其特征在于:
所述环化连接所需的酶为DNA连接酶和DNA聚合酶;
或,所述DNA损伤修复所需的酶为DNA修复酶。
5.根据权利要求1-3任一所述的方法,其特征在于:
若所述目标DNA分子为多个目标DNA样品,且高通量同时测序,则在所述方法中进行如下改变:
步骤1)中,在每个所述发卡结构测序接头序列的片段a中引入用于区分不同目标DNA样品的DNA条形码序列;
每个所述目标DNA样品对应一个所述发卡结构测序接头序列;每个所述发卡结构测序接头序列中仅所述DNA条形码序列不同;
步骤3)得到的多个目标DNA样品对应的环化的DNA测序文库混匀,得到混合的PacBio测序文库。
6.根据权利要求1-3任一所述的方法,其特征在于:所述转座酶为Tn5转座酶。
7.根据权利要求1-3任一所述的方法,其特征在于:
所述目标DNA分子为长片段DNA;
或,所述长片段DNA长度大于等于1kb;
或,步骤2)中,所述目标DNA分子在所述转座反应的体系中的量如下:大于等于20ng。
8.权利要求1-7任一所述方法在长片段PacBio测序中的应用;
或,权利要求1-7任一所述方法在滚环复制扩增环化DNA中的应用。
9.一种对目标DNA分子进行PacBio测序的方法,对权利要求1-7任一所述方法得到的PacBio测序文库进行PacBio测序。
10.一种长片段PacBio测序的试剂盒,包括权利要求1-7任一所述方法中的所述发卡结构测序接头序列和能与其结合的转座酶。
CN202110042549.7A 2020-01-20 2021-01-13 一种用于PacBio测序的文库构建方法 Active CN113136416B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2020100633090 2020-01-20
CN202010063309 2020-01-20

Publications (2)

Publication Number Publication Date
CN113136416A CN113136416A (zh) 2021-07-20
CN113136416B true CN113136416B (zh) 2022-05-17

Family

ID=76810080

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110042549.7A Active CN113136416B (zh) 2020-01-20 2021-01-13 一种用于PacBio测序的文库构建方法

Country Status (1)

Country Link
CN (1) CN113136416B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114774411B (zh) * 2022-06-16 2022-10-21 序康医疗科技(苏州)有限公司 大片段dna环化连接方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105525357A (zh) * 2014-09-30 2016-04-27 深圳华大基因股份有限公司 一种测序文库的构建方法及试剂盒和应用
CN109207572A (zh) * 2018-09-29 2019-01-15 苏州贝康医疗器械有限公司 单细胞高通量测序文库构建方法及其试剂盒
CN109750086A (zh) * 2017-11-06 2019-05-14 深圳华大智造科技有限公司 单链环状文库的构建方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105525357A (zh) * 2014-09-30 2016-04-27 深圳华大基因股份有限公司 一种测序文库的构建方法及试剂盒和应用
CN109750086A (zh) * 2017-11-06 2019-05-14 深圳华大智造科技有限公司 单链环状文库的构建方法
CN109207572A (zh) * 2018-09-29 2019-01-15 苏州贝康医疗器械有限公司 单细胞高通量测序文库构建方法及其试剂盒

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
A New Way to Discover IRESs in Pathology or Stress Conditions? Harnessing Latest High-Throughput Technologies;Lei-Yun Wang et al.;《BioEssays》;20191231;全文 *
New Approaches for Genome Assembly and Scaffolding;Edward S. Rice and Richard E. Green;《Annu. Rev. Anim. Biosci.》;20191115;全文 *

Also Published As

Publication number Publication date
CN113136416A (zh) 2021-07-20

Similar Documents

Publication Publication Date Title
US20250109426A1 (en) Compositions and methods for targeted depletion, enrichment, and partitioning of nucleic acids using crispr/cas system proteins
EP3386550B1 (en) Methods for the making and using of guide nucleic acids
EP2423325B1 (en) Method of preparing libraries of template polynucleotides
US20100222238A1 (en) Asymmetrical Adapters And Methods Of Use Thereof
CN101641449B (zh) 用于多态性的高通量鉴定和检测的策略
US20250179477A1 (en) Creation and use of guide nucleic acids
CN110699426B (zh) 基因目标区域富集方法及试剂盒
US11274333B2 (en) Compositions and methods for preparing sequencing libraries
US20250066767A1 (en) Compositions and methods for making guide nucleic acids
CN110607353B (zh) 一种利用高效地连接技术快速制备dna测序文库的方法和试剂盒
CN110012671A (zh) Ngs文库浓度的标准化
CN107475779A (zh) 适用于单细胞rrbs测序的文库建立方法及其应用
WO2021253372A1 (zh) 一种高兼容性的PCR-free建库和测序方法
CN113136416B (zh) 一种用于PacBio测序的文库构建方法
KR20210110790A (ko) 외가닥 dna의 합성방법
CN112176422B (zh) Rna文库的构建方法
CN117487884B (zh) 一种高样品利用率的基于转座酶的测序文库构建方法及相关寡核苷酸
CN119331953A (zh) 一种去除总RNA中的核糖体RNA(rRNA)的方法以及其试剂盒
HK40014831A (zh) 制备模板多核苷酸的文库的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant