CN111455031A

CN111455031A - 基于Nanopore测序技术的多组学测序及分析方法

Info

Publication number: CN111455031A
Application number: CN201910048654.4A
Authority: CN
Inventors: 王军; 赵娜; 陈亮; 徐嘉悦; 于莹; 李亦嘉; 徐西占; 许亚昆
Original assignee: Institute of Microbiology of CAS
Current assignee: Institute of Microbiology of CAS
Priority date: 2019-01-18
Filing date: 2019-01-18
Publication date: 2020-07-28

Abstract

本发明提供一种基于Nanopore测序技术的多组学测序及分析方法，包括：A、将采集的样本同时进行DNA和RNA提取；B、提取的RNA 3′端添加Poly U尾巴；C、将带有Poly U尾巴的RNA反转录成cDNA，并在其5′端添加MID条形码序列；D、将cDNA样品与DNA样品混合建库，进行Nanopore测序；E、将测序数据中所有cDNA表达量水平按照DNA进行均一化处理；F、对测序数据中全基因组甲基化信号进行读取与分析。本发明在实现基因组测序的基础上，同时还能够实现转录组以及表观甲基化组检测，并达到宏转录组、宏基因组以及表观甲基化组的多组学关联分析的目的。

Description

基于Nanopore测序技术的多组学测序及分析方法

技术领域

本发明涉及组学领域，具体地说，涉及基于Nanopore测序技术的多组学测序及分析方法。

背景技术

宿主实际上是由宿主自身与共生菌群共同组成的超级生态系统，在宿主的皮肤表面、呼吸系统、生殖系统都生活着复杂的共生菌的群落，而肠道系统内的菌群数量和种类则更加庞大；以人类为例，多个研究表明肠道内有多达几百种细菌，其细胞总量超过人类本身的细胞数量，而这些不同的细菌所包含的基因多样性也要远远超过人类。一系列研究表明菌群在健康和疾病的发生中发挥着重要作用，多种慢性代谢疾病、免疫系统疾病、肝病、中枢神经系统疾病及传染病的发生都与菌群失调存在关联，研究人员据此提出了“肠肝轴”、“肠脑轴”和“肠肺轴”等生理学关联假说。

随着二代测序技术的兴起，世界各国在菌群研究中取得了飞速发展，从最初的454平台到Illumina Hiseq和Miseq平台，能够为我们提供越来越多的菌群扩增子数据信息、宏基因组数据以及宏转录组数据。

随着菌群研究的深入，越来越多的研究表明，细菌16S转录本或宏转录组可以揭示更多实际功能；更易发现疾病和健康人之间的微生物功能的不同。传统观点认为，细菌表观甲基化组可以防御外源DNA，此外，DNA甲基化在DNA错配修复，基因表达等方面也发挥了重要作用，最近研究发现，致病菌DNA甲基化还在致病性和传播方面发挥重要作用。但是二代高通量测序技术由于存在技术瓶颈，因此无法实现全基因组水平表观甲基化的完整分析。

传统DNA甲基化的检测方法按照原理可分为以下几类：一是用甲基化敏感的限制性内切酶鉴定DNA甲基化的差异；二是用重亚硫酸盐处理DNA，经PCR及测序技术鉴定序列差异性，未甲基化的胞嘧啶经重亚硫酸盐处理会变为尿嘧啶，在PCR测序过程中会被读成胸腺嘧啶，但甲基化的胞嘧啶不受影响，这个方法的缺点是只能够检测胞嘧啶甲基化。三是使用变性高效液相色谱(denaturing high performance liquid chromatography，DHPLC)或DHPLC与PCR技术联用分析DNA分子，检测基因组的甲基化程度；四是用免疫化学法如单克隆抗体anti-6mA、anti-4mC检测特定位点的甲基化。这些方法均不能满足全基因组所有甲基化水平检测的需求。以Pacbio和 Nanopore单分子测序为代表的三代测序技术的兴起不仅在测序读长上为我们提供很大优势，例如二代Illumina测序单条序列的长度较短(2×250bp)，不能够在宏基因组组装时生成大的contig，N50一般在几十个kb左右；同时，这样的序列长度也不足以发现较大的结构变异(如拷贝数变异)和较大的结构变异(如插入或缺失)，而三代 Pacbio测序及Nanopore测序的平均读长分别为10kb和几十kb，与二代测序相比能够更好地减少拼接错误；重要的是，以Pacbio测序及Nanopore测序为代表的三代测序技术可以识别基因组上的甲基化信号。例如，Pacbio通过读取碱基两个相邻的脉冲峰之间的距离和参考序列的距离之间的比值来区分甲基化信号；Nanopore单分子测序则通过捕获核酸通过纳米孔的电压变化，来区分修饰碱基。因此三代测序使得在全基因组水平上绘制表观甲基化组成为可能。

传统对特定物种整体转录水平研究及全基因组水平的基因表达差异研究的方法主要依赖二代高通量测序技术的RNA-seq，此技术通过对样本中总RNA的提取，分离 mRNA后利用超声波进行片段化，建库后上机测序，能够在单核苷酸水平对特定物种的整体转录活动进行检测，从而全面快速地获得该物种在某一状态下的几乎全部转录本信息。与传统技术相比，具有定量更准确、可重复性更高、检测范围更广、分析更可靠等特点，一直以来被用于新的转录本的发现、基因表达量和不同样本间差异表达等研究领域。但是目前针对不同样品测序量的差异，一般所采用的标准化方式是计算Transcripts Per Kilobase ofexon model per Million mapped reads(TPM)，即先对每个基因的read数用基因的长度进行校正，再用校正后该基因read数与矫正后该样本的所有read数求商。这种计算方式的缺点是容易受到极高表达且在不同样品中存在差异表达的基因的影响，基因的打开或关闭会影响到细胞中总的分子数目，可能导致基因标准化之后就不存在很大差异了，而原本没有差异的基因标准化之后却有差异了。由于DNA在同一细胞中的总分子是一定的，因此如果能够同时对DNA和 RNA/cDNA样品同时进行测序，通过DNA对cDNA绝对量进行矫正，则能够很大程度上避免这种误差。

发明内容

本发明的目的是提供一种基于Nanopore测序技术的多组学测序及分析方法。

为了实现本发明目的，第一方面，本发明提供一种基于Nanopore测序技术的多组学测序及分析方法，包括以下步骤：

A、将采集的样本同时进行DNA和RNA提取；

B、提取的RNA 3′端添加Poly U尾巴；

C、将带有Poly U尾巴的RNA反转录成cDNA，然后在其5′端添加MID条形码序列；

D、将步骤C得到的cDNA样品与步骤A得到的DNA样品混合建库，并进行 Nanopore测序；

E、将测序数据中所有cDNA表达量水平按照DNA进行均一化处理；

F、对测序数据中全基因组甲基化信号进行读取与分析。

前述的方法，步骤C中所述MID条形码序列(包括MID01～MID12，SEQ ID NO:1-12)见表1：

表1

前述的方法，步骤D具体操作如下：

1.DNA/cDNA末端修复

1)配制如下反应体系：

混匀后，短暂离心；

将上述反应体系转移至离心管(1.5mL离心管)中，20℃和65℃(金属浴)依次孵育5min；

2)磁珠纯化

将磁珠(Agencourt AMPure XP，Beckman Coulter)提前放置于室温，充分震荡混匀，重悬磁珠；向上述离心管中加入108μL重悬的(AMPure XP)磁珠，温和吹吸混匀；

室温下(于垂直转子混匀器内)孵育5min；

将离心管放置在磁珠架上，室温静置5min直至溶液变澄清；

弃上清液(注意避免吸入磁珠)，加入200μL 70％乙醇溶液(新鲜配制)，室温静置30秒，弃乙醇溶液，再用70％乙醇溶液重复清洗两次(此步骤在磁珠架上操作)；

清洗后将残留液体吸干(注意避免吸入磁珠)，室温晾干磁珠(避免磁珠出现裂缝)；

取下离心管，加入15μL nuclease-free水重悬磁珠，室温静置2min；

将离心管放置在磁珠架上，室温静置直至溶液(水洗脱液)变清亮；

吸取14μL的上清液于一个新的离心管(1.5mL离心管)中。

用Qubit fluorometer对DNA/cDNA浓度进行定量，保证总量>700ng。

2.末端补平和加dA尾

1)反应体系及反应条件

将以下反应试剂加入0.2mL反应管中：

移液器温和吹吸混匀，室温孵育10min。

2)磁珠纯化

DNA(带有不同MID序列的样品12个)和cDNA(带有不同MID序列的样品12个) 样品共24个混合加入一个新的离心管(1.5mL离心管)中，磁珠(Agencourt AMPure XP)纯化参照上述方法进行，最后用38μL nuclease-free水洗脱，吸取36μL上清液于新的离心管(1.5mL离心管)中，用Qubit fluorometer进行定量，确保样品总质量不少于700ng。

3.加接头

1)配制如下反应体系：

移液器温和吹吸混匀，室温孵育10min。

2)磁珠纯化

Agencourt AMPure XP磁珠纯化，参照上述方法进行，期间无须用乙醇清洗，换做试剂盒中Adapter Bead Binding Buffer(ABB)清洗一次，最后用15μL试剂盒中ElutionBuffer(ELB)洗脱，并用Qubit fluorometer进行定量，确保总的样品质量约为430ng。

4.建库及上机测序

1)配制如下起始缓冲液：

Running Buffer FM(RBF) 576μL

Nuclease-free水 624μL

总计 1200μL

温和吹吸混匀后将800μL起始缓冲液加入测序芯片priming port中，室温孵育5min。

2)文库准备

3)上机测序

将200μL起始缓冲液加入sample port中，避免引入气泡；

将75μL文库加入sample port中(温和吹吸混匀并逐滴加入)，先后将sample port和priming port关闭，开始测序。

前述的方法，步骤E中根据测序结果中获得的n个样本的转录组和基因组数据，对所有cDNA表达量水平按照DNA进行均一化处理的具体方法如下：

①分别计算基因组上基因i的覆盖度N_1i，N_2i，N_3i，…N_ni，并获得DNA分子数的绝对定量min(N_1i，N_2i，N_3i，…N_ni)；

②分别计算n个重复样本对应基因的TPM值，即TPM_1i，TPM_2i，TPM_3i，…TPM_ni；

③通过DNA的真实分子数均一化cDNA的TPM值，从而得到每个基因校正后的 TPM值，即Nomalized TPM_ji＝TPM_ji/(N_ji/min(N_1i，N_2i，N_3i，…N_ni))，j＝1,2,3…n。

其中，TPMji表示cDNA校正后的TPM值；i表示基因组上的第i个基因；min表示最小值；j表示第j个样本；N_ji表示第j个样本基因组上第i个基因的覆盖度。

在本发明的一个具体实施方式中，利用Nanopore测序技术同时检测同一样品野生型和敲除型的转录组和基因组，每个样本三个生物学重复，实现DNA和RNA的同时检测，因而可以对RNA中每个基因覆盖度基于DNA文库中相应文库的覆盖层数进行校正后，再进行差异分析。具体方法如下：

(1)分别计算三个重复样本基因组每个基因的覆盖度N_1i，N_2i，N_3i，并获得DNA 分子数的绝对定量min(N_1i，N_2i，N_3i)；

(2)分别计算三个重复样本对应基因的TPM值，即TPM_1i，TPM_2i，TPM_3i；

(3)通过DNA的真实分子数均一化RNA的TPM值，从而得到每个基因校正后的 TPM值，即Nomalized TPM_ji＝TPM_ji/(N_ji/min(N_1i，N_2i，N_3i))，j＝1,2,3。

其中，TPM_ji表示cDNA校正后的TPM值；i表示基因组上的第i个基因；min表示最小值；j表示第j个样本；N_ji表示第j个样本基因组上第i个基因的覆盖度。

前述的方法，步骤F所述甲基化信号包括但不限于5mC和6mA。

本发明中，所述样本可来自植物、动物、微生物及其周围的环境。

第二方面，本发明提供上述基于Nanopore测序技术的多组学测序及分析方法的以下任一应用：

i.实现复杂生境微生物组样品中，单菌比例、单菌活力以及单菌单基因的绝对表达量的测定；

ii.实现宿主细胞、真核原核生物或真菌，通过与原核微生物进行区分，完成活力检测以及单个基因的表达量测定；

iii.跨门或跨种的互作研究，实现包括胞内寄生菌在内的细菌与细菌间丰度比例和/或基因表达上的差异分析；

iv.实现DNA病毒、RNA病毒或噬菌体的直接检测；

v.噬菌体溶源性和裂解性状态的确定；

vi.建立人基因组水平上的DNA变异(SNP、SV、CNV)基线数据、宏甲基化基线数据以及宏转录组数据，进行三者的关联分析(尤其是甲基化对转录影响)；以及疾病过程中三者的变化情况。

借由上述技术方案，本发明至少具有下列优点及有益效果：

本发明提供的基于Nanopore测序技术的多组学测序及分析方法，在实现基因组测序的基础上，同时还能够实现转录组以及表观甲基化组检测，并且达到宏转录组、宏基因组以及表观甲基化组的多组学关联分析的目的。不仅可以实现单核苷酸水平对特定物中的整体基因拷贝数及整体转录活动进行检测，获得全部转录本信息，而且经过关联分析，能够弥补RNA-seq转录本测序在基因表达计算上的误差，极大程度降低了由于极高表达且在不同样品中存在差异表达的基因的影响。就本发明具体实例而言，利用本发明提供的多组学测序技术，通过与传统RNA-seq样本间差异分析方法的结果相比较，DNA文库进行校正后，可以减少30％左右假阳性和假阴性的差异基因[指数期：29.71％(279/939)；平台期：31.29％(311/994)]。具体来说：

(一)可有效减少传统RNA-seq分析方法所获结果的3％～5％差异基因的假阳性率[指数期：3.73％(35/939)；平台期：5.43％(54/994)]。即不进行均一化有表达差异的，经均一化处理后实际没有表达差异(图4A)。

(二)可以更敏感的检测到传统RNA-seq分析方法所获结果中没有差异表达的约26％基因的假阴性率[指数期：25.99％(244/939)；平台期：25.86％(257/994)]。即不进行均一化没有表达差异的，经均一化处理后实际有表达差异(图4B)。

本发明有望用于健康疾病人群/模型中的差异分析。同时通过对RNA进行Poly U尾巴的添加能够根据是否含有Poly A，实现复杂生境中真核与原核的区分，通过12 条MID可以实现样本的区分。

附图说明

图1为本发明较佳实施例中WT和KO菌株的生长曲线(OD₆₀₀)。

图2为本发明较佳实施例中WT和KO菌株在指数增长期(A)和平台期(B) Nanopore单分子测序密度覆盖曲线。

图3为本发明较佳实施例中通过DNA对RNA/cDNA绝对量进行矫正(RNA表达量热图)，结果显示WT和KO菌株在指数增长期(A)和平台期(B)的基因表达情况相对比较稳定。

图4为本发明较佳实施例中基于DNA均一化cDNA表达量的校正后的差异基因表达情况。其中，A：传统方法有显著差异的基因均一化后表现为没有显著差异的基因表达情况(假阳性)；B：传统方法没有显著差异的基因均一化后表现为显著差异的基因表达情况(假阴性)。

图5为本发明较佳实施例中WT和KO菌株在指数增长期和平台期6mA甲基化修饰情况。其中，A：指数增长期6mA甲基化修饰情况；B：平台期6mA甲基化修饰情况。

图6为本发明较佳实施例中WT和KO菌株在指数增长期和平台期5mC甲基化修饰情况。其中，A：指数增长期5mC甲基化修饰情况；B：平台期5mC甲基化修饰情况。

图7为本发明较佳实施例中WT和KO菌株平台期与指数增长期5mC甲基化比例。其中，A：WT菌株平台期和指数增长期5mC甲基化比例；B：KO菌株平台期和指数增长期5mC甲基化比例。

图8为本发明较佳实施例中WT菌株5mC甲基化motif预测结果。其中，A：WT菌株指数增长期motif预测；B：WT菌株平台期motif预测。

具体实施方式

以下实施例用于说明本发明，但不用来限制本发明的范围。若未特别指明，实施例中所用的技术手段为本领域技术人员所熟知的常规手段，所用原料均为市售商品。

本发明中，Native Barcode、BAM 1D来自EXP-NBD103试剂盒，购自OxfordNanopore Technologies公司。

ELB、RBF、ABB、LLB来自SQK-LSK108试剂盒，购自Oxford Nanopore Technologies公司。

NEXTflex^TM Ligase Enzyme Mix来自NEXTflex^TMRapid DNA-Seq Kit试剂盒，购自Bioo Scientific公司。

UltraⅡEnd-prep reaction buffer和UltraⅡEnd-prep enzyme mix来自NEBNext Ultra End Repair/dA-Tailing Module试剂盒，购自NEB technology公司。

Blunt/TA Ligase Master Mix购自NEB technology公司。

本发明中使用的Nanopore测序仪购自Oxford Nanopore Technologies，型号为FLO-MIN106测序芯片。

实施例1基于Nanopore测序技术的多组学测序及分析方法

以E.coli菌株K12(WT野生菌株)和6个内源限制修饰系统缺失的EC135菌株(KO 敲除菌株，参见ZL201210080124.6)为实验对象，通过绘制生长曲线(图1)，挑选指数增长期时的4h和平台期的13h分别进行以下操作。

1、在维持样本中核酸原有比例的基础上，分别对WT菌株和KO菌株的两个时期样品(各3个生物学重复，共计12个样本)进行DNA和RNA的同时提取。所用试剂盒为

Bacterial DNA/RNA/Protein kit(Qiagen，货号：47054)。

2、对RNA样品添加Poly U尾巴

用E.coli PloyU polymerase(NEB technology，货号：M0337S)和UTP(TAKARA，货号：4044)对总RNA 3’端进行标记，实现与DNA的区分。

3、将带有Poly U尾巴的RNA反转录成cDNA，并在其5′端添加MID条形码序列，用于区分测序后样本信息。

所述MID条形码序列见表1。

4、将步骤3得到的cDNA样品与步骤1得到的DNA样品混合建库，并进行Nanopore 测序。建库及上机的具体方法如下：

1)DNA/cDNA末端修复

a)反应体系及反应条件

温和混匀，并短暂离心；

将样品转移至1.5mL离心管中，金属浴20℃和65℃依次孵育5min；

b)磁珠纯化

将Agencourt AMPure XP磁珠(Beckman Coulter)提前放置于室温，充分震荡混匀；

加入108μL重悬的AMPure XP磁珠，温和吹吸混匀；

室温下垂直转子混匀器孵育5min；

将离心管放置在磁珠架上，室温静置5min直至溶液变澄清；

弃上清液，注意避免吸入磁珠；

加入200μL现配的70％乙醇溶液，室温静置30秒，弃乙醇溶液(此步骤在磁珠架上操作)；

重复上一步骤，完成两次乙醇清洗；

短暂离心，把离心管壁上的溶液离心下来，用20μL移液器将剩下的溶液吸干，注意避免吸入磁珠；

室温晾干磁珠30s。避免磁珠出现裂缝；

取下离心管，加入15μL nuclease-free水温和吹吸使磁珠悬浮(用水洗脱)，室温静置2min；

将离心管放置磁珠架上，室温静置直至洗脱液变清亮；

吸取14μL的上清液于新的1.5mL离心管中。

用Qubit fluorometer对DNA/cDNA浓度进行定量，保证总量>700ng。

2)末端补平&dA尾

a)反应体系及反应条件

将以下反应试剂加入0.2mL反应管中：

移液器温和吹吸混匀，室温孵育10min。

b)磁珠纯化

DNA(带有不同MID序列的样品12个)和cDNA(带有不同MID序列的样品12个) 样品共24个混合加入一个新的1.5mL离心管中，Agencourt AMPure XP磁珠纯化，参照上述方法进行，最后用38μL nuclease-free水洗脱，吸取36μL上清液于新的1.5mL 离心管中，并用Qubit fluorometer进行定量，确保总的样品质量不少于700ng。

3)加接头

a)反应体系及反应条件

移液器温和吹吸混匀，室温孵育10min。

b)磁珠纯化

磁珠(Agencourt AMPure XP)纯化参照上述方法进行，期间无须用乙醇清洗，换用试剂盒中Adapter Bead Binding Buffer(ABB)清洗一次，然后用15μL试剂盒中 ElutionBuffer(ELB)洗脱，用Qubit fluorometer进行定量，确保总的样品质量为430ng 左右。

4)建库及上机测序

a)测序芯片起始缓冲液

Running Buffer FM(RBF) 576μL

Nuclease-free水 624μL

总计 1200μL

温和吹吸混匀后将800μL上述起始缓冲液加入测序芯片priming port中，室温孵育 5min。

b)文库准备

c)上机测序

将200μL起始缓冲液加入sample port中，避免引入气泡；

将75μL文库温和吹吸混匀并逐滴加入sample port中，先后将sample port和priming port关闭，开始测序。

Nanopore单分子测序密度覆盖曲线结果显示(图2)，WT和KO菌株在指数增长期(A)和平台期(B)，分别能达到25×左右的coverage。

5、将测序数据中所有cDNA表达量水平按照DNA进行均一化处理。具体如下：

本发明中利用Nanopore测序技术同时检测同一样品野生型和敲除型的转录组和基因组，每个样品三个生物学重复，实现DNA和RNA的同时检测，因而可以对RNA 中每个基因覆盖度基于DNA文库中相应文库的覆盖层数进行校正后，再进行差异分析。具体方法如下：

1)分别计算三个重复样本基因组每个基因的覆盖度N_1i，N_2i，N_3i，并获得DNA 分子数的绝对定量min(N_1i，N_2i，N_3i)；

2)分别计算三个重复样本对应基因的TPM值，即TPM_1i，TPM_2i，TPM_3i；

3)通过DNA的真实分子数均一化RNA的TPM值，从而得到每个基因校正后的 TPM值，即Nomalized TPM_ji＝TPM_ji/(N_ji/min(N_1i，N_2i，N_3i))，j＝1,2,3；

通过与单独使用RNA进行样本间差异分析的结果相比较，基于DNA文库进行校正后，图3结果显示WT和KO菌株在指数增长期(A)和平台期(B)的基因表达情况相对比较稳定。并且可以减少30％左右假阳性和假阴性的差异基因[指数期：29.71％ (279/939)；平台期：31.29％(311/994)]，具体来说：

(1)可有效减少传统RNA-seq方法获得的3％～5％差异基因的假阳性率[指数期：3.73％(35/939)；平台期：5.43％(54/994)]。即不进行均一化有表达差异的，均一化以后实际没有表达差异(图4A)；

(2)可以更敏感地检测到传统RNA-seq方法没有差异表达的约26％基因的假阴性率[指数期：25.99％(244/939)；平台期：25.86％(257/994)]。即不进行均一化没有表达差异的，均一化以后实际有表达差异(图4B)。

6、对测序数据中全基因组甲基化信号进行读取与分析。

全基因组表观甲基化分析显示WT和KO菌株甲基化水平有明显不同。WT和KO 菌株在指数增长期(A)和平台期(B)的6mA甲基化修饰情况见图5；WT和KO菌株在指数增长期(A)和平台期(B)的5mC甲基化修饰情况见图6。据文献报道，三代 Pacbio单分子实时测序对5mC甲基化的检测阈值较高，因此不易检测到5mC甲基化修饰，与此不同，我们的结果显示Nanpore单分子测序可以对5mC甲基化修饰实现非常好的检测(图6)。此外，WT和KO菌株在细菌生长的不同时期也表现出不同的5mC 甲基化修饰特征(图7)。而且在WT菌株中，我们可以预测到5mC甲基化的motif集中富集为5’-CCWGG-3’，也与文献报道一致(图8)。

虽然，上文中已经用一般性说明及具体实施方案对本发明作了详尽的描述，但在本发明基础上，可以对之做一些修改或改进，这对本领域技术人员而言是显而易见的。因此，在不偏离本发明精神的基础上所做的这些修改或改进，均属于本发明要求保护的范围。

序列表

<110> 中国科学院微生物研究所

<120> 基于Nanopore测序技术的多组学测序及分析方法

<130> KHP181119035.9

<160> 12

<170> SIPOSequenceListing 1.0

<210> 1

<211> 59

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 1

aaggttaaca caaagacacc gacaactttc ttcagcacct aaaaaaaaaa aaaaaaaaa 59

<210> 2

<211> 59

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 2

aaggttaaac agacgactac aaacggaatc gacagcacct aaaaaaaaaa aaaaaaaaa 59

<210> 3

<211> 59

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 3

aaggttaacc tggtaactgg gacacaagac tccagcacct aaaaaaaaaa aaaaaaaaa 59

<210> 4

<211> 59

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 4

aaggttaata gggaaacacg atagaatccg aacagcacct aaaaaaaaaa aaaaaaaaa 59

<210> 5

<211> 59

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 5

aaggttaaaa ggttacacaa accctggaca agcagcacct aaaaaaaaaa aaaaaaaaa 59

<210> 6

<211> 59

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 6

aaggttaaga ctactttctg cctttgcgag aacagcacct aaaaaaaaaa aaaaaaaaa 59

<210> 7

<211> 59

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 7

aaggttaaaa ggattcattc ccacggtaac accagcacct aaaaaaaaaa aaaaaaaaa 59

<210> 8

<211> 59

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 8

aaggttaaac gtaacttggt ttgttccctg aacagcacct aaaaaaaaaa aaaaaaaaa 59

<210> 9

<211> 59

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 9

aaggttaaaa ccaagactcg ctgtgcctag ttcagcacct aaaaaaaaaa aaaaaaaaa 59

<210> 10

<211> 59

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 10

aaggttaaga gaggacaaag gtttcaacgc ttcagcacct aaaaaaaaaa aaaaaaaaa 59

<210> 11

<211> 59

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 11

aaggttaatc cattccctcc gatagatgaa accagcacct aaaaaaaaaa aaaaaaaaa 59

<210> 12

<211> 59

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 12

aaggttaatc cgattctgct tctttctacc tgcagcacct aaaaaaaaaa aaaaaaaaa 59

Claims

1.基于Nanopore测序技术的多组学测序及分析方法，其特征在于，包括以下步骤：

A、将采集的样本同时进行DNA和RNA提取；

B、提取的RNA 3′端添加Poly U尾巴；

C、将带有Poly U尾巴的RNA反转录成cDNA，并在其5′端添加MID条形码序列；

D、将步骤C得到的cDNA样品与步骤A得到的DNA样品混合建库，并进行Nanopore测序；

F、对测序数据中全基因组甲基化信号进行读取与分析。

2.根据权利要求1所述的方法，其特征在于，步骤C中所述MID条形码序列包括MID01～MID12，序列如下：

3.根据权利要求1所述的方法，其特征在于，步骤D具体操作如下：

1)DNA/cDNA末端修复

a)配制如下反应体系：

混匀后，短暂离心；

将上述反应体系转移至离心管中，20℃和65℃依次孵育5min；

b)磁珠纯化

将磁珠提前放置于室温，震荡混匀，重悬磁珠；向上述离心管中加入108μL重悬的磁珠，吹吸混匀，室温孵育5min；

将离心管放置在磁珠架上，室温静置5min直至溶液变澄清；

弃上清液，加入200μL 70％乙醇溶液，室温静置30秒，弃乙醇溶液，再用70％乙醇溶液重复清洗两次；

清洗后将残留液体吸干，室温晾干磁珠；

将离心管放置在磁珠架上，室温静置直至溶液变清亮；

吸取14μL上清液于另一离心管中，用Qubit fluorometer对DNA/cDNA浓度进行定量，保证总量>700ng；

2)末端补平和加dA尾

a)将以下反应试剂加入0.2mL反应管中：

混匀，室温孵育10min；

b)磁珠纯化

DNA和cDNA样品共24个混合加入离心管中，磁珠纯化参照上述方法进行，最后用38μLnuclease-free水洗脱，吸取36μL上清液于离心管中，用Qubit fluorometer进行定量，确保总样品质量不少于700ng；

3)加接头

a)配制如下反应体系：

混匀，室温孵育10min；

b)磁珠纯化

磁珠纯化参照上述方法进行，期间用Adapter Bead Binding Buffer清洗一次，然后用Elution Buffer洗脱，用Qubit fluorometer进行定量，确保总的样品质量为430ng；

4)建库及上机测序

a)配制如下起始缓冲液：

Running Buffer FM 576μL

Nuclease-free水 624μL

总计 1200μL

混匀后将800μL起始缓冲液加入测序芯片priming port中，室温孵育5min；

b)文库准备

c)上机测序

将200μL起始缓冲液加入sample port中；

将75μL文库加入sample port中，先后将sample port和priming port关闭，开始测序。

4.根据权利要求1所述的方法，其特征在于，步骤E中根据测序结果中获得的n个样本的转录组和基因组数据，对所有cDNA表达量水平按照DNA进行均一化处理的具体方法如下：

③通过DNA的真实分子数均一化cDNA的TPM值，从而得到每个基因校正后的TPM值，即Nomalized TPM_ji＝TPM_ji/(N_ji/min(N_1i，N_2i，N_3i，…N_ni))，j＝1,2,3…n；

5.根据权利要求1所述的方法，其特征在于，步骤F所述甲基化信号包括5mC和6mA。

6.根据权利要求1-5任一项所述的方法，其特征在于，所述样本来自植物、动物、微生物及其周围的环境。

7.权利要求1-6任一项所述方法的以下任一应用：

iv.实现DNA病毒、RNA病毒或噬菌体的直接检测；

v.噬菌体溶源性和裂解性状态的确定；

vi.建立人基因组水平上的DNA变异基线数据、宏甲基化基线数据以及宏转录组数据，进行三者的关联分析。