CN111455031A - 基于Nanopore测序技术的多组学测序及分析方法 - Google Patents
基于Nanopore测序技术的多组学测序及分析方法 Download PDFInfo
- Publication number
- CN111455031A CN111455031A CN201910048654.4A CN201910048654A CN111455031A CN 111455031 A CN111455031 A CN 111455031A CN 201910048654 A CN201910048654 A CN 201910048654A CN 111455031 A CN111455031 A CN 111455031A
- Authority
- CN
- China
- Prior art keywords
- sequencing
- dna
- sample
- tpm
- cdna
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Analytical Chemistry (AREA)
- Microbiology (AREA)
- Immunology (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明提供一种基于Nanopore测序技术的多组学测序及分析方法,包括:A、将采集的样本同时进行DNA和RNA提取;B、提取的RNA 3′端添加Poly U尾巴;C、将带有Poly U尾巴的RNA反转录成cDNA,并在其5′端添加MID条形码序列;D、将cDNA样品与DNA样品混合建库,进行Nanopore测序;E、将测序数据中所有cDNA表达量水平按照DNA进行均一化处理;F、对测序数据中全基因组甲基化信号进行读取与分析。本发明在实现基因组测序的基础上,同时还能够实现转录组以及表观甲基化组检测,并达到宏转录组、宏基因组以及表观甲基化组的多组学关联分析的目的。
Description
技术领域
本发明涉及组学领域,具体地说,涉及基于Nanopore测序技术的多组学测序及 分析方法。
背景技术
宿主实际上是由宿主自身与共生菌群共同组成的超级生态系统,在宿主的皮肤表面、呼吸系统、生殖系统都生活着复杂的共生菌的群落,而肠道系统内的菌群数 量和种类则更加庞大;以人类为例,多个研究表明肠道内有多达几百种细菌,其细 胞总量超过人类本身的细胞数量,而这些不同的细菌所包含的基因多样性也要远远 超过人类。一系列研究表明菌群在健康和疾病的发生中发挥着重要作用,多种慢性 代谢疾病、免疫系统疾病、肝病、中枢神经系统疾病及传染病的发生都与菌群失调 存在关联,研究人员据此提出了“肠肝轴”、“肠脑轴”和“肠肺轴”等生理学关联 假说。
随着二代测序技术的兴起,世界各国在菌群研究中取得了飞速发展,从最初的454平台到Illumina Hiseq和Miseq平台,能够为我们提供越来越多的菌群扩增子数据 信息、宏基因组数据以及宏转录组数据。
随着菌群研究的深入,越来越多的研究表明,细菌16S转录本或宏转录组可以揭示更多实际功能;更易发现疾病和健康人之间的微生物功能的不同。传统观点认为, 细菌表观甲基化组可以防御外源DNA,此外,DNA甲基化在DNA错配修复,基因表 达等方面也发挥了重要作用,最近研究发现,致病菌DNA甲基化还在致病性和传播 方面发挥重要作用。但是二代高通量测序技术由于存在技术瓶颈,因此无法实现全 基因组水平表观甲基化的完整分析。
传统DNA甲基化的检测方法按照原理可分为以下几类:一是用甲基化敏感的限 制性内切酶鉴定DNA甲基化的差异;二是用重亚硫酸盐处理DNA,经PCR及测序技 术鉴定序列差异性,未甲基化的胞嘧啶经重亚硫酸盐处理会变为尿嘧啶,在PCR测序 过程中会被读成胸腺嘧啶,但甲基化的胞嘧啶不受影响,这个方法的缺点是只能够 检测胞嘧啶甲基化。三是使用变性高效液相色谱(denaturing high performance liquid chromatography,DHPLC)或DHPLC与PCR技术联用分析DNA分子,检测基因组的 甲基化程度;四是用免疫化学法如单克隆抗体anti-6mA、anti-4mC检测特定位点的甲 基化。这些方法均不能满足全基因组所有甲基化水平检测的需求。以Pacbio和 Nanopore单分子测序为代表的三代测序技术的兴起不仅在测序读长上为我们提供很 大优势,例如二代Illumina测序单条序列的长度较短(2×250bp),不能够在宏基因组 组装时生成大的contig,N50一般在几十个kb左右;同时,这样的序列长度也不足以 发现较大的结构变异(如拷贝数变异)和较大的结构变异(如插入或缺失),而三代 Pacbio测序及Nanopore测序的平均读长分别为10kb和几十kb,与二代测序相比能够更 好地减少拼接错误;重要的是,以Pacbio测序及Nanopore测序为代表的三代测序技术 可以识别基因组上的甲基化信号。例如,Pacbio通过读取碱基两个相邻的脉冲峰之间 的距离和参考序列的距离之间的比值来区分甲基化信号;Nanopore单分子测序则通 过捕获核酸通过纳米孔的电压变化,来区分修饰碱基。因此三代测序使得在全基因组水平上绘制表观甲基化组成为可能。
传统对特定物种整体转录水平研究及全基因组水平的基因表达差异研究的方法主要依赖二代高通量测序技术的RNA-seq,此技术通过对样本中总RNA的提取,分离 mRNA后利用超声波进行片段化,建库后上机测序,能够在单核苷酸水平对特定物种 的整体转录活动进行检测,从而全面快速地获得该物种在某一状态下的几乎全部转 录本信息。与传统技术相比,具有定量更准确、可重复性更高、检测范围更广、分 析更可靠等特点,一直以来被用于新的转录本的发现、基因表达量和不同样本间差 异表达等研究领域。但是目前针对不同样品测序量的差异,一般所采用的标准化方 式是计算Transcripts Per Kilobase ofexon model per Million mapped reads(TPM),即先 对每个基因的read数用基因的长度进行校正,再用校正后该基因read数与矫正后该样 本的所有read数求商。这种计算方式的缺点是容易受到极高表达且在不同样品中存在 差异表达的基因的影响,基因的打开或关闭会影响到细胞中总的分子数目,可能导 致基因标准化之后就不存在很大差异了,而原本没有差异的基因标准化之后却有差 异了。由于DNA在同一细胞中的总分子是一定的,因此如果能够同时对DNA和 RNA/cDNA样品同时进行测序,通过DNA对cDNA绝对量进行矫正,则能够很大程度 上避免这种误差。
发明内容
本发明的目的是提供一种基于Nanopore测序技术的多组学测序及分析方法。
为了实现本发明目的,第一方面,本发明提供一种基于Nanopore测序技术的多 组学测序及分析方法,包括以下步骤:
A、将采集的样本同时进行DNA和RNA提取;
B、提取的RNA 3′端添加Poly U尾巴;
C、将带有Poly U尾巴的RNA反转录成cDNA,然后在其5′端添加MID条形码序列;
D、将步骤C得到的cDNA样品与步骤A得到的DNA样品混合建库,并进行 Nanopore测序;
E、将测序数据中所有cDNA表达量水平按照DNA进行均一化处理;
F、对测序数据中全基因组甲基化信号进行读取与分析。
前述的方法,步骤C中所述MID条形码序列(包括MID01~MID12,SEQ ID NO:1-12)见表1:
表1
前述的方法,步骤D具体操作如下:
1.DNA/cDNA末端修复
1)配制如下反应体系:
混匀后,短暂离心;
将上述反应体系转移至离心管(1.5mL离心管)中,20℃和65℃(金属浴)依次 孵育5min;
2)磁珠纯化
将磁珠(Agencourt AMPure XP,Beckman Coulter)提前放置于室温,充分震荡 混匀,重悬磁珠;向上述离心管中加入108μL重悬的(AMPure XP)磁珠,温和吹吸 混匀;
室温下(于垂直转子混匀器内)孵育5min;
将离心管放置在磁珠架上,室温静置5min直至溶液变澄清;
弃上清液(注意避免吸入磁珠),加入200μL 70%乙醇溶液(新鲜配制),室温 静置30秒,弃乙醇溶液,再用70%乙醇溶液重复清洗两次(此步骤在磁珠架上操作);
清洗后将残留液体吸干(注意避免吸入磁珠),室温晾干磁珠(避免磁珠出现裂缝);
取下离心管,加入15μL nuclease-free水重悬磁珠,室温静置2min;
将离心管放置在磁珠架上,室温静置直至溶液(水洗脱液)变清亮;
吸取14μL的上清液于一个新的离心管(1.5mL离心管)中。
用Qubit fluorometer对DNA/cDNA浓度进行定量,保证总量>700ng。
2.末端补平和加dA尾
1)反应体系及反应条件
将以下反应试剂加入0.2mL反应管中:
移液器温和吹吸混匀,室温孵育10min。
2)磁珠纯化
DNA(带有不同MID序列的样品12个)和cDNA(带有不同MID序列的样品12个) 样品共24个混合加入一个新的离心管(1.5mL离心管)中,磁珠(Agencourt AMPure XP)纯化参照上述方法进行,最后用38μL nuclease-free水洗脱,吸取36μL上清液于 新的离心管(1.5mL离心管)中,用Qubit fluorometer进行定量,确保样品总质量不少 于700ng。
3.加接头
1)配制如下反应体系:
移液器温和吹吸混匀,室温孵育10min。
2)磁珠纯化
Agencourt AMPure XP磁珠纯化,参照上述方法进行,期间无须用乙醇清洗,换 做试剂盒中Adapter Bead Binding Buffer(ABB)清洗一次,最后用15μL试剂盒中ElutionBuffer(ELB)洗脱,并用Qubit fluorometer进行定量,确保总的样品质量约为430ng。
4.建库及上机测序
1)配制如下起始缓冲液:
Running Buffer FM(RBF) 576μL
Nuclease-free水 624μL
总计 1200μL
温和吹吸混匀后将800μL起始缓冲液加入测序芯片priming port中,室温孵育5min。
2)文库准备
3)上机测序
将200μL起始缓冲液加入sample port中,避免引入气泡;
将75μL文库加入sample port中(温和吹吸混匀并逐滴加入),先后将sample port和priming port关闭,开始测序。
前述的方法,步骤E中根据测序结果中获得的n个样本的转录组和基因组数据, 对所有cDNA表达量水平按照DNA进行均一化处理的具体方法如下:
①分别计算基因组上基因i的覆盖度N1i,N2i,N3i,…Nni,并获得DNA分子数的 绝对定量min(N1i,N2i,N3i,…Nni);
②分别计算n个重复样本对应基因的TPM值,即TPM1i,TPM2i,TPM3i,…TPMni;
③通过DNA的真实分子数均一化cDNA的TPM值,从而得到每个基因校正后的 TPM值,即Nomalized TPMji=TPMji/(Nji/min(N1i,N2i,N3i,…Nni)),j=1,2,3…n。
其中,TPMji表示cDNA校正后的TPM值;i表示基因组上的第i个基因;min表示 最小值;j表示第j个样本;Nji表示第j个样本基因组上第i个基因的覆盖度。
在本发明的一个具体实施方式中,利用Nanopore测序技术同时检测同一样品野生型和敲除型的转录组和基因组,每个样本三个生物学重复,实现DNA和RNA的同 时检测,因而可以对RNA中每个基因覆盖度基于DNA文库中相应文库的覆盖层数进 行校正后,再进行差异分析。具体方法如下:
(1)分别计算三个重复样本基因组每个基因的覆盖度N1i,N2i,N3i,并获得DNA 分子数的绝对定量min(N1i,N2i,N3i);
(2)分别计算三个重复样本对应基因的TPM值,即TPM1i,TPM2i,TPM3i;
(3)通过DNA的真实分子数均一化RNA的TPM值,从而得到每个基因校正后的 TPM值,即Nomalized TPMji=TPMji/(Nji/min(N1i,N2i,N3i)),j=1,2,3。
其中,TPMji表示cDNA校正后的TPM值;i表示基因组上的第i个基因;min表示 最小值;j表示第j个样本;Nji表示第j个样本基因组上第i个基因的覆盖度。
前述的方法,步骤F所述甲基化信号包括但不限于5mC和6mA。
本发明中,所述样本可来自植物、动物、微生物及其周围的环境。
第二方面,本发明提供上述基于Nanopore测序技术的多组学测序及分析方法的以下任一应用:
i.实现复杂生境微生物组样品中,单菌比例、单菌活力以及单菌单基因的绝对表达量的测定;
ii.实现宿主细胞、真核原核生物或真菌,通过与原核微生物进行区分,完成活力检测以及单个基因的表达量测定;
iii.跨门或跨种的互作研究,实现包括胞内寄生菌在内的细菌与细菌间丰度比例和/或基因表达上的差异分析;
iv.实现DNA病毒、RNA病毒或噬菌体的直接检测;
v.噬菌体溶源性和裂解性状态的确定;
vi.建立人基因组水平上的DNA变异(SNP、SV、CNV)基线数据、宏甲基化基 线数据以及宏转录组数据,进行三者的关联分析(尤其是甲基化对转录影响);以及 疾病过程中三者的变化情况。
借由上述技术方案,本发明至少具有下列优点及有益效果:
本发明提供的基于Nanopore测序技术的多组学测序及分析方法,在实现基因组测序的基础上,同时还能够实现转录组以及表观甲基化组检测,并且达到宏转录组、 宏基因组以及表观甲基化组的多组学关联分析的目的。不仅可以实现单核苷酸水平 对特定物中的整体基因拷贝数及整体转录活动进行检测,获得全部转录本信息,而 且经过关联分析,能够弥补RNA-seq转录本测序在基因表达计算上的误差,极大程度 降低了由于极高表达且在不同样品中存在差异表达的基因的影响。就本发明具体实 例而言,利用本发明提供的多组学测序技术,通过与传统RNA-seq样本间差异分析方 法的结果相比较,DNA文库进行校正后,可以减少30%左右假阳性和假阴性的差异 基因[指数期:29.71%(279/939);平台期:31.29%(311/994)]。具体来说:
(一)可有效减少传统RNA-seq分析方法所获结果的3%~5%差异基因的假阳性率[指数期:3.73%(35/939);平台期:5.43%(54/994)]。即不进行均一化有表达 差异的,经均一化处理后实际没有表达差异(图4A)。
(二)可以更敏感的检测到传统RNA-seq分析方法所获结果中没有差异表达的约26%基因的假阴性率[指数期:25.99%(244/939);平台期:25.86%(257/994)]。即 不进行均一化没有表达差异的,经均一化处理后实际有表达差异(图4B)。
本发明有望用于健康疾病人群/模型中的差异分析。同时通过对RNA进行Poly U尾巴的添加能够根据是否含有Poly A,实现复杂生境中真核与原核的区分,通过12 条MID可以实现样本的区分。
附图说明
图1为本发明较佳实施例中WT和KO菌株的生长曲线(OD600)。
图2为本发明较佳实施例中WT和KO菌株在指数增长期(A)和平台期(B) Nanopore单分子测序密度覆盖曲线。
图3为本发明较佳实施例中通过DNA对RNA/cDNA绝对量进行矫正(RNA表达量 热图),结果显示WT和KO菌株在指数增长期(A)和平台期(B)的基因表达情况相 对比较稳定。
图4为本发明较佳实施例中基于DNA均一化cDNA表达量的校正后的差异基因表 达情况。其中,A:传统方法有显著差异的基因均一化后表现为没有显著差异的基因 表达情况(假阳性);B:传统方法没有显著差异的基因均一化后表现为显著差异的 基因表达情况(假阴性)。
图5为本发明较佳实施例中WT和KO菌株在指数增长期和平台期6mA甲基化修 饰情况。其中,A:指数增长期6mA甲基化修饰情况;B:平台期6mA甲基化修饰情 况。
图6为本发明较佳实施例中WT和KO菌株在指数增长期和平台期5mC甲基化修 饰情况。其中,A:指数增长期5mC甲基化修饰情况;B:平台期5mC甲基化修饰情 况。
图7为本发明较佳实施例中WT和KO菌株平台期与指数增长期5mC甲基化比例。 其中,A:WT菌株平台期和指数增长期5mC甲基化比例;B:KO菌株平台期和指数 增长期5mC甲基化比例。
图8为本发明较佳实施例中WT菌株5mC甲基化motif预测结果。其中,A:WT菌 株指数增长期motif预测;B:WT菌株平台期motif预测。
具体实施方式
以下实施例用于说明本发明,但不用来限制本发明的范围。若未特别指明,实 施例中所用的技术手段为本领域技术人员所熟知的常规手段,所用原料均为市售商 品。
本发明中,Native Barcode、BAM 1D来自EXP-NBD103试剂盒,购自OxfordNanopore Technologies公司。
ELB、RBF、ABB、LLB来自SQK-LSK108试剂盒,购自Oxford Nanopore Technologies公司。
NEXTflexTM Ligase Enzyme Mix来自NEXTflexTMRapid DNA-Seq Kit试剂盒,购自Bioo Scientific公司。
UltraⅡEnd-prep reaction buffer和UltraⅡEnd-prep enzyme mix来自NEBNext Ultra End Repair/dA-Tailing Module试剂盒,购自NEB technology公司。
Blunt/TA Ligase Master Mix购自NEB technology公司。
本发明中使用的Nanopore测序仪购自Oxford Nanopore Technologies,型号为FLO-MIN106测序芯片。
实施例1基于Nanopore测序技术的多组学测序及分析方法
以E.coli菌株K12(WT野生菌株)和6个内源限制修饰系统缺失的EC135菌株(KO 敲除菌株,参见ZL201210080124.6)为实验对象,通过绘制生长曲线(图1),挑选 指数增长期时的4h和平台期的13h分别进行以下操作。
1、在维持样本中核酸原有比例的基础上,分别对WT菌株和KO菌株的两个时期 样品(各3个生物学重复,共计12个样本)进行DNA和RNA的同时提取。所用试剂盒 为Bacterial DNA/RNA/Protein kit(Qiagen,货号:47054)。
2、对RNA样品添加Poly U尾巴
用E.coli PloyU polymerase(NEB technology,货号:M0337S)和UTP(TAKARA, 货号:4044)对总RNA 3’端进行标记,实现与DNA的区分。
3、将带有Poly U尾巴的RNA反转录成cDNA,并在其5′端添加MID条形码序列, 用于区分测序后样本信息。
所述MID条形码序列见表1。
4、将步骤3得到的cDNA样品与步骤1得到的DNA样品混合建库,并进行Nanopore 测序。建库及上机的具体方法如下:
1)DNA/cDNA末端修复
a)反应体系及反应条件
温和混匀,并短暂离心;
将样品转移至1.5mL离心管中,金属浴20℃和65℃依次孵育5min;
b)磁珠纯化
将Agencourt AMPure XP磁珠(Beckman Coulter)提前放置于室温,充分震荡混匀;
加入108μL重悬的AMPure XP磁珠,温和吹吸混匀;
室温下垂直转子混匀器孵育5min;
将离心管放置在磁珠架上,室温静置5min直至溶液变澄清;
弃上清液,注意避免吸入磁珠;
加入200μL现配的70%乙醇溶液,室温静置30秒,弃乙醇溶液(此步骤在磁珠架 上操作);
重复上一步骤,完成两次乙醇清洗;
短暂离心,把离心管壁上的溶液离心下来,用20μL移液器将剩下的溶液吸干, 注意避免吸入磁珠;
室温晾干磁珠30s。避免磁珠出现裂缝;
取下离心管,加入15μL nuclease-free水温和吹吸使磁珠悬浮(用水洗脱),室温静置2min;
将离心管放置磁珠架上,室温静置直至洗脱液变清亮;
吸取14μL的上清液于新的1.5mL离心管中。
用Qubit fluorometer对DNA/cDNA浓度进行定量,保证总量>700ng。
2)末端补平&dA尾
a)反应体系及反应条件
将以下反应试剂加入0.2mL反应管中:
移液器温和吹吸混匀,室温孵育10min。
b)磁珠纯化
DNA(带有不同MID序列的样品12个)和cDNA(带有不同MID序列的样品12个) 样品共24个混合加入一个新的1.5mL离心管中,Agencourt AMPure XP磁珠纯化,参 照上述方法进行,最后用38μL nuclease-free水洗脱,吸取36μL上清液于新的1.5mL 离心管中,并用Qubit fluorometer进行定量,确保总的样品质量不少于700ng。
3)加接头
a)反应体系及反应条件
移液器温和吹吸混匀,室温孵育10min。
b)磁珠纯化
磁珠(Agencourt AMPure XP)纯化参照上述方法进行,期间无须用乙醇清洗, 换用试剂盒中Adapter Bead Binding Buffer(ABB)清洗一次,然后用15μL试剂盒中 ElutionBuffer(ELB)洗脱,用Qubit fluorometer进行定量,确保总的样品质量为430ng 左右。
4)建库及上机测序
a)测序芯片起始缓冲液
Running Buffer FM(RBF) 576μL
Nuclease-free水 624μL
总计 1200μL
温和吹吸混匀后将800μL上述起始缓冲液加入测序芯片priming port中,室温孵育 5min。
b)文库准备
c)上机测序
将200μL起始缓冲液加入sample port中,避免引入气泡;
将75μL文库温和吹吸混匀并逐滴加入sample port中,先后将sample port和priming port关闭,开始测序。
Nanopore单分子测序密度覆盖曲线结果显示(图2),WT和KO菌株在指数增长期(A)和平台期(B),分别能达到25×左右的coverage。
5、将测序数据中所有cDNA表达量水平按照DNA进行均一化处理。具体如下:
本发明中利用Nanopore测序技术同时检测同一样品野生型和敲除型的转录组和基因组,每个样品三个生物学重复,实现DNA和RNA的同时检测,因而可以对RNA 中每个基因覆盖度基于DNA文库中相应文库的覆盖层数进行校正后,再进行差异分 析。具体方法如下:
1)分别计算三个重复样本基因组每个基因的覆盖度N1i,N2i,N3i,并获得DNA 分子数的绝对定量min(N1i,N2i,N3i);
2)分别计算三个重复样本对应基因的TPM值,即TPM1i,TPM2i,TPM3i;
3)通过DNA的真实分子数均一化RNA的TPM值,从而得到每个基因校正后的 TPM值,即Nomalized TPMji=TPMji/(Nji/min(N1i,N2i,N3i)),j=1,2,3;
其中,TPMji表示cDNA校正后的TPM值;i表示基因组上的第i个基因;min表示 最小值;j表示第j个样本;Nji表示第j个样本基因组上第i个基因的覆盖度。
通过与单独使用RNA进行样本间差异分析的结果相比较,基于DNA文库进行校 正后,图3结果显示WT和KO菌株在指数增长期(A)和平台期(B)的基因表达情况 相对比较稳定。并且可以减少30%左右假阳性和假阴性的差异基因[指数期:29.71% (279/939);平台期:31.29%(311/994)],具体来说:
(1)可有效减少传统RNA-seq方法获得的3%~5%差异基因的假阳性率[指数期:3.73%(35/939);平台期:5.43%(54/994)]。即不进行均一化有表达差异的,均一 化以后实际没有表达差异(图4A);
(2)可以更敏感地检测到传统RNA-seq方法没有差异表达的约26%基因的假阴 性率[指数期:25.99%(244/939);平台期:25.86%(257/994)]。即不进行均一化没 有表达差异的,均一化以后实际有表达差异(图4B)。
6、对测序数据中全基因组甲基化信号进行读取与分析。
全基因组表观甲基化分析显示WT和KO菌株甲基化水平有明显不同。WT和KO 菌株在指数增长期(A)和平台期(B)的6mA甲基化修饰情况见图5;WT和KO菌株 在指数增长期(A)和平台期(B)的5mC甲基化修饰情况见图6。据文献报道,三代 Pacbio单分子实时测序对5mC甲基化的检测阈值较高,因此不易检测到5mC甲基化修 饰,与此不同,我们的结果显示Nanpore单分子测序可以对5mC甲基化修饰实现非常 好的检测(图6)。此外,WT和KO菌株在细菌生长的不同时期也表现出不同的5mC 甲基化修饰特征(图7)。而且在WT菌株中,我们可以预测到5mC甲基化的motif集中 富集为5’-CCWGG-3’,也与文献报道一致(图8)。
虽然,上文中已经用一般性说明及具体实施方案对本发明作了详尽的描述,但 在本发明基础上,可以对之做一些修改或改进,这对本领域技术人员而言是显而易 见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明 要求保护的范围。
序列表
<110> 中国科学院微生物研究所
<120> 基于Nanopore测序技术的多组学测序及分析方法
<130> KHP181119035.9
<160> 12
<170> SIPOSequenceListing 1.0
<210> 1
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
aaggttaaca caaagacacc gacaactttc ttcagcacct aaaaaaaaaa aaaaaaaaa 59
<210> 2
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
aaggttaaac agacgactac aaacggaatc gacagcacct aaaaaaaaaa aaaaaaaaa 59
<210> 3
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
aaggttaacc tggtaactgg gacacaagac tccagcacct aaaaaaaaaa aaaaaaaaa 59
<210> 4
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
aaggttaata gggaaacacg atagaatccg aacagcacct aaaaaaaaaa aaaaaaaaa 59
<210> 5
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
aaggttaaaa ggttacacaa accctggaca agcagcacct aaaaaaaaaa aaaaaaaaa 59
<210> 6
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
aaggttaaga ctactttctg cctttgcgag aacagcacct aaaaaaaaaa aaaaaaaaa 59
<210> 7
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
aaggttaaaa ggattcattc ccacggtaac accagcacct aaaaaaaaaa aaaaaaaaa 59
<210> 8
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
aaggttaaac gtaacttggt ttgttccctg aacagcacct aaaaaaaaaa aaaaaaaaa 59
<210> 9
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
aaggttaaaa ccaagactcg ctgtgcctag ttcagcacct aaaaaaaaaa aaaaaaaaa 59
<210> 10
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
aaggttaaga gaggacaaag gtttcaacgc ttcagcacct aaaaaaaaaa aaaaaaaaa 59
<210> 11
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
aaggttaatc cattccctcc gatagatgaa accagcacct aaaaaaaaaa aaaaaaaaa 59
<210> 12
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
aaggttaatc cgattctgct tctttctacc tgcagcacct aaaaaaaaaa aaaaaaaaa 59
Claims (7)
1.基于Nanopore测序技术的多组学测序及分析方法,其特征在于,包括以下步骤:
A、将采集的样本同时进行DNA和RNA提取;
B、提取的RNA 3′端添加Poly U尾巴;
C、将带有Poly U尾巴的RNA反转录成cDNA,并在其5′端添加MID条形码序列;
D、将步骤C得到的cDNA样品与步骤A得到的DNA样品混合建库,并进行Nanopore测序;
E、将测序数据中所有cDNA表达量水平按照DNA进行均一化处理;
F、对测序数据中全基因组甲基化信号进行读取与分析。
3.根据权利要求1所述的方法,其特征在于,步骤D具体操作如下:
1)DNA/cDNA末端修复
a)配制如下反应体系:
混匀后,短暂离心;
将上述反应体系转移至离心管中,20℃和65℃依次孵育5min;
b)磁珠纯化
将磁珠提前放置于室温,震荡混匀,重悬磁珠;向上述离心管中加入108μL重悬的磁珠,吹吸混匀,室温孵育5min;
将离心管放置在磁珠架上,室温静置5min直至溶液变澄清;
弃上清液,加入200μL 70%乙醇溶液,室温静置30秒,弃乙醇溶液,再用70%乙醇溶液重复清洗两次;
清洗后将残留液体吸干,室温晾干磁珠;
取下离心管,加入15μL nuclease-free水重悬磁珠,室温静置2min;
将离心管放置在磁珠架上,室温静置直至溶液变清亮;
吸取14μL上清液于另一离心管中,用Qubit fluorometer对DNA/cDNA浓度进行定量,保证总量>700ng;
2)末端补平和加dA尾
a)将以下反应试剂加入0.2mL反应管中:
混匀,室温孵育10min;
b)磁珠纯化
DNA和cDNA样品共24个混合加入离心管中,磁珠纯化参照上述方法进行,最后用38μLnuclease-free水洗脱,吸取36μL上清液于离心管中,用Qubit fluorometer进行定量,确保总样品质量不少于700ng;
3)加接头
a)配制如下反应体系:
混匀,室温孵育10min;
b)磁珠纯化
磁珠纯化参照上述方法进行,期间用Adapter Bead Binding Buffer清洗一次,然后用Elution Buffer洗脱,用Qubit fluorometer进行定量,确保总的样品质量为430ng;
4)建库及上机测序
a)配制如下起始缓冲液:
Running Buffer FM 576μL
Nuclease-free水 624μL
总计 1200μL
混匀后将800μL起始缓冲液加入测序芯片priming port中,室温孵育5min;
b)文库准备
c)上机测序
将200μL起始缓冲液加入sample port中;
将75μL文库加入sample port中,先后将sample port和priming port关闭,开始测序。
4.根据权利要求1所述的方法,其特征在于,步骤E中根据测序结果中获得的n个样本的转录组和基因组数据,对所有cDNA表达量水平按照DNA进行均一化处理的具体方法如下:
①分别计算基因组上基因i的覆盖度N1i,N2i,N3i,…Nni,并获得DNA分子数的绝对定量min(N1i,N2i,N3i,…Nni);
②分别计算n个重复样本对应基因的TPM值,即TPM1i,TPM2i,TPM3i,…TPMni;
③通过DNA的真实分子数均一化cDNA的TPM值,从而得到每个基因校正后的TPM值,即Nomalized TPMji=TPMji/(Nji/min(N1i,N2i,N3i,…Nni)),j=1,2,3…n;
其中,TPMji表示cDNA校正后的TPM值;i表示基因组上的第i个基因;min表示最小值;j表示第j个样本;Nji表示第j个样本基因组上第i个基因的覆盖度。
5.根据权利要求1所述的方法,其特征在于,步骤F所述甲基化信号包括5mC和6mA。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述样本来自植物、动物、微生物及其周围的环境。
7.权利要求1-6任一项所述方法的以下任一应用:
i.实现复杂生境微生物组样品中,单菌比例、单菌活力以及单菌单基因的绝对表达量的测定;
ii.实现宿主细胞、真核原核生物或真菌,通过与原核微生物进行区分,完成活力检测以及单个基因的表达量测定;
iii.跨门或跨种的互作研究,实现包括胞内寄生菌在内的细菌与细菌间丰度比例和/或基因表达上的差异分析;
iv.实现DNA病毒、RNA病毒或噬菌体的直接检测;
v.噬菌体溶源性和裂解性状态的确定;
vi.建立人基因组水平上的DNA变异基线数据、宏甲基化基线数据以及宏转录组数据,进行三者的关联分析。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201910048654.4A CN111455031A (zh) | 2019-01-18 | 2019-01-18 | 基于Nanopore测序技术的多组学测序及分析方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201910048654.4A CN111455031A (zh) | 2019-01-18 | 2019-01-18 | 基于Nanopore测序技术的多组学测序及分析方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN111455031A true CN111455031A (zh) | 2020-07-28 |
Family
ID=71677256
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201910048654.4A Pending CN111455031A (zh) | 2019-01-18 | 2019-01-18 | 基于Nanopore测序技术的多组学测序及分析方法 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN111455031A (zh) |
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN113257348A (zh) * | 2021-05-26 | 2021-08-13 | 南开大学 | 一种宏转录组测序数据处理方法及系统 |
| CN113265452A (zh) * | 2021-05-14 | 2021-08-17 | 北京大学人民医院 | 一种基于Nanopore宏基因组RNA-seq的生物信息学检测病原体的方法 |
| CN114350769A (zh) * | 2021-12-07 | 2022-04-15 | 予果生物科技(北京)有限公司 | 一种基于Nanopore测序技术特征化细菌DNA甲基化的方法和应用 |
| WO2024082945A1 (zh) * | 2022-10-21 | 2024-04-25 | 深圳华大生命科学研究院 | 多组学的文库构建方法、检测方法及相关试剂盒 |
| CN119007824A (zh) * | 2024-10-21 | 2024-11-22 | 粤北人民医院 | 一种甲基化组学和宏基因组学分析方法 |
| CN119920323A (zh) * | 2025-01-24 | 2025-05-02 | 中国科学院生态环境研究中心 | 一种环境rna病毒的组学分析方法 |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN101914619A (zh) * | 2010-07-22 | 2010-12-15 | 深圳华大基因科技有限公司 | 关于基因表达的rna测序质控方法及装置 |
| CN105102633A (zh) * | 2013-03-11 | 2015-11-25 | 以琳生物药物有限公司 | 包含基因组DNA和cDNA两者的总核酸的富集和新一代测序 |
| CN107109489A (zh) * | 2014-10-17 | 2017-08-29 | 牛津纳米孔技术公司 | 纳米孔rna表征方法 |
| WO2018100370A1 (en) * | 2016-12-01 | 2018-06-07 | Oxford Nanopore Technologies Limited | Methods and systems for characterizing analytes using nanopores |
-
2019
- 2019-01-18 CN CN201910048654.4A patent/CN111455031A/zh active Pending
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN101914619A (zh) * | 2010-07-22 | 2010-12-15 | 深圳华大基因科技有限公司 | 关于基因表达的rna测序质控方法及装置 |
| CN105102633A (zh) * | 2013-03-11 | 2015-11-25 | 以琳生物药物有限公司 | 包含基因组DNA和cDNA两者的总核酸的富集和新一代测序 |
| CN107109489A (zh) * | 2014-10-17 | 2017-08-29 | 牛津纳米孔技术公司 | 纳米孔rna表征方法 |
| WO2018100370A1 (en) * | 2016-12-01 | 2018-06-07 | Oxford Nanopore Technologies Limited | Methods and systems for characterizing analytes using nanopores |
Non-Patent Citations (2)
| Title |
|---|
| HTTP://BLOG.SCIENCENET.CN/BLOG-1113671-1038659.HTML: "FPKM,RPKM,RPM以及TPM的关系之见解", 《科学网博客》 * |
| 刘亭亭: "中华蜜蜂转录组测序及雌性蜜蜂基因表达分析", 《中国优秀硕士学位论文全文数据库 农业科技辑》 * |
Cited By (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN113265452A (zh) * | 2021-05-14 | 2021-08-17 | 北京大学人民医院 | 一种基于Nanopore宏基因组RNA-seq的生物信息学检测病原体的方法 |
| CN113257348A (zh) * | 2021-05-26 | 2021-08-13 | 南开大学 | 一种宏转录组测序数据处理方法及系统 |
| CN114350769A (zh) * | 2021-12-07 | 2022-04-15 | 予果生物科技(北京)有限公司 | 一种基于Nanopore测序技术特征化细菌DNA甲基化的方法和应用 |
| WO2024082945A1 (zh) * | 2022-10-21 | 2024-04-25 | 深圳华大生命科学研究院 | 多组学的文库构建方法、检测方法及相关试剂盒 |
| CN119007824A (zh) * | 2024-10-21 | 2024-11-22 | 粤北人民医院 | 一种甲基化组学和宏基因组学分析方法 |
| CN119007824B (zh) * | 2024-10-21 | 2025-04-22 | 粤北人民医院 | 一种甲基化组学和宏基因组学分析方法 |
| CN119920323A (zh) * | 2025-01-24 | 2025-05-02 | 中国科学院生态环境研究中心 | 一种环境rna病毒的组学分析方法 |
| CN119920323B (zh) * | 2025-01-24 | 2025-11-11 | 中国科学院生态环境研究中心 | 一种环境rna病毒的组学分析方法 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN111455031A (zh) | 基于Nanopore测序技术的多组学测序及分析方法 | |
| CN110964826B (zh) | 一种结直肠癌抑癌基因甲基化高通量检测试剂盒及其应用 | |
| Skibsted et al. | Bench-to-bedside review: future novel diagnostics for sepsis-a systems biology approach | |
| CN110218781B (zh) | 21个微单倍型位点的复合扩增体系、下一代测序分型试剂盒及分型方法 | |
| Zhang et al. | Whole-genome resequencing from bulked-segregant analysis reveals gene set based association analyses for the Vibrio anguillarum resistance of turbot (Scophthalmus maximus) | |
| CN113463202A (zh) | 一种新的rna高通量测序的方法、引物组和试剂盒及其应用 | |
| Wan et al. | A genome-wide association study of resistance to Pseudomonas plecoglossicida infection in the large yellow croaker (Larimichthys crocea) | |
| WO2019114049A1 (zh) | 一种用于分析肠道微生物的引物组合物及其应用 | |
| CN114854737A (zh) | 基于三代测序平台的i类hla基因扩增引物、试剂盒及分型方法 | |
| CN115807104A (zh) | 猪1号染色体上与猪肋骨数性状相关的snp标记引物对及其应用 | |
| CN116515955B (zh) | 一种多基因靶向分型方法 | |
| Haag et al. | Systematic perturbation screens identify regulators of inflammatory macrophage states and a role for TNF mRNA m6A modification | |
| CN110699465B (zh) | 一种快速提高鸭群体青壳率的分子标记及应用 | |
| CN118016159A (zh) | 基于drs的生物遗传样本转录组测序分析方法 | |
| CN109680040A (zh) | 一种针对FFPE和cfDNA的DNA二代测序文库构建的试剂盒及其应用 | |
| CN112410441A (zh) | 利用snp标记kz288479.1_95621鉴别蜂群抗囊状幼虫病性状的方法 | |
| CN113718039B (zh) | 一种与猪肋骨数性状相关的snp标记引物对及其应用 | |
| CN116219040A (zh) | 用于检测植物乳杆菌s58的分子标记、引物探针组和检测方法 | |
| CN113337617B (zh) | 大黄鱼dna甲基化的分子标记及其在育种中的应用 | |
| CN114574600A (zh) | 一种美洲鲥鱼雄性分子标记及其特异性引物对和应用 | |
| CN114774517A (zh) | 一种人免疫组库测序的方法及试剂盒 | |
| WO2019227331A1 (zh) | 可变区序列文库构建方法、测序方法及其试剂盒 | |
| CN113122618A (zh) | 一种基于高通量测序精准检测t细胞免疫组库的方法及其引物体系 | |
| CN119265363A (zh) | 一种用于美洲型猪繁殖与呼吸综合征病毒全基因组测序的引物组合物、方法及其应用 | |
| CN108707653B (zh) | 构建可变区序列文库试剂盒及可变区序列的测序方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| RJ01 | Rejection of invention patent application after publication | ||
| RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200728 |