CN112301118A

CN112301118A - 一种全转录组范围同时获取rna丰度及活性rna聚合酶位点的方法及试剂盒

Info

Publication number: CN112301118A
Application number: CN202011191413.4A
Authority: CN
Inventors: 刘建钊; 高敏淞; 舒潇; 李腾伟
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang University ZJU
Priority date: 2020-10-30
Filing date: 2020-10-30
Publication date: 2021-02-02
Anticipated expiration: 2040-10-30
Also published as: CN112301118B

Abstract

本发明提供一种全转录组范围同时获取RNA丰度及活性RNA聚合酶位点的方法及试剂盒。该方法基于活性RNA聚合酶可在体外将未修饰的三磷酸核苷、N⁶‑烯丙基三磷酸腺苷(a⁶ATP)、N⁴‑烯丙基三磷酸胞苷(a⁴CTP)转录进新生RNA中，经化学处理诱导使修饰碱基在逆转录成DNA过程中发生碱基突变，然后通过核酸测序手段识别突变位点，进而得到N⁶‑烯丙基腺嘌呤(a⁶A)和N⁴‑烯丙基胞嘧啶(a⁴C)位点，该位点即为活性RNA聚合酶原本所在的位点。未突变的部分即为原有的RNA，即可得到新生RNA的丰度。本发明首次实现了在隔离的染色质中进行a⁶A、a⁴C的特异性标记，能够借助突变测序的手段进行定位，并利用一次测序获取活性聚合酶位点与RNA丰度两种信息。

Description

一种全转录组范围同时获取RNA丰度及活性RNA聚合酶位点的方法及试剂盒

技术领域

本发明属于基因测序领域，特别是一种全转录组范围同时获取RNA丰度及活性RNA聚合酶位点的方法及试剂盒。

背景技术

RNA在生物体遗传信息的传递中起到了承上启下的作用，它的丰度直接影响了下游蛋白质的生产速率，细胞面对外界的刺激也会第一时间反映在RNA的变化中，有着极其重要的生物学功能。对RNA的研究中，针对RNA的产生的研究是其中重要的一环，也是应激反应最直接的体现。RNA在生产过程中经历了多种调控，新生RNA的变化直接反映了转录调控的多种机理。对新生RNA丰度的检测与正在进行转录的精确位置的鉴定是研究其生物学意义的前提条件。转录的精确位置在聚合酶上是活性位点(本发明中简称为RNA聚合酶位点)，在DNA上是转录位点，在RNA上是聚合位点。在转录复合物DNA-RNA-RNA聚合酶的三元复合体中三点合一，为同一位点。

目前来说，染色质RNA的丰度与活性RNA聚合酶位点是不同的测序信息，需要分别建库测序来获取。它们不同的测序方法，会导致测序中的差异，从而对研究造成干扰。目前，通过掺入5-溴尿嘧啶，然后经过免疫沉淀后建库的方式(GRO-seq)可以获取活性RNA聚合酶的位点，但分辨率仅有50碱基区域范围内，且对建库过程有极高的要求；为了提高分辨率，还将5-溴尿嘧啶换成了带生物素修饰的碱基(PRO-seq)，具体来说，就是通过掺入带生物素修饰的三磷酸核苷，使RNA聚合酶在碱基掺入处发生终止，进而免疫沉淀建库后，通过分析终止信息来确定活性RNA聚合酶的位点。尽管该方法的分辨率得到了提升，但接近转录起始位点的小RNA难以建库，造成数据损失；同时，RNA的3’端生物素的修饰导致了在后续建库过程中，连接与逆转录的效率低，这同样造成了数据的损失，因此导致了检测位点的减少。

根据以上分析可知，现有的新生RNA的高通量分析手段未获得重大突破的原因主要有三点：①不同数据难以用同种方式获取，引入新的变量；②针对活性RNA聚合酶位置的检测方式有着内在的冲突，利用对酶友好的标记方式则需要忍受较低的分辨率，利用对酶不友好的标记方式则要忍受较高的信息损失，缺乏一种两全其美的标记方式。

因此，一种新的在全转录组范围同时获取RNA丰度及活性RNA聚合酶位点的方法亟待开发。

发明内容

针对现有技术中存在的缺点，本发明目的在于提供一种全转录组范围同时获取RNA丰度及活性RNA聚合酶位点的方法及试剂盒，不同于传统利用抗体富集的方式仅能获取一种数据，亦不同于传统通过转录终止的方式得到单碱基分辨率。本发明通过突变测序的方式，无需抗体富集，可直接在全转录组范围单碱基分辨率下检测活性RNA聚合酶位点，并同时获取染色质RNA丰度。

本发明采用以下技术方案：

一种全转录组范围同时获取RNA丰度及活性RNA聚合酶位点的方法，包括以下步骤：

(1)N⁶-烯丙基三磷酸腺苷或N⁴-烯丙基三磷酸胞苷标记活性RNA聚合酶位点：用未修饰的三磷酸核苷、和修饰的三磷酸核苷N⁶-烯丙基三磷酸腺苷或N⁴-烯丙基三磷酸胞苷处理带有活性RNA聚合酶的生物材料，活性RNA聚合酶将N⁶-烯丙基三磷酸腺苷或N⁴-烯丙基三磷酸胞苷引入到新生RNA中的腺嘌呤或胞嘧啶位点上，在该位点形成N⁶-烯丙基腺嘌呤(a⁶A)或N⁴-烯丙基胞嘧啶(a⁴C)，RNA纯化后，经过碘加成与环化处理后，形成环化结构，屏蔽碱基互补配对；

(2)环化处理后的RNA的逆转录突变与测序识别：向步骤(1)获得的环化结构中加入HIV逆转录酶，RNA上的N¹,N⁶环化腺嘌呤或N³,N⁴环化胞嘧啶在HIV逆转录酶作用下逆转录成DNA的过程中，对位互补碱基引入发生错误，通过核酸测序手段识别突变位点，进而得到a⁶A或a⁴C位点，该位点即为新生RNA中活性RNA聚合酶的位点。

上述技术方案中，进一步地，步骤(1)中，N⁶-烯丙基三磷酸腺苷的制备方法为：在氩气或氮气保护下，以摩尔比为1:1.5～3:3～10(优选1:2:5)的6-氯嘌呤核苷(化合物1)、碳酸钙和烯丙基胺为原料，乙醇为溶剂，加热回流8～16小时，过滤除去不溶物，-20℃沉淀过夜，获得N⁶-烯丙基腺苷(化合物2)；加入摩尔量为6-氯代嘌呤核苷5～50倍的完全干燥的磷酸三甲酯、摩尔量为6-氯代嘌呤核苷1.1～2倍的三氯氧磷，0～4℃搅拌0.5～3小时至反应液完全澄清；再加入摩尔量为6-氯代嘌呤核苷2～10倍的焦磷酸三丁基胺(如将其以0.6g/mL的浓度预溶于N,N’-二甲基甲酰胺中)，0～4℃搅拌10～30分钟；之后室温继续搅拌5～10分钟，加入摩尔量为6-氯代嘌呤核苷至少1千倍的三乙基碳酸氢铵终止反应；通过高效液相色谱(HPLC)分析提纯，得到N⁶-烯丙基三磷酸腺苷(a⁶ATP，化合物3)。所述各反应物的用量可按比例调整。

进一步地，步骤(1)中，N⁴-烯丙基三磷酸胞苷的制备方法为：在氩气或氮气保护下，以摩尔比为1:1.5～3:1.5～3:1.1～2(优选1:2:2:1.5)的2’,3’,5’-三乙酰基尿苷、1-氢-四氮唑、对甲苯磺酰氯和磷酸二苯酯为原料，吡啶为溶剂，室温下搅拌反应1～2天，加入去离子水淬灭，并用二氯甲烷萃取，反复用0.5～2mol/L的盐酸洗涤至水相呈酸性。旋转蒸发仪浓缩后，经硅胶柱纯化，获得4-四唑-2’,3’,5’-三乙酰胞苷(化合物2)；将4-四唑-2’,3’,5’-三乙酰胞苷溶于乙腈，将摩尔量为2’,3’,5’-三乙酰基尿苷一倍的氢氧化钾和摩尔量为2’,3’,5’-三乙酰基尿苷一倍的烯丙胺盐酸盐预先加入到圆底烧瓶中并密封，随后依次加入水，乙腈，三乙胺以及溶于乙腈的4-四唑-2’,3’,5’-三乙酰胞苷，室温下反应12～24h，旋转蒸发仪浓缩后，经硅胶柱纯化，获得2’,3’,5’-三乙酰基-N⁴-烯丙基胞苷(化合物3)；将2’,3’,5’-三乙酰基-N⁴-烯丙基胞苷加入到摩尔量为2’,3’,5’-三乙酰基尿苷至少1千倍的1～3mol/L的氨的甲醇溶液中，室温下反应12～24h，旋转蒸发仪浓缩后，经真空干燥箱干燥得到N⁴-烯丙基胞苷(化合物4)；氩气或氮气保护下，加入摩尔量为2’,3’,5’-三乙酰基尿苷10～50倍的完全干燥的磷酸三甲酯、摩尔量为2’,3’,5’-三乙酰基尿苷1.1～1.5倍的三氯氧磷，0～4℃下反应1～3小时；再加入摩尔量为2’,3’,5’-三乙酰基尿苷3～10倍的焦磷酸三丁基胺(可将其以0.6g/mL的浓度预溶于N,N’-二甲基甲酰胺中)，0～4℃搅拌10～30分钟；之后室温继续搅拌5～10分钟，加入摩尔量为2’,3’,5’-三乙酰基尿苷至少1千倍的三乙基碳酸氢铵终止反应；通过高效液相色谱分析提纯，得到N⁴-烯丙基三磷酸胞苷(化合物5)。所述各反应物的用量可按比例调整。

进一步地，所述的生物材料为染色质、细胞核、线粒体、叶绿体、细菌等。这些生物材料的来源有多种，如所述的染色质可以来源于普通哺乳动物细胞的染色质、哺乳动物癌细胞的染色质、哺乳动物干细胞的染色质、病毒的宿主细胞的染色质，或取自各种类型的组织与器官的染色质。

更进一步地，步骤(1)中染色质处理的具体方法为，从培养的细胞中获取活性细胞核，加入氯化钠溶液至终浓度0.5～1mol/L裂解细胞核；加入无核酸酶水(如DEPC处理过的水)，将氯化钠稀释至0.1～0.3mol/L，离心获取活性染色质；用甘油储存液(详见表3)溶解染色质沉淀，加入与缓冲液等体积的含N⁶-烯丙基三磷酸腺苷或N⁴-烯丙基三磷酸胞苷的转录重启缓冲液(详见表4)，16～37℃反应5～15分钟，之后用TRIzol终止反应并提取RNA。

进一步地，步骤(1)中所述的碘加成与环化处理具体为：将0.1～0.5M碘单质溶于0.2～1M碘化钾得到碘的碘化钾溶液，再使碘的碘化钾溶液与RNA a⁶A或a⁴C上的烯丙基反应，然后用0.1～0.5M硫代硫酸钠除去过量碘；再加入0.1～0.5M碳酸钠，调节pH＝9～10，诱导RNA a⁶A上的N¹,N⁶位或a⁴C上的N³,N⁴位形成环化结构，从而使腺嘌呤或胞嘧啶正常的氢键配对受到屏蔽。

进一步地，步骤(2)具体为：i)利用HIV逆转录酶逆转录上述环化处理后的RNA；ii)采用RNA文库制备技术结合高通量测序手段进行全转录组测序获取染色质RNA丰度，并通过突变位点的识别从而得到全转录组单碱基分辨率的活性RNA聚合酶位点分布。

进一步地，本发明提供的一种全转录组范围同时获取RNA丰度及活性RNA聚合酶位点的方法，还可以具有这样的特征：所述修饰的三磷酸核苷包括但不限于N⁶-烯丙基三磷酸腺苷、N⁴-烯丙基三磷酸胞苷及其衍生物、类似物；逆转录突变的逆转录酶包括但不限于HIV逆转录酶(Recombinant HIV reverse transcriptase enzyme)。

上述步骤(1)中，提取RNA的方法包括常用的纯化方法或商业化的纯化试剂盒。方法中包括但不受限于：使用TRIzol^TM Reagent,氯仿-苯酚萃取，Proteinase K消解，硅胶膜离心柱法，磁珠法，乙醇、异丙醇沉淀等技术中的一项或多项组合。纯化试剂盒包括但不仅限于：GeneElute^TM mRNAMiniprep Kit，RNeasy^TMMini Kit(Qiagen)，RNA Clean&Concentrator(Zymo)。

上述步骤(1)中，碘加成的方法包括但又不仅限于碘的碘化钾溶液(0.125M I₂,0.25M KI)，过量碘的去除方法包括但又不仅限于硫代硫酸钠处理(0.2M Na₂S₂O₃)，碱性条件下诱导环化的方法包括但又不仅限于碳酸钠、碳酸氢钠溶液(0.1M Na₂CO₃,pH＝9.5)处理，反应式如下。在碱性条件下，a⁶A的N¹,N⁶位或a⁴C的N³,N⁴位自发关环，屏蔽碱基互补配对。

上述步骤(2)中，逆转录的方法包括但又不仅限于HIV逆转录酶(Recombinant HIVreverse transcriptase enzyme)处理的方法。

上述步骤(2)中，逆转录后测序的方法包括但又不仅限于构建文库的高通量测序；建库方法包括但不仅限于illumina stranded建库，NEB small RNA建库，NEB链特异性RNA建库及改进的建库方法等。

上述步骤(1)-(2)中，各反应后的核酸纯化步骤，可以使用常用的纯化方法或商业化的纯化试剂盒。方法中包括但不受限于：硅胶膜离心柱法，磁珠法，乙醇、异丙醇沉淀等技术中的一项或多项组合。纯化试剂盒包括但不仅限于：AmpureXP beads,

PCRpurification Kit(Qiagen)，RNA Clean&Concentrator(Zymo)，DNA Clean&Concentrator(Zymo)。

本发明还提供一种全转录组范围同时获取RNA丰度及活性RNA聚合酶位点的试剂盒，包括N⁶-烯丙基三磷酸腺苷或N⁴-烯丙基三磷酸胞苷，碘的碘化钾溶液，硫代硫酸钠溶液，碳酸钠溶液，HIV逆转录酶，HIV逆转录反应液，Tris-HCl，RNase inhibitor，测序接头，测序引物。

在本发明中：

(1)碘诱导的双键加成在加成到双键上后，碘具有一定的离去性，其紧邻的碳原子可以亲电进攻电子云密度较高的原子，对于腺嘌呤和胞嘧啶而言，其嘌呤环或嘧啶环上的氮原子就具有电子云密度较高的特性，特别是腺嘌呤1号位的氮原子和胞嘧啶3号位的氮原子。因此发明人设计了N⁶-烯丙基腺苷和N⁴-烯丙基胞苷，发现其在碘加成与碱性条件下，烯丙基碘可以诱导碘原子离去后碳原子亲电进攻相邻位置的氮原子(腺嘌呤1号位的氮原子或胞嘧啶3号位的氮原子)，形成关环反应，屏蔽原本这两个位置用于碱基互补配对的氢键，从而在逆转录的过程中引发突变，借助测序的手段，达到识别N⁶-烯丙基腺嘌呤或N⁴-烯丙基胞嘧啶位点的目的；

(2)为了将上述突变测序的方法应用于RNA聚合酶位点的识别，本发明设计了体外转录重启的方法，利用RNA聚合酶、DNA、RNA三元复合物极高的稳定性，将染色质低温提取，并洗掉游离的蛋白质与RNA后，加入N⁶-烯丙基三磷酸腺苷或N⁴-烯丙基三磷酸胞苷和其他未修饰的三磷酸核苷，重启转录，从而在RNA上与RNA聚合酶的反应位点处引入N⁶-烯丙基腺嘌呤或N⁴-烯丙基胞嘧啶，通过突变测序识别N⁶-烯丙基腺嘌呤或N⁴-烯丙基胞嘧啶的位点，来达到单碱基分辨率检测活性RNA聚合酶位点的目的。同时，已经转录的部分由于没有N⁶-烯丙基腺嘌呤或N⁴-烯丙基胞嘧啶的掺入，从而在后续处理中不发生突变，是原有的染色质RNA。一次测序获取两种数据，极大地促进了RNA产生的生物学功能研究。

本发明的有益效果在于:

本发明的一种全转录组范围同时获取RNA丰度及活性RNA聚合酶位点的方法及试剂盒是基于体外RNA聚合酶的重启动、核酸腺嘌呤的化学标记与诱导突变，首次实现在活性RNA聚合酶位点进行核糖核酸(RNA)腺嘌呤的N⁶-烯丙基或胞嘧啶的N⁴-烯丙基标记，通过位点突变的方式来识别活性RNA聚合酶位点；与现有应用于活性RNA聚合酶位点检测的基因测序技术相比，由于突变位点可以精确到单碱基分辨率，提升了目前采用的基于抗体免疫沉淀与大规模平行测序方法检测RNA聚合酶位点(GRO-seq)的精度；同时，由于突变测序是先逆转录突变再进行建库，建库过程使用的是逆转录后正常的DNA，从而减少了目前采用的基于修饰碱基转录终止、生物素富集与大规模平行测序方法检测PRO-seq的信息损失；同时，由于该突变方法不需要抗体富集，因而一次测序可同时获取突变与未突变的测序信息，亦即同时获取染色质RNA丰度及活性RNA聚合酶位点信息，减除了因不同测序方法获取不同信息引入的外来误差，是一个直接的高通量多信息的单碱基鉴定方法。

本发明采用HIV逆转录酶对碘加成与诱导环化的RNA进行逆转录处理，因为在我们的研究中发现，HIV逆转录酶对于腺嘌呤用于碱基互补配对的氢键被屏蔽的环化结构具有更强的识别能力，我们选取了众多商业化的逆转录酶，包括HIV逆转录酶(ReverseTranscriptase Recombinant HIV，Worthington Biochemical Corporation)，M-MLV逆转录酶(PROMEGA,M170A)，AMV逆转录酶(PROMEGA,M510F)，RevertAid逆转录酶(Thermofisher,EP0441)，SuperScript II逆转录酶(Invitrogen,100004925)，SuperScriptⅢ逆转录酶(Invitrogen,55549)等，最终发现了HIV逆转录酶在a⁶A或a⁴C碘加成环化RNA的逆转录过程中对应位点会发生突变。

本发明在突变测序的基础上，可将其应用于多种基于基因测序的分析方法，如基于N⁶-烯丙基三磷酸腺苷或N⁴-烯丙基三磷酸胞苷的细胞RNA动态测序，以及各种体外的RNA标记等。

附图说明

图1是一种全转录组范围同时获取RNA丰度及活性RNA聚合酶位点的方法示意图；

图2是N⁶-烯丙基三磷酸腺苷的加入比例与N⁶-烯丙基腺苷的掺入比例的曲线图；

图3是采用不同方法处理的二代测序结果中rRNA所占的比例图。DC：差速离心；DGC：密度梯度离心；DGC&rD:密度梯度离心联合rRNA去除.

图4是N⁶-烯丙基三磷酸腺苷的高分辨质谱；

图5是N⁴-烯丙基三磷酸胞苷的高分辨质谱；

图6是通过RT-qPCR确定rRNA去除效率；

图7是通过qPCR确定文库中rRNA污染程度；

图8是HeLa细胞高通量测序得到的基因组上的信号分布；

图9是HeLa细胞高通量测序结果与其他活性RNA聚合酶位点测序方法的相关性热图；

图10是HeLa细胞高通量测序结果与组蛋白修饰的相关性热图；

图11是HeLa细胞高通量测序得到的染色质RNA丰度四例；

图12是HeLa细胞高通量测序得到的活性RNA聚合酶位点数据四例。

具体实施方式

下面结合附图和具体实施例对本发明进行详细的说明，但是不能把它们理解为对本发明保护范围的限定。

如图1为本发明的一种全转录组范围同时获取RNA丰度及活性RNA聚合酶位点的方法示意图。该方法的一种具体实施方式包括以下步骤：

(1)染色质的提取：样本细胞在正常培养至百分之八十左右融合度后，用蔗糖密度梯度离心的方式获取纯净的细胞核，以除去细胞质RNA与线粒体RNA的干扰。获取的活性细胞核在0.5mol/L氯化钠溶液中裂解，加入无核酸酶水，将氯化钠稀释至0.25mol/L，离心获取活性染色质。染色质需要现取现用。

(2)染色质的提取及处理：用甘油储存液(详见表3)溶解染色质沉淀，加入与甘油储存液等体积的含N⁶-烯丙基三磷酸腺苷或N⁴-烯丙基三磷酸胞苷的转录重启缓冲液(详见表4)，37℃反应5分钟，之后用TRIzol终止反应并提取RNA。

(3)碘加成RNA a⁶A上的N⁶-烯丙基诱导发生N¹,N⁶位环化或a⁴C上的N⁴-烯丙基诱导发生N³,N⁴位环化：将0.1～0.5M碘单质溶于0.2～1M碘化钾得到碘的碘化钾溶液，再使碘的碘化钾溶液与RNA a⁶A上的N⁶-烯丙基腺嘌呤的烯丙基反应，然后用0.1～0.5M硫代硫酸钠除去过量碘；再加入0.1～0.5M碳酸钠，调节pH＝9～10，诱导RNA a⁶A上的N⁶-烯丙基发生N¹,N⁶位环化或a⁴C上的N⁴-烯丙基发生N³,N⁴位环化形成环化结构，从而使腺嘌呤或胞嘧啶的正常的氢键配对受到屏蔽。

(4)环化处理RNA的逆转录突变与测序识别：RNA上N¹,N⁶环化腺嘌呤或N³,N⁴位环化胞嘧啶在体外HIV逆转录酶作用下逆转录成DNA的过程中，对位互补碱基引入发生错误，可通过核酸测序手段识别突变位点，进而得到a⁶A或a⁴C位点，该位点即为细胞RNA中原本活性RNA聚合酶的位点。同时，测序得到的未突变的序列即为染色质RNA。

本发明对可应用的生物材料没有特殊限定，所述的染色质可以为又不限于普通哺乳动物细胞的染色质、哺乳动物癌细胞的染色质、哺乳动物干细胞的染色质、病毒的宿主细胞的染色质，或取自各种类型的组织与器官的染色质，亦可将染色质替代为细胞核、线粒体、叶绿体、细菌等。

在本发明中，RNA的提取采用TRIzol提取染色质RNA，采用异丙醇沉淀法提取碘加成处理过的RNA。

本发明采用TRIzol终止染色质的体外RNA转录重启动，加入氯仿分层后，将上层上清液用等体积pH＝5.3的苯酚/氯仿溶液萃取两次，彻底去除DNA与蛋白污染；再用等体积氯仿萃取两次，去除残余的苯酚。之后加入1μg糖原作为共沉淀剂，用异丙醇沉淀法对RNA进行沉淀。具体来说，加入与RNA溶液等体积的异丙醇，混匀后放入-20℃沉淀过夜后，15000rpm转速下4℃离心45分钟，80％乙醇洗涤两次后，溶解得到上述样本的染色质RNA溶液。

本发明对N⁶-烯丙基三磷酸腺苷的比例进行了优选，如图2所示，在染色质的体外RNA转录重启动时采用了不同比例的N⁶-烯丙基三磷酸腺苷，之后将RNA纯化，酶解消化成核苷后，用液质联用进行定量。从结果图2来看，80％的N⁶-烯丙基三磷酸腺苷的比例掺入量最多，低于这个值则因比例降低而掺入量减少，高于这个值则因转录长度不足而掺入量减少。该数据未扣除rRNA的影响，扣除后预计可达0.5％～1％。

本发明在得到上述N⁶-烯丙基腺苷掺入的染色质RNA后，进一步进行碘加成与碱性条件下环化处理。在本发明中，26μL的上述RNA与4μL的0.125M碘溶液(溶于0.25M碘化钾)，在4～50℃下处理15～60分钟，更优为37℃下处理30分钟。之后，加入2～4μL的0.2M硫代硫酸钠至溶液无色，再加入6μL的0.1M碳酸钠(pH＝9～10,更优为9.5)，在4～50℃下处理15～60分钟，更优为37℃下处理30分钟。本发明在RNA碘加成与环化处理后，优选的还包括对RNA进行纯化的步骤，得到的RNA产物按照上述异丙醇沉淀法进行纯化。

本发明在细胞核提取及建库过程中对rRNA的去除进行了优选。如图3所示，当采用差速离心的方式获取细胞核并直接建库时，rRNA的测序量占总测序量的95％左右，与细胞质RNA中rRNA的比例相近，表明有较高细胞质RNA的污染；而仅仅将差速离心改变为蔗糖密度梯度离心，rRNA的测序量降为总测序量的70％左右，相当于去除了超过85％的rRNA；发明人又使用NEBNext的rRNA去除试剂盒去除rRNA，如图6所示，去除rRNA后，残余的rRNA的量不到原先的万分之三，其中28s和18s的量不到原先的十万分之三；如图7所示，建库后rRNA的相对量仅为gDNA的百倍以下。根据这些优化，发明人将rRNA的测序量降为总测序量的10％以下。从而确定了最终的实验方案。

本发明中，建库过程使用NEB链特异性RNA建库试剂盒，在rRNA去除后，经过试剂盒的片段化过程后，使用HIV逆转录酶进行逆转录后接上测序接头，并用测序引物进行PCR扩增构建高通量测序文库。在本发明中,片段化的RNA经过HIV逆转录酶逆转录后接上测序接头并用测序引物进行PCR扩增构建高通量文库优选为

Ultra IIDirectional RNALibrary Prep Kit，具体建库方法参照说明书进行。

本发明在完成测序文库构建后，对所述测序文库进行测序获得测序数据。本发明中，所述测序优选为二代测序，更优选为Illumina双端测序，所述测序的读长优选为150bp。

本发明在获得测序数据后，分析环化和未环化样品在腺苷酸位点或胞苷酸位点的突变率，若环化样品在该位点的突变率高于未环化样品的两倍以上，则认为该位点为活性RNA聚合酶所在位点。所述分析包括对所述测序数据进行质量控制、将所述数据去除接头序列、去除低质量碱基、将所述去除低质量和接头的数据比对到基因组序列并进行富集统计、将所述去除低质量和接头的数据比对到转录组序列并进行突变统计。在本发明的具体实施过程中，所述分析包括以下步骤：通过cutadapt(v1.15)默认参数对所述原始测序数据进行质量控制，并去除接头序列。得到的序列用Hisat2(v2.1.0)默认参数比对到转录组序列hg38。用Picard MarkDuplicates默认参数移除PCR重复序列，并将比对到tRNA及rRNA上的序列移除。使用bedtools genomeCoverageBed function功能将bam文件转化为bedgraph文件，并用UCSC bedGraphToBigWig tool功能将bedgraph文件转化为bigWig文件。bigWig文件可通过Integrative Genomics Viewer(IGV)软件可视化，其结果即为染色质RNA位点。A-C突变被选取，若环化样品在该位点的突变率高于未环化样品的两倍以上，则认为该位点为活性RNA聚合酶所在位点(Fold-change＝(The abundance of mutant A-to-C positions(mGRO-seq))/(The abundance of mutant A-to-C positions(Control))and Fold-change>2.)。

本发明还提供了一种全转录组范围同时获取RNA丰度及活性RNA聚合酶位点的试剂盒，包括N⁶-烯丙基三磷酸腺苷或N⁴-烯丙基三磷酸胞苷，0.125M碘的碘化钾溶液，0.2M硫代硫酸钠溶液，0.1M碳酸钠溶液(pH＝9.5)，HIV逆转录酶，HIV逆转录反应液，Tris-HCl，RNase inhibitor，测序接头，测序引物。

如图4为采用本发明方法制备的N⁶-烯丙基三磷酸腺苷(a⁶ATP)的相关表征数据(高分辨质谱，C₁₃H₂₀N₅O₁₃P₃,m/z为546.0192，[M-H]^-理论计算546.0198)，可知成功制备了a⁶ATP。

如图5为采用本发明方法制备的N⁴-烯丙基三磷酸胞苷(a⁴CTP)的相关表征数据(高分辨质谱，C₁₃H₂₀N₅O₁₃P₃,m/z为522.0080，[M-H]^-理论计算522.0158)，可知成功制备了a⁶ATP。

实施例1 HeLa细胞中染色质RNA丰度及活性RNA聚合酶位点的检测

1、HeLa细胞核提取

(1)HeLa细胞在15-cm培养皿中正常培养条件下培养至满度为百分之八十后，吸去培养基，用磷酸缓冲盐溶液(PBS)洗去残留培养基；

(2)每个15-cm培养皿中加入5mL 0.25％胰蛋白酶溶液，37℃消化5分钟；

(3)加入5mL培养基终止消化，将收获的细胞收集在50mL离心管中，RCF 1000g离心5分钟，收获细胞；

(4)用PBS清洗细胞两次，洗去残留培养基；

(5)震荡5秒，震松细胞团；

(6)将细胞以5×10⁷个每毫升的浓度，悬浮在冰上预冷的蔗糖溶液I中，用相差显微镜确定细胞浓度，蔗糖溶液I成分见表1；

表1蔗糖溶液I

(7)冰上温育5分钟后，将细胞悬浮液转移至冰上预冷的杜恩斯匀浆器中，将细胞破碎，用相差显微镜确定细胞已完全破碎；

(8)将破碎后的细胞悬液转移至50mL离心管中，加入等体积冰上预冷的蔗糖溶液II，颠倒混匀，蔗糖溶液II成分见表2；

表2蔗糖溶液II

(9)加入4.4mL蔗糖溶液II至超速离心管的底部，小心地将细胞裂解液加入到它的上层，每个离心管不可超过2×10⁸个细胞；

(10)在顶部加入蔗糖溶液I液封，在4℃、RCF 30,000g下，离心45分钟；

(11)吸走上层液体，细胞核在下层形成紧密的沉淀；

*若细胞未裂解，则不形成沉淀；若细胞核也被裂解，则生成凝胶状的染色质沉淀。

(12)震荡5秒，震松细胞核沉淀；

(13)以5×10⁷个细胞核每毫升的浓度加入冰上预冷的甘油储存液，上下吹打混匀，甘油储存液成分见表3；

表3甘油储存液

(14)每100μL细胞核悬浮液放入一管预冷的1.5mL离心管中，液氮骤冷，放于-80℃冰箱保存备用。

2、染色质获取与RNA聚合酶重启动

(1)每100μL细胞核悬浮液加入10uL 5M氯化钠溶液，混合均匀；

(2)待溶液澄清后，加入110uL DEPC处理过的水，混合均匀后，在4℃、RCF 12,000rpm下离心3分钟；

(3)转移上清液，上清液中是细胞核RNA，可用于之后的质量控制，染色质在底部形成密实的凝胶状沉淀；

(4)将沉淀用500uL的50mM pH 7.5的Tris-HCl溶液清洗两次，去除残余的细胞核RNA与氯化钠；

(5)用100uL的甘油储存液溶解染色质沉淀，之后加入等体积37℃预热的转录重启缓冲液，其中实验组使用80％a⁶ATP，控制组使用ATP，混匀后37℃震荡反应5分钟，转录重启缓冲液成分见表4；

表4转录重启缓冲液

(6)加入600uL LC-Trizol，吹打混匀，终止反应；

(7)加入0.16mL的氯仿，剧烈摇晃离心管15秒，室温萃取3分钟，在4℃、RCF 12,000g下离心15分钟，溶液分层，上层清液为RNA，中间白色沉淀主要为蛋白质，下层红色液体主要为DNA；

(8)将上层水相转移至新的离心管，加入等体积的pH 5.3的苯酚-氯仿溶液，剧烈摇晃离心管15秒，室温萃取3分钟，在4℃、RCF 12,000g下离心15分钟，去除残余的DNA与蛋白质杂质，重复两次；

(9)将上层水相转移至新的离心管，加入等体积的氯仿，剧烈摇晃离心管15秒，室温萃取3分钟，在4℃、RCF 12,000g下离心15分钟，去除残余的苯酚，重复两次；

(10)将上层水相转移至新的离心管，加入1uL的20mg/mL糖原溶液，混匀后加入等体积的异丙醇，-20℃温育30分钟，在4℃、RCF 15,000g下离心45分钟，得到染色质RNA白色沉淀；

(11)移去上清液，留下染色质RNA白色沉淀，用200uL 80％乙醇洗涤沉淀，，在4℃、RCF 15,000g下离心15分钟，重复两次，去除残余的异丙醇和盐；

(12)再次移去上清液，风干5分钟，用100μL的DEPC处理过的水溶解染色质RNA，70℃加热10分钟使染色质RNA充分溶解，共约20μg RNA，取出部分RNA用于质量控制；

3、rRNA去除

(1)将5μg染色质RNA转移进PCR管中，加入5μL DNaseI反应液，2U DNaseI，加入DEPC处理过的水至50μL，37℃反应10分钟，去除痕量DNA；

(2)加入150μL LC-Trizol，吹打混匀，终止反应，转移至1.5mL离心管中；

(3)加入40μL的氯仿，剧烈摇晃离心管15秒，室温萃取3分钟，在4℃、RCF 12,000g下离心15分钟，溶液分层，上层清液为RNA；

(4)将上层水相转移至新的离心管，加入1uL的20mg/mL糖原溶液，混匀后加入等体积的异丙醇，-20℃温育30分钟，在4℃、RCF 15,000g下离心45分钟，得到RNA白色沉淀；

(5)移去上清液，留下RNA白色沉淀，用200uL 80％乙醇洗涤沉淀，在4℃、RCF 15,000g下离心15分钟，重复两次，去除残余的异丙醇和盐；

(6)再次移去上清液，风干5分钟，用50μL的DEPC处理过的水溶解RNA，70℃加热10分钟使染色质RNA充分溶解，测量RNA的浓度，取出部分RNA与2(12)中的RNA一起做qPCR，确定DNA的残余量；

(7)使用NEBNext rRNA Depletion Kit去除rRNA，将1μL NEBNext rRNADepletion Solution，2μL Probe Hybridization Buffer在PCR管中同12μL染色质RNA混合(不超过1μg RNA)，吹打混匀后，放入PCR仪中，运行如下程序：

95℃ 2分钟

95-22℃ 0.1℃/秒

22℃ 5分钟

(8)程序结束后，放在冰上，加入1μL Nuclease-free Water，2μL RNase HReaction Buffer和2μL NEBNext RNase H，吹打混匀后，放入PCR仪中，37℃温育30分钟；

(9)程序结束后，放在冰上，加入22.5μL Nuclease-free Water，5μL DNase IReaction Buffer和2.5μL DNase I(RNase-free)，吹打混匀后，放入PCR仪中，37℃温育30分钟；

(10)使用NEBNext RNA Sample Purification Beads纯化RNA，将NEBNext RNASample Purification Beads震荡混匀后，取出110μL加入到rRNA去除的反应液中，吹打混匀，冰上温育15分钟；

(11)将PCR管放入磁台，静置5分钟至磁珠全部贴壁后，吸弃上清液；

(12)加入200μL的80％乙醇，静置30秒，吸弃上清液，重复两次；

(13)风干5分钟，用30μL的DEPC处理过的水溶解RNA，测量RNA的浓度；

4、RNA的N⁶-烯丙基腺嘌呤的碘加成反应与环化处理

(1)将26μL上述去除rRNA后的RNA转移至PCR管中，加入4μL的0.125M碘溶液(溶于0.25M碘化钾)，溶液变为棕色，在37℃下温育30分钟；

*磁珠法纯化会使溶液中存在游离的聚乙二醇，与碘进行络合，使碘的颜色加深，有利于观测。

(2)将上述棕色溶液转移至新的PCR管，加入4μL的0.2M硫代硫酸钠至溶液无色，再加入6μL的0.1M碳酸钠(pH＝9.5)，在37℃下温育30分钟；

(3)将上述40μL溶液，加入1uL的20mg/mL糖原溶液，混匀后加入等体积的异丙醇，-20℃温育过夜，在4℃、RCF 15,000g下离心45分钟，得到RNA白色沉淀；

(4)移去上清液，留下RNA白色沉淀，用200uL 80％乙醇洗涤沉淀，在4℃、RCF 15,000g下离心15分钟，重复两次，去除残余的异丙醇和盐；

(5)再次移去上清液，风干5分钟，用5μL的DEPC处理过的水溶解RNA。

5、将实验组与控制组所得RNA片段利用

Ultra II Directional RNA建库试剂盒构建文库

(1)将RNA进行片段化：将4μL NEBNext First Strand Synthesis ReactionBuffer，1μL Random Primers和4(5)中获得的5μL RNA溶液加入到PCR管中，吹打混匀，放入PCR仪中，94℃温育7分钟，RNA片段大小约为200nt；

(2)一链合成：从PCR仪中取出PCR管，立即放入冰上，加入8μL NEBNext StrandSpecificity Reagent，5μL 5x RT buffer(Thermofisher)，2μL HIV逆转录酶(约10U)，吹打混匀，放入PCR仪中，运行如下程序：

(3)二链合成：从PCR仪中取出PCR管，立即放入冰上，加入8μL NEBNext SecondStrand Synthesis Reaction Buffer with dUTP Mix(10X)、4μL NEBNext Second StrandSynthesis Enzyme Mix和43μL的DEPC处理过的水，吹打混匀，放入PCR仪中，16℃温育1小时；

(4)纯化所得双链DNA片段：向反应体系中加入144μL提前恢复至室温的AMPure XPbeads，吹打混匀6-10次后室温孵育15分钟，用磁力架分离并丢弃上清，用80％乙醇洗beads两次，每次30秒，静置5-10分钟挥发乙醇，用53μL 0.1X TE Buffer洗脱双链DNA片段，室温孵育2分钟后经磁力架分离，取50μL上清转移至新的PCR管中，用于下步反应；

(5)cDNA末端准备：往获得的cDNA中加入7μL NEBNext Ultra II End PrepReaction Buffer和3μL NEBNext Ultra II End Prep Enzyme Mix，吹打混匀，放入PCR仪中，运行如下程序：

20℃ 30分钟

65℃ 30分钟

4℃ 保持

(6)添加接头：将NEBNext Adaptor用Adaptor Dilution Buffer稀释五倍，向(5)中所得的反应液中加入2.5μL，再加入1μL NEBNext Ligation Enhancer和30μL NEBNextUltra II Ligation Master Mix，吹打混匀，放入PCR仪中，20℃温育15分钟；

(7)接头处理：向反应液中加入1μL USER Enzyme，吹打混匀，放入PCR仪中，37℃温育15分钟；

(8)纯化所得双链DNA片段：向反应体系中加入87μL提前恢复至室温的AMPure XPbeads，吹打混匀6-10次后室温孵育15分钟，用磁力架分离并丢弃上清，用80％乙醇洗beads两次，每次30秒，静置5-10分钟挥发乙醇，用17μL 0.1X TE Buffer洗脱双链DNA片段，室温孵育2分钟后经磁力架分离，取15μL上清转移至新的PCR管中，用于下步反应；

(9)PCR富集：加入5μL Index(X)Primer/i7 Primer、5μL Universal PCR Primer/i5Primer和25μL NEBNext Ultra II Q5 Master Mix，吹打混匀，放入PCR仪中，运行如下程序：

(10)纯化所得双链DNA片段：向反应体系中加入45μL提前恢复至室温的AMPure XPbeads，吹打混匀6-10次后室温孵育15分钟，用磁力架分离并丢弃上清，用80％乙醇洗beads两次，每次30秒，静置5-10分钟挥发乙醇，用23μL 0.1X TE Buffer洗脱双链DNA片段，室温孵育2分钟后经磁力架分离，取20μL上清转移至新的PCR管中，其中1μL用于Qubit测定浓度，-20℃保存；

(11)将得到的文库利用illumina X-10平台进行双端150测序，得到的数据经低质量过滤、接头过滤后与HeLa细胞的转录组进行比对，未突变的reads即为HeLa细胞中染色质RNA丰度信息，突变位点即为HeLa细胞中活性RNA聚合酶位点。其与公开文献相比，新生RNA的信号分布比例类似，内含子占据一半左右的比例(图8)；与其他新生RNA检测方法如GRO-seq,NET-seq,mNET-seq,ATAC-seq,Pol II ChIP-seq有较强的相关性(图9)；同时和标示染色体活性转录区域的组蛋白修饰(H3K79me2,H3K9ac,H3K4me3,H3K36me3)分布正相关，而和标示染色体转录抑制区域的组蛋白修饰(H3K27me3,H3K9me3)负相关(图10)。说明该方法检测的RNA为新生RNA。与同类方法相比，染色质RNA丰度信息与文献报道的chrRNA-seq转录信息信号相似(图11)，检测的活性RNA聚合酶位点的信号也与文献报道的GRO-seq信号相似(图12)，说明本方法所检测的信息和所识别的位点真实有效。

Claims

1.一种全转录组范围同时获取RNA丰度及活性RNA聚合酶位点的方法，其特征在于，包括以下步骤：

(1)N⁶-烯丙基三磷酸腺苷或N⁴-烯丙基三磷酸胞苷标记活性RNA聚合酶位点：用未修饰的三磷酸核苷、和N⁶-烯丙基三磷酸腺苷或N⁴-烯丙基三磷酸胞苷处理带有活性RNA聚合酶的生物材料，活性RNA聚合酶将N⁶-烯丙基三磷酸腺苷或N⁴-烯丙基三磷酸胞苷引入到新生RNA中的腺嘌呤或胞嘧啶位点上，在该位点形成N⁶-烯丙基腺嘌呤或N⁴-烯丙基胞嘧啶，经过碘加成与环化处理后，形成N¹,N⁶-环化腺嘌呤或N³,N⁴-环化胞嘧啶的环化结构，屏蔽碱基互补配对；

(2)环化处理后的RNA的逆转录突变与测序识别：向步骤(1)获得的环化结构中加入HIV逆转录酶，RNA上的N¹,N⁶-环化腺嘌呤或N³,N⁴-环化胞嘧啶在HIV逆转录酶作用下逆转录成DNA的过程中，对位互补碱基引入发生错误，通过核酸测序手段识别突变位点，进而得到a⁶A或a⁴C位点，该位点即为新生RNA中活性RNA聚合酶的位点。

2.根据权利要求1所述的一种全转录组范围同时获取RNA丰度及活性RNA聚合酶位点的方法，其特征在于，步骤(1)中，N⁶-烯丙基三磷酸腺苷的制备方法为：在氩气或氮气保护下，以摩尔比为1:1.5～3:3～10的6-氯嘌呤核苷、碳酸钙和烯丙基胺为原料，乙醇为溶剂，加热回流8～16小时，过滤除去不溶物，-20℃沉淀过夜，获得N⁶-烯丙基腺苷；加入摩尔量为6-氯代嘌呤核苷5～50倍的完全干燥的磷酸三甲酯、摩尔量为6-氯代嘌呤核苷1.1～2倍的三氯氧磷，0～4℃搅拌0.5～3小时至反应液完全澄清；再加入摩尔量为6-氯代嘌呤核苷2～10倍的焦磷酸三丁基胺，0～4℃搅拌10～30分钟；之后室温继续搅拌5～10分钟，加入摩尔量为6-氯代嘌呤核苷至少1千倍的三乙基碳酸氢铵终止反应；通过高效液相色谱分析提纯，得到N⁶-烯丙基三磷酸腺苷。

3.根据权利要求1所述的一种全转录组范围同时获取RNA丰度及活性RNA聚合酶位点的方法，其特征在于，步骤(1)中，N⁴-烯丙基三磷酸胞苷的制备方法为：在氩气或氮气保护下，以摩尔比为1:1.5～3:1.5～3:1.1～2的2’,3’,5’-三乙酰基尿苷、1-氢-四氮唑、对甲苯磺酰氯和磷酸二苯酯为原料，吡啶为溶剂，室温下搅拌反应1～2天，加入去离子水淬灭，并用二氯甲烷萃取，反复用0.5～2mol/L的盐酸洗涤至水相呈酸性；旋转蒸发仪浓缩后，经硅胶柱纯化，获得4-四唑-2’,3’,5’-三乙酰胞苷；将4-四唑-2’,3’,5’-三乙酰胞苷溶于乙腈，将摩尔量为2’,3’,5’-三乙酰基尿苷一倍的氢氧化钾和摩尔量为2’,3’,5’-三乙酰基尿苷一倍的烯丙胺盐酸盐混合并依次加入水，乙腈，三乙胺以及溶于乙腈的4-四唑-2’,3’,5’-三乙酰胞苷，室温下反应12～24h，旋转蒸发仪浓缩后，经硅胶柱纯化，获得2’,3’,5’-三乙酰基-N⁴-烯丙基胞苷；将2’,3’,5’-三乙酰基-N⁴-烯丙基胞苷加入到摩尔量为2’,3’,5’-三乙酰基尿苷至少1千倍的1～3mol/L的氨的甲醇溶液中，室温下反应12～24h，旋转蒸发仪浓缩后，经真空干燥箱干燥得到N⁴-烯丙基胞苷；氩气或氮气保护下，加入摩尔量为2’,3’,5’-三乙酰基尿苷10～50倍的完全干燥的磷酸三甲酯、摩尔量为2’,3’,5’-三乙酰基尿苷1.1～1.5倍的三氯氧磷，0～4℃下反应1～3小时；再加入摩尔量为2’,3’,5’-三乙酰基尿苷3～10倍的焦磷酸三丁基胺，0～4℃搅拌10～30分钟；之后室温继续搅拌5～10分钟，加入摩尔量为2’,3’,5’-三乙酰基尿苷至少1千倍的三乙基碳酸氢铵终止反应；通过高效液相色谱分析提纯，得到N⁴-烯丙基三磷酸胞苷。

4.根据权利要求1所述的一种全转录组范围同时获取RNA丰度及活性RNA聚合酶位点的方法，其特征在于，步骤(1)中，所述的生物材料为染色质、细胞核、线粒体、叶绿体、细菌。

5.根据权利要求4所述的一种全转录组范围同时获取RNA丰度及活性RNA聚合酶位点的方法，其特征在于，步骤(1)中处理染色质的具体方法为，从细胞中获取活性细胞核，加入氯化钠溶液至终浓度0.5～1mol/L裂解细胞核；加入无核酸酶水，将氯化钠稀释至0.1～0.3mol/L，离心获取活性染色质；用甘油储存液溶解染色质沉淀，再加入与甘油储存液等体积的含N⁶-烯丙基三磷酸腺苷或N⁴-烯丙基三磷酸胞苷的转录重启缓冲液，16～37℃反应5～15分钟，之后用TRIzol终止反应并提取RNA。

6.根据权利要求1所述的一种全转录组范围同时获取RNA丰度及活性RNA聚合酶位点的方法，其特征在于，步骤(1)中所述的碘加成与环化处理具体为：将0.1～0.5M碘单质溶于0.2～1M碘化钾得到碘的碘化钾溶液，再使碘的碘化钾溶液与RNA a⁶A或a⁴C上的烯丙基反应，然后用0.1～0.5M硫代硫酸钠除去过量碘；再加入0.1～0.5M碳酸钠，调节pH＝9～10，诱导RNA a⁶A上的N¹,N⁶位或a⁴C上的N³,N⁴位形成环化结构，从而使正常的氢键配对受到屏蔽。

7.根据权利要求1所述的一种全转录组范围同时获取RNA丰度及活性RNA聚合酶位点的方法，其特征在于，所述步骤(2)具体为：i)利用HIV逆转录酶逆转录上述环化处理后的RNA；ii)采用RNA文库制备技术结合高通量测序手段进行全转录组测序获取染色质RNA丰度，并通过突变位点的识别从而得到全转录组单碱基分辨率的活性RNA聚合酶位点分布。

8.一种全转录组范围同时获取RNA丰度及活性RNA聚合酶位点的试剂盒，其特征在于，包括：N⁶-烯丙基三磷酸腺苷或N⁴-烯丙基三磷酸胞苷，碘的碘化钾溶液，硫代硫酸钠溶液，碳酸钠溶液，HIV逆转录酶，HIV逆转录反应液，Tris-HCl，RNase inhibitor，测序接头，测序引物。