CN112301118A - 一种全转录组范围同时获取rna丰度及活性rna聚合酶位点的方法及试剂盒 - Google Patents
一种全转录组范围同时获取rna丰度及活性rna聚合酶位点的方法及试剂盒 Download PDFInfo
- Publication number
- CN112301118A CN112301118A CN202011191413.4A CN202011191413A CN112301118A CN 112301118 A CN112301118 A CN 112301118A CN 202011191413 A CN202011191413 A CN 202011191413A CN 112301118 A CN112301118 A CN 112301118A
- Authority
- CN
- China
- Prior art keywords
- rna
- allyl
- active
- rna polymerase
- sequencing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 65
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 title claims abstract description 57
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 title claims abstract description 57
- 238000012163 sequencing technique Methods 0.000 claims abstract description 58
- 108010077544 Chromatin Proteins 0.000 claims abstract description 56
- 210000003483 chromatin Anatomy 0.000 claims abstract description 56
- 230000035772 mutation Effects 0.000 claims abstract description 30
- -1 nucleoside triphosphates Chemical class 0.000 claims abstract description 29
- ZKHQWZAMYRWXGA-UHFFFAOYSA-N Adenosine triphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)C(O)C1O ZKHQWZAMYRWXGA-UHFFFAOYSA-N 0.000 claims abstract description 25
- 238000010839 reverse transcription Methods 0.000 claims abstract description 18
- 239000002777 nucleoside Substances 0.000 claims abstract description 17
- WTYYPLSFICPDGL-QYVSTXNMSA-N N-Allyladenosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(NCC=C)=C2N=C1 WTYYPLSFICPDGL-QYVSTXNMSA-N 0.000 claims abstract description 16
- 239000001226 triphosphate Substances 0.000 claims abstract description 14
- 235000011178 triphosphate Nutrition 0.000 claims abstract description 14
- 238000011282 treatment Methods 0.000 claims abstract description 12
- 239000000126 substance Substances 0.000 claims abstract description 7
- 238000002372 labelling Methods 0.000 claims abstract description 6
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 6
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 6
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 6
- 239000000243 solution Substances 0.000 claims description 61
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 claims description 45
- NLKNQRATVPKPDG-UHFFFAOYSA-M potassium iodide Chemical compound [K+].[I-] NLKNQRATVPKPDG-UHFFFAOYSA-M 0.000 claims description 40
- 229910052740 iodine Inorganic materials 0.000 claims description 32
- ZCYVEMRRCGMTRW-UHFFFAOYSA-N 7553-56-2 Chemical compound [I] ZCYVEMRRCGMTRW-UHFFFAOYSA-N 0.000 claims description 31
- 239000011630 iodine Substances 0.000 claims description 31
- 238000006243 chemical reaction Methods 0.000 claims description 28
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 28
- 210000004027 cell Anatomy 0.000 claims description 27
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 claims description 26
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 claims description 24
- 108010078851 HIV Reverse Transcriptase Proteins 0.000 claims description 21
- 229910001868 water Inorganic materials 0.000 claims description 19
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 claims description 18
- CDBYLPFSWZWCQE-UHFFFAOYSA-L Sodium Carbonate Chemical compound [Na+].[Na+].[O-]C([O-])=O CDBYLPFSWZWCQE-UHFFFAOYSA-L 0.000 claims description 18
- 238000002156 mixing Methods 0.000 claims description 18
- 239000002244 precipitate Substances 0.000 claims description 18
- 230000035897 transcription Effects 0.000 claims description 18
- 238000013518 transcription Methods 0.000 claims description 18
- AUFUWRKPQLGTGF-FMKGYKFTSA-N uridine triacetate Chemical compound CC(=O)O[C@@H]1[C@H](OC(C)=O)[C@@H](COC(=O)C)O[C@H]1N1C(=O)NC(=O)C=C1 AUFUWRKPQLGTGF-FMKGYKFTSA-N 0.000 claims description 16
- 238000007363 ring formation reaction Methods 0.000 claims description 15
- 229930024421 Adenine Natural products 0.000 claims description 14
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 claims description 14
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 claims description 14
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 claims description 14
- 229960000643 adenine Drugs 0.000 claims description 14
- 229940104302 cytosine Drugs 0.000 claims description 13
- 238000003756 stirring Methods 0.000 claims description 13
- 238000005406 washing Methods 0.000 claims description 13
- XKRFYHLGVUSROY-UHFFFAOYSA-N Argon Chemical compound [Ar] XKRFYHLGVUSROY-UHFFFAOYSA-N 0.000 claims description 12
- 229910052757 nitrogen Inorganic materials 0.000 claims description 12
- 238000012165 high-throughput sequencing Methods 0.000 claims description 9
- 229910000029 sodium carbonate Inorganic materials 0.000 claims description 9
- AKHNMLFCWUSKQB-UHFFFAOYSA-L sodium thiosulfate Chemical compound [Na+].[Na+].[O-]S([O-])(=O)=S AKHNMLFCWUSKQB-UHFFFAOYSA-L 0.000 claims description 9
- 235000019345 sodium thiosulphate Nutrition 0.000 claims description 9
- XHXFXVLFKHQFAL-UHFFFAOYSA-N phosphoryl trichloride Chemical compound ClP(Cl)(Cl)=O XHXFXVLFKHQFAL-UHFFFAOYSA-N 0.000 claims description 8
- 238000002360 preparation method Methods 0.000 claims description 7
- 239000011780 sodium chloride Substances 0.000 claims description 7
- 239000011550 stock solution Substances 0.000 claims description 7
- VVJKKWFAADXIJK-UHFFFAOYSA-N Allylamine Chemical compound NCC=C VVJKKWFAADXIJK-UHFFFAOYSA-N 0.000 claims description 6
- YMWUJEATGCHHMB-UHFFFAOYSA-N Dichloromethane Chemical compound ClCCl YMWUJEATGCHHMB-UHFFFAOYSA-N 0.000 claims description 6
- KWYUFKZDYYNOTN-UHFFFAOYSA-M Potassium hydroxide Chemical compound [OH-].[K+] KWYUFKZDYYNOTN-UHFFFAOYSA-M 0.000 claims description 6
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 claims description 6
- ZMANZCXQSJIPKH-UHFFFAOYSA-N Triethylamine Chemical compound CCN(CC)CC ZMANZCXQSJIPKH-UHFFFAOYSA-N 0.000 claims description 6
- 229910052786 argon Inorganic materials 0.000 claims description 6
- 230000000295 complement effect Effects 0.000 claims description 6
- 210000004940 nucleus Anatomy 0.000 claims description 6
- 239000000741 silica gel Substances 0.000 claims description 6
- 229910002027 silica gel Inorganic materials 0.000 claims description 6
- 239000012620 biological material Substances 0.000 claims description 5
- 238000009826 distribution Methods 0.000 claims description 5
- 239000001257 hydrogen Substances 0.000 claims description 5
- 229910052739 hydrogen Inorganic materials 0.000 claims description 5
- WJFREWBMJPXLBS-UHFFFAOYSA-N n,n-dibutylbutan-1-amine;phosphono dihydrogen phosphate Chemical compound OP(O)(=O)OP(O)(O)=O.CCCCN(CCCC)CCCC WJFREWBMJPXLBS-UHFFFAOYSA-N 0.000 claims description 5
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 claims description 4
- 125000003903 2-propenyl group Chemical group [H]C([*])([H])C([H])=C([H])[H] 0.000 claims description 4
- YYROPELSRYBVMQ-UHFFFAOYSA-N 4-toluenesulfonyl chloride Chemical compound CC1=CC=C(S(Cl)(=O)=O)C=C1 YYROPELSRYBVMQ-UHFFFAOYSA-N 0.000 claims description 4
- VTYYLEPIZMXCLO-UHFFFAOYSA-L Calcium carbonate Chemical compound [Ca+2].[O-]C([O-])=O VTYYLEPIZMXCLO-UHFFFAOYSA-L 0.000 claims description 4
- PCDQPRRSZKQHHS-CCXZUQQUSA-N Cytarabine Triphosphate Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 PCDQPRRSZKQHHS-CCXZUQQUSA-N 0.000 claims description 4
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 claims description 4
- JUJWROOIHBZHMG-UHFFFAOYSA-N Pyridine Chemical compound C1=CC=NC=C1 JUJWROOIHBZHMG-UHFFFAOYSA-N 0.000 claims description 4
- 238000001914 filtration Methods 0.000 claims description 4
- 238000010438 heat treatment Methods 0.000 claims description 4
- 238000004128 high performance liquid chromatography Methods 0.000 claims description 4
- 230000001939 inductive effect Effects 0.000 claims description 4
- PNDPGZBMCMUPRI-UHFFFAOYSA-N iodine Chemical compound II PNDPGZBMCMUPRI-UHFFFAOYSA-N 0.000 claims description 4
- 239000002994 raw material Substances 0.000 claims description 4
- 239000002904 solvent Substances 0.000 claims description 4
- WVLBCYQITXONBZ-UHFFFAOYSA-N trimethyl phosphate Chemical compound COP(=O)(OC)OC WVLBCYQITXONBZ-UHFFFAOYSA-N 0.000 claims description 4
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 claims description 3
- 241000894006 Bacteria Species 0.000 claims description 3
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 claims description 3
- 230000009471 action Effects 0.000 claims description 3
- 210000003763 chloroplast Anatomy 0.000 claims description 3
- 125000004122 cyclic group Chemical group 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 claims description 3
- AFQIYTIJXGTIEY-UHFFFAOYSA-N hydrogen carbonate;triethylazanium Chemical compound OC(O)=O.CCN(CC)CC AFQIYTIJXGTIEY-UHFFFAOYSA-N 0.000 claims description 3
- 210000003470 mitochondria Anatomy 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 239000003161 ribonuclease inhibitor Substances 0.000 claims description 3
- 239000011734 sodium Substances 0.000 claims description 3
- DKNPRRRKHAEUMW-UHFFFAOYSA-N Iodine aqueous Chemical compound [K+].I[I-]I DKNPRRRKHAEUMW-UHFFFAOYSA-N 0.000 claims description 2
- 230000002378 acidificating effect Effects 0.000 claims description 2
- CBHOOMGKXCMKIR-UHFFFAOYSA-N azane;methanol Chemical compound N.OC CBHOOMGKXCMKIR-UHFFFAOYSA-N 0.000 claims description 2
- 239000007853 buffer solution Substances 0.000 claims description 2
- 229910000019 calcium carbonate Inorganic materials 0.000 claims description 2
- 239000012295 chemical reaction liquid Substances 0.000 claims description 2
- 239000008367 deionised water Substances 0.000 claims description 2
- 229910021641 deionized water Inorganic materials 0.000 claims description 2
- ASMQGLCHMVWBQR-UHFFFAOYSA-M diphenyl phosphate Chemical compound C=1C=CC=CC=1OP(=O)([O-])OC1=CC=CC=C1 ASMQGLCHMVWBQR-UHFFFAOYSA-M 0.000 claims description 2
- 238000001035 drying Methods 0.000 claims description 2
- 230000001376 precipitating effect Effects 0.000 claims description 2
- UMJSCPRVCHMLSP-UHFFFAOYSA-N pyridine Natural products COC1=CC=CN=C1 UMJSCPRVCHMLSP-UHFFFAOYSA-N 0.000 claims description 2
- 238000010791 quenching Methods 0.000 claims description 2
- 230000000171 quenching effect Effects 0.000 claims description 2
- 238000010992 reflux Methods 0.000 claims description 2
- 238000001291 vacuum drying Methods 0.000 claims description 2
- 238000012049 whole transcriptome sequencing Methods 0.000 claims description 2
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 claims 1
- 150000003254 radicals Chemical class 0.000 claims 1
- 229910052708 sodium Inorganic materials 0.000 claims 1
- 238000000338 in vitro Methods 0.000 abstract description 7
- PESODIMBTPDRTA-UHFFFAOYSA-N n-prop-2-enyl-7h-purin-6-amine Chemical compound C=CCNC1=NC=NC2=C1NC=N2 PESODIMBTPDRTA-UHFFFAOYSA-N 0.000 abstract description 3
- 229920002477 rna polymer Polymers 0.000 description 115
- 239000000203 mixture Substances 0.000 description 37
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 25
- 239000006228 supernatant Substances 0.000 description 22
- 108020004414 DNA Proteins 0.000 description 17
- 239000011324 bead Substances 0.000 description 13
- 210000003855 cell nucleus Anatomy 0.000 description 13
- 238000010276 construction Methods 0.000 description 13
- 238000000746 purification Methods 0.000 description 13
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 12
- 102100034343 Integrase Human genes 0.000 description 10
- 229930006000 Sucrose Natural products 0.000 description 10
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 10
- 238000007664 blowing Methods 0.000 description 10
- 239000005720 sucrose Substances 0.000 description 10
- 238000001514 detection method Methods 0.000 description 9
- 108090000623 proteins and genes Proteins 0.000 description 9
- 239000000523 sample Substances 0.000 description 9
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 8
- 239000012634 fragment Substances 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 7
- 238000010009 beating Methods 0.000 description 7
- 239000000872 buffer Substances 0.000 description 7
- 238000010348 incorporation Methods 0.000 description 7
- 102000053602 DNA Human genes 0.000 description 6
- 102000004190 Enzymes Human genes 0.000 description 6
- 108090000790 Enzymes Proteins 0.000 description 6
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 6
- 238000001556 precipitation Methods 0.000 description 6
- 238000000605 extraction Methods 0.000 description 5
- 125000004433 nitrogen atom Chemical group N* 0.000 description 5
- 102000004169 proteins and genes Human genes 0.000 description 5
- 239000011535 reaction buffer Substances 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 4
- 229920002527 Glycogen Polymers 0.000 description 4
- 239000008346 aqueous phase Substances 0.000 description 4
- 229940096919 glycogen Drugs 0.000 description 4
- 239000001963 growth medium Substances 0.000 description 4
- 239000007788 liquid Substances 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000003908 quality control method Methods 0.000 description 4
- 108010033040 Histones Proteins 0.000 description 3
- 238000011529 RT qPCR Methods 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 108091092330 cytoplasmic RNA Proteins 0.000 description 3
- 238000000432 density-gradient centrifugation Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000001085 differential centrifugation Methods 0.000 description 3
- 238000007865 diluting Methods 0.000 description 3
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 3
- 238000004896 high resolution mass spectrometry Methods 0.000 description 3
- 238000001114 immunoprecipitation Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 239000002953 phosphate buffered saline Substances 0.000 description 3
- 150000003839 salts Chemical class 0.000 description 3
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- LQLQRFGHAALLLE-UHFFFAOYSA-N 5-bromouracil Chemical compound BrC1=CNC(=O)NC1=O LQLQRFGHAALLLE-UHFFFAOYSA-N 0.000 description 2
- 108091032955 Bacterial small RNA Proteins 0.000 description 2
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 2
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 2
- 101710203526 Integrase Proteins 0.000 description 2
- ZMXDDKWLCZADIW-UHFFFAOYSA-N N,N-Dimethylformamide Chemical compound CN(C)C=O ZMXDDKWLCZADIW-UHFFFAOYSA-N 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- 239000013614 RNA sample Substances 0.000 description 2
- UIIMBOGNXHQVGW-UHFFFAOYSA-M Sodium bicarbonate Chemical compound [Na+].OC([O-])=O UIIMBOGNXHQVGW-UHFFFAOYSA-M 0.000 description 2
- 238000007605 air drying Methods 0.000 description 2
- 125000004429 atom Chemical group 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008827 biological function Effects 0.000 description 2
- 229960002685 biotin Drugs 0.000 description 2
- 235000020958 biotin Nutrition 0.000 description 2
- 239000011616 biotin Substances 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 201000011510 cancer Diseases 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 125000004432 carbon atom Chemical group C* 0.000 description 2
- 239000006285 cell suspension Substances 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 229940125782 compound 2 Drugs 0.000 description 2
- 229940126214 compound 3 Drugs 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 210000004962 mammalian cell Anatomy 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 239000012071 phase Substances 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 239000000376 reactant Substances 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000007789 sealing Methods 0.000 description 2
- 239000013049 sediment Substances 0.000 description 2
- 210000000130 stem cell Anatomy 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 230000005030 transcription termination Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical group N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 1
- QGZKDVFQNNGYKY-UHFFFAOYSA-O Ammonium Chemical compound [NH4+] QGZKDVFQNNGYKY-UHFFFAOYSA-O 0.000 description 1
- BVKZGUZCCUSVTD-UHFFFAOYSA-M Bicarbonate Chemical compound OC([O-])=O BVKZGUZCCUSVTD-UHFFFAOYSA-M 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- 238000001353 Chip-sequencing Methods 0.000 description 1
- 229930183912 Cytidylic acid Natural products 0.000 description 1
- AHCYMLUZIRLXAA-SHYZEUOFSA-N Deoxyuridine 5'-triphosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C=C1 AHCYMLUZIRLXAA-SHYZEUOFSA-N 0.000 description 1
- 108010067770 Endopeptidase K Proteins 0.000 description 1
- 108091092584 GDNA Proteins 0.000 description 1
- 102000043141 Nuclear RNA Human genes 0.000 description 1
- 108020003217 Nuclear RNA Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- 108090000631 Trypsin Proteins 0.000 description 1
- 102000004142 Trypsin Human genes 0.000 description 1
- 238000007259 addition reaction Methods 0.000 description 1
- UDMBCSSLTHHNCD-KQYNXXCUSA-N adenosine 5'-monophosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O UDMBCSSLTHHNCD-KQYNXXCUSA-N 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 108091092328 cellular RNA Proteins 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- VOAXAOULFRTTAM-UHFFFAOYSA-N chloroform phenol Chemical compound C1(=CC=CC=C1)O.C(Cl)(Cl)Cl.C1(=CC=CC=C1)O.C1(=CC=CC=C1)O VOAXAOULFRTTAM-UHFFFAOYSA-N 0.000 description 1
- YTRQFSDWAXHJCC-UHFFFAOYSA-N chloroform;phenol Chemical compound ClC(Cl)Cl.OC1=CC=CC=C1 YTRQFSDWAXHJCC-UHFFFAOYSA-N 0.000 description 1
- 229940125904 compound 1 Drugs 0.000 description 1
- 229940125898 compound 5 Drugs 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 230000000875 corresponding effect Effects 0.000 description 1
- 238000005336 cracking Methods 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 1
- IERHLVCPSMICTF-XVFCMESISA-N cytidine 5'-monophosphate Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(O)=O)O1 IERHLVCPSMICTF-XVFCMESISA-N 0.000 description 1
- IERHLVCPSMICTF-UHFFFAOYSA-N cytidine monophosphate Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(COP(O)(O)=O)O1 IERHLVCPSMICTF-UHFFFAOYSA-N 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 239000013024 dilution buffer Substances 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000006862 enzymatic digestion Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 108010051779 histone H3 trimethyl Lys4 Proteins 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 1
- 238000001819 mass spectrum Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 108091064355 mitochondrial RNA Proteins 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 231100000219 mutagenic Toxicity 0.000 description 1
- 230000003505 mutagenic effect Effects 0.000 description 1
- 238000007481 next generation sequencing Methods 0.000 description 1
- 150000003833 nucleoside derivatives Chemical class 0.000 description 1
- 125000003835 nucleoside group Chemical group 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000002135 phase contrast microscopy Methods 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 125000000714 pyrimidinyl group Chemical group 0.000 description 1
- 238000003762 quantitative reverse transcription PCR Methods 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 229910000030 sodium bicarbonate Inorganic materials 0.000 description 1
- 235000017557 sodium bicarbonate Nutrition 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 1
- 239000012588 trypsin Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H1/00—Processes for the preparation of sugar derivatives
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H19/00—Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
- C07H19/02—Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
- C07H19/04—Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
- C07H19/16—Purine radicals
- C07H19/20—Purine radicals with the saccharide radical esterified by phosphoric or polyphosphoric acids
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Immunology (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- Analytical Chemistry (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Saccharide Compounds (AREA)
Abstract
本发明提供一种全转录组范围同时获取RNA丰度及活性RNA聚合酶位点的方法及试剂盒。该方法基于活性RNA聚合酶可在体外将未修饰的三磷酸核苷、N6‑烯丙基三磷酸腺苷(a6ATP)、N4‑烯丙基三磷酸胞苷(a4CTP)转录进新生RNA中,经化学处理诱导使修饰碱基在逆转录成DNA过程中发生碱基突变,然后通过核酸测序手段识别突变位点,进而得到N6‑烯丙基腺嘌呤(a6A)和N4‑烯丙基胞嘧啶(a4C)位点,该位点即为活性RNA聚合酶原本所在的位点。未突变的部分即为原有的RNA,即可得到新生RNA的丰度。本发明首次实现了在隔离的染色质中进行a6A、a4C的特异性标记,能够借助突变测序的手段进行定位,并利用一次测序获取活性聚合酶位点与RNA丰度两种信息。
Description
技术领域
本发明属于基因测序领域,特别是一种全转录组范围同时获取RNA丰度及活性RNA聚合酶位点的方法及试剂盒。
背景技术
RNA在生物体遗传信息的传递中起到了承上启下的作用,它的丰度直接影响了下游蛋白质的生产速率,细胞面对外界的刺激也会第一时间反映在RNA的变化中,有着极其重要的生物学功能。对RNA的研究中,针对RNA的产生的研究是其中重要的一环,也是应激反应最直接的体现。RNA在生产过程中经历了多种调控,新生RNA的变化直接反映了转录调控的多种机理。对新生RNA丰度的检测与正在进行转录的精确位置的鉴定是研究其生物学意义的前提条件。转录的精确位置在聚合酶上是活性位点(本发明中简称为RNA聚合酶位点),在DNA上是转录位点,在RNA上是聚合位点。在转录复合物DNA-RNA-RNA聚合酶的三元复合体中三点合一,为同一位点。
目前来说,染色质RNA的丰度与活性RNA聚合酶位点是不同的测序信息,需要分别建库测序来获取。它们不同的测序方法,会导致测序中的差异,从而对研究造成干扰。目前,通过掺入5-溴尿嘧啶,然后经过免疫沉淀后建库的方式(GRO-seq)可以获取活性RNA聚合酶的位点,但分辨率仅有50碱基区域范围内,且对建库过程有极高的要求;为了提高分辨率,还将5-溴尿嘧啶换成了带生物素修饰的碱基(PRO-seq),具体来说,就是通过掺入带生物素修饰的三磷酸核苷,使RNA聚合酶在碱基掺入处发生终止,进而免疫沉淀建库后,通过分析终止信息来确定活性RNA聚合酶的位点。尽管该方法的分辨率得到了提升,但接近转录起始位点的小RNA难以建库,造成数据损失;同时,RNA的3’端生物素的修饰导致了在后续建库过程中,连接与逆转录的效率低,这同样造成了数据的损失,因此导致了检测位点的减少。
根据以上分析可知,现有的新生RNA的高通量分析手段未获得重大突破的原因主要有三点:①不同数据难以用同种方式获取,引入新的变量;②针对活性RNA聚合酶位置的检测方式有着内在的冲突,利用对酶友好的标记方式则需要忍受较低的分辨率,利用对酶不友好的标记方式则要忍受较高的信息损失,缺乏一种两全其美的标记方式。
因此,一种新的在全转录组范围同时获取RNA丰度及活性RNA聚合酶位点的方法亟待开发。
发明内容
针对现有技术中存在的缺点,本发明目的在于提供一种全转录组范围同时获取RNA丰度及活性RNA聚合酶位点的方法及试剂盒,不同于传统利用抗体富集的方式仅能获取一种数据,亦不同于传统通过转录终止的方式得到单碱基分辨率。本发明通过突变测序的方式,无需抗体富集,可直接在全转录组范围单碱基分辨率下检测活性RNA聚合酶位点,并同时获取染色质RNA丰度。
本发明采用以下技术方案:
一种全转录组范围同时获取RNA丰度及活性RNA聚合酶位点的方法,包括以下步骤:
(1)N6-烯丙基三磷酸腺苷或N4-烯丙基三磷酸胞苷标记活性RNA聚合酶位点:用未修饰的三磷酸核苷、和修饰的三磷酸核苷N6-烯丙基三磷酸腺苷或N4-烯丙基三磷酸胞苷处理带有活性RNA聚合酶的生物材料,活性RNA聚合酶将N6-烯丙基三磷酸腺苷或N4-烯丙基三磷酸胞苷引入到新生RNA中的腺嘌呤或胞嘧啶位点上,在该位点形成N6-烯丙基腺嘌呤(a6A)或N4-烯丙基胞嘧啶(a4C),RNA纯化后,经过碘加成与环化处理后,形成环化结构,屏蔽碱基互补配对;
(2)环化处理后的RNA的逆转录突变与测序识别:向步骤(1)获得的环化结构中加入HIV逆转录酶,RNA上的N1,N6环化腺嘌呤或N3,N4环化胞嘧啶在HIV逆转录酶作用下逆转录成DNA的过程中,对位互补碱基引入发生错误,通过核酸测序手段识别突变位点,进而得到a6A或a4C位点,该位点即为新生RNA中活性RNA聚合酶的位点。
上述技术方案中,进一步地,步骤(1)中,N6-烯丙基三磷酸腺苷的制备方法为:在氩气或氮气保护下,以摩尔比为1:1.5~3:3~10(优选1:2:5)的6-氯嘌呤核苷(化合物1)、碳酸钙和烯丙基胺为原料,乙醇为溶剂,加热回流8~16小时,过滤除去不溶物,-20℃沉淀过夜,获得N6-烯丙基腺苷(化合物2);加入摩尔量为6-氯代嘌呤核苷5~50倍的完全干燥的磷酸三甲酯、摩尔量为6-氯代嘌呤核苷1.1~2倍的三氯氧磷,0~4℃搅拌0.5~3小时至反应液完全澄清;再加入摩尔量为6-氯代嘌呤核苷2~10倍的焦磷酸三丁基胺(如将其以0.6g/mL的浓度预溶于N,N’-二甲基甲酰胺中),0~4℃搅拌10~30分钟;之后室温继续搅拌5~10分钟,加入摩尔量为6-氯代嘌呤核苷至少1千倍的三乙基碳酸氢铵终止反应;通过高效液相色谱(HPLC)分析提纯,得到N6-烯丙基三磷酸腺苷(a6ATP,化合物3)。所述各反应物的用量可按比例调整。
进一步地,步骤(1)中,N4-烯丙基三磷酸胞苷的制备方法为:在氩气或氮气保护下,以摩尔比为1:1.5~3:1.5~3:1.1~2(优选1:2:2:1.5)的2’,3’,5’-三乙酰基尿苷、1-氢-四氮唑、对甲苯磺酰氯和磷酸二苯酯为原料,吡啶为溶剂,室温下搅拌反应1~2天,加入去离子水淬灭,并用二氯甲烷萃取,反复用0.5~2mol/L的盐酸洗涤至水相呈酸性。旋转蒸发仪浓缩后,经硅胶柱纯化,获得4-四唑-2’,3’,5’-三乙酰胞苷(化合物2);将4-四唑-2’,3’,5’-三乙酰胞苷溶于乙腈,将摩尔量为2’,3’,5’-三乙酰基尿苷一倍的氢氧化钾和摩尔量为2’,3’,5’-三乙酰基尿苷一倍的烯丙胺盐酸盐预先加入到圆底烧瓶中并密封,随后依次加入水,乙腈,三乙胺以及溶于乙腈的4-四唑-2’,3’,5’-三乙酰胞苷,室温下反应12~24h,旋转蒸发仪浓缩后,经硅胶柱纯化,获得2’,3’,5’-三乙酰基-N4-烯丙基胞苷(化合物3);将2’,3’,5’-三乙酰基-N4-烯丙基胞苷加入到摩尔量为2’,3’,5’-三乙酰基尿苷至少1千倍的1~3mol/L的氨的甲醇溶液中,室温下反应12~24h,旋转蒸发仪浓缩后,经真空干燥箱干燥得到N4-烯丙基胞苷(化合物4);氩气或氮气保护下,加入摩尔量为2’,3’,5’-三乙酰基尿苷10~50倍的完全干燥的磷酸三甲酯、摩尔量为2’,3’,5’-三乙酰基尿苷1.1~1.5倍的三氯氧磷,0~4℃下反应1~3小时;再加入摩尔量为2’,3’,5’-三乙酰基尿苷3~10倍的焦磷酸三丁基胺(可将其以0.6g/mL的浓度预溶于N,N’-二甲基甲酰胺中),0~4℃搅拌10~30分钟;之后室温继续搅拌5~10分钟,加入摩尔量为2’,3’,5’-三乙酰基尿苷至少1千倍的三乙基碳酸氢铵终止反应;通过高效液相色谱分析提纯,得到N4-烯丙基三磷酸胞苷(化合物5)。所述各反应物的用量可按比例调整。
进一步地,所述的生物材料为染色质、细胞核、线粒体、叶绿体、细菌等。这些生物材料的来源有多种,如所述的染色质可以来源于普通哺乳动物细胞的染色质、哺乳动物癌细胞的染色质、哺乳动物干细胞的染色质、病毒的宿主细胞的染色质,或取自各种类型的组织与器官的染色质。
更进一步地,步骤(1)中染色质处理的具体方法为,从培养的细胞中获取活性细胞核,加入氯化钠溶液至终浓度0.5~1mol/L裂解细胞核;加入无核酸酶水(如DEPC处理过的水),将氯化钠稀释至0.1~0.3mol/L,离心获取活性染色质;用甘油储存液(详见表3)溶解染色质沉淀,加入与缓冲液等体积的含N6-烯丙基三磷酸腺苷或N4-烯丙基三磷酸胞苷的转录重启缓冲液(详见表4),16~37℃反应5~15分钟,之后用TRIzol终止反应并提取RNA。
进一步地,步骤(1)中所述的碘加成与环化处理具体为:将0.1~0.5M碘单质溶于0.2~1M碘化钾得到碘的碘化钾溶液,再使碘的碘化钾溶液与RNA a6A或a4C上的烯丙基反应,然后用0.1~0.5M硫代硫酸钠除去过量碘;再加入0.1~0.5M碳酸钠,调节pH=9~10,诱导RNA a6A上的N1,N6位或a4C上的N3,N4位形成环化结构,从而使腺嘌呤或胞嘧啶正常的氢键配对受到屏蔽。
进一步地,步骤(2)具体为:i)利用HIV逆转录酶逆转录上述环化处理后的RNA;ii)采用RNA文库制备技术结合高通量测序手段进行全转录组测序获取染色质RNA丰度,并通过突变位点的识别从而得到全转录组单碱基分辨率的活性RNA聚合酶位点分布。
进一步地,本发明提供的一种全转录组范围同时获取RNA丰度及活性RNA聚合酶位点的方法,还可以具有这样的特征:所述修饰的三磷酸核苷包括但不限于N6-烯丙基三磷酸腺苷、N4-烯丙基三磷酸胞苷及其衍生物、类似物;逆转录突变的逆转录酶包括但不限于HIV逆转录酶(Recombinant HIV reverse transcriptase enzyme)。
上述步骤(1)中,提取RNA的方法包括常用的纯化方法或商业化的纯化试剂盒。方法中包括但不受限于:使用TRIzolTM Reagent,氯仿-苯酚萃取,Proteinase K消解,硅胶膜离心柱法,磁珠法,乙醇、异丙醇沉淀等技术中的一项或多项组合。纯化试剂盒包括但不仅限于:GeneEluteTM mRNAMiniprep Kit,RNeasyTMMini Kit(Qiagen),RNA Clean&Concentrator(Zymo)。
上述步骤(1)中,碘加成的方法包括但又不仅限于碘的碘化钾溶液(0.125M I2,0.25M KI),过量碘的去除方法包括但又不仅限于硫代硫酸钠处理(0.2M Na2S2O3),碱性条件下诱导环化的方法包括但又不仅限于碳酸钠、碳酸氢钠溶液(0.1M Na2CO3,pH=9.5)处理,反应式如下。在碱性条件下,a6A的N1,N6位或a4C的N3,N4位自发关环,屏蔽碱基互补配对。
上述步骤(2)中,逆转录的方法包括但又不仅限于HIV逆转录酶(Recombinant HIVreverse transcriptase enzyme)处理的方法。
上述步骤(2)中,逆转录后测序的方法包括但又不仅限于构建文库的高通量测序;建库方法包括但不仅限于illumina stranded建库,NEB small RNA建库,NEB链特异性RNA建库及改进的建库方法等。
上述步骤(1)-(2)中,各反应后的核酸纯化步骤,可以使用常用的纯化方法或商业化的纯化试剂盒。方法中包括但不受限于:硅胶膜离心柱法,磁珠法,乙醇、异丙醇沉淀等技术中的一项或多项组合。纯化试剂盒包括但不仅限于:AmpureXP beads,PCRpurification Kit(Qiagen),RNA Clean&Concentrator(Zymo),DNA Clean&Concentrator(Zymo)。
本发明还提供一种全转录组范围同时获取RNA丰度及活性RNA聚合酶位点的试剂盒,包括N6-烯丙基三磷酸腺苷或N4-烯丙基三磷酸胞苷,碘的碘化钾溶液,硫代硫酸钠溶液,碳酸钠溶液,HIV逆转录酶,HIV逆转录反应液,Tris-HCl,RNase inhibitor,测序接头,测序引物。
在本发明中:
(1)碘诱导的双键加成在加成到双键上后,碘具有一定的离去性,其紧邻的碳原子可以亲电进攻电子云密度较高的原子,对于腺嘌呤和胞嘧啶而言,其嘌呤环或嘧啶环上的氮原子就具有电子云密度较高的特性,特别是腺嘌呤1号位的氮原子和胞嘧啶3号位的氮原子。因此发明人设计了N6-烯丙基腺苷和N4-烯丙基胞苷,发现其在碘加成与碱性条件下,烯丙基碘可以诱导碘原子离去后碳原子亲电进攻相邻位置的氮原子(腺嘌呤1号位的氮原子或胞嘧啶3号位的氮原子),形成关环反应,屏蔽原本这两个位置用于碱基互补配对的氢键,从而在逆转录的过程中引发突变,借助测序的手段,达到识别N6-烯丙基腺嘌呤或N4-烯丙基胞嘧啶位点的目的;
(2)为了将上述突变测序的方法应用于RNA聚合酶位点的识别,本发明设计了体外转录重启的方法,利用RNA聚合酶、DNA、RNA三元复合物极高的稳定性,将染色质低温提取,并洗掉游离的蛋白质与RNA后,加入N6-烯丙基三磷酸腺苷或N4-烯丙基三磷酸胞苷和其他未修饰的三磷酸核苷,重启转录,从而在RNA上与RNA聚合酶的反应位点处引入N6-烯丙基腺嘌呤或N4-烯丙基胞嘧啶,通过突变测序识别N6-烯丙基腺嘌呤或N4-烯丙基胞嘧啶的位点,来达到单碱基分辨率检测活性RNA聚合酶位点的目的。同时,已经转录的部分由于没有N6-烯丙基腺嘌呤或N4-烯丙基胞嘧啶的掺入,从而在后续处理中不发生突变,是原有的染色质RNA。一次测序获取两种数据,极大地促进了RNA产生的生物学功能研究。
本发明的有益效果在于:
本发明的一种全转录组范围同时获取RNA丰度及活性RNA聚合酶位点的方法及试剂盒是基于体外RNA聚合酶的重启动、核酸腺嘌呤的化学标记与诱导突变,首次实现在活性RNA聚合酶位点进行核糖核酸(RNA)腺嘌呤的N6-烯丙基或胞嘧啶的N4-烯丙基标记,通过位点突变的方式来识别活性RNA聚合酶位点;与现有应用于活性RNA聚合酶位点检测的基因测序技术相比,由于突变位点可以精确到单碱基分辨率,提升了目前采用的基于抗体免疫沉淀与大规模平行测序方法检测RNA聚合酶位点(GRO-seq)的精度;同时,由于突变测序是先逆转录突变再进行建库,建库过程使用的是逆转录后正常的DNA,从而减少了目前采用的基于修饰碱基转录终止、生物素富集与大规模平行测序方法检测PRO-seq的信息损失;同时,由于该突变方法不需要抗体富集,因而一次测序可同时获取突变与未突变的测序信息,亦即同时获取染色质RNA丰度及活性RNA聚合酶位点信息,减除了因不同测序方法获取不同信息引入的外来误差,是一个直接的高通量多信息的单碱基鉴定方法。
本发明采用HIV逆转录酶对碘加成与诱导环化的RNA进行逆转录处理,因为在我们的研究中发现,HIV逆转录酶对于腺嘌呤用于碱基互补配对的氢键被屏蔽的环化结构具有更强的识别能力,我们选取了众多商业化的逆转录酶,包括HIV逆转录酶(ReverseTranscriptase Recombinant HIV,Worthington Biochemical Corporation),M-MLV逆转录酶(PROMEGA,M170A),AMV逆转录酶(PROMEGA,M510F),RevertAid逆转录酶(Thermofisher,EP0441),SuperScript II逆转录酶(Invitrogen,100004925),SuperScriptⅢ逆转录酶(Invitrogen,55549)等,最终发现了HIV逆转录酶在a6A或a4C碘加成环化RNA的逆转录过程中对应位点会发生突变。
本发明在突变测序的基础上,可将其应用于多种基于基因测序的分析方法,如基于N6-烯丙基三磷酸腺苷或N4-烯丙基三磷酸胞苷的细胞RNA动态测序,以及各种体外的RNA标记等。
附图说明
图1是一种全转录组范围同时获取RNA丰度及活性RNA聚合酶位点的方法示意图;
图2是N6-烯丙基三磷酸腺苷的加入比例与N6-烯丙基腺苷的掺入比例的曲线图;
图3是采用不同方法处理的二代测序结果中rRNA所占的比例图。DC:差速离心;DGC:密度梯度离心;DGC&rD:密度梯度离心联合rRNA去除.
图4是N6-烯丙基三磷酸腺苷的高分辨质谱;
图5是N4-烯丙基三磷酸胞苷的高分辨质谱;
图6是通过RT-qPCR确定rRNA去除效率;
图7是通过qPCR确定文库中rRNA污染程度;
图8是HeLa细胞高通量测序得到的基因组上的信号分布;
图9是HeLa细胞高通量测序结果与其他活性RNA聚合酶位点测序方法的相关性热图;
图10是HeLa细胞高通量测序结果与组蛋白修饰的相关性热图;
图11是HeLa细胞高通量测序得到的染色质RNA丰度四例;
图12是HeLa细胞高通量测序得到的活性RNA聚合酶位点数据四例。
具体实施方式
下面结合附图和具体实施例对本发明进行详细的说明,但是不能把它们理解为对本发明保护范围的限定。
如图1为本发明的一种全转录组范围同时获取RNA丰度及活性RNA聚合酶位点的方法示意图。该方法的一种具体实施方式包括以下步骤:
(1)染色质的提取:样本细胞在正常培养至百分之八十左右融合度后,用蔗糖密度梯度离心的方式获取纯净的细胞核,以除去细胞质RNA与线粒体RNA的干扰。获取的活性细胞核在0.5mol/L氯化钠溶液中裂解,加入无核酸酶水,将氯化钠稀释至0.25mol/L,离心获取活性染色质。染色质需要现取现用。
(2)染色质的提取及处理:用甘油储存液(详见表3)溶解染色质沉淀,加入与甘油储存液等体积的含N6-烯丙基三磷酸腺苷或N4-烯丙基三磷酸胞苷的转录重启缓冲液(详见表4),37℃反应5分钟,之后用TRIzol终止反应并提取RNA。
(3)碘加成RNA a6A上的N6-烯丙基诱导发生N1,N6位环化或a4C上的N4-烯丙基诱导发生N3,N4位环化:将0.1~0.5M碘单质溶于0.2~1M碘化钾得到碘的碘化钾溶液,再使碘的碘化钾溶液与RNA a6A上的N6-烯丙基腺嘌呤的烯丙基反应,然后用0.1~0.5M硫代硫酸钠除去过量碘;再加入0.1~0.5M碳酸钠,调节pH=9~10,诱导RNA a6A上的N6-烯丙基发生N1,N6位环化或a4C上的N4-烯丙基发生N3,N4位环化形成环化结构,从而使腺嘌呤或胞嘧啶的正常的氢键配对受到屏蔽。
(4)环化处理RNA的逆转录突变与测序识别:RNA上N1,N6环化腺嘌呤或N3,N4位环化胞嘧啶在体外HIV逆转录酶作用下逆转录成DNA的过程中,对位互补碱基引入发生错误,可通过核酸测序手段识别突变位点,进而得到a6A或a4C位点,该位点即为细胞RNA中原本活性RNA聚合酶的位点。同时,测序得到的未突变的序列即为染色质RNA。
本发明对可应用的生物材料没有特殊限定,所述的染色质可以为又不限于普通哺乳动物细胞的染色质、哺乳动物癌细胞的染色质、哺乳动物干细胞的染色质、病毒的宿主细胞的染色质,或取自各种类型的组织与器官的染色质,亦可将染色质替代为细胞核、线粒体、叶绿体、细菌等。
在本发明中,RNA的提取采用TRIzol提取染色质RNA,采用异丙醇沉淀法提取碘加成处理过的RNA。
本发明采用TRIzol终止染色质的体外RNA转录重启动,加入氯仿分层后,将上层上清液用等体积pH=5.3的苯酚/氯仿溶液萃取两次,彻底去除DNA与蛋白污染;再用等体积氯仿萃取两次,去除残余的苯酚。之后加入1μg糖原作为共沉淀剂,用异丙醇沉淀法对RNA进行沉淀。具体来说,加入与RNA溶液等体积的异丙醇,混匀后放入-20℃沉淀过夜后,15000rpm转速下4℃离心45分钟,80%乙醇洗涤两次后,溶解得到上述样本的染色质RNA溶液。
本发明对N6-烯丙基三磷酸腺苷的比例进行了优选,如图2所示,在染色质的体外RNA转录重启动时采用了不同比例的N6-烯丙基三磷酸腺苷,之后将RNA纯化,酶解消化成核苷后,用液质联用进行定量。从结果图2来看,80%的N6-烯丙基三磷酸腺苷的比例掺入量最多,低于这个值则因比例降低而掺入量减少,高于这个值则因转录长度不足而掺入量减少。该数据未扣除rRNA的影响,扣除后预计可达0.5%~1%。
本发明在得到上述N6-烯丙基腺苷掺入的染色质RNA后,进一步进行碘加成与碱性条件下环化处理。在本发明中,26μL的上述RNA与4μL的0.125M碘溶液(溶于0.25M碘化钾),在4~50℃下处理15~60分钟,更优为37℃下处理30分钟。之后,加入2~4μL的0.2M硫代硫酸钠至溶液无色,再加入6μL的0.1M碳酸钠(pH=9~10,更优为9.5),在4~50℃下处理15~60分钟,更优为37℃下处理30分钟。本发明在RNA碘加成与环化处理后,优选的还包括对RNA进行纯化的步骤,得到的RNA产物按照上述异丙醇沉淀法进行纯化。
本发明在细胞核提取及建库过程中对rRNA的去除进行了优选。如图3所示,当采用差速离心的方式获取细胞核并直接建库时,rRNA的测序量占总测序量的95%左右,与细胞质RNA中rRNA的比例相近,表明有较高细胞质RNA的污染;而仅仅将差速离心改变为蔗糖密度梯度离心,rRNA的测序量降为总测序量的70%左右,相当于去除了超过85%的rRNA;发明人又使用NEBNext的rRNA去除试剂盒去除rRNA,如图6所示,去除rRNA后,残余的rRNA的量不到原先的万分之三,其中28s和18s的量不到原先的十万分之三;如图7所示,建库后rRNA的相对量仅为gDNA的百倍以下。根据这些优化,发明人将rRNA的测序量降为总测序量的10%以下。从而确定了最终的实验方案。
本发明中,建库过程使用NEB链特异性RNA建库试剂盒,在rRNA去除后,经过试剂盒的片段化过程后,使用HIV逆转录酶进行逆转录后接上测序接头,并用测序引物进行PCR扩增构建高通量测序文库。在本发明中,片段化的RNA经过HIV逆转录酶逆转录后接上测序接头并用测序引物进行PCR扩增构建高通量文库优选为Ultra IIDirectional RNALibrary Prep Kit,具体建库方法参照说明书进行。
本发明在完成测序文库构建后,对所述测序文库进行测序获得测序数据。本发明中,所述测序优选为二代测序,更优选为Illumina双端测序,所述测序的读长优选为150bp。
本发明在获得测序数据后,分析环化和未环化样品在腺苷酸位点或胞苷酸位点的突变率,若环化样品在该位点的突变率高于未环化样品的两倍以上,则认为该位点为活性RNA聚合酶所在位点。所述分析包括对所述测序数据进行质量控制、将所述数据去除接头序列、去除低质量碱基、将所述去除低质量和接头的数据比对到基因组序列并进行富集统计、将所述去除低质量和接头的数据比对到转录组序列并进行突变统计。在本发明的具体实施过程中,所述分析包括以下步骤:通过cutadapt(v1.15)默认参数对所述原始测序数据进行质量控制,并去除接头序列。得到的序列用Hisat2(v2.1.0)默认参数比对到转录组序列hg38。用Picard MarkDuplicates默认参数移除PCR重复序列,并将比对到tRNA及rRNA上的序列移除。使用bedtools genomeCoverageBed function功能将bam文件转化为bedgraph文件,并用UCSC bedGraphToBigWig tool功能将bedgraph文件转化为bigWig文件。bigWig文件可通过Integrative Genomics Viewer(IGV)软件可视化,其结果即为染色质RNA位点。A-C突变被选取,若环化样品在该位点的突变率高于未环化样品的两倍以上,则认为该位点为活性RNA聚合酶所在位点(Fold-change=(The abundance of mutant A-to-C positions(mGRO-seq))/(The abundance of mutant A-to-C positions(Control))and Fold-change>2.)。
本发明还提供了一种全转录组范围同时获取RNA丰度及活性RNA聚合酶位点的试剂盒,包括N6-烯丙基三磷酸腺苷或N4-烯丙基三磷酸胞苷,0.125M碘的碘化钾溶液,0.2M硫代硫酸钠溶液,0.1M碳酸钠溶液(pH=9.5),HIV逆转录酶,HIV逆转录反应液,Tris-HCl,RNase inhibitor,测序接头,测序引物。
如图4为采用本发明方法制备的N6-烯丙基三磷酸腺苷(a6ATP)的相关表征数据(高分辨质谱,C13H20N5O13P3,m/z为546.0192,[M-H]-理论计算546.0198),可知成功制备了a6ATP。
如图5为采用本发明方法制备的N4-烯丙基三磷酸胞苷(a4CTP)的相关表征数据(高分辨质谱,C13H20N5O13P3,m/z为522.0080,[M-H]-理论计算522.0158),可知成功制备了a6ATP。
实施例1 HeLa细胞中染色质RNA丰度及活性RNA聚合酶位点的检测
1、HeLa细胞核提取
(1)HeLa细胞在15-cm培养皿中正常培养条件下培养至满度为百分之八十后,吸去培养基,用磷酸缓冲盐溶液(PBS)洗去残留培养基;
(2)每个15-cm培养皿中加入5mL 0.25%胰蛋白酶溶液,37℃消化5分钟;
(3)加入5mL培养基终止消化,将收获的细胞收集在50mL离心管中,RCF 1000g离心5分钟,收获细胞;
(4)用PBS清洗细胞两次,洗去残留培养基;
(5)震荡5秒,震松细胞团;
(6)将细胞以5×107个每毫升的浓度,悬浮在冰上预冷的蔗糖溶液I中,用相差显微镜确定细胞浓度,蔗糖溶液I成分见表1;
表1蔗糖溶液I
(7)冰上温育5分钟后,将细胞悬浮液转移至冰上预冷的杜恩斯匀浆器中,将细胞破碎,用相差显微镜确定细胞已完全破碎;
(8)将破碎后的细胞悬液转移至50mL离心管中,加入等体积冰上预冷的蔗糖溶液II,颠倒混匀,蔗糖溶液II成分见表2;
表2蔗糖溶液II
(9)加入4.4mL蔗糖溶液II至超速离心管的底部,小心地将细胞裂解液加入到它的上层,每个离心管不可超过2×108个细胞;
(10)在顶部加入蔗糖溶液I液封,在4℃、RCF 30,000g下,离心45分钟;
(11)吸走上层液体,细胞核在下层形成紧密的沉淀;
*若细胞未裂解,则不形成沉淀;若细胞核也被裂解,则生成凝胶状的染色质沉淀。
(12)震荡5秒,震松细胞核沉淀;
(13)以5×107个细胞核每毫升的浓度加入冰上预冷的甘油储存液,上下吹打混匀,甘油储存液成分见表3;
表3甘油储存液
(14)每100μL细胞核悬浮液放入一管预冷的1.5mL离心管中,液氮骤冷,放于-80℃冰箱保存备用。
2、染色质获取与RNA聚合酶重启动
(1)每100μL细胞核悬浮液加入10uL 5M氯化钠溶液,混合均匀;
(2)待溶液澄清后,加入110uL DEPC处理过的水,混合均匀后,在4℃、RCF 12,000rpm下离心3分钟;
(3)转移上清液,上清液中是细胞核RNA,可用于之后的质量控制,染色质在底部形成密实的凝胶状沉淀;
(4)将沉淀用500uL的50mM pH 7.5的Tris-HCl溶液清洗两次,去除残余的细胞核RNA与氯化钠;
(5)用100uL的甘油储存液溶解染色质沉淀,之后加入等体积37℃预热的转录重启缓冲液,其中实验组使用80%a6ATP,控制组使用ATP,混匀后37℃震荡反应5分钟,转录重启缓冲液成分见表4;
表4转录重启缓冲液
(6)加入600uL LC-Trizol,吹打混匀,终止反应;
(7)加入0.16mL的氯仿,剧烈摇晃离心管15秒,室温萃取3分钟,在4℃、RCF 12,000g下离心15分钟,溶液分层,上层清液为RNA,中间白色沉淀主要为蛋白质,下层红色液体主要为DNA;
(8)将上层水相转移至新的离心管,加入等体积的pH 5.3的苯酚-氯仿溶液,剧烈摇晃离心管15秒,室温萃取3分钟,在4℃、RCF 12,000g下离心15分钟,去除残余的DNA与蛋白质杂质,重复两次;
(9)将上层水相转移至新的离心管,加入等体积的氯仿,剧烈摇晃离心管15秒,室温萃取3分钟,在4℃、RCF 12,000g下离心15分钟,去除残余的苯酚,重复两次;
(10)将上层水相转移至新的离心管,加入1uL的20mg/mL糖原溶液,混匀后加入等体积的异丙醇,-20℃温育30分钟,在4℃、RCF 15,000g下离心45分钟,得到染色质RNA白色沉淀;
(11)移去上清液,留下染色质RNA白色沉淀,用200uL 80%乙醇洗涤沉淀,,在4℃、RCF 15,000g下离心15分钟,重复两次,去除残余的异丙醇和盐;
(12)再次移去上清液,风干5分钟,用100μL的DEPC处理过的水溶解染色质RNA,70℃加热10分钟使染色质RNA充分溶解,共约20μg RNA,取出部分RNA用于质量控制;
3、rRNA去除
(1)将5μg染色质RNA转移进PCR管中,加入5μL DNaseI反应液,2U DNaseI,加入DEPC处理过的水至50μL,37℃反应10分钟,去除痕量DNA;
(2)加入150μL LC-Trizol,吹打混匀,终止反应,转移至1.5mL离心管中;
(3)加入40μL的氯仿,剧烈摇晃离心管15秒,室温萃取3分钟,在4℃、RCF 12,000g下离心15分钟,溶液分层,上层清液为RNA;
(4)将上层水相转移至新的离心管,加入1uL的20mg/mL糖原溶液,混匀后加入等体积的异丙醇,-20℃温育30分钟,在4℃、RCF 15,000g下离心45分钟,得到RNA白色沉淀;
(5)移去上清液,留下RNA白色沉淀,用200uL 80%乙醇洗涤沉淀,在4℃、RCF 15,000g下离心15分钟,重复两次,去除残余的异丙醇和盐;
(6)再次移去上清液,风干5分钟,用50μL的DEPC处理过的水溶解RNA,70℃加热10分钟使染色质RNA充分溶解,测量RNA的浓度,取出部分RNA与2(12)中的RNA一起做qPCR,确定DNA的残余量;
(7)使用NEBNext rRNA Depletion Kit去除rRNA,将1μL NEBNext rRNADepletion Solution,2μL Probe Hybridization Buffer在PCR管中同12μL染色质RNA混合(不超过1μg RNA),吹打混匀后,放入PCR仪中,运行如下程序:
95℃ 2分钟
95-22℃ 0.1℃/秒
22℃ 5分钟
(8)程序结束后,放在冰上,加入1μL Nuclease-free Water,2μL RNase HReaction Buffer和2μL NEBNext RNase H,吹打混匀后,放入PCR仪中,37℃温育30分钟;
(9)程序结束后,放在冰上,加入22.5μL Nuclease-free Water,5μL DNase IReaction Buffer和2.5μL DNase I(RNase-free),吹打混匀后,放入PCR仪中,37℃温育30分钟;
(10)使用NEBNext RNA Sample Purification Beads纯化RNA,将NEBNext RNASample Purification Beads震荡混匀后,取出110μL加入到rRNA去除的反应液中,吹打混匀,冰上温育15分钟;
(11)将PCR管放入磁台,静置5分钟至磁珠全部贴壁后,吸弃上清液;
(12)加入200μL的80%乙醇,静置30秒,吸弃上清液,重复两次;
(13)风干5分钟,用30μL的DEPC处理过的水溶解RNA,测量RNA的浓度;
4、RNA的N6-烯丙基腺嘌呤的碘加成反应与环化处理
(1)将26μL上述去除rRNA后的RNA转移至PCR管中,加入4μL的0.125M碘溶液(溶于0.25M碘化钾),溶液变为棕色,在37℃下温育30分钟;
*磁珠法纯化会使溶液中存在游离的聚乙二醇,与碘进行络合,使碘的颜色加深,有利于观测。
(2)将上述棕色溶液转移至新的PCR管,加入4μL的0.2M硫代硫酸钠至溶液无色,再加入6μL的0.1M碳酸钠(pH=9.5),在37℃下温育30分钟;
(3)将上述40μL溶液,加入1uL的20mg/mL糖原溶液,混匀后加入等体积的异丙醇,-20℃温育过夜,在4℃、RCF 15,000g下离心45分钟,得到RNA白色沉淀;
(4)移去上清液,留下RNA白色沉淀,用200uL 80%乙醇洗涤沉淀,在4℃、RCF 15,000g下离心15分钟,重复两次,去除残余的异丙醇和盐;
(5)再次移去上清液,风干5分钟,用5μL的DEPC处理过的水溶解RNA。
(1)将RNA进行片段化:将4μL NEBNext First Strand Synthesis ReactionBuffer,1μL Random Primers和4(5)中获得的5μL RNA溶液加入到PCR管中,吹打混匀,放入PCR仪中,94℃温育7分钟,RNA片段大小约为200nt;
(2)一链合成:从PCR仪中取出PCR管,立即放入冰上,加入8μL NEBNext StrandSpecificity Reagent,5μL 5x RT buffer(Thermofisher),2μL HIV逆转录酶(约10U),吹打混匀,放入PCR仪中,运行如下程序:
(3)二链合成:从PCR仪中取出PCR管,立即放入冰上,加入8μL NEBNext SecondStrand Synthesis Reaction Buffer with dUTP Mix(10X)、4μL NEBNext Second StrandSynthesis Enzyme Mix和43μL的DEPC处理过的水,吹打混匀,放入PCR仪中,16℃温育1小时;
(4)纯化所得双链DNA片段:向反应体系中加入144μL提前恢复至室温的AMPure XPbeads,吹打混匀6-10次后室温孵育15分钟,用磁力架分离并丢弃上清,用80%乙醇洗beads两次,每次30秒,静置5-10分钟挥发乙醇,用53μL 0.1X TE Buffer洗脱双链DNA片段,室温孵育2分钟后经磁力架分离,取50μL上清转移至新的PCR管中,用于下步反应;
(5)cDNA末端准备:往获得的cDNA中加入7μL NEBNext Ultra II End PrepReaction Buffer和3μL NEBNext Ultra II End Prep Enzyme Mix,吹打混匀,放入PCR仪中,运行如下程序:
20℃ 30分钟
65℃ 30分钟
4℃ 保持
(6)添加接头:将NEBNext Adaptor用Adaptor Dilution Buffer稀释五倍,向(5)中所得的反应液中加入2.5μL,再加入1μL NEBNext Ligation Enhancer和30μL NEBNextUltra II Ligation Master Mix,吹打混匀,放入PCR仪中,20℃温育15分钟;
(7)接头处理:向反应液中加入1μL USER Enzyme,吹打混匀,放入PCR仪中,37℃温育15分钟;
(8)纯化所得双链DNA片段:向反应体系中加入87μL提前恢复至室温的AMPure XPbeads,吹打混匀6-10次后室温孵育15分钟,用磁力架分离并丢弃上清,用80%乙醇洗beads两次,每次30秒,静置5-10分钟挥发乙醇,用17μL 0.1X TE Buffer洗脱双链DNA片段,室温孵育2分钟后经磁力架分离,取15μL上清转移至新的PCR管中,用于下步反应;
(9)PCR富集:加入5μL Index(X)Primer/i7 Primer、5μL Universal PCR Primer/i5Primer和25μL NEBNext Ultra II Q5 Master Mix,吹打混匀,放入PCR仪中,运行如下程序:
(10)纯化所得双链DNA片段:向反应体系中加入45μL提前恢复至室温的AMPure XPbeads,吹打混匀6-10次后室温孵育15分钟,用磁力架分离并丢弃上清,用80%乙醇洗beads两次,每次30秒,静置5-10分钟挥发乙醇,用23μL 0.1X TE Buffer洗脱双链DNA片段,室温孵育2分钟后经磁力架分离,取20μL上清转移至新的PCR管中,其中1μL用于Qubit测定浓度,-20℃保存;
(11)将得到的文库利用illumina X-10平台进行双端150测序,得到的数据经低质量过滤、接头过滤后与HeLa细胞的转录组进行比对,未突变的reads即为HeLa细胞中染色质RNA丰度信息,突变位点即为HeLa细胞中活性RNA聚合酶位点。其与公开文献相比,新生RNA的信号分布比例类似,内含子占据一半左右的比例(图8);与其他新生RNA检测方法如GRO-seq,NET-seq,mNET-seq,ATAC-seq,Pol II ChIP-seq有较强的相关性(图9);同时和标示染色体活性转录区域的组蛋白修饰(H3K79me2,H3K9ac,H3K4me3,H3K36me3)分布正相关,而和标示染色体转录抑制区域的组蛋白修饰(H3K27me3,H3K9me3)负相关(图10)。说明该方法检测的RNA为新生RNA。与同类方法相比,染色质RNA丰度信息与文献报道的chrRNA-seq转录信息信号相似(图11),检测的活性RNA聚合酶位点的信号也与文献报道的GRO-seq信号相似(图12),说明本方法所检测的信息和所识别的位点真实有效。
Claims (8)
1.一种全转录组范围同时获取RNA丰度及活性RNA聚合酶位点的方法,其特征在于,包括以下步骤:
(1)N6-烯丙基三磷酸腺苷或N4-烯丙基三磷酸胞苷标记活性RNA聚合酶位点:用未修饰的三磷酸核苷、和N6-烯丙基三磷酸腺苷或N4-烯丙基三磷酸胞苷处理带有活性RNA聚合酶的生物材料,活性RNA聚合酶将N6-烯丙基三磷酸腺苷或N4-烯丙基三磷酸胞苷引入到新生RNA中的腺嘌呤或胞嘧啶位点上,在该位点形成N6-烯丙基腺嘌呤或N4-烯丙基胞嘧啶,经过碘加成与环化处理后,形成N1,N6-环化腺嘌呤或N3,N4-环化胞嘧啶的环化结构,屏蔽碱基互补配对;
(2)环化处理后的RNA的逆转录突变与测序识别:向步骤(1)获得的环化结构中加入HIV逆转录酶,RNA上的N1,N6-环化腺嘌呤或N3,N4-环化胞嘧啶在HIV逆转录酶作用下逆转录成DNA的过程中,对位互补碱基引入发生错误,通过核酸测序手段识别突变位点,进而得到a6A或a4C位点,该位点即为新生RNA中活性RNA聚合酶的位点。
2.根据权利要求1所述的一种全转录组范围同时获取RNA丰度及活性RNA聚合酶位点的方法,其特征在于,步骤(1)中,N6-烯丙基三磷酸腺苷的制备方法为:在氩气或氮气保护下,以摩尔比为1:1.5~3:3~10的6-氯嘌呤核苷、碳酸钙和烯丙基胺为原料,乙醇为溶剂,加热回流8~16小时,过滤除去不溶物,-20℃沉淀过夜,获得N6-烯丙基腺苷;加入摩尔量为6-氯代嘌呤核苷5~50倍的完全干燥的磷酸三甲酯、摩尔量为6-氯代嘌呤核苷1.1~2倍的三氯氧磷,0~4℃搅拌0.5~3小时至反应液完全澄清;再加入摩尔量为6-氯代嘌呤核苷2~10倍的焦磷酸三丁基胺,0~4℃搅拌10~30分钟;之后室温继续搅拌5~10分钟,加入摩尔量为6-氯代嘌呤核苷至少1千倍的三乙基碳酸氢铵终止反应;通过高效液相色谱分析提纯,得到N6-烯丙基三磷酸腺苷。
3.根据权利要求1所述的一种全转录组范围同时获取RNA丰度及活性RNA聚合酶位点的方法,其特征在于,步骤(1)中,N4-烯丙基三磷酸胞苷的制备方法为:在氩气或氮气保护下,以摩尔比为1:1.5~3:1.5~3:1.1~2的2’,3’,5’-三乙酰基尿苷、1-氢-四氮唑、对甲苯磺酰氯和磷酸二苯酯为原料,吡啶为溶剂,室温下搅拌反应1~2天,加入去离子水淬灭,并用二氯甲烷萃取,反复用0.5~2mol/L的盐酸洗涤至水相呈酸性;旋转蒸发仪浓缩后,经硅胶柱纯化,获得4-四唑-2’,3’,5’-三乙酰胞苷;将4-四唑-2’,3’,5’-三乙酰胞苷溶于乙腈,将摩尔量为2’,3’,5’-三乙酰基尿苷一倍的氢氧化钾和摩尔量为2’,3’,5’-三乙酰基尿苷一倍的烯丙胺盐酸盐混合并依次加入水,乙腈,三乙胺以及溶于乙腈的4-四唑-2’,3’,5’-三乙酰胞苷,室温下反应12~24h,旋转蒸发仪浓缩后,经硅胶柱纯化,获得2’,3’,5’-三乙酰基-N4-烯丙基胞苷;将2’,3’,5’-三乙酰基-N4-烯丙基胞苷加入到摩尔量为2’,3’,5’-三乙酰基尿苷至少1千倍的1~3mol/L的氨的甲醇溶液中,室温下反应12~24h,旋转蒸发仪浓缩后,经真空干燥箱干燥得到N4-烯丙基胞苷;氩气或氮气保护下,加入摩尔量为2’,3’,5’-三乙酰基尿苷10~50倍的完全干燥的磷酸三甲酯、摩尔量为2’,3’,5’-三乙酰基尿苷1.1~1.5倍的三氯氧磷,0~4℃下反应1~3小时;再加入摩尔量为2’,3’,5’-三乙酰基尿苷3~10倍的焦磷酸三丁基胺,0~4℃搅拌10~30分钟;之后室温继续搅拌5~10分钟,加入摩尔量为2’,3’,5’-三乙酰基尿苷至少1千倍的三乙基碳酸氢铵终止反应;通过高效液相色谱分析提纯,得到N4-烯丙基三磷酸胞苷。
4.根据权利要求1所述的一种全转录组范围同时获取RNA丰度及活性RNA聚合酶位点的方法,其特征在于,步骤(1)中,所述的生物材料为染色质、细胞核、线粒体、叶绿体、细菌。
5.根据权利要求4所述的一种全转录组范围同时获取RNA丰度及活性RNA聚合酶位点的方法,其特征在于,步骤(1)中处理染色质的具体方法为,从细胞中获取活性细胞核,加入氯化钠溶液至终浓度0.5~1mol/L裂解细胞核;加入无核酸酶水,将氯化钠稀释至0.1~0.3mol/L,离心获取活性染色质;用甘油储存液溶解染色质沉淀,再加入与甘油储存液等体积的含N6-烯丙基三磷酸腺苷或N4-烯丙基三磷酸胞苷的转录重启缓冲液,16~37℃反应5~15分钟,之后用TRIzol终止反应并提取RNA。
6.根据权利要求1所述的一种全转录组范围同时获取RNA丰度及活性RNA聚合酶位点的方法,其特征在于,步骤(1)中所述的碘加成与环化处理具体为:将0.1~0.5M碘单质溶于0.2~1M碘化钾得到碘的碘化钾溶液,再使碘的碘化钾溶液与RNA a6A或a4C上的烯丙基反应,然后用0.1~0.5M硫代硫酸钠除去过量碘;再加入0.1~0.5M碳酸钠,调节pH=9~10,诱导RNA a6A上的N1,N6位或a4C上的N3,N4位形成环化结构,从而使正常的氢键配对受到屏蔽。
7.根据权利要求1所述的一种全转录组范围同时获取RNA丰度及活性RNA聚合酶位点的方法,其特征在于,所述步骤(2)具体为:i)利用HIV逆转录酶逆转录上述环化处理后的RNA;ii)采用RNA文库制备技术结合高通量测序手段进行全转录组测序获取染色质RNA丰度,并通过突变位点的识别从而得到全转录组单碱基分辨率的活性RNA聚合酶位点分布。
8.一种全转录组范围同时获取RNA丰度及活性RNA聚合酶位点的试剂盒,其特征在于,包括:N6-烯丙基三磷酸腺苷或N4-烯丙基三磷酸胞苷,碘的碘化钾溶液,硫代硫酸钠溶液,碳酸钠溶液,HIV逆转录酶,HIV逆转录反应液,Tris-HCl,RNase inhibitor,测序接头,测序引物。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202011191413.4A CN112301118B (zh) | 2020-10-30 | 2020-10-30 | 一种全转录组范围同时获取rna丰度及活性rna聚合酶位点的方法及试剂盒 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202011191413.4A CN112301118B (zh) | 2020-10-30 | 2020-10-30 | 一种全转录组范围同时获取rna丰度及活性rna聚合酶位点的方法及试剂盒 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN112301118A true CN112301118A (zh) | 2021-02-02 |
| CN112301118B CN112301118B (zh) | 2022-05-13 |
Family
ID=74332831
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN202011191413.4A Active CN112301118B (zh) | 2020-10-30 | 2020-10-30 | 一种全转录组范围同时获取rna丰度及活性rna聚合酶位点的方法及试剂盒 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN112301118B (zh) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN115125292A (zh) * | 2022-06-02 | 2022-09-30 | 武汉大学 | 一种内切酶辅助的rna中肌苷修饰的单碱基分辨率定位分析方法 |
| CN119220655A (zh) * | 2023-06-29 | 2024-12-31 | 浙江大学 | 一种基于核酸嫁接和核酸逆转录模板转换技术检测核酸化学修饰位点与互作位点的方法 |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CH505834A (de) * | 1966-10-20 | 1971-04-15 | Boehringer Mannheim Gmbh | Verfahren zur Herstellung von N6-substituierten Adenosin-Derivaten |
| CN104311618A (zh) * | 2013-09-27 | 2015-01-28 | 北京大学 | 5-醛基胞嘧啶特异性化学标记方法及相关应用 |
| CN111154837A (zh) * | 2019-09-02 | 2020-05-15 | 浙江大学 | 一种全转录组范围单碱基分辨率检测rna n6-甲基腺嘌呤修饰的方法及试剂盒 |
-
2020
- 2020-10-30 CN CN202011191413.4A patent/CN112301118B/zh active Active
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CH505834A (de) * | 1966-10-20 | 1971-04-15 | Boehringer Mannheim Gmbh | Verfahren zur Herstellung von N6-substituierten Adenosin-Derivaten |
| CN104311618A (zh) * | 2013-09-27 | 2015-01-28 | 北京大学 | 5-醛基胞嘧啶特异性化学标记方法及相关应用 |
| CN111154837A (zh) * | 2019-09-02 | 2020-05-15 | 浙江大学 | 一种全转录组范围单碱基分辨率检测rna n6-甲基腺嘌呤修饰的方法及试剂盒 |
Non-Patent Citations (7)
| Title |
|---|
| CHARLES R ALLERSON: "Synthesis and biochemical evaluation of RNA containing an intrahelical disulfide crosslink", 《CHEMISTRY & BIOLOGY》 * |
| JEREMY A SCHOFIELD: "TimeLapse-seq:adding a temporal dimension to RNA sequencing through nucleoside recoding", 《NATURE METHODS》 * |
| ROBERTA OTTRIA: "N6-Alkyladenosines: Synthesis and evaluation of in vitro anticancer activity", 《BIOORGANIC & MEDICINAL CHEMISTRY》 * |
| VERONIKA A HERZOG: "Thiol-linked alkylation of RN A to assess expression dynamics", 《NATURE METHODS》 * |
| XIAO SHU: "N6‑Allyladenosine: A New Small Molecule for RNA Labeling Identified by Mutation Assay", 《JACS》 * |
| YUQI CHEN: "Acrylonitrile-Mediated Nascent RNA Sequencing for", 《ADVANCED SCIENCE》 * |
| 邱政夫: "《肿瘤分子生物学基础》", 31 May 1989, 人民卫生出版社 * |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN115125292A (zh) * | 2022-06-02 | 2022-09-30 | 武汉大学 | 一种内切酶辅助的rna中肌苷修饰的单碱基分辨率定位分析方法 |
| CN119220655A (zh) * | 2023-06-29 | 2024-12-31 | 浙江大学 | 一种基于核酸嫁接和核酸逆转录模板转换技术检测核酸化学修饰位点与互作位点的方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| CN112301118B (zh) | 2022-05-13 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US20250092449A1 (en) | Method for highly sensitive dna methylation analysis | |
| US8329398B2 (en) | Universal amplification of fragmented RNA | |
| ES2920524T3 (es) | Preparación de muestras para la amplificación de ácidos nucleicos | |
| KR102592367B1 (ko) | 게놈 및 치료학적 적용을 위한 핵산 분자의 클론 복제 및 증폭을 위한 시스템 및 방법 | |
| EP4090766B1 (en) | Methods of targeted sequencing | |
| CN116694730B (zh) | 一种单细胞开放染色质和转录组共测序文库的构建方法 | |
| CN111560482A (zh) | 基于CRISPR/Cas和核酸试纸的检测方法和人乳头瘤病毒检测试剂盒 | |
| EP3105340B1 (en) | Partitioning of dna sequencing libraries into host and microbial components | |
| CN108866174B (zh) | 一种循环肿瘤dna低频突变的检测方法 | |
| CN109971843B (zh) | 一种单细胞转录组的测序方法 | |
| CN113166809A (zh) | 一种dna甲基化检测的方法、试剂盒、装置和应用 | |
| CN112301118A (zh) | 一种全转录组范围同时获取rna丰度及活性rna聚合酶位点的方法及试剂盒 | |
| CN113943763B (zh) | 一种还原核酸的方法及其检测方法 | |
| CN114807324A (zh) | 单引物扩增建库技术在检测片段化稀有dna分子突变中的应用及试剂盒 | |
| CN113832221B (zh) | R环的高通量检测方法 | |
| CN113846160B (zh) | 正向筛选的胞嘧啶甲基化快速检测方法及过氧钨酸盐在将5hmC氧化为thT中的应用 | |
| CN112831543B (zh) | 单细胞全基因组扩增试剂盒及其应用 | |
| CN113862333A (zh) | 一种组合物及其氧化5-甲基胞嘧啶的方法 | |
| WO2022094863A1 (zh) | 一种全转录组水平rna结构检测方法及其应用 | |
| CN117305466B (zh) | 一种能够识别单碱基甲基化状态的检测方法 | |
| CN116555432B (zh) | 一种膀胱癌快速检测试剂盒 | |
| US20250084484A1 (en) | Methods and compositions for transcriptome analysis | |
| CN114438168B (zh) | 一种全转录组水平rna结构检测方法及其应用 | |
| CN119776504A (zh) | 一种检测dna甲基化的方法及其应用 | |
| CN108486101B (zh) | 一种快速捕获建库的方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| GR01 | Patent grant | ||
| GR01 | Patent grant |