CN102691111A - 高通量全基因组水平捕获染色质核小体空缺区的新方法及其用途 - Google Patents
高通量全基因组水平捕获染色质核小体空缺区的新方法及其用途 Download PDFInfo
- Publication number
- CN102691111A CN102691111A CN2012100874919A CN201210087491A CN102691111A CN 102691111 A CN102691111 A CN 102691111A CN 2012100874919 A CN2012100874919 A CN 2012100874919A CN 201210087491 A CN201210087491 A CN 201210087491A CN 102691111 A CN102691111 A CN 102691111A
- Authority
- CN
- China
- Prior art keywords
- nucleosome
- chromatin
- dna
- new method
- genome
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 108010047956 Nucleosomes Proteins 0.000 title claims abstract description 42
- 210000001623 nucleosome Anatomy 0.000 title claims abstract description 42
- 238000000034 method Methods 0.000 title claims abstract description 24
- 210000004027 cell Anatomy 0.000 claims abstract description 21
- 210000003527 eukaryotic cell Anatomy 0.000 claims abstract description 4
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 claims description 18
- 239000011324 bead Substances 0.000 claims description 16
- 108010077544 Chromatin Proteins 0.000 claims description 13
- 102000007260 Deoxyribonuclease I Human genes 0.000 claims description 13
- 108010008532 Deoxyribonuclease I Proteins 0.000 claims description 13
- 210000003483 chromatin Anatomy 0.000 claims description 13
- 239000011616 biotin Substances 0.000 claims description 9
- 229960002685 biotin Drugs 0.000 claims description 9
- 235000020958 biotin Nutrition 0.000 claims description 9
- 238000013519 translation Methods 0.000 claims description 6
- 239000003550 marker Substances 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 2
- 238000011160 research Methods 0.000 abstract description 5
- 230000035897 transcription Effects 0.000 abstract description 5
- 238000013518 transcription Methods 0.000 abstract description 5
- 238000013507 mapping Methods 0.000 abstract description 3
- 230000033228 biological regulation Effects 0.000 abstract description 2
- 108020004414 DNA Proteins 0.000 description 35
- 108090000623 proteins and genes Proteins 0.000 description 31
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 21
- 210000004940 nucleus Anatomy 0.000 description 10
- 239000000872 buffer Substances 0.000 description 9
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 8
- 230000027455 binding Effects 0.000 description 8
- 239000006228 supernatant Substances 0.000 description 8
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 7
- 108010033040 Histones Proteins 0.000 description 7
- 239000012634 fragment Substances 0.000 description 7
- 239000000203 mixture Substances 0.000 description 7
- 101710163270 Nuclease Proteins 0.000 description 6
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 6
- 108091023040 Transcription factor Proteins 0.000 description 6
- 239000000499 gel Substances 0.000 description 6
- 238000012163 sequencing technique Methods 0.000 description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 6
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 5
- 102000040945 Transcription factor Human genes 0.000 description 5
- 210000003855 cell nucleus Anatomy 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000012165 high-throughput sequencing Methods 0.000 description 5
- 238000010348 incorporation Methods 0.000 description 5
- 108700024394 Exon Proteins 0.000 description 4
- 241000282414 Homo sapiens Species 0.000 description 4
- 108091028043 Nucleic acid sequence Proteins 0.000 description 4
- 230000003321 amplification Effects 0.000 description 4
- 230000029087 digestion Effects 0.000 description 4
- 239000013642 negative control Substances 0.000 description 4
- 230000007935 neutral effect Effects 0.000 description 4
- 238000003199 nucleic acid amplification method Methods 0.000 description 4
- YBYRMVIVWMBXKQ-UHFFFAOYSA-N phenylmethanesulfonyl fluoride Chemical compound FS(=O)(=O)CC1=CC=CC=C1 YBYRMVIVWMBXKQ-UHFFFAOYSA-N 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- 238000011144 upstream manufacturing Methods 0.000 description 4
- 108091026890 Coding region Proteins 0.000 description 3
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 3
- 238000000246 agarose gel electrophoresis Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 238000012869 ethanol precipitation Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 230000001105 regulatory effect Effects 0.000 description 3
- 239000011780 sodium chloride Substances 0.000 description 3
- 230000005026 transcription initiation Effects 0.000 description 3
- 230000005030 transcription termination Effects 0.000 description 3
- XNCSCQSQSGDGES-UHFFFAOYSA-N 2-[2-[bis(carboxymethyl)amino]propyl-(carboxymethyl)amino]acetic acid Chemical compound OC(=O)CN(CC(O)=O)C(C)CN(CC(O)=O)CC(O)=O XNCSCQSQSGDGES-UHFFFAOYSA-N 0.000 description 2
- 206010008342 Cervix carcinoma Diseases 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- 239000007983 Tris buffer Substances 0.000 description 2
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 201000010881 cervical cancer Diseases 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 239000012160 loading buffer Substances 0.000 description 2
- 238000013178 mathematical model Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000002244 precipitate Substances 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 102000004169 proteins and genes Human genes 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- 108020005345 3' Untranslated Regions Proteins 0.000 description 1
- 108020003589 5' Untranslated Regions Proteins 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 102000004594 DNA Polymerase I Human genes 0.000 description 1
- 108010017826 DNA Polymerase I Proteins 0.000 description 1
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 108060006698 EGF receptor Proteins 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 102000006947 Histones Human genes 0.000 description 1
- 108091029795 Intergenic region Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 102000007474 Multiprotein Complexes Human genes 0.000 description 1
- 108010085220 Multiprotein Complexes Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000019522 cellular metabolic process Effects 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 239000007771 core particle Substances 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000012350 deep sequencing Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 238000010201 enrichment analysis Methods 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 239000000834 fixative Substances 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 235000003642 hunger Nutrition 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 230000002934 lysing effect Effects 0.000 description 1
- 238000007886 magnetic bead extraction Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- WSFSSNUMVMOOMR-NJFSPNSNSA-N methanone Chemical compound O=[14CH2] WSFSSNUMVMOOMR-NJFSPNSNSA-N 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 238000012257 pre-denaturation Methods 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000008844 regulatory mechanism Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 102000023888 sequence-specific DNA binding proteins Human genes 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 239000012679 serum free medium Substances 0.000 description 1
- 239000000741 silica gel Substances 0.000 description 1
- 229910002027 silica gel Inorganic materials 0.000 description 1
- 230000037351 starvation Effects 0.000 description 1
- 239000008223 sterile water Substances 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Images
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明涉及全细胞水平高效捕获染色质核小体空缺区的新方法。所述新方法能在全基因组范围内更精确、更敏感地定位染色质核小体空缺区。这种方法可以用来寻找真核细胞转录调控的染色质核小体空缺区,是功能基因组研究的有效手段。
Description
技术领域
本发明属于医学分子生物学领域,涉及高通量全基因组水平捕获染色质核小体空缺区的新方法。
背景技术
后基因组时代研究的主要内容是基因的在基因组水平上调控机制,其中核小体定位以及其化学组成、其成分的修饰是重要的研究内容[1-6]。构成染色质的基本结构单位是核小体,正是核小体使DNA线性结构长度压缩了约10000倍,核小体结构在压缩基因组的同时,也限制了转录因子与DNA之间的结合。两分子的组蛋白H2A、H2B、H3和H4构成八聚体的核心组蛋白。长度约146bp的DNA分子在组蛋白八聚体上盘绕1.65圈形成核小体的核心颗粒,每个核小体之间由约60个碱基围绕着H1组蛋白的连接子连接[7-10]。以核小体形式存在的DNA会影响转录的每个过程,包括从转录起始复合物前体的结合到延伸的每一个阶段。146bp的DNA围绕组蛋白八聚体1.65圈;其中有14个组蛋白与DNA连接位点[11]。在生理条件下蛋白与DNA的结合形成的核小体是相对稳定存在的。但核小体并不是一个简单的稳定性的结构,它受很多蛋白复合体的调节并拥有不同的动态时相从而行使很复杂的生命活动。全基因组研究表明启动子区域的核小体的密度远远低于编码区的核小体密度。Yuan等人首次用高通量基因芯片技术发现在酵母基因启动子区都存在约200bp的核小体空缺区域[12]。早期和实验和严格的数学模型都支持这一假说:核小体的包装信号在全基因组序列上有序列依赖性[13]。通过这种数学模型预测在DNA的转录因子结合的位点有着低水平核小体占位,相反在DNA没有转录因子结合位点有着稳定的核小体占位。因而,真核细胞基因组里有序列特异性的转录因子结合位点,这些位点可以有蛋白靠近,所以在基因激活的第一步,这些序列比形成核小体的DNA序列更容易被刺激信号所激活。
核心组蛋白八聚体对特定的DNA序列有一定的选择性其选择性较其他序列高约1000倍;也有一些DNA序列特异性的DNA结合蛋白如转录因子等反式作用元件与DNA结合时,会阻止核小体结构的形成,从而导致数百个碱基对的DNA双链上没有核小体结构,我们称为核小体空缺区域(Nucleosome Free Region)[14]。这些核小体空缺区域经常发生在基因的转录起始位点或者转录终止点,或者转录因子结合的部位、或者转录活性较高的部位,这些位点对一些非特异的核酸酶如DNase I、MNase敏感[15]。核小体空缺区域的发现使我们对真核细胞转录调控机制有深刻的了解。目前许多研究试图用生物信息学计算机预测的办法,在基于DNA序列的前提下对酵母、人类、果蝇的核小体定位进行预测,并且更多的更复杂的算法不断出现。这种预测在统计学上行得通,但是与实验检测的核小体定位比起来,精确度会小很多。本发明以人宫颈癌细胞系HeLa S3为模型,采用染色质上DNA缺刻平移biotin掺入标记、磁珠沾取biotin DNA获得核小体空缺区域文库。结合高通量测序技术建立了全基因组水平上核小体空缺区域捕捉技术。为全基因组范围内更精确的定位活性染色质核小体空缺区域的研究提供新的方法。可以用来研究真核细胞转录调控的染色质区域,为基因组学研究提供了一个有效方法。
发明内容
本发明提供一种高通量全基因组水平捕获染色质核小体空缺区的新方法。
本发明中使用的细胞HeLa S3是本领域技术人员熟知的人宫颈癌细胞系。在优选的实施方案中,使用的工具酶是脱氧核糖核酸酶I(DNase I),S1核酸酶(S1nuclease)处理细胞核。最优选的方法是本发明中的采用中性甲醛固定细胞核,DNase I做缺刻,S1核酸酶切取缺刻DNA,缺刻DNA平移biotin掺入,磁珠沾取biotin-DNA构建文库的方法,以及通过该方法构建的HeLa S3细胞活性染色质NFR文库。
本发明涉及高通量全基因组水平捕获染色质核小体空缺区的新方法。它在基因组相关研究中有潜在的用途。
附图表说明
图1NFR片段扩增文库琼脂糖凝胶电泳
Mr1100bp DNA ladder
1、无DNase I酶切未掺入biotin-dATP的阴性对照
2、无DNase I酶切的阴性对照
3、未掺入biotin-dATP的阴性对照
4、DNase I酶切掺入biotin-dATP的NFR文库
图2NFR文库的特异性验证电泳图
Mr 100bp DNA Ladder
1-5无DNase I酶切的阴性对照1、N8引物2、N9引物3、S10引物4、S115、S12引物6-10NFR文库6、N8引物7、N9引物8、S10引物9、S11引物10、S12引物
图3Unique mapped reads在基因间区和基因上的分布特征
图4Unique mapped reads在基因上的覆盖深度
图5NFR peaks在全基因组上的分布
图6NFR文库与某些特定修饰位点或蛋白-DNA结合位点的富集测序结果相关性分析
具体实施方式
在本发明的具体实施方案中,以人HeLaS3细胞为模型,应用本发明的高通量全基因组水平捕获染色质核小体空缺区的新方法,捕捉活性染色质构建NFR文库,直接利用高通量全基因组深度测序技术捕捉染色质核小体空缺区域,分析其分布特征。为全基因组范围内更精确的定位活性染色质转录调控区域的研究建立了新的方法。
将HeLaS3细胞活性染色质经构建的NFR文库,送华大基因公司,Illumina公司的Solexa基因组分析平台(Genome Analyzer platform)进行高通量测序。通过高通量测序获得HeLaS3细胞染色质全基因组15000个核小体空缺区域片段。通过对本发明方法获得的15000个核小体空缺区在全基因组上分布进行的全面分析,证明本发明所采用的链置换缺刻平移标记掺入的方法,根据对已有的染色质构象的了解以及分子生物学酶学技术捕捉染色质上的核小体空缺区域,结合磁珠沾取来捕获全基因组核小体空缺区域的方法特异性很高。
本发明所述高通量全基因组水平捕获染色质核小体空缺区的新方法,包括裂解细胞,提取细胞核、中性甲醛固定细胞核,DNase I做缺刻、缺刻DNA平移biotin掺入、S1核酸酶切取缺刻DNA、苯酚/氯仿抽提,乙醇沉淀、DNA片段末端加A,加接头、磁珠沾取biotin-DNA、NFR文库扩增等8个步骤。
以下通过实施例来进一步阐明本申请的内容。应当理解,实施例仅用于示例性说明申请的技术方案的具体实施方式,而不是以任何方式限定本申请的范围。
实施例1
步骤一、裂解细胞,提取细胞核
培养HeLa S3细胞生长达80%融合后换无血清培养基,血清饥饿24小时[15,16]后,弃培养液。用冰预冷的PBS洗细胞两次,再加1ml PBS在冰上用细胞刮刮细胞,4℃,3000rpm离心10分钟,收集细胞。用PBS缓冲液悬浮细胞,并对细胞进行计数。107/管分装,再次离心收集细胞。加入细胞核分离缓冲液(10mM Tris buffer,pH 7.4,10mM NaCl,5mM MgCl2,1mM PMSF,0.2%NP40),轻柔混匀,使细胞终浓度为5×106/ml,冰浴10分钟。4℃下3000rpm离心10分钟,收集细胞核。用无NP40的缓冲液洗涤细胞核(10mM Tris buffer,pH 7.4,10mM NaCl,5mM MgCl2,1mM PMSF),洗去多余的NP40,4℃下3000rpm离心10分钟。
步骤二、中性甲醛固定细胞核,DNaseI做缺刻
1.加用PBS配制的甲醛固定液,甲醛终浓度为1%,轻柔混匀,室温下交联20分钟固定细胞核。
2.灭活甲醛
加2.5M的的甘氨酸至终浓度为0.125M,以灭活甲醛。轻柔混匀,放置10分钟后,4℃下3000rpm离心10分钟;用NEB buffer2洗涤重悬。4℃下3000rpm离心10分钟,弃上清。
3.DNaseI在染色质上打切口
配制0.02U/ml的DNase I缺刻液,用NEBbuffer2为缓冲液,室温下处理细胞核5分钟后,加0.5MEDTA至终浓度为20mM,用以灭活DNase I,4℃下3000rpm离心10分钟,弃上清。
步骤三、DNA缺刻平移biotin掺入
37℃孵育60分钟。加0.5MEDTA至终浓度为20mM,用以灭活DNApolymerase I,4℃下3000rpm离心10分钟,弃上清。
步骤四、S1nuclease处理细胞核
S1nuclease处理细胞核,工作浓度为330U/ml,室温孵育30分钟。以切取缺刻DNA。
23℃孵育45分钟,加8μl 0.5M EDTA终止反应。
步骤五、苯酚/氯仿抽提,乙醇沉淀DNA
加入等体积酚,冰上放置10min,12000rpm离心10min。取上清,加入等体积酚/氯仿(1∶1),冰上放置10min,12000rpm离心10min。再次取上清,加入1/10体积的3M NaAc和2.5倍体积的无水乙醇,-20℃沉淀1h以上,4℃12000rpm离心20min,沉淀用70%乙醇洗一遍,室温放置待乙醇挥发干净后,加入15μ1无菌水溶解。
步骤六、DNA片段末端加A,加接头
1.DNA片段末端加A
37℃孵育60分钟,65℃孵育20分钟后灭活。
2.加接头,用于DNA文库扩增
16℃过夜孵育。
步骤七、磁珠沾取biotin-DNA
1.清洗磁珠
在连接的同一天,处理磁珠,吸取80μl磁珠,1×WB buffer(5mM Tris-HCl(pH 7.5),0.5mMEDTA,1M NaCl),按200μl每管清洗,5分钟洗一次,洗3次。用1%BSA封闭过夜。1×WB buffer洗2次,按200μl每管清洗,每次5分钟,离心弃上清。600μl 2×WB buffer重悬浮磁珠。
2.链霉素磁珠与biotin的DNA相互结合
反应体系 体积(μl)
磁珠 100
DNA连接产物 100
25℃孵育4小时。
3.清洗磁珠,去掉没有连接的混合物
1×WB buffer,按200μl每管清洗,5分钟洗一次,洗3次。磁铁架把磁珠固定在EP管底,弃去上清。再用无菌ddH2O,5分钟洗一次共洗2次。
4.DNA从磁珠上洗脱
无菌ddH2O 20μl悬浮磁珠,70℃孵育30分钟,吸取上清。
步骤八、NFR文库扩增
1.NFR文库PCR扩增:
94℃,3min预变性;94℃,30sec;64℃,30sec;72℃,30sec;30次循环;72℃,10min;4℃。取10μl PCR产物,加6×上样缓冲液,1.5%琼脂糖凝胶电泳检测,结果如(图1)所示。
2.所得DNA用1.5%琼脂糖胶电泳,应用100bp Marker,加压100V电泳约30min。跑完胶后,切割约150bp的胶置于1.5ml EP管内。
3.采用QAGEN公司的胶回收纯化试剂盒回收DNA
称量胶重量,加入3倍体积QG结合液,55℃,10min将胶融化;将试剂盒中的硅胶膜型离心纯化管柱放入2ml的收集管;将样品分次转移至离心管柱中,13,000×g离心1min;弃去离心得到的液体,再将柱子放回原收集管;在柱内加入750μLPE buffer,13,000×g离心1min洗涤柱子;弃去离心得到的液体,再将柱子放回原收集管,13,000×g离心2min,尽量除去残余的乙醇;将离心管柱放入1.5ml的干净Eppendorf管中;在柱子中央加入100μLH2O,静置2min,13,000×g离心1min洗脱DNA。
步骤九、NFR文库的验证
选取五对引物对NFR文库实验操作进行可靠性验证。选取随机引物2对(N8,N9)和具有DNase I高敏感区域的2对引物(S10,S11)以及本实验室筛选到的一对egfr启动子区的DNaseI高敏感区域的引物(S12)进行验证。以不加接头的样品为对照。取10μl PCR产物,加6×上样缓冲液,1.5%琼脂糖凝胶电泳检测,结果如(图2)所示。PCR引物及接头序列如表1所示。
表1PCR引物及接头序列
| Primer | Sequence(5’→3’) |
| PE adapter1-s | ACACTCTTTCCCTACACGACGCTCTTCCGATCT |
| PE adapter1-as | GATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT-NH2 |
| PE adapter2-s | CTCGGCATTCCTGCTGAACCGCTCTTCCGATCT |
| PE adapter2-as | GATCGGAAGAGCGGTTCAGCAGGAATGCCGAG-NH2 |
| PE primer1 | ACACTCTTTCCCTACACGACGCTCTTCCGATCT |
| PE primer2 | CTCGGCATTCCTGCTGAACCGCTCTTCCGATCT |
| N8primer1 | CCAGCATTGGCACCATACCTACC |
| N8primer2 | CCTCCATAACAGGCACTGATAACACTT |
| N9primer1 | GGAAAGAGCAGGAGAAAGGGAATCTTGG |
| N9primer2 | CTCGTTTGTTCCCACAAGCTGAAGAGAC |
| S10primer1 | CTCTGACGTAGTGTGACCTTGCTCAT |
| S10primer2 | CCAACAGTCCTAGCAGAGCTGAATT |
| S11primer1 | GCTCTTTGCATCGCTCTCTGTCGG |
| S11primer2 | TTACCGCTCCGCGTAAGTGCGAAG |
| S12primer1 | AGAAGGAACAGTGGGGATGGGGT |
| S12primer2 | GTTTCCCCGTCGGTGCCATTAT |
实施例2
步骤一、NFR文库高通量测序
1、测序样品的制备
NFR文库制备方法同上步骤一至步骤八,提取HeLaS3细胞核;中性甲醛固定细胞核;DNaseI做缺刻;缺刻DNA平移biotin掺入;S1核酸酶切取缺刻DNA;苯酚/氯仿抽提,乙醇沉淀;DNA片段末端加A,加接头;磁珠沾取biotin-DNA;NFR文库扩增;胶回收DNA片段;用NanoDrop1000分光光度计测定胶回收产物浓度为100ng/μl,260/280比值为2.0。将样品送华大基因公司,Illumina公司的Solexa基因组分析平台(Genome Analyzer platform)进行高通量测序。
2、Unique mapped reads在编码区和内含子区分布情况。使用UCSC已知信息对Sequencing数据进行注释,计算外显子、内含子和保守非编码区域占Sequencing全部数据的比例,并与全基因组数据进行比较,得到Sequencing reads的分布信息,展现reads富集区与这些区域的相互关系如表2所示。Genome-wide为参考序列的相关信息。coding exons指的是全部的外显子或比例,或是指被翻译的外显子的比例。富集程度=(测序碱基数覆盖到相应特征区域的比例/全基因组上该特征区域的碱基数)×可比对的基因的碱基数。
表2比对reads在全基因组上的分布比例
步骤二、Unique mapped reads在基因间区和基因上的分布
将单个样品mapped reads与基因数据库做比对,统计该样品在基因间区,基因内含子区,基因外显子区,基因上游20K,基因下游20K的分布情况,如(图3)所示。
步骤三、Unique mapped reads在基因上的覆盖深度
将基因上游5K和基因下游5K各等分为40份,genebody等分为100份,然后对窗口扫描,计算reads在窗口的覆盖程度(即tag Density,计算:该区域tag总数/(样品tag总数*区域长度)(区域长度为:bp)。结果如(图4)所示,在已知基因以及其上下游调控区域在转录起始点和转录终止点有一峰值,证明在基因的转录起始点和终止点都有广泛的NFR分布;在转录起始点上游3kb-4kb有一峰值,次区域也有NFR分布,我们认为这个区域对转录调控有着重要调控作用。
步骤四、NFR peaks在全基因组上的分布
NFR全基因组上Peak的分布情况,包括:intergenic,intron,downstream20K,upstream20K,coding,5’UTR,3’UTR等不同基因功能元件的分布特征,分析结果如(图5)所示。
步骤四、Peak相关基因筛选与G0功能聚类分析
通过GO功能富集分析,可以知道peak相关基因涉及到哪些生物学功能的改变。图6中横轴代表GO项,左纵轴代表与GO相关的基因比例,右纵轴代表与GO相关的基因数量。结果显示在参与细胞代谢的基因、构成细胞组成性成分基因等活化的基因有广泛的NFR分布,这些NFR主要分布在基因的转录起始点和终止点附近,在沉默的基因中也有分布,但是不如活化的基因分布的多。
步骤五、NFR peaks的碱基组成性分析
在对15000个peaks的碱基组成序列进行分析,把测序结果的peaks序列调出,向前延续300bp,向后延续300bp,全长约700bp的15000个peaks里的polydA:dT总共有38129个,这个比例远远大于随机序列中的polydA:dT的比例。polydA:dT结构倾向于阻止核小体结构的形成。
参考文献
[1]Collins F.S.,Green E.D.,Guttmacher A.E.,and Guyer M.S.A vision for the future of genomicsresearch.Nature,2003,422:835-847.
[2]Vaillant C.,Palmeira L.,Chevereau G.,et al.A novel strategy of transcription regulation byintragenic nucleosome ordering.Genome Res.,2010,20:59-67.
[3]Yaragatti M.,Basilico C.and Dailey L.Identification of active transcriptional regulatorymodules by the functional assay of DNA from nucleosome-free regions.Genome Res.,2008,18:930-938.
[4]Carey M.,Smale S.T.Transcriptional regulation in eukaryotes:concepts,strategies,andtechniques[M].Cold Spring Harbor Laboratory Press,Cold Spring Harbor,2000,New York.
[5]Xi H.,Shulha H.P.,Lin J.M.,et al.Identification and Characterization of Cell RegulatoryStructures in the Human Genome.PLoS Genet.,2007,3(8):1377-1388.
[6]Kim T.M.and Park P.J.Advances in analysis of transcriptional regulatory networks.WIREsSystems Biology and Medicine,2010,3:21-35.
[7]Weiss E,Ruhlmann C,Oudet P.Transcriptionally active SV40minichromosomes are restrictionenzyme sensitive and contain a nucleosome-free origin region.Nucleic Acids Res.1986,14(5):2045-2058.
[8]Harbison C.T.,Gordon1D.B.,Lee1T.I.,Rinaldi1N.J.,Macisaac K.D.,et al.Transcriptionalregulatory code of a eukaryotic genome.Nature,2004,431,99-104.
[9]Segal E.,Fondufe M.Y.,Chen L.,Thastrom A.,Field Y,Moore I.K.,Wang J.P.,Widom J.Agenomic code for nucleosome positioning.Nature,2006,442:772-778.
[10]Ganapathi M.,Singh G.P.,Sandhu K.S.,Brahmachari S.K.,Brahmachari V.A whole genomeanalysis of 5’regulatory regions of human genes for putative cis-acting modulators of nucleosomepositioning.Gene,2007,391:242-251.
[11]Luger,K.,et al.Crystal structure of the nucleosome core particle at 2.8A resolution.Nature,1997,389(6648):251-60.
[12]Yuan,G.C.,et al.Genome-scale identification of nucleosome positions in S.cerevisiae.Science,2005,309(5734):626-30.
[13]Richmond,T.J.,Genomics:predictable packaging.Nature,2006,442(7104):750-2.
[14]Mavrich,T.N.,et al.A barrier nucleosome model for statistical positioning of nucleosomesthroughout the yeast genome.Genome Res,2008,18(7):1073-83.
[15]Gilbert,N.,et al.Chromatin architecture of the human genome :gene-rich domains areenriched in open chromatin fibers.Cell,2004,118(5):555-66.
Claims (3)
1.高通量全基因组水平捕获染色质核小体空缺区的新方法。
2.权利要求1捕获染色质核小体空缺区的新方法,其中选择DNase I酶切细胞核内染色质,染色质DNA缺刻平移biotin掺入标记,磁珠沾取biotin DNA获得核小体空缺区域进行文库构建。
3.权利要求2的所述的细胞主要指真核细胞。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201210087491.9A CN102691111B (zh) | 2012-03-29 | 2012-03-29 | 高通量全基因组水平捕获染色质核小体空缺区的方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201210087491.9A CN102691111B (zh) | 2012-03-29 | 2012-03-29 | 高通量全基因组水平捕获染色质核小体空缺区的方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN102691111A true CN102691111A (zh) | 2012-09-26 |
| CN102691111B CN102691111B (zh) | 2014-11-26 |
Family
ID=46856842
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201210087491.9A Expired - Fee Related CN102691111B (zh) | 2012-03-29 | 2012-03-29 | 高通量全基因组水平捕获染色质核小体空缺区的方法 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN102691111B (zh) |
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN108048543A (zh) * | 2017-12-25 | 2018-05-18 | 上海嘉因生物科技有限公司 | 应用于组织样本中核小体位点MNase酶切优化方法 |
| CN108179179A (zh) * | 2017-12-28 | 2018-06-19 | 上海嘉因生物科技有限公司 | 应用于组织样本中核小体位点MNase酶切优化方法 |
| CN108368548A (zh) * | 2015-11-09 | 2018-08-03 | 普罗格尼迪公司 | 用于确定dna分子的来源的方法 |
| CN110904191A (zh) * | 2019-12-21 | 2020-03-24 | 福建农林大学 | 一种快速简便构建植物DNase-seq文库的方法及应用 |
| CN112921070A (zh) * | 2019-12-05 | 2021-06-08 | 首都医科大学 | 全基因组蛋白结合位点捕获的新方法及其用途 |
| CN117384938A (zh) * | 2023-11-06 | 2024-01-12 | 内蒙古大学 | 一种调控外源基因表达的方法 |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2004081183A2 (en) * | 2003-03-07 | 2004-09-23 | Rubicon Genomics, Inc. | In vitro dna immortalization and whole genome amplification using libraries generated from randomly fragmented dna |
| CN102061526A (zh) * | 2010-11-23 | 2011-05-18 | 深圳华大基因科技有限公司 | 一种DNA文库及其制备方法、以及一种检测SNPs的方法和装置 |
-
2012
- 2012-03-29 CN CN201210087491.9A patent/CN102691111B/zh not_active Expired - Fee Related
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2004081183A2 (en) * | 2003-03-07 | 2004-09-23 | Rubicon Genomics, Inc. | In vitro dna immortalization and whole genome amplification using libraries generated from randomly fragmented dna |
| CN102061526A (zh) * | 2010-11-23 | 2011-05-18 | 深圳华大基因科技有限公司 | 一种DNA文库及其制备方法、以及一种检测SNPs的方法和装置 |
Non-Patent Citations (3)
| Title |
|---|
| MANUELA L. MURER-ORLANDO AND ALAN C. PETERSON: "In situ Nick Translation of Human and Mouse Chromosomes Detected with a Biotinylated Nucleotide", 《EXPERIMENTAL CELL RESEARCH》 * |
| SABINE ADOLPH AND HORST HAMEISTER: "In situ nick translation of metaphase chromosomes with biotin-labeled d-UTP", 《HUM GENET》 * |
| 杨锦等: "利用RNA 捕获法在全基因组进行egfr 启动子片段的富集", 《首都医科大学学报》 * |
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN108368548A (zh) * | 2015-11-09 | 2018-08-03 | 普罗格尼迪公司 | 用于确定dna分子的来源的方法 |
| CN108048543A (zh) * | 2017-12-25 | 2018-05-18 | 上海嘉因生物科技有限公司 | 应用于组织样本中核小体位点MNase酶切优化方法 |
| CN108179179A (zh) * | 2017-12-28 | 2018-06-19 | 上海嘉因生物科技有限公司 | 应用于组织样本中核小体位点MNase酶切优化方法 |
| CN112921070A (zh) * | 2019-12-05 | 2021-06-08 | 首都医科大学 | 全基因组蛋白结合位点捕获的新方法及其用途 |
| CN110904191A (zh) * | 2019-12-21 | 2020-03-24 | 福建农林大学 | 一种快速简便构建植物DNase-seq文库的方法及应用 |
| CN117384938A (zh) * | 2023-11-06 | 2024-01-12 | 内蒙古大学 | 一种调控外源基因表达的方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| CN102691111B (zh) | 2014-11-26 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Head et al. | Library construction for next-generation sequencing: overviews and challenges | |
| Denker et al. | The second decade of 3C technologies: detailed insights into nuclear organization | |
| Wu et al. | Widespread influence of 3′-end structures on mammalian mRNA processing and stability | |
| Tan et al. | A landscape of circular RNA expression in the human heart | |
| Park et al. | Simultaneous mapping of transcript ends at single-nucleotide resolution and identification of widespread promoter-associated non-coding RNA governed by TATA elements | |
| Tariq et al. | Whole-transcriptome RNAseq analysis from minute amount of total RNA | |
| Cullum et al. | The next generation: using new sequencing technologies to analyse gene regulation | |
| Gazzoli et al. | Non-sequential and multi-step splicing of the dystrophin transcript | |
| Mercer et al. | Regulated post-transcriptional RNA cleavage diversifies the eukaryotic transcriptome | |
| CN102732629B (zh) | 利用高通量测序同时测定基因表达量和多聚腺苷酸加尾的方法 | |
| CN102691111B (zh) | 高通量全基因组水平捕获染色质核小体空缺区的方法 | |
| CN110878334B (zh) | 用于扩增子测序的引物及两步pcr建库方法 | |
| Ballantyne et al. | Genome-wide interrogation reveals hundreds of long intergenic noncoding RNAs that associate with cardiometabolic traits | |
| Liu et al. | Polyadenylation ligation‐mediated sequencing (PALM‐Seq) characterizes cell‐free coding and non‐coding RNAs in human biofluids | |
| Coleman et al. | Structural annotation of equine protein‐coding genes determined by mRNA sequencing | |
| CN108060460A (zh) | 一种small RNA的文库构建及测序方法 | |
| Tarbell et al. | CD4+ T cells from children with active juvenile idiopathic arthritis show altered chromatin features associated with transcriptional abnormalities | |
| US10287621B2 (en) | Targeted chromosome conformation capture | |
| CN110607363A (zh) | 一种用于高通量检测糖尿病致病基因突变的核酸组及其试剂盒和应用 | |
| Rosinski-Chupin et al. | Riboswitch discovery by combining RNA-seq and genome-wide identification of transcriptional start sites | |
| Li et al. | Comprehensive analysis of dysregulated exosomal long non-coding RNA networks associated with arteriovenous malformations | |
| EP4632077A1 (en) | Multibody full-length sequencing analysis method for single cell using multi-combination assembly reaction of dna fragments | |
| Pelechano et al. | Genome-wide polyadenylation site mapping | |
| CN120272616A (zh) | 一种检测呼吸道感染病原微生物的探针组、方法及其应用 | |
| US20230104375A1 (en) | Method for multiplexable strand-specific 3' end sequencing of mrna transcriptome primer set, kit and application thereof |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| C06 | Publication | ||
| PB01 | Publication | ||
| C10 | Entry into substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| C14 | Grant of patent or utility model | ||
| GR01 | Patent grant | ||
| CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20141126 Termination date: 20180329 |
|
| CF01 | Termination of patent right due to non-payment of annual fee |