CN102691111A

CN102691111A - 高通量全基因组水平捕获染色质核小体空缺区的新方法及其用途

Info

Publication number: CN102691111A
Application number: CN2012100874919A
Authority: CN
Inventors: 张玉祥; 李振华; 王雅梅; 周萍
Original assignee: Capital Medical University
Current assignee: Capital Medical University
Priority date: 2012-03-29
Filing date: 2012-03-29
Publication date: 2012-09-26
Anticipated expiration: 2032-03-29
Also published as: CN102691111B

Abstract

本发明涉及全细胞水平高效捕获染色质核小体空缺区的新方法。所述新方法能在全基因组范围内更精确、更敏感地定位染色质核小体空缺区。这种方法可以用来寻找真核细胞转录调控的染色质核小体空缺区，是功能基因组研究的有效手段。

Description

高通量全基因组水平捕获染色质核小体空缺区的新方法及其用途

技术领域

本发明属于医学分子生物学领域，涉及高通量全基因组水平捕获染色质核小体空缺区的新方法。

背景技术

后基因组时代研究的主要内容是基因的在基因组水平上调控机制，其中核小体定位以及其化学组成、其成分的修饰是重要的研究内容[1-6]。构成染色质的基本结构单位是核小体，正是核小体使DNA线性结构长度压缩了约10000倍，核小体结构在压缩基因组的同时，也限制了转录因子与DNA之间的结合。两分子的组蛋白H2A、H2B、H3和H4构成八聚体的核心组蛋白。长度约146bp的DNA分子在组蛋白八聚体上盘绕1.65圈形成核小体的核心颗粒，每个核小体之间由约60个碱基围绕着H1组蛋白的连接子连接[7-10]。以核小体形式存在的DNA会影响转录的每个过程，包括从转录起始复合物前体的结合到延伸的每一个阶段。146bp的DNA围绕组蛋白八聚体1.65圈；其中有14个组蛋白与DNA连接位点[11]。在生理条件下蛋白与DNA的结合形成的核小体是相对稳定存在的。但核小体并不是一个简单的稳定性的结构，它受很多蛋白复合体的调节并拥有不同的动态时相从而行使很复杂的生命活动。全基因组研究表明启动子区域的核小体的密度远远低于编码区的核小体密度。Yuan等人首次用高通量基因芯片技术发现在酵母基因启动子区都存在约200bp的核小体空缺区域[12]。早期和实验和严格的数学模型都支持这一假说：核小体的包装信号在全基因组序列上有序列依赖性[13]。通过这种数学模型预测在DNA的转录因子结合的位点有着低水平核小体占位，相反在DNA没有转录因子结合位点有着稳定的核小体占位。因而，真核细胞基因组里有序列特异性的转录因子结合位点，这些位点可以有蛋白靠近，所以在基因激活的第一步，这些序列比形成核小体的DNA序列更容易被刺激信号所激活。

核心组蛋白八聚体对特定的DNA序列有一定的选择性其选择性较其他序列高约1000倍；也有一些DNA序列特异性的DNA结合蛋白如转录因子等反式作用元件与DNA结合时，会阻止核小体结构的形成，从而导致数百个碱基对的DNA双链上没有核小体结构，我们称为核小体空缺区域(Nucleosome Free Region)[14]。这些核小体空缺区域经常发生在基因的转录起始位点或者转录终止点，或者转录因子结合的部位、或者转录活性较高的部位，这些位点对一些非特异的核酸酶如DNase I、MNase敏感[15]。核小体空缺区域的发现使我们对真核细胞转录调控机制有深刻的了解。目前许多研究试图用生物信息学计算机预测的办法，在基于DNA序列的前提下对酵母、人类、果蝇的核小体定位进行预测，并且更多的更复杂的算法不断出现。这种预测在统计学上行得通，但是与实验检测的核小体定位比起来，精确度会小很多。本发明以人宫颈癌细胞系HeLa S3为模型，采用染色质上DNA缺刻平移biotin掺入标记、磁珠沾取biotin DNA获得核小体空缺区域文库。结合高通量测序技术建立了全基因组水平上核小体空缺区域捕捉技术。为全基因组范围内更精确的定位活性染色质核小体空缺区域的研究提供新的方法。可以用来研究真核细胞转录调控的染色质区域，为基因组学研究提供了一个有效方法。

发明内容

本发明提供一种高通量全基因组水平捕获染色质核小体空缺区的新方法。

本发明中使用的细胞HeLa S3是本领域技术人员熟知的人宫颈癌细胞系。在优选的实施方案中，使用的工具酶是脱氧核糖核酸酶I(DNase I)，S1核酸酶(S1nuclease)处理细胞核。最优选的方法是本发明中的采用中性甲醛固定细胞核，DNase I做缺刻，S1核酸酶切取缺刻DNA，缺刻DNA平移biotin掺入，磁珠沾取biotin-DNA构建文库的方法，以及通过该方法构建的HeLa S3细胞活性染色质NFR文库。

本发明涉及高通量全基因组水平捕获染色质核小体空缺区的新方法。它在基因组相关研究中有潜在的用途。

附图表说明

图1NFR片段扩增文库琼脂糖凝胶电泳

Mr1100bp DNA ladder

1、无DNase I酶切未掺入biotin-dATP的阴性对照

2、无DNase I酶切的阴性对照

3、未掺入biotin-dATP的阴性对照

4、DNase I酶切掺入biotin-dATP的NFR文库

图2NFR文库的特异性验证电泳图

Mr 100bp DNA Ladder

1-5无DNase I酶切的阴性对照1、N8引物2、N9引物3、S10引物4、S115、S12引物6-10NFR文库6、N8引物7、N9引物8、S10引物9、S11引物10、S12引物

图3Unique mapped reads在基因间区和基因上的分布特征

图4Unique mapped reads在基因上的覆盖深度

图5NFR peaks在全基因组上的分布

图6NFR文库与某些特定修饰位点或蛋白-DNA结合位点的富集测序结果相关性分析

具体实施方式

在本发明的具体实施方案中，以人HeLaS3细胞为模型，应用本发明的高通量全基因组水平捕获染色质核小体空缺区的新方法，捕捉活性染色质构建NFR文库，直接利用高通量全基因组深度测序技术捕捉染色质核小体空缺区域，分析其分布特征。为全基因组范围内更精确的定位活性染色质转录调控区域的研究建立了新的方法。

将HeLaS3细胞活性染色质经构建的NFR文库，送华大基因公司，Illumina公司的Solexa基因组分析平台(Genome Analyzer platform)进行高通量测序。通过高通量测序获得HeLaS3细胞染色质全基因组15000个核小体空缺区域片段。通过对本发明方法获得的15000个核小体空缺区在全基因组上分布进行的全面分析，证明本发明所采用的链置换缺刻平移标记掺入的方法，根据对已有的染色质构象的了解以及分子生物学酶学技术捕捉染色质上的核小体空缺区域，结合磁珠沾取来捕获全基因组核小体空缺区域的方法特异性很高。

本发明所述高通量全基因组水平捕获染色质核小体空缺区的新方法，包括裂解细胞，提取细胞核、中性甲醛固定细胞核，DNase I做缺刻、缺刻DNA平移biotin掺入、S1核酸酶切取缺刻DNA、苯酚/氯仿抽提，乙醇沉淀、DNA片段末端加A，加接头、磁珠沾取biotin-DNA、NFR文库扩增等8个步骤。

以下通过实施例来进一步阐明本申请的内容。应当理解，实施例仅用于示例性说明申请的技术方案的具体实施方式，而不是以任何方式限定本申请的范围。

实施例1

步骤一、裂解细胞，提取细胞核

培养HeLa S3细胞生长达80％融合后换无血清培养基，血清饥饿24小时[15，16]后，弃培养液。用冰预冷的PBS洗细胞两次，再加1ml PBS在冰上用细胞刮刮细胞，4℃，3000rpm离心10分钟，收集细胞。用PBS缓冲液悬浮细胞，并对细胞进行计数。10⁷/管分装，再次离心收集细胞。加入细胞核分离缓冲液(10mM Tris buffer，pH 7.4，10mM NaCl，5mM MgCl₂，1mM PMSF，0.2％NP40)，轻柔混匀，使细胞终浓度为5×10⁶/ml，冰浴10分钟。4℃下3000rpm离心10分钟，收集细胞核。用无NP40的缓冲液洗涤细胞核(10mM Tris buffer，pH 7.4，10mM NaCl，5mM MgCl₂，1mM PMSF)，洗去多余的NP40，4℃下3000rpm离心10分钟。

步骤二、中性甲醛固定细胞核，DNaseI做缺刻

1.加用PBS配制的甲醛固定液，甲醛终浓度为1％，轻柔混匀，室温下交联20分钟固定细胞核。

2.灭活甲醛

加2.5M的的甘氨酸至终浓度为0.125M，以灭活甲醛。轻柔混匀，放置10分钟后，4℃下3000rpm离心10分钟；用NEB buffer2洗涤重悬。4℃下3000rpm离心10分钟，弃上清。

3.DNaseI在染色质上打切口

配制0.02U/ml的DNase I缺刻液，用NEBbuffer2为缓冲液，室温下处理细胞核5分钟后，加0.5MEDTA至终浓度为20mM，用以灭活DNase I，4℃下3000rpm离心10分钟，弃上清。

步骤三、DNA缺刻平移biotin掺入

37℃孵育60分钟。加0.5MEDTA至终浓度为20mM，用以灭活DNApolymerase I，4℃下3000rpm离心10分钟，弃上清。

步骤四、S1nuclease处理细胞核

S1nuclease处理细胞核，工作浓度为330U/ml，室温孵育30分钟。以切取缺刻DNA。

23℃孵育45分钟，加8μl 0.5M EDTA终止反应。

步骤五、苯酚/氯仿抽提，乙醇沉淀DNA

加入等体积酚，冰上放置10min，12000rpm离心10min。取上清，加入等体积酚/氯仿(1∶1)，冰上放置10min，12000rpm离心10min。再次取上清，加入1/10体积的3M NaAc和2.5倍体积的无水乙醇，-20℃沉淀1h以上，4℃12000rpm离心20min，沉淀用70％乙醇洗一遍，室温放置待乙醇挥发干净后，加入15μ1无菌水溶解。

步骤六、DNA片段末端加A，加接头

1.DNA片段末端加A

37℃孵育60分钟，65℃孵育20分钟后灭活。

2.加接头，用于DNA文库扩增

16℃过夜孵育。

步骤七、磁珠沾取biotin-DNA

1.清洗磁珠

在连接的同一天，处理磁珠，吸取80μl磁珠，1×WB buffer(5mM Tris-HCl(pH 7.5)，0.5mMEDTA，1M NaCl)，按200μl每管清洗，5分钟洗一次，洗3次。用1％BSA封闭过夜。1×WB buffer洗2次，按200μl每管清洗，每次5分钟，离心弃上清。600μl 2×WB buffer重悬浮磁珠。

2.链霉素磁珠与biotin的DNA相互结合

反应体系体积(μl)

磁珠 100

DNA连接产物 100

25℃孵育4小时。

3.清洗磁珠，去掉没有连接的混合物

1×WB buffer，按200μl每管清洗，5分钟洗一次，洗3次。磁铁架把磁珠固定在EP管底，弃去上清。再用无菌ddH₂O，5分钟洗一次共洗2次。

4.DNA从磁珠上洗脱

无菌ddH₂O 20μl悬浮磁珠，70℃孵育30分钟，吸取上清。

步骤八、NFR文库扩增

1.NFR文库PCR扩增：

94℃，3min预变性；94℃，30sec；64℃，30sec；72℃，30sec；30次循环；72℃，10min；4℃。取10μl PCR产物，加6×上样缓冲液，1.5％琼脂糖凝胶电泳检测，结果如(图1)所示。

2.所得DNA用1.5％琼脂糖胶电泳，应用100bp Marker，加压100V电泳约30min。跑完胶后，切割约150bp的胶置于1.5ml EP管内。

3.采用QAGEN公司的胶回收纯化试剂盒回收DNA

称量胶重量，加入3倍体积QG结合液，55℃，10min将胶融化；将试剂盒中的硅胶膜型离心纯化管柱放入2ml的收集管；将样品分次转移至离心管柱中，13,000×g离心1min；弃去离心得到的液体，再将柱子放回原收集管；在柱内加入750μLPE buffer，13,000×g离心1min洗涤柱子；弃去离心得到的液体，再将柱子放回原收集管，13,000×g离心2min，尽量除去残余的乙醇；将离心管柱放入1.5ml的干净Eppendorf管中；在柱子中央加入100μLH2O，静置2min，13,000×g离心1min洗脱DNA。

步骤九、NFR文库的验证

选取五对引物对NFR文库实验操作进行可靠性验证。选取随机引物2对(N8，N9)和具有DNase I高敏感区域的2对引物(S10，S11)以及本实验室筛选到的一对egfr启动子区的DNaseI高敏感区域的引物(S12)进行验证。以不加接头的样品为对照。取10μl PCR产物，加6×上样缓冲液，1.5％琼脂糖凝胶电泳检测，结果如(图2)所示。PCR引物及接头序列如表1所示。

表1PCR引物及接头序列

Primer	Sequence(5’→3’)
		PE adapter1-s	ACACTCTTTCCCTACACGACGCTCTTCCGATCT
PE adapter1-as	GATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT-NH2
		PE adapter2-s	CTCGGCATTCCTGCTGAACCGCTCTTCCGATCT
PE adapter2-as	GATCGGAAGAGCGGTTCAGCAGGAATGCCGAG-NH2
		PE primer1	ACACTCTTTCCCTACACGACGCTCTTCCGATCT
PE primer2	CTCGGCATTCCTGCTGAACCGCTCTTCCGATCT
		N8primer1	CCAGCATTGGCACCATACCTACC
N8primer2	CCTCCATAACAGGCACTGATAACACTT
		N9primer1	GGAAAGAGCAGGAGAAAGGGAATCTTGG
N9primer2	CTCGTTTGTTCCCACAAGCTGAAGAGAC
		S10primer1	CTCTGACGTAGTGTGACCTTGCTCAT
S10primer2	CCAACAGTCCTAGCAGAGCTGAATT
		S11primer1	GCTCTTTGCATCGCTCTCTGTCGG
S11primer2	TTACCGCTCCGCGTAAGTGCGAAG
		S12primer1	AGAAGGAACAGTGGGGATGGGGT
S12primer2	GTTTCCCCGTCGGTGCCATTAT

实施例2

步骤一、NFR文库高通量测序

1、测序样品的制备

NFR文库制备方法同上步骤一至步骤八，提取HeLaS3细胞核；中性甲醛固定细胞核；DNaseI做缺刻；缺刻DNA平移biotin掺入；S1核酸酶切取缺刻DNA；苯酚/氯仿抽提，乙醇沉淀；DNA片段末端加A，加接头；磁珠沾取biotin-DNA；NFR文库扩增；胶回收DNA片段；用NanoDrop1000分光光度计测定胶回收产物浓度为100ng/μl，260/280比值为2.0。将样品送华大基因公司，Illumina公司的Solexa基因组分析平台(Genome Analyzer platform)进行高通量测序。

2、Unique mapped reads在编码区和内含子区分布情况。使用UCSC已知信息对Sequencing数据进行注释，计算外显子、内含子和保守非编码区域占Sequencing全部数据的比例，并与全基因组数据进行比较，得到Sequencing reads的分布信息，展现reads富集区与这些区域的相互关系如表2所示。Genome-wide为参考序列的相关信息。coding exons指的是全部的外显子或比例，或是指被翻译的外显子的比例。富集程度＝(测序碱基数覆盖到相应特征区域的比例/全基因组上该特征区域的碱基数)×可比对的基因的碱基数。

表2比对reads在全基因组上的分布比例

步骤二、Unique mapped reads在基因间区和基因上的分布

将单个样品mapped reads与基因数据库做比对，统计该样品在基因间区，基因内含子区，基因外显子区，基因上游20K，基因下游20K的分布情况，如(图3)所示。

步骤三、Unique mapped reads在基因上的覆盖深度

将基因上游5K和基因下游5K各等分为40份，genebody等分为100份，然后对窗口扫描，计算reads在窗口的覆盖程度(即tag Density，计算：该区域tag总数/(样品tag总数*区域长度)(区域长度为：bp)。结果如(图4)所示，在已知基因以及其上下游调控区域在转录起始点和转录终止点有一峰值，证明在基因的转录起始点和终止点都有广泛的NFR分布；在转录起始点上游3kb-4kb有一峰值，次区域也有NFR分布，我们认为这个区域对转录调控有着重要调控作用。

步骤四、NFR peaks在全基因组上的分布

NFR全基因组上Peak的分布情况，包括：intergenic，intron，downstream20K，upstream20K，coding，5’UTR，3’UTR等不同基因功能元件的分布特征，分析结果如(图5)所示。

步骤四、Peak相关基因筛选与G0功能聚类分析

通过GO功能富集分析，可以知道peak相关基因涉及到哪些生物学功能的改变。图6中横轴代表GO项，左纵轴代表与GO相关的基因比例，右纵轴代表与GO相关的基因数量。结果显示在参与细胞代谢的基因、构成细胞组成性成分基因等活化的基因有广泛的NFR分布，这些NFR主要分布在基因的转录起始点和终止点附近，在沉默的基因中也有分布，但是不如活化的基因分布的多。

步骤五、NFR peaks的碱基组成性分析

在对15000个peaks的碱基组成序列进行分析，把测序结果的peaks序列调出，向前延续300bp，向后延续300bp，全长约700bp的15000个peaks里的polydA:dT总共有38129个，这个比例远远大于随机序列中的polydA:dT的比例。polydA:dT结构倾向于阻止核小体结构的形成。

参考文献

[1]Collins F.S.，Green E.D.，Guttmacher A.E.，and Guyer M.S.A vision for the future of genomicsresearch.Nature，2003，422：835-847.

[2]Vaillant C.，Palmeira L.，Chevereau G.，et al.A novel strategy of transcription regulation byintragenic nucleosome ordering.Genome Res.，2010，20：59-67.

[3]Yaragatti M.，Basilico C.and Dailey L.Identification of active transcriptional regulatorymodules by the functional assay of DNA from nucleosome-free regions.Genome Res.，2008，18：930-938.

[4]Carey M.，Smale S.T.Transcriptional regulation in eukaryotes：concepts，strategies，andtechniques[M].Cold Spring Harbor Laboratory Press，Cold Spring Harbor，2000，New York.

[5]Xi H.，Shulha H.P.，Lin J.M.，et al.Identification and Characterization of Cell RegulatoryStructures in the Human Genome.PLoS Genet.，2007，3(8)：1377-1388.

[6]Kim T.M.and Park P.J.Advances in analysis of transcriptional regulatory networks.WIREsSystems Biology and Medicine，2010，3：21-35.

[7]Weiss E，Ruhlmann C，Oudet P.Transcriptionally active SV40minichromosomes are restrictionenzyme sensitive and contain a nucleosome-free origin region.Nucleic Acids Res.1986，14(5)：2045-2058.

[8]Harbison C.T.，Gordon1D.B.，Lee1T.I.，Rinaldi1N.J.，Macisaac K.D.，et al.Transcriptionalregulatory code of a eukaryotic genome.Nature，2004，431，99-104.

[9]Segal E.，Fondufe M.Y.，Chen L.，Thastrom A.，Field Y，Moore I.K.，Wang J.P.，Widom J.Agenomic code for nucleosome positioning.Nature，2006，442：772-778.

[10]Ganapathi M.，Singh G.P.，Sandhu K.S.，Brahmachari S.K.，Brahmachari V.A whole genomeanalysis of 5’regulatory regions of human genes for putative cis-acting modulators of nucleosomepositioning.Gene，2007，391：242-251.

[11]Luger，K.，et al.Crystal structure of the nucleosome core particle at 2.8A resolution.Nature，1997，389(6648)：251-60.

[12]Yuan，G.C.，et al.Genome-scale identification of nucleosome positions in S.cerevisiae.Science，2005，309(5734)：626-30.

[13]Richmond，T.J.，Genomics：predictable packaging.Nature，2006，442(7104)：750-2.

[14]Mavrich，T.N.，et al.A barrier nucleosome model for statistical positioning of nucleosomesthroughout the yeast genome.Genome Res，2008，18(7)：1073-83.

[15]Gilbert，N.，et al.Chromatin architecture of the human genome ：gene-rich domains areenriched in open chromatin fibers.Cell，2004，118(5)：555-66.

Claims

1.高通量全基因组水平捕获染色质核小体空缺区的新方法。

2.权利要求1捕获染色质核小体空缺区的新方法，其中选择DNase I酶切细胞核内染色质，染色质DNA缺刻平移biotin掺入标记，磁珠沾取biotin DNA获得核小体空缺区域进行文库构建。

3.权利要求2的所述的细胞主要指真核细胞。