CN101133166B

CN101133166B - 平行制备核酸及应用

Info

Publication number: CN101133166B
Application number: CN2006800066623A
Authority: CN
Inventors: 高晓莲; 周小川; 张小林; 盛苨晶; 朱奇
Original assignee: Individual
Current assignee: Hangzhou Chuan Chuan Biotechnology Ltd By Share Ltd
Priority date: 2005-03-10
Filing date: 2006-03-01
Publication date: 2011-02-02
Anticipated expiration: 2026-03-01
Also published as: US20070031942A1; WO2007040592A1; US7544793B2; CN101133166A; WO2007040592A8

Abstract

本发明涉及到基因组学、合成生物学和遗传工程等领域。本发明特别涉及到在固相表面平行多链体连接和扩增的方法，用于制备生物应用的核酸组装体及分析各种生物样品，例如DNA、RNA、和蛋白质。

Description

平行制备核酸及应用

技术领域

背景技术

本发明涉及到核酸技术领域，特别是制备和应用已知序列的核酸。目前来说，生物科学和技术的主要进展是基于基础分子科学在基因组水平上的科研和应用。因此需要更快，更经济，更好的实验工具来满足日益增长的科研需要。在基因组和蛋白质组学研究领域，传统的分子生物学技术已经飞速朝着微型化、平行化、自动化技术发展。传统的单个实验现在可以使用自动机械操作，在96或384微孔板平行进行。这些实验只需微摩尔级别的材料和毫升级别的溶液。然而，现有的进展仍然不能满足大规模的应用，如基因组水平的研究或大量样品的处理。因为此类大规模实验需要成千上万的测试，这些测试用价昂贵和消耗大量的时间(几个月到几年)。对人群进行基因组水平的单核苷酸多态性分析(SNP)就是其中一例，此实验能够提供对于预测和预防遗传病及对生命有威胁疾病的分子诊断，例如癌症的诊断，的宝贵信息。如果对每个人的每个多态性位点进行一次测试，使用10mL溶液，如有100,000个多态性位点和1,000个人，那么单溶剂的消耗量达1,000,000升，相当于一个小型化工厂的年产量。另一个例子，如合成寡核苷酸的基因并组装成基因也显示了当前常规方法的不足之处。一个小型基因组一般由几千个基因组成，包括大约5百万个碱基对。单考虑溶剂，若传统的方法的一个合成循环需要消耗5mL的溶剂，获得这个基因组的寡核苷酸就需要消耗50,000升溶剂。基于这种水平的材料消耗，在基因组水平上进行研究很显然是不切实际。这样大规模的实验需要大量的器械和充足的空间来处理和储存试剂。整个过程还要耗费大量的劳力、时间而且容易出错。为了克服这些问题急需发展新技术来减少试剂的消耗量，将微摩尔(固体)或毫升(液体)的用量降低1000倍或更多。这样的新技术的优势是显而易见的，包括用于基因组水平的实验研究，加速错综复杂的生物细胞系统的理解，有助于发现新的调控机理，同时节约自然资源。在材料和时间的节约就意味着，因而对环境友好，也在经济上可行。

本发明的目标之一是合成大片段DNA。大片段DNA可以是完整的基因或基因的一部分，或是任合部分的染色体DNA或生物源DNA，也可以是任何任意序列组成的DNA。DNA序列信息和强大的计算方法使得改造DNA序列成为可能。这些序列可以模仿或改造大量转录RNA和蛋白质的功能和作用。这个初成的领域称作合成生物学，它包括构建DNA文库来转录RNA或表达蛋白质/抗体和多肽，使生化、农业和环境领域受益。合成生物学也包括构建完整基因组来制备RNA和蛋白质，并能组装成生物分子复合物、生物信号传导系统、有机体和细胞。采用当前的DNA合成方法完成从寡核苷酸组装成长链核酸是非常昂贵并且速度较慢，或者仅限于组装消化后的散乱的天然DNA片段(Stemmer，1994)。

分子生物学家已经用寡核苷酸组装成DNA来生成天然基因、突变基因(切断、融合、插入/缺失)、杂合基因、转基因等(Dillon et al.，1990；Stemmer et al.，1995；Au etal.，1998)。合成的基因通常长度为1,000碱基对(1kbp)或者更长，一般是通过在溶液中连接30-80bp的寡核苷酸文库一次组装完成一个基因。根据要组装的DNA信息专门设计寡核苷酸，并在固相表面进行化学合成，如在可控制的多孔玻璃(CPG)进行化学合成，然后通常在没有纯化步骤的情况下，这些寡核苷酸被组装成长DNA片段。基因的组装过程需要完成两项任务：(1)寡核苷酸退火和杂交形成一个双链复合物；(2)通过连接反应使这些寡核苷酸形成长链共价相连的的核苷酸。作为选择地，寡核苷酸双链复合体包含重叠区域，通过聚合酶链式反应(PCR)可以延伸成长链产物。当前的基因合成方法在杂交、连接和PCR步骤的次序上稍有不同，但都局限于小片段的基因合成。当前的一种合成方法是根据感兴趣的DNA合成一套寡核苷酸，并在连接酶和聚合酶的作用下同时进行连接和PCR过程(e.g.ligation chain reaction(LCR))。在这个过程中，中等长度的DNA片段先生成，并在随后的重叠融合PCR中产生全长的DNA。该方法已经用于合成5.4kbp噬菌体基因组(Smith et al.，2003)和7.5kbp脊髓灰质炎病毒基因组(Cello et al.，2002)。另一个方法(U.S.Pat.Nos.6,521,427和U.S.Pat.No.6,670,127)是将合成双链聚核苷酸，包括将不同的双链复合物连续变性退火产生长链双链DNA，其中的缺刻位点再通过连接酶连接。总体来说，当前的DNA合成方法在一个组装反应中只能产生一个序列，因此整个过程比较缓慢且成本较高。

历史上，寡核苷酸的合成并不是为了高通量平行应用而开发，而仅是用于单个序列核酸的应用。今天，寡核苷酸的合成基本上还是靠一个个碱基的合成。用当前的方法进行高通量合成受到合成速度和成本的限制，大约每天只能合成40,000bp且每对碱基需要约0.1美金。因此，用寡核苷酸组装一个含5,000个基因，每个基因平均1,000kbp，的小型基因组将需要500,000美金和125天的时间(以每天工作24小时计算)。如果以40-mer寡核苷酸来组装则需要合成250,000条寡核苷酸链。另外，这些寡核苷酸需要独立完成并根据基因合成的需要保持一定浓度且混合成一个寡核苷酸库。实验室需要自动液体处理装置和庞大的温控储藏空间来进行整个过程，不大量的时间和财力被耗费。由于混合的寡核苷酸库易因操作错误并得到不同浓度，在组装中一个寡核苷酸的缺失就可能导致整个基因合成的失败。假设这些条件都被优化，合成一个基因中的一对碱基将需要花费大约2美金并且会需要四个星期完成全部合成工作。

当前基于微芯片的DNA寡核苷酸合成技术在合成的通量上得到了极大的提高(Zhou et al.2004)。该方法在设计有上千个独立的反应微室的微流体装置中平行合成上千个寡核苷酸。每个微室的反应体积为皮升数量级，合成的寡核苷酸从表面切下并混合收集。基于微芯片合成上千个寡核苷酸仅仅消耗常规方法合成一条寡核苷酸所消耗的试剂。合成后的寡核苷酸收集在一个离心管中，这大大简化了后续寡核苷酸的应，如进行基因合成。该方法产生的寡核苷酸混合物通过连接反应已经用于构建全长714bp的绿色荧光蛋白基因(Zhou et al.2004)。另一个办法是对寡核苷酸混合物使用独立的PCR反应，然后通过限制性酶切反应去除引物，扩增的寡核苷酸再经融合PCR产生21个编码大肠杆菌30S核糖体蛋白的基因，这些基因总共长14.6kbp(Tianet al2004)。通过杂交的方法纯化这些扩增的寡核苷酸使它们的保真性提高9倍(Tianet al2004)。

上述基因合成的方法克服了寡核苷酸合成过程中费时、价格昂贵等的缺点，但该方法仍不适合同时组装大量基因或DNA片段。正确组装全长的基因或DNA片段需要将所组成的寡核苷酸片段正确退火。这些寡核苷酸通常在30-50个碱基长度。因此，对于1kbp的双链需要用40个以上的寡核苷酸进行组装。这是一个高度有序的n(n＝寡核苷酸的数目)个组分间的反应，对于全长基因组装成功与否取决于n的大小。当n＝40，或大于40时，组装失败的几率相当高。高通量或多基因合成需要同时组装上百个或更多的寡核苷酸。由于相关核苷酸之间或本身存在较高的交叉反应而形成各种结构，因此基于需要高度有序反应的基因合成失败的机会随着n值的提高而大大增加。现在还没有同时组装十个以上基因或长链DNA的例子。

一些酶促反应包括连接、缺口填平(缺口填平可能是连接反应中的一部分)、链延伸及PCR对于制备长链核酸非常有帮助。连接反应需要连接酶的参与，如DNA链接酶中有：Taq连接酶、T4连接酶、和T7连接酶，RNA连接酶有：T4RNA连接酶，这些酶能将寡核苷酸的5′-磷酸和3′-羟基连接起来。一种连接形式是将单链核酸或末端钝化的双链核酸连接起来。另一种连接反应是将参与连接的寡核苷酸与互补模板连杂交形成含有缺刻位点的双链复合物，在连接酶作用下缺刻位点的5′-磷酸和3′-羟基连接起来。再有一种连接反应是两个以上的双链复合物部分重叠的寡核苷酸杂交形成连续重叠且带有粘性末端的双链复合物。该双链复合物包含两个以上的缺刻位点，在连接酶作用下缺刻位点的5′-磷酸和3′-羟基连接起来。由于连接反应倾向与在酶反应位点有稳定的双链结构，在双链复合物形式连接中，两个与互补链连接的关核苷酸的互补碱基(A与T配对，C与G配对)决定了连接反应的效率。这种基本的配对要求已经开发用于检测特殊的基因组或RNA序列，或用于DNA各种序列变化的分析，如在可能的突变位点设置连接位点，然后通过检测产物连中在该位点含有C还是T来检测A是否突变成G。这些基于连接反应的方法已经广泛用于单核苷酸多态性检测、人类基因组单模标本制作及在基因表达谱中鉴定特殊的基因(Landegren et al.1988；Nickerson et al.1990；Bibikova et al.2004；Fan et al.2004)。这些方法的应用原理基本都是模板链在溶液中进行连接反应，然后通过读取连接后的产物的荧光、化学发光或其他信号来进行检测。另一个与溶液相连接反应类似的方法是在光学薄膜的生物传感器微阵列中通过固定与基因型相适应的特异序列的探针进行连接反应(Zhong et al.2003)。该实验表明了可通过完全匹配的寡核苷酸连接成正确的基因型。基于连接反应的基因型分析的优势在于其比基于杂交的遗传分析更具特异性。这些方法同样要求预先合成好寡核苷酸，因此进行大规模的实验受到与用寡核苷酸合成长链DNA同样的限制。

基于寡核苷酸的应用，如基因合成，和基于连接反应的定量检测遗传分析受所使用的寡核苷酸质量的影响。这些未纯化的寡核苷酸会使基因合成保真性降低，限制了DNA合成的长度，使分析的质量下降，甚至产生假阳性或假阴性的结果。尽管传统的寡核苷酸合成是每步产率很高，通常在98.5％以上，但核苷酸的替换、缺失和插入频繁出现，几率高达1/160bp(Tian et al.2004)。在这样的错误率下，长链DNA(大于1kbp)就不可能在较高的效率下进行组装。这样就要求进行大规模的测序而从许多错误的序列中筛选正确的全长序列。尽管先前基因组装的大多数方法使用未纯化的寡核苷酸，但有一些方法已改进了基于连接反应的应用：(a)通过计算机辅助设计寡核苷酸来降低错误的杂交，优化其长度，序列的组成，并通过熔解温度平衡双链复合物的稳定性和其他的物化参数(Rouillard et al.2003)。(b)通过表面固定的寡核苷酸互补链与寡核苷酸的亲和杂交来纯化寡核苷酸(Zhou et al.2004；Tian et al2004)，而有错误的寡核苷酸因形成的不稳定双链复合物而被洗去。(c)通过酶识别和/或切除错误的序列，例如用内切酶切除错配的突出序列或环序列。可以识别非互补的核酸双链复合物的酶包括T7内切酶I、T4内切酶VII、mutS/mutY/mutL错配结合修复蛋白和单链结合蛋白。(d)通过化学法降解错误的DNA序列。许多有机无机分子能结合和诱导切除错配结合的寡核苷酸(Gao和Han，2001)。(e)使用纯化标签把合成的正确的寡核苷酸从错误的群体中分离出来。纯化标签包括如生物素(与生物素亲和蛋白结合)、硫醇(形成二硫键与金结合)和其他类型分子能基于亲和能力，电荷或分子大小来分离正确与错误寡核苷酸。(f)通过色谱分离正确与错误的寡核苷酸，例如变性高效液相色谱(Mulligan和Tabone(2003)U.S.Pat.No.6,664,112)。

合成的多序列DNA有许多应用，例如制备RNA、体外转录已知序列、制备蛋白或多肽文库。历来，通过采用已知序列的DNA转录为RNA或蛋白产品的过程往往是一次制备一种。因此，制备这些生物学上重要的分子费时并且昂贵，利用合成的RNA或蛋白分子是不可能成为常用的方法。

本发明克服了先前基因组装方法的限制，提供了一种快速、有效、经济的的方法来制备一个以上寡核苷酸或具有期望序列和长度的多聚核苷酸，并能在多方面应用。

发明内容

本发明的方法涉及在固相表面进行多种酶促反应。特别是，这些反应包括但并不局限于连接、扩增、复制、转录和翻译，并且这些反应的产物会与反应前的物质不同。新生成的产物可以是后续多体反应的反应物。一些本发明实施方法包括使用已知序列寡核苷酸混合物的反应。例如，用寡核苷酸混合物来制备长链核酸分子。表面上每平方毫米含有9到2的11次方的反应位点更适宜平行进行连接、扩增、复制、转录和翻译反应。本发明描述十个，百个，上千个，上万个，百万个空间分离的表面位点的反应方法。

本发明在每个反应位点至少为一种寡核苷酸序列或可能有多种寡核苷酸序列。在本发明较佳实施中，两种或更多的序列以分子临近状态进行酶反应，例如连接反应。

本发明描述的方法利用寡核苷酸混合物在反应位点表面通过杂交和连接已知序列的寡核苷酸序列进行平行反应。杂交和连接反应同步或者连续进行，可提高基因序列分析的特异性，例如检测miRNA序列、单核苷酸多态性、染色体排列异常、基因表达分析和测序。

本发明较佳实施包括在分离的的反应位点的反应。分离的反应位点可以是在微流体微阵列装置上，通过表面张力(Gao et al.2001；Srivannavit et al.2004)，分散的小珠粒，微小粒子(nanoparticles)，或是固相表面单分子微阵列。

本发明其他较佳实施包括包含有用于制备DNA、RNA或DNA-RNA杂合体的方法。在该领域中，核酸修饰的技术已有相当的应用。对于长DNA片段构建，通常的化学合成方法难以制备100个碱基或以上的DNA序列。进行高通量制备长链DNA才能进行基因组水平的实验，如制备合成的基因用于DNA文库、RNA、蛋白、抗体或医药诊断上重要多肽的生产。构建已知长度和序列的DNA、合成的基因及其转录和翻译产物是制备微阵列中所需要的DNA、cDNA、cRNA多肽和蛋白的材料基础。在本发明较佳实施中，制备长链DNA是通过逐步连接寡核苷酸的方式进行。该逐步反应的方式可用于监控有效反应，控制反应的质量。

在本发明较佳实施中，用于连接的寡核苷酸混合物及表面固定的寡核苷酸(捕获探针)是根据DNA同一序列的连续区域进行设计的。捕获探针通过化学或酶的磷酸化作用方法使5’端磷酸化。另外，也可以通过核酸酶消化特殊的位点来获得5’磷酸化的捕获探针。用于连接的寡核苷酸或捕获探针通过与模板链杂交或自身退火形成有缺失或缺刻位点的双链复合物。一些错误的杂交序列通过提高温度、降低盐浓度、添加变性剂如SDS、甲酰胺或二甲亚砜等严格的杂交条件来去除。这些程序提高了杂交的特异性并可产生高保真的连接产物。在本发明较佳实施包括，表面完全正确配对的双链序列与某些蛋白或配体分子结合，这种结合跟与互补链错误杂交结合不同。结合形成复合物的不同提供了分离了这两种正确配对和错配类型的序列的方法，因而也改善了合成序列的质量。

本发明较佳实施包括，连接反应包括直接连接或结合缺口填平和连接功能。连接反应要求两个寡核苷酸序列与模板链杂交后在连接处的一个寡核苷酸具有5’端磷酸基团，另一个具有3’端羟基。因此，基于5’端磷酸基团和3’端羟基的连接反应是一个可控的过程。对这些位点进行修饰，如去除、封闭或替换5’端磷酸基团或3’端羟基，将会由于该寡核苷酸具有非可连接5’或3’末端而限制了连接或缺口填平反应的进行。

附图说明

图1A-E—表面杂交连接反应基本的过程图解说明。捕获探针的表面连接臂和空间延伸臂未在图中显示，捕获探针有3’-OH或5’-OPO₃(5‘-P)，并远离表面。捕获探针与模板序列的杂交过程，模板序列可含有检测的标签下一步与连接的寡核苷酸序列(ligator)杂交，ligator也可含有检测的标签。这样的连接反应连接了两个寡核苷酸，在表面形成长的双链，然后用严格的洗脱-剥离条件去除杂交模板链，从而留下单链序列。

图2—通过杂交连接反应制备单链或双链核苷酸的过程。(a)在表面有众多的寡核苷酸，将含有部分可互补杂交序列的第一种寡核苷酸混合物添加到表面反应。(b)将含有部分可互补杂交序列的第二种寡核苷酸混合物添加到表面反应。(c)通过进行连接反应延伸在表面序列的长度。(d)将含有部分可互补杂交序列的第三种寡核苷酸混合物添加到表面反应。(e)通过进行连接反应延伸双链复合物两条链的长度。(f)将含有部分可互补杂交序列的第四种寡核苷酸混合物添加于表面反应。(g)通过进行连接反应延伸双链复合物两条链的长度。(h)另一可行的方法为，将含有部分可互补杂交序列的第三种寡核苷酸混合物添加于表面反应，寡核苷酸杂交后不进行与临近链的连接反应。(i)将含有部分可互补杂交序列的第四种寡核苷酸混合物添加于表面反应。(j)通过进行连接反应延伸双链复合物两条链的长度，包含标签的#12和#13用于检测。标签可以是荧光分子、与抗体结合的亲和标签、共轭的生物素、核酸序列和其他直接或间接提供检测信号的分子。

图3A—使用正交合成表面寡核苷酸探针的图解说明。X1和X2是不同化学组分的保护基团。将X1或X2去除，功能基团OH或NH₂会暴露，从而允许偶联引入的合成单体如核苷酸合成单体。X1和X2可以用完全不同的反应条件去除。例如，X1可以是DMT基团，该基团可以在酸性条件下去除，而X2是Fmoc基团，该基团可以在碱性条件下去除。在去除第一个保护基团后，寡核苷酸合成按照通常的方法在固相表面进行合成。随后去除X2保护基团，寡核苷酸合成按照通常的方法在固相表面进行合成。在表面包括了众多保护基团的寡核苷酸，可以通过有区别的去保护来合成众多不同的寡核苷酸序列。

图3B—使用正交合成在芯片上进行连接反应的说明。(c)在同个反应位点的两种不同的链反向平行形成一个捕获探针。(d)连接反应在表面进行。(e)在严格的洗脱条件下，与捕获探针杂交的目标序列留在表面，而那些与捕获探针只有部分杂交的错误序列将从表面去除。(f)在表面连接起来的环作为扩增的模板，进行PCR或等温扩增。在本发明较佳实施中，至少有一个引物带有检测标签，例如广泛用于生物化学和生物学中的核酸和蛋白分析的荧光染料或化学发光组分。

图3C一两个相邻的不同寡核苷酸与目标序列在表面进行的杂交和连接示意图。该过程同样产生双链复合物。(g)在表面有众多成对的寡核苷酸。成对的序列相对于5’端呈反向平行排列，并且至少部分为双链。各种长度的目标序列与表面探针杂交(7a和7b作为杂交的双链复合物或7c和7d作为另一杂交链)。(h)紧接着进行下一步杂交反应(i)洗脱后保留正确连接配对的双链复合物。

图4A—通过形成自身为模板的发夹序列，依据它们的序列和特定的长度来检测核酸序列的杂交连接示意图。该方法对于特异序列的检测非常有效。(a)在表面众多的自身为模板的寡核苷酸序列(1a)中加入第一寡核苷酸混合物(1b，1c或1d)或目标序列到表面。(b)更严格的杂交条件，如低浓度的缓冲溶液或促使双链打开的溶液添加到表面。杂交后形成双链复合物(2a)和包含了错配的序列(2b和2c)。经洗脱步骤后，在表面留下互补双链。(c)连接产生一个单链发夹序列。(d)多步杂交和连接。例如产物(5)来源于链接片段ii和i。

图4B—在芯片上进行多重杂交和连接反应检测miRNA示意图。X＝(LNA)n，其他修饰的核苷酸；n＝0，1，2，3等；n选择是用于平衡杂交双链的退火温度。Z＝Am，其他与X互补的序列；m＝1，2等到100。Nk＝寡核苷酸；k＝3，4，5到5,000碱基。N’k’＝包含有至少一段与连接序列互补的寡核苷酸；k’＝3，4，5到5,000碱基。圆形符号表示为检测标签。捕获探针以与图中所示相反的5’-3’的方向排列。1a是捕获探针，1b是3’端添加poly(A)的样品miRNA。2b和2c是带有或不带有检测标签的连接序列。3a和3b是检测标签。4a和4b是带有或不带有标签的连接后的序列；4c是没有目标互补序列的捕获探针。5是代表性通过多步杂交和连接形成的双链复合物；其中通过被修饰而带有一个或多个检测标签。

图5—使用对于5’端方向相反的初始序列连接反应对比示意图。(a)连接寡核苷酸的合成说明。通常合成方法是从3’到5’延伸产生全长序列；附带产生的失败的序列大多数3’端正确，但长度较短，并且朝向5’端出错可能较高。(b)通过连接在表面链的5’磷酸和连接寡核苷酸的3’-OH开始连接反应。错误的序列也杂交形成连接位点，但该情况比正常的要少很多，并且会进而终止随后的连接反应中。(c)通过连接在表面链的3’-OH和连接寡核苷酸的5’磷酸开始连接反应。错误的序列不会形成正确的连接位点并会在连接反应后被洗去，这样就提高了连接反应的纯度。

图6—在芯片上有限制地随机合成寡核苷酸示意图。序列用替代序列表示，并使用替代密码子。#组相当于已知序列的寡核苷酸混合物。每个替代序列代表一些编码序列和一些氨基酸残基；每个替代序列代表许多的寡核苷酸序列和一些多肽序列。组成的寡核苷酸混合物和替代密码子可以根据所设计的蛋白质序列的要求随时改变。

图7—由一套寡核苷酸通过杂交和连接反应合成长链DNA示意图。寡核苷酸的数量是由被合成基因的长度决定的。当在固相表面组装时，捕获探针用粗线在左边表示。全长的基因可以直接合成，或者基因的片段先被组装，然后这些片段再进而组装成全长基因(图7B)。寡核苷酸的长度通常在6-100个碱基，合适长度为25-70个碱基。双链复合物可以直接合成或通过PCR扩增完成，这些产物需要通过限制性酶切除不属于基因序列部分的引物序列。(a)被合成的基因可以是单链或是双链。(b)一套寡核苷酸包含设计有部分重叠的双链序列。通过杂交和连接这些序列产生长链DNA序列。(c)两套寡核苷酸双链复合物在设计时有部分重叠，且末端是钝化的。通过杂交和连接这些序列产生长链DNA序列。(d)一套寡核苷酸包含设计有部分重叠的双链序列。通过DNA扩增反应把重叠区域的双链复合物延长成全长双链。

图8—用相应的DNA引物或掺入有RNA的引物与连接好的DNA片段合成长链DNA示意图。如图所示，连接好的DNA片段进行组装不局限于2个片段；多个连接好的DNA片段或其他合适序列的双链DNA也可以通过重叠PCR产生长链DNA。(a)让连接好的单链或双链复合物和含有RNA切除位点的引物进行扩增反应。(b)使用RNase酶切除含RNA位点。(c)使用单链DNA酶消化引物切除后形成的悬垂末端。(d)进行重叠PCR产生长链DNA。

图9A—在芯片上进行寡核苷酸及反应产物的平行合成、杂交、连接和其他酶反应示意图。由硅和玻璃熔合形成的两层结构，在硅板上分布有蚀刻的反应微室及进出口通道，并且通过微室相连。图中显示了位于选择位点的数字光射，光射到的位点能发生可控的光反应产生酸。随后的杂交、连接和其他反应可在同一表面进行；另外，合成后切除的寡核苷酸混合物将用于另一个含有捕获探针的芯片。

图9B—用于描述寡核苷酸混合物合成的微芯片三维示意图。该芯片也可用于进行杂交、连接和其他酶反应。

图9C—用于描述支持寡核苷酸混合物合成的平整表面的示意图。这些位点是空间上分离的反应位点。

图10A-10F—显示cy5检测信号的荧光图片：(A)cy5标记的PCR产物杂交到芯片上；(B)连接反应后的芯片图；(C)经严格洗脱剥脱后，显示cy5荧光检测信号的芯片图分别为：(D)没有杂交任何cy5标记的序列；(E)连接反应结果；(F)芯片经剥脱过程后存在的连接序列。

图11—用连接反应检测SNP的阳性和阴性探针示意图。

图12—使用融合蛋白的策略，固定蛋白质在芯片上进行蛋白表达方法示意图。采用新合成的蛋白或融合了荧光蛋白的新合成蛋白作为原位表达指示剂。(12a)在表面固定了带有亲和标签的核糖体或多核蛋白复合物。(12b)目标蛋白通过融合多肽或结合特殊氨基酸带上亲和结合成分的标签。(12c)目标蛋白在溶液中直接分析。(12d)融合了修饰蛋白的目标蛋白和唯一与蛋白识别的寡核苷酸形成共价键。(12e)带有嘌呤标签的目标蛋白也可以与编码蛋白的mRNA共价结合。

图13—组成268bps DNA片段(SEQ ID#90-1)的寡核苷酸排列示意图。通过杂交、连接反应同时进行组装多个DNA片段，生成长链DNA。组装后的序列可以用SEQ ID#90-P2-1R和#90-P2-2R引物进行扩增。“x”是一个限制酶切位点。

图14A—组成EGFP片段的寡核苷酸布局示意图。核苷酸片段长度在40个碱基左右。SEQ ID#96-S10的5’端用cy3染料标记。

图14B—该荧光图片用于监控在表面进行多个DNA片段组装的连接子的杂交和退火过程。在方框区域的荧光信号由cy3标记SEQ ID#90-S10的产生，阳性信号说明期望的EGFP的DNA片段在表面组装成功。

图15—用引物SEQ ID#90-S1和#90-A14扩增后，表面组装合成的EGFP DNA片段的凝胶电泳图。孔道2-4是在表面组装后扩增的DNA片段。孔道5-7是在溶液中组装扩增后的DNA片段。孔道8是DNA分子量标尺。

图16—中等长度的DNA片段和质粒经过酶切(EcoR I)形成的1k bps DNA片段。孔道3和4是268+18bps的DNA片段；孔道5，6和7是520+18bps的DNA片段；孔道8和9是770+18bps的DNA片段；孔道10和11是1,000+42bps的全长DNA；孔道1，2和12是DNA分子量标尺。

具体实施方式

定义

下列使用的术语具有下述通常的意义：

术语“基质”、“表面”和“固相支持物”可替换指核酸合成中用于引出功能基团的任何材料。

术语“核苷酸”指一个5碳糖上通过糖苷键连有一个碱基和在糖基5’位置连有一个磷酸基团。天然的核苷酸含有的碱基有：腺嘌呤(A)、胞嘧啶(C)、鸟嘌呤(G)、胸腺嘧啶(T)和尿嘧啶(U)。

术语“修饰的核苷酸”指含有其他化学组分而与天然核苷酸不同的核苷酸。

术语“连接臂”指一个结合基团，用于在固相合成时分子锚定于固相支持物。

术语“空间臂”指一个化学基团连接于连接子或一个锚定组分，在连接子和固定的核酸序列之间作为聚合链合成的起始位点。例如空间臂包括但不局限于乙烯聚合体、烷基、含分支链分子、聚合物、寡核苷酸、多肽和模拟肽。空间臂分子末端可以羟基或氨基基团结尾，用于合成寡核苷酸或核酸序列。

术语“3’-5’合成”指将核苷酸的3’磷酸加到多聚核酸链末端的5’-OH上；该方式在寡核苷酸合成中较常用。

术语“5’-3’合成”指将核苷酸的5’磷酸加到多聚核酸链末端的3’-OH上；该方式也称作反向合成。

术语“错误序列”指所有获得合成的寡核苷酸序列中与所设计的序列不同的。错误序列产生的错误有碱基的缺失、插入、替换和寡核苷酸的断裂。

术语“染料”指能产生可检测光学信号的分子、化合物或物质(荧光、冷光、量热、拓扑等)。如染料包括的荧光分子可与核酸分子连接。

术语“标记”指对核酸和寡核苷酸进行修饰，使带标记的序列提供可检测的信号。可检测标记包括任何能通过分光镜、光化学、生物化学、免疫化学、电子、光学、拓扑、或化学方法产生检测信号的化合物。

术语“检测标签”指附于核酸和寡核苷酸后能在分子内产生检测信号或用于提供产生检测信号的组分。一个众所周知的例子是作为检测标签的生物素。它结合到一个修饰的能产生检测信号的组分。可检测的标签包括任何能通过分光镜、光化学、生物化学、免疫化学、电子、光学、拓扑、或化学方法产生检测信号的化合物。

术语“寡核苷酸”指两个或更多的脱氧核核糖苷酸和/或核糖核苷酸通过磷酸二酯键连接在一起；术语“寡核苷酸”不局限于天然类型的核苷酸而可以包括碱基、糖基和/或骨架经化学修饰的寡核苷酸。寡核苷酸的序列直接按5’到3’的惯例书写，除非有特别说明。

术语“核酸”和“核酸序列”均指明为脱氧核糖核苷酸或核糖核苷酸聚合物或寡聚物，包括双链或单链的形式，除非特别注明，它们包括自然界中的已知的与这里具有相同或相似功能的核苷酸类似物。

术语“引物”指一类多聚核苷酸，能与互补的模板退火并作为起始位点依据模板合成核酸序列，如多聚核酸扩增反应。引物不需要与模板序列精确匹配，但必须大部分与模板互补杂交。

术语“双链复合物”和“双链”可替换指至少部分或全部配对的双链寡核苷酸或依照5’端反向与另一条链的3’端匹配的核酸。

术语“寡核苷酸混合物”指含有至少两条或更多不同序列的寡核苷酸。

术语“目标序列”指溶液中与表面探针杂交的寡核苷酸。

术语“杂交”和“结合”在文中与核酸链和寡核苷酸链相关。该术语定义为两条链碱基配对形成双链复合物或至少部分呈双链复合物的反应过程。典型的杂交会形成关于5’反向的双链复合物。天然的核酸在DNA中形成A和T、G和C或是在RNA中形成A和U碱基对。这些是互补碱基对。

术语“退火”指寡核苷酸链中特殊的相互作用。一条链根据Watson-Crick定义的碱基互补配对原则与另一条链结合。

术语“严格”指在进行核酸杂交时的温度、离子强度和其他存在的化合物。用“高严格”条件，指核酸片段只有在互补链序列高度保真且有足够的杂交稳定性时碱基发生互补配对。因此，“弱”或是“低”严格条件下，通常是希望核酸之间不完全互补或是在较低的杂交稳定性下杂交和退火。

术语“错配”指在两个核苷酸之间没有互补配对。在DNA中互补配对的碱基指A-T和G-C配对，在RNA中指A-U和G-C配对。因此，错配发生指在DNA中两个寡核苷酸序列配对后一个以上的位置A不是与T配对或G不是与C配对，在RNA中A不是与U配对或G不是与C配对。

术语“完全匹配”或“完全互补”指两个寡核苷酸它们的全部或部分序列全部互补配对。完全互补存在于一条较短的核苷酸全部碱基与另一条长核苷酸完全互补。短的核苷酸可以“完全互补”，即使它比所匹配的寡核苷酸要来的短。

术语“发夹”指寡核苷酸碱基折叠配对形成的状态。发夹是由分子内序列折叠形成碱基配对的双链区域，两条链通过单链环相连的结构。发夹序列可以自身为模板用于连接反应。寡核苷酸可以与发夹突出的一端杂交，随后与发夹短的一端连接。

术语“阵列”和“微阵列”可替换指多个不同位点序列连接在一个或多个固相表面。该术语阵列也能指在支持物上收集全部或部分寡核苷酸。通过连接子和/或空间臂固定在表面的序列阵列作为探针或捕获探针。

术语“捕获探针”指寡核苷酸通过一种或多种化学键通常是碱基互补配对形成的氢键与目标核酸互补序列结合。捕获探针在选定杂交条件下设计与目标序列充分互补的序列。在这里使用的捕获探针包括天然的核糖核苷酸或脱氧核糖核苷酸，如腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶或是修饰的核酸，如甲基化核苷酸、7’修饰的鸟嘌呤、次黄苷、5’磷酸化、分子内硫键连接或是其他修饰基团。捕获探针中的核苷酸碱基也可通过磷酸二酯键或其它键连接，只要选择的连接键不干扰杂交。捕获探针可以全部或部分由套锁式核酸(LNAs)和/或其他修饰的核苷酸或通过肽连接碱基的肽核酸(PNAs)制成。捕获探针可以包含一个或多个连接臂和/或空间臂，并且用5’或3’端与空间臂或连接臂相连。

术语“连接序列”指通过连接反应将一个以上寡核苷酸连接起来的序列。连接的寡核苷酸包括捕获探针，并且通过连接一个以上的寡核苷酸使捕获探针延伸。该术语指连续或同时进行一个以上寡核苷酸连接子的连接反应后，链延伸了的连接寡核苷酸序列。

术语“连接”在文中指通过反应以共价键连接两个核酸序列。一般说，连接反应需要两条序列与模板杂交，在连接酶作用下一条链的5’端磷酸与另一条链的3’-OH形成磷酸二酯键而连接。连接反应发生在两个双链复合物的互补的粘性末端或平末端也发生在单链的DNA和/或RNA。术语“连接”泛指包括缺口填平和连接步骤的反应。本发明文中指的“连接”包含了缺口填平使对于同个模板的两个杂交序列的连接位点成为可连接末端，同时也指包括其他方法共价连接这些序列，如通过化学方法。

术语“连接酶”指用于催化连接反应的酶。DNA连接酶共价连接DNA链，RNA连接酶连接RNA链，一些连接酶催化连接单链或双链的RNA与RNA和/或RNA与DNA分子间的连接。

术语“连接子”指能杂交后形成的双链复合物包含能用于杂交的缺刻和/或缺口位点的寡核苷酸。

术语“模板链”和“模板序列”在连接内容中可替换指一个序列至少有部分序列区域与两个序列互补。这三个序列间的杂交通过连接反应形成双链复合物。

术语“自身模板”和“自身形成模板”可替换指模板链与杂交链为同一个序列。

术语“稳定剂”指能稳定特定结构的试剂或溶剂，如双链、发夹结构。这些稳定剂包括多聚胺，多聚物如聚乙二醇，金属离子如二价钴、二价镁、二价镍和三价镍等，其他阳离子如多聚赖氨酸、阳离子脂质体、阳离子多聚物、聚乙烯亚胺、铵离子或是这些试剂的组合。

本发明的详细描述

本发明涉及在固相表面通过杂交和连接互补的短寡核苷酸同时组装成两个或更多的长寡核苷酸。通过本发明所描述的方法在固相表面制备，产生的加长的寡核苷酸序列不是随机生成的，而是可寻址的且精心设计好的。本发明所运用特异序列的寡核苷酸混合物和各种形式的捕获探针在表面进行平行连接反应。本发明利用的微型化技术如微阵列、小珠阵列、单分子阵列用于(a)经济有效地同时构建多个单链、部分双链和/或双链寡核苷酸或多聚核苷酸，包括但不局限于DNA、RNA、DNA/RNA杂合物、部分双链复合物和双链核酸；(b)用于遗传分析更灵敏和特异的检测方法；(c)在表面进行转录、翻译和其他生化反应，而这些反应通常是在离心管里进行单个反应测试。

图1-8是本发明所涉及方法的普通示意图。图1-8显示本发明在表面单个位点的进行的情况。这些图只是代表性的说明，本发明方法能用于在多个固定位点构建各种已知序列的寡核苷酸，提供在多个位点连续或同时进行各种反应。本发明方法使用的和连接序列产生的寡核苷酸在每个反应位点可以一样也可以不同。本发明方法甚至提供在同个位点合成不同的寡核苷酸和延长的寡核苷酸。本发明方法第一步中，在固相支持物上固定捕获探针。在固相支持物上固定捕获探针可以将预先合成的捕获探针放置在固相表面或是在固相支持物上直接合成捕获探针(Gao，Zhou和Gulari2004)。本发明方法不局限于探针固定于表面的方法，也不局限于表面利用的方法类型。有许多已知的DNA、RNA芯片制备的方法都可以在本发明中利用。捕获探针也可以通过固定在固相支持物上的连接臂和/或空间臂连接，这些都是在该领域众所周知的技巧。捕获探针的朝向既可以3’-5’也可以5’-3’，在合成捕获探针时，是要求恰当地选择连接子、空间臂和/或寡核苷酸来达到所希望的朝向。当捕获探针通过5’末端基团与连接子连接，5’-OH需通过化学、生化方法磷酸化或限制性酶切方法转化成5′-端磷酸化。

图1所示本发明最适合的的一个应用实例，捕获探针安置在固相支持物上，添加单链或双链目标序列并在一定的杂交条件下与捕获探针杂交。在一些或所有例子中，杂交后，目标序列的一部分与捕获探针形成双链但还有部分呈单链。随后，连接寡核苷酸(连接子)与目标序列的单链区域杂交并与捕获探针相邻。所设计的捕获探针和连接寡核苷酸经上述步骤后完全与同个目标序列杂交，各自的一端完全接近，并可以在连接酶条件下有效地完成连接。捕获探针与连接子寡核苷酸的连接延长了初始序列的长度，后续的产物称作连接核酸序列。

图2所示，添加作为寡核苷酸混合物的目标序列/连接子的步骤。在初始循环中这些寡核苷酸与捕获探针杂交，其他在表面的单链序列在一段时间里进行循环杂交反应。连接杂交形成的双链复合物可提供所要长度和序列的单链、双链或部分双链的寡核苷酸，并且这些寡核苷酸可带有用于检测的标签。有许多分子可以作为标签如荧光分子、用于结合抗体的亲和标签、共轭的抗生素/链霉素、核酸序列和其他直接或间接提供检测信号的分子。本发明方法力图在与捕获探针初始杂交后的杂交和连接步骤能在不同次序下结合整个过程进行。寡核苷酸混合物可以连续、同时或是组合添加。例如，在寡核苷酸混合物与捕获探针初始杂交后，逐步添加寡核苷酸混合物用于杂交和连接步骤(图2，步骤b，c，d，e)可以核酸聚合物得以延长。连接序列的代表性例子如图2(类型4和6)所示。可供选择的逐步添加寡核苷酸混合物用于杂交的方法是重复一次以上添加，然后进行连接反应(图2，步骤d，f，和g，或步骤h，i，和j)。通过这些反应延伸了核酸聚合物的长度。连接序列代表性的例子如图2(类型8和11)所示。可供选择的方法是组合添加寡核苷酸混合物用于进行杂交和连接使核酸聚合物的链延长，连接序列代表性的例子如图2(类型4，6，8和11)。图2所示的添加寡核苷酸混合物用于杂交和连接可如所描述的方法进行用于组装所希望长度的核酸聚合物。在一定情况下要求产生单链产物时，一条链可以从寡核苷酸的非连接5’或3’端产生。因此，连接反应中只能加入一条或两条链。可供选择的是，在各步连接反应后，杂交到连接子的序列可以从上面熔解呈单链脱落。链的延长可以通过添加和将寡核苷酸混合物杂交到连接子序列上产生双链区域，并且在末端的单链区域可提供第二个寡核苷酸混合物的杂交位点。反应的方式类似于图2中类型4，6，8，和11所讨论的重复进行，并且生成至少部分区域呈单链的核酸聚合物。因此，本发明方法包括结合连续和同时添加、杂交和连接。对于使用连续、同时或是结合两者的添加方法的选择取决于各种因素的优化，包括但不局限所制备序列的长度、总数和所使用连接酶的类型。

在本发明中，双链复合物及延长的核酸序列包括为有目的使用核酸类似物对合成核酸的性质进行改造的，如稳定性或是核酸合成中添加标签。所知这样的核酸类似物如套锁式核酸(LNA)和硫键核酸作为DNA聚合酶的底物，已用于产生双链复合物，这些物质更具稳定性和抗酶降解。

本发明中稳定剂和/或其他条件可有助于双链和延长的核酸序列的形成(Sarkaret al.2005)。稳定剂包括多聚胺，多聚物如聚乙二醇，金属离子如二价钴、二价镁、二价镍和三价镍等，其他阳离子如多聚赖氨酸、阳离子脂质体、阳离子多聚物、聚乙烯亚胺、铵离子或是这些试剂的组合。据了解，这些化合物的存在能提高核酸链的亲和性。特别对于核酸合成，稳定剂存在可能干扰酶反应，如连接和PCR。这点上，在固相表面进行核酸序列的合成和组装过程中可以使用干扰酶反应的稳定剂，如连接和PCR。因为这些的稳定剂可被洗脱溶液和适宜的反应液所代替。

如图1和图2所示，本发明中图的已知序列寡核苷酸混合物，作为杂交序列的模板可用于连接反应和/或作为连接子连接到捕获探针上，或是杂交、连接序列成更长的序列。寡核苷酸混合物里的成分可以通过传统的合成方法一次一个的合成然后混合起来。但本发明最适合于通过为阵列合成装置产生多种不同序列的寡核苷酸，然后从表面上切割下来，直接产出寡核苷酸混合物。该寡核苷酸混合物可直接在本发明方法中应用，或是选择通过酶反应先扩增这些寡核苷酸。这些寡核苷酸带有用于连接所必需的合适的末端基团(5′-P和/或3′-OH末端基团)。本发明方法准备合成寡核苷酸混合物在支持材料包括可控的多孔玻璃(CPG)，或是聚合物包括聚乙二醇、聚苯乙烯、聚丙烯或这些材料的复合体。支持物材料也包括复合材料，如在固相基质上附有支持膜。制备支持膜的材料包括但不局限于CPG、溶胶、聚乙二醇、聚苯乙烯、聚丙烯或这些材料的复合体。固相基质包括但不局限于玻璃、硅、陶瓷、塑料和金属。固相基质可以加工成板层、圆片、球和板，包含了各种结构特征，如孔、沟、小池和洞，用于液体的输送、储存和其他合适的功能。显然，通过改变或重组上述材料也能作为支持物用于本发明中寡核苷酸或是其混合物的合成。寡核苷酸混合物也可通过采用以下试剂完成平行阵列合成，如光敏保护基团、DMT光产酸敏核苷酸合成单体(phosphoramidites)、电化学产酸、DMT核苷酸合成单体或喷墨打印DMTphosphoramidites(Gao，Gulari，和Zhou2004)。连接的序列有用的特性是存在配对位点(图1C1，1C2；图3，类型6b；图4A，类型5)，在连接序列中该位点序列可以特异或是通用的。例如，这些引物区域可包括启动子和/或通用引物，用于转录和PCR。因此，连接序列可作为RNA合成的模板或是扩增后进行各种应用，如连接序列的灵敏检测或产生DNA文库。在一个芯片合成中与不同配对区一起的用于不同的合成序列用于制备连接序列也采用不同引物区来合成不同的寡核苷酸可以从一次阵列合成中就产生包含不同的分类的寡核苷酸混合物。在杂交和连接反应后，用相应的互补引物对寡核苷酸混合物进行独立的PCR反应。每个PCR反应的结果产生特异的含不同分类的寡核苷酸混合物。可供选择的，含不同分类的寡核苷酸混合物可以带上不同的标签，如特异的核酸序列可用于选择性杂交分离，或是生物素、氨基酸末端，这样就可用不同的亲和结合靶标进行分离。

本发明方法中使用的寡核苷酸混合物可以通过纯化去除部分或所有不纯的寡核苷酸。不纯的寡核苷酸与所设计的序列相比包括一个或多个核苷酸的替换、插入、和/或缺失，也包括部分的断裂短核酸(比全长短的寡核苷酸)。寡核苷酸可通过色谱的方法纯化，如反向柱、离子交换柱或凝胶电泳，或是与固定在表面的另一套互补寡核苷酸混合物杂交(Tian et al.2004，Zhou et al.2004)。纯化的纯度可以通过控制杂交条件来提高特异性杂交来实现。不纯的寡核苷酸形成不稳定的双链复合物，并在随后的洗脱中去除，而纯的寡核苷酸仍留在表面，最后通过水溶液剥离并收集为纯寡核苷酸。在本发明中，为连接作准备的杂交步骤可优化用于寡核苷酸纯化。寡核苷酸纯化也可通过酶反应(Smith和Modrich，1997)和/或配体反应(Gao和Han，2001)。配体是通过选择性识别双链复合物中的特殊结构，如错配碱基、突出部位、环、缺痕或去嘌呤位点。这些试剂可用于协助去除带有不纯的寡核苷酸的序列或连接后的序列。

本发明提供减少杂交和/或连接序列错误的方法。在本发明的较佳实施中，对于在表面进行的杂交和连接后的序列，采用核酸结合蛋白，如MutS和/或MutL来区分并结合到错配的碱基和核酸异常结构上。通过蛋白结合DNA序列从而分离游离的DNA，这些方法是该领域众所周知的技巧。从表面释放出来的杂交和/或连接的序列能进行蛋白结合之前或之后进行。从正确序列中分离去除了错误的序列从而获得用于杂交和/或连接高质量的序列。

本发明合成核酸聚合物的方法包括3’-5’和5’-3’方向。因此，在本发明方法中的捕获探针连接在固相支持物表面，其中离开表面的一端可以是3’或5’端。在本发明较佳实施中，捕获探针序列有一端远离表面可以是5’-磷酸或3’-OH。捕获探针序列的5’-磷酸可与临近的连接子的3’-OH连接，或是捕获探针序列的3’-OH与临近的连接子的5’-磷酸连接。

如图5所示，本发明通过初始连接用于改进连接序列质量的方法。如前方法所述本发明允许所合成的寡核苷酸和随后长的序列可以是3’5’和5’-3’方向。产生的捕获探针序列在离表面的一段可以是3’-OH或5’-磷酸(图1A1和1A2；图5，b和c)。通常，寡核苷酸以3’-5’方向合成，该合成方法产生的错误序列也有正常的3’末端但可能在5’端有断裂或是碱基的替换、缺失或其他错误。因此，如果寡核苷酸探针按传统方法合成带有游离的5’-磷酸，与它连接的连接子的序列就要求有3’-OH末端。这种连接方法导致有正常3’末端与5’端有断裂或是碱基的替换、缺失或其他错误的连接子发生连接反应。可供选择的方法是，捕获探针以5’-3’方向合成并有游离的3’-OH末端，与带有5’-磷酸的连接子序列进行反应。该连接方式能产生多数全长序列，从而生成高质量的连接序列。因此，本发明一个较佳实施中，捕获探针和连接子寡核苷酸混合物按相反的方向合成。更适合的方法是捕获探针按5’-3’方向合成而连接子寡核苷酸混合物按3’-5’方向合成。

本发明方法使用的寡核苷酸混合物可以标记一个或多个检测标签(图2.12和13)。检测标签包括如荧光分子、化学发光分子、有光学特性的微粒子如射线、能量共振转移、双折射和淬灭。本发明有用的标签包括生物素、磁珠、荧光染料、放射性标记物(如³H、¹²⁵I，、³⁵S、¹⁴C和³²p)、酶(辣根酶、碱性磷酸酶和其他ELISA中常用的酶)和比色标记物如胶体金(e.g.金粒子在40-80nm直径范围，能高效发散绿色光)、着色玻璃或塑料珠和其他能引起附属物检测信号的分子，如生物素、核酸寡聚物、多肽、聚合物和金微粒子。首选的标记是荧光组分包括但不局限那些基于荧光素、若丹明、cynine和其他商业上的可得到的产品(Molecular Probe/Invitrogen，CA，USA)。在寡核苷酸上连接检测标签可以存在或不存在连接组分进行直接共价连接，或是通过非共价结合，如杂交。检测标签与寡核苷酸连接位点的改变取决于检测标签的类型和不同连接策略的要求。例如，只要不干扰杂交、检测或连接，检测标签可以连接到核苷、核苷酸或类似物的任何位置。检测标签以及连接位点的选择要满足寡核苷酸能与其他本发明说说的序列进行杂交及连接。在一些情况下，标记的检测标签要在核酸结合另一个通过杂交和/或连接的检测标签前被去除或封闭。信号去除的方法依据所使用的标签分子而不同。对于荧光分子，可能进行光漂白去除信号。在连接位点结合到一个可被切除的连接物也是一个可供选择的方法。然后，每步的杂交和连接反应可被监控。杂交产生的信号可以通过去除杂交序列而得到解除，但在这种的条件下，如图C1对E1，C2对E2；图10C对10F所示，由于生成共价键，连接产生的信号仍然存在。对杂交和连接反应的监控能帮助优化这些反应的效率。

本发明所提供的检测杂交和/或连接序列的方法是通过使用有检测标签序列特异的连接寡核苷酸进行平行连接反应。由于通过选择性完全匹配的杂交和连接反应，该方法提高了检测的特异性。修饰过的寡核苷酸，如包含套锁式核酸能提高Tm值和形成双链的特异性(Vester和Wengel，2004)。恰当选择修饰物参入捕获探针和/或连接子序列能进一步改善杂交和连接的特异性从而能高保真合成长链核酸序列。

本发明方法产生的单链、双链和部分双链连接的核酸能进行各种应用，这些技巧在核酸技术领域也是众所周知。本发明方法所制备的连接序列，可以固定在固相支持物时加以利用或是从表面切除后加以利用。可以通过化学或是酶反应使得连接序列从表面切除。化学或酶反应切除方法依赖于固定在固相支持物表面并连有捕获探针的连接臂或空间臂的类型。选择用于切割释放连接在固相支持物上的序列的连接臂在美国申请20030120035中有说明，并在这结合参考。

本发明方法所制备的连接序列的一个应用例子是用该领域众所周知的方法技巧扩增连接产物，这些方法包括如PCR、滚环扩增(RCA)、或恒温扩增。连接序列上可配对的位点使扩增反应既可以在固相表面进行也可以从表面切割下连接序列后在溶液中进行。扩增反应能有效地提高对连接产物的检测灵敏性，同过在扩增过程中或是之后结合上检测标签。可供选择的是，连接序列可以结合特异的标签，如特异的寡核苷酸序列，它能杂交结合放大的检测信号，如有互补链的聚合物杂交到连接序列特异的寡核苷酸上，或是结合生物素或链酶生物素标记的检测分子。比较常见的是采用多层结合复合物，如生物素-链酶生物素来达到信号的放大。

所描述的合成的DNA序列可广泛的应用于DNA的技术领域。本方法的优势在于能制备任意序列和任意长度的人工DNA。这些DNA片段在基因合成和大片段基因组装方面非常有用(Zhou et al.2004；Tian et al.2004)。这些DNA可以制成理想的长度和序列作为分子尺寸的标尺用于生物学DNA片段的鉴定。

所描述的合成的DNA序列可广泛的应用于RNA和蛋白质的已有技术领域。在一个较佳实施中，连接的DNA序列包括一个转录起始位点，如含一个T7启动子序列。连接的DNA序列可以在表面或是在溶液里作为转录RNA序列的模板各自进行平行或是多重形式转录反应。平行转录反应产生一个RNA序列阵列，可以用于与RNA分子进行反应或是使用商业化试剂盒(Roche和Promega)在表面进行体外蛋白表达。有许多方法用于表达后蛋白/多肽的固定，如核糖体显示(Hanes和Pluckthun(1997))、RecA结合(Odegrip et al.(2004))、和嘌呤霉素mRNA显示(Roberts and Szostak(1997))。通过获得大量连接DNA来固定蛋白和多肽，为制备已知序列的蛋白和多肽微阵列提供有效的手段。

本发明提供的用于制备核酸或蛋白/多肽阵列的方法已经应用到细胞微阵列的制备和研究。合成的核酸或蛋白/多肽与细胞表面的受体特异性地反应能将细胞固定，并且随后这些分子融合到所固定的细胞里使之有机会对细胞进行扫瞄和体内研究。本发明所提供的方法能用于构建抗体文库来进行多重突变研究。

图3A和3B所示为本发明提供的用在表面的探针与目标序列进行杂交和连接的方法。图3A说明了在表面正交合成寡核苷酸探针，表面上同个反应位点有众多不同的被保护的功能基团，如X1和/或X2，这两个是明显不同化学组分的保护基团。去除X1和/或X2将会暴露功能基团，如OH或NH₂使进来的物质如核酸磷酰胺能继续合成到该位点上。X1和X2可以通过不同的反应条件去除。例如，X1可以是DMT基团，可在酸性条件下去除，而X2可以是Fmoc基团，可在碱性条件下去除。在一个较佳实施中，正交保护基团来源于不对称倍增试剂(GlenResearch，Sterling，Va.USA)或是在结合在固相表面的试剂N-.alpha.-Fmoc-N-.epsilon.-tBoc-L-赖氨酸(LC Sciences，Houston，Tex.USA)。在去除第一个保护基团后，用在固相支持物上制备寡核苷酸序列的方法进行合成。在合成过程中X2基团是稳定的，它起初也是被X1保护但随后被去除，然后用在固相支持物上制备寡核苷酸序列的方法进行合成。结果是在同个反应位点合成两个不同的寡核苷酸。

表面可以包含很多保护基团，并适用于不同的去保护方法，从而能够合成多个不同序列的寡核苷酸。表面的连接臂或空间臂不局限于两个分支，也可以在分支聚合物中找到多分支的分子。有用的分支聚合物分子包括三酸磷酰胺(Glen Research，Sterling，Va.USA)。

图3B所示的为本发明方法中以下步骤，在同一个反应位点上使用正交合成的众多寡核苷酸在表面得以配对，并在表面进行和目标序列进行杂交和连接反应(图3a和3b)。成对的序列呈反平行方向，两个末端序列离表面最远，作为可结合特异目标序列的捕获探针。捕获探针作为目标序列的互补链与目标序列杂交形成双链复合物。随后进行连接反应，并通过洗脱使正确杂交和连接的双链复合物保留下来。表面检测目标序列可通过目标序列的标记信号获得。在适用于本发明的一个较佳实施中，标记信号是一个荧光染料组分，信号波长在480-700nm的范围内。在另一个适用于本发明较佳实施中，标记信号来源于一个化学发光器，如辣根过氧化氢酶系统。

如图3B，在同个反应位点的不同序列可通过与目标序列的杂交和连接反应形成一个环结构。在表面连接上的环可作为扩增的模板，如PCR或恒温扩增。本发明一个较佳实施中，至少一个引物标记有检测信号，如在生化和生物核酸和蛋白质分析中广泛应用的荧光染料或化学发光组分。

在同个反应位点成对的探针也能以如图3C所示的方式加以运用，成对的序列以5’末端反响平行并且至少部分呈双链。各种长度的目标序列杂交到表面探针上(图3C，7a和7b是杂交的双链复合物或7c和7d作为杂交链)。成对的探针通过正交的保护基团在活性表面合成。典型情况下，一个表面基团至少用一个依赖于酸保护的基团进行封闭，另一个至少用一个依赖于碱保护的基团进行封闭。合成后，一对寡核苷酸中的一条序列较长，单链的区域特异性地用于与目标序列杂交。然后连接，通过洗脱使与目标序列正确连接产生的双链复合物得以保留下来(图3C，类型8a和8b)。

本发明描述使用杂交和连接过程用自身作为模板的序列。杂交和连接的步骤可以多重进行，但不局限于图4A所描述的。使用自身作模板的捕获探针的一个应用是提供形成单链发夹的连接产物(图4，类型4a和5)。严格的洗脱条件结合连接反应可帮助去除错误的序列提高连接序列的质量。发夹寡核苷酸的一个应用是使用载体表达得小片段的干扰RNA(siRNA)。将合成大量的发夹寡核苷酸克隆到载体上，在体内或体外表达(Paddison et al.2004)。质量提高后的发夹寡核苷酸比直接合成全长的发夹序列能产生更多正确的载体。

本发明提供用于检测样品序列的方法，该方法基于特殊的序列和长度并在多个步骤中结合使用杂交和连接反应(图4A)。在适用于本发明一个较佳实施中，第一批连接反应的序列是样品分子，它通过杂交和连接形成自身为模板的探针(图4A，类型3a和4a)。在适用于本发明一个较佳实施中，目标分子是小RNA分子，特别是生物总RNA里的miRNA分子。第二批在寡核苷酸混合物中的杂交序列专门在与紧接第一个连接区域的位点与模板链互补。在存在专门设计的自身为模板的探针时，从两个连接步骤形成的连接反应产物能正确鉴定第一批连接产物(样品分子)的序列和长度(图4A，类型5)。

图4B所示的本发明较佳实施中，捕获探针包含一个可变区(直线表示)，该可变区与目标序列特异匹配(图4B，1a和1b)，延伸后的寡聚T序列可加入LNA或其他修饰分子而改变杂交双链复合物的Tm值，并且加入的这些修饰的核苷酸紧靠着可变区。首先，样品目标序列与捕获探针杂交后在目标序列上有一段甩出的链；然后，带有或不带标记标签的寡核苷酸部分杂交到目标序列的甩出链上同时在捕获探针链上形成第二个甩出链(图4B，类型4a和4b)。杂交和连接重复进行，用于产生合适的检测标签和在连接序列中导入更多的检测标签从而方便对目标序列的检测。图4B所显示的本发明较佳实施是对miRNA进行检测，它们是序列小于25-mer的小RNA目标序列。通过杂交和连接反应引入检测标签提高了miRNA的检测灵敏性和特异性。

本发明也提供检测有特异末端序列的目标序列(图10和图11)。当捕获探针的连接末端和杂交序列或两个杂交序列的碱基完全匹配(C和G，T和A配对)，连接反应就能有效进行。在本发明较佳实施中，通过设计，捕获探针也能因特异位点形成错配而随后将该序列去除，如SNP位点(图10和图11)。图10和图11显示包含错配的捕获探针在杂交后显示阳性信号，连接后显示阴性信号的序列且未连接的序列会在洗脱中被去除。

如图6所示，本发明提供用于在同个反应位点合成多个序列的方法。通过一种核苷酸或几种核苷酸混合进行合成，在微阵列上的同个反应位点可产生不同的序列。核苷酸混合物包括至少两种类型以上的核苷酸，用它们合成寡核苷酸可生成多种序列。三个核苷酸通常作为一个随机密码子来编码蛋白质或是多肽的序列。总共有61个密码子用于表达20种天然的氨基酸，细菌E.coli有20种偏好的密码子用于进行蛋白质表达(图6.密码子例子)。本发明方法能用于蛋白子序列文库的合成。相关的DNA序列可用替代密码子编写。组数与已知序列的核苷酸混合物相对应。每个替代密码子代表一些编码序列和一些氨基酸残基。每个伪序列代表一定数量的寡核苷酸序列和一些多肽序列。核苷酸混合物组成和替代密码子的组成可以根据所设计和合成的蛋白质序列的要求进行变化。如图6所说明，9个替代密码子代表所有除终止密码子以外的20种天然的氨基酸。选择的5种替代密码子进行合成的DNA序列来编码7种氨基酸，可产生78,125个包括预测替代密码子在内的伪序列，这些伪序列代表了62,748,517个唯一的天然核酸序列，并且根据替代密码子排列将它们分组。该随机化合成方法称为限制随机化(rRAM)。替代密码子的不同设计组合决定了产生在微阵列上合成寡核苷酸混合物序列文库的大小程度。

本发明方法提供rRAM方法用于合成寡核苷酸混合物。合成的寡核苷酸可使用已知的方法(例如，Gao et al.2003)和前面所描述的用于连接制备长序列的方法从表面切除。

本发明通过如图7所列的方法，运用杂交和连接反应将一套寡核苷酸合成为长链DNA。寡核苷酸的数量根据所合成基因的长度决定。捕获探针在所画的序列中用粗线在左边表示。合成的方式可以直接合成全场的基因或是先合成基因的一些片段，然后组装产生全长的基因(图8)。寡核苷酸的长度通常在6-100残基，适宜长度为15-80个残基，25-70个残基更佳。用于组装的双链复合物可直接合成或通过PCR产生，但这需要通过酶切去除不属于基因部分的引物序列。组装长链DNA的序列可包括：

(a)所合成的基因可以是单链或双链。

(b)一套寡核苷酸在设计时有部分重叠双链序列。通过杂交和连接这些序列产生长链DNA序列。

(c)设计两套部分序列重叠的寡核苷酸双链复合物。这些序列的末端钝化或是包含重叠序列。通过杂交和连接这些序列产生长链DNA序列。

(d)一套寡核苷酸在设计时有部分重叠双链序列。通过DNA扩增反应将重叠的双链复合物延长成全长双链复合物。

本发明方法合成的DNA可用于制备蛋白质文库，包含10个以上不同的蛋白质序列和潜在达10¹⁶种不同蛋白质。连接的序列可以从表面连接反应中获得，并直接克隆或是纯化后克隆到表达载体。在扩增的反应里，引物区域可以通过酶切反应从扩增反应产物上去除(Tian et al.2004)。另外，如图8所示可在设计时在引物的切割位点上包含RNA，这样可将引物去除。长链DNA合成可以使用连接的寡核苷酸和包含RNA的引物。DNA连接如图8所示并不局限于两个，多个连接片段DNA或有合适序列的DNA双链复合物可用于产生长链DNA，通过单链或双链复合物中有连接序列和在切除位点含有RNA的引物进行扩增反应；使用RNase酶切除结合的RNA；使用单链DNA酶消化由切除引物所产生的甩出的尾部序列；进行重叠PCR制备长链DNA。另外，可以通过设计限制酶切位点在扩增反应后用来去除引物序列(图8a)。然后进行重叠PCR获得长链DNA。

本发明提供从大量寡核苷酸序列中产生含分类的寡核苷酸混合物的方法。分类的核酸序列中含有特有的引物区域。如图8a所示是扩增反应或是PCR反应，为所设计的分类的序列提供特异的引物分别进行单独反应是该领域众所周知的技巧。

本发明方法包括寡核苷酸在表面独立空间进行合成、杂交、和连接反应。本发明包括在表面平行进行的连接反应，反应位点的密度至少是每平方毫米9个位点到大约2的10到11次方个位点每平方毫米。在适用于本发明一个较佳实施中，反应在三维的微流体装置中进行，该装置结构特征如图9所示(Zhou和Gulari，USP Application20030118486；Zhou et al.2004)。图9是一个含有体积为皮升级反应小室的微芯片示意图，该芯片用于寡核苷酸和反应产物的平行合成、杂交、连接和其他酶反应。微芯片的双层结构由硅和玻璃熔合组成，硅片上的反应微室通过蚀刻产生并平行排列，溶液分配的入口和出口小道与反应微室连接。在选择的位点进行数控光射，使光产酸控制的发生在光照射的反应微室。随后的杂交、连接和其他反应在同个表面进行。另外，寡核苷酸合成切除后产生的寡核苷酸混合物可应用于另一个含捕获探针的微芯片。如图9本发明提供一个微芯片物理三维的说明，用于描述合成、杂交、连接和其他酶反应。

本发明也因采用三维微流体芯片技术使得制备长链核酸变得经济有效。该微流体微芯片装置和合成方法在美国专利号为No.20020012616，No.20030118486和No.6,426,184中有描述，这些应被结合参考。长核酸序列，尤其是长DNA序列，如图1，2，3C，4-8所示被合成。然而，用于制备长DNA序列的表面和表面所固定的捕获探针并不局限于这里所描述产生和合成的方法，捕获探针也可以通过点样预先合成的寡核苷酸获得。长DNA合成时可以设计包含合成RNA的启动子位点，如T4和T7启动子序列，并且保留于表面而作为已知序列的模板链在独立反应位点中用于RNA合成。这些固定在表面的长DNA序列可在体外转录条件下制备RNA序列或是在体外翻译条件下用于蛋白质体外合成。这些试剂盒可通过各种商业途径获得。微流体微芯片的独立反应位点可缩微化成微升滴定板、纳升滴定板、皮升滴定板和托升滴定板，然后可以通过图12所示的固定策略建立蛋白质微阵列。在这里，通过制备融合蛋白和抗原决定簇标签、嘌呤霉素和融合蛋白中的RNA固定蛋白质到表面。这些蛋白质固定的方法是该领域众所周知的技巧。本发明提供的方法用于高通量平行制备蛋白质和蛋白微阵列。通过优化各种在表面的媒介条件使蛋白在芯片上表达，这些因素包括温度、蛋白表达时间和一些其他因素。

本发明方法用于经济有效地制备长链DNA，该方法图解如图2所示。在本发明一个较佳实施包括，第一步在有众多反应位点的固相支持物表面合成捕获探针(图2，类型1)。与捕获探针部分互补的目标寡核苷酸添加到表面，并在特异杂交条件下与捕获探针杂交(图2，类型2)。一个连接子寡核苷酸混合物添加到捕获探针和目标寡核苷酸中，并且连接子与目标寡核苷酸部分互补。双链复合物形成后有一个缺刻位点并且连接子寡核苷酸有一段甩出的单链序列区域(图2，类型3)。捕获探针和连接子的各自一端在适宜的条件下通过连接酶连接。如图2所示，添加另一个目标寡核苷酸或连接子的步骤中，连接子与连接序列单链区域的杂交(图2，类型5和9)，连接子与连接序列的连接产生长DNA双链复合物(图2，类型6和8)。如图2所说明，用单链或双链寡核苷酸组装长链DNA序列另外的方法是可能存在的。如图8所示这些连接产物能用于扩增和融合PCR来产生全长的基因序列。

如图13所描述，本发明也包括靠测试长度来逐步监控在芯片上的DNA组装。寡核苷酸通过一个叫捕获-寡核苷酸的3’-配对区连接到芯片表面，用于杂交和连接的寡核苷酸叫连接-寡核苷酸。所有的序列使用同个监控序列，也就是一个5’-cy3标记的检测-寡核苷酸，它是通过常规的CPG单独制备的。连接-寡核苷酸长大约41个核苷酸，图13所示仅是代表性的的寡核苷酸的数量，并且从一种序列变化到另一种序列。

逐步反应(第一步2个片段组装，第二步3个片段组装(图.13))包含增加长度的杂交和连接，并在例2所描述的条件下有20-40％的产物。通过优化影响这些反应的因素如DNA拓扑、寡核苷酸浓度、温度和pH可提高产量。详细地说，促使DNA浓缩的化合物包括在杂交和连接中使用的缓冲液，可能会显著地增加产物量。促使浓缩的化合物包括但不局限于如多聚赖氨酸、聚乙二醇(PEG)、聚乙烯亚胺(PEI)、阳离子化合物、DNA结合试剂和螯合剂。另外，单独或联合使用促使去浓缩的试剂或影响DNA拓扑结构的试剂可能也会有效提高产物量。捕获芯片的微流体性质更加有利于添加和清洗促使浓缩和稀释的化合物，从而获得最佳产量。

上述提到的所有发表文献与专利在参考文献清单中。所描述方法的各种修改和变化将是明显来至于这些已知技术，但这并没有脱离本发明的范围和精神。尽管本发明结合描述了具体适用的实例，但应该理解本发明权利要求并不限制于这些示例。实际上，各种对执行本发明描述方式的修改在分子生物学、遗传学、化学或相关领域的这些技巧是清楚的，并将在这些范围内要求下述权利。

实施例

下述包括的例子是本发明的具体阐明。在这些例子中所揭示的技术在该领域应当更有价值。发明者所揭示的这些代表性技术在本发明实践中起到非常好的作用。然而，该领域的这些技巧依照本发明所揭示的可以在特殊的实例中做许多变化来提升价值。这些所揭示和获得的同样或类似的结果没有背离本发明的范围和精神。

材料

DNA寡核苷酸微流体芯片如我们所发表描述的方法进合成(Zhou et al.NucleicAcids Res.32，5409-5417(2004))。限制酶MlyI、BbsI、BsaI，VentR.RTM.DNA聚合酶、Taq DNA连接酶和T4DNA连接酶从New England Biolabs购买。用于测序的TOPO TA Cloning.^TM.Kit包括pCR4-TOPO载体和Oneshot.^TMTOP10化学敏态的E.Coli细胞是从Invitrogen购买。用于EGFP基因(gi:7638256，712nts)的CPG寡核苷酸从Integrated DNA Technologies购买。QIAquick去除核苷酸试剂盒、PCR产物纯化试剂盒、胶回收试剂盒和QIAprep Spin Miniprep试剂盒从QIAGEN Inc购买。

实施例1、表面连接反应

如图10所示，阐明了在表面连接反应的结果，模板链在CPG上合成，连接子使用微芯片合成(Zhou et al.2004)。实验所使用的目标序列(SEQ ID#4180-#4183)来源于胆囊纤维跨膜调节(CFTR)基因。4个81-mer目标DNA序列通过PCR扩增，DNA产物用芯片合成的寡核苷酸制备。SEQ ID#4180是野生型CFTR在1069-1089位置基因部分序列。SEQ ID#4181是野生型CFTR基因在1650位点C突变成G的序列。SEQ ID#4182是野生型CFTR基因在1655位点C突变成G的序列。SEQ ID#4183是CFTR基因在1652和1654位点的一个错配和缺失突变序列。如图图11所示，通过合成34个长度是35-mer和25-mer的捕获探针来检测突变。这些探针在5’-位置加入A、C、G和T组合，15-mer的连接子在捕获探针3’-这边与目标序列互补。目标序列与捕获探针在芯片上杂交通过一个微流蠕动泵循环100μL样品溶液进行。杂交缓冲液由含25％甲酰胺的6倍SSPE缓冲液(用于杂交)或含25％甲酰胺的1倍SSPE(用于杂交后洗脱)组成。芯片的温度通过一个加热/冷却板调节到32℃控制。杂交图片通过激光扫描仪(GenePix4.0，Axon)采集(图10A和10D)。连接反应在45℃反应4小时，使用45μL的溶液(20mM Tris-HC1(pH7.6)，25mM醋酸钾，10mM醋酸镁，10mM DTT，1mM NAD，0.1％Triton X-100，15％PEG-8000，10％DMSO)和20U的Taq DNA连接酶。连接反应进行4小时或更长时间，然后表面用含25％甲酰胺的1倍SSPE洗脱，然后采集连接反应的芯片图片(图10B和10E)。最后，表面用水在50℃洗脱然后采集图片(图10最后一列图片)。

表面连接反应包括：1.杂交cy5标记的PCR产物(SEQ ID#4180)；2.将连接子序列与根据图11所设计的捕获探针连接并进行严谨洗涤；3.从表面切除杂交序列。该面板包含18个35-mer的捕获探针(信号可见)和18个25-mer探针(信号太弱而不可见)。第一和三列捕获探针能检测SEQ ID#4180序列。相应的线谱从每张图片的第一列开始。最强的信号来自完全匹配(PM)的序列。临近面板E的边栏是用于说明在连接位置的碱基对。顶部的面板显示与目标序列杂交后cy5的信号，而底部面板显示连接子序列cy3的信号。这些结果显示了成功杂交的目标序列；杂交的阴性对照；区分完全匹配和错配(PM/MM)的连接信号。在这两个面板的最后一列中，杂交和连接的信号用于确认表面连接的特异性。25-mer完全匹配捕获探针的连接信号用星号标记。比起杂交完全匹配和错配的区分大大改善了(右边下面两个面板)。在面板A、B和E的中间列上也有信号，但这些信号没有在F面板中出现进一步确认了表面连接的特异性，并且特异性从杂交结果中有改善。

实施例2、设计寡核苷酸用于长链DNA合成

所有在这个实施例中的序列列于表1。一个1kb长的DNA(SEQ ID#90)分成4个268bps的片段(SEQ ID#90-1到#90-4)，并且第一个片段3’端与第二个片段的5’端重叠(SEQ ID#90-3)等等。对每个268bps的片段分成2套寡核苷酸。一套寡核苷酸包含SEQ ID#90-1-F1到#90-1-F5(图13)，SEQ ID#90-2-F1到#90-2-F5，#90-3-F1到#90-3-F5和#90-4-F1到#90-4-F5；另一套包含SEQ ID#90-1-H1到#90-1-H5，#90-2-H1到#90-2-H5，#90-3-H1到#90-3-H5和#90-4-H1到#90-4-H5。两套寡核苷酸来自1kb长的DNA(SEQ ID#90)的同个链。这些寡核苷酸的长度如SEQ ID#90-1-F1与SEQ ID#90-1-H1一半重叠，SEQ ID#90-1-H2与SEQ ID#90-1-F1一半重叠以及SEQ ID#90-1-F2等等。1kb长的DNA(SEQ ID#90-C)的互补链也分成4个268bps的片段(SEQ ID#90-C1到#90-C4)。每个268bps的片段按上述方法分成2套，包含SEQ ID#90-1-FC1到#90-1-FC5，SEQ ID#90-2-FC1到#90-2-FC5，#90-3-FC1到#90-3-FC5和#90-4-FC1到#90-4-FC5；令一套包含SEQ ID#90-1-HC1到#90-1-HC5，#90-2-HC1到#90-2-HC5，#90-3-HC1到#90-3-HC5和#90-4-HC1到#90-4-HC5。

对寡核苷酸的考虑因素包括PCR效率、杂交亲和性和每个寡核苷酸的均匀分布性。

实施例3、EGFP寡核苷酸作为组装对照

EGFP寡核苷酸#96-A10到#96-A13是#96-S10到#96-S13的各自的互补序列(图14)。这些寡核苷酸的排列如SEQ ID#96-A10与SEQ ID#96-S10和#96-S11一半重叠，SEQ ID#96-A11与SEQ ID#96-S11和SEQ ID#96-S12一半重叠等等(图14A)。SEQ ID#96-S10的5’端用荧光染料cy3标记。

实施例4、在溶液相组装寡核苷酸

SEQID#90-P1-1F(5′-CACAGGAGTCCTCAC)和SEQID#90-P1-2R(5′-CTAGCGACTCCTTGG)包含了限制性内切酶位点，MlyI(5′-GAGTC(N5)/-3′-CTCAG(N5))N是A，C，G，或T，酶切位点加到实施例2中描述的268bps片段(SEQ ID#90-1，#90-2，#90-3，和#90-4)(表1)的寡核苷酸的5’-和3’-末端，这些寡核苷酸是在所描述的DNA芯片上合成的(Zhou et al.Nucleic Acids Res.32，5409-5417(2004))。合成的寡核苷酸用浓氨水在55℃下保持18小时后从芯片上切除。从溶液中蒸发氨水，切割下来的核苷酸用80％的乙醇水溶液沉淀，最后沉淀用25μL的水重新溶解。寡核苷酸用聚合酶链式反应扩增(PCR)，25μL的反应体系包括：1μL从芯片上切除的寡核苷酸，1μL引物(SEQ ID#90-P1-1F和SEQ ID#90-P1-2F)，1U ventDNA聚合酶，200μM dNTPs和一倍ThermoPol Reaction缓冲液。反应用以下程序进行：94℃5min，94℃30sec，60℃40sec，72℃2min进行25个循环，最后72℃反应2min，4℃保存。PCR产物用10U M1yI限制酶，0.5mg/mL牛血清白蛋白和1倍NEB buffer4处理，在37℃反应3小时。最后的反应溶液按试剂盒说明经过QIAquick核苷酸去除柱，并收集寡核苷酸。这些寡核苷酸在退火和连接后用于组装长链寡核苷酸，它们称作连接子。

实施例5、在固相表面组装寡核苷酸

SEQ ID#90-P1-1F(5′-CACAGGAGTCCTCAC)和SEQ ID#90-P1-2R(5′-CTAGCGACTCCTTGG)包含了限制性内切酶位点，MlyI(5′-GAGTC(N5)/-3′-CTCAG(N5))N是A，C，G，或T酶切位点加到实施例2中描述的268bps片段(SEQ ID#90-1，#90-2，#90-3，和#90-4)(表1)的寡核苷酸的5’-和3’-末端，除了那些多数3’-末端。这些寡核苷酸通过实施例4所描述的制备。

实施例6、产生ssDNA连接子用于固相表面组装

表1所列的2条268bps片段(SEQ ID#90-1，#90-2，#90-3，和#90-4)各自的寡核苷酸如所描述的方法在DNA微芯片上合成(Zhou，2004)，除了在这些片段(SE ID#90-1-F1到#90-1-F4，SEQ ID#90-2-F1到#90-2-F4，#90-3-F1到#90-3-F4，#90-4-F1到#90-4-F4，SEQ ID#90-1-H2到#90-1-H5，#90-2-H2到#90-2-H5，#90-3-H2到#90-3-H5和#90-4-H2到#90-4-H5；SEQ ID#90-1-FC1到#90-1-FC4，SEQ ID#90-2-FC1到#90-2-FC4，#90-3-FC1到#90-3-FC4，#90-4-FC1到#90-4-FC4，SEQ ID#90-1-HC2到#90-1-HC5，#90-2-HC2到#90-2-HC5，#90-3-HC2到#90-3-HC5和#90-4-HC2到#90-4-HC5)3’端的寡核苷酸。合成的寡核苷酸用浓氨水在55℃下保持18小时后从芯片上切除。从溶液中蒸发氨水后，切除的关核苷酸用80％的乙醇水溶液沉淀，最后沉淀用50μL的水重新溶解。

实施例7、在固相表面合成捕获探针

在268bps DNA片段的寡核苷酸里将SEQ ID#90-P2-1R加到寡核苷酸(SEQ ID#90-1-F5，#90-2-F5，#90-3-F4，#90-4-F5，#90-1-H5，#90-2-H5，#90-3-H5和#90-4-H5)里，SEQ ID#90-P2-2F加到寡核苷酸(SEQ ID#90-1-HC1，#90-2-HC1，#90-3-HC1和#90-4-HC1，#90-1-FC1，#90-2-FC1，#90-3-FC1，#90-4-FC1)里。这些寡核苷酸在DNA芯片上合成，并且使用磷酸化试剂将5’-OH磷酸化(Zhou，2004)。这个芯片称作捕获芯片，在上面包含的寡核苷酸称作捕获探针。芯片的品质通过所建立的程序包括将荧光标记的寡核苷酸与探针杂交来监控。用激光扫描仪采集芯片表面的图像和荧光信号来分析作为芯片合成质量评价标准。

实施例8、在固相表面组装多个DNA片段

实施例5和6所描述的连接子混合物溶于200μL杂交液(6倍SSPE，25％甲酰胺，0.2％牛血清白蛋白，pH6.5)中，将其用微型蠕动泵添加到捕获芯片上，在30℃下溶液循环12小时。然后用严格的洗脱液(1倍SSPE，25％甲酰胺，0.2％牛血清白蛋白，pH6.5)代替杂交溶液洗脱10min。随后，将150μL包含0.4mg/mL牛血清白蛋白(NEB)的1倍T4DNA连接缓冲液添加到芯片里。连接反应使用150μL T4DNA连接缓冲液(400U T4连接酶，，1倍T4连接缓冲液)在16℃反应过夜。最后用500μL溶液(1倍SSPE，25％甲酰胺，0.2％牛血清白蛋白，pH6.5)清洗芯片反应表面。

通过采集一张芯片的图像来监控杂交退火和连接。Cy3标记的寡核苷酸溶于150μL杂交溶液中，然后添加到芯片并与在30℃下杂交12小时。芯片在50℃下用水清洗，并通过激光扫描仪采集图像。图14B是一张代表性的图片。

实施例9、溶液中多个DNA片段组装

实施例3和4所描述的将加有一个连接子混合物和包含了40U Taq DNA连接酶的Taq DNA连接缓冲溶液(NEC)的小管置于热循环仪中(MJ Research)。循环的温度程序是：94℃5min，然后72℃60sec，45℃5min进行40循环，最后4℃保存。

实施例10、扩增组装的DNA片段

实施例8所描述的在固相表面组装的DNA片段通过浓氨水在55℃切除18小时。在将氨水蒸发后，切除下的寡核苷酸用80％的乙醇水溶液沉淀，最后沉淀用50μL的水重新溶解。

实施例9所描述的组装后的DNA片段在水溶液中。

第二对包含BbsI限制性酶切位点的引物(SEQ ID#90-P1-1F和#90-P2-1F)用于PCR(1U vent DNA聚合酶，200μM dNTPs，1倍ThermoPol Reaction缓冲液(NEB))扩增组装好的DNA片段。反应使用的程序为：94℃5min，然后94℃30sec，50-60℃梯度温度40sec，72℃2min，进行25个循环，最后72℃反应7min并在4℃保存。PCR产物用QIAquick PCR纯化试剂盒根据说明书进行纯化。图15显示了通过在芯片上合成的寡核苷酸组装了EGFP DNA片段(200bps)。

实施例11、1kb长链DNA(SEQ ID#90)合成

如SEQ ID#90-1到#90-4的268bps DNA片段用10U BbsI(NEB)在1倍NEB缓冲液2中处理。反应在37℃条件下进行3小时，然后用QIAquick核苷酸去除试剂盒根据说明书纯化。

4个DNA片段混合物加到一个50μL PCR扩增反应溶液中，包含有BsaI酶切位点(SEQ ID#90-P3-1F和SEQ ID#90-P3-1F)的扩增1kb长链DNA的5′-和3′-引物、1U vent DNA聚合酶、200.mu.M dNTP和1倍ThermoPol缓冲液。扩增反应的使用程序是：94℃5min，然后94℃30sec，56℃40sec，72℃2min进行25个循环，最后4℃保存。正确大小的1kb PCR产物通过1％的凝胶电泳分析，并且通过QIAquick胶回收试剂盒获得该片段。

实施例12、克隆测序组装的DNA序列

对组装的DNA序列进行PCR(图16)、克隆和测序。载体上的插入片段进一步用PCR和限制性酶切鉴定(图16)。

Claims

1.一种在固相表面上同时制备2到4个相同双链核酸聚合物的方法，该方法包括：

(a)在固相表面上放置2到4个不同的捕获探针，该捕获探针选自于双链聚合物的3’和/或5’端寡核苷酸；

(b)将包含4个或更多寡核苷酸的混合物添加于固相表面；

(c)使寡核苷酸混合物与捕获探针杂交，由此在固相表面不同位点上形成2到4个包含缺刻和缺口的杂交双链复合物；

(d)杂交双链复合物；

(e)通过连接和/或延伸加连接的方法使杂交双链复合物上各条链上的缺刻和缺口位点连接，以在固相表面的不同位点制备2到4个相同的双链复合物。

2.根据权利要求1所述的方法，其中合成的双链复合物长度至少为100bp。

3.一种在固相表面上同时制备多个核酸双链聚合物的方法，其中每个不同双链聚合物的序列被合成至少2次于表面不同位点，该方法包括：

(a)在固相表面上对于每个不同的双链聚合物放置至少2个不同的捕获探针，该捕获探针选自于双链聚合物的3’和/或5’端寡核苷酸；

(b)将包含4个或更多寡核苷酸的混合物施加于固相表面；

(c)使寡核苷酸混合物与捕获探针杂交，由此在固相表面不同位点形成至少2个包含缺刻和/或缺口的杂交双链复合物用于每个不同的双链聚合物；

(d)通过连接和/或延伸加连接的方法衔接杂交双链复合物上各条链上的缺刻和缺口从而对每个不同的双链聚合物制备2个或2个以上相同的双链复合物。

4.根据权利要求3所述的方法，其中双链聚合物包含用于自身复制及扩增的3’和5’引物区。

5.根据权利要求3所述的方法，其中双链聚合物包含用于将自身转录成RNA的启动子区。

6.根据权利要求3所述的方法，其中双链聚合物是用于蛋白质翻译编码序列。

7.根据权利要求3所述的方法，其中双链聚合物包含一个或多个siRNA或miRNA序列。

8.根据权利要求7所述的方法，其中双链聚合物包含用于克隆的3’和5’粘性末端。

9.根据权利要求3所述的方法，其中双链聚合物包含用于克隆的3’和5’粘性末端。

10.根据权利要求4-6任一项所述的方法，其中双链复合物的复制、扩增、转录和/或翻译都是在双链复合物合成的位点上进行。

11.根据权利要求10所述的方法，其中在反应位点可以有DNA聚合酶、RNA聚合酶、蛋白合成酶和反应媒介。

12.根据权利要求10所述的方法，其中在固相表面的不同位点进行制备DNA。

13.根据权利要求10所述的方法，其中在固相表面的不同位点进行制备RNA。

14.根据权利要求10所述的方法，其中在固相表面的不同位点进行制备蛋白质。

15.根据权利要求3所述的方法，其中在寡核苷酸混合物序列和/或捕获探针中包含替代密码子。

16.根据权利要求10所述的方法，该方法用于制备DNA文库。

17.根据权利要求15所述的方法，该方法用于制备DNA文库。

18.根据权利要求10所述的方法，该方法用于制备RNA文库。

19.根据权利要求15所述的方法，该方法用于制备RNA文库。

20.根据权利要求10所述的方法，该方法用于制备多肽文库。

21.根据权利要求15所述的方法，该方法用于制备多肽文库。

22.根据权利要求3所述的方法，其中通过平行反应合成寡核苷酸混合物。

23.根据权利要求3所述的方法，其中通过平行反应制备包含修饰基团的寡核苷酸混合物。

24.根据权利要求3所述的方法，其中合成长度至少为100bp的双链聚合物。

25.一种制备包含替代密码子序列的寡核苷酸混合物的方法，该方法包括：

(a)将设计好的替代密码子整合到寡核苷酸的预定位点中；

(b)平行合成长度一致或不一致的寡核苷酸；

(c)根据设计在固相表面的不同位点平行合成寡核苷酸和包含替代密码子的寡核苷酸；

(d)在一个位点制备一个或多个所设计的寡核苷酸；

(e)在固相表面切除全部或部分的寡核苷酸从而制备成寡核苷酸文库。

26.根据权利要求25所述的方法，其中寡核苷酸文库所包含长度为至少6个碱基的寡核苷酸。

27.在固相表面的子区域上同时制备多个核酸双链聚合物的方法，其中每个不同双链聚合物的序列被合成至少2次于表面不同位点，该方法包括：

(b)将包含4个或更多寡核苷酸的混合物施加于固相表面；

(c)使寡核苷酸混合物与捕获探针杂交，由此在固相表面不同位点形成至少2个包含缺刻和缺口的杂交双链复合物用于每个不同的双链聚合物；

(d)杂交双链复合物；

(e)重复(b)到(e)的步骤直到能产生所需要数量的双链聚合物；

(f)通过连接和/或延伸加连接的方法使杂交双链复合物上各条链上的缺刻和缺口位点连接，在固相表面的不同位点制备2个相同的双链复合物用于每个不同的双链聚合物。