用于产量增加的方法中的重组体微生物
分案说明
本申请为申请号为201480010133.5,申请日为2014年2月21日,发明名称为“用于产量增加的方法中的重组体微生物”的专利申请的分案申请。
技术领域
本发明涉及能够产生所需发酵产物、在微生物中功能性表达异源肽的重组体微生物、和其中利用所述微生物的产生发酵产物的方法。在一种优选的实施方式中,所述微生物为酵母。本发明进一步涉及CO2在微生物中的应用。
背景技术
微生物发酵工艺被应用于广泛且迅速扩展范围的来自可回收利用的碳水化合物进料的化合物的工业生产中。
尤其是在厌氧发酵过程中,辅因子组NADH/NAD+的氧化还原平衡能够引起对产量的重要限制。这一挑战的例证是在例如通过酿酒酵母(Saccharomyces cerevisiae)生产颜料乙醇的工业生产中作为主要副产物形成的甘油,其是需要再氧化在生物合成反应中形成的NADH的直接后果。
通过酿酒酵母生产乙醇目前是工业生物技术中的(以体积计)单次最大发酵工艺,而其他化合物(包括其他醇类、羧酸、类异戊二烯、氨基酸等)目前是以工业生物技术工艺生产的。
已经提出了多种方法通过基因修饰来改善工业生物技术中生物体的发酵性质。
WO 2008/028019涉及利用具有至少一个异源的基因序列的微生物来形成发酵产物的方法,该方法包括使至少一种碳水化合物转化为3-磷酸甘油酯以及固定二氧化碳的步骤,其中所述步骤中的至少之一是由至少一种外源酶催化的。此外,其还涉及用于通过至少一种糖的发酵来形成发酵产物的微生物,该微生物包含编码选自由磷酸戊糖表异构酶、磷酸核酮糖激酶和核酮糖二磷酸羧化酶组成的组中的至少一种酶的至少一个异源基因序列。
在一个实例中提到了其中结合了异源PRK和异源Rubisco基因的酵母。在一种实施方式中,酵母被用于乙醇生产。结果(图24)示出了转基因对照和经修饰菌株的浓度。在经修饰的酵母和其相应对照物之间几乎没有可注意到的差异。没有关于产物产量,糖转化,酵母生长、乙醇的蒸发速率的明显信息。因此,显然结果并不能得出关于乙醇产量得到改善的结论。
此外,WO 2008/028019中没有提到甘油副产物形成的问题。
关于基于酵母生产乙醇以及其他化合物的化学计量的主要挑战在于,NADH-依赖性副产品(尤其是甘油)的实际量通常作为副产物形成,尤其是在厌氧和氧受限条件下或在呼吸作用受到抑制或不存的条件下。已经估计在常规的工业遗传工艺中,高达约4wt.%的糖进料被转化为甘油(Nissen等人,Yeast 16(2000)463-474)。在对于厌氧生长是理想的条件下,向甘油的转化甚至会更高,高达约10%。
在厌氧条件下生产甘油主要与氧化还原代谢有关。在酿酒酵母的厌氧生长过程中,糖异化作用经由酒精发酵而发生。在该过程中,在糖酵解的3-磷酸甘油醛脱氢酶反应中形成的NADH通过NAD+-依赖性醇脱氢酶将丙酮酸酯脱羧形成的乙醛再氧化为乙醇。当代谢的其他地方发生NAD+向NADH的净还原时,这种中性条件下氧化还原的异化途径(redox-neutral dissimilatory pathway)的固定的化学计量导致一些问题。在厌氧条件下,酿酒酵母中的NADH再次氧化严格依赖于糖还原为甘油。甘油形成是通过糖酵解中间体磷酸二羟丙酮(DHAP)还原为甘油3-磷酸(甘油-3P)开始的,这个反应由NAD+-依赖性甘油3-磷酸脱氢酶催化。随后,通过甘油-3-磷酸酶来水解在该反应中形成的甘油3-磷酸以产生甘油和无机磷酸盐。因此,在通过酿酒酵母厌氧生产乙醇的过程中甘油是主要的副产物,其是不希望的因为其降低了糖向乙醇的总体转化。此外,乙醇生产车间的废水中甘油的存在会增加废水处理的成本。
在WO 2011/010923中,通过提供包含编码NAD+-依赖性乙酰化乙醛脱氢酶(EC1.2.1.10)活性的一种或多种重组体核酸序列的重组酵母细胞在由含碳水化合物进料(尤其是来自木质纤维素生物质的碳水化合物进料)生产乙醇的过重形成NADH-相关的副产物(甘油)的甘油副产品问题,所述细胞缺少NADH-依赖性甘油合成所需的酶活或者相比于野生型酵母细胞该细胞在NADH-依赖性甘油合成方面具有降低的酶活性。细胞被描述为在实质上降低甘油生产方面是有效的。而且,该细胞使用乙酸盐以再氧化NADH,从而在使用含乙酸盐进料时能够增加乙醇产量。
尽管WO 2011/010923中描述的方法是有利的,但对于其变型仍存在持续的需要,尤其是也能够生产有用的有机化合物(例如乙醇)而不需要乙酸盐或其他有机电子接受体分子以消除或至少降低NADH-依赖性副产物合成的变型。尤其是合乎需要的是提供一种微生物,其中减少了NADH-依赖性副产物合成并且能够增加产物产量并且不存在乙酸盐。
发明内容
发明人认识到利用二氧化碳作为底物通过在异养、化养微生物细胞,尤其是酵母细胞中功能性表达重组体酶来减少或者甚至消除NADH-依赖性副产物合成是可能的。
因此,本发明涉及二氧化碳作为电子接受体在重组体化异养微生物,尤其是真核微生物中的应用。化养、(化)异养和自养和其他分类的微生物在本文中涉及重组前的微生物,该生物体在本文中也被称为宿主。例如,因为本文中所披露的应用使得重组的生物体可以同化二氧化碳从而导致(部分)(化)自养作用,因此通过如本文中所披露的重组原来为(化)异养和非自养的宿主微生物在重组之后可变成自养的。
有利的是,发明人已经发现了合并二氧化碳在异养生物微生物的代谢工程中作为辅助底物以用于改善产物产率和/或减少副产物形成的方式。
尤其是,发明人发现,通过功能性表达来自真核微生物(尤其是酵母细胞)的两个特定组的中至少两种重组体酶来减少或甚至消除NADH-依赖性副产物合成是可能的,其中的一种酶对话其中利用二氧化碳的反应而另一种酶利用ATP作为辅因子。
因此,本发明进一步涉及重组体,尤其是转基因真核微生物,尤其是酵母细胞,所述微生物功能性表达一种或多种重组体,尤其是编码1,5-二磷酸核酮糖羧化酶加氧酶(Rubisco)和磷酸核酮糖激酶(PRK)的异源核酸序列。
已经发现根据本发明的微生物尤其具有优势,因为在Rubisco和PRK的存在下,NADH-依赖性副产物形成(甘油)显著减少或基本上被完全消除并且期望产物的生产增加。这被认为是二氧化碳起到了NADH的电子接受体的作用,从而少量的NADH可用于朝向生成副产物(例如甘油)的反应。
本发明进一步涉及用于制备有机化合物的方法,尤其是醇、有机酸或氨基酸,该方法包括利用微生物使碳源,尤其是碳水化合物或另外的有机碳源转化形成有机化合物,其中该微生物是根据本发明的微生物或其中在重组体化养或化异养微生物中二氧化碳被用作电子接受体。
本发明进一步涉及用于在酵母细胞中功能性表达异源多肽的载体,其中所述载体包含编码Rubisco和PRK的异源核酸序列,其中所述Rubisco表现出固碳活性,除非另外具体提及,在本文中使用的术语”一个”或”一种”被定义为”至少一个/一种”。
附图说明
图1为根据实施例5检测的1,5-二磷酸核酮糖羧化酶(Rubisco)活性结果。
具体实施方式
当提到单数形式的名词(例如,化合物、添加剂等)时,意味着复数形式也包括在内。因此,除非另外具体提及,当提到具体的部分时,例如”化合物”,其意指该部分的”至少一个/一种”,例如”至少一种化合物”。
如在本文中使用的术语”或”应被理解为”和/或”。
当提到存在若干异构体(例如D和L对映异构体)的化合物时,原则上该化合物包括可用于本发明的特定方法中的该化合物的所有对映异构体、非对映异构体和顺/反异构体,尤其是当提到例如化合物时,其包括(一种或多种)天然异构体。
出于清楚和简要描述的目的,本文中作为相同或单独实施方式的部分来描述特征,然而,优选本发明的范围可以包括具有所有或一些所述特征的组合的实施方式。在本文中,对于本领域技术人员而言,如所提交的权利要求1的变体可与所提交的申请中描述的其他特征进行组合,尤其是与从属权利要求中的特征进行组合,例如那些通常涉及本发明的最优选实施方式的权利要求。
本文中使用的术语“发酵”“、“发酵的”等具有经典的含义,即,其表示在厌氧条件下或已经在厌氧条件下进行的工艺。厌氧条件在本文中被定义为不具有任何氧的条件或在该条件下酵母细胞(尤其是酵母细胞)基本上不消耗氧,并且通常对应于耗氧量小于5mmol/l.h,尤其是对应于耗氧量小于2.5mmol/l.h,或更低于1mmol/l.h。更优选地,消耗0mmol/L/h(即,耗氧量不可检出)。这通常对应于培养物肉汤中的溶解氧浓度小于空气饱和的5%,尤其是溶解氧浓度小于空气饱和的1%,或更低于空气饱和的0.2%。
术语“酵母”或”酵母细胞”是指系统发生差异较大的一组单细胞真菌,其中的大多数为子囊菌门(Ascomycota)和担子菌亚门(Basidiomycota)的分支。芽酵母(“真酵母(trueyeasts)”)被分在酵母菌目(Saccharomycetales),其中酿酒酵母是最为熟知的物种。
如本文中使用术语“重组体(细胞)”或”重组体微生物”是指含有作为利用重组体DNA技术和/或另外的突变技术的一种或多种基因修饰的结果的核酸的菌株(细胞)。尤其是重组体细胞可以包含相应的野生型细胞中不存在的核酸,该已利用重组体DNA技术(转基因细胞)将该核酸被引入到菌株(细胞)中,或所述野生型中不存在的核酸是所述野生型(例如编码野生型多肽的基因)存在的核酸序列的一种或多种突变的结果(例如利用重组体DNA技术和/或另外的突变技术),或其中基因的核酸序列已被修饰为使该多肽产物(编码其)靶向于另外的细胞腔隙。此外,术语“重组体(细胞)”尤其涉及已利用重组体DNA技术将来自其的DNA序列除去的菌株(细胞)。
如本文中使用的术语“转基因(酵母)细胞”是指含有该菌株(细胞)中非天然存在的核酸,并且其已经利用重组体DNA技术白引入到该菌株(细胞)中的菌株(细胞),即,重组体细胞。
如本文中使用的涉及蛋白质或多肽的术语“突变的”意指野生型或天然存在的蛋白质或多肽序列中的至少一个氨基酸已经由编码这些氨基酸的核酸的突变发生而被不同氨基酸替代、插入或从该序列删除。突变发生是本领域公知的方法,并且包括例如,通过PCR的方式或经由寡核苷酸-介导的突变发生进行的定点突变发生,如Sambrook等人,Molecular Cloning-A Laboratory Manual,第2版,第1-3卷(1989)中所描述的。如本文中使用的涉及基因的术语“突变的”意指该基因或其常规序列的核酸序列中的至少一个核苷酸突变发生已被不同的核苷酸替代,或已经从该序列删除,使得蛋白质序列以定性或定量改变的功能或基因敲除的方式发生转录。
如本文中使用的术语“基因”是指含有核酸聚合酶的模板的核酸序列,在真核细胞中该酶为RNA聚合酶。基因被转录为mRNA,并且然后被翻译成蛋白质。
如本文中使用的术语“核酸”包括指代单链或双链形式的脱氧核糖核苷酸或核糖核苷酸聚合物,即多核苷酸,并且除非另外限制,其包含具有天然核苷酸的必需性质的已知类似物,因为其以类似于天然存在的核苷酸(即肽核酸)的方式杂交至单链核酸。多核苷酸可以是全长或天然或异源结构或常规基因的子序列。除非另外说明,该术语包括指代具体的序列及其互补序列。因此,如该术语在本文中的期望含义,具有出于稳定性目的或其他目的进行修饰的骨架的DNA或RNA为“多核苷酸“。而且,包含非常规碱基例如次黄嘌呤核苷(inosine)或修饰的碱基例例如三苯甲基化的碱基(仅仅是两个实例)的DNA或RNA在本文中也被称作术语多核苷酸。应该理解,已经对DNA和RNA进行了大量不同的修饰以起到本领域技术人员公知的许多不同目的。如在本文中使用的,术语多核苷酸涵盖多核苷酸的这些化学、酶促或代谢修饰的形式,以及病毒和细胞的DNA和RNA特征的化学形式,包括除简单和复杂细胞之外。
术语“多肽”、“肽”和“蛋白”在本文中可以互换使用,其是指氨基酸残基的聚合物。该术语适用于其中的一个或多个氨基酸残基为相应天然存在氨基酸的人工化学类似物的氨基酸聚合物,以及天然存在的氨基酸聚合物。天然存在的氨基酸的这些类似物的必需性质是,当结合于蛋白质时,该蛋白质与形成相同蛋白质但全部由天然存在的氨基酸组成的抗体特异性反应。术语”多肽”、“肽”和“蛋白质”还包括修饰,包括但不限于糖基化、脂粘附、硫酸化、谷氨酸残基的γ-羧化、羟基化和ADP-核糖基化。
当参照酶分类(EC)提到酶时,该酶分类是其中酶基于国际生物化学与分子生物学联合会命名法学会(Nomenclature Committee of the International Union ofBiochemistry and Molecular Biology,NC-IUBMB)提供的酶命名法(EnzymeNomenclature)被分类或可以被分类成的类别,该命名法可在http://www.chem.qmul.ac.uk/iubmb/enzyme/找到。意在包括尚未分类在具体类别中但可以这样进行分类的其他适合的酶。
除非另外说明,如果本文中参照登录号提到蛋白或核酸序列,例如基因,则该号码尤其用于指具有能够通过www.ncbi.nlm.nih.gov/(如2009年7月13日可用的)找到的蛋白质或核酸序列。
本文中参照遗传密码编码多肽的每一核酸序列描述了核酸的每一可能沉默变异。术语“保守修饰变体”应用于氨基酸和核酸序列。对于特定的核酸序列,保守修饰的变体是指编码相同氨基酸序列或者由于遗传密码的简并而编码氨基酸序列的保守修饰变体的那些核酸。术语“遗传密码的简并”是指大量功能上相同的核酸编码任意给定蛋白质。例如,密码子GCA、GCC、GCG和GCU均编码氨基酸丙氨酸。因此,在丙氨酸被密码子指定的每一位置,该密码子都能够变成所述的任意相应密码子,而不需改变所编码的多肽。这样的核酸变化是“沉默变化“并且代表一种类型的保守修饰的变化。
如本文中所使用的,术语具有特定序列(例如SEQ ID NO:X)的多肽的“功能性同源物”(或短“同源物”)是指包含所述特定序列的多肽,条件是一个或多个氨基酸被取代、缺失、添加和/或插入,并且该多肽对于底物转化具有(质量上)相同的酶促功能性。这种功能性可通过利用包含重组酵母细胞的测试系统来进行测试,其中该重组酵母细胞包含用于在酵母中表达同源物的表达载体,所述表达载体包含可操作地连接于在酵母中是功能性的启动子的异源核酸序列,并且所述异源核酸序列编码该同系物多肽,对其在酵母细胞中使乙酰基-辅酶A转化为乙醛的酶活性进行测试,并且测定在所述细胞中是否发生该转化。可通过利用计算机辅助类似性分来来鉴定候选同源物。WO2009/013159的实施例2中描述了这样的分析的具体实例。本领域技术人员能够从中知晓可以发现多么适合的候选同源物并且,可选地在密码子(对)最后化之能够如上文所述利用适合的测定系统来测试这样的候选同源物的所需功能性。适合的同源物代表具有类似于具体多肽50%,优选60%或更多,尤其是至少70%,,更加尤其是至少80%,至少90%,至少95%,至少97%,至少98%或至少99%的氨基酸序列,并且具有所需酶促功能性的多肽。对于核酸序列,术语功能性同源物意在包括不同于由于遗传密码的简并获得的另一核酸序列并编码相同多肽序列的核酸序列。
序列同一性在本文中被定义为如通过比较序列确定的两种或更多种氨基酸(多肽或蛋白)序列或两种或更多种核酸(多核苷酸)序列之间的关系。通常,序列同一性或类似性是在所比较的序列的全长上进行比较。在本领域中,“同一性“还意指氨基酸或核酸序列之间序列联系的程度,例如情况可以是如通过这样的序列的字串自检的匹配来确定的。
当氨基酸或核苷酸序列表现出一定程度的相似性时被称为同源物。被称为同源物的两个序列表示相同的进化来源。不论两个同源序列是否紧密相关或者关系较远都分别比或高或低的以“百分比同一性”或“百分比类似性”来表示。尽管对于表示“百分比同一性”或“百分比类似性”会引起争论,但“同一性水平”或“百分比同源性”经常被互换使用。能够利用数学算法来完成两个序列之间的序列的比较和百分比同一性的确定。本领域技术人员知晓若干准哦功能不同的计算机程序能够用于比对两个序列并确定两个序列之间的同源性(Kruskal,J.B.(1983)An overview of sequence comparison In D.Sankoff和J.B.Kruskal,(ed.),Time warps,string edits and macromoleucle:the theory andpractice of sequence comparison,pp.1-44Addison Wesley)。能够利用用于比对两个序列的Needleman和Wunsch算法来确定两个氨基酸序列之间的百分比同一性(Needleman,S.B.和Wunsch,C.D.(1970)J.Mol.Biol.48,443-453)。该算法比对氨基酸序列和核苷酸序列。Needleman-Wunsch算法已在计算机程序NEEDLE上实现。出于本发明的目的,使用来自EMBOSS程序包的NEEDLE程序(2.8.0或更高版本,EMBOSS:The European MolecularBiology Open Software Suite(2000)Rice,P.Longden,I.和Bleasby,A.Trends inGenetics 16,(6)pp276—277,http://emboss.bioinformatics.nl/)。对于蛋白质序列,EBLOSUM62被用作取代矩阵。对于核苷酸序列,使用EDNAFULL。可以指定其他矩阵。用于氨基酸序列比对的可选参数为:空位开放罚分为10且空位延伸罚分为0.5。本领域技术人员将理解,当利用不同算法时,所有这些不同参数将产生稍有不同的结果,但两个序列的总体百分比同一性不会发生显著变化。
全局同源性定义
同源性或同一性是在包括任何空位或延伸的整个比对区上两个完整序列之间的相同匹配的百分比。两个比对序列之间的同源性或同一性如下计算:示出了两个序列中相同氨基酸的比对结果中相应位置的数目除以包括空位的比对结果的总长度。同一性在本文中被定义为能够由NEEDLE获得并且在该程序的输出结果中被标识为“IDENTITY”。
最长同一性定义
两个比对序列之间的同源性或同一性计算如下:示出了两个序列中相同氨基酸的比对结果中相应位置的数目减去比对结果中空位总数之后除以比对结果的总长度。该同一性在本文中被定义为能够利用NOBRIEF选项由NEEDLE获得的,并且在该程序的输出结果中被标识为“最长同一性”。
本文中披露的核苷酸或氨基酸序列的变体也可以被定义为相比于本文中具体披露的核苷酸或氨基酸序列具有一个或多个取代、插入和/或删除的核苷酸或氨基酸(例如在序列表中所列出的)。
可选地,在确定氨基酸类似性的程度时,本领域技术人员也可以考虑所谓的“保守”氨基酸取代,因为其对于本领域技术人员而言是明确的。保守氨基酸取代是指具有类似侧链的残基的可替换性。例如,具有脂肪族侧链的一组氨基酸为甘氨酸、丙氨酸、缬氨酸、亮氨酸、和异亮氨酸;具有脂肪族-羧基侧链的氨基酸组为丝氨酸和苏氨酸;具有含氨基侧链的氨基酸组为天门冬酰胺和谷氨酰胺;具有芳香族侧链的氨基酸组为苯丙氨酸、酪氨酸和色氨酸;具有碱性侧链的氨基酸组为赖氨酸、精氨酸和组氨酸;以及具有含硫侧链的氨基酸组为半胱氨酸和甲硫氨酸。优选的保守氨基酸取代组为:缬氨酸-亮氨酸-异亮氨酸、苯丙氨酸-酪氨酸、赖氨酸-精氨酸、丙氨酸-缬氨酸和天门冬酰胺-谷氨酰胺。本文中披露的氨基酸序列的取代变体是所披露序列中的至少一个残基已被除去而在该位置插入不同的残基。优选地,该氨基酸改变是保守的。对于每一天然存在氨基酸的优选保守取代如下:Ala变成ser;Arg变成lys;Asn变成gln或his;Asp变成glu;Cys变成ser或ala;Gln变成asn;Glu变成asp;Gly变成pro;His变成asn或gln;Ile变成leu或val;Leu变成ile或val;Lys变成arg;gln或glu;Met变成leu或ile;Phe变成met,leu或tyr;Ser变成thr;Thr变成ser;Trp变成tyr;Tyr变成trp或phe;以及Val变成ile或leu。
也可以通过其分别在温和或优选在严格杂交条件下与本文中披露的特定核苷酸序列的部分进行杂交的能力来定义本发明的核苷酸序列。严格杂交条件在本文中被定义为使至少约25个,优选约50个核苷酸,75个或100个以及最优选约200个或更多个核苷酸的核酸序列在约65℃的温度下,在包含约1M盐、优选6x SSC的溶液中或具有相当离子强度的其他任何溶液中进行杂交,并且在65℃下在包含约0.1M盐或更低,优选0.2x SSC的溶液中或具有相当离子强度的其他任何溶液中进行洗涤的条件。优选地,该杂交进行过夜,即,至少持续10小时并且优选洗涤进行持续1小时并且更换至少两次洗涤溶液。这些条件通常使得能够获得具有约90%或更高序列同一性的序列的特定杂交产物。
温和条件在本文中被定义为使得至少50个核苷酸的核酸序列,优选约200或更多个核苷酸能够在约45℃的温度下,在包含约1M盐、优选6x SSC的溶液中或具有相当离子强度的其他任何溶液中进行杂交的条件。优选地,该杂交进行过夜,即,至少持续10小时并且优选洗涤进行持续1小时并且更换至少两次洗涤溶液。这些条件通常使得能够获得具有高达50%序列同一性的序列的特定杂交产物。本领域技术人员能够改变这些杂交条件,以具体鉴别同一性在50%至90%.之间变化的序列。
“表达”是指基因转录称为结构RNA(rRNA、tRNA)或信使RNA(mRNA),其随后被翻译称为蛋白质。
如本文中使用的,“异源的”在指代核酸或蛋白时是指来源于外来物种的核酸或蛋白,或者当来源于相同的物种时,是指通过审慎的人为干涉使其天然形式的组成和/或基因组位点被实质上改变的形式。例如,操作性连接至异源结构基因的启动子来源于不同于该结构基因来源于相同物种的物种,或者,如果来源于相同物种,则其中之一或二者的原始形式均发生实质性改变。异源蛋白可以来源于外来物种,或者如果来源于相同的物种,则通过审慎的人为干涉使其原始形式发生实质性改变。
术语“异源表达”是指异源核酸在宿主细胞中的表达。异源蛋白在真核宿主细胞系统例如酵母中的表达是本领域技术人员公知的。包含编码具有特异性活性的基因的核酸序列的多核苷酸能够在这样的真核系统中被表达。在一些实施方式中,转化的/翻译的酵母细胞可以被用于酶表达的表达系统。异源蛋白在酵母中的表达是公知的。Sherman,F.,等人,Methods in Yeast Genetics,Cold Spring Harbor Laboratory(1982)公认作出了描述可用于在酵母中表达蛋白的多种方法的工作。两种广泛使用的酵母是酿酒酵母和巴斯德毕赤酵母。在酿酒酵母和巴斯德毕赤酵母中用于表达的载体、菌株和实验方案是本领域公知的并且可获自供应商(例如,Invitrogen)。适合的载体通常具有表达控制序列,例如,如所需要的启动子,包括3-磷酸甘油酸激酶或醇氧化酶,以及复制起点、序列终点等等。
如本文中所使用的,“启动子”是涉及(结构)基因转录的DNA序列。通常,启动子位于基因的5'-区中,邻近于(结构)基因的转录起始位点。启动子序列可以是组成性的、可诱导的或可抑制的。如果启动子为可诱导启动子,则转录的速率响应于诱导剂而增加。
如本文中所使用的,术语“载体”包括指代常染色体表达载体和用于整合到染色体组中的整合载体。
术语”表达载体”是指包含编码感兴趣多肽的片段的线性或环状DNA分子,在另外的核酸片段的控制(例如操作性连接至另外的核酸片段)下实现其转录。这样的另外的片段可以包括启动子和终止子序列,并且可以可选地包括一个或多个复制起点、一个或多个可选择的标志物、增强子、多腺苷酸化信号等。表达载体通常来自质粒或病毒DNA,或可以含有二者的元素。尤其是,表达载体包含如下处于5'至3'方向并且可操作地连接的核酸序列:(a)酵母识别的转录和翻译起始区,(b)感兴趣多肽的编码序列,和(c)酵母识别的转录和翻译起始区。“质粒”是指自主地复制染色体外DNA,其不被整合到微生物的基因组中并且通常在性质上是环状的。
“整合载体”是指能够结合到微生物的基因组中并且提供编码感兴趣多肽的基因的稳定遗传的线形或圆形DNA分子。该整合载体通常包含一个或多个片段,该片段包含编码感兴趣多肽的基因序列,在另外的核酸片段控制下(即,可操作性连接于)提供其转录。这样的另外片段可以包括启动子和终止子序列,以及通常通过同源重组过程驱动感兴趣的基因结合到靶细胞基因组中的一个或多个片段。通常,该整合载体是能够转移到靶细胞中的载体,但其具有在生物体中是非功能性的复制子。如果该片段中包括适当的标志物,则可以选择包含感兴趣基因的片段的整合。
“宿主细胞”意指含有载体或支持该载体复制和/或表达的细胞。宿主细胞可以是原核细胞例如大肠杆菌,或真核细胞例如酵母、昆虫、两栖动物、或哺乳动物细胞。优选地,宿主细胞为放线菌目(Actinomycetales)的真核细胞。
如在本文中使用的,”转化”是指外源多核苷酸插入到宿主细胞中,而与用于插入的方法无关,例如直接摄取、转导、f-mating或电穿孔。该外源多核苷酸可以作为未整合的载体(例如质粒)得以保持,或可替代地可以被整合到宿主细胞基因组中。
该微生物优选选自酵母科(Saccharomyceraceae),例如酿酒酵母、巴斯德酵母(Saccharomyces pastorianus)、布拉迪酵母(Saccharomyces beticus)、发酵酵母(Saccharomyces fermentati)、奇异酵母(Saccharomyces paradoxus)、葡萄汁酵母(Saccharomyces uvarum)和贝酵母(Saccharomyces bayanus);裂殖酵母属(Schizosaccharomyces)例如粟酒裂殖酵母(Schizosaccharomyces pombe)、日本裂殖酵母(Schizosaccharomyces japonicus)、八孢裂殖酵母(Schizosaccharomyces octosporus)和嗜冷裂殖酵母(Schizosaccharomyces cryophilus);有孢圆酵母属(Torulaspora),例如德布尔有孢酵母(Torulaspora delbrueckii);克鲁维酵母属(Kluyveromyces),例如马克斯克鲁维酵母(Kluyveromyces marxianus);毕赤酵母属(Pichia),例如树干毕赤酵母(Pichia stipitis)、巴斯德毕赤酵母(Pichia pastoris)或安格斯毕赤酵母(pichiaangusta);接合酵母属(Zygosaccharomyces)例如拜耳接合酵母(Zygosaccharomycesbailii);酒香酵母属(Brettanomyces),例如间型酒香酵母(Brettanomycesintermedius)、布鲁塞尔酒香酵母(Brettanomyces bruxellensis)、异型酒香酵母(Brettanomyces anomalus)、班图酒香酵母(Brettanomyces custersianus)、纳氏酒香酵母(Brettanomyces naardenensis)、Brettanomyces nanus、布鲁塞尔德克酵母(Dekkerabruxellensis)和异型德克酵母(Dekkera anomala);梅奇酵母属(Metschnikowia),伊萨酵母属(Issatchenkia),例如东方伊萨酵母(Issatchenkia orientalis)、克勒克酵母(Kloeckera),例如柠檬形克勒克酵母(Kloeckera apiculata);海洋酵母属(Aureobasidium),例如出芽短梗霉(Aureobasidium pullulans)。
在高度优选的实施方式中,该微生物为选自酵母科的酵母细胞。尤其是,用酿酒酵母细胞已经获得了良好的结果。一经发现,在用于制备醇(乙醇)的方法中能够利用这样的根据本发明的细胞,其中相比于不具有Rubisco和PRK的相似细胞,NADH-依赖性副产物形成(甘油)减少了约90%,并且其中期望产物(乙醇)的产量增加了10%。
Rubisco原则上可选自真核和原核Rubisco。
Rubisco优选来自非光养生物。尤其是,Rubisco可来自化能自养微生物。
用细菌Rubisco已经获得了良好的结果。优选地,细菌Rubisco来源于硫杆菌属(Thiobacillus),尤其是脱氮硫杆菌(Thiobacillus denitrificans),其是化能自养的。
Rubisco可以是单一亚单位Rubisco或具有多于一个亚单位的Rubisco。尤其是,用单一亚单位Rubisco已经获得了良好结果。
尤其是,用II型Rubisco,更加尤其是CbbM已经获得了良好结果。
SEQUENCE ID NO:2示出了尤其根据本发明的优选的Rubisco的序列。其由来自脱氮硫杆菌的cbbM基因编码。这种Rubisco的一种优选的替代物是该Rubisco的功能性同源物,尤其是这样的功能性同源物包含与SEQUENCE ID NO:2具有至少80%,85%,90%或95%序列同一性的序列。表1中给出了适合的天然Rubisco多肽。
表1:Rubisco多肽
| 来源 |
登录号 |
MAX ID(%) |
| 脱氮硫杆菌 |
AAA99178.2 |
100 |
| Sideroxydans lithotrophicus ES-1 |
YP_003522651.1 |
94 |
| Thiothrix nivea DSM 5205 |
ZP_10101642.1 |
91 |
| 那不勒斯盐生硫杆菌c2 |
YP_003262978.1 |
90 |
| 氧化亚铁硫杆菌ATCC 53993 |
YP_002220242.1 |
88 |
| 铁还原红螺菌T118 |
YP_522655.1 |
86 |
| 硫红球菌AZ1 |
ZP_08824342.1 |
85 |
| 未经培养的原核生物 |
AGE14067.1 |
82 |
根据本发明,Rubisco在微生物中被功能性表达,至少在感兴趣化合物的总也制备过程中。
为了增加本文中在转化的(重组体)宿主细胞中酶活性以足够的水平被表达并且处于活性形式的可能性,编码这些酶、以及Rubisco酶和本发明的其他酶(见下文)的核苷酸序列优选被用于最优化所讨论的宿主细胞的密码子使用。编码酶为宿主细胞的密码子使用的核苷酸序列的适应性可被表示为密码子适应指数(CAI)。该密码子适应指数在本文中被定义为在特定宿主细胞或生物体中,基因的密码子使用朝向高度表达的基因的密码子使用的相对适应性的量度。每个密码子的相对适应性(w)是每个密码子的使用与相同氨基酸的最丰富密码子的比值。CAI指数被定义为这些相对适应性值的几何平均数。非同义密码子和终止密码子(依赖于基因编码)被排除。CAI值的范围为0至1,该值越高表示最丰富密码子的比例越高(参见Sharp和Li,1987,Nucleic Acids Research 15:1281-1295;还参见:Jansen等人,2003,Nucleic Acids Res.31(8):2242-51)。适用的核苷酸优选具有至少0.2,0.3,0.4,0.5,0.6,0.7,0.8或0.9的CAI。最优选已经针对在所讨论的真菌宿主细胞(例如酿酒酵母细胞)中的表达密码子最优化的序列。
优选地,功能性表达的Rubisco具有至少1nmol.min-1.(mg蛋白)-1的活性,该由细胞提取物结合1,5-二磷酸核酮糖-依赖性14C-碳酸氢盐的速率来定义,尤其是活性为至少2nmol.min-1.(mg蛋白)-1,更加尤其是活性为至少4nmol.min-1.(mg蛋白)-1。活性的上限不是关键的。在实践中,该活性可以为约200nmol.min-1.(mg蛋白)-1或更低,尤其是25nmol.min-1.(mg蛋白)-1,更加尤其是15nmol.min-1.(mg蛋白)-1或更低,例如约10nmol.min-1.(mg蛋白)-1或更低。当在本文中提到Rubisco的活性时,尤其是指在30℃的活性。在如下实施例(实施例4)中能够找到用于确定Rubisco活性的条件的测定。
根据本发明的功能性表达的磷酸核酮糖激酶(PRK,(EC 2.7.1.19))能够催化化学反应:
因此,该酶的两种底物为ATP和D-5-磷酸核酮糖,而其两种产物为ADP和1,5-二磷酸-D-核酮糖。
PRK属于转移酶家族,尤其是那些以醇基团作为接受体转移含磷基团的酶(磷酸转移酶)。该酶分类的系统命名为ATP:D-核酮糖-5-磷酸1-磷酸转移酶。其他常用名包括磷酸戊糖激酶、核酮糖-5-磷酸激酶、磷酸戊糖激酶、磷酸核酮糖激酶(磷酸化)、5-磷酸核酮糖激酶、核酮糖磷酸激酶、PKK、PRuK和PRK。该酶参与碳固定。
PRK能够来自原核细胞或真核细胞。用来源于真核细胞的PRK已经获得了良好结果。优选地,该真核PRK来源于选自石竹目(Caryophyllales),尤其是苋科(Amaranthaceae),更加尤其是菠菜(Spinacia)的植物。
作为优选的可替代来自菠菜的PRK,可以存在来自菠菜的的功能性同源物,尤其是包含与SEQUENCE ID NO 4具有至少70%,75%,80%,85%,90%或95%序列同一性的序列的功能性同源物。
表2中给出了适合的天然PRK多肽。
表2:适合用于表达的天然PRK多肽
| 来源 |
登录号 |
MAX ID(%) |
| 菠菜(Spinacia oleracea) |
P09559.1 |
100 |
| 蒺藜苜蓿(Medicago truncatula) |
XP_003612664.1 |
88 |
| 拟南芥(Arabidopsis thaliana) |
NP_174486.1 |
87 |
| 葡萄(Vitis vinifera) |
XP_002263724.1 |
86 |
| 极锐新月藻(Closterium peracerosum) |
BAL03266.1 |
82 |
| 玉米(Zea mays) |
NP_001148258.1 |
78 |
在一种有利的实施方式中,重组体微生物进一步包含编码一种或多种异源原核或真核分子伴侣的核酸序列,当被表达时,其能够与微生物中的酶发生功能性相互作用,尤其是与Rubisco和PRK中的至少一种。
伴侣蛋白是为其他蛋白的正确折叠提供有利条件的蛋白,因而防止聚集。新制备的蛋白通常必须从氨基酸的线性链折叠成三维形式。伴侣蛋白属于辅助蛋白折叠的分子大类,被称为分子伴侣。通过三磷酸腺苷(ATP)提供折叠蛋白的能量。本文中适用的关于伴侣蛋白(chaperonin)的综述性文章是Yébenes(2001)所著;“Chaperonins:two rings forfolding”;Hugo Yébenes等人Trends in Biochemical Sciences,August 2011,Vol.36,No.8。
在一种优选的实施方式中,该伴侣蛋白或伴侣由细菌形成,更优选地由埃希氏菌属(Escherichia),尤其是大肠杆菌。在根据本发明的微生物中可尤其编码来自大肠杆菌的GroEL和GroEs。其他优选的伴侣是来自酵母(Saccharomyces)的伴侣,尤其是酿酒酵母Hsp10和Hsp60。如果伴侣在细胞器(例如线粒体)中被天然表达(实例为酿酒酵母的Hsp60和Hsp10),则能够通过例如修饰该伴侣蛋白的天然信号序列来实现迁移至胞质溶胶。
在真核细胞中,蛋白Hsp60和Hsp10在结构上和功能上分别与GroEL和GroES接近完全相同。因此,设想来自任何真核细胞的Hsp60和Hsp10都可作为Rubisc的伴侣蛋白。参见Zeilstra-Ryalls J,Fayet O,Georgopoulos C(1991).“The universally conservedGroE(Hsp60)Chaperonins”.Annu Rev Microbiol.45:301–25.doi:10.1146/annurev.mi.45.100191.001505.PMID 1683763和Horwich AL,Fenton WA,Chapman E,Farr GW(2007).“Two Families of Chaperonins:Physiology and Mechanism”.Annu Rev Cell DevBiol.23:115–45.doi:10.1146/annurev.cellbio.23.090506.123555.PMID 17489689。
用包含异源伴侣GroEL和GroES的重组酵母细胞已经获得了尤其好的结果。
作为GroEL的优选替代物,可以存在GroEL的功能性同源物,尤其是包含与SEQUENCE ID NO:10具有至少70%、75%、80%、85%、90%或95%序列同一性的序列的功能性同源物。
表3中给出了SEQUENCE ID NO:10的适合的天然伴侣多肽同源物。
表3:适合用于表达的SEQUENCE ID NO:10多肽的天然伴侣同源物
作为GroES的一种优选替代物,可以存在GroES的功能性同源物,尤其是包含与SEQUENCE ID NO:12具有至少70%,75%,80%,85%,90%或95%序列同一性的序列的功能性同源物。
表4中废除了SEQUENCE ID NO:12的适合的天然伴侣多肽同源物。
表4:适合用于表达的SEQUENCE ID NO:12多肽的天然伴侣蛋白同源物
在一种实施方式中,表3中的10kDa伴侣蛋白与表4中相同生物属或种的匹配的60kDa伴侣蛋白组合以用于在宿主中表达。
例如:>gi|189189366|ref|XP_001931022.1|:71-168 10kDa伴侣蛋白[小麦全蚀病菌]与匹配>gi|189190432|ref|XP_001931555.1|热休克蛋白60,线粒体的前体[小麦全蚀病菌Pt-1C-BFP]一起表达。
本领域技术人员也可以使用用相同的生物来源类似地作出的表3和表4中的所有其他组合以用于表达。
此外,可以将来自一种生物体的表3的伴侣蛋白与来自另一种生物体的表4的伴侣蛋白组合,或可以将具有表3的伴侣蛋白的GroES与表3的伴侣蛋白组合,或可以将GroEL与表4的伴侣蛋白组合。
如下所示,本发明还涉及用于利用微生物来制备包含转化碳源的有机化合物的方法,从而形成有机化合物。该方法可在需氧、氧受限或厌氧条件下进行。
本发明使得尤其能够减少NADH依赖性副产物形成,尤其是甘油,相比于在相应参比菌株中的生产减少达100%,达99%或达90%。相比于相应的参比菌株,该NADH依赖性副产物形成优选减少超过10%,尤其是减少至少20%,更加尤其是减少至少50%。NADH依赖性副产物产生优选减少10-100%,尤其是减少20-95%,更加尤其是减少50-90%.
在其中使用Rubisco或另外的酶能够催化从CO2(和其他底物)形成有机化合物或催化CO2起到作为电子接受体的另外的酶的优选方法中,在反应条件下反应介质中的二氧化碳浓度为CO2饱和浓度的至少5%,尤其是所示CO2饱和浓度的至少10%,更加尤其是CO2饱和浓度的至少20%。这对于产物产量而言是尤其有利的。反应介质可以在CO2浓度中是过饱和的,在CO2浓度中是饱和的或可以具有低于饱和浓度的浓度。在一种具体实施方式中,CO2浓度为饱和浓度的75%或更低,尤其是所述饱和浓度的50%或更低,更加尤其是CO2饱和浓度的25%或更低。
在一种具体实施方式中,二氧化碳或其部分通过微生物在原位形成。根据需要,该方法进一步包括向反应体系加入外部CO2的步骤,通常是通过用CO2或含有CO2的气体混合物(例如CO2/氮气混合物)进行换气来进行。如果无原位形成CO2或原位形成的CO2不足,则加入外部CO2尤其用于使得CO2(增加或)保持在所需浓度范围内。
确定流体中的CO2浓度是本领域技术人员常规技能。在实践中,人们会常规地在酵母培养物上方在气相中确定CO2浓度(如果用气体净化培养基的话,实际上是废气)。这通常能够利用商品化气体分析仪来进行测量,例如RosemountNGA200000气体分析仪(RosemountAnalytical,Orrvile,USA)。在该方法中在现有条件下,液相中的浓度(相对于饱和浓度)则能够从在气体中测量的值,从CO2饱和浓度和Henri系数计算得到。
作为碳源,原则上能够使用微生物能够利用作为碳源的任何碳源作为底物。尤其是可以使用有机碳源,其选自碳水化合物和脂质(包括脂肪酸)。适合的碳水化合物包括单糖、二糖和水解的多糖(例如,水解的淀粉、木质纤维素水物质。尽管可以存在羧酸,但不一定要包括羧酸例如乙酸作为碳源。
本发明的一个尤其有利的优点是,相比于例如野生型酵母细胞,可实现改善的乙醇产量和减少的甘油产生,而不需要通过通过抑制甘油3-磷酸磷酸水解酶和/或编码甘油3-磷酸脱氢酶基因来干预细胞基因组。
此外,在一种具体实施方式中,根据本发明的酵母细胞可以包含编码甘油3-磷酸磷酸水解酶和/或编码甘油3-磷酸脱氢酶基因的一个或多个外源核苷酸序列的删除或中断。
在本文中,在细胞中,NADH-依赖性甘油合成所需的酶活性被降低或消除。这种酶活性的降低或消除能够通过修饰编码NAD-依赖性甘油3-磷酸脱氢酶活性(GPD)的一种或多种基因或编码磷酸甘油磷酸酶活性(GPP)的一种或多种基因来实现,以使得该酶的表达显著低于在野生型中的表达或编码该多肽的基因具有降低的活性。
这样的修饰能够利用公知的生物技术来进行,并且尤其可包括启动子区或编码GPD和/或GPP的结构基因编码区的一种或多种敲除突变或定点突变发生。可替代地,甘油产生缺陷的酵母菌株可通过随机突变发生之后选择具有减少或无GPD和/或GPP活性的菌株来获得。酿酒酵母GPD1、GPD2、GPP1和GPP2基因在WO 2011/010923中示出,并且在该申请的SEQID NO:24-27中披露。该申请的内容以引用方式结合于本文,尤其是涉及GPD和/或GPP的内容。
如以下实施例中所示出的,发现本发明在用于生产醇(尤其是乙醇)的方法中尤其有利。然而,预期CO2在微生物中能够用作电子接受体(并不是自然如此)的发现在用于生产有机分子方面的生物技术方法方面具有工业益处,尤其是相对低分子量的有机分子,尤其是分子量低于1000g/mol的有机分子。根据本发明,本文中作为利用二氧化碳作为电子接受体的优选实施方式提到了下述事项。
1.二氧化碳作为电子接受体在重组体化养微生物中的应用该重组体化养微生物为非光养真核微生物。
2.二氧化碳作为电子接受体在重组体化养微生物中的应用,其中该微生物在厌氧条件下产生有机化合物。
3.根据第1项或第2项所述的应用,其中该二氧化碳在以NADH作为电子供体方法中起到电子接受体的作用。
5.根据前述项目中任一项所述的应用,其中该微生物在过量产生ATP和/或NADH的方法中产生有机化合物。
6.根据前述项目中任一项所述的应用,其中该微生物包含编码来自(天然)自养生物的多肽的异源核酸序列。
7.根据第6项所述的应用,其中该微生物包含编码所述第一多肽的第一原核伴侣蛋白的异源核酸序列以及优选地包含编码所述多肽的第二原核伴侣蛋白的核酸序列-该第二原核伴侣蛋白不同于第一多肽。
8.根据第7项所述的应用,其中该伴侣为GroEL和GroES。
9.根据前述项目中任一项所述的应用,其中该微生物产生选自如下的有机化合物:醇(例如甲醇、乙醇、丙醇、丁醇、苯酚或多酚)、核糖体肽、抗生素(例如青霉素)、生物柴油、炔烃、烯烃、类异戊二烯、酯类、羧酸(例如琥珀酸、柠檬酸、己二酸、乳酸)、氨基酸、聚酮化合物、脂质、碳水化合物。
10.根据前述项目中任一项所述的应用,其中该微生物包含功能性表达选自以下多肽的异源核酸序列:碳酸酐酶、羧化酶、加氧酶、氢化酶、脱氢酶、异构酶、醛缩酶、转酮醇酶、转醛醇酶、磷酸酶、表异构酶、激酶、羧激酶、氧化还原酶、顺乌头酸酶、延胡索酸酶、还原酶、内酯酶、磷酸烯醇丙酮酸(PEP)羧化酶、磷酸甘油酸激酶、甘油醛-3-磷酸脱氢酶、磷酸丙糖异构酶、果糖-1,6-二磷酸酶、景天庚酮糖-1,7-二磷酸酶,磷酸戊糖异构酶、磷酸戊糖表异构酶、磷酸核酮糖激酶(PRK)、葡萄糖-6-磷酸脱氢酶、6-磷酸葡萄糖酸内酯酶、6-磷酸葡糖酸脱氢酶、5-磷酸核酮糖异构酶、5-磷酸核酮糖3-表异构酶、1,5-二磷酸核酮糖羧化酶加氧酶、乳酸脱氢酶、苹果酸合酶、异柠檬酸裂解酶、丙酮酸羧化酶、磷酸烯醇丙酮酸羧激酶、果糖-1,6-二磷酸酶、葡萄糖异构酶、葡萄糖-6-磷酸酶、己糖激酶、葡萄糖激酶、磷酸果糖激酶、丙酮酸激酶、琥珀酸脱氢酶、柠檬酸合酶、异柠檬酸脱氢酶、α-酮戊二酸脱氢酶、琥珀酰辅酶A合成酶、苹果酸脱氢酶、核苷二磷酸激酶、木糖还原酶、木糖醇脱氢酶、木糖异构酶、类异戊二烯合酶和木糖酸脱水酶。
11.根据第10项所述的应用,其中该微生物包含功能性表达1,5-二磷酸核酮糖羧化酶加氧酶(Rubisco)的异源核酸序列和/或功能性表达磷酸核酮糖激酶(PRK)的异源核酸序列。
12.根据前述项目中任一项所述的应用,其中该微生物选自酵母科青霉菌(Penicillium)、耶氏酵母(Yarrowia)和曲霉菌(Aspergillus)。
13.根据前述项目中任一项所述的应用,其中在用于制备另一种有机化合物(例如另一种醇或羧酸)的过程中,该二氧化碳被用作电子接受体以减少NAD+-依赖性副产物或NADH-依赖性副产物(例如甘油)的产生。
14.重组体微生物,尤其是真核微生物,其具有使得该微生物在化养(非光养)条件下利用二氧化碳作为电子接受体的酶系统,其中该微生物优选如前述项目中所定义。
15.根据第14项所述的重组体微生物,其中该微生物具有伴有过量产生的ATP和/或NADH的过程中产生有机化合物的酶系统。
感兴趣的有机化合物的生产可以在已知该感兴趣的有机化合物在其中不能产生的生物体中发生,条件是该生物体已经经过基因修饰从而在该生物体中能够利用二氧化碳作为电子接受体。
尽管设想本发明关注的是生产多种工业相关有机化合物,但尤其考虑了根据本发明用于生产醇的方法或用途,尤其是选自乙醇,、正丁醇和2,3-丁醇的醇;或生产有机酸/羧酸酯/盐的方法或用途,尤其是选自L-乳酸酯/盐、3-羟基丙酸/盐,D-苹果酸酯/盐,L-苹果酸酯/盐、琥珀酸酯/盐、柠檬酸酯/盐、丙酮酸酯/盐和衣康酸酯/盐。
考虑到乙醇生产,当描述包含PRK和Rubisco的酵母细胞时和在实施例中上文中发现了细节。乙醇或其他的醇优选在发酵过程中产生。
为了产生若干有机酸(羧酸),例如柠檬酸,需要需氧过程。对以例如柠檬酸的生产,可以使用黑曲霉(Aspergillus niger)、解脂亚罗酵母(Yarrowia lipolytica)或另外的已知产柠檬酸生物体。
优选厌氧产生的有机酸的实例为乳酸。已被工程化改造以用于产生乳酸盐/酯的多种产乳酸细菌菌株和酵母菌株通常是本领域中公知的。
实施例
实施例1.表达载体的构建
利用Phusion Hot-start聚合酶(Finnzymes,Landsmeer,荷兰)以及寡核苷酸XbaI_prk-FW2和RV1_XhoI_prk(表5)对来自菠菜(spinach)(EMBL accession number:X07654.1)的磷酸核酮糖激酶(PRK)cDNA进行PCR-扩增,并在-Blunt II-(Life Technologies Europe BV,Bleiswijk,荷兰)中连接。
在通过XbaI和XhoI限制后,将含PRK-片段结合到pTEF424中。之后通过XbaI和SacI限制/结合用来自质粒pSH47的GAL1p代替TEF1p,产生质粒pUDE046(参见表6)。
表6:质粒
侧接有KpnI和SacI位点的来自脱氮硫杆菌(T.denitrificans)的II型Rubisco基因cbbM在GeneArt(Life Technologies Europe BV)被密码子最优化合成,并且结合于pPCR-Script.,然后BamHI和SacI来消化质粒。将含cbbM-片段结合到BamHI和SacI限制的产生质粒pBTWW002的载体pGPD_426中。利用KpnI和SacI将cbbM表达盒转移至pRS416中,产生pUDC098。
来自脱氮硫杆菌(T.denitrificans)cbbQ2和cbbO2的具体RubiscoII型伴侣蛋的表达盒,以及来自大肠杆菌的伴侣groEL和groES被密码子最优化。该表达盒含有酵母组成型启动子和终止子,侧接有密码子最优化基因。该侧接有通过随机组合在酵母基因组数据库(Saccharomyces Genome Deletion Project)和EcoRV位点(GeneArt)中使用的条形码序列获得的独特的60bp区。利用产生pUB230(PGI1p-cbbQ2-TEF2t)、pUD231(PGK1p-cbbO2-ADH1t)、pUD232(TEF1p-groEL-ACT1t)和pUDE233(TPI1p-groES-PGI1t)的SfiI克隆位点将该表达盒插入到质粒pMK-RQ(GeneArt)中(表6)。将表达盒TDH3p-cbbM-CYC1t从质粒pBTWW002经历PCR扩增,利用Phusion Hot-Start Polymerase(Finnzymes)以及引物HR-cbbM-FW-65和HR-cbbM-RV-65,以结合60-bp区以用于重组克隆。
实施例2.菌株构建、分离和保持
使用的所有的酿酒酵母菌株(表7)属于CEN.PK科。使所有的菌株在补充有150mgL-1尿嘧啶的2%w/v葡萄糖合成培养基中生长,当需要时直至其达到末端指数生长期间,然后加入无菌甘油至约30%v/v并在-80℃储存1ml等分试样。
表7:酿酒酵母菌株
利用与重组相关的体内转化来构建与II型Rubisco ccbM以及四个伴侣蛋白cbbQ2、cbbO2、groEL和groES共表达的菌株IMC014。将200fmol的每一表达盒与100fmol的KpnI/SacI线性化pRS416骨架混合至终体积为50μl,并利用乙酸锂试验方案在CEN.PK 113-5D中进行转化(Gietz,等人,Yeast Transformation by the LiAc/SS Carrier DNA/PEGMethod in Yeast Protocol,Humana press,2006)。在合成培养基上选择细胞。大肠杆菌DH5α利用能够在用于同源重组的区域上扩增的引物(表5)通过多重PCR并且在分离的质粒的再转化之后通过限制性分析在转化体菌落上进行pUDC075片段的正确组装。通过Next-Generation Sequencing(Illumina,San Diego,California,U.S.A.)(100br阅读配对末端序列(reads paired-end),50Mb)对PUDC075进行测序并与Velvet进行组装(Zerbino,等人,Velvet:Algorithms for De Novo Short Read Assembly Using De Bruijn Graphs,Genome Research,2008)。组装的序列不含有组装的表达和中的任何突变。利用具有如下变化的相同的体内组装方法构建分别表达ccbM/ccbQ2/ccbO2和ccbM/groEL/groES的菌株IMC034和IMC035。对于构建体质粒pUDC099和pUDC100,120bp cbbO2-pRS416接头和cbbM-GroEL接头分别用于封闭组装(表5),将100fmol的每一互补120bp寡核苷酸加入到转化中。通过用pUDC098转化CEN.PK113-5D来构建仅表达cbbM基因的菌株IMC033。
为了构建共表达PRK、ccbM、ccbQ2、ccbO2、GroEL、GroES的菌株IMU033,在CEN.PK102-3A中在CAN1基因座处通过同源整合通过整合PRK、四个伴侣蛋白和KlLEU2来构建中间体菌株IMI229(Güldener,等人,A second set of loxP marker cassettes forCre-mediated multiple gene knockouts in budding yeast,Nucleic Acids Research,2002)。该表达盒是利用Phusion热启动聚合酶(Finnzymes,Thermo Fisher ScientificInc.Massachusetts,U.S.A.)、相应的寡核苷酸和DNA模板进行PCR扩增的(表5)。最后,用携带II型Rubisco ccbM以及两个大肠杆菌伴侣groEL和groES的pUDC100对菌株IMI229进行转化。
通过用KlLEU2表达盒转化CEN.PK102-3A来构建菌株IMI232。最后用质粒p426GPD来转化IMI232以恢复在参比菌株中IMU032获得的原养型。
实施例3.恒化器的试验安排和分批试验
基本如所描述的进行厌氧恒化器培养(Basso,et al.,Engineering topologyand kinetics of sucrose metabolism in Saccharomyces cerevisiae for improvedethanol yield,Metabolic Engineering 13:694-703,2011),但利用12.5g l-1葡萄糖和12.5g l-1半乳糖作为碳源并且其中指出10%CO2/90%N2的混合物代替纯氮气作为喷射气体。利用针对葡萄糖(Boehringer,Mannheim,Germany)和D-半乳糖(Megazyme,Bray,Ireland)的商品化酶测定在快速淬灭之后确定残余葡萄糖和半乳糖浓度(Mashego等人,Critical evaluation of sampling techniques for residual glucose determinationin carbon-limited chemostat culture of Saccharomyces cerevisiae,Biotechnologyand Bioengineering 83:395-399,2003)。厌氧生物反应器分批培养物基本如所描述生长(Guadalupe Medina等人,Elimination of glycerol production in anaerobiccultures of a Saccharomyces cerevisiae strain engineered to use acetic acidas an electron acceptor.Applied and Environmental Microbiology 76:190-195,2010),但利用用20g L-1半乳糖且喷射气体由10%CO2和90%N2组成。批料和恒化期以及批量培养物中的生物质和代谢物浓度如Guadalupe等人所述确定(Guadalupe Medina等人,Elimination of glycerol production in anaerobic cultures of a Saccharomycescerevisiae strain engineered to use acetic acid as an electron acceptor.Appl.Environ.Microbiol.76,190-195,2010)。在乙醇通量和产量的计算中,基于生物反应器设置中0.008h-1的第一级蒸发速度常数并在本研究中使用的条件下来更正乙醇蒸发。
实施例4.磷酸核酮糖激酶(PRK)和Rubisco的酶测定
如前文所述制备用于分析磷酸核酮糖激酶(PRK)活性的细胞提取物(Abbott等人,Catalase Overexpression reduces lactic acid-induced oxidative stress inSaccharomyces cerevisiae,Applied and Environmental Microbiology 75:2320-2325,2009)。通过偶合的分光光度分析在30℃测量PRK活性(MacElroy等人,Properties ofPhosphoribulokinase from Thiobacillus neapolitanus,Journal of Bacteriology112:532-538,1972)。反应速率与所加入的细胞提取物的量成比例。利用牛血清白蛋白作为标准物通过Lowry方法来确定蛋白质浓度(Lowry等人,Protein measurement with theFolin phenol reagent,The Journal of Biological Chemistry 193:265-275,1951)。
如Abbott,D.A.等人在Catalase overexpression reduces lactic acid-induced oxidative stress in Saccharomyces cerevisiae.Appl.Environ.Microbiol.75:2320-2325,2009中所述制备用于Rubisco活性测定的细胞提取物,具有两项改变:Tris-HCl(1mM,pH 8.2)含有20mM MgCl2·6H2O,5mM的DTT 5mM NaHCO3用作超声缓冲液并且Tris-HCl(100mM,pH 8.2)、20mM MgCl2·6H2O和5mM的DTT用作冷冻缓冲液。通过测量14CO2-固定来确定Rubisco活性(PerkinElmer,Groningen,荷兰)如(Beudeker等人,Relationsbetween d-ribulose-1,5-biphosphate carboxylase,carboxysomes and CO2fixingcapacity in the obligate chemolithotroph Thiobacillus neapolitanus grownunder different limitations in the chemostat,Archives of Microbiology 124:185-189,1980)所述并且利用Ultima GoldTM闪烁液(PerkinElmer,Groningen,荷兰)测量TRI-2700TR Series液体闪烁计数器(PerkinElmer,Groningen,荷兰)中的放射性计数。利用牛血清白蛋白的标准溶液在50mM Tris-HCl(pH 8.2)中通过Lowry方法确定蛋白质浓度(Lowry,O.H.,Rosebrough,N.J.,Farr,A.L.,&Randall,R.J.Protein measurementwith the Folin phenol reagent.J.Biol.Chem.193:265-275,1951)。
实施例5.细胞提取物中的Rubisco的活性和PRK活性
为了研究酿酒酵母中对于Rubisco的异源伴侣的可能要求,将编码来自脱氮硫杆菌的cbbM基因的II型Rubisco进行密码子最优化并由着丝粒载体进行表达,单独或与密码子最优化的大肠杆菌groEL/groES和/或脱氮硫杆菌cbbO2/cbbQ2基因表达盒一起表达。通过酵母细胞提取物的1,5-二磷酸核酮糖-依赖性CO2的分析表明,在大肠杆菌GroEL/GroES的共表达之后观察到酿酒酵母中脱氮硫杆菌Rubisco的表达。Rubisco活性从<0.2nmol.min-1.(mg蛋白)-1增加到超过6nmol.min-1.(mg蛋白)-1。这些试验的结果示于图1,其中示出了单独或与大肠杆菌伴侣GroEL/GroES(IMC035)一起表达来自脱氮硫杆菌的II型Rubisco CbbM(IMC033)的酿酒酵母细胞提取物中的具体1,5-二磷酸核酮糖羧化酶(Rubisco)活性。该脱氮硫杆菌伴侣CbbO2/CbbQ2[20](IMC034)或全部四个伴侣(IMC014)异源的表达的基因被密码子最优化以用于在酵母中表达以及从单个着丝粒载体表达。生物质样品获自合成培养基上的厌氧分批培养物(pH 5.0,30℃),用氮气吹扫并且含有20g l-1葡萄糖作为碳源。,如作为细胞提取物中14CO2-固定所测量的,在野生型参比菌株中和表达cbbM和cbbM-cbbQ2-cbbO2的酿酒酵母菌株中的Rubisco活性低于酶测定的检测限(0.2nmolCO2min-1mg蛋白-1)。
CbbO2/cbbQ2的共表达不会导致Rubisco活性的显著进一步增加。GroEL/GroES对于Rubisco在酿酒酵母中表达的积极影响证明了肽方法用于代谢工程化方法的潜在价值,尤其是当原核酶需要在真核细胞的细胞溶质中被功能化表达时。
在半乳糖-可诱导的GAL1启动子的控制下,将菠菜PRK基因与大肠杆菌groEL/groES和脱氮硫杆菌cbbO2/cbbQ2一起在CAN1基因座处整合到酿酒酵母基因组中。这在还另外携带脱氮硫杆菌Rubisco的着丝粒表达盒的酿酒酵母菌株IMU033的细胞提取物中诱导了高PRK活性。这种工程化的酵母菌株被用于定量分析Rubisco和PRK表达的生理学影响。
表8
表8示出了在表达磷酸核酮糖激酶(PRK)和Rubisco的酿酒酵母菌株的糖上乙醇产量增加。在厌氧恒化器培养物中进行表达PRK和Rubisco的酿酒酵母IMU033和同基因参比菌株IMU032的生理学分析,以0.05h-1的稀释比在补充有12.5g l-1葡萄糖和12.5g l-1半乳糖作为碳源的合成培养基上生长(pH 5)。为了评价CO2浓度的影响,恒化器培养物与纯氮气或与10%CO2和90%氮气的混合物一起以喷射方式进样。结果表示为来自独立平行恒化器试验的数据的平均值±平均差。用相同下标(a,a,b,b,等)标识的数据对被认为是在标准t-检验中具有统计学差异(p<0.02)。
在补充有CO2的碳限制的恒化器培养物中,相比于参比菌株IMU032(0.12mol mol-1),不与PRK(菌株IMC014)共表达的Rubisco和四个伴侣的表达不会导致甘油产量减少(0.13mol mol-1),这表明磷酸核酮糖激酶(PRK)基因的表达是在酿酒酵母中减少甘油产生的功能性途径多必需的。还研究了PRK和Rubisco的表达对于在酿酒酵母的半乳糖-生长的厌氧批量培养物中的生长、底物消耗和产物形成的生理学影响,并将其与同基因参比菌株进行了比较。生长条件:T=30℃,pH 5.0,10%CO2进口气体。进行了两个独立的平行试验,其生长动力学参数的差异小于5%。在其中功能性表达PRK和Rubisco的酵母细胞中,相比于缺少这些酶的酵母细胞,半乳糖上的乙醇产量要高8%而甘油产生则下降了60%。该差异是统计学显著的,标准t-检验(p值<0.02)。工程化菌株IMU033(表7)的细胞提取物中的磷酸核酮糖激酶和Rubisco的活性使得能够利用CO2作为电子接受体。相对于参比菌株IMU032,菌株IMU033的乙醇产量和甘油产量(表8)显示出在厌氧发酵中增加乙醇生产是可能的。
序列
SEQUENCE ID NO 1:
Rubisco cbbM基因(合成的;基于来自脱氮硫杆菌的cbbM基因–pBTWW002,密码子最优来源:Hernandez et al 1996,GenBank ID:L37437.2)
ATGGATCAATCTGCAAGATATGCTGACTTGTCTTTAAAGGAAGAAGATTTGATTAAAGGTGGTAGACATATTTTGGTTGCTTACAAAATGAAACCAAAATCTGGTTATGGTTATTTGGAAGCTGCTGCTCATTTTGCTGCTGAATCTTCTACAGGTACAAATGTTGAAGTTTCTACTACAGATGATTTTACAAAAGGTGTTGATGCTTTAGTTTACTACATCGATGAAGCTTCAGAAGATATGAGAATTGCTTATCCATTGGAATTATTCGACAGAAATGTTACTGACGGAAGATTCATGTTAGTTTCTTTTTTGACTTTGGCTATTGGTAACAATCAAGGAATGGGAGATATAGAACATGCAAAAATGATAGATTTTTACGTTCCAGAAAGATGTATTCAAATGTTTGATGGTCCAGCTACAGATATTTCTAATTTGTGGAGAATTTTGGGTAGACCAGTAGTTAATGGTGGTTATATTGCTGGTACTATTATTAAGCCAAAATTGGGTTTAAGACCAGAACCATTTGCTAAAGCTGCTTATCAATTTTGGTTGGGTGGAGATTTTATCAAGAATGACGAACCACAAGGTAATCAAGTTTTTTGTCCATTGAAAAAAGTTTTGCCATTGGTTTACGATGCTATGAAAAGAGCACAAGATGATACTGGTCAAGCAAAATTGTTTTCTATGAATATTACTGCAGACGATCATTATGAAATGTGTGCAAGAGCTGATTATGCTTTGGAAGTTTTCGGTCCAGATGCAGATAAATTGGCTTTTTTGGTAGATGGTTACGTTGGAGGTCCAGGAATGGTTACTACTGCTAGAAGGCAATATCCTGGTCAATATTTGCATTATCATAGAGCAGGTCACGGTGCTGTTACTTCTCCATCTGCTAAAAGAGGTTATACTGCTTTTGTTTTGGCTAAAATGTCTAGATTGCAAGGCGCTTCAGGTATTCATGTTGGTACTATGGGTTATGGAAAAATGGAAGGAGAAGGCGACGATAAGATTATTGCTTATATGATAGAAAGGGACGAATGTCAAGGTCCAGTTTATTTTCAAAAATGGTACGGTATGAAACCAACTACTCCAATTATCTCCGGAGGAATGAATGCTTTGAGATTGCCTGGTTTTTTCGAAAATTTGGGTCATGGTAACGTTATTAATACTGCAGGTGGTGGTTCTTACGGTCATATTGATTCTCCTGCTGCTGGTGCTATTTCTTTGAGACAATCTTACGAATGTTGGAAACAAGGTGCAGATCCAATTGAATTTGCTAAGGAACATAAGGAATTTGCAAGAGCTTTTGAATCTTTTCCAAAAGATGCTGATAAGTTATTTCCAGGATGGAGAGAAAAATTGGGAGTTCATTCTTAA
SEQUENCE ID NO 2:
来自脱氮硫杆菌的cbbM基因的翻译的蛋白质序列
MDQSARYADLSLKEEDLIKGGRHILVAYKMKPKSGYGYLEAAAHFAAESSTGTNVEVSTTDDFTKGVDALVYYIDEASEDMRIAYPLELFDRNVTDGRFMLVSFLTLAIGNNQGMGDIEHAKMIDFYVPERCIQMFDGPATDISNLWRILGRPVVNGGYIAGTIIKPKLGLRPEPFAKAAYQFWLGGDFIKNDEPQGNQVFCPLKKVLPLVYDAMKRAQDDTGQAKLFSMNITADDHYEMCARADYALEVFGPDADKLAFLVDGYVGGPGMVTTARRQYPGQYLHYHRAGHGAVTSPSAKRGYTAFVLAKMSRLQGASGIHVGTMGYGKMEGEGDDKIIAYMIERDECQGPVYFQKWYGMKPTTPIISGGMNALRLPGFFENLGHGNVINTAGGGSYGHIDSPAAGAISLRQSYECWKQGADPIEFAKEHKEFARAFESFPKDADKLFPGWREKLGVHS
SEQUENCE ID NO 3:
来自菠菜的prk基因–pBTWW001,用限制性酶切和连接构建的质粒。来源:Milanezand Mural 1988,GenBank ID:M21338.1
ATGTCACAACAACAAACAATTGTGATTGGTTTAGCAGCAGATTCAGGTTGTGGTAAGAGTACATTCATGAGGAGGTTAACAAGTGTTTTCGGTGGCGCGGCCGAGCCACCAAAGGGTGGTAACCCAGATTCAAACACATTGATTAGTGACACTACTACTGTTATCTGTTTGGATGATTTTCATTCCCTTGATAGAAATGGCAGGAAAGTGGAAAAAGTTACTGCTTTAGACCCAAAAGCTAATGATTTTGATCTTATGTATGAACAAGTTAAGGCTTTGAAAGAAGGTAAAGCTGTTGATAAACCTATTTATAATCATGTTTCTGGTTTGTTGGACCCTCCTGAGCTTATTCAACCTCCTAAGATCTTGGTCATTGAAGGGTTACACCCCATGTATGACGCACGTGTGAGGGAATTGCTAGACTTCAGCATCTACTTGGACATTAGCAATGAAGTTAAATTTGCCTGGAAAATTCAGAGAGACATGAAAGAAAGAGGACACAGTCTTGAAAGCATCAAAGCCAGTATTGAATCCAGAAAGCCAGATTTTGATGCTTACATTGACCCACAAAAGCAGCATGCTGATGTAGTGATTGAAGTATTGCCAACTGAACTCATTCCTGATGATGATGAAGGCAAAGTGTTGAGAGTAAGGATGATTCAGAAAGAAGGAGTCAAGTTTTTCAACCCAGTTTACTTGTTTGATGAAGGATCTACCATTTCATGGATTCCATGTGGTAGAAAATTAACATGTTCTTACCCTGGTATCAAATTTTCCTATGGCCCAGACACCTTCTATGGCAACGAGGTGACAGTAGTAGAGATGGATGGGATGTTTGACAGATTAGACGAACTAATCTACGTCGAAAGCCATTTGAGCAATCTATCAACCAAGTTTTATGGTGAAGTCACTCAACAAATGTTGAAGCACCAAAATTTCCCAGGAAGCAACAATGGAACTGGTTTCTTCCAAACCATAATTGGATTGAAGATCAGAGACTTGTTCGAGCAGCTCGTTGCTAGCAGGTCTACAGCAACTGCAACAGCTGCTAAAGCCTAG
SEQUENCE ID NO 4:
来自菠菜的prk基因的翻译的蛋白质序列
MSQQQTIVIGLAADSGCGKSTFMRRLTSVFGGAAEPPKGGNPDSNTLISDTTTVICLDDFHSLDRNGRKVEKVTALDPKANDFDLMYEQVKALKEGKAVDKPIYNHVSGLLDPPELIQPPKILVIEGLHPMYDARVRELLDFSIYLDISNEVKFAWKIQRDMKERGHSLESIKASIESRKPDFDAYIDPQKQHADVVIEVLPTELIPDDDEGKVLRVRMIQKEGVKFFNPVYLFDEGSTISWIPCGRKLTCSYPGIKFSYGPDTFYGNEVTVVEMDGMFDRLDELIYVESHLSNLSTKFYGEVTQQMLKHQNFPGSNNGTGFFQTIIGLKIRDLFEQLVASRSTATATAAKA
SEQUENCE ID NO 5:
cbbQ2基因(合成的,基于来自脱氮硫杆菌的cbbQ2基因-密码子最优化,原始序列获自Beller et al 2006,GenBank基因ID:3672366,蛋白质ID:AAZ98590.1)
ATGACTACTAACAAGGAACAATACAAGGTTCACCAAGAACCATACTACCAAGCTCAAGGTAGAGAAGTTCAATTGTACGAAGCTGCTTACAGAAACAGATTGCCAGTTATGGTTAAGGGTCCAACTGGTTGTGGTAAGTCTAGATTCGTTGAATACATGGCTTGGAAGTTGAACAAGCCATTGATCACTGTTGCTTGTAACGAAGACATGACTGCTTCTGACTTGGTTGGTAGATACTTGTTGGAAGCTAACGGTACTAGATGGTTGGACGGTCCATTGACTACTGCTGCTAGAATCGGTGCTATCTGTTACTTGGACGAAGTTGTTGAAGCTAGACAAGACACTACTGTTGTTATCCACCCATTGACTGACCACAGAAGAACTTTGCCATTGGACAAGAAGGGTGAATTGATCGAAGCTCACCCAGACTTCCAATTGGTTATCTCTTACAACCCAGGTTACCAATCTTTGATGAAGGACTTGAAGCAATCTACTAAGCAAAGATTCGCTGCTTTCGACTTCGACTACCCAGACGCTGCTTTGGAAACTACTATCTTGGCTAGAGAAACTGGTTTGGACGAAACTACTGCTGGTAGATTGGTTAAGATCGGTGGTGTTGCTAGAAACTTGAAGGGTCACGGTTTGGACGAAGGTATCTCTACTAGATTGTTGGTTTACGCTGCTACTTTGATGAAGGACGGTGTTGACGCTGGTGACGCTTGTAGAATGGCTTTGGTTAGACCAATCACTGACGACGCTGACATCAGAGAAACTTTGGACCACGCTATCGACGCTACTTTCGCTTAA
SEQUENCE ID NO 6:
来自脱氮硫杆菌的cbbQ2基因的翻译的蛋白质序列
MTTNKEQYKVHQEPYYQAQGREVQLYEAAYRNRLPVMVKGPTGCGKSRFVEYMAWKLNKPLITVACNEDMTASDLVGRYLLEANGTRWLDGPLTTAARIGAICYLDEVVEARQDTTVVIHPLTDHRRTLPLDKKGELIEAHPDFQLVISYNPGYQSLMKDLKQSTKQRFAAFDFDYPDAALETTILARETGLDETTAGRLVKIGGVARNLKGHGLDEGISTRLLVYAATLMKDGVDAGDACRMALVRPITDDADIRETLDHAIDATFA
SEQUENCE ID NO 7:
cbbO2基因(合成的,基于来自脱氮硫杆菌的cbbO2基因-密码子最优化,原始序列获自Beller et al 2006,GenBank基因ID:3672365,蛋白质ID:YP_316394.1)
ATGGCTGCTTACTGGAAGGCTTTGGACACTAGATTCGCTCAAGTTGAAGAAGTTTTCGACGACTGTATGGCTGAAGCTTTGACTGTTTTGTCTGCTGAAGGTGTTGCTGCTTACTTGGAAGCTGGTAGAGTTATCGGTAAGTTGGGTAGAGGTGTTGAACCAATGTTGGCTTTCTTGGAAGAATGGCCATCTACTGCTCAAGCTGTTGGTGAAGCTGCTTTGCCAATGGTTATGGCTTTGATCCAAAGAATGCAAAAGTCTCCAAACGGTAAGGCTATCGCTCCATTCTTGCAAACTTTGGCTCCAGTTGCTAGAAGATTGCAATCTGCTGAACAATTGCAACACTACGTTGACGTTACTTTGGACTTCATGACTAGAACTACTGGTTCTATCCACGGTCACCACACTACTTTCCCATCTCCAGGTTTGCCAGAATTCTTCGCTCAAGCTCCAAACTTGTTGAACCAATTGACTTTGGCTGGTTTGAGAAACTGGGTTGAATACGGTATCAGAAACTACGGTACTCACCCAGAAAGACAACAAGACTACTTCTCTTTGCAATCTGCTGACGCTAGAGCTGTTTTGCAAAGAGAAAGACACGGTACTTTGTTGGTTGACGTTGAAAGAAAGTTGGACTTGTACTTGAGAGGTTTGTGGCAAGACCACGACCACTTGGTTCCATACTCTACTGCTTTCGACGAAATCAGAAAGCCAGTTCCATACTACGACAAGTTGGGTATGAGATTGCCAGACGTTTACGACGACTTGGTTTTGCCATGTCCAGCTGGTAGAGGTGGTGCTGGTGGTGAAGACGTTTTGGTTTCTGGTTTGGACAGATACAGAGCTACTTTGGCTCACATGGTTGGTCACAGAAGATGGTCTGAAGCTCAAATCGCTGACAACTGGTCTCCATTCCAAAGAATGGCTGTTGAATTCTTCGAAGACTGTAGAGTTGAAACTTTGTTGATGAGAGAATACCCAGGTTTGGCTAGAATCTTCAGAGCTTTGCACCCAAAGCCAGTTGAAGCTGCTTGTGACGGTGAAACTACTTCTTGTTTGAGACACAGATTGGCTATGTTGTCTAGAGCTTTCATCGACCCAGACCACGGTTACGCTGCTCCAGTTTTGAACGACTTCGTTGCTAGATTCCACGCTAGATTGGCTGACGGTACTTCTTCTACTTCTGAAATGGCTGACTTGGCTTTGTCTTACGTTGCTAAGACTAGAAGACCATCTGACCAATTCGCTAAGGTTCACTTCGACGACACTGTTGTTGACTACAGAGACGACAACAGACAATTGTGGAAGTTCATCGAAGAAGGTGACGAAGAAGAAGCTTTCGACGCTAAGAGAAAGATCGAACCAGGTGAAGAAATCCAAGGTTTGCCACCAAGACACTACCCAGAATGGGACTACACTTCTCAAACTTACAGACCAGACTGGGTTTCTGTTTACGAAGGTTTGCACAGATCTGGTAACGCTGGTGACATCGACAGATTGTTGGCTAAGCACGCTGCTTTGGCTAAGAGATTGAAGAAGATGTTGGACTTGTTGAAGCCACAAGACAAGGTTAGAGTTAGATACCAAGAAGAAGGTTCTGAATTGGACTTGGACGTTGCTATCAGATCTTTGATCGACTTCAAGGGTGGTGCTACTCCAGACCCAAGAATCAACATGTCTCACAGATCTGACGGTAGAGACATCGCTGTTATGTTGTTGTTGGACTTGTCTGAATCTTTGAACGAAAAGGCTGCTGGTGCTGGTCAAACTATCTTGGAATTGTCTCAAGAAGCTGTTTCTTTGTTGGCTTGGTCTATCGAAAAGTTGGGTGACCCATTCGCTATCGCTGGTTTCCACTCTAACACTAGACACGACGTTAGATACTTCCACATCAAGGGTTACTCTGAAAGATGGAACGACGACGTTAAGGCTAGATTGGCTGCTATGGAAGCTGGTTACTCTACTAGAATGGGTGCTGCTATGAGACACGCTGCTCACTACTTGTCTGCTAGACCAGCTGACAAGAAGTTGATGTTGATCTTGACTGACGGTAGACCATCTGACGTTGACGCTGCTGACGAAAGATTGTTGGTTGAAGACGCTAGACAAGCTGTTAAGGAATTGGACAGACAAGGTATCTTCGCTTACTGTATCTCTTTGGACGCTCAATTGAAGGCTGGTGCTGACGACTACGTTGCTGAAATCTTCGGTAGACAATACACTGTTATCGACAGAGTTGAAAGATTGCCAGAAAGATTGCCAGAATTGTTCATGGCTTTGACTAAGTAA
SEQUENCE ID NO:8
来自脱氮硫杆菌的cbbO2基因的翻译的蛋白质序列
MAAYWKALDTRFAQVEEVFDDCMAEALTVLSAEGVAAYLEAGRVIGKLGRGVEPMLAFLEEWPSTAQAVGEAALPMVMALIQRMQKSPNGKAIAPFLQTLAPVARRLQSAEQLQHYVDVTLDFMTRTTGSIHGHHTTFPSPGLPEFFAQAPNLLNQLTLAGLRNWVEYGIRNYGTHPERQQDYFSLQSADARAVLQRERHGTLLVDVERKLDLYLRGLWQDHDHLVPYSTAFDEIRKPVPYYDKLGMRLPDVYDDLVLPCPAGRGGAGGEDVLVSGLDRYRATLAHMVGHRRWSEAQIADNWSPFQRMAVEFFEDCRVETLLMREYPGLARIFRALHPKPVEAACDGETTSCLRHRLAMLSRAFIDPDHGYAAPVLNDFVARFHARLADGTSSTSEMADLALSYVAKTRRPSDQFAKVHFDDTVVDYRDDNRQLWKFIEEGDEEEAFDAKRKIEPGEEIQGLPPRHYPEWDYTSQTYRPDWVSVYEGLHRSGNAGDIDRLLAKHAALAKRLKKMLDLLKPQDKVRVRYQEEGSELDLDVAIRSLIDFKGGATPDPRINMSHRSDGRDIAVMLLLDLSESLNEKAAGAGQTILELSQEAVSLLAWSIEKLGDPFAIAGFHSNTRHDVRYFHIKGYSERWNDDVKARLAAMEAGYSTRMGAAMRHAAHYLSARPADKKLMLILTDGRPSDVDAADERLLVEDARQAVKELDRQGIFAYCISLDAQLKAGADDYVAEIFGRQYTVIDRVERLPERLPELFMALTK
SEQUENCE ID NO:9
GroEL基因(合成的,基于来自大肠杆菌的GroEL-密码子最优化,原始序列获自Durfee et al 2008,基因ID:6061450,蛋白质ID:YP_001732912.1)
ATGGCTGCTAAGGACGTTAAGTTCGGTAACGACGCTAGAGTTAAGATGTTGAGAGGTGTTAACGTTTTGGCTGACGCTGTTAAGGTTACTTTGGGTCCAAAGGGTAGAAACGTTGTTTTGGACAAGTCTTTCGGTGCTCCAACTATCACTAAGGACGGTGTTTCTGTTGCTAGAGAAATCGAATTGGAAGACAAGTTCGAAAACATGGGTGCTCAAATGGTTAAGGAAGTTGCTTCTAAGGCTAACGACGCTGCTGGTGACGGTACTACTACTGCTACTGTTTTGGCTCAAGCTATCATCACTGAAGGTTTGAAGGCTGTTGCTGCTGGTATGAACCCAATGGACTTGAAGAGAGGTATCGACAAGGCTGTTACTGCTGCTGTTGAAGAATTGAAGGCTTTGTCTGTTCCATGTTCTGACTCTAAGGCTATCGCTCAAGTTGGTACTATCTCTGCTAACTCTGACGAAACTGTTGGTAAGTTGATCGCTGAAGCTATGGACAAGGTTGGTAAGGAAGGTGTTATCACTGTTGAAGACGGTACTGGTTTGCAAGACGAATTGGACGTTGTTGAAGGTATGCAATTCGACAGAGGTTACTTGTCTCCATACTTCATCAACAAGCCAGAAACTGGTGCTGTTGAATTGGAATCTCCATTCATCTTGTTGGCTGACAAGAAGATCTCTAACATCAGAGAAATGTTGCCAGTTTTGGAAGCTGTTGCTAAGGCTGGTAAGCCATTGTTGATCATCGCTGAAGACGTTGAAGGTGAAGCTTTGGCTACTTTGGTTGTTAACACTATGAGAGGTATCGTTAAGGTTGCTGCTGTTAAGGCTCCAGGTTTCGGTGACAGAAGAAAGGCTATGTTGCAAGACATCGCTACTTTGACTGGTGGTACTGTTATCTCTGAAGAAATCGGTATGGAATTGGAAAAGGCTACTTTGGAAGACTTGGGTCAAGCTAAGAGAGTTGTTATCAACAAGGACACTACTACTATCATCGACGGTGTTGGTGAAGAAGCTGCTATCCAAGGTAGAGTTGCTCAAATCAGACAACAAATCGAAGAAGCTACTTCTGACTACGACAGAGAAAAGTTGCAAGAAAGAGTTGCTAAGTTGGCTGGTGGTGTTGCTGTTATCAAGGTTGGTGCTGCTACTGAAGTTGAAATGAAGGAAAAGAAGGCTAGAGTTGAAGACGCTTTGCACGCTACTAGAGCTGCTGTTGAAGAAGGTGTTGTTGCTGGTGGTGGTGTTGCTTTGATCAGAGTTGCTTCTAAGTTGGCTGACTTGAGAGGTCAAAACGAAGACCAAAACGTTGGTATCAAGGTTGCTTTGAGAGCTATGGAAGCTCCATTGAGACAAATCGTTTTGAACTGTGGTGAAGAACCATCTGTTGTTGCTAACACTGTTAAGGGTGGTGACGGTAACTACGGTTACAACGCTGCTACTGAAGAATACGGTAACATGATCGACATGGGTATCTTGGACCCAACTAAGGTTACTAGATCTGCTTTGCAATACGCTGCTTCTGTTGCTGGTTTGATGATCACTACTGAATGTATGGTTACTGACTTGCCAAAGAACGACGCTGCTGACTTGGGTGCTGCTGGTGGTATGGGTGGTATGGGTGGTATGGGTGGTATGATGTAA
SEQUENCE ID NO:10
基因来自大肠杆菌的GroEL的翻译的蛋白质序列
MAAKDVKFGNDARVKMLRGVNVLADAVKVTLGPKGRNVVLDKSFGAPTITKDGVSVAREIELEDKFENMGAQMVKEVASKANDAAGDGTTTATVLAQAIITEGLKAVAAGMNPMDLKRGIDKAVTAAVEELKALSVPCSDSKAIAQVGTISANSDETVGKLIAEAMDKVGKEGVITVEDGTGLQDELDVVEGMQFDRGYLSPYFINKPETGAVELESPFILLADKKISNIREMLPVLEAVAKAGKPLLIIAEDVEGEALATLVVNTMRGIVKVAAVKAPGFGDRRKAMLQDIATLTGGTVISEEIGMELEKATLEDLGQAKRVVINKDTTTIIDGVGEEAAIQGRVAQIRQQIEEATSDYDREKLQERVAKLAGGVAVIKVGAATEVEMKEKKARVEDALHATRAAVEEGVVAGGGVALIRVASKLADLRGQNEDQNVGIKVALRAMEAPLRQIVLNCGEEPSVVANTVKGGDGNYGYNAATEEYGNMIDMGILDPTKVTRSALQYAASVAGLMITTECMVTDLPKNDAADLGAAGGMGGMGGMGGMM
SEQUENCE ID NO:11
GroES基因(合成的,基于GroES大肠杆菌-密码子最优化,原始序列获自Durfee etal 2008,基因ID:6061370,蛋白质ID:YP_001732911.1)
ATGAACATCAGACCATTGCACGACAGAGTTATCGTTAAGAGAAAGGAAGTTGAAACTAAGTCTGCTGGTGGTATCGTTTTGACTGGTTCTGCTGCTGCTAAGTCTACTAGAGGTGAAGTTTTGGCTGTTGGTAACGGTAGAATCTTGGAAAACGGTGAAGTTAAGCCATTGGACGTTAAGGTTGGTGACATCGTTATCTTCAACGACGGTTACGGTGTTAAGTCTGAAAAGATCGACAACGAAGAAGTTTTGATCATGTCTGAATCTGACATCTTGGCTATCGTTGAAGCTTAA
SEQUENCE ID NO:12
来自大肠杆菌的GroES基因的翻译的蛋白质序列
MNIRPLHDRVIVKRKEVETKSAGGIVLTGSAAAKSTRGEVLAVGNGRILENGEVKPLDVKVGDIVIFNDGYGVKSEKIDNEEVLIMSESDILAIVEA