CN109312353A - 通过crispr-抑制来改善微生物 - Google Patents
通过crispr-抑制来改善微生物 Download PDFInfo
- Publication number
- CN109312353A CN109312353A CN201780034269.3A CN201780034269A CN109312353A CN 109312353 A CN109312353 A CN 109312353A CN 201780034269 A CN201780034269 A CN 201780034269A CN 109312353 A CN109312353 A CN 109312353A
- Authority
- CN
- China
- Prior art keywords
- bacillus
- sequence
- host cell
- genomic target
- target sequences
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases [RNase]; Deoxyribonucleases [DNase]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
- C12N15/75—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Bacillus
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPR]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/80—Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Medicinal Chemistry (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本发明涉及通过CRISPR‑抑制对一个或多个目的基因组靶序列的表达进行阻遏来改善微生物宿主细胞的至少一个特性的方法、以及所得宿主细胞和采用所述宿主细胞的产生方法。
Description
对序列表的引用
本申请含有处于计算机可读形式的序列表,将其通过引用并入本文。
技术领域
本发明涉及通过CRISPR-抑制对一个或多个目的基因组靶序列的表达进行阻遏来改善微生物宿主细胞的至少一个特性的方法、以及所得宿主细胞和采用所述宿主细胞的产生方法。
背景技术
最初从化脓性链球菌分离的所谓的CRISPR(规律间隔成簇短回文重复序列)Cas9基因组编辑系统已经广泛用做一种工具以修饰多个真核生物的基因组。然而,只有少数出版物报道了这种编辑系统在细菌中的应用。
Cas9酶有两个能够靶向特异性基因组序列的RNA-指导的DNA内切核酸酶结构域。所述系统已被广泛描述用于在各种真核生物(Doudna和Charpentier,2014,Genomeediting[基因组编辑].The new frontier of genome engineering with CRISPR-Cas9[CRISPR-Cas9基因工程的新前沿],Science[科学]346(6213):1258096)、大肠杆菌(Jiang等人,2013,RNA-guided editing of bacterial genomes using CRISPR-Cas systems[使用CRISPR-Cas系统对细菌基因组进行RNA指导的编辑],Nat.Biotechnol.[自然生物技术],31(3):233-9)、酵母(DiCarlo等人,2013,Genome engineering in Saccharomycescerevisiae using CRISPR-Cas systems[使用CRISPR-Cas系统在酿酒酵母中进行基因组工程],Nucleic Acids Res.[核酸研究]41(7):4336-4343)、乳酸菌属(Oh和van Pijkeren,2014,CRISPR-Cas9-assisted recombineering in Lactobacillus reuteri.[罗伊氏乳杆菌中CRISPR-Cas9-辅助的重组工程].Nucleic Acids Res.[核酸研究]42(17):e131)和丝状真菌(如里氏木霉)(Liu等人,2015,Efficient genome editing in filamentousfungus Trichoderma reesei using the CRISPR/Cas9 system.[使用CRISPR/Cas9系统对丝状真菌里氏木霉进行有效的基因组编辑]Cell Discovery[细胞发现]1)和黑曲霉(等人,2015,A CRISPR-Cas9 System for Genetic Engineering of FilamentousFungi.[用于丝状真菌基因组工程的CRISPR-Cas9系统]PLoS ONE[公共科学图书馆·综合]10(7):e0133085)中编辑基因组。
Cas9系统的力量在于其简单性,可在特异性目的基因中靶向和编辑单个碱基对。另外,可以在单个反应中靶向多个基因进行修饰(多重化),产生插入和缺失,以及沉默或活化基因。在2012年,CRISPR-Cas9蛋白被证明是双-RNA指导的内切核酸酶蛋白(Jinek等人,2012,A programmable dual-RNA-guided DNA endonuclease in adaptive bacterialimmunity[在自适应细菌免疫中的可编程双重-RNA-指导的DNA核酸内切酶],Science[科学]337(6096):816-21)。利用CRISPR-Cas9作为基因组编辑工具的进一步开发导致了单指导RNA分子的工程化,所述分子将内切核酸酶指导至其DNA靶标。单指导RNA保留了与Cas9蛋白相互作用和进一步靶向所希望的核苷酸序列所必需的关键特征。当与RNA分子复合时,Cas9蛋白将结合DNA序列并使用两个催化结构域产生双链断裂。当工程化为在任一催化结构域中含有单个氨基酸突变时,Cas9蛋白起切口酶的作用,切口酶是具有单链切割活性的变体蛋白。最近Xu等人证明经由CRISPR-Cas9切口酶在解纤维素梭菌(Clostridiumcellulyticum)中进行基因组编辑(Xu等人,2015,Efficient Genome Editing inClostridium cellulolyticum via CRISPR-Cas9 Nickase[经由CRISPR-Cas9切口酶在解纤维素梭菌中进行有效的基因组编辑].Appl.Environ.Microbiol.[应用环境微生物学]81(13):4423-4431)。已经显示了使用基于CRISPR的敲低方法对枯草芽孢杆菌中的必需基因的基本系统分析(Peters等人,2016,Cell[细胞]165:1493-1506)。
寻求在工业上采用的微生物宿主细胞中成功瞬时或永久减少或完全消除一个或多个特异性基因的表达的新方法。此类宿主细胞是希望的,因为特异性基因沉默可以导致出人意料的改善的特性,例如更好的转化效率、更高的产物产率或生产力等。
发明内容
在第一方面,本发明提供通过阻遏一个或多个目的基因组靶序列的表达来改善微生物宿主细胞的至少一个特性的方法,所述方法包括以下步骤:
I)提供微生物宿主细胞,所述微生物宿主细胞包含待阻遏的一个或多个目的基因组靶序列,其中每个靶序列包含或侧接针对II类Cas9酶的功能性PAM序列;
II)用以下转化所述宿主细胞:
a)编码所述II类Cas9酶的无效核酸酶变体的多核苷酸,
b)编码针对每个待阻遏的靶序列的单指导RNA或指导RNA复合物的多核苷酸,所述单指导RNA或指导RNA复合物包含:
i)第一RNA序列,其包含20个或更多个核苷酸并且包含tracr配对序列,所述核苷酸与至少一个待阻遏的基因组靶序列至少80%互补并且能够与至少一个待阻遏的基因组靶序列杂交,以及
ii)第二RNA序列,其包含与所述tracr配对序列互补并且能够与所述tracr配对序列杂交的tracr序列;
其中所述第一RNA序列的20个或更多个核苷酸与所述一个或多个基因组靶序列杂交,并且其中所述无效核酸酶变体II类Cas9酶与所述单指导RNA或所述指导RNA复合物相互作用并且与所述一个或多个基因组靶序列结合,从而阻遏其表达并改善所述宿主细胞的至少一个特性。
在第二方面,本发明提供具有至少一个改善的特性的微生物宿主细胞,其中一个或多个目的基因组靶序列的表达被阻遏,所述宿主细胞包含:
a)一个或多个被阻遏的目的基因组靶序列,其中每个靶序列包含或侧接针对II类Cas9酶的功能性PAM序列;
b)编码所述II类Cas9酶的无效核酸酶变体的多核苷酸,
c)编码针对每个被阻遏的靶序列的单指导RNA或指导RNA复合物的多核苷酸,所述单指导RNA或指导RNA复合物包含:
i)第一RNA序列,其包含20个或更多个核苷酸并且包含tracr配对序列,所述核苷酸与至少一个被阻遏的基因组靶序列至少80%互补并且能够与至少一个被阻遏的基因组靶序列杂交,以及
ii)第二RNA序列,其包含与所述tracr配对序列互补并且能够与所述tracr配对序列杂交的tracr序列;
其中所述第一RNA序列的20个或更多个核苷酸与所述一个或多个基因组靶序列杂交,并且其中所述无效核酸酶变体II类Cas9酶与所述单指导RNA或所述指导RNA复合物相互作用并且与所述一个或多个基因组靶序列结合,从而阻遏其表达并改善所述宿主细胞的至少一个特性。
附图说明
图1显示了pMOL3188的示意性环状质粒图谱,其中指示了引物1-10的靶标。
图2显示了pMOL3198的示意性线性质粒图谱,其中指示了引物11-22的靶标。
定义
编码序列:术语“编码序列”意指直接指定多肽的氨基酸序列的多核苷酸。编码序列的边界一般由可读框决定,所述可读框以起始密码子(如ATG、GTG或TTG)开始并且以终止密码子(如TAA、TAG或TGA)结束。编码序列可为基因组DNA、cDNA、合成DNA或其组合。
控制序列:术语“控制序列”意指表达编码本发明的成熟多肽的多核苷酸所必需的核酸序列。每个控制序列对于编码所述多肽的多核苷酸来说可以是天然的(即,来自相同基因)或外源的(即,来自不同基因),或相对于彼此是天然的或外源的。此类控制序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。最少,控制序列包括启动子、以及转录和翻译终止信号。出于引入有利于将控制序列与编码多肽的多核苷酸的编码区连接的特异性限制性酶切位点的目的,所述控制序列可以提供有多个接头。
表达:术语“表达”包括涉及多肽产生的任何步骤,包括但不限于,转录、转录后修饰、翻译、翻译后修饰、以及分泌。
表达载体:术语“表达载体”意指直链或环状DNA分子,所述DNA分子包含编码多肽的多核苷酸并且可操作地连接至提供用于其表达的控制序列。
高严格条件:术语“高严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃、于5X SSPE、0.3%SDS、200微克/ml剪切并且变性的鲑精DNA和50%甲酰胺中预杂交和杂交12小时至24小时。最后在65℃使用2X SSC、0.2%SDS将载体材料洗涤三次,每次15分钟。
宿主细胞:术语“宿主细胞”意指易于用包含本发明的多核苷酸的核酸构建体或表达载体进行转化、转染、转导等的任何细胞类型。术语“宿主细胞”涵盖由于复制期间发生的突变而与亲本细胞不同的亲本细胞的任何后代。
分离的:术语“分离的”意指处于自然界中不存在的形式或环境中的一种物质。分离的物质的非限制性实例包括(1)任何非天然存在的物质,(2)包括但不限于任何酶、变体、核酸、蛋白质、肽或辅因子的任何物质,所述物质至少部分地从与其性质相关的一个或多个或所有天然存在的成分中去除;(3)相对于自然界中发现的物质通过人工修饰的任何物质;或(4)通过相对于与其天然相关的其他组分增加物质的量而修饰的任何物质(例如,宿主细胞中的重组产生;编码所述物质的基因的多个拷贝;以及使用比与编码所述物质的基因天然相关的启动子更强的启动子)。
低严格条件:术语“低严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃、于5X SSPE、0.3%SDS、200微克/ml剪切并且变性的鲑精DNA以及25%甲酰胺中预杂交和杂交12小时至24小时。最后在50℃使用2X SSC、0.2%SDS将载体材料洗涤三次,每次15分钟。
成熟多肽:术语“成熟多肽”意指在翻译和任何翻译后修饰,如N-末端加工、C-末端截短、糖基化作用、磷酸化作用等之后处于其最终形式的多肽。本领域内公知,宿主细胞可以产生由相同多核苷酸表达的两种或更多种不同的成熟多肽(即,具有不同的C-末端和/或N-末端氨基酸)的混合物。本领域还已知,不同的宿主细胞不同地加工多肽,且因此一个表达多核苷酸的宿主细胞当与另一个表达相同多核苷酸的宿主细胞相比时可产生不同的成熟多肽(例如,具有不同的C-末端和/或N-末端氨基酸)。
成熟多肽编码序列:术语“成熟多肽编码序列”意指编码成熟多肽的多核苷酸。
中严格条件:术语“中严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃、于5X SSPE、0.3%SDS、200微克/ml剪切并且变性的鲑精DNA以及35%甲酰胺中预杂交和杂交12小时至24小时。最后在55℃使用2X SSC、0.2%SDS将载体材料洗涤三次,每次15分钟。
中高严格条件:术语“中高严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃、于5X SSPE、0.3%SDS、200微克/ml剪切并且变性的鲑精DNA以及35%甲酰胺中预杂交和杂交12小时至24小时。最后在60℃使用2X SSC、0.2%SDS将载体材料洗涤三次,每次15分钟。
核酸构建体:术语“核酸构建体”意指单-链或双链的核酸分子,所述核酸分子是从天然存在的基因中分离的,或以本来不存在于自然界中的方式被修饰成含有核酸的区段,或是合成的,所述核酸分子包含一个或多个控制序列。
可操作地连接:术语“可操作地连接”意思指这样一种配置,在所述配置中,一个控制序列被放置在相对于多核苷酸的编码序列适当的位置处,这样使得所述控制序列引导所述编码序列的表达。
序列同一性:两个氨基酸序列之间或两个核苷酸序列之间的关联度通过参数“序列同一性”或“序列互补性”来描述。
出于本发明的目的,使用如在EMBOSS软件包(EMBOSS:The European MolecularBiology Open Software Suite[EMBOSS:欧洲分子生物学开放软件套件]),Rice等人,2000,Trends Genet.[遗传学趋势]16:276-277)(优选5.0.0版本或更新版本)的Needle程序中所实施的Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.[分子生物学杂志]48:443-453)来确定两个氨基酸序列之间的序列同一性。使用的参数是空位开放罚分10、空位延伸罚分0.5、以及EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。使用Needle标记的“最长同一性”的输出(使用-nobrief选项获得)作为同一性百分比并且计算如下:
(同一的残基x 100)/(比对长度-比对中的空位总数)
出于本发明的目的,使用如在EMBOSS软件包(EMBOSS:The European MolecularBiology Open Software Suite[EMBOSS:欧洲分子生物学开放软件套件],Rice等人,2000,同上)(优选5.0.0版本或更新版本)的Needle程序中所实施的Needleman-Wunsch算法(Needleman和Wunsch,1970,同上)来确定两个核苷酸序列之间的序列同一性(或相应的序列互补性)。使用的参数是空位开放罚分10,空位延伸罚分0.5,以及EDNAFULL(NCBI NUC4.4的EMBOSS版本)取代矩阵。使用Needle标记的“最长同一性”的输出(使用-nobrief选项获得)作为同一性百分比并且计算如下:
(同一的脱氧核糖核苷酸x100)/(比对长度-比对中的空位总数)
为了确定两个互补序列的互补性百分比,需要将两个序列中的一个转换为其互补序列,然后可以使用上述提及的第一序列和第二转换序列之间的同一性百分比计算互补性百分比。
变体:术语“变体”意指在一个或多个(例如,若干个)位置处包含改变(即,取代、插入和/或缺失)的多肽。取代意指用不同的氨基酸替代占用某一位置的氨基酸;缺失意指去除占用某一位置的氨基酸;并且插入意指邻近于并且紧跟着占据一个位置的氨基酸之后添加氨基酸,例如,1-5个氨基酸。
具体实施方式
在第一方面,本发明提供通过阻遏一个或多个目的基因组靶序列的表达来改善微生物宿主细胞的至少一个特性的方法,所述方法包括以下步骤:
I)提供微生物宿主细胞,所述微生物宿主细胞包含待阻遏的一个或多个目的基因组靶序列,其中每个靶序列包含或侧接针对II类Cas9酶的功能性PAM序列;
II)用以下转化所述宿主细胞:
c)编码所述II类Cas9酶的无效核酸酶变体的多核苷酸,
d)编码针对每个待阻遏的靶序列的单指导RNA或指导RNA复合物的多核苷酸,所述单指导RNA或指导RNA复合物包含:
i)第一RNA序列,其包含20个或更多个核苷酸并且包含tracr配对序列,所述核苷酸与至少一个待阻遏的基因组靶序列至少80%互补并且能够与至少一个待阻遏的基因组靶序列杂交,以及
ii)第二RNA序列,其包含与所述tracr配对序列互补并且能够与所述tracr配对序列杂交的tracr序列;
其中所述第一RNA序列的20个或更多个核苷酸与所述一个或多个基因组靶序列杂交,并且其中所述无效核酸酶变体II类Cas9酶与所述单指导RNA或所述指导RNA复合物相互作用并且与所述一个或多个基因组靶序列结合,从而阻遏其表达并改善所述宿主细胞的至少一个特性。
在第二方面,本发明提供具有至少一个改善的特性的微生物宿主细胞,其中一个或多个目的基因组靶序列的表达被阻遏,所述宿主细胞包含:
a)一个或多个被阻遏的目的基因组靶序列,其中每个靶序列包含或侧接针对II类Cas9酶的功能性PAM序列;
b)编码所述II类Cas9酶的无效核酸酶变体的多核苷酸,
c)编码针对每个被阻遏的靶序列的单指导RNA或指导RNA复合物的多核苷酸,所述单指导RNA或指导RNA复合物包含:
iii)第一RNA序列,其包含20个或更多个核苷酸并且包含tracr配对序列,所述核苷酸与至少一个被阻遏的基因组靶序列至少80%互补并且能够与至少一个被阻遏的基因组靶序列杂交,以及
iv)第二RNA序列,其包含与所述tracr配对序列互补并且能够与所述tracr配对序列杂交的tracr序列;
其中所述第一RNA序列的20个或更多个核苷酸与所述一个或多个基因组靶序列杂交,并且其中所述无效核酸酶变体II类Cas9酶与所述单指导RNA或所述指导RNA复合物相互作用并且与所述一个或多个基因组靶序列结合,从而阻遏其表达并改善所述宿主细胞的至少一个特性。
原核宿主细胞
本发明还涉及重组原核宿主细胞,所述原核宿主细胞包含可操作地连接至一个或多个控制序列的本发明的多核苷酸,所述一个或多个控制序列指导本发明的多肽的产生。将包含多核苷酸的构建体或载体引入宿主细胞中,这样使得所述构建体或载体作为染色体整合体或作为自主复制的染色体外载体维持,如本文所述。
术语“宿主细胞”涵盖由于复制期间发生的突变而与亲本细胞不同的亲本细胞的任何后代。
原核宿主细胞可为任何革兰氏阳性或革兰氏阴性细菌。革兰氏阳性细菌包括但不限于:芽孢杆菌属、梭菌属、肠球菌属、土芽孢杆菌属、乳杆菌属、乳球菌属、海洋芽孢杆菌属、葡萄球菌属、链球菌属、和链霉菌属。革兰氏阴性细菌包括但不限于:弯曲杆菌属、大肠杆菌、黄杆菌属、梭杆菌属、螺杆菌属、泥杆菌属、奈瑟氏菌属、假单胞菌属、沙门氏菌属、以及脲原体属。
在本发明的优选的实施例中,芽孢杆菌宿主细胞选自芽孢杆菌属物种组成的组,该组由以下组成:嗜碱芽孢杆菌、高地芽孢杆菌、解淀粉芽孢杆菌、植物解淀粉芽孢杆菌亚种(B.amyloliquefaciens subsp.plantarum)、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚硬芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、甲基营养型芽孢杆菌、短小芽孢杆菌、沙福芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌以及苏云金芽孢杆菌。
将DNA引入芽孢杆菌属细胞中可以通过以下来实现:原生质体转化(参见例如,Chang和Cohen,1979,Mol.Gen.Genet.[分子遗传学与基因组学]168:111-115)、感受态细胞转化(参见例如,Young和Spizizen,1961,J.Bacteriol.[细菌学杂志]81:823-829,或Dubnau和Davidoff-Abelson,1971,J.Mol.Biol.[分子生物学杂志]56:209-221)、电穿孔(参见例如,Shigekawa和Dower,1988,Biotechniques[生物技术]6:742-751)或接合(参见例如,Koehler和Thorne,1987,J.Bacteriol.[细菌学杂志]169:5271-5278)。将DNA引入大肠杆菌细胞中可以通过以下来实现:原生质体转化(参见例如,Hanahan,1983,J.Mol.Biol.[分子生物学杂志]166:557-580)或电穿孔(参见例如,Dower等人,1988,Nucleic AcidsRes.[核酸研究]16:6127-6145)。将DNA引入链霉菌属细胞中可以通过以下来实现:原生质体转化、电穿孔(参见例如,Gong等人,2004,Folia Microbiol.(Praha)[叶线形微生物学(布拉格)]49:399-405)、接合(参见例如,Mazodier等人,1989,J.Bacteriol.[细菌学杂志]171:3583-3585)或转导(参见例如,Burke等人,2001,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]98:6289-6294)。
将DNA引入假单孢菌属细胞中可以通过以下来实现:电穿孔(参见例如,Choi等人,2006,J.Microbiol.Methods[微生物学方法杂志]64:391-397)或接合(参见例如,Pinedo和Smets,2005,Appl.Environ.Microbiol.[应用与环境微生物学]71:51-57)。将DNA引入到链球菌属细胞中可以通过以下来实现:天然感受态(natural competence)(参见,例如,Perry和Kuramitsu,1981,Infect.Immun.[感染与免疫]32:1295-1297)、原生质体转化(参见,例如,Catt和Jollick,1991,Microbios[微生物学]68:189-207)、电穿孔(参见,例如,Buckley等人,1999,Appl.Environ.Microbiol.[应用与环境微生物学]65:3800-3804)、或接合(参见,例如,Clewell,1981,Microbiol.Rev.[微生物学评论]45:409-436)。然而,可以使用本领域已知的将DNA引入宿主细胞中的任何方法。
真菌宿主细胞
宿主细胞可以是真菌细胞。如本文使用的“真菌”包括子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)以及卵菌门(Oomycota)和所有有丝分裂孢子真菌(如由Hawksworth等人所定义的,在:Ainsworth andBisby’s Dictionary of The Fungi[Ainsworth和Bisby的真菌大词典],第8版,1995,CABInternational[国际CAB],University Press[大学出版社],Cambridge[剑桥],英国)。
真菌宿主细胞可为酵母细胞。如本文使用的“酵母”包括产子囊酵母(ascosporogenous yeast)(内孢霉目(Endomycetales))、产担子酵母(basidiosporogenous yeast)和属于半知菌类(Fungi Imperfecti)(芽孢纲(Blastomycetes))的酵母。由于酵母的分类可能在将来变化,出于本发明的目的,酵母应当如Biology and Activities of Yeast[酵母的生物学与活性](Skinner、Passmore和Davenport编辑,Soc.App.Bacteriol.Symposium Series No.9[应用细菌学学会专题论文集系列9],1980)所描述那样定义。
酵母宿主细胞可以是假丝酵母属细胞、汉逊酵母属细胞、克鲁弗酵母属细胞、毕赤酵母属细胞、酵母菌属细胞、裂殖酵母或耶罗维亚酵母属细胞、如乳酸克鲁弗酵母细胞、卡尔酵母细胞、酿酒酵母细胞、糖化酵母细胞、道格拉氏酵母细胞、克鲁弗酵母细胞、诺地酵母细胞、卵形酵母细胞或解脂耶罗维亚酵母细胞。
真菌宿主细胞可为丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门(Oomycota)的亚门的所有丝状形式(如由Hawksworth等人,1995,同上)。丝状真菌通常的特征在于由几丁质、纤维素、葡聚糖、壳多糖、甘露聚糖、以及其他复杂多糖构成的菌丝体壁。营养生长是通过菌丝延长,而碳分解代谢是专性需氧的。相反,酵母(如酿酒酵母)的营养生长是通过单细胞菌体的出芽(budding),而碳分解代谢可以是发酵性的。
丝状真菌宿主细胞可以是枝顶孢属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟腊菌属、金孢子菌属、鬼伞属、革盖菌属(Coriolus)、隐球菌属、线黑粉菌科(Filibasidium)、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新美鞭菌属、链孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属(Trametes)或木霉属细胞。
例如,丝状真菌宿主细胞可以是泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌(Bjerkandera adusta)、干拟蜡菌(Ceriporiopsisaneirina)、卡内基拟蜡菌(Ceriporiopsis caregiea)、浅黄拟蜡孔菌(Ceriporiopsisgilvescens)、潘诺希塔拟蜡菌(Ceriporiopsis pannocinta)、环带拟蜡菌(Ceriporiopsisrivulosa)、微红拟蜡菌(Ceriporiopsis subrufa)、虫拟蜡菌(Ceriporiopsissubvermispora)、狭边金孢子菌(Chrysosporium inops)、嗜角质金孢子菌、卢克诺文思金孢子菌(Chrysosporium lucknowense)、粪状金孢子菌(Chrysosporium merdarium)、毡金孢子菌、昆士兰金孢子菌(Chrysosporium queenslandicum)、热带金孢子菌、褐薄金孢子菌(Chrysosporium zonatum)、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolushirsutus)、杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾谷镰孢、禾赤镰孢(Fusariumgraminum)、异孢镰孢、合欢木镰孢、尖孢镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、疏棉状腐质霉、米黑毛霉、嗜热毁丝霉、粗糙脉孢菌、产紫青霉、黄孢平革菌(Phanerochaete chrysosporium)、射脉菌(Phlebia radiata)、刺芹侧耳(Pleurotus eryngii)、土生梭孢壳霉、长域毛栓菌(Trametes villosa)、变色栓菌(Trametes versicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、或绿色木霉细胞。
真菌细胞可以通过以下过程转化,所述过程涉及原生质体形成、原生质体的转化、以及以本身已知的方式的细胞壁的再生。用于转化曲霉属和木霉属宿主细胞的合适的程序描述于以下文献中:EP 238023,Yelton等人,1984,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]81:1470-1474以及Christensen等人,1988,Bio/Technology[生物/技术]6:1419-1422。用于转化镰孢属物种的合适的方法由Malardier等人,1989,Gene[基因]78:147-156和WO 96/00787描述。可使用由如以下文献描述的程序转化酵母:Becker和Guarente,于Abelson,J.N.和Simon,M.I.编辑,Guide to Yeast Genetics and MolecularBiology[酵母遗传学与分子生物学指南],Methods in Enzymology[酶学方法],第194卷,第182-187页,Academic Press,Inc.[学术出版社有限公司],New York[纽约];Ito等人,1983,J.Bacteriol.[细菌学杂志]153:163;以及Hinnen等人,1978,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]75:1920。
基因组靶序列
通过本发明的方法修饰的至少一个基因组靶序列的长度为至少20个核苷酸,以允许其与对应的20个核苷酸序列的指导RNA杂交。所述至少一个待修饰的基因组靶序列可以位于基因组中的任何位置,但通常位于编码序列或可读框内。
所述至少一个待修饰的基因组靶序列需要具有位于其旁边的合适的原型间隔子相邻基序(PAM)以允许相应的无效核酸酶变体II类Cas9酶与靶标的切口结合。
有关其他PAM序列的综述,参见,例如,Shah等人,2013,Protospacer recognitionmotifs[原型间隔子识别基序],RNA Biol.[RNA生物学]10(5):891-899。
在本发明的优选的实施例中,改善的特性是改善的转化效率、减少的蛋白酶表达、和/或改善的由所述宿主细胞产生的异源多肽的生产力或产率;优选地,异源多肽是选自下组的一种或多种酶,该组由以下组成:水解酶、异构酶、连接酶、裂解酶、氧化还原酶、或转移酶;最优选地,所述酶是α-淀粉酶、α-半乳糖苷酶、α-葡糖苷酶、氨肽酶、淀粉酶、天冬酰胺酶、β-半乳糖苷酶、β-葡糖苷酶、β-木糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、绿色荧光蛋白、葡聚糖转移酶、葡糖淀粉酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶、氧化酶、果胶分解酶、过氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、或木聚糖酶。
优选地,如果微生物宿主细胞是芽孢杆菌宿主细胞,则待阻遏的一个或多个目的基因组靶序列包含mecA和/或yjbH基因或其同系物,如本文列举的。待阻遏的其他优选的目的基因组靶序列包含蛋白酶编码基因,尤其是如果表达,则可以降解重组产生的多肽的细胞溶质、分泌或膜结合蛋白酶。
在本发明的优选的实施例中,待阻遏的一个或多个基因组靶序列包含至少20个核苷酸;优选地,所述待阻遏的一个或多个基因组靶序列包含在编码多肽的可读框中。
无效核酸酶变体II类Cas9
若干个II类Cas9类似物或同系物是已知的,并且随着近几年科学兴趣增加被更多发现;在Makarova等人的综述(20015,An updated evolutionary classification ofCRISPR-Cas systems[CRISPR-Cas系统的更新的进化分类],Nature[自然]13:722-736)中提供。
化脓性链霉菌(Streptomyces pyogenes)的Cas9酶是一种标准II类Cas9酶并且迄今为止具有最佳特征。通过在位置10:D10A处取代单个氨基酸,天冬氨酸替代丙氨酸,开发了仅具有一个活性核酸酶结构域(与野生型酶中的两个活性结构域相反)的这种酶的变体。通过在位置840:H840A处取代单个氨基酸,组氨酸替代丙氨酸,开发了仅具有一个活性核酸酶结构域(与野生型酶中的两个活性结构域相反)的这种酶的另一种变体。双取代的(D10A、H840A)变体是无效核酸酶变体。预期其他II类Cas9酶可以被类似地修饰。
因此,在优选的实施例中,II类Cas9酶的无效核酸酶变体在对应于化脓性链霉菌Cas9氨基酸序列中的位置10的氨基酸位置处包含取代;优选地,所述II类Cas9酶的无效核酸酶变体在化脓性链霉菌Cas9氨基酸序列中包含天冬氨酸取代丙氨酸,D10A。还优选地,II类Cas9酶的无效核酸酶变体在对应于化脓性链霉菌Cas9氨基酸序列中的位置840的氨基酸位置处包含取代;优选地,所述II类Cas9酶的所述无效核酸酶变体在化脓性链霉菌Cas9氨基酸序列中包含组氨酸取代丙氨酸,H840A。
在优选的实施例中,一个或多个目的基因组靶序列被II类Cas9酶的温度敏感无效核酸酶变体瞬时阻遏;优选地,所述II类Cas9酶的所述温度敏感无效核酸酶变体在如下温度不能与所述一个或多个基因组靶序列结合:高于35℃;优选地,高于36℃;高于37℃;高于38℃;高于39℃;高于40℃;高于41℃;高于42℃;高于43℃;高于44℃;或最优选地,高于45℃。
指导RNA
CRISPR-Cas9基因组编辑中的指导RNA构成了可重复编程的部分,使得系统如此通用。在天然化脓链球菌系统中,指导RNA实际上是两种RNA多核苷酸的复合物,第一crRNA含有约20个核苷酸,其确定了Cas9酶的特异性以及与crRNA杂交以形成与Cas9相互作用的RNA复合物的tracr RNA。参见Jinek等人,2012,A programmable dual-RNA-guided DNAendonuclease in adaptive bacterial immunity[在自适应细菌免疫中的可编程双重-RNA-指导的DNA核酸内切酶].Science[科学].337:816-821。术语crRNA和tracrRNA在本文中与术语tracr-配对RNA和tracr RNA可互换地使用。
由于CRISPR-Cas9系统的发现,单个多核苷酸指导RNA已经被开发并成功应用,与天然两部分指导RNA复合物一样有效。
在优选的实施例中,所述单指导RNA或RNA复合物包含第一RNA,所述第一RNA包含与所述一个或多个基因组靶序列至少85%互补并且能够与所述一个或多个基因组靶序列杂交的20个或更多个核苷酸;优选地,所述20个或更多个核苷酸与所述一个或多个基因组靶序列至少90%、95%、97%、98%、99%或甚至100%互补并且能够与所述一个或多个基因组靶序列杂交。
在另一个优选的实施例中,芽孢杆菌宿主细胞包含单指导RNA,所述单指导RNA包含单个多核苷酸形式的第一和第二RNA,并且其中当彼此杂交时,tracr配对序列和tracr序列形成茎环结构。
多重化
在优选的实施例中,宿主细胞中的两种或更多种基因组靶序列被阻遏。
多核苷酸
用于分离或克隆多核苷酸的技术是本领域中已知的且包括从基因组DNA或cDNA或其组合进行分离。可以例如通过使用熟知的聚合酶链反应(PCR)或表达文库的抗体筛选来检测具有共有结构特征的克隆DNA片段,实现从基因组DNA克隆多核苷酸。参见例如,Innis等人,1990,PCR:A Guide to Methods and Application[方法和应用指南],AcademicPress[学术出版社],New York[纽约]。可以使用其他核酸扩增程序如连接酶链式反应(LCR)、连接激活转录(LAT)和基于多核苷酸的扩增(NASBA)。所述多核苷酸可以是,例如可以是所述多核苷酸的多肽编码区的等位基因或物种变体。
编码本发明多肽的多核苷酸的修饰对于合成基本上类似于所述多肽的多肽可以是必需的。术语“基本上类似”于所述多肽是指多肽的非天然存在的形式。这些多肽可以因某种工程化方式而与从其天然来源分离的多肽不同,例如在比活性、热稳定性、最适pH等方面不同的变体。可以如下构建变体:基于作为成熟多肽编码序列(例如,其子序列)所提出的多核苷酸,和/或通过引入核苷酸置换,所述核苷酸置换不导致多肽的氨基酸序列变化,但是对应于旨在用于产生酶的宿主生物体的密码子使用,或通过引入可以产生不同氨基酸序列的核苷酸置换。对于核苷酸取代的一般描述,参见例如Ford等人,1991,ProteinExpression and Purification[蛋白质表达与纯化]2:95-107。
核酸构建体
本发明还涉及核酸构建体,所述核酸构建体包含可操作地连接至一个或多个控制序列的某些多核苷酸,所述控制序列指导编码序列表达。
可用许多方式操作所述多核苷酸以提供多肽的表达。取决于表达载体,在多核苷酸插入载体之前对其进行操作可为希望的或必需的。用于利用重组DNA方法修饰多核苷酸的技术是本领域已知的。
所述控制序列可为启动子,即,被宿主细胞识别用于表达编码本发明多肽的多核苷酸的多核苷酸。所述启动子包含转录控制序列,其介导所述多肽的表达。启动子可以是在宿主细胞中显示出转录活性的任何多核苷酸,包括突变型、截短型和杂合型启动子,并且可以从编码与宿主细胞同源或异源的细胞外或细胞内多肽的基因获得。
用于在细菌宿主细胞中指导本发明核酸构建体的转录的合适启动子的实例是从以下基因中获得的启动子:解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌α-淀粉酶基因(amyL)、地衣芽孢杆菌青霉素酶基因(penP)、嗜热脂肪芽孢杆菌产麦芽糖淀粉酶基因(amyM)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、枯草芽孢杆菌xylA和xylB基因、苏云金芽孢杆菌cryIIIA基因(Agaisse和Lereclus,1994,Molecular Microbiology[分子微生物学]13:97-107)、大肠杆菌lac操纵子、大肠杆菌trc启动子(Egon等人,1988,Gene[基因]69:301-315)、天蓝链霉菌琼脂水解酶基因(dagA)和原核β-内酰胺酶基因(Villa-Kamaroff等人,1978,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]75:3727-3731)以及tac启动子(DeBoer等人,1983,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]80:21-25)。其他启动子描述于Gilbert等人,1980,Scientific American[科学美国人]242:74-94的“Usefulproteins from recombinant bacteria[来自重组细菌的有用蛋白质]”;和在Sambrook等人,1989,同上。串联启动子的实例披露于WO 99/43835中。
在丝状真菌宿主细胞中,用于指导本发明的核酸构建体的转录的合适启动子的实例是从以下酶的基因获得的启动子:构巢曲霉(Aspergillus nidulans)乙酰胺酶、黑曲霉(Aspergillus niger)中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉(Aspergillus awamori)葡萄糖淀粉酶(glaA)、米曲霉(Aspergillus oryzae)TAKA淀粉酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、尖孢镰孢(Fusarium oxysporum)胰蛋白酶-样蛋白酶(WO 96/00787)、镶片镰孢(Fusarium venenatum)淀粉葡糖苷酶(WO 00/56900)、镶片镰孢Daria(WO 00/56900)、镶片镰孢Quinn(WO 00/56900)、米黑根毛霉(Rhizomucormiehei)脂肪酶、米黑根毛霉天冬氨酸蛋白酶、里氏木霉(Trichoderma reesei)β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶,以及里氏木霉翻译延长因子,以及NA2-tpi启动子(来自曲霉属中性α-淀粉酶基因的经修饰的启动子,其中未翻译的前导序列已经用来自曲霉属丙糖磷酸异构酶基因的未翻译的前导序列替换;非限制性实例包括来自黑曲霉中性α-淀粉酶的基因的经修饰的启动子,其中未翻译的前导序列已经用来自构巢曲霉或米曲霉丙糖磷酸异构酶基因的未翻译的前导序列替换);及其突变型、截短型及杂合型启动子。其他启动子在美国专利号6,011,147中描述。
在酵母宿主中,从以下酶的基因获得有用的启动子:酿酒酵母(Saccharomycescerevisiae)烯醇化酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母乙醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1,ADH2/GAP)、酿酒酵母磷酸丙糖异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)、和酿酒酵母3-磷酸甘油酸激酶。酵母宿主细胞的其他有用的启动子由Romanos等人,1992,Yeast[酵母]8:423-488描述。
控制序列也可为由宿主细胞识别以终止转录的转录终止子。所述终止子可操作地连接到编码所述多肽的多核苷酸的3'-末端。在宿主细胞中有功能的任何终止子可用于本发明中。
细菌宿主细胞的优选终止子从以下酶的基因获得:克劳氏芽孢杆菌碱性蛋白酶(aprH)、地衣芽孢杆菌α-淀粉酶(amyL)、和大肠杆菌核糖体RNA(rrnB)。
用于丝状真菌宿主细胞的优选终止子从以下酶的基因获得:构巢曲霉乙酰胺酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶、尖孢镰孢胰蛋白酶-样蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶以及里氏木霉翻译延长因子。
用于酵母宿主细胞的优选的终止子从以下酶的基因获得:酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYC1)、以及酿酒酵母甘油醛-3-磷酸脱氢酶。酵母宿主细胞的其他有用的终止子由Romanos等人,1992,同上描述。
所述控制序列还可以是在启动子下游并且在基因编码序列上游的mRNA稳定子区域,它增加所述基因的表达。
合适的mRNA稳定子区域的实例从以下获得:苏云金芽孢杆菌cryIIIA基因(WO 94/25612)和枯草芽孢杆菌SP82基因(Hue等人,1995,Journal of Bacteriology[细菌学杂志]177:3465-3471)。
控制序列也可以是前导子,即对宿主细胞翻译很重要的mRNA的非翻译区域。所述前导子可操作地连接至编码所述多肽的多核苷酸的5'-末端。可以使用在宿主细胞中有功能的任何前导序列。
用于丝状真菌宿主细胞的优选前导序列从米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶的基因获得。
酵母宿主细胞的合适的前导序列从以下酶的基因获得:酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α因子、和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。
控制序列也可以是多聚腺苷化序列,一种与多核苷酸3’-末端可操作地连接并在转录时由宿主细胞识别为向转录的mRNA添加聚腺苷酸残基的信号序列。可以使用在宿主细胞中有功能的任何聚腺苷酸化序列。
用于丝状真菌宿主细胞的优选聚腺苷酸化序列从以下酶的基因获得:构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶以及尖孢镰孢胰蛋白酶样蛋白酶。
酵母宿主细胞的有用的多聚腺苷酸化序列由Guo和Sherman,1995,Mol.CellularBiol.[分子细胞生物学]15:5983-5990描述。
控制序列也可为编码与多肽的N-末端连接的信号肽并指导多肽进入细胞的分泌途径的信号肽编码区。多核苷酸的编码序列的5'-端可固有地含有在翻译阅读框中与编码多肽的编码序列的区段天然地连接的信号肽编码序列。可替代地,编码序列的5'-端可含有对于编码序列为外源的信号肽编码序列。在编码序列天然地不含有信号肽编码序列的情况下,可能需要外源信号肽编码序列。可替代地,外源信号肽编码序列可以单纯地替代天然信号肽编码序列以便增强多肽的分泌。然而,可以使用指导已表达多肽进入宿主细胞的分泌途径的任何信号肽编码序列。
用于细菌宿主细胞的有效信号肽编码序列是从以下酶的基因获得的信号肽编码序列:芽孢杆菌NCIB 11837生麦芽糖淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌α-淀粉酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)和枯草杆菌prsA。另外的信号肽由Simonen和Palva,1993,Microbiological Reviews[微生物评论]57:109-137描述。
用于丝状真菌宿主细胞的有效的信号肽编码序列是从以下酶的基因获得的信号肽编码序列:黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V、疏棉状腐质霉脂肪酶和米黑根毛霉(Rhizomucormiehei)天冬氨酸蛋白酶。
用于酵母宿主细胞的有用的信号肽从酿酒酵母α-因子和酿酒酵母转化酶的基因获得。其他的有用的信号肽编码序列由Romanos等人,1992,同上描述。
控制序列也可以是编码位于多肽N-末端处的前肽的前肽编码序列。生成的多肽被称为前体酶(proenzyme)或多肽原(或在一些情况下被称为酶原(zymogen))。多肽原通常是无活性的并且可通过催化切割或自身催化切割来自多肽原的前肽而转化为活性多肽。前肽编码序列可以从以下酶的基因获得:枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、嗜热毁丝霉漆酶(Myceliophthora thermophila laccase)(WO 95/33836)、米黑根毛霉天冬氨酸蛋白酶(Rhizomucor miehei aspartic proteinase)和酿酒酵母(Saccharomyces cerevisiae)α-因子。
在信号肽序列和前肽序列二者都存在的情况下,所述前肽序列位于紧邻多肽的N-末端且所述信号肽序列位于紧邻所述前肽序列的N-末端。
也可为希望的是添加调节序列,所述调节序列调节宿主细胞生长相关的多肽的表达。调节序列的实例是引起基因表达以响应于化学或物理刺激(包括调节化合物的存在)而开启或关闭的那些。原核系统中的调节序列包括lac、tac以及trp操纵子系统。在酵母中,可以使用ADH2系统或GAL1系统。在丝状真菌中,可以使用黑曲霉葡糖淀粉酶启动子、米曲霉TAKA α-淀粉酶启动子和米曲霉葡糖淀粉酶启动子、里氏木霉纤维二糖水解酶I启动子以及里氏木霉纤维二糖水解酶II启动子。调节序列的其他实例是那些允许基因扩增的那些序列。在真核系统中,这些调节序列包括在甲氨蝶呤存在下扩增的二氢叶酸还原酶基因以及用重金属扩增的金属硫蛋白基因。在这些情况中,编码多肽的多核苷酸会与调节序列可操作地连接。
表达载体
本发明还涉及包含本发明的多核苷酸、启动子、以及转录和翻译终止信号的重组表达载体。多个核苷酸和控制序列可连接在一起以产生重组表达载体,其可包括一个或多个便利的限制位点以允许编码所述多肽的多核苷酸在此类位点处的插入或取代。可替代地,多核苷酸可通过将所述多核苷酸或包含所述多核苷酸的核酸构建体插入用于表达的适当载体中来表达。在产生所述表达载体时,所述编码序列位于所述载体中使得所述编码序列与所述用于表达的适当控制序列可操作地连接。
重组表达载体可以是可方便地经受重组DNA程序并且可引起多核苷酸表达的任何载体(例如,质粒或病毒)。载体的选择将典型地取决于载体与待引入载体的宿主细胞的相容性。载体可以是线状或闭合的环状质粒。
载体可以是自主复制载体,即作为染色体外实体存在的载体,其复制独立于染色体复制,例如质粒、染色体外元件、微染色体或人工染色体。载体可以含有用于确保自我复制的任何装置。可替代地,载体可以是这样的载体,当它引入宿主细胞中时整合入基因组中并与其中已整合了它的一个或多个染色体一起复制。此外,可以使用单独的载体或质粒或两个或更多个载体或质粒,其共同含有待引入宿主细胞基因组的总DNA,或可以使用转座子。
载体优选地含有允许方便地选择转化细胞、转染细胞、转导细胞等细胞的一个或多个选择性标志。选择性标志是一种基因,其产物提供了杀生物剂抗性或病毒抗性、对重金属抗性、对营养缺陷型的原养性等。
细菌选择性标志的实例是地衣芽孢杆菌或枯草芽孢杆菌dal基因、或赋予抗生素抗性(如氨苄青霉素、氯霉素、卡那霉素、新霉素、大观霉素、或四环素抗性)的标志。酵母宿主细胞的合适的标志包括但不限于:ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于丝状真菌宿主细胞中的选择性标志包括但不限于:adeA(磷酸核糖酰氨基咪唑-琥珀酸甲酰胺合酶)、adeB(磷酸核糖酰-氨基咪唑合酶)、amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草丁膦乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清酸核苷-5'-磷酸脱羧酶)、sC(硫酸腺苷酰基转移酶)、以及trpC(邻氨基苯甲酸合酶)、以及其等效物。优选地用于曲霉细胞中的是构巢曲霉或米曲霉amdS和pyrG基因以及吸水链霉菌bar基因。优选地用于木霉属细胞的是adeA、adeB、amdS、hph以及pyrG基因。
选择性标志可以是如描述于WO 2010/039889中的双选择性标志系统。在一方面,双选择性标志是hph-tk双选择性标志系统。
载体优选地含有允许载体整合到宿主细胞的基因组中或载体在细胞中独立于基因组自主复制的一个或多个元件。
对于整合到所述宿主细胞基因组中,所述载体可以依靠编码所述多肽的多核苷酸序列或用于通过同源或非同源重组整合到所述基因组中的所述载体的任何其他元件。可替代地,所述载体可含有用于指导通过同源重组而整合入宿主细胞基因组中的一个或多个染色体中的一个或多个精确位置处的另外的多核苷酸。为了增加在精确位置整合的可能性,整合的元件应包含足够数量的核酸,如100至10,000个碱基对、400至10,000个碱基对、以及800至10,000个碱基对,其与相应的靶序列具有高度的序列同一性以增强同源重组的可能性。整合元件可以是与宿主细胞基因组内的靶序列同源的任何序列。此外,整合元件可以是非编码多核苷酸或编码多核苷酸。另一个方面,载体可以通过非同源重组整合入宿主细胞的基因组中。
对于自主复制,载体可以进一步包含使载体能够在所讨论的宿主细胞中自主地进行复制的复制起点。复制起点可为在细胞中有功能的介导自主复制的任何质粒复制子。术语“复制起点”或“质粒复制子”意指使质粒或载体能够在体内复制的多核苷酸。
细菌复制起点的实例是容许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177和pACYC184的复制起点,以及容许在芽孢杆菌属中复制的质粒pUB110、pE194、pTA1060和pAMβ1。
用于酵母宿主细胞中的复制起点的实例是2微米复制起点、ARS1、ARS4、ARS1与CEN3的组合、及ARS4与CEN6的组合。
用于丝状真菌细胞中的复制起点的实例是AMA1和ANS1(Gems等人,1991,Gene[基因]98:61-67;Cullen等人,1987,Nucleic Acids Res.[核酸研究]15:9163-9175;WO 00/24883)。可根据WO 00/24883中披露的方法完成AMA1基因的分离和包含所述基因的质粒或载体的构建。
可将本发明多核苷酸的多于一个拷贝插入宿主细胞以增加多肽的产生。通过将序列的至少一个另外的拷贝整合到宿主细胞基因组中或者通过包括与所述多核苷酸一起的可扩增的选择性标志基因可以获得多核苷酸的增加的拷贝数目,其中通过在适当的选择性试剂的存在下培养细胞可以选择含有选择性标志基因的经扩增的拷贝的细胞、以及由此所述多核苷酸的另外的拷贝。
用于连接以上所描述的元件以构建本发明的重组表达载体的方法是本领域的技术人员熟知的(参见,例如,Sambrook等人,1989,同上)。
产生方法
本发明还涉及产生本发明的多肽的方法,所述方法包括(a)在有益于产生所述多肽的条件下培养本发明的重组宿主细胞;和任选地(b)回收所述多肽。
宿主细胞是在合适于使用本领域中已知的方法产生多肽的营养培养基中培养的。例如,可通过摇瓶培养、或在实验室或工业发酵器中小规模或大规模发酵(包括连续、分批、补料分批或固态发酵)培养细胞,所述培养在合适的培养基中并且在允许表达和/或分离多肽的条件下进行。使用本领域中已知的程序,培养发生在包含碳和氮来源及无机盐的合适的营养培养基中。合适的培养基可从商业供应商获得或可以根据公开的组成(例如,在美国典型培养物保藏中心(American Type Culture Collection)的目录中)制备。如果多肽被分泌到所述营养培养基中,那么可以直接从所述培养基中回收多肽。如果多肽不进行分泌,那么其可以从细胞裂解液中进行回收。
可以使用本领域已知的对于所述多肽是特异性的方法来检测多肽。这些检测方法包括但不限于:特异性抗体的使用、酶产物的形成或酶底物的消失。例如,可以使用酶测定来确定多肽的活性。
可使用本领域已知的方法来回收多肽。例如,可通过常规方法,包括但不限于,收集、离心、过滤、提取、喷雾干燥、蒸发或沉淀,从营养培养基回收多肽。在一方面,回收包含多肽的发酵液。
可通过本领域已知的多种方法纯化多肽以获得基本上纯的多肽,所述方法包括但不限于层析(例如,离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如,制备型等电聚焦)、差示溶解度(例如,硫酸铵沉淀)、SDS-PAGE或提取(参见,例如,ProteinPurification[蛋白质纯化],Janson和Ryden编辑,VCH Publishers[VCH出版公司],纽约,1989)。
在一个替代性方面,不回收多肽,而是将表达所述多肽的本发明的宿主细胞用作多肽的来源。
实例
用于实例1-5的材料和方法
培养基
使芽孢杆菌属菌株生长在LB琼脂板上(10g/l胰蛋白胨、5g/l酵母提取物、5g/lNaCl、15g/l琼脂)或生长于LB液体培养基(10g/l胰蛋白胨、5g/l酵母提取物、5g/l NaCl)中。在一些实验中,通过添加5g/l淀粉、20ml/l的20%葡萄糖和10ml/l的1M K2PO4,将LB补充磷酸盐、葡萄糖和淀粉(LBPGS)。
为了选择红霉素抗性,将琼脂培养基补充1μg/ml红霉素并且将液体培养基补充2μg/ml红霉素。为了选择氯霉素抗性,将琼脂和液体培养基补充6μg/ml氯霉素。
为了筛选蛋白酶表型,将琼脂板补充1%脱脂乳,以允许圈形成在产生蛋白酶的菌落附近。
Spizizen I-木糖培养基由以下组成:1x Spizizen盐(6g/l KH2PO4、14g/lK2HPO4、2g/l(NH4)2SO4、1g/l柠檬酸钠、0.2g/l MgSO4,pH 7.0)、1%木糖、0.1%酵母提取物以及0.02%酪蛋白水解物。
Spizizen II-木糖培养基由补充有0.5mM CaCl2和2.5mM MgCl2和2mM EGTA的Spizizen I-木糖培养基组成。
菌株
-JA1622:这种菌株是具有破坏的spoIIAC基因(sigF)的枯草芽孢杆菌168衍生物JA578,其描述于WO 02/00907中。所述基因型是:amyE::repF(pE194)、spoIIAC。
-MOL3188:JA1622+pMOL3188
-AEB708:枯草芽孢杆菌,其中通过染色体转化,将来自地衣芽孢杆菌的M.Bli1904II DNA甲基转移酶基因插入amyE基因座处(WO 2015/004013)
-MOL3190:AEB1517与pMOL3188
-SJ8039:枯草芽孢杆菌接合供体PP289-5+pSJ8017,其描述于WO 2007/138049中。所述质粒用于使地衣芽孢杆菌中的catL缺失
-SJ1904:这种菌株是描述于WO 2008/066931中的地衣芽孢杆菌菌株。编码碱性蛋白酶的基因(aprL)是失活的。
-MOL3026:具有catL缺失的SJ1904(描述于实例2中)
-TaHy9:如在WO 2015/004013中描述的具有mecA缺失的地衣芽孢杆菌SJ1904
-MOL3027:具有catL缺失的TaHy9菌株(描述于实例2中)
-MOL3053:描述于WO 2015/004013中的地衣芽孢杆菌菌株整合到阿拉伯糖操纵子上的蛋白酶基因aprH。
-MOL3192:MOL3026+forD-cas9d(描述于实例3中)
-MOL3193:MOL3027+forD-cas9d(描述于实例3中)
-MOL3198:MOL3027+ara:aprH-erm(描述于实例4和图2中)。
质粒
pC194:从金黄色葡萄球菌中分离的质粒(Horinouchi和Weisblum,1982)。
pE194:从金黄色葡萄球菌中分离的质粒(Horinouchi和Weisblum,1982)。
pUB110:分离的质粒(McKenzie等人,1987)
pMOL3188:描述于实验1和图1中
pSJ8017:描述于WO 2007/138049中。
分子生物学方法
通过如在以下描述的标准分子生物学方法进行DNA操纵和转化:
·Sambrook等人(1989):Molecular cloning:A laboratory manual.[分子克隆:实验室手册]Cold Spring Harbor laboratory[冷泉港实验室],Cold Spring Harbor[冷泉港],纽约。
·Ausubel等人(编辑)(1995):Current protocols in Molecular Biology.[分子生物学现代方法]John Wiley and Sons[约翰威利父子出版公司]。
·Harwood和Cutting(编辑)(1990):Molecular Biological Methods forBacillus.[芽孢杆菌属的分子生物学方法]John Wiley and Sons[约翰威利父子出版公司]。
用于DNA操纵的酶是从新英格兰生物实验室公司(New England Biolabs,Inc.)获得的并且基本上如供应商推荐的进行使用。
枯草芽孢杆菌的感受态细胞和转化是如在以下文献中所描述的来获得,Yasbin等人,1975,Transformation and transfection in lysogenic strains of Bacillussubtilis:evidence for selective induction of prophage in competent cells[枯草芽孢杆菌的溶原性菌株中的转化和转染:感受态细胞中原噬菌体选择性诱导的证据],J.Bacteriol[细菌学杂志].121:296-304。
根据先前描述的方法(Pitcher等人,同上)或通过使用从凯杰公司(Qiagen)可商购的QIAamp DNA血液试剂盒,从以上若干红霉素敏感分离体中制备基因组DNA。
表1.实例1-5的序列综述。
实例1.靶向地衣芽孢杆菌中的mecA的Cas9d和指导RNA载体
较早前已经描述了地衣芽孢杆菌中的mecA缺失将导致菌株的更有效的感受态发展(WO 2015/004013)。然而,mecA的缺失并不总是希望的,因为mecA缺陷菌株显示出轻微改变的生长特征和降低的酶表达潜力。在实例1-5中,显示了mecA基因的可替代阻遏,其中利用了CRISPR-抑制系统。
通过用以下列出的引物、模板和合成DNA(生命技术公司(LifeTechnologies))进行SOE-PCR,将质粒组装,并且保持cas9d基因(SEQ ID NO:30)的合成版本,其编码与野生型Cas9相比具有两个氨基酸取代的D10A和H840A的Cas9d多肽,从而使两种核酸酶活性失活。通过来自地衣芽孢杆菌的forD启动子来控制cas9d基因。来自amyQ(解淀粉芽孢杆菌)的启动子的共有版本控制指导RNA(gRNA)的表达,所述指导RNA具有针对mecA启动子的识别位点:tcttacaaagaagggaaggt(片段3中的核苷酸95至115;SEQ ID NO:3),随后是Cas9PAM序列:gtt。用于选择染色体插入的cat标志从质粒pC194扩增,并且保持起点和复制功能的质粒骨架从pE194扩增。插入来自质粒pUB110的oriT区域以允许如较早前所述的接合(WO 96/29418)。完整pMOL3188序列列于SEQ ID NO:29中。pMOL3188的质粒图谱显示在图1中。
表2:用于组装质粒pMOL3188的SOE-PCR策略
实例2.菌株SJ1904和TaHy9中的catL基因的缺失
通过来自枯草芽孢杆菌供体菌株SJ8039的接合,将质粒pSJ8017转化到两种地衣芽孢杆菌菌株SJ1904和TaHy9中。如较早前所述的进行接合(WO 2007/138049)。接合后,将质粒整合并在SJ1904和TaHy9的染色体上的catL基因座处切割,以用通过质粒pSJ8017递送的缺失版本替换功能性catL基因。将catL缺失的地衣芽孢杆菌菌株SJ1904和TaHy9分别保存为MOL3026和MOL3027。
实例3.在菌株MOL3026和MOL3027中的pMOL3188至forD的接合
将SOE-PCR组装的质粒pMOL3188转化到感受态枯草芽孢杆菌JA1622中,选择对红霉素和氯霉素有抗性的。通过限制性消化分析和DNA测序来测试转化体。将保留质粒pMOL3188的菌株命名为MOL3188。将此菌株用作通过接合转化的质粒的供体。
根据先前描述的方法(美国专利号5,843,720),通过染色体整合和切割将温度敏感质粒pMOL3188整合入地衣芽孢杆菌MOL3026和MOL3027的基因组中。使含有质粒pMOL3188的地衣芽孢杆菌转化体在50℃、在LBPGS选择性培养基(cam)上生长。基于其在50℃、在LBPGS氯霉素选择性培养基上生长的能力来选择所希望的整合体。然后,使整合体于34℃无选择性地生长在LBPGS培养基中,以允许切割整合的质粒。将细胞铺在LBPGS板上并针对红霉素敏感性和氯霉素抗性进行筛选。
从若干种红霉素敏感的分离体制备基因组DNA。基因组PCR证实了cas9d-gRNA(mecA)盒在MOL3026和MOL3027的forD基因座中的插入。将所得验证的菌株分别指定为MOL3192和MOL3193。
实例4:在菌株MOL3027的阿拉伯糖操纵子中具有erm标志的aprH表达盒的构建
将具有来自克劳氏芽孢杆菌aprH的碱性蛋白酶的表达盒与erm标志一起插入上述MOL3027染色体的ara基因座中。将SOE产物如下表所列组装并如上所述直接转化为感受态MOL3027。用PCR验证erm板上的菌落并冷冻为MOL3198。
表3.用于将aprH基因和erm基因插入地衣芽孢杆菌MOL3027的ara操纵子中的SOE-PCR策略
实例5:用mecA的组成型CRISPRi阻遏的菌株MOL3192和MOL3193的转化效率
将地衣芽孢杆菌菌株MOL3026、MOL3027、MOL3192和MOL3193涂布在LB琼脂板上以在37℃孵育过夜后获得汇合生长。
孵育过夜后,向每个板中添加大约2-3ml的Spizizen I-木糖培养基。将细胞使用无菌涂布器刮出并且转移进15ml Falcon 2059管中。使用大约500μl的每种培养悬浮液来孵育50ml Spizizen I-木糖培养基。使用Klett光密度计监测生长。在对应于Klett单位140、160、180及200的每个细胞密度处,向Falcon 2059管中添加250μl的培养物加包含2mMEGTA的250μl Spizizen II-木糖培养基。
向每个管中添加一微克的转化的地衣芽孢杆菌MOL3147染色体DNA(含有整合在ara基因座处的erm抗性表达盒)。将管在37℃在设置为250rpm的旋转摇床上孵育1小时。将转化反应物铺在包含1μg/ml的erm的LB琼脂板上。第二天对菌落计数,以确定转化效率。
如下表可见,与对照菌株MOL3026不同,包含具有对抗mecA的指导RNA的CRISPRi盒的MOL3192菌株可以用基因组DNA转化。两个阳性对照菌株MOL3027和MOL3193都具有mecA缺失并且可以用gDNA转化,如预期的以及如较早前在WO2015/004013中对于mecA缺失的菌株的描述。
表4.转化频率作为cfu/μg的基因组DNA(gDNA)。
用于实例6-13的材料和方法
先前已经显示,枯草芽孢杆菌宿主细胞中yjbH的失活改善了α淀粉酶的生产力或产率(WO 00/63346)。在以下实例中,我们采用CRISPR干扰在重组枯草芽孢杆菌宿主细胞中沉默yjbH表达,从而改善异源α淀粉酶的生产力或产率。
以下实例6和7概述了这项工作中质粒的构建。实例8-12概述了菌株的构建,并且实例13显示了结果。
菌株
将大肠杆菌StellarTM感受态细胞(克罗泰克实验室公司(Clontech laboratories),山景城(Mountain View),加利福尼亚州)用于常规质粒构建和繁殖中。
将枯草芽孢杆菌RB128用作建立基于Cas9的基因沉默的宿主;此菌株是根据美国专利号5,891,701的方法获得的枯草芽孢杆菌A164Δ5菌株(在spollAC、aprE、nprE、amyE和srfC基因处缺失的枯草芽孢杆菌ATCC 6051A)。枯草芽孢杆菌菌株RB128含有编码芽孢杆菌产麦芽糖淀粉酶的异源基因。
培养基:
使芽孢杆菌菌株生长在TBAB(胰蛋白胨血琼脂基质,Difco实验室,斯帕克斯(Sparks),马里兰州(MD),美国)或LB琼脂(10g/l胰蛋白胨、5g/l酵母提取物、5g/l NaCl,15g/l琼脂)板上或生长于LB液体培养基(10g/l胰蛋白胨、5g/l酵母提取物、5g/l NaCl)中。
为了选择红霉素抗性,将琼脂培养基补充1μg/ml红霉素+25μg/ml洁霉素并且将液体培养基补充5μg/ml红霉素。为了选择氯霉素抗性,将琼脂和液体培养基两者补充5μg/ml氯霉素。
Spizizen I培养基由以下组成:1x Spizizen盐(6g/l KH2PO4、14g/l K2HPO4、2g/l(NH4)2SO4、1g/l柠檬酸钠、0.2g/l MgSO4,pH 7.0)、0.5%葡萄糖、0.1%酵母提取物以及0.02%酪蛋白水解物。
Spizizen II培养基由补充有0.5mM CaCl2和2.5mM MgCl2的Spizizen I培养基组成。
根据制造商的建议,使用55g/l乳杆菌MRS肉汤(贝迪公司(Becton,Dickinson andCompany),富兰克林湖(Franklin Lakes),新泽西州(NJ))制备MRS培养基。
感受态细胞的制备和转化:
将枯草芽孢杆菌RB128在37℃孵育过夜后,将其涂布在LB琼脂平板上以获得单菌落。孵育过夜后,用一个菌落孵育10ml的LB培养基。第二天,将大约500μl的此培养物用于孵育50ml Spizizen I培养基。使用Klett光密度计监测生长。当细胞进入稳定期时立即收获细胞并用于孵育Spizizen II培养基。使Spizizen II培养物另外生长90分钟。收获细胞并立即用于转化或以500μl等分试样在15%甘油中冷冻。
向500μl感受态细胞中添加含有2mM EGTA的500μl Spizizen II培养基。然后将二百五十微升细胞混合物转移至Falcon 2059管中。向每个管中添加一微克转化DNA,随后添加250μl LB。两微升的50μg/ml适当的抗生素也被包括在转化混合物中。将管在34℃或37℃在设置为250rpm的旋转摇床上孵育1小时。将转化反应物铺在含有适当的抗生素的LB琼脂板上。在37℃、24小时后或在34℃、48小时后收获菌落。
实例6:质粒pBM376a的构建
从GeneArt(赛默飞世尔科技公司(Thermo Fischer Scientific),格兰德岛(Grand Island),纽约)获得含有scBAN启动子减去其核糖体结合位点加上靶向DNA顶部链的yjbH指导RNA的合成DNA片段;DNA序列如下所示:
SEQ ID NO:31:
Aagctttgctgtccagactgtccgctgtgtaaaaaaaaggaataaaggggggttgacattattttactgatatgtataatataatttgtataagaaaatgtacaaacatctgggaaatacgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgctttaagctt
将此片段克隆到温度敏感芽孢杆菌/大肠杆菌穿梭载体pBM354中,如下:使用以下引物用于扩增合成DNA。
引物1216467(SEQ ID NO:32):5’cctcgaggtcgacggtatcgataagctttgctgtccagactgtc引物1216468(SEQ ID NO:33):5’gctgcaggaattcgatatcaagcttaaagcaccgactcggtgcc
使用Phusion热启动II聚合酶(赛默科技公司(Thermo Scientific),格兰德岛(Grand Island),纽约)扩增DNA片段。PCR扩增反应混合物含有1μl的25μg/μl的合成DNA、0.5μl的正义引物(50pmol/μl)、0.5μl的反义引物(50pmol/μl)、5μl的10X Phusion HF PCR缓冲液、1μl的dNTP混合物(各自10mM)、36.5μl的水和0.5μl(2.0U/μl)的DNA聚合酶混合物。使用艾本德主循环器(Eppendorf Mastercycler)热循环仪用以下设置扩增片段:在98℃进行一个30秒的循环;25个循环,各自为在98℃持续10秒,在58℃持续20秒,在72℃持续20秒;在72℃进行一个5分钟的循环;并且在4℃保持。
根据制造商的说明书,使用QIAGEN QIAquick凝胶提取试剂盒(凯杰公司(Qiagen,Inc.),Valencia(巴伦西亚),加利福尼亚州),用1x TBE缓冲液从1.8%琼脂糖(Amresco公司,Solon(梭伦),俄亥俄州)凝胶中纯化205bp PCR产物。
将含有scBAN启动子的205bp的PCR片段,减去其核糖体结合位点加上yjbH指导RNA,克隆进质粒pBM354中,所述质粒先前已经根据制造商的说明书,使用Clontech In-Fusion HD克隆系统(隆达实验室有限公司(Clontech Laboratories,Inc.),山景城(Mountain View),加利福尼亚州)用限制性内切酶HindIII进行了消化。
根据制造商的说明书,将In-fusion混合物的2μl等分部分用于转化大肠杆菌StellarTM细胞。由大肠杆菌转化体制备质粒DNA。一种这样的转化体的DNA测序被鉴定为具有正确的DNA序列并被指定为pBM376a。
实例7:质粒pBM375C的构建
从GeneArt(赛默飞世尔科技公司(Thermo Fischer Scientific),格兰德岛(Grand Island),纽约)获得含有scBAN启动子减去其核糖体结合位点加上靶向DNA底部链的yjbH指导RNA的合成DNA片段;DNA序列在以下显示为SEQ ID NO:34:
aagctttgctgtccagactgtccgctgtgtaaaaaaaaggaataaaggggggttgacattattttactgatatgtataatataatttgtataagaaaatgaccctttatgtcctgaatgcgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgctttaagctt
将所述片段克隆到温度敏感芽孢杆菌/大肠杆菌穿梭载体pBM354中,如下:
使用以下引物用于扩增合成DNA:
引物1216467(SEQ ID NO:32):5’-cctcgaggtcgacggtatcgataagctttgctgtccagactgtc
引物1216468(SEQ ID NO:33):5’-gctgcaggaattcgatatcaagcttaaagcaccgactcggtgcc
使用Phusion热启动II聚合酶(赛默科技公司(Thermo Scientific),格兰德岛(Grand Island),纽约)扩增DNA片段。PCR扩增反应混合物含有1μl的25μg/μl的合成DNA、0.5μl的正义引物(50pmol/μl)、0.5μl的反义引物(50pmol/μl)、5μl的10X Phusion HF PCR缓冲液、1μl的dNTP混合物(各自10mM)、36.5μl的水和0.5μl(2.0U/μl)的DNA聚合酶混合物。使用艾本德主循环器(Eppendorf Mastercycler)热循环仪用以下设置扩增片段:在98℃进行一个30秒的循环;25个循环,各自为在98℃持续10秒,在58℃持续20秒,在72℃持续20秒;在72℃进行一个5分钟的循环;并且在4℃保持。
根据制造商的说明书,使用QIAGEN QIAquick凝胶提取试剂盒(凯杰公司(Qiagen,Inc.),Valencia(巴伦西亚),加利福尼亚州),用1x TBE缓冲液从1.8%琼脂糖(Amresco公司,Solon(梭伦),俄亥俄州)凝胶中纯化205bp PCR产物。
将含有scBAN启动子的205bp的PCR片段,减去其核糖体结合位点加上yjbH指导RNA,克隆进质粒pBM354中,所述质粒先前已经根据制造商的说明书,使用Clontech In-Fusion HD克隆系统(隆达实验室有限公司(Clontech Laboratories,Inc.),山景城(Mountain View),加利福尼亚州)用限制性内切酶HindIII进行了消化。
根据制造商的说明书,将In-fusion混合物的2μl等分部分用于转化大肠杆菌StellarTM细胞。由大肠杆菌转化体制备质粒DNA。一种这样的转化体的DNA测序被鉴定为具有正确的DNA序列并被指定为pBM375c。
实例8:菌株BaC0266的构建
为评估芽孢杆菌中化脓性链球菌的II类型CRISPR-Cas9系统的用途,我们选择与非同源末端连接(NHEJ)缺陷的芽孢杆菌菌株进行搡作。由于双链断裂造成的DNA损伤可经由两种途径在芽孢杆菌中修复:无错同源重组(HR)或非同源末端连接。由CRISPR Cas9诱导的NHEJ缺陷菌株的双链断裂将是致命的,除非通过同源重组修复。参与枯草芽孢杆菌中非同源末端连接(NHEJ)的两个基因注释为ligD和ku(de Vega,2013,The minimal Bacillussubtilis nonhomologous end joining repair machinery[最小的枯草芽孢杆菌非同源末端连接修复机制].PLoS One[公共科学图书馆·综合]8(5):e64232)。ligD基因编码多功能性DNA连接酶D,而ku基因编码DNA结合蛋白。两种基因的破坏导致不能通过NHEJ修复双链断裂的菌株。由于这两个基因位于枯草芽孢杆菌168的相同操纵子中,两个可读框同时被破坏。
根据先前描述的方法(美国专利号5,843,720),通过染色体整合与切割将温度敏感质粒pBM353并入枯草芽孢杆菌168.Δ.4的基因组中。使含有质粒pBM353的枯草芽孢杆菌168.Δ.4转化体在50℃生长在补充红霉素/洁霉素的TBAB上,以推动载体整合。基于其在50℃、在TBAB红霉素/洁霉素选择培养基上生长的能力选择希望的整合体。然后,使整合体于37℃无选择性地生长在LB培养基中,以允许切割整合的质粒。将细胞铺在LB板上并且针对红霉素-敏感性进行筛选。
根据前述的方法(Pitcher等人,1989,Rapid extraction of bacterial genomicDNA with guanidium thiocyanate[用疏氰酸胍快速提取细菌基因组DNA].Letters inApplied Microbiology[应用微生物学简讯]8(4):151-156)从若干红霉素/洁霉素敏感分离体中制备基因组DNA。基因组PCR证实了ykoV(ligD)和ykoU(ku)基因的破坏,所得菌株被指定为BaC0266。
实例9:菌株BaC0301的构建
来自化脓性链球菌的II类型CRISPR-Cas9系统由能够靶向特异性基因组靶序列的双RNA指导的DNA核酸内切酶组成。当与指导RNA分子复合时,Cas9蛋白将结合DNA序列并通过两个催化结构域的方式产生双链断裂。随着Cas9催化结构域中两个突变(D10A和H840A)的引入,当与特异性指导RNA复合时,蛋白质保留其结合能力但失去其催化功能(Cas9d)。当与DNA结合时,Cas9d-gRNA复合物可以阻遏靶基因的转录。
产生枯草芽孢杆菌菌株BaC0301用于催化失活的dCas9的表达,如下:
将线性整合载体系统用于化脓性链球菌Cas9d基因的表达克隆。线性整合构建体是一种PCR融合产物,所述融合产物由两个枯草芽孢杆菌同源染色体区域之间的cas9基因连同一个强启动子与氯霉素抗性标志的融合制备。通过SOE PCR进行融合。在三联启动子系统(如WO 99/43835中所述)的控制下表达所述基因,所述启动子系统由包含稳定化序列的地衣芽孢杆菌α-淀粉酶基因启动子(amyL)、解淀粉芽孢杆菌α-淀粉酶基因启动子(amyQ)和苏云金芽孢杆菌cryIIIA启动子组成。编码氯霉素乙酰基转移酶的基因被用作标志(Diderichsen等人,1993,A useful cloning vector for Bacillus subtilis[枯草芽孢杆菌的有用的克隆载体].Plasmid[质粒]30(3):312-315)。在枯草芽孢杆菌染色体中,最终的基因构建体通过同源重组整合到果胶裂解酶pel基因座上。
设计用于扩增与枯草芽孢杆菌A164基因组同源的5'侧翼序列的第一片段,加上三联启动子的DNA序列,从枯草芽孢杆菌A164菌株BaC0291在PCR反应中使用如下引物扩增:
1209582(SEQ ID NO:35):5’-ctgcgtgtgcctacagat
1216378(SEQ ID NO:36):5’-gcctattgagtatttcttatccattcggttccctcctcatttttatagagc
使用以下引物对从枯草芽孢杆菌BaC0298 PCR扩增设计为含有化脓链球菌cas9D10A部分的基因的第二片段:
1216377(SEQ ID NO:37):5’-gctctataaaaatgaggagggaaccgaatggataagaaatactcaataggc
1217984(seq ID NO:38)5’-catcataatcacttaaacgattaatatctaattcttggtccacatacatgtc
使用以下引物对从合成DNA片段(SEQ ID NO:39)PCR扩增设计为含有化脓链球菌cas9 H840A部分的基因的第三片段:
1213933(SEQ ID NO:40):5’-tgtggaccaagaattagata
1214793(seq ID NO:41):5’-tttcttaatcaaagcagttccaacg
设计第四片段以扩增氯霉素抗性基因以及与枯草芽孢杆菌A164基因组同源的3'侧翼序列,在来自BaC0291的PCR反应中用以下引物扩增:
1213934(SEQ ID NO:42):5’-cgttggaactgctttgattaagaaa
1209587(SEQ ID NO:43)5’-gtgtcgatcagcttcttcagc
使用Phusion热启动II(Phusion Hot Start II)聚合酶(赛默科技公司(ThermoScientific),格兰德岛(Grand Island),纽约(NY)),通过PCR来扩增对应的DNA片段。PCR扩增反应混合物含有大约1μl DNA、0.5μl的正义引物(50pmol/μl)、0.5μl的反义引物(50pmol/μl)、5μl的10X Phusion HF PCR缓冲液、1μl的dNTP混合物(各自10mM)、36.5μl的水和0.5μl(2.0U/μl)的DNA聚合酶混合物。使用艾本德主循环器(EppendorfMastercycler)热循环仪用以下设置扩增片段:在98℃进行一个30秒的循环;25个循环,各自为在98℃持续10秒,在58℃持续20秒,以及在72℃延伸时间(如制造商所建议的);在72℃进行一个5分钟的循环;并且在4℃保持。根据制造商的说明书,使用Qiagen QIAquick PCR纯化试剂盒(凯杰公司(Qiagen,Inc.),Valencia(瓦伦西亚),加利福尼亚州)从1%TBE琼脂糖胶纯化PCR产物。
将所有四个片段在单个PCR反应中组合以获得用于转化的最终片段。PCR扩增反应混合物含有大约25ng凝胶纯化DNA、0.5μl的正义引物(50pmol/μl)、0.5μl的反义引物(50pmol/μl)、5μl的10X Phusion HF PCR缓冲液、1μl的dNTP混合物(各自10mM)、36.5μl的水、和0.5μl(2.0U/μl)的Phusion热启动II聚合酶(赛默科技公司(Thermo Scientific),格兰德岛(Grand Island),纽约)。使用艾本德主循环器(Eppendorf Mastercycler)热循环仪用以下设置扩增片段:在98℃进行一个30秒的循环;25个循环,各自为在98℃持续10秒,在58℃持续20秒,以及在72℃延伸时间(如制造商所建议的);在72℃进行一个5分钟、30秒的循环;并且在4℃保持。根据制造商的说明书,使用QIAquick PCR纯化试剂盒(凯杰公司(Qiagen,Inc.),Valencia(巴伦西亚),加利福尼亚州)纯化PCR产物。
一微克纯化的PCR产物用于转化枯草芽孢杆菌BaC0266,并在含有氯霉素(6μg/ml)的LB平板上选择转化体。选择通过基因组PCR和化脓性链球菌cas9 D10A H840A基因的进一步DNA测序鉴定的一种转化体,并命名为BaC0301。
实例10:菌株BaC0303的构建
一微克的BaC0301基因组DNA被用于转化枯草芽孢杆菌RB128感受态细胞,并且在含有氯霉素(6μg/ml)的LB平板上选择转化体。如下通过SDS-PAGE蛋白分析的方式分离和验证一个转化体。为了检查Cas9d(D10A、H840A)蛋白的表达,将BaC0303培养物在LB培养基在37℃生长过夜。第二天,收集过夜培养物1ml,并使用裂解基质B(安倍生物医疗(MPBiomedicals),圣安娜(Santa Ana),加利福尼亚州)在尿素样品缓冲液中裂解细胞。十毫升尿素样品缓冲液由1ml 10%SDS、5.4g尿素、250μl的1M Tris-HCl、20μl的0.5M EDTA、pH8.0、500mlβ-巯基乙醇组成。使用4%至15%TGX Criterion蛋白凝胶(伯乐实验室(Bio-RadLaboratories),赫拉克勒斯(Hercules),加利福尼亚州)对无细胞裂解物进行SDS-PAGE。通过与未转化的RB128裂解物进行比较来验证Cas9d(D10A、H840A)变体的表达。
实例11.菌株BaC0306的构建
为了产生能够沉默枯草芽孢杆菌BaC0303yjbH基因的菌株,我们首先制备天然感受态细胞,并在500微升等分试样中在-80℃在15%甘油中进行冷冻。然后,将500μl含有2mMEGTA的Spizizen II培养基添加至冷冻的等分试样中,然后将250μl转移到Falcon管中。将一微克质粒pBM375c、250μl LB和2μl 50mg/ml红霉素添加至Falcon管中。将细胞在设置为250rpm 34℃的旋转摇床上生长2小时。2小时后,将转化混合物铺在含有25μg/ml红霉素和1μg/ml洁霉素的琼脂板上。将板在34℃放置2天。两天后,选择一个单独的菌落并命名为枯草芽孢杆菌BaC0306。
实例12.菌株BaC0307的构建
为了产生能够沉默枯草芽孢杆菌BaC0303yjbH基因的菌株,我们制备了天然感受态细胞。将500微升等分试样的感受态细胞在-80℃的15%的甘油中冷冻。在转化之前,将500μl含有2mM EGTA的Spizizen II培养基添加至冷冻的等分试样中,然后将250μl转移到Falcon管中。将一微克质粒pBM376、250μl LB和2μl 50mg/ml红霉素添加至Falcon管中。将细胞在设置为250rpm 34℃的旋转摇床上生长2小时。2小时后,将转化混合物铺在含有25μg/ml红霉素和1μg/ml洁霉素的琼脂板上。将板在34℃放置2天。两天后,选择一个单独的菌落并命名为枯草芽孢杆菌BaC0307。
实例13.在枯草芽孢杆菌中的CRISPR干扰(CRISPRi)
为了证明枯草芽孢杆菌中的CRISPRi系统,我们靶向产生麦芽糖淀粉酶的枯草芽孢杆菌菌株RB128中的yjbH基因的转录阻遏。我们预期yjbH基因的成功“沉默”将导致Novamyl活性增加。
首先,我们整合了表达盒,其将Cas9d置于RB128的pel基因座中的强启动子构建体的转录控制之下。将所得菌株命名为BaC0303。
然后用含有表达盒的质粒转化菌株BaC0303(对照),所述表达盒设计用于表达靶向yjbH编码序列的5'末端的任一链的指导RNA。将所得转化体命名为BaC0306和BaC0307。
菌株BaC0303、BaC0306、和BaC0307在LB培养基中在摇瓶(n=5)中生长,并在3天后分析麦芽糖淀粉酶活性。
当与对照菌株BaC0303相比时,从菌株BaC0306和BaC0307获得的上清液中检测到的产麦芽糖淀粉酶活性加倍(参见下表)。相对地,所述加倍的活性与从相同条件下生长的RB128和yjbH-突变的RB128(yjbH:E159K)获得的结果相似。
表5:来自摇瓶培养物的平均(n=5)产麦芽糖淀粉酶活性(MANU/ml)。
| 菌株 | 平均MANU/ml(n=5) | 标准差 |
| BaC0303(对照) | 4.76 | 0.35 |
| BaC0306 | 11.35 | 1.91 |
| BaC0307 | 10.12 | 0.82 |
序列表
<110> 诺维信公司(Novozymes A/S)
<120> 通过CRISPR-抑制来改善微生物
<130> 14143-WO-PCT
<160> 43
<170> PatentIn版本3.5
<210> 1
<211> 1144
<212> DNA
<213> 人工序列
<220>
<223> 表1,片段1
<400> 1
ctctagagga tccccgggta ccgagctctg ccttttagtc cagctgattt cactttttgc 60
attctacaaa ctgcataact catatgtaaa tcgctccttt ttaggtggca caaatgtgag 120
gcattttcgc tctttccggc aaccacttcc aagtaaagta taacacacta tactttatat 180
tcataaagtg tgtgctctgc gaggctgtcg gcagtgccga ccaaaaccat aaaaccttta 240
agacctttct tttttttacg agaaaaaaga aacaaaaaaa cctgccctct gccacctcag 300
caaagggggg ttttgctctc gtgctcgttt aaaaatcagc aagggacagg tagtattttt 360
tgagaagatc actcaaaaaa tctccacctt taaacccttg ccaattttta ttttgtccgt 420
tttgtctagc ttaccgaaag ccagactcag caagaataaa atttttattg tctttcggtt 480
ttctagtgta acggacaaaa ccactcaaaa taaaaaagat acaagagagg tctctcgtat 540
cttttattca gcaatcgcgc ccgattgctg aacagattaa taatgagctc ggaattcgta 600
cgagttcctc cacattcgga gtatttctga atgatagagc cacacggtcc acgttctcac 660
tggctaaccg gatcaaatga tcttcaggag tcagcataat acatccagtt caggtagata 720
agatttgaat ttggtgactt gcttttgttc ttcttctttc attttctgac taatccaaac 780
tggaaaaagc aggtctttta acagattagg aggtttctga catgcaccat tcggtcacta 840
accgaatgca gtaaaggaca ctgtggtgct tgccagccat tagggtattg aggaggtgat 900
caaaatgcta ggtgacagta tttcgtcgaa gtggacaagt cgtgaccaaa tgacctcgga 960
tcgagggttg gtcatggagg aaaaaattga tgtctggtga caaagaggag tcatgatcat 1020
ggcaccgcca acgagggaaa aaactcttcc cgcatcgaca cggtatgtgg gcggtgacaa 1080
actaacttat agagtaaatt tattagtcga atgaaagacg cgctaaaaat gaggagggaa 1140
gcga 1144
<210> 2
<211> 4107
<212> DNA
<213> 人工序列
<220>
<223> 表1,片段2
<400> 2
atggacaaaa aatacagcat cggcctggct attggcacaa attcagttgg ctgggcagtt 60
atcacagacg aatataaagt tccgagcaaa aaatttaaag tcctgggcaa tacagatcgc 120
catagcatca aaaaaaacct gattggcgca ctgctgtttg attcaggcga aacagcagaa 180
gcaacaagac ttaaaagaac agcaagacgc agatatacaa gacgcaaaaa tcgcatttgc 240
tatctgcaag aaatctttag caacgaaatg gcgaaagtcg acgacagctt ttttcataga 300
ctggaagaat catttctggt cgaagaagat aaaaaacacg aacgccatcc gatttttggc 360
aacattgttg atgaagtcgc gtatcatgaa aaatacccga caatttatca tctgcgcaaa 420
aaactggttg acagcacaga taaagcagat cttcgcctga tttatctggc actggcacat 480
atgatcaaat ttagaggcca ttttctgatc gaaggcgatc tgaatccgga taattcagat 540
gtcgacaaac tgtttattca gctggtccag acatataacc agctgtttga agaaaatccg 600
attaatgcat caggcgttga tgcaaaagca attctgtcag caagactgtc aaaatcaaga 660
cgcctggaaa atctgattgc acaactgcct ggcgaaaaaa aaaatggact gtttggcaat 720
cttattgcac tgtcactggg cctgacaccg aactttaaat caaattttga tctggcggaa 780
gatgcgaaac tgcaactttc aaaagatacg tatgatgacg atctggataa tctgctggcg 840
caaattggcg atcaatatgc agatcttttt ctggcagcga aaaatctgtc agatgcaatt 900
ctgctgtcag atattctgcg cgtcaataca gaaattacaa aagcaccgct gagcgcgagc 960
atgattaaaa gatatgatga acatcatcag gacctgacac tgctgaaagc actggttaga 1020
caacaactgc cggaaaaata caaagaaatc ttttttgatc agagcaaaaa cggctatgca 1080
ggctatattg atggcggagc atcacaagaa gaattttaca aatttatcaa accgatcctg 1140
gaaaaaatgg atggaacaga agaactgctg gttaaactga atcgcgaaga tttactgaga 1200
aaacagcgca catttgataa tggctcaatt ccgcatcaaa ttcatctggg cgaactgcat 1260
gcgattctta gacgccaaga agatttttat ccgtttctga aagacaaccg ggaaaaaatt 1320
gaaaaaatcc tgacatttcg catcccgtat tatgtcggac cgctggcaag aggcaattca 1380
agatttgcat ggatgacacg caaaagcgaa gaaacaatta caccgtggaa ttttgaagaa 1440
gtcgttgata aaggcgcaag cgcacaatca tttattgaac gcatgacgaa ctttgacaaa 1500
aacctgccga atgaaaaagt cctgccgaaa cattcactgc tgtatgaata ctttacggtc 1560
tataatgaac tgacgaaagt caaatatgtc acagaaggca tgagaaaacc ggcatttctg 1620
tcaggcgaac agaaaaaagc gattgtcgat cttctgttta aaacgaaccg caaagtcaca 1680
gtgaaacagc tgaaagaaga ttactttaaa aaaatcgaat gctttgatag cgtcgaaatc 1740
tcaggcgtcg aagatagatt taatgcaagc ctgggcacat atcatgatct gctgaaaatc 1800
atcaaagata aagattttct ggataacgaa gaaaacgaag atatcctgga agatattgtg 1860
ctgacactga cgctttttga agatcgcgaa atgattgaag aacgcctgaa aacatatgcg 1920
cacctgtttg atgataaagt catgaaacaa cttaaacgca gacgctatac aggctggggc 1980
agactttcaa gaaaactgat taacggcatt cgcgataaac aaagcggcaa aacaatcctg 2040
gattttctga aatcagatgg ctttgcgaat cgcaatttta tgcagctgat tcatgatgac 2100
agcctgacgt ttaaagaaga tattcagaaa gcacaagttt caggccaagg cgattcactg 2160
catgaacata ttgcaaatct ggcaggctca ccggcaatca aaaaaggcat tctgcaaaca 2220
gttaaagtcg tcgatgaact ggttaaagtt atgggcagac ataaaccgga aaacatcgtt 2280
attgaaatgg cacgcgaaaa tcagacaaca caaaaaggac agaaaaattc acgcgaacgg 2340
atgaaaagaa ttgaagaagg cattaaagaa ctgggcagcc aaatcctgaa agaacatccg 2400
gttgaaaata cacagctgca gaacgaaaaa ctgtatctgt attatctgca gaatggacgc 2460
gatatgtatg tcgatcaaga actggatatt aatcgcctga gcgattatga tgtggatgct 2520
attgttccgc agagctttct taaagatgat agcatcgata acaaagtcct gacacgctca 2580
gataaaaaca gaggcaaatc agataatgtc ccgtcagaag aggttgtcaa aaaaatgaaa 2640
aactactggc gtcaactgct gaacgcgaaa cttattacac aacgcaaatt tgacaatctg 2700
acaaaagcag aaagaggcgg actgtcagaa cttgataaag cgggttttat caaaagacag 2760
ctggtcgaaa cacgccagat tacaaaacat gttgcgcaaa ttctggatag ccgcatgaac 2820
acaaaatatg acgaaaacga taaactgatc cgggaagtca aagtcattac gctgaaatca 2880
aaactggtca gcgattttcg caaagacttt cagttttaca aagtccgcga aatcaacaac 2940
taccatcatg cacatgatgc atatctgaat gcagttgtcg gcacagcgct tatcaaaaaa 3000
taccctaaac tggaaagcga atttgtctac ggcgactata aagtctatga tgtccgcaaa 3060
atgattgcga aaagcgaaca agaaattggc aaagcgacag cgaaatactt tttttacagc 3120
aacatcatga acttttttaa aacggaaatc acactggcga acggcgaaat tagaaaaaga 3180
ccgcttattg aaacgaacgg tgaaacaggc gaaattgttt gggataaagg cagagatttt 3240
gcaacagtta gaaaagttct gagcatgccg caagtcaaca tcgtgaaaaa aacagaagtt 3300
cagacaggcg gatttagcaa agaatcaatt cttccgaaac gcaactcaga caaactgatt 3360
gcgcgtaaaa aagactggga cccgaaaaaa tacggtggct ttgattcacc gacagttgca 3420
tattcagttc tggttgttgc gaaagtggaa aaaggcaaat ccaaaaaact taaaagcgtg 3480
aaagaacttc tgggcatcac aattatggaa cgctcgagct ttgaaaaaaa cccgatcgac 3540
tttctggaag ccaaaggcta taaagaagtg aaaaaagacc ttattatcaa actgccgaaa 3600
tacagcctgt ttgaactgga aaatggcaga aaacgcatgc tggcatcagc aggcgaactt 3660
cagaaaggca atgaactggc actgccgtca aaatatgtta actttctgta tctggcgagc 3720
cattacgaaa aacttaaagg ctcaccggaa gataacgaac agaaacaact gtttgtcgaa 3780
cagcataaac attacctgga cgaaatcatc gaacaaatca gcgaattttc aaaacgcgtt 3840
attctggcag atgcgaacct ggataaagtt cttagcgcat ataacaaaca ccgggataaa 3900
ccgattagag aacaagcgga aaatatcatt cacctgttta cactgacaaa tcttggcgca 3960
ccggcagcgt ttaaatactt tgatacaaca attgaccgca aacgctacac aagcacaaaa 4020
gaagttctgg acgcaacact gattcatcaa tcaattacag gcctttatga aacgagcatt 4080
gatctgtcac aactgggagg cgattga 4107
<210> 3
<211> 263
<212> DNA
<213> 人工序列
<220>
<223> 表1,片段3
<400> 3
tgctgtccag actgtccgct gtgtaaaaaa aaggaataaa ggggggttga cattatttta 60
ctgatatgta taatataatt tgtataagaa aatgtcttac aaagaaggga aggtgtttta 120
gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa aagtggcacc 180
gagtcggtgc tttgcggccg cagatctggg accaataata atgactagag aagaaagaat 240
gaagattgtt catgaaatta agg 263
<210> 4
<211> 1176
<212> DNA
<213> 人工序列
<220>
<223> 表1,片段4
<400> 4
aacgaatatt ggataaagtg ggatattttt aaaatatata tttatgttac agtaatattg 60
acttttaaaa aaggattgat tctaatgaag aaagcagaca agtaagcctc ctaaattcac 120
tttagataaa aatttaggag gcatatcaaa tgaactttaa taaaattgat ttagacaatt 180
ggaagagaaa agagatattt aatcattatt tgaaccaaca aacgactttt agtataacca 240
cagaaattga tattagtgtt ttataccgaa acataaaaca agaaggatat aaattttacc 300
ctgcatttat tttcttagtg acaagggtga taaactcaaa tacagctttt agaactggtt 360
acaatagcga cggagagtta ggttattggg ataagttaga gccactttat acaatttttg 420
atggtgtatc taaaacattc tctggtattt ggactcctgt aaagaatgac ttcaaagagt 480
tttatgattt atacctttct gatgtagaga aatataatgg ttcggggaaa ttgtttccca 540
aaacacctat acctgaaaat gctttttctc tttctattat tccatggact tcatttactg 600
ggtttaactt aaatatcaat aataatagta attaccttct acccattatt acagcaggaa 660
aattcattaa taaaggtaat tcaatatatt taccgctatc tttacaggta catcattctg 720
tttgtgatgg ttatcatgca ggattgttta tgaactctat tcaggaattg tcagataggc 780
ctaatgactg gcttttataa tatgagataa tgccgactgg ctagcatggc aagacccaga 840
aaagttctgg gagatcccgc tttgcataag cgtattatag tggatgacgc gggctttgtt 900
gtttacactt cttgcacctg ctgacggcaa tcatccctat ctatgaaatc gagatttcag 960
caggccgtta ttttcgagag agttaaatct atattcattg tttttatttt ggtaaggaca 1020
taccggattt taggtttgga ttaccggtcg agttagcttg tcttttcgcc cactaccgtg 1080
tcgatgcggg agcaatttac cagaagcact taccgattga tagtttttta ttccggtgat 1140
tgcaaagttt cataaacaag cttgcatgcc tgcagg 1176
<210> 5
<211> 180
<212> DNA
<213> 人工序列
<220>
<223> 表1,片段5
<400> 5
cagtttgaaa attatgtatt atggagctca gaggaggaga gtgagtaatg atgaggaaaa 60
agagtttttg gcttgggatg ctgacggcct tcatgctcgt gttcacgatg gcattcagcg 120
attccgcttc tgctgctgaa gaagcaaaag aaaaatattt aattggcttt aatgagcagg 180
<210> 6
<211> 160
<212> DNA
<213> 人工序列
<220>
<223> 表1,片段6
<400> 6
cttgtcaatg cagaagcggc aacgcgataa cgcgtagggc ccgcggctag cggccgcgtc 60
gactagaaga gcagagagga cggatttcct gaaggaaatc cgttttttta ttttgcccgt 120
cttataaatt tcgttgttca ataatcgcat ccgattgcag 160
<210> 7
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 表1,引物1
<400> 7
ccgactgcgc aaaagacata atcgactcta gaggatcccc gggtaccgag 50
<210> 8
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 表1,引物2
<400> 8
cgatgctgta ttttttgtcc attcgcttcc ctcctcattt ttagcgcgtc 50
<210> 9
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 表1,引物3
<400> 9
atggacaaaa aatacagcat cggc 24
<210> 10
<211> 47
<212> DNA
<213> 人工序列
<220>
<223> 表1,引物4
<400> 10
cacagcggac agtctggaca gcatcaatcg cctcccagtt gtgacag 47
<210> 11
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 表1,引物5
<400> 11
tgctgtccag actgtccgct gtg 23
<210> 12
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> 表1,引物6
<400> 12
cccactttat ccaatattcg ttccttaatt tcatgaacaa tcttcattc 49
<210> 13
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 表1,引物7
<400> 13
ggaacgaata ttggataaag tggg 24
<210> 14
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 表1,引物8
<400> 14
gtgtgcctat tttttgtgaa tcgacctgca ggcatgcaag cttgtttatg 50
<210> 15
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 表1,引物9
<400> 15
tcgattcaca aaaaataggc acacg 25
<210> 16
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 表1,引物10
<400> 16
gtcgattatg tcttttgcgc agtcg 25
<210> 17
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 表1,引物11
<400> 17
gtgcagttct cgtcgatgtc cgg 23
<210> 18
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 表1,引物12
<400> 18
ggtcaagaca ttgatcaagc gcttc 25
<210> 19
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 表1,引物13
<400> 19
gaagcgcttg atcaatgtct tgaccgcaac gttcgcagat gctgctgaag 50
<210> 20
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 表1,引物14
<400> 20
ccataataca taattttcaa actg 24
<210> 21
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 表1,引物15
<400> 21
gaaaaatatt taattggctt taatgagcag g 31
<210> 22
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 表1,引物16
<400> 22
cgcgttgccg cttctgcatt gacaag 26
<210> 23
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 表1,引物17
<400> 23
gttcaataat cgcatccgat tgcag 25
<210> 24
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 表1,引物18
<400> 24
ctgcgcaaaa gacataatcg attc 24
<210> 25
<211> 48
<212> DNA
<213> 人工序列
<220>
<223> 表1,引物19
<400> 25
gaatcgatta tgtcttttgc gcagatgctg gttctcgacc attcaagg 48
<210> 26
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 表1,引物20
<400> 26
cgtagacggc aagcccgtat cc 22
<210> 27
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 表1,引物21
<400> 27
ggtgaggaaa tcgcgacagc tg 22
<210> 28
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 表1,引物22
<400> 28
ccattgaaga aaacaagagc gtc 23
<210> 29
<211> 10421
<212> DNA
<213> 人工序列
<220>
<223> 表1,质粒pMOL3188全序列
<400> 29
gaattcgtac gagttcctcc acattcggag tatttctgaa tgatagagcc acacggtcca 60
cgttctcact ggctaaccgg atcaaatgat cttcaggagt cagcataata catccagttc 120
aggtagataa gatttgaatt tggtgacttg cttttgttct tcttctttca ttttctgact 180
aatccaaact ggaaaaagca ggtcttttaa cagattagga ggtttctgac atgcaccatt 240
cggtcactaa ccgaatgcag taaaggacac tgtggtgctt gccagccatt agggtattga 300
ggaggtgatc aaaatgctag gtgacagtat ttcgtcgaag tggacaagtc gtgaccaaat 360
gacctcggat cgagggttgg tcatggagga aaaaattgat gtctggtgac aaagaggagt 420
catgatcatg gcaccgccaa cgagggaaaa aactcttccc gcatcgacac ggtatgtggg 480
cggtgacaaa ctaacttata gagtaaattt attagtcgaa tgaaagacgc gctaaaaatg 540
aggagggaag cgaatggaca aaaaatacag catcggcctg gctattggca caaattcagt 600
tggctgggca gttatcacag acgaatataa agttccgagc aaaaaattta aagtcctggg 660
caatacagat cgccatagca tcaaaaaaaa cctgattggc gcactgctgt ttgattcagg 720
cgaaacagca gaagcaacaa gacttaaaag aacagcaaga cgcagatata caagacgcaa 780
aaatcgcatt tgctatctgc aagaaatctt tagcaacgaa atggcgaaag tcgacgacag 840
cttttttcat agactggaag aatcatttct ggtcgaagaa gataaaaaac acgaacgcca 900
tccgattttt ggcaacattg ttgatgaagt cgcgtatcat gaaaaatacc cgacaattta 960
tcatctgcgc aaaaaactgg ttgacagcac agataaagca gatcttcgcc tgatttatct 1020
ggcactggca catatgatca aatttagagg ccattttctg atcgaaggcg atctgaatcc 1080
ggataattca gatgtcgaca aactgtttat tcagctggtc cagacatata accagctgtt 1140
tgaagaaaat ccgattaatg catcaggcgt tgatgcaaaa gcaattctgt cagcaagact 1200
gtcaaaatca agacgcctgg aaaatctgat tgcacaactg cctggcgaaa aaaaaaatgg 1260
actgtttggc aatcttattg cactgtcact gggcctgaca ccgaacttta aatcaaattt 1320
tgatctggcg gaagatgcga aactgcaact ttcaaaagat acgtatgatg acgatctgga 1380
taatctgctg gcgcaaattg gcgatcaata tgcagatctt tttctggcag cgaaaaatct 1440
gtcagatgca attctgctgt cagatattct gcgcgtcaat acagaaatta caaaagcacc 1500
gctgagcgcg agcatgatta aaagatatga tgaacatcat caggacctga cactgctgaa 1560
agcactggtt agacaacaac tgccggaaaa atacaaagaa atcttttttg atcagagcaa 1620
aaacggctat gcaggctata ttgatggcgg agcatcacaa gaagaatttt acaaatttat 1680
caaaccgatc ctggaaaaaa tggatggaac agaagaactg ctggttaaac tgaatcgcga 1740
agatttactg agaaaacagc gcacatttga taatggctca attccgcatc aaattcatct 1800
gggcgaactg catgcgattc ttagacgcca agaagatttt tatccgtttc tgaaagacaa 1860
ccgggaaaaa attgaaaaaa tcctgacatt tcgcatcccg tattatgtcg gaccgctggc 1920
aagaggcaat tcaagatttg catggatgac acgcaaaagc gaagaaacaa ttacaccgtg 1980
gaattttgaa gaagtcgttg ataaaggcgc aagcgcacaa tcatttattg aacgcatgac 2040
gaactttgac aaaaacctgc cgaatgaaaa agtcctgccg aaacattcac tgctgtatga 2100
atactttacg gtctataatg aactgacgaa agtcaaatat gtcacagaag gcatgagaaa 2160
accggcattt ctgtcaggcg aacagaaaaa agcgattgtc gatcttctgt ttaaaacgaa 2220
ccgcaaagtc acagtgaaac agctgaaaga agattacttt aaaaaaatcg aatgctttga 2280
tagcgtcgaa atctcaggcg tcgaagatag atttaatgca agcctgggca catatcatga 2340
tctgctgaaa atcatcaaag ataaagattt tctggataac gaagaaaacg aagatatcct 2400
ggaagatatt gtgctgacac tgacgctttt tgaagatcgc gaaatgattg aagaacgcct 2460
gaaaacatat gcgcacctgt ttgatgataa agtcatgaaa caacttaaac gcagacgcta 2520
tacaggctgg ggcagacttt caagaaaact gattaacggc attcgcgata aacaaagcgg 2580
caaaacaatc ctggattttc tgaaatcaga tggctttgcg aatcgcaatt ttatgcagct 2640
gattcatgat gacagcctga cgtttaaaga agatattcag aaagcacaag tttcaggcca 2700
aggcgattca ctgcatgaac atattgcaaa tctggcaggc tcaccggcaa tcaaaaaagg 2760
cattctgcaa acagttaaag tcgtcgatga actggttaaa gttatgggca gacataaacc 2820
ggaaaacatc gttattgaaa tggcacgcga aaatcagaca acacaaaaag gacagaaaaa 2880
ttcacgcgaa cggatgaaaa gaattgaaga aggcattaaa gaactgggca gccaaatcct 2940
gaaagaacat ccggttgaaa atacacagct gcagaacgaa aaactgtatc tgtattatct 3000
gcagaatgga cgcgatatgt atgtcgatca agaactggat attaatcgcc tgagcgatta 3060
tgatgtggat gctattgttc cgcagagctt tcttaaagat gatagcatcg ataacaaagt 3120
cctgacacgc tcagataaaa acagaggcaa atcagataat gtcccgtcag aagaggttgt 3180
caaaaaaatg aaaaactact ggcgtcaact gctgaacgcg aaacttatta cacaacgcaa 3240
atttgacaat ctgacaaaag cagaaagagg cggactgtca gaacttgata aagcgggttt 3300
tatcaaaaga cagctggtcg aaacacgcca gattacaaaa catgttgcgc aaattctgga 3360
tagccgcatg aacacaaaat atgacgaaaa cgataaactg atccgggaag tcaaagtcat 3420
tacgctgaaa tcaaaactgg tcagcgattt tcgcaaagac tttcagtttt acaaagtccg 3480
cgaaatcaac aactaccatc atgcacatga tgcatatctg aatgcagttg tcggcacagc 3540
gcttatcaaa aaatacccta aactggaaag cgaatttgtc tacggcgact ataaagtcta 3600
tgatgtccgc aaaatgattg cgaaaagcga acaagaaatt ggcaaagcga cagcgaaata 3660
ctttttttac agcaacatca tgaacttttt taaaacggaa atcacactgg cgaacggcga 3720
aattagaaaa agaccgctta ttgaaacgaa cggtgaaaca ggcgaaattg tttgggataa 3780
aggcagagat tttgcaacag ttagaaaagt tctgagcatg ccgcaagtca acatcgtgaa 3840
aaaaacagaa gttcagacag gcggatttag caaagaatca attcttccga aacgcaactc 3900
agacaaactg attgcgcgta aaaaagactg ggacccgaaa aaatacggtg gctttgattc 3960
accgacagtt gcatattcag ttctggttgt tgcgaaagtg gaaaaaggca aatccaaaaa 4020
acttaaaagc gtgaaagaac ttctgggcat cacaattatg gaacgctcga gctttgaaaa 4080
aaacccgatc gactttctgg aagccaaagg ctataaagaa gtgaaaaaag accttattat 4140
caaactgccg aaatacagcc tgtttgaact ggaaaatggc agaaaacgca tgctggcatc 4200
agcaggcgaa cttcagaaag gcaatgaact ggcactgccg tcaaaatatg ttaactttct 4260
gtatctggcg agccattacg aaaaacttaa aggctcaccg gaagataacg aacagaaaca 4320
actgtttgtc gaacagcata aacattacct ggacgaaatc atcgaacaaa tcagcgaatt 4380
ttcaaaacgc gttattctgg cagatgcgaa cctggataaa gttcttagcg catataacaa 4440
acaccgggat aaaccgatta gagaacaagc ggaaaatatc attcacctgt ttacactgac 4500
aaatcttggc gcaccggcag cgtttaaata ctttgataca acaattgacc gcaaacgcta 4560
cacaagcaca aaagaagttc tggacgcaac actgattcat caatcaatta caggccttta 4620
tgaaacgagc attgatctgt cacaactggg aggcgattga tgctgtccag actgtccgct 4680
gtgtaaaaaa aaggaataaa ggggggttga cattatttta ctgatatgta taatataatt 4740
tgtataagaa aatgtcttac aaagaaggga aggtgtttta gagctagaaa tagcaagtta 4800
aaataaggct agtccgttat caacttgaaa aagtggcacc gagtcggtgc tttgcggccg 4860
cagatctggg accaataata atgactagag aagaaagaat gaagattgtt catgaaatta 4920
aggaacgaat attggataaa gtgggatatt tttaaaatat atatttatgt tacagtaata 4980
ttgactttta aaaaaggatt gattctaatg aagaaagcag acaagtaagc ctcctaaatt 5040
cactttagat aaaaatttag gaggcatatc aaatgaactt taataaaatt gatttagaca 5100
attggaagag aaaagagata tttaatcatt atttgaacca acaaacgact tttagtataa 5160
ccacagaaat tgatattagt gttttatacc gaaacataaa acaagaagga tataaatttt 5220
accctgcatt tattttctta gtgacaaggg tgataaactc aaatacagct tttagaactg 5280
gttacaatag cgacggagag ttaggttatt gggataagtt agagccactt tatacaattt 5340
ttgatggtgt atctaaaaca ttctctggta tttggactcc tgtaaagaat gacttcaaag 5400
agttttatga tttatacctt tctgatgtag agaaatataa tggttcgggg aaattgtttc 5460
ccaaaacacc tatacctgaa aatgcttttt ctctttctat tattccatgg acttcattta 5520
ctgggtttaa cttaaatatc aataataata gtaattacct tctacccatt attacagcag 5580
gaaaattcat taataaaggt aattcaatat atttaccgct atctttacag gtacatcatt 5640
ctgtttgtga tggttatcat gcaggattgt ttatgaactc tattcaggaa ttgtcagata 5700
ggcctaatga ctggctttta taatatgaga taatgccgac tggctagcat ggcaagaccc 5760
agaaaagttc tgggagatcc cgctttgcat aagcgtatta tagtggatga cgcgggcttt 5820
gttgtttaca cttcttgcac ctgctgacgg caatcatccc tatctatgaa atcgagattt 5880
cagcaggccg ttattttcga gagagttaaa tctatattca ttgtttttat tttggtaagg 5940
acataccgga ttttaggttt ggattaccgg tcgagttagc ttgtcttttc gcccactacc 6000
gtgtcgatgc gggagcaatt taccagaagc acttaccgat tgatagtttt ttattccggt 6060
gattgcaaag tttcataaac aagcttgcat gcctgcaggt cgattcacaa aaaataggca 6120
cacgaaaaac aagttaaggg atgcagttta tgcatccctt aacttactta ttaaataatt 6180
tatagctatt gaaaagagat aagaattgtt caaagctaat attgtttaaa tcgtcaattc 6240
ctgcatgttt taaggaattg ttaaattgat tttttgtaaa tattttcttg tattctttgt 6300
taacccattt cataacgaaa taattatact tttgtttatc tttgtgtgat attcttgatt 6360
tttttctact taatctgata agtgagctat tcactttagg tttaggatga aaatattctc 6420
ttggaaccat acttaatata gaaatatcaa cttctgccat taaaagtaat gccaatgagc 6480
gttttgtatt taataatctt ttagcaaacc cgtattccac gattaaataa atctcattag 6540
ctatactatc aaaaacaatt ttgcgtatta tatccgtact tatgttataa ggtatattac 6600
catatatttt ataggattgg tttttaggaa atttaaactg caatatatcc ttgtttaaaa 6660
cttggaaatt atcgtgatca acaagtttat tttctgtagt tttgcataat ttatggtcta 6720
tttcaatggc agttacgaaa ttacacctct ttactaattc aagggtaaaa tggccttttc 6780
ctgagccgat ttcaaagata ttatcatgtt catttaatct tatatttgtc attattttat 6840
ctatattatg ttttgaagta ataaagtttt gactgtgttt tatatttttc tcgttcatta 6900
taaccctctt taatttggtt atatgaattt tgcttattaa cgattcatta taaccactta 6960
ttttttgttt ggttgataat gaactgtgct gattacaaaa atactaaaaa tgcccatatt 7020
ttttcctcct tataaaatta gtataattat agcacgagct ctgataaata tgaacatgat 7080
gagtgatcgt taaatttata ctgcaatcgg atgcgattat tgaataaaag atatgagaga 7140
tttatctaat ttcttttttc ttgtaaaaaa agaaagttct taaaggtttt atagttttgg 7200
tcgtagagca cacggtttaa cgacttaatt acgaagtaaa taagtctagt gtgttagact 7260
ttatgaaatc tatatacgtt tatatatatt tattatccgg aggtgtagca tgtctcattc 7320
aattttgagg gttgccagag ttaaaggatc aagtaataca aacgggatac aaagacataa 7380
tcaaagagag aataaaaact ataataataa agacataaat catgaggaaa catataaaaa 7440
ttatgatttg attaacgcac aaaatataaa gtataaagat aaaattgatg aaacgattga 7500
tgagaattat tcagggaaac gtaaaattcg gtcagatgca attcgacatg tggacggact 7560
ggttacaagt gataaagatt tctttgatga tttaagcgga gaagaaatag aacgattttt 7620
taaagatagc ttggagtttc tagaaaatga atacggtaag gaaaatatgc tgtatgcgac 7680
tgtccatctg gatgaaagag tcccacatat gcactttggt tttgtccctt taacagagga 7740
cgggagattg tctgcaaaag aacagttagg caacaagaaa gactttactc aattacaaga 7800
tagatttaat gagtatgtga atgagaaagg ttatgaactt gaaagaggca cgtccaaaga 7860
ggttacagaa cgagaacata aagcgatgga tcagtacaag aaagatactg tatttcataa 7920
acaggaactg caagaagtta aggatgagtt acagaaggca aataagcagt tacagagtgg 7980
aatagagcat atgaggtcta cgaaaccctt tgattatgaa aatgagcgta caggtttgtt 8040
ctctggacgt gaagagactg gtagaaagat attaactgct gatgaatttg aacgcctgca 8100
agaaacaatc tcttctgcag aacggattgt tgatgattac gaaaatatta agagcacaga 8160
ctattacaca gaaaatcaag aattaaaaaa acgtagagag agtttgaaag aagtagtgaa 8220
tacatggaaa gaggggtatc acgaaaaaag taaagaggtt aataaattaa agcgagagaa 8280
tgatagtttg aatgagcagt tgaatgtatc agagaaattt caagctagta cagtgacttt 8340
atatcgtgct gcgagggcga atttccctgg gtttgagaaa gggtttaata ggcttaaaga 8400
gaaattcttt aatgattcca aatttgagcg tgtgggacag tttatggatg ttgtacagga 8460
taatgtccag aaggtcgata gaaagcgtga gaaacagcgt acagacgatt tagagatgta 8520
gaggtacttt tatgccgaga aaactttttg cgtgtgacag tccttaaaat atacttagag 8580
cgtaagcgaa agtagtagcg acagctatta actttcggtt tcaaagctct aggattttta 8640
atggacgcag cgcatcacac gcaaaaagga aattggaata aatgcgaaat ttgagatgtt 8700
aattaaagac ctttttgagg tctttttttc ttagattttt ggggttattt aggggagaaa 8760
acataggggg gtactacgac ctccccccta ggtgtccatt gtccattgtc caaacaaata 8820
aataaatatt gggtttttaa tgttaaaagg ttgtttttta tgttaaagtg aaaaaaacag 8880
atgttgggag gtacagtgat ggttgtagat agaaaagaag agaaaaaagt tgctgttact 8940
ttaagactta caacagaaga aaatgagata ttaaatagaa tcaaagaaaa atataatatt 9000
agcaaatcag atgcaaccgg tattctaata aaaaaatatg caaaggagga atacggtgca 9060
ttttaaacaa aaaaagatag acagcactgg catgctgcct atctatgact aaattttgtt 9120
aagtgtatta gcaccgttat tatatcatga gcgaaaatgt aataaaagaa actgaaaaca 9180
agaaaaattc aagaggacgt aattggacat ttgttttata tccagaatca gcaaaagccg 9240
agtggttaga gtatttaaaa gagttacaca ttcaatttgt agtgtctcca ttacatgata 9300
gggatactga tacagaaggt aggatgaaaa aagagcatta tcatattcta gtgatgtatg 9360
agggtaataa atcttatgaa cagataaaaa taattacaga agaattgaat gcgactattc 9420
cgcagattgc aggaagtgtg aaaggtcttg tgagatatat gcttcacatg gacgatccta 9480
ataaatttaa atatcaaaaa gaagatatga tagtttatgg cggtgtagat gttgatgaat 9540
tattaaagaa aacaacaaca gatagatata aattaattaa agaaatgatt gagtttattg 9600
atgaacaagg aatcgtagaa tttaagagtt taatggatta tgcaatgaag tttaaatttg 9660
atgattggtt cccgctttta tgtgataact cggcgtatgt tattcaagaa tatataaaat 9720
caaatcggta taaatctgac cgatagattt tgaatttagg tgtcacaaga cactcttttt 9780
tcgcaccagc gaaaactggt ttaagccgac tgcgcaaaag acataatcga ctctagagga 9840
tccccgggta ccgagctctg ccttttagtc cagctgattt cactttttgc attctacaaa 9900
ctgcataact catatgtaaa tcgctccttt ttaggtggca caaatgtgag gcattttcgc 9960
tctttccggc aaccacttcc aagtaaagta taacacacta tactttatat tcataaagtg 10020
tgtgctctgc gaggctgtcg gcagtgccga ccaaaaccat aaaaccttta agacctttct 10080
tttttttacg agaaaaaaga aacaaaaaaa cctgccctct gccacctcag caaagggggg 10140
ttttgctctc gtgctcgttt aaaaatcagc aagggacagg tagtattttt tgagaagatc 10200
actcaaaaaa tctccacctt taaacccttg ccaattttta ttttgtccgt tttgtctagc 10260
ttaccgaaag ccagactcag caagaataaa atttttattg tctttcggtt ttctagtgta 10320
acggacaaaa ccactcaaaa taaaaaagat acaagagagg tctctcgtat cttttattca 10380
gcaatcgcgc ccgattgctg aacagattaa taatgagctc g 10421
<210> 30
<211> 4107
<212> DNA
<213> 人工序列
<220>
<223> 表1,密码子优化的Cas9d编码序列
<400> 30
atggacaaaa aatacagcat cggcctggct attggcacaa attcagttgg ctgggcagtt 60
atcacagacg aatataaagt tccgagcaaa aaatttaaag tcctgggcaa tacagatcgc 120
catagcatca aaaaaaacct gattggcgca ctgctgtttg attcaggcga aacagcagaa 180
gcaacaagac ttaaaagaac agcaagacgc agatatacaa gacgcaaaaa tcgcatttgc 240
tatctgcaag aaatctttag caacgaaatg gcgaaagtcg acgacagctt ttttcataga 300
ctggaagaat catttctggt cgaagaagat aaaaaacacg aacgccatcc gatttttggc 360
aacattgttg atgaagtcgc gtatcatgaa aaatacccga caatttatca tctgcgcaaa 420
aaactggttg acagcacaga taaagcagat cttcgcctga tttatctggc actggcacat 480
atgatcaaat ttagaggcca ttttctgatc gaaggcgatc tgaatccgga taattcagat 540
gtcgacaaac tgtttattca gctggtccag acatataacc agctgtttga agaaaatccg 600
attaatgcat caggcgttga tgcaaaagca attctgtcag caagactgtc aaaatcaaga 660
cgcctggaaa atctgattgc acaactgcct ggcgaaaaaa aaaatggact gtttggcaat 720
cttattgcac tgtcactggg cctgacaccg aactttaaat caaattttga tctggcggaa 780
gatgcgaaac tgcaactttc aaaagatacg tatgatgacg atctggataa tctgctggcg 840
caaattggcg atcaatatgc agatcttttt ctggcagcga aaaatctgtc agatgcaatt 900
ctgctgtcag atattctgcg cgtcaataca gaaattacaa aagcaccgct gagcgcgagc 960
atgattaaaa gatatgatga acatcatcag gacctgacac tgctgaaagc actggttaga 1020
caacaactgc cggaaaaata caaagaaatc ttttttgatc agagcaaaaa cggctatgca 1080
ggctatattg atggcggagc atcacaagaa gaattttaca aatttatcaa accgatcctg 1140
gaaaaaatgg atggaacaga agaactgctg gttaaactga atcgcgaaga tttactgaga 1200
aaacagcgca catttgataa tggctcaatt ccgcatcaaa ttcatctggg cgaactgcat 1260
gcgattctta gacgccaaga agatttttat ccgtttctga aagacaaccg ggaaaaaatt 1320
gaaaaaatcc tgacatttcg catcccgtat tatgtcggac cgctggcaag aggcaattca 1380
agatttgcat ggatgacacg caaaagcgaa gaaacaatta caccgtggaa ttttgaagaa 1440
gtcgttgata aaggcgcaag cgcacaatca tttattgaac gcatgacgaa ctttgacaaa 1500
aacctgccga atgaaaaagt cctgccgaaa cattcactgc tgtatgaata ctttacggtc 1560
tataatgaac tgacgaaagt caaatatgtc acagaaggca tgagaaaacc ggcatttctg 1620
tcaggcgaac agaaaaaagc gattgtcgat cttctgttta aaacgaaccg caaagtcaca 1680
gtgaaacagc tgaaagaaga ttactttaaa aaaatcgaat gctttgatag cgtcgaaatc 1740
tcaggcgtcg aagatagatt taatgcaagc ctgggcacat atcatgatct gctgaaaatc 1800
atcaaagata aagattttct ggataacgaa gaaaacgaag atatcctgga agatattgtg 1860
ctgacactga cgctttttga agatcgcgaa atgattgaag aacgcctgaa aacatatgcg 1920
cacctgtttg atgataaagt catgaaacaa cttaaacgca gacgctatac aggctggggc 1980
agactttcaa gaaaactgat taacggcatt cgcgataaac aaagcggcaa aacaatcctg 2040
gattttctga aatcagatgg ctttgcgaat cgcaatttta tgcagctgat tcatgatgac 2100
agcctgacgt ttaaagaaga tattcagaaa gcacaagttt caggccaagg cgattcactg 2160
catgaacata ttgcaaatct ggcaggctca ccggcaatca aaaaaggcat tctgcaaaca 2220
gttaaagtcg tcgatgaact ggttaaagtt atgggcagac ataaaccgga aaacatcgtt 2280
attgaaatgg cacgcgaaaa tcagacaaca caaaaaggac agaaaaattc acgcgaacgg 2340
atgaaaagaa ttgaagaagg cattaaagaa ctgggcagcc aaatcctgaa agaacatccg 2400
gttgaaaata cacagctgca gaacgaaaaa ctgtatctgt attatctgca gaatggacgc 2460
gatatgtatg tcgatcaaga actggatatt aatcgcctga gcgattatga tgtggatgct 2520
attgttccgc agagctttct taaagatgat agcatcgata acaaagtcct gacacgctca 2580
gataaaaaca gaggcaaatc agataatgtc ccgtcagaag aggttgtcaa aaaaatgaaa 2640
aactactggc gtcaactgct gaacgcgaaa cttattacac aacgcaaatt tgacaatctg 2700
acaaaagcag aaagaggcgg actgtcagaa cttgataaag cgggttttat caaaagacag 2760
ctggtcgaaa cacgccagat tacaaaacat gttgcgcaaa ttctggatag ccgcatgaac 2820
acaaaatatg acgaaaacga taaactgatc cgggaagtca aagtcattac gctgaaatca 2880
aaactggtca gcgattttcg caaagacttt cagttttaca aagtccgcga aatcaacaac 2940
taccatcatg cacatgatgc atatctgaat gcagttgtcg gcacagcgct tatcaaaaaa 3000
taccctaaac tggaaagcga atttgtctac ggcgactata aagtctatga tgtccgcaaa 3060
atgattgcga aaagcgaaca agaaattggc aaagcgacag cgaaatactt tttttacagc 3120
aacatcatga acttttttaa aacggaaatc acactggcga acggcgaaat tagaaaaaga 3180
ccgcttattg aaacgaacgg tgaaacaggc gaaattgttt gggataaagg cagagatttt 3240
gcaacagtta gaaaagttct gagcatgccg caagtcaaca tcgtgaaaaa aacagaagtt 3300
cagacaggcg gatttagcaa agaatcaatt cttccgaaac gcaactcaga caaactgatt 3360
gcgcgtaaaa aagactggga cccgaaaaaa tacggtggct ttgattcacc gacagttgca 3420
tattcagttc tggttgttgc gaaagtggaa aaaggcaaat ccaaaaaact taaaagcgtg 3480
aaagaacttc tgggcatcac aattatggaa cgctcgagct ttgaaaaaaa cccgatcgac 3540
tttctggaag ccaaaggcta taaagaagtg aaaaaagacc ttattatcaa actgccgaaa 3600
tacagcctgt ttgaactgga aaatggcaga aaacgcatgc tggcatcagc aggcgaactt 3660
cagaaaggca atgaactggc actgccgtca aaatatgtta actttctgta tctggcgagc 3720
cattacgaaa aacttaaagg ctcaccggaa gataacgaac agaaacaact gtttgtcgaa 3780
cagcataaac attacctgga cgaaatcatc gaacaaatca gcgaattttc aaaacgcgtt 3840
attctggcag atgcgaacct ggataaagtt cttagcgcat ataacaaaca ccgggataaa 3900
ccgattagag aacaagcgga aaatatcatt cacctgttta cactgacaaa tcttggcgca 3960
ccggcagcgt ttaaatactt tgatacaaca attgaccgca aacgctacac aagcacaaaa 4020
gaagttctgg acgcaacact gattcatcaa tcaattacag gcctttatga aacgagcatt 4080
gatctgtcac aactgggagg cgattga 4107
<210> 31
<211> 205
<212> DNA
<213> 人工序列
<220>
<223> 含有scBAN启动子减去其核糖体结合位点,加上靶向DNA顶部链的yjbH指导RNA的合成DNA片段。
<400> 31
aagctttgct gtccagactg tccgctgtgt aaaaaaaagg aataaagggg ggttgacatt 60
attttactga tatgtataat ataatttgta taagaaaatg tacaaacatc tgggaaatac 120
gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 180
ggcaccgagt cggtgcttta agctt 205
<210> 32
<211> 44
<212> DNA
<213> 人工序列
<220>
<223> 引物 1216467
<400> 32
cctcgaggtc gacggtatcg ataagctttg ctgtccagac tgtc 44
<210> 33
<211> 44
<212> DNA
<213> 人工序列
<220>
<223> 引物 1216468
<400> 33
gctgcaggaa ttcgatatca agcttaaagc accgactcgg tgcc 44
<210> 34
<211> 205
<212> DNA
<213> 人工序列
<220>
<223> 含有scBAN启动子减去其核糖体结合位点,加上靶向DNA底部链的yjbH指导RNA的合成DNA片段。
<400> 34
aagctttgct gtccagactg tccgctgtgt aaaaaaaagg aataaagggg ggttgacatt 60
attttactga tatgtataat ataatttgta taagaaaatg accctttatg tcctgaatgc 120
gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 180
ggcaccgagt cggtgcttta agctt 205
<210> 35
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 引物 1209582
<400> 35
ctgcgtgtgc ctacagat 18
<210> 36
<211> 51
<212> DNA
<213> 人工序列
<220>
<223> 引物 1216378
<400> 36
gcctattgag tatttcttat ccattcggtt ccctcctcat ttttatagag c 51
<210> 37
<211> 51
<212> DNA
<213> 人工序列
<220>
<223> 引物 1216377
<400> 37
gctctataaa aatgaggagg gaaccgaatg gataagaaat actcaatagg c 51
<210> 38
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 引物 1217984
<400> 38
catcataatc acttaaacga ttaatatcta attcttggtc cacatacatg tc 52
<210> 39
<211> 1670
<212> DNA
<213> 人工序列
<220>
<223> 用于多核苷酸片段的PCR扩增的合成DNA模板,所述多核苷酸包含cas9基因的化脓性链球菌Cas9(H840A)编码部分。
<400> 39
tgtggaccaa gaattagata ttaatcgttt aagtgattat gatgtcgatg ccattgttcc 60
acaaagtttc cttaaagacg attcaataga caataaggtc ttaacgcgtt ctgataaaaa 120
tcgtggtaaa tcggataacg ttccaagtga agaagtagtc aaaaagatga aaaactattg 180
gagacaactt ctaaacgcca agttaatcac tcaacgtaag tttgataatt taacgaaagc 240
tgaacgtgga ggtttgagtg aacttgataa agctggtttt atcaaacgcc aattggttga 300
aactcgccaa atcactaagc atgtggcaca aattttggat agtcgcatga atactaaata 360
cgatgaaaat gataaactta ttcgagaggt taaagtgatt accttaaaat ctaaattagt 420
ttctgacttc cgaaaagatt tccaattcta taaagtacgt gagattaaca attaccatca 480
tgcccatgat gcgtatctaa atgccgtcgt tggaactgct ttgattaaga aatatccaaa 540
acttgaatcg gagtttgtct atggtgatta taaagtttat gatgttcgta aaatgattgc 600
taagtctgag caagaaatag gcaaagcaac cgcaaaatat ttcttttact ctaatatcat 660
gaacttcttc aaaacagaaa ttacacttgc aaatggagag attcgcaaac gccctctaat 720
cgaaactaat ggggaaactg gagaaattgt ctgggataaa gggcgagatt ttgccacagt 780
gcgcaaagta ttgtccatgc cccaagtcaa tattgtcaag aaaacagaag tacagacagg 840
cggattctcc aaggagtcaa ttttaccaaa aagaaattcg gacaagctta ttgctcgtaa 900
aaaagactgg gatccaaaaa aatatggtgg ttttgatagt ccaacggtag cttattcagt 960
cctagtggtt gctaaggtgg aaaaagggaa atcgaagaag ttaaaatccg ttaaagagtt 1020
actagggatc acaattatgg aaagaagttc ctttgaaaaa aatccgattg actttttaga 1080
agctaaagga tataaggaag ttaaaaaaga cttaatcatt aaactaccta aatatagtct 1140
ttttgagtta gaaaacggtc gtaaacggat gctggctagt gccggagaat tacaaaaagg 1200
aaatgagctg gctctgccaa gcaaatatgt gaatttttta tatttagcta gtcattatga 1260
aaagttgaag ggtagtccag aagataacga acaaaaacaa ttgtttgtgg agcagcataa 1320
gcattattta gatgagatta ttgagcaaat cagtgaattt tctaagcgtg ttattttagc 1380
agatgccaat ttagataaag ttcttagtgc atataacaaa catagagaca aaccaatacg 1440
tgaacaagca gaaaatatta ttcatttatt tacgttgacg aatcttggag ctcccgctgc 1500
ttttaaatat tttgatacaa caattgatcg taaacgatat acgtctacaa aagaagtttt 1560
agatgccact cttatccatc aatccatcac tggtctttat gaaacacgca ttgatttgag 1620
tcagctagga ggtgactgaa cgcgttaatc aataaaaaaa cgctgtgcgg 1670
<210> 40
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物 1213933
<400> 40
tgtggaccaa gaattagata 20
<210> 41
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 引物 1214793
<400> 41
tttcttaatc aaagcagttc caacg 25
<210> 42
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 引物 1213934
<400> 42
cgttggaact gctttgatta agaaa 25
<210> 43
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物 1209587
<400> 43
gtgtcgatca gcttcttcag c 21
Claims (28)
1.一种通过阻遏一个或多个目的基因组靶序列的表达来改善微生物宿主细胞的至少一个特性的方法,所述方法包括以下步骤:
a)提供微生物宿主细胞,所述微生物宿主细胞包含待阻遏的一个或多个目的基因组靶序列,其中每个靶序列包含或侧接针对II类Cas9酶的功能性PAM序列;
b)用以下转化所述宿主细胞:
i)编码所述II类Cas9酶的无效核酸酶变体的多核苷酸,
ii)编码针对每个待阻遏的靶序列的单指导RNA或指导RNA复合物的多核苷酸,所述单指导RNA或指导RNA复合物包含:
a)第一RNA序列,其包含20个或更多个核苷酸并且包含tracr配对序列,所述核苷酸与至少一个待阻遏的基因组靶序列至少80%互补并且能够与至少一个待阻遏的基因组靶序列杂交,以及
b)第二RNA序列,其包含与所述tracr配对序列互补并且能够与所述tracr配对序列杂交的tracr序列;
其中所述第一RNA序列的20个或更多个核苷酸与所述一个或多个基因组靶序列杂交,并且其中所述无效核酸酶变体II类Cas9酶与所述单指导RNA或所述指导RNA复合物相互作用并且与所述一个或多个基因组靶序列结合,从而阻遏其表达并改善所述宿主细胞的至少一个特性。
2.如权利要求1所述的方法,其中所述微生物宿主细胞是芽孢杆菌属宿主细胞;优选地,所述宿主细胞选自芽孢杆菌属物种组成的组,该组由以下组成:嗜碱芽孢杆菌、高地芽孢杆菌、解淀粉芽孢杆菌、植物解淀粉芽孢杆菌亚种、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚硬芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、甲基营养型芽孢杆菌、短小芽孢杆菌、沙福芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌以及苏云金芽孢杆菌。
3.如权利要求2所述的方法,其中所述待阻遏的一个或多个目的基因组靶序列包含mecA和/或yjbH基因或其同系物。
4.如前述权利要求中任一项所述的方法,其中所述待阻遏的一个或多个基因组靶序列包含至少20个核苷酸;优选地,所述待阻遏的一个或多个基因组靶序列包含在编码多肽的可读框中。
5.如前述权利要求中任一项所述的方法,其中所述II类Cas9酶的所述无效核酸酶变体在对应于化脓性链霉菌Cas9氨基酸序列中的位置10的氨基酸位置处包含取代;优选地,所述II类Cas9酶的所述无效核酸酶变体在化脓性链霉菌Cas9氨基酸序列中包含天冬氨酸取代丙氨酸,D10A。
6.如前述权利要求中任一项所述的方法,其中所述II类Cas9酶的所述无效核酸酶变体在对应于化脓性链霉菌Cas9氨基酸序列中的位置840的氨基酸位置处包含取代;优选地,所述II类Cas9酶的所述无效核酸酶变体在化脓性链霉菌Cas9氨基酸序列中包含组氨酸取代丙氨酸,H840A。
7.如前述权利要求中任一项所述的方法,其中所述单指导RNA或RNA复合物包含第一RNA,所述第一RNA包含与所述一个或多个基因组靶序列至少85%互补并且能够与所述一个或多个基因组靶序列杂交的20个或更多个核苷酸;优选地,所述20个或更多个核苷酸与所述一个或多个基因组靶序列至少90%、95%、97%、98%、99%或甚至100%互补并且能够与所述一个或多个基因组靶序列杂交。
8.如前述权利要求中任一项所述的方法,其中所述微生物宿主细胞包含单指导RNA,所述单指导RNA包含呈单个多核苷酸形式的第一和第二RNA,并且其中当彼此杂交时,所述tracr配对序列和所述tracr序列形成茎环结构。
9.如前述权利要求中任一项所述的方法,其中所述宿主细胞中的两个或更多个基因组靶序列被阻遏。
10.如前述权利要求中任一项所述的方法,其中所述改善的特性是改善的转化效率。
11.如前述权利要求中任一项所述的方法,其中所述改善的特性是减少的蛋白酶表达。
12.如前述权利要求中任一项所述的方法,其中所述改善的特性是由所述宿主细胞产生的异源多肽的改善的生产力或产率。
13.如权利要求12所述的方法,其中所述异源多肽是选自下组的一种或多种酶,该组由以下组成:水解酶、异构酶、连接酶、裂解酶、氧化还原酶、或转移酶;优选地,所述酶是α-淀粉酶、α-半乳糖苷酶、α-葡糖苷酶、氨肽酶、淀粉酶、天冬酰胺酶、β-半乳糖苷酶、β-葡糖苷酶、β-木糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、绿色荧光蛋白、葡聚糖转移酶、葡糖淀粉酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶、氧化酶、果胶分解酶、过氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、或木聚糖酶。
14.如前述权利要求中任一项所述的方法,其中所述一个或多个目的基因组靶序列被所述II类Cas9酶的温度敏感无效核酸酶变体瞬时阻遏;优选地,所述II类Cas9酶的所述温度敏感无效核酸酶变体在如下温度不能与所述一个或多个基因组靶序列结合:高于35℃;优选地,高于36℃;高于37℃;高于38℃;高于39℃;高于40℃;高于41℃;高于42℃;高于43℃;高于44℃;或最优选地,高于45℃。
15.一种微生物宿主细胞,所述微生物宿主细胞具有至少一种改善的特性,其中一个或多个目的基因组靶序列的表达被阻遏,所述宿主细胞包含:
a)一个或多个被阻遏的目的基因组靶序列,其中每个靶序列包含或侧接针对II类Cas9酶的功能性PAM序列;
b)编码所述II类Cas9酶的无效核酸酶变体的多核苷酸,
c)编码针对每个被阻遏的靶序列的单指导RNA或指导RNA复合物的多核苷酸,所述单指导RNA或指导RNA复合物包含:
i)第一RNA序列,其包含20个或更多个核苷酸并且包含tracr配对序列,所述核苷酸与至少一个被阻遏的基因组靶序列至少80%互补并且能够与至少一个被阻遏的基因组靶序列杂交,以及
ii)第二RNA序列,其包含与所述tracr配对序列互补并且能够与所述tracr配对序列杂交的tracr序列;
其中所述第一RNA序列的20个或更多个核苷酸与所述一个或多个基因组靶序列杂交,并且其中所述无效核酸酶变体II类Cas9酶与所述单指导RNA或所述指导RNA复合物相互作用并且与所述一个或多个基因组靶序列结合,从而阻遏其表达并改善所述宿主细胞的至少一个特性。
16.如权利要求15所述的微生物宿主细胞,所述微生物宿主细胞是芽孢杆菌属宿主细胞;优选地,所述宿主细胞选自芽孢杆菌属物种组成的组,该组由以下组成:嗜碱芽孢杆菌、高地芽孢杆菌、解淀粉芽孢杆菌、植物解淀粉芽孢杆菌亚种、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚硬芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、甲基营养型芽孢杆菌、短小芽孢杆菌、沙福芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌以及苏云金芽孢杆菌。
17.如权利要求16所述的微生物宿主细胞,其中所述待阻遏的一个或多个目的基因组靶序列包含mecA和/或yjbH基因或其同系物。
18.如权利要求15-17中任一项所述的微生物宿主细胞,其中所述待阻遏的一个或多个基因组靶序列包含至少20个核苷酸;优选地,所述待阻遏的一个或多个基因组靶序列包含在编码多肽的可读框中。
19.如权利要求15-18中任一项所述的微生物宿主细胞,其中所述II类Cas9酶的所述无效核酸酶变体在对应于化脓性链霉菌Cas9氨基酸序列中的位置10的氨基酸位置处包含取代;优选地,所述II类Cas9酶的所述无效核酸酶变体在化脓性链霉菌Cas9氨基酸序列中包含天冬氨酸取代丙氨酸,D10A。
20.如权利要求15-19中任一项所述的微生物宿主细胞,其中所述II类Cas9酶的所述无效核酸酶变体在对应于化脓性链霉菌Cas9氨基酸序列中的位置840的氨基酸位置处包含取代;优选地,所述II类Cas9酶的所述无效核酸酶变体在化脓性链霉菌Cas9氨基酸序列中包含组氨酸取代丙氨酸,H840A。
21.如权利要求15-20中任一项所述的微生物宿主细胞,其中所述单指导RNA或RNA复合物包含第一RNA,所述第一RNA包含与所述一个或多个基因组靶序列至少85%互补并且能够与所述一个或多个基因组靶序列杂交的20个或更多个核苷酸;优选地,所述20个或更多个核苷酸与所述一个或多个基因组靶序列至少90%、95%、97%、98%、99%或甚至100%互补并且能够与所述一个或多个基因组靶序列杂交。
22.如权利要求15-21中任一项所述的微生物宿主细胞,其中所述微生物宿主细胞包含单指导RNA,所述单指导RNA包含呈单个多核苷酸形式的第一和第二RNA,并且其中当彼此杂交时,所述tracr配对序列和所述tracr序列形成茎环结构。
23.如权利要求15-22中任一项所述的微生物宿主细胞,其中所述宿主细胞中的两个或更多个基因组靶序列被阻遏。
24.如权利要求15-23中任一项所述的微生物宿主细胞,其中所述改善的特性是改善的转化效率。
25.如权利要求15-24中任一项所述的微生物宿主细胞,其中所述改善的特性是减少的蛋白酶表达。
26.如权利要求15-25中任一项所述的微生物宿主细胞,其中所述改善的特性是由所述宿主细胞产生的异源多肽的改善的生产力或产率。
27.如权利要求26所述的方法,其中所述异源多肽是选自下组的一种或多种酶,该组由以下组成:水解酶、异构酶、连接酶、裂解酶、氧化还原酶、或转移酶;优选地,所述酶是α-淀粉酶、α-半乳糖苷酶、α-葡糖苷酶、氨肽酶、淀粉酶、天冬酰胺酶、β-半乳糖苷酶、β-葡糖苷酶、β-木糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、绿色荧光蛋白、葡聚糖转移酶、葡糖淀粉酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶、氧化酶、果胶分解酶、过氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、或木聚糖酶。
28.如权利要求15-27中任一项所述的微生物宿主细胞,其中所述一个或多个目的基因组靶序列被所述II类Cas9酶的温度敏感无效核酸酶变体瞬时阻遏;优选地,所述II类Cas9酶的所述温度敏感无效核酸酶变体在如下温度不能与所述一个或多个基因组靶序列结合:高于35℃;优选地,高于36℃;高于37℃;高于38℃;高于39℃;高于40℃;高于41℃;高于42℃;高于43℃;高于44℃;或最优选地,高于45℃。
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201662358644P | 2016-07-06 | 2016-07-06 | |
| US62/358,644 | 2016-07-06 | ||
| PCT/US2017/040689 WO2018009520A1 (en) | 2016-07-06 | 2017-07-05 | Improving a microorganism by crispr-inhibition |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN109312353A true CN109312353A (zh) | 2019-02-05 |
Family
ID=59363265
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201780034269.3A Pending CN109312353A (zh) | 2016-07-06 | 2017-07-05 | 通过crispr-抑制来改善微生物 |
Country Status (4)
| Country | Link |
|---|---|
| US (1) | US20190185847A1 (zh) |
| EP (1) | EP3481959A1 (zh) |
| CN (1) | CN109312353A (zh) |
| WO (1) | WO2018009520A1 (zh) |
Families Citing this family (49)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP6261500B2 (ja) | 2011-07-22 | 2018-01-17 | プレジデント アンド フェローズ オブ ハーバード カレッジ | ヌクレアーゼ切断特異性の評価および改善 |
| US20150044192A1 (en) | 2013-08-09 | 2015-02-12 | President And Fellows Of Harvard College | Methods for identifying a target site of a cas9 nuclease |
| US9359599B2 (en) | 2013-08-22 | 2016-06-07 | President And Fellows Of Harvard College | Engineered transcription activator-like effector (TALE) domains and uses thereof |
| US9228207B2 (en) | 2013-09-06 | 2016-01-05 | President And Fellows Of Harvard College | Switchable gRNAs comprising aptamers |
| US9322037B2 (en) | 2013-09-06 | 2016-04-26 | President And Fellows Of Harvard College | Cas9-FokI fusion proteins and uses thereof |
| US9737604B2 (en) | 2013-09-06 | 2017-08-22 | President And Fellows Of Harvard College | Use of cationic lipids to deliver CAS9 |
| US9068179B1 (en) | 2013-12-12 | 2015-06-30 | President And Fellows Of Harvard College | Methods for correcting presenilin point mutations |
| US10077453B2 (en) | 2014-07-30 | 2018-09-18 | President And Fellows Of Harvard College | CAS9 proteins including ligand-dependent inteins |
| EP3365356B1 (en) | 2015-10-23 | 2023-06-28 | President and Fellows of Harvard College | Nucleobase editors and uses thereof |
| JP7231935B2 (ja) | 2016-08-03 | 2023-03-08 | プレジデント アンド フェローズ オブ ハーバード カレッジ | アデノシン核酸塩基編集因子およびそれらの使用 |
| EP3497214B1 (en) | 2016-08-09 | 2023-06-28 | President and Fellows of Harvard College | Programmable cas9-recombinase fusion proteins and uses thereof |
| WO2018039438A1 (en) | 2016-08-24 | 2018-03-01 | President And Fellows Of Harvard College | Incorporation of unnatural amino acids into proteins using base editing |
| EP3526320A1 (en) | 2016-10-14 | 2019-08-21 | President and Fellows of Harvard College | Aav delivery of nucleobase editors |
| US10745677B2 (en) | 2016-12-23 | 2020-08-18 | President And Fellows Of Harvard College | Editing of CCR5 receptor gene to protect against HIV infection |
| WO2018165631A1 (en) | 2017-03-09 | 2018-09-13 | President And Fellows Of Harvard College | Cancer vaccine |
| WO2018165504A1 (en) | 2017-03-09 | 2018-09-13 | President And Fellows Of Harvard College | Suppression of pain by gene editing |
| KR20190127797A (ko) | 2017-03-10 | 2019-11-13 | 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 | 시토신에서 구아닌으로의 염기 편집제 |
| KR20240116572A (ko) | 2017-03-23 | 2024-07-29 | 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 | 핵산 프로그램가능한 dna 결합 단백질을 포함하는 핵염기 편집제 |
| US11560566B2 (en) | 2017-05-12 | 2023-01-24 | President And Fellows Of Harvard College | Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation |
| WO2019023680A1 (en) | 2017-07-28 | 2019-01-31 | President And Fellows Of Harvard College | METHODS AND COMPOSITIONS FOR EVOLUTION OF BASIC EDITORS USING PHAGE-ASSISTED CONTINUOUS EVOLUTION (PACE) |
| EP3676376B1 (en) | 2017-08-30 | 2025-01-15 | President and Fellows of Harvard College | High efficiency base editors comprising gam |
| CN111757937A (zh) | 2017-10-16 | 2020-10-09 | 布罗德研究所股份有限公司 | 腺苷碱基编辑器的用途 |
| WO2019118949A1 (en) | 2017-12-15 | 2019-06-20 | The Broad Institute, Inc. | Systems and methods for predicting repair outcomes in genetic engineering |
| US12157760B2 (en) | 2018-05-23 | 2024-12-03 | The Broad Institute, Inc. | Base editors and uses thereof |
| US12281338B2 (en) | 2018-10-29 | 2025-04-22 | The Broad Institute, Inc. | Nucleobase editors comprising GeoCas9 and uses thereof |
| WO2020154500A1 (en) | 2019-01-23 | 2020-07-30 | The Broad Institute, Inc. | Supernegatively charged proteins and uses thereof |
| MX2021011426A (es) | 2019-03-19 | 2022-03-11 | Broad Inst Inc | Metodos y composiciones para editar secuencias de nucleótidos. |
| EP3956349A1 (en) | 2019-04-17 | 2022-02-23 | The Broad Institute, Inc. | Adenine base editors with reduced off-target effects |
| WO2021038213A1 (en) * | 2019-08-23 | 2021-03-04 | The University Court Of The University Of Edinburgh | Engineered crispra |
| US12435330B2 (en) | 2019-10-10 | 2025-10-07 | The Broad Institute, Inc. | Methods and compositions for prime editing RNA |
| MX2022014008A (es) | 2020-05-08 | 2023-02-09 | Broad Inst Inc | Métodos y composiciones para la edición simultánea de ambas cadenas de una secuencia de nucleótidos de doble cadena objetivo. |
| MX2023001016A (es) | 2020-07-24 | 2023-03-01 | Basf Se | Eliminacion simple de alanina racemasa y transcomplementacion. |
| US20240060110A1 (en) | 2020-10-07 | 2024-02-22 | Basf Se | Bacillus cell with reduced lipase and/or esterase side activities |
| WO2022263504A1 (en) * | 2021-06-17 | 2022-12-22 | Dsm Ip Assets B.V. | Improved bacillus host cell |
| EP4359546A1 (en) | 2021-06-24 | 2024-05-01 | Basf Se | Improved bacillus host cell with altered rema/remb protein |
| MX2023015455A (es) | 2021-06-24 | 2024-02-23 | Basf Se | Huesped de produccion de bacillus mejorado. |
| CN117813316A (zh) | 2021-06-24 | 2024-04-02 | 巴斯夫欧洲公司 | 用于生产纯度更高的感兴趣的化合物的地衣芽孢杆菌宿主细胞 |
| WO2023285348A1 (en) | 2021-07-13 | 2023-01-19 | Novozymes A/S | Recombinant cutinase expression |
| WO2023117970A1 (en) | 2021-12-20 | 2023-06-29 | Basf Se | Method for improved production of intracellular proteins in bacillus |
| WO2023152220A1 (en) | 2022-02-10 | 2023-08-17 | Novozymes A/S | Improved expression of recombinant proteins |
| JP2025509233A (ja) | 2022-03-08 | 2025-04-11 | ノボザイムス アクティーゼルスカブ | デアミダーゼ阻害剤及びデアミダーゼドメインを有する融合ポリペプチド |
| EP4242303A1 (en) | 2022-03-08 | 2023-09-13 | Novozymes A/S | Fusion polypeptides with deamidase inhibitor and deamidase domains |
| WO2023247514A1 (en) | 2022-06-22 | 2023-12-28 | Novozymes A/S | Recombinant mannanase expression |
| CN120265779A (zh) | 2022-12-05 | 2025-07-04 | 诺维信公司 | 经修饰的rna聚合酶活性 |
| WO2024133344A1 (en) | 2022-12-20 | 2024-06-27 | Novozymes A/S | A method for providing a candidate biological sequence and related electronic device |
| EP4273249A3 (en) | 2023-07-07 | 2024-05-22 | Novozymes A/S | Improved expression of recombinant proteins |
| WO2025012213A1 (en) | 2023-07-10 | 2025-01-16 | Novozymes A/S | Artificial signal peptides |
| WO2025031865A1 (en) | 2023-08-08 | 2025-02-13 | Basf Se | Improved bacillus cell with inactivated metalloprotease |
| WO2024240965A2 (en) | 2023-09-29 | 2024-11-28 | Novozymes A/S | Droplet-based screening method |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN1347449A (zh) * | 1999-04-16 | 2002-05-01 | 诺维信公司 | 芽孢杆菌蛋白生产细胞 |
| CN105378079A (zh) * | 2013-07-12 | 2016-03-02 | 诺维信公司 | 在基因组之间多核苷酸的直接转移 |
| CN105671070A (zh) * | 2016-03-03 | 2016-06-15 | 江南大学 | 一种用于枯草芽孢杆菌基因组编辑的CRISPRCas9系统及其构建方法 |
Family Cites Families (14)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DK122686D0 (da) | 1986-03-17 | 1986-03-17 | Novo Industri As | Fremstilling af proteiner |
| US5989870A (en) | 1986-04-30 | 1999-11-23 | Rohm Enzyme Finland Oy | Method for cloning active promoters |
| FR2704860B1 (fr) | 1993-05-05 | 1995-07-13 | Pasteur Institut | Sequences de nucleotides du locus cryiiia pour le controle de l'expression de sequences d'adn dans un hote cellulaire. |
| KR970703426A (ko) | 1994-06-03 | 1997-07-03 | 제임스 쉐한 | 정제된 Myceliophthora 락카제 및 그것을 암호화 하는 핵산(PURIFIED MYCELIOPHTHORA LACCASES AND NUCLEIC ACIDS ENCODING SAME) |
| AU2705895A (en) | 1994-06-30 | 1996-01-25 | Novo Nordisk Biotech, Inc. | Non-toxic, non-toxigenic, non-pathogenic fusarium expression system and promoters and terminators for use therein |
| WO1996029418A1 (en) | 1995-03-22 | 1996-09-26 | Novo Nordisk A/S | Introduction of dna into bacillus strains by conjugation |
| US5891701A (en) | 1997-06-12 | 1999-04-06 | Novo Nordisk Biotech Inc. | Nucleic acids encoding a polypeptide having protease activity |
| US5955310A (en) | 1998-02-26 | 1999-09-21 | Novo Nordisk Biotech, Inc. | Methods for producing a polypeptide in a bacillus cell |
| AU6188599A (en) | 1998-10-26 | 2000-05-15 | Novozymes A/S | Constructing and screening a dna library of interest in filamentous fungal cells |
| CN1526820B (zh) | 1999-03-22 | 2010-05-26 | 诺沃奇梅兹有限公司 | 用于在真菌细胞中表达基因的启动子 |
| AU2001265835A1 (en) | 2000-06-23 | 2002-01-08 | Novozymes A/S | Method for stable chromosomal multi-copy integration of genes |
| US8431382B2 (en) | 2006-05-31 | 2013-04-30 | Novozymes A/S | Chloramphenicol resistance selection in Bacillus licheniformis |
| EP2210898A1 (en) | 2006-11-29 | 2010-07-28 | Novozymes Inc. | Bacillus Licheniformis chromosome |
| EP2356242A2 (en) | 2008-09-30 | 2011-08-17 | Novozymes Inc. | Methods for using positively and negatively selectable genes in a filamentous fungal cell |
-
2017
- 2017-07-05 US US16/309,651 patent/US20190185847A1/en not_active Abandoned
- 2017-07-05 WO PCT/US2017/040689 patent/WO2018009520A1/en not_active Ceased
- 2017-07-05 EP EP17740565.1A patent/EP3481959A1/en not_active Withdrawn
- 2017-07-05 CN CN201780034269.3A patent/CN109312353A/zh active Pending
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN1347449A (zh) * | 1999-04-16 | 2002-05-01 | 诺维信公司 | 芽孢杆菌蛋白生产细胞 |
| CN105378079A (zh) * | 2013-07-12 | 2016-03-02 | 诺维信公司 | 在基因组之间多核苷酸的直接转移 |
| CN105671070A (zh) * | 2016-03-03 | 2016-06-15 | 江南大学 | 一种用于枯草芽孢杆菌基因组编辑的CRISPRCas9系统及其构建方法 |
Non-Patent Citations (3)
| Title |
|---|
| LEIS.QI等: ""Repurposing CRISPR as an RNA-Guided Platform for Sequence-Specific Control of Gene Expression"", 《CELL》 * |
| LV LI等: ""Application of CRISPRi for prokaryotic metabolic engineering involving multiple genes,a case study: Controllable P(3HB-co-4HB) biosynthesis"", 《METABOLIC ENGINEERING》 * |
| PETERS JASON M等: ""A Comprehensive, CRISPR-based", 《CELL》 * |
Also Published As
| Publication number | Publication date |
|---|---|
| US20190185847A1 (en) | 2019-06-20 |
| WO2018009520A1 (en) | 2018-01-11 |
| EP3481959A1 (en) | 2019-05-15 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN109312353A (zh) | 通过crispr-抑制来改善微生物 | |
| US11174487B2 (en) | Stable genomic integration of multiple polynucleotide copies | |
| CN107849562B (zh) | 基因组编辑系统及使用方法 | |
| CA2834716C (en) | Simultaneous site-specific integrations of multiple gene-copies in filamentous fungi | |
| EP3268482B1 (en) | Methods of introducing multiple expression constructs into a eukaryotic cell | |
| US8569029B2 (en) | DNase expression in recombinant host cells | |
| EP3183343B1 (en) | Recombinase-mediated integration of a polynucleotide library | |
| US20220010305A1 (en) | Genome Editing by Guided Endonuclease and Single-stranded Oligonucleotide | |
| US20250230469A1 (en) | Counter-Selection by Inhibition of Conditionally Essential Genes | |
| US20160304887A1 (en) | Introducing or Inactivating Female Fertility in Filamentous Fungal Cells | |
| CN115427560A (zh) | 使用无催化活性rna指导的内切核酸酶的crispr-aid | |
| US20150307871A1 (en) | Method for generating site-specific mutations in filamentous fungi | |
| US20220298517A1 (en) | Counter-selection by inhibition of conditionally essential genes | |
| US20210284991A1 (en) | Yeast Cell Extract Assisted Construction of DNA Molecules | |
| WO2025132815A1 (en) | Novel cas nucleases and polynucleotides encoding the same | |
| CN116583534A (zh) | 前导肽和编码其的多核苷酸 | |
| WO2017211803A1 (en) | Co-expression of heterologous polypeptides to increase yield |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| WD01 | Invention patent application deemed withdrawn after publication | ||
| WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190205 |