CN111699254A - 使用crispr在棒状杆菌属中进行基因组编辑 - Google Patents
使用crispr在棒状杆菌属中进行基因组编辑 Download PDFInfo
- Publication number
- CN111699254A CN111699254A CN201980012131.2A CN201980012131A CN111699254A CN 111699254 A CN111699254 A CN 111699254A CN 201980012131 A CN201980012131 A CN 201980012131A CN 111699254 A CN111699254 A CN 111699254A
- Authority
- CN
- China
- Prior art keywords
- rna
- host
- sequence
- plasmid
- corynebacterium
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
- C12N15/77—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Corynebacterium; for Brevibacterium
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases [RNase]; Deoxyribonucleases [DNase]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/20—Bacteria; Culture media therefor
- C12N1/205—Bacterial isolates
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPR]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/01—Bacteria or Actinomycetales ; using bacteria or Actinomycetales
- C12R2001/15—Corynebacterium
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Medicinal Chemistry (AREA)
- Crystallography & Structural Chemistry (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
CRISPR系统成功地用于对如棒状杆菌属的物种等革兰氏阳性细菌的基因组进行修饰。对棒状杆菌物种进行修饰的方法包含单核苷酸变化,从而产生基因缺失和/或插入。
Description
相关申请的交叉引用
本申请要求于2018年2月8日提交的美国临时申请第62/628,166号和于2018年7月23日提交的美国临时申请第62/701,979号的权益,所述申请中的每个申请的内容通过引用整体并入本文。
关于联邦政府资助的研究或开发的声明
本公开是根据由美国政府国防高级研究计划局(DARPA)授予的合同第HR0011-15-9-0014号在政府支持下进行的。政府享有本发明的某些权利。
序列表的并入
含有序列表的计算机可读形式的命名为“ZYMR_038_02WO_SeqList_ST25.txt”的文件于2019年2月6日创建。此文件为约12.9KB(在MS-Windows中测量的),同时通过电子提交方式(使用美国专利局EFS-Web提交系统)提交,并且通过引用整体并入到本申请中。
技术领域
本公开总体上涉及用于使用CRISPR介导的编辑对革兰氏阳性细菌谷氨酸棒状杆菌(谷氨酸棒状杆菌(C.glutamicum))的基因组进行修饰来进行体内和体外引导的基因序列编辑的系统、方法和组合物。本公开尤其描述了使用用于DNA克隆改进、寡核苷酸的组装以及微生物改进的引导的序列编辑复合物的方法。
背景技术
在过去的几十年中,修饰基因组和改进微生物的能力已显著提高。早期方法涉及UV或化学诱变和转座子(卡伯格(Karberg)等人,2001;佩鲁卡(Perutka)等人,2004;姚(Yao)和兰博维兹(Lambowitz),2007),通常导致功能性敲除和小的改变(例如,单核苷酸多态性或SNP)。涉及整合酶和重组酶的位点特异性整合技术使得能够插入基因和途径,但仅限于基因组中特定的预先存在的序列或“着陆垫”(基尔比(Kilby)等人,1993;斯腾伯格(Sternberg)等人,1981;图兰(Turan)等人,2011)。
利用同源重组(HR)精确地工程化所关注的基因组区以创建SNP、缺失和插入的能力已在生物技术的所有领域(治疗、新颖化学品的生产、代谢工程化等)实现了巨大进步。早期技术通过利用内源性宿主同源重组机制或通过补充病毒重组蛋白来将双链DNA以及单链寡核苷酸供体DNA引入到宿主基因组中(达岑科(Datsenko)和万纳(Wanner),2000;范·皮克伦(van Pijkeren)和布里顿(Britton),2012;余(Yu)等人,2000;张(Zhang)等人,1998)。然而,不幸的是,这些方法依赖于低频率事件,并且需要使用选择标志物来选择所要引入的变化,然后必须在每轮工程化之前将所述变化除去以并入多个突变。
随后发现,在所工程化的位点处或其附近产生双链断裂(DSB)可以显著增加所述位点处的重组事件的频率。例如,在重组精通的生物体(如酿酒酵母(Saccharomycescerevisiae))中,双链断裂诱导了同源重组机制,这提高随后的DNA掺入的效率(赛明顿(Symington),2002)。这最初是通过预先安装带有大范围核酸酶(例如,I-SceI和I-CeuI)的“着陆垫”,通过表达适当的归巢核酸内切酶诱导DSB,并且供应适当的供体核酸(其同源末端与所引入的变化侧接)来利用的(库尔曼(Kuhlman)和考克斯(Cox),2010)。后来,技术利用了与核酸酶结构域融合的结合结构域(例如,锌指核酸酶或ZFN和转录活化因子样效应核酸酶或TALEN,所述ZFN和所述TALEN是与FokI核酸酶融合的结合结构域),这允许通过使得能够在任何给定的基因组位置处产生双链断裂进行可编程的无标志物编辑(霍克迈耶(Hockemeyer)等人,2011;李(Li)等人,2011;米勒(Miller)等人,2011;乌尔诺夫(Urnov)等人,2005)。
最近,依靠成簇的规律间隔的短回文重复序列(CRISPR)基因组基因座和CRISPR相关(Cas)蛋白,已经在一些细菌和古细菌中鉴别出一类新的RNA引导的核酸内切酶,所述RNA引导的核酸内切酶共同起作用以提供免受入侵的病毒和质粒的保护。在II型CRISPR-Cas系统中,Cas9蛋白充当RNA引导的核酸内切酶,所述RNA引导的核酸内切酶使用由CRISPR RNA(crRNA)和反式活化crRNA(tracrRNA)组成的双引导RNA,以通过涉及两个一起产生双链DNA断裂(DSB)的核酸酶活性位点的机制进行靶标识别和裂解。季聂克(Jinek)等人后来表明,crRNA和tracrRNA可以组合并且转录为单个引导RNA(sgRNA),其中sgRNA内的短的20nt“间隔子”序列将Cas9蛋白引导至其DNA靶标(季聂克等人,2012)。
从功能上讲,Cas9蛋白识别引导RNA并与所述引导RNA复合,并且所得核糖核蛋白复合物然后在基因组中搜索与间隔子序列(“原型间隔子”)互补的序列,随后搜索原型间隔子相邻基序(PAM)。在一种模型下,Cas9在与靶序列结合后产生双链断裂,并且然后可以通过非同源末端连接(NHEJ)或通过供应的供体核酸的HR来引入变化。NHEJ导致短插入或缺失,这可以用于通过开放阅读框(ORF)中的移码突变来产生功能敲除。相反,通过掺入适当设计的供体核酸,HR可以用于在基因组中引入更精确的无缝变化。
然而,在具有用于同源重组的有限内源性机制或不具有用于同源重组的内源性机制的宿主中,基因组中的Cas9靶向的双链断裂通常会导致毒性和细胞死亡。在这些生物体中,已经开发了用于诱导单链缺口的替代性策略,因为这些断裂并不致命。例如,在解纤维梭状芽胞杆菌(Clostridium cellulolyticum)中,野生型Cas9蛋白的表达具有致死性,这在许(Xu)等人(2015)的研究中通过表达Cas9D10A切口酶以在基因组中的一条DNA链中产生缺口进行规避,所述缺口然后用作用于以所供应的供体DNA增加HR的位点。尽管可以按照这种方法以合理的效率获得基因缺失,但是在较大(例如,>1kb)的插入物的整合上存在明显的限制。
谷氨酸棒状杆菌是另一种具有用于HR的有限的内源性机制的原核生物(雷森迪(Resende)等人,基因(Gene)2011;482:1-7;1-7;纳卡穆拉(Nakamura)等人,基因2003年10月23日;317(1-2):149-55),因此就CRISPR/Cas9介导的基因编辑而言,结果不确定。当前存在若干描述了CRISPR/Cas9在谷氨酸棒状杆菌中的用途的出版物(江(Jiang)等人,自然-通讯(Nat Commun.)2017年5月4日;8:15179;赵(Cho)等人,代谢工程学(Metab Eng.)2017年7月;42:157-167;彭(Peng)等人,微生物细胞工厂(Microb Cell Fact.);2017年11月14日;16(1):201;刘(Liu)等人,微生物细胞工厂2017年11月16日;16(1):205)。这些出版物测试了若干种编辑构型和谷氨酸棒状杆菌菌株。然而,有趣的是,这些出版物在有关Cas9毒性、编辑功效、所测试的特定菌株以及所测试的供体构型方面的结论差异很大。此外,特别是对于多重基因编辑,谷氨酸棒状杆菌技术仅专注于同时引入多个编辑,但是仅实现了非常低的连续多核苷酸区的编辑效率。例如,分别使用rfp导向的和rpsL导向的引导RNA,刘等人描述了同时编辑第一(rfp)和第二(rpsL)基因座。然而,仅实现了非常低的编辑效率,并且在每个基因座内仅对连续区进行了编辑。因此,仍然需要用于在谷氨酸棒状杆菌中进行基因组编辑的改进的RNA引导的核酸内切酶工具和方法,包含提供更高效率、在一或多个基因座内的非连续编辑以及其它益处的改进的多重基因编辑方法。
发明内容
本发明通过用于使用包括RNA引导的核酸内切酶(例如,Cas9)多肽、引导RNA和供体多核苷酸的CRISPR系统对棒状杆菌属进行基因修饰的成功方法解决了这些未满足的需求和不确定性,其中所述供体多核苷酸优选地在复制质粒中进行编码。在特定实施例中,采用两个或两个以上供体多核苷酸的同时或顺序的基于质粒的呈递例示了用于以改进的编辑效率进行多重基因修饰的方法。本发明的某些实施例在以下进行了描述:科茨(Coates)等人,“用于在谷氨酸棒状杆菌NRRL-B11474中灵活且高效地进行基因组编辑的CRISPR-Cas9构型的系统性研究(Systematic investigation of CRISPR-Cas9 configurationsfor flexible and efficient genome editing in Corynebacterium glutamicum NRRL-B11474)”,工业微生物学与生物技术杂志(J Ind Microbiol Biotechnol),于2018年11月27日在线发布(doi:10.1007/s10295-018-2112-7),所述参考文献通过引用整体并入本文。
在某些实施例中,采用对两种或两种以上基因组修饰进行编码的一或多个供体多核苷酸的基于质粒的呈递例示了用于以改进的编辑效率引入多个编辑的方法。在一些情况下,所述一或多个供体多核苷酸(无论是通过基于质粒的呈递来提供还是以线性片段的形式提供)对两种或两种以上基因组修饰进行编码,其中所述两种或两种以上基因组修饰中的至少两种基因组修饰或所述两种或两种以上基因组修饰中的所有基因组修饰例如是非连续的并且在基因组中彼此紧邻。在一些情况下,在基因组中彼此紧邻的所述修饰在150个碱基对、125个碱基对、100个碱基对、75个碱基对、70个碱基对、65个碱基对、60个碱基对、55个碱基对、50个碱基对、45个碱基对、40个碱基对、35个碱基对、30个碱基对、25个碱基对、20个碱基对或10个或5个碱基对之内或左右。在一些情况下,在基因组中彼此紧邻的所述修饰在基因组中彼此之间的距离为约10个到约100个碱基对或约25个到约75个碱基对。
而且,许多针对CRISPR/Cas9在谷氨酸棒状杆菌中的用途的最新出版物利用了具有pBL1复制起点的质粒。在本文所描述的工作过程期间,确定在测试菌株NRRL-B11474中pCG1和pCASE1质粒出乎意料地优于基于pBL1的质粒。不希望受到理论的束缚,本发明人假设与基于pBL1的质粒相比,基于pCG1和pCASE1的质粒出乎意料地改进的转化功效适用于广泛的商业相关棒状杆菌属菌株,包含其它谷氨酸棒状杆菌菌株。同样,不希望受到理论的束缚,进一步假设出乎意料地改进的编辑至少部分是由于与基于pBL1的质粒相比,使用pCG1和pCASE1质粒获得的转化效率的出乎意料的增加。因此,本文还描述了更有效的RNA引导的核酸内切酶(例如,Cas9)编辑系统的构建和可能的供体构型的扩展工具箱,包含但不限于使用一或多个供体多核苷酸的pCG1和/或pCASE1质粒编码的供体构型。
一方面,本发明提供了对棒状杆菌属宿主进行基因修饰的方法,所述方法包括:用包括第一启动子(例如,诱导型启动子或组成型启动子)的质粒转化棒状杆菌属宿主,所述第一启动子可操作地连接到用于表达第一引导RNA的序列;以及提供第一供体多核苷酸,所述第一供体多核苷酸具有左同源臂序列和右同源臂序列,所述左同源臂序列和所述右同源臂序列各自与棒状杆菌属靶序列同源;以及在所述宿主中结合RNA引导的核酸内切酶(例如,Cas9)表达所述第一引导RNA。在一些情况下,所述供体多核苷酸在质粒上进行编码。
一方面,本发明提供了对棒状杆菌属宿主进行基因修饰的方法,所述方法包括:用包括第一启动子的第一质粒转化棒状杆菌物种,所述第一启动子可操作地连接到用于表达RNA引导的DNA核酸内切酶多肽的序列;提供第一引导RNA;以及在所述宿主中结合第一供体多核苷酸表达所述RNA引导的DNA核酸内切酶多肽,所述第一供体多核苷酸具有左同源臂序列和右同源臂序列,所述左同源臂序列和所述右同源臂序列各自与棒状杆菌属靶序列同源,所述第一供体多核苷酸包含由所述左同源臂序列和右同源臂序列侧接的至少一个突变序列。
在一些实施例中,所述RNA引导的DNA核酸内切酶选自由以下组成的群组:Cas9、Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas12h、Cas13a、Cas13b、Cas13c、Cpf1和MAD7或其同源物、直系同源物或旁系同源物。在一些实施例中,所述RNA引导的DNA核酸内切酶是Cas9。
在一些实施例中,所述第一供体多核苷酸通过基于质粒的呈递提供。在一些实施例中,所述第一引导RNA通过基于质粒的呈递提供。在一些实施例中,所述RNA引导的DNA核酸内切酶通过基于质粒的呈递提供。在一些实施例中,所述RNA引导的DNA核酸内切酶整合到所述棒状杆菌物种的基因组中。
在一些实施例中,所述棒状杆菌物种是谷氨酸棒状杆菌。在一些实施例中,所述棒状杆菌物种是谷氨酸棒状杆菌菌株NRRL-B11474。
在一些实施例中,所述第一质粒包括选自由以下组成的群组的复制起点:pCASE1复制起点和pCG1复制起点。在一些实施例中,所述第一质粒包括pCASE1复制起点。在一些实施例中,所述第一质粒包括pCG1复制起点。
在一些实施例中,所述第一供体多核苷酸在与所述引导RNA相同的质粒上提供。在一些实施例中,所述第一供体多核苷酸在不同的(例如,第二或第三)质粒上提供。在一些实施例中,所述第一供体多核苷酸以线性、单链或双链DNA片段的形式提供。在一些实施例中,包括或编码所述第一供体多核苷酸的质粒或线性或环形片段进一步包括或编码一或多个或两个或两个以上另外的供体多核苷酸。
在一些实施例中,所述第一供体多核苷酸在所述第一质粒上提供。在一些实施例中,所述第一供体多核苷酸在第二质粒上提供。在一些实施例中,所述第一供体多核苷酸以线性片段的形式提供。在一些实施例中,所述第一质粒进一步对所述第一引导RNA、或可操作地连接到所述第一启动子的一或多个另外的引导RNA或可操作地连接到第二启动子的一或多个另外的引导RNA进行编码。在一些实施例中,所述第一启动子是组成型的。在一些实施例中,所述第一启动子是诱导型的。在一些实施例中,所述第二启动子是组成型的。在一些实施例中,所述第二启动子是诱导型的。在一些实施例中,所述第一启动子和所述第二启动子是诱导型的。在一些实施例中,所述第一启动子和所述第二启动子是差异诱导型的。在一些实施例中,所述第一供体多核苷酸在所述第一质粒上提供,并且所述第一质粒进一步包括一或多个另外的供体多核苷酸,所述一或多个另外的供体多核苷酸具有一或多个左同源臂序列和一或多个右同源臂序列,所述一或多个左同源臂序列和所述一或多个右同源臂序列各自与棒状杆菌属靶序列同源,所述一或多个另外的供体多核苷酸各自包含由所述左同源臂序列和所述右同源臂序列侧接的至少一个突变序列。在一些实施例中,所述第一供体多核苷酸在所述第二质粒上提供,并且其中所述第二质粒进一步包括一或多个另外的供体多核苷酸,所述一或多个另外的供体多核苷酸具有一或多个左同源臂序列和一或多个右同源臂序列,所述一或多个左同源臂序列和所述一或多个右同源臂序列各自与棒状杆菌属靶序列同源,所述一或多个另外的供体多核苷酸各自包含由所述左同源臂序列和所述右同源臂序列侧接的至少一个突变序列。在一些实施例中,所述第一质粒或所述第二质粒对所述RNA引导的DNA核酸内切酶进行编码。
在某些实施例中,所述第一供体多核苷酸包含由所述左同源臂序列和所述右同源臂序列侧接的至少一个突变序列。所述至少一个突变序列可以有利地包括选自由以下组成的群组的突变:单核苷酸插入;两个或两个以上核苷酸的插入;对一或多种蛋白质进行编码的核酸序列的插入;单核苷酸缺失;两个或两个以上核苷酸的缺失;一或多个编码序列的缺失;单核甘酸的取代;以及两个或两个以上核苷酸的取代。在具体实施例中,所述至少一个突变序列包括Cas9 PAM或种子区的突变。在某些实施例中,所述至少一个突变序列包括根据先前句子的多种突变。在某些实施例中,所述多种突变在相同的供体多核苷酸序列上进行编码。
在一些实施例中,所述至少一个突变序列包括RNA引导的DNA核酸内切酶原型间隔子相邻基序(PAM)或种子区的突变。在一些实施例中,所述棒状杆菌属宿主进一步表达连接到组成型或诱导型启动子的功能性RNA引导的DNA核酸内切酶多肽编码序列。在一些实施例中,所述第一质粒进一步包括可操作地连接到组成型或诱导型启动子的功能性RNA引导的DNA核酸内切酶多肽编码序列。在一些实施例中,所述第一质粒进一步包括可操作地连接到组成型或诱导型启动子的功能性Cas9多肽编码序列。
在一些实施例中,所述棒状杆菌属宿主包括连接到组成型或诱导型启动子的序列,其中所述序列对所述RNA引导的DNA核酸内切酶多肽进行编码。在一些实施例中,所述第一质粒包括可操作地连接到组成型或诱导型启动子的序列,其中所述序列对所述RNA引导的DNA核酸内切酶多肽进行编码。在一些实施例中,所述RNA引导的DNA核酸内切酶多肽是Cas9核酸内切酶多肽。
在一些实施例中,供体多核苷酸上的所述左同源臂序列和/或右同源臂序列为至少25个碱基对,优选地至少75个碱基对,更优选地至少150个、200个、250个或300个碱基对,仍更优选地至少350个、400个、450个、500个或2,000个碱基对。在一些实施例中,所述启动子选自由以下组成的群组:内源启动子、异源启动子、合成启动子、诱导型启动子和/或组成型启动子。在一些实施例中,所述启动子是Pcg2613。在一些实施例中,所述第一引导RNA包括CRISPR RNA(crRNA)和反式活化crRNA(tracrRNA)。在一些实施例中,所述第一引导RNA包括单个gRNA(sgRNA)。在一些实施例中,所述第一引导RNA包括CRISPR RNA(crRNA)和反式活化RNA(tracrRNA)以及至少20个核苷酸的第一间隔子序列,其中所述第一间隔子序列与所述棒状杆菌属靶序列至少80%、85%、90%、95%或100%互补。在一些实施例中,所述方法包括顺序地诱导两个或两个以上不同的引导RNA的表达,并且由此引入所述棒状杆菌属宿主的两种或两种以上不同的基因修饰。在一些实施例中,所述两种或两种以上不同的基因修饰中的至少一种基因修饰包括非连续的插入、缺失和/或取代;或者其中所述两种或两种以上不同的基因修饰中的两种或两种以上基因修饰各自包括非连续的插入、缺失和/或取代。在一些实施例中,所述方法包括在不同的诱导型启动子的控制下顺序地表达两个或两个以上不同的引导RNA/供体多核苷酸对,并且由此顺序地引入所述棒状杆菌属宿主的两种或两种以上不同的基因修饰,其中通过连续地诱导每个连续的引导RNA/供体多核苷酸对的表达来引入连续的编辑。在一些实施例中,所述方法包括在所述棒状杆菌属宿主中表达两个或两个以上供体多核苷酸,并且顺序地提供与所述宿主中已经存在的修复片段相对应的一或多个gRNA,由此顺序地引入所述棒状杆菌属宿主的两种或两种以上不同的基因修饰。在一些实施例中,所述方法包括同时表达两个或两个以上不同的引导RNA,并且由此引入所述棒状杆菌属宿主的两种或两种以上不同的基因修饰。在一些实施例中,所述第一质粒包括反选择标志物,并且所述方法包括针对所述反选择标志物进行选择,并且由此固化所述第一质粒的所述棒状杆菌属宿主。在一些实施例中,所述针对所述第一质粒的所述反选择标志物进行选择是在所述宿主中用所述第一引导RNA结合所述RNA引导的DNA核酸内切酶多肽对所述棒状杆菌属宿主进行基因修饰之后以及在所述宿主中用第二引导RNA结合所述RNA引导的DNA核酸内切酶多肽对所述棒状杆菌属宿主进行基因修饰之前执行的。在一些实施例中,所述两种或两种以上不同的基因修饰中的所述至少一种基因修饰包括非连续的插入、缺失和/或取代;或者其中所述两种或两种以上不同的基因修饰中的两种或两种以上基因修饰各自包括非连续的插入、缺失和/或取代。在一些实施例中,所述方法包括在所述宿主中表达来自一或多个异源重组系统的一组蛋白质。在一些实施例中,所述方法包括表达来自λred重组系统、Rec ET重组系统的一组蛋白质、来自λred重组系统或Rec ET重组系统的蛋白质的任何同源物、直系同源物或旁系同源物或其任何组合。在某些实施例中,所述棒状杆菌属宿主进一步包括可操作地连接到组成型或诱导型启动子的功能性Cas9多肽编码序列。在一些实施例中,所述质粒进一步表达连接到组成型或诱导型启动子的所述功能性Cas9多肽编码序列。在一些情况下,与可操作地连接到引导RNA的组成型或诱导型启动子相比,所述Cas9启动子是差异诱导型的。在某些实施例中,所述第一质粒进一步包括可操作地连接到组成型或诱导型启动子的功能性Cas9多肽编码序列。
在一些实施例中,连接到组成型或诱导型启动子的所述功能性Cas9多肽编码序列整合到所述宿主基因组中。据报道,先前用Cas9转化复制质粒的尝试产生了很少的转化子或表现出降低的生长速率,这可能是由于Cas9基因和/或多肽对细胞的毒性所致(赵等人,代谢工程学2017年7月;42:157-167;彭(Peng)等人,微生物细胞工厂(Microb CellFact.);2017年11月14日;16(1):201)。如本文首次例示的,本发明人已经确定功能性Cas9多肽可以成功地整合到棒状杆菌属基因组中,而对所述宿主没有毒性,并且不需要降低Cas9本身的毒性。在一些情况下,通过使用诱导型启动子降低Cas9多肽的毒性,无论所述Cas9多肽是由质粒进行编码还是由基因组中整合的基因进行编码,使得所述Cas9多肽不以非诱导状态进行表达或进行最低程度地表达,并且然后以诱导状态进行表达以执行基因组编辑。在一些情况下,与可操作地连接到引导RNA的诱导型启动子相比,所述Cas9启动子是差异诱导型的。
在一些实施例中,连接到组成型或诱导型启动子的功能性Cas9多肽编码序列处于质粒中。在一些情况下,连接到组成型或诱导型启动子的功能性Cas9多肽编码序列处于所述第一质粒中。在一些情况下,连接到组成型或诱导型启动子的功能性Cas9多肽编码序列处于第二质粒中。在一些情况下,连接到组成型或诱导型启动子的功能性Cas9多肽编码序列处于包括引导RNA编码序列(例如,所述第一引导RNA编码序列)的质粒中。在一些情况下,连接到组成型或诱导型启动子的功能性Cas9多肽编码序列处于包括供体多核苷酸(例如,所述第一供体多核苷酸)的质粒中。在一些实施例中,包括连接到组成型或诱导型启动子的所述功能性Cas9多肽编码序列的质粒进一步包括反选择标志物。在一些情况下,与不同(例如,第一或第二)质粒上的另一种反选择标志物相比,包括Cas9多肽编码序列的质粒中的所述反选择标志物可以被差异反选择。在一些情况下,所述方法包括在对所述棒状杆菌属宿主进行一或多个或两个或两个以上优选顺序的基因组编辑之后,对包括所述功能性Cas9多肽编码序列的质粒进行反选择,并且由此固化所述Cas9多肽编码序列的所述棒状杆菌属宿主。
在一些实施例中,所述引导RNA是单分子引导RNA(sgRNA)。在一些实施例中,所述引导RNA是双分子引导RNA,例如crRNA和tracrRNA。在一些实施例中,所述第一质粒进一步对所述第一引导RNA、或可操作地连接到所述第一启动子的一或多个另外的引导RNA或可操作地连接到第二启动子的一或多个另外的引导RNA进行编码。在一些情况下,所述第一启动子是组成型的。在一些情况下,所述第一启动子是诱导型的。在一些情况下,所述第二启动子是组成型的。在一些情况下,所述第二启动子是诱导型的。在一些情况下,所述第一启动子和所述第二启动子是诱导型的。在一些情况下,所述第一启动子和所述第二启动子是差异诱导型的。在一些情况下,对可操作地连接到所述第一引导RNA的所述第一启动子进行诱导,对所述棒状杆菌属宿主的基因组进行修饰,并且然后对所述第二启动子进行诱导,并且执行所述棒状杆菌属宿主的不同遗传修饰。在一些实施例中,所述右同源臂序列和所述左同源臂序列各自独立地包括、包括约、包括至少或包括至少约25个;50个;75个;100个;125个;150个;175个;200个;225个;250个;275个;300个;325个;350个;375个;400个;425个;450个;475个;500个;525个;550个;575个;600个;625个;650个;675个;700个;725个;750个;775个;800个;825个;850个;875个;900个;925个;950个;975个;1,000个;1,025个;1,050个;1,075个;1,100个;1,125个;1,150个;1,175个;1,200个;1,225个;1,250个;1,275个;1,300个;1,325个;1,350个;1,375个;1,400个;1,425个;1,450个;1,475个;1,500个;1个;525个;1,550个;1,575个;1,600个;1,625个;1,650个;1,675个;1,700个;1,725个;1,750个;1,775个;1,800个;1,825个;1,850个;1,875个;1,900个;1,925个;1,950个;或2,000个碱基对。
在某些实施例中,所述右同源臂序列和所述左同源臂序列各自独立地包括介于约25个与约2000个之间的碱基对、介于约25个与约1000个之间的碱基对、介于约25个与约600个之间的碱基对、介于约25个与约500个之间的碱基对、介于约25个与约250个之间的碱基对、介于约25个与约200个之间的碱基对、介于约25个与约100个之间的碱基对或介于约25个与约50个之间的碱基对。在某些实施例中,所述右同源臂序列和所述左同源臂序列各自独立地包括介于约100个与约2000个之间的碱基对、介于约100个与约1000个之间的碱基对、介于约100个与约600个之间的碱基对、介于约100个与约500个之间的碱基对、介于约100个与约250个之间的碱基对、介于约100个与约200个之间的碱基对或介于约100个与约150个之间的碱基对。在某些实施例中,所述右同源臂序列和所述左同源臂序列各自独立地包括介于约0个与约2000个之间的碱基对、介于约0个与约1000个之间的碱基对、介于约0个与约600个之间的碱基对、介于约0个与约500个之间的碱基对、介于约0个与约250个之间的碱基对、介于约0个与约200个之间的碱基对、介于约0个与约100个之间的碱基对、介于约0个与约50个之间的碱基对或介于约0个与约25个之间的碱基对。
在一些实施例中,可操作地连接到所述引导RNA的所述启动子是天然棒状杆菌属启动子。在一些实施例中,可操作地连接到所述引导RNA的所述启动子是与宿主细胞异源的启动子。通常,所述启动子与可操作地连接的引导RNA是异源的,无论所启动子是宿主细胞天然的、来源于不同生物体还是合成的。在一些实施例中,可操作地连接到所述引导RNA的所述启动子是合成启动子。天然、异源或合成启动子可以是组成型的。可替代地,天然、异源或合成启动子可以是诱导型的。在某些实施例中,所述启动子选自由以下组成的群组:Pcg2613、或Pcg0007、或Pcg0047、或Pcg1133、或PTet1、或PTet3、或PLac1、或PLac2、或PAra1或PTrc。在某些实施例中,所述启动子是Pcg2613。在某些实施例中,所述启动子选自由以下组成的群组:任何内源性棒状杆菌属启动子、任何来自异源生物体的启动子、任何合成启动子、任何诱导型启动子或任何组成型启动子。
在一些实施例中,所述引导RNA由包括反选择标志物的第一质粒编码,并且所述方法包括针对所述反选择标志物进行选择,并且由此固化所述第一质粒的所述棒状杆菌属宿主。在一些情况下,所述针对所述第一质粒的所述反选择标志物进行选择在所述宿主中用所述第一引导RNA结合所述Cas9多肽对所述棒状杆菌属宿主进行基因修饰之后以及在所述宿主中用第二引导RNA结合所述Cas9多肽对所述棒状杆菌属宿主进行基因修饰之前执行的。
另一方面,提供了改进的多重基因编辑方法,所述方法包括:用由第一质粒表达的第一引导RNA结合Cas9多肽对棒状杆菌属宿主进行基因修饰;针对所述第一质粒上存在的反选择标志物进行选择,并且由此固化所述第一质粒的所述宿主;用由第二质粒表达的第二引导RNA结合Cas9多肽对棒状杆菌属宿主进行基因修饰;针对所述第二质粒上存在的反选择标志物进行选择,并且由此固化所述第二质粒的所述宿主;以及根据需要重复以完成所期望的基因组编辑。在一些情况下,所述第一质粒和/或第二质粒包括至少一个供体多核苷酸(例如,其中所述第一和第二质粒的所述供体多核苷酸是不同的)。如本文首次明确证明的,这种顺序基因组编辑方法显著提高了棒状杆菌属宿主中的基因编辑效率。
另一方面,本公开提供了改进革兰氏阳性细菌中的CRISPR/Cas9编辑的方法,如通过将用于CRISPR/Cas9编辑的引导RNA置于本文所公开的启动子的控制下。
另一方面,本公开提供了一种棒状杆菌属宿主,其包括:a)第一质粒,所述第一质粒包括可操作地连接到第一引导RNA的启动子;以及b)第一供体多核苷酸,所述第一供体多核苷酸具有右同源臂序列和左同源臂序列,其中每个同源臂序列与棒状杆菌属基因组中的靶序列同源,其中所述宿主结合Cas9多肽表达所述第一引导RNA。在一些情况下,所述棒状杆菌属宿主是谷氨酸棒状杆菌宿主。在一些情况下,所述谷氨酸棒状杆菌宿主是谷氨酸棒状杆菌菌株NRRL-B11474。
在一些实施例中,所述第一质粒包括选自由以下组成的群组的复制起点:pCASE1复制起点和pCG1复制起点。在一些实施例中,所述第一质粒包括pCASE1复制起点。在一些实施例中,所述第一供体多核苷酸在所述第一质粒上提供。在一些实施例中,所述第一供体多核苷酸在第二质粒上提供。在一些实施例中,所述第一供体多核苷酸以线性核酸片段的形式提供。在一些实施例中,所述第一质粒进一步包括可操作地连接到所述第一启动子的一或多个另外的引导RNA或可操作地连接到一或多个另外的启动子的一或多个另外的引导RNA。
在一些实施例中,第一供体多核苷酸在所述第一质粒上提供,并且所述第一质粒进一步包括一或多个另外的供体多核苷酸。在一些实施例中,所述第一供体多核苷酸在所述第一质粒上提供,并且一或多个另外的供体多核苷酸在第二质粒上提供。在一些实施例中,所述第一供体多核苷酸、第二供体多核苷酸、第三供体多核苷酸等中的每个供体多核苷酸包括至少一个突变序列,所述至少一个突变序列包括选自由以下组成的群组的突变:单核苷酸插入;两个或两个以上核苷酸的插入;对一或多种蛋白质进行编码的核酸序列的插入;单核苷酸缺失;两个或两个以上核苷酸的缺失;一或多个编码序列的缺失;单核甘酸的取代;两个或两个以上核苷酸的取代;及其任何组合。
在一些实施例中,所述至少一个突变序列包括Cas9 PAM或种子区的突变。在一些情况下,所述至少一个突变序列包括Cas9 PAM的突变。在一些情况下,至少一个突变序列包括Cas9种子区的突变。在一些情况下,至少一个突变序列包括Cas9种子区的突变,并且序列的至少一种突变包括Cas9 PAM的突变。
在一些实施例中,所述Cas9多肽由可操作地连接到启动子的Cas9多肽编码序列表达。在一些情况下,所述Cas9启动子是组成型的。在一些实施例中,所述组成型Cas9启动子选自由以下组成的群组:Pcg2613或Pcg0007或Pcg0047或Pcg1133或PTrc。在一些情况下,所述Cas9启动子是诱导型的。在一些实施例中,所述诱导型Cas9启动子选自由以下组成的群组:PTet1或PTet3或PLac1或PLac2或PAra1。在一些情况下,与可操作地连接到引导RNA的诱导型启动子和/或可操作地连接到供体多核苷酸的诱导型启动子相比,所述Cas9启动子是差异诱导型的。在一些实施例中,所述Cas9多肽编码序列处于质粒中。在一些实施例中,所述第一质粒进一步包括可操作地连接到启动子的所述Cas9多肽编码序列。在一些实施例中,所述第二质粒进一步包括可操作地连接到启动子的所述Cas9多肽编码序列。在一些实施例中,包括所述Cas9多肽编码序列的所述质粒包括反选择标志物。在一些情况下,与不同(例如,第一或第二)质粒上的另一个反选择标志物相比,所述反选择标志物可以被差异反选择。在一些实施例中,可操作地连接到启动子的所述Cas9多肽编码序列整合到所述棒状杆菌属宿主的所述基因组中。在一些情况下,所述Cas9多肽编码序列包括针对在棒状杆菌物种中的表达而优化的编码序列。
在一些实施例中,所述右同源臂序列和所述左同源臂序列为至少25个碱基对,优选地至少150个、200个、250个或300个碱基对,更优选地至少350个、400个、450个、500个、550个或600个碱基对。在一些实施例中,所述第一、第二和/或另外的启动子选自由以下组成的群组:Pcg2613或Pcg0007或Pcg0047或Pcg1133或PTet1或PTet3或PLac1或PLac2或PAra1或PTrc。在一些实施例中,所述第一、第二和/或另外的启动子选自由以下组成的群组:内源性棒状杆菌属启动子、与所述棒状杆菌属宿主异源的启动子、合成启动子、诱导型启动子和组成型启动子。在一些实施例中,所述第一启动子和/或所述第二启动子是Pcg2613。在一些实施例中,所述第一启动子是Pcg2613。在一些实施例中,所述引导RNA是单分子引导RNA(sgRNA)。在一些实施例中,所述引导RNA是双分子引导RNA,例如crRNA和tracrRNA。在一些实施例中,所述第一引导RNA包括CRISPR RNA(crRNA)和反式活化RNA(tracrRNA)以及至少20个核苷酸的第一间隔子序列,其中所述第一间隔序列与所述棒状杆菌属靶序列至少80%、85%、90%、95%或100%互补。在一些实施例中,所述第一引导RNA包括sgRNAsgRNA。在一些实施例中,所述第一引导RNA包括CRISPR RNA(crRNA)和反式活化crRNA(tracrRNA)。在一些实施例中,所述第一引导RNA包括单个gRNA(sgRNA)。
在一些实施例中,所述宿主包括可操作地连接到至少两个不同的引导RNA序列的至少两个不同的诱导型启动子。在一些实施例中,所述第一质粒包括反选择标志物。
在一些实施例中,本发明提供了一种棒状杆菌属宿主,其包括:第一质粒,所述第一质粒包括可操作地连接到第一引导RNA的启动子;以及第一供体多核苷酸,所述第一供体多核苷酸具有右同源臂序列和左同源臂序列,其中每个同源臂序列与棒状杆菌属基因组中的靶序列同源;其中所述宿主结合RNA引导的DNA核酸内切酶多肽表达所述第一引导RNA。在其它实施例中,本发明提供了一种棒状杆菌属宿主,其包括:第一质粒,所述第一质粒包括可操作地连接到用于表达RNA引导的DNA核酸内切酶多肽的序列的启动子;以及第一引导RNA;其中所述宿主在所述宿主中结合第一供体多核苷酸表达所述RNA引导的DNA核酸内切酶多肽,所述第一供体多核苷酸具有左同源臂序列和右同源臂序列,所述左同源臂序列和所述右同源臂序列各自与棒状杆菌属靶序列同源,所述第一供体多核苷酸包含由所述左同源臂序列和所述右同源臂序列侧接的至少一个突变序列。在一些实施例中,所述棒状杆菌属宿主是谷氨酸棒状杆菌宿主。在一些实施例中,所述谷氨酸棒状杆菌宿主是谷氨酸棒状杆菌菌株NRRL-B11474。在一些实施例中,所述RNA引导的DNA核酸内切酶选自由以下组成的群组:Cas9、Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas12h、Cas13a、Cas13b、Cas13c、Cpf1和MAD7或其同源物、直系同源物或旁系同源物。在一些实施例中,所述RNA引导的DNA核酸内切酶是Cas9。在一些实施例中,所述RNA引导的DNA核酸内切酶通过基于质粒的呈递提供。在一些实施例中,所述RNA引导的DNA核酸内切酶整合到所述棒状杆菌物种的基因组中。在一些实施例中,所述第一质粒包括选自由以下组成的群组的复制起点:pCASE1复制起点和pCG1复制起点。在一些实施例中,所述第一质粒包括pCASE1复制起点。在一些实施例中,所述第一供体多核苷酸在所述第一质粒上提供。在一些实施例中,所述第一供体多核苷酸在第二质粒上提供。在一些实施例中,所述第一供体多核苷酸以线性核酸片段的形式提供。在一些实施例中,所述第一质粒进一步对所述第一引导RNA、或可操作地连接到所述第一启动子的一或多个另外的引导RNA或可操作地连接到一或多个另外的启动子的一或多个另外的引导RNA进行编码。在一些实施例中,所述第一供体多核苷酸在所述第一质粒上提供,并且其中所述第一质粒进一步包括一或多个另外的供体多核苷酸。在一些实施例中,所述第一供体多核苷酸在第二质粒上提供,并且其中所述第二质粒进一步包括一或多个另外的供体多核苷酸。
在一些实施例中,本发明提供了如本文所描述的棒状杆菌属宿主,其中所述第一供体多核苷酸包括至少一个突变序列,所述至少一个突变序列包括选自由以下组成的群组的突变:单核苷酸插入;两个或两个以上核苷酸的插入;对一或多种蛋白质进行编码的核酸序列的插入;单核苷酸缺失;两个或两个以上核苷酸的缺失;一或多个编码序列的缺失;单核甘酸的取代;两个或两个以上核苷酸的取代;两种或两种以上非连续的插入、缺失和/或取代;及其任何组合。在一些实施例中,所述宿主包括第二供体多核苷酸,并且其中所述第二供体多核苷酸包括至少一个突变序列,所述至少一个突变序列包括选自由以下组成的群组的突变:单核苷酸插入;两个或两个以上核苷酸的插入;对一或多种蛋白质进行编码的核酸序列的插入;单核苷酸缺失;两个或两个以上核苷酸的缺失;一或多个编码序列的缺失;单核甘酸的取代;两个或两个以上核苷酸的取代;两种或两种以上非连续的插入、缺失和/或取代;及其任何组合。在一些实施例中,所述至少一个突变序列包括RNA引导的DNA核酸内切酶原型间隔子相邻基序(PAM)或种子区的突变。在一些实施例中,所述RNA引导的DNA核酸内切酶多肽由可操作地连接到组成型或诱导型启动子的RNA引导的DNA核酸内切酶多肽编码序列表达。在一些实施例中,所述第一质粒进一步包括可操作地连接到组成型或诱导型启动子的所述RNA引导的DNA核酸内切酶多肽编码序列。在一些实施例中,所述RNA引导的DNA核酸内切酶多肽编码序列包括针对在棒状杆菌物种中的表达而优化的编码序列。在一些实施例中,所述右同源臂序列和所述左同源臂序列为至少25个碱基对,优选地至少150个、200个、250个或300个碱基对,更优选地至少350个、400个、450个、500个、550个或600个碱基对。在一些实施例中,所述启动子选自由以下组成的群组:内源性棒状杆菌属启动子、与所述棒状杆菌属宿主异源的启动子、合成启动子、诱导型启动子和组成型启动子。在一些实施例中,所述启动子是Pcg2613。在一些实施例中,所述第一引导RNA包括CRISPR RNA(crRNA)和反式活化crRNA(tracrRNA)。在一些实施例中,所述第一引导RNA包括单个gRNA(sgRNA)。在一些实施例中,所述第一引导RNA包括CRISPR RNA(crRNA)和反式活化RNA(tracrRNA)以及至少20个核苷酸的第一间隔子序列,其中所述第一间隔子序列与所述棒状杆菌属靶序列至少80%、85%、90%、95%或100%互补。在一些实施例中,所述宿主包括可操作地连接到至少两个不同的引导RNA序列的至少两个不同的诱导型启动子。在一些实施例中,所述第一质粒包括反选择标志物。在一些实施例中,所述宿主包括所述宿主中的来自一或多个异源重组系统的一组蛋白质。在一些实施例中,所述宿主包括来自λred重组系统、Rec ET重组系统的一组蛋白质、来自λred重组系统或Rec ET重组系统的蛋白质的任何同源物、直系同源物或旁系同源物或其任何组合。
附图说明
图1呈现了已经用含有靶向谷氨酸棒状杆菌基因组中的三个基因座(rpsL、cg3031和cg3404)的sgRNA的质粒转化的NRRL-B11474谷氨酸棒状杆菌的板的照片。上图描绘了具有NRRL-B11474谷氨酸棒状杆菌的对照菌株的结果。下图描绘了已经用与上述对照菌株中的引导质粒相同的引导质粒转化的含Cas9的NRRL-B11474谷氨酸棒状杆菌。从其中sgRNA靶向基因组中存在的序列的转化子的数量的大幅减少可以明显看出Cas9和sgRNA复合物的致命性,从而表明CRISPR/Cas9是有活性的,并且sgRNA序列是功能性的。
图2示出了由已经被转化为含有或缺乏所指示的Cas9基因的菌株的sgRNA构建体产生的菌落计数。使用两个不同的谷氨酸棒状杆菌复制起点(pCASE1、pCG1)构建对靶向五个基因座(cg0167、cg3031、cg3404、gdhA或rpsL)中的一个基因座的sgRNA进行编码的质粒。质粒不含有供体片段。用sgRNA质粒转化含有整合的Cas9(Cas9 NRRL-B11474)的感受态NRRL-B11474谷氨酸棒状杆菌细胞或野生型对照(WT NRRL-B11474),并且将连续稀释液平板接种于选择性培养基上。所指示的菌落计数是两次独立转化的菌落计数的平均值。与WT对照菌株相比,在含Cas9的菌株中观察到明显较低的菌落计数,这表明sgRNA和Cas9蛋白对于所有测试的基因座均起作用。
图3是可以用于在具有整合的Cas9的NRRL-B11474谷氨酸棒状杆菌中引入SNP的示范性sgRNA和供体配置的示意图。A.在一个实施例中,可以使用含有谷氨酸棒状杆菌复制起点、sgRNA、抗性标志物和具有侧接靶SNP的左(L)同源臂和右(R)同源臂的供体片段的质粒。B.在另一个实施例中,可以使用含有谷氨酸棒状杆菌复制起点、sgRNA、抗性标志物和含有具有侧接靶SNP的左(L)同源臂和右(R)同源臂的供体片段的单独的PCR产物的质粒。
图4是可以用于在具有整合的Cas9的谷氨酸棒状杆菌中产生敲除的示范性sgRNA和供体构型的示意图。A.在一个实施例中,可以使用含有谷氨酸棒状杆菌复制起点、sgRNA、抗性标志物以及具有左(L)同源臂和右(R)同源臂的供体片段的质粒。B.在另一个实施例中,可以使用含有谷氨酸棒状杆菌复制起点、sgRNA和抗性标志物的质粒;以及不具有含有具有左(L)同源臂和右(R)同源臂的供体片段的谷氨酸棒状杆菌复制起点的单独的质粒。C.在另一个实施例中,可以使用含有谷氨酸棒状杆菌复制起点、sgRNA以及具有含有具有左(L)同源臂和右(R)同源臂的供体片段的单独的PCR产物的抗性标志物的质粒。
图5是可以用于在具有整合的Cas9的谷氨酸棒状杆菌中产生插入的示范性sgRNA和供体构型的示意图。A.含有谷氨酸棒状杆菌复制起点、sgRNA、抗性标志物以及具有侧接插入的左(L)同源臂和右(R)同源臂的供体片段的质粒。
图6描绘了示出在rpsL基因座处具有三个成功整合的SNP的菌落和未编辑的野生型菌落的覆盖图。用对靶向rpsL基因座的sgRNA和对三个单独的SNP进行编码的供体片段进行编码的质粒转化感受态谷氨酸棒状杆菌细胞。1.SNP使PAM区突变并且阻止由sgRNA/Cas9复合物进行进一步识别。2.SNP使原型间隔子识别序列的种子区突变,距PAM区中的突变10个bp。3.rpsL开放阅读框中的SNP,距PAM位点65个bp。在供体片段上的同源臂外杂交的引物用于从筛选的菌落扩增rpsL区。使用此扩增子产生标签文库,并且将其提交用于高通量测序。A.测序从成功并入所有三个SNP、与rpsL供体片段比对而没有错误的菌落中读取。B.测序从未编辑的WT菌落中读取,所述未编辑的WT菌落与rpsL供体片段比对,并且在工程化的SNP位点中的每个工程化的位点处表现出序列差异。C.示出了对三个单独的SNP进行编码的示范性rpsL供体片段的示意图。
图7展示了根据本发明的实施例的在谷氨酸棒状杆菌中进行RNA引导的核酸内切酶编辑的结果。用含有pCASE1起点的质粒转化含有整合的Cas9基因的NRRL-B11474谷氨酸棒状杆菌细胞。pCASE1质粒对靶向三个基因座之一的sgRNA以及对扰乱PAM基因座的SNP进行编码的匹配供体片段进行编码,在任一侧上侧接的SNP具有125个bp的同源序列。通过PCR扩增、标记和下一代测序来筛选菌落,并且通过将经过序列确认的编辑菌落的总数与所筛选的全部菌落进行列表来计算编辑百分比。
图8展示了根据本发明的实施例的在谷氨酸棒状杆菌中进行RNA引导的核酸内切酶编辑的结果。构建含有pCASE1或pCG1复制起点的质粒,以对靶向三个基因座(cg0167、cg3404、rpsL)之一的sgRNA以及被设计用于在靶向的基因座处引入SNP的供体片段进行编码。构建供体片段,其中侧接预期SNP的任一侧的同源臂长度的范围为25个bp到125个bp。通过PCR扩增、标记和下一代测序来筛选菌落,并且通过将经过序列确认的编辑菌落的总数与所筛选的全部菌落进行列表来计算编辑百分比。
图9展示了根据本发明的实施例的在谷氨酸棒状杆菌中进行RNA引导的核酸内切酶基因组编辑的结果。构建含有pCASE1或pCG1复制起点的质粒,以对靶向三个基因座(cg3031、cg3404、gdhA)之一的sgRNA以及被设计用于在靶基因座处引入100个bp的小的插入的供体片段进行编码。构建供体片段,其中侧接预期插入的任一侧的同源臂长度的范围为25个bp到2000个bp。通过PCR扩增、标记和下一代测序来筛选菌落,并且通过将经过序列确认的编辑菌落的总数与所筛选的全部菌落进行列表来计算编辑百分比。
图10是用于用RNA引导的核酸内切酶在谷氨酸棒状杆菌基因组中产生编辑的示范性构型的示意图。此构型使用dsDNA供体片段和表达RecET的复制辅助质粒以及对sgRNA进行编码的单独复制质粒。
图11示出了通过递送经过PCR扩增的供体片段和在复制质粒中进行编码的sgRNA进行RNA引导的核酸内切酶编辑的菌落筛选结果。使用PCR筛选菌落,并且通过Sanger测序分析进行验证。经过编辑的菌落是从cg3031基因座去除702个bp的敲除。每个条代表针对预期编辑进行阳性筛选的菌落的平均百分比,并且点代表从单独转化事件中编辑的菌落的百分比。
图12描绘了证明用于通过利用基于质粒的系统进行CRISPR/Cas9编辑来制备SNP和小插入的两种不同的谷氨酸棒状杆菌复制起点的有效性的数据。构建了两组编辑质粒,以在三个基因座之一处引入SNP(A.和C.)或100个bp的插入(B.和D.)。质粒含有pCASE1或pCG1复制起点。所有质粒还含有对靶基因座具有特异性的sgRNA,以及在SNP的任一侧上含有125个bp的同源性或在插入的任一侧上含有500个bp的同源性的供体片段。将质粒转化到携带整合的、组成型表达的Cas9基因拷贝的NRRL-B11474谷氨酸棒状杆菌菌株中,并且最多挑选8个菌落用于通过下一代测序(NGS)进行筛选。对于每个编辑构建体,对两个生物重复品进行平均。A.通过靶基因座和谷氨酸棒状杆菌复制起点筛选对预期SNP引入呈阳性的菌落的百分比。B.通过靶基因座和谷氨酸棒状杆菌复制起点筛选对预期100个bp的插入呈阳性的菌落的百分比。C.和D.通过将对由谷氨酸棒状杆菌复制起点进行小插入编辑执行学生t检验的平均值进行比较,证明在使用pCASE1起点时,插入编辑效率具有统计学上显著的提高。
图13展示了从谷氨酸棒状杆菌基因组基因座cg3031缺失702个bp,并且是对引导RNA设计参数进行评估的结果。在此实验中,将含有设计成在cg3031基因座中引入702个bp的缺失的供体片段和靶向缺失区的sgRNA的质粒引入到表达NRRL-B11474谷氨酸棒杆菌菌株的Cas9中。将质粒转化到表达菌株的Cas9中后,使用PCR和DNA片段分析筛选存在来自cg3031基因座的702个bp的缺失的缺失的菌落。野生型cg3031基因座产生1648个bp的条带,而在cg3031基因座中具有靶缺失的菌落产生946个bp的条带。PCR片段分析数据示出了在8个菌落中的6个菌落中从cg3031基因座缺失702个bp。
图14是对五个谷氨酸棒状杆菌复制起点的转化效率进行比较的图。菱形的中心线代表总体平均值,并且外菱形线为95%的置信区间。出乎意料的是,与pBL1、pCC1和pNG2质粒相比,含有CASE1和CG1复制起点的质粒系统表现出统计学上显著更高的转化效率(通过图克-克拉默(Tukey-Kramer),P<0.05)。
图15展示了证明在两个基因座cg3404和rpsL处进行多重编辑的覆盖图。所述图描绘了在y轴上读段的数量和在x轴上的染色体坐标。竖直标志物(浅色阴影)指示比对的读段与参考序列之间的不一致。当将来自突变菌落的读段映射到野生型参考序列时,在cg3404基因座处存在两种不一致,并且在rpsL基因座处存在三种不一致,这表明在这些基因座处进行编辑。在cg0167基因座(未针对编辑进行靶向的基因座)处不存在不一致。相反,当将来自突变菌落的读段映射到cg0167、cg3404和rpsL时,所述读段在cg3404和rpsL处完全对齐(如所预期的),并且在cg0167处与突变不一致(如所预期的)。
具体实施方式
定义
虽然认为以下术语可以很好地为本领域的普通技术人员所理解,但是阐述以下定义是为了便于解释当前公开的主题。
术语“一个(a)”或“一种(an)”是指一或多个所述实体,即可以指复数指示物。如此,术语“一个(a)”或“一种(an)”、“一或多个”以及“至少一个”在本文可互换地使用。另外,通过不定冠词“一个(a)”或“一种(an)”提及“一个元素”并不排除存在多于一个元素的可能性,除非上下文明确地要求存在一个且仅有一个元素。
除非另有说明,否则术语“约”是指所指示的参数的±10%的变化。
术语“经过基因修饰的宿主细胞”、“重组宿主细胞”和“重组菌株”在本文中可互换地使用,并且是指已经通过本公开的CRISPR介导的方法进行基因修饰的宿主细胞。因此,与宿主棒状杆菌属细胞来源于的天然存在的微生物相比,术语包含已经进行基因改变、修饰或工程化使得其表现出改变、修饰或不同的基因型和/或表型(例如,当基因修饰影响微生物的编码核酸序列时)的宿主棒状杆菌属细胞。应当理解,术语不仅指所讨论的特定重组微生物,而且还指此类微生物的后代或潜在后代。
术语“基因工程化”可以指对宿主棒状杆菌属细胞基因组的任何操纵(例如,通过核酸的插入、缺失或取代)。
术语“多核苷酸”和“核酸”在本文可互换地使用,并且是指任何长度的核苷酸的聚合形式,即核糖核苷酸或脱氧核糖核苷酸或其类似物。这些术语指分子的一级结构,并且因此包含双链和单链DNA以及双链和单链RNA。所述术语还包含经过修饰的核酸,如甲基化和/或加帽的核酸、含有经过修饰的碱基的核酸、骨架修饰等。
如本文所使用的,术语“基因”是指与生物功能相关的DNA的任何区段。因此,基因包含但不限于其表达所需的编码序列和/或调节序列。基因还可以包含非表达的DNA区段,例如形成其它蛋白质的识别序列。基因可以从多种来源获得,包含从所关注的来源克隆或从已知或预测的序列信息合成,并且可以包含被设计成具有期望的参数的序列。
如本文所使用的,术语“同源的”或“同源物”或“直系同源物”是本领域已知的,并且是指共享共同祖先或家族成员并且基于序列同一性程度确定的有关序列。术语“基本上类似”和“基本上对应”在本文可互换地使用。所述术语是指其中一或多个核苷酸碱基的差异不影响核酸片段介导基因表达或产生某种表型的能力的核酸片段。这些术语还指本公开的核酸片段的修饰,如相对于初始的未经过修饰的片段,基本上不改变所得核酸片段的功能特性的一或多个核苷酸的缺失或插入。因此,如本领域技术人员将理解的,应当理解,本公开不仅仅涵盖具体的示范性序列。这些术语“同源的”或“同源物”或“直系同源物”或“基本上类似”或“基本上对应”可以描述在一种物种、亚种、变种、栽培品种或菌株中发现的基因与在另一物种、亚种、变种、栽培品种或菌株中的相应或等效基因之间的关系。
出于本公开的目的,对同源序列进行比较。认为、相信或已知“同源序列”或“同源物”或“直系同源物”在功能上有关。可以以多种方式中的任何一种来指示功能关系,包含但不限于:(a)序列同一性的程度和/或(b)相同或类似的生物功能。优选地,指示(a)和(b)两者。同源性可以使用默认参数使用本领域中容易获得的软件程序来确定,如NCBI BLAST(基本局部比对搜索工具)。
如本文所使用的,如本领域所熟知的,术语“核苷酸改变”是指例如核苷酸取代、缺失和/或插入。例如,突变含有产生沉默取代、添加或缺失但不改变编码蛋白质的特性或活性或蛋白质的制备方式的改变。
如本文所使用的,如本领域所熟知的,术语“蛋白质修饰”是指例如氨基酸取代、氨基酸修饰、缺失和/或插入。
如本文所使用的,术语“核酸或多肽的至少一部分或片段”意指具有此类序列的最小尺寸特性的部分或全长分子的直至并包含全长分子的任何较大片段。本公开的多核苷酸的片段可以对基因调节元件的生物活性部分进行编码。基因调节元件的生物活性部分可以通过分离本公开的多核苷酸之一的包括基因调节元件的一部分并且如本文所描述的对活性进行评估来制备。类似地,多肽的一部分可以是4个氨基酸、5个氨基酸、6个氨基酸、7个氨基酸,依此类推,直至全长多肽。待使用的部分的长度将取决于特定的应用。可用作引导RNA的杂交探针或靶向区的核酸的一部分可以短至12个核苷酸;在一些方面,所述部分为或约为15个、20个或25个核苷酸。可用作表位的多肽的一部分可以短至4个氨基酸。执行全长多肽的功能的多肽的一部分通常长于4个氨基酸。在一些情况下,执行全长多肽的功能的多肽的一部分含有从N和/或C末端缺失的1个、2个、3个、4个、5个、6个、7个、8个、9个或10个氨基酸。
如本文所使用的,“启动子”是指能够控制编码序列或功能性RNA的表达的DNA序列。启动子序列可以由近端和更远端的上游元件组成,后者元件通常被称为增强子。因此,“增强子”是可以刺激启动子活性的DNA序列,并且可以是启动子的先天元件或被插入以增强启动子的水平或组织特异性的异源元件。下表1中提供了适用于本说明书的方法的非限制性启动子序列:用于驱动引导RNA表达的示例性启动子。
表1:用于驱动引导RNA或RNA引导的核酸内切酶(例如,Cas9)表达的示例性启动子
如本文所使用的,术语“内源性”和“天然”是指基因或启动子的天然存在的拷贝。
如本文所使用的,术语“天然存在的”是指来源于天然存在的来源的基因。在一些方面,天然存在的基因是指野生型(非转基因)基因的基因,当被引入不同生物体中时,无论是定位于其源生物体内的内源环境,还是置于“异源”环境中。因此,出于本公开的目的,“非天然存在的”基因是已被突变或以其它方式修饰或合成以具有与已知天然基因不同的序列的基因。在一些方面,修饰可以处于蛋白质水平下(例如,氨基酸取代)。在其它方面,修饰可以处于DNA水平下,而对蛋白质序列没有任何影响(例如,密码子优化)。
如本文所使用的,术语“异源”是指在特定生物体中不是天然存在的或在特定生物体中的特定情况下(例如,基因组或质粒位置)不是天然存在的氨基酸或核酸序列(例如,基因或启动子)。例如,当可操作地连接到在野生型谷氨酸棒状杆菌中未可操作地连接的核酸序列时,或当天然启动子或其它核酸序列以非天然的形式(如以异源质粒或异源核酸序列)递送时,谷氨酸棒状杆菌的天然启动子或其它核酸序列可以是异源的。
如本文所使用的,术语“外源”与术语“异源”可互换地使用,并且是指来自除其天然来源之外的某一来源的物质。例如,术语“外源蛋白质”或“外源基因”是指来自非天然来源或位置且已被人工供应给生物系统的蛋白质或基因。出于本公开的目的,内源基因的人工突变的变体被认为是“外源的”。
如本文所使用的,短语“重组构建体”、“表达构建体”、“嵌合构建体”、“构建体”和“重组DNA构建体”在本文可互换地使用。重组构建体包括核酸片段的人工组合,例如自然界中未一起发现的调节序列和编码序列。例如,嵌合构建体可以包括源自不同来源的调节序列和编码序列、或源自相同来源的但以与自然界中发现的方式不同的方式布置的调节序列和编码序列。此类构建体可以单独使用或者可以与载体结合使用。如果使用载体,则载体的选择取决于如本领域技术人员所熟知的将用于转化宿主细胞的方法。例如,可以使用质粒载体。
技术人员充分了解为了成功转化、选择和繁殖包括本公开的分离的核酸片段中的任何分离的核酸片段的宿主细胞而必须存在于载体上的基因元件。技术人员还将认识到,不同的独立转化事件将导致不同的表达水平和模式(琼斯(Jones)等人,(1985)欧洲分子生物学学会会刊(EMBO J.)4:2411-2418;阿尔梅达(De Almeida)等人,(1989)分子遗传学与基因组学(Mol.Gen.Genetics)218:78-86),并且因此,必须筛选多个事件以获得显示所期望的表达水平和模式的线。可以通过DNA的Southern印迹分析、mRNA表达的Northern印迹分析、蛋白表达的免疫印迹分析或表型分析等来完成此类筛选。载体可以是自主复制或可以整合到宿主细胞的染色体中的质粒、病毒、噬菌体、前病毒、噬菌粒、转座子、人工染色体等。载体也可以是不自主复制的裸RNA多核苷酸、裸DNA多核苷酸、由同一链内的DNA和RNA两者构成的多核苷酸、聚赖氨酸缀合的DNA或RNA、肽缀合的DNA或RNA、脂质体缀合的DNA等。如本文所使用的,术语“表达”是指功能性最终产物例如mRNA或蛋白质(前体或成熟)的产生。
在此上下文中,术语“可操作地连接”意指根据本公开的启动子多核苷酸与另外的寡核苷酸或多核苷酸的顺序布置,从而导致所述另外的多核苷酸的转录。在一些方面,本公开的启动子序列恰好在基因的5'UTR或开放阅读框之前插入。在其它方面,本公开的可操作地连接的启动子序列和基因序列被一或多个接头核苷酸分开。
当此类DNA已经被引入细胞内部时,细胞已经被外源DNA(例如,重组表达载体)“遗传修饰”或“转化”或“转染”。外源DNA的存在导致永久或瞬时的遗传变化。转化DNA可以或可以不整合(共价连接)到细胞的基因组中。例如,在原核生物、酵母和哺乳动物细胞中,转化DNA可以保持在附加型元件如质粒上。对于真核细胞,稳定转化的细胞是一种其中转化DNA已经整合到染色体中使得其通过染色体复制由子细胞遗传的细胞。真核细胞建立包括含有转化DNA的子代细胞群的细胞系或克隆的能力证明了这种稳定性。“克隆”是通过有丝分裂源自单个细胞或共同祖先的细胞群。“细胞系”是能够在体外稳定生长许多代的原代细胞的克隆。
如本文所使用的,“靶核酸”是包含“靶位点”或“靶序列”的多核苷酸(例如,RNA、DNA)。术语“靶位点”或“靶序列”在本文可互换地使用,以指代存在于靶核酸中的核酸序列,只要存在足够的结合条件,主题引导核酸的靶向区段将与所述靶核酸结合。合适的杂交条件包含细胞中通常存在的生理条件。对于双链靶核酸,与引导核酸互补并且与其杂交的靶核酸的链被称为“互补链”;而与“互补链”互补(并且因此不与引导核酸互补)的靶核酸的链被称为“非互补链(noncomplementary strand或non-complementary strand)”。在靶核酸是单链靶核酸(例如,单链DNA(ssDNA)、单链RNA(ssRNA))的实施例中,引导核酸与单链靶核酸互补并且杂交。
与RNA引导的核酸内切酶(例如,Cas9多肽)结合并且将多肽靶向到靶核酸内的特定位置的核酸分子在本文中被称为“引导核酸”。当引导核酸是RNA分子时,其可以被称为“引导RNA”或“gRNA”。引导核酸包括两个区段,第一区段(在本文中被称为“靶向区段”);以及第二区段(在本文中被称为“蛋白质结合区段”)。“区段”是指分子的区段/切片/区,例如核酸分子中的核苷酸的连续段。区段也可以意指复合物的区/切片,使得区段可以包括一个以上分子的区。例如,在一些实施例中,引导核酸的蛋白质结合区段(如下所述)是一个核酸分子(例如,一个RNA分子),并且蛋白质结合区段因此包括所述一个分子的区。在其它实施例中,引导核酸的蛋白质结合区段(如下所述)包括沿互补性区杂交的两个单独的分子。作为说明性的非限制性实例,包括两个单独的分子的引导核酸的蛋白质结合区段可以包括:(i)长度为100个碱基对的第一分子(例如,RNA分子、DNA/RNA杂交分子)的碱基对40-75;以及(ii)长度为50个碱基对的第二分子(例如,RNA分子)的碱基对10-25。除非在特定上下文中另外明确定义,否则“区段”的定义不限于总碱基对的具体数量,不限于来自给定核酸分子的碱基对的任何特定数量,不限于复合物内的单独的分子的特定数量,并且可以包含具有任何总长度的核酸分子的区,并且可以包含或可以不包含与其它分子互补的区。
引导核酸(例如,引导RNA或gRNA)的第一区段(靶向区段)包括与靶核酸(例如,靶ssRNA、靶ssDNA、双链靶DNA的互补链等)内的特异性序列(靶位点)互补的核苷酸序列。蛋白质结合区段(或“蛋白质结合序列”)与RNA引导的核酸内切酶(例如,Cas9)多肽相互作用。靶核酸的位点特异性结合和/或裂解可以发生在由引导核酸(例如,引导RNA)与靶核酸之间的碱基配对互补性确定的位置处。
主题引导核酸的蛋白质结合区段包括核苷酸的两个彼此杂交以形成双链RNA双链体(dsRNA双链体)的互补段。
连接到供体多核苷酸的主题引导核酸(例如,引导RNA)与主题RNA引导的核酸内切酶(例如,Cas9)形成复合物(即,通过非共价相互作用结合)。引导核酸(例如,引导RNA)通过包括与靶核酸的序列互补的核苷酸序列而提供对复合物的靶特异性。因此,复合物的RNA引导的核酸内切酶(例如,Cas9)由于其与引导核酸的蛋白质结合区段的缔合而提供位点特异性或“靶向”活性。
在一些实施例中,主题引导核酸(例如,引导RNA)包括两个单独的核酸分子,并且在本文中被称为“双重引导核酸”。在一些实施例中,主题引导核酸是单个核酸分子(单个多核苷酸),并且在本文中被称为“单个引导核酸”。术语“引导核酸”是包含性的,既指双重引导核酸又指单个引导核酸,并且术语“引导RNA”也是包含性的,指双重引导RNA(dgRNA)和单个引导RNA(sgRNA)两者。
在一些实施例中,引导核酸是DNA/RNA杂交分子。在此类实施例中,引导核酸的蛋白质结合区段是RNA并且形成RNA双链体。然而,引导核酸的靶向区段可以是DNA。因此,如果DNA/RNA杂交引导核酸是双重引导核酸,则靶向区段可以是DNA,并且双链体形成区段可以是RNA。在此类实施例中,“活化剂”分子的双链体形成区段可以是RNA(例如,为了与靶向区段的双链体形成区段形成RNA双链体),而在双链体形成区段之外的“活化剂”分子的核苷酸可以是DNA(在这种情况下,活化剂分子是杂交DNA/RNA分子)或可以是RNA(在这种情况下,活化剂分子是RNA)。如果DNA/RNA杂交引导核酸是单个引导核酸,则靶向区段可以是DNA,双链体形成区段(其组成蛋白质结合区段)可以是RNA,并且靶向区段和双链体形成区段之外的核苷酸可以是RNA或DNA。
示范性双重引导核酸包括CRISPR-RNA(crRNA)分子和对应的反式活化crRNA(tracrRNA)分子。crRNA分子既包括引导核酸的靶向区段(单链),又包括形成引导核酸的蛋白质结合区段的dsRNA双链体的一半的核苷酸段(“双链体形成区段”)。对应的tracrRNA分子包括形成引导核酸的蛋白质结合区段的dsRNA双链体的另一半的核苷酸段(双链体形成区段)。换句话说,crRNA分子的核苷酸段与tracrRNA分子的核苷酸段互补并且与其杂交,以形成引导核酸的蛋白质结合结构域的dsRNA双链体。crRNA样分子另外提供单链靶向区段。因此,crRNA和tracrRNA(作为对应的对)杂交以形成双重引导核酸。给定的crRNA或tracrRNA分子的确切序列具有其中发现RNA分子的物种的特性。
术语“原型间隔子”是指由crRNA引导链靶向的DNA序列。在一些方面,原型间隔子序列与CRISPR复合物的crRNA引导序列杂交。
“原型间隔子相邻基序”或“PAM”序列是紧随由RNA引导的核酸内切酶(例如,Cas9)靶向的DNA序列之后的2-6个碱基对的DNA序列。PAM序列是裂解靶核酸所需的,并且根据RNA引导的核酸内切酶(例如,Cas9)的来源而变化。例如,在化脓链球菌(Streptococcuspyogenes)Cas9的情况下,PAM序列是NGG。在本公开的各方面,PAM序列由供体多核苷酸进行突变,从而防止靶位点进一步裂解。
在一些情况下,组分,例如核酸组分(例如,引导核酸等);蛋白质组分(例如,RNA引导的核酸内切酶、Cas9多肽、变体RNA引导的核酸内切酶、变体Cas9多肽)等包含标记部分。如本文所使用的,术语“标记”、“可检测标记”或“标记部分”是指提供信号检测的任何部分,并且可以根据测定的特定性质而广泛变化。所关注的标记部分包含直接可检测的标记(例如,荧光标记)和间接可检测的标记(间接标记,例如,结合对成员)两者。荧光标记可以是任何荧光标记,例如荧光染料(例如,荧光黄、德克萨斯红、罗丹明、标记等)、荧光蛋白(例如,绿色荧光蛋白(GFP)、增强GFP(EGFP)、黄色荧光蛋白(YFP)、红色荧光蛋白(RFP)、青色荧光蛋白(CFP)、mCherry、mTomato、mTangerine和其任何荧光衍生物等)。
用于所述方法的合适的可检测的(直接或间接)标记部分包含可通过光谱学、光化学、生物化学、免疫化学、电学、光学、化学或其它方式检测的任何部分。例如,合适的间接标记包含生物素(结合对成员),所述生物素可以由链霉亲和素(其自身可以直接或间接被标记)结合。标记还可以包含:放射性标记(直接标记)(例如,3H、125I、35S、14C或32P);酶(间接标记)(例如,过氧化物酶、碱性磷酸酶、半乳糖苷酶、荧光素酶、葡萄糖氧化酶等);荧光蛋白(直接标记)(例如,绿色荧光蛋白、红色荧光蛋白、黄色荧光蛋白和其任何方便的衍生物);金属标记(直接标记);比色标记;结合对成员;等等。“结合对成员”是指第一部分和第二部分中的一个部分,其中所述第一部分和所述第二部分彼此具有特异性结合亲和力。合适的结合对包含但不限于:抗原/抗体(例如,洋地黄毒苷/抗洋地黄毒苷、二硝基苯(DNP)/抗DNP、丹磺酰-X-抗丹磺酰、荧光素/抗荧光素、荧光黄/抗荧光黄和罗丹明/抗罗丹明)、生物素/亲和素(或生物素/链霉亲和素)以及钙调蛋白结合蛋白(CBP)/钙调蛋白。任何结合对成员可以适合用作间接可检测的标记部分。
任何给定的组分或组分的组合可以是未标记的,或可以用标记部分可检测地标记。在一些实施例中,当标记两种或两种以上组分时,可以用彼此可区分的标记部分标记所述组分。
分子和细胞生物化学的通用方法可以在这种标准教科书中找到,如分子克隆:实验室手册(Molecular Cloning:A Laboratory Manual),第3版(萨姆布鲁克(Sambrook)等人,港口实验室出版社(HaRBor Laboratory Press)2001);精编分子生物学实验指南(Short Protocols in Molecular Biology),第4版(奥苏贝尔(Ausubel)等人编辑,约翰威利父子出版社(John Wiley&Sons)1999);蛋白质方法(Protein Methods)(博拉格(Bollag)等人,约翰威利父子出版社1996);用于基因疗法的非病毒载体(Nonviral Vectors forGene Therapy)(瓦格纳(Wagner)等人编辑,学术出版社(Academic Press)1999);病毒载体(Viral Vectors)(卡普力夫(Kaplift)和洛伊(Loewy)编辑,学术出版社1995);免疫学方法手册(Immunology Methods Manual)(莱夫科维奇(I.Lefkovits)编辑,学术出版社1997);细胞和组织培养:生物技术实验室程序(Cell and Tissue Culture:LaboratoryProcedures in Biotechnology)(道尔(Doyle)和格里菲思(Griffiths),约翰威利父子出版公司1998);以及分子生物学实验指南(奥苏贝尔等人编辑,约翰威利父子出版公司2003),包含增补版1-117,所述文献的公开内容通过引用并入本文中。
RNA引导的核酸内切酶多肽
存在至少五种主要的CRISPR系统类型(I型、II型、III型、IV型和V型)和至少16种不同的亚型(基拉·马卡洛娃(Makarova,K.S.)等人,自然综述:微生物学(Nat RevMicrobiol.)2015.自然综述:微生物学13,722–736)。CRISPR系统也基于其效应蛋白进行分类。第1类系统具有多亚基crRNA效应复合物,而在第2类系统中,效应复合物的所有功能均由RNA引导的核酸内切酶(例如,Cas9)执行。如实例中所描述的,本公开有利地采用II型CRISPR RNA引导的核酸内切酶,如Cas9多肽、其变体和/或其直系同源物。本领域技术人员将理解,本公开的各方面可适用于除包括Cas9(例如,Cpf1)的那些系统以外的其它CRISPR/Cas系统。因此,合适的RNA引导的DNA核酸内切酶可以选自以下:例如,Cas9、Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas12h、Cas13a、Cas13b、Cas13c、Cpf1和MAD7或其同源物、直系同源物或旁系同源物。
用于本发明的合适的RNA引导的核酸内切酶多肽(例如,Cas9多肽)包含天然存在的RNA引导的核酸内切酶多肽,例如Cas9多肽(例如,天然存在于细菌和/或古细菌细胞中)或r如下文所讨论的变体Cas9多肽。在一个优选的实施例中,Cas9多肽来自化脓链球菌。在特别优选的实施例中,RNA引导的核酸内切酶多肽(例如,Cas9多肽)已针对链霉菌属进行密码子优化,如科布(Cobb)等人,ACS合成生物学(ACS Synth.Biol.),4,723-728(2015)中所描述的。
如本文所详述的,天然存在的RNA引导的核酸内切酶多肽(例如,Cas9多肽)结合引导核酸,并且由此被引导至靶核酸(靶位点)内的特异性序列,并且裂解靶核酸(例如,裂解dsDNA以产生双链断裂、裂解ssDNA、裂解ssRNA等)。因此,合适的RNA引导的核酸内切酶多肽(例如,Cas9多肽)将包括两个部分,RNA结合部分和活性部分。RNA结合部分与主题引导核酸相互作用,并且活性部分表现出定点酶活性(例如,核酸酶活性、DNA和/或RNA甲基化活性、DNA和/或RNA裂解活性、组蛋白乙酰化活性、组蛋白甲基化活性、RNA修饰活性、RNA结合活性、RNA剪接活性等)。在一些实施例中,相对于野生型RNA引导的核酸内切酶多肽(例如,Cas9多肽)的对应活性部分,所述活性部分可以表现出降低的核酸酶活性。
用于确定蛋白质是否具有与主题引导核酸相互作用的RNA结合部分的测定可以是测试蛋白质与核酸之间的结合的任何方便的结合测定。示范性结合测定包含涉及将引导核酸和RNA引导的核酸内切酶多肽(例如,Cas9多肽)添加到靶核酸的结合测定(例如,凝胶移位测定)。
用于确定蛋白质是否具有活性部分(例如,用于确定多肽是否具有裂解靶核酸的核酸酶活性)的测定可以是测试核酸裂解的任何方便的核酸裂解测定。示范性裂解测定包含但不限于将引导核酸和RNA引导的核酸内切酶多肽(例如,Cas9多肽)添加到靶核酸并且通过任何合适的分析技术(如测序或PCR扩增)检查靶核酸的裂解是否已经发生。
适用于本发明的RNA引导的核酸内切酶多肽(例如,Cas9多肽)包含变体RNA引导的核酸内切酶多肽(例如,Cas9多肽)。当与野生型RNA引导的核酸内切酶多肽(例如,Cas9多肽)的氨基酸序列相比时,变体RNA引导的核酸内切酶多肽(例如,Cas9多肽)具有的氨基酸序列相差至少一个氨基酸(例如,具有缺失、插入或取代),从而导致核酸酶活性的修饰。
在一些实施例中,变体RNA引导的核酸内切酶多肽(例如,Cas9多肽)可以裂解靶核酸的互补链,但是裂解双链靶核酸的非互补链的能力降低。例如,变体RNA引导的核酸内切酶多肽(例如,Cas9多肽)可以具有降低RuvC结构域的功能的突变(氨基酸取代)。作为非限制性实例,在一些实施例中,变体Cas9多肽具有D10A突变(例如,在与由SEQ ID NO:3的核酸序列进行编码的Cas9多肽的位置10相对应的氨基酸位置处的天冬氨酸盐至丙氨酸)并且因此可以裂解双链靶核酸的互补链,但裂解双链靶核酸的非互补链的能力降低(因此,当变体Cas9多肽裂解双链靶核酸时,会导致单链断裂(SSB)而不是双链断裂(DSB))(参见例如,季聂克等人,科学(Science.)2012年8月17日;337(6096):816-21)。
在一些实施例中,变体RNA引导的核酸内切酶多肽(例如,Cas9多肽)可以裂解双链靶核酸的非互补链,但是裂解靶核酸的互补链的能力降低。例如,变体RNA引导的核酸内切酶多肽(例如,Cas9多肽)可以具有降低HNH结构域的功能的突变(氨基酸取代)。作为非限制性实例,在一些实施例中,变体Cas9多肽可以具有H840A突变(例如,与化脓链球菌的位置840相对应的氨基酸位置处的组氨酸至丙氨酸)并且因此可以裂解靶核酸的非互补链,但裂解靶核酸的互补链的能力降低(因此,当变体Cas9多肽裂解双链靶核酸时,会导致SSB而不是DSB)。
在其它实施例中,本公开的RNA引导的核酸内切酶多肽(例如,Cas9肽)可以包含文献中所描述突变中的一或多种突变,包含但不限于以下中所描述的功能性突变:方法拉(Fonfara)等人,核酸研究(Nucleic Acids Res.)2014年2月;42(4):2577-90;西增弘治(Nishimasu H.)等人,细胞(Cell)2014年2月27日;156(5):935-49;马丁·季聂克等人,科学2012 337:816-21;马丁·季聂克等人,科学2014年3月14日;343(6176);和陈(Chen)等人,自然(Nature)2017年10月19日;550(7676):407-410;还参见美国专利公开第2014/0068797号;以及第2016/0168592号;还参见PCT专利公开号WO 2017/155717;WO 2017/147056;WO 2017/066175;WO 2017/040348;WO 2017/035416;WO 2017/015101;WO 2016/186953;和WO 2016/186745;进一步地,参见美国专利第8,697,359号;第8,771,945号;第8,795,965号;第8,865,406号;第8,871,445号;第8,889,356号;第8,895,308号;第8,906,616号;第8,932,814号;第8,945,839号;第8,993,233号;第8,999,641号;第9,840,713号;第9,840,699号;和第9,771,600号。出于所有目的,前述专利和出版物中的每个通过引用整体并入本文中,所述目的包含但不限于用于利用RNA引导的核酸酶、引导RNA、CRISPR相关蛋白、供体核酸和/或CRISPR系统的组分对一或多个核酸的表达进行靶向、切割、编辑、修饰或调节的方法和组合物。
因此,在一些实施例中,本文所公开的系统和方法可以与具有双链核酸酶活性的野生型RNA引导的核酸内切酶多肽(例如,Cas9多肽)、充当单链切口酶的RNA引导的核酸内切酶多肽(例如,Cas9变体)或其它具有经过修饰的核酸酶活性的突变体一起使用。如此,适用于本发明的RNA引导的核酸内切酶多肽(例如,Cas9多肽)可以是酶活性的RNA引导的核酸内切酶多肽(例如,Cas9多肽),例如与野生型RNA引导的核酸内切酶多肽(例如,Cas9多肽)相比,所述酶活性的RNA引导的核酸内切酶多肽可以在靶核酸中产生单链或双链断裂或者可替代地可以具有降低的酶活性。
RNA引导的核酸内切酶多肽(例如,Cas9多肽)可以以各种合适的形式提供给细胞或在细胞中提供。在一些实施例中,所述RNA引导的核酸内切酶由质粒进行编码。质粒可以是具有复制能力的或没有复制能力的,并且优选是具有复制能力的。质粒可以是与对引导RNA进行编码的质粒和/或对供体多核苷酸进行编码的质粒相同或不同的质粒。在一些情况下,RNA引导的核酸内切酶由第一质粒进行编码,并且引导RNA由第二质粒进行编码。在一些情况下,供体片段由第一质粒进行编码。在一些情况下,供体片段由第二质粒进行编码。在一些情况下,供体片段由第三质粒进行编码。
本发明的质粒可以包括谷氨酸棒状杆菌和/或大肠杆菌相容的复制起点。在一些情况下,质粒包括CG1或CASE1起点。在一些情况下,质粒包括colE1、p15a或R6k起点。在一些情况下,质粒包括选自CG1和CASE1的起点以及选自colE1、p15a和R6k的起点。
如本文所描述,在一些情况下,供体片段、RNA引导的核酸内切酶和/或引导RNA中的一或多种在线性或环形非质粒核酸片段中进行编码。一或多个片段可以整合到基因组中。因此,在一些实施例中,RNA引导的核酸内切酶可以在整合到待编辑的细胞的基因组中的核酸片段中进行编码。在一些情况下,质粒或整合片段进一步含有可以在稍后的时间被活化以去除RNA引导的核酸内切酶编码序列的用于阴性选择(例如,mazF、ccdB、gata-1、lacY、thyA、pheS、tetAR、rpsL、sacB、温度敏感的复制起点等)和/或侧接重组序列(如FLP、loxP序列等)的序列。
对RNA引导的核酸内切酶进行编码的核酸(例如,线性或环形片段或质粒)可以含有选择标志物。合适的选择标志物包含但不限于抗生素抗性基因,如氯霉素(chloramphenicol)抗性基因、氨苄青霉素(ampicillin)抗性基因、四环素(tetracycline)抗性基因、吉欧霉素(Zeocin)抗性基因、壮观霉素(spectinomycin)抗性基因和卡那霉素(Kanamycin,Km)抗性基因)、四环素抗性基因(tetA)、G418(新霉素(neomycin)抗性基因)、van(万古霉素(vancomycin)抗性基因)、tet(四环素抗性基因)、氨苄青霉素(氨苄青霉素抗性基因)、甲氧西林(methicillin)(甲氧西林抗性基因)、盘尼西林(penicillin)(盘尼西林抗性基因)、苯唑西林(oxacillin)(苯唑西林抗性基因)、红霉素(erythromycin)(红霉素抗性基因)、利奈唑胺(linezolid)(利奈唑胺抗性基因)、嘌呤霉素(puromycin)(嘌呤霉素抗性基因)或潮霉素(hygromycin)(潮霉素抗性基因)。
在一些情况下,在RNA引导的核酸内切酶编码核酸(例如,线性或环形片段或质粒)中的选择标志物与在对引导RNA和/或供体多核苷酸进行编码的不同核酸中使用的选择标志物相同。在一些情况下,与对引导RNA和/或供体多核苷酸进行编码的不同核酸中的选择标志物相比,RNA引导的核酸内切酶编码质粒中的选择标志物是不同的选择标志物。一或多种阳性和/或阴性选择标志物的使用可以允许对单独的CRISPR组分进行特异性和差异性选择。例如,可以通过在细胞中提供RNA引导的核酸内切酶多肽、第一引导RNA以及任选地第一供体片段来编辑细胞;并且然后通过固化第一引导RNA和供体片段的细胞并且向细胞中提供第二引导RNA和/或供体片段来进行第二编辑。可以通过引入对一或多种CRISPR组分进行编码的核酸、引入一或多种CRISPR组分的核蛋白复合物、诱导一或多种CRISPR组分的表达或其组合来将RNA引导的核酸内切酶、引导RNA和/或供体片段提供到细胞中。
在一些实施例中,RNA引导的核酸内切酶序列可操作地连接到组成型启动子。在一些实施例中,RNA引导的核酸内切酶序列可操作地连接到诱导型启动子。在一些实施例中,RNA引导的核酸内切酶序列可操作地连接到天然启动子。在一些实施例中,RNA引导的核酸内切酶序列可操作地连接到外源启动子。在一些实施例中,RNA引导的核酸内切酶序列可操作地连接到合成启动子。
供体多核苷酸
“供体多核苷酸”或“修复片段”意指待插入在由RNA引导的核酸内切酶(例如,Cas9多肽)诱导的切割位点处的核酸序列。合适的供体多核苷酸序列通常将包括各自与棒状杆菌属靶序列同源的左同源臂序列和右同源臂序列,并且将进一步包括由左同源臂序列和右同源臂序列侧接的至少一个突变序列。在一些情况下,供体多核苷酸包括两个或两个以上突变序列,其中所述两个或两个以上突变序列中的至少两个或全部突变序列由相同的左同源臂序列和右同源臂序列两者侧接,或者所述两个或两个以上突变序列中的至少两个或全部突变序列由不同的左同源臂序列和右同源臂序列侧接。通常,其中两个或两个以上突变序列处于相同的供体多核苷酸中,突变序列是彼此紧邻的靶基因组基因座的突变。通常,供体多核苷酸上的两个或两个以上突变序列对基因组修饰进行编码,所述基因组修饰处于150个碱基对、125个碱基对、100个碱基对、75个碱基对、70个碱基对、65个碱基对、60个碱基对、55个碱基对、50个碱基对、45个碱基对、40个碱基对、35个碱基对、30个碱基对、25个碱基对、20个碱基对或10个或5个碱基对之内或左右。在一些情况下,对在基因组中彼此紧邻的基因组修饰进行编码的两个或两个以上突变序列在基因组中彼此之间的距离为约10个到约100个碱基对或约25个到约75个碱基对。
如本文所证明的,在棒状杆菌属中,CRISPR/Cas9复合物的编辑效率随着同源臂长的增加而显著增加。因此,在一些实施例中,与如本文所描述的RNA引导的核酸内切酶多肽组合使用的右同源臂序列和左同源臂序列各自独立地包括、包括约、包括至少或包括至少约25个;45个;50个;75个;100个;125个;150个;175个;200个;225个;250个;275个;300个;325个;350个;375个;400个;425个;450个;475个;500个;525个;550个;575个;600个;625个;650个;675个;700个;725个;750个;775个;800个;825个;850个;875个;900个;925个;950个;975个;1,000个;1,025个;1,050个;1,075个;1,100个;1,125个;1,150个;1,175个;1,200个;1,225个;1,250个;1,275个;1,300个;1,325个;1,350个;1,375个;1,400个;1,425个;1,450个;1,475个;1,500个;1个;525个;1,550个;1,575个;1,600个;1,625个;1,650个;1,675个;1,700个;1,725个;1,750个;1,775个;1,800个;1,825个;1,850个;1,875个;1,900个;1,925个;1,950个;或2,000个碱基对。在一些实施例中,与如本文所描述的RNA引导的核酸内切酶多肽组合使用的左同源臂序列和右同源臂序列各自独立地包括不超过或不超过约25个;50个;75个;100个;125个;150个;175个;200个;225个;250个;275个;300个;325个;350个;375个;400个;425个;450个;475个;500个;525个;550个;575个;600个;625个;650个;675个;700个;725个;750个;775个;800个;825个;850个;875个;900个;925个;950个;975个;1,000个;1,025个;1,050个;1,075个;1,100个;1,125个;1,150个;1,175个;1,200个;1,225个;1,250个;1,275个;1,300个;1,325个;1,350个;1,375个;1,400个;1,425个;1,450个;1,475个;1,500个;1个;525个;1,550个;1,575个;1,600个;1,625个;1,650个;1,675个;1,700个;1,725个;1,750个;1,775个;1,800个;1,825个;1,850个;1,875个;1,900个;1,925个;1,950个;或2,000个碱基对。
在某些实施例中,与如本文所描述的RNA引导的核酸内切酶多肽组合使用的右同源臂序列和左同源臂序列各自独立地包括介于约45个与约125个之间的碱基对、介于约25个与约2000个之间的碱基对、介于约25个与约1000个之间的碱基对、介于约25个与约600个之间的碱基对、介于约25个与约500个之间的碱基对、介于约25个与约250个之间的碱基对、介于约25个与约200个之间的碱基对、介于约25个与约100个之间的碱基对或介于约25个与约50个之间的碱基对。在某些实施例中,与如本文所描述的RNA引导的核酸内切酶多肽组合使用的右同源臂序列和左同源臂序列各自独立地包括介于约100个与约2000个之间的碱基对、介于约100个与约1000个之间的碱基对、介于约100个与约600个之间的碱基对、介于约100个与约500个之间的碱基对、介于约100个与约250个之间的碱基对、介于约100个与约200个之间的碱基对或介于约100个与约150个之间的碱基对。在某些实施例中,与如本文所描述的RNA引导的核酸内切酶多肽组合使用的右同源臂序列和左同源臂序列各自独立地包括介于约0个与约2000个之间的碱基对、介于约0个与约1000个之间的碱基对、介于约0个与约600个之间的碱基对、介于约0个与约500个之间的碱基对、介于约0个与约250个之间的碱基对、介于约0个与约200个之间的碱基对、介于约0个与约100个之间的碱基对、介于约0个与约50个之间的碱基对或介于约0个与约25个之间的碱基对。
在一些情况下,与如本文所描述的RNA引导的核酸内切酶多肽组合使用的右同源臂序列的长度为0个碱基对,而左同源臂的长度为、为至少、为约或为至少约25个、45个、50个、75个、100个、150个、175个、200个、225个、250个、275个、300个、325个、350个、375个、400个、425个、450个、475个、500个、525个、550个、575个、600个、625个、650个、675个、700个、725个、750个、775个、800个、825个、850个、875个、900个、925个、950个、975个、1000个、1025个、1050个、1075个、1100个、1125个、1150个、1175个、1200个、1225个、1250个、1275个、1300个、1325个、1350个、1375个、1400个、1425个、1450个、1475个、1500个、1525个、1550个、1575个、1600个、1625个、1650个、1675个、1700个、1725个、1750个、1775个、1800个、1825个、1850个、1875个、1900个、1925个、1950个或2000个碱基对。在一些情况下,与如本文所描述的RNA引导的核酸内切酶多肽组合使用的左同源臂序列的长度为0个碱基对,而右同源臂的长度为、为至少、为约或为至少约25个、45个、50个、75个、100个、150个、175个、200个、225个、250个、275个、300个、325个、350个、375个、400个、425个、450个、475个、500个、525个、550个、575个、600个、625个、650个、675个、700个、725个、750个、775个、800个、825个、850个、875个、900个、925个、950个、975个、1000个、1025个、1050个、1075个、1100个、1125个、1150个、1175个、1200个、1225个、1250个、1275个、1300个、1325个、1350个、1375个、1400个、1425个、1450个、1475个、1500个、1525个、1550个、1575个、1600个、1625个、1650个、1675个、1700个、1725个、1750个、1775个、1800个、1825个、1850个、1875个、1900个、1925个、1950个或2000个碱基对。
供体多核苷酸通常与其替换的基因组序列不同。相反,供体多核苷酸通常包括至少一个突变序列,例如相对于基因组序列的一或多个单碱基改变、插入、缺失、倒置或重排,只要存在足够的同源性以支持同源性指导的修复即可。示范性突变序列包含:单核苷酸插入;两个或两个以上核苷酸的插入;对一或多种蛋白质进行编码的核酸序列的插入;单核苷酸缺失;两个或两个以上核苷酸的缺失;一或多个编码序列的缺失;单核甘酸的取代;两个或两个以上核苷酸的取代;两种或两种以上非连续的插入、缺失和/或取代;或其任何组合。在具体实施例中,所述至少一个突变序列包括Cas9 PAM的突变。
在一些实施例中,供体多核苷酸包括具有两种或两种以上非连续突变的突变序列。例如,供体多核苷酸可以包括在RNA引导的核酸内切酶多肽PAM区(例如,Cas9 PAM区)中的突变,任选地或可替代地在RNA引导的核酸内切酶多肽种子区(例如,Cas9种子区)中的突变,以及离至少5个、10个、15个、20个、25个、30个、45个、50个、60个、90个或100个核苷酸的突变。在一些情况下,在基因组中彼此紧邻的非连续修饰处于200个碱基对、175个碱基对、150个碱基对、125个碱基对、100个碱基对、75个碱基对、70个碱基对、65个碱基对、60个碱基对、55个碱基对、50个碱基对、45个碱基对、40个碱基对、35个碱基对、30个碱基对、25个碱基对、20个碱基对或10个碱基对或5个碱基对之内或左右。在一些情况下,在基因组中彼此紧邻的非连续修饰在基因组中彼此之间的距离为约10到约100个碱基对或约25到约75个碱基对。
在一些情况下,一个供体多核苷酸包括两种或两种以上非连续的突变,并且第二或另一个供体多核苷酸包括不同基因座处的突变。在一些情况下,一个供体多核苷酸包括两个或两个以上非连续的序列,并且第二或另一个供体多核苷酸包括不同基因座处的两种或两种以上非连续的突变。
与基因组序列相比,突变序列可以包括某些序列差异,例如限制性位点、核苷酸多态性、可选择标志物(例如,耐药基因、荧光蛋白、酶等)等,所述序列差异可以用于评估供体序列在切割位点处的成功插入,或在一些实施例中可以用于其它目的(例如,表示在靶向基因组基因座处的表达)。在一些实施例中,如果定位于编码区中,则此类核苷酸序列差异将不会改变氨基酸序列,或将使沉默氨基酸发生改变(即,不影响蛋白质的结构或功能的改变)。可替代地,这些序列差异可以包含侧接重组序列,如FLP、loxP序列等,所述重组序列可以在稍后的时间被活化以去除标志物序列。
供体多核苷酸可以以单链DNA或双链DNA的形式提供。可以通过本领域技术人员已知的方法保护供体多核苷酸的末端(例如,防止核酸外切降解)。例如,可以将一或多个双脱氧核苷酸残基添加到线性分子的3'末端和/或可以将自互补寡核苷酸连接到一或两个末端。参见例如,常(Chang)等人(1987)美国国家科学院院刊(Proc.Natl.Acad Sci USA)84:4959-4963;内尔斯(Nehls)等人(1996)科学272:886-889。用于保护外源多核苷酸免于降解的另外的方法包含但不限于添加一或多个末端氨基、磷酸基、甲基以及使用经过修饰的核苷酸间键,例如硫代磷酸酯、氨基磷酸酯和O-甲基核糖或脱氧核糖残基。
在一些实施例中,提供供体多核苷酸,例如引入到细胞中,作为具有另外的序列的质粒的一部分,所述另外的序列例如复制起点、一或多个启动子和/或阳性或阴性选择标志物或其两种、其三种或其全部的组合。在一些实施例中,供体多核苷酸作为具有复制能力的质粒的一部分提供。在一些实施例中,将供体多核苷酸作为无复制能力的质粒的一部分引入到细胞中。可替代地,供体多核苷酸可以作为裸核酸(例如,作为线性或环形片段)、作为与如脂质体或聚合物等药剂复合的核酸引入,或者可以通过病毒(例如,腺病毒、AAV)递送。
在一些实施例中,供体多核苷酸的掺入可以通过同时或顺序引入重组蛋白(如RecE/T)或噬菌体λ源性Red重组系统λ核酸外切酶、β蛋白和/或γ蛋白中的一或多种组分来辅助(参见遗传学(GENETICS)2010年11月1日第186卷第3期791-799)。
在某些实施例中,两个或两个以上编码供体片段的核酸可操作地连接到差异诱导型启动子,以进行选择性诱导,如进行宿主细胞基因组的连续编辑。
不希望受理论的束缚,本发明人假设利用供体多核苷酸的基于质粒的呈递进行的多重基因组编辑可以通过以下详述的机制(1)、(2)、(3)、(4)或(5)中的一或多种进行。
机制(1),单交叉环入,然后进行RNA引导的核酸内切酶多肽(例如,Cas9)/sgRNA介导的切割和修复。在细胞内,对RNA引导的核酸内切酶多肽(例如,Cas9)进行组成型表达。在转化sgRNA/修复片段构建体后,修复片段基因座处存在环入事件(即两个单独的整合事件),由此复制了基因座(即,一个突变体拷贝,一个野生型拷贝)。并行地,构建体上的一或多个sgRNA被表达、折叠并且与RNA引导的核酸内切酶多肽(例如,Cas9)结合-引发其进行靶识别和切割。此时,“引发的RNA引导的核酸内切酶多肽(例如,Cas9)”识别并且裂解野生型基因座。细胞必须修复此断裂才能存活。已经整合到基因组中的突变体基因座与切割位点相邻,并且用作用于修复的重组模板。突变然后固定在基因组DNA中,并且持续存在于子细胞中。
机制(2),双交叉环入/环出,然后进行RNA引导的核酸内切酶多肽(例如,Cas9)/sgRNA介导的裂解。在细胞内,对RNA引导的核酸内切酶多肽(例如,Cas9)进行组成型表达。在转化sgRNA/修复片段构建体后,修复片段基因座处存在环入事件(即两个单独的整合事件),由此复制了基因座(即,一个突变体拷贝,一个野生型拷贝)。sgRNA/修复片段构建体环入后,存在由修复片段同源臂介导的环出事件。(理论上,约50%的细胞应环出到基因座的野生型版本,其它50%的细胞应环出到基因座的突变体版本。)并行地,构建体上的一或多个sgRNA被表达、折叠并且与RNA引导的核酸内切酶多肽(例如,Cas9)结合-引发其进行靶识别和切割。此时,“引发的RNA引导的核酸内切酶多肽(例如,Cas9)”识别并且裂解已环出为野生型的细胞,从而将其从种群中清除。含有突变体基因座的细胞不被“引发的RNA引导的核酸内切酶多肽(例如,Cas9)”裂解;突变然后固定在基因组DNA中,并且持续存在于子细胞中。
机制(3),RNA引导的核酸内切酶多肽(例如,Cas9)/sgRNA介导的切割,然后用质粒供体进行双交叉修复。在细胞内,对Cas9进行组成型表达。在转化sgRNA/修复片段构建体后,构建体上的一或多个sgRNA被表达、折叠并且与RNA引导的核酸内切酶多肽(例如,Cas9)结合-引发其进行靶识别和切割。此时,“引发的RNA引导的核酸内切酶多肽(例如,Cas9)”识别并且裂解野生型基因座(即,染色体DNA中的两个双链断裂)。细胞必须修复这些断裂才能存活。sgRNA/修复片段构建体用作重组模板以固定DNA中的断裂(即,两个双交叉修复事件)。细胞执行双交叉事件并且修复断裂。突变固定在基因组DNA中,并且持续存在于子细胞中。
机制(4),RNA引导的核酸内切酶多肽(例如,Cas9)/sgRNA介导的切割,然后用双链线性供体进行双交叉修复:在细胞内,对RNA引导的核酸内切酶多肽(例如,Cas9)与异源重组蛋白(例如,来自λred重组系统的β、gam和exo或来自rac前噬菌体的RecE/RecT)一起进行组成型表达。在转化sgRNA构建体和一或多个线性双链修复片段后,构建体上的一或多个sgRNA被表达、折叠并且与RNA引导的核酸内切酶多肽(例如,Cas9)结合-引发其进行靶识别和切割。此时,“引发的Cas9”识别并且裂解野生型基因座(即,染色体DNA中的两个双链断裂)。细胞必须修复这些断裂才能存活。修复片段由异源重组蛋白加工,并且用作用于染色体修复的模板。突变固定在基因组DNA中,并且持续存在于子细胞中。
机制(5),通过DNA复制引入单链线性供体,然后进行野生型基因座的RNA引导的核酸内切酶多肽(例如,Cas9)/sgRNA介导的裂解。在细胞内,对RNA引导的核酸内切酶多肽(例如,Cas9)与异源重组蛋白(例如,来自λred重组系统的gam或来自rac前噬菌体的RecT)一起进行组成型表达。在转化sgRNA构建体和一或多个线性单链修复片段后,在DNA复制期间,通过冈崎片段扩展将所述一或多个线性单链修复片段掺入到基因组DNA中。一或多个sgRNA被表达、折叠并且与RNA引导的核酸内切酶多肽(例如,Cas9)结合-引发其进行靶识别和切割。此时,“引发的RNA引导的核酸内切酶多肽(例如,Cas9)”识别并且裂解野生型基因座(即,染色体DNA中的两个双链断裂),从而使改变的基因座是完整的。突变固定在基因组DNA中,并且持续存在于子细胞中。
引导RNA
引导RNA可以作为以下提供:对引导RNA进行编码的双链DNA、单链RNA或双链RNA。在一些实施例中,引导RNA在具有另外的序列的质粒中被编码,所述另外的序列例如复制起点、一或多个启动子和/或阳性或阴性选择标志物或其两种、其三种或其全部的组合。在一些实施例中,引导RNA作为具有复制能力的质粒的一部分提供。在一些实施例中,引导RNA作为无复制能力的质粒的一部分提供。可替代地,引导RNA可以作为裸核酸(例如,作为线性或环形片段)、作为与如脂质体或聚合物等药剂复合的核酸提供,或者可以通过病毒(例如,腺病毒、AAV)递送。
在某些实施例中,两个或两个以上编码引导RNA的核酸可操作地连接到差异诱导型启动子,以进行选择性诱导,如进行宿主细胞基因组的连续编辑。差异诱导型引导RNA可以由相同或不同的质粒或核酸片段编码。
DNA修复组分
在某些实施例中,提供了用于利用RNA引导的核酸内切酶、供体多核苷酸和对异源DNA修复途径的组分进行编码的核酸来编辑宿主细胞基因组的方法。在一些情况下,所述方法包含利用RNA引导的核酸内切酶、供体多核苷酸和对异源DNA修复途径的两种或两种以上组分进行编码的两个或两个以上核酸来编辑宿主细胞基因组。在一些情况下,所述方法包含RNA引导的核酸内切酶、供体多核苷酸和对异源DNA修复途径的两种或两种以上组分进行编码的核酸。
在一些情况下,修复途径是RecA/RecBCD修复途径。在一些情况下,修复途径是RecE/RecT修复途径。在一些情况下,修复途径是Redα/Redβ修复途径。在一些情况下,修复途径是λ源性red重组修复途径。在一些情况下,所述方法包含表达RecA和/或RecBCD。在一些情况下,所述方法包含表达RecE和/或RecT。在一些情况下,所述方法包含表达Redα和/或Redβ。在一些情况下,所述方法包含表达λ源性red重组修复途径的β、gam和/或exo组分。对异源DNA修复途径的组分进行编码的核酸可以位于第一、第二或其它质粒上。在一些情况下,一或多个sgRNA在第一质粒上进行编码,并且一或多种异源DNA修复蛋白在第二质粒上进行编码。
表达、纯化和递送
一方面,本公开提供了对CRISPR/RNA引导的核酸内切酶多肽(例如,Cas9)基因编辑复合物进行编码的质粒、载体、构建体和核酸序列。在某些实施例中,本公开提供了用于在同时或顺序表达或不同时或顺序表达RNA引导的核酸内切酶(例如,Cas9)多肽和/或呈递或不呈递供体多核苷酸的情况下瞬时表达引导RNA的质粒。在一些实施例中,本发明的质粒和载体将对引导RNA进行编码,并且还对本公开的RNA引导的核酸内切酶(例如,Cas9)多肽和/或供体多核苷酸进行编码。在其它方面,可以在一或多种不同的质粒中编码工程化复合物的不同组分。
在一些实施例中,本公开的质粒可以跨多种棒状杆菌物种使用。在一些实施例中,本公开的质粒是专门针对谷氨酸棒状杆菌而定制的。在一些实施例中,本公开的质粒是经过密码子优化以通常在棒状杆菌属中和/或具体地在谷氨酸棒状杆菌中和/或其特异性菌株(如谷氨酸棒状杆菌NRRL-B11474)中表达的序列(例如,启动子、引导RNA、RNA引导的核酸内切酶多肽(例如,Cas基因)、复制起点等)或含有所述序列。
在一些实施例中,本公开的质粒和载体在所关注的细胞中选择性地表达。因此,在一些实施例中,本申请设想了异位启动子、发育调节的启动子和/或诱导型启动子的用途。在一些实施例中,本公开提供了终止子序列的用途。
转化
在一些实施例中,本说明书提供了本文所公开的质粒和载体的转化的用途。本领域技术人员将认识到,本说明书的质粒可以通过本说明书的其它部分所描述的任何已知系统转化到细胞中。例如,在一些方面,本说明书提供了通过电穿孔、化学诱导的转化(例如,在二价阳离子如Mg2+存在下的转化)、缀合、粒子轰击、农杆菌属转化、纳米钉转化和病毒转化(例如,噬菌体转化)进行的转化。
在一些实施例中,可以使用包含转化、转染、转导、病毒感染、基因枪或Ti介导的基因转移的多种技术中的任何一种技术将本说明书的载体引入到棒状杆菌属宿主细胞中。具体方法包含磷酸钙转染、DEAE-葡聚糖介导的转染、脂质转染或电穿孔(戴维斯(Davis)等人,1986“分子生物学的基本方法(Basic Methods in Molecular Biology)”;凡·德尔·雷斯特(Van der Rest)等人,应用微生物学与生物技术(Appl Microbiol Biotechnol.)1999年10月;52(4):541-5)。其它转化方法包含例如乙酸锂转化和电穿孔。参见例如吉茨(Gietz)等人,核酸研究27:69-74(1992);伊藤(Ito)等人,细菌学杂志(J.Bacteriol.)153:163-168(1983);以及贝克尔(Becker)和瓜伦特(Guarente),酶学方法(Methods inEnzymology)194:182-187(1991)。在一些实施例中,转化的宿主细胞被称为重组棒状杆菌属宿主菌株。
在一些实施例中,如PCT/US2017/040114,标题为“用于电穿孔的设备和方法(Apparatuses and methods for electroporation)”中所描述的,本说明书提供了使用96孔板机器人平台和液体处理机的细胞高通量转化。
在一些实施例中,需要用于将外源蛋白质(例如,RNA引导的核酸内切酶(例如,Cas9)多肽)引入到细胞中的方法。先前已经描述了用于实现此目的的各种方法,包含直接转染蛋白质/RNA/DNA或DNA转化,然后在细胞内表达RNA和蛋白质(参见例如迪卡洛(Dicarlo),核酸研究41:4336-43(2013);任(Ren)等人,基因195:303-311(1997);林(Lin)等人,Elife 3:e04766(2014))。
在一些实施例中,本说明书提供了用一或多种如上文所描述的选择标志物筛选经过转化的细胞。在一个此类实施例中,将用包括卡那霉素抗性标志物(KanR)的载体转化的细胞平板接种于含有有效量的卡那霉素抗生素的培养基上。推测在卡那霉素包埋的培养基上可见的菌落形成单位已将载体盒掺入其基因组中。可以通过PCR、限制酶分析和/或相关插入位点的测序来确认所期望的序列的插入。
本领域技术人员将容易认识到,用于基因表达的病毒载体或质粒可以用于递送本文所公开的序列和/或复合物。病毒样颗粒(VLP)可以用于包封核酸或核蛋白复合物以进行重组表达,或者可以提供本文所公开的经过纯化的核糖核蛋白复合物,并且通过电穿孔、使一或多个细胞与VLP接触或注射而递送到细胞。
试剂盒
在一些实施例中,本公开提供了试剂盒,所述试剂盒含有以上方法和组合物中所公开的元件中的任何一或多种元件。在一些方面,试剂盒包括CRISPR/RNA引导的核酸内切酶多肽(例如,Cas9)系统和使用所述试剂盒的说明书。在一些方面,CRISPR/RNA引导的核酸内切酶多肽(例如,Cas9)系统包括:包括启动子的质粒,所述启动子可操作地连接到用于表达第一引导RNA的序列;以及第一供体多核苷酸,所述第一供体多核苷酸具有上游同源臂序列和下游同源臂序列,所述上游同源臂序列和所述下游同源臂序列各自与棒状杆菌属靶序列同源,所述第一供体多核苷酸包含由所述上游同源臂序列和所述下游同源臂序列侧接的至少一个突变序列;以及任选地RNA引导的核酸内切酶(例如,Cas9)多肽,所述RNA引导的核酸内切酶多肽还可以直接地整合到宿主棒状杆菌属菌株中。供体多核苷酸和/或RNA引导的核酸内切酶(例如,Cas9)多肽可以在与引导RNA相同或不同的质粒上编码。可替代地,供体多核苷酸可以以线性或环形片段的形式提供。
元件可以单独或组合提供,并且可以提供在任何合适的容器中,如小瓶、瓶子、试管或多孔板(例如,96孔板、384孔板或1536孔板)。在一些方面,所述试剂盒包含采用一或多种语言(例如,一种以上语言)的说明书。
在一些方面,试剂盒包括用于在利用本文所描述的元件(例如,经过纯化的RNA引导的核酸内切酶(例如,Cas9)多肽)中的一或多种元件的方法中使用的一或多种试剂。可以在任何合适的容器中提供试剂。例如,试剂盒可以提供一或多种反应或存储缓冲液。试剂可以以可用于特定测定的形式提供,或以在使用前需要添加一或多种其它组分的形式(例如,以浓缩或冻干形式)提供。缓冲液可以是任何缓冲液,包含但不限于碳酸钠缓冲液、碳酸氢钠缓冲液、硼酸盐缓冲液、Tris缓冲液、MOPS缓冲液、HEPES缓冲液和其组合。在一些方面,缓冲液是碱性的。在一些方面,缓冲液的pH为约7至约10。在一些方面,试剂盒包括一或多种与crRNA序列相对应的寡核苷酸以插入到载体中,从而可操作地连接crRNA序列和调节元件。
现在已经大体上描述了本发明,通过参考以举例方式提供的以下实例将更容易理解本发明,并且除非另有说明,否则这些实例不旨在限制本发明。
本文引用的每个期刊、专利和其它文件或参考文献均通过引用整体并入本文中。
实例
实例1:当Cas9与功能性引导RNA结合表达时,所述Cas9可以在谷氨酸棒状杆菌中 诱导致命的DSB
合成了来自化脓链球菌的具有链霉菌属的密码子偏倚的Cas9基因(科布等人,ACS合成生物学4,723-728(2015)),并且将其与Ptrc启动子连接,并整合到NRRL-B11474谷氨酸棒状杆菌中以表达Cas9。
在Cas9整合到cg0443-cg0444基因座中的菌株中测试了Cas9活性。当修复无效时,由于双链断裂(DSB)具有致死性,因此预计在少数逃逸突变体之外不会形成菌落(图1)。如图1所示,在用作为驱动引导RNA表达的启动子的Pcg2613转化质粒后,证明了所得Cas9 DSB的致死作用,并且因此Cas9在NRRL-B11474谷氨酸棒状杆菌中起作用。图2证明,功能性sgRNA的致死作用可以跨各种所关注的基因座得到概括。
实例2:CRISPR/Cas9基因组编辑-SNP引入
在成功证明Cas9和待使用的引导RNA的功能后,质粒被设计成使用经过验证的引导RNA和在单个质粒上一起编码的对应供体多核苷酸在3个测试基因座处引入SNP。图3的图A中示出了用于引入SNP的构型示意图。靶向的SNP是每个基因座中的改变PAM区的单个突变。PAM区处的靶SNP防止通过CRISPR/Cas9复合物随后切割经过修饰的基因组。将结果与含有Cas9并且仅表达引导RNA的菌株以及不具有整合的Cas9但具有含有用于Cas9整合菌株的相同引导RNA和供体片段的质粒的NRRL-B11474谷氨酸棒状杆菌进行比较。
通过菌落PCR和NGS序列分析测试用引导RNA/供体DNA质粒转化的菌落。图6中描绘了一个NGS覆盖图的实例。选择三个基因座来测试SNP引入(rpsL、cg0167和cg3404)。用含有PAM位点突变的引导RNA/供体DNA质粒转化的菌落的百分比为44%(rpsL)、87.5%(cg0167)和75%(cg3404)(图7)。测试基因座遍及整个基因组,并且代表各种已知和未知功能的基因,这表明这种基因组编辑方法可推广到广泛的基因靶标。
实例3:CRISPR/Cas9基因组编辑-基因缺失
测试从cg3031基因座中缺失702个bp。在图4的图A中提供了在谷氨酸棒状杆菌中敲除cg3031 ORF的策略概述。如上述实例中,Cas9被整合到基因组中;将含有与cg3031 ORF同源的340个bp的左臂和400个bp的右臂的供体多核苷酸和引导RNA盒引入单个质粒上。可通过PCR检测到cg3031的702个bp区的去除,如图13所示。1648个bp的条带指示野生型基因组;而946个bp的条带指示经过修饰的基因组。转化后产生的菌落的分析证明,存在8个菌落中的6个菌落从cg3031基因座缺失702个bp。
实例4:CRISPR/Cas9基因组编辑-小插入
如图5所示,多核苷酸被设计成在三个基因座处插入100个bp。每个插入被设计为缺失20个bp的靶向原型间隔子,并且用100个bp的插入替换。插入被设计成靶向三个基因座(gdhA、cg3031和cg3404)。供体片段的同源臂长度为25个、50个、75个、100个和125个、500个和2000个bp。具有每个供体片段的多核苷酸被转化到具有整合的Cas9的NRRL-B11474谷氨酸棒状杆菌中。利用插入成功地编辑了所有三个基因座(图9)。具有500个bp的同源臂能够在所有三个测试基因座处产生插入,而较低的同源臂示出跨基因座的变异性(图9)。
实例5:CRISPR/Cas9基因组编辑-成功同时在多个基因座处引入多个共同定位的 SNP
如果靶SNP定位于PAM区域之外,或者如果需要多个SNP,则可以将多个共同定位的SNP引入同一供体片段上。为了探索同时引入多个共同定位的SNP,供体片段被设计成在cg0167和cg3404测试基因座处引入两个同时的SNP,并且在rpsL测试基因座处引入三个同时的编辑。靶向cg0167的供体片段由1个扰乱PAM区的SNP和另一个距PAM 10个bp的SNP组成。靶向cg3404的供体片段包含1个扰乱PAM区的SNP和另一个距PAM 70个bp的SNP。rpsL供体片段包含1个扰乱PAM区的SNP,另一个位于原型间隔子的种子区中的SNP(PAM下游10个bp)和另一个距PAM 65个bp的SNP。PAM和种子区处的靶SNP防止通过CRISPR/Cas9复合物进一步切割经过修饰的基因组。来自经过编辑的和未经过编辑的菌落的序列分析的覆盖图在图6中示出,并且证明在rpsL基因座处成功地共同引入了3个SNP。在所有三个基因座处成功引入了多个SNP(图7)。
实例6:CRISPR/Cas9编辑效率根据经过质粒编码的供体多核苷酸中的同源臂的长 度而变化
在具有不同长度同源臂的三个基因座处测试了靶向SNP和插入。供体片段的左右对称同源臂长度为25个、50个、75个、100个和125个bp。在三个测试基因座(cg0167、cg3404和rpsL)处产生靶SNP,并且更长的同源臂导致编辑的菌落百分比更高(图8)。用在1个基因座(rpsL)处的小至25个bp的同源臂证明了SNP编辑。还以三个基因座(cg3031、cg3404和gdhA)的替代性组测试了插入。更长的同源臂导致编辑的菌落的更高百分比(图9)。导致1个基因座(gdhA)处的成功插入的最小同源臂长度为75个bp。
实例7:转化效率取决于复制起点,并且在谷氨酸棒状杆菌的NRRL-B11474菌株中是独特的
将一组五个谷氨酸棒状杆菌复制起点构建到质粒中,并且转化到WT NRRL-B11474谷氨酸棒状杆菌中以测试转化效率(图14)。复制起点pCASE1和pCG1产生大量菌落和可接受的转化效率。起点pBL1、pCC1和pNG2产生很少的菌落并且转化效率可忽略不计。与pBL1、pCC1和pNG2相比,pCASE1和pCG1的转化效率差异是统计上显著的。这些结果与报道的在一些谷氨酸棒状杆菌的菌株中使用后者复制起点的用途形成对比。本文呈现的数据表明,各种复制起点在谷氨酸棒状杆菌的与工业相关的不同菌株中表现出不同的转化效率。对起点pCASE1和pCG1进行了进一步的研究,以研究质粒复制起点对NRRL-B11474中编辑效率的影响。预期对于起点pBL1、pCC1和pNG2的编辑效率可以忽略不计,因为成功的转化子是在此系统中成功进行编辑的前提。
实例8:复制起点影响编辑效率
多核苷酸拷贝数可能影响引导RNA的表达水平和供体片段的递送。为了研究复制起点是否对编辑效率有影响,将两个谷氨酸棒状杆菌复制起点(pCASE1和pCG1)包含在含有对靶基因座具有特异性的引导RNA的多核苷酸以及在SNP的任一侧上含有125个bp的同源性或在插入的任一侧上含有500个bp的同源性的供体片段中。将质粒转化到携带整合的、组成型表达的Cas9基因拷贝的谷氨酸棒状杆菌NRRL-B11474菌株中,并且最多挑选8个菌落用于通过NGS进行筛选。对于每个编辑构建体,对两个生物重复品进行平均。复制起点对编辑效率具有显著影响,其中pCASE1示出了显著高于pCG1的编辑效率(图12)。
实例9:结合PCR供体多核苷酸表达RecET导致成功掺入所期望的编辑
可以用于产生编辑的构型包含在复制质粒上递送引导RNA以及作为PCR产物的供体片段。将这些组分转化到含有辅助质粒的菌株背景中,所述辅助质粒含有可操作地连接到RecET的诱导型启动子(pRecET)(图10)。PCR产物被设计为在cg3404处产生两个SNP。将PCR供体和引导RNA质粒转化为WT、整合的Cas9、含有pRecET的WT以及含有pRecET的整合的Cas9。通过菌落PCR筛选菌落,并且对其进行Sanger测序以确定是否成功产生了SNP或敲除。仅在具有整合的Cas9和pRecET的菌株中成功产生SNP和敲除(图11)。
实例10:使用基于质粒的供体多核苷酸在cg3404和rpsL处进行多重并行SNP编辑
先前的报告表明,并行引入多个CRISPR Cas9介导的编辑是低效的过程。在一个实验中(图15),2个成对的sgRNA和供体片段被包含在单个被转化为携带整合的Cas9基因的菌株的质粒上。在筛选的菌落中,观察到根据实验中的2种编辑构建体之一在rpsL和cg3404处同时进行编辑(如图15中的NGS读段所描绘的)。在另一种构型中,可以将在不同诱导型启动子控制下含有多个sgRNA/供体片段对的单个质粒转化为表达Cas9的菌株。然后可以通过连续诱导每个连续sgRNA的表达来引入每个连续的编辑。在又另一种构型中,可以用含有多个修复片段而不含有对应gRNA的质粒转化亲本菌株。然后,可以用含有一或多个与已经存在的修复片段相对应的gRNA的质粒转化含有修复片段的转化子。
实例11:通过迭代CRISPR编辑堆叠基因组编辑
先前的报道和数据表明,引入多个编辑是低效率的]],并行引入多个CRISPR Cas9介导的编辑是低效率的过程。
一种替代方案是顺序地并入多个编辑。在一个此类构型中,可以将具有单个sgRNA/供体片段对并且含有用于质粒清除的元件的质粒引入到表达Cas9的菌株中。在转化和编辑之后,可以清除质粒,并且可以转化含有不同sgRNA/供体片段对的第二质粒以引入第二编辑。然后,可以对菌落进行测定以验证所有预期编辑的并入。
***
虽然已经参考优选的实施例描述了本公开,但是本领域技术人员应当理解的是,在不背离本公开的范围的情况下,可以作出各种改变并且可以用等同物代替其元件以适应特定情况。因此,所旨在的是本公开不限于作为预期用于执行本公开的最佳模式而公开的特定实施例,而是本公开将包含落入所附权利要求的范围和精神内的所有实施例。
序列表
<110> 齐默根公司(ZYMERGEN INC.)
<120> 在棒状杆菌属中使用CRISPR进行基因组编辑
<130> ZYMR-038/02WO
<150> US 62/701,979
<151> 2018-07-23
<150> US 62/628,166
<151> 2018-02-08
<160> 13
<170> PatentIn版本3.5
<210> 1
<211> 1451
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 1
atctgacttg gttacgatgg actttgaaca cgccgagggt gactaaaccg ctggatttac 60
gcggttttct tctcttcaac ttctttgacg tagcggtgaa ccgtgcccac cgagcaacca 120
atctctgccg cgatagcgcg catggacaga cctttggcgc gcagctcctg gacgcgagca 180
cgcttctcgt tggcacgttt aatgaacact tcacgcggtt cggaagtcca tcgttgagct 240
gttctcaccg acataccggc acgttctgcc agctcgcggg ctgtttttcc gttgcgtgga 300
taacgtgcat aaaccttagc caatgttcct ccaaagagta tgtccagcct cacgacgcac 360
ctcagcgctt cgttgccagc ctttcttccc gcgtgcggat tgcattgcgg tgaatgtggc 420
gtcgtagacg gcggcgccgt ctgtccacat gcgtgacttg gtgatgatcc atttatggat 480
tgacctggca atacagtcaa cttcggccac aggtagtggt tcatcaaaca gctcttggtt 540
aagtgcttgc gcggtggttt ggattgcgcg gcctaggccg tcagcgtctc caaaatgctt 600
tctgacctcc cgatatgccc acgtacgtgc gctttcaaag agtgcgcaat tacgacctag 660
accaactggc gagaaccgcc gcgttttcct ccaggacgca ggcggcataa agccggtttc 720
ttcgagccaa aagcgcagct catcgagcgt atacagctta tcggtgatcc agtgactatc 780
ccatgcagtg tgctcggggt ttttggtgat cagcccggag tatccgctat cgccatcgac 840
agagcgccgt aggccttcgg tgacagccgc ggcataggcc aaaggcttgc gtttggcgta 900
ttcggtgcgg gtaaatggct ccgcgagcgc ccagacagcg tgtgcgtgcc cgtttaaggg 960
gttttcaacc accgcgttag gtctccagtc ctccctgtcc cacaaagagc gcaaaagcgc 1020
gtcctcctgg tcgatgtcaa cgaccaggag gttagagagc gcgtcgggat tggcttcgac 1080
gtagcgctta tccagcgcgt tcttccgtga ggtgcggtaa atgccctcac ggaggtcatc 1140
gcttgccaat ggccacagcg gcagccacag ctgctcaaag cgtccctcag ggcgggtagt 1200
tggtctcatg tagctgactt tctcacacga gcgtgcacgg tcggttttca ttcctcggcg 1260
tgttcataat acgacattta accaagtcag atgtttcccc ggtttccggg ggttcccctg 1320
aagaaccctt ccagtgcgag cgaagcgagc tcctttggcc ggcgcccctc aggtagccct 1380
ctaaggctcc cagggctccg cccctccctg aggttggctc aagcctcctg gtggctccta 1440
cggacgttct a 1451
<210> 2
<211> 1885
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 2
ggaaccgtta tctgcctatg gtgtgagccc ccctagagag cttcaagagc aatcagcccg 60
acctagaaag gaggccaaga gagagacccc tacgggggga accgttttct gcctacgaga 120
tggcacattt actgggaagc tttacggcgt cctcgtggaa gttcaatgcc cgcagactta 180
agtgctctat tcacggtctg acgtgacacg ctaaattcag acatagcttc attgattgtc 240
ggccacgagc cagtctctcc ctcaacagtc ataaaccaac ctgcaatggt caagcgattt 300
cctttagctt tcctagcttg tcgttgactg gacttagcta gtttttctcg ctgtgctcgg 360
gcgtactcac tgtttgggtc tttccagcgt tctgcggcct ttttaccgcc acgtcttccc 420
atagtggcca gagcttttcg ccctcggctg ctctgcgtct ctgtctgacg agcagggacg 480
actggctggc ctttagcgac gtagccgcgc acacgtcgcg ccatcgtctg gcggtcacgc 540
atcggcggca gatcaggctc acggccgtct gctccgaccg cctgagcgac ggtgtaggca 600
cgctcgtagg cgtcgatgat cttggtgtct tttaggcgct caccagccgc ttttaactgg 660
tatcccacag tcaaagcgtg gcgaaaagcc gtctcatcac gggcggcacg ccctggagca 720
gtccagagga cacggacgcc gtcgatcagc tctccagacg cttcagcggc gctcggcagg 780
cttgcttcaa gcgtggcaag tgcttttgct tccgcagtgg cttttcttgc cgcttcgata 840
cgtgcccgtc cgctagaaaa ctcctgctca tagcgttttt taggtttttc tgtgcctgag 900
atcatgcgag caacctccat aagatcagct aggcgatcca cgcgattgtg ctgggcatgc 960
cagcggtacg cggtgggatc gtcggagacg tgcagtggcc accggctcag cctatgtgaa 1020
aaagcctggt cagcgccgaa aacgcgggtc atttcctcgg tcgttgcagc cagcaggcgc 1080
atattcgggc tgctcatgcc tgctgcggca tacaccggat caatgagcca gatgagctgg 1140
catttcccgc tcagtggatt cacgccgatc caagctggcg ctttttccag gcgtgcccag 1200
cgctccaaaa tcgcgtagac ctcggggttt acgtgctcga ttttcccgcc ggcctggtgg 1260
ctcggcacat caatgtccag gacaagcacg gctgcgtgct gcgcgtgcgt cagagcaaca 1320
tactggcacc gggcaagcga ttttgaacca actcggtata acttcggctg tgtttctccc 1380
gtgtccgggt ctttgatcca agcgctggcg aagtcgcggg tcttgctgcc ctggaaattt 1440
tctctgccca ggtgagcgag gaattcgcgg cggtcttcgc tcgtccagcc acgtgatcgc 1500
agcgcgagct cgggatgggt gtcgaacaga tcagcggaaa atttccaggc cggtgtgtca 1560
atgtctcgtg aatccgctag agtcattttt gagcgctttc tcccaggttt ggactggggg 1620
ttagccgacg ccctgtgagt taccgctcac ggggcgttca acatttttca ggtattcgtg 1680
cagcttatcg cttcttgccg cctgtgcgct ttttcgacgc gcgacgctgc tgccgattcg 1740
gtgcaggtgg tggcggcgct gacacgtcct gggcggccac ggccacacga aacgcggcat 1800
ttacgatgtt tgtcatgcct gcgggcaccg cgccacgatc gcggataatt ctcgctgccg 1860
cttccagctc tgtgacgacc atgct 1885
<210> 3
<211> 4107
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 3
atggacaaga agtacagcat cggcctggac atcggcacca acagcgtggg ctgggcggtc 60
atcaccgacg agtacaaggt cccctccaag aagttcaagg tcctgggcaa caccgaccgg 120
cactcgatca agaagaacct gatcggcgcc ctgctcttcg acagcggcga aaccgccgag 180
gcgacccgcc tgaagcggac cgcccgtcgc cgctacaccc ggcgcaagaa ccgcatctgc 240
tacctccagg agatcttctc caacgagatg gccaaggtcg acgactcgtt cttccaccgg 300
ctcgaggaga gcttcctggt ggaggaggac aagaagcacg agcgccaccc gatcttcggc 360
aacatcgtcg acgaggtggc ctaccacgag aagtacccca ccatctacca cctccgcaag 420
aagctggtcg actcgaccga caaggcggac ctgcggctca tctacctggc cctcgcgcac 480
atgatcaagt tccgcggcca cttcctcatc gagggcgacc tgaacccgga caactccgac 540
gtcgacaagc ttttcatcca gctggtgcag acctacaacc agctgttcga ggagaacccc 600
atcaacgcca gcggcgtcga cgccaaggcg atcctctccg cgcgcctgag caagtcccgg 660
cgcctggaga acctcatcgc ccagctgccg ggcgagaaga agaacggcct cttcggcaac 720
ctgatcgcgc tgtcgctcgg cctgaccccc aacttcaaga gcaacttcga cctggccgag 780
gacgcgaagc tccagctgtc caaggacacc tacgacgacg acctggacaa cctgctcgcc 840
cagatcggcg accagtacgc ggacctcttc ctggccgcga agaacctctc ggacgccatc 900
ctgctcagcg acatcctgcg ggtcaacacc gagatcacca aggccccgct gtcggcgagc 960
atgatcaagc ggtacgacga gcaccaccag gacctgaccc tgctcaaggc cctcgtgcgc 1020
cagcagctgc ccgagaagta caaggagatc ttcttcgacc agtccaagaa cggctacgcc 1080
ggctacatcg acggcggcgc gtcgcaggag gagttctaca agttcatcaa gccgatcctg 1140
gagaagatgg acggcaccga ggagctgctc gtcaagctga accgcgagga cctgctccgc 1200
aagcagcgga ccttcgacaa cggctccatc ccgcaccaga tccacctggg cgagctccac 1260
gccatcctcc ggcgccagga ggacttctac cccttcctga aggacaaccg cgagaagatc 1320
gagaagatcc tgaccttccg gatcccgtac tacgtcggcc ccctggcccg cggcaactcc 1380
cggttcgcgt ggatgacccg gaagtcggag gaaaccatca ccccgtggaa cttcgaggag 1440
gtcgtggaca agggcgcctc cgcgcagtcg ttcatcgagc gcatgaccaa cttcgacaag 1500
aacctcccga acgagaaggt cctgcccaag cacagcctgc tctacgagta cttcaccgtg 1560
tacaacgagc tgaccaaggt caagtacgtg accgagggca tgcggaagcc ggccttcctg 1620
tccggcgagc agaagaaggc gatcgtcgac ctgctcttca agaccaaccg caaggtcacc 1680
gtgaagcagc tgaaggagga ctacttcaag aagatcgagt gcttcgactc cgtcgagatc 1740
tcgggcgtgg aggaccgctt caacgcctcc ctgggcacct accacgacct gctcaagatc 1800
atcaaggaca aggacttcct cgacaacgag gagaacgagg acatcctgga ggacatcgtc 1860
ctcaccctga ccctcttcga ggaccgcgag atgatcgagg agcggctcaa gacctacgcc 1920
cacctgttcg acgacaaggt gatgaagcag ctgaagcggc gccggtacac cggctggggc 1980
cgcctctccc ggaagctgat caacggcatc cgggacaagc agagcggcaa gaccatcctg 2040
gacttcctca agtccgacgg cttcgccaac cgcaacttca tgcagctcat ccacgacgac 2100
tcgctgacct tcaaggagga catccagaag gcccaggtgt ccggccaggg cgacagcctc 2160
cacgagcaca tcgccaacct ggcgggctcc ccggcgatca agaagggcat cctccagacc 2220
gtcaaggtcg tggacgagct ggtcaaggtg atgggccgcc acaagcccga gaacatcgtg 2280
atcgagatgg cccgggagaa ccagaccacc cagaagggcc agaagaactc ccgcgagcgg 2340
atgaagcgca tcgaggaggg catcaaggag ctcggctcgc agatcctgaa ggagcacccg 2400
gtcgagaaca cccagctcca gaacgagaag ctgtacctct actacctgca gaacggccgc 2460
gacatgtacg tggaccagga gctcgacatc aaccggctga gcgactacga cgtcgaccac 2520
atcgtgccgc agtccttcct gaaggacgac tcgatcgaca acaaggtcct gacccgctcc 2580
gacaagaacc ggggcaagtc cgacaacgtg ccctcggagg aggtcgtgaa gaagatgaag 2640
aactactggc gccagctgct caacgccaag ctcatcaccc agcgcaagtt cgacaacctg 2700
accaaggccg agcggggcgg cctgtcggag ctcgacaagg cgggcttcat caagcgccag 2760
ctcgtcgaaa cccggcagat caccaagcac gtggcccaga tcctggacag ccggatgaac 2820
accaagtacg acgagaacga caagctgatc cgcgaggtca aggtgatcac cctcaagagc 2880
aagctggtgt ccgacttccg caaggacttc cagttctaca aggtccggga gatcaacaac 2940
taccaccacg cccacgacgc gtacctgaac gccgtcgtgg gcaccgcgct gatcaagaag 3000
tacccgaagc tggagtccga gttcgtctac ggcgactaca aggtctacga cgtgcgcaag 3060
atgatcgcca agtcggagca ggagatcggc aaggccaccg cgaagtactt cttctacagc 3120
aacatcatga acttcttcaa gaccgagatc accctggcca acggcgagat ccgcaagcgg 3180
cccctgatcg aaaccaacgg cgaaaccggc gagatcgtct gggacaaggg ccgcgacttc 3240
gccaccgtcc ggaaggtgct gtccatgccg caggtcaaca tcgtcaagaa aaccgaggtg 3300
cagaccggcg gcttcagcaa ggagtccatc ctccccaagc gcaactcgga caagctgatc 3360
gcccggaaga aggactggga cccgaagaag tacggcggct tcgacagccc caccgtcgcc 3420
tactccgtgc tggtcgtggc gaaggtcgag aagggcaaga gcaagaagct gaagtccgtg 3480
aaggagctgc tcggcatcac catcatggag cgctcctcgt tcgagaagaa cccgatcgac 3540
ttcctggagg ccaagggcta caaggaggtc aagaaggacc tcatcatcaa gctgcccaag 3600
tactcgctgt tcgagctcga gaacggccgc aagcggatgc tcgccagcgc gggcgagctg 3660
cagaagggca acgagctggc cctcccgtcc aagtacgtca acttcctgta cctcgcgtcc 3720
cactacgaga agctgaaggg ctcgcccgag gacaacgagc agaagcagct tttcgtggag 3780
cagcacaagc actacctgga cgagatcatc gagcagatct cggagttcag caagcgggtc 3840
atcctggccg acgcgaacct cgacaaggtg ctgtccgcct acaacaagca ccgcgacaag 3900
ccgatccggg agcaggcgga gaacatcatc cacctgttca ccctcaccaa cctgggcgcc 3960
cccgccgcgt tcaagtactt cgacaccacc atcgaccgca agcggtacac cagcaccaag 4020
gaggtcctcg acgcgaccct gatccaccag tccatcaccg gcctgtacga aacccgcatc 4080
gacctctccc agctcggcgg cgactga 4107
<210> 4
<211> 59
<212> DNA
<213> 未知
<220>
<223> 启动子序列
<400> 4
cgtcaagatc acccaaaact ggtggctgtt ctcttttaag cgggatagca tgggttctt 59
<210> 5
<211> 97
<212> DNA
<213> 未知
<220>
<223> 启动子序列
<400> 5
tgccgtttct cgcgttgtgt gtggtactac gtggggacct aagcgtgtaa gatggaaacg 60
tctgtatcgg ataagtagcg aggagtgttc gttaaaa 97
<210> 6
<211> 92
<212> DNA
<213> 未知
<220>
<223> 启动子序列
<400> 6
taactacatt gagcgaaatg ccaaccacat gtcccatgct tttactaatg tggggtctta 60
gaagaaagcg accaatttaa ggagagttga at 92
<210> 7
<211> 49
<212> DNA
<213> 未知
<220>
<223> 启动子序列
<400> 7
agtgaaccca tacttttata tatgggtatc ggcggtctat gcttgtggg 49
<210> 8
<211> 74
<212> DNA
<213> 未知
<220>
<223> 启动子序列
<400> 8
tccctatcag tgatagagat tgacatccct atcagtgata gagatactga gcacatcagc 60
aggacgcact gacc 74
<210> 9
<211> 80
<212> DNA
<213> 未知
<220>
<223> 启动子序列
<400> 9
tcgtcaagat cacccaaaac tggtggctgt tctcttttaa gcgggatagc atgggttctt 60
atccctatca gtgatagaga 80
<210> 10
<211> 62
<212> DNA
<213> 未知
<220>
<223> 启动子序列
<400> 10
ttgacaatta atcatcggct cgtataatgt gtggaattgt gagcggataa caatttcaca 60
ca 62
<210> 11
<211> 101
<212> DNA
<213> 未知
<220>
<223> 启动子序列
<400> 11
ctcgagggta aatgtgagca ctcacaattc attttgcaaa agttgttgac tttatctaca 60
aggtgtggca taatgtgtgt aattgtgagc ggataacaat t 101
<210> 12
<211> 354
<212> DNA
<213> 未知
<220>
<223> 启动子序列
<400> 12
acttttcata ctcccgccat tcagagaaga aaccaattgt ccatattgca tcagacattg 60
ccgtcactgc gtcttttact ggctcttctc gctaaccaaa ccggtaaccc cgcttattaa 120
aagcattctg taacaaagcg ggaccaaagc catgacaaaa acgcgtaaca aaagtgtcta 180
taatcacggc agaaaagtcc acattgatta tttgcacggc gtcacacttt gctatgccat 240
agcattttta tccataagat tagcggatcc tacctgacgc tttttatcgc aactctctac 300
tgtttctcca tacccgtttt tttgggaatt cgagctctaa ggaggttata aaaa 354
<210> 13
<211> 226
<212> DNA
<213> 未知
<220>
<223> 启动子序列
<400> 13
gagctgttga caattaatca tccggctcgt ataatgtgtg gaattgtgag cggataacaa 60
tttcacacag gaaacagcgc cgctgagaaa aagcgaagcg gcactgctct ttaacaattt 120
atcagacaat ctgtgtgggc actcgaccgg aattatcgat taactttatt attaaaaatt 180
aaagaggtat atattaatgt atcgattaaa taaggaggaa taaacc 226
Claims (81)
1.一种对棒状杆菌属宿主进行基因修饰的方法,所述方法包括:用包括第一启动子的第一质粒转化棒状杆菌物种,所述第一启动子可操作地连接到用于表达第一引导RNA的序列;提供第一供体多核苷酸,所述第一供体多核苷酸具有左同源臂序列和右同源臂序列,所述左同源臂序列和所述右同源臂序列各自与棒状杆菌属靶序列同源,所述第一供体多核苷酸包含由所述左同源臂序列和所述右同源臂序列侧接的至少一个突变序列;以及在所述宿主中结合RNA引导的DNA核酸内切酶多肽表达所述第一引导RNA。
2.一种对棒状杆菌属宿主进行基因修饰的方法,所述方法包括:用包括第一启动子的第一质粒转化棒状杆菌物种,所述第一启动子可操作地连接到用于表达RNA引导的DNA核酸内切酶多肽的序列;提供第一引导RNA;以及在所述宿主中结合第一供体多核苷酸表达所述RNA引导的DNA核酸内切酶多肽,所述第一供体多核苷酸具有左同源臂序列和右同源臂序列,所述左同源臂序列和所述右同源臂序列各自与棒状杆菌属靶序列同源,所述第一供体多核苷酸包含由所述左同源臂序列和所述右同源臂序列侧接的至少一个突变序列。
3.根据权利要求1或权利要求2所述的方法,其中所述RNA引导的DNA核酸内切酶选自由以下组成的群组:Cas9、Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas12h、Cas13a、Cas13b、Cas13c、Cpf1和MAD7或其同源物、直系同源物或旁系同源物。
4.根据权利要求1或权利要求2所述的方法,其中所述RNA引导的DNA核酸内切酶是Cas9。
5.根据权利要求1所述的方法,其中所述第一供体多核苷酸通过基于质粒的呈递提供。
6.根据权利要求2所述的方法,其中所述第一引导RNA通过基于质粒的呈递提供。
7.根据权利要求1或3到6中任一权利要求所述的方法,其中所述RNA引导的DNA核酸内切酶通过基于质粒的呈递提供。
8.根据权利要求1或3到6中任一权利要求所述的方法,其中所述RNA引导的DNA核酸内切酶整合到所述棒状杆菌物种的基因组中。
9.根据权利要求1到8中任一权利要求所述的方法,其中所述棒状杆菌物种是谷氨酸棒状杆菌。
10.根据权利要求9所述的方法,其中所述谷氨酸棒状杆菌是谷氨酸棒状杆菌菌株NRRL-B11474。
11.根据权利要求1到10中任一权利要求所述的方法,其中所述第一质粒包括选自由以下组成的群组的复制起点:pCASE1复制起点(SEQ ID NO:1)和pCG1复制起点(SEQ ID NO:2)。
12.根据权利要求11所述的方法,其中所述第一质粒包括pCASE1复制起点。
13.根据权利要求11所述的方法,其中所述第一质粒包括pCG1复制起点。
14.根据权利要求1到13中任一权利要求所述的方法,其中所述第一供体多核苷酸在所述第一质粒上提供。
15.根据权利要求1到13中任一权利要求所述的方法,其中所述第一供体多核苷酸在第二质粒上提供。
16.根据权利要求1到13中任一权利要求所述的方法,其中所述第一供体多核苷酸以线性片段的形式提供。
17.根据权利要求1到16中任一权利要求所述的方法,其中所述第一质粒进一步对所述第一引导RNA、或可操作地连接到所述第一启动子的一或多个另外的引导RNA或可操作地连接到第二启动子的一或多个另外的引导RNA进行编码。
18.根据权利要求1到17中任一权利要求所述的方法,其中所述第一启动子是组成型的。
19.根据权利要求1到17中任一权利要求所述的方法,其中所述第一启动子是诱导型的。
20.根据权利要求17所述的方法,其中所述第二启动子是组成型的。
21.根据权利要求17所述的方法,其中所述第二启动子是诱导型的。
22.根据权利要求17所述的方法,其中所述第一启动子和所述第二启动子是诱导型的。
23.根据权利要求22所述的方法,其中所述第一启动子和所述第二启动子是差异诱导型的。
24.根据权利要求14或17到23中任一权利要求所述的方法,其中所述第一供体多核苷酸在所述第一质粒上提供,并且所述第一质粒进一步包括一或多个另外的供体多核苷酸,所述一或多个另外的供体多核苷酸具有一或多个左同源臂序列和一或多个右同源臂序列,所述一或多个左同源臂序列和所述一或多个右同源臂序列各自与棒状杆菌属靶序列同源,所述一或多个另外的供体多核苷酸各自包含由所述左同源臂序列和所述右同源臂序列侧接的至少一个突变序列。
25.根据权利要求15或17到23中任一权利要求所述的方法,其中所述第一供体多核苷酸在所述第二质粒上提供,并且其中所述第二质粒进一步包括一或多个另外的供体多核苷酸,所述一或多个另外的供体多核苷酸具有一或多个左同源臂序列和一或多个右同源臂序列,所述一或多个左同源臂序列和所述一或多个右同源臂序列各自与棒状杆菌属靶序列同源,所述一或多个另外的供体多核苷酸各自包含由所述左同源臂序列和所述右同源臂序列侧接的至少一个突变序列。
26.根据权利要求24或25所述的方法,其中所述第一质粒或所述第二质粒对所述RNA引导的DNA核酸内切酶进行编码。
27.根据权利要求1到26中任一权利要求所述的方法,其中所述至少一个突变序列包括选自由以下组成的群组的突变:
a.单核苷酸插入;
b.两个或两个以上核苷酸的插入;
c.对一或多种蛋白质进行编码的核酸序列的插入;
d.单核苷酸缺失;
e.两个或两个以上核苷酸的缺失;
f.一或多个编码序列的缺失;
g.单核甘酸的取代;
h.两个或两个以上核苷酸的取代;
i.两种或两种以上非连续的插入、缺失和/或取代;以及
j.其任何组合。
28.根据权利要求27所述的方法,其中所述至少一个突变序列包括根据a)-j)的多种突变。
29.根据权利要求28所述的方法,其中所述多种突变在相同的供体多核苷酸序列上进行编码。
30.根据权利要求27所述的方法,其中所述至少一个突变序列包括RNA引导的DNA核酸内切酶原型间隔子相邻基序PAM或种子区的突变。
31.根据权利要求1到30中任一权利要求所述的方法,其中所述棒状杆菌属宿主包括连接到组成型或诱导型启动子的序列,其中所述序列对所述RNA引导的DNA核酸内切酶多肽进行编码。
32.根据权利要求1到30中任一权利要求所述的方法,其中所述第一质粒包括可操作地连接到组成型或诱导型启动子的序列,其中所述序列对所述RNA引导的DNA核酸内切酶多肽进行编码。
33.根据权利要求32所述的方法,其中所述RNA引导的DNA核酸内切酶多肽是Cas9核酸内切酶多肽。
34.根据权利要求1到33中任一权利要求所述的方法,其中所述同源臂序列为至少25个碱基对,优选地至少75个碱基对,更优选地至少150个、200个、250个或300个碱基对,仍更优选地至少350个、400个、450个、500个或2,000个碱基对。
35.根据前述权利要求中任一权利要求所述的方法,其中所述第一启动子选自由以下组成的群组:内源启动子、异源启动子、合成启动子、诱导型启动子和组成型启动子。
36.根据权利要求35所述的方法,其中所述第一启动子是Pcg2613。
37.根据权利要求1到36中任一权利要求所述的方法,其中所述第一引导RNA包括CRISPR RNA(crRNA)和反式活化crRNA(tracrRNA)。
38.根据权利要求1到36中任一权利要求所述的方法,其中所述第一引导RNA包括单个gRNA(sgRNA)。
39.根据权利要求1到38中任一权利要求所述的方法,其中所述第一引导RNA包括CRISPR RNA(crRNA)和反式活化RNA(tracrRNA)以及至少20个核苷酸的第一间隔子序列,其中所述第一间隔子序列与所述棒状杆菌属靶序列至少80%、85%、90%、95%或100%互补。
40.根据权利要求1到39中任一权利要求所述的方法,其中所述方法包括顺序地诱导两个或两个以上不同的引导RNA的表达,并且由此引入所述棒状杆菌属宿主的两种或两种以上不同的基因修饰。
41.根据权利要求40所述的方法,其中所述两种或两种以上不同的基因修饰中的至少一种基因修饰包括非连续的插入、缺失和/或取代;或者其中所述两种或两种以上不同的基因修饰中的两种或两种以上基因修饰各自包括非连续的插入、缺失和/或取代。
42.根据权利要求1到39中任一权利要求所述的方法,其中所述方法包括在不同的诱导型启动子的控制下顺序地表达两个或两个以上不同的引导RNA/供体多核苷酸对,并且由此顺序地引入所述棒状杆菌属宿主的两种或两种以上不同的基因修饰,其中通过连续地诱导每个连续的引导RNA/供体多核苷酸对的表达来引入连续的编辑。
43.根据权利要求1到39中任一权利要求所述的方法,其中所述方法包括在所述棒状杆菌属宿主中表达两个或两个以上供体多核苷酸,并且顺序地提供与所述宿主中已经存在的修复片段相对应的一或多个gRNA,由此顺序地引入所述棒状杆菌属宿主的两种或两种以上不同的基因修饰。
44.根据权利要求1到39中任一权利要求所述的方法,其中所述方法包括同时表达两个或两个以上不同的引导RNA,并且由此引入所述棒状杆菌属宿主的两种或两种以上不同的基因修饰。
45.根据权利要求1到44中任一权利要求所述的方法,其中所述第一质粒包括反选择标志物,并且所述方法包括针对所述反选择标志物进行选择,并且由此固化所述第一质粒的所述棒状杆菌属宿主。
46.根据权利要求45所述的方法,其中所述针对所述第一质粒的所述反选择标志物进行选择是在所述宿主中用所述第一引导RNA结合所述RNA引导的DNA核酸内切酶多肽对所述棒状杆菌属宿主进行基因修饰之后以及在所述宿主中用第二引导RNA结合所述RNA引导的DNA核酸内切酶多肽对所述棒状杆菌属宿主进行基因修饰之前执行的。
47.根据权利要求42到46中任一权利要求所述的方法,其中所述两种或两种以上不同的基因修饰中的至少一种基因修饰包括非连续的插入、缺失和/或取代;或者其中所述两种或两种以上不同的基因修饰中的两种或两种以上基因修饰各自包括非连续的插入、缺失和/或取代。
48.根据权利要求1到47中任一权利要求所述的方法,其中所述方法包括在所述宿主中表达来自一或多个异源重组系统的一组蛋白质。
49.根据权利要求1到48中任一权利要求所述的方法,其中所述方法包括表达来自λred重组系统、Rec ET重组系统的一组蛋白质、来自λred重组系统或Rec ET重组系统的蛋白质的任何同源物、直系同源物或旁系同源物或其任何组合。
50.一种棒状杆菌属宿主,其包括:
a.第一质粒,所述第一质粒包括可操作地连接到第一引导RNA的第一启动子;以及
b.第一供体多核苷酸,所述第一供体多核苷酸具有右同源臂序列和左同源臂序列,其中每个同源臂序列与棒状杆菌属基因组中的靶序列同源;
其中所述宿主结合RNA引导的DNA核酸内切酶多肽表达所述第一引导RNA。
51.一种棒状杆菌属宿主,其包括:
a.第一质粒,所述第一质粒包括可操作地连接到用于表达RNA引导的DNA核酸内切酶多肽的序列的第一启动子;以及
b.第一引导RNA;
其中所述宿主在所述宿主中结合第一供体多核苷酸表达所述RNA引导的DNA核酸内切酶多肽,所述第一供体多核苷酸具有左同源臂序列和右同源臂序列,所述左同源臂序列和所述右同源臂序列各自与棒状杆菌属靶序列同源,所述第一供体多核苷酸包含由所述左同源臂序列和所述右同源臂序列侧接的至少一个突变序列。
52.根据权利要求50或权利要求51所述的宿主,其中所述棒状杆菌属宿主是谷氨酸棒状杆菌宿主。
53.根据权利要求52所述的宿主,其中所述谷氨酸棒状杆菌宿主是谷氨酸棒状杆菌菌株NRRL-B11474。
54.根据权利要求50到53中任一权利要求所述的宿主,其中所述RNA引导的DNA核酸内切酶选自由以下组成的群组:Cas9、Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas12h、Cas13a、Cas13b、Cas13c、Cpf1和MAD7或其同源物、直系同源物或旁系同源物。
55.根据权利要求50到53中任一权利要求所述的宿主,其中所述RNA引导的DNA核酸内切酶是Cas9。
56.根据权利要求50、52到55中任一权利要求所述的宿主,其中所述RNA引导的DNA核酸内切酶通过基于质粒的呈递提供。
57.根据权利要求50、52到55中任一权利要求所述的宿主,其中所述RNA引导的DNA核酸内切酶整合到所述棒状杆菌物种的基因组中。
58.根据权利要求50到57中任一权利要求所述的宿主,其中所述第一质粒包括选自由以下组成的群组的复制起点:pCASE1复制起点和pCG1复制起点。
59.根据权利要求58所述的宿主,其中所述第一质粒包括pCASE1复制起点。
60.根据权利要求50到59中任一权利要求所述的宿主,其中所述第一供体多核苷酸在所述第一质粒上提供。
61.根据权利要求50到59中任一权利要求所述的宿主,其中所述第一供体多核苷酸在第二质粒上提供。
62.根据权利要求50到59中任一权利要求所述的宿主,其中所述第一供体多核苷酸以线性核酸片段的形式提供。
63.根据权利要求50到62中任一权利要求所述的宿主,其中所述第一质粒进一步对所述第一引导RNA、或可操作地连接到所述第一启动子的一或多个另外的引导RNA或可操作地连接到一或多个另外的启动子的一或多个另外的引导RNA进行编码。
64.根据权利要求60或63中任一权利要求所述的宿主,其中所述第一供体多核苷酸在所述第一质粒上提供,并且其中所述第一质粒进一步包括一或多个另外的供体多核苷酸。
65.根据权利要求61或63中任一权利要求所述的宿主,其中所述第一供体多核苷酸在第二质粒上提供,并且其中所述第二质粒进一步包括一或多个另外的供体多核苷酸。
66.根据权利要求50到65中任一权利要求所述的宿主,其中所述第一供体多核苷酸包括至少一个突变序列,所述至少一个突变序列包括选自由以下组成的群组的突变:
a)单核苷酸插入;
b)两个或两个以上核苷酸的插入;
c)对一或多种蛋白质进行编码的核酸序列的插入;
d)单核苷酸缺失;
e)两个或两个以上核苷酸的缺失;
f)一或多个编码序列的缺失;
g)单核甘酸的取代;
h)两个或两个以上核苷酸的取代;
i)两种或两种以上非连续的插入、缺失和/或取代;以及
j)其任何组合。
67.根据权利要求66所述的宿主,其中所述宿主包括第二供体多核苷酸,并且其中所述第二供体多核苷酸包括至少一个突变序列,所述至少一个突变序列包括选自由以下组成的群组的突变:
k)单核苷酸插入;
l)两个或两个以上核苷酸的插入;
m)对一或多种蛋白质进行编码的核酸序列的插入;
n)单核苷酸缺失;
o)两个或两个以上核苷酸的缺失;
p)一或多个编码序列的缺失;
q)单核甘酸的取代;
r)两个或两个以上核苷酸的取代;
s)两种或两种以上非连续的插入、缺失和/或取代;以及
t)其任何组合。
68.根据权利要求66或67所述的宿主,其中所述至少一个突变序列包括RNA引导的DNA核酸内切酶原型间隔子相邻基序PAM或种子区的突变。
69.根据权利要求50到68中任一权利要求所述的宿主,其中所述RNA引导的DNA核酸内切酶多肽由可操作地连接到组成型或诱导型启动子的RNA引导的DNA核酸内切酶多肽编码序列表达。
70.根据权利要求50到68中任一权利要求所述的宿主,其中所述第一质粒进一步包括可操作地连接到组成型或诱导型启动子的所述RNA引导的DNA核酸内切酶多肽编码序列。
71.根据权利要求70所述的宿主,其中所述RNA引导的DNA核酸内切酶多肽编码序列包括针对在棒状杆菌物种中的表达而优化的编码序列。
72.根据权利要求50到71中任一权利要求所述的宿主,其中所述右同源臂序列和所述左同源臂序列为至少25个碱基对,优选地至少150个、200个、250个或300个碱基对,更优选地至少350个、400个、450个、500个、550个或600个碱基对。
73.根据权利要求50到72中任一权利要求所述的宿主,其中所述第一启动子选自由以下组成的群组:内源性棒状杆菌属启动子、与所述棒状杆菌属宿主异源的启动子、合成启动子、诱导型启动子和组成型启动子。
74.根据权利要求73所述的宿主,其中所述第一启动子是Pcg2613。
75.根据权利要求50到74中任一权利要求所述的方法,其中所述第一引导RNA包括CRISPR RNA(crRNA)和反式活化crRNA(tracrRNA)。
76.根据权利要求50到74中任一权利要求所述的方法,其中所述第一引导RNA包括单个gRNA(sgRNA)。
77.根据权利要求50到74中任一权利要求所述的宿主,其中所述第一引导RNA包括CRISPR RNA(crRNA)和反式活化RNA(tracrRNA)以及至少20个核苷酸的第一间隔子序列,其中所述第一间隔子序列与所述棒状杆菌属靶序列至少80%、85%、90%、95%或100%互补。
78.根据权利要求50到77中任一权利要求所述的宿主,其中所述宿主包括可操作地连接到至少两个不同的引导RNA序列的至少两个不同的诱导型启动子。
79.根据权利要求50到78中任一权利要求所述的宿主,其中所述第一质粒包括反选择标志物。
80.根据权利要求50到79中任一权利要求所述的宿主,其中所述宿主包括所述宿主中的来自一或多个异源重组系统的一组蛋白质。
81.根据权利要求50到80中任一权利要求所述的方法,其中所述宿主包括来自λred重组系统、Rec ET重组系统的一组蛋白质、来自λred重组系统或Rec ET重组系统的蛋白质的任何同源物、直系同源物或旁系同源物或其任何组合。
Applications Claiming Priority (5)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201862628166P | 2018-02-08 | 2018-02-08 | |
| US62/628,166 | 2018-02-08 | ||
| US201862701979P | 2018-07-23 | 2018-07-23 | |
| US62/701,979 | 2018-07-23 | ||
| PCT/US2019/017276 WO2019157326A1 (en) | 2018-02-08 | 2019-02-08 | Genome editing using crispr in corynebacterium |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN111699254A true CN111699254A (zh) | 2020-09-22 |
Family
ID=65494671
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201980012131.2A Pending CN111699254A (zh) | 2018-02-08 | 2019-02-08 | 使用crispr在棒状杆菌属中进行基因组编辑 |
Country Status (7)
| Country | Link |
|---|---|
| US (2) | US20200362346A1 (zh) |
| EP (1) | EP3749764A1 (zh) |
| JP (1) | JP2021512617A (zh) |
| KR (1) | KR20200119239A (zh) |
| CN (1) | CN111699254A (zh) |
| CA (1) | CA3087715A1 (zh) |
| WO (1) | WO2019157326A1 (zh) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN114480467A (zh) * | 2022-02-24 | 2022-05-13 | 江南大学 | 一种在棒状杆菌中辅助sacB基因编辑系统的CRISPR-cpf1筛选工具 |
| CN117264990A (zh) * | 2023-11-20 | 2023-12-22 | 中国农业科学院北京畜牧兽医研究所 | 一种时序性调控RecET和Cas12a表达的谷氨酸棒杆菌基因编辑质粒及编辑方法 |
Families Citing this family (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP7386082B2 (ja) | 2017-02-28 | 2023-11-24 | ブイオーアール バイオファーマ インコーポレーテッド | 系統特異的タンパク質の阻害のための組成物および方法 |
| MX2021002415A (es) | 2018-08-28 | 2021-09-21 | Vor Biopharma Inc | Celulas madre hematopoyeticas modificadas geneticamente y usos de las mismas. |
| BR112021007229A2 (pt) | 2018-10-16 | 2021-08-10 | Blueallele, Llc | métodos para inserção dirigida de dna em genes |
| CA3136114A1 (en) * | 2019-04-05 | 2020-10-08 | Danisco Us Inc. | Methods for integrating a donor dna sequence into the genome of bacillus using linear recombinant dna constructs and compositions thereof |
| CA3159682A1 (en) * | 2019-11-07 | 2021-05-14 | Qingdao Kingagroot Chemical Compound Co., Ltd. | Method for generating new mutations in organisms, and application thereof |
| EP4065701A4 (en) * | 2019-11-27 | 2023-11-29 | Danmarks Tekniske Universitet | CONSTRUCTS, COMPOSITIONS AND METHODS THEREOF WITH IMPROVED GENOMEDITING EFFICIENCY AND SPECIFICITY |
| EP4381062A1 (en) * | 2021-08-02 | 2024-06-12 | Vor Biopharma Inc. | Compositions and methods for gene modification |
| KR102767511B1 (ko) * | 2024-05-29 | 2025-02-17 | 충북대학교 산학협력단 | CRISPR/Cas 시스템을 이용한 유산균 및 그람양성균 유전자 재조합 방법 |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN106701810A (zh) * | 2016-12-12 | 2017-05-24 | 江南大学 | 一种谷氨酸棒状杆菌的基因编辑系统及其应用 |
Family Cites Families (18)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| SI3401400T1 (sl) | 2012-05-25 | 2019-10-30 | Univ California | Postopki in sestavki za RNA usmerjeno modifikacijo tarčne DNA in za RNA usmerjeno modulacijo prepisovanja |
| US20140310830A1 (en) | 2012-12-12 | 2014-10-16 | Feng Zhang | CRISPR-Cas Nickase Systems, Methods And Compositions For Sequence Manipulation in Eukaryotes |
| CN113355357B (zh) | 2012-12-12 | 2024-12-03 | 布罗德研究所有限公司 | 对用于序列操纵的改进的系统、方法和酶组合物进行的工程化和优化 |
| ES2536353T3 (es) | 2012-12-12 | 2015-05-22 | The Broad Institute, Inc. | Ingeniería de sistemas, métodos y composiciones de guía optimizadas para manipulación de secuencias |
| US8697359B1 (en) | 2012-12-12 | 2014-04-15 | The Broad Institute, Inc. | CRISPR-Cas systems and methods for altering expression of gene products |
| EP2931898B1 (en) | 2012-12-12 | 2016-03-09 | The Broad Institute, Inc. | Engineering and optimization of systems, methods and compositions for sequence manipulation with functional domains |
| CN105658796B (zh) | 2012-12-12 | 2021-10-26 | 布罗德研究所有限公司 | 用于序列操纵的crispr-cas组分系统、方法以及组合物 |
| RU2764637C2 (ru) | 2013-07-09 | 2022-01-19 | Президент Энд Фэллоуз Оф Харвард Коллидж | Мультиплексная геномная инженерия, направляемая рнк |
| US9840699B2 (en) | 2013-12-12 | 2017-12-12 | President And Fellows Of Harvard College | Methods for nucleic acid editing |
| EP3294880A4 (en) | 2015-05-15 | 2018-12-26 | Dharmacon, Inc. | Synthetic single guide rna for cas9-mediated gene editing |
| CN107709562A (zh) | 2015-05-15 | 2018-02-16 | 先锋国际良种公司 | 指导rna/cas内切核酸酶系统 |
| WO2017015101A1 (en) | 2015-07-17 | 2017-01-26 | University Of Washington | Methods for maximizing the efficiency of targeted gene correction |
| KR102699944B1 (ko) | 2015-08-25 | 2024-09-13 | 듀크 유니버시티 | Rna-가이드된 엔도뉴클레아제를 이용하는 게놈 조작에서 특이성을 개선하는 조성물 및 방법 |
| KR102668608B1 (ko) | 2015-08-28 | 2024-05-24 | 더 제너럴 하스피탈 코포레이션 | 조작된 crispr-cas9 뉴클레아제 |
| DK4144844T3 (da) | 2015-10-12 | 2025-11-24 | Dupont Us Holding Llc | Beskyttede dna-templates til genmodificering og øget homolog rekombination i celler og fremgangsmåder til anvendelse deraf |
| ES2735773T3 (es) | 2015-12-04 | 2019-12-20 | Caribou Biosciences Inc | Acidos nucleicos manipulados dirigidos a ácidos nucleicos |
| ES2847252T3 (es) | 2016-02-22 | 2021-08-02 | Caribou Biosciences Inc | Procedimientos de modulación de resultados de reparación de ADN |
| EP3426778A1 (en) | 2016-03-11 | 2019-01-16 | Pioneer Hi-Bred International, Inc. | Novel cas9 systems and methods of use |
-
2019
- 2019-02-08 WO PCT/US2019/017276 patent/WO2019157326A1/en not_active Ceased
- 2019-02-08 EP EP19706232.6A patent/EP3749764A1/en not_active Withdrawn
- 2019-02-08 JP JP2020542549A patent/JP2021512617A/ja active Pending
- 2019-02-08 CN CN201980012131.2A patent/CN111699254A/zh active Pending
- 2019-02-08 KR KR1020207021542A patent/KR20200119239A/ko not_active Withdrawn
- 2019-02-08 CA CA3087715A patent/CA3087715A1/en active Pending
-
2020
- 2020-07-30 US US16/943,761 patent/US20200362346A1/en not_active Abandoned
-
2022
- 2022-08-03 US US17/817,223 patent/US20230074594A1/en not_active Abandoned
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN106701810A (zh) * | 2016-12-12 | 2017-05-24 | 江南大学 | 一种谷氨酸棒状杆菌的基因编辑系统及其应用 |
Non-Patent Citations (4)
| Title |
|---|
| FENG PENG等: "Efcient gene editing in Corynebacterium glutamicum using the CRISPR/Cas9 system" * |
| JAE SUNG CHO等: "CRISPR/Cas9-coupled recombineering for metabolic engineering of Corynebacterium glutamicum" * |
| JIAO LIU等: "Development of a CRISPR/Cas9 genome editing toolbox for Corynebacterium glutamicum" * |
| YU JIANG等: "CRISPR-Cpf1 assisted genome editing of Corynebacterium glutamicum" * |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN114480467A (zh) * | 2022-02-24 | 2022-05-13 | 江南大学 | 一种在棒状杆菌中辅助sacB基因编辑系统的CRISPR-cpf1筛选工具 |
| CN114480467B (zh) * | 2022-02-24 | 2023-08-25 | 江南大学 | 一种在棒状杆菌中辅助sacB基因编辑系统的CRISPR-cpf1筛选工具 |
| CN117264990A (zh) * | 2023-11-20 | 2023-12-22 | 中国农业科学院北京畜牧兽医研究所 | 一种时序性调控RecET和Cas12a表达的谷氨酸棒杆菌基因编辑质粒及编辑方法 |
| CN117264990B (zh) * | 2023-11-20 | 2024-02-06 | 中国农业科学院北京畜牧兽医研究所 | 一种时序性调控RecET和Cas12a表达的谷氨酸棒杆菌基因编辑质粒及编辑方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| EP3749764A1 (en) | 2020-12-16 |
| US20230074594A1 (en) | 2023-03-09 |
| KR20200119239A (ko) | 2020-10-19 |
| CA3087715A1 (en) | 2019-08-15 |
| US20200362346A1 (en) | 2020-11-19 |
| JP2021512617A (ja) | 2021-05-20 |
| WO2019157326A1 (en) | 2019-08-15 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US20230074594A1 (en) | Genome editing using crispr in corynebacterium | |
| US20230272394A1 (en) | RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX | |
| US12123014B2 (en) | Class II, type V CRISPR systems | |
| JP6737974B1 (ja) | ヌクレアーゼ媒介dnaアセンブリ | |
| US11098305B2 (en) | Modular universal plasmid design strategy for the assembly and editing of multiple DNA constructs for multiple hosts | |
| CN102124112B (zh) | 基于同源重组dna的克隆方法及组合物 | |
| JPH11507236A (ja) | 操作された組換え部位を使用する組換えクローニング | |
| US20230340481A1 (en) | Systems and methods for transposing cargo nucleotide sequences | |
| AU2022284808A1 (en) | Class ii, type v crispr systems | |
| US20240301374A1 (en) | Systems and methods for transposing cargo nucleotide sequences | |
| HK40037626A (zh) | 使用crispr在棒状杆菌属中进行基因组编辑 | |
| US20250059568A1 (en) | Class ii, type v crispr systems | |
| JP2025508794A (ja) | 融合タンパク質 | |
| CN116615547A (zh) | 用于对货物核苷酸序列转座的系统和方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40037626 Country of ref document: HK |
|
| WD01 | Invention patent application deemed withdrawn after publication | ||
| WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200922 |