[go: up one dir, main page]

CN119137265A - 经由天冬酰胺生物合成途径的代谢选择 - Google Patents

经由天冬酰胺生物合成途径的代谢选择 Download PDF

Info

Publication number
CN119137265A
CN119137265A CN202380038098.7A CN202380038098A CN119137265A CN 119137265 A CN119137265 A CN 119137265A CN 202380038098 A CN202380038098 A CN 202380038098A CN 119137265 A CN119137265 A CN 119137265A
Authority
CN
China
Prior art keywords
cell line
asns
mammalian cell
cells
endogenous
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202380038098.7A
Other languages
English (en)
Inventor
J·拉维勒特
M·奥托
D·拉扎夫斯基
J·A·古斯汀
T·博格舒尔特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sigma Aldrich Co LLC
Original Assignee
Sigma Aldrich Co LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sigma Aldrich Co LLC filed Critical Sigma Aldrich Co LLC
Publication of CN119137265A publication Critical patent/CN119137265A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y603/00Ligases forming carbon-nitrogen bonds (6.3)
    • C12Y603/01Acid-ammonia (or amine)ligases (amide synthases)(6.3.1)
    • C12Y603/01002Glutamate-ammonia ligase (6.3.1.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y603/00Ligases forming carbon-nitrogen bonds (6.3)
    • C12Y603/05Carbon-nitrogen ligases with glutamine as amido-N-donor (6.3.5)
    • C12Y603/05004Asparagine synthase (glutamine-hydrolyzing) (6.3.5.4)

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本公开提供了一种分离的哺乳动物细胞,其包含降低或消除的天冬酰胺合成酶(ASNS)表达。还提供了制备此类细胞的方法和使用此类细胞生产重组蛋白的方法。

Description

经由天冬酰胺生物合成途径的代谢选择
技术领域
本公开涉及用于生物制品生产系统的哺乳动物细胞系,其中哺乳动物细胞系被工程改造为具有减少或消除的天冬酰胺生物合成途径的组分的表达,以建立天冬酰胺营养缺陷细胞系。
背景技术
用于生物制造的高产量克隆细胞系的开发通常利用一种或多种众所周知的选择方法,比如谷氨酰胺合成酶(GS用于谷氨酰胺选择)、二氢叶酸受体(DHFR用于次黄嘌呤和胸苷选择)、抗生素选择(嘌呤霉素、潮霉素、杀稻瘟菌素等)或P5C合成酶(P5CS-脯氨酸选择)。GS系统已成为行业的标准,但需要允许多种选择方法的细胞系,以便可将多于一个载体引入细胞系以促进生产分子,比如双特异性抗体、多特异性抗体以及其他多链酶/蛋白或需要效应蛋白用于表达的蛋白/酶的分子。
发明内容
本公开的各个方面中提供了用于生物生产系统的哺乳动物细胞系,其中哺乳动物细胞系被工程改造为具有减少或消除的内源天冬酰胺合成酶(ASNS)基因表达。在缺乏内源表达的功能性ASNS蛋白的情况下,细胞需要外源的氨基酸天冬酰胺。可以使用靶向内切核酸酶介导的基因组修饰,例如CRISPR核糖核蛋白(RNP)复合物或锌指核酸酶,来灭活染色体ASNS序列。本公开的其他方面提供了哺乳动物细胞系,其中哺乳动物细胞系被工程改造为具有减少或消除的内源ASNS基因表达,以及减少或消除的内源谷氨酰胺合成酶(GS)基因表达。
本公开的另一个方面包括用于选择具有表达的生物治疗蛋白的增强的生产力的细胞系的过程。在本公开的其他方面提供了一种生物生产系统,用于更方便地通过利用多种选择系统表达双特异性抗体或需要效应蛋白表达的生物治疗蛋白。这些过程包括在任何哺乳动物细胞系中表达至少一种重组蛋白。
本公开的其他方面和迭代在下文更详细地描述。
附图说明
图1显示了天冬酰胺合成酶在天冬酰胺生物合成的最后一步中的作用。
图2展示了GS-/-CHO细胞中ASNS的cDNA序列,包括优选的ZFN结合位点(下划线)。
图3显示了表明CHO GS-/-细胞系基因组中ASNS基因存在两个拷贝的数据。
图4显示了靶向图2中鉴定的结合位点的ZFN的切割活性。
图5显示了ZFN切割导致的ASNS编码序列的改变。
图6显示了用于基于谷氨酰胺和/或天冬酰胺的选择系统的载体。
图7展示了ASNS基因的内源表达控制序列(启动子),包括在转基因载体中使用的序列(下划线)。
图8显示了ASNS敲除克隆的有效天冬酰胺选择。
图9显示了由基于天冬酰胺的选择系统驱动的有效IgG表达。
图10展示了分别使用GS、ASNS或双GS+ASNS选择的表达GFP、RFP或GFP+RFP的池的生长和存活数据。
图11显示了利用GS和ASNS都被敲除的CHO细胞以及含有GS编码序列、ASNS编码序列或GS和ASNS编码序列两者的质粒的有效选择。
图12展示了分别使用GS、ASNS或双GS+ASNS选择的表达GFP、RFP或GFP+RFP的池的荧光表达数据。
图13展示了分别使用GS、ASNS或双GS+ASNS选择的表达IgG重链和IgG轻链的池的IgG表达数据。
具体实施方式
本公开提供了哺乳动物细胞系,其被工程改造为具有减少或消除的内源ASNS基因表达。进一步提供了哺乳动物细胞系,其被工程改造为减少或消除的内源GS基因表达和减少或消除的内源ASNS基因表达。提供了生产所述工程改造细胞系的方法,以及选择和使用所述工程改造细胞系生产重组蛋白的方法。
(I)工程改造的细胞系
本公开的一个方面包括哺乳动物细胞系,其被工程改造为具有减少或消除的内源ASNS基因表达。备选地,哺乳动物细胞系被工程改造为具有减少或消除的内源ASNS基因和内源GS基因表达。
对本文公开的具有减少或消除的ASNS表达或减少的ASNS和GS表达的细胞系进行基因工程改造,以修饰编码ASNS或GS蛋白的染色体序列。可以使用在下面第(III)节中详细描述的靶向内切核酸酶介导的基因组编辑技术来修饰染色体序列。例如,染色体序列可以修饰为包含至少一个核苷酸的缺失、至少一个核苷酸的插入、至少一个核苷酸的替换或其组合,使得阅读框移码而不产生蛋白产物(即染色体序列被灭活)。灭活编码ASNS或GS的染色体序列的一个等位基因导致蛋白表达减少(即敲低)。灭活编码ASNS或GS的染色体序列的两个等位基因导致不表达蛋白(即敲除)。
在一些实施方案中,ASNS表达水平可以降低至少约5%,至少约10%,至少约20%,至少约30%,至少约40%,至少约50%,至少约60%,至少约70%,至少约80%,至少约90%,至少约95%,至少约99%或多于约99%。在其他实施方案中,ASNS表达水平可以降低到使用本领域标准技术(例如Western免疫印迹分析、ELISA酶分析、SDS聚丙烯酰胺凝胶电泳等)无法检测到的水平。
通常,在补充有天冬酰胺和/或外源ASNS编码序列时,本文公开的工程改造细胞系的细胞活力、活细胞密度、滴度、生长速率、增殖反应、细胞形态、凋亡和自噬水平和/或一般细胞健康状况与其非工程改造的亲本细胞相似。
(a)细胞类型
本文公开的工程改造细胞系是哺乳动物细胞系。在一些实施方案中,工程改造细胞系可以衍生自人类细胞系。适合的人类细胞系的非限制性实例包括人类胚胎肾细胞(HEK293、HEK293T);人类结缔组织细胞(HT-1080);人类宫颈癌细胞(HELA);人类胚胎视网膜细胞(PER.C6);人类肾细胞(HKB-11);人类肝细胞(Huh-7);人类肺细胞(W138);人类肝细胞(Hep G2);人类U2-OS骨肉瘤细胞,人类A549肺细胞,人类A-431表皮细胞,CACO-2人类结肠腺癌细胞,人类多能干细胞,Jurkat人类T淋巴细胞,或人类K562骨髓细胞。在其他实施方案中,工程改造细胞系可以衍生自非人类细胞系。适合的细胞系还包括中国仓鼠卵巢(CHO)细胞;仓鼠肾(BHK)细胞;小鼠骨髓瘤NS0细胞;小鼠骨髓瘤Sp2/0细胞;小鼠乳腺腺癌C127细胞;小鼠胚胎成纤维细胞3T3细胞(NIH3T3);小鼠B淋巴瘤A20细胞;小鼠黑色素瘤B16细胞;小鼠成肌细胞C2C12细胞;小鼠胚胎间充质C3H-10T1/2细胞;小鼠癌CT26细胞,小鼠前列腺DuCuP细胞;小鼠乳腺EMT6细胞;小鼠肝细胞瘤Hepa1c1c7细胞;小鼠骨髓瘤J5582细胞;小鼠上皮MTD-1A细胞;小鼠心肌MyEnd细胞;小鼠肾Renca细胞;小鼠胰腺RIN-5F细胞;小鼠黑色素瘤X64细胞;小鼠淋巴瘤YAC-1细胞;大鼠胶质瘤9L细胞;大鼠B淋巴瘤RBL细胞;大鼠神经母细胞瘤B35细胞;大鼠肝细胞瘤细胞(HTC);布法罗大鼠肝BRL 3A细胞;犬肾细胞(MDCK);犬乳腺(CMT)细胞;大鼠骨肉瘤D17细胞;大鼠单核细胞/巨噬细胞DH82细胞;猴肾SV-40转化的成纤维细胞(COS7)细胞;猴肾CVI-76细胞;或非洲绿猴肾(VERO,VERO-76)细胞。可以在美国典型培养物保藏中心目录(ATCC,Manassas,VA)中找到哺乳动物细胞系的广泛列表。在一些实施方案中,本文公开的细胞系不是小鼠细胞系。在某些实施方案中,工程改造细胞系是CHO细胞系。适合的CHO细胞系包括但不限于CHO-K1、CHO-K1SV、CHO GS-/-、CHO S、DG44、DuxB11及其衍生物。
在各种实施方案中,亲本细胞系可以缺乏谷氨酰胺合成酶(GS)、二氢叶酸还原酶(DHFR)、次黄嘌呤-鸟嘌呤磷酸核糖基转移酶(HPRT)或其组合。例如,可以灭活编码GS、DHFR和/或HPRT的染色体序列。在特定实施方案中,所有编码GS、DHFR和/或HPRT的染色体序列在亲本细胞系中都被灭活。
(b)任选的编码重组蛋白的核酸
在一些实施方案中,本文公开的工程改造细胞系可以进一步包含至少一个编码重组蛋白的核酸。通常情况下,重组蛋白是异源的,意味着蛋白对细胞而言不是天然的。重组蛋白不受限制地可以是治疗蛋白,选自抗体、抗体片段、单克隆抗体、人源化抗体、人源化单克隆抗体、嵌合抗体、IgG分子、IgG重链、IgG轻链、IgA分子、IgD分子、IgE分子、IgM分子、疫苗、生长因子、细胞因子、干扰素、白细胞介素、激素、凝血(clotting)(或凝结(coagulation))因子、血液成分、酶、治疗蛋白、营养蛋白、上述任何一种的功能片段或功能变体或者包含上述蛋白和/或其功能片段或变体的融合蛋白。在特定实施方案中,重组蛋白是双特异性抗体或多特异性抗体,或者需要效应蛋白用于表达的蛋白。
在一些实施方案中,编码重组蛋白的核酸可以与编码天冬酰胺合成酶(ASNS)、次黄嘌呤-鸟嘌呤磷酸核糖基转移酶(HPRT)、二氢叶酸还原酶(DHFR)和/或谷氨酰胺合成酶(GS)的序列相连,使得ASNS、HPRT、DHFR和/或GS可以用作可选择标记。编码重组蛋白的核酸也可以与编码至少一个抗生素抗性基因的序列和/或编码标记蛋白比如荧光蛋白的序列相连。在一些实施方案中,编码重组蛋白的核酸可以是表达构建体的一部分。表达构建体或载体可以包含另外的表达控制序列(例如增强子序列、Kozak序列、聚腺苷酸化序列、转录终止序列等)、选择标记序列、复制起点等。其他信息可以在“Current Protocols in MolecularBiology”Ausubel等人,John Wiley&Sons,New York,2003或“Molecular Cloning:ALaboratory Manual”
Sambrook&Russell,Cold Spring Harbor Press,Cold Spring Harbor,NY,第3版,2001中找到。
在一些实施方案中,编码重组蛋白的核酸可以位于染色体外。也就是说,编码重组蛋白的核酸可以从质粒、黏粒、人工染色体、小染色体或另一个染色体外构建体中瞬时表达。在其他实施方案中,编码重组蛋白的核酸可以在染色体上整合到细胞的基因组内。整合可以是随机的或靶向的。因此,重组蛋白可以稳定表达。在这种实施方案的一些迭代中,编码重组蛋白的核酸序列可以与适当的异源表达控制序列(即,启动子)可操作地连接。在其他迭代中,编码重组蛋白的核酸序列可以置于内源表达控制序列的控制之下。可以使用同源重组、靶向内切核酸酶介导的基因组编辑、病毒载体、转座子、重组酶介导的盒式交换系统、质粒和其他众所周知的手段将编码重组蛋白的核酸序列整合到细胞系的基因组内。其他指南可见于Ausubel等人2003,同上和Sambrook&Russell,2001,同上。
(II)试剂盒
本公开的另一个方面提供了用于生产重组蛋白的试剂盒,其中试剂盒包括上述第(I)节中详细描述的任何工程改造细胞系。试剂盒还可以包括细胞生长培养基、转染试剂、质粒载体、选择培养基、重组蛋白纯化手段、缓冲液等。本文提供的试剂盒通常包括生长细胞系和使用它们来生产重组蛋白的说明。试剂盒中包含的说明可以固定在包装材料上,也可以作为包装插入物而包括。虽然说明通常是书面或印刷材料,但不限于此。本公开考虑任何能够存储此类说明并向终端用户传达它们的介质。此类介质包括但不限于电子存储介质(例如磁盘、磁带、盒式磁带、芯片)、光学介质(例如CD ROM)等。如上文所述,术语“说明”可以包括提供说明的互联网站点的地址。
(III)制备工程改造细胞系的方法
本公开的还另一个方面提供了制备或工程改造上述第(I)节中描述的具有减少或消除的ASNS和/或GS表达的细胞系的方法。可以使用各种技术敲低或敲除编码ASNS和/或GS的染色体序列。通常情况下,工程改造细胞系是使用靶向内切核酸酶介导的基因组修饰过程制备的。本领域技术人员理解,所述工程改造细胞系也可以使用位点特异性重组系统、随机诱变或本领域已知的其他方法制备。
通常,工程改造细胞系通过以下方法制备,包括将至少一个靶向内切核酸酶或编码所述靶向内切核酸酶的核酸引入目的亲本细胞系,其中靶向内切核酸酶靶向编码ASNS和/或GS的染色体序列。靶向内切核酸酶识别并结合特定的染色体序列并引入双链断裂。在一些实施方案中,双链断裂通过非同源末端连接(NHEJ)修复过程修复。由于NHEJ容易出错,可能会发生至少一个核苷酸的缺失、插入和/或替换,从而破坏染色体序列的阅读框,使得不产生蛋白产物或经由破坏(例如蛋白的酶活性位点的破坏)产生非功能性蛋白。在其他实施方案中,靶向内切核酸酶也可以用来经由同源重组反应改变染色体序列,通过共引入与靶向染色体序列的一部分具有实质序列同一性的多核苷酸。在此类情况下,由靶向内切核酸酶引入的双链断裂通过同源定向修复过程修复,使得染色体序列以导致染色体序列变化或改变(例如通过外源序列的整合)的方式与多核苷酸交换。
(a)靶向内切核酸酶
可以使用多种靶向内切核酸酶来修饰编码ASNS和/或GS的染色体序列。靶向内切核酸酶可以是天然存在的蛋白或工程改造蛋白。合适的靶向内切核酸酶包括但不限于锌指核酸酶(ZFN)、CRISPR核酸酶、转录激活因子样效应物(TALE)核酸酶(TALEN)、大范围核酸酶、嵌合核酸酶、位点特异性内切核酸酶和人工靶向DNA双链断裂诱导剂。
(i)锌指核酸酶
在特定实施方案中,靶向内切核酸酶可以是一对锌指核酸酶(ZFN)。ZFN结合到特定的靶向序列并向靶向切割位点内引入双链断裂。通常,ZFN包含DNA结合结构域(即锌指)和切割结构域(即核酸酶),下面分别描述。
DNA结合结构域。DNA结合结构域或锌指可以被工程改造以识别和结合任何选择的核酸序列。参见例如,Beerli等人(2002)Nat.Biotechnol.20:135-141;Pabo等人(2001)Ann.Rev.Biochem.70:313-340;Isalan等人(2001)Nat.Biotechnol.19:656-660;Segal等人(2001)Curr.Opin.Biotechnol.12:632-637;Choo等人(2000)Curr.Opin.Struct.Biol.10:411-416;Zhang等人(2000)J.Biol.Chem.
275(43):33850-33860;Doyon等人(2008)Nat.Biotechnol.26:702-708;以及Santiago等人(2008)Proc.Natl.Acad.Sci.USA 105:5809-5814。与天然存在的锌指蛋白相比,工程改造的锌指结合结构域可能具有新的结合特异性。工程改造方法包括但不限于合理设计和各种类型的选择。合理设计包括,例如,使用包含双联体、三联体和/或四联体核苷酸序列和单独的锌指氨基酸序列的数据库,在这些数据库中,每个双联体、三联体或四联体核苷酸序列与一个或多个结合特定的三联体或四联体核苷酸序列的锌指的氨基酸序列相关联。参见,例如,美国专利号6,453,242和6,534,261,其公开的全部内容通过引用并入本文。例如,美国专利6,453,242中描述的算法可以用来设计靶向预选序列的锌指结合结构域。也可以使用替代方法,比如使用非简并识别码表的合理设计来设计锌指结合结构域以靶向特定序列(Sera等人(2002)Biochemistry 41:7074-7081)。可公开获得的用于鉴定DNA序列中的潜在靶位点以及设计锌指结合结构域的基于网络的工具是本领域已知的。例如,可以在zincfingertools.org找到用于鉴定DNA序列中潜在靶位点的工具。可以在
zifit.partners.org/ZiFiT找到用于设计锌指结合结构域的工具。(还参见Mandell等人(2006)Nuc.Acid Res.34:W516-W523;Sander等人(2007)Nuc.Acid Res.35:W599-W605)。
可以设计锌指结合结构域以识别和结合长度在约3个核苷酸至约21个核苷酸范围内的DNA序列。在一个实施方案中,锌指结合结构域可以设计为识别和结合长度在约9个至约18个核苷酸范围内的DNA序列。通常,本文使用的锌指核酸酶中的锌指结合结构域包括至少三个锌指识别结构域或锌指,其中每个锌指结合3个核苷酸。在一个实施方案中,锌指结合结构域包括四个锌指识别结构域。在另一个实施方案中,锌指结合结构域包括五个锌指识别结构域。在仍然另一个实施方案中,锌指结合结构域包括六个锌指识别结构域。可以设计锌指结合结构域以结合任何适当的靶DNA序列。参见例如,美国专利号6,607,882、6,534,261和6,453,242,其全部内容通过引用并入本文。
选择锌指识别结构域的示例方法包括噬菌体展示和双杂交系统,这些在美国专利号5,789,538;5,925,523;6,007,988;6,013,453;6,410,248;6,140,466;6,200,759;和6,242,568;以及WO 98/37186;WO 98/53057;WO 00/27878;WO 01/88197和GB 2,338,237中描述,其中每个的全部内容均通过引用并入本文。此外,已经描述了锌指结合结构域的结合特异性增强(例如在WO
02/077227中描述,其全部内容通过引用并入本文)。
锌指结合结构域和设计和构建融合蛋白(和编码它们的多核苷酸)的方法为本领域技术人员已知的,并在例如美国专利号7,888,121中详细描述,所述专利的全部内容通过引用并入本文。锌指识别结构域和/或多指锌指蛋白可以使用合适的接头序列连接在一起,包括例如长度为五个或更多氨基酸的接头序列。关于长度为六个或更多氨基酸的接头序列的非限制性实例参见美国专利号6,479,626;6,903,185;和7,153,949,其全部内容通过引用并入本文。本文描述的锌指结合结构域可能包括在蛋白的单独的锌指之间的适合的接头序列的组合。
切割结构域。锌指核酸酶还包括切割结构域。锌指核酸酶的切割结构域部分可以从任何内切核酸酶或外切核酸酶中获得。切割结构域可衍生自其的内切核酸酶的非限制性实例包括但不限于限制性内切核酸酶和归巢内切核酸酶。参见例如New England BiolabsCatalog或Belfort等人(1997)Nucleic Acids Res.25:3379-3388。已知切割DNA的另外的酶(例如S1核酸酶;绿豆核酸酶;胰脏DNA酶I;微球菌核酸酶;酵母HO核酸酶)。还参见Linn等人(编辑),Nucleases,Cold Spring Harbor Laboratory Press,1993。一种或多种这些酶(或其功能片段)可用作切割结构域的来源。
如上所述,切割结构域也可以衍生自酶或其部分,该酶或其部分需要二聚体化得到切割活性。可能需要两个锌指核酸酶进行切割,因为每个核酸酶包括活性酶二聚体的一个单体。备选地,一个锌指核酸酶可以包括两个单体以创建活性酶二聚体。如本文所用,“活性酶二聚体”是能够切割核酸分子的酶二聚体。两个切割单体可以衍生自相同的内切核酸酶(或其功能片段),或者每个单体可以衍生自不同的内切核酸酶(或其功能片段)。
当使用两个切割单体形成活性酶二聚体时,两个锌指的识别位点优选这样布置,使得两个锌指与它们分别的识别位点的结合使切割单体以允许切割单体来形成活性酶二聚体(例如通过二聚化)的空间取向彼此定位。因此,识别位点的近端可以由约5至约18个核苷酸分隔开。例如,近端可以由大约5、6、7、8、9、10、11、12、13、14、15、16、17或18个核苷酸分隔开。然而,将理解,任何整数个核苷酸或核苷酸对可以位于两个识别位点之间(例如约2至约50个核苷酸对或更多)。锌指核酸酶的识别位点的近端,例如本文详细描述的那些,可以由6个核苷酸分隔开。通常,切割位点位于识别位点之间。
限制性核酸内切酶(限制性酶)存在于许多物种中,并且能够(在识别位点处)与DNA序列特异性结合,并在结合位点处或附近切割DNA。某些限制性内切酶(例如IIS型)在远离识别位点的位点切割DNA,并且具有可分离的结合和切割结构域。例如,IIS型酶FokI催化DNA的双链切割,在一条链上在距其识别位点9个核苷酸处而在另一条链上在距其识别位点13个核苷酸出。参见例如,美国专利号5,356,802;5,436,150和5,487,994;以及Li等人(1992)Proc.Natl.Acad.Sci.USA 89:4275-4279;Li等人(1993)Proc.Natl.Acad.Sci.USA90:2764-2768;Kim等人(1994a)Proc.Natl.Acad.Sci.USA
91:883-887;Kim等人(1994b)J.Biol.Chem.269:31978-31982。因此,锌指核酸酶可以包括至少一种IIS型限制酶的切割结构域和一个或多个锌指结合结构域,其可能是工程改造的或非工程改造的。示例的IIS型限制酶例如在国际公布WO 07/014,275中公开,其公开的全部内容通过引用并入本文。另外的限制酶也含有可分离的结合和切割结构域,并且本公开也考虑这些。参见例如Roberts等人(2003)Nucleic Acids Res.31:418-420。
一种示例性IIS型限制酶是FokI,其切割结构域可与结合结构域分离。这种特定的酶作为二聚体具有活性(Bitinaite等人(1998)Proc.Natl.Acad.Sci.USA 95:10,570-10,575)。因此,出于本公开的目的,用于锌指核酸酶的FokI酶的部分被认为是切割单体。因此,对于使用FokI切割结构域的靶向双链切割,可用各自包含FokI切割单体的两个锌指核酸酶重构活性酶二聚体。备选地,也可以使用含有锌指结合结构域和两个FokI切割单体的单个多肽分子。
在某些实施方案中,切割结构域包含使同源二聚化最小化或防止同源二聚化的一种或多种工程改造切割单体。作为非限制性实例,FokI的446、447、479、483、484、486、487、490、491、496、498、499、500、531、534、537和538位的氨基酸残基都是影响FokI切割半结构域二聚化的靶标。形成专性异二聚体的FokI的示例性工程改造切割单体包括这样的一对,其中第一切割单体包括FokI的氨基酸残基位置490和538处的突变,而第二切割单体包括氨基酸残基位置486和499处的突变。
因此,在工程改造切割单体的一个实施方案中,氨基酸位置490处的突变用Lys(K)替换Glu(E);氨基酸残基538处的突变用Lys(K)替代Iso(I);氨基酸残基486处的突变用Glu(E)替换Gln(Q);而位置499处的突变用Lys(K)替换Iso(I)。具体地,工程改造切割单体可以这样制备:通过使一个切割单体中的490位从E突变到K和538位从I突变到K以产生指定为“E490K:I538K”的工程改造切割单体,以及通过使另一个切割单体的486位从Q突变到E和499位从I突变到K以产生指定为“Q486E:I499K”的工程改造切割单体。上述工程改造切割单体是专性异二聚体突变体,其中异常切割被最小化或消除。工程改造切割单体可以使用合适的方法制备,例如通过野生型切割单体(FokI)的定点诱变,如美国专利号7,888,121中所述,其全部内容并入本文。
另外的结构域。在一些实施方案中,锌指核酸酶进一步包括至少一个核定位信号(NLS)。NLS是促进将锌指核酸酶蛋白靶向到细胞核内的氨基酸序列,以在染色体中的靶序列处引入双链断裂。核定位信号为本领域已知的(参见例如,Lange等人,J.Biol.Chem.,2007,282:5101-5105)。核定位信号的非限制性实例包括PKKKRKV(SEQ ID NO:1)、PKKKRRV(SEQ ID NO:2)、KRPAATKKAGQAKKKK(SEQ ID NO:3)、YGRKKRRQRRR(SEQ ID NO:4)、RKKRRQRRR(SEQ ID NO:5)、PAAKRVKLD(SEQ ID NO:6)、RQRRNELKRSP(SEQ ID NO:7)、VSRKRPRP(SEQ ID NO:8)、PPKKARED(SEQ ID NO:9)、PQPKKKPL(SEQ ID NO:10)、SALIKKKKKMAP(SEQ ID NO:11)、PKQKKRK(SEQ ID NO:12)、RKLKKKIKKL(SEQ ID NO:13)、REKKKFLKRR(SEQ ID NO:14)、KRKGDEVDGVDEVAKKKSKK(SEQ ID NO:15)、RKCLQAGMNLEARKTKK(SEQ ID NO:16)、NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(SEQ ID NO:17)和
RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(SEQ ID NO:18)。NLS可以位于锌指核酸酶的N端、C端或内部位置。
在另外的实施方案中,锌指核酸酶还可以包括至少一个细胞穿透结构域。适合的细胞穿透结构域的实例包括但不限于
GRKKRRQRRRPPQPKKKRKV(SEQ ID NO:19)、PLSSIFSRIGDPPKKKRKV(SEQ ID NO:20)、GALFLGWLGAAGSTMGAPKKKRKV(SEQ ID NO:21)、GALFLGFLGAAGSTMGAWSQPKKKRKV(SEQ ID NO:22)、KETWWETWWTEWSQPKKKRKV(SEQ ID NO:23)、YARAAARQARA(SEQ ID NO:24)、THRLPRRRRRR(SEQ ID NO:25)、GGRRARRRRRR(SEQ ID NO:26)、RRQRRTSKLMKR(SEQ ID NO:27)、GWTLNSAGYLLGKINLKALAALAKKIL(SEQ ID NO:28)、KALAWEAKLAKALAKALAKHLAKALAKALKCEA(SEQ ID NO:29)和RQIKIWFQNRRMKWKK(SEQ ID NO:30)。细胞穿透结构域可以位于锌指核酸酶的N端、C端或内部位置。
在仍然其他实施方案中,锌指核酸酶可以进一步包括至少一个标记结构域。标记结构域的非限制性实例包括荧光蛋白、纯化标签和表位标签。在一个实施方案中,标记结构域可以是荧光蛋白。适合的荧光蛋白的非限制性实例包括绿色荧光蛋白(例如GFP、GFP-2、tagGFP、turboGFP、EGFP、Emerald、Azami Green、Monomeric Azami Green、CopGFP、AceGFP、ZsGreen1)、黄色荧光蛋白(例如YFP、EYFP、Citrine、Venus、YPet、PhiYFP、ZsYellow1)、蓝色荧光蛋白(例如EBFP、EBFP2、Azurite、mKalama1、GFPuv、Sapphire、T-sapphire)、青色荧光蛋白(例如ECFP、Cerulean、CyPet、AmCyan1、Midoriishi-Cyan)、红色荧光蛋白(mKate、mKate2、mPlum、DsRed单体、mCherry、mRFP1、DsRed-Express、DsRed2、DsRed-Monomer、HcRed-Tandem、HcRed1、AsRed2、eqFP611、mRasberry、mStrawberry、Jred)和橙色荧光蛋白(mOrange、mKO、Kusabira-Orange、单体Kusabira-Orange、mTangerine、tdTomato)或任何其他适合的荧光蛋白。在另一个实施方案中,标记结构域可以是纯化标签和/或表位标签。适合的标签包括但不限于聚(His)标签、FLAG(或DDK)标签、Halo标签、AcV5标签、AU1标签、AU5标签、生物素羧基载体蛋白(BCCP)、钙调蛋白结合蛋白(CBP)、几丁质结合结构域(CBD)、E标签、E2标签、ECS标签、eXact标签、Glu-Glu标签、谷胱甘肽-S-转移酶(GST)、HA标签、HSV标签、KT3标签、麦芽糖结合蛋白(MBP)、MAP标签、Myc标签、NE标签、NusA标签、PDZ标签、S标签、S1标签、SBP标签、Softag 1标签、Softag 3标签、Spot标签、Strep标签、SUMO标签、T7标签、串联亲和纯化(TAP)标签、硫氧还蛋白(TRX)、V5标签、VSV-G标签和Xa标签。标记结构域可以位于锌指核酸酶的N端、C端或内部位置。
至少一个核定位信号、至少一个细胞穿透结构域和/或至少一个标记结构域可以经由一个或多个化学键(例如共价键)直接连接到锌指核酸酶。备选地,至少一个核定位信号、至少一个细胞穿透结构域和/或至少一个标记结构域可以经由一个或多个接头间接连接到锌指核酸酶。适合的接头包括氨基酸、肽、核苷酸、核酸、有机接头分子(例如马来酰亚胺衍生物、N-乙氧基苄基咪唑、二苯基-3,4′,5-三羧酸、对氨基苄氧基羧基等),二硫化物接头和聚合物接头(例如PEG)。接头可以包括一个或多个间隔基团,包括但不限于亚烷基、亚烯基、亚炔基、烷基、烯基、炔基、烷氧基、芳基、杂芳基、芳烷基、芳烯基和芳炔基等。接头可以是中性的,或者带有正电或负电。此外,接头可以是可切割的,使得连接接头与另一个化学基团的接头的共价键可以在某些条件下断裂或切割,所述条件包括pH、温度、盐浓度、光、催化剂或酶。在一些实施方案中,接头可以是肽接头。肽接头可以是柔性氨基酸接头或刚性氨基酸接头。另外的适合的接头的实例在本领域是众所周知的,并且设计接头的程序在本领域是容易的(Crasto等人,Protein Eng.,2000,13(5):309-312)。
(ii)CRISPR核糖核蛋白(RNP)
在其他实施方案中,靶向内切核酸酶可以是成簇规律间隔短回文重复序列(CRISPR)核酸酶。CRISPR核酸酶是衍生自细菌或古细菌CRISPR/CRISPR相关(Cas)系统的RNA向导核酸酶。CRISPR RNP系统包括CRISPR核酸酶和向导RNA。
核酸酶。CRISPR核酸酶可以衍生自I型(即IA、IB、IC、ID、IE或IF)、II型(即IIA、IIB或IIC)、III型(即IIIA或IIIB)、V型或VI型CRISPR系统,这些系统存在于各种细菌和古细菌中。例如,CRISPR核酸酶可以来自链球菌属物种(Streptococcus sp.)(例如化脓性链球菌(S.pyogenes)、嗜热链球菌(S.thermophilus)、巴氏链球菌(S.pasteurianus))、弯曲杆菌属物种(Campylobacter sp.)(例如空肠弯曲杆菌(Campylobacter jejuni))、弗朗西斯菌属物种(Francisella sp.)(例如新凶手弗朗西斯菌(Francisella novicida))、无核绿菌属物种(Acaryochloris sp.)、醋盐杆菌属物种(Acetohalobium sp.)、氨基酸球菌属物种(Acidaminococcus sp.)、酸硫杆菌属物种(Acidithiobacillus sp.)、脂环酸芽孢杆菌属物种(Alicyclobacillus sp.)、异着色菌属物种(Allochromatium sp.)、产氨菌属物种(Ammonifex sp.)、鱼腥藻属物种(Anabaena sp.)、节旋藻属物种(Arthrospira sp.)、芽孢杆菌属物种(Bacillus sp.)、伯克霍尔德氏菌属物种(Burkholderiales sp.)、热解纤维素菌属物种(Caldicelulosiruptor sp.)、Candidatus物种、梭菌属物种(Clostridium sp.)、鳄球藻属物种(Crocosphaera sp.)、蓝杆藻属物种(Cyanothece sp.)、微小杆菌属物种(Exiguobacterium sp.)、芬戈尔德菌属物种(Finegoldia sp.)、纤线杆菌属物种(Ktedonobacter sp.)、毛螺菌属物种(Lachnospiraceae sp.)、乳杆菌属物种(Lactobacillus sp.)、鞘丝藻属物种(Lyngbya sp.)、海杆菌属物种(Marinobacter sp.)、甲烷盐菌属物种(Methanohalobium sp.)、微颤菌属物种(Microscilla sp.)、微鞘藻属物种(Microcoleus sp.)、微囊藻属物种(Microcystis sp.)、盐碱厌氧菌属物种(Natranaerobius sp.)、奈瑟菌属物种(Neisseria sp.)、亚硝化球菌属物种(Nitrosococcus sp.)、拟诺卡菌属物种(Nocardiopsis sp.)、节球藻属物种(Nodulariasp.)、念珠藻属物种(Nostoc sp.)、颤藻属物种(Oscillatoria sp.)、极单胞菌属物种(Polaromonas sp.)、厌氧肠状菌属物种(Pelotomaculum sp.)、假交替单胞菌属物种(Pseudoalteromonas sp.)、石袍菌属物种(Petrotoga sp.)、普雷沃氏菌属物种(Prevotella sp.)、葡萄球菌属物种(Staphylococcus sp.)、链霉菌属物种(Streptomycessp.)、链孢囊菌属物种(Streptosporangium sp.)、聚球蓝细菌属物种(Synechococcussp.)、栖热腔菌属物种(Thermosipho sp.)或疣微菌门物种(Verrucomicrobia sp.)。在其他实施方案中,CRISPR核酸酶可以衍生自古细菌CRISPR系统、CRISPR/CasX系统或CRISPR/CasY系统(Burstein等人,Nature,2017,542(7640):237-241)。
在一些实施方案中,CRISPR核酸酶可以衍生自II型CRISPR核酸酶。例如,II型CRISPR核酸酶可以是Cas9蛋白。适合的Cas9核酸酶包括化脓性链球菌Cas9(SpCas9)、新凶手弗朗西斯菌Cas9(FnCas9)、金黄色葡萄球菌(Staphylococcus aureus)Cas9(SaCas9)、嗜热链球菌Cas9(StCas9)、巴氏链球菌Cas9(SpaCas9)、空肠弯曲杆菌Cas9(CjCas9)、脑膜炎奈瑟菌(Neisseria meningitis)Cas9(NmCas9)或灰色奈瑟菌(Neisseria cinerea)Cas9(NcCas9)。在其他实施方案中,CRISPR核酸酶可以衍生自V型CRISPR核酸酶,比如Cpf1核酸酶。合适的Cpf1核酸酶包括新凶手弗朗西斯菌Cpf1(FnCpf1)、氨基酸球菌属物种Cpf1(AsCpf1)或毛螺菌科细菌ND2006 Cpf1
(LbCpf1)。在还另一个实施方案中,CRISPR核酸酶可以衍生自VI型CRISPR核酸酶,例如瓦氏纤毛菌(Leptotrichia wadei)Cas13a(LwaCas13a)或沙氏纤毛菌(Leptotrichiashahii)Cas13a(LshCas13a)。
CRISPR核酸酶可以是野生型CRISPR核酸酶、经修饰的CRISPR核酸酶或者野生型或经修饰的CRISPR核酸酶的片段。CRISPR核酸酶可以被修饰以增加核酸结合亲和力和/或特异性、改变酶活性和/或改变蛋白的其他特性。例如,CRISPR核酸酶的核酸酶(即DNA酶、RNA酶)结构域可以被修饰、删除或灭活。CRISPR核酸酶可以被截断以去除对核酸酶功能非必需的结构域。
CRISPR核酸酶包括两个核酸酶结构域。例如,Cas9核酸酶包括一个HNH结构域,它切割向导RNA互补链,和一个RuvC结构域,它切割非互补链;Cpf1核酸酶包括一个RuvC结构域和一个NUC结构域;而Cas13a核酸酶包括两个HNEPN结构域。当两个核酸酶结构域都为功能性时,CRISPR核酸酶引入双链断裂。两个核酸酶结构域均可以通过一个或多个突变和/或缺失而失活,从而建立在双链序列的一个链中引入单链断裂的变体。例如,Cas9核酸酶的RuvC结构域中的一个或多个突变(例如D10A、D8A、E762A和/或D986A)导致对向导RNA互补链产生切口的HNH切口酶;而Cas9核酸酶的HNH结构域中的一个或多个突变(例如H840A、H559A、N854A、N856A和/或N863A)会导致对向导RNA非互补链产生切口的RuvC切口酶。类似的突变可以将Cpf1和Cas13a核酸酶转变为切口酶。可以组合使用两个靶向于染色体序列相对的链的CRISPR切口酶(经由一对相为补充的向导RNA),以建立染色体序列中的双链断裂。双CRISPR切口酶RNP可以提高靶特异性并减少脱靶效应。
另外的结构域。CRISPR核酸酶可以进一步包括至少一个核定位信号(NLS)。NLS是促进将锌指核酸酶蛋白靶向到细胞核内以在染色体中的靶序列引入双链断裂的氨基酸序列。核定位信号为本领域已知的(参见例如,Lange等人,J.Biol.Chem.,2007,282:5101-5105)。核定位信号的非限制性实例包括PKKKRKV(SEQ ID NO:1)、PKKKRRV(SEQ ID NO:2)、KRPAATKKAGQAKKKK(SEQ ID NO:3)、YGRKKRRQRRR(SEQ ID NO:4)、RKKRRQRRR(SEQ ID NO:5)、PAAKRVKLD(SEQ ID NO:6)、RQRRNELKRSP(SEQ ID
NO:7)、VSRKRPRP(SEQ ID NO:8)、PPKKARED(SEQ ID NO:9)、PQPKKKPL(SEQ ID NO:10)、SALIKKKKKMAP(SEQ ID NO:11)、PKQKKRK(SEQ ID NO:12)、RKLKKKIKKL(SEQ ID NO:13)、REKKKFLKRR(SEQ ID NO:14)、KRKGDEVDGVDEVAKKKSKK(SEQ ID NO:15)、RKCLQAGMNLEARKTKK(SEQ ID NO:16)、NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(SEQ IDNO:17)和
RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(SEQ ID NO:18)。NLS可以位于CRISPR核酸酶的N端、C端或内部位置。
在另外的实施方案中,CRISPR核酸酶还可以包括至少一个细胞穿透结构域。适合的细胞穿透结构域的实例包括但不限于
GRKKRRQRRRPPQPKKKRKV(SEQ ID NO:19)、PLSSIFSRIGDPPKKKRKV(SEQ ID NO:20)、GALFLGWLGAAGSTMGAPKKKRKV(SEQ ID NO:21)、GALFLGFLGAAGSTMGAWSQPKKKRKV(SEQ ID NO:22)、KETWWETWWTEWSQPKKKRKV(SEQ ID NO:23)、YARAAARQARA(SEQ ID NO:24)、THRLPRRRRRR(SEQ ID NO:25)、GGRRARRRRRR(SEQ ID NO:26)、RRQRRTSKLMKR(SEQ ID NO:27)、GWTLNSAGYLLGKINLKALAALAKKIL(SEQ ID NO:28)、KALAWEAKLAKALAKALAKHLAKALAKALKCEA(SEQ ID NO:29)和RQIKIWFQNRRMKWKK(SEQ ID NO:30)。细胞穿透结构域可以位于CRISPR蛋白的N端、C端或内部位置。
在仍然其他实施方案中,CRISPR核酸酶可以进一步包括至少一个标记结构域。标记结构域的非限制性实例包括荧光蛋白、纯化标签和表位标签。在一个实施方案中,标记结构域可以是荧光蛋白。适合的荧光蛋白的非限制性实例包括绿色荧光蛋白(例如GFP、GFP-2、tagGFP、turboGFP、EGFP、Emerald、Azami Green、Monomeric Azami Green、CopGFP、AceGFP、ZsGreen1)、黄色荧光蛋白(例如YFP、EYFP、Citrine、Venus、YPet、PhiYFP、ZsYellow1)、蓝色荧光蛋白(例如EBFP、EBFP2、Azurite、mKalama1、GFPuv、Sapphire、T-sapphire)、青色荧光蛋白(例如ECFP、Cerulean、CyPet、AmCyan1、Midoriishi-Cyan)、红色荧光蛋白(mKate、mKate2、mPlum、DsRed单体、mCherry、mRFP1、DsRed-Express、DsRed2、DsRed-Monomer、HcRed-Tandem、HcRed1、AsRed2、eqFP611、mRasberry、mStrawberry、Jred)和橙色荧光蛋白(mOrange、mKO、Kusabira-Orange、单体Kusabira-Orange、mTangerine、tdTomato)或任何其他适合的荧光蛋白。在另一个实施方案中,标记结构域可以是纯化标签和/或表位标签。适合的标签包括但不限于聚(His)标签、FLAG(或DDK)标签、Halo标签、AcV5标签、AU1标签、AU5标签、生物素羧基载体蛋白(BCCP)、钙调蛋白结合蛋白(CBP)、几丁质结合结构域(CBD)、E标签、E2标签、ECS标签、eXact标签、Glu-Glu标签、谷胱甘肽-S-转移酶(GST)、HA标签、HSV标签、KT3标签、麦芽糖结合蛋白(MBP)、MAP标签、Myc标签、NE标签、NusA标签、PDZ标签、S标签、S1标签、SBP标签、Softag 1标签、Softag 3标签、Spot标签、Strep标签、SUMO标签、T7标签、串联亲和纯化(TAP)标签、硫氧还蛋白(TRX)、V5标签、VSV-G标签和Xa标签。标记结构域可以位于CRISPR核酸酶的N端、C端或内部位置。
至少一个核定位信号、至少一个细胞穿透结构域和/或至少一个标记结构域可以经由一个或多个化学键(例如共价键)直接连接到CRISPR核酸酶。备选地,至少一个核定位信号、至少一个细胞穿透结构域和/或至少一个标记结构域可以经由一个或多个接头间接连接到CRISPR核酸酶。适合的接头包括氨基酸、肽、核苷酸、核酸、有机接头分子(例如马来酰亚胺衍生物、N-乙氧基苄基咪唑、二苯基-3,4′,5-三羧酸、对氨基苄氧基羧基等),二硫化物接头和聚合物接头(例如PEG)。接头可以包括一个或多个间隔基团,包括但不限于亚烷基、亚烯基、亚炔基、烷基、烯基、炔基、烷氧基、芳基、杂芳基、芳烷基、芳烯基和芳炔基等。接头可以是中性的,或者带有正电或负电。此外,接头可以是可切割的,使得连接接头与另一个化学基团的接头的共价键可以在某些条件下断裂或切割,所述条件包括pH、温度、盐浓度、光、催化剂或酶。在一些实施方案中,接头可以是肽接头。肽接头可以是柔性氨基酸接头或刚性氨基酸接头。另外的适合的接头的实例在本领域是众所周知的,并且设计接头的程序在本领域是容易的
向导RNA。CRISPR核酸酶由向导RNA引导至其靶位点。向导RNA与靶位点杂交,并与CRISPR核酸酶相互作用以将CRISPR核酸酶定向至染色体序列中的靶位点。靶位点除了被前间隔相邻基序(protospacer adjacent motif,PAM)限制边界外,没有序列限制。来自不同细菌物种的CRISPR蛋白识别不同的PAM序列。例如,PAM序列包括5'-NGG(SpCas9、FnCas9)、5'-NGRRT(SaCas9)、5'-NNAGAAW(StCas9)、5'-NNNNGATT(NmCas9)、5'-NNNNRYAC(CjCas9)和5'-TTTV(Cpf1),其中N定义为任何核苷酸,R定义为G或A,W定义为A或T,Y定义为C或T,而V定义为A、C或G。Cas9 PAM位于靶位点的3'端,而cpf1 PAM位于靶位点的5'端。
向导RNA包括三个区域:与靶位点的序列互补的在5'端的第一区域,形成茎环结构的第二内部区域,以及基本上保持单链的第三3'区域。每个向导RNA的第一区域是不同的,使得每个向导RNA引导CRISPR核酸酶至特定的靶位点。每个向导RNA的第二和第三区域(也被称为支架区域)在所有向导RNA中可以是相同的。
向导RNA的第一区域与靶位点的序列(即,前间隔序列)互补,使得向导RNA的第一区域可以与靶位点的序列进行碱基配对。向导RNA的第一区域(即,crRNA)与靶位点序列之间的互补性可以为至少80%,至少85%,至少90%,至少95%或更多。通常情况下,向导RNA的第一区域序列与靶位点序列之间没有错配(即,互补性是完全的)。在各种实施方案中,向导RNA的第一区域可以包含约10个核苷酸到多于约25个核苷酸。例如,向导RNA的第一区域与染色体序列中靶位点的碱基配对区域可以长度为约10、11、12、13、14、15、16、17、18、19、20、22、23、24、25或多于25个核苷酸。在示例性实施方案中,向导RNA的第一区域长度约为19、20或21个核苷酸。
向导RNA还包括形成二级结构的第二区域。在一些实施方案中,二级结构包括一个茎(或发夹)和一个环。环和茎的长度可以变化。例如,环的长度可以在约3个核苷酸至约10个核苷酸范围内,而茎的长度可以在约6个至约20个碱基对范围内。茎可以包括一个或多个1至约10个核苷酸的突起。因此,第二区域的总长度可以在约16个核苷酸至约60个核苷酸范围内。在一个示例性实施方案中,环为约4个核苷酸长,而茎包括约12个碱基对。
向导RNA还包括在3'端的第三区域,该区域基本上保持单链。因此,第三区域与目的细胞中任何染色体序列没有互补性,也与向导RNA的其余部分没有互补性。第三区域的长度可以变化。通常情况下,第三区域的长度多于约4个核苷酸。例如,第三区域的长度可以在约5个核苷酸至约60个核苷酸长范围内。
向导RNA的第二和第三区域(或支架)的合并长度可以在约30个核苷酸至约120个核苷酸长范围内。在一个方面,向导RNA的第二和第三区域的合并长度在约70个核苷酸至约100个核苷酸长范围内。
在一些实施方案中,向导RNA包括一个分子,其包括所有三个区域。在其他实施方案中,向导RNA可以包括两个分开的分子。第一个RNA分子可以包括向导RNA的第一(5')区域和向导RNA的第二区域“茎”的一半。第二个RNA分子可以包括向导RNA的第二区域“茎”的另一半和向导RNA的第三区域。因此,这种实施方案中,第一和第二RNA分子各自包含彼此互补的核苷酸序列。例如,在一个实施方案中,第一和第二RNA分子各自包含彼此碱基配对以形成功能性向导RNA的(约6至约20个核苷酸的)序列。
(iii)其他靶向内切核酸酶
在进一步的实施方案中,靶向内切核酸酶可以是大范围核酸酶。大范围核酸酶是特征为长识别序列的内切脱氧核糖核酸酶,即识别序列通常在约12个碱基对至约40个碱基对范围内。作为该要求的结果,识别序列通常在任何给定基因组中仅出现一次。在大范围核酸酶中,名为LAGLIDADG的归巢内切核酸酶家族已成为研究基因组和基因组工程的有价值的工具(参见例如,Arnould等人,2011,Protein Eng Des Sel,24(1-2):27-31)。其他适合的大范围核酸酶包括I-CreI和I-Dmol。大范围核酸酶可以通过使用本领域技术人员众所周知的技术修饰其识别序列来靶向特定的染色体序列。
在另外的实施方案中,靶向内切核酸酶可以是转录激活因子样效应物(TALE)核酸酶。TALE是来自植物病原体黄单胞杆菌(Xanthomonas)的转录因子,其可以很容易地被工程改造以结合新的DNA靶。TALE或其截短版本可以与内切核酸酶比如FokI的催化结构域连接,以建立称为TALE核酸酶或TALEN的靶向内切核酸酶(Sanjana等人,2012,Nat Protoc,7(1):171-192)和Arnould等人,2011,Protein Engineering,Design&Selection,24(1-2):27-31)。
在替代实施方案中,靶向内切核酸酶可以是嵌合核酸酶。嵌合核酸酶的非限制性实例包括ZF-大范围核酸酶、TAL-大范围核酸酶、Cas9-FokI融合体、ZF-Cas9融合体、TAL-Cas9融合体等。本领域技术人员熟悉生成此类嵌合核酸酶融合体的手段。
在仍然其他实施方案中,靶向内切核酸酶可以是位点特异性内切核酸酶。特别是,位点特异性内切核酸酶可以是“稀有切割”内切核酸酶,其识别在基因组中很少出现的序列。备选地,位点特异性内切核酸酶可以被工程改造以切割目的位点(Friedhoff等人,2007,Methods Mol Biol 352:1110123)。通常,位点特异性内切核酸酶的识别序列在基因组中只出现一次。在替代的进一步实施方案中,靶向内切核酸酶可以是人工靶向DNA双链断裂诱导剂。
(b)将靶向内切核酸酶递送至细胞
该方法包括将靶向内切核酸酶引入目的亲本细胞系。靶向内切核酸酶可以作为纯化的分离蛋白或作为编码靶向内切核酸酶的核酸引入细胞内。核酸可以是DNA或RNA。在其中编码核酸是mRNA的实施方案中,mRNA可能是5'加帽和/或3'聚腺苷酸化。在其中编码核酸是DNA的实施方案中,DNA可以是线性或环形的。核酸可以是质粒或病毒载体的一部分,其中编码DNA可以与合适的启动子可操作地连接。本领域技术人员熟悉适合的载体、启动子、其他控制元件以及将载体引入目的细胞的手段。在其中靶向内切核酸酶是CRISPR核酸酶的实施方案中,CRISPR核酸酶系统可以作为gRNA-蛋白复合物引入细胞内。
可以通过多种手段将靶向内切核酸酶分子引入细胞内。适合的递送手段包括微注射、电穿孔、声穿孔、生物弹道、磷酸钙介导的转染、阳离子转染、脂质体转染、树状聚合物转染、热休克转染、核转染、磁转染、脂质转染、穿刺转染、光学转染、专有剂增强的核酸摄取以及经由脂质体、免疫脂质体、病毒体或人工病毒体递送。在一个特定实施方案中,靶向内切核酸酶分子通过核转染引入细胞内。
任选的供体多核苷酸。靶向基因组修饰或工程改造的方法可以进一步包括向细胞引入至少一个供体多核苷酸,所述供体多核苷酸包含与靶染色体序列相比具有至少一个核苷酸变化的序列。供体多核苷酸与染色体序列靶向位点处或附近的序列具有基本序列同一性,以便通过靶向内切核酸酶引入的双链断裂可以通过同源定向修复过程修复,并且供体多核苷酸的序列可以插入染色体序列内或与染色体序列交换,从而修饰染色体序列。例如,供体多核苷酸可以包含与靶位点一侧的序列具有基本序列同一性的第一序列,以及与靶位点另一侧的序列具有基本序列同一性的第二序列。供体多核苷酸可以进一步包括供体序列,用于整合到靶向染色体序列中。例如,供体序列可以是外源序列(例如标记序列),使得外源序列的整合破坏阅读框并灭活靶向染色体序列。
供体多核苷酸中与染色体序列靶向位点处或附近的序列具有基本序列同一性的第一和第二序列的长度可以变化。通常情况下,供体多核苷酸中的第一和第二序列各自的长度为至少约10个核苷酸。在各种实施方案中,与染色体序列有基本序列同一性的供体多核苷酸序列的长度可以是约15个核苷酸、约20个核苷酸、约25个核苷酸、约30个核苷酸、约40个核苷酸、约50个核苷酸、约100个核苷酸或多于100个核苷酸。
短语“基本序列同一性”意指多核苷酸中的序列与目的染色体序列至少有约75%的序列同一性。在一些实施方案中,多核苷酸中的序列与目的染色体序列的同一性约为75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、
89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性。
供体多核苷酸的长度可以且将会变化。例如,供体多核苷酸的长度可以在约20个核苷酸到至多约200,000个核苷酸范围内。在各种实施方案中,供体多核苷酸的长度可以在约20个核苷酸至约100个核苷酸,约100个核苷酸至约1000个核苷酸,约1000个核苷酸至约10,000个核苷酸,约10,000个核苷酸至约100,000个核苷酸,或约100,000个核苷酸至约200,000个核苷酸范围内。
通常,供体多核苷酸是DNA。DNA可以是单链或双链。DNA可以是线性或环形。在一些实施方案中,供体多核苷酸可以是单链、线性寡核苷酸,包含小于约200个核苷酸。在其他实施方案中,供体多核苷酸可以是载体的一部分。适合的载体包括DNA质粒、病毒载体、细菌人工染色体(BAC)和酵母人工染色体(YAC)。在仍然其他实施方案中,供体多核苷酸可以是PCR片段或与递送媒介物比如脂质体或泊洛沙姆复合的核酸。
供体多核苷酸可以在靶向内切核酸酶分子引入细胞内的同时引入。备选地,供体多核苷酸和靶向内切核酸酶分子可以顺序引入细胞内。靶向内切核酸酶分子与供体多核苷酸的比例可以且将会变化。通常情况下,靶向内切核酸酶分子与供体多核苷酸的比例在约1:10至约10:1范围内。在各种实施方案中,靶向内切核酸酶分子与多核苷酸的比例可以是约1:10、1:9、1:8、1:7、1:6、1:5、1:4、1:3、1:2、1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1或10:1。在一个实施方案中,比例约为1:1。
(c)培养细胞
该方法进一步包括在适当条件下培养细胞,使得通过靶向内切核酸酶引入的双链断裂可以通过以下修复:(i)非同源末端连接修复过程,使得染色体序列通过至少一个核苷酸的缺失、插入和/或替换而修饰,或者任选地(ii)同源定向修复过程,使得染色体序列与多核苷酸序列交换,使得染色体序列被修饰。在其中将编码靶向内切核酸酶的核酸引入细胞内的实施方案中,该方法包括在适当条件下维持细胞,使得细胞表达靶向内切核酸酶。
通常情况下,细胞在适合细胞生长和/或维持的条件下维持。合适的细胞培养条件是本领域众所周知的,且描述于例如Santiago等人(2008)PNAS105:5809-5814;Moehle等人(2007)PNAS104:3055-3060;Urnov等人(2005)Nature 435:646-651;和Lombardo等人(2007)Nat.Biotechnology 25:1298-1306。本领域技术人员知道培养细胞的方法是本领域已知的,并且可以并且将会取决于细胞类型而变化。在所有情况下可使用常规优化来确定特定细胞类型的最佳技术。
在这一步骤过程中,靶向内切核酸酶在染色体序列的靶向切割位点识别、结合并产生双链断裂,并且在修复双链断裂期间,至少一个核苷酸缺失、插入和/或替换被引入到靶向染色体序列内。在特定实施方案中,靶向染色体序列被灭活。
在确认目的染色体序列已被修饰后,可以分离单细胞克隆并(经由DNA测序和/或蛋白分析)进行基因分型。包含一个经修饰的染色体序列的细胞可以经历一轮或多轮另外的靶向基因组修饰以修饰另外的染色体序列,从而建立双重敲除、三重敲除等。
(IV)生产重组蛋白
本公开的另一个方面包括在生物制品生产系统中生产重组蛋白的方法。适合的重组蛋白在第(I)(c)节中描述。方法包括在上述第(I)节中描述的任何工程改造细胞系中表达目的重组蛋白,并纯化表达的重组蛋白。生产或制造重组蛋白的手段是本领域众所周知的(参见例如,"Biopharmaceutical Production Technology",Subramanian(编辑),2012,Wiley-VCH;ISBN:978-3-527-33029-4)。
可以经由包括澄清步骤(例如过滤)和一步或多步色谱法(例如亲和色谱法、蛋白A(或G)色谱法、离子交换(即,阳离子和/或阴离子)色谱法)的过程来纯化重组蛋白。
定义
除非另有定义,否则本文使用的所有技术和科学术语均具有该发明所属领域内技术人员通常理解的含义。以下参考文献为技术人员提供了本发明中使用的许多术语的一般定义:Singleton等人,Dictionary of Microbiology and Molecular Biology(第2版.1994);The Cambridge Dictionary of Science and Technology(Walker编辑,1988);The Glossary of Genetics,第5版,R.Rieger等人(编辑),Springer Verlag(1991);和Hale&Marham,The Harper Collins Dictionary of Biology(1991)。如本文所用,除非另有说明,否则以下术语具有赋予它们的含义。
当介绍本公开或其优选实施方案的元素时,冠词“一个”、“一种”、“该”和“所述”预期表示存在一个或多个元素。术语“包含”、“包括”和“具有”预期是包括性的,并且意指除了所列出的元素之外,还可以存在另外的元素。
如本文所用,术语“内源序列”是指对细胞是天然的染色体序列。
术语“外源序列”是指对细胞不是天然的染色体序列,或者移动到不同染色体位置的染色体序列。
“工程改造”或“基因修饰”的细胞指的是基因组已被修饰或工程改造的细胞,即细胞含有至少一个已被工程改造为包含至少一个核苷酸插入、至少一个核苷酸缺失和/或至少一个核苷酸替换的染色体序列。
术语“基因组修饰”和“基因组编辑”是指通过其改变特定的内源染色体序列使得染色体序列被修饰的过程。染色体序列可以被修饰为包含至少一个核苷酸的插入、至少一个核苷酸的缺失和/或至少一个核苷酸的替换。经修饰的染色体序列可以被灭活,使得不产生任何产物。或者,染色体序列可以被修饰,使得产生改变的产物。
如本文所用,“基因”指的是编码基因产物的DNA区域(包括外显子和内含子),以及调节基因产物生产的所有DNA区域,无论这些调节序列是否与编码和/或转录序列相邻。因此,基因包括但不限于启动子序列、终止子、翻译调节序列,比如核糖体结合位点和内部核糖体进入位点、增强子、沉默子、绝缘子、边界元件、复制起点、基质附着位点和位点控制区域。
术语“异源”指的是对目的细胞或物种不是天然的实体。
术语“核酸”和“多核苷酸”是指脱氧核糖核苷酸或核糖核苷酸聚合物,呈线性或环形构象。就本公开的目的而言,这些术语不被解释为限制聚合物的长度。术语可以涵盖已知的天然核苷酸的类似物,以及在碱基、糖和/或磷酸部分被修饰的核苷酸。通常情况下,特定核苷酸的类似物具有相同的碱基配对特异性;即,A的类似物将与T配对。核酸或多核苷酸的核苷酸可以通过磷酸二酯键、硫代磷酸酯键、亚磷酰胺键或亚磷酰二胺键或其组合连接。
术语“核苷酸”指的是脱氧核糖核苷酸或核糖核苷酸。核苷酸可以是标准核苷酸(即,腺苷、鸟苷、胞苷、胸苷和尿苷)或核苷酸类似物。核苷酸类似物是指具有经修饰的嘌呤或嘧啶碱基或经修饰的核糖部分的核苷酸。核苷酸类似物可以是天然存在的核苷酸(例如肌苷)或非天然存在的核苷酸。核苷酸糖或碱基部分的修饰的非限制性实例包括乙酰基、氨基、羧基、羧甲基、羟基、甲基、磷酸基和巯基的添加(或去除),以及碱基的碳和氮原子被其他原子(例如7-脱氮杂嘌呤)替换。核苷酸类似物还包括二脱氧核苷酸、2′-O-甲基核苷酸、锁核酸(LNA)、肽核酸(PNA)和吗啉代。
术语“多肽”和“蛋白”可互换使用,指的是氨基酸残基的聚合物。
如本文所用,术语“靶位点”或“靶序列”指的是定义染色体序列待修饰或编辑的部分的核酸序列,并且靶向内切核酸酶被工程改造以识别并结合所述核酸序列,前提是存在足够的结合条件。
术语“上游”和“下游”指的是核酸序列中相对于固定位置的位置。上游是指距该位置5'(即,靠近链的5'端)的区域,下游是指距该位置3'(即,靠近链的3'端)的区域。
确定核酸和氨基酸序列同一性的技术是本领域已知的。通常,此类技术包括确定基因的mRNA的核苷酸序列和/或由此确定编码的氨基酸序列,并将这些序列与第二个核苷酸或氨基酸序列比较。也可以以这种方式确定和比较基因组序列。通常情况下,同一性指的是两个多核苷酸或多肽序列之间分别的确切的核苷酸对核苷酸或氨基酸对氨基酸的对应关系。两个或更多的序列(多核苷酸或氨基酸)可以通过确定它们的百分比同一性来比较。两个序列(无论是核酸还是氨基酸序列)的百分比同一性是将两个对齐序列之间的确切匹配数除以较短序列的长度并乘以100的数值。对于核酸序列的近似对齐,由Smith和Waterman,Advances in Applied Mathematics 2:482-489,1981的局部同源算法提供。可以将该算法通过使用Dayhoff,Atlas of Protein Sequences and Structure,M.O.Dayhoff编辑,5suppl.3:353-358,National Biomedical Research Foundation,Washington,D.C.,USA开发的评分矩阵应用于氨基酸序列,并通过Gribskov,Nucl.AcidsRes.14(6):6745-6763(1986)归一化。这个算法确定序列的百分比同一性的示例性实施方式由Genetics Computer Group(Madison,Wis.)在“BestFit”实用应用程序中提供。其他适合于计算序列之间百分比同一性或相似性的程序是本领域已知的,例如,另一个对齐程序是BLAST,以默认参数使用。例如,BLASTN和BLASTP可以使用以下默认参数使用:遗传密码=标准;过滤=无;链=两者;截止值
=60;期望=10;矩阵=BLOSUM62;描述=50个序列;排序依据=按高分数排序;数据库=非冗余,
GenBank+EMBL+DDBJ+PDB+GenBank CDS翻译+Swiss蛋白
+Spupdate+PIR。这些程序的详细信息可以在GenBank网站上找到。关于本文描述的序列,所期望的序列同一性程度约在80%到100%的范围内,以及两者之间的任何整数值。通常,序列之间的百分比同一性至少为70-75%,优选80-82%,更优选85-90%,甚至更优选92%,仍然更优选95%,且最优选98%的序列同一性。
由于在不脱离本发明范围的情况下,上述细胞和方法可以进行各种变化,因此预期上述描述和下面实施例中包含的所有内容应被解释为说明性的,而不是限制性的。
实施例
以下实施例说明了本发明的某些方面。
实施例1:天冬酰胺介导的选择系统的设计
为了开发天冬酰胺介导的代谢选择系统,首先开发了对非必需氨基酸天冬酰胺(Asn)营养缺陷型的CHO细胞系。针对Reactome和KEGG数据库进行了全面搜索,以鉴定与天冬酰胺合成途径相关的所有基因。鉴定了内源谷氨酰胺水解天冬酰胺合成酶基因(ASNS)是唯一负责Asn合成的非冗余基因(图1)。为了生成Asn营养缺陷型CHO细胞系,利用了来自MilliporeSigma的谷氨酰胺(Gln)营养缺陷型GS-/-细胞系经由细胞系的全基因组测序(WGS)阐明了内源ASNS编码序列(图2),并发现它在基因组中以两个拷贝存在,如通过数字微滴PCR(ddPCR)分析确定的(图3)。设计了锌指核酸酶(ZFN)来破坏编码ASNS蛋白活性亚基的ASNS基因的第十个外显子。ZFN靶序列在图2中被下划线标记。将细胞在补充有6mM L-谷氨酰胺
(MilliporeSigma G7513)的CD CHO融合培养基(MilliporeSigma14365C)(融合+Gln)中在37℃和5%CO2的振荡条件下培养。细胞在转染前一天以0.5e6的密度种植,以维持培养处于对数生长期。使用电穿孔用每个ZFN臂的6μg mRNA转染1.0e6个细胞。经由Surveyor核酸酶S突变检测测定评估ZFN切割活性(图4)。转染的细胞被转移到含有3mL补充了6mM L-谷氨酰胺(MilliporeSigma G7513)和2mM L-无水天冬酰胺(MilliporeSigma1043502)的CD CHO融合介质(MilliporeSigma 14365C)(融合+Gln+Asn)的6孔培养皿中。细胞在30℃和5% CO2的静态环境中孵育48小时,之后转移到37℃/5% CO2的静态环境中再孵育48小时。转染后96小时,ZFN修饰的细胞被放大到T-75烧瓶中。经由荧光激活细胞分选仪(FACS)将来自ZFN修饰的池的单克隆细胞分离到96孔培养板内。经由下一代测序(NGS)评估单克隆细胞,以鉴定含有成功遗传破坏ASNS两个拷贝的克隆(图5)。
为了证明天冬酰胺介导的选择机制作为独立系统以及作为双重代谢选择系统的一部分的有效性,生成了稳定选择的细胞群,表达多种分子。在验证该系统时使用的分子包括辣椒红荧光蛋白(RFP)、Dasher绿色荧光蛋白(GFP)和人类IgG1。GS-/-ASNS-/-细胞在融合+Gln+Asn培养基中培养。当前工作中使用的表达载体包含天冬酰胺合成酶(ASNS)或谷氨酰胺合成酶(GS)选择标记,如实验设计所示。鼠ASNS(蛋白:天冬酰胺合成酶{谷氨酰胺水解};基因:ASNS;UniProtKB ID:Q61024)或鼠GS(蛋白:谷氨酰胺合成酶{谷氨酰胺氨连接酶};基因:Glul;UniProtKB ID:P15105)的表达由5'内源表达控制序列(启动子)或在基因3'末端具有SV40聚腺苷酸化序列的5'SV40启动子驱动(图6和7)。
GS-/-ASNS-/-细胞在融合+Gln+Asn中,在37℃和5%CO2的振荡条件下培养。细胞在转染前一天以0.5e6的密度种植,以维持培养处于对数生长期。使用电穿孔用12μg的质粒DNA转染每个条件的1.0e6个细胞。转染的细胞被转移到含有融合+Gln+Asn的T-25培养皿中,在转染后48小时另外添加了2mL的培养基。转染后96小时,丸粒化细胞,且抽吸培养基,然后将4e5个活细胞/mL重悬于12mL适当的选择介质中并转移到T-75烧瓶中。使用融合-Gln进行基于谷氨酰胺的选择,使用融合-Asn进行基于天冬酰胺的选择,并使用具有低浓度谷氨酰胺和-Asn的融合进行谷氨酰胺/天冬酰胺双重选择。随时间监测了各种选择培养物的细胞活力和活细胞密度。从选择中恢复后,将稳定的选择培养物转移到TubeSpin生物反应器管中用于放大和适应振荡条件。
开发了不含L-无水天冬酰胺(Asn)的高级CHO流加补料培养基(MilliporeSigma 14366C)、高级CHO补料(MilliporeSigma 24367C)和4补料(MilliporeSigma
1.03796.0005)的定制配方(分别为高级-Asn、补料-Asn和4补料-Asn)。将用IgG1表达载体转染的稳定选择的培养物丸粒化,选择培养基被抽吸,然后以3e5个活细胞/mL在高级-Asn中重新悬浮,用于流加补料条件下的生产力分析。从接种后第3天开始,每隔一天收集每个培养基的活细胞密度和活力。从接种后第3天开始,向每个培养基中添加1.5mL的高级补料-Asn和4补料-Asn的50/50混合物。从第5天开始每隔一天从每个培养中读取葡萄糖和谷氨酰胺读数,其中加入D-+-葡萄糖(MilliporeSigma G8769)和L-谷氨酰胺(MilliporeSigma G7513),以维持适当的葡萄糖和谷氨酰胺水平。随时间监测生产力,从第9天开始每隔一天记录补料批次滴度,直到培养的活力下降到70%以下。使用ForteBioOctet的干涉测量法确定滴度,然后经由HPLC蛋白A亲和色谱法确认。
实施例2:
开发了不含L-无水天冬酰胺(Asn)的CD CHO融合培养基的定制配方(融合-Gln-Asn)。GS-/-ASNS-/-克隆在融合+Gln+Asn或融合+Gln-Asn中培养至少十天。一周两次进行活力和活细胞密度测量。图8表明,在缺乏天冬酰胺的情况下,GS-/-ASNS-/-细胞无法生长,但当天冬酰胺被补充到培养基内时,GS-/-ASNS-/-细胞生长得以恢复。
实施例3:
为了证明稳定选择的细胞群能够使用实施例1中描述的天冬酰胺介导的选择系统产生目的蛋白,转染细胞并在选择压力下在融合-Asn中传代。将ASNS/RFP载体转染到GS-/-ASNS-/-细胞内。在整个选择过程中监测细胞生长和活力。用ASNS/RFP质粒转染并在融合+Gln+Asn(非选择性培养基)或融合+Gln-Asn(Asn选择性培养基)中生长的细胞从选择压力中恢复。通过FACS分析存活的细胞群,并测量平均荧光强度(MFI)和RFP+细胞的百分比。与在融合+Gln-Asn中经历天冬酰胺选择的细胞相比,在融合+Gln+Asn中生长的细胞显示出小百分比的RFP阳性细胞和低MFI。结果总结在表1中。
表1
实施例4:
为了证明稳定选择的细胞群能够使用实施例1中描述的天冬酰胺介导的选择系统产生目的蛋白,我们开发了一种载体,该载体具有IgG重链、IgG轻链和由5'端内源表达控制序列或5'SV40启动子驱动的天冬酰胺合成酶(ASNS)编码序列(图6和7)。这个载体被转染到GS-/-ASNS-/-细胞系内。作为对照,使用了无DNA的模拟转染。这些群体已在融合+Gln-Asn中的选择压力下传代。用于选择的条件也在恢复、放大期间和生产力测定期间应用。流加补料生产力测定以3e5个活细胞/mL接种在高级+Gln-Asn培养基中。从接种后第3天开始,每隔一天收集每个培养基的活细胞密度和活力。从接种后第3天开始,向每个培养基中添加1.5mL的高级补料-Asn和4补料-Asn的50/50混合物。从第5天开始,每隔一天读取葡萄糖和谷氨酰胺读数,其中加入D-+-葡萄糖(MilliporeSigma G8769)和L-谷氨酰胺(MilliporeSigma G7513),以维持适当的葡萄糖和谷氨酰胺水平。用由内源表达控制序列(ASNS启动子)驱动的ASNS编码序列选择的细胞显示为展现出IgG表达水平为当用由SV40启动子驱动的ASNS编码序列选择时表达相同IgG的细胞的约3倍高(图9)。
实施例5:
为了测试稳定细胞群是否能够在双重选择条件下产生两种独立的细胞内荧光蛋白,我们开发了两种载体,一种含有GFP和GS编码序列,而第二种含有RFP和ASNS编码序列(图6)。这两种质粒被共转染到GS-/-ASNS-/-细胞内(GFP+RFP)。作为对照,每个质粒也被独立地转染到GS-/-ASNS-/-细胞内(分别仅GFP和仅RFP)。然后所有三种转染的细胞在GS选择性条件(融合-Gln)下、ASNS选择性条件(融合-Asn)下以及双重代谢选择条件(融合-Gln-Asn,必要时补充氨基酸)下传代。用于选择的条件也在恢复、放大和所有其他测定期间应用。图10显示了来自选择测定的生长和活力数据,表明用GFP载体转染的细胞可以在-Gln条件下生存和生长,但需要培养基中补充Asn。另一方面,用RFP载体转染的细胞可以在-Asn条件下生存和生长,但需要培养基中补充Gln。共转染两种质粒(GFP+RFP)的细胞可以在-Gln培养基中、-Asn培养基中和-Gln-Asn培养基中(必要时补充氨基酸)生存和生长。图11和12表明,在-Gln培养基中生存和生长的用GFP载体转染的细胞为GFP阳性;而在-Asn培养基中生存和生长的用RFP载体转染的细胞为RFP阳性;且在-Gln-Asn培养基中或补充不同水平的Gln和/或Asn的-Asn培养基中生存和生长的用两种质粒(GFP+RFP)共转染的细胞对GFP和RFP均呈阳性。这些数据表明,GS+ASNS双重代谢选择系统提供了独特的机会,选择出其中无需向培养基中添加任何选择剂(例如抗生素)而已引入了多个编码细胞内蛋白的独立载体的细胞。
实施例6:
为了测试稳定细胞群是否能够在双重选择条件下产生分泌蛋白,我们开发了两种表达IgG1的载体,一个包含IgG重链、IgG轻链和GS编码序列,而第二个包含相同的IgG重链、IgG轻链和ASNS编码序列(图6)。这两个独立的载体被共转染到GS-/-ASNS-/-细胞内(GS+ASNS)。作为对照,每个载体也被独立地转染到GS-/-ASNS-/-细胞内(仅GS和仅ASNS)。然后细胞在融合-Gln(仅转染GS的细胞)中、在融合-Asn(仅转染ASNS的细胞)中或在融合-Gln–Asn(GS+ASNS转染的细胞)或补充痕量Gln和/或Asn的培养基中在选择压力下传代。用于选择的条件也在恢复、放大期间和生产力测定期间应用。仅GS的选择培养在14天后完全恢复,而仅ASNS和GS+ASNS双重选择培养恢复概况相似,且需要21天完全恢复。在流加补料测定中,仅GS的细胞、仅ASNS的细胞产生IgG(图13)。这表明,细胞产生的外源GS和ASNS加上必要时补充Gln和Asn,足以在不因增加代谢负担而减缓细胞的生长和增殖的情况下维持分泌蛋白的生产。这提供了在双重代谢选择条件下运行大规模生产生物反应器的潜力,这可能难以使用抗生素选择方法进行,要么是因为需要后来将抗生素从所期望的分泌蛋白中分离或纯化,要么是因为向大规模生物反应器中添加抗生素的成本。此外,这种双重代谢选择系统(GS+ASNS)提供了机会,更有效地选择出其中已向细胞内引入了多个大型载体的细胞,例如在表达双特异性抗体或其他大型和/或复杂蛋白时。

Claims (25)

1.生产重组蛋白产品的方法,过程包括
(a)提供一种哺乳动物细胞系,其被工程改造为具有减少或消除的内源天冬酰胺合成酶(ASNS)表达;
(b)向所述哺乳动物细胞系内引入多核苷酸,其中所述多核苷酸编码功能性ASNS基因和重组蛋白;
(c)培养所述细胞系;以及
(d)纯化所述重组蛋白以形成所述重组蛋白产品。
2.根据权利要求1所述的方法,其中所述(a)的哺乳动物细胞系进一步包含减少或消除的内源谷氨酰胺合成酶(GS)表达。
3.根据权利要求1所述的方法,其中通过灭活所述哺乳动物细胞系的内源ASNS基因来减少或消除内源ASNS表达。
4.根据权利要求1所述的方法,其中使用靶向内切核酸酶介导的基因组修饰技术来灭活所述内源ASNS基因。
5.根据权利要求4所述的方法,其中所述靶向内切核酸酶是CRISPR核糖核蛋白复合物或一对锌指核酸酶。
6.根据权利要求1所述的方法,其中所述哺乳动物细胞系是中国仓鼠卵巢(CHO)细胞系、婴儿仓鼠肾(BHK)细胞系、NS0小鼠骨髓瘤细胞系、HEK293细胞系或Vero非洲绿猴肾细胞系。
7.根据权利要求1所述的方法,其中所述细胞系是CHO细胞系。
8.根据权利要求1所述的方法,其中所述重组蛋白产品选自抗体、抗体片段、疫苗、生长因子、细胞因子、激素或凝血因子。
9.根据权利要求8所述的方法,其中所述抗体是双特异性或多特异性抗体。
10.用于生物制品生产系统的遗传工程改造的哺乳动物细胞系,其中所述哺乳动物细胞系被工程改造为具有减少或消除的内源ASNS表达。
11.根据权利要求10所述的哺乳动物细胞系,其中ASNS表达经由灭活至少一个编码ASNS的染色体序列的等位基因来减少或消除。
12.根据权利要求11所述的哺乳动物细胞系,其中两个编码ASNS的染色体序列的等位基因都被灭活。
13.根据权利要求10所述的哺乳动物细胞系,其中所述细胞系被工程改造为具有减少或消除的内源谷氨酰胺合成酶(GS)表达。
14.根据权利要求12所述的哺乳动物细胞系,其中使用靶向内切核酸酶介导的基因组修饰技术来灭活所述染色体序列。
15.根据权利要求14所述的哺乳动物细胞系,其中所述靶向内切核酸酶是核糖核蛋白复合物或一对锌指核酸酶。
16.根据权利要求15所述的哺乳动物细胞系,其中所述非人类细胞系是中国仓鼠卵巢(CHO)细胞系、婴儿仓鼠肾(BHK)细胞系、NS0小鼠骨髓瘤细胞系、HEK293细胞系或Vero非洲绿猴肾细胞系。
17.根据权利要求16所述的哺乳动物细胞系,其中所述细胞系是CHO细胞系。
18.根据权利要求17所述的哺乳动物细胞系,其中细胞活力、活细胞密度、滴度、生长速率、增殖反应、细胞形态和/或一般细胞健康状况与非工程改造的亲本哺乳动物细胞系相当。
19.根据权利要求10所述的哺乳动物细胞系,进一步包括至少一个编码选自抗体、抗体片段、疫苗、生长因子、细胞因子、激素或凝血因子的重组蛋白的核酸。
20.根据权利要求19所述的哺乳动物细胞系,其中所述抗体是双特异性或多特异性抗体。
21.包含编码功能性ASNS和至少一个目的重组蛋白的核酸序列的多核苷酸。
22.多核苷酸,其包含
a)编码功能性ASNS的核酸序列;
b)编码功能性GS的核酸序列;以及
c)编码目的重组蛋白的核酸序列的多核苷酸。根据权利要求1所述的方法,其中所述功能性ASNS基因包含异源启动子序列。
23.根据权利要求1所述的方法,其中所述功能性ASNS基因包含内源启动子序列。
24.根据权利要求24所述的方法,其中所述内源启动子是内源ASNS启动子。
25.根据权利要求22所述的多核苷酸,其中所述功能性ASNS包含内源ASNS启动子。
CN202380038098.7A 2022-03-04 2023-03-03 经由天冬酰胺生物合成途径的代谢选择 Pending CN119137265A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202263268857P 2022-03-04 2022-03-04
US63/268857 2022-03-04
PCT/US2023/063672 WO2023168397A1 (en) 2022-03-04 2023-03-03 Metabolic selection via the asparagine biosynthesis pathway

Publications (1)

Publication Number Publication Date
CN119137265A true CN119137265A (zh) 2024-12-13

Family

ID=86099966

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202380038098.7A Pending CN119137265A (zh) 2022-03-04 2023-03-03 经由天冬酰胺生物合成途径的代谢选择

Country Status (6)

Country Link
EP (1) EP4486874A1 (zh)
JP (1) JP2025507032A (zh)
KR (1) KR20240151871A (zh)
CN (1) CN119137265A (zh)
CA (1) CA3244807A1 (zh)
WO (1) WO2023168397A1 (zh)

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4656134A (en) * 1982-01-11 1987-04-07 Board Of Trustees Of Leland Stanford Jr. University Gene amplification in eukaryotic cells
US5011776A (en) * 1988-02-11 1991-04-30 The Royal Institution For The Advancement Of Learning (Mcgill University) Shuttle vector, utilizing the E. coli asparagine synthetase gene, and capable of dominant transfection and amplification in animal cells
US5356802A (en) 1992-04-03 1994-10-18 The Johns Hopkins University Functional domains in flavobacterium okeanokoites (FokI) restriction endonuclease
US5487994A (en) 1992-04-03 1996-01-30 The Johns Hopkins University Insertion and deletion mutants of FokI restriction endonuclease
US5436150A (en) 1992-04-03 1995-07-25 The Johns Hopkins University Functional domains in flavobacterium okeanokoities (foki) restriction endonuclease
US6242568B1 (en) 1994-01-18 2001-06-05 The Scripps Research Institute Zinc finger protein derivatives and methods therefor
US6140466A (en) 1994-01-18 2000-10-31 The Scripps Research Institute Zinc finger protein derivatives and methods therefor
GB9824544D0 (en) 1998-11-09 1999-01-06 Medical Res Council Screening system
JP4118327B2 (ja) 1994-08-20 2008-07-16 ゲンダック・リミテッド Dna認識のための結合タンパク質におけるまたはそれに関連する改良
US5789538A (en) 1995-02-03 1998-08-04 Massachusetts Institute Of Technology Zinc finger proteins with high affinity new DNA binding specificities
US5776746A (en) * 1996-05-01 1998-07-07 Genitope Corporation Gene amplification methods
US5925523A (en) 1996-08-23 1999-07-20 President & Fellows Of Harvard College Intraction trap assay, reagents and uses thereof
GB9703369D0 (en) 1997-02-18 1997-04-09 Lindqvist Bjorn H Process
GB2338237B (en) 1997-02-18 2001-02-28 Actinova Ltd In vitro peptide or protein expression library
GB9710809D0 (en) 1997-05-23 1997-07-23 Medical Res Council Nucleic acid binding proteins
US6410248B1 (en) 1998-01-30 2002-06-25 Massachusetts Institute Of Technology General strategy for selecting high-affinity zinc finger proteins for diverse DNA target sites
ATE466952T1 (de) 1998-03-02 2010-05-15 Massachusetts Inst Technology Poly-zinkfinger-proteine mit verbesserten linkern
US6534261B1 (en) 1999-01-12 2003-03-18 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
US6453242B1 (en) 1999-01-12 2002-09-17 Sangamo Biosciences, Inc. Selection of sites for targeting by zinc finger proteins and methods of designing zinc finger proteins to bind to preselected sites
US6794136B1 (en) 2000-11-20 2004-09-21 Sangamo Biosciences, Inc. Iterative optimization in the design of binding proteins
US20030044787A1 (en) 2000-05-16 2003-03-06 Joung J. Keith Methods and compositions for interaction trap assays
US7888121B2 (en) 2003-08-08 2011-02-15 Sangamo Biosciences, Inc. Methods and compositions for targeted cleavage and recombination
WO2007014275A2 (en) 2005-07-26 2007-02-01 Sangamo Biosciences, Inc. Targeted integration and expression of exogenous nucleic acid sequences
US20210317435A1 (en) * 2018-07-13 2021-10-14 Enzene Biosciences Limited Double knock-out cho cell line method of its generation and producing therapeutic proteins therefrom

Also Published As

Publication number Publication date
WO2023168397A1 (en) 2023-09-07
KR20240151871A (ko) 2024-10-18
CA3244807A1 (en) 2023-09-07
EP4486874A1 (en) 2025-01-08
JP2025507032A (ja) 2025-03-13

Similar Documents

Publication Publication Date Title
US20230374490A1 (en) Stable targeted integration
CA3129835A1 (en) Crispr/cas fusion proteins and systems
US20210238628A1 (en) Engineered cells with modified host cell protein profiles
JP2024099583A (ja) 安定的な標的組み込み
US20210238222A1 (en) Producing recombinant proteins with reduced levels of host cell proteins
CN119137265A (zh) 经由天冬酰胺生物合成途径的代谢选择
CN120283057A (zh) 通过丝氨酸生物合成途径的代谢选择
JP2025536205A (ja) グリシン-ギ酸生合成経路による代謝選択
WO2025029740A1 (en) Metabolic selection via the alanine biosynthesis pathway

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination