发明详述
定义
如本文所用,除非另有说明,以下术语具有赋予它们的含义。
本文使用的术语“一个”、“一种”或“所述”不仅包括具有一个成员的方面,而且包括具有一个以上成员的方面。例如,除非上下文另有明确规定,单数形式“一个”、“一种”和“所述”包括复数指示物。因此,例如,提及“一个细胞”包括多个这样的细胞,并且提及“所述试剂”包括提及本领域技术人员已知的一种或多种试剂,等等。
术语“基因”是指多核苷酸元件的组合,当以天然或重组方式可操作地连接时,其提供一些产物或功能。术语“基因”应被广泛地解释,并且可包括基因的mRNA、cDNA、cRNA和基因组DNA形式。
术语“同源性定向修复”或“HDR”是指在细胞中使用同源模板来指导修复以准确且精确地修复双链DNA断裂的机制。HDR的基础机制是同源重组(HR)。
术语“同源重组”或“HR”是指在DNA的两个类似分子之间交换核苷酸序列的遗传过程。细胞使用同源重组(HR)来精确修复发生在DNA两条链上的有害断裂,被称为双链断裂或产生突出序列的其他断裂。
术语“单链向导RNA”或“sgRNA”是指靶向DNA的RNA,其包含将Cas核酸酶靶向靶基因组DNA的向导序列和与Cas核酸酶(如tracrRNA)相互作用的支架序列。优选地,所述sgRNA包含SEQ ID NO.:1或由SEQ ID NO.:1组成。
术语“Cas多肽”或“Cas核酸酶”是指成簇规律间隔短回文重复序列相关的多肽或核酸酶,其切割DNA以在由包含于crRNA分子内的20个核苷酸的向导序列指定位点的双链断裂处产生平端。Cas核酸酶需要用于位点特异性DNA识别和切割的crRNA和tracrRNA。crRNA通过部分互补的区域或通过接头与tracrRNA结合,以将Cas核酸酶引导至与靶DNA中的crRNA同源的区域,被称为“前间隔序列”。
术语“HiFi-Cas9”在本文中被理解为作为核糖核蛋白复合物递送的高保真Cas9突变体,其能够高效地进行基因编辑,具有与野生型Cas9类似的在靶活性,但具有降低的脱靶活性。Vakulskas et al.描述了HiFi-Cas9(Vakulskas,Dever et al.2018)中。
术语“核糖核蛋白复合物”或“RNP复合物”是指包含sgRNA和Cas多肽的复合物。
术语“递送供体模板的腺相关病毒载体”或“含有供体模板的腺相关病毒载体”是指可递送用于在靶细胞(如原代细胞)中经由同源定向修复进行基于CRISPR的基因编辑的重组供体模板的腺相关病毒颗粒。
术语“重组供体模板”是指核酸链,如DNA链,其为同源重组链侵入期间由受损的DNA修复机制起始的供体链,在一些情况下,受损的DNA修复机制由双链断裂引起。供体多核苷酸用作指导受损的DNA区域修复的模板材料。
在两种或更多种核酸或多肽的背景下,术语“序列同一性”或“百分比同一性”是指如使用序列比较算法(如,通过BLAST比对或技术人员已知的任何其他算法)或者通过目测所测量的,与第二分子进行最大对应关系的比较和比对时,两个或更多个序列或子序列是一样的(“相同的”),或具有相同的氨基酸残基或核苷酸的特定百分比(“百分比同一性”)。
术语“同源的”是指天然或人工源自共同的祖先蛋白或氨基酸序列的两个或多个氨基酸序列。类似地,当核苷酸序列天然地或人工地源自共同的祖先核酸时,它们是同源的。
术语“原代细胞”是指直接从多细胞生物中分离的细胞。与连续(肿瘤或人工永生化)的细胞系相比,原代细胞通常经历非常少的群体倍增,因此更能代表它们所来源的组织的主要功能成分。在一些情况下,原代细胞是已经分离然后立即使用的细胞。在另一些情况下,原代细胞不能无限分裂,因此不能在体外长期培养。
术语“基因修饰的原代细胞”或“基因组编辑的原代细胞”是指在某些情况下已将异源核酸引入其内源基因组DNA的原代细胞。
术语“药物组合物”是指生理学上可接受且药理学上可接受的组合物。在一些情况下,组合物包括用于储存缓冲和保存的试剂,并且可包括用于适合于递送的缓冲液和载体,这取决于施用途径。
术语“药学上可接受的载体”是指有助于向细胞、生物体或对象施用试剂(如,Cas核酸酶、经修饰的单链向导RNA、基因修饰的原代细胞等)的物质。“药学上可接受的载体”是指可包含在组合物或制剂中且对患者没有显著不良毒理学作用的载体或赋形剂。药学上可接受的载体的非限制性示例包括水、NaCl、生理盐水溶液、乳酸化林格氏液、正常蔗糖、正常葡萄糖、粘合剂、填充剂、崩解剂、润滑剂、涂层、甜味剂、调味剂和着色剂等。本领域技术人员将认识到在本发明中有用的其他药物载体。
术语“施用”或“给药”是指将本文公开的试剂、组合物、剂型和/或组合递送至对象用于治疗或预防目的的方法。本文公开的组合物、剂型和/或组合根据良好医学实践考虑对象的临床状况、施用部位和方法、剂量、对象年龄、性别、体重和医师已知的其他因素来施用。例如,术语“施用”或“给药”包括由临床医生或其他临床专业人员提供、给予、给药和/或开具本文公开的试剂、组合物、剂型和/或组合。
术语“治疗”是指获得有益或期望结果的方法,包括但不限于治疗益处和/或预防益处。治疗益处是指在治疗中对一种或多种疾病、病症或症状的任何治疗上相关的改善或作用。为了预防益处,可将组合物施用于处于发展特定疾病、病症或症状的风险中的对象,或施用于报告疾病的一种或多种生理症状的对象,即使该疾病、病症或症状可能尚未表现出来。
术语“对象”、“患者”和“个体”在本文中可互换地用于包括人或动物。例如,动物对象可以是哺乳动物,灵长类动物(如,猴),家畜动物(如,马、牛、绵羊、猪或山羊),伴生动物(如,狗、猫),实验室试验动物(如,小鼠、大鼠、豚鼠、鸟)、具有兽医学意义的动物、或具有经济学意义的动物。
除非另有定义,本文使用的所有技术和科学术语具有与本技术所属领域的普通技术人员通常理解的相同的含义。尽管本文描述了示例性方法、设备和材料,但是与本文明确描述的那些方法和材料类似或等同的任何方法和材料都可用于本技术的实践或测试。例如,本文所述的试剂仅是示例性的,并且这些试剂的等同物是本领域已知的。除非另有说明,本技术的实践可采用本领域技术人员所熟知的组织培养、免疫学、分子生物学、微生物学、细胞生物学和重组DNA的常规技术。参见,例如,Sambrook and Russell eds.(2001)Molecular Cloning:A Laboratory Manual,3rd edition;the series Ausubel etal.eds.(2007)Current Protocols in Molecular Biology;the series Methods inEnzymology(Academic Press,Inc.,N.Y.);MacPherson et al.(1991)PCR I:A PracticalApproach(IRL Press at Oxford University Press);MacPherson etal.(1995)PCR 2:APractical Approach;Harlow and Lane eds.(1999)Antibodies,A Laboratory Manual;Freshney(2005)Culture of Animal Cells:A Manual of Basic Technique,5thedition;Miller and Calos eds.(1987)Gene Transfer Vectors for Mammalian Cells(Cold Spring Harbor Laboratory);以及Makrides ed.(2003)Gene Transfer andExpression in Mammalian Cells(Cold Spring Harbor Laboratory)。
描述
如已在本发明背景部分中所指出的,在过去的几年里,基因编辑因可精确地校正遗传突变已成为用于血细胞疾病的有前景的基因治疗方法。RNP与用于递送供体模板的腺相关病毒(AAV)一起使用,正在靠近基因编辑领域进行各种疾病的治疗(Dever,Bak etal.2016,Bak,Dever et al.2018,Charlesworth,Camarena et al.2018,Pavel-Dinu,Wiebking et al.2019)。在这种意义上,我们已经建立了这种校正PKD的方法,并且发现最高达40%的人造血祖细胞已利用治疗性RPK(R-型丙酮酸激酶)基因座通过组合特异性RNP和AAV进行了基因编辑。这些结果表明,临床上使用基因编辑治疗来校正PKD是可能的,然而,这种待临床应用的新的基因编辑技术最关注的问题是由RNP引起的脱靶效应。尽管使用高保真Cas9已经降低了脱靶活性,但是仍然需要在使用基因编辑治疗患者之前显著降低脱靶效应。
为此,为了避免脱靶效应,双链断裂(DSB)应尽可能位于靠近将要整合外源DNA的位置。sgRNA,特别是crRNA决定该位置。在这个意义上,需要仔细选择sgRNA,特别是crRNA,以最大化在靶切割并最小化脱靶效应。同源臂应在DSB的位点周围。它们需要根据所选择的sgRNA来设计,以维持功能并避免额外的序列变化。
在本发明中,使用可用于该目的的不同网络工具来设计在感兴趣的基因组位点中引入DSB的不同单链向导RNA(参见实施例1)。测试所获得的不同crRNA(SEQ ID NO.:1至10)形成DSB的效力,并通过Surveyor法、TIDE和/或GUIDE-Seq和rhAmp-Seq进行评估。结果表明,所选择的crRNA仅有一种在K562细胞的在靶位点产生了非常高频率的indel,在人CB-CD34+细胞的在靶位点产生了非常高频率的indel,尽管这种特异性crRNA在HEK293-Cas9细胞和Jurkat细胞中转染时显示几个脱靶,但是使用HiFi-Cas9 RNP时,这些几乎被忽略。这种crRNA对应于SEQ ID NO.:1(作为DNA)或SEQ ID NO.:11(作为RNA)的crRNA SG1。值得注意的是,这种crRNA(SG1)是由于在选择RPK转录物变体的正确ATG起始密码子时的错误,如实施例1所示。在这个意义上,与所测试的不同crRNA相比,这种crRNA SG1显示明显改善的效果的事实是令人惊讶的。事实上,与位于RPK起始密码子上游30bp的隐性ATG周围鉴定的不同crRNA相比,以及与在隐性ATG和正确ATG RPK起始位点之间为校正先前提及的设计失误或错误而设计的那些(SG5至SG8)相比,这种crRNA SG1显示明显改善的效果,因为为了避免脱靶效应,双链断裂(DSB)应尽可能位于靠近将要整合外源DNA的位置。基于这些结果,我们在此提出使用SEQ ID NO.:1或SEQ ID NO.:11的crRNA来提供用于校正PKD的基因编辑疗法的新的RNP复合物,从而消除或减少由RNP引起的脱靶效应。
在这种意义上,与其他方法相反,本文提供的RNP复合物显著降低了脱靶效应的百分比。总之,本发明提供了这样的证据:RNP复合物与用于递送本发明的coRPK供体序列的腺相关病毒(AAV)一起,特别适合作为离体有效的基因组编辑工具,其能够在许多不同的细胞类型中实现基因校正,提供了开发用于丙酮酸激酶缺乏症(PKD)的不同细胞疗法的来源。
因此,本发明的第一方面,提供了一种经修饰的crRNA,其包含SEQ ID NO.:1或11或者由SEQ ID NO.:1或11组成。在其他情况下,本发明的经修饰的crRNA为SEQ ID NO.:1或SEQ ID NO.:11的变体,所述变体具有与SEQ ID NO.:1或SEQ ID NO.:11至少80%、85%、90%或95%的序列同一性,例如具有与SEQ ID NO.:1或SEQ ID NO.:11 95%、96%、97%、98%、99%或100%的序列同一性。(下文中SEQ ID NO.:1、SEQ ID NO.:11及其任何变体将被称为本发明的经修饰的crRNA)。
优选地,本发明的经修饰的crRNA与tracrRNA核苷酸序列或接头相关联或相结合,所述接头与CRISPR相关蛋白(Cas)多肽相互作用(在此指出,与tracrRNA相关联的本发明的经修饰的crRNA应被称为本发明的经修饰的单链向导RNA(sgRNA))。优选地,本发明的经修饰的sgRNA包含以下或由以下组成:SEQ ID NO.:12或SEQ ID NO.:12的变体,所述变体具有与SEQ ID NO.:12至少80%、85%、90%或95%的序列同一性,例如,具有与SEQ ID NO.:1295%、96%、97%、98%、99%或100%的序列同一性。
本发明的第二方面涉及一种核糖核蛋白(RNP),其包含本发明的经修饰的crRNA或sgRNA和CRISPR相关蛋白(CAS)多肽。例如,经修饰的sgRNA和Cas多肽可在容器中混合形成本发明的RNP复合物,然后将RNP复合物引入原代细胞。
在其他实施方案中,本发明涉及包含编码Cas多肽的mRNA和本发明的经修饰的sgRNA的“全RNA”CRISPR系统。
本发明的第三方面涉及一种包含coRPK cDNA序列的载体,所述coRPK cDNA序列包括同源臂(LHA和RHA)、coRPK序列以及用于真核细胞中蛋白表达的特化终止序列,例如bGHpoly(A)序列;其中优选地,LHA为SEQ ID NO.:13,RHA为SEQ ID NO.:14,coRPK序列为SEQID NO.:16,以及bGH poly(A)序列为SEQ ID NO.:18。优选地,本发明的coRPK序列包含以下或由以下组成:SEQ ID NO.:16或SEQ ID NO.:16的变体,所述变体具有与SEQ ID NO.:16至少80%、85%、90%或95%的序列同一性,例如,具有与SEQ ID NO.:16 95%、96%、97%、98%、99%或100%的序列同一性。优选地,本发明的LHA序列包含以下或由以下组成:SEQID NO.:13或SEQ ID NO.:13的变体,所述变体具有与SEQ ID NO.:13至少80%、85%、90%或95%的序列同一性,例如,具有与SEQ ID NO.:13 95%、96%、97%、98%、99%或100%的序列同一性。优选地,本发明的RHA序列包含以下或由以下组成:SEQ ID NO.:14或SEQ IDNO.:14的变体,所述变体具有与SEQ ID NO.:14至少80%、85%、90%或95%的序列同一性,例如,具有与SEQ ID NO.:14 95%、96%、97%、98%、99%或100%的序列同一性。优选地,本发明的bGH poly(A)序列包含以下或由以下组成:SEQ ID NO.:18或SEQ ID NO.:18的变体,所述变体具有与SEQ ID NO.:18至少80%、85%、90%或95%的序列同一性,例如,具有与SEQ ID NO.:18 95%、96%、97%、98%、99%或100%的序列同一性。
在某些情况下,包含本发明的coRPK cDNA序列的载体还包含5’UTR序列,其中优选地,该序列是SEQ ID NO.:15。更优选地,包含coRPK cDNA序列的所述载体包含以下或由以下组成:SEQ ID NO.:15或SEQ ID NO.:15的变体,所述变体具有与SEQ ID NO.:15至少80%、85%、90%或95%的序列同一性,例如,具有与SEQ ID NO.:15 95%、96%、97%、98%、99%或100%的序列同一性。
在其他示例中,包含coRPK cDNA的载体包含以下或由以下组成:SEQ ID NO.:19至22中的任一个或SEQ ID NO.:19至22的变体,所述变体具有与SEQ ID NO.:19至22中的任一个至少95%的序列同一性,例如,具有与SEQ ID NO.:19至22中的任一个95%、96%、97%、98%、99%或100%的序列同一性。
本发明的第四方面涉及包括本发明的RNP复合物或本发明的全RNA CRISPR系统和腺相关病毒颗粒或同源供体AAV的系统,所述腺相关病毒颗粒或同源供体AAV可递送用于在靶细胞(如原代细胞)中经由同源定向修复进行基于CRISPR的基因编辑的重组供体模板。在某些情况下,所述腺相关病毒或同源供体AAV骨架(如(AAV-6)或(AAV-1)或任何其他可能的AAV血清型或血清型嵌合体)具有与AAV骨架至少约90%的序列同一性。值得注意的是,在本发明中,将AAV骨架理解为不包含本发明的用于在靶细胞中经由同源定向修复进行基于CRISPR的基因编辑的重组供体模板的腺相关病毒颗粒或同源供体AAV。在其他情况下,AAV骨架是野生型AAV6或AAV6变体,所述变体具有与SEQ ID NO.:23至少95%的序列同一性,例如,具有与SEQ ID NO.:23 95%、96%、97%、98%、99%或100%的序列同一性。在一些实施方案中,编码AAV骨架(如(AAV-6)或(AAV-1)或任何其他可能的AAV血清型或血清型嵌合体)载体的一种或多种不同组件的多核苷酸可操作地连接到诱导型启动子、阻抑型启动子或组成型启动子。此外,可操作地连接到组件的调控序列可包括激活因子结合序列、增强子、内含子、聚腺苷化识别序列、启动子、阻抑因子结合序列、茎环结构、翻译起始序列、翻译前导序列、转录终止序列、翻译终止序列、引物结合位点等。常用的启动子是组成型哺乳动物启动子CMV、EF1a、SV40、PGKl(小鼠或人)、Ubc、CAG、CaMKIla和beta-Act,以及本领域已知的其他启动子(Khan,K.H.(2013)"Gene Expression in Mammalian Cells and itsApplications,"Advanced Pharmaceutical Bulletin 3(2),257-263)。此外,可使用哺乳动物RNA聚合酶III启动子,包括H1和U6。
在一些实施方案中,所述腺相关病毒颗粒或同源供体包括AAV骨架和待递送至原代细胞的本发明的coRPK cDNA序列。更优选地,腺相关病毒颗粒或同源供体AAV包括SEQ IDNO.:19至22中的任一个或SEQ ID NO.:19至22的变体,所述变体具有与SEQ ID NO.:19至22中的任一个至少95%的序列同一性,例如,具有与SEQ ID NO.:19至22中的任一个95%、96%、97%、98%、99%或100%的序列同一性。
更优选地,包括载体的腺相关病毒颗粒或同源供体AAV相应地包括选自以下的本发明的coRPK cDNA序列:SEQ ID NO.:24至27中的任一个或SEQ ID NO.:24至27的变体,所述变体具有与SEQ ID NO.:24至27中的任一个至少95%的序列同一性,例如,具有与SEQ IDNO.:24至27中的任一个95%、96%、97%、98%、99%或100%的序列同一性。
此外,在本发明的第五方面,在此提供了一种用于在原代细胞中诱导稳定的基因修饰的方法,所述原代细胞包含含有PKLR基因的靶核酸,所述靶核酸相应地包含PKLR基因中的一个或多个突变以及在所述原代细胞中通过同源重组与SEQ ID NO.:1或11互补的核苷酸序列,所述原代细胞优选造血干细胞和祖细胞(HSPC)、或胚胎干细胞(ESC)或诱导多能干细胞(iPSC),或可分化为HSPC或红细胞的任何其他细胞类型,其中所述方法包括:
(A)将组合物引入原代细胞中,所述组合物包含与本发明的CRISPR相关蛋白(Cas)多肽相关联的本发明的经修饰的crRNA或sgRNA或“全RNA”CRISPR系统;并且同时或顺序
(b)将腺相关病毒颗粒或同源供体AAV引入原代细胞中,所述腺相关病毒颗粒或同源供体AAV包含对应于靶核酸的本发明的coRPK cDNA序列以经历同源重组;
其中,靶核酸的稳定基因修饰包括通过引入包含校正供体模板的同源供体AAV(如(AAV-6)或(AAV-1)或任何其他可能的AAV血清型或血清型嵌合体)载体来补偿PKLR基因(靶核酸)的致病突变。
进行以上所述的原代细胞(优选造血干细胞和祖细胞(HSPC)、或胚胎干细胞(ESC)或诱导多能干细胞(iPSC)、或可分化为HSPC或红系细胞的任何其他细胞类型)中的基因修饰策略,其目的是治疗罹患或患有丙酮酸激酶缺乏症(PKD)的对象。值得注意的是,丙酮酸激酶缺乏症(PKD)是由PKLR基因突变引起的遗传性常染色体隐性遗传病,是组成慢性非球形红细胞溶血性贫血的主要病因。据估计,全世界每20,000人中就有一人患有PKD,其中有约17%的人尚未得到治愈性治疗。PKLR基因编码红细胞中无氧糖酵解的最后一步所涉及的红系丙酮酸激酶蛋白(RPK)。这些致PKD突变导致RPK活性完全或部分降低,随后ATP水平降低,这有利于RBC溶血和随之而来的贫血。当蛋白活性降低至红细胞中正常活性的25%以下时,该疾病就具有临床相关性。
因此,在本发明第五方面的进一步实施方案中,同源供体AAV包含coRPK cDNA序列,如SEQ ID NO.:16,更优选地,所述供体模板包括coRPK cDNA序列和靶核酸的两个同源部分,如SEQ ID NO.:13和14。
在一些实施方案中,原代细胞选自原代HSPC,或胚胎干细胞(ESC),或诱导多能干细胞(iPSC),或可分化为HSPC或红系细胞的任何其他细胞类型,以及它们的任何组合。在一些实施方案中,将与本发明的CRISPR相关蛋白(Cas)多肽相关的本发明的经修饰的crRNA或sgRNA或“全RNA”CRISPR系统以及同源供体AAV载体引入原代细胞之前,从哺乳动物分离出原代细胞。例如,原代细胞可从人对象获得。在某些情况下,在将与本发明的CRISPR相关蛋白(Cas)多肽相关的本发明的经修饰的crRNA或sgRNA或“全RNA”CRISPR系统以及同源供体AAV载体引入原代细胞后,将原代细胞或其后代返回哺乳动物中。换句话说,转基因原代细胞经历自体移植。在其他情况下,转基因细胞经历同种异体移植。例如,从供体对象中分离出经历不稳定基因修饰的细胞,然后将转基因供体细胞移植到与供体对象不同的受体对象中。
原代细胞可包括原代细胞群。在某些情况下,原代细胞群包括原代细胞的异质群。在其他情况下,原代细胞群包括原代细胞的同质群。
在其他情况下,同源供体AAV骨架(如(AAV-6)或(AAV-1))具有与AAV骨架至少约90%的序列同一性。在其他情况下,同源供体AAV骨架是野生型AAV6或AAV6骨架变体,所述变体具有与SEQ ID NO.:23至少95%的序列同一性,例如,具有与SEQ ID NO.:23 95%、96%、97%、98%、99%或100%的序列同一性。在一些实施方案中,编码AAV骨架(如(AAV-6)或(AAV-1))载体的各种组件中的一种或多种的多核苷酸可操作地连接到诱导型启动子、阻抑型启动子或组成型启动子。此外,可操作地连接到组件的调控序列可包括激活因子结合序列、增强子、内含子、聚腺苷化识别序列、启动子、阻抑因子结合序列、茎环结构、翻译起始序列、翻译前导序列、转录终止序列、翻译终止序列、引物结合位点等。常用的启动子是组成型哺乳动物启动子CMV、EF1a、SV40、PGKl(小鼠或人)、Ubc、CAG、CaMKIla和beta-Act,以及本领域已知的其他启动子(Khan,K.H.(2013)"Gene Expression in Mammalian Cells andits Applications,"Advanced Pharmaceutical Bulletin 3(2),257-263)。此外,可使用哺乳动物RNA聚合酶III启动子,包括HI和U6。
在一些实施方案中,同源供体AAV骨架能够优先引导核酸在特定细胞类型中的表达(如,使用组织特异性调控元件来表达多核苷酸)。组织特异性调控元件是本领域已知的,包括但不限于白蛋白启动子、淋巴特异性启动子、神经元特异性启动子(如神经丝启动子)、胰腺特异性启动子、乳腺特异性启动子(如乳清蛋白启动子),特别是T细胞受体和免疫球蛋白的启动子。还包括发育调控启动子,如鼠hox启动子和甲胎蛋白启动子。
将AAV如(AAV-6)或(AAV-1)表达载体引入宿主细胞的方法是本领域已知的,并且通常基于宿主细胞的种类来选择。
在一些实施方案中,在大于约30%的原代细胞群中诱导靶核酸的稳定基因修饰,例如,在约35%、约40%、约50%、约60%、约70%、约71%、约72%、约73%、约74%、约75%、约76%、约77%、约78%、约79%,约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或约100%的原代细胞群中诱导靶核酸的稳定基因修饰。在另一些实施方案中,在大于约80%的原代细胞群中诱导靶核酸的稳定基因修饰,例如,在约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%,约93%、约94%、约95%、约96%、约97%、约98%、约99%或约100%的原代细胞群中诱导靶核酸的稳定基因修饰。在又一些实施方案中,在大于约90%的原代细胞群中诱导靶核酸的稳定基因修饰,例如,在约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%、或约100%的原代细胞群中诱导靶核酸的稳定基因修饰。
在一些实施方案中,本发明第五方面的序列可包含经修饰的核苷酸,如核糖基团、磷酸基团、核碱基或其组合中的修饰。在某些情况下,核糖基团中的修饰包括核糖基团的2’位处的修饰。在一些情况下,核糖基团的2’位处的修饰选自2’-O-甲基、2’-氟、2’-脱氧、2’-O-(2-甲氧乙基)及其组合。在另一些情况下,磷酸基团中的修饰包含硫代磷酸修饰。在另一些实施方案中,经修饰的核苷酸选自2’-O-甲基(M)核苷酸,2’-O-甲基3’-硫代磷酸(MS)核苷酸,2’-O-甲基3’-硫代PACE(MSP)核苷酸及其组合。
优选地,对于本发明的所有方面和实施方案,Cas多肽为Cas9多肽或高保真或增强特异性的Cas9多肽变体。在某些实施方案中,将本发明的经修饰的sgRNA和Cas多肽同时引入原代细胞。在另一些实施方案中,将经修饰的sgRNA和Cas多肽顺序引入原代细胞。在某些情况下,首先引入经修饰的sgRNA,然后引入Cas多肽。在另一些情况下,首先引入Cas多肽,然后引入本发明的经修饰的sgRNA。
在一些实施方案中,本文所述的Cas多肽可以是编码Cas多肽的mRNA,将该CasmRNA与本发明的经修饰的gRNA一起作为“全RNA”CRISPR系统引入原代细胞中。在某些情况下,将本发明的经修饰的gRNA和Cas mRNA同时引入原代细胞中。在另一些情况下,将经修饰的gRNA和Cas mRNA顺序引入原代细胞中。在一些情况下,首先引入本发明的经修饰的gRNA,然后引入Cas mRNA。在另一些情况下,首先引入Cas mRNA,然后引入本发明的经修饰的gRNA。
在一些实施方案中,将RNP复合物和同源供体AAV(如,(AAV-6)或(AAV-1))载体同时引入原代细胞中。在另一些实施方案中,将RNP复合物和同源供体AAV载体顺序引入原代细胞中。在一些情况下,在同源供体AAV载体之前将RNP复合物引入原代细胞中。在另一些情况下,在RNP复合物之前将同源供体AAV载体引入原代细胞中。例如,可在同源供体AAV载体之前约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、90、120、150、180、210或240分钟或更长时间将RNP复合物引入原代细胞中,反之亦然。在具体实施方案中,在同源供体AAV载体之前约15分钟(如,约10至约20分钟)将RNP复合物引入原代细胞中。
在一些实施方案中,将“全RNA”CRISPR系统和同源供体AAV载体同时引入原代细胞中。在另一些实施方案中,将“全RNA”CRISPR系统和同源供体AAV载体顺序引入原代细胞中。在一些情况下,在同源供体AAV载体之前将“全RNA”CRISPR系统引入原代细胞中。在另一些情况下,在“全RNA”CRISPR系统之前将同源供体AAV载体引入原代细胞中。例如,在同源供体AAV载体之前约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、90、120、150、180、210或240分钟或更长时间将“全RNA”CRISPR系统引入原代细胞中,反之亦然。在特定实施方案中,在同源供体AAV载体之前约15分钟(如,约10至约20分钟)将“全RNA”CRISPR系统引入原代细胞中。
在一些实施方案中,本文所述的任何方法也可包括使用标志物来纯化具有靶核酸的稳定基因修饰的原代细胞。在一些情况下,通过纯化步骤分离的组合物包括至少约80%的具有靶核酸的稳定基因修饰的原代细胞,如约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、93%、约94%、约95%、约96%、约97%、约98%、约99%或更多的具有靶核酸的稳定基因修饰的原代细胞。
在一些实施方案中,将本发明的经修饰的gRNA和Cas多肽引入原代细胞的步骤包括将经修饰的gRNA和Cas多肽电穿孔至原代细胞中。在一些实施方案中,将同源供体AAV(如(AAV-6)或(AAV-1))载体引入原代细胞的步骤包括转导原代细胞。
在另一些方面,本文提供了通过本文所述的任何方法产生的经基因修饰的原代细胞。在一些实施方案中,经基因修饰的原代细胞选自HSPC,或胚胎干细胞(ESC),或诱导多能干细胞(iPSC),或可分化为HSPC或红系细胞的任何其它细胞类型,或其任何组合。
在又一些方面,本文提供了药物组合物,其包含本文所述的任何经基因修饰的原代细胞和药学上可接受的载体。在另一些实施方案中,药物组合物包含一种类型的经基因修饰的原代细胞。在又一些实施方案中,药物组合物包含两种或更多种不同类型的经基因修饰的原代细胞,例如2、3、4、5、6、7、8、9、10种或更多种不同类型的经基因修饰的原代细胞。
在进一步的方面,本文提供了试剂盒的体外应用,所述试剂盒包括(a)与本发明的CRISPR相关蛋白(Cas)多肽相关的本发明的经修饰的crRNA或sgRNA或“全RNA”CRISPR系统;和/或(b)包含对应于靶核酸的本发明的coRPK cDNA序列以经历同源重组的腺相关病毒颗粒或同源供体AAV。
在某些情况下,试剂盒还包括用于从对象采集或分离原代细胞的试剂。对象可以是哺乳动物对象,例如人类对象。
在更进一步的方面,本文提供了预防或治疗有需要的对象的PKD的方法,所述方法包括向所述对象施用本文所述的任何经基因修饰的原代细胞或本文所述的任何药物组合物,以预防所述疾病或改善所述疾病的一种或多种症状。
在一些实施方案中,施用步骤包括选自静脉内、腹膜内、骨内或其组合的递送途径。
在特定实施方案中,本发明的经基因修饰的原代细胞或药物组合物以足够的量向对象施用,以校正与疾病相关的靶核酸中的突变。在某些情况下,通过用野生型等位基因替换靶核酸中的突变等位基因来校正突变。
通过阅读随后参考以下示意图和所附权利要求书进行的详细描述,本发明的其他目的和优点对于本领域的技术人员而言将是显而易见的。
因此,本申请人在此已显示了CRISPR系统明确修复PKD突变的用途。申请人靶向突变位点周围的位点。使用CRISPR/Cas9系统对PKD的疾病突变进行DNA修复代表了一种新颖的治疗方法。本发明提供了利用工程化核酸酶在DNA水平作用使致病突变失活或修复的可能性。
以下实施例仅仅是说明性的,并不限制本发明的范围。
实施例
本实施例旨在举例说明合并以下程序的不同元件:在造血细胞因子存在下需要离体扩增HSPC 16、24或48小时,并且i)引入产生PKLR基因的RPK转录物变体的转录起始位点上游的DNA的双链断裂(DSB)的系统,如CRISPR/Cas9系统,和ii)引入包含两侧有同源臂(左[LHA]和右[RHA])的coRPK cDNA的供体基体。LHA和RHA与将要插入外源序列的基因组序列相同。本文所用的coRPK cDNA前面是部分5’UTR RPK序列,以在内源性调控下表达治疗性盒。CRISPR/Cas9应通过电穿孔引入,以有利于DNA核酸酶进入细胞核,并且供体基体应通过腺相关病毒载体血清型6(AAV-coRPK)引入。为了组装核糖核蛋白(RNP),将Cas9蛋白与sgRNA组合。为了将RNP核转染至细胞,使用电穿孔装置。细胞先进行预刺激,然后重悬于电穿孔溶液中。将RNP复合物添加到细胞悬浮液中并使细胞电穿孔。在电脉冲之后,将HSPC于37℃温育10分钟。然后,加入预热的培养基,并将细胞转移至培养板。用不同浓度的相应AAV立即转导经核转染的细胞。
因此,细胞(造血干细胞(HSC))获自患者,在体外操作,冷冻,并且一旦产物经表征且证实是正确的,就将细胞解冻并输注至先前已经用化疗调节的患者中,以允许输注的校正细胞的移植。
实施例1.本发明的CRISPR/Cas9系统的设计
sgRNA:
1.sgRNA设计
按照先前报道,应设计在基因的起始处引入DSB并促进敲入整合的sgRNA,使其尽可能靠近基因的RPK转录物变体的起始密码子。crRNA的设计使用可用于该目的的不同网络工具进行,例如Dr.Zhang的实验室工具(https://zlab.bio/guide-design-resources)或IDT的工具(https://eu.idtdna.com/site/order/designtool/index/CRISPR_SEQUENCE)。由于在选择RPK转录物变体的合适ATG起始密码子时的错误,在位于RPK起始密码子上游30bp的隐性ATG周围鉴定出不同的crRNA。首先设计的crRNA为SG1至SG4。另外,在隐性ATG和合适ATG RPK起始位点之间为校正前面提到的设计失误或错误而设计了更多的crRNA(SG5至SG8),因为为了避免脱靶效应,双链断裂(DSB)应位于尽可能靠近将要整合外源DNA的位置。
表1:所设计和分析的不同crRNA(作为DNA)
2.sgRNA效力和安全性
通过Surveyor法、TIDE和/或GUIDE-Seq和rhAmp-Seq评估表1中不同的10种sgRNA(SEQ ID NO.:1至10)形成DSB的效力。
对于Surveyor法,纯化基因组DNA并进行PCR以扩增RPK转录物变体起始密码子周围的区域。然后,根据制造商的说明,用Surveyor核酸酶S消化PCR产物,并通过10% NovexTBE凝胶分离来评估经消化的产物。分析凝胶图像,以便通过测量不同条带的密度测定值来测量裂解。
另外,在人CB-CD34+细胞中通过TIDE法分析SG1、SG3、SG5、SG6和SG8的Indel频率。纯化基因组DNA,并进行PCR以扩增PKLR基因的RPK转录物变体的起始密码子周围的区域。然后,对PCR产物进行Sanger测序。未编辑的细胞总是用作用TIDE计算Indel频率的阴性对照。最后,通过使用TIDE软件(https://tide.deskgen.com/)计算Indel频率来评估所设计向导的活性。
此外,在选择其中一种进行临床应用之前,按照目前最严格的标准GUIDE-seq和rhAmpSeq分析三种最有前景的sgRNA(SG1、SG2和SG3)以及新设计的sgRNA(SG4、SG9和SG10)的脱靶活性。首先,在组成型表达WT-Cas9的HEK293T细胞系中进行GUIDE-seq分析,以广泛地鉴定考虑体内基因组环境的脱靶。用不同的sgRNA转染细胞。5天后,收集细胞,并分离基因组DNA。利用IDT内部向导分析工具使用GUIDE-seq-tag确定脱靶位点,其中还观察到脱靶位点出现于>1%的读长中。鉴定这些sgRNA的体内脱靶,并计算在全局基因编辑中表示的在靶修饰(表3)。然而,在用RNP形式的SG1电穿孔的Jurkat细胞中进行相同的GUIDE-seq分析时,脱靶的数目明显减少(图4)。此外,在RNP复合物中使用HiFi-Cas9缩小了SG1的脱靶效应。为了定量GUIDE-Seq所揭示的位点处的在靶和脱靶活性,通过rhAmpSeq测量在靶和脱靶indel频率,该测定有助于更准确地定量分析SG1在细胞和基因组环境中的基因编辑。CB-CD34+细胞使用与WT-Cas9或HiFi-Cas9复合形成RNP复合物的SG1或SG9或SG10进行编辑,显示降低的脱靶贡献(表3)。另外,在一些样品中加入特异性ssODN HDR模板以确定每种sgRNA介导HDR的能力。用rhAmpSeq池扩增来自GUIDE-seq实验的最高命中(1个在靶位点ON和48个脱靶位点OT)。然后,文库在MiSeq系统上运行,并用内部分析工具进行分析。通过将NHEJ的百分比与不完全HDR的百分比和完全HDR的百分比相加来计算切割位点处的编辑水平。如图5所示,证实SG1在在靶位点处具有最大的基因编辑活性。此外,当使用HiFi-Cas9形成RNP复合物时,完全HDR的频率无变化。因此,在SG1 RNP复合物中使用HiFi-Cas9不会妨碍靶位点处的HDR。另外,分析了hCD34+中SG1 RNP的脱靶作用(图6)。在SG1 RNP中使用HiFi-Cas9将所有的脱靶修饰降低至0.1以下,这是该技术的检测极限。因此,hCD34+细胞用SG1 HiFi-Cas9 RNP复合物进行基因编辑保持了在靶位点处高水平的修饰而不改变HDR,并将脱靶效应降低至不可检测的水平。
2.1.surveyor法
除了下表2之外,Surveyor法提供的结果示于图2中。
表2:通过Surveyor法分析人细胞系K562中的SG1、SG2、SG3和SG4的Indel定量
Surveyor法的结果:
SG1(SEQ ID NO.:1)在K562细胞中的在靶位点处产生最高频率的indel。
2.2.TIDE法
TIDE法提供的结果示于图3中。
TIDE法的结果:
SG1(SEQ ID NO.:1)在人CB-CD34+细胞中的在靶位点处产生最高频率的indel。
2.3.GUIDE-Seq和rhAmp-Seq
-鉴定体内脱靶:在组成型表达WT-Cas9(HEK293-Cas9)的HEK293细胞系中进行GUIDE-Seq分析以强制鉴定体内脱靶。
表3:在用每种sgRNA转染并用GUIDE-Seq分析的HEK293-Cas9中获得的SG1、SG2、SG3、SG4、SG9和SG10的脱靶数目和在靶百分比
结果:
在HEK293-Cas9中转染时,SG1(SEQ ID NO.:1)显示几个脱靶。核糖核蛋白(RNP)形式的PKLR SG1 ATG的安全性结果示于图4和图6。当使用HiFi Cas9-RNP时,hCD34+中SG1的脱靶效应降低至0.1%以下。
3.通过rhAmp-Seq定量HDR的在靶修饰和频率
结果如图5所示,其中使用SG1时,在CB-CD34+中,在靶频率最高。此外,使用HiFiCas9-RNP时,SG1的HDR高频率没有受损。
SEQ ID NO.:1:前间隔序列SG1序列
CTGCGGGACCATGGAATGAG
SEQ ID NO.:11:crRNA SG1序列(作为RNA)
CUGCGGGACCAUGGAAUGAG
SEQ ID NO.:12:sgRNA SG1序列(作为RNA)
CUGCGGGACCAUGGAAUGAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAUAAGGCUAGUCCG
实施例2.CoRPK-AAV的设计
一旦选择了最有效且最安全的sgRNA(其明显是实验失误或错误的产物),设计了coRPK-AAV。如以下部分所述,coRPK-AAV由围绕SG1在靶位点、ATG(5’UTR)的上游序列、coRPK cDNA、FLAG-Tag和牛生长激素聚腺苷酸化(bgh-polyA)信号的两个同源臂(左同源臂或LHA和右同源臂或RHA)形成,如图7和图8所示。设计coRPK-AAV考虑了SG1切割位点,其位于RPK起始密码子上游38bp处。两个同源臂选自围绕SG1切割位点的序列。LHA覆盖RPK起始密码子上游463bp至39bp的基因组区域(总大小425bp)。RHA覆盖RPK起始密码子上游30bp至RPK起始密码子下游395bp的区域(总大小425bp)。在与LHA和RHA同源的基因组区域之间,存在SG1靶序列的8bp区域,包括SG1切割位点。一旦发生同源直接修复,认为两个同源臂之间的该8bp缺口防止SG1的再切割。另一方面,将覆盖37bp上游至RPK起始密码子的序列(其部分是RPK转录物变体的Kozac序列)克隆到coRPK-AAV中不含ATG和终止密码子的coRPK cDNA的5’处。注意,在LHA和5’UTR之间存在1bp的缺口,对应于SG1切割位点,以降低一旦发生HDR治疗性盒就被SG1切割的风险。
1.LHA(左同源臂)(SEQ ID NO.:13)
如图9所示,LHA覆盖SG1切割位点上游的425bp。
CAGAGTGGTGAAGGCACTCTGCATTTCTTGGTTGAGACAGAGAAAAAAAGTGGTCAGAACTGGGTAACCCTCCCCCCACCATATTATCACAGTGATCCCTTTTGTCTTTCTTCAGGCTCCAGCCCCACCCTACAGCCCCTGCTCCCTGGATTCACTAGAGCTAACTTCAGTAAAGTACAAAGAAAATGGGGCCATATGACTGGCCAAAAAAAAAATATCTATTCACGTGGATGACCAGATAGTATGAATGGATTGAAAATTTATCAGGAAAAAAGGATGAGAGGAAATGCCAGGAGATGAGGGCAGAGAGCAGGCCGTTCTGGGGGAGGGATTCTGTGGGGACAGGGTGGCCTACTGGGTGTGCCCCTTTTCTCTTCTCTGTCTCCCTTAGATAAGACCAGCAGTTTTGTCATCCTCTCCCTCTC
2.RHA(右同源臂)(SEQ ID NO.:14)
如图10所示,RHA覆盖远离SG1 PAM序列11bp开始的425bp。
GTCCCGCAGCCCCAGGCCCACACTGAAAGCATGTCGATCCAGGAGAACATATCATCCCTGCAGCTTCGGTCATGGGTCTCTAAGTCCCAAAGAGACTTAGCAAAGTCCATCCTGATTGGGGCTCCAGGAGGTAAGAAGGGGAGACAGAAGCCATGGAACATAGGAGGAAAATGAGGGTGAAAACTAGGAGCCAGGGTGGAGGGCATAAATGATCCACATCAGCCACTGGCTAGGTGGGTTTTGGAGAGGAACGTACGTTCTTCAGAGCCTCCCGTGTGTTAAATTATGGACCCTGGCCTGGGTCTTTTCCAGGCCCTATAGGCAGGCCAGAGCCACAGCATGTAAGCCACGGGGCACTCCCGTGGTTCCTGGACTCTGGCCCCTGGCATACAGGGCTTCCAATGGAACAGGAGACAGTGGTGACA
3.5’UTR序列(SEQ ID NO.:15)
将含有SG1前间隔序列第4个nt至RPK起始密码子的40bp序列克隆到不含起始密码子和终止密码子的下游coRPK cDNA。除了起始密码子外,该序列还提供了最适合的与WTRPK相似的coRPK红系表达的5’UTR,因为RPK转录物变体的Kozac序列是该序列的一部分。
注意:LHA与5’UTR之间存在1bp的缺口,以防止基因编辑校正后被SG1再切割,因为SG1前间隔序列在基因编辑之后未完全重建。
TTCCATGGTCCCGCAGCCCCAGGCCCACACTGAAAGCATG
4.coRPK cDNA(SEQ ID NO.:16)
coRPK cDNA序列是LV coRPK(Garcia-Gomez et al.Mol Ther.2016)的修饰版本,经GeneArt密码子优化后获得。在此包括了以下改变:i)将其克隆为无起始密码子,以便利用PKLR内源性起始密码子,目的是使coRPK的表达受到内源性PKLR启动子和内源性调控序列的驱动;ii)将其克隆为无终止密码子,以便与FLAG-Tag融合。
AGCATCCAGGAAAATATCAGCTCTCTGCAGCTGCGGTCCTGGGTGTCCAAGAGCCAGAGAGACCTGGCCAAGAGCATCCTGATCGGAGCCCCTGGCGGACCAGCCGGATACCTGAGAAGGGCTAGCGTGGCCCAGCTGACCCAGGAACTGGGCACCGCCTTTTTCCAGCAGCAGCAGCTGCCAGCCGCCATGGCCGACACCTTTCTGGAACACCTGTGCCTGCTGGACATCGACTCTGAGCCCGTGGCCGCCAGAAGCACCAGCATCATTGCCACCATCGGCCCTGCCAGCAGAAGCGTGGAGCGGCTGAAAGAGATGATCAAGGCCGGCATGAATATCGCCCGGCTGAACTTCTCCCACGGCAGCCACGAGTACCACGCAGAGAGCATTGCCAACGTCCGGGAGGCCGTGGAGAGCTTTGCCGGCAGCCCCCTGAGCTACAGACCCGTGGCCATTGCCCTGGACACCAAGGGCCCCGAGATCAGAACAGGAATTCTGCAGGGAGGGCCTGAGAGCGAGGTGGAGCTGGTGAAGGGCAGCCAAGTGCTGGTGACCGTGGACCCCGCCTTCAGAACCAGAGGCAACGCCAACACAGTGTGGGTGGACTACCCCAACATCGTGCGGGTGGTGCCTGTGGGCGGCAGAATCTACATCGACGACGGCCTGATCAGCCTGGTGGTGCAGAAGATCGGACCTGAGGGCCTGGTGACCCAGGTCGAGAATGGCGGCGTGCTGGGCAGCAGAAAGGGCGTGAATCTGCCAGGCGCCCAGGTGGACCTGCCTGGCCTGTCTGAGCAGGACGTGAGAGACCTGAGATTTGGCGTGGAGCACGGCGTGGACATCGTGTTCGCCAGCTTCGTGCGGAAGGCCTCTGATGTGGCCGCCGTGAGAGCCGCTCTGGGCCCTGAAGGCCACGGCATCAAGATCATCAGCAAGATCGAGAACCACGAGGGCGTGAAGCGGTTCGACGAGATCCTGGAAGTGTCCGACGGCATCATGGTGGCCAGAGGCGACCTGGGCATCGAGATCCCCGCCGAGAAGGTGTTCCTGGCCCAGAAAATGATGATCGGACGGTGCAACCTGGCCGGCAAACCTGTGGTGTGCGCCACCCAGATGCTGGAAAGCATGATCACCAAGCCCAGACCCACCAGAGCCGAGACAAGCGACGTGGCCAACGCCGTGCTGGATGGCGCTGACTGCATCATGCTGTCCGGCGAGACAGCCAAGGGCAACTTCCCCGTGGAGGCCGTGAAGATGCAGCACGCCATTGCCAGAGAAGCCGAGGCCGCCGTGTACCACCGGCAGCTGTTCGAGGAACTGCGGAGAGCCGCCCCTCTGAGCAGAGATCCCACCGAAGTGACCGCCATCGGAGCCGTGGAAGCCGCCTTCAAGTGCTGCGCCGCTGCAATCATCGTGCTGACCACCACAGGCAGAAGCGCCCAGCTGCTGTCCAGATACAGACCCAGAGCCGCCGTGATCGCCGTGACAAGATCCGCCCAGGCCGCTAGACAGGTCCACCTGTGCAGAGGCGTGTTCCCCCTGCTGTACCGGGAGCCTCCCGAGGCCATCTGGGCCGACGACGTGGACAGACGGGTGCAGTTCGGCATCGAGAGCGGCAAGCTGCGGGGCTTCCTGAGAGTGGGCGACCTGGTGATCGTGGTGACAGGCTGGCGGCCTGGCAGCGGCTACACCAACATCATGAGGGTGCTGTCCATCAGC
5.FLAG-Tag(SEQ ID NO.:17)
该序列在利用源自健康供体的hCD34+细胞设置基因编辑条件时已添加在具有无终止密码子的coRPK框内来产生融合蛋白,以便跟踪基因编辑后的治疗性RPK蛋白,但推荐临床应用的coRPK-AAV中不存在FLAG-Taq,因为它对校正PKD没有任何功能性贡献。
GACTACAAAGACGATGACGATAAATGA
6.bGH poly(A)信号(SEQ ID NO.:18)
牛生长激素聚腺苷酸(bGH-polyA)信号是真核细胞中蛋白表达的特化终止序列。
CTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGG
7.LHA-5’UTR-coRPK-FLAG-bGHpoly(A)-RHA(SEQ ID NO.:19)
这是在设置实验期间设计用于通过SG1靶处的HDR来校正PKD的供体序列。它按照所提及的次序包括LHA(SEQ ID NO.:13,黑体)、5’UTR(SEQ ID NO.:15,斜体),无起始密码子和终止密码子的coRPK(SEQ ID NO.:16,加下划线),FLAG-Taq(SEQ ID NO.:17,粗体斜体),以及bGH poly(A)(SEQ ID NO.:18,粗体加下划线),RHA(SEQ ID NO.:14,粗体斜体)。这些元件的功能说明如下:
-同源臂介导coRPK盒在SG1靶位点处的插入
-5’UTR确保coRPK表达的正确调控
-coRPK是RPK转录物的密码子优化版本,其编码RPK蛋白以校正红系细胞中的PKD表型
-在利用源自健康供体的hCD34+细胞设置基因编辑条件时,添加FLAG-Taq以区分WT RPK蛋白和由coRPK编码的RPK,但在推荐临床应用的coRPK-AAV中不存在FLAG-Taq,因为它对PKD校正没有任何功能性贡献
-最后,bGH poly(A)信号促进coRPK-FLAG翻译成蛋白
8.LHA-5’UTR-coRPK-bGH poly(A)-RHA(SEQ ID NO.:20)
SEQ ID NO.:20是供体基体(SEQ ID NO.:19),其中已去除FLAG-Tag序列。
9.LHA-5’UTR-coRPK-bGHpoly(A)-RHA(SEQ ID NO.:21)
SEQ ID NO.:21是所述SEQ ID NO.:19的反向序列。
AAV中的coRPK治疗性供体序列从5’至3’为:右同源臂(粗体),bGH poly(A),FLAG-Tag(粗体斜体),无起始密码子的coRPK(加下划线),5’UTR(斜体)和左同源臂(粗体)。
10.LHA-5’UTR-coRPK-bGHpoly(A)-RHA(SEQ ID NO.:22)
SEQ ID NO.:22是所述SEQ ID NO.:20的反向序列。
AAV中的coRPK治疗性供体序列从5’至3’为:右同源臂(粗体),bGH poly(A),无起始密码子的coRPK(加下划线),5’UTR(斜体)和左同源臂(粗体)。
11.AAV骨架(SEQ ID NO.:23)
使用来自含有AAV2 ITR(内部末端重复序列)的pAAV-MCS质粒(AgilentTechnologies)的携带ITR的转移质粒。将反向LHA-5’UTR-coRPK-FLAG-bGH poly(A)-RHA(SEQ ID NO.:20)通过NotI限制位点克隆来克隆到AAV骨架中。
CCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGCGGCCGCAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGGGGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATACGTCAAAGCAACCATAGTACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTTGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGGCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGTTTACAATTTTATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCTTGTCTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCTCCGGGAGCTGCATGTGTCAGAGGTTTTCACCGTCATCACCGAAACGCGCGAGACGAAAGGGCCTCGTGATACGCCTATTTTTATAGGTTAATGTCATGATAATAATGGTTTCTTAGACGTCAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTATGAGTATTCAACATTTCCGTGTCGCCCTTATTCCCTTTTTTGCGGCATTTTGCCTTCCTGTTTTTGCTCACCCAGAAACGCTGGTGAAAGTAAAAGATGCTGAAGATCAGTTGGGTGCACGAGTGGGTTACATCGAACTGGATCTCAACAGCGGTAAGATCCTTGAGAGTTTTCGCCCCGAAGAACGTTTTCCAATGATGAGCACTTTTAAAGTTCTGCTATGTGGCGCGGTATTATCCCGTATTGACGCCGGGCAAGAGCAACTCGGTCGCCGCATACACTATTCTCAGAATGACTTGGTTGAGTACTCACCAGTCACAGAAAAGCATCTTACGGATGGCATGACAGTAAGAGAATTATGCAGTGCTGCCATAACCATGAGTGATAACACTGCGGCCAACTTACTTCTGACAACGATCGGAGGACCGAAGGAGCTAACCGCTTTTTTGCACAACATGGGGGATCATGTAACTCGCCTTGATCGTTGGGAACCGGAGCTGAATGAAGCCATACCAAACGACGAGCGTGACACCACGATGCCTGTAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGT
12.用于临床前研究的coRPK AAV(SEQ ID NO.:24)
插入AAV骨架(SEQ ID NO.:23)中的包含coRPK治疗性供体(SEQ ID NO.:19)的序列。
13.用于临床前研究的coRPK AAV(SEQ ID NO.:25)
插入AAV骨架(SEQ ID NO.:23)中的包含coRPK治疗性供体(SEQ ID NO.:20)的序列。
14.用于临床前研究的coRPK AAV(SEQ ID NO.:26):
插入AAV骨架(SEQ ID NO.:23)中的包含coRPK治疗性供体(SEQ ID NO.:21)的序列。
15.用于临床应用的coRPK AAV(SEQ ID NO.:27)
插入AAV骨架(SEQ ID NO.:23)中的包含coRPK治疗性供体(SEQ ID NO.:22)的序列。
实施例3.PDK-HSPC中的PKLR校正
为了评估基因编辑系统的治疗潜力,对来自4名携带PKLR基因突变的PKD患者的人HSPC和HD-CD34+细胞进行预刺激48小时。然后,细胞进行核转染并用rAAV转导。基因编辑步骤后24小时,收集细胞并转移至红系分化培养基。在所有实验期间,通过FACS评估红系分化过程,观察到健康和基因编辑供体样品之间的成熟特征没有差异。第14天,收集细胞并进行基因组和功能分析。首先,在来自1名患者(PKD2)的样品中,通过3’和5’连接处的特异性PCR评估载体整合。如图15C所示,可在患者的样品中检测到特异性条带。此外,对红系细胞进行基于ATP定量的功能分析。未编辑或经GFP-AAV编辑的PKD细胞产生低水平的ATP。然而,经历用RNP和coRPK-AAV进行基因编辑的PKD-HSPC产生的红系细胞能够恢复接近HD细胞的ATP水平(图15D)。总之,数据表明,对PKLR基因进行基因编辑可恢复患者的红系细胞的体外功能。
序列表
<110> 能源环境和技术研究中心OAMP
<120> 丙酮酸激酶缺乏症(PKD)基因编辑治疗方法
<130> 906 345
<160> 40
<170> BiSSAP 1.3.6
<210> 1
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> SG1
<400> 1
ctgcgggacc atggaatgag 20
<210> 2
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> SG2
<400> 2
tggggacagg gtggcctact 20
<210> 3
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> SG3
<400> 3
aaaactgctg gtcttatcta 20
<210> 4
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> SG4
<400> 4
agaaaagggg cacacccagt 20
<210> 5
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> SG5
<400> 5
tggtcccgca gccccaggcc 20
<210> 6
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> SG6
<400> 6
ctccctctca ttccatggtc 20
<210> 7
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> SG7
<400> 7
cagccccagg cccacactga 20
<210> 8
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> SG8
<400> 8
ttccatggtc ccgcagcccc 20
<210> 9
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> SG9
<400> 9
cactgaaagc atgtcgatcc 20
<210> 10
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> SG10
<400> 10
aaactgctgg tcttatctaa 20
<210> 11
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> crRNA SG1 sequence (as RNA)
<400> 11
cugcgggacc auggaaugag 20
<210> 12
<211> 61
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA SG1 sequence (as RNA)
<400> 12
cugcgggacc auggaaugag guuuuagagc uagaaauagc aaguuaaaua aggcuagucc 60
g 61
<210> 13
<211> 425
<212> DNA
<213> Artificial Sequence
<220>
<223> LHA (left homologous arm)
<400> 13
cagagtggtg aaggcactct gcatttcttg gttgagacag agaaaaaaag tggtcagaac 60
tgggtaaccc tccccccacc atattatcac agtgatccct tttgtctttc ttcaggctcc 120
agccccaccc tacagcccct gctccctgga ttcactagag ctaacttcag taaagtacaa 180
agaaaatggg gccatatgac tggccaaaaa aaaaatatct attcacgtgg atgaccagat 240
agtatgaatg gattgaaaat ttatcaggaa aaaaggatga gaggaaatgc caggagatga 300
gggcagagag caggccgttc tgggggaggg attctgtggg gacagggtgg cctactgggt 360
gtgccccttt tctcttctct gtctccctta gataagacca gcagttttgt catcctctcc 420
ctctc 425
<210> 14
<211> 425
<212> DNA
<213> Artificial Sequence
<220>
<223> RHA (right homology arm)
<400> 14
gtcccgcagc cccaggccca cactgaaagc atgtcgatcc aggagaacat atcatccctg 60
cagcttcggt catgggtctc taagtcccaa agagacttag caaagtccat cctgattggg 120
gctccaggag gtaagaaggg gagacagaag ccatggaaca taggaggaaa atgagggtga 180
aaactaggag ccagggtgga gggcataaat gatccacatc agccactggc taggtgggtt 240
ttggagagga acgtacgttc ttcagagcct cccgtgtgtt aaattatgga ccctggcctg 300
ggtcttttcc aggccctata ggcaggccag agccacagca tgtaagccac ggggcactcc 360
cgtggttcct ggactctggc ccctggcata cagggcttcc aatggaacag gagacagtgg 420
tgaca 425
<210> 15
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> 5'UTR sequence
<400> 15
ttccatggtc ccgcagcccc aggcccacac tgaaagcatg 40
<210> 16
<211> 1719
<212> DNA
<213> Artificial Sequence
<220>
<223> coRPK cDNA
<400> 16
agcatccagg aaaatatcag ctctctgcag ctgcggtcct gggtgtccaa gagccagaga 60
gacctggcca agagcatcct gatcggagcc cctggcggac cagccggata cctgagaagg 120
gctagcgtgg cccagctgac ccaggaactg ggcaccgcct ttttccagca gcagcagctg 180
ccagccgcca tggccgacac ctttctggaa cacctgtgcc tgctggacat cgactctgag 240
cccgtggccg ccagaagcac cagcatcatt gccaccatcg gccctgccag cagaagcgtg 300
gagcggctga aagagatgat caaggccggc atgaatatcg cccggctgaa cttctcccac 360
ggcagccacg agtaccacgc agagagcatt gccaacgtcc gggaggccgt ggagagcttt 420
gccggcagcc ccctgagcta cagacccgtg gccattgccc tggacaccaa gggccccgag 480
atcagaacag gaattctgca gggagggcct gagagcgagg tggagctggt gaagggcagc 540
caagtgctgg tgaccgtgga ccccgccttc agaaccagag gcaacgccaa cacagtgtgg 600
gtggactacc ccaacatcgt gcgggtggtg cctgtgggcg gcagaatcta catcgacgac 660
ggcctgatca gcctggtggt gcagaagatc ggacctgagg gcctggtgac ccaggtcgag 720
aatggcggcg tgctgggcag cagaaagggc gtgaatctgc caggcgccca ggtggacctg 780
cctggcctgt ctgagcagga cgtgagagac ctgagatttg gcgtggagca cggcgtggac 840
atcgtgttcg ccagcttcgt gcggaaggcc tctgatgtgg ccgccgtgag agccgctctg 900
ggccctgaag gccacggcat caagatcatc agcaagatcg agaaccacga gggcgtgaag 960
cggttcgacg agatcctgga agtgtccgac ggcatcatgg tggccagagg cgacctgggc 1020
atcgagatcc ccgccgagaa ggtgttcctg gcccagaaaa tgatgatcgg acggtgcaac 1080
ctggccggca aacctgtggt gtgcgccacc cagatgctgg aaagcatgat caccaagccc 1140
agacccacca gagccgagac aagcgacgtg gccaacgccg tgctggatgg cgctgactgc 1200
atcatgctgt ccggcgagac agccaagggc aacttccccg tggaggccgt gaagatgcag 1260
cacgccattg ccagagaagc cgaggccgcc gtgtaccacc ggcagctgtt cgaggaactg 1320
cggagagccg cccctctgag cagagatccc accgaagtga ccgccatcgg agccgtggaa 1380
gccgccttca agtgctgcgc cgctgcaatc atcgtgctga ccaccacagg cagaagcgcc 1440
cagctgctgt ccagatacag acccagagcc gccgtgatcg ccgtgacaag atccgcccag 1500
gccgctagac aggtccacct gtgcagaggc gtgttccccc tgctgtaccg ggagcctccc 1560
gaggccatct gggccgacga cgtggacaga cgggtgcagt tcggcatcga gagcggcaag 1620
ctgcggggct tcctgagagt gggcgacctg gtgatcgtgg tgacaggctg gcggcctggc 1680
agcggctaca ccaacatcat gagggtgctg tccatcagc 1719
<210> 17
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> FLAG-Tag
<400> 17
gactacaaag acgatgacga taaatga 27
<210> 18
<211> 225
<212> DNA
<213> Artificial Sequence
<220>
<223> bGH poly(A) signal
<400> 18
ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc 60
tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc 120
tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt 180
gggaagacaa tagcaggcat gctggggatg cggtgggctc tatgg 225
<210> 19
<211> 2884
<212> DNA
<213> Artificial Sequence
<220>
<223> LHA-5'UTR-coRPK-FLAG-bGH poly(A)-RHA
<400> 19
cagagtggtg aaggcactct gcatttcttg gttgagacag agaaaaaaag tggtcagaac 60
tgggtaaccc tccccccacc atattatcac agtgatccct tttgtctttc ttcaggctcc 120
agccccaccc tacagcccct gctccctgga ttcactagag ctaacttcag taaagtacaa 180
agaaaatggg gccatatgac tggccaaaaa aaaaatatct attcacgtgg atgaccagat 240
agtatgaatg gattgaaaat ttatcaggaa aaaaggatga gaggaaatgc caggagatga 300
gggcagagag caggccgttc tgggggaggg attctgtggg gacagggtgg cctactgggt 360
gtgccccttt tctcttctct gtctccctta gataagacca gcagttttgt catcctctcc 420
ctctcttcca tggtcccgca gccccaggcc cacactgaaa gcatgagcat ccaggaaaat 480
atcagctctc tgcagctgcg gtcctgggtg tccaagagcc agagagacct ggccaagagc 540
atcctgatcg gagcccctgg cggaccagcc ggatacctga gaagggctag cgtggcccag 600
ctgacccagg aactgggcac cgcctttttc cagcagcagc agctgccagc cgccatggcc 660
gacacctttc tggaacacct gtgcctgctg gacatcgact ctgagcccgt ggccgccaga 720
agcaccagca tcattgccac catcggccct gccagcagaa gcgtggagcg gctgaaagag 780
atgatcaagg ccggcatgaa tatcgcccgg ctgaacttct cccacggcag ccacgagtac 840
cacgcagaga gcattgccaa cgtccgggag gccgtggaga gctttgccgg cagccccctg 900
agctacagac ccgtggccat tgccctggac accaagggcc ccgagatcag aacaggaatt 960
ctgcagggag ggcctgagag cgaggtggag ctggtgaagg gcagccaagt gctggtgacc 1020
gtggaccccg ccttcagaac cagaggcaac gccaacacag tgtgggtgga ctaccccaac 1080
atcgtgcggg tggtgcctgt gggcggcaga atctacatcg acgacggcct gatcagcctg 1140
gtggtgcaga agatcggacc tgagggcctg gtgacccagg tcgagaatgg cggcgtgctg 1200
ggcagcagaa agggcgtgaa tctgccaggc gcccaggtgg acctgcctgg cctgtctgag 1260
caggacgtga gagacctgag atttggcgtg gagcacggcg tggacatcgt gttcgccagc 1320
ttcgtgcgga aggcctctga tgtggccgcc gtgagagccg ctctgggccc tgaaggccac 1380
ggcatcaaga tcatcagcaa gatcgagaac cacgagggcg tgaagcggtt cgacgagatc 1440
ctggaagtgt ccgacggcat catggtggcc agaggcgacc tgggcatcga gatccccgcc 1500
gagaaggtgt tcctggccca gaaaatgatg atcggacggt gcaacctggc cggcaaacct 1560
gtggtgtgcg ccacccagat gctggaaagc atgatcacca agcccagacc caccagagcc 1620
gagacaagcg acgtggccaa cgccgtgctg gatggcgctg actgcatcat gctgtccggc 1680
gagacagcca agggcaactt ccccgtggag gccgtgaaga tgcagcacgc cattgccaga 1740
gaagccgagg ccgccgtgta ccaccggcag ctgttcgagg aactgcggag agccgcccct 1800
ctgagcagag atcccaccga agtgaccgcc atcggagccg tggaagccgc cttcaagtgc 1860
tgcgccgctg caatcatcgt gctgaccacc acaggcagaa gcgcccagct gctgtccaga 1920
tacagaccca gagccgccgt gatcgccgtg acaagatccg cccaggccgc tagacaggtc 1980
cacctgtgca gaggcgtgtt ccccctgctg taccgggagc ctcccgaggc catctgggcc 2040
gacgacgtgg acagacgggt gcagttcggc atcgagagcg gcaagctgcg gggcttcctg 2100
agagtgggcg acctggtgat cgtggtgaca ggctggcggc ctggcagcgg ctacaccaac 2160
atcatgaggg tgctgtccat cagcgactac aaagacgatg acgataaatg aacgcgtgag 2220
ttacaaataa agcactgtgc cttctagttg ccagccatct gttgtttgcc cctcccccgt 2280
gccttccttg accctggaag gtgccactcc cactgtcctt tcctaataaa atgaggaaat 2340
tgcatcgcat tgtctgagta ggtgtcattc tattctgggg ggtggggtgg ggcaggacag 2400
caagggggag gattgggaag acaatagcag gcatgctggg gatgcggtgg gctctatggg 2460
tcccgcagcc ccaggcccac actgaaagca tgtcgatcca ggagaacata tcatccctgc 2520
agcttcggtc atgggtctct aagtcccaaa gagacttagc aaagtccatc ctgattgggg 2580
ctccaggagg taagaagggg agacagaagc catggaacat aggaggaaaa tgagggtgaa 2640
aactaggagc cagggtggag ggcataaatg atccacatca gccactggct aggtgggttt 2700
tggagaggaa cgtacgttct tcagagcctc ccgtgtgtta aattatggac cctggcctgg 2760
gtcttttcca ggccctatag gcaggccaga gccacagcat gtaagccacg gggcactccc 2820
gtggttcctg gactctggcc cctggcatac agggcttcca atggaacagg agacagtggt 2880
gaca 2884
<210> 20
<211> 2860
<212> DNA
<213> Artificial Sequence
<220>
<223> LHA-5'UTR-coRPK-bGH poly(A)-RHA
<400> 20
cagagtggtg aaggcactct gcatttcttg gttgagacag agaaaaaaag tggtcagaac 60
tgggtaaccc tccccccacc atattatcac agtgatccct tttgtctttc ttcaggctcc 120
agccccaccc tacagcccct gctccctgga ttcactagag ctaacttcag taaagtacaa 180
agaaaatggg gccatatgac tggccaaaaa aaaaatatct attcacgtgg atgaccagat 240
agtatgaatg gattgaaaat ttatcaggaa aaaaggatga gaggaaatgc caggagatga 300
gggcagagag caggccgttc tgggggaggg attctgtggg gacagggtgg cctactgggt 360
gtgccccttt tctcttctct gtctccctta gataagacca gcagttttgt catcctctcc 420
ctctcttcca tggtcccgca gccccaggcc cacactgaaa gcatgagcat ccaggaaaat 480
atcagctctc tgcagctgcg gtcctgggtg tccaagagcc agagagacct ggccaagagc 540
atcctgatcg gagcccctgg cggaccagcc ggatacctga gaagggctag cgtggcccag 600
ctgacccagg aactgggcac cgcctttttc cagcagcagc agctgccagc cgccatggcc 660
gacacctttc tggaacacct gtgcctgctg gacatcgact ctgagcccgt ggccgccaga 720
agcaccagca tcattgccac catcggccct gccagcagaa gcgtggagcg gctgaaagag 780
atgatcaagg ccggcatgaa tatcgcccgg ctgaacttct cccacggcag ccacgagtac 840
cacgcagaga gcattgccaa cgtccgggag gccgtggaga gctttgccgg cagccccctg 900
agctacagac ccgtggccat tgccctggac accaagggcc ccgagatcag aacaggaatt 960
ctgcagggag ggcctgagag cgaggtggag ctggtgaagg gcagccaagt gctggtgacc 1020
gtggaccccg ccttcagaac cagaggcaac gccaacacag tgtgggtgga ctaccccaac 1080
atcgtgcggg tggtgcctgt gggcggcaga atctacatcg acgacggcct gatcagcctg 1140
gtggtgcaga agatcggacc tgagggcctg gtgacccagg tcgagaatgg cggcgtgctg 1200
ggcagcagaa agggcgtgaa tctgccaggc gcccaggtgg acctgcctgg cctgtctgag 1260
caggacgtga gagacctgag atttggcgtg gagcacggcg tggacatcgt gttcgccagc 1320
ttcgtgcgga aggcctctga tgtggccgcc gtgagagccg ctctgggccc tgaaggccac 1380
ggcatcaaga tcatcagcaa gatcgagaac cacgagggcg tgaagcggtt cgacgagatc 1440
ctggaagtgt ccgacggcat catggtggcc agaggcgacc tgggcatcga gatccccgcc 1500
gagaaggtgt tcctggccca gaaaatgatg atcggacggt gcaacctggc cggcaaacct 1560
gtggtgtgcg ccacccagat gctggaaagc atgatcacca agcccagacc caccagagcc 1620
gagacaagcg acgtggccaa cgccgtgctg gatggcgctg actgcatcat gctgtccggc 1680
gagacagcca agggcaactt ccccgtggag gccgtgaaga tgcagcacgc cattgccaga 1740
gaagccgagg ccgccgtgta ccaccggcag ctgttcgagg aactgcggag agccgcccct 1800
ctgagcagag atcccaccga agtgaccgcc atcggagccg tggaagccgc cttcaagtgc 1860
tgcgccgctg caatcatcgt gctgaccacc acaggcagaa gcgcccagct gctgtccaga 1920
tacagaccca gagccgccgt gatcgccgtg acaagatccg cccaggccgc tagacaggtc 1980
cacctgtgca gaggcgtgtt ccccctgctg taccgggagc ctcccgaggc catctgggcc 2040
gacgacgtgg acagacgggt gcagttcggc atcgagagcg gcaagctgcg gggcttcctg 2100
agagtgggcg acctggtgat cgtggtgaca ggctggcggc ctggcagcgg ctacaccaac 2160
atcatgaggg tgctgtccat cagctgaacg cgtgagttac aaataaagca ctgtgccttc 2220
tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc 2280
cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc tgagtaggtg 2340
tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt gggaagacaa 2400
tagcaggcat gctggggatg cggtgggctc tatgggtccc gcagccccag gcccacactg 2460
aaagcatgtc gatccaggag aacatatcat ccctgcagct tcggtcatgg gtctctaagt 2520
cccaaagaga cttagcaaag tccatcctga ttggggctcc aggaggtaag aaggggagac 2580
agaagccatg gaacatagga ggaaaatgag ggtgaaaact aggagccagg gtggagggca 2640
taaatgatcc acatcagcca ctggctaggt gggttttgga gaggaacgta cgttcttcag 2700
agcctcccgt gtgttaaatt atggaccctg gcctgggtct tttccaggcc ctataggcag 2760
gccagagcca cagcatgtaa gccacggggc actcccgtgg ttcctggact ctggcccctg 2820
gcatacaggg cttccaatgg aacaggagac agtggtgaca 2860
<210> 21
<211> 2884
<212> DNA
<213> Artificial Sequence
<220>
<223> LHA-5'UTR-coRPK-bGH poly(A)-RHA
<400> 21
tgtcaccact gtctcctgtt ccattggaag ccctgtatgc caggggccag agtccaggaa 60
ccacgggagt gccccgtggc ttacatgctg tggctctggc ctgcctatag ggcctggaaa 120
agacccaggc cagggtccat aatttaacac acgggaggct ctgaagaacg tacgttcctc 180
tccaaaaccc acctagccag tggctgatgt ggatcattta tgccctccac cctggctcct 240
agttttcacc ctcattttcc tcctatgttc catggcttct gtctcccctt cttacctcct 300
ggagccccaa tcaggatgga ctttgctaag tctctttggg acttagagac ccatgaccga 360
agctgcaggg atgatatgtt ctcctggatc gacatgcttt cagtgtgggc ctggggctgc 420
gggacccata gagcccaccg catccccagc atgcctgcta ttgtcttccc aatcctcccc 480
cttgctgtcc tgccccaccc caccccccag aatagaatga cacctactca gacaatgcga 540
tgcaatttcc tcattttatt aggaaaggac agtgggagtg gcaccttcca gggtcaagga 600
aggcacgggg gaggggcaaa caacagatgg ctggcaacta gaaggcacag tgctttattt 660
gtaactcacg cgttcattta tcgtcatcgt ctttgtagtc gctgatggac agcaccctca 720
tgatgttggt gtagccgctg ccaggccgcc agcctgtcac cacgatcacc aggtcgccca 780
ctctcaggaa gccccgcagc ttgccgctct cgatgccgaa ctgcacccgt ctgtccacgt 840
cgtcggccca gatggcctcg ggaggctccc ggtacagcag ggggaacacg cctctgcaca 900
ggtggacctg tctagcggcc tgggcggatc ttgtcacggc gatcacggcg gctctgggtc 960
tgtatctgga cagcagctgg gcgcttctgc ctgtggtggt cagcacgatg attgcagcgg 1020
cgcagcactt gaaggcggct tccacggctc cgatggcggt cacttcggtg ggatctctgc 1080
tcagaggggc ggctctccgc agttcctcga acagctgccg gtggtacacg gcggcctcgg 1140
cttctctggc aatggcgtgc tgcatcttca cggcctccac ggggaagttg cccttggctg 1200
tctcgccgga cagcatgatg cagtcagcgc catccagcac ggcgttggcc acgtcgcttg 1260
tctcggctct ggtgggtctg ggcttggtga tcatgctttc cagcatctgg gtggcgcaca 1320
ccacaggttt gccggccagg ttgcaccgtc cgatcatcat tttctgggcc aggaacacct 1380
tctcggcggg gatctcgatg cccaggtcgc ctctggccac catgatgccg tcggacactt 1440
ccaggatctc gtcgaaccgc ttcacgccct cgtggttctc gatcttgctg atgatcttga 1500
tgccgtggcc ttcagggccc agagcggctc tcacggcggc cacatcagag gccttccgca 1560
cgaagctggc gaacacgatg tccacgccgt gctccacgcc aaatctcagg tctctcacgt 1620
cctgctcaga caggccaggc aggtccacct gggcgcctgg cagattcacg ccctttctgc 1680
tgcccagcac gccgccattc tcgacctggg tcaccaggcc ctcaggtccg atcttctgca 1740
ccaccaggct gatcaggccg tcgtcgatgt agattctgcc gcccacaggc accacccgca 1800
cgatgttggg gtagtccacc cacactgtgt tggcgttgcc tctggttctg aaggcggggt 1860
ccacggtcac cagcacttgg ctgcccttca ccagctccac ctcgctctca ggccctccct 1920
gcagaattcc tgttctgatc tcggggccct tggtgtccag ggcaatggcc acgggtctgt 1980
agctcagggg gctgccggca aagctctcca cggcctcccg gacgttggca atgctctctg 2040
cgtggtactc gtggctgccg tgggagaagt tcagccgggc gatattcatg ccggccttga 2100
tcatctcttt cagccgctcc acgcttctgc tggcagggcc gatggtggca atgatgctgg 2160
tgcttctggc ggccacgggc tcagagtcga tgtccagcag gcacaggtgt tccagaaagg 2220
tgtcggccat ggcggctggc agctgctgct gctggaaaaa ggcggtgccc agttcctggg 2280
tcagctgggc cacgctagcc cttctcaggt atccggctgg tccgccaggg gctccgatca 2340
ggatgctctt ggccaggtct ctctggctct tggacaccca ggaccgcagc tgcagagagc 2400
tgatattttc ctggatgctc atgctttcag tgtgggcctg gggctgcggg accatggaag 2460
agagggagag gatgacaaaa ctgctggtct tatctaaggg agacagagaa gagaaaaggg 2520
gcacacccag taggccaccc tgtccccaca gaatccctcc cccagaacgg cctgctctct 2580
gccctcatct cctggcattt cctctcatcc ttttttcctg ataaattttc aatccattca 2640
tactatctgg tcatccacgt gaatagatat tttttttttg gccagtcata tggccccatt 2700
ttctttgtac tttactgaag ttagctctag tgaatccagg gagcaggggc tgtagggtgg 2760
ggctggagcc tgaagaaaga caaaagggat cactgtgata atatggtggg gggagggtta 2820
cccagttctg accacttttt ttctctgtct caaccaagaa atgcagagtg ccttcaccac 2880
tctg 2884
<210> 22
<211> 2860
<212> DNA
<213> Artificial Sequence
<220>
<223> LHA-5'UTR-coRPK-bGH poly(A)-RHA
<400> 22
tgtcaccact gtctcctgtt ccattggaag ccctgtatgc caggggccag agtccaggaa 60
ccacgggagt gccccgtggc ttacatgctg tggctctggc ctgcctatag ggcctggaaa 120
agacccaggc cagggtccat aatttaacac acgggaggct ctgaagaacg tacgttcctc 180
tccaaaaccc acctagccag tggctgatgt ggatcattta tgccctccac cctggctcct 240
agttttcacc ctcattttcc tcctatgttc catggcttct gtctcccctt cttacctcct 300
ggagccccaa tcaggatgga ctttgctaag tctctttggg acttagagac ccatgaccga 360
agctgcaggg atgatatgtt ctcctggatc gacatgcttt cagtgtgggc ctggggctgc 420
gggacccata gagcccaccg catccccagc atgcctgcta ttgtcttccc aatcctcccc 480
cttgctgtcc tgccccaccc caccccccag aatagaatga cacctactca gacaatgcga 540
tgcaatttcc tcattttatt aggaaaggac agtgggagtg gcaccttcca gggtcaagga 600
aggcacgggg gaggggcaaa caacagatgg ctggcaacta gaaggcacag tgctttattt 660
gtaactcacg cgttcagctg atggacagca ccctcatgat gttggtgtag ccgctgccag 720
gccgccagcc tgtcaccacg atcaccaggt cgcccactct caggaagccc cgcagcttgc 780
cgctctcgat gccgaactgc acccgtctgt ccacgtcgtc ggcccagatg gcctcgggag 840
gctcccggta cagcaggggg aacacgcctc tgcacaggtg gacctgtcta gcggcctggg 900
cggatcttgt cacggcgatc acggcggctc tgggtctgta tctggacagc agctgggcgc 960
ttctgcctgt ggtggtcagc acgatgattg cagcggcgca gcacttgaag gcggcttcca 1020
cggctccgat ggcggtcact tcggtgggat ctctgctcag aggggcggct ctccgcagtt 1080
cctcgaacag ctgccggtgg tacacggcgg cctcggcttc tctggcaatg gcgtgctgca 1140
tcttcacggc ctccacgggg aagttgccct tggctgtctc gccggacagc atgatgcagt 1200
cagcgccatc cagcacggcg ttggccacgt cgcttgtctc ggctctggtg ggtctgggct 1260
tggtgatcat gctttccagc atctgggtgg cgcacaccac aggtttgccg gccaggttgc 1320
accgtccgat catcattttc tgggccagga acaccttctc ggcggggatc tcgatgccca 1380
ggtcgcctct ggccaccatg atgccgtcgg acacttccag gatctcgtcg aaccgcttca 1440
cgccctcgtg gttctcgatc ttgctgatga tcttgatgcc gtggccttca gggcccagag 1500
cggctctcac ggcggccaca tcagaggcct tccgcacgaa gctggcgaac acgatgtcca 1560
cgccgtgctc cacgccaaat ctcaggtctc tcacgtcctg ctcagacagg ccaggcaggt 1620
ccacctgggc gcctggcaga ttcacgccct ttctgctgcc cagcacgccg ccattctcga 1680
cctgggtcac caggccctca ggtccgatct tctgcaccac caggctgatc aggccgtcgt 1740
cgatgtagat tctgccgccc acaggcacca cccgcacgat gttggggtag tccacccaca 1800
ctgtgttggc gttgcctctg gttctgaagg cggggtccac ggtcaccagc acttggctgc 1860
ccttcaccag ctccacctcg ctctcaggcc ctccctgcag aattcctgtt ctgatctcgg 1920
ggcccttggt gtccagggca atggccacgg gtctgtagct cagggggctg ccggcaaagc 1980
tctccacggc ctcccggacg ttggcaatgc tctctgcgtg gtactcgtgg ctgccgtggg 2040
agaagttcag ccgggcgata ttcatgccgg ccttgatcat ctctttcagc cgctccacgc 2100
ttctgctggc agggccgatg gtggcaatga tgctggtgct tctggcggcc acgggctcag 2160
agtcgatgtc cagcaggcac aggtgttcca gaaaggtgtc ggccatggcg gctggcagct 2220
gctgctgctg gaaaaaggcg gtgcccagtt cctgggtcag ctgggccacg ctagcccttc 2280
tcaggtatcc ggctggtccg ccaggggctc cgatcaggat gctcttggcc aggtctctct 2340
ggctcttgga cacccaggac cgcagctgca gagagctgat attttcctgg atgctcatgc 2400
tttcagtgtg ggcctggggc tgcgggacca tggaagagag ggagaggatg acaaaactgc 2460
tggtcttatc taagggagac agagaagaga aaaggggcac acccagtagg ccaccctgtc 2520
cccacagaat ccctccccca gaacggcctg ctctctgccc tcatctcctg gcatttcctc 2580
tcatcctttt ttcctgataa attttcaatc cattcatact atctggtcat ccacgtgaat 2640
agatattttt tttttggcca gtcatatggc cccattttct ttgtacttta ctgaagttag 2700
ctctagtgaa tccagggagc aggggctgta gggtggggct ggagcctgaa gaaagacaaa 2760
agggatcact gtgataatat ggtgggggga gggttaccca gttctgacca ctttttttct 2820
ctgtctcaac caagaaatgc agagtgcctt caccactctg 2860
<210> 23
<211> 2876
<212> DNA
<213> Artificial Sequence
<220>
<223> AAV backbone
<400> 23
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct gcggccgcag gaacccctag tgatggagtt ggccactccc tctctgcgcg 180
ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg 240
cggcctcagt gagcgagcga gcgcgcagct gcctgcaggg gcgcctgatg cggtattttc 300
tccttacgca tctgtgcggt atttcacacc gcatacgtca aagcaaccat agtacgcgcc 360
ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga ccgctacact 420
tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct tcctttctcg ccacgttcgc 480
cggctttccc cgtcaagctc taaatcgggg gctcccttta gggttccgat ttagtgcttt 540
acggcacctc gaccccaaaa aacttgattt gggtgatggt tcacgtagtg ggccatcgcc 600
ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg ttctttaata gtggactctt 660
gttccaaact ggaacaacac tcaaccctat ctcgggctat tcttttgatt tataagggat 720
tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa 780
ttttaacaaa atattaacgt ttacaatttt atggtgcact ctcagtacaa tctgctctga 840
tgccgcatag ttaagccagc cccgacaccc gccaacaccc gctgacgcgc cctgacgggc 900
ttgtctgctc ccggcatccg cttacagaca agctgtgacc gtctccggga gctgcatgtg 960
tcagaggttt tcaccgtcat caccgaaacg cgcgagacga aagggcctcg tgatacgcct 1020
atttttatag gttaatgtca tgataataat ggtttcttag acgtcaggtg gcacttttcg 1080
gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa atatgtatcc 1140
gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga agagtatgag 1200
tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc ttcctgtttt 1260
tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt 1320
gggttacatc gaactggatc tcaacagcgg taagatcctt gagagttttc gccccgaaga 1380
acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat tatcccgtat 1440
tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg acttggttga 1500
gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag aattatgcag 1560
tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa cgatcggagg 1620
accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc gccttgatcg 1680
ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca cgatgcctgt 1740
agcaatggca acaacgttgc gcaaactatt aactggcgaa ctacttactc tagcttcccg 1800
gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc tgcgctcggc 1860
ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg 1920
tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta tctacacgac 1980
ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag gtgcctcact 2040
gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga ttgatttaaa 2100
acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc tcatgaccaa 2160
aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg 2220
atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc 2280
gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac 2340
tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca 2400
ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt 2460
ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc 2520
ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg 2580
aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc 2640
cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac 2700
gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct 2760
ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc 2820
cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgt 2876
<210> 24
<211> 5899
<212> DNA
<213> Artificial Sequence
<220>
<223> coRPK AAV used for pre-clinical studies
<400> 24
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct gcggccgcca gagtggtgaa ggcactctgc atttcttggt tgagacagag 180
aaaaaaagtg gtcagaactg ggtaaccctc cccccaccat attatcacag tgatcccttt 240
tgtctttctt caggctccag ccccacccta cagcccctgc tccctggatt cactagagct 300
aacttcagta aagtacaaag aaaatggggc catatgactg gccaaaaaaa aaatatctat 360
tcacgtggat gaccagatag tatgaatgga ttgaaaattt atcaggaaaa aaggatgaga 420
ggaaatgcca ggagatgagg gcagagagca ggccgttctg ggggagggat tctgtgggga 480
cagggtggcc tactgggtgt gccccttttc tcttctctgt ctcccttaga taagaccagc 540
agttttgtca tcctctccct ctcttccatg gtcccgcagc cccaggccca cactgaaagc 600
atgagcatcc aggaaaatat cagctctctg cagctgcggt cctgggtgtc caagagccag 660
agagacctgg ccaagagcat cctgatcgga gcccctggcg gaccagccgg atacctgaga 720
agggctagcg tggcccagct gacccaggaa ctgggcaccg cctttttcca gcagcagcag 780
ctgccagccg ccatggccga cacctttctg gaacacctgt gcctgctgga catcgactct 840
gagcccgtgg ccgccagaag caccagcatc attgccacca tcggccctgc cagcagaagc 900
gtggagcggc tgaaagagat gatcaaggcc ggcatgaata tcgcccggct gaacttctcc 960
cacggcagcc acgagtacca cgcagagagc attgccaacg tccgggaggc cgtggagagc 1020
tttgccggca gccccctgag ctacagaccc gtggccattg ccctggacac caagggcccc 1080
gagatcagaa caggaattct gcagggaggg cctgagagcg aggtggagct ggtgaagggc 1140
agccaagtgc tggtgaccgt ggaccccgcc ttcagaacca gaggcaacgc caacacagtg 1200
tgggtggact accccaacat cgtgcgggtg gtgcctgtgg gcggcagaat ctacatcgac 1260
gacggcctga tcagcctggt ggtgcagaag atcggacctg agggcctggt gacccaggtc 1320
gagaatggcg gcgtgctggg cagcagaaag ggcgtgaatc tgccaggcgc ccaggtggac 1380
ctgcctggcc tgtctgagca ggacgtgaga gacctgagat ttggcgtgga gcacggcgtg 1440
gacatcgtgt tcgccagctt cgtgcggaag gcctctgatg tggccgccgt gagagccgct 1500
ctgggccctg aaggccacgg catcaagatc atcagcaaga tcgagaacca cgagggcgtg 1560
aagcggttcg acgagatcct ggaagtgtcc gacggcatca tggtggccag aggcgacctg 1620
ggcatcgaga tccccgccga gaaggtgttc ctggcccaga aaatgatgat cggacggtgc 1680
aacctggccg gcaaacctgt ggtgtgcgcc acccagatgc tggaaagcat gatcaccaag 1740
cccagaccca ccagagccga gacaagcgac gtggccaacg ccgtgctgga tggcgctgac 1800
tgcatcatgc tgtccggcga gacagccaag ggcaacttcc ccgtggaggc cgtgaagatg 1860
cagcacgcca ttgccagaga agccgaggcc gccgtgtacc accggcagct gttcgaggaa 1920
ctgcggagag ccgcccctct gagcagagat cccaccgaag tgaccgccat cggagccgtg 1980
gaagccgcct tcaagtgctg cgccgctgca atcatcgtgc tgaccaccac aggcagaagc 2040
gcccagctgc tgtccagata cagacccaga gccgccgtga tcgccgtgac aagatccgcc 2100
caggccgcta gacaggtcca cctgtgcaga ggcgtgttcc ccctgctgta ccgggagcct 2160
cccgaggcca tctgggccga cgacgtggac agacgggtgc agttcggcat cgagagcggc 2220
aagctgcggg gcttcctgag agtgggcgac ctggtgatcg tggtgacagg ctggcggcct 2280
ggcagcggct acaccaacat catgagggtg ctgtccatca gcgactacaa agacgatgac 2340
gataaatgaa cgcgtgagtt acaaataaag cactgtgcct tctagttgcc agccatctgt 2400
tgtttgcccc tcccccgtgc cttccttgac cctggaaggt gccactccca ctgtcctttc 2460
ctaataaaat gaggaaattg catcgcattg tctgagtagg tgtcattcta ttctgggggg 2520
tggggtgggg caggacagca agggggagga ttgggaagac aatagcaggc atgctgggga 2580
tgcggtgggc tctatgggtc ccgcagcccc aggcccacac tgaaagcatg tcgatccagg 2640
agaacatatc atccctgcag cttcggtcat gggtctctaa gtcccaaaga gacttagcaa 2700
agtccatcct gattggggct ccaggaggta agaaggggag acagaagcca tggaacatag 2760
gaggaaaatg agggtgaaaa ctaggagcca gggtggaggg cataaatgat ccacatcagc 2820
cactggctag gtgggttttg gagaggaacg tacgttcttc agagcctccc gtgtgttaaa 2880
ttatggaccc tggcctgggt cttttccagg ccctataggc aggccagagc cacagcatgt 2940
aagccacggg gcactcccgt ggttcctgga ctctggcccc tggcatacag ggcttccaat 3000
ggaacaggag acagtggtga cagcggccgc aggaacccct agtgatggag ttggccactc 3060
cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg 3120
gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag ctgcctgcag gggcgcctga 3180
tgcggtattt tctccttacg catctgtgcg gtatttcaca ccgcatacgt caaagcaacc 3240
atagtacgcg ccctgtagcg gcgcattaag cgcggcgggt gtggtggtta cgcgcagcgt 3300
gaccgctaca cttgccagcg ccctagcgcc cgctcctttc gctttcttcc cttcctttct 3360
cgccacgttc gccggctttc cccgtcaagc tctaaatcgg gggctccctt tagggttccg 3420
atttagtgct ttacggcacc tcgaccccaa aaaacttgat ttgggtgatg gttcacgtag 3480
tgggccatcg ccctgataga cggtttttcg ccctttgacg ttggagtcca cgttctttaa 3540
tagtggactc ttgttccaaa ctggaacaac actcaaccct atctcgggct attcttttga 3600
tttataaggg attttgccga tttcggccta ttggttaaaa aatgagctga tttaacaaaa 3660
atttaacgcg aattttaaca aaatattaac gtttacaatt ttatggtgca ctctcagtac 3720
aatctgctct gatgccgcat agttaagcca gccccgacac ccgccaacac ccgctgacgc 3780
gccctgacgg gcttgtctgc tcccggcatc cgcttacaga caagctgtga ccgtctccgg 3840
gagctgcatg tgtcagaggt tttcaccgtc atcaccgaaa cgcgcgagac gaaagggcct 3900
cgtgatacgc ctatttttat aggttaatgt catgataata atggtttctt agacaaacct 3960
agatattgat agtctgatcg gtcaacgtat aatcgagtcc tagcttttgc aaacatctat 4020
caagagacag gatcagcagg aggctttcgc atgattgaac aagatggatt gcacgcaggt 4080
tctccggcgg cttgggtgga gaggctattc ggctatgact gggcacaaca gacaatcggc 4140
tgctctgatg ccgccgtgtt ccggctgtca gcgcaggggc gtccggttct ttttgtcaag 4200
accgacctgt ccggtgccct gaatgaactg caagacgagg cagcgcggct atcgtggctg 4260
gcgacgacgg gcgttccttg cgcggctgtg ctcgacgttg tcactgaagc gggaagggac 4320
tggctgctat tgggcgaagt gccggggcag gatctcctgt catctcacct tgctcctgcc 4380
gagaaagtat ccatcatggc tgatgcaatg cggcggctgc atacgcttga tccggctacc 4440
tgcccattcg accaccaagc gaaacatcgc atcgagcgag cacgtactcg gatggaagcc 4500
ggtcttgtcg atcaggatga tctggacgaa gagcatcagg ggctcgcgcc agccgaactg 4560
ttcgccaggc tcaaggcgtc tatgcccgac ggcgaggatc tcgtcgtgac ccacggcgat 4620
gcctgcttgc cgaatatcat ggtggaaaat ggccgctttt ctggattcat cgactgtggc 4680
cgtctgggtg tggcggaccg ctatcaggac atagcgttgg ctacccgtga tattgctgaa 4740
gagcttggcg gcgaatgggc tgaccgcttc cttgtgcttt acggtatcgc cgcgcccgat 4800
tcgcagcgca tcgccttcta tcgccttctt gacgagttct tctgaccgat tctaggtgca 4860
ttggcgcaga aaaaaatgcc tgatgcgacg ctgcgcgtct tatactccca catatgccag 4920
attcagcaac ggatacggct tccccaactt gcccacttcc atacgtgtcc tccttaccag 4980
aaatttatcc ttaacgatcg gacggggagt caggcaacta tggatgaacg aaatagacag 5040
atcgctgaga taggtgcctc actgattaag cattggtaac tgtcagacca agtttactca 5100
tatatacttt agattgattt aaaacttcat ttttaattta aaaggatcta ggtgaagatc 5160
ctttttgata atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca 5220
gaccccgtag aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc 5280
tgcttgcaaa caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta 5340
ccaactcttt ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgttctt 5400
ctagtgtagc cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc 5460
gctctgctaa tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg 5520
ttggactcaa gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg 5580
tgcacacagc ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag 5640
ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc 5700
agggtcggaa caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat 5760
agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg 5820
gggcggagcc tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc 5880
tggccttttg ctcacatgt 5899
<210> 25
<211> 5875
<212> DNA
<213> Artificial Sequence
<220>
<223> coRPK AAV used for pre-clinical studies
<400> 25
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct gcggccgcca gagtggtgaa ggcactctgc atttcttggt tgagacagag 180
aaaaaaagtg gtcagaactg ggtaaccctc cccccaccat attatcacag tgatcccttt 240
tgtctttctt caggctccag ccccacccta cagcccctgc tccctggatt cactagagct 300
aacttcagta aagtacaaag aaaatggggc catatgactg gccaaaaaaa aaatatctat 360
tcacgtggat gaccagatag tatgaatgga ttgaaaattt atcaggaaaa aaggatgaga 420
ggaaatgcca ggagatgagg gcagagagca ggccgttctg ggggagggat tctgtgggga 480
cagggtggcc tactgggtgt gccccttttc tcttctctgt ctcccttaga taagaccagc 540
agttttgtca tcctctccct ctcttccatg gtcccgcagc cccaggccca cactgaaagc 600
atgagcatcc aggaaaatat cagctctctg cagctgcggt cctgggtgtc caagagccag 660
agagacctgg ccaagagcat cctgatcgga gcccctggcg gaccagccgg atacctgaga 720
agggctagcg tggcccagct gacccaggaa ctgggcaccg cctttttcca gcagcagcag 780
ctgccagccg ccatggccga cacctttctg gaacacctgt gcctgctgga catcgactct 840
gagcccgtgg ccgccagaag caccagcatc attgccacca tcggccctgc cagcagaagc 900
gtggagcggc tgaaagagat gatcaaggcc ggcatgaata tcgcccggct gaacttctcc 960
cacggcagcc acgagtacca cgcagagagc attgccaacg tccgggaggc cgtggagagc 1020
tttgccggca gccccctgag ctacagaccc gtggccattg ccctggacac caagggcccc 1080
gagatcagaa caggaattct gcagggaggg cctgagagcg aggtggagct ggtgaagggc 1140
agccaagtgc tggtgaccgt ggaccccgcc ttcagaacca gaggcaacgc caacacagtg 1200
tgggtggact accccaacat cgtgcgggtg gtgcctgtgg gcggcagaat ctacatcgac 1260
gacggcctga tcagcctggt ggtgcagaag atcggacctg agggcctggt gacccaggtc 1320
gagaatggcg gcgtgctggg cagcagaaag ggcgtgaatc tgccaggcgc ccaggtggac 1380
ctgcctggcc tgtctgagca ggacgtgaga gacctgagat ttggcgtgga gcacggcgtg 1440
gacatcgtgt tcgccagctt cgtgcggaag gcctctgatg tggccgccgt gagagccgct 1500
ctgggccctg aaggccacgg catcaagatc atcagcaaga tcgagaacca cgagggcgtg 1560
aagcggttcg acgagatcct ggaagtgtcc gacggcatca tggtggccag aggcgacctg 1620
ggcatcgaga tccccgccga gaaggtgttc ctggcccaga aaatgatgat cggacggtgc 1680
aacctggccg gcaaacctgt ggtgtgcgcc acccagatgc tggaaagcat gatcaccaag 1740
cccagaccca ccagagccga gacaagcgac gtggccaacg ccgtgctgga tggcgctgac 1800
tgcatcatgc tgtccggcga gacagccaag ggcaacttcc ccgtggaggc cgtgaagatg 1860
cagcacgcca ttgccagaga agccgaggcc gccgtgtacc accggcagct gttcgaggaa 1920
ctgcggagag ccgcccctct gagcagagat cccaccgaag tgaccgccat cggagccgtg 1980
gaagccgcct tcaagtgctg cgccgctgca atcatcgtgc tgaccaccac aggcagaagc 2040
gcccagctgc tgtccagata cagacccaga gccgccgtga tcgccgtgac aagatccgcc 2100
caggccgcta gacaggtcca cctgtgcaga ggcgtgttcc ccctgctgta ccgggagcct 2160
cccgaggcca tctgggccga cgacgtggac agacgggtgc agttcggcat cgagagcggc 2220
aagctgcggg gcttcctgag agtgggcgac ctggtgatcg tggtgacagg ctggcggcct 2280
ggcagcggct acaccaacat catgagggtg ctgtccatca gctgaacgcg tgagttacaa 2340
ataaagcact gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc 2400
cttgaccctg gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc 2460
gcattgtctg agtaggtgtc attctattct ggggggtggg gtggggcagg acagcaaggg 2520
ggaggattgg gaagacaata gcaggcatgc tggggatgcg gtgggctcta tgggtcccgc 2580
agccccaggc ccacactgaa agcatgtcga tccaggagaa catatcatcc ctgcagcttc 2640
ggtcatgggt ctctaagtcc caaagagact tagcaaagtc catcctgatt ggggctccag 2700
gaggtaagaa ggggagacag aagccatgga acataggagg aaaatgaggg tgaaaactag 2760
gagccagggt ggagggcata aatgatccac atcagccact ggctaggtgg gttttggaga 2820
ggaacgtacg ttcttcagag cctcccgtgt gttaaattat ggaccctggc ctgggtcttt 2880
tccaggccct ataggcaggc cagagccaca gcatgtaagc cacggggcac tcccgtggtt 2940
cctggactct ggcccctggc atacagggct tccaatggaa caggagacag tggtgacagc 3000
ggccgcagga acccctagtg atggagttgg ccactccctc tctgcgcgct cgctcgctca 3060
ctgaggccgg gcgaccaaag gtcgcccgac gcccgggctt tgcccgggcg gcctcagtga 3120
gcgagcgagc gcgcagctgc ctgcaggggc gcctgatgcg gtattttctc cttacgcatc 3180
tgtgcggtat ttcacaccgc atacgtcaaa gcaaccatag tacgcgccct gtagcggcgc 3240
attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc gctacacttg ccagcgccct 3300
agcgcccgct cctttcgctt tcttcccttc ctttctcgcc acgttcgccg gctttccccg 3360
tcaagctcta aatcgggggc tccctttagg gttccgattt agtgctttac ggcacctcga 3420
ccccaaaaaa cttgatttgg gtgatggttc acgtagtggg ccatcgccct gatagacggt 3480
ttttcgccct ttgacgttgg agtccacgtt ctttaatagt ggactcttgt tccaaactgg 3540
aacaacactc aaccctatct cgggctattc ttttgattta taagggattt tgccgatttc 3600
ggcctattgg ttaaaaaatg agctgattta acaaaaattt aacgcgaatt ttaacaaaat 3660
attaacgttt acaattttat ggtgcactct cagtacaatc tgctctgatg ccgcatagtt 3720
aagccagccc cgacacccgc caacacccgc tgacgcgccc tgacgggctt gtctgctccc 3780
ggcatccgct tacagacaag ctgtgaccgt ctccgggagc tgcatgtgtc agaggttttc 3840
accgtcatca ccgaaacgcg cgagacgaaa gggcctcgtg atacgcctat ttttataggt 3900
taatgtcatg ataataatgg tttcttagac aaacctagat attgatagtc tgatcggtca 3960
acgtataatc gagtcctagc ttttgcaaac atctatcaag agacaggatc agcaggaggc 4020
tttcgcatga ttgaacaaga tggattgcac gcaggttctc cggcggcttg ggtggagagg 4080
ctattcggct atgactgggc acaacagaca atcggctgct ctgatgccgc cgtgttccgg 4140
ctgtcagcgc aggggcgtcc ggttcttttt gtcaagaccg acctgtccgg tgccctgaat 4200
gaactgcaag acgaggcagc gcggctatcg tggctggcga cgacgggcgt tccttgcgcg 4260
gctgtgctcg acgttgtcac tgaagcggga agggactggc tgctattggg cgaagtgccg 4320
gggcaggatc tcctgtcatc tcaccttgct cctgccgaga aagtatccat catggctgat 4380
gcaatgcggc ggctgcatac gcttgatccg gctacctgcc cattcgacca ccaagcgaaa 4440
catcgcatcg agcgagcacg tactcggatg gaagccggtc ttgtcgatca ggatgatctg 4500
gacgaagagc atcaggggct cgcgccagcc gaactgttcg ccaggctcaa ggcgtctatg 4560
cccgacggcg aggatctcgt cgtgacccac ggcgatgcct gcttgccgaa tatcatggtg 4620
gaaaatggcc gcttttctgg attcatcgac tgtggccgtc tgggtgtggc ggaccgctat 4680
caggacatag cgttggctac ccgtgatatt gctgaagagc ttggcggcga atgggctgac 4740
cgcttccttg tgctttacgg tatcgccgcg cccgattcgc agcgcatcgc cttctatcgc 4800
cttcttgacg agttcttctg accgattcta ggtgcattgg cgcagaaaaa aatgcctgat 4860
gcgacgctgc gcgtcttata ctcccacata tgccagattc agcaacggat acggcttccc 4920
caacttgccc acttccatac gtgtcctcct taccagaaat ttatccttaa cgatcggacg 4980
gggagtcagg caactatgga tgaacgaaat agacagatcg ctgagatagg tgcctcactg 5040
attaagcatt ggtaactgtc agaccaagtt tactcatata tactttagat tgatttaaaa 5100
cttcattttt aatttaaaag gatctaggtg aagatccttt ttgataatct catgaccaaa 5160
atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa gatcaaagga 5220
tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg 5280
ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc gaaggtaact 5340
ggcttcagca gagcgcagat accaaatact gttcttctag tgtagccgta gttaggccac 5400
cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct gttaccagtg 5460
gctgctgcca gtggcgataa gtcgtgtctt accgggttgg actcaagacg atagttaccg 5520
gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca cacagcccag cttggagcga 5580
acgacctaca ccgaactgag atacctacag cgtgagctat gagaaagcgc cacgcttccc 5640
gaagggagaa aggcggacag gtatccggta agcggcaggg tcggaacagg agagcgcacg 5700
agggagcttc cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc 5760
tgacttgagc gtcgattttt gtgatgctcg tcaggggggc ggagcctatg gaaaaacgcc 5820
agcaacgcgg cctttttacg gttcctggcc ttttgctggc cttttgctca catgt 5875
<210> 26
<211> 5899
<212> DNA
<213> Artificial Sequence
<220>
<223> coRPK AAV used for pre-clinical studies
<400> 26
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct gcggccgctg tcaccactgt ctcctgttcc attggaagcc ctgtatgcca 180
ggggccagag tccaggaacc acgggagtgc cccgtggctt acatgctgtg gctctggcct 240
gcctataggg cctggaaaag acccaggcca gggtccataa tttaacacac gggaggctct 300
gaagaacgta cgttcctctc caaaacccac ctagccagtg gctgatgtgg atcatttatg 360
ccctccaccc tggctcctag ttttcaccct cattttcctc ctatgttcca tggcttctgt 420
ctccccttct tacctcctgg agccccaatc aggatggact ttgctaagtc tctttgggac 480
ttagagaccc atgaccgaag ctgcagggat gatatgttct cctggatcga catgctttca 540
gtgtgggcct ggggctgcgg gacccataga gcccaccgca tccccagcat gcctgctatt 600
gtcttcccaa tcctccccct tgctgtcctg ccccacccca ccccccagaa tagaatgaca 660
cctactcaga caatgcgatg caatttcctc attttattag gaaaggacag tgggagtggc 720
accttccagg gtcaaggaag gcacggggga ggggcaaaca acagatggct ggcaactaga 780
aggcacagtg ctttatttgt aactcacgcg ttcatttatc gtcatcgtct ttgtagtcgc 840
tgatggacag caccctcatg atgttggtgt agccgctgcc aggccgccag cctgtcacca 900
cgatcaccag gtcgcccact ctcaggaagc cccgcagctt gccgctctcg atgccgaact 960
gcacccgtct gtccacgtcg tcggcccaga tggcctcggg aggctcccgg tacagcaggg 1020
ggaacacgcc tctgcacagg tggacctgtc tagcggcctg ggcggatctt gtcacggcga 1080
tcacggcggc tctgggtctg tatctggaca gcagctgggc gcttctgcct gtggtggtca 1140
gcacgatgat tgcagcggcg cagcacttga aggcggcttc cacggctccg atggcggtca 1200
cttcggtggg atctctgctc agaggggcgg ctctccgcag ttcctcgaac agctgccggt 1260
ggtacacggc ggcctcggct tctctggcaa tggcgtgctg catcttcacg gcctccacgg 1320
ggaagttgcc cttggctgtc tcgccggaca gcatgatgca gtcagcgcca tccagcacgg 1380
cgttggccac gtcgcttgtc tcggctctgg tgggtctggg cttggtgatc atgctttcca 1440
gcatctgggt ggcgcacacc acaggtttgc cggccaggtt gcaccgtccg atcatcattt 1500
tctgggccag gaacaccttc tcggcgggga tctcgatgcc caggtcgcct ctggccacca 1560
tgatgccgtc ggacacttcc aggatctcgt cgaaccgctt cacgccctcg tggttctcga 1620
tcttgctgat gatcttgatg ccgtggcctt cagggcccag agcggctctc acggcggcca 1680
catcagaggc cttccgcacg aagctggcga acacgatgtc cacgccgtgc tccacgccaa 1740
atctcaggtc tctcacgtcc tgctcagaca ggccaggcag gtccacctgg gcgcctggca 1800
gattcacgcc ctttctgctg cccagcacgc cgccattctc gacctgggtc accaggccct 1860
caggtccgat cttctgcacc accaggctga tcaggccgtc gtcgatgtag attctgccgc 1920
ccacaggcac cacccgcacg atgttggggt agtccaccca cactgtgttg gcgttgcctc 1980
tggttctgaa ggcggggtcc acggtcacca gcacttggct gcccttcacc agctccacct 2040
cgctctcagg ccctccctgc agaattcctg ttctgatctc ggggcccttg gtgtccaggg 2100
caatggccac gggtctgtag ctcagggggc tgccggcaaa gctctccacg gcctcccgga 2160
cgttggcaat gctctctgcg tggtactcgt ggctgccgtg ggagaagttc agccgggcga 2220
tattcatgcc ggccttgatc atctctttca gccgctccac gcttctgctg gcagggccga 2280
tggtggcaat gatgctggtg cttctggcgg ccacgggctc agagtcgatg tccagcaggc 2340
acaggtgttc cagaaaggtg tcggccatgg cggctggcag ctgctgctgc tggaaaaagg 2400
cggtgcccag ttcctgggtc agctgggcca cgctagccct tctcaggtat ccggctggtc 2460
cgccaggggc tccgatcagg atgctcttgg ccaggtctct ctggctcttg gacacccagg 2520
accgcagctg cagagagctg atattttcct ggatgctcat gctttcagtg tgggcctggg 2580
gctgcgggac catggaagag agggagagga tgacaaaact gctggtctta tctaagggag 2640
acagagaaga gaaaaggggc acacccagta ggccaccctg tccccacaga atccctcccc 2700
cagaacggcc tgctctctgc cctcatctcc tggcatttcc tctcatcctt ttttcctgat 2760
aaattttcaa tccattcata ctatctggtc atccacgtga atagatattt tttttttggc 2820
cagtcatatg gccccatttt ctttgtactt tactgaagtt agctctagtg aatccaggga 2880
gcaggggctg tagggtgggg ctggagcctg aagaaagaca aaagggatca ctgtgataat 2940
atggtggggg gagggttacc cagttctgac cacttttttt ctctgtctca accaagaaat 3000
gcagagtgcc ttcaccactc tggcggccgc aggaacccct agtgatggag ttggccactc 3060
cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg 3120
gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag ctgcctgcag gggcgcctga 3180
tgcggtattt tctccttacg catctgtgcg gtatttcaca ccgcatacgt caaagcaacc 3240
atagtacgcg ccctgtagcg gcgcattaag cgcggcgggt gtggtggtta cgcgcagcgt 3300
gaccgctaca cttgccagcg ccctagcgcc cgctcctttc gctttcttcc cttcctttct 3360
cgccacgttc gccggctttc cccgtcaagc tctaaatcgg gggctccctt tagggttccg 3420
atttagtgct ttacggcacc tcgaccccaa aaaacttgat ttgggtgatg gttcacgtag 3480
tgggccatcg ccctgataga cggtttttcg ccctttgacg ttggagtcca cgttctttaa 3540
tagtggactc ttgttccaaa ctggaacaac actcaaccct atctcgggct attcttttga 3600
tttataaggg attttgccga tttcggccta ttggttaaaa aatgagctga tttaacaaaa 3660
atttaacgcg aattttaaca aaatattaac gtttacaatt ttatggtgca ctctcagtac 3720
aatctgctct gatgccgcat agttaagcca gccccgacac ccgccaacac ccgctgacgc 3780
gccctgacgg gcttgtctgc tcccggcatc cgcttacaga caagctgtga ccgtctccgg 3840
gagctgcatg tgtcagaggt tttcaccgtc atcaccgaaa cgcgcgagac gaaagggcct 3900
cgtgatacgc ctatttttat aggttaatgt catgataata atggtttctt agacaaacct 3960
agatattgat agtctgatcg gtcaacgtat aatcgagtcc tagcttttgc aaacatctat 4020
caagagacag gatcagcagg aggctttcgc atgattgaac aagatggatt gcacgcaggt 4080
tctccggcgg cttgggtgga gaggctattc ggctatgact gggcacaaca gacaatcggc 4140
tgctctgatg ccgccgtgtt ccggctgtca gcgcaggggc gtccggttct ttttgtcaag 4200
accgacctgt ccggtgccct gaatgaactg caagacgagg cagcgcggct atcgtggctg 4260
gcgacgacgg gcgttccttg cgcggctgtg ctcgacgttg tcactgaagc gggaagggac 4320
tggctgctat tgggcgaagt gccggggcag gatctcctgt catctcacct tgctcctgcc 4380
gagaaagtat ccatcatggc tgatgcaatg cggcggctgc atacgcttga tccggctacc 4440
tgcccattcg accaccaagc gaaacatcgc atcgagcgag cacgtactcg gatggaagcc 4500
ggtcttgtcg atcaggatga tctggacgaa gagcatcagg ggctcgcgcc agccgaactg 4560
ttcgccaggc tcaaggcgtc tatgcccgac ggcgaggatc tcgtcgtgac ccacggcgat 4620
gcctgcttgc cgaatatcat ggtggaaaat ggccgctttt ctggattcat cgactgtggc 4680
cgtctgggtg tggcggaccg ctatcaggac atagcgttgg ctacccgtga tattgctgaa 4740
gagcttggcg gcgaatgggc tgaccgcttc cttgtgcttt acggtatcgc cgcgcccgat 4800
tcgcagcgca tcgccttcta tcgccttctt gacgagttct tctgaccgat tctaggtgca 4860
ttggcgcaga aaaaaatgcc tgatgcgacg ctgcgcgtct tatactccca catatgccag 4920
attcagcaac ggatacggct tccccaactt gcccacttcc atacgtgtcc tccttaccag 4980
aaatttatcc ttaacgatcg gacggggagt caggcaacta tggatgaacg aaatagacag 5040
atcgctgaga taggtgcctc actgattaag cattggtaac tgtcagacca agtttactca 5100
tatatacttt agattgattt aaaacttcat ttttaattta aaaggatcta ggtgaagatc 5160
ctttttgata atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca 5220
gaccccgtag aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc 5280
tgcttgcaaa caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta 5340
ccaactcttt ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgttctt 5400
ctagtgtagc cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc 5460
gctctgctaa tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg 5520
ttggactcaa gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg 5580
tgcacacagc ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag 5640
ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc 5700
agggtcggaa caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat 5760
agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg 5820
gggcggagcc tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc 5880
tggccttttg ctcacatgt 5899
<210> 27
<211> 5875
<212> DNA
<213> Artificial Sequence
<220>
<223> coRPK AAV for clinical use
<400> 27
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct gcggccgctg tcaccactgt ctcctgttcc attggaagcc ctgtatgcca 180
ggggccagag tccaggaacc acgggagtgc cccgtggctt acatgctgtg gctctggcct 240
gcctataggg cctggaaaag acccaggcca gggtccataa tttaacacac gggaggctct 300
gaagaacgta cgttcctctc caaaacccac ctagccagtg gctgatgtgg atcatttatg 360
ccctccaccc tggctcctag ttttcaccct cattttcctc ctatgttcca tggcttctgt 420
ctccccttct tacctcctgg agccccaatc aggatggact ttgctaagtc tctttgggac 480
ttagagaccc atgaccgaag ctgcagggat gatatgttct cctggatcga catgctttca 540
gtgtgggcct ggggctgcgg gacccataga gcccaccgca tccccagcat gcctgctatt 600
gtcttcccaa tcctccccct tgctgtcctg ccccacccca ccccccagaa tagaatgaca 660
cctactcaga caatgcgatg caatttcctc attttattag gaaaggacag tgggagtggc 720
accttccagg gtcaaggaag gcacggggga ggggcaaaca acagatggct ggcaactaga 780
aggcacagtg ctttatttgt aactcacgcg ttcagctgat ggacagcacc ctcatgatgt 840
tggtgtagcc gctgccaggc cgccagcctg tcaccacgat caccaggtcg cccactctca 900
ggaagccccg cagcttgccg ctctcgatgc cgaactgcac ccgtctgtcc acgtcgtcgg 960
cccagatggc ctcgggaggc tcccggtaca gcagggggaa cacgcctctg cacaggtgga 1020
cctgtctagc ggcctgggcg gatcttgtca cggcgatcac ggcggctctg ggtctgtatc 1080
tggacagcag ctgggcgctt ctgcctgtgg tggtcagcac gatgattgca gcggcgcagc 1140
acttgaaggc ggcttccacg gctccgatgg cggtcacttc ggtgggatct ctgctcagag 1200
gggcggctct ccgcagttcc tcgaacagct gccggtggta cacggcggcc tcggcttctc 1260
tggcaatggc gtgctgcatc ttcacggcct ccacggggaa gttgcccttg gctgtctcgc 1320
cggacagcat gatgcagtca gcgccatcca gcacggcgtt ggccacgtcg cttgtctcgg 1380
ctctggtggg tctgggcttg gtgatcatgc tttccagcat ctgggtggcg cacaccacag 1440
gtttgccggc caggttgcac cgtccgatca tcattttctg ggccaggaac accttctcgg 1500
cggggatctc gatgcccagg tcgcctctgg ccaccatgat gccgtcggac acttccagga 1560
tctcgtcgaa ccgcttcacg ccctcgtggt tctcgatctt gctgatgatc ttgatgccgt 1620
ggccttcagg gcccagagcg gctctcacgg cggccacatc agaggccttc cgcacgaagc 1680
tggcgaacac gatgtccacg ccgtgctcca cgccaaatct caggtctctc acgtcctgct 1740
cagacaggcc aggcaggtcc acctgggcgc ctggcagatt cacgcccttt ctgctgccca 1800
gcacgccgcc attctcgacc tgggtcacca ggccctcagg tccgatcttc tgcaccacca 1860
ggctgatcag gccgtcgtcg atgtagattc tgccgcccac aggcaccacc cgcacgatgt 1920
tggggtagtc cacccacact gtgttggcgt tgcctctggt tctgaaggcg gggtccacgg 1980
tcaccagcac ttggctgccc ttcaccagct ccacctcgct ctcaggccct ccctgcagaa 2040
ttcctgttct gatctcgggg cccttggtgt ccagggcaat ggccacgggt ctgtagctca 2100
gggggctgcc ggcaaagctc tccacggcct cccggacgtt ggcaatgctc tctgcgtggt 2160
actcgtggct gccgtgggag aagttcagcc gggcgatatt catgccggcc ttgatcatct 2220
ctttcagccg ctccacgctt ctgctggcag ggccgatggt ggcaatgatg ctggtgcttc 2280
tggcggccac gggctcagag tcgatgtcca gcaggcacag gtgttccaga aaggtgtcgg 2340
ccatggcggc tggcagctgc tgctgctgga aaaaggcggt gcccagttcc tgggtcagct 2400
gggccacgct agcccttctc aggtatccgg ctggtccgcc aggggctccg atcaggatgc 2460
tcttggccag gtctctctgg ctcttggaca cccaggaccg cagctgcaga gagctgatat 2520
tttcctggat gctcatgctt tcagtgtggg cctggggctg cgggaccatg gaagagaggg 2580
agaggatgac aaaactgctg gtcttatcta agggagacag agaagagaaa aggggcacac 2640
ccagtaggcc accctgtccc cacagaatcc ctcccccaga acggcctgct ctctgccctc 2700
atctcctggc atttcctctc atcctttttt cctgataaat tttcaatcca ttcatactat 2760
ctggtcatcc acgtgaatag atattttttt tttggccagt catatggccc cattttcttt 2820
gtactttact gaagttagct ctagtgaatc cagggagcag gggctgtagg gtggggctgg 2880
agcctgaaga aagacaaaag ggatcactgt gataatatgg tggggggagg gttacccagt 2940
tctgaccact ttttttctct gtctcaacca agaaatgcag agtgccttca ccactctggc 3000
ggccgcagga acccctagtg atggagttgg ccactccctc tctgcgcgct cgctcgctca 3060
ctgaggccgg gcgaccaaag gtcgcccgac gcccgggctt tgcccgggcg gcctcagtga 3120
gcgagcgagc gcgcagctgc ctgcaggggc gcctgatgcg gtattttctc cttacgcatc 3180
tgtgcggtat ttcacaccgc atacgtcaaa gcaaccatag tacgcgccct gtagcggcgc 3240
attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc gctacacttg ccagcgccct 3300
agcgcccgct cctttcgctt tcttcccttc ctttctcgcc acgttcgccg gctttccccg 3360
tcaagctcta aatcgggggc tccctttagg gttccgattt agtgctttac ggcacctcga 3420
ccccaaaaaa cttgatttgg gtgatggttc acgtagtggg ccatcgccct gatagacggt 3480
ttttcgccct ttgacgttgg agtccacgtt ctttaatagt ggactcttgt tccaaactgg 3540
aacaacactc aaccctatct cgggctattc ttttgattta taagggattt tgccgatttc 3600
ggcctattgg ttaaaaaatg agctgattta acaaaaattt aacgcgaatt ttaacaaaat 3660
attaacgttt acaattttat ggtgcactct cagtacaatc tgctctgatg ccgcatagtt 3720
aagccagccc cgacacccgc caacacccgc tgacgcgccc tgacgggctt gtctgctccc 3780
ggcatccgct tacagacaag ctgtgaccgt ctccgggagc tgcatgtgtc agaggttttc 3840
accgtcatca ccgaaacgcg cgagacgaaa gggcctcgtg atacgcctat ttttataggt 3900
taatgtcatg ataataatgg tttcttagac aaacctagat attgatagtc tgatcggtca 3960
acgtataatc gagtcctagc ttttgcaaac atctatcaag agacaggatc agcaggaggc 4020
tttcgcatga ttgaacaaga tggattgcac gcaggttctc cggcggcttg ggtggagagg 4080
ctattcggct atgactgggc acaacagaca atcggctgct ctgatgccgc cgtgttccgg 4140
ctgtcagcgc aggggcgtcc ggttcttttt gtcaagaccg acctgtccgg tgccctgaat 4200
gaactgcaag acgaggcagc gcggctatcg tggctggcga cgacgggcgt tccttgcgcg 4260
gctgtgctcg acgttgtcac tgaagcggga agggactggc tgctattggg cgaagtgccg 4320
gggcaggatc tcctgtcatc tcaccttgct cctgccgaga aagtatccat catggctgat 4380
gcaatgcggc ggctgcatac gcttgatccg gctacctgcc cattcgacca ccaagcgaaa 4440
catcgcatcg agcgagcacg tactcggatg gaagccggtc ttgtcgatca ggatgatctg 4500
gacgaagagc atcaggggct cgcgccagcc gaactgttcg ccaggctcaa ggcgtctatg 4560
cccgacggcg aggatctcgt cgtgacccac ggcgatgcct gcttgccgaa tatcatggtg 4620
gaaaatggcc gcttttctgg attcatcgac tgtggccgtc tgggtgtggc ggaccgctat 4680
caggacatag cgttggctac ccgtgatatt gctgaagagc ttggcggcga atgggctgac 4740
cgcttccttg tgctttacgg tatcgccgcg cccgattcgc agcgcatcgc cttctatcgc 4800
cttcttgacg agttcttctg accgattcta ggtgcattgg cgcagaaaaa aatgcctgat 4860
gcgacgctgc gcgtcttata ctcccacata tgccagattc agcaacggat acggcttccc 4920
caacttgccc acttccatac gtgtcctcct taccagaaat ttatccttaa cgatcggacg 4980
gggagtcagg caactatgga tgaacgaaat agacagatcg ctgagatagg tgcctcactg 5040
attaagcatt ggtaactgtc agaccaagtt tactcatata tactttagat tgatttaaaa 5100
cttcattttt aatttaaaag gatctaggtg aagatccttt ttgataatct catgaccaaa 5160
atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa gatcaaagga 5220
tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg 5280
ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc gaaggtaact 5340
ggcttcagca gagcgcagat accaaatact gttcttctag tgtagccgta gttaggccac 5400
cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct gttaccagtg 5460
gctgctgcca gtggcgataa gtcgtgtctt accgggttgg actcaagacg atagttaccg 5520
gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca cacagcccag cttggagcga 5580
acgacctaca ccgaactgag atacctacag cgtgagctat gagaaagcgc cacgcttccc 5640
gaagggagaa aggcggacag gtatccggta agcggcaggg tcggaacagg agagcgcacg 5700
agggagcttc cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc 5760
tgacttgagc gtcgattttt gtgatgctcg tcaggggggc ggagcctatg gaaaaacgcc 5820
agcaacgcgg cctttttacg gttcctggcc ttttgctggc cttttgctca catgt 5875
<210> 28
<211> 218
<212> DNA
<213> Homo sapiens
<220>
<223> RPK CDS (Fig 1)
<400> 28
gttctggggg agggattctg tggggacagg gtggcctact gggtgtgccc cttttctctt 60
ctctgtctcc cttagataag accagcagtt ttgtcatcct ctccctctca ttccatggtc 120
ccgcagcccc aggcccacac tgaaagcatg tcgatccagg agaacatatc atccctgcag 180
cttcggtcat gggtctctaa gtcccaaaga gacttagc 218
<210> 29
<211> 107
<212> DNA
<213> Artificial Sequence
<220>
<223> PKLR locus (Fig 7)
<400> 29
tctgtctccc ttagataaga ccagcagttt tgtcatcctc tccctctcat tccatggtcc 60
cgcagcccca ggcccacact gaaagcatgt cgatccagga gaacata 107
<210> 30
<211> 88
<212> DNA
<213> Artificial Sequence
<220>
<223> Genomic region of the starting site of the RPK transcript variant
(Fig 8, 9, 10, 11)
<400> 30
aagaccagca gttttgtcat cctctccctc tcattccatg gtcccgcagc cccaggccca 60
cactgaaagc atgtcgatcc aggagaac 88
<210> 31
<211> 158
<212> DNA
<213> Artificial Sequence
<220>
<223> 5’UTR position with respect to LHA and coRPK without start condon
in coRPK- AAV vector (Fig 12)
<400> 31
agggtggcct actgggtgtg ccccttttct cttctctgtc tcccttagat aagaccagca 60
gttttgtcat cctctccctc tcttccatgg tcccgcagcc ccaggcccac actgaaagca 120
tgagcatcca ggaaaatatc agctctctgc agctgcgg 158
<210> 32
<211> 154
<212> DNA
<213> Artificial Sequence
<220>
<223> FLAG-Tag position with respect to coRPK without STOP condon and
bGH poly(A) signal in coRPK-AAV vector (Fig 13)
<400> 32
gcgacctggt gatcgtggtg acaggctggc ggcctggcag cggctacacc aacatcatga 60
gggtgctgtc catcagcgac tacaaagacg atgacgataa atgaacgcgt gagttacaaa 120
taaagcactg tgccttctag ttgccagcca tctg 154
<210> 33
<211> 480
<212> DNA
<213> Artificial Sequence
<220>
<223> bGH poly(A) signal with respect to coRPK-FLAG and RHA in
coRPK-AAV vector (Fig 14)
<400> 33
agtgggcgac ctggtgatcg tggtgacagg ctggcggcct ggcagcggct acaccaacat 60
catgagggtg ctgtccatca gcgactacaa agacgatgac gataaatgaa cgcgtgagtt 120
acaaataaag cactgtgcct tctagttgcc agccatctgt tgtttgcccc tcccccgtgc 180
cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat gaggaaattg 240
catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg caggacagca 300
agggggagga ttgggaagac aatagcaggc atgctgggga tgcggtgggc tctatgggtc 360
ccgcagcccc aggcccacac tgaaagcatg tcgatccagg agaacatatc atccctgcag 420
cttcggtcat gggtctctaa gtcccaaaga gacttagcaa agtccatcct gattggggct 480
<210> 34
<211> 23
<212> PRT
<213> Artificial Sequence
<220>
<223> Aminoacid seq. RPK (Fig 1)
<400> 34
Met Ser Ile Gln Glu Asn Ile Ser Ser Leu Gln Leu Arg Ser Trp Val
1 5 10 15
Ser Lys Ser Gln Arg Asp Leu
20
<210> 35
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> Aminoacid seq. RPK (Figs 8-11)
<400> 35
Met Ser Ile Gln Glu Asn
1 5
<210> 36
<211> 35
<212> PRT
<213> Artificial Sequence
<220>
<223> Aminoacid seq. from aminoacids 748 to 782 (Fig 14)
<400> 36
Val Gly Asp Leu Val Ile Val Val Thr Gly Trp Arg Pro Gly Ser Gly
1 5 10 15
Tyr Thr Asn Ile Met Arg Val Leu Ser Ile Ser Asp Tyr Lys Asp Asp
20 25 30
Asp Asp Lys
35
<210> 37
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<223> Aminoacid seq. from aminoacids 784 to 794 (Fig 14)
<400> 37
Thr Arg Glu Leu Gln Ile Lys His Cys Ala Phe
1 5 10
<210> 38
<211> 28
<212> PRT
<213> Artificial Sequence
<220>
<223> Aminoacid seq. from aminoacids 796 to 823 (Fig 14)
<400> 38
Leu Pro Ala Ile Cys Cys Leu Pro Leu Pro Arg Ala Phe Leu Asp Pro
1 5 10 15
Gly Arg Cys His Ser His Cys Pro Phe Leu Ile Lys
20 25
<210> 39
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Aminoacid seq. from aminoacids 825 to 832 (Fig 14)
<400> 39
Gly Asn Cys Ile Ala Leu Ser Glu
1 5
<210> 40
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> Aminoacid seq. from aminoacids 834 to 853 (Fig 14)
<400> 40
Val Ser Phe Tyr Ser Gly Gly Trp Gly Gly Ala Gly Gln Gln Gly Gly
1 5 10 15
Gly Leu Gly Arg
20