CN116648511A

CN116648511A - 丙酮酸激酶缺乏症(pkd)基因编辑治疗方法

Info

Publication number: CN116648511A
Application number: CN202180053301.9A
Authority: CN
Inventors: J·C·塞戈比亚·桑斯; O·昆塔纳·布斯塔曼特; S·范安娜·巴克罗; M·波特斯
Original assignee: Biomedical Network Research Consortium Center; Himenez Diaz Health Research Foundation Institute; Energy Environment And Technology Research Center Oamp; Leland Stanford Junior University
Current assignee: Biomedical Network Research Consortium Center; Energy Environment And Technology Research Center Oamp; Himenez Diaz Health Research Foundation Institute
Priority date: 2020-06-26
Filing date: 2021-06-28
Publication date: 2023-08-25
Also published as: EP4172332A1; CA3188164A1; MX2023000035A; KR20230029922A; US20230303990A1; JP2023531718A; EP3929294A1; WO2021260227A1; AU2021298186A1

Abstract

本发明涉及使用成簇规律间隔短回文重复序列(CRISPR)系统治疗丙酮酸激酶缺乏症(PKD)。该技术提供了设计改进的单链向导RNA(sgRNA)的可能性，特别是与tracrRNA相关的改进的crRNA，其被并入CRISPR相关蛋白(Cas9)中，以识别和诱导特定靶位置处的DNA双链断裂。DNA双链断裂将在PKLR基因修复的供体序列存下通过同源重组(HR)进行修复。

Description

丙酮酸激酶缺乏症(PKD)基因编辑治疗方法

发明领域

本发明涉及使用成簇规律间隔短回文重复序列(CRISPR)系统治疗丙酮酸激酶缺乏症(PKD)。该技术提供了设计改进的单链向导RNA(sgRNA)的可能性，特别是与tracrRNA或接头相关的改进的crRNA，其被并入CRISPR相关蛋白(Cas9)中，以识别和诱导特定靶位置处的DNA双链断裂。DNA双链断裂将在用于PKLR基因修复的供体序列存在下通过同源重组(HR)进行修复。

发明背景

丙酮酸激酶缺乏(PKD)是引起慢性非球形红细胞溶血性贫血的最常见的红系遗传性酶缺陷。在白种人中，PKD的患病率估计为每100,000人1至9例。PKD是由PKLR基因中的突变引起的常染色体隐性遗传病。该基因编码分别在红细胞和肝脏中表达的两种不同的转录物变体RPK和LPK。至今，已有超过200种不同的PKLR基因突变与PKD相关。PKD的治疗方案是姑息性的，包括常规红细胞输注、脾切除术和铁螯合疗法。目前，同种异体造血干细胞移植(HSCT)代表了对重症患者的唯一治愈性治疗。基因校正细胞的自体HSCT，又被称为造血干细胞和祖细胞(HSPC)基因疗法，正被用于治疗许多血细胞遗传病。CIEMAT最近开发了用于校正PKD的慢病毒载体，该慢病毒载体已获得孤儿药资格认定(EU/3/14/1330；FDA#DRU-2016-5168)。这种慢病毒介导的基因治疗方法将通过单次治疗提供持久治愈的临床益处。

在过去几年里，基因编辑因可精确地校正遗传突变已成为用于血细胞疾病的有前景的基因治疗方法。通过使用工程化内切核酸酶在募集DNA修复细胞机制的特定基因组位置中切割产生双链断裂(DSB)，同时将所需的待引入的DNA序列引入该特定位点，已经将基因编辑效率提高到被认为临床适用的百分比。CRISPR-Cas9系统是目前描述的工程化内切核酸酶之一。已经证明向细胞中引入特异性sgRNA加上Cas9蛋白以及使用腺相关病毒(AAV)来递送供体模板是靠近基因编辑领域进行遗传性造血疾病患者的治疗的最有效的系统，所述特异性sgRNA识别基因组中特有的特异性位点，所述Cas9蛋白在该位点产生DSB，二者作为复合物又被称为核糖核蛋白复合物(RNPS)(Dever,Bak et al.2016,Bak,Dever etal.2018,Charlesworth,Camarena et al.2018,Pavel-Dinu,Wiebking et al.2019)。CIEMAT已经建立了这种校正PKD的方法，并且发现最高达40％的人造血祖细胞已经通过组合特异性RNP和AAV利用治疗性RPK(R-型丙酮酸激酶)基因座进行基因编辑。所获得的结果表明，在短期内极有可能临床应用基因编辑疗法来校正PKD。

当前使用基因编辑来治疗遗传病的瓶颈之一是在不同于所选择的特定在靶位点的位置产生DSB，这可能产生具有非期望的基因修饰和预料不到的临床效果。由产生非期望的DSB形成的CRISPR-Cas9系统的这种副作用被称为脱靶效应。由特异性sgRNA产生的脱靶可能妨碍其临床应用，因为造血干细胞基因疗法意味着数百万HSPC的基因修饰，因此在其基因组中携带非期望的改变的细胞数目可能是相当大量的。在移植的HSPC之一中的单次非期望修饰可能引起不受控制的克隆增殖，这可能会危害治疗并使患者的健康处于风险之中。如先前在天然环境以及造血干细胞基因治疗环境中所描述的，单个HSPC基因组中的改变或病毒载体在宿主基因组中的随机整合能够触发白血病进程(Greaves and Maley2012)。因此，使用CRISPR系统的重要挑战是需要鉴定并最小化由这些核酸酶诱导的潜在有害的脱靶突变。尽管使用高保真Cas9显著降低了脱靶活性(Vakulskas,Dever etal.2018)，在使用基因编辑治疗患者之前，需要仔细分析治疗性RNP的脱靶效应。

潜在的脱靶效应的高灵敏度分析对于任何临床应用是强制性的，因为甚至低频事件也可能导致有害的结果。涉及潜在脱靶的计算机预测方法最常用于预测脱靶效应。然而，这些方法不考虑潜在脱靶的基因组位置，也不考虑感兴趣的细胞类型。因此，它们鉴定特异性sgRNA的脱靶位点的能力非常有限。分析基因编辑技术副作用的理想方法应当是以全基因组无偏方式且高灵敏度地识别脱靶位点的方法；也就是说，具有在非常大的细胞群中检测甚至低频的突变的能力。GUIDE-seq基于双链寡脱氧核苷酸(dsODN)标签的有效整合，随后是标签特异性扩增和高通量测序。GUIDE-seq是高灵敏度的，并且可检测在细胞群中由所测试的sgRNA诱变的脱靶位点。GUIDE-seq的一些优点包括其实验简单、高效和精确，以及在生理学相关的细胞环境中检测核酸酶诱导的DSB的修复结果。CIEMAT已经通过GUIDE-seq在HSPC自身中评估了相关sgRNA的脱靶效应，遵循最严格的标准来选择基于基因编辑的治疗工具。这些类型的基因编辑平台副作用的全基因组无偏分析将保证HSPC中基因编辑的临床应用的安全性。

附图简述

图1：显示相对于RPK起始密码子的不同单链向导RNA位置的图。部分RPK CDS标记为紫色。RPK起始密码子的ATG显示为绿色。RPK起始密码子上游30bp的隐性ATG显示为红色。另外，基因组中除了SG1靶之外的单链向导RNA靶用蓝色框显示，SG1靶用红色框显示。

图2：不同单链向导RNA识别PKLR基因座的效力。通过Surveyor法分析人细胞系K562中SG1、SG2、SG3和SG4向导的Indel(插入/缺失)频率。纯化基因组DNA，并进行PCR以扩增RPK基因起始密码子周围的区域。然后，根据制造商说明，利用Surveyor核酸酶S消化PCR产物，并通过10％ Novex TBE凝胶分离来评估消化的产物。分析凝胶图像，以便通过测量不同条带的密度测定值来测量裂解。

图3：不同单链向导RNA识别PKLR基因座的Indel频率的效力。通过TIDE法分析人CB-CD34⁺细胞中SG1、SG3、SG5、SG6和SG8的Indel频率。纯化基因组DNA，并进行PCR以扩增PKLR基因的RPK转录物变体起始密码子周围的区域。然后，对PCR产物进行Sanger测序。未编辑的细胞总是用作用TIDE计算INDEL频率的阴性对照。最后，通过使用TIDE软件(https://tide.deskgen.com/)计算Indel频率来评估所设计向导的活性。

图4：所选择的单链向导RNA的脱靶分析。在用与WT-Cas9或HiFi-Cas9蛋白处于RNP形式的SG1向导RNA电穿孔的Jurkat细胞中进行GUIDE-seq分析。5天后，分离基因组DNA。使用IDT内部向导分析工具，确定448个脱靶位点，其中147个出现于>1％的读长中。来自用WT-Cas9 RNP编辑的样品的读长有84％显示特异性在靶基因编辑，并且当使用HiFi-Cas9进行RNP形成时，该百分比增加(94％的Indel发生于在靶位点中)，表明PKLR SG1 RNP是安全有效的。

图5：用SG1、SG9和SG10 RNP(与WT-Cas9或HiFi-Cas9复合)编辑的hCD34⁺细胞中不同在靶位点处的HDR相比NHEJ分析。由图4设计rhAmpSeq分析。简言之，用rhAmpSeq池扩增来自使用PKLR SG1的GUIDE-Seq实验的最高命中(top Hits)(1个在靶位点ON和48个脱靶位点OT)。然后，文库在MiSeq系统上运行并用内部分析工具进行分析。通过将NHEJ的百分比与不完全HDR(部分HDR模板的同源重组)的百分比和完全HDR(整个HDR模板的同源重组)的百分比相加来计算切割位点处的编辑水平。SG1 RNP显示出在靶位点处最高的基因编辑活性。使用WT-或HiFi-Cas9时，在完全HDR水平上未发现差异(分别为30.6％相比30.4％)，但是使用HiFi-Cas9时，NHEJ和不完全HDR水平降低。灰色，完全HDR的百分比；橙色，不完全HDR的百分比；蓝色，NHEJ的百分比。

图6：用SG1 RNP复合物电穿孔的CB-hCD34⁺细胞中由高-低排序的前十个位点的脱靶分析。由图4设计rhAmpSeq分析。使用SG1单链向导RNA与WT-Cas9或HiFi-Cas9(IDT)复合形成的RNP复合物来编辑CB-hCD34⁺细胞。另外，在一些样品中加入特异性HDR模板。用rhAmpSeq池扩增来自使用PKLR SG1的GUIDE-Seq实验的最高命中(1个在靶位点ON和48个脱靶位点OT)。然后，文库在MiSeq系统上运行，并用内部分析工具进行分析。显示前十个位点中RNP[WT-或HiFi-Cas9 HiFi+SG1(PKLR SG1 ATG)]±HDR-SG1模板的总基因编辑效率。橙色柱和黄色柱中，基因编辑由不存在特异性HDR模板时分别与WT-Cas9或HiFi-Cas9复合的SG1引起。蓝色柱和灰色柱中，基因编辑由存在特异性HDR模板时分别与WT-Cas9或HiFi-Cas9复合的SG1引起。不连续的红线指示检测极限(<0.1％)。当使用HiFi-Cas9时，与来自WT-Cas9编辑的读长(蓝色柱和橙色柱)相比，脱靶读长的数目明显减少(灰色柱和黄色柱)。不存在HDR模板时，对应于脱靶位点的所有读长都在检测限以下(0.1％)，并且用SG1-Cas9RNP和HDR模板编辑细胞时获得的最高脱靶得分为0.13％。

图7：将报告基因和治疗性同源供体靶向PKLR基因座的方案。设计两个构建体在RPK转录物变体的基因组起始位点(RPK的起始密码子[ATG]为红色)进行i)报告基因供体(上面紫色部分)和ii)治疗性供体(下面蓝色部分)的敲入。最佳向导RNA(粉红色，SG1)导致切割ATG位点上游38bp(PAM序列为浅蓝色)。对于报告基因供体(图的上面紫色部分)，将切割位点附近的425bp序列用作同源臂(HA)，将其克隆到侧面有UBC启动子、turboGFP序列和bGH基因的聚腺苷酸化信号的AAV构建体中。对于治疗性供体(图的下面蓝色部分)，用作RHA的序列与在报告基因供体中使用的相同，以尽可能使构建体具有可比性。为了加入部分RPK5’UTR序列(棕色)，LHA向上游移位8bp，但保持425bp的大小。治疗性供体中的LHA和RHA在包含5’UTR序列、RPK转录物变体的密码子优化版本(coRPK)、FLAG-Tag序列和bGH基因的聚腺苷酸化信号的构建体两侧。

图8：SG1(SEQ ID NO.:1)。在靶序列。该图显示RPK转录物变体起始位点的基因组区域，为浅紫色。示出蛋白的前27个氨基酸。SG1的切割位点位于RPK起始密码子上游38bp处，显示为浅红色。PAM序列和SG1的切割位点在下面标记为深紫色。设计不同的向导RNA来引入靠近RPK转录物变体的转录起始位点的DSB使用可用于该目的的不同网络工具进行，如Dr.Zhang的实验室工具(https://zlab.bio/guide-design-resources)或Integrated DNATechnologies(IDT)网站(https://eu.idtdna.com/site/order/designtool/index/CRISPR_SEQUENCE。SEQ ID NO.:1:CTGCGGGACCATGGAATGAG

图9：显示相对于SG1在靶的LHA位置的图。

图10：显示相对于SG1在靶和RPK起始密码子的LHA和RHA位置的图。表示RPK转录物变体的转录起始位点周围的序列的图(CDS为浅紫色)，分别显示SG1识别位点(红色)，由该SG1产生的切割位点(深紫色)以及右同源臂和左同源臂的同源区的起始(绿色)。在LHA和RHA之间分开SG1的靶序列，以避免基因编辑后的再切割。

图11：显示相对于PKLR基因座中的两个同源臂的5’UTR位置的图。5’UTR加黑。5’UTR区的指定部分为由SG1产生的DSB的上游，因此，在插入治疗性盒后将内源5’UTR分开。颜色图例如图9所示。黄色，5’UTR。

图12：显示coRPK-AAV载体中相对于LHA和无起始密码子的coRPK的5’UTR位置的图。图11中提及的5’UTR的部分序列克隆在左同源臂和coRPK的cDNA之间，以保持RPK转录物变体的内源调控。转录起始位点由克隆的5’UTR提供。蓝色，5’UTR位置；绿色，LHA和coRPK序列。

图13：显示coRPK-AAV载体中相对于无终止(STOP)密码子和bGH poly(A)信号的coRPK的FLAG-Tag位置的图。去除coRPK终止密码子并在同一开放阅读框(ORF)中克隆FLAG-Tag序列之后，形成coRPK和FLAG-Tag之间的融合蛋白。在3’FLAG-Tag序列中提供终止密码子。蓝色，FLAG-Tag序列；浅绿色，coRPK序列；深绿色，bGH聚腺苷酸化信号。

图14：显示coRPK-AAV载体中相对于coRPK-FLAG和RHA的bGH poly(A)信号的图。在coRPK-FLAG tag cDNA的上游，克隆牛生长激素聚腺苷酸化(bGH poly(A))信号以高效转录治疗性盒。在该聚腺苷酸化信号之后克隆右同源臂(RHA)。蓝色，FLAG-Tag和部分SG1向导序列，位于RHA中；浅绿色，coRPK和RHA序列；深绿色，bGH聚腺苷酸化信号。

图15：来自具有红系分化能力的PKD患者的HSPC的基因编辑。A)特异性in-out PCR证实5’(LHA)和3’(RHA)连接处治疗性供体(coRPK-AAV+RNP)的正确整合。B)相对于源自未编辑的PKD-HSPC的红系细胞的源自三名PKD患者的经编辑的HSPC的红系细胞的ATP定量。HD未编辑的：来自在体外已经历红系分化的健康供体的HSPC；PKD未编辑的：来自在体外已经历红系分化的PKD患者的HSPC；PKD GFP/coRPK：来自在体外已经历用GFP-AAV或coRPK-AAV基因编辑且随后红系分化的PKD患者的HSPC。进行Kruskal-Wallis多重比较检验；P值如图所示。ns＝不显著。

图16：序列13至27的示意图。

发明详述

定义

如本文所用，除非另有说明，以下术语具有赋予它们的含义。

本文使用的术语“一个”、“一种”或“所述”不仅包括具有一个成员的方面，而且包括具有一个以上成员的方面。例如，除非上下文另有明确规定，单数形式“一个”、“一种”和“所述”包括复数指示物。因此，例如，提及“一个细胞”包括多个这样的细胞，并且提及“所述试剂”包括提及本领域技术人员已知的一种或多种试剂，等等。

术语“基因”是指多核苷酸元件的组合，当以天然或重组方式可操作地连接时，其提供一些产物或功能。术语“基因”应被广泛地解释，并且可包括基因的mRNA、cDNA、cRNA和基因组DNA形式。

术语“同源性定向修复”或“HDR”是指在细胞中使用同源模板来指导修复以准确且精确地修复双链DNA断裂的机制。HDR的基础机制是同源重组(HR)。

术语“同源重组”或“HR”是指在DNA的两个类似分子之间交换核苷酸序列的遗传过程。细胞使用同源重组(HR)来精确修复发生在DNA两条链上的有害断裂，被称为双链断裂或产生突出序列的其他断裂。

术语“单链向导RNA”或“sgRNA”是指靶向DNA的RNA，其包含将Cas核酸酶靶向靶基因组DNA的向导序列和与Cas核酸酶(如tracrRNA)相互作用的支架序列。优选地，所述sgRNA包含SEQ ID NO.:1或由SEQ ID NO.:1组成。

术语“Cas多肽”或“Cas核酸酶”是指成簇规律间隔短回文重复序列相关的多肽或核酸酶，其切割DNA以在由包含于crRNA分子内的20个核苷酸的向导序列指定位点的双链断裂处产生平端。Cas核酸酶需要用于位点特异性DNA识别和切割的crRNA和tracrRNA。crRNA通过部分互补的区域或通过接头与tracrRNA结合，以将Cas核酸酶引导至与靶DNA中的crRNA同源的区域，被称为“前间隔序列”。

术语“HiFi-Cas9”在本文中被理解为作为核糖核蛋白复合物递送的高保真Cas9突变体，其能够高效地进行基因编辑，具有与野生型Cas9类似的在靶活性，但具有降低的脱靶活性。Vakulskas et al.描述了HiFi-Cas9(Vakulskas,Dever et al.2018)中。

术语“核糖核蛋白复合物”或“RNP复合物”是指包含sgRNA和Cas多肽的复合物。

术语“递送供体模板的腺相关病毒载体”或“含有供体模板的腺相关病毒载体”是指可递送用于在靶细胞(如原代细胞)中经由同源定向修复进行基于CRISPR的基因编辑的重组供体模板的腺相关病毒颗粒。

术语“重组供体模板”是指核酸链，如DNA链，其为同源重组链侵入期间由受损的DNA修复机制起始的供体链，在一些情况下，受损的DNA修复机制由双链断裂引起。供体多核苷酸用作指导受损的DNA区域修复的模板材料。

在两种或更多种核酸或多肽的背景下，术语“序列同一性”或“百分比同一性”是指如使用序列比较算法(如，通过BLAST比对或技术人员已知的任何其他算法)或者通过目测所测量的，与第二分子进行最大对应关系的比较和比对时，两个或更多个序列或子序列是一样的(“相同的”)，或具有相同的氨基酸残基或核苷酸的特定百分比(“百分比同一性”)。

术语“同源的”是指天然或人工源自共同的祖先蛋白或氨基酸序列的两个或多个氨基酸序列。类似地，当核苷酸序列天然地或人工地源自共同的祖先核酸时，它们是同源的。

术语“原代细胞”是指直接从多细胞生物中分离的细胞。与连续(肿瘤或人工永生化)的细胞系相比，原代细胞通常经历非常少的群体倍增，因此更能代表它们所来源的组织的主要功能成分。在一些情况下，原代细胞是已经分离然后立即使用的细胞。在另一些情况下，原代细胞不能无限分裂，因此不能在体外长期培养。

术语“基因修饰的原代细胞”或“基因组编辑的原代细胞”是指在某些情况下已将异源核酸引入其内源基因组DNA的原代细胞。

术语“药物组合物”是指生理学上可接受且药理学上可接受的组合物。在一些情况下，组合物包括用于储存缓冲和保存的试剂，并且可包括用于适合于递送的缓冲液和载体，这取决于施用途径。

术语“药学上可接受的载体”是指有助于向细胞、生物体或对象施用试剂(如，Cas核酸酶、经修饰的单链向导RNA、基因修饰的原代细胞等)的物质。“药学上可接受的载体”是指可包含在组合物或制剂中且对患者没有显著不良毒理学作用的载体或赋形剂。药学上可接受的载体的非限制性示例包括水、NaCl、生理盐水溶液、乳酸化林格氏液、正常蔗糖、正常葡萄糖、粘合剂、填充剂、崩解剂、润滑剂、涂层、甜味剂、调味剂和着色剂等。本领域技术人员将认识到在本发明中有用的其他药物载体。

术语“施用”或“给药”是指将本文公开的试剂、组合物、剂型和/或组合递送至对象用于治疗或预防目的的方法。本文公开的组合物、剂型和/或组合根据良好医学实践考虑对象的临床状况、施用部位和方法、剂量、对象年龄、性别、体重和医师已知的其他因素来施用。例如，术语“施用”或“给药”包括由临床医生或其他临床专业人员提供、给予、给药和/或开具本文公开的试剂、组合物、剂型和/或组合。

术语“治疗”是指获得有益或期望结果的方法，包括但不限于治疗益处和/或预防益处。治疗益处是指在治疗中对一种或多种疾病、病症或症状的任何治疗上相关的改善或作用。为了预防益处，可将组合物施用于处于发展特定疾病、病症或症状的风险中的对象，或施用于报告疾病的一种或多种生理症状的对象，即使该疾病、病症或症状可能尚未表现出来。

术语“对象”、“患者”和“个体”在本文中可互换地用于包括人或动物。例如，动物对象可以是哺乳动物，灵长类动物(如，猴)，家畜动物(如，马、牛、绵羊、猪或山羊)，伴生动物(如，狗、猫)，实验室试验动物(如，小鼠、大鼠、豚鼠、鸟)、具有兽医学意义的动物、或具有经济学意义的动物。

除非另有定义，本文使用的所有技术和科学术语具有与本技术所属领域的普通技术人员通常理解的相同的含义。尽管本文描述了示例性方法、设备和材料，但是与本文明确描述的那些方法和材料类似或等同的任何方法和材料都可用于本技术的实践或测试。例如，本文所述的试剂仅是示例性的，并且这些试剂的等同物是本领域已知的。除非另有说明，本技术的实践可采用本领域技术人员所熟知的组织培养、免疫学、分子生物学、微生物学、细胞生物学和重组DNA的常规技术。参见，例如，Sambrook and Russell eds.(2001)Molecular Cloning:A Laboratory Manual,3rd edition；the series Ausubel etal.eds.(2007)Current Protocols in Molecular Biology；the series Methods inEnzymology(Academic Press,Inc.,N.Y.)；MacPherson et al.(1991)PCR I:A PracticalApproach(IRL Press at Oxford University Press)；MacPherson etal.(1995)PCR 2:APractical Approach；Harlow and Lane eds.(1999)Antibodies,A Laboratory Manual；Freshney(2005)Culture of Animal Cells:A Manual of Basic Technique,5thedition；Miller and Calos eds.(1987)Gene Transfer Vectors for Mammalian Cells(Cold Spring Harbor Laboratory)；以及Makrides ed.(2003)Gene Transfer andExpression in Mammalian Cells(Cold Spring Harbor Laboratory)。

描述

如已在本发明背景部分中所指出的，在过去的几年里，基因编辑因可精确地校正遗传突变已成为用于血细胞疾病的有前景的基因治疗方法。RNP与用于递送供体模板的腺相关病毒(AAV)一起使用，正在靠近基因编辑领域进行各种疾病的治疗(Dever,Bak etal.2016,Bak,Dever et al.2018,Charlesworth,Camarena et al.2018,Pavel-Dinu,Wiebking et al.2019)。在这种意义上，我们已经建立了这种校正PKD的方法，并且发现最高达40％的人造血祖细胞已利用治疗性RPK(R-型丙酮酸激酶)基因座通过组合特异性RNP和AAV进行了基因编辑。这些结果表明，临床上使用基因编辑治疗来校正PKD是可能的，然而，这种待临床应用的新的基因编辑技术最关注的问题是由RNP引起的脱靶效应。尽管使用高保真Cas9已经降低了脱靶活性，但是仍然需要在使用基因编辑治疗患者之前显著降低脱靶效应。

为此，为了避免脱靶效应，双链断裂(DSB)应尽可能位于靠近将要整合外源DNA的位置。sgRNA，特别是crRNA决定该位置。在这个意义上，需要仔细选择sgRNA，特别是crRNA，以最大化在靶切割并最小化脱靶效应。同源臂应在DSB的位点周围。它们需要根据所选择的sgRNA来设计，以维持功能并避免额外的序列变化。

在本发明中，使用可用于该目的的不同网络工具来设计在感兴趣的基因组位点中引入DSB的不同单链向导RNA(参见实施例1)。测试所获得的不同crRNA(SEQ ID NO.:1至10)形成DSB的效力，并通过Surveyor法、TIDE和/或GUIDE-Seq和rhAmp-Seq进行评估。结果表明，所选择的crRNA仅有一种在K562细胞的在靶位点产生了非常高频率的indel，在人CB-CD34⁺细胞的在靶位点产生了非常高频率的indel，尽管这种特异性crRNA在HEK293-Cas9细胞和Jurkat细胞中转染时显示几个脱靶，但是使用HiFi-Cas9 RNP时，这些几乎被忽略。这种crRNA对应于SEQ ID NO.:1(作为DNA)或SEQ ID NO.:11(作为RNA)的crRNA SG1。值得注意的是，这种crRNA(SG1)是由于在选择RPK转录物变体的正确ATG起始密码子时的错误，如实施例1所示。在这个意义上，与所测试的不同crRNA相比，这种crRNA SG1显示明显改善的效果的事实是令人惊讶的。事实上，与位于RPK起始密码子上游30bp的隐性ATG周围鉴定的不同crRNA相比，以及与在隐性ATG和正确ATG RPK起始位点之间为校正先前提及的设计失误或错误而设计的那些(SG5至SG8)相比，这种crRNA SG1显示明显改善的效果，因为为了避免脱靶效应，双链断裂(DSB)应尽可能位于靠近将要整合外源DNA的位置。基于这些结果，我们在此提出使用SEQ ID NO.:1或SEQ ID NO.:11的crRNA来提供用于校正PKD的基因编辑疗法的新的RNP复合物，从而消除或减少由RNP引起的脱靶效应。

在这种意义上，与其他方法相反，本文提供的RNP复合物显著降低了脱靶效应的百分比。总之，本发明提供了这样的证据：RNP复合物与用于递送本发明的coRPK供体序列的腺相关病毒(AAV)一起，特别适合作为离体有效的基因组编辑工具，其能够在许多不同的细胞类型中实现基因校正，提供了开发用于丙酮酸激酶缺乏症(PKD)的不同细胞疗法的来源。

因此，本发明的第一方面，提供了一种经修饰的crRNA，其包含SEQ ID NO.:1或11或者由SEQ ID NO.:1或11组成。在其他情况下，本发明的经修饰的crRNA为SEQ ID NO.:1或SEQ ID NO.:11的变体，所述变体具有与SEQ ID NO.:1或SEQ ID NO.:11至少80％、85％、90％或95％的序列同一性，例如具有与SEQ ID NO.:1或SEQ ID NO.:11 95％、96％、97％、98％、99％或100％的序列同一性。(下文中SEQ ID NO.:1、SEQ ID NO.:11及其任何变体将被称为本发明的经修饰的crRNA)。

优选地，本发明的经修饰的crRNA与tracrRNA核苷酸序列或接头相关联或相结合，所述接头与CRISPR相关蛋白(Cas)多肽相互作用(在此指出，与tracrRNA相关联的本发明的经修饰的crRNA应被称为本发明的经修饰的单链向导RNA(sgRNA))。优选地，本发明的经修饰的sgRNA包含以下或由以下组成：SEQ ID NO.:12或SEQ ID NO.:12的变体，所述变体具有与SEQ ID NO.:12至少80％、85％、90％或95％的序列同一性，例如，具有与SEQ ID NO.:1295％、96％、97％、98％、99％或100％的序列同一性。

本发明的第二方面涉及一种核糖核蛋白(RNP)，其包含本发明的经修饰的crRNA或sgRNA和CRISPR相关蛋白(CAS)多肽。例如，经修饰的sgRNA和Cas多肽可在容器中混合形成本发明的RNP复合物，然后将RNP复合物引入原代细胞。

在其他实施方案中，本发明涉及包含编码Cas多肽的mRNA和本发明的经修饰的sgRNA的“全RNA”CRISPR系统。

本发明的第三方面涉及一种包含coRPK cDNA序列的载体，所述coRPK cDNA序列包括同源臂(LHA和RHA)、coRPK序列以及用于真核细胞中蛋白表达的特化终止序列，例如bGHpoly(A)序列；其中优选地，LHA为SEQ ID NO.:13，RHA为SEQ ID NO.:14，coRPK序列为SEQID NO.:16，以及bGH poly(A)序列为SEQ ID NO.:18。优选地，本发明的coRPK序列包含以下或由以下组成：SEQ ID NO.:16或SEQ ID NO.:16的变体，所述变体具有与SEQ ID NO.:16至少80％、85％、90％或95％的序列同一性，例如，具有与SEQ ID NO.:16 95％、96％、97％、98％、99％或100％的序列同一性。优选地，本发明的LHA序列包含以下或由以下组成：SEQID NO.:13或SEQ ID NO.:13的变体，所述变体具有与SEQ ID NO.:13至少80％、85％、90％或95％的序列同一性，例如，具有与SEQ ID NO.:13 95％、96％、97％、98％、99％或100％的序列同一性。优选地，本发明的RHA序列包含以下或由以下组成：SEQ ID NO.:14或SEQ IDNO.:14的变体，所述变体具有与SEQ ID NO.:14至少80％、85％、90％或95％的序列同一性，例如，具有与SEQ ID NO.:14 95％、96％、97％、98％、99％或100％的序列同一性。优选地，本发明的bGH poly(A)序列包含以下或由以下组成：SEQ ID NO.:18或SEQ ID NO.:18的变体，所述变体具有与SEQ ID NO.:18至少80％、85％、90％或95％的序列同一性，例如，具有与SEQ ID NO.:18 95％、96％、97％、98％、99％或100％的序列同一性。

在某些情况下，包含本发明的coRPK cDNA序列的载体还包含5’UTR序列，其中优选地，该序列是SEQ ID NO.:15。更优选地，包含coRPK cDNA序列的所述载体包含以下或由以下组成：SEQ ID NO.:15或SEQ ID NO.:15的变体，所述变体具有与SEQ ID NO.:15至少80％、85％、90％或95％的序列同一性，例如，具有与SEQ ID NO.:15 95％、96％、97％、98％、99％或100％的序列同一性。

在其他示例中，包含coRPK cDNA的载体包含以下或由以下组成：SEQ ID NO.:19至22中的任一个或SEQ ID NO.:19至22的变体，所述变体具有与SEQ ID NO.:19至22中的任一个至少95％的序列同一性，例如，具有与SEQ ID NO.:19至22中的任一个95％、96％、97％、98％、99％或100％的序列同一性。

本发明的第四方面涉及包括本发明的RNP复合物或本发明的全RNA CRISPR系统和腺相关病毒颗粒或同源供体AAV的系统，所述腺相关病毒颗粒或同源供体AAV可递送用于在靶细胞(如原代细胞)中经由同源定向修复进行基于CRISPR的基因编辑的重组供体模板。在某些情况下，所述腺相关病毒或同源供体AAV骨架(如(AAV-6)或(AAV-1)或任何其他可能的AAV血清型或血清型嵌合体)具有与AAV骨架至少约90％的序列同一性。值得注意的是，在本发明中，将AAV骨架理解为不包含本发明的用于在靶细胞中经由同源定向修复进行基于CRISPR的基因编辑的重组供体模板的腺相关病毒颗粒或同源供体AAV。在其他情况下，AAV骨架是野生型AAV6或AAV6变体，所述变体具有与SEQ ID NO.:23至少95％的序列同一性，例如，具有与SEQ ID NO.:23 95％、96％、97％、98％、99％或100％的序列同一性。在一些实施方案中，编码AAV骨架(如(AAV-6)或(AAV-1)或任何其他可能的AAV血清型或血清型嵌合体)载体的一种或多种不同组件的多核苷酸可操作地连接到诱导型启动子、阻抑型启动子或组成型启动子。此外，可操作地连接到组件的调控序列可包括激活因子结合序列、增强子、内含子、聚腺苷化识别序列、启动子、阻抑因子结合序列、茎环结构、翻译起始序列、翻译前导序列、转录终止序列、翻译终止序列、引物结合位点等。常用的启动子是组成型哺乳动物启动子CMV、EF1a、SV40、PGKl(小鼠或人)、Ubc、CAG、CaMKIla和beta-Act，以及本领域已知的其他启动子(Khan,K.H.(2013)"Gene Expression in Mammalian Cells and itsApplications,"Advanced Pharmaceutical Bulletin 3(2),257-263)。此外，可使用哺乳动物RNA聚合酶III启动子，包括H1和U6。

在一些实施方案中，所述腺相关病毒颗粒或同源供体包括AAV骨架和待递送至原代细胞的本发明的coRPK cDNA序列。更优选地，腺相关病毒颗粒或同源供体AAV包括SEQ IDNO.:19至22中的任一个或SEQ ID NO.:19至22的变体，所述变体具有与SEQ ID NO.:19至22中的任一个至少95％的序列同一性，例如，具有与SEQ ID NO.:19至22中的任一个95％、96％、97％、98％、99％或100％的序列同一性。

更优选地，包括载体的腺相关病毒颗粒或同源供体AAV相应地包括选自以下的本发明的coRPK cDNA序列：SEQ ID NO.:24至27中的任一个或SEQ ID NO.:24至27的变体，所述变体具有与SEQ ID NO.:24至27中的任一个至少95％的序列同一性，例如，具有与SEQ IDNO.:24至27中的任一个95％、96％、97％、98％、99％或100％的序列同一性。

此外，在本发明的第五方面，在此提供了一种用于在原代细胞中诱导稳定的基因修饰的方法，所述原代细胞包含含有PKLR基因的靶核酸，所述靶核酸相应地包含PKLR基因中的一个或多个突变以及在所述原代细胞中通过同源重组与SEQ ID NO.:1或11互补的核苷酸序列，所述原代细胞优选造血干细胞和祖细胞(HSPC)、或胚胎干细胞(ESC)或诱导多能干细胞(iPSC)，或可分化为HSPC或红细胞的任何其他细胞类型，其中所述方法包括：

(A)将组合物引入原代细胞中，所述组合物包含与本发明的CRISPR相关蛋白(Cas)多肽相关联的本发明的经修饰的crRNA或sgRNA或“全RNA”CRISPR系统；并且同时或顺序

(b)将腺相关病毒颗粒或同源供体AAV引入原代细胞中，所述腺相关病毒颗粒或同源供体AAV包含对应于靶核酸的本发明的coRPK cDNA序列以经历同源重组；

其中，靶核酸的稳定基因修饰包括通过引入包含校正供体模板的同源供体AAV(如(AAV-6)或(AAV-1)或任何其他可能的AAV血清型或血清型嵌合体)载体来补偿PKLR基因(靶核酸)的致病突变。

进行以上所述的原代细胞(优选造血干细胞和祖细胞(HSPC)、或胚胎干细胞(ESC)或诱导多能干细胞(iPSC)、或可分化为HSPC或红系细胞的任何其他细胞类型)中的基因修饰策略，其目的是治疗罹患或患有丙酮酸激酶缺乏症(PKD)的对象。值得注意的是，丙酮酸激酶缺乏症(PKD)是由PKLR基因突变引起的遗传性常染色体隐性遗传病，是组成慢性非球形红细胞溶血性贫血的主要病因。据估计，全世界每20,000人中就有一人患有PKD，其中有约17％的人尚未得到治愈性治疗。PKLR基因编码红细胞中无氧糖酵解的最后一步所涉及的红系丙酮酸激酶蛋白(RPK)。这些致PKD突变导致RPK活性完全或部分降低，随后ATP水平降低，这有利于RBC溶血和随之而来的贫血。当蛋白活性降低至红细胞中正常活性的25％以下时，该疾病就具有临床相关性。

因此，在本发明第五方面的进一步实施方案中，同源供体AAV包含coRPK cDNA序列，如SEQ ID NO.:16，更优选地，所述供体模板包括coRPK cDNA序列和靶核酸的两个同源部分，如SEQ ID NO.:13和14。

在一些实施方案中，原代细胞选自原代HSPC，或胚胎干细胞(ESC)，或诱导多能干细胞(iPSC)，或可分化为HSPC或红系细胞的任何其他细胞类型，以及它们的任何组合。在一些实施方案中，将与本发明的CRISPR相关蛋白(Cas)多肽相关的本发明的经修饰的crRNA或sgRNA或“全RNA”CRISPR系统以及同源供体AAV载体引入原代细胞之前，从哺乳动物分离出原代细胞。例如，原代细胞可从人对象获得。在某些情况下，在将与本发明的CRISPR相关蛋白(Cas)多肽相关的本发明的经修饰的crRNA或sgRNA或“全RNA”CRISPR系统以及同源供体AAV载体引入原代细胞后，将原代细胞或其后代返回哺乳动物中。换句话说，转基因原代细胞经历自体移植。在其他情况下，转基因细胞经历同种异体移植。例如，从供体对象中分离出经历不稳定基因修饰的细胞，然后将转基因供体细胞移植到与供体对象不同的受体对象中。

原代细胞可包括原代细胞群。在某些情况下，原代细胞群包括原代细胞的异质群。在其他情况下，原代细胞群包括原代细胞的同质群。

在其他情况下，同源供体AAV骨架(如(AAV-6)或(AAV-1))具有与AAV骨架至少约90％的序列同一性。在其他情况下，同源供体AAV骨架是野生型AAV6或AAV6骨架变体，所述变体具有与SEQ ID NO.:23至少95％的序列同一性，例如，具有与SEQ ID NO.:23 95％、96％、97％、98％、99％或100％的序列同一性。在一些实施方案中，编码AAV骨架(如(AAV-6)或(AAV-1))载体的各种组件中的一种或多种的多核苷酸可操作地连接到诱导型启动子、阻抑型启动子或组成型启动子。此外，可操作地连接到组件的调控序列可包括激活因子结合序列、增强子、内含子、聚腺苷化识别序列、启动子、阻抑因子结合序列、茎环结构、翻译起始序列、翻译前导序列、转录终止序列、翻译终止序列、引物结合位点等。常用的启动子是组成型哺乳动物启动子CMV、EF1a、SV40、PGKl(小鼠或人)、Ubc、CAG、CaMKIla和beta-Act，以及本领域已知的其他启动子(Khan,K.H.(2013)"Gene Expression in Mammalian Cells andits Applications,"Advanced Pharmaceutical Bulletin 3(2),257-263)。此外，可使用哺乳动物RNA聚合酶III启动子，包括HI和U6。

在一些实施方案中，同源供体AAV骨架能够优先引导核酸在特定细胞类型中的表达(如，使用组织特异性调控元件来表达多核苷酸)。组织特异性调控元件是本领域已知的，包括但不限于白蛋白启动子、淋巴特异性启动子、神经元特异性启动子(如神经丝启动子)、胰腺特异性启动子、乳腺特异性启动子(如乳清蛋白启动子)，特别是T细胞受体和免疫球蛋白的启动子。还包括发育调控启动子，如鼠hox启动子和甲胎蛋白启动子。

将AAV如(AAV-6)或(AAV-1)表达载体引入宿主细胞的方法是本领域已知的，并且通常基于宿主细胞的种类来选择。

在一些实施方案中，在大于约30％的原代细胞群中诱导靶核酸的稳定基因修饰，例如，在约35％、约40％、约50％、约60％、约70％、约71％、约72％、约73％、约74％、约75％、约76％、约77％、约78％、约79％，约80％、约81％、约82％、约83％、约84％、约85％、约86％、约87％、约88％、约89％、约90％、约91％、约92％、约93％、约94％、约95％、约96％、约97％、约98％、约99％或约100％的原代细胞群中诱导靶核酸的稳定基因修饰。在另一些实施方案中，在大于约80％的原代细胞群中诱导靶核酸的稳定基因修饰，例如，在约80％、约81％、约82％、约83％、约84％、约85％、约86％、约87％、约88％、约89％、约90％、约91％、约92％，约93％、约94％、约95％、约96％、约97％、约98％、约99％或约100％的原代细胞群中诱导靶核酸的稳定基因修饰。在又一些实施方案中，在大于约90％的原代细胞群中诱导靶核酸的稳定基因修饰，例如，在约90％、约91％、约92％、约93％、约94％、约95％、约96％、约97％、约98％、约99％、或约100％的原代细胞群中诱导靶核酸的稳定基因修饰。

在一些实施方案中，本发明第五方面的序列可包含经修饰的核苷酸，如核糖基团、磷酸基团、核碱基或其组合中的修饰。在某些情况下，核糖基团中的修饰包括核糖基团的2’位处的修饰。在一些情况下，核糖基团的2’位处的修饰选自2’-O-甲基、2’-氟、2’-脱氧、2’-O-(2-甲氧乙基)及其组合。在另一些情况下，磷酸基团中的修饰包含硫代磷酸修饰。在另一些实施方案中，经修饰的核苷酸选自2’-O-甲基(M)核苷酸，2’-O-甲基3’-硫代磷酸(MS)核苷酸，2’-O-甲基3’-硫代PACE(MSP)核苷酸及其组合。

优选地，对于本发明的所有方面和实施方案，Cas多肽为Cas9多肽或高保真或增强特异性的Cas9多肽变体。在某些实施方案中，将本发明的经修饰的sgRNA和Cas多肽同时引入原代细胞。在另一些实施方案中，将经修饰的sgRNA和Cas多肽顺序引入原代细胞。在某些情况下，首先引入经修饰的sgRNA，然后引入Cas多肽。在另一些情况下，首先引入Cas多肽，然后引入本发明的经修饰的sgRNA。

在一些实施方案中，本文所述的Cas多肽可以是编码Cas多肽的mRNA，将该CasmRNA与本发明的经修饰的gRNA一起作为“全RNA”CRISPR系统引入原代细胞中。在某些情况下，将本发明的经修饰的gRNA和Cas mRNA同时引入原代细胞中。在另一些情况下，将经修饰的gRNA和Cas mRNA顺序引入原代细胞中。在一些情况下，首先引入本发明的经修饰的gRNA，然后引入Cas mRNA。在另一些情况下，首先引入Cas mRNA，然后引入本发明的经修饰的gRNA。

在一些实施方案中，将RNP复合物和同源供体AAV(如，(AAV-6)或(AAV-1))载体同时引入原代细胞中。在另一些实施方案中，将RNP复合物和同源供体AAV载体顺序引入原代细胞中。在一些情况下，在同源供体AAV载体之前将RNP复合物引入原代细胞中。在另一些情况下，在RNP复合物之前将同源供体AAV载体引入原代细胞中。例如，可在同源供体AAV载体之前约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、90、120、150、180、210或240分钟或更长时间将RNP复合物引入原代细胞中，反之亦然。在具体实施方案中，在同源供体AAV载体之前约15分钟(如，约10至约20分钟)将RNP复合物引入原代细胞中。

在一些实施方案中，将“全RNA”CRISPR系统和同源供体AAV载体同时引入原代细胞中。在另一些实施方案中，将“全RNA”CRISPR系统和同源供体AAV载体顺序引入原代细胞中。在一些情况下，在同源供体AAV载体之前将“全RNA”CRISPR系统引入原代细胞中。在另一些情况下，在“全RNA”CRISPR系统之前将同源供体AAV载体引入原代细胞中。例如，在同源供体AAV载体之前约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、90、120、150、180、210或240分钟或更长时间将“全RNA”CRISPR系统引入原代细胞中，反之亦然。在特定实施方案中，在同源供体AAV载体之前约15分钟(如，约10至约20分钟)将“全RNA”CRISPR系统引入原代细胞中。

在一些实施方案中，本文所述的任何方法也可包括使用标志物来纯化具有靶核酸的稳定基因修饰的原代细胞。在一些情况下，通过纯化步骤分离的组合物包括至少约80％的具有靶核酸的稳定基因修饰的原代细胞，如约80％、约81％、约82％、约83％、约84％、约85％、约86％、约87％、约88％、约89％、约90％、约91％、约92％、93％、约94％、约95％、约96％、约97％、约98％、约99％或更多的具有靶核酸的稳定基因修饰的原代细胞。

在一些实施方案中，将本发明的经修饰的gRNA和Cas多肽引入原代细胞的步骤包括将经修饰的gRNA和Cas多肽电穿孔至原代细胞中。在一些实施方案中，将同源供体AAV(如(AAV-6)或(AAV-1))载体引入原代细胞的步骤包括转导原代细胞。

在另一些方面，本文提供了通过本文所述的任何方法产生的经基因修饰的原代细胞。在一些实施方案中，经基因修饰的原代细胞选自HSPC，或胚胎干细胞(ESC)，或诱导多能干细胞(iPSC)，或可分化为HSPC或红系细胞的任何其它细胞类型，或其任何组合。

在又一些方面，本文提供了药物组合物，其包含本文所述的任何经基因修饰的原代细胞和药学上可接受的载体。在另一些实施方案中，药物组合物包含一种类型的经基因修饰的原代细胞。在又一些实施方案中，药物组合物包含两种或更多种不同类型的经基因修饰的原代细胞，例如2、3、4、5、6、7、8、9、10种或更多种不同类型的经基因修饰的原代细胞。

在进一步的方面，本文提供了试剂盒的体外应用，所述试剂盒包括(a)与本发明的CRISPR相关蛋白(Cas)多肽相关的本发明的经修饰的crRNA或sgRNA或“全RNA”CRISPR系统；和/或(b)包含对应于靶核酸的本发明的coRPK cDNA序列以经历同源重组的腺相关病毒颗粒或同源供体AAV。

在某些情况下，试剂盒还包括用于从对象采集或分离原代细胞的试剂。对象可以是哺乳动物对象，例如人类对象。

在更进一步的方面，本文提供了预防或治疗有需要的对象的PKD的方法，所述方法包括向所述对象施用本文所述的任何经基因修饰的原代细胞或本文所述的任何药物组合物，以预防所述疾病或改善所述疾病的一种或多种症状。

在一些实施方案中，施用步骤包括选自静脉内、腹膜内、骨内或其组合的递送途径。

在特定实施方案中，本发明的经基因修饰的原代细胞或药物组合物以足够的量向对象施用，以校正与疾病相关的靶核酸中的突变。在某些情况下，通过用野生型等位基因替换靶核酸中的突变等位基因来校正突变。

通过阅读随后参考以下示意图和所附权利要求书进行的详细描述，本发明的其他目的和优点对于本领域的技术人员而言将是显而易见的。

因此，本申请人在此已显示了CRISPR系统明确修复PKD突变的用途。申请人靶向突变位点周围的位点。使用CRISPR/Cas9系统对PKD的疾病突变进行DNA修复代表了一种新颖的治疗方法。本发明提供了利用工程化核酸酶在DNA水平作用使致病突变失活或修复的可能性。

以下实施例仅仅是说明性的，并不限制本发明的范围。

实施例

本实施例旨在举例说明合并以下程序的不同元件：在造血细胞因子存在下需要离体扩增HSPC 16、24或48小时，并且i)引入产生PKLR基因的RPK转录物变体的转录起始位点上游的DNA的双链断裂(DSB)的系统，如CRISPR/Cas9系统，和ii)引入包含两侧有同源臂(左[LHA]和右[RHA])的coRPK cDNA的供体基体。LHA和RHA与将要插入外源序列的基因组序列相同。本文所用的coRPK cDNA前面是部分5’UTR RPK序列，以在内源性调控下表达治疗性盒。CRISPR/Cas9应通过电穿孔引入，以有利于DNA核酸酶进入细胞核，并且供体基体应通过腺相关病毒载体血清型6(AAV-coRPK)引入。为了组装核糖核蛋白(RNP)，将Cas9蛋白与sgRNA组合。为了将RNP核转染至细胞，使用电穿孔装置。细胞先进行预刺激，然后重悬于电穿孔溶液中。将RNP复合物添加到细胞悬浮液中并使细胞电穿孔。在电脉冲之后，将HSPC于37℃温育10分钟。然后，加入预热的培养基，并将细胞转移至培养板。用不同浓度的相应AAV立即转导经核转染的细胞。

因此，细胞(造血干细胞(HSC))获自患者，在体外操作，冷冻，并且一旦产物经表征且证实是正确的，就将细胞解冻并输注至先前已经用化疗调节的患者中，以允许输注的校正细胞的移植。

实施例1.本发明的CRISPR/Cas9系统的设计

sgRNA：

1.sgRNA设计

按照先前报道，应设计在基因的起始处引入DSB并促进敲入整合的sgRNA，使其尽可能靠近基因的RPK转录物变体的起始密码子。crRNA的设计使用可用于该目的的不同网络工具进行，例如Dr.Zhang的实验室工具(https://zlab.bio/guide-design-resources)或IDT的工具(https://eu.idtdna.com/site/order/designtool/index/CRISPR_SEQUENCE)。由于在选择RPK转录物变体的合适ATG起始密码子时的错误，在位于RPK起始密码子上游30bp的隐性ATG周围鉴定出不同的crRNA。首先设计的crRNA为SG1至SG4。另外，在隐性ATG和合适ATG RPK起始位点之间为校正前面提到的设计失误或错误而设计了更多的crRNA(SG5至SG8)，因为为了避免脱靶效应，双链断裂(DSB)应位于尽可能靠近将要整合外源DNA的位置。

表1：所设计和分析的不同crRNA(作为DNA)

2.sgRNA效力和安全性

通过Surveyor法、TIDE和/或GUIDE-Seq和rhAmp-Seq评估表1中不同的10种sgRNA(SEQ ID NO.:1至10)形成DSB的效力。

对于Surveyor法，纯化基因组DNA并进行PCR以扩增RPK转录物变体起始密码子周围的区域。然后，根据制造商的说明，用Surveyor核酸酶S消化PCR产物，并通过10％ NovexTBE凝胶分离来评估经消化的产物。分析凝胶图像，以便通过测量不同条带的密度测定值来测量裂解。

另外，在人CB-CD34⁺细胞中通过TIDE法分析SG1、SG3、SG5、SG6和SG8的Indel频率。纯化基因组DNA，并进行PCR以扩增PKLR基因的RPK转录物变体的起始密码子周围的区域。然后，对PCR产物进行Sanger测序。未编辑的细胞总是用作用TIDE计算Indel频率的阴性对照。最后，通过使用TIDE软件(https://tide.deskgen.com/)计算Indel频率来评估所设计向导的活性。

此外，在选择其中一种进行临床应用之前，按照目前最严格的标准GUIDE-seq和rhAmpSeq分析三种最有前景的sgRNA(SG1、SG2和SG3)以及新设计的sgRNA(SG4、SG9和SG10)的脱靶活性。首先，在组成型表达WT-Cas9的HEK293T细胞系中进行GUIDE-seq分析，以广泛地鉴定考虑体内基因组环境的脱靶。用不同的sgRNA转染细胞。5天后，收集细胞，并分离基因组DNA。利用IDT内部向导分析工具使用GUIDE-seq-tag确定脱靶位点，其中还观察到脱靶位点出现于>1％的读长中。鉴定这些sgRNA的体内脱靶，并计算在全局基因编辑中表示的在靶修饰(表3)。然而，在用RNP形式的SG1电穿孔的Jurkat细胞中进行相同的GUIDE-seq分析时，脱靶的数目明显减少(图4)。此外，在RNP复合物中使用HiFi-Cas9缩小了SG1的脱靶效应。为了定量GUIDE-Seq所揭示的位点处的在靶和脱靶活性，通过rhAmpSeq测量在靶和脱靶indel频率，该测定有助于更准确地定量分析SG1在细胞和基因组环境中的基因编辑。CB-CD34⁺细胞使用与WT-Cas9或HiFi-Cas9复合形成RNP复合物的SG1或SG9或SG10进行编辑，显示降低的脱靶贡献(表3)。另外，在一些样品中加入特异性ssODN HDR模板以确定每种sgRNA介导HDR的能力。用rhAmpSeq池扩增来自GUIDE-seq实验的最高命中(1个在靶位点ON和48个脱靶位点OT)。然后，文库在MiSeq系统上运行，并用内部分析工具进行分析。通过将NHEJ的百分比与不完全HDR的百分比和完全HDR的百分比相加来计算切割位点处的编辑水平。如图5所示，证实SG1在在靶位点处具有最大的基因编辑活性。此外，当使用HiFi-Cas9形成RNP复合物时，完全HDR的频率无变化。因此，在SG1 RNP复合物中使用HiFi-Cas9不会妨碍靶位点处的HDR。另外，分析了hCD34⁺中SG1 RNP的脱靶作用(图6)。在SG1 RNP中使用HiFi-Cas9将所有的脱靶修饰降低至0.1以下，这是该技术的检测极限。因此，hCD34⁺细胞用SG1 HiFi-Cas9 RNP复合物进行基因编辑保持了在靶位点处高水平的修饰而不改变HDR，并将脱靶效应降低至不可检测的水平。

2.1.surveyor法

除了下表2之外，Surveyor法提供的结果示于图2中。

表2：通过Surveyor法分析人细胞系K562中的SG1、SG2、SG3和SG4的Indel定量

Surveyor法的结果：

SG1(SEQ ID NO.:1)在K562细胞中的在靶位点处产生最高频率的indel。

2.2.TIDE法

TIDE法提供的结果示于图3中。

TIDE法的结果：

SG1(SEQ ID NO.:1)在人CB-CD34⁺细胞中的在靶位点处产生最高频率的indel。

2.3.GUIDE-Seq和rhAmp-Seq

-鉴定体内脱靶：在组成型表达WT-Cas9(HEK293-Cas9)的HEK293细胞系中进行GUIDE-Seq分析以强制鉴定体内脱靶。

表3：在用每种sgRNA转染并用GUIDE-Seq分析的HEK293-Cas9中获得的SG1、SG2、SG3、SG4、SG9和SG10的脱靶数目和在靶百分比

结果：

在HEK293-Cas9中转染时，SG1(SEQ ID NO.:1)显示几个脱靶。核糖核蛋白(RNP)形式的PKLR SG1 ATG的安全性结果示于图4和图6。当使用HiFi Cas9-RNP时，hCD34⁺中SG1的脱靶效应降低至0.1％以下。

3.通过rhAmp-Seq定量HDR的在靶修饰和频率

结果如图5所示，其中使用SG1时，在CB-CD34⁺中，在靶频率最高。此外，使用HiFiCas9-RNP时，SG1的HDR高频率没有受损。

SEQ ID NO.:1：前间隔序列SG1序列

CTGCGGGACCATGGAATGAG

SEQ ID NO.:11：crRNA SG1序列(作为RNA)

CUGCGGGACCAUGGAAUGAG

SEQ ID NO.:12：sgRNA SG1序列(作为RNA)

CUGCGGGACCAUGGAAUGAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAUAAGGCUAGUCCG

实施例2.CoRPK-AAV的设计

一旦选择了最有效且最安全的sgRNA(其明显是实验失误或错误的产物)，设计了coRPK-AAV。如以下部分所述，coRPK-AAV由围绕SG1在靶位点、ATG(5’UTR)的上游序列、coRPK cDNA、FLAG-Tag和牛生长激素聚腺苷酸化(bgh-polyA)信号的两个同源臂(左同源臂或LHA和右同源臂或RHA)形成，如图7和图8所示。设计coRPK-AAV考虑了SG1切割位点，其位于RPK起始密码子上游38bp处。两个同源臂选自围绕SG1切割位点的序列。LHA覆盖RPK起始密码子上游463bp至39bp的基因组区域(总大小425bp)。RHA覆盖RPK起始密码子上游30bp至RPK起始密码子下游395bp的区域(总大小425bp)。在与LHA和RHA同源的基因组区域之间，存在SG1靶序列的8bp区域，包括SG1切割位点。一旦发生同源直接修复，认为两个同源臂之间的该8bp缺口防止SG1的再切割。另一方面，将覆盖37bp上游至RPK起始密码子的序列(其部分是RPK转录物变体的Kozac序列)克隆到coRPK-AAV中不含ATG和终止密码子的coRPK cDNA的5’处。注意，在LHA和5’UTR之间存在1bp的缺口，对应于SG1切割位点，以降低一旦发生HDR治疗性盒就被SG1切割的风险。

1.LHA(左同源臂)(SEQ ID NO.:13)

如图9所示，LHA覆盖SG1切割位点上游的425bp。

CAGAGTGGTGAAGGCACTCTGCATTTCTTGGTTGAGACAGAGAAAAAAAGTGGTCAGAACTGGGTAACCCTCCCCCCACCATATTATCACAGTGATCCCTTTTGTCTTTCTTCAGGCTCCAGCCCCACCCTACAGCCCCTGCTCCCTGGATTCACTAGAGCTAACTTCAGTAAAGTACAAAGAAAATGGGGCCATATGACTGGCCAAAAAAAAAATATCTATTCACGTGGATGACCAGATAGTATGAATGGATTGAAAATTTATCAGGAAAAAAGGATGAGAGGAAATGCCAGGAGATGAGGGCAGAGAGCAGGCCGTTCTGGGGGAGGGATTCTGTGGGGACAGGGTGGCCTACTGGGTGTGCCCCTTTTCTCTTCTCTGTCTCCCTTAGATAAGACCAGCAGTTTTGTCATCCTCTCCCTCTC

2.RHA(右同源臂)(SEQ ID NO.:14)

如图10所示，RHA覆盖远离SG1 PAM序列11bp开始的425bp。

GTCCCGCAGCCCCAGGCCCACACTGAAAGCATGTCGATCCAGGAGAACATATCATCCCTGCAGCTTCGGTCATGGGTCTCTAAGTCCCAAAGAGACTTAGCAAAGTCCATCCTGATTGGGGCTCCAGGAGGTAAGAAGGGGAGACAGAAGCCATGGAACATAGGAGGAAAATGAGGGTGAAAACTAGGAGCCAGGGTGGAGGGCATAAATGATCCACATCAGCCACTGGCTAGGTGGGTTTTGGAGAGGAACGTACGTTCTTCAGAGCCTCCCGTGTGTTAAATTATGGACCCTGGCCTGGGTCTTTTCCAGGCCCTATAGGCAGGCCAGAGCCACAGCATGTAAGCCACGGGGCACTCCCGTGGTTCCTGGACTCTGGCCCCTGGCATACAGGGCTTCCAATGGAACAGGAGACAGTGGTGACA

3.5’UTR序列(SEQ ID NO.:15)

将含有SG1前间隔序列第4个nt至RPK起始密码子的40bp序列克隆到不含起始密码子和终止密码子的下游coRPK cDNA。除了起始密码子外，该序列还提供了最适合的与WTRPK相似的coRPK红系表达的5’UTR，因为RPK转录物变体的Kozac序列是该序列的一部分。

注意：LHA与5’UTR之间存在1bp的缺口，以防止基因编辑校正后被SG1再切割，因为SG1前间隔序列在基因编辑之后未完全重建。

TTCCATGGTCCCGCAGCCCCAGGCCCACACTGAAAGCATG

4.coRPK cDNA(SEQ ID NO.:16)

coRPK cDNA序列是LV coRPK(Garcia-Gomez et al.Mol Ther.2016)的修饰版本，经GeneArt密码子优化后获得。在此包括了以下改变：i)将其克隆为无起始密码子，以便利用PKLR内源性起始密码子，目的是使coRPK的表达受到内源性PKLR启动子和内源性调控序列的驱动；ii)将其克隆为无终止密码子，以便与FLAG-Tag融合。

AGCATCCAGGAAAATATCAGCTCTCTGCAGCTGCGGTCCTGGGTGTCCAAGAGCCAGAGAGACCTGGCCAAGAGCATCCTGATCGGAGCCCCTGGCGGACCAGCCGGATACCTGAGAAGGGCTAGCGTGGCCCAGCTGACCCAGGAACTGGGCACCGCCTTTTTCCAGCAGCAGCAGCTGCCAGCCGCCATGGCCGACACCTTTCTGGAACACCTGTGCCTGCTGGACATCGACTCTGAGCCCGTGGCCGCCAGAAGCACCAGCATCATTGCCACCATCGGCCCTGCCAGCAGAAGCGTGGAGCGGCTGAAAGAGATGATCAAGGCCGGCATGAATATCGCCCGGCTGAACTTCTCCCACGGCAGCCACGAGTACCACGCAGAGAGCATTGCCAACGTCCGGGAGGCCGTGGAGAGCTTTGCCGGCAGCCCCCTGAGCTACAGACCCGTGGCCATTGCCCTGGACACCAAGGGCCCCGAGATCAGAACAGGAATTCTGCAGGGAGGGCCTGAGAGCGAGGTGGAGCTGGTGAAGGGCAGCCAAGTGCTGGTGACCGTGGACCCCGCCTTCAGAACCAGAGGCAACGCCAACACAGTGTGGGTGGACTACCCCAACATCGTGCGGGTGGTGCCTGTGGGCGGCAGAATCTACATCGACGACGGCCTGATCAGCCTGGTGGTGCAGAAGATCGGACCTGAGGGCCTGGTGACCCAGGTCGAGAATGGCGGCGTGCTGGGCAGCAGAAAGGGCGTGAATCTGCCAGGCGCCCAGGTGGACCTGCCTGGCCTGTCTGAGCAGGACGTGAGAGACCTGAGATTTGGCGTGGAGCACGGCGTGGACATCGTGTTCGCCAGCTTCGTGCGGAAGGCCTCTGATGTGGCCGCCGTGAGAGCCGCTCTGGGCCCTGAAGGCCACGGCATCAAGATCATCAGCAAGATCGAGAACCACGAGGGCGTGAAGCGGTTCGACGAGATCCTGGAAGTGTCCGACGGCATCATGGTGGCCAGAGGCGACCTGGGCATCGAGATCCCCGCCGAGAAGGTGTTCCTGGCCCAGAAAATGATGATCGGACGGTGCAACCTGGCCGGCAAACCTGTGGTGTGCGCCACCCAGATGCTGGAAAGCATGATCACCAAGCCCAGACCCACCAGAGCCGAGACAAGCGACGTGGCCAACGCCGTGCTGGATGGCGCTGACTGCATCATGCTGTCCGGCGAGACAGCCAAGGGCAACTTCCCCGTGGAGGCCGTGAAGATGCAGCACGCCATTGCCAGAGAAGCCGAGGCCGCCGTGTACCACCGGCAGCTGTTCGAGGAACTGCGGAGAGCCGCCCCTCTGAGCAGAGATCCCACCGAAGTGACCGCCATCGGAGCCGTGGAAGCCGCCTTCAAGTGCTGCGCCGCTGCAATCATCGTGCTGACCACCACAGGCAGAAGCGCCCAGCTGCTGTCCAGATACAGACCCAGAGCCGCCGTGATCGCCGTGACAAGATCCGCCCAGGCCGCTAGACAGGTCCACCTGTGCAGAGGCGTGTTCCCCCTGCTGTACCGGGAGCCTCCCGAGGCCATCTGGGCCGACGACGTGGACAGACGGGTGCAGTTCGGCATCGAGAGCGGCAAGCTGCGGGGCTTCCTGAGAGTGGGCGACCTGGTGATCGTGGTGACAGGCTGGCGGCCTGGCAGCGGCTACACCAACATCATGAGGGTGCTGTCCATCAGC

5.FLAG-Tag(SEQ ID NO.:17)

该序列在利用源自健康供体的hCD34⁺细胞设置基因编辑条件时已添加在具有无终止密码子的coRPK框内来产生融合蛋白，以便跟踪基因编辑后的治疗性RPK蛋白，但推荐临床应用的coRPK-AAV中不存在FLAG-Taq，因为它对校正PKD没有任何功能性贡献。

GACTACAAAGACGATGACGATAAATGA

6.bGH poly(A)信号(SEQ ID NO.:18)

牛生长激素聚腺苷酸(bGH-polyA)信号是真核细胞中蛋白表达的特化终止序列。

CTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGG

7.LHA-5’UTR-coRPK-FLAG-bGHpoly(A)-RHA(SEQ ID NO.:19)

这是在设置实验期间设计用于通过SG1靶处的HDR来校正PKD的供体序列。它按照所提及的次序包括LHA(SEQ ID NO.:13，黑体)、5’UTR(SEQ ID NO.:15，斜体)，无起始密码子和终止密码子的coRPK(SEQ ID NO.:16，加下划线)，FLAG-Taq(SEQ ID NO.:17，粗体斜体)，以及bGH poly(A)(SEQ ID NO.:18，粗体加下划线)，RHA(SEQ ID NO.:14，粗体斜体)。这些元件的功能说明如下:

-同源臂介导coRPK盒在SG1靶位点处的插入

-5’UTR确保coRPK表达的正确调控

-coRPK是RPK转录物的密码子优化版本，其编码RPK蛋白以校正红系细胞中的PKD表型

-在利用源自健康供体的hCD34⁺细胞设置基因编辑条件时，添加FLAG-Taq以区分WT RPK蛋白和由coRPK编码的RPK，但在推荐临床应用的coRPK-AAV中不存在FLAG-Taq，因为它对PKD校正没有任何功能性贡献

-最后，bGH poly(A)信号促进coRPK-FLAG翻译成蛋白

8.LHA-5’UTR-coRPK-bGH poly(A)-RHA(SEQ ID NO.:20)

SEQ ID NO.:20是供体基体(SEQ ID NO.:19)，其中已去除FLAG-Tag序列。

9.LHA-5’UTR-coRPK-bGHpoly(A)-RHA(SEQ ID NO.:21)

SEQ ID NO.:21是所述SEQ ID NO.:19的反向序列。

AAV中的coRPK治疗性供体序列从5’至3’为：右同源臂(粗体)，bGH poly(A)，FLAG-Tag(粗体斜体)，无起始密码子的coRPK(加下划线)，5’UTR(斜体)和左同源臂(粗体)。

10.LHA-5’UTR-coRPK-bGHpoly(A)-RHA(SEQ ID NO.:22)

SEQ ID NO.:22是所述SEQ ID NO.:20的反向序列。

AAV中的coRPK治疗性供体序列从5’至3’为：右同源臂(粗体)，bGH poly(A)，无起始密码子的coRPK(加下划线)，5’UTR(斜体)和左同源臂(粗体)。

11.AAV骨架(SEQ ID NO.:23)

使用来自含有AAV2 ITR(内部末端重复序列)的pAAV-MCS质粒(AgilentTechnologies)的携带ITR的转移质粒。将反向LHA-5’UTR-coRPK-FLAG-bGH poly(A)-RHA(SEQ ID NO.:20)通过NotI限制位点克隆来克隆到AAV骨架中。

CCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGCGGCCGCAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGGGGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATACGTCAAAGCAACCATAGTACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTTGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGGCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGTTTACAATTTTATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCTTGTCTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCTCCGGGAGCTGCATGTGTCAGAGGTTTTCACCGTCATCACCGAAACGCGCGAGACGAAAGGGCCTCGTGATACGCCTATTTTTATAGGTTAATGTCATGATAATAATGGTTTCTTAGACGTCAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTATGAGTATTCAACATTTCCGTGTCGCCCTTATTCCCTTTTTTGCGGCATTTTGCCTTCCTGTTTTTGCTCACCCAGAAACGCTGGTGAAAGTAAAAGATGCTGAAGATCAGTTGGGTGCACGAGTGGGTTACATCGAACTGGATCTCAACAGCGGTAAGATCCTTGAGAGTTTTCGCCCCGAAGAACGTTTTCCAATGATGAGCACTTTTAAAGTTCTGCTATGTGGCGCGGTATTATCCCGTATTGACGCCGGGCAAGAGCAACTCGGTCGCCGCATACACTATTCTCAGAATGACTTGGTTGAGTACTCACCAGTCACAGAAAAGCATCTTACGGATGGCATGACAGTAAGAGAATTATGCAGTGCTGCCATAACCATGAGTGATAACACTGCGGCCAACTTACTTCTGACAACGATCGGAGGACCGAAGGAGCTAACCGCTTTTTTGCACAACATGGGGGATCATGTAACTCGCCTTGATCGTTGGGAACCGGAGCTGAATGAAGCCATACCAAACGACGAGCGTGACACCACGATGCCTGTAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGT

12.用于临床前研究的coRPK AAV(SEQ ID NO.:24)

插入AAV骨架(SEQ ID NO.:23)中的包含coRPK治疗性供体(SEQ ID NO.:19)的序列。

13.用于临床前研究的coRPK AAV(SEQ ID NO.:25)

插入AAV骨架(SEQ ID NO.:23)中的包含coRPK治疗性供体(SEQ ID NO.:20)的序列。

14.用于临床前研究的coRPK AAV(SEQ ID NO.:26):

插入AAV骨架(SEQ ID NO.:23)中的包含coRPK治疗性供体(SEQ ID NO.:21)的序列。

15.用于临床应用的coRPK AAV(SEQ ID NO.:27)

插入AAV骨架(SEQ ID NO.:23)中的包含coRPK治疗性供体(SEQ ID NO.:22)的序列。

实施例3.PDK-HSPC中的PKLR校正

为了评估基因编辑系统的治疗潜力，对来自4名携带PKLR基因突变的PKD患者的人HSPC和HD-CD34⁺细胞进行预刺激48小时。然后，细胞进行核转染并用rAAV转导。基因编辑步骤后24小时，收集细胞并转移至红系分化培养基。在所有实验期间，通过FACS评估红系分化过程，观察到健康和基因编辑供体样品之间的成熟特征没有差异。第14天，收集细胞并进行基因组和功能分析。首先，在来自1名患者(PKD2)的样品中，通过3’和5’连接处的特异性PCR评估载体整合。如图15C所示，可在患者的样品中检测到特异性条带。此外，对红系细胞进行基于ATP定量的功能分析。未编辑或经GFP-AAV编辑的PKD细胞产生低水平的ATP。然而，经历用RNP和coRPK-AAV进行基因编辑的PKD-HSPC产生的红系细胞能够恢复接近HD细胞的ATP水平(图15D)。总之，数据表明，对PKLR基因进行基因编辑可恢复患者的红系细胞的体外功能。

序列表

<110> 能源环境和技术研究中心OAMP

<120> 丙酮酸激酶缺乏症(PKD)基因编辑治疗方法

<130> 906 345

<160> 40

<170> BiSSAP 1.3.6

<210> 1

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> SG1

<400> 1

ctgcgggacc atggaatgag 20

<210> 2

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> SG2

<400> 2

tggggacagg gtggcctact 20

<210> 3

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> SG3

<400> 3

aaaactgctg gtcttatcta 20

<210> 4

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> SG4

<400> 4

agaaaagggg cacacccagt 20

<210> 5

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> SG5

<400> 5

tggtcccgca gccccaggcc 20

<210> 6

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> SG6

<400> 6

ctccctctca ttccatggtc 20

<210> 7

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> SG7

<400> 7

cagccccagg cccacactga 20

<210> 8

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> SG8

<400> 8

ttccatggtc ccgcagcccc 20

<210> 9

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> SG9

<400> 9

cactgaaagc atgtcgatcc 20

<210> 10

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> SG10

<400> 10

aaactgctgg tcttatctaa 20

<210> 11

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<223> crRNA SG1 sequence (as RNA)

<400> 11

cugcgggacc auggaaugag 20

<210> 12

<211> 61

<212> RNA

<213> Artificial Sequence

<220>

<223> sgRNA SG1 sequence (as RNA)

<400> 12

cugcgggacc auggaaugag guuuuagagc uagaaauagc aaguuaaaua aggcuagucc 60

g 61

<210> 13

<211> 425

<212> DNA

<213> Artificial Sequence

<220>

<223> LHA (left homologous arm)

<400> 13

cagagtggtg aaggcactct gcatttcttg gttgagacag agaaaaaaag tggtcagaac 60

tgggtaaccc tccccccacc atattatcac agtgatccct tttgtctttc ttcaggctcc 120

agccccaccc tacagcccct gctccctgga ttcactagag ctaacttcag taaagtacaa 180

agaaaatggg gccatatgac tggccaaaaa aaaaatatct attcacgtgg atgaccagat 240

agtatgaatg gattgaaaat ttatcaggaa aaaaggatga gaggaaatgc caggagatga 300

gggcagagag caggccgttc tgggggaggg attctgtggg gacagggtgg cctactgggt 360

gtgccccttt tctcttctct gtctccctta gataagacca gcagttttgt catcctctcc 420

ctctc 425

<210> 14

<211> 425

<212> DNA

<213> Artificial Sequence

<220>

<223> RHA (right homology arm)

<400> 14

gtcccgcagc cccaggccca cactgaaagc atgtcgatcc aggagaacat atcatccctg 60

cagcttcggt catgggtctc taagtcccaa agagacttag caaagtccat cctgattggg 120

gctccaggag gtaagaaggg gagacagaag ccatggaaca taggaggaaa atgagggtga 180

aaactaggag ccagggtgga gggcataaat gatccacatc agccactggc taggtgggtt 240

ttggagagga acgtacgttc ttcagagcct cccgtgtgtt aaattatgga ccctggcctg 300

ggtcttttcc aggccctata ggcaggccag agccacagca tgtaagccac ggggcactcc 360

cgtggttcct ggactctggc ccctggcata cagggcttcc aatggaacag gagacagtgg 420

tgaca 425

<210> 15

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<223> 5'UTR sequence

<400> 15

ttccatggtc ccgcagcccc aggcccacac tgaaagcatg 40

<210> 16

<211> 1719

<212> DNA

<213> Artificial Sequence

<220>

<223> coRPK cDNA

<400> 16

agcatccagg aaaatatcag ctctctgcag ctgcggtcct gggtgtccaa gagccagaga 60

gacctggcca agagcatcct gatcggagcc cctggcggac cagccggata cctgagaagg 120

gctagcgtgg cccagctgac ccaggaactg ggcaccgcct ttttccagca gcagcagctg 180

ccagccgcca tggccgacac ctttctggaa cacctgtgcc tgctggacat cgactctgag 240

cccgtggccg ccagaagcac cagcatcatt gccaccatcg gccctgccag cagaagcgtg 300

gagcggctga aagagatgat caaggccggc atgaatatcg cccggctgaa cttctcccac 360

ggcagccacg agtaccacgc agagagcatt gccaacgtcc gggaggccgt ggagagcttt 420

gccggcagcc ccctgagcta cagacccgtg gccattgccc tggacaccaa gggccccgag 480

atcagaacag gaattctgca gggagggcct gagagcgagg tggagctggt gaagggcagc 540

caagtgctgg tgaccgtgga ccccgccttc agaaccagag gcaacgccaa cacagtgtgg 600

gtggactacc ccaacatcgt gcgggtggtg cctgtgggcg gcagaatcta catcgacgac 660

ggcctgatca gcctggtggt gcagaagatc ggacctgagg gcctggtgac ccaggtcgag 720

aatggcggcg tgctgggcag cagaaagggc gtgaatctgc caggcgccca ggtggacctg 780

cctggcctgt ctgagcagga cgtgagagac ctgagatttg gcgtggagca cggcgtggac 840

atcgtgttcg ccagcttcgt gcggaaggcc tctgatgtgg ccgccgtgag agccgctctg 900

ggccctgaag gccacggcat caagatcatc agcaagatcg agaaccacga gggcgtgaag 960

cggttcgacg agatcctgga agtgtccgac ggcatcatgg tggccagagg cgacctgggc 1020

atcgagatcc ccgccgagaa ggtgttcctg gcccagaaaa tgatgatcgg acggtgcaac 1080

ctggccggca aacctgtggt gtgcgccacc cagatgctgg aaagcatgat caccaagccc 1140

agacccacca gagccgagac aagcgacgtg gccaacgccg tgctggatgg cgctgactgc 1200

atcatgctgt ccggcgagac agccaagggc aacttccccg tggaggccgt gaagatgcag 1260

cacgccattg ccagagaagc cgaggccgcc gtgtaccacc ggcagctgtt cgaggaactg 1320

cggagagccg cccctctgag cagagatccc accgaagtga ccgccatcgg agccgtggaa 1380

gccgccttca agtgctgcgc cgctgcaatc atcgtgctga ccaccacagg cagaagcgcc 1440

cagctgctgt ccagatacag acccagagcc gccgtgatcg ccgtgacaag atccgcccag 1500

gccgctagac aggtccacct gtgcagaggc gtgttccccc tgctgtaccg ggagcctccc 1560

gaggccatct gggccgacga cgtggacaga cgggtgcagt tcggcatcga gagcggcaag 1620

ctgcggggct tcctgagagt gggcgacctg gtgatcgtgg tgacaggctg gcggcctggc 1680

agcggctaca ccaacatcat gagggtgctg tccatcagc 1719

<210> 17

<211> 27

<212> DNA

<213> Artificial Sequence

<220>

<223> FLAG-Tag

<400> 17

gactacaaag acgatgacga taaatga 27

<210> 18

<211> 225

<212> DNA

<213> Artificial Sequence

<220>

<223> bGH poly(A) signal

<400> 18

ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc 60

tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc 120

tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt 180

gggaagacaa tagcaggcat gctggggatg cggtgggctc tatgg 225

<210> 19

<211> 2884

<212> DNA

<213> Artificial Sequence

<220>

<223> LHA-5'UTR-coRPK-FLAG-bGH poly(A)-RHA

<400> 19

cagagtggtg aaggcactct gcatttcttg gttgagacag agaaaaaaag tggtcagaac 60

tgggtaaccc tccccccacc atattatcac agtgatccct tttgtctttc ttcaggctcc 120

agccccaccc tacagcccct gctccctgga ttcactagag ctaacttcag taaagtacaa 180

agaaaatggg gccatatgac tggccaaaaa aaaaatatct attcacgtgg atgaccagat 240

agtatgaatg gattgaaaat ttatcaggaa aaaaggatga gaggaaatgc caggagatga 300

gggcagagag caggccgttc tgggggaggg attctgtggg gacagggtgg cctactgggt 360

gtgccccttt tctcttctct gtctccctta gataagacca gcagttttgt catcctctcc 420

ctctcttcca tggtcccgca gccccaggcc cacactgaaa gcatgagcat ccaggaaaat 480

atcagctctc tgcagctgcg gtcctgggtg tccaagagcc agagagacct ggccaagagc 540

atcctgatcg gagcccctgg cggaccagcc ggatacctga gaagggctag cgtggcccag 600

ctgacccagg aactgggcac cgcctttttc cagcagcagc agctgccagc cgccatggcc 660

gacacctttc tggaacacct gtgcctgctg gacatcgact ctgagcccgt ggccgccaga 720

agcaccagca tcattgccac catcggccct gccagcagaa gcgtggagcg gctgaaagag 780

atgatcaagg ccggcatgaa tatcgcccgg ctgaacttct cccacggcag ccacgagtac 840

cacgcagaga gcattgccaa cgtccgggag gccgtggaga gctttgccgg cagccccctg 900

agctacagac ccgtggccat tgccctggac accaagggcc ccgagatcag aacaggaatt 960

ctgcagggag ggcctgagag cgaggtggag ctggtgaagg gcagccaagt gctggtgacc 1020

gtggaccccg ccttcagaac cagaggcaac gccaacacag tgtgggtgga ctaccccaac 1080

atcgtgcggg tggtgcctgt gggcggcaga atctacatcg acgacggcct gatcagcctg 1140

gtggtgcaga agatcggacc tgagggcctg gtgacccagg tcgagaatgg cggcgtgctg 1200

ggcagcagaa agggcgtgaa tctgccaggc gcccaggtgg acctgcctgg cctgtctgag 1260

caggacgtga gagacctgag atttggcgtg gagcacggcg tggacatcgt gttcgccagc 1320

ttcgtgcgga aggcctctga tgtggccgcc gtgagagccg ctctgggccc tgaaggccac 1380

ggcatcaaga tcatcagcaa gatcgagaac cacgagggcg tgaagcggtt cgacgagatc 1440

ctggaagtgt ccgacggcat catggtggcc agaggcgacc tgggcatcga gatccccgcc 1500

gagaaggtgt tcctggccca gaaaatgatg atcggacggt gcaacctggc cggcaaacct 1560

gtggtgtgcg ccacccagat gctggaaagc atgatcacca agcccagacc caccagagcc 1620

gagacaagcg acgtggccaa cgccgtgctg gatggcgctg actgcatcat gctgtccggc 1680

gagacagcca agggcaactt ccccgtggag gccgtgaaga tgcagcacgc cattgccaga 1740

gaagccgagg ccgccgtgta ccaccggcag ctgttcgagg aactgcggag agccgcccct 1800

ctgagcagag atcccaccga agtgaccgcc atcggagccg tggaagccgc cttcaagtgc 1860

tgcgccgctg caatcatcgt gctgaccacc acaggcagaa gcgcccagct gctgtccaga 1920

tacagaccca gagccgccgt gatcgccgtg acaagatccg cccaggccgc tagacaggtc 1980

cacctgtgca gaggcgtgtt ccccctgctg taccgggagc ctcccgaggc catctgggcc 2040

gacgacgtgg acagacgggt gcagttcggc atcgagagcg gcaagctgcg gggcttcctg 2100

agagtgggcg acctggtgat cgtggtgaca ggctggcggc ctggcagcgg ctacaccaac 2160

atcatgaggg tgctgtccat cagcgactac aaagacgatg acgataaatg aacgcgtgag 2220

ttacaaataa agcactgtgc cttctagttg ccagccatct gttgtttgcc cctcccccgt 2280

gccttccttg accctggaag gtgccactcc cactgtcctt tcctaataaa atgaggaaat 2340

tgcatcgcat tgtctgagta ggtgtcattc tattctgggg ggtggggtgg ggcaggacag 2400

caagggggag gattgggaag acaatagcag gcatgctggg gatgcggtgg gctctatggg 2460

tcccgcagcc ccaggcccac actgaaagca tgtcgatcca ggagaacata tcatccctgc 2520

agcttcggtc atgggtctct aagtcccaaa gagacttagc aaagtccatc ctgattgggg 2580

ctccaggagg taagaagggg agacagaagc catggaacat aggaggaaaa tgagggtgaa 2640

aactaggagc cagggtggag ggcataaatg atccacatca gccactggct aggtgggttt 2700

tggagaggaa cgtacgttct tcagagcctc ccgtgtgtta aattatggac cctggcctgg 2760

gtcttttcca ggccctatag gcaggccaga gccacagcat gtaagccacg gggcactccc 2820

gtggttcctg gactctggcc cctggcatac agggcttcca atggaacagg agacagtggt 2880

gaca 2884

<210> 20

<211> 2860

<212> DNA

<213> Artificial Sequence

<220>

<223> LHA-5'UTR-coRPK-bGH poly(A)-RHA

<400> 20

cagagtggtg aaggcactct gcatttcttg gttgagacag agaaaaaaag tggtcagaac 60

tgggtaaccc tccccccacc atattatcac agtgatccct tttgtctttc ttcaggctcc 120

agccccaccc tacagcccct gctccctgga ttcactagag ctaacttcag taaagtacaa 180

agaaaatggg gccatatgac tggccaaaaa aaaaatatct attcacgtgg atgaccagat 240

agtatgaatg gattgaaaat ttatcaggaa aaaaggatga gaggaaatgc caggagatga 300

gggcagagag caggccgttc tgggggaggg attctgtggg gacagggtgg cctactgggt 360

gtgccccttt tctcttctct gtctccctta gataagacca gcagttttgt catcctctcc 420

ctctcttcca tggtcccgca gccccaggcc cacactgaaa gcatgagcat ccaggaaaat 480

atcagctctc tgcagctgcg gtcctgggtg tccaagagcc agagagacct ggccaagagc 540

atcctgatcg gagcccctgg cggaccagcc ggatacctga gaagggctag cgtggcccag 600

ctgacccagg aactgggcac cgcctttttc cagcagcagc agctgccagc cgccatggcc 660

gacacctttc tggaacacct gtgcctgctg gacatcgact ctgagcccgt ggccgccaga 720

agcaccagca tcattgccac catcggccct gccagcagaa gcgtggagcg gctgaaagag 780

atgatcaagg ccggcatgaa tatcgcccgg ctgaacttct cccacggcag ccacgagtac 840

cacgcagaga gcattgccaa cgtccgggag gccgtggaga gctttgccgg cagccccctg 900

agctacagac ccgtggccat tgccctggac accaagggcc ccgagatcag aacaggaatt 960

ctgcagggag ggcctgagag cgaggtggag ctggtgaagg gcagccaagt gctggtgacc 1020

gtggaccccg ccttcagaac cagaggcaac gccaacacag tgtgggtgga ctaccccaac 1080

atcgtgcggg tggtgcctgt gggcggcaga atctacatcg acgacggcct gatcagcctg 1140

gtggtgcaga agatcggacc tgagggcctg gtgacccagg tcgagaatgg cggcgtgctg 1200

ggcagcagaa agggcgtgaa tctgccaggc gcccaggtgg acctgcctgg cctgtctgag 1260

caggacgtga gagacctgag atttggcgtg gagcacggcg tggacatcgt gttcgccagc 1320

ttcgtgcgga aggcctctga tgtggccgcc gtgagagccg ctctgggccc tgaaggccac 1380

ggcatcaaga tcatcagcaa gatcgagaac cacgagggcg tgaagcggtt cgacgagatc 1440

ctggaagtgt ccgacggcat catggtggcc agaggcgacc tgggcatcga gatccccgcc 1500

gagaaggtgt tcctggccca gaaaatgatg atcggacggt gcaacctggc cggcaaacct 1560

gtggtgtgcg ccacccagat gctggaaagc atgatcacca agcccagacc caccagagcc 1620

gagacaagcg acgtggccaa cgccgtgctg gatggcgctg actgcatcat gctgtccggc 1680

gagacagcca agggcaactt ccccgtggag gccgtgaaga tgcagcacgc cattgccaga 1740

gaagccgagg ccgccgtgta ccaccggcag ctgttcgagg aactgcggag agccgcccct 1800

ctgagcagag atcccaccga agtgaccgcc atcggagccg tggaagccgc cttcaagtgc 1860

tgcgccgctg caatcatcgt gctgaccacc acaggcagaa gcgcccagct gctgtccaga 1920

tacagaccca gagccgccgt gatcgccgtg acaagatccg cccaggccgc tagacaggtc 1980

cacctgtgca gaggcgtgtt ccccctgctg taccgggagc ctcccgaggc catctgggcc 2040

gacgacgtgg acagacgggt gcagttcggc atcgagagcg gcaagctgcg gggcttcctg 2100

agagtgggcg acctggtgat cgtggtgaca ggctggcggc ctggcagcgg ctacaccaac 2160

atcatgaggg tgctgtccat cagctgaacg cgtgagttac aaataaagca ctgtgccttc 2220

tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc 2280

cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc tgagtaggtg 2340

tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt gggaagacaa 2400

tagcaggcat gctggggatg cggtgggctc tatgggtccc gcagccccag gcccacactg 2460

aaagcatgtc gatccaggag aacatatcat ccctgcagct tcggtcatgg gtctctaagt 2520

cccaaagaga cttagcaaag tccatcctga ttggggctcc aggaggtaag aaggggagac 2580

agaagccatg gaacatagga ggaaaatgag ggtgaaaact aggagccagg gtggagggca 2640

taaatgatcc acatcagcca ctggctaggt gggttttgga gaggaacgta cgttcttcag 2700

agcctcccgt gtgttaaatt atggaccctg gcctgggtct tttccaggcc ctataggcag 2760

gccagagcca cagcatgtaa gccacggggc actcccgtgg ttcctggact ctggcccctg 2820

gcatacaggg cttccaatgg aacaggagac agtggtgaca 2860

<210> 21

<211> 2884

<212> DNA

<213> Artificial Sequence

<220>

<223> LHA-5'UTR-coRPK-bGH poly(A)-RHA

<400> 21

tgtcaccact gtctcctgtt ccattggaag ccctgtatgc caggggccag agtccaggaa 60

ccacgggagt gccccgtggc ttacatgctg tggctctggc ctgcctatag ggcctggaaa 120

agacccaggc cagggtccat aatttaacac acgggaggct ctgaagaacg tacgttcctc 180

tccaaaaccc acctagccag tggctgatgt ggatcattta tgccctccac cctggctcct 240

agttttcacc ctcattttcc tcctatgttc catggcttct gtctcccctt cttacctcct 300

ggagccccaa tcaggatgga ctttgctaag tctctttggg acttagagac ccatgaccga 360

agctgcaggg atgatatgtt ctcctggatc gacatgcttt cagtgtgggc ctggggctgc 420

gggacccata gagcccaccg catccccagc atgcctgcta ttgtcttccc aatcctcccc 480

cttgctgtcc tgccccaccc caccccccag aatagaatga cacctactca gacaatgcga 540

tgcaatttcc tcattttatt aggaaaggac agtgggagtg gcaccttcca gggtcaagga 600

aggcacgggg gaggggcaaa caacagatgg ctggcaacta gaaggcacag tgctttattt 660

gtaactcacg cgttcattta tcgtcatcgt ctttgtagtc gctgatggac agcaccctca 720

tgatgttggt gtagccgctg ccaggccgcc agcctgtcac cacgatcacc aggtcgccca 780

ctctcaggaa gccccgcagc ttgccgctct cgatgccgaa ctgcacccgt ctgtccacgt 840

cgtcggccca gatggcctcg ggaggctccc ggtacagcag ggggaacacg cctctgcaca 900

ggtggacctg tctagcggcc tgggcggatc ttgtcacggc gatcacggcg gctctgggtc 960

tgtatctgga cagcagctgg gcgcttctgc ctgtggtggt cagcacgatg attgcagcgg 1020

cgcagcactt gaaggcggct tccacggctc cgatggcggt cacttcggtg ggatctctgc 1080

tcagaggggc ggctctccgc agttcctcga acagctgccg gtggtacacg gcggcctcgg 1140

cttctctggc aatggcgtgc tgcatcttca cggcctccac ggggaagttg cccttggctg 1200

tctcgccgga cagcatgatg cagtcagcgc catccagcac ggcgttggcc acgtcgcttg 1260

tctcggctct ggtgggtctg ggcttggtga tcatgctttc cagcatctgg gtggcgcaca 1320

ccacaggttt gccggccagg ttgcaccgtc cgatcatcat tttctgggcc aggaacacct 1380

tctcggcggg gatctcgatg cccaggtcgc ctctggccac catgatgccg tcggacactt 1440

ccaggatctc gtcgaaccgc ttcacgccct cgtggttctc gatcttgctg atgatcttga 1500

tgccgtggcc ttcagggccc agagcggctc tcacggcggc cacatcagag gccttccgca 1560

cgaagctggc gaacacgatg tccacgccgt gctccacgcc aaatctcagg tctctcacgt 1620

cctgctcaga caggccaggc aggtccacct gggcgcctgg cagattcacg ccctttctgc 1680

tgcccagcac gccgccattc tcgacctggg tcaccaggcc ctcaggtccg atcttctgca 1740

ccaccaggct gatcaggccg tcgtcgatgt agattctgcc gcccacaggc accacccgca 1800

cgatgttggg gtagtccacc cacactgtgt tggcgttgcc tctggttctg aaggcggggt 1860

ccacggtcac cagcacttgg ctgcccttca ccagctccac ctcgctctca ggccctccct 1920

gcagaattcc tgttctgatc tcggggccct tggtgtccag ggcaatggcc acgggtctgt 1980

agctcagggg gctgccggca aagctctcca cggcctcccg gacgttggca atgctctctg 2040

cgtggtactc gtggctgccg tgggagaagt tcagccgggc gatattcatg ccggccttga 2100

tcatctcttt cagccgctcc acgcttctgc tggcagggcc gatggtggca atgatgctgg 2160

tgcttctggc ggccacgggc tcagagtcga tgtccagcag gcacaggtgt tccagaaagg 2220

tgtcggccat ggcggctggc agctgctgct gctggaaaaa ggcggtgccc agttcctggg 2280

tcagctgggc cacgctagcc cttctcaggt atccggctgg tccgccaggg gctccgatca 2340

ggatgctctt ggccaggtct ctctggctct tggacaccca ggaccgcagc tgcagagagc 2400

tgatattttc ctggatgctc atgctttcag tgtgggcctg gggctgcggg accatggaag 2460

agagggagag gatgacaaaa ctgctggtct tatctaaggg agacagagaa gagaaaaggg 2520

gcacacccag taggccaccc tgtccccaca gaatccctcc cccagaacgg cctgctctct 2580

gccctcatct cctggcattt cctctcatcc ttttttcctg ataaattttc aatccattca 2640

tactatctgg tcatccacgt gaatagatat tttttttttg gccagtcata tggccccatt 2700

ttctttgtac tttactgaag ttagctctag tgaatccagg gagcaggggc tgtagggtgg 2760

ggctggagcc tgaagaaaga caaaagggat cactgtgata atatggtggg gggagggtta 2820

cccagttctg accacttttt ttctctgtct caaccaagaa atgcagagtg ccttcaccac 2880

tctg 2884

<210> 22

<211> 2860

<212> DNA

<213> Artificial Sequence

<220>

<223> LHA-5'UTR-coRPK-bGH poly(A)-RHA

<400> 22

tgtcaccact gtctcctgtt ccattggaag ccctgtatgc caggggccag agtccaggaa 60

ccacgggagt gccccgtggc ttacatgctg tggctctggc ctgcctatag ggcctggaaa 120

agacccaggc cagggtccat aatttaacac acgggaggct ctgaagaacg tacgttcctc 180

tccaaaaccc acctagccag tggctgatgt ggatcattta tgccctccac cctggctcct 240

agttttcacc ctcattttcc tcctatgttc catggcttct gtctcccctt cttacctcct 300

ggagccccaa tcaggatgga ctttgctaag tctctttggg acttagagac ccatgaccga 360

agctgcaggg atgatatgtt ctcctggatc gacatgcttt cagtgtgggc ctggggctgc 420

gggacccata gagcccaccg catccccagc atgcctgcta ttgtcttccc aatcctcccc 480

cttgctgtcc tgccccaccc caccccccag aatagaatga cacctactca gacaatgcga 540

tgcaatttcc tcattttatt aggaaaggac agtgggagtg gcaccttcca gggtcaagga 600

aggcacgggg gaggggcaaa caacagatgg ctggcaacta gaaggcacag tgctttattt 660

gtaactcacg cgttcagctg atggacagca ccctcatgat gttggtgtag ccgctgccag 720

gccgccagcc tgtcaccacg atcaccaggt cgcccactct caggaagccc cgcagcttgc 780

cgctctcgat gccgaactgc acccgtctgt ccacgtcgtc ggcccagatg gcctcgggag 840

gctcccggta cagcaggggg aacacgcctc tgcacaggtg gacctgtcta gcggcctggg 900

cggatcttgt cacggcgatc acggcggctc tgggtctgta tctggacagc agctgggcgc 960

ttctgcctgt ggtggtcagc acgatgattg cagcggcgca gcacttgaag gcggcttcca 1020

cggctccgat ggcggtcact tcggtgggat ctctgctcag aggggcggct ctccgcagtt 1080

cctcgaacag ctgccggtgg tacacggcgg cctcggcttc tctggcaatg gcgtgctgca 1140

tcttcacggc ctccacgggg aagttgccct tggctgtctc gccggacagc atgatgcagt 1200

cagcgccatc cagcacggcg ttggccacgt cgcttgtctc ggctctggtg ggtctgggct 1260

tggtgatcat gctttccagc atctgggtgg cgcacaccac aggtttgccg gccaggttgc 1320

accgtccgat catcattttc tgggccagga acaccttctc ggcggggatc tcgatgccca 1380

ggtcgcctct ggccaccatg atgccgtcgg acacttccag gatctcgtcg aaccgcttca 1440

cgccctcgtg gttctcgatc ttgctgatga tcttgatgcc gtggccttca gggcccagag 1500

cggctctcac ggcggccaca tcagaggcct tccgcacgaa gctggcgaac acgatgtcca 1560

cgccgtgctc cacgccaaat ctcaggtctc tcacgtcctg ctcagacagg ccaggcaggt 1620

ccacctgggc gcctggcaga ttcacgccct ttctgctgcc cagcacgccg ccattctcga 1680

cctgggtcac caggccctca ggtccgatct tctgcaccac caggctgatc aggccgtcgt 1740

cgatgtagat tctgccgccc acaggcacca cccgcacgat gttggggtag tccacccaca 1800

ctgtgttggc gttgcctctg gttctgaagg cggggtccac ggtcaccagc acttggctgc 1860

ccttcaccag ctccacctcg ctctcaggcc ctccctgcag aattcctgtt ctgatctcgg 1920

ggcccttggt gtccagggca atggccacgg gtctgtagct cagggggctg ccggcaaagc 1980

tctccacggc ctcccggacg ttggcaatgc tctctgcgtg gtactcgtgg ctgccgtggg 2040

agaagttcag ccgggcgata ttcatgccgg ccttgatcat ctctttcagc cgctccacgc 2100

ttctgctggc agggccgatg gtggcaatga tgctggtgct tctggcggcc acgggctcag 2160

agtcgatgtc cagcaggcac aggtgttcca gaaaggtgtc ggccatggcg gctggcagct 2220

gctgctgctg gaaaaaggcg gtgcccagtt cctgggtcag ctgggccacg ctagcccttc 2280

tcaggtatcc ggctggtccg ccaggggctc cgatcaggat gctcttggcc aggtctctct 2340

ggctcttgga cacccaggac cgcagctgca gagagctgat attttcctgg atgctcatgc 2400

tttcagtgtg ggcctggggc tgcgggacca tggaagagag ggagaggatg acaaaactgc 2460

tggtcttatc taagggagac agagaagaga aaaggggcac acccagtagg ccaccctgtc 2520

cccacagaat ccctccccca gaacggcctg ctctctgccc tcatctcctg gcatttcctc 2580

tcatcctttt ttcctgataa attttcaatc cattcatact atctggtcat ccacgtgaat 2640

agatattttt tttttggcca gtcatatggc cccattttct ttgtacttta ctgaagttag 2700

ctctagtgaa tccagggagc aggggctgta gggtggggct ggagcctgaa gaaagacaaa 2760

agggatcact gtgataatat ggtgggggga gggttaccca gttctgacca ctttttttct 2820

ctgtctcaac caagaaatgc agagtgcctt caccactctg 2860

<210> 23

<211> 2876

<212> DNA

<213> Artificial Sequence

<220>

<223> AAV backbone

<400> 23

cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60

ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120

aggggttcct gcggccgcag gaacccctag tgatggagtt ggccactccc tctctgcgcg 180

ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg 240

cggcctcagt gagcgagcga gcgcgcagct gcctgcaggg gcgcctgatg cggtattttc 300

tccttacgca tctgtgcggt atttcacacc gcatacgtca aagcaaccat agtacgcgcc 360

ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga ccgctacact 420

tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct tcctttctcg ccacgttcgc 480

cggctttccc cgtcaagctc taaatcgggg gctcccttta gggttccgat ttagtgcttt 540

acggcacctc gaccccaaaa aacttgattt gggtgatggt tcacgtagtg ggccatcgcc 600

ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg ttctttaata gtggactctt 660

gttccaaact ggaacaacac tcaaccctat ctcgggctat tcttttgatt tataagggat 720

tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa 780

ttttaacaaa atattaacgt ttacaatttt atggtgcact ctcagtacaa tctgctctga 840

tgccgcatag ttaagccagc cccgacaccc gccaacaccc gctgacgcgc cctgacgggc 900

ttgtctgctc ccggcatccg cttacagaca agctgtgacc gtctccggga gctgcatgtg 960

tcagaggttt tcaccgtcat caccgaaacg cgcgagacga aagggcctcg tgatacgcct 1020

atttttatag gttaatgtca tgataataat ggtttcttag acgtcaggtg gcacttttcg 1080

gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa atatgtatcc 1140

gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga agagtatgag 1200

tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc ttcctgtttt 1260

tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt 1320

gggttacatc gaactggatc tcaacagcgg taagatcctt gagagttttc gccccgaaga 1380

acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat tatcccgtat 1440

tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg acttggttga 1500

gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag aattatgcag 1560

tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa cgatcggagg 1620

accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc gccttgatcg 1680

ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca cgatgcctgt 1740

agcaatggca acaacgttgc gcaaactatt aactggcgaa ctacttactc tagcttcccg 1800

gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc tgcgctcggc 1860

ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg 1920

tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta tctacacgac 1980

ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag gtgcctcact 2040

gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga ttgatttaaa 2100

acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc tcatgaccaa 2160

aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg 2220

atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc 2280

gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac 2340

tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca 2400

ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt 2460

ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc 2520

ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg 2580

aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc 2640

cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac 2700

gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct 2760

ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc 2820

cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgt 2876

<210> 24

<211> 5899

<212> DNA

<213> Artificial Sequence

<220>

<223> coRPK AAV used for pre-clinical studies

<400> 24

cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60

ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120

aggggttcct gcggccgcca gagtggtgaa ggcactctgc atttcttggt tgagacagag 180

aaaaaaagtg gtcagaactg ggtaaccctc cccccaccat attatcacag tgatcccttt 240

tgtctttctt caggctccag ccccacccta cagcccctgc tccctggatt cactagagct 300

aacttcagta aagtacaaag aaaatggggc catatgactg gccaaaaaaa aaatatctat 360

tcacgtggat gaccagatag tatgaatgga ttgaaaattt atcaggaaaa aaggatgaga 420

ggaaatgcca ggagatgagg gcagagagca ggccgttctg ggggagggat tctgtgggga 480

cagggtggcc tactgggtgt gccccttttc tcttctctgt ctcccttaga taagaccagc 540

agttttgtca tcctctccct ctcttccatg gtcccgcagc cccaggccca cactgaaagc 600

atgagcatcc aggaaaatat cagctctctg cagctgcggt cctgggtgtc caagagccag 660

agagacctgg ccaagagcat cctgatcgga gcccctggcg gaccagccgg atacctgaga 720

agggctagcg tggcccagct gacccaggaa ctgggcaccg cctttttcca gcagcagcag 780

ctgccagccg ccatggccga cacctttctg gaacacctgt gcctgctgga catcgactct 840

gagcccgtgg ccgccagaag caccagcatc attgccacca tcggccctgc cagcagaagc 900

gtggagcggc tgaaagagat gatcaaggcc ggcatgaata tcgcccggct gaacttctcc 960

cacggcagcc acgagtacca cgcagagagc attgccaacg tccgggaggc cgtggagagc 1020

tttgccggca gccccctgag ctacagaccc gtggccattg ccctggacac caagggcccc 1080

gagatcagaa caggaattct gcagggaggg cctgagagcg aggtggagct ggtgaagggc 1140

agccaagtgc tggtgaccgt ggaccccgcc ttcagaacca gaggcaacgc caacacagtg 1200

tgggtggact accccaacat cgtgcgggtg gtgcctgtgg gcggcagaat ctacatcgac 1260

gacggcctga tcagcctggt ggtgcagaag atcggacctg agggcctggt gacccaggtc 1320

gagaatggcg gcgtgctggg cagcagaaag ggcgtgaatc tgccaggcgc ccaggtggac 1380

ctgcctggcc tgtctgagca ggacgtgaga gacctgagat ttggcgtgga gcacggcgtg 1440

gacatcgtgt tcgccagctt cgtgcggaag gcctctgatg tggccgccgt gagagccgct 1500

ctgggccctg aaggccacgg catcaagatc atcagcaaga tcgagaacca cgagggcgtg 1560

aagcggttcg acgagatcct ggaagtgtcc gacggcatca tggtggccag aggcgacctg 1620

ggcatcgaga tccccgccga gaaggtgttc ctggcccaga aaatgatgat cggacggtgc 1680

aacctggccg gcaaacctgt ggtgtgcgcc acccagatgc tggaaagcat gatcaccaag 1740

cccagaccca ccagagccga gacaagcgac gtggccaacg ccgtgctgga tggcgctgac 1800

tgcatcatgc tgtccggcga gacagccaag ggcaacttcc ccgtggaggc cgtgaagatg 1860

cagcacgcca ttgccagaga agccgaggcc gccgtgtacc accggcagct gttcgaggaa 1920

ctgcggagag ccgcccctct gagcagagat cccaccgaag tgaccgccat cggagccgtg 1980

gaagccgcct tcaagtgctg cgccgctgca atcatcgtgc tgaccaccac aggcagaagc 2040

gcccagctgc tgtccagata cagacccaga gccgccgtga tcgccgtgac aagatccgcc 2100

caggccgcta gacaggtcca cctgtgcaga ggcgtgttcc ccctgctgta ccgggagcct 2160

cccgaggcca tctgggccga cgacgtggac agacgggtgc agttcggcat cgagagcggc 2220

aagctgcggg gcttcctgag agtgggcgac ctggtgatcg tggtgacagg ctggcggcct 2280

ggcagcggct acaccaacat catgagggtg ctgtccatca gcgactacaa agacgatgac 2340

gataaatgaa cgcgtgagtt acaaataaag cactgtgcct tctagttgcc agccatctgt 2400

tgtttgcccc tcccccgtgc cttccttgac cctggaaggt gccactccca ctgtcctttc 2460

ctaataaaat gaggaaattg catcgcattg tctgagtagg tgtcattcta ttctgggggg 2520

tggggtgggg caggacagca agggggagga ttgggaagac aatagcaggc atgctgggga 2580

tgcggtgggc tctatgggtc ccgcagcccc aggcccacac tgaaagcatg tcgatccagg 2640

agaacatatc atccctgcag cttcggtcat gggtctctaa gtcccaaaga gacttagcaa 2700

agtccatcct gattggggct ccaggaggta agaaggggag acagaagcca tggaacatag 2760

gaggaaaatg agggtgaaaa ctaggagcca gggtggaggg cataaatgat ccacatcagc 2820

cactggctag gtgggttttg gagaggaacg tacgttcttc agagcctccc gtgtgttaaa 2880

ttatggaccc tggcctgggt cttttccagg ccctataggc aggccagagc cacagcatgt 2940

aagccacggg gcactcccgt ggttcctgga ctctggcccc tggcatacag ggcttccaat 3000

ggaacaggag acagtggtga cagcggccgc aggaacccct agtgatggag ttggccactc 3060

cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg 3120

gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag ctgcctgcag gggcgcctga 3180

tgcggtattt tctccttacg catctgtgcg gtatttcaca ccgcatacgt caaagcaacc 3240

atagtacgcg ccctgtagcg gcgcattaag cgcggcgggt gtggtggtta cgcgcagcgt 3300

gaccgctaca cttgccagcg ccctagcgcc cgctcctttc gctttcttcc cttcctttct 3360

cgccacgttc gccggctttc cccgtcaagc tctaaatcgg gggctccctt tagggttccg 3420

atttagtgct ttacggcacc tcgaccccaa aaaacttgat ttgggtgatg gttcacgtag 3480

tgggccatcg ccctgataga cggtttttcg ccctttgacg ttggagtcca cgttctttaa 3540

tagtggactc ttgttccaaa ctggaacaac actcaaccct atctcgggct attcttttga 3600

tttataaggg attttgccga tttcggccta ttggttaaaa aatgagctga tttaacaaaa 3660

atttaacgcg aattttaaca aaatattaac gtttacaatt ttatggtgca ctctcagtac 3720

aatctgctct gatgccgcat agttaagcca gccccgacac ccgccaacac ccgctgacgc 3780

gccctgacgg gcttgtctgc tcccggcatc cgcttacaga caagctgtga ccgtctccgg 3840

gagctgcatg tgtcagaggt tttcaccgtc atcaccgaaa cgcgcgagac gaaagggcct 3900

cgtgatacgc ctatttttat aggttaatgt catgataata atggtttctt agacaaacct 3960

agatattgat agtctgatcg gtcaacgtat aatcgagtcc tagcttttgc aaacatctat 4020

caagagacag gatcagcagg aggctttcgc atgattgaac aagatggatt gcacgcaggt 4080

tctccggcgg cttgggtgga gaggctattc ggctatgact gggcacaaca gacaatcggc 4140

tgctctgatg ccgccgtgtt ccggctgtca gcgcaggggc gtccggttct ttttgtcaag 4200

accgacctgt ccggtgccct gaatgaactg caagacgagg cagcgcggct atcgtggctg 4260

gcgacgacgg gcgttccttg cgcggctgtg ctcgacgttg tcactgaagc gggaagggac 4320

tggctgctat tgggcgaagt gccggggcag gatctcctgt catctcacct tgctcctgcc 4380

gagaaagtat ccatcatggc tgatgcaatg cggcggctgc atacgcttga tccggctacc 4440

tgcccattcg accaccaagc gaaacatcgc atcgagcgag cacgtactcg gatggaagcc 4500

ggtcttgtcg atcaggatga tctggacgaa gagcatcagg ggctcgcgcc agccgaactg 4560

ttcgccaggc tcaaggcgtc tatgcccgac ggcgaggatc tcgtcgtgac ccacggcgat 4620

gcctgcttgc cgaatatcat ggtggaaaat ggccgctttt ctggattcat cgactgtggc 4680

cgtctgggtg tggcggaccg ctatcaggac atagcgttgg ctacccgtga tattgctgaa 4740

gagcttggcg gcgaatgggc tgaccgcttc cttgtgcttt acggtatcgc cgcgcccgat 4800

tcgcagcgca tcgccttcta tcgccttctt gacgagttct tctgaccgat tctaggtgca 4860

ttggcgcaga aaaaaatgcc tgatgcgacg ctgcgcgtct tatactccca catatgccag 4920

attcagcaac ggatacggct tccccaactt gcccacttcc atacgtgtcc tccttaccag 4980

aaatttatcc ttaacgatcg gacggggagt caggcaacta tggatgaacg aaatagacag 5040

atcgctgaga taggtgcctc actgattaag cattggtaac tgtcagacca agtttactca 5100

tatatacttt agattgattt aaaacttcat ttttaattta aaaggatcta ggtgaagatc 5160

ctttttgata atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca 5220

gaccccgtag aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc 5280

tgcttgcaaa caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta 5340

ccaactcttt ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgttctt 5400

ctagtgtagc cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc 5460

gctctgctaa tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg 5520

ttggactcaa gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg 5580

tgcacacagc ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag 5640

ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc 5700

agggtcggaa caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat 5760

agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg 5820

gggcggagcc tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc 5880

tggccttttg ctcacatgt 5899

<210> 25

<211> 5875

<212> DNA

<213> Artificial Sequence

<220>

<223> coRPK AAV used for pre-clinical studies

<400> 25

cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60

ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120

aggggttcct gcggccgcca gagtggtgaa ggcactctgc atttcttggt tgagacagag 180

aaaaaaagtg gtcagaactg ggtaaccctc cccccaccat attatcacag tgatcccttt 240

tgtctttctt caggctccag ccccacccta cagcccctgc tccctggatt cactagagct 300

aacttcagta aagtacaaag aaaatggggc catatgactg gccaaaaaaa aaatatctat 360

tcacgtggat gaccagatag tatgaatgga ttgaaaattt atcaggaaaa aaggatgaga 420

ggaaatgcca ggagatgagg gcagagagca ggccgttctg ggggagggat tctgtgggga 480

cagggtggcc tactgggtgt gccccttttc tcttctctgt ctcccttaga taagaccagc 540

agttttgtca tcctctccct ctcttccatg gtcccgcagc cccaggccca cactgaaagc 600

atgagcatcc aggaaaatat cagctctctg cagctgcggt cctgggtgtc caagagccag 660

agagacctgg ccaagagcat cctgatcgga gcccctggcg gaccagccgg atacctgaga 720

agggctagcg tggcccagct gacccaggaa ctgggcaccg cctttttcca gcagcagcag 780

ctgccagccg ccatggccga cacctttctg gaacacctgt gcctgctgga catcgactct 840

gagcccgtgg ccgccagaag caccagcatc attgccacca tcggccctgc cagcagaagc 900

gtggagcggc tgaaagagat gatcaaggcc ggcatgaata tcgcccggct gaacttctcc 960

cacggcagcc acgagtacca cgcagagagc attgccaacg tccgggaggc cgtggagagc 1020

tttgccggca gccccctgag ctacagaccc gtggccattg ccctggacac caagggcccc 1080

gagatcagaa caggaattct gcagggaggg cctgagagcg aggtggagct ggtgaagggc 1140

agccaagtgc tggtgaccgt ggaccccgcc ttcagaacca gaggcaacgc caacacagtg 1200

tgggtggact accccaacat cgtgcgggtg gtgcctgtgg gcggcagaat ctacatcgac 1260

gacggcctga tcagcctggt ggtgcagaag atcggacctg agggcctggt gacccaggtc 1320

gagaatggcg gcgtgctggg cagcagaaag ggcgtgaatc tgccaggcgc ccaggtggac 1380

ctgcctggcc tgtctgagca ggacgtgaga gacctgagat ttggcgtgga gcacggcgtg 1440

gacatcgtgt tcgccagctt cgtgcggaag gcctctgatg tggccgccgt gagagccgct 1500

ctgggccctg aaggccacgg catcaagatc atcagcaaga tcgagaacca cgagggcgtg 1560

aagcggttcg acgagatcct ggaagtgtcc gacggcatca tggtggccag aggcgacctg 1620

ggcatcgaga tccccgccga gaaggtgttc ctggcccaga aaatgatgat cggacggtgc 1680

aacctggccg gcaaacctgt ggtgtgcgcc acccagatgc tggaaagcat gatcaccaag 1740

cccagaccca ccagagccga gacaagcgac gtggccaacg ccgtgctgga tggcgctgac 1800

tgcatcatgc tgtccggcga gacagccaag ggcaacttcc ccgtggaggc cgtgaagatg 1860

cagcacgcca ttgccagaga agccgaggcc gccgtgtacc accggcagct gttcgaggaa 1920

ctgcggagag ccgcccctct gagcagagat cccaccgaag tgaccgccat cggagccgtg 1980

gaagccgcct tcaagtgctg cgccgctgca atcatcgtgc tgaccaccac aggcagaagc 2040

gcccagctgc tgtccagata cagacccaga gccgccgtga tcgccgtgac aagatccgcc 2100

caggccgcta gacaggtcca cctgtgcaga ggcgtgttcc ccctgctgta ccgggagcct 2160

cccgaggcca tctgggccga cgacgtggac agacgggtgc agttcggcat cgagagcggc 2220

aagctgcggg gcttcctgag agtgggcgac ctggtgatcg tggtgacagg ctggcggcct 2280

ggcagcggct acaccaacat catgagggtg ctgtccatca gctgaacgcg tgagttacaa 2340

ataaagcact gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc 2400

cttgaccctg gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc 2460

gcattgtctg agtaggtgtc attctattct ggggggtggg gtggggcagg acagcaaggg 2520

ggaggattgg gaagacaata gcaggcatgc tggggatgcg gtgggctcta tgggtcccgc 2580

agccccaggc ccacactgaa agcatgtcga tccaggagaa catatcatcc ctgcagcttc 2640

ggtcatgggt ctctaagtcc caaagagact tagcaaagtc catcctgatt ggggctccag 2700

gaggtaagaa ggggagacag aagccatgga acataggagg aaaatgaggg tgaaaactag 2760

gagccagggt ggagggcata aatgatccac atcagccact ggctaggtgg gttttggaga 2820

ggaacgtacg ttcttcagag cctcccgtgt gttaaattat ggaccctggc ctgggtcttt 2880

tccaggccct ataggcaggc cagagccaca gcatgtaagc cacggggcac tcccgtggtt 2940

cctggactct ggcccctggc atacagggct tccaatggaa caggagacag tggtgacagc 3000

ggccgcagga acccctagtg atggagttgg ccactccctc tctgcgcgct cgctcgctca 3060

ctgaggccgg gcgaccaaag gtcgcccgac gcccgggctt tgcccgggcg gcctcagtga 3120

gcgagcgagc gcgcagctgc ctgcaggggc gcctgatgcg gtattttctc cttacgcatc 3180

tgtgcggtat ttcacaccgc atacgtcaaa gcaaccatag tacgcgccct gtagcggcgc 3240

attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc gctacacttg ccagcgccct 3300

agcgcccgct cctttcgctt tcttcccttc ctttctcgcc acgttcgccg gctttccccg 3360

tcaagctcta aatcgggggc tccctttagg gttccgattt agtgctttac ggcacctcga 3420

ccccaaaaaa cttgatttgg gtgatggttc acgtagtggg ccatcgccct gatagacggt 3480

ttttcgccct ttgacgttgg agtccacgtt ctttaatagt ggactcttgt tccaaactgg 3540

aacaacactc aaccctatct cgggctattc ttttgattta taagggattt tgccgatttc 3600

ggcctattgg ttaaaaaatg agctgattta acaaaaattt aacgcgaatt ttaacaaaat 3660

attaacgttt acaattttat ggtgcactct cagtacaatc tgctctgatg ccgcatagtt 3720

aagccagccc cgacacccgc caacacccgc tgacgcgccc tgacgggctt gtctgctccc 3780

ggcatccgct tacagacaag ctgtgaccgt ctccgggagc tgcatgtgtc agaggttttc 3840

accgtcatca ccgaaacgcg cgagacgaaa gggcctcgtg atacgcctat ttttataggt 3900

taatgtcatg ataataatgg tttcttagac aaacctagat attgatagtc tgatcggtca 3960

acgtataatc gagtcctagc ttttgcaaac atctatcaag agacaggatc agcaggaggc 4020

tttcgcatga ttgaacaaga tggattgcac gcaggttctc cggcggcttg ggtggagagg 4080

ctattcggct atgactgggc acaacagaca atcggctgct ctgatgccgc cgtgttccgg 4140

ctgtcagcgc aggggcgtcc ggttcttttt gtcaagaccg acctgtccgg tgccctgaat 4200

gaactgcaag acgaggcagc gcggctatcg tggctggcga cgacgggcgt tccttgcgcg 4260

gctgtgctcg acgttgtcac tgaagcggga agggactggc tgctattggg cgaagtgccg 4320

gggcaggatc tcctgtcatc tcaccttgct cctgccgaga aagtatccat catggctgat 4380

gcaatgcggc ggctgcatac gcttgatccg gctacctgcc cattcgacca ccaagcgaaa 4440

catcgcatcg agcgagcacg tactcggatg gaagccggtc ttgtcgatca ggatgatctg 4500

gacgaagagc atcaggggct cgcgccagcc gaactgttcg ccaggctcaa ggcgtctatg 4560

cccgacggcg aggatctcgt cgtgacccac ggcgatgcct gcttgccgaa tatcatggtg 4620

gaaaatggcc gcttttctgg attcatcgac tgtggccgtc tgggtgtggc ggaccgctat 4680

caggacatag cgttggctac ccgtgatatt gctgaagagc ttggcggcga atgggctgac 4740

cgcttccttg tgctttacgg tatcgccgcg cccgattcgc agcgcatcgc cttctatcgc 4800

cttcttgacg agttcttctg accgattcta ggtgcattgg cgcagaaaaa aatgcctgat 4860

gcgacgctgc gcgtcttata ctcccacata tgccagattc agcaacggat acggcttccc 4920

caacttgccc acttccatac gtgtcctcct taccagaaat ttatccttaa cgatcggacg 4980

gggagtcagg caactatgga tgaacgaaat agacagatcg ctgagatagg tgcctcactg 5040

attaagcatt ggtaactgtc agaccaagtt tactcatata tactttagat tgatttaaaa 5100

cttcattttt aatttaaaag gatctaggtg aagatccttt ttgataatct catgaccaaa 5160

atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa gatcaaagga 5220

tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg 5280

ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc gaaggtaact 5340

ggcttcagca gagcgcagat accaaatact gttcttctag tgtagccgta gttaggccac 5400

cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct gttaccagtg 5460

gctgctgcca gtggcgataa gtcgtgtctt accgggttgg actcaagacg atagttaccg 5520

gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca cacagcccag cttggagcga 5580

acgacctaca ccgaactgag atacctacag cgtgagctat gagaaagcgc cacgcttccc 5640

gaagggagaa aggcggacag gtatccggta agcggcaggg tcggaacagg agagcgcacg 5700

agggagcttc cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc 5760

tgacttgagc gtcgattttt gtgatgctcg tcaggggggc ggagcctatg gaaaaacgcc 5820

agcaacgcgg cctttttacg gttcctggcc ttttgctggc cttttgctca catgt 5875

<210> 26

<211> 5899

<212> DNA

<213> Artificial Sequence

<220>

<223> coRPK AAV used for pre-clinical studies

<400> 26

cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60

ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120

aggggttcct gcggccgctg tcaccactgt ctcctgttcc attggaagcc ctgtatgcca 180

ggggccagag tccaggaacc acgggagtgc cccgtggctt acatgctgtg gctctggcct 240

gcctataggg cctggaaaag acccaggcca gggtccataa tttaacacac gggaggctct 300

gaagaacgta cgttcctctc caaaacccac ctagccagtg gctgatgtgg atcatttatg 360

ccctccaccc tggctcctag ttttcaccct cattttcctc ctatgttcca tggcttctgt 420

ctccccttct tacctcctgg agccccaatc aggatggact ttgctaagtc tctttgggac 480

ttagagaccc atgaccgaag ctgcagggat gatatgttct cctggatcga catgctttca 540

gtgtgggcct ggggctgcgg gacccataga gcccaccgca tccccagcat gcctgctatt 600

gtcttcccaa tcctccccct tgctgtcctg ccccacccca ccccccagaa tagaatgaca 660

cctactcaga caatgcgatg caatttcctc attttattag gaaaggacag tgggagtggc 720

accttccagg gtcaaggaag gcacggggga ggggcaaaca acagatggct ggcaactaga 780

aggcacagtg ctttatttgt aactcacgcg ttcatttatc gtcatcgtct ttgtagtcgc 840

tgatggacag caccctcatg atgttggtgt agccgctgcc aggccgccag cctgtcacca 900

cgatcaccag gtcgcccact ctcaggaagc cccgcagctt gccgctctcg atgccgaact 960

gcacccgtct gtccacgtcg tcggcccaga tggcctcggg aggctcccgg tacagcaggg 1020

ggaacacgcc tctgcacagg tggacctgtc tagcggcctg ggcggatctt gtcacggcga 1080

tcacggcggc tctgggtctg tatctggaca gcagctgggc gcttctgcct gtggtggtca 1140

gcacgatgat tgcagcggcg cagcacttga aggcggcttc cacggctccg atggcggtca 1200

cttcggtggg atctctgctc agaggggcgg ctctccgcag ttcctcgaac agctgccggt 1260

ggtacacggc ggcctcggct tctctggcaa tggcgtgctg catcttcacg gcctccacgg 1320

ggaagttgcc cttggctgtc tcgccggaca gcatgatgca gtcagcgcca tccagcacgg 1380

cgttggccac gtcgcttgtc tcggctctgg tgggtctggg cttggtgatc atgctttcca 1440

gcatctgggt ggcgcacacc acaggtttgc cggccaggtt gcaccgtccg atcatcattt 1500

tctgggccag gaacaccttc tcggcgggga tctcgatgcc caggtcgcct ctggccacca 1560

tgatgccgtc ggacacttcc aggatctcgt cgaaccgctt cacgccctcg tggttctcga 1620

tcttgctgat gatcttgatg ccgtggcctt cagggcccag agcggctctc acggcggcca 1680

catcagaggc cttccgcacg aagctggcga acacgatgtc cacgccgtgc tccacgccaa 1740

atctcaggtc tctcacgtcc tgctcagaca ggccaggcag gtccacctgg gcgcctggca 1800

gattcacgcc ctttctgctg cccagcacgc cgccattctc gacctgggtc accaggccct 1860

caggtccgat cttctgcacc accaggctga tcaggccgtc gtcgatgtag attctgccgc 1920

ccacaggcac cacccgcacg atgttggggt agtccaccca cactgtgttg gcgttgcctc 1980

tggttctgaa ggcggggtcc acggtcacca gcacttggct gcccttcacc agctccacct 2040

cgctctcagg ccctccctgc agaattcctg ttctgatctc ggggcccttg gtgtccaggg 2100

caatggccac gggtctgtag ctcagggggc tgccggcaaa gctctccacg gcctcccgga 2160

cgttggcaat gctctctgcg tggtactcgt ggctgccgtg ggagaagttc agccgggcga 2220

tattcatgcc ggccttgatc atctctttca gccgctccac gcttctgctg gcagggccga 2280

tggtggcaat gatgctggtg cttctggcgg ccacgggctc agagtcgatg tccagcaggc 2340

acaggtgttc cagaaaggtg tcggccatgg cggctggcag ctgctgctgc tggaaaaagg 2400

cggtgcccag ttcctgggtc agctgggcca cgctagccct tctcaggtat ccggctggtc 2460

cgccaggggc tccgatcagg atgctcttgg ccaggtctct ctggctcttg gacacccagg 2520

accgcagctg cagagagctg atattttcct ggatgctcat gctttcagtg tgggcctggg 2580

gctgcgggac catggaagag agggagagga tgacaaaact gctggtctta tctaagggag 2640

acagagaaga gaaaaggggc acacccagta ggccaccctg tccccacaga atccctcccc 2700

cagaacggcc tgctctctgc cctcatctcc tggcatttcc tctcatcctt ttttcctgat 2760

aaattttcaa tccattcata ctatctggtc atccacgtga atagatattt tttttttggc 2820

cagtcatatg gccccatttt ctttgtactt tactgaagtt agctctagtg aatccaggga 2880

gcaggggctg tagggtgggg ctggagcctg aagaaagaca aaagggatca ctgtgataat 2940

atggtggggg gagggttacc cagttctgac cacttttttt ctctgtctca accaagaaat 3000

gcagagtgcc ttcaccactc tggcggccgc aggaacccct agtgatggag ttggccactc 3060

cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg 3120

gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag ctgcctgcag gggcgcctga 3180

tgcggtattt tctccttacg catctgtgcg gtatttcaca ccgcatacgt caaagcaacc 3240

atagtacgcg ccctgtagcg gcgcattaag cgcggcgggt gtggtggtta cgcgcagcgt 3300

gaccgctaca cttgccagcg ccctagcgcc cgctcctttc gctttcttcc cttcctttct 3360

cgccacgttc gccggctttc cccgtcaagc tctaaatcgg gggctccctt tagggttccg 3420

atttagtgct ttacggcacc tcgaccccaa aaaacttgat ttgggtgatg gttcacgtag 3480

tgggccatcg ccctgataga cggtttttcg ccctttgacg ttggagtcca cgttctttaa 3540

tagtggactc ttgttccaaa ctggaacaac actcaaccct atctcgggct attcttttga 3600

tttataaggg attttgccga tttcggccta ttggttaaaa aatgagctga tttaacaaaa 3660

atttaacgcg aattttaaca aaatattaac gtttacaatt ttatggtgca ctctcagtac 3720

aatctgctct gatgccgcat agttaagcca gccccgacac ccgccaacac ccgctgacgc 3780

gccctgacgg gcttgtctgc tcccggcatc cgcttacaga caagctgtga ccgtctccgg 3840

gagctgcatg tgtcagaggt tttcaccgtc atcaccgaaa cgcgcgagac gaaagggcct 3900

cgtgatacgc ctatttttat aggttaatgt catgataata atggtttctt agacaaacct 3960

agatattgat agtctgatcg gtcaacgtat aatcgagtcc tagcttttgc aaacatctat 4020

caagagacag gatcagcagg aggctttcgc atgattgaac aagatggatt gcacgcaggt 4080

tctccggcgg cttgggtgga gaggctattc ggctatgact gggcacaaca gacaatcggc 4140

tgctctgatg ccgccgtgtt ccggctgtca gcgcaggggc gtccggttct ttttgtcaag 4200

accgacctgt ccggtgccct gaatgaactg caagacgagg cagcgcggct atcgtggctg 4260

gcgacgacgg gcgttccttg cgcggctgtg ctcgacgttg tcactgaagc gggaagggac 4320

tggctgctat tgggcgaagt gccggggcag gatctcctgt catctcacct tgctcctgcc 4380

gagaaagtat ccatcatggc tgatgcaatg cggcggctgc atacgcttga tccggctacc 4440

tgcccattcg accaccaagc gaaacatcgc atcgagcgag cacgtactcg gatggaagcc 4500

ggtcttgtcg atcaggatga tctggacgaa gagcatcagg ggctcgcgcc agccgaactg 4560

ttcgccaggc tcaaggcgtc tatgcccgac ggcgaggatc tcgtcgtgac ccacggcgat 4620

gcctgcttgc cgaatatcat ggtggaaaat ggccgctttt ctggattcat cgactgtggc 4680

cgtctgggtg tggcggaccg ctatcaggac atagcgttgg ctacccgtga tattgctgaa 4740

gagcttggcg gcgaatgggc tgaccgcttc cttgtgcttt acggtatcgc cgcgcccgat 4800

tcgcagcgca tcgccttcta tcgccttctt gacgagttct tctgaccgat tctaggtgca 4860

ttggcgcaga aaaaaatgcc tgatgcgacg ctgcgcgtct tatactccca catatgccag 4920

attcagcaac ggatacggct tccccaactt gcccacttcc atacgtgtcc tccttaccag 4980

aaatttatcc ttaacgatcg gacggggagt caggcaacta tggatgaacg aaatagacag 5040

atcgctgaga taggtgcctc actgattaag cattggtaac tgtcagacca agtttactca 5100

tatatacttt agattgattt aaaacttcat ttttaattta aaaggatcta ggtgaagatc 5160

ctttttgata atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca 5220

gaccccgtag aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc 5280

tgcttgcaaa caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta 5340

ccaactcttt ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgttctt 5400

ctagtgtagc cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc 5460

gctctgctaa tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg 5520

ttggactcaa gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg 5580

tgcacacagc ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag 5640

ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc 5700

agggtcggaa caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat 5760

agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg 5820

gggcggagcc tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc 5880

tggccttttg ctcacatgt 5899

<210> 27

<211> 5875

<212> DNA

<213> Artificial Sequence

<220>

<223> coRPK AAV for clinical use

<400> 27

cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60

ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120

aggggttcct gcggccgctg tcaccactgt ctcctgttcc attggaagcc ctgtatgcca 180

ggggccagag tccaggaacc acgggagtgc cccgtggctt acatgctgtg gctctggcct 240

gcctataggg cctggaaaag acccaggcca gggtccataa tttaacacac gggaggctct 300

gaagaacgta cgttcctctc caaaacccac ctagccagtg gctgatgtgg atcatttatg 360

ccctccaccc tggctcctag ttttcaccct cattttcctc ctatgttcca tggcttctgt 420

ctccccttct tacctcctgg agccccaatc aggatggact ttgctaagtc tctttgggac 480

ttagagaccc atgaccgaag ctgcagggat gatatgttct cctggatcga catgctttca 540

gtgtgggcct ggggctgcgg gacccataga gcccaccgca tccccagcat gcctgctatt 600

gtcttcccaa tcctccccct tgctgtcctg ccccacccca ccccccagaa tagaatgaca 660

cctactcaga caatgcgatg caatttcctc attttattag gaaaggacag tgggagtggc 720

accttccagg gtcaaggaag gcacggggga ggggcaaaca acagatggct ggcaactaga 780

aggcacagtg ctttatttgt aactcacgcg ttcagctgat ggacagcacc ctcatgatgt 840

tggtgtagcc gctgccaggc cgccagcctg tcaccacgat caccaggtcg cccactctca 900

ggaagccccg cagcttgccg ctctcgatgc cgaactgcac ccgtctgtcc acgtcgtcgg 960

cccagatggc ctcgggaggc tcccggtaca gcagggggaa cacgcctctg cacaggtgga 1020

cctgtctagc ggcctgggcg gatcttgtca cggcgatcac ggcggctctg ggtctgtatc 1080

tggacagcag ctgggcgctt ctgcctgtgg tggtcagcac gatgattgca gcggcgcagc 1140

acttgaaggc ggcttccacg gctccgatgg cggtcacttc ggtgggatct ctgctcagag 1200

gggcggctct ccgcagttcc tcgaacagct gccggtggta cacggcggcc tcggcttctc 1260

tggcaatggc gtgctgcatc ttcacggcct ccacggggaa gttgcccttg gctgtctcgc 1320

cggacagcat gatgcagtca gcgccatcca gcacggcgtt ggccacgtcg cttgtctcgg 1380

ctctggtggg tctgggcttg gtgatcatgc tttccagcat ctgggtggcg cacaccacag 1440

gtttgccggc caggttgcac cgtccgatca tcattttctg ggccaggaac accttctcgg 1500

cggggatctc gatgcccagg tcgcctctgg ccaccatgat gccgtcggac acttccagga 1560

tctcgtcgaa ccgcttcacg ccctcgtggt tctcgatctt gctgatgatc ttgatgccgt 1620

ggccttcagg gcccagagcg gctctcacgg cggccacatc agaggccttc cgcacgaagc 1680

tggcgaacac gatgtccacg ccgtgctcca cgccaaatct caggtctctc acgtcctgct 1740

cagacaggcc aggcaggtcc acctgggcgc ctggcagatt cacgcccttt ctgctgccca 1800

gcacgccgcc attctcgacc tgggtcacca ggccctcagg tccgatcttc tgcaccacca 1860

ggctgatcag gccgtcgtcg atgtagattc tgccgcccac aggcaccacc cgcacgatgt 1920

tggggtagtc cacccacact gtgttggcgt tgcctctggt tctgaaggcg gggtccacgg 1980

tcaccagcac ttggctgccc ttcaccagct ccacctcgct ctcaggccct ccctgcagaa 2040

ttcctgttct gatctcgggg cccttggtgt ccagggcaat ggccacgggt ctgtagctca 2100

gggggctgcc ggcaaagctc tccacggcct cccggacgtt ggcaatgctc tctgcgtggt 2160

actcgtggct gccgtgggag aagttcagcc gggcgatatt catgccggcc ttgatcatct 2220

ctttcagccg ctccacgctt ctgctggcag ggccgatggt ggcaatgatg ctggtgcttc 2280

tggcggccac gggctcagag tcgatgtcca gcaggcacag gtgttccaga aaggtgtcgg 2340

ccatggcggc tggcagctgc tgctgctgga aaaaggcggt gcccagttcc tgggtcagct 2400

gggccacgct agcccttctc aggtatccgg ctggtccgcc aggggctccg atcaggatgc 2460

tcttggccag gtctctctgg ctcttggaca cccaggaccg cagctgcaga gagctgatat 2520

tttcctggat gctcatgctt tcagtgtggg cctggggctg cgggaccatg gaagagaggg 2580

agaggatgac aaaactgctg gtcttatcta agggagacag agaagagaaa aggggcacac 2640

ccagtaggcc accctgtccc cacagaatcc ctcccccaga acggcctgct ctctgccctc 2700

atctcctggc atttcctctc atcctttttt cctgataaat tttcaatcca ttcatactat 2760

ctggtcatcc acgtgaatag atattttttt tttggccagt catatggccc cattttcttt 2820

gtactttact gaagttagct ctagtgaatc cagggagcag gggctgtagg gtggggctgg 2880

agcctgaaga aagacaaaag ggatcactgt gataatatgg tggggggagg gttacccagt 2940

tctgaccact ttttttctct gtctcaacca agaaatgcag agtgccttca ccactctggc 3000

ggccgcagga acccctagtg atggagttgg ccactccctc tctgcgcgct cgctcgctca 3060

ctgaggccgg gcgaccaaag gtcgcccgac gcccgggctt tgcccgggcg gcctcagtga 3120

gcgagcgagc gcgcagctgc ctgcaggggc gcctgatgcg gtattttctc cttacgcatc 3180

tgtgcggtat ttcacaccgc atacgtcaaa gcaaccatag tacgcgccct gtagcggcgc 3240

attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc gctacacttg ccagcgccct 3300

agcgcccgct cctttcgctt tcttcccttc ctttctcgcc acgttcgccg gctttccccg 3360

tcaagctcta aatcgggggc tccctttagg gttccgattt agtgctttac ggcacctcga 3420

ccccaaaaaa cttgatttgg gtgatggttc acgtagtggg ccatcgccct gatagacggt 3480

ttttcgccct ttgacgttgg agtccacgtt ctttaatagt ggactcttgt tccaaactgg 3540

aacaacactc aaccctatct cgggctattc ttttgattta taagggattt tgccgatttc 3600

ggcctattgg ttaaaaaatg agctgattta acaaaaattt aacgcgaatt ttaacaaaat 3660

attaacgttt acaattttat ggtgcactct cagtacaatc tgctctgatg ccgcatagtt 3720

aagccagccc cgacacccgc caacacccgc tgacgcgccc tgacgggctt gtctgctccc 3780

ggcatccgct tacagacaag ctgtgaccgt ctccgggagc tgcatgtgtc agaggttttc 3840

accgtcatca ccgaaacgcg cgagacgaaa gggcctcgtg atacgcctat ttttataggt 3900

taatgtcatg ataataatgg tttcttagac aaacctagat attgatagtc tgatcggtca 3960

acgtataatc gagtcctagc ttttgcaaac atctatcaag agacaggatc agcaggaggc 4020

tttcgcatga ttgaacaaga tggattgcac gcaggttctc cggcggcttg ggtggagagg 4080

ctattcggct atgactgggc acaacagaca atcggctgct ctgatgccgc cgtgttccgg 4140

ctgtcagcgc aggggcgtcc ggttcttttt gtcaagaccg acctgtccgg tgccctgaat 4200

gaactgcaag acgaggcagc gcggctatcg tggctggcga cgacgggcgt tccttgcgcg 4260

gctgtgctcg acgttgtcac tgaagcggga agggactggc tgctattggg cgaagtgccg 4320

gggcaggatc tcctgtcatc tcaccttgct cctgccgaga aagtatccat catggctgat 4380

gcaatgcggc ggctgcatac gcttgatccg gctacctgcc cattcgacca ccaagcgaaa 4440

catcgcatcg agcgagcacg tactcggatg gaagccggtc ttgtcgatca ggatgatctg 4500

gacgaagagc atcaggggct cgcgccagcc gaactgttcg ccaggctcaa ggcgtctatg 4560

cccgacggcg aggatctcgt cgtgacccac ggcgatgcct gcttgccgaa tatcatggtg 4620

gaaaatggcc gcttttctgg attcatcgac tgtggccgtc tgggtgtggc ggaccgctat 4680

caggacatag cgttggctac ccgtgatatt gctgaagagc ttggcggcga atgggctgac 4740

cgcttccttg tgctttacgg tatcgccgcg cccgattcgc agcgcatcgc cttctatcgc 4800

cttcttgacg agttcttctg accgattcta ggtgcattgg cgcagaaaaa aatgcctgat 4860

gcgacgctgc gcgtcttata ctcccacata tgccagattc agcaacggat acggcttccc 4920

caacttgccc acttccatac gtgtcctcct taccagaaat ttatccttaa cgatcggacg 4980

gggagtcagg caactatgga tgaacgaaat agacagatcg ctgagatagg tgcctcactg 5040

attaagcatt ggtaactgtc agaccaagtt tactcatata tactttagat tgatttaaaa 5100

cttcattttt aatttaaaag gatctaggtg aagatccttt ttgataatct catgaccaaa 5160

atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa gatcaaagga 5220

tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg 5280

ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc gaaggtaact 5340

ggcttcagca gagcgcagat accaaatact gttcttctag tgtagccgta gttaggccac 5400

cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct gttaccagtg 5460

gctgctgcca gtggcgataa gtcgtgtctt accgggttgg actcaagacg atagttaccg 5520

gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca cacagcccag cttggagcga 5580

acgacctaca ccgaactgag atacctacag cgtgagctat gagaaagcgc cacgcttccc 5640

gaagggagaa aggcggacag gtatccggta agcggcaggg tcggaacagg agagcgcacg 5700

agggagcttc cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc 5760

tgacttgagc gtcgattttt gtgatgctcg tcaggggggc ggagcctatg gaaaaacgcc 5820

agcaacgcgg cctttttacg gttcctggcc ttttgctggc cttttgctca catgt 5875

<210> 28

<211> 218

<212> DNA

<213> Homo sapiens

<220>

<223> RPK CDS (Fig 1)

<400> 28

gttctggggg agggattctg tggggacagg gtggcctact gggtgtgccc cttttctctt 60

ctctgtctcc cttagataag accagcagtt ttgtcatcct ctccctctca ttccatggtc 120

ccgcagcccc aggcccacac tgaaagcatg tcgatccagg agaacatatc atccctgcag 180

cttcggtcat gggtctctaa gtcccaaaga gacttagc 218

<210> 29

<211> 107

<212> DNA

<213> Artificial Sequence

<220>

<223> PKLR locus (Fig 7)

<400> 29

tctgtctccc ttagataaga ccagcagttt tgtcatcctc tccctctcat tccatggtcc 60

cgcagcccca ggcccacact gaaagcatgt cgatccagga gaacata 107

<210> 30

<211> 88

<212> DNA

<213> Artificial Sequence

<220>

<223> Genomic region of the starting site of the RPK transcript variant

(Fig 8, 9, 10, 11)

<400> 30

aagaccagca gttttgtcat cctctccctc tcattccatg gtcccgcagc cccaggccca 60

cactgaaagc atgtcgatcc aggagaac 88

<210> 31

<211> 158

<212> DNA

<213> Artificial Sequence

<220>

<223> 5’UTR position with respect to LHA and coRPK without start condon

in coRPK- AAV vector (Fig 12)

<400> 31

agggtggcct actgggtgtg ccccttttct cttctctgtc tcccttagat aagaccagca 60

gttttgtcat cctctccctc tcttccatgg tcccgcagcc ccaggcccac actgaaagca 120

tgagcatcca ggaaaatatc agctctctgc agctgcgg 158

<210> 32

<211> 154

<212> DNA

<213> Artificial Sequence

<220>

<223> FLAG-Tag position with respect to coRPK without STOP condon and

bGH poly(A) signal in coRPK-AAV vector (Fig 13)

<400> 32

gcgacctggt gatcgtggtg acaggctggc ggcctggcag cggctacacc aacatcatga 60

gggtgctgtc catcagcgac tacaaagacg atgacgataa atgaacgcgt gagttacaaa 120

taaagcactg tgccttctag ttgccagcca tctg 154

<210> 33

<211> 480

<212> DNA

<213> Artificial Sequence

<220>

<223> bGH poly(A) signal with respect to coRPK-FLAG and RHA in

coRPK-AAV vector (Fig 14)

<400> 33

agtgggcgac ctggtgatcg tggtgacagg ctggcggcct ggcagcggct acaccaacat 60

catgagggtg ctgtccatca gcgactacaa agacgatgac gataaatgaa cgcgtgagtt 120

acaaataaag cactgtgcct tctagttgcc agccatctgt tgtttgcccc tcccccgtgc 180

cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat gaggaaattg 240

catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg caggacagca 300

agggggagga ttgggaagac aatagcaggc atgctgggga tgcggtgggc tctatgggtc 360

ccgcagcccc aggcccacac tgaaagcatg tcgatccagg agaacatatc atccctgcag 420

cttcggtcat gggtctctaa gtcccaaaga gacttagcaa agtccatcct gattggggct 480

<210> 34

<211> 23

<212> PRT

<213> Artificial Sequence

<220>

<223> Aminoacid seq. RPK (Fig 1)

<400> 34

Met Ser Ile Gln Glu Asn Ile Ser Ser Leu Gln Leu Arg Ser Trp Val

1 5 10 15

Ser Lys Ser Gln Arg Asp Leu

20

<210> 35

<211> 6

<212> PRT

<213> Artificial Sequence

<220>

<223> Aminoacid seq. RPK (Figs 8-11)

<400> 35

Met Ser Ile Gln Glu Asn

1 5

<210> 36

<211> 35

<212> PRT

<213> Artificial Sequence

<220>

<223> Aminoacid seq. from aminoacids 748 to 782 (Fig 14)

<400> 36

Val Gly Asp Leu Val Ile Val Val Thr Gly Trp Arg Pro Gly Ser Gly

1 5 10 15

Tyr Thr Asn Ile Met Arg Val Leu Ser Ile Ser Asp Tyr Lys Asp Asp

20 25 30

Asp Asp Lys

35

<210> 37

<211> 11

<212> PRT

<213> Artificial Sequence

<220>

<223> Aminoacid seq. from aminoacids 784 to 794 (Fig 14)

<400> 37

Thr Arg Glu Leu Gln Ile Lys His Cys Ala Phe

1 5 10

<210> 38

<211> 28

<212> PRT

<213> Artificial Sequence

<220>

<223> Aminoacid seq. from aminoacids 796 to 823 (Fig 14)

<400> 38

Leu Pro Ala Ile Cys Cys Leu Pro Leu Pro Arg Ala Phe Leu Asp Pro

1 5 10 15

Gly Arg Cys His Ser His Cys Pro Phe Leu Ile Lys

20 25

<210> 39

<211> 8

<212> PRT

<213> Artificial Sequence

<220>

<223> Aminoacid seq. from aminoacids 825 to 832 (Fig 14)

<400> 39

Gly Asn Cys Ile Ala Leu Ser Glu

1 5

<210> 40

<211> 20

<212> PRT

<213> Artificial Sequence

<220>

<223> Aminoacid seq. from aminoacids 834 to 853 (Fig 14)

<400> 40

Val Ser Phe Tyr Ser Gly Gly Trp Gly Gly Ala Gly Gln Gln Gly Gly

1 5 10 15

Gly Leu Gly Arg

20

Claims

1.一种分离的crRNA序列，其中所述序列包含SEQ ID NO.:1或SEQ ID NO.:11，或者SEQID NO.:1或SEQ ID NO.:11的变体，所述变体具有与SEQ ID NO.:1或SEQ ID NO.:11至少95％的序列同一性。

2.权利要求1所述的分离的crRNA序列，其中所述序列由SEQ ID NO.:1组成。

3.权利要求1或2中任一项所述的分离的crRNA序列，其中所述序列与tracrRNA核苷酸序列化学结合，所述tracrRNA核苷酸序列与CRISPR-相关蛋白(Cas)多肽相互作用。

4.一种单链向导sgRNA，其包含权利要求3所述的crRNA序列和tracrRNA序列。

5.根据权利要求4所述的sgRNA，其中所述sgRNA包含SEQ ID NO.:12。

6.一种核糖核蛋白(RNP)复合物，其包含权利要求1或2中任一项所述的分离的crRNA序列，或者权利要求5所述的sgRNA，以及CRISPR-相关蛋白(Cas)多肽。

7.一种CRISPR系统，其包括编码Cas多肽的mRNA和权利要求4或5中任一项所述的sgRNA。

8.权利要求6所述的RNP复合物或权利要求7所述的CRISPR系统，其中所述Cas多肽为Cas9多肽。

9.权利要求6所述的RNP复合物或权利要求7所述的CRISPR系统，其中所述Cas多肽为高保真的或增强特异性的Cas9多肽变体。

10.一种系统，其包括权利要求6所述的RNP复合物或权利要求7所述的CRISPR系统，以及腺相关病毒颗粒或同源供体AAV载体，所述腺相关病毒颗粒或同源供体AAV载体可递送用于在靶细胞如原代细胞中经由同源定向修复进行基于CRISPR的基因编辑的重组供体模板。

11.权利要求10所述的系统，其中所述腺相关病毒颗粒或同源供体AAV载体包含DNA序列，所述DNA序列相应地包含同源臂LHA和同源臂RHA、编码PKLR基因的校正供体模板和真核细胞中蛋白表达的特化终止序列，如bGH poly(A)序列。

12.权利要求10所述的系统，其中所述LHA为SEQ ID NO.:13，所述RHA为SEQ ID NO.:14，所述编码PKLR基因的校正供体模板为SEQ ID NO.:16，以及bGH poly(A)序列为SEQIDNO.:18，或者这些序列中的任一个的变体，所述变体具有与这些序列中的任一个至少95％的序列同一性。

13.如权利要求11或12中任一项所述的系统，其中所述腺相关病毒颗粒或同源供体AAV载体还包含5’UTR序列，其中优选所述序列为SEQ ID NO.:15或SEQ ID NO.:15的变体，所述变体具有与SEQ ID NO.:15至少95％的序列同一性。

14.一种用于在原代细胞中通过同源重组诱导稳定基因修饰的方法，其中所述原代细胞以包含含有PKLR基因的靶核酸为特征，所述靶核酸相应地包含PKLR基因的一个或多个突变和与SEQ ID NO.:1或21互补的核苷酸序列，并且所述方法包括：

a.将权利要求6所述的RNP复合物或权利要求7所述的CRISPR系统引入所述原代细胞中；并且同时或顺序

b.将权利要求10至13中任一项所定义的腺相关病毒颗粒或同源供体AAV引入所述原代细胞中；

其中，所述靶核酸的稳定基因修饰包括通过引入包含校正供体模板的同源供体AAV载体来补偿PKLR基因(靶核酸)的致病突变。