CN117957022A

CN117957022A - 用于靶向cug重复序列的反义化合物和方法

Info

Publication number: CN117957022A
Application number: CN202280056925.0A
Authority: CN
Inventors: 沈秀龙; 钱自清; P·多尔蒂; M·凯拉迪; 李翔
Original assignee: Anzhuoda Treatment Co ltd
Current assignee: Anzhuoda Treatment Co ltd
Priority date: 2021-06-23
Filing date: 2022-06-22
Publication date: 2024-04-30

Abstract

提供了包含环肽诸如环状细胞穿透肽及反义化合物的化合物。所述反义化合物与具有扩增的CTG重复序列的基因或具有扩增的CUG重复序列的基因转录物结合。所述化合物可递送至受试者以治疗与扩增的CTG·CUG重复序列相关的疾病，诸如1型强直性肌营养不良(DM1)、脊髓小脑性共济失调‑8(SCA8)和亨廷顿病样‑2(HDL2)。

Description

用于靶向CUG重复序列的反义化合物和方法

相关申请的交叉引用

本申请要求2021年6月23日提交的美国临时申请序列号63/213,900；2021年9月1日提交的美国临时申请序列号63/239,847；2021年12月17日提交的美国临时申请序列号63/290,892；2022年1月31日提交的美国临时申请序列号63/305,071；2022年2月26日提交的美国临时申请序列号63/314,369；2022年3月4日提交的美国临时申请序列号63/316,634；2022年3月8日提交的美国临时申请序列号63/317,856；2022年3月31日提交的美国临时申请序列号63/326,201；2022年4月4日提交的美国临时申请序列号63/327,179；2022年5月6日提交的美国临时申请序列号63/339,250；2022年3月31日提交的美国临时申请序列号63/362,295；2021年9月1日提交的美国临时申请序列号63/239,671；2021年12月17日提交的美国临时申请序列号63/290,960；2022年1月11日提交的美国临时申请序列号63/298,565；及2022年2月25日提交的美国临时申请序列号63/268,577。

技术领域

本公开涉及用于调节基因活性和/或水平的化合物、组合物和方法，所述基因包括扩增的核苷酸重复序列，尤其是扩增的CTG·CUG重复序列。所述化合物和包含所述化合物的组合物可用于治疗与包括扩增的核苷酸重复序列，尤其是扩增的CTG·CUG重复序列的基因相关的疾病。

简介

一些疾病与具有扩增的核苷酸重复序列的基因相关，也就是说，比在健康表型中观察到的核苷酸重复序列数量更多。扩增的重复序列可以引起含有扩增的重复序列的转录物的聚集和/或成核，和/或引起与含有扩增的重复序列的转录物结合的蛋白质的成核。扩增的重复序列可以引起一些蛋白质，诸如前体mRNA加工蛋白质，被隔绝在重复序列上，从而抑制蛋白质执行其正常功能，诸如加工不含扩增的重复序列的其他基因的前体mRNA转录物。

有几种疾病与具有扩增的CTG·CUG三核苷酸重复序列的基因相关(CTG是指DNA重复序列，CUG是指转录时出现的相应RNA重复序列)。与具有扩增的CTG·CUG三核苷酸重复序列的基因相关的疾病包括但不限于1型强直性肌营养不良(DM1)、脊髓小脑性共济失调-8(SCA8)、类亨廷顿舞蹈病-2(HDL2)和富克斯角膜内皮营养不良(Fuchs'endothelialcorneal dystrophy，FECD)。

1型强直性肌营养不良(DM1)，是成人肌营养不良最常见的原因，在世界范围内影响1/8500的个体，与具有扩增的三核苷酸重复序列的基因相关(Lee和Cooper.(2009)“Pathogenic mechanisms of myotonic dystrophy,”Biochem Soc Trans.37(06):10.1042/BST0371281)。DM1是一种影响骨骼肌和平滑肌以及眼睛、心脏、内分泌系统和中枢神经系统的病症。DM1是由编码肌强直营养不良蛋白激酶(DMPK)的基因的非编码区中的CTG三核苷酸重复序列的异常扩增引起的。CTG扩增位于对应于DMPK mRNA的3′非翻译区(3′-UTR)的区域内。健康个体中的DMPK基因包含5至40个CTG三核苷酸重复序列，而DM1患者具有50至数千个CTG三核苷酸重复序列。由于一些调控性RNA结合蛋白在3’非翻译区(3’-UTR)的CUG扩增中成核，CTG-三核苷酸重复序列扩增引起受影响个体中基因表达的整体失调，致使RNA结合蛋白，诸如肌盲样蛋白(MBNL1-3)不能执行其正常的细胞功能。有核RNA结合蛋白不能结合和影响其他mRNA转录物的翻译。这些CUG扩增的mRNA蛋白质聚集体形成独特的核灶(nuclear foci)。附加剪接因子，诸如CUGBP Elav样家族成员1(CELF1)的活性，也被破坏，导致大量与DM1症状相关的下游基因转录物的错误剪接。随着重复序列数量的增加，疾病的严重程度增加且发病年龄减小(Pettersson等人(2015)“Molecular mechanisms in DM1–afocus on foci.”Nucleic Acids Res.43(4):2433-2441)。

DMPK mRNA 3’非翻译区中的CUG-三核苷酸重复序列形成不完美的稳定发夹结构，这些发夹结构在细胞核中以小核糖核复合物或显微镜可见包含物的形式积聚，并损害转录、剪接或RNA输出中牵涉的蛋白质的功能。尽管具有CUG重复序列的DMPK基因被转录成mRNA，但是突变转录物作为聚集体(灶)隔绝在细胞核中，这导致细胞质DMPK mRNA水平的降低。由于两种RNA结合蛋白的隔绝，这些聚集导致许多不同转录物的选择性剪接失调：MBNL1(肌盲样蛋白1)和CUGBP1(CUG结合蛋白1)，引起MBNL1功能丧失和CUGBP1上调(Lee和Cooper.(2009)“Pathogenic mechanisms of myotonic dystrophy,”Biochem SocTrans.37(06):10.1042/BST0371281)。MBNL1和CUGBP-ETR-3样因子1(CELF1)是胎儿向成人转变期间剪接事件的发育调控因子，它们在DM1中活性的改变导致胎儿剪接模式在成人组织中的表达。降低MBNL1和增加CELF1水平的下游影响包括蛋白质中破坏选择性剪接、mRNA翻译和mRNA衰减，这些蛋白质诸如心肌肌钙蛋白T(cTNT)、胰岛素受体(INSR)、肌肉特异性氯离子通道(CLCN1)和肌浆/内质网钙ATP酶1(ATP2A1)转录物，以及MBNL1(Konieczny等人(2017)“Myotonic dystrophy:candidate small molecule therapeutics.”Drug DiscovToday.22(11):1740-174)。

治疗DM1或与扩增的CTG·CUG重复序列相关的其他疾病的可能治疗方法，包括使用含有治疗性寡核苷酸的化合物。然而，与在治疗剂中使用寡核苷酸化合物相关的一个主要问题是当全身施用时，它们进入细胞内隔室的能力有限。通过使用载剂系统诸如聚合物、阳离子脂质体或通过对构建体进行化学修饰，例如通过胆固醇分子的共价附接，可以促进寡核苷酸化合物的细胞内递送。然而，寡核苷酸化合物的细胞内递送效率仍然很低。仍然需要改进的递送系统来增加这些化合物的效力。

对于将治疗性寡核苷酸化合物递送至细胞内隔室以治疗由扩增的CTG·CUG重复序列引起的疾病(诸如DM1)的有效组合物存在未满足的需求。

发明内容

本文描述了用于治疗与扩增的CTG·CUG重复序列相关的疾病的化合物、组合物和方法。在实施方案中，本公开涉及包括反义化合物(AC)和环肽，诸如环状细胞穿透肽(cCPP)的化合物。在实施方案中，AC与包含扩增的CUG重复序列的基因或基因转录物结合。在实施方案中，环肽促进AC的细胞内定位。这些化合物可以包含内体逃逸载体(EEV)。EEV可以包含环肽和环外肽。

在实施方案中，本文提供了一种化合物，该化合物包含：(a)至少一种环肽和(b)与靶核苷酸互补的反义化合物(AC)。在实施方案中，靶核苷酸包含至少一个扩增的CUG或CTG重复序列。在实施方案中，靶核苷酸是包含至少一个扩增的CTG重复序列的基因。在实施方案中，靶核苷酸是包含至少一个扩增的CUG重复序列的RNA。在实施方案中，包含至少一个扩增的CUG重复序列的RNA是前体mRNA序列。在实施方案中，扩增的CUG重复序列对应于转录前体mRNA的基因中的扩增的CTG重复序列。在实施方案中，反义化合物与扩增的CTG重复序列或扩增的CUG重复序列结合。在实施方案中，AC包含5-40个CAG重复序列(例如，5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40个重复序列)。在实施方案中，AC包含表2、表10或表11中列出的核苷酸序列。在实施方案中，AC包含表2中列出的核苷酸序列。

在实施方案中，AC包含至少一个选自以下的经修饰的核苷酸或核酸：硫代磷酸酯(PS)核苷酸、磷酰二胺吗啉代(PMO)核苷酸、锁核酸(LNA)、肽核酸(PNA)、包含2’-O-甲基(2’-OMe)修饰的骨架的核苷酸、2’-O-甲氧基-乙基(2’-MOE)核苷酸、2',4'限制性乙基(cEt)核苷酸、2'-脱氧-2'-氟-β-D-阿拉伯核酸(2’F-ANA)及它们的组合。在实施方案中，AC包含PMO核苷酸。

在实施方案中，提供了包含具有6至12个氨基酸的环肽的化合物，其中所述环肽的至少两个氨基酸是带电荷的氨基酸，所述环肽的至少两个氨基酸是芳族疏水性氨基酸，所述环肽的至少两个氨基酸是不带电荷的非芳族氨基酸。在实施方案中，反义化合物(AC)与靶mRNA序列中扩增的CUG重复序列的至少一部分互补。在实施方案中，AC是磷酰二胺吗啉代(PMO)核苷酸。

在实施方案中，环肽的至少两个带电荷的氨基酸是精氨酸。在实施方案中，环肽的至少两个芳族疏水性氨基酸是苯丙氨酸、萘丙氨酸(3-萘-2-基-丙氨酸)或它们的组合。在实施方案中，环肽的至少两个不带电荷的非芳族氨基酸是瓜氨酸、甘氨酸或它们的组合。在实施方案中，所述化合物是具有6至12个氨基酸的环肽，其中环肽的两个氨基酸是精氨酸，至少两个氨基酸是选自苯丙氨酸、萘丙氨酸及它们的组合的芳族疏水性氨基酸，并且至少两个氨基酸是选自瓜氨酸、甘氨酸及它们的组合的不带电荷的非芳族氨基酸。

在实施方案中，所述化合物包含内体逃逸载体，所述内体逃逸载体包含环肽和环外肽(EP)。在实施方案中，EP在氨基处与接头缀合。接头可以是如本文所述的接头。在实施方案中，EP经由接头与环肽缀合。在实施方案中，EP经由接头与AC缀合。在实施方案中，EP缀合到接头上，接头将AC缀合到环肽上。

在实施方案中，EP包含2至10个氨基酸。在实施方案中，EP包含4至8个氨基酸残基。在实施方案中，EP包含1或2个包含含有胍基或其质子化形式的侧链的氨基酸。在实施方案中，EP包含1、2、3或4个赖氨酸残基。在实施方案中，每个赖氨酸残基的侧链上的氨基被三氟乙酰基(-COCF₃)、烯丙氧羰基(Alloc)、1-(4,4-二甲基-2,6-二氧代亚环己基)乙基(Dde)或(4,4-二甲基-2,6-二氧代亚环-1-己基-3)-甲基丁基(ivDde)取代。在实施方案中，EP包含至少2个具有疏水性侧链的氨基酸残基。在实施方案中，具有疏水性侧链的氨基酸残基选自缬氨酸、脯氨酸、丙氨酸、亮氨酸、异亮氨酸和蛋氨酸。在实施方案中，环外肽包含以下序列之一：PKKKRKV；KR；RR；KKK；KGK；KBK；KBR；KRK；KRR；RKK；RRR；KKKK；KKRK；KRKK；KRRK；RKKR；RRRR；KGKK；KKGK；KKKKK；KKKRK；KBKBK；KKKRKV；PGKKRKV；PKGKRKV；PKKGRKV；PKKKGKV；PKKKRGV；或PKKKRKG。在实施方案中，环外肽由以下序列之一组成：PKKKRKV；KR；RR；KKK；KGK；KBK；KBR；KRK；KRR；RKK；RRR；KKKK；KKRK；KRKK；KRRK；RKKR；RRRR；KGKK；KKGK；KKKKK；KKKRK；KBKBK；KKKRKV；PGKKRKV；PKGKRKV；PKKGRKV；PKKKGKV；PKKKRGV；或PKKKRKG。在实施方案中，环外肽具有以下结构：Ac-P-K-K-K-R-K-V-。

在实施方案中，环肽包含4至12个氨基酸。在实施方案中，环肽包含6至12个氨基酸。在一些实施方案中，环肽的至少两个氨基酸是带电荷的氨基酸，环肽的至少两个氨基酸是芳族疏水性氨基酸，环肽的至少两个氨基酸是不带电荷的非芳族氨基酸。在一些实施方案中，环肽的至少两个带电荷的氨基酸是精氨酸，环肽的至少两个芳族疏水性氨基酸是苯丙氨酸、萘丙氨酸或它们的组合，并且至少两个不带电荷的非芳族氨基酸是瓜氨酸、甘氨酸或它们的组合。

在实施方案中，环肽具有4至12个氨基酸，其中至少两个氨基酸是精氨酸，并且至少两个氨基酸包含疏水性侧链，条件是该环肽不是具有SEQ ID NO:89-117的序列的环肽。在实施方案中，该环肽不是具有SEQ ID NO:89-117的序列的环肽。

其中F为L-苯丙氨酸，f为D-苯丙氨酸，为L-3-(2-萘基)-丙氨酸，为D-3-(2-萘基)-丙氨酸，R为L-精氨酸，r为D-精氨酸，Q为L-谷氨酰胺，q为D-谷氨酰胺，C为L-半胱氨酸，U为L-硒代半胱氨酸，W为L-色氨酸，K为L-赖氨酸，D为L-天冬氨酸，并且Ω为L-正亮氨酸。

在实施方案中，该环肽具有以下结构：

或

其质子化形式，

其中：

R₁、R₂和R₃各自独立地是H或氨基酸的芳族或杂芳族侧链；

R₁、R₂和R₃中的至少一者是氨基酸的芳族或杂芳族侧链；

R₄、R₅、R₆、R₇独立地是H或氨基酸侧链；

R₄、R₅、R₆、R₇中的至少一个是3-胍基-2-氨基丙酸、4-胍基-2-氨基丁酸、精氨酸、高精氨酸、N-甲基精氨酸、N,N-二甲基精氨酸、2,3-二氨基丙酸、2,4-二氨基丁酸、赖氨酸、N-甲基赖氨酸、N,N-二甲基赖氨酸、N-乙基赖氨酸、N,N,N-三甲基赖氨酸、4-胍基苯丙氨酸、瓜氨酸、N,N-二甲基赖氨酸、β-高精氨酸、3-(1-哌啶基)丙氨酸的侧链；

AA_SC是所述反义化合物所缀合到的氨基酸侧链；并且

q是1、2、3或4。

在实施方案中，R₄、R₅、R₆、R₇中的至少一个独立地是氨基酸的不带电荷的非芳族侧链。在实施方案中，R₄、R₅、R₆、R₇中的至少一个独立地为H或瓜氨酸的侧链。

在实施方案中，该环肽具有式I的结构：

或其质子化形式，

其中：

R₁、R₂和R₃各自独立地是H或具有包含芳族基团的侧链的氨基酸残基；

R₁、R₂和R₃中的至少一者是氨基酸的芳族或杂芳族侧链；

R₄和R₇独立地是H或氨基酸侧链；

AA_SC是所述反义化合物所缀合到的氨基酸侧链；

q是1、2、3或4；并且

每个m独立地是0、1、2或3的整数。

在实施方案中，式(I)的环肽具有以下结构之一：

或

其质子化形式。

在实施方案中，式(I)的环肽具有以下结构之一：

或

其质子化形式。

在实施方案中，式(I)的环肽具有以下结构之一：

或

其质子化形式。

在实施方案中，式(I)的环肽具有以下结构：

或

其质子化形式。

在实施方案中，该化合物具有式C的结构：

或

其质子化形式或盐，

其中：

R₁、R₂和R₃各自独立地是H或包含芳基或杂芳基的侧链，其中R₁、R₂和R₃中的至少一个是包含芳基或杂芳基的侧链；

R₄和R₇独立地是H或氨基酸侧链；

EP是所述环外肽；

每个m独立地是0至3的整数；

n是0至2的整数；

x’是1至23的整数；

y是1至5的整数；

q是1至4的整数；

z’是1至23的整数，并且

货物是所述反义化合物。

在实施方案中，该化合物具有一种或以下结构：

或其质子化形式或盐，

其中EP是所述环外肽，并且

寡核苷酸是所述反义化合物。

在实施方案中，式(C-1)、式(C-2)、式(C-3)或式(C-4)化合物的寡核苷酸包含以下序列：5’-CAG CAG CAG CAG CAG CAG CAG-3’。

在实施方案中，式(C-1)、式(C-2)、式(C-3)或式(C-4)化合物的EP包含以下序列：PKKKRKV。

附图说明

图1是显示靶向mRNA中的CUG重复序列的多种策略的示意图。

图2显示了在本文描述的反义寡核苷酸中使用的经修饰的核苷酸。结构1-3(1＝硫代磷酸酯；2＝(S_C5-R_p)-α,β-CAN；3＝PMO)是磷酸酯骨架修饰；结构4(2-硫代-dT)是碱基修饰；结构5-8(5＝2’-OMe-RNA；6＝2’O-MOE-RNA；7＝2’F-RNA；8＝2’F-ANA)是2’糖修饰；结构9-11是限制性核苷酸；结构12-14(9＝LNA；10＝(S)-cET；11＝tcDNA；12＝FHNA；13＝(S)5’-C-甲基；14＝UNA)是附加糖修饰；以及结构15-18(15＝E-VP；16＝甲基膦酸酯；17＝5’硫代磷酸酯；18＝(S)-5’-C-甲基与磷酸酯)是5’磷酸酯稳定修饰；结构19是吗啉代糖。重新格式化自Khvorova,A.等人，Nat.Biotechnol.2017年3月；35(3):238–248。

图3A-图3D说明了用于将AC连接到环状细胞穿透肽的缀合化学。图3A显示了具有羧酸基团或具有TFP活化的酯的肽与AC 5’端的伯胺残基之间的酰胺键形成。图3B显示了3’端的仲胺或伯胺修饰的AC与肽-TFP酯通过酰胺键形成的缀合。图3C显示了肽-叠氮化物经由无铜叠氮化物-炔烃环加成与5’环辛炔修饰的AC的缀合。图3D展示了分别经由无铜叠氮化物-炔烃环加成或铜催化的叠氮化物-炔烃环加成(点击反应)，在3’修饰的环辛烯AC或3’修饰的叠氮化物AC和含有接头-叠氮化物或接头-炔烃/环辛炔部分的CPP之间的另一示例性缀合。

图4显示了用含有聚乙二醇(PEG)部分的附加接头形式连接AC和CPP的缀合化学结构。

图5A-图5D提供了腺嘌呤(5A)、胞嘧啶(5B)、鸟嘌呤(5C)和胸腺嘧啶(5D)吗啉亚基单体的结构，这些结构可用于合成磷酰二胺连接的吗啉代寡聚物(PMO)。

图6A-图6F显示了使用Endo-Porter转染剂(图6A-图6C)或不使用Endo-Porter转染剂(图6E-图6F)，用1μM、3μM或10μM的各种PMO或PMO-EEV化合物处理HeLa-48细胞后24小时(图6A-图6B)和48小时(图6C-图6D)，MBNL1(外显子5；图6A、图6B、图6E)和CLASP1(外显子19；图6B、图6D、图6F)的选择性RNA剪接事件(例如，外显子包含或排除)的RT-PCR分析。包括亲代HeLa细胞系和用(图6A-图6D)或不用(图6E-图6F)Endo-Porter试剂处理的HeLa-480细胞系作为对照。

图7A-图7B显示了不使用Endo-Porter转染剂，用1μM的各种PMO或PMO-EEV化合物处理DM1成肌细胞48小时后，MBNL1(外显子5；图7A)和CLASP1(外显子19；图7B)的选择性RNA剪接事件(例如，外显子包含或排除)的RT-PCR分析。包括两个对照，即未经endo-porter处理的DM-04和未经endo-porter处理的DM-05作为对照。

图8A-图8D显示了在用PMO、20mpk PMO-EEV 221-1106或40mpk PMO-EEV 221-1106处理HSA-LR(DM1-小鼠模型)小鼠一周后，腓肠肌组织的Atp2a1(外显子22；图8A)、Nfix(外显子7；图8B)、Clcn1(外显子7a；图8C)和Mbnl1(外显子5；图8D)的选择性RNA剪接事件(例如，外显子包含或排除)的RT-PCR分析。包括FVB/NJ(野生型近交系小鼠)和HSA-LR(未经处理)小鼠作为对照组。

图9A-图9D显示了在用PMO、20mpk PMO-EEV 221-1106或40mpk PMO-EEV 221-1106处理HSA-LR(DM1-小鼠模型)小鼠一周后，四头肌组织的Atp2a1(外显子22；图9A)、Nfix(外显子7；图9B)、Clcn1(外显子7a；图9C)和Mbnl1(外显子5；图9D)的选择性RNA剪接事件(例如，外显子包含或排除)的RT-PCR分析。包括FVB/NJ(野生型近交系小鼠)和HSA-LR(未经处理)小鼠作为对照组。

图10A-图10D显示了在用PMO、20mpk PMO-EEV 221-1106或40mpk PMO-EEV 221-1106处理HSA-LR(DM1-小鼠模型)小鼠一周后，胫骨前肌组织的Atp2a1(外显子22；图10A)、Nfix(外显子7；图10B)、Clcn1(外显子7a；图10C)和Mbnl1(外显子5；图10D)的选择性RNA剪接事件(例如，外显子包含或排除)的RT-PCR分析。包括FVB/NJ(野生型近交系小鼠)和HSA-LR(未经处理)小鼠作为对照组。

图11A-图11F显示了用不同浓度(10μm、3μm、1μm、0.3μm)的靶向DMPK CUG的EEV-PMO(CUG^exp 197-777和CUG^exp 221-1106)处理DM1患者来源的肌细胞后，MBNL1(外显子5，图11A)、SOS1(外显子25，图11B)、IR(外显子11，图11C)、DMD(外显子78，图11D)、BIN1(外显子11，图11E)和LDB3(外显子11，图11F)的选择性RNA剪接事件(例如，外显子包含或排除)的RT-PCR分析。测试来自两个组即健康人(阴性对照)和DM1患者(阳性对照)的肌肉细胞的选择性RNA剪接事件作为对照。所有数据都是从三项单独的实验收集的(n＝3)。对经过处理与未处理的DM1肌管进行t检验；*p<0.05；**p<0.01；***p<0.001。

图12A-图12F显示了用10μm、3μm或1μm的靶向DMPK CUG的EEV-PMO 197-777处理患者来源的DM1成肌细胞和肌管后，MBL1(外显子5，图12A)、SOS1(外显子25，图12B)、INSR(外显子11，图12C)、DMD(外显子78，图12D)、BIN1(外显子11，图12E)和LDB3(外显子11，图12F)的选择性RNA剪接事件(例如，外显子包含或排除)的RT-PCR分析。健康患者细胞和DM1细胞用作对照。所有数据都是从三项单独的实验收集的(n＝3)。对经过处理与未处理的DM1肌管进行t检验；*p<0.05；**p<0.01；***p<0.001。

图13A-图13B显示了用各种浓度的PMO-EEV 221-1120处理HSA-LR小鼠后mRNA的相对水平。图13A显示了腓肠肌、三头肌、胫骨前肌和膈肌的相对mRNA水平。图13B显示了膈肌中的相对mRNA水平。

图14A-图14C显示了用各种浓度的PMO-EEV 221-1120处理HSA-LR小鼠后，四头肌(图14A)、腓肠肌(图14B)、三头肌(图14C)和胫骨前肌(图14D)组织中mRNA的相对水平。

图15A-图15D显示了用各种浓度的PMO-EEV 221-1120处理HSA-LR小鼠后，四头肌(图15A)、腓肠肌(图15B)、三头肌(图15C)和胫骨前肌(图15D)组织中各种基因的小鼠DM1剪接指数(mDSI)。

图16A-图16C显示了在HSA-LR小鼠未经处理或用EEV-PMO 221-1120(EEV-PMO-DM1-3；DM1-3)处理之后，胫骨前肌中RNA灶的流行率。图16A-图16B显示了针对RNA CUG灶(红色)和细胞核(蓝色)染色的胫骨前肌组织的图像。图16C是根据与图16A-图16B中的图像相关的数据量化具有CUG灶的细胞核的百分比的图。

图17A-图17F是显示用各种浓度的EEV-PMO-DM1-3处理HSA-LR小鼠后，在四头肌(图17A)、三头肌(图17B)、心脏(图17C)、腓肠肌(图17D)、胫骨前肌(图17E)、膈肌(图17F)、脑(图17H)、肝(图17I)和肾(图17J)组织中，针对药物水平的剂量依赖性反应的图。图17K显示了在60mpk剂量水平下各种组织的药物暴露。

图18显示了在用15、30、60和90mpk的EEV-PMO-DM1-3处理7天后，HSA-LR小鼠中的剂量依赖性肌强直减轻。

图19A-图19D是显示了比较用PMO-EEV 221-1120处理的未患病小鼠(WT)、DM1小鼠(HSA-LR)和HSA-LR小鼠中基因表达的主成分分析结果的图。图19A和图19C是显示三个主成分的图，而图19B和图19D是显示两个主成分的图。

图20A-图20B显示了用60mpk PMO-EEV 221-1120处理的未患病小鼠(WT)、DM1小鼠(HSA-LR)和HSA-LR小鼠之间差异性表达的基因的热图。图20A是显示513个差异性表达基因的聚类热图。图20B是显示已知具有CTG CUG重复序列的40个基因的聚类热图。

图21是显示未处理的HSA-LR小鼠和用PMO-EEV 221-1120处理的小鼠的整体转录变化的火山图。

图22A-图22E是显示来自未患病小鼠、HSA-LR小鼠和用PMO-EEV 221-1120处理的HSA-LR小鼠的Scube2(图22A)、Greb1(图22B)、Ttc7(图22C)、Txlnb(CUG)9(图22D)和Ndrg3(图22E)基因的主成分分析结果的图。

图23A-图23D显示了对于未患病小鼠(WT-盐水)、HSA-LR小鼠(HSA-LR盐水)和用PMO-EEV 221-1120处理的HSA-LR小鼠，Atp2a1(图23A；外显子22加方框)、Clcn1(图23B；外显子7a加方框)、Nfix(图23C；外显子7加方框)和Mbn1(图23D；外显子5加方框)的RNA测序(RNAseq)数据。每个处理组显示两个读段。

图24显示了未患病小鼠(WT-盐水)、HSA-LR小鼠(HSA-LR盐水)和用PMO-EEV 221-1120处理的HSA-LR小鼠的各种目标基因的单个外显子的百分比剪接指数(PSI)。

图25A-图25D显示了用80mpk(60mpk寡聚物、80mpk全药)EEV-PMO-DM1-3处理的HSA-LR小鼠在1周到4周后在胫骨前肌(图25A)、腓肠肌(图25B)、三头肌(图25C)和四头肌(图25D)组织中的药物水平。

图26A-图26D显示了用单次80mpk剂量的EEV-PMO-DM1-3处理HSA-LR小鼠后小鼠中的药物水平。图26A-图26B显示了处理后1周至12周肝脏中的药物水平。图26C-图26D显示了处理后1周至12周肾脏中的药物水平。

图27A-图27C是显示在用30μM EEV-PMO-DM1-3处理DM1患者来源的肌细胞后，MBNL1(外显子5；图26A)、SOS1(外显子25；图26B)和NFIX(外显子7；26C)的外显子包含水平的图。

图28A-图28C显示EEV-PMO-DM1-3减少DM1患者来源的肌细胞的细胞核(蓝色)中的CUG核灶(绿色)。图28A-图28B是未经处理的或用EEV-PMO-DM1-3处理的或未经处理的DM1患者来源的肌细胞的图像。图28C是对于与图28A中的图像相关的数据，每个细胞核的CUG灶的数量的定量。

图29A-图29B显示了CELLTITER-GLO发光活力测定的原始数据(图29A)和归一化数据(图29B)，其中用各种浓度的PMO-DM1或EEV-PMO-DM1-3处理RPTEC细胞。蜂毒肽用作阳性对照。

图30A-图30C显示了描绘DM1患者来源的细胞(图30A)和用EEV-PMO 221-1113处理的DM1患者来源的细胞(图30B)中的RNA CUG重复序列灶的图像。对细胞的细胞核(蓝色；Hoechst)和RNA CUG灶(绿色)进行染色。图30C是对于与图30A-图30B的图像相关的数据，每细胞核面积的CUG RNA灶的图。

图31A-图31B显示了在HeLa、未处理的HeLa480细胞和用EEV-PMO 221-1113处理的HeLa480细胞中RNA CUG7灶的流行率。图31A显示了对RNA CUG7灶(绿色)和细胞核(蓝色)染色的细胞的图像。图31B是对于与图31A中的图像相关的数据，量化每细胞核面积的CUG7灶的的图。

图32A-图32C是显示用30μM的EEV-PMO 221-1113处理DM1患者来源的细胞后，MBNL1中的外显子5(图32A)、SOS1中的外显子25(图32B)和NFIX中的外显子7(图32C)的百分比包含的图。

图33A-图33E显示了用各种浓度的PMO-EEV 221-1113处理DM1患者来源的肌细胞后，MBNL1(外显子5；图33A)、SOS1(外显子25；图33B)、CLASP1(外显子19，图33C)、NFIX(外显子7，图33D)和INSR(外显子11，图33E)的选择性RNA剪接事件(例如，外显子包含)的RT-PCR分析。使用t检验确定显著性；*p<0.05；**p<0.01；***p<0.001。

图34A-图34D显示在用各种浓度的PMO 221或EEV-PMO 221-1106处理的小鼠的腓肠肌组织中的Atp2a1(外显子22，图34A)、Nfix(外显子7，图34B)、Clcn1(外显子7a，图34C)和Mbnl1(外显子5，图34D)的选择性RNA剪接事件(例如，外显子包含)的RT-PCR分析。

图35A-图35C显示在用PMO-EEV 0221-1121(21-mer)或PMO-EEV 0325-1121(24-mer)处理的HSA-LR小鼠的胫骨前肌组织中Mbnl1(外显子5，图35A)、Nfix(外显子7，图35B)和Atp2a1(外显子22，图35C)的选择性RNA剪接事件(例如，外显子包含或排除)的RT-PCR分析。

图36A-图36C显示在用PMO-EEV 0221-1121(21-mer)或PMO-EEV 0325-1121(24-mer)处理的HSA-LR小鼠的腓肠肌组织中的Mbnl1(外显子5，图36A)、Nfix(外显子7，图36B)和Atp2a1(外显子22，图36C)的选择性RNA剪接事件(例如，外显子包含)的RT-PCR分析。

图37显示PMO-0221a，在体内检测到的PMO-EEV 220-1120的主要代谢物。

图38A-图38B显示了在用各种浓度的EEV-PMO 221-1120处理Hela480细胞后，MBNL1(外显子5)在胫骨前肌(图38A)和腓肠肌(图38B)中的百分比外显子包含。

图39A-图39B显示了在用各种浓度的EEV-PMO 221-1120处理Hela480细胞后，NFIX(外显子7)在胫骨前肌(图39A)和腓肠肌(图39B)中的百分比外显子包含。

图40A-图40B显示了在用各种浓度的EEV-PMO 221-1120处理Hela480细胞后，Atp2a1(外显子22)在胫骨前肌(图40A)和腓肠肌(图40B)中的百分比外显子包含。

图41显示了描绘用各种浓度的EEV-PMO 221-1120处理后Hela480细胞中的RNACUG重复序列灶的图像(图41A)。图41B是对于与图41A的图像相关的数据，每细胞核面积的RNA灶的图。

图42A-图42D显示了在用各种浓度的EEV-PMO 221-1120处理后，HeLa480细胞中的相对r(CUG480)重复序列mRNA水平(图42A)、相对DMPK mRNA水平(图42B)、MBNL1的百分比外显子5包含(图42C)和SOS1中的百分比外显子25包含(图42D)。

图43是显示肌肉组织中表达的已知具有CTG CUG重复序列的基因的实例的柱状图。

图44A-图44D显示了用20mpk PMO-EEV 221-1106处理的HSA-LR小鼠模型中的表型肌强直减轻。图44A和图44C显示了松弛图。图44B显示了示例原始力迹线。图44D显示了代表性肌电图迹线。

具体实施方式

化合物

在实施方案中，提供了调节具有扩增的CUG三核苷酸重复序列的基因转录物的水平和/或活性的化合物。在实施方案中，本公开的化合物包括至少一种环状细胞穿透肽(cCPP)和治疗部分(TM)。cCPP促进TM进入细胞。在实施方案中，所述化合物包括包含cCPP和环外肽(EP)的内体逃逸载体(EEV)。cCPP或EEV可以容许TM进入胞质溶胶或细胞隔室以与靶转录物相互作用。

治疗部分

通常，TM是引发反应的效应部分。在实施方案中，TM通过调节靶转录物和/或靶蛋白的表达、活性和/或水平引发反应。在实施方案中，靶转录物包括扩增的CUG三核苷酸重复序列。在实施方案中，TM调节细胞内靶转录物和/或靶蛋白的水平。在实施方案中，TM降低细胞内靶转录物和/或靶蛋白的水平。

在实施方案中，TM通过降低靶转录物与一种或多种与靶转录物结合的蛋白质之间的亲和力来调节靶转录物的活性。通过降低靶转录物与所述一种或多种蛋白质之间的亲和力，TM可以有效地调节所述一种或多种蛋白质的活性，否则所述一种或多种蛋白质将与靶转录物缔合。例如，如果所述一种或多种蛋白质不与靶转录物结合，它们可以在其他分子上实现其功能。例如，如果所述一种或多种蛋白质参与前体mRNA加工，降低所述一种或多种蛋白质对包含扩增的CUG重复序列的转录物的亲和力可以允许所述一种或多种蛋白质加工不包含扩增的CUG重复序列的前体mRNA转录物。因此，TM可以调节下游基因(不含扩增的CTG重复序列的基因)的活性、表达和/或水平，所述下游基因由所述一种或多种蛋白质调控，所述一种或多种蛋白质与靶转录物的相互作用被TM破坏。

在实施方案中，TM包括寡核苷酸、肽、抗体和/或小分子。TM的类别和特性取决于用于调节靶转录物的水平和/或活性的机制，所述靶转录物包括扩增的CUG三核苷酸重复序列。

反义化合物

在各种实施方案中，本文公开的化合物包含与反义化合物(AC)缀合的细胞穿透肽(CPP)。

术语“反义化合物”是指与靶核苷酸序列互补或至少部分互补的寡核苷酸序列。AC是包括天然DNA碱基、经修饰的DNA碱基、天然RNA碱基、经修饰的RNA碱基、天然RNA糖、经修饰的RNA糖、天然DNA糖、经修饰的DNA糖、天然核苷间连键、经修饰的核苷间连键或它们的任意组合的寡核苷酸。AC包括但不限于反义寡核苷酸RNAi、微RNA、antagomir、适体、核酶、免疫刺激性寡核苷酸、诱饵寡核苷酸、supermir、miRNA模拟物、miRNA抑制剂、U1衔接子及它们的组合。

在实施方案中，AC包括与具有扩增的CUG三核苷酸重复序列的靶转录物至少部分互补的核苷酸序列。在实施方案中，AC包括与靶mRNA序列中扩增的CUG三核苷酸重复序列至少部分互补的核苷酸序列。几种疾病与扩增的CUG三核苷酸重复序列相关，例如，1型强直性肌营养不良(DM1)、富克斯角膜内皮营养不良(FECD)、脊髓小脑性共济失调-8(SCA8)和类亨廷顿舞蹈病(HDL2)。表1提供了核苷酸重复序列病症的实例，以及具有与此类病症相关的扩增的核苷酸重复序列的基因的特征。以下文件描述了用于治疗串联重复序列疾病的示例性寡核苷酸并且通过引用整体并入本文：Zain等人Neurotherapeutics.2019；16(2):248-262；Zarouchlioti等人Am J Hum Genet.2018；102(4):528-539；Fautsch等人Prog RetinEye Res.2021；81:100883。

表1：与扩增的CUG三核苷酸重复序列相关的疾病

在实施方案中，AC包括与包括扩增的CTG·CUG三核苷酸重复序列的靶mRNA转录物内的核苷酸序列至少部分互补的核苷酸序列。在实施方案中，AC包括与靶mRNA转录物中扩增的CTG·CUG三核苷酸重复序列至少部分互补的核苷酸序列。

在实施方案中，AC包括与包括扩增的CTG·CUG三核苷酸重复序列的DMPK1靶转录物内的核苷酸序列至少部分互补的核苷酸序列。在实施方案中，AC包括与包括扩增的CTG·CUG三核苷酸重复序列的TCF4靶转录物内的核苷酸序列至少部分互补的核苷酸序列。在实施方案中，AC包括与包括扩增的CTG·CUG三核苷酸重复序列的ATXN8OS/ATXN8靶转录物内的核苷酸序列至少部分互补的核苷酸序列。在实施方案中，AC包括与包括扩增的CTG·CUG三核苷酸重复序列的JPH3靶转录物内的核苷酸序列至少部分互补的核苷酸序列。

在实施方案中，AC包括与靶mRNA转录物的3’UTR中的三核苷酸重复序列至少部分互补的核苷酸序列。在实施方案中，AC包括与DMPK1靶转录物的3’UTR中扩增的CTG·CUG三核苷酸重复序列至少部分互补的核苷酸序列。在实施方案中，AC包括与ATXN8OS/ATXN8靶转录物的3’UTR中的扩增的CTG·CUG三核苷酸重复序列至少部分互补的核苷酸序列。在实施方案中，AC包括与JPH3靶转录物的3’UTR中扩增的CTG·CUG三核苷酸重复序列至少部分互补的核苷酸序列。

在实施方案中，AC包括与三核苷酸重复序列，诸如CTG·CUG重复序列至少部分互补的核苷酸序列。在实施方案中，靶核苷酸序列包含至少一个扩增的三核苷酸重复序列(例如，CTG·CUG重复序列)。在实施方案中，靶核苷酸序列包含至少40个、至少45个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少150个、至少200个、至少300个、至少400个、至少500个、至少600个、至少700个、至少800个、至少900个、至少1000个或至少2000个CTG·CUG三核苷酸重复序列。在实施方案中，扩增的三核苷酸重复序列处于靶核苷酸序列的3’UTR中。

在实施方案中，AC包括与靶转录物中存在的连续扩增的三核苷酸重复序列的至少一部分至少部分互补并可与之杂交的核苷酸序列。在实施方案中，AC包括与靶转录物中的至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少17个、至少18个、至少19个、至少20个且最多50个、最多100个、最多150个、最多200个、最多300个、最多400个、最多500个、最多600个、最多700个、最多800个、最多900个、最多1000个或最多2000个三核苷酸重复序列至少部分互补并可与之杂交的核苷酸序列。在实施方案中，AC包括与靶转录物中的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个三核苷酸重复序列至少部分互补并可与之杂交的核苷酸序列。在实施方案中，AC包括与靶转录物中的5至10个三核苷酸重复序列至少部分互补并可与之杂交的核苷酸序列。在实施方案中，AC包括与靶转录物中的5至9个三核苷酸重复序列至少部分互补并可与之杂交的核苷酸序列。在实施方案中，AC包括与靶转录物中的5至8个三核苷酸重复序列至少部分互补并可与之杂交的核苷酸序列。在实施方案中，AC包括与靶转录物中的5至7个三核苷酸重复序列至少部分互补并可与之杂交的核苷酸序列。在实施方案中，AC包括与靶转录物中的5至6个三核苷酸重复序列至少部分互补并可与之杂交的核苷酸序列。在实施方案中，AC包括与靶转录物中的5个三核苷酸重复序列至少部分互补并可与之杂交的核苷酸序列。在实施方案中，AC包括与靶转录物中的6个三核苷酸重复序列至少部分互补并可与之杂交的核苷酸序列。在实施方案中，AC包括与靶转录物中的7个三核苷酸重复序列至少部分互补并可与之杂交的核苷酸序列。在实施方案中，AC包括与靶转录物中的8个三核苷酸重复序列至少部分互补并可与之杂交的核苷酸序列。在实施方案中，AC包括与靶转录物中的9个三核苷酸重复序列至少部分互补并可与之杂交的核苷酸序列。在实施方案中，AC包括核苷酸序列

在实施方案中，AC可包括与靶转录物中任何位置存在的连续扩增的三核苷酸重复序列的至少一部分至少部分互补并可与之杂交的核苷酸序列。在实施方案中，AC包括与靶转录物的3’UTR中存在的连续扩增的三核苷酸重复序列的至少一部分至少部分互补并可与之杂交的核苷酸序列。在实施方案中，AC包括与DMPK1、SCA8和/或HDL2靶转录物的3’UTR中存在的连续扩增的三核苷酸重复序列的至少一部分至少部分互补并可与之杂交的核苷酸序列。在实施方案中，AC包括与靶转录物的内含子中存在的连续扩增的三核苷酸重复序列的至少一部分至少部分互补并可与之杂交的核苷酸序列。在实施方案中，AC包括与TCF4靶转录物的内含子3中存在的连续扩增的三核苷酸重复序列的至少一部分至少部分互补并可与之杂交的核苷酸序列。在实施方案中，AC包括与TCF4转录物的CTG18.1基因座中存在的连续扩增的三核苷酸重复序列的至少一部分至少部分互补并可与之杂交的核苷酸序列。在实施方案中，AC包括与靶转录物的外显子中存在的连续扩增的三核苷酸重复序列的至少一部分至少部分互补并可与之杂交的核苷酸序列。

在实施方案中，AC的长度为5个或更多、10个或更多、15个或更多、20个或更多、25个或更多、30个或更多、35个或更多、40个或更多、或45个或更多的核酸。在实施方案中，AC的长度为50个或更少、45个或更少、40个或更少、35个或更少、30个或更少、25个或更少、20个或更少、15个或更少、或10个或更少的核酸。在实施方案中，AC的长度为5至50、5至45、5至40、5至35、5至30、5至25、5至20、5至15或5至10个核酸。在实施方案中，AC的长度为10至50、10至45、10至40、10至35、10至30、10至25、10至20或10至15个核酸。在实施方案中，AC的长度为15至50、15至45、15至40、15至35、15至30、15至25或15至20个核酸。在实施方案中，AC的长度为20至50、20至45、20至40、20至35、20至30或20至25个核酸。在实施方案中，AC的长度为25至50、25至45、25至40、25至35或25至30个核酸。在实施方案中，AC的长度为30至50、30至45、30至40或30至35个核酸。在实施方案中，AC的长度为35至50、35至45或35至40个核酸。在实施方案中，AC的长度为40至50或40至45个核酸。在实施方案中，AC的长度为45至50个核酸。在实施方案中，AC的长度为5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核酸。

在实施方案中，AC与靶核苷酸序列具有100％的互补性。在实施方案中，AC与靶核苷酸序列没有100％的互补性。如本文所用，术语“百分比互补性”是指AC中与寡聚化合物或核酸(例如，靶核苷酸序列)的相应核碱基具有核碱基互补性的核碱基(例如，天然核碱基或经修饰的核碱基)的数量除以AC的总长度(核碱基的数量)。本领域技术人员认识到，在不消除反义化合物活性的情况下，包含错配是可能的。

在实施方案中，AC包括与靶核苷酸序列的20％或更少、15％或更少、10％或更少、5％或更少或零错配。在一些实施方案中，AC包括5％或更多、10％或更多、或15％或更多的错配。在实施方案中，AC包括与靶核苷酸序列的零至5％、零至10％、零至15％或零至20％的错配。在实施方案中，AC包括与靶核苷酸序列的5％至10％、5％至15％或5％至20％的错配。在实施方案中，AC包括与靶核苷酸序列的10％至15％或10％至20％的错配。在实施方案中，AC包括与靶核苷酸序列的10％至20％的错配。

在实施方案中，AC与靶核苷酸序列具有80％或更高、85％或更高、90％或更高、95％或更高、96％或更高、97％或更高、98％或更高、或99％或更高的互补性。在实施方案中，AC与靶核苷酸序列具有100％或更低、99％或更低、98％或更低、97％或更低、96％或更低、95％或更低、90％或更低、85％或更低的互补性。在实施方案中，AC与靶核苷酸序列具有80％至100％、80％至99％、80％至98％、80％至97％、80％至96％、80％至95％、80％至90％或80％至85％的互补性。在实施方案中，AC与靶核苷酸序列具有85％至100％、85％至99％、85％至98％、85％至97％、85％至96％、85％至95％或85％至90％的互补性。在实施方案中，AC与靶核苷酸序列具有90％至100％、90％至99％、90％至98％、90％至97％、90％至96％或90％至95％的互补性。在实施方案中，AC与靶核苷酸序列具有95％至100％、95％至99％、95％至98％、95％至97％或95％至96％的互补性。在实施方案中，AC与靶核苷酸序列具有96％至100％、96％至99％、96％至98％或96％至97％的互补性。在实施方案中，AC与靶核苷酸序列具有97％至100％、97％至99％或97％至98％的互补性。在实施方案中，AC与靶核苷酸序列具有98％至100％或98％至99％的互补性。在实施方案中，AC与靶核苷酸序列具有99％至100％的互补性。

在实施方案中，与未修饰的化合物相比，核苷酸亲和力修饰的掺入允许更多数量的错配。类似地，某些寡核苷酸序列可能比其他寡核苷酸序列更耐受错配。本领域普通技术人员能够确定AC和靶核苷酸序列之间错配的适当数量，诸如通过确定热解链温度(Tm)。Tm或ΔTm可以通过本领域普通技术人员熟悉的技术来计算。例如，Freier等人描述的技术(Nucleic Acids Research,1997,25,22:4429-4443)允许本领域普通技术人员评价核苷酸修饰提高RNA:DNA双链体解链温度的能力。

在实施方案中，AC包括本身是三核苷酸重复序列的核苷酸序列，即CAG三核苷酸重复序列。5’-CAG-3’的反向互补序列具有100％的互补性，并且可以与5’-CUG-3’三核苷酸重复序列杂交。在实施方案中，AC包括1至50个CAG重复序列。在实施方案中，CAG重复序列是连续的。在实施方案中，CAG重复序列不是连续的。在实施方案中，AC包括在5’端或3’端包含不完全CAG重复序列的核苷酸序列。例如，在实施方案中，AC包括序列如AG(CAG)_n、G(CAG)_n、(CAG)_nAG或(CAG)_nA，其中n是1至50的整数。在实施方案中，AC包括包含一个或多个、2个或更多个、3个或更多个、4个或更多个、5个或更多个、6个或更多个、7个或更多个、8个或更多个、9个或更多个、10个或更多个、20个或更多个、30个或更多个或50个或更多个CAG重复序列的核苷酸序列。在实施方案中，AC包括包含50个或更少、40个或更少、30个或更少、20个或更少、10个或更少、9个或更少、8个或更少、7个或更少、6个或更少、5个或更少、4个或更少、3个或更少或2个或更少CAG重复序列的核苷酸序列。在实施方案中，AC包括包含2至50、2至20、2至10、4至10、5至10、6至10、6至9、6至8或6至7个CAG重复序列的核苷酸序列。在实施方案中，AC包括表2中的任一核苷酸序列(SEQ ID NO:151-291)。

表2：CAG重复序列AC核苷酸序列

在实施方案中，具有包含CAG重复序列的核苷酸的AC可以在CAG重复序列的5’端、3’端或两端上包含附加核苷酸序列。在实施方案中，附加核苷酸序列可以与它们所杂交的靶转录物的部分具有80％至100％或95％至100％的互补性。可以将附加核苷酸序列添加到CAG重复核苷酸序列中，以增加AC与特定靶转录物杂交的选择性。

在实施方案中，AC包括包含1至50个CAG重复序列且是gapmer的核苷酸序列。gapmer是作为DNA/RNA杂交体并且诱导RNA酶衰减机制的寡核苷酸。例如，gapmer可以具有中央DNA或DNA模拟区段，在该DNA或DNA模拟的5’端和3’端两侧是RNA或RNA模拟区段。在实施方案中，AC包括gapmer，该gapmer包括与靶转录物的靶核酸序列杂交的核苷酸序列，该靶核酸序列与靶转录物的扩增的CUG重复序列分开。

在实施方案中，本公开的AC是美国专利号9,550,988中公开的gapmer寡核苷酸，该专利的公开内容通过引用并入本文。

在实施方案中，本公开的AC包含美国专利公开号2017/0260524中公开的靶向DMPK的AC中任一个的序列和/或结构，该专利公开的公开内容通过引用并入本文。

在实施方案中，本公开的AC包含美国专利公开US20030235845A1、US20060099616A1、US 2013/0072671 A1、US 2014/0275212 A1、US 2009/0312532 A1、US20100125099A1、US 2010/0125099 A1、US 2009/0269755 A1、US 2011/0294753 A1、US2012/0022134 A1、US 2011/0263682 A1、US 2014/0128592 A1、US 2015/0073037 A1和US20120059042A1中公开的任一AC或寡核苷酸的序列和/或结构，这些专利公开中的每一个的内容整体并入本文用于所有目的。

当使用AC靶向扩增的CTG CUG重复序列和/或与之杂交时，必须小心避免脱靶效应，其中AC无意中与包括CTG CUG重复序列的脱靶转录物(例如，包括CTG CUG重复序列但不是扩增的CTG CUG重复序列的转录物)结合。对人类基因组的计算机模拟(in-silico)分析揭示，总共63个人类基因具有CTG·CUG重复序列(Uhlen等人，Science 2015 347(6220):1260419))。这63个基因可以通过mRNA的表达加上总肌肉(心肌、骨骼肌和平滑肌)中表达的蛋白质的量来评级。可以使用RPM(每百万个的读段)来定量表达水平。mRNA表达是FPKM(每百万个作图片段的转录物的每千个碱基的片段)并且蛋白质表达是pTPM(每百万个蛋白质编码基因的转录物)，使用大于10RPM作为非不显著表达的截止值。图43显示了此类计算机模拟分析的结果。三十六个基因显示表达水平>10RPM。在36个基因中，只有三个基因(除了DMPK)具有>10个CTG·CUG重复序列。具有≤10CTG CUG重复序列的基因代表脱靶结合和毒性的最低风险。尽管如此，这3个基因(TCF4、CASK、MAP3k4)中CTG·CUG重复序列的数量(11-24)显著低于在经典型和先天性DM1患者中所见的数量。例如，晚发型DM1患者在DMPK上具有100-600个CTG·CUG重复序列，经典型DM1患者在DMPK上具有250-750个CTG·CUG重复序列，并且先天性DM1患者在DMPK上具有750-1,400个CTG·CUG重复序列。可以对肝脏和肾脏进行相同的计算机模拟分析。CASK是肾脏中唯一具有>10个CTG·CUG重复序列的重要基因。在肝脏中，具有>10个CTG·CUG重复序列的基因不明显。

本文所述的AC可以含有一个或多个不对称中心，因此产生对映异构体、非对映异构体和其他立体异构构型，这些构型可以根据绝对立体化学定义为(R)或(S)；α或β；或(D)或(L)。本文提供的反义化合物包括所有此类可能的异构体，以及它们的外消旋形式和光学纯形式。

AC的功效可以通过评价施用它们所引起的反义活性来评估。如本文所用，术语“反义活性”是指可归因于反义化合物与其靶核苷酸序列杂交的任何可检测的和/或可测量的活性。此类检测和/或测量可以是直接的或间接的。在实施方案中，通过检测和/或测量从目标转录物表达的蛋白质的量来评估反义活性。在实施方案中，通过检测和/或测量目标转录物的量来评估反义活性。在实施方案中，通过检测和/或测量选择性剪接的RNA的量和/或从靶转录物翻译的蛋白质同种型的量来评估反义活性。

AC调节机制/

在实施方案中，AC可以调节细胞内靶转录物的活性和/或水平。图1显示AC可以如何调节靶转录物的水平和/或活性的示例性机制。

在实施方案中，AC可以调节细胞内靶转录物的水平。例如，在AC是gamper的实施方案中，AC与靶转录物的结合经由RNA酶H途径诱导靶转录物的降解(图1，箭头A和箭头B)。在实施方案中，gapmer与靶转录物中不同于扩增的CUG三核苷酸重复序列的部分杂交，从而经由RNA酶H途径诱导靶转录物的降解(图1，箭头A)。在实施方案中，gapmer与靶转录物内扩增的CUG重复序列的至少一部分杂交，从而经由RNA酶H途径诱导靶转录物的降解(图1，箭头B)。

在实施方案中，AC可以调节靶转录物的活性。活性的调节可以包括增加或减少靶转录物与结合配偶体结合的能力。在实施方案中，AC可以通过降低靶转录物与一种或多种可能与转录物缔合的蛋白质，特别是与靶转录物的扩增的CUG重复序列的至少一部分缔合的蛋白质结合的能力来调节靶转录物的活性(图1，箭头C)。在实施方案中，降低靶转录物与一种或多种蛋白质结合的能力包括降低靶转录物对该一种或多种蛋白质的亲和力。在实施方案中，降低靶转录物与一种或多种蛋白质结合的能力包括部分或完全空间阻断靶转录物结合该一种或多种蛋白质。例如，AC可以占据结合位点的至少一部分，如果没有空间阻断，该结合位点可以被该一种或多种蛋白质占据。在实施方案中，该一种或多种蛋白质与靶转录物的结合位点包括靶转录物的扩增的三核苷酸重复序列的至少一部分。因此，在实施方案中，AC可以占据扩增的三核苷酸重复序列(例如，扩增的CUG重复序列)的至少一部分，如果没有空间阻断，该部分可以被该一种或多种蛋白质占据。靶转录物的部分空间阻断可导致靶转录物和该一种或多种蛋白质之间的亲和力降低。例如，在实施方案中，AC与靶转录物的扩增的CUG重复序列的至少一部分结合，从而在空间上阻断和/或降低靶转录物对可能与扩增的CUG重复序列结合的蛋白质的亲和力(图1，箭头C)。下面的综述文章描述了空间阻断反义寡核苷酸的其他应用并且通过引用整体并入本文：Roberts等人Nature Reviews DrugDiscovery(2020)19:673-694。

扩增的CUG重复序列的CUG重复序列可以形成双链发夹结构。在疾病状态下，蛋白质与双链发夹结构结合，并被隔绝且不能执行其他功能。在实施方案中，AC与双链发夹结构的至少一部分结合，从而在空间上阻断和/或降低双链发夹结构对蛋白质结合配偶体的亲和力。在实施方案中，AC与单链扩增CUG重复序列的至少一部分结合，从而抑制双链发夹结构的形成，并因此抑制一种或多种蛋白质与双链发夹结构结合。在实施方案中，AC与双发夹结构的杂交在空间上阻断和/或降低了一种或多种蛋白质与双发夹结构结合的亲和力。在实施方案中，AC与扩增的三核苷酸重复序列的单链区域的至少一部分的杂交抑制双链发夹结构的形成。

降低靶转录物与该一种或多种蛋白质结合的能力，可以使该一种或多种蛋白质执行其他功能，例如，调控下游转录物(不含扩增的CUG重复序列的转录物)的剪接。因此，在实施方案中，降低靶转录物与该一种或多种蛋白质结合的能力，可以增加细胞内可用于提供其他功能或对其他转录物起作用的该一种或多种蛋白质的水平。在实施方案中，降低靶转录物与该一种或多种蛋白质结合的能力，可以增加细胞内可用于提供其他功能或对其他转录物起作用的该一种或多种蛋白质的胞质水平。因此，在实施方案中，AC与靶转录物的结合可引起对与靶转录物相互作用的该一种或多种蛋白质的水平和/或活性的调节。

在实施方案中，AC与扩增的CUG重复序列的至少一部分杂交降低亲和力和/或在空间上阻断MNBL1与靶转录物的结合。MNBL1是调控下游基因转录物的剪接的剪接因子。在DM1疾病表型中，MNBL1与靶转录物的扩增的CUG重复序列结合。当与靶转录物结合时，MNBL1被隔绝在细胞核中，并且不能调控下游基因转录物(不含扩增的CUG重复序列的转录物)的剪接。在实施方案中，AC与靶转录物中扩增的CUG重复序列的至少一部分杂交，在空间上阻断和/或降低MNBL1对靶转录物的亲和力，从而允许其调控下游基因转录物的剪接。在实施方案中，AC与靶转录物中扩增的CUG重复序列的至少一部分杂交，在空间上阻断和/或降低MNBL1对靶转录物的亲和力，从而增加了游离(例如，不与具有CUG重复序列的转录物结合的)MNBL1的量。在实施方案中，AC与靶转录物中扩增的CUG重复序列的至少一部分杂交，在空间上阻断和/或降低MNBL1对靶转录物的亲和力，从而降低与靶转录物结合并被靶转录物隔绝的MBNL1的量。

在靶转录物是DMPK的实施方案中，AC与扩增的CUG重复序列的至少一部分杂交降低亲和力和/或在空间上阻断MNBL1与靶转录物的结合。MNBL1是调控下游基因转录物的剪接的剪接因子。在DM1疾病表型中，MNBL1与DMPK1的扩增的CUG重复序列结合。当与DMPK1结合时，MNBL1被隔绝在细胞核中，并且不能调控下游基因转录物(不含扩增的CUG重复序列的转录物)的剪接。在实施方案中，AC与DMPK中扩增的CUG重复序列的至少一部分杂交，在空间上阻断和/或降低MNBL1对DMPK转录物的亲和力，从而允许其调控下游基因转录物的剪接。在实施方案中，AC与DMPK中扩增的CUG重复序列的至少一部分杂交，在空间上阻断和/或降低MNBL1对DMPK转录物的亲和力，从而增加了游离(例如，不与具有CUG重复序列的转录物结合的)MNBL1的量。在实施方案中，AC与DMPK中扩增的CUG重复序列的至少一部分杂交，在空间上阻断和/或降低MNBL1对DMPK转录物的亲和力，从而降低与DMPK1转录物结合并被DMPK1转录物隔绝的MBNL1的量。

在靶转录物是DMPK的实施方案中，AC与扩增的CUG重复序列的至少一部分杂交引起CUGBP1水平的降低。在DM1疾病状态下，游离MBNL1(能够发挥功能)的水平降低，而游离(能够发挥功能)的CUGBP1水平增加。CUGBP1水平的增加与疾病状态相关。因此，在实施方案中，AC与扩增的CUG重复序列的至少一部分杂交引起游离(能够发挥功能)的MBNL1水平的增加和/或游离(能够发挥功能)的CUGBP1水平的降低。

降低靶转录物与该一种或多种蛋白质结合的能力可以减少或抑制CUG重复序列灶的形成。包括扩增的核苷酸重复序列(例如，扩增的CUG重复序列)的转录物可以转录，然后被隔绝在细胞核中。在细胞核内，隔绝的转录物可以形成聚集体。然后，与转录物结合的蛋白质可以在隔绝的转录物和/或隔绝的转录物聚集体上成核，从而形成扩增的核苷酸重复序列(例如，CUG重复序列)灶。使用显微镜可以看到CUG重复序列灶。在实施方案中，降低靶转录物与该一种或多种蛋白质结合的能力可以减少或抑制包含靶转录物的聚集体的形成。在实施方案中，降低靶转录物与该一种或多种蛋白质结合的能力可以减少或抑制该一种或多种蛋白质在靶转录物上、转录物的双链发夹区域上或靶转录物的聚集体上的成核。在靶转录物是DMPK的实施方案中，降低DMPK1靶转录物与MNBL1结合的能力可以减少或抑制MNBL1在DMPK1靶转录物或DMPK1靶转录物聚集体上的成核。在实施方案中，AC与靶转录物的杂交可引起CUG重复序列核灶形成的抑制或减少。在实施方案中，AC与靶转录物的杂交可引起由DMPK、TCF4、JPH3和/或ATXN8OS/ATXN8靶转录物形成的CUG重复序列核灶的形成的抑制或减少。

在实施方案中，AC与靶转录物的杂交可引起一个或多个下游基因的水平、表达和/或活性的调节。例如，AC与靶转录物的杂交可用于诱导靶转录物降解或在空间上阻断或降低靶转录物对一种或多种蛋白质的亲和力，从而允许被靶转录物隔绝的该一种或多种蛋白质调控下游基因的表达、水平和/或活性。例如，在实施方案中，该一种或多种蛋白质可以包括参与调控一种或多种下游转录物(不含扩增的CUG重复序列的转录物)的剪接的蛋白质。在实施方案中，当参与剪接的蛋白质结合并隔绝在靶转录物上时，改变了下游转录物的剪接。例如，剪接的改变可以包括在转录物中排除一个或多个外显子或包含一个或多个内含子，从而导致各种蛋白质同种型的表达。在实施方案中，剪接的改变可导致包含含有提前终止密码子的外显子和/或内含子，从而产生可能没有活性或具有有害活性的截短的同种型。下游基因转录物剪接的改变可导致可能与疾病表型相关的下游基因产物水平、折叠和/或活性的变化。当不与包含扩增的CUG重复序列的靶转录物结合时，参与剪接的蛋白质自由调控剪接，这可导致下游基因转录物剪接的校正(或挽救)，从而至少部分恢复与健康表型相关的下游基因产物的蛋白质水平、折叠和/或活性。

在实施方案中，AC与靶转录物的杂交可引起对下游基因转录物剪接的调节，所述下游基因转录物由在与扩增的核苷酸重复序列(例如，扩增的三核苷酸重复序列)相关的疾病状态下被靶转录物隔绝的蛋白质调控。在与扩增的三核苷酸重复序列相关的疾病中，下游基因转录物经常被错误加工，例如错误剪接。下游基因转录物的错误剪接可产生在翻译前被破坏或被翻译成具有异常结构和/或功能的蛋白质的基因产物。例如，隔绝调控下游基因转录物的加工的蛋白质可导致包含具有提前终止密码子的外显子和/或内含子、包含内含子、排除外显子和/或包含选择性外显子，这些可产生在翻译前被破坏或被翻译成具有异常功能的基因产物的转录物和/或基因产物。下游基因转录物和/或基因产物的水平变化和/或下游基因产物的异常结构和/或功能与扩增的三核苷酸疾病表型相关。在实施方案中，AC与靶转录物的杂交可引起对下游转录物中外显子包含、外显子排除、内含子包含和/或内含子排除的调节，所述下游转录物的剪接由在疾病状态期间隔绝至靶转录物的蛋白质调控。因此，AC与靶转录物的杂交可引起与健康表型相关的下游蛋白质异构体和/或转录物的上调。类似地，AC与靶转录物的杂交可引起与疾病表型相关的下游转录物和/或蛋白质异构体的下调(例如，阻抑)。

在靶转录物是DMPK的实施方案中，AC与靶转录物的杂交可引起对下游基因转录物剪接的调节，所述下游基因转录物由在疾病状态期间被DMPK靶转录物隔绝的蛋白质调控。在DM1中，几种下游基因转录物是错误剪接产生的。错误剪接的基因与疾病表型相关。因此，基因剪接的调节可以包括校正(例如挽救)基因的剪接，以产生与健康表型相关的下游基因的基因产物。在靶转录物是DMPK的实施方案中，AC与靶转录物的杂交可引起对下游基因转录物剪接的调节，所述下游基因转录物由在疾病状态期间被DMPK靶转录物隔绝的剪接调控因子MNBL1调控。在靶转录物是DMPK的实施方案中，AC与靶转录物的杂交可引起对下游基因转录物剪接的调节，所述下游基因转录物由活性受扩增的CUG重复序列影响的蛋白质CUGBP1调控。在靶转录物是DMPK的实施方案中，AC与靶转录物的杂交可引起受MNBL1和/或CUGBP1调控的下游基因的正确加工(例如，剪接)。在靶转录物是DMPK的实施方案中，与靶转录物的AC杂交可以导致下游基因剪接的调节，所述下游基因包括但不限于4833439L19Rik、Abcc9、Atp2a1、Arhgef10、Arhgap28、Armcx6、Angel1、Best3、Bin1、Brd2、Cacna1s、Cacna2d1、Cpd、Cpeb3、Ccpg1、Clasp1、ClC-1、Clcn1、Clk4、Cpeb2、Camk2g、Capzb、Copz2、Coch、cTNT、Ctu2、Cyp2s1、Dctn4、Dnm1l、Eya4、Efna3、Efna2、Fbxo31、Fbxo21、Frem2、Fgd4、Fuca1、Fn1、Gogla4、Gpr37l1、Greb1、Heg1、Insr、Impdh2、IR、Itgav、Jag2、Klc1、Kcan6、Kif13a、Ldb3、Lrrfip2、Mapt、Macf1、Map3k4、Mapkap1、Mbnl1、Mllt3、Mbnl2、Mef2c、Mpdz、Mrpl1、Mxra7、Mybpc1、Myo9a、Ncapd3、Ngfr、Ndrg3、Ndufv3、Neb、Nfix、Numa1、Opa1、Pacsin2、Pcolce、Pdlim3、Pla2g15、Phactr4、Phka1、Phtf2、Ppp1r12b、Ppp3cc、Ppp1cc、Ramp2、Rapgef1、Rur1、Ryr1、Sorcs2、Spsb4、Scube2、Sema6c、Sfc8a3、Slain2、Sorbs1、Spag9、Tmem28、Tacc1、Tacc2、Ttc7、Tnik、Tnfrsf22、Tnfrsf25、Trappc9、Trim55、Ttn、Txnl4a、Txlnb、Ube2d3、Vsp39，或它们的任何组合。

许多上述下游基因转录物的错误剪接产生特定的DM1疾病表型。例如，MNBL1是一种剪接因子，在DM1中由于包含外显子5而丧失功能。MNBL1通过DMPK CUG扩增隔绝并形成RNA核灶。另外，SOS1促进Ras激活以正向调控RAS/MAPK信号传导途径。在DM1中，SOS1的外显子25被排除，导致肌肉肥大途径的抑制。在DM1中，IR/INSR具有外显子11排除，这导致DM1中低信号传导性非肌肉同种型的水平更高和对胰岛素的代谢反应降低(胰岛素抗性)。类似地，在DM中观察到DMD的外显子78排除。外显子78排除产生C-末端结构域的框外转录物。这种突变蛋白质在DM1患者中表达，并与患者中造成肌肉消耗的机制相关。BIN1是正常肌肉T-小管形成(EC偶联)所需的。外显子11排除产生无活性的同种型，并且发现于DM1患者。LDB3与横纹肌Z-盘处的α-肌动蛋白相互作用，并维持肌肉结构。在DM1中检测到LDB3的外显子11包含导致对蛋白激酶C(PKC)的亲和力降低。因此，PKC在DM1变得异常活跃。在实施方案中，一个或多个下游基因的调节引起对与健康表型相关的转录物剪接的校正或挽救。因此，在实施方案中，AC与DMPK靶转录物的杂交引起对下游基因/转录物的错误剪接的挽救，从而降低与疾病表型相关的下游基因/转录物的水平。因此，在实施方案中，AC与DMPK靶转录物的杂交引起对下游基因/转录物的错误剪接的挽救，从而增加与健康表型相关的下游基因/转录物的水平。

在实施方案中，AC抑制靶转录物的表达。在实施方案中，AC通过阻断前体mRNA加工机械和/或翻译机械进入和/或完成翻译和/或前体mRNA加工来抑制靶转录物的表达。在实施方案中，AC通过诱导靶转录物的降解，例如通过RNA酶H途径，抑制靶转录物的表达。

AC结构

AC包括寡核苷酸和/或寡核苷。寡核苷酸和/或寡核苷酸是通过核苷间连键连接的核苷酸或核苷。核苷包括戊糖(例如核糖或脱氧核糖)和与糖共价附接的含氮碱基。在DNA和/或RNA中发现的天然存在的碱基(或传统碱基)是腺嘌呤(A)、鸟嘌呤(G)、胸腺嘧啶(T)、胞嘧啶(C)和尿嘧啶(U)。在DNA和/或RNA中发现的天然存在的糖(或传统糖)是脱氧核糖(DNA)和核糖(RNA)。天然存在的核苷连键(或传统的核苷间连键)是磷酸二酯键。在实施方案中，本公开的AC可以具有所有天然糖、碱基和核苷间连键。

经化学修饰的核苷惯常用于掺入反义化合物中，以增强一种或多种特性，诸如核酸酶抗性、药代动力学或对靶RNA的亲和力。在实施方案中，本公开的AC可以具有一个或多个经修饰的核苷。在实施方案中，本公开的AC可以具有一个或多个经修饰的糖。在实施方案中，本公开的AC可以具有一个或多个经修饰的碱基。在实施方案中，本公开的AC可以具有一个或多个经修饰的核苷间连键。

一般来说，核碱基是含有一个或多个能够氢键键合到另一个核酸的碱基上的原子或原子团的任何基团。除了“未修饰的”或“天然的”核碱基(A、G、T、C和U)之外，许多经修饰的核碱基或核碱基模拟物是本领域技术人员已知的，并且可以受本文所述的化合物影响。通常，经修饰的核碱基是指在结构上与母体核碱基非常相似的核碱基，例如7-脱氮嘌呤、5-甲基胞嘧啶、2-硫代-dT(图2)或G-钳。通常，核碱基模拟物是包括比经修饰的核酸碱基更复杂的结构的核酸碱基，例如三环吩噁嗪核酸碱基模拟物。制备上述经修饰的核碱基的方法是本领域技术人员熟知的。

在实施方案中，AC可以包括一个或多个具有经修饰的糖部分的核苷。在实施方案中，天然核苷的呋喃糖基糖可以具有2’修饰、形成限制性核苷的修饰等(参见图2)。例如，在实施方案中，天然核苷的呋喃糖基糖环可以以多种方式进行修饰，包括但不限于添加取代基、桥接两个非偕环原子以形成双环核酸(BNA)或锁核酸；用C或N交换呋喃糖基环的氧；和/或取代原子或基团(参见图2)。经修饰的糖是熟知的，可用于增加或降低AC对其靶核苷酸序列的亲和力。经修饰的糖也可以用于增加AC对核酸酶的抗性。糖也可以用糖模拟基团等置换。在实施方案中，AC的核苷的一个或多个糖被亚甲基吗啉环置换，如图2中的19所示。

在实施方案中，AC包括一个或多个核苷，所述核苷包括双环修饰糖(BNA；有时称为桥接核酸)。BNA的实例包括但不限于LNA(4'-(CH₂)-O-2'桥)、2'-硫代-LNA(4'-(CH₂)-S-2'桥)、2'-氨基-LNA(4'-(CH₂)-NR-2'桥)、ENA(4'-(CH₂)₂-O-2'桥)、4'-(CH₂)₃-2'桥接BNA、4'-(CH₂CH(CH₃))-2'桥接BNA"cEt(4'-(CH(CH₃)-O-2'桥)和cMOE BNA(4'-(CH(CH₂OCH₃)-O-2'桥)。BNA已经制备并且在专利文献以及科技文献中公开(Srivastava等人，J.Am.Chem.Soc.(2007),ACS新进在线出版，10.1021/ja071106y；Albaek等人，J.Org.Chem.(2006),71,7731-7740；Fluiter等人，Chembiochem(2005),6,1104-1109；Singh等人，Chem.Commun.(1998),4,455-456；Koshkin等人，Tetrahedron(1998),54,3607-3630；Wahlestedt等人，Proc.Natl.Acad.Sci.U.S.A.(2000),97,5633-5638；Kumar等人，Bioorg.Med.Chem.Lett.(1998),8,2219-2222；WO 94/14226；WO 2005/021570；Singh等人，J.Org.Chem.(1998),63,10035-10039,WO 2007/090071；美国专利号7,053,207、6,268,490、6,770,748、6,794,499、7,034,133和6,525,191；及美国授予前公开号2004-0171570、2004-0219565、2004-0014959、2003-0207841、2004-0143114和20030082807)。

在实施方案中，AC包括一个或多个核苷，所述核苷包括锁核酸(LNA)。在LNA中，核糖基糖环的2’-羟基连接到糖环的4’碳原子上，从而形成2'-C,4'-C-氧亚甲基连键，以形成双环糖部分(综述于Elayadi等人，Curr.Opinion Invens.Drugs(2001),2,558-561；Braasch等人，Chem.Biol.(2001),8 1-7；及Orum等人，Curr.Opinion Mol.Ther.(2001),3,239-243；；还参见美国专利6,268,490和6,670,461)。该连键可以是桥接2’氧原子和4’碳原子的亚甲基(-CH₂-)基团，对其而言术语LNA用于双环部分；在该位置上的亚乙基基团的情况下，使用术语ENA^TM(Singh等人，Chem.Commun.(1998),4,455-456；ENA^TM；Morita等人，Bioorganic Medicinal Chemistry(2003),11,2211-2226)。LNA和其他双环糖类似物显示出与互补DNA和RNA非常高的双链体热稳定性(Tm＝+3至+10℃)，对3’-外切核酸降解的稳定性和良好的溶解性。已经描述了含有LNA的有效且无毒的反义寡核苷酸(Wahlestedt等人，Proc.Natl.Acad.Sci.U.S.A.(2000),97,5633-5638)。

也已经研究的LNA的异构体是α-L-LNA，已经证实其对3’-核酸外切酶具有优良的稳定性。将α-L-LNA掺入显示出有效的反义活性的反义gapmer和嵌合体中(Frieden等人，Nucleic Acids Research(2003),21,6365-6372)。

已经描述了LNA单体腺嘌呤、胞嘧啶、鸟嘌呤、5-甲基胞嘧啶、胸腺嘧啶和尿嘧啶的合成和制备，以及它们的寡聚化和核酸识别特性(Koshkin等人，Tetrahedron,1998,54,3607-3630)。在WO 98/39352和WO 99/14226中也描述了LNA及其制备。

还已制备了LNA的类似物、硫代磷酸酯-LNA和2’-硫代-LNA(Kumar等人，Bioorg.Med.Chem.Lett.,1998,8,2219-2222)。含有寡脱氧核糖核苷酸双链体作为核酸聚合酶底物的LNA类似物的制备也已有描述(Wengel等人，WO 99/14226)。此外，2’-氨基-LNA(一种构象受限的高亲和力寡核苷酸类似物)的合成已有描述(Singh等人，J.Org.Chem.(1998),63,10035-10039)。另外，已经制备了2’-氨基-和2’-甲氨基-LNA，并且先前已经报告了它们的具有互补RNA和DNA链的双链体的热稳定性。

制备经修饰的糖的方法是本领域技术人员熟知的。教导制备此类经修饰的糖的一些代表性专利和出版物包括但不限于美国专利：4,981,957；5,118,800；5,319,080；5,359,044；5,393,878；5,446,137；5,466,786；5,514,785；5,519,134；5,567,811；5,576,427；5,591,722；5,597,909；5,610,300；5,627,053；5,639,873；5,646,265；5,658,873；5,670,633；5,792,747；5,700,920；和6,600,032；及WO 2005/121371。

核苷间连键

本文描述了核苷间连接基团，其将核苷或其他经修饰的核苷单体单元连接在一起，从而形成寡核苷酸和/或含有寡核苷酸的AC。AC可以包括天然存在的核苷间连键、非天然核苷间连键或两者。

在天然存在的DNA和RNA中，核苷间连接基团是将相邻的核苷彼此共价连接以形成线性聚合化合物的磷酸二酯。在天然存在的DNA和RNA中，磷酸二酯与糖的2'、3'或5'羟基部分连接。在寡核苷酸内，磷酸基团通常称为形成寡核苷酸的核苷间骨架。在天然存在的DNA和RNA中，RNA和DNA的连键或骨架是3’至5’磷酸二酯连键。在实施方案中，AC的核苷间连接基团是磷酸二酯。在实施方案中，AC的核苷间连接基团是3’至5’磷酸二酯连键。

非天然核苷间连接基团的两个主要类别由磷原子的存在与否来定义。代表性的含磷核苷间连键包括但不限于磷酸三酯、甲基膦酸酯、氨基磷酸酯和硫代磷酸酯。代表性的不含磷的核苷间连接基团包括但不限于亚甲基甲基亚氨基(-CH₂-N(CH₃)-O-CH₂-)、硫代二酯(-O-C(O)-S-)、硫代氨基甲酸酯(-O-C(O)(NH)-S-)；硅氧烷(-O-Si(H₂-O-)；和N,N'-二甲基肼(-CH₂-N(CH₃)-N(CH₃)-)。具有磷核苷间连接基团的AC被称为寡核苷酸。具有非磷核苷间连接基团的反义化合物被称为寡核苷。与天然磷酸二酯连键相比，经修饰的核苷间连键可用于改变(通常增加)反义化合物的核酸酶抗性。具有手性原子的核苷间连键可以制备为外消旋的、手性的或混合物。代表性的手性核苷间连键包括但不限于烷基膦酸酯和硫代磷酸酯。含磷和不含磷的连键的制备方法是本领域技术人员熟知的。

在实施方案中，具有经修饰的糖和/或经修饰的核碱基的两个或更多个核苷可以使用氨基磷酸酯连接。在实施方案中，具有亚甲基吗啉环的两个或更多个核苷可以通过氨基磷酸酯核苷间连键连接。

包括通过氨基磷酸酯核苷间连键连接的具有亚甲基吗啉环的核碱基的反义化合物可被称为氨基磷酸酯吗啉寡聚物(PMO)。

缀合基团

在实施方案中，通过共价附接一个或多个缀合基团来修饰AC。通常，缀合基团修饰所附接的AC的一种或多种特性，包括但不限于药效学、药代动力学、结合、吸收、细胞分布、细胞摄取、电荷和清除。缀合基团惯常地用于化学领域，直接或经由任选的连接部分或连接基团连接至母体化合物诸如AC。缀合基团包括但不限于嵌入剂、报告分子、聚胺、聚酰胺、聚乙二醇、硫醚、聚醚、胆固醇、硫代胆固醇、胆酸部分、叶酸、脂类、磷脂、生物素、吩嗪、菲啶、蒽醌、金刚烷、吖啶、荧光素、罗丹明、香豆素和染料。在实施方案中，缀合基团是聚乙二醇(PEG)，并且PEG与AC或CPP(本文别处讨论的CPP)缀合。

在实施方案中，缀合基团包括脂质部分，诸如胆固醇部分(Letsinger等人，Proc.Natl.Acad.Sci.USA(1989),86,6553)；胆酸(Manoharan等人，Bioorg.Med.Chem.Lett.(1994),4,1053)；硫醚，例如己基-S-三苯甲基硫醇(Manoharan等人，Ann.N.Y.Acad.Sci.(1992),660,306；Manoharan等人，Bioorg.Med.Chem.Let.(1993),3,2765)；硫代胆固醇(Oberhauser等人，Nucl.Acids Res.(1992),20,533)；脂族链，例如十二烷二醇或十一烷基残基(Saison-Behmoaras等人，EMBO J.(1991),10,111；Kabanov等人，FEBS Lett.(1990),259,327；Svinarchuk等人，Biochimie(1993),75,49)；磷脂，例如二-十六烷基-外消旋-甘油或三乙基铵-1,2-二-O-十六烷基-外消旋-甘油-3-H-膦酸酯(Manoharan等人，Tetrahedron Lett.(1995),36,3651；Shea等人，Nucl.Acids Res.(1990),18,3777)；聚胺或聚乙二醇链(Manoharan等人，Nucleosides&Nucleotides(1995),14,969)；金刚烷乙酸(Manoharan等人，Tetrahedron Lett.(1995),36,3651)；棕榈基部分(Mishra等人，Biochim.Biophys.Acta.(1995),1264,229)；或十八烷基胺或己胺基-羰基-氧胆固醇部分(Crooke等人，J.Pharmacol.Exp.Ther.(1996),277,923)。

反义化合物的类型

可以使用各种类型的AC，例如，包括反义寡核苷酸、siRNA、微RNA、antagomir、适体、核酶、supermir、miRNA模拟物、miRNA抑制剂或它们的组合。

反义寡核苷酸

在各种实施方案中，反义化合物(AC)是与靶核苷酸序列互补的反义寡核苷酸(ASO)。术语“反义寡核苷酸(ASO)”或简称“反义物”意在包括与靶核苷酸序列互补的寡核苷酸。该术语还涵盖可能与期望的靶核苷酸序列不完全互补的ASO。ASO包括与选定的靶核苷酸序列或靶基因互补的DNA和/或RNA单链。ASO可以包括一个或多个经修饰的DNA和/或RNA碱基、经修饰的糖和/或非天然的核苷间连键。在实施方案中，ASO可以包括一个或多个氨基磷酸酯核苷间连键。在实施方案中，ASO是氨基磷酸酯吗啉代寡聚物(PMO)。ASO可以具有任何特征，可以是任何长度，可以与任何靶核苷酸序列和/或序列元件结合，并且可以实现所描述的与AC相关的任何机制。

已经证明反义寡核苷酸作为蛋白质合成的靶向抑制剂是有效的，因此，可以用于特异性抑制所靶向的基因的蛋白质合成。ASO抑制蛋白质合成的功效已充分确立。迄今为止，这些化合物已经在几种体外和体内模型中显示出前景，这些模型包括炎症疾病、癌症和HIV的模型(Agrawal,Trends in Biotech.(1996),14:376-387)。反义物也可以通过与染色体DNA特异性杂交来影响细胞活性。

产生反义寡核苷酸的方法是本领域已知的，并且可以容易地适用于产生靶向任何多核苷酸序列的反义寡核苷酸。对给定靶序列具有特异性的反义寡核苷酸序列的选择是基于对选定靶序列的分析和对二级结构、Tm、结合能和相对稳定性的确定。反义寡核苷酸可以基于它们相对不能形成二聚体、发夹或其他二级结构来选择，所述二聚体、发夹或其他二级结构会减少或阻止与宿主细胞中靶mRNA的特异性结合。mRNA的靶区包括AUG翻译起始密码子处或附近的那些区域以及与mRNA的5’区域基本上互补的那些序列。这些二级结构分析和靶位点选择考虑可以例如使用OLIGO引物分析软件的v.4(Molecular Biology Insights)和/或BLASTN 2.0.5算法软件(Altschul等人，Nucleic Acids Res.1997,25(17):3389-402)来进行。

RNA干扰

在实施方案中，AC包括介导RNA干扰(RNAi)的分子。如本文所用，短语“介导RNAi”是指以序列特异性方式使靶转录物沉默的能力。虽然不希望受理论所束缚，但据信沉默使用RNAi机械或过程和指导RNA，例如约21至约23个核苷酸的siRNA化合物。在实施方案中，AC靶向靶转录物进行降解。因此，在实施方案中，RNAi分子可用于破坏目标基因或多核苷酸的表达。在实施方案中，RNAi分子用于诱导靶转录物，例如前体mRNA或成熟mRNA的降解。

在实施方案中，AC包括引发RNAi反应的小干扰RNA(siRNA)。

小干扰RNA(siRNA)是通常约16至约30个核苷酸长的核酸双链体，可与称为RNAi诱导的沉默复合物(RISC)的细胞质多蛋白复合物缔合。负载有siRNA的RISC介导同源转录物的降解，因此siRNA可以被设计成以高特异性敲低蛋白质表达。与其他反义技术不同，siRNA通过天然机制发挥功能，该机制进化为通过非编码RNA来控制基因表达。多种RNAi试剂，包括靶向临床相关靶标的siRNA，目前正处于药物开发中，例如Fougerolles,A.等人，NatureReviews(2007)6:443-453中所述。

虽然首先描述的RNAi分子是包括RNA有义链和RNA反义链的RNA:RNA杂交体，但是现在已经证明DNA有义:RNA反义杂交体、RNA有义:DNA反义杂交体和DNA:DNA杂交体能够介导RNAi(Lamberton,J.S.和Christian,A.T.,Molecular Biotechnology(2003),24:111-119)。在实施方案中，使用的RNAi分子包括这些不同类型的双链分子中的任何类型。另外，应当理解，RNAi分子可以以多种形式使用和引入细胞。因此，如本文所用，RNAi分子涵盖能够在细胞中介导RNAi的任何和所有分子，包括但不限于：包括两条独立的链，即有义链和反义链的双链寡核苷酸，例如小干扰RNA(siRNA)；包括通过非核苷酸接头连接在一起的两条独立的链的双链寡核苷酸；包括形成双链区的互补序列的发夹环的寡核苷酸，例如shRNAi分子，以及表达一种或多种多核苷酸的表达载体，所述多核苷酸能够单独或与另一种多核苷酸组合形成双链多核苷酸。

如本文所用的“单链siRNA化合物”是由单个分子组成的siRNA化合物。它可以包括通过链内配对形成的双链区，例如，它可以是或包括发夹或盘-柄结构。单链siRNA化合物可以与靶分子反义。

单链siRNA化合物可以足够长，以致于它可以进入RISC并参与RISC介导的靶mRNA的裂解。单链siRNA化合物的长度为至少约14、至少约15、至少约20、至少约25、至少约30、至少约35、至少约40或至多约50个核苷酸。在某些实施方案中，单链siRNA的长度小于约200、约100或约60个核苷酸。

发夹siRNA化合物可以具有等于或至少约17、约18、约19、约20、约21、约22、约23、约24或约25个核苷酸对的双链体区。双链体区长度可以等于或小于约200、约100或约50个核苷酸对。在某些实施方案中，双链体区的长度范围为约15至约30、约17至约23、约19至约23以及约19至约21个核苷酸对。发夹可以具有单链突出端或末端未配对区域。在某些实施方案中，突出端的长度为约2至约3个核苷酸。在实施方案中，突出端在发夹的同一侧，并且在实施方案中在发夹的反义侧。

如本文所用的“双链siRNA化合物”是包括一条以上的链，并且在一些情况下包括两条链的siRNA化合物，其中链间杂交可以形成双链结构的区域。

双链siRNA化合物的反义链长度可以等于或至少约14、约15、约16、约17、约18、约19、约20、约25、约30、约40或约60个核苷酸。它的长度可以等于或小于约200、约100或约50个核苷酸。长度范围可以是约17至约25、约19至约23以及约19至约21个核苷酸。如本文所用，术语“反义链”意指与靶分子，例如靶转录物的靶核苷酸序列充分互补的siRNA化合物链。

双链siRNA化合物的有义链长度可以等于或至少约14、约15、约16、约17、约18、约19、约20、约25、约30、约40或约60个核苷酸。它的长度可以等于或小于约200、约100或约50个核苷酸。长度范围可以是约17至约25、约19至约23以及约19至约21个核苷酸。

双链siRNA化合物的双链部分的长度可以等于或至少约14、约15、约16、约17、约18、约19、约20、约21、约22、约23、约24、约25、约30、约40或约60个核苷酸对。它的长度可以等于或小于约200、约100或约50个核苷酸对。长度范围可以是约15至约30、约17至约23、约19至约23以及约19至约21个核苷酸对。

在实施方案中，siRNA化合物足够大，以致于它可以被内源分子，例如Dicer裂解，以产生较小的siRNA化合物，例如siRNA试剂。

可以选择有义链和反义链，使得双链siRNA化合物在分子的一端或两端包含单链或非配对区域。因此，双链siRNA化合物可以含有有义链和反义链，配对成含有突出端，例如一个或两个5’或3’突出端，或1-3个核苷酸的3’突出端。突出端可能是一条链比另一条链长的结果，或者是两条相同长度的链交错的结果。一些实施方案将具有至少一个3’突出端。在实施方案中，siRNA分子的两端都将具有3’突出端。在实施方案中，突出端是2个核苷酸。

在实施方案中，双链体区的长度为约15至约30、或约18、约19、约20、约21、约22、或约23个核苷酸，例如在以上讨论的ssiRNA(具有粘性突出端的siRNA)化合物范围内。ssiRNA化合物可以在长度和结构方面类似于来自长dsiRNA的天然Dicer加工产物。还包括其中ssiRNA化合物的两条链连接，例如共价连接的实施方案。在实施方案中，包括提供双链区和3’突出端的发夹或其他单链结构。

本文所述的siRNA化合物，包括双链siRNA化合物和单链siRNA化合物，可以介导靶RNA，例如mRNA，例如编码蛋白质的基因的转录物的沉默。为方便起见，此类mRNA在本文中也称为待沉默的mRNA。此类基因也被称为靶基因。一般来说，待沉默的RNA是内源基因。

在实施方案中，siRNA化合物与靶转录物“充分互补”，使得siRNA化合物使靶mRNA编码的蛋白质的产生沉默。在实施方案中，siRNA化合物与靶转录物的至少一部分“充分互补”，使得siRNA化合物使靶转录物编码的基因产物的产生沉默。在另一个实施方案中，siRNA化合物与靶核苷酸序列(例如，靶转录物的一部分)“精确互补”，使得靶核苷酸序列和siRNA化合物退火，例如在精确互补的区域形成仅由沃森-克里克碱基对组成的杂交体。与靶核苷酸序列“充分互补”可以包括与靶核苷酸序列精确互补的内部区域(例如，至少约10个核苷酸)。而且，在某些实施方案中，siRNA化合物特异性区分单核苷酸差异。在这种情况下，如果在单核苷酸差异的区域(例如，7个核苷酸内)发现精确互补，则siRNA化合物仅介导RNAi。

RNAi的治疗应用极为广泛，因为siRNA和miRNA构建体可以用针对靶蛋白的任何核苷酸序列合成。迄今为止，siRNA构建体已经显示出在体外和体内模型以及在临床研究中特异性下调靶蛋白的能力

微RNA

在实施方案中，AC包括微RNA分子。微RNA(miRNA)是一类高度保守的小RNA分子，其从植物和动物基因组中的DNA转录但不会翻译成蛋白质。所加工的miRNA是17-25个核苷酸的单链RNA分子，它们掺入到RNA诱导的沉默复合物(RISC)中并且已经被鉴定为发育、细胞增殖、凋亡和分化的关键调控因子。据信它们通过与特定mRNA的3’-非翻译区结合在基因表达调控中发挥作用。RISC通过翻译抑制、转录裂解或两者介导基因表达的下调。RISC还涉及多种真核生物细胞核中的转录沉默。

antagomir

在实施方案中，AC是antagomir。antagomir是带有针对RNA酶保护和药理学特性(诸如增强组织和细胞摄取)的各种修饰的RNA样寡核苷酸。它们与正常RNA的不同之处在于，例如糖的完全2’-0-甲基化、硫代磷酸酯骨架，以及例如3’-端的胆固醇部分。antagomir可用于通过形成包含antagomir和内源性miRNA的双链体使内源性miRNA有效沉默，从而防止miRNA诱导的基因沉默。antagomir介导的miRNA沉默的实例是miR-122的沉默，描述于Krutzfeldt等人，Nature(2005),438:685-689，其明确地通过引用整体并入本文。antagomir RNA可以使用标准固相寡核苷酸合成方案合成(美国专利申请序列号11/502,158和11/657,341；每个专利公开内容通过引用并入本文)。

antagomir可以包括配体缀合的单体亚基和用于寡核苷酸合成的单体。单体在美国申请号10/916,185中有描述。antagomir可以具有ZXY结构，如PCT申请号PCT/US2004/07070中所述。antagomir可以与两亲性部分复合。PCT申请号PCT/US2004/07070中描述了与寡核苷酸试剂一起使用的两亲性部分。

适体

在实施方案中，AC包括适体。适体是以高亲和力和特异性与特定目标分子结合的核酸或肽分子(Tuerk和Gold,Science 249:505(1990)；Ellington and Szostak,Nature346:818(1990))。已经成功产生了DNA或RNA适体，其结合从大蛋白质到小有机分子的许多不同实体(Eaton,Curr.Opin.Chem.Biol.(1997),1:10-16；Famulok,Curr.Opin.Struct.Biol.(1999),9:324-9；以及Hermann和Patel,Science(2000),287:820-5)。适体可以是基于RNA或DNA的，并且可以包括核糖开关。核糖开关是mRNA分子的一部分，可以直接结合小的靶分子，其与靶标的结合会影响基因的活性。因此，根据靶分子的存在与否，含有核糖开关的mRNA直接参与调控其自身的活性。一般来说，适体通过多轮重复的体外选择或等效地SELEX(通过指数富集的配体系统进化)进行工程改造，以结合各种分子靶标，诸如小分子、蛋白质、核酸，甚至细胞、组织和生物体。适体可以通过任何已知的方法制备，包括合成、重组和纯化方法，并且可以单独使用或与对相同靶标具有特异性的其他适体组合使用。此外，术语“适体”还包括“二级适体”，其含有通过将两种或更多种已知适体与给定靶标进行比较而得到的共有序列。在实施方案中，适体是“细胞内适体”，或“intramer”，其特异性识别细胞内靶标(Famulok等人，Chem Biol.(2001),8(10):931-939；Yoon和Rossi,Adv.Drug Deliv.Rev.(2018),134:22-35；各自通过引用并入本文)。

核酶

在实施方案中，AC是核酶。核酶是具有特定催化结构域的具有核酸内切酶活性的RNA分子复合物(Kim和Cech,Proc.Natl.Acad.Sci.USA(1987),84(24):8788-92；Forster和Symons,Cell(1987)24,49(2):211-20)。例如，大量的核酶以高度的特异性加速磷酸酯转移反应，通常仅裂解寡核苷酸底物中几种磷酸酯中的一种(Cech等人，Cell(1981),27(3Pt2):487-96；Michel和Westhof,J.Mol.Biol.(1990),5,216(3):585-610；Reinhold-Hurek和Shub,Nature(1992),14,357(6374):173-6)。已经将这种特异性归因于在化学反应之前，需要底物经由特定的碱基配对相互作用与核酶的内部指导序列(IGS)结合。

目前已知至少六种天然存在的酶促RNA的基本变种。在生理条件下，每种核酶都可以催化RNA磷酸二酯键的反式水解(因此可以裂解其他RNA分子)，一般来说，酶促核酸通过首先与靶RNA结合来起作用。此类结合通过酶促核酸的靶结合部分发生，所述靶结合部分保持紧密靠近该分子的起到裂解靶RNA作用的酶部分。因此，酶促核酸首先识别靶RNA，然后通过互补碱基配对结合靶RNA，并且一旦结合到正确的位点，就酶促作用切割靶RNA。此类靶RNA的策略性裂解将破坏其指导所编码的蛋白质合成的能力。在酶促核酸结合并裂解其RNA靶后，它从该RNA中释放出来以寻找另一个靶标，并且可以重复地结合和裂解新的靶标。

例如，酶促核酸分子可以在锤头状、发夹状、δ型肝炎病毒、I类内含子或RNA酶PRNA(与RNA指导序列相关)或脉孢菌VS RNA基序中形成。锤头状基序的具体实例由Rossi等人Nucleic Acids Res.(1992),20(17):4559-65描述。发夹基序的实例由Hampel等人(欧洲专利申请公开号EP 0360257)、Hampel和Tritz,Biochemistry(1989),28(12):4929-33；Hampel等人，Nucleic Acids Res.(1990),18(2):299-304和美国专利5,631,359描述。肝炎病毒基序的实例由Perrotta和Been,Biochemistry(1992),31(47):11843-52描述；RNA酶P基序的实例由Guerrier-Takada等人，Cell(1983),35(3Pt 2):849-57描述；脉孢菌VS RNA核酶基序由Collins(Saville和Collins,Cell(1990),61(4):685-96；Saville andCollins,Proc.Natl.Acad.Sci.USA(1991),88(19):8826-30；Collins和Olive,Biochemistry(1993),32(l l):2795-9)描述；以及I类内含子的实例在美国专利4,987,071中有描述。在实施方案中，酶促核酸分子具有与一个或多个靶基因DNA或RNA区域互补的特异性底物结合位点，并且它们在该底物结合位点内或周围具有赋予分子RNA裂解活性的核苷酸序列。因此，核酶构建体不必限于本文提到的特定基序。

核酶可以按照国际专利申请公开号WO 93/23569和国际专利申请公开号WO 94/02595(各自明确地通过引用并入本文)中所述那样设计，并且如其中所述那样合成以进行体外和体内测试。在实施方案中，核酶被靶向至靶转录物的靶核苷酸序列。

可以通过改变核酶结合臂的长度或化学合成具有防止其被血清核糖核酸酶降解的修饰的核酶来增加核酶活性(参见，例如，国际专利申请公开号WO 92/07065；国际专利申请公开号WO 93/15187；国际专利申请公开号WO 91/03162；欧洲专利申请公开号92110298.4；美国专利5,334,711；及国际专利申请公开号WO 94/13688，这些专利描述了可以对酶促RNA分子的糖部分产生的各种化学修饰)，这些修饰增强了它们在细胞中的功效，以及去除茎Π碱基以缩短RNA合成时间并减少化学需求。

Supermir

在实施方案中，AC是supermir。supermir是指单链、双链或部分双链的RNA寡聚物或聚合物、DNA聚合物或两者，或具有与miRNA基本上相同并且相对于其靶标是反义的核苷酸序列的其修饰体，该术语包括由天然存在的核碱基、糖和共价核苷间(骨架)连键组成的寡核苷酸，并且其含有至少一个功能相似的非天然存在的部分。此类经修饰或取代的寡核苷酸具有期望的特性，例如，增强的细胞摄取、对核酸靶标增强的亲和力以及在核酸酶存在下增强的稳定性。在实施方案中，supermir不包括有义链，在另一个实施方案中，supermir不会显著程度地自我杂交。supermir可以具有二级结构，但在生理条件下基本上是单链的。基本上单链的supermir是单链的程度为少于约50％(例如，少于约40％、约30％、约20％、约10％或约5％)的supermir与其自身是双链体化。supermir可包括发夹区段，例如序列，例如，在3’端可自我杂交并形成双链体区，例如至少约1个、约2个、约3个或约4个或少于约8个、约7个、约6个或约5个核苷酸或约5个核苷酸的双链体区。双链体区可以通过接头连接，例如核苷酸接头，例如约3个、约4个、约5个或约6个dT，例如经修饰的dT。在另一个实施方案中，supermir与更短的寡聚物，例如长度为约5个、约6个、约7个、约8个、约9个或约10个核苷酸的寡聚物，例如在supermir的3’端和5’末端之一或两者处，或者在一端和非末端或中部双链体化。

miRNA模拟物

在实施方案中，AC是miRNA模拟物。miRNA模拟物代表一类可用于模仿一种或多种miRNA的基因沉默能力的分子。因此，术语“微RNA模拟物”是指能够进入RNAi途径并调控基因表达的合成的非编码RNA(即，miRNA不是通过从内源miRNA来源纯化获得的)。miRNA模拟物可以设计为成熟分子(例如单链的)或模拟前体(例如预miRNA或前体miRNA)。miRNA模拟物可包括核酸(经修饰或修饰的核酸)，包括寡核苷酸，包括但不限于RNA、经修饰的RNA、DNA、经修饰的DNA、锁核酸或2'-0,4'-C-乙烯桥核酸(ENA)，或上述的任何组合(包括DNA-RNA杂交体)。另外，miRNA模拟物可以包括能够影响递送、细胞内区室化、稳定性、特异性、功能性、链使用和/或效力的缀合物。在一个设计中，miRNA模拟物是双链分子(例如，具有长度在约16至约31个核苷酸之间的双链体区)，并且含有与给定miRNA的成熟链具有同一性的一个或多个序列。修饰可以包括在分子的一条链或两条链上的2’修饰(包括2’-0甲基修饰和2'F修饰)和增强核酸的稳定性和/或特异性的核苷间修饰(例如，硫代磷酸酯修饰)。另外，miRNA模拟物可以包括突出端。突出端可以在任一条链的3’端或5’端包含约1至约6个核苷酸，并且可以被修饰以增强稳定性或功能性。在实施方案中，miRNA模拟物包括约16至约31个核苷酸的双链体区和一种或多种下列化学修饰模式：有义链含有核苷酸1和核苷酸2(从有义寡核苷酸的5’端计数)以及所有的C和U的2’-0-甲基修饰；反义链修饰可以包括所有C和U的2'F修饰，寡核苷酸5’端的磷酸化，以及与2个核苷酸的3’突出端缔合的稳定化核苷间连键。

miRNA抑制剂

在实施方案中，AC是miRNA抑制剂。术语“antimir”、“微RNA抑制剂”、“miR抑制剂”或“miRNA抑制剂”是同义的并且是指干扰特定miRNA能力的寡核苷酸或经修饰的寡核苷酸。一般来说，抑制剂本质上是核酸或经修饰的核酸，包括寡核苷酸，其包括RNA、经修饰的RNA、DNA、经修饰的DNA、锁核酸(LNA)或上述的任何组合。

修饰包括2’修饰(包括2’-0烷基修饰和2'F修饰)和核苷间修饰(例如，硫代磷酸酯修饰)，这些修饰可以影响递送、稳定性、特异性、细胞内区室化或效力。另外，miRNA抑制剂可以包括能够影响递送、细胞内区室化、稳定性和/或效力的缀合物。抑制剂可以采用多种构型，包括单链、双链(RNA/RNA或RNA/DNA双链体)和发夹设计，一般而言，微RNA抑制剂包含与待靶向的miRNA的一条(或多条)成熟链互补或部分互补的一个或多个序列或序列部分。另外，miRNA抑制剂还可以包括位于是成熟miRNA反向互补序列的序列的5’和3’的附加序列。附加序列可以是与成熟miRNA所来源的预miRNA中的成熟miRNA相邻的序列的反向互补序列，或者附加序列可以是任意序列(具有A、G、C或U的混合物)。在实施方案中，一个或两个附加序列是能够形成发夹的任意序列。因此，在实施方案中，作为miRNA反向互补序列的序列在5’侧和3’侧的侧翼为发夹结构。当为双链时，微RNA抑制剂可包括相对链上核苷酸之间的错配。此外，微RNA抑制剂可以与缀合部分连接以便促进抑制剂摄取到细胞中。例如，微RNA抑制剂可以与胆固醇基5-(双(4-甲氧基苯基)(苯基)甲氧基)-3羟基戊基氨基甲酸酯)连接，后者允许微RNA抑制剂被动摄取到细胞中。微RNA抑制剂，包括发夹miRNA抑制剂，在Vermeulen等人RNA 13:723-730(2007)及WO2007/095387和WO 2008/036825中有详细描述，美国参考文献通过引用整体并入本文。本领域普通技术人员可以从数据库中选择期望miRNA的序列，并设计可用于本文公开的方法的抑制剂。

诸如本领域已知的那些连接基团或双官能连接部分适用于本文提供的化合物。连接基团可用于将化学官能团、缀合基团、报告基团和其他基团附接到母体化合物诸如AC中的选择性位点上。一般来说，双官能连接部分包括具有两个官能团的烃基部分。选择一个官能团与母体分子或目标化合物结合，选择另一个官能团结合基本上任何选择的基团，诸如化学官能团或缀合基团。可以使用这里描述的任何接头。在实施方案中，接头包括重复单元诸如乙二醇或氨基酸单元的链结构或寡聚物。惯常地在双官能连接部分中使用的官能团的实例包括但不限于用于与亲核基团反应的亲电子试剂和用于与亲电子基团反应的亲核试剂。在实施方案中，双官能连接部分包括氨基、羟基、羧酸、硫醇、不饱和性(例如，双键或三键)等。双官能连接部分的一些非限制性实例包括8-氨基-3,6-二氧代辛酸(ADO)、琥珀酰亚胺基4-(N-马来酰亚胺甲基)环己烷-1-羧酸酯(SMCC)和6-氨基己酸(AHEX或AHA)。其他连接基团包括但不限于经取代的C1-C10烷基、经取代或未取代的C2-C10烯基或经取代或未取代的C2-C10炔基，其中取代基的非限制性列表包括羟基、氨基、烷氧基、羧基、苄基、苯基、硝基、硫醇、硫代烷氧基、卤素、烷基、芳基、烯基和炔基。

在实施方案中，AC包括设计为不支持RNA酶H活性的核苷酸修饰。不支持RNA酶H活性的反义化合物的核苷酸修饰是已知的，包括但不限于2’-O-甲氧基乙基/硫代磷酸酯(MOE)修饰。有利的是，具有MOE修饰的AC对靶RNA的亲和力增加，并且核酸酶稳定性增加。

免疫刺激性寡核苷酸

在实施方案中，治疗部分是免疫刺激性寡核苷酸。免疫刺激性寡核苷酸(ISS，单链或双链)在施用于患者时能够诱导免疫反应，所述患者可以是哺乳动物或其他患者。ISS包括，例如，产生发夹二级结构的某些回文(参见Yamamoto S.等人(1992)J.Immunol.148:4072-4076)，或CpG基序，以及其他已知的ISS特征部(诸如多G结构域，参见WO 96/11266)。

免疫反应可以是先天性或适应性免疫反应。免疫系统分为更先天的免疫系统和脊椎动物的获得性适应性免疫系统，后者进一步分为体液细胞成分。在特定的实施方案中，免疫反应可以是粘膜的。

当不需要免疫刺激性核酸与靶多核苷酸特异性结合并降低其表达以便激发免疫反应时，认为免疫刺激性核酸是非序列特异性的。因此，某些免疫刺激性核酸可包括对应于天然存在的基因或mRNA区域的序列，但它们仍可被视为非序列特异性的免疫刺激性核酸。

在实施方案中，免疫刺激性核酸或寡核苷酸包括至少一个CpG二核苷酸。寡核苷酸或CpG二核苷酸可以是未甲基化的或甲基化的。在另一个实施方案中，免疫刺激性核酸包括至少一个具有甲基化胞嘧啶的CpG二核苷酸。在实施方案中，核酸包括单个CpG二核苷酸，其中所述CpG二核苷酸中的胞嘧啶是甲基化的。在一个具体的实施方案中，核酸包括序列5'TAACGTTGAGGG’CAT 3'(SEQ ID NO:369)。在另一个实施方案中，核酸包括至少两个CpG二核苷酸，其中CpG二核苷酸中的至少一个胞嘧啶是甲基化的。在另一个实施方案中，序列中存在的CpG二核苷酸中的每个胞嘧啶都是甲基化的。在另一个实施方案中，核酸包括多个CpG二核苷酸，其中所述CpG二核苷酸中的至少一个包括甲基化的胞嘧啶。

Raney等人，Journal of Pharmacology and Experimental Therapeutics,298:1185-1192(2001)中描述了适合在所述组合物和方法中使用的寡核苷酸(ODN)的其他特定核酸序列。在某些实施方案中，所述组合物和方法中使用的ODN具有磷酸二酯(“PO”)骨架或硫代磷酸酯(“PS”)骨架，和/或CpG基序中至少一个甲基化的胞嘧啶残基。

诱饵寡核苷酸

在实施方案中，治疗部分是诱饵寡核苷酸。因为转录因子识别它们相对短的结合序列，所以甚至在周围基因组DNA不存在的情况下，带有特定转录因子的共有结合序列的短寡核苷酸也可以用作在活细胞中操纵基因表达的工具。这种策略涉及细胞内递送此类“诱饵寡核苷酸”，然后“诱饵寡核苷酸”被靶因子识别和结合。诱饵占据转录因子的DNA结合位点致使转录因子不能随后与靶基因的启动子区结合。诱饵可以用作治疗剂，抑制由转录因子激活的基因的表达，或者上调因转录因子的结合阻抑的基因。利用诱饵寡核苷酸的实例可以在Mann等人，J.Clin.Invest,2000,106:1071-1075中找到，其明确地通过引用整体并入本文。

U1衔接子

在一些实施方案中，治疗部分是U1衔接子。U1衔接子抑制多聚A位点，并且是双功能寡核苷酸，具有与靶基因的末端外显子中的位点互补的靶结构域和与U1 snRNP的U1较小核RNA成分结合的“U1结构域”(Goraczniak等人，2008,Nature Biotechnology,27(3),257-263，其明确地通过引用整体并入本文)。U1 snRNP是一种核糖核蛋白复合物，其主要功能是通过结合至前体mRNA外显子-内含子边界来指导剪接体形成的早期步骤(Brown和Simpson,1998,Annu Rev Plant Physiol Plant Mol Biol49:77-95)。U1 snRNA碱基对5’端的核苷酸2-11与前体mRNA的5'ss结合。在一个实施方案中，寡核苷酸是U1衔接子。在一个实施方案中，Ul衔接子可以与至少一种其他iRNA试剂组合施用。

(CRISPR)基因编辑机械

在实施方案中，本文公开的化合物包括一种或多种与CRISPR基因编辑机械缀合的CPP(或cCPP)。如本文所用，“CRISPR基因编辑机械”是指可用于编辑基因组的蛋白质、核酸或它们的组合。基因编辑机械的非限制性实例包括gRNA、核酸酶、核酸酶抑制剂及它们的组合和复合物。以下专利文件描述了CRISPR基因编辑机械：美国专利号8,697,359、美国专利号8,771,945、美国专利号8,795,965、美国专利号8,865,406、美国专利号8,871,445、美国专利号8,889,356、美国专利号8,895,308、美国专利号8,906,616、美国专利号8,932,814、美国专利号8,945,839、美国专利号8,993,233、美国专利号8,999,641、美国专利申请号14/704,551和美国专利申请号13/842,859。上述专利文件中的每一个都通过引用整体并入本文。

在实施方案中，接头将cCPP缀合到CRISPR基因编辑机械上。可以利用本公开中描述的或本领域技术人员已知的任何接头。

gRNA

在实施方案中，化合物包括与gRNA缀合的CPP(或cCPP)。gRNA靶向原核细胞或真核细胞中的基因组基因座。

在实施方案中，gRNA是单分子指导RNA(sgRNA)。sgRNA包括间隔区序列和支架序列。间隔区序列是用于将核酸酶(例如，Cas9核酸酶)靶向目标特定核苷酸区域(例如，待裂解的基因组DNA序列)的短核酸序列。在实施方案中，间隔区的长度可为约17-24个碱基，诸如约20个碱基。在实施方案中，间隔区的长度可以是约15、约16、约17、约18、约19、约20、约21、约22、约23、约24、约25、约26、约27、约28、约29或约30个碱基。在实施方案中，间隔区的长度可以是至少15、至少16、至少17、至少18、至少19、至少20、至少21、至少22、至少23、至少24、至少25、至少26、至少27、至少28、至少29或至少30个碱基。在实施方案中，间隔区的长度可以是约15、约16、约17、约18、约19、约20、约21、约22、约23、约24、约25、约26、约27、约28、约29或约30个碱基。在实施方案中，间隔区序列具有约40％至约80％的GC含量。

在实施方案中，间隔区靶向紧接在5’原间隔区邻近基序(PAM)之前的位点。PAM序列可以根据期望的核酸酶进行选择。例如，PAM序列可以是下面表3中所示的任何一种PAM序列，其中N是指任何核酸，R是指A或G，Y是指C或T，W是指A或T，并且V是指A或C或G。

表3：示例性的核酸酶和PAM序列

PAM序列(5’至3’)	核酸酶	分离自
			NGG	SpCas9	酿脓链球菌(Streptococcus pyogenes)
NGRRT或NGRRN	SaCas9	金黄色葡萄球菌(Staphylococcus aureus)
			NNNNGATT	NmeCas9	脑膜炎奈瑟球菌(Neisseria meningitidis)
NNNNRYAC	CjCas9	空肠弯曲杆菌(Campylobacter jejuni)
			NNAGAAW	StCas9	嗜热链球菌(Streptococcus thermophiles)
TTTV	LbCpf1	毛螺菌科(Lachnospiraceae)细菌
			TTTV	AsCpf1	氨基酸球菌属的种(Acidaminococcus sp.)

在实施方案中，间隔区可以靶向哺乳动物基因(诸如人类基因)的序列。在实施方案中，间隔区可以靶向突变基因。在实施方案中，间隔区可以靶向编码序列。在实施方案中，间隔区可以靶向外显子序列。在实施方案中，间隔区可以靶向聚腺苷酸化位点(PS)。在实施方案中，间隔区可以靶向PS的序列元件。在实施方案中，间隔区可以靶向聚腺苷酸化信号(PAS)、插入序列(IS)、裂解位点(CS)、下游元件(DES)或它们的一部分或组合。在实施方案中，间隔区可以靶向剪接元件(SE)或顺式剪接调控元件(SRE)。

支架序列是sgRNA内负责核酸酶(例如，Cas9)结合的序列。支架序列不包括间隔区/靶向序列。在实施方案中，支架的长度可以为约1至约10、约10至约20、约20至约30、约30至约40、约40至约50、约50至约60、约60至约70、约70至约80、约80至约90、约90至约100、约100至约110、约110至约120或约120至约130个核苷酸。在实施方案中，支架的长度可以是约1、约2、约3、约4、约5、约6、约7、约8、约9、约10、约11、约12、约13、约14、约15、约16、约17、约18、约19、约20、约21、约22、约23、约24、约25、约26、约27、约28、约29、约30、约31、约32、约33、约34、约35、约36、约37、约38、约39、约40、约41、约42、约43、约44、约45、约46、约47、约48、约49、约50、约51、约52、约53、约54、约55、约56、约57、约58、约59、约60、约60、约61、约62、约63、约64、约65、约66、约67、约68、约69、约70、约71、约72、约73、约74、约75、约76、约77、约78、约79、约80、约81、约82、约83、约84、约85、约86、约87、约88、约89、约90、约91、约92、约93、约94、约95、约96、约97、约98、约99、约100、约101、约102、约103、约104、约105、约106、约107、约108、约109、约110、约111、约112、约113、约114、约115、约116、约117、约118、约119、约120、约121、约122、约123、约124或约125个核苷酸。在实施方案中，支架的长度可以是至少10、至少20、至少30、至少40、至少50、至少60、至少70、至少80、至少90、至少100、至少110、至少120或至少125个碱基。

在实施方案中，gRNA是双分子指导RNA，例如crRNA和tracrRNA。在实施方案中，gRNA还可以包括聚(A)尾。

在实施方案中，包含CPP的化合物与包含gRNA的核酸缀合。在实施方案中，核酸包括约1、约2、约3、约4、约5、约6、约7、约8、约9、约10、约11、约12、约13、约14、约15、约16、约17、约18、约19或约20个gRNA。在实施方案中，gRNA识别相同的靶标。在实施方案中，gRNA识别不同的靶标。在实施方案中，包含gRNA的核酸包含编码启动子的序列，其中启动子驱动gRNA的表达。

核酸酶

在实施方案中，所述化合物包括与核酸酶缀合的细胞穿透肽。在实施方案中，核酸酶是II型、V-A型、V-B型、VC型、V-U型、VI-B型核酸酶。在实施方案中，核酸酶是转录、激活物样效应物核酸酶(TALEN)、大范围核酸酶或锌指核酸酶。在实施方案中，核酸酶是Cas9、Cas12a(Cpf1)、Cas12b、Cas12c、Tnp-B样、Cas13a(C2c2)、Cas13b或Cas14核酸酶。例如，在一些实施方案中，核酸酶是Cas9核酸酶或Cpf1核酸酶。

在实施方案中，核酸酶是Cas9、Cas12a(Cpf1)、Cas12b、Cas12c、Tnp-B样、Cas13a(C2c2)、Cas13b或Cas14核酸酶的经修饰形式或变体。在实施方案中，核酸酶是TAL核酸酶、大范围核酸酶或锌指核酸酶的经修饰形式或变体。“经修饰的”或“变体”核酸酶是例如截短的、与另一种蛋白质(诸如另一种核酸酶)融合的、催化失活的核酸酶。在实施方案中，核酸酶可以与天然存在的Cas9、Cas12a(Cpf1)、Cas12b、Cas12c、Tnp-B样、Cas13a(C2c2)、Cas13b、Cas14核酸酶或TALEN、大范围核酸酶或锌指核酸酶具有至少约80％、至少约85％、至少约90％、至少约95％、至少约98％、至少约99％或约100％的序列同一性。在实施方案中，核酸酶是源自酿脓链球菌的Cas9核酸酶(SpCas9)。在实施方案中，核酸酶与源自酿脓链球菌的Cas9核酸酶(SpCas9)具有至少约90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％的序列同一性。在实施方案中，核酸酶是源自金黄色葡萄球菌的Cas9(SaCas9)。在实施方案中，核酸酶与源自金黄色葡萄球菌的Cas9(SaCas9)具有至少约90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％的序列同一性。在实施方案中，Cpf1是来自氨基酸球菌属(种BV3L6，UniProt登录号U2UMQ6)的Cpf1酶。在实施方案中，核酸酶与来自氨基酸球菌属(种BV3L6，UniProt登录号U2UMQ6)的Cpf1酶具有至少约90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％的序列同一性。

在实施方案中，Cpf1是来自毛螺菌科(种ND2006，UniProt登录号A0A182DWE3)的Cpf1酶。在实施方案中，核酸酶与来自毛螺菌科的Cpf1酶具有至少约90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％的序列同一性。在实施方案中，编码核酸酶的序列经密码子优化以在哺乳动物细胞中表达。在实施方案中，编码核酸酶的序列经密码子优化以在人类细胞或小鼠细胞中表达。

在实施方案中，包含CPP的化合物与核酸酶缀合。在实施方案中，核酸酶是可溶性蛋白质。

在实施方案中，包含CPP的化合物与编码核酸酶的核酸缀合。在实施方案中，编码核酸酶的核酸包括编码启动子的序列，其中启动子驱动核酸酶的表达。

gRNA和核酸酶的组合

在实施方案中，所述化合物包括一种或多种与gRNA和核酸酶缀合的CPP(或cCPP)。在实施方案中，该一种或多种CPP(或cCPP)与编码gRNA和/或核酸酶的核酸缀合。在实施方案中，编码核酸酶和gRNA的核酸包括编码启动子的序列，其中启动子驱动核酸酶和gRNA的表达。在实施方案中，编码核酸酶和gRNA的核酸包括两个启动子，其中第一启动子控制核酸酶的表达，第二启动子控制gRNA的表达。在实施方案中，编码gRNA和核酸酶的核酸编码约1至约20个gRNA，或约1、约2、约3、约4、约5、约6、约7、约8、约9、约10、约11、约12、约13、约14、约15、约16、约17、约18或约19，以及最多约20个gRNA。在实施方案中，gRNA识别不同的靶标。在实施方案中，gRNA识别相同的靶标。

在实施方案中，所述化合物包括与包括gRNA和核酸酶的核糖核蛋白(RNP)缀合的细胞穿透肽(或cCPP)。

在实施方案中，将包含(a)与gRNA缀合的CPP和(b)核酸酶的组合物递送至细胞。在实施方案中，将包含(a)与核酸酶缀合的CPP和(b)gRNA的组合物递送至细胞。

在实施方案中，将包含(a)与gRNA缀合的第一CPP和(b)与核酸酶缀合的第二CPP的组合物递送至细胞。在实施方案中，第一CPP和第二CPP是相同的。在实施方案中，第一CPP和第二CPP是不同的。

目标遗传元件

在实施方案中，本文公开的化合物包括与目标遗传元件缀合的细胞穿透肽。在实施方案中，目标遗传元件置换被核酸酶裂解的基因组DNA序列。目标遗传元件的非限制性实例包括基因、单核苷酸多态性、启动子或终止子。

核酸酶抑制剂

在实施方案中，本文公开的化合物包括与核酸酶(例如，Cas9)的抑制剂缀合的细胞穿透肽。基因编辑的一个限制是潜在的脱靶编辑。核酸酶抑制剂的递送将限制脱靶编辑。在实施方案中，核酸酶抑制因子是多肽、多核苷酸或小分子。示例性的核酸酶抑制剂描述在美国公开号2020/087354、国际公开号2018/085288、美国公开号2018/0382741、国际公开号2019/089761、国际公开号2020/068304、国际公开号2020/041384和国际公开号2019/076651中有描述，每个公开通过引用整体并入本文。

治疗性多肽

在实施方案中，治疗部分包括多肽。在实施方案中，治疗部分包括蛋白质或其片段。在实施方案中，治疗部分包括RNA结合蛋白或其RNA结合片段。在实施方案中，治疗部分包括酶。在实施方案中，治疗部分包括RNA裂解酶或其活性片段。

缀合基团

在实施方案中，通过共价附接一个或多个缀合基团来修饰AC。通常，缀合基团修饰所附接的AC的一种或多种特性，包括但不限于药效学、药代动力学、结合、吸收、细胞分布、细胞摄取、电荷和清除。缀合基团惯常地用于化学领域，直接或经由任选的连接部分或连接基团连接至母体化合物诸如AC。缀合基团包括但不限于嵌入剂、报告分子、聚胺、聚酰胺、聚乙二醇、硫醚、聚醚、胆固醇、硫代胆固醇、胆酸部分、叶酸、脂类、磷脂、生物素、吩嗪、菲啶、蒽醌、金刚烷、吖啶、荧光素、罗丹明、香豆素和染料。在实施方案中，缀合基团是聚乙二醇(PEG)，并且PEG与AC或CPP缀合。

缀合基团包括脂质部分，诸如胆固醇部分(Letsinger等人，Proc.Natl.Acad.Sci.USA 1989,86,6553)；胆酸(Manoharan等人，Bioorg.Med.Chem.Lett.,1994,4,1053)；硫醚，例如己基-S-三苯甲基硫醇(Manoharan等人，Ann.N.Y.Acad.Sci.,1992,660,306；Manoharan等人，Bioorg.Med.Chem.Let.,1993,3,2765)；硫代胆固醇(Oberhauser等人，Nucl.Acids Res.,1992,20,533)；脂族链，例如十二烷二醇或十一烷基残基(Saison-Behmoaras等人，EMBO J.,1991,10,111；Kabanov等人，FEBS Lett.,1990,259,327；Svinarchuk等人，Biochimie,1993,75,49)；磷脂，例如二-十六烷基-外消旋-甘油或三乙基铵-1,2-二-O-十六烷基-外消旋-甘油-3-H-膦酸酯(Manoharan等人，Tetrahedron Lett.,1995,36,3651；Shea等人，Nucl.Acids Res.,1990,18,3777)；聚胺或聚乙二醇链(Manoharan等人，Nucleosides&Nucleotides,1995,14,969)；金刚烷乙酸(Manoharan等人，Tetrahedron Lett.,1995,36,3651)；棕榈基部分(Mishra等人，Biochim.Biophys.Acta,1995,1264,229)；或十八烷基胺或己胺基-羰基-氧胆固醇部分(Crooke等人，J.Pharmacol.Exp.Ther.,1996,277,923)。

在实施方案中，AC可以连接到10个精氨酸-丝氨酸的二肽重复序列。与10个精氨酸-丝氨酸的二肽重复序列连接的用于人工募集剪接增强因子的AC已在体外应用，以诱导包含突变的BRCA1和SMN2外显子，否则这些外显子将被跳过。参见Cartegni和Krainer2003，通过引用并入本文。

内体逃逸载体(EEV)

内体逃逸载体(EEV)可用于运输货物穿过细胞膜，例如，将货物递送至细胞的胞质溶胶或细胞核。货物可以包括治疗部分(TM)。EEV可以包括细胞穿透肽(CPP)，例如环状细胞穿透肽(cCPP)。在实施方案中，EEV包含与环外肽(EP)缀合的cCPP。EP可以互换地称为调节肽(MP)。EP可以包括核定位信号(NLS)的序列。EP可以偶联到货物。EP可以偶联到cCPP。EP可以偶联到货物和cCPP。EP、货物、cCPP或它们的组合之间的偶联可以是非共价的或共价的。EP可以通过肽键附接到cCPP的N-末端。EP可以通过肽键附接到cCPP的C-末端。EP可以通过cCPP中氨基酸的侧链附接到cCPP上。EP可以通过赖氨酸的侧链附接到cCPP，该侧链可以与cCPP中谷氨酰胺的侧链缀合。EP可以与寡核苷酸货物的5’端或3’端缀合。EP可以偶联到接头。环外肽可以与接头的氨基缀合。EP可以通过cCPP和/或EP上的侧链经由EP和cCPP的C-末端偶联到接头上。例如，EP可以包含末端赖氨酸，然后末端赖氨酸可以通过酰胺键偶联到含有谷氨酰胺的cCPP。当EP含有末端赖氨酸，并且赖氨酸的侧链可用于附接cCPP时，C-末端或N-末端可以与货物上的接头附接。

环外肽

环外肽(EP)可包含2至10个氨基酸残基，例如2、3、4、5、6、7、8、9或10个氨基酸残基，包括其间的所有范围和值。EP可以包含6至9个氨基酸残基。EP可以包含4至8个氨基酸残基。

环外肽中的每个氨基酸可以是天然氨基酸或非天然氨基酸。术语“非天然氨基酸”是指一种有机化合物，它是天然氨基酸的同源物，因为它具有与天然氨基酸相似的结构，以致它模拟天然氨基酸的结构和反应性。非天然氨基酸可以是经修饰的氨基酸和/或氨基酸类似物，其不是20种常见的天然存在的氨基酸之一或稀有的天然氨基酸硒代半胱氨酸或吡咯赖氨酸。非天然氨基酸也可以是天然氨基酸的D-异构体。合适的氨基酸的实例包括但不限于丙氨酸、别异亮氨酸、精氨酸、瓜氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、蛋氨酸、萘基丙氨酸、苯丙氨酸、脯氨酸、焦谷氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸、缬氨酸、它们的衍生物或它们的组合。这些和其他氨基酸连同它们在本文中使用的缩写一起列在表4中。例如，氨基酸可以是A、G、P、K、R、V、F、H、Nal或瓜氨酸。

EP可包含至少一个带正电荷的氨基酸残基，例如至少一个赖氨酸残基和/或至少一个包含含有胍基或其质子化形式的侧链的氨基酸残基。EP可以包含1或2个包含含有胍基或其质子化形式的侧链的氨基酸。包含含有胍基的侧链的氨基酸残基可以是精氨酸残基。在整个公开内容中，质子化形式可以意指其盐。

EP可以包含至少两个、至少三个或至少四个或更多个赖氨酸残基。EP可以包含2、3或4个赖氨酸残基。每个赖氨酸残基侧链上的氨基可以被保护基团取代，该保护基团包括例如三氟乙酰基(-COCF₃)、烯丙氧羰基(Alloc)、1-(4,4-二甲基-2,6-二氧代亚环己基)乙基(Dde)或(4,4-二甲基-2,6-二氧代亚环-1-己基-3)-甲基丁基(ivDde)。每个赖氨酸残基侧链上的氨基可以被三氟乙酰基(-COCF₃)取代。可以包括保护基团以实现酰胺缀合。在EP与cCPP缀合后，可以去除保护基团。

EP可以包含至少2个具有疏水性侧链的氨基酸残基。具有疏水性侧链的氨基酸残基可以选自缬氨酸、脯氨酸、丙氨酸、亮氨酸、异亮氨酸和蛋氨酸。具有疏水性侧链的氨基酸残基可以是缬氨酸或脯氨酸。

EP可以包含至少一个带正电荷的氨基酸残基，例如至少一个赖氨酸残基和/或至少一个精氨酸残基。EP可以包含至少两个、至少三个或至少四个或更多个赖氨酸残基和/或精氨酸残基。

EP可以包含KK、KR、RR、HH、HK、HR、RH、KKK、KGK、KBK、KBR、KRK、KRR、RKK、RRR、KKH、KHK、HKK、HRR、HRH、HHR、HBH、HHH、HHHH(SEQ ID NO:1)、KHKK(SEQ ID NO:2)、KKHK(SEQ IDNO:3)、KKKH(SEQ ID NO:4)、KHKH(SEQ IDNO:5)、HKHK(SEQ ID NO:6)、KKKK(SEQ ID NO:7)、KKRK(SEQ ID NO:8)、KRKK(SEQ ID NO:9)、KRRK(SEQ ID NO:10)、RKKR(SEQ ID NO:11)、RRRR(SEQ ID NO:12)、KGKK(SEQ ID NO:13)、KKGK(SEQ ID NO:14)、HBHBH(SEQ ID NO:15)、HBKBH(SEQ ID NO:16)、RRRRR(SEQ ID NO:17)、KKKKK(SEQ ID NO:18)、KKKRK(SEQ ID NO:19)、RKKKK(SEQ ID NO:20)、KRKKK(SEQ ID NO:21)、KKRKK(SEQ ID NO:22)、KKKKR(SEQ IDNO:23)、KBKBK(SEQ ID NO:24)、RKKKKG(SEQ ID NO:25)、KRKKKG(SEQ ID NO:26)、KKRKKG(SEQ ID NO:27)、KKKKRG(SEQ ID NO:28)、RKKKKB(SEQ ID NO:29)、KRKKKB(SEQ ID NO:30)、KKRKKB(SEQ ID NO:31)、KKKKRB(SEQ ID NO:32)、KKKRKV(SEQ ID NO:33)、RRRRRR(SEQID NO:34)、HHHHHH(SEQ ID NO:35)、RHRHRH(SEQ ID NO:36)、HRHRHR(SEQ ID NO:37)、KRKRKR(SEQ ID NO:38)、RKRKRK(SEQ ID NO:39)、RBRBRB(SEQ ID NO:40)、KBKBKB(SEQ IDNO:41)、PKKKRKV(SEQ ID NO:42)、PGKKRKV(SEQ ID NO:43)、PKGKRKV(SEQ ID NO:44)、PKKGRKV(SEQ ID NO:45)、PKKKGKV(SEQ ID NO:46)、PKKKRGV(SEQ ID NO:47)或PKKKRKG(SEQ ID NO:48)，其中B为β-丙胺酸。EP中的氨基酸可以具有D或L立体化学。

EP可以包含KK、KR、RR、KKK、KGK、KBK、KBR、KRK、KRR、RKK、RRR、KKKK(SEQ ID NO:7)、KKRK(SEQ ID NO:8)、KRKK(SEQ ID NO:9)、KRRK(SEQ ID NO:10)、RKKR(SEQ ID NO:11)、RRRR(SEQ ID NO:12)、KGKK(SEQ ID NO:13)、KKGK(SEQ ID NO:14)、KKKKK(SEQ ID NO:18)、KKKRK(SEQ ID NO:19)、KBKBK(SEQ ID NO:24)、KKKRKV(SEQ ID NO:33)、PKKKRKV(SEQ IDNO:42)、PGKKRKV(SEQ ID NO:43)、PKGKRKV(SEQ ID NO:44)、PKKGRKV(SEQ ID NO:45)、PKKKGKV(SEQ ID NO:46)、PKKKRGV(SEQ ID NO:47)或PKKKRKG(SEQ ID NO:48)。EP可以包含PKKKRKV(SEQ ID NO:42)、RR、RRR、RHR、RBR、RBRBR(SEQ ID NO:49)、RBHBR(SEQ ID NO:50)或HBRBH(SEQ ID NO:51)，其中B是β-丙氨酸。EP中的氨基酸可以具有D或L立体化学。

EP可以由KK、KR、RR、KKK、KGK、KBK、KBR、KRK、KRR、RKK、RRR、KKKK(SEQ ID NO:7)、KKRK(SEQ ID NO:8)、KRKK(SEQ ID NO:9)、KRRK(SEQ ID NO:10)、RKKR(SEQ ID NO:11)、RRRR(SEQ ID NO:12)、KGKK(SEQ ID NO:13)、KKGK(SEQ ID NO:14)、KKKKK(SEQ ID NO:18)、KKKRK(SEQ ID NO:19)、KBKBK(SEQ ID NO:24)、KKKRKV(SEQ ID NO:33)、PKKKRKV(SEQ IDNO:42)、PGKKRKV(SEQ ID NO:Z43)、PKGKRKV(SEQ ID NO:Z44)、PKKGRKV(SEQ ID NO:Z45)、PKKKGKV(SEQ ID NO:46)、PKKKRGV(SEQ ID NO:47)或PKKKRKG(SEQ ID NO:48)组成。EP可以由PKKKRKV(SEQ ID NO:42)、RR、RRR、RHR、RBR、RBRBR(SEQ ID NO:49)、RBHBR(SEQ ID NO:50)或HBRBH(SEQ ID NO:51)组成，其中B是β-丙氨酸。EP中的氨基酸可以具有D或L立体化学。

EP可以包含在本领域中被鉴定为核定位序列(NLS)的氨基酸序列。EP可以由在本领域中被鉴定为核定位序列(NLS)的氨基酸序列组成。EP可以包含含有氨基酸序列PKKKRKV(SEQ ID NO:42)的NLS。EP可以由含有氨基酸序列PKKKRKV(SEQ ID NO:42)的NLS组成。EP可包含NLS，所述NLS包含选自以下的氨基酸序列：NLSKRPAAIKKAGQAKKKK(SEQ ID NO:52)、PAAKRVKLD(SEQ ID NO:53)、RQRRNELKRSF(SEQ ID NO:54)、RMRKFKNKGKDTAELRRRRVEVSVELR(SEQ ID NO:Z55)、KAKKDEQILKRRNV(SEQ ID NO:56)、VSRKRPRP(SEQ ID NO:57)、PPKKARED(SEQ ID NO:58)、PQPKKKPL(SEQ ID NO:59)、SALIKKKKKMAP(SEQ ID NO:60)、DRLRR(SEQ IDNO:61)、PKQKKRK(SEQ ID NO:62)、RKLKKKIKKL(SEQ ID NO:63)、REKKKFLKRR(SEQ ID NO:64)、KRKGDEVDGVDEVAKKKSKK(SEQ ID NO:65)和RKCLQAGMNLEARKTKK(SEQ ID NO:66)。EP可由NLS组成，所述NLS包含选自以下的氨基酸序列：NLSKRPAAIKKAGQAKKKK(SEQ ID NO:52)、PAAKRVKLD(SEQ ID NO:53)、RQRRNELKRSF(SEQ ID NO:54)、RMRKFKNKGKDTAELRRRRVEVSVELR(SEQ ID NO:55)、KAKKDEQILKRRNV(SEQ ID NO:56)、VSRKRPRP(SEQ ID NO:57)、PPKKARED(SEQ ID NO:58)、PQPKKKPL(SEQ ID NO:59)、SALIKKKKKMAP(SEQ ID NO:60)、DRLRR(SEQ IDNO:61)、PKQKKRK(SEQ ID NO:62)、RKLKKKIKKL(SEQ ID NO:63)、REKKKFLKRR(SEQ ID NO:64)、KRKGDEVDGVDEVAKKKSKK(SEQ ID NO:65)和RKCLQAGMNLEARKTKK(SEQ ID NO:66)。

所有的环外序列也可以含有N-末端乙酰基。因此，例如，EP可以具有以下结构：Ac-PKKKRKV(SEQ ID NO:42)。

细胞穿透肽(CPP)

细胞穿透肽(CPP)可以包含6至20个氨基酸残基。细胞穿透肽可以是环状细胞穿透肽(cCPP)。cCPP能够穿透细胞膜。环外肽(EP)可以与cCPP缀合，并且所得到的构建体可以称为内体逃逸载体(EEV)。cCPP可以指导货物(例如，治疗部分(TM)，诸如寡核苷酸、肽或小分子)穿透细胞膜。cCPP可以将货物递送到细胞的细胞溶质中。cCPP可以将货物递送到靶标(例如，前体mRNA)所在的细胞位置。为了将cCPP与货物(例如，肽、寡核苷酸或小分子)缀合，cCPP上的至少一个键或孤对电子可以被置换。

cCPP中氨基酸残基的总数在6至20个氨基酸残基的范围内，例如6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个氨基酸残基，包括其间的所有范围和子范围。cCPP可以包含6至13个氨基酸残基。本文公开的cCPP可以包含6至10个氨基酸。举例来说，包含6-10个氨基酸残基的cCPP可以具有根据式I-A至式I-E中任何一个的结构：

其中AA₁、AA₂、AA₃、AA₄、AA₅、AA₆、AA₇、AA₈、AA₉和AA₁₀是氨基酸残基。

cCPP可以包含6至8个氨基酸。cCPP可以包含8个氨基酸。

cCPP中的每个氨基酸可以是天然氨基酸或非天然氨基酸。术语“非天然氨基酸”是指一种有机化合物，它是天然氨基酸的同源物，因为它具有与天然氨基酸相似的结构，以致它模拟天然氨基酸的结构和反应性。非天然氨基酸可以是经修饰的氨基酸和/或氨基酸类似物，其不是20种常见的天然存在的氨基酸之一或稀有的天然氨基酸硒代半胱氨酸或吡咯赖氨酸。非天然氨基酸也可以是天然氨基酸的D-异构体。合适的氨基酸的实例包括但不限于丙氨酸、别异亮氨酸、精氨酸、瓜氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、蛋氨酸、萘基丙氨酸、苯丙氨酸、脯氨酸、焦谷氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸、缬氨酸、它们的衍生物或它们的组合。这些和其他氨基酸连同它们在本文中使用的缩写一起列在表5中。

表4.氨基酸缩写

如本文所用，“聚乙二醇”和“PEG”可互换使用。“PEGm”和“PEG_m”是或衍生自式HO(CO)-(CH₂)_n-[OCH₂CH₂)_m-NH₂的分子，其中n是1至5的任何整数，m是1至23的任何整数。在实施方案中，n为1或2。在实施方案中，n为1。在实施方案中，n为2。在实施方案中，n为1且m为2。在实施方案中，n为2且m为2。在实施方案中，n为1且m为4。在实施方案中，n为2且m为4。在实施方案中，n为1且m为12。在实施方案中，n为2且m为12。

如本文所用，“miniPEGm”或“miniPEG_m”是或衍生自式HO(CO)-(CH₂)_n-[OCH₂CH₂)_m-NH₂的分子，其中n是1，m是1至23的任何整数。例如，“miniPEG2”或“miniPEG₂”是或源自(2-[2-[2-氨基乙氧基]乙氧基]乙酸)，而“miniPEG4”或“miniPEG₄”是或源自HO(CO)-(CH₂)_n-(OCH₂CH₂)_m-NH₂，其中n为1且m为4。

cCPP可以包含4至20个氨基酸，其中:(I)至少一个氨基酸具有包含胍基或其质子化形式的侧链；(ii)至少一个氨基酸没有侧链或包含或其质子化形式的侧链；和(iii)至少两个氨基酸独立地具有包含芳族或杂芳族基团的侧链。

至少两个氨基酸可以没有侧链或具有包含或其质子化形式的侧链。如本文所用，当不存在侧链时，氨基酸在连接胺和羧酸的碳原子上具有两个氢原子(例如，-CH₂-)。

没有侧链的氨基酸可以是甘氨酸或β-丙氨酸。

cCPP可以包含形成cCPP的6至20个氨基酸残基，其中:(I)至少一个氨基酸可以是甘氨酸、β-丙氨酸或4-氨基丁酸残基；(ii)至少一个氨基酸可以具有包含芳基或杂芳基的侧链；和(iii)至少一个氨基酸具有包含胍基、或其质子化形式的侧链。

cCPP可以包含形成cCPP的6至20个氨基酸残基，其中:(I)至少两个氨基酸可以独立地是甘氨酸、β-丙氨酸或4-氨基丁酸残基；(ii)至少一个氨基酸可以具有包含芳基或杂芳基的侧链；和(iii)至少一个氨基酸具有包含胍基、或其质子化形式的侧链。

cCPP可以包含形成cCPP的6至20个氨基酸残基，其中:(I)至少三个氨基酸可以独立地是甘氨酸、β-丙氨酸或4-氨基丁酸残基；(ii)至少一个氨基酸可以具有包含芳族或杂芳族基团的侧链；和(iii)至少一个氨基酸可以具有包含胍基、或其质子化形式的侧链。

甘氨酸和相关的氨基酸残基

cCPP可以包含(i)1、2、3、4、5或6个甘氨酸、β-丙氨酸、4-氨基丁酸残基或它们的组合。cCPP可以包含(i)2甘氨酸、β-丙氨酸、4-氨基丁酸残基或它们的组合。cCPP可以包含(i)3甘氨酸、β-丙氨酸、4-氨基丁酸残基或它们的组合。cCPP可以包含(i)4甘氨酸、β-丙氨酸、4-氨基丁酸残基或它们的组合。cCPP可以包含(i)5甘氨酸、β-丙氨酸、4-氨基丁酸残基或它们的组合。cCPP可以包含(i)6甘氨酸、β-丙氨酸、4-氨基丁酸残基或它们的组合。cCPP可以包含(i)3、4或5个甘氨酸、β-丙氨酸、4-氨基丁酸残基或它们的组合。cCPP可以包含(i)3或4个甘氨酸、β-丙氨酸、4-氨基丁酸残基或它们的组合。

cCPP可以包含(i)1、2、3、4、5或6个甘氨酸残基。cCPP可以包含(i)2个甘氨酸残基。cCPP可以包含(i)3个甘氨酸残基。cCPP可以包含(i)4个甘氨酸残基。cCPP可以包含(i)5个甘氨酸残基。cCPP可以包含(i)6个甘氨酸残基。cCPP可以包含(i)3、4或5个甘氨酸残基。cCPP可以包含(i)3或4个甘氨酸残基。cCPP可以包含(i)2或3个甘氨酸残基。cCPP可以包含(i)1或2个甘氨酸残基。

cCPP可以包含(i)3、4、5或6个甘氨酸、β-丙氨酸、4-氨基丁酸残基或它们的组合。cCPP可以包含(i)3甘氨酸、β-丙氨酸、4-氨基丁酸残基或它们的组合。cCPP可以包含(i)4甘氨酸、β-丙氨酸、4-氨基丁酸残基或它们的组合。cCPP可以包含(i)5甘氨酸、β-丙氨酸、4-氨基丁酸残基或它们的组合。cCPP可以包含(i)6甘氨酸、β-丙氨酸、4-氨基丁酸残基或它们的组合。cCPP可以包含(i)3、4或5个甘氨酸、β-丙氨酸、4-氨基丁酸残基或它们的组合。cCPP可以包含(i)3或4个甘氨酸、β-丙氨酸、4-氨基丁酸残基或它们的组合。

cCPP可以包含至少三个甘氨酸残基。cCPP可以包含(i)3、4、5或6个甘氨酸残基。cCPP可以包含(i)3个甘氨酸残基。cCPP可以包含(i)4个甘氨酸残基。cCPP可以包含(i)5个甘氨酸残基。cCPP可以包含(i)6个甘氨酸残基。cCPP可以包含(i)3、4或5个甘氨酸残基。cCPP可以包含(i)3或4个甘氨酸残基

在实施方案中，cCPP中没有甘氨酸、β-丙氨酸或4-氨基丁酸残基是连续的。两个或三个甘氨酸、β-丙氨酸、4-或氨基丁酸残基可以是连续的。两个甘氨酸、β-丙氨酸或4-氨基丁酸残基可以是连续的。

在实施方案中，cCPP中没有甘氨酸残基是连续的。cCPP中的每个甘氨酸残基可以被不可以是甘氨酸的氨基酸残基隔开。两个或三个甘氨酸残基可以是连续的。两个甘氨酸残基可以是连续的。

具有芳族基团或杂芳族基团的氨基酸侧链

cCPP可以包含(ii)2、3、4、5或6个氨基酸残基，这些氨基酸残基独立地具有包含芳族或杂芳族基团的侧链。cCPP可以包含(ii)2个氨基酸残基，这些氨基酸残基独立地具有包含芳族或杂芳族基团的侧链。cCPP可以包含(ii)3个氨基酸残基，这些氨基酸残基独立地具有包含芳族或杂芳族基团的侧链。cCPP可以包含(ii)4个氨基酸残基，这些氨基酸残基独立地具有包含芳族或杂芳族基团的侧链。cCPP可以包含(ii)5个氨基酸残基，这些氨基酸残基独立地具有包含芳族或杂芳族基团的侧链。cCPP可以包含(ii)6个氨基酸残基，这些氨基酸残基独立地具有包含芳族或杂芳族基团的侧链。cCPP可以包含(ii)2、3或4个氨基酸残基，这些氨基酸残基独立地具有包含芳族或杂芳族基团的侧链。cCPP可以包含(ii)2或3个氨基酸残基，这些氨基酸残基独立地具有包含芳族或杂芳族基团的侧链。

cCPP可以包含(ii)2、3、4、5或6个氨基酸残基，这些氨基酸残基独立地具有包含芳族基团的侧链。cCPP可以包含(ii)2个氨基酸残基，这些氨基酸残基独立地具有包含芳族基团的侧链。cCPP可以包含(ii)3个氨基酸残基，这些氨基酸残基独立地具有包含芳族基团的侧链。cCPP可以包含(ii)4个氨基酸残基，这些氨基酸残基独立地具有包含芳族基团的侧链。cCPP可以包含(ii)5个氨基酸残基，这些氨基酸残基独立地具有包含芳族基团的侧链。cCPP可以包含(ii)6个氨基酸残基，这些氨基酸残基独立地具有包含芳族基团的侧链。cCPP可以包含(ii)2、3或4个氨基酸残基，这些氨基酸残基独立地具有包含芳族基团的侧链。cCPP可以包含(ii)2或3个氨基酸残基，这些氨基酸残基独立地具有包含芳族基团的侧链。

芳族基团可以是6至14元芳基。芳基可以是苯基、萘基或蒽基，它们各自任选地被取代。芳基可以是苯基或萘基，它们各自任选地被取代。杂芳族基团可以是具有1、2或3个选自N、O和S的杂原子的6至14元杂芳基。杂芳基可以是吡啶基、喹啉基或异喹啉基。

具有包含芳族或杂芳族基团的侧链的氨基酸残基可以各自独立地是双(高萘丙氨酸)、高萘丙氨酸、萘丙氨酸、苯基甘氨酸、双(高苯丙氨酸)、高苯丙氨酸、苯丙氨酸、色氨酸、3-(3-苯并噻吩基)-丙氨酸、3-(2-喹啉基)-丙氨酸、O-苄基丝氨酸、3-(4-(苄氧基)苯基)-丙氨酸、S-(4-甲基苄基)半胱氨酸、N-(萘-2-基)谷氨酰胺、3-(1,1'-联苯-4-基)-丙氨酸、3-(3-苯并噻吩基)-丙氨酸或色氨酸，它们各自任选地被一个或多个取代基取代。具有包含芳族或杂芳族基团的侧链的氨基酸可以各自独立地选自：

以及

其中N-末端上的H和/或C-末端上的H被肽键置换。

具有包含芳族或杂芳族基团的侧链的氨基酸残基可以各自独立地是苯丙氨酸、萘丙氨酸、苯基甘氨酸、高苯丙氨酸、高萘丙氨酸、双(高苯丙氨酸)、双-(高萘丙氨酸)、色氨酸或酪氨酸的残基，它们各自任选地被一个或多个取代基取代。具有包含芳族基团的侧链的氨基酸残基可以各自独立地是酪氨酸、苯丙氨酸、1-萘丙氨酸、2-萘丙氨酸、色氨酸、3-苯并噻吩基丙氨酸、4-苯基苯丙氨酸、3,4-二氟苯丙氨酸、4-三氟甲基苯丙氨酸、2,3,4,5,6-五氟苯丙氨酸、高苯丙氨酸、β-高苯丙氨酸、4-叔丁基-苯丙氨酸、4-吡啶基丙氨酸、3-吡啶基丙氨酸、4-甲基苯丙氨酸、4-氟苯丙氨酸、4-氯苯丙氨酸、3-(9-蒽基)-丙氨酸的残基。具有包含芳族基团的侧链的氨基酸残基可以各自独立地是苯丙氨酸、萘丙氨酸、苯基甘氨酸、高苯丙氨酸或高萘丙氨酸的残基，它们各自任选地被一个或多个取代基取代。具有包含芳族基团的侧链的氨基酸残基可以各自独立地是苯丙氨酸、萘丙氨酸、高苯丙氨酸、高萘丙氨酸、双(高萘丙氨酸)或双(高萘丙氨酸)的残基，它们各自任选地被一个或多个取代基取代。具有包含芳族基团的侧链的氨基酸残基可以各自独立地是苯丙氨酸或萘丙氨酸的残基，它们各自任选地被一个或多个取代基取代。至少一个具有包含芳族基团的侧链的氨基酸残基可以是苯丙氨酸残基。至少两个具有包含芳族基团的侧链的氨基酸残基可以是苯丙氨酸残基。每个具有包含芳族基团的侧链的氨基酸残基可以是苯丙氨酸残基。

在实施方案中，没有具有包含芳族或杂芳族基团的侧链的氨基酸是连续的。两个具有包含芳族或杂芳族基团的侧链的氨基酸可以是连续的。两个连续的氨基酸可以有相反的立体化学。两个连续的氨基酸可以具有相同的立体化学。三个具有包含芳族或杂芳族基团的侧链的氨基酸可以是连续的。三个连续的氨基酸可以有相同的立体化学。三个连续的氨基酸可以具有交替的立体化学。

包含芳族或杂芳族基团的氨基酸残基可以是L-氨基酸。包含芳族或杂芳族基团的氨基酸残基可以是D-氨基酸。包含芳族或杂芳族基团的氨基酸残基可以是D-氨基酸和L-氨基酸的混合物。

任选的取代基可以是例如与没有取代基的其他相同序列相比，不会显著降低(例如，超过50％)cCPP的胞质递送效率的任何原子或基团。任选的取代基可以是疏水性取代基或亲水性取代基。任选的取代基可以是疏水性取代基。该取代基可以增加疏水性氨基酸的溶剂可及表面积(如本文所定义)。该取代基可以是卤素、烷基、烯基、炔基、环烷基、环烯基、环炔基、杂环基、芳基、杂芳基、烷氧基、芳氧基、酰基、烷基氨基甲酰基、烷基羧酰胺基、烷氧羰基、烷硫基或芳硫基。该取代基可以是卤素。

虽然不希望受理论所束缚，但是据信具有有较高疏水性值的芳族或杂芳族基团的氨基酸(即，具有包含芳族或杂芳族基团的侧链的氨基酸)相对于具有较低疏水性值的氨基酸可以提高cCPP的胞质递送效率。每个疏水性氨基酸可以独立地具有比甘氨酸更大的疏水性值。每个疏水性氨基酸可以独立地是疏水性值大于丙氨酸的疏水性氨基酸。每个疏水性氨基酸可以独立地具有大于或等于苯丙氨酸的疏水性值。疏水性可以使用本领域已知的疏水性标度来测量。表5列出了各种氨基酸的疏水性值，如Eisenberg和Weiss(Proc.Natl.Acad.Sci.U.S.A.1984；81(1):140–144)，Engleman等人(Ann.Rev.ofBiophys.Biophys.Chem.1986；1986(15):321–53)，Kyte和Doolittle(J.Mol.Biol.1982；157(1):105–132)，Hoop和Woods(Proc.Natl.Acad.Sci.U.S.A.1981；78(6):3824–3828)，及Janin(Nature.1979；277(5696):491–492)所报告的，每篇参考文献整体通过引用并入本文。疏水性可以使用Engleman等人报告的疏水性标度来测量。

表5.氨基酸疏水性

可以选择芳族或杂芳族基团的大小来提高cCPP的胞质递送效率。虽然不希望受理论所束缚，但是据信与具有较小疏水性氨基酸的其他相同序列相比，氨基酸侧链上较大的芳族或杂芳族基团可提高胞质递送效率。疏水性氨基酸的大小可以根据疏水性氨基酸的分子量、疏水性氨基酸的空间效应、侧链的溶剂可及表面积(SASA)或它们的组合来测量。疏水性氨基酸的大小可以根据疏水性氨基酸的分子量来测量，并且较大的疏水性氨基酸具有分子量为至少约90 g/mol、或至少约130 g/mol、或至少约141 g/mol的侧链。氨基酸的大小可以根据疏水性侧链的SASA来测量。疏水性氨基酸可以具有SASA大于或等于丙氨酸，或者大于或等于甘氨酸的侧链。较大的疏水性氨基酸可以具有SASA大于丙氨酸或大于甘氨酸的侧链。疏水性氨基酸可以具有SASA大于或等于约哌啶-2-羧酸、大于或等于约色氨酸、大于或等于约苯丙氨酸或大于或等于约萘丙氨酸的芳族或杂芳族基团。第一疏水性氨基酸(AA_H1)可具有SASA为至少约至少约至少约至少约至少约至少约至少约至少约至少约至少约至少约至少约或至少约的侧链。第二疏水性氨基酸(AA_H2)可具有SASA为至少约至少约至少约至少约至少约至少约至少约至少约至少约至少约至少约至少约或至少约的侧链。AA_H1和AA_H2的侧链可具有的组合SASA为至少约至少约至少约至少约至少约至少约至少约至少约至少约至少约至少约至少约至少约至少约至少约大于约至少约至少约至少约至少约至少约至少约至少约至少约至少约至少约至少约至少约至少约至少约大于约至少约至少约至少约至少约或至少约AA_H2可以是侧链的SASA小于或等于AA_H1的疏水性侧链的SASA的疏水性氨基酸残基。举例来说，而非限制，与具有Phe-Arg基序的其他方面相同的cCPP相比，具有Nal-Arg基序的cCPP可表现出提高的胞质递送效率；与具有Nal-Phe-Arg基序的其他方面相同的cCPP相比，具有Phe-Nal-Arg基序的cCPP可以表现出提高的胞质递送效率；并且与具有nal-Phe-Arg基序的其他方面相同的cCPP相比，phe-Nal-Arg基序可以表现出提高的胞质递送效率。

如本文所用，“疏水表面积”或“SASA”是指溶剂可及的氨基酸侧链的表面积(以平方埃的形式报告；)。SASA可以使用由Shrake和Rupley开发的“滚球”算法来计算(J MolBiol.79(2):351–71)，其通过引用整体并入本文用于所有目的。这种算法使用特定半径的溶剂“球体”来探测分子表面。球体的典型值为接近水分子的半径。

某些侧链的SASA值显示在下面的表6中。本文所述的SASA值基于下面表6中所列的理论值，如Tien等人所报告的(PLOS ONE 8(11):e80635，可在doi.org/10.1371/journal.pone.0080635获得)，其通过引用整体并入本文用于所有目的。

表6.氨基酸SASA值

残基	理论值	经验值	Miller等人(1987)	Rose等人(1985)
					丙氨酸	129.0	121.0	113.0	118.1
精氨酸	274.0	265.0	241.0	256.0
					天冬酰胺	195.0	187.0	158.0	165.5
天冬氨酸	193.0	187.0	151.0	158.7
					半胱氨酸	167.0	148.0	140.0	146.1
谷氨酸盐	223.0	214.0	183.0	186.2
					谷氨酰胺	225.0	214.0	189.0	193.2
甘氨酸	104.0	97.0	85.0	88.1
					组氨酸	224.0	216.0	194.0	202.5
异亮氨酸	197.0	195.0	182.0	181.0
					亮氨酸	201.0	191.0	180.0	193.1
赖氨酸	236.0	230.0	211.0	225.8
					蛋氨酸	224.0	203.0	204.0	203.4
苯丙氨酸	240.0	228.0	218.0	222.8
					脯氨酸	159.0	154.0	143.0	146.8
丝氨酸	155.0	143.0	122.0	129.8
					苏氨酸	172.0	163.0	146.0	152.5
色氨酸	285.0	264.0	259.0	266.3
					酪氨酸	263.0	255.0	229.0	236.8
缬氨酸	174.0	165.0	160.0	164.5

具有包含胍基、胍置换基团或其质子化形式的侧链的氨基酸残基

如本文所用，胍是指以下结构：

如本文所用，质子化形式的胍是指以下结构：

胍置换基团是指氨基酸侧链上的，在生理pH或高于生理pH时将带正电荷的官能团，或者是那些能够再现胍鎓基团的氢键给予和接受活性的官能团。

胍置换基团促进治疗剂的细胞渗透和递送，同时降低与胍基或其质子化形式相关的毒性。cCPP可以包含至少一个氨基酸，该至少一个氨基酸具有包含胍或胍鎓置换基团的侧链。cCPP可以包含至少两个氨基酸，该至少两个氨基酸具有包含胍或胍鎓置换基团的侧链。cCPP可以包含至少三个氨基酸，该至少三个氨基酸具有包含胍或胍鎓置换基团的侧链。

胍或胍鎓基团可以是胍或胍鎓的等排体。胍或胍鎓置换基团的碱性可以比胍弱。

如本文所用，胍置换基团是指或其质子化形式。

本公开涉及包含4至20个氨基酸的cCPP，其中：(i)至少一个氨基酸具有包含胍基或其质子化形式的侧链；(ii)至少一个氨基酸残基没有侧链或具有包含或其质子化形式的侧链；和(iii)至少两个氨基酸残基独立地具有包含芳族或杂芳族基团的侧链。

至少两个氨基酸残基可以没有侧链或具有包含或其质子化形式的侧链。如本文所用，当不存在侧链时，氨基酸残基在连接胺和羧酸的碳原子上具有两个氢原子(例如，-CH₂-)。

cCPP可以包含至少一个氨基酸，该至少一个氨基酸的侧链包含下列部分之一：或其质子化形式。

cCPP可以包含至少两个氨基酸，该至少两个氨基酸各自独立地具有下列部分之一：或其质子化形式。至少两个氨基酸可以具有包含选自以下的相同部分的侧链：或其质子化形式。至少一个氨基酸可以具有包含或其质子化形式的侧链。至少两个氨基酸可以具有包含或其质子化形式的侧链。一个、两个、三个或四个氨基酸可以具有包含或其质子化形式的侧链。一个氨基酸可以具有包含或其质子化形式的侧链。两个氨基酸可以具有包含其质子化形式的侧链。或其质子化形式可以附接到氨基酸侧链的末端。可以附接到氨基酸侧链的末端。

cCPP可包含(iii)2、3、4、5或6个氨基酸残基，这些氨基酸残基独立地具有包含胍基、胍置换基团或其质子化形式的侧链。cCPP可包含(iii)2个氨基酸残基，这些氨基酸残基独立地具有包含胍基、胍置换基团或其质子化形式的侧链。cCPP可包含(iii)3个氨基酸残基，这些氨基酸残基独立地具有包含胍基、胍置换基团或其质子化形式的侧链。cCPP可包含(iii)4个氨基酸残基，这些氨基酸残基独立地具有包含胍基、胍置换基团或其质子化形式的侧链。cCPP可包含(iii)5个氨基酸残基，这些氨基酸残基独立地具有包含胍基、胍置换基团或其质子化形式的侧链。cCPP可包含(iii)6个氨基酸残基，这些氨基酸残基独立地具有包含胍基、胍置换基团或其质子化形式的侧链。cCPP可包含(iii)2、3、4或5个氨基酸残基，这些氨基酸残基独立地具有包含胍基、胍置换基团或其质子化形式的侧链。cCPP可包含(iii)2、3或4个氨基酸残基，这些氨基酸残基独立地具有包含胍基、胍置换基团或其质子化形式的侧链。cCPP可包含(iii)2或3个氨基酸残基，这些氨基酸残基独立地具有包含胍基、胍置换基团或其质子化形式的侧链。cCPP可以包含(iii)至少一个氨基酸残基，该至少一个氨基酸残基具有包含胍基或其质子化形式的侧链。cCPP可以包含(iii)两个氨基酸残基，该两个氨基酸残基具有包含胍基或其质子化形式的侧链。cCPP可以包含(iii)三个氨基酸残基，该三个氨基酸残基具有包含胍基或其质子化形式的侧链。

氨基酸残基可以独立地具有包含胍基、胍置换基团或其质子化形式的侧链，是不连续的。两个氨基酸残基可以独立地具有包含胍基、胍置换基团或其质子化形式的侧链，可以是连续的。三个氨基酸残基可以独立地具有包含胍基、胍置换基团或其质子化形式的侧链，可以是连续的。四个氨基酸残基可以独立地具有包含胍基、胍置换基团或其质子化形式的侧链，可以是不连续的。连续的氨基酸残基可以具有相同的立体化学。连续的氨基酸可以具有交替的立体化学。

独立地具有包含胍基、胍置换基团或其质子化形式的侧链的氨基酸残基可以是L-氨基酸。独立地具有包含胍基、胍置换基团或其质子化形式的侧链的氨基酸残基可以是D-氨基酸。独立地具有包含胍基、胍置换基团或其质子化形式的侧链的氨基酸残基可以是L-或D-氨基酸的混合物。

每个具有包含胍基或其质子化形式的侧链的氨基酸残基可以独立地是精氨酸、高精氨酸、2-氨基-3-丙酸、2-氨基-4-胍基丁酸的残基或其质子化形式。每个具有包含胍基或其质子化形式的侧链的氨基酸残基可以独立地是精氨酸残基或其质子化形式。

每个具有包含胍置换基团或其质子化形式的侧链的氨基酸可以独立地是或其质子化形式。

不受理论的束缚，假设胍置换基团相对于精氨酸具有降低的碱性，并且在一些情况下在生理pH下不带电荷(例如，-N(H)C(O))，并且能够保持与质膜上磷脂的二齿氢键相互作用，据信这会促进有效的膜缔合和后续内化。也据信正电荷的去除会降低cCPP的毒性。

本领域技术人员将会理解，上述非天然芳族疏水性氨基酸的N-末端和/或C-末端，掺入本文公开的肽中后，就形成酰胺键。

cCPP可以包含具有包含芳族或杂芳族基团的侧链的第一氨基酸和具有包含芳族或杂芳族基团的侧链的第二氨基酸，其中第一甘氨酸的N-末端与具有包含芳族或杂芳族基团的侧链的第一氨基酸形成肽键，并且第一甘氨酸的C-末端与具有包含芳族或杂芳族基团的侧链的第二氨基酸形成肽键。尽管按照惯例，术语“第一氨基酸”常常是指肽序列的N-末端氨基酸，如本文所用，“第一氨基酸”用于区分cCPP中的参考氨基酸和另一氨基酸(例如，“第二氨基酸”)，以致术语“第一氨基酸”可以是或者可以指位于肽序列的N-末端的氨基酸。

cCPP可以包含第二甘氨酸的N-末端，其与具有包含芳族或杂芳族基团的侧链的氨基酸形成肽键，并且第二甘氨酸的C-末端与具有包含胍基或其质子化形式的侧链的氨基酸形成肽键。

cCPP可以包含具有包含胍基或其质子化形式的侧链的第一氨基酸，和具有包含胍基或其质子化形式的侧链的第二氨基酸，其中第三甘氨酸的N-末端与具有包含胍基或其质子化形式的侧链的第一氨基酸形成肽键，并且第三甘氨酸的C-末端与具有包含胍基或其质子化形式的侧链的第二氨基酸形成肽键。

cCPP可以包含天冬酰胺、天冬氨酸、谷氨酰胺、谷氨酸或高谷氨酰胺的残基。cCPP可以包含天冬酰胺残基。cCPP可以包含谷氨酰胺残基。

cCPP可以包含酪氨酸、苯丙氨酸、1-萘丙氨酸、2-萘丙氨酸、色氨酸、3-苯并噻吩基丙氨酸、4-苯基苯丙氨酸、3,4-二氟苯丙氨酸、4-三氟甲基苯丙氨酸、2,3,4,5,6-五氟苯丙氨酸、高苯丙氨酸、β-高苯丙氨酸、4-叔丁基-苯丙氨酸、4-吡啶基丙氨酸、3-吡啶基丙氨酸、4-甲基苯丙氨酸、4-氟苯丙氨酸、4-氯苯丙氨酸、3-(9-蒽基)-丙氨酸的残基。

虽然不希望受理论所束缚，但据信cCPP中氨基酸的手性可能影响胞质摄取效率。cCPP可以包含至少一个D氨基酸。cCPP可以包含一至十五个D氨基酸。cCPP可以包含一至十个D氨基酸。cCPP可以包含1、2、3或4个D氨基酸。cCPP可以包含2、3、4、5、6、7或8个具有交替D和L手性的连续氨基酸。cCPP可以包含三个具有相同手性的连续氨基酸。cCPP可以包含两个具有相同手性的连续氨基酸。至少两个氨基酸可以具有相反的手性。至少两个具有相反手性的氨基酸可以彼此相邻。至少三个氨基酸可以相对于彼此具有交替的立体化学。相对于彼此具有交替手性的至少三个氨基酸可以彼此相邻。至少四个氨基酸相对于彼此具有交替的立体化学。相对于彼此具有交替手性的至少四个氨基酸可以彼此相邻。至少两个氨基酸可以具有相同的手性。至少两个具有相同手性的氨基酸可以彼此相邻。至少两个氨基酸具有相同手性，且至少两个氨基酸具有相反手性。至少两个具有相反手性的氨基酸可以与至少两个具有相同手性的氨基酸相邻。因此，cCPP中的相邻氨基酸可以具有以下任何序列：D-L；L-D；D-L-L-D；L-D-D-L；L-D-L-L-D；D-L-D-D-L；D-L-L-D-L；或L-D-D-L-D。形成cCPP的氨基酸残基可以全部是L-氨基酸。形成cCPP的氨基酸残基可以全部是D-氨基酸。

至少两个氨基酸可以具有不同的手性。至少两个具有不同手性的氨基酸可以彼此相邻。至少三个氨基酸可以相对于相邻氨基酸具有不同的手性。至少四个氨基酸可以相对于相邻氨基酸具有不同的手性。至少两个氨基酸具有相同手性，且至少两个氨基酸具有不同手性。形成cCPP的一个或多个氨基酸残基可以是非手性的。cCPP可以包含3、4或5个氨基酸的基序，其中具有相同手性的两个氨基酸可以被非手性氨基酸隔开。cCPP可以包含以下序列：D-X-D；D-X-D-X；D-X-D-X-D；L-X-L；L-X-L-X；或L-X-L-X-L，其中X是非手性氨基酸。非手性氨基酸可以是甘氨酸。

具有包含：

或其质子化形式的侧链的氨基酸可以与具有包含芳族或杂芳族基团的侧链的氨基酸相邻。具有包含：或其质子化形式的侧链的氨基酸可以与至少一个具有包含胍或其质子化形式的侧链的氨基酸相邻。具有包含胍或其质子化形式的侧链的氨基酸可以与具有包含芳族或杂芳族基团的侧链的氨基酸相邻。具有包含：或其质子化形式的侧链的两个氨基酸可以彼此相邻。具有包含胍或其质子化形式的侧链的两个氨基酸彼此相邻。cCPP可包含至少两个具有可包含芳族或杂芳族基团的侧链的连续氨基酸，以及至少两个具有包含：或其质子化形式的侧链的非相邻氨基酸。cCPP可包含至少两个具有包含芳族或杂芳族基团的侧链的连续氨基酸，以及至少两个具有包含或其质子化形式的侧链的非相邻氨基酸。相邻氨基酸可以具有相同手性。相邻氨基酸可以具有相反手性。氨基酸的其他组合可以具有D和L氨基酸的任何排列，例如，前一段落中描述的任何序列。

至少两个具有包含：

或其质子化形式的侧链的氨基酸与至少两个具有包含胍基或其质子化形式的侧链的氨基酸交替。

cCPP可以包含式(A)的结构：

或其质子化形式，

其中：

R₁、R₂和R₃各自独立地是H或氨基酸的芳族或杂芳族侧链；

R₁、R₂和R₃中的至少一者是氨基酸的芳族或杂芳族侧链；

R₄、R₅、R₆、R₇独立地是H或氨基酸侧链；

AA_SC是氨基酸侧链；并且

q是1、2、3或4。

在实施方案中，提供了包含具有6至12个氨基酸的环肽的化合物，其中所述环肽的至少两个氨基酸是带电荷的氨基酸，所述环肽的至少两个氨基酸是芳族疏水性氨基酸，所述环肽的至少两个氨基酸是不带电荷的非芳族氨基酸。在实施方案中，环肽的至少两个带电荷的氨基酸是精氨酸。在实施方案中，环肽的至少两个芳族疏水性氨基酸是苯丙氨酸或萘丙氨酸。在实施方案中，环肽的至少两个不带电荷的非芳族氨基酸是瓜氨酸或甘氨酸。

在实施方案中，式(A)的环肽不是选自具有SEQ ID NO:89-117的序列的环肽。

在实施方案中，式(A)的环肽选自具有SEQ ID NO:89-117的序列的环肽。

Φ＝L-萘丙氨酸；φ＝D-萘丙氨酸；Ω＝L-正亮氨酸

cCPP可以包含式(I)的结构：

或其质子化形式，

其中：

R₁、R₂和R₃可以各自独立地是H或具有包含芳族基团的侧链的氨基酸残基；

R₁、R₂和R₃中的至少一者是氨基酸的芳族或杂芳族侧链；

R₄和R₇独立地是H或氨基酸侧链；

AA_SC是氨基酸侧链；

q是1、2、3或4；并且

每个m独立地是0、1、2或3的整数。

R₁、R₂和R₃可以各自独立地是H、-亚烷基-芳基或-亚烷基-杂芳基。R₁、R₂和R₃可以各自独立地是H、-C_1-3亚烷基-芳基或-C_1-3亚烷基-杂芳基。R₁、R₂和R₃可以各自独立地是H或-亚烷基-芳基。R₁、R₂和R₃可以各自独立地是H或-C_1-3亚烷基-芳基。C_1-3亚烷基可以是亚甲基。芳基可以是6至14元芳基。杂芳基可以是具有一个或多个选自N、O和S的杂原子的6至14元杂芳基。芳基可以选自苯基、萘基或蒽基。芳基可以是苯基或萘基。芳基可以是苯基。杂芳基可以是吡啶基、喹啉基和异喹啉基。R₁、R₂和R₃可以各自独立地是H、-C_1-3亚烷基-Ph或-C_1-3亚烷基-萘基。R₁、R₂和R₃可以各自独立地是H、-CH₂Ph或-CH₂萘基。R₁、R₂和R₃可以各自独立地是H或-CH₂Ph。

R₁、R₂和R₃可以各自独立地是酪氨酸、苯丙氨酸、1-萘丙氨酸、2-萘丙氨酸、色氨酸、3-苯并噻吩基丙氨酸、4-苯基苯丙氨酸、3,4-二氟苯丙氨酸、4-三氟甲基苯丙氨酸、2,3,4,5,6-五氟苯丙氨酸、高苯丙氨酸、β-高苯丙氨酸、4-叔丁基-苯丙氨酸、4-吡啶基丙氨酸、3-吡啶基丙氨酸、4-甲基苯丙氨酸、4-氟苯丙氨酸、4-氯苯丙氨酸、3-(9-蒽基)-丙氨酸的侧链。

R₁可以是酪氨酸的侧链。R₁可以是苯丙氨酸的侧链。R₁可以是1-萘基丙氨酸的侧链。R₁可以是2-萘基丙氨酸的侧链。R₁可以是色氨酸的侧链。R₁可以是3-苯并噻吩基丙氨酸的侧链。R₁可以是4-苯基苯丙氨酸的侧链。R₁可以是3,4-二氟苯丙氨酸的侧链。R₁可以是4-三氟甲基苯丙氨酸的侧链。R₁可以是2,3,4,5,6-五氟苯丙氨酸的侧链。R₁可以是高苯丙氨酸的侧链。R₁可以是β-高苯丙氨酸的侧链。R₁可以是4-叔丁基苯丙氨酸的侧链。R₁可以是4-吡啶基丙氨酸的侧链。R₁可以是3-吡啶基丙氨酸的侧链。R₁可以是4-甲基苯丙氨酸的侧链。R₁可以是4-氟苯丙氨酸的侧链。R₁可以是4-氯苯丙氨酸的侧链。R₁可以是3-(9-蒽基)-丙氨酸的侧链。

R₂可以是酪氨酸的侧链。R₂可以是苯丙氨酸的侧链。R₂可以是1-萘基丙氨酸的侧链。R₁可以是2-萘基丙氨酸的侧链。R₂可以是色氨酸的侧链。R₂可以是3-苯并噻吩基丙氨酸的侧链。R₂可以是4-苯基苯丙氨酸的侧链。R₂可以是3,4-二氟苯丙氨酸的侧链。R₂可以是4-三氟甲基苯丙氨酸的侧链。R₂可以是2,3,4,5,6-五氟苯丙氨酸的侧链。R₂可以是高苯丙氨酸的侧链。R₂可以是β-高苯丙氨酸的侧链。R₂可以是4-叔丁基苯丙氨酸的侧链。R₂可以是4-吡啶基丙氨酸的侧链。R₂可以是3-吡啶基丙氨酸的侧链。R₂可以是4-甲基苯丙氨酸的侧链。R₂可以是4-氟苯丙氨酸的侧链。R₂可以是4-氯苯丙氨酸的侧链。R₂可以是3-(9-蒽基)-丙氨酸的侧链。

R₃可以是酪氨酸的侧链。R₃可以是苯丙氨酸的侧链。R₃可以是1-萘基丙氨酸的侧链。R₃可以是2-萘基丙氨酸的侧链。R₃可以是色氨酸的侧链。R₃可以是3-苯并噻吩基丙氨酸的侧链。R₃可以是4-苯基苯丙氨酸的侧链。R₃可以是3,4-二氟苯丙氨酸的侧链。R₃可以是4-三氟甲基苯丙氨酸的侧链。R₃可以是2,3,4,5,6-五氟苯丙氨酸的侧链。R₃可以是高苯丙氨酸的侧链。R₃可以是β-高苯丙氨酸的侧链。R₃可以是4-叔丁基苯丙氨酸的侧链。R₃可以是4-吡啶基丙氨酸的侧链。R₃可以是3-吡啶基丙氨酸的侧链。R₃可以是4-甲基苯丙氨酸的侧链。R₃可以是4-氟苯丙氨酸的侧链。R₃可以是4-氯苯丙氨酸的侧链。R₃可以是3-(9-蒽基)-丙氨酸的侧链。

R₄可以是H、-亚烷基-芳基、-亚烷基-杂芳基。R₄可以是H、-C_1-3亚烷基-芳基或-C_1-3亚烷基-杂芳基。R₄可以是H或-亚烷基-芳基。R₄可以是H或-C_1-3亚烷基-芳基。C_1-3亚烷基可以是亚甲基。芳基可以是6至14元芳基。杂芳基可以是具有一个或多个选自N、O和S的杂原子的6至14元杂芳基。芳基可以选自苯基、萘基或蒽基。芳基可以是苯基或萘基。芳基可以是苯基。杂芳基可以是吡啶基、喹啉基和异喹啉基。R₄可以是H、-C_1-3亚烷基-Ph或-C_1-3亚烷基-萘基。R₄可以是H或是表4或表6中氨基酸的侧链。R₄可以是H或是具有包含芳族基团的侧链的氨基酸残基。R₄可以是H、-CH₂Ph或-CH₂萘基。R₄可以是H或-CH₂Ph。

R₅可以是H、-亚烷基-芳基、-亚烷基-杂芳基。R₅可以是H、-C_1-3亚烷基-芳基或-C_1-3亚烷基-杂芳基。R₅可以是H或-亚烷基-芳基。R₅可以是H或-C_1-3亚烷基-芳基。C_1-3亚烷基可以是亚甲基。芳基可以是6至14元芳基。杂芳基可以是具有一个或多个选自N、O和S的杂原子的6至14元杂芳基。芳基可以选自苯基、萘基或蒽基。芳基可以是苯基或萘基。芳基可以是苯基。杂芳基可以是吡啶基、喹啉基和异喹啉基。R₅可以是H、-C_1-3亚烷基-Ph或-C_1-3亚烷基-萘基。R₅可以是H或是表4或表6中氨基酸的侧链。R₄可以是H或是具有包含芳族基团的侧链的氨基酸残基。R₅可以是H、-CH₂Ph或-CH₂萘基。R₄可以是H或-CH₂Ph。

R₆可以是H、-亚烷基-芳基、-亚烷基-杂芳基。R₆可以是H、-C_1-3亚烷基-芳基或-C_1-3亚烷基-杂芳基。R₆可以是H或-亚烷基-芳基。R₆可以是H或-C_1-3亚烷基-芳基。C_1-3亚烷基可以是亚甲基。芳基可以是6至14元芳基。杂芳基可以是具有一个或多个选自N、O和S的杂原子的6至14元杂芳基。芳基可以选自苯基、萘基或蒽基。芳基可以是苯基或萘基。芳基可以是苯基。杂芳基可以是吡啶基、喹啉基和异喹啉基。R₆可以是H、-C_1-3亚烷基-Ph或-C_1-3亚烷基-萘基。R₆可以是H或是表4或表6中氨基酸的侧链。R₆可以是H或是具有包含芳族基团的侧链的氨基酸残基。R₆可以是H、-CH₂Ph或-CH₂萘基。R₆可以是H或-CH₂Ph。

R₇可以是H、-亚烷基-芳基、-亚烷基-杂芳基。R₇可以是H、-C_1-3亚烷基-芳基或-C_1-3亚烷基-杂芳基。R₇可以是H或-亚烷基-芳基。R₇可以是H或-C_1-3亚烷基-芳基。C_1-3亚烷基可以是亚甲基。芳基可以是6至14元芳基。杂芳基可以是具有一个或多个选自N、O和S的杂原子的6至14元杂芳基。芳基可以选自苯基、萘基或蒽基。芳基可以是苯基或萘基。芳基可以是苯基。杂芳基可以是吡啶基、喹啉基和异喹啉基。R₇可以是H、-C_1-3亚烷基-Ph或-C_1-3亚烷基-萘基。R₇可以是H或是表4或表6中氨基酸的侧链。R₇可以是H或是具有包含芳族基团的侧链的氨基酸残基。R₇可以是H、-CH₂Ph或-CH₂萘基。R₇可以是H或-CH₂Ph。

R₁、R₂、R₃、R₄、R₅、R₆和R₇中的一者、两者或三者可以是-CH₂Ph。R₁、R₂、R₃、R₄、R₅、R₆和R₇中的一者可以是-CH₂Ph。R₁、R₂、R₃、R₄、R₅、R₆和R₇中的两者可以是-CH₂Ph。R₁、R₂、R₃、R₄、R₅、R₆和R₇中的三者可以是-CH₂Ph。R₁、R₂、R₃、R₄、R₅、R₆和R₇中的至少一者可以是-CH₂Ph。R₁、R₂、R₃、R₄、R₅、R₆和R₇中不超过四者可以是-CH₂Ph。

R₁、R₂、R₃和R₄中的一者、两者或三者是-CH₂Ph。R₁、R₂、R₃和R₄中的一者是-CH₂Ph。R₁、R₂、R₃和R₄中的两者是-CH₂Ph。R₁、R₂、R₃和R₄中的三者是-CH₂Ph。R₁、R₂、R₃和R₄中的至少一者是-CH₂Ph。

R₁、R₂、R₃、R₄、R₅、R₆和R₇中的一者、两者或三者可以是H。R₁、R₂、R₃、R₄、R₅、R₆和R₇中的一者可以是H。R₁、R₂、R₃、R₄、R₅、R₆和R₇中的两者是H。R₁、R₂、R₃、R₅、R₆和R₇中的三者可以是H。R₁、R₂、R₃、R₄、R₅、R₆和R₇中的至少一者可以是H。R₁、R₂、R₃、R₄、R₅、R₆和R₇中不超过三者可以是-CH₂Ph。

R₁、R₂、R₃和R₄中的一者、两者或三者是H。R₁、R₂、R₃和R₄中的一者是H。R₁、R₂、R₃和R₄中的两者是H。R₁、R₂、R₃和R₄中的三者是H。R₁、R₂、R₃和R₄中的至少一者是H。

R₄、R₅、R₆和R₇中的至少一者可以是3-胍基-2-氨基丙酸的侧链。R₄、R₅、R₆和R₇中的至少一者可以是4-胍基-2-氨基丁酸的侧链。R₄、R₅、R₆和R₇中的至少一者可以是精氨酸的侧链。R₄、R₅、R₆和R₇中的至少一者可以是高精氨酸的侧链。R₄、R₅、R₆和R₇中的至少一者可以是N-甲基精氨酸的侧链。R₄、R₅、R₆和R₇中的至少一者可以是N,N-二甲基精氨酸的侧链。R₄、R₅、R₆和R₇中的至少一者可以是2,3-二氨基丙酸的侧链。R₄、R₅、R₆和R₇中的至少一者可以是2,4-二氨基丁酸、赖氨酸的侧链。R₄、R₅、R₆和R₇中的至少一者可以是N-甲基赖氨酸的侧链。R₄、R₅、R₆和R₇中的至少一者可以是N,N-二甲基赖氨酸的侧链。R₄、R₅、R₆和R₇中的至少一者可以是N-乙基赖氨酸的侧链。R₄、R₅、R₆和R₇中的至少一者可以是N,N,N-三甲基赖氨酸、4-胍基苯丙氨酸的侧链。R₄、R₅、R₆和R₇中的至少一者可以是瓜氨酸的侧链。R₄、R₅、R₆和R₇中的至少一者可以是N,N-二甲基赖氨酸、β-高精氨酸的侧链。R₄、R₅、R₆和R₇中的至少一者可以是3-(1-哌啶基)丙氨酸的侧链。

R₄、R₅、R₆和R₇中的至少两者可以是3-胍基-2-氨基丙酸的侧链。R₄、R₅、R₆和R₇中的至少两者可以是4-胍基-2-氨基丁酸的侧链。R₄、R₅、R₆和R₇中的至少两者可以是精氨酸的侧链。R₄、R₅、R₆和R₇中的至少两者可以是高精氨酸的侧链。R₄、R₅、R₆和R₇中的至少两者可以是N-甲基精氨酸的侧链。R₄、R₅、R₆和R₇中的至少两者可以是N,N-二甲基精氨酸的侧链。R₄、R₅、R₆和R₇中的至少两者可以是2,3-二氨基丙酸的侧链。R₄、R₅、R₆和R₇中的至少两者可以是2,4-二氨基丁酸、赖氨酸的侧链。R₄、R₅、R₆和R₇中的至少两者可以是N-甲基赖氨酸的侧链。R₄、R₅、R₆和R₇中的至少两者可以是N,N-二甲基赖氨酸的侧链。R₄、R₅、R₆和R₇中的至少两者可以是N-乙基赖氨酸的侧链。R₄、R₅、R₆和R₇中的至少两者可以是N,N,N-三甲基赖氨酸、4-胍基苯丙氨酸的侧链。R₄、R₅、R₆和R₇中的至少两者可以是瓜氨酸的侧链。R₄、R₅、R₆和R₇中的至少两者可以是N,N-二甲基赖氨酸、β-高精氨酸的侧链。R₄、R₅、R₆和R₇中的至少两者可以是3-(1-哌啶基)丙氨酸的侧链。

R₄、R₅、R₆和R₇中的至少三者可以是3-胍基-2-氨基丙酸的侧链。R₄、R₅、R₆和R₇中的至少三者可以是4-胍基-2-氨基丁酸的侧链。R₄、R₅、R₆和R₇中的至少三者可以是精氨酸的侧链。R₄、R₅、R₆和R₇中的至少三者可以是高精氨酸的侧链。R₄、R₅、R₆和R₇中的至少三者可以是N-甲基精氨酸的侧链。R₄、R₅、R₆和R₇中的至少三者可以是N,N-二甲基精氨酸的侧链。R₄、R₅、R₆和R₇中的至少三者可以是2,3-二氨基丙酸的侧链。R₄、R₅、R₆和R₇中的至少三者可以是2,4-二氨基丁酸、赖氨酸的侧链。R₄、R₅、R₆和R₇中的至少三者可以是N-甲基赖氨酸的侧链。R₄、R₅、R₆和R₇中的至少三者可以是N,N-二甲基赖氨酸的侧链。R₄、R₅、R₆和R₇中的至少三者可以是N-乙基赖氨酸的侧链。R₄、R₅、R₆和R₇中的至少三者可以是N,N,N-三甲基赖氨酸、4-胍基苯丙氨酸的侧链。R₄、R₅、R₆和R₇中的至少三者可以是瓜氨酸的侧链。R₄、R₅、R₆和R₇中的至少三者可以是N,N-二甲基赖氨酸、β-高精氨酸的侧链。R₄、R₅、R₆和R₇中的至少三者可以是3-(1-哌啶基)丙氨酸的侧链。

AA_SC可以是天冬酰胺、谷氨酰胺或高谷氨酰胺残基的侧链。AA_SC可以是谷氨酰胺残基的侧链。cCPP还可包含与AA_SC缀合的接头，例如天冬酰胺、谷氨酰胺或高谷氨酰胺的残基。因此，cCPP还可包含与天冬酰胺、谷氨酰胺或高谷氨酰胺残基缀合的接头。cCPP还可包含与谷氨酰胺残基缀合的接头。

q可以是1、2或3。q可以1或2。q可以是1。q可以是2。q可以是3。q可以是4。

m可以是1-3。m可以是1或2。m可以是0。m可以是1。m可以是2。m可以是3。

式(A)的cCPP可包含式(I)的结构(I)或其质子化形式，其中AA_SC、R₁、R₂、R₃、R₄、R₇、m和q如本文所定义。

式(A)的cCPP可以包含式(I-a)或式(I-b)的结构：

或其质子化形式，其中AA_SC、R₁、R₂、R₃、R₄和m如本文所定义。

式(A)的cCPP可以包含式(I-1)、式(I-2)、式(I-3)或式(I-4)的结构：

或其质子化形式，其中AA_SC和m如本文所定义。

式(A)的cCPP可以包含式(I-5)或式(I-6)的结构：

或其质子化形式，其中AA_SC如本文所定义。

式(A)的cCPP可以包含式(I-1)的结构：

或其质子化形式，

其中AA_SC-和m如本文所定义。

式(A)的cCPP可以包含式(I-2)的结构：

或其质子化形式，其中AA_SC-和m如本文所定义。

式(A)的cCPP可以包含式(I-3)的结构：

或其质子化形式，其中AA_SC-和m如本文所定义。

式(A)的cCPP可以包含式(I-4)的结构：

或其质子化形式，其中AA_SC-和m如本文所定义。

式(A)的cCPP可以包含式(I-5)的结构：

或其质子化形式，

其中AA_SC-和m如本文所定义。

式(A)的cCPP可以包含式(I-6)的结构：

或其质子化形式，其中AA_SC和m如本文所定义。

cCPP可以包含以下序列之一：FGFGRGR(SEQ ID NO:68)；GfFGrGr(SEQ ID NO:69)；FfΦGRGR(SEQ ID NO:70)；FfFGRGR(SEQ ID NO:71)；或FfΦGrGr(SEQ ID NO:72)。cCPP可以具有以下序列之一：FGFΦ(SEQ ID NO:73)；GfFGrGrQ(SEQ ID NO:74)；FfΦGRGRQ(SEQID NO:75)；FfFGRGRQ(SEQ ID NO:76)；或FfΦGrGrQ(SEQ ID NO:77)。

本公开还涉及具有式(II)结构的cCPP：

其中：

AA_SC是氨基酸侧链；

R^1a、R^1b和R^1c各自独立地是6至14元芳基或6至14元杂芳基；

R^2a、R^2b、R^2c和R^2d独立地是氨基酸侧链；

R^2a、R^2b、R^2c和R^2d中的至少一者是或其质子化形式；

R^2a、R^2b、R^2c和R^2d中的至少一者是胍或其质子化形式；

每个n”独立地是整数0、1、2、3、4或5；

每个n’独立地是0、1、2或3的整数；并且

如果n’是0，则R^2a，R^2b，R^2b或R^2d不存在。

R^2a、R^2b、R^2c和R^2d中的至少两者可以是或其质子化形式。R^2a、R^2b、R^2c和R^2d中的两者或三者可以是或其质子化形式。R^2a、R^2b、R^2c和R^2d中的一者可以是或其质子化形式。R^2a、R^2b、R^2c和R^2d中的至少一者可以是或其质子化形式、并且R^2a、R^2b、R^2c和R^2d的剩余部分可以是胍或其质子化形式。R^2a、R^2b、R^2c和R^2d中的至少两者可以是或其质子化形式，R^2a、R^2b、R^2c和R^2d中的剩余部分可以是胍或其质子化形式。

R^2a、R^2b、R^2c和R^2d全部可以是或其质子化形式。R^2a、R^2b、R^2c和R^2d中的至少一者可以是或其质子化形式、并且R^2a、R^2b、R^2c和R^2d的剩余部分可以是胍或其质子化形式。至少两个R^2a、R^2b、R^2c和R^2d基团可以是或其质子化形式、并且R^2a、R^2b、R^2c和R^2d中的剩余部分是胍或其质子化形式。

R^2a、R^2b、R^2c和R^2d中的每一者可以独立地是2,3-二氨基丙酸、2,4-二氨基丁酸、鸟氨酸、赖氨酸、甲基赖氨酸、二甲基赖氨酸、三甲基赖氨酸、高赖氨酸、丝氨酸、高丝氨酸、苏氨酸、别苏氨酸、组氨酸、1-甲基组氨酸、2-氨丁二酸、天冬氨酸、谷氨酸或高谷氨酸的侧链。

AA_SC可以是其中t可以是0至5的整数。AA_SC可以是其中t可以是0到5的整数。t可以是1到5。t是2或3。t可以是2。t可以是3。

R^1a、R^1b和R^1c可以各自独立地是6至14元芳基。R^1a、R^1b和R^1c可以各自独立地是具有一个或多个选自N、O或S的杂原子的6至14元杂芳基。R^1a、R^1b和R^1c可以各自独立地选自苯基、萘基、蒽基、吡啶基、喹啉基或异喹啉基。R^1a、R^1b和R^1c可以各自独立地选自苯基、萘基或蒽基。R^1a、R^1b和R^1c可以各自独立地是苯基或萘基。R^1a、R^1b和R^1c可以各自独立地选自吡啶基、喹啉基或异喹啉基。

每个n’可以独立地是1或2。每个n’可以是1。每个n’可以是2。至少有一个n'可以是0。至少有一个n'可以是1。至少有一个n'可以是2。至少有一个n'可以是3。至少有一个n'可以是4。至少有一个n'可以是5。

每个n”可以独立地是1至3的整数。每个n”可以独立地是2或3。每个n”可以是2。每个n”可以是3。至少一个n”可以是0。至少一个n”可以是1。至少一个n”可以是2。至少一个n”可以是3。

每个n”可以独立地是1或2，每个n’可以独立地是2或3。每个n”可以是1，每个n’可以独立地是2或3。每个n”可以是1，每个n’可以是2。每个n”是1，并且每个n’是3。

式(II)的cCPP可以具有式(II-1)的结构：

其中R^1a、R^1b、R^1c、R^2a、R^2b、R^2c、R^2d、AA_SC、n’和n”如本文所定义。

式(II)的cCPP可以具有式(IIa)的结构：

其中R^1a、R^1b、R^1c、R^2a、R^2b、R^2c、R^2d、AA_SC和n’如本文所定义。

式(II)的cCPP可以具有式(IIb)的结构：

其中R^2a、R^2b、AA_SC和n’如本文所定义。

cCPP可以具有式(IIc)的结构：

或其质子化形式，

其中：

AA_SC和n’如本文所定义。

式(IIa)的cCPP具有以下结构之一：

其中AA_SC和n如本文所定义。式(IIa)的cCPP具有以下结构之一：

其中AA_SC和n如本文所定义式(IIa)的cCPP具有以下结构之一：

其中AA_SC和n如本文所定义。式(II)的cCPP可以具有以下结构：

式(II)的cCPP可以具有以下结构：

cCPP可以具有式(III)的结构：

其中：

AA_SC是氨基酸侧链；

R^1a、R^1b和R^1c各自独立地是6至14元芳基或6至14元杂芳基；

R^2a和R^2c各自独立地是H、或其质子化形式；

R^2b和R^2d各自独立地是胍或其质子化形式；

每个n”独立地是1至3的整数；

每个n’独立地是1至5的整数；并且

每个p’独立地是0至5的整数。

式(III)的cCPP可以具有式(III-1)的结构：

其中：

AA_SC、R^1a、R^1b、R^1c、R^2a、R^2c、R^2b、R^2d n’、n”和p’如本文所定义。式(III)的cCPP可以具有式(IIIa)的结构：

其中：

AA_SC、R^2a、R^2c、R^2b、R^2d n’、n”和p’如本文所定义。

在式(III)、式(III-1)和式(IIIa)中，R^a和R^c可以是H。R^a和R^c可以是H并且R^b和R^d可以各自独立地是胍或其质子化形式。R^a可以是H。R^b可以是H。p'可以是0。R^a和R^c可以是H且每个p’可以是0。

在式(III)、式(III-1)和式(IIIa)中，R^a和R^c可以是H，R^b和R^d可以各自独立地是胍或其质子化形式，n”可以是2或3，并且每个p’可以是0。

p'可以是0。p'可以是1。p'可以是2。p'可以是3。p’可以是4。p'可以是5。

cCPP可以具有以下结构：

式(A)的cCPP可选自：

CPP序列	SEQ ID NO:
		FΦRRRRQ	86
fΦRrRrQ	87
		FfΦRrRrQ	78
FfΦCit-r-Cit-rQ	79
		FfΦGrGrQ	80
FfΦRGRGQ	88
		FfFGRGRQ	81
FGFGRGRQ	82
		GfFGrGrQ	83
FGFGRRRQ	84
		FGFRRRRQ	85

在实施方案中，cCPP选自：

其中Φ＝L-萘丙氨酸；φ＝D-萘丙氨酸；Ω＝L-正亮氨酸

在实施方案中，cCPP不是选自：

其中Φ＝L-萘丙氨酸；φ＝D-萘丙氨酸；Ω＝L-正亮氨酸cCPP可以包含式(D)的结构：

或其质子化形式，其中：

R₁、R₂和R₃中的至少一者是氨基酸的芳族或杂芳族侧链；

R₄和R₆独立地是H或氨基酸侧链；

Y是

AA_SC是氨基酸侧链；

q是1、2、3或4；

每个m独立地是整数0、1、2或3，并且

每个n独立地是整数0、1、2或3。

式(D)的cCPP可以具有式(D-I)的结构：

或其质子化形式，

其中：

R₁、R₂和R₃中的至少一者是氨基酸的芳族或杂芳族侧链；

R₄和R₆独立地是H或氨基酸侧链；

AA_SC是氨基酸侧链；

q是1、2、3或4；

每个m独立地是整数0、1、2或3，并且

Y是

式(D)的cCPP可以具有式(D-II)的结构：

或其质子化形式，

其中：

R₁、R₂和R₃中的至少一者是氨基酸的芳族或杂芳族侧链；

R₄和R₆独立地是H或氨基酸侧链；

AA_SC是氨基酸侧链；

q是1、2、3或4；

每个m独立地是整数0、1、2或3，

每个m独立地是整数0、1、2或3，并且

Y是

式(D)的cCPP可以具有式(D-III)的结构：

或其质子化形式，

其中：

R₁、R₂和R₃中的至少一者是氨基酸的芳族或杂芳族侧链；

R₄和R₆独立地是H或氨基酸侧链；

AA_SC是氨基酸侧链；

q是1、2、3或4；

每个m独立地是整数0、1、2或3，

每个n独立地是整数0、1、2或3，并且

Y是

式(D)的cCPP可以具有式(D-IV)的结构：

或其质子化形式，

其中：

R₁、R₂和R₃中的至少一者是氨基酸的芳族或杂芳族侧链；

R₄和R₆独立地是H或氨基酸侧链；

AA_SC是氨基酸侧链；

q是1、2、3或4；

每个m独立地是整数0、1、2或3，并且

Y是

式(D)的cCPP可以具有式(D-V)的结构：

或其质子化形式，

其中：

R₁、R₂和R₃中的至少一者是氨基酸的芳族或杂芳族侧链；

R₄和R₆独立地是H或氨基酸侧链；

AA_SC是氨基酸侧链；

q是1、2、3或4；

每个m独立地是整数0、1、2或3，并且

Y是

AA_SC可以与接头缀合。

接头

本公开的cCPP可以与接头缀合。接头可以将货物与cCPP连接。接头可以附接到cCPP氨基酸的侧链上，并且货物可以附接到接头上的合适位置。

接头可以是任何适当的部分，其可以将cCPP缀合到一个或多个附加部分，例如环外肽(EP)和/或货物。在缀合到cCPP和一个或多个附加部分之前，接头具有两个或更多个官能团，每个官能团能够独立地与cCPP和一个或多个附加部分形成共价键。如果货物是寡核苷酸，则接头可以共价结合到货物的5’端或货物的3’端。接头可以共价结合到货物的5’端。接头可以共价结合到货物的3’端。如果货物是肽，则接头可以共价结合到货物的N-末端或C-末端。接头可以共价结合到寡核苷酸或肽货物的骨架上。接头可以是将本文所述的cCPP缀合到货物诸如寡核苷酸、肽或小分子上的任何适当部分。

接头可以包括烃接头。

接头可以包含裂解位点。裂解位点可以是二硫化物或半胱天冬酶裂解位点(例如，Val-Cit-PABC)。

接头可以包含：(i)一个或多个D或L氨基酸，每个氨基酸任选地被取代；(ii)任选取代的亚烷基；(iii)任选取代的亚烯基；(iv)任选取代的亚炔基；(v)任选取代的碳环基；(vi)任选取代的杂环基；(vii)一个或多个-(R^1-J-R²)z”-亚基，其中R¹和R²中的每一者在每种情况下独立地选自亚烷基、亚烯基、亚炔基、碳环基和杂环基，每个J独立地是C、NR³、-NR³C(O)-、S和O，其中R³独立地选自H、烷基、烯基、炔基、碳环基和杂环基，其中每一者任选地被取代，并且z”是1至50的整数；(viii)-(R^1-J)z”-或-(J-R¹)z”-，其中每个R¹在每种情况下独立地是亚烷基、亚烯基、亚炔基、碳环基或杂环基，每个J独立地是C、NR³、-NR³C(O)-、S或O，其中R³为H、烷基、烯基、炔基、碳环基或杂环基，其中每一者任选地被取代，并且z”是1至50的整数；或(ix)接头可包含(i)至(x)中的一者或多者。

接头可以包含一个或多个D或L氨基酸和/或-(R^1-J-R²)z”-，其中R¹和R²中的每一者在每种情况下各自独立地是亚烷基，每个J独立地是C、NR³、-NR³C(O)-、S和O，其中R⁴独立地选自H和烷基，并且z”是1至50的整数；或者它们的组合。

接头可以包含-(OCH₂CH₂)_z’-(例如，作为间隔区)，其中z’是1至23的整数，例如2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22或23。“-(OCH₂CH₂)z’也可称为聚乙二醇(PEG)。

接头可以包含一个或多个氨基酸。接头可以包含肽。接头可以包含-(OCH₂CH₂)_z’-和肽，其中z'是1至23的整数。该肽可以包含2至10个氨基酸。接头还可包含能够通过点击化学反应的官能团(FG)。FG可以是叠氮化物或炔烃，当货物与接头结合时，形成三唑。

接头可以包含(i)β丙氨酸残基和赖氨酸残基；(ii)-(J-R¹)z”；或(iii)它们的组合。每个R¹可以独立地是亚烷基、亚烯基、亚炔基、碳环基或杂环基，每个J独立地是C、NR³、-NR³C(O)-、S或O，其中R³是H、烷基、烯基、炔基、碳环基或杂环基，其中每一个任选地被取代，并且z”可以是1至50的整数。每个R¹可以是亚烷基，并且每个J可以是O。

接头可包含(i)β-丙氨酸、甘氨酸、赖氨酸、4-氨基丁酸、5-氨基戊酸、6-氨基己酸或它们的组合的残基；和(ii)-(R^1-J)z”-或-(J-R¹)z”。每个R¹可以独立地是亚烷基、亚烯基、亚炔基、碳环基或杂环基，每个J独立地是C、NR³、-NR³C(O)-、S或O，其中R³是H、烷基、烯基、炔基、碳环基或杂环基，其中每一个任选地被取代，并且z”可以是1至50的整数。每个R¹可以是亚烷基，并且每个J可以是O。接头可以包含甘氨酸、β-丙氨酸、4-氨基丁酸、5-氨基戊酸、6-氨基己酸或它们的组合。

接头可以是三价接头。接头可以具有以下结构：其中A₁、B₁和C₁可独立地是烃接头(例如，NRH-(CH₂)_n-COOH)、PEG接头(例如，NRH-(CH₂O)_n-COOH，其中R是H、甲基或乙基)或一个或多个氨基酸残基，并且Z独立地是保护基团。接头还可以掺入裂解位点，包括二硫化物[NH₂-(CH₂O)_n-S-S-(CH₂O)_n-COOH]或半胱天冬酶裂解位点(Val-Cit-PABC)。

烃可以是甘氨酸或β-丙氨酸的残基。

接头可以是二价的，并将cCPP连接到货物上。接头可以是二价的，并将cCPP连接到环外肽(EP)上。

接头可以是三价的，并将cCPP连接到货物和EP上。

接头可以是二价或三价C₁-C₅₀亚烷基，其中1-25个亚甲基任选且独立地被-N(H)-、-N(C₁-C₄烷基)-、-N(环烷基)-、-O-、-C(O)-、-C(O)O-、-S-、-S(O)-、-S(O)₂-、-S(O)₂N(C₁-C₄烷基)-、-S(O)₂N(环烷基)-、-N(H)C(O)-、-N(C₁-C₄烷基)C(O)-、-N(环烷基)C(O)-、-C(O)N(H)-、-C(O)N(C₁-C₄烷基)、-C(O)N(环烷基)、芳基、杂环基、杂芳基、环烷基或环烯基。接头可以是二价或三价C₁-C₅₀亚烷基，其中1-25个亚甲基基团任选且独立地被-N(H)-、-O-、-C(O)N(H)-或它们的组合置换。

接头可以具有以下结构：

其中：每个AA独立地是氨基酸残基；*是与AA_SC的附接点，并且AA_SC是cCPP的氨基酸残基的侧链；x是1-10的整数；y是1-5的整数；并且z是1-10的整数。x可以是1-5的整数。x可以是1-3的整数。x可以是1。y可以是2-4的整数。y可以是4。z可以是1-5的整数。z可以是1-3的整数。z可以是1。每个AA可以独立地选自甘氨酸、β-丙氨酸、4-氨基丁酸、5-氨基戊酸和6-氨基己酸。

cCPP可以通过接头(“L”)附接到货物上。接头可以通过键合基团(“M”)与货物缀合。

接头可以具有以下结构：

其中：x是1-10的整数；y是1-5的整数；z是1-10的整数；每个AA独立地是氨基酸残基；*是与AA_SC的附接点，并且AA_SC是cCPP的氨基酸残基的侧链；并且M是本文定义的键合基团。

接头可以具有以下结构：

其中：x’是1-23的整数；y是1-5的整数；z’是1-23的整数；*是与AA_SC的附接点，并且AA_SC是cCPP的氨基酸残基的侧链；并且M是本文定义的键合基团。

接头可以具有以下结构：

其中：x’是1-23的整数；y是1-5的整数；并且z’是1-23的整数；*是与AA_SC的附接点，并且AA_SC是cCPP的氨基酸残基的侧链。

x可以是1至10的整数，例如1、2、3、4、5、6、7、8、9或10，包括其间的所有范围和子范围。

x’可以是1至23的整数，例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22或23，包括其间的所有范围和子范围。x’可以是5至15的整数。x’可以是9至13的整数。x’可以是1至5的整数。x’可以是1。

y可以是1至5的整数，例如1、2、3、4或5，包括其间的所有范围和子范围。y可以是2至5的整数。y可以是3至5的整数。y可以是3或4。y可以是4或5。y可以是3。y可以是4。y可以是5。

z可以是1至10的整数，例如1、2、3、4、5、6、7、8、9或10，包括其间的所有范围和子范围。

z’可以是1至23的整数，例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22或23，包括其间的所有范围和子范围。z’可以是5至15的整数。z’可以是9至13的整数。z'可以是11。

如上所述，接头或M(其中M是接头的一部分)可以在货物上任何合适的位置与货物共价结合。接头或M(其中M是接头的一部分)可以共价结合到寡核苷酸货物的3’端或寡核苷酸货物的5’端。接头或M(其中M是接头的一部分)可以共价结合到肽货物的N-末端或C-末端。接头或M(其中M是接头的一部分)可以共价结合到寡核苷酸或肽货物的骨架上。

接头可以结合到cCPP上的天冬氨酸、谷氨酸、谷氨酰胺、天冬酰胺或赖氨酸的侧链，或者谷氨酰胺或天冬酰胺的经修饰的侧链(例如，具有氨基的还原侧链)。接头可以结合到cCPP上赖氨酸的侧链上。

接头可以结合到肽货物上的天冬氨酸、谷氨酸、谷氨酰胺、天冬酰胺或赖氨酸的侧链，或者谷氨酰胺或天冬酰胺的经修饰的侧链(例如，具有氨基的还原侧链)。接头可以结合到肽货物上赖氨酸的侧链上。

接头可以具有以下结构：

其中

M是将L缀合到货物例如寡核苷酸上的基团；

AA_s是cCPP上氨基酸的侧链或末端；

每个AA_x独立地是氨基酸残基；

o是0至10的整数；并且

p是0到5的整数。

接头可以具有以下结构：

其中

M是将L缀合到货物例如寡核苷酸上的基团；

AA_s是cCPP上氨基酸的侧链或末端；

每个AA_x独立地是氨基酸残基；

o是0至10的整数；并且

p是0到5的整数。

M可以包括亚烷基、亚烯基、亚炔基、碳环基或杂环基，其中的每一个任选地被取代。M可选自：

其中R是烷基、烯基、炔基、碳环基或杂环基。

M可选自：

其中：R¹⁰是亚烷基、环烷基或其中a是0至10。

M可以是R¹⁰可以是并且a是0至10。M可以是

M可以是异双官能交联剂，例如其公开于Williams等人Curr.Protoc Nucleic Acid Chem.2010,42,4.41.1-4.41.20，其通过引用整体并入本文。

M可以是-C(O)-。

AA_s可以是cCPP上氨基酸的侧链或末端。AA_s的非限制性实例包括天冬氨酸、谷氨酸、谷氨酰胺、天冬酰胺或赖氨酸，或者谷氨酰胺或天冬酰胺的经修饰的侧链(例如，具有氨基的还原侧链)。AA_s可以是本文定义的AA_SC。

每个AA_x独立地是天然或非天然氨基酸。一个或多个AA_x可以是天然氨基酸。一个或多个AA_x可以是非天然氨基酸。一个或多个AA_x可以是β-氨基酸。β-氨基酸可以是β-丙氨酸。

o可以是0至10的整数，例如0、1、2、3、4、5、6、7、8、9和10。o可以是0、1、2或3。o可以是0。o可以是1。o可以是2。o可以是3。

p可以是0至5，例如0、1、2、3、4或5。p可以是0。p可以是1。p可以是2。p可以是3。p可以是4。p可以是5。

接头可以具有以下结构：

其中M、AA_s、每个-(R^1-J-R²)z”-、o和z”在本文中定义；r可以是0或1。

r可以是0。r可以是1。

接头可以具有以下结构：

其中M、AA_s、o、p、q、r和z”中的每一者可以如本文所定义。

z”可以是1至50的整数，例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49和50，包括其间的所有范围和数值。z”可以是5至20的整数。z”可以是10至15的整数。

接头可以具有以下结构：

其中：

M、AA_s和o如本文所定义。

合适的接头的其他非限制性实例包括：

其中M和AA_s如本文所定义。

本文提供了包含cCPP和AC，还包含L的化合物，所述AC与前体mRNA序列中的靶标互补，其中接头通过键合基团(M)与AC缀合，其中M是

本文提供了包含cCPP和货物的化合物，所述货物包含与前体mRNA序列中的靶标互补的反义化合物(AC)，例如反义寡核苷酸，其中所述化合物还包含L，其中所述接头通过键合基团(M)与AC缀合，其中M选自：其中：R¹是亚烷基、环烷基或其中t’是0至10，其中每个R独立地是烷基、烯基、炔基、碳环基或杂环基，其中R¹是并且t’是2。

接头可以具有以下结构：

其中AA_s如本文所定义，并且m’是0-10。

接头可以具有下式：

接头可以具有下式：其中“碱基”是货物磷酰二胺吗啉代寡聚物3’端的核碱基。

接头可以具有下式：

其中“碱基”对应于磷酰二胺吗啉代寡聚物3’端的核碱基。

接头可以具有下式：

其中“碱基”是磷酰二胺吗啉代寡聚物3’端的核碱基。

接头可以具有下式：

接头可以共价结合到货物上任何合适的位置。接头共价结合到货物的3’端或寡核苷酸货物的5’端。接头可以共价结合到货物的骨架上。

cCPP-接头缀合物

cCPP可以与本文定义的接头缀合。接头可以与本文定义的cCPP的AA_SC缀合。

接头可以包含-(OCH₂CH₂)_z’-亚基(例如，作为间隔区)，其中z’是1至23的整数，例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22或23。“-(OCH₂CH₂)_z’也称为PEG。cCPP-接头缀合物可以具有选自表7的结构：

表7：cCPP-接头缀合物和SEQ ID NO

环(FfФ-4gp-r-4gp-rQ)-PEG₄-K-NH₂	环(SEQ ID NO:118)-PEG₄-K-NH₂
		环(FfФ-Cit-r-Cit-rQ)-PEG₄-K-NH₂	环(SEQ ID NO:119)-PEG₄-K-NH₂
环(FfФ-Pia-r-Pia-rQ)-PEG₄-K-NH₂	环(SEQ ID NO:120)-PEG₄-K-NH₂
		环(FfФ-Dml-r-Dml-rQ)-PEG₄-K-NH₂	环(SEQ ID NO:121)-PEG₄-K-NH₂
环(FfФ-Cit-r-Cit-rQ)-PEG₁₂-OH	环(SEQ ID NO:122)-PEG₁₂-OH
		环(fФR-Cit-R-Cit-Q)-PEG₁₂-OH	环(SEQ ID NO:123)-PEG₁₂-OH

接头可以包含-(OCH₂CH₂)_z’-亚基和肽亚基，其中z'是1至23的整数。肽亚基可以包含2至10个氨基酸。cCPP-接头缀合物可以具有选自表8的结构：

表8：cCPP-接头缀合物和SEQ ID NO

提供了包含环状细胞穿透肽(cCPP)、接头和环外肽(EP)的EEV。EEV可以包含式(B)的结构：

或其质子化形式，

其中：

R₁、R₂和R₃各自独立地是H或氨基酸的芳族或杂芳族侧链；

R₄和R₇独立地是H或氨基酸侧链；

EP是如本文定义的环外肽；

每个m独立地是0至3的整数；

n是0至2的整数；

x’是1-20的整数；

y是1至5的整数；

q是1-4；并且

z’是1至23的整数。

R₁、R₂、R₃、R₄、R₇、EP、m、q、y、x’、z’如本文所定义。

n可以是0。n可以是1。n可以是2。

EEV可以包含式(B-a)或式(B-b)的结构：

或其质子化形式，其中EP、R¹、R²、R³、R⁴、m和z’如以上式(B)中所定义。

EEV可以包含式(B-c)的结构：

或其质子化形式，其中EP、R¹、R²、R³、R⁴和m如以上式(B)中所定义；AA是如本文定义的氨基酸；M如本文所定义；n是0-2的整数；x是1-10的整数；y是1-5的整数；并且z是1-10的整数。

EEV可以具有式(B-1)、式(B-2)、式(B-3)或式(B-4)的结构：

或其质子化形式，其中EP如以上式(B)中所定义。

EEV可以包含式(B)并且可以具有以下结构：Ac-PKKKRKVAEEA-K(环[FGFGRGRQ])-PEG₁₂-OH(Ac-SEQ ID NO:132-K(环[SEQ ID NO:82])-PEG₁₂-OH)或Ac-PK-KKR-KV-AEEA-K(环[GfFGrGrQ])-PEG₁₂-OH(Ac-SEQ ID NO:133-K(环[SEQ ID NO:83])-PEG₁₂-OH)。

EEV可以包含下式的cCPP：

EEV可以包括下式：Ac-PKKKRKV-miniPEG₂-Lys(环(FfFGRGRQ)-PEG₂-K(N₃)(Ac-SEQID NO:42-miniPEG₂-Lys(环(SEQ ID NO:81)-PEG₂-K(N₃))。

EEV可以是：

EEV可以是

EEV可为Ac-P-K(Tfa)-K(Tfa)-K(Tfa)-R-K(Tfa)-V-miniPEG₂-K(环(Ff-Nal-GrGrQ)-PEG₁₂-OH(Ac-SEQ ID NO:134-miniPEG₂-K(环(SEQ ID NO:135)-PEG₁₂-OH)。

EEV可以是

EEV可为Ac-P-K-K-K-R-K-V-miniPEG₂-K(环(Ff-Nal-GrGrQ)-PEG₁₂-OH(Ac-SEQ IDNO:42-miniPEG₂-K(环(SEQ ID NO:135)-PEG₁₂-OH)。

EEV可以是

EEV可以是：

EEV可以是

EEV可以选自

EEV可选自:

Ac-PKKKRKV-Lys(环[FfΦGrGrQ])-PEG₁₂-K(N₃)-NH₂

(Ac-SEQ ID NO:42-Lys(环[SEQ ID NO:80])-PEG₁₂-K(N₃)-NH₂)Ac-PKKKRKV-miniPEG₂-Lys(环[FfΦGrGrQ])-miniPEG₂-K(N₃)-NH₂

(Ac-SEQ ID NO:42-miniPEG₂-Lys(环[SEQ ID NO:80])-miniPEG₂-K(N₃)-NH₂)

Ac-PKKKRKV-miniPEG₂-Lys(环[FGFGRGRQ])-miniPEG₂-K(N₃)-NH₂

(Ac-SEQ ID NO:42-miniPEG₂-Lys(环[SEQ ID NO:82])-miniPEG₂-K(N₃)-NH₂)

Ac-KR-PEG₂-K(环[FGFGRGRQ])-PEG₂-K(N₃)-NH₂

(Ac-KR-PEG₂-K(环[SEQ ID NO:82])-PEG₂-K(N₃)-NH₂)Ac-PKKKGKV-PEG₂-K(环[FGFGRGRQ])-PEG₂-K(N₃)-NH₂

(Ac-SEQ ID NO:46-PEG₂-K(环[SEQ ID NO:82])-PEG₂-K(N₃)-NH₂)Ac-PKKKRKG-PEG₂-K(环[FGFGRGRQ])-PEG₂-K(N₃)-NH₂

(Ac-SEQ ID NO:48-PEG₂-K(环[SEQ ID NO:82])-PEG₂-K(N₃)-NH₂)Ac-KKKRK-PEG₂-K(环[FGFGRGRQ])-PEG₂-K(N₃)-NH₂

(Ac-SEQ ID NO:19-PEG₂-K(环[SEQ ID NO:82])-PEG₂-K(N₃)-NH₂)Ac-PKKKRKV-miniPEG₂-Lys(环[FFΦGRGRQ])-miniPEG₂-K(N₃)-NH₂

(Ac-SEQ ID NO:42-miniPEG₂-Lys(环[SEQ ID NO:80])-miniPEG₂-K(N₃)-NH₂)

Ac-PKKKRKV-miniPEG₂-Lys(环[βhFfΦGrGrQ])-miniPEG₂-K(N₃)-NH₂

(Ac-SEQ ID NO:42-miniPEG₂-Lys(环[SEQ ID NO:142])-miniPEG₂-K(N₃)-NH₂)

Ac-PKKKRKV-miniPEG₂-Lys(环[FfΦSrSrQ])-miniPEG₂-K(N₃)-NH₂

(Ac-SEQ ID NO:42-miniPEG₂-Lys(环[SEQ ID NO:143])-miniPEG₂-K(N₃)-NH₂)。

EEV可选自:

Ac-PKKKRKV-miniPEG₂-Lys(环(GfFGrGrQ])-PEG₁₂-OH

(Ac-SEQ ID NO:42-miniPEG₂-Lys(环(SEQ ID NO:133])-PEG₁₂-OH)Ac-PKKKRKV-miniPEG₂-Lys(环[FGFKRKRQ])-PEG₁₂-OH

(Ac-SEQ ID NO:42-miniPEG₂-Lys(环[SEQ ID NO:144])-PEG₁₂-OH)Ac-PKKKRKV-miniPEG₂-Lys(环[FGFRGRGQ])-PEG₁₂-OH

(Ac-SEQ ID NO:42-miniPEG₂-Lys(环[SEQ ID NO:145])-PEG₁₂-OH)Ac-PKKKRKV-miniPEG₂-Lys(环[FGFGRGRGRQ])-PEG₁₂-OH

(Ac-SEQ ID NO:42-miniPEG₂-Lys(环[SEQ ID NO:146])-PEG₁₂-OH)Ac-PKKKRKV-miniPEG₂-Lys(环[FGFGRrRQ])-PEG₁₂-OH

(Ac-SEQ ID NO:42-miniPEG₂-Lys(环[SEQ ID NO:147])-PEG₁₂-OH)Ac-PKKKRKV-miniPEG₂-Lys(环[FGFGRRRQ])-PEG₁₂-OH

(Ac-SEQ ID NO:42-miniPEG₂-Lys(环[SEQ ID NO:84])-PEG₁₂-OH)和Ac-PKKKRKV-miniPEG₂-Lys(环[FGFRRRRQ])-PEG₁₂-OH

(Ac-SEQ ID NO:42-miniPEG₂-Lys(环[SEQ ID NO:85])-PEG₁₂-OH)。

EEV可选自:

Ac-K-K-K-R-K-G-miniPEG₂-K(环[FGFGRGRQ])-PEG₁₂-OH

(Ac-SEQ ID NO:148-miniPEG₂-K(环[SEQ ID NO:82])-PEG₁₂-OH)Ac-K-K-K-R-K-miniPEG₂-K(环[FGFGRGRQ])-PEG₁₂-OH

(Ac-SEQ ID NO:19-miniPEG₂-K(环[SEQ ID NO:82])-PEG₁₂-OH)Ac-K-K-R-K-K-PEG₄-K(环[FGFGRGRQ])-PEG₁₂-OH

(Ac-SEQ ID NO:22-PEG₄-K(环[SEQ ID NO:82])-PEG₁₂-OH)Ac-K-R-K-K-K-PEG₄-K(环[FGFGRGRQ])-PEG₁₂-OH

(Ac-SEQ ID NO:21-PEG₄-K(环[SEQ ID NO:82])-PEG₁₂-OH)Ac-K-K-K-K-R-PEG₄-K(环[FGFGRGRQ])-PEG₁₂-OH

(Ac-SEQ ID NO:23-PEG₄-K(环[SEQ ID NO:82])-PEG₁₂-OH)Ac-R-K-K-K-K-PEG₄-K(环[FGFGRGRQ])-PEG₁₂-OH

(Ac-SEQ ID NO:20-PEG₄-K(环[SEQ ID NO:82])-PEG₁₂-OH)和Ac-K-K-K-R-K-PEG₄-K(环[FGFGRGRQ])-PEG₁₂-OH

(Ac-SEQ ID NO:19-PEG₄-K(环[SEQ ID NO:82])-PEG₁₂-OH)。

EEV可选自:

Ac-PKKKRKV-PEG₂-K(环[FGFGRGRQ])-PEG₂-K(N₃)-NH₂

(Ac-SEQ ID NO:42-PEG₂-K(环[SEQ ID NO:82])-PEG₂-K(N₃)-NH₂)Ac-PKKKRKV-PEG₂-K(环[FGFGRGRQ])-PEG₁₂-OH

(Ac-SEQ ID NO:42-PEG₂-K(环[SEQ ID NO:82])-PEG₁₂-OH)Ac-PKKKRKV-PEG₂-K(环[GfFGrGrQ])-PEG₂-K(N₃)-NH₂

(Ac-SEQ ID NO:42-PEG₂-K(环[SEQ ID NO:133])-PEG₂-K(N₃)-NH₂)和Ac-PKKKRKV-PEG₂-K(环[GfFGrGrQ])-PEG₁₂-OH

(Ac-SEQ ID NO:42-PEG₂-K(环[SEQ ID NO:133])-PEG₁₂-OH)。

货物可以是AC并且EEV可以选自：

Ac-PKKKRKV-PEG₂-K(环[FfΦGrGrQ])-PEG₁₂-OH

(Ac-SEQ ID NO:42-PEG₂-K(环[SEQ ID NO:80])-PEG₁₂-OH)

Ac-PKKKRKV-PEG₂-K(环[FfΦCit-r-Cit-rQ])-PEG₁₂-OH

(Ac-SEQ ID NO:42-PEG₂-K(环[SEQ ID NO:79])-PEG₁₂-OH)

Ac-PKKKRKV-PEG₂-K(环[FfFGRGRQ])-PEG₁₂-OH

(Ac-SEQ ID NO:42-PEG₂-K(环[SEQ ID NO:81])-PEG₁₂-OH)

Ac-PKKKRKV-PEG₂-K(环[FGFGRGRQ])-PEG₁₂-OH

(Ac-SEQ ID NO:42-PEG₂-K(环[SEQ ID NO:82])-PEG₁₂-OH)

Ac-PKKKRKV-PEG₂-K(环[GfFGrGrQ])-PEG₁₂-OH

(Ac-SEQ ID NO:42-PEG₂-K(环[SEQ ID NO:133])-PEG₁₂-OH)

Ac-PKKKRKV-PEG₂-K(环[FGFGRRRQ])-PEG₁₂-OH

(Ac-SEQ ID NO:42-PEG₂-K(环[SEQ ID NO:84])-PEG₁₂-OH)

Ac-PKKKRKV-PEG₂-K(环[FGFRRRRQ])-PEG₁₂-OH

(Ac-SEQ ID NO:42-PEG₂-K(环[SEQ ID NO:85])-PEG₁₂-OH)

Ac-rr-PEG₂-K(环[FfΦGrGrQ])-PEG₁₂-OH

(Ac-rr-PEG₂-K(环[SEQ ID NO:80])-PEG₁₂-OH)

Ac-rr-PEG₂-K(环[FfΦCit-r-Cit-rQ])-PEG₁₂-OH

(Ac-rr-PEG₂-K(环[SEQ ID NO:79])-PEG₁₂-OH)

Ac-rr-PEG₂-K(环[FfF-GRGRQ])-PEG₁₂-OH

(Ac-rr-PEG₂-K(环[SEQ ID NO:81])-PEG₁₂-OH)

Ac-rr-PEG₂-K(环[FGFGRGRQ])-PEG₁₂-OH

(Ac-rr-PEG₂-K(环[SEQ ID NO:82])-PEG₁₂-OH)

Ac-rr-PEG₂-K(环[GfFGrGrQ])-PEG₁₂-OH

(Ac-rr-PEG₂-K(环[SEQ ID NO:133])-PEG₁₂-OH)

Ac-rr-PEG₂-K(环[FGFGRRRQ])-PEG₁₂-OH

(Ac-rr-PEG₂-K(环[SEQ ID NO:84])-PEG₁₂-OH)

Ac-rr-PEG₂-K(环[FGFRRRRQ])-PEG₁₂-OH

(Ac-rr-PEG₂-K(环[SEQ ID NO:85])-PEG₁₂-OH)

Ac-rrr-PEG₂-K(环[FfΦGrGrQ])-PEG₁₂-OH

(Ac-rrr-PEG₂-K(环[SEQ ID NO:80])-PEG₁₂-OH)

Ac-rrr-PEG₂-K(环[FfΦCit-r-Cit-rQ])-PEG₁₂-OH

(Ac-rrr-PEG₂-K(环[SEQ ID NO:79])-PEG₁₂-OH)

Ac-rrr-PEG₂-K(环[FfFGRGRQ])-PEG₁₂-OH

(Ac-rrr-PEG₂-K(环[SEQ ID NO:81])-PEG₁₂-OH)

Ac-rrr-PEG₂-K(环[FGFGRGRQ])-PEG₁₂-OH

(Ac-rrr-PEG₂-K(环[SEQ ID NO:82])-PEG₁₂-OH)

Ac-rrr-PEG₂-K(环[GfFGrGrQ])-PEG₁₂-OH

(Ac-rrr-PEG₂-K(环[SEQ ID NO:133])-PEG₁₂-OH)

Ac-rrr-PEG₂-K(环[FGFGRRRQ])-PEG₁₂-OH

(Ac-rrr-PEG₂-K(环[SEQ ID NO:84])-PEG₁₂-OH)

Ac-rrr-PEG₂-K(环[FGFRRRRQ])-PEG₁₂-OH

(Ac-rrr-PEG₂-K(环[SEQ ID NO:85])-PEG₁₂-OH)

Ac-rhr-PEG₂-K(环[FfΦGrGrQ])-PEG₁₂-OH

(Ac-rhr-PEG₂-K(环[SEQ ID NO:80])-PEG₁₂-OH)

Ac-rhr-PEG₂-K(环[FfΦCit-r-Cit-rQ])-PEG₁₂-OH

(Ac-rhr-PEG₂-K(环[SEQ ID NO:79])-PEG₁₂-OH)

Ac-rhr-PEG₂-K(环[FfFGRGRQ])-PEG₁₂-OH

(Ac-rhr-PEG₂-K(环[SEQ ID NO:81])-PEG₁₂-OH)

Ac-rhr-PEG₂-K(环[FGFGRGRQ])-PEG₁₂-OH

(Ac-rhr-PEG₂-K(环[SEQ ID NO:82])-PEG₁₂-OH)

Ac-rhr-PEG₂-K(环[GfFGrGrQ])-PEG₁₂-OH

(Ac-rhr-PEG₂-K(环[SEQ ID NO:133])-PEG₁₂-OH)

Ac-rhr-PEG₂-K(环[FGFGRRRQ])-PEG₁₂-OH

(Ac-rhr-PEG₂-K(环[SEQ ID NO:84])-PEG₁₂-OH)

Ac-rhr-PEG₂-K(环[FGFRRRRQ])-PEG₁₂-OH

(Ac-rhr-PEG₂-K(环[SEQ ID NO:85])-PEG₁₂-OH)

Ac-rbr-PEG₂-K(环[FfΦGrGrQ])-PEG₁₂-OH

(Ac-rbr-PEG₂-K(环[SEQ ID NO:80])-PEG₁₂-OH)

Ac-rbr-PEG₂-K(环[FfΦCit-r-Cit-rQ])-PEG₁₂-OH

(Ac-rbr-PEG₂-K(环[SEQ ID NO:79])-PEG₁₂-OH)

Ac-rbr-PEG₂-K(环[FfFGRGRQ])-PEG₁₂-OH

(Ac-rbr-PEG₂-K(环[SEQ ID NO:81])-PEG₁₂-OH)

Ac-rbr-PEG₂-K(环[FGFGRGRQ])-PEG₁₂-OH

(Ac-rbr-PEG₂-K(环[SEQ ID NO:82])-PEG₁₂-OH)

Ac-rbr-PEG₂-K(环[GfFGrGrQ])-PEG₁₂-OH

(Ac-rbr-PEG₂-K(环[SEQ ID NO:133])-PEG₁₂-OH)

Ac-rbr-PEG₂-K(环[FGFGRRRQ])-PEG₁₂-OH

(Ac-rbr-PEG₂-K(环[SEQ ID NO:84])-PEG₁₂-OH)

Ac-rbr-PEG₂-K(环[FGFRRRRQ])-PEG₁₂-OH

(Ac-rbr-PEG₂-K(环[SEQ ID NO:85])-PEG₁₂-OH)

Ac-rbrbr-PEG₂-K(环[FfΦGrGrQ])-PEG₁₂-OH

(Ac-SEQ ID NO:138-PEG₂-K(环[SEQ ID NO:80])-PEG₁₂-OH)

Ac-rbrbr-PEG₂-K(环[FfΦCit-r-Cit-rQ])-PEG₁₂-OH

(Ac-SEQ ID NO:138-PEG₂-K(环[SEQ ID NO:79])-PEG₁₂-OH)

Ac-rbrbr-PEG₂-K(环[FfFGRGRQ])-PEG₁₂-OH

(Ac-SEQ ID NO:138-PEG₂-K(环[SEQ ID NO:81])-PEG₁₂-OH)

Ac-rbrbr-PEG₂-K(环[FGFGRGRQ])-PEG₁₂-OH

(Ac-SEQ ID NO:138-PEG₂-K(环[SEQ ID NO:82])-PEG₁₂-OH)

Ac-rbrbr-PEG₂-K(环[GfFGrGrQ])-PEG₁₂-OH

(Ac-SEQ ID NO:138-PEG₂-K(环[SEQ ID NO:133])-PEG₁₂-OH)

Ac-rbrbr-PEG₂-K(环[FGFGRRRQ])-PEG₁₂-OH

(Ac-SEQ ID NO:138-PEG₂-K(环[SEQ ID NO:84])-PEG₁₂-OH)

Ac-rbrbr-PEG₂-K(环[FGFRRRRQ])-PEG₁₂-OH

(Ac-SEQ ID NO:138-PEG₂-K(环[SEQ ID NO:85])-PEG₁₂-OH)

Ac-rbhbr-PEG₂-K(环[FfΦGrGrQ])-PEG₁₂-OH

(Ac-SEQ ID NO:149-PEG₂-K(环[SEQ ID NO:80])-PEG₁₂-OH)

Ac-rbhbr-PEG₂-K(环[FfΦCit-r-Cit-rQ])-PEG₁₂-OH

(Ac-SEQ ID NO:149-PEG₂-K(环[SEQ ID NO:79])-PEG₁₂-OH)

Ac-rbhbr-PEG₂-K(环[FfFGRGRQ])-PEG₁₂-OH

(Ac-SEQ ID NO:149-PEG₂-K(环[SEQ ID NO:81])-PEG₁₂-OH)

Ac-rbhbr-PEG₂-K(环[FGFGRGRQ])-PEG₁₂-OH

(Ac-SEQ ID NO:149-PEG₂-K(环[SEQ ID NO:82])-PEG₁₂-OH)

Ac-rbhbr-PEG₂-K(环[GfFGrGrQ])-PEG₁₂-OH

(Ac-SEQ ID NO:149-PEG₂-K(环[SEQ ID NO:133])-PEG₁₂-OH)

Ac-rbhbr-PEG₂-K(环[FGFGRRRQ])-PEG₁₂-OH

(Ac-SEQ ID NO:149-PEG₂-K(环[SEQ ID NO:84])-PEG₁₂-OH)

Ac-rbhbr-PEG₂-K(环[FGFRRRRQ])-PEG₁₂-OH

(Ac-SEQ ID NO:149-PEG₂-K(环[SEQ ID NO:85])-PEG₁₂-OH)

Ac-hbrbh-PEG₂-K(环[FfΦGrGrQ])-PEG₁₂-OH

(Ac-SEQ ID NO:141-PEG₂-K(环[SEQ ID NO:80])-PEG₁₂-OH)

Ac-hbrbh-PEG₂-K(环[FfΦCit-r-Cit-rQ])-PEG₁₂-OH

(Ac-SEQ ID NO:141-PEG₂-K(环[SEQ ID NO:79])-PEG₁₂-OH)

Ac-hbrbh-PEG₂-K(环[FfFGRGRQ])-PEG₁₂-OH

(Ac-SEQ ID NO:141-PEG₂-K(环[SEQ ID NO:81])-PEG₁₂-OH)

Ac-hbrbh-PEG₂-K(环[FGFGRGRQ])-PEG₁₂-OH

(Ac-SEQ ID NO:141-PEG₂-K(环[SEQ ID NO:82])-PEG₁₂-OH)

Ac-hbrbh-PEG₂-K(环[GfFGrGrQ])-PEG₁₂-OH

(Ac-SEQ ID NO:141-PEG₂-K(环[SEQ ID NO:133])-PEG₁₂-OH)

Ac-hbrbh-PEG₂-K(环[FGFGRRRQ])-PEG₁₂-OH

(Ac-SEQ ID NO:141-PEG₂-K(环[SEQ ID NO:84])-PEG₁₂-OH)

Ac-hbrbh-PEG₂-K(环[FGFRRRRQ])-PEG₁₂-OH

(Ac-SEQ ID NO:141-PEG₂-K(环[SEQ ID NO:85])-PEG₁₂-OH),

其中b是β-丙氨酸，并且环外序列可以是D或L立体化学。

货物

细胞穿透肽(CPP)，诸如环状细胞穿透肽(例如cCPP)，可以与货物缀合。如本文所用，“货物”是期望递送到细胞中的化合物或部分。货物可以与接头的末端羰基缀合。环肽的至少一个原子可以被货物置换，或者至少一个孤对可以与货物形成键。货物可以通过接头与cCPP缀合。货物可以通过接头与AA_SC缀合。cCPP的至少一个原子可以被货物置换，或者cCPP的至少一个孤对与货物形成键。cCPP的氨基酸侧链上的羟基可以被与货物的键置换。cCPP的谷氨酰胺侧链上的羟基可以被与货物的键置换。货物可以通过接头与cCPP缀合。货物可以通过接头与AA_SC缀合。

在实施方案中，氨基酸侧链包含与接头或货物缀合的化学反应基团。化学反应基团可以包括胺基、羧酸、酰胺、羟基、巯基、胍基、酚基、硫醚基、咪唑基或吲哚基。在实施方案中，与货物缀合的cCPP的氨基酸包括赖氨酸、精氨酸、天冬氨酸、谷氨酸、天冬酰胺、谷氨酰胺、高谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸、精氨酸、酪氨酸、蛋氨酸、组氨酸或色氨酸。

货物可以包括一个或多个可检测部分、一个或多个治疗部分(TM)、一个或多个靶向部分或其任意组合。在实施方案中，货物包括TM。在实施方案中，货物包括AC。

与货物部分缀合的环状细胞穿透肽(cCPP)

环状细胞穿透肽(cCPP)可以与货物部分缀合。

货物部分可以在末端羰基与接头缀合，以提供以下结构：

其中：

EP是环外肽，并且M、AA_SC、货物、x’、y和z’如上所定义，*是与AA_SC的附接点。x’可以是1。y可以是4。z'可以是11。-(OCH₂CH₂)_x’-和/或-(OCH₂CH₂)_z’-可以独立地被一种或多种氨基酸置换，包括例如甘氨酸、β-丙氨酸、4-氨基丁酸、5-氨基戊酸、6-氨基己酸或它们的组合。

内体逃逸载体(EEV)可以包含环状细胞穿透肽(cCPP)、环外肽(EP)和接头，并且可以与货物缀合以形成包含式(C)的结构的EEV缀合物：

或其质子化形式，

其中：

R₄是H或氨基酸侧链；

EP是如本文定义的环外肽；

货物是如本文定义的部分；

每个m独立地是0至3的整数；

n是0至2的整数；

x’是2-20的整数；

y是1至5的整数；

q是1至-4的整数；并且

z’是2至-20的整数。

R₁、R₂、R₃、R₄、EP、货物、m、n、x’、y、q和z’如本文所定义。

EEV可以与货物缀合，EEV缀合物可以包含式(C-a)或式(C-b)的结构：

或其质子化形式，其中EP、m和z如以上式(C)中所定义。

EEV可以与货物缀合，EEV缀合物可以包含式(C-c)的结构：

或其质子化形式，其中EP、R¹、R²、R³、R⁴和m如以上式(III)中所定义；AA可以是如本文定义的氨基酸；n可以是0-2的整数；x可以是1-10的整数；y可以是1-5的整数；并且z可以是1-10的整数。

EEV可以与寡核苷酸货物缀合，并且EEV-寡核苷酸缀合物可以包含式(C-1)、式(C-2)、式(C-3)或式(C-4)的结构：

EEV可以与寡核苷酸货物缀合，并且EEV缀合物可以包括以下结构：

胞质递送效率

对环状细胞穿透肽(cCPP)的修饰可以提高胞质递送效率。通过比较具有经修饰的序列与对照序列的cCPP的胞质递送效率，可以测量提高的胞质摄取效率。对照序列不包括经修饰的序列中的特定置换氨基酸残基(包括但不限于精氨酸、苯丙氨酸和/或甘氨酸)，但在其他方面是相同的。

如本文所用，胞质递送效率是指cCPP穿过细胞膜并进入细胞胞质溶胶的能力。cCPP的胞质递送效率不一定依赖于受体或细胞类型。胞质递送效率可以指绝对胞质递送效率或相对胞质递送效率。

绝对胞质递送效率是生长培养基中cCPP(或cCPP-货物缀合物)的胞质浓度与cCPP(或cCPP-货物缀合物)的浓度之比。相对胞质递送效率是指与胞质溶胶中对照cCPP的浓度相比，胞质溶胶中cCPP的浓度。定量可以通过荧光标记cCPP(例如，用FITC染料)并使用本领域熟知的技术测量荧光强度来实现。

通过比较(i)某一细胞类型(例如，HeLa细胞)内化的本发明cCPP的量与(ii)相同细胞类型内化的对照cCPP的量来确定相对胞质递送效率。为了测量相对胞质递送效率，可以在cCPP存在下将该细胞类型孵育指定时间段(例如，30分钟、1小时、2小时等)，之后使用本领域已知的方法，例如荧光显微镜术，定量细胞内化的cCPP的量。分别地，将相同浓度的对照cCPP在该细胞类型存在下孵育相同时间段，并定量该细胞内化的对照cCPP的量。

相对胞质递送效率可通过测量具有经修饰的序列的cCPP针对细胞内靶标的IC₅₀并将具有经修饰的序列与对照序列的cCPP的IC₅₀(如本文所述)进行比较来确定。

与环(FfФRrRrQ,SEQ ID NO:150)相比，cCPP的相对胞质递送效率可以在约50％至约450％的范围内，例如约60％、约70％、约80％、约90％、约100％、约110％、约120％、约130％、约140％、约150％、约160％、约170％、约180％、约190％、约200％、约210％、约220％、约230％、约240％、约250％、约260％、约270％、约280％、约290％、约300％、约310％、约320％、约330％、约340％、约350％、约360％、约370％、约380％、约390％、约400％、约410％、约420％、约430％、约440％、约450％、约460％、约470％、约480％、约490％、约500％、约510％、约520％、约530％、约540％、约550％、约560％、约570％、约580％或约590％。与包含环(FfФRrRrQ，SEQ ID NO:150)的环肽相比，cCPP的相对胞质递送效率可提高约600％以上。

绝对胞质递送效率为约40％至约100％的，例如，约45％、约50％、约55％、约60％、约65％、约70％、约75％、约80％、约85％、约90％、约91％、约92％、约93％、约94％、约95％、约96％、约97％、约98％、约99％，包括其间的所有值和子范围。

与其他相同的序列相比，本发明的cCPP可将胞质递送效率提高约1.1倍至约30倍，例如，约1.2、约1.3、约1.4、约1.5、约1.6、约1.7、约1.8、约1.9、约2.0、约2.5、约3.0、约3.5、约4.0、约4.5、约5.0、约5.5、约6.0、约6.5、约7.0、约7.5、约8.0、约8.5、约9.0、约10、约10.5、约11.0、约11.5、约12.0、约12.5、约13.0、约13.5、约14.0、约14.5、约15.0、约15.5、约16.0、约16.5、约17.0、约17.5、约18.0、约18.5、约19.0、约19.5、约20、约20.5、约21.0、约21.5、约22.0、约22.5、约23.0、约23.5、约24.0、约24.5、约25.0、约25.5、约26.0、约26.5、约27.0、约27.5、约28.0、约28.5、约29.0或约29.5倍，包括其间的所有值和子范围。

可检测部分

在实施方案中，本文公开的化合物包括可检测部分。在实施方案中，可检测部分在细胞穿透肽部分的任何氨基酸的氨基、羧酸根基团或侧链(例如，在CPP中的任何氨基酸的氨基、羧酸根基团或侧链)处附接到细胞穿透肽。在实施方案中，治疗部分包括可检测部分。可检测部分可以包括任何可检测标记。合适的可检测标记的实例包括但不限于，UV-Vis标记、近红外标记、发光基团、磷光基团、磁自旋共振标记、光敏剂、光可裂解部分、螯合中心、重原子、放射性同位素、同位素可检测自旋共振标记、顺磁性部分、发色团或它们的任意组合。在实施方案中，标记是可检测的，无需添加其他试剂。

在实施方案中，可检测部分是生物相容性可检测部分，使得化合物可适合用于多种生物应用。如本文所用，“生物相容性”和“生物相容的”通常是指这样的化合物，连同任何其代谢物或其降解产物一起，通常对细胞和组织无毒，并且当细胞和组织在它们的存在下孵育(例如，培养)时，不会对细胞和组织造成任何显著的副作用。

可检测部分可以包含发光体，诸如荧光标记或近红外标记。合适的发光体的实例包括但不限于金属卟啉；苯并卟啉；氮杂苯并卟啉；萘卟啉；酞菁；多环芳烃，诸如苝二酰亚胺、芘；偶氮染料；呫吨染料；硼二吡咯亚甲基、氮杂硼二吡咯亚甲基、花青染料、金属-配体复合物诸如联吡啶、二吡啶、邻二氮杂菲、香豆素以及钌和铱的乙酰丙酮化物；吖啶、噁嗪衍生物诸如苯并吩噁嗪；氮杂-轮烯、方酸；8-羟基喹啉、聚甲炔、发光纳米粒子，诸如量子点、纳米晶体；喹诺酮(carbostyril)；铽络合物；无机磷光体；离子载体，诸如冠醚附属或衍生的染料；或者它们的组合。合适的发光体的具体实例包括但不限于，Pd(II)八乙基卟啉；Pt(II)-八乙基卟啉；Pd(II)四苯基卟啉；Pt(II)四苯基卟啉；Pd(II)间-四苯基卟啉四苯并卟啉；Pt(II)间-四苯基甲基苯并卟啉；Pd(II)八乙基卟啉酮；Pt(II)八乙基卟啉酮；Pd(II)间-四(五氟苯基)卟啉；Pt(II)间-四(五氟苯基)卟啉；Ru(II)三(4,7-二苯基-1,10-菲咯啉)(Ru(dpp)₃)；Ru(II)三(1,10-菲咯啉)(Ru(phen)₃)、三(2,2’-联吡啶)钌(II)氯化物六水合物(Ru(bpy)₃)；赤藓红B；荧光素；异硫氰酸荧光素(FITC)；曙红；铱(III)((N-甲基-苯并咪唑-2-基)-7-(二乙基氨基)-香豆素)；137苯并噻唑)((苯并噻唑-2-基)-7-(二乙基氨基)-香豆素))-2-(乙酰丙酮)；Lumogen染料；Macroflex荧光红；Macrolex荧光黄；德州红；罗丹明B；罗丹明6G；硫罗丹明；间甲酚；百里酚蓝；二甲苯酚蓝；甲酚红；氯酚蓝；溴甲酚绿；溴甲酚红；溴百里酚蓝；Cy2；Cy3；Cy5；Cy5.5；Cy7；4-硝基苯酚；茜素；酚酞；邻-甲酚酞；氯酚红；钙镁指示剂(calmagite)；溴-二甲苯酚；酚红；中性红；硝嗪；3,4,5,6-四溴酚酞；刚果红；荧光素；曙红；2',7'-二氯荧光素；5(6)-羧基-荧光素；羧基萘荧光素；8-羟基芘-1,3,6-三磺酸；半萘基罗丹明(semi-naphthorhodafluor)；半萘荧光素；三(4,7-二苯基-1,10-菲咯啉)二氯化钌(II)；(4,7-二苯基-1,10-菲咯啉)四苯基硼化钌(II)；八乙基卟啉铂(II)；二烷基羰花青；双十八烷基环氧羰花青；芴基甲氧基碳酰氯；7-氨基-4-甲基香豆素(Amc)；绿色荧光蛋白(GFP)；以及它们的衍生物或组合。

在一些实例中，可检测部分可包括罗丹明B(Rho)、异硫氰酸荧光素(FITC)、7-氨基-4-甲基香豆素(Amc)、绿色荧光蛋白(GFP)或它们的衍生物或组合。

制备方法

本文所述的化合物可以用有机合成领域的技术人员已知的各种方式或本领域技术人员理解的对其的改变制备。本文所述的化合物可以由容易获得的原材料制备。最佳反应条件可以随着使用的特定反应物或溶剂而变化，但是此类条件可以由本领域的技术人员确定。

对本文所述的化合物的改变包括对每种化合物所述的各种成分的添加、减除或移动。类似地，当一个分子中存在一个或多个手性中心时，该分子的手性可以变化。另外，化合物合成可能涉及各种化学基团的保护和去保护。本领域技术人员可以确定保护和去保护的使用，以及适当的保护基团的选择。保护基团的化学结构可以在例如Wuts和Greene,Protective Groups in Organic Synthesis，第4版，Wiley&Sons,2006中找到，其通过引用整体并入本文。

用于制备所公开的化合物和组合物的原材料和试剂可以从商业供应商处获得，诸如Aldrich Chemical Co.,(Milwaukee,WI)、Acros Organics(Morris Plains,NJ)、FisherScientific(Pittsburgh,PA)、Sigma(St.Louis,MO)、Pfizer(New York,NY)、GlaxoSmithKline(Raleigh,NC)、Merck(Whitehouse Station,NJ)、Johnson&Johnson(NewBrunswick,NJ)、Aventis(Bridgewater,NJ)、AstraZeneca(Wilmington,DE)、Novartis(Basel,Switzerland)、Wyeth(Madison,NJ)、Bristol-Myers-Squibb(New York,NY)、Roche(Basel,Switzerland)、Lilly(Indianapolis,IN)、Abbott(Abbott Park,IL)、ScheringPlough(Kenilworth,NJ)或Boehringer Ingelheim(Ingelheim,Germany)，或者通过本领域技术人员已知的方法按照诸如以下的参考文献中阐述的程序制备：Fieser and Fieser’sReagents for Organic Synthesis，第1-17卷(John Wiley and Sons,1991)；Rodd’sChemistry of Carbon Compounds，第1-5卷及增刊(Elsevier Science Publishers,1989)；Organic Reactions，第1-40卷(John Wiley and Sons,1991)；March’s AdvancedOrganic Chemistry,(John Wiley and Sons，第4版)；及Larock’sComprehensive OrganicTransformations(VCH Publishers Inc.,1989)。其他材料，诸如本文公开的药物载剂，可以从商业来源获得。

用于产生本文所述的化合物的反应可以在溶剂中进行，所述溶剂可由有机合成领域的技术人员选择。在进行反应的条件即温度和压力下，溶剂可以基本上不与原材料(反应物)、中间体或产物反应。反应可以在一种溶剂或一种以上溶剂的混合物中进行。可以根据本领域已知的任何合适的方法监测产物或中间体的形成。例如，可以通过光谱手段，诸如核磁共振光谱法(例如，1H或13C)、红外光谱法、分光光度法(例如，UV-可见光)或质谱法或通过色谱法诸如高效液相色谱法(HPLC)或薄层色谱法来监测产物形成。

所公开的化合物可以通过固相肽合成来制备，其中氨基酸α-N-末端受酸或碱保护基团保护。此类保护基团应该具有对肽连键形成条件稳定的特性，同时易于去除，而不破坏生长的肽链或其中所含的任何手性中心的外消旋化。合适的保护基团是9-芴基甲氧基羰基(Fmoc)、叔丁氧基羰基(Boc)、苄氧基羰基(Cbz)、联苯基异丙氧基羰基、叔戊氧基羰基、异冰片氧基羰基、α,α-二甲基-3,5-二甲氧基苄氧基羰基、邻硝基苯亚氧硫基、2-氰基-叔丁氧基羰基等。9-芴基甲氧基羰基(Fmoc)保护基团对于所公开化合物的合成是特别优选的。其他优选的侧链保护基团，对于侧链氨基如赖氨酸和精氨酸是2,2,5,7,8-五甲基色满-6-磺酰基(pmc)、硝基、对甲苯磺酰基、4-甲氧基苯磺酰基、Cbz、Boc和金刚烷氧羰基；对于酪氨酸是苄基、邻溴苄氧基-羰基、2,6-二氯苄基、异丙基、叔丁基(t-Bu)、环己基、环苯基和乙酰基(Ac)；对于丝氨酸是叔丁基、苄基和四氢吡喃基；对于组氨酸是三苯甲基、苄基、Cbz、对甲苯磺酰基和2,4-二硝基苯基；对于色氨酸是甲酰基；对于天冬氨酸和谷氨酸是苄基和叔丁基以及对于半胱氨酸是三苯基甲基(三苯甲基)。

在固相肽合成方法中，α-C-末端氨基酸附接到合适的固体支持物或树脂上。可用于上述合成的合适固体支持物是对逐步缩合-去保护反应的试剂和反应条件呈惰性，并且不溶于所用介质的那些材料。用于合成α-C-末端羧基肽的固体支持物是可从AppliedBiosystems(Foster City,Calif.)获得的4-羟甲基苯氧基甲基-共聚(苯乙烯-1％二乙烯基苯)或4-(2',4'-二甲氧基苯基-Fmoc-氨基甲基)苯氧基乙酰胺基乙基树脂。α-C-末端氨基酸借助于N,N'-二环己基碳二亚胺(DCC)、N,N'-二异丙基碳二亚胺(DIC)或邻-苯并三唑-1-基-N,N,N',N'-四甲基脲六氟磷酸盐(HBTU)与树脂偶联，有或没有4-二甲基氨基吡啶(DMAP)、1-羟基苯并三唑(HOBT)、苯并三唑-1-基氧基-三(二甲基氨基)磷鎓六氟磷酸盐(BOP)或双(2-氧代-3-噁唑烷)氯化膦(BOPCl)，在10℃至50℃的温度下在诸如二氯甲烷或DMF的溶剂中介导偶联约1至约24小时。当固体支持物是4-(2',4'-二甲氧基苯基-Fmoc-氨基甲基)苯氧基-乙酰胺基乙基树脂时，在如上所述与α-C-末端氨基酸偶联之前，用仲胺，优选哌啶裂解Fmoc基团。与去保护的4-(2',4'-二甲氧基苯基-Fmoc-氨基甲基)苯氧基-乙酰胺基乙基树脂偶联的一种方法是邻-苯并三唑-1-基-N,N,N',N'-四甲基脲六氟磷酸盐(HBTU，1当量)和1-羟基苯并三唑(HOBT，1当量)在DMF中。连续保护的氨基酸的偶联可以在自动多肽合成仪中进行。在一个实例中，生长肽链的氨基酸中的α-N-末端受Fmoc保护。从生长肽的α-N-末端侧去除Fmoc保护基团是通过用仲胺，优选哌啶处理来完成的。然后引入约3倍摩尔过量的每种受保护的氨基酸，并且优选在DMF中进行偶联。偶联剂可以是邻-苯并三唑-1-基-N,N,N',N'-四甲基脲六氟磷酸盐(HBTU，1当量)和1-羟基苯并三唑(HOBT，1当量)。在固相合成结束时，将多肽从树脂上去除并去保护，连续地或在单一操作中进行。多肽的去除和去保护可以在单一操作中，通过用包含茴香硫醚(thianisole)、水、乙二硫醇和三氟乙酸的裂解试剂处理树脂结合的多肽来完成。在多肽的α-C末端是烷基酰胺的情况下，通过用烷基胺进行氨解来裂解树脂。可替代地，肽可以通过例如与甲醇进行酯交换，随后氨解或通过直接转酰胺基来去除。受保护的肽可以在此时纯化或直接进入下一步。侧链保护基团的去除可以使用上述裂解混合物来完成。完全去保护的肽可以通过一系列色谱步骤纯化，所述色谱步骤采用任何或所有下列类型：在弱碱性树脂上的离子交换(乙酸盐形式)；在未衍生化的聚苯乙烯-二乙烯基苯上的疏水吸附色谱法(例如，Amberlite XAD)；硅胶吸附色谱法；羧甲基纤维素离子交换色谱法；分配色谱法，例如Sephadex G-25、LH-20或逆流分配上；高效液相色谱法(HPLC)，尤其是在辛基或十八烷基甲硅烷基-二氧化硅键合相柱填料上的反相HPLC。

上述聚合物，诸如PEG基团，可以在任何合适的条件下附接到寡核苷酸，诸如AC上。可以使用本领域已知的任何手段，包括经由酰化、还原性烷基化、迈克尔加成、硫醇烷基化或其他化学选择性缀合/连接方法，通过PEG部分上的反应基团(例如，醛、氨基、酯、硫醇、α-卤代乙酰基、马来酰亚胺基或肼基)缀合到AC上的反应基团(例如，醛、氨基、酯、硫醇、α-卤代乙酰基、马来酰亚胺基或肼基)。可用于将水溶性聚合物连接到一种或多种蛋白质上的活化基团包括但不限于砜、马来酰亚胺、巯基、硫醇、三氟甲磺酸酯(triflate)、三氟乙磺酸酯(tresylate)、氮丙啶(azidirine)、环氧乙烷、5-吡啶基和α-卤代酰基(例如，α-碘乙酸、α-溴乙酸、α-氯乙酸)。如果通过还原性烷基化附接到AC上，选择的聚合物应该具有单个反应性醛，以便控制聚合度。参见，例如，Kinstler等人，Adv.Drug.Delivery Rev.(2002),54:477-485；Roberts等人，Adv.Drug Delivery Rev.(2002),54:459-476；及Zalipsky等人，Adv.Drug Delivery Rev.(1995),16:157-182。

为了将AC或接头直接共价连接到CPP上，CPP的适当氨基酸残基可以与有机衍生剂反应，该有机衍生剂能够与氨基酸的选定侧链或N-末端或C-末端反应。肽或缀合物部分上的反应基团包括例如醛、氨基、酯、硫醇、α-卤代乙酰基、马来酰亚胺基或肼基。衍生剂包括例如马来酰亚胺苯甲酰基磺基琥珀酰亚胺酯(通过半胱氨酸残基缀合)、N-羟基琥珀酰亚胺(通过赖氨酸残基)、戊二醛、琥珀酸酐或本领域已知的其他试剂。

制备AC和将AC缀合至线性CPP的方法总体上在美国公开号2018/0298383中有描述，其通过引用并入本文用于所有目的。该方法可以应用于本文公开的环状CPP。

图3A-图3D和图4中提供了合成方案。

表9中显示了包括CPP和可用于与AC缀合的反应基团的化合物的非限制性实例。还显示了示例接头基团。示例反应基团包括四氟苯基酯(TFP)、游离羧酸(COOH)和叠氮化物(N₃)。在表9中，n是0至20的整数；Pipa6是AcRXRRBRRXRYQFLIRXRBRXRB，其中B是β-丙氨酸且X是氨基己酸；Dap是2,3-二氨基丙酸；NLS是核定位序列；βA是β丙氨酸；-ss-是二硫化物；PABC是聚(A)结合蛋白的C-末端结构域；C_x(其中x是数字)是长度为x的烷基链；并且BCN是[6.1.0]壬炔。

表9：包含CPP和反应基团的化合物

在实施方案中，CPP具有可用于与AC缀合的游离羧酸基团。在实施方案中，EEV具有可用于与AC缀合的游离羧酸基团。

下面的结构是3’环辛炔改性的PMO，用于与包含叠氮化物的化合物进行点击反应：

CPP和接头经由酰胺键缀合到AC的3’端的示例方案如下所示。

CPP和接头经由应变促进的叠氮化物-炔环加成缀合到3’-环辛炔修饰的PMO的示例方案如下所示：

用于将AC和CPP与含有聚乙二醇部分的附加接头连接的缀合化学的实例如下所示：

CPP-接头经由应变促进的叠氮化物-炔环加成(点击化学)缀合到5’-环辛炔修饰的PMO的示例如下所示：

合成寡聚反义化合物的方法是本领域已知的。本公开不限于合成AC的方法。在实施方案中，本文提供了具有可用于形成核苷间连键(包括例如磷酸二酯和硫代磷酸酯核苷间连键)的反应性磷基团的化合物。前体或反义化合物的制备和/或纯化方法不是本文提供的组合物或方法的限制。合成和纯化DNA、RNA和反义化合物的方法是本领域技术人员熟知的。

经修饰的和未修饰的核苷的寡聚化可以惯常地根据针对DNA(Protocols forOligonucleotides and Analogs，Agrawal编辑(1993),Humana Press)和/或RNA(Scaringe,Methods(2001),23,206-217.Gait等人，Applications of Chemicallysynthesized RNA in RNA:Protein Interactions，Smith编辑(1998),1-36.Gallo等人，Tetrahedron(2001),57,5707-5713)的文献程序进行。

本文提供的反义化合物可以通过熟知的固相合成技术方便和惯常地制备。用于此类合成的设备由几家供应商出售，包括例如Applied Biosystems(Foster City,CA)。另外或可替代地，可以采用本领域已知的用于此类合成的任何其他手段。熟知使用类似技术来制备寡核苷酸，诸如硫代磷酸酯和烷基化衍生物。本发明不受反义化合物合成方法的限制。

寡核苷酸纯化和分析的方法是本领域技术人员已知的。分析方法包括毛细管电泳(CE)和电喷雾质谱法。此类合成和分析方法可以在多孔板中进行。本发明的方法不受寡聚物纯化方法的限制。

在本文公开的化合物中，AC与CPP(例如环肽)偶联。如本文所用，“偶联”可指CPP与AC之间的共价或非共价缔合，包括CPP与AC的融合以及CPP(例如环肽)与AC的化学缀合。将CPP非共价附接到AC的手段的一个非限制性实例是通过链霉亲和素/生物素相互作用，例如通过将生物素与CPP缀合和将AC与链霉亲和素融合。在所得到的化合物中，CPP经由生物素和链霉亲和素之间的非共价缔合与AC偶联。

在实施方案中，CPP(例如环肽)直接或间接与AC缀合，从而形成CPP-AC缀合物。AC与CPP的缀合可以发生在这些部分上的任何适当位点。例如，在实施方案中，AC的5’端或3’端可以与CPP中氨基酸的C-末端、N-末端或侧链缀合。

在实施方案中，AC共价连接到CPP(例如，环肽)。如本文所用，共价连键是指其中CPP部分共价连接到AC部分的5’端和/或3’端的构建体。此类缀合物可以可替代地被描述为具有CPP部分(例如环肽部分)和寡核苷酸部分。根据某些实施方案，共价连接的AC-CPP或CPP-AC缀合物包括通过本文所述的接头相互缔合的AC组分和CPP组分。

在实施方案中，AC可以通过CPP上氨基酸的侧链与CPP(例如环肽)缀合。CPP上任何能够形成共价键或者可以如此修饰的氨基酸侧链，都可以用于将AC连接到CPP上。CPP上的氨基酸可以是天然或非天然氨基酸。在实施方案中，CPP上用于缀合AC的氨基酸是天冬氨酸、谷氨酸、谷氨酰胺、天冬酰胺、赖氨酸、鸟氨酸、2,3-二氨基丙酸或它们的类似物，其中侧链被与AC或接头的键取代。在实施方案中，氨基酸是赖氨酸或其类似物。在实施方案中，氨基酸是谷氨酸或其类似物。在实施方案中，氨基酸是天冬氨酸或其类似物。

在实施方案中，CPP是环状的。本文公开的化合物有许多可能的构型。在实施方案中，本公开的化合物包括其中AC与环肽中氨基酸的侧链缀合的化合物。在实施方案中，本文公开的化合物具有根据式I-A的结构(即，环外结构)：

CPPLAC

(I-A),

其中接头共价结合到CPP上氨基酸的侧链和AC的5’端、AC的骨架或AC的3’端。

疾病和靶基因

在实施方案中，提供了用于治疗与具有扩增的核苷酸重复序列(例如，扩增的三核苷酸重复序列，诸如扩增的三核苷酸重复序列)的一个或多个基因相关的疾病或病症的化合物和方法。在实施方案中，提供了用于治疗与具有扩增的CTG·CUG三核苷酸重复序列的一个或多个基因相关的疾病或病症的化合物和方法。在实施方案中，提供了用于治疗与一个或多个基因相关的疾病或病症的化合物和方法，该一个或多个基因在基因的3′-UTR中具有扩增的CTG·CUG三核苷酸重复序列。在实施方案中，提供了用于治疗与在3’UTR中具有扩增的CTG·CUG的基因诸如DMPK、ATXN8OS ATXN8和/或JPH3相关的疾病或病症的化合物和方法。在实施方案中，提供了用于治疗与一个或多个基因相关的疾病或病症的化合物和方法，该一个或多个基因在基因的内含子中具有扩增的CTG·CUG三核苷酸重复序列。在实施方案中，提供了用于治疗与TCF4内含子中扩增的CTG·CUG三核苷酸重复序列相关的疾病或病症的化合物和方法。在实施方案中，提供了用于治疗1型强直性肌营养不良(DM1)、富克斯角膜内皮营养不良(FECD)、脊髓小脑性共济失调-8(SCA8)和/或类亨廷顿舞蹈病(HDL2)的化合物和方法。

1型强直性肌营养不良(DM1)

在实施方案中，提供了治疗强直性肌营养不良(DM1或Steinert病)的化合物、组合物和方法。DM1是一种多系统疾病，常常特征在于肌纤维中重复序列动作电位引起的肌肉变性和肌强直或延迟性肌肉松弛。1型强直性肌营养不良(DM1)是最常见的肌营养不良形式，约8000人中有1人患病。DM1是由CTG·CUG扩增引起的遗传病症的范例。DM1是一种由营养不良性肌强直蛋白激酶(DMPK)基因的3′-非翻译区(UTR)中的CTG·CUG重复序列扩增引起的神经肌肉病症。在RNA水平，DMPK转录物(例如，扩增的CUG重复序列)隔绝剪接调控蛋白，例如，肌盲样(MBNL)蛋白，这导致由MBNL1调控的许多下游前体mRNA(不含扩增的CUG重复序列的前体mRNA)的不正确剪接。这种功能获得是DM1的原因。

过量的CUG重复序列赋予毒性活性，称为毒性功能获得。多种关键蛋白质被错误加工，这导致该疾病的多系统性质，包括全身四肢无力、呼吸肌损伤、心脏异常、疲劳、胃肠道并发症、白内障、失禁和白天过度嗜睡。

DMPK基因3′-非翻译区内有CTG·CUG扩增的DM1患者患FECD的风险增加，并在角膜内皮中形成CUGexp-MBNL1灶。(Mootha等人，Investigative ophthalmology&visualscience,2017；58,4579-4585)。MBNL1与突变RNA的缔合会影响游离MBNL1的细胞库，并在受影响的脑部、肌肉和心脏组织中触发一些MBNL1靶基因(例如，由MBNL1调控)的错误剪接(Jiang等人Hum Mol Genet.2004；13:3079–3088)。Gattey等人(Cornea.2014；33:96–98)报告了包括一对母女在内的四名DM1受试者的FECD。因此，DM1和FECD之间可能存在关联(FECD在本文别处有更详细的描述)。

不受理论的束缚，至少提出了两种假说来解释DM1的发病机理。一种发病机理是扩增的CTG·CUG重复序列抑制DMPK mRNA或蛋白质的产生，导致DMPK单倍体不足。这得到了研究支持，证明DM1肌肉中DMPK mRNA和蛋白质的表达减少(Fu,Y.H.等人(1993)Decreasedexpression of myotonin-protein kinase messenger RNA and protein in adult formof myotonic dystrophy.Science 260,235–238)。在实施方案中，本文所述的化合物和方法改善DMPK单倍体不足。另一种RNA功能获得假说提出，从扩增的等位基因转录的突变RNA足以诱导疾病的症状。这是通过以下观察结果得到的提示：(i)扩增的CTG重复序列被转录成在离散的核灶中积聚的CUG重复序列，(ii)仅表达具有200个CTG重复序列的DMPK 3’-UTR足以抑制肌生成(Davis,B.M.等人(1997)Expansion of a CUG trinucleotide repeat inthe 3l untranslated region of myotonic dystrophy protein kinase transcriptsresults in nuclear retention of transcripts.Proc.Natl.Acad.Sci.U.S.A.94,7388–7393；Amack,J.D.等人，(1999)Cis and trans effects of the myotonic dystrophy(DM)mutation in a cell culture model.Hum.Mol.Genet.8,1975–1984)。在实施方案中，本文所述的化合物和方法减少与扩增的等位基因相关的突变RNA的转录。

DMPK mRNA 3’非翻译区中扩增的CTG·CUG三核苷酸重复序列形成不完美的稳定发夹结构，这些发夹结构在细胞核中以小核糖核复合物或显微镜可见包含物的形式积聚，并损害转录、剪接或RNA输出中牵涉的蛋白质的功能。尽管具有CUG重复序列的DMPK基因被转录成mRNA，但是突变转录物作为聚集体(灶)隔绝在细胞核中，这导致细胞质DMPK mRNA水平的降低。由于两种RNA结合蛋白的隔绝，这些聚集导致许多不同转录物的选择性剪接失调：MBNL1(肌盲样蛋白1)和CUGBP1(CUG结合蛋白1)，引起MBNL1功能丧失和CUGBP1上调(Lee和Cooper.(2009)“Pathogenic mechanisms of myotonic dystrophy,”Biochem SocTrans.37(06):1281-1286)。

在DM1中，RNA结合蛋白MBNL1被隔绝在由CUG重复序列形成的双链发夹结构中，使其从核质中耗尽。然后，MBNL1结合的CUG重复序列通过未知机制刺激蛋白激酶C(PKC)激活，从而诱导CUGBP1过度磷酸化和稳定。下游效应包括破坏下游基因的选择性剪接、mRNA翻译和mRNA衰减。DM1的重要分子特征是选择性剪接的错误调控，这是由于MBNL1隔绝至具有双链发夹结构的CUG重复序列。在DM1中二十多个错误调控的剪接事件中，已知骨骼肌特异性ClC-1(氯离子通道1)的异常剪接是肌强直的原因之一。含提前终止密码子的外显子包含的增加导致ClC-1mRNA和蛋白质的下调，这足以引起肌强直(Charlet-B等人(2002)Loss ofthe muscle-specific chloride channel in type 1myotonic dystrophy due tomisregulated alternative splicing.Mol.Cell 10,45–53；Mankodi,A.等人(2002)Expanded CUG repeats trigger aberrant splicing of ClC-1chloride channel pre-mRNA and hyperexcitability of skeletal muscle in myotonic dystrophy.Mol.Cell10,35–44)。在实施方案中，本文所述的化合物和方法改善下游效应，包括破坏下游基因的选择性剪接、mRNA翻译和mRNA衰减。在实施方案中，与未用本公开的化合物或方法治疗的患有DM1的受试者相比，本文所述的化合物和方法减少DM1中错调的剪接事件的数量。例如，在一些实施方案中，本文所述的化合物和方法可以减少一种或多种下游基因中错调剪接事件的数量，所述下游基因诸如4833439L19Rik、Abcc9、Atp2a1、Arhgef10、Arhgap28、Armcx6、Angel1、Best3、Bin1、Brd2、Cacna1s、Cacna2d1、Cpd、Cpeb3、Ccpg1、Clasp1、Clcn1、Clk4、Cpeb2、Camk2g、Capzb、Copz2、Coch、cTNT、Ctu2、Cyp2s1、Dctn4、Dnm1l、Eya4、Efna3、Efna2、Fbxo31、Fbxo21、Frem2、Fgd4、Fuca1、Fn1、Gogla4、Gpr37l1、Greb1、Heg1、Insr、Impdh2、IR、Itgav、Jag2、Klc1、Kcan6、Kif13a、Ldb3、Lrrfip2、Mapt、Macf1、Map3k4、Mapkap1、Mbnl1、Mllt3、Mbnl2、Mef2c、Mpdz、Mrpl1、Mxra7、Mybpc1、Myo9a、Ncapd3、Ngfr、Ndrg3、Ndufv3、Neb、Nfix、Numa1、Opa1、Pacsin2、Pcolce、Pdlim3、Pla2g15、Phactr4、Phka1、Phtf2、Ppp1r12b、Ppp3cc、Ppp1cc、Ramp2、Rapgef1、Rur1、Ryr1、Sorcs2、Spsb4、Scube2、Sema6c、Sfc8a3、Slain2、Sorbs1、Spag9、Tmem28、Tacc1、Tacc2、Ttc7、Tnik、Tnfrsf22、Tnfrsf25、Trappc9、Trim55、Ttn、Txnl4a、Txlnb、Ube2d3或Vsp39。在实施方案中，与未用本公开的化合物或方法治疗的患有DM1的受试者相比，本文所述的化合物和方法减少含提前终止密码子的外显子的数量，含提前终止密码子的外显子导致ClC-1mRNA的下调。

核中MBNL1和CUGBP1的水平控制在DM1中被逆转的受发育调控的剪接事件的子集。在胚胎阶段，MBNL1核水平低，CUGBP1水平高。在发育期间，MBNL1核水平增加，而CUGBP1水平降低，诱导下游剪接靶标(包括IR外显子11、含终止密码子的ClC-1外显子和cTNT外显子5)从胚胎到成体的转变。然而，在DM1中，MBNL1隔绝至CUG重复序列，引起功能性MBNL1减少，而CUGBP1水平由于磷酸化和稳定化而增加。这模拟了胚胎条件并增强了成人胚胎同种型的表达，导致多种疾病症状(Lee和Cooper.；2009)。在实施方案中，与未用本公开的化合物或方法治疗的患有DM1的受试者相比，本文所述的化合物和方法减少被隔绝的MBNL1的量，增加功能性MBNL1的量，降低CUGBP1水平。

MBNL1和CELF1(也称为“CUGBP1”)是胎儿向成人转变期间剪接事件的发育调控因子，它们在DM1中活性的改变导致胎儿剪接模式在成人组织中的表达。低MBNL1和高CELF1的下游影响包括破坏蛋白质中的选择性剪接、mRNA翻译和mRNA衰减，这些蛋白质诸如心肌肌钙蛋白T(cTNT)、胰岛素受体(INSR)、肌肉特异性氯离子通道(CLCN1)和肌浆/内质网钙ATP酶1(ATP2A1)转录物，以及MBNL1。Konieczny等人(2017)“Myotonic dystrophy:candidatesmall molecule therapeutics,”Drug Discovery Today.22(11):1740-1748。

在US10106796B2、US10111962B2、US20150080311A1中描述了使用靶向DMPK基因的3′-UTR中的聚CUG重复序列的反义寡聚物来治疗强直性肌营养不良的化合物和方法，这些文献中的每一篇都通过引用整体并入本文用于所有目的。然而，此类靶向CUG重复序列以治疗DM1的PMO或PPMO可能在寡核苷酸递送至肌肉(受疾病影响的组织)方面具有局限性。

在实施方案中，本公开教导了使用不同的细胞穿透肽(CPP)将本文例如在表2和表10中描述的AC(例如，PMO或ASO)和降解序列递送至细胞的胞质溶胶。在实施方案中，与AC缀合的CPP或EEV将目标AC递送至前体mRNA上的靶序列所在的细胞位置。

在实施方案中，疾病是强直性肌营养不良的一种形式(例如，1型强直性肌营养不良或2型强直性肌营养不良)。在实施方案中，靶基因是编码肌强直蛋白激酶的DMPK基因。在实施方案中，本文提供的化合物包含靶向DMPK(例如，DMPK基因的3′-非翻译区/聚腺苷酸化)以降解DMPK基因的AC(例如，ASO)。靶向DMPK进行降解的示例性寡核苷酸在表10中提供。降解序列可以与包含10-40个CAG重复序列的AC序列(包括但不限于表2中提供的AC)组合使用。

表10.靶向DMPK进行降解的寡核苷酸(AC)。

脊髓小脑性共济失调-8(SCA8)

在实施方案中，提供了治疗脊髓小脑性共济失调-8(SCA8)的化合物、组合物和方法。SCA8是一种遗传性神经退行性病状，其特征在于缓慢进展的共济失调。症状通常在生命的第三十年至第五十年出现。症状包括眼动异常、感觉神经病、吞咽困难、小脑共济失调和认知障碍。

SCA8与两个重叠基因ATXN8OS和ATXN8的3’UTR中的杂合异常扩增CTG·CUG重复序列相关。健康个体在ATXN8OS和ATXN8基因中通常具有15至50个CTG·CUG重复序列。在ATXN8OS和ATXN8基因中，SCA8患者具有超过50个CTG·CUG重复序列，有时多达240个CTG·CUG重复序列。

类亨廷顿舞蹈病-2(HDL2)

在实施方案中，提供了用于治疗类亨廷顿舞蹈病-2(HDL2)疾病的化合物、组合物和方法。HDL2是一种常染色体显性神经退行性病症，在表型上与亨廷顿舞蹈病相关。HDL2的特征在于包括舞蹈病、肌张力障碍、强直、运动迟缓和精神症状(诸如痴呆)在内的症状。HDL2的症状通常出现在中年并且可能到约10-15年导致过早死亡。

HDL2与连接蛋白3(JPH3)基因(16q24.3)的3’UTR中扩增的CTG·CUG相关。健康个体在JPH3基因中通常具有6至27个CTG·CUG重复序列。在JPH3基因中，HDL2患者具有超过40个CTG·CUG重复序列，有时多达60个或更多个CTG·CUG重复序列。

富克斯角膜内皮营养不良

在实施方案中，提供了用于治疗富克斯角膜内皮营养不良(FECD)的化合物、组合物和方法。FECD(MIM 136800)是一种与年龄相关的角膜内皮退行性病症。FECD的特征在于角膜内皮细胞的进行性损失、德塞梅膜(Descement’s membrane)增厚和细胞外基质以滴状形式沉积。当内皮细胞的数量变得极低时，角膜膨胀并导致视力丧失(Elhalis等人OculSurf.2010；8(4):173-184)。

FECD可以作为具有遗传异质性的常染色体显性性状遗传。胶原蛋白VIII型α2基因(COL8A2，MIM 120252)的罕见杂合突变可导致早发性角膜内皮营养不良。其他基因诸如溶质载体家族4、硼酸钠转运蛋白成员11(SLC4A11，MIM 610206)、转录因子8(TCF8，MIM189909)、脂肪氧合酶同源结构域1(LOXHD1，MIM 613267)和类ATP/GTP结合蛋白1(AGBL1，MIM 615523)共同与一小部分成年发作型FECD病例相关。成年发作型FECD的全基因组关联研究表明，转录因子4(TCF4，MIM 602272)和最近的含KN基序和锚蛋白重复序列结构域的蛋白4(KANK4，MIM 614612)、层粘连蛋白γ-1(LAMC1，MIM150290)、Na⁺/K⁺转运ATP酶和β-1多肽(ATP1B1，MIM 182330)与所提到的TCF4基因座对FECD具有突出影响(Mootha等人，Investigative ophthalmology&visual science,2017；58,4579-4585)。

TCF4内含子2中CTG18.1基因座处扩增的三核苷酸重复序列与FECD相关(Wieben等人，PLoS One.2012；7(11):e49083)。超过40个CTG·CUG三核苷酸重复序列的扩增CTG18.1等位基因的每个拷贝都导致FECD发展的显著风险(Mootha等人，Invest Ophthalmol VisSci.2014；55:33–42)。RNA核灶，即功能性RNA毒性获得的标志，在简单重复序列扩增引起的神经退行性病症中已有报告。在具有CTG18.1三联体重复序列扩增的FECD受试者的角膜内皮中，扩增的CUG重复序列RNA作为核灶积聚，而在缺乏三联体扩增的对照样品中不存在(Mootha等人，Invest Ophthalmol Vis Sci.2015；56(3):2003-2011)。扩增的CUG重复序列RNA与mRNA剪接因子，肌盲样1(MBNL1)共同定位于内皮细胞核灶中作为分子标志。CTG18.1基因座处的三联体重复序列扩增可能由于突变CUG RNA转录物隔绝MBNL1而经由异常基因剪接介导内皮功能障碍(Du等人，JBiol Chem.2015；290:5979–5990)。因此，两个不同的三联体重复序列集中在RNA灶和FECD上，并且这些灶可能对FECD起着因果作用。

在实施方案中，在WO2018165541A1、US10760076B2中描述了用反义寡核苷酸减少扩增的CUG重复序列RNA，可用于治疗富克斯角膜内皮营养不良(FECD)的化合物和方法，这些文献中的每一篇通过引用整体并入本文用于所有目的。然而，用于治疗DM1的此类靶向CUG重复序列的磷酰二胺吗啉代寡聚物(PMO)或肽缀合的PMO(PPMO)，诸如现有技术中描述的那，可能在寡聚物递送至靶组织(例如角膜的内皮细胞层)方面具有局限性，所述靶组织是受疾病影响的组织。

在实施方案中，本公开教导了使用不同的细胞穿透肽(CPP)或内体逃逸载体(EEV)将本文例如在表6中描述的AC(例如PMO或ASO)递送至细胞的胞质溶胶。在实施方案中，与AC缀合的CPP或EEV将目标AC递送至前体mRNA上的靶序列所在的细胞位置。

在实施方案中，该疾病是富克斯内皮角膜营养不良(FECD)。在实施方案中，靶基因是TCF4，其编码转录因子4(TCF-4)，也称为免疫球蛋白转录因子2(ITF-2)。在实施方案中，本文提供的化合物包含靶向TCF4的反义寡核苷酸。表2和表11中提供了可用于靶向TCF4的示例性寡核苷酸。

表11.靶向TCF4的扩增三联体重复序列的示例性寡核苷酸

PMO：磷酰二胺吗啉代寡聚物

Mootha等人(2017)报告，DM1和FECD起源于非编码CTG扩增，但是两者不是相同的疾病。DM1中的DMPK扩增导致多器官疾病，涉及眼内各种组织，包括晶状体、视网膜和角膜内皮。相比之下，TCF4重复序列扩增似乎会影响角膜内皮，而对其他眼组织或身体器官没有任何临床上明显的后遗症。DMPK和TCF4的突变扩增具有重要的相似性，诸如(i)含有扩增的CUG重复序列的核灶，(ii)灶与MBNL1蛋白的关联，以及(iii)导致FECD的能力。这表明，DMPK和TCF4的三联体扩增可能通过共同的分子机械导致相同的FECD角膜内皮组织表型。

参见美国专利号10760076B2、国际申请公开号WO2018165541A1、美国专利申请公开号2016/0355796和美国专利申请公开号2018/0344817，每一篇都通过引用并入本文，并且公开了倾向于形成和/或扩增串联核苷酸重复序列的疾病和相应基因。

组合物和施用方法

本公开的化合物可以配制成适于体内应用的组合物。可以将这些化合物和/或组合物施用于患有或疑似患有与扩增的三核苷酸重复序列相关的疾病的患者。

所公开的化合物和含有这些化合物的组合物的体内应用可以通过本领域技术人员目前或预期已知的任何合适的方法和技术来实现。例如，所公开的化合物可以配制成生理学或药学上可接受的组合物，并通过本领域已知的任何合适的途径施用，包括例如口服和胃肠外施用途径。如本文所用，术语胃肠外包括皮下、皮内、静脉内、肌内、腹膜内、胸骨内和鞘内施用，诸如通过注射。所公开的化合物或组合物的施用可以是单次施用，或者以连续或不同的间隔施用，这可以由本领域技术人员容易地确定。

本文公开的化合物和含有这些化合物的组合物也可以利用脂质体技术、缓释胶囊、可植入泵和可生物降解容器来施用。这些递送方法可以有利地在长时间段内提供均匀的剂量。这些化合物也可以呈其盐衍生物形式或结晶形式施用。

本文公开的化合物可以根据制备药学上可接受的组合物的已知方法配制成药物组合物。制剂在许多来源中有详细描述，这些来源是本领域技术人员熟知且容易获得的。例如，E.W.Martin的Remington’s Pharmaceutical Science(1995)描述了可与所公开的方法结合使用的制剂。一般而言，本文公开的化合物可以配制成使得有效量的化合物与合适的载剂组合，以便促进化合物的有效施用。所用的组合物也可以是多种形式。这些形式包括例如固体、半固体和液体剂型，诸如片剂、丸剂、粉剂、液体溶液或混悬液、栓剂、可注射的溶液和不可输注的溶液及喷雾剂。形式取决于预期的施用模式和治疗应用。这些组合物还包括本领域技术人员已知的常规药学上可接受的载剂和稀释剂。与化合物一起使用的载剂或稀释剂的实例包括乙醇、二甲基亚砜、甘油、氧化铝、淀粉、盐水及等效载剂和稀释剂。为了提供此类剂量的施用进行期望的治疗处理，基于包括载剂或稀释剂的总组合物的重量，本文公开的组合物可以有利地包含总共约0.1重量％至100重量％的一种或多种主题化合物。

适于施用的制剂包括，例如，无菌注射水溶液，其可含有抗氧化剂、缓冲剂、抑菌剂和使制剂与预期接受者的血液等渗的溶质；以及水性和非水性无菌混悬液，其可以包括悬浮剂和增稠剂。制剂可以呈现在单位剂量或多剂量容器中，例如密封的安瓿和小瓶，并且可以储存在冷冻干燥(冻干)条件下，使用前只需要无菌液体载剂例如注射用水的条件。可以由无菌粉末、颗粒、片剂等制备临时注射液和混悬液。应该理解的是，除了上面特别提到的成分之外，本文公开的组合物可以包括本领域中考虑到所讨论的制剂类型的其他常规试剂。

本文公开的化合物和包含这些化合物的组合物可以通过与细胞直接接触或经由载剂手段递送至细胞。用于将化合物和组合物递送至细胞的载剂手段是本领域已知的，包括例如将组合物包封在脂质体部分中。将本文公开的化合物和组合物递送至细胞的另一种手段包括将化合物附接至被靶向递送至靶细胞的蛋白质或核酸。美国专利号6,960,648及美国申请公开号20030032594和20020120100公开了可以与另一种组合物偶联并允许该组合物跨生物膜转运的氨基酸序列。美国申请公开号20020035243也描述了用于跨细胞膜转运生物部分以进行细胞内递送的组合物。化合物也可以掺入聚合物中，聚合物的实例包括用于颅内肿瘤的聚(D-L丙交酯-共-乙交酯)聚合物；摩尔比为20:80的聚[双(对羧基苯氧基)丙烷:癸二酸](如GLIADEL中所用)；软骨素；几丁质；和壳聚糖。

本文公开的化合物和组合物，包括其药学上可接受的盐或前药，可以通过输注或注射在静脉内、肌内或腹膜内施用。活性剂或其盐的溶液可以在水中制备，任选地与无毒表面活性剂混合。也可以在甘油、液体聚乙二醇、三醋精及其混合物和油中制备分散体。在普通储存和使用条件下，这些制剂可含有防腐剂以防止微生物生长。

适于注射或输注的药物剂型可包括包含活性成分的无菌水溶液或分散体或无菌粉末，适于临时制备无菌注射液或输注溶液或分散体，任选地封装在脂质体中。最终剂型应在生产和储存条件下是无菌、流动且稳定的。液体载剂或媒介物可以是溶剂或液体分散介质，包括例如水、乙醇、多元醇(例如甘油、丙二醇、液体聚乙二醇等)、植物油、无毒甘油酯及其合适的混合物。例如，通过形成脂质体，通过在分散体的情况下保持所需粒度或通过使用表面活性剂，可以保持适当的流动性。任选地，预防微生物作用可通过各种其他抗细菌剂和抗真菌剂(例如对羟基苯甲酸酯、氯丁醇、苯酚、山梨酸和硫柳汞等)来实现。在许多情况下，可以包括等渗剂，例如糖、缓冲剂或氯化钠。可通过包含延迟吸收的试剂例如单硬脂酸铝和明胶来实现可注射组合物的延长吸收。

通过以下方式制备无菌可注射溶液：将本文公开的化合物和/或试剂以所需的量根据需要与以上枚举的各种其他成分掺入适当的溶剂中，然后过滤灭菌。在用于制备无菌可注射溶液的无菌粉末的情况下，制备方法包括真空干燥和冷冻干燥技术，其产生活性成分外加存在于先前无菌过滤溶液中的任何其他所需成分的粉末。

本文公开的化合物和试剂及药物组合物的可用剂量可通过比较它们的体外活性与在动物模型中的体内活性来确定。用于将小鼠和其他动物中的有效剂量外推至人类的方法是本领域已知的。

组合物施用的剂量范围是那些大到足以产生影响症状或病状的期望效果的剂量范围。剂量不应太大，以免引起不良副作用，诸如不希望的交叉反应、过敏反应等。通常，剂量将随着患者的年龄、状况、性别和疾病程度而变化，并且可以由本领域技术人员确定。如果有任何禁忌，可以由个体医师调整剂量。剂量可以变化并且可以每天一次或多次剂量施用，持续一天或几天。

还公开了包含本文公开的化合物与药学上可接受的载剂组合的药物组合物。本文公开了适于口服、局部或胃肠外施用的包含一定量化合物的药物组合物。对患者，特别是人类施用的剂量应足以在患者中在合理的时间范围实现治疗反应，而没有致死毒性，并且不会引起超过可接受水平的副作用或发病率。本领域技术人员将认识到剂量将取决于多种因素，包括受试者的状况(健康)、受试者的体重、同时治疗的种类(如果有的话)、治疗频率、治疗比率以及病理状况的严重程度和阶段。

还公开了在一个或多个容器中包含本文公开的化合物和/或含有该化合物的药物组合物的试剂盒。所公开的试剂盒可以任选地包括药学上可接受的载剂和/或稀释剂。在一个实施方案中，试剂盒包括一种或多种如本文所述的其他组分、附加物或佐剂。在一个实施方案中，试剂盒包括描述如何施用试剂盒的化合物或组合物的说明书或包装材料。试剂盒的容器可以是任何合适的材料，例如玻璃、塑料、金属等，并且可以是任何合适的大小、形状或配置。在一个实施方案中，本文公开的化合物和/或试剂以固体形式，诸如片剂、丸剂或粉末形式在试剂盒中提供。在另一个实施方案中，本文公开的化合物和/或试剂以液体或溶液的形式在试剂盒中提供。在一个实施方案中，该试剂盒包括含有液体或溶液形式的本文公开的化合物和/或试剂的安瓿或注射器。

在实施方案中，以一定的剂量剂量向诊断为患有与核苷酸重复序列扩增相关联的疾病的患者施用本公开的化合物和/或组合物，所述剂量介于约0.1mg/kg与约1000mg/kg之间，例如约0.1mg/kg、约0.2mg/kg、约0.3mg/kg、约0.4mg/kg、约0.5mg/kg、约0.6mg/kg、约0.7mg/kg、约0.8mg/kg、约0.9mg/kg、约1mg/kg、约2mg/kg、约3mg/kg、约4mg/kg、约5mg/kg、约6mg/kg、约7mg/kg、约8mg/kg、约9mg/kg、约10mg/kg、约11mg/kg、约12mg/kg、约13mg/kg、约14mg/kg、约15mg/kg、约16mg/kg、约17mg/kg、约18mg/kg、约19mg/kg、约20mg/kg、约21mg/kg、约22mg/kg、约23mg/kg、约24mg/kg、约25mg/kg、约26mg/kg、约27mg/kg、约28mg/kg、约29mg/kg、约30mg/kg、约31mg/kg、约32mg/kg、约33mg/kg、约34mg/kg、约35mg/kg、约36mg/kg、约37mg/kg、约38mg/kg、约39mg/kg、约40mg/kg、约41mg/kg、约42mg/kg、约43mg/kg、约44mg/kg、约45mg/kg、约46mg/kg、约47mg/kg、约48mg/kg、约49mg/kg、约50mg/kg、约51mg/kg、约52mg/kg、约53mg/kg、约54mg/kg、约55mg/kg、约56mg/kg、约57mg/kg、约58mg/kg、约59mg/kg、约60mg/kg、约61mg/kg、约62mg/kg、约63mg/kg、约64mg/kg、约65mg/kg、约66mg/kg、约67mg/kg、约68mg/kg、约69mg/kg、约70mg/kg、约71mg/kg、约72mg/kg、约73mg/kg、约74mg/kg、约75mg/kg、约76mg/kg、约77mg/kg、约78mg/kg、约79mg/kg、约80mg/kg、约81mg/kg、约82mg/kg、约83mg/kg、约84mg/kg、约85mg/kg、约86mg/kg、约87mg/kg、约88mg/kg、约89mg/kg、约90mg/kg、约91mg/kg、约92mg/kg、约93mg/kg、约94mg/kg、约95mg/kg、约96mg/kg、约97mg/kg、约98mg/kg、约99mg/kg、约100mg/kg、约110mg/kg、约120mg/kg、约130mg/kg、约140mg/kg、约150mg/kg、约160mg/kg、约170mg/kg、约180mg/kg、约190mg/kg、约200mg/kg、约210mg/kg、约220mg/kg、约230mg/kg、约240mg/kg、约250mg/kg、约260mg/kg、约270mg/kg、约280mg/kg、约290mg/kg、约300mg/kg、约310mg/kg、约320mg/kg、约330mg/kg、约340mg/kg、约350mg/kg、约360mg/kg、约370mg/kg、约380mg/kg、约390mg/kg、约400mg/kg、约410mg/kg、约420mg/kg、约430mg/kg、约440mg/kg、约450mg/kg、约460mg/kg、约470mg/kg、约480mg/kg、约490mg/kg、约500mg/kg、约510mg/kg、约520mg/kg、约530mg/kg、约540mg/kg、约550mg/kg、约560mg/kg、约570mg/kg、约580mg/kg、约590mg/kg、约600mg/kg、约610mg/kg、约620mg/kg、约630mg/kg、约640mg/kg、约650mg/kg、约660mg/kg、约670mg/kg、约680mg/kg、约690mg/kg、约700mg/kg、约710mg/kg、约720mg/kg、约730mg/kg、约740mg/kg、约750mg/kg、约760mg/kg、约770mg/kg、约780mg/kg、约790mg/kg、约800mg/kg、约810mg/kg、约820mg/kg、约830mg/kg、约840mg/kg、约850mg/kg、约860mg/kg、约870mg/kg、约880mg/kg、约890mg/kg、约900mg/kg、约910mg/kg、约920mg/kg、约930mg/kg、约940mg/kg、约950mg/kg、约960mg/kg、约970mg/kg、约980mg/kg、约990mg/kg或约1000mg/kg，包括其中和之间的所有值和范围。

治疗方法

本公开提供了一种治疗有需要的受试者的疾病的方法，该方法包括施用本文公开的化合物和/或含有该化合物的组合物。在实施方案中，该疾病是本公开中提供的任何疾病。在实施方案中，靶基因或基因转录物是本公开中提供的任何靶基因或基因转录物。

在实施方案中，将患者鉴定为患有本文所述的任何疾病或处于患本文所述的任何疾病的风险中。在实施方案中，提供了用于治疗与基因/转录物的3’非翻译区中的CTG·CUG重复序列相关的疾病的方法。在实施方案中，提供了一种用于治疗强直性肌营养不良的方法。在实施方案中，提供了一种用于治疗1型强直性肌营养不良(DM1)的方法。在实施方案中，提供了一种用于治疗SCA8的方法。在实施方案中，提供了一种用于治疗HDL2的方法。在实施方案中，提供了一种用于治疗FECD的方法。

在实施方案中，治疗是指部分或完全减轻、改善、缓解、抑制、延迟发作、降低受试者中一种或多种症状的严重程度和/或发生率。

疾病和/或疾病症状的治疗可以通过多种分子机制，诸如本文所述的那些分子机制进行。

在实施方案中，提供了用于改变有需要的受试者中靶基因的表达和/或活性的方法，该方法包括施用本文公开的化合物。在实施方案中，治疗引起靶蛋白从靶转录物的表达降低。在实施方案中，治疗引起靶转录物水平降低。在实施方案中，治疗引起下游基因转录物剪接的调节，这些下游基因转录物受靶转录物和/或与靶转录物结合的蛋白质调控。在实施方案中，下游基因转录物剪接的调节引起与健康表型相关的下游转录物和/或下游蛋白质同种型的增加。在实施方案中，选择性剪接导致与疾病表型相关的下游转录物和/或下游蛋白质同种型的减少。

在实施方案中，提供了通过减少至少一种RNA结合蛋白隔绝到包含至少一个扩增的CUG重复序列的前体mRNA来治疗DM1的方法。在实施方案中，提供了通过减少包含至少一个扩增的CUG重复序列的前体mRNA的积聚来治疗DM1的方法。在实施方案中，提供了通过校正下游基因转录物的剪接缺陷来治疗DM1的方法。

在实施方案中，与治疗前的受试者或一个或多个患有类似疾病但未治疗的对照个体的平均蛋白质水平相比，或与用未缀合于本文公开的环状CPP的AC治疗相比，根据本公开的治疗引起靶转录物和/或靶转录物(例如，DMPK、TCF4、JPH3、ATXN8OS和/或ATXN8)基因表达的水平降低超过约5％、约10％、约15％、约20％、约25％、约30％、约35％、约40％、约45％、约50％、约55％、约60％、约65％、约70％、约75％、约80％、约85％、约90％、约95％和约100％。在实施方案中，与治疗前的受试者或一个或多个患有类似疾病但未治疗的对照个体中转录物和/或蛋白质的平均水平相比，或与用未缀合于本文公开的环状CPP的AC治疗相比，根据本公开的治疗引起靶转录物(例如，DMPK、TCF4、JPH3、ATXN8OS和/或ATXN8)和/或靶转录物表达的水平降低约5％至约100％、约10％至约100％、约20％至约100％、约50％至约100％、约70％至约100％、约80％至约100％、约90％至约100％、约95％至约100％、约40％至约95％、约50％至约95％、约70％至约95％或约90％至约95％。

在实施方案中，与治疗前的受试者或一个或多个患有类似疾病但未治疗的对照个体中的平均灶水平相比，或与用未缀合于本文公开的环状CPP的AC治疗相比，根据本公开的治疗引起靶基因(例如，DMPK、TCF4、JPH3、ATXN8OS和/或ATXN8)的CUG重复序列RNA核灶的数量降低超过约5％，例如约5％、约10％、约15％、约20％、约25％、约30％、约35％、约40％、约45％、约50％、约55％、约60％、约65％、约70％、约75％、约80％、约85％、约90％、约95％和约100％。在实施方案中，与治疗前的受试者或一个或多个患有类似疾病但未治疗的对照个体中的平均灶水平相比，或与用未缀合于本文公开的环状CPP的AC治疗相比，根据本公开的治疗引起靶基因(例如，DMPK、TCF4、JPH3、ATXN8OS和/或ATXN8)的CUG重复序列RNA核灶的数量减少约5％至约100％、约10％至约100％、约20％至约100％、约50％至约100％、约70％至约100％、约80％至约100％、约90％至约100％、约95％至约100％、约40％至约95％、约50％至约95％、约70％至约95％或约90％至约95％。

在实施方案中，与治疗前的受试者或一个或多个患有类似疾病但未治疗的对照个体的平均蛋白质水平相比，或与用未缀合于本文公开的环状CPP的AC治疗相比，根据本公开的治疗引起与疾病表型相关的下游转录物和/或下游基因产物表达的水平降低超过约5％，例如约5％、约10％、约15％、约20％、约25％、约30％、约35％、约40％、约45％、约50％、约55％、约60％、约65％、约70％、约75％、约80％、约85％、约90％、约95％和约100％。在实施方案中，与治疗前的受试者或一个或多个患有类似疾病但未治疗的对照个体中蛋白质的平均水平相比，或与用未缀合于本文公开的环状CPP的AC治疗相比，根据本公开的治疗引起与疾病表型相关的下游转录物和/或下游基因产物表达的水平降低约5％至约100％、约10％至约100％、约20％至约100％、约50％至约100％、约70％至约100％、约80％至约100％、约90％至约100％、约95％至约100％、约40％至约95％、约50％至约95％、约70％至约95％或约90％至约95％。

在实施方案中，与治疗前的受试者或一个或多个患有类似疾病但未治疗的对照个体的平均蛋白质水平相比，或与用未缀合于本文公开的环状CPP的AC治疗相比，根据本公开的治疗引起与健康表型相关的下游转录物和/或下游基因产物表达的水平增加超过约5％，例如约5％、约10％、约15％、约20％、约25％、约30％、约35％、约40％、约45％、约50％、约55％、约60％、约65％、约70％、约75％、约80％、约85％、约90％、约95％和约100％。在实施方案中，与治疗前的受试者或一个或多个患有类似疾病但未治疗的对照个体的平均蛋白质水平相比，或与用未缀合于本文公开的环状CPP的AC治疗相比，根据本公开的治疗引起与健康表型相关的下游转录物和/或下游基因产物表达的水平增加约5％至约100％、约10％至约100％、约20％至约100％、约50％至约100％、约70％至约100％、约80％至约100％、约90％至约100％、约95％至约100％、约40％至约95％、约50％至约95％、约70％至约95％或约90％至约95％。

在实施方案中，与治疗前受试者的角膜组织、肌肉组织、膈组织、四头肌、三头肌、胫骨前肌、腓肠肌或心脏中的平均蛋白质水平相比，或与用未缀合于本文公开的环状CPP的AC治疗相比，根据本公开的治疗引起受试者的角膜组织、肌肉组织、膈组织、四头肌、三头肌、胫骨前肌、腓肠肌或心脏中与疾病表型相关的蛋白质同种型的表达降低超过约5％，例如约5％、约10％、约15％、约20％、约25％、约30％、约35％、约40％、约45％、约50％、约55％、约60％、约65％、约70％、约75％、约80％、约85％、约90％、约95％和约100％。在实施方案中，与治疗前受试者的角膜组织、肌肉组织、膈组织、四头肌、三头肌、胫骨前肌、腓肠肌或心脏中的平均蛋白质水平相比，或与用未缀合于本文公开的环状CPP的AC治疗相比，根据本公开的治疗引起受试者的角膜组织、肌肉组织、膈组织、四头肌、三头肌、胫骨前肌、腓肠肌或心脏中与疾病表型相关的蛋白质同种型的表达降低超过约5％至约100％、约10％至约100％、约20％至约100％、约50％至约100％、约70％至约100％、约80％至约100％、约90％至约100％、约95％至约100％、约40％至约95％、约50％至约95％、约70％至约95％或约90％至约95％。

在实施方案中，与治疗前受试者的角膜组织、肌肉组织、膈组织、四头肌或心脏中下游蛋白质的平均水平相比，或与用未缀合于本文公开的环状CPP的AC治疗相比，根据本公开的治疗引起受试者的角膜组织、肌肉组织、膈组织、四头肌或心脏中选择性剪接的下游蛋白质的表达增加超过约5％，例如约5％、约10％、约15％、约20％、约25％、约30％、约35％、约40％、约45％、约50％、约55％、约60％、约65％、约70％、约75％、约80％、约85％、约90％、约95％、约100％、约150％、约200％、约250％、约300％、约350％、约400％、约450％、约500％、约550％、约600％、约650％、约700％、约750％、约800、约850％、约900％、约950％或约1000％或更多。

在实施方案中，与治疗前受试者的角膜组织、肌肉组织、膈组织、四头肌或心脏中野生型蛋白质异构体的平均水平相比，或与用未缀合于本文公开的环状CPP的AC治疗相比，根据本公开的治疗引起受试者的角膜组织、肌肉组织、膈组织、四头肌或心脏中野生型蛋白质异构体的表达增加或降低超过约5％，例如约5％、约10％、约15％、约20％、约25％、约30％、约35％、约40％、约45％、约50％、约55％、约60％、约65％、约70％、约75％、约80％、约85％、约90％、约95％和约100％。

在实施方案中，与治疗前受试者的目标组织中的平均蛋白质水平相比，或与用未缀合于本文公开的环状CPP的AC治疗相比，根据本公开的治疗引起受试者的目标组织中蛋白质的表达降低超过约5％，例如约5％、约10％、约15％、约20％、约25％、约30％、约35％、约40％、约45％、约50％、约55％、约60％、约65％、约70％、约75％、约80％、约85％、约90％、约95％和约100％。

在实施方案中，与治疗前受试者的目标组织中下游蛋白质的平均水平相比，或与用未缀合于本文公开的环状CPP的AC治疗相比，根据本公开的治疗引起受试者的目标组织中选择性剪接的下游蛋白质的表达增加超过约5％，例如约5％、约10％、约15％、约20％、约25％、约30％、约35％、约40％、约45％、约50％、约55％、约60％、约65％、约70％、约75％、约80％、约85％、约90％、约95％、约100％、约150％、约200％、约250％、约300％、约350％、约400％、约450％、约500％、约550％、约600％、约650％、约700％、约750％、约800、约850％、约900％、约950％或约1000％或更多。

在实施方案中，与治疗前受试者的目标组织中下游蛋白质的平均水平相比，或与用未缀合于本文公开的环状CPP的AC治疗相比，根据本公开的治疗引起受试者的目标组织中野生型下游蛋白质异构体的表达增加或降低超过约5％，例如约5％、约10％、约15％、约20％、约25％、约30％、约35％、约40％、约45％、约50％、约55％、约60％、约65％、约70％、约75％、约80％、约85％、约90％、约95％和约100％。

在实施方案中，受试者的目标组织是角膜组织或肌肉组织。

如本文所用，术语“提高”、“增加”、“减少”、“降低”等指示相对于对照的值。在实施方案中，合适的对照是基线测量，诸如在开始本文所述的治疗之前对同一个体的测量，或者在没有本文所述治疗的情况下对一个对照个体(或多个对照个体)的测量。“对照个体”是患有相同疾病的个体，年龄和/或性别与正在治疗的个体大致相同(以确保受治疗的个体和对照个体的疾病阶段是同等的)。

正在治疗的个体(也称为“患者”或“受试者”)是患有疾病或有可能发展疾病的个体(胎儿、婴儿、儿童、青少年或成年人)。该个体可能患有异常基因表达或异常基因剪接介导的疾病。在各种实施方案中，患有疾病的个体的下游蛋白质表达或活性水平可能低于未患该疾病的个体中正常野生型蛋白质表达或活性水平的约1％-99％。在实施方案中，该范围包括但不限于正常野生型蛋白质表达或活性水平的小于约80％-99％、小于约65％-80％、小于约50％-65％、小于约30％-50％、小于约25％-30％、小于约20％-25％、小于约15％-20％、小于约10％-15％、小于约5％-10％、小于约1％-5％。在实施方案中，该个体的下游蛋白质表达或活性水平是未患该疾病的个体中正常野生型靶蛋白表达或活性水平的1％-500％。在实施方案中，该范围包括但不限于大于正常野生型靶蛋白表达或活性水平的约1％-10％、约10％-50％、约50％-100％、约100％-200％、约200％-300％、约300％-400％、约400％-500％或约500％-1000％。

在实施方案中，个体是最近已经诊断患有该疾病的个体。通常，早期治疗(在诊断后尽快开始治疗)对于最小化疾病的影响和最大化治疗益处很重要。

某些定义

如说明书和所附权利要求书中所用，除非上下文另外明确指出，否则单数形式“一”、“一种(个)”和“所述(该)”包括复数指示物。因此，例如，提及“一种组合物”包括两种或更多种此类组合物的混合物，提及“一种试剂”包括两种或更多种此类试剂的混合物，提及“该组分”包括两种或更多种此类组分的混合物，等等。

术语“约”当紧接在数值之前时意指一个范围(例如，该值的+或-20％、10％或5％)。例如，除非本公开的上下文另有说明，或者与此类解释不一致，否则“约50”可以意指45至55，“约25,000”可以意指22,500至27,500，等等。例如，在诸如“约49、约50、约55、…”的数值列表中，“约50”意指延伸到小于前后值之间一半间隔的范围，例如，大于49.5至小于52.5。此外，短语“小于约”一个值或“大于约”一个值应该根据本文提供的术语“约”的定义来理解。类似地，在一系列数值或值的范围之前的术语“约”(例如，“约10、20、30”或“约10-30”)分别是指该系列中的所有值或该范围的端点。

如本文所用，“细胞穿透肽”或“CPP”是指促进货物，例如治疗性部分(TM)递送到细胞中的肽。在实施方案中，CPP是环状的，并且被表示为“cCPP”。在实施方案中，cCPP能够指导治疗部分穿透细胞膜。在实施方案中，cCPP将治疗部分递送至细胞的胞质溶胶。在实施方案中，cCPP将反义化合物(AC)递送至前体mRNA所在的细胞位置。

如本文所用，术语“内体逃逸载体”(EEV)是指通过化学连键(即，共价键或非共价相互作用)与接头和/或环外肽(EP)缀合的cCPP。EEV可以是式(B)的EEV。

如本文所用，术语“EEV缀合物”是指本文定义的通过化学连键(即，共价键或非共价相互作用)与货物缀合的内体逃逸载体。货物可以是可以通过EEV递送到细胞中的治疗部分(例如，寡核苷酸、肽或小分子)。EEV缀合物可以是式(C)的EEV缀合物。

如本文所用，术语“环外肽”(EP)和“调节肽”(MP)可互换用于指两个或更多个通过肽键连接的，可与本文公开的环状细胞穿透肽(cCPP)缀合的氨基酸残基。当与本文公开的环肽缀合时，EP可以改变化合物的组织分布和/或保留。通常，EP包含至少一个带正电荷的氨基酸残基，例如至少一个赖氨酸残基和/或至少一个精氨酸残基。本文描述了EP的非限制性实例。EP可以是在本领域中已经被鉴定为“核定位序列”(NLS)的肽。核定位序列的非限制性实例包括SV40病毒大T抗原的核定位序列，其最小功能单位是七个氨基酸的序列PKKKRKV(SEQ ID NO:42)，具有序列NLSKRPAAIKKAGQAKKKK(SEQ ID NO:52)的核质蛋白二分NLS，具有氨基酸序列PAAKRVKLD(SEQ ID NO:53)或RQRRNELKRSF(SEQ ID NO:54)的c-myc核定位序列，来自输入蛋白-α的IBB结构域的序列RMRKFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(SEQ ID NO:50)，肌瘤T蛋白的序列VSRKRPRP(SEQ ID NO:57)和PPKKARED(SEQ ID NO:58)，人p53的序列PQPKKKPL(SEQ ID NO:59)，小鼠c-abl IV的序列SALIKKKKKMAP(SEQ ID NO:60)，流感病毒NS1的序列DRLRR(SEQ ID NO:61)和PKQKKRK(SEQ ID NO:62)，肝炎病毒δ抗原的序列RKLKKKIKKL(SEQ ID NO:63)，小鼠Mxl蛋白的序列REKKKFLKRR(SEQ ID NO:64)，人聚(ADP-核糖)聚合酶的序列KRKGDEVDGVDEVAKKKSKK(SEQ ID NO:65)，以及类固醇激素受体(人)糖皮质激素的序列RKCLQAGMNLEARKTKK(SEQ ID NO:66)。国际公开号2001/038547描述了NLS的另外的实例，并且通过引用整体并入本文。

如本文所用，“接头”或“L”是指将一个或多个部分(例如，环外肽(EP)和货物，例如寡核苷酸、肽或小分子)共价键合到环状细胞穿透肽(cCPP)上的部分。接头可以包含天然或非天然的氨基酸或多肽。接头可以是含有两个或更多个适当官能团的合成化合物，所述官能团适于将cCPP结合到货物部分，从而形成本文公开的化合物。接头可以包含聚乙二醇(PEG)部分。接头可以包含一个或多个氨基酸。cCPP可以经由接头共价结合到货物上。

术语“肽”、“蛋白质”和“多肽”可互换用于指包含两个或更多个氨基酸的天然或合成分子，所述两个或更多个氨基酸通过一个氨基酸的羧基与另一个氨基酸的α氨基连接。两个或更多个氨基酸残基可以通过一个氨基酸的羧基与α氨基连接。多肽的两个或更多个氨基酸可以通过肽键连接。多肽可以包括肽骨架修饰，其中两个或更多个氨基酸通过除肽键以外的键共价附接。多肽可以包括一个或多个非天然氨基酸、氨基酸类似物或能够整合到多肽中的其他合成分子。术语多肽包括天然存在和人工产生的氨基酸。术语多肽包括例如包含约2至约100个氨基酸残基的肽，以及包含超过约100个氨基酸残基或超过约1000个氨基酸残基的蛋白质，包括但不限于治疗性蛋白质，诸如抗体、酶、受体、可溶性蛋白质等。

如本文所用，术语“连续”是指通过共价键连接的两个氨基酸。例如，在代表性的环状细胞穿透肽(cCPP)诸如的情况下，AA₁/AA₂、AA₂/AA₃、AA₃/AA₄和AA₅/AA₁例示了连续氨基酸对。

如本文所用，化学物质的残基是指特定产物中存在的化学物质的衍生物。为了形成产物，该物质的至少一个原子被与另一部分的键取代，使得该产物含有该化学物质的衍生物或残基。例如，本文所述的环状细胞穿透肽(cCPP)具有通过形成一个或多个肽键而掺入其中的氨基酸(例如，精氨酸)。掺入cCPP的氨基酸可称为残基，或简称为氨基酸。例如，精氨酸或精氨酸残基是指

术语“其质子化形式”是指氨基酸或侧链的质子化形式。例如，精氨酸侧链上的胍基可以被质子化形成胍鎓基团。精氨酸质子化形式的结构是

如本文所用，术语“手性”是指具有一种以上立体异构体的分子，这些立体异构体在原子的三维空间排列上不同，其中一种立体异构体是另一种立体异构体的不可重叠的镜像。除了甘氨酸以外，氨基酸具有与羧基相邻的手性碳原子。术语“对映异构体”是指具有手性的立体异构体。手性分子可以是具有“D”和“L”对映异构体的氨基酸残基。没有手性中心的分子，诸如甘氨酸，可以称为“非手性的”。

如本文所用，术语“疏水性”是指不溶于水或在水中溶解度极小的部分。通常，中性部分和/或非极性部分，或者主要是中性和/或非极性的部分是疏水性的。疏水性可以通过本文公开的方法之一来测量。

如本文所用，“芳族”是指具有4n+2个π电子的不饱和环状分子，其中n是任何整数。下面定义的“杂芳族”是芳族的子集。芳族氨基酸的实例包括苯丙氨酸和萘丙氨酸。术语“非芳族”是指不属于芳族定义的任何分子。例如，任何不属于芳族定义的直链、支链或环状分子都是非芳族的。非芳族氨基酸的实例包括但不限于甘氨酸和瓜氨酸。

“烷基”、“烷基链”或“烷基基团”是指具有1至40个碳原子并且通过单键与分子的其余部分附接的完全饱和的直链或支链烃基。包括含有1至40个任意数量的碳原子的烷基。包含至多40个碳原子的烷基是C₁-C₄₀烷基，包含至多10个碳原子的烷基是C₁-C₁₀烷基，包含至多6个碳原子的烷基是C₁-C₆烷基，并且包含至多5个碳原子的烷基是C₁-C₅烷基。C₁-C₅烷基包括C₅烷基、C₄烷基、C₃烷基、C₂烷基和C₁烷基(即，甲基)。C₁-C₆烷基包括以上针对C₁-C₅烷基描述的所有部分，但也包括C₆烷基。C₁-C₁₀烷基包括以上针对C₁-C₅烷基和C₁-C₆烷基描述的所有部分，但也包括C₇、C₈、C₉和C₁₀烷基。类似地，C₁-C₁₂烷基包括所有前述部分，但也包括C₁₁和C₁₂烷基。C₁-C₁₂烷基的非限制性实例包括甲基、乙基、正丙基、异丙基、仲丙基、正丁基、异丁基、仲丁基、叔丁基、正戊基、叔戊基、正己基、正庚基、正辛基、正壬基、正癸基、正十一烷基和正十二烷基。除非在说明书中另有特别说明，否则烷基可任选地被取代。

“亚烷基”、“亚烷基链”或“亚烷基基团”是指具有1至40个碳原子的完全饱和的直链或支链二价烃链基团。C₂-C₄₀亚烷基的非限制性实例包括亚乙基、亚丙基、正-亚丁基、亚乙烯基、亚丙烯基、正-亚丁烯基、亚丙炔基、正-亚丁炔基等。除非在说明书中另有特别说明，否则亚烷基链可任选地被取代。

“烯基”、“烯基链”或“烯基基团”是指具有2至40个碳原子并具有一个或多个碳-碳双键的直链或支链烃链基团。每个烯基基团通过单键与分子的其余部分附接。包括含有2至40个任意数量的碳原子的烯基基团。包含至多40个碳原子的烯基基团是C₂-C₄₀烯基，包含至多10个碳原子的烯基是C₂-C₁₀烯基，包含至多6个碳原子的烯基基团是C₂-C₆烯基，并且包含至多5个碳原子的烯基是C₂-C₅烯基。C₂-C₅烯基包括C₅烯基、C₄烯基、C₃烯基和C₂烯基。C₂-C₆烯基包括以上针对C₂-C₅烯基描述的所有部分，但也包括C₆烯基。C₂-C₁₀烯基包括以上针对C₂-C₅烯基和C₂-C₆烯基描述的所有部分，但也包括C₇、C₈、C₉和C₁₀烯基。类似地，C₂-C₁₂烯基包括所有前述部分，但也包括C₁₁和C₁₂烯基。C₂-C₁₂烯基的非限制性实例包括乙烯基(乙烯基)、1-丙烯基、2-丙烯基(烯丙基)、异丙烯基、2-甲基-1-丙烯基、1-丁烯基、2-丁烯基、3-丁烯基、1-戊烯基、2-戊烯基、3-戊烯基、4-戊烯基、1-己烯基、2-己烯基、3-己烯基、4-己烯基、5-己烯基、1-庚烯基、2-庚烯基、3-庚烯基、4-庚烯基、5-庚烯基、6-庚烯基、1-辛烯基、2-辛烯基、3-辛烯基、4-辛烯基、5-辛烯基、6-辛烯基、7-辛烯基、1-壬烯基、2-壬烯基、3-壬烯基、4-壬烯基、5-壬烯基、6-壬烯基、7-壬烯基、8-壬烯基、1-癸烯基、2-癸烯基、3-癸烯基、4-癸烯基、5-癸烯基、6-癸烯基、7-癸烯基、8-癸烯基、9-癸烯基、1-十一碳烯基、2-十一碳烯基、3-十一碳烯基、4-十一碳烯基、5-十一碳烯基、6-十一碳烯基、7-十一碳烯基、8-十一碳烯基、9-十一碳烯基、10-十一碳烯基、1-十二碳烯基、2-十二碳烯基、3-十二碳烯基、4-十二碳烯基、5-十二碳烯基、6-十二碳烯基、7-十二碳烯基、8-十二碳烯基、9-十二碳烯基、10-十二碳烯基和11-十二碳烯基。除非在说明书中另有特别说明，否则烷基可任选地被取代。

“亚烯基”、“亚烯基链”或“亚烯基基团”是指具有2至40个碳原子并具有一个或多个碳-碳双键的直链或支链二价烃链基团。C₂-C₄₀亚烯基的非限制性实例包括乙烯、丙烯、丁烯等。除非在说明书中另有特别说明，否则亚烯基链可任选的。

“烷氧基”或“烷氧基基团”是指基团-OR，其中R是如本文定义的烷基、烯基、炔基、环烷基或杂环基。除非在说明书中另有特别说明，否则烷氧基基团可任选地被取代。

“酰基”或“酰基基团”是指基团-C(O)R，其中R是如本文所定义的氢、烷基、烯基、炔基、碳环基或杂环基。除非在说明书中另有特别说明，否则酰基可任选地被取代。

“烷基氨基甲酰基”或“烷基氨基甲酰基基团”是指基团-O-C(O)-NR_aR_b，其中R_a和R_b相同或不同，并且独立地是如本文所定义的烷基、烯基、炔基、芳基、杂芳基，或者R_aR_b可以一起形成如本文所定义的环烷基基团或杂环基基团。除非在说明书中另有特别说明，否则烷基氨基甲酰基基团可任选地被取代。

“烷基甲酰胺基”或“烷基甲酰胺基基团”是指基团–C(O)-NR_aR_b，其中R_a和R_b相同或不同，并且独立地是如本文所定义的烷基、烯基、炔基、芳基、杂芳基、环烷基、环烯基、环炔基或杂环基基团，或者R_aR_b可以一起形成如本文所定义的环烷基基团。除非在说明书中另有特别说明，否则烷基甲酰胺基基团可任选地被取代。

“芳基”是指包含氢、6至18个碳原子和至少一个芳环的烃环系基团。为了本发明的目的，芳基基团可以是单环、双环、三环或四环环系，其可以包括稠环或桥环环系。芳基基团包括但不限于衍生自醋蒽烯、苊烯、醋菲烯、蒽、甘菊环、苯、荧蒽、芴、as-二戊(熳)环并苯(as-indacene)、s-二戊(熳)环并苯(s-indacene)、茚满、茚、萘、非那烯(phenalene)、菲、七曜烯(pleiadene)、芘和苯并菲(triphenylene)的芳基基团。除非在说明书中另有具体说明，否则术语“芳基”意在包括任选地被取代的芳基基团。

“杂芳基”是指包含氢原子，1至13个碳原子，1至6个选自氮、氧和硫的杂原子和至少一个芳环的5至20元环系基团。为了本发明的目的，杂芳基基团可以是单环、双环、三环或四环环系，其可以包括稠环或桥环环系；并且杂芳基基团中的氮、碳或硫原子可以任选地被氧化；氮原子可以任选被季铵化。实例包括但不限于氮杂环庚三烯基、吖啶基、苯并咪唑基、苯并噻唑基、苯并吲哚基、苯并二氧杂环戊烯基、苯并呋喃基、苯并噁唑基、苯并噻唑基、苯并噻二唑基、苯并[b][1,4]二氧杂环庚烯基、1,4-苯并二氧六环基、苯并萘并呋喃基、苯并噁唑基、苯并二氧代基、苯并二氧杂环己烯基、苯并吡喃基、苯并吡喃酮基(benzopyranonyl)、苯并呋喃基、苯并呋喃酮基(benzofuranonyl)、苯并噻吩基(benzothienyl)(苯并噻吩基(benzothiophenyl))、苯并三唑基、苯并[4,6]咪唑[1,2-a]吡啶基、咔唑基、噌啉基、二苯并呋喃基、二苯并噻吩基、呋喃基、呋喃酮基、异噻唑基、咪唑基、吲唑基、吲哚基、吲唑基、异吲哚基、吲哚啉基、异吲哚啉基、异喹啉基、吲嗪基、异噁唑基、萘啶基、噁二唑基、2-氧代环庚三烯基、噁唑基、环氧乙烷基、1-氧代吡啶基、1-氧代嘧啶基、1-氧代吡嗪基、1-氧代哒嗪基、1-苯基-1H-吡咯基、吩嗪基、吩噻嗪基、吩噁嗪基、酞嗪基、蝶啶基、嘌呤基、吡咯基、吡唑基、吡啶基、吡嗪基、嘧啶基、哒嗪基、喹唑啉基、喹喔啉基、喹啉基、奎宁环基、异喹啉基、四氢喹啉基、噻唑基、噻二唑基、三唑基、四唑基、三嗪基和噻吩基(thiophenyl)(即，噻吩基(thienyl))。除非在说明书中另有特别说明，否则杂芳基基团可任选地被取代。

本文使用的术语“经取代的”意指任何上述基团(即，烷基、烯基、炔基、环烷基、环烯基、环炔基、杂环基、芳基、杂芳基、烷氧基、芳氧基、酰基、烷基氨基甲酰基、烷基甲酰胺基、烷氧基羰基、烷硫基或芳硫基)，其中至少一个原子被非氢原子置换，非氢原子诸如但不限于：卤素原子，诸如F、Cl、Br和I；诸如羟基基团、烷氧基基团和酯基等基团中的氧原子；诸如硫醇基团、硫代烷基基团、砜基、磺酰基基团和亚砜基团等基团中的硫原子；诸如胺、酰胺、烷基胺、二烷基胺、芳基胺、烷基芳基胺、二芳基胺、N-氧化物、酰亚胺和烯胺等基团中的氮原子；诸如三烷基甲硅烷基基团、二烷基芳基甲硅烷基基团、烷基二芳基甲硅烷基基团和三芳基甲硅烷基基团中的硅原子；以及各种其他基团中的其他杂原子。“经取代的”也意指任何上述基团，其中一个或多个原子被与杂原子的高阶键(如双键或三键)置换，该杂原子诸如氧代、羰基、羧基和酯基中的氧；和诸如亚胺、肟、腙和腈等基团中的氮。例如，“经取代的”包括任何上述基团，其中一个或多个原子被-NR_gR_h、-NR_gC(＝O)R_h、-NR_gC(＝O)NR_gR_h、-NR_gC(＝O)OR_h、-NR_gSO₂R_h、-OC(＝O)NR_gR_h、-OR_g、-SR_g、-SOR_g、-SO₂R_g、-OSO₂R_g、-SO₂OR_g、＝NSO₂R_g和-SO₂NR_gR_h置换。“经取代的”还意指任何上述基团，其中一个或多个氢原子被-C(＝O)R_g、-C(＝O)OR_g、-C(＝O)NR_gR_h、-CH₂SO₂R_g、-CH₂SO₂NR_gR_h置换。在前述内容中，R_g和R_h相同或不同，并且独立地为氢、烷基、烯基、炔基、烷氧基、烷基氨基、硫代烷基、芳基、芳烷基、环烷基、环烯基、环炔基、环烷基烷基、卤代烷基、卤代烯基、卤代炔基、杂环基、N-杂环基、杂环基烷基、杂芳基、N-杂芳基和/或杂芳基烷基。“经取代的”还意指任何上述基团，其中一个或多个原子被氨基、氰基、羟基、亚氨基、硝基、氧代、硫氧代、卤代、烷基、烯基、炔基、烷氧基、烷基氨基、硫代烷基、芳基、芳烷基、环烷基、环烯基、环炔基、环烷基烷基、卤代烷基、卤代烯基、卤代炔基、杂环基、N-杂环基、杂环基烷基、杂芳基、N-杂芳基和/或杂芳基烷基基团置换。“经取代的”也可以意指侧链上的一个或多个原子被烷基、烯基、炔基、酰基、烷基羧酰胺基、烷氧羰基、碳环基、杂环基、芳基或杂芳基置换的氨基酸。另外，每个前述取代基也可以任选地被一个或多个上述取代基取代。

如本文所用，符号(下文可称为“附接键点”)表示作为两个化学实体之间的附接点的键，其中一个化学实体被描绘为附接到附接键点，另一个化学实体未被描绘为附接到附接键点。例如，指示化学实体“XY”经由附接键点键合到另一个化学实体。此外，与未描绘的化学实体的具体附接点可以通过推断来指定。例如，化合物CH₃R³，其中R³是H或推断当R³是“XY”时，附接键点是与将R³描绘为键合至CH₃的键相同的键。

如本文所用,“受试者”意指个体。因此，“受试者”可以包括家养动物(例如，猫、狗等)、家畜(例如，牛、马、猪、绵羊、山羊等)、实验动物(例如，小鼠、兔、大鼠、豚鼠等)和鸟。“受试者”还可以包括哺乳动物，诸如灵长类动物或人。因此，受试者可以是人或兽医患者。术语“患者”是指在临床医生(例如，医师)治疗下的受试者。

术语“抑制(inhibit)”、“抑制(inhibiting)”或“抑制(inhibition)”是指活性、表达、功能或其他生物参数的降低，并且可以包括但不要求活性、表达、功能或其他生物参数的完全消除。抑制可以包括，例如，与对照相比，活性、反应、病状或疾病减少至少约10％。在实施方案中，基因或蛋白质的表达、活性或功能降低统计学上显著的量。在实施方案中，活性或功能降低至少约10％、约20％、约30％、约40％、约50％，并且高达约60％、约70％、约80％、约90％或约100％。

“减少(reduce)”或该词的其他形式，诸如“减少(reducing)”或“减少(reduction)”，意指降低事件或特征(例如，肿瘤生长)。应当理解，这通常与某个标准值或期望值相关，换句话说，这是相对的，但是并不总是需要参考标准值或相对值。例如，“降低肿瘤生长”意指相对于标准或对照(例如，未治疗的肿瘤)降低肿瘤的生长速率。

如本文所用，“治疗(treat)”、“治疗(treating)”、“治疗(treatment)”及其变型是指部分或完全减轻、改善、缓解、抑制、延迟本文所述的疾病发作、降低其严重程度和/或降低疾病的一种或多种症状或特征的发生率的所公开化合物的任何施用。就患者而言，术语“治疗”是指对患者的医学管理，旨在治愈、改善、稳定或预防疾病、病理状况或病症。该术语包括积极治疗，即专门针对改善疾病、病理状况或病症的治疗，也包括病因治疗，即针对去除相关疾病、病理状况或病症的原因的治疗。此外，该术语还包括姑息治疗，即设计用于缓解症状而非治愈疾病、病理状况或病症的治疗；预防性治疗，即旨在最小化或部分或完全抑制相关疾病、病理状况或病症的发展的治疗；和支持性治疗，即用于补充另一种针对改善相关疾病、病理状况或病症的特定疗法的治疗。

术语“治疗有效”是指所使用的公开的化合物和/或组合物的量是足以改善疾病或病症的一种或多种原因或症状的量。此类改善只需要减少或改变，不一定消除。

术语“药学上可接受的”是指那些化合物、材料、组合物和/或剂型在合理的医学判断范围内，适合接触人类和/或动物的组织使用而无过度毒性、刺激、过敏反应或其它问题或并发症，与合理的效益/风险比相称。

术语“载剂”意指一种化合物、组合物、物质或结构，当与本公开的化合物或组合物组合时，有助于或促进该化合物或组合物的制备、储存、施用、递送、有效性、选择性或任何其他用于其预期用途或目的的特征，或它们的组合。例如，可以选择载剂以最小化活性成分的任何降解并最小化在受试者中的任何不利副作用。

如本文所用，术语“药学上可接受的载剂”是指适于给患者施用的载剂。药物载剂可以是有助于或促进本公开的化合物或组合物的制备、储存、施用、递送、有效性、选择性或任何其他特征以用于其预期用途或目的或它们的组合的物质。例如，可以选择载剂来减少化合物的降解或减少在患者中的不良副作用。在实施方案中，药学上可接受的载剂可以是无菌的水性或非水性溶液、分散体、混悬液或乳液，以及用于在使用前重构为无菌注射溶液或分散体的无菌粉末。合适的水性和非水性载剂、稀释剂、溶剂或媒介物的实例包括水、乙醇、多元醇(诸如甘油、丙二醇、聚乙二醇等)，羧甲基纤维素及其合适的混合物、植物油(诸如橄榄油)以及可注射有机酯，诸如油酸乙酯。可以例如通过使用诸如卵磷脂的包衣材料、在分散液的情况下通过维持所要求的粒度、以及通过使用表面活性剂来维持适当流动性。这些组合物还可以含有佐剂，诸如防腐剂、润湿剂、乳化剂和分散剂。可以通过包括各种抗细菌剂和抗真菌剂(诸如对羟苯甲酸酯、三氯叔丁醇、山梨酸苯酚等)确保防止微生物的作用。还令人希望的是包含等渗剂，诸如糖、氯化钠等。可注射制剂可通过以下进行灭菌，例如，通过细菌截留过滤器(bacterial-retaining filter)过滤或通过掺入无菌固体组合物形式的灭菌剂，该灭菌剂可以就在使用前溶解或分散于无菌水或其它无菌可注射介质中。合适的惰性载剂可以包括糖，诸如乳糖。

术语“药学上可接受的盐”包括通过起碱作用的活性化合物与无机酸或有机酸反应形成盐而获得的那些盐，所述盐例如盐酸、硫酸、磷酸、甲磺酸、樟脑磺酸、草酸、马来酸、琥珀酸、柠檬酸、甲酸、氢溴酸、苯甲酸、酒石酸、富马酸、水杨酸、扁桃酸、碳酸等的盐。本领域技术人员将进一步认识到，酸加成盐可以经由许多已知方法中的任何一种，通过化合物与适当的无机酸或有机酸的反应来制备。术语“药学上可接受的盐”还包括通过起酸作用的活性化合物与无机碱或有机碱反应形成盐而获得的那些盐，所述盐例如乙二胺、N-甲基-葡糖胺、赖氨酸、精氨酸、鸟氨酸、胆碱、N,N'-二苄基乙二胺、氯普鲁卡因、二乙醇胺、普鲁卡因、N-苄基苯乙胺、二乙胺、哌嗪、三(羟甲基)-氨基甲烷、氢氧化四甲铵、三乙胺、二苄胺、二苯羟甲胺(ephenamine)、脱氢枞胺、N-乙基哌啶、苄胺、四甲基铵、四乙基铵、甲胺、二甲胺、三甲胺、乙胺、碱性氨基酸等的盐。无机盐或金属盐的非限制性实例包括锂盐、钠盐、钙盐、钾盐、镁盐等。

如本文所用，术语“肠胃外施用”是指通过注射或输注施用。肠胃外施用包括但不限于皮下施用、静脉内施用或肌肉内施用。

如本文所用，术语“皮下施用”是指刚好在皮肤下施用。“静脉内施用”意指施用到静脉中。

如本文所用，术语“剂量”是指在单次施用中提供的药剂的指定量。在实施方案中，一个剂量可以以两个或更多个丸剂、片剂或注射剂的形式施用。在期望皮下施用的实施方案中，期望的剂量需要单次注射不容易适应的体积。在此类实施方案中，可以使用两次或更多次注射来实现期望的剂量。在实施方案中，可以在两次或更多次注射中施用剂量，以减少患者的注射部位反应。

如本文所用，术语“剂量单位”是指提供药剂的形式。在实施方案中，剂量单位是包含本文所述的冻干化合物或组合物的小瓶。在实施方案中，剂量单位是包含本文所述的重构化合物或组合物的小瓶。

术语“治疗部分”(TM)是指可用于治疗疾病或病症的至少一种症状的化合物，并且可包括但不限于治疗性多肽、寡核苷酸、小分子和可用于治疗疾病或病症的至少一种症状的其他试剂。在实施方案中，TM调节靶转录物的活性、表达和/或水平。在实施方案中，TM通过衰减机制降低靶转录物的水平。在实施方案中，活性是靶转录物结合(例如隔绝)一种或多种蛋白质的能力。在实施方案中，TM通过降低靶转录物与一种或多种与靶转录物结合的蛋白质之间的亲和力来调节靶转录物的活性。由于降低了靶转录物和该一种或多种蛋白质之间的亲和力，该一种或多种蛋白质的活性可以被调节。例如，如果该一种或多种蛋白质不与靶转录物结合，它们可用于执行它们的功能，例如促进其他转录物的剪接、选择性剪接和/或外显子跳跃。由于TM的功能，可以调节由该一种或多种蛋白质调控的下游基因的活性、表达和/或水平，所述蛋白质与靶转录物的相互作用被TM破坏。

术语“调节(modulate)”、“调节(modulating)”和“调节(modulation)”是指与调节之前的表达、功能或活性水平相比，表达、功能或活性的扰动。调节可以包括表达、功能或活性的增加(刺激或诱导)或降低(抑制或减少)。在实施方案中，靶转录物的活性受到调节。在实施方案中，调节靶转录物的活性包括降低靶转录物与一种或多种蛋白质结合的能力。在实施方案中，降低靶转录物和该一种或多种蛋白质之间的亲和力导致调节与靶转录物相互作用的该一种或多种蛋白质的活性。例如，如果该一种或多种蛋白质不与靶转录物结合，它们可用于执行它们的功能，例如促进其他转录物(例如，下游转录物)的剪接、选择性剪接和/或外显子跳跃。因此，调节靶转录物的活性可以导致由该一种或多种蛋白质调控的下游基因的活性、表达和/或水平的调节，所述蛋白质与靶转录物的相互作用可能被破坏。

“氨基酸”是指包括氨基和羧酸基团并具有通式的有机化合物，其中R可以是任何有机基团。氨基酸可以是天然存在的氨基酸或非天然存在的氨基酸。氨基酸可以是蛋白原性氨基酸或非蛋白原性氨基酸。氨基酸可以是L-氨基酸或D-氨基酸。术语“氨基酸侧链”或“侧链”是指与天然或非天然α-氨基酸的α-碳结合的特征性取代基(“R”)。氨基酸可以通过肽键掺入到多肽中。

如本文所用,“不带电荷的”氨基酸是具有在pH 7.35至7.45下具有净中性电荷的侧链的氨基酸。不带电荷的氨基酸的实例包括但不限于甘氨酸和瓜氨酸。

如本文所用,“带电荷的”氨基酸是具有在pH 7.35至7.45下具有净电荷的侧链的氨基酸。带电荷的氨基酸的实例是精氨酸。

如本文所用，术语“序列同一性”分别是指两个寡核苷酸或多肽序列之间相同且处于相同相对位置的核酸或氨基酸的百分比。因此，一个序列与另一个序列相比具有一定百分比的序列同一性。对于序列比较而言，通常一个序列用作参考序列，将测试序列与其做比较。本领域普通技术人员将会理解，如果两个序列在相应位置含有相同残基，则通常认为它们是“基本上相同的”。在实施方案中，序列之间的序列同一性可以使用Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-453)确定，如截至申请日存在的版本的EMBOSS包的Needle程序(EMBOSS:The European Molecular Biology Open SoftwareSuite,Rice et al.,Trends Genet.(2000),16:276-277)中实施。使用的参数是空位开放罚分10、空位延伸罚分0.5和EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。标有“最长同一性”的针头输出(使用-nobrief选项获得)用作百分比同一性且计算如下：(相同残基×100)/(比对长度-比对空位总数)

在其他实施方案中，序列同一性可以使用截至申请日存在的版本的Smith-Waterman算法来确定。

如本文所用，“序列同源性”是指两个多肽序列之间同源且处于相同相对位置的氨基酸百分比。因此，一个多肽序列与另一个多肽序列相比具有一定百分比的序列同源性。如本领域普通技术人员将理解的，如果两个序列在相应位置含有同源残基，则通常认为它们是“基本上同源”。同源残基可以是相同的残基。可替代地，同源残基可以是具有适当相似的结构和/或功能特征的不同残基。例如，如本领域普通技术人员熟知的，通常将某些氨基酸分类为“疏水性”或“亲水性”氨基酸，和/或分类为具有“极性”或“非极性”侧链，并且一个氨基酸取代同一类型的另一个氨基酸通常可以视为“同源”取代。

如本领域中熟知的，可以使用多种算法中的任何一种来比较氨基酸序列，这些算法包括商业计算机程序中可用的那些算法，诸如截至申请日存在的BLASTP、空位BLAST和PSI-BLAST。此类程序在Altschul等人，J.Mol.Biol.,(1990),215(3):403-410；Altschul等人，Nucleic Acids Res.(1997),25:3389-3402；Baxevanis等人，Bioinformatics APractical Guide to the Analysis of Genes and Proteins,Wiley,1998；及Misener等人，(编辑),Bioinformatics Methods and Protocols(Methods in Molecular Biology，第132卷),Humana Press,1999中有描述。除了鉴定同源序列外，以上提到的程序通常还提供对同源性程度的指示。

如本文所用，“细胞靶向部分”是指与靶细胞表面上的分子诸如受体特异性结合的分子或大分子。在实施方案中，细胞表面分子仅在靶细胞的表面上表达。在实施方案中，细胞表面分子也存在于一个或多个非靶细胞的表面上，但是细胞表面分子表达的量在靶细胞的表面上更高。细胞靶向部分的实例包括但不限于抗体、肽、蛋白质、适体或小分子。

如本文所用，术语“反义化合物”和“AC”可互换用于指一种聚合核酸结构，该结构至少部分互补于与它(AC)杂交的靶核酸分子。AC可以是短(在实施方案中，少于50个碱基)多核苷酸或多核苷酸同源物，其包括与靶序列互补的序列的至少一部分。在实施方案中，AC是多核苷酸或多核苷酸同源物，其包括具有与靶前体mRNA链中的靶序列互补的序列的部分。AC可以由天然核酸、合成核酸、核酸同源物或它们的任何组合形成。在实施方案中，AC包括寡核苷。在实施方案中，AC包括反义寡核苷酸。在实施方案中，AC包括缀合基团。AC的非限制性实例包括但不限于引物、探针、反义寡核苷酸、外部指导序列(EGS)寡核苷酸、siRNA、寡核苷酸、寡核苷、寡核苷酸类似物、寡核苷酸模拟物以及这些的嵌合组合。因此，这些化合物可以以单链、双链、环状、支链或发夹的形式引入，并且可以含有诸如内部或末端凸起或环的结构元件。寡聚双链化合物可以是杂交形成双链化合物的两条链，或者是具有足够自身互补性以允许完全或部分双链化合物的杂交和形成的单链。在实施方案中，AC调节(增加、降低或改变)靶转录物(例如，靶核酸)的表达、水平和/或活性。在实施方案中，AC通过诱导衰减机制降低靶转录物的水平。在实施方案中，AC调节靶转录物的活性。在实施方案中，AC通过降低靶转录物结合一种或多种蛋白质的能力来调节靶转录物的活性。在实施方案中，降低靶转录物和该一种或多种蛋白质之间的亲和力可导致调节该一种或多种蛋白质的活性。例如，如果该一种或多种蛋白质不与靶转录物结合，它们可用于执行它们的功能，例如促进其他转录物(下游转录物)的剪接、选择性剪接和/或外显子跳跃。因此，AC介导调节靶转录物的活性可以导致由该一种或多种蛋白质调控的下游基因的活性、表达和/或水平的调节，所述蛋白质与靶转录物的相互作用可能被破坏。

如本文所用，术语“靶向”或“靶向至”是指治疗部分(例如反义化合物)与靶核酸分子或靶核酸分子的区域的缔合。在实施方案中，治疗部分包括能够在生理条件下与靶核酸杂交的反义化合物。在实施方案中，反义化合物靶向靶核酸内的具体部分或位点，例如，靶核酸的具有至少一种可识别的结构、功能或特征的部分，诸如特定的外显子或内含子，或外显子或内含子内选定的核碱基或基序。

如本文所用，术语“靶核酸序列”、“靶核苷酸序列”和“靶序列”是指治疗部分(诸如反义化合物)与之结合或杂交的核酸序列或核苷酸序列。靶核酸包括但不限于靶转录物的一部分、靶RNA(包括但不限于前体mRNA和mRNA或其部分)、源自此类RNA的靶cDNA的一部分以及靶非翻译RNA的一部分(诸如miRNA)。例如，在实施方案中，靶核酸可以是靶细胞基因(或从此类基因转录的mRNA)的一部分，其表达或转录与特定的病症或疾病状态相关。术语“部分”是指核酸中限定数量的连续(即连接的)核苷酸。

如本文所用，术语“转录物”或“基因转录物”是指从DNA转录的RNA分子，包括但不限于mRNA、前体mRNA和部分加工的RNA。

术语“靶转录物”和“靶RNA”是指治疗部分所结合的前体mRNA或mRNA转录物。靶转录物可以包括靶核苷酸序列。在实施方案中，靶转录物包括靶核苷酸序列，该靶核苷酸序列包括扩增的CUG三核苷酸重复序列。

术语“靶基因”和“目标基因”是指期望或预期调节其表达和/或活性的基因。靶基因可以转录成包括靶核苷酸序列的靶转录物。靶转录物可以翻译成目标蛋白质。

术语“靶蛋白”是指由靶转录物(例如，靶mRNA)编码的多肽或蛋白质。

如本文所用，术语“mRNA”是指编码蛋白质的RNA分子，包括前体mRNA和成熟mRNA。“前体mRNA”是指DNA转录后直接新合成的真核mRNA分子。在实施方案中，前体mRNA被5’帽进行加帽，用3'聚A尾修饰，和/或剪接产生成熟mRNA序列。在实施方案中，前体mRNA包括一个或多个内含子。在实施方案中，前体mRNA经历称为剪接的过程以去除内含子并连接外显子。在实施方案中，前体mRNA包括一个或多个剪接元件或剪接调控元件。在实施方案中，前体mRNA包括聚腺苷酸化位点。

如本文所用，术语“表达”、“基因表达”、“基因的表达”等是指基因中编码的信息在细胞中转化为功能性基因产物，诸如多肽或非编码RNA的所有功能和步骤。非编码RNA的实例包括转运RNA(tRNA)和核糖体RNA。多肽的基因表达包括转录基因以形成前体mRNA，加工前体mRNA以形成成熟mRNA，将成熟mRNA从细胞核易位到细胞质，将成熟mRNA翻译成多肽，以及装配编码的多肽。表达包括部分表达。例如，基因的表达可以称为基因转录物的生成。成熟mRNA的翻译可以称为成熟mRNA的表达。

如本文所用，“基因表达的调节”等是指一种或多种与基因表达相关的过程的调节。例如，基因表达的修饰可以包括基因转录、RNA加工、RNA从细胞核向细胞质的易位和mRNA翻译成蛋白质中的一种或多种的修饰。

如本文所用，术语“基因”是指涵盖与基因产物的表达相关的5’启动子区，及任何内含子区和外显子区以及与基因产物的表达相关的3’非翻译区(“UTR”)的核酸序列。

术语“免疫细胞”是指造血来源的细胞，并且在免疫反应中起作用。免疫细胞包括但不限于淋巴细胞(例如，B细胞和T细胞)、自然杀伤(NK)细胞和骨髓细胞。术语“骨髓细胞”包括单核细胞、巨噬细胞和粒细胞(例如，嗜碱性粒细胞、嗜中性粒细胞、嗜酸性粒细胞和肥大细胞)。单核细胞是循环通过血液1-3天的淋巴细胞，此后，它们迁移到组织中并分化为巨噬细胞或炎性树突细胞，或者死亡。如本文使用的术语“巨噬细胞”包括胎儿来源的巨噬细胞(也可称为常驻组织巨噬细胞)和源自已经从血流迁移到体内组织的单核细胞的巨噬细胞(也可称为单核细胞来源的巨噬细胞)。根据巨噬细胞所在的组织，它称为库普弗细胞(肝)、肾小球膜内系膜细胞(肾)、肺泡巨噬细胞(肺)、窦组织细胞(淋巴结)、霍夫鲍尔细胞(胎盘)、小胶质细胞(脑和脊髓)或朗格汉斯细胞(皮肤)等。

如本文所用，术语“寡核苷酸”是指包含多个连接的核苷酸或核苷的寡聚化合物。寡核苷酸的一个或多个核苷酸可以是经修饰的。寡核苷酸可以包括核糖核酸(RNA)或脱氧核糖核酸(DNA)。寡核苷酸可以由天然和/或经修饰的核碱基、糖和共价核苷间连键组成，并且还可包括非核酸缀合物。

如本文所用，术语“核苷”是指包括核碱基和糖的糖基胺。核苷包括但不限于天然核苷、脱碱基核苷、经修饰的核苷和具有模拟碱基和/或糖基的核苷。“天然核苷”或“未修饰的核苷”是包括天然核碱基和天然糖的核苷。天然核苷包括RNA和DNA核苷。

如本文所用，术语“天然糖”是指未从其在RNA(2'-OH)或DNA(2'-H)中天然存在的形式修饰的核苷的糖。

如本文所用，术语“核苷酸”是指具有共价连接到糖上的磷酸基团的核苷。核苷酸可以用多种取代基中的任何一种进行修饰。

如本文所用，术语“核碱基”是指核苷或核苷酸的碱基部分。核碱基可以包括能够氢键键合到另一个核酸的碱基上的任何原子或原子团。天然核碱基是未从其在RNA或DNA中天然存在的形式修饰的核碱基。

如本文所用，术语“杂环碱基部分”是指包括杂环的核碱基。

如本文所用，“核苷间连键”是指相邻核苷之间的共价连键。

如本文所用，“天然核苷间连键”是指3’至5’磷酸二酯连键。

如本文所用，术语“经修饰的核苷间连键”是指核苷或核苷酸之间除天然存在的核苷间连键以外的任何连键。

如本文所用，“寡核苷”是指核苷间连键不含磷原子的寡核苷酸。

如本文所用，术语“嵌合反义化合物”是指具有至少一个糖、核碱基和/或核苷间连键与相同寡聚化合物内的其他糖、核碱基和核苷间连键相比进行差异性修饰的反义化合物。其余的糖、核碱基和核苷间连键可以独立地修饰或未修饰。一般而言，嵌合寡聚化合物将具有经修饰的核苷，这些核苷可以处于分离的位置或在将会限定特定基序的区域中聚集在一起。修饰和/或模拟基团的任何组合可以包括如本文所述的嵌合寡聚化合物。

如本文所用，术语“混合骨架反义寡核苷酸”是指反义寡核苷酸，其中反义寡核苷酸的至少一个核苷间连键不同于反义寡核苷酸的至少一个其他核苷间连键。

如本文所用，术语“核碱基互补性”是指能够与另一个核碱基进行碱基配对的核碱基。例如，在DNA中，腺嘌呤(A)与胸腺嘧啶(T)互补。例如，在RNA中，腺嘌呤(A)与尿嘧啶(U)互补。在实施方案中，互补核碱基是指反义化合物中能够与其靶核酸的核碱基进行碱基配对的核碱基。例如，如果反义化合物某一位置的核碱基能够与靶核酸某一位置的核碱基氢键键合，则认为寡核苷酸和靶核酸之间氢键键合的位置在该核碱基对处是互补的。

如本文所用，术语“非互补核碱基”是指一对彼此不形成氢键或不支持杂交的核碱基。

如本文所用，术语“互补”是指寡聚化合物通过核碱基互补性与另一寡聚化合物或核酸杂交的能力。在实施方案中，当每个分子中足够数量的相应位置被可以彼此键合的核碱基占据以允许反义化合物和靶标之间稳定键合时，该反义化合物与其靶标是互补的。本领域技术人员认识到，在不消除寡聚化合物保持缔合的能力的情况下，包含错配是可能的。因此，本文描述的反义化合物可包括高达约20％的错配核苷酸(即，不是与靶标的相应核苷酸互补的核碱基)。在实施方案中，反义化合物含有不超过约15％，例如不超过约10％，例如不超过5％的错配，或者没有错配。剩余的核苷酸是互补的核碱基或者不破坏杂交(例如，通用碱基)。本领域普通技术人员将认识到本文提供的化合物与靶核酸具有至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％或100％的核碱基互补。

如本文所用，“杂交”意指互补寡聚化合物(例如，反义化合物及其靶核酸)的配对。虽然不限于特定的机制，但最常见的配对机制涉及互补核苷或核苷酸碱基(核碱基)之间的氢键键合，其可以是Watson-Crick、Hoogsteen或反向Hoogsteen氢键键合。例如，天然碱基腺嘌呤是与通过形成氢键配对的天然核碱基胸腺嘧啶和尿嘧啶互补的核碱基。天然碱基鸟嘌呤是与天然碱基胞嘧啶和5-甲基胞嘧啶互补的核碱基。杂交可以在不同的环境下发生。

如本文所用，术语“特异性杂交”是指寡聚化合物以比其与另一核酸位点杂交更大的亲和力与一个核酸位点杂交的能力。在实施方案中，反义寡核苷酸与一个以上的靶位点特异性杂交。在实施方案中，寡聚化合物在严格杂交条件下与其靶标特异性杂交。

在核酸杂交的情况下“严格杂交条件”和“严格杂交洗涤条件”是序列依赖性的，并且在不同的环境参数下是不同的。在Tijssen,Laboratory Techniques in Biochemistryand Molecular Biology-Hybridization with Nucleic Acid Probes第2章部分I"Overview of principles of hybridization and the strategy of nucleic acidprobe assays"Elsevier,New York(1993)中找到核酸杂交的广泛指南。通常，高度严格的杂交和洗涤条件被选择为在限定的离子强度和pH下比特定序列的热解链温度(Tm)低约5℃。Tm是50％的靶序列与完全匹配的探针杂交时的温度(在限定的离子强度和pH下)。选择非常严格的条件，使其等于特定探针的Tm。在Southern或Northern印迹中，在过滤器上具有100个以上互补残基的互补核苷酸序列杂交的严格杂交条件的实例是在42℃下50％甲酰胺与1mg肝素，杂交过夜。高度严格的洗涤条件的实例是在72℃下0.15M NaCl洗涤约15分钟。严格洗涤条件的实例是在65℃下0.2x SSC洗涤15分钟(参见Sambrook and Russel,Molecular Cloning:A laboratory Manual，第3版，Cold Spring Harbor LaboratoryPress,2001对SSC缓冲液的描述)。通常，高严格性洗涤之前是低严格性洗涤，以去除背景探针信号。对于例如超过100个核苷酸的双链体，中等严格性洗涤的实例是在45℃下1x SSC洗涤15分钟。对于例如超过100个核苷酸的双链体，低严格性洗涤的实例是在40℃下4-6x SSC洗涤15分钟。对于短探针(例如，约10至50个核苷酸)，严格条件通常涉及小于约1.0M Na离子的盐浓度，在pH 7.0至8.3下通常为约0.01至1.0M Na离子浓度(或其他盐)，并且温度通常为至少约30℃。严格条件也可以添加去稳定剂诸如甲酰胺来实现。

如本文所用，术语“2’-修饰的”或“2’-取代的”意指在2’位置包括除H或OH以外的取代基的糖。2’-修饰的单体包括但不限于BNA和具有2’-取代基的单体(例如，核苷和核苷酸)，诸如烯丙基、氨基、叠氮基、硫代基、O-烯丙基、O-C1-C10烷基、-OCF3、O-(CH2)2-O-CH3、2'-O(CH2)2SCH3、O-(CH2)2-O-N(Rm)(Rn)或O-CH2-C(＝O)-N(Rm)(Rn)，其中每个Rm和Rn独立地是H或经取代或未取代的C₁-C₁₀烷基。

如本文所用，术语“MOE”是指2’-O-甲氧基乙基取代基。

如本文所用，术语“高亲和力修饰的核苷酸”是指具有至少一个经修饰的核碱基、核苷间连键或糖部分的核苷酸，使得修饰增加了包括经修饰的核苷酸的反义化合物对靶核酸的亲和力。高亲和力修饰包括但不限于BNA、LNA和2’-MOE。

如本文所用，术语“模拟物”是指在AC中取代糖、核碱基和/或核苷间连键的基团。通常，用模拟物代替糖或糖-核苷间连键组合，并保持核碱基以与选定的靶标杂交。糖模拟物的代表性实例包括但不限于环己烯基或吗啉基。糖-核苷间连键组合的模拟物的代表性实例包括但不限于由不带电荷的非手性连键连接的肽核酸(PNA)和吗啉基团。在一些情况下，用模拟物来代替核酸碱基。代表性的核碱基模拟物是本领域熟知的，包括但不限于三环吩噁嗪类似物和通用碱基(Berger等人，Nuc Acid Res.2000,28:2911-14，其通过引用并入本文)。糖、核苷和核碱基模拟物的合成方法是本领域技术人员熟知的。

如本文所用，术语“双环核苷”或“BNA”是指核苷，其中该核苷的呋喃糖部分包括连接呋喃糖环上两个原子，从而形成双环环系的桥。BNA包括但不限于α-L-LNA、β-D-LNA、ENA、氧氨基BNA(2'-O-N(CH3)-CH2-4')和氨基氧基BNA(2'-N(CH3)-O-CH2-4')。

如本文所用，术语“4’至2’双环核苷”是指BNA，其中连接呋喃糖环的两个原子的桥桥接呋喃糖环的4’碳原子和2’碳原子，从而形成双环环系。

如本文所用，“锁核酸”或“LNA”是指经修饰的核苷酸，使得核糖基糖环的2’-羟基经由亚甲基与糖环的4’碳原子连接，从而形成2'-C,4'-C-氧亚甲基连键。LNA包括但不限于α-L-LNA和β-D-LNA。

如本文所用，术语“帽结构”或“末端帽部分”是指已经掺入AC任一端的化学修饰。术语“治疗性多肽”是指天然存在或重组产生的大分子，其包括两个或更多个氨基酸，并具有治疗、预防或其他生物活性。

术语“小分子”是指具有药理活性且分子量小于约2000道尔顿、或小于约1000道尔顿、或小于约500道尔顿的有机化合物。小分子治疗剂通常通过化学合成来制造。

“野生型靶蛋白”是指由野生型、正常或未突变型式的靶基因产生的天然、功能性蛋白质异构体。野生型靶蛋白也指由已经重剪接的靶前体mRNA产生的蛋白质。

如本文所用，“重剪接靶蛋白”是指由AC杂交的靶前体mRNA剪接产生的mRNA编码的蛋白质。重剪接靶蛋白可以与野生型靶蛋白相同，可以与野生型靶蛋白同源，可以是野生型靶蛋白的功能变体，可以是野生型靶蛋白的同种型，或者可以是野生型靶蛋白的活性片段。

如本文所用，“扩增的三核苷酸重复序列”，诸如“扩增的”CUG或和“扩增的”CTG重复序列，意指含有或编码三核苷酸重复序列的基因含有比野生型基因中存在的更大数量的重复连续三核苷酸。扩增的核苷酸重复序列可以写成XXX·NNN或(XXX·NNN)，其中XXX是指DNA重复序列且NNN是指从DNA重复序列转录的RNA重复序列。例如，CTG·CUG重复序列，是指具有CTG DNA重复序列的基因，具有CUG重复序列的RNA从该基因转录而来。在实施方案中，扩增的三核苷酸重复序列中重复序列的数量比野生型基因多5个或更多个、10个或更多个、15个或更多个或20个或更多个。在实施方案中，扩增的三核苷酸重复序列包括是野生型基因的2x、3x、4x、5x、10x、20x、50x或更多倍的三核苷酸重复序列。扩增的三核苷酸重复序列可在具有含扩增的三核苷酸重复序列的基因的受试者中导致疾病。例如，基因中具有扩增的CTG重复序列的受试者可患有DM1或FECD。在DM1中，DPMK基因含有扩增的CTG重复序列。患有DM1的受试者在DPMK基因的3’非翻译区(UTR)中可能具有50个或更多个CTG重复序列，而非患病受试者在DPMK基因的3’UTR中通常具有5至34个CTG重复序列。在FECD中，TCF4基因含有扩增的CTG重复序列。患有FECD的受试者在TCF4基因的CTG18.1基因座中可具有40个或更多个CTG重复序列，而非患病受试者在TCF4基因的CTG18.1基因座中通常具有30个或更少的CTG重复序列。从具有扩增的CTG重复序列的基因转录的mRNA将具有扩增的CUG重复序列。

本公开中的术语“下游”，当其与基因、mRNA或蛋白质相关时，是指受AC与靶核苷酸(例如，靶转录物)结合影响的基因、mRNA或蛋白质，但不是对应于靶核苷酸的基因、mRNA或蛋白质。AC与靶核苷酸的结合可减少RNA结合蛋白诸如MBNL1或CUGBP1在具有CUG重复序列的积聚mRNA上的聚集或隔绝，这可使此类RNA结合蛋白可用于下游基因产物的正确转录、RNA加工和/或表达。

如本文所用，“功能片段”或“活性片段”是指真核野生型靶蛋白的一部分，该部分表现出活性，诸如全长野生型靶蛋白的一种或多种活性，或具有另一种活性。在实施方案中，共有野生型靶蛋白的至少一种生物活性的重剪接靶蛋白被认为是野生型靶蛋白的活性片段。活性可以是全长野生型靶蛋白的活性的任何百分比(即，更多或更少)，包括但不限于与野生型靶蛋白相比活性的约1％，活性的约2％、约3％、约4％、约5％、约10％、约20％、约30％、约40％、约50％、约60％、约70％、约80％、约90％、约95％、约96％、约97％、约98％、约99％、约100％、约200％、约300％、约400％、约500％或更多(包括介于这些值之间的所有值和范围)。因此，在实施方案中，活性片段可以保留野生型靶蛋白的一种或多种生物活性的至少一部分。在实施方案中，活性片段可以增强野生型靶蛋白的一种或多种生物活性。

“野生型靶蛋白”是指由野生型、正常或未突变型式的靶基因产生的天然、功能性蛋白质异构体。野生型靶蛋白也指由已经正确剪接的靶前体mRNA产生的蛋白质。

如本文所用，术语“剪接”和“加工”是指转录后前体mRNA的修饰，其中去除内含子且连接外显子。剪接在一系列反应中发生，这些反应由大的RNA-蛋白质复合物催化，该复合物由五个小的细胞核核糖核蛋白(snRNP)组成，称为剪接体。在内含子内，剪接需要3’剪接位点、5’剪接位点和分支位点。snRNP的RNA组分与内含子相互作用，并且可能参与催化。

如本文所用，选择性剪接是指基因中存在的外显子的不同组合的剪接，导致由单个基因生成不同的mRNA转录物。

如本文所用，“重剪接靶蛋白”是指由AC杂交的靶前体mRNA剪接产生的mRNA编码的蛋白质。重剪接靶蛋白可以与野生型靶蛋白相同，可以与野生型靶蛋白同源，可以是野生型靶蛋白的功能变体，或者可以是野生型靶蛋白的活性片段。

本说明书中提及的所有出版物、专利和专利申请指示本发明所属领域的技术人员的水平。所有出版物、专利和专利申请都通过引用并入本文，其程度如同每个单独的出版物或专利申请被具体地且单独地指示通过引用并入一样。

实施例

实施例1.评估PMO和PMO-EEV化合物对DM1相关细胞系中RNA灶形成和剪接挽救的影响

评价在DM1相关细胞系中(CUG)₇重复序列PMO和(CUG)₇重复序列PMO-EEV化合物(表12中的A和D)对RNA灶形成和剪接挽救的影响。还包括具有错配的PMO序列的PMO-EEV化合物和具有混乱序列的PMO(表12中的B和C)。

实验

细胞在DM1 HeLa细胞模型(HeLa-480)和DM1成肌细胞中评价PMO和PMO-EEV，该DM1HeLa细胞模型是具有高CUG重复序列载荷和下游剪接缺陷的稳定细胞系，并且DM1成肌细胞源自DM1患者，具有约2600个CTG重复序列和下游剪接缺陷。HeLa-480再现DM1的致病特征，包括CUG核糖核灶和肌盲(MBNL)选择性剪接因子的前体mRNA靶标的错误剪接。注意到DM1成肌细胞生长非常缓慢(倍增时间为约7天)并且不能很好地转染。对照HeLa和HeLa-480细胞用不含其他化合物的ENDOPORTER处理。HeLa-480细胞表现疾病状态，HeLa细胞表现非患病状态。

RNA灶分析。用1μM、3μM或10μM的化合物A-D(表12)处理HeLa-480细胞或DM1成肌细胞。所有化合物都在没有转染试剂的情况下或使用设计用于将天然带电荷的PMO递送到细胞中的ENDOPORTER(可从Philomath,Oregon的GENETOOLS LLC获得)转染剂进行转染。将细胞孵育24小时，然后固定以经由显微镜术进行定性RNA灶分析。对经过处理的Hela-480细胞的定性视觉检查后，化合物A(PMO-EEV)显示最少量的RNA灶。从DM1成肌细胞中没有得出结论。

剪接分析和RT-PCR。在孵育24小时或48小时后收获如上所述处理的HeLa-480细胞，并提取总RNA。进行RT-PCR以测量和/或定量靶RNA诸如MBNL1和CLASP1中DM影响的外显子的剪接模式。评价目标外显子包含的百分比。

表12：实施例1中测试的PMO和PMO-EEV。

结果。图6A-图6D显示了用化合物A-D和ENDOPORTER转染剂处理HeLa-480细胞后24小时(6A和6B)和48小时(6C和6D)，MBNL1(6A和6C，外显子5包含)和CLASP1(6B和6D，外显子19包含)的选择性剪接事件的RT-PCR结果。对于用化合物A-D中的每一种处理的细胞在24小时和48小时时间点观察到MBNL1中外显子5包含的减少(图6A和图6C)。用化合物A处理的细胞显示出最大的挽救(外显子5包含减少)。对于用化合物A-D中的每一种处理的细胞在24小时和48小时时间点观察到CLASP1中外显子19包含的增加(图6B和图6D)。用化合物A处理的细胞显示出最大的挽救(外显子19包含增加)。相反，当HeLa-480细胞在没有ENDOPORTER转染剂的情况下用A-D处理时，除了化合物A之外，没有观察到MBNL1(图6E)或CLASP1(图6F)的剪接事件的变化。

图7A-图7B显示了用化合物A-D、阴性对照DM-04或阳性对照DM-05处理DM1成肌细胞后，MBNL1和CLASP1的选择性剪接事件的RT-PCR结果。用所有化合物处理引起MBNL1(图7A)和CLASP1(图7B)的剪接事件的挽救。

实施例2.评估EEV-PMO 221-1106对DM1-小鼠模型中剪接挽救的影响

使用HSA-LR DM1-小鼠模型在体内评价仅PMO和PMO-EEV(表13)对剪接挽救的影响。

实验。

小鼠模型。HSA-LR是一种转基因小鼠模型，其在人骨骼肌动蛋白(HSA)转基因的3′-UTR中具有扩增的长CUG重复序列(LR)并在骨骼肌中高水平表达CUGexp RNA(例如，扩增的CUG RNA)(Mankodi等人，Science 2000,289(5485):1769-1773)。HSA-LR小鼠显示出肌强直表型以及剪接缺陷。Friend病毒B NIH Jackson(FVB/NJ)小鼠模型用作对照并用于产生HSA-LR转基因小鼠。

实验设计。经由眶后注射或静脉内(IV)注射，以每20克体重100μL化合物溶液的单剂量向小鼠施用化合物A-D。量表与每只小鼠的体重成比例(例如，每30g体重150μL)。

表13：实施例2中测试的PMO和PMO-EEV。

将动物进行年龄匹配并分配到六个处理组。使用两个对照组；第1组：FVB/NJ小鼠(FVB/NJ；未患病的对照)和第2组：HSA-LR(患病对照)小鼠，每只小鼠注射盐水。使用四个处理组(A-D组)；HSA-LR小鼠注射化合物A、B、C或D。FVB/NJ小鼠在注射时为5周零4天大，而HSA-LR小鼠在注射时为6周零1天或2天大。每组四只小鼠(两只雄性和两只雌性)用于该实验。处理后1周处死小鼠。收获组织(腓肠肌、四头肌、胫骨前肌(TA))并在液氮中快速冷冻，并储存在-80℃下用于剪接挽救分析的进一步评价。

从组织样品中提取总RNA，并通过RT-PCR进行分析，以评估(i)Atp2a1外显子22，(ii)Nfix外显子7，(iii)Clcn1外显子7a，和(iv)Mbnl1外显子5上AC诱导的选择性RNA剪接挽救事件。评价目标外显子包含的百分比。

结果。在处理之前，所有HSA-LR小鼠都有肌强直。注射化合物后，所有小鼠分不清方向。注射化合物A和化合物B的小鼠(A组和B组)在15分钟内恢复，而注射化合物C和化合物D的小鼠(C组和D组)需要几个小时才能恢复。所有经过处理的小鼠到第二天完全恢复。处死时，A组和B组都有肌强直；然而，C组和D组明显没有肌强直。

图8A-图10D显示了在经过处理的小鼠的腓肠肌(图8A-图8D)、四头肌(图9A-图9D)和胫骨前肌(图10A-图10D)肌肉组织中，Atp2a1(对于外显子22包含；图8A、图9A和图10A)、Nfix(对于外显子7包含；图8B、图9B和图10B)、Clcn1(对于外显子7a包含；图8C、图9C和图10C)和Mbnl1(对于外显子5包含；图8D、图9D和图10D)的RNA剪接测量。用化合物C和化合物D(PMO-EEV)处理的小鼠在腓肠肌、四头肌和胫骨前组织中显示出Atp2a1和Nfix剪接事件的挽救，而PMO和盐水组没有显示出剪接事件的挽救(图8A、图8B、图9A、图9B、图10A和图10B)。类似地，在腓肠肌和四头肌组织中，用化合物C和化合物D处理的小鼠显示出Clcn1(图8C和图9C)和Mbnl1(图8D和图9D)剪接事件的挽救，而PMO和盐水组没有显示出剪接事件的挽救。关于胫骨组织中Clcn1和Mbnl1的剪接(图10C-图10D)，在对照小鼠系(FVB/NJ)和DM1小鼠模型(HSA-LR)中没有检测到选择性剪接缺陷，因此，用化合物A-D处理没有引起胫骨组织中Clcn1和Mbnl1基因的剪接挽救。

这些结果证明在使用DM1小鼠模型的体内研究中PMO-EEV处理对剪接挽救的积极影响，以及PMO-EEV化合物处理强直性肌营养不良(DM)的潜在用途。

实施例3.评估各种PMO-EEV化合物用于校正来自DM1患者的永生化成肌细胞中的错误剪接事件

在体外使用DM1患者来源的肌成肌细胞和肌管评价两种靶向DMPK CUG的PMO-EEV(197-777和221-1106；表14)对DM1相关基因的剪接挽救的影响。

实验。

细胞培养。获得来自DM1患者(ASA308DM1)和未受影响个体(KM1421；AB1190)的永生化成肌细胞。DM1患者成肌细胞在DMPK的3′-UTR中带有2600个CTG重复序列。将成肌细胞在骨骼肌细胞生长培养基(可从PromoCell in Heidelberg,Germany获得)、2％马血清(可从Bristol,RI的Gibco获得)、1％鸡胚提取物(可从Cleveland,OH的USB公司获得)和0.5mg/mL青霉素/链霉素(Gibco)的生长培养基中培养。对于成肌分化，将汇合培养物转换到补充有2％马血清的DMEM分化培养基中并培养4天。

表14：实施例3中测试的化合物

处理。使用两种不同的处理条件，用10μm、3μm、1μm或0.3μm化合物处理DM1患者的肌细胞。在第一种条件下，成肌细胞以75％-80％汇合平板接种，化合物在生长培养基中连续稀释，并将细胞浸泡24小时以允许化合物的自由摄取。去除含化合物的培养基，用1XDPBS(Gibco)洗涤成肌细胞，并在收获前分化4天。对于平行运行的第二种条件，成肌细胞在处理前三天分化，将化合物在分化培养基中连续稀释，并在24小时后收获肌管用于分析。

RNA分离和PCR。根据制造商的说明，用RNEASY Mini试剂盒(可从Germantown,MD的Qiagen获得)分离总RNA。对于外显子包含，将100ng RNA逆转录并用于PCR(OneStep RT-PCR试剂盒，Qiagen)。用HT DNA高灵敏度测定试剂盒通过LabChip(可从Waltham,MD的PerkinElmer获得)分析样品。

结果。靶向DMPK CUG的PMO(未与EEV缀合)改善了MBNL1外显子5的错误剪接(数据未示出)。图11A-图11F显示了在用各种浓度的靶向DMPK CUG的EEV-PMO(CUG^exp 197-777和CUG^exp 221-1106)处理的DM1患者来源的肌细胞中MBNL1(图11A)及其靶标(SOS1、IR、DMD、BIN1、LDB3；图11B-图11F)的剪接缺陷的混合挽救。EEV-PMO 197-777在DM1患者肌细胞中引起错误剪接事件的中度校正。MBNL1和SOS1显示出错误剪接校正的最佳反应。EEV-PMO 197-777被选为下述后续实验的工具化合物。

使用与上述那些类似的方法，用10μm、3μm和1μm的靶向DMPK CUG的EEV PMO 197-777处理DM1患者来源的成肌细胞和肌管。评价MNBL1和MNBL1靶标的选择性RNA剪接事件的挽救。在用EEV-PMO处理成肌细胞和肌管后，对于MNBL1(外显子5排除；图12A)，SOS1(外显子25包含物；图12B)、INSR(外显子11包含物；图12C)、DMD(外显子78包含物，图12D)、BIN1(外显子11包含物；图12E)和LDB3(外显子11排除；图12F)观察到不同程度的剪接校正。

图44A-图44D显示了通过肌肉松弛法定量的用20mpk 221-1106处理的HSA-LR小鼠中肌强直表型的逆转。图44A和图44C显示了达到80％峰值等长力的松弛时间的图，而图44B显示了力迹线原始数据。图44D显示了通过代表性肌电图(EMG)迹线定量的用20mpk 221-1106处理的HSA-LR小鼠中肌强直表型的逆转。

实施例4.在DM1小鼠模型中评价PMO-EEV 221-1120

用DM1小鼠模型来研究EEV-PMO 221-1120(也称为EEV-PMO-DM1-3或DM1-3；PMO221＝5’-CAG CAG CAG CAG CAG CAG CAG-3’(SEQ ID NO:154，全部PMO单体)；EEV 1120＝Ac-PKKKRKV-AEEA-Lys(环[FGFGRGRQ]-PEG12-OH(Ac-(SEQ ID NO:42)-AEEA-Lys(SEQ IDNO:82)-PEG12-OH))对与实施例2中描述的相同的HSA-LR转基因小鼠模型中的下游基因的剪接和mRNA水平的影响。使用酰胺化学结构缀合PMO和EEV。

实验。有两个常规处理组：1)野生型小鼠；和2)HSA-LR小鼠(DM1疾病模型)。在HSA-LR处理组中，有两个子处理组：1)用盐水处理的HSA-LR(对照)；以及2)HSA-LR+EEV-PMO221-1120。经由尾部静脉注射用15mpk、30mpk、60mpk或90mpk(基于PMO)的PMO-EEV或盐水处理小鼠。处理7天后，处死小鼠并收集组织用于分析。

RT-PCR测定(剪接的校正)。用OMNI珠磨匀浆器匀化组织并用QIACUBEQ提取RNA。按照制造商的方案，使用一步RT-PCT试剂盒(Qiagen)进行RT-PCR分析，进行35个PCR循环：94℃持续30秒；60℃持续30秒和72℃持续30秒。基因特异性引物序列如下：Clcn1外显子7a包含正向引物＝5’-TTCACATCGCCAGCATCTGTGC-3’(SEQ ID NO:319)，反向引物＝5’-CACGGAACACAAAGGCACTGAATGT-3’(SEQ ID NO:320)；Mbnl1外显子5包含正向引物＝5’-GCTGCCCAATACCAGGTCAAC-3’(SEQ ID NO:321)，反向引物＝5’-TGGTGGGAGAAATGCTGTATGC-3’(SEQ ID NO:322)；

Atp2a1外显子22包含正向引物＝5’-GCTCATGGTCCTCAAGATCTCAC-3’(SEQ ID NO:323)，反向引物：5’-GGGTCAGTGCCTCAGCTTTG-3’(SEQ ID NO:324)；

Nfix外显子7包含正向引物＝5’-TCGACGACAGTGAGATGGAG-3’(SEQ ID NO:325)，反向引物5’CAAACTCCTTCAGCGAGTCC-3’(SEQ ID NO:326)。Clcn1、Mbnl1和Atp2a1的引物来自Klein等人，The Journal of Clinical Investigation.2019,129(11)，第4739页；并且Nfix的引物来自Chen等人，Scientific Reports.2016,6(1)，第1页。用SYBR SAFE染料在2％琼脂糖E-凝胶上分离cDNA产物。通过未跳过的条带/(未跳过的条带+跳过的条带)的比率计算外显子包含百分比。

小鼠DM1剪接指数(mDSI)的计算。按照来自Tanner等人的文献方案计算mDSI(Nucleic acids research.2021,49(4)，第2240-54页)。对于每个样品i，计算每个剪接事件j的归一化剪接值为(PSI_i,j–PSI_野生型,j)/(PSI_HSALR,j–PSI_野生型,j)，其中PSI_野生型,j是野生型小鼠中事件j的平均PSI，并且PSI_HSALR,j是HSALR小鼠中事件j的平均PSI。然后将mDSI计算为所有归一化剪接值的平均值，这些归一化剪接值是研究中的Atp2a1、Nfix、Mbnl1和Clcn1。

qRT-PCR测定法(HSA mRNA敲减)。使用来自Life Technologies Corporation的高容量cDNA逆转录试剂盒，按照制造商的方案进行逆转录。使用Bio-Rad SyBr GreenSupermix和QuantStudio3 qPCR机，用基因特异性引物进行定量实时PCR：HSA mRNA正向引物＝5’-TTCCATCGTCCACCGCAAAT-3’(SEQ ID NO:327)，反向引物＝5’-AGTTTACGATGGCAGCAACG-3’(SEQ ID NO；328)，两种引物均来自Klein等人The Journal ofClinical Investigation.2019,129(11)，第4739页；和小鼠GAPDH正向引物＝5’-AGGTCGGTGTGAACGGATTTG-3’(SEQ ID NO:329)，反向引物＝5’-TGTAGACCATGTAGTTGAGGTCA-3’(SEQ ID NO:330)。

RNAseq。使用下一代测序进行PolyA RNAseq进行转录组谱型分析。每个基因的Z-评分计算为(样品值-平均值)/(标准偏差)。对RNAseq数据进行差异性剪接分析，以计算每个基因的单个外显子的剪接百分比(PSI)。PSI是指示转录元件的包含的归一化读段计数与该事件的总归一化读段(包含和排除读段)的比率。例如，如果外显子100％的时间都包含在读段中，则PSI为1。另外，如果外显子100％的时间都从读段中排除，则PSI为0。

分析已知预测DM1的22个目标基因。另外，分析Wagner等人(PLOS Gen 2016(47))和Tanner等人(NAR 2021(48),4,2240-2254)研究的基因。小鼠外显子映射到人类的位置。在一些情况下，小鼠和/或人类基因组中外显子的边界不完全已知。因此，使用不同的边界来分析数据。使用RNAseq数据验证了正确的边界。

RNA CUG灶分析。对胫骨前肌切片进行CUG灶(FISH，红色)和细胞核(Hoechst，蓝色)染色。对TA肌肉切片进行成像，并对具有CUG RNA灶的细胞核数量进行定量。

结果

HSA mRNA敲低。与四头肌、胫骨前肌和三头肌相比，膈肌仅表达5％-10％的HSAmRNA水平(图13A)。EEV-PMO处理似乎没有改变膈肌中的HSA mRNA水平(图13B)。对于DM1膈肌中的错误剪接表型，HSA 220CUG重复序列的表达水平可能不足。

EEV-PMO以剂量依赖性方式敲低HSA mRNA，证实了在四头肌(图14A)、腓肠肌(图14B)、三头肌(图14C)和胫骨前肌(图14D)组织中的靶接合。另外，HSA mRNA的Ct(循环阈值)值与小鼠GAPDH的水平相似(～15)，表明HSA-LR小鼠四头肌中HSA转基因的高表达。

mDSI(剪接的校正)。在图15A-图15D中示出了四头肌、腓肠肌、三头肌和胫骨前肌的小鼠DM1剪接指数(mDSI)。用EEV-PMO处理在注射后1周在四头肌(图15A)、腓肠肌(图15B)、三头肌(图15C)和胫骨前肌(图15D)中，以剂量依赖性方式校正DM1相关的剪接缺陷(Atp2a1外显子22、Nfix外显子7、Clcn1外显子7a、Mbnl1外显子5)，较高的剂量接近或等效于野生型(完全校正)。在HSA-LR小鼠中大约50％-60％的人骨骼肌动蛋白RNA敲低在实现近完全剪接校正的药物浓度下实现。

图16A-B显示了HSA-LR小鼠(图16A)和用EEV-PMO处理的HSA-LR小鼠(图16B)对CUG灶(红色)和细胞核(蓝色)进行染色的胫骨前组织的图像。定性和定量评估(图16C)显示EEV-PMO处理减少了具有CUG灶的细胞核的数量。

药物暴露。使用LC-MS研究药物暴露。图17A-图17D显示了四头肌(图17A)、三头肌(图17B)、心脏(图17C)、腓肠肌(图17D)、胫骨前肌(TA；图17F)、肝脏(图17I)和肾脏(图17J)中PMO-EEV暴露的剂量依赖性反应。在膈肌中未观察到剂量依赖性反应(图17G)。除了在60mpk和90mpk剂量水平下以外，在脑部中没有检测到EEV-PMO。图17K显示了在60mpk剂量水平下各种组织的药物暴露。

肌强直反应：在用15mpk、30mpk、60mpk和90mpk的EEV-PMO-DM1-3处理后7天，在HSA-LR小鼠中观察到剂量依赖性肌强直减少(图18A)。肌强直可能在用EEV-PMO-DM1-3处理后一周得到改善。用单剂量90mpk EEV-PMO-DM1-3处理的HSA-LR小鼠在诱导后没有表现出明显的后肢肌强直迹象。

RNAseq数据分析。图19A-图19D显示了主成分分析的结果。主成分分析可用于基于距离矩阵揭示样品之间的相似性。这种类型的图可用于可视化实验协变量的整体效应和批量效应。x轴是解释最大方差的方向，y轴是第二大。每个方向总方差的百分比显示为PCA。野生型和HSA-LR小鼠是不同的组。用PMO-EEV处理的HSA-LR小鼠的腓肠肌中的基因表达向野生型小鼠的基因表达转变。

图20A是显示来自三个处理组的差异表达基因(通过Z-评分)的热图：1)WT小鼠；2)HSA-LR小鼠；以及3)HSA-LR+EEV-PMO 221-1120(60mpk)。在处理组之间总共有956个(p<0.5)基因差异性表达，知识野生型小鼠(WT)和疾病模型小鼠(HSA-LR)之间的差异。用EEV-PMO(HSA-LR(+,+))处理引起整体基因表达校正，从疾病谱(红色，HSA-LR(-,-))向野生型小鼠(上述WT)转变。

图20B是用于可视化从BLAST分析发现具有7个以上CTG重复序列的43个基因中的40个基因的表达谱的热图。在Blast分析中发现的三个CTG重复序列基因(Crb2、Hsd3b6和Inhbe)由于读段数量低而没有包括在内。这种分析可用于鉴定处理条件中共调控的基因。

图21显示了EEV-PMO处理组和HSA-LA组中整体转录变化的火山图。散点图中的每个数据点表示一个基因。每个基因的倍数变化表示在x轴上，其调整p值的log10在y轴上。调整p值小于0.05且倍数变化大于2的基因用红点指示。这些表示上调的基因。调整p值小于0.05且倍数变化小于-2的基因用蓝点指示。这些表示下调的基因。发现三个基因显著下调(Txlnb、Scube2和Greb1)，且一个基因显著上调(Txlnb)。大多数至少含有(CUG)₇的转录物没有受到显著影响。这些基因的PCA分析显示，当用EEV-PMO处理时，Scube2(图22A)、Greb1(图22B)、Ttc7(图22C),Txlnb(CUG)9和Ndrg3(图22E)显示出校正。Txlnb通过处理过度校正(图22D)。

图23A-图23D显示了各种基因和各个处理组的转录组数据。HSA-LR+EEV-PMO 221-1120处理组显示了Atp2a1的外显子22的包含(图23A)、Clcn1的外显子7的排除(图23B)、Nfix的外显子7的排除(图23C)和Mbnl1的外显子7的排除(图23D)的校正。

图24显示了各种基因的单个外显子的剪接百分比(PSI)。这些基因是MBNL-1反应性剪接生物标志物(例如，下游基因)。MBNL-1依赖性生物标志物的选择是基于如文献中描述的野生型和疾病组之间的动态范围来选择的。HSA-LR+EEV-PMO 221-1120处理组显示出对所有20个目标基因的外显子包含/排除的校正，这些基因包括Mbnl1、Nfix、Atp2a1、Ldb3、Camk2g、Trim55、Fbox31、Slc8a3、Map3k4、Dctn4、Cacna1s、Ryr1、Slain2、Phka1、Ppp3cc、Ttn、Neb、lrrfip2、Rapgef1和Vsp39。

实施例5.在DM1小鼠模型即第二DM1小鼠模型中评价PMO-EEV 221-1120

在第二DM1小鼠模型中使用类似于实施例4中描述的那些的方法评价PMO-EEVDM1-3(221-1120；参见实施例4的序列)。

实验。七周龄的HSA-LR小鼠每隔一周静脉内施用单剂量80mpk的EEV-PMO-DM1-3或20mpk剂量的EEV-PMO-DM1-3，持续六周(4次剂量总共80mpk)并且在单剂量后1周至12周或最终剂量后两周收获组织。使用RT-PCR确定特定基因(Atp2a1、Clcn1、Nfix、MBNL1)的选择性剪接。使用Q-PCR确定处理后肌动蛋白-HSA mRNA水平的降低。使用LC-mass确定四头肌、腓肠肌、胫骨前肌、三头肌、膈肌、心脏、肾脏、肝脏、脑部和血浆中的药物水平。用EEV-PMO-DM1-3化合物处理7天后，记录肌强直减少。

结果。对于胫骨前肌、腓肠肌、三头肌和四头肌组织中Atp2a1、Clcn1、Nfix和MBNL1剪接的挽救，观察到与实施例4中观察到的趋势类似的趋势(数据未示出)。另外，对于处理后1周和4周的胫骨前肌、腓肠肌、三头肌和四头肌组织，观察到与实施例4中观察到的趋势类似的趋势(数据未示出)。

图25A-图25D是显示在胫骨前肌(图25A)、腓肠肌(图25B)、三头肌(图25C)和四头肌(图25D)组织中，用80mpk EEV-PMO-DM1-3在1周至8周后药物水平的降低的图。EEV-PMO-DM1-3(60mpk寡聚物、80mpk全药)在处理1周后完全校正腓肠肌、三头肌、胫骨前肌和四头肌中的错误剪接。图26A-图26B是显示用单次80mpk剂量的EEV-PMO-DM1-3在1周至4周、至8周和至12周后在肝脏中观察到的药物水平的降低的图。与单剂量方案后4周相比，在6周给药方案的最后一个剂量后2周，在肝脏中观察到相对较高量的EEV-PMO-DM1-3。

图26C-图26D显示了用单次80mpk剂量的EEV-PMO-DM1-3在1周至4周、至8周和至12周后在肾脏中观察到的药物水平的降低。与单剂量方案后4周相比，从6周给药方案的最后一个剂量后2周开始，在肾脏中观察到相对低量的EEV-PMO-DM1-3。在单剂量EEV-PMO-DM1-3后12周，该药物仍存在于肾脏中，但不存在于肝脏中。

进行主观肌强直观察并示于表15。多剂量方案(Q2W)在处理后两周没有显示出肌强直挽救的迹象。在用单次80mpk剂量处理的小鼠中，对肌强直有混合效应，该效应在处理后12周消失。

表15.肌强直观察结果

进行类似实验以评价EEV-PMO-DM1-3更长持续时间和更高剂量的静脉施用。用40mpk、60mpk、80mpk或120mpk的EEV-PMO-DM1-3静脉内处理八周龄的HSA-LR小鼠，并在4周至12周后收获组织。使用RT-PCR确定特定基因(Atp2a1、Clcn1、Nfix、MBNL1)的选择性剪接。用EEV-PMO-DM1-3处理7天后，记录肌强直减少。对于胫骨前肌、腓肠肌组织中Atp2a1、Clcn1、Nfix和MBNL1剪接的挽救，观察到与实施例4中观察到的趋势类似的趋势(数据未示出)。

进行主观肌强直观察并示于表16。雌性比雄性显示出更多的肌强直。在处理后8周，以120mpk给药的雄性和雌性小鼠都没有肌强直的迹象。

表16.肌强直观察结果

实施例6.用EEV-PMO-DM1-3处理患者来源的DM1细胞

在DM1患者来源的成肌细胞中评价PMO-EEV DM1-3(221-1120；序列参见实施例4)。

实验。在分化的四天中，用30微摩尔的DM1-3处理患者成肌细胞。通过一步RT-PCR和Labpchip评估剪接校正(标绘平均值±SD；n＝4)。使用HCR-FISH和隔绝的MBNL1蛋白检测测定法检测RNA CUG灶。结果：EEV-PMO-DM1-3促进DM1患者来源的肌细胞中显著的生物标志物剪接校正和核灶的减少。

结果。图27A-图27C是显示EEV-PMO-DM1-3促进DM1患者来源的肌细胞中显著的生物标记剪接校正(MBLN1、SOS1和NFIX)的图。另外，用DM1-3处理引起DM1患者来源的肌细胞中的核灶减少(图28A-图28C)。

实施例7.肾细胞中EEV-PMO-DM1-3的细胞毒性筛选

在人肾细胞中评价PMO-EEV DM1-3(221-1120；序列参见实施例4)。

实验。将人原代肾近端小管上皮细胞(RPTEC)暴露于不同浓度的PMO-DM1和EEV-PMO-DM1-3(在盐水中1:2连续稀释，最终稀释因数为4x，从约6μM至约800μM)24小时，并使用CELLTITER-GLO发光活力测定法针对活力进行筛选。蜂毒肽以16.6μM用作阳性对照。

结果。图29A-图29B显示PMO-DM1或其缀合的EEV-PMO-DM1-3即使分别以817μM或797μM的最高浓度也没有显示出任何毒性。

实施例8.评估PMO-EEV 221-1113在永生化细胞DM1患者和HeLa-480细胞中校正错误剪接事件和下游剪接的能力

用EEV-PMO构建体221-1113处理永生化的DM1患者来源的(2,600个CUG重复序列)肌肉细胞和HeLa-480(DM1模型细胞系，参见实施例1)并分析异常剪接的校正和灶定量。EEV1113是Ac-PKKKRKV-miniPEG-K(cyclo(Ff-Nal-GrGrQ)-PEG12-OH(Ac-(SEQ ID NO:42)-miniPEG-K(cyclo(SEQ ID NO:80)-PEG12-OH)。EEV-PMO 221-1113是经由酰胺键化学结构与PMO序列221缀合的EEV 1113(5’-CAG CAG CAG CAG CAG CAG CAG-3’(SEQ ID NO:154；所有PMO单体)。

实验。使用与实施例1和实施例3中描述的那些相似的方法。

结果。

RNA CUG灶分析。对细胞的细胞核(Hoeschet，蓝色)和RNA CUG重复序列灶(绿色)进行染色并成像。在未处理的DM1患者细胞和EEV-PMO处理的DM1细胞之间观察到RNA CUG灶的减少(图30A-图30C)。类似地，在未处理的HeLa-480细胞和EEV-PMO HeLa-480细胞之间观察到RNA CUG灶的减少(图31A-图31B)。

下游剪接的校正。分析PMO-EEV处理的DM1患者来源的细胞和HeLa-480细胞中MBLN1的外显子5包含百分比、SOS1的外显子25包含百分比和NFIX的外显子7包含百分比。用EEV-PMO处理引起Mbnl1(图32A)、Sos1(图32B)和NFIX(图32C)的剪接事件的挽救。

另外，EEV-PMO处理的HeLa-480细胞以剂量依赖性方式显示出MBNL1(图33A)剪接以及SOS1(图33B)、CLASP1(图33C)、NFIX(图33D)和INSR(图33E)的下游错误剪接的剂量依赖性校正。

实施例9.在第二DM1小鼠模型中评价EEV-PMO 221-1106

用DM1小鼠模型研究EEV-PMO 221-1106对下游基因剪接和mRNA水平的影响。

实验。人骨骼肌动蛋白长重复序列(HSA-LR)转基因小鼠用作DM1疾病模型。使用与实施例5中描述的那些类似的方法。

结果。图34A-图34D显示了在用各种浓度的EEV-PMO 221-1106处理的小鼠的腓肠肌中Atp2a1中外显子22(图34A)、Nfix中外显子7(图34B)、Clcn1中外显子7A(图34C)和Mbnl1(图34D)的包含的剂量依赖性校正。单独用PMO 221处理未引起剪接的校正。

实施例10.用于研究PMO中CUG重复序列的不同长度的影响的DM1小鼠模型

用DM1小鼠模型研究PMO-EEV 221-1121(PMO具有7个CAG重复序列，21-mer)和PMO-EEV 0325-1121(PMO具有8个CAG重复序列，24-mer)对下游基因剪接和mRNA水平的影响。PMO-EEV 221-1121是经由酰胺化学结构与EEV 1121(Ac-PKKKRKV-miniPEG2-Lys(环[GfFGrGrQ])-PEG12-OH；Ac-(SEQ ID NO:42)-miniPEG2-Lys(SEQ ID NO:74)-PEG12-OH)缀合的PMO 221(5’-CAG CAG CAG CAG CAG CAG CAG-3’；SEQ ID NO:154；所有PMO单体)。PMO-EEV 0325-1121是经由酰胺化学结构与EEV 1121缀合的PMO 0325(5’-CAG CAG CAG CAGCAG CAG CAG-CAG-3’；SEQ ID NO:155；所有PMO单体)。

实验。人骨骼肌动蛋白长重复序列(HSA-LR)转基因小鼠用作DM1疾病模型。简言之，HSA-LR小鼠以20mpk、40mpk或60mpk的0221-1121或0325-1121经由向尾静脉进行静脉注射给药。注射后一周，处死小鼠并收集组织。使用与实施例5中描述的那些类似的其他实验方法。

结果。0221-1121(21-mer)在校正胫骨前肌组织中Mbnl1(图35A)、Nfix(图35B)和Atp2a1(图35C)中的外显子剪接方面比0325-1121(24-mer)更有效。该结果出乎意料。预期24-mer将更有效，因为它将具有更高的杂交效率和更高的热解链温度。在腓肠肌组织中，如图36A-图36C所示，差异不太明显。使用雄性小鼠进行主观肌强直观察(表17)。在40mpk的21-mer处理后1周观察到混合肌强直，类似于表11中的结果。

表17：肌强直观察结果

分组	给药前	给药后1周	给药后4周
				性别	M	M	M
FVB	0	0	NA
				HSA-LR	++	++	NA
221-112 20mpk	++	++	NA
				221-1120 40mpk	++	+
325-1120 20mpk	++	++	NA
				325-1120 40mpk	++	++

M＝男性；0＝没有小鼠显示肌强直；+＝混合肌强直，一些小鼠显示

肌强直减轻；++＝所有小鼠都显示肌强直

实施例11.EEV-PMO 221-1120在CD1小鼠中的药代动力学研究

使用CD1小鼠模型研究血浆、肾脏和胫骨前肌对EEV-PMO构建体221-1120(序列参见实施例4)和PMO-0221a的药物暴露(AUC)，还测量了221-1120的主要代谢物(参见图37)。

实验。经由静脉注射用80mpk的EEV-PMO构建体221-1120处理5至7周龄的CD1小鼠。在不同的时间点对小鼠进行放血和/或处死。

结果。表18、表19和表20分别显示在血浆、肾脏和胫骨前肌中观察到的药代动力学特性。对于表格：AUC_最后＝从零到最后可量化浓度的曲线下面积；D＝剂量；C_max＝最大血清或血浆浓度；T_max＝达到C_max的时间；CL＝总血浆、血清或血液清除率；t_1/2＝消除半衰期；V_ss＝平衡时的表观分布体积；Q_h＝肝血流量(ml/min/kg)。

与肾脏相比，胫骨前肌中代谢物的AUC值低～1000倍。血浆中的代谢物平均滞留时间(MRT)值可能与组织MRT值直接相关，这是由于在尿排泄之前从组织转移到血浆。

表18：血浆药代动力学特性

	221-1120	PMO-0221a
			AUC_最后(nM*hr)	9290	953
AUC_最后/D	1121	115
			C_max(nM)	16217	12
C_max/D	1956	1.4
			T_max(小时)	0.1	24
CL(mL/min/kg)	15	-
			Q_h(％)	16	-
t_1/2(小时)	19	68
			MRT_最后(小时)	1.2	60.0
V_ss(mL/kg)	1325	-

表19：肾脏药代动力学特性

表20：胫骨前肌药代动力学特性

实施例12.在第三DM1小鼠模型中评价PMO-EEV 221-1120

进行类似于实施例5和实施例9的DM1小鼠模型研究，以评价不同剂量的PMO-EEV221-220(序列参见实施例4)在HSA-LR小鼠中的作用。

实验。给八周龄的HSA-LR小鼠静脉施用40mpk、60mpk、80mpk或120mpk的PMO-EEV221-1120，并在4至12周后收获组织。使用RT-PCR确定特定基因(Atp2a1、Clcn1、Nfix、MBNL1)的选择性剪接。使用LC-mass确定四头肌(Quad)、腓肠肌(gastro)、胫骨前肌(TA)、三头肌、膈肌、心脏、肾脏、肝脏、脑部和血浆中的药物水平。使用RNA-seq确定经处理的疾病模型、未处理的疾病模型和野生型之间的转录水平变化。使用Q-PCR确定处理后肌动蛋白-HSAmRNA水平的降低。

结果。使用荧光成像确定用EEV-寡聚化合物处理后RNA灶的减少(数据未示出)。用EEV-寡聚化合物处理7天后，记录肌强直减少(数据未示出)。这些实验的结果显示出与实施例5和实施例14中用PMO-EEV 221-1120处理的小鼠类似的趋势。

在不同剂量的EEV-PMO下，在胫骨前肌(图38A、图39A、图40A)和腓肠肌(图38B、图39B、图40B)中观察到MBNL1、NFIX和ATP2A1剪接校正。在用120mpk EEV-PMO处理12周后，在胫骨前肌和腓肠肌中都观察到MBNL1、NFIX和ATP2A1剪接校正。

实施例13.在HeLa480细胞中评价EEV-PMO 221-1120

用不同浓度的EEV-PMO 221-1120(序列参见实施例4)处理HeLa480细胞，并分析CUG重复序列灶、选择性r(CUG)减少及MBNL1和SOS1的下游剪接校正。

实验。Hela480细胞如先前实施例中所述那样构建。类似于本文所述的其他实施例进行RT-PCR和灶染色。

结果。图41A-图41B显示对照细胞(未处理的)和用5μM、10μM、20μM、50μM和100μM的EEV-PMO 221-1120处理的细胞的示例图像。与未处理的HeLa480细胞相比，经处理的HeLa480组中的CUG灶(绿色)减少。图41B是量化每细胞核面积的灶的图。图41A-图41B显示EEV-PMO 221-1120可以减少核CUG RNA灶。在5μM剂量中观察到几乎完全减少。

图42A-图42B指示EEV-PMO 221-1120处理可以选择性敲低HeLa480细胞系中含有重复序列扩增的DMPK转录物。

图42C-图42D显示用EEV-PMO 221-1120处理以剂量依赖性方式校正MBNL1(图42C)和SOCS1(图42D)剪接。

已经描述了本发明的多个实施方案。然而，应该理解，在不脱离本发明的精神和范围的情况下，可以进行各种修改。因此，其他实施方案在以下权利要求的范围内。

Claims

1.一种化合物，所述化合物包含：

具有6至12个氨基酸的环肽，其中所述环肽的至少两个氨基酸是带电荷的氨基酸，所述环肽的至少两个氨基酸是芳族疏水性氨基酸，所述环肽的至少两个氨基酸是不带电荷的非芳族氨基酸；以及

与靶mRNA序列中扩增的CUG重复序列的至少一部分互补的反义化合物(AC)，其中所述AC包含磷酰二胺吗啉代(PMO)核苷酸。

2.如权利要求1所述的化合物，其中所述环肽的至少两个带电荷的氨基酸是精氨酸。

3.如权利要求1或2所述的化合物，其中所述环肽的至少两个芳族疏水性氨基酸是苯丙氨酸、萘丙氨酸或它们的组合。

4.如权利要求1至3中任一项所述的化合物，其中至少两个不带电荷的非芳族氨基酸为瓜氨酸、甘氨酸或它们的组合。

5.如权利要求1所述的化合物，其中所述环肽具有以下结构之一：

其质子化形式，

其中：

R₁、R₂和R₃中的至少一者是氨基酸的芳族或杂芳族侧链；

R₄是H或氨基酸侧链；

AA_SC是所述反义化合物所缀合到的氨基酸侧链；并且

每个m独立地是0、1、2或3的整数。

6.如权利要求5所述的化合物，其中所述环肽具有以下结构之一：

或

其质子化形式。

7.如权利要求5或6所述的化合物，其中AA_SC是天冬酰胺残基、天冬氨酸残基、谷氨酸残基、高谷氨酸残基或高谷氨酸盐残基的侧链。

8.如权利要求5或6所述的化合物，其中

R₁、R₂和R₃中的至少一者是氨基酸的芳族或杂芳族侧链；

R₄是H或氨基酸侧链；

m是2，并且

AA_SC是谷氨酸残基的侧链。

9.如权利要求5或6所述的化合物，其中AA_SC是：其中t是0至5的整数。

10.如权利要求1至9中任一项所述的化合物，所述化合物还包含接头，其中所述接头将所述反义化合物缀合到所述AA_SC。

11.如权利要求10所述的化合物，其中所述接头包含-(OCH₂CH₂)_z’-亚基，其中z’是1至23的整数。

12.如权利要求10所述的化合物，其中所述接头包含：

(i)-(OCH₂CH₂)_z-亚基，其中z’是1至23的整数；

(ii)一个或多个氨基酸残基，诸如甘氨酸、β-丙氨酸、4-氨基丁酸、5-氨基戊酸或6-氨基己酸或它们的组合的残基；或者

(iii)(i)和(ii)的组合。

13.如权利要求10所述的化合物，其中所述接头包含：

(i)-(OCH₂CH₂)_z-亚基，其中z是2至20的整数；

(ii)甘氨酸、β-丙氨酸、4-氨基丁酸、5-氨基戊酸、6-氨基己酸或它们的组合的一个或多个残基；或者

(iii)(i)和(ii)的组合。

14.一种化合物，所述化合物包含：

包含环肽和环外肽的内体逃逸载体，其中所述环肽包含6至12个氨基酸，并且所述环外肽包含2至10个氨基酸；以及

15.如权利要求14所述的化合物，其中所述环肽的至少两个氨基酸是带电荷的氨基酸，所述环肽的至少两个氨基酸是芳族疏水性氨基酸，所述环肽的至少两个氨基酸是不带电荷的非芳族氨基酸。

16.如权利要求15所述的化合物，其中所述环肽的至少两个带电荷的氨基酸是精氨酸，所述环肽的至少两个芳族疏水性氨基酸是苯丙氨酸、萘丙氨酸或它们的组合，并且至少两个不带电荷的非芳族氨基酸是瓜氨酸、甘氨酸或它们的组合。

17.如权利要求14所述的化合物，其中所述环肽具有以下结构之一：

或

其质子化形式，

其中：

R₁、R₂和R₃中的至少一者是氨基酸的芳族或杂芳族侧链；

R₄是H或氨基酸侧链；

AA_SC是所述反义化合物和所述环外肽所缀合到的氨基酸侧链；并且

每个m独立地是0、1、2或3的整数。

18.如权利要求17所述的化合物，其中所述环肽具有以下结构之一：

或

其质子化形式。

19.如权利要求17或18所述的化合物，其中AA_SC是天冬酰胺残基、天冬氨酸残基、谷氨酸残基、高谷氨酸残基或高谷氨酸盐残基的侧链。

20.如权利要求17或18所述的化合物，其中AA_SC是谷氨酸残基的侧链。

21.如权利要求17或18所述的化合物，其中

R₁、R₂和R₃中的至少一者是氨基酸的芳族或杂芳族侧链；

R₄是H或氨基酸侧链；

m是2，并且

AA_SC是谷氨酸残基的侧链。

22.如权利要求17至21中任一项所述的化合物，其中AA_SC是：其中t是0至5的整数。

23.如权利要求14至22中任一项所述的化合物，其中所述环外肽包含4至8个氨基酸残基。

24.如权利要求14至23中任一项所述的化合物，其中所述环外肽包含1或2个氨基酸残基或其质子化形式或盐，所述氨基酸残基包含含有胍基的侧链。

25.如权利要求14至24中任一项所述的化合物，其中所述环外肽包含2个、3个或4个赖氨酸残基。

26.如权利要求25所述的化合物，其中每个赖氨酸残基的侧链上的所述氨基被三氟乙酰基(-COCF₃)、烯丙氧羰基(Alloc)、1-(4,4-二甲基-2,6-二氧代亚环己基)乙基(Dde)或(4,4-二甲基-2,6-二氧代亚环-1-己基-3)-甲基丁基(ivDde)取代。

27.如权利要求14至24中任一项所述的化合物，其中所述环外肽包含至少2个具有疏水性侧链的氨基酸残基。

28.如权利要求27所述的化合物，其中具有疏水性侧链的所述氨基酸残基选自缬氨酸、脯氨酸、丙氨酸、亮氨酸、异亮氨酸和蛋氨酸。

29.如权利要求14至24中任一项所述的化合物，其中所述环外肽包含以下序列之一：KK、KR、RR、HH、HK、HR、RH、KKK、KGK、KBK、KBR、KRK、KRR、RKK、RRR、KKH、KHK、HKK、HRR、HRH、HHR、HBH、HHH、HHHH、KHKK、KKHK、KKKH、KHKH、HKHK、KKKK、KKRK、KRKK、KRRK、RKKR、RRRR、KGKK、KKGK、HBHBH、HBKBH、RRRRR、KKKKK、KKKRK、RKKKK、KRKKK、KKRKK、KKKKR、KBKBK、RKKKKG、KRKKKG、KKRKKG、KKKKRG、RKKKKB、KRKKKB、KKRKKB、KKKKRB、KKKRKV、RRRRRR、HHHHHH、RHRHRH、HRHRHR、KRKRKR、RKRKRK、RBRBRB、KBKBKB、PKKKRKV、PGKKRKV、PKGKRKV、PKKGRKV、PKKKGKV、PKKKRGV或PKKKRKG，其中B是β-丙氨酸。

30.如权利要求14至24中任一项所述的化合物，其中所述环外肽包含以下序列之一：PKKKRKV、RR、RRR、RHR、RBR、RBRBR、RBHBR,或HBRBH，其中B是β-丙氨酸。

31.如权利要求14至24中任一项所述的化合物，其中所述环外肽包含以下序列之一：KK、KR、RR、KKK、KGK、KBK、KBR、KRK、KRR、RKK、RRR、KKKK、KKRK、KRKK、KRRK、RKKR、RRRR、KGKK、KKGK、KKKKK、KKKRK、KBKBK、KKKRKV、PKKKRKV、PGKKRKV、PKGKRKV、PKKGRKV、PKKKGKV、PKKKRGV或PKKKRKG。

32.如权利要求14至24中任一项所述的化合物，其中所述环外肽包含PKKKRKV。

33.如权利要求14至24中任一项所述的化合物，其中所述环外肽包含以下序列之一：NLSKRPAAIKKAGQAKKKK、PAAKRVKLD、RQRRNELKRSF、RMRKFKNKGKDTAELRRRRVEVSVELR、KAKKDEQILKRRNV、VSRKRPRP、PPKKARED、PQPKKKPL、SALIKKKKKMAP、DRLRR、PKQKKRK、RKLKKKIKKL、REKKKFLKRR、KRKGDEVDGVDEVAKKKSKK或RKCLQAGMNLEARKTKK。

34.如权利要求14至33中任一项所述的化合物，所述化合物还包含将所述反义化合物和所述环外肽缀合到所述AA_SC的接头。

35.如权利要求34所述的化合物，其中所述接头包含：

(i)-(OCH₂CH₂)_z’-亚基，其中z’是1至23的整数；

(iii)(i)和(ii)的组合。

36.如权利要求34所述的化合物，其中所述接头包含：

(i)-(OCH₂CH₂)_z-亚基，其中z是2至20的整数；

(iii)(i)和(ii)的组合。

37.如权利要求34所述的化合物，其中所述接头包含二价或三价C₁-C₅₀亚烷基，其中1-25个亚甲基任选且独立地被-N(H)-、-N(C₁-C₄烷基)-、-N(环烷基)-、-O-、-C(O)-、-C(O)O-、-S-、-S(O)-、-S(O)₂-、-S(O)₂N(C₁-C₄烷基)-、-S(O)₂N(环烷基)-、-N(H)C(O)-、-N(C₁-C₄烷基)C(O)-、-N(环烷基)C(O)-、-C(O)N(H)-、-C(O)N(C₁-C₄烷基)、-C(O)N(环烷基)、芳基、杂芳基、环烷基或环烯基置换。

38.如权利要求34所述的化合物，其中所述接头具有结构：

其中：

x’是1-23的整数；y是1-5的整数；z’是1-23的整数；*是所述环肽的氨基酸残基与氨基酸侧链的附接点；并且M是键合基团。

39.如权利要求38所述的化合物，其中z'是11。

40.如权利要求38或39所述的化合物，其中x'是1。

41.如权利要求38至40中任一项所述的化合物，其中所述环外肽在所述接头的氨基末端处缀合到所述接头。

42.如权利要求38至41中任一项所述的化合物，其中所述反义化合物缀合到M。

43.如权利要求17所述的化合物，其中所述化合物具有式(C)：

或

其质子化形式或盐，

其中：

R₄和R₇独立地是H或氨基酸侧链；

EP是所述环外肽；

每个m独立地是0至3的整数；

n是0至2的整数；

x’是1至23的整数；

y是1至5的整数；

q是1至4的整数；

z’是1至23的整数，并且

货物是所述反义化合物。

44.如权利要求43所述的化合物，其中R₁、R₂和R₃是H或包含芳基的侧链。

45.如权利要求44所述的化合物，其中包含芳基的所述侧链是苯丙氨酸的侧链。

46.如权利要求45所述的化合物，其中R₁、R₂和R₃中的两个是苯丙氨酸的侧链。

47.如权利要求44至46中任一项所述的化合物，其中R₁、R₂、R₃和R₄中的两个是H。

48.如权利要求44至47中任一项所述的化合物，其中z’是11。

49.如权利要求44至48中任一项所述的化合物，其中x’是1。

50.如权利要求17所述的化合物，所述化合物包含式(C-1)、(C-2)、(C-3)或(C-4)的结构：

或其质子化形式或盐，

其中EP是所述环外肽，并且

寡核苷酸是所述反义化合物。

51.如权利要求50所述的化合物，其中所述寡核苷酸包含以下序列：5’-CAG CAG CAGCAG CAG CAG CAG-3’。

52.如权利要求50或51所述的化合物，其中所述EP包含以下序列：PKKKRKV。

53.如前述权利要求中任一项所述的化合物，其中所述扩增的三核苷酸重复序列位于所述靶mRNA序列的3’UTR中。

54.如权利要求53所述的化合物，其中所述靶mRNA序列是DMPK mRNA序列。

55.如权利要求53所述的化合物，其中所述靶mRNA序列是ATXN8OS/ATXN8 mRNA序列。

56.如权利要求53所述的化合物，其中所述靶mRNA序列是JPH3mRNA序列。

57.如前述权利要求中任一项所述的化合物，其中所述AC包含5-10个CAG重复序列。

58.如前述权利要求中任一项所述的化合物，其中所述mRNA是前体mRNA或成熟mRNA。

59.如前述权利要求中任一项所述的化合物，其中所述mRNA是前体mRNA。

60.一种药物组合物，所述药物组合物包含有效量的如权利要求1-59中任一项所述的化合物。

61.一种细胞，所述细胞包含如权利要求1-59中任一项所述的化合物。

62.一种治疗有需要的受试者的强直性肌营养不良(DM)的方法，所述方法包括向所述受试者施用如权利要求1-59中任一项所述的化合物或如权利要求60所述的组合物。

63.如权利要求62所述的方法，其中所述施用引起肌肉组织中野生型蛋白质的表达增加。

64.如权利要求63所述的方法，其中所述施用引起膈肌组织、四头肌组织和/或心脏组织中所述野生型蛋白质的表达增加。

65.如权利要求63或64所述的方法，其中所述野生型蛋白质是由不具有扩增的CUG重复序列的基因表达的蛋白质。

66.如权利要求62至65中任一项所述的方法，其中所述施用防止或减少病灶形成。

67.如权利要求62-66中任一项所述的方法，其中所述核苷酸重复序列扩增位于DMPKmRNA的3’UTR中。

68.一种治疗与在3’非翻译区(UTR)中具有扩增的CUG重复序列的mRNA相关的疾病的方法，所述方法包括向有需要的受试者施用一种化合物，所述化合物包含：

与所述mRNA中所述扩增的CUG重复序列的至少一部分互补的反义化合物(AC)；以及

具有6至12个氨基酸的环肽，其中所述环肽的至少两个氨基酸是带电荷的氨基酸，所述环肽的至少两个氨基酸是芳族疏水性氨基酸，所述环肽的至少两个氨基酸是不带电荷的非芳族氨基酸。

69.如权利要求68所述的方法，其中所述环肽的至少两个带电荷的氨基酸是精氨酸，所述环肽的至少两个芳族疏水性氨基酸是苯丙氨酸、萘丙氨酸或它们的组合，并且所述环肽的至少两个不带电荷的非芳族氨基酸是瓜氨酸、甘氨酸或它们的组合。

70.如权利要求68所述的方法，其中所述环肽具有以下结构：

或

其质子化形式，

其中：

R₁、R₂和R₃各自独立地是H或氨基酸的芳族或杂芳族侧链；

R₁、R₂和R₃中的至少一者是氨基酸的芳族或杂芳族侧链；

R₄、R₅、R₆、R₇独立地是H或氨基酸侧链；

R₄、R₅、R₆、R₇中的至少一个是H或瓜氨酸的侧链；

AA_SC是所述反义化合物所缀合到的氨基酸侧链；并且

q是1、2、3或4。

71.如权利要求70所述的方法，其中R₄、R₅、R₆、R₇中的至少一个是3-胍基-2-氨基丙酸、4-胍基-2-氨基丁酸、精氨酸、高精氨酸、N-甲基精氨酸、N,N-二甲基精氨酸、2,3-二氨基丙酸、2,4-二氨基丁酸、赖氨酸、N-甲基赖氨酸、N,N-二甲基赖氨酸、N-乙基赖氨酸、N,N,N-三甲基赖氨酸、4-胍基苯丙氨酸、N,N-二甲基赖氨酸、β-高精氨酸或3-(1-哌啶基)丙氨酸的侧链。

72.如权利要求68所述的方法，其中所述环肽具有以下结构：

或其质子化形式，

其中：

R₁、R₂和R₃中的至少一者是氨基酸的芳族或杂芳族侧链；

R₄和R₇独立地是H或氨基酸侧链；

AA_SC是所述反义化合物所缀合到的氨基酸侧链；

q是1、2、3或4；并且

每个m独立地是0、1、2或3的整数。

73.如权利要求72所述的方法，其中所述环肽具有以下结构之一：

或

其质子化形式。

74.如权利要求72所述的方法，其中所述环肽具有以下结构之一：

或

其质子化形式。

75.如权利要求68至74中任一项所述的方法，其中所述反义化合物包含磷酰二胺吗啉代(PMO)核苷酸。

76.如权利要求68至75中任一项所述的方法，所述方法还包括将所述反义化合物缀合到AA_SC的接头。

77.如权利要求68至76中任一项所述的方法，所述方法包括内体逃逸载体，其中所述内体逃逸载体包含环肽和环外肽。

78.如权利要求68至77中任一项所述的方法，其中所述疾病是强直性肌营养不良(DM)。

79.如权利要求68至77中任一项所述的方法，其中所述疾病是脊髓小脑性共济失调8型(SCA8)。

80.如权利要求68至77中任一项所述的方法，其中所述疾病是亨廷顿病样2(HDL2)。

81.如前述权利要求中任一项所述的化合物、组合物或方法，其中所述反义化合物包含表2中所列的核苷酸序列。