[go: up one dir, main page]

CN117616126A - 可重新编程的tnpb多肽及其用途 - Google Patents

可重新编程的tnpb多肽及其用途 Download PDF

Info

Publication number
CN117616126A
CN117616126A CN202280024175.9A CN202280024175A CN117616126A CN 117616126 A CN117616126 A CN 117616126A CN 202280024175 A CN202280024175 A CN 202280024175A CN 117616126 A CN117616126 A CN 117616126A
Authority
CN
China
Prior art keywords
tnpb
sequence
target
protein
composition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280024175.9A
Other languages
English (en)
Inventor
张锋
H·阿尔泰-特兰
S·坎南
S·内蒂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Massachusetts Institute of Technology
Broad Institute Inc
Original Assignee
Massachusetts Institute of Technology
Broad Institute Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Massachusetts Institute of Technology, Broad Institute Inc filed Critical Massachusetts Institute of Technology
Priority claimed from PCT/US2022/013710 external-priority patent/WO2022159892A1/en
Publication of CN117616126A publication Critical patent/CN117616126A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本文详细描述了用于靶向多核苷酸的系统、方法和组合物。特别地,提供了包含新型TnpB多肽和可重新编程靶向核酸组分的工程化DNA靶向系统以及使用方法和应用。

Description

可重新编程的TNPB多肽及其用途
相关申请的交叉引用
本申请要求2021年1月25日提交的美国临时申请号63/141,371、2021年6月1日提交的美国临时申请号63/195,610、2021年6月15日提交的美国临时申请号63/210,860和2021年11月23日提交的美国临时申请号63/282,352的权益。上述申请的全部内容特此通过引用整体并入本文。
关于联邦政府赞助研究的声明
本发明是在由美国国家卫生研究院颁发的HL141201和HG09761号拨款下借助政府资助进行的。政府对本发明具有一定的权利。
序列表
本申请含有与提交同时发送的并且标记为“COPY 1”、“COPY 2”和“3of 3”的CD-ROM上的序列表。每个含有标题为BROD-5345WP_ST25.txt、创建于2022年1月25日并且大小为222,687,678字节(磁盘上为222.7MB)的ASCII.txt文件。序列表的内容整体并入本文。
技术领域
本文公开的主题一般涉及用于利用包含TnpB多肽的系统进行靶向基因修饰和核酸编辑的系统、方法和组合物。
背景技术
虽然存在可用于产生靶向基因组干扰的基因组编辑技术,但仍然需要新的基因组工程技术,所述技术采用新的策略和分子机制,并且是负担得起的、易于建立的、可放大的,并且便于靶向基因组内的多个位置。基因组工程和生物技术中的其他期望的工具将进一步推动技术的发展。
本申请中任何文献的引用或标识不承认此类文献可作为本发明的现有技术。
发明内容
在某些示例性实施方案中,非天然存在的、工程化的组合物包含a)TnpB多肽,所述TnpB多肽包含RuvC样结构域,和b)核酸组分分子ωRNA,所述ωRNA包含支架和可重新编程间隔序列,所述RNA分子能够与TnpB多肽形成复合物并且将TnpB多肽引导至靶多核苷酸。在一个实施方案中,TnpB多肽包含约200至约500个氨基酸。组合物可包含长度为10个核苷酸至30个核苷酸的ωRNA组分分子可重新编程间隔序列。在实施方案中,核酸组分分子包含长度为约80至200个核苷酸的支架。在一个方面,靶序列包含靶多核苷酸5'的靶相邻基序(TAM)序列,其可包含序列TCA或TTCAN。
在实施方案中,TnpB蛋白选自表1A、表1B或图1,或者由表1C中的多核苷酸序列编码。在实施方案中,TnpB蛋白选自表1A、表1B、表1C或图1,或者包含对应于图1中的序列比对的195D、277E或361D的一个或多个催化残基。在一个实施方案中,TnpB蛋白在45℃至60℃的温度范围内具有活性,即具有核酸酶活性。
在实施方案中,TnpB蛋白选自解纤维素马杜拉放线菌(Actinomaduracellulosilytica)菌株DSM 45823、纳米比亚马杜拉放线菌(Actinomadura namibiensis)菌株DSM 44197、裂叶游动放线菌(Actinoplanus lobatus)菌株DSM 43150(TnpB-1和TnpB-2)、嗜盐张利平氏菌(Lipingzhangella halophila)菌株DSM 102030、消旋纤线杆菌(Ktedonobacter racemifer)和ε变形菌纲细菌(Epsilonproteobacteria bacterium)QNF01000004_提取物_(反向)以及大孢束脂环酸芽孢杆菌(Alicyclobacillusmacrosporangiidus)菌株DSM 17980。
在实施方案中,靶多核苷酸是DNA。在一个方面,核酸组分还包含适体。在实施方案中,ωRNA组分分子还包含添加RNA模板的延伸。
在实施方案中,组合物可包含与TnpB蛋白缔合的功能结构域。在一个方面,功能结构域具有转座酶活性、重组酶活性、甲基化酶活性、去甲基化酶活性、翻译活化活性、翻译阻遏活性、转录活化活性、转录阻遏活性、转录释放因子活性、染色质修饰或重塑活性、组蛋白修饰活性、核酸酶活性、单链RNA切割活性、双链RNA切割活性、单链DNA切割活性、双链DNA切割活性、核酸结合活性、可检测活性或其任何组合。组合物可包含丝氨酸或酪氨酸重组酶。
在一个实施方案中,组合物还可包含同源重组供体模板,其包含用于插入到靶多核苷酸中的供体序列。
在一个方面,组合物提供位点特异性修饰,所述修饰可包括切割DNA多核苷酸。在一个方面,切割导致5'突出端,所述切割可发生在靶相邻基序的远端。在实施方案中,TnpB介导的切割发生在间隔子退火位点的位点或靶序列的3'。
还提供了一种载体系统,并且其可包含编码如本文详述的TnpB多肽和ωRNA组分组合物的一种或多种载体。
在实施方案中,提供了一种包含如本文详述的组合物的工程化细胞。
提供了编辑靶多核苷酸中的核酸的方法,其包括将组合物、一种或多种多核苷酸、或一种或多种载体递送至包含如本文所公开的靶多核苷酸的细胞或细胞群。在实施方案中,靶多核苷酸是基因组DNA内的靶序列。在实施方案中,在一个或多个碱基处编辑靶多核苷酸以引入G→A或C→T突变。
还提供了一种经分离的细胞或其后代,其包含使用如本文所述的方法进行的一个或多个碱基编辑。
本文提供了修饰细胞中的靶多核苷酸序列的方法,其包括向细胞中引入如本文所公开的任一种组合物。在一个方面,所述多肽和/或ωRNA组分经由编码多肽和/或一种或多种ωRNA的一种或多种多核苷酸来提供,并且其中所述一种或多种多核苷酸可操作地配置为表达TnpB多肽和/或ωRNA分子。在一个实施方案中,所述方法引入一种或多种突变,包括取代、缺失和插入。
在实施方案中,本文提供了经工程化、非天然存在的组合物,其包含:a)TnpB多肽,其中所述TnpB多肽是催化失活的;b)核苷酸脱氨酶,其与TnpB蛋白缔合或者以其他方式能够与TnpB蛋白形成复合物;以及c)ωRNA组分分子,其能够与TnpB蛋白形成复合物并且引导靶序列处的位点特异性结合。在实施方案中,核苷酸脱氨酶是腺苷脱氨酶或胞嘧啶脱氨酶。
提供了一种或多种多核苷酸,其编码如本文所公开的一种或多种多核苷酸。
还提供了一种或多种载体,其编码如本文所公开的一种或多种多核苷酸。
提供了一种细胞或其后代,其经遗传工程化以表达如本文所公开的组合物的一种或多种组分。
在实施方案中,本文提供了经工程化、非天然存在的组合物,其包含:a)催化死亡的TnpB多肽;b)逆转录酶,其与TnpB多肽缔合或者以其他方式能够与TnpB多肽形成复合物;以及c)ωRNA组分分子,其能够与TnpB蛋白形成复合物并引导复合物与靶多核苷酸的靶序列的位点特异性结合,所述指导分子还包含编码用于插入到靶多核苷酸中的供体序列的供体模板。
提供了一种或多种多核苷酸,其编码如本文所公开的一种或多种多核苷酸。
提供了一种或多种载体,其编码如本文所公开的一种或多种多核苷酸。
提供了修饰靶多核苷酸的方法,其包括将上述组合物、一种或多种多核苷酸、或一种或多种载体递送至包含靶多核苷酸的细胞或细胞群,其中所述复合物将逆转录酶引导至靶序列,并且所述逆转录酶促进由来自ωRNA组分分子的供体模板编码的供体序列插入到靶多核苷酸中。
在实施方案中,本文提供了方法,其中供体序列的插入:a)引入一个或多个碱基编辑;b)校正或引入提前终止密码子;c)破坏剪接位点;d)插入或恢复剪接位点;e)在靶多核苷酸的一个或两个等位基因处插入基因或基因片段;或f)其组合。在实施方案中,本文提供了一种经分离的细胞或其后代,其包含使用如所公开的方法进行的修饰。
在实施方案中,本文提供了经工程化、非天然存在的组合物,其包含:a)TnpB多肽;b)非LTR逆转录转座子蛋白,其与TnpB多肽缔合或者以其他方式能够与TnpB多肽形成复合物;以及c)ωRNA组分分子,其能够与TnpB蛋白形成复合物并引导复合物与靶多核苷酸的靶序列的位点特异性结合,所述ωRNA分子还包含编码用于插入到靶多核苷酸中的供体序列的供体模板,并且位于能够与非LTR逆转录转座子蛋白形成复合物的两个结合元件之间。
在实施方案中,本文提供了一种组合物,其中TnpB蛋白融合至非LTR逆转录转座子蛋白的N末端。在实施方案中,本文提供了一种组合物,其中TnpB蛋白经工程化以具有切口酶活性。在实施方案中,ωRNA组分分子将融合蛋白引导至靶向插入位点5'的靶序列,并且其中TnpB蛋白在靶向插入位点处产生链断裂。在实施方案中,ωRNA组分分子将融合蛋白引导至靶向插入位点3'的靶序列,并且其中TnpB蛋白在靶向插入位点处产生链断裂。在实施方案中,供体多核苷酸还包含聚合酶加工元件以促进供体多核苷酸序列的3'端加工。在实施方案中,供体多核苷酸还包含与供体构建体的5'端、供体构建体的3'端或两者上的靶序列同源的区域。在示例性实施方案中,同源区为8至25个碱基对。
提供了一种或多种多核苷酸,其编码如本文所公开的组合物的一种或多种组分。
提供了一种或多种载体,其包含如本文所公开的一种或多种多核苷酸。
提供了修饰靶多核苷酸的方法,其包括将上述组合物、一种或多种多核苷酸、或一种或多种载体递送至包含靶多核苷酸的细胞或细胞群,其中所述复合物将非LTR逆转录转座子蛋白引导至靶序列,并且所述非LTR逆转录转座子蛋白促进将来自供体构建体的供体多核苷酸序列插入到靶多核苷酸中。
在实施方案中,本文提供了方法,其中供体序列的插入:a)引入一个或多个碱基编辑;b)校正或引入提前终止密码子;c)破坏剪接位点;d)插入或恢复剪接位点;e)在靶多核苷酸的一个或两个等位基因处插入基因或基因片段;或f)其组合。在实施方案中,本文提供了一种经分离的细胞或其后代,其包含使用本文公开的方法进行的修饰。
在实施方案中,本文提供了经工程化、非天然存在的组合物,其包含:a)TnpB多肽;b)整合酶蛋白,其与TnpB多肽缔合或者以其他方式能够与TnpB多肽形成复合物;以及c)ωRNA组分分子,其能够与TnpB蛋白形成复合物并引导复合物与靶多核苷酸的靶序列的位点特异性结合,所述指导分子还包含编码用于插入到靶多核苷酸中的供体序列的供体模板,并且位于能够与整合酶蛋白形成复合物的两个结合元件之间。在实施方案中,TnpB蛋白融合至整合酶蛋白并且任选地融合至逆转录酶。在实施方案中,本文提供了一种组合物,其中TnpB蛋白经工程化以具有切口酶活性。在实施方案中,ωRNA组分分子将融合蛋白引导至靶序列,并且其中TnpB蛋白在靶向插入位点处产生切口。在实施方案中,供体多核苷酸还包含与供体构建体的5'端、供体构建体的3'端或两者上的靶序列同源的区域。
提供了一种或多种多核苷酸,其编码如本文所公开的组合物的一种或多种组分。
提供了一种或多种载体,其包含如本文所公开的一种或多种多核苷酸。
提供了修饰靶多核苷酸的方法,其包括将上述组合物、一种或多种多核苷酸、或一种或多种载体递送至包含靶多核苷酸的细胞或细胞群,其中所述复合物将整合酶蛋白引导至靶序列,并且所述整合酶蛋白促进将来自供体构建体的供体多核苷酸序列插入到靶多核苷酸中。
在实施方案中,本文提供了方法,其中供体序列的插入:a)引入一个或多个碱基编辑;b)校正或引入提前终止密码子;c)破坏剪接位点;d)插入或恢复剪接位点;e)在靶多核苷酸的一个或两个等位基因处插入基因或基因片段;或f)其组合。在实施方案中,本文提供了一种经分离的细胞或其后代,其包含使用上文公开的方法进行的修饰。
在实施方案中,本文提供了用于检测样品中靶核苷酸的存在的组合物,其包含:一种或多种具有旁切活性(collateral activity)的TnpB蛋白;至少一种ωRNA组分,其包含能够结合靶多核苷酸的序列并且被设计为与一种或多种TnpB蛋白形成复合物;检测构建体,其包含多核苷酸组分,其中TnpB蛋白表现出旁切核酸酶活性,并且一旦被靶序列活化就切割检测构建体的多核苷酸组分;以及任选地,等温扩增试剂。
在实施方案中,TnpB蛋白选自表1A、表1B或图1,或者由表1C中的多核苷酸序列编码。在实施方案中,TnpB蛋白选自表1A、表1B或图1,或者包含对应于图1中的序列比对的195D、277E或361D的一个或多个催化残基,或者由表1C中的多核苷酸序列编码。在一个实施方案中,TnpB蛋白在45℃至60℃的温度范围内具有活性,即具有核酸酶活性。
在实施方案中,等温扩增试剂是环介导等温扩增(LAMP)试剂。在示例性实施方案中,LAMP试剂包含LAMP引物。
在实施方案中,本文提供了组合物,其还包含一种或多种添加剂以增加反应特异性或动力学。在实施方案中,本文提供了包含多核苷酸结合珠的组合物。
在实施方案中,提供了一种用于检测靶序列(例如冠状病毒)的系统。一种用于检测样品中靶序列的存在的系统可包括:TnpB蛋白;至少一种ωRNA组分分子,其包含能够结合靶序列的序列并且被设计为与TnpB蛋白形成复合物;以及包含多核苷酸组分的检测构建体,其中TnpB蛋白表现出旁切RNA酶活性,并且一旦被靶序列活化就切割检测构建体的多核苷酸组分。
在示例性实施方案中,提供了用于检测样品中靶多核苷酸的存在的组合物,其包含用于扩增靶多核苷酸的等温扩增试剂,以及用于从细胞或病毒颗粒分离多核苷酸的免提取溶液(extraction-free solution)。等温扩增试剂可包括LAMP试剂,所述LAMP试剂包含F3、B3、FIP、BIP、环正向和环反向引物。在一个方面,LAMP试剂还可包含寡核苷酸链置换(OSD)探针。
所述系统和方法可以利用一种或多种TnpB蛋白,在一个方面,所述TnpB蛋白是热稳定的。用于检测的组合物可包含DNA提取溶液。检测方法还可以包括在使样品与本文公开的系统接触之前用DNA提取溶液处理样品的步骤。提取还可包括添加能够浓缩样品的感兴趣靶标的珠子,在一个方面,珠子是磁性的。
在实施方案中,通过靶多核苷酸与TnpB复合物的结合来检测扩增的靶多核苷酸在45℃至60℃的温度范围内发生。
在实施方案中,TnpB复合物中的TnpB蛋白选自解纤维素马杜拉放线菌菌株DSM45823、纳米比亚马杜拉放线菌菌株DSM 44197、裂叶游动放线菌菌株DSM 43150(TnpB-1和TnpB-2)、嗜盐张利平氏菌菌株DSM 102030、消旋纤线杆菌和ε变形菌纲细菌QNF01000004_提取物_(反向)以及大孢束脂环酸芽孢杆菌菌株DSM 17980。
还提供了包括检测系统的装置。装置可包括侧流装置或盒。还提供了一种侧流装置,其包括有包括第一端和第二端的基底,所述第一端包括样品装载部分;第一区域,所述第一区域包括可检测配体、本文提供的权利要求的两个或更多个系统、以及一个或多个第一捕获区域,每个第一捕获区域包含第一结合剂;基底在第一端的第一区域与第二端之间包括两个或更多个第二捕获区域,每个第二捕获区域包含不同的结合剂。在一个方面,第一端包含两个检测构建体,其中两个检测构建体中的每一个包含RNA或DNA寡核苷酸,其包含在第一端上的第一分子和在第二端上的第二分子。在一个方面,第一端包含三个检测构建体,其中三个检测构建体中的每一个包含RNA或DNA寡核苷酸,其包含在第一端上的第一分子和在第二端上的第二分子。侧流装置可包含编码TnpB的多核苷酸,并且核酸组分分子作为多重多核苷酸提供,所述多重多核苷酸被配置为包含两种或更多种核酸组分分子。
可提供一种盒,至少包括第一和第二安瓿、裂解室、扩增室和样品接收室,第一安瓿流体连接至样品接收室,样品接收室进一步连接至裂解室,裂解室经由计量通道连接至第二安瓿和扩增室。
盒可以被配置为安装在包括加热装置、光学装置、用于在盒上释放试剂的装置、以及用于读出测定结果的装置的系统中。盒可以包括包含裂解缓冲液的第一安瓿和/或包含TnpB系统的第二安瓿,所述TnpB系统包含一种或多种TnpB蛋白和至少一种核酸组分分子。
在实施方案中,提供了一种盒,其中用于扩增和检测靶多核苷酸的TnpB旁切检测系统中的TnpB蛋白在45℃至60℃的温度范围内具有活性,即,具有核酸酶活性。
在实施方案中,提供了一种盒,其中TnpB蛋白是来自以下的表1A中的TnpB:解纤维素马杜拉放线菌菌株DSM 45823、纳米比亚马杜拉放线菌菌株DSM 44197、裂叶游动放线菌菌株DSM 43150(TnpB-1和TnpB-2)、嗜盐张利平氏菌菌株DSM 102030、消旋纤线杆菌和ε变形菌纲细菌QNF01000004_提取物_(反向)以及大孢束脂环酸芽孢杆菌菌株DSM 17980。
提供了用于检测样品中的多核苷酸的方法,其包括使一个或多个靶序列与TnpB、至少一种能够与所述TnpB形成复合物并引导与一种或多种靶多核苷酸的序列特异性结合的ωRNA组分以及检测构建体接触,其中所述TnpB表现出旁切核酸酶活性并且一旦被所述一个或多个靶序列活化就切割所述检测构建体;和检测来自检测构建体的切割的信号,从而检测一种或多种靶多核苷酸。提供了用于检测样品中的多核苷酸的方法,其还包括在接触步骤之前使用等温扩增来扩增靶多核苷酸。在实施方案中,提供了一种方法,其中通过靶多核苷酸与TnpB复合物的结合来检测扩增的靶多核苷酸在45℃至60℃的温度范围内发生。在示例性实施方案中,靶多核苷酸在一小时或更短的时间内检测。
还提供了用于检测样品中的靶核酸的方法,其包括使样品与本文所述的装置接触。
本领域普通技术人员在考虑示例性实施方案的以下详细描述后,示例性实施方案的这些和其他方面、目标、特征和优点将变得显而易见。
附图说明
本发明的特征和优点的理解通过参考阐明利用本发明原则的说明性实施方案的以下详细描述和其附图来获得:
图1–示出了示例性TnpB肽的序列比对。RuvC催化氨基酸残基带下划线。
图2–示例性TnpB序列的比对。
图3–示例性TnpB基因座的3'端的比对。
图4–描绘了示例性TnpB的5'反向末端重复(ITR)序列。
图5–IscB的5'ITR示出了与示例性TnpB在序列水平上的相似性。
图6–描绘了示例性消旋纤线杆菌TnpB基因、RNA保守区和指导物(即,间隔子)。
图7–描绘了来自消旋纤线杆菌的示例性TnpB基因座的注释序列,包括5'ITR和3'ITR。
图8–示出了用于询问裂叶游动放线菌菌株DSM 43150和ε变形菌纲细菌分离株B11的示例性TnpB蛋白的TAM要求的实验设置。
图9–示出了裂叶游动放线菌菌株DSM 43150(TCAG)和ε变形菌纲细菌分离株B11(TCAT)的5’TAM weblogo。
图10–示出了用于评价靶标切割的示例性质粒切割测定的示意图。
图11A至图11D–示出了直系同源物5的TnpB Rd1总结。Rd1是10种直系同源物的选择,所述直系同源物似乎和与IscB ncRNA具有序列相似性的ncRNA相关。(11A)RNA-seq分析验证了TnpB与ncRNA相关。(11B)TnpBRd1_5_Fn30_TAM的Weblogo示出了所有捕获的TAM中的富集的TAM(Fn间隔区的30bp指导物)。(11C)TnpBRd1_5_644PSP1_30的Weblogo示出了捕获的TAM的前15%中的富集的TAM(644PSP1间隔区的30bp指导物)。(11D)TCAG TAM观察到的10%耗竭中的耗竭的TAM(Fn间隔区的30bp指导物)的Weblogo。
图12A至图12B–示出了直系同源物1和4的TnpB Rd1验证。(12A)质粒底物的TXTL切割测定验证了裂叶游动放线菌TnpB-1和解纤维素马杜拉放线菌TnpB中的TAM特异性切割。每个条件包括两种相同浓度的单独质粒用于直接比较不同的底物。(12B)衔接子连接位点在TAM筛选和验证之间是相似的(示出的直系同源物4的结果)。使用非靶标(NT)链和靶标(T)链的8N TAM文库质粒(上方条形图)进行的衔接子连接的位置示出了每条链的衔接子连接位点略有不同。当单个TAM质粒与非靶标(NT)链一起使用时(底部条形图),衔接子连接的位点与使用TAM文库时的非靶标(NT)链相似。
图13A至图13B–示出了七种示例性TnpB直系同源物中的TAM序列的鉴定。(13A)使用两种方法来确定具有5'TAM的直系同源物中的TAM序列:(i)完整pTarget的测序和(ii)在切割和衔接子连接之后富集的TAM的测序。(13B)Weblogo示出了七种细菌TnpB直系同源物序列的TAM,包括解纤维素马杜拉放线菌菌株DSM 45823、纳米比亚马杜拉放线菌菌株DSM44197、来自裂叶游动放线菌菌株DSM 43150的两种TnpB、大孢束脂环酸芽孢杆菌菌株DSM17980、嗜盐张利平氏菌菌株DSM 102030以及ε变形菌纲细菌和消旋纤线杆菌。
图14–示出了两种TnpB直系同源物的TAM的验证。在裂叶游动放线菌TnpB-1和解纤维素马杜拉放线菌TnpB的切割产物的衔接子连接后确定TAM。
图15A至图15B–示出了裂叶游动放线菌TnpB-2的靶标链(TS)和非靶标链(NTS)的DNA切割位点的鉴定(15A)。黑色三角形代表测序后鉴定的两条链上的特异性切割位点。(15B)来自裂叶游动放线菌TnpB-2的8N TAM文库质粒切割产物的测序和分析。非靶标(NT)和靶标(T)链均被切割,并且示出了间隔区中不同位置(bp)处的读数丰度。
图16A至图16B–示出了与裂叶游动放线菌TnpB相关的非编码RNA(ncRNA)的表征。(16A)裂叶游动放线菌TnpB-2在大肠埃希氏菌(E.coli)中的表达和RNA拉下(RNApulldown)示出了紧邻TnpB-2ORF下游的173nt支架,其后是指导序列。(16B)尺寸范围从全长173nt截短至102nt的RNA支架已被证明维持TAM特异性富集。
图17–示出了与消旋纤线杆菌TnpB缔合的非编码RNA区域。
图18A至图18F–示出了对IS200/605超家族核酸酶多样性的探索。(18A)IS200/605转座子超家族编码的核酸酶和相关RNA之间的进化。虚线反映了暂定/未知的关系。(18B)TnpBωRNA在消旋纤线杆菌中的天然表达。(18C)来自消旋纤线杆菌IscB和TnpB基因座的ωRNA的比较。(18D)KraTnpB连接的ωRNA的二级结构预测。(18E)裂叶游动放线菌和解纤维素马杜拉放线菌TnpB在IVTT TAM屏幕中使用重新编程的指导切割TAM的Weblogo。(18F)使用裂叶游动放线菌和解纤维素马杜拉放线菌TnpB的质粒竞争测定(*表示p<0.05)。
图19–示出了天然存在的RNA指导的DNA靶向系统。Ω(专性移动元件指导活性(OMEGA))系统与其他已知的RNA指导的系统的比较。与捕获间隔序列并将其存储在基因座中的CRISPR阵列中的CRISPR系统不同,Ω系统将其基因座(或反式作用基因座)转座到靶序列中,显然,在可以被称为指导募集(guide conscription)的过程中将靶标转换为ωRNA指导。
图20–示出了TnpB保守分析的结果。共享KraIscB-1转座子末端的TnpB基因座的3'端的保守。TnpB基因座的3'区域上的保守区域对应于IscB的ωRNA的5'区域。3'端上的ORF外部的TnpB基因座的保守性表明存在可能与IscB的ωRNA功能类似的非编码RNA。
图21A至图21C–TnpBωRNA指导的切割的表征。(21A)在下游预测的ωRNA和指导物的存在下重组纯化的裂叶游动放线菌TnpB-2的小RNA-seq。预测的ωRNA支架和构成与裂叶游动放线菌TnpB-2蛋白共纯化的推定指导的下游区域,表明所述蛋白与ωRNA转录物存在相互作用。(21B)额外TnpB基因座的TAM筛选。(21C)使用SpCas9的质粒竞争测定阳性对照。如预期的那样,SpCas9仅切割含有TAM和靶标的质粒,如切割特异性衔接子连接产物的存在所示。通过使用双尾T检验比较每个条件下列出的第一质粒的衔接子连接的读数数目来评估统计显著性,所述数目归一化为+蛋白质与-蛋白质条件中列出的第二质粒的衔接子连接读数的平均值。
图22–示出了在dsDNA底物的不同温度(范围37℃至80℃)下使用TnpB蛋白进行的靶相邻基序(TAM)和靶标依赖性dsDNA切割需要TAM和靶标两者,并且在45℃与60℃之间最稳健。在本实验中,TnpB蛋白从直系同源物6获得,其对应于大孢束脂环酸芽孢杆菌菌株DSM17980,并以1μM蛋白和100ng dsDNA底物的最终浓度添加。
图23–是一张照片,其示出了在60℃下使用来自大孢束脂环酸芽孢杆菌菌株DSM17980的TnpB蛋白以1μM的最终浓度对旁切底物(旁切底物1)进行的旁切切割。“ssDNA底物”和“dsDNA底物”含有ωRNA被设计与其结合的靶序列。“旁切底物1”不含有靶序列。照片显示在dsDNA底物的存在下诱导旁切底物1的切割,其中dsDNA底物具有靶序列和TAM两者。也在具有靶序列以及具有和不具有TAM的ssDNA底物的存在下诱导旁切底物1的切割。
本文中的图仅用于说明目的,并且不一定按比例绘制。
具体实施方式
一般定义
除非另外定义,否则本文所使用的技术和科学术语具有与本公开所属领域的普通技术人员通常所理解相同的意义。分子生物学中的常见术语和技术的定义可见于Molecular Cloning:A Laboratory Manual,第2版(1989)(Sambrook,Fritsch和Maniatis);Molecular Cloning:A Laboratory Manual,第4版(2012)(Green和Sambrook);Current Protocols in Molecular Biology(1987)(F.M.Ausubel等人编辑);the seriesMethods in Enzymology(Academic Press,Inc.):PCR 2:A Practical Approach(1995)(M.J.MacPherson,B.D.Hames和G.R.Taylor编辑):Antibodies,A Laboratory Manual(1988)(Harlow和Lane编辑):Antibodies A Laboratory Manual,2013年第2版(E.A.Greenfield编辑);Animal Cell Culture(1987)(R.I.Freshney编辑);BenjaminLewin,Genes IX,由Jones and Bartlet出版,2008(ISBN 0763752223);Kendrew等人(编辑),The Encyclopedia of Molecular Biology,由Blackwell Science Ltd.出版,1994(ISBN 0632021829);Robert A.Meyers(编辑),Molecular Biology and Biotechnology:aComprehensive Desk Reference,由VCH Publishers,Inc.出版,1995(ISBN9780471185710);Singleton等人,Dictionary of Microbiology and Molecular Biology第2版,J.Wiley&Sons(New York,N.Y.1994),March,Advanced Organic ChemistryReactions,Mechanisms and Structure第4版,John Wiley&Sons(New York,N.Y.1992);以及Marten H.Hofker和Jan van Deursen,Transgenic Mouse Methods and Protocols,第2版(2011)。
如本文所用,除非上下文另外明确指出,否则单数形式“一个/一种(a/an)”和“所述(the)”包括单个指代物和复数个指代物两者。
术语“任选的”或“任选地”意指随后描述的事件、情况或取代者可能发生或可能不发生,并且所述描述包括其中所述事件或情况发生的情况以及其中所述事件或情况未发生的情况。
通过端点列举的数值范围包括包容在相应范围内的所有数字和分数,以及所列举的端点。
如本文所用的术语“约”或“大约”当提及诸如参数、量、时距等的可测量值时,意在涵盖特定值的变化以及从特定值的变化,诸如特定值的+/-10%或更少、+/-5%或更少、+/-1%或更少以及+/-0.1%或更少的变化以及从特定值的+/-10%或更少、+/-5%或更少、+/-1%或更少以及+/-0.1%或更少的变化,只要此类变化适合在所公开的发明中执行。应当理解,修饰语“约”或“大约”所指的值本身也是具体且优选地公开的。
如本文所用,“生物样品”可含有全细胞和/或活细胞和/或细胞碎片。生物样品可含有(或来源于)“体液”。本发明涵盖其中体液选自羊水、房水、玻璃体液、胆汁、血清、母乳、脑脊液、耵聍(耳垢)、乳糜、食糜、内淋巴、外淋巴、渗出液、粪便、女性精液(femaleejaculate)、胃酸、胃液、淋巴液、粘液(包括鼻腔引流液和痰)、心包液、腹膜液、胸膜液、脓液、发炎性分泌物、唾液、皮脂(皮肤油)、精液、痰液、滑液、汗液、泪液、尿液、阴道分泌物、呕吐物及其一种或多种的混合物的实施方案。生物样品包括细胞培养物、体液、来自体液的细胞培养物。体液可以例如通过穿刺或其他收集或取样程序从哺乳动物生物体中获得。
术语“受试者”、“个体”和“患者”在本文中可互换使用以指代脊椎动物,优选哺乳动物,更优选人类。哺乳动物包括但不限于鼠科动物、猿、人类、家畜、竞技动物和宠物。还涵盖在体内获得或在体外培养的生物实体的组织、细胞及其后代。
下文描述了各种实施方案。应当注意,具体实施方案并不旨在作为详尽的描述或作为对本文讨论的更广义方面的限制。结合特定实施方案描述的一个方面不一定限于所述实施方案并且可以与任何其他实施方案一起实施。在整篇本说明书中,“一个实施方案(oneembodiment)”、“实施方案(an embodiment)”、“示例性实施方案(an exampleembodiment)”的提及意指结合实施方案描述的特定特征、结构或特性被包括在本发明的至少一个实施方案中。因此,在整篇本说明书中各处出现短语“在一个实施方案中(in oneembodiment)”、“在实施方案中(in an embodiment)”或“示例性实施方案(an exampleembodiment)”时,不一定都指代同一个实施方案,但可指代同一个实施方案。此外,本领域技术人员从本公开中将显而易见,在一个或多个实施方案中,特定特征、结构或特性可以任何合适方式组合。此外,尽管本文所述的一些实施方案包括一些但不包括其他实施方案中所包括的其他特征,但是不同实施方案的特征的组合意图落入本发明的范围内。例如,在所附权利要求中,所要求保护的实施方案中的任一个可以任何组合使用。
本文引用的所有出版物、公开的专利文献、以及专利申请特此通过引用并入,其程度就如同每篇单独出版物、公开的专利文献、或专利申请明确地并且单独地指示通过引用并入。
概述本文公开的实施方案提供了经工程化TnpB系统。TnpB系统包含TnpB多肽以及能够与TnpB多肽形成复合物并将所述复合物引导至靶多核苷酸的核酸组分。TnpB系统和TnpB/核酸组分复合物在本文中也可称为OMEGA(专性移动元件指导活性(Obligate MobileElement Guided Activity))系统或复合物,或简称为Ω系统或复合物。TnpB系统是Ω系统的一种独特类型,TnpB系统还包括IscB、IsrB和IshB系统。Ω系统的核酸组分在结构上与其他RNA指导的核酸酶(诸如CRISPR-Cas系统)不同,并且也可称为ωRNA。在某些示例性实施方案中,TnpB系统以RNA为主,即相对于其他RNA指导的核酸酶系统(诸如CRISPR-Cas),核酸组分对TnpB复合物的总体大小做出更大的贡献。此外,考虑到TnpB相对于其他已知的可编程核酸酶(诸如CRISPR-Cas)具有更小的结构特征,多核苷酸结合口袋是开放的并且更具可及性,这可以促进对结合的多核苷酸上的靶区域处的核苷酸的更大的接近以及操纵、修饰、编辑、移除或缺失所述核苷酸的能力。本文公开了可充当核酸酶、切口酶或可与其他功能结构域偶联的催化失活多核苷酸结合蛋白的TnpB系统。
在一个实施方案中,TnpB系统和相关组合物可特异性地靶向单链或双链DNA。在一个实施方案中,TnpB系统可结合并切割双链DNA。在一个实施方案中,TnpB系统可结合双链DNA而不向任一条链引入断裂。在一个实施方案中,TnpB多肽或核酸酶/核酸组分复合物可打开,破坏两条DNA链之一的连续性,从而引入双链DNA的切口。在实施方案中,并且不受理论的束缚,TnpB系统的大小和构型允许暴露于非靶向链(其可以是单链形式),以允许修饰、编辑、缺失或插入非靶标链上的多核苷酸的能力。在实施方案中,此种可及性还允许增强对靶标链和/或非靶标链的编辑结果,例如增加特异性、增强编辑效率。
在另一个方面,本文公开的实施方案包括本文的组合物的应用,包括治疗和诊断组合物和用途。还提供了所公开的蛋白质和系统的递送,包括递送至多个细胞,并且所述递送经由多种递送媒介物。
TnpB组合物
在一个方面,本文公开的实施方案涉及组合物,其包含TnpB以及能够与TnpB形成复合物并引导TnpB与靶多核苷酸上的靶序列的位点特异性结合的ωRNA。
TnpB多肽
本发明的TnpB多肽可包含Ruv-C样结构域。示例性TnpB序列在图1、表1A、表1B、表1C和表5中示出。RuvC结构域可以是包含RuvC-I、RuvC-II和RuvC-III亚结构域的分割RuvC结构域。TnpB还可包含HTH结构域、桥螺旋结构域和锌指结构域中的一种或多种。TnpB多肽不包含HNH结构域。在一个示例性实施方案中,TnpB蛋白从N末端开始包含HTH结构域、RuvC-I亚结构域、桥螺旋结构域、RuvC-II亚结构域、锌指结构域和RuvC-III亚结构域。在一个示例性实施方案中,RuvC-III亚结构域形成TnpB多肽的C末端。
在某些示例性实施方案中,TnpB多肽的大小在175与800个氨基酸之间、大小在200与790个氨基酸之间、大小在200与780个氨基酸之间、大小在200与770个氨基酸之间、大小在200与760个氨基酸之间、大小在200与750个氨基酸之间、大小在200与740个氨基酸之间、大小在200与730个氨基酸之间、大小在200与720个氨基酸之间、大小在200与720个氨基酸之间、大小在200与710个氨基酸之间、大小在200与700个氨基酸之间、大小在200与690个氨基酸之间、大小在200与680个氨基酸之间、大小在200与670个氨基酸之间、大小在200与660个氨基酸之间、大小在200与650个氨基酸之间、大小在200与640个氨基酸之间、大小在200与630个氨基酸之间、大小在200与620个氨基酸之间、大小在200与610个氨基酸之间、大小在200与600个氨基酸之间、大小在200与590个氨基酸之间、大小在200与580个氨基酸之间、大小在200与570个氨基酸之间、200与560个氨基酸之间、200 550个氨基酸之间、200与540个氨基酸之间、200与530个氨基酸之间、200与520个氨基酸之间、200与510个氨基酸之间、200与500个氨基酸之间、200与490个氨基酸之间、200与480个氨基酸之间、200与470个氨基酸之间、200与460个氨基酸之间、200与450个氨基酸之间、200与440个氨基酸之间、200与430个氨基酸之间、200与420个氨基酸之间、200与410个氨基酸之间、210与500个氨基酸之间、220与500个氨基酸之间。230与500个氨基酸之间、240与500个氨基酸之间、250与500个氨基酸之间、260与500个氨基酸之间、270与500个氨基酸之间、280与500个氨基酸之间、290与500个氨基酸之间、300与500个氨基酸之间、250与490个氨基酸之间、250与480个氨基酸之间、250与490个氨基酸之间或250与600个氨基酸之间。在一个实施方案中,TnpB多肽在300与500个氨基酸之间,或者在350与450个氨基酸之间。
在一个实施方案中,TnpB多肽可包含修饰的天然存在的蛋白质、其功能片段或截短版本、或非天然存在的蛋白质。在一个实施方案中,TnpB多肽包含来源于其他TnpB多肽、更特别地来源于不同生物体的一个或多个结构域。在一个实施方案中,TnpB多肽可通过计算机方法设计。计算机蛋白质设计的实例已在本领域中描述并且因此是技术人员已知的。
在一个实施方案中,TnpB多肽来自ε变形菌纲细菌或裂叶游动放线菌菌株DSM43150、解纤维素马杜拉放线菌菌株DSM 45823、纳米比亚马杜拉放线菌菌株DSM 44197、大孢束脂环酸芽孢杆菌菌株DSM 17980、嗜盐张利平氏菌菌株DSM 102030或消旋纤线杆菌。在一个实施方案中,TnpB多肽来自消旋纤线杆菌,或包含与消旋纤线杆菌TnpB基因座的5'ITR类似的保守RNA区域。参见例如表5、图2。在一个方面,TnpB多肽编码5'ITR/RNA(RNA位于3'链上)、TnpB(3'链)、以及最后的3’ITR。在一个示例性实施方案中,TnpB可包含真核基因组中发现的Fanzor蛋白、TnpB同源物。
TnpB多肽还涵盖TnpB多肽的同源物或直系同源物,其序列在本文中具体描述。术语“直系同源物”和“同源物”是本领域众所周知的。通过进一步指导的方式,如本文所用的蛋白质的“同源物”是相同物种的蛋白质,其与作为其同源物的蛋白质执行相同或类似的功能。同源蛋白质可以但不必在结构上相关,或者仅在结构上部分相关。如本文所用的蛋白质的“直系同源物”是不同物种的蛋白质,其与作为其直系同源物的蛋白质执行相同或类似的功能。直系同源蛋白质可以是但可以不总是在结构上相关,或者仅在结构上部分相关。在特定的实施方案中,TnpB多肽的同源物或直系同源物(诸如本文提及的)与TnpB多肽,更具体地与表1A、1B、1C、5或图1中鉴定的TnpB序列具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同源性或同一性。在特定的实施方案中,同源物或直系同源物根据其结构域结构和/或功能来鉴定。在实施方案中,同源物或直系同源物包含如本文所定义的催化残基和/或结构域,包括图1和图18中鉴定的。如本文所述进行的序列比对以及如本文教导的折叠研究和结构域预测可以帮助鉴定同源物或直系同源物,所述同源物或直系同源物具有鉴定TnpB多肽的结构和功能特征,特别是具有保守残基(包括催化残基)和TnpB多肽的结构域的那些。
在一个实施方案中,TnpB基因座包含反向末端重复(ITR)。反向末端重复可存在于TnpB序列的5'或3'端。在一个方面,反向末端重复可包含约20至约40个核苷酸,例如约20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40个核苷酸。在实施方案中,ITR包含约25至35个核苷酸、约28至32个核苷酸。在一个方面,ITR与编码IscB多肽的序列的一个或多个反向末端重复具有相似性。在一个实施方案中,TnpB的5’ITR或3’ITR与IscB 5’ITR或3’ITR具有至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同源性或同一性。在实施方案中,TnpB的5’ITR与IscB的5’ITR同源。示例性IscB ITR公开于Altae-Tran等人,Science 2021年9月9日,374:6563,第57-65页;doi:10.1126/science.abj685,其明确通过引用整体并入本文,包括补充材料数据S1至S4和表S1至S6。
在一个实施方案中,TnpB基因座包含超出编码多肽的序列的高度保守区域,其表明在TnpB基因座的5'端存在RNA。在一个方面,TnpB的5’ITR的上游区域包含编码包含指导序列的RNA物种的区域。
嵌合酶可以包含第一片段和第二片段,并且所述片段可以是一个属或一种物种的生物体的TnpB多肽直系同源物,例如,所述片段来自不同物种的TnpB多肽直系同源物。
RuvC结构域
在一个实施方案中,TnpB多肽包含至少一个RuvC样核酸酶结构域。RuvC结构域可包含指示RuvC催化残基的保守催化氨基酸。在示例性实施方案中,RuvC催化残基可相对于以下来引用:表1A的TnpB多肽488601079的186D、270E或354D;表1A的TnpB多肽297565028的172D、254E或337D;或表1A的TnpB多肽257060308的179D、268E或351D。催化残基可相对于图1中的序列比对的195D、277E或361D来引用。在一个方面,RuvC结构域可包含多个亚结构域,例如RuvC-I、RuvC-II和RuvC-III。亚结构域可被蛋白质的间插氨基酸序列分开。示例性TnpB多肽的示例性结构域架构在图18A中示出。
在一个实施方案中,RuvC结构域的实例包括与本领域中描述的RuvC结构域具有结构相似性和/或序列相似性的任何多肽。在一些实例中,RuvC结构域可具有与本领域已知的RuvC结构域具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少99%、或100%序列同一性的氨基酸序列。
在一些实例中,RuvC结构域包含RuvC-I亚结构域、RuvC-II亚结构域和RuvC-III亚结构域。RuvC-I亚结构域的实例还包括与本领域中描述的RuvC-I结构域具有结构相似性和/或序列相似性的任何多肽。例如,RuvC-I结构域可与细菌或古细菌物种中发现的RuvC-I具有结构相似性和/或序列相似性。在一些实例中,RuvC结构域可具有与RuvC-I结构域具有至少50%、至少55%、至少60%、至少5%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少99%、或100%序列同一性的氨基酸序列。RuvC-II结构域还包括与本领域中描述的RuvC-II结构域具有结构相似性和/或序列相似性的任何多肽。在一些实例中,RuvC结构域可具有与RuvC-II结构域具有至少50%、至少55%、至少60%、至少5%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少99%、或100%序列同一性的氨基酸序列。RuvC-III结构域还包括与本领域中描述的RuvC-III结构域具有结构相似性和/或序列相似性的任何多肽。在一些实例中,RuvC结构域可具有与RuvC-III结构域具有至少50%、至少55%、至少60%、至少5%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少99%、或100%序列同一性的氨基酸序列。
例如,并且如本领域中所述(例如,Crystal structure of Cas9 in complexwith nucleic acid component molecule and target DNA,Nishimasu等人Cell,2014),RuvC可以由侧接α螺旋(α33、α34和α39-α45)的六链混合β片层(β1、β2、β5、β11、β14和β17)和两个额外的双链反平行β片层(β3/β4和β15/β16)组成。据描述,一些RuvC结构域与以RNA酶H折叠为特征的逆转录病毒整合酶超家族成员具有结构相似性,诸如大肠埃希氏菌RuvC(PDB代码1HJR,14%同一性,均方根偏差(rmsd)为126个等效Cα原子)和嗜热栖热菌(Thermus thermophilus)RuvC(PDB代码4LD0,12%同一性,rmsd为131个等效Cα原子)。大肠埃希氏菌RuvC是一种3层α-β夹心,其含有夹在5个α螺旋之间的5链β折叠。RuvC核酸酶具有四个催化残基(例如,嗜热栖热菌RuvC中的Asp7、Glu70、His143和Asp146),并通过双金属机制切割Holliday连接(或结构类似的十字形连接)。Cas9 RuvC结构域的Asp10(Ala)、Glu762、His983和Asp986位于与嗜热栖热菌RuvC的催化残基相似的位置。TnpB多肽的RuvC样结构域可包含1、2、3或4个催化残基。
在实施方案中,TnpB多肽是核酸酶。在一个实施方案中,TnpB和核酸组分可以引导序列特异性核酸酶活性。切割可导致5'突出端。切割可能发生在靶相邻基序(TAM)的远端,也可能发生在间隔子(指导物)退火位点的位点或靶序列的3'。在一个方面,TnpB在核酸组分退火位点之内和之外的多个位置处切割。在一个方面,DNA切割发生在TAM远端的15、16、17、18、19、20、21、22、23、24、25或更多个碱基对处并且导致5'突出端。
在实施方案中,TnpB多肽在约37℃至约80℃的温度范围内具有活性,即具有核酸酶活性。在实施方案中,TnpB多肽在约37℃至约75℃、约37℃至约70℃、约37℃至约65℃、约37℃至约60℃、约37℃至约55℃、约37℃至约50℃、约37℃至约45℃的温度下具有活性。在示例性实施方案中,TnpB多肽在37℃至65℃的范围内具有活性。在示例性实施方案中,TnpB多肽在45℃至65℃的范围内具有活性。在示例性实施方案中,TnpB多肽在45℃至60℃的范围内具有活性。在另一个示例性实施方案中,TnpB多肽是选自以下的TnpB多肽:解纤维素马杜拉放线菌菌株DSM 45823、纳米比亚马杜拉放线菌菌株DSM 44197、裂叶游动放线菌菌株DSM 43150(TnpB-1和TnpB-2)、嗜盐张利平氏菌菌株DSM 102030、消旋纤线杆菌和ε变形菌纲细菌QNF01000004_提取物_(反向)。在另一个示例性实施方案中,TnpB多肽来自大孢束脂环酸芽孢杆菌菌株DSM 17980。在示例性实施方案中,大孢束脂环酸芽孢杆菌菌株DSM17980TnpB蛋白在45℃至60℃的范围内最具活性(图22)。
在一个实施方案中,TnpB多肽表现出旁切活性,也称为反式切割,其中在活化并切割其同源靶标后,发生非同源核酸的非特异性切割。在一个方面,一旦被靶标识别触发,TnpB多肽就具有旁切活性。在一个方面,在与靶序列结合后,TnpB多肽将非特异性地切割多核苷酸序列,例如DNA。TnpB的靶标活化的非特异性核酸酶活性在本文中也称为旁切活性。
在实施方案中,TnpB蛋白对ssDNA和dsDNA靶序列均表现出核酸酶活性。在实施方案中,TnpB蛋白对ssDNA和dsDNA表现出核酸酶活性,其中TAM可能不是切割ssDNA靶标所必需的(图23)。
在实施方案中,TnpB多肽是核酸酶。在一个实施方案中,TnpB和核酸组分分子可以引导序列特异性核酸酶活性。本文提供的TnpB多肽还可表现出RNA指导的重组酶活性。与RuvC结构域的同源性以及与DDE重组酶家族的相关性表明了潜在的重组酶活性。在实施方案中,本文详述的一些TnpB多肽可天然地表现出或经工程化以表现出缺乏核酸酶活性或降低的核酸酶活性,并且具有如本文所详述的功能结构域,例如,核苷酸脱氨酶、逆转录酶、转座元件,例如转座酶、整合酶、重组酶,从而允许RNA指导的靶标特异性修饰。
示例性TnpB多肽
在某些示例性实施方案中,TnpB蛋白可包含表1A、表1B或表1C中列出的序列。在表1A中,提供了解纤维素马杜拉放线菌、裂叶游动放线菌TnpB-1、白色嗜盐放线孢菌(H.alba)、纳米比亚马杜拉放线菌、赭褐马杜拉放线菌(A.umbrina)和ε变形菌纲细菌10_QNFX01000004提取物反向的天然TnpB氨基酸序列,其全部以缬氨酸(GTG)开始(+1位),但如本领域众所周知的,由于起始子tRNA的特殊性质,被翻译为甲硫氨酸。
表1A.示例性TnpB序列
表1B.对应于SEQ ID NO:38–64,263的TnpB多肽
表1B示例性TnpB序列
表1C.示例性TnpB多核苷酸和直接重复序列
TnpB多肽可以包含一种或多种修饰。如本文所用,关于TnpB多肽的术语“修饰的”通常是指与衍生TnpB多肽的野生型对应物相比,所述TnpB多肽具有一种或多种修饰或突变(包括点突变、截短、插入、缺失、嵌合体、融合蛋白等)。衍生的意指衍生的酶在与野生型酶具有高度序列或结构同源性的意义上很大程度上基于野生型酶,但是它已经以本领域已知或如本文所述的某种方式突变(修饰)。
修饰的蛋白质(例如修饰的TnpB多肽)可以是催化失活的(也称为死亡的)。如本文所用,与野生型对应核酸酶相比,催化失活或死亡的核酸酶可具有降低的核酸酶活性或无核酸酶活性。在一些情况下,催化失活或死亡的核酸酶可具有切口酶活性。在一些情况下,催化失活或死亡的核酸酶可不具有切口酶活性。此种催化失活或死亡的核酸酶可不在靶多核苷酸上产生双链或单链断裂,但仍可与靶多核苷酸结合或以其他方式与靶多核苷酸形成复合物。
在实施方案中,细菌TnpB的真核同源物可用于本发明。这些TnpB样蛋白Fanzor 1和Fanzor 2虽然在其C末端半区具有共享的氨基酸基序,但在其N末端区域是可变的。参见Bao等人,Homologues of bacterial TnpB_IS605 are widespread in diverseeukaryotic transposable elements.Mobile DNA 4,12(2013).Doi:10.1186/1759-8753-4-12。在一个方面,TnpB与fanzor之间的保守序列包含D-X(125,275)-[TS]-[TS]-X-X-[C4锌指]-X(5,50)-RD。Fanzor蛋白除了其N末端区域与TnpB不同外,还具有更高的多样性,其中Fanzor蛋白与不同的转座子和组成相关。随着申请人发现用于重新编程TnpB多肽活性的核酸组分和机制,Fanzor系统的相似性可允许相似的用途和应用。
在一个实施方案中,TnpB多肽的修饰可能会或可能不会引起改变的功能性。举例来说,不导致改变的功能性的修饰包括例如密码子优化以表达到特定宿主中,或为核酸酶提供特定标志物(例如,用于可视化)。可导致改变的功能性的修饰还可包括突变,包括点突变、插入、缺失、截短(包括分裂核酸酶)等,以及嵌合核酸酶(例如,包含来自不同直系同源物或同源物的结构域)或融合蛋白。融合蛋白可不受限制地包括例如与异源结构域或功能结构域(例如,定位信号、催化结构域等)的融合物。在一个实施方案中,可组合各种不同的修饰(例如,突变的核酸酶,其是催化失活的并且进一步与功能结构域融合,诸如例如以诱导DNA甲基化或另一种核酸修饰,诸如包括但不限于断裂(例如,通过不同的核酸酶(结构域))、突变、缺失、插入、替换、连接、消化、断裂或重组)。如本文所用,“改变的功能性”包括但不限于改变的特异性(例如,改变的靶标识别、增加的(例如,“增强的”TnpB多肽)或降低的特异性、或改变的TAM识别)、改变的活性(例如,增加的或降低的催化活性,包括催化失活的核酸酶或切口酶)和/或改变的稳定性(例如,与去稳定结构域的融合物)。所有这些修饰的实例是本领域已知的。应当理解,本文提及的“修饰的”核酸酶,特别是“修饰的”TnpB多肽或系统或复合物优选仍然具有与多核酸相互作用或结合的能力(例如,与核酸组分分子形成复合物)。此类修饰的TnpB多肽可以与如本文所述的脱氨酶蛋白或其活性结构域组合。
在一个实施方案中,未修饰的TnpB多肽可具有切割活性。在一个实施方案中,TnpB多肽可在靶序列的位置处或附近,诸如在靶序列内和/或在靶序列的互补序列内或在与靶序列缔合的序列处引导一条或两条核酸(DNA或RNA)链的切割。在一个实施方案中,TnpB多肽可引导距离靶序列的第一个或最后一个核苷酸约1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500个或更多个碱基对或核苷酸内的一条或两条DNA或RNA链的切割。在一个实施方案中,切割可以是交错的,即产生粘性末端。在一个实施方案中,切割是具有5'突出端的交错切割。在一个实施方案中,切割是具有1至5个核苷酸、优选4或5个核苷酸的5'突出端的交错切割。在特定的实施方案中,TnpB多肽切割DNA链。
在一个实施方案中,TnpB多肽可相对于对应的野生型酶是突变的,使得突变的TnpB缺乏切割含有靶序列的靶多核苷酸的一条或两条链的能力。作为另一个实例,TnpB多肽(例如,RuvC)的两个或更多个催化结构域可以是突变的以产生基本上缺乏所有DNA切割活性的突变TnpB多肽。在一个实施方案中,当突变的酶的多核苷酸切割活性为非突变形式的酶的核酸切割活性的不超过25%、不超过10%、不超过5%、不超过1%、不超过0.1%、不超过0.01%时,TnpB多肽可被认为基本上缺乏所有的多核苷酸切割活性;一个实例可以是,与非突变形式相比,突变形式的核酸切割活性为零或可忽略不计。
在一个实施方案中,TnpB多肽可包含导致活性和/或特异性增强的一种或多种修饰,诸如包括使稳定靶向链或非靶向链的残基突变。在一个实施方案中,经工程化TnpB多肽的改变或修饰的活性包括增加的靶向效率或降低的脱靶结合。在一个实施方案中,经工程化TnpB多肽的改变的活性包括改变的切割活性。在一个实施方案中,改变的活性包括对靶多核苷酸基因座的增加的切割活性。在一个实施方案中,改变的活性包括对靶多核苷酸基因座的降低的切割活性。在一个实施方案中,改变的活性包括对脱靶多核苷酸基因座的降低的切割活性。在一个实施方案中,修饰的核酸酶包含改变蛋白质与包含RNA、或靶多核苷酸基因座链、或脱靶多核苷酸基因座链的核酸分子的缔合的修饰。在本发明的一个方面,经工程化TnpB多肽包含改变TnpB多肽和相关复合物的形成的修饰。在一个实施方案中,改变的活性包括对脱靶多核苷酸基因座的增加的切割活性。因此,在一个实施方案中,与脱靶多核苷酸基因座相比,对靶多核苷酸基因座的特异性增加。在其他实施方案中,与脱靶多核苷酸基因座相比,对靶多核苷酸基因座的特异性降低。在一个实施方案中,突变导致降低的脱靶效应(例如,切割或结合性质、活性或动力学),诸如在TnpB多肽的情况下,例如导致对靶标与ωRNA之间的错配的较低耐受性。其他突变可导致增加的脱靶效应(例如,切割或结合性质、活性或动力学)。其他突变可导致增加的或降低的中靶效应(例如,切割或结合性质、活性或动力学)。在一个实施方案中,突变导致功能性核酸酶复合物的改变(例如,增加或降低)的活性、缔合或形成。示例性突变包括将带负电或中性残基突变为带正电残基,或将带正电残基突变为中性,或将中性残基突变为带负电残基和/或(进化)保守残基,诸如保守的带正电残基,以便增强特异性。参见,例如,Zhou等人,Chem Rev.2018年2月28日:118(4):1691-1741,doi:10.1021/acs/chemrev.7b00305(讨论蛋白质结合中的静电相互作用以及氨基酸突变对此类静电相互作用的影响)。在一个实施方案中,此类残基可突变为不带电荷的残基,诸如丙氨酸。因为TnpB多肽在TnpB多肽的长度上与指导或结合的DNA相互作用,所以可以利用整个TnpB多肽上的残基的突变来改变活性。在一个方面,用于突变的TnpB多肽残基基于抗辐射异常球菌ISDra2的氨基酸序列位置而改变,参见例如Karvelis等人,Nature 599,692-696(2021)。ISDra2氨基酸可包含序列:
在实施方案中,一个或多个残基经突变以改变TnpB多肽的TAM特异性。在一个方面,一个或多个突变对应于基于ISDra2的氨基酸序列位置的52TYR、53GLY、56SER、57SER、60THR、72SER、75ASP、76LYS、77PHE、80GLN、84LYS、119ARG、121GLN、122PHE、123THR、124ASN、125ASN、126ASN、137PRO、138LYS、153LYS、155LEU和172LEU中的一个或多个。
在一个实施方案中,一个或多个残基经突变以改变TnpB的特异性和/或活性,所述突变选自基于ISDra2的氨基酸序列位置的6ALA、7PHE、8VAL、9VAL、10ARG、11LEU、12TYR、35PHE、36LEU、39ARG、40ILE、42ALA、43TYR、46SER、47GLY、48LYS、49GLY、50LEU、51THR、52TYR、95ARG、96THR、97VAL、98LYS、99GLN、100SER、101GLY、102LYS、103LYS、104VAL、105GLY、106PHE、107PRO、108ARG、109PHE、110ARG、111LYS、112LYS、113ARG、114THR、115GLY、116GLU、117SER、118TYR、119ARG、120THR、121GLN、154ILE、155LEU、156ASN、157VAL、158THR、159VAL、160ARG、161ARG、162ILE、163HIS、164GLU、165GLY、166HIS、167TYR、168GLU、169ALA、170SER、171VAL、172LEU、173CYS、174GLU、215TYR、216ARG、217SER、218THR、219LEU、220LYS、221ARG、222LEU、223ARG、224LYS、225ALA、226GLN、227GLN、228THR、229LEU、230SER、231ARG、232ARG、233LYS、234LYS、235GLY、236SER、237ALA、238ARG、239YR、240GLY、241LYS、242ALA、243LYS、244THR、245LYS、246LEU、247ALA、248ARG、249ILE、250HIS、251LYS、252ARG、253ILE、254VAL、283ASP、284ASN、285MET、286ARG、287LYS、288ASN、289ARG、290ARG、291LEU、292ALA、293LEU、294SER、295ILE、296SER和297ASP中的一个或多个。
不受特定科学理论的束缚,据信V型CRISPR-Cas系统从TnpB系统进化而来。已知V型系统具有针对单链DNA的体外旁切活性,参见例如Chen等人,Science.2018年4月27日;360(6387):436-439。
专业TnpB系统
在一个实施方案中,系统是能够执行专门的功能或活性的基于TnpB的系统。例如,TnpB蛋白可与一个或多个异源功能结构域融合、可操作地偶联或以其他方式缔合。在某些示例性实施方案中,TnpB蛋白可以是催化死亡的TnpB蛋白且/或具有切口酶活性。切口酶是一种仅切割双链靶标的一条链的TnpB蛋白。在此类实施方案中,催化失活的TnpB或切口酶经由将功能结构域递送至靶序列或邻近靶序列的ωRNA来提供序列特异性靶向功能性。
还设想了TnpB复合物作为整体可与两个或更多个功能结构域缔合。例如,可以存在两个或更多个与TnpB多肽缔合的功能结构域,或者可以存在两个或更多个与核酸组分缔合(经由一种或多种衔接蛋白或适体)的功能结构域,或者可以存在一个或多个与TnpB多肽缔合的功能结构域以及一个或多个与核酸组分缔合的功能结构域。
在一个实施方案中,一个或多个功能结构域经由衔接蛋白与TnpB多肽缔合,例如与Konnerman等人(Nature 517,583–588,2015年1月29日)的修饰的指导物一起使用。在一个实施方案中,一个或多个功能结构域附接至衔接蛋白,使得在TnpB多肽与RNA分子和靶标结合后,功能结构域处于允许所述功能结构域发挥其归属功能的空间方向。
在一个实施方案中,一个或多个功能结构域与死亡的核酸组分缔合。在一个实施方案中,具有活性TnpB多肽的复合物通过一个基因座处的功能结构域来引导基因调控,而与核酸组分缔合的功能结构域通过另一个基因座处的活性TnpB多肽来引导DNA切割。在一个实施方案中,选择核酸组分以最大程度地增加与脱靶调控相比对感兴趣的基因座的调控的选择性。在一个实施方案中,选择核酸组分以最大程度地增加靶基因调控并且最大程度地减少靶切割。可以通过插入不同的环或不同的序列来延伸核酸组分的环,而不与TnpB多肽碰撞,所述不同的环或不同的序列可募集可以结合所述不同的环或不同的序列的衔接蛋白。衔接蛋白可包括但不限于存在于噬菌体外壳蛋白多样性中的正交多核苷酸结合蛋白/适体组合。此类外壳蛋白的列表包括但不限于:Qβ、F2、GA、fr、JP501、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、φCb5、φCb8r、φCb12r、φCb23r、7s和PRR1。这些衔接蛋白或正交RNA结合蛋白可以进一步募集包含一个或多个功能结构域的效应蛋白或融合物。
可与TnpB蛋白融合、可操作地偶联或以其他方式缔合的示例性功能结构域可以是或包括但不限于核定位信号(NLS)结构域、核输出信号(NES)结构域、翻译活化结构域、转录活化结构域(例如VP64、p65、MyoD1、HSF1、RTA和SET7/9)、翻译起始结构域、转录阻遏结构域(例如,KRAB结构域、NuE结构域、NcoR结构域和SID结构域,诸如SID4X结构域)、核酸酶结构域(例如,FokI)、组蛋白修饰结构域(例如,组蛋白乙酰转移酶)、光诱导型/可控结构域、化学诱导型/可控结构域、转座酶结构域、同源重组机器结构域、重组酶结构域、连接酶结构域、拓扑异构酶结构域、整合酶结构域及其组合。在实施方案中,功能结构域是HNH结构域,并且可以与天然催化失活的TnpB蛋白一起使用来将切口酶工程化。用于产生催化死亡的TnpB或切口酶TnpB的方法可以根据Cas9蛋白中的方法进行调整,参见例如WO 2014/204725、Ran等人Cell.2013年9月12日;154(6):1380-1389,其是本领域已知的并且通过引用并入本文。简而言之,可以在TnpB蛋白的RuvC结构域和/或HNH结构域的催化结构域中引入一个或多个可降低或消除NHEJ活性的突变。在一个方面,提供了RuvC结构域中的至少一个突变和HNH结构域中的至少一个突变。在实施方案中,TnpB多肽包含基于抗辐射异常球菌ISDra2的氨基酸序列位置的D191和/或E278处的突变。在一个方面,氨基酸突变包含基于抗辐射异常球菌ISDra2的氨基酸序列位置的D191A和/或E278A。
在一个实施方案中,功能结构域可以具有以下活性中的一种或多种:核碱基脱氨酶活性、逆转录酶活性、逆转录转座酶活性、转座酶活性、整合酶活性、重组酶活性、拓扑异构酶活性、连接酶活性、聚合酶活性、解旋酶活性、甲基化酶活性、去甲基化酶活性、翻译活化活性、翻译起始活性、翻译阻遏活性、转录活化活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、核酸酶活性(例如,VirD2)、单链RNA切割活性、双链RNA切割活性、单链DNA切割活性、双链DNA切割活性、分子开关活性、化学可诱导性、光可诱导性和核酸结合活性。在一个实施方案中,一个或多个功能结构域可包含表位标签或报告分子。表位标签的非限制性实例包括组氨酸(His)标签、V5标签、FLAG标签、流感血凝素(HA)标签、Myc标签、VSV-G标签和硫氧还蛋白(Trx)标签。报告分子的实例包括但不限于谷胱甘肽-S-转移酶(GST)、辣根过氧化物酶(HRP)、氯霉素乙酰转移酶(CAT)β-半乳糖苷酶、β-葡萄糖醛酸酶、荧光素酶、绿色荧光蛋白(GFP)、HcRed、DsRed、青色荧光蛋白(CFP)、黄色荧光蛋白(YFP)和自发荧光蛋白,包括蓝色荧光蛋白(BFP)。
一个或多个功能结构域可以定位在效应蛋白(例如,TnpB蛋白)的末端处、附近和/或与之邻近。在具有两个或更多个功能结构域的实施方案中,两个功能结构域中的每一个可定位在效应蛋白(例如,TnpB蛋白)的末端处或附近或与之邻近。在一个实施方案中,诸如其中功能结构域可操作地偶联至效应蛋白的那些实施方案,一个或多个功能结构域可以经由合适的接头(包括但不限于GlySer接头)来拴系或连接至效应蛋白(例如,TnpB蛋白)。当存在多于一个功能结构域时,功能结构域可以相同或不同。在一个实施方案中,所有功能结构域都是相同的。在一个实施方案中,所有功能结构域都彼此不同。在一个实施方案中,功能结构域中的至少两个彼此不同。在一个实施方案中,功能结构域中的至少两个彼此相同。
在一个实施方案中,组蛋白修饰结构域也是优选的。下文讨论了示例性组蛋白修饰结构域。转座酶结构域、HR(同源重组)机器结构域、重组酶结构域和/或整合酶结构域也优选作为本发明的功能结构域。在一个实施方案中,DNA整合活性包括HR机器结构域、整合酶结构域、重组酶结构域和/或转座酶结构域。
在一个实施方案中,DNA切割活性是由于核酸酶。在一个实施方案中,核酸酶包括Fok1核酸酶。参见“Dimeric CRISPR RNA-guided FokI nucleases for highly specificgenome editing”,Shengdar Q.Tsai,Nicolas Wyvekens,Cyd Khayter,JenniferA.Foden,Vishal Thapar,Deepak Reyon,Mathew J.Goodwin,Martin J.Aryee,J.KeithJoung Nature Biotechnology 32(6):569-77(2014),涉及二聚体RNA指导的FokI核酸酶,其识别延伸序列并可以在人类细胞中高效编辑内源基因。
功能结构域可用于调控转录,例如转录阻遏。转录阻遏通常由染色质修饰酶(诸如组蛋白甲基转移酶(HMT)和脱乙酰酶(HDAC))介导。阻遏性组蛋白效应结构域是已知的,并且下面提供了示例性列表。优选促进有效病毒包装(例如经由AAV)的小尺寸蛋白质和功能性截短。然而,一般来讲,所述结构域可包括HDAC、组蛋白甲基转移酶(HMT)和组蛋白乙酰转移酶(HAT)抑制剂,以及HDAC和HMT募集蛋白。在一个实施方案中,功能结构域可以是或包括HDAC效应结构域、HDAC募集效应结构域、组蛋白甲基转移酶(HMT)效应结构域、组蛋白甲基转移酶(HMT)募集效应结构域、或组蛋白乙酰转移酶抑制剂效应结构域。
在一个实施方案中,功能结构域可以是甲基转移酶(HMT)效应结构域。优选的实例包括NUE、vSET、EHMT2/G9A、SUV39H1、dim-5、KYP、SUVR4、SET4、SET1、SETD8和TgSET8。NUE在本发明的实施例中举例说明,尽管是优选的,但是设想所述类别中的其他实例也将是有用的。
在一个实施方案中,功能结构域可以是组蛋白甲基转移酶(HMT)募集效应结构域。优选的实例包括Hp1a、PHF19和NIPP1。
在一个实施方案中,功能结构域可以是组蛋白乙酰转移酶抑制剂效应结构域。优选的实例包括SET/TAF-1β。
在一些情况下,除了启动子或启动子近端元件之外,靶向内源(调控)控制元件(诸如增强子和沉默子)。因此,除了靶向启动子之外,本发明还可以用于靶向内源控制元件(包括增强子和沉默子)。这些控制元件可以位于转录起始位点(TSS)的上游和下游,从距离TSS200bp至100kb远。靶向已知控制元件可以用于活化或阻遏感兴趣的基因。在一些情况下,单个控制元件可以影响多个靶基因的转录。因此,靶向单个控制元件可以用于同时控制多个基因的转录。
在另一个方面,靶向推定控制元件(例如,通过平铺推定控制元件的区域以及元件周围的200bp至100kB)可以用作验证此类元件(通过测量感兴趣的基因的转录)或检测新的控制元件(例如,通过平铺感兴趣的基因的TSS上游和下游100kb)的方式。此外,靶向推定控制元件在了解疾病的遗传原因的背景下可以是有用的。与疾病表型相关的许多突变和常见SNP变异体位于编码区之外。用本文所述的活化或阻遏系统靶向此类区域后可以读出以下的转录:a)一组推定的靶标(例如,位于最紧密接近控制元件的一组基因)或b)通过例如RNAseq或微阵列进行的全转录组读出。这将允许鉴定涉及疾病表型的可能的候选基因。此类候选基因可以用作新型药物靶标。
在一个实施方案中,一个或多个功能结构域包含乙酰转移酶,优选组蛋白乙酰转移酶。这些在表观基因组学领域中,例如在询问表观基因组的方法中是有用的。询问表观基因组的方法可包括例如靶向表观基因组序列。靶向表观基因组序列可包括针对表观基因组靶序列的ωRNA。在一个实施方案中,表观基因组靶序列可包括启动子、沉默子或增强子序列。
功能结构域可以是乙酰转移酶结构域。乙酰转移酶的实例是已知的,但在一个实施方案中可包括组蛋白乙酰转移酶。在一个实施方案中,组蛋白乙酰转移酶可包含人乙酰转移酶p300的催化核心(Gerbasch&Reddy,Nature Biotech 2015年4月6日)。
核定位序列
在一个实施方案中,TnpB多肽与一个或多个核定位序列(NLS)融合,诸如约或多于约1、2、3、4、5、6、7、8、9、10或更多个NLS。在一个实施方案中,TnpB多肽在氨基末端处或附近包含约或多于约1、2、3、4、5、6、7、8、9、10或更多个NLS,在羧基末端处或附近包含约或多于约1、2、3、4、5、6、7、8、9、10或更多个NLS,或这些的组合(例如,氨基末端处的零个或至少一个或多个NLS以及羧基末端处的零个或至少一个或多个NLS)。当存在多于一个NLS时,每一个可独立于其他而选择,使得单个NLS可以多于一个拷贝存在且/或与以一个或多个拷贝存在的一个或多个其他NLS组合。在本发明的优选实施方案中,TnpB多肽包含至多6个NLS。在一个实施方案中,当NLS的最近的氨基酸是在从N末端或C末端沿着多肽链的约1、2、3、4、5、10、15、20、25、30、40、50个或更多个氨基酸以内时,NLS被认为接近N末端或C末端。NLS的非限制性实例包括衍生自以下的NLS序列:SV40病毒大T抗原的NLS,其具有氨基酸序列PKKKRKV(SEQ ID NO:64,264);核质蛋白的NLS(例如,双分型核质蛋白NLS,其具有序列KRPAATKKAGQAKKKK(SEQ ID NO:64,265);c-myc NLS,其具有氨基酸序列PAAKRVKLD(SEQ IDNO:64,266)或RQRRNELKRSP(SEQ ID NO:64,267);hRNPA1 M9 NLS,其具有序列NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(SEQ ID NO:64,268);输入蛋白-α的IBB结构域的序列RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(SEQ ID NO:64,269);肌瘤T蛋白的序列VSRKRPRP(SEQ ID NO:64,270)和PPKKARED(SEQ ID NO:64,271);人p53的序列PQPKKKPL(SEQ ID NO:64,272);小鼠c-abl IV的序列SALIKKKKKMAP(SEQ ID NO:64,273);流感病毒NS1的序列DRLRR(SEQ ID NO:64,274)和PKQKKRK(SEQ ID NO:64,275);丁型肝炎病毒抗原的序列RKLKKKIKKL(SEQ ID NO:64,276);小鼠Mx1蛋白的序列REKKKFLKRR(SEQ ID NO:64,277);人聚(ADP-核糖)聚合酶的序列KRKGDEVDGVDEVAKKKSKK(SEQ ID NO:64,278);以及类固醇激素受体(人)糖皮质激素的序列RKCLQAGMNLEARKTKK(SEQ ID NO:64,279)。一般来讲,一个或多个NLS的强度足以驱动TnpB多肽在真核细胞的细胞核中以可检测的量积累。一般来讲,核定位活性的强度可来源于TnpB多肽中的NLS的数量、所使用的特定NLS、或这些因素的组合。可通过任何合适的技术来检测细胞核中的积累。例如,可检测标志物可以与TnpB多肽融合,使得可以将细胞内的位置可视化,诸如与用于检测细胞核位置的方式组合(例如,对细胞核具有特异性的染色剂,诸如DAPI)。还可从细胞中分离细胞核,然后可通过任何合适的用于检测蛋白质的方法(诸如免疫组织化学、蛋白质印迹或酶活性测定)来分析细胞核的内容物。还可以间接确定细胞核中的积累,诸如通过与未暴露于TnpB多肽或复合物、或暴露于缺乏一个或多个NLS的TnpB多肽的对照相比,测定复合物形成的效果(例如,测定靶序列处的DNA切割或突变,或测定受复合物形成和/或TnpB多肽活性影响的改变的基因表达活性)。在本文所述的TnpB多肽蛋白复合物和系统的一个实施方案中,密码子优化的TnpB多肽蛋白包含附接至蛋白质的C末端的NLS。在一个实施方案中,其他定位标签可与TnpB多肽融合,诸如但不限于将TnpB多肽定位于细胞中的特定位点,诸如细胞器,诸如线粒体、质体、叶绿体、囊泡、高尔基体(核或细胞)膜、核糖体、核仁、ER、细胞骨架、液泡、中心体、核小体、颗粒、中心粒等。
在本发明的一个实施方案中,至少一个核定位信号(NLS)附接至编码TnpB多肽的核酸序列。在优选的实施方案中,附接至少一个或多个C末端或N末端NLS(因此编码TnpB多肽的核酸分子可以包括编码NLS,使得表达的产物具有附接或连接的NLS)。在优选的实施方案中,附接C末端NLS以在真核细胞、优选人细胞中实现最佳表达和核靶向。本发明还涵盖用于递送多种核酸组分的方法,其中每种核酸组分对不同的感兴趣的靶基因座具有特异性,从而修饰多个感兴趣的靶基因座。复合物的核酸组分可包含一种或多种蛋白质结合RNA适体。一种或多种适体可能能够结合噬菌体外壳蛋白。
接头
在一些优选的实施方案中,功能结构域连接至TnpB多肽(例如,活性或死亡的TnpB多肽)以靶向并活化表观基因组序列,诸如启动子或增强子。还可提供针对此类启动子或增强子的一种或多种ωRNA以引导TnpB多肽与此类启动子或增强子的结合。
本文使用的术语“与...缔合”涉及功能结构域与TnpB多肽蛋白或衔接蛋白的缔合。它是在一个分子如何相对于另一个分子“缔合”方面使用,例如在衔接蛋白与功能结构域之间,或在TnpB多肽蛋白与功能结构域之间。在此类蛋白质-蛋白质相互作用的情况下,此种缔合可以从抗体识别表位的识别方式来看待。或者,一种蛋白质可以经由两者的融合而与另一种蛋白质缔合,例如一个亚基与另一个亚基融合。融合通常通过将一种蛋白质的氨基酸序列添加到另一种蛋白质的氨基酸序列来发生,例如经由将编码每种蛋白质或亚基的核苷酸序列剪接在一起。或者,这本质上可以视为两个分子之间的结合或直接连接,诸如融合蛋白。在任何情况下,融合蛋白可包括两个感兴趣的亚基之间(即,酶与功能结构域之间或衔接蛋白与功能结构域之间)的接头。因此,在一个实施方案中,TnpB多肽蛋白或衔接蛋白通过与功能结构域结合而与功能结构域缔合。在其他实施方案中,TnpB多肽或衔接蛋白与功能结构域缔合,因为两者任选地经由中间接头融合在一起。
在提及融合蛋白时使用的术语“接头”是指接合蛋白质以形成融合蛋白的分子。一般来讲,此类分子除了接合蛋白质或保持蛋白质之间的一些最小距离或其他空间关系之外,不具有特定的生物活性。然而,在一个实施方案中,可选择接头以影响接头和/或融合蛋白的一些性质,诸如接头的折叠、净电荷或疏水性。
用于本发明的方法的合适的接头是本领域技术人员众所周知的,并且包括但不限于直链或支链碳接头、杂环碳接头或肽接头。然而,如本文所用,接头还可以是共价键(碳-碳键或碳-杂原子键)。在特定的实施方案中,接头用于将TnpB多肽与核苷酸脱氨酶分开一段距离,所述距离足以确保每种蛋白质保留其所需的功能性质。优选的肽接头序列采用柔性延伸构象并且不表现出形成有序二级结构的倾向。在一个实施方案中,接头可以是化学部分,其可以是单体、二聚体、多聚体或聚合物。优选地,接头包含氨基酸。柔性接头中的典型氨基酸包括Gly、Asn和Ser。因此,在特定的实施方案中,接头包含Gly、Asn和Ser氨基酸中的一种或多种的组合。其他近中性氨基酸,诸如Thr和Ala,也可用于接头序列中。示例性接头公开于Maratea等人(1985),Gene 40:39-46;Murphy等人(1986)Proc.Nat'l.Acad.Sci.USA 83:8258-62;美国专利号4,935,233;和美国专利号4,751,180。例如,可以使用GlySer接头GGS、GGGS(SEQ ID NO:64,280)或GSG。GGS、GSG、GGGS(SEQ ID NO:64,280)或GGGGS(SEQ ID NO:64,281)接头可以以3个(诸如(GGS)3(SEQ ID NO:64,282)、(GGGGS)3(SEQ ID NO:64,283))或5个、6个、7个、9个或甚至12个或更多个重复使用,以提供合适的长度。在一些情况下,接头可以是(GGGGS)3-15(SEQ ID NO:64,283-64,295)。例如,在一些情况下,接头可以是(GGGGS)3-11(SEQ ID NO:64,283-64,291),例如GGGGS(SEQ ID NO:64,281)、(GGGGS)2(SEQ ID NO:64,296)、(GGGGS)3(SEQ ID NO:64,283)、(GGGGS)4(SEQ ID NO:64,284)、(GGGGS)5(SEQ ID NO:64,285)、(GGGGS)6(SEQ ID NO:64,286)、(GGGGS)7(SEQ ID NO:64,287)、(GGGGS)8(SEQ ID NO:64,288)、(GGGGS)9(SEQ ID NO:64,289)、(GGGGS)10(SEQ IDNO:64,290)或(GGGGS)11(SEQ ID NO:64,291)。
在特定的实施方案中,本文优选使用接头,诸如(GGGGS)3(SEQ ID NO:64,283)。(GGGGS)6(SEQ ID NO:64,286)、(GGGGS)9(SEQ ID NO:64,289)或(GGGGS)12(SEQ ID NO:64,292)可优选用作替代方案。其他优选的替代方案是(GGGGS)1(SEQ ID NO:64,281)、(GGGGS)2(SEQ ID NO:64,296)、(GGGGS)4(SEQ ID NO:64,284)、(GGGGS)5(SEQ ID NO:64,285)、(GGGGS)7(SEQ ID NO:64,287)、(GGGGS)8(SEQ ID NO:64,288)、(GGGGS)10(SEQ ID NO:64,290)或(GGGGS)11(SEQ ID NO:64,291)。在又另一个实施方案中,LEPGEKPYKCPECGKSFSQSGALTRHQRTHTR(SEQ ID NO:64,297)用作接头。在又另一个实施方案中,接头是XTEN接头。在特定的实施方案中,TnpB多肽通过LEPGEKPYKCPECGKSFSQSGALTRHQRTHTR(SEQ ID NO:64,297)接头连接至脱氨酶蛋白或其催化结构域。在其他特定的实施方案中,TnpB多肽的C末端通过LEPGEKPYKCPECGKSFSQSGALTRHQRTHTR(SEQ ID NO:64,297)接头连接至脱氨酶蛋白或其催化结构域的N末端。此外,N末端和C末端NLS还可以充当接头(例如,PKKKRKVEASSPKKRKVEAS(SEQ ID NO:64,298))。
接头的实例在下表2中示出。
表2.
接头可用在ωRNA分子与功能结构域(活化子或阻遏子)之间,或者在TnpB多肽与功能结构域之间。接头可用于将适当量的“机械柔性”工程化。
在一个实施方案中,一个或多个功能结构域是可控的,例如可诱导的。
其他合适的功能结构域可见于例如国际申请公开号WO2019/018423,例如在[0678]-[0692]处,所述申请通过引用并入本文。示例性功能结构域在本文别处进一步详述。
ωRNA分子
本文中的TnpB系统还可包含一种或多种核酸组分,其在本文中也称为omega RNA(ωRNA)。这样的核酸组分可包含RNA、DNA或其组合,并且包括如下文进一步描述的修饰的和非规范的核苷酸。ωRNA可以包含可重新编程的间隔序列以及与TnpB多肽相互作用的支架。ωRNA可以与TnpB多肽形成复合物(Ω复合物),并且引导复合物与靶多核苷酸的靶序列的序列特异性结合。在一个示例性实施方案中,ωRNA是包含支架序列和间隔序列的单分子。在某些示例性实施方案中,间隔子在支架序列的5'。在一个示例性实施方案中,ωRNA还可包含支架与间隔部分之间的保守核酸序列。
在实施方案中,ωRNA包含间隔序列和支架序列,例如保守核苷酸序列。在实施方案中,ωRNA包含约45至约250个核苷酸,或约45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、17、138、19、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、11、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、2340、241、242、243、244、245、246、247、248、249或250个核苷酸。
在实施方案中,ωRNA包含支架序列,例如保守核苷酸序列。因此,支架序列通常包含保守区域,其中支架包含约30至200个核苷酸、约50至180个、约80至175个核苷酸、或约30、31、32、33、34、35、36、37、38、39 40、41、42、43、44、45、46、4748、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180或更多nt。在一个方面,核酸组分支架包含一个保守核苷酸序列。在实施方案中,保守核苷酸序列位于支架的5'端上或附近。
ωRNA还可包含间隔子,其可以被重新编程以引导与靶多核苷酸的靶序列的位点特异性结合。间隔子在本文中也可以称为ωRNA支架或ωRNA的一部分,并且可包含经工程化异源序列。在实施方案中,支架可包含表5的序列。在实施方案中,支架包含表5中的和图2中描绘的RNA保守区的一个或多个保守序列。在一个实施方案中,ωRNA的二级结构包含图18D所示的多发夹区域。在一个方面,RNA物种包含RNA保守区+指导序列,其与CRISPR-Cas系统的DR+间隔子构型不同但通常与其相关。
在一个实施方案中,ωRNA的间隔子长度为10至50nt。在一个实施方案中,ωRNA的间隔子长度为至少10、11、12、13、14或15个核苷酸。在一个实施方案中,间隔子长度为10至40个核苷酸、15至30nt、15至17nt,例如15、16、或17nt、17至20nt,例如17、18、19、或20nt、20至24nt,例如20、21、22、23、或24nt、23至25nt,例如23、24、或25nt、24至27nt,例如24、25、26、或27nt、27至30nt,例如27、28、29、或30nt、30至35nt,例如30、31、32、33、34、或35nt、或35nt或更长。在示例性实施方案中,间隔序列为14、15、16、17,18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39 40、41、42、43、44、45、46、47、48、49或50nt。
在一个实施方案中,选择ωRNA的序列以降低ωRNA内的二级结构程度。在一个实施方案中,当最佳折叠时,核酸靶向ωRNA组分的核苷酸中的约或少于约75%、50%、40%、30%、25%、20%、15%、10%、5%、1%或更少参与自互补碱基配对。最佳折叠可以通过任何合适的多核苷酸折叠算法来确定。一些程序基于计算最小吉布斯(Gibbs)自由能。一种这样的算法的实例是mFold,如由Zuker和Stiegler(Nucleic Acids Res.9(1981),133-148)所述。折叠算法的另一个实例是在线网络服务器RNAfold,它在维也纳大学理论化学研究所(Institute for Theoretical Chemistry at the University of Vienna)开发,使用质心结构预测算法(参见例如,A.R.Gruber等人,2008,Cell106(1):23-24;和PA Carr和GMChurch,2009,Nature Biotechnology27(12):1151-62)。
如本文所用,异源ωRNA是不衍生自与TnpB多肽相同的物种的ωRNA,或包含不衍生自与TnpB多肽相同的物种的分子的一部分,例如间隔子。例如,衍生自物种A的TnpB多肽的异源ωRNA包含衍生自与物种A不同的物种的多核苷酸或人工多核苷酸。
在特定的实施方案中,ωRNA包含与保守核苷酸序列连接的间隔序列,其中保守核苷酸序列可包含一个或多个茎环或优化的二级结构。在特定的实施方案中,保守核苷酸序列具有16nt的最小长度和单个茎环。在其他实施方案中,保守核苷酸序列的长度大于16nt,优选大于17nt,并且具有多于一个茎环或优化的二级结构。在特定的实施方案中,间隔序列可连接至全部或部分的天然保守核苷酸序列。在特定的实施方案中,可以例如通过添加、减去或取代特征来修改ωRNA架构的某些方面,而维持架构的某些其他方面。经工程化ωRNA修饰(包括但不限于插入、缺失和取代)的优选位置包括ωRNA的末端和当与TnpB多肽和/或靶标复合时ωRNA暴露的区域。
在一个实施方案中,ωRNA形成具有单独的非共价连接序列的茎环,所述序列可以是DNA或RNA。在特定的实施方案中,形成ωRNA的序列首先使用标准亚磷酰胺合成方案来合成(Herdewijn,P.编辑,Methods in Molecular Biology Col 288,OligonucleotideSynthesis:Methods and Applications,Humana Press,New Jersey(2012))。在一个实施方案中,可以使用本领域已知的标准方案,将这些序列官能化以含有用于连接的适当官能团(Hermanson,G.T.,Bioconjugate Techniques,Academic Press(2013))。官能团的实例包括但不限于羟基、胺、羧酸、羧酸卤化物、羧酸活性酯、醛、羰基、氯羰基、咪唑基羰基、酰肼、氨基脲、硫代氨基脲、硫醇、马来酰亚胺、卤代烷基、磺酰基、烯丙基、炔丙基、二烯、炔烃和叠氮化物。一旦此序列被官能化,就可以在此序列与保守核苷酸序列之间形成共价化学键或连接键。化学键的实例包括但不限于基于以下的那些化学键:氨基甲酸酯、醚、酯、酰胺、亚胺、脒、氨基三嗪、氢腙、二硫化物、硫醚、硫酯、硫代磷酸酯、二硫代磷酸酯、磺胺类、磺酸盐、砜类、亚砜、脲、硫脲、酰肼、肟、三唑、光不稳定键、C-C键形成基团,诸如Diels-Alder环加成对或闭环复分解对,以及迈克尔反应对。
在一个实施方案中,这些茎环形成序列可以是化学合成的。在一个实施方案中,化学合成使用利用2'-乙酰氧基乙基原酸酯(2’-ACE)(Scaringe等人,J.Am.Chem.Soc.(1998)120:11820-11821;Scaringe,Methods Enzymol.(2000)317:3-18)或2'-硫代氨基甲酸酯(2’-TC)化学(Dellinger等人,J.Am.Chem.Soc.(2011)133:11540-11546;Hendel等人,Nat.Biotechnol.(2015)33:985-989)的自动化固相寡核苷酸合成机器。
重复:反重复双链体(repeat:anti repeat duplex)将从ωRNA组分的二级结构中显而易见。它通常可以是在poly U束之后(5'至3'方向)和四环之前的第一互补段;以及在四环之后(5'至3'方向)和poly A束之前的第二互补段。第一互补段(“重复”)与第二互补段(“反重复”)互补。因此,当相互折叠时,它们发生沃森克里克(Watson-Crick)碱基配对以形成dsRNA的双链体。因此,在A-U或C-G碱基配对方面,并且在反重复由于四环而处于相反方向的事实方面,反重复序列是重复的互补序列。
在本发明的实施方案中,ωRNA组分分子架构的修饰包括替换茎环2中的碱基。例如,在一个实施方案中,茎环2中的“actt”(RNA中为“acuu”)和“aagt”(RNA中为“aagu”)碱基被替换为“cgcc”和“gcgg”。在一个实施方案中,茎环2中的“actt”和“aagt”碱基被替换为互补的具有4个核苷酸的富含GC区域。在一个实施方案中,互补的具有4个核苷酸的富含GC区域是“cgcc”和“gcgg”(都是5'至3'方向)。在一个实施方案中,互补的具有4个核苷酸的富含GC区域是“gcgg”和“cgcc”(都是5'至3'方向)。互补的具有4个核苷酸的富含GC区域中的C和G的其他组合将是显而易见的,包括CCCC和GGGG。
在一个方面,茎环2,例如“ACTTgtttAAGT(SEQ ID NO:64,304)”可以被任何“XXXXgtttYYYY(SEQ ID NO:64,305)”替换,例如,其中XXXX和YYYY代表一起将彼此碱基配对以产生茎的任何互补的核苷酸组。
如本文所用,术语“间隔子”也可称为“指导序列”。在一个实施方案中,当使用合适的比对算法进行最佳比对时,间隔序列与给定靶序列的互补程度为约或大于50%、60%、75%、80%、85%、90%、95%、97.5%、99%或更多。在某些示例性实施方案中,ωRNA分子包含间隔序列,所述间隔序列可以被设计为与靶序列具有至少一个错配,使得在序列与靶序列之间形成RNA双链体。因此,互补程度为小于99%。例如,在间隔序列由24个核苷酸组成的情况下,互补程度更特别地为约96%或更低。在特定的实施方案中,间隔序列被设计成具有一段两个或更多个相邻的错配核苷酸,使得整个序列的互补程度进一步降低。例如,在间隔序列由24个核苷酸组成的情况下,互补程度更特别地为约96%或更低、更特别地为约92%或更低、更特别地为约88%或更低、更特别地为约84%或更低、更特别地为约80%或更低、更特别地为约76%或更低、更特别地为约72%或更低,这取决于一段两个或更多个错配核苷酸是否涵盖2、3、4、5、6或7个核苷酸等。在一个实施方案中,除了一段一个或多个错配核苷酸之外,当使用合适的比对算法进行最佳比对时,互补程度为约或大于约50%、60%、75%、80%、85%、90%、95%、97.5%、99%或更高。可以使用用于比对序列的任何合适的算法来确定最佳比对,所述算法的非限制性实例包括Smith-Waterman算法、Needleman-Wunsch算法、基于Burrows-Wheeler Transform的算法(例如,Burrows Wheeler Aligner)、Clustal W,Clustal X,BLAT,Novoalign(Novocraft Technologies;可在www.novocraft.com获得)、ELAND(Illumina,San Diego,CA)、SOAP(可在soap.genomics.org.cn获得)和Maq(可在maq.sourceforge.net获得)。序列(在核酸靶向ωRNA t分子内)引导核酸靶向复合物与靶核酸序列的序列特异性结合的能力可以通过任何合适的测定来评估。例如,足以形成TnpB靶向复合物的ωRNA系统的组分(包括待测试的ωRNA分子序列)可以提供给具有对应靶核酸序列的宿主细胞,诸如通过用编码TnpB靶向复合物的组分的载体转染,随后评估靶核酸序列内的优先靶向(例如,切割),诸如通过Surveyor测定,如本文所述。类似地,可以通过提供靶核酸序列、TnpB靶向复合物的组分(包括待测试的序列和不同于测试ωRNA的对照序列),并且比较测试与对照ωRNA分子序列反应之间的靶序列处或附近的结合或切割速率,在试管中评价靶核酸序列(或其附近的序列)的切割。其他测定是可能的并且本领域技术人员会想到。可以选择间隔序列,并因此选择核酸靶向ωRNA来靶向任何靶核酸序列。
可以选择ωRNA,并因此选择核酸靶向间隔子来靶向任何靶核酸序列。靶序列可以是DNA。靶序列可以是任何RNA序列。在一个实施方案中,靶序列可以是选自由以下组成的组的RNA分子内的序列:信使RNA(mRNA)、前mRNA、核糖体RNA(rRNA)、转移RNA(tRNA)、微小RNA(miRNA)、小干扰RNA(siRNA)、核小RNA(snRNA)、核仁小RNA(snoRNA)、双链RNA(dsRNA)、非编码RNA(ncRNA)、长链非编码RNA(lncRNA)和细胞质小RNA(scRNA)。在一些优选的实施方案中,靶序列可以是选自由以下组成的组的RNA分子内的序列:mRNA、前mRNA和rRNA。在一些优选的实施方案中,靶序列可以是选自由ncRNA和lncRNA组成的组的RNA分子内的序列。在一些更优选的实施方案中,靶序列可以是mRNA分子或前mRNA分子内的序列。
在一个实施方案中,ωRNA形成具有单独的非共价连接序列的茎环,所述序列可以是DNA或RNA。在特定的实施方案中,形成ωRNA组分的序列首先使用标准亚磷酰胺合成方案来合成(Herdewijn,P.编辑,Methods in Molecular Biology Col 288,OligonucleotideSynthesis:Methods and Applications,Humana Press,New Jersey(2012))。在一个实施方案中,可以使用本领域已知的标准方案,将这些序列官能化以含有用于连接的适当官能团(Hermanson,G.T.,Bioconjugate Techniques,Academic Press(2013))。官能团的实例包括但不限于羟基、胺、羧酸、羧酸卤化物、羧酸活性酯、醛、羰基、氯羰基、咪唑基羰基、酰肼、氨基脲、硫代氨基脲、硫醇、马来酰亚胺、卤代烷基、磺酰基、烯丙基、炔丙基、二烯、炔烃和叠氮化物。一旦此序列被官能化,就可以在此序列与保守核苷酸序列之间形成共价化学键或连接键。化学键的实例包括但不限于基于以下的那些化学键:氨基甲酸酯、醚、酯、酰胺、亚胺、脒、氨基三嗪、氢腙、二硫化物、硫醚、硫酯、硫代磷酸酯、二硫代磷酸酯、磺胺类、磺酸盐、砜类、亚砜、脲、硫脲、酰肼、肟、三唑、光不稳定键、C-C键形成基团,诸如Diels-Alder环加成对或闭环复分解对,以及迈克尔反应对。
ωRNA化学修饰
在一个实施方案中,这些茎环形成序列可以是化学合成的。在一个实施方案中,化学合成使用利用2'-乙酰乙酸基原酸酯(2’-ACE)(Scaringe等人,J.Am.Chem.Soc.(1998)120:11820-11821;Scaringe,Methods Enzymol.(2000)317:3-18)或2’-硫代氨基甲酸酯(2’-TC)化学(Dellinger等人,J.Am.Chem.Soc.(2011)133:11540-11546;Hendel等人,Nat.Biotechnol.(2015)33:985-989)的自动化固相寡核苷酸合成机器。
在一个实施方案中,ωRNA组分分子包含非天然存在的核酸和/或非天然存在的核苷酸和/或核苷酸类似物和/或化学修饰。优选地,这些非天然存在的核酸和非天然存在的核苷酸位于ωRNA序列之外。非天然存在的核酸可以包括例如天然和非天然存在的核苷酸的混合物。非天然存在的核苷酸和/或核苷酸类似物可以在核糖、磷酸和/或碱基部分被修饰。在本发明的实施方案中,ωRNA组分核酸包含核糖核苷酸和非核糖核苷酸。在一个这样的实施方案中,ωRNA组分包含一个或多个核糖核苷酸和一个或多个脱氧核糖核苷酸。在本发明的实施方案中,ωRNA组分包含一个或多个非天然存在的核苷酸或核苷酸类似物,诸如具有硫代磷酸酯键的核苷酸、锁核酸(LNA)、在核糖环的2'与4'碳之间包含亚甲基桥的核苷酸或桥接核酸(BNA)。修饰的核苷酸的其他实例包括2'-O-甲基类似物、2'-脱氧类似物或2'-氟类似物。修饰的碱基的其他实例包括但不限于2-氨基嘌呤、5-溴-尿苷、假尿苷、肌苷、7-甲基鸟苷。ωRNA化学修饰的实例包括但不限于在一个或多个末端核苷酸处掺入2'-O-甲基(M)、2'-O-甲基3'硫代磷酸酯(MS)、S-约束乙基(cEt)或2'-O-甲基3'硫代PACE(MSP)。与未修饰的ωRNA组分相比,此类化学修饰的ωRNA组分可以包括增加的稳定性和增加的活性,但中靶与脱靶特异性不可预测。(参见Hendel,2015,Nat Biotechnol.33(9):985-9,doi:10.1038/nbt.3290,2015年6月29日在线发表Ragdarm等人,0215,PNAS,E7110-E7111;Allerson等人,J.Med.Chem.2005,48:901-904;Bramsen等人,Front.Genet.,2012,3:154;Deng等人,PNAS,2015,112:11870-11875;Sharma等人,MedChemComm.,2014,5:1454-1471;Hendel等人,Nat.Biotechnol.(2015)33(9):985-989;Li等人,Nature BiomedicalEngineering,2017,1,0066DOI:10.1038/s41551-017-0066)。在一个实施方案中,ωRNA组分的5'和/或3'端被多种功能部分修饰,所述功能部分包括荧光染料、聚乙二醇、胆固醇、蛋白质或检测标签。(参见Kelly等人,2016,J.Biotech.233:74-83)。在一个实施方案中,ωRNA组分包含结合靶序列的区域中的核糖核苷酸以及结合TnpB多肽的区域中的一个或多个脱氧核糖核苷酸和/或核苷酸类似物。在实施方案中,将脱氧核糖核苷酸和/或核苷酸类似物掺入经工程化ωRNA组分结构中。在一个实施方案中,ωRNA组分的3'或5'端处的3-5个核苷酸是化学修饰的。在一个实施方案中,仅在种子区域引入小的修饰,诸如2'-F修饰。在一个实施方案中,2’-F修饰被引入到ωRNA组分的3'端。在一个实施方案中,ωRNA组分的5'和/或3'端处的三至五个核苷酸用2'-O-甲基(M)、2'-O-甲基3'硫代磷酸酯(MS)、S-约束乙基(cEt)或2'-O-甲基3'硫代PACE(MSP)进行化学修饰。此类修饰可以增强基因组编辑效率(参见Hendel等人,Nat.Biotechnol.(2015)33(9):985-989)。在一个实施方案中,ωRNA组分的所有磷酸二酯键被硫代磷酸酯(PS)取代以增强基因破坏水平。在一个实施方案中,ωRNA组分的5'和/或3'端处的多于五个核苷酸用2’-O-Me、2’-F或S-约束乙基(cEt)进行化学修饰。此类化学修饰的ωRNA组分可以介导增强的基因破坏水平(参见Ragdarm等人,0215,PNAS,E7110-E7111)。在本发明的实施方案中,对ωRNA组分进行修饰以在其3'和/或5'端处包含化学部分。此类部分包括但不限于胺、叠氮化物、炔烃、硫基、二苯并环辛炔(DBCO)或罗丹明。在某些实施方案中,化学部分通过接头(诸如烷基链)与ωRNA组分缀合。在一个实施方案中,修饰的核酸组分的化学部分可以用于将ωRNA组分附接至另一个分子,诸如DNA、RNA、蛋白质或纳米颗粒。此类化学修饰的ωRNA组分可以用于鉴定或富集通常由TnpB多肽和相关系统编辑的细胞(参见Lee等人,eLife,2017,6:e25312,DOI:10.7554)。
在特定的实施方案中,保守核苷酸序列可被修饰以包含一种或多种蛋白质结合RNA适体。在特定的实施方案中,可包括一种或多种适体,诸如优化的二级结构的一部分。此类适体可能能够结合如本文进一步详述的噬菌体外壳蛋白。
在实施方案中,TnpB多肽利用ωRNA组分支架,所述支架包含促进与TnpB蛋白相互作用的多核苷酸序列,从而允许核酸组分分子与靶多核苷酸的序列特异性结合和/或靶向。考虑了经由糖、核苷酸间磷酸二酯键、嘌呤和嘧啶残基的修饰,使用利用各种生物缀合反应、环、桥和非核苷酸连接的共价连接来化学合成ωRNA组分支架。Sletten等人,Angew.Chem.Int.编辑(2009)48:6974-6998;Manoharan,M.Curr.Opin.Chem.Biol.(2004)8:570-9;Behlke等人,Oligonucleotides(2008)18:305-19;Watts等人,Drug.Discov.Today(2008)13:842-55;Shukla等人,ChemMedChem(2010)5:328-49;化学合成使用利用2'-乙酰乙酸基原酸酯(2’-ACE)(Scaringe等人,J.Am.Chem.Soc.(1998)120:11820-11821;Scaringe,Methods Enzymol.(2000)317:3-18)或2’-硫代氨基甲酸酯(2’-TC)化学(Dellinger等人,J.Am.Chem.Soc.(2011)133:11540-11546;Hendel等人,Nat.Biotechnol.(2015)33:985-989)的自动化固相寡核苷酸合成机器。
在某些示例性实施方案中,支架和间隔子可设计为两个单独的分子,其可以杂交或共价接合成单个分子。共价连接可以经由接头(例如,非核苷酸环)进行,所述接头包含诸如间隔子、附着物、生物缀合物、发色团、报告基团、染料标记的RNA和非天然存在的核苷酸类似物的部分。更具体地,用于本发明的目的的合适的间隔子包括但不限于聚醚(例如,聚乙二醇、多元醇、聚丙二醇或乙二醇和丙二醇的混合物)、多胺基团(例如,精胺(spennine)、亚精胺及其聚合物衍生物)、聚酯(例如,聚(丙烯酸乙酯))、聚磷酸二酯、亚烷基及其组合。合适的附着物包括可以被添加至接头以将额外的性质添加至接头的任何部分,诸如但不限于荧光标记。合适的生物缀合物包括但不限于肽、糖苷、脂质、胆固醇、磷脂、二酰基甘油和二烷基甘油、脂肪酸、烃、酶底物、类固醇、生物素、洋地黄毒苷、碳水化合物、多糖。合适的发光团、报告基团和染料标记的RNA包括但不限于荧光染料,诸如荧光素和罗丹明、化学发光、电化学发光和生物发光标记化合物。WO 2004/015075中还描述了缀合两个核酸组分的示例性接头的设计,所述接头可以适合与ωRNA一起使用。
接头(例如,非核苷酸环)可以是任何长度。在一个实施方案中,接头的长度相当于约0-16个核苷酸。在一个实施方案中,接头的长度相当于约0-8个核苷酸。在一个实施方案中,接头的长度相当于约0-4个核苷酸。在一个实施方案中,接头的长度相当于约2个核苷酸。国际专利公开号WO 2011/008730中还描述了示例性接头设计。
护送的ωRNA组分
在特定的实施方案中,组合物或复合物具有ωRNA组分分子,所述分子具有被设计为改善ωRNA组分分子结构、架构、稳定性、遗传表达或其任何组合的功能结构。这样的结构可以包括适体。
适体是可以被设计或选择与其他配体紧密结合的生物分子,例如使用被称为指数级富集配体系统进化的技术(SELEX;Tuerk C,Gold L:“Systematic evolution ofligands by exponential enrichment:RNA ligands to bacteriophage T4 DNApolymerase.”Science 1990,249:505-510)。例如,核酸适体可以选自随机序列寡核苷酸库,对广泛的生物医学相关靶标具有高结合亲和力和特异性,这表明适体具有广泛的治疗效用(Keefe,Anthony D.,Supriya Pai,and Andrew Ellington."Aptamers astherapeutics."Nature Reviews Drug Discovery9.7(2010):537-550)。这些特性还表明适体作为药物递送媒介物的广泛用途(Levy-Nissenbaum,Etgar等人"Nanotechnology andaptamers:applications in drug delivery."Trends in biotechnology 26.8(2008):442-449;和Hicke BJ,Stephens AW.“Escort aptamers:a delivery service fordiagnosis and therapy.”J Clin Invest 2000,106:923-928.)。适体也可以被构建为充当分子开关,其通过改变性质来响应que,诸如结合荧光团以模拟绿色荧光蛋白活性的RNA适体(Paige,Jeremy S.,Karen Y.Wu和Samie R.Jaffrey."RNA mimics of greenfluorescent protein."Science 333.6042(2011):642-646)。它还表明适体可用作靶向的siRNA治疗递送系统的组分,例如靶向细胞表面蛋白(Zhou,Jiehua和John J.Rossi."Aptamer-targeted cell-specific RNA interference."Silence 1.1(2010):4)。
因此,在特定的实施方案中,例如通过一种或多种被设计为改善ωRNA组分分子递送的适体来修饰ωRNA组分分子,所述递送包括递送穿过细胞膜、递送至细胞内区室、或递送至细胞核中。除了一种或多种适体之外,或者在没有此类一种或多种适体的情况下,这样的结构可以包括使核酸组分分子可递送、可诱导或响应于选择的效应子的部分。因此,本发明包括响应于正常或病理性生理条件的ωRNA组分分子,所述生理条件包括但不限于pH、缺氧、O2浓度、温度、蛋白质浓度、酶浓度、脂质结构、光暴露、机械破坏(例如,超声波)、磁场、电场或电磁辐射。
诱导型系统的光反应性可以经由隐花色素-2和CIB1的活化和结合来实现。蓝光刺激诱导隐花色素-2发生活化构象变化,从而导致其结合配偶体CIB1募集。此种结合快速且可逆,在脉冲刺激后<15秒内达到饱和,并且在刺激结束后<15分钟内恢复至基线。这些快速结合动力学导致系统暂时仅受转录/翻译和转录/蛋白质降解的速度限制,而不受诱导剂的摄取和清除的限制。隐花色素-2活化也是高度敏感的,从而允许使用低光强度刺激并减轻光毒性风险。此外,在诸如完整哺乳动物脑的上下文中,可变的光强度可用于控制受刺激区域的大小,从而允许比单独的载体递送可提供的精度更高的精度。
能量源(诸如电磁辐射、声能或热能)可诱导核酸组分分子。有利地,电磁辐射是可见光的组分。在优选的实施方案中,光是波长为约450至约495nm的蓝光。在特别优选的实施方案中,波长为约488nm。在另一个优选的实施方案中,光刺激是经由脉冲进行的。光功率可以在约0-9mW/cm2的范围内。在优选的实施方案中,每15秒低至0.25秒的刺激范式应导致最大活化。
化学或能量敏感的ωRNA组分可以在化学源结合或能量的诱导后经历构象变化,从而允许其充当ωRNA并具有TnpB多肽系统或复合物功能。本发明可以涉及应用化学源或能量以具有ωRNA功能和TnpB多肽系统或复合物功能;以及任选地进一步确定基因组基因座的表达被改变。
此化学诱导型系统有若干种不同的设计:1.由脱落酸(ABA)可诱导的基于ABI-PYL的系统(参见,例如,stke.sciencemag.org/cgi/content/abstract/sigtrans;4/164/rs2)、2.由雷帕霉素(rapamycin)(或基于雷帕霉素的相关化学物质)可诱导的基于FKBP-FRB的系统(参见,例如,nature.com/nmeth/journal/v2/n6/full/nmeth763.html)、3.由赤霉素(GA)可诱导的基于GID1-GAI的系统(参见,例如,nature.com/nchembio/journal/v8/n5/full/nchembio.922.html)。
化学诱导型系统可以是由4-羟基他莫昔芬(4OHT)可诱导的基于雌激素受体(ER)的系统(参见,例如,pnas.org/content/104/3/1027.abstract)。在与4-羟基他莫昔芬结合后,雌激素受体的突变配体结合结构域(称为ERT2)易位到细胞的细胞核中。在本发明的其他实施方案中,任何核受体、甲状腺激素受体、视黄酸受体、雌激素受体、雌激素相关受体、糖皮质激素受体、孕激素受体、雄激素受体的任何天然存在的或工程化的衍生物可用于与基于ER的诱导型系统类似的诱导型系统。
另一种诱导型系统基于使用由能量、热或无线电波可诱导的基于瞬时受体电位(TRP)离子通道的系统的设计(参见,例如,sciencemag.org/content/336/6081/604)。这些TRP家族蛋白响应于不同的刺激,包括光和热。当此蛋白质被光或热活化时,离子通道将打开并允许离子(诸如钙)进入质膜。此离子流入将结合至与多肽连接的细胞内离子相互作用配偶体,所述多肽包括核酸组分以及TnpB多肽/ωRNA分子复合物或系统的其他组分,并且所述结合将诱导多肽的亚细胞定位的变化,从而导致整个多肽进入细胞的细胞核。一旦进入细胞核,核酸组分蛋白以及TnpB多肽/ωRNA分子复合物的其他组分将是活性的并且调节细胞中的靶基因表达。
虽然光活化可能是有利的实施方案,但有时对于光可能不穿透皮肤或其他器官的体内应用而言可能是尤为不利的。在此情况下,考虑其他具有类似效果的能量活化方法,特别是电场能和/或超声。
优选地在体内条件下使用约1伏/厘米至约10千伏/厘米的一个或多个电脉冲,基本上如本领域中所述施用电场能。代替脉冲或除了脉冲之外,可以连续的方式递送电场。电脉冲可施加1微秒与500毫秒之间,优选地1微秒与100毫秒之间。电场可连续施加或以脉冲方式施加,持续约5分钟。
如本文所用,“电场能”是细胞暴露于其中的电能。在体内条件下,电场优选具有约1伏/厘米至约10千伏/厘米或更高的强度(参见WO97/49450)。
如本文所用,术语“电场”包括可变电容和电压下的一个或多个脉冲,并且包括指数波和/或方波和/或调制波和/或调制方波形式。对电场和电的提及应视为包括对细胞环境中电位差的存在的提及。如本领域已知的,此种环境可通过静电、交流电(AC)、直流电(DC)等来建立。电场可以是均匀的、非均匀的或其他方式的,并且可以时间依赖性方式在强度和/或方向上变化。
以任何顺序和任何组合单次或多次施加电场以及单次或多次施加超声也是可能的。超声和/或电场可作为单次或多次连续施加或者作为脉冲来递送(脉冲式递送)。
电穿孔已经用于体外和体内程序中以将外来物质引入活细胞中。在体外应用中,首先将活细胞样品与感兴趣的剂混合并放置在电极(诸如平行板)之间。然后,电极向细胞/植入物混合物施加电场。执行体外电穿孔的系统的实例包括Electro Cell ManipulatorECM600产品和Electro Square Porator T820,两者均由Genetronics,Inc的BTX部门制造(参见美国专利号5,869,326)。
已知的电穿孔技术(体外和体内)通过向位于治疗区域周围的电极施加短暂的高压脉冲来发挥作用。电极之间产生的电场导致细胞膜暂时变为多孔的,于是感兴趣的剂的分子进入细胞。在已知的电穿孔应用中,此电场包括持续约100μs的大约1000V/cm的单个方波脉冲。例如,可在Electro Square Porator T820的已知应用中产生这样的脉冲。
在体外条件下,电场优选具有约1V/cm至约10kV/cm的强度。因此,电场可以具有1V/cm、2V/cm、3V/cm、4V/cm、5V/cm、6V/cm、7V/cm、8V/cm、9V/cm、10V/cm、20V/cm、50V/cm、100V/cm、200V/cm、300V/cm、400V/cm、500V/cm、600V/cm、700V/cm、800V/cm、900V/cm、1kV/cm、2kV/cm、5kV/cm、10kV/cm、20kV/cm、50kV/cm或更高的强度。在体外条件下,更优选为约0.5kV/cm至约4.0kV/cm。在体内条件下,电场优选具有约1V/cm至约10kV/cm的强度。然而,在递送至靶位点的脉冲数量增加的情况下,电场强度可降低。因此,设想以较低场强来脉冲式递送电场。
优选地,以多个脉冲的形式,诸如具有相同强度和电容的双脉冲或具有不同强度和/或电容的顺序脉冲来施加电场。如本文所用,术语“脉冲”包括可变电容和电压下的一个或多个脉冲,并且包括指数波和/或方波和/或调制波/方波形式。
优选地,将电脉冲作为选自指数波形式、方波形式、调制波形式和调制方波形式的波形来递送。
优选的实施方案采用低电压直流电。因此,申请人公开了电场的使用,所述电场以1V/cm与20V/cm之间的场强向细胞、组织或组织块施加,持续100毫秒或更长、优选15分钟或更长的时间段。
超声有利地以约0.05W/cm2至约100W/cm2的功率水平施用。可使用诊断性或治疗性超声或其组合。
如本文所用,术语“超声”是指由机械振动组成的能量形式,所述机械振动的频率高到超过人类听觉的范围。超声谱的频率下限通常可取为约20kHz。大多数诊断性超声应用采用1与15MHz'范围内的频率(摘自Ultrasonics in Clinical Diagnosis,P.N.T.Wells编辑,第2版,出版社Churchill Livingstone[Edinburgh,London&NY,1977])。
超声已经用于诊断性和治疗性应用。当用作诊断性工具(“诊断性超声”)时,超声通常以高达约100mW/cm2(FDA推荐)的能量密度范围使用,但也使用过高达750mW/cm2的能量密度。在物理治疗中,超声通常用作高达约3至4W/cm2(WHO建议)范围的能量源。在其他治疗性应用中,可在短时间段内采用强度更高的超声,例如100W/cm至1kW/cm2(或甚至更高)的HIFU。如本说明书中所用的术语“超声”旨在涵盖诊断性超声、治疗性超声和聚焦超声。
聚焦超声(FUS)允许在不使用侵入性探头的情况下递送热能(参见Morocz等人1998Journal of Magnetic Resonance Imaging第8卷,第1期,第136-142页。聚焦超声的另一种形式是高强度聚焦超声(HIFU),其由Moussatov等人在Ultrasonics(1998)第36卷,第8期,第893-900页中并且由TranHuuHue等人在Acustica(1997)第83卷,第6期,第1103-1106页中进行综述。
优选地,采用诊断性超声和治疗性超声的组合。然而,此组合并非旨在进行限制,并且本领域技术人员将理解,可使用超声的任何多种组合。另外,能量密度、超声频率和暴露时间段可改变。
优选地,暴露于超声能量源的功率密度为约0.05至约100Wcm-2。甚至更优选地,暴露于超声能量源的功率密度为约1至约15Wcm-2。
优选地,暴露于超声能量源的频率为约0.015至约10.0MHz。更优选地,暴露于超声能量源的频率为约0.02至约5.0MHz或约6.0MHz。最优选地,以3MHz的频率施加超声。
优选地,暴露持续约10毫秒至约60分钟的时间段。优选地,暴露持续约1秒至约5分钟的时间段。更优选地,施加超声持续约2分钟。然而,根据待破坏的特定靶细胞,暴露可持续较长的持续时间,例如持续15分钟。
有利地,将靶组织暴露于声功率密度为约0.05Wcm-2至约10Wcm-2、频率范围为约0.015至约10MHz的超声能量源(参见WO 98/52609)。然而,替代方案也是可能的,例如,暴露于声功率密度高于100Wcm-2的超声能量源,但持续缩短的时间段,例如,暴露于1000Wcm-2,持续毫秒范围或更短的时间段。
优选地,以多个脉冲的形式来施加超声;因此,可以任何组合来采用连续波和脉冲波(脉冲式超声递送)。例如,可施加连续波超声,然后施加脉冲波超声,或者反之亦然。这可以任何顺序和组合来重复任意次数。可以在连续波超声的背景下施加脉冲波超声,并且可使用任何组数的任何数量的脉冲。
优选地,超声可包括脉冲波超声。在高度优选的实施方案中,超声以0.7Wcm-2或1.25Wcm-2的功率密度作为连续波施加。如果使用脉冲波超声,则可采用更高的功率密度。
使用超声是有利的,因为像光一样,超声可精确地聚焦在靶标上。此外,超声是有利的,因为与光不同,超声可更深入地聚焦到组织中。因此,超声更适合完整组织穿透(诸如但不限于肝叶)或完整器官(诸如但不限于整个肝脏或整个肌肉,诸如心脏)疗法。另一个重要的优点是超声是一种用于各种诊断性和治疗性应用的非侵入性刺激。举例来说,超声在医学影像技术中以及另外在骨科疗法中是众所周知的。此外,适合对受试脊椎动物施加超声的仪器是广泛可获得的,并且它们的使用是本领域众所周知的。
在特定的实施方案中,ωRNA分子被二级结构修饰以增加TnpB多肽和相关系统的特异性,并且二级结构可以保护免受核酸外切酶活性影响并且允许对核酸组分序列进行5'添加,所述核酸组分序列在本文中也称为受保护的核酸组分分子。
在一个方面,本发明提供了将“保护RNA”与核酸组分分子的序列杂交,其中“保护RNA”是与核酸组分分子的3'端互补的RNA链,从而产生部分双链的核酸组分。在本发明的实施方案中,用完全互补的保护序列保护错配的碱基(即,不形成核酸组分序列的一部分的核酸组分分子的碱基)降低了靶标DNA结合至3'端处的错配的碱基对的可能性。在本发明的特定实施方案中,包含延伸长度的额外序列也可存在于核酸组分分子内,使得核酸组分在核酸组分分子内包含保护序列。此“保护序列”确保核酸组分分子除了“暴露序列”(包含与靶序列杂交的核酸组分序列的一部分)之外还包含“受保护的序列”。在特定的实施方案中,核酸组分分子通过保护核酸组分的存在而被修饰以包含二级结构,诸如发夹。有利地,存在与受保护的序列、核酸组分序列或两者具有互补性的三个或四个至三十个或更多个(例如,约10个或更多个)连续碱基对。有利的是受保护的部分不妨碍TnpB多肽和相关系统与其靶标相互作用的热力学。通过提供包括部分双链的核酸组分分子的此种延伸,核酸组分分子被认为是受保护的并且导致TnpB多肽/核酸组分分子复合物的特异性结合改善,同时保持特异活性。
在特定的实施方案中,使用截短的ωRNA组分(tru核酸组分),即包含相对于规范核酸组分序列长度而言长度被截短的核酸组分序列的核酸组分分子。如Nowak等人(Nucleic Acids Res(2016)44(20):9555-9564)所述,此类核酸组分分子可允许具有催化活性的TnpB多肽结合其靶标而不切割靶DNA。在特定的实施方案中,使用截短的核酸组分,其允许靶标的结合但仅保留TnpB多肽的切口酶活性。
在一个实施方案中,三触角N-乙酰半乳糖胺(GalNAc)与寡核苷酸组分的缀合可用于改善递送,例如递送至选择的细胞类型,例如肝细胞(参见通过引用并入本文的国际专利公开号WO 2014/118272;Nair,JK等人,2014,Journal of the American ChemicalSociety 136(49),16958-16961)。这被认为是糖基颗粒,并且本文提供了关于其他颗粒递送系统和/或制剂的进一步详细信息。因此,GalNAc可以被认为是本文所述的其他颗粒意义上的颗粒,使得一般用途和其他考虑因素,例如所述颗粒的递送,也适用于GalNAc颗粒。例如,溶液相缀合策略可用于将作为PFP(五氟苯基)酯活化的三触角GalNAc簇(摩尔重量为约2000)附接到5'-己氨基修饰的寡核苷酸上(5′-HA ASO,摩尔重量为约8000Da;等人,Bioconjugate Chem.,2015,26(8),第1451–1455页)。类似地,已经描述了用于体内核酸递送的聚(丙烯酸酯)聚合物(参见通过引用并入本文的WO2013158141)。在另外的替代实施方案中,可以使用TnpB多肽纳米颗粒(或蛋白质复合物)与天然存在的血清蛋白的预混合来改善递送(Akinc A等人,2010,Molecular Therapy第18卷第7期,第1357–1364页)。
筛选技术可用于鉴定递送增强剂,例如通过筛选化学文库(Gilleron J.等人,2015,Nucl.Acids Res.43(16):7984-8001)。还已经描述了用于评估递送媒介物(诸如脂质纳米颗粒)效率的方法,其可用于鉴定组分的有效递送媒介物(参见Sahay G.等人,2013,Nature Biotechnology 31,653–658)。
靶相邻基序
本文公开的TnpB系统可识别靶相邻基序(TAM),以便识别并结合靶多核苷酸上的靶序列。在一个实施方案中,核酸指导的核酸酶和相关组合物不含有TAM要求。TAM的精确序列和长度要求将根据所使用的核酸指导的核酸酶而不同。在一些实例中,TAM通常是与原间隔序列(即,靶序列)相邻的2-5个碱基对序列。在一个示例性实施方案中,TAM与靶多核苷酸3'相邻。在另一个示例性实施方案中,TAM与靶多核苷酸的靶序列5'相邻。
在一个实施方案中,切割位点远离TAM,例如,切割发生在非靶链上的第n个核苷酸之后以及靶向链上的核苷酸之后。在一个实施方案中,切割位点发生在非靶链上的已鉴定的核苷酸(从TAM计数)之后以及靶向链上的进一步鉴定的核苷酸(从TAM计数)之后。在一个实施方案中,载体编码核酸靶向效应蛋白,其可以相对于对应的野生型酶是突变的,使得突变的核酸靶向效应蛋白缺乏切割含有靶序列的靶多核苷酸的一条或两条DNA和RNA链的能力。
在一个示例性实施方案中,TAM序列是TCAG。在另一个示例性实施方案中,TAM序列是TCAA。TAM识别和特异性可例如使用以下实施例部分中公开的方法来鉴定。
HDR供体模板
在一个实施方案中,本文的组合物和系统还可包含一个或多个HDR供体模板,其用于同源定向修复介导的编辑。在一些情况下,HDR供体模板可包含一个或多个多核苷酸。在某些情况下,HDR供体模板可以包含一个或多个多核苷酸的编码序列。HDR供体模板可以是DNA模板。
HDR供体模板可用于编辑靶多核苷酸。在一些情况下,供体多核苷酸包含待引入靶多核苷酸中的一个或多个突变。此类突变的实例包括取代、缺失、插入或其组合。突变可导致靶多核苷酸上的开放阅读框的移位。在一些情况下,HDR供体模板改变靶多核苷酸中的终止密码子。例如,HDR供体模板可校正提前终止密码子。校正可通过缺失终止密码子或引入一个或多个终止密码子的突变来实现。在其他示例性实施方案中,HDR供体模板通过插入或恢复基因的功能拷贝、或其功能片段、或功能调控序列或调控序列的功能片段,解决了例如在某些疾病背景下可能发生的功能丧失性突变、缺失或易位。功能片段是指通过提供足够的核苷酸序列来恢复野生型基因或非编码调控序列(例如,编码长的非编码RNA的序列)的功能性的少于基因的完整拷贝。在某些示例性实施方案中,本文公开的系统可用于替换缺陷基因或其缺陷片段的单个等位基因。在另一个示例性实施方案中,本文公开的系统可用于替换缺陷基因或缺陷基因片段的两个等位基因。“缺陷基因”或“缺陷基因片段”是当表达时无法产生具有对应野生型基因功能的功能蛋白或非编码RNA的基因或基因部分。在某些示例性实施方案中,这些缺陷基因可能与一种或多种疾病表型相关。在某些示例性实施方案中,缺陷基因或基因片段不被替换,但本文所述的系统用于插入HDR供体模板,所述HDR供体模板编码补偿或覆盖缺陷基因表达的基因或基因片段,使得消除与缺陷基因表达相关的细胞表型或将其改变为不同的或期望的细胞表型。
在本发明的实施方案中,HDR供体模板可包括但不限于编码待表达的蛋白质或RNA转录物的基因或基因片段、调控元件、修复模板等。根据本发明,HDR供体模板可包含左端和右端序列元件,它们与介导插入的转座组分一起发挥作用。
在某些情况下,HDR供体模板操纵靶多核苷酸上的剪接位点。在一些实例中,HDR供体模板破坏剪接位点。破坏可以通过将多核苷酸插入至剪接位点和/或将一个或多个突变引入至剪接位点来实现。在某些实例中,HDR供体模板可恢复剪接位点。例如,多核苷酸可包含剪接位点序列。
待插入的HDR供体模板可以具有长度为10个碱基对或核苷酸至50kb的尺寸,例如长度为50至40k、100和30k、100至10000、100至300、200至400、300至500、400至600、500至700、600至800、700至900、800至1000、900至1100、1000至1200、1100至1300、1200至1400、1300至1500、1400至1600、1500至1700、600至1800、1700至1900、1800至2000个碱基对(bp)或核苷酸。
系统和复合物
在一个方面,本公开提供了核酸靶向系统。此类系统可用于靶向、修饰和以其他方式操纵靶多核苷酸。在一个实施方案中,系统包含TnpB多肽和一种或多种ωRNA。TnpB多肽可以具有核酸酶活性,例如能够切割DNA。在一些实施方案中,TnpB多肽可具有或可被工程化为具有切口酶活性,例如能够在双链核酸(诸如dsDNA或dsRNA)上产生单链断裂。
在一些实例中,本文的系统中的两种或更多种组分可形成复合物。例如,组分是单独的分子,但彼此直接或间接相互作用。在某些实例中,本文的系统中的两种或更多种组分可包含在融合蛋白中。
如本文所用,“靶序列”是指ωRNA被设计成与其具有互补性的序列,其中靶序列与ωRNA之间的杂交促进了多核苷酸靶向复合物的形成。不一定需要完全互补,只要有足够的互补性来引起杂交并促进TnpB靶向复合物的形成即可。靶序列可以包含DNA多核苷酸。在一个实施方案中,靶序列位于细胞的细胞核或细胞质中。在一个实施方案中,靶序列可位于真核细胞的细胞器(例如,线粒体或叶绿体)内。可用于重组至包含靶序列的靶向基因座中的序列或模板被称为“编辑模板”或“编辑序列”。在本发明的方面中,外源模板可以称为编辑模板。在一个方面,重组是同源重组。
在一个实施方案中,TnpB靶向复合物(包含与靶序列杂交并且与一种或多种核酸靶向效应蛋白复合的ωRNA)的形成导致靶序列中或附近(例如,距离靶序列1、2、3、4、5、6、7、8、9、10、20、50或更多个碱基对内)的一条或两条核酸链的切割。在一个实施方案中,将驱动TnpB系统的一个或多个元件的表达的一个或多个载体引入宿主细胞中,使得TnpB系统的元件的表达引导在一个或多个靶位点处形成TnpB复合物。例如,TnpB多肽和ωRNA可以各自可操作地连接至单独载体上的单独调控元件。或者,由相同或不同调控元件表达的元件中的两个或更多个可与一个或多个额外的载体一起组合在单个载体中,所述额外的载体提供不包含在第一载体中的TnpB系统的任何组分。组合在单个载体中的TnpB系统元件可以任何合适的方向排列,诸如一个元件相对于第二元件(的“上游”)位于5’或相对于第二元件(的“下游”)位于3’。一个元件的编码序列可以位于第二元件的编码序列的相同或相反的链上,并且定向在相同或相反的方向上。在一个实施方案中,单个启动子驱动编码TnpB和ωRNA的转录物的表达,所述转录物嵌入一个或多个内含子序列(例如每个在不同的内含子中,两个或更多个在至少一个内含子中,或全部在单个内含子中)。在一个实施方案中,TnpB多肽和ωRNA可操作地连接至同一启动子并由其表达。
本公开涵盖预测新TnpB多肽、鉴定组分和其中的新TnpB系统的计算方法和算法。在一些实例中,可以通过搜索宏基因组数据库中额外的同源物来进行鉴定候选物的新TnpB多肽基因座分析的计算方法。
在一个方面,通过将所鉴定的基因与TnpB多肽特异性谱进行比较并且根据NCBI保守结构域数据库(CDD)对它们进行注释来鉴定所有预测的蛋白质编码基因,所述数据库是一种蛋白质注释资源,由一组注释良好的古代结构域(ancient domain)和全长蛋白质的多序列比对模型组成。这些可用作位置特异性评分矩阵(PSSM),其用于经由RPS-BLAST快速鉴定蛋白质序列中的保守结构域。CDD内容包括NCBI-已标记结构域(NCBI-curated domain),其使用3D结构信息来明确定义结构域边界并且提供对序列/结构/功能关系的见解,以及从许多外部源数据库(Pfam、SMART、COG、PRK、TIGRFAM)导入的结构域模型。
在另一个方面,使用PSI-BLAST(位置特异性迭代基本局部比对搜索工具)来执行逐案分析(case-by-case analysis)。PSI-BLAST从使用蛋白质-蛋白质BLAST检测到的高于给定评分阈值的序列的多序列比对中得出位置特异性评分矩阵(PSSM)或特征。此PSSM用于进一步搜索数据库中的新匹配,并针对这些新检测到的序列进行后续迭代更新。因此,PSI-BLAST提供了一种检测蛋白质之间远距离关系的方式。
在另一个方面,使用HHpred执行逐案分析,HHpred是一种用于序列数据库搜索和结构预测的方法,其与BLAST或PSI-BLAST一样易于使用,同时在寻找远程同源物方面更加灵敏。事实上,HHpred的灵敏度与当前可用的最强大的用于结构预测的服务器具有竞争力。HHpred是第一个基于序型(profile)隐蔽马尔科夫模型(HMM)的成对比较的服务器。大多数常规序列搜索方法搜索序列数据库,诸如UniProt或NR,而HHpred搜索比对数据库,例如Pfam或SMART。这极大地简化了对多个序列家族的命中列表,而不是混乱的单个序列。所有主要的公开可用的特征和比对数据库均可通过HHpred获得。HHpred接受单个查询序列或多重比对作为输入。仅在几分钟内,它就会以类似于PSI-BLAST的易于阅读的格式返回搜索结果。搜索选项包括局部或全局比对以及二级结构相似性评分。HHpred可以产生成对查询模板序列比对、合并的查询模板多重比对(例如,用于传递搜索)以及由MODELLER软件根据HHpred比对计算的3D结构模型。
专门的系统
TnpB多肽可以是死亡形式,例如不具有核酸酶或切口酶活性。在一个实施方案中,所述系统还包含一种或多种功能结构域,例如核苷酸脱氨酶、逆转录酶、非LTR逆转录转座子(和编码的蛋白质)、聚合酶、多样性产生元件(和编码的蛋白质)和整合酶。在一些实例中,系统还包含一种或多种供体多核苷酸。供体多核苷酸可通过系统插入到靶多核苷酸中。供体多核苷酸可以包含在核酸模板中或由核酸模板编码。
TnpB碱基编辑系统
本公开还提供了碱基编辑系统。一般来讲,此种系统可包含与TnpB多肽缔合(例如,融合)的核碱基脱氨酶(例如,腺苷脱氨酶或胞苷脱氨酶)。TnpB多肽可以是催化失活的或死亡的TnpB多肽dTnpB。在某些实例中,核碱基脱氨酶是腺苷脱氨酶的突变形式。腺苷脱氨酶的突变形式可具有腺苷脱氨酶和胞苷脱氨酶活性。
在一些实例中,本公开提供了一种经工程化、非天然存在的组合物,其包含:dTnpB,核碱基脱氨酶,其与dTnpB缔合或者以其他方式能够与dTnpB形成复合物,以及ωRNA,其能够与TnpB蛋白形成复合物并且引导在待编辑的单个核苷酸或核苷酸碱基对处或与之相邻的靶序列处的位点特异性结合。在一个方面,核苷酸脱氨酶或其他编辑酶翻转DNA内的靶碱基。参见,例如Hong和Cheng等人,DNA Base Flipping:A general Mechanism forWriting Reading and Erasing DNA Modifications,Adv.Exp Med Biol.,2016:945:321-341,doi:10.1007/978-3-316-43624-1_14。不受理论的束缚,与靶标结合的TnpB-ωRNA复合物相对于例如CRISPR-Cas蛋白(例如Cas9、Cas12)提供了更开放的口袋,这有利地为复合物提供更多的可及性,并通过脱氨酶或其他碱基编辑酶进行靶核苷酸的碱基翻转,减少空间位阻,并且使得可以增强碱基编辑系统的特异性。
在一个方面,碱基编辑可以靶向距TAM末端约2至100个碱基对,或距TAM末端约4至100、50至100、6至100、7至100、8至100、9至100、10至100、11至100、12至100、13至100、14至100、15至100、16至100、17至100、18至100、18至100、19至100、20至100、25至100、3至90、3至80、3至70、3至60、3至50、3至40、3至30、或约3至30个碱基对。在一个方面,当碱基编辑器与TnpB融合时,接头长度可被配置为允许在期望位置进行更精确的碱基编辑。例如,如本文别处详述的,可以调节接头长度以促进距TAM更近或更远的碱基编辑,并且接头长度可被配置为具有增加或减少的刚性和其他性质,以在结合位点处产生期望的构型或呈递。TnpB复合物的结合口袋处的更开放的构型可允许TnpB编辑系统的构型的柔性更大,并且接触靶位点的特异性更大。
在一个方面,本公开提供了一种经工程化腺苷脱氨酶。经工程化腺苷脱氨酶可包含本文中的一种或多种突变。在一个实施方案中,经工程化腺苷脱氨酶具有胞苷脱氨酶活性。在某些实例中,经工程化腺苷脱氨酶具有胞苷脱氨酶活性和腺苷脱氨酶两者。在一些情况下,本文的碱基编辑器的修饰可用于靶向翻译后信号传导或催化。在一个实施方案中,本文的组合物包含核苷酸序列,所述核苷酸序列包含碱基编辑系统的一种或多种组分的编码序列。碱基编辑系统可包含与TnpB多肽或其变体融合的脱氨酶(例如,腺苷脱氨酶或胞苷脱氨酶)。在一些情况下,在一个或多个碱基处编辑靶多核苷酸以引入G→A或C→T突变。
在一些情况下,腺苷脱氨酶是双链RNA特异性腺苷脱氨酶(ADAR)。ADAR的实例包括Yiannis A Savva等人,The ADAR protein family,Genome Biol.2012;13(12):252中描述的那些,其通过引用整体并入。在一些实例中,ADAR可以是hADAR1。在某些实例中,ADAR可以是hADAR2。hADAR2的序列可以是登录号AF525422.1下描述的序列。
在一些情况下,脱氨酶可以是脱氨酶结构域,例如ADAR的脱氨酶结构域(“ADAR-D”)。在一个实例中,脱氨酶可以是hADAR2的脱氨酶结构域(“hADAR2-D),例如,如Phelps KJ等人,Recognition of duplex RNA by the deaminase domain of the RNA editingenzyme ADAR2.Nucleic Acids Res.2015年1月;43(2):1123-32中所述,其通过引用整体并入本文。在特定的实例中,hADAR2-D具有包含hADAR2-D的氨基酸299-701的序列,例如登录号AF525422.1下的序列的氨基酸299-701。
在某些实例中,系统包含与dTnpB融合的突变形式的腺苷脱氨酶。腺苷脱氨酶的突变形式可具有腺苷脱氨酶和胞苷脱氨酶活性。在一个实施方案中,腺苷脱氨酶可包含一个或多个突变:基于hADAR2-D的氨基酸序列位置的E488Q,以及对应于上述的同源ADAR蛋白中的突变。在一个实施方案中,腺苷脱氨酶可包含一个或多个突变:基于hADAR2-D的氨基酸序列位置的E488Q、V351G,以及对应于上述的同源ADAR蛋白中的突变。在一个实施方案中,腺苷脱氨酶可包含一个或多个突变:基于hADAR2-D的氨基酸序列位置的E488Q、V351G、S486A,以及对应于上述的同源ADAR蛋白中的突变。在一个实施方案中,腺苷脱氨酶可包含一个或多个突变:基于hADAR2-D的氨基酸序列位置的E488Q、V351G、S486A、T375S,以及对应于上述的同源ADAR蛋白中的突变。在一个实施方案中,腺苷脱氨酶可包含一个或多个突变:基于hADAR2-D的氨基酸序列位置的E488Q、V351G、S486A、T375S、S370C,以及对应于上述的同源ADAR蛋白中的突变。在一个实施方案中,腺苷脱氨酶可包含一个或多个突变:基于hADAR2-D的氨基酸序列位置的E488Q、V351G、S486A、T375S、S370C、P462A,以及对应于上述的同源ADAR蛋白中的突变。在一个实施方案中,腺苷脱氨酶可包含一个或多个突变:基于hADAR2-D的氨基酸序列位置的E488Q、V351G、S486A、T375S、S370C、P462A、N597I,以及对应于上述的同源ADAR蛋白中的突变。在一个实施方案中,腺苷脱氨酶可包含一个或多个突变:基于hADAR2-D的氨基酸序列位置的E488Q、V351G、S486A、T375S、S370C、P462A、N597I、L332I,以及对应于上述的同源ADAR蛋白中的突变。在一个实施方案中,腺苷脱氨酶可包含一个或多个突变:基于hADAR2-D的氨基酸序列位置的E488Q、V351G、S486A、T375S、S370C、P462A、N597I、L332I、I398V,以及对应于上述的同源ADAR蛋白中的突变。在一个实施方案中,腺苷脱氨酶可包含一个或多个突变:基于hADAR2-D的氨基酸序列位置的E488Q、V351G、S486A、T375S、S370C、P462A、N597I、L332I、I398V、K350I,以及对应于上述的同源ADAR蛋白中的突变。在一个实施方案中,腺苷脱氨酶可包含一个或多个突变:基于hADAR2-D的氨基酸序列位置的E488Q、V351G、S486A、T375S、S370C、P462A、N597I、L332I、I398V、K350I、M383L,以及对应于上述的同源ADAR蛋白中的突变。在一个实施方案中,腺苷脱氨酶可包含一个或多个突变:基于hADAR2-D的氨基酸序列位置的E488Q、V351G、S486A、T375S、S370C、P462A、N597I、L332I、I398V、K350I、M383L、D619G,以及对应于上述的同源ADAR蛋白中的突变。在一个实施方案中,腺苷脱氨酶可包含一个或多个突变:基于hADAR2-D的氨基酸序列位置的E488Q、V351G、S486A、T375S、S370C、P462A、N597I、L332I、I398V、K350I、M383L、D619G、S582T,以及对应于上述的同源ADAR蛋白中的突变。在一个实施方案中,腺苷脱氨酶可包含一个或多个突变:基于hADAR2-D的氨基酸序列位置的E488Q、V351G、S486A、T375S、S370C、P462A、N597I、L332I、I398V、K350I、M383L、D619G、S582T、V440I,以及对应于上述的同源ADAR蛋白中的突变。在一个实施方案中,腺苷脱氨酶可包含一个或多个突变:基于hADAR2-D的氨基酸序列位置的E488Q、V351G、S486A、T375S、S370C、P462A、N597I、L332I、I398V、K350I、M383L、D619G、S582T、V440I、S495N,以及对应于上述的同源ADAR蛋白中的突变。在一个实施方案中,腺苷脱氨酶可包含一个或多个突变:基于hADAR2-D的氨基酸序列位置的E488Q、V351G、S486A、T375S、S370C、P462A、N597I、L332I、I398V、K350I、M383L、D619G、S582T、V440I、S495N、K418E,以及对应于上述的同源ADAR蛋白中的突变。在一个实施方案中,腺苷脱氨酶可包含一个或多个突变:基于hADAR2-D的氨基酸序列位置的E488Q、V351G、S486A、T375S、S370C、P462A、N597I、L332I、I398V、K350I、M383L、D619G、S582T、V440I、S495N、K418E、S661T,以及对应于上述的同源ADAR蛋白中的突变。在一些实例中,本文提供的包括一种突变的腺苷脱氨酶,例如,包含E488Q、V351G、S486A、T375S、S370C、P462A、N597I、L332I、I398V、K350I、M383L、D619G、S582T、V440I、S495N、K418E、S661T中的一种或多种突变的腺苷脱氨酶,其与死亡的TnpB多肽或TnpB多肽切口酶融合。在一些实例中,本文提供的包括一种突变的腺苷脱氨酶,例如,包含E488Q、V351G、S486A、T375S、S370C、P462A、N597I、L332I、I398V、K350I、M383L、D619G、S582T、V440I、S495N、K418E和S661T的腺苷脱氨酶,其与死亡的TnpB多肽或TnpB多肽切口酶融合。在一些实例中,本文提供的包括一种突变的腺苷脱氨酶,例如,包含E488Q、V351G、S486A、T375S、S370C、P462A、N597I、L332I、I398V、K350I、M383L、D619G、S582T、V440I、S495N、K418E、S661T和S375N的腺苷脱氨酶,其与死亡的TnpB多肽或TnpB多肽切口酶融合。
在一个实施方案中,腺苷脱氨酶可以是tRNA特异性腺苷脱氨酶或其变体。在一个实施方案中,腺苷脱氨酶可包含一个或多个突变:基于大肠埃希氏菌TadA的氨基酸序列位置的W23L、W23R、R26G、H36L、N37S、P48S、P48T、P48A、I49V、R51L、N72D、L84F、S97C、A106V、D108N、H123Y、G125A、A142N、S146C、D147Y、R152H、R152P、E155V、I156F、K157N、K161T,以及对应于上述的同源脱氨酶蛋白中的突变。在一个实施方案中,腺苷脱氨酶可包含一个或多个突变:基于大肠埃希氏菌TadA的氨基酸序列位置的D108N,以及对应于上述的同源脱氨酶蛋白中的突变。在一个实施方案中,腺苷脱氨酶可包含一个或多个突变:基于大肠埃希氏菌TadA的氨基酸序列位置的A106V、D108N,以及对应于上述的同源脱氨酶蛋白中的突变。在一个实施方案中,腺苷脱氨酶可包含一个或多个突变:基于大肠埃希氏菌TadA的氨基酸序列位置的A106V、D108N、D147Y、E155V,以及对应于上述的同源脱氨酶蛋白中的突变。在一个实施方案中,腺苷脱氨酶可包含一个或多个突变:基于大肠埃希氏菌TadA的氨基酸序列位置的A106V、D108N,以及对应于上述的同源脱氨酶蛋白中的突变。在一个实施方案中,腺苷脱氨酶可包含一个或多个突变:基于大肠埃希氏菌TadA的氨基酸序列位置的A106V、D108N、D147Y、E155V、L84F、H123Y、I156F,以及对应于上述的同源脱氨酶蛋白中的突变。在一个实施方案中,腺苷脱氨酶可包含一个或多个突变:基于大肠埃希氏菌TadA的氨基酸序列位置的A106V、D108N、D147Y、E155V、L84F、H123Y、I156F、A142N,以及对应于上述的同源脱氨酶蛋白中的突变。在一个实施方案中,腺苷脱氨酶可包含一个或多个突变:基于大肠埃希氏菌TadA的氨基酸序列位置的A106V、D108N、D147Y、E155V、L84F、H123Y、I156F、H36L、R51L、S146C、K157N,以及对应于上述的同源脱氨酶蛋白中的突变。在一个实施方案中,腺苷脱氨酶可包含一个或多个突变:基于大肠埃希氏菌TadA的氨基酸序列位置的A106V、D108N、D147Y、E155V、L84F、H123Y、I156F、H36L、R51L、S146C、K157N、P48S,以及对应于上述的同源脱氨酶蛋白中的突变。在一个实施方案中,腺苷脱氨酶可包含一个或多个突变:基于大肠埃希氏菌TadA的氨基酸序列位置的A106V、D108N、D147Y、E155V、L84F、H123Y、I156F、H36L、R51L、S146C、K157N、P48S、A142N,以及对应于上述的同源脱氨酶蛋白中的突变。在一个实施方案中,腺苷脱氨酶可包含一个或多个突变:基于大肠埃希氏菌TadA的氨基酸序列位置的A106V、D108N、D147Y、E155V、L84F、H123Y、I156F、H36L、R51L、S146C、K157N、P48S、W23R、P48A,以及对应于上述的同源脱氨酶蛋白中的突变。在一个实施方案中,腺苷脱氨酶可包含一个或多个突变:基于大肠埃希氏菌TadA的氨基酸序列位置的A106V、D108N、D147Y、E155V、L84F、H123Y、I156F、H36L、R51L、S146C、K157N、P48S、W23R、P48A、A142N,以及对应于上述的同源脱氨酶蛋白中的突变。在一个实施方案中,腺苷脱氨酶可包含一个或多个突变:基于大肠埃希氏菌TadA的氨基酸序列位置的A106V、D108N、D147Y、E155V、L84F、H123Y、I156F、H36L、R51L、S146C、K157N、P48S、W23R、P48A、R152P,以及对应于上述的同源脱氨酶蛋白中的突变。在一个实施方案中,腺苷脱氨酶可包含一个或多个突变:基于大肠埃希氏菌TadA的氨基酸序列位置的A106V、D108N、D147Y、E155V、L84F、H123Y、I156F、H36L、R51L、S146C、K157N、P48S、W23R、P48A、R152P、A142N,以及对应于上述的同源脱氨酶蛋白中的突变。
在一些实例中,碱基编辑系统可以包含内含肽介导的反式剪接系统,其能够体内递送碱基编辑器,例如经工程化以反式剪接的分裂内含肽胞苷碱基编辑器(CBE)或腺嘌呤碱基编辑器(ABE)。此类碱基编辑系统的实例包括Colin K.W.Lim等人,Treatment of aMouse Model of ALS by In Vivo Base Editing,Mol Ther.2020年1月14日pii:S1525-0016(20)30011-3.doi:10.1016/j.ymthe.2020.01.005;和Jonathan M.Levy等人,Cytosine and adenine base editing of the brain,liver,retina,heart andskeletal muscle of mice via adeno-associated viruses,Nature BiomedicalEngineering第4卷,第97–110页(2020)中描述的那些,所述文献通过引用整体并入本文。
碱基编辑系统的实例包括以下中描述的那些:国际专利公开号WO 2019/071048(例如,段落[0933]-[0938])、WO 2019/084063(例如,段落[0173]-[0186]、[0323]-[0475]、[0893]-[1094])、WO 2019/126716(例如,段落[0290]-[0425]、[1077]-[1084])、WO 2019/126709(例如,段落[0294]-[0453])、WO 2019/126762(例如,段落[0309]-[0438])、WO2019/126774(例如,段落[0511]-[0670])、Cox DBT等人,RNA editing with CRISPR-Cas13,Science.2017年11月24日;358(6366):1019-1027;Abudayyeh OO等人,A cytosinedeaminase for programmable single-base RNA editing,Science 2019年7月26日:第365卷,第6451期,第382-386页;Gaudelli NM等人,Programmable base editing of A·Tto G·C in genomic DNA without DNA cleavage,Nature第551卷,第464–471页(2017年11月23日);Komor AC等人,Programmable editing of a target base in genomic DNAwithout double-stranded DNA cleavage.Nature.2016年5月19日;533(7603):420-4;Jordan L.Doman等人,Evaluation and minimization of Cas9-independent off-targetDNA editing by cytosine base editors,Nat Biotechnol(2020).doi.org/10.1038/s41587-020-0414-6;和Richter MF等人,Phage-assisted evolution of an adeninebase editor with improved Cas domain compatibility and activity,NatBiotechnol(2020).doi.org/10.1038/s41587-020-0453-z,所述文献通过引用整体并入本文并且可以用于适应TnpB多肽。
TnpB引物编辑系统
在一个实施方案中,本公开提供的组合物和系统可包含TnpB或dTnpB、一种或多种核酸组分和逆转录酶。系统可用于将供体多核苷酸插入靶多核苷酸。在一些实例中,组合物或系统包含催化失活的TnpB多肽、与TnpB多肽缔合或以其他方式能够与TnpB多肽形成复合物的逆转录酶、以及能够与TnpB多肽形成复合物并且引导复合物与靶多核苷酸的靶序列的位点特异性结合的核酸组分分子,所述核酸组分分子还包含供体模板,其充当用于通过逆转录酶将供体序列插入到靶多核苷酸中的模板。
在一些情况下,TnpB或dTnpB可以是切口酶,例如DNA切口酶。TnpB切口酶可包含一个或多个突变。在一些实例中,TnpB包含对应于RuvC核酸酶中的突变的突变。在一些实例中,TnpB是天然催化失活的并且包含与核酸酶结构域(例如HNH或FokI结构域)的融合。
逆转录酶结构域可以是逆转录酶或其片段。在某些方面,逆转录酶是人类免疫缺陷病毒(HIV)RT、禽成髓细胞白血病病毒(AMV)RT、莫洛尼鼠白血病病毒(M-MLV)RT、II组内含子RT、II组内含子样RT、或嵌合RT。在某些实施方案中,RT包含这些RT的修饰形式,诸如禽成髓细胞白血病病毒(AMV)RT、莫洛尼鼠白血病病毒(M-MLV)RT或人类免疫缺陷病毒(HIV)RT的工程变体(参见,例如,Anzalone等人,Search-and-replace genome editing withoutdouble-strand breaks or donor DNA,Nature.2019年12月;576(7785):149-157)。
在一些实例中,组合物和系统可包含本文的TnpB蛋白;与TnpB蛋白连接或以其他方式能够与TnpB蛋白形成复合物的逆转录酶(RT)多肽;以及ωRNA分子,其能够与TnpB蛋白形成复合物,并且包含:ωRNA序列,期能够引导TnpB复合物与靶多核苷酸的靶序列的位点特异性结合;能够与靶多核苷酸的切割的上游链结合的3'结合位点区域;以及编码延伸序列的RT模板序列,其中延伸序列包含变体区以及能够与靶多核苷酸的下游切割链杂交的3'同源序列。
本发明的替代实施方案中可使用多种逆转录酶(RT),包括原核和真核RT,前提条件是RT在宿主内发挥作用以从RNA模板产生供体多核苷酸序列。如果期望,可修饰天然RT的核苷酸序列,例如使用已知的密码子优化技术,使得优化在期望宿主内的表达。逆转录酶(RT)是一种用于从RNA模板产生互补DNA(cDNA)的酶,这个过程称为逆转录。逆转录酶被逆转录病毒用来复制其基因组,被逆转录转座子移动遗传元件用来在宿主基因组内增殖,被真核细胞用来延长其线性染色体末端的端粒,并且被一些非逆转录病毒(诸如乙型肝炎病毒(嗜肝DNA病毒科的成员,其是dsDNA-RT病毒))使用。逆转录病毒RT具有三种连续的生化活性:RNA依赖性DNA聚合酶活性、核糖核酸酶H、和DNA依赖性DNA聚合酶活性。总的来说,这些活性使酶能够将单链RNA转化为双链cDNA。在一个实施方案中,逆转录酶的RT结构域用于本发明。结构域可以仅包括RNA依赖性DNA聚合酶活性。在一些实例中,RT结构域是非诱变的,即,不引起供体多核苷酸的突变(例如,在逆转录酶过程期间)。在一些情况下,在一些实例中,RT结构域可以是非逆转录子RT,例如病毒RT或人内源RT。在一些实例中,RT结构域可以是逆转录子RT或DGR RT。在一些实例中,RT可以比对应的野生型RT具有更低的诱变性。在一个实施方案中,本文中的RT不具有诱变性。
逆转录酶可以融合至TnpB的C末端。或者或另外,逆转录酶可融合至TnpB的N末端。融合可以经由接头和/或衔接蛋白进行。在一些实例中,逆转录酶可以是M-MLV逆转录酶或其变体。M-MLV逆转录酶变体可包含一种或多种突变。例如,M-MLV逆转录酶可包含D200N、L603W和T330P。在另一个实例中,M-MLV逆转录酶可包含D200N、L603W、T330P、T306K和W313F。在特定的实例中,TnpB多肽与逆转录酶的融合是与M-MLV逆转录酶(D200N+L603W+T330P+T306K+W313F)融合的具有突变的TnpB多肽。
本文中的TnpB多肽的小尺寸可允许更容易地包装和递送(例如,用病毒载体(例如,AAV或慢病毒载体))引物编辑系统。参见,例如,Lino等人Drug Deliv.2018;25(1):1234-1257;doi:10.1080/10717544.2018.1474964,其通过引用并入本文,具体参见表1,CRISPR递送方法通过引用并入本文。
TnpB多肽可在靶DNA上在靶位点处产生单链断裂(切口)以暴露3'-羟基,从而引发核酸组分分子上的编辑编码延伸的逆转录直接进入靶位点。这些步骤可导致具有两个冗余单链DNA瓣的分支中间体:含有未编辑的DNA序列的5'瓣,以及含有从核酸组分复制的编辑序列的3'瓣。5'瓣可通过结构特异性核酸内切酶(例如,FEN122)去除,所述核酸内切酶切除在滞后链DNA合成和长补片碱基切除修复期间产生的5'瓣。可对未编辑的DNA链进行切口以诱导偏好DNA修复以优先替换未编辑的链。引物编辑系统和方法的实例包括Anzalone AV等人,Search-and-replace genome editing without double-strand breaks or donorDNA,Nature.2019年10月21日doi:10.1038/s41586-019-1711-4中描述的那些,其通过引用整体并入本文。
TnpB(例如,切口酶形式)可用于对靶DNA上的单个核苷酸进行引物编辑。或者或另外,TnpB多肽可用于对靶DNA上的至少2、至少3、至少4、至少5、至少6、至少7、至少8、至少10、至少11、至少12、至少13、至少14、至少15、至少16、至少17、至少18、至少19、至少20、至少21、至少22、至少23、至少24、至少25、至少26、至少27、至少28、至少29、至少30、至少40、至少50、至少60、至少70、至少80、至少90、至少100、至少200、至少300、至少400、至少500、至少600、至少700、至少800、至少900、或至少1000个核苷酸进行引物编辑。
在又另一个实施方案中,首先使用引物编辑来创建更长的3'区域(例如,20个核苷酸)。引物编辑系统和方法的实例包括Anzalone AV等人,Search-and-replace genomeediting without double-strand breaks or donor DNA,Nature.2019年10月21日doi:10.1038/s41586-019-1711-4中描述的那些,其通过引用整体并入本文。在此类情况下,系统包含具有切口酶活性的TnpB蛋白、逆转录酶结构域和DNA聚合酶、以及包含能够与靶多核苷酸杂交的结合序列和编辑序列的ωRNA分子。产生的区域可如本文所述在DNA模板上进一步延伸。后者可允许产生与通用供体序列相容的靶标非依赖性序列。
在靶多核苷酸上,TnpB蛋白能够在靶序列中产生第一次切割,并且在靶序列外产生第二次切割。在一些变体中,可以在靶位点附近进行第二次TnpB介导的切割,这可以使得延伸的DNA能够更有效地侵入。
在一些实例中,本文的TnpB蛋白的组合物和系统包含:与TnpB蛋白连接或以其他方式能够与TnpB蛋白形成复合物的逆转录酶(RT)多肽;第一ωRNA分子,其能够与TnpB蛋白形成第一TnpB-逆转录酶复合物,并且包含:ωRNA序列,其能够引导第一TnpB-逆转录酶复合物与靶多核苷酸的第一靶序列的位点特异性结合;能够与靶多核苷酸的切割链或切口链结合的第一结合位点区域;以及编码第一延伸序列的RT模板序列;第二ωRNA分子,其能够与TnpB蛋白形成第二TnpB-逆转录酶复合物,并且包含:ωRNA序列,其能够引导第二TnpB-逆转录酶复合物与靶多核苷酸的第二靶序列的位点特异性结合;能够与靶多核苷酸的切割链或切口链结合的第二结合位点区域;以及编码第二延伸序列的RT模板序列。
在一些情况下,组合物和系统还可包含:供体模板;第三ωRNA序列,其能够与TnpB蛋白形成TnpB-逆转录酶复合物-ωRNA,并且包含:ωRNA序列,其能够引导与供体模板上的靶序列的位点特异性结合;能够结合供体模板的切割链或切口链的第三结合区域;以及RT模板,其编码与在靶多核苷酸上产生的第一延伸区域互补的第三延伸区域;以及第四ωRNA序列,其能够与TnpB蛋白形成TnpB-逆转录酶复合物,并且包含:ωRNA序列,其能够引导与供体模板上的第二靶序列的位点特异性结合;能够结合供体模板的切割链或切口链的第四结合区域;以及RT模板,其编码与在靶多核苷酸上产生的第二延伸区域互补的第四延伸区域。
有利的是,TnpB复合物相对于CRISPR-Cas酶更开放的构型可以允许不仅改善与靶位点互补的序列的可及性,还改善RT模板序列和逆转录酶的可及性,这可以增加靶位点处的编辑效率。另外,TnpB的更小的尺寸允许提高逆转录酶递送的包装效率、递送额外ωRNA序列的可及性,如下文进一步详述,所有这些都可进一步改善编辑效率。
在一些情况下,组合物和系统还可包含位点特异性重组酶,并且其中第一延伸区和第二延伸区彼此互补并且引入丝氨酸整合酶重组位点;和供体分子,其包含用于插入靶多肽中的供体序列和与丝氨酸整合酶重组位点互补的重组位点。
在一些实例中,组合物和系统还可包含重组酶。重组酶与TnpB蛋白连接或者以其他方式能够与TnpB蛋白形成复合物。在某些实施方案中,复合物能够通过RT模板的延伸将重组位点插入到感兴趣的DNA基因座中,所述RT模板通过逆转录酶编码ωRNA序列的3'延伸上的重组位点。在某些实施方案中,提供了包含相容重组位点的供体模板,当还提供对重组位点具有特异性的重组酶时,所述供体模板可以与插入的重组位点单向重组。在某些实施方案中,供体模板是质粒,其包含互补重组位点和用于插入在感兴趣的DNA基因座处的任何序列。在某些实施方案中,重组酶与TnpB酶连接或能够与TnpB酶形成复合物,使得所有酶蛋白在感兴趣的基因座处接触。在某些实施方案中,针对真核细胞对重组酶进行密码子优化(本文进一步描述)。在某些实施方案中,重组酶包括NLS(本文进一步描述)。在某些实施方案中,重组酶作为单独的蛋白质提供。单独的重组酶可形成二聚体并且与供体模板重组位点结合。由于相容重组位点的插入也被重组酶识别,重组酶可靶向感兴趣的基因座。因此,重组酶可识别插入在感兴趣的DNA基因座处的重组位点和供体上的重组位点,并且在不对重组酶进行任何额外修饰的情况下靶向感兴趣的DNA基因座。
在某些实施方案中,连接至重组酶的第二TnpB复合物靶向感兴趣的DNA基因座。在某些实施方案中,第二TnpB复合物包含死亡的TnpB蛋白(dTnpB,本文进一步描述),使得重组酶靶向感兴趣的DNA基因座,但靶序列不被进一步切割。在某些实施方案中,dTnpB靶向仅在插入重组位点后产生的序列。在某些实施方案中,重组酶识别并结合供体模板重组位点和插入的重组位点。在某些实施方案中,重组酶与作为单独蛋白质提供的重组酶形成二聚体。
如本文所用,术语“重组酶”是指催化两个或更多个重组位点(例如,受体和供体位点)之间的重组的酶。可用于本发明的重组酶在特定重组位点处催化重组,所述特定重组位点是被特定重组酶识别的特定多核苷酸序列。“单向重组酶”或“整合酶”是指其识别位点在重组发生后被破坏的重组酶。术语“整合酶”是指重组酶的一种类型。换句话说,重组酶识别的序列在重组后变成重组酶不识别的序列。因此,一旦序列通过单向重组酶进行重组,重组酶的连续存在就不能逆转先前的重组事件。
“重组位点”是被本文所述的重组酶识别的特定多核苷酸序列。通常,涉及两个不同的位点(就重组而言,称为“互补位点”),一个存在于靶核酸(例如,真核生物的染色体或附加体)中,另一个存在于靶重组位点处的待整合的核酸上。本文使用的术语“attB”和“attP”分别指代最初来源于细菌靶标(细菌的附着位点)和噬菌体供体(噬菌体的附着位点)的附着(或重组)位点,但特定酶的重组位点可具有不同的名称。两个附着位点可以共享与几个碱基对一样少的序列同一性。重组位点通常包括被核心区或间隔区分开的左臂和右臂。因此,attB重组位点由BOB'组成,其中B和B'分别是左臂和右臂,并且O是核心区。类似地,attP是POP',其中P和P'是臂,并且O又是核心区。当attB与attP位点之间发生重组并且同时核酸整合至靶标后,侧接整合DNA的重组位点被称为“attL”和“aatR”。使用上述术语,attL和attR位点因此分别由BOP'和POB'组成。在本文的一些表示中,省略了“O”,并且attB和attP例如分别被指定为BB'和PP'。
TnpB相关转座酶系统
本文的系统和组合物可包含TnpB、一种或多种核酸组分、以及转座酶的一种或多种组分。在一个示例性实施方案中,TnpB介导RNA指导的TnpA催化的转座。在一个示例性实施方案中,TnpB介导RNA指导的Tn7催化的转座。
在示例性实施方案中,转座酶可包含TnpA。转座酶可以是IS200/IS605家族的Y1转座酶,其由来自幽门螺杆菌的插入序列(IS)IS608编码(例如TnpAIS608)、由来自抗辐射异常球菌的插入序列(IS)IS608编码(例如ISDra2)、由来自产氢盐厌氧菌或来自硫磺矿硫化叶菌的插入序列(IS)IS608编码。转座酶的实例包括Barabas,O.,Ronning,D.R.,Guynet,C.,Hickman,A.B.,TonHoang,B.,Chandler,M.和Dyda,F.(2008)Mechanism of IS200/IS605 family DNA transposases:activation and transposon-directed target siteselection.Cell,132,208–220;Sadler等人,Genes 2020,11,484,doi:10.3390/genes11050484以及He等人,(2013)NAR,41:5,3302-3313中描述的那些。在某些示例性实施方案中,转座酶是单链DNA转座酶。在某些示例性实施方案中,单链DNA转座酶是TnpA或其功能片段。在一个方面,用于归巢至插入位点的TnpA基序与TnpB的TAM至少50%、75%或100%互补,使得TnpA催化的转座可以发生在序列的TAM部分处或附近。
在一些实例中,一种或多种转座酶或转座酶亚基是Tn7转座酶或衍生自Tn7转座酶。在特定的实施方案中,Tn7或TN7样转座酶可以是Tn5053转座酶。例如,Tn5053转座酶包括Minakhina S等人,Tn5053 family transposons are res site hunters sensingplasmidal res sites occupied by cognate resolvases.Mol Microbiol.1999年9月;33(5):1059-68;和Partridge SR等人,Mobile Genetic Elements Associated withAntimicrobial Resistance,Clin Microbiol Rev.2018年8月1日;31(4)的图4和相关文本中的那些,所述两篇文献通过引用整体并入本文。在一些情况下,一种或多种Tn5053转座酶可包含TniA、TniB和TniQ中的一种或多种。TniA也称为TnsB。TniB也称为TnsC。TniQ也称为TnsD。因此,在一个实施方案中,这些Tn5053转座酶亚基可分别称为TnsB、TnsC和TnsD。在某些情况下,一种或多种转座酶可包含TnsB、TnsC和TnsD。
在一个实施方案中,转座酶可以是一种或多种霍乱弧菌Tn6677转座酶。在一个实例中,转座子可包括包含tnsA、tnsB和tnsC基因的末端操纵子。转座子还可包含tniQ基因。在一个实施方案中,转座子中可不存在TnsE。
在某些实例中,转座酶包括Mu转座酶、TniQ、TniB或其功能结构域中的一种或多种。在某些实例中,转座酶包括TniQ、TniB、TnpB或其功能结构域中的一种或多种。在某些实例中,转座酶包括rve整合酶、TniQ、TniB或其功能结构域中的一种或多种。
在一个实施方案中,所述系统(更特别地,转座酶)不包括rve整合酶。在一个实施方案中,所述系统(更特别地,转座酶)不包括Mu转座酶、TniQ、TniB、TnpB、IstB结构域或其功能结构域中的一种或多种。
在某些实例中,转座酶包括Mu转座酶、TniQ、TniB或其功能结构域中的一种或多种。在某些实例中,转座酶包括TniQ、TniB、TnpB或其功能结构域中的一种或多种。在某些实例中,转座酶包括rve整合酶、TniQ、TniB、TnpB结构域或其功能结构域中的一种或多种。
右端序列元件或左端序列元件是参考示例性Tn7转座子制成的。建立了规范Tn7的左端(LE)和右端(RE)序列元素的一般结构。Tn7末端包含一系列22-bp TnsB结合位点。侧接最远端TnsB结合位点的是以5'-TGT-3'/3'-ACA-5'结尾的8-bp末端序列。Tn7的右端含有在约90-bp的右端元件中的四个重叠的TnsB结合位点。左端含有分散在元件的约150-bp的左端中的三个TnsB结合位点。TnsB结合位点的数量和分布在Tn7样元件之间可以有所不同。Tn7相关元件的末端序列可以通过鉴定直接重复的5-bp靶位点重复、末端8-bp序列和22-bpTnsB结合位点来确定(Peters JE等人,2017)。示例性Tn7元件(包括右端序列元件和左端序列元件)包括Parks AR,Plasmid,2009年1月;61(1):1-14中描述的那些。
TnpB重组酶/整合酶系统
本文的系统和组合物可包含TnpB系统和重组酶或整合酶的一种或多种组分。在一个方面,TnpB是天然催化失活的并且与一种或多种核酸组分一起利用以提供位点特异性靶向,并且与重组酶的一种或多种组分一起利用以引入修饰。在一个方面,TnpB多肽可以经由催化结构域(例如RuvC)的一个或多个残基的突变或经由截短而催化失活,并且与一种或多种核酸组分一起利用以提供位点特异性靶向,并且与重组酶的一种或多种组分一起利用以引入修饰。在一个实施方案中,天然失活的TnpB提供有重组酶,例如整合酶,以及任选的逆转录酶。本文的系统和组合物可包含TnpB多肽、一种或多种核酸组分、以及整合酶的一种或多种组分。在一个方面,TnpB多肽是切口酶,并且与一种或多种核酸组分一起利用以提供位点特异性靶向,其中整合酶的一种或多种组分引入修饰。系统和组合物可用于将供体多核苷酸插入靶多核苷酸。系统和组合物还可包含供体多核苷酸。
在优选的实施方案中,重组酶介导单向位点特异性重组。在一个实施方案中,重组酶是丝氨酸重组酶(SR),也称为丝氨酸整合酶,由例如IS607家族、Tn4451和噬菌体phiC31编码。一般参见,Smith MC,Thorpe HM:Diversity in the serine recombinases.MolMicrobiol.2002,44:299-307.10.1046/j.1365-2958.2002.02891.x;Li等人,(2018)J.Mol.Biol.430:21,4401-4418。
在实施方案中,重组酶是由IS91、螺旋子(helitron)、IS200/IS605、Crypton或DIRS-逆转录转座子家族编码的酪氨酸重组酶(YR)。一般参见,Goodwin TJ,Butler MI,Poulter T:Cryptons:a group of tyrosine-recombinase-encoding DNA transposonsfrom pathogenic fungi.Microbiology.2003,149:3099-3109.Doi:10.1099/mic.0.26529-0;Cappello J,Handelsman K,Lodish HF:Sequence of DictyosteliumDIRS-1:an apparent retrotransposon with inverted terminal repeats and aninternal circle junction sequence.Cell.1985,43:105-115.10.1016/0092-8674(85)90016-9。
在一个方面,重组酶提供了可与组合物一起提供的模板(例如,供体寡核苷酸)的位点特异性整合。不受理论的束缚,重组酶允许不依赖于有效负载大小的整合,并且可以协调多种细胞类型之间的链交换和重新连接,从而允许长段多核苷酸的整合。在示例性实施方案中,丝氨酸重组酶是PhiC31,并且靶标是DNA。在一个方面,phiC31允许整合包含attP或假attP识别位点的靶位点。参见,例如,systembio.com/wp-content/uploads/phiC31_productsheet-1.pdf。在利用phiC231的实施方案中,供体寡核苷酸将在序列处具有attB,所述attB促进在靶基因组的attP位点上的附着。设计具有与重组酶的附着位点互补的序列的供体寡核苷酸的类似方法可以设计用于本发明。参见,例如,Li等人,(2018)J.Mol.Biol.430:21,4401-4418。
在优选的实施方案中,整合酶通过用与逆转录酶和整合酶两者融合的TnpB切口酶引导插入来介导不同基因座处的基因整合。在一个实施方案中,整合酶是丝氨酸整合酶,编码例如BxbINT。一般参见Ioannidi等人,“Drag-and-drop genome insertion without DNAcleavage with CRISPR-directed integrases”;doi:10.1101/2021.11.01.466786m,其通过引用整体并入本文。在Ioannidi、Gootenberg、Abudayyeh及其同事示出了使用与逆转录酶和丝氨酸整合酶融合的CRISPR-Cas9切口酶进行的整合,称为经由位点特异性靶向元件的可编程添加(PASTE),以及利用包含AttB着陆位点的指导RNA,经由单剂量的具有非分裂细胞和原代细胞功能的质粒进行递送,所述指导RNA称为含有附着位点的指导RNA,其用于插入序列,包括可以插入到不同基因座中的不同货物序列,其大小不等,最大可达约36kb。PASTE系统的其他用途包括基因标记、基因替换、基因递送以及蛋白质生产和分泌,这些方法考虑与TnpB切口酶和整合酶方法一起使用。在一个方面,ωRNA可包含AttB着陆位点。在一个方面,重组酶提供了可与组合物一起提供的模板(例如,供体寡核苷酸)的位点特异性整合。
其他的大丝氨酸整合酶可以与TnpB多肽一起使用,例如,如Durrant等人,Large-scalediscovery of recombinases for integrating DNA into the human genome,doi:10.1101/2021.11.05.467528中所鉴定和描述的,其通过引用并入本文。其他整合酶包括BceINT、SscINT、SacINT。参见Ioannidi,2021的图6d和图10a。
不受理论的束缚,重组酶允许不依赖于有效负载大小的整合,并且可以协调多种细胞类型之间的链交换和重新连接,从而允许长段多核苷酸的整合。在示例性实施方案中,整合酶是BxbINT并且靶标是DNA。在一个方面,BxbINT允许整合包含attP或假attP识别位点的靶位点。在利用BxbINT的实施方案中,供体寡核苷酸将在序列处具有attB,所述attB促进在靶基因组的attP位点上的附着。设计具有与整合酶附着位点互补的序列的供体寡核苷酸的类似方法可以设计用于本发明,例如含有AttP附着位点的环状双链DNA模板,或经由腺病毒或其他病毒载体递送大货物,如本文别处所述。参见,例如,Ioannidi等人,2021的图1a、图1b和图5b。
TnpB拓扑异构酶系统
一种或多种功能结构域可以是一种或多种拓扑异构酶结构域。拓扑异构酶是一类经由核酸链的断裂和重新接合来改变DNA拓扑状态的酶。在一些情况下,拓扑异构酶可以是DNA拓扑异构酶,它是一种在转录期间控制并改变DNA拓扑状态,并且催化DNA单链的瞬时断裂和重新接合,以允许链彼此穿过,从而改变DNA的拓扑结构的酶。
在一个实施方案中,拓扑异构酶结构域能够将供体多核苷酸与靶多核苷酸连接。连接可通过粘性末端或平末端连接来实现。在一个实例中,供体多核苷酸可包含突出端,所述突出端包含与靶多核苷酸的区域互补的序列。将供体多核苷酸与靶多核苷酸连接的实例包括TOPO克隆的那些,例如,在www.thermofisher.com/us/en/home/life-science/cloning/topo/topo-resources/the-technology-behind-topo-cloning.html的“TheTechnology Behind TOPO Cloning”中描述的那些。
在一个实施方案中,拓扑异构酶结构域可以与供体多核苷酸缔合。例如,拓扑异构酶结构域与供体多核苷酸共价连接。在一个实施方案中,拓扑异构酶结构域可以与TnpB或其变体一起提供,例如与之缔合(例如,融合)。
或者或另外,拓扑异构酶结构域可以位于与TnpB多肽不同的分子上。在一些情况下,拓扑异构酶结构域可以与供体多核苷酸缔合。例如,拓扑异构酶结构域可以与供体DNA分子共价预装载。此种设计可允许仅有效连接特定的货物。拓扑异构酶结构域可将供体多核苷酸(例如,DNA分子)连接至靶多核苷酸上的靶位点(例如,游离的双链DNA末端)。在一个实施方案中,供体多核苷酸可具有突出端,所述突出端包含与靶多核苷酸的区域互补的序列。例如,突出端可在tnpB多肽产生的切割位点处侵入靶多核苷酸。
拓扑异构酶的实例包括I型拓扑异构酶,包括IA型和IB型拓扑异构酶,其切割双链核酸分子的单链,以及II型拓扑异构酶(例如,旋转酶(gyrase)),其切割双链核酸分子的两条链。
IA型和IB型拓扑异构酶切割双链核酸分子的一条链。在一些实例中,IA型拓扑异构酶对双链核酸分子的切割在切割位点产生5'磷酸和3'羟基,其中IA型拓扑异构酶共价结合至切割链的5'末端。IB型拓扑异构酶对双链核酸分子的切割可在切割位点产生3'磷酸和5'羟基,其中IB型拓扑异构酶共价结合至切割链的3'末端。
IA型拓扑异构酶的实例包括大肠埃希氏菌拓扑异构酶I、大肠埃希氏菌拓扑异构酶III、真核拓扑异构酶II、古细菌逆旋转酶、酵母拓扑异构酶III、果蝇拓扑异构酶III、人拓扑异构酶III、肺炎链球菌拓扑异构酶III等,包括其他IA型拓扑异构酶。酶与5'-胸苷残基共价结合,形成DNA-蛋白质加合物,其中在两个胸苷残基之间发生切割。
IB型拓扑异构酶的实例包括所有真核细胞中存在的核I型拓扑异构酶以及由牛痘和其他细胞痘病毒编码的那些。真核IB型拓扑异构酶的实例是在酵母、果蝇和哺乳动物细胞(包括人类细胞)中表达的那些。病毒IB型拓扑异构酶的实例是由脊椎动物痘病毒(牛痘、肖普纤维瘤(Shope fibroma)病毒、ORF病毒、鸡痘病毒和传染性软疣(molluscumcontagiosum)病毒)和昆虫痘病毒(桑灯蛾昆虫痘病毒(Amsacta mooreientomopoxvirus))产生的那些。
II型拓扑异构酶的实例包括细菌旋转酶、细菌DNA拓扑异构酶IV、真核DNA拓扑异构酶II和T-偶数噬菌体编码的DNA拓扑异构酶。II型拓扑异构酶可具有切割和连接活性。可以制备II型拓扑异构酶的底物双链核酸分子,使得II型拓扑异构酶可以在切割位点与一条链形成共价连接。例如,小牛胸腺II型拓扑异构酶可以切割底物双链核酸分子,所述核酸分子含有距离5'端三个核苷酸的5'凹进拓扑异构酶识别位点,导致位于切割位点5'的三个核酸分子的解离以及拓扑异构酶与双链核酸分子的5'末端的共价结合。此外,当此种带有II型拓扑异构酶的双链核酸分子与含有3'羟基的第二核酸分子接触时,II型拓扑异构酶可以将序列连接在一起,然后从重组核酸分子中释放。
拓扑异构酶的结构分析表明,每个特定拓扑异构酶家族的成员,包括IA型、IB型和II型拓扑异构酶,与所述家族的其他成员具有共同的结构特征。此外,各种IB型拓扑异构酶的序列分析表明结构是高度保守的,特别是在催化结构域中。例如,包含314个氨基酸的牛痘拓扑异构酶的氨基酸81至314的结构域与其他IB型拓扑异构酶具有显著的同源性,并且分离的结构域具有与全长拓扑异构酶基本上相同的活性,但分离的结构域具有较慢的周转率和对识别位点的较低结合亲和力。此外,在氨基末端结构域(例如,在氨基酸残基70和72处)突变的突变体牛痘拓扑异构酶可表现出与全长拓扑异构酶相同的性质。对牛痘IB型拓扑异构酶的突变分析揭示了可以在不影响拓扑异构酶活性的情况下突变的大量氨基酸残基,并且鉴定了活性所需的若干种氨基酸。鉴于牛痘拓扑异构酶催化结构域与其他IB型拓扑异构酶之间的高度同源性,以及牛痘拓扑异构酶的详细突变分析,将认识到出于本发明的目的,IB型拓扑异构酶和具有多种氨基酸突变的IB型拓扑异构酶的分离的催化结构域可用于本发明的方法中,因此被认为是拓扑异构酶。
各种拓扑异构酶表现出一定范围的序列特异性。例如,II型拓扑异构酶可以结合多种序列,但在高度特异性的识别位点处切割。IB型拓扑异构酶可包括位点特异性拓扑异构酶,其结合并切割特定核苷酸序列(“拓扑异构酶识别位点”)。当双链核酸分子被拓扑异构酶(例如,IB型拓扑异构酶)切割时,经由在拓扑异构酶中的特定酪氨酸残基与拓扑异构酶识别位点的3'核苷酸之间形成磷酸酪氨酰键,磷酸二酯键的能量是保守的。在拓扑异构酶切割位点靠近核酸分子的3'末端的情况下,下游序列(切割位点的3')可以解离,从而留下具有与新产生的3'端共价结合的拓扑异构酶的核酸分子。
共价结合的拓扑异构酶还可以催化逆反应,例如识别序列的3'核苷酸与含有游离5'羟基的核酸分子的共价连接,IB型拓扑异构酶通过磷酸酪氨酰键与所述3'核苷酸连接。因此,已经开发了使用IB型拓扑异构酶产生重组核酸分子的方法。例如,用磷酸酶处理待克隆到此种载体中的核酸分子诸如包含cDNA文库的核酸分子、或限制性片段、或剪切的基因组DNA序列,以产生5'羟基末端,然后在允许拓扑异构酶在含有羟基的5'末端和含有共价结合的拓扑异构酶的3'末端连接核酸分子的条件下将所述核酸分子添加到线性化载体中。
牛痘病毒的实例编码314个氨基酸的I型拓扑异构酶,其能够对双链DNA进行位点特异性单链切口,并且进行5'羟基驱动的重新连接。位点特异性I型拓扑异构酶包括但不限于病毒拓扑异构酶,诸如痘病毒拓扑异构酶。痘病毒拓扑异构酶的实例包括肖普纤维瘤病毒和ORF病毒。其他位点特异性拓扑异构酶是本领域技术人员众所周知的,并且可以用于实践本发明。
牛痘拓扑异构酶的实例结合双链体DNA并且切割一条链的磷酸二酯骨架,同时表现出高水平的序列特异性。切割可发生在共有五嘧啶元件5'-(C/T)CCTT↓或易断链中的相关序列处。在一个实施方案中,易断键位于距离双链体DNA的3'端2至12bp的范围内。在另一个实施方案中,牛痘拓扑异构酶形成可切割复合物需要切割位点上游的六个双链体核苷酸和下游的两个核苷酸。
在一些实例中,拓扑异构酶是DNA拓扑异构酶I,例如牛痘病毒拓扑异构酶I。拓扑异构酶可预装载有供体多核苷酸。牛痘病毒拓扑异构酶可能需要包含5'-OH基团的靶标。
TnpB指导的切除-转座系统
本文公开的实施方案提供了一种经工程化或非自然指导的切除-转座系统。经工程化或非天然指导的切除-转座系统可包含ωRNA-TnpB系统的一种或多种组分,例如ωRNA支架和间隔子和/或TnpB多肽,以及II类转座子的一种或多种组分。ωRNA-TnpB系统的组分可以将II类转座子组分引导至靶核酸序列的逆转录转座子,并且引导其转座至受体多核苷酸中。
例如,经工程化或非天然指导的切除-转座系统可以包括(a)第一TnpB蛋白;(b)第一II类转座子多肽,其与第一TnpB蛋白偶联或者以其他方式能够与第一TnpB蛋白形成复合物;(c)第一指导分子,其能够与第一TnpB蛋白形成第一ωRNA-TnpB复合物,并且引导与第一靶多核苷酸的第一靶序列的位点特异性结合;(d)第二TnpB蛋白;(e)第二II类转座子多肽,其与第二TnpB蛋白偶联或者以其他方式能够与第二TnpB蛋白形成复合物;(f)第二指导分子,其能够与第一TnpB蛋白形成第二ωRNA-TnpB复合物,并且引导与第一靶多核苷酸的第二靶序列的位点特异性结合;以及(g)II类转座子多核苷酸,其包含第一靶多核苷酸,并且能够与第一和第二TnpB蛋白、第一和第二指导分子以及第一和第二II类转座子多肽形成复合物。
在一些实施方案中,经工程化或非天然指导的切除-转座系统可以包括(h)第三指导分子,其能够与第一TnpB蛋白复合并且引导与第二靶多核苷酸的第一靶序列的位点特异性结合,其中第三指导分子任选地与第一TnpB蛋白偶联;(i)任选地,编码第三指导分子的第一指导分子多核苷酸;(j)第四指导分子,其能够与第二TnpB蛋白复合并且引导与第二靶多核苷酸的第二靶序列的位点特异性结合,其中第四指导分子任选地与第二TnpB蛋白偶联;以及(k)任选地,编码第四指导分子的第二指导分子多核苷酸。
在一些实施方案中,第一和第二II类转座子多肽能够从II类转座子多核苷酸切除第一靶多核苷酸。在一些实施方案中,第一和第二II类转座子多肽能够将第一靶多核苷酸转座到第二靶多核苷酸中。在一些实施方案中,第一靶多核苷酸不包括一个或多个II类转座子长末端重复。
本文所述的经工程化或非天然指导的切除-转座系统可以基于II类转座子或II类转座子系统。经工程化或非天然指导的切除-转座系统可包括第一靶多核苷酸(也称为供体多核苷酸或转座子)和第二靶多核苷酸(在本文中也称为受体多核苷酸)。如本文所用,“转座子”(也称为转座元件)是指能够从基因组中的位置移动至另一个位置的多核苷酸序列。存在若干类转座子。转座子包括逆转录转座子(I类转座子)和DNA转座子(II类转座子)。在一些情况下,逆转录转座子需要多核苷酸的转录,所述多核苷酸被移动(或转座)以便将所述多核苷酸转座至新的基因组或多核苷酸。DNA转座子是不需要多核苷酸的逆转录的那些,所述多核苷酸被移动(或转座)以便将所述多核苷酸转座至新的基因组或多核苷酸。
可以使用任何合适的转座子系统。合适的转座子及其系统可以包括但不限于睡美人转座子系统(Tc1/mariner超家族)(参见,例如,Ivics等人1997.Cell.91(4):501-510)、piggyBac(piggyBac超家族)(参见,例如,Li等人2013 110(25):E2279-E2287和Yusa等人2011.PNAS.108(4):1531-1536)、Tol2(超家族hAT)、青蛙王子(Frog Prince)(Tc1/mariner超家族)(参见,例如,Miskey等人2003Nucleic Acid Res.31(23):6873-6881)及其变体。
在一些实施方案中,第一和/或第二II类转座子多肽是DD[E/D]转座子或转座子多肽。在一些实施方案中,第一和/或第二II类转座子多核苷酸是Tc1/mariner、PiggyBac、青蛙王子、Tn3、Tn5、hAT、CACTA、P、Mutator、PIF/Harbinger、Transib、或Merlin/IS1016转座子多核苷酸。在一些实施方案中,第一和/或第二II类转座子多肽是Tc1/mariner、PiggyBac、青蛙王子、Tn3、Tn5、hAT、CACTA、P、Mutator、PIF/Harbinger、Transib、或Merlin/IS1016转座子多肽。
可以利用的合适的II类转座子系统和组分还可以是并且不限于以下中描述的那些,例如但不限于Han等人,2013.BMC Genomics.14:71,doi:10.1186/1471-2164-14-71,Lopez和Garcia-Perez.2010.Curr.Genomics.11(2):115-128;Wessler.2006.PNAS.103(47):176000-17601;Gao等人,2017.Marine Genomics.34:67-77;Bradic等人2014.MobileDNA.5(12)doi:10.1186/1759-8753-5-12;Li等人,2013.PNAS.110(25)E2279-E2287;Kebriaei等人2017.Trends in Genetics.33(11):852-870);Miskey等人2003.NucleicAcid res.31(23):6873-6881;Nicolas等人2015.Microbiol Spectr.3(4)doi:10.1128/microbiolspec.MDNA3-0060-2014);W.S.Reznikoff.1993.Annu Rev.Microbiol.47:945-963;Rubin等人2001.Genetics.158(3):949-957;Wicker等人2003.Plant Physiol.132(1):52-63;Majumdar和Rio.2015.Microbiol.Spectr.3(2)doi:10.1128/microbiolspec.MDNA3-0004-2014;D.Lisch.2002.Trends in Plant Sci.7(11):498-504;Sinzelle等人2007.PNAS.105(12):4715-4720;Han等人2014;Genome Biol.Evol.6(7):1748-1757;Grzebelus等人2006;Mol.Genet.Genomics.275(5):450-459;Zhang等人2004.Genetics.166(2):971-986;Chen和Li.2008.Gene.408(1-2):51-63;以及C.Feschotte.2004.Mol.Biol.Evol.21(9):1769-1780。
TnpB逆转录转座子系统
本文的系统和组合物可包含TnpB、一种或多种核酸组分、以及逆转录转座子(例如,非LTR逆转录转座子)的一种或多种组分。逆转录转座子的一种或多种组分包括逆转录转座子蛋白和逆转录转座子RNA。系统和组合物可用于将供体多核苷酸插入靶多核苷酸。系统和组合物还可包含供体多核苷酸。
在一些实例中,本公开提供了一种经工程化、非天然存在的组合物,其包含:TnpB多肽;非LTR逆转录转座子蛋白,其与TnpB多肽缔合或以其他方式能够与TnpB多肽形成复合物;单一核酸组分,其能够与TnpB多肽形成复合物并且引导与靶多核苷酸的靶序列的位点特异性结合。组合物还可包含供体构建体,所述供体构建体包含供体多核苷酸,所述供体多核苷酸用于插入至靶多核苷酸,并且位于能够与非LTR逆转录转座子蛋白形成复合物的两个结合元件之间。在一些情况下,TnpB多肽经工程化以具有切口酶活性。
在一些实例中,TnpB多肽融合至非LTR逆转录转座子蛋白的N末端。在一些实例中,TnpB多肽融合至非LTR逆转录转座子蛋白的C末端。
核酸组分分子可将融合蛋白引导至位于靶向插入位点5'的靶序列,并且其中TnpB多肽在靶向插入位点处产生双链断裂。核酸组分分子可将融合蛋白引导至位于靶向插入位点3'的靶序列,并且其中TnpB多肽在靶向插入位点处产生双链断裂。
供体多核苷酸还可包含聚合酶加工元件以促进供体多核苷酸序列的3'端加工。聚合酶可以是DNA聚合酶,例如DNA聚合酶I。在一些实例中,聚合酶可以是RNA聚合酶。
在一些实例中,供体多核苷酸还包含与供体构建体5'端、供体构建体3'端或两者上的靶序列同源的区域。在一些实例中,同源区的长度为1至50、5至30、8至25,例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个碱基对。
天然或野生型非LTR逆转录转座子编码其自我动员所必需的蛋白质机制。非LTR逆转录转座子元件包含整合到宿主基因组中的DNA元件。此DNA元件可编码一个或两个开放阅读框(ORF)。例如,家蚕(Bombyx mori)的R2元件编码含有逆转录酶(RT)活性的单个ORF和限制性酶样(REL)结构域。L1元件编码两种ORF,即ORF1和ORF2。ORF1含有参与蛋白质-蛋白质相互作用的亮氨酸拉链结构域和C末端核酸结合结构域。ORF2具有N末端无嘌呤/无嘧啶核酸内切酶(APE)、中央RT结构域和C末端富含半胱氨酸组氨酸的结构域。非LTR逆转录转座子的示例性复制周期可包括全长逆转录转座子元件的转录以产生mRNA活性元件(逆转录转座子RNA)。活性元件mRNA被翻译以产生编码的逆转录转座子蛋白或多肽。形成包含活性元件和逆转录转座子蛋白或多肽的核糖核蛋白复合物,并且此RNP促进将活性元件整合到基因组中。RNA-转座酶复合物对基因组进行切口。经切口的DNA的3'端用作引物,以允许转座子RNA逆转录成cDNA。第四,转座酶蛋白将cDNA整合到基因组中。
这些系统的元件可以被工程化以在本发明的背景中起作用。例如,非LTR逆转录转座子多肽可融合至位点特异性核酸酶。允许非LTR逆转录转座子多肽与天然逆转录转座子DNA元件结合的结合元件可被工程化到供体构建体中,以促进供体多核苷酸序列进入靶多肽中。
在本发明中,非LTR逆转录转座子的蛋白质组分可连接至位点特异性核酸酶(例如TnpB多肽),或者以其他方式工程化以与位点特异性核酸酶形成复合物。逆转录转座子RNA可被工程化以编码供体多核苷酸序列。因此,在某些示例性实施方案中,经由TnpB多肽与核酸组分分子序列形成TnpB多肽复合物,TnpB多肽将逆转录转座子复合物(例如,逆转录转座子多肽和逆转录转座子RNA)引导至靶多核苷酸中的靶序列,其中逆转录转座子RNP复合物促进供体多核苷酸序列整合至靶多核苷酸中。因此,一种或多种非LTR逆转录转座子组分可包含逆转录转座子多肽或其功能结构域,其促进逆转录转座子RNA的结合、逆转录转座子RNA逆转录成cDNA、和/或供体多核苷酸整合至靶多核苷酸中,以及经修饰以编码供体多核苷酸序列的逆转录转座子RNA元件。
非LTR逆转录转座子的实例包括CRE、R2、R4、L1、RTE、Tad、R1、LOA、I、Jockey、CR1。在一个实例中,非LTR逆转录转座子是R2。在另一个实例中,非LTR逆转录转座子是L1。非LTR逆转录转座子的实例可包括以下中描述的那些:Christensen SM等人,RNA from the 5'end of the R2 retrotransposon controls R2 protein binding to and cleavage ofits DNA target site,Proc Natl Acad Sci U S A.2006年11月21日;103(47):17602-7;Eickbush TH等人,Integration,Regulation,and Long-Term Stability of R2Retrotransposons,Microbiol Spectr.2015年4月;3(2):MDNA3-0011-2014.doi:10.1128/microbiolspec.MDNA3-0011-2014;Han JS,Non-long terminal repeat(non-LTR)retrotransposons:mechanisms,recent developments,and unanswered questions,MobDNA.2010年5月12日;1(1):15.doi:10.1186/1759-8753-1-15;Malik HS等人,The age andevolution of non-LTR retrotransposable elements,Mol Biol Evol.1999年6月;16(6):793-805,所述文献通过引用整体并入本文。
非LTR逆转录转座子多肽的实例还包括来自华支睾吸虫(Clonorchis sinensis)或白喉带鹀(Zonotrichia albicollis)的R2。
非LTR逆转录转座子可包含多个逆转录转座子多肽或编码所述多肽的多核苷酸。在一个实施方案中,逆转录转座子多肽可形成复合物。例如,非LTR逆转录转座子是二聚体,例如,包含形成二聚体的两个逆转录转座子多肽。二聚体亚基可连接或形成串联融合体。TnpB多肽可以与此种复合物的一个或多个亚基缔合(例如,连接)。在一些实例中,非LTR逆转录转座子是两个逆转录转座子多肽的二聚体;逆转录转座子多肽之一包含核酸酶或切口酶活性并且与TnpB多肽连接。
逆转录转座子多肽可包含一种或多种修饰,以例如增强供体多核苷酸识别、靶标引发的模板识别(TPTR)的特异性或效率。逆转录转座子多肽还可包含一处或多处截短或切除以去除野生型蛋白质的结构域或区域,以获得保留供体多核苷酸识别和TPTR的最小多肽。在一些示例性实施方案中,天然核酸内切酶活性可被突变以消除核酸内切酶活性。
在某些示例性实施方案中,非LTR逆转录转座子肽的修饰或截短可以在锌指区域、Myb区域、碱性区域、逆转录酶结构域、富含半胱氨酸-组氨酸的基序或核酸内切酶结构域中。
非LTR逆转录转座子可包含编码一种或多种逆转录转座子RNA分子的多核苷酸。多核苷酸可包含一个或多个调控元件。调控元件可以是启动子。多核苷酸上的调控元件和启动子包括整篇本申请中描述的那些。例如,多核苷酸可包含pol2启动子、pol3启动子或T7启动子。
在一些情况下,多核苷酸编码逆转录转座子RNA,所述逆转录转座子RNA的序列的至少一部分与靶序列互补。例如,逆转录转座子RNA的3'端可以与靶序列互补。RNA可以与经切口的靶序列的一部分互补。在一个实施方案中,逆转录转座子RNA可包含一种或多种供体多核苷酸。在某些情况下,逆转录转座子RNA可编码一种或多种供体多核苷酸。
逆转录转座子RNA可能能够结合逆转录转座子多肽。此种逆转录转座子RNA可包含一种或多种用于结合逆转录转座子多肽的元件。结合元件的实例包括发夹结构、假结(例如,含有至少两个茎环结构的核酸二级结构,其中一个茎的一半嵌入另一个茎的两半之间)、茎环和凸起(例如,位于核酸双链体的一条链内的不配对的核苷酸段)。在某些实例中,逆转录转座子RNA包含一个或多个发夹结构。在一些实例中,逆转录转座子RNA包含一个或多个假结。在某些实例中,逆转录转座子RNA包含编码供体多核苷酸的序列以及用于与逆转录转座子多肽形成复合物的一种或多种结合元件。结合元件可以位于5'端或3'端。
在一个实施方案中,逆转录转座子RNA包含能够与靶位点处的靶多核苷酸的突出端杂交的区域。突出端可以是一段单链DNA。突出端可充当用于将逆转录转座子RNA的至少一部分逆转录成cDNA的引物。在一些情况下,cDNA的区域可能能够与靶多核苷酸的第二突出端杂交。第二突出端可充当用于合成第二链以产生双链cDNA的引物。cDNA可包含供体多核苷酸序列。两个突出端可来自靶多核苷酸的不同链。
逆转录酶结构域
一种或多种功能结构域可以是一种或多种逆转录酶结构域。在一些实施方案中,系统包含用于修饰靶多核苷酸的工程化系统,其包含:TnpB蛋白或其变体(例如,dTnpB);逆转录酶(RT)结构域;RNA模板,其包含或编码待插入到靶多核苷酸的靶序列的供体多核苷酸;和ωRNA分子(即,包含用于重新编程的支架的天然单一指导RNA分子)。
逆转录酶可基于RNA模板产生单链DNA。单链DNA可以由非逆转录子、逆转录子或多样性产生逆转录元件(DGR)产生。在一些实例中,单链DNA可以由自我引发的RNA模板产生。自我引发的RNA模板可用于产生DNA而无需单独的引物。
逆转录酶结构域可以是逆转录酶或其片段。本发明的替代实施方案中可使用多种逆转录酶(RT),包括原核和真核RT,前提条件是RT在宿主内发挥作用以从RNA模板产生供体多核苷酸序列。如果期望,可修饰天然RT的核苷酸序列,例如使用已知的密码子优化技术,使得优化在期望宿主内的表达。逆转录酶(RT)是一种用于从RNA模板产生互补DNA(cDNA)的酶,这个过程称为逆转录。逆转录酶被逆转录病毒用来复制其基因组,被逆转录转座子移动遗传元件用来在宿主基因组内增殖,被真核细胞用来延长其线性染色体末端的端粒,并且被一些非逆转录病毒(诸如乙型肝炎病毒(嗜肝DNA病毒科的成员,其是dsDNA-RT病毒))使用。逆转录病毒RT具有三种连续的生化活性:RNA依赖性DNA聚合酶活性、核糖核酸酶H、和DNA依赖性DNA聚合酶活性。总的来说,这些活性使酶能够将单链RNA转化为双链cDNA。在某些实施方案中,逆转录酶的RT结构域用于本发明。结构域可以仅包括RNA依赖性DNA聚合酶活性。在一些实例中,RT结构域是非诱变的,即,不引起供体多核苷酸的突变(例如,在逆转录酶过程期间)。在一些实例中,RT结构域可以是非逆转录子RT,例如病毒RT或人内源RT。在一些实例中,RT结构域可以是逆转录子RT或DGR RT。在一些实例中,RT可以比对应的野生型RT具有更低的诱变性。在一些实施方案中,本文中的RT不具有诱变性。
逆转录子
在某些实施方案中,用于同源重组的供体模板通过使用用于逆转录的自我引发的RNA模板产生。自我引发的逆转录系统的非限制性实例是逆转录子系统。术语“逆转录子”意指编码能够合成分支RNA连接的单链DNA(msDNA)和逆转录酶的组分的遗传元件。编码msDNA的逆转录子是本领域已知的,例如但不限于美国专利号6,017,737;美国专利号5,849,563;美国专利号5,780,269;美国专利号5,436,141;美国专利号5,405,775;美国专利号5,320,958;CA 2,075,515;所述专利全部通过引用并入本文。
在某些实施方案中,逆转录酶结构域是逆转录子RT结构域。在某些实施方案中,RNA模板编码被逆转录子逆转录酶结构域识别并逆转录的逆转录子RNA模板。逆转录子在许多细菌物种中是保守的,是功能相对未知的高效逆转录系统。逆转录子系统由逆转录子RT蛋白以及msr和msd转录物组成,msr和msd转录物分别充当引物和模板序列。逆转录子系统的所有组分从单个开放阅读框表达为单个转录物,所述转录物包括msr-msd并且编码逆转录子RT蛋白(Lampson等人,2005,Retrons,msDNA,and the bacterial genome.CytogenetGenome Res 110:491–499)。逆转录子的msr元件ORF提供msDNA分子的RNA部分,而msd元件ORF提供msDNA分子的DNA部分。msr-msd区域的初级转录物被认为作为模板和引物两者以产生msDNA。msDNA的合成是从RNA转录物的内部rG残基、使用其2'-OH基团引发的。还可以对msd或msr进行修饰以允许将编码供体多核苷酸的RNA模板插入至msd内而不改变msDNA的功能或产生。编码供体多核苷酸序列的RNA模板可以是任何长度,但优选小于约5kb核苷酸,或者还小于约2kb,或者还小于500个碱基,前提条件是产生msDNA产物。
TnpB多样性产生逆转录元件系统
在某些实施方案中,一种或多种功能结构域可以是多样性产生逆转录元件(例如,US20100041033A1中描述的DGR)。在一些实施方案中,DGR可使用其归巢机制插入供体多核苷酸。例如,DGR可以与催化失活的TnpB蛋白(例如,死亡的TnpB)缔合,并且使用归巢机制来整合单链DNA。在一些实例中,DGR可以比对应的野生型DGR具有更低的诱变性。在一些实例中,DGR不容易出错。在一些实施方案中,本文中的DGR不具有诱变性。非诱变性DGR可以是野生型DGR的突变体。如本文所用,术语“DGR”涵盖多样性产生逆转录元件多核苷酸和由多样性产生逆转录元件多核苷酸编码的蛋白质。在一些实例中,DGR可以是由具有逆转录酶活性的多样性产生逆转录元件多核苷酸编码的蛋白质。在一些实例中,DGR可以是由具有逆转录酶活性和整合酶活性的多样性产生逆转录元件多核苷酸编码的蛋白质。在一些情况下,模板或供体多核苷酸可以由多样性产生逆转录元件多核苷酸编码。在某些情况下,模板可以是与多样性产生逆转录元件多核苷酸不同的多核苷酸,例如,作为单独的构建体或分子提供。
在一些实施方案中,本文的DGR还可包括II组内含子(以及编码的任何蛋白质和多核苷酸),它们是可移动核酶,从前体RNA自我剪接以产生切除的内含子套索RNA,所述套索RNA然后通过反向剪接侵入新的基因组DNA位点。II组内含子的实例包括Lambowitz AM等人,Group II Introns:Mobile Ribozymes that Invade DNA,Cold Spring HarbPerspect Biol.2011年8月;3(8):a003616中描述的那些。
在一些实施方案中,多样性产生逆转录元件(DGR)是可以在携带这些元件的基因组中产生靶向的大量变异的遗传元件。在一些实施方案中,DGR系统依赖于易错的逆转录酶,从模板区(TR)产生诱变的cDNA(含有A至N突变),以替换与TR区类似的被称为可变区(VR)的区段—这个过程被称为诱变逆转录归巢(mutagenic retrohoming)(参见,例如,Sharifi和Ye,MyDGR:a server for identification and characterization ofdiversity-generating retroelements.Nucleic Acids Res.2019年7月2日;47(W1):W289–W294)。DGR可包括产生DNA序列多样性的独特逆转录元件家族。它们广泛存在于细菌、古细菌、噬菌体和质粒中,并通过引入变异和加速靶蛋白的进化而使宿主受益(参见,例如,Yan等人,Discovery and characterization of the evolution,variation andfunctions of diversity-generating retroelements using thousands of genomesand metagenomes.BMC Genomics.2019;20:595)。第一DGR是在博德特氏菌噬菌体BPP-1中发现的。博德特氏菌引起人类和许多其他哺乳动物的呼吸道感染,由BvgAS信号转导系统控制。由于感染周期中的动态基因表达,博德特氏菌的表面变化很大。BPP-1对博德特氏菌的侵入依赖于噬菌体尾部纤维蛋白Mtd。通过诱变逆转录和cDNA整合的过程,DGR可将多个核苷酸取代引入至Mtd基因,并产生不同的受体结合分子,从而使BPP-1具有侵入不同细胞表面的博德特氏菌的能力。
所述系统可用于使用逆转录子RT或DGR RT来产生ssDNA供体,然后使用TnpB多肽在靶切割或切口时通过同源重组来整合所述供体。在一些实施方案中,系统可以包含DGR和/或II组内含子逆转录酶。DGR或II组内含子的归巢机制可用于修饰靶多核苷酸。DGR或II组内含子逆转录酶可通过栓系至核酸酶死亡的TnpB多肽、TALE或ZF蛋白而被指导至靶多核苷酸。在另一个实施方案中,非逆转录子/DGR逆转录酶(例如,病毒RT)可用于产生自我引发RNA的cDNA。在一些实施方案中,可通过RT来产生ssDNA,但使用死亡的TnpB酶将其整合,从而产生可接近的R环而不是切口/切割。
TnpB拓扑异构酶系统
一种或多种功能结构域可以是一种或多种拓扑异构酶结构域。在一些实施方案中,用于修饰靶多核苷酸的工程化系统包含:TnpB蛋白;拓扑异构酶结构域;和核酸模板,所述核酸模板包含或编码待插入至靶多核苷酸的靶序列的供体多核苷酸。在一些实例中,TnpB蛋白;拓扑异构酶结构域;和核酸模板中的两种或更多种可形成复合物。在一些实例中,TnpB蛋白;拓扑异构酶结构域中的两种或更多种可包含在融合蛋白中。
拓扑异构酶是一类经由核酸链的断裂和重新接合来改变DNA拓扑状态的酶。在一些情况下,拓扑异构酶可以是DNA拓扑异构酶,它是一种在转录期间控制并改变DNA拓扑状态,并且催化DNA单链的瞬时断裂和重新接合,以允许链彼此穿过,从而改变DNA的拓扑结构的酶。
在一些实施方案中,拓扑异构酶结构域能够将供体多核苷酸与靶多核苷酸连接。连接可通过粘性末端或平末端连接来实现。在一个实例中,供体多核苷酸可包含突出端,所述突出端包含与靶多核苷酸的区域互补的序列。将供体多核苷酸与靶多核苷酸连接的实例包括TOPO克隆的那些,例如,在www.thermofisher.com/us/en/home/life-science/cloning/topo/topo-resources/the-technology-behind-topo-cloning.html的“TheTechnology Behind TOPO Cloning”中描述的那些。
在一些实施方案中,拓扑异构酶结构域可以与供体多核苷酸缔合。例如,拓扑异构酶结构域与供体多核苷酸共价连接。
在一些实施方案中,拓扑异构酶结构域可以与TnpB蛋白(例如,TnpB蛋白或其变体,诸如死亡的TnpB或TnpB切口酶)一起提供,例如与之缔合(例如,融合)。或者或另外,拓扑异构酶结构域可以位于与TnpB蛋白不同的分子上。在一些情况下,拓扑异构酶结构域可以与供体多核苷酸缔合。例如,拓扑异构酶结构域可以与供体DNA分子共价预装载。此种设计可允许仅有效连接特定的货物。拓扑异构酶结构域可将供体多核苷酸(例如,DNA分子)连接至靶多核苷酸上的靶位点(例如,游离的双链DNA末端)。在一些实施方案中,供体多核苷酸可具有突出端,所述突出端包含与靶多核苷酸的区域互补的序列。例如,突出端可在TnpB蛋白产生的切割位点处侵入靶多核苷酸。
拓扑异构酶的实例包括I型拓扑异构酶,包括IA型和IB型拓扑异构酶,其切割双链核酸分子的单链,以及II型拓扑异构酶(例如,旋转酶),其切割双链核酸分子的两条链。
IA型和IB型拓扑异构酶切割双链核酸分子的一条链。在一些实例中,IA型拓扑异构酶对双链核酸分子的切割在切割位点产生5'磷酸和3'羟基,其中IA型拓扑异构酶共价结合至切割链的5'末端。IB型拓扑异构酶对双链核酸分子的切割可在切割位点产生3'磷酸和5'羟基,其中IB型拓扑异构酶共价结合至切割链的3'末端。
IA型拓扑异构酶的实例包括大肠埃希氏菌拓扑异构酶I、大肠埃希氏菌拓扑异构酶III、真核拓扑异构酶II、古细菌逆旋转酶、酵母拓扑异构酶III、果蝇拓扑异构酶III、人拓扑异构酶III、肺炎链球菌拓扑异构酶III等,包括其他IA型拓扑异构酶。酶与5'-胸苷残基共价结合,形成DNA-蛋白质加合物,其中在两个胸苷残基之间发生切割。
IB型拓扑异构酶的实例包括所有真核细胞中存在的核I型拓扑异构酶以及由牛痘和其他细胞痘病毒编码的那些。真核IB型拓扑异构酶的实例是在酵母、果蝇和哺乳动物细胞(包括人类细胞)中表达的那些。病毒IB型拓扑异构酶的实例是由脊椎动物痘病毒(牛痘、肖普纤维瘤病毒、ORF病毒、鸡痘病毒和传染性软疣病毒)和昆虫痘病毒(桑灯蛾昆虫痘病毒)产生的那些。
II型拓扑异构酶的实例包括细菌旋转酶、细菌DNA拓扑异构酶IV、真核DNA拓扑异构酶II和T-偶数噬菌体编码的DNA拓扑异构酶。II型拓扑异构酶可具有切割和连接活性。可以制备II型拓扑异构酶的底物双链核酸分子,使得II型拓扑异构酶可以在切割位点与一条链形成共价连接。例如,小牛胸腺II型拓扑异构酶可以切割底物双链核酸分子,所述核酸分子含有距离5'端三个核苷酸的5'凹进拓扑异构酶识别位点,导致位于切割位点5'的三个核酸分子的解离以及拓扑异构酶与双链核酸分子的5'末端的共价结合。此外,当此种带有II型拓扑异构酶的双链核酸分子与含有3'羟基的第二核酸分子接触时,II型拓扑异构酶可以将序列连接在一起,然后从重组核酸分子中释放。
在一些实例中,拓扑异构酶是DNA拓扑异构酶I,例如牛痘病毒拓扑异构酶I。拓扑异构酶可预装载有供体多核苷酸。牛痘病毒拓扑异构酶可能需要包含5'-OH基团的靶标。
TnpB磷酸酶系统
本文的系统还可包含磷酸酶结构域。磷酸酶是能够从分子(例如核酸,诸如DNA)中去除磷酸基团的酶。磷酸酶的实例包括小牛肠磷酸酶、虾碱性磷酸酶、南极磷酸酶和APEX碱性磷酸酶。
在一些实例中,靶多核苷酸中的5'-OH基团可由磷酸酶产生。与5'磷酸靶标相容的拓扑异构酶可用于产生稳定负载的中间体。在一些情况下,可使用在切割靶多核苷酸后留下5'OH的TnpB多肽。在一些情况下,磷酸酶结构域可以与TnpB蛋白缔合(例如,融合)。磷酸酶结构域可能能够在靶多核苷酸的5'端产生-OH基团。磷酸酶可以在与其他组分分开的载体上与系统中的其他组分分开递送,例如作为单独的蛋白质。
TnpB聚合酶系统
本文的系统还可包含聚合酶结构域。聚合酶是指合成核酸链的酶。聚合酶可以是DNA聚合酶或RNA聚合酶。
在一些实施方案中,系统包含用于修饰靶多核苷酸的工程化系统,所述工程化系统包含:TnpB蛋白;DNA聚合酶结构域;和DNA模板,所述DNA模板包含待插入至靶多核苷酸的靶序列的供体多核苷酸。在一些实例中,TnpB蛋白;DNA聚合酶结构域;和DNA模板中的两种或更多种可形成复合物。在一些实例中,TnpB蛋白;DNA聚合酶结构域中的两种或更多种包含在融合蛋白中。例如,TnpB蛋白和DNA聚合酶结构域可包含在融合蛋白中。
在一些实施方案中,系统可包含TnpB酶(或其变体,诸如dTnpB或TnpB切口酶)和DNA聚合酶(例如,phi29、T4、T7 DNA聚合酶)。系统还可包含单链DNA或双链DNA模板。DNA模板可包含i)与靶多核苷酸上的TnpB蛋白的靶位点同源的第一序列,和/或ii)与靶多核苷酸的另一个区域同源的第二序列。在一些实施方案中,模板可以是合成的单链DNA分子或PCR产生的DNA分子(任选地通过修饰的核苷酸进行末端保护)或病毒基因组(例如,AAV)。在另一个实施方案中,使用逆转录酶产生模板。当系统被递送到细胞中时,可以使用细胞中的内源DNA聚合酶。或者或另外,可在细胞中表达外源DNA聚合酶。
DNA模板可通过一个或多个修饰的核苷酸进行末端保护,或者包含病毒基因组的一部分。在一些实施方案中,DNA模板包含LNA或其他修饰(例如,在3'末端)。LNA和/或修饰的存在可导致通过TnpB蛋白切割产生的3'瓣进行更有效的退火。
DNA聚合酶的实例包括Taq、Tne(外源-)、Tma(外源-)、Pfu(外源-)、Pwo(外源-)、热产硫化氢热厌氧杆菌DNA聚合酶、海岸嗜热球菌DNA聚合酶I、大肠埃希氏菌DNA聚合酶I、TaqDNA聚合酶I、Tth DNA聚合酶I、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)(Bst)DNA聚合酶I、大肠埃希氏菌DNA聚合酶III、噬菌体T5 DNA聚合酶、噬菌体M2 DNA聚合酶、噬菌体T4DNA聚合酶、噬菌体T7 DNA聚合酶、噬菌体phi29 DNA聚合酶、噬菌体PRD1 DNA聚合酶、噬菌体phi15 DNA聚合酶、噬菌体phi21DNA聚合酶、噬菌体PZE DNA聚合酶、噬菌体PZADNA聚合酶、噬菌体Nf DNA聚合酶、噬菌体M2Y DNA聚合酶、噬菌体B103 DNA聚合酶、噬菌体SF5 DNA聚合酶、噬菌体GA-1DNA聚合酶、噬菌体Cp-5 DNA聚合酶、噬菌体Cp-7 DNA聚合酶、噬菌体PR4 DNA聚合酶、噬菌体PR5 DNA聚合酶、噬菌体PR722 DNA聚合酶和噬菌体L17 DNA聚合酶。
TnpB连接酶系统
一般来讲,系统包含TnpB蛋白和与TnpB蛋白缔合的连接酶。TnpB蛋白可被包含能够结合靶序列的间隔子的ωRNA募集至靶序列,并且在靶序列上产生断裂。ωRNA还可包含具有期望突变或其他序列元件的模板序列。模板序列可连接至靶序列以将突变或其他序列元件引入至核酸分子。TnpB蛋白可以是在核酸分子上产生单链断裂的切口酶,并且连接酶可以是单链DNA连接酶。在一些实施方案中,系统包含具有两个不同的ωRNA序列的一对TnpB-连接酶复合物。每个TnpB-连接酶复合物可以靶向双链多核苷酸的一条链,并且共同作用以有效地修饰双链多核苷酸的序列。
在一些实例中,TnpB与连接酶或其功能片段缔合。连接酶可连接由TnpB产生的单链断裂(切口)。在某些情况下,连接酶可以连接由TnpB产生的双链断裂。在某些实例中,TnpB与逆转录酶或其功能片段相关。
本发明还提供了使用一对不同的TnpB-连接酶-ωRNA复合物来修饰核酸序列的系统和方法,所述系统和方法包括:(a)与连接酶连接或复合的工程化TnpB蛋白;(b)两个不同的ωRNA序列,其与此种TnpB-连接酶蛋白复合物复合以形成第一和第二不同的TnpB-连接酶ωRNA复合物;(c)第一TnpB-连接酶ωRNA复合物,其与靶双链多核苷酸序列的一条链结合,和第二TnpB-连接酶-ωRNA复合物,其与靶双链多核苷酸序列的另一条链结合;(d)当所述复合物与感兴趣的基因座结合时,效应蛋白诱导与感兴趣的靶基因座缔合的或在所述靶基因座处的序列的修饰,由此两个TnpB-连接酶-ωRNA复合物在双链靶序列的不同链上共同作用并修饰所述序列。
使用此种“一对”TnpB-连接酶-ωRNA复合物的优点之一包括修饰与靶双链多核苷酸的感兴趣基因座缔合的序列或所述感兴趣基因座处的序列的高效率。
在一些实施方案中,TnpB蛋白可以是切口酶。在优选的实施方案中,连接酶连接至TnpB蛋白。连接酶可以将供体序列连接至靶序列。连接酶可以是单链DNA连接酶或双链DNA连接酶。连接酶可以融合至TnpB蛋白的羧基末端,或融合至TnpB蛋白的氨基末端。
如本文所用,术语“连接酶”是指催化核酸的相邻碱基之间的断裂(例如,双链断裂或单链断裂(“切口”))的接合的酶。例如,连接酶可以是能够在5'磷酸基团与3'羟基之间形成分子内或分子间共价键的酶。术语“连接”是指通过形成核苷酸间键来共价接合相邻寡核苷酸的反应。
DNA连接酶分为两大类:ATP依赖性DNA连接酶(EC 6.5.1.1)和NAD(+)依赖性DNA连接酶(EC 6.5.1.2)。NAD(+)依赖性DNA连接酶仅存在于细菌(以及一些病毒)中,而ATP依赖性DNA连接酶则普遍存在。ATP依赖性DNA连接酶可以分为四类:DNA连接酶I、II、III和IV。DNA连接酶I连接冈崎片段(Okazaki fragment)以形成连续的DNA链;DNA连接酶II是DNA连接酶III的可变剪接形式,仅存在于非分裂细胞中;DNA连接酶III参与碱基切除修复;并且DNA连接酶IV参与通过非同源末端接合(NHEJ)来修复DNA双链断裂。在所有连接酶中,有两种类型的原核连接酶和一种类型的真核连接酶特别适合促进平末端双链DNA连接:原核DNA连接酶(T3和T4)和真核DNA连接酶(连接酶1)。
在一些情况下,连接酶对双链核酸(例如dsDNA、dsRNA、RNA/DNA双链体)具有特异性。对双链DNA和DNA/RNA杂交体具有特异性的连接酶的实例是T4 DNA连接酶。在一些情况下,连接酶对单链核酸(例如,ssDNA、ssRNA)具有特异性。此种连接酶的实例是CircLigaseII。在一些情况下,连接酶对RNA/DNA双链体具有特异性。在一些情况下,连接酶能够作用于任何组合的单链核酸、双链核酸和/或RNA/DNA核酸。
在一些情况下,连接酶可以是泛连接酶,其是具有连接DNA和RNA靶标两者的能力的单一连接酶。连接酶可以对靶标具有特异性(例如,DNA特异性或RNA特异性)。在一些情况下,连接酶可以是双重连接酶系统,其包括任何组合的DNA特异性连接酶、RNA特异性连接酶和/或泛连接酶。
可以与本公开一起使用的连接酶的实例包括T4 DNA连接酶、T3 DNA连接酶、T7DNA连接酶、大肠埃希氏菌DNA连接酶、HiFi Taq DNA连接酶、9°NTM DNA连接酶、Taq DNA连接酶、连接酶(也称为PBCV-1DNA连接酶或小球藻病毒DNA连接酶)、热稳定5′AppDNA/RNA连接酶、T4 RNA连接酶、T4 RNA连接酶2、截短的T4 RNA连接酶2、T4 RNA连接酶2截短的K227Q、T4 RNA连接酶2、截短的KQ、RtcB连接酶(将具有3"-磷酸盐或2',3'-环磷酸盐的单链RNA连接至另一个RNA)、CircLigase II、CircLigase ssDNA连接酶、CircLigase RNA连接酶或热稳定DNA Ligas、NAD依赖性连接酶,包括Taq DNA连接酶、丝状栖热菌DNA连接酶、大肠埃希氏菌DNA连接酶、Tth DNA连接酶、水管致黑栖热菌DNA连接酶(I和II)、热稳定连接酶、扩增酶热稳定DNA连接酶、VanC型连接酶、9°N DNA连接酶、Tsp DNA连接酶、和通过生物勘探发现的新型连接酶;ATP依赖性连接酶,包括T4 RNA连接酶、T4 DNA连接酶、T3 DNA连接酶、T7 DNA连接酶、Pfu DNA连接酶、DNA连接酶I、DNA连接酶III、DNA连接酶IV、和通过生物勘探发现的新型连接酶及野生型、突变同种型及其遗传工程变体。在特定的实例中,连接酶是
在一些实施方案中,连接酶的实例包括用于通过合成测序或通过连接反应测序的那些。
TnpB螺旋子系统
本文的系统和组合物可包含TnpB多肽、一种或多种核酸组分、以及螺旋子的一种或多种组分。系统和组合物可用于将供体多核苷酸插入靶多核苷酸。系统和组合物还可包含供体多核苷酸。
如本文所用,术语“螺旋子”是指多核苷酸(或核酸区段),其被识别为捕获并动员真核生物中的基因片段的转座子。如本文所用的术语“螺旋子”是指包含核酸内切酶结构域和C末端解旋酶结构域的转座酶。螺旋子是滚环RNA转座子。在特定的实施方案中,螺旋子编码1400至约2000个氨基酸的、或约1800个氨基酸的多结构域转座酶。在实施方案中,螺旋子在3'端附近包含发夹以充当转座终止子。在实施方案中,转座子包含RepHel基序,所述RepHel基序包含复制起始子(Rep)和DNA解旋酶(hel)结构域。参见Thomas J.&PrithamE.J.Helitrons,the eukaryotic rolling-circle transposableelements.Microbiol.Spectr.3,893–926(2015)。在实施方案中,螺旋子包含Rep核酸酶结构域和C末端解旋酶结构域以及单链DNA中的AT二核苷酸之间的插入物。在一个方面,C末端解旋酶以5'至3'方向解旋DNA。HUH核酸酶结构域可包含一个或两个活性位点酪氨酸残基,在实施方案中,是2酪氨酸(Y2)HUH核酸内切酶结构域。螺旋子可以涵盖helentron、原helentron和螺旋子2型蛋白质,其结构可以如Thomas等人,2015的图1和图3中所述,所述文献通过引用明确并入。其中已发现螺旋子或helentron的特定生物体可以包括Thomas J.&Pritham E.J.Helitrons,the eukaryotic rolling-circle transposableelements.Microbiol.Spectr.3,893–926(2015)的表1中描述的那些,其通过引用并入本文。类似地,可以至少部分地基于Rep基序和螺旋子中的保守残基,并且根据Thomas J.&Pritham E.J.Helitrons,the eukaryotic rolling-circle transposableelements.Microbiol.Spectr.3,893–926(2015)的图2的比对序列来鉴定螺旋子,所述文献通过引用明确地并入本文。
本文使用的表达“螺旋子反应”是指其中转座酶将供体多核苷酸序列插入靶多核苷酸上的插入位点中或附近的反应。插入位点可含有被螺旋子识别的序列或二级结构和/或其中可插入供体多核苷酸序列的靶多核苷酸中的插入基序序列。
如Grabundzija 2018中所述,螺旋子末端序列含有独特的约150个碱基对(bp)的长序列,在左末端序列(LTS)的末端具有绝对保守的二核苷酸,在右末端序列(RTS)的末端具有四核苷酸,前面是可以形成发夹结构的回文序列。Grabundzija等人,Nat.Commun.2018;9:1278;doi:10.1035/s41467-018-03688-w。
螺旋子末端序列可负责鉴定用于转座的供体多核苷酸。螺旋子末端序列可以是用于执行转座反应的DNA序列,末端序列在本文中可被称为右末端序列和左末端序列。供体多核苷酸可以被配置为包含第一和第二螺旋子识别序列,其与编码螺旋子多肽的多核苷酸的左末端序列和/或右末端序列至少80%、85%、90%、95%、96%、97%、98%、99%或100%互补。
在一个方面,回文序列可位于右末端序列的上游,例如右末端序列末端上游的约5、10、15、20、25、30、35个核苷酸,或右末端序列末端上游约10至15个核苷酸,右末端序列末端上游的约10至12个核苷酸或约11个核苷酸。Ivana Grabundzija,Nat Commun.2016;7:10716,doi:10.1038/ncomms10716,其通过引用并入本文。
示例性螺旋子可以使用软件来鉴定,例如已经用于鉴定广泛的植物基因组中的螺旋子的(EAHelitron)。参见Hu,K.,Xu,K.,Wen,J.等人Helitron distribution inBrassicaceae and whole Genome Helitron density as a character fordistinguishing plant species.BMC Bioinformatics 20,354(2019).doi:10.1186/s12859-019-2945-8,其通过引用并入本文。
螺旋子可衍生自真核生物。在一个方面,螺旋子衍生自哺乳动物基因组,在一个方面,环颈蝠(vespertilionid bat),例如Helibat。在实施方案中,螺旋子衍生自Helibat1转座子。在实施方案中,螺旋子是Helraiser,共有转座子的完整DNA序列,包括Grabundzija,2016的补充图1中提供的左末端和右末端序列以及鉴定的发夹,其通过引用明确地并入本文。在一个方面,螺旋子侧接转座子的左末端序列和右末端序列。在一个方面,左末端序列和右末端序列以保守的5'-TC/CTAG-3'基序终止。在一个实施方案中,螺旋子可包含可能形成发夹结构的约10至约35、或约5至25bp的回文序列或约19-bp长的回文序列。
这些系统的元件可以被工程化以在本发明的背景中起作用。例如,螺旋子多肽可以与能够产生R环的多肽融合。融合可以通过任何适当的接头进行,在示例性实施方案中是XTEN16。允许螺旋子多肽结合的结合元件,例如,使用与螺旋子的右末端序列和左末端序列互补的序列,可以被工程化到供体构建体中,以促进供体多核苷酸序列进入靶多核苷酸。
在某些示例性实施方案中,经由与核酸组分序列形成复合物,Isc多肽将螺旋子多肽引导至靶多核苷酸中的靶序列,其中螺旋子促进供体多核苷酸序列整合至靶多核苷酸中。
螺旋子多肽还可以包含一个或多个截短或切除以去除野生型蛋白质的结构域或区域以得到最小的多肽,根据使用螺旋子的系统改变功能性,或者突变以增强或减弱与螺旋子相关的特定活性,即核酸酶活性或解旋酶活性。
多重化
在一个实施方案中,TnpB多肽可用于多重(串联)靶向方法。例如,本文的TnpB多肽可以采用多于一种核酸组分分子而不丧失活性。这可以使得能够使用如本文所定义的TnpB多肽、系统或复合物,通过如本文所定义的单一酶、系统或复合物来靶向多个DNA靶标、基因或基因座。核酸组分分子可以串联排列,任选地被核苷酸序列(诸如如本文所定义的保守核苷酸序列)分隔。不同核酸组分分子的位置是不影响活性的串联。
在一个方面,TnpB多肽可用于串联或多重靶向。应当理解,本文别处的任何TnpB多肽、复合物或组合物都可用于此种方法。如本文别处所述的任何方法、产物、组合物和用途同样适用于下文进一步详述的多重或串联靶向方法。通过进一步指导的方式,提供以下特定的方面和实施方案。
在一个方面,本发明提供了如本文所定义的TnpB多肽、复合物或系统用于靶向多个基因座的用途。在一个实施方案中,这可以通过使用多个(串联或多重)核酸组分分子序列来建立。
在一个方面,本发明提供了用于使用如本文所定义的TnpB多肽、复合物或系统的一种或多种元件进行串联或多重靶向的方法,其中本文的所述系统包含多个核酸组分分子序列。所述序列被核苷酸序列,诸如如本文别处定义的保守核苷酸序列分隔。
如本文所定义的TnpB多肽、组合物、系统或复合物提供了用于修饰多个靶多核苷酸的有效手段。如本文所定义的TnpB多肽、系统或复合物具有广泛的效用,包括修饰(例如,缺失、插入、易位、去活化、活化)多种细胞类型中的一个或多个靶多核苷酸。因此,本发明的如本文所定义的TnpB多肽、系统或复合物在例如基因疗法、药物筛选、疾病诊断和预后中具有广泛的应用,包括靶向单个系统内的多个基因座。
在一个方面,本公开提供了如本文所定义的TnpB多肽、系统或复合物,其具有TnpB多肽,所述TnpB多肽具有至少一个与其缔合的去稳定结构域,以及靶向多个核酸分子(诸如DNA分子)的多个核酸组分分子,由此所述多个核酸组分分子中的每一个特异性地靶向其对应的核酸分子,例如DNA分子。每个核酸分子靶标(例如,DNA分子)可以编码基因产物或涵盖基因座。因此,使用多个核酸组分分子能够靶向多个基因座或多个基因。在一个实施方案中,TnpB多肽可切割编码基因产物的DNA分子。在一个实施方案中,基因产物的表达被改变。TnpB多肽和核酸组分分子不会天然地一起出现。本公开涵盖核酸组分分子,其包含串联排列的核酸组分分子。本公开还涵盖TnpB多肽的编码序列,其被密码子优化以在真核细胞中表达。在一个实施方案中,真核细胞是哺乳动物细胞、植物细胞或酵母细胞,并且在更优选的实施方案中,哺乳动物细胞是人细胞。基因产物的表达可能会降低。TnpB多肽可形成系统或复合物的一部分,其还包含串联排列的核酸组分分子,所述核酸组分分子包含一系列2、3、4、5、6、7、8、9、10、15、25、25、30或多于30个核酸组分分子,每个核酸组分分子能够与细胞中的感兴趣的基因组基因座中的靶序列特异性杂交。在一个实施方案中,功能系统或复合物结合多个靶序列。在一个实施方案中,功能系统或复合物可编辑多个靶序列,例如,靶序列可包含基因组基因座,并且在一个实施方案中,可存在基因表达的改变。在一个实施方案中,功能系统或复合物可包含另外的功能结构域。在一个实施方案中,本发明提供了一种用于改变或修饰多种基因产物的表达的方法。所述方法可包括引入含有所述靶核酸(例如,DNA分子)的细胞或含有并表达靶核酸(例如,DNA分子)的细胞;例如,靶核酸可编码基因产物或提供基因产物的表达(例如,调控序列)。
在一个实施方案中,用于多重靶向的TnpB多肽与一个或多个功能结构域缔合。在一些更具体的实施方案中,用于多重靶向的TnpB多肽是死亡的TnpB多肽。发明人已经发现,如本文所述的TnpB多肽可以使得能够改进和/或直接接近DNA:RNA双链体中涉及的一种或多种核苷酸。
诱导型系统
在一个实施方案中,TnpB多肽可以形成诱导型系统的组分。系统的诱导型性质将允许使用某种形式的能量对基因编辑或基因表达进行时空控制。能量的形式可包括但不限于电磁辐射、声能、化学能和热能。诱导型系统的实例包括四环素诱导型启动子(Tet-On或Tet-Off)、小分子双杂交转录活化系统(FKBP、ABA等)或光诱导型系统(光敏色素、LOV结构域或隐花色素)。在一个实施方案中,TnpB多肽可以是光诱导型转录效应子(LITE)的一部分,以序列特异性方式引导转录活性的变化。光的组分可包括TnpB多肽、光反应性细胞色素异源二聚体(例如来自拟南芥(Arabidopsis thaliana))和转录活化/阻遏结构域。诱导型DNA结合蛋白及其使用方法的进一步实例在美国临时申请号61/736,465和US 61/721,283以及国际专利公开号WO 2014/018423 A2中提供,其特此通过引用整体并入。
自我失活系统
一旦细胞基因组中基因的所有拷贝都已经被编辑,所述系统就不再需要在所述细胞中继续表达。事实上,如果在非预期的基因组位点等处出现脱靶效应,则持续表达是不期望的。因此,限时表达将是有用的。诱导型表达提供了一种方法,但此外申请人还将一种自我失活系统工程化,所述系统依赖于载体本身内的非编码核酸组分分子靶序列的使用。因此,在表达开始后,系统将导致其自身破坏,但在破坏完成之前,它将有时间编辑靶基因的基因组拷贝(对于二倍体细胞中的正常点突变,最多需要两次编辑)。简单来说,自我失活系统包括额外的RNA(例如,核酸组分分子),其靶向TnpB多肽本身的编码序列,或靶向与存在于以下中的一种或多种的独特序列互补的一种或多种非编码核酸组分分子靶序列:(a)在驱动非编码RNA元件表达的启动子内,(b)在驱动TnpB多肽基因表达的启动子内,(c)在TnpB多肽编码序列中的ATG翻译起始密码子的100bp内,(d)在病毒递送载体的反向末端重复(iTR)内,例如在AAV基因组中。
在一些方面,提供了能够与TnpB多肽起始密码子下游的序列杂交的单一核酸组分分子,由此在一段时间后丧失TnpB多肽表达。在一些方面,提供一种或多种核酸组分分子,其能够与编码所述系统的多核苷酸的一个或多个编码区或非编码区杂交,由此在一段时间后,系统中的一个或多个失活、或在一些情况下全部失活。在系统的一些方面,并且不受理论的限制,细胞可包含多个复合物,其中复合物的第一子集包含第一核酸组分分子,其能够靶向待编辑的一个或多个基因组基因座,并且复合物的第二子集包含至少一种第二核酸组分分子,其能够靶向编码系统的多核苷酸,其中复合物的第一子集介导一个或多个靶向基因组基因座的编辑,并且复合物的第二子集最终使系统失活,从而使细胞中的进一步表达失活。
各种编码序列(TnpB多肽和核酸组分分子)可以包括在单个载体或多个载体上。例如,可以在一个载体上编码酶,并且在另一个载体上编码各种RNA序列,或者在一个载体上编码酶和一种核酸组分分子,而在另一个载体上编码剩余的核酸组分分子,或任何其他排列。一般来讲,优选使用总共一种或两种不同载体的系统。
当使用多个载体时,可以以不相等的数量递送它们,并且理想地使用相对于第二核酸组分分子过量的编码第一核酸组分分子的载体,从而帮助延迟系统的最终失活直到基因组编辑有机会发生。
第一核酸组分分子可以靶向基因组内的任何感兴趣的靶序列,如本文别处所述。第二核酸组分分子靶向载体内编码TnpB多肽的序列,从而使所述载体的酶表达失活。因此,载体中的靶序列必须能够使表达失活。合适的靶序列可以例如在TnpB多肽编码序列的翻译起始密码子附近或内部,在驱动非编码RNA元件表达的启动子中的非编码序列中,在驱动TnpB多肽基因表达的启动子内,在TnpB多肽编码序列中的ATG翻译起始密码子的100bp内,且/或在病毒递送载体的反向末端重复(iTR)内,例如在AAV基因组中。此区域附近的双链断裂可以诱导TnpB多肽编码序列发生移码,从而引起蛋白质表达丧失。“自我失活”核酸组分分子的替代靶序列旨在对系统表达或载体稳定性所需的调控区/序列进行编辑/使其失活。例如,如果TnpB多肽编码序列的启动子被破坏,则可以抑制或阻止转录。类似地,如果载体包括用于复制、维持或稳定性的序列,则可以靶向这些序列。例如,在AAV载体中,有用的靶序列位于iTR内。其他有用的靶向序列可以是启动子序列、聚腺苷酸化位点等。
此外,如果核酸组分分子以阵列形式表达,则同时靶向两个启动子的“自我失活”核酸组分分子将导致从TnpB多肽表达构建体中切除间插核苷酸,从而有效地导致其完全失活。类似地,在核酸组分分子靶向两个ITR或同时靶向两个或更多个其他组分的情况下,将导致间插核苷酸的切除。一般来讲,如本文所解释的自我失活适用于系统以便提供系统的调控。例如,如本文所解释的自我失活可应用于突变的修复,例如如本文所解释的扩增障碍。由于此自我失活,修复可能仅具有短暂的活性。
将非靶向核苷酸添加至“自我失活”核酸组分分子的5'端(例如,1-10个核苷酸,优选1-5个核苷酸)可以用于延迟其加工和/或修改其效率,作为确保在关闭之前在靶向基因组基因座进行编辑的方式。
在自我失活AAV系统的一个方面,共表达一个或多个靶向感兴趣的基因组序列的核酸组分分子(例如,1-2、1-5、1-10、1-15、1-20、1-30个)的质粒可以用“自我失活”核酸组分分子建立,所述“自我失活”核酸组分分子靶向工程化ATG起始位点处或附近的TnpB多肽序列(例如,5个核苷酸内、15个核苷酸内、30个核苷酸内、50个核苷酸内、100个核苷酸内)。U6启动子区中的调控序列也可以用核酸组分分子来靶向。U6驱动的核酸组分分子可以以阵列形式设计,使得可以同时释放多个核酸组分分子序列。当首次递送至靶组织/细胞(左细胞)中时,核酸组分分子开始积累,同时细胞核中的TnpB多肽水平上升。TnpB多肽与所有核酸组分分子复合,以介导TnpB多肽质粒的基因组编辑和自我失活。
自我失活系统的一个方面是单个或以串联阵列形式表达1至4个或更多个不同的核酸组分序列;例如,多达约20或约30个序列。每个单独的自我失活核酸组分分子序列可靶向不同的靶标。其可以由例如一种嵌合pol3转录物加工而成。可使用Pol3启动子,诸如U6或H1启动子。Pol2启动子诸如整篇本文中提到的那些。反向末端重复(iTR)序列可侧接Pol3启动子-核酸组分分子-Pol2启动子-TnpB多肽。
串联阵列转录物的一个方面是一个或多个核酸组分分子编辑一个或多个靶标,同时一个或多个自我失活核酸组分分子使系统失活。因此,例如,所述用于修复扩增障碍的系统可以与本文所述的自我失活系统直接组合。此种系统可例如具有针对靶区域进行修复的两个核酸组分分子以及针对TnpB多肽或系统的自我失活的至少第三个核酸组分分子。
核酸组分分子可以是对照分子。例如,其可被工程化以靶向编码TnpB多肽本身的核酸序列,如美国专利公开号US2015232881A1中所述,所述专利的公开内容特此通过引用并入。在一个实施方案中,系统或组合物可仅具有经工程化以靶向编码TnpB多肽的核酸序列的核酸组分分子。此外,系统或组合物可具有经工程化以靶向编码TnpB多肽的核酸序列的核酸组分分子,以及编码TnpB多肽的核酸序列,和任选的第二核酸组分分子,和进一步任选的修复模板。第二核酸组分可以是系统或组合物的主要靶标(诸如如本文所定义的治疗性靶标、诊断性靶标、敲除靶标等)。以此方式,系统或组合物是自我失活的。这在US2015232881A1(也公开为WO2015070083(A1))中关于Cas进行举例说明,并且可外推至本文公开的TnpB多肽,例如TnpB多肽。
编码TNPB系统和载体的多核苷酸
本文的系统可包含一种或多种多核苷酸。多核苷酸可包含本文系统的组分的编码序列,例如TnpB多肽、核酸组分、功能结构域、供体多核苷酸和/或系统中的其他组分。本公开还提供了包含本文的一种或多种多核苷酸的载体或载体系统。载体或载体系统包括本文的递送部分中描述的那些。
术语“多核苷酸”、“核苷酸”、“核苷酸序列”、“核酸”和“寡核苷酸”可互换使用。它们是指任何长度的核苷酸(脱氧核糖核苷酸或核糖核苷酸或其类似物)的聚合形式。多核苷酸可具有任何三维结构,并且可执行任何已知或未知的功能。以下是多核苷酸的非限制性实例:基因或基因片段的编码区或非编码区、由连锁分析定义的一个或多个基因座、外显子、内含子、信使RNA(mRNA)、转运RNA、核糖体RNA、短干扰RNA(siRNA)、短发夹RNA(核酸组分)、微小RNA(miRNA)、核酶、cDNA、重组多核苷酸、分支多核苷酸、质粒、载体、任何序列的分离DNA、任何序列的分离RNA、核酸探针和引物。所述术语还涵盖具有合成骨架的核酸样结构,参见例如Eckstein,1991;Baserga等人,1992;Milligan,1993;WO 97/03211;WO 96/39154;Mata,1997;Strauss-Soukup,1997;和Samstag,1996。多核苷酸可包含一个或多个经修饰的核苷酸,诸如甲基化核苷酸和核苷酸类似物。如果存在,则可在聚合物组装之前或之后赋予对核苷酸结构的修饰。核苷酸的序列可间杂非核苷酸组分。多核苷酸可在聚合后被进一步修饰,诸如通过与标记组分缀合。如本文所用,术语“野生型”是本领域技术人员理解的术语,并且意指与突变体或变体形式区分开的自然界中存在的生物体、菌株、基因或特性的典型形式。“野生型”可以是基线。如本文所用,术语“变体”应当被理解为意指表现出具有偏离自然界中存在的模式的品质。术语“非天然存在的”或“工程化的”可互换使用,并且表示人工的参与。当提及核酸分子或多肽时,所述术语意指核酸分子或多肽至少基本上不含它们在自然界中天然缔合的和在自然界中发现的至少一种其他组分。“互补性”是指核酸通过传统沃森-克里克碱基配对或其他非传统类型与另一个核酸序列形成氢键的能力。互补性百分比表示核酸分子中可以与第二个核酸序列形成氢键(例如,沃森-克里克碱基配对)的残基的百分比(例如,10个中的5、6、7、8、9、10个为50%、60%、70%、80%、90%和100%互补)。“完全互补”意指核酸序列的所有连续残基将与第二个核酸序列中相同数量的连续残基形成氢键。如本文所用的“基本上互补”是指在8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50或更多个核苷酸的区域内互补程度为至少60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%,或者是指两个核酸在严格条件下杂交。如本文所用,杂交的“严格条件”是指与靶序列具有互补性的核酸主要与靶序列杂交并且基本上不与非靶序列杂交的条件。严格条件通常具有序列依赖性,并且根据多种因素而变化。一般来讲,序列越长,序列与其靶序列特异性杂交的温度越高。严格条件的非限制性实例详细描述于Tijssen(1993),Laboratory Techniques In BiochemistryAnd Molecular Biology-Hybridization With Nucleic Acid Probes Part I,SecondChapter“Overview of principles of hybridization and the strategy of nucleicacid probe assay”,Elsevier,N.Y.。当提及多核苷酸序列时,则还设想互补或部分互补的序列。这些优选地能够在高度严格的条件下与参考序列杂交。“杂交”是指其中一个或多个多核苷酸反应形成经由核苷酸残基碱基之间的氢键而稳定的复合物的反应。氢键可通过沃森克里克碱基配对、霍格斯坦结合(Hoogstein binding)或以任何其他序列特异性方式发生。复合物可包含形成双链体结构的两条链、形成多链复合物的三条或更多条链、单个自我杂交链、或这些的任何组合。杂交反应可构成更广泛的过程中的一个步骤,诸如PCR的起始、或酶切割多核苷酸。能够与给定序列杂交的序列被称为给定序列的“互补体”。如本文所用,术语“基因组基因座”或“基因座”(多个基因座)是基因或DNA序列在染色体上的特定位置。“基因”是指编码在生物体中发挥功能作用的多肽或RNA链的DNA或RNA段,因此是活生物体中遗传的分子单位。出于本发明的目的,可认为基因包括调控基因产物产生的区域,无论此类调控序列是否与编码序列和/或转录序列相邻。因此,基因包括但不一定限于启动子序列、终止子、翻译调控序列,诸如核糖体结合位点和内部核糖体进入位点、增强子、沉默子、绝缘子、边界元件、复制起点、基质附着位点以及基因座控制区。如本文所用,“基因组基因座的表达”或“基因表达”是来自基因的信息用于合成功能性基因产物的过程。基因表达的产物通常是蛋白质,但在诸如rRNA基因或tRNA基因的非蛋白质编码基因中,产物是功能性RNA。所有已知的生命体-真核生物(包括多细胞生物)、原核生物(细菌和古细菌)和病毒都使用基因表达过程来产生功能性产物,从而生存。如本文所用,基因或核酸的“表达”不仅涵盖细胞基因表达,还涵盖克隆系统中和任何其他背景中的核酸的转录和翻译。如本文所用,“表达”还指代多核苷酸从DNA模板转录(诸如转录成mRNA或其他RNA转录物)的过程和/或转录的mRNA随后翻译成肽、多肽或蛋白质的过程。转录物和编码的多肽可统称为“基因产物”。如果多核苷酸衍生自基因组DNA,则表达可包括真核细胞中mRNA的剪接。术语“多肽”、“肽”和“蛋白质”在本文中可互换使用以指代任何长度的氨基酸的聚合物。聚合物可以是线性或支链的,其可包含修饰的氨基酸,并且其可以间杂非氨基酸。所述术语还涵盖已经修饰的氨基酸聚合物;例如二硫键形成、糖基化、脂化、乙酰化、磷酸化或任何其他操纵,诸如与标记组分缀合。如本文所用的术语“氨基酸”包括天然和/或非天然或合成的氨基酸,包括甘氨酸和D或L光学异构体、以及氨基酸类似物和肽模拟物。如本文所用,术语“结构域”或“蛋白质结构域”是指可独立于蛋白质链的其余部分而存在并发挥作用的蛋白质序列的一部分。如本发明的方面所述,序列同一性与序列同源性相关。同源性比较可通过肉眼进行,或更通常地,借助容易获得的序列比较程序进行。这些可商购获得的计算机程序可以计算两个或更多个序列之间的同源性百分比(%),并且还可计算两个或更多个氨基酸或核酸序列具有的序列同一性。
在一个实施方案中,多核苷酸序列是重组DNA。在其他实施方案中,多核苷酸序列还包含如本文别处所述的额外序列。在一个实施方案中,核酸序列在体外合成。
本公开提供了编码如本文任何实施方案中提及的系统或TnpB多肽的一种或多种组分的多核苷酸分子。在一个实施方案中,多核苷酸分子可包含另外的调控序列。通过指导而非限制的方式,多核苷酸序列可以是以下的一部分:表达质粒、微环、慢病毒载体、逆转录病毒载体、腺病毒或腺相关病毒载体、piggyback载体或tol2载体。在一个实施方案中,多核苷酸序列可以是双顺反子表达构建体。在其他实施方案中,经分离的多核苷酸序列可以掺入到细胞基因组中。在其他实施方案中,经分离的多核苷酸序列可以是细胞基因组的一部分。在其他实施方案中,经分离的多核苷酸序列可包含在人工染色体中。在一个实施方案中,可修饰经分离的多核苷酸序列的5'和/或3'端以提高主动避免降解的序列的稳定性。在一个实施方案中,经分离的多核苷酸序列可包含在噬菌体中。在其他实施方案中,经分离的多核苷酸序列可包含在农杆菌(agrobacterium)物种中。在一个实施方案中,经分离的多核苷酸序列是冻干的。
密码子优化
本发明的方面涉及编码如本文任何实施方案中所述的一种或多种系统的一种或多种组分的多核苷酸分子,其中多核苷酸分子的至少一个或多个区域可被密码子优化以在真核细胞中表达。在一个实施方案中,编码如本文任何实施方案中所述的一种或多种系统的一种或多种组分的多核苷酸分子被优化以在哺乳动物细胞或植物细胞中表达。
在此情况下,密码子优化的序列的实例是被优化以在真核细胞例如人中表达(即被优化以在人中表达)的序列,或被优化以在如本文所讨论的另一种真核细胞、动物或哺乳动物中表达的序列。在一个实施方案中,编码DNA/RNA靶向TnpB多肽的酶编码序列被密码子优化以在特定细胞(诸如真核细胞)中表达。真核细胞可以是特定生物体的那些或可以衍生自特定生物体的那些,所述生物体诸如植物或哺乳动物,包括但不限于如本文所讨论的人或非人真核生物或动物或哺乳动物,例如小鼠、大鼠、兔、狗、牲畜或非人哺乳动物或灵长类动物。在一个实施方案中,可排除用于修饰人类的种系遗传同一性的方法和/或用于修饰动物的遗传同一性的方法,所述方法可能导致他们遭受痛苦,而对于人或动物以及由此类方法获得的动物没有任何实质性的医疗益处。一般来讲,密码子优化是指通过用在感兴趣的宿主细胞的基因中更频繁或最频繁使用的密码子替换天然序列的至少一个密码子(例如,约或多于约1、2、3、4、5、10、15、20、25、50或更多个密码子)来修饰核酸序列以增强在所述宿主细胞中的表达,同时维持天然氨基酸序列的过程。各种物种对特定氨基酸的某些密码子表现出特定的偏好性。密码子偏好性(生物体之间密码子使用的差异)通常与信使RNA(mRNA)的翻译效率相关,而信使RNA的翻译效率又据信取决于被翻译的密码子的性质和特定转运RNA(tRNA)分子的可用性等。选定tRNA在细胞中的优势通常反映了肽合成中最频繁使用的密码子。因此,可以基于密码子优化来剪裁基因以在给定生物体中实现最佳基因表达。密码子使用表容易获得(例如,在于www.kazusa.orjp/codon/可获得的“密码子使用数据库”)并且这些表可以多种方式进行调整。参见Nakamura,Y.等人“Codon usagetabulated from the international DNA sequence databases:status for the year2000”Nucl.Acids Res.28:292(2000)。用于对特定序列进行密码子优化以在特定宿主细胞中表达的计算机算法也是可获得的,诸如Gene Forge(Aptagen;Jacobus,PA)也是可获得的。在一个实施方案中,编码TnpB多肽的序列中的一个或多个密码子(例如,1、2、3、4、5、10、15、20、25、50或更多个或所有密码子)对应于特定氨基酸的最常用密码子。
递送
本公开还提供了用于将本文的系统和组合物的组分引入至细胞、组织、器官或生物体的递送系统。递送系统可包括一种或多种递送媒介物和/或货物。示例性递送系统和方法包括以下中描述的那些:Feng Zhang等人(WO2016106236A1)的第[00117]至[00278]段以及Lino CA等人,Delivering CRISPR:a review of the challenges and approaches,DRUG DELIVERY,2018,第25卷,第1期,1234–1257的第1241-1251页和表1,所述文献通过引用整体并入本文,并且可以适用于与本文公开的TnpB蛋白一起使用。
在一个实施方案中,递送系统可用于将系统和组合物的组分引入至植物细胞。例如,可以使用电穿孔、显微注射、植物细胞原生质体的气溶胶束注射、基因枪方法、DNA颗粒轰击和/或农杆菌介导的转化将组分递送至植物。用于植物的方法和递送系统的实例包括Fu等人,Transgenic Res.2000年2月;9(1):11-9;Klein RM等人,Biotechnology.1992;24:384-6;Casas AM等人,Proc Natl Acad Sci U S A.1993年12月1日;90(23):11212–11216;和美国专利号5,563,055、Davey MR等人,Plant Mol Biol.1989年9月;13(3):273-85中描述的那些,所述文献通过引用整体并入本文。
本文所述的与组合物或TnpB多肽相关的示例性递送组合物、系统和方法也适用于功能结构域和其他组分(例如,与TnpB多肽相关的其他蛋白质和多核苷酸,诸如逆转录酶、核苷酸脱氨酶、逆转录转座子、供体多核苷酸等)。在优选的实施方案中,组合物包含经由mRNA递送多肽。
RNA递送
在一个实施方案中,TnpB系统可包含作为编码TnpB多肽的mRNA来递送。ωRNA可以与编码TnpB多肽的mRNA一起递送或分开递送。通过RNA工程可以进一步提高mRNA分子的体内翻译效率。为了实现有效的翻译,mRNA需要五种结构元件,包括5'帽、3'poly(A)尾、蛋白质编码序列以及5'和3'非翻译区(UTR),可利用这些元件中的一种或多种的序列工程来改进体内翻译。
在一些实施方案中,经分离的mRNA不自我复制。
在一些实施方案中,经分离的mRNA包含和/或编码一个或多个5'末端帽(或帽结构)、3'末端帽、5'非翻译区、3'非翻译区、加尾区或其任何组合。
在一些实施方案中,经分离的mRNA区的加帽区域的长度可以是1至10个,例如2-9、3-8、4-7、1-5、5-10个、或至少2个、或10个或更少的核苷酸。在一些实施方案中,帽不存在。
在示例性实施方案中,mRNA可以在体外合成并直接转移到靶细胞中,并且可被进一步修饰。例如,mRNA可包含用7-甲基鸟苷帽结构修饰的内源mRNA的5'端,其具有聚腺苷酸化的3'末端,这可促进蛋白质产生。还可以执行嘧啶残基的修饰以增强递送的mRNA的转基因表达,因为它可以降低对宿主细胞的先天免疫系统的刺激。在示例性实施方案中,mRNA包含抗逆转帽类似物和120-nt的poly(A)尾,并且任选地可包含被5-甲基胞嘧啶和假尿苷替换的胞嘧啶和尿苷残基。参见美国专利公开2019/0151474,其通过引用并入本文。
在一些实施方案中,5'-帽结构是cap0、cap1、ARCA、肌苷、N1-甲基-鸟苷、2'-氟-鸟苷、7-脱氮-鸟苷、8-氧代-鸟苷、2-氨基-鸟苷、LNA-鸟苷或2-叠氮基-鸟苷。
在一些实施方案中,5'末端帽是7mG(5')ppp(5')NlmpNp、m7GpppG帽、N7-甲基鸟嘌呤。在一些实施方案中,3'末端帽是3'-O-甲基-m7GpppG。
在一些实施方案中,3'-UTR是α-珠蛋白3'-UTR。在一些实施方案中,5'-UTR包含Kozak序列。
在一些实施方案中,加尾序列的长度范围可以是不存在至500个核苷酸(例如,至少60、70、80、90、120、140、160、180、200、250、300、350、400、450或500个核苷酸)。在一些实施方案中,加尾区是或包括polyA尾。在加尾区是polyA尾的情况下,长度可以以polyA结合蛋白结合的单位或作为polyA结合蛋白结合的函数来确定。在此实施方案中,polyA尾的长度足够结合PolyA结合蛋白的至少4个单体。PolyA结合蛋白单体与大约38个核苷酸的段结合。因此,已经观察到约80个核苷酸和160个核苷酸的polyA尾是功能性的。在一些实施方案中,polyA尾的长度为至少160个核苷酸。
在一些实施方案中,mRNA多核苷酸包括稳定元件。在一些实施方案中,稳定元件是组蛋白茎环。在一些实施方案中,稳定元件是相对于野生型序列具有增加的GC含量的核酸序列。
在实施方案中,期望减少用于递送的mRNA的免疫原性序列基序。示例性技术是本领域已知的,参见例如国际专利公开WO/2020/033720,其讨论了用于去除的示例性免疫原性序列基序,包括可以结合人TLR8的那些基序,其通过引用并入本文。
经分离的mRNA可以部分制备或仅使用体外转录制备。通过体外转录制备多核苷酸的方法是本领域已知的并且描述于美国临时专利申请号61/618,862、61/681,645、61/737,130、61/618,866、61/681,647、61/737,134、61/618,868、61/681,648、61/737,135、61/618,873、61/681,650、61/737,147、61/618,878、61/681,654、61/737,152、61/618,885、61/681,658、61/737,155、61/618,896、61/668,157、61/681,661、61/737,160、61/618,911、61/681,667、61/737,168、61/618,922、61/681,675、61/737,174、61/618,935、61/681,687、61/737,184、61/618,945、61/681,696、61/737,191、61/618,953、61/681,704 61/737,203;国际公开号WO2013151666、WO2013151668、WO2013151663、WO2013151669、WO2013151670、WO2013151664、WO2013151665、WO2013151736、WO2013151672、WO2013151671、WO2013151667和WO/2020/205793A1;每篇专利的内容均通过引用整体并入本文。制备核糖核酸的无细胞生产方法(包括大规模合成)在例如美国专利10,954,541中描述,其通过引用整体并入本文。
mRNA的靶向递送和内体逃逸通常是有效mRNA使用的要求。如本文别处详述,脂质(包括脂质纳米颗粒、脂质样材料、聚合物)是特别优选的递送媒介物。
货物
递送系统可包含一种或多种货物。货物可包含本文的系统和组合物的一种或多种组分。货物可以包含以下中的一种或多种:i)编码组合物和系统中的一种或多种蛋白质组分(诸如TnpB多肽和/或功能结构域)的质粒;ii)编码一种或多种核酸组分的质粒;iii)组合物和系统中的一种或多种蛋白质组分(诸如TnpB多肽和/或功能结构域)的mRNA;iv)一种或多种核酸组分分子;v)组合物和系统中的一种或多种蛋白质组分,诸如TnpB多肽和/或功能结构域;vi)其任何组合。一种或多种蛋白质组分可包括核酸指导的核酸酶(例如,Cas)、逆转录酶、核苷酸脱氨酶、逆转录转座子蛋白、其他功能结构域或其任何组合。
在一些实例中,货物可包含编码组合物和系统中的一种或多种蛋白质组分(诸如TnpB多肽和/或功能结构域)的质粒和一种或多种(例如,复数种)核酸组分分子。在一些情况下,质粒还可编码重组模板(例如,用于HDR)。在一个实施方案中,货物可包含编码一种或多种蛋白质组分的mRNA和一种或多种核酸组分分子。
在一些实例中,货物可包含一种或多种蛋白质组分和一种或多种核酸组分分子,例如,以核糖核蛋白复合物(RNP)的形式。核糖核蛋白复合物可通过本文的方法和系统递送。在一些情况下,核糖核蛋白可通过基于多肽的穿梭剂(shuttle agent)来递送。在一个实例中,核糖核蛋白可使用合成肽来递送,所述合成肽包含可操作地连接至细胞穿透结构域(CPD)、富含组氨酸的结构域和CPD的内体渗漏结构域(ELD),例如,如WO2016161516中所述。RNP还可用于将组合物和系统递送至植物细胞,例如,如Wu JW等人,NatBiotechnol.2015年11月;33(11):1162-4中所述。
物理递送
在一个实施方案中,可通过物理递送方法将货物引入细胞。物理方法的实例包括显微注射、电穿孔和流体动力学递送。核酸和蛋白质都可以使用此类方法来递送。例如,一种或多种蛋白质组分可以在体外制备、分离(如果需要的话,重新折叠、纯化)并引入细胞。
显微注射
将货物直接显微注射至细胞可以实现高效率,例如高于90%或约100%。在一个实施方案中,可以使用显微镜和针(例如,直径为0.5–5.0μm)执行显微注射,以刺穿细胞膜并将货物直接递送至细胞内的靶位点。显微注射可用于体外和离体递送。
可以显微注射质粒,所述质粒包含一种或多种蛋白质组分和/或核酸组分的编码序列、mRNA和/或核酸组分分子。在一些情况下,显微注射可用于i)将DNA直接递送至细胞核,和/或ii)将mRNA(例如,体外转录的)递送至细胞核或细胞质。在某些实例中,显微注射可用于将核酸组分直接递送至细胞核并将mRNA直接递送至细胞质,从而例如促进一种或多种蛋白质组分翻译并穿梭至细胞核。
显微注射可用于产生遗传修饰的动物。例如,可将基因编辑货物注射到受精卵中以允许有效的种系修饰。此种方法可以产生具有期望修饰的正常胚胎和足月小鼠幼崽。显微注射还可用于例如使用TnpB来提供瞬时上调或下调细胞基因组内的特定基因。
电穿孔
在一个实施方案中,货物和/或递送媒介物可通过电穿孔递送。电穿孔可使用脉冲高压电流来瞬时打开悬浮在缓冲液中的细胞的细胞膜内的纳米尺寸的孔,从而允许流体动力学直径为数十纳米的组分流入细胞中。在一些情况下,电穿孔可用于各种细胞类型并且有效地将货物转移到细胞中。电穿孔可用于体外和离体递送。
电穿孔还可用于通过施加特定电压和试剂,例如通过核转染,将货物递送至哺乳动物细胞的细胞核中。此类方法包括Wu Y等人(2015).Cell Res 25:67–79;Ye L等人(2014).Proc Natl Acad Sci USA 111:9591–6;Choi PS,Meyerson M.(2014).Nat Commun5:3728;Wang J,Quake SR.(2014).Proc Natl Acad Sci 111:13157–62中描述的那些。电穿孔还可用于体内递送货物,例如通过使用Zuckermann M等人(2015).Nat Commun 6:7391中描述的方法。
流体动力学递送
流体动力学递送也可用于递送货物,例如用于体内递送。在一些实例中,可通过将含有基因编辑货物的大体积(8-10%体重)溶液快速推入受试者(例如,动物或人)的血流中来执行流体动力学递送,例如对于小鼠,经由尾静脉推入血流中。由于血液不可压缩,大量液体可能会导致流体动力学压力增加,所述增加暂时增强内皮细胞和实质细胞的渗透性,从而允许通常无法穿过细胞膜的货物进入细胞。此方法可用于递送裸DNA质粒和蛋白质。所递送的货物可以在肝脏、肾脏、肺、肌肉和/或心脏中富集。
转染
可通过用于将核酸引入细胞的转染方法将货物(例如,核酸)引入细胞。转染方法的实例包括磷酸钙介导的转染、阳离子转染、脂质体转染、树状聚合物转染、热休克转染、磁转染、脂质转染、穿刺转染(impalefection)、光学转染、专利剂(proprietary agent)增强的核酸摄取。
递送媒介物
递送系统可以包括一种或多种递送媒介物。递送媒介物可将货物递送至细胞、组织、器官或生物体(例如,动物或植物)中。货物可被包装、携带或以其他方式与递送媒介物缔合。可基于待递送的货物的类型和/或递送是体外和/或体内的来选择递送媒介物。递送媒介物的实例包括载体、病毒、非病毒媒介物和本文所述的其他递送试剂。
根据本发明的递送媒介物可具有小于100微米(μm)的最大尺寸(例如,直径)。在一个实施方案中,递送媒介物具有小于10μm的最大尺寸。在一个实施方案中,递送媒介物可具有小于2000纳米(nm)的最大尺寸。在一个实施方案中,递送媒介物可具有小于1000纳米(nm)的最大尺寸。在一个实施方案中,递送媒介物可具有小于900nm、小于800nm、小于700nm、小于600nm、小于500nm、小于400nm、小于300nm、小于200nm、小于150nm或小于100nm、小于50nm的最大尺寸(例如,直径)。在一个实施方案中,递送媒介物可具有范围在25nm与200nm之间的最大尺寸。
在一个实施方案中,递送媒介物可以是或包含颗粒。例如,递送媒介物可以是或包含纳米颗粒(例如,最大尺寸(例如,直径)不大于1000nm的颗粒)。颗粒可以不同的形式提供,例如作为固体颗粒(例如金属,诸如银、金、铁、钛)、非金属、基于脂质的固体、聚合物)、颗粒的悬浮液或其组合。可制备金属、介电和半导体颗粒,以及混合结构(例如,核-壳颗粒)。纳米颗粒还可用于将组合物和系统递送至植物细胞,例如,如国际专利公开号WO2008042156、美国公开申请号US20130185823和国际专利公开号WO 2015/089419中所述。
载体
系统、组合物和/或递送系统可包含一种或多种载体。本公开还包括载体系统。载体系统可包含一种或多种载体。在一个实施方案中,载体是指能够转运其已经连接的另一个核酸的核酸分子。载体包括单链、双链或部分双链的核酸分子;包含一个或多个游离末端、无游离末端(例如环状)的核酸分子;包含DNA、RNA或两者的核酸分子;以及本领域已知的多核苷酸的其他变体。载体可以是质粒,例如可以通过诸如标准分子克隆技术向其中插入额外的DNA区段的环状双链DNA环。某些载体可能能够在其被引入的宿主细胞中自主复制(例如,具有细菌复制起点的细菌载体和附加型哺乳动物载体)。一些载体(例如,非附加型哺乳动物载体)在引入宿主细胞中之后整合到宿主细胞的基因组中,从而与宿主基因组一起复制。在某些实例中,载体可以是表达载体,例如能够引导与其可操作地连接的基因的表达。在一些情况下,表达载体可以用于在真核细胞中表达。在重组DNA技术中使用的常见表达载体经常呈质粒的形式。
载体的实例包括pGEX、pMAL、pRIT5、大肠埃希氏菌表达载体(例如,pTrc、pET 11d、酵母表达载体(例如,pYepSec1、pMFa、pJRY88、pYES2和picZ、杆状病毒(Baculovirus)载体(例如,用于在昆虫细胞诸如SF9细胞中表达)(例如,pAc系列和pVL系列)、哺乳动物表达载体(例如,pCDM8和pMT2PC。
载体可包含i)一个或多个蛋白质组分编码序列,和/或ii)单个或至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少12个、至少14个、至少16个、至少32个、至少48个、至少50个核酸组分分子编码序列。在单个载体中,可以存在每个RNA编码序列的启动子。或者或另外,在单个载体中,可存在控制(例如,驱动转录和/或表达)多个RNA编码序列的启动子。
此外,所述组合物或系统可经由载体递送,例如单独的载体或编码复合物的相同载体。当由单独的载体提供时,靶向TnpB多肽表达的RNA可以按顺序或同时施用。当按顺序施用时,靶向TnpB多肽表达的RNA将在旨在用于例如基因编辑或基因工程的RNA之后递送。此时间段可以是几分钟(例如,5分钟、10分钟、20分钟、30分钟、45分钟、60分钟)的时间段。此时间段可以是几个小时(例如,2小时、4小时、6小时、8小时、12小时、24小时)的时间段。此时间段可以是几天(例如,2天、3天、4天、7天)的时间段。此时间段可以是几周(例如,2周、3周、4周)的时间段。此时间段可以是几个月(例如,2个月、4个月、8个月、12个月)的时间段。此时间段可以是几年(2年、3年、4年)的时间段。以此方式,TnpB多肽与能够与第一靶标(诸如一个或多个感兴趣的基因组基因座)杂交的第一核酸组分分子缔合,并且承担系统期望的功能(例如,基因工程);随后,TnpB多肽然后可以与第二核酸组分分子缔合,所述第二核酸组分分子能够与包含至少部分TnpB多肽的序列杂交。在核酸组分分子靶向编码TnpB多肽表达的序列的情况下,酶变得受阻并且系统变得自我失活。以相同的方式,经由例如如本文所解释的脂质体、脂质转染、颗粒、微泡施加的靶向TnpB多肽表达的RNA可以按顺序或同时施用。类似地,可使用自我失活来使用于靶向一个或多个靶标的一个或多个核酸组分分子失活。
调控元件
载体可包含一个或多个调控元件。调控元件可以可操作地连接至TnpB多肽的编码序列、辅助蛋白、核酸组分支架和/或核酸组分分子或其组合。术语“可操作地连接”旨在意指以允许核苷酸序列表达的方式(例如,在体外转录/翻译系统中,或当载体被引入宿主细胞中时,在宿主细胞中)将感兴趣的核苷酸序列与调控元件连接。在某些实例中,载体可包含:可操作地连接至编码TnpB多肽的核苷酸序列的第一调控元件,和可操作地连接至编码核酸组分分子的核苷酸序列的第二调控元件。
调控元件的实例包括启动子、增强子、内部核糖体进入位点(IRES)和其他表达控制元件(例如,转录终止信号,诸如聚腺苷酸化信号和poly-U序列)。此类调控元件描述于例如Goeddel,GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY 185,AcademicPress,San Diego,Calif.(1990)中。调控元件包括引导核苷酸序列在许多类型的宿主细胞中组成型表达的调控元件,以及引导核苷酸序列仅在某些宿主细胞中表达的调控元件(例如,组织特异性调控序列)。组织特异性启动子可以主要引导在感兴趣的期望组织(诸如肌肉、神经元、骨骼、皮肤、血液、特定器官(例如,肝脏、胰腺)或特定细胞类型(例如,淋巴细胞))中表达。调控元件还可以时间依赖性方式(诸如以细胞周期依赖性或发育阶段依赖性方式)引导表达,所述表达还可以是或可以不是组织或细胞类型特异性的。
启动子的实例包括一个或多个pol III启动子(例如,1、2、3、4、5或更多个pol III启动子)、一个或多个pol II启动子(例如,1、2、3、4、5或更多个pol II启动子)、一个或多个pol I启动子(例如,1、2、3、4、5或更多个pol I启动子)或其组合。pol III启动子的实例包括但不限于U6和H1启动子。pol II启动子的实例包括但不限于逆转录病毒劳斯肉瘤病毒(RSV)LTR启动子(任选地具有RSV增强子)、巨细胞病毒(CMV)启动子(任选地具有CMV增强子)、SV40启动子、二氢叶酸还原酶启动子、β-肌动蛋白启动子、磷酸甘油激酶(PGK)启动子和EF1α启动子。
病毒载体
货物可通过病毒递送。在一个实施方案中,使用病毒载体。病毒载体可包含用于包装到病毒(例如,逆转录病毒、复制缺陷型逆转录病毒、腺病毒、复制缺陷型腺病毒和腺相关病毒)中的病毒衍生的DNA或RNA序列。病毒载体还包括由病毒携带以转染到宿主细胞中的多核苷酸。病毒和病毒载体可用于体外、离体和/或体内递送。
腺相关病毒(AAV)
本文的系统和组合物可通过腺相关病毒(AAV)递送。AAV载体可用于此种递送。AAV属于细小病毒科(Parvoviridae family)依赖病毒属(Dependovirus genus),是一种单链DNA病毒。在一个实施方案中,AAV可以提供所提供的DNA的持久来源,因为AAV递送的基因组材料可以无限期地存在于细胞中,例如作为外源DNA或者通过一些修饰直接整合到宿主DNA中。在一个实施方案中,AAV不引起任何人类疾病或与任何人类疾病不相关。病毒本身能够有效地感染细胞,同时几乎不引起先天或适应性免疫反应或相关毒性。
可用于本文的AAV的实例包括AAV-1、AAV-2、AAV-3、AAV-4、AAV-5、AAV-6、AAV-8和AAV-9。可根据待靶向的细胞来选择AAV的类型;例如,可以选择AAV血清型1、2、5或杂交衣壳AAV1、AAV2、AAV5或其任何组合以靶向脑或神经元细胞;并且可以选择AAV4以靶向心脏组织。AAV8可用于递送至肝脏。基于AAV-2的载体最初被提议用于将CFTR递送至CF气道,其他血清型(诸如AAV-1、AAV-5、AAV-6和AAV-9)在多个肺上皮模型中表现出改善的基因转移效率。AAV靶向的细胞类型的实例在Grimm,D.等人,J.Virol.82:5887-5911(2008))中描述,并且如下表3所示:
表3.
AAV颗粒可以在HEK 293T细胞中产生。一旦产生具有特定趋向性的颗粒,就使用它们来感染靶细胞系,就像天然病毒颗粒一样。这可允许组分在感染的细胞类型中持续存在,并且使得此递送方式特别适合期望长期表达的情况。可以使用的AAV的剂量和制剂的实例包括美国专利号8,454,972和8,404,658中描述的那些。
可以使用各种策略来用AAV递送本文的系统和组合物。在一些实例中,TnpB多肽和核酸组分的编码序列可直接包装到一个DNA质粒载体上并经由一个AAV颗粒递送。在一些实例中,AAV可用于将核酸组分递送至先前已被工程化以表达TnpB多肽的细胞中。在一些实例中,TnpB多肽和核酸组分的编码序列可被制成用于共转染靶细胞的两个单独的AAV颗粒。在一些实例中,标志物、标签和其他序列可以与TnpB多肽和/或核酸组分的编码序列包装在相同的AAV颗粒中。
慢病毒
本文的系统和组合物可通过慢病毒递送。慢病毒载体可用于此种递送。慢病毒是复杂的逆转录病毒,其具有在有丝分裂细胞和有丝分裂后细胞中感染并表达其基因的能力。
慢病毒的实例包括人类免疫缺陷病毒(HIV),其可以利用其他病毒的包膜糖蛋白来靶向广泛的细胞类型;基于马传染性贫血病毒(EIAV)的最小非灵长类慢病毒载体,其可用于眼部疗法。在一个实施方案中,具有靶向HIV tat/rev共有的共同外显子的siRNA、核仁定位TAR诱饵和抗CCR5特异性锤头核酶的自我失活慢病毒载体(参见,例如,DiGiusto等人(2010)Sci Transl Med 2:36ra43)可用于和/或适用于本文的TnpB系统。
慢病毒可以用其他病毒蛋白(诸如水疱性口炎病毒的G蛋白)假型化。在此过程中,可以根据需要将慢病毒的细胞趋向性改变为宽或窄。在一些情况下,为了提高安全性,第二代和第三代慢病毒系统可将必需基因分裂到三个质粒上,这可能会降低细胞内活病毒颗粒意外重构的可能性。
在一些实例中,利用整合能力,慢病毒可用于创建包含各种遗传修饰的细胞文库,例如用于筛选和/或研究基因和信号传导途径。
腺病毒
本文的系统和组合物可通过腺病毒递送。腺病毒载体可用于此种递送。腺病毒包括无包膜病毒,其具有含有双链DNA基因组的二十面体核衣壳。腺病毒可感染分裂细胞和非分裂细胞。在一个实施方案中,腺病毒不整合到宿主细胞的基因组中,这可用于限制基因编辑应用中系统的脱靶效应。
用于递送至植物的病毒媒介物
可使用病毒媒介物将系统和组合物递送至植物细胞。在特定的实施方案中,可以使用植物病毒载体将组合物和系统引入植物细胞中(例如,如Scholthof等人1996,AnnuRev Phytopathol.1996;34:299-323中所述)。此类病毒载体可以是来自DNA病毒的载体,所述DNA病毒例如双生病毒(geminivirus)(例如,卷心菜卷叶病毒(cabbage leaf curlvirus)、豆黄矮病毒(bean yellow dwarf virus)、小麦矮化病毒(wheat dwarf virus)、番茄卷叶病毒(tomato leaf curl virus)、玉米线条病毒(maize streak virus)、烟草卷叶病毒(tobacco leaf curl virus)或番茄金色花叶病毒(tomato golden mosaic virus))或纳米病毒(例如,菜豆坏死黄化病毒(Faba bean necrotic yellow virus))。病毒载体可以是来自RNA病毒的载体,所述RNA病毒例如烟草脆裂病毒属(tobravirus)(例如,烟草脆裂病毒(tobacco rattle virus)、烟草花叶病毒(tobacco mosaic virus))、马铃薯X病毒(potexvirus)(例如马铃薯病毒X)或大麦病毒(hordeivirus)(例如,大麦条纹花叶病毒(barley stripe mosaic virus))。植物病毒的复制基因组可以是非整合载体。
非病毒媒介物
递送媒介物可包括非病毒媒介物。一般来讲,能够递送核酸和/或蛋白质的方法和媒介物可用于递送本文的系统组合物。非病毒媒介物的实例包括脂质纳米颗粒、细胞穿透肽(CPP)、DNA纳米线团(nanoclew)、金纳米颗粒、链球菌溶血素O、多功能包膜型纳米装置(MEND)、脂质包被的介孔二氧化硅颗粒和其他无机纳米颗粒。RNA的靶向递送和内体逃逸通常是有效RNA使用的要求。如下文进一步详述,脂质,包括脂质纳米颗粒、脂质样材料、聚合物是RNA的特别优选的递送媒介物。
纳米颗粒
用于与本发明组合物一起使用的递送媒介物可包含纳米颗粒,所述纳米颗粒包括脂质纳米颗粒。可以使用其他颗粒系统,包括基于聚合物的材料,诸如磷酸钙-硅酸纳米颗粒、磷酸钙纳米颗粒、二氧化硅纳米颗粒、以及聚(酰氨基-胺)、聚-β氨基酯(PBAE)和聚乙烯亚胺(PEI)。参见,例如Trepotec等人Mol.Therapy 27:4 2019年4月。在实施方案中,示例性纳米颗粒包含修饰的树状聚合物,所述修饰的树状聚合物包含核心、用于封装和递送核酸(例如mRNA)的一个或多个均质或异质中间层和末端层。修饰的树状聚合物可以优选地包含一种或多种聚酯树状聚合物,例如,所述聚酯树状聚合物包含分支成一代或多代聚酯单元的核心,其中聚酯经由胺接头(例如,聚胺)在表面连接至疏水单元(例如,脂肪酸衍生物),包括聚酰胺基胺(PAMAM)树状聚合物、聚丙烯亚胺(PPI)树状聚合物或聚乙烯亚胺(PEI)树状聚合物。多个中间层可包含至少一个针对内体逃逸而改性的层和多氟烃。示例性分子和制备方法可见于WO/2020/132196和WO 2021/207020,其通过引用并入本文。国际专利公开WO 2021/207020的式IB、II和III作为用于递送核酸的示例性纳米颗粒递送媒介物通过引用明确地并入本文。
脂质颗粒
递送媒介物可包含脂质颗粒,例如脂质纳米颗粒(LNP)和脂质体。脂质氨基糖苷及其衍生物在本领域中已知用于递送RNA,包括如国际专利公开WO 2008/040792中详细描述的二油胺-A-琥珀酰-新霉素(“DOSN”)、二油胺-A-琥珀酰-巴龙霉素(paromomycin)(“DOSP”)、NeoCHol NeoSucChol、ParomoChol.ParomoCapSucDOLA、ParamoLysSucDOLA、NeoDiSucDODA、NeodiLysSucDOLA和[ParomoLys]2-Glu-Lys-[SucDOLA]2,所述专利通过引用并入本文。
脂质纳米颗粒(LNP)
LNP可将核酸包封在阳离子脂质颗粒(例如,脂质体)内,并且可以相对容易地递送至细胞。在一些实例中,脂质纳米颗粒不含有任何病毒组分,这有助于最大程度地减少安全性和免疫原性问题。脂质颗粒可用于体外、离体和体内递送。脂质颗粒可用于各种规模的细胞群。
在一些实例中,LNP可用于递送DNA分子(例如,包含TnpB多肽和/或核酸组分的编码序列的那些)和/或RNA分子(例如,TnpB多肽、核酸组分分子的mRNA)。在某些情况下,LNP可用于递送TnpB多肽/核酸组分的RNP复合物。
阳离子脂质与mRNA形成复合物,形成脂质复合物,然后被细胞内吞。在示例性实施方案中,LNP包含阳离子脂质、辅助脂质、胆固醇和聚乙二醇(PEG)。在示例性实施方案中,LNP可以包含基于巴龙霉素的阳离子脂质,并且在另一个方面包含两种基于咪唑的中性脂质,所述阳离子脂质具有酰胺或磷酰胺接头,所述中性脂质也具有充当接头的酰胺或磷酰胺。在实施方案中,当阳离子脂质和辅助脂质包含不同的接头时,可以获得组装体。参见Colombani等人,Self-assembling complexes between binary mixtures of lipidswith different linkers and nucleic acids promote universal mRNA,DNA and siRNAdelivery.J.Control Release.(2017)doi:10.1016/j.jconrel.2017.01.041。
在实施方案中,纳米颗粒可以根据选择性器官靶向(SORT)来开发,其中多种类别的脂质纳米颗粒被系统地工程化以经由添加补充的SORT分子来专门编辑肝外组织。参见,例如Cheng等人,Nature Nanotechnology 15,313-320 2020)。已显示所述方法使用树状聚合物脂质纳米颗粒(DLNP)、稳定核酸脂质颗粒(SNALP)和脂质样纳米颗粒(LLNP),包括使用可电离的阳离子脂质(5A2-SC8、C12-200或DLin-MC3-DMA)36、48、49、两性离子脂质(DOPE或DSPC)、胆固醇、DMG-PEG和永久阳离子脂质(DOTAP、DDAB或EPC)。Wei等人,Systemicnanoparticledelivery of CRISPR-Cas9ribonucleproteins for effective tissuespecific genome editing.,Nature Comm.(2020)11:3232,doi:10.1038/s4146020170293,其通过引用并入本文。
在一个实施方案中,所述组合物包含多个脂质纳米颗粒,所述脂质纳米颗粒包含阳离子脂质、中性脂质、胆固醇、PEG脂质或其组合,其中多个脂质纳米颗粒任选地具有80nm与160nm之间的平均粒径;并且其中脂质纳米颗粒包含编码至少一种本发明的多肽(例如,TnpB多肽)的一种或多种多核苷酸。
LNP中的组分可包含阳离子脂质1,2-二亚油酰基-3-二甲基铵-丙烷(DLinDAP)、1,2-二亚油酰氧基-3-N,N-二甲基氨基丙烷(DLinDMA)、1,2-二亚油酰氧基酮-N,N-二甲基-3-氨基丙烷(DLinK-DMA)、1,2-二亚油酰-4-(2-二甲基氨基乙基)-[1,3]-二氧戊环(DLinKC2-DMA)、(3-o-[2"-(甲氧基聚乙二醇2000)琥珀酰基]-1,2-二肉豆蔻酰基-sn-乙二醇(PEG-S-DMG)、R-3-[(间甲氧基-聚(乙二醇)2000)氨基甲酰基]-1,2-二肉豆蔻酰基氧基丙基-3-胺(PEG-C-DOMG,及其任何组合。LNP的制备和包装可根据Rosin等人,Molecular Therapy,第19卷,第12期,第1286-2200页,2011年12月)进行调整。
另外的阳离子脂质可包括单独或与其他材料(诸如胆固醇)组合的二-O-十八烯基-3-三甲基铵-丙烷(DOTMA)、1,2-二油酰基-sn-甘油-3-磷酸乙醇胺(DOPE)、1,2-二油酰基-3-三甲基铵-丙烷(DOTAP)、DOTMA的可生物降解类似物。此类阳离子脂质LNP可以例如纳米乳液的形式递送,并且可以进一步掺入碳酸磷灰石(增加颗粒与细胞膜之间的相互作用),或者与纤连蛋白缀合,从而加速内吞作用。还考虑了其他季铵脂质用于递送,诸如二甲基双十八烷基溴化铵(DDAB)也是2,3-二油酰氧基-N-[2-(精胺甲酰氨基)乙基]-N,N-二甲基-1-三氟乙酸丙铵(DOSPA)。
用于mRNA递送的脂质纳米颗粒可以包括2-(((((3S,8S,9S,10R,13R,14S,17R)-10,13-二甲基-17-((R)-6-甲基庚-2-基)-2,3,4,7,8,9,10,11,12,13,14,15,16,17-十四氢-1H-环戊[a]菲-3-基)氧基)羰基)氨基)-N,N-双(2-羟乙基)-N-甲基乙烷-1-溴化铵(BHEM-胆固醇)。参见Zhang,Y.等人In situ repurposing of dendritic cells withCRISPR/Cas9-based nanomedicine to induce transplant tolerance.Biomaterials217,119302(2019),其通过引用并入本文。
在一些实施方案中,脂质纳米颗粒包含20-60%可电离的阳离子脂质、5-25%非阳离子脂质、25-55%甾醇和0.5-15% PEG修饰的脂质的摩尔比。
在一些实施方案中,脂质纳米颗粒是美国专利号10,442,756中描述的任何纳米颗粒且/或包含美国专利号10,442,756中描述的任何化合物,包括但不限于根据其中描述的式(IA)或(II)的任一种的纳米颗粒。
在一些实施方案中,脂质纳米颗粒是美国专利号10,266,485中描述的任何纳米颗粒且/或包含美国专利号10,266,485中描述的任何化合物,包括但不限于根据其中描述的式(II)的纳米颗粒。
在一些实施方案中,脂质纳米颗粒是美国专利号9,868,692中描述的纳米颗粒且/或包含例如美国专利号9,868,692中描述的化合物,包括但不限于根据式(I)、(1A)、(II)、(IIa)、(IIb)、(IIc)、(IId)、(IIe)的纳米颗粒。
在一些实施方案中,脂质纳米颗粒包含如美国专利号10272150中所述的式(I)和/或式(II)的化合物。
在一些实施方案中,mRNA被配制在脂质纳米颗粒中,所述脂质纳米颗粒包含选自美国专利号10,272,150的化合物3、18、20、25、26、29、30、60、108-112和122的化合物。
在一些实施方案中,开放阅读框中至少80%(例如,85%、90%、95%、98%、99%)的尿嘧啶具有化学修饰,任选地其中疫苗被配制在脂质纳米颗粒中(例如,脂质纳米颗粒包含阳离子脂质、PEG修饰的脂质、甾醇和非阳离子脂质)。
在一些实施方案中,脂质纳米颗粒具有50-200nm的平均直径。
在一些实施方案中,脂质纳米颗粒包含如美国专利号10272150中列出的化合物3、18、20、25、26、29、30、60、108-112或122。
在一些实施方案中,脂质纳米颗粒具有小于0.4(例如小于0.3、0.2或0.1)的多分散性值。
在一些实施方案中,多个脂质纳米颗粒,诸如当包含在制剂中时,具有0.02与0.2之间的平均PDI。在一些实施方案中,多个脂质纳米颗粒,诸如当包含在包含一种或多种多核苷酸的制剂中时,具有10与20之间的平均脂质与多核苷酸比率(重量/重量)。
在一些实施方案中,脂质纳米颗粒在中性pH值下具有净中性电荷。
脂质体
在一个实施方案中,脂质颗粒可以是脂质体。脂质体是球形囊泡结构,其由围绕内部水性隔室的单层或多层脂质双层和相对不可渗透的外部亲脂性磷脂双层组成。在一个实施方案中,脂质体是生物相容的、无毒的,可以递送亲水性和亲脂性药物分子,保护其货物免于血浆酶降解,并且将其负载转运穿过生物膜和血脑屏障(BBB)。
脂质体可以由若干种不同类型的脂质(例如,磷脂)制成。脂质体可包含天然磷脂和脂质,诸如1,2-二硬脂酰-sn-甘油-3-磷脂酰胆碱(DSPC)、鞘磷脂、卵磷脂酰胆碱、单唾液酸神经节苷脂或其任何组合。
可以将若干种其他添加剂添加至脂质体中,以便改变其结构和性质。例如,脂质体还可包含胆固醇、鞘磷脂和/或1,2-二油酰-sn-甘油-3-磷酸乙醇胺(DOPE),例如以增加稳定性和/或防止脂质体内部货物的泄漏。
在一个实施方案中,脂质体包含转运聚合物,其可以任选地是分支的,包含至少10个氨基酸以及大于1.5且小于10的组氨酸与非组氨酸氨基酸比率。分支转运聚合物可以包含一条或多条主链、一条或多条末端支链、以及任选的一条或多条非末端支链。参见美国专利号7,070,807,其通过引用整体并入本文。在一个实施方案中,转运聚合物是用于包装和递送mRNA和其他货物的组氨酸-赖氨酸共聚物(HKP)。参见美国专利号7,163,695和7,772,201,其通过引用整体并入本文。
稳定的核酸脂质颗粒(SNALP)
在一个实施方案中,脂质颗粒可以是稳定的核酸脂质颗粒(SNALP)。SNALP可包含可电离脂质(DLinDMA)(例如,在低pH下为阳离子)、中性辅助脂质、胆固醇、扩散性聚乙二醇(PEG)-脂质或其任何组合。在一些实例中,SNALP可包含合成胆固醇、二棕榈酰磷脂酰胆碱、3-N-[(单甲氧基聚乙二醇)2000)氨基甲酰基]-1,2-二肉豆蔻基氧基丙胺和阳离子1,2-二亚油基氧基-3-N,N二甲基氨基丙烷。在一些实例中,SNALP可包含合成胆固醇、1,2-二硬脂酰-sn-甘油-3-磷酸胆碱、PEG-cDMA和1,2-二亚油基氧基-3-(N;N-二甲基)氨基丙烷(DLinDMA)。
其他脂质
脂质颗粒还可包含一种或多种其他类型的脂质,例如阳离子脂质,诸如氨基脂质2,2-二亚油基-4-二甲基氨基乙基-[1,3]-二氧戊环(DLin-KC2-DMA)、DLin-KC2-DMA4、C12-200和辅助脂(colipid)二硬脂酰磷脂酰胆碱、胆固醇和PEG-DMG。
脂质复合物/聚合复合物
在一个实施方案中,递送媒介物包含脂质复合物和/或聚合复合物。脂质复合物可以与带负电荷的细胞膜结合并诱导内吞到细胞中。脂质复合物的实例可以是包含脂质和非脂质组分的复合物。脂质复合物和聚合复合物的实例包括FuGENE-6试剂(一种含有脂质和其他组分的非脂质体溶液)、两性离子氨基脂质(ZAL)、(例如,形成DNA/Ca2+微复合物)、聚乙烯亚胺(PEI)(例如,分支PEI)和聚(L-赖氨酸)(PLL)。还可以使用核-壳结构的脂质复合物递送平台,并且所述平台是mRNA的一种优选递送,特别是因为核-壳结构的颗粒可以蛋白质化并且在聚合物降解时逐渐释放mRNA。参见美国专利公开2018/0360756,其通过引用并入本文。
细胞穿透肽
在一个实施方案中,递送媒介物包含细胞穿透肽(CPP)。CPP是短肽,其促进细胞摄取各种分子货物(例如,从纳米大小的颗粒到小化学分子和大DNA片段)。
CPP可具有不同的大小、氨基酸序列和电荷。在一些实例中,CPP可以使质膜易位,并促进各种分子货物递送至细胞质或细胞器。CPP可经由不同的机制引入细胞中,例如,直接穿透膜、内吞作用介导的进入以及通过形成暂时性结构的易位。
CPP可具有含有高相对丰度的带正电荷的氨基酸诸如赖氨酸或精氨酸的氨基酸组成,或者具有含有交替模式的极性/带电荷的氨基酸和非极性、疏水性氨基酸的序列。这两种类型的结构分别称为聚阳离子性或两亲性。第三类CPP是疏水性肽,其仅含有非极性残基,具有低净电荷或具有对细胞摄取至关重要的疏水性氨基酸基团。另一种类型的CPP是来自人类免疫缺陷病毒1(HIV-1)的反式活化转录活化子(Tat)。CPP的实例包括Penetratin、Tat(48-60)、Transportan和(R-AhX-R4)(Ahx指氨基己酰基)、卡波西成纤维细胞生长因子(FGF)信号肽序列、整联蛋白β3信号肽序列、聚精氨酸肽Arg序列、富含鸟嘌呤的分子转运蛋白和甜箭肽(sweet arrow peptide)。CPP和相关应用的实例还包括美国专利号8,372,951中描述的那些。
CPP可以很容易地用于体外和离体工作,并且通常需要对每种货物和细胞类型进行广泛的优化。在一些实例中,CPP可直接共价附接至TnpB多肽,所述TnpB多肽然后与核酸组分复合并递送至细胞。在一些实例中,可以将CPP-TnpB和CPP-核酸组分单独递送至多个细胞。CPP也可用于递送RNP。
CPP可用于将组合物和系统递送至植物。在一些实例中,CPP可用于将组分递送至植物原生质体,所述植物原生质体然后再生为植物细胞并进一步再生为植物。
DNA纳米线团
在一个实施方案中,递送媒介物包括DNA纳米线团。DNA纳米线团是指DNA的球状结构(例如,具有纱球形状)。纳米线团可以通过使用有助于结构自我组装的回文序列进行滚环扩增来合成。然后可以向球体装载有效负载。DNA纳米线团的实例描述于Sun W等人,J AmChem Soc.2014年10月22日;136(42):14722-5;和Sun W等人,Angew Chem Int EdEngl.2015年10月5日;54(41):12029-33。DNA纳米线团可以具有与TnpB多肽:核酸组分核糖核蛋白复合物内的核酸组分分子部分互补的回文序列。DNA纳米线团可以被包被,例如包被有PEI以诱导内体逃逸。
金纳米颗粒
在一个实施方案中,递送媒介物包括金纳米颗粒(也称为AuNP或胶体金)。金纳米颗粒可以与货物形成复合物,例如TnpB多肽:核酸组分RNP。金纳米颗粒可以被包被,例如包被在硅酸盐和内体破坏性聚合物PAsp(DET)中。金纳米颗粒的实例包括AuraSenseTherapeutics'Spherical Nucleic Acid(SNATM)构建体,以及Mout R等人(2017).ACS Nano11:2452–8;Lee K等人(2017).Nat Biomed Eng 1:889–901中描述的那些。
iTOP
在一个实施方案中,递送媒介物包括iTOP。iTOP是指不依赖于任何转导肽,驱动天然蛋白质的高效细胞内递送的小分子的组合。iTOP可用于使用NaCl介导的高渗透压与转导化合物(丙甜菜碱)一起触发细胞对细胞外大分子的巨胞饮摄取,通过渗透作用和丙甜菜碱进行诱导转导。iTOP方法和试剂的实例包括D'Astolfo DS,Pagliero RJ,Pras A等人(2015).Cell 161:674–690中描述的那些。
聚合物基颗粒
在一个实施方案中,递送媒介物可包括聚合物基颗粒(例如,纳米颗粒)。在一个实施方案中,聚合物基颗粒可模拟病毒的膜融合机制。聚合物基颗粒可以是流感病毒机器的合成拷贝,并且与细胞经由内吞途径摄取的各种类型的核酸(siRNA、miRNA、质粒DNA或核酸组分、mRNA)形成转染复合物,这是一个涉及形成酸性隔室的过程。晚期内体中的低pH值充当化学开关,其使颗粒表面具有疏水性并且促进膜穿过。一旦进入细胞溶胶,颗粒就释放其有效负载以进行细胞作用。此活性内体逃逸技术是安全的,并且最大程度地提高了转染效率,因为所述技术使用的是天然摄取途径。在一个实施方案中,聚合物基颗粒可包含烷基化和羧烷基化的分支聚乙烯亚胺。在一些实例中,聚合物基颗粒是VIROMER,例如VIROMERRNAi、VIROMER RED、VIROMER mRNA。递送本文的系统和组合物的示例性方法包括Bawage SS等人,Synthetic mRNA expressed Cas13a mitigates RNA virus infections,biorxiv.org/content/10.1101/370460v1.full doi:doi.org/10.1101/370460,RED,a powerful tool for transfection of keratinocytes.doi:10.13140/RG.2.2.16993.61281,Transfection-Factbook 2018:technology,productoverview,users'data.,doi:10.13140/RG.2.2.23912.16642中描述的那些。
链球菌溶血素O(SLO)
递送媒介物可以是链球菌溶血素O(SLO)。SLO是A组链球菌产生的毒素,其通过在哺乳动物细胞膜上形成孔来发挥作用。SLO可以可逆的方式发挥作用,这允许将蛋白质(例如,高达100kDa)递送至细胞的细胞溶胶,而不损害整体活力。SLO的实例包括Sierig G等人(2003).Infect Immun 71:446–55;Walev I等人(2001).Proc Natl Acad Sci U S A 98:3185–90;Teng KW等人(2017).Elife6:e25460中描述的那些。
多功能包膜型纳米装置(MEND)
递送媒介物可包括多功能包膜型纳米装置(MEND)。MEND可包含浓缩的质粒DNA、PLL核心和脂质膜壳。MEND还可包含细胞穿透肽(例如,硬脂基八精氨酸)。细胞穿透肽可以位于脂质壳中。脂质包膜可以用一种或多种功能组分进行修饰,例如,以下的一种或多种:聚乙二醇(例如,增加血管循环时间)、用于靶向特定组织/细胞的配体、额外的细胞穿透肽(例如,用于更大的细胞递送)、增强内体逃逸的脂质和核递送标签。在一些实例中,MEND可以是四层MEND(T-MEND),其可以靶向细胞核和线粒体。在某些实例中,MEND可以是PEG-肽-DOPE-缀合的MEND(PPD-MEND),其可以靶向膀胱癌细胞。MEND的实例包括Kogure K等人(2004).J Control Release 98:317–23;Nakamura T等人(2012).Acc Chem Res45:1113–21中描述的那些。
脂质包被的介孔二氧化硅颗粒
递送媒介物可包含脂质包被的介孔二氧化硅颗粒。脂质包被的介孔二氧化硅颗粒可包含介孔二氧化硅纳米颗粒核和脂质膜壳。二氧化硅核可具有大的内表面积,从而导致高的货物负载能力。在一个实施方案中,可以修饰孔径、孔化学和总体颗粒大小,以装载不同类型的货物。还可以修饰颗粒的脂质包衣,以最大程度地提高货物负载,增加循环时间,并提供精确的靶向和货物释放。脂质包被的介孔二氧化硅颗粒的实例包括Du X等人(2014).Biomaterials35:5580–90;Durfee PN等人(2016).ACS Nano 10:8325–45中描述的那些。
无机纳米颗粒
递送媒介物可包括无机纳米颗粒。无机纳米颗粒的实例包括碳纳米管(CNT)(例如,如Bates K和Kostarelos K.(2013).Adv Drug Deliv Rev 65:2023–33中所述)、裸介孔二氧化硅纳米颗粒(MSNP)(例如,如Luo GF等人(2014).Sci Rep 4:6064中所述)和致密二氧化硅纳米颗粒(SiNP)(如Luo D和Saltzman WM.(2000).Nat Biotechnol18:893–5中所述)。
外来体
递送媒介物可包括外来体。外来体包括膜结合细胞外囊泡,其可以用于含有和递送各种类型的生物分子,诸如蛋白质、碳水化合物、脂质和核酸及其复合物(例如,RNP)。外来体的实例包括Schroeder A等人,J Intern Med.2010年1月;267(1):9-21;El-Andaloussi S等人,Nat Protoc.2012年12月;7(12):2112-26;Uno Y等人,Hum GeneTher.2011年6月;22(6):711-9;Zou W等人,Hum Gene Ther.2011年4月;22(4):465-75中描述的那些。示例性外来体可以由293F细胞产生,在一些情况下,装载mRNA的外来体比装载mRNA的LNP驱动更高的mRNA表达。参见,例如,J.Biol.Chem.(2021)297(5)101266
在一些实例中,外来体可以与货物的一种或多种组分形成复合物(例如,通过直接或间接结合)。在某些实例中,外来体的分子可以与第一衔接蛋白融合,并且货物的组分可以与第二衔接蛋白融合。第一和第二衔接蛋白可特异性地彼此结合,从而将货物与外来体缔合。此类外来体的实例包括在Ye Y等人,Biomater Sci.2020年4月28日doi:10.1039/d0bm00427h中描述的那些。
逆转录病毒样递送系统
递送媒介物可包括逆转录病毒样蛋白,诸如PEG10,其能够将货物掺入到病毒样颗粒中。由于此类系统可以被重新编程以包装特定货物,因此编码本文公开的TnpB系统的组分的多核苷酸可进一步用识别序列进行修饰,所述识别序列导致TnpB组分选择性包装到此类逆转录病毒样VLP中。所述VLP可以用赋予组织或细胞特异性的融合原蛋白进一步修饰。示例性系统公开于Segel等人Mammalian retrovirus-like protein PEG10 packages its own mRNA and can be pseudotyped for mRNA delivery.373 Science,882-889(2021)中,其通过引用并入本文。与其他递送方法相比,利用形成病毒样颗粒并且可以递送mRNA货物的天然蛋白质或用于细胞递送的选择性内源性衣壳化(SEND)可减少免疫原性反应。
遗传修饰的细胞和生物体
本公开还提供了包含本文的组合物和系统的一种或多种组分(例如TnpB多肽和/或核酸组分)的细胞。还提供了通过本文的系统和方法修饰的细胞,以及包含此类细胞或其后代的细胞培养物、组织、器官、生物体。在一个实施方案中,本公开提供了一种修饰细胞或生物体的方法。细胞可以是原核细胞或真核细胞。细胞可以是哺乳动物细胞。哺乳动物细胞可以是非人灵长类动物、牛、猪、啮齿动物或小鼠细胞。细胞可以是非哺乳动物真核细胞,诸如家禽、鱼或虾。细胞可以是治疗性T细胞或产生抗体的B细胞。所述细胞还可以是植物细胞。植物细胞可以是作物植物(诸如木薯、玉米、高粱、小麦或水稻)的细胞。植物细胞还可以是藻类、树木或蔬菜的细胞。通过本发明引入到细胞的修饰可以使得细胞和细胞后代被改变以改善生物产物(诸如抗体、淀粉、醇或其他期望细胞输出物)的产生。通过本发明引入到细胞的修饰可以使得细胞和细胞的后代包括使所产生的生物产物发生变化的改变。
在一个实施方案中,将驱动组合物、系统的一个或多个元件的表达的一个或多个多核苷酸分子、载体或载体系统、或包含TnpB系统的一个或多个元件的递送系统引入宿主细胞中,使得TnpB系统的元件的表达引导在一个或多个靶位点处形成TnpB靶向复合物。在本发明的一个实施方案中,宿主细胞可以是真核细胞、原核细胞或植物细胞。
在特定的实施方案中,宿主细胞是细胞系的细胞。细胞系可从本领域技术人员已知的多个来源(参见例如,美国菌种保藏中心(American Type Culture Collection)(ATCC)(Manassas,Va.))获得。在一个实施方案中,用本文所述的一种或多种载体转染的细胞用于建立包含一个或多个载体衍生序列的新细胞系。在一个实施方案中,用如本文所述的系统的组分瞬时转染(诸如通过一个或多个载体的瞬时转染,或用RNA转染)并且通过复合物的活性进行修饰的细胞用于建立新的细胞系,所述细胞系包含含有修饰但缺乏任何其他外源序列的细胞。在一个实施方案中,用本文所述的一个或多个载体瞬时或非瞬时转染的细胞或衍生自此类细胞的细胞系用于评估一种或多种测试化合物。
还旨在经分离的人细胞或组织、植物或非人动物,其包含本文任何实施方案中描述的多核苷酸分子、载体、载体系统或细胞中的一种或多种。在一个方面,提供了通过本发明的组合物、系统或修饰酶修饰的宿主细胞和细胞系或包含所述组合物、系统或修饰酶的宿主细胞和细胞系,包括(分离的)干细胞及其后代。
在一个实施方案中,植物或非人动物在植物或非人动物的至少一种组织类型中包含本文任何实施方案中所述的系统组分、多核苷酸分子、载体、载体系统或细胞中的至少一种。在一个实施方案中,非人动物在至少一种组织类型中包含本文任何实施方案中所述的系统组分、多核苷酸分子、载体、载体系统或细胞中的至少一种。在一个实施方案中,系统组分的存在是暂时的,因为它们随着时间的推移而降解。在一个实施方案中,任何实施方案中描述的包含在多核苷酸分子、载体、载体系统或细胞中的系统和组合物的组分的表达限于植物或非人动物中的某些组织类型或区域。在一个实施方案中,任何实施方案中描述的包含在多核苷酸分子、载体、载体系统或细胞中的系统和组合物的组分的表达依赖于生理信号。在一个实施方案中,任何实施方案中描述的包含在多核苷酸分子、载体、载体系统或细胞中的系统和组合物的组分的表达可以由外源分子触发。在一个实施方案中,任何实施方案中描述的包含在多核苷酸分子、载体、载体系统或细胞中的系统和组合物的组分的表达依赖于非TnpB分子在植物或非人动物中的表达。
一般应用和用途
本文所述的系统、载体系统、载体和组合物可用于各种核酸靶向应用,从而改变或修饰基因产物(诸如蛋白质)的合成、核酸切割、核酸编辑、核酸剪接;靶核酸的运输、靶核酸的追踪、靶核酸的分离、靶核酸的可视化等。
因此,本发明的方面还涵盖本文所述的组合物和系统在基因组工程中的方法和用途,例如用于在体外、体内或离体在原核或真核细胞中改变或操纵一个或多个基因或一种或多种基因产物的表达。在一些实例中,靶多核苷酸是基因组DNA(包括核基因组DNA、线粒体DNA或叶绿体DNA)内的靶序列。
通常,在TnpB系统的背景中,TnpB复合物(包含与靶序列杂交并且与一种或多种核酸靶向效应蛋白复合的核酸组分分子(ωRNA))的形成导致靶序列中或附近(例如,距离靶序列1、2、3、4、5、6、7、8、9、10、20、50或更多个碱基对内)的一条或两条DNA或RNA链的切割。如本文所用,术语“与感兴趣的靶基因座缔合的序列”是指靠近靶序列附近的序列(例如,距离靶序列1、2、3、4、5、6、7、8、9、10、20、50或更多个碱基对内,其中靶序列包含在感兴趣的靶基因座内)。
在一个实施方案中,本公开提供了一种靶向多核苷酸的方法,其包括使包含靶多核苷酸的样品(诸如细胞、细胞群、组织、器官或生物体)与组合物、系统、多核苷酸或载体接触。接触可导致基因产物的修饰或基因产物的量或表达的修饰。在一些实例中,多核苷酸的靶序列是疾病相关的靶序列。
在一个实施方案中,本公开提供了一种修饰靶多核苷酸的方法,其包括将组合物、2的一种或多种多核苷酸、或者一种或多种载体递送至包含靶多核苷酸的细胞或细胞群,其中复合物将逆转录酶引导至靶序列,并且逆转录酶促进将来自核酸组分的供体序列插入靶多核苷酸中。
靶多核苷酸的实例包括与信号传导生化途径相关的序列,例如信号传导生化途径相关基因或多核苷酸。靶多核苷酸的实例包括疾病相关基因或多核苷酸。“疾病相关”基因或多核苷酸是指与非疾病对照的组织或细胞相比,在衍生自受疾病影响的组织的细胞中以异常水平或异常形式产生转录或翻译产物的任何基因或多核苷酸。它可能是以异常高水平表达的基因;它可能是以异常低水平表达的基因,其中改变的表达与疾病的发生和/或进展相关。疾病相关基因还指代具有与引起疾病病因的基因直接相关或连锁不平衡的突变或遗传变异的基因。转录或翻译的产物可以是已知或未知的,并且可以处于正常或异常水平。
复合物的靶多核苷酸可以是真核细胞内源或外源的任何多核苷酸。例如,靶多核苷酸可以是存在于真核细胞核中的多核苷酸。靶多核苷酸可以是编码基因产物(例如,蛋白质)的序列或非编码序列(例如,调控多核苷酸或垃圾DNA)。不希望受理论束缚,据信靶序列应当缔合TAM(靶向相邻基序);即,复合物识别的短序列。TAM的精确序列和长度要求根据所使用的TnpB多肽而有所不同,但TAM通常是与原间隔序列(即,靶序列)相邻的2-5个碱基对序列。TAM特异性可以例如根据图8中描述的实验设定来确定。在一个实施方案中,TAM序列包含TCA。在实施方案中,TAM序列是TCAN,其中N可包含任何核苷酸。在一个实施方案中,TAM序列包含TCAG或TCAT。技术人员将能够鉴定与给定TnpB多肽一起使用的另外的TAM序列。此外,TAM相互作用(PI)结构域的工程化可允许对TAM特异性进行编程,提高靶位点识别保真度,并且增加TnpB多肽、基因组工程平台的多功能性。TnpB多肽可被工程化以改变其TAM特异性,例如,如Kleinstiver BP等人Engineered CRISPR-Cas9 nucleases with alteredTAMspecificities.Nature.2015年7月23日;523(7561):481-5.doi:10.1038/nature14592中所述。
靶多核苷酸的实例包括与信号传导生化途径相关的序列,例如信号传导生化途径相关基因或多核苷酸。靶多核苷酸的实例包括疾病相关基因或多核苷酸。“疾病相关”基因或多核苷酸是指与非疾病对照的组织或细胞相比,在衍生自受疾病影响的组织的细胞中以异常水平或异常形式产生转录或翻译产物的任何基因或多核苷酸。它可能是以异常高水平表达的基因;它可能是以异常低水平表达的基因,其中改变的表达与疾病的发生和/或进展相关。疾病相关基因还指代具有与引起疾病病因的基因直接相关或连锁不平衡的突变或遗传变异的基因。转录或翻译的产物可以是已知或未知的,并且可以处于正常或异常水平。
本发明的方面涉及一种靶向多核苷酸的方法,其包括使包含所述多核苷酸的样品与以下接触:如本文任何实施方案中所述的组合物、系统或TnpB多肽、包含如本文任何实施方案中所述的组合物、系统或TnpB多肽的递送系统、包含如本文任何实施方案中所述的组合物、系统或TnpB多肽的多核苷酸、包含如本文任何实施方案中所述的组合物、系统或TnpB多肽的载体或包含如本文任何实施方案中所述的组合物、系统或TnpB多肽的载体系统。在一个实施方案中,靶多核苷酸与至少两种不同的组合物、系统或TnpB多肽接触。在其他实施方案中,两种不同的TnpB多肽具有不同的靶多核苷酸特异性或特异性程度。在一个实施方案中,两种不同的TnpB多肽具有不同的TAM特异性。
还设想了靶向多核苷酸的方法,其包括使包含多核苷酸的样品与本文的组合物和系统、载体、多核苷酸接触,其中接触导致基因产物的修饰或基因产物的量或表达的修饰。在一个实施方案中,通过所述方法增加靶向的基因产物的表达。在一个实施方案中,靶向的基因产物的表达增加了至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%。在一个实施方案中,靶向的基因产物的表达增加了至少1.5倍、至少2倍、至少2.5倍、至少3倍、至少3.5倍、至少3.5倍、至少4倍、至少4.5倍、至少5倍、至少10倍、至少10倍、至少15倍、至少20倍、至少25倍、至少50倍、至少100倍。在一个实施方案中,靶向的基因产物的表达降低了至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少100%。在一个实施方案中,靶向的基因产物的表达降低了至少1.5倍、至少2倍、至少2.5倍、至少3倍、至少3.5倍、至少3.5倍、至少4倍、至少4.5倍、至少5倍、至少10倍、至少10倍、至少15倍、至少20倍、至少25倍、至少50倍、至少100倍。在替代的实施方案中,通过所述方法降低靶向的基因产物的表达。在其他实施方案中,靶向基因的表达可以被完全消除,或者当靶向基因的残余表达水平低于本领域已知的用于量化、检测或监测基因表达水平的方法的检测限时,可以认为靶向基因的表达被消除。
在一个实施方案中,将驱动TnpB系统的一个或多个元件的表达的一个或多个多核苷酸分子、载体或载体系统、或包含TnpB系统的一个或多个元件的递送系统引入宿主细胞中,使得TnpB系统的元件的表达引导在一个或多个靶位点处形成TnpB靶向复合物。在本发明的一个实施方案中,宿主细胞可以是真核细胞、原核细胞或植物细胞。
在特定的实施方案中,宿主细胞是细胞系的细胞。细胞系可从本领域技术人员已知的多个来源(参见例如,美国菌种保藏中心(ATCC)(Manassas,Va.))获得。在一个实施方案中,用本文所述的一种或多种载体转染的细胞用于建立包含一个或多个载体衍生序列的新细胞系。在一个实施方案中,用如本文所述的组合物或系统的组分瞬时转染(诸如通过一个或多个载体的瞬时转染,或用RNA转染)并且通过复合物的活性进行修饰的细胞用于建立新的细胞系,所述细胞系包含含有修饰但缺乏任何其他外源序列的细胞。在一个实施方案中,用本文所述的一个或多个载体瞬时或非瞬时转染的细胞或衍生自此类细胞的细胞系用于评估一种或多种测试化合物。
还旨在经分离的人细胞或组织、植物或非人动物,其包含本文任何实施方案中描述的多核苷酸分子、载体、载体系统或细胞中的一种或多种。在一个方面,提供了通过本发明的组合物、系统或修饰酶修饰的宿主细胞和细胞系或包含所述组合物、系统或修饰酶的宿主细胞和细胞系,包括(分离的)干细胞及其后代。
在一个实施方案中,植物或非人动物在植物或非人动物的至少一种组织类型中包含本文任何实施方案中所述的组合物、多核苷酸分子、载体、载体系统或细胞中的至少一种。在某些实施方案中,非人动物在至少一种组织类型中包含本文任何实施方案中所述的组合物、多核苷酸分子、载体、载体系统或细胞中的至少一种。在一个实施方案中,组合物的存在是暂时的,因为它们随着时间的推移而降解。在一个实施方案中,任何实施方案中描述的包含在多核苷酸分子、载体、载体系统或细胞中的组合物的表达限于植物或非人动物中的某些组织类型或区域。在一个实施方案中,任何实施方案中描述的包含在多核苷酸分子、载体、载体系统或细胞中的组合物的表达依赖于生理信号。在一个实施方案中,任何实施方案中描述的包含在多核苷酸分子、载体、载体系统或细胞中的组合物的表达可以由外源分子触发。在一个实施方案中,任何实施方案中描述的包含在多核苷酸分子、载体、载体系统或细胞中的组合物的表达依赖于非Cas分子在植物或非人动物中的表达。
在一个方面,本发明提供了用于使用TnpB系统的一个或多个元件的方法。本发明的TnpB靶向复合物提供了一种用于修饰靶DNA或RNA(单链或双链、线性或超螺旋)的有效方式。本发明的TnpB靶向复合物具有多种用途,包括修饰(例如,缺失、插入、易位、失活、活化)多种细胞类型中的靶DNA或RNA。因此,本发明的TnpB靶向复合物在例如基因疗法、药物筛选、疾病诊断和预后中具有广泛的应用。示例性TnpB靶向复合物包含DNA或RNA靶向效应蛋白,所述DNA或RNA靶向效应蛋白与核酸组分分子复合,所述核酸组分分子与感兴趣的靶基因座内的靶序列杂交。
在一个实施方案中,本发明提供了一种切割靶多核苷酸的方法。方法可包括使用与靶多核苷酸结合的TnpB靶向复合物来修饰靶多核苷酸,并且实现所述靶多核苷酸的切割。在实施方案中,本发明的TnpB靶向复合物在引入到细胞中时可以在多核苷酸序列中产生断裂(例如,单链或双链断裂)。例如,方法可以用于切割细胞中的疾病多核苷酸。例如,可以将包含侧接上游序列和下游序列的待整合序列的外源模板引入细胞中。上游和下游序列与多核苷酸中整合位点的任一侧具有序列相似性。外源模板包含待整合的序列(例如,突变的RNA)。用于整合的序列可以是细胞内源或外源的序列。待整合的序列的实例包括编码蛋白质的多核苷酸或非编码RNA(例如,微小RNA)。因此,用于整合的序列可以可操作地连接至一个或多个适当的控制序列。或者,待整合的序列可提供调控功能。选择重组模板中的上游和下游序列以促进感兴趣的RNA序列与重组之间的重组。上游序列是与用于整合的靶位点上游的序列具有序列相似性的多核苷酸序列。类似地,下游序列是与用于整合的靶位点下游的多核苷酸序列具有序列相似性的多核苷酸序列。重组模板中的上游和下游序列可以与靶向序列具有75%、80%、85%、90%、95%或100%的序列同一性。优选地,重组模板中的上游和下游序列与靶向序列具有约95%、96%、97%、98%、99%或100%的序列同一性。在一些方法中,重组模板中的上游和下游序列与靶序列具有约99%或100%的序列同一性。上游或下游序列可包含约20bp至约2500bp,例如约50、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400或2500bp。在一些方法中,示例性上游或下游序列具有约200bp至约2000bp、约600bp至约1000bp、或更特别地约700bp至约1000bp。在一些方法中,重组模板还可包含标志物。此种标志物可以使筛选靶向整合变得容易。合适的标志物的实例包括限制性位点、荧光蛋白或选择性标志物。本发明的重组模板可以使用重组技术构建(参见例如Sambrook等人,2001和Ausubel等人,1996)。在用于通过整合重组模板来修饰靶序列的方法中,通过TnpB靶向复合物将断裂(例如,双链或单链DNA或RNA中的双链或单链断裂)引入DNA或RNA序列中,所述断裂经由与重组模板的同源重组来修复,使得模板整合到靶标中。双链断裂的存在有利于模板的整合。在其他实施方案中,本发明提供了一种修饰真核细胞中的RNA表达的方法。方法包括通过使用结合DNA或RNA(例如,mRNA或前mRNA)的TnpB靶向复合物来增加或降低靶多核苷酸的表达。在一些方法中,可以使靶标失活以影响细胞中表达的修饰。例如,当TnpB靶向复合物与细胞中的靶序列结合时,使靶标失活,使得序列不被翻译,不产生编码的蛋白质,或者序列不发挥野生型序列的功能。例如,可以使蛋白质或微小RNA编码序列失活,使得不产生蛋白质或微小RNA或前微小RNA转录物。TnpB靶向复合物的靶标可以是真核细胞内源或外源的任何多核苷酸。例如,靶多核苷酸可以是存在于真核细胞核中的多核苷酸。靶多核苷酸可以是编码基因产物(例如,蛋白质)的序列或非编码序列(例如,ncRNA、lncRNA、tRNA或rRNA)。靶RNA的实例包括与信号传导生化途径相关的序列,例如信号传导生化途径相关多核苷酸。靶多核苷酸的实例包括疾病相关多核苷酸。“疾病相关”多核苷酸是指与非疾病对照的组织或细胞相比,在衍生自受疾病影响的组织的细胞中以异常水平或异常形式产生翻译产物的任何多核苷酸。它可能是以异常高水平表达的基因;它可能是以异常低水平表达的基因,其中改变的表达与疾病的发生和/或进展相关。疾病相关多核苷酸还指代具有与引起疾病病因的基因直接相关或连锁不平衡的突变或遗传变异的基因。翻译的产物可以是已知或未知的,并且可以处于正常或异常水平。TnpB靶向复合物的靶RNA可以是真核细胞内源或外源的任何多核苷酸。例如,靶RNA可以是存在于真核细胞核中的RNA。靶多核苷酸可以是编码基因产物(例如,蛋白质)的序列或非编码序列(例如,ncRNA、lncRNA、tRNA或rRNA)。
在一个实施方案中,方法可包括允许组合物与靶DNA或RNA结合以实现所述靶DNA或RNA的切割,从而修饰靶DNA或RNA,其中TnpB靶向复合物包含核酸靶向效应蛋白,其与核酸组分分子复合,所述核酸组分分子与所述靶DNA或RNA内的靶序列杂交。在一个方面,本发明提供了一种修饰真核细胞中的DNA或RNA表达的方法。在一个实施方案中,方法包括允许TnpB靶向复合物与DNA或RNA结合,使得所述结合导致所述DNA或RNA的表达增加或降低;其中TnpB靶向复合物包含与核酸组分分子复合的核酸靶向效应蛋白。类似的考虑因素和条件如上所述适用于修饰靶DNA或RNA的方法。事实上,这些取样、培养和重新引入选项适用于本发明的各个方面。在一个方面,本发明提供了修饰真核细胞中的靶DNA或RNA的方法,所述方法可以在体内、离体或体外进行。在一个实施方案中,方法包括对来自人类或非人动物的细胞或细胞群进行取样,并且修饰所述一个或多个细胞。培养可以在任何离体阶段进行。甚至可以将一个或多个细胞重新引入到非人动物或植物中。对于重新引入的细胞,特别优选细胞是干细胞。如本文任何实施方案中所述的组合物可用于检测核酸标识符。核酸标识符是可用于鉴定特定制品的非编码核酸。示例性核酸标识符,诸如DNA水印,描述于Heider和Barnekow."DNA watermarks:A proof of concept"BMC Molecular Biology 9:40(2008)。核酸标识符还可以是核酸条形码。基于核酸的条形码是短的核苷酸序列(例如,DNA、RNA或其组合),其用作相关分子(诸如靶分子和/或靶核酸)的标识符。核酸条形码可以具有至少例如4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、60、70、80、90或100个核苷酸的长度,并且可以是单链或双链形式。一种或多种核酸条形码可以附接或“标记”至靶分子和/或靶核酸。此附接可以是直接的(例如,条形码与靶分子的共价或非共价结合)或间接的(例如,经由额外的分子,例如特异性结合剂,诸如抗体(或其他蛋白质)或条形码接收衔接子(或其他核酸分子)。靶分子和/或靶核酸可以以组合方式(诸如核酸条形码多联体)用多个核酸条形码标记。通常,核酸条形码用于鉴定来自特定区室(例如,离散体积)的、具有特定物理性质(例如,亲和力、长度、序列等)的或已经历某些治疗条件的靶分子和/或靶核酸。靶分子和/或靶核酸可以与多个核酸条形码缔合以提供关于所有这些特征(以及更多)的信息。产生核酸条形码的方法公开于例如国际专利申请公开号WO/2014/047561中。
在实施方案中,组合物诱导双链断裂以诱导HDR介导的校正。在另一个实施方案中,与TnpB多肽或其直系同源物或同源物复合的两个或更多个核酸组分分子可用于诱导多重断裂,以诱导HDR介导的校正。
本文使用的术语重组模板核酸是指可以与本文公开的组合物结合使用以改变靶位置的结构的核酸序列。在实施方案中,对靶核酸进行修饰以具有通常在切割位点处或附近的重组模板核酸的一些或全部序列。在实施方案中,重组模板核酸是单链的。在替代的实施方案中,重组模板核酸是双链的。在实施方案中,重组模板核酸是DNA,例如双链DNA。在替代的实施方案中,重组模板核酸是单链DNA。
在一个实施方案中,提供重组模板以充当同源重组中的模板,诸如在被作为TnpB靶向复合物的一部分的核酸靶向效应蛋白切口或切割的靶序列内或附近。
重组模板可以是本文所述的另一种载体的组分,包含在单独的载体中,或作为单独的多核苷酸提供。重组模板多核苷酸可以具有任何合适的长度,诸如长度为约或大于约10、15、20、25、50、75、100、150、200、500、1000或更多个核苷酸。在一个实施方案中,重组模板多核苷酸与包含靶序列的多核苷酸的一部分互补。当最佳比对时,重组模板多核苷酸可以与靶序列的一个或多个核苷酸重叠(例如,约或大于约1、5、10、15、20、25、30、35、40、45、50、60、70、80、90、100或更多个核苷酸)。在一个实施方案中,当重组模板序列和包含靶序列的多核苷酸最佳比对时,重组模板多核苷酸的最近的核苷酸在距靶序列约1、5、10、15、20、25、50、75、100、200、300、400、500、1000、5000、10000或更多个核苷酸内。
在实施方案中,重组模板核酸通过参与同源重组来改变靶位置的结构。在实施方案中,重组模板核酸改变靶位置的序列。在实施方案中,重组模板核酸导致修饰的或非天然存在的碱基掺入到靶核酸中。
重组模板序列可经历与靶序列的断裂介导的或催化的重组。在实施方案中,重组模板核酸可包括对应于靶序列上的位点的序列,所述靶序列被TnpB多肽介导的切割事件切割。在实施方案中,重组模板核酸可以包括对应于以下两者的序列:在第一TnpB多肽介导的事件中被切割的靶序列上的第一位点和在第二TnpB多肽介导的事件中被切割的靶序列上的第二位点。
在一个实施方案中,重组模板核酸可以包括导致翻译序列的编码序列改变的序列,例如导致蛋白质产物中一个氨基酸取代为另一个氨基酸的序列,所述取代例如将突变体等位基因转化为野生型等位基因、将野生型等位基因转化为突变体等位基因和/或引入终止密码子、插入氨基酸残基、缺失氨基酸残基或无义突变。在一个实施方案中,重组模板核酸可以包括导致非编码序列改变(例如,外显子或5'或3'非翻译或非转录区域的改变)的序列。此类改变包括控制元件(例如启动子、增强子)的改变以及顺式作用或反式作用控制元件的改变。
与靶基因中的靶位置具有同源性的重组模板核酸可用于改变靶序列的结构。重组模板序列可用于改变不需要的结构,例如不需要的或突变的核苷酸。重组模板核酸可包括在整合时导致以下的序列:降低正对照元件的活性;增加正对照元件的活性;降低负对照元件的活性;增加负对照元件的活性;降低基因的表达;增加基因的表达;增加对病症或疾病的抵抗力;增强对病毒侵入的抵抗力;校正突变或改变不需要的氨基酸残基,赋予、增加、消除或降低基因产物的生物学特性,例如增加酶的酶活性,或增加基因产物与另一个分子相互作用的能力。
重组模板核酸可包括导致以下的序列:靶序列的1、2、3、4、5、6、7、8、9、10、11、12或更多个核苷酸的序列改变。在实施方案中,重组模板核酸的长度可以是20+/-10、30+/-10、40+/-10、50+/-10、60+/-10、70+/-10、80+/-10、90+/-10、100+/-10、110+/-10、120+/-10、130+/-10、140+/-10、150+/-10、160+/-10、170+/-10、1 80+/-10、190+/-10、200+/-10、210+/-10或220+/-10个核苷酸。在实施方案中,重组模板核酸的长度可以是30+/-20、40+/-20、50+/-20、60+/-20、70+/-20、80+/-20、90+/-20、100+/-20、1 10+/-20、120+/-20、130+/-20、140+/-20、I 50+/-20、160+/-20、170+/-20、180+/-20、190+/-20、200+/-20、210+/-20或220+/-20个核苷酸。在实施方案中,重组模板核酸的长度是10至1,000、20至900、30至800、40至700、50至600、50至500、50至400、50至300、50至200或50至100个核苷酸。
重组模板核酸包含以下组分:[5'同源臂]-[替换序列]-[3'同源臂]。同源臂将重组提供到染色体中,从而用替换序列替换不期望的元件,例如突变或标记。在实施方案中,同源臂侧接最远端切割位点。在实施方案中,5'同源臂的3'端是紧邻替换序列的5'端的位置。在实施方案中,5'同源臂可以从替换序列的5'端向5'延伸至少10、20、30、40、50、100、200、300、400、500、600、700、800、900、1000、1500或2000个核苷酸。在实施方案中,3'同源臂的5'端是紧邻替换序列的3'端的位置。在实施方案中,3'同源臂可以从替换序列的3'端向3'延伸至少10、20、30、40、50、100、200、300、400、500、600、700、800、900、1000、1500或2000个核苷酸。
在一个实施方案中,可缩短一个或两个同源臂以避免包括某些序列重复元件。例如,可缩短5'同源臂以避免序列重复元件。在其他实施方案中,可缩短3'同源臂以避免序列重复元件。在一个实施方案中,可缩短5'和3'同源臂两者以避免包括某些序列重复元件。
在一个实施方案中,用于校正突变的重组模板核酸可被设计用作单链寡核苷酸。当使用单链寡核苷酸时,5'和3'同源臂的长度范围可高达约200个碱基对(bp),例如长度为至少25、50、75、100、125、150、175或200bp。
与TnpB多肽介导的基因敲除(通过在DNA水平突变基因来永久消除表达)不同,TnpB多肽敲除允许通过使用人工转录因子来暂时减少基因表达。使TnpB多肽的两个DNA切割结构域中的关键残基突变,导致产生催化失活的TnpB多肽。催化失活的TnpB多肽与核酸组分分子复合,并且定位于由所述核酸组分分子的靶向结构域指定的DNA序列,然而,它不切割靶DNA。失活TnpB多肽蛋白与效应结构域(例如,转录阻遏结构域)的融合使得能够将效应子募集至由核酸组分分子指定的任何DNA位点。在一个实施方案中,TnpB多肽可融合至转录阻遏结构域并且被募集至基因的启动子区域。特别是对于基因阻遏,本文考虑阻断内源转录因子的结合位点将有助于下调基因表达。在另一个实施方案中,失活的TnpB多肽可以与染色质修饰蛋白融合。改变染色质状态可以导致靶基因表达降低。
在实施方案中,可以将核酸组分分子靶向已知的转录反应元件(例如,启动子、增强子等)、已知的上游活化序列(UAS)和/或怀疑能够控制靶DNA的表达的功能已知或未知的序列。
在一些方法中,可以使靶多核苷酸失活以影响细胞中表达的修饰。例如,当组合物与细胞中的靶序列结合时,使靶多核苷酸失活,使得序列不被转录,不产生编码的蛋白质,或者序列不发挥野生型序列的功能。例如,可以使蛋白质或微小RNA编码序列失活,使得不产生蛋白质。
非同源末端连接
在一个实施方案中,核酸酶诱导的非同源末端接合(NHEJ)可以用于靶向基因特异性敲除。核酸酶诱导的NHEJ还可以用于去除(例如,缺失)感兴趣的基因中的序列。一般来讲,NHEJ通过将两端接合在一起来修复DNA中的双链断裂;然而,一般来讲,只有在两个相容末端(与双链断裂形成的完全相同)完美连接的情况下,原始序列才能恢复。双链断裂的DNA末端经常是酶处理的对象,从而导致在末端重新接合之前在一条或两条链处添加或去除核苷酸。这导致DNA序列的NHEJ修复位点处存在插入和/或缺失(插入缺失)突变。这些突变中的三分之二通常改变阅读框,并且因此产生无功能的蛋白质。此外,维持阅读框但插入或缺失大量序列的突变可能会破坏蛋白质的功能。这是基因座依赖性的,因为关键功能结构域中的突变可能比蛋白质的非关键区域中的突变更难以容忍。NHEJ产生的插入缺失突变本质上是不可预测的;然而,在给定的断裂位点处,某些插入缺失序列是有利的并且在群体中过表示,这可能是由于微同源性区域较小。缺失的长度可以有很大差异;最常见在1-50bp范围内,但它们可以容易地大于50bp,例如,它们可以容易地达到大于约100-200bp。插入趋于较短,并且通常包括紧邻断裂位点的序列的短重复。然而,可以获得大的插入,并且在这些情况下,插入的序列通常追溯至基因组的其他区域或细胞中存在的质粒DNA。
因为NHEJ是一种诱变过程,所以它也可用于缺失小序列基序,只要不需要产生特定的最终序列即可。如果双链断裂靶向短靶序列附近,则NHEJ修复引起的缺失突变通常跨越并因此去除不需要的核苷酸。对于较大DNA区段的缺失,引入两个双链断裂(序列的每侧各一个)可以导致末端之间的NHEJ,同时去除完整的间插序列。这两种方法都可以用来缺失特定的DNA序列;然而,NHEJ的易错性质仍可能在修复位点处产生插入缺失突变。
双链切割TnpB多肽或其直系同源物或同源物以及单链或切口酶TnpB多肽或其直系同源物或同源物分子均可用于本文所述的方法和组合物以产生NHEJ介导的插入缺失。靶向基因(例如编码区,例如感兴趣的基因的早期编码区)的NHEJ介导的插入缺失可以用于敲除感兴趣的基因(即,消除其表达)。例如,感兴趣的基因的早期编码区包括紧接在转录起始位点之后、在编码序列的第一外显子内、或在转录起始位点的500bp内(例如,小于500、450、400、350、300、250、200、150、100或50bp)的序列。
在实施方案中,其中核酸组分分子和TnpB多肽或其直系同源物或同源物产生双链断裂以诱导NHEJ介导的插入缺失,RNA组分分子可以被配置为将一个双链断裂定位成紧密接近靶位置的核苷酸。在实施方案中,切割位点可以距离靶位置0-500bp(例如,距离靶位置小于500、400、300、200、100、50、40、30、25、20、15、10、9、8、7、6、5、4、3、2或1bp)。
在实施方案中,其中与TnpB多肽或其直系同源物或同源物(例如,TnpB多肽切口酶)复合的两个核酸组分分子诱导两个单链断裂以诱导NHEJ介导的插入缺失,两个核酸组分分子可以被配置为将两个单链断裂定位成向NHEJ修复提供靶位置的核苷酸。
在一些实例中,本文的系统可经由NHEJ途径来引入一个或多个插入缺失,并且经由HDR来插入来自组合模板的序列。
示例性应用
本发明提供了一种用于在体内、离体或体外修饰靶细胞的非天然存在的或工程化的组合物、或编码所述组合物的组分的一种或多种多核苷酸、或包含编码所述组合物的组分的一种或多种多核苷酸的载体或递送系统,并且可以以改变细胞的方式进行,使得一旦被修饰,TnpB多肽修饰的细胞的后代或细胞系保留改变的表型。修饰的细胞和后代可以是多细胞生物体(诸如植物或动物)的一部分,其中将组合物离体或体内应用至期望的细胞类型。本文的方法包括治疗性的治疗方法。治疗性的治疗方法可包括基因或基因组编辑、或基因疗法。
在一个实施方案中,本文所述的一种或多种载体用于产生非人转基因动物或转基因植物。在一个实施方案中,转基因动物是哺乳动物,诸如小鼠、大鼠或兔。用于产生转基因动物和植物的方法是本领域已知的,并且通常以细胞转染方法(诸如本文所述的)开始。
正交催化失活的TnpB多肽的用途
在特定的实施方案中,TnpB多肽切口酶与正交催化失活的TnpB多肽组合使用以增加所述切口酶的效率(例如,如Chen等人2017,Nature Communications 8:14958;doi:10.1038/ncomms14958中所述)。更特别地,正交催化失活的TnpB多肽的特征在于与AD官能化组合物中使用的TnpB切口酶不同的TAM识别位点,并且选择对应的核酸组分分子序列来结合与官能化TnpB多肽的切口酶的靶序列邻近的靶序列。如本发明的上下文中所用的正交催化失活的TnpB多肽不形成官能化组合物的一部分,而仅发挥增加所述切口酶效率的作用,并且与如本领域中所述的用于所述TnpB多肽的标准核酸组分组合使用。在特定的实施方案中,所述正交催化失活的TnpB多肽是死亡的TnpB多肽,即包含消除所述TnpB多肽的核酸酶活性的一个或多个突变。在特定的实施方案中,催化失活的正交TnpB多肽具有能够与和切口酶的靶序列邻近的靶序列杂交的两个或更多个核酸组分。在特定的实施方案中,至少两种核酸组分用于靶向所述催化失活的TnpB多肽,其中至少一种核酸组分能够与官能化组合物的切口酶的靶序列5'处的靶序列杂交,并且至少一种核酸组分能够与所述切口酶的靶序列3'处的靶序列杂交,由此所述一个或多个靶序列可以位于与TnpB切口酶的靶序列相同或相反的DNA链上。在特定的实施方案中,选择正交催化失活的TnpB多肽的一种或多种ω核酸组分的指导序列,使得靶序列与用于靶向功能化组合物(例如,用于靶向切口酶)的核酸组分的序列接近。在特定的实施方案中,正交催化失活的TnpB多肽的一个或多个靶序列各自与切口酶的靶序列相隔多于5个但少于450个碱基对。与正交催化失活的TnpB多肽一起使用的核酸组分分子的靶序列与官能化组合物的靶序列之间的最佳距离可以由技术人员确定。在特定的实施方案中,催化失活的正交TnpB多肽已被修饰以改变其如本文别处所述的TAM特异性。在特定的实施方案中,TnpB多肽切口酶是其本身在人细胞中具有有限活性的切口酶,但是其与无活性的正交TnpB多肽和一种或多种对应的近端核酸组分分子组合以确保所需的切口酶活性。
诸如FISH的检测方法
在一个方面,本发明提供了一种包含本文所述的催化失活的TnpB多肽的经工程化、非天然存在的组合物,以及此系统在检测方法(诸如荧光原位杂交(FISH))中的用途。缺乏产生DNA双链断裂的能力的死亡TnpB多肽可以与标志物(诸如荧光蛋白,诸如增强的绿色荧光蛋白(eEGFP))融合,并且与小核酸组分分子共表达,以在体内靶向近中心(pericentric)、中心和远距重复。死亡的TnpB多肽系统可用于可视化人类基因组中的重复序列和单个基因两者。标记的死亡TnpB多肽的此类新应用对于细胞成像和功能性核结构研究可能很重要,特别是在小细胞核体积或复杂3-D结构的情况下。(Chen B,Gilbert LA,Cimini BA,Schnitzbauer J,Zhang W,Li GW,Park J,Blackburn EH,Weissman JS,Qi LS,Huang B.2013.Dynamic imaging of genomic lociin living human cells by anoptimized CRISPR/Cas system.Cell 155(7):1479-91.doi:10.1016/j.cell.2013.12.001)。
患者特异性筛选方法
可以使用靶向DNA(例如,三核苷酸重复)的核酸靶向系统来筛选患者或患者样品中是否存在此类重复。所述重复可以是TnpB系统的ωRNA的靶标,并且如果通过TnpB系统存在与所述ωRNA的结合,则可以检测所述结合,从而表明存在此种重复。因此,可以使用TnpB系统来筛选患者或患者样品中是否存在重复。然后可以向患者施用合适的化合物来治疗病状;或者,可以施用TnpB系统以结合并引起插入、缺失或突变并缓解病状。
遗传和表观遗传条件模型
可使用本发明的方法来产生可用于建模和/或研究感兴趣的遗传或表观遗传条件的植物、动物或细胞,诸如通过感兴趣的突变模型或疾病模型。如本文所用,“疾病”是指受试者的疾病、病症或适应症。例如,可使用本发明的方法来产生包含与疾病相关的一个或多个核酸序列的修饰的动物或细胞,或者其中与疾病相关的一个或多个核酸序列的表达被改变的植物、动物或细胞。此种核酸序列可编码疾病相关蛋白质序列或者可以是疾病相关的控制序列。因此,应当理解,在本发明的实施方案中,植物、受试者、患者、生物体或细胞可以是非人受试者、患者、生物体或细胞。因此,本发明提供了通过本发明的方法产生的植物、动物或细胞或其后代。后代可以是产生的植物或动物的克隆,或者可能由通过与同一物种的其他个体杂交以将进一步期望的性状渗入其后代的有性生殖产生。在多细胞生物体、特别是动物或植物的情况下,细胞可以是体内或离体的。在培养细胞的情况下,如果满足适当的培养条件并且优选地如果细胞适用于此目的(例如干细胞),则可以建立细胞系。还设想了通过本发明产生的细菌细胞系。因此,还设想了细胞系。
在一些方法中,疾病模型可以用于使用疾病研究中常用的量度来研究突变对动物或细胞以及疾病的发展和/或进展的影响。或者,此种疾病模型可用于研究药学活性化合物对疾病的影响。
在一些方法中,疾病模型可以用于评估潜在基因疗法策略的功效。即,可以修饰疾病相关基因或多核苷酸,使得抑制或减少疾病的发展和/或进展。特别地,方法包括修饰疾病相关基因或多核苷酸,使得产生改变的蛋白质,并且因此动物或细胞具有改变的反应。因此,在一些方法中,可以将遗传修饰的动物与容易发展疾病的动物进行比较,使得可以评估基因疗法事件的作用。
在另一个实施方案中,本发明提供了一种开发调节与疾病基因相关的细胞信号传导事件的生物活性剂的方法。方法包括使测试化合物与细胞接触,所述细胞包含一个或多个载体和与指导/间隔序列连接的保守核苷酸序列,所述载体驱动TnpB多肽中的一种或多种的表达;以及检测读数的变化,所述变化指示与例如细胞中含有的疾病基因的突变相关的细胞信号传导事件的减少或增加。
细胞模型或动物模型可以与本发明的用于筛选细胞功能变化的方法组合构建。此种模型可用于研究由本发明的复合物修饰的基因组序列对感兴趣的细胞功能的影响。例如,细胞功能模型可用于研究修饰的基因组序列对细胞内信号传导或细胞外信号传导的影响。或者,细胞功能模型可用于研究修饰的基因组序列对感官知觉的影响。在一些此类模型中,与模型中的信号传导生化途径相关的一个或多个基因组序列被修饰。
已经专门研究了若干种疾病模型。这些包括新发自闭症风险基因CHD8、KATNAL2和SCN2A;以及综合征性自闭症(天使综合征)基因UBE3A。这些基因和所得自闭症模型当然是优选的,但用于显示本发明在基因和对应模型中的广泛适用性。与信号传导生化途径相关的一个或多个基因组序列的改变的表达可以通过测定当测试模型细胞和对照细胞与候选剂接触时,测试模型细胞与对照细胞之间的对应基因的mRNA水平的差异来确定。或者,与信号传导生化途径相关的序列的差异表达通过检测所编码的多肽或基因产物的水平的差异来确定。
为了测定mRNA转录物或对应多核苷酸水平的剂诱导的改变,首先根据本领域的标准方法提取样品中含有的核酸。例如,可以根据Sambrook等人(1989)中阐述的程序使用各种裂解酶或化学溶液来分离mRNA,或者按照制造商提供的随附说明书通过核酸结合树脂来提取mRNA。然后根据本领域广泛已知的方法或基于本文举例说明的方法,通过扩增程序或常规杂交测定(例如,Northern印迹分析)来检测提取的核酸样品中含有的mRNA。
出于本发明的目的,扩增意指采用能够以合理保真度复制靶序列的引物和聚合酶的任何方法。扩增可以通过天然或重组DNA聚合酶进行,诸如TaqGoldTM、T7 DNA聚合酶、大肠埃希氏菌DNA聚合酶的Klenow片段和逆转录酶。优选的扩增方法是PCR。特别地,可以对分离的RNA进行与定量聚合酶链反应(RT-PCR)偶联的逆转录测定,以便量化与信号传导生化途径相关的序列的表达水平。
基因表达水平的检测可以在扩增测定中实时进行。在一个方面,扩增产物可以用荧光DNA结合剂直接可视化,所述结合剂包括但不限于DNA嵌入剂和DNA小沟结合剂。由于掺入双链DNA分子中的嵌入剂的量通常与扩增的DNA产物的量成正比,因此可以通过使用本领域的常规光学系统量化嵌入染料的荧光来方便地确定扩增产物的量。适用于此应用的DNA结合染料包括SYBR绿、SYBR蓝、DAPI、碘化丙啶、Hoeste、SYBR金、溴化乙锭、吖啶、普罗黄素(proflavine)、吖啶橙(acridine orange)、吖啶黄(acriflavine)、氟香豆素(fluorcoumanin)、玫瑰树碱(ellipticine)、道诺霉素(daunomycin)、氯喹(chloroquine)、偏端霉素D(distamycin D)、色霉素(chromomycin)、胡米溴铵(homidium)、光辉霉素(mithramycin)、多吡啶钌(ruthenium polypyridyls)、蒽霉素(anthramycin)等。
在另一个方面,其他荧光标记(诸如序列特异性探针)可以用于扩增反应以促进扩增产物的检测和定量。基于探针的定量扩增依赖于期望的扩增产物的序列特异性检测。它利用荧光、靶特异性探针(例如,探针),从而导致特异性和灵敏度增加。用于进行基于探针的定量扩增的方法在本领域中已被充分确立,并且在美国专利号5,210,015中教导。
在又另一个方面,可以使用与信号传导生化途径相关的序列具有序列同源性的杂交探针进行常规杂交测定。通常,在杂交反应中,允许探针与测试受试者衍生的生物样品中含有的与信号传导生化途径相关的序列形成稳定复合物。本领域技术人员应当理解,在使用反义核酸作为探针核酸的情况下,样品中提供的靶多核苷酸被选择为与反义核酸的序列互补。相反,在核苷酸探针是有义核酸的情况下,靶多核苷酸被选择为与有义核酸的序列互补的。
杂交可以在各种严格条件下执行。用于实践本发明的合适的杂交条件使得探针和与信号传导生化途径相关的序列之间的识别相互作用具有足够的特异性和足够的稳定性。提高杂交反应严格性的条件是本领域广泛已知和公开的。参见,例如,(Sambrook等人,(1989);Nonradioactive In Situ Hybridization Application Manual,BoehringerMannheim,第二版)。杂交测定可以使用固定在任何固体支持物上的探针来形成,所述固体支持物包括但不限于硝基纤维素、玻璃、硅和多种基因阵列。优选的杂交测定在如美国专利号5,445,934中所述的高密度基因芯片上进行。
为了方便检测在杂交测定期间形成的探针-靶标复合物,将核苷酸探针与可检测标记缀合。适用于本发明的可检测标记包括可通过光化学、生物化学、光谱、免疫化学、电学、光学或化学方式检测的任何组合物。多种适当的可检测标记是本领域已知的,其包括荧光或化学发光标记、放射性同位素标记、酶或其他配体。在优选的实施方案中,可能期望采用荧光标记或酶标签,诸如地高辛(digoxigenin)、β-半乳糖苷酶、脲酶、碱性磷酸酶或过氧化物酶、亲和素/生物素复合物。
用于检测或量化杂交强度的检测方法通常取决于上文选择的标记。例如,可以使用照相胶片或磷光成像仪来检测放射性标记。可以使用光电检测器检测发射的光来检测和量化荧光标志物。酶标记通常通过向酶提供底物并且测量酶对底物的作用产生的反应产物来检测;最后,通过简单地将彩色标记可视化来检测比色标记。
与信号传导生化途径相关的序列表达的剂诱导的变化也可以通过检查对应的基因产物来确定。确定蛋白质水平通常涉及a)将生物样品中含有的蛋白质与特异性结合与信号传导生化途径相关的蛋白质的剂接触;以及(b)鉴定如此形成的任何剂:蛋白质复合物。在此实施方案的一个方面,特异性结合与信号传导生化途径相关的蛋白质的剂是抗体,优选单克隆抗体。
通过在允许剂和与信号传导生化途径相关的蛋白质之间形成复合物的条件下,使剂与衍生自测试样品的与信号传导生化途径相关的蛋白质的样品接触来执行反应。复合物的形成可以根据本领域的标准程序直接或间接检测。在直接检测方法中,剂提供有可检测标记,并且可以从复合物中去除未反应的剂;剩余标记的量从而表明形成的复合物的量。对于此种方法,优选选择即使在严格的洗涤条件期间仍保持附着在剂上的标记。优选不干扰结合反应的标记。在替代方案中,间接检测程序可以使用含有化学或酶促引入的标记的剂。期望的标记通常不干扰所得的剂:多肽复合物的结合或稳定性。然而,标记通常被设计为可接近抗体以进行有效结合,从而产生可检测的信号。
适用于检测蛋白质水平的多种标记是本领域已知的。非限制性实例包括放射性同位素、酶、胶体金属、荧光化合物、生物发光化合物和化学发光化合物。
结合反应期间形成的剂:多肽复合物的量可以通过标准定量测定来量化。如上所述,剂:多肽复合物的形成可以通过在结合位点处保留的标记的量来直接测量。在替代方案中,测试与信号传导生化途径相关的蛋白质与标记的类似物竞争特定剂上的结合位点的能力。在此竞争性测定中,捕获的标记量与测试样品中存在的与信号传导生化途径相关的蛋白质序列的量成反比。
基于上文概述的一般原理的用于蛋白质分析的许多技术在本领域中是可用的。它们包括但不限于放射免疫测定、ELISA(酶联免疫放射测定)、“夹心”免疫测定、免疫放射测定、原位免疫测定(使用例如胶体金、酶或放射性同位素标记)、蛋白质印迹分析、免疫沉淀测定、免疫荧光测定和SDS-PAGE。
特异性识别或结合与信号传导生化途径相关的蛋白质的抗体优选用于进行上文提及的蛋白质分析。在期望的情况下,可以使用识别特定类型的翻译后修饰(例如,信号传导生化途径诱导型修饰)的抗体。翻译后修饰包括但不限于糖基化、脂化、乙酰化和磷酸化。这些抗体可以从商业供应商处购买。例如,特异性识别酪氨酸磷酸化蛋白的抗磷酸酪氨酸抗体可从许多供应商(包括Invitrogen和Perkin Elmer)处获得。抗磷酸酪氨酸抗体特别可用于检测响应于ER应激而在其酪氨酸残基上发生差异磷酸化的蛋白质。此类蛋白质包括但不限于真核翻译起始因子2α(eIF-2α)。或者,可以使用常规多克隆或单克隆抗体技术,通过用表现出期望的翻译后修饰的靶蛋白使宿主动物或抗体产生细胞免疫来产生这些抗体。
全基因组敲除筛选
本文所述的TnpB多肽和系统可以用于执行有效且具有成本效益的功能基因组筛选。此类筛选可以利用基于TnpB多肽的全基因组文库。此类筛选和文库可以提供确定基因的功能、基因所参与的细胞途径、以及基因表达的任何改变如何可以导致特定的生物过程。本发明的一个优点是组合物避免了脱靶结合及其导致的副作用。这是使用被安排为对靶DNA具有高度序列特异性的系统来实现的。在本发明的优选实施方案中,TnpB多肽复合物是TnpB多肽复合物。
在本发明的实施方案中,全基因组文库可包含多个TnpB多肽核酸组分分子,如本文所述,其包含能够靶向真核细胞群中的多个基因组基因座中的多个靶序列的指导/间隔序列。细胞群可以是胚胎干(ES)细胞群。基因组基因座中的靶序列可以是非编码序列。非编码序列可以是内含子、调控序列、剪接位点、3'UTR、5'UTR或聚腺苷酸化信号。一种或多种基因产物的基因功能可通过所述靶向来改变。靶向可导致基因功能的敲除。基因产物的靶向可以包含多于一种核酸组分分子。基因产物可以被2、3、4、5、6、7、8、9或10个核酸组分分子靶向,优选每个基因3至4个。可以通过利用由TnpB多肽复合物产生的交错双链断裂或通过利用与组合物中使用的方法类似的方法来最大程度地减少脱靶修饰(参见,例如,DNAtargeting specificity of RNA-guided Cas nucleases.Hsu,P.,Scott,D.,Weinstein,J.,Ran,FA.,Konermann,S.,Agarwala,V.,Li,Y.,Fine,E.,Wu,X.,Shalem,O.,Cradick,TJ.,Marraffini,LA.,Bao,G.,&Zhang,F.Nat Biotechnol doi:10.1038/nbt.2647(2013)),其通过引用并入本文。靶向可能是约100个或更多个序列。靶向可能是约1000个或更多个序列。靶向可能是约20,000个或更多个序列。靶向可能是整个基因组。靶向可能是聚焦于相关或期望途径的一组靶序列。途径可能是免疫途径。途径可能是细胞分裂途径。
本发明的一个方面涵盖全基因组文库,其可包含多个核酸组分分子,所述核酸组分分子可包含能够靶向多个基因组基因座中的多个靶序列的指导/间隔序列,其中所述靶向导致基因功能的敲除。此文库可能包含靶向生物体基因组中的每个基因的核酸组分分子。
在本发明的一个实施方案中,生物体或受试者是真核生物(包括哺乳动物,包括人类)或非人真核生物或非人动物或非人哺乳动物。在一个实施方案中,生物体或受试者是非人动物,并且可以是节肢动物,例如昆虫,或者可以是线虫。在本发明的一些方法中,生物体或受试者是植物。在本发明的一些方法中,生物体或受试者是哺乳动物或非人哺乳动物。非人哺乳动物可以是例如啮齿动物(优选小鼠或大鼠)、有蹄类动物或灵长类动物。在本发明的一些方法中,生物体或受试者是藻类,包括微藻,或者是真菌。
基因功能的敲除可包括将包含本文的经工程化、非天然存在的组合物的一种或多种载体的载体系统引入到细胞群中的每个细胞中。核酸组分分子序列可靶向每个细胞中的独特基因,其中TnpB多肽可操作地连接至调控元件,其中当转录时,包含间隔序列的核酸组分分子引导TnpB多肽与独特基因的基因组基因座中的靶序列的序列特异性结合,以诱导TnpB多肽对基因组基因座的切割并且确认细胞群的每个细胞中的多个独特基因中的不同敲除突变,从而产生基因敲除细胞文库。本发明涵盖,细胞群是真核细胞群,并且在优选的实施方案中,细胞群是胚胎干(ES)细胞群。
一种或多种载体可以是质粒载体。载体可以是单一载体,其包含TnpB多肽、核酸组分和任选的进入靶细胞的选择标志物。不受理论的束缚,通过单一载体同时递送TnpB多肽和核酸组分的能力使得能够应用于任何感兴趣的细胞类型,而不需要首先产生表达TnpB多肽的细胞系。调控元件可以是诱导型启动子。诱导型启动子可以是多西环素(doxycycline)诱导型启动子。在本发明的一些方法中,核酸组分分子序列的表达受到T7启动子的控制并且由T7聚合酶的表达驱动。不同敲除突变的确认可以通过全外显子组测序来进行。敲除突变可以在100个或更多个独特基因中实现。敲除突变可以在1000个或更多个独特基因中实现。敲除突变可以在20,000个或更多个独特基因中实现。敲除突变可以在整个基因组中实现。基因功能的敲除可以在多个独特基因中实现,所述多个独特基因在特定生理途径或条件下发挥作用。途径或条件可以是免疫途径或条件。途径或条件可以是细胞分裂途径或条件。
功能改变和筛选
在另一个方面,本发明提供了一种基因的功能评估和筛选的方法。使用组合物精确递送功能结构域、活化或阻遏基因或通过精确改变感兴趣的特定基因座上的甲基化位点来改变表观遗传状态,可以离体或在体内与应用于单个细胞或细胞群的一个或多个核酸组分分子或与应用于细胞池中的基因组的文库一起使用,所述文库包括施用或表达包含多个核酸组分(包含间隔分子)的文库,并且其中筛选还包括使用TnpB多肽,其中包含TnpB的复合物被修饰以包含异源功能结构域。在一个方面,本发明提供了一种用于筛选基因组的方法,其包括向宿主施用文库或在宿主体内表达文库。在一个方面,本发明提供了一种如本文所讨论的方法,其还包括向宿主施用或在宿主中表达的活化子。在一个方面,本发明提供了一种如本文所讨论的方法,其中活化子附接至TnpB多肽。在一个方面,本发明提供了一种如本文所讨论的方法,其中活化子附接至TnpB多肽的N末端或C末端。在一个方面,本发明提供了一种如本文所讨论的方法,其中活化子附接至核酸组分环。在一个方面,本发明提供了一种如本文所讨论的方法,其还包括向宿主施用或在宿主中表达阻遏子。在一个方面,本发明提供了一种如本文所讨论的方法,其中筛选包括影响和检测基因座中的基因活化、基因抑制或切割。
例如,除了启动子或启动子近端元件之外,还优选靶向内源(调控性)控制元件(诸如增强子和沉默子)。因此,除了靶向启动子之外,本发明还可以用于靶向内源控制元件(包括增强子和沉默子)。这些控制元件可以位于转录起始位点(TSS)的上游和下游,从距离TSS200bp至100kb远。靶向已知控制元件可以用于活化或阻遏感兴趣的基因。在一些情况下,单个控制元件可以影响多个靶基因的转录。因此,靶向单个控制元件可以用于同时控制多个基因的转录。
在另一个方面,靶向推定控制元件(例如,通过平铺推定控制元件的区域以及元件周围的200bp至100kB)可以用作验证此类元件(通过测量感兴趣的基因的转录)或检测新的控制元件(例如,通过平铺感兴趣的基因的TSS上游和下游100kb)的方式。此外,靶向推定控制元件在了解疾病的遗传原因的背景下可以是有用的。与疾病表型相关的许多突变和常见SNP变异体位于编码区之外。用本文所述的活化或阻遏系统靶向此类区域后可以读出以下的转录:a)一组推定的靶标(例如,位于最紧密接近控制元件的一组基因)或b)通过例如RNAseq或微阵列进行的全转录组读出。这将允许鉴定涉及疾病表型的可能的候选基因。此类候选基因可以用作新型药物靶标。
本文提及了组蛋白乙酰转移酶(HAT)抑制剂。然而,替代实施方案是一个或多个包含乙酰转移酶(优选组蛋白乙酰转移酶)的功能结构域。这些在表观基因组学领域中,例如在询问表观基因组的方法中是有用的。询问表观基因组的方法可包括例如靶向表观基因组序列。靶向表观基因组序列可包括针对表观基因组靶序列的核酸组分分子。表观基因组靶序列可包括启动子、沉默子或增强子序列。
饱和诱变
本文的组合物可以用于与细胞表型结合执行基因组基因座的饱和或深度扫描诱变,例如,用于确定基因表达、药物抗性和疾病逆转所需的功能元件的关键最小特征和离散脆弱性。饱和或深度扫描诱变意指基因组基因座内的每个或基本上每个DNA碱基都被切割。可以将Cas1效应蛋白核酸组分分子文库引入细胞群中。可以引入文库,使得每个细胞接收单一核酸组分。在通过病毒载体转导引入文库的情况下,如本文所述,使用低感染复数(MOI)。文库可包括靶向基因组基因座中的(靶相邻基序)(TAM)序列上游的每个序列的核酸组分。对于基因组基因座内的每1000个碱基对,文库可包括TAM序列上游的至少100个非重叠基因组序列。文库可包括靶向至少一种不同TAM序列上游的序列的核酸组分。组合物可包括多于一种TnpB多肽。如本文所述的任何TnpB多肽蛋白,其包括直系同源物或经工程化的TnpB多肽。核酸组分的脱靶位点频率可以小于500。可以产生脱靶分数以选择具有最低脱靶位点的核酸组分。任何被确定与核酸组分靶位点处的切割相关的表型可以通过在单个实验中使用靶向相同位点的核酸组分来确认。靶位点的验证还可以通过使用如本文所述的修饰的TnpB多肽和靶向感兴趣的基因组位点的两个核酸组分来执行。不受理论的束缚,如果在验证实验中观察到表型的变化,则靶位点是真实命中。
基因组基因座可包括至少一个连续基因组区域。至少一个连续基因组区域可包含多达整个基因组。至少一个连续基因组区域可包含基因组的功能元件。功能元件可以位于非编码区、编码基因、内含子区、启动子或增强子内。至少一个连续基因组区域可包含至少1kb、优选至少50kb的基因组DNA。至少一个连续基因组区域可包含转录因子结合位点。至少一个连续基因组区域可包含DNA酶I超敏区域。至少一个连续基因组区域可包含转录增强子或阻遏子元件。至少一个连续基因组区域可包含富集表观遗传特征的位点。至少一个连续基因组DNA区域可包含表观遗传绝缘子。至少一个连续基因组区域可包含物理上相互作用的两个或更多个连续基因组区域。相互作用的基因组区域可通过“4C技术”来确定。4C技术允许以公正的方式筛选整个基因组的与所选DNA片段物理相互作用的DNA区段,如Zhao等人((2006)Nat Genet 38,1341-7)和美国专利8,642,295中所述,两篇文献通过引用整体并入本文。表观遗传特征可以是组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化、组蛋白磷酸化、DNA甲基化或其缺乏。
用于饱和或深度扫描诱变的组合物可以用于细胞群中。组合物可以用于真核细胞,包括但不限于哺乳动物和植物细胞。细胞群可以是原核细胞。真核细胞群可以是胚胎干(ES)细胞、神经元细胞、上皮细胞、免疫细胞、内分泌细胞、肌肉细胞、红细胞、淋巴细胞、植物细胞或酵母细胞的群。
在一个方面,本发明提供了一种筛选与表型变化相关的功能元件的方法。可以将文库引入到适合含有TnpB多肽的细胞群中。可以基于表型将细胞分选为至少两组。表型可以是基因的表达、细胞生长或细胞活力。确定每组中存在的核酸组分分子的相对表示,由此通过每组中存在的核酸组分分子的表示来确定与表型变化相关的基因组位点。表型变化可以是感兴趣的基因的表达的变化。感兴趣的基因可被上调、下调或敲除。可将细胞分选为高表达组和低表达组。细胞群可包括用于确定表型的报告构建体。报告构建体可包括可检测标志物。可通过使用可检测标志物来分选细胞。
在另一个方面,本发明提供了一种筛选与化学化合物抗性相关的基因组位点的方法。化学化合物可以是药物或杀虫剂。可以将文库引入适合含有TnpB多肽的细胞群中,其中群体的每个细胞含有不超过一种核酸组分分子;用化学化合物处理细胞群;并且在用化学化合物处理后,在与早期时间点相比较晚的时间点确定核酸组分分子的代表,由此通过核酸组分的富集来确定与化学化合物抗性相关的基因组位点。核酸组分的表示可通过深度测序方法来确定。
在利用组合物的本发明的实践中有用的是组合物中使用的方法并且参考标题为BCL11A enhancer dissection by Cas-mediated in situ saturatingmutagenesis.Canver,M.C.,Smith,E.C.,Sher,F.,Pinello,L.,Sanjana,N.E.,Shalem,O.,Chen,D.D.,Schupp,P.G.,Vinjamur,D.S.,Garcia,S.P.,Luc,S.,Kurita,R.,Nakamura,Y.,Fujiwara,Y.,Maeda,T.,Yuan,G.,Zhang,F.,Orkin,S.H.,&Bauer,D.E.DOI:10.1038/nature15521的文章,其在线发表于2015年9月16日,所述文章通过引用并入本文并且在下文简略讨论。
Canver等人涉及新型的汇集指导RNA文库以对人和小鼠BCL11A红细胞增强子进行原位饱和诱变,所述增强子先前被鉴定为与胎儿血红蛋白(HbF)水平相关的增强子,并且其小鼠直系同源物对于红细胞BCL11A表达是必需的。此方法揭示了这些增强子的关键最小特征和离散脆弱性。通过编辑人原代祖细胞和小鼠转基因,作者验证了BCL11A红细胞增强子作为HbF重新诱导的靶标。作者带来了为治疗性基因组编辑提供信息的详细的增强子图谱。
细胞或生物体的修饰
本公开还提供了包含本文的系统的一种或多种组分(例如TnpB多肽和/或核酸组分)的细胞。还提供了通过本文的系统和方法修饰的细胞,以及包含此类细胞或其后代的细胞培养物、组织、器官、生物体。在一个实施方案中,本发明涵盖一种修饰细胞或生物体的方法。细胞可以是原核细胞或真核细胞。细胞可以是哺乳动物细胞。哺乳动物细胞可以是非人灵长类动物、牛、猪、啮齿动物或小鼠细胞。细胞可以是非哺乳动物真核细胞,诸如家禽、鱼或虾。所述细胞还可以是植物细胞。植物细胞可以是作物植物(诸如木薯、玉米、高粱、小麦或水稻)的细胞。植物细胞还可以是藻类、树木或蔬菜的细胞。通过本发明引入到细胞的修饰可以使得细胞和细胞后代被改变以改善生物产物(诸如抗体、淀粉、醇或其他期望细胞输出物)的产生。通过本发明引入到细胞的修饰可以使得细胞和细胞的后代包括使所产生的生物产物发生变化的改变。
治疗性用途和治疗方法
本文还提供了诊断、预测、治疗和/或预防受试者的疾病、状态或病状的方法。一般来讲,诊断、预测、治疗和/或预防受试者的疾病、状态或病状的方法可以包括使用本文所述的组合物、系统或其组分来修饰受试者或其细胞中的多核苷酸,且/或包括使用本文所述的组合物、系统或其组分来检测受试者或其细胞中的患病或健康的多核苷酸。在一个实施方案中,治疗或预防的方法可以包括使用组合物、系统或其组分来修饰受试者或其细胞内的感染性生物体(例如细菌或病毒)的多核苷酸。在一个实施方案中,治疗或预防的方法可以包括使用组合物、系统或其组分来修饰受试者体内的感染性生物体或共生生物体的多核苷酸。组合物、系统及其组分可以用于开发疾病、状态或病状的模型。组合物、系统及其组分可以用于检测疾病状态或其校正,诸如通过本文所述的治疗或预防方法。组合物、系统及其组分可以用于筛选和选择可以用作例如本文所述的治疗或预防的细胞。组合物、系统及其组分可以用于开发生物活性剂,所述生物活性剂可以用于改变受试者或其细胞中的一种或多种生物功能或活性。
一般来讲,方法可以包括通过合适的递送技术和/或组合物将组合物、系统和/或其组分递送至受试者或其细胞,或者递送至感染性或共生生物体。一旦施用,组分可以如本文别处所述的那样发挥作用以引发核酸修饰事件。在一些方面,核酸修饰事件可以在基因组、表观基因组和/或转录组水平上发生。可以发生DNA和/或RNA切割、基因活化和/或基因去活化。下文更详细地描述了额外的特征、用途和优点。基于这一概念,有若干种变异适合引发基因组基因座事件,包括DNA切割、基因活化或基因去活化。使用所提供的组合物,本领域技术人员可以有利地且特异性地靶向具有相同或不同功能结构域的单个或多个基因座以引发一个或多个基因组基因座事件。除了治疗和/或预防受试者的疾病之外,组合物还可应用于用于在细胞文库中筛选和体内功能建模的多种方法(例如,lincRNA的基因活化和功能鉴定;获得功能建模;失去功能建模;使用本发明的组合物建立细胞系和转基因动物以用于优化和筛选目的)。
本文别处描述的组合物、系统及其组分可以用于治疗和/或预防受试者的疾病,诸如遗传和/或表观遗传疾病。本文别处描述的组合物、系统及其组分可以用于治疗和/或预防受试者的遗传感染性疾病,诸如细菌感染、病毒感染、真菌感染、寄生虫感染及其组合。本文别处描述的组合物、系统及其组分可以用于改变受试者的微生物组的组成或特征,这进而可以改变受试者的健康状态。本文所述的组合物、系统可以用于离体修饰细胞,然后可以向受试者施用所述细胞,由此修饰的细胞可以治疗或预防疾病或其症状。在一些情况下,这也被称为过继疗法。本文所述的组合物、系统可以用于治疗线粒体疾病,其中线粒体疾病病因涉及线粒体DNA中的突变。
还提供了一种治疗受试者(例如有需要的受试者)的方法,其包括通过用编码组合物、系统或复合物中的一种或多种组分的多核苷酸或本文所述的多核苷酸或载体中的任一种转化受试者并且将它们施用于受试者来诱导基因编辑。还可以提供合适的修复模板,例如通过包含所述修复模板的载体来递送。本文的修复模板可以是重组模板。还提供了一种治疗受试者(例如,有需要的受试者)的方法,其包括通过用本文所述的多核苷酸或载体转化受试者来诱导多个靶基因座的转录活化或阻遏,其中所述多核苷酸或载体编码或包含有包含多种TnpB多肽的组合物、系统、复合物或其组分的一种或多种组分。在任何治疗离体(例如在细胞培养物中)发生的情况下,那么应当理解,术语“受试者”可以被短语“细胞或细胞培养物”替代。
还提供了一种治疗受试者(例如,有需要的受试者)的方法,其包括通过用TnpB多肽转化受试者来诱导基因编辑,从而有利地在体内编码和表达组合物、系统的剩余部分(例如,RNA)。还可以提供合适的修复模板,例如通过包含所述修复模板的载体来递送。还提供了一种治疗受试者(例如有需要的受试者)的方法,其包括通过使用在体内有利地编码和表达组合物、系统的剩余部分(例如,核酸组分分子)的TnpB多肽转化受试者来诱导转录活化或阻遏;有利地,在一个实施方案中,TnpB多肽是催化失活的TnpB多肽并且包括一个或多个相关的功能结构域。在任何治疗离体(例如在细胞培养物中)发生的情况下,那么应当理解,术语“受试者”可以被短语“细胞或细胞培养物”替代。
本文所述的组合物和系统的一种或多种组分可以包括在组合物诸如药物组合物中,并且单独或共同向宿主施用。或者,这些组分可以以单一组合物的形式提供以施用于宿主。可以经由技术人员已知的或本文所述的用于递送至宿主的病毒载体(例如,慢病毒载体、腺病毒载体、AAV载体)来向宿主施用。如本文所解释的,使用不同的选择标志物(例如,用于慢病毒核酸组分选择)和核酸组分浓度(例如,取决于是否使用多种核酸组分)可能有利于引发改善的效果。
因此,本文还描述了在受试者的真核或原核细胞或其组分(例如,线粒体)、感染性生物体和/或受试者的微生物组的生物体中诱导一种或多种多核苷酸修饰的方法。修饰可以包括在一个或多个细胞的多核苷酸的靶序列处引入、缺失或取代一个或多个核苷酸。修饰可以在体外、离体、原位或体内进行。
在一个实施方案中,治疗或抑制由真核生物体或非人生物体中的基因组基因座中的一个或多个突变引起的病状或疾病的方法可以包括对有需要的受试者或非人受试者的靶序列中的所述基因组基因座的编码、非编码或调控元件内的靶序列进行操纵,包括通过靶序列的操纵来修饰受试者或非人受试者,并且其中病状或疾病易于通过靶序列的操纵来治疗或抑制,包括提供包括递送组合物的治疗,所述组合物包含上述实施方案中任一项的颗粒递送系统或递送系统或病毒颗粒或上述实施方案中任一项的细胞。
本文还提供了上述实施方案中任一项的颗粒递送系统或递送系统或病毒颗粒或上述实施方案中任一项的细胞在离体或体内基因或基因组编辑中的用途;或用于体外、离体或体内基因疗法的用途。本文还提供了上述实施方案中任一项的颗粒递送系统、非病毒递送系统和/或病毒颗粒或上述实施方案中任一项的细胞,其用于制造用于体外、离体或体内基因或基因组编辑的药物,或用于体外、离体或体内基因疗法,或用于通过操纵与疾病相关的基因组基因座中的靶序列来修饰生物体或非人生物体的方法,或用于治疗或抑制由真核生物体或非人生物体的基因组基因座的一个或多个突变引起的病状或疾病的方法。
在一个实施方案中,多核苷酸修饰可以包括在所述细胞的所述多核苷酸的每个靶序列处引入、缺失或取代1-75个核苷酸。修饰可以包括在每个靶序列处引入、缺失或取代至少1、5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50或75个核苷酸。修饰可包括在所述细胞的每个靶序列处引入、缺失或取代至少5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50或75个核苷酸。修饰可以包括在所述细胞的每个靶序列处引入、缺失或取代至少10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50或75个核苷酸。修饰可以包括在所述细胞的每个靶序列处引入、缺失或取代至少20、21、22、23、24、25、26、27、28、29、30、35、40、45、50或75个核苷酸。修饰可以包括在所述细胞的每个靶序列处引入、缺失或取代至少40、45、50、75、100、200、300、400或500个核苷酸。修饰可以包括在所述细胞的每个靶序列处引入、缺失或取代至少500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3100、3200、3300、3400、3500、3600、3700、3800、3900、4000、4100、4200、4300、4400、4500、4600、4700、4800、4900、5000、5100、5200、5300、5400、5500、5600、5700、5800、5900、6000、6100、6200、6300、6400、6500、6600、6700、6800、6900、7000、7100、7200、7300、7400、7500、7600、7700、7800、7900、8000、8100、8200、8300、8400、8500、8600、8700、8800、8900、9000、9100、9200、9300、9400、9500、9600、9700、9800或9900至10000个核苷酸。
在一个实施方案中,修饰可以包括经由核酸组分(例如核酸组分分子、RNA或核酸组分)在所述细胞的每个靶序列处引入、缺失或取代核苷酸,诸如由本文别处描述的组合物、系统或其组分介导的那些。在一个实施方案中,修饰可以包括经由组合物、系统或技术在所述细胞的靶序列或随机序列处引入、缺失或取代核苷酸。
在一个实施方案中,组合物、系统或其组分可以促进非同源末端接合(NHEJ)。在一个实施方案中,组合物、系统或其组分对多核苷酸(诸如患病多核苷酸)的修饰可以包括NHEJ。在一个实施方案中,组合物、系统或其组分对此修复途径的促进可以用于靶向基因或多核苷酸特异性敲除和/或敲入。在一个实施方案中,组合物、系统或其组分对此修复途径的促进可以用于产生NHEJ介导的插入缺失。核酸酶诱导的NHEJ还可以用于去除(例如,缺失)感兴趣的基因中的序列。一般来讲,NHEJ通过将两端接合在一起来修复DNA中的双链断裂;然而,一般来讲,只有在两个相容末端(与双链断裂形成的完全相同)完美连接的情况下,原始序列才能恢复。双链断裂的DNA末端经常是酶处理的对象,从而导致在末端重新接合之前在一条或两条链处添加或去除核苷酸。这导致DNA序列的NHEJ修复位点处存在插入和/或缺失(插入缺失)突变。插入缺失的大小范围可以是1-50个或更多个碱基对。在一个实施方案中,三个插入缺失可以是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、316、317、318、319、320、321、322、323、324、325、326、327、328、329、330、331、332、333、334、335、336、337、338、339、340、341、342、343、344、345、346、347、348、349、350、351、352、353、354、355、356、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、372、373、374、375、376、377、378、379、380、381、382、383、384、385、386、387、388、389、390、391、392、393、394、395、396、397、398、399、400、401、402、403、404、405、406、407、408、409、410、411、412、413、414、415、416、417、418、419、420、421、422、423、424、425、426、427、428、429、430、431、432、433、434、435、436、437、438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、454、455、456、457、458、459、460、461、462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478、479、480、481、482、483、484、485、486、487、488、489、490、491、492、493、494、495、496、497、498、499或500个碱基对或更多。如果双链断裂靶向短靶序列附近,则NHEJ修复引起的缺失突变通常跨越并因此去除不需要的核苷酸。对于较大DNA区段的缺失,引入两个双链断裂(序列的每侧各一个)可以导致末端之间的NHEJ,同时去除完整的间插序列。这两种方法都可以用来缺失特定的DNA序列。
在一个实施方案中,组合物、系统介导的NHEJ可以用于缺失小序列基序的方法中。在一个实施方案中,组合物、系统介导的NHEJ可以用于产生NHEJ介导的插入缺失的方法,所述插入缺失可以靶向基因(例如编码区,例如感兴趣的基因的早期编码区),可以用于敲除感兴趣的基因(即,消除其表达)。例如,感兴趣的基因的早期编码区包括紧接在转录起始位点之后、在编码序列的第一外显子内、或在转录起始位点的500bp内(例如,小于500、450、400、350、300、250、200、150、100或50bp)的序列。在实施方案中,其中核酸组分和TnpB多肽产生双链断裂以诱导NHEJ介导的插入缺失,核酸组分可以被配置为将一个双链断裂定位成紧密接近靶位置的核苷酸。在实施方案中,切割位点可以距离靶位置0-500bp(例如,距离靶位置小于500、400、300、200、100、50、40、30、25、20、15、10、9、8、7、6、5、4、3、2或1bp)。在实施方案中,其中与一个或多个切口酶复合的两个组分RNA诱导两个单链断裂以诱导NHEJ介导的插入缺失,两个组分RNA可以被配置为将两个单链断裂定位成向NHEJ修复提供靶位置的核苷酸。
为了最大程度地减少毒性和脱靶效应,控制递送的TnpB多肽mRNA和组分RNA的浓度可能很重要。可以通过在细胞或非人真核动物模型中测试不同浓度并使用深度测序分析潜在脱靶基因组位点的修饰程度来确定TnpB多肽mRNA和组分RNA的最佳浓度。或者,为了最大程度地减少毒性和脱靶效应的水平,切口酶mRNA(例如,突变的TnpB)可以与靶向感兴趣的位点的一对核酸组分一起递送。
通常,在内源TnpB多肽的上下文中,TnpB多肽或复合物(包含与靶序列杂交并且与一种或多种TnpB多肽复合的多核苷酸组分序列)的形成导致靶序列中或附近(例如,距离靶序列1、2、3、4、5、6、7、8、9、10、20、50或更多个碱基对内)的一条或两条链的切割、切口和/或另一种修饰。
在一个实施方案中,修饰细胞中的靶多核苷酸以治疗或预防疾病的方法可包括允许组合物、系统或其组分与靶多核苷酸结合,例如以实现组合物、系统能够对所述靶多核苷酸进行切割、切口或其他修饰,从而修饰靶多核苷酸,其中组合物、系统或其组分与核酸组分分子序列复合,并且使所述核酸组分分子序列与靶多核苷酸内的靶序列杂交,其中所述核酸组分分子序列任选地连接至核酸组分支架序列。在这些实施方案中的一些中,组合物、系统或其组分可以是或包括与核酸组分分子序列复合的TnpB多肽。在一个实施方案中,修饰可以包括通过组合物、系统或其组分的一种或多种组分在靶序列的位置处对一条或两条链进行切割或切口。
能够被组合物、系统进行的切割、切口或其他修饰可以修饰靶多核苷酸的转录。在一个实施方案中,转录的修饰可以包括减少靶多核苷酸的转录。在一个实施方案中,修饰可以包括增加靶多核苷酸的转录。在一个实施方案中,方法包括通过与重组模板多核苷酸同源重组来修复所述切割的靶多核苷酸,其中所述修复导致修饰,诸如但不限于所述靶多核苷酸的一个或多个核苷酸的插入、缺失或取代。在一个实施方案中,所述修饰导致由包含靶序列的基因表达的蛋白质中的一个或多个氨基酸变化。在一个实施方案中,由组合物、系统或其组分赋予的修饰提供了可以校正疾病或其症状的转录物和/或蛋白质,所述疾病或其症状包括但不限于本文别处更详细描述的任何疾病或其症状。
在一个实施方案中,治疗或预防疾病的方法可以包括将一个或多个载体或载体系统递送至细胞,诸如真核或原核细胞,其中一个或多个载体或载体系统包括组合物、系统或其组分。在一个实施方案中,载体或载体系统可以是病毒载体或载体系统,诸如AAV或慢病毒载体系统,其在本文别处更详细地描述。在一个实施方案中,治疗或预防疾病的方法可以包括递送含有组合物、系统或其组分的一种或多种病毒颗粒,诸如AAV或慢病毒颗粒。在一个实施方案中,病毒颗粒具有组织特异性趋向性。在一个实施方案中,病毒颗粒具有肝、肌肉、眼、心脏、胰腺、肾、神经元、上皮细胞、内皮细胞、星形胶质细胞、神经胶质细胞、免疫细胞或红细胞特异性趋向性。
应当理解,如本文所述的根据本发明的组合物和系统,诸如用于如本文所述的根据本发明的方法的组合物和系统,可以适合用于组合物、系统已知的任何类型的应用,优选在真核生物中。在某些方面,应用是治疗性的,优选地在真核生物体中是治疗性的,所述真核生物体诸如包括但不限于动物(包括人类)、植物、藻类、真菌(包括酵母)等。或者或另外,在某些方面,应用可涉及实现或诱导一种或多种特定性状或特征,诸如基因型和/或表型性状或特征,也如本文别处所述。
治疗循环系统疾病
在一个实施方案中,本文所述的组合物、系统和/或其组分可以用于治疗和/或预防循环系统疾病。例如,在表2和3中提供了示例性疾病。在一个实施方案中,Wahlgren等人(Nucleic Acids Research,2012,第40卷,第17期e130)的血浆外来体可以用于将本文所述的组合物、系统和/或其组分递送至血液。在一个实施方案中,可以通过使用慢病毒递送本文所述的组合物、系统以在体内或离体修饰造血干细胞(HSC)来治疗循环系统疾病(参见,例如,Drakopoulou,“Review Article,The Ongoing Challenge of Hematopoietic StemCell-Based Gene Therapy forβ-Thalassemia,”Stem Cells International,第2011卷,文章ID 987980,10页,doi:10.4061/2011/987980,鉴于本文的描述,其可以适合与本文的组合物、系统一起使用)。在一个实施方案中,循环系统病症可以通过使用本文的组合物、系统或其组分校正关于疾病的HSC来治疗,其中组合物、系统任选地包括合适的HDR修复模板(参见,例如,Cavazzana,“Outcomes of Gene Therapy forβ-Thalassemia Major viaTransplantation of Autologous Hematopoietic Stem Cells Transduced Ex Vivowith a LentiviralβA-T87Q-Globin Vector.”;Cavazzana-Calvo,“Transfusionindependence and HMGA2 activation after gene therapy of humanβ-thalassaemia”,Nature 467,318–322(2010年9月16日)doi:10.1038/nature09328;Nienhuis,“Development of Gene Therapy for Thalassemia,Cold Spring Harbor Perspectivesin Medicine,doi:10.1101/cshperspect.a011833(2012),LentiGlobin BB305,alentiviral vector containing an engineered β-globin gene(βA-T87Q);和Xie等人,“Seamless gene correction ofβ-thalassaemia mutations in patient-specificiPSCs using CRISPR/Cas9 and piggyback”Genome Research gr.173427.114(2014)www.genome.org/cgi/doi/10.1101/gr.173427.114(Cold Spring Harbor LaboratoryPress;[1599]Watts,“Hematopoietic Stem Cell Expansion and Gene Therapy”Cytotherapy 13(10):1164–1171.doi:10.3109/14653249.2011.620748(2011),鉴于本文的描述,其可以适合与本文的组合物、系统一起使用)。在一个实施方案中,可以使用本文所述的组合物、系统修饰iPSC以校正与循环系统疾病相关的疾病多核苷酸。在这方面,鉴于本文的描述,关于修饰iPSC的Xu等人(Sci Rep.2015年7月9日;5:12065.doi:10.1038/srep12065)和Song等人(Stem Cells Dev.2015年5月1日;24(9):1053-65.doi:10.1089/scd.2014.0347Epub 2015年2月5日)的教导可以适合与本文所述的组合物、系统一起使用)。
术语“造血干细胞”或“HSC”广泛地指代被认为是HSC的那些细胞,例如产生所有其他血细胞并且衍生自中胚层的血细胞;位于包含在大多数骨骼的核心中的红骨髓中的血细胞。本发明的HSC包括具有造血干细胞表型的细胞,其通过小尺寸、缺乏谱系(lin)标志物、以及属于分化系列簇的标志物(如:CD34、CD38、CD90、CD133、CD105、CD45以及干细胞因子的受体c-kit)来鉴定。造血干细胞对于用于检测谱系定型(lineage commitment)的标志物呈阴性,因此被称为Lin-;并且,在通过FACS纯化期间,许多多达14种不同的成熟血液谱系标志物,例如,对于人类,骨髓细胞的CD13和CD33、红细胞的CD71、B细胞的CD19、巨核细胞的CD61等;以及B细胞的B220(鼠CD45)、单核细胞的Mac-1(CD11b/CD18)、粒细胞的Gr-1、红细胞的Ter119,T细胞的Il7Ra、CD3、CD4、CD5、CD8等。小鼠HSC标志物:CD34lo/-、SCA-1+、Thy1.1+/lo、CD38+、C-kit+、lin-和人HSC标志物:CD34+、CD59+、Thy1/CD90+、CD38lo/-、C-kit/CD117+和lin-。HSC通过标志物进行鉴定。因此,在本文讨论的实施方案中,HSC可以是CD34+细胞。HSC也可以是作为CD34-/CD38-的造血干细胞。细胞表面上可能缺乏c-kit的在本领域中被认为是HSC的干细胞以及本领域中同样被认为是HSC的CD133+细胞都在本发明的范围内。
在一个实施方案中,用于治疗循环系统或血液疾病的治疗或预防可以包括用本文所述的任何修饰来修饰人脐带血细胞。在一个实施方案中,用于治疗循环系统或血液疾病的治疗或预防可以包括用本文所述的任何修饰来修饰粒细胞集落刺激因子动员的外周血细胞(mPB)。在一个实施方案中,人脐带血细胞或mPB可以是CD34+的。在一个实施方案中,修饰的脐带血细胞或mPB细胞可以是自体的。在一个实施方案中,脐带血细胞或mPB细胞可以是同种异体的。除了疾病基因的修饰之外,还可以使用本文所述的组合物、系统进一步修饰同种异体细胞,以降低细胞在递送至接受者时的免疫原性。此类技术在本文别处描述,并且例如Cartier,“MINI-SYMPOSIUM:X-Linked Adrenoleukodystrophypa,HematopoieticStem Cell Transplantation and Hematopoietic Stem Cell Gene Therapy in X-Linked Adrenoleukodystrophy,”Brain Pathology 20(2010)857–862”,其可以适合与本文的组合物、系统一起使用。修饰的脐带血细胞或mPB细胞可以任选地在体外扩增。可以使用任何合适的递送技术将修饰的脐带血细胞或mPB细胞递送至有需要的受试者。
组合物可以经工程化以靶向HSC中的一个或多个基因座。在一个实施方案中,TnpB多肽可以针对真核细胞并且特别是哺乳动物细胞(例如人细胞,例如HSC或iPSC)进行密码子优化,并且可以制备靶向HSC中的一个或多个基因座(诸如循环系统疾病)的核酸组分。这些可以经由颗粒来递送。颗粒可以通过混合TnpB多肽和核酸组分来形成。核酸组分和TnpB多肽混合物可以例如与包含表面活性剂、磷脂、可生物降解聚合物、脂蛋白和醇、或基本上由其组成、或由其组成的混合物混合,由此可以形成含有核酸组分和TnpB多肽的颗粒。本发明涵盖如此制备的颗粒以及由此种方法形成的颗粒及其用途。在血液或循环系统的背景下的组合物的颗粒合适递送或HSC递送至血液或循环系统在本文别处更详细地描述。
在一个实施方案中,在离体修饰后,HSC或iPCS可以在施用于受试者之前扩增。HSC的扩增可以经由任何合适的方法进行,诸如Lee,“Improved ex vivo expansion of adulthematopoietic stem cells by overcoming CUL4-mediated degradation of HOXB4.”Blood.2013年5月16日;121(20):4082-9.doi:10.1182/blood-2012-09-455204.Epub2013年3月21日中描述的方法。
在一个实施方案中,修饰的HSC或iPSC可以是自体的。在一个实施方案中,HSC或iPSC可以是同种异体的。除了疾病基因的修饰之外,还可以使用本文所述的组合物、系统进一步修饰同种异体细胞,以降低细胞在递送至接受者时的免疫原性。此类技术在本文别处描述,并且例如Cartier,“MINI-SYMPOSIUM:X-Linked Adrenoleukodystrophypa,Hematopoietic Stem Cell Transplantation and Hematopoietic Stem Cell GeneTherapy in X-Linked Adrenoleukodystrophy,”Brain Pathology 20(2010)857–862”,其可以适合与本文的组合物、系统一起使用。
治疗神经系统疾病
在一个实施方案中,本文所述的组合物、系统可以用于治疗脑和CNS疾病。脑的递送选择包括将TnpB多肽和核酸组分分子以DNA或RNA的形式封装到脂质体中,并且与分子特洛伊木马缀合以进行跨血脑屏障(BBB)递送。分子特洛伊木马已被证明有效地将B-gal表达载体递送到非人灵长类动物的脑中。相同的方法可以用于递送含有TnpB多肽和核酸组分分子的载体。例如,Xia CF和Boado RJ,Pardridge WM("Antibody-mediated targeting ofsiRNA via the human insulin receptor using avidin-biotin technology."MolPharm.2009年5月至6月;6(3):747-51.doi:10.1021/mp800194)描述了如何可以组合使用受体特异性单克隆抗体(mAb)和亲和素-生物素技术,将短干扰RNA(siRNA)递送至培养物中的细胞和体内细胞。作者还报告说,由于在使用亲和素-生物素技术的情况下,靶向mAb与siRNA之间的键是稳定的,并且在静脉内施用靶向siRNA后,在体内观察到远端部位诸如脑处的RNAi效应,所述文献的教导可以适合与本文的组合物、系统一起使用。在其他实施方案中,可以产生用于CNS和/或脑递送的人工病毒。参见Zhang等人(Mol Ther.2003年1月;7(1):11-8.)),其教导可以适合与本文的组合物、系统一起使用。
治疗听力疾病
在一个实施方案中,本文所述的组合物和系统可以用于治疗一只或两只耳朵的听力疾病或听力损失。耳聋通常是由于毛细胞损失或损伤而无法将信号传递给听觉神经元引起的。在此类情况下,耳蜗植入物可用于响应声音并且向神经细胞传输电信号。但由于受损的毛细胞释放的生长因子较少,这些神经元通常退化并从耳蜗中缩回。
在一个实施方案中,可以通过任何合适的方法或技术将组合物、系统或修饰的细胞递送至一只或两只耳朵以治疗或预防听力疾病或损失。合适的方法和技术包括但不限于美国专利公开号20120328580中阐述的那些方法和技术,所述专利描述了使用注射器(例如单剂量注射器)将药物组合物注射到耳朵中(例如,耳穴施用),诸如注射到耳蜗的管腔(例如,中管、前庭管、鼓管)中。例如,本文所述的化合物中的一种或多种可以通过鼓室内注射(例如,注射到中耳中)和/或注射到外耳、中耳和/或内耳中来施用;经由导管或泵而原位施用(参见,例如,McKenna等人,(美国专利公开号2006/0030837)和Jacobsen等人,(美国专利号7,206,639);与戴在外耳的机械装置(诸如耳蜗植入物或助听器)结合使用(参见,例如,美国专利公开号2007/0093878,其提供了适合于将本文所述的组合物、系统递送至耳朵的示例性耳蜗植入物)。此类方法在本领域中常规使用,例如用于将类固醇和抗生素施用到人耳中。例如,可以通过耳朵的圆窗或通过耳蜗囊进行注射。其他内耳施用方法是本领域已知的(参见,例如,Salt和Plontke,Drug Discovery Today,10:1299-1306,2005)。在一个实施方案中,在外科手术期间可以将导管或泵定位在例如患者的耳朵(例如外耳、中耳和/或内耳)中。在一个实施方案中,可以将导管或泵定位在例如患者的耳朵(例如外耳、中耳和/或内耳)中而不需要外科手术。
一般来讲,美国专利公开号20120328580中描述的细胞治疗方法可以用于促进细胞在体外完全或部分分化为内耳的成熟细胞类型(例如,毛细胞)。然后可以将由此类方法产生的细胞移植或植入需要此种治疗的患者体内。下文描述了实践这些方法所需的细胞培养方法,包括用于鉴定和选择合适细胞类型的方法、用于促进所选细胞完全或部分分化的方法、用于鉴定完全或部分分化的细胞类型的方法以及用于植入完全或部分分化的细胞的方法。
适用于本发明的细胞包括但不限于当与本文所述的化合物中的一种或多种接触(例如,在体外)时能够完全或部分分化为内耳的成熟细胞的细胞,例如毛细胞(例如,内耳和/或外耳毛细胞)。能够分化为毛细胞的示例性细胞包括但不限于干细胞(例如,内耳干细胞、成体干细胞、骨髓衍生干细胞、胚胎干细胞、间充质干细胞、皮肤干细胞、iPS细胞和脂肪衍生干细胞)、祖细胞(例如,内耳祖细胞)、支持细胞(例如,Deiter细胞、柱细胞、内指细胞、顶盖细胞和Hensen细胞)和/或生殖细胞。干细胞用于替代内耳感觉细胞的用途描述于Li等人,(美国专利公开号2005/0287127)和Li等人,(美国专利申请号11/953,797)。骨髓衍生干细胞用于替代内耳感觉细胞的用途描述于Edge等人,PCT/US2007/084654。iPS细胞描述于例如Takahashi等人,Cell,第131卷,第5期,第861-872页(2007);Takahashi和Yamanaka,Cell 126,663-76(2006);Okita等人,Nature448,260-262(2007);Yu,J.等人,Science 318(5858):1917-1920(2007);Nakagawa等人,Nat.Biotechnol.26:101-106(2008);以及Zaehres和Scholer,Cell 131(5):834-835(2007)。此类合适的细胞可以通过分析(例如,定性或定量)一种或多种组织特异性基因的存在来鉴定。例如,可以通过检测一种或多种组织特异性基因的蛋白质产物来检测基因表达。蛋白质检测技术涉及使用针对适当抗原的抗体对蛋白质进行染色(例如,使用细胞提取物或全细胞)。在此情况下,适当的抗原是组织特异性基因表达的蛋白质产物。尽管原则上可以标记第一抗体(即结合抗原的抗体),但使用针对第一抗体的第二抗体(例如抗IgG)更常见(并且改善可视化)。此第二抗体与荧光染料、或用于比色反应的适当酶、或金珠(用于电子显微镜)或与生物素-亲和素系统缀合,使得可以鉴定一抗的位置,从而鉴定抗原的位置。
可以通过将药物组合物直接施加于外耳而将组合物和系统递送至耳朵,其中组合物是根据美国专利公开号20110142917进行修饰的。在一个实施方案中,将药物组合物施加于耳道。递送至耳朵也可称为听觉或耳部递送。
在一个实施方案中,组合物、系统或其组分和/或载体或载体系统可以通过可应用于本发明的TnpB系统的新型蛋白质递送技术通过完整圆窗经由转染至内耳而递送至耳(参见,例如,Qi等人,Gene Therapy(2013),1-9)。可以考虑将约40μl的10mM RNA作为施用于耳朵的剂量。
根据Rejali等人(Hear Res.2007年6月;228(1-2):180-7),通过良好地保存螺旋神经节神经元(植入物电刺激的目标),可以改善耳蜗植入物的功能,并且脑源性神经营养因子(BDNF)先前已被证明增强实验性聋耳中螺旋神经节的存活。Rejali等人测试了耳蜗植入物电极的改良设计,其包括由具有BDNF基因插入物的病毒载体转导的成纤维细胞涂层。为了完成这种类型的离体基因转移,Rejali等人用具有BDNF基因盒插入物的腺病毒来转导豚鼠成纤维细胞,并且确定这些细胞分泌BDNF,然后经由琼脂糖凝胶将分泌BDNF的细胞附着到耳蜗植入物电极上,并将电极植入鼓管中。Rejali等人确定,与对照电极相比,在植入48天后,表达BDNF的电极能够在耳蜗基底旋转中保留显著更多的螺旋神经节神经元,并且证明了将耳蜗植入物疗法与离体基因转移相组合以增强螺旋神经节神经元存活的可行性。此种系统可应用于本发明的用于递送至耳朵的TnpB系统。
在一个实施方案中,Mukherjea等人(Antioxidants&Redox Signaling,第13卷,第5期,2010)中阐述的系统可以适用于将组合物、系统或其组分经鼓膜施用至耳朵。在一个实施方案中,用于施用于人的TnpB多肽的剂量为约2mg至约4mg。
在一个实施方案中,Jung等人(Molecular Therapy,第21卷,第4期,第834–841页,2013年4月)中阐述的系统可以适用于将组合物、系统或其组分通过前庭上皮递送至耳朵。在一个实施方案中,用于施用于人的TnpB多肽的剂量为约1mg至约30mg。
治疗非分裂细胞疾病
在一个实施方案中,待校正的基因或转录物位于非分裂细胞中。示例性非分裂细胞是肌肉细胞或神经元。非分裂(特别是非分裂、完全分化的)细胞类型给基因靶向或基因组工程带来了问题,例如因为同源重组(HR)通常在G1细胞周期阶段受到抑制。然而,在研究细胞控制正常DNA修复系统的机制时,Durocher发现了一种先前未知的开关,其使非分裂细胞中的HR保持“关闭”,并且设计了一种重新打开此开关的策略。最近报道(Nature 16142,2015年12月9日在线发表)的Orthwein等人(Daniel Durocher’s lab at the Mount SinaiHospital in Ottawa,Canada)已经证明,HR的抑制可以解除,并且在肾(293T)和骨肉瘤(U2OS)细胞中成功完成基因靶向。已知肿瘤抑制子BRCA1、PALB2和BRAC2通过HR促进DNADSB修复。他们发现BRCA1与PALB2-BRAC2形成复合物受到PALB2上的泛素位点控制,使得E3泛素连接酶对所述位点发挥作用。此E3泛素连接酶由KEAP1(PALB2相互作用蛋白)与cullin-3(CUL3)–RBX1的复合物构成。PALB2泛素化抑制其与BRCA1的相互作用,并且被去泛素化酶USP11抵消,去泛素化酶USP11本身受到细胞周期控制。如通过多种方法测量,包括针对USP11或KEAP1(由pX459载体表达)的基于Cas多肽核酸酶的基因靶向测定,BRCA1–PALB2相互作用的恢复与DNA末端切除的活化的组合足以诱导G1期的同源重组。然而,当使用KEAP1耗竭或PALB2-KR突变体的表达在具有切除能力的G1细胞中恢复BRCA1-PALB2相互作用时,检测到基因靶向事件的稳健增加。这些教导可以适用于和/或应用于本文所述的组合物、系统。
因此,在一个实施方案中,细胞,特别是非分裂的、完全分化的细胞类型中的HR的重新活化是优选的。在一个实施方案中,促进BRCA1-PALB2相互作用是优选的。在一个实施方案中,靶细胞是非分裂细胞。在一个实施方案中,靶细胞是神经元或肌肉细胞。在一个实施方案中,靶细胞在体内被靶向。在一个实施方案中,细胞处于G1期并且HR被抑制。在一个实施方案中,优选使用KEAP1耗竭,例如抑制KEAP1活性的表达。KEAP1耗竭可以通过siRNA来实现,例如如Orthwein等人中所示。或者,优选与KEAP1耗竭组合或单独地表达PALB2-KR突变体(缺乏BRCA1相互作用结构域中的全部8个赖氨酸残基)。PALB2-KR与BRCA1相互作用,无论细胞周期位置如何。因此,优选促进或恢复BRCA1-PALB2相互作用,特别是在G1细胞中的所述相互作用。在一个实施方案中,特别是在靶细胞为非分裂的情况下,或者在去除和返回(离体基因靶向)有问题的情况下,例如神经元或肌肉细胞。KEAP1 siRNA可从ThermoFischer获得。在一个实施方案中,可将BRCA1-PALB2复合物递送至G1细胞。在一个实施方案中,可以例如通过增加去泛素化酶USP11的表达来促进PALB2去泛素化,因此设想可以提供构建体来促进或上调去泛素化酶USP11的表达或活性。
治疗眼部疾病
在一个实施方案中,待治疗的疾病是影响眼睛的疾病。因此,在一个实施方案中,将本文所述的组合物、系统或其组分递送至一只或两只眼睛。
组合物、系统可以用于校正由若干种基因突变引起的眼部缺陷,所述基因突变进一步描述于Genetic Diseases of the Eye,第二版,由Elias I.Traboulsi编辑,OxfordUniversity Press,2012。
在一个实施方案中,待治疗或靶向的病状是眼部病症。在一个实施方案中,眼部病症可包括青光眼。在一个实施方案中,眼部病症包括视网膜变性疾病。在一个实施方案中,视网膜变性疾病选自:斯塔加特病(Stargardt disease)、巴德-毕德氏综合征(Bardet-Biedl syndrome)、贝斯特病(Best disease)、蓝锥细胞单色视(Blue ConeMonochromacy)、无脉络膜症(Choroidermia)、视锥视杆营养不良(Cone-rod dystrophy)、先天性静止性夜盲症、增强型S锥综合征、青少年X连锁视网膜劈裂症(Juvenile X-LinkedRetinoschisis)、莱伯先天性黑蒙症(Leber Congenital Amaurosis)、莫拉蒂致拉分提那斯症(Malattia Leventinesse)、诺里病(Norrie Disease)或X连锁家族性渗出性玻璃体视网膜病变、模式性营养不良、索斯比营养不良(Sorsby Fundus Dystrophy)、尤塞氏综合征(Usher syndrome)、色素性视网膜炎、全色盲或黄斑营养不良或变性、色素性视网膜炎、全色盲和年龄相关性黄斑变性。在一个实施方案中,视网膜变性疾病是莱伯先天性黑蒙症(LCA)或色素性视网膜炎。其他示例性眼部疾病在本文别处更详细地描述。
在一个实施方案中,任选地经由玻璃体内注射或视网膜下注射将组合物、系统递送至眼睛。眼内注射可以借助手术显微镜执行。对于视网膜下和玻璃体内注射,可以通过轻轻的指压使眼睛突出,并使用接触镜系统将眼底可视化,所述接触镜系统由被玻璃显微镜载玻片盖玻片覆盖的角膜上的一滴耦合介质溶液组成。对于视网膜下注射,安装在5-μl的汉密尔顿注射器上的10-mm 34号针的尖端可以在直接可视化之下穿过巩膜赤道部上部朝向后极切向行进,直到所述针的孔在视网膜下空间中可见时为止。然后,可注射2μl载体悬浮液以产生上大疱性视网膜脱离,从而确认视网膜下载体施用。此方法创建了自封闭巩膜切开术,其允许载体悬浮液保留在视网膜下空间中,直到通常在所述操作的48小时内被RPE吸收。可以在下半球重复此操作以产生下视网膜脱离。此技术导致大约70%的感觉神经视网膜和RPE暴露于载体悬浮液。对于玻璃体内注射,针尖可以在角巩膜缘后方1mm穿过巩膜并且将2μl的载体悬浮液注射到玻璃体腔中。对于前房内注射,针尖可以通过角巩膜缘穿刺向中央角膜行进,并且可以注射2μl的载体悬浮液。对于前房内注射,针尖可以通过角巩膜缘穿刺向中央角膜行进,并且可以注射2μl的载体悬浮液。这些载体可以以1.0–1.4×1010或1.0–1.4×109转导单位(TU)/ml的滴度注射。
在一个实施方案中,为了向眼睛施用,慢病毒载体。在一个实施方案中,慢病毒载体是马传染性贫血病毒(EIAV)载体。用于眼睛递送的示例性EIAV载体描述于Balagaan,JGene Med 2006;8:275–285,2005年11月21日在Wiley InterScience(www.interscience.wiley.com)在线发表.DOI:10.1002/jgm.845;Binley等人,HUMANGENE THERAPY 23:980–991(2012年9月),其可以适合与本文所述的组合物、系统一起使用。在一个实施方案中,剂量可以是1.1x 105转导单位/眼睛(TU/眼),总体积为100μl。
其他病毒载体也可以用于递送至眼睛,所述病毒载体诸如AAV载体,诸如Campochiaro等人,Human Gene Therapy 17:167-176(2006年2月),Millington-Ward等人(Molecular Therapy,第19卷第4期,642–649 2011年4月;Dalkara等人(Sci Transl Med5,189ra76(2013))中描述的那些,其可以适合与本文所述的组合物、系统一起使用。在一个实施方案中,剂量可以在约106至109.5颗粒单位的范围内。在Millington-Ward AAV载体的上下文中,可以施用约2x1011至约6x 1013病毒颗粒的剂量。在Dalkara载体的上下文中,向人施用约1x 1015至约1x 1016vg/ml的剂量。
在一个实施方案中,RXi Pharmaceuticals的系统可用于/和/或适合将组合物、系统递送至眼睛。在此系统中,单次玻璃体内施用3μg的sd-rxRNA导致PPIBmRNA水平的序列特异性降低,持续14天。系统可应用于本发明的TnpB系统,考虑向人施用约3至20mg组合物的剂量。
在其他实施方案中,美国专利公开号20130183282的方法(其涉及从人视紫红质基因切割靶序列的方法)也可以针对本发明的TnpB系统进行修改。
在其他实施方案中,可以使用或调整美国专利公开号20130202678的用于治疗视网膜病和威胁视力的眼科病症的方法,所述方法涉及将Puf-A基因(其在视网膜神经节和眼组织色素细胞中表达,并表现出独特的抗凋亡活性)递送至眼睛的视网膜下或玻璃体内空间。特别地,期望的靶标是zgc:193933、prdm1a、spata2、tex10、rbb4、ddx3、zp2.2、Blimp-1和HtrA2,所有这些都可以被本发明的组合物、系统靶向。
Wu(Cell Stem Cell,13:659–62,2013)设计了一种指导RNA,其将Cas9导向至单个碱基突变,所述突变在小鼠中引起白内障,其中所述Cas9诱导DNA切割。然后,在突变小鼠中,使用针对接合子(zygote)修复机制给予的另一种野生型等位基因或寡核苷酸来校正断裂的等位基因的序列并且校正引起白内障的基因缺陷。此方法可以适用于和/或应用于本文所述的TnpB组合物、系统。
美国专利公开号20120159653描述了使用锌指核酸酶对与黄斑变性(MD)相关的细胞、动物和蛋白质进行遗传修饰,其教导可以应用于和/或适合于本文所述的TnpB组合物、系统。
美国专利公开号20120159653的一个方面涉及编辑编码与MD相关的蛋白质的任何染色体序列,其可应用于本发明的TnpB系统。
治疗肌肉疾病和心血管疾病
在一个实施方案中,组合物、系统可以用于治疗和/或预防肌肉疾病和相关循环或心血管疾病或病症。本发明还考虑将本文所述的组合物、系统(例如TnpB效应蛋白系统)递送至心脏。对于心脏,优选心肌热带腺相关病毒(AAVM),特别是在心脏中显示出优先基因转移的AAVM41(参见,例如,Lin-Yanga等人,PNAS,2009年3月10日,第106卷,第10期)。施用可以是全身性的或局部的。对于全身施用,可以考虑约1-10x 1014个载体基因组的剂量。另见,例如,Eulalio等人(2012)Nature 492:376和Somasuntharam等人(2013)Biomaterials 34:7790,其教导可以适合于和/或应用于本文所述的组合物、系统。
例如,美国专利公开号20110023139(其教导可以适合于和/或应用于本文所述的组合物、系统)描述了使用锌指核酸酶来遗传修饰与心血管疾病相关的细胞、动物以及蛋白质。心血管疾病通常包括高血压、心脏病、心力衰竭以及中风和TIA。涉及心血管疾病的任何染色体序列或由涉及心血管疾病的任何染色体序列编码的蛋白质都可以用于本公开中描述的方法中。通常基于心血管相关蛋白与心血管疾病的发展的实验性关联来选择心血管相关蛋白。例如,相对于缺乏心血管病症的群体,在具有心血管病症的群体中,心血管相关蛋白的产生率或循环浓度可以升高或降低。可以使用蛋白质组技术来评估蛋白质水平差异,包括但不限于蛋白质印迹、免疫组织化学染色、酶联免疫吸附测定(ELISA)以及质谱法。或者,可以使用基因组技术通过获得编码所述蛋白质的基因的基因表达谱来鉴定心血管相关蛋白,所述技术包括但不限于DNA微阵列分析、基因表达系列分析(SAGE)以及定量实时聚合酶链反应(Q-PCR)。
本文的组合物、系统可以用于治疗肌肉系统的疾病。本发明还考虑将本文所述的组合物、系统、效应蛋白系统递送至肌肉。
在一个实施方案中,待治疗的肌肉疾病是肌肉营养不良,诸如DMD。在一个实施方案中,本文所述的组合物、系统(诸如能够进行RNA修饰的系统)可以用于实现外显子跳跃,以实现患病基因的校正。如本文所用,术语“外显子跳跃”是指通过靶向具有一个或多个互补反义通过阻止剪接体接近一个或多个剪接供体或受体位点,AON可以防止剪接反应,从而导致一个或多个外显子从完全加工的mRNA中缺失。在前mRNA的成熟过程期间,可以在细胞核中实现外显子跳跃。在一些实例中,外显子跳跃可包括通过使用本文所述的能够进行RNA修饰的组合物、系统来掩蔽参与靶向外显子的剪接的关键序列。在一个实施方案中,可以在肌营养不良蛋白mRNA中实现外显子跳跃。在一个实施方案中,组合物、系统可以诱导肌营养不良蛋白mRNA的外显子1、2、3、4、5、6、7、8、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、45、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79或其任何组合处的外显子跳跃。在一个实施方案中,组合物、系统可以诱导肌营养不良蛋白mRNA的外显子43、44、50、51、52、55或其任何组合处的外显子跳跃。这些外显子中的突变也可以使用非外显子跳跃多核苷酸修饰方法来校正。
在一个实施方案中,为了治疗肌肉疾病,可以将Bortolanza等人MolecularTherapy第19卷第11期,2055–2064 2011年11月)的方法应用于表达TnpB多肽的AAV,并且以约2×1015或2×1016vg载体的剂量注射到人体内。Bortolanza等人的教导可以适用于和/或应用于本文所述的组合物、系统。
在一个实施方案中,可以将Dumonceaux等人(Molecular Therapy第18卷第5期,881–887 2010年5月)的方法应用于表达TnpB多肽的AAV,并且例如以约1014至约1015vg载体的剂量注射到人体内。本文所述的Dumonceaux的教导可以适用于和/或应用于本文所述的组合物、系统。
在一个实施方案中,可以将Kinouchi等人(Gene Therapy(2008)15,1126–1130)的方法应用于本文所述的组合物,并且注射到人体内,例如以约500至1000ml的40μM溶液的剂量注射到肌肉中。
在一个实施方案中,Hagstrom等人(Molecular Therapy第10卷,第2期,2004年8月)的方法可以适合和/或应用于本文的组合物、系统,并且以约15至约50mg的剂量注射到人的大隐静脉中。
在一个实施方案中,所述方法包括治疗镰状细胞相关疾病,例如镰状细胞性状、镰状细胞疾病,诸如镰状细胞性贫血、β-地中海贫血。例如,方法和系统可用于例如通过校正β-珠蛋白基因的一种或多种突变来修饰镰状细胞的基因组。在β-地中海贫血的情况下,可以通过用所述系统修饰HSC来校正镰状细胞性贫血。系统允许通过切割细胞基因组的DNA并且然后让它自我修复来对细胞基因组进行特定编辑。插入TnpB多肽,并且核酸组分分子将其引导至突变点,然后TnpB多肽在所述点切割DNA。同时,插入所述序列的健康版本。细胞自身的修复系统使用此序列来修复诱导的切割。以此方式,TnpB多肽允许校正先前获得的干细胞中的突变。方法和系统可用于使用靶向并校正突变(例如,使用递送β-珠蛋白、有利地非镰状β-珠蛋白的编码序列的合适的HDR模板)的系统来校正关于镰状细胞性贫血的HSC;具体来说,核酸组分分子可以靶向引起镰状细胞性贫血的突变,并且HDR可以提供β-珠蛋白正确表达的编码。将靶向含有突变和TnpB多肽的颗粒的核酸组分分子与携带突变的HSC接触。颗粒还可以含有合适的HDR模板来校正突变,以正确表达β-珠蛋白;或者HSC可以与含有或递送HDR模板的第二颗粒或载体接触。可以施用如此接触的细胞;并任选地进行处理/扩展;参见Cartier。HDR模板可以提供表达工程化β-珠蛋白基因(例如,βA-T87Q)或β-珠蛋白的HSC。
治疗肝脏和肾脏疾病
在一个实施方案中,本文所述的组合物、系统或其组分可以用于治疗肾脏或肝脏疾病。因此,在一个实施方案中,本文所述的组合物或其组分递送至肝脏或肾脏。
诱导治疗性核酸的细胞摄取的递送策略包括物理力或载体系统,诸如基于病毒、脂质或复合物的递送、或纳米载体。根据具有较低可能的临床相关性的最初应用,当以全身性流体动力高压注射将核酸寻址(address)于肾细胞时,许多种基因治疗性病毒和非病毒载体已经被应用于体内靶向不同的动物肾脏疾病模型中的转录后事件(Csaba Révész和Péter Hamar(2011)。Delivery Methods to Target RNAs in the Kidney,Gene TherapyApplications,Prof.Chunsheng Kang(编辑),ISBN:978-953-307-541-9,InTech,可获自:www.intechopen.com/books/gene-therapy-applications/delivery-methods-to-target-rnas-inthe-kidney)。向肾脏的递送方法可包括Yuan等人(Am J Physiol RenalPhysiol 295:F605–F617,2008)中的那些。Yuang等人的方法可应用于本发明的组合物,考虑将1-2g与胆固醇缀合的多肽核酸酶皮下注射至人,以递送至肾脏。在一个实施方案中,Molitoris等人(J Am Soc Nephrol 20:1754–1764,2009)的方法可以适合所述组合物,并且对人的12-20mg/kg的累积剂量可以用于递送至肾脏的近端小管细胞。在一个实施方案中,Thompson等人(Nucleic Acid Therapeutics,第22卷,第4期,2012)的方法可以适合所述组合物,并且可以经由静脉内施用来递送至多25mg/kg的剂量。在一个实施方案中,Shimizu等人(J Am Soc Nephrol 21:622–633,2010)的方法可以适合所述组合物,并且可以使用与纳米载体在约1-2升生理流体中复合的约10-20μmol组合物的剂量用于腹膜内施用。
其他各种递送媒介物可以用于将组合物、系统递送至肾脏,诸如病毒、流体动力学、脂质、聚合物纳米颗粒、适体及其各种组合(参见,例如,Larson等人,Surgery,(2007年8月),第142卷,第2期,第(262-269)页;Hamar等人,Proc Natl Acad Sci,(2004年10月),第101卷,第41期,第(14883-14888)页;Zheng等人,Am J Pathol,(2008年10月),第173卷,第4期,第(973–980)页;Feng等人,Transplantation,(2009年5月),第87卷,第9期,第(1283–1289)页;Q.Zhang等人,PloS ONE,(2010年7月),第5卷,第7期,e11709,第(1-13)页;Kushibikia等人,J Controlled Release,(2005年7月),第105卷,第3期,第(318-331)页;Wang等人,Gene Therapy,(2006年7月),第13卷,第14期,第(1097-1103)页;Kobayashi等人,Journal of Pharmacology and Experimental Therapeutics,(2004年2月),第308卷,第2期,第(688-693)页;Wolfrum等人,Nature Biotechnology,(2007年9月),第25卷,第10期,第(1149-1157)页;Molitoris等人,J Am Soc Nephrol,(2009年8月),第20卷,第8期第(1754-1764)页;Mikhaylova等人,Cancer Gene Therapy,(2011年3月),第16卷,第3期,第(217-226)页;Y.Zhang等人,J Am Soc Nephrol,(2006年4月),第17卷,第4期,第(1090–1101)页;Singhal等人,Cancer Res,(2009年5月),第69卷,第10期,第(4244-4251)页;Malek等人,Toxicology and Applied Pharmacology,(2009年4月),第236卷,第1期,第(97-108)页;Shimizu等人,J Am Soc Nephrology,(2010年4月),第21卷,第4期,第(622-633)页;Jiang等人,Molecular Pharmaceutics,(2009年5月至6月),第6卷,第3期,第(727-737)页;Cao等人,J Controlled Release,(2010年6月),第144卷,第2期,第(203-212)页;Ninichuk等人,Am J Pathol,(2008年3月),第172卷,第3期,第(628-637)页;Purschke等人,Proc Natl Acad Sci,(2006年3月),第103卷,第13期,第(5173-5178)页。
在一个实施方案中,递送至肝脏细胞。在一个实施方案中,肝脏细胞是肝细胞(hepatocyte)。本文的组合物和系统的递送可以经由病毒载体进行,特别是AAV(并且特别是AAV2/6)载体。这些可以通过静脉注射施用。无论是体外还是体内,肝脏的优选靶标是白蛋白基因。这是所谓的“安全港”,因为白蛋白以非常高的水平表达,因此成功的基因编辑后白蛋白产量的一些减少是可以容忍的。其也是优选的,因为即使仅编辑一小部分肝细胞,从白蛋白启动子/增强子观察到的高水平表达也允许实现有用水平的正确或转基因生产(从插入的重组模板)。参见Wechsler等人(在美国血液学会第57届年会和博览会上报告-摘要可在ash.confex.com/ash/2015/webprogram/Pap er86495.html在线获得,并于2015年12月6日提交)鉴定的可适用于本文的组合物、系统的位点。
可以治疗和/或预防的示例性肝脏和肾脏疾病在本文别处描述。
治疗上皮疾病和肺部疾病
在一个实施方案中,通过本文所述的组合物和系统治疗或预防的疾病可以是肺部或上皮疾病。本文所述的组合物和系统可以用于治疗上皮疾病和/或肺部疾病。本发明还考虑将本文所述的组合物、系统递送至一侧或两侧肺。
在一个实施方案中,病毒载体可以用于将组合物、系统或其组分递送至肺。在一个实施方案中,AAV是用于递送至肺部的AAV-1、AAV-2、AAV-5、AAV-6和/或AAV-9。(参见,例如,Li等人,Molecular Therapy,第17卷第12期,2067-2077 2009年12月)。在一个实施方案中,MOI可以在1×103至4×105个载体基因组/细胞之间变化。在一个实施方案中,递送载体可以是RSV载体,如Zamora等人(Am J Respir Crit Care Med第183卷第531–538页,2011中所述。Zamora等人的方法可以应用于本发明的TnpB系统,并且本发明可以考虑例如剂量为0.6mg/kg的雾化组合物。
接受肺部疾病治疗的受试者可以例如每侧肺接受支气管内递送的药学有效量的雾化AAV载体系统,同时自主呼吸。因此,一般来讲,AAV递送优选雾化递送。腺病毒或AAV颗粒可用于递送。可以将合适的基因构建体(每个可操作地连接至一个或多个调控序列)克隆到递送载体中。在此情况下,提供以下构建体作为实例:TnpB的Cbh或EF1a启动子、核酸组分分子的U6或H1启动子:优选的安排是使用靶向CFTRδ508的核酸组分分子、δF508突变的修复模板和密码子优化的组合物,任选地具有一个或多个核定位信号或序列(NLS),例如两(2)个NLS。
治疗皮肤疾病
本文所述的组合物和系统可用于治疗皮肤疾病。本发明还考虑将本文所述的组合物和系统递送至皮肤。
在一个实施方案中,组合物、系统或其组分可以经由一根或多根微针或含有微针的装置来递送至皮肤(皮内递送)。例如,在一个实施方案中,Hickerson等人(MolecularTherapy—Nucleic Acids(2013)2,e129)的装置和方法可以用于和/或适合将本文所述的组合物、系统例如以至多300μl的0.1mg/ml组合物的剂量递送至皮肤。
在一个实施方案中,Leachman等人(Molecular Therapy,第18卷第2期,442–4462010年2月)的方法和技术可以用于和/或适合将本文所述的组合物递送至皮肤。
在一个实施方案中,Zheng等人(PNAS,2012年7月24日,第109卷,第30期,11975–11980)的方法和技术可以用于和/或适合将本文所述的组合物通过纳米颗粒递送至皮肤。在一个实施方案中,在单次应用中施加约25nM的剂量可以实现皮肤中的基因敲低。
治疗癌症
本文所述的组合物、系统可以用于治疗癌症。本发明还考虑将本文所述的组合物、系统递送至癌细胞。此外,如本文别处所述,组合物、系统可以用于修饰免疫细胞,诸如CAR或CAR T细胞,所述免疫细胞然后可以进而用于治疗和/或预防癌症。这也在国际专利公开号WO 2015/161276中描述,其公开内容特此通过引用并入并且在下文中描述。
适合治疗或预防癌症的靶基因可以包括表2和3中列出的那些。在一个实施方案中,用于癌症治疗和预防的靶基因还可以包括国际专利公开号WO 2015/048577中描述的那些,所述专利的公开内容特此通过引用并入,并且可以适用于和/或应用于本文所述的组合物、系统。
过继细胞疗法
本文所述的组合物、系统及其组分可用于修饰细胞以用于过继细胞疗法。在本发明的一个方面,通过调整本发明的组合物、系统来理解涉及编辑靶核酸序列或调节靶核酸序列的表达的方法和组合物及其与癌症免疫疗法相关的应用。在一些实例中,组合物、系统和方法可用于修饰干细胞(例如,诱导型多能细胞)以衍生修饰的自然杀伤细胞、γδT细胞和αβT细胞,其可以用于过继细胞疗法。在某些实例中,组合物、系统和方法可用于对修饰的自然杀伤细胞、γδT细胞和αβT细胞进行修饰。
如本文所用,“ACT”、“过继细胞疗法”和“过继细胞转移”可互换使用。在一个实施方案中,过继细胞疗法(ACT)可以指代将细胞转移至患者,目的是通过细胞植入将功能和特征转移至新宿主中(参见,例如,Mettananda等人,Editing anα-globin enhancer inprimary human hematopoietic stem cells as a treatment forβ-thalassemia,NatCommun.2017年9月4日;8(1):424)。如本文所用,术语“植入(engraft)”或“植入(engraftment)”是指细胞通过与组织的现有细胞接触而在体内掺入到感兴趣的组织中的过程。过继细胞疗法(ACT)可以指代将细胞(最常见的是免疫衍生细胞)转移回同一患者或新的受体宿主中,目的是将免疫功能和特征转移到新宿主中。如果可能的话,使用自体细胞有助于受体最大程度地减少GVHD问题。自体肿瘤浸润淋巴细胞(TIL)(Zacharakis等人,(2018)Nat Med.2018年6月;24(6):724-730;Besser等人,(2010)Clin.Cancer Res 16(9)2646–55;Dudley等人,(2002)Science 298(5594):850–4;和Dudley等人,(2005)Journalof Clinical Oncology 23(10):2346–57.)或遗传重定向的外周血单核细胞(Johnson等人,(2009)Blood 114(3):535–46;和Morgan等人,(2006)Science 314(5796)126-9)的过继转移已经用于成功治疗患有晚期实体瘤(包括黑色素瘤、转移性乳腺癌和结直肠癌)的患者,以及患有CD19表达性血液恶性肿瘤的患者(Kalos等人,(2011)Science TranslationalMedicine 3(95):95ra73)。在一个实施方案中,转移同种异体细胞免疫细胞(参见,例如,Ren等人,(2017)Clin Cancer Res 23(9)2255-2266)。如本文进一步所述,可以编辑同种异体细胞以降低同种异体反应性并预防移植物抗宿主病。因此,同种异体细胞的使用允许从健康供体获得细胞并制备用于患者,而不是在诊断后从患者制备自体细胞。
本发明的方面涉及对所选抗原(诸如肿瘤相关抗原或肿瘤特异性新抗原)具有特异性的免疫系统细胞(诸如T细胞)的过继转移(参见,例如,Maus等人,2014,AdoptiveImmunotherapy for Cancer or Viruses,Annual Review of Immunology,第32卷:189-225;Rosenberg和Restifo,2015,Adoptive cell transfer as personalizedimmunotherapy for human cancer,Science第348卷第6230期第62-68页;Restifo等人,2015,Adoptive immunotherapy for cancer:harnessing the T cellresponse.Nat.Rev.Immunol.12(4):269-281;和Jenson和Riddell,2014,Design andimplementation of adoptive therapy with chimeric antigen receptor-modified Tcells.Immunol Rev.257(1):127–144;和Rajasagi等人,2014,Systematicidentification of personal tumor-specific neoantigens in chronic lymphocyticleukemia.Blood.2014年7月17日;124(3):453-62)。
在一个实施方案中,疾病(诸如特别是肿瘤或癌症)的过继细胞疗法(诸如特别是CAR或TCR T细胞疗法)中靶向的抗原(诸如肿瘤抗原)可以选自由以下组成的组:MR1(参见,例如,Crowther等人,2020,Genome-wide CRISPR–Cas9 screening reveals ubiquitous Tcell cancer targeting via the monomorphic MHC class I-related protein MR1,Nature Immunology第21卷,第178–185页)、B细胞成熟抗原(BCMA)(参见,例如,Friedman等人,Effective Targeting of Multiple BCMA-Expressing Hematological Malignanciesby Anti-BCMACAR T Cells,Hum Gene Ther.2018年3月8日;Berdeja JG等人Durableclinical responses in heavily pretreated patients with relapsed/refractorymultiple myeloma:updated results from a multicenter study of bb2121anti-BcmaCAR T cell therapy.Blood.2017;130:740;以及Mouhieddine和Ghobrial,Immunotherapyin Multiple Myeloma:The Era of CAR T Cell Therapy,Hematologist,2018年5月至6月,第15卷,第3期);PSA(前列腺特异性抗原);前列腺特异性膜抗原(PSMA);PSCA(前列腺干细胞抗原);酪氨酸蛋白激酶跨膜受体ROR1;成纤维细胞活化蛋白(FAP);肿瘤相关糖蛋白72(TAG72);癌胚抗原(CEA);上皮细胞粘附分子(EPCAM);间皮素;人表皮生长因子受体2(ERBB2(Her2/neu));前列腺酶(prostase);前列腺酸性磷酸酶(PAP);延长因子2突变体(ELF2M);胰岛素样生长因子1受体(IGF-1R);gplOO;BCR-ABL(断点簇区域-Abelson);酪氨酸酶;纽约食管鳞状上皮癌抗原1(NY-ESO-1);κ-轻链、LAGE(L抗原);MAGE(黑色素瘤抗原);黑色素瘤相关抗原1(MAGE-A1);MAGE A3;MAGE A6;legumain;人乳头状瘤病毒(HPV)E6;HPVE7;prostein;生存素;PCTA1(半乳糖凝集素8);Melan-A/MART-1;Ras突变体;TRP-1(酪氨酸相关蛋白1或gp75);酪氨酸相关蛋白2(TRP2);TRP-2/INT2(TRP-2/内含子2);RAGE(肾抗原);晚期糖基化终产物受体1(RAGE1);肾遍在蛋白(renal ubiquitous)1、2(RU1、RU2);肠羧酯酶(iCE);热休克蛋白70-2(HSP70-2)突变体;促甲状腺激素受体(TSHR);CD123;CD171;CD19;CD20;CD22;CD26;CD30;CD33;CD44v7/8(分化簇44、外显子7/8);CD53;CD92;CD100;CD148;CD150;CD200;CD261;CD262;CD362;CS-1(CD2子集1、CRACC、SLAMF7、CD319和19A24);C型凝集素样分子1(CLL-1);神经节苷脂GD3(aNeu5Ac(2-8)aNeu5Ac(2-3)bDGalp(1-4)bDGlcp(1-1)Cer);Tn抗原(Tn Ag);Fms样酪氨酸激酶3(FLT3);CD38;CD138;CD44v6;B7H3(CD276);KIT(CD117);白介素13受体亚基α2(IL-13Ra2);白介素11受体α(IL-11Ra);前列腺干细胞抗原(PSCA);丝氨酸蛋白酶21(PRSS21);血管内皮生长因子受体2(VEGFR2);刘易斯(Y)抗原(Lewis(Y)antigen);CD24;血小板衍生生长因子受体β(PDGFR-β);阶段特异性胚胎抗原4(SSEA-4);粘蛋白1,细胞表面相关(MUC1);粘蛋白16(MUC16);表皮生长因子受体(EGFR);表皮生长因子受体变体III(EGFRvIII);神经细胞粘附分子(NCAM);碳酸酐酶IX(CAIX);蛋白酶体(Prosome、Macropain)亚基、β型、9(LMP2);肝配蛋白A型受体2(EphA2);肝配蛋白B2;岩藻糖基GM1;唾液酸刘易斯粘附分子(sialyl Lewis adhesion molecule)(sLe);神经节苷脂GM3(aNeu5Ac(2-3)bDGalp(1-4)bDGlcp(1-1)Cer);TGS5;高分子量黑色素瘤相关抗原(HMWMAA);o-乙酰基-GD2神经节苷脂(OAcGD2);叶酸受体α;叶酸受体β;肿瘤内皮标志物1(TEM1/CD248);肿瘤内皮标志物7相关(TEM7R);紧密连接蛋白6(CLDN6);G蛋白偶联受体C类5组成员D(GPRC5D);X染色体开放阅读框61(CXORF61);CD97;CD179a;间变性淋巴瘤激酶(ALK);多唾液酸;胎盘特异性1(PLAC1);globoH甘油酰胺的六糖部分(GloboH);乳腺分化抗原(NY-BR-1);uroplakin 2(UPK2);甲型肝炎病毒细胞受体1(HAVCR1);肾上腺素受体β3(ADRB3);pannexin 3(PANX3);G蛋白偶联受体20(GPR20);淋巴细胞抗原6复合物,K9基因座(LY6K);嗅觉受体51E2(OR51E2);TCRγ交替阅读框蛋白(TARP);维尔姆斯氏瘤(Wilms tumor)蛋白(WT1);ETS易位变异基因6,位于染色体12p(ETV6-AML);精子蛋白17(SPA17);X抗原家族成员1A(XAGE1);血管生成素结合细胞表面受体2(Tie 2);CT(癌症/睾丸(抗原));黑色素瘤癌症睾丸抗原1(MAD-CT-1);黑色素瘤癌症睾丸抗原2(MAD-CT-2);Fos相关抗原1;p53;p53突变体;人端粒酶逆转录酶(hTERT);肉瘤易位断点;黑色素瘤细胞凋亡抑制剂(ML-IAP);ERG(跨膜蛋白酶丝氨酸2(TMPRSS2)ETS融合基因);N-乙酰葡糖胺基转移酶V(NA17);配对盒蛋白(PAX3);雄激素受体;细胞周期蛋白B1;细胞周期蛋白D1;v-myc禽骨髓细胞瘤病毒癌基因神经母细胞瘤衍生同源物(MYCN);Ras同源物家族成员C(RhoC);细胞色素P450 1B1(CYP1B1);CCCTC结合因子(锌指蛋白)样(BORIS);T细胞识别的鳞状细胞癌抗原1或3(SART1、SART3);配对盒蛋白Pax-5(PAX5);顶体蛋白结合蛋白sp32(OY-TES1);淋巴细胞特异性蛋白酪氨酸激酶(LCK);A激酶锚定蛋白4(AKAP-4);滑膜肉瘤、X断点1、2、3或4(SSX1、SSX2、SSX3、SSX4);CD79a;CD79b;CD72;白细胞相关免疫球蛋白样受体1(LAIR1);IgA受体的Fc片段(FCAR);白细胞免疫球蛋白样受体亚家族A成员2(LILRA2);CD300分子样家族成员f(CD300LF);C型凝集素结构域家族12成员A(CLEC12A);骨髓基质细胞抗原2(BST2);EGF样含模块粘蛋白样激素受体样2(EMR2);淋巴细胞抗原75(LY75);磷脂酰肌醇蛋白多糖3(GPC3);Fc受体样5(FCRL5);小鼠双分钟2同源物(MDM2);livin;甲胎蛋白(AFP);跨膜活化因子和CAML相互作用子(TACI);B细胞活化因子受体(BAFF-R);V-Ki-ras2 Kirsten大鼠肉瘤病毒癌基因同源物(KRAS);免疫球蛋白λ样多肽1(IGLL1);707-AP(707丙氨酸脯氨酸);ART-4(T4细胞识别的腺癌抗原);BAGE(B抗原;b-连环蛋白/m,b连环蛋白/突变的);CAMEL(黑色素瘤上的CTL识别抗原);CAP1(癌胚抗原肽1);CASP-8(半胱天冬酶8);CDC27m(细胞分裂周期27突变);CDK4/m(细胞周期蛋白E依赖性激酶4突变);Cyp-B(亲环蛋白B);DAM(分化抗原黑色素瘤);EGP-2(上皮糖蛋白2);EGP-40(上皮糖蛋白40);Erbb2、3、4(红细胞白血病病毒癌基因同源物2、3、4);FBP(叶酸结合蛋白);fAchR(胎儿乙酰胆碱受体);G250(糖蛋白250);GAGE(G抗原);GnT-V(N-乙酰葡糖胺基转移酶V);HAGE(螺旋糖抗原);ULA-A(人白细胞抗原A);HST2(人印戒瘤2);KIAA0205;KDR(激酶插入结构域受体);LDLR/FUT(低密度脂受体/GDP L-海藻糖:b-D-半乳糖苷酶2-a-L岩藻糖基转移酶);L1CAM(L1细胞粘附分子);MC1R(黑皮质素1受体);肌球蛋白/m(突变的肌球蛋白);MUM-1、-2-3(突变的黑色素瘤遍在蛋白1、2、3);NA88-A(患者M88的NA cDNA克隆);KG2D(自然杀伤2组成员D)配体;癌胎抗原(h5T4);p190微小bcr-abl(190KD bcr-abl的蛋白质);Pml/RARa(早幼粒细胞白血病/视黄酸受体a);PRAME(优先表达的黑色素瘤抗原);SAGE(肉瘤抗原);TEL/AML1(易位Ets家族白血病/急性髓系白血病1);TPI/m(突变的磷酸丙糖异构酶);CD70;及其任何组合。
在一个实施方案中,疾病(诸如特别是肿瘤或癌症)的过继细胞疗法(诸如特别是CAR或TCR T细胞疗法)中靶向的抗原是肿瘤特异性抗原(TSA)。
在一个实施方案中,疾病(诸如特别是肿瘤或癌症)的过继细胞疗法(诸如特别是CAR或TCR T细胞疗法)中靶向的抗原是新抗原。
在一个实施方案中,疾病(诸如特别是肿瘤或癌症)的过继细胞疗法(诸如特别是CAR或TCR T细胞疗法)中靶向的抗原是肿瘤相关抗原(TAA)。
在一个实施方案中,疾病(诸如特别是肿瘤或癌症)的过继细胞疗法(诸如特别是CAR或TCR T细胞疗法)中靶向的抗原是通用肿瘤抗原。在某些优选的实施方案中,通用肿瘤抗原选自由以下组成的组:人端粒酶逆转录酶(hTERT)、存活蛋白(survivin)、小鼠双分钟2同源物(MDM2)、细胞色素P450 1B 1(CYP1B)、HER2/neu、维尔姆斯氏瘤基因1(WT1)、livin、甲胎蛋白(AFP)、癌胚抗原(CEA)、粘蛋白16(MUC16)、MUC1、前列腺特异性膜抗原(PSMA)、p53、细胞周期蛋白(Dl)及其任何组合。
在一个实施方案中,疾病(诸如特别是肿瘤或癌症)的过继细胞疗法(诸如特别是CAR或TCR T细胞疗法)中靶向的抗原(诸如肿瘤抗原)可以选自由以下组成的组:CD19、BCMA、CD70、CLL-1、MAGE A3、MAGE A6、HPV E6、HPV E7、WT1、CD22、CD171、ROR1、MUC16和SSX2。在某些优选的实施方案中,抗原可以是CD19。例如,CD19可以靶向血液恶性肿瘤,诸如淋巴瘤,更特别地B细胞淋巴瘤,诸如但不限于弥漫性大B细胞淋巴瘤、原发性纵隔b细胞淋巴瘤、转化滤泡性淋巴瘤、边缘区淋巴瘤、套细胞淋巴瘤、急性淋巴细胞白血病(包括成人和儿童ALL)、非霍奇金淋巴瘤(non-Hodgkin lymphoma)、惰性非霍奇金淋巴瘤或慢性淋巴细胞白血病。例如,BCMA可以靶向多发性骨髓瘤或浆细胞白血病(参见,例如,2018AmericanAssociation for Cancer Research(AACR)Annual meeting Poster:AllogeneicChimeric Antigen Receptor T Cells Targeting B Cell Maturation Antigen)。例如,CLL1可以靶向急性髓系白血病。例如,MAGE A3、MAGE A6、SSX2和/或KRAS可以靶向实体瘤。例如,HPV E6和/或HPV E7可以靶向宫颈癌或头颈癌。例如,WT1可以靶向急性髓系白血病(AML)、骨髓增生异常综合征(MDS)、慢性髓系白血病(CML)、非小细胞肺癌、乳腺癌、胰腺癌、卵巢癌或结直肠癌或间皮瘤。例如,CD22可以靶向B细胞恶性肿瘤,包括非霍奇金淋巴瘤、弥漫性大B细胞淋巴瘤或急性淋巴细胞白血病。例如,CD171可以靶向神经母细胞瘤、胶质母细胞瘤或肺癌、胰腺癌或卵巢癌。例如,ROR1可以靶向ROR1+恶性肿瘤,包括非小细胞肺癌、三阴性乳腺癌、胰腺癌、前列腺癌、ALL、慢性淋巴细胞白血病或套细胞淋巴瘤。例如,MUC16可以靶向MUC16ecto+上皮性卵巢癌、输卵管癌或原发性腹膜癌。例如,CD70可以靶向血液恶性肿瘤以及实体癌,诸如肾细胞癌(RCC)、神经胶质瘤(例如,GBM)和头颈癌(HNSCC)。CD70在血液恶性肿瘤以及实体癌中表达,而其在正常组织中的表达仅限于淋巴细胞类型的子集(参见,例如,2018American Association for Cancer Research(AACR)Annual meetingPoster:Allogeneic CRISPR Engineered Anti-CD70 CAR-T Cells Demonstrate PotentPreclinical Activity Against Both Solid and Hematological Cancer Cells)。
例如,可以采用各种策略通过改变T细胞受体(TCR)的特异性来对T细胞进行遗传修饰,例如通过引入具有选定肽特异性的新TCRα和β链(参见美国专利号8,697,854;PCT专利公开:WO2003020763、WO2004033685、WO2004044004、WO2005114215、WO2006000830、WO2008038002、WO2008039818、WO2004074322、WO2005113595、WO2006125962、WO2013166321、WO2013039889、WO2014018863、WO2014083173;美国专利号8,088,379)。
作为TCR修饰的替代方案或补充,可以使用嵌合抗原受体(CAR)以便产生对所选靶标(诸如恶性细胞)具有特异性的免疫反应细胞(诸如T细胞),其中已描述了多种受体嵌合构建体(参见美国专利号5,843,728;5,851,828;5,912,170;6,004,811;6,284,240;6,392,013;6,410,014;6,753,162;8,211,422;和PCT公开WO 9215322)。
一般来讲,CAR由细胞外结构域、跨膜结构域和细胞内结构域组成,其中细胞外结构域包含对预定靶标具有特异性的抗原结合结构域。虽然CAR的抗原结合结构域通常是抗体或抗体片段(例如,单链可变片段scFv),但结合结构域没有特别限制,只要其导致靶标的特异性识别即可。例如,在一个实施方案中,抗原结合结构域可以包含受体,使得CAR能够结合受体的配体。或者,抗原结合结构域可以包含配体,使得CAR能够结合所述配体的内源受体。
CAR的抗原结合结构域通常通过铰链或间隔子与跨膜结构域分开。间隔子也没有特别限制,并且其被设计为给CAR提供柔性。例如,间隔子结构域可包含人Fc结构域的一部分(包括CH3结构域的一部分),或任何免疫球蛋白(诸如IgA、IgD、IgE、IgG或IgM或其变体)的铰链区。此外,可以修饰铰链区以防止FcR或其他潜在干扰物的脱靶结合。例如,铰链可包含具有或不具有S228P、L235E和/或N297Q突变(根据Kabat编号)的IgG4 Fc结构域,以便减少与FcR的结合。额外的间隔子/铰链包括但不限于CD4、CD8和CD28铰链区。
CAR的跨膜结构域可以衍生自天然来源或合成来源。当来源是天然的时,结构域可衍生自任何膜结合蛋白或跨膜蛋白。本公开中特别使用的跨膜区可衍生自CD8、CD28、CD3、CD45、CD4、CD5、CDS、CD9、CD 16、CD22、CD33、CD37、CD64、CD80、CD86、CD 134、CD137、CD 154、TCR。或者,跨膜结构域可以是合成的,在这种情况下,它将主要包含疏水性残基,诸如亮氨酸和缬氨酸。优选地,在合成的跨膜结构域的每一端都将发现苯丙氨酸、色氨酸和缬氨酸的三联体。任选地,短的寡肽或多肽接头(优选长度在2与10个氨基酸之间)可以形成CAR的跨膜结构域与细胞质信号传导结构域之间的连接。甘氨酸-丝氨酸双联体提供了特别合适的接头。
替代CAR构建体的特征可能是属于连续几代。第一代CAR通常由对抗原具有特异性的抗体的单链可变片段组成,例如包含与特定抗体的VH连接的VL,通过柔性接头(例如,通过CD8α铰链结构域和CD8α跨膜结构域)连接至CD3ζ或FcRγ跨膜结构域和细胞内信号传导结构域(scFv-CD3ζ或scFv-FcRγ;参见美国专利号7,741,465;美国专利号5,912,172;美国专利号5,906,936)。第二代CAR在胞内结构域(例如scFv-CD28/OX40/4-1BB-CD3ζ;参见美国专利号8,911,993;8,916,381;8,975,071;9,101,584;9,102,760;9,102,761)内掺入了一种或多种共刺激分子,诸如CD28、OX40(CD134)或4-1BB(CD137)的胞内结构域。第三代CAR包括共刺激胞内结构域的组合,诸如CD3ζ链、CD97、GDI la-CD18、CD2、ICOS、CD27、CD154、CDS、OX40、4-1BB、CD2、CD7、LIGHT、LFA-1、NKG2C、B7-H3、CD30、CD40、PD-1或CD28信号传导结构域(例如scFv-CD28-4-1BB-CD3ζ或scFv-CD28-OX40-CD3ζ;参见美国专利号8,906,682;美国专利号8,399,645;美国专利号5,686,281;PCT公开号WO 2014/134165;PCT公开号WO 2012/079000)。在一个实施方案中,初级信号传导结构域包含选自由以下组成的组的蛋白质的功能信号传导结构域:CD3ζ、CD3γ、CD3δ、CD3ε、共同FcRγ(FCERIG)、FcRβ(FcεR1b)、CD79a、CD79b、FcγRIIa、DAP10和DAP12。在某些优选的实施方案中,初级信号传导结构域包含CD3ζ或FcRγ的功能信号传导结构域。在一个实施方案中,一个或多个共刺激信号传导结构域包含各自独立地选自由以下组成的组的蛋白质的功能信号传导结构域:CD27、CD28、4-1BB(CD137)、OX40、CD30、CD40、PD-1、ICOS、淋巴细胞功能相关抗原-1(LFA-1)、CD2、CD7、LIGHT、NKG2C、B7-H3、与CD83特异性结合的配体、CDS、ICAM-1、GITR、BAFFR、HVEM(LIGHTR)、SLAMF7、NKp80(KLRF1)、CD160、CD19、CD4、CD8α、CD8β、IL2Rβ、IL2Rγ、IL7Rα、ITGA4、VLA1、CD49a、ITGA4、IA4、CD49D、ITGA6、VLA-6、CD49f、ITGAD、CD11d、ITGAE、CD103、ITGAL、CD11a、LFA-1、ITGAM、CD11b、ITGAX、CD11c、ITGB1、CD29、ITGB2、CD18、ITGB7、TNFR2、TRANCE/RANKL、DNAM1(CD226)、SLAMF4(CD244、2B4)、CD84、CD96(Tactile)、CEACAM1、CRTAM、Ly9(CD229)、CD160(BY55)、PSGL1、CD100(SEMA4D)、CD69、SLAMF6(NTB-A、Lyl08)、SLAM(SLAMF1、CD150、IPO-3)、BLAME(SLAMF8)、SELPLG(CD162)、LTBR、LAT、GADS、SLP-76、PAG/Cbp、NKp44、NKp30、NKp46和NKG2D。在一个实施方案中,一个或多个共刺激信号传导结构域包含各自独立地选自由以下组成的组的蛋白质的功能信号传导结构域:4-1BB、CD27和CD28。在一个实施方案中,嵌合抗原受体可具有如美国专利号7,446,190中所述的设计,其包含CD3ζ链的细胞内结构域(诸如人CD3ζ链的氨基酸残基52-163,如US 7,446,190的SEQ ID NO:14所示)、来自CD28的信号传导区域和抗原结合元件(或部分或结构域;诸如scFv)。当在ζ链部分与抗原结合元件之间时,CD28部分可合适地包括CD28的跨膜结构域和信号传导结构域(诸如SEQ ID NO:10的氨基酸残基114-220,US 7,446,190的SEQ ID NO:6中示出的全序列;这些可以包括Genbank标识符NM_006139中列出的CD28的以下部分。或者,当ζ序列位于CD28序列与抗原结合元件之间时,可以单独使用CD28的细胞内结构域(诸如US 7,446,190的SEQ ID NO:9中列出的氨基酸序列)。因此,某些实施方案采用包含以下的CAR:(a)包含人CD3ζ链的细胞内结构域的ζ链部分、(b)共刺激信号传导区域和(c)抗原结合元件(或部分或结构域),其中共刺激信号传导区域包含由US 7,446,190的SEQ ID NO:6编码的氨基酸序列。
或者,可以通过在抗原特异性T细胞中表达CAR来协调共刺激,所述T细胞被选择以便在其天然αβTCR的结合后活化并扩增,例如通过专业抗原呈递细胞上的抗原,并伴随共刺激。此外,可以在免疫反应细胞上提供额外的工程化受体,例如以改善T细胞攻击的靶向性和/或最大程度地减少副作用。
通过实例而非限制,Kochenderfer等人,(2009)J Immunother.32(7):689-702描述了抗CD19嵌合抗原受体(CAR)。FMC63-28Z CAR含有识别衍生自FMC63小鼠杂交瘤的CD19的单链可变区部分(scFv)(描述于Nicholson等人,(1997)Molecular Immunology 34:1157–1165)、人CD28分子的一部分、以及人TCR-ζ分子的细胞内组分。FMC63-CD828BBZ CAR包含FMC63 scFv、CD8分子的铰链和跨膜区域、CD28和4-1BB的细胞质部分以及TCR-ζ分子的细胞质组分。FMC63-28Z CAR中包括的CD28分子的确切序列对应于Genbank标识符NM_006139;所述序列包括以氨基酸序列IEVMYPPPY(SEQ.I.D.No.64,306)开始并一直延续到蛋白质的羧基末端的所有氨基酸。为了编码载体的抗CD19 scFv组分,作者设计了一种DNA序列,其基于先前发表的CAR的一部分(Cooper等人,(2003)Blood 101:1637–1644)。此序列在框架内从5'端到3'端编码以下组分:XhoI位点、人粒细胞-巨噬细胞集落刺激因子(GM-CSF)受体α链信号序列、FMC63轻链可变区(如Nicholson等人,同上)、接头肽(如Cooper等人,同上)、FMC63重链可变区(如Nicholson等人,同上)和NotI位点。用XhoI和NotI消化编码此序列的质粒。为了形成MSGV-FMC63-28Z逆转录病毒载体,将编码FMC63 scFv的XhoI和NotI消化片段连接至编码MSGV逆转录病毒骨架的第二个XhoI和NotI消化片段(如Hughes等人,(2005)Human Gene Therapy16:457–472)以及人CD28的细胞外部分的一部分、人CD28的完整跨膜部分和细胞质部分以及人TCR-ζ分子的细胞质部分(如Maher等人,2002)NatureBiotechnology 20:70–75)。FMC63-28Z CAR包括在Kite Pharma,Inc.开发的KTE-C19(axicabtagene ciloleucel)抗CD19CAR-T治疗产品中,用于治疗尤其是患有复发/难治性侵袭性B细胞非霍奇金淋巴瘤(NHL)的患者。因此,在一个实施方案中,旨在用于过继细胞疗法的细胞,更特别地免疫反应细胞(诸如T细胞),可表达如Kochenderfer等人(同上)所述的FMC63-28Z CAR。因此,在一个实施方案中,旨在用于过继细胞疗法的细胞,更特别地免疫反应细胞(诸如T细胞),可包含CAR,所述CAR包含特异性结合抗原的细胞外抗原结合元件(或部分或结构域;诸如scFv)、包含CD3ζ链的细胞内结构域的细胞内信号传导结构域,以及包含CD28的信号传导结构域的共刺激信号传导区域。优选地,CD28氨基酸序列如Genbank标识符NM_006139(序列版本1、2或3)中所示,以氨基酸序列IEVMYPPPY(SEQ ID NO:64,306)开始并一直延续到蛋白质的羧基末端。优选地,抗原是CD19,更优选地,抗原结合元件是抗CD19scFv,甚至更优选地是如Kochenderfer等人(同上)所述的抗CD19 scFv。
国际专利公开号WO 2015/187528中进一步描述了额外的抗CD19 CAR。更特别地,通过引用并入本文的WO2015187528的实施例1和表1证明了基于全人抗CD19单克隆抗体(47G4,如US20100104509中所述)和鼠抗CD19单克隆抗体(如Nicholson等人中所述并且在上文解释)的抗CD19 CAR的产生。公开了信号序列(人CD8-α或GM-CSF受体)、细胞外区域和跨膜区域(人CD8-α)和细胞内T细胞信号传导结构域(CD28-CD3ζ;4-1BB-CD3ζ;CD27-CD3ζ;CD28-CD27-CD3ζ、4-1BB-CD27-CD3ζ;CD27-4-1BB-CD3ζ;CD28-CD27-FcωRIγ链;或CD28-FcωRIγ链)的各种组合。因此,在一个实施方案中,旨在用于过继细胞疗法的细胞,更特别地免疫反应细胞(诸如T细胞),可包含CAR,所述CAR包含特异性结合抗原的细胞外抗原结合元件、如WO2015187528的表1中所列的细胞外区域和跨膜区域、以及如国际申请号WO 2015/187528的表1中所列的细胞内T细胞信号传导结构域。优选地,抗原是CD19,更优选地,抗原结合元件是抗CD19 scFv,甚至更优选地是如WO2015/187528的实施例1中所述的小鼠或人抗CD19 scFv。在一个实施方案中,CAR包含如WO2015187528的表1中所列的以下氨基酸序列、基本上由其组成或由其组成:SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQID NO:11、SEQ ID NO:12或SEQ ID NO:13。
通过实例而非限制,识别CD70抗原的嵌合抗原受体在WO2012058460A2中描述(另见,Park等人,CD70 as a target for chimeric antigen receptor T cells in headand neck squamous cell carcinoma,Oral Oncol.2018年3月;78:145-150;和Jin等人,CD70,a novel target of CAR T-cell therapy for gliomas,Neuro Oncol.2018年1月10日;20(1):55-65)。CD70由弥漫性大B细胞淋巴瘤和滤泡性淋巴瘤表达,并且还由霍奇金淋巴瘤、华氏巨球蛋白血症(Waldenstrom's macroglobulinemia)和多发性骨髓瘤的恶性细胞表达,并且由HTLV-1和EBV相关恶性肿瘤表达。(Agathanggelou等人Am.J.Pathol.1995;147:1152-1160;Hunter等人,Blood 2004;104:4881.26;Lens等人,J Immunol.2005;174:6212-6219;Baba等人,J Virol.2008;82:3843-3852)。此外,CD706由非血液恶性肿瘤(诸如肾细胞癌和胶质母细胞瘤)表达。(Junker等人,J Urol.2005;173:2150-2153;Chahlavi等人,Cancer Res 2005;65:5428-5438)从生理学角度来看,CD70表达是瞬时的,并且仅限于高度活化的T细胞、B细胞和树突状细胞的子集。
通过实例而非限制,已经描述了识别BCMA的嵌合抗原受体(参见,例如,US20160046724A1;WO2016014789A2;WO2017211900A1;WO2015158671A1;US20180085444A1;WO2018028647A1;US20170283504A1;和WO2013154760A1)。
在一个实施方案中,除了如本文所述的CAR或外源TCR之外,免疫细胞还可包含嵌合抑制性受体(抑制性CAR),其特异性结合第二靶抗原并且能够在识别第二靶抗原后向细胞诱导抑制性(inhibitory)或免疫抑制性(immunosuppressive)或抑制性(repressive)信号。在一个实施方案中,嵌合抑制性受体包含被配置为特异性结合靶抗原的细胞外抗原结合元件(或部分或结构域)、跨膜结构域和细胞内免疫抑制或抑制性信号传导结构域。在一个实施方案中,第二靶抗原是不在癌细胞或感染细胞的表面上表达或其表达在癌细胞或感染细胞上发生下调的抗原。在一个实施方案中,第二靶抗原是MHC I类分子。在一个实施方案中,细胞内信号传导结构域包含免疫检查点分子(诸如例如PD-1或CTLA4)的功能性信号传导部分。有利地,包括此类抑制性CAR降低了工程化免疫细胞攻击非靶(例如,非癌症)组织的机会。
或者,可以进一步修饰表达CAR的T细胞,以降低或消除内源TCR的表达,以便减少脱靶效应。降低或消除内源TCR可以减少脱靶效应并提高T细胞的有效性(U.S.9,181,527)。可以使用多种方法来产生稳定缺乏功能性TCR表达的T细胞。T细胞将完整T细胞受体作为复合物内化、分选并降解,其中静息T细胞的半衰期为约10小时,并且受刺激的T细胞的半衰期为3小时(von Essen,M.等人2004.J.Immunol.173:384-393)。TCR复合物的正常功能需要构成TCR复合物的蛋白质具有适当的化学计量比。TCR功能还需要两个具有ITAM基序的功能性TCRζ蛋白。TCR在与其MHC肽配体结合后的活化需要若干个TCR与同一T细胞结合,所述TCR都必须正确发出信号。因此,如果TCR复合物被不正确缔合或无法最佳地发出信号的蛋白质去稳定,则T细胞的活化将不足以开始细胞反应。
因此,在一个实施方案中,TCR表达可以使用RNA干扰(例如,核酸组分、siRNA、miRNA等)、TnpB多肽或靶向原代T细胞中编码特定TCR(例如,TCR-α和TCR-β)和/或CD3链的核酸的其他方法来消除。通过阻断这些蛋白质中的一种或多种的表达,T细胞将不再产生TCR复合物的关键组分中的一种或多种,从而将TCR复合物去稳定并且阻止功能性TCR的细胞表面表达。
在一些情况下,CAR还可包含用于控制CAR的表达和/或活化的开关机制。例如,CAR可以包含细胞外结构域、跨膜结构域和细胞内结构域,其中细胞外结构域包含靶特异性结合元件,所述靶特异性结合元件包含对靶细胞上表达的或由靶细胞表达的靶抗原以外的分子具有特异性的标记、结合结构域或标签。在此类实施方案中,CAR的特异性由第二构建体提供,所述第二构建体包含靶抗原结合结构域(例如,对靶抗原以及CAR上的标记或标签都具有特异性的scFv或双特异性抗体)和被CAR上的标记、结合结构域或标签识别或与其结合的结构域。参见,例如,WO 2013/044225、WO 2016/000304、WO 2015/057834、WO 2015/057852、WO 2016/070061、US 9,233,125、US2016/0129109。以此方式,可以向受试者施用表达CAR的T细胞,但在施用包含抗原特异性结合结构域的第二组合物之前,CAR无法结合其靶抗原。
替代的开关机制包括需要多聚化以便活化其信号传导功能的CAR(参见,例如,美国专利公开号US2015/0368342、US 2016/0175359、US2015/0368360)和/或外源信号,诸如小分子药物(US2016/0166613,Yung等人,Science,2015),以便引发T细胞反应。一些CAR还可以包含“自杀开关”,以在治疗后诱导CAR T细胞死亡(Buddee等人,PLoS One,2013)或在与靶抗原结合后下调CAR的表达(国际专利公开号WO 2016/011210)。
可以使用替代技术来转化靶免疫反应细胞,诸如原生质体融合、脂质转染、转染或电穿孔。可以使用多种载体,诸如逆转录病毒载体、慢病毒载体、腺病毒载体、腺相关病毒载体、质粒或转座子,诸如睡美人转座子(参见美国专利号6,489,458;7,148,203;7,160,682;7,985,739;8,227,432)可用于引入CAR,例如使用通过CD3ζ和CD28或CD137进行信号传导的第二代抗原特异性CAR。病毒载体可例如包括基于HIV、SV40、EBV、HSV或BPV的载体。
针对转化靶向的细胞可以例如包括T细胞、自然杀伤(NK)细胞、细胞毒性T淋巴细胞(CTL)、调控性T细胞、人胚胎干细胞、肿瘤浸润淋巴细胞(TIL)或可由其分化出淋巴细胞的多能干细胞。表达期望CAR的T细胞可以例如通过与γ-辐照的活化和增殖细胞(AaPC)共培养来选择,所述AaPC共表达癌抗原和共刺激分子。工程化CAR T细胞可以例如通过在可溶性因子(诸如IL-2和IL-21)的存在下在AaPC上共培养来扩增。例如,可以进行这种扩增以提供记忆CAR+T细胞(其可以例如通过非酶数字阵列和/或多面板流式细胞术进行测定)。以此方式,可以提供对携带抗原的肿瘤具有特异性细胞毒性活性的CAR T细胞(任选地与期望的趋化因子诸如干扰素-γ的产生结合)。这种CAR T细胞可以例如用于动物模型中,例如以治疗肿瘤异种移植物。
在一个实施方案中,ACT包括共转移的CD4+Th1细胞和CD8+CTL以诱导协同抗肿瘤反应(参见,例如,Li等人,Adoptive cell therapy with CD4+T helper 1cells and CD8+cytotoxic T cells enhances complete rejection of an established tumor,leadingto generation of endogenous memory responses to non-targeted tumorepitopes.Clin Transl Immunology.2017年10月;6(10):e160)。
在一个实施方案中,将Th17细胞转移至有需要的受试者。据报道,Th17细胞比Th1细胞更大程度地直接根除小鼠黑色素瘤肿瘤(Muranski P等人,Tumor-specific Th17-polarized cells eradicate large established melanoma.Blood.2008年7月15日;112(2):362-73;和Martin-Orozco N等人,T helper 17cells promote cytotoxic T cellactivation in tumor immunity.Immunity.2009年11月20日;31(5):787-98)。那些研究涉及过继T细胞转移(ACT)治疗方法,其利用表达TCR识别酪氨酸酶肿瘤抗原的CD4+T细胞。利用TCR导致Th17群快速离体扩增到大量以回输到携带自体肿瘤的宿主中。
在一个实施方案中,ACT可包括基于自体iPSC的疫苗,诸如自体抗肿瘤疫苗中经辐照的iPSC(参见,例如,Kooreman,Nigel G.等人,Autologous iPSC-Based VaccinesElicit Anti-tumor Responses In Vivo,Cell Stem Cell 22,1–13,2018,doi.org/10.1016/j.stem.2018.01.016)。
与受MHC限制的T细胞受体(TCR)不同,CAR可以结合任何细胞表面表达的抗原,因此可以更普遍地用于治疗患者(参见Irving等人,Engineering Chimeric AntigenReceptor T-Cells for Racing in Solid Tumors:Don’t Forget the Fuel,Front.Immunol.,2017年4月3日,doi.org/10.3389/fimmu.2017.00267)。在一个实施方案中,在不存在内源性T细胞浸润(例如,由于异常的抗原加工和呈递)的情况下(这排除了TIL疗法和免疫检查点阻断的使用),CAR T细胞的转移可用于治疗患者(参见,例如,HinrichsCS,Rosenberg SA.Exploiting the curative potential of adoptive T-cell therapyfor cancer.Immunol Rev(2014)257(1):56–71.doi:10.1111/imr.12132)。
诸如前述的方法可以适合于提供治疗和/或增加患有疾病(诸如瘤形成)的受试者的存活的方法,例如通过施用有效量的免疫反应细胞,所述免疫反应细胞包含结合选定抗原的抗原识别受体,其中所述结合活化免疫反应细胞,从而治疗或预防疾病(诸如瘤形成、病原体感染、自身免疫性病症或同种异体移植反应)。
在一个实施方案中,可以在化学疗法(通常是环磷酰胺和氟达拉滨(fludarabine)的组合)或放射疗法形式的淋巴细胞清除预处理之后施用治疗。ACT的初步研究具有短暂的反应,并且转移的细胞在体内无法持续很长时间(Houot等人,T-cell-basedimmunotherapy:adoptive cell transfer and checkpoint inhibition.Cancer ImmunolRes(2015)3(10):1115–22;和Kamta等人,Advancing Cancer Therapy with Present andEmerging Immuno-Oncology Approaches.Front.Oncol.(2017)7:64)。免疫抑制细胞(如Treg和MDSC)可能通过与转移的细胞竞争必要的细胞因子来减弱转移的细胞的活性。不受理论的束缚,淋巴细胞清除预处理可消除抑制细胞,从而允许TIL持续存在。
在一个实施方案中,可以对正在接受免疫抑制治疗(例如,糖皮质激素治疗)的患者施用治疗。由于编码免疫抑制剂的受体的基因失活,可以使细胞或细胞群对至少一种此种免疫抑制剂具有抗性。在一个实施方案中,免疫抑制治疗提供了患者体内的免疫反应性T细胞的选择和扩增。
在一个实施方案中,治疗可以在初次治疗(例如,手术或放射治疗)之前施用以在初次治疗前缩小肿瘤。在另一个实施方案中,治疗可以在初次治疗之后施用以去除任何剩余的癌细胞。
在一个实施方案中,可以在ACT之前和/或期间治疗性地靶向免疫代谢屏障,以增强对ACT或CAR T细胞疗法的反应并且支持内源免疫(参见,例如,Irving等人,EngineeringChimeric Antigen Receptor T-Cells for Racing in Solid Tumors:Don’t Forget theFuel,Front.Immunol.,2017年4月3日,doi.org/10.3389/fimmu.2017.00267)。
如本文所公开的细胞或细胞群(诸如免疫系统细胞或细胞群,诸如更特别地免疫反应细胞或细胞群)的施用可以以任何方便的方式进行,包括通过气雾吸入、注射、摄取、输血、植入或移植。细胞或细胞群可以皮下、皮内、瘤内、结节内、髓内、肌内、鞘内、通过静脉或淋巴内注射或腹膜内施用于患者。在一个实施方案中,可以将所公开的CAR递送或施用到通过切除肿瘤组织形成的腔中(即,腔内递送)或在切除之前直接递送到肿瘤中(即,瘤内递送)。在一个实施方案中,本发明的细胞组合物优选通过静脉注射施用。
细胞或细胞群的施用可以由104-109个细胞/kg体重(优选105至106个细胞/kg体重)的施用组成,包括那些范围内的细胞数的所有整数值。在具有或不具有例如使用环磷酰胺的淋巴细胞清除过程的情况下,CAR T细胞疗法中的给药可以例如涉及施用106至109个细胞/kg。可以一剂或多剂施用细胞或细胞群。在另一个实施方案中,有效量的细胞作为单剂量施用。在另一个实施方案中,有效量的细胞在一段时间内作为多于一个剂量施用。施用时间在主治医师的判断范围内,并取决于患者的临床状况。细胞或细胞群可从任何来源获得,诸如血库或供体。尽管个体需求不同,但确定针对特定疾病或病状的给定细胞类型的有效量的最佳范围在本领域技术人员的技能范围内。有效量意指提供治疗性或预防性益处的量。施用剂量将取决于接受者的年龄、健康状况和体重、同时治疗的种类(如果有的话)、治疗频率和期望效果的性质。
在另一个实施方案中,有效量的细胞或包含那些细胞的组合物经胃肠外施用。施用可以是静脉内施用。可通过在肿瘤内注射直接进行施用。
为了防止可能的不良反应,经工程化免疫反应细胞可以配备有转基因安全开关,其形式为使细胞容易暴露于特定信号的转基因。例如,单纯疱疹病毒胸苷激酶(TK)基因可以以这种方式使用,例如通过引入到在干细胞移植后用作供体淋巴细胞输注的同种异体T淋巴细胞中(Greco等人,Improving the safety of cell therapy with the TK-suicidegene.Front.Pharmacol.2015;6:95)。在此类细胞中,施用核苷前药(诸如更昔洛韦(ganciclovir)或阿昔洛韦(acyclovir))会导致细胞死亡。替代的安全开关构建体包括诱导型半胱天冬酶9,例如通过施用小分子二聚体来触发,所述二聚体将两个非功能性icasp9分子结合在一起以形成活性酶。已经描述了多种实施细胞增殖控制的替代方法(参见美国专利公开号20130071414;国际专利公开WO 2011/146862;国际专利公开WO 2014/011987;国际专利公开WO 2013/040371;Zhou等人BLOOD,2014,123/25:3895–3905;Di Stasi等人,The New England Journal of Medicine 2011;365:1673-1683;Sadelain M,The NewEngland Journal of Medicine 2011;365:1735-173;Ramos等人,Stem Cells 28(6):1107-15(2010))。
在过继疗法的进一步细化中,基因组编辑可用于调整免疫反应细胞以适应替代实施,例如提供编辑的CAR T细胞(参见Poirot等人,2015,Multiplex genome edited T-cellmanufacturing platform for"off-the-shelf"adoptive T-cell immunotherapies,Cancer Res 75(18):3853;Ren等人,2017,Multiplex genome editing to generateuniversal CAR T cells resistant to PD1 inhibition,Clin Cancer Res.2017年5月1日;23(9):2255-2266.doi:10.1158/1078-0432.CCR-16-1300.Epub 2016年11月4日;Qasim等人,2017,Molecular remission of infant B-ALL after infusion of universalTALEN gene-edited CAR T cells,Sci Transl Med.2017年1月25日;9(374);Legut等人,2018,CRISPR-mediated TCR replacement generates superior anticancer transgenicT cells.Blood,131(3),311-322;和Georgiadis等人,Long Terminal Repeat CRISPR-CAR-Coupled“Universal”T Cells Mediate Potent Anti-leukemic Effects,MolecularTherapy,In Press,Corrected Proof,可在线访问,2018年3月6日)。可以使用本文所述的任何CRISPR系统及其使用方法来编辑细胞。可以通过本文所述的任何方法将组合物和系统递送至免疫细胞。在优选的实施方案中,对细胞进行离体编辑并转移至有需要的受试者。可以编辑免疫反应细胞、CAR T细胞或任何用于过继细胞转移的细胞。可以执行编辑以例如在细胞中预选的基因座(例如,TRAC基因座)插入或敲入外源基因,诸如编码CAR或TCR的外源基因;消除潜在的同种反应性T细胞受体(TCR)或防止内源与外源TCR链之间的不适当配对,诸如敲除或敲低细胞中内源性TCR的表达;破坏细胞内化疗剂的靶标;阻断免疫检查点,诸如敲除或敲低细胞中免疫检查点蛋白或受体的表达;敲除或敲低细胞中一个或多个其他基因的表达,所述基因的表达减少或表达缺乏可以增强使用所述细胞的过继疗法的功效;敲除或敲低细胞中内源基因的表达,所述内源基因编码被外源CAR或TCR靶向的抗原;敲除或敲低细胞中一种或多种MHC组成蛋白的表达;活化T细胞;调节细胞,使得细胞对耗竭或功能障碍具有抗性;和/或增加功能耗竭或功能障碍的CD8+T细胞的分化和/或增殖(参见国际专利公开号WO 2013/176915、WO 2014/059173、WO 2014/172606、WO 2014/184744和WO 2014/191128)。
在一个实施方案中,编辑可以导致基因失活。通过使基因失活,旨在使感兴趣的基因不以功能性蛋白形式表达。在特定的实施方案中,系统特异性地催化一个靶向基因的切割,从而使所述靶向基因失活。引起的核酸链断裂通常通过同源重组或非同源末端接合(NHEJ)的不同机制进行修复。然而,NHEJ是一种不完美的修复过程,其通常导致切割位点处的DNA序列发生变化。经由非同源末端接合(NHEJ)的修复通常导致小的插入或缺失(插入缺失),并且可以用于创建特定的基因敲除。可以通过本领域众所周知的方法来鉴定和/或选择其中已发生切割诱导的诱变事件的细胞。在一个实施方案中,同源定向修复(HDR)用于同时使基因(例如TRAC)失活并且将内源TCR或CAR插入失活的基因座中。
因此,在一个实施方案中,可以对细胞(特别地旨在用于过继细胞疗法的细胞,更特别地免疫反应细胞,诸如T细胞)执行编辑以在细胞中的预选基因座处插入或敲入外源基因,诸如编码CAR或TCR的外源基因。传统上,使用随机整合载体将编码CAR或TCR的核酸分子转染或转导至细胞,这根据整合位点可能导致克隆扩增、致癌转化、多样化转基因表达和/或转基因转录沉默。将转基因引导至细胞中的特定基因座可以最大程度地减少或避免此类风险,并且有利地提供细胞对转基因的均匀表达。非限制地,用于定向转基因整合的合适的“安全港”基因座包括CCR5或AAVS1。同源定向修复(HDR)策略是已知的并且在本说明书的别处描述,其允许将转基因插入到期望的基因座(例如,TRAC基因座)中。
用于插入转基因(特别是CAR或外源TCR转基因)的其他合适的基因座包括但不限于包含编码内源T细胞受体成分的基因的基因座,诸如T细胞受体α基因座(TRA)或T细胞受体β基因座(TRB),例如T细胞受体α恒定(TRAC)基因座、T细胞受体β恒定1(TRBC1)基因座或T细胞受体β恒定2(TRBC1)基因座。有利地,将转基因插入到此类基因座中可以同时实现转基因的表达(可能受内源启动子控制)和内源TCR的敲除表达。此方法已经在Eyquem等人,(2017)Nature 543:113-117中举例说明,其中作者使用CRISPR/Cas9基因编辑将编码CD19特异性CAR的DNA分子敲入内源启动子下游的TRAC基因座中;通过CRISPR获得的CAR-T细胞在减少CAR信号传导和耗竭方面显著更优异。
T细胞受体(TCR)是细胞表面受体,其响应于抗原呈递而参与T细胞活化。TCR通常由两条链α和β组成,它们组装形成异二聚体,并且与CD3转导亚基缔合形成存在于细胞表面上的T细胞受体复合物。TCR的每条α链和β链由免疫球蛋白样N末端可变(V)和恒定(C)区、疏水性跨膜结构域和短胞质区组成。对于免疫球蛋白分子,α链和β链的可变区是通过V(D)J重组产生的,从而在T细胞群内产生多种抗原特异性。然而,与识别完整抗原的免疫球蛋白不同,T细胞被与MHC分子缔合的加工肽片段活化,从而为T细胞的抗原识别引入了额外的维度,称为MHC限制。通过T细胞受体识别供体与受体之间的MHC差异导致T细胞增殖和移植物抗宿主病(GVHD)的潜在发展。TCRα或TCRβ的失活可以导致TCR从T细胞表面消除,从而阻止同种异体抗原的识别,从而阻止GVHD。然而,TCR破坏通常导致CD3信号传导组分的消除,并且改变T细胞进一步扩增的方式。
因此,在一个实施方案中,可以对细胞(特别地旨在用于过继细胞疗法的细胞,更特别地免疫反应细胞,诸如T细胞)执行编辑以敲除或敲低细胞中内源TCR的表达。例如,基于NHEJ或基于HDR的基因编辑方法可以用于破坏内源TCRα和/或β链基因。例如,一个或多个基因编辑系统,诸如一个或多个TnpB系统,可以被设计为靶向存在于TCRβ链内的在β1与β2恒定区基因(TRBC1与TRBC2)之间保守的序列和/或靶向TCRα链(TRAC)基因的恒定区。
同种异体细胞被宿主免疫系统迅速排斥。已经证明,未经辐照的血液制品中存在的同种异体白细胞将持续不超过5至6天(Boni,Muranski等人2008Blood 1;112(12):4746-54)。因此,为了防止同种异体细胞的排斥,宿主的免疫系统通常必须在一定程度上受到抑制。然而,在过继细胞转移的情况下,免疫抑制药物的使用也对引入的治疗性T细胞具有不利影响。因此,为了在这些情况下有效地使用过继免疫治疗方法,引入的细胞将需要对免疫抑制治疗具有抗性。因此,在特定的实施方案中,本发明还包括修饰T细胞以使它们对免疫抑制剂具有抗性的步骤,优选通过使编码免疫抑制剂靶标的至少一种基因失活。免疫抑制剂是通过若干种作用机制之一抑制免疫功能的剂。免疫抑制剂可以是但不限于钙调神经磷酸酶抑制剂、雷帕霉素靶标、白介素2受体α链阻断剂、肌苷一磷酸脱氢酶抑制剂、二氢叶酸还原酶抑制剂、皮质类固醇或免疫抑制抗代谢物。本发明允许通过使T细胞中的免疫抑制剂的靶标失活来赋予T细胞免疫抑制抗性以用于免疫疗法。作为非限制性实例,免疫抑制剂的靶标可以是免疫抑制剂的受体,诸如:CD52、糖皮质激素受体(GR)、FKBP家族基因成员和亲环蛋白家族基因成员。
在一个实施方案中,可以对细胞(特别地旨在用于过继细胞疗法的细胞,更特别地免疫反应细胞,诸如T细胞)执行编辑以阻断免疫检查点,诸如敲除或敲低细胞中的免疫检查点蛋白或受体的表达。免疫检查点是减缓或停止免疫反应并防止免疫细胞不受控制的活性造成过度组织损伤的抑制途径。在一个实施方案中,靶向的免疫检查点是程序性死亡-1(PD-1或CD279)基因(PDCD1)。在其他实施方案中,靶向的免疫检查点是细胞毒性T淋巴细胞相关抗原(CTLA-4)。在另外的实施方案中,靶向的免疫检查点是CD28和CTLA4 Ig超家族的另一成员,诸如BTLA、LAG3、ICOS、PDL1或KIR。在又另外的实施方案中,靶向的免疫检查点是TNFR超家族的成员,诸如CD40、OX40、CD137、GITR、CD27或TIM-3。
另外的免疫检查点包括含Src同源2结构域的蛋白酪氨酸磷酸酶1(SHP-1)(WatsonHA等人,SHP-1:the next checkpoint target for cancer immunotherapy?Biochem SocTrans.2016年4月15日;44(2):356-62)。SHP-1是一种广泛表达的抑制性蛋白酪氨酸磷酸酶(PTP)。在T细胞中,所述PTP是抗原依赖性活化和增殖的负调控剂。所述PTP是一种胞质蛋白,并且因此不适合抗体介导的疗法,但它在活化和增殖中的作用使其成为过继转移策略(诸如嵌合抗原受体(CAR)T细胞)中遗传操纵的有吸引力的靶标。免疫检查点还可包括具有Ig和ITIM结构域的T细胞免疫受体(TIGIT/Vstm3/WUCAM/VSIG9)和VISTA(Le Mercier I等人,(2015)Beyond CTLA-4and PD-1,the generation Z of negative checkpointregulators.Front.Immunol.6:418)。
国际专利公开号WO 2014/172606涉及使用MT1和/或MT2抑制剂以增加耗竭的CD8+T细胞的增殖和/或活性并且减少CD8+T细胞耗竭(例如,减少功能耗竭或无反应的CD8+免疫细胞)。在一个实施方案中,通过过继转移T细胞中的基因编辑来靶向金属硫蛋白。
在一个实施方案中,基因编辑的靶标可以是至少一个参与免疫检查点蛋白表达的靶向基因座。此类靶标可包括但不限于CTLA4、PPP2CA、PPP2CB、PTPN6、PTPN22、PDCD1、ICOS(CD278)、PDL1、KIR、LAG3、HAVCR2、BTLA、CD160、TIGIT、CD96、CRTAM、LAIR1、SIGLEC7、SIGLEC9、CD244(2B4)、TNFRSF10B、TNFRSF10A、CASP8、CASP10、CASP3、CASP6、CASP7、FADD、FAS、TGFBRII、TGFRBRI、SMAD2、SMAD3、SMAD4、SMAD10、SKI、SKIL、TGIF1、IL10RA、IL10RB、HMOX2、IL6R、IL6ST、EIF2AK4、CSK、PAG1、SIT1、FOXP3、PRDM1、BATF、VISTA、GUCY1A2、GUCY1A3、GUCY1B2、GUCY1B3、MT1、MT2、CD40、OX40、CD137、GITR、CD27、SHP-1、TIM-3、CEACAM-1、CEACAM-3或CEACAM-5。在优选的实施方案中,靶向参与PD-1或CTLA-4基因表达的基因座。在其他优选的实施方案中,靶向基因组合,诸如但不限于PD-1和TIGIT。
通过实例而非限制,国际专利公开号WO 2016/196388涉及一种经工程化T细胞,其包含(a)特异性结合抗原的遗传工程化抗原受体,所述受体可以是CAR;和(b)编码PD-L1的被破坏的基因、用于破坏编码PD-L1的基因的剂和/或编码PD-L1的基因的破坏,其中所述基因的破坏可以由基因编辑核酸酶、锌指核酸酶(ZFN)、CRISPR/Cas9和/或TALEN介导。WO2015142675涉及免疫效应细胞,所述免疫效应细胞包含CAR与增加免疫效应细胞在癌症治疗中的功效的剂(诸如本文的组合物或系统)的组合,其中所述剂可以抑制免疫抑制分子,诸如PD1、PD-L1、CTLA-4、TIM-3、LAG-3、VISTA、BTLA、TIGIT、LAIR1、CD160、2B4、TGFRβ、CEACAM-1、CEACAM-3或CEACAM-5。Ren等人,(2017)Clin Cancer Res 23(9)2255-2266同时执行CAR的慢病毒递送和靶向内源TCR、β-2微球蛋白(B2M)和PD1的Cas9 mRNA和gRNA的电转移,以产生缺乏TCR、HLA I类分子和PD1的基因破坏的同种异体CAR T细胞。
在一个实施方案中,细胞可以经工程化以表达CAR,其中已经降低或消除了细胞中的甲基胞嘧啶双加氧酶基因(TET1、TET2和/或TET3)的表达和/或功能(诸如本文的组合物或系统)(例如,如WO201704916中所述)。
在一个实施方案中,可以对细胞(特别地旨在用于过继细胞疗法的细胞,更特别地免疫反应细胞,诸如T细胞)执行编辑以敲除或敲低细胞中内源基因的表达,所述内源基因编码外源CAR或TCR靶向的抗原,从而降低靶向工程化细胞的可能性。在一个实施方案中,靶向抗原可以是选自由以下组成的组的一种或多种抗原:CD38、CD138、CS-1、CD33、CD26、CD30、CD53、CD92、CD100、CD148、CD150、CD200、CD261、CD262、CD362、人端粒酶逆转录酶(hTERT)、生存素、小鼠双分钟2同源物(MDM2)、细胞色素P450 1B1(CYP1B)、HER2/neu、维尔姆斯氏瘤基因1(WT1)、livin、甲胎蛋白(AFP)、癌胚抗原(CEA)、粘蛋白16(MUC16)、MUC1、前列腺特异性膜抗原(PSMA)、p53、细胞周期蛋白(D1)、B细胞成熟抗原(BCMA)、跨膜活化子和CAML相互作用子(TACI)以及B细胞活化因子受体(BAFF-R)(例如,如国际专利公开号WO2016/011210和WO 2017/011804所述)。
在一个实施方案中,可以对细胞(特别地旨在用于过继细胞疗法的细胞,更特别地免疫反应细胞,诸如T细胞)执行编辑以敲除或敲低细胞中一种或多种MHC组成蛋白(诸如一种或多种HLA蛋白和/或β-2微球蛋白(B2M))的表达,从而可以降低或避免受体免疫系统对非自体(例如,同种异体)细胞的排斥。在优选的实施方案中,可以敲除或敲低一种或多种HLA I类蛋白,诸如HLA-A、B和/或C和/或B2M。优选地,可以敲除或敲低B2M。例如,Ren等人,(2017)Clin Cancer Res 23(9)2255-2266同时执行CAR的慢病毒递送和靶向内源TCR、β-2微球蛋白(B2M)和PD1的Cas mRNA和gRNA的电转移,以产生缺乏TCR、HLA I类分子和PD1的基因破坏的同种异体CAR T细胞。
在其他实施方案中,编辑至少两个基因。基因对可包括但不限于PD1和TCRα、PD1和TCRβ、CTLA-4和TCRα、CTLA-4和TCRβ、LAG3和TCRα、LAG3和TCRβ、Tim3和TCRα、Tim3和TCRβ、BTLA和TCRα、BTLA和TCRβ、BY55和TCRα、BY55和TCRβ、TIGIT和TCRα、TIGIT和TCRβ、B7H5和TCRα、B7H5和TCRβ、LAIR1和TCRα、LAIR1和TCRβ、SIGLEC10和TCRα、SIGLEC10和TCRβ、2B4和TCRα、2B4和TCRβ、B2M和TCRα、B2M和TCRβ。
在一个实施方案中,可以如本文教导的那样对细胞进行多重编辑(多重基因组编辑)以(1)敲除或敲低内源TCR(例如,TRBC1、TRBC2和/或TRAC)的表达,(2)敲除或敲低免疫检查点蛋白或受体(例如,PD1、PD-L1和/或CTLA4)的表达;以及(3)敲除或敲低一种或多种MHC组成蛋白(例如,HLA-A、B和/或C和/或B2M,优选B2M)的表达。
无论是在T细胞的遗传修饰之前或之后,通常可以使用例如在以下专利中描述的方法来活化和扩增T细胞:美国专利号6,352,694;6,534,055;6,905,680;5,858,358;6,887,466;6,905,681;7,144,575;7,232,566;7,175,843;5,883,223;6,905,874;6,797,514;6,867,041;和7,572,631。T细胞可以在体外或体内扩增。
可以使用本领域已知的任何方法获得免疫细胞。在一个实施方案中,可以从健康受试者获得同种异体T细胞。在一个实施方案中,分离已经浸润肿瘤的T细胞。可以在手术期间去除T细胞。可以在通过活组织检查去除肿瘤组织后分离T细胞。T细胞可以通过本领域已知的任何方式来分离。在一个实施方案中,T细胞通过单采术获得。在一个实施方案中,方法可以包括通过本领域已知的任何合适的方法从肿瘤样品获得大的T细胞群。例如,可以通过将肿瘤样品解离到可以从中选择特定细胞群的细胞悬浮液中来从肿瘤样品中获得大的T细胞群。获得大的T细胞群的合适方法可包括但不限于机械解离(例如,切碎)肿瘤、酶促解离(例如,消化)肿瘤和抽吸(例如,用针)中的任何一种或多种。
从肿瘤样品获得的大的T细胞群可以包含任何合适类型的T细胞。优选地,从肿瘤样品获得的大的T细胞群包含肿瘤浸润淋巴细胞(TIL)。
肿瘤样品可以从任何哺乳动物获得。除非另有说明,否则如本文所用,术语“哺乳动物”是指任何哺乳动物,包括但不限于以下哺乳动物:兔形目(Logomorpha),诸如兔;食肉目(Carnivora),包括猫科动物(猫)和犬科动物(狗);偶蹄目(Artiodactyla),包括牛科动物(奶牛)和猪科动物(猪);或奇蹄目(Perssodactyla),包括马科动物(马)。哺乳动物可以是非人灵长类动物,例如灵长目动物(Primate)、四足猴目(eboid)或猿猴目动物(Simoid)(猴)或类人猿目动物(Anthropoid)(人类和猿)。在一个实施方案中,哺乳动物可以是啮齿目(Rodentia)哺乳动物,诸如小鼠和仓鼠。优选地,哺乳动物是非人灵长类动物或人类。特别优选的哺乳动物是人类。
T细胞可从多种来源获得,包括外周血单核细胞(PBMC)、骨髓、淋巴结组织、脾组织和肿瘤。在本发明的一个实施方案中,可以使用本领域技术人员已知的多种技术(诸如Ficoll分离)从采集自受试者的单位血中获得T细胞。在一个优选的实施方案中,来自个体的循环血液的细胞通过单采术或白细胞分离术获得。单采术产物通常含有淋巴细胞,包括T细胞、单核细胞、粒细胞、B细胞、其他有核白细胞、红细胞和血小板。在一个实施方案中,可以将通过单采术收集的细胞洗涤以去除血浆级分并且将细胞置于适当的缓冲液或培养基中用于后续处理步骤。在本发明的一个实施方案中,用磷酸盐缓冲盐水(PBS)洗涤细胞。在替代实施方案中,洗涤溶液缺乏钙并且可以缺乏镁或者可以缺乏许多(如果不是全部的话)二价阳离子。不存在钙的情况下的初始活化步骤会导致活化放大。本领域普通技术人员将容易理解,可以通过本领域技术人员已知的方法完成洗涤步骤,诸如通过根据制造商的说明使用半自动“流通型(flow-through)”离心机(例如,Cobe 2991细胞处理器)。洗涤后,可以将细胞重悬在多种生物相容性缓冲液中,诸如,例如,不含Ca、不含Mg的PBS。或者,可以去除单采术样品中不期望的组分,并将细胞直接重悬在培养基中。
在另一个实施方案中,通过裂解红细胞并且消耗单核细胞,例如通过PERCOLLTM梯度离心,从外周血淋巴细胞中分离T细胞。可以通过正选择或负选择技术进一步分离特定的T细胞亚群,诸如CD28+、CD4+、CDC、CD45RA+和CD45RO+T细胞。例如,在一个优选的实施方案中,通过与抗CD3/抗CD28(即,3×28)缀合的珠子(诸如M-450 CD3/CD28T或XCYTE DYNABEADSTM)一起孵育足以正选择期望T细胞的时间段来分离T细胞。在一个实施方案中,时间段为约30分钟。在另一个实施方案中,时间段的范围为30分钟至36小时或更长时间以及其间的所有整数值。在另一个实施方案中,时间段是至少1、2、3、4、5或6小时。在又另一个优选的实施方案中,时间段是10至24小时。在一个优选的实施方案中,孵育时间段是24小时。对于从白血病患者中分离T细胞,使用较长的孵育时间(诸如24小时)可以增加细胞产量。在与其他细胞类型相比,T细胞较少的任何情况下,可以使用更长的孵育时间来分离T细胞,诸如从肿瘤组织或免疫失能的个体中分离肿瘤浸润淋巴细胞(TIL)。此外,使用较长的孵育时间可以增加CD8+ T细胞的捕获效率。
通过负选择富集T细胞群可以通过针对负选择细胞特有的表面标志物的抗体组合来实现。优选的方法是经由负磁免疫粘附或流式细胞术进行细胞分选和/或选择,所述负磁免疫粘附或流式细胞术使用针对负选择的细胞上存在的细胞表面标志物的单克隆抗体混合物。例如,为了通过负选择富集CD4+细胞,单克隆抗体鸡尾酒通常包括CD14、CD20、CD11b、CD16、HLA-DR和CD8的抗体。
此外,可以通过多种方法从血液制品中耗尽单核细胞群(例如,CD14+细胞),包括抗CD14包被的珠子或柱,或者利用这些细胞的吞噬活性来促进去除。因此,在一个实施方案中,本发明使用大小足以被吞噬性单核细胞吞噬的顺磁颗粒。在一个实施方案中,顺磁颗粒是可商购获得的珠子,例如Life Technologies以商品名DynabeadsTM生产的那些珠子。在一个实施方案中,通过用“不相关”蛋白质(例如,血清蛋白或抗体)包被顺磁颗粒来去除其他非特异性细胞。不相关蛋白质和抗体包括不特异性靶向待分离的T细胞的那些蛋白质和抗体或其片段。在一个实施方案中,不相关的珠子包括包被有绵羊抗小鼠抗体、山羊抗小鼠抗体和人血清白蛋白的珠子。
简而言之,此种单核细胞的耗竭通过以下方式来执行:将从全血、单采外周血或肿瘤中分离的T细胞与一种或多种不相关或非抗体偶联的顺磁颗粒以允许去除单核细胞的任何量(大约20:1的珠:细胞比例)在22℃至37℃下预孵育30分钟至2小时,然后磁性去除附着或吞噬顺磁性颗粒的细胞。此种分离可以使用本领域可用的标准方法执行。例如,可以使用任何磁分离方法,包括多种可商购获得的磁分离方法(例如,磁性颗粒浓缩器(DYNAL))。可以通过本领域普通技术人员已知的多种方法来监测必要的耗竭的保证,所述方法包括在耗竭之前和之后对CD14阳性细胞进行流式细胞术分析。
为了通过正选择或负选择来分离期望的细胞群,可以改变细胞和表面(例如颗粒,诸如珠子)的浓度。在一个实施方案中,可能期望显著降低珠子和细胞混合在一起的体积(即,增加细胞浓度),以确保细胞和珠子的最大接触。例如,在一个实施方案中,使用20亿个细胞/ml的浓度。在一个实施方案中,使用10亿个细胞/ml的浓度。在另一个实施方案中,使用大于1亿个细胞/ml。在另一个实施方案中,使用1000、1500、2000、2500、3000、3500、4000、4500或5000万个细胞/ml的细胞浓度。在又另一个实施方案中,使用7500、8000、8500、9000、9500万或1亿个细胞/ml的细胞浓度。在其他实施方案中,可以使用1.25或1.5亿个细胞/ml的浓度。使用高浓度可以导致细胞产量增加、细胞活化和细胞扩增。此外,使用高细胞浓度允许更有效地捕获可能弱表达感兴趣的靶抗原的细胞,诸如CD28阴性T细胞,或来自存在许多肿瘤细胞的样品(即,白血病血液、肿瘤组织等)的细胞。此类细胞群可能具有治疗价值并且是期望获得的。例如,使用高浓度的细胞允许更有效地选择通常具有较弱CD28表达的CD8+T细胞。
在相关实施方案中,可能期望使用较低浓度的细胞。通过显著稀释T细胞和表面(例如颗粒,诸如珠子)的混合物,最大程度地减少颗粒与细胞之间的相互作用。这会选择表达与颗粒结合的大量期望抗原的细胞。例如,在稀释浓度下,CD4+T细胞表达较高水平的CD28,并且比CD8+T细胞更有效地被捕获。在一个实施方案中,所使用的细胞浓度为5×106/ml。在其他实施方案中,所使用的浓度可以为约1×105/ml至1×106/ml,以及其间的任何整数值。
也可以将T细胞冷冻。希望不受理论的束缚,冷冻和后续的解冻步骤通过去除细胞群中的粒细胞和一定程度的单核细胞来提供更均匀的产物。在去除血浆和血小板的洗涤步骤之后,可以将细胞悬浮在冷冻溶液中。虽然许多冷冻溶液和参数是本领域已知的并且可用于上下文,但一种方法涉及使用含有20% DMSO和8%人血清白蛋白的PBS或其他合适的细胞冷冻介质,然后以1℃/分钟的速率将细胞冷冻至-80℃并且储存在液氮储存罐的气相中。可以使用其他受控冷冻方法以及立即在-20℃下或在液氮中进行非受控冷冻。
用于本发明的T细胞还可以是抗原特异性T细胞。例如,可以使用肿瘤特异性T细胞。在一个实施方案中,抗原特异性T细胞可以从感兴趣的患者分离,诸如罹患癌症或感染性疾病的患者。在一个实施方案中,确定受试者的新表位并且分离对这些抗原具有特异性的T细胞。用于扩增的抗原特异性细胞还可以使用本领域已知的任意种方法在体外产生,例如,如标题为Generation and Isolation of Antigen-Specific T Cells的美国专利公开号US20040224402或美国专利号6,040,177所述。用于本发明的抗原特异性细胞还可以使用本领域已知的任意种方法在体外产生,例如,如Current Protocols in Immunology或Current Protocols in Cell Biology所述,两者均由John Wiley&Sons,Inc.,Boston,Mass发表。
在相关实施方案中,可能期望在一轮或两轮扩增之前或之后对抗原特异性细胞进行分选或以其他方式正选择(例如,经由磁性选择)。分选或正选择抗原特异性细胞可以使用肽-MHC四聚体进行(Altman等人,Science.1996年10月4日;274(5284):94-6)。在另一个实施方案中,使用适应性四聚体技术方法(Andersen等人,2012Nat Protoc.7:891-902)。四聚体由于需要利用基于先前假设的预测结合肽以及对特定HLA的限制而受到限制。肽-MHC四聚体可以使用本领域已知的技术产生,并且可以用如本文所述的任何感兴趣的MHC分子和任何感兴趣的抗原来制备。可以使用本领域已知的多种测定来鉴定上下文中使用的特定表位。例如,多肽与MHC I类结合的能力可以通过监测促进125I标记的β2-微球蛋白(β2m)掺入MHC I类/β2m/肽异源三聚体复合物的能力来间接评价。
在一个实施方案中,细胞用表位特异性试剂直接标记用于通过流式细胞术分离,然后表征表型和TCR。在一个实施方案中,通过与T细胞特异性抗体接触来分离T细胞。抗原特异性T细胞或通常本发明的任何细胞的分选可以使用多种可商购获得的细胞分选器中的任何一种进行,包括但不限于MoFlo分选器(DakoCytomation,Fort Collins,Colo.)、FACSAriaTM、FACSArrayTM、FACSVantageTM、BDTM LSR II和FACSCaliburTM(BD Biosciences,San Jose,Calif.)。
在优选的实施方案中,方法包括选择还表达CD3的细胞。方法可以包括以任何合适的方式特异性地选择细胞。优选地,使用流式细胞术进行选择。流式细胞术可以使用本领域已知的任何合适的方法进行。流式细胞术可以采用任何合适的抗体和染色剂。优选地,选择抗体使得其特异性识别并结合所选择的特定生物标志物。例如,CD3、CD8、TIM-3、LAG-3、4-1BB或PD-1的特异性选择可以分别使用抗CD3、抗CD8、抗TIM-3、抗LAG-3、抗4-lBB或抗PD-1抗体进行。一种或多种抗体可以缀合至珠子(例如,磁珠)或荧光染料。优选地,流式细胞术是荧光活化细胞分选(FACS)。可以基于对自体肿瘤的反应性来选择T细胞上表达的TCR。此外,可以使用专利公开号WO2014133567和WO2014133568中描述的方法基于标志物来选择对肿瘤具有反应性的T细胞,所述专利通过引用整体并入本文。此外,可以基于CD107a的表面表达来选择活化的T细胞。
在本发明的一个实施方案中,方法还包括扩增富集细胞群中T细胞的数量。此类方法在美国专利号8,637,307中描述并且通过引用整体并入本文。T细胞的数量可以增加至少约3倍(或4倍、5倍、6倍、7倍、8倍或9倍),更优选至少约10倍(或20倍、30倍、40倍、50倍、60倍、70倍、80倍或90倍),更优选至少约100倍,更优选至少约1,000倍,或最优选至少约100,000倍。可以使用本领域已知的任何合适的方法来扩增T细胞的数量。扩增细胞数量的示例性方法描述于专利公开号WO 2003/057171、美国专利号8,034,334和美国专利公开号2012/0244133,其各自通过引用并入本文。
在一个实施方案中,离体T细胞扩增可以通过分离T细胞并且随后刺激或活化然后进一步扩增来进行。在本发明的一个实施方案中,T细胞可以由单一剂刺激或活化。在另一个实施方案中,T细胞用两种剂刺激或活化,一种诱导初级信号,并且第二种诱导共刺激信号。可用于刺激单一信号或刺激初级信号的配体和刺激第二信号的辅助分子可以以可溶形式使用。配体可以附着至细胞表面、附着至工程化多价信号传导平台(EMSP)或固定在表面上。在优选的实施方案中,第一剂和第二剂共同固定在表面(例如珠子或细胞)上。在一个实施方案中,提供初级活化信号的分子可以是CD3配体,并且共刺激分子可以是CD28配体或4-1BB配体。
在一个实施方案中,包含CAR或外源TCR的T细胞可以如国际专利公开号WO 2015/120096中所述通过包括以下的方法来制造:富集从供体受试者获得的淋巴细胞群;用一种或多种T细胞刺激剂刺激淋巴细胞群以产生活化的T细胞群,其中使用无血清培养基在封闭系统中执行刺激;使用包含编码CAR或TCR的核酸分子的病毒载体转导活化的T细胞群,使用单循环转导以产生转导的T细胞群,其中使用无血清培养基在封闭系统中执行转导;以及将转导的T细胞群扩增预定时间以产生工程化T细胞群,其中使用无血清培养基在封闭系统中执行扩增。在一个实施方案中,包含CAR或外源TCR的T细胞可以如WO 2015/120096中所述通过包括以下的方法来制造:获得淋巴细胞群;用一种或多种刺激剂刺激淋巴细胞群以产生活化的T细胞群,其中使用无血清培养基在封闭系统中执行刺激;使用包含编码CAR或TCR的核酸分子的病毒载体转导活化的T细胞群,使用至少一个循环转导以产生转导的T细胞群,其中使用无血清培养基在封闭系统中执行转导;以及将转导的T细胞群扩增以产生工程化T细胞群,其中使用无血清培养基在封闭系统中执行扩增。用于扩增转导的T细胞群的预定时间可以是3天。从富集淋巴细胞群到产生工程化T细胞的时间可以是6天。封闭式系统可以是封闭式袋系统。还提供了一种包含可通过或通过所述方法获得的CAR或外源TCR的T细胞群,以及包含此类细胞的药物组合物。
在一个实施方案中,可以通过国际专利公开号WO 2017/070395中描述的方法来延迟或抑制体外T细胞的成熟或分化,所述方法包括将来自需要T细胞疗法的受试者的一种或多种T细胞与AKT抑制剂(诸如,例如,WO2017070395的权利要求8公开的一种AKT抑制剂或两种或更多种AKT抑制剂的组合)以及外源性白介素7(IL-7)和外源性白介素15(IL-15)中的至少一种接触,其中所得的T细胞表现出延迟的成熟或分化且/或其中相对于在不存在AKT抑制剂的情况下培养的T细胞的T细胞功能,所得的T细胞表现出改善的T细胞功能(诸如,例如,T细胞增殖增加;细胞因子产生增加;和/或溶细胞活性增加)。
在一个实施方案中,需要T细胞疗法的患者可以通过如国际专利公开号WO 2016/191756所述的方法进行调理,所述方法包括向患者施用200mg/m2/天与2000mg/m2/天之间的剂量的环磷酰胺和20mg/m2/天与900mg/m2/天之间的剂量的氟达拉滨。
疾病
遗传疾病以及具有遗传和/或表观遗传特征的疾病
组合物、系统或其组分可以用于治疗和/或预防遗传疾病以及具有遗传和/或表观遗传特征的疾病。本文举例说明的基因和条件并不详尽。在一个实施方案中,治疗和/或预防遗传疾病的方法可以包括向受试者施用组合物、系统和/或其一种或多种组分,其中所述组合物、系统和/或其一种或多种组分能够修饰受试者的一个或多个细胞中的与遗传疾病或具有遗传和/或表观遗传特征的疾病相关的一个或多个基因的一个或多个拷贝。在一个实施方案中,修饰受试者的与遗传疾病或具有遗传和/或表观遗传特征的疾病相关的一个或多个基因的一个或多个拷贝可以消除受试者的遗传疾病或其症状。在一个实施方案中,修饰受试者的与遗传疾病或具有遗传和/或表观遗传特征的疾病相关的一个或多个基因的一个或多个拷贝可以降低受试者的遗传疾病或其症状的严重程度。在一个实施方案中,组合物、系统或其组分可以修饰与一种或多种疾病相关的一个或多个基因或多核苷酸,所述疾病包括遗传疾病和/或具有遗传特征和/或表观遗传特征的疾病,包括但不限于表4A中列出的任何一种或多种。应当理解,本文列出的那些疾病和相关基因是非穷尽性和非限制性的。此外,一些基因在多种疾病的发展中发挥作用。
在一个实施方案中,组合物、系统或其组分可以用于通过修饰与一种或多种细胞功能相关的一个或多个基因(诸如表4B中的那些的任何一个或多个)来治疗或预防受试者的疾病。在一个实施方案中,疾病是遗传疾病或病症。在一些实施方案中,组合物、系统或其组分可以修饰与一种或多种遗传疾病(诸如表4B中列出的任何疾病)相关的一个或多个基因或多核苷酸。
在一个方面,本发明提供了一种对需要此种治疗的受试者的遗传疾病进行个体化或个性化治疗的方法,其包括:(a)将一种或多种突变离体引入至组织、器官或细胞系,或者在体内引入至转基因非人哺乳动物,包括向组织、器官、细胞或哺乳动物的细胞递送组合物,所述组合物包含上述实施方案中任一项的颗粒递送系统或递送系统或病毒颗粒或上述实施方案中任一项的细胞,其中特定突变或精确序列取代与遗传疾病相关或已经与遗传疾病相关;(b)在已递送载体的细胞上测试遗传疾病的治疗,所述载体具有与遗传疾病相关的特定突变或精确序列取代;以及(c)基于步骤(b)的治疗测试的结果来治疗受试者。
感染性疾病
在一个实施方案中,组合物、系统或其组分可以用于诊断、预测、治疗和/或预防由微生物(诸如细菌、病毒、真菌、寄生虫、或其组合)引起的感染性疾病。
在一个实施方案中,系统或其组分能够靶向混合群内的特定微生物。此类技术的示例性方法描述于例如Gomaa AA,Klumpe HE,Luo ML,Selle K,Barrangou R,BeiselCL.2014.Programmable removal of bacterial strains by use of genome-targetingcomposition,systems,mBio 5:e00928-13;Citorik RJ,Mimee M,Lu TK.2014.Sequence-specific antimicrobials using efficiently delivered RNA-guided nucleases.NatBiotechnol 32:1141–1145,其教导可以适合与本文所述的组合物、系统及其组分一起使用。
在一个实施方案中,组合物、系统和/或其组分能够靶向病原性和/或药物抗性微生物,诸如细菌、病毒、寄生虫和真菌。在一个实施方案中,组合物、系统和/或其组分能够靶向和修饰病原性微生物中的一个或多个多核苷酸,使得微生物毒性较低、被杀死、被抑制或者以其他方式使其不能引起疾病和/或感染和/或在宿主细胞中复制。
在一个实施方案中,可以被本文所述的组合物、系统和/或其组分靶向和/或修饰的病原菌包括但不限于以下属的病原菌:放线菌属(例如,衣氏放线菌(A.israelii))、芽孢杆菌属(Bacillus)(例如,炭疽芽孢杆菌(B.anthracis)、蜡样芽孢杆菌(B.cereus))、拟杆菌属(Bactereoides)(例如,脆弱拟杆菌(B.fragilis))、巴尔通体属(汉氏巴尔通体(B.henselae)、五日热巴尔通体(B.quintana))、博德特氏菌属(百日咳博德特氏菌(B.pertussis))、疏螺旋体属(例如,伯氏疏螺旋体(B.burgdorferi)、加里疏螺旋体(B.garinii)、阿氏疏螺旋体(B.afzelii)和回归热疏螺旋体(B.recurreentis))、布鲁氏菌属(Brucella)(例如,流产布鲁氏菌(B.abortus)、犬布鲁氏菌(B.canis)、马耳他布鲁氏菌(B.melitensis)和猪布鲁氏菌(B.suis))、弯曲菌属(例如,空肠弯曲菌(C.jejuni))、衣原体(例如,肺炎衣原体(C.pneumoniae)和沙眼衣原体(C.trachomatis))、嗜衣原体属(Chlamydophila)(例如,鹦鹉热嗜衣原体(C.psittaci))、梭菌属(Clostridium)(例如,肉毒梭菌(C.botulinum)、艰难梭菌(C.difficile)、产气荚膜梭菌(C.perfringens)、破伤风梭菌(C.tetani))、棒状杆菌属(例如,白喉棒状杆菌(C.diptheriae))、肠球菌属(Enterococcus)(例如,粪肠球菌(E.Faecalis)、屎肠球菌(E.faecium))、埃立克体属(Ehrlichia)(犬埃立克体(E.canis)和恰菲埃立克体(E.chaffensis))、埃希氏菌属(Escherichia)(例如,大肠埃希氏菌)、弗朗西斯菌属(Francisella)(例如,土拉弗朗西斯菌(F.tularensis))、嗜血杆菌属(例如,流感嗜血杆菌(H.influenzae))、螺杆菌属(Helicobacter)(幽门螺杆菌)、克雷伯氏菌属(例如,肺炎克雷伯氏菌(K.pneumoniae))、军团菌属(Legionella)(例如,嗜肺军团菌(L.pneumophila))、钩端螺旋体属(Leptospira)(例如,问号钩端螺旋体(L.interrogans)、圣地罗西钩端螺旋体(L.santarosai)、韦氏钩端螺旋体(L.weilii)、野口钩端螺旋体(L.noguchii))、李斯特菌属(例如,单核细胞增生性李斯特菌(L.monocytogeenes))、分枝杆菌属(Mycobacterium)(例如,麻风分枝杆菌(M.leprae)、结核分枝杆菌(M.tuberculosis)、溃疡分枝杆菌(M.ulcerans))、支原体属(Mycoplasma)(肺炎支原体(M.pneumoniae))、奈瑟菌属(Neisseria)(淋病奈瑟菌(N.gonorrhoeae)和脑膜炎奈瑟菌(N.menigitidis))、诺卡氏菌属(Nocardia)(例如,星形诺卡氏菌(N.asteeroides))、假单胞菌属(Pseudomonas)(铜绿假单胞菌(P.aeruginosa))、立克次体属(Rickettsia)(立氏立克次体(R.rickettsia))、沙门氏菌属(Salmonella)(伤寒沙门氏菌(S.typhi)和鼠伤寒沙门氏菌(S.typhimurium))、志贺氏菌属(Shigella)(宋内氏志贺氏菌(S.sonnei)和痢疾志贺氏菌(S.dysenteriae))、葡萄球菌属(金黄色葡萄球菌(S.aureus)、表皮葡萄球菌(S.epidermidis)和腐生葡萄球菌(S.saprophyticus))、链球菌属(Streptococcus)(无乳链球菌(S.agalactiaee)、肺炎链球菌(S.pneumoniae)、化脓性链球菌(S.pyogenes))、密螺旋体属(Treponema)(苍白密螺旋体(T.pallidum))、脲原体属(Ureaplasma)(例如,解脲脲原体(U.urealyticum))、弧菌属(Vibrio)(例如,霍乱弧菌(V.cholerae))、耶尔森菌属(Yersinia)(例如,鼠疫耶尔森菌(Y.pestis)、小肠结肠炎耶尔森菌(Y.enteerocolitica)和假结核耶尔森菌(Y.pseudotuberculosis))。
在一个实施方案中,可以被本文所述的组合物、系统和/或其组分靶向和/或修饰的病原性病毒包括但不限于双链DNA病毒、部分双链DNA病毒、单链DNA病毒、正单链RNA病毒、负单链RNA病毒、或双链RNA病毒。在一个实施方案中,病原性病毒可以来自以下病毒科:腺病毒科(Adenoviridae)(例如,腺病毒)、疱疹病毒科(Herpeesviridae)(例如,单纯疱疹1型、单纯疱疹2型、水痘带状疱疹病毒、爱泼斯坦-巴尔病毒(Epstein–Barr virus)、人巨细胞病毒、人疱疹病毒8型)、乳头瘤病毒科(Papillomaviridae)(例如,人乳头瘤病毒)、多瘤病毒科(Polyomaviridae)(例如,BK病毒、JC病毒)、痘病毒科(Poxviridae)(例如,天花)、嗜肝DNA病毒科(Hepadnaviridae)(例如,乙型肝炎)、细小病毒科(Parvoviridae)(例如,细小病毒B19)、星状病毒科(Astroviridae)(例如,人星状病毒)、杯状病毒科(Caliciviridae)(例如,诺沃克病毒(Norwalk virus))、小RNA病毒科(Picornaviridae)(例如,柯萨奇病毒(coxsackievirus)、甲型肝炎病毒、脊髓灰质炎病毒、鼻病毒)、冠状病毒科(Coronaviridae)(例如,严重急性呼吸综合征相关冠状病毒、毒株:严重急性呼吸综合征病毒、严重急性呼吸综合征冠状病毒2(COVID-19))、黄病毒科(Flaviviridae)(例如,丙型肝炎病毒、黄热病病毒、登革病毒、西尼罗河病毒(West Nile virus)、TBE病毒)、披膜病毒科(Togaviridae)(例如,风疹病毒)、肝炎病毒科(Hepeviridae)(例如,戊型肝炎病毒)、逆转录病毒科(人类免疫缺陷病毒(HIV))、正粘病毒科(Orthomyxoviridae)(例如,流感病毒)、沙粒病毒科(Arenaviridae)(例如,拉沙病毒(Lassa virus))、布尼亚病毒科(Bunyaviridae)(例如,克里米亚-刚果出血热病毒(Crimean-Congo hemorrhagic fevervirus)、汉坦病毒(Hantaan virus))、丝状病毒科(Filoviridae)(例如,埃博拉病毒(Ebolavirus)和马尔堡病毒(Marburg virus))、副粘病毒科(Paramyxoviridae)(例如麻疹病毒、流行性腮腺炎病毒、副流感病毒、呼吸道合胞病毒)、弹状病毒科(Rhabdoviridae)(狂犬病病毒)、丁型肝炎病毒、呼肠孤病毒科(Reoviridae)(例如轮状病毒(Rotavirus)、环状病毒(Orbivirus)、科罗拉多蜱热病毒(Coltivirus)、版纳病毒(Banna virus))。
在一个实施方案中,可以被本文所述的组合物、系统和/或其组分靶向和/或修饰的病原性真菌包括但不限于以下真菌属的真菌:念珠菌属(Candida)(例如,白色念珠菌(C.albicans))、曲霉属(Aspergillus)(例如,烟曲霉(A.fumigatus)、黄曲霉(A.flavus)、棒曲霉(A.clavatus))、隐球菌属(Cryptococcus)(例如,新型隐球菌(C.neoformans)、格特隐球菌(C.gattii))、组织胞浆菌属(Histoplasma)(荚膜组织胞浆菌(H.capsulatum))、肺孢子菌属(Pneumocystis)(例如,耶氏肺孢子菌(P.jiroveecii))、葡萄穗霉属(Stachybotrys)(例如,纸葡萄穗霉(S.chartarum))。
在一个实施方案中,可以被本文所述的组合物、系统和/或其组分靶向和/或修饰的病原性寄生虫包括但不限于原生动物、蠕虫和体外寄生虫。在一个实施方案中,可以被本文所述的组合物、系统和/或其组分靶向和/或修饰的病原性原生动物包括但不限于以下目的原生动物:肉虫纲(Sarcodina)(例如,阿米巴虫(ameba),诸如内阿米巴虫(Entamoeba))、鞭毛虫纲(Mastigophora)(例如,鞭毛虫(flagellates),诸如贾第虫(Giardia)和利什曼原虫(Leishmania))、纤毛虫纲(例如纤毛虫(ciliates),诸如肠袋虫(Balantidum))和孢子纲(sporozoa)(例如,疟原虫(plasmodium)和隐孢子虫(cryptosporidium))。在一个实施方案中,可以被本文所述的组合物、系统和/或其组分靶向和/或修饰的病原性蠕虫包括但不限于扁虫(flatworm)(扁形动物(platyhelminths))、刺头虫(thorny-headed worm)(棘脑类(acanthoceephalins))和蛔虫(roundworm)(线虫类(nematodes))。在一个实施方案中,可以被本文所述的组合物、系统和/或其组分靶向和/或修饰的病原性体外寄生虫包括但不限于蜱虫、跳蚤、虱子和螨虫。
在一个实施方案中,可以被本文所述的组合物、系统和/或其组分靶向和/或修饰的病原性寄生虫包括但不限于棘阿米巴属某些种(Acanthamoeba spp.)、狒狒巴拉姆希阿米巴(Balamuthia mandrillaris)、巴贝西虫属某些种(Babesiosis spp.)(例如,巴贝西虫(Babesia)、分歧巴贝西虫(B.divergens)、双芽巴贝西虫(B.bigemina)、马巴贝西虫(B.equi)、微小巴贝西虫(B.microfti)、邓肯巴贝西虫(B.duncani))、小袋纤毛虫属某些种(Balantidiasis spp.)(例如,结肠小袋纤毛虫(Balantidium coli))、人芽囊原虫某些种(Blastocystis spp.)、隐孢子虫属某些种(Cryptosporidium spp.)、环孢子虫属某些种(Cyclosporiasis spp.)(例如,卡耶他环孢子虫(Cyclospora cayetanensis))、双核阿米巴属某些种(Dientamoebiasis spp.)(例如,脆弱双核阿米巴(Dientamoeba fragilis))、阿米巴属某些种(Amoebiasis spp.)(例如,溶组织内阿米巴(Entamoeba histolytica))、贾第虫属某些种(Giardiasis spp.)(例如,蓝氏贾第虫(Giardia lamblia))、等孢球虫属某些种(Isosporiasis spp.)(例如,贝氏等孢球虫(Isospora belli))、利什曼原虫属某些种(Leishmania spp.)、内格里虫属某些种(Naegleria spp.)(例如,福氏内格里虫(Naegleria fowleri))、疟原虫属某些种(Plasmodium spp.)(例如,恶性疟原虫(Plasmodium falciparum)、间日疟原虫(Plasmodium vivax)、卵形疟原虫柯氏亚种(Plasmodium ovale curtisi)、卵形疟原虫沃氏亚种(Plasmodium ovale wallikeri)、三日疟原虫(Plasmodium malariae)、诺氏疟原虫(Plasmodium knowlesi))、鼻孢子虫属某些种(Rhinosporidiosis spp.)(例如,西伯鼻孢子虫(Rhinosporidium seeberi))、肉孢子虫属某些种(Sarcocystosis spp.)(例如,牛人肉孢子虫(Sarcocystis bovihominis)、猪人肉孢子虫(Sarcocystis suihominis))、弓形虫属某些种(Toxoplasma spp.)(例如,刚地弓形虫(Toxoplasma gondii))、毛滴虫属某些种(Trichomonas spp.)(例如,阴道毛滴虫(Trichomonas vaginalis))、锥虫属某些种(Trypanosoma spp.)(例如,布氏锥虫(Trypanosoma brucei))、锥虫属某些种(Trypanosoma spp.)(例如,克氏锥虫(Trypanosoma cruzi))、绦虫(例如,绦虫纲(Cestoda)、多头绦虫(Taenia multiceps)、牛肉绦虫(Taenia saginata)、猪肉绦虫(Taenia solium))、广节裂头绦虫某些种(Diphyllobothrium latum spp.)、棘球绦虫属某些种(Echinococcus spp.)(例如,细粒棘球绦虫(Echinococcus granulosus)、多房棘球绦虫(Echinococcus multilocularis)、福氏棘球绦虫(E.vogeli)、少节棘球绦虫(E.oligarthrus)、膜壳绦虫属某些种(Hymenolepisspp.)(例如,短膜壳绦虫(Hymenolepis nana)、缩小膜壳绦虫(Hymenolepis diminuta))、伯特绦虫属某些种(Bertiella spp.)(例如,古巴伯特绦虫(Bertiella mucronata)、司氏伯特绦虫(Bertiella studeri))、迭宫绦虫属(Spirometra)(例如,欧猬迭宫绦虫(Spirometra erinaceieuropaei))、睾吸虫属某些种(Clonorchis spp.)(例如,华支睾吸虫(Clonorchis sinensis);泰国睾吸虫(Clonorchis viverrini))、双腔属某些种(Dicrocoelium spp.)(例如,分枝双腔吸虫(Dicrocoelium dendriticum))、片形属某些种(Fasciola spp.)(例如,牛羊肝吸虫(Fasciola hepatica)、巨大肝吸虫(Fasciolagigantica))、姜片吸虫属某些种(Fasciolopsis spp.)(例如,布氏姜片吸虫(Fasciolopsis buski))、后殖吸虫属某些种(Metagonimus spp.)(例如,横川后殖吸虫(Metagonimus yokogawai))、次睾吸虫属某些种(Metorchis spp.)(例如,联合次睾吸虫(Metorchis conjunctus))、后睾属某些种(Opisthorchis spp.)(例如,泰国肝吸虫(Opisthorchis viverrini)、猫肝吸虫(Opisthorchis felineus))、睾吸虫属某些种(例如,华支睾吸虫)、并殖属某些种(Paragonimus spp.)(例如,卫氏并殖吸虫(Paragonimuswestermani);非洲并殖吸虫(Paragonimus africanus);卡里并殖吸虫(Paragonimuscaliensis);猫肺并殖吸虫(Paragonimus kellicotti);斯氏并殖吸虫(Paragonimusskrjabini);双侧宫并殖吸虫(Paragonimus uterobilateralis))、血吸虫属某种(Schistosoma sp.)、血吸虫属某些种(例如,曼氏血吸虫(Schistosoma mansoni)、埃及血吸虫(Schistosoma haematobium)、日本血吸虫(Schistosoma japonicum)、湄公河血吸虫(Schistosoma mekongi)和间插血吸虫(Schistosoma intercalatum))、棘口属某些种(Echinostoma spp.)(例如,多刺棘口吸虫(E.echinatum))、毛毕属某些种(Trichobilharzia spp.)(例如,摄政毛毕吸虫(Trichobilharzia regent))、钩口线虫属某些种(Ancylostoma spp.)(例如,十二指肠钩口线虫(Ancylostoma duodenale))、板口线虫属某些种(Necator spp.)(例如,美洲板口线虫(Necator americanus)、管圆线虫属某些种(Angiostrongylus spp.)、异尖线虫属某些种(Anisakis spp.)、蛔属某些种(Ascarisspp.)(例如,种人蛔虫(Ascaris lumbricoides))、拜林蛔线虫属某些种(Baylisascarisspp.)(例如,浣熊拜林蛔线虫(Baylisascaris procyonis))、布鲁线虫属某些种(Brugiaspp.)(例如,马来布鲁线虫(Brugia malayi)、帝汶布鲁线虫(Brugia timori))、膨结线虫属某些种(Dioctophyme spp.)(例如,肾膨结线虫(Dioctophyme renale))、龙线虫属某些种(Dracunculus spp.)(例如,麦地那龙线虫(Dracunculus medinensis))、蛲虫属某些种(Enterobius spp.)(例如,蠕形住肠蛲虫(Enterobius vermicularis)、格氏蛲虫(Enterobius gregorii))、颚口线虫属某些种(Gnathostoma spp.)(例如,棘颚口线虫(Gnathostoma spinigerum)、刚棘颚口线虫(Gnathostoma hispidum))、恶魔蠕虫属某些种(Halicephalobus spp.)(例如,牙龈恶魔蠕虫(Halicephalobus gingivalis))、罗阿丝虫属某些种(Loa loa spp.)(例如,罗阿罗阿丝虫(Loa loa filaria))、曼森线虫属某些种(Mansonella spp.)(例如,链尾曼森线虫(Mansonella streptocerca))、蟠尾丝虫属某些种(Onchocerca spp.)(例如,旋盘尾丝虫(Onchocerca volvulus))、类圆虫属某些种(Strongyloides spp.)(例如,粪类圆虫(Strongyloides stercoralis))、吸吮线虫属某些种(Thelazia spp.)(例如,加利福尼亚吸吮线虫(Thelazia californiensis)、结膜吸吮线虫(Thelazia callipaeda))、弓蛔虫属某些种(Toxocara spp.)(例如,犬弓蛔虫(Toxocaracanis)、猫弓蛔虫(Toxocara cati)、狮弓蛔虫(Toxascaris leonine))、旋毛虫属某些种(Trichinella spp.)(例如,旋毛虫(Trichinella spiralis)、布氏旋毛虫(Trichinellabritovi)、纳氏旋毛虫(Trichinella nelsoni)、乡土旋毛虫(Trichinella nativa))、鞭虫属某些种(Trichuris spp.)(例如,毛首鞭形线虫(Trichuris trichiura)、犬鞭虫(Trichuris vulpis))、吴策线虫属某些种(Wuchereria spp.)(例如,班氏吴策线虫(Wuchereria bancrofti))、肤蝇属某些种(Dermatobia spp.)(例如,人皮蝇(Dermatobiahominis))、潜蚤属某些种(Tunga spp.)(例如,穿皮潜蚤(Tunga penetrans))、锥蝇属某些种(Cochliomyia spp.)(例如,螺旋锥蝇(Cochliomyia hominivorax))、舌形虫属某些种(Linguatula spp.)(例如,锯齿状舌形虫(Linguatula serrata))、原棘头虫目某种(Archiacanthocephala sp.)、念珠棘虫属某种(Moniliformis sp.)(例如,念珠棘头虫(Moniliformis moniliformis))、虱属某些种(Pediculus spp.)(例如,头虱(Pediculushumanus capitis)、体虱(Pediculus humanus humanus))、阴虱属某些种(Pthirus spp.)(例如,阴虱(Pthirus pubis))、蛛形纲某些种(Arachnida spp.)(例如,恙螨科(Trombiculidae)、硬蜱科(Ixodidae)、软蜱科(Argaside))、蚤目某些种(Siphonapteraspp.)(例如,蚤目:蚤科(Siphonaptera:Pulicinae))、臭虫科某些种(Cimicidae spp.)(例如,温带臭虫(Cimex lectularius)和半翅臭虫(Cimex hemipterus))、双翅目某些种(Diptera spp.)、蠕形螨属某些种(Demodex spp.)(例如,毛囊/皮脂/犬蠕形螨(Demodexfolliculorum/brevis/canis))、疥螨属某些种(Sarcoptes spp.)(例如,疥螨(Sarcoptesscabiei))、皮刺螨属某些种(Dermanyssus spp.)(例如,鸡皮刺螨(Dermanyssusgallinae))、禽刺螨属某些种(Ornithonyssus spp.)(例如,林禽刺螨(Ornithonyssussylviarum)、热带禽刺螨(Ornithonyssus bursa)、柏氏禽刺螨(Ornithonyssus bacoti))、厉螨属某些种(Laelaps spp.)(例如,毒棘厉螨(Laelaps echidnina))、异脂刺螨属某些种(Liponyssoides spp.)(例如,吸血异脂刺螨(Liponyssoides sanguineus))。
在一个实施方案中,基因靶标可以是Strich和Chertow,2019.J.Clin.Microbio.57:4e01307-18的表1中列出的那些靶标中的任一种,所述文献并入本文,如同在本文中整体表达一样。
在一个实施方案中,方法可以包括将组合物、系统和/或其组分递送至本文所述的病原性生物体,从而允许所述组合物、系统和/或其组分特异性结合并修饰病原性生物体中的一个或多个靶标,由此所述修饰杀死、抑制、降低病原性生物体的病原性,或者以其他方式使病原性生物体成为非病原性。在一个实施方案中,组合物、系统的递送在体内(即,治疗的受试者中)发生。在通过媒介发生的一个实施方案中,诸如对受试者为非病原性但能够转移多核苷酸和/或感染病原性微生物的微生物或噬菌体。在一个实施方案中,中间微生物可以是含有组合物、系统和/或其组分和/或载体和/或载体系统的工程化细菌、病毒或噬菌体。方法可以包括向待治疗的受试者施用含有组合物、系统和/或其组分和/或载体和/或载体系统的中间微生物。然后,中间微生物可以产生组合物和/或其组分,或者将组合物、系统、多核苷酸转移至病原性生物体。在实施方案中,在将组合物和/或其组分、载体或载体系统转移至病原性微生物的情况下,然后在病原性微生物中产生组合物、系统或其组分并且修饰病原性微生物,使得其毒性较低、被杀死、被抑制或者以其他方式使其不能引起疾病和/或感染和/或在宿主细胞中复制。
在一个实施方案中,在病原性微生物将其遗传物质插入到宿主细胞的基因组(例如,病毒)中的情况下,可以设计组合物、系统,使得其修饰宿主细胞的基因组,从而使得病毒DNA或cDNA不能被宿主细胞的机制复制成功能性病毒。在一个实施方案中,在病原性微生物将其遗传物质插入到宿主细胞的基因组(例如,病毒)中的情况下,可以设计组合物、系统,使得其修饰宿主细胞的基因组,从而使得病毒DNA或cDNA从宿主细胞的基因组中缺失。
应当理解,抑制或杀死病原性微生物,可以治疗或预防其感染在受试者中引起的疾病和/或病状。因此,本文还提供治疗和/或预防由任何一种或多种病原性微生物(诸如本文所述的任何病原性微生物)引起的一种或多种疾病或其症状的方法。
线粒体疾病
一些最具挑战性的线粒体病症是由线粒体DNA(mtDNA)的突变引起的,线粒体DNA是一种母系遗传的高拷贝数基因组。在一个实施方案中,可以使用本文所述的组合物、系统来修饰mtDNA突变。在一个实施方案中,可诊断、预测、治疗和/或预防的线粒体疾病可以是MELAS(线粒体脑肌病(mitochondrial myopathy encephalopathy)以及乳酸血症和类中风症状)、CPEO/PEO(慢性进行性眼外肌麻痹综合征/进行性眼外肌麻痹)、KSS(卡恩斯-塞尔综合征(Kearns-Sayre syndrome))、MIDD(母系遗传的糖尿病和耳聋)、MERRF(肌抽跃癫痫合并红色褴褛肌纤维症(myoclonic epilepsy associated with ragged red fibers))、NIDDM(非胰岛素依赖型糖尿病)、LHON(莱伯遗传性视神经病)、LS(雷氏综合征(LeighSyndrome))、氨基糖苷类引起的听力障碍、NARP(神经病、共济失调和色素性视网膜病)、锥体外系病症伴运动不能性强直、精神病和SNHL、非综合征性听力损失,一种心肌病、脑肌病、皮尔逊综合征(Pearson’s syndrome)或其组合。
在一个实施方案中,受试者的mtDNA可以体内或离体修饰。在一个实施方案中,在mtDNA离体修饰的情况下,修饰后可以将含有修饰的线粒体的细胞施用回受试者。在一个实施方案中,组合物、系统或其组分能够校正mtDNA突变或其组合。
在一个实施方案中,一种或多种mtDNA突变中的至少一种选自由以下组成的组:A3243G、C3256T、T3271C、G1019A、A1304T、A15533G、C1494T、C4467A、T1658C、G12315A、A3421G、A8344G、T8356C、G8363A、A13042T、T3200C、G3242A、A3252G、T3264C、G3316A、T3394C、T14577C、A4833G、G3460A、G9804A、G11778A、G14459A、A14484G、G15257A、T8993C、T8993G、G10197A、G13513A、T1095C、C1494T、A1555G、G1541A、C1634T、A3260G、A4269G、T7587C、A8296G、A8348G、G8363A、T9957C、T9997C、G12192A、C12297T、A14484G、G15059A、CCCCCTCCCC-串联(SEQ ID NO:64,307)重复在位置305-314和/或956-965处的重复、8,469-13,447、4,308-14,874和/或4,398-14,822位置处的缺失、961ins/delC、线粒体共同缺失(例如,mtDNA 4,977bp缺失)及其组合。
在一个实施方案中,线粒体突变可以是如在mitomap.org上可获得的Mitomap上可获得的一种或多种生物信息学工具所阐述的或通过使用所述生物信息学工具所鉴定的任何突变。此类工具包括但不限于“Variant Search,又名Market Finder”、Find Sequencesfor Any Haplogroup,又名“Sequence Finder”、“Variant Info”、“POLG PathogenicityPrediction Server”、“MITOMASTER”、“Allele Search”、“Sequence and VariantDownloads”、“Data Downloads”。MitoMap含有可能与疾病相关的mtDNA突变的报告,并且维护已报告的线粒体DNA碱基取代疾病的数据库:rRNA/tRNA突变。
在一个实施方案中,方法包括将组合物、系统和/或其组分递送至细胞,并且更具体地递送至细胞中的一个或多个线粒体,从而允许组合物、系统和/或其组分修饰细胞中的一个或多个靶多核苷酸,并且更具体地修饰细胞中的一个或多个线粒体。靶多核苷酸可以对应于mtDNA的突变,诸如本文所述的突变中的任何一种或多种。在一个实施方案中,修饰可以改变线粒体的功能,使得线粒体功能正常,或者与未修饰的线粒体相比至少功能障碍较少。修饰可以在在体内或离体发生。当离体执行修饰时,可以将含有修饰的线粒体的细胞以自体或同种异体方式施用于有需要的受试者。
微生物组修饰
微生物组在健康和疾病中发挥重要作用。例如,肠道微生物组可以通过控制消化、防止病原性微生物的生长在健康方面发挥作用,并被认为可以影响情绪和情感。不平衡的微生物组会促进疾病,并被认为会导致体重增加、血糖失控、高胆固醇、癌症和其他病症。健康的微生物组具有可以与非健康个体区分开来的一系列联合特征,因此疾病相关微生物组的检测和鉴定可以用于诊断和检测个体的疾病。组合物、系统及其组分可以用于筛选微生物组细胞群并且用于鉴定与疾病相关的微生物组。利用组合物、系统及其组分的细胞筛选方法在本文别处描述,并且可以应用于筛选受试者的微生物组,诸如肠道、皮肤、阴道和/或口腔微生物组。
在一个实施方案中,可以使用本文所述的组合物、系统和/或其组分来修饰受试者中微生物组的微生物群。在一个实施方案中,组合物、系统和/或其组分可以用于鉴定和选择微生物组中的一种或多种细胞类型并将它们从微生物组群中去除。使用组合物、系统和/或其组分选择细胞的示例性方法在本文别处描述。以此方式,可以改变微生物组的组成或微生物特征。在一个实施方案中,所述改变引起从患病微生物组组成到健康微生物组组成的变化。以此方式,可以改变一种或多种微生物与另一种微生物的比例,例如从患病比例变为健康比例。在一个实施方案中,所选择的细胞是病原性微生物。
在一个实施方案中,本文所述的组合物和系统可用于修饰受试者中微生物组的微生物中的多核苷酸。在一个实施方案中,微生物是病原性微生物。在一个实施方案中,微生物是共生且非病原性微生物。修饰受试者细胞中的多核苷酸的方法在本文别处描述并且可以应用于这些实施方案。
疾病和病状的模型
在一个方面,本发明提供了一种对与真核生物体或非人生物体中的基因组基因座相关的疾病进行建模的方法,其包括操纵所述基因组基因座的编码、非编码或调控元件内的靶序列,包括递送非天然存在的或工程化的组合物,所述组合物包含病毒载体系统,所述病毒载体系统包含可操作地编码用于其表达的组合物的一种或多种病毒载体,其中所述组合物包含上述实施方案中任一项的颗粒递送系统或递送系统或病毒颗粒或上述实施方案中任一项的细胞。
在一个方面,本发明提供了一种产生模型真核细胞的方法,所述模型真核细胞可以包括一种或多种突变的疾病基因和/或感染性微生物。在一个实施方案中,疾病基因是与患有或发展疾病的风险增加相关的任何基因。在一个实施方案中,方法包括(a)将一种或多种载体引入真核细胞中,其中所述一种或多种载体包含组合物、系统和/或其组分和/或能够驱动组合物、系统和/或其组分的表达的载体或载体系统,包括但不限于:核酸组分分子序列、一种或多种TnpB多肽及其组合,以及(b)允许组合物、系统或复合物结合一种或多种靶多核苷酸,例如以实现所述疾病基因内的靶多核苷酸的切割、切口或其他修饰,其中所述组合物、系统或复合物由一种或多种TnpB多肽组成,所述TnpB多肽与以下复合:(1)与靶多核苷酸内的靶序列杂交的一个或多个核酸组分分子序列,以及任选地(2)核酸组分支架序列,从而产生包含一种或多种突变的疾病基因的模型真核细胞。因此,在一个实施方案中,组合物和系统含有用于并驱动以下中的一种或多种的表达的核酸分子:TnpB多肽、核酸组分分子序列和/或同源重组模板和/或稳定配体(如果TnpB多肽具有去稳定结构域)。在一个实施方案中,所述切割包括通过TnpB多肽在靶序列的位置处切割一条或两条链。在一个实施方案中,切口包括通过TnpB多肽在靶序列的位置处对一条或两条链进行切口。在一个实施方案中,所述切割或切口导致靶多核苷酸的修饰的转录。在一个实施方案中,修饰导致靶多核苷酸的转录减少。在一个实施方案中,方法还包括通过与重组模板多核苷酸同源重组来修复所述切割或切口的靶多核苷酸,其中所述修复导致突变,其包括所述靶多核苷酸的一个或多个核苷酸的插入、缺失或取代。在一个实施方案中,所述突变导致包含靶序列的基因的蛋白质表达中的一个或多个氨基酸变化。
建模的疾病可以是具有遗传或表观遗传组分的任何疾病。在一个实施方案中,建模的疾病可以是如本文别处讨论的任何疾病。
原位疾病检测
组合物、系统和/或其组分可以用于诸如以下中的诊断检测方法:CASFISH(参见,例如,Deng等人2015.PNAS USA 112(38):11870-11875)、CRISPR-Live FISH(参见,例如,Wang等人2020.Science;365(6459):1301-1305)、sm-FISH(Lee和Jefcoate.2017.Front.Endocrinol.doi.org/10.3389/fendo.2017.00289)、顺序FISH CRISPRainbow(Ma等人NatBiotechnol,34(2016),第528-530页)、CRISPR-Sirius(Nat Methods,15(2018),第928-931页)、Casilio(Cheng等人Cell Res,26(2016),第254-257页)、基于卤素标签的基因组基因座可视化技术(例如,Deng等人2015.PNAS USA 112(38):11870-11875;Knight等人,Science,350(2015),第823-826页)、基于RNA适体的方法(例如,Ma等人,J Cell Biol,214(2016),第529-537页)、基于分子信标的方法(例如,Zhao等人Biomaterials,100(2016),第172-183页;Wu等人Nucleic Acids Res(2018))、基于量子点的系统(例如,Ma等人AnalChem,89(2017),第12896-12901页)、多重方法(例如,Ma等人,Proc Natl Acad Sci U S A,112(2015),第3002-3007页;Fu等人Nat Commun,7(2016),第11707页;Ma等人NatBiotechnol,34(2016),第528-530页;Shao等人Nucleic Acids Res,44(2016),文章e86);Wang等人Sci Rep,6(2016),第26857页)和其他基于原位CRISPR杂交的方法(例如,Chen等人Cell,155(2013),第1479-1491页;Gu等人Science,359(2018),第1050-1055页;Tanebaum等人Cell,159(2014),第635-646页;Ye等人Protein Cell,8(2017),第853-855页;Chen等人Nat Commun,9(2018),第5065页;Shao等人ACS Synth Biol(2017);Fu等人Nat Commun,7(2016),第11707页;Shao等人Nucleic Acids Res,44(2016),文章e86;Wang等人,Sci Rep,6(2016),第26857页),所述文献全部通过引用并入本文,如同完整表达一样,并且鉴于本文的描述,其教导可以适用于本文描述的组合物、系统及其组分。
在一个实施方案中,组合物、系统或其组分可以用于检测方法,诸如本文所述的原位检测方法。在一个实施方案中,组合物、系统或其组分可以包括本文所述的催化失活的TnpB多肽,并且在检测方法中使用这种系统,所述检测方法诸如荧光原位杂交(FISH)或本文所述的任何其他方法。在一个实施方案中,缺乏产生DNA双链断裂的能力的失活TnpB多肽可以与标志物(诸如荧光蛋白,诸如增强的绿色荧光蛋白(eEGFP))融合,并且与小核酸组分分子共表达,以在体内靶向近中心、中心和远距重复。死亡的TnpB多肽或其系统可用于可视化人类基因组中的重复序列和单个基因两者。标记的死亡TnpB多肽及其组合物、系统的此类新应用对于细胞成像和功能性核结构研究可能很重要,特别是在小细胞核体积或复杂3-D结构的情况下。
细胞选择
在一个实施方案中,本文所述的组合物、系统和/或其组分可以用于筛选和/或选择细胞的方法中。在一个实施方案中,基于组合物、系统的筛选/选择方法可用于鉴定细胞群中的患病细胞。在一个实施方案中,细胞的选择导致细胞的修饰,使得所选择的细胞死亡。以此方式,可以鉴定患病细胞并将其从健康细胞群中去除。在一个实施方案中,患病细胞可以是癌细胞、癌前期细胞、病毒或其他病原性生物体感染的细胞、或其他异常细胞。在一个实施方案中,修饰可以赋予待选择的细胞另一种可检测的变化(例如,功能变化和/或基因组条形码),所述变化促进期望的细胞的选择。在一个实施方案中,可以使用负选择方案来获得期望的细胞群。在这些实施方案中,待选择的细胞被修饰,因此可以基于它们的死亡或鉴定从细胞群中去除,或者基于赋予细胞的可检测变化进行分选。因此,在这些实施方案中,选择后剩余的细胞是期望的细胞群。
在一个实施方案中,选择一种或多种含有多核苷酸修饰的细胞的方法可以包括:将一种或多种组合物、系统和/或其组分和/或载体或载体系统引入细胞中,其中所述组合物、系统和/或其组分和/或载体或载体系统含有且/或能够表达以下中的一种或多种:TnpB多肽、核酸组分序列和重组模板;其中,例如,所表达的内容在组合物、系统、载体或载体系统内并且由组合物、系统、载体或载体系统体内表达且/或重组模板包含消除TnpB多肽切割的一种或多种突变;允许重组模板与待选择细胞中的靶多核苷酸进行同源重组;允许组合物、系统或复合物与靶多核苷酸结合以实现所述基因内靶多核苷酸的切割,其中AAV复合物包含TnpB多肽,所述TnpB多肽与以下复合:(1)与靶多核苷酸内的靶序列杂交的核酸组分分子序列,以及(2)核酸组分支架,其中复合物与靶多核苷酸的结合诱导细胞死亡或赋予细胞一些其他可检测的变化,从而允许选择其中已引入一种或多种突变的一个或多个细胞。在一个实施方案中,待选择的细胞可以是真核细胞。在一个实施方案中,待选择的细胞可以是原核细胞。可以经由本文的方法执行特定细胞的选择,而不需要选择标志物或可以包括反选择系统的两步骤过程。
治疗剂开发
本文所述的组合物、系统及其组分可以用于开发基于TnpB多肽的生物活性剂,诸如小分子治疗剂。因此,本文描述了用于开发生物活性剂的方法,所述生物活性剂调节与疾病和/或疾病基因相关的细胞功能和/或信号传导事件。在一个实施方案中,方法包括(a)使测试化合物与患病细胞和/或含有疾病基因的细胞接触;以及(b)检测读数的变化,所述变化指示与所述疾病或疾病基因相关的细胞信号传导事件或其他细胞功能的减少或增加,从而开发调节与所述疾病基因相关的所述细胞信号传导事件或其他功能的所述生物活性剂。在一个实施方案中,患病细胞是本文别处描述的模型细胞。在一个实施方案中,患病细胞是从需要治疗的受试者分离的患病细胞。在一个实施方案中,测试化合物是小分子剂。在一个实施方案中,测试化合物是小分子剂。在一个实施方案中,测试化合物是生物分子剂。
在一个实施方案中,方法涉及开发基于本文所述的组合物、系统的治疗剂。在特定的实施方案中,治疗剂包含TnpB多肽和/或具有能够与感兴趣的靶序列杂交的可重新编程间隔子的核酸组分。在特定的实施方案中,治疗剂是载体或载体系统,其可以含有a)可操作地连接至编码TnpB多肽的核苷酸序列的第一调控元件;和b)第二调控元件,其可操作地连接至编码一个或多个核酸分子的一个或多个核苷酸序列,所述核酸分子包含核酸组分,所述核酸组分包含可重新编程间隔序列、保守RNA序列;其中组分(a)和(b)位于相同或不同的载体上。在特定的实施方案中,生物活性剂是包含递送系统的组合物,所述递送系统被可操作地配置为将组合物、系统或其组分和/或含有或编码所述组分的一个或多个多核苷酸序列、载体或载体系统递送至细胞中,并且能够与本文的组合物和系统的组分形成复合物,并且其中所述复合物在细胞中是可操作的。在一个实施方案中,复合物可以包括如本文所述的TnpB多肽、包含指导序列(可重新编程间隔序列)的核酸组分支架、以及保守核苷酸序列。在任何此类组合物中,递送系统可以是酵母系统、脂质转染系统、显微注射系统、基因枪系统、病毒体、脂质体、免疫脂质体、聚阳离子、脂质:核酸缀合物或人工病毒体、或如本文所述的任何其他系统。在特定的实施方案中,递送是经由颗粒、纳米颗粒、脂质或细胞穿透肽(CPP)进行的。
本文还描述了用于开发或设计组合物、系统、任选地基于组合物、系统的疗法或治疗剂的方法,其包括(a)选择感兴趣的(治疗性)基因座核酸组分靶位点,其中所述靶位点具有群体中的最小序列变异,并且从所述选择的靶位点亚选择靶位点,其中针对所述靶位点的核酸组分识别所述群体中的最小脱靶位点数量,或(b)选择感兴趣的(治疗性)基因座核酸组分靶位点,其中所述靶位点在群体中具有最小的序列变异,或选择感兴趣的(治疗性)基因座核酸组分靶位点,其中针对所述靶位点的核酸组分识别所述群体中的最小脱靶位点数量,并且任选地估计治疗或以其他方式调节或操纵群体所需的(亚)选择的靶位点的数量,并且任选地验证单个受试者的(亚)选择的靶位点中的一个或多个,任选地设计一种或多种识别所述(亚)选择的靶位点中的一个或多个的核酸组分。
在一个实施方案中,用于开发或设计用于组合物、系统、任选地基于组合物、系统的疗法或治疗剂的核酸组分的方法可以包括(a)选择感兴趣的(治疗性)基因座核酸组分靶位点,其中所述靶位点具有群体中的最小序列变异,并且从所述选择的靶位点亚选择靶位点,其中针对所述靶位点的核酸组分分子识别所述群体中的最小脱靶位点数量,或(b)选择感兴趣的(治疗性)基因座核酸组分分子靶位点,其中所述靶位点在群体中具有最小的序列变异,或选择感兴趣的(治疗性)基因座核酸组分分子靶位点,其中针对所述靶位点的核酸组分分子识别所述群体中的最小脱靶位点数量,并且任选地估计治疗或以其他方式调节或操纵群体所需的(亚)选择的靶位点的数量,任选地验证单个受试者的(亚)选择的靶位点中的一个或多个,任选地设计一种或多种识别所述(亚)选择的靶位点中的一个或多个的核酸组分分子。
在一个实施方案中,用于开发或设计群体中的组合物、系统、任选地基于组合物、系统的疗法或治疗剂的方法可以包括(a)选择感兴趣的(治疗性)基因座可重新编程间隔子靶位点,其中所述靶位点具有群体中的最小序列变异,并且从所述选择的靶位点亚选择靶位点,其中针对所述靶位点的核酸组分识别所述群体中的最小脱靶位点数量,或(b)选择感兴趣的(治疗性)基因座核酸组分可重新编程间隔子靶位点,其中所述靶位点在群体中具有最小的序列变异,或选择感兴趣的(治疗性)基因座核酸组分可重新编程间隔子靶位点,其中针对所述靶位点的核酸组分识别所述群体中的最小脱靶位点数量,并且任选地估计治疗或以其他方式调节或操纵群体所需的(亚)选择的靶位点的数量,任选地验证单个受试者的(亚)选择的靶位点中的一个或多个,任选地设计一种或多种识别所述(亚)选择的靶位点中的一个或多个的核酸组分。
在一个实施方案中,用于开发或设计用于群体中的组合物、系统、任选地基于组合物、系统的疗法或治疗剂的核酸组分分子的方法可以包括(a)选择感兴趣的(治疗性)基因座核酸组分分子靶位点,其中所述靶位点具有群体中的最小序列变异,并且从所述选择的靶位点亚选择靶位点,其中针对所述靶位点的核酸组分分子识别所述群体中的最小脱靶位点数量,或(b)选择感兴趣的(治疗性)基因座核酸组分分子靶位点,其中所述靶位点在群体中具有最小的序列变异,或选择感兴趣的(治疗性)基因座核酸组分分子靶位点,其中针对所述靶位点的核酸组分分子识别所述群体中的最小脱靶位点数量,并且任选地估计治疗或以其他方式调节或操纵群体所需的(亚)选择的靶位点的数量,任选地验证单个受试者的(亚)选择的靶位点中的一个或多个,任选地设计一种或多种识别所述(亚)选择的靶位点中的一个或多个的核酸组分可重新编程间隔子。
在一个实施方案中,用于开发或设计组合物、系统(诸如基于组合物、系统的疗法或治疗剂)(任选地在群体中)或用于开发或设计用于组合物、系统(任选地基于组合物、系统的疗法或治疗剂)的核酸组分可重新编程间隔子(任选地在群体中)的方法可以包括选择靶群体的一个或多个基因座中的一组靶序列,其中靶序列不含有靶群体(即,铂靶序列)中以高于阈值等位基因频率出现的变体;从所述选择的(铂)靶序列中去除具有高频脱靶候选物(相对于组中的其他(铂)靶标)的任何靶序列,以限定最终靶序列组;基于最终靶序列组制备一个或多个,诸如一组组合物、系统,任选地其中制备的组合物的数量(至少部分)基于靶群体的大小。
在一个实施方案中,使用基于测序的双链断裂(DSB)检测测定(诸如本文别处所述)来鉴定或确定脱靶候选物/脱靶物、TAM限制性、靶切割效率或效应蛋白特异性。在一个实施方案中,使用基于测序的双链断裂(DSB)检测测定(诸如本文别处所述)来鉴定或确定脱靶候选物/脱靶物。在一个实施方案中,脱靶物或脱靶候选物具有至少1个、优选1-3个错配或(远端)TAM错配,诸如1个或多个,诸如1、2、3或更多个(远端)TAM错配。在一个实施方案中,基于测序的DSB检测测定包括用包含引物结合位点的衔接子标记DSB的位点、用条形码或独特分子标识符标记DSB的位点或其组合,如本文别处所述。
应当理解,核酸组分的可重新编程间隔序列与靶位点100%互补,即不包含与靶位点的任何错配。还应当理解,可重新编程间隔子对(脱)靶位点的“识别”以组合物、系统的功能为前提,即,如果可重新编程间隔子RNA与(脱)靶位点的结合导致组合物、系统的活性(诸如诱导单链或双链DNA切割、转录调节等),则(脱)靶位点仅被可重新编程间隔子RNA识别。
在一个实施方案中,在群体中具有最小序列变异的靶位点的特征在于在至少99%、优选至少99.9%、更优选至少99.99%的群体中不存在序列变异。在一个实施方案中,优化靶位置包括选择在至少99%、优选至少99.9%、更优选至少99.99%的群体中不存在序列变异的靶序列或基因座。这些靶标在本文别处也称为“铂靶标”。在一个实施方案中,所述群体包含至少1000个个体,诸如至少5000个个体,诸如至少10000个个体,诸如至少50000个个体。
在一个实施方案中,脱靶位点的特征在于脱靶位点与核酸组分之间的至少一个错配。在一个实施方案中,脱靶位点的特征在于脱靶位点与核酸组分之间的至多五个、优选至多四个、更优选至多三个错配。在一个实施方案中,脱靶位点的特征在于脱靶位点与核酸组分之间的至少一个错配,以及脱靶位点与核酸组分之间的至多五个、优选至多四个、更优选至多三个错配。
在一个实施方案中,确定所述群体中的高频单倍型在所述群体中的所述最小脱靶位点数量。在一个实施方案中,确定所述群体中的脱靶位点基因座的高频单倍型在所述群体中的所述最小脱靶位点数量。在一个实施方案中,确定所述群体中的靶位点基因座的高频单倍型在所述群体中的所述最小脱靶位点数量。在一个实施方案中,高频单倍型的特征在于在至少0.1%的群体中出现。
在一个实施方案中,治疗群体所需的(亚)选择的靶位点的数量基于低频序列变异(诸如在大规模测序数据集中捕获的低频序列变异)来估计。在一个实施方案中,估计治疗给定大小的群体所需的(亚)选择的靶位点的数量。
在一个实施方案中,方法还包括获得待治疗受试者的基因组测序数据;以及用选自组合物、系统组的组合物、系统治疗受试者,其中所选择的组合物、系统(至少部分地)基于个体的基因组测序数据。在一个实施方案中,((亚)选择的)靶标通过基因组测序、优选全基因组测序来验证。
在一个实施方案中,基于一个或多个参数的优化来(进一步)选择如本文所述的靶序列或基因座,所述参数诸如TAM类型(天然的或修饰的)、TAM核苷酸含量、TAM长度、靶序列长度、TAM限制性、靶切割效率和基因、基因座或其他基因组区域内的靶序列位置。优化方法在本文别处更详细地讨论。
在一个实施方案中,基于靶基因座位置、靶长度、靶特异性和TAM特征中的一种或多种的优化,(进一步)选择如本文所述的靶序列或基因座。如本文所用,TAM特征可包含例如TAM序列、TAM长度和/或TAM GC含量。在一个实施方案中,优化TAM特征包括优化TAM的核苷酸含量。在一个实施方案中,优化TAM的核苷酸含量是选择具有使一个或多个靶基因座中的丰度最大化、使突变频率最小化或实现两者的基序的TAM。可以例如通过选择缺乏CpG或具有低或最小CpG的TAM序列来实现最小化突变频率。
在一个实施方案中,组合物、系统组中的每种组合物和系统的效应蛋白基于选自由以下组成的组的一个或多个参数的优化来选择:效应蛋白大小、效应蛋白进入高染色质可及性区域的能力、跨基因组靶标的酶活性均匀程度、表观遗传耐受性、错配/凸起耐受性、效应蛋白特异性、效应蛋白稳定性或半衰期、效应蛋白免疫原性或毒性。优化方法在本文别处更详细地讨论。
系统的优化
本发明的方法可以涉及优化与组合物、系统和/或其功能相关的所选参数或变量,如本文别处进一步所述。如本文所述的方法中的组合物、系统的优化可以取决于靶标,诸如一种或多种治疗性靶标、组合物、系统调节的模式或类型,诸如基于组合物、系统的治疗性靶标调节、修饰或操纵,以及组合物、系统、组分的递送。可以根据基因型和/或表型结果选择一种或多种靶标。例如,可以根据(遗传)疾病病因学或期望的治疗结果来选择一种或多种治疗性靶标。(治疗性)靶标可以是单个基因、基因座或其他基因组位点,或者可以是多个基因、基因座或其他基因组位点。如本领域已知的,单个基因、基因座或其他基因组位点可以被靶向多于一次,诸如通过使用多个核酸组分、或核酸组分支架和多个可重新编程间隔子。
组合物和/或系统(诸如基于TnpB多肽的疗法或治疗剂)的活性可以涉及靶标破坏,诸如靶标突变,从而诸如导致基因敲除。组合物和/或系统(诸如基于TnpB多肽的疗法或治疗剂)的活性可以涉及特定靶位点的替换,从而诸如导致靶标校正。基于TnpB多肽的疗法或治疗剂可以涉及特定靶位点的去除,从而诸如导致靶标缺失。组合物和/或系统(诸如基于TnpB多肽的疗法或治疗剂)的活性可以涉及靶位点功能,诸如靶位点活性或可及性的调节,从而导致例如(转录和/或表观遗传)基因或基因组区域活化或基因或基因组区域沉默。技术人员将理解,靶位点功能的调节可以涉及TnpB多肽突变(诸如例如催化失活的TnpB多肽的产生)和/或官能化(诸如例如TnpB多肽与异源功能结构域,诸如转录活化子或阻遏子的融合),如本文别处所述。
因此,在一个方面,本发明涉及一种如本文所述的方法,其包括选择一种或多种(治疗性)靶标、选择组合物和/或系统的一种或多种功能、以及优化与组合物和/或其功能相关的所选参数或变量。在相关方面,本发明涉及一种如本文所述的方法,其包括(a)选择一个或多个(治疗性)靶基因座,(b)选择一种或多种组合物功能,(c)任选地选择一种或多种递送模式,以及制备、开发或设计基于步骤(a)-(c)选择的本文的组合物。
在一个实施方案中,组合物和/或系统的功能包括基因组突变。在一个实施方案中,组合物和/或系统的功能包括单个基因组突变。在一个实施方案中,组合物和/或系统的功能包括多个基因组突变。在一个实施方案中,组合物和/或系统的功能包括基因敲除。在一个实施方案中,组合物和/或系统的功能包括单个基因敲除。在一个实施方案中,组合物和/或系统的功能包括多个基因敲除。在一个实施方案中,组合物和/或系统的功能包括基因校正。在一个实施方案中,组合物和/或系统的功能包括单个基因校正。在一个实施方案中,组合物和/或系统的功能包括多个基因校正。在一个实施方案中,组合物和/或系统的功能包括基因组区域校正。在一个实施方案中,组合物和/或系统的功能包括单个基因组区域校正。在一个实施方案中,组合物和/或系统的功能包括多个基因组区域校正。在一个实施方案中,组合物和/或系统的功能包括基因缺失。在一个实施方案中,组合物和/或系统的功能包括单个基因缺失。在一个实施方案中,组合物和/或系统的功能包括多个基因缺失。在一个实施方案中,组合物和/或系统的功能包括基因组区域缺失。在一个实施方案中,组合物和/或系统的功能包括单个基因组区域缺失。在一个实施方案中,组合物和/或系统的功能包括多个基因组区域缺失。在一个实施方案中,组合物和/或系统的功能包括基因或基因组区域功能的调节。在一个实施方案中,组合物和/或系统的功能包括单个基因或基因组区域功能的调节。在一个实施方案中,组合物和/或系统的功能包括多个基因或基因组区域功能的调节。在一个实施方案中,组合物和/或系统的功能包括基因或基因组区域功能,诸如基因或基因组区域活性。在一个实施方案中,组合物和/或系统的功能包括单个基因或基因组区域功能,诸如基因或基因组区域活性。在一个实施方案中,组合物和/或系统的功能包括多个基因或基因组区域功能,诸如基因或基因组区域活性。在一个实施方案中,组合物和/或系统的功能包括调节基因活性或可及性,从而任选地导致转录和/或表观遗传基因或基因组区域活化或者基因或基因组区域沉默。在一个实施方案中,组合物和/或系统的功能包括调节单个基因活性或可及性,从而任选地导致转录和/或表观遗传基因或基因组区域活化或者基因或基因组区域沉默。在一个实施方案中,组合物和/或系统的功能包括调节多个基因活性或可及性,从而任选地导致转录和/或表观遗传基因或基因组区域活化或者基因或基因组区域沉默。
如本文所述的方法中的所选参数或变量的优化可以导致优化或改进的系统,诸如基于TnpB多肽的疗法或治疗剂、特异性、功效和/或安全性。在一个实施方案中,在如本文所述的本发明的方法中考虑、选择或优化以下参数或变量中的一个或多个:TnpB多肽变构相互作用、TnpB多肽功能结构域和功能结构域相互作用、TnpB多肽特异性、核酸组分特异性、组合物特异性、TAM限制性、TAM类型(天然的或修饰的)、TAM核苷酸含量、TAM长度、TnpB多肽活性、核酸组分活性、TnpB多肽/核酸组分分子复合物活性、靶切割效率、靶位点选择、靶序列长度、效应蛋白进入高染色质可及性区域的能力、跨基因组靶标的酶活性均匀程度、表观遗传耐受性、错配/凸起耐受性、TnpB多肽稳定性、TnpB多肽mRNA稳定性、核酸组分分子稳定性、TnpB多肽复合物稳定性、TnpB多肽蛋白或mRNA免疫原性或毒性、核酸组分分子免疫原性或毒性、TnpB多肽免疫原性或毒性、TnpB多肽或mRNA剂量或滴度、核酸组分分子剂量或滴度、剂量或滴度、TnpB多肽蛋白大小、TnpB多肽表达水平、核酸组分分子表达水平、TnpB多肽表达水平、TnpB多肽时空表达、核酸组分分子时空表达、TnpB多肽/核酸组分时空表达。
通过实例而非限制,可以如下实现参数或变量优化。TnpB多肽特异性可以通过选择最具特异性的TnpB多肽(例如TnpB)来优化。这可以例如通过选择最具特异性的TnpB多肽直系同源物或通过增加特异性的特定TnpB多肽突变来实现。可以通过选择最具特异性的核酸组分来优化核酸组分的特异性。这可以例如通过选择具有低同源性(即,与脱靶位点具有至少一个或优选多个,诸如至少2个或优选至少3个错配)的核酸组分来实现。可以通过如上所述增加TnpB多肽特异性和/或核酸组分特异性来优化特异性。
靶标长度或靶序列长度可以例如通过选择适当的TnpB多肽(诸如识别期望的靶标或靶序列核苷酸长度的适当TnpB多肽)来优化。或者或另外,可以通过提供长度偏离通常与TnpB多肽(诸如天然存在的TnpB多肽)相关的靶(序列)长度的靶标来优化靶(序列)长度。TnpB多肽或靶(序列)长度可以是天然存在的,或者可以例如基于具有改变的靶(序列)长度识别或靶(序列)长度识别库的TnpB多肽突变体进行优化。例如,增加或减少靶(序列)长度可能会影响靶标识别和/或脱靶识别。可以通过选择最具活性的TnpB多肽来优化TnpB多肽活性。这可以例如通过选择最具活性的TnpB多肽直系同源物或通过增加活性的特定TnpB多肽突变来实现。TnpB多肽蛋白接近高染色质可及性区域的能力可以通过选择适当的TnpB多肽或其突变体来优化,并且可以考虑TnpB多肽的大小、电荷或其他尺寸变量等。TnpB多肽活性的均匀程度可以通过选择适当的TnpB多肽或其突变体来优化,并且可以考虑TnpB多肽特异性和/或活性、TAM特异性、靶长度、错配耐受性、表观遗传耐受性、TnpB多肽和/或核酸组分稳定性和/或半衰期、TnpB多肽和/或核酸组分的免疫原性和/或毒性等。可以通过选择最具活性的核酸组分来优化核酸组分活性。在一个实施方案中,这可以通过用RNA修饰增加核酸组分稳定性来实现。可以通过如上所述增加TnpB多肽活性和/或核酸组分活性来优化组合物活性。
可以通过选择基因、基因座或其他基因组区域内的靶位点的最佳位置来优化靶位点选择。可以通过优化靶位置,包括选择具有低变异性的基因、基因座或其他基因组区域的靶序列来优化靶位点选择。这可以例如通过选择早期和/或保守的外显子或结构域(即,在群体内具有低变异性,诸如多态性)中的靶位点来实现。
在一个实施方案中,优化靶(序列)长度包括选择一个或多个5与25个核苷酸之间的靶基因座内的靶序列。在一个实施方案中,靶序列是20个核苷酸。
在一个实施方案中,优化靶标特异性包括选择最大程度地减少脱靶候选物的靶标基因座。
在一个实施方案中,可以通过最大程度地减少脱靶效应(例如,脱靶物被限定为与靶标相比具有1-5、1-4或优选1-3个错配,优选地还考虑群体内的变异性)来选择靶位点。可以通过选择具有适当半衰期(诸如优选短半衰期),同时仍能够维持足够活性的TnpB多肽来优化TnpB多肽稳定性。在一个实施方案中,这可以通过选择具有特定半衰期的适当的TnpB多肽直系同源物或通过影响半衰期或稳定性的特定TnpB多肽突变或修饰(诸如包括(例如,融合)稳定或去稳定结构域或序列)来实现。可以通过增加或降低TnpB多肽mRNA稳定性来优化TnpB多肽mRNA稳定性。在一个实施方案中,这可以通过用mRNA修饰增加TnpB多肽mRNA稳定性来实现。可以通过增加或降低核酸组分稳定性来优化核酸组分稳定性。在一个实施方案中,这可以通过用RNA修饰增加或降低核酸组分稳定性来实现。可以通过如上所述增加或降低TnpB多肽稳定性和/或核酸组分分子稳定性来优化稳定性。可以通过降低TnpB多肽或mRNA免疫原性或毒性来优化TnpB多肽蛋白或mRNA免疫原性或毒性。在一个实施方案中,这可以通过mRNA或蛋白质修饰来实现。类似地,在基于DNA的表达系统的情况下,可以降低DNA免疫原性或毒性。可以通过降低核酸组分免疫原性或毒性来优化核酸组分免疫原性或毒性。在一个实施方案中,这可以通过核酸组分修饰来实现。类似地,在基于DNA的表达系统的情况下,可以降低DNA免疫原性或毒性。可以通过如上所述降低TnpB多肽免疫原性或毒性和/或核酸组分免疫原性或毒性,或通过选择免疫原性或毒性最小的TnpB多肽/核酸组分组合来优化免疫原性或毒性。类似地,在基于DNA的表达系统的情况下,可以降低DNA免疫原性或毒性。可以通过选择最大程度地减少毒性和/或最大程度地增加特异性和/或功效的剂量或滴度来优化TnpB多肽蛋白或mRNA的剂量或滴度。可以通过选择最大程度地减少毒性和/或最大程度地增加特异性和/或功效的剂量或滴度来优化核酸组分的剂量或滴度。可以通过选择最大程度地减少毒性和/或最大程度地增加特异性和/或功效的剂量或滴度来优化组合物的剂量或滴度。可以通过选择最小蛋白质大小来优化TnpB多肽大小,以提高递送效率,特别是病毒介导的递送的效率。可以通过限制(或延长)表达持续时间和/或限制(或提高)表达水平来优化TnpB多肽、核酸组分或其复合物的表达水平。这可以例如通过以下方式实现:使用自我失活组合物、系统,诸如包括自我靶向(例如TnpB多肽靶向)核酸组分分子,通过使用表达持续时间受限的病毒载体,通过使用用于低(或高)表达水平的适当启动子,通过组合各个TnpB系统组分的不同递送方法,诸如病毒介导的编码核酸的TnpB多肽的递送与非病毒介导的核酸组分的递送的组合,或者病毒介导的核酸组分的递送与非病毒介导的TnpB多肽或mRNA的递送的组合。可以通过适当选择条件性和/或诱导型表达系统来优化TnpB多肽、核酸组分或TnpB复合物的时空表达,所述表达系统包括可控的TnpB多肽活性,任选地去稳定的TnpB多肽和/或分裂的TnpB多肽和/或细胞或组织特异性表达系统。
在一个方面,本发明涉及一种如本文所述的方法,其包括选择一个或多个(治疗性)靶标、选择组合物和/或系统的功能、选择组合物递送模式、选择组合物递送媒介物或表达系统以及优化与组合物和/或其功能相关的所选参数或变量,任选地其中所述参数或变量是选自以下的一种或多种:TnpB多肽特异性、核酸组分特异性、TnpB复合物特异性、TnpB多肽活性、核酸组分分子活性、TnpB多肽/核酸组分复合物活性、靶切割效率、靶位点选择、靶序列长度、效应蛋白进入高染色质可及性区域的能力、跨基因组靶标的酶活性均匀程度、表观遗传耐受性、错配/凸起耐受性、TnpB多肽稳定性、TnpB多肽mRNA稳定性、核酸组分稳定性、TnpB复合物稳定性、TnpB多肽蛋白或mRNA免疫原性或毒性、核酸组分免疫原性或毒性、TnpB多肽/核酸组分复合物免疫原性或毒性、TnpB多肽蛋白或mRNA剂量或滴度、核酸组分剂量或滴度、TnpB复合物剂量或滴度、TnpB多肽蛋白大小、TnpB多肽表达水平、核酸组分表达水平、TnpB多肽/核酸组分分子复合物表达水平、TnpB多肽时空表达、核酸组分时空表达、TnpB多肽/核酸组分复合物时空表达。
应当理解,待优化的参数或变量以及优化的性质可以取决于(治疗性)靶标、组合物和/或系统的功能、系统递送模式和/或组合物递送媒介物或表达系统。
在一个方面,本发明涉及一种如本文所述的方法,其包括在群体水平优化核酸组分特异性。优选地,核酸组分特异性的所述优化包括最大程度地降低群体中的核酸组分靶位点序列变异和/或最大程度地降低群体中的核酸组分脱靶发生率。
在一个实施方案中,优化可以导致选择天然存在的或修饰的TnpB多肽。在一个实施方案中,优化可以导致选择具有核酸酶、切口酶、脱氨酶、转座酶和/或具有失活或消除的一种或多种效应子功能的TnpB多肽。在一个实施方案中,优化TAM特异性可以包括选择具有修饰的TAM特异性的TnpB多肽。在一个实施方案中,优化可以包括选择具有最小尺寸的TnpB多肽。在一个实施方案中,优化效应蛋白稳定性包括诸如通过选择具有特定半衰期或稳定性的适当的TnpB多肽直系同源物来选择具有短半衰期同时维持足够活性的效应蛋白。在一个实施方案中,优化免疫原性或毒性包括通过蛋白质修饰来最大程度地降低效应蛋白免疫原性或毒性。在一个实施方案中,优化功能特异性包括选择对核酸组分分子与一个或多个靶基因座之间的错配和/或凸起的耐受性降低的蛋白质效应子。
在一个实施方案中,优化功效包括优化总体效率、表观遗传耐受性或两者。在一个实施方案中,最大程度地增加总体效率包括选择在具有不同染色质复杂性的靶基因座中具有均匀酶活性的效应蛋白,选择酶活性限于开放染色质可及性区域的效应蛋白。在一个实施方案中,使用ATAC-seq或DNA邻近连接测定中的一种或多种来测量染色质可及性。在一个实施方案中,优化表观遗传耐受性包括优化甲基化耐受性、表观遗传标志竞争或两者。在一个实施方案中,优化甲基化耐受性包括选择修饰甲基化DNA的效应蛋白。在一个实施方案中,优化表观遗传耐受性包括选择不能修饰染色体沉默区域的效应蛋白、选择能够修饰染色体沉默区域的效应蛋白、或选择未富集表观遗传标志物的靶基因座
在一个实施方案中,选择优化的核酸组分分子包括优化稳定性、免疫原性或两者,或如本文别处所述的其他相关参数或变量。
在一个实施方案中,优化核酸组分分子稳定性和/或核酸组分分子免疫原性包括RNA修饰,或如本文别处所述的其他核酸组分分子相关参数或变量。在一个实施方案中,修饰包括从核酸组分分子的靶互补区的3'末端去除1-3个核苷酸。在一个实施方案中,修饰包括延伸的核酸组分分子和/或反式RNA/DNA元件,其在核酸组分分子中产生稳定的结构,所述核酸组分分子与脱靶基因座的靶标处的核酸组分分子碱基配对进行竞争,或包括核酸组分分子与靶序列之间的延伸的互补核苷酸,或包括两者。
在一个实施方案中,递送模式包括递送核酸组分分子和/或TnpB多肽、递送核酸组分分子和/或TnpB多肽mRNA、或作为基于DNA的表达系统递送核酸组分分子和/或TnpB多肽。在一个实施方案中,递送模式还包括从由脂质体、脂质颗粒、纳米颗粒、基因枪或基于病毒的表达/递送系统组成的组中选择递送媒介物和/或表达系统。在一个实施方案中,表达是时空表达,通过选择条件性和/或诱导型表达系统来优化时空表达,所述表达系统包括可控的TnpB多肽活性,任选地去稳定的TnpB多肽和/或分裂的TnpB多肽和/或细胞或组织特异性表达系统。
如本文所述的方法还可以涉及递送模式的选择。在一个实施方案中,递送或将要递送核酸组分和/或TnpB多肽。在一个实施方案中,递送或将要递送核酸组分和/或TnpB多肽mRNA。在一个实施方案中,递送或将要递送基于DNA的表达系统中提供的核酸组分和/或TnpB多肽。在一个实施方案中,各个系统组分的递送包括上述递送模式的组合。在一个实施方案中,递送包括递送核酸组分和/或TnpB多肽蛋白、递送核酸组分和/或TnpB多肽mRNA、或作为基于DNA的表达系统递送核酸组分和/或TnpB多肽。
如本文所述的方法还可以涉及组合物递送媒介物和/或表达系统的选择。递送媒介物和表达系统在本文别处描述。例如,核酸和/或蛋白质的递送媒介物包括纳米颗粒、脂质体等。DNA的递送媒介物(诸如基于DNA的表达系统)包括例如基因枪、基于病毒的载体系统(例如腺病毒、AAV、慢病毒)等。技术人员将理解,递送模式以及递送媒介物或表达系统的选择可以取决于例如待靶向的细胞或组织。在一个实施方案中,用于递送组合物、系统或其组分的递送媒介物和/或表达系统包括脂质体、脂质颗粒、纳米颗粒、基因枪或基于病毒的表达/递送系统。
治疗应用的考虑因素
基因组编辑疗法的一个考虑因素是序列特异性核酸酶(诸如TnpB多肽的变体)的选择。每种核酸酶变体可具有其独特的优点和缺点,其中许多优点和缺点必须在治疗背景下进行平衡以最大程度地提高治疗效果。为了使特定的编辑疗法有效,必须在靶细胞群中实现足够高水平的修饰以逆转疾病症状。这种治疗修饰“阈值”由治疗后编辑细胞的适应性以及逆转症状所需的基因产物的量决定。就适应性而言,相对于未编辑的细胞,编辑为处理的细胞创造了三种潜在的结果:适应性增加、不变或降低。在适应性增强的情况下,校正的细胞可能能够相对于患病细胞进行扩张以介导治疗。在此情况下,在编辑的细胞具有选择性优势的情况下,即使少量的编辑细胞也可以通过扩增进行扩增,从而为患者提供治疗益处。在编辑的细胞在适应性方面没有变化的情况下,可以保证增加治疗修饰阈值。因此,相对于其中编辑为靶细胞创造增加的适应性的疾病,可能需要显著更高水平的编辑来治疗其中编辑创造中性适应性优势的疾病。如果编辑带来了适应性劣势,就像恢复癌细胞中肿瘤抑制基因的功能一样,则修饰的细胞将在与患病细胞的竞争中被击败,从而引起治疗益处相对于编辑率较低。这可以通过补充疗法来克服,以增加编辑的细胞相对于患病细胞的效力和/或适应性。
除了细胞适应性之外,治疗疾病所需的基因产物的量也可以影响可以治疗或预防疾病或其症状的治疗性基因组编辑的最低水平。在基因产物水平的小变化可能导致临床结果显著变化的情况下,相对于需要基因产物水平的较大变化以获得临床相关反应的情况,治疗性基因组编辑的最低水平较低。在一个实施方案中,治疗性基因组编辑的最低水平可以在0.1-1%、1-5%、5-10%、10-15%、15-20%、20-25%、25-30%、30-35%、35-40%、40-45%、45-50%或50-55%的范围内。因此,基因产物水平的小变化可以影响临床结果以及编辑细胞具有适应性优势的疾病,是基因组编辑疗法的理想目标,因为治疗修饰阈值低得足以允许高成功机会。
NHEJ和HDR DSB修复的活性可以因细胞类型和细胞状态而异。NHEJ不受细胞周期的高度调控,并且在细胞类型中有效,从而允许可接近的靶细胞群中的高水平的基因破坏。相比之下,HDR主要在S/G2期期间发挥作用,因此仅限于活跃分裂的细胞,从而限制了需要对有丝分裂细胞进行精确基因组修饰的治疗[Ciccia,A.&Elledge,S.J.Molecular cell40,179-204(2010);Chapman,J.R.等人Molecular cell 47,497-510(2012)]。
经由HDR进行校正的效率可以通过靶向基因座的表观遗传状态或序列控制,或通过所使用的特定修复模板配置(单链与双链,长与短同源臂)控制[Hacein-Bey-Abina,S.等人The New England journal of medicine 346,1185-1193(2002);Gaspar,H.B.等人Lancet 364,2181-2187(2004);Beumer,K.J.等人G3(2013)]。靶细胞中NHEJ和HDR机制的相对活性也可以影响基因校正效率,因为这些途径可能竞争解析DSB[Beumer,K.J.等人Proceedings of the National Academy of Sciences of the United States ofAmerica 105,19821-19826(2008)]。HDR还带来了NHEJ策略所未见的递送挑战,因为它使用核酸酶和修复模板的同时递送。因此,当设计、优化和/或选择如本文别处更详细描述的基于TnpB多肽的治疗剂时,可以牢记这些差异。
基于TnpB多肽的多核苷酸修饰应用可以包括蛋白质、小RNA分子和/或修复模板的组合,并且在一个实施方案中可以使这些多个部分的递送比例如传统的小分子疗法显著更具挑战性。已经开发了用于递送组合物、系统及其组分的两种主要策略:离体和体内。在离体治疗的一个实施方案中,从受试者取出患病细胞,进行编辑,然后移植回患者体内。在其他实施方案中,收集来自健康同种异体供体的细胞,使用组合物或其组分进行修饰,以赋予各种功能和/或降低免疫原性,并且施用于需要治疗的同种异体受体。离体编辑的优势是允许明确定义靶细胞群,并且指定递送至细胞的治疗分子的特定剂量。当考虑脱靶修饰时,后一种考虑因素可能特别重要,因为滴定核酸酶的量可能会减少此类突变(Hsu等人,2013)。离体方法的另一个优势是通常可以实现的高编辑率,这是由于开发了将蛋白质和核酸递送到培养的细胞中以用于研究和基因疗法应用的高效递送系统。
经由组合物、系统和/或其组分的体内多核苷酸修饰涉及将组合物、系统和/或其组分直接递送至其天然组织中的细胞类型。经由组合物、系统和/或其组分的体内多核苷酸修饰允许治疗受影响的细胞群不适合离体操作的疾病。此外,将组合物、系统和/或其组分原位递送至细胞允许治疗多种组织和细胞类型。
在一个实施方案中,诸如使用病毒载体系统产生病毒颗粒以将组合物和/或其组分递送至细胞的那些实施方案,组合物和/或其组分的总货物大小应当被视为载体系统可以对可以由其表达和/或包装到病毒颗粒内的货物中的多核苷酸的大小有限制。在一个实施方案中,应当考虑载体系统(诸如病毒载体系统)的趋向性,因为它可以影响组合物或其组分可以高效地和/或有效地递送至的细胞类型。
当经由基于病毒的系统递送系统或其组分时,重要的是考虑实现治疗效果所需的病毒颗粒的量,以便考虑当递送至受试者或细胞时,病毒颗粒可能引发的潜在免疫反应。当经由基于病毒的系统递送系统或其组分时,重要的是考虑控制系统的体内分布和/或剂量的机制。一般来讲,为了减少脱靶效应的可能性,系统的量尽可能接近最小或最低有效剂量是最佳的,但不是必需的。实际上,这可能很难做到。
在一个实施方案中,重要的是考虑系统或其组分的免疫原性。在实施方案中,在涉及系统或其组分的免疫原性的情况下,可以降低系统或其组分的免疫原性。仅举例来说,可以使用Tangri等人中阐述的方法来降低系统或其组分的免疫原性。因此,定向进化或合理设计可以用于降低TnpB多肽在宿主物种(人或其他物种)中的免疫原性。
异种移植
本发明还考虑了本文所述的组合物(例如,TnpB多肽蛋白质系统)用于提供RNA指导的DNA核酸酶的用途,所述核酸酶适合用于提供用于移植的修饰组织。例如,RNA指导的DNA核酸酶可用于敲除、敲低或破坏动物(诸如转基因猪(诸如人血红素加氧酶-1转基因猪系))中选定的基因,例如通过破坏编码人类免疫系统识别的表位的基因(即,异种抗原基因)的表达。供破坏的候选猪基因可例如包括α(1,3)-半乳糖基转移酶和胞苷一磷酸-N-乙酰神经氨酸羟化酶基因(参见PCT专利公开WO 2014/066505)。此外,编码内源逆转录病毒的基因可被破坏,例如编码所有猪内源逆转录病毒的基因(参见Yang等人,2015,Genome-wideinactivation of porcine endogenous retroviruses(PERVs),Science 2015年11月27日:第350卷第6264期第1101-1104页)。此外,RNA指导的DNA核酸酶可用于靶向用于整合异种移植供体动物中的另外的基因(诸如人CD55基因)的位点,以提高针对超急性排斥的保护。
本发明的实施方案还涉及方法和组合物,所述方法和组合物涉及敲除基因、扩增基因和修复与DNA重复不稳定性和神经系统病症相关的特定突变(Robert D.Wells,TetsuoAshizawa,Genetic Instabilities and Neurological Diseases,Second Edition,Academic Press,2011年10月13日–Medical)。已经发现串联重复序列的特定特征与多于二十种人类疾病有关(New insights into repeat instability:role of RNA·DNAhybrids.McIvor EI,Polak U,Napierala M.RNA Biol.2010年9月至10月;7(5):551-8)。可以利用本发明的效应蛋白系统来校正这些基因组不稳定性的缺陷。
本发明的若干个另外的方面涉及校正与多种遗传疾病相关的缺陷,所述遗传疾病在美国国立卫生研究院的网站上的主题小节遗传病症(Genetic Disorders)下进一步描述(网站为health.nih.gov/topic/GeneticDisorders)。遗传性脑部疾病可包括但不限于肾上腺脑白质营养不良、胼胝体缺失、艾卡迪综合征(Aicardi Syndrome)、阿尔珀斯病(Alpers'Disease)、阿尔茨海默病、巴斯综合征(Barth Syndrome)、巴登氏病(BattenDisease)、CADASIL、小脑变性、法布里病、格斯特曼–斯特劳斯勒–申克病(Gerstmann-Straussler-Scheinker Disease)、亨廷顿病和其他三联体重复病症、雷氏病、莱希-尼亨综合征、孟克斯氏病(Menkes Disease)、线粒体肌病和NINDS空洞脑。这些疾病在美国国立卫生研究院网站的遗传性脑部病症小节中进一步描述。
在植物和真菌中的应用
本文所述的组合物、系统和方法可以用于在植物和真菌中执行基因或基因组询问或编辑或操纵。例如,应用包括植物基因或基因组的询问和/或选择和/或询问和/或比较和/或操纵和/或转化;例如,以创造、鉴定、发展、优化或赋予植物性状或特征,或者转化植物或真菌基因组。因此可以改善植物、具有新的性状或特征组合的新植物、或具有增强的性状的新植物的生产。组合物、系统和方法可以用于定点整合(SDI)或基因编辑(GE)或任何近反向育种(NRB)或反向育种(RB)技术中的植物。
本文的组合物、系统和方法可用于赋予基本上任何植物和真菌及其细胞和组织期望的性状(例如,营养质量增强、对疾病的抗性以及对生物和非生物胁迫的抗性增加、以及具有商业价值的植物产品或异源化合物的产量增加)。所述组合物、系统和方法可用于修饰内源基因或修饰其表达,而不将任何外来基因永久引入基因组中。
在一个实施方案中,组合物、系统和方法可用于植物中的基因组编辑或先前已使用RNAi或类似基因组编辑技术的情况;参见,例如,Nekrasov,“Plant genome editingmade easy:targeted mutagenesis in model and crop plants using the CRISPR-Cassystem,”Plant Methods2013,9:39(doi:10.1186/1746-4811-9-39);Brooks,“Efficientgene editing in tomato in the first generation using the CRISPR-Cas9 system,”Plant Physiology 2014年9月pp 114.247577;Shan,“Targeted genome modification ofcrop plants using a CRISPR-Cas system,”Nature Biotechnology 31,686-688(2013);Feng,“Efficient genome editing in plants using a CRISPR/Cas system,”CellResearch(2013)23:1229–1232.doi:10.1038/cr.2013.114;2013年8月20日在线发表;Xie,“RNA-guided genome editing in plants using a CRISPR-Cas system,”MolPlant.2013Nov;6(6):1975-83.doi:10.1093/mp/sst119.Epub 2013年8月17日;Xu,“Genetargeting using the Agrobacterium tumefaciens-mediated CRISPR-Cas systeminrice,”Rice 2014,7:5(2014),Zhou等人,“Exploiting SNPs for biallelic CRISPRmutations in the outcrossing woody perennial Populus reveals 4-coumarate:CoAligase specificity and Redundancy,”New Phytologist(2015)(Forum)1-4(仅可以在www.newphytologist.com在线获得);Caliando等人,“Targeted DNA degradation usinga CRISPR device stably carried in the host genome,NATURE COMMUNICATIONS 6:6989,DOI:10.1038/ncomms7989,www.nature.com/naturecommunications DOI:10.1038/ncomms7989;美国专利号6,603,061-Agrobacterium-Mediated Plant TransformationMethod;美国专利号7,868,149-Plant Genome Sequences and Uses Thereof和US2009/0100536-Transgenic Plants with Enhanced Agronomic Traits,Morrell等人“Cropgenomics:advances and applications,”Nat Rev Genet.2011年12月29日;13(2):85-96,所述文献各自的全部内容和公开内容通过引用整体并入本文。利用组合物、系统和方法的方面可以类似于在植物中使用组合物,并且提及了亚利桑那大学(University ofArizona)网站“CRISPR-PLANT”(genome.arizona.edu/crispr/)(由Penn State和AGI赞助)的对植物系统中的核酸修饰的指导。
组合物、系统和方法也可用于原生质体。“原生质体”是指一种植物细胞,使用例如机械或酶促方式完全或部分去除其保护性细胞壁,从而产生完整的活植物生化能力单位,所述单位可以在适当的生长条件下重新形成细胞壁、增殖和再生为完整的植物。
组合物、系统和方法可用于筛选感兴趣的基因(例如,内源基因、突变)。在一些实例中,感兴趣的基因包括编码涉及产生具有附加营养价值的组分的酶的那些基因,或者通常影响跨物种、门和植物界的感兴趣的农艺性状的基因。通过选择性地靶向例如编码代谢途径的酶的基因,可以鉴定负责植物的某些营养特征的基因。类似地,通过选择性地靶向可能影响期望的农艺性状的基因,可以鉴定相关基因。因此,本发明涵盖筛选编码酶的基因的方法,所述酶参与具有特定营养价值和/或农艺性状的化合物的生产。
还应当理解,除非另有说明,否则本文对动物细胞的提及经过必要的修改也可以适用于植物或真菌细胞;并且,本文的具有降低的脱靶效应的酶和采用此类酶的系统可以用于植物应用,包括本文提及的那些。
在一些情况下,引入植物和真菌的核酸可以针对在植物和真菌中的表达进行密码子优化。密码子优化的方法包括在Kwon KC,et al.,Codon Optimization to EnhanceExpression Yields Insights into Chloroplast Translation,Plant Physiol.2016年9月;172(1):62-77中描述的那些。
组合物和系统中的组分(例如,TnpB多肽)还可包含本文所述的一种或多种功能结构域。在一些实例中,功能结构域可以是核酸外切酶。此类核酸外切酶可以增加TnpB多肽功能的效率,例如诱变效率。功能结构域的一个实例是Trex2,如Weiss T等人,www.biorxiv.org/content/10.1101/2020.04.11.037572v1,doi:doi.org/10.1101/2020.04.11.037572中所述。
植物的实例
本文的组合物、系统和方法可以用于赋予基本上任何植物期望的性状。可以对多种植物和植物细胞系统进行工程化以获得期望的生理和农艺特征。一般来讲,术语“植物”涉及植物界的任何各种光合作用、真核、单细胞或多细胞生物体,其特征在于通过细胞分裂生长,含有叶绿体,并且具有由纤维素组成的细胞壁。术语植物涵盖单子叶植物和双子叶植物。
所述组合物、系统和方法可用于广泛的植物,诸如例如属于以下目的双子叶植物:木兰目(Magnoliales)、八角目(Illiciales)、樟目(Laurales)、胡椒目(Piperales)、马兜铃目(Aristochiales)、睡莲目(Nymphaeales)、毛茛目(Ranunculales)、罂粟目(Papeverales)、瓶子草科(Sarraceniaceae)、昆蓝树目(Trochodendrales)、金缕梅目(Hamamelidales)、杜仲目(Eucomiales)、塞子木目(Leitneriales)、杨梅目(Myricales)、山毛榉目(Fagales)、木麻黄目(Casuarinales)、石竹目(Caryophyllales)、肉穗果目(Batales)、蓼目(Polygonales)、蓝雪目(Plumbaginales)、五桠果目(Dilleniales)、山茶目(Theales)、锦葵目(Malvales)、荨麻目(Urticales)、玉蕊目(Lecythidales)、紫堇目(Violales)、杨柳目(Salicales)、白花菜目(Capparales)、杜鹃花目(Ericales)、岩梅目(Diapensales)、柿树目(Ebenales)、报春花目(Primulales)、蔷薇目(Rosales)、豆目(Fabales)、川草目(Podostemales)、小二仙草目(Haloragales)、桃金娘目(Myrtales)、山茱萸目(Cornales)、山龙眼目(Proteales)、檀香目(Santales)、大花草目(Rafflesiales)、卫矛目(Celastrales)、大戟目(Euphorbiales)、鼠李目(Rhamnales)、无患子目(Sapindales)、胡桃目(Juglandales)、牻牛儿苗目(Geraniales)、远志目(Polygalales)、伞形目(Umbellales)、龙胆目(Gentianales)、花葱目(Polemoniales)、唇形目(Lamiales)、车前草目(Plantaginales)、玄参目(Scrophulariales)、桔梗目(Campanulales)、茜草目(Rubiales)、川绿断目(Dipsacales)和菊目(Asterales);单子叶植物诸如属于以下目的那些:泽泻目(Alismatales)、水鳖目(Hydrocharitales)、茨藻目(Najadales)、霉草目(Triuridales)、鸭跖草目(Commelinales)、谷精草目(Eriocaulales)、帚灯草目(Restionales)、禾本目(Poales)、灯芯草目(Juncales)、莎草目(Cyperales)、香蒲目(Typhales)、凤梨目(Bromeliales)、姜目(Zingiberales)、棕榈目(Arecales)、巴拿马草目(Cyclanthales)、露兜树目(Pandanales)、天南星目(Arales)、百合目(Lilliales)、和蓝目(Orchidales),或属于裸子植物(Gymnospermae)的植物,例如属于以下目的那些:松目(Pinales)、银杏目(Ginkgoales)、苏铁目(Cycadales)、南洋杉目(Araucariales)和柏目(Cupressales)和买麻藤目(Gnetales)。
本文的组合物、系统和方法可以用于包括在下文的双子叶植物、单子叶植物或裸子植物属的非限制性列表中的广泛植物物种:颠茄属(Atropa)、油丹属(Alseodaphne)、腰果属(Anacardium)、落花生属(Arachis)、琼楠属(Beilschmiedia)、芸薹属(Brassica)、红花属(Carthamus)、木防己属(Cocculus)、巴豆属(Croton)、黄瓜属(Cucumis)、柑橘属(Citrus)、西瓜属(Citrullus)、辣椒属(Capsicum)、长春花属(Catharanthus)、椰子属(Cocos)、咖啡属(Coffea)、南瓜属(Cucurbita)、胡萝卜属(Daucus)、端心木属(Duguetia)、花菱草属(Eschscholzia)、榕属(Ficus)、草莓属(Fragaria)、海罂粟属(Glaucium)、大豆属(Glycine)、棉花属(Gossypium)、向日葵属(Helianthus)、橡胶树属(Hevea)、天仙子属(Hyoscyamus)、莴苣属(Lactuca)、卷枝藤属(Landolphia)、亚麻属(Linum)、木姜子属(Litsea)、番茄属(Lycopersicon)、羽扇豆属(Lupinus)、木薯属(Manihot)、墨角兰属(Majorana)、苹果属(Malus)、苜蓿属(Medicago)、烟草属(Nicotiana)、木犀榄属(Olea)、银胶菊属(Parthenium)、罂粟属(Papaver)、鳄梨属(Persea)、菜豆属(Phaseolus)、黄连木属(Pistacia)、豌豆属(Pisum)、梨属(Pyrus)、李属(Prunus)、萝卜属(Raphanus)、蓖麻属(Ricinus)、千里光属(Senecio)、风龙属(Sinomenium)、千金藤属(Stephania)、欧白芥属(Sinapis)、茄属((Solanum))、可可属(Theobroma)、三叶草属(Trifolium)、胡芦巴属(Trigonella)、野豌豆属(Vicia)、蔓长春花属(Vinca)、葡萄属(Vilis)和豇豆属(Vigna);以及葱属(Allium)、须芒草属(Andropogon)、画眉草属(Aragrostis)、天门冬属(Asparagus)、燕麦属(Avena)、狗牙根属(Cynodon)、油棕属(Elaeis)、羊茅属(Festuca)、羊毒麦属(Festulolium)、萱草属(Heterocallis)、大麦属(Hordeum)、浮萍属(Lemna)、黑麦草属(Lolium)、芭蕉属(Musa)、稻属(Oryza)、黍属(Panicum)、狼尾草属(Pannesetum)、梯牧草属(Phleum)、早熟禾属(Poa)、黑麦属(Secale)、高粱属(Sorghum)、小麦属(Triticum)、玉蜀黍属(Zea)、冷杉属(Abies)、杉木属(Cunninghamia)、麻黄属(Ephedra)、云杉属(Picea)、松属(Pinus)和黄杉属(Pseudotsuga)。
在一个实施方案中,用于工程化的目标植物和植物细胞包括那些单子叶植物和双子叶植物,诸如作物,包括谷类作物(例如,小麦、玉米、水稻、小米、大麦)、水果作物(例如,番茄、苹果、梨、草莓、橙子)、饲料作物(例如苜蓿)、块根蔬菜作物(例如,胡萝卜、马铃薯、甜菜、山药)、叶类蔬菜作物(例如,生菜、菠菜);开花植物(例如,矮牵牛、玫瑰、菊花)、针叶树和松树(例如,松杉、云杉);用于植物修复的植物(例如,积累重金属的植物);油料作物(例如,向日葵、油菜籽)和用于实验目的的植物(例如,拟南芥)。具体地,植物旨在包括但不限于被子植物和裸子植物,诸如金合欢、苜蓿、苋菜、苹果、杏、洋蓟、白蜡树、芦笋、鳄梨、香蕉、大麦、豆类、甜菜、桦树、山毛榉、黑莓、蓝莓、西兰花、抱子甘蓝、卷心菜、油菜、哈密瓜、胡萝卜、木薯、花椰菜、雪松、谷物、芹菜、板栗、樱桃、大白菜、柑橘、克莱门氏小柑橘(clementine)、三叶草、咖啡、玉米、棉花、豇豆、黄瓜、柏树、茄子、榆树、菊苣、桉树、茴香、无花果、冷杉、天竺葵、葡萄、葡萄柚、花生、地樱桃、树胶、毒堇、山核桃、羽衣甘蓝、猕猴桃、大头菜、落叶松、生菜、韭菜、柠檬、酸橙、刺槐、松树、孔雀草、玉米、芒果、枫树、甜瓜、小米、蘑菇、芥末、坚果、橡木、燕麦、油棕、秋葵、洋葱、橙子、观赏植物或花或树、木瓜、棕榈、欧芹、防风草、豌豆、桃子、花生、梨、泥炭、胡椒、柿子、木豆、松树、菠萝、大蕉、李子、石榴、马铃薯、南瓜(pumpkin)、菊苣、萝卜、油菜籽、覆盆子、水稻、黑麦、高粱、红花、黄华柳、大豆、菠菜、云杉、南瓜(squash)、草莓、甜菜、甘蔗、向日葵、红薯、甜玉米、橘子、茶、烟草、番茄、树木、黑小麦、草坪草、芜菁、藤蔓、核桃、豆瓣菜、西瓜、小麦、山药、红豆杉和西葫芦。
术语植物还涵盖藻类,藻类主要是光合自养生物,主要是由于缺乏根、叶和其他高等植物特有的器官。组合物、系统和方法可用于广泛的“藻类”或“藻类细胞”。藻类的实例包括真核门,包括红藻门(Rhodophyta)(红藻)、绿藻门(Chlorophyta)(绿藻)、褐藻门(Phaeophyta)(褐藻)、硅藻门(Bacillariophyta)(硅藻)、大眼藻门(Eustigmatophyta)和双鞭毛虫门(dinoflagellates)以及原核藻门蓝细菌门(Cyanobacteria)(蓝绿藻)。藻类物种的实例包括以下的那些:双耳瓶藻属(Amphora)、鱼腥藻属、针连藻属(Anikstrodesmis)、葡萄球藻属(Botryococcus)、角毛藻属(Chaetoceros)、衣藻属(Chlamydomonas)、小球藻属、绿球藻属(Chlorococcum)、小环藻属(Cyclotella)、细柱藻属(Cylindrotheca)、杜氏藻属(Dunaliella)、球石藻属(Emiliania)、裸藻属(Euglena)、红球藻属(Haematococcus)、等鞭藻属(Isochrysis)、单鞭藻属(Monochrysis)、单壳缝藻属(Monoraphidium)、微绿球藻属(Nannochloris)、微拟球藻属(Nannochloropsis)、舟形藻属(Navicula)、肾鞭藻属(Nephrochloris)、肾口藻属(Nephroselmis)、菱形藻属(Nitzschia)、节球藻属、念珠藻属、赭球藻属(Oochromonas)、卵胞藻属(Oocystis)、颤藻属、绿色巴夫藻属(Pavlova)、褐指藻属(Phaeodactylum)、扁藻属(Platymonas)、颗石藻属(Pleurochrysis)、紫菜属藻属(Porphyra)、假鱼腥藻属(Pseudoanabaena)、塔胞藻属(Pyramimonas)、丝藻藻属(Stichococcus)、聚球藻属、集胞藻属、四爿藻属、海链藻属(Thalassiosira)和束毛藻属(Trichodesmium)。
植物启动子
为了确保植物细胞中的适当表达,本文的组分和系统的组分可以置于植物启动子的控制下。植物启动子是在植物细胞中可操作的启动子。植物启动子能够在植物细胞中启动转录,无论其来源是否是植物细胞。设想使用不同类型的启动子。
在一些实例中,植物启动子是组成型植物启动子,其是能够在植物的所有或几乎所有发育阶段期间在所有或几乎所有植物组织中表达其控制的开放阅读框(ORF)的启动子(称为“组成型表达”)。组成型启动子的一个实例是花椰菜花叶病毒(cauliflower mosaicvirus)35S启动子。在一些实例中,植物启动子是非组成性地、但以时间和/或空间调控方式引导基因表达的受调控的启动子,并且包括组织特异性、组织优先型和诱导型启动子。不同的启动子可以引导基因在不同组织或细胞类型中,或在不同发育阶段,或响应不同环境条件进行表达。在一些实例中,植物启动子是组织偏好的启动子,其可以用于靶向特定植物组织内的某些细胞类型(例如叶或根中的维管细胞或种子的特定细胞)中的增强的表达。
示例性植物启动子包括从植物、植物病毒和细菌(诸如农杆菌或根瘤菌)获得的植物启动子,其包含在植物细胞中表达的基因。启动子的额外实例包括Kawamata等人,(1997)Plant Cell Physiol 38:792-803;Yamamoto等人,(1997)Plant J 12:255-65;Hire等人,(1992)Plant Mol Biol 20:207-18、Kuster等人,(1995)Plant Mol Biol 29:759-72和Capana等人,(1994)Plant Mol Biol 25:681 -91中描述的那些。
在一些实例中,植物启动子可以是诱导型启动子,其是诱导型的并且允许基因编辑或基因表达的时空控制可以使用某种形式的能量。能量的形式可以包括声能、电磁辐射、化学能和/或热能。诱导型系统的实例包括四环素诱导型启动子(Tet-On或Tet-Off)、小分子双杂交转录活化系统(FKBP、ABA等)或光诱导型系统(光敏色素、LOV结构域或隐花色素),诸如以序列特异性方式引导转录活性变化的光诱导型转录效应子(LITE)。在特定的实例中,光诱导型系统的组分包括TnpB多肽、光反应性细胞色素异源二聚体(例如来自拟南芥)和转录活化/阻遏结构域。
在一些实例中,启动子可以是化学调控启动子(其中外源化学物质的应用诱导基因表达)或化学阻遏型启动子(其中化学物质的应用阻遏基因表达)。化学诱导型启动子的实例包括玉米ln2-2启动子(由苯磺酰胺除草剂安全剂活化)、玉米GST启动子(由用作芽前除草剂的疏水性亲电子化合物活化)、烟草PR-1a启动子(由水杨酸活化),受抗生素调控的启动子(诸如四环素诱导型和四环素阻遏型启动子)。
稳定整合到植物基因组中
在一个实施方案中,可以引入编码组合物和系统的组分的多核苷酸以稳定整合到植物细胞的基因组中。在一些情况下,载体或表达系统可用于此类整合。载体或表达系统的设计可以根据核酸组分分子和/或TnpB多肽基因表达的时间、地点和条件进行调整。在一些情况下,多核苷酸可以整合到植物的细胞器(诸如质体、线粒体或叶绿体)中。表达系统的元件可以位于一种或多种表达构建体上,所述表达构建体是环状的,诸如质粒或转化载体,或者是非环状的,诸如线性双链DNA。
在一个实施方案中,整合方法通常包括以下步骤:选择合适的宿主细胞或宿主组织,将构建体引入宿主细胞或宿主组织中,以及由其重新产生植物细胞或植物。在一些实例中,用于稳定整合到植物细胞基因组中的表达系统可以含有以下元件中的一种或多种:可用于在植物细胞中表达RNA和/或TnpB多肽的启动子元件;增强表达的5'非翻译区;进一步增强某些细胞(诸如单子叶植物细胞)中的表达的内含子元件;多克隆位点,其为插入核酸组分分子和/或TnpB多肽基因序列和其他期望元件提供方便的限制性位点;以及3'非翻译区,其提供表达的转录物的高效终止。
植物中的瞬时表达
在一个实施方案中,组合物和系统的组分可以在植物细胞中瞬时表达。在一些实例中,仅当核酸组分分子和TnpB多肽都存在于细胞中时,组合物和系统才可以修饰靶核酸,使得可以进一步控制基因组修饰。由于TnpB多肽的表达是瞬时的,因此由此类植物细胞重新产生的植物通常不含有外来DNA。在某些实例中,TnpB多肽被稳定表达并且核酸组分分子序列被瞬时表达。
可以将DNA和/或RNA(例如mRNA)引入植物细胞中用于瞬时表达。在此类情况下,引入的核酸可以以足够的量提供以修饰细胞,但在经过预期的时间段后或在一次或多次细胞分裂后不会持续存在。
瞬时表达可以使用合适的载体来实现。可用于瞬时表达的示例性载体包括pEAQ载体(可以针对农杆菌介导的瞬时表达进行调整)和卷心菜卷叶病毒(CaLCuV),以及Sainsbury F.等人,Plant Biotechnol J.2009年9月;7(7):682-93;和Yin K等人,Scientific Reports第5卷,文章编号:14926(2015)中描述的载体。
还设想了上述不同方法的组合。
易位至特定植物细胞器和/或在特定植物细胞器中表达
本文的组合物和系统可以包含用于易位至特定植物细胞器和/或在特定植物细胞器中表达的元件。
叶绿体靶向
在一个实施方案中,设想组合物和系统用于特异性修饰叶绿体基因或确保叶绿体中的表达。组合物和系统(例如,TnpB多肽、核酸组分、或其编码多核苷酸)可以被转化、区室化和/或靶向至叶绿体。在一个实例中,在质体基因组中引入遗传修饰可以减少生物安全问题,诸如通过花粉的基因流动。
叶绿体转化方法的实例包括颗粒轰击、PEG处理和显微注射,以及将转化盒从核基因组易位至质体。在一些实例中,叶绿体的靶向可以通过将编码叶绿体转运肽(CTP)或质体转运肽的序列掺入叶绿体定位序列和/或表达构建体中来实现,所述序列可操作地连接至编码组合物和系统的组分的序列的5’区域。叶绿体的转化、靶向和定位的额外实例包括WO2010061186、Protein Transport into Chloroplasts,2010,Annual Review of PlantBiology,第61卷:157-180和US20040142476中描述的那些,其通过引用整体并入本文。
植物中的示例性应用
组合物、系统和方法可用于在感兴趣的植物(例如作物)中产生遗传变异。可以提供靶向基因组中的一个或多个位置的一种或多种核酸组分,例如核酸组分文库,并将其与TnpB多肽一起引入植物细胞中。例如,可以产生基因组规模的点突变和基因敲除的集合。在一些实例中,组合物、系统和方法可用于从如此获得的细胞产生植物部分或植物并且筛选细胞的感兴趣性状。靶基因可以包括编码区和非编码区。在一些情况下,性状是胁迫耐受性并且方法是用于产生胁迫耐受性作物品种的方法。
在一个实施方案中,组合物、系统和方法用于修饰内源基因或修饰其表达。组分的表达可以通过TnpB多肽的直接活性和任选地重组模板DNA的引入,或者通过靶向基因的修饰来诱导基因组的靶向修饰。上文所述的不同策略允许TnpB多肽介导的靶向基因组编辑,而不需要将组分引入植物基因组中。
在一些情况下,可以在不将任何外来基因(包括编码本文的组合物组分的那些基因)永久引入植物基因组的情况下进行修饰,以避免植物基因组中存在外来DNA。这可能会令人感兴趣,因为对非转基因植物的监管要求不太严格。瞬时引入植物细胞的组分通常在杂交时被去除。
例如,修饰可以通过组合物和系统的组分的瞬时表达来执行。瞬时表达可以通过用病毒载体递送组合物和系统的组分、借助颗粒分子(诸如纳米颗粒或CPP)递送至原生质体来执行。
产生具有期望性状的植物
本文的组合物、系统和方法可用于将期望的性状引入植物。方法包括引入一个或多个外来基因以赋予感兴趣的性状,编辑或调节内源基因以赋予感兴趣的性状。
农艺性状
在一个实施方案中,可以通过影响特定植物性状来改良作物植物。性状的实例包括改良的农艺性状,诸如除草剂抗性、抗病性、非生物胁迫耐受性、高产量和优异的质量、杀虫剂抗性、抗病性、昆虫和线虫抗性、对寄生杂草的抗性、耐旱性、营养价值、胁迫耐受性、自花授粉无效性、饲料消化率生物量和谷物产量。
在一个实施方案中,可以将赋予对害虫或疾病的抗性的基因引入植物中。在存在赋予植物这种抗性的内源基因的情况下,可以增强它们的表达和功能(例如,通过引入额外的拷贝、增强表达和/或活性的修饰)。
赋予抗性的基因的实例包括植物抗病性基因(例如,Cf-9、Pto、RSP2、SlDMR6-1)、赋予害虫抗性的基因(例如,WO96/30517中描述的那些)、苏云金芽孢杆菌蛋白、凝集素、维生素结合蛋白(例如,亲和素)、酶抑制剂(例如,蛋白酶(protease)或蛋白酶(proteinase)抑制剂或淀粉酶抑制剂)、昆虫特异性激素或信息素(例如,蜕皮类固醇或保幼激素、其变体、基于其的模拟物或其拮抗剂或激动剂)或涉及此类激素和信息素的产生和调控的基因、昆虫特异性肽或神经肽、昆虫特异性毒液(例如,由蛇、黄蜂等产生的毒液或其类似物)、负责单萜、倍半萜、类固醇、异羟肟酸、苯基丙酸类衍生物或具有杀虫活性的另一种非蛋白质分子的超积累的酶、参与生物活性分子修饰的酶(例如,糖酵解酶、蛋白水解酶、脂解酶、核酸酶、环化酶、转氨酶、酯酶、水解酶、磷酸酶、激酶、磷酸化酶、聚合酶、弹性蛋白酶、几丁质酶和葡聚糖酶,无论是天然的还是合成的)、刺激信号转导的分子、病毒侵入性蛋白质或由其衍生的复杂毒素、由病原体或寄生虫在自然界中产生的发育阻滞蛋白、由植物在自然界中产生的发育阻滞蛋白、或其任何组合。
组合物、系统和方法可用于鉴定、筛选、引入或去除导致遗传变异性的突变或序列,所述遗传变异性引起对某些病原体(例如,宿主特异性病原体)的易感性。此种方法可以产生非宿主抗性的植物,例如,宿主和病原体不相容,或者可以对病原体的所有种族具有部分抗性,这通常由许多基因控制且/或还对病原体的一些种族具有完全抗性但对其他种族不具有完全抗性。
在一个实施方案中,组合物、系统和方法可用于修饰涉及植物疾病的基因。可以将此类基因去除、失活或以其他方式调控或修饰。植物疾病的实例包括US20140213619A1的[0045]-[0080]中描述的那些,所述文献通过引用整体并入本文。
在一个实施方案中,可以将赋予对除草剂的抗性的基因引入植物中。赋予除草剂抗性的基因的实例包括赋予对抑制生长点或分生组织的除草剂(诸如咪唑啉酮或磺酰脲)的抗性的基因、赋予草甘膦耐受性(例如,分别由例如突变体5-烯醇丙酮莽草酸-3-磷酸合酶基因、aroA基因和草甘膦乙酰转移酶(GAT)基因赋予的抗性),或诸如通过草铵膦赋予对其他膦酰基化合物的抗性(来自链霉菌属物种(包括吸水链霉菌和绿色产色链霉菌)的草丁膦乙酰转移酶(PAT)基因)并且通过ACC酶抑制剂编码基因赋予对吡啶氧基或苯氧基丙酸和环己酮的抗性的基因、赋予对抑制光合作用的除草剂(诸如三嗪(psbA和gs+基因)或苯甲腈(腈水解酶基因)和谷胱甘肽S-转移酶)的抗性的基因、编码除草剂解毒酶或对抑制具有抗性的突变体谷氨酰胺合酶的基因、编码作为编码草胺膦乙酰转移酶的酶(诸如来自链霉菌属物种的bar或pat蛋白)的解毒酶的基因、编码羟苯基丙酮酸双加氧酶(HPPD)抑制剂(例如天然存在的HPPD抗性酶)的基因以及编码突变或嵌合HPPD酶的基因。
在一个实施方案中,可以将涉及非生物胁迫耐受性的基因引入植物中。基因的实例包括能够降低聚(ADP-核糖)聚合酶(PARP)基因的表达和/或活性的基因、能够降低PARG编码基因的表达和/或活性的转基因、编码烟酰胺腺嘌呤二核苷酸挽救合成途径的植物功能酶的基因,所述植物功能酶包括烟酰胺酶、烟酸磷酸核糖基转移酶、烟酸单核苷酸腺苷转移酶、烟酰胺腺嘌呤二核苷酸合酶或烟碱酰胺磷酸糖基转移酶、参与碳水化合物生物合成的酶、参与多聚果糖(例如,菊粉和果聚糖型)生产、α-1,6支链α-1,4-葡聚糖生产、交替糖(alternan)生产、透明质酸生产的酶。
在一个实施方案中,可以将改善耐旱性的基因引入植物中。基因的实例:泛素蛋白连接酶蛋白(UPL)蛋白(UPL3)、DR02、DR03、ABC转运蛋白和DREB1A。
营养改良植物
在一个实施方案中,组合物、系统和方法可用于产生营养改良的植物。在一些实例中,此类植物可提供功能食品,例如可提供超出其含有的传统营养的健康益处的改良食品或食品成分。在某些实例中,此类植物可提供营养食品,例如可以被认为是食品或食品的一部分并且提供健康益处(包括预防和治疗疾病)的物质。营养食品可用于预防和/或治疗动物和人类的疾病,例如癌症、糖尿病、心血管疾病和高血压。
改良的植物可以天然地产生一种或多种期望的化合物,并且修饰可以增强化合物的水平或活性或质量。在一些情况下,改良的植物可能不会天然产生化合物,而修饰使植物能够产生此类化合物。在一些情况下,组合物、系统和方法用于间接修饰这些化合物的内源合成,例如通过修饰控制这种化合物代谢的一种或多种转录因子。
营养改良的植物的实例包括包含以下的植物:改变的蛋白质质量、含量和/或氨基酸组成、必需氨基酸含量、油和脂肪酸、碳水化合物、维生素和类胡萝卜素、功能性次生代谢物和矿物质。在一些实例中,改良的植物可以包含或产生具有健康益处的化合物。营养改良的植物的实例包括Newell-McGloughlin,Plant Physiology,2008年7月,第147卷,第939–953页中描述的那些。
可以产生的化合物的实例包括类胡萝卜素(例如,α-胡萝卜素或β-胡萝卜素)、叶黄素、番茄红素、玉米黄质、膳食纤维(例如,不溶性纤维、β-葡聚糖、可溶性纤维、脂肪酸(例如,ω-3脂肪酸、共轭亚油酸、GLA)、类黄酮(例如,羟基肉桂酸盐、黄酮醇、儿茶素和丹宁)、芥子油甙、吲哚、异硫氰酸酯(例如,萝卜硫素)、酚类(例如,二苯乙烯、咖啡酸和阿魏酸、表儿茶素)、植物甾烷醇/甾醇、果聚糖、菊粉、低聚果糖、皂苷、大豆蛋白、植物雌激素(例如异黄酮、木酚素)、硫化物和硫醇,诸如二烯丙基硫化物、烯丙基甲基三硫化物、二硫硫酮、丹宁,诸如原花色素,或其任何组合。
组合物、系统和方法还可用于改变蛋白质/淀粉功能性、保质期、味道/美观、纤维质量和过敏原、抗营养素和毒素减少性状。
可以经修饰以引入性状的基因和核酸的实例包括硬脂基-ACP去饱和酶、与可能导致以低植酸水平为特征的玉米突变体的单一等位基因相关的DNA、Tf RAP2.2及其相互作用配偶体SINAT2、Tf Dof1和DOF Tf AtDof1.1(OBP2)。
多倍体植物的修饰
组合物、系统和方法可用于修饰多倍体植物。多倍体植物携带其基因组的重复拷贝(例如多达六个,诸如小麦)。在一些情况下,组合物、系统和方法可以被多重化以影响基因的所有拷贝或同时靶向数十个基因。例如,组合物、系统和方法可用于同时确保负责抑制对疾病的防御的不同基因中的功能突变的丧失。所述修饰可以同时抑制小麦植物细胞中的TaMLO-Al、TaMLO-Bl和TaMLO-Dl核酸序列的表达,并且由小麦植物细胞重新产生小麦植物,以便确保小麦植物对白粉病有抗性(例如,如WO2015109752所述)。
果实成熟的调控
组合物、系统和方法可用于调控水果的成熟。成熟是水果和蔬菜熟化过程中的正常阶段。仅在其开始几天后,它就可能使水果或蔬菜无法食用,这可能给农民和消费者带来显著损失。
在一个实施方案中,组合物、系统和方法用于减少乙烯产量。在一些实例中,组合物、系统和方法可用于抑制ACC合酶的表达和/或活性、插入ACC脱氨酶基因或其功能片段、插入SAM水解酶基因或其功能片段、抑制ACC氧化酶基因表达。
或者或另外,组合物、系统和方法可用于修饰乙烯受体(例如,抑制ETR1)和/或多聚半乳糖醛酸酶(PG)。基因的抑制可以通过将突变、反义序列和/或基因的截短拷贝引入基因组来实现。
延长植物的储存寿命
在一个实施方案中,组合物、系统和方法用于修饰参与影响植物或植物部分的储存寿命的化合物的产生的基因。所述修饰可能在阻止马铃薯块茎中的还原糖积累的基因中。高温加工后,这些还原糖与游离氨基酸发生反应,产生棕色、苦味的产物,并且导致丙烯酰胺水平升高,丙烯酰胺是一种潜在的致癌物质。在特定的实施方案中,本文提供的方法用于减少或抑制液泡转化酶基因(VInv)的表达,所述基因编码将蔗糖分解为葡萄糖和果糖的蛋白质。
减少植物中的过敏原
在一个实施方案中,组合物、系统和方法用于产生过敏原水平降低的植物,使它们对消费者来说更安全。为此,组合物、系统和方法可用于鉴定和修饰(例如,抑制)负责植物过敏原产生的一种或多种基因。此类基因的实例包括Lol p5,以及花生、大豆、扁豆、豌豆、羽扇豆、绿豆(green bean)、绿豆(mung bean)中的基因,诸如Nicolaou等人,CurrentOpinion in Allergy and Clinical Immunology2011;11(3):222)中描述的那些,所述文献通过引用整体并入本文。
雄性不育植物的产生
组合物、系统和方法可用于产生雄性不育植物。与近交植物相比,杂交植物通常具有有利的农艺性状。然而,对于自花授粉植物来说,杂交品种的产生可能具有挑战性。在不同的植物类型(例如,玉米和水稻)中,已经鉴定出对于植物育性、更特别地雄性育性重要的基因。如此遗传改造的植物可以用于杂交育种计划。
组合物、系统和方法可用于修饰涉及雄性育性的基因,例如使雄性育性所需的基因失活(诸如通过引入突变)。涉及雄性育性的基因的实例包括细胞色素P450样基因(MS26)或大范围核酸酶基因(MS45),以及Wan X等人,Mol Plant.2019年3月4日;12(3):321-342;和Kim YJ,等人,Trends Plant Sci.2018年1月;23(1):53-65中描述的那些基因。
增加植物的育性阶段
在一个实施方案中,组合物、系统和方法可用于延长植物(诸如水稻)的育性阶段。例如,可以靶向水稻育性阶段基因,诸如Ehd3,以便在基因中产生突变,并且可以选择再生植物育性阶段延长的小植株。
产物的早期产量的生产
在一个实施方案中,组合物、系统和方法可用于产生产物的早期产量。例如,可以例如通过使开花阻遏基因诸如SP5G突变来调节开花过程。此类方法的实例包括Soyk S等人,Nat Genet.2017年1月;49(1):162-168中描述的那些。
油和生物燃料生产
组合物、系统和方法可用于产生用于生产油和生物燃料的植物。生物燃料包括由植物和植物源性资源制成的燃料。生物燃料可以从有机物中提取,所述有机物的能量是通过碳固定过程获得的,或者是通过生物质的使用或转化制成的。这种生物质可以直接用于生物燃料,或者可以通过热转化、化学转化和生化转化来转化为方便的含能物质。这种生物质转化可以产生固体、液体或气体形式的燃料。生物燃料包括生物乙醇和生物柴油。生物乙醇可以通过纤维素(淀粉)的糖发酵过程生产,所述纤维素可以来源于玉米和甘蔗。生物柴油可以由油料作物(诸如油菜籽、棕榈和大豆)生产。生物燃料可以用于运输。
用于生产植物油和生物燃料的植物的产生
组合物、系统和方法可用于产生表达或过表达高水平的油或生物燃料的藻类(例如,硅藻)和其他植物(例如,葡萄)。
在一些情况下,组合物、系统和方法可用于修饰参与脂质数量和/或脂质质量的修饰的基因。此类基因的实例包括参与脂肪酸合成途径的基因,例如乙酰辅酶A羧化酶、脂肪酸合酶、3-酮脂酰基_酰基-载体蛋白合酶III、甘油-3-磷酸脱氢酶(G3PDH)、烯酰基-酰基载体蛋白还原酶(烯酰基-ACP-还原酶)、甘油-3-磷酸酰基转移酶、溶血磷脂酰基转移酶或二酰基甘油酰基转移酶、磷脂:二酰基甘油酰基转移酶、磷脂酸磷酸酶、脂肪酸硫酯酶,诸如棕榈酰蛋白硫酯酶、或苹果酸酶活性。
在其他实施方案中,设想产生具有增加的脂质积累的硅藻。这可以通过靶向减少脂质分解代谢的基因来实现。基因的实例包括参与三酰基甘油和游离脂肪酸的活化、脂肪酸的β-氧化的基因,诸如乙酰辅酶A合酶、3-酮酰基辅酶A硫解酶、乙酰辅酶A氧化酶活性和葡萄糖磷酸变位酶的基因。
在一些实例中,可以对藻类进行修饰以生产油和生物燃料,包括脂肪酸(例如脂肪酸酯,诸如脂肪酸甲酯(FAME)和脂肪酸乙酯(FAEE))。修饰微藻的方法的实例包括Stovicek等人Metab.Eng.Comm.,2015;2:1;美国专利号8,945,839;和国际专利公开号WO 2015/086795中所述的方法。
在一些实例中,可以将一个或多个基因引入至植物(例如,藻类)(例如,在其中过表达)以由碳源(例如,醇)生产油和生物燃料(例如,脂肪酸)。基因的实例包括编码以下的基因:乙酰辅酶A合酶、酯合酶、硫酯酶(例如,tesA、'tesA、tesB、fatB、fatB2、fatB3、fatAl或fatA)、乙酰辅酶A合酶(例如,fadD、JadK、BH3103、pfl-4354、EAV15023、fadDl、fadD2、RPC_4074、fadDD35、fadDD22、faa39)、酯合酶(例如来自以下的合酶/乙酰辅酶A:二酰基甘油酰基转移酶:油蜡树(Simmondsia chinensis)、不动杆菌属某种ADP、泊库岛食烷菌(Alcanivorax borkumensis)、铜绿假单胞菌、海洋螺菌(Fundibacter jadensis)、拟南芥或真养产碱杆菌(Alkaligenes eutrophus)或其变体)。
另外或或者,植物(例如,藻类)中的一个或多个基因可以失活(例如,基因的表达降低)。例如,可以将一种或多种突变引入基因中。此类基因的实例包括编码以下的基因:乙酰辅酶A脱氢酶(例如,fade)、外膜蛋白受体和脂肪酸生物合成的转录调控子(例如,阻遏子)(例如,fabR)、丙酮酸甲酸裂解酶(例如,pflB)、乳酸脱氢酶(例如,IdhA)。
有机酸生产
在一个实施方案中,可以对植物进行修饰以产生有机酸,诸如乳酸。植物可以利用糖、戊糖或己糖产生有机酸。为此,可以将一个或多个基因引入植物中(例如,并且在其中过表达)。此类基因的实例包括LDH基因。
在一些实例中,一个或多个基因可以失活(例如,基因的表达降低)。例如,可以将一种或多种突变引入基因中。基因可包括编码参与内源代谢途径的蛋白质的那些基因,所述内源代谢途径产生除感兴趣的有机酸之外的代谢物和/或其中内源代谢途径消耗有机酸。
可以修饰或引入的基因的实例包括编码以下的那些基因:丙酮酸脱羧酶(pdc)、富马酸还原酶、醇脱氢酶(adh)、乙醛脱氢酶、磷酸烯醇丙酮酸羧化酶(ppc)、D-乳酸脱氢酶(d-ldh)、L-乳酸脱氢酶(l-ldh)、乳酸2-单加氧酶、乳酸脱氢酶、细胞色素依赖性乳酸脱氢酶(例如,细胞色素B2依赖性L-乳酸脱氢酶)。
增强生物燃料生产的植物性质
在一个实施方案中,组合物、系统和方法用于改变植物细胞壁的性质,以促进关键水解剂的进入,从而更有效地释放用于发酵的糖。通过减少植物中木质素的比例,可以增加纤维素的比例。在特定的实施方案中,可以下调植物中的木质素生物合成以增加可发酵碳水化合物。
在一些实例中,可以下调一种或多种木质素生物合成基因。此类基因的实例包括4-香豆酸3-羟化酶(C3H)、苯丙氨酸解氨酶(PAL)、肉桂酸4-羟化酶(C4H)、羟基肉桂酰转移酶(HCT)、咖啡酸O-甲基转移酶(COMT)、咖啡酰辅酶A 3-O-甲基转移酶(CCoAOMT)、阿魏酸5-羟化酶(F5H)、肉桂醇脱氢酶(CAD)、肉桂酰辅酶A还原酶(CCR)、4-香豆酸辅酶A连接酶(4CL)、单木质醇-木质素特异性糖基转移酶和醛脱氢酶(ALDH),以及WO 2008064289中描述的那些。
在一些实例中,可以减少在发酵期间产生较低水平乙酸的植物质量。为此,可以使参与多糖乙酰化的基因(例如,Cas1L和WO 2010096488中描述的那些)失活。
用于油和生物燃料生产的其他微生物
在一个实施方案中,除植物之外的微生物可用于使用本文的组合物、系统和方法生产油和生物燃料。微生物的实例包括以下属的那些:埃希氏菌属、芽孢杆菌属、乳杆菌属(Lactobacillus)、红球菌属、聚球藻属、集胞藻属、假单胞菌属、曲霉属、木霉属、脉孢菌属(Neurospora)、镰刀菌属(Fusarium)、腐质霉属(Humicola)、根毛霉属(Rhizomucor)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、毛霉属(Mucor)、蚀丝霉属(Myceliophtora)、青霉属(Penicillium)、原毛平革菌属(Phanerochaete)、侧耳属(Pleurotus)、栓菌属(Trametes)、金孢属(Chrysosporium)、酵母属(Saccharomyces)、寡养单胞菌属(Stenotrophamonas)、裂殖酵母属(Schizosaccharomyces)、耶氏酵母属(Yarrowia)或链霉菌属。
植物培养和再生
在一个实施方案中,可以培养修饰的植物或植物细胞以再生具有转化或修饰的基因型并因此具有期望表型的完整植物。再生技术的实例包括依赖于组织培养生长培养基中某些植物激素的操纵的再生技术、依赖于与期望的核苷酸序列一起引入的杀生物剂和/或除草剂标志物的再生技术、从培养的原生质体、植物愈伤组织、外植体、器官、花粉、胚芽或其部分获得的再生技术。
检测植物基因组选择性标志物中的修饰
当组合物、系统和方法用于修饰植物时,可以使用合适的方法来确认并检测在植物中进行的修饰。在一些实例中,当进行多种修饰时,可以选择并检测一种或多种期望的修饰或由所述修饰产生的性状。检测和确认可以通过生化和分子生物学技术执行,诸如Southern分析、PCR、Northern印迹、S1 RNA酶保护、引物延伸或逆转录酶-PCR、酶测定、核酶活性、凝胶电泳、蛋白质印迹、免疫沉淀、酶联免疫测定、原位杂交、酶染色和免疫染色。
在一些情况下,可以将一种或多种标志物(诸如选择性标志物和可检测标志物)引入植物中。此类标志物可用于选择、监测、分离具有期望修饰和性状的细胞和植物。选择性标志物可以赋予正选择或负选择,并且以外部底物的存在为条件或不以外部底物的存在为条件。此类标志物的实例包括赋予抗生素(诸如潮霉素(hpt)和卡那霉素(nptII))抗性的基因和蛋白质以及赋予除草剂(诸如草丁膦(bar)和氯磺隆(als))抗性的基因、能够产生或加工有色物质的酶(例如,β-葡萄糖醛酸酶、荧光素酶、B或C1基因)。
在真菌中的应用
本文所述的组合物、系统和方法可以用于在真菌或真菌细胞(诸如酵母)中执行有效且具有成本效益的基因或基因组询问或编辑或操纵。在植物中的方法和应用也可以应用于真菌。
真菌细胞可以是真菌界内的任何类型的真核细胞,诸如子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、芽枝霉门(Blastocladiomycota)、壶菌门(Chytridiomycota)、球囊菌门(Glomeromycota)、微孢子虫门(Microsporidia)和新美鞭菌门(Neocallimastigomycota)。真菌或真菌细胞的实例包括酵母、霉菌和丝状真菌。
在一个实施方案中,真菌细胞是酵母细胞。酵母细胞是指子囊菌门和担子菌门内的任何真菌细胞。酵母的实例包括出芽酵母、裂殖酵母和霉菌、酿酒酵母(S.cerervisiae)、马克斯克鲁维酵母(Kluyveromyces marxianus)或东方伊萨酵母(Issatchenkiaorientalis)、念珠菌属某些种(例如,白色念珠菌)、耶氏酵母属某些种(例如,解脂耶氏酵母(Yarrowia lipolytica))、毕赤酵母属某些种(例如,巴斯德毕赤酵母(Pichiapastoris))、克鲁维酵母属某些种(例如,乳酸克鲁维酵母(Kluyveromyces lactis)和马克斯克鲁维酵母)、脉孢菌属某些种(例如,粗糙脉孢菌(Neurospora crassa))、镰刀菌属某些种(例如,尖孢镰刀菌(Fusarium oxysporum))和伊萨酵母属某些种(Issatchenkia spp.)(例如,东方伊萨酵母、毕赤酵母(Pichia kudriavzevii)和耐热酵母(Candidaacidothermophilum))。
在一个实施方案中,真菌细胞是丝状真菌细胞,其以丝状生长,例如菌丝或菌丝体。丝状真菌细胞的实例包括曲霉属某些种(例如,黑曲霉(Aspergillus niger))、木霉属某些种(例如,里氏木霉(Trichoderma reesei))、根霉属某些种(例如,米根霉(Rhizopusoryzae))和被孢霉属某些种(Mortierella spp.)(例如,深黄被孢霉(Mortierellaisabellina))。
在一个实施方案中,真菌细胞是工业菌株。“工业菌株”包括在工业过程(例如以商业或工业规模生产产品)中使用或从所述工业过程中分离的任何真菌细胞菌株。工业菌株可指代通常用于工业过程的真菌物种,或者它可指代也可用于非工业目的(例如,实验室研究)的真菌物种的分离株。工业过程的实例包括发酵(例如,在食品或饮料产品的生产中)、蒸馏、生物燃料生产、化合物的生产和多肽的生产。工业菌株的实例包括但不限于JAY270和ATCC4124。
在一个实施方案中,真菌细胞是多倍体细胞,其基因组以多于一个拷贝存在。多倍体细胞包括以多倍体状态天然存在的细胞以及已经被诱导从而以多倍体状态存在(例如,通过减数分裂、胞质分裂或DNA复制的特定调控、改变、失活、活化或修饰)的细胞。多倍体细胞可以是其整个基因组是多倍体的细胞,或者是在特定感兴趣的基因组基因座中是多倍体的细胞。在一些实例中,在多倍体细胞的基因组工程中,核酸组分分子的丰度可能比在单倍体细胞中更经常是限速组分,因此使用本文所述的组合物的方法可利用使用某些真菌细胞类型。
在一个实施方案中,真菌细胞是二倍体细胞,其基因组以两个拷贝存在。二倍体细胞包括以二倍体状态天然存在的细胞以及已经被诱导从而以二倍体状态存在(例如,通过减数分裂、胞质分裂或DNA复制的特定调控、改变、失活、活化或修饰)的细胞。二倍体细胞可指代其整个基因组是二倍体的细胞,或者它可指代在特定感兴趣的基因组基因座中是二倍体的细胞。
在一个实施方案中,真菌细胞是单倍体细胞,其基因组以一个拷贝存在。单倍体细胞包括以单倍体状态天然存在的细胞以及已经被诱导从而以单倍体状态存在(例如,通过减数分裂、胞质分裂或DNA复制的特定调控、改变、失活、活化或修饰)的细胞。单倍体细胞可指代其整个基因组是单倍体的细胞,或者它可指代在特定感兴趣的基因组基因座中是单倍体的细胞。
可以使用本文的递送系统和方法将组合物和系统以及编码所述组合物和系统的核酸引入真菌细胞。递送系统的实例包括乙酸锂处理、轰击、电穿孔以及Kawai等人,2010,Bioeng Bugs.2010年11月至12月;1(6):395–403中描述的那些。
在一些实例中,可以使用酵母表达载体(例如,具有一种或多种调控元件的那些)。此类载体的实例包括着丝粒(CEN)序列、自主复制序列(ARS)、启动子(诸如与感兴趣的序列或基因可操作地连接的RNA聚合酶III启动子)、终止子(诸如RNA聚合酶III终止子)、复制起点和标记基因(例如营养缺陷型、抗生素或其他可选择标志物)。用于酵母的表达载体的实例可以包括质粒、酵母人工染色体、2μ质粒、酵母整合型质粒、酵母复制型质粒、穿梭载体和附加型质粒。
真菌的生物燃料和材料生产
在一个实施方案中,组合物、系统和方法可用于产生用于生物燃料和材料生产的修饰的真菌。例如,修饰的真菌用于由可发酵糖生产生物燃料或生物聚合物,并且任选地能够降解来源于作为可发酵糖来源的农业废物的植物源性木质纤维素。可以将生物燃料生产和合成所需的外来基因引入真菌中。在一些实例中,所述基因可编码参与以下的酶:将丙酮酸转化为乙醇或另一种感兴趣的产物、降解纤维素(例如,纤维素酶)、生物燃料生产途径竞争的内源代谢途径。
在一些实例中,组合物、系统和方法可用于产生和/或选择具有改善的木糖或纤维二糖利用、类异戊二烯生物合成和/或乳酸生产的酵母菌株。可以对参与这些化合物的代谢和合成的一个或多个基因进行修饰和/或将其引入酵母细胞中。方法和基因的实例包括乳酸脱氢酶、PDC1和PDC5,以及Ha,S.J.等人(2011)Proc.Natl.Acad.Sci.USA 108(2):504-9和Galazka,J.M.等人(2010)Science 330(6000):84-6;T等人,MetabEng.2015年3月;28:213-222;Stovicek V,等人,FEMS Yeast Res.2017年8月1日;17(5)中描述的那些。
改良的植物和酵母细胞
本公开还提供了改良的植物和真菌。改良的真菌可包含通过本文的组合物、系统和方法引入的一个或多个基因和/或通过所述组合物、系统和方法修饰的一个或多个基因。改良的植物和真菌可具有增加的食物或饲料产量(例如,更高的蛋白质、碳水化合物、营养物质或维生素水平)、油和生物燃料产量(例如,甲醇、乙醇)、对害虫、除草剂、干旱、低温或高温、过量水等的耐受性。
植物或真菌可具有一个或多个经改良的部分,例如叶、茎、根、块茎、种子、胚乳、胚珠和花粉。所述部分可以是存活的、非存活的、可再生的和/或不可再生的。
改良的植物和真菌可包括改良的植物和真菌的配子、种子、胚胎、合子或体细胞、后代和/或杂交体。后代可以是产生的植物或真菌的克隆,或者可能由通过与同一物种的其他个体杂交以将进一步期望的性状渗入其后代的有性生殖产生。在多细胞生物体、特别是植物的情况下,细胞可以是体内或离体的。
在植物中的进一步应用
组合物、系统和方法在植物和真菌上的进一步应用包括遗传元件动态的可视化(例如,如Chen B,等人,Cell.2013年12月19日;155(7):1479-91中所述)、体内和体外的靶向基因破坏正选择(如Malina A等人,Genes Dev.2013年12月1日;27(23):2602-14中所述)、表观遗传修饰,诸如使用TnpB多肽和组蛋白修饰酶的融合(例如,如Rusk N,NatMethods.2014年1月;11(1):28中所述)、识别转录调控子(例如,如Waldrip ZJ,Epigenetics.2014年9月;9(9):1207-11中所述)、RNA和DNA病毒的抗病毒治疗(例如,如Price AA等人,Proc Natl Acad Sci U S A.2015年5月12日;112(19):6164-9;Ramanan V等人,Sci Rep.2015年6月2日;5:10833中所述)、改变基因组复杂性,诸如染色体数量(例如,如Karimi-Ashtiyani R等人,Proc Natl Acad Sci U S A.2015年9月8日;112(36):11211-6;Anton T等人,Nucleus.2014年3月至4月;5(2):163-72中所述)、用于受控失活/活化的组合物的自我切割(例如,如Sugano SS等人,Plant Cell Physiol.2014年3月;55(3):475-81中所述)、多重基因编辑(如Kabadi AM等人,Nucleic Acids Res.2014年10月29日;42(19):e147中所述)、开发用于多重基因组编辑的试剂盒(如Xing HL等人,BMC PlantBiol.2014年11月29日;14:327中所述)、淀粉生产(如KH等人,Front Plant Sci.2015年4月23日;6:247中所述)、靶向家族或途径中的多个基因(例如,如Ma X等人,Mol Plant.2015年8月;8(8):1274-84中所述)、调控非编码基因和序列(例如,如Lowder LG,等人,PlantPhysiol.2015年10月;169(2):971-85中所述)、编辑树木的基因(例如,如Belhaj K等人,Plant Methods.2013年10月11日;9(1):39;Harrison MM等人,Genes Dev.2014年9月1日;28(17):1859-72;Zhou X等人,New Phytol.2015年10月;208(2):298-301中所述)、引入突变以获得宿主特异性病原体和害虫的抗性。
可以使用组合物、系统和方法执行的植物和真菌修饰的额外实例包括国际专利公开号WO2016/099887、WO2016/025131、WO2016/073433、WO2017/066175、WO2017/100158、WO2017/105991、WO2017/106414、WO2016/100272、WO2016/100571、WO 2016/100568、WO 2016/100562和WO 2017/019867中描述的类似修饰。
在非人动物中的应用
组合物、系统和方法可用于研究和修饰非人动物,例如,引入期望的性状和疾病恢复能力、治疗疾病、促进繁殖等。在一个实施方案中,组合物、系统和方法可用于改良繁殖并引入期望的性状,例如,增加性状相关等位基因的频率、渗入来自其他品种/物种的等位基因而不产生连锁拖累、以及从头创建有利等位基因。可以筛选和鉴定可以靶向的基因和其他遗传元件。应用和方法的实例包括Tait-Burkard C等人,Livestock 2.0-genomeediting for fitter,healthier,and more productive farmed animals.GenomeBiol.2018年11月26日;19(1):204;Lillico S,Agricultural applications of genomeediting in farmed animals.Transgenic Res.2019年8月;28(增刊2):57-60;Houston RD等人,Harnessing genomics to fast-track genetic improvement in aquaculture.NatRev Genet.2020年4月16日doi:10.1038/s41576-020-0227-y中描述的那些,所述文献通过引用整体并入本文。其他部分中描述的应用(诸如治疗应用、诊断应用等)也可以用于本文的动物。
组合物、系统和方法可用于动物,诸如鱼、两栖动物、爬行动物、哺乳动物和鸟类。动物可以是农场和农业动物或宠物。农场和农业动物的实例包括马、山羊、绵羊、猪、牛、美洲驼、羊驼和鸟类,例如鸡、火鸡、鸭和鹅。动物可以是非人灵长类动物,例如狒狒、卷尾猴、黑猩猩、狐猴、猕猴、狨猴、金狮狨猴、蜘蛛猴、松鼠猴和黑长尾猴。宠物的实例包括狗、猫、马、狼、兔子、雪貂、沙鼠、仓鼠、龙猫、花枝鼠、豚鼠、金丝雀、长尾小鹦鹉和鹦鹉。
在一个实施方案中,可以将一个或多个基因引入动物中(例如,在其中过表达)以获得或增强一种或多种期望的性状。可以引入生长激素、胰岛素样生长因子(IGF-1)以增加动物(例如,猪或鲑鱼)的生长(诸如Pursel VG等人,J Reprod Fertil增刊1990;40:235-45;Waltz E,Nature.2017;548:148中所述)。可以例如在猪中引入Fat-1基因(例如,来自秀丽隐杆线虫(C elegans))以产生更大比例的n-3至n-6脂肪酸(诸如Li M等人,Genetics.2018;8:1747–54中所述)。可以例如在猪中引入植酸酶(例如,来自大肠埃希氏菌)、木聚糖酶(例如,来自黑曲霉)、β-葡聚糖酶(例如,来自地衣芽孢杆菌)以通过减少磷和氮释放来减少环境影响(诸如Golovan SP等人,Nat Biotechnol.2001;19:741–5;Zhang X等人,elife.2018中所述)。可以例如在鸡中引入核酸组分诱饵来诱导禽流感恢复力(诸如Lyall等人,Science.2011;331:223–6中所述)。可以例如在山羊和奶牛中引入溶菌酶或溶葡球菌酶以诱导乳腺炎恢复力(诸如Maga EA等人,Foodborne Pathog Dis.2006;3:384–92;Wall RJ等人,Nat Biotechnol.2005;23:445–51中所述)。可以例如在猪中引入组蛋白脱乙酰酶诸如HDAC6以诱导PRRSV恢复能力(诸如Lu T.等人,PLoS One.2017;12:e0169317中所述)。可以在猪中修饰CD163(例如,失活或去除)以引入PRRSV恢复能力(诸如PratherRS等人,Sci Rep.2017年10月17日;7(1):13371中所述)。类似的方法可用于抑制或去除可能从动物传播给人类的病毒和细菌(例如,猪流感病毒(SIV)毒株,其包括丙型流感和甲型流感亚型,称为H1N1、H1N2、H2N1、H3N1、H3N2和H2N3,以及肺炎、脑膜炎和水肿)。
在一个实施方案中,可以修饰或编辑一个或多个基因以获得抗病性和生产性状。可以例如在奶牛、绵羊、山羊、鲶鱼和猪中修饰肌肉生长抑制素(例如,GDF8)以增加肌肉生长(诸如Crispo M等人,PLoS One.2015;10:e0136690;Wang X等人,Anim Genet.2018;49:43–51;Khalil K等人,Sci Rep.2017;7:7301;Kang J-D等人,RSC Adv.2017;7:12541–9中所述)。可以例如在奶牛中修饰Pc POLLED以诱导无角(诸如Carlson DF等人,NatBiotechnol.2016;34:479–81中所述)。可以例如在猪中修饰KISS1R以诱导公猪异味(性成熟期间的激素释放,导致不期望的肉味)。可以例如在鲑鱼中修饰死端蛋白(dnd)以诱导不育(诸如Wargelius A等人,Sci Rep.2016;6:21284中所述)。可以例如在猪和鸡中修饰Nano2和DDX以诱导不育(例如,在代孕宿主中)(诸如Park K-E等人,Sci Rep.2017;7:40176;Taylor L等人,Development.2017;144:928–34中所述)。可以例如在猪中修饰CD163以诱导PRRSV抗性(诸如Whitworth KM等人,Nat Biotechnol.2015;34:20–2中所述)。可以例如在猪中修饰RELA以诱导ASFV恢复能力(诸如Lillico SG等人,Sci Rep.2016;6:21645中所述)。可以例如在奶牛中修饰CD18以诱导曼氏杆菌属(Mannheimia)(巴斯德氏菌)溶血恢复能力(诸如Shanthalingam S等人,roc Natl Acad Sci U S A.2016;113:13186–90中所述)。可以例如在奶牛中修饰NRAMP1以诱导结核病恢复能力(诸如Gao Y等人,GenomeBiol.2017;18:13中所述)。可以修饰或去除内源逆转录病毒基因以用于异种移植,诸如Yang L等人Science.2015;350:1101–4;Niu D等人,Science.2017;357:1303–7中所述。可以例如在狗中修饰(例如,失活)肌肉量的负调控子(例如,肌肉生长抑制素)以增加肌肉量(诸如Zou Q等人,J Mol Cell Biol.2015年12月;7(6):580-3中所述)。
可以产生(例如,通过修饰RAG2)患有严重联合免疫缺陷(SCID)的动物诸如猪为再生医学、异种移植(也在本文别处讨论)和肿瘤发展提供有用的模型。方法和途径的实例包括Lee K等人,Proc Natl Acad Sci U S A.2014年5月20日;111(20):7260-5;和Schomberg等人FASEB Journal,2016年4月;30(1):增刊571.1中描述的那些。
可以修饰动物体内的SNP。方法和途径的实例包括Tan W.等人,Proc Natl AcadSci U S A.2013年10月8日;110(41):16526-31;Mali P等人,Science.2013年2月15日;339(6121):823-6中描述的那些。
可以修饰干细胞(例如,诱导型多能干细胞)并使其分化成期望的后代细胞,例如,如Heo YT等人,Stem Cells Dev.2015年2月1日;24(3):393-402中所述。
可以对动物执行特征分析(诸如Igenity)以筛选并鉴定与经济性状相关的遗传变异。可以修饰遗传变异以引入或改良性状,诸如胴体组成、胴体品质、母性和繁殖性状以及平均日增重。
检测组合物和检测方法
在另一个方面,本文公开的实施方案涉及多核苷酸检测组合物、系统和方法。检测组合物可包含上文讨论的任一种TnpB多肽和任何一种或多种ωRNA。此外,组合物和系统可包含检测构建体。在一个示例性实施方案中,检测构建体至少包含单链多核苷酸的一部分。一种或多种ωRNA被配置为结合靶多肽上的靶序列。TnpB复合物与靶序列的结合活化TnpB切割活性,并且可以进一步活化TnpB旁切活性,由此TnpB随后以不依赖于ωRNA的方式切割非靶单链多核苷酸。因此,可以将检测构建体配置为使得在检测构建体的单链部分的切割时产生可检测信号,从而指示样品中靶序列的存在。下文更详细地讨论了示例性检测构建体。在其他示例性实施方案中,组合物还可包含扩增试剂。扩增试剂可包含扩增靶序列所需的引物和聚合酶和/或逆转录酶。在一个示例性实施方案中,扩增试剂是等温扩增试剂。在其他示例性实施方案中,组合物和系统还可包含快速提取溶液,其允许检测粗样品中的靶序列或在扩增和/或检测之前进行最少的纯化。
检测构建体
本文所述的系统和方法包含检测构建体。如本文所用,“检测构建体”是指可以被本文所述的活化的TnpB系统蛋白切割或以其他方式失活的分子。术语“检测构建体”也可以替代地称为“掩蔽构建体”。根据TnpB蛋白的核酸酶活性和所利用的方法,掩蔽构建体可以是基于RNA的掩蔽构建体或基于DNA的掩蔽构建体。基于核酸的掩蔽构建体包含可被TnpB蛋白切割的核酸元件。核酸元件的切割释放剂,或者产生允许产生可检测信号的构象变化。下文描述了展示核酸元件如何可用于防止或掩蔽可检测信号的产生的示例性构建体,并且本发明的实施方案包含其变体。在切割之前,或当掩蔽构建体处于“活性”状态时,掩蔽构建体阻断阳性可检测信号的产生或检测。在一个实施方案中,检测构建体被设计用于切割特定TnpB蛋白的基序。
应当理解,在某些示例性实施方案中,可以在活性掩蔽构建体的存在下产生最小的背景信号。阳性可检测信号可以是可以使用光学、荧光、化学发光、电化学或本领域已知的其他检测方法检测的任何信号。术语“阳性可检测信号”用于区分在掩蔽构建体的存在下可检测的其他可检测信号。例如,在一个实施方案中,当掩蔽剂存在时或当TnpB系统尚未活化时,可以检测到第一信号(即,阴性可检测信号),所述第一信号然后在靶分子的检测以及掩蔽剂的切割或失活后或者在TnpB蛋白的活化后转化为第二信号(例如,阳性可检测信号)。那么,阳性可检测信号是在TnpB蛋白活化时检测到的信号,并且在比色或荧光测定中,可以是相对于对照荧光或颜色的减少或相对于对照荧光或颜色的增加,具体取决于侧流基质的构造,并且如本文进一步描述。
在某些示例性实施方案中,掩蔽构建体可包含HCR起始序列和切割基序,或防止起始子引发HCR反应的可切割结构元件,诸如环或发夹。切割基序可以优先被活化的TnpB效应蛋白之一切割。当切割基序或结构元件被活化的TnpB蛋白切割后,然后释放起始子以触发HCR反应,其检测表明样品中存在一个或多个靶标。在某些示例性实施方案中,掩蔽构建体包含具有RNA环的发夹。当活化的TnpB蛋白切割RNA环时,可以释放起始子来触发HCR反应。
在某些示例性实施方案中,掩蔽构建体可抑制基因产物的产生。基因产物可以由添加到样品中的报告构建体编码。掩蔽构建体可以是参与RNA干扰途径的干扰RNA,诸如短发夹RNA(shRNA)或小干扰RNA(siRNA)。掩蔽构建体还可包含微小RNA(miRNA)。当存在时,掩蔽构建体抑制基因产物的表达。基因产物可以是荧光蛋白或其他RNA转录物或蛋白质,如果不存在掩蔽构建体,则它们可以通过标记的探针、适体或抗体检测到。效应蛋白活化后,掩蔽构建体被切割或以其他方式沉默,从而允许作为阳性可检测信号的基因产物的表达和检测。在优选的实施方案中,掩蔽构建体包含两个或更多个可检测信号,例如可以在荧光计的不同通道上读取的荧光信号。
在具体的实施方案中,掩蔽构建体包含沉默RNA,其抑制由报告构建体编码的基因产物的产生,其中所述基因产物在表达时产生可检测的阳性信号。
在某些示例性实施方案中,掩蔽构建体可以隔离产生可检测阳性信号所需的一种或多种试剂,使得一种或多种试剂从掩蔽构建体的释放导致可检测阳性信号的产生。一种或多种试剂可以组合产生比色信号、化学发光信号、荧光信号或任何其他可检测信号,并且可包含已知适合于此类目的的任何试剂。在某些示例性实施方案中,一种或多种试剂被结合一种或多种试剂的RNA适体隔离。当效应蛋白在检测到靶分子后被活化并且RNA或DNA适体被降解时,一种或多种试剂被释放。
在某些示例性实施方案中,掩蔽构建体可以固定在单独离散体积(下文进一步定义)中的固体基质上并且隔离单一试剂。例如,试剂可以是包含染料的珠子。当被固定化试剂隔离时,单个珠子太分散而不能产生可检测信号,但在从掩蔽构建体释放后能够产生可检测信号,例如通过聚集或溶液浓度的简单增加。在某些示例性实施方案中,固定化的掩蔽剂是基于RNA或DNA的适体,其可以在检测到靶分子后被活化的效应蛋白切割。
在某些其他示例性实施方案中,掩蔽构建体与溶液中的固定化试剂结合,从而阻断试剂与溶液中游离的单独的标记的结合配偶体结合的能力。因此,在对样品应用洗涤步骤后,可以在不存在靶分子的情况下将标记的结合配偶体从样品中洗掉。然而,如果效应蛋白被活化,则掩蔽构建体被切割至足以干扰掩蔽构建体结合试剂的能力的程度,从而允许标记的结合配偶体与固定化试剂结合。因此,标记的结合配偶体在洗涤步骤之后仍然存在,表明样品中存在靶分子。在某些方面,结合固定化试剂的掩蔽构建体是DNA或RNA适体。固定化试剂可以是蛋白质,并且标记的结合配偶体可以是标记的抗体。或者,固定化试剂可以是链霉亲和素,并且标记的结合配偶体可以是标记的生物素。上述实施方案中使用的结合配偶体上的标记可以是本领域已知的任何可检测标记。此外,可以根据本文所述的整体设计使用其他已知的结合配偶体。
在某些示例性实施方案中,掩蔽构建体可以包含核酶。核酶是具有催化特性的RNA分子。天然的和工程化的核酶包含可以被本文公开的效应蛋白靶向的RNA或由其组成。可选择或工程化核酶以催化产生阴性可检测信号或防止产生阳性对照信号的反应。当核酶由于活化的效应蛋白失活时,产生阴性对照信号或防止产生阳性可检测信号的反应被去除,从而允许产生阳性可检测信号。在一个示例性实施方案中,核酶可以催化比色反应,从而引起溶液呈现第一种颜色。当核酶失活时,溶液变成第二种颜色,第二种颜色是可检测的阳性信号。核酶如何可以用于催化比色反应的实例描述于Zhao等人“Signal amplification ofglucosamine-6-phosphate based on ribozyme glmS,”Biosens Bioelectron.2014;16:337-42,并且提供了如何可以修饰此种系统以在本文公开的实施方案的背景中发挥作用的实例。或者,当存在时,核酶可以产生例如RNA转录物的切割产物。因此,检测阳性可检测信号可以包括检测仅在不存在核酶的情况下产生的未切割的RNA转录物。
在一个实施方案中,掩蔽构建体可以是产生阴性可检测信号的核酶,并且其中当核酶失活时产生阳性可检测信号。
在某些示例性实施方案中,一种或多种试剂是蛋白质诸如酶,其能够促进可检测信号(诸如比色、化学发光或荧光信号)的产生,所述可检测信号被抑制或隔离,使得蛋白质不能通过一种或多种DNA或RNA适体与蛋白质的结合而产生可检测信号。在活化本文公开的效应蛋白后,DNA或RNA适体被切割或降解至它们不再抑制蛋白质产生可检测信号的能力的程度。在某些示例性实施方案中,适体是凝血酶抑制剂适体。在某些示例性实施方案中,凝血酶抑制剂适体具有序列GGGAACAAAGCUGAAGUACUUACCC(SEQ ID NO:64,308)。当此适体被切割时,凝血酶将变得具有活性并且切割肽比色或荧光底物。在某些示例性实施方案中,比色底物是与凝血酶的肽底物共价连接的对硝基苯胺(pNA)。被凝血酶切割后,pNA被释放并变成黄色,并且肉眼容易看到。在某些示例性实施方案中,荧光底物是7-氨基-4-甲基香豆素,这是一种可以使用荧光检测器检测的蓝色荧光团。抑制性适体还可用于辣根过氧化物酶(HRP)、β-半乳糖苷酶或小牛碱性磷酸酶(CAP),并且符合上述一般原理。
在一个实施方案中,经由酶抑制适体的切割通过比色法检测RNA酶或DNA酶活性。将DNA酶或RNA酶活性转化为比色信号的一种潜在模式是将DNA或RNA适体的切割与能够产生比色输出的酶的重新活化偶联起来。在不存在RNA或DNA切割的情况下,完整的适体将与酶靶标结合并抑制其活性。此读出系统的优点是酶提供了额外的扩增步骤:一旦经由旁切活性(例如TnpB旁切活性)从适体中释放出来,比色酶将继续产生比色产物,从而导致信号倍增。
在一个实施方案中,使用通过比色读出来抑制酶的现有适体。存在若干种具有比色读出的适体/酶对,诸如凝血酶、蛋白质C、中性粒细胞弹性蛋白酶和枯草杆菌蛋白酶(subtilisin)。这些蛋白酶具有基于pNA的比色底物并且可商购获得。在一个实施方案中,使用靶向常见比色酶的新型适体。常见且稳健的酶,诸如β-半乳糖苷酶、辣根过氧化物酶或小牛肠碱性磷酸酶,可以被通过选择策略诸如SELEX设计的工程化适体靶向。此类策略允许快速选择具有纳摩尔结合效率的适体,并且可以用于开发用于比色读出的额外酶/适体对。
在一个实施方案中,掩蔽构建体可以是DNA或RNA适体且/或可以包含DNA或RNA栓系抑制剂。
在一个实施方案中,掩蔽构建体可包含连接有可检测配体和掩蔽组分的DNA或RNA寡核苷酸。
在一个实施方案中,经由RNA栓系抑制剂的切割通过比色法检测RNA酶或DNA酶活性。许多常见的比色酶具有竞争性、可逆的抑制剂:例如,β-半乳糖苷酶可以被半乳糖抑制。这些抑制剂中的许多都很弱,但可以通过增加局部浓度来增加其效果。通过将抑制剂的局部浓度与DNA酶RNA酶活性联系起来,可以将比色酶和抑制剂对工程化成DNA酶和RNA酶传感器。基于小分子抑制剂的比色DNA酶或RNA酶传感器涉及三种组分:比色酶、抑制剂以及与抑制剂和酶两者共价连接,从而将抑制剂栓系至酶的桥接RNA或DNA。在未切割的构型中,酶受到小分子局部浓度增加的抑制;当DNA或RNA被切割(例如,通过TnpB旁切切割)时,抑制剂将被释放并且比色酶将被活化。
在一个实施方案中,适体或DNA或RNA栓系抑制剂可隔离酶,其中酶通过作用于底物而从适体或DNA或RNA栓系抑制剂释放后产生可检测信号。在一个实施方案中,适体可以是抑制剂受体,其抑制酶并且防止酶对底物产生可检测信号的催化。在一个实施方案中,DNA或RNA栓系抑制剂可以抑制酶并且防止酶对底物产生可检测信号的催化。
在一个实施方案中,经由G-四链体的形成和/或活化通过比色法检测RNA酶活性。DNA中的G四链体可以与血红素(铁(III)-原卟啉IX)复合以形成具有过氧化物酶活性的脱氧核酶(DNAzyme)。当提供过氧化物酶底物(例如ABTS:(2,2'-联氮双[3-乙基苯并噻唑啉-6-磺酸]-二铵盐))时,G-四链体-血红素复合物在过氧化氢的存在下引起底物的氧化,所述底物然后在溶液中形成绿色。示例性G-四链体形成DNA序列是:GGGTAGGGCGGGTTGGGA(SEQID NO:64,309)。通过将额外的DNA或RNA序列(本文中称为“钉书钉”)与此DNA适体杂交,G-四链体结构的形成将受到限制。旁切活化后,钉书钉将被切割,从而允许形成G四链体并结合血红素。此策略特别有吸引力,因为颜色形成是酶促的,这意味着除了旁切活化之外还有额外的扩增作用。
在一个实施方案中,掩蔽构建体可包含被设计为结合G-四链体形成序列的RNA寡核苷酸,其中G-四链体结构在掩蔽构建体的切割后由G-四链体形成序列形成,并且其中G-四链体结构产生可检测的阳性信号。
在某些示例性实施方案中,掩蔽构建体可以固定在单独离散体积(下文进一步定义)中的固体基质上并且隔离单一试剂。例如,试剂可以是包含染料的珠子。当被固定化试剂隔离时,单个珠子太分散而不能产生可检测信号,但在从掩蔽构建体释放后能够产生可检测信号,例如通过聚集或溶液浓度的简单增加。在某些示例性实施方案中,固定化的掩蔽剂是基于DNA或RNA的适体,其可以在检测到靶分子后被活化的效应蛋白切割。
在一个示例性实施方案中,掩蔽构建体包含检测剂,其根据检测剂在溶液中是聚集还是分散而改变颜色。例如,某些纳米颗粒(诸如胶体金)在从聚集体移动为分散颗粒时会经历可见的紫色到红色的颜色变化。因此,在某些示例性实施方案中,此类检测剂可通过一种或多种桥接分子保持聚集。桥接分子的至少一部分包含RNA或DNA。在本文公开的效应蛋白的活化后,桥接分子的RNA或DNA部分被切割,从而允许检测剂分散并导致对应的颜色变化。在某些示例性实施方案中,检测剂是胶体金属。胶体金属材料可包括分散在液体、水溶胶或金属溶胶中的水不溶性金属颗粒或金属化合物。胶体金属可以选自元素周期表IA、IB、IIB和IIIB族中的金属,以及过渡金属,特别是VIII族的那些金属。优选的金属包括金、银、铝、钌、锌、铁、镍和钙。其他合适的金属还包括以下所有各种氧化态的金属:锂、钠、镁、钾、钪、钛、钒、铬、锰、钴、铜、镓、锶、铌、钼、钯、铟、锡、钨、铼、铂和钆。金属优选以离子形式提供,来源于适当的金属化合物,例如Al3+、Ru3+、Zn2+、Fe3+、Ni2+和Ca2+离子。
当RNA或DNA桥被活化的TnpB多肽切割时,观察到前述的颜色变化。在某些示例性实施方案中,颗粒是胶体金属。在某些其他示例性实施方案中,胶体金属是胶体金。在某些示例性实施方案中,胶体纳米颗粒是15nm金纳米颗粒(AuNP)。由于胶体金纳米颗粒独特的表面性质,当完全分散在溶液中时,在520nm处观察到最大吸光度,并且肉眼呈现红色。AuNP聚集后,它们表现出最大吸光度的红移,并且颜色会变深,最终以深紫色聚集体的形式从溶液中沉淀出来。在某些示例性实施方案中,对纳米颗粒进行修饰以包括从纳米颗粒表面延伸的DNA接头。各个颗粒通过单链RNA(ssRNA)或单链DNA(ssDNA)桥而连接在一起,所述桥的每一端与DNA接头的至少一部分杂交。因此,纳米颗粒将形成连接颗粒的网络并聚集,从而呈现为深色沉淀物。在本文公开的TnpB多肽的活化后,ssRNA或ssDNA桥将被切割,从而从连接的网状物中释放AU NPS并产生可见的红色。下文列出了示例性DNA接头和桥接序列。DNA接头末端的硫醇接头可用于与AuNPS的表面缀合。可以使用其他形式的缀合。在某些示例性实施方案中,可以产生两个AuNP群体,每个群体对应一个DNA接头。这将有助于促进ssRNA桥以正确的方向正确结合。在某些示例性实施方案中,第一DNA接头通过3'端缀合,而第二DNA接头通过5'端缀合。
在某些其他示例性实施方案中,掩蔽构建体可包含RNA或DNA寡核苷酸,其连接有可检测标记和所述可检测标记的掩蔽剂。此种可检测标记/掩蔽剂对的实例是荧光团和荧光团的淬灭剂。荧光团的淬灭可以由于荧光团与另一个荧光团或非荧光分子之间形成非荧光复合物而发生。此机制被称为基态复合物形成、静态淬灭或接触淬灭。因此,可以设计RNA或DNA寡核苷酸,使得荧光团和淬灭剂足够接近以发生接触淬灭。荧光团及其同源淬灭剂是本领域已知的并且可以由本领域普通技术人员选择用于此目的。在本发明的上下文中,特定的荧光团/淬灭剂对并不重要,只是荧光团/淬灭剂对的选择确保荧光团的掩蔽。在活化本文公开的效应蛋白后,RNA或DNA寡核苷酸被切割,从而切断维持接触淬灭效应所需的荧光团与淬灭剂之间的接近度。因此,荧光团的检测可用于确定样品中的靶分子的存在。
在某些其他示例性实施方案中,掩蔽构建体可包含一个或多个RNA寡核苷酸,其连接有一个或多个金属纳米颗粒,诸如金纳米颗粒。在一个实施方案中,掩蔽构建体包含通过形成闭环的多个RNA或DNA寡核苷酸交联的多个金属纳米颗粒。在一个实施方案中,掩蔽构建体包含通过形成闭环的三个RNA或DNA寡核苷酸交联的三个金纳米颗粒。在一个实施方案中,TnpB蛋白对RNA或DNA寡核苷酸的切割导致由金属纳米颗粒产生可检测信号。
在某些其他示例性实施方案中,掩蔽构建体可包含一个或多个RNA或DNA寡核苷酸,其连接有一个或多个量子点。在一个实施方案中,TnpB蛋白对RNA或DNA寡核苷酸的切割导致由量子点产生可检测信号。
在一个示例性实施方案中,掩蔽构建体可包含量子点。量子点可以具有附接至表面的多个连接分子。接头分子的至少一部分包含RNA或DNA。接头分子在一端连接至量子点,并沿着接头的长度或在末端连接至一个或多个淬灭剂,使得淬灭剂保持足够接近以发生量子点的淬灭。接头可以是支链的。如上所述,量子点/淬灭剂对并不关键,只是量子点/淬灭剂对的选择确保荧光团的掩蔽。量子点及其同源淬灭剂是本领域已知的并且可以由本领域普通技术人员选择用于此目的。在活化本文公开的效应蛋白后,接头分子的RNA或DNA部分被切割,从而消除维持淬灭效应所需的量子点与一个或多个淬灭剂之间的接近度。在某些示例性实施方案中,量子点是链霉亲和素缀合的。RNA或DNA经由生物素接头连接并且募集具有序列/5Biosg/UCUCGUACGUUC/3IAbRQSp/(SEQ ID NO:64,310)或/5Biosg/UCUCGUACGUUCUCUCGUACGUUC/3IAbRQSp/(SEQ ID NO:64,311)的淬灭分子,其中/5Biosg/是生物素标签并且/3lAbRQSp/是爱荷华黑淬灭剂(Iowa Black FQ)。一旦切割,通过本文公开的活化的效应子,量子点将发出明显的荧光。
在具体的实施方案中,可检测配体可以是荧光团并且掩蔽组分可以是淬灭剂分子。
以类似的方式,荧光能量转移(FRET)可用于产生可检测的阳性信号。FRET是一种非辐射过程,通过所述过程,来自高能激发荧光团(即“供体荧光团”)的光子将另一个分子(即“受体”)中电子的能态提升至激发单重态的更高振动能级。供体荧光团返回基态,而不发射所述荧光团的荧光特征。受体可以是另一种荧光团或非荧光分子。如果受体是荧光团,则转移的能量作为所述荧光团的荧光特征而发射。如果受体是非荧光分子,则吸收的能量以热量的形式损失。因此,在本文公开的实施方案的背景中,荧光团/淬灭剂对被附接至寡核苷酸分子的供体荧光团/受体对替代。当完整时,掩蔽构建体产生第一信号(阴性可检测信号),如通过从受体发射的荧光或热量检测的。在本文公开的效应蛋白的活化后,RNA寡核苷酸被切割并且FRET被破坏,使得现在检测到供体荧光团的荧光(阳性可检测信号)。
在某些示例性实施方案中,掩蔽构建体包括使用嵌入染料,其响应于长RNA或DNA切割成短核苷酸而改变其吸光度。存在若干种此类染料。例如,派若宁(pyronine)-Y将与RNA复合并形成在572nm处具有吸光度的复合物。RNA的切割导致吸光度损失和颜色变化。亚甲基蓝可以类似的方式使用,RNA切割时688nm处的吸光度发生变化。因此,在某些示例性实施方案中,掩蔽构建体包含RNA和嵌入染料复合物,其在RNA被本文公开的效应蛋白切割后改变吸光度。
在某些示例性实施方案中,掩蔽构建体可以包含HCR反应的起始子。参见,例如,Dirks和Pierce.PNAS101,15275-15728(2004)。HCR反应利用两种发夹类型的势能。当具有与发夹之一上的对应区域互补的部分的单链起始子被释放到先前稳定的混合物中时,它打开一种类型的发夹。此过程进而暴露了打开另一种类型的发夹的单链区域。此过程进而暴露了与原始起始子相同的单链区域。所得的链反应可导致形成带切口的双螺旋,所述双螺旋不断生长直至发夹供应耗尽。所得产物的检测可以在凝胶上或通过比色法进行。示例性比色检测方法包括例如Lu等人“Ultra-sensitive colorimetric assay system based onthe hybridization chain reaction-triggered enzyme cascade amplification ACSAppl Mater Interfaces,2017,9(1):167-175、Wang等人“An enzyme-free colorimetricassay using hybridization chain reaction amplification and split aptamers”Analyst 2015,150,7657-7662和Song等人“Non-covalent fluorescent labeling ofhairpin DNA probe coupled with hybridization chain reaction for sensitive DNAdetection.”Applied Spectroscopy,70(4):686-694(2016)中公开的那些。
在某些示例性实施方案中,掩蔽构建体抑制可检测阳性信号的产生,直到被活化的TnpB蛋白切割或修饰。在一个实施方案中,掩蔽构建体可以通过掩蔽可检测的阳性信号或者替代地产生可检测的阴性信号来抑制可检测的阳性信号的产生。
扩增试剂
在某些示例性实施方案中,可以在活化CRISPR效应蛋白之前扩增靶RNA和/或DNA。可以使用任何合适的RNA或DNA扩增技术。在某些示例性实施方案中,RNA或DNA扩增是等温扩增。在某些示例性实施方案中,等温扩增可以是基于核酸序列的扩增(NASBA)、重组酶聚合酶扩增(RPA)、环介导的等温扩增(LAMP)、链置换扩增(SDA)、解旋酶依赖性扩增(HDA)或切口酶扩增反应(NEAR)。在某些示例性实施方案中,可以使用非等温扩增方法,其包括但不限于PCR、多重置换扩增(MDA)、滚环扩增(RCA)、连接酶链反应(LCR)或分支扩增方法(RAM)。
在某些示例性实施方案中,RNA或DNA扩增是NASBA,其通过序列特异性反向引物从靶RNA的逆转录起始,以产生RNA/DNA双链体。然后使用RNA酶H来降解RNA模板,从而允许含有启动子诸如T7启动子的正向引物结合并启动互补链的延伸,从而产生双链DNA产物。然后,RNA聚合酶启动子介导的DNA模板转录创建靶RNA序列的拷贝。重要的是,每个新的靶RNA都可以被指导RNA检测到,从而进一步提高测定的灵敏度。指导RNA与靶RNA的结合然后导致CRISPR效应蛋白的活化,并且方法如上所述进行。NASBA反应的另一个优点是能够在中等等温条件下进行,例如在大约41℃下进行,使其适合部署在远离临床实验室的现场进行早期直接检测的系统和装置。
在某些其他示例性实施方案中,重组酶聚合酶扩增(RPA)反应可用于扩增靶核酸。RPA反应采用能够将序列特异性引物与双链体DNA中的同源序列配对的重组酶。如果存在靶DNA,则启动DNA扩增,并且不需要其他样品操纵,诸如热循环或化学熔化。整个RPA扩增系统作为干燥制剂是稳定的,并且可以在没有冷藏的情况下安全运输。RPA反应也可以在等温温度下进行,最佳反应温度为37-42℃。序列特异性引物被设计为扩增包含待检测的靶核酸序列的序列。在某些示例性实施方案中,将RNA聚合酶启动子诸如T7启动子添加至引物之一。这产生了包含靶序列和RNA聚合酶启动子的扩增的双链DNA产物。在RPA反应之后或期间,添加RNA聚合酶,所述RNA聚合酶将从双链DNA模板产生RNA。然后扩增的靶RNA进而可以被CRISPR效应系统检测到。以此方式,可以使用本文公开的实施方案来检测靶DNA。RPA反应还可以用于扩增靶RNA。首先使用逆转录酶将靶RNA转化为cDNA,然后进行第二链DNA合成,此时RPA反应如上所述进行。
在本发明的实施方案中,可包括基于切口酶的扩增。切口酶可以是CRISPR蛋白。因此,将切口引入dsDNA可以是可编程的并且是序列特异性的。图115描绘了本发明的实施方案,其以设计用于靶向dsDNA靶标的相反链的两个指导开始。根据本发明,切口酶可以是Cpf1、C2c1、Cas9或任何直系同源物或CRISPR蛋白,其切割或被工程化以切割DNA双链体的单链。然后可以通过聚合酶延伸带切口的链。在实施方案中,选择切口的位置,使得聚合酶对链的延伸朝向切口位点之间的靶双链体DNA的中心部分。在某些实施方案中,引物被包括在能够与延伸链杂交的反应中,随后进行引物的进一步聚合酶延伸以重新产生两个dsDNA片段:包括第一链Cpf1指导位点或第一链和第二链Cpf1指导位点两者的第一dsDNA,以及包括第二链Cpf1指导位点或第一链和第二链Cprf指导位点两者的第二dsDNA。这些片段在循环反应中继续被切口和延伸,所述循环反应以指数方式扩增切口位点之间的靶区域。
扩增可以是等温的并且可以选择温度。在一个实施方案中,扩增在37摄氏度下快速进行。在其他实施方案中,可以通过选择可在不同温度下操作的聚合酶(例如Bsu、Bst、Phi29、klenow片段等)来选择等温扩增的温度。
因此,切口等温扩增技术使用具有固定序列偏好的切口酶(例如,在切口酶扩增反应或NEAR中),这需要使原始dsDNA靶标变性以允许将切口底物添加至靶标末端的引物的退火和延伸,使用CRISPR切口酶(其中切口位点可经由指导RNA进行编程)意味着不需要变性步骤,使整个反应能够真正等温。这也简化了反应,因为这些添加切口底物的引物与反应中稍后使用的引物不同,这意味着NEAR需要两组引物(即4个引物),而Cpf1切口扩增仅需要一组引物(即,两个引物)。这使得切口Cpf1扩增更简单并且更容易操作,无需复杂的仪器来执行变性并且然后冷却至等温温度。
因此,在某些示例性实施方案中,本文公开的系统可包括扩增试剂。本文描述了可用于核酸扩增的不同组分或试剂。例如,如本文所述的扩增试剂可包括缓冲液,诸如Tris缓冲液。Tris缓冲液可以以适合期望应用或用途的任何浓度使用,例如包括但不限于1mM、2mM、3mM、4mM、5mM、6mM、7mM、8mM、9mM、10mM、11mM、12mM、13mM、14mM、15mM、25mM、50mM、75mM、1M等的浓度。本领域技术人员将能够确定与本发明一起使用的缓冲液诸如Tris的适当浓度。
生物或化学反应的其他组分可包括细胞裂解组分,以便破裂或裂解细胞以分析其中的材料。细胞裂解组分可包括但不限于洗涤剂、如上所述的盐,诸如NaCl、KCl、硫酸铵[(NH4)2SO4]或其他。适用于本发明的洗涤剂可包括Triton X-100、十二烷基硫酸钠(SDS)、CHAPS(3-[(3-胆酰胺丙基)二甲基铵]-1-丙磺酸盐)、乙基三甲基溴化铵、壬基苯氧基聚乙氧基乙醇(NP-40)。洗涤剂的浓度可以取决于特定应用,并且在一些情况下可能对反应具有特异性。扩增反应可包括以适合本发明的任何浓度使用的dNTP和核酸引物,诸如包括但不限于100nM、150nM、200nM、250nM、300nM、350nM、400nM、450nM、500nM、550nM、600nM、650nM、700nM、750nM、800nM、850nM、900nM、950nM、1mM、2mM、3mM、4mM、5mM、6mM、7mM、8mM、9mM、10mM、20mM、30mM、40mM、50mM、60mM、70mM、80mM、90mM、100mM、150mM、200mM、250mM、300mM、350mM、400mM、450mM、500mM等的浓度。同样,根据本发明的有用的聚合酶可以是本领域已知的并且可用于本发明的任何特定或通用聚合酶,包括Taq聚合酶、Q5聚合酶等。
在一些实施方案中,如本文所述的扩增试剂可适用于热启动扩增。在一些实施方案中,热启动扩增可能有益于减少或消除衔接分子或寡核苷酸的二聚化,或者以其他方式防止不需要的扩增产物或人工制品并获得期望产物的最佳扩增。本文所述的用于扩增的许多组分也可以用于热启动扩增。在一些实施方案中,可以使用适合与热启动扩增一起使用的试剂或组分来适当地代替组合物组分中的一种或多种。例如,可以使用在特定温度或其他反应条件下表现出期望活性的聚合酶或其他试剂。在一些实施方案中,可以使用被设计或优化用于热启动扩增的试剂,例如,可以在转座后或达到特定温度后活化聚合酶。此类聚合酶可以是基于抗体的或基于适体的。如本文所述的聚合酶是本领域已知的。此类试剂的实例可包括但不限于热启动聚合酶、热启动dNTP和光笼dNTP。此类试剂是本领域已知的且可获得的。本领域技术人员将能够确定适合各个试剂的最佳温度。
核酸的扩增可以使用特定的热循环机器或设备来执行,并且可以在单个反应中执行或批量地执行,使得可以同时执行任何期望数量的反应。在一些实施方案中,可以使用微流体或机器人装置执行扩增,或者可以使用手动改变温度来执行扩增以实现期望的扩增。在一些实施方案中,可以执行优化以获得特定应用或材料的最佳反应条件。本领域技术人员将理解并能够优化反应条件以获得足够的扩增。
在某些实施方案中,用本发明的方法或系统检测DNA需要在检测之前将(扩增的)DNA转录成RNA。
显然,本发明的检测方法可以涉及各种组合的核酸扩增和检测程序。待检测的核酸可以是任何天然存在的或合成的核酸,包括但不限于DNA和RNA,其可以通过任何合适的方法扩增以提供可以检测的中间产物。中间产物的检测可以通过任何合适的方法进行,包括但不限于CRISPR蛋白的结合和活化,所述CRISPR蛋白通过直接或旁切活性产生可检测的信号部分。
基于LAMP的等温扩增
在某些示例性实施方案中,LAMP扩增试剂可以包括SARS-COV2的引物。LAMP试剂还可以包含比色和/或荧光检测试剂,诸如羟基萘酚蓝(参见,例如,Goto,M.等人,Colorimetric detection of loop-mediated isothermal amplification reaction byusing hydroxy naphthol blue.Biotechniques,2009.46(3):第167-72页.)、无色三苯甲烷染料(参见,例如,Miyamoto,S.等人,Method for colorimetric detection of double-stranded nucleic acid using leuco triphenylmethane dyes.Anal Biochem,2015.473:第28-33页)和pH敏感染料(参见,例如,Tanner,N.A.、Y.Zhang和T.C.Evans,Jr.,Visual detection of isothermal nucleic acid amplification using pH-sensitivedyes.Biotechniques,2015.58(2):第59-68页);以及荧光检测(参见,例如,Yu等人,Clinical Chemistry,hvaa102,doi:10.1093/clinchem/hvaa102 2020年5月12日),包括使用淬灭探针(参见,例如,Shirato等人,J Virol Methods.2018年8月;258:41-48.doi:10.1016/j.jviromet.2018.05.006)。用于序列特异性检测的LAMP方法(包括OSD-LAMP)的综述描述于Becherer等人,Anal.Methods,2020,12,717-746,doi:10.1039/C9AY02246E,其通过引用并入本文。
在实施方案中,LAMP扩增试剂可以包含寡核苷酸链置换(OSD)探针。如本文所用,寡核苷酸链置换探针在本文中也称为寡核苷酸链交换探针或一步式链置换探针。使用OSD交换的一般概念描绘于Bhadra等人,High-surety isothermal amplification anddetection of SARS-CoV-2,including with crude enzymes,doi:10.1101/2020.04.13.039941的图1。OSD探针依赖于靶标结合探针与LAMP反应的扩增子之间的结合焓,从而产生链交换反应,从而导致容易读取的荧光信号变化。因此,LAMP反应的结果可以通过荧光OSD探针目视或光学上读取。
在一个方面,OSD探针包含对靶分子具有特异性的序列。OSD探针可包含预杂交的核酸序列,其中靶序列比与其杂交的链长5、6、7、8、9、10、11、12或13个核苷酸,从而允许与互补靶标进行序列特异性相互作用,OSD发生链交换并产生荧光信号的变化。
在一个方面,以以下浓度提供OSD探针:约50nM至200nM、约75nM至150nM、小于或等于200nM、190nM、180nM、170nM、160nM、150nM、140nM、130nM、120nM、110nM、100nM、90nM、80nM、75nM、65nM或50nM。探针可以被设计为与LAMP引物的F1c与F2引物结合位点之间的环区域互补,这可以称为长立足点区域。互补部分的长度可以是约9与14个核苷酸之间,更优选11-12个核苷酸。在一个方面,OSD的较长链在所述链的5'或3'端用荧光分子标记。在一个方面,标记设置在与设计的互补靶区域(长立足点区域)相对的末端上。短链在探针一端准备有淬灭剂,并且可以被设计为包含与长链的一部分互补的区域。OSD探针可以作为如本文所述的LAMP试剂的一部分提供,其可以包括它们在任何装置、盒上或在如本文所提供的任何组合物中的使用,包括在一些情况下作为冻干试剂提供。
提取溶液
在某些方面,本文公开的实施方案涉及组合物和试剂盒,其将靶核酸的免提取裂解和扩增合并到单个反应体积中。在某些示例性实施方案中,免提取裂解试剂可以用于从细胞和/或病毒颗粒中提取核酸。与现有方案相比,免提取裂解溶液不需要在进一步扩增之前分离核酸。免提取裂解试剂可以与扩增试剂(诸如标准RT-PCR扩增反应)混合。
在一个实施方案中,免提取裂解溶液和等温扩增试剂可以在单个反应体积中冻干,以通过添加待测定的样品来重构。在某些其他实施方案中,免提取裂解溶液和等温扩增试剂可被冻干并储存在盒或侧流条上,如下文进一步详细讨论。
在某些示例性实施方案中,单一裂解反应组合物和试剂盒还可包含一种或多种具有旁切活性的TnpB蛋白以及检测构建体。与一种或多种TnpB蛋白配对可以提高测定的灵敏度或特异性。在某些示例性实施方案中,一种或多种TnpB蛋白可以是热稳定TnpB蛋白。下文更详细地公开了示例性TnpB蛋白。
在某些示例性实施方案中,单一裂解扩增反应组合物和试剂盒可包含优化的引物和/或一种或多种添加剂。在一个方面,设计优化了扩增中使用的引物。在特定的方面,单独使用等温扩增。在另一个方面,等温扩增与TnpB系统一起使用。在任一种方法中,设计考虑因素可以遵循合理设计以优化反应。在一个实例中,可以鉴定反应中具有特定引物、靶标、TnpB蛋白、温度和其他添加剂浓度的不同添加剂。可以进行优化,以减少反应中必须发生的步骤数和缓冲液交换、简化反应、并且降低转移步骤中的污染风险。在一个方面,可以考虑添加抑制剂,诸如蛋白酶K,使得可以减少缓冲液交换。类似地,优化盐水平以及所用盐的类型可以进一步促进并优化本文公开的一锅检测(one-pot detection)。在一个方面,当此类扩增方法与裂解步骤中的珠浓度一起使用时,可以使用氯化钾而不是氯化钠。
在一个实施方案中,组合物和试剂盒还可包含核酸结合珠。珠子可用于捕获、浓缩或以其他方式富集特定材料。珠子可以是磁性的,并且可以提供珠子来捕获核酸材料。在另一个方面,珠子是二氧化硅珠。珠子可用于本文公开的方法的提取步骤中。珠子可以任选地与本文所述的方法一起使用,所述方法包括一锅法,其允许从大体积样品(诸如唾液或拭子样品)中浓缩病毒核酸,以允许单一一锅反应方法。期望的靶分子的浓度可以增加约10倍、50倍、100倍、200倍、500倍、800倍、1000倍、1500倍、2000倍、2500倍、3000倍或更多倍。
PEG和盐溶液中的磁珠在一个方面是优选的,并且在实施方案中与病毒RNA和/或DNA结合,这允许同时进行浓缩和裂解。二氧化硅珠可以用于另一个方面。预期使用捕获部分,诸如寡核苷酸官能化珠子。珠子可以与提取试剂一起使用,允许与样品和裂解/提取缓冲液一起孵育,从而将靶分子浓缩在珠子上。当与本文别处详述的盒装置一起使用时,可以活化磁体并收集珠子,任选地冲洗提取缓冲液并执行一次或多次洗涤。有利地,珠子可以用于一锅法和系统,而无需额外洗涤珠子,从而允许更有效的过程,而不会增加多步骤过程中的污染风险。珠子可以与本文详述的等温扩增一起利用,并且珠子可流入盒的扩增室中或维持在锅中用于扩增步骤。加热后,核酸可以从珠子上释放。
诊断装置
本文所述的系统可以包括在诊断装置上。可以使用多种底物和配置。装置可能能够在装置内限定多个单独的离散体积。如本文所用,“单独的离散体积”是指离散空间,诸如容器、接收器或可以由防止和/或抑制靶分子迁移的特征件限定的其他限定体积或空间,例如由物理特征件(诸如壁,例如孔壁、管壁或液滴表面)限定的体积或空间,其可以是不可渗透的或半渗透的,或者如由可以将样品包含在限定空间内的其他方式限定的体积或空间,所述方式诸如化学的、扩散速率受限的、电磁的、或光照明、或其任何组合。单独的离散体积可以通过分子标签诸如核酸条形码来识别。“扩散速率受限”(例如扩散限定的体积)意指由于扩散约束有效限定了空间或体积(就像两个平行层流的情况一样,其中扩散将限制靶分子从一个流迁移至另一个流)而仅有某些分子或反应可进入的空间。“化学”限定的体积或空间意指由于其化学或分子性质(诸如尺寸)而仅可以存在某些靶分子的空间,其中例如凝胶珠可以诸如通过珠子的表面电荷、基质大小或可以允许选择可进入珠子内部的物质的其他珠物理性质来排除某些物质进入珠子,但不能排除其他物质。“电磁”限定的体积或空间意指靶分子或其支持物的电磁性质(诸如电荷或磁性)可以用于限定空间中的某些区域(诸如捕获磁场内或直接在磁体上的磁性颗粒)的空间。“光学”限定的体积意指可以通过用可见光、紫外线、红外线或其他波长的光照射它来限定,使得只有所限定空间或体积内的靶分子可以被标记的任何空间区域。使用无壁或半渗透离散体积的一个优点是一些试剂(诸如缓冲剂、化学活化剂或其他剂)可通过离散体积,而其他材料诸如靶分子可以保留在离散体积或空间中。通常,离散体积将包括适合于在允许标记的条件下用可转位核酸标识符标记靶分子的流体介质(例如,水性溶液、油、缓冲液和/或能够支持细胞生长的培养基)。可用于所公开方法的示例性离散体积或空间包括液滴(例如,微流体液滴和/或乳液液滴)、水凝胶珠或其他聚合物结构(例如,聚乙二醇二丙烯酸酯珠或琼脂糖珠)、组织载玻片(例如,固定的福尔马林石蜡包埋的组织载玻片,其具有通过化学、光学或物理方式限定的特定区域、体积或空间)、显微镜载玻片,其区域通过以有序阵列或随机图案沉积试剂来限定、管(诸如离心管、微量离心管、试管、比色皿、锥形管等)、瓶(诸如玻璃瓶、塑料瓶、陶瓷瓶、锥形瓶、闪烁瓶等)、孔(诸如板中的孔)、板、移液器或移液器头等。在某些实施方案中,区室是油包水乳液中的水滴。在具体的实施方案中,本文所述的需要精确或均匀体积的任何应用、方法或系统可以采用声学液体分配器(acoustic liquid dispenser)的使用。
在一些实施方案中,单独的离散体积可以是液滴。
在某些示例性实施方案中,装置包括柔性材料基底,可以在所述柔性材料基底上限定多个点。适用于诊断和生物传感的柔性基底材料是本领域已知的。柔性基底材料可以由植物源性纤维诸如纤维素纤维制成,或者可以由柔性聚合物(诸如柔性聚酯膜和其他聚合物类型)制成。在每个限定的点内,将本文所述的系统的试剂应用于各个点。每个点可含有相同的试剂,不同的指导RNA或指导RNA组除外,或者在适用的情况下,可含有不同的检测适体以一次筛选多个靶标。因此,本文的系统和装置可能能够筛选来自多个来源的样品(例如,来自不同个体的多个临床样品)是否存在相同的靶标、或有限数量的靶标,或者筛选单个样品的等分试样(或来自同一来源的多个样品)在样品中是否存在多个不同的靶标。在某些示例性实施方案中,本文所述的系统的元件被冷冻干燥到纸或布基底上。可用于某些示例性装置的示例性的基于柔性材料的基底公开于Pardee等人Cell.2016,165(5):1255-66和Pardee等人Cell.2014,159(4):950-54。用于与生物流体(包括血液)一起使用的合适的基于柔性材料的基底公开于Shevkoplyas等人的标题为“Paper based diagnostic test”的国际专利申请公开号WO/2013/071301、Siegel等人的标题为“Paper-basedmicrofluidic systems”的美国专利申请公开号2011/0111517、以及Shafiee等人“Paperand Flexible Substrates as Materials for Biosensing Platforms to DetectMultiple Biotargets”Scientific Reports 5:8719(2015)。其他柔性基材料,包括适用于可穿戴诊断装置的那些材料,公开于Wang等人“Flexible Substrate-Based Devices forPoint-of-Care Diagnostics”Cell 34(11):909-21(2016)。其他柔性基材料可包括硝基纤维素、聚碳酸酯、甲基乙基纤维素、聚偏二氟乙烯(PVDF)、聚苯乙烯或玻璃(参见例如US20120238008)。在某些实施方案中,离散体积被疏水表面分开,诸如但不限于蜡、光致抗蚀剂或固体墨水。
在一些实施方案中,可以提供充当传感器或指示器的剂量计或徽章,使得佩戴者被告知暴露于某些微生物或其他剂。例如,本文所述的系统可用于检测特定病原体。同样,上文公开的基于适体的实施方案可用于检测多肽以及特定适体可结合的其他剂,诸如化学剂。此种装置可用于监视士兵或其他军事人员以及临床医生、研究人员、医院工作人员等,以便尽可能快地提供与暴露于潜在危险剂相关的信息,例如用于生物或化学战剂检测。在其他实施方案中,此种监视徽章可用于防止免疫受损患者、烧伤患者、接受化疗的患者、儿童或老年个体暴露于危险微生物或病原体。
在具体的实施方案中,每个单独的离散体积还包含一种或多种检测适体,所述检测适体包含掩蔽的RNA聚合酶启动子结合位点或掩蔽的引物结合位点。因此,每个单独的离散体积还可包含核酸扩增试剂。
在具体的实施方案中,靶分子可以是靶DNA并且单独的离散体积还包含引物,所述引物结合靶DNA并包含RNA聚合酶启动子。
可使用本文所述的系统和装置分析的样品源包括受试者的生物样品或环境样品。环境样品可包括表面或流体。生物样品可包括但不限于唾液、血液、血浆、血清、粪便、尿液、痰、粘液、淋巴液、滑液、脊髓液、脑脊液、来自皮肤或粘膜的拭子、或其组合。在示例性实施方案中,环境样品取自固体表面,诸如用于制备食品或其他敏感组合物和材料的表面。
在其他示例性实施方案中,本文所述的系统的元件可以放置在一次性基底上,诸如用于擦拭表面或样品流体的拭子或布。例如,系统可用于通过擦拭食品(诸如水果或蔬菜)的表面来测试食品上是否存在病原体。类似地,一次性基底可用于擦拭其他表面以检测某些微生物或剂,诸如用于安全筛选。一次性基底还可以具有法医学中的应用,其中CRISPR系统被设计用于检测,例如鉴定可用于鉴定嫌疑人的DNA SNP,或鉴定某些组织或细胞标志物以确定样品中存在的生物物质的类型。同样,一次性基底可用于从患者收集样品–诸如口腔中的唾液样品–或皮肤拭子。在其他实施方案中,可以从肉产品中采集样品或拭子,以便检测肉产品上或肉产品内是否存在污染物。
食品、临床、工业和其他环境设置需要近实时微生物诊断(参见,例如,Lu TK、Bowers J和Koeris MS.,Trends Biotechnol.2013年6月;31(6):325-7)。在某些实施方案中,本发明用于使用对病原体(例如,空肠弯曲菌、产气荚膜梭菌、沙门氏菌属某些种、大肠埃希氏菌、蜡样芽孢杆菌、单核细胞增生性李斯特菌(Listeria monocytogenes)、志贺氏菌属某些种、金黄色葡萄球菌、葡萄球菌性肠炎(Staphylococcal enteritis)、链球菌属、霍乱弧菌、副溶血性弧菌、创伤弧菌、小肠结肠炎耶尔森菌和假结核耶尔森菌(Yersiniapseudotuberculosis)、布鲁氏菌属某些种、溃疡棒状杆菌(Corynebacterium ulcerans)、贝氏柯克斯体(Coxiella burnetii)或类志贺邻单胞菌)具有特异性的指导RNA来快速检测食源性病原体。
在某些实施方案中,装置是或包括流动试纸条。例如,侧流试纸条允许通过颜色进行检测。报告分子被修饰为具有附接至5'端的第一分子(诸如例如FITC)和附接至3'端的第二分子(诸如例如生物素)(或反之亦然)。侧流试纸条被设计为具有两条捕获线,其中抗第一分子(例如,抗FITC)抗体在第一线处杂交,并且抗第二分子(例如,抗生物素)抗体在第二下游线处杂交。当反应沿着条带流动时,未切割的报告分子将在第一捕获线结合抗第一分子抗体,而切割的报告分子将释放第二分子并允许第二分子在第二捕获线结合。第二分子夹心抗体,例如与纳米颗粒(诸如金纳米颗粒)缀合的抗体,将结合第一线或第二线处的任何第二分子,并产生强读出/信号(例如,颜色)。随着更多报告分子被切割,第二捕获线上将积累更多信号,并且第一线上将出现更少信号。在某些方面,本发明涉及如本文所述的跟随试纸条用于检测核酸或多肽的用途。在某些方面,本发明涉及一种用如本文所定义的流动试纸条检测核酸或多肽的方法,例如(侧向)流动测试或(侧向)流动免疫色谱测定。
本文公开的实施方案涉及包括TnpB系统的侧流检测装置。装置可以包括用于检测TnpB旁切反应的侧流基底。适用于侧流测定的底物是本领域已知的。这些可包括但不一定限于由纤维素和/或玻璃纤维、聚酯、硝化纤维素制成的膜或垫、或吸收垫(J Saudi ChemSoc 19(6):689-705;2015)。将TnpB系统(即,一种或多种TnpB系统和对应的报告构建体)在侧流基底的限定试剂部分处(通常在侧流基底的一端)添加至侧流基底。本发明上下文中使用的报告构建体包含通过DNA接头连接的第一分子和第二分子。侧流基底还包括样品部分。样品部分可以与试剂部分等同、连续或邻近。侧流试纸条还包括第一捕获线,通常是穿过装置的水平线,但其他配置也是可能的。第一捕获区域邻近侧流基底并且位于侧流基底的与样品装载部分的同一端部上。特异性结合报告构建体的第一分子的第一结合剂固定或以其他方式固定化至第一捕获区域。第二捕获区域位于朝向侧流基底的与第一结合区域相反的端部。第二结合剂固定或以其他方式固定化至第二捕获区域。第二结合剂特异性结合报告构建体的第二分子,或者第二结合剂可以结合可检测配体。例如,可检测配体可以是当其聚集时可以目视检测到的颗粒,诸如胶体颗粒。颗粒可以用特异性结合报告构建体上的第二分子的抗体进行修饰。如果报告构建体未被切割,它将促进可检测配体在第一结合区域处的积累。如果报告构建体被切割,则可检测配体被释放以流动至第二结合区域。在此种实施方案中,第二结合剂是能够将可检测配体特异性或非特异性结合在可检测配体上的抗体上的试剂。适用于此种实施方案的结合剂的实例包括但不限于蛋白质A和蛋白质G。
侧向支持基底可以位于外壳内(参见,例如,“Rapid Lateral Flow Test Strips”Merck Millipore 2013)。外壳可以包括用于装载样品的至少一个开口和允许读取在第一捕获区域和第二捕获区域处产生的可检测信号的第二单个开口或单独的开口。
TnpB系统可以冷冻干燥至侧流基底并包装为即用型装置,或者可以在使用装置时将TnpB系统添加至侧流基底的试剂部分。将待筛选的样品装载到侧流基底的样品装载部分。样品必须是液体样品或溶解在适当溶剂(通常是水性)中的样品。液体样品重构TnpB试剂,使得可以发生TnpB反应。液体样品开始从基底的样品部分流向第一捕获区域和第二捕获区域。完整的报告构建体通过第一结合剂与第一分子之间的结合而在第一捕获区域处结合。同样,检测剂将通过与完整报告构建体上的第二分子结合而开始在第一结合区域处收集。如果样品中存在靶分子,TnpB旁切效应就会被活化。当活化的TnpB与结合的报告构建体接触时,报告构建体被切割,从而释放第二分子以进一步沿着侧流基底流向第二结合区域。释放的第二分子然后通过与第二结合剂结合而在第二捕获区域处被捕获,其中额外的检测剂也可以通过与第二分子结合而积累。因此,如果样品中不存在靶分子,则可检测信号将出现在第一捕获区域处,而如果样品中存在靶分子,则可检测信号将出现在第二捕获区域的位置处。
特异性结合整合分子包括可用于本发明的结合对的任何成员。此类结合对是本领域技术人员已知的,并且包括但不限于抗体-抗原对、酶-底物对、受体-配体对和链霉亲和素-生物素。除了此类已知的结合对之外,还可以专门设计新型结合对。结合对的一个特征是结合对的两个成员之间的结合。
如果TnpB具有DNA旁切活性,则任一端具有分子的寡核苷酸接头可包含DNA。寡核苷酸接头可以是单链或双链的,并且在某些实施方案中,它们可以含有RNA和DNA区域。寡核苷酸接头可以具有不同的长度,诸如5-10个核苷酸、10-20个核苷酸、20-50个核苷酸或更多。
在一些实施方案中,多肽标识符元件包括亲和标签,诸如血凝素(HA)标签、Myc标签、FLAG标签、V5标签、几丁质结合蛋白(CBP)标签、麦芽糖结合蛋白(MBP)标签、GST标签、聚His标签和荧光蛋白(例如,绿色荧光蛋白(GFP)、黄色荧光蛋白(YFP)、青色荧光蛋白(CFP)、dsRed、mCherry、Kaede、Kindling及其衍生物、FLAG标签、Myc标签、AU1标签、T7标签、OLLAS标签、Glu-Glu标签、VSV标签或其组合。其他亲和标签是本领域众所周知的。可以使用本领域已知的方法(例如,通过使用识别特定亲和标签的特异性结合剂,诸如抗体)来检测和/或分离此类标记。此类特异性结合剂(例如,抗体)还可以含有例如可检测标记,诸如同位素标记和/或核酸条形码,诸如本文所述的那些。
在某些示例性实施方案中,侧流装置包括侧流基底,所述侧流基底包括用于施加样品的第一端。第一区域装载有可检测配体,诸如本文公开的那些,例如金纳米颗粒。金纳米颗粒可以用第一抗体诸如抗FITC抗体修饰。第一区域还包含检测构建体。在一个示例性实施方案中,本文公开了一种DNA检测构建体和TnpB系统。在一个示例性实施方案中,并且出于进一步说明的目的,DNA构建体可以包含在检测构建体的第一端上的FAM分子和在检测构建体的第二端上的生物素。第一测试带位于侧流基底第一端的溶液流的上游。测试带可包含生物素配体。因此,当DNA检测构建体以其初始状态存在时,即在不存在靶标的情况下,第一端上的FAM分子将结合金纳米颗粒上的抗FITC抗体,并且DNA构建体第二端的生物素将结合生物素配体,从而允许可检测配体在第一次测试时积累,产生可检测信号。在第一条带处产生可检测信号表明不存在靶配体。在靶标的存在下,TnpB复合物形成,并且TnpB被活化,从而导致DNA检测构建体的切割。在不存在完整DNA检测构建体的情况下,胶体金将流过第二试纸条。侧流装置可包括位于第一条带上游的第二条带。第二条带可包含能够结合抗体标记的胶体金分子的分子,例如能够结合胶体金上的兔抗FTIC抗体的抗兔抗体。因此,在一个或多个靶标的存在下,可检测配体将在第二条带处累积,这表明样品中存在一个或多个靶标。
在某些示例性实施方案中,装置是产生和/或合并不同液滴(即,单独的离散体积)的微流体装置。例如,可以形成含有待筛选样品的第一组液滴,并且可以形成含有本文所述的系统的元件的第二组液滴。然后将第一组液滴和第二组液滴合并,然后对合并的液滴组进行如本文所述的诊断方法。本文公开的微流体装置可以是基于硅酮的芯片并且可以使用多种技术来制造,包括但不限于热压成形、弹性体模制、注射模制、LIGA、软光刻、硅制造和相关薄膜处理技术。用于制造微流体装置的合适材料包括但不限于环烯烃共聚物(COC)、聚碳酸酯、聚(二甲基硅氧烷)(PDMS)和聚(丙烯酸甲酯)(PMMA)。在一个实施方案中,PDMS中的软光刻可用于制备微流体装置。例如,可以使用光刻法来制造模具,所述模具限定了基底内的流动通道、阀和过滤器的位置。将基底材料倒入模具中并静置以产生印模。然后将印模密封到固体支撑物上,诸如但不限于玻璃。由于一些聚合物诸如PDMS的吸收一些蛋白质并可能抑制某些生物过程的疏水性,因此可能需要钝化剂(Schoffner等人Nucleic AcidsResearch,1996,24:375-379)。合适的钝化剂是本领域已知的并且包括但不限于硅烷、聚对二甲苯、正十二烷基-b-D-番茄苷(matoside)(DDM)、pluronic、Tween-20、其他类似的表面活性剂、聚乙二醇(PEG)、白蛋白、胶原蛋白以及其他类似的蛋白质和肽。
在某些示例性实施方案中,系统和/或装置可适合于转换为流式细胞术读出或允许在单个实验中对数百万个细胞进行所有灵敏和定量测量,并改进现有的基于流式的方法,诸如PrimeFlow测定。在某些示例性实施方案中,可以将细胞浇注成含有未聚合的凝胶单体的液滴,然后可以将所述液滴浇注成适合通过流式细胞术分析的单细胞液滴。可以将包含荧光可检测标记的检测构建体浇注到包含未聚合的凝胶单体的液滴中。凝胶单体聚合在液滴内形成珠子。由于凝胶聚合是通过自由基形成进行的,因此荧光报告分子与凝胶共价结合。检测构建体可以被进一步修饰以包含接头,诸如胺。淬灭剂可以在凝胶形成后添加,并且经由接头与报告构建体结合。因此,淬灭剂不与凝胶结合,并且当报告分子被TnpB切割时可以自由扩散。液滴中信号的扩增可以通过将检测构建体与杂交链反应(HCR起始子)扩增偶联来实现。DNA/RNA杂合发夹可掺入凝胶中,其可包含具有RNA酶敏感结构域的发夹环。通过保护具有RNA酶敏感结构域的发夹环内的链置换立足点,HCR起始子可在TnpB系统切割发夹环后选择性地去保护。经由立足点介导的链置换使HCR起始子去保护后,可将荧光HCR单体洗入凝胶中,以在起始子去保护的情况下实现信号扩增。
可以在本发明的背景下使用的微流体装置的实例描述于Hour等人“DirectDetection and drug-resistance profiling of bacteremias using inertialmicrofluidics”Lap Chip.15(10):2297-2307(2016)。
在本文描述的系统中,可以进一步掺入到可穿戴医疗装置中,所述装置评估诊所环境之外的受试者的生物样品诸如生物流体并将测定结果远程报告给医疗护理专业人员可访问的中央服务器。所述装置可以包括自采样血液的能力,诸如Peeters等人的标题为“Needle-free Blood Draw”的美国专利申请公开号2015/0342509、Andrew Conrad的标题为“Nanoparticle Phoresis”的美国专利申请公开号2015/0065821中公开的装置。
在一些实施方案中,单独的离散体积是微孔。
在某些示例性实施方案中,装置可包括单独的孔,例如微板孔。微板孔的大小可以是标准6、24、96、384、1536、3456或9600大小的孔的大小。在某些示例性实施方案中,本文所述的系统的元件可以在分配和使用之前被冷冻干燥并施加到孔的表面。
本文公开的装置还可包括入口端口和出口端口或开口,其进而可以连接至阀、管、通道、区室和注射器和/或泵,用于将流体引入装置中和从装置中提取流体。装置可以连接至允许流体在微流体装置内定向运动的流体流动致动器。示例性致动器包括但不限于注射泵、机械致动的再循环泵、电渗泵、灯泡、波纹管、隔膜或旨在迫使流体运动的气泡。在某些示例性实施方案中,装置连接至具有可编程阀的控制器,所述可编程阀一起工作以使流体运动通过装置。在某些示例性实施方案中,装置连接至下文进一步详细讨论的控制器。装置可以通过管道连接至流动致动器、控制器和样品装载装置,所述管道终止于金属销以插入到装置上的入口端口中。
如本文所示,系统的元件在冷冻干燥时是稳定的,因此还考虑了不需要支持装置的实施方案,即,系统可以应用于将支持本文公开的反应的任何表面或流体,并且允许检测来自所述表面或溶液的阳性可检测信号。除了冷冻干燥外,系统还可以以颗粒形式稳定储存和利用。可用于形成合适的颗粒形式的聚合物是本领域已知的。
在一些实施方案中,将单独的离散体积限定在固体基底上。在一些实施方案中,单独的离散体积是限定在基底上的点。在一些实施方案中,基底可以是柔性材料基底,例如,包括但不限于纸基底、织物基底或基于柔性聚合物的基底。在具体的实施方案中,柔性材料基底是纸基底或基于柔性聚合物的基底。
在某些实施方案中,TnpB结合至装置中的每个离散体积。每个离散体积可包含对不同靶分子具有特异性的不同ωRNA。在某些实施方案中,将样品暴露于固体基底,所述固体基底包含多于一个离散体积,每个离散体积包含对靶分子具有特异性的ωRNA。不受理论的束缚,每个ωRNA将从样品中捕获其靶分子,并且样品不需要被分成单独的测定。因此,可以保存有价值的样品。效应蛋白可以是包含亲和标签的融合蛋白。亲和标签是本领域众所周知的(例如,HA标签、Myc标签、Flag标签、His标签、生物素)。效应蛋白可连接至生物素分子并且离散体积可包含链霉亲和素。在其他实施方案中,CRISPR效应蛋白被对所述效应蛋白具有特异性的抗体结合。先前已经描述了结合CRISPR酶的方法(参见,例如,US20140356867A1)。
本文公开的装置还可包括本领域已知的用于通过其他方法分析样品的护理点(POC)装置的元件。参见,例如St John和Price,“Existing and Emerging Technologiesfor Point-of-Care Testing”(Clin Biochem Rev.2014年8月;35(3):155–167)。
本发明可以与无线芯片实验室(LOC)诊断传感器系统一起使用(参见,例如,美国专利号9,470,699“Diagnostic radio frequency identification sensors andapplications thereof”)。在某些实施方案中,本发明在由无线装置(例如,移动电话、个人数字助理(PDA)、平板电脑)控制的LOC中执行,并且将结果报告至所述装置。
射频识别(RFID)标签系统包括传输数据以供RFID读取器(也称为询问器)接收的RFID标签。在典型的RFID系统中,单个物体(例如,商店商品)配备有相对较小的标签,所述标签含有转发器。转发器具有存储器芯片,所述芯片具有唯一的电子产品代码。RFID读取器通过使用通信协议来发射活化标签内的转发器的信号。因此,RFID读取器能够读取数据并将数据写入标签。此外,RFID标签读取器根据RFID标签系统应用来处理数据。目前,存在无源型和有源型的RFID标签。无源型RFID标签不含有内部电源,而是由从RFID读取器接收的射频信号供电。或者,有源型RFID标签含有内部电源,所述内部电源使得有源型RFID标签具有更大的传输范围和存储容量。无源型标签与有源型标签的使用取决于特定的应用。
芯片实验室技术在科学文献中详细描述,标签由多个微流体通道、输入孔或化学孔组成。可以使用射频识别(RFID)标签技术测量孔中的反应,因为RFID电子芯片的导电引线可以直接连接到每个测试孔。天线可以印刷或安装在电子芯片的另一层中,或者直接安装在装置的背面。此外,引线、天线和电子芯片可以嵌入LOC芯片中,从而防止电极或电子器件短路。由于LOC允许复杂的样品分离和分析,因此这种技术允许LOC测试独立于复杂或昂贵的读取器进行。相反,可以使用简单的无线装置,诸如移动电话或PDA。在一个实施方案中,无线装置还控制微流体通道的分离和控制,以实现更复杂的LOC分析。在一个实施方案中,LOC-RFID芯片中包括LED和其他电子测量或感测装置。不受理论的束缚,这种技术是一次性的,并且允许在实验室外执行需要分离和混合的复杂测试。
在优选的实施方案中,LOC可以是微流体装置。LOC可以是无源型芯片,其中所述芯片通过无线装置来供电和控制。在某些实施方案中,LOC包括用于容纳试剂的微流体通道和用于引入样品的通道。在某些实施方案中,来自无线装置的信号将电力传送至LOC并活化样品与测定试剂的混合。具体地,在本发明的情况下,系统可以包括掩蔽剂、CRISPR效应蛋白和对靶分子具有特异性的指导RNA。当LOC活化时,微流体装置可以混合样品和测定试剂。混合后,传感器检测到信号并将结果传输至无线装置。在某些实施方案中,暴露剂(unmaskingagent)是导电RNA分子。导电RNA分子可以附着至导电材料。导电分子可以是导电纳米颗粒、导电蛋白质、附着在蛋白质或乳胶或其他导电珠上的金属颗粒。在某些实施方案中,如果使用DNA或RNA,则导电分子可以直接附着至匹配的DNA或RNA链。可以通过传感器检测导电分子的释放。所述测定可以是一步过程。
由于可以精确测量表面区域的电导率,因此一次性无线RFID电测定可以得到定量结果。此外,测试区域可以非常小,从而允许在给定区域进行更多测试,从而节省成本。在某些实施方案中,使用各自与不同CRISPR效应蛋白缔合的单独传感器和固定至传感器的指导RNA来检测多个靶分子。不受理论的束缚,无线装置可以区分不同传感器的活化。
除了本文所述的导电方法之外,还可以使用依赖于RFID或蓝牙作为用于一次性RFID测定的基本低成本通信和电力平台的其他方法。例如,可以使用光学构件来评估给定靶分子的存在和水平。在某些实施方案中,光学传感器检测荧光掩蔽剂的暴露。
在某些实施方案中,本发明的装置可以包括用于测定的诊断读取的手持便携式装置(参见,例如,Vashist等人,Commercial Smartphone-Based Devices and SmartApplications for Personalized Healthcare Monitoring and Management,Diagnostics 2014,4(3),104-128;来自Mobile Assay的mReader;以及Holomic快速诊断测试阅读器)。
如本文所指出的,某些实施方案允许经由比色变化进行检测,当在POC情况和/或在访问更复杂的检测设备以读出信号可能受到限制的资源匮乏的环境中使用实施方案时,这具有某些附带的好处。然而,本文公开的便携式实施方案还可以与能够检测可见范围之外的信号的手持式分光光度计耦合。可以与本发明组合使用的手持式分光光度计装置的实例描述于Das等人“Ultra-portable,wireless smartphone spectrophotometer forrapid,non-destructive testing of fruit ripeness.”Nature ScientificReports.2016,6:32504,DOI:10.1038/srep32504。最后,在利用基于量子点的掩蔽构建体的某些实施方案中,由于量子点提供的接近完整的量子产率,手持式UV光或其他合适的装置的使用可以成功地用于检测信号。
用于检测核酸的方法
检测平台的低成本和适应性使其适合多种应用,包括(i)一般RNA/DNA定量,(ii)快速、多重RNA/DNA和蛋白质表达检测,以及(iii)临床和环境样品中的靶核酸、肽和蛋白质的灵敏检测。另外,本文公开的系统可适用于检测生物环境诸如细胞内的转录物。鉴于本文所述的CRISPR效应子的高度特异性,可以追踪活细胞中转录物或疾病相关突变的等位基因特异性表达。
在一些实施方案中,方法包括检测样品中的靶核酸,包括将样品或样品组分配到包含如本文所述的TnpB系统的一个或多个单独的离散体积中。然后可以在足以允许一个或多个ωRNA与一个或多个靶分子结合的条件下孵育样品或样品组,并且可以经由一个或多个ωRNA与一个或多个靶分子的结合来活化TnpB蛋白,其中活化CRISPR效应蛋白导致检测构建体的修饰,使得产生可检测的阳性信号。然后可以检测一个或多个可检测的阳性信号,检测表明样品中存在一个或多个靶分子。
在一些实施方案中,本发明的方法包括检测样品中的多肽,包括将样品或样品组分配到包含如本文所述的肽检测适体和TnpB的一组单独的离散体积中。然后可以在足以允许肽检测适体与一个或多个靶分子结合的条件下孵育样品或样品组,其中适体与对应靶分子的结合暴露了RNA聚合酶结合位点或引物结合位点,从而导致产生触发RNA(triggerRNA)。然后可以经由一个或多个ωRNA与触发RNA的结合来活化TnpB,其中活化TnpB蛋白导致检测构建体的修饰,使得产生可检测的阳性信号。然后可以检测可检测的阳性信号,可检测的阳性信号的检测表明样品中存在一个或多个靶分子。
在某些示例性实施方案中,对单个靶标具有特异性的单个指导序列被放置在单独的体积中。然后每个体积可以接收不同的样品或同一样品的等分试样。在某些示例性实施方案中,可以将各自分离靶标的多个ωRNA放置在单个孔中,使得可以在不同的孔中筛选多个靶标。为了检测单个体积中的多个ωRNA,在某些示例性实施方案中,可以使用具有不同特异性的多种TnpB蛋白。
在实施方案中,可以使用具有不同序列特异性的不同TnpB直系同源物。切割基序可用于利用不同直系同源物的序列特异性。检测构建体可以包含优先被给定TnpB直系同源物切割的切割基序。切割基序序列可以是特定的核苷酸碱基、均聚物中的重复核苷酸碱基、或碱基的杂聚物。切割基序可以是二核苷酸序列、三核苷酸序列或包含4、5、6、7、8、9或10个核苷酸基序的更复杂的基序。例如,一种直系同源物可优先切割A,而其他直系同源物优先切割C、G、U/T。因此,可以产生完全包含单个核苷酸的实质部分或由其组成的检测构建体,每个构建体具有可以在不同波长下被检测到的不同荧光团。以此方式,可以在单个单独的离散体积中筛选多达四个不同的靶标。在某些其他示例性实施方案中,可以使用具有不同核苷酸编辑偏好的不同直系同源物,诸如TnpB与Cas13或Cas12的组合。
除了单碱基编辑偏好之外,还可以基于TnpB、Cas12和Cas13直系同源物的其他基序切割偏好来设计额外的检测构建体。例如,Cas13或Cas12直系同源物可优先切割二核苷酸序列、三核苷酸序列或包含4、5、6、7、8、9或10个核苷酸基序的更复杂的基序。例如,LwaCas13a显示出对六核苷酸基序序列的强烈偏好,而CcaCas13b显示出对其他六核苷酸基序的强烈偏好。因此,使用本文公开的实施方案的多重测定的上限主要受到可区分的可检测标记和检测它们所需的检测通道的数量的限制。在某些示例性实施方案中,检测到2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、25、27、28、29或30个不同的靶标。用于鉴定此类基序的示例性方法在以下工作实施例中进一步公开。
在具体的实施方案中,靶分子可以是靶DNA并且方法还可包括将靶DNA与包含RNA聚合酶位点的引物结合,如本文所述。
在具体的实施方案中,一个或多个ωRNA可被设计为检测靶RNA或DNA中的单核苷酸多态性,或RNA转录物的剪接变体。
与本发明一起使用的样品可以是生物或环境样品,诸如食品样品(新鲜水果或蔬菜、肉类)、饮料样品、纸张表面、织物表面、金属表面、木材表面、塑料表面、土壤样品、淡水样品、废水样品、盐水样品、暴露于大气或其他气体样品、或其组合。例如,可以擦拭由包括但不限于金属、木材、塑料、橡胶等的任何材料制成的家用/商业/工业表面并测试污染物。可以测试土壤样品是否存在病原性细菌或寄生虫或其他微生物,以用于环境目的和/或用于人类、动物或植物疾病测试。可以评价水样品(诸如淡水样品、废水样品或盐水样品)的清洁度和安全性和/或可饮用性以检测例如小隐孢子虫(Cryptosporidium parvum)、蓝氏贾第虫或其他微生物污染物的存在。在另外的实施方案中,生物样品可以从包括但不限于以下的来源获得:组织样品、唾液、血液、血浆、血清、粪便、尿液、痰、粘液、淋巴液、滑液、脑脊液、腹水、胸腔积液、血清肿、脓液、胆汁、房水或玻璃体液、漏出液、渗出液、或皮肤或粘膜表面的拭子。在一些特定的实施方案中,环境样品或生物样品可以是粗样品且/或在应用方法之前可以不从样品中纯化或扩增一个或多个靶分子。微生物的鉴定对于任何数量的应用来说可能是有用的和/或需要的,因此可以根据本发明使用本领域技术人员认为合适的来自任何来源的任何类型的样品。
在一些实施方案中,一个或多个ωRNA可被设计为结合细胞游离核酸。在一些实施方案中,一个或多个ωRNA可被设计为检测靶RNA或DNA中的单核苷酸多态性,或RNA转录物的剪接变体。在一些实施方案中,一个或多个指导RNA被设计为与诊断疾病状态的一个或多个靶分子结合,如本文所述。
在一些实施方案中,疾病状态可以是感染、器官疾病、血液疾病、免疫系统疾病、癌症、脑和神经系统疾病、内分泌疾病、妊娠或分娩相关疾病、遗传性疾病、或环境获得的疾病。
在某些示例性实施方案中,本文公开的系统、装置和方法涉及检测样品(诸如从受试者获得的生物样品)中一种或多种微生物剂的存在。在某些示例性实施方案中,微生物可以是细菌、真菌、酵母、原生动物、寄生虫或病毒。因此,本文公开的方法可适用于需要快速鉴定微生物物种、监测微生物蛋白(抗原)、抗体、抗体基因的存在、检测某些表型(例如,细菌抗性)、监测疾病进展和/或爆发以及抗生素筛查的其他方法或与其他方法(组合)使用。由于本文公开的实施方案的快速且灵敏的诊断能力、微生物物种类型的检测、低至单个核苷酸差异以及部署为POC装置的能力,本文公开的实施方案可用作指导治疗方案,诸如选择适当的抗生素或抗病毒药物。本文公开的实施方案还可用于筛选环境样品(空气、水、表面、食物等)中是否存在微生物污染。
公开了一种鉴定微生物物种(诸如细菌、病毒、真菌、酵母或寄生物种等)的方法。本文公开的特定实施方案描述了将识别和区分单个样品内或多个样品内的微生物物种,从而允许识别许多不同的微生物的方法和系统。本发明的方法允许通过检测生物或环境样品中靶核酸序列的存在来检测病原体并且区分所述样品中的一种或多种生物体的两种或更多种物种,例如细菌、病毒、酵母、原生动物和真菌或其组合。从样品中获得的阳性信号表明微生物的存在。通过使用多于一种效应蛋白,可以使用本发明的方法和系统同时鉴定多种微生物,其中每种效应蛋白靶向特定的微生物靶序列。以此方式,可以对特定受试者执行多水平分析,其中可以一次检测任何数量的微生物。在一些实施方案中,可以使用一组可鉴定一种或多种微生物物种的探针进行多种微生物的同时检测。
样品的多重分析实现了样品的大规模检测,从而减少分析的时间和成本。然而,多重分析通常受到生物样品可用性的限制。然而,根据本发明,可以执行多重分析的替代方案,使得可以将多种效应蛋白添加至单个样品,并且每个掩蔽构建体可以与单独的淬灭剂染料组合。在此情况下,可以分别从每种淬灭剂染料获得阳性信号,以在单个样品中进行多次检测。
本文公开了用于区分样品中的一种或多种生物体的两种或更多种物种的方法。方法还适合于检测样品中的一种或多种生物体的一种或多种物种。
在一些实施方案中,方法提供对疾病状态的检测,所述疾病状态的特征在于优选在病原体或细胞中存在或不存在抗生素或药物抗性或易感性基因或转录物或多肽。
用于检测测定的装置
在一个实施方案中,可以在盒或芯片上提供检测测定。在一个方面,盒可以包括连通耦合的一个或多个安瓿和一个或多个孔,从而允许在使用或不使用珠子的情况下将试剂和样品转移、交换或移动通过盒的区室并且促进检测测定,所述检测测定利用用于促进盒上的检测测定的系统/装置。
根据本发明的盒,在本文中也称为芯片,包括与盒上的一个或多个其他组件连通耦合的一系列安瓿和区室的组件。耦合通常是流体连通,例如经由通道。盒可包括密封区室和/或安瓿中的一者或多者的膜。在一个方面,膜允许储存覆盖并密封盒的试剂、缓冲液和其他固体或流体组分。膜可被配置成通过用于释放试剂的构件被穿刺、刺穿或以其他方式从密封或覆盖盒的一个或多个组件中释放。
如上所述,某些实施方案使得能够使用核酸结合珠来浓缩靶核酸,但不需要洗脱分离的核酸。因此,在某些示例性实施方案中,盒还可包括可活化磁体,诸如电磁体。用于活化磁体的构件可以位于装置上,或者用于供应磁体或活化盒上的磁体的构件可以由第二装置提供,所述第二装置诸如下文进一步详细公开的那些装置。
安瓿
安瓿也称为泡罩,允许在整个盒中储存和释放试剂。安瓿可以包括液体或固体试剂,例如,一个安瓿中的裂解试剂和另一个安瓿中的反应试剂。试剂可以如本文别处所述,并且可以适合在盒中使用。安瓿可以由膜密封,所述膜允许破裂、穿刺或以其他方式释放安瓿的内容物。参见,例如,Becker,H.&C.Microfluidics-enabled diagnosticsystems:markets,challenges,and examples.In Microchip Diagnostics:Methods andProtocols(Taly,V.等人编辑)(Springer,New York,2017);Czurratis等人,doi:10.1088/0960-1317/25/4/045002。对于安瓿的考虑因素可以包括例如Smith,S.等人,Blisterpouches for effective reagent storage on microfluidic chips for blood cellcounting.Microfluid Nanofluid 20,163(2016).DOI:10.1007/s10404-016-1830-2中讨论的。在一个方面,密封件是由组装至盒主体的复合层膜形成的易碎密封件。虽然在本文中被称为安瓿,但是所述安瓿可包括芯片上的空腔,所述空腔包括由释放构件打开的密封膜。
区室
芯片上的区室的位置和大小可以设置为经由通道或其他连通构件与安瓿和/或芯片上的其他区室流体连通。
用于读取测定结果的构件
系统中可以提供用于读取测定结果的构件。用于读取测定结果的构件将部分取决于所述测定产生的可检测信号的类型。在特定的实施方案中,测定产生可检测的荧光或颜色读数。在这些情况下,用于读取测定结果的构件将是光学构件,例如单通道或多通道光学构件,诸如荧光计、比色计或其他光谱传感器。
可以利用用于读取测定结果的构件的组合,并且可以包括诸如浊度、温度、磁、无线电或电性质和/或光学性质(包括散射、偏振效应等)的读数。
系统还可包括用于对装置进行编程和/或读出测定结果的用户界面。用户界面可包括LED屏幕。系统还可以进一步配置有允许对接四个或更多个装置的USB端口。
在一个方面,系统包括用于活化设置在盒内或盒上的磁体的构件。
侧流装置
在一个实施方案中,检测测定可以在侧流装置上提供,示例性侧流装置参见例如国际公开WO 2019/071051,其通过引用并入本文。侧流装置可适合于检测一种或多种冠状病毒和/或其他病毒与冠状病毒的组合。侧流装置可包括柔性基底,诸如纸基底或基于柔性聚合物的基底,所述基底可以包括用于检测测定的冻干试剂和测定结果的目视读数。参见WO 2019/071051的[0145]-[0151]和实施例2,其明确通过引用并入本文。在一个方面,冻干试剂可以包括有助于反应速率、特异性或其他变量的优选赋形剂,例如海藻糖、组氨酸和/或甘氨酸。在一个实施方案中,冠状病毒测定可与等温扩增试剂一起利用,从而允许在不使用现场可能无法获得的复杂仪器的情况下进行扩增。因此,测定可以适用于现场诊断,包括使用侧流装置上的目视读数、快速、灵敏的检测,并且可以部署用于早期和直接检测。可以利用比色检测,并且比色检测可以特别适合现场可部署应用,如国际申请PCT/US2019/015726所述,其公开为WO2019/148206。特别地,比色检测可以如WO2019/148206中的图102、图105、图107至图111和[00306]-[00324]中所述并且可以与TnpB系统一起使用,所述专利通过引用并入本文。
在一个实施方案中,本发明提供了一种侧流装置,其包括有包括第一端和第二端的基底。第一端可包括样品装载部分;第一区域,所述第一区域包括可检测配体、两个或更多个TnpB系统、两个或更多个检测构建体、以及一个或多个第一捕获区域,每个第一捕获区域包含第一结合剂。基底在第一端的第一区域与第二端之间还可以包括两个或更多个第二捕获区域,每个第二捕获区域包括不同的结合剂。两个或更多个TnpB系统中的每一个可包含TnpB蛋白和一个或多个核酸组分分子,每个核酸组分分子序列被配置为结合一个或多个靶分子。
装置可以包括用于检测TnpB多肽与靶分子之间的反应的侧流基底,所述反应触发检测构建体的旁切、非特异性切割。适用于侧流测定的基底是本领域已知的。这些可包括但不一定限于由纤维素和/或玻璃纤维、聚酯、硝化纤维素制成的膜或垫或吸收垫(J SaudiChem Soc 19(6):689-705;2015)以及本文进一步描述的其他实施方案。将检测系统(即,一种或多种TnpB系统和对应的报告构建体)在侧流基底的限定试剂部分处(通常在侧流基底的一端)添加至侧流基底。本发明上下文中使用的报告构建体可包含通过RNA或DNA接头连接的第一分子和第二分子。侧流基底还包括样品部分。样品部分可以与试剂部分等同、连续或邻近。在一个方面,侧流基底可以包含在另外的装置内。在一个方面,侧流基底可用于在一锅反应中目视读出可检测信号,例如其中提取、扩增和检测步骤在单独的离散体积中执行。
侧流基底
在某些示例性实施方案中,侧流装置包括可以在其上执行检测的侧流基底。适用于侧流测定的基底是本领域已知的。这些可包括但不一定限于由纤维素和/或玻璃纤维、聚酯、硝化纤维素制成的膜或垫或吸收垫(J Saudi Chem Soc 19(6):689-705;2015)。
侧向支撑基底包括第一端和第二端,以及一个或多个各自包含结合剂的捕获区域。第一端可包括样品装载部分;第一区域,所述第一区域包括可检测配体、两个或更多个TnpB系统、两个或更多个检测构建体、以及一个或多个第一捕获区域,每个第一捕获区域包含第一结合剂。基底在第一端的第一区域与第二端之间还可以包括两个或更多个第二捕获区域,每个第二捕获区域包括不同的结合剂。两个或更多个TnpB系统中的每一个可包含TnpB蛋白和一个或多个核酸组分分子,每个核酸组分被配置为结合一个或多个靶分子。侧流基底可被配置成检测反应,其中当靶分子在反应中被TnpB蛋白结合和切割时触发旁切的非特异性切割。
侧向支持基底可以位于外壳内(参见,例如,“Rapid Lateral Flow Test Strips”Merck Millipore 2013)。外壳可以包括用于装载样品的至少一个开口和允许读取在第一捕获区域和第二捕获区域处产生的可检测信号的第二单个开口或单独的开口。
本文公开的实施方案可以以冷冻干燥形式制备,以方便分配和护理点(POC)应用。此类实施方案可用于人类健康的多种情况,包括例如病毒检测、细菌菌株分型、敏感基因分型以及与疾病相关的细胞游离DNA的检测。因此,包含系统元件中的一个或多个(包括可检测配体、TnpB系统、检测构建体和结合剂)的侧向基底可被冷冻干燥成侧流基底并包装为即用型装置。或者,可以在使用装置时将系统的全部或部分元件添加至侧流基底的试剂部分。
基底的第一端和第二端
侧流装置的基底包括第一端和第二端。将TnpB系统(即,一种或多种TnpB系统和对应的报告构建体)在侧流基底的限定试剂部分处(通常在侧流基底的第一端)添加至侧流基底。本发明上下文中使用的报告构建体包含通过RNA或DNA接头连接的第一分子和第二分子。侧流基底还包括样品部分。样品部分可以与试剂部分等同、连续或邻近。
在某些示例性实施方案中,第一端包括第一区域。第一区域包括可检测配体、两个或更多个TnpB系统、两个或更多个检测构建体、以及一个或多个第一捕获区域,每个第一捕获区域包含第一结合剂。
捕获区域
侧流基底可包括一个或多个捕获区域。在实施方案中,侧流基底的第一端包括一个或多个第一捕获区域,在基底的第一端的第一区域与基底的第二端之间具有两个或更多个第二捕获区域。捕获区域可被提供为捕获线,通常是穿过装置的水平线,但其他配置也是可能的。第一捕获区域邻近侧流基底并且位于侧流基底的与样品装载部分的同一端部上。
结合剂
特异性结合整合分子包括可用于本发明的结合对的任何成员。此类结合对是本领域技术人员已知的,并且包括但不限于抗体-抗原对、酶-底物对、受体-配体对和链霉亲和素-生物素。除了此类已知的结合对之外,还可以专门设计新型结合对。结合对的一个特征是结合对的两个成员之间的结合。
特异性结合报告构建体的第一分子的第一结合剂固定或以其他方式固定化至第一捕获区域。第二捕获区域位于朝向侧流基底的与第一捕获区域相反的端部。第二结合剂固定或以其他方式固定化至第二捕获区域。第二结合剂特异性结合报告构建体的第二分子,或者第二结合剂可以结合可检测配体。例如,可检测配体可以是当其聚集时可以目视检测到并且产生可检测阳性信号的颗粒,诸如胶体颗粒。颗粒可以用特异性结合报告构建体上的第二分子的抗体进行修饰。如果报告构建体未被切割,它将促进可检测配体在第一结合区域处的积累。如果报告构建体被切割,则可检测配体被释放以流动至第二结合区域。在此种实施方案中,第二结合区域包含第二结合剂,其能够将可检测配体特异性或非特异性结合在可检测配体的抗体上。结合剂可以是例如识别特定亲和标签的抗体。此类结合剂还可以含有例如可检测标记,诸如同位素标记和/或核酸条形码。条形码是用作标识符的短核苷酸序列(例如,DNA、RNA或其组合)。核酸条形码可以具有4-100个核苷酸的长度并且可以是单链或双链的。用条形码鉴定细胞的方法是本领域已知的。因此,本文所述的TnpB系统的核酸组分分子可用于检测条形码。
可检测配体
第一区域装载有可检测配体,诸如本文公开的那些,例如金纳米颗粒。可检测配体可以是当其聚集时可以目视检测到的颗粒,诸如胶体颗粒。颗粒可以用特异性结合报告构建体上的第二分子的抗体进行修饰。如果报告构建体未被切割,它将促进可检测配体在第一结合区域处的积累。如果报告构建体被切割,则可检测配体被释放以流动至第二结合区域。在此种实施方案中,第二结合剂是能够将可检测配体特异性或非特异性结合在可检测配体上的抗体上的试剂。适用于此种实施方案的结合剂的实例包括但不限于蛋白质A和蛋白质G。在一些实例中,可检测配体是金纳米颗粒,其可以用第一抗体诸如抗FITC抗体修饰。
侧流检测构建体
第一区域还包含检测构建体。在一个示例性实施方案中,本文公开了RNA检测构建体和TnpB系统(TnpB蛋白和被配置为结合一个或多个靶序列的一个或多个核酸组分分子)。在一个示例性实施方案中,并且出于进一步说明的目的,RNA构建体可以包含在检测构建体的第一端上的FAM分子和在检测构建体的第二端上的生物素。第一测试带位于侧流基底第一端的溶液流的上游。测试带可包含生物素配体。因此,当RNA检测构建体以其初始状态存在时,即在不存在靶标的情况下,第一端上的FAM分子将结合金纳米颗粒上的抗FITC抗体,并且RNA构建体第二端的生物素将结合生物素配体,从而允许可检测配体在第一次测试时积累,产生可检测信号。在第一条带处产生可检测信号表明不存在靶配体。在靶标的存在下,TnpB复合物形成,并且TnpB蛋白被活化,从而导致检测构建体的切割。在不存在完整RNA检测构建体的情况下,胶体金将流过第二试纸条。侧流装置可包括位于第一条带上游的第二条带。第二条带可包含能够结合抗体标记的胶体金分子的分子,例如能够结合胶体金上的兔抗FITC抗体的抗兔抗体。因此,在一个或多个靶标的存在下,可检测配体将在第二条带处累积,这表明样品中存在一个或多个靶标。
在一个实施方案中,侧流装置的第一端包含两个检测构建体,并且两个检测构建体中的每一个包含RNA或DNA寡核苷酸,其包含在第一端上的第一分子和在第二端上的第二分子。第一分子和第二分子可以通过RNA或DNA接头连接。
在一个实施方案中,第一检测构建体的第一端上的第一分子可以是FAM,而第一检测构建体的第二端上的第二分子可以是生物素,或反之亦然。在一个实施方案中,第二检测构建体的第一端上的第一分子可以是FAM,而第二检测构建体的第二端上的第二分子可以是地高辛(DIG),或反之亦然。
在一个实施方案中,第一端可包含三个检测构建体,其中三个检测构建体中的每一个包含RNA或DNA寡核苷酸,其包含在第一端上的第一分子和在第二端上的第二分子。在具体的实施方案中,检测构建体上的第一和第二分子分别包括Tye 665和Alexa 488;Tye665和FAM以及Tye 665和地高辛(DIG)。
在一个实施方案中,侧流装置的第一端包含两个或更多个TnpB系统,也称为TnpB系统。在一个实施方案中,此种TnpB系统可以包括TnpB蛋白和被配置为结合一个或多个靶序列的一个或多个核酸组分分子。
样品
当使用具有侧流基底的检测系统时,将待筛选的样品装载到侧流基底的样品装载部分。样品必须是液体样品或溶解在适当溶剂(通常是水性)中的样品。液体样品重构检测试剂,使得可以发生检测反应。液体样品开始从基底的样品部分流向第一捕获区域和第二捕获区域。
与本发明一起使用的样品可以是生物或环境样品,诸如表面样品、流体样品或食品样品(新鲜水果或蔬菜、肉类)。食品样品可包括饮料样品、纸张表面、织物表面、金属表面、木材表面、塑料表面、土壤样品、淡水样品、废水样品、盐水样品、暴露于大气或其他气体样品、或其组合。例如,可以擦拭由包括但不限于金属、木材、塑料、橡胶等的任何材料制成的家用/商业/工业表面并测试污染物。可以测试土壤样品是否存在病原性细菌或寄生虫或其他微生物,以用于环境目的和/或用于人类、动物或植物疾病测试。可以评价水样品(诸如淡水样品、废水样品或盐水样品)的清洁度和安全性和/或可饮用性以检测例如小隐孢子虫、蓝氏贾第虫或其他微生物污染物的存在。在另外的实施方案中,生物样品可以从包括但不限于以下的来源获得:组织样品、唾液、血液、血浆、血清、粪便、尿液、痰、粘液、淋巴液、滑液、脊髓液、脑脊液、腹水、胸腔积液、血清肿、脓液、胆汁、房水或玻璃体液、漏出液、渗出液、或皮肤或粘膜表面的拭子。在一些特定的实施方案中,环境样品或生物样品可以是粗样品且/或在应用方法之前可以不从样品中纯化或扩增一个或多个靶分子。微生物的鉴定对于任何数量的应用来说可能是有用的和/或需要的,因此可以根据本发明使用本领域技术人员认为合适的来自任何来源的任何类型的样品。
在特定的实施方案中,方法和系统可用于从患者样品中直接检测。在一个方面,方法和系统还可以允许使用目视读数从患者样品中直接检测,以进一步促进现场可部署性。在一个方面,可现场部署的版本可以包括例如如本文所述的侧流装置和系统和/或比色检测。所述方法和系统可用于区分多种病毒物种和毒株并鉴定临床相关突变,这对于病毒爆发(诸如冠状病毒爆发(2019-nCoV))非常重要。在一个方面,样品来自鼻咽拭子或唾液样品。参见,例如Wyllie等人,“Saliva is more sensitive for SARS-CoV-2detection inCOVID-19patients than nasopharyngeal swabs,”DOI:10.1101/2020.04.16.20067835。
用于检测和/或量化靶核酸的方法
在一个实施方案中,本发明提供了用于检测样品中的靶核酸的方法。此类方法可包括使样品与如本文所述的侧流装置的第一端接触。侧流装置的第一端可包括样品装载部分,其中样品从基底的样品装载部分流向第一捕获区域和第二捕获区域并且产生可检测信号。
阳性可检测信号可以是可以使用光学、荧光、化学发光、电化学或本领域已知的其他检测方法检测的任何信号,如本文别处所述。
在一个实施方案中,侧流装置可能能够检测两种不同的靶核酸序列。在一个实施方案中,两种不同靶核酸序列的这种检测可以同时发生。
在一个实施方案中,样品中靶核酸序列的不存在在每个捕获区域处引发可检测的荧光信号。在此类情况下,样品中任何靶核酸序列的不存在可能引起在第一和第二捕获区域处出现可检测信号。
在一个实施方案中,如本文所述的侧流装置能够检测三种不同的靶核酸序列。在具体的实施方案中,当样品中不存在靶核酸序列时,可以在三个捕获区域中的每一个处产生荧光信号。在此类示例性实施方案中,当样品含有一个或多个靶核酸序列时,在对应靶核酸序列的捕获区域处可能不存在荧光信号。
将待筛选的样品装载到侧流基底的样品装载部分。样品必须是液体样品或溶解在适当溶剂(通常是水性)中的样品。液体样品重构系统试剂,使得可以发生检测反应。完整的报告构建体通过第一结合剂与第一分子之间的结合而在第一捕获区域处结合。同样,检测剂将通过与完整报告构建体上的第二分子结合而开始在第一结合区域处收集。如果样品中存在靶分子,TnpB蛋白旁切效应就会被活化。当活化的TnpB蛋白与结合的报告构建体接触时,报告构建体被切割,从而释放第二分子以进一步沿着侧流基底流向第二结合区域。释放的第二分子然后通过与第二结合剂结合而在第二捕获区域处被捕获,其中额外的检测剂也可以通过与第二分子结合而积累。因此,如果样品中不存在靶分子,则可检测信号将出现在第一捕获区域处,而如果样品中存在靶分子,则可检测信号将出现在第二捕获区域的位置处。
在一个实施方案中,本发明提供了一种用于量化样品中靶核酸的方法,其包括将样品或样品组分配到包含如本文所述的两个或更多个TnpB系统的一个或多个单独的离散体积中。方法可包括使用HDA来扩增样品或样品组中的一个或多个靶分子,如本文所述。方法还可以包括在足以允许核酸组分分子与一个或多个靶分子结合的条件下孵育样品或样品组。方法还可以包括经由核酸组分分子与一个或多个靶分子的结合来活化TnpB蛋白。活化TnpB蛋白可导致检测构建体的修饰,使得产生可检测的阳性信号。方法还可包括检测一个或多个可检测的阳性信号,其中检测表明样品中存在一个或多个靶分子。方法还可包括将一个或多个信号的强度与对照比较以量化样品中的核酸。扩增、孵育、活化和检测的步骤都可以在相同的单独的离散体积中执行。
“单独的离散体积”是离散体积或离散空间,诸如容器、接收器或可以由防止和/或抑制进行本文公开的方法所必需的核酸和试剂的迁移的特征件限定的其他限定体积或空间,例如由物理特征件(诸如壁,例如孔壁、管壁或液滴表面)限定的体积或空间,其可以是不可渗透的或半渗透的,或者如由其他方式限定的体积或空间,所述方式诸如化学的、扩散速率受限的、电磁的、或光照明、或其任何组合。“扩散速率受限”(例如扩散限定的体积)意指由于扩散约束有效限定了空间或体积(就像两个平行层流的情况一样,其中扩散将限制靶分子从一个流迁移至另一个流)而仅有某些分子或反应可进入的空间。“化学”限定的体积或空间意指由于其化学或分子性质(诸如尺寸)而仅可以存在某些靶分子的空间,其中例如凝胶珠可以诸如通过珠子的表面电荷、基质大小或可以允许选择可进入珠子内部的物质的其他珠物理性质来排除某些物质进入珠子,但不能排除其他物质。“电磁”限定的体积或空间意指靶分子或其支持物的电磁性质(诸如电荷或磁性)可以用于限定空间中的某些区域(诸如捕获磁场内或直接在磁体上的磁性颗粒)的空间。“光学”限定的体积意指可以通过用可见光、紫外线、红外线或其他波长的光照射它来限定,使得只有所限定空间或体积内的靶分子可以被标记的任何空间区域。使用无壁或半渗透的一个优点是一些试剂(诸如缓冲剂、化学活化剂或其他剂)可在申请人中通过离散体积,而其他材料诸如靶分子可以保留在离散体积或空间中。通常,离散体积将包括适合于在允许标记的条件下用可转位核酸标识符标记靶分子的流体介质(例如,水性溶液、油、缓冲液和/或能够支持细胞生长的培养基)。可用于所公开方法的示例性离散体积或空间包括液滴(例如,微流体液滴和/或乳液液滴)、水凝胶珠或其他聚合物结构(例如,聚乙二醇二丙烯酸酯珠或琼脂糖珠)、组织载玻片(例如,固定的福尔马林石蜡包埋的组织载玻片,其具有通过化学、光学或物理方式限定的特定区域、体积或空间)、显微镜载玻片,其区域通过以有序阵列或随机图案沉积试剂来限定、管(诸如离心管、微量离心管、试管、比色皿、锥形管等)、瓶(诸如玻璃瓶、塑料瓶、陶瓷瓶、锥形瓶、闪烁瓶等)、孔(诸如板中的孔)、板、移液器或移液器头等。在某些示例性实施方案中,单独的离散体积是微板的孔。在某些示例性实施方案中,微板是96孔、384孔或1536孔微板。
可以使用本领域已知的热源来执行如本文所述的扩增步骤或提取步骤中的样品孵育。有利地,热源可以是不需要复杂仪器的容易商购获得的热源。示例性加热系统可包括加热块、培养箱和/或水浴,其温度由可商购获得的真空低温(sous-vide)炊具维持。以此方式,可以在不需要主要存在于诊断实验室和医院环境中的昂贵且专有的设备的情况下执行样品诊断。
在某些示例性实施方案中,基于纸的微流体可以用于样品或试剂的转移。例如,在距纸量油计的末端限定距离处印刷有蜡屏障的试纸条可用于限定待转移的试剂或样品的体积。例如,可以在纸量油计上印刷蜡屏障以限定微升体积,使得当量油计被转移到一定体积的试剂或样品中时,仅微升的所述试剂或样品被吸收到量油计上。可以将量油计放入第二试剂混合物中,其中试剂或样品将扩散到反应混合物中。此类组件允许在没有专用设备诸如移液器的情况下准备和使用测定。
可以使用光学构件来评估给定靶分子的存在和水平。在一个实施方案中,光学传感器检测荧光掩蔽剂的暴露。在一个实施方案中,本发明的装置可以包括用于测定的诊断读取的手持便携式装置(参见,例如,Vashist等人,Commercial Smartphone-BasedDevices and Smart Applications for Personalized Healthcare Monitoring andManagement,Diagnostics 2014,4(3),104-128;来自Mobile Assay的mReader;以及Holomic快速诊断测试阅读器)。
如本文所指出的,某些实施方案允许经由比色变化进行检测,当在POC情况和/或在访问更复杂的检测设备以读出信号可能受到限制的资源匮乏的环境中使用实施方案时,这具有某些附带的好处。然而,本文公开的便携式实施方案还可以与能够检测可见范围之外的信号的手持式分光光度计耦合。可以与本发明组合使用的手持式分光光度计装置的实例描述于Das等人“Ultra-portable,wireless smartphone spectrophotometer forrapid,non-destructive testing of fruit ripeness.”Nature ScientificReports.2016,6:32504,DOI:10.1038/srep32504。最后,在利用基于量子点的掩蔽构建体的一个实施方案中,由于量子点提供的接近完整的量子产率,手持式UV光或其他合适的装置的使用可以成功地用于检测信号。
扩增靶分子
扩增一个或多个靶分子的步骤可包括本领域已知的扩增系统。在一个实施方案中,扩增是等温的。在某些示例性实施方案中,可以在活化TnpB蛋白之前扩增靶RNA和/或DNA。可以使用任何合适的RNA或DNA扩增技术。在某些实施方案中,扩增步骤可以花费少于约1小时、50分钟、40分钟、30分钟、25分钟、20分钟或15分钟,这可以取决于样品、起始浓度和所使用的扩增的性质。
在一个实施方案中,靶分子的扩增和靶分子的检测可以在单个反应例如“一锅法”中执行。使用单锅法的一般指南可以如以下中所述:Gootenberg等人,Science 2018年4月27日:360(6387)439-444(通常使用Cas13、Cas12a和Csm6,在单个反应中检测多个靶标,并且专门在样品中执行DNA提取,并用作图S33中直接检测的输入);和Ding等人,“All-in-OneDual CRISPR-Cas12a(AIOD-CRISPR)Assay:A Case for Rapid,Ultrasensitive andVisual Detection of Novel Coronavirus SARS-CoV-2and HIV Virus,”doi:10.1101/2020.03.19.998724,biorxiv preprint(利用一对crRNA和双重CRISPR-Cas12a检测,实现靶标特异性核酸检测的一锅法)。
在某些示例性实施方案中,RNA或DNA扩增是等温扩增。在某些示例性实施方案中,等温扩增可以是基于核酸序列的扩增(NASBA)、重组酶聚合酶扩增(RPA)、环介导的等温扩增(LAMP)、链置换扩增(SDA)、解旋酶依赖性扩增(HDA)或切口酶扩增反应(NEAR)。在某些示例性实施方案中,可以使用非等温扩增方法,其包括但不限于PCR、多重置换扩增(MDA)、滚环扩增(RCA)、连接酶链反应(LCR)或分支扩增方法(RAM)。
靶分子的扩增可以通过如本文详细描述的方法来优化。在一个方面,设计优化了扩增中使用的引物。在特定的方面,等温扩增与TnpB系统一起使用。在任一种方法中,设计考虑因素可以遵循合理设计以优化反应。如本文所公开的方法的优化可以包括首先筛选引物以鉴定对特定靶标、TnpB蛋白和/或反应发挥良好作用的一组或多组引物。一旦筛选了引物,就可以执行镁浓度滴定,以确定信噪比读数更高的最佳镁浓度。在一个实例中,可以鉴定反应中具有特定引物、靶标、TnpB蛋白、温度和其他添加剂浓度的不同添加剂。可以进行优化,以减少反应中必须发生的步骤数和缓冲液交换、简化反应、并且降低转移步骤中的污染风险。类似地,优化盐水平以及所用盐的类型可以进一步促进并优化本文公开的一锅检测。
环介导的等温扩增
在某些示例性实施方案中,环介导的等温扩增(LAMP)反应可用于靶向核酸,所述反应涵盖LAMP和RT-LAMP反应两者。可以使用四引物系统执行LAMP,从而与聚合酶结合进行等温核酸扩增。Notomi等人,Nucleic Acids Res..2000,28,12,Nagamine等人,Molecularand Cellular Probes(2002)16,223-229,doi:10.1006/mcpr.2002.0415。当使用4引物系统执行LAMP时,提供两个成环内引物(表示为FIP和BIP)以及两个外引物F3和B3。内引物各自含有两个不同的序列,一个用于在扩增的第一阶段中引发,而另一个序列用于在随后的扩增状态中自我引发。两个外引物启动从FIP和BIP引物起始的核酸链的链置换,从而利用所提供的聚合酶产生环的形成和链置换核酸合成。LAMP可以用两个至六个引物进行,范围从仅两个成环引物到至少添加2个额外的引物LF和LB以及两个外引物和两个内引物。LAMP技术有利地具有高特异性并且可以在多种pH和温度下工作。在一个优选的方面,LAMP是在约45℃至75℃、55℃至70℃或60℃至65℃之间的等温反应。已经开发了比色LAMP(Y.Zhang等人,doi:10.1101/2020.92.26.20028373)、RT-LAMP(Lamb等人,doi:10.1101/2020.02.19.20025155;和Yang等人,doi:10.1101/2020.03.02.20030130)用于检测COVID-19,并且通过引用整体并入本文。
在一个实施方案中,LAMP试剂可以包括来自New England Biolabs的Bst 2.0+RTx或Bst 3.0。在一个实施方案中,LAMP试剂可包括比色或荧光检测。LAMP产物的检测可以使用比色工具来完成,诸如羟基萘酚蓝(参见,例如,Goto,M.等人,Colorimetric detectionof loop-mediated isothermal amplification reaction by using hydroxy naphtholblue.Biotechniques,2009.46(3):第167-72页.)、无色三苯甲烷染料(参见,例如,Miyamoto,S.等人,Method for colorimetric detection of double-stranded nucleicacid using leuco triphenylmethane dyes.Anal Biochem,2015.473:第28-33页)和pH敏感染料(参见,例如,Tanner,N.A.,Y.Zhang和T.C.Evans,Jr.,Visual detection ofisothermal nucleic acid amplification using pH-sensitive dyes.Biotechniques,2015.58(2):第59-68页);以及荧光检测(参见,例如,Yu等人,Clinical Chemistry,hvaa102,doi:10.1093/clinchem/hvaa1022020年5月12日),包括使用淬灭探针(参见,例如,Shirato等人,J Virol Methods.2018年8月;258:41-48.doi:10.1016/j.jviromet.2018.05.006)。
在一个方面,LAMP的引物组被设计成扩增一个或多个靶序列,从而产生包含所述一个或多个靶序列的扩增子。任选地,引物可以包含可以如本文别处所述设计的条形码。使用聚合酶和任选的逆转录酶(在利用RT-LAMP的情况下)孵育至足以进行LAMP扩增的温度,例如50℃-72℃,更优选55℃至65℃。优选地,LAMP反应中利用的酶是热稳定的。已经设计了LAMP引物位点,参见,例如Park等人,“Development of Reverse Transcription Loop-Mediated Isothermal Amplification Assays Targeting SARS-CoV-2”J.of Mol.Diag.(2020)。任选地,对照模板进一步与样品一起提供,所述对照模板可以与靶序列不同但共享引物结合位点。在示例性实施方案中,检测结果的目视读出可以使用可商购获得的侧流基底(例如可商购获得的纸质基底)来完成。
NASBA
在某些示例性实施方案中,RNA或DNA扩增是NASBA,其通过序列特异性反向引物从靶RNA的逆转录起始,以产生RNA/DNA双链体。然后使用RNA酶H来降解RNA模板,从而允许含有启动子诸如T7启动子的正向引物结合并启动互补链的延伸,从而产生双链DNA产物。然后,RNA聚合酶启动子介导的DNA模板转录创建靶RNA序列的拷贝。重要的是,每个新的靶RNA都可以被核酸组分分子检测到,从而进一步提高测定的灵敏度。核酸组分分子与靶RNA的结合然后导致TnpB蛋白的活化,并且方法如上所述进行。NASBA反应的另一个优点是能够在中等等温条件下进行,例如在大约41℃下进行,使其适合部署在远离临床实验室的现场进行早期直接检测的系统和装置。
RPA
在某些其他示例性实施方案中,重组酶聚合酶扩增(RPA)反应可用于扩增靶核酸。RPA反应采用能够将序列特异性引物与双链体DNA中的同源序列配对的重组酶。如果存在靶DNA,则启动DNA扩增,并且不需要其他样品操纵,诸如热循环或化学熔化。整个RPA扩增系统作为干燥制剂是稳定的,并且可以在没有冷藏的情况下安全运输。RPA反应也可以在等温温度下进行,最佳反应温度为37-42℃。序列特异性引物被设计为扩增包含待检测的靶核酸序列的序列。在某些示例性实施方案中,将RNA聚合酶启动子诸如T7启动子添加至引物之一。这产生了包含靶序列和RNA聚合酶启动子的扩增的双链DNA产物。在RPA反应之后或期间,添加RNA聚合酶,所述RNA聚合酶将从双链DNA模板产生RNA。然后扩增的靶RNA进而可以被TnpB系统检测到。以此方式,可以使用本文公开的实施方案来检测靶DNA。RPA反应还可以用于扩增靶RNA。首先使用逆转录酶将靶RNA转化为cDNA,然后进行第二链DNA合成,此时RPA反应如上所述进行。
基于转座酶的扩增
本文公开的实施方案提供了通过使含有靶核酸序列的寡核苷酸与转座子复合物接触用于等温扩增靶核酸序列的系统和方法。寡核苷酸可以是单链或双链RNA、DNA或RNA/DNA杂合寡核苷酸。转座子复合物包含转座酶和包含一个或多个RNA聚合酶启动子的转座子序列。转座酶促进一个或多个RNA聚合酶启动子插入寡核苷酸中。然后RNA聚合酶启动子可以从插入的一个或多个RNA聚合酶启动子转录靶核酸序列。此系统的一个优点是无需加热或熔化双链DNA模板,因为RNA聚合酶聚合酶需要双链模板。此种等温扩增快速而简单,无需复杂且昂贵的变性和冷却仪器。在某些示例性实施方案中,RNA聚合酶启动子是天然的或修饰的T7 RNA启动子。
如本文所用,术语“转座子”是指被转座酶或整合酶识别的核酸区段,并且其是能够转座的功能性核酸-蛋白质复合物(即,转座体)的基本组分。如本文所用的术语“转座酶”是指一种酶,其是能够转座的功能性核酸-蛋白质复合物的组分并且介导转座。术语“转座酶”还指代来自逆转录转座子或逆转录病毒来源的整合酶。转座子复合物在转座酶与双链DNA片段之间形成,所述片段含有所述酶的特异性结合序列,称为“转座子端”。转座子结合位点的序列可以在某些位置用其他碱基进行修饰,而不影响转座子复合物形成可以有效转座到靶DNA中的稳定结构的能力。
在本文提供的实施方案中,转座子复合物可包含转座酶和包含一个或多个RNA聚合酶启动子的转座子序列。术语“启动子”是指参与结合RNA聚合酶以启动转录的DNA区域。在具体的实施方案中,RNA聚合酶启动子可以是T7 RNA聚合酶启动子。可以使用转座酶将T7RNA启动子插入双链多核苷酸中。在一个实施方案中,T7 RNA聚合酶启动子插入寡核苷酸中可以是随机的。
大多数转座子的转座频率非常低,所述转座子使用复杂的机制来限制活性。例如,Tn5转座酶利用次优的DNA结合序列,并且转座酶的C末端干扰DNA结合。Reznikoff及其同事仔细描述了涉及Tn5转座的机制的特征。Tn5通过剪切和粘贴机制进行转座。所述转座子具有两对被转座酶利用的19bp元件:外部元件(OE)和内部元件(IE)。一个转座酶单体与所利用的两个元件中的每一个结合。当单体与转座子的每一端结合后,两个单体二聚化,从而形成突触。具有至少200bp但小于1000bp的供体骨架的载体在细菌中最具转座功能。转座子切割通过反式催化发生,并且仅当与每个DNA末端结合的单体处于突触复合物中时才会发生。Tn5使用具有宽松的靶位点选择进行转座,因此可以在几乎没有靶序列特异性的情况下插入到靶DNA中。
Tn5转座的自然下调可以通过选择高活性转座酶和通过优化转座酶结合元件来克服[York等人1998]。由野生型OE的三个碱基的修饰制成的嵌合元件(ME)导致细菌以及无细胞系统中的转座事件增加了50倍。优化的ME和高活性突变转座酶的组合作用估计导致转座活性增加100倍。Goryshin等人显示,预先形成的Tn5转座复合物可以通过电穿孔功能性地引入到细菌或酵母中[Goryshin等人2000]。DNA的线性化使反向重复精确定位在转座子的两端,允许Goryshin和同事绕过转座的切割步骤,从而增强转座效率。
在一个实施方案中,转座酶可用于对包含靶序列的寡核苷酸序列进行标签化。术语“标签化”是指使用所描述的测序(ATAC-seq)进行的转座酶可及染色质测定中的步骤。(参见,Buenrostro,J.D.,Giresi,P.G.,Zaba,L.C.,Chang,H.Y.,Greenleaf,W.J.,Transposition of native chromatin for fast and sensitive epigenomic profilingof open chromatin,DNA-binding proteins and nucleosome position.Nature methods2013;10(12):1213-1218)。具体来说,在体外装载有用于高通量DNA测序的衔接子的高活性Tn5转座酶可以同时使用测序衔接子对基因组进行片段化和标记。在一个实施方案中,衔接子与本文所述的方法兼容。
在一个实施方案中,转座酶可以是Tn5转座酶。在一个实施方案中,转座酶可以是Tn5转座酶的变体或经工程化的转座酶。转座酶可以使用本领域已知的任何方法进行工程化。经工程化转座酶可经优化以在30℃至45℃、35℃至40℃范围内的温度或在之间的任何温度下发挥作用。与野生型转座酶相比,经工程化转座酶可以经优化从而以更快的速率从寡核苷酸中释放。
在一个实施方案中,转座酶可以是Tn5转座酶、Mu转座酶或Tn7转座酶。体外转座效率可能根据所使用的转座子系统而变化。一般来讲,Tn5和Mu转座酶实现较高水平的转座效率。在一个实施方案中,插入可以是随机的。在一个实施方案中,插入可以发生在靶序列的富含GC的区域中。
在一个实施方案中,转座子序列可包含两个19碱基对的嵌合末端(ME)Tn5转座酶识别序列。Tn5转座酶通常将转座此种短19碱基对ME Tn5转座酶识别序列之间含有的任何DNA序列。
在一个实施方案中,转座酶的使用允许在不存在加热或解链的情况下分离双链多核苷酸。方法可以根据PCT/US2019/039195中描述的方法进行调整,所述专利通过引用并入本文。
切口酶依赖性扩增
在本发明的实施方案中,可包括基于切口酶的扩增。切口酶可以是TnpB蛋白。因此,将切口引入双链DNA可以是可编程的并且是序列特异性的。在本发明的实施方案中,可以设计两个指导物以靶向dsDNA靶标的相反链。根据本发明,切口酶可以是TnpB或可使用任何CRISPR蛋白(诸如Cpf1、C2c1、Cas9)的切口酶或任何直系同源物或CRISPR蛋白,其切割或被工程化以切割DNA双链体的单链。在特定的实施方案中,TnpB用于切口酶依赖性扩增。然后可以通过聚合酶延伸带切口的链。在一个实施方案中,选择切口的位置,使得聚合酶对链的延伸朝向切口位点之间的靶双链体DNA的中心部分。在一个实施方案中,引物被包括在能够与延伸链杂交的反应中,随后进行引物的进一步聚合酶延伸以重新产生两个dsDNA片段:包括第一链TnpB指导位点或第一链和第二链TnpB指导位点两者的第一dsDNA,以及包括第二链TnpB指导位点或第一链和第二链TnpB指导位点两者的第二dsDNA。这些片段在循环反应中继续被切口和延伸,所述循环反应以指数方式扩增切口位点之间的靶区域。或者,可以使用CRISPR-Cas蛋白代替TnpB用于基于切口酶的扩增,并且此类方法是本领域已知的。
扩增可以是等温的并且可以选择温度。在一个实施方案中,扩增在37摄氏度下快速进行。在其他实施方案中,可以通过选择可在不同温度下操作的聚合酶(例如Bsu、Bst、Phi29、klenow片段等)来选择等温扩增的温度。
因此,切口等温扩增技术使用具有固定序列偏好的切口酶(例如,在切口酶扩增反应或NEAR中),这需要使原始dsDNA靶标变性以允许将切口底物添加至靶标末端的引物的退火和延伸,使用可重新编程切口酶(其中切口位点可经由RNA分子进行编程)意味着不需要变性步骤,使整个反应能够真正等温。这也简化了反应,因为这些添加切口底物的引物与反应中稍后使用的引物不同,这意味着NEAR需要两组引物(即4个引物),而Cpf1切口扩增仅需要一组引物(即,两个引物)。这使得切口Cpf1扩增更简单并且更容易操作,无需复杂的仪器来执行变性并且然后冷却至等温温度。
在一个方面,等温扩增试剂可以与热稳定TnpB蛋白一起利用。热稳定蛋白和等温扩增试剂的组合可用于进一步改善检测和诊断的反应时间。
因此,在某些示例性实施方案中,本文公开的系统可包括扩增试剂。本文描述了可用于核酸扩增的不同组分或试剂。例如,如本文所述的扩增试剂可包括缓冲液,诸如Tris缓冲液。Tris缓冲液可以以适合期望应用或用途的任何浓度使用,例如包括但不限于1mM、2mM、3mM、4mM、5mM、6mM、7mM、8mM、9mM、10mM、11mM、12mM、13mM、14mM、15mM、25mM、50mM、75mM、1M等的浓度。本领域技术人员将能够确定与本发明一起使用的缓冲液诸如Tris的适当浓度。
诸如氯化镁(MgCl2)、氯化钾(KCl)或氯化钠(NaCl)的盐可以包括在诸如PCR的扩增反应中,以便改善核酸片段的扩增。尽管盐浓度将取决于特定的反应和应用,但在一个实施方案中,特定大小的核酸片段可以在特定的盐浓度下产生最佳结果。较大的产物可能需要改变的盐浓度,通常是较低的盐,以便产生期望的结果,而较小产物的扩增可在较高的盐浓度下产生更好的结果。本领域技术人员将理解,盐的存在和/或浓度以及盐浓度的改变可改变生物或化学反应的严格性,因此可以使用为本发明和本文所述的反应提供适当条件的任何盐。在某些优选的实施方案中,当利用多核苷酸提取珠诸如磁珠时,PlantQuickExtract溶液可以与KCl缓冲液组合用于根据本公开的优化检测方法。
生物或化学反应的其他组分可包括细胞裂解组分,以便破裂或裂解细胞以分析其中的材料。细胞裂解组分可包括但不限于洗涤剂、如上所述的盐,诸如NaCl、KCl、硫酸铵[(NH4)2SO4]或其他。适用于本发明的洗涤剂可包括Triton X-100、十二烷基硫酸钠(SDS)、CHAPS(3-[(3-胆酰胺丙基)二甲基铵]-1-丙磺酸盐)、乙基三甲基溴化铵、壬基苯氧基聚乙氧基乙醇(NP-40)。洗涤剂的浓度可以取决于特定应用,并且在一些情况下可能对反应具有特异性。扩增反应可包括以适合本发明的任何浓度使用的dNTP和核酸引物,诸如包括但不限于100nM、150nM、200nM、250nM、300nM、350nM、400nM、450nM、500nM、550nM、600nM、650nM、700nM、750nM、800nM、850nM、900nM、950nM、1mM、2mM、3mM、4mM、5mM、6mM、7mM、8mM、9mM、10mM、20mM、30mM、40mM、50mM、60mM、70mM、80mM、90mM、100mM、150mM、200mM、250mM、300mM、350mM、400mM、450mM、500mM等的浓度。同样,根据本发明的有用的聚合酶可以是本领域已知的并且可用于本发明的任何特定或通用聚合酶,包括Taq聚合酶、Q5聚合酶等。
在一个实施方案中,如本文所述的扩增试剂可适用于热启动扩增。在一个实施方案中,热启动扩增可能有益于减少或消除衔接分子或寡核苷酸的二聚化,或者以其他方式防止不需要的扩增产物或人工制品并获得期望产物的最佳扩增。本文所述的用于扩增的许多组分也可以用于热启动扩增。在一个实施方案中,可以使用适合与热启动扩增一起使用的试剂或组分来适当地代替组合物组分中的一种或多种。例如,可以使用在特定温度或其他反应条件下表现出期望活性的聚合酶或其他试剂。在一个实施方案中,可以使用被设计或优化用于热启动扩增的试剂,例如,可以在转座后或达到特定温度后活化聚合酶。此类聚合酶可以是基于抗体的或基于适体的。如本文所述的聚合酶是本领域已知的。此类试剂的实例可包括但不限于热启动聚合酶、热启动dNTP和光笼dNTP。此类试剂是本领域已知的且可获得的。本领域技术人员将能够确定适合各个试剂的最佳温度。
核酸的扩增可以使用特定的热循环机器或设备来执行,并且可以在单个反应中执行或批量地执行,使得可以同时执行任何期望数量的反应。在一个实施方案中,可以使用微流体或机器人装置执行扩增,或者可以使用手动改变温度来执行扩增以实现期望的扩增。在一个实施方案中,可以执行优化以获得特定应用或材料的最佳反应条件。本领域技术人员将理解并能够优化反应条件以获得足够的扩增。
在一个实施方案中,用本发明的方法或系统检测DNA需要在检测之前将(扩增的)DNA转录成RNA。
显然,本发明的检测方法可以涉及各种组合的核酸扩增和检测程序。待检测的核酸可以是任何天然存在的或合成的核酸,包括但不限于DNA和RNA,其可以通过任何合适的方法扩增以提供可以检测的中间产物。中间产物的检测可以通过任何合适的方法进行,包括但不限于TnpB蛋白的结合和活化,所述TnpB蛋白通过直接或旁切活性产生可检测的信号部分。
解旋酶依赖性扩增
在解旋酶依赖性扩增中,解旋酶用于解开双链核酸以产生用于引物杂交和随后的引物延伸的模板。此过程利用两个寡核苷酸引物,每个引物与含有靶序列的有义链或含有反向互补靶序列的反义链的3'端杂交。HDA反应是解旋酶依赖性核酸扩增的通用方法。
将此方法与TnpB检测系统组合时,可以通过使用第一和第二TnpB复合物打开靶核酸的R环来扩增靶核酸。因此,可以使用解旋酶解开靶核酸的第一链和第二链,从而允许引物和聚合酶在等温条件下结合并延伸DNA。
术语“解旋酶”在此指能够以酶促方式解开双链核酸的任何酶。例如,解旋酶是存在于所有生物体和涉及核酸的所有过程中的酶,所述过程诸如复制、重组、修复、转录、翻译和RNA剪接。(Kornberg和Baker,DNA Replication,W.H.Freeman and Company(第2版(1992)),特别是第11章)。沿DNA或RNA以5'至3'方向或相反的3'至5'方向易位的任何解旋酶可用于本发明的本实施方案中。这包括从原核生物、病毒、古细菌和真核生物获得的解旋酶或天然存在的酶的重组形式以及具有特定活性的类似物或衍生物。Kornberg和Baker在其著作DNA Replication,W.H.Freeman and Company(第2版(1992))的第11章中描述的天然存在的DNA解旋酶的实例包括大肠埃希氏菌解旋酶I、II、III和IV、Rep、DnaB、PriA、PcrA、T4 Gp41解旋酶、T4 Dda解旋酶、T7 Gp4解旋酶、SV40大T抗原、酵母RAD。可用于HDA的额外的解旋酶包括RecQ解旋酶(Harmon和Kowalczykowski,J.Biol.Chem.276:232–243(2001))、来自腾冲热厌氧杆菌(T.tengcongensis)(公开于本发明的实施例XII)和嗜热栖热菌(T.thermophilus)的热稳定UvrD解旋酶(Collins和McCarthy,Extremophiles.7:35–41.(2003))、来自水生栖热菌(T.aquaticus)的热稳定DnaB解旋酶(Kaplan和Steitz,J.Biol.Chem.274:6889–6897(1999))以及来自古细菌和真核生物体的MCM解旋酶((Grainge等人,Nucleic Acids Res.31:4888–4898(2003))。
解旋酶的传统定义是一种使用核苷三磷酸(NTP)水解作为能量来源(诸如ATP),催化将核酸双链体(DNA、RNA或杂合体)的螺旋结构分离/解压/解开成单链组分的反应的酶。然而,应当指出的是,并非所有解旋酶都符合这个定义。更一般的定义是它们是沿着单链或双链核酸移动(通常以某个方向,3'至5'或5至3或两者)的运动蛋白,即转位酶,可以或不能解开遇到的双链核酸。此外,一些解旋酶只是结合并“解链”双链体核酸结构,而没有明显的转位酶活性。
解旋酶存在于所有生物体中,并在核酸代谢的全部方面发挥作用。解旋酶基于氨基酸序列、方向性、寡聚状态以及核酸类型和结构偏好进行分类。最常见的分类方法是基于某些氨基酸序列(称为基序)的存在而开发的。根据这种分类,解旋酶被分为6个超家族:SF1、SF2、SF3、SF4、SF5和SF6。SF1和SF2解旋酶不会在核酸周围形成环状结构,而SF3至SF6则会形成环状结构。超家族分类不依赖于经典分类学。
DNA解旋酶负责催化双链DNA(dsDNA)分子解旋为其相应的单链核酸(ssDNA)形式。尽管结构和生化研究已经证明各种解旋酶如何可以在ssDNA上定向易位,每个核苷酸消耗一个ATP,但核酸解开机制以及解开活性如何调控仍不清楚且存在争议(T.M.Lohman,E.J.Tomko,C.G.Wu,“Non-hexameric DNA helicases and translocases:mechanisms andregulation,”Nat Rev Mol Cell Biol 9:391-401(2008))。由于解旋酶潜在地可以解开遇到的所有核酸,因此了解其解开活性如何调控可以导致将解旋酶功能用于生物技术应用。
术语“HDA”是指解旋酶依赖性扩增,这是一种通过使用解旋酶制剂解开双链核酸以产生用于引物杂交和随后的引物延伸的模板从而扩增核酸的体外方法。此过程利用两个寡核苷酸引物,每个引物与含有靶序列的有义链或含有反向互补靶序列的反义链的3'端杂交。HDA反应是解旋酶依赖性核酸扩增的通用方法。
本发明包括使用本领域已知的任何合适的解旋酶。这些包括但不一定限于UvrD解旋酶、CRISPR-Cas3解旋酶、大肠埃希氏菌解旋酶I、大肠埃希氏菌解旋酶II、大肠埃希氏菌解旋酶III、大肠埃希氏菌解旋酶IV、Rep解旋酶、DnaB解旋酶、PriA解旋酶、PcrA解旋酶、T4Gp41解旋酶、T4 Dda解旋酶、SV40大T抗原、酵母RAD解旋酶、RecD解旋酶、RecQ解旋酶、热稳定腾冲热厌氧杆菌UvrD解旋酶、热稳定嗜热栖热菌UvrD解旋酶、热稳定水生栖热菌DnaB解旋酶、Dda解旋酶、乳头状瘤病毒E1解旋酶、古细菌MCM解旋酶、真核MCM解旋酶和T7 Gp4解旋酶。
在特别优选的实施方案中,解旋酶包含超突变。在特定的实施方案中,尽管已经描述了大肠埃希氏菌突变,但是突变通过序列比对产生(例如,TteUvrd的D409A/D410A)并且导致嗜热酶在如37℃的较低温度下工作,这有利于本文所述的扩增方法和系统。在一个实施方案中,超突变是天冬氨酸至丙氨酸的突变,其位置基于序列比对。在一个实施方案中,超突变体解旋酶选自WP_003870487.1乙醇热厌氧杆菌403/404、WP_049660019.1芽孢杆菌属某种FJAT-27231 407/408、WP_034654680.1巨大芽孢杆菌415/416、WP_095390358.1简单芽胞杆菌407/408和WP_055343022.1索氏类梭菌402/403。
孵育
使用本文公开的系统的检测和/或提取方法可以包括在足以允许核酸组分分子与一个或多个靶分子结合的条件下孵育样品或样品组。提取可以包括在足以允许样品中存在的病毒RNA释放的条件下孵育样品,这可以包括在22℃至60℃下孵育30至70分钟或者在90℃至100℃下孵育约10分钟。
在某些示例性实施方案中,本发明中的扩增和检测的孵育时间可以缩短。测定可以在发生酶促反应所需的时间段内执行。本领域技术人员可以在5分钟内执行生化反应(例如,5分钟连接)。孵育可以在一种或多种温度下进行约10分钟与90分钟之间的时间范围,优选小于90分钟、75分钟、60分钟、45分钟、30分钟、25分钟、20分钟、15分钟或10分钟,这取决于系统的样品、试剂和组分。在一个实施方案中,用于扩增的孵育在约20℃与80℃之间的一个或多个温度下执行,在一个实施方案中,在约37℃下执行。在一个实施方案中,用于扩增的孵育在约55℃与65℃之间、约59℃与61℃之间的一个或多个温度下执行,在一个实施方案中,在约60℃下执行。
活化
在某些示例性实施方案中,TnpB蛋白的活化是通过TnpB复合物经由核酸组分分子与一个或多个靶分子的结合而发生的,其中TnpB蛋白的活化导致检测构建体的修饰,使得产生可检测信号。
检测信号
检测可包括目视观察相对于对照的阳性信号。检测可包括一个或多个捕获区域处的信号丢失或信号存在,例如比色检测或荧光检测。在某些示例性实施方案中,可以引入进一步的修改,所述修改进一步扩增可检测的阳性信号。例如,活化的TnpB蛋白旁切活化可用于产生第二靶标或额外的核酸组分分子序列或两者。在一个示例性实施方案中,反应溶液将含有以高浓度掺入的第二靶标。第二靶标可以与第一靶标(即,测定被设计来检测的靶标)不同,并且在某些情况下可以在所有反应体积中是共同的。用于第二靶标的第二核酸组分分子序列可以例如通过二级结构特征(诸如具有RNA环的发夹)被保护,并且不能结合第二靶标或TnpB蛋白。保护基团被活化的TnpB r蛋白切割(即,通过与溶液中的第一靶标形成复合物而活化后),并且与溶液中的游离TnpB蛋白形成复合物并且由第二靶标中的掺入物活化。在某些其他示例性实施方案中,类似的概念与第二靶标和受保护的第二靶标的游离核酸组分分子序列一起使用。从第二靶标上切割保护基团将允许形成额外的TnpB蛋白、核酸组分序列、第二靶序列。在又另一个示例性实施方案中,第一靶标对TnpB蛋白的活化可用于切割受保护的或环化的引物,然后释放所述引物以对第二核酸组分序列、第二靶标或两者的模板执行等温扩增反应,诸如本文公开的那些。这种扩增模板的后续转录将产生更多的第二核酸组分分子序列和/或第二靶序列,然后进行额外的TnpB蛋白旁切活化。
量化
在特定的方法中,将一种或多种信号的强度与对照比较以量化样品中的核酸。术语“对照”是指适合提供与测试样品中的表达产物的比较的任何参考标准。在一个实施方案中,对照包括获得“对照样品”,从中检测表达产物水平并且与来自测试样品的表达产物水平进行比较。此种对照样品可包括任何合适的样品,包括但不限于结果已知的对照患者的样品(可以是存储的样品或先前的样品测量结果);从受试者(诸如正常患者或患有感兴趣病状的患者)分离的正常组织、流体或细胞。
如果信号分别大于或小于正常或对照水平的量大于用于评估量的测定的标准误差,并且优选至少20%、30%、40%、50%、60%、70%、80%、90%、100%、150%、200%、300%、350%、400%、500%、600%、700%、800%、900%、1000%或以上,则信号强度“显著”高于或低于正常强度。或者,如果所述量分别比正常和/或对照信号高或低至少约2%,优选至少约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、100%、105%、110%、115%、120%、125%、130%、135%、140%、145%、150%、155%、160%、165%、170%、175%、180%、185%、190%、195%、2倍、3倍、4倍、5倍或更多、或其间的任何范围(诸如5%-100%),则可以认为所述信号“显著”高于或低于正常和/或对照信号。此类显著的调节值可以应用于本文所述的任何度量,诸如改变的表达水平、改变的活性、生物标志物抑制的变化、测试剂结合的变化等。
在一个实施方案中,可检测的阳性信号可以是相对于对照的荧光信号或比色信号的损失,如本文所述。在一个实施方案中,可检测的阳性信号可以在侧流装置上检测,如本文所述。
检测方法的应用
可以设计用于检测和诊断微生物(包括细菌、真菌和病毒微生物)的系统和方法。在一个方面,系统可以包括病毒感染的多种变体的多重检测,所述病毒包括冠状病毒、可以是相关冠状病毒或呼吸道病毒的不同病毒或其组合。在实施方案中,可以使用本文详述的公开内容对多种病毒和病毒感染(包括急性呼吸道感染)执行测定。系统可以包含如本文别处所述的两个或更多个TnpB系统以实现多重化,从而检测多种呼吸道感染或病毒感染,包括冠状病毒。冠状病毒是一种正义单链RNA病毒家族,感染多种动物和人类。SARS-CoV是冠状病毒感染的一种类型,并且设想了一种或多种冠状病毒的MERS-CoV检测,包括检测到的2019-nCoV。2019-nCoV的序列可从GISAID登录号EPI_ISL_402124和EPI_ISL_402127-402130获得,并且描述于DOI:10.1101/2020.01.22.914952。GISAID平台中存放的SARS-CoV-2的进一步存放包括EP_ISL_402119-402121和EP_ISL 402123-402124;另见GenBank登录号MN908947.3。
靶分子检测可以包括两个或更多个利用TnpB蛋白的检测系统。TnpB蛋白可以优选是热稳定的,通过多重设计,使得可以使用具有不同序列特异性、可操作温度或切割偏好的不同TnpB蛋白。
多重实施方案可被设计为追踪冠状病毒的一种或多种变体或冠状病毒的一种或多种变体,包括SARS-CoV-2与其他病毒的组合,所述其他病毒例如人呼吸道合胞病毒、中东呼吸综合征(MERS)冠状病毒、严重急性呼吸综合征相关(SARS)冠状病毒和流感。在实施方案中,可以多重进行测定以检测冠状病毒的多种变体、可能是相关冠状病毒或呼吸道病毒的不同病毒、或其组合。在一个方面,每次测定可以在单独的离散体积中进行。“单独的离散体积”是离散体积或离散空间,诸如容器、接收器或可以由防止和/或抑制进行本文公开的方法所必需的核酸和试剂的迁移的特征件限定的其他限定体积或空间,例如由物理特征件(诸如壁,例如孔壁、管壁或液滴表面)限定的体积或空间,其可以是不可渗透的或半渗透的,或者如由其他方式限定的体积或空间,所述方式诸如化学的、扩散速率受限的、电磁的、或光照明、或其任何组合。“扩散速率受限”(例如扩散限定的体积)意指由于扩散约束有效限定了空间或体积(就像两个平行层流的情况一样,其中扩散将限制靶分子从一个流迁移至另一个流)而仅有某些分子或反应可进入的空间。“化学”限定的体积或空间意指由于其化学或分子性质(诸如尺寸)而仅可以存在某些靶分子的空间,其中例如凝胶珠可以诸如通过珠子的表面电荷、基质大小或可以允许选择可进入珠子内部的物质的其他珠物理性质来排除某些物质进入珠子,但不能排除其他物质。“电磁”限定的体积或空间意指靶分子或其支持物的电磁性质(诸如电荷或磁性)可以用于限定空间中的某些区域(诸如捕获磁场内或直接在磁体上的磁性颗粒)的空间。“光学”限定的体积意指可以通过用可见光、紫外线、红外线或其他波长的光照射它来限定,使得只有所限定空间或体积内的靶分子可以被标记的任何空间区域。使用无壁或半渗透的一个优点是一些试剂(诸如缓冲剂、化学活化剂或其他剂)可在申请人中通过离散体积,而其他材料诸如靶分子可以保留在离散体积或空间中。通常,离散体积将包括适合于在允许标记的条件下用可转位核酸标识符标记靶分子的流体介质(例如,水性溶液、油、缓冲液和/或能够支持细胞生长的培养基)。可用于所公开方法的示例性离散体积或空间包括液滴(例如,微流体液滴和/或乳液液滴)、水凝胶珠或其他聚合物结构(例如,聚乙二醇二丙烯酸酯珠或琼脂糖珠)、组织载玻片(例如,固定的福尔马林石蜡包埋的组织载玻片,其具有通过化学、光学或物理方式限定的特定区域、体积或空间)、显微镜载玻片,其区域通过以有序阵列或随机图案沉积试剂来限定、管(诸如离心管、微量离心管、试管、比色皿、锥形管等)、瓶(诸如玻璃瓶、塑料瓶、陶瓷瓶、锥形瓶、闪烁瓶等)、孔(诸如板中的孔)、板、移液器或移液器头等。在某些示例性实施方案中,单独的离散体积是微板的孔。在某些示例性实施方案中,微板是96孔、384孔或1536孔微板。
在某些示例性实施方案中,本文公开的系统、装置和方法涉及检测样品(诸如从受试者获得的生物样品)中一种或多种微生物剂的存在。在某些示例性实施方案中,微生物可以是细菌、真菌、酵母、原生动物、寄生虫或病毒。因此,本文公开的方法可适用于需要快速鉴定微生物物种、监测微生物蛋白(抗原)、抗体、抗体基因的存在、检测某些表型(例如,细菌抗性)、监测疾病进展和/或爆发以及抗生素筛查的其他方法或与其他方法(组合)使用。由于本文公开的实施方案的快速且灵敏的诊断能力、微生物物种类型的检测、低至单个核苷酸差异以及部署为POC装置的能力,本文公开的实施方案可用作指导治疗方案,诸如选择适当的抗生素或抗病毒药物。本文公开的实施方案还可用于筛选环境样品(空气、水、表面、食物等)中是否存在微生物污染。
公开了一种鉴定微生物物种(诸如细菌、病毒、真菌、酵母或寄生物种等)的方法。本文公开的特定实施方案描述了将识别和区分单个样品内或多个样品内的微生物物种,从而允许识别许多不同的微生物的方法和系统。本发明的方法允许通过检测生物或环境样品中靶核酸序列的存在来检测病原体并且区分所述样品中的一种或多种生物体的两种或更多种物种,例如细菌、病毒、酵母、原生动物和真菌或其组合。从样品中获得的阳性信号表明微生物的存在。通过使用多于一种效应蛋白,可以使用本发明的方法和系统同时鉴定多种微生物,其中每种效应蛋白靶向特定的微生物靶序列。以此方式,可以对特定受试者执行多水平分析,其中可以一次检测任何数量的微生物,所述受试者例如患有未知呼吸道感染、患有冠状病毒症状的受试者或有风险或已经暴露于冠状病毒的个体。在一个实施方案中,可以使用一组可鉴定一种或多种微生物物种的探针进行多种微生物的同时检测。
微生物检测
在一个实施方案中,提供了一种用于检测样品中的微生物的方法,其包括将样品或一组样品分配到一个或多个单独的离散体积中,所述单独的离散体积包括如本文所述的TNPB系统;在足以允许一个或多个核酸组分分子与一个或多个微生物特异性靶标结合的条件下孵育样品或样品组;经由一个或多个核酸组分分子与一个或多个靶分子的结合来活化TnpB蛋白,其中活化TnpB蛋白导致基于RNA的掩蔽构建体的修饰,使得产生可检测的阳性信号;以及检测可检测的阳性信号,其中检测到可检测的阳性信号表明样品中存在一个或多个靶分子。一个或多个靶分子可以是mRNA、gDNA(编码或非编码)、trRNA或rRNA,其包含可用于彼此区分两个或更多个微生物物种/菌株的靶核苷酸序列。核酸组分分子可被设计成检测靶序列。本文公开的实施方案还可以利用某些步骤来改善核酸组分分子与靶RNA序列之间的杂交。用于增强核糖核酸杂交的方法公开于标题为“Enhanced Methods ofRibonucleic Acid Hybridization”的WO 2015/085194,其通过引用并入本文。微生物特异性靶标可以是RNA或DNA或蛋白质。DNA方法还可以包括使用引入如本文所述的RNA聚合酶启动子的DNA引物。如果靶标是蛋白质,则所述方法将利用对本文所述的蛋白质检测具有特异性的适体和步骤。
单核苷酸变体的检测
在一个实施方案中,可以使用对本文所述的靶序列具有特异性并与其结合的核酸组分分子来检测一种或多种鉴定的靶序列。本发明的系统和方法甚至可以区分不同微生物物种之间存在的单核苷酸多态性,因此,使用根据本发明的多个核酸组分分子可以进一步扩大或改善可以用于区分物种的靶序列的数量。例如,在一个实施方案中,一个或多个核酸组分分子可以区分微生物的种、属、科、目、纲、门、界或表型或其组合。
基于rRNA序列的检测
在某些示例性实施方案中,本文公开的装置、系统和方法可用于区分样品中的多个微生物物种。在某些示例性实施方案中,鉴定可以基于核糖体RNA序列,包括16S、23S和5S亚基。用于鉴定相关rRNA序列的方法公开于美国专利申请公开号2017/0029872中。在某些示例性实施方案中,一组核酸组分分子可被设计为通过每个物种或菌株独特的可变区来区分每个物种。核酸组分分子还可被设计成靶向在属、科、目、纲、门、界水平或其组合上区分微生物的RNA基因。在使用扩增的某些示例性实施方案中,一组扩增引物可以被设计成侧接核糖体RNA序列的恒定区,并且核酸组分分子被设计为通过可变内部区域来区分每个物种。在某些示例性实施方案中,引物和核酸组分分子可分别被设计为16S亚基中的保守区和可变区。也可以使用在物种或物种子集之间独特变化的其他基因或基因组区域,诸如RecA基因家族、RNA聚合酶β亚基。其他合适的系统发育标志物及其鉴定方法讨论于例如Wu等人arXiv:1307.8690[q-bio.GN]。
在某些示例性实施方案中,方法或诊断被设计为同时在多个系统发育和/或表型水平上筛选微生物。例如,方法或诊断可包括使用具有不同核酸组分分子的多个TnpB系统。第一组核酸组分分子可以区分例如分枝杆菌、革兰氏阳性菌和革兰氏阴性菌。这些一般类别甚至可以进一步细分。例如,可以设计核酸组分并将其用于区分革兰氏阴性细菌内的肠道和非肠道的方法或诊断中。第二组核酸组分分子可以被设计为在属或种水平上区分微生物。因此,可以产生鉴定所有分枝杆菌、革兰氏阳性菌、革兰氏阴性菌(进一步分为肠道和非肠道)的矩阵,并且在给定样品中鉴定出落入这些类别之一的细菌物种的每个属。前述内容仅用于实例目的。还考虑了用于对其他微生物类型进行分类的其他方式,并且所述方式将遵循上述一般结构。
药物抗性筛选
在某些示例性实施方案中,本文公开的装置、系统和方法可用于筛选感兴趣的微生物基因,例如抗生素和/或抗病毒抗性基因。核酸组分分子可被设计为区分已知的感兴趣基因。然后可以使用本文公开的用于检测此类基因的实施方案来筛选样品,包括临床样品。在POC筛选药物抗性的能力对于选择适当的治疗方案将具有巨大的益处。在某些示例性实施方案中,抗生素抗性基因是碳青霉烯酶,包括KPC、NDM1、CTX-M15、OXA-48。其他抗生素抗性基因是已知的,并且可见于例如综合抗生素抗性数据库(Jia等人“CARD 2017:expansionand model-centric curation of the Comprehensive Antibiotic ResistanceDatabase.”Nucleic Acids Research,45,D566-573)。
利巴韦林(Ribavirin)是一种有效的抗病毒药物,其对抗多种RNA病毒。若干种临床上重要的病毒已进化出利巴韦林抗性,包括口蹄疫病毒doi:10.1128/JVI.03594-13;脊髓灰质炎病毒(Pfeifer和Kirkegaard.PNAS,100(12):7289-7294,2003);和丙型肝炎病毒(Pfeiffer和Kirkegaard,J.Virol.79(4):2346-2355,2005)。许多其他持久性RNA病毒,诸如肝炎和HIV,已经进化出对现有抗病毒药物的抗性:乙型肝炎病毒(拉米夫定(lamivudine)、替诺福韦(tenofovir)、恩替卡韦(entecavir))doi:10/1002/hep22900;丙型肝炎病毒(特拉匹韦(telaprevir)、BILN2061、ITMN-191、SCh6、波塞普韦(boceprevir)、AG-021541、ACH-806)doi:10.1002/hep.22549;和HIV(许多药物抗性突变)hivb.standford.edu。本文公开的实施方案可用于检测此类变体等。
除了药物抗性之外,还存在许多可以用本文公开的实施方案检测到的临床相关突变,诸如在LCMV中的持续性与急性感染(doi:10.1073/pnas.1019304108),以及埃博拉病毒感染性的增加(Diehl等人Cell.2016,167(4):1088-1098。
如本文别处所述,密切相关的微生物物种(例如,在给定靶序列中仅具有单个核苷酸差异)可以通过在核酸组分分子中引入合成错配来区分。
监测微生物爆发
在一个实施方案中,如本文所述的TnpB系统或其使用方法可用于确定病原体爆发的演变。方法可包括检测来自一名或多名受试者的多个样品的一种或多种靶序列,其中所述靶序列是来自引起爆发的微生物的序列。此种方法可以进一步包括确定病原体传播的模式,或涉及由病原体引起的疾病爆发的机制。
病原体传播的模式可包括来自病原体的天然储存库的持续的新传播或来自天然储存库的单次传播之后的受试者至受试者的传播(例如,人际传播)或两者的混合。在一个实施方案中,病原体传播可以是细菌或病毒传播,在此种情况下,靶序列优选是微生物基因组或其片段。在一个实施方案中,病原体传播的模式是病原体传播的早期模式,即,在病原体爆发开始时。在病原体爆发开始时确定病原体传播模式可以增加尽早阻止病原体爆发的可能性,从而减少本地和国际散播的可能性。
确定病原体传播的模式可以包括根据本文所述的方法检测病原体序列。确定病原体传播的模式还可以包括检测受试者之间病原体序列的共有宿主内变异和确定所述共有宿主内变异是否显示出时间模式。观察到的宿主内和宿主间变异模式提供了关于传播和流行病学的重要见解(Gire等人,2014)。
检测到受试者之间的显示时间模式的共有宿主内变异表明受试者之间(特别是人类之间)的传播联系,因为它可以通过来自多个来源的受试者感染(重复感染)、样品污染重复突变(使用或不使用平衡选择来加强突变),或由传播链早期突变引起的略有不同的病毒的共同传播(Park,等人,Cell 161(7):1516–1526,2015)。受试者之间的共有宿主内变异的检测可以包括位于共同单核苷酸多态性(SNP)位置的宿主内变异的检测。位于共同(SNP)位置的宿主内变异的阳性检测表明重复感染和污染是宿主内变异的主要解释。重复感染和污染可以基于宿主间变异出现的SNP频率来区分(Park等人,2015)。否则可以排除重复感染和污染。在后一种情况下,受试者之间的共有宿主内变异的检测还可以包括评估同义变异和非同义变异的频率以及将同义变异与非同义变异的频率彼此比较。非同义突变是改变蛋白质氨基酸的突变,可能导致经受自然选择的微生物的生物变化。同义取代不改变氨基酸序列。同义变异和非同义变异的相同频率表明宿主内变异是中性进化的。如果同义变异和非同义变异的频率不同,则宿主内变异很可能通过平衡选择来维持。如果同义变异和非同义变异的频率低,则表明存在反复突变。如果同义变异和非同义变异的频率高,则表明存在共同传播(Park等人,2015)。
与埃博拉病毒一样,拉沙病毒(LASV)可引起出血热,病死率很高。Andersen等人从临床和啮齿动物储存库样品中产生了近200个LASV序列的基因组目录(Andersen等人,Cell第162卷,第4期,第738–750页,2015年8月13日)。Andersen等人显示,2013-2015年的EVD疫情是由人际传播推动的,而LASV感染主要是由储存库至人的感染导致的。Andersen等人阐明了LASV在西非的传播,并且显示这种迁移伴随着LASV基因组丰度、死亡率、密码子适应和翻译效率的变化。方法还可以包括在系统发育上比较第一病原体序列与第二病原体序列,并且确定第一病原体序列与第二病原体序列之间是否存在系统发育联系。第二病原体序列可以是较早的参考序列。如果存在系统发育联系,则所述方法还可以包括将第一病原体序列的系统发育植根于第二病原体序列。因此,可以构建第一病原体序列的谱系。(Park等人,2015)。
所述方法还可以包括确定突变是有害的还是适应性的。有害突变表明传播受损的病毒和死端感染,因此通常仅存在于个体受试者中。一名个体受试者特有的突变是发生在系统发育树的外部分支上的那些突变,而内部分支突变是存在于多个样品中(即多个受试者中)的突变。较高的非同义取代率是系统发育树的外部分支的一个特征(Park等人,2015)。
在系统发育树的内部分支中,选择有更多的机会过滤掉有害的突变体。根据定义,内部分支已经产生了多个后代谱系,因此不太可能包含具有适应度成本的突变。因此,较低的非同义取代率表明存在内部分支(Park等人,2015)。
可能对适应度影响较小的同义突变在内部和外部分支上以更具可比性的频率发生(Park等人,2015)。
通过对测序的靶序列诸如病毒基因组进行分析,有可能发现负责疫情严重程度的机制,诸如在2014年埃博拉爆发期间。例如,Gire等人对2014年爆发的基因组与早期爆发的所有20个基因组进行了系统发育比较,表明2014年西非病毒可能在过去十年内从中非传播。使用与其他埃博拉病毒基因组的差异来植根系统发育是有问题的(6,13)。然而,对最古老的爆发进行树的植根揭示了采样日期与根尖距离之间存在很强的相关性,每年每个地点的取代率为8×10-4(13)。这表明最近三起爆发的谱系几乎在2004年左右的同一时间从一个共同的祖先中分离出来,这支持了这样的假设:每次爆发都代表了来自其天然储存库中的相同遗传多样性病毒群体的独立人畜共患事件。他们还发现,2014年的EBOV爆发可能是由天然储存库的单次传播,然后在爆发期间发生了人际传播引起的。他们的结果还表明,塞拉利昂的流行病可能源于同一时间左右从几内亚引入两种遗传上不同的病毒(Gire等人,2014)。
还可以确定拉沙病毒如何从其起源点传播,特别是通过人际传播,并且甚至可以追溯至400年前这种传播的历史(Andersen等人,Cell 162(4):738–50,2015)。
就2013-2015年EBOV爆发期间所需的工作以及爆发现场医务人员遇到的困难而言,并且更一般地,本发明的方法使得可以使用较少的选定探针进行测序,使得可以加速测序,从而缩短从样品采集到结果获取所需的时间。此外,试剂盒和系统可以被设计为可在现场使用,使得可以容易地执行患者的诊断,而无需将样品发送或运送到国家或世界的其他地方。
在任何上述方法中,可以使用上述测序方法中的任一种对靶序列或其片段进行测序。此外,对靶序列或其片段进行测序可以是近实时测序。可以根据先前描述的方法对靶序列或其片段进行测序(实验程序:Matranga等人,2014;和Gire等人,2014)。对靶序列或其片段进行测序可包括对多个靶序列进行平行测序。对靶序列或其片段进行测序可包括Illumina测序。
分析与一个或多个选定探针杂交的靶序列或其片段可以是鉴定分析,其中选定探针与靶序列或其片段的杂交指示样品内存在靶序列。
目前,主要诊断是基于患者的症状。然而,各种疾病可能具有相同的症状,使得诊断在很大程度上依赖于统计数据。例如,疟疾会触发类似流感的症状:头痛、发烧、发抖、关节疼痛、呕吐、溶血性贫血、黄疸、尿中有血红蛋白、视网膜损伤和抽搐。这些症状在败血症、胃肠炎和病毒性疾病中也很常见。在后者中,埃博拉出血热有以下症状:发烧、喉咙痛、肌肉疼痛、头痛、呕吐、腹泻、皮疹、肝肾功能下降、内出血和外出血。
当患者被送往医疗单位(例如,在热带非洲)时,基本诊断结果将是疟疾,因为从统计数据来看,疟疾是非洲所述地区最可能发生的疾病。因此,患者接受了疟疾治疗,但患者实际上可能并未感染所述疾病,并且患者最终没有得到正确的治疗。缺乏正确的治疗可能会危及生命,尤其是当患者感染的疾病迅速发展时。当医务人员意识到对患者的治疗无效并做出正确的诊断并且向患者施用适当的治疗时,可能为时已晚。
本发明的方法为这种情况提供了解决方案。事实上,因为核酸组分分子的数量可以显著减少,这使得可以在单个芯片上提供分成组的选定探针,每个组对于一种疾病具有特异性,使得可以同时诊断多种疾病,例如病毒感染。由于本发明,可以在单个芯片上同时诊断多于3种疾病,优选多于4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20种疾病,优选给定地理区域的人群中最常发生的疾病。由于每组选定探针对于所诊断的疾病之一具有特异性,可以执行更准确的诊断,从而减少向患者施用错误治疗的风险。
在其他情况下,疾病诸如病毒感染可能在没有任何症状的情况下发生,或者已经引起症状但在患者被送至医务人员之前就消失了。在此类情况下,要么患者不寻求任何医疗帮助,要么由于就诊当天没有症状而使诊断变得复杂。
本发明还可以与基于核酸(例如粗制、未纯化样品中的mRNA)检测来诊断疾病、鉴定病原体和优化治疗的其他方法一起使用。
本发明的方法还为解决这种情况提供了有力工具。事实上,由于多组选定的核酸组分分子(每组对于给定区域的人群中发生的最常见疾病之一具有特异性)包含在单个诊断中,因此医务人员只需要将从患者采集的生物样品与芯片接触。读取芯片揭示了患者感染的疾病。
在一些情况下,将患者带到医务人员处进行特定症状的诊断。本发明的方法使得不仅可以鉴定哪种疾病引起这些症状,而且可以同时确定患者是否罹患他不知道的另一种疾病。
在寻找爆发机制时,此信息可能至关重要。事实上,携带相同病毒的患者组也表现出时间模式,表明存在受试者至受试者的传播联系。
示例性微生物
本文公开的实施方案可用于检测多种不同的微生物。如本文所用的术语微生物包括细菌、真菌、原生动物、寄生虫和病毒。
细菌
下文提供了可以使用本文公开的实施方案检测的微生物类型的实例列表。在某些示例性实施方案中,微生物是细菌。可以根据所公开的方法检测的细菌的实例包括但不限于以下中的任何一种或多种(或其任何组合):鲍曼不动杆菌、放线杆菌属某种、放线菌(Actinomycetes)、放线菌属某种(诸如衣氏放线菌(Actinomyces israelii)和内氏放线菌(Actinomyces naeslundii))、气单胞菌属某种(诸如嗜水气单胞菌、凡隆气单胞菌温和生物型(Aeromonas veronii biovar sobria)(温和气单胞菌)和豚鼠气单胞菌)、嗜吞噬细胞无浆体(Anaplasma phagocytophilum)、边缘无浆体(Anaplasma marginale)、木糖氧化产碱菌(Alcaligenes xylosoxidans)、鲍曼不动杆菌、伴放线菌放线杆菌(Actinobacillusactinomycetemcomitans)、芽孢杆菌属某种(诸如炭疽芽孢杆菌、蜡样芽孢杆菌、枯草芽孢杆菌、苏云金芽孢杆菌和嗜热脂肪芽孢杆菌)、拟杆菌属某种(诸如脆弱拟杆菌)、巴尔通体属某种(诸如杆菌状巴尔通体(Bartonella bacilliformis)和汉氏巴尔通体(Bartonellahenselae))、双歧杆菌属某种、博德特氏菌属某种(诸如百日咳博德特氏菌(Bordetellapertussis)、副百日咳博德特氏菌(Bordetella parapertussis)和支气管炎博德特氏菌(Bordetella bronchiseptica))、疏螺旋体属某种(Borrelia sp.)(诸如回归热疏螺旋体和伯氏疏螺旋体)、布鲁氏菌属某种(诸如流产布鲁氏菌(Brucella abortus)、犬布鲁氏菌(Brucella canis)、羊布鲁氏菌(Brucella melintensis)和猪布鲁氏菌(Brucellasuis))、伯克霍尔德菌属某种(诸如类鼻疽伯克霍尔德菌和洋葱伯克霍尔德菌)、弯曲菌属某种(诸如空肠弯曲菌、结肠弯曲菌、红嘴鸥弯曲菌和胎儿弯曲菌)、二氧化碳嗜纤维菌属某种(Capnocytophaga sp.)、人心杆菌(Cardiobacterium hominis)、沙眼衣原体(Chlamydiatrachomatis)、肺炎嗜衣原体(Chlamydophila pneumoniae)、鹦鹉热嗜衣原体(Chlamydophila psittaci)、柠檬酸杆菌属某种(Citrobacter sp.)贝氏柯克斯体、棒状杆菌属某种(诸如白喉棒状杆菌(Corynebacterium diphtheriae)、杰氏棒状杆菌和棒状杆菌)、梭菌属某种(诸如产气荚膜梭菌()、艰难梭菌、肉毒梭菌和破伤风梭菌)、啮蚀艾肯菌(Eikenella corrodens)、肠杆菌属某种(诸如产气肠杆菌(Enterobacter aerogenes)、聚团肠杆菌(Enterobacter agglomerans)、阴沟肠杆菌和大肠埃希氏菌,包括机会大肠埃希氏菌(opportunistic Escherichia coli),诸如肠产毒性大肠埃希氏菌、肠侵袭性大肠埃希氏菌、肠致病性大肠埃希氏菌、肠出血性大肠埃希氏菌、肠聚集性大肠埃希氏菌和尿道致病性大肠埃希氏菌)、肠球菌属某种(诸如粪肠球菌和屎肠球菌)、埃立克体属某种(Ehrlichia sp.)(诸如恰菲埃立克体(Ehrlichia chafeensia)和犬埃立克体(Ehrlichiacanis))、絮状表皮癣菌(Epidermophyton floccosum)、猪红斑丹毒丝菌、真杆菌属某种、土拉弗朗西斯菌(Francisella tularensis)、具核梭杆菌、阴道加德纳菌(Gardnerellavaginalis)、麻疹双球菌(Gemella morbillorum)、嗜血杆菌属某种(诸如流感嗜血杆菌、杜克雷嗜血杆菌(Haemophilus ducreyi)、埃及嗜血杆菌(Haemophilus aegyptius)、副流感嗜血杆菌(Haemophilus parainfluenzae)、溶血嗜血杆菌)和副溶血嗜血杆菌(Haemophilus parahaemolyticus))、螺杆菌属某种(诸如幽门螺杆菌、同性恋螺杆菌和芬纳尔螺杆菌(Helicobacter fennelliae))、金氏金氏菌(Kingella kingii)、克雷伯氏菌属某种(诸如肺炎克雷伯氏菌、肉芽肿克雷伯氏菌(Klebsiella granulomatis)和产酸克雷伯氏菌)、乳杆菌属某种、单核细胞增生性李斯特菌、问号钩端螺旋体(Leptospirainterrogans)、嗜肺军团菌(Legionella pneumophila)、问号钩端螺旋体、消化链球菌属某种、溶血性曼氏杆菌(Mannheimia hemolytica)、犬小孢子菌(Microsporum canis)、卡他莫拉氏菌、摩根氏菌属某种(Morganella sp.)、动弯杆菌属某种(Mobiluncus sp.)、微球菌属某种、分枝杆菌属某种(诸如麻风分枝杆菌(Mycobacterium leprae)、结核分枝杆菌、副结核分枝杆菌(Mycobacterium paratuberculosis)、胞内分枝杆菌、鸟分枝杆菌、牛分枝杆菌和海洋分枝杆菌(Mycobacterium marinum))、支原体属某种(Mycoplasm sp.)(诸如肺炎支原体(Mycoplasma pneumoniae)、人支原体(Mycoplasma hominis)和生殖支原体(Mycoplasma genitalium))、诺卡氏菌属某种(诸如星形诺卡氏菌、圣乔治教堂诺卡氏菌和巴西诺卡氏菌(Nocardia brasiliensis))、奈瑟菌属某种(Neisseria sp.)(诸如淋病奈瑟菌(Neisseria gonorrhoeae)和脑膜炎奈瑟菌)、多杀巴斯德氏菌、糠秕孢子菌(Pityrosporum orbiculare)(糠秕马拉色菌(Malassezia furfur))、类志贺邻单胞菌、普雷沃菌属某种、卟啉单胞菌属某种(Porphyromonas sp.)、产黑普雷沃菌(Prevotellamelaninogenica)、变形杆菌属某种(诸如普通变形杆菌和奇异变形杆菌)、普罗威登斯菌属某种(Providencia sp.)((诸如产碱普罗威登斯菌、雷氏普罗威登斯菌(Providenciarettgeri)和斯氏普罗威登斯菌)、铜绿假单胞菌、痤疮丙酸杆菌(Propionibacteriumacnes)、马红球菌(Rhodococcus equi)、立克次体属某种(诸如立氏立克次体(Rickettsiarickettsii)、小蛛立克次体(Rickettsia akari)和普氏立克次体(Rickettsiaprowazekii)、恙虫病东方体(Orientia tsutsugamushi)(原名:恙虫病立克次体(Rickettsia tsutsugamushi))和伤寒立克次体(Rickettsia typhi))、红球菌属某种、粘质沙雷氏菌、嗜麦芽寡养单胞菌(Stenotrophomonas maltophilia)、沙门氏菌属某种(诸如肠道沙门氏菌、伤寒沙门氏菌(Salmonella typhi)、副伤寒沙门氏菌(Salmonellaparatyphi)、肠炎沙门氏菌(Salmonella enteritidis)、猪霍乱沙门氏菌(Salmonellacholerasuis)和鼠伤寒沙门氏菌(Salmonella typhimurium))、沙雷氏菌属某种(诸如粘质沙雷氏菌和液化沙雷氏菌)、志贺氏菌属某种(Shigella sp.)(诸如痢疾志贺氏菌、弗氏志贺氏菌、鲍氏志贺氏菌和宋内氏志贺氏菌)、葡萄球菌属某种(诸如金黄色葡萄球菌、表皮葡萄球菌、溶血葡萄球菌、腐生葡萄球菌)、链球菌属某种(诸如肺炎链球菌(例如氯霉素抗性血清型4肺炎链球菌、壮观霉素(spectinomycin)抗性血清型6B肺炎链球菌、链霉素(streptomycin)抗性血清型9V肺炎链球菌、红霉素(erythromycin)抗性血清型14肺炎链球菌、奥普托欣(optochin)抗性血清型14肺炎链球菌、利福平(rifampicin)抗性血清型18C肺炎链球菌、四环素抗性血清型19F肺炎链球菌、青霉素(penicillin)抗性血清型19F肺炎链球菌和甲氧苄啶(trimethoprim)抗性血清型23F肺炎链球菌、氯霉素抗性血清型4肺炎链球菌、壮观霉素抗性血清型6B肺炎链球菌、链霉素抗性血清型9V肺炎链球菌、奥普托欣抗性血清型14肺炎链球菌、利福平抗性血清型18C肺炎链球菌、青霉素抗性血清型19F肺炎链球菌或甲氧苄啶抗性血清型23F肺炎链球菌))、无乳链球菌(Streptococcus agalactiae)、变异链球菌(Streptococcus mutans)、化脓性链球菌(Streptococcus pyogenes)、A群链球菌(Group A streptococci)、化脓性链球菌、B群链球菌(Group B streptococci)、无乳链球菌、C群链球菌(Group C streptococci)、咽峡炎链球菌、类马链球菌(Streptococcusequismilis)、D群链球菌(Group D streptococci)、牛链球菌(Streptococcus bovis)、F群链球菌(Group F streptococci)和咽峡炎链球菌G群链球菌(Streptococcus anginosusGroup G streptococci))、小螺菌(Spirillum minus)、念珠状链杆菌(Streptobacillusmoniliformi)、密螺旋体属某种(Treponema sp.)(诸如斑点密螺旋体(Treponemacarateum)、细弱密螺旋体(Treponema petenue)、苍白密螺旋体(Treponema pallidum)和地方性密螺旋体(Treponema endemicum))、红色毛癣菌(Trichophyton rubrum)、须癣毛癣菌(T.mentagrophytes)、惠普尔养障体(Tropheryma whippelii)、解脲脲原体(Ureaplasmaurealyticum)、韦荣氏球菌属某种(Veillonella sp.)、弧菌属某种(诸如霍乱弧菌、副溶血弧菌、创伤弧菌、副溶血性弧菌、创伤弧菌、溶藻弧菌、拟态弧菌、霍利斯弧菌、河弧菌、麦奇尼科夫氏弧菌、海鱼弧菌(Vibrio damsela)和弗氏弧菌(Vibrio furnisii))、耶尔森菌属某种(Yersinia sp.)(诸如小肠结肠炎耶尔森菌、鼠疫耶尔森菌(Yersinia pestis)和假结核耶尔森菌())以及嗜麦芽黄单胞菌(Xanthomonas maltophilia)等。
真菌
在某些示例性实施方案中,微生物是真菌或真菌物种。可以根据所公开的方法检测的真菌的实例包括但不限于以下中的任何一种或多种(或其任何组合):曲霉属、芽生菌(Blastomyces)、念珠菌(Candidiasis)、球孢子菌(Coccidiodomycosis)、新型隐球菌(Cryptococcus neoformans)、格特隐球菌(Cryptococcus gatti)、组织胞浆菌属某种(sp.Histoplasma sp.)(诸如荚膜组织胞浆菌(Histoplasma capsulatum))、肺孢子菌属某种(Pneumocystis sp.)(诸如耶氏肺孢子菌(Pneumocystis jirovecii))、葡萄穗霉属(Stachybotrys)(诸如纸葡萄穗霉(Stachybotrys chartarum))、毛霉菌(Mucroymcosis)、孢子丝菌(Sporothrix)、眼真菌感染环癣、突脐蠕孢(Exserohilum)、枝孢霉(Cladosporium)。
在某些示例性实施方案中,真菌是酵母。可以根据所公开的方法检测的酵母的实例包括但不限于以下一种或多种(或其任何组合):曲霉属物种(诸如烟曲霉(Aspergillusfumigatus)、黄曲霉(Aspergillus flavus)和棒曲霉(Aspergillus clavatus))、隐球菌属某种(Cryptococcus sp.)(诸如新型隐球菌、格特隐球菌、罗伦隐球菌(Cryptococcuslaurentii)和浅白隐球菌(Cryptococcus albidus))、地霉属(Geotrichum)物种、酵母属物种、汉逊酵母属(Hansenula)物种、念珠菌属物种(诸如白色念珠菌)、克鲁维酵母属物种、德巴利酵母属(Debaryomyces)物种、毕赤酵母属物种或其组合。在某些示例性实施方案中,真菌是霉菌。示例性霉菌包括但不限于青霉属物种、枝孢霉属物种、丝衣霉属(Byssochlamys)物种或其组合。
原生动物
在某些示例性实施方案中,微生物是原生动物。可以根据所公开的方法和装置检测的原生动物的实例包括但不限于以下中的任何一种或多种(或其任何组合):眼虫动物界(Euglenozoa)、异叶足纲(Heterolobosea)、双滴虫目(Diplomonadida)、变形虫界(Amoebozoa)、芽囊原虫属(Blastocystic)和顶复亚门(Apicomplexa)。示例性眼虫动物界包括但不限于克氏锥虫(Trypanosoma cruzi)(查加斯病(Chagas disease))、布氏冈比亚锥虫(T.brucei gambiense)、布氏罗得西亚锥虫(T.brucei rhodesiense)、巴西利什曼原虫(Leishmania braziliensis)、婴儿利什曼原虫(L.infantum)、墨西哥利什曼原虫(L.mexicana)、大型利什曼原虫(L.major)、热带利什曼原虫(L.tropica)和杜氏利什曼原虫(L.donovani)。示例性异叶足纲包括但不限于福氏耐格里变形虫(Naegleria fowleri)。示例性双滴虫目包括但不限于肠贾第虫(Giardia intestinalis)(兰伯氏贾第虫(G.lamblia)、十二指肠贾第虫(G.duodenalis))。示例性变形虫界包括但不限于卡氏棘阿米巴(Acanthamoeba castellanii)、狒狒巴拉姆希阿米巴(Balamuthia madrillaris)、溶组织内阿米巴(Entamoeba histolytica)。示例性芽囊原虫属包括但不限于人芽囊原虫(Blastocystic hominis)。示例性顶复亚门包括但不限于微小巴贝虫(Babesia microti)、小隐孢子虫、卡耶他环孢子虫、恶性疟原虫、间日疟原虫、卵形疟原虫(P.ovale)、三日疟原虫和刚地弓形虫。
寄生虫
在某些示例性实施方案中,微生物是寄生虫。可以根据所公开的方法检测的寄生虫的实例包括但不限于以下中的一种或多种(或其任何组合):蟠尾丝虫属物种和疟原虫属物种。
病毒
在某些示例实施方案中,本文公开的系统、装置和方法涉及检测样品中的病毒。本文公开的实施方案可用于检测病毒感染(例如,受试者或植物的病毒感染),或确定病毒株,包括单核苷酸多态性不同的病毒株。病毒可以是DNA病毒、RNA病毒或逆转录病毒。可用于本发明的病毒的非限制性实例包括但不限于埃博拉、麻疹、SARS、基孔肯雅热(Chikungunya)、肝炎、马尔堡病毒、黄热病、MERS、登革热、拉沙、流感、弹状病毒或HIV。肝炎病毒可包括甲型肝炎、乙型肝炎或丙型肝炎。流感病毒可包括例如甲型流感或乙型流感。HIV可包括HIV 1或HIV 2。在某些示例性实施方案中,病毒序列可以是人呼吸道合胞病毒、苏丹埃博拉病毒(Sudan ebola virus)、本迪布焦病毒(Bundibugyo virus)、大森林埃博拉病毒(TaiForest ebola virus)、雷斯顿埃博拉病毒(Reston ebola virus)、阿基莫塔(Achimota)、伊蚊黄病毒(Aedes flavivirus)、艾顾凯特病毒(Aguacate virus)、阿卡班病毒(Akabanevirus)、阿德非德瑞塔沙粒病毒(Alethinophid reptarenavirus)、阿帕华约哺乳类沙粒病毒(Allpahuayo mammarenavirus)、阿马帕里沙粒病毒(Amapari mmarenavirus)、安第斯病毒(Andesvirus)、阿波依病毒(Apoi virus)、阿拉万病毒(Aravan virus)、阿罗阿病毒(Aroavirus)、阿莫瓦病毒(Arumwot virus)、大西洋鲑鱼副粘病毒(Atlanticsalmonparamyoxivirus)、澳洲蝙蝠狂犬病病毒(Australian bat lyssavirus)、禽波纳病毒(Avian bornavirus)、禽偏肺病毒(Avian metapneumovirus)、禽副粘病毒(Avianparamyoxvirus)、企鹅或福克兰群岛病毒(penguin or Falkland Islandsvirus)、BK多瘤病毒、巴加扎病毒(Bagaza virus)、版纳病毒、蝙蝠戊型肝炎病毒(Bathepevirus)、蝙蝠札幌病毒(Bat sapovirus)、熊佳农哺乳类沙粒病毒(Bear Canonmammarenavirus)、北龙病毒(Beilong virus)、贝塔康诺病毒(Betacoronoavirus)、贝塔乳头瘤病毒1-6(Betapapillomavirus 1-6)、班杰病毒(Bhanja virus)、博克洛蝙蝠狂犬病病毒(Bokelohbat lyssavirus)、博尔纳病病毒、波本病毒(Bourbon virus)、牛丙型肝炎病毒(Bovinehepacivirus)、牛副流感病毒3、牛呼吸道合胞病毒、巴宗病毒(Brazoran virus)、本雅威病毒(Bunyamwere virus)、杯状病毒科病毒、加利福尼亚脑炎病毒(Californiaencephalitis virus)、坎迪鲁病毒(Candiru virus)、犬瘟热病毒(Caninedistempervirus)、犬肺病毒(Canaine pneumovirus)、松湾病毒(Cedar virus)、细胞融合因子病毒(Cell fusing agent virus)、鲸麻疹病毒(Cetacean morbillivirus)、金迪普拉病毒(Chandipura virus)、朝阳病毒(Chaoyang virus)、查帕雷哺乳类沙粒病毒(Chaparemammarenavirus)、基孔肯雅病毒、疣猴乳头瘤病毒(Colobus monkeypapillomavirus)、科罗拉多蜱热病毒(Colorado tick fever virus)、牛痘病毒、克里米亚-刚果出血热病毒、库蚊黄病毒(Culex flavivirus)、库皮科斯哺乳类沙粒病毒(Cupiximammarenavirus)、登革病毒、多布拉瓦-贝尔格莱德病毒(Dobrava-Belgrade virus)、东港病毒(Donggang virus)、杜贝病毒(Dugbe virus)、杜文海格病毒(Duvenhage virus)、东方马脑炎病毒(Eastern equineencephalitis virus)、恩德培蝙蝠病毒(Entebbe batvirus)、肠病毒A-D、欧洲蝙蝠狂犬病病毒1-2、依埃契病毒(Eyach virus)、猫麻疹病毒(Feline morbillivirus)、矛头蛇副粘病毒(Fer-de-Lance paramyxovirus)、费茨罗伊河病毒(Fitzroy River virus)、黄病毒科病毒、弗莱克索哺乳类沙粒病毒(Flexalmammarenavirus)、GB病毒C、加伊若病毒(Gairo virus)、戈麦环状病毒(Gemycircularvirus)、鹅副粘病毒SF02、大岛病毒(Great Island virus)、瓜纳瑞托哺乳类沙粒病毒(Guanarito mammarenavirus)、汉坦病毒、汉坦病毒Z10、哈特兰德病毒(Heartland virus)、亨德拉病毒、甲型/乙型/丙型/戊型肝炎、丁型肝炎病毒(Hepatitisdelta virus)、人博卡病毒(Human bocavirus)、人冠状病毒、人内源逆转录病毒K、人肠道冠状病毒、人生殖器相关环状DNA病毒-1、人疱疹病毒1-8、人免疫缺陷病毒1/2、人哺乳动物腺病毒A-G(Human mastadenovirus A-G)、人乳头瘤病毒、人副流感病毒1-4、人副肠孤病毒(Human paraechovirus)、人小RNA病毒(Human picornavirus)、人斯马可病毒(Humansmacovirus)、艾克马狂犬病病毒(Ikoma lyssavirus)、伊列乌斯病毒(Ilheus virus)、甲型-丙型流感、伊皮哺乳类沙粒病毒(Ippy mammarenavirus)、伊尔库特病毒(Irkutvirus)、J-病毒、JC多瘤病毒、日本脑炎病毒、胡宁哺乳类沙粒病毒(Juninmammarenavirus)、KI多瘤病毒、卡迪皮罗病毒(Kadipiro virus)、卡密河病毒(KamitiRiver virus)、凯杜古病毒(Kedougou virus)、库贾德病毒(Khujand virus)、科科贝拉病毒(Kokobera virus)、科萨努尔森林病病毒(Kyasanur forest disease virus)、拉各斯蝙蝠病毒(Lagos bat virus)、兰加特病毒(Langat virus)、拉沙哺乳类沙粒病毒(Lassamammarenavirus)、拉丁哺乳类沙粒病毒(Latino mammarenavirus)、罗帕德山病毒(Leopards Hill virus)、辽宁病毒(Liao ning virus)、永安河病毒(Ljungan virus)、拉洛维病毒(Lloviu virus)、跳跃病病毒(Louping ill virus)、卢约哺乳类沙粒病毒(Lujomammarenavirus)、卢纳哺乳类沙粒病毒(Luna mammarenavirus)、伦卡病毒(Lunk virus)、淋巴细胞性脉络丛脑膜炎哺乳类沙粒病毒(Lymphocytic choriomeningitismammarenavirus)、欧泽诺尔狂犬病病毒(Lyssavirus Ozernoe)、MSSI2\.225病毒、马丘波哺乳类沙粒病毒(Machupo mammarenavirus)、哺乳动物星状病毒1(Mamastrovirus 1)、曼萨尼亚病毒(Manzanilla virus)、马普埃拉病毒(Mapuera virus)、马尔堡病毒、马雅罗病毒(Mayaro virus)、麻疹病毒、梅南高病毒(Menangle virus)、摩西卡迪病毒(Mercadeovirus)、梅克尔细胞多瘤病毒(Merkel cell polyomavirus)、中东呼吸综合征冠状病毒、莫巴拉哺乳类沙粒病毒(Mobala mammarenavirus)、摩多克病毒(Modoc virus)、莫江病毒(Moijang virus)、莫科洛病毒(Mokolo virus)、猴痘病毒、蒙大拿鼠耳蝙蝠脑白质炎病毒(Montana myotis leukoenchalitis virus)、莫佩亚拉沙病毒重排体29(Mopeia lassavirus reassortant29)、莫佩亚哺乳类沙粒病毒(Mopeia mammarenavirus)、莫罗戈罗病毒(Morogoro virus)、莫斯曼病毒(Mossman virus)、腮腺炎病毒、鼠类肺炎病毒、墨累山谷脑炎病毒(Murray Valley encephalitis virus)、纳里瓦病毒(Nariva virus)、新城疫病毒、尼帕病毒、诺瓦克病毒、挪威鼠丙型肝炎病毒(Norway rat hepacivirus)、恩塔亚病毒(Ntaya virus)、奥尼昂-尼昂病毒(O'nyong-nyong virus)、奥利韦罗斯哺乳类沙粒病毒(Oliveros mammarenavirus)、鄂木斯克出血热病毒(Omsk hemorrhagic fever virus)、奥罗普切病毒(Oropouche virus)、副流感病毒5、巴拉那哺乳类沙粒病毒(Paranamammarenavirus)、帕拉马塔河病毒(Parramatta River virus)、小型反刍动物瘟疫病毒(Peste-des-petits-ruminants virus)、毕赤德哺乳类沙粒病毒(Pichandemammarenavirus)、小RNA病毒科病毒、皮里陶哺乳类沙粒病毒(Pirital mammarenavirus)、鱼戊型肝炎病毒A(Piscihepevirus A)、猪副流感病毒1、猪腮腺炎病毒(porcinerubulavirus)、波瓦桑病毒(Powassan virus)、灵长类动物T-嗜淋巴细胞病毒1-2、灵长类动物红系细小病毒1(Primate erythroparvovirus 1)、庞塔托鲁病毒(Punta Torovirus)、普马拉病毒(Puumala virus)、广平病毒(Quang Binh virus)、狂犬病病毒、拉兹丹病毒(Razdanvirus)、爬行动物博尔纳病毒(Reptile bornavirus 1)、鼻病毒A-B、里夫特山谷热病毒(Rift Valley fever virus)、牛瘟病毒、热伯维病毒(Rio Bravo virus)、啮齿动物细环病毒(Rodent Torque Teno virus)、啮齿动物丙型肝炎病毒(Rodenthepacivirus)、罗斯河病毒、轮状病毒A-I、皇家农场病毒(Royal Farm virus)、风疹病毒、萨比亚哺乳类沙粒病毒(Sabia mammarenavirus)、塞勒姆病毒(Salem virus)、那不勒斯白蛉热病毒(Sandfly fever Naples virus)、西西里白蛉热病毒(Sandfly fever Sicilianvirus)、札幌病毒(Sapporo virus)、萨苏伯里病毒(Sathuperi virus)、海豹指环病毒(Seal anellovirus)、塞姆利基森林病毒(Semliki Forest virus)、仙台病毒(Sendaivirus)、汉城病毒(Seoul virus)、塞皮克病毒(Sepik virus)、严重急性呼吸综合征相关冠状病毒、严重发热伴血小板减少综合征病毒、沙门达病毒(Shamonda virus)、希莫尼蝙蝠病毒(Shimoni batvirus)、舒尼病毒(Shuni virus)、西姆布病毒(Simbu virus)、猿猴细环病毒(Simiantorque teno virus)、猿猴病毒40-41、辛诺柏病毒(Sin Nombre virus)、辛德毕斯病毒(Sindbis virus)、小指环病毒(Small anellovirus)、索素佳病毒(Sosuga virus)、西班牙山羊脑炎病毒(Spanish goat encephalitis virus)、斯庞德温尼病毒(Spondwenivirus)、圣路易斯脑炎病毒(St.Louis encephalitis virus)、森夏恩病毒(Sunshinevirus)、TTV样微小病毒(TTV-like mini virus)、塔卡里伯哺乳类沙粒病毒(Tacaribemammarenavirus)、台依病毒(Taila virus)、塔玛纳蝙蝠病毒(Tamana bat virus)、塔米埃米哺乳类沙粒病毒(Tamiami mammarenavirus)、坦布苏病毒(Tembusu virus)、托高土病毒(Thogoto virus)、索托帕拉雅病毒(Thottapalayam virus)、蜱传脑炎病毒(Tick-borneencephalitisvirus)、刁曼病毒(Tioman virus)、披膜病毒科病毒、犬细环病毒(Torqueteno canis virus)、夜猴细环病毒(Torque teno douroucouli virus)、猫细环病毒(Torque tenofelis virus)、中细环病毒(Torque teno midi virus)、猪细环病毒(Torqueteno susvirus)、狨猴细环病毒(Torque teno tamarin virus)、细环病毒(Torque tenovirus)、海狮细环病毒(Torque teno zalophus virus)、吐霍克病毒(Tuhoko virus)、图拉病毒(Tula virus)、树鼩副粘病毒、乌苏图病毒(Usutu virus)、尤库尼米病毒(Uukuniemivirus)、痘苗病毒、天花病毒、委内瑞拉马脑炎病毒(Venezuelan equine encephalitisvirus)、印第安纳水泡性口炎病毒(Vesicular stomatitis Indiana virus)、WU多瘤病毒、韦塞尔斯布朗病毒(Wesselsbron virus)、西高加索蝙蝠病毒(West Caucasian batvirus)、西尼罗河病毒、西方马脑炎病毒(Western equine encephalitis virus)、怀特沃特阿罗约哺乳类沙粒病毒(Whitewater Arroyo mammarenavirus)、黄热病病毒、横须贺病毒(Yokose virus)、尤格波格丹诺夫奇病毒(Yug Bogdanovac virus)、扎伊尔埃博拉病毒(Zaireebolavirus)、寨卡病毒或拜氏接合酵母病毒Z病毒序列(Zygosaccharomycesbailiivirus Z viral sequence)。可检测的RNA病毒的实例包括以下一种或多种(或其任何组合):冠状病毒科病毒、小RNA病毒科病毒、杯状病毒科病毒、黄病毒科病毒、披膜病毒科病毒、玻那病毒科(Bornaviridae)、丝状病毒科、副粘病毒科、肺泡病毒科(Pneumoviridae)、弹状病毒科、沙粒病毒科、布尼亚病毒科、正粘病毒科或丁型病毒。在某些示例性实施方案中,病毒是冠状病毒、SARS、脊髓灰质炎病毒、鼻病毒、甲型肝炎、诺瓦克病毒、黄热病病毒、西尼罗河病毒、丙型肝炎病毒、登革热病毒、寨卡病毒、风疹病毒、罗斯河病毒、辛德毕斯病毒、基孔肯雅病毒、博尔纳病病毒、埃博拉病毒、马尔堡病毒、麻疹病毒、腮腺炎病毒、尼帕病毒、亨德拉病毒、新城疫病毒、人呼吸道合胞病毒、狂犬病病毒、拉沙病毒、汉坦病毒、克里米亚-刚果出血热病毒、流感或丁型肝炎病毒。
在某些示例性实施方案中,病毒可以是选自包括以下的组的植物病毒:烟草花叶病毒(TMV)、番茄斑萎病毒(TSWV)、黄瓜花叶病毒(CMV)、马铃薯Y病毒(PVY)、RT病毒花椰菜花叶病毒(CaMV)、李痘病毒(PPV)、雀麦草花叶病毒(BMV)、马铃薯病毒X(PVX)、柑橘衰退病毒(CTV)、大麦黄矮病毒(BYDV)、马铃薯卷叶病毒(PLRV)、番茄丛矮病毒(TBSV)、水稻东格鲁球状病毒(rice tungro spherical virus)(RTSV)、水稻黄斑驳病毒(RYMV)、水稻白叶病毒(RHBV)、玉米雷亚朵非纳病毒(maize rayado fino virus)(MRFV)、玉米矮花叶病毒(MDMV)、甘蔗花叶病毒(SCMV)、甘薯羽状斑驳病毒(SPFMV)、甘薯凹脉黄化丝状病毒(sweetpotato sunken vein closterovirus)(SPSVV)、葡萄扇叶病毒(GFLV)、葡萄病毒A(GVA)、葡萄病毒B(GVB)、葡萄斑点病毒(GFkV)、葡萄卷叶相关病毒-1、葡萄卷叶相关病毒-2和葡萄卷叶相关病毒-3(GLRaV-1、GLRaV-2和GLRaV-3)、南芥菜花叶病毒(ArMV)或沙地葡萄茎痘相关病毒(RSPaV)。在优选的实施方案中,靶RNA分子是所述病原体的一部分或者从所述病原体的DNA分子转录而来。例如,靶序列可以包含在RNA病毒的基因组中。进一步优选的是,如果所述病原体感染或已经感染所述植物,则TnpB蛋白水解所述植物中所述病原体的所述靶RNA分子。因此优选的是,当治疗性地(即在感染已经发生之后)或预防性地(即在感染已经发生之前)应用TnpB系统(或其完成所需的部分)时,TnpB系统能够使靶RNA分子从植物病原体裂解。
在某些示例性实施方案中,病毒可以是逆转录病毒。可以使用本文所公开的实施方案检测的示例性逆转录病毒包括以下病毒中的一种或多种或任何组合:α逆转录病毒属、β逆转录病毒属、γ逆转录病毒属、δ逆转录病毒属、ε逆转录病毒属、慢病毒属、泡沫病毒属(Spumavirus),或转座病毒科(Metaviridae)、假病毒科(Pseudoviridae)和逆转录病毒科(Retroviridae)(包括HIV)、嗜肝DNA病毒科(Hepadnaviridae)(包括乙型肝炎病毒)和花椰菜花叶病毒科(Caulimoviridae)(包括花椰菜花叶病毒)。
在某些示例性实施方案中,病毒是DNA病毒。可以使用本文所公开的实施方案检测的示例性DNA病毒包括来自以下病毒科的一种或多种(或其任何组合):肌病毒科(Myoviridae)、短尾病毒科(Podoviridae)、长尾病毒科(Siphoviridae)、异疱疹病毒科(Alloherpesviridae)、疱疹病毒科(Herpesviridae)(包括人疱疹病毒和水痘带状疱疹病毒)、马洛疱疹病毒科(Malocoherpesviridae)、脂毛病毒科(Lipothrixviridae)、小杆状病毒科(Rudiviridae)、腺病毒科(Adenoviridae)、瓶状病毒科(Ampullaviridae)、囊泡病毒科(Ascoviridae)、非洲猪瘟病毒科(Asfarviridae)(包括非洲猪瘟病毒)、杆状病毒科(Baculoviridae)、西坎达病毒科(Cicaudaviridae)、棒状病毒科(Clavaviridae)、覆盖噬菌体科(Corticoviridae)、微小纺锤形病毒科(Fuselloviridae)、球状病毒科(Globuloviridae)、滴状病毒科(Guttaviridae)、肥大唾腺炎病毒科(Hytrosaviridae)、虹彩病毒科(Iridoviridae)、马赛病毒科(Maseilleviridae)、拟菌病毒科(Mimiviridae)、裸病毒科(Nudiviridae)、线形病毒科(Nimaviridae)、潘多拉病毒科(Pandoraviridae)、乳头瘤病毒科(Papillomaviridae)、藻类DNA病毒科(Phycodnaviridae)、原质病毒科(Plasmaviridae)、多DNA病毒(Polydnavirus)、多瘤病毒科(Polyomaviridae)(包括猿猴病毒40、JC病毒、BK病毒)、痘病毒科(Poxviridae)(包括牛痘和天花)、球脂状病毒科(Sphaerolipoviridae)、复层病毒科(Tectiviridae)、图里病毒科(Turriviridae)、地诺DNA病毒(Dinodnavirus)、盐末端蛋白病毒(Salterprovirus)、瑞兹病毒(Rhizidovirus)等。在一些实施方案中,诊断疑似患有细菌感染的受试者中的物种特异性细菌感染的方法被描述为从受试者获得包含细菌核糖体核糖核酸的样品;使样品与所述探针中的一个或多个接触;以及检测样品中存在的细菌核糖体核糖核酸序列与探针之间的杂交,其中杂交的检测指示受试者被以下细菌感染:大肠埃希氏菌、肺炎克雷伯氏菌、铜绿假单胞菌、金黄色葡萄球菌、鲍曼不动杆菌、白色念珠菌、阴沟肠杆菌、粪肠球菌、屎肠球菌、奇异变形杆菌、无乳葡萄球菌(Staphylococcus agalactiae)或嗜麦芽葡萄球菌(Staphylococcusmaltophilia)或其组合。
新冠病毒
当前公开的本发明的系统和方法被设计为检测冠状病毒,在一个方面,靶序列是2019-nCoV,在本文中也称为SARS-CoV-2,其引起COVID-19。冠状病毒是一种正义单链RNA病毒家族,感染多种动物和人类。SARS-CoV以及MERS-CoV都是冠状病毒感染的一种类型。设想将检测到一种或多种冠状病毒,包括检测到的SARS-CoV-2。sARS-CoV-2的序列可从GISAID登录号EPI_ISL_402124和EPI_ISL_402127-402130获得,并且描述于DOI:10.1101/2020.01.22.914952。SARS-CoV2的其他存放均存放在GISAID平台中,包括EP_ISL_402119-402121和EP_ISL 402123-402124;另见GenBank登录号MN908947.3。在一个方面,可以使用已知的SARS和SARS相关冠状病毒或来自一个或多个宿主的其他病毒来产生非冗余比对。相关病毒可以存在于例如蝙蝠中。
在一个实施方案中,系统被设计为包含至少一种根据本文公开的方法设计的高活性核酸组分多核苷酸。在优选的实施方案中,核酸组分多核苷酸与至少一个作为独特冠状病毒基因组序列的靶序列结合,从而鉴定冠状病毒的存在以排除其他病毒。所述系统和方法可被设计成检测多种呼吸道感染或病毒感染,包括冠状病毒。
在一个方面,至少一种核酸组分多核苷酸与编码对宿主免疫系统具有免疫刺激作用的多肽的冠状病毒序列结合。免疫刺激多肽具有增强、刺激或增加免疫系统应答的能力,通常通过诱导免疫系统(例如,免疫细胞)组分的活化或活性。在实施方案中,免疫刺激多肽导致宿主中免疫介导的疾病。在一个方面,宿主是可能被冠状病毒感染的哺乳动物,例如人、蝙蝠或穿山甲。Cyranoski,D.Did pangolins spread the China coronavirus topeople?Nature,2020年2月7日。在一个实施方案中,核酸组分多核苷酸可以被设计为检测肉类、活体动物和人类中的SARS-CoV-2或其变体,使得可以例如在市场和其他可能出现污染源的公共场所进行测试。
基因靶标可包含ORF1ab、N蛋白、RNA依赖性RNA聚合酶(RdRP)、E蛋白、ORF1b-nsp14、刺突糖蛋白(S)或全冠靶标。分子测定已经在开发中并且可以用作开发用于本文所述的方法和系统的核酸组分分子的起点。参见“Diagnostic detection of 2019-nCoV byreal-time RT-PCR”Charité,Berlin Germany(2020年1月17日)’Detection of 2019novelcoronavirus(2019-nCoV)in suspected human cases by RT-PCR–Hong Kong University(2020年1月23日);PCR and sequencing protocol for 2019-nCoV-Department ofMedical Sciences,Ministry of Public Health,Thailand(2020年1月28日更新);PCRand sequencing protocols for 2019-nCoV-National Institute of InfectiousDiseases Japan(2020年1月24日);US CDC panel primer and probes–U.S.CDC,USAV–U.S.CDC,USA(2020年1月28日);China CDC Primers and probes for detection 2019-nCoV(2020年1月24日),其通过引用整体并入本文。此外,核酸组分分子设计可以利用与SARS-CoV的差异或相似性。研究人员最近鉴定了2019-nCoV与SARS-CoV之间的相似性和差异。“Coronavirus Genome Annotation Reveals Amino Acid Differences with OtherSARS Viruses,”genomeweb,2020年2月10日。例如,基于8a蛋白的核酸组分分子(存在于SARS-CoV中,但在SARS-CoV-2中不存在)可用于区分病毒。类似地,8b和3b蛋白在SARS-CoV和sARS-CoV-2中具有不同的长度,并且可用于设计核酸组成分子以检测两种病毒中编码的核苷酸的非重叠蛋白。Wu等人,Genome Composition and Divergence of the NovelCoronavirus(2019-nCoV)Originating in China,Cell Host&Microbe(2020),DOI:10.1016/j.chom.2020.02.001,其通过引用并入本文,包括所有补充信息,特别是表S1。还可以使用专门设计用于检测例如SARS-CoV-2病毒变化的核酸组分和/或引物来检测突变。在实施方案中,核酸组分或引物可被设计为检测SARS-CoV-2刺突蛋白中的D614G突变。参见,Korber等人,Cell 182,812-827(2020);doi:10.1016/j.cell.2020.06.043.Othermutations in the spike protein can be designed utilizing the COVID-19viralgenome analysis pipeline available at cov.lanl.gov。设计用于检测冠状病毒或冠状病毒突变的引物和核酸组分的更多资源可见于Starr等人,“Deep Mutational Scanningof SARS-CoV-2Receptor Binding Domain Reveals Constraints in Folding and ACE2Binding,”Cell,182,1-16(2020);doi:10.1016/j.cell.2020.08.012。
所述检测系统和方法可用于鉴定单核苷酸变异、基于rRNA序列的检测、药物抗性筛选、监测微生物爆发、遗传扰动以及环境样品筛选,如2018年10月22日提交的PCT/US2018/054472的[0183]–[0327]所述,其通过引用并入本文。
在某些示例性实施方案中,本文公开的系统、装置和方法可用于生物标志物检测。例如,本文公开的系统、装置和方法可用于SNP检测和/或基因分型。本文公开的系统、装置和方法还可用于检测以异常基因表达为特征的任何疾病状态或病症。异常基因表达包括表达的基因、表达位置和表达水平的异常。可以检测到与心血管、免疫病症和癌症等疾病相关的多种转录物或蛋白质标志物。在某些示例性实施方案中,本文公开的实施方案可用于涉及裂解的疾病的细胞游离DNA检测。在某些示例性实施方案中,所述实施方案可用于更快且更便携的检测,以进行细胞游离DNA的产前测试。本文公开的实施方案可用于筛选与不同冠状病毒、进化的SARS-CoV2和其他相关呼吸道病毒感染等相关的不同SNP组。如本文别处所述,密切相关的基因表型/等位基因或生物标志物(例如,在给定靶序列中仅具有单个核苷酸差异)可以通过在核酸组分分子中引入合成错配来区分。
在一个方面,本发明涉及一种用于检测样品中的靶核酸的方法,其包括:将样品或一组样品分配到一个或多个单独的离散体积中,所述单独的离散体积包括如本文所述的根据本发明的TnpB系统;在足以允许一个或多个核酸组分分子与一个或多个靶分子结合的条件下孵育样品或样品组;经由一个或多个核酸组分分子与一个或多个靶分子的结合来活化TnpB蛋白,其中活化TnpB蛋白导致基于RNA的掩蔽构建体的修饰,使得产生可检测的阳性信号;以及检测可检测的阳性信号,其中检测到可检测的阳性信号表明样品中存在一个或多个靶分子。
本文所述的测定的灵敏度非常适合检测多种生物样品类型中的靶核酸,包括其中靶核酸被稀释或样品材料有限的样品类型。用于现场可部署和快速诊断测定的方法可以针对所利用的样品材料的类型进行优化,并且可以根据本领域已知的用于其他测定的方法进行调整。参见Myhrvold等人,2018。可以对多种样品类型进行生物标志物筛选,包括但不限于唾液、尿液、血液、粪便、痰液和脑脊液。本文公开的实施方案还可用于检测基因的上调和/或下调。例如,样品可以被连续稀释,使得只有过表达的基因保持在测定的检测限阈值之上。
在一个实施方案中,本发明提供了获得生物流体样品(例如,尿液、血浆或血清、痰、脑脊液)并提取DNA或RNA的步骤。待检测的突变核苷酸序列可以是较大分子的一部分或者可以最初作为离散分子存在。
在实施方案中,从癌症患者的血浆/血清中分离DNA。出于比较,从肿瘤组织中分离的DNA样品和第二样品可以从同一患者(对照)的非肿瘤组织(例如淋巴细胞)中分离。非肿瘤组织可以与肿瘤组织属于相同类型或来自不同的器官来源。在一个实施方案中,收集血液样品并立即通过离心将血浆与血细胞分离。可以过滤血清并冷冻保存直至DNA/RNA提取。
在一个方面,样品制备可以包括如本文所公开的方法以规避其他RNA提取方法,并且可以与标准扩增技术诸如RT-PCR以及本文公开的TnpB检测方法一起使用。在一个方面,方法可包括可以与测试冠状病毒的样品一起使用的一步免提取RNA制备方法,在一个方面,其可以是RT-qPCR测试方法、侧流检测方法或本文公开的其他TnpB检测方法。有利地,RNA提取方法可以直接与其他测试方案一起使用。在一个方面,所述方法包括使用鼻咽拭子、鼻盐水灌洗物或其他鼻部样品(例如,前鼻拭子)与Quick ExtractTM DNA提取溶液(QE09050),Lucigen或QuickExtract植物DNA提取溶液,Lucigen。在一个方面,将样品以2:1、1:1或1:2样品:DNA提取溶液进行稀释。将样品:提取混合物在约90℃至约98℃、优选约95℃下孵育。在另一个方面,孵育在约20℃至约90℃之间、约22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89或90℃下执行。孵育期可以是约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30分钟,优选约4至6分钟,或约5分钟。孵育时间和温度可能会根据样品大小和质量而变化,并且如果使用较低的温度,孵育时间可能会增加。当前的CDC实时RT-PCR诊断面板如fda.gov/media/134922/download,“CDC2019-Novel Coronavierus(2019-nCoV)Real-Time RT-PCR Diagnostic Panel”所述。在一个实施方案中,DNA提取溶液可以在孵育后与样品一起保留并用于检测方法的后续步骤中。在一个方面,检测方法是RT-qPCR反应,并且提取溶液的浓度保持低于反应混合物的10%、9%、8%、7%、6%、5%、4%、3%,其中所述反应混合物包括检测反应试剂、样品和提取液。
在一个实施方案中,珠子与本发明的特定实施方案一起使用并且可以包括在提取溶液中。珠子可用于捕获、浓缩或以其他方式富集特定材料。珠子可以是磁性的,并且可以提供珠子来捕获核酸材料。在另一个方面,珠子是二氧化硅珠。珠子可用于本文公开的方法的提取步骤中。珠子可以任选地与本文所述的方法一起使用,所述方法包括一锅法,其允许从大体积样品(诸如唾液或拭子样品)中浓缩病毒核酸,以允许单一一锅反应方法。期望的靶分子的浓度可以增加约10倍、50倍、100倍、200倍、500倍、800倍、1000倍、1500倍、2000倍、2500倍、3000倍或更多倍。
PEG和盐溶液中的磁珠在一个方面是优选的,并且在实施方案中与病毒RNA和/或DNA结合,这允许同时进行浓缩和裂解。二氧化硅珠可以用于另一个方面。预期使用捕获部分,诸如寡核苷酸官能化珠子。珠子可以与提取试剂一起使用,允许与样品和裂解/提取缓冲液一起孵育,从而将靶分子浓缩在珠子上。提取可以如本文别处所述在22℃-60℃下执行,随后在如本文别处所述的条件下进行等温扩增和/或TnpB检测。当与本文别处详述的盒装置一起使用时,可以活化磁体并收集珠子,任选地冲洗提取缓冲液并执行一次或多次洗涤。有利地,珠子可以用于一锅法和系统,而无需额外洗涤珠子,从而允许更有效的过程,而不会增加多步骤过程中的污染风险。珠子可以与本文详述的等温扩增一起利用,并且珠子可流入盒的扩增室中或维持在锅中用于扩增步骤。加热后,核酸可以从珠子上释放。
在某些示例性实施方案中,直接从粗制或未处理的样品(诸如血液、血清、唾液、脑脊液、痰或尿液)中检测靶核酸。在某些实施方案中,靶核酸为细胞游离DNA。
试剂盒
在一个方面,本发明提供了含有上述方法和组合物中公开的任何一种或多种元素的试剂盒。在一个方面,本发明提供了一种试剂盒,其包含本文所述的组分中的一种或多种。在一个实施方案中,试剂盒包含本文的组合物和使用试剂盒的说明书。在一个实施方案中,试剂盒包含载体系统和使用试剂盒的说明书。在一个实施方案中,试剂盒包含递送系统和使用试剂盒的说明书。在一个实施方案中,试剂盒包含载体系统和使用试剂盒的说明书。元素可以单独地或组合地提供,并且可以提供在任何合适的容器中,诸如小瓶、瓶子或管。试剂盒可包括核酸组分和任选的如本文所述的未结合的保护链。试剂盒可包括具有保护链的核酸组分,所述保护链至少部分地结合至核酸组分序列(即核酸组分)的可重新编程间隔子部分。因此,试剂盒可以包括如本文所述的部分双链核苷酸序列形式的核酸组分。在一个实施方案中,试剂盒包括一种或多种语言的说明书,例如多于一种语言的说明书。所述说明书可以对本文所述的应用和方法具有特异性。
在一个实施方案中,试剂盒包含用于在利用本文所述的一种或多种元素的方法中使用的一种或多种试剂。试剂可以提供在任何合适的容器中。例如,试剂盒可以提供一种或多种反应或储存缓冲液。试剂可以以可用于特定测定的形式提供,或者以需要在使用前添加一种或多种其他组分的形式提供(例如,以浓缩物或冻干形式)。缓冲液可以是任何缓冲液,包括但不限于碳酸钠缓冲液、碳酸氢钠缓冲液、硼酸盐缓冲液、Tris缓冲液、MOPS缓冲液、HEPES缓冲液及其组合。在一个实施方案中,缓冲液是碱性的。在一个实施方案中,缓冲液具有约7至约10的pH。在一个实施方案中,试剂盒包含对应于核酸组分支架的一种或多种寡核苷酸、用于插入载体中以便可操作地连接核酸组分序列和调控元件的可重新编程序列。在一个实施方案中,试剂盒包含同源重组模板多核苷酸。在一个实施方案中,试剂盒包含本文所述的一种或多种载体和/或一种或多种多核苷酸。试剂盒可以有利地允许提供本发明的系统的所有元素。
实施例
实施例1-
申请人审查了与IscB ITR共享反向末端重复(ITR)序列的TnpB,以推断TnpB的真实RNA。具体地,消旋纤线杆菌中的TnpB与消旋纤线杆菌IscB共享ITRS。图2提供了示例性TnpB的比对,其包括与消旋纤线杆菌中的TnpB的相似性。重要的是,存在一个高度保守的区域,所述区域超出了人们所认为的蛋白质的典型末端(图2)。这个保守区域标志着ITR以及表达的RNA可能存在。支持这个区域标记RNA的是TnpB基因座3'端的保守性要弱得多(图3),表明3'端不表达为RNA。TnpB与IscB之间的ITR的相似性可以包括TnpB的5'ITR(图4),其与IscB的5'ITR(图5)同源。
TnpB和IscB的5'ITR在序列水平上相似,并且基于与IscB基因座的相似性,TnpB相对于所述基因座的指导方向将是一致的。在IscB中,指导物位于基因座的5',创建指导物+(hRNA保守区)表达的RNA。这表明TnpB的5'ITR的直接上游的区域也可以充当指导物。基于紧邻保守RNA区域3'的编码序列末端的位置,这表明保守RNA区域可以由CDS表达为径流转录,其可以容易地流过ITR并包括部分周围区域而不是部分基因座(指导区域)。这表明这些系统的RNA种类是(TnpB RNA保守区)+指导物,这类似于许多V型CRISPR采用的DR+间隔子配置。
使用来自消旋纤线杆菌的现有RNA seq数据,所提出的RNA确实表达了,证据是15bp的指导物,其中RNA的其余部分保留了50-60bp(图6)。这表明表达是3'->5',意味着RNA反映了底部链。虽然IscB是一种RNA指导的核酸内切酶,类似地在相对于反向末端重复的相同位置(紧邻5'ITR的上游)具有指导物,但在基于TnpB的转座子中,效应蛋白相对于DNA转座子的方向与IscB的方向相反。IscB基因座的方向是5'ITR/hRNA(重叠)、IscB(5'链),最后是3'ITR。对于与IscB共享ITR的TnpB,它是5'ITR/RNA(RNA在3'链上)、TnpB(3'链),最后是3'ITR。这项工作与TnpB的RuvC结构域一起支持了TnpB系统充当RNA指导的DNA核酸内切酶,其中指导物是紧邻5'端上游表达的RNA。来自消旋纤线杆菌的示例性TnpB基因座的注释序列,包括5'ITR和3'ITR(图7)。
表5.
申请人鉴定了两种功能性TnpB直系同源物:裂叶游动放线菌菌株DSM 43150和ε变形菌纲细菌分离株B11。申请人使用图8中的实验方法研究了这些功能性TnpB直系同源物的TAM要求。基于所述实验,图9中鉴定了裂叶游动放线菌菌株DSM 43150和ε变形菌纲细菌分离株B11的TAM,其中TCAG鉴定为裂叶游动放线菌菌株DSM 43150的TAM,TCAT鉴定为ε变形菌纲细菌分离株B11的TAM。
实施例2-质粒切割测定
TnpB蛋白和ωRNA在体外转录/翻译反应中与两种质粒混合,一种质粒含有正确的同源靶标和TAM序列(图10中的示例性TCAT),而另一种质粒具有不正确的TAM或根本不含有靶标。如果发生切割,则可以连接衔接子,然后将其用于扩增和下一代测序。如果质粒未被切割,则衔接子将不会被连接并且产物将不会被扩增。序列的鉴定表明发生了切割。申请人已观察到(未公开的结果),衔接子连接似乎仅在任何可感知量的+TAM/+靶质粒的存在下发生,因此得出结论,切割仅在那些底物中发生。
实施例3-直系同源物5的TnpB Rd1总结
对选定的10个TnpB-Rd1直系同源物执行了RNA测序(RNA-Seq),所述直系同源物似乎和与IscB非编码RNA(ncRNA)具有序列相似性的ncRNA相关。RNA-seq的结果验证了TnpB与ncRNA相关。观察到173个核苷酸(nt)的支架可以被截短至102nt并保持TnpB活性(图11A)。使用直系同源物TnpBRd1_5_Fn30_TAM执行分析,使用Fn间隔区的30bp指导物对所有捕获的TAM进行富集(图11B),使用Fn的相同30bp指导物将TAM消耗15%(图11C),并使用644PSP1间隔子的30bp指导物对TAM进行富集(针对捕获的TAM的前10%;图11D)。结果表明,TnpB活性是可重新编程的并且具有指导特异性,即,未观察到非靶向指导物的TAM富集,TnpB活性与切口不一致,因为NEB切口酶不会导致切口位点富集,并且15-30nt的指导长度是可以接受的。
实施例4-直系同源物1和4的TnpB Rd1验证。
使用裂叶游动放线菌TnpB-1和解纤维素马杜拉放线菌TnpB中的衔接子连接读数的TAM特异性切割的质粒底物,使用TXTL切割测定来验证Rd1直系同源物1和4(图12A)。对于每种条件,使用相同浓度的两个单独的质粒来直接比较不同底物(图12A)。使用扩增产物中的下一代测序确定衔接子连接位点,并且所述衔接子连接位点显示TAM筛选与验证之间是一致的(结果基于直系同源物4)。使用非靶标(NT)链和靶标(T)链的8N TAM文库质粒的衔接子连接位置(图12B,上部条形图)显示衔接子连接位点相对于每条链略有不同。当单个TAM质粒与非靶标(NT)链一起使用时(图12B,底部条形图),衔接子连接的位点与使用TAM文库时的非靶标(NT)链相似。
实施例5-具有5'TAM的TnpB直系同源物的鉴定。
直系同源物的选择基于来自不同细菌的十种Tnp直系同源物的实验表征,所述细菌含有与IscB非编码RNA(ncRNA)具有序列相似性的ncRNA。直系同源物衍生自解纤维素马杜拉放线菌菌株DSM 45823、纳米比亚马杜拉放线菌菌株DSM 44197、两个TnpB来自解纤维素马杜拉放线菌菌株DSM 45823、纳米比亚马杜拉放线菌菌株DSM 44197、裂叶游动放线菌菌株DSM 43150、大孢束脂环酸芽孢杆菌菌株DSM 17980、嗜盐张利平氏菌菌株DSM 102030、白色嗜盐放线孢菌菌株DSM 45015、ε变形菌纲细菌、消旋纤线杆菌、席氏稍栖热菌菌株DSM9946和QNF01000004_提取物(反向)。
为了确定直系同源物中的TAM,使用了两种方法(图13A至图13B)。第一种方法包括从可操作连接的T7启动子、可重新编程的pTarget(例如,Fn)以及表达用于重新靶向的ωRNA支架和指导物的T7一起表达TnpB。对完整的pTarget进行测序以确定哪些TAM允许切割(图13A)。第二种方法涉及体外转录和翻译、TAM特异性pTarget切割,然后进行衔接子连接、切割特异性扩增,最后对富集的TAM进行测序。仅允许在那些被切割的序列中鉴定5'TAM(图13A)。显示了十个直向同源物中的七个已鉴定的TAM,并且每个都具有序列TTCAN(图13B)。
实施例6-两种TnpB直系同源物的TAM的验证。
使用存在TnpB蛋白(+蛋白质)或不存在TnpB蛋白(-蛋白质)的情况下的衔接子连接读数来验证来自裂叶游动放线菌菌株DSM 43150(TnpB-2)和解纤维素马杜拉放线菌菌株DSM 45823(图14)的两种TnpB直系同源物。结果显示,两种直系同源物中靶质粒的切割均依赖于TnpB蛋白,并且需要靶标和TAM均存在(图14)。
实施例7-TnpB-2DNA切割。
申请人确定了靶标链和非靶标链上的裂叶游动放线菌TnpB-2切割位点(图15A)。观察到与一些Cas12蛋白类似,TnpB在指导退火位点之内和之外的多个位置处切割(图15B)。
实施例8-与裂叶游动放线菌TnpB相关的ncRNA的表征。
裂叶游动放线菌TnpB-2ORF在大肠埃希氏菌中表达,包括大约200bp的下游区域。下游区域显示含有173nt支架(reRNA)和RNA指导序列(图16A)。经工程化支架序列导致一系列截短,从201nt截短至102nt,在指导物和dsDNA的存在下维持TAM特异性富集(图16B)。
实施例9-与消旋纤线杆菌TnpB相关的ncRNA的表征
紧邻消旋纤线杆菌TnpB下游的区域似乎编码ncRNA和指导序列(图17)。
实施例10-IS200/IS605元件编码多种RNA指导的核酸酶
申请人试图确定IS200/605转座子通常是否含有RNA指导的效应子。IS200/IS605转座子更常见地编码TnpB,TnpB是一种独特家族的蛋白质,其像IsrB一样含有RuvC结构域作为唯一的核酸内切酶结构域,并被认为是Cas12s(V型CRISPR效应子)的祖先(图18A)。TnpB家族的多样性比IscB家族丰富一个数量级;HMMER搜索在公开可用的原核生物基因组中鉴定了多于100万个tnpB基因座。序列保守性分析揭示了保守非编码区紧邻许多TnpB的CDS的下游,表明存在可以充当RNA指导物的相关ncRNA(图20)。先前的工作也在古细菌和细菌中鉴定了与tnpB基因3'端重叠的ncRNA,但这些ncRNA的功能尚未得到表征。消旋纤线杆菌的小RNA-seq证明了ncRNA的天然表达与相关tnpB ORF的3'端重叠(图18B),其被分类为独特类别的ωRNA。消旋纤线杆菌TnpBωRNA 3'端的反向互补与一些消旋纤线杆菌IscB中的ωRNA的5'端几乎相同,所述区域对应于每个基因座中的预测的转座子端(图18C)。对含有聚集消旋纤线杆菌TnpB的tnpB基因的非冗余基因座的分析显示,基因座3'端的保守性突然下降(图20),所述3'端对应于IS200/605转座子末端。与小RNA-seq轨迹的比较揭示了超出保守性下降的表达,这表明转录物中可能存在指导序列(图18D)。为了研究这种可能性,申请人在与ORF重叠的预测的ωRNA的存在下重组表达并纯化了这些TnpB中的一种(来自裂叶游动放线菌)。共纯化的RNA的小RNA-seq显示,含有裂叶游动放线菌中的推定指导区的预测的ωRNA与TnpB蛋白相互作用(图21A)。使用重新编程的指导物对此簇中的多个TnpB蛋白进行体外质粒切割测定,证明了使用5'TAM的RNA指导的切割(图18E)。含有TAM的靶向质粒的切割特异性衔接子连接和测序进一步证实了TnpB的可重新编程RNA指导的dsDNA核酸内切酶活性(图18F)。对其他TnpB基因座(包括裂叶游动放线菌TnpB-2、大孢束脂环酸芽孢杆菌TnpB和ε变形菌纲细菌分离株B11_G4 TnpB TAM)执行了TAM筛选(图21B)。使用SpCas9进行质粒竞争测定阳性对照。SpCas9仅切割含有TAM和靶标的质粒,如切割特异性衔接子连接产物的存在所示。通过使用双尾T检验比较每个条件下列出的第一质粒的衔接子连接的读数数目来评估统计显著性,所述数目归一化为+蛋白质与-蛋白质条件中列出的第二质粒的衔接子连接读数的平均值(图21C)。
图19中显示了RNA指导的系统的实例,包括特异性指导加载系统,诸如ω(OMEGA)和CRISPR系统,以及非特异性指导加载系统,诸如Argonaute/RNAi系统。
材料和方法
配置文件策划
IscB的初始配置文件是使用NCBI的PSI-BLAST在NR数据库上进行策划的,从起始种子序列到至多20000个靶序列,经过8次迭代。选择强过滤参数(预期阈值1e-5和PSI-BLAST阈值1e-6)以减少同样含有HNH结构域的不相关蛋白质(诸如限制性酶或归巢核酸内切酶)的积累。所有小于260aa的蛋白质均被丢弃。然后使用MAFFT FFT-NS-1比对剩余的蛋白质,并且部分蛋白质以及与HNH结构域比对覆盖率较差的蛋白质被丢弃。然后使用MMSeqs2对过滤后的集合进行聚类,序列同一性为70%,最小覆盖率为70%。然后使用MAFFT-einsi比对每个簇的MMSeqs2代表。由此产生的比对进一步分为多个结构域(NTD、RuvC-I、RuvC-II、HNH和RuvC-III),以便为各自的区域创建不同的HHAlign配置文件。对于HMMER配置文件,RuvC-I、BH和RuvC-II组合为单个配置文件以减少假阳性。
由于TnpA具有广泛的多样性,PSI-BLAST搜索产生了超过20000个同源序列。由于TnpA由单个连续催化结构域组成,因此替代地使用HHblits来识别更多非冗余同源物,使用1e-3的E值截止、80%的最小命中概率并且在UniRef30_2020_06数据库进行8次迭代。使用MAFFT-einsi比对所得蛋白质,并去除部分蛋白质。
IscB、IsrB和IshA的鉴定
所有原核生物基因组均从NCBI、NCBI WGS以及获得明确许可的JGI项目下载。所有重叠群上的ORF预测最小尺寸为80aa,并允许替代性起始密码子GTG和TTG。与现有蛋白质注释共享相同终止位置和链(+/-)的ORF被丢弃,以支持现有注释。然后使用HMMER和6个IscB配置文件(最小位数为18)搜索所有ORF。命中6个结构域中的任一个的任何ORF/蛋白质都被视为感兴趣的蛋白质(POI),并保留用于进一步分析。为了减少冗余,然后使用MMSeqs2以90%的序列同一性和85%的覆盖率对所有蛋白质进行聚类。起始位点或终止位点在重叠群边缘200bp以内的蛋白质被认为是部分的。在每个90%的簇内,长度小于第80个百分位数的蛋白质被丢弃。在剩余的蛋白质中,含有X(不明确)氨基酸的蛋白质被丢弃,除非它们的去除会导致一组空序列。在剩余的蛋白质中,代表性序列被选择为从蛋白质起始位点或终止位点到基于IscB-IsrB-Cas9RuvC/BH和RuvC/BH/HNH结构域的系统发育分析的最小距离最大的序列。
从基于IscB结构域的搜索中鉴定的Cas9表现出来自基于RuvC的树的单系分支,但并非所有Cas9都是从此搜索中鉴定出。为了扩大分析中包括的Cas9空间,使用Koonin实验室,TIGRFAM的Cas9配置文件和由CRISPRDisco的Cas9蛋白的MAFFT比对制成的配置文件,以鉴定在初始基于IscB结构域的搜索中未发现的其他Cas9蛋白,所述搜索使用HMMER,最小比特分数为25,蛋白质长度为500aa。将来自IscB结构域搜索的Cas9蛋白与来自Cas9搜索的Cas9蛋白组合并删除重复数据。然后使用GLIMMER(8)改进Cas9ORF起始位点。然后,Cas9蛋白的超集以与IscB搜索相同的方式以90%的序列同一性、85%的覆盖率进行聚类并减少冗余。然后,非冗余Cas9蛋白的超集以50%序列同一性和60%覆盖率重新聚类。50%序列同一性的选择反映了IscB与Cas9之间保守区域大小的差异,其中大约100aa在关键区域(RuvC、BH和HNH)中进化较慢。400aa蛋白质的65%最小序列同一性的聚类标准在功能上类似于具有跨越大约100aa的相同保守结构域的较大1000aa Cas9的65%-100/400+100/1000=50%序列同一性。然后将Cas9簇与IscB簇合并用于系统发育分析。
从上述过滤标准获得的IscB、IsrB和Cas9使用MAFFT-x2(两次迭代)和BLOSUM62评分(如果未提及则默认)进行比对。由于这些不同蛋白家族的结构域架构和大小不同,Cas9的RuvC-I和BH区域与IscB和IsrB的RuvC-I和BH区域并不对齐。对RuvC-I和BH进行手动分组,并使用MAFFT-x2重新比对。如果IscB-RuvC-I或Cas9-RuvC-I配置文件的HHAlign得分小于21,则去除在比对的RuvC-I结构域区域覆盖率较差的序列。由于其杂合性质,相对于所有其他蛋白质,具有Cas9样和IscB样序列且含有RuvC-I和BH的HHAlign命中的小蛋白质通常不具有与RuvC-I和BH的正确比对。对于此类蛋白质,N末端与RuvC-II之间的所有氨基酸都被分组为RuvC-I和BH以进行比对。然后使用MAFFT-linsi重新比对RuvC-I和BH区域。HNH结构域的IsrB比对列已移至RuvC-II列组。然后使用MAFFT-linsi按顺序比对RuvC-II、RuvC-III、HNH和NTD结构域。然后使用MAFFT-einsi和BLOSUM30比对BH结构域与RuvC-II之间的多余区域以鉴定REC样插入。去除与RuvC或BH结构域中的任一个都不对齐或对齐不良的序列。然后将所得的比对用于系统发育分析。
所有3种类型的蛋白质不常见的所有结构域,即NTD、REC1、REC2、PI结构域和IscB/IsrB C末端结构域,均从比对中去除,留下仅含有RuvC-I、BH、RuvC-II和RuvC-III结构域的高度保守部分的修剪比对,从而创建含有IscB、IsrB和Cas9的RuvC/BH比对。创建了仅含有IscB和Cas9的仅RuvC-I、BH、RuvC-II、HNH和RuvC-III结构域的另一个比对,称为RuvC/BH/HNH比对。对于这两种比对,去除具有死亡代表性序列(关键催化位点突变的序列)的簇。具体地,过滤的位置是RuvC-I保守D、RuvC-II保守E、HNH保守H(适用时)和RuvC-III保守D和H。使用在IQ Tree 2中实施的对称性测试来鉴定比对的潜在系统发育违规(图S#74fu2)。RuvC/BH/HNH比对显示出严重违反典型系统发育分析中使用的三个主要假设(可逆性、平稳性、同质性)的平稳性假设。由于比对含有太多分类群,无法在IQ Tree 2中使用异速模型,因此我们使用减法方法来识别平稳性违规的来源。初步分析揭示,II-B Cas9的主要单系分支始终从分支长度≥1的其余Cas9分裂,这表明其沿树的准确放置可能很困难。我们从RuvC/BH/HNH比对中去除了II-B Cas9的主要单系分支,这显著减少了边缘对称性测试p值确定的平稳性违规(图S#74fu2)。我们还从Cas9进化的早期阶段创建了另一个仅由IscB和Cas9组成的比对,这完全消除了任何平稳性违规。对于每个比对,使用在IQ Tree 2中实施的模型查找工具执行替代模型选择。使用针对小样本量校正的赤池信息量准则(AICc)来选择最佳模型。在大多数情况下,AICc最佳模型不同于贝氏信息量准则(BayesianInformation Criterion,BIC)或AIC(标准赤池信息量准则),并且对两组模型都运行了一些分析;然而,由于样本量校正较小,AICc通常更优选。然后,对于每个比对,使用多种方法(IQ Tree 2,RAxML,MrBayes)构建系统发育树以进行交叉比较。虽然FastTree2用于系统发育信息的快速可视化,但使用此方法获得的似然评分比使用IQ Tree 2、RAxML或MrBayes差得多。因此,FastTree2没有用于全面的交叉比较。
对于正文系统发育图,使用混合树方法以便浓缩与Cas9相关的信息,同时保持系统发育的准确性。对于这种方法,除了完整的IscB和IsrB组之外,还从比对中选择了Cas9簇的子样本。然后使用具有相同参数的IQ Tree 2将所得子比对用于系统发育推断。由于子比对中存在可能存在偏差的Cas9相关信息,因此Cas9谱系的位置是从原始比对推断出的树中推断出来的。这是通过从子比对树中分离Cas9分支并用较小的分离分支替换原始树上的原始Cas9分支来完成的。选择用于嫁接的分支是Cas9_849与所有其他Cas9之间的分支,因为此区域在两棵树之间共享相同的拓扑结构。检查Cas9亚型进化的顺序以确保每棵树之间的一致性,以确保在对Cas9蛋白进行大幅降采样后的兼容性。
IscB/IsrBωRNA发现、管理和分析
仅使用IscB结构域搜索的结果,收集了来自具有至少3个蛋白质和RuvC-I、RuvC-II或RuvC-III中任一种的至少2个HHAlign命中的簇并且比特数为至少17的所有代表。所有IscB和IsrB蛋白的所有上游区域(起始密码子的-300bp至+200bp)和下游区域(终止密码子的-200bp至+300bp)均使用MAFFT-einsi单独比对。上游比对证明了在IscB/IsrB的典型CDS边界之外有大的保守区域。下游比对不含有任何大的保守区域并被丢弃以用于进一步分析。使用ViennaRNA RNAFold折叠保守上游区域中的各个序列(9)。基于对比对中的关键不同区域的保守性,将比对中的序列分成单独的组。主要组被标记为G1a,涵盖大量IscBωRNA。使用R-scape推断协方差折叠的RNA结构,以校正系统发育相关性。用于所有配置文件的R-scape参数E值阈值1e-2和间隙阈值0.75。使用来自infernal的CMbuild来优化RNA比对并构建协方差模型(CM)。使用R2R将所得的RNA结构可视化。IscB/IsrBωRNA的其他比对组(G1b、G1c...)是基于来自RuvC树中的IscB/IsrB分支的保守上游区域(相对于ORF)迭代创建的,所述分支与现有ωRNA组没有很强的相关性。这些组的模型以相同的方式构建,不同之处在于,当样本量太小而无法获得准确的协方差折叠结构时,使用ViennaRNA鉴定的共有二级结构来代替R-scape结构。Infernal的协方差模型中未明确编码伪结。与CRISPR相关IscB相关的杂合CRISPR/ωRNA的结构以相同的方式推断,由于样本量较小,使用共有二级结构代替协方差折叠结构。
簇注释
收集所有10kb基因组框架(感兴趣的蛋白质(POI)周围的10kb区域)。使用CRT鉴定CRISPR序列。使用HMMER预测POI 10kb内的TnpA的所有ORF。使用Infernal-1.1的基于协方差的核酸hmm搜索cmsearch,在基因组DNA上预测所有ωRNA配置文件。得分低于35的RNA配置文件命中被丢弃。对于每个基因组框架,所有RNA配置文件命中被分组为重叠组,所述组中的每个ωRNA命中与所述组中的至少一个其他ωRNA命中在基因组上重叠。然后将每个重叠组分配给所述组中具有最高比特分数的ωRNA命中。使用GraphLAN将不同系统发育树的结果信息可视化。
IscB/IsrBωRNA的指导编码机制的鉴定
根据IscB和IsrB对所有主要ωRNA类型进行完整分类和管理后,使用HMMER和先前描述的配置文件搜索消旋纤线杆菌的基因组中的IscB和IsrB的所有实例。还使用CMsearch和G1a-G1i RNA协方差模型搜索基因组中的IscB/IsrBωRNA的所有实例。与几乎相同的ωRNA相关的多个几乎相同的IscB的出现被BLASTn鉴定,并被分类为转座子扩增。同一链上500bp内没有可检测的IscB或IsrB的ωRNA的出现被归类为独立的反式作用ωRNA。在一些情况下,ωRNA和对应的IscB/IsrB通过在它们之间插入不相关的转座子而分开。在此类情况下,ωRNA不被视为反式作用ωRNA。
所有协方差模型均根据我们的原核基因组数据库进行搜索。保留同一条链上300bp内具有多个ωRNA的实例用于进一步分析,并归类为ωRNA阵列。
真核IscB直系同源物的鉴定
所有真核基因组均从NCBI下载。为了捕获所有可能的IscB,本分析中丢弃了现有的基因模型。所有DNA序列均翻译成6框氨基酸翻译,并通过跨终止密码子分裂而分裂成ORF(*)。然后使用IscB配置文件管理步骤产生的HMMER配置文件搜索每个ORF的IscB结构域。保留同时命中IscB HNH和RuvC结构域的ORF用于进一步分析。然后使用CMsearch和本研究中创建的IscB连接的ωRNA协方差模型来搜索ORF周围区域中的IscB连接的ωRNA。
IshB的发现
产生了PLMP、RuvC-I、BH、RuvC-II、HNH和RuvC-III结构域的所有可能的结构域组合的幂集。对于每个结构域组合,计算命中每个结构域并且最小比特数为21的来自IscB结构域搜索的簇的数量。组合内表现出高水平蛋白质同源性的结构域组合被保留用于进一步分析。作为IscB、Cas9或IsrB的N末端或C末端截短的结构域组合被丢弃。从其余组合中,PLMP+HNH相对于其他结构域组合(诸如仅RuvC-II+PLMP)显示出较高的簇计数,表明所述组合对应于真正的蛋白质家族。由于存在HNH结构域,随后将这些蛋白质命名为IshB,其同时还含有IscB和IsrB中存在的PLMP结构域。
TnpB管理和ωRNA分析
使用BLASTn在消旋纤线杆菌基因组中搜索来自消旋纤线杆菌的IscB连接的ωRNA的实例。IscB或IsrB附近的命中被丢弃。在TnpB附近发现了多个部分命中,命中始终位于TnpB基因下游。对这些命中的探索揭示了多个TnpB与IscB共享转座子末端。正如对IscB所做的那样,对相关TnpB基因座执行了上游和下游基因座保守分析。由于TnpB高度多样化,因此仅包括可经由mmseqs2搜索中的高度相似性鉴定的TnpB。
小RNA测序
大肠埃希氏菌中的异源表达
用含有感兴趣的基因座的质粒转化Stbl3化学感受态大肠埃希氏菌。使用单个菌落接种5mL过夜培养物。过夜生长后,将培养物离心并重悬于750uL TRI试剂(Zymo)中,并在室温下孵育5min。添加0.5mm氧化锆/二氧化硅珠(BioSpec产品),并将培养物涡旋大约1分钟以机械裂解细胞。然后添加200uL氯仿(Sigma Aldrich),轻轻翻转培养物以混合,并且在室温下孵育3min,随后在4℃下以12000xg旋转15min。使用Direct-zol RNA miniprep plus试剂盒(Zymo)将水相用作RNA提取的输入。提取的RNA用10单位的DNA酶I(N EB)在37℃下处理30min以去除残留的DNA,并用RNA Clean&C oncentrator-25试剂盒(Zymo)再次纯化。根据制造商的方案,使用半体积反应,使用细菌RiboMinus转录组分离试剂盒(Thermo FisherSc ientific)去除核糖体RNA。然后将纯化的样品用20单位的T4多核苷酸激酶(NEB)在37℃下处理6h,并用RNA Clean&Concentrator-25(Zymo)试剂盒再次纯化。将纯化的RNA用20单位的5'RNA多磷酸酶(Lucigen)在37℃下处理30min,并使用RNA Clean&Concentrato r-5试剂盒(Zymo)再次纯化。根据制造商的方案,纯化的RNA用作NEBNext Small RNA LibraryPrep for Illumina(NEB)的输入,最终PC R中的延长时间为60s,进行16个循环。对扩增的文库进行凝胶提取,在StepOne Plus机器(Applied Biosystems/Thermo FisherScientific)上使用Illumina的KAPA文库定量试剂盒(Roche)通过qPCR进行量化,并在Illumina NextSeq上进行测序,读数1进行42个循环,读数2进行46个循环,索引1进行6个循环。使用CutAdapt修剪衔接子并使用Bowtie2(http://bowtie-bio.sourceforge.net/bowtie2/index.shtm l)将其映射到感兴趣的基因座。获得填充读数,并使用自定义Python脚本对长度大于200bp的填充读数进行可视化。
核糖核蛋白
如所述纯化RNP。100uL浓缩RNP用作输入。上述方案进行以下修改:使用300uL TRI试剂(Zymo)和60uL氯仿(Sigma Aldrich)进行RNA提取。
消旋纤线杆菌
冷冻干燥的消旋纤线杆菌SOSP1-21 DSM 44963获自DSMZ(dsmz.de/collection/catalogue/details/culture/DSM-44963),重悬于GYM链霉菌培养基(4g葡萄糖、10g麦芽提取物、4g酵母提取物于1L水中)并在28℃的振荡培养箱中生长。76天后,将培养物离心,并对上述方案进行以下修改:使用氧化锆珠执行机械裂解,并涡旋大约30min。根据制造商的方案,使用NEBNext rRNA耗竭试剂盒(细菌)(NEB)去除核糖体RNA,并在T4 PNK处理之前使用Agencourt RNAClean XP珠子(Beckman Coulter)纯化rRNA耗竭的样品。T4 PNK处理执行1.5h,并使用RNA清洁&浓缩-5试剂盒(Zymo)执行纯化。小RNA文库制备中的最终PCR包括15个循环。
克隆TAM文库
通过IDT合成具有8N简并侧翼序列的靶序列,并使用NEBNext高保真2X主混合物(NEB)通过PCR进行扩增。用限制酶(pACYC:EcoRV;pUC19:Eco88I和HindIII,Thermo FisherScientific)消化骨架质粒,并用FastAP碱性磷酸酶(Thermo Fisher Scientific)处理。使用2X Gibson组装主混合物(NEB),以8:1的插入物:载体摩尔比,通过Gibson组装在50℃下将扩增的文库片段插入骨架质粒中,持续1小时。然后通过添加等体积的异丙醇(SigmaAldrich)、最终浓度为50mM NaCl和1uL GlycoBlue核酸共沉淀剂(Thermo FisherScientific)来异丙醇沉淀Gibson组装反应。在室温下孵育15min后,将溶液在4℃下以最大速度离心15min,然后吸出上清液,并且将沉淀的DNA重悬于12uL TE中,并在50℃下孵育10分钟以溶解。然后根据制造商的说明通过电穿孔将2uL转化到持久电感受态大肠埃希氏菌(Lucigen)中,通过在37℃下振荡1h来恢复,然后接种在具有适当抗生素抗性的5个22.7cmx 22.7cm的生物测定板上。在37℃下生长12-16小时后,从板上刮下细胞并使用NucleoBondMidi-或Maxi-prep试剂盒(Machery Nagel)进行midi-或maxi-制备。
大肠埃希氏菌TAM筛选
根据制造商的方案,通过电穿孔将含有感兴趣基因座的质粒和靶8N简并侧翼文库质粒各100ng转化到30uL持久电感受态大肠埃希氏菌(Lucigen)中,每个感兴趣的基因座重复3次,并且空对照重复3次。通过在37℃下振荡1小时恢复后,将细胞接种在具有适当抗生素抗性的1个22.7cm x 22.7cm的生物测定板上,并在37℃下生长12-16h。从板上刮下细胞并充分混合,并将2mL刮下的细胞用作小量制备(Qiagen)的输入。将100ng小量制备的质粒输入PCR,以使用NEBNext高保真2X PCR主混合物(NEB)进行12个循环的PCR来扩增含有TAM的区域(补充表XXX),退火温度为63℃,然后进行第二轮18个循环的PCR,以进一步添加Illumina衔接子和条形码。对扩增的文库进行凝胶提取,通过Qubit dsDNA HS测定(ThermoFisher Scientific)进行量化,并在Illumina NextSeq上进行单端测序,其中读数1进行75个循环、索引1进行8个循环,并且索引2进行8个循环。提取TAM,并且使用自定义Python脚本使描述耗竭的TAM的weblogo可视化。
体外切割测定
通过对含有靶位点和TAM序列的pUC19质粒进行PCR扩增来产生双链DNA(dsDNA)底物。Cy3和Cy5缀合的DNA寡核苷酸(IDT)用作引物来产生标记的dsDNA底物。单链DNA(ssDNA)底物被订购为Cy5.5缀合的寡核苷酸(IDT)。生化测定中使用的所有ωRNA均使用HiScribeT7快速高产RNA合成试剂盒(New England Biolabs)从购自Twist Biosciences的DNA模板进行体外转录。使用AwaIscB执行的靶标切割测定含有20mM HEPES pH 7.5、50mM NaCl和5mM MgCl2的最终1x反应缓冲液中的10nM DNA底物、1μM蛋白质和4μMωRNA。允许测定在37℃下进行1小时,然后短暂转移至50℃持续5min,并立即置于冰上以帮助在RNA消化之前松弛RNA结构。然后用RNA酶A(Qiagen)和蛋白酶K(New England Biolabs)处理反应,并使用PCR净化试剂盒(Qiagen)进行纯化。DNA通过在Novex 10% TBE(dsDNA底物)、6% TBE-尿素(dsDNA底物)和15% TBE-尿素(ssDNA底物)聚丙烯酰胺凝胶(Thermo Fisher Scientific)上进行凝胶电泳来解析。使用CRISPR相关IscB RNP执行的靶标切割测定类似地执行,不同之处在于用450nM RNP替换了蛋白质和ωRNA,并且反应在37℃下孵育1.5小时。然后在4%琼脂糖E-凝胶(Thermo Fisher Scientific)上运行经清洁的反应。
对于AwaIscB活性的动力学分析,在净化之前的每个时间点用11mM EDTA淬灭切割反应。对于筛选金属,从反应缓冲液中除去MgCl2,同时添加2mM EDTA和7mM所示金属。使用10nM未标记的ds/ssDNA底物和10nM Cy5.5标记的旁切ssDNA底物执行旁切切割测定,并且允许反应在37℃下进行3小时。然后在15%TBE-尿素聚丙烯酰胺凝胶上评估标记的非靶向ssDNA的切割。
单链RNA(ssRNA)底物在体外转录,并在其3'端用pCp-Cy5(Jena Bioscience)进行标记。对于3'端标记,将50pmol的ssRNA与50mM Tris pH 7.8、10mM MgCl2、10mM DTT、2mMATP和10%DMSO中的100pmol的pCp-Cy5和50U的T4 RNA连接酶1(New England Biolabs)在4℃下孵育40小时。用20mM EDTA淬灭标记反应,并使用RNA清洁和浓缩试剂盒(Zymo)进行纯化。ssRNA切割测定以类似于DNA切割测定的方式执行,在反应结束时用19mM EDTA淬灭,用蛋白酶K处理,并在6% TBE-尿素聚丙烯酰胺凝胶上可视化。
细胞游离转录/翻译TAM筛选
IscB蛋白序列使用GenScript密码子优化工具进行人类密码子优化,并且具有内源密码子优化的IscB基因、TnpB基因以及ωRNA支架由Twist Biosciences合成。转录/翻译模板是通过PCR由定制合成产品产生的。根据制造商的半体积反应方案,使用PURExpress体外蛋白质合成试剂盒(NEB),使用75ng的感兴趣的蛋白质的模板、125ng具有靶向TAM文库的指导物的对应ωRNA的模板和25ng TAM文库质粒,进行细胞游离转录/翻译反应。反应在37℃下孵育4小时,然后通过置于4℃或冰上并各自添加10ug RNA酶A(Qiagen)和8单位蛋白酶K(NEB)来淬灭,然后在37℃下孵育5min。通过PCR纯化提取DNA,并且根据制造商的方案,使用Illumina的NEBNext Ultra IIDNA文库制备试剂盒(NEB),使用Illumina的NEBNext衔接子(NEB)来连接衔接子。衔接子连接后,使用一种对TAM文库骨架具有特异性的引物和一种对NEBNext衔接子具有特异性的引物,使用NEBNext高保真2X PCR主混合物(NEB)在63℃的退火温度下进行12个循环的PCR,以特异性扩增切割产物,然后进行第二轮18个循环的PCR,以进一步添加Illumina i5衔接子。对扩增的文库进行凝胶提取,在StepOne Plus机器(Applied Biosystems/Thermo Fisher Scientific)上使用Illumina(Roche)的KAPA文库定量试剂盒通过qPCR进行量化,并在Illumina MiSeq上进行单端测序,读数1进行80个循环,索引1进行8个循环,并且索引2进行8个循环。提取TAM,并通过以下方式计算每种TAM的富集评分:过滤所有出现多于一次的TAM,并且归一化为输入库中的TAM频率,所述输入库经历相同的体外转录/翻译和淬灭反应。产生基于富集分数的位置权重矩阵,并使用自定义Python脚本基于所述位置权重矩阵将weblogo可视化。
KraIscB-1RNP复合物的表达和纯化
与其天然基因座的ncRNA复合的KraIscB-1的纯化以类似于CRISPR相关IscB-ncRNA RNP复合物的方式执行,但进行了以下修改:(1)KraIscB-1CDS没有改变,并且优化了人类密码子;(2)在100μg/ml氨苄青霉素(ampicillin)和25μg/ml卡那霉素的存在下,在BL21(DE3)细胞(New England Biolabs)中与ncRNA共表达;(3)未使用bdSENP1蛋白酶,因为KraIscB-1蛋白未附着至N末端标签,而仅在其C末端带有双链球菌标签。通过小RNA测序限定共纯化RNA的边界后,将预测的ωRNA序列克隆到pCOLADuet-1载体中的T7启动子的下游以进行诱导表达,然后按照相同的程序制备KraIscB-1-ωRNA复合物。
细胞游离转录/翻译切割测定
ωRNA模板如所述从定制合成产品中扩增,并进行体外转录,使用HiScribe T7快速高产RNA合成试剂盒(NEB)和2uL中的150ng DNA模板和2uL T7 RNA聚合酶混合物(NEB)以及30uL反应物中的6.67mM最终浓度的每种NTP,并且用RNA清洁&浓缩-25试剂盒(Zymo)纯化。从定制合成产品或基因座质粒模板扩增蛋白质序列。为了产生靶标,Genewiz合成了含有靶标的短寡核苷酸和具有适当突出端的TAM序列,并通过金门(Golden Gate)或限制性连接克隆将其克隆到对应的骨架质粒中。通过IDT合成用于产生标记的线性靶标的标记引物,并根据制造商的方案使用Q5热启动高保真2x主混合物(NEB)通过PCR从靶标质粒扩增线性靶标。
根据制造商的半体积反应方案,使用PURExpress体外蛋白质合成试剂盒(NEB),使用75ng感兴趣的蛋白质的模板和最终浓度的1μM体外转录ωRNA进行细胞游离转录/翻译反应。将反应在37℃下孵育4小时,然后置于冰上以淬灭体外转录/翻译。然后添加50-100ng靶底物,并将反应在特定温度下再孵育1小时。然后通过各自添加10ug RNA酶A(Qiagen)和8单位蛋白酶K(NEB)来淬灭反应,然后在37℃下孵育5min。通过PCR纯化提取DNA,并且根据制造商的方案,按照规定,在10%或6% NovexTBE-尿素凝胶或10%Novex TBE凝胶(ThermoFisher Scientific)上进行电泳。凝胶用1X SYBR金(Thermo Fisher Scientific)染色,规定时间为10-15min,并在具有最佳曝光设置的ChemiDoc成像仪(BioRad)上成像。
哺乳动物细胞培养和转染
哺乳动物细胞培养实验在Dulbecco改良Eagle培养基中生长的HEK293FT系(美国典型培养物保藏中心(ATCC))中执行,所述培养基含有高葡萄糖、丙酮酸钠和GlutaMAX(Thermo Fisher),额外补充有1×青霉素-链霉素(Thermo Fisher)、10mM HEPES(ThermoFisher)和10%胎牛血清(VWR Seradigm)。所有细胞的汇合度均维持在80%以下。
所有转染均使用Lipofectamine 2000(Thermo Fisher)执行。转染前16-20小时将细胞接种,以确保转染时90%的汇合度。对于96孔板,细胞以20,000个细胞/孔接种,对于24孔板,细胞以100,000个细胞/孔接种。对于板上的每个孔,将转染质粒与OptiMEM I低血清培养基(Thermo Fisher)组合至总量25μL。单独地,将23μL OptiMEM与2μL Lipofectamine2000组合。然后将质粒和Lipofectamine溶液组合并移液至细胞上。
哺乳动物裂解物切割测定
使用2X Gibson组装主混合物(NEB)通过Gibson组装将人类密码子优化的IscB基因克隆到CMV表达骨架中,以产生pCMV-SV40NLS-IscB蛋白-核质蛋白NLS-3xHA构建体。如所述,将500ng每种蛋白质表达质粒转染到24孔板的单独孔中。大约48小时后,用500μLDulbecco磷酸盐缓冲盐水(Sigma Aldrich)洗涤细胞。添加50μL冰冷裂解缓冲液(20mMHEPES 7.5、100mM KCl、5mM MgCl2、0.1% Triton-X 100、5%甘油、1mM DTT、1X完整蛋白酶抑制剂混合物),然后从板上刮下细胞,转移至干净的管中并在冰上孵育15min。然后将细胞在冷水浴中以振幅30超声处理4个循环,每个循环10s。然后通过以最大速度离心20min来澄清裂解物,并收集上清液并在测定中新鲜使用或在液氮中速冻以供以后使用。如上文“细胞游离转录/翻译切割测定”中所述产生标记的靶标和体外转录的RNA。
ωRNA模板如所述从定制合成产品中扩增,并进行体外转录,使用HiScribe T7快速高产RNA合成试剂盒(NEB)和2uL中的150ng DNA模板和2uL T7 RNA聚合酶混合物(NEB)以及30uL反应物中的6.67mM最终浓度的每种NTP,并且用RNA清洁&浓缩-25试剂盒(Zymo)纯化。为了执行切割测定,将10μL细胞裂解物与1μg体外转录的ωRNA或sgRNA或阴性对照为无RNA以及1X NEBuffer 3.1(NEB)中的100ng靶底物一起孵育。反应在37℃下孵育1小时,然后通过各自添加10ug RNA酶A(Qiagen)和8单位蛋白酶K(NEB)来淬灭,然后在37℃下孵育5min。通过PCR纯化提取DNA,并且根据制造商的说明在4%琼脂糖E-凝胶EX(Thermo FisherScientific)上运行,并在ChemiDoc成像仪(BioRad)上可视化。
切割产物的测序
如所述执行体外切割测定。使用2.5uM衔接子作为近端衔接子退火步骤的输入,如所述对纯化的反应进行GLOE-seq文库制备方案(15)。添加Illumina衔接子和条形码的最终扩增使用NEBNext高保真2x PCR主混合物(NEB)执行,退火温度为63℃,持续15s,进行12个循环。使用Illumina MiSeq对文库进行双端测序,其中读数1进行150个循环、读数2进行150个循环、索引1进行8个循环,并且索引2进行8个循环。使用BWA将双端读数映射至靶底物,并使用自定义Python脚本提取并绘制3'端。
酶促足迹法(Enzymatic footprinting assay)
dsDNA底物(191bp)通过PCR扩增由含有靶位点和TAM序列的质粒产生。将10pmol的dAwaIscB和40pmol的ωRNA在反应缓冲液(20mM HEPES pH 7.5、50mM NaCl、10mM MgCl2和5%甘油)中在37℃下孵育30min。然后,添加0.1pmol DNA底物,并允许反应在37℃下再进行30min。接下来,添加500U的核酸外切酶III(New England Biolabs),将测定在37℃下再孵育10min,并且用20mM EDTA淬灭。作为阴性对照,平行运行另一个反应,其中排除ωRNA并用水替换体积。淬灭后,将两个反应短暂转移至50℃持续5min,然后立即置于冰上,用RNA酶A(Qiagen)和蛋白酶K(New England Biolabs)处理,并使用PCR净化试剂盒(Qiagen)进行纯化。使用2.5uM衔接子作为近端和远端衔接子退火步骤的输入,对纯化的反应进行GLOE-seq文库制备方案。如“材料和方法”部分中的“切割产物的测序”中所述扩增文库,并且使用Illumina MiSeq对文库进行双端测序,其中读数1进行100个循环、读数2进行100个循环、索引1进行8个循环,并且索引2进行8个循环。使用BWA将双端读数映射至靶底物,并使用自定义Python脚本提取并绘制3'端。
哺乳动物基因组编辑
通过Gibson组装将ωRNA支架骨架克隆到基于pUC19的人类U6表达骨架中。对于合并的12个指导文库,将添加给定库中的12个指导物中的每一个的引物以等摩尔比混合,并且使用Phusion快速高保真2X主混合物(Thermo Fisher Scientific),使用退火至U6启动子的指导引物和退火至ωRNA支架起点的第二引物,对ωRNA支架骨架进行完整质粒扩增。对PCR产物进行凝胶提取并在30uL中洗脱,然后通过添加5单位T4 PNK(NEB)、200单位T4DNA连接酶(NEB)和最终1X T4 DNA连接酶缓冲液(NEB)来连接平末端以环化,并且在室温下孵育1.5h,然后在Stbl3化学感受态大肠埃希氏菌(NEB)中转化。对于单个指导构建体,Genewiz合成了具有适当突出端的寡核苷酸,使用T4 PNK(NEB)进行退火和磷酸化,并且通过限制性连接克隆将其克隆到ωRNA骨架中。蛋白质表达构建体如上文“哺乳动物裂解物切割测定”中所述克隆。
对于单个指导序列,对于所述的每种指导条件,将250ng指导物/ωRNA表达质粒和125ng蛋白表达质粒转染到96孔板的4个孔中的每一个中。60-72小时后,通过在1xDPBS(Sigma Aldrich)中洗涤细胞一次并添加50uL QuickExtract DNA提取溶液(Lucigen)来收获基因组DNA。从板上刮下细胞,将其悬浮在QuickExtract中,并在65℃下循环15min,在68℃下循环15min,然后在95℃下循环10min以裂解细胞。2.5uL的裂解细胞用作每个PCR反应的输入。
对于文库扩增,扩增靶基因组区域,并使用NEBNext高保真2X PCR主混合物(NEB)进行12个循环的PCR,退火温度为63℃,持续15s,然后进行第二轮18个循环的PCR以添加Illumina衔接子和条形码。对文库进行凝胶提取,并在Illumina MiSeq上进行单端测序,其中读数1进行300个循环、索引1进行8个循环,索引2进行8个循环。使用CRISPResso2分析插入/缺失(插入缺失)频率。鉴于IscB的插入缺失事件频率较低,为了消除PCR中的噪音和测序错误,仅将具有至少2个读数或插入或缺失多于1个碱基的插入缺失计入报告的插入缺失频率。对于单个指导物/ωRNA实验,为了评估统计显著性,使用非靶向指导物/ωRNA条件作为阴性对照来执行2尾T检验(参见补充表ukreP)。
TnpB RNP复合物的表达和纯化
为了纯化与其天然基因座的推定ωRNA复合的TnpB蛋白,将N末端His14-MBP标记的TnpB CDS和对应的下游基因座(至多超出预测的指导衔接子末端80bp)克隆为pET45b(+)载体中T7启动子下游的单片。TnpB RNP以与CRISPR相关IscB RNP类似的方式表达并纯化,但进行了以下修改:(1)裂解缓冲液和缓冲液A和B中补充40mM咪唑和5mMβ-巯基乙醇,同时消除所有缓冲液中的MgCl2和DTT;(2)RNP在Ni-琼脂糖凝胶6快速流动珠(GE Healthcare)上纯化,而不是在链球菌-Tactin树脂上纯化;(3)洗脱缓冲液中补充300mM咪唑和5mMβ-巯基乙醇,同时消除MgCl2、DTT和脱硫生物素;(4)His14-MBP溶解度标签保持附着在RNP上以提供稳定性。
体外转录/翻译质粒竞争测定
如“细胞游离转录/翻译切割测定”中所述,使用62.5ng蛋白质模板和最终浓度为5uL中7uM的ωRNA建立了验证TAM特异性TnpB活性的体外测定。SpCas9也作为阳性对照进行了测定(图S#KnIchC)。反应在37℃下孵育3小时,然后添加靶质粒底物。每个反应接受2种质粒各15ng,其含有侧接同源靶标的TAM序列、仅含有同源靶标或不含靶标。将反应物在37℃下再孵育1小时,然后淬灭并进行衔接子连接和测序,如“细胞游离转录/翻译TAM筛选”中所述。使用自定义python脚本来量化对应于每种质粒底物的切割产物。
***
在不偏离本发明的范围和精神的情况下,本发明的各种修改和变型对于本领域技术人员而言将是显而易见的。尽管已结合具体实施方案对本发明进行了描述,但应当理解,能够进行进一步的修改,并且所要求保护的本发明不应当不适当地限定于此类具体实施方案。实际上,用于进行本发明的所述方式的各种修改对于本领域技术人员而言是明显的,并且旨在包含在本发明的范围内。本申请旨在涵盖大体上符合本发明原理的并且包括虽然不属于本发明所公开内容范围但属于本发明所属领域的已知的常用技术手段并可以应用于上文中阐述的必要特征中的任何变型、用途或者变更。

Claims (70)

1.一种非天然存在的、工程化的组合物,其包含a)TnpB多肽,所述TnpB多肽包含Ruv-C核酸酶结构域,所述Ruv-C核酸酶结构域任选地包含Ruv-CI、Ruv-CII和Ruv-CIII亚结构域,和b)ωRNA分子,所述ωRNA分子包含支架和可重新编程间隔序列,所述核酸组分分子能够与所述TnpB多肽形成复合物并且将所述TnpB多肽引导至靶多核苷酸。
2.如权利要求1所述的组合物,其中所述TnpB多肽包含约200至约500个氨基酸。
3.如权利要求1所述的组合物,其中所述可重新编程间隔序列包含长度为10个核苷酸至30个核苷酸的间隔子。
4.如权利要求1所述的组合物,其中所述ωRNA组分分子包含长度为约80至200个核苷酸的支架。
5.如前述权利要求中任一项所述的组合物,其中所述TnpB复合物与所述靶多核苷酸5′的靶相邻基序(TAM)结合。
6.如权利要求5所述的组合物,其中所述TAM序列包含TCA。
7.如权利要求5所述的组合物,其中所述TAM序列包含TTCAN。
8.如前述权利要求中任一项所述的组合物,其中所述靶多核苷酸是DNA。
9.如前述权利要求中任一项所述的组合物,其还包含同源重组供体模板,所述同源重组供体模板包含用于插入到靶多核苷酸中的供体序列。
10.如前述权利要求中任一项所述的组合物,其还包含与所述TnpB蛋白缔合的功能结构域。
11.如权利要求10所述的组合物,其中所述功能结构域是转座酶、整合酶、核碱基脱氨酶、逆转录酶、重组酶、整合酶、拓扑异构酶、逆转录转座子、磷酸酶、聚合酶、连接酶、螺旋子、解旋酶、甲基化酶、去甲基化酶、翻译活化子、翻译阻遏子、转录活化子、转录阻遏子、转录释放因子、染色质修饰子、组蛋白修饰子、核酸酶。
12.一种载体系统,其包含编码如前述权利要求中任一项所述的TnpB多肽和ωRNA组分的一种或多种载体。
13.一种工程化细胞,其包含如权利要求1至12中任一项所述的组合物。
14.一种修饰细胞中的靶多核苷酸序列的方法,其包括将如权利要求1至12中任一项所述的组合物引入到所述细胞中。
15.如权利要求14所述的方法,其中所述修饰包括切割DNA多核苷酸。
16.如权利要求15所述的方法,其中所述切割导致5′突出端。
17.如权利要求16所述的方法,其中所述切割发生在靶相邻基序的远端。
18.如权利要求17所述的方法,其中所述切割发生在间隔子退火位点的位点或所述靶序列的3′。
19.如权利要求14所述的方法,其中所述多肽和/或ωRNA组分经由编码所述多肽和/或一种或多种ωRNA组分的一种或多种多核苷酸来提供,并且其中所述一种或多种多核苷酸可操作地配置为表达所述TnpB多肽和/或所述ωRNA组分分子。
20.如前述权利要求中任一项所述的方法,其中所述一种或多种突变包括取代、缺失和插入。
21.一种经工程化、非天然存在的组合物,其包含:
a.TnpB多肽,其中所述TnpB多肽是催化失活的,
b.核苷酸脱氨酶,其与所述TnpB蛋白缔合或者以其他方式能够与所述TnpB蛋白形成复合物,以及
c.ωRNA组分分子,其能够与所述TnpB蛋白形成复合物并且引导靶序列处的位点特异性结合。
22.如权利要求21所述的组合物,其中所述TnpB选自表1A、1B、1C或图1。
23.如权利要求21所述的组合物,其中所述核苷酸脱氨酶是腺苷脱氨酶或胞苷脱氨酶。
24.一种或多种多核苷酸,其编码如权利要求21或22中任一项所述的组合物的一种或多种组分。
25.一种或多种载体,其编码如权利要求24所述的一种或多种多核苷酸。
26.一种细胞或其后代,其经遗传工程化以表达如权利要求24或26中任一项所述的组合物的一种或多种组分。
27.一种编辑靶多核苷酸中的核酸的方法,其包括将如权利要求21或22所述的组合物、如权利要求24所述的一种或多种多核苷酸、或如权利要求25所述的一种或多种载体递送至包含所述靶多核苷酸的细胞或细胞群。
28.如权利要求27所述的方法,其中所述靶多核苷酸是基因组DNA内的靶序列。
29.如权利要求27或28所述的方法,其中在一个或多个碱基处编辑所述靶多核苷酸以引入G→A或C→T突变。
30.一种经分离的细胞或其后代,其包含使用如权利要求28至29中任一项所述的方法进行的一个或多个碱基编辑。
31.一种经工程化、非天然存在的组合物,其包含:
a.催化死亡的TnpB多肽,
b.逆转录酶,其与所述TnpB多肽缔合或者以其他方式能够与所述TnpB多肽形成复合物,以及
c.ωRNA组分分子,其能够与所述TnpB蛋白形成复合物并且引导所述复合物与靶多核苷酸的靶序列的位点特异性结合,所述指导分子还包含编码用于插入到所述靶多核苷酸中的供体序列的供体模板。
32.一种或多种多核苷酸,其编码如权利要求31所述的组合物的一种或多种组分。
33.一种或多种载体,其编码如权利要求32所述的一种或多种多核苷酸。
34.一种修饰靶多核苷酸的方法,其包括:
将如权利要求31所述的组合物、如权利要求32所述的一种或多种多核苷酸、或如权利要求33所述的一种或多种载体递送至包含所述靶多核苷酸的细胞或细胞群,其中所述复合物将所述逆转录酶引导至所述靶序列,并且所述逆转录酶促进由来自所述ωRNA组分分子的所述供体模板编码的供体序列插入到所述靶多核苷酸中。
35.如权利要求34所述的方法,其中所述供体序列的插入:
a.引入一个或多个碱基编辑;
b.校正或引入提前终止密码子;
c.破坏剪接位点;
d.插入或恢复剪接位点;
e.在所述靶多核苷酸的一个或两个等位基因处插入基因或基因片段;或
f.其组合。
36.一种经分离的细胞或其后代,其包含使用如权利要求34或35所述的方法进行的修饰。
37.一种经工程化、非天然存在的组合物,其包含:
a.TnpB多肽,
b.非LTR逆转录转座子蛋白,其与所述TnpB多肽缔合或者以其他方式能够与所述TnpB多肽形成复合物,以及
c.ωRNA组分分子,其能够与所述TnpB蛋白形成复合物并引导所述复合物与靶多核苷酸的靶序列的位点特异性结合,所述ωRNA分子还包含编码用于插入到所述靶多核苷酸中的供体序列的供体模板,并且位于能够与所述非LTR逆转录转座子蛋白形成复合物的两个结合元件之间。
38.如权利要求37所述的组合物,其中所述TnpB蛋白融合至所述非LTR逆转录转座子蛋白的N末端。
39.如权利要求37或38所述的组合物,其中所述TnpB蛋白经工程化以具有切口酶活性。
40.如权利要求39所述的组合物,其中所述ωRNA组分分子将所述融合蛋白引导至所述靶向插入位点5′的靶序列,并且其中所述TnpB蛋白在所述靶向插入位点处产生链断裂。
41.如权利要求39所述的组合物,其中所述ωRNA组分分子将所述融合蛋白引导至所述靶向插入位点3′的靶序列,并且其中所述TnpB蛋白在所述靶向插入位点处产生链断裂。
42.如权利要求39所述的组合物,其中所述供体多核苷酸还包含聚合酶加工元件以促进所述供体多核苷酸序列的3′端加工。
43.如权利要求39所述的组合物,其中所述供体多核苷酸还包含与所述供体构建体的5′端、所述供体构建体的3′端或两者上的靶序列同源的区域。
44.如权利要求43所述的组合物,其中所述同源区为8至25个碱基对。
45.一种或多种多核苷酸,其编码如权利要求39至44中任一项所述的组合物的一种或多种组分。
46.一种或多种载体,其包含如权利要求45所述的一种或多种多核苷酸。
47.一种修饰靶多核苷酸的方法,其包括:
将如权利要求39至44中任一项所述的组合物、如权利要求45所述的一种或多种多核苷酸、或如权利要求46所述的一种或多种载体递送至包含所述靶多核苷酸的细胞或细胞系,其中所述复合物将所述非LTR逆转录转座子蛋白引导至所述靶序列,并且所述非LTR逆转录转座子蛋白促进将来自所述供体构建体的供体多核苷酸序列插入到所述靶多核苷酸中。
48.如权利要求47所述的方法,其中所述供体序列的插入:
a.引入一个或多个碱基编辑;
b.校正或引入提前终止密码子;
c.破坏剪接位点;
d.插入或恢复剪接位点;
e.在所述靶多核苷酸的一个或两个等位基因处插入基因或基因片段;或
f.其组合。
49.一种经分离的细胞或其后代,其包含使用如权利要求47或48所述的方法进行的修饰。
50.一种经工程化、非天然存在的组合物,其包含:
a.TnpB多肽,
b.整合酶蛋白和任选地逆转录酶,所述整合酶蛋白与所述TnpB多肽缔合或者以其他方式能够与所述TnpB多肽形成复合物,以及
c.ωRNA组分分子,其能够与所述TnpB蛋白形成复合物并引导所述复合物与靶多核苷酸的靶序列的位点特异性结合,所述指导分子还包含编码用于插入到所述靶多核苷酸中的供体序列的供体模板,并且位于能够与所述整合酶蛋白形成复合物的两个结合元件之间。
51.如权利要求50所述的组合物,其中所述TnpB蛋白融合至所述整合酶蛋白并且任选地融合至所述逆转录酶。
52.如权利要求50或51所述的组合物,其中所述TnpB蛋白经工程化以具有切口酶活性。
53.如权利要求52所述的组合物,其中所述ωRNA组分分子将所述融合蛋白引导至靶序列,并且其中所述TnpB蛋白在所述靶向插入位点处产生切口。
54.如权利要求52所述的组合物,其中所述供体多核苷酸还包含与所述供体构建体的5′端、所述供体构建体的3′端或两者上的靶序列同源的区域。
55.一种或多种多核苷酸,其编码如权利要求52至54中任一项所述的组合物的一种或多种组分。
56.一种或多种载体,其包含如权利要求55所述的一种或多种多核苷酸。
57.一种修饰靶多核苷酸的方法,其包括:
将如权利要求50至54中任一项所述的组合物、如权利要求55所述的一种或多种多核苷酸、或如权利要求56所述的一种或多种载体递送至包含所述靶多核苷酸的细胞或细胞群,其中所述复合物将所述整合酶蛋白引导至所述靶序列,并且所述整合酶蛋白促进将来自所述供体构建体的供体多核苷酸序列插入到所述靶多核苷酸中。
58.如权利要求57所述的方法,其中所述供体序列的插入:
a.引入一个或多个碱基编辑;
b.校正或引入提前终止密码子;
c.破坏剪接位点;
d.插入或恢复剪接位点;
e.在所述靶多核苷酸的一个或两个等位基因处插入基因或基因片段;或
f.其组合。
59.一种经分离的细胞或其后代,其包含使用如权利要求57或58所述的方法进行的修饰。
60.一种用于检测样品中靶多核苷酸的存在的组合物,其包含:
一种或多种具有旁切活性的TnpB蛋白;
至少一种ωRNA组分,其包含能够结合靶多核苷酸的序列并且被设计为与所述一种或多种TnpB蛋白形成复合物;
检测构建体,其包含多核苷酸组分,其中所述TnpB表现出旁切核酸酶活性并且一旦被所述靶序列活化就切割所述检测构建体的多核苷酸组分;以及
任选地,等温扩增试剂。
61.如权利要求60所述的组合物,其中所述TnpB选自表1A、表1B、表1C或图1,或者包含对应于图1的序列比对的195D、277E或361D的一个或多个催化残基。
62.如权利要求60所述的组合物,其中所述一种或多种TnpB蛋白选自表1A、表1B、表1C或图1,并且在45℃至60℃的温度范围内具有活性,即具有核酸酶活性。
63.如权利要求60所述的组合物,其中所述等温扩增试剂是环介导等温扩增(LAMP)试剂。
64.如权利要求63所述的组合物,其中所述LAMP试剂包含LAMP引物。
65.如权利要求60至64中任一项所述的组合物,其还包含一种或多种添加剂以增加反应特异性或动力学。
66.如权利要求60至65中任一项所述的组合物,其还包含多核苷酸结合珠。
67.一种用于检测样品中的多核苷酸的方法,所述方法包括:
使一个或多个靶序列与TnpB、至少一种能够与所述TnpB形成复合物并引导与一种或多种靶多核苷酸的序列特异性结合的ωRNA组分以及检测构建体接触,其中所述TnpB表现出旁切核酸酶活性并且一旦被所述一个或多个靶序列活化就切割所述检测构建体;和
检测来自所述检测构建体的切割的信号,从而检测所述一种或多种靶多核苷酸。
68.如权利要求67所述的方法,其还包括在所述接触步骤之前使用等温扩增来扩增所述靶多核苷酸。
69.如权利要求68所述的方法,其中通过所述靶多核苷酸与所述TnpB复合物的结合来检测扩增的靶多核苷酸在45℃至60℃的温度范围内发生。
70.如权利要求67所述的方法,其中所述靶多核苷酸在一小时或更短的时间内检测。
CN202280024175.9A 2021-01-25 2022-01-25 可重新编程的tnpb多肽及其用途 Pending CN117616126A (zh)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US63/141,371 2021-01-25
US63/195,610 2021-06-01
US63/210,860 2021-06-15
US202163282352P 2021-11-23 2021-11-23
US63/282,352 2021-11-23
PCT/US2022/013710 WO2022159892A1 (en) 2021-01-25 2022-01-25 Reprogrammable tnpb polypeptides and use thereof

Publications (1)

Publication Number Publication Date
CN117616126A true CN117616126A (zh) 2024-02-27

Family

ID=89958397

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280024175.9A Pending CN117616126A (zh) 2021-01-25 2022-01-25 可重新编程的tnpb多肽及其用途

Country Status (1)

Country Link
CN (1) CN117616126A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117947054A (zh) * 2024-03-25 2024-04-30 上海羽冠生物技术有限公司 一种百日咳鲍特菌无缝基因编辑的方法
CN120310956A (zh) * 2025-06-11 2025-07-15 中国科学院东北地理与农业生态研究所 一种基于DNAzyme的基因芯片生物传感器及其应用

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117947054A (zh) * 2024-03-25 2024-04-30 上海羽冠生物技术有限公司 一种百日咳鲍特菌无缝基因编辑的方法
CN120310956A (zh) * 2025-06-11 2025-07-15 中国科学院东北地理与农业生态研究所 一种基于DNAzyme的基因芯片生物传感器及其应用

Similar Documents

Publication Publication Date Title
EP4281567A1 (en) Reprogrammable tnpb polypeptides and use thereof
AU2021364399A9 (en) Reprogrammable iscb nucleases and uses thereof
CN115175996A (zh) 新颖vi型crispr酶和系统
WO2022173830A1 (en) Nuclease-guided non-ltr retrotransposons and uses thereof
WO2021102042A1 (en) Retrotransposons and use thereof
WO2020236967A1 (en) Random crispr-cas deletion mutant
WO2023114872A2 (en) Reprogrammable fanzor polynucleotides and uses thereof
WO2021097118A1 (en) Small type ii cas proteins and methods of use thereof
EP4437094A1 (en) Reprogrammable iscb nucleases and uses thereof
WO2022147321A1 (en) Type i-b crispr-associated transposase systems
AU2020373064A1 (en) Type I-B CRISPR-associated transposase systems
WO2023230483A2 (en) Engineered chimeric iscb polypeptides and uses thereof
WO2021041922A1 (en) Crispr-associated mu transposase systems
EP4274603A1 (en) Dna nuclease guided transposase compositions and methods of use thereof
WO2023170535A2 (en) Novel nucleic acid-guided nucleases and use thereof
CN116583599A (zh) 可重编程IscB核酸酶及其用途
WO2022087451A1 (en) Nucleic acid-guided nucleases and use thereof
CN117616126A (zh) 可重新编程的tnpb多肽及其用途
WO2022076830A1 (en) Type i crispr-associated transposase systems
WO2024081728A2 (en) Reprogrammable tnpb polypeptides with maze domains and uses thereof
WO2024238835A2 (en) Novel crispr enzymes and systems
EP4436592A1 (en) Reprogrammable isrb nucleases and uses thereof
WO2024015920A1 (en) Hybrid crispr-cas systems and methods of use thereof
WO2024081711A2 (en) Reprogramable tnpb polypeptides and use thereof
WO2024197008A2 (en) Nuclease-guided non-ltr retrotransposons and uses thereof

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination