[go: up one dir, main page]

CN116096875B - 工程化的CRISPR/Cas13系统及其用途 - Google Patents

工程化的CRISPR/Cas13系统及其用途 Download PDF

Info

Publication number
CN116096875B
CN116096875B CN202180018124.0A CN202180018124A CN116096875B CN 116096875 B CN116096875 B CN 116096875B CN 202180018124 A CN202180018124 A CN 202180018124A CN 116096875 B CN116096875 B CN 116096875B
Authority
CN
China
Prior art keywords
rna
sequence
cas13
engineered
crispr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202180018124.0A
Other languages
English (en)
Other versions
CN116096875A (zh
Inventor
童华威
王兴
王少冉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huida Gene Therapy Singapore Private Ltd
Huida Shanghai Biotechnology Co ltd
Original Assignee
Huida Shanghai Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from PCT/CN2021/079821 external-priority patent/WO2022188039A1/en
Application filed by Huida Shanghai Biotechnology Co ltd filed Critical Huida Shanghai Biotechnology Co ltd
Priority to CN202410088378.5A priority Critical patent/CN118109438A/zh
Priority claimed from PCT/CN2021/121926 external-priority patent/WO2022068912A1/en
Publication of CN116096875A publication Critical patent/CN116096875A/zh
Application granted granted Critical
Publication of CN116096875B publication Critical patent/CN116096875B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases [RNase]; Deoxyribonucleases [DNase]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/105Murine
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Cell Biology (AREA)
  • Mycology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Epidemiology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明提供新型工程化的CRISPR/Cas效应酶,如Cas13(例如,Cas13d、Cas13e或Cas13f),与对应的野生型Cas相比,所述工程化的CRISPR/Cas效应酶基本上保持指导序列特异性内切核酸酶活性,并且基本上缺乏非指导序列依赖性附带内切核酸酶活性。还提供编码所述工程化的CRISPR/Cas效应酶的多核苷酸、包含所述多核苷酸或工程化的Cas的载体或宿主细胞、以及例如在基于RNA的靶基因转录物敲低中的使用方法。

Description

工程化的CRISPR/Cas13系统及其用途
相关申请的引用
本申请要求于2020年9月30日提交的国际专利申请号PCT/CN2020/119559和于2021年3月9日提交的国际专利申请号PCT/CN2021/079821的优先权;将以上引用的每个申请的全部内容(包括任何序列表和附图)通过引用并入本文。
序列表
本申请含有已经以ASCII格式电子递交的序列表,并且所述序列表通过引用以其全文特此并入。所述ASCII副本创建于2021年9月28日,名称为132045-00418_SL.txt,并且大小为903,499字节。
背景技术
CRISPR(成簇的规律间隔的短回文重复序列)是在原核生物(如细菌和古细菌)的基因组中发现的DNA序列家族。这些序列应理解为源自先前已感染原核生物的噬菌体的DNA片段,并在随后的原核生物感染期间用于检测和破坏相似噬菌体的DNA或RNA。
CRISPR相关系统是一组同源基因或Cas基因,其中一些编码具有解旋酶和核酸酶活性的Cas蛋白。Cas蛋白是利用源自CRISPR序列的RNA(crRNA)作为指导序列以识别并切割与crRNA互补的多核苷酸特定链(例如,DNA)的酶。
CRISPR-Cas系统共同构成原始的原核“免疫系统”,其赋予对外来致病遗传元件(如存在于染色体外DNA(例如,质粒)和噬菌体中的那些)或由外来DNA编码的外来RNA的抗性或获得性免疫。
CRISPR/Cas系统似乎是在自然界中广泛存在的针对外来遗传物质的原核防御机制,并且见于大约50%的经测序细菌基因组和近90%的经测序古细菌中。这种原核系统后来经过发展形成称为CRISPR-Cas技术的基础,所述技术广泛用在包括人在内的众多真核生物中,用在包括基础生物学研究、生物技术产品开发和疾病治疗在内的多种应用中。
原核CRISPR-Cas系统包括一组极其多样的效应蛋白、非编码元件以及基因座架构,其中一些实例已经过工程化并适于产生重要的生物技术。
CRISPR基因座结构已在许多系统中进行了研究。在这些系统中,基因组DNA中的CRISPR阵列典型地包含富含AT的前导序列,随后是由独特的间隔序列隔开的短DR序列。这些CRISPR DR序列的大小范围可以是23-55bp,但典型地在从28至37bp的范围。一些DR序列显示出双向对称性(dyad symmetry),这提示RNA中二级结构如茎环(“发夹”)的形成,而其他序列则呈现为非结构化。不同CRISPR阵列中的间隔子大小典型地是28-38bp(范围为21-72bp)。CRISPR阵列中的重复-间隔序列通常少于50个单位。
通常在这样的CRISPR重复-间隔阵列旁发现小簇的cas基因。到目前为止,已将所鉴定的93种cas基因基于其编码的蛋白的序列相似性分为35个家族。所述35个家族中的十一个家族形成所谓的cas核心,所述核心包括Cas1至Cas9的蛋白家族。完整的CRISPR-Cas基因座具有至少一个属于cas核心的基因。
CRISPR-Cas系统可广义地分为两类——1类系统使用多种Cas蛋白的复合物来降解外来核酸,而2类系统使用单个大Cas蛋白用于相同目的。2类系统的单亚基效应组合物为工程化和应用转化提供了更简单的组分集,并且迄今为止已成为用于基因组工程化和其他方面的新颖强大且可编程技术的发现、工程化和优化的重要来源。
1类系统进一步分为I型、III型和IV型;并且2类系统分为II型、V型和VI型。这6种系统类型又分为19种亚型。分类也基于存在的cas基因的互补序列。大多数CRISPR-Cas系统具有Cas1蛋白。许多原核生物含有多个CRISPR-Cas系统,表明这些系统相容并且可共享组分。
最早且最佳表征的Cas蛋白之一Cas9是2类II型的原型成员,并起源于化脓性链球菌(Streptococcus pyogenes)(SpCas9)。Cas9是DNA内切核酸酶,其由与靶DNA序列互补的小crRNA分子和单独的反式激活CRISPR RNA(tracrRNA)激活。crRNA由负责使蛋白与crRNA结合的同向重复(DR)序列和间隔序列组成,所述间隔序列可以经工程化为与任何希望的核酸靶序列互补。通过这种方式,可以将CRISPR系统进行编程以通过修饰crRNA的间隔序列来靶向DNA或RNA靶标。已将crRNA和tracrRNA融合以形成实际效用更好的单个指导RNA(sgRNA)。当与Cas9结合时,sgRNA与其靶DNA杂交,并指导Cas9切割靶DNA。也已类似地鉴定并使用来自其他物种的其他Cas9效应蛋白,包括来自嗜热链球菌(S.thermophilus)CRISPR系统的Cas9。这些CRISPR/Cas9系统已广泛用在众多真核生物中,包括面包酵母(酿酒酵母(Saccharomyces cerevisiae))、条件致病病原体白色念珠菌(Candida albicans)、斑马鱼(zebrafish)(斑马鱼(Danio rerio))、果蝇(黑腹果蝇(Drosophila melanogaster))、蚂蚁(跳镰猛蚁(Harpegnathos saltator)和毕氏卵角蚁(Ooceraea biroi))、蚊(埃及伊蚊(Aedes aegypti))、线虫(秀丽隐杆线虫(Caenorhabditis elegans))、植物、小鼠、猴和人胚胎。
最近表征的另一Cas效应蛋白是Cas12a(以前称为Cpf1)。Cas12a与C2c1和C2c3都是属于2类V型Cas蛋白的成员,所述蛋白缺乏HNH核酸酶,但具有RuvC核酸酶活性。Cas12a最初在细菌新凶手弗朗西斯菌(Francisella novicida)的CRISPR/Cpf1系统中表征。它的原名反映其CRISPR-Cas亚型在普雷沃菌属(Prevotella)和弗朗西斯菌属(Francisella)谱系中的普遍性。Cas12a显示出与Cas9的几个关键差异,包括:引起双链DNA的“交错(staggered)”切割,而不是Cas9产生的“钝(blunt)”切割,依赖于“富含T”的PAM序列(它为Cas9提供替代性靶向位点),以及只需要CRISPR RNA(crRNA)而不需要tracrRNA就可成功靶向。Cas12a的小crRNA比Cas9更适合用于多重基因组编辑,因为与Cas9的sgRNA可以包装在一个载体中的数量相比,它们可以包装在一个载体中的数量更多。此外,Cas12a留下的粘性5’突出端可用于DNA组装,所述组装比传统的限制性酶克隆的靶标特异性大得多。最后,Cas12a在其PAM位点下游切割DNA 18-23个碱基对,这意味着在通过NHEJ系统产生双链断裂(DSB)后,在DNA修复后,不会破坏核酸酶识别序列,因此Cas12a能够实现多轮DNA切割,与之相反,Cas9切割后可能实现一轮DNA切割,因为Cas9切割序列仅在PAM位点上游的3个碱基对处,并且NHEJ途径典型地导致插入缺失(indel)突变,所述插入缺失突变破坏识别序列,从而防止另外的多轮切割。理论上,重复多轮的DNA切割与发生所希望的基因组编辑的机会增加相关。
最近,已经鉴定了几种2类VI型Cas蛋白,包括Cas13(也称为C2c2)、Cas13b、Cas13c、Cas13d(包括工程化的变体CasRx)Cas13e和Cas13f,每一种都是RNA指导的RNA酶(即,这些Cas蛋白使用它们的crRNA来识别Cas9和Cas12a中的靶RNA序列,而不是靶DNA序列)。总体而言,与传统的RNAi和CRISPRi技术相比,CRISPR/Cas13系统可以实现更高的RNA消化效率,同时与RNAi相比,展现出少得多的脱靶切割。
CRISPR-Cas13正迅速成为一种广泛采用的RNA编辑技术。该系统可以使用其序列特异性指导RNA选择性地修饰(例如,经由内切核酸酶活性切割(cut或cleave))靶RNA,如mRNA。与通过基于DNA的编辑引入的永久性基因组变化相比,RNA在转录水平控制基因表达,从而提供更安全且更可控的基因疗法方法。由于CRISPR/Cas13系统的RNA编辑效率高,它们已广泛用于多种生物中,包括酵母、植物、哺乳动物和斑马鱼(参见Abudayyeh等人,2017;Aman等人,2018;Cox等人,2017;Jing等人,2018;Konermann等人,2018)。CRISPR-Cas13d的直系同源物CasRx可以在体内介导RNA敲低,并有效缓解各种小鼠模型中的疾病表型(He等人,Protein Cell[蛋白与细胞]11:518-524,2020;Zhou等人,Cell[细胞]181:590-603e516,2020;以及Zhou等人,National Science Review[国家科学评论]7:835-837,2020)。
然而,目前鉴定的这些Cas13蛋白的一个缺点是,它们在通过基于crRNA的靶序列识别激活后全部都具有非特异性/附带(collateral)RNA酶活性。这种活性在Cas13a和Cas13b中特别强烈,并且仍然例如以可检测的方式存在于Cas13d中以及在较小程度上存在于Cas13e中。虽然这种特性可以有利地用于核酸检测方法中,但这些Cas13蛋白的非特异性/附带RNA酶活性也会导致不希望的邻近RNA的附带降解,并对它们的体内应用(例如在基因疗法中)施加了巨大的障碍。
另一方面,对于依赖附带活性进行灵敏检测的实际效用(如SHERLOCK),具有展现出甚至比野生型Cas13更高的附带活性的突变体Cas13效应酶可以是有益的。
因此,本领域需要进一步优化野生型Cas13以用于不同目的,例如,降低附带切割活性,使其具有针对某些用途(如治疗应用)的可接受的中靶切割活性;或增强/增加附带切割活性,使其具有针对某些其他用途(如诊断应用)的可接受的中靶切割活性。
发明内容
本发明的一个方面提供工程化的成簇的规律间隔的短回文重复序列(CRISPR)-Cas13效应酶,其中所述工程化的Cas13:(1)包含在空间上接近对应的野生型Cas13效应酶的内切核酸酶催化结构域(例如,HEPN结构域)的区域中的突变;(2)基本上保存(例如,保留至少50%、60%、70%、72.5%、75%、80%、85%、87.5%、90%、95%、96%、97%、97.5%、98%、99%或更多的)所述野生型Cas13对与指导序列互补的靶RNA的指导序列特异性内切核酸酶切割活性(或其理论最大值);并且(3)基本上缺乏(例如,保留少于50%、40%、35%、30%、27.5%、25%、22.5%、20%、17.5%、15%、12.5%、10%、7.5%、5%、4%、3%、2.5%、2%、1%或更少的)所述野生型Cas13对不与所述指导序列结合的非靶RNA的非指导序列依赖性附带内切核酸酶切割活性(或其理论最大值)。
本发明的另一方面提供工程化的成簇的规律间隔的短回文重复序列(CRISPR)-Cas13效应酶,其中所述工程化的Cas13:(1)包含在空间上接近对应的野生型Cas13效应酶的内切核酸酶催化结构域(例如,HEPN结构域)的区域中的突变;(2)基本上保存或具有增强的(例如,保留至少50%、60%、70%、72.5%、75%、80%、85%、87.5%、90%、95%、96%、97%、97.5%、98%、99%、100%、102%、105%、108%、110%或更多的)所述野生型Cas13对与指导序列互补的靶RNA的指导序列特异性内切核酸酶切割活性(或其理论最大值);并且(3)基本上增强(例如,具有多于100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多的)所述野生型Cas13对不与所述指导序列结合的非靶RNA的非指导序列依赖性附带内切核酸酶切割活性。
在某些实施方式中,所述Cas13是Cas13a、Cas13b、Cas13c、Cas13d(包括CasRx)、Cas13e或Cas13f。
在某些实施方式中,所述Cas13e具有SEQ ID NO:4的氨基酸序列,并且/或者其中所述Cas13d具有SEQ ID NO:101的氨基酸序列,并且/或者其中所述Cas13f具有SEQ ID NO:52的氨基酸序列。
在某些实施方式中,所述区域包括距离所述Cas13e的一级序列中的内切核酸酶催化结构域(例如,RXXXXH结构域)的任何残基130、125、120、110、100、90、80、70、60、50、40、30、20、或10个氨基酸内的残基;以及距离所述Cas13d的一级序列中的内切核酸酶催化结构域(例如,RXXXXH结构域)的任何残基170、160、150、140、130、120、110、100、90、80、70、60、50、40、30、20、或10个氨基酸内的残基;或距离所述Cas13f的一级序列中的内切核酸酶催化结构域(例如,RXXXXH结构域)的任何残基140、130、120、110、100、90、80、70、60、50、40、30、20或10个氨基酸内的残基。
在某些实施方式中,所述区域包括距离所述Cas13的一级序列中的内切核酸酶催化结构域的任何残基超过100、110、120或130个残基,但在空间上在所述内切核酸酶催化结构域的残基的1-10或5埃内的残基。
在某些实施方式中,所述内切核酸酶催化结构域是HEPN结构域,任选地是包含RXXXXH基序的HEPN结构域。
在某些实施方式中,所述RXXXXH基序包含R{N/H/K/Q/R}X1X2X3H序列(SEQ ID NO:1024)。
在某些实施方式中,在所述R{N/H/K/Q/R}X1X2X3H序列(SEQ ID NO:1025)中,X1是R、S、D、E、Q、N、G或Y;X2是I、S、T、V或L;并且X3是L、F、N、Y、V、I、S、D、E或A。
在某些实施方式中,所述RXXXXH基序是包含RNXXXH序列,如RN{Y/F}{F/Y}SH序列(SEQ ID NO:64)的N-末端RXXXXH基序。
在某些实施方式中,所述N-末端RXXXXH基序具有RNYFSH序列(SEQ ID NO:65)。
在某些实施方式中,所述N-末端RXXXXH基序具有RNFYSH序列(SEQ ID NO:66)。
在某些实施方式中,所述RXXXXH基序是包含R{N/A/R}{A/K/S/F}{A/L/F}{F/H/L}H序列(SEQ ID NO:1026)的C-末端RXXXXH基序。
在某些实施方式中,所述C-末端RXXXXH基序具有RN(A/K)ALH序列(SEQ ID NO:67)。
在某些实施方式中,所述C-末端RXXXXH基序具有RAFFHH(SEQ ID NO:68)或RRAFFH序列(SEQ ID NO:69)。
在某些实施方式中,所述区域包含以下、基本上由以下组成、或由以下组成:(i)对应于在SEQ ID NO:4的残基1-194、2-187、227-242、620-775、或634-755之间的残基的残基;或者(ii)对应于SEQ ID NO:101的HEPN1-1结构域(例如,残基90-292)、Helical2结构域(例如,残基536-690)和HEPN2结构域(例如,残基690-967)的残基;或者(iii)对应于SEQ IDNO:52的HEPN1结构域(例如,残基1-168)、Helical1结构域、Helical2结构域(例如,残基346-477)和HEPN2结构域(例如,残基644-790)的残基。
在某些实施方式中,所述区域包含以下、基本上由以下组成、或由以下组成:对应于在SEQ ID NO:4的残基35-51、52-67、156-171、666-682、或712-727之间的残基的残基。
在某些实施方式中,所述突变包含在所述区域内的15-20个连续氨基酸的延伸段内的以下取代、基本上由其组成、或由其组成:(a)一个或多个带电荷的、含氮侧链基团的、大的(如F或Y)、脂肪族和/或极性残基至电荷中性的短链脂肪族残基取代(如A、V或I);(b)一个或多个I/L至A的取代;和/或(c)一个或多个A至V的取代。
在某些实施方式中,所述延伸段为约16或17个残基。
在某些实施方式中,所述延伸段内除了至多1、2或3个之外的基本上所有带电荷的和极性残基都经取代。
在某些实施方式中,所述延伸段内总共约7、8、9或10个带电荷的和极性残基经取代。
在某些实施方式中,所述延伸段的N-末端和C-末端的2个残基经取代为编码序列含有限制酶识别序列的氨基酸。
在某些实施方式中,所述N-末端的两个残基是VF,并且所述C-末端的2个残基是ED,并且所述限制酶是BpiI。
在某些实施方式中,所述一个或多个带电荷的或极性残基包含N、Q、R、K、H、D、E、Y、S和T残基。
在某些实施方式中,所述一个或多个带电荷的或极性残基包含R、K、H、N、Y和/或Q残基。
在某些实施方式中,所述延伸段内的一个或多个Y残基经取代。
在某些实施方式中,所述一个或多个Y残基对应于野生型Cas13e.1(SEQ ID NO:4)的Y672、Y676、和/或Y715。
在某些实施方式中,所述延伸段是SEQ ID NO:4的残基35-51、52-67、156-171、666-682、或712-727。
在某些实施方式中,所述突变包含对应于SEQ ID NO:37-39、45和48中的任何一者或多者的一个或多个Ala取代。
在某些实施方式中,所述电荷中性的短链脂肪族残基是Ala(A)。
在某些实施方式中,附带活性降低的所述突变包含以下、基本上由以下组成、或由以下组成:(a)在所述区域内的1、2、3、4或5个所述15-20个连续氨基酸的延伸段内的取代;(b)对应于实施例4的Cas13d突变的突变,所述Cas13d突变保留野生型Cas13d(如SEQ IDNO:101)的至少约75%的指导RNA特异性切割(或其理论最大值),并且展现出野生型Cas13d(如SEQ ID NO:101)的小于约27.5%的附带效果(或其理论最大值);(c)对应于Cas13d突变的N1V7、N2V7、N2V8(cfCas13d)、N3V7或N15V4突变的突变;(d)对应于实施例4的Cas13d突变的突变,所述Cas13d突变保留野生型Cas13d(如SEQ ID NO:101)的约25%-75%之间的指导RNA特异性切割(或其理论最大值),并且展现出野生型Cas13d(如SEQ ID NO:101)的小于约27.5%的附带效果(或其理论最大值);(e)对应于Cas13d突变的N2V4、N2V5、N4V3、N6V3、N10V6、N15V2、N20V6或N20-Y910A突变的突变;(f)对应于实施例1、2或5的Cas13e突变的突变,所述Cas13e突变保留野生型Cas13e(如SEQ ID NO:4)的至少约75%的指导RNA特异性切割(或其理论最大值),并且展现出野生型Cas13e(如SEQ ID NO:4)的小于约25%的附带效果(或其理论最大值);(g)对应于Cas13e突变的M1V4、M2V2、M2V3、M2V4、M5V1、M6V2、M6V3、M6V4、M7V1、M7V2、M7V3、M7-Y55A、M7-Y61A、M11V1、M12V3、M15V1、M15V2、M15-Y643A、M15-Y647A、M16V1、M16V2、M17V2、M18V2、M18V3、M19V2、M19V3、或M19-IA突变的突变;(h)对应于实施例5的Cas13e突变的突变,所述Cas13e突变保留野生型Cas13e(如SEQ ID NO:4)的约25%-75%之间的指导RNA特异性切割(或其理论最大值),并且展现出野生型Cas13e(如SEQID NO:4)的小于约25%的附带效果(或其理论最大值);(i)对应于Cas13e突变的M17YY(cfCas13e)、M8V4、M9V1、M11V2、M11V3、M13V1、M13V2、M13V3、M15V3、或M20V2突变的突变;(j)对应于Cas13f突变(例如,实施例12的Cas13f突变)的突变,所述Cas13f突变保留野生型Cas13f(如SEQ ID NO:52)的至少约75%的指导RNA特异性切割(或其理论最大值),并且展现出野生型Cas13f(如SEQ ID NO:52)的小于约25%或27.5%的附带效果(或其理论最大值);(k)对应于Cas13f突变的F7V2、F10V1、F10V4、F40V2、F40V4、F44V2、F10S19、F10S21、F10S24、F10S26、F10S27、F10S33、F10S34、F10S35、F10S36、F10S45、F10S46、F10S48、F10S49、F40S22、F40S23、F40S26、F40S27、或F40S36突变的突变;(l)对应于Cas13f突变(例如,实施例12的Cas13f突变)的突变,所述Cas13f突变保留野生型Cas13f(如SEQ ID NO:52)的约50%-75%之间的指导RNA特异性切割(或其理论最大值),并且展现出野生型Cas13f(如SEQID NO:52)的小于约25%或27.5%的附带效果(或其理论最大值);和/或(m)对应于Cas13f突变的F2V4、F3V1、F3V3、F3V4、F5V2、F5V3、F6V4、F7V1、F38V4、F40V1、F41V1、F41V3、F42V4、F43V1、F10S2、F10S11、F10S12、F10S18、F10S20、F10S23、F10S25、F10S28、F10S43、F10S44、F10S47、F10S50、F10S51、F10S52、F40S7、F40S9、F40S11、F40S21、F40S22、F40S24、F40S28、F40S29、F40S30、F40S35、或F40S37突变的突变。
在某些实施方式中,附带活性增强的所述突变包含以下、基本上由以下组成、或由以下组成:(a)在所述区域内的1、2、3、4或5个所述15-20个连续氨基酸的延伸段内的取代;(b)对应于Cas13d突变(例如,实施例4的Cas13d突变)的突变,所述Cas13d突变保留野生型Cas13d(如SEQ ID NO:101)的至少约75%的指导RNA特异性切割(或其理论最大值),并且展现出野生型Cas13d(如SEQ ID NO:101)的多于约110%、115%、120%、125%、130%、135%、140%、145%、150%、155%、160%、165%、170%、175%、180%或更多的附带效果;(c)对应于实施例4中Cas13d突变的N2-Y142A、N4-Y193A、N12-Y604A、N21V7突变的突变;(d)对应于Cas13e突变(例如,实施例5的Cas13e突变)的突变,所述Cas13e突变保留野生型Cas13e(如SEQ ID NO:4)的至少约75%的指导RNA特异性切割(或其理论最大值),并且展现出野生型Cas13e(如SEQ ID NO:4)的多于约110%、115%、120%、125%、130%、135%、140%、145%、150%、155%、160%、165%、170%、175%、180%或更多的附带效果;(e)对应于Cas13e突变的M4V2、M4V3、M4V4、M8V1、M8V2、M9V2、M9V3、M10V1、M10V2、M11V4、M12V2、M14V1、M14V2、M16V3、M18V1、M19-G712A、M19-C727A、M19T725A、或M21V2突变的突变;(f)对应于Cas13f突变(例如,实施例12的Cas13f突变)的突变,所述Cas13f突变保留野生型Cas13f(如SEQ IDNO:52)的至少约75%的指导RNA特异性切割(或其理论最大值),并且展现出野生型Cas13f(如SEQ ID NO:52)的多于约110%、115%、120%、125%、130%、135%、140%、145%、150%、155%、160%、165%、170%、175%、180%或更多的附带效果;(g)对应于Cas13f突变(例如,实施例12的Cas13f突变)的F38V2、F42V1、F46V3、F38S2、F38S4、F38S5、F38S6、F38S7、F38S8、F38S9、F38S10、F38S11、F38S12、F38S13、F38S15、F38S16、F38S17、F40S1、F40S2、F40S3、F40S4、F40S5、F40S6、F40S8、F40S16、F40S18、F46S1、F46S4、F46S6、F46S7、F46S10、F46S14、F46S15、F10S4、F10S5、F10S6、F10S9、F10S10、F10S7、F38S1、F38S13或F46S2突变的突变。
在某些实施方式中,所述工程化的Cas13保存所述野生型Cas13对所述靶RNA的至少约50%、60%、70%、80%、85%、90%、95%、96%、97%、98%或99%的指导序列特异性内切核酸酶切割活性(或其理论最大值)。
在某些实施方式中,所述工程化的Cas13缺乏所述野生型Cas13对所述非靶RNA的至少约70%、72.5%、75%、77.5%、80%、82.5%、85%、87.5%、90%、92.5%、95%、96%、97%、98%、99%、或100%的非指导序列依赖性附带内切核酸酶切割活性(或其理论最大值)。
在某些实施方式中,所述工程化的Cas13保存所述野生型Cas13对所述靶RNA的至少约80%-90%的指导序列特异性内切核酸酶切割活性(或其理论最大值),并且缺乏所述野生型Cas13对所述非靶RNA的至少约95%-100%的非指导序列依赖性附带内切核酸酶切割活性(或其理论最大值)。
在某些实施方式中,本发明的工程化的Cas13具有以下氨基酸序列:所述氨基酸序列与SEQ ID NO:6-10和Cas13d(例如,SEQ ID NO:101)中的任一者具有至少80%、85%、90%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%或99.86%的同一性,不包括由SEQ ID NO:16、20、24、28和32定义的区域中的任何一个或多个以及实施例4或5中的任一突变区域。
在某些实施方式中,所述氨基酸序列在(a)或(b)中含有至多1、2、3、4或5个差异:(a)分别与SEQ ID NO:17、21、25、29和33相比,由SEQ ID NO:16、20、24、28和32定义的一个或多个区域中的每一个区域,(b)本文披露的Cas13d和Cas13e中的任一所希望的突变。
在某些实施方式中,本发明的工程化的Cas13具有SEQ ID NO:6-10中的任一者的氨基酸序列。
在某些实施方式中,本发明的工程化的Cas13具有SEQ ID NO:9或10的氨基酸序列。
在某些实施方式中,本发明的工程化的Cas13进一步包含核定位信号(NLS)序列或核输出信号(NES)。
在某些实施方式中,所述工程化的Cas13包含N-末端和/或C-末端NLS。
本发明的另一方面提供多核苷酸,所述多核苷酸编码本发明的工程化的Cas13。
在某些实施方式中,本发明的多核苷酸经密码子优化以在真核生物、哺乳动物如人或非人哺乳动物、植物、昆虫、鸟、爬行动物、啮齿动物(例如,小鼠、大鼠)、鱼、蠕虫/线虫或酵母中表达。
本发明的另一方面提供多核苷酸,所述多核苷酸(i)与本发明的多核苷酸相比具有一个或多个(例如,1、2、3、4、5、6、7、8、9或10个)核苷酸添加、缺失或取代;(ii)与本发明的多核苷酸具有至少50%、60%、70%、80%、90%、95%或97%的序列同一性;(iii)在严格条件下与本发明的多核苷酸、或(i)和(ii)中的任一者杂交;或(iv)是(i)-(iii)中的任一者的互补序列。
本发明的另一方面提供载体,所述载体包含本发明的多核苷酸。
在某些实施方式中,所述多核苷酸与启动子和任选的增强子可操作地连接。
在某些实施方式中,所述启动子是组成型启动子、诱导型启动子、泛素启动子或组织特异性启动子。
在某些实施方式中,所述载体是质粒。
在某些实施方式中,所述载体是逆转录病毒载体、噬菌体载体、腺病毒载体、单纯疱疹病毒(HSV)载体、AAV载体或慢病毒载体。
在某些实施方式中,所述AAV载体是血清型AAV1、AAV2、AAV4、AAV5、AAV6、AAV7、AAVrh74、AAV8、AAV9、AAV10、AAV11、AAV12或AAV13的重组AAV载体。
本发明的另一方面提供递送系统,所述递送系统包含(1)递送媒介物,和(2)本发明的工程化的Cas13、本发明的多核苷酸、或本发明的载体。
在某些实施方式中,所述递送媒介物是纳米颗粒、脂质体、外泌体、微泡或基因枪。
本发明的另一方面提供细胞或其后代,所述细胞或其后代包含本发明的工程化的Cas13、本发明的多核苷酸、或本发明的载体。
在某些实施方式中,所述细胞或其后代是真核细胞(例如,非人哺乳动物细胞、人细胞或植物细胞)或原核细胞(例如,细菌细胞)。
本发明的另一方面提供非人多细胞真核生物,所述非人多细胞真核生物包含本发明的细胞。
在某些实施方式中,所述非人类多细胞真核生物是针对人遗传障碍的动物(例如,啮齿动物或灵长类动物)模型。
本发明的另一方面提供修饰靶RNA的方法,所述方法包括使所述靶RNA与CRISPR-Cas13复合物接触,所述CRISPR-Cas13复合物包含本发明的工程化的Cas13和与所述靶RNA的至少15个核苷酸互补的间隔序列;其中在所述复合物通过所述间隔序列与所述靶RNA结合后,工程化的Cas13修饰所述靶RNA。
在某些实施方式中,通过由所述工程化的Cas13进行切割来修饰所述靶RNA。
在某些实施方式中,所述靶RNA是mRNA、tRNA、rRNA、非编码RNA、lncRNA或核RNA。
在某些实施方式中,在所述复合物与所述靶RNA结合后,所述工程化的Cas13不会展现出实质性的(或可检测的)附带RNA酶活性。
在某些实施方式中,所述靶RNA在细胞内。
在某些实施方式中,所述细胞是癌细胞。
在某些实施方式中,所述细胞受感染原感染。
在某些实施方式中,所述感染原是病毒、朊病毒、原生动物、真菌或寄生物。
在某些实施方式中,所述细胞是神经元细胞(例如,星形胶质细胞、神经胶质细胞(例如,穆勒神经胶质细胞(Muller glia cell)、少突胶质细胞、室管膜细胞、施万细胞(Schwan cell)、NG2细胞或卫星细胞))。
在某些实施方式中,所述CRISPR-Cas13复合物由以下编码:编码本发明的工程化的Cas13的第一多核苷酸,以及包含或编码能够与所述靶RNA结合的间隔RNA的第二多核苷酸,其中将所述第一多核苷酸和所述第二多核苷酸引入所述细胞中。
在某些实施方式中,通过相同的载体将所述第一多核苷酸和所述第二多核苷酸引入所述细胞中。
在某些实施方式中,所述方法导致以下中的一项或多项:(i)体外或体内诱导细胞衰老;(ii)体外或体内细胞周期停滞;(iii)体外或体内细胞生长抑制;(iv)体外或体内诱导无反应性;(v)体外或体内诱导细胞凋亡;以及(vi)体外或体内诱导坏死。
本发明的另一方面提供在有需要的受试者中治疗病症或疾病的方法,所述方法包括向所述受试者施用包含CRISPR-Cas复合物的组合物,所述CRISPR-Cas复合物包含本发明的工程化的Cas13或编码本发明的工程化的Cas13的多核苷酸,以及与所述病症或疾病相关的靶RNA的至少15个核苷酸互补的间隔序列;其中在所述复合物通过所述间隔序列与所述靶RNA结合后,所述工程化的Cas13切割所述靶RNA,从而治疗所述受试者的病症或疾病。
在某些实施方式中,所述病症或疾病是神经病症、癌症或感染性疾病。
在某些实施方式中,所述癌症是威尔姆斯肿瘤、尤因肉瘤、神经内分泌肿瘤、胶质母细胞瘤、神经母细胞瘤、黑素瘤、皮肤癌、乳腺癌、结肠癌、直肠癌、前列腺癌、肝癌、肾癌、胰腺癌、肺癌、胆道癌、子宫颈癌、子宫内膜癌、食道癌、胃癌、头颈癌、甲状腺髓样癌、卵巢癌、神经胶质瘤、淋巴瘤、白血病、骨髓瘤、急性淋巴细胞白血病、急性骨髓性白血病、慢性淋巴细胞白血病、慢性骨髓性白血病、霍奇金淋巴瘤、非霍奇金淋巴瘤或膀胱癌。
在某些实施方式中,所述神经病症是青光眼,与年龄相关的RGC丧失,视神经损伤,视网膜缺血,莱伯遗传性视神经病变,与RGC神经元退化相关的神经病症,与有需要的受试者的纹状体中功能性神经元退化相关的神经病症,帕金森病,阿尔茨海默病,亨廷顿病,精神分裂症,抑郁症,药物成瘾,运动障碍如舞蹈病、舞蹈徐动症和动作障碍,双相障碍,自闭症谱系障碍(ASD)或功能失调。
在某些实施方式中,所述方法是体外方法、体内方法或离体方法。
本发明的另一方面提供CRISPR-Cas复合物,所述CRISPR-Cas复合物包含本发明的工程化的Cas13、指导RNA和间隔序列,所述指导RNA包含与所述工程化的Cas13结合的DR序列,所述间隔序列设计成与靶RNA互补并与其结合。
在某些实施方式中,所述靶RNA由真核DNA编码。
在某些实施方式中,所述真核DNA是非人哺乳动物DNA、非人灵长类动物DNA、人DNA、植物DNA、昆虫DNA、鸟DNA、爬行动物DNA、啮齿动物DNA、鱼DNA、蠕虫/线虫DNA、酵母DNA。
在某些实施方式中,所述靶RNA是mRNA。
在某些实施方式中,所述CRISPR-Cas复合物进一步包含靶RNA,所述靶RNA包含能够与所述间隔序列杂交的序列。
本发明的另一方面提供鉴定对应的野生型Cas效应酶的工程化的CRISPR/Cas效应酶的方法,其中所述工程化的Cas基本上保持指导序列特异性内切核酸酶活性,并且基本上缺乏非指导序列依赖性附带内切核酸酶活性,所述方法包括:(1)在15-20个连续多核苷酸的一个或多个区域的每一个区域中,所述区域(a)在所述野生型Cas效应酶的内切核酸酶催化结构域的任何残基的80、90、100、110、120、130、140、150、160、170或180个残基内,或(b)在空间上在所述野生型Cas效应酶的内切核酸酶催化结构域的任何残基的1-10埃内,用电荷中性的脂肪族侧链残基(如A)取代一个或多个(例如,除了至多1、2、3、4或5个之外的基本上所有)极性和带电荷的残基;以及(2)鉴定工程化的Cas,与所述对应的野生型Cas相比,所述工程化的Cas基本上保持指导序列特异性内切核酸酶活性,并且基本上缺乏非指导序列依赖性附带内切核酸酶活性。
在某些实施方式中,所述野生型Cas效应酶是Cas13。
在某些实施方式中,所述Cas13是Cas13a、Cas13b、Cas13c、Cas13d(例如,CasRx)、Cas13e或Cas13f。
在某些实施方式中,所述Cas13e具有SEQ ID NO:4的氨基酸序列;或者其中所述Cas13d具有SEQ ID NO:101的氨基酸序列;或者其中所述Cas13f具有SEQ ID NO:52的氨基酸序列。
本发明的另一方面提供鉴定工程化的成簇的规律间隔的短回文重复序列(CRISPR)-Cas13效应酶的方法,所述工程化的成簇的规律间隔的短回文重复序列(CRISPR)-Cas13效应酶具有改变的非指导序列依赖性附带核酸酶活性,所述方法包括:在空间上接近对应的野生型Cas13效应酶的内切核酸酶催化结构域的区域中,将一个或多个带电荷的或极性残基取代为电荷中性的短链脂肪族残基(如A),以确定所得的变体Cas13效应酶是否:(1)基本上保存了所述野生型Cas13对与指导序列互补的靶RNA的指导序列特异性内切核酸酶切割活性(或其理论最大值);并且(2)基本上缺乏或具有增强的所述野生型Cas13对不与所述指导序列结合的非靶RNA的非指导序列依赖性附带内切核酸酶切割活性(或其理论最大值),从而鉴定所述具有改变的非指导序列依赖性附带核酸酶活性的工程化的Cas13效应酶。
在某些实施方式中,所述工程化的Cas13效应酶基本上缺乏非指导序列依赖性附带核酸酶活性。
在某些实施方式中,所述工程化的Cas13效应酶具有增强的非指导序列依赖性附带核酸酶活性。
在某些实施方式中,所述一个或多个带电荷的或极性残基在所述区域内的15-20个(例如,16或17个)连续氨基酸的延伸段内。
在某些实施方式中,所述一个或多个带电荷的或极性残基包含所述延伸段内的一个或多个(或所有)Tyr(Y)残基、基本上由其组成、或由其组成。
应理解,本文描述的本发明的任何一个实施方式,包括仅在实施例或权利要求中、或仅在下文的一个方面/部分中描述的那些实施方式,可以与本发明的任何其他一个或多个实施方式组合,除非明确否认或认为不当。
附图说明
图1是由Cas13(例如,Cas13e)效应酶减少附带效果的可能机制的示意图(未按比例绘制)。左上分图显示出野生型Cas13e对靶RNA进行序列特异性靶向和切割的可能机制。右上分图显示出野生型Cas13e对非靶RNA进行非序列特异性靶向和切割的可能机制。左下分图显示出主题工程化的Cas13e的可能作用机制,所述主题工程化的Cas13e对非靶RNA的亲和力降低,并且以序列特异性方式切割靶RNA的趋势更大。
图2显示出Cas13e蛋白的预测3D结构。
图3显示出映射到野生型Cas13e序列(SEQ ID NO:4)的工程化的Cas13e中突变的位置。还显示出两个HEPN序列(HEPN1和HEPN2)。
图4是用于鉴定主题工程化的Cas13e效应蛋白的双荧光载体的示意图(未按比例绘制)。由所述载体编码的指导RNA(gRNA)靶向EGFP报告子。虚线框包括两个HEPN RXXXXH序列(HEPN1和HEPN2)和它们各自的附近序列(残基2-187和634-755)、以及经预测在空间上接近Cas13e中的HEPN序列的序列(残基227-242)。在工程化的Cas13e中鉴定了在那些区域中具有所希望的功能性变化的突变。
图5显示出各种工程化的Cas13e效应酶(Mut-1至Mut-21)以及Cas13e野生型阳性和阴性对照之间的相对荧光强度分布,各自显示为靶向的(指导序列特异性切割的)EGFP信号(左分图)与对照mCherry信号(右分图)之间的强度差异。
图6显示出在使用EGFP的指导序列特异性切割激活Cas13e核酸酶活性后,将各种工程化的Cas13e效应酶与野生型或dCas13e(核酸酶无效突变体)进行比较后,mCherry阳性细胞的相对百分比。具有接近100%相对百分比的mCherry阳性细胞的工程化的Cas13e效应酶没有或几乎没有非序列特异性内切核酸酶活性,像dCas13e(其既没有序列特异性内切核酸酶活性,也没有非序列特异性内切核酸酶活性)。
图7显示出在使用EGFP的指导序列特异性切割激活Cas13e核酸酶活性后,将各种工程化的Cas13e效应酶与野生型或dCas13e(核酸酶无效突变体)进行比较后,EGFP阳性细胞的相对百分比。具有接近野生型Cas13e相对百分比(例如,约20%)的EGFP阳性细胞的工程化的Cas13e效应酶具有与野生型Cas13e相当水平的序列特异性内切核酸酶活性。
图8显示出在预测Cas13e 3D结构中附带效果减少的各种突变的空间分布。
图9显示出Mut-17区域中几个突变的序列。图9按出现的顺序分别披露了SEQ IDNO:28、29和36-43。
图10显示出在使用EGFP的指导序列特异性切割激活Cas13e核酸酶活性后,将各种工程化的Cas13e效应酶与野生型或dCas13e(核酸酶无效突变体)进行比较后,mCherry阳性细胞的相对百分比。具有接近100%相对百分比的mCherry阳性细胞的工程化的Cas13e效应酶没有或几乎没有非序列特异性内切核酸酶活性,像dCas13e(其既没有序列特异性内切核酸酶活性,也没有非序列特异性内切核酸酶活性)。
图11显示出在使用EGFP的指导序列特异性切割激活Cas13e核酸酶活性后,将各种工程化的Cas13e效应酶与野生型或dCas13e(核酸酶无效突变体)进行比较后,EGFP阳性细胞的相对百分比。具有接近野生型Cas13e相对百分比(例如,约20%)的EGFP阳性细胞的工程化的Cas13e效应酶具有与野生型Cas13e相当水平的序列特异性内切核酸酶活性。
图12显示出Mut-19区域中突变的序列。图12按出现的顺序分别披露了SEQ ID NO:32和44-49。
图13显示出在使用EGFP的指导序列特异性切割激活Cas13e核酸酶活性后,将各种工程化的Cas13e效应酶与野生型或dCas13e(核酸酶无效突变体)进行比较后,mCherry阳性细胞的相对百分比。具有接近100%相对百分比的mCherry阳性细胞的工程化的Cas13e效应酶没有或几乎没有非序列特异性内切核酸酶活性,像dCas13e(其既没有序列特异性内切核酸酶活性,也没有非序列特异性内切核酸酶活性)。M17.15-1和M17.15-2相同,并且两者都是在M17.8和M17.9中具有Y至A突变的双突变体(参见图9)。
图14显示出在使用EGFP的指导序列特异性切割激活Cas13e核酸酶活性后,将各种工程化的Cas13e效应酶与野生型或dCas13e(核酸酶无效突变体)进行比较后,EGFP阳性细胞的相对百分比。具有接近野生型Cas13e相对百分比(例如,约20%)的EGFP阳性细胞的工程化的Cas13e效应酶具有与野生型Cas13e相当水平的序列特异性内切核酸酶活性。
图15是示意图,其显示出代表性Cas13a-Cas13f效应酶的结构域结构。指示出代表性Cas13蛋白的每个代表性成员上两个RXXXXH基序的总体大小和位置。
图16A-16D显示出使用本发明的双荧光报告系统评价经瞬时转染的哺乳动物细胞HEK293T中附带效果的结果。
图16A是哺乳动物双荧光报告系统的示意图,所述哺乳动物双荧光报告系统用于评价由Cas13(Cas13d/Cas13a)介导的RNA敲低诱导的附带效果。本文使用的示例性双荧光报告子含有一个质粒(所述质粒具有处于强CAG启动子的转录控制下的Cas13(具有NLS)和EGFP的编码序列)和另一质粒(所述质粒具有靶向内源性或外源性靶标(例如,mCherry、NT或RPL4,处于U6启动子的转录控制下)和mCherry(处于EF1α启动子的转录控制下)的各种gRNA的编码序列)。NLS,核定位信号;DR:同向重复序列;P2A:来自猪捷申病毒-1启动子的2A肽;以及pA:聚A信号。对双荧光报告系统质粒转染的HEK293T细胞在转染后48小时进行FACS分析,以确定EGFP(非特异性靶标)和mCherry(特异性靶标)表达。未显示出与NT相比,在HEK293T细胞中使用三种不同mCherry gRNA敲低Cas13d/Cas13a介导的mCherry和EGFP RNA的代表性FACS分析数据,以及与NT相比,在HEK293T细胞中使用四种不同RPL4 gRNA进行由Cas13d诱导敲低mCherry和EGFP RNA的代表性FACS分析数据。
图16B显示出对以下进行总结的条形图:使用三种不同mCherry gRNA进行由Cas13d(左分图)或Cas13a(中间分图)诱导的外源性gRNA特异性靶mCherry和外源性附带靶EGFP转录物的相对敲低,以及使用四种不同RPL4 gRNA进行由Cas13d(右分图)诱导的内源性gRNA特异性RPL4和外源性附带靶EGFP转录物的相对敲低。通过qPCR确定相对于NT gRNA的敲低。NT:非靶向gRNA。所有值均为平均值±s.e.m.(n=3),除非另有说明。使用了双尾非配对双样品t检验进行统计分析。*P<0.05,**P<0.01,***P<0.001,ns:无显著性。
图16C显示出来自这些实验的EGFP或mCherry阳性细胞的相对百分比的FACS定量分析。NT:非靶向gRNA。所有值均为平均值±s.e.m.(n=3),除非另有说明。使用了双尾非配对双样品t检验进行统计分析。*P<0.05,**P<0.01,***P<0.001,ns:无显著性。
图16D显示出在HEK293T细胞中Cas13介导的内源性转录物敲低的附带效果的特征。未显示出使用Cas13d敲低三种内源性转录物(RPL4、PFN1、PKM)(各自使用四种gRNA)时,mCherry和EGFP荧光强度降低的细胞的代表性明视野、荧光图像和流式细胞术图像。然而,靶向PFN1(左分图)和PKM(右分图)转录物(每种转录物使用四种gRNA)的Cas13d诱导了EGFP或mCherry阳性细胞的相对百分比的差异性降低。NT:非靶向gRNA。所有值均为平均值±s.e.m.(n=3),除非另有说明。使用了双尾非配对双样品t检验进行统计分析。*P<0.05,**P<0.01,***P<0.001,ns:无显著性。
图17A-17H显示出合理诱变Cas13d以消除附带活性的结果。图17A是用于筛选Cas13(显示为Cas13d,但广义上代表所有Cas13,包括Cas13a、Cas13b、Cas13c、Cas13d、Cas13e和Cas13f等)的中靶干扰活性的哺乳动物双荧光报告系统的示意图,其中Cas13、EGFP(本实验中的靶标)、mCherry(本实验中的附带靶标)和EGFP gRNA的编码序列全部在一个质粒中。野生型(wt)Cas13经由gRNA特异性机制切割靶EGFP mRNA,并经由附带活性切割非靶mCherry mRNA。由于缺乏内切核酸酶活性,dCas13不会切割mCherry或EGFP mRNA。主题工程化的Cas13突变体/变体保存了gRNA特异性EGFP切割,但失去了针对mCherry mRNA的附带活性。图17B显示出以条带表示的RfxCas13d复合物的预测总体结构(通过I-TASSER)的视图。HEPN结构域的RXXXXH是催化位点。图17C显示出选择用于诱变研究的Cas13d的HEPN1(包括HEPN1-I和HEPN1-II)、HEPN2、Helical2和部分Helical1结构域中的21个区域,每个区域跨越约36个氨基酸。图17D显示出118个靶向EGFP转录物的Cas13d突变体中EGFP或mCherry阳性细胞的相对百分比的定量。WT(野生型Cas13d)和死Cas13d(dCas13d)作为对照,阳性细胞的相对百分比全部相对于dCas13d归一化。图17E显示出具有不同的在N2V7和N2V8内或附近的突变位点组合的Cas13d突变体中EGFP或mCherry阳性细胞的相对百分比的定量。WT(野生型Cas13d)和死Cas13d(dCas13d)作为对照,阳性细胞的相对百分比全部相对于dCas13d归一化。未显示出使用EGFP gRNA进行由Cas13d突变体诱导敲低mCherry和EGFP的代表性FACS分析。图17F显示出与作为对照的Cas13d、dCas13d相比,使用EGFP gRNA由cfCas13d诱导的mCherry和EGFP阳性细胞的相对百分比的差异性变化。图17G和17H显示出Cas13酶的体外核酸酶活性的动力学。使用脱靶或中靶合成ssRNA荧光探针对Cas13d、cfCas13d和dCas13d进行体外附带核糖核酸酶活性(图17G)分析和靶核糖核酸酶活性(图17H)分析。
图18A和18B显示出Cas13d的晶体结构(包括HEPN结构域的催化位点(由RXXXXH标记)和有效突变位点(由各种NxVy突变标记))的卡通视图(图18A)和反面视图(图18B)。
图18C显示出来自Cas13d的有效变体的突变序列。图18C按列的顺序分别披露了SEQ ID NO:948、949、561、950-955、561、950、951、601、615和625。
图19A-19I显示出合理诱变Cas13e以改善核酸酶特异性的结果。图19A显示出以条带表示的Cas13e复合物的预测总体结构的视图。HEPN结构域的RXXXXH是催化位点。图19B显示出诱变方案,根据所述方案,主要选择了HEPN1和HEPN2结构域并将其分成21个突变区域用于进一步的后续诱变。图19C显示出靶向EGFP转录物的Cas13e突变体中EGFP或mCherry阳性细胞的相对百分比的定量。WT(野生型Cas13e)和死Cas13e(dCas13e)分别用作阳性对照和阴性对照,并且阳性细胞的相对百分比全部相对于dCas13d归一化。图19D显示出来自不同的基于靶向EGFP转录物的M17的突变位点组合的Cas13e突变体中EGFP或mCherry阳性细胞的相对百分比的定量。Cas13e和dCas13e用作对照。图19E和19F显示出Cas13酶的体外核酸酶活性的动力学。使用脱靶或中靶合成ssRNA荧光探针对Cas13e、cfCas13e和dCas13e进行体外附带核糖核酸酶活性(图19E)分析和靶核糖核酸酶活性(图19F)分析。图19G显示出与Cas13e相比,使用EGFP gRNA进行由cfCas13e诱导的mCherry和EGFP荧光强度的差异性变化。图19H是示意图,其显示出编码cfCas13e(无附带活性的Cas13e)和靶向VEGFA的指导RNA的AAV载体基因组,以及靶mRNA敲低的结果。图19I显示出以剂量依赖性方式使用cfCas13e敲低靶mRNA以及与两种比较药物的结果比较。
图20A-20I显示出在HEK293细胞中靶向内源性基因的cfCas13d的高效和特异性干扰活性。图20A显示出来自dCas13d组的RNA-seq的HEK293细胞中23个内源性基因的相对表达水平(如通过CPM测量的,计数/百万)。图20B显示出与NT相比,靶向22种内源性转录物(每种转录物使用1-7种gRNA)的Cas13d诱导的EGFP或mCherry阳性细胞的相对百分比的差异性降低。图20C显示出图20B的统计定量。未显示出使用靶向RPL4、PPIA或RPS5转录物的gRNA进行由dCas13d/Cas13d/cfCas13d诱导的mCherry和EGFP荧光强度的差异性降低的FACS图像,但在图20D-20G中显示出来自这种FACS分析的EGFP或mCherry阳性细胞的相对百分比的FACS定量分析。图20H显示出在HEK293细胞中靶向14种内源性转录物的Cas13d和cfCas13d。转录物水平相对于作为媒介物对照的dCas13d。图20I显示出图20H的统计数据分析。NT:非靶向gRNA。所有值均为平均值±s.e.m.(n=3),除非另有说明。使用了双尾非配对双样品t检验。*P<0.05,**P<0.01,***P<0.001,ns:无显著性。
图20J和20K显示出通过流式细胞术分析靶向CA2/B4GALNT1转录物的Cas13d/cfCas13d的差异性基因表达。未显示出使用靶向CA2或B4GALNT1转录物的gRNA进行由dCas13d/Cas13d/cfCas13d诱导的mCherry和EGFP荧光强度的差异性降低的FACS图像,但在图20J和20K中显示出EGFP或mCherry阳性细胞的相对百分比的FACS定量分析。所有值均为平均值±s.e.m.(n=3),除非另有说明。使用了双尾非配对双样品t检验进行统计分析。*P<0.05,**P<0.01,***P<0.001,ns:无显著性。
图21A-21E显示出靶向内源性转录物的Cas13d/cfCas13d的转录组范围的脱靶编辑分析的结果。图21A显示出在Cas13d和cfCas13d组中测量的来自RPL4-g3、PPIA-g1、CA2-g1或PPARG-g1的gRNA依赖性脱靶位点的特征。MM#:脱靶位点的错配数目。图21A按出现的顺序分别披露了SEQ ID NO:956、956、956-958和958-970。图21B显示出图21A的统计数据分析,其中分析了具有一个或多个错配的脱靶位点。图21C-21D显示出由Cas13d/cfCas13d介导的RPL4(图21C)/PPIA(图21D)敲低诱导的基因显著下调的生物学过程。在图21C和21D中,相关基因是0008219(细胞死亡)、0007049(细胞周期)、0009056(分解代谢过程)、0007165(信号转导)、0009058(生物合成过程)、0051716(细胞对刺激的响应)、0071704(有机物质代谢过程)和0071840(细胞组分组织或生物发生)。在图21E中,在Cas13d和cfCas13d组中测量了来自RPL4-g1或PPIA-g2的gRNA依赖性脱靶位点的特征。MM#:脱靶位点的错配数目。图21E按出现的顺序分别披露了SEQ ID NO:971和971-975。
图22A-22C显示出附带效果的细胞后果和工作模型及其消除。图22A是使用RPL4gRNA1的dox诱导型Cas13d/cfCas13d/dCas13d表达系统的示意图,所述dox诱导型Cas13d/cfCas13d/dCas13d表达系统用于考查附带效果。未显示出在dox处理后5天期间具有dox诱导型Cas13d/cfCas13d/dCas13d表达系统的HEK293T细胞克隆的代表性明视野图像。图22B左分图显示出在5天期间在dox存在或不存在的情况下通过使用RPL4 gRNA的dCas13d/Cas13d/cfCas13d进行的相对RPL4 mRNA敲低。中间的两个分图显示出在5或6天期间使用/不使用dox处理的dCas13d、Cas13d或cfCas13d细胞克隆的生长曲线和MTT测定(n=3)。右分图显示出前三个分图的统计分析。图22C是Cas13中靶和附带切割活性的模型。一旦经靶RNA激活,具有突变位点的cfCas13(例如,cfCas13d和cfCas13e)会保持中靶切割活性,但会消除附带切割活性,而wtCas13则展现出两种切割活性。所有值均为平均值±s.e.m.(n=3),除非另有说明。使用了双尾非配对双样品t检验进行统计分析。*P<0.05,**P<0.01,***P<0.001,ns:无显著性。
图23A-23J是几个代表性Cas13家族蛋白(例如,Cas13b、Cas13e和Cas13f)和包括HPEN结构域在内的结构域组织的示例性多序列比对。图23A-23J按出现的顺序分别披露了SEQ ID NO:4和976-994。
图24A-24M是几个代表性Cas13家族蛋白(例如,Cas13d、Cas13a和Cas13c)和包括HPEN结构域在内的结构域组织的示例性多序列比对。图24A-24M按出现的顺序分别披露了SEQ ID NO:101、995-1008、1007、1009-1023和855。
图25是用于筛选Cas13f的中靶干扰活性的哺乳动物双荧光报告系统的示意图,其中Cas13f编码序列、EGFP靶标、mCherry附带靶标和EGFP gRNA在一个质粒中。野生型(wt)Cas13f经由gRNA特异性机制切割靶EGFP mRNA,并经由其附带活性切割非靶mCherry mRNA。由于缺乏内切核酸酶活性,dCas13f既不切割mCherry mRNA也不切割EGFP mRNA。主题工程化的Cas13f突变体/变体保存了gRNA特异性EGFP切割,但失去了其针对mCherry mRNA的附带活性。
图26显示出以条带表示的Cas13f.1复合物的预测总体结构(通过I-TASSER)的视图。HEPN结构域的RXXXXH基序是催化位点。
图27显示出选择用于诱变的Cas13f的HEPN1、HEPN2、Helical1(包括Hel1-1、Hel1-2和Hel1-3)和Helical2结构域中的47个区域,每个区域跨越约17个氨基酸。
图28显示出75个靶向EGFP转录物的Cas13f突变体中EGFP+或mCherry+细胞的相对百分比的定量。WT(野生型)Cas13f和死Cas13f(dCas13f)是对照。阳性细胞的相对百分比相对于dCas13df归一化。
图29显示出具有不同的在F10V1、F10V4、F38V2、F40V2、F40V4、F46V1和F46V3内或附近的突变位点组合的Cas13f突变体中EGFP+或mCherry+细胞的相对百分比的定量。WT(野生型)Cas13f和死Cas13f(dCas13f)是对照。阳性细胞的相对百分比相对于dCas13f归一化。未显示出使用EGFP gRNA进行由Cas13f突变体诱导敲低mCherry和EGFP的代表性FACS分析。
具体实施方式
1.概述
已经发现了范围广泛的CRISPR-Cas系统,并为相关Cas基因建立了分类系统和通用命名法。在这种分类系统下,CRISPR-Cas系统和相关效应酶属于两类——1类和2类——根据它们的特征Cas基因,每一类又分为三种类型和多种亚型。1类系统涵盖利用多亚基RNA-蛋白(RNP)复合物的I、III和IV型系统。2类系统涵盖利用单蛋白RNP复合物的II、V和VI型系统。
Cas9是2类II型效应酶,而最近发现的Cas13酶(包括Cas13a、Cas13b、Cas13c、Cas13d(包括工程化的变体CasRx)、Cas13e和Cas13f)是2类VI型效应酶。与任何其他CRISPR-Cas系统不同,已证明2类VI型效应蛋白专门切割RNA靶标。这样的2类VI型效应酶具有两个不同的活性位点,均赋予RNA酶活性:一个活性位点参与pre-crRNA加工,另一个活性位点参与靶RNA降解。
存在2类VI型的几种亚型,包括至少VI-A(Cas13a/C2c2)、VI-B(Cas13b1和Cas13b2)、VI-C(Cas13c)、VI-D(Cas13d、CasRx)、VI-E(Cas13e)和VI-F(Cas13f)亚型。Cas13亚型通常共享非常低的序列同一性/相似性,但基于两个保守的HEPN样RNA酶结构域的存在,可以全部分类为VI型Cas蛋白(例如,本文通常称为“Cas13”)。参见图15。尽管这两个结构域似乎是Cas13酶的保守特征,并且典型地位于靠近两个末端的位置,但它们在蛋白内的间距对于每种亚型似乎是唯一的。已公布了至少三种VI-A型Cas13a蛋白的晶体结构,包括来自沙氏纤毛菌(Leptotrichia shahii)(LshCas13a)、毛螺旋菌科(Lachnospiraceae)细菌(LbaCas13a)和口腔纤毛菌(Leptotrichia buccalis)(LbuCas13a)的Cas13a。与其他2类复合物相似,crRNA-Cas13a复合物是双叶的,带有核酸酶(NUC)叶和crRNA识别(REC)叶。Cas13a的crRNA结合形式采用“握紧拳头(clenched fist)”样结构,其中REC叶不完美地堆叠在NUC叶的顶部。REC叶具有可变的N-末端结构域(NTD),然后是螺旋结构域(Helical-1)。同时,NUC叶由两个HEPN结构域(HEPN-1和HEPN-2)组成,这两个HEPN结构域由接头结构域(Helical-3)隔开。此外,HEPN-1结构域经另一螺旋结构域(Helical-2)拆分成两个亚结构域。NTD、Helical-1和HEPN2结构域形成狭窄的带正电荷的裂隙,其锚定结合的crRNA的5’重复序列衍生端(5’-手柄(handle)),而Helical-2结构域结合crRNA的3’端。
Cas13 CRISPR基因座最初经转录成长的pre-crRNA转录物。然后,Cas13蛋白在由回文性质的同向重复(DR)序列形成的茎环结构上游的固定位置处切割pre-crRNA。VI型中的pre-crRNA加工涉及茎环上游的非金属依赖性切割,并且不需要反式激活crRNA(tracrRNA)或其他宿主因子。成熟的crRNA(其包含DR序列和与靶RNA互补的指导序列)与Cas13蛋白组装形成功能性RNP复合物,然后针对互补的RNA靶标扫描转录物。一旦发现这样的RNA靶标并且指导序列与其结合,所述RNA靶标就会经Cas13内切核酸酶降解。
Cas13效应酶展现出前所未有的灵敏度以识别异质非靶RNA群内的特异性靶RNA。据报道,Cas13能够以飞摩尔级灵敏度检测靶RNA。因此,一方面,2类VI型酶或Cas13为基因疗法提供巨大的机会以敲低靶基因产物(例如,mRNA),但另一方面,这种使用本质上受到所谓的附带活性的限制,所述附带活性会带来显著的细胞毒性风险。
特别地,在2类VI型系统中,在靶RNA结合后,Cas13中的高等真核生物和原核生物核苷酸结合(HEPN)结构域赋予指导序列非特异性RNA切割,称为“附带活性”。与结合的crRNA互补的同源靶ssRNA的结合导致Cas13效应酶发生实质性的构象变化,从而导致形成单一的复合催化位点,用于非指导序列依赖性“附带”RNA切割,从而将Cas13转化为序列非特异性核糖核酸酶。这个新形成的高度可及的活性位点不仅会以顺式降解靶RNA(如果所述靶RNA足够长,能够到达这个新的活性位点),而且还会基于这种混杂的RNA酶活性以反式降解非靶RNA。
大多数RNA似乎容易受到Cas13这种混杂的RNA酶活性的影响,并且大多数(如果不是全部)Cas13效应酶具有这种附带的内切核酸酶活性。最近已证明,Cas13介导的敲低带来的附带效果存在于哺乳动物细胞和动物中(已提交稿件),这表明Cas13介导的靶RNA敲低的临床应用在附带效果存在的情况下将面临重大挑战。
已经使用如本文描述的本发明的双荧光报告系统证明了存在Cas13介导的RNA敲低的实质性的附带效果。针对哺乳动物细胞中的外源性和内源性基因,均已经观察到这样的附带效果。特别地,发现具有这种附带效果的野生型Cas13d诱导转录组范围的脱靶编辑和细胞生长停滞。
因此,为了在基因疗法中使用Cas13酶特异性敲低靶RNA,显然必须严格控制这种指导序列非特异性附带活性,以防止不必要的自发性细胞毒性。通过不清楚的机制,VI-B亚型系统包括经由VI型相关基因csx27和csx28调节Cas13b的附带活性的天然手段,但这种天然调节机制似乎是VI-B亚型独有的,因为类似的机制似乎不存在于其他亚型(如VI-A型和VI-C型)中。
使用本发明的这种相同的报告系统,筛选了通过结构指导的诱变获得的约200个Cas13d和Cas13e变体。据发现,在高等真核生物和原核生物核苷酸结合(HEPN)结构域上具有2-4个突变的几种变体保留了不减弱的中靶活性,但大大减少了附带效果。对于附带效果减弱的Cas13d变体,消除了在野生型Cas13d中观察到的转录组范围的脱靶编辑和细胞生长停滞。
有趣的是,据发现,大多数变体展现出低的双切割活性,或者高的中靶切割活性但低的附带切割活性。然而,几乎没有变体显示出低的中靶切割活性但高的附带切割活性。这些结果表明在中靶切割活性和附带切割活性之间存在不同的结合机制。
尽管不希望受任何特定理论的束缚,但申请人相信以下靶标(例如,gRNA特异性)和附带切割活性的模型有助于Cas13效应酶的无附带效果的变体的基本原理设计。特别地,如图22C中所示,认为Cas13含有两个靠近HEPN结构域的分开的结合结构域——一个负责中靶切割,并且两者都是附带切割所必需的。与该模型一致,在切割位点周围的N1V7、N2V7、N2V8和N15V4区域上设计的突变会引起空间位阻效应或电荷变化,从而导致激活的Cas13与混杂的RNA之间的相互作用弱化,但对激活的Cas13与中靶RNA之间的影响不大(如果有的话)。因此,对这些结合位点的诱变消除Cas13的附带切割活性,同时保留对应的野生型Cas13的中靶切割活性。
因此,本文描述的本发明提供工程化的高保真2类VI型或Cas13(例如,Cas13d、Cas13e和Cas13f)效应酶变体,所述变体具有最小的残余附带效果。例如,这些变体可用于在基础研究和治疗性应用中靶向降解RNA。
另一方面,鉴定了多种展现出双切割活性增加的低保真Cas13变体。这样的变体可用于更好的核酸检测应用(例如在SHERLOCK测定中使用的那些)。
特别地,在一个方面,本发明提供工程化的2类VI型或Cas13(例如,Cas13d、e或f)效应酶,所述效应酶大部分保持其针对靶RNA的序列特异性内切核酸酶活性,但减弱(如果未消除)针对非靶RNA的非指导序列特异性内切核酸酶活性。这样的工程化的Cas13效应酶(其基本上缺乏附带效果)为在基于靶RNA敲低的效用(如基因疗法)中使用Cas13铺平道路。这样的工程化的Cas13效应酶(其基本上缺乏附带效果)也可用于RNA碱基编辑,因为这样的工程化的Cas13的核酸酶死亡版本(或“dCas13”)也减少了脱靶效果,这种效果仍然存在于没有主题工程化的Cas13的突变的dCas13中。
尽管不希望受任何特定理论的束缚,但图1和22C(见上文)提供与本文呈现的数据一致的合理机制。特别地,在图1中,野生型Cas13不仅具有通过crRNA的指导序列与靶RNA结合的能力,而且还在HEPN催化结构域附近具有针对任何RNA的非特异性RNA结合位点(参见催化位点周围的椭圆形基序)。一旦指导序列识别到靶RNA,Cas13的构象变化就会激活其催化活性,并且互补指导序列和非特异性RNA结合位点两者所结合的靶RNA会受到切割。一旦经激活,Cas13也会非特异性地切割不与指导序列结合的非靶RNA,部分原因是这样的非靶RNA与cas13上的非特异性RNA结合位点结合。非特异性RNA结合基序的突变(如由椭圆基序的不同阴影表示)降低/消除(或在一些情况下,增强)Cas13结合RNA的能力,从而降低/消除(或增强)针对非靶RNA的附带活性而不显著影响靶RNA切割,因为指导序列仍然结合靶RNA。
根据该模型,也可以减少或消除使用工程化的Cas13的核酸酶缺陷型(dCas13)版本的RNA碱基编辑中的脱靶效果,因为工程化的dCas13中非特异性RNA结合的丧失减少/消除由于RNA碱基编辑结构域(例如,ADAR或CDAR)和脱靶RNA底物的接近而导致的基于RNA的非预期编辑。
在相关方面,本发明还提供工程化的2类VI型或Cas13(例如,Cas13d、Cas13e或Cas13f)效应酶,与对应的野生型Cas13相比,所述效应酶大部分保持其针对靶RNA的序列特异性内切核酸酶活性,但增强针对非靶RNA的非指导序列特异性内切核酸酶活性。与野生型相比,这种附带效果增强的工程化的Cas13在核酸检测测定(如SHERLOCK)中提供更好的(例如,更灵敏的)变体,所述SHERLOCK利用附带活性来提供极灵敏的测定,用于在预扩增或不预扩增样品中的初始核酸的情况下检测样品中非常少量的指导序列特异性靶RNA。
更特别地,本发明的一个方面提供工程化的2类VI型成簇的规律间隔的短回文重复序列(CRISPR)-Cas效应酶,如Cas13(例如,Cas13d、Cas13e或Cas13f),其中所述工程化的2类VI型Cas效应酶:(1)包含在空间上接近对应的野生型效应酶的内切核酸酶催化结构域的区域中的突变;(2)基本上保存所述野生型效应酶对与所述指导序列互补的靶RNA的指导序列特异性内切核酸酶切割活性(或其理论最大值);并且(3)基本上缺乏或具有增强的所述野生型效应酶对基本上不与所述指导序列互补/不与其结合的非靶RNA的非指导序列依赖性附带内切核酸酶切割活性(或其理论最大值)。
在某些实施方式中,所述指导序列特异性内切核酸酶切割活性和所述非指导序列依赖性附带内切核酸酶切割活性两者都可以与对应的野生型Cas13效应酶相比(如突变体Cas13e相比于衍生所述突变体的野生型Cas13e)来测量,如针对对应的核酸酶缺陷型Cas13(如dCas13e)进行归一化。
所述核酸酶缺陷型Cas13可缺乏催化结构域、基序或关键催化残基,使它不展现出可察觉的或可检测的指导序列依赖性靶RNA内切核酸酶切割活性水平、以及非指导序列依赖性附带内切核酸酶切割活性水平。因此,在本文描述的适当报告系统中,dCas13典型地具有100%剩余/基线EGFP信号(作为没有可察觉的或可检测的指导序列依赖性靶RNA内切核酸酶切割活性水平的指示),并且具有100%剩余/基线mCherry信号(作为没有可察觉的或可检测的非指导序列依赖性附带内切核酸酶切割活性水平的指示)。同时,野生型Cas13典型地展现出强烈的指导序列依赖性靶RNA内切核酸酶切割活性(如通过dCas13 EGFP参考信号减少近80%、90%、95%或接近100%所反映的)。这种指导序列依赖性靶RNA内切核酸酶切割活性的理论最大值为100%,相当于完全消除所有dCas13 EGFP参考信号。
野生型Cas13还典型地展现出不同水平的非指导序列依赖性附带内切核酸酶切割活性,从而导致dCas13 mCherry参考信号减少约50%-70%。这种非指导序列依赖性附带内切核酸酶切割活性的理论最大值为100%,相当于完全消除所有dCas13mCherry参考信号。
在某些实施方式中,本发明的工程化的Cas13效应酶与对应的衍生所述工程化的Cas13的野生型Cas13相比展现出降低的或减弱的非指导序列依赖性附带内切核酸酶切割活性(或其理论最大值)。例如,所述工程化的Cas13效应酶可以基本上缺乏(例如,保留少于50%、40%、35%、30%、27.5%、25%、22.5%、20%、17.5%、15%、12.5%、10%、7.5%、5%、4%、3%、2.5%、2%、1%或更少的)野生型Cas13对不与指导序列结合的非靶RNA的非指导序列依赖性附带内切核酸酶切割活性。例如,如果野生型Cas13由于附带活性而消除dCas13 mCherry基线信号的约70%(理论最大值为100%消除),并且附带活性减弱的突变体Cas13由于剩余附带活性而仅消除dCas13 mCherry基线信号的约10%,则所述突变体仅展现或保留约1/7(或约15%)的野生型附带活性(或理论最大值的10%)。
在某些实施方式中,本发明的工程化的Cas13效应酶与对应的衍生所述工程化的Cas13的野生型Cas13相比展现出增加的或增强的非指导序列依赖性附带内切核酸酶切割活性。例如,所述工程化的Cas13效应酶可以具有基本上增强的或增加的(例如,具有多于100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多的)野生型Cas13对不与指导序列结合的非靶RNA的非指导序列依赖性附带内切核酸酶切割活性。例如,如果野生型Cas13由于附带活性而消除dCas13mCherry基线信号的约50%,并且附带活性增强的突变体Cas13由于其增强的附带活性而消除dCas13 mCherry基线信号的约90%,则所述突变体展现出约90/50(或约180%)的野生型附带活性。
在某些实施方式中,所述突变发生在以下区域内,例如,在野生型Cas13(如Cas13a、Cas13b、Cas13c、Cas13d、Cas13e、Cas13f等)的其中一个HEPN型催化结构域处、旁边或附近的两个RNA结合结构域中的一个内。在某些实施方式中,所述突变弱化(例如,显著弱化或消除)野生型Cas13与非特异性RNA靶标(例如,基本上不与指导RNA互补的靶标)的结合,但基本上保留与靶RNA(其与所述指导RNA基本上互补)的结合。在某些实施方式中,所述突变引起空间位阻效应和/或所涉及残基的侧链的电荷、极性和/或大小的变化,从而导致激活的Cas13与混杂的RNA之间的相互作用弱化,但对激活的Cas13与中靶RNA之间的影响不大(如果有的话)。
如本文所用,“Cas13”是2类VI型CRISPR-Cas效应酶,其作为野生型酶在结合与其crRNA的指导序列互补的同源靶RNA后显示出附带活性。野生型2类VI型效应酶的附带活性使其能够针对非靶RNA切割RNA酶或内切核酸酶活性,所述非靶RNA不与crRNA的指导序列互补或基本上不与其互补。所述野生型2类VI型效应酶还可以展现出一个或多个以下特征:具有一个或两个保守的HEPN样RNA酶结构域,如具有保守的RXXXXH基序(其中X是任何氨基酸)(例如,下文所述的RXXXXH基序)的HEPN结构域;当所述2类VI型效应酶(例如,Cas13)与同源crRNA结合时,具有“握紧拳头”样结构;具有带有核酸酶(NUC)叶和crRNA识别(REC)叶的双叶结构,任选地,所述REC叶具有可变的N-末端结构域(NTD),然后是螺旋结构域(Helical-1),并且/或者任选地,所述NUC叶由两个HEPN结构域(HEPN-1和HEPN-2)组成,这两个HEPN结构域由接头结构域(Helical-3)隔开,其中所述HEPN-1结构域任选地经另一螺旋结构域(Helical-2)拆分成两个亚结构域;将pre-crRNA转录物加工成crRNA;不需要反式激活crRNA(tracrRNA)或其他宿主因子来进行pre-crRNA加工;并且展现出飞摩尔级灵敏度以识别异质非靶RNA群内的指导序列特异性靶RNA。
在某些实施方式中,所述2类VI型效应酶(例如,Cas13)在HEPN样结构域中的其中一个RXXXXN基序位于或接近(例如,在50-160个残基内,或在10、20、30、40、50、60、70、80、90、100、110、120、130、140、150或160个残基内)N-末端。在某些实施方式中,所述2类VI型效应酶(例如,Cas13)在HEPN样结构域中的其中一个RXXXXN基序位于或接近(例如,在50-160个残基内,或在10、20、30、40、50、60、70、80、90、100、110、120、130、140、150或160个残基内)C-末端。在某些实施方式中,所述2类VI型效应酶(例如,Cas13)的HEPN样结构域的其中一个RXXXXN基序位于或接近(例如,在50-160个残基内,或在10、20、30、40、50、60、70、80、90、100、110、120、130、140、150或160个残基内)N-末端,同时HEPN样结构域的另一个RXXXXN基序位于或接近(例如,在50-160个残基内,或在10、20、30、40、50、60、70、80、90、100、110、120、130、140、150或160个残基内)C-末端。如果RXXXXN基序的R或N残基位于或接近N-末端或C-末端,则所述RXXXXN基序“位于或接近”N-末端或C-末端。
基于生物学和细胞实验数据,所述工程化的2类VI型效应酶(例如,Cas13,特别是Cas13e效应酶)显著降低了针对非靶RNA的非序列特异性内切核酸酶活性,但同时展现出基本上相同(如果不是更高)的针对靶RNA的序列特异性内切核酸酶活性,所述靶RNA与crRNA的指导序列基本上互补。所述工程化的效应酶可实现高保真RNA靶向/编辑。
在某些实施方式中,所述2类VI型效应酶是Cas13a、Cas13b、Cas13c、Cas13d(包括工程化的变体CasRx)、Cas13e或Cas13f,或基本上保持指导序列特异性内切核酸酶活性的其直系同源物、旁系同源物、同源物、天然的或工程化的变体或其功能性片段。
在某些实施方式中,其变体或功能性片段保持对应的野生型效应酶的至少一种功能。这样的功能包括但不限于结合本发明的指导RNA/crRNA(下文描述)以形成复合物的能力、指导序列特异性RNA酶活性、以及在与靶RNA至少部分互补的crRNA的指导下在特定位点处结合并切割所述靶RNA的能力。
在某些实施方式中,所述Cas13蛋白是Cas13a蛋白。在一些实施方式中,所述Cas13a蛋白来自以下属的物种:拟杆菌属(Bacteroides)、布劳特氏菌属(Blautia)、丁酸弧菌属(Butyrivibrio)、肉食杆菌属(Carnobacterium)、绿屈挠菌属(Chloroflexus)、梭菌属(Clostridium)、去甲基醌属(Demequina)、真杆菌属(Eubacterium)、赫氏菌属(Herbinix)、非适应螺菌(Insoliti spirillum)、毛螺旋菌科、纤毛菌属(Leptotrichia)、李斯特菌属(Listeria)、沼杆菌属(Paludibacter)、紫单胞菌科(Porphyromonadaceae)、假丁酸弧菌属(Pseudobutyrivibrio)、红杆菌属(Rhodobacter)或海旋菌属(Thalassospira)。在某些实施方式中,所述Cas13a蛋白来自以下的物种:沙氏纤毛菌、西尔李斯特菌(Listeriaseeligeri)、毛螺旋菌科细菌(如Lb MA2020、Lb NK4A179、Lb NK4A144)、嗜氨基梭菌(Clostridium aminophilum)(如Ca DSM 10710)、鸡肉杆菌(Carnobacterium gallinarum)(如Cg DSM 4847)、产丙酸沼杆菌(Paludibacter propionicigenes)(如Pp WB4)、韦氏李斯特菌(Listeria weihenstephanensis)(如Lw FSL R9-0317)、李斯特氏菌科(Listeriaceae)细菌(如Lb FSL M6-0635)、瓦氏纤毛菌(Leptotrichia wadei)(如LwF0279)、荚膜红杆菌(Rhodobacter capsulatus)(如Rc SB1003、Rc R121、Rc DE442)、口腔纤毛菌(如Lb C-l0l3-b)、解半纤维素赫氏菌(Herbinix hemicellulosilytica)、真杆菌科(Eubacteriaceae)细菌(如Eb CHKCI004)、布劳特氏菌属物种马赛-P2398(Blautia.spMarseille-P2398)、纤毛菌属物种口腔分类群879菌株F0557、聚集绿屈挠菌(Chloroflexusaggregans)、桔红色去甲基醌菌(Demequina aurantiaca)、海旋菌属物种TSL5-1、假丁酸弧菌属(Pseudobutyrivibrio)物种OR37、丁酸弧菌属物种YAB3001、纤毛菌属物种马赛-P3007(Leptotrichia sp.Marseille-P3007)、爱华拟杆菌(Bacteroides ihuae)、紫单胞菌科细菌(如Pb KH3CP3RA)、崖李斯特菌(Listeria riparia)、或陌生非适应螺菌(Insolitispirillum peregrinum)。
在某些实施方式中,所述Cas13a是WO2020/028555(将其通过引用并入本文)中披露的任何一种Cas13a。
在一些实施方式中,所述Cas13蛋白是Cas13b蛋白。在一些实施方式中,所述Cas13b蛋白来自以下属的物种:另枝菌属(Alistipes)、拟杆菌属、拟杆菌门(Bacteroidetes)、伯杰氏菌属(Bergeyella)、二氧化碳嗜纤维菌属(Capnocytophaga)、金黄杆菌属(Chryseobacterium)、黄杆菌属(Flavobacterium)、类香味菌属(Myroides)、沼杆菌属、褐指藻杆菌属(Phaeodactylibacter)、卟啉单胞菌属(Porphyromonas)、普雷沃氏菌属(Prevotella)、冷弯曲菌属(Psychroflexus)、赖兴巴赫氏菌属(Reichenbachiella)、里默氏杆菌属(Riemerella)、或中华微杆菌属(Sinomicrobium)。在某些实施方式中,所述Cas13b蛋白来自以下物种:另枝菌属物种ZOR0009、酿脓拟杆菌(Bacteroides pyogenes)(如Bp F0041)、拟杆菌门细菌(如Bb GWA2319)、动物溃疡伯杰氏菌(Bergeyellazoohelcum)(如Bz ATCC 43767)、狗咬二氧化碳嗜纤维菌(Capnocytophaga canimorsus)、犬咬二氧化碳嗜纤维菌(Capnocytophaga cynodegmi)、肉鸡白痢金黄杆菌(Chryseobacterium carnipullorum)、济州岛金黄杆菌(Chryseobacterium jejuense)、解脲金黄杆菌(Chryseobacterium ureilyticum)、嗜枝黄杆菌(Flavobacteriumbranchiophilum)、柱状黄杆菌(Flavobacterium columnare)、黄杆菌属物种316、拟香味类香味菌(Myroides odoratimimus)(如Mo CCUG 10230、Mo CCUG 12901、Mo CCUG 3837)、产丙酸沼杆菌、厦门褐指藻杆菌(Phaeodactylibacter xiamenensis)、牙龈卟啉单胞菌(Porphyromonas gingivalis)(如Pg F0185、Pg F0568、Pg JCVI SC001、Pg W4087)、古卟啉单胞菌(Porphyromonas gulae)、卟啉单胞菌属物种COT-052OH4946、桔红色普雷沃氏菌(Prevotella aurantiaca)、颊普雷沃氏菌(Prevotella buccae)(如Pb ATCC 33574)、斐氏普雷沃氏菌(Prevotella falsenii)、中间普雷沃氏菌(Prevotella intermedia)(如Pi17、Pi ZT)、苍白普雷沃氏菌(Prevotella pallens)(如Pp ATCC 700821)、胸膜炎普雷沃氏菌(Prevotella pleuritidis)、解糖普雷沃氏菌(Prevotella saccharolytica)(如PsF0055)、普雷沃氏菌属物种MA2016、普雷沃氏菌属物种MSX73、普雷沃氏菌属物种P4-76、普雷沃氏菌属物种P5-119、普雷沃氏菌属物种P5-125、普雷沃氏菌属物种P5-60、扭曲冷弯曲菌(Psychroflexus torquis)、噬琼胶赖兴巴赫氏菌(Reichenbachiellaagariperforans)、鸭疫里默氏杆菌(Riemerella anatipestifer)、或海洋中华微杆菌(Sinomicrobium oceani)。
在某些实施方式中,所述Cas13b是WO2020/028555(将其通过引用并入本文)中披露的任何一种Cas13b。
在一些实施方式中,所述Cas13蛋白是Cas13c蛋白。在一些实施方式中,所述Cas13c蛋白来自梭杆菌属(Fusobacterium)或厌氧唾液杆菌属(Anaerosalibacter)的物种。在某些实施方式中,所述Cas13c蛋白来自以下的物种:坏死梭杆菌(Fusobacteriumnecrophorum)(如Fn基形亚种(Fn subsp.funduliforme)ATCC 51357、Fn DJ-2、Fn BFTR-l、Fn基形亚种)、坏疽梭杆菌(Fusobacterium perfoetens)(如Fp ATCC 29250)、溃疡梭杆菌(Fusobacterium ulcerans)(如Fu ATCC 49185)、或厌氧唾液杆菌属物种ND1。
在某些实施方式中,所述Cas13c是WO2020/028555(将其通过引用并入本文)中披露的任何一种Cas13c。
在一些实施方式中,所述Cas13蛋白是Cas13d蛋白。在一些实施方式中,所述Cas13d蛋白来自真杆菌属或瘤胃球菌属(Ruminococcus)的物种。在某些实施方式中,所述Cas13d蛋白来自以下的物种:产亚硝酸真杆菌(Eubacterium siraeum)、黄化瘤胃球菌(Ruminococcus flavefaciens)(如Rfx XPD3002)或白色瘤胃球菌(Ruminococcus albus)。在某些实施方式中,Cas13d是CasRx。在某些实施方式中,Cas13d具有SEQ ID NO:101的氨基酸序列。
在某些实施方式中,所述Cas13d是WO2020/028555(将其通过引用并入本文)中披露的任何一种Cas13d。
在一些实施方式中,所述Cas13蛋白是Cas13e蛋白。在一些实施方式中,所述Cas13e蛋白来自浮霉菌门(Planctomycetes)属的物种。在某些实施方式中,所述Cas13e蛋白具有SEQ ID NO:4、50或51的氨基酸序列。SEQ ID NO:50和51的Cas13e的同向重复(DR)序列分别是SEQ ID NO:57和58。
在一些实施方式中,所述Cas13蛋白是Cas13f蛋白。在某些实施方式中,所述Cas13f蛋白具有SEQ ID NO:52-56中的任一者的氨基酸序列。SEQ ID NO:52-56的Cas13f的同向重复(DR)序列分别是SEQ ID NO:59-63。
如本文所用,“同向重复序列”可指CRISPR基因座中的DNA编码序列,或指在crRNA中由其编码的RNA。因此,当在RNA分子(如crRNA)的上下文中提到SEQ ID NO:57-63中的任一者时,每个T应理解为代表U。
在某些实施方式中,本发明的野生型Cas效应蛋白可以是:(i)SEQ ID NO:50-56中的任一者,如SEQ ID NO:50;(ii)SEQ ID NO:50-56中的任一者的直系同源物、旁系同源物、同源物;或(iii)与SEQ ID NO:50-56中的任一者相比具有至少约80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸序列同一性的2类VI型效应酶。
在某些实施方式中,所述Cas13e和Cas13f效应蛋白、其直系同源物、同源物、衍生物和功能性片段是天然存在的。在某些其他实施方式中,所述Cas13e和Cas13f效应蛋白、其直系同源物、同源物、衍生物和功能性片段不是天然存在的,例如与天然存在的序列相比具有至少一个氨基酸差异。
在某些实施方式中,在空间上接近对应的野生型Cas13效应酶的内切核酸酶催化结构域的区域包括距离所述Cas13的一级序列中的内切核酸酶催化结构域(例如,RXXXXH结构域)的任何残基120、110、100、90、80、70、60、50、40、30、20或10个氨基酸内的残基。
在某些实施方式中,所述区域包括距离所述Cas13e的一级序列中的内切核酸酶催化结构域(例如,RXXXXH结构域)的任何残基130、125、120、110、100、90、80、70、60、50、40、30、20、或10个氨基酸内的残基;距离所述Cas13d的一级序列中的内切核酸酶催化结构域(例如,RXXXXH结构域)的任何残基170、160、150、140、130、120、110、100、90、80、70、60、50、40、30、20、或10个氨基酸内的残基;或距离所述Cas13f的一级序列中的内切核酸酶催化结构域(例如,RXXXXH结构域)的任何残基140、130、120、110、100、90、80、70、60、50、40、30、20或10个氨基酸内的残基。
在某些实施方式中,在空间上接近对应的野生型Cas13效应酶的内切核酸酶催化结构域的区域包括距离所述Cas13的一级序列中的内切核酸酶催化结构域的任何残基超过100、110、120或130个残基,但在空间上在所述内切核酸酶催化结构域的残基的1-10或5埃内的残基。
在某些实施方式中,所述内切核酸酶催化结构域是HEPN结构域,任选地是包含RXXXXH基序的HEPN结构域。
在某些实施方式中,所述RXXXXH基序包含R{N/H/K/Q/R}X1X2X3H序列(SEQ ID NO:1024)。
在某些实施方式中,在所述R{N/H/K/Q/R}X1X2X3H序列(SEQ ID NO:1025)中,X1是R、S、D、E、Q、N、G或Y;X2是I、S、T、V或L;并且X3是L、F、N、Y、V、I、S、D、E或A。
在某些实施方式中,所述RXXXXH基序是包含RNXXXH序列,如RN{Y/F}{F/Y}SH序列(SEQ ID NO:64)的N-末端RXXXXH基序。在某些实施方式中,所述N-末端RXXXXH基序具有RNYFSH序列(SEQ ID NO:65)。在某些实施方式中,所述N-末端RXXXXH基序具有RNFYSH序列(SEQ ID NO:66)。在某些实施方式中,所述RXXXXH基序是包含R{N/A/R}{A/K/S/F}{A/L/F}{F/H/L}H序列(SEQ ID NO:1026)的C-末端RXXXXH基序。例如,所述C-末端RXXXXH基序可以具有RN(A/K)ALH序列(SEQ ID NO:67),或RAFFHH(SEQ ID NO:68)或RRAFFH序列(SEQ IDNO:69)。
在某些实施方式中,区域包含以下、基本上由以下组成、或由以下组成:(a)对应于在SEQ ID NO:4的残基1-194、2-187、227-242、620-775、或634-755之间的残基的残基。在某些实施方式中,区域包含以下、基本上由以下组成、或由以下组成:(i)对应于在SEQ ID NO:4的残基35-51、52-67、156-171、666-682、或712-727之间的残基的残基;(ii)对应于SEQ IDNO:101的HEPN1-1结构域(例如,残基90-292)、Helical2结构域(例如,残基536-690)和HEPN2结构域(例如,残基690-967)的残基;或者(iii)对应于SEQ ID NO:52的HEPN1结构域(例如,残基1-168)、Helical1结构域、Helical2结构域(例如,残基346-477)和HEPN2结构域(例如,残基644-790)的残基。
在某些实施方式中,所述突变包含在所述区域内的15-20个连续氨基酸的延伸段内的以下取代、基本上由其组成、或由其组成:一个或多个带电荷的或极性残基至电荷中性的短链脂肪族残基(如A)。例如,在一些实施方式中,所述延伸段为约16或17个残基。
在某些实施方式中,所述突变包含在所述区域内的15-20个连续氨基酸的延伸段内的以下取代、基本上由其组成、或由其组成:(a)一个或多个带电荷的、含氮侧链基团的、大的(如F或Y)、脂肪族和/或极性残基至电荷中性的短链脂肪族残基(如A、V或I)取代;(b)一个或多个I/L至A的取代;和/或(c)一个或多个A至V的取代。
在某些实施方式中,所述延伸段内除了至多1、2或3个之外的基本上所有带电荷的和极性残基都经取代。
在某些实施方式中,所述延伸段内总共约7、8、9或10个带电荷的和极性残基经取代。
在某些实施方式中,所述延伸段的N-末端和C-末端的2个残基经取代为编码序列含有限制酶识别序列的氨基酸。例如,在一些实施方式中,所述N-末端的两个残基可以是VF,并且所述C-末端的2个残基可以是ED,并且所述限制酶是BpiI。其他合适的RE位点很容易想到。N-末端和C-末端的RE位点可以相同,但不必相同。
在某些实施方式中,所述一个或多个带电荷的或极性残基包含N、Q、R、K、H、D、E、Y、S和T残基。在某些实施方式中,所述一个或多个带电荷的或极性残基包含R、K、H、N、Y和/或Q残基。
在某些实施方式中,所述延伸段内的一个或多个Y残基经取代。在某些实施方式中,所述一个或多个Y残基对应于野生型Cas13e.1(SEQ ID NO:4)的Y672、Y676、和/或Y715。在某些实施方式中,所述延伸段是SEQ ID NO:4的残基35-51、52-67、156-171、666-682、或712-727。
在某些实施方式中,所述突变导致非指导序列依赖性附带RNA酶活性的减少或消除。在某些实施方式中,所述突变包含对应于SEQ ID NO:37-39、45和48中的任何一者或多者的一个或多个电荷中性的短链脂肪族残基取代。
在某些实施方式中,所述突变导致与野生型Cas13相比增强的非指导序列依赖性附带RNA酶活性。在某些实施方式中,所述突变包含对应于SEQ ID NO:40-42中的任何一者或多者的一个或多个电荷中性的短链脂肪族残基取代。
在某些实施方式中,所述电荷中性的短链脂肪族残基是A、I、L、V或G。
在某些实施方式中,所述电荷中性的短链脂肪族残基是Ala(A)。
在某些实施方式中,所述突变包含在所述区域内的2、3、4或5个所述15-20个连续氨基酸的延伸段内的取代、基本上由其组成、或由其组成。
在某些实施方式中,附带活性降低的所述突变包含以下、基本上由以下组成、或由以下组成:(a)在所述区域内的1、2、3、4或5个所述15-20个连续氨基酸的延伸段内的取代;(b)对应于Cas13d突变(例如,实施例4的Cas13d突变)的突变,所述Cas13d突变保留野生型Cas13d(如SEQ ID NO:101)的至少约75%的指导RNA特异性切割(或其理论最大值),并且展现出野生型Cas13d(如SEQ ID NO:101)的小于约25%或27.5%的附带效果(或其理论最大值);(c)对应于Cas13d突变的N1V7、N2V7、N2V8(cfCas13d)、N3V7或N15V4突变的突变;(d)对应于Cas13d突变(例如,实施例4的Cas13d突变)的突变,所述Cas13d突变保留野生型Cas13d(如SEQ ID NO:101)的约25%-75%之间的指导RNA特异性切割(或其理论最大值),并且展现出野生型Cas13d(如SEQ ID NO:101)的小于约25%或27.5%的附带效果(或其理论最大值);(e)对应于Cas13d突变的N2V4、N2V5、N4V3、N6V3、N10V6、N15V2、N20V6或N20-Y910A突变的突变;(f)对应于Cas13e突变(例如,实施例1、2或5的Cas13e突变)的突变,所述Cas13e突变保留野生型Cas13e(如SEQ ID NO:4)的至少约75%的指导RNA特异性切割(或其理论最大值),并且展现出野生型Cas13e(如SEQ ID NO:4)的小于约25%的附带效果(或其理论最大值);(g)对应于Cas13e突变的M1V4、M2V2、M2V3、M2V4、M5V1、M6V2、M6V3、M6V4、M7V1、M7V2、M7V3、M7-Y55A、M7-Y61A、M11V1、M12V3、M15V1、M15V2、M15-Y643A、M15-Y647A、M16V1、M16V2、M17V2、M18V2、M18V3、M19V2、M19V3、或M19-IA突变的突变;(h)对应于Cas13e突变(例如,实施例5的Cas13e突变)的突变,所述Cas13e突变保留野生型Cas13e(如SEQ ID NO:4)的约25%-75%之间的指导RNA特异性切割(或其理论最大值),并且展现出野生型Cas13e(如SEQID NO:4)的小于约25%的附带效果(或其理论最大值);和/或(i)对应于Cas13e突变的M17YY(cfCas13e)、M8V4、M9V1、M11V2、M11V3、M13V1、M13V2、M13V3、M15V3、或M20V2突变的突变;(j)对应于Cas13f突变(例如,实施例12的Cas13f突变)的突变,所述Cas13f突变保留野生型Cas13f(如SEQ ID NO:52)的至少约75%的指导RNA特异性切割(或其理论最大值),并且展现出野生型Cas13f(如SEQ ID NO:52)的小于约25%或27.5%的附带效果(或其理论最大值);(k)对应于Cas13f突变的F7V2、F10V1、F10V4、F40V2、F40V4、F44V2、F10S19、F10S21、F10S24、F10S26、F10S27、F10S33、F10S34、F10S35、F10S36、F10S45、F10S46、F10S48、F10S49、F40S22、F40S23、F40S26、F40S27、或F40S36突变的突变;(l)对应于Cas13f突变(例如,实施例12的Cas13f突变)的突变,所述Cas13f突变保留野生型Cas13f(如SEQ ID NO:52)的约50%-75%之间的指导RNA特异性切割(或其理论最大值),并且展现出野生型Cas13f(如SEQID NO:52)的小于约25%或27.5%的附带效果(或其理论最大值);和/或(m)对应于Cas13f突变的F2V4、F3V1、F3V3、F3V4、F5V2、F5V3、F6V4、F7V1、F38V4、F40V1、F41V1、F41V3、F42V4、F43V1、F10S2、F10S11、F10S12、F10S18、F10S20、F10S23、F10S25、F10S28、F10S43、F10S44、F10S47、F10S50、F10S51、F10S52、F40S7、F40S9、F40S11、F40S21、F40S22、F40S24、F40S28、F40S29、F40S30、F40S35、或F40S37突变的突变。
在某些实施方式中,附带活性增强的所述突变包含以下、基本上由以下组成、或由以下组成:(a)在所述区域内的1、2、3、4或5个所述15-20个连续氨基酸的延伸段内的取代;(b)对应于Cas13d突变(例如,实施例4的Cas13d突变)的突变,所述Cas13d突变保留野生型Cas13d(如SEQ ID NO:101)的至少约75%的指导RNA特异性切割(或其理论最大值),并且展现出野生型Cas13d(如SEQ ID NO:101)的多于约110%、115%、120%、125%、130%、135%、140%、145%、150%、155%、160%、165%、170%、175%、180%或更多的附带效果;(c)对应于实施例4中Cas13d突变的N2-Y142A、N4-Y193A、N12-Y604A、N21V7突变的突变;(d)对应于Cas13e突变(例如,实施例5的Cas13e突变)的突变,所述Cas13e突变保留野生型Cas13e(如SEQ ID NO:4)的至少约75%的指导RNA特异性切割(或其理论最大值),并且展现出野生型Cas13e(如SEQ ID NO:4)的多于约110%、115%、120%、125%、130%、135%、140%、145%、150%、155%、160%、165%、170%、175%、180%或更多的附带效果;(e)对应于Cas13e突变的M4V2、M4V3、M4V4、M8V1、M8V2、M9V2、M9V3、M10V1、M10V2、M11V4、M12V2、M14V1、M14V2、M16V3、M18V1、M19-G712A、M19-C727A、M19T725A、或M21V2突变的突变;(f)对应于Cas13f突变(例如,实施例12的Cas13f突变)的突变,所述Cas13f突变保留野生型Cas13f(如SEQ IDNO:52)的至少约75%的指导RNA特异性切割(或其理论最大值),并且展现出野生型Cas13f(如SEQ ID NO:52)的多于约110%、115%、120%、125%、130%、135%、140%、145%、150%、155%、160%、165%、170%、175%、180%或更多的附带效果;(g)对应于Cas13f突变(例如,实施例12的Cas13f突变)的F38V2、F42V1、F46V3、F38S2、F38S4、F38S5、F38S6、F38S7、F38S8、F38S9、F38S10、F38S11、F38S12、F38S13、F38S15、F38S16、F38S17、F40S1、F40S2、F40S3、F40S4、F40S5、F40S6、F40S8、F40S16、F40S18、F46S1、F46S4、F46S6、F46S7、F46S10、F46S14、F46S15、F10S4、F10S5、F10S6、F10S9、F10S10、F10S7、F38S1、F38S13或F46S2突变的突变。
在实施例(如实施例1、2、4、5和12)和相关序列表中详细描述了本文提及的Cas13d、Cas13e和Cas13f的突变和/或变体的序列。
在某些实施方式中,多于一个(例如,两个或更多个的任何组合)这样的突变/变体可以存在于相同的工程化的Cas13效应酶中。
在某些实施方式中,所述工程化的Cas13保存所述野生型Cas13对所述靶RNA的至少约50%、60%、70%、72.5%、75%、80%、85%、87.5%、90%、95%、96%、97%、97.5%、98%或99%的指导序列特异性内切核酸酶切割活性(或其理论最大值)。
在某些实施方式中,所述工程化的Cas13具有所述野生型Cas13对所述靶RNA的至少约95%、100%、105%、110%、115%、120%、125%、130%、135%、140%、145%、150%、155%、160%或更多的指导序列特异性内切核酸酶切割活性。也就是说,与衍生变体的野生型Cas13相比,所述主题工程化的Cas13变体可对所述靶RNA具有更高的指导序列特异性内切核酸酶切割活性。
在某些实施方式中,所述工程化的Cas13缺乏所述野生型Cas13对所述非靶RNA的至少约70%、72.5%、75%、77.5%、80%、82.5%、85%、87.5%、90%、92.5%、95%、96%、97%、98%、99%、或100%的非指导序列依赖性附带内切核酸酶切割活性(或其理论最大值)。
在某些实施方式中,所述工程化的Cas13保存所述野生型Cas13对所述靶RNA的至少约80%-90%的指导序列特异性内切核酸酶切割活性(或其理论最大值),并且缺乏所述野生型Cas13对所述非靶RNA的至少约95%-100%的非指导序列依赖性附带内切核酸酶切割活性(或其理论最大值)。
在某些实施方式中,使用基本上如任一实施例(如实施例1、2、4、5和12)中所述的方法测量所述工程化的Cas13效应酶的指导RNA特异性和附带(非gRNA依赖性)切割活性。
在某些实施方式中,本发明的工程化的Cas13具有以下氨基酸序列:所述氨基酸序列与SEQ ID NO:6-10和Cas13d(如SEQ ID NO:101)中的任一者具有至少80%、85%、90%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%或99.86%的同一性,不包括由SEQ ID NO:16、20、24、28和32定义的区域中的任何一个或多个以及实施例4或5中的任一突变区域。例如,在SEQ ID NO:16、20、24、28和/或32之外或不包括其的区域中,本发明的工程化的Cas13可以与SEQ ID NO:6-10中任一者的工程化的Cas13相差1、2、3、4、5、6、7、8、9、10或更多个残基,前提是这样的额外变化不会对指导序列特异性内切核酸酶活性产生实质性的负面影响,并且/或者不会增加非指导序列依赖性附带效果。
在某些实施方式中,分别与SEQ ID NO:17、21、25、29和33相比,所述氨基酸序列在由SEQ ID NO:16、20、24、28和32定义的一个或多个区域中的每一个区域中含有至多1、2、3、4或5个差异。例如,SEQ ID NO:17、21、25、29和/或33中的额外变化可能不会对指导序列特异性内切核酸酶活性产生实质性的负面影响,并且/或者不会增加非指导序列依赖性附带效果。
在某些实施方式中,本发明的工程化的Cas13具有SEQ ID NO:6-10中的任一者的氨基酸序列。在某些实施方式中,本发明的工程化的Cas13具有SEQ ID NO:9或10的氨基酸序列。
在某些实施方式中,本发明的工程化的Cas13进一步包含核定位信号(NLS)序列或核输出信号(NES)。例如,在某些实施方式中,所述工程化的Cas13可包含N-末端和/或C-末端NLS。
在相关方面,本发明提供主题工程化的Cas13(例如基本上缺乏附带内切核酸酶活性或具有增强的附带内切核酸酶活性的那些,如基于SEQ ID NO:50-56中的任一者的Cas13e和Cas13f效应蛋白(例如,SEQ ID NO:6-10))或其上述直系同源物、同源物、衍生物和功能性片段的额外的衍生物,所述额外的衍生物包含另一共价或非共价连接的蛋白或多肽或其他分子(如检测试剂或药物/化学部分)。这样的其他蛋白/多肽/其他分子可以通过例如化学偶联、基因融合或其他非共价连接(如生物素-链霉亲和素结合)来连接。这样的衍生的蛋白不影响原始蛋白的功能,如结合本发明的指导RNA/crRNA(下文描述)以形成复合物的能力、RNA酶活性、以及在与靶RNA至少部分互补的crRNA的指导下在特定位点处结合并切割所述靶RNA的能力。此外,这样的衍生的蛋白确实保留了主题工程化的Cas13缺乏附带内切核酸酶活性或具有增强的附带内切核酸酶活性的特征。
也就是说,在某些实施方式中,在主题工程化的Cas13(或其衍生物)的RNP复合物与所述靶RNA结合后,所述工程化的Cas13不会展现出实质性的(或可检测的)附带RNA酶活性或具有增强的附带RNA酶活性。
例如,这样的衍生可用于添加核定位信号(NLS,如SV40大T抗原NLS)以增强主题Cas13(例如,Cas13e和Cas13f)效应蛋白进入细胞核的能力。这样的衍生也可用于添加靶向分子或部分,以将主题Cas13(例如,Cas13e和Cas13f)效应蛋白引导至特定的细胞或亚细胞位置。这样的衍生还可用于添加可检测标记,以促进主题Cas13(例如,Cas13e和Cas13f)效应蛋白的检测、监测或纯化。这样的衍生可进一步用于添加脱氨基酶部分(如具有腺嘌呤或胞嘧啶脱氨基活性的酶部分)以促进RNA碱基编辑。
衍生可以通过在主题Cas13效应蛋白的N-末端或C-末端处或在内部(例如,通过内部氨基酸的侧链进行内部融合或连接)添加任一额外的部分来进行。
在相关方面,本发明提供主题工程化的Cas13(例如基本上缺乏或具有增强的附带内切核酸酶活性的那些,如基于SEQ ID NO:50-56中的任一者的Cas13e和Cas13f效应蛋白(例如,SEQ ID NO:6-10))或其上述直系同源物、同源物、衍生物和功能性片段的缀合物,所述缀合物缀合有如其他蛋白或多肽、可检测标记、或其组合等部分。这样的缀合的部分可包括但不限于定位信号、报告基因(例如,GST、HRP、CAT、GFP、HcRed、DsRed、CFP、YFP、BFP)、标记(例如,荧光染料,如FITC或DAPI)、NLS、靶向部分、DNA结合结构域(例如,MBP、Lex A DBD、Gal4 DBD)、表位标签(例如,His、myc、V5、FLAG、HA、VSV-G、Trx等)、转录激活结构域(例如,VP64或VPR)、转录抑制结构域(例如,KRAB部分或SID部分)、核酸酶(例如,FokI)、脱氨基结构域(例如,ADAR1、ADAR2、APOBEC、AID或TAD)、甲基化酶、去甲基化酶、转录释放因子、HDAC、具有ssRNA切割活性的部分、具有dsRNA切割活性的部分、具有ssDNA切割活性的部分、具有dsDNA切割活性的部分、DNA或RNA连接酶、其任何组合等。
例如,所述缀合物可包括一个或多个NLS,其可以位于或接近N-末端、C-末端、内部、或其组合。缀合可以通过氨基酸(如D或E、或S或T)、氨基酸衍生物(如Ahx、β-Ala、GABA或Ava)或PEG连接来进行。
在某些实施方式中,缀合不影响原始工程化的蛋白(例如基本上缺乏附带效果或具有增强的附带效果的那些)的功能,如结合本发明的指导RNA/crRNA(下文描述)以形成复合物的能力、以及在与靶RNA至少部分互补的crRNA的指导下在特定位点处结合并切割所述靶RNA的能力。
在相关方面,本发明提供主题工程化的Cas13(例如基本上缺乏附带内切核酸酶活性或具有增强的附带内切核酸酶活性的那些,如基于SEQ ID NO:50-56中的任一者的Cas13e和Cas13f效应蛋白(例如,SEQ ID NO:6-10))或其上述直系同源物、同源物、衍生物和功能性片段的融合物,所述融合物具有如下部分,如定位信号、报告基因(例如,GST、HRP、CAT、GFP、HcRed、DsRed、CFP、YFP、BFP)、NLS、蛋白靶向部分、DNA结合结构域(例如,MBP、LexA DBD、Gal4 DBD)、表位标签(例如,His、myc、V5、FLAG、HA、VSV-G、Trx等)、转录激活结构域(例如,VP64或VPR)、转录抑制结构域(例如,KRAB部分或SID部分)、核酸酶(例如,FokI)、脱氨基结构域(例如,ADAR1、ADAR2、APOBEC、AID或TAD)、甲基化酶、去甲基化酶、转录释放因子、HDAC、具有ssRNA切割活性的部分、具有dsRNA切割活性的部分、具有ssDNA切割活性的部分、具有dsDNA切割活性的部分、DNA或RNA连接酶、其任何组合等。
例如,所述融合物可包括一个或多个NLS,其可以位于或接近N-末端、C-末端、内部、或其组合。在某些实施方式中,缀合不影响原始工程化的Cas13蛋白(例如基本上缺乏附带活性或具有增强的附带活性的那些)的功能,如结合本发明的指导RNA/crRNA(下文描述)以形成复合物的能力、RNA酶活性、以及在与靶RNA至少部分互补的crRNA的指导下在特定位点处结合并切割所述靶RNA的能力。
在另一方面,本发明提供多核苷酸,所述多核苷酸编码本发明的工程化的Cas13。所述多核苷酸可以包含:(i)编码以下中的任一者的多核苷酸:工程化的Cas13(例如基本上缺乏附带效果或具有增强的附带效果的那些,例如基于SEQ ID NO:50-56的Cas13e或Cas13f效应蛋白的那些(如SEQ ID NO:6-10))或其直系同源物、同源物、衍生物、功能性片段、融合物;(ii)SEQ ID NO:11-15中的任一者的多核苷酸;或(iii)包含(i)和(ii)的多核苷酸。
在某些实施方式中,本发明的多核苷酸经密码子优化以在真核生物、哺乳动物(如人或非人哺乳动物)、植物、昆虫、鸟、爬行动物、啮齿动物(例如,小鼠、大鼠)、鱼、蠕虫/线虫或酵母中表达。
在相关方面,本发明提供多核苷酸,所述多核苷酸(i)与上文描述的主题多核苷酸相比具有一个或多个(例如,1、2、3、4、5、6、7、8、9或10个)核苷酸添加、缺失或取代;(ii)与上文描述的主题多核苷酸具有至少50%、60%、70%、80%、90%、95%或97%的序列同一性;(iii)在严格条件下与上文描述的主题多核苷酸、或(i)和(ii)中的任一者杂交;或(iv)是(i)-(iii)中的任一者的互补序列。
在另一相关方面,本发明提供载体,所述载体包含或涵盖本文描述的本发明的任一多核苷酸。所述载体可以是克隆载体或表达载体。仅举几例,所述载体可以是质粒、噬菌粒或粘粒。在某些实施方式中,所述载体可用于表达哺乳动物细胞(如人细胞)中的多核苷酸、工程化的Cas13(例如基本上缺乏附带活性或具有增强的附带活性的那些,例如基于SEQID NO:50-56的主题工程化的Cas13e或Cas13f效应蛋白(如SEQ ID NO:6-10))或其直系同源物、同源物、衍生物、功能性片段、融合物中的任一者;或本发明的任一多核苷酸;或本发明的任一复合物。
在某些实施方式中,所述多核苷酸与启动子和任选的增强子可操作地连接。例如,在一些实施方式中,所述启动子是组成型启动子、诱导型启动子、泛素启动子或组织特异性启动子。在某些实施方式中,所述载体是质粒。在某些实施方式中,所述载体是逆转录病毒载体、噬菌体载体、腺病毒载体、单纯疱疹病毒(HSV)载体、AAV载体或慢病毒载体。在某些实施方式中,所述AAV载体是血清型AAV1、AAV2、AAV4、AAV5、AAV6、AAV7、AAVrh74、AAV8、AAV9、AAV10、AAV11、AAV12或AAV13的重组AAV载体。
本发明的另一方面提供递送系统,所述递送系统包含(1)递送媒介物,和(2)本发明的工程化的Cas13、本发明的多核苷酸、或本发明的载体。
在某些实施方式中,所述递送媒介物是纳米颗粒、脂质体、外泌体、微泡或基因枪。
本发明的另外的方面提供细胞或其后代,所述细胞或其后代包含本发明的工程化的Cas13、本发明的多核苷酸、或本发明的载体。所述细胞可以是原核生物(如大肠杆菌)或来自真核生物(如酵母、昆虫、植物、动物(例如,哺乳动物,包括人和小鼠))的细胞。所述细胞可以是分离的原代细胞(如用于离体疗法的骨髓细胞)或已建立的细胞系,如肿瘤细胞系、293T细胞或干细胞、iPC等。
在某些实施方式中,所述细胞或其后代是真核细胞(例如,非人哺乳动物细胞、人细胞或植物细胞)或原核细胞(例如,细菌细胞)。
本发明的另外的方面提供非人多细胞真核生物,所述非人多细胞真核生物包含本发明的细胞。
在某些实施方式中,所述非人类多细胞真核生物是针对人遗传障碍的动物(例如,啮齿动物或灵长类动物)模型。
在另一方面,本发明提供复合物,所述复合物包含:(i)以下中的任一者的蛋白组合物:主题工程化的Cas13(例如基本上缺乏附带内切核酸酶活性或具有增强的附带内切核酸酶活性的那些,例如工程化的Cas13e或Cas13f效应蛋白)或其直系同源物、同源物、衍生物、缀合物、功能性片段、或其融合物;以及(ii)包含分离的多核苷酸以及与靶RNA的至少一部分互补的间隔序列/指导序列的多核苷酸组合物,所述分离的多核苷酸包含针对所述工程化的Cas13效应酶的同源DR序列。
在某些实施方式中,所述DR序列在所述间隔序列的3’端。
在某些实施方式中,所述DR序列在所述间隔序列的5’端。
在一些实施方式中,所述多核苷酸组合物是主题工程化的Cas13(例如基本上缺乏附带活性或具有增强的附带活性的那些,例如,不包括tracrRNA的工程化的Cas13e或Cas13f系统)的指导RNA/crRNA。
在某些实施方式中,为了与主题工程化的Cas13(例如基本上缺乏附带活性或具有增强的附带活性的那些,例如,主题工程化的Cas13e和Cas13f效应蛋白)、其同源物、直系同源物、衍生物、融合物、缀合物或具有指导序列特异性RNA酶活性的功能性片段一起使用,所述间隔序列为至少约10个核苷酸,或在10-60、15-50、20-50、25-40、25-50或19-50个核苷酸之间。
在相关方面,本发明提供真核细胞,所述真核细胞包含含有主题工程化的Cas13的主题复合物,所述复合物包含:(1)RNA指导序列,其包含能够与靶RNA杂交的间隔序列以及在所述间隔序列的5’或3’的同向重复(DR)序列;以及(2)主题工程化的Cas13,例如基本上缺乏附带活性或具有增强的附带活性的那些,如基于具有SEQ ID NO:50-56中任一者的氨基酸序列的野生型的主题工程化的Cas13e或Cas13f效应酶(如SEQ ID NO:6-10),或所述Cas的衍生物或功能性片段;其中所述Cas、所述Cas的衍生物和功能性片段能够(i)与所述RNA指导序列结合,并且(ii)靶向所述靶RNA。
在另一方面,本发明提供组合物,所述组合物包含:(i)选自以下中的任一者的第一(蛋白)组合物:工程化的Cas13(例如基本上缺乏附带活性或具有增强的附带活性的那些,例如基于SEQ ID NO:50-56的工程化的Cas13e或Cas13f效应蛋白(如SEQ ID NO:6-10))或其直系同源物、同源物、衍生物、缀合物、功能性片段、融合物;以及(ii)包含RNA的第二(核苷酸)组合物,所述RNA涵盖指导RNA/crRNA、特别是间隔序列或其编码序列。所述指导RNA可包含DR序列和可与靶RNA互补或杂交的间隔序列。所述指导RNA可以与(i)的第一(蛋白)组合物形成复合物。在一些实施方式中,所述DR序列可以是本发明的多核苷酸。在一些实施方式中,所述DR序列可以在所述指导RNA的5或3’端。在一些实施方式中,所述组合物(如(i)和/或(ii))是非天然存在的或从天然存在的组合物修饰而来。在一些实施方式中,所述靶序列是来自原核生物或真核生物的RNA,如非天然存在的RNA。所述靶RNA可以存在于细胞内,如在胞质溶胶中或在细胞器内。在一些实施方式中,所述蛋白组合物可以具有可位于其N-末端或C-末端或内部的NLS。
在另一方面,本发明提供组合物,所述组合物包含本发明的一种或多种载体,所述一种或多种载体包含:(i)编码以下中的任一者的第一多核苷酸:工程化的Cas13(例如基本上缺乏附带活性或具有增强的附带活性的那些,如基于SEQ ID NO:50-56的主题工程化的Cas13e或Cas13f效应蛋白(如SEQ ID NO:6-10))或其直系同源物、同源物、衍生物、功能性片段、融合物;任选地与第一调节元件可操作地连接;和(ii)编码本发明的指导RNA的第二多核苷酸;任选地与第二调节元件可操作地连接。所述第一多核苷酸和所述第二多核苷酸可以在不同的载体上或在相同的载体上。所述指导RNA可与由所述第一多核苷酸编码的蛋白产物形成复合物,并包含DR序列(如第4方面的任一DR序列)和可与靶RNA结合/互补的间隔序列。在一些实施方式中,所述第一调节元件是启动子,如诱导型启动子。在一些实施方式中,所述第二调节元件是启动子,如诱导型启动子。在一些实施方式中,所述靶序列是来自原核生物或真核生物的RNA,如非天然存在的RNA。所述靶RNA可以存在于细胞内,如在胞质溶胶中或在细胞器内。在一些实施方式中,所述蛋白组合物可以具有可位于其N-末端或C-末端或内部的NLS。
在一些实施方式中,所述载体是质粒。在一些实施方式中,所述载体是病毒载体,所述病毒载体基于逆转录病毒、不能复制的逆转录病毒、腺病毒、不能复制的腺病毒或AAV。在一些实施方式中,所述载体可以在宿主细胞中自我复制(例如,具有细菌复制起点序列)。在一些实施方式中,所述载体可以整合到宿主基因组中并与其一起复制。在一些实施方式中,所述载体是克隆载体。在一些实施方式中,所述载体是表达载体。
本发明进一步提供用于递送以下的递送组合物:本发明的工程化的Cas13(例如基本上缺乏附带活性或具有增强的附带活性的那些,例如,基于SEQ ID NO:50-56的主题工程化的Cas13e或Cas13f效应蛋白(如SEQ ID NO:6-10))或其直系同源物、同源物、衍生物、缀合物、功能性片段、融合物中的任一者;本发明的多核苷酸;本发明的复合物;本发明的载体;本发明的细胞;以及本发明的组合物。递送可以使用媒介物(如一种或多种脂质体、一种或多种纳米颗粒、一种或多种外泌体、一种或多种微泡、基因枪或一种或多种病毒载体)通过本领域已知的任何一种方式,如转染、脂质转染、电穿孔、基因枪、显微注射、超声、磷酸钙转染、阳离子转染、病毒载体递送等来进行。
本发明进一步提供试剂盒,所述试剂盒包含以下中的任一者或多者:本发明的工程化的Cas13(例如基本上缺乏附带活性或具有增强的附带活性的那些,例如,基于SEQ IDNO:50-56的主题工程化的Cas13e或Cas13f效应蛋白(如SEQ ID NO:6-10))或其直系同源物、同源物、衍生物、缀合物、功能性片段、融合物中的任一者;本发明的多核苷酸;本发明的复合物;本发明的载体;本发明的细胞;以及本发明的组合物。在一些实施方式中,所述试剂盒可进一步包括关于如何使用试剂盒组分和/或如何从第3方获得用于与所述试剂盒组分一起使用的其他组分的说明。所述试剂盒的任何组分都可以储存在任何合适的容器中。
本发明的另一方面提供工程化的Cas13效应酶,所述工程化的Cas13效应酶包含如任一实施例(如实施例1、2、4、5或12)中所述的任何一个或多个突变。
在某些实施方式中,与衍生工程化的Cas13效应酶的野生型Cas13效应酶的情况相比,所述工程化的Cas13效应酶展现出大致相同的或增强的与指导RNA互补的靶RNA的指导RNA介导的切割(或其理论最大值)。
在某些实施方式中,与衍生工程化的Cas13效应酶的野生型Cas13效应酶的情况相比,所述工程化的Cas13效应酶展现出减少的或减弱的非特异性RNA(例如,基本上不与指导RNA互补的RNA)的非指导RNA依赖性或附带切割(或其理论最大值)。例如,与衍生工程化的Cas13效应酶的野生型Cas13效应酶的情况相比,所述工程化的Cas13效应酶展现出约50%、40%、30%、20%、15%、10%或更少的附带切割(或其理论最大值)。
在某些实施方式中,与衍生工程化的Cas13效应酶的野生型Cas13效应酶的情况相比,所述工程化的Cas13效应酶展现出增加的非特异性RNA(例如,基本上不与指导RNA互补的RNA)的非指导RNA依赖性或附带切割。例如,与衍生工程化的Cas13效应酶的野生型Cas13效应酶的情况相比,所述工程化的Cas13效应酶展现出约105%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多的附带切割。
上文大体描述了本发明,本发明各个方面的更详细描述在下文的单独部分中提供。然而,应理解,为了简洁和减少冗余,本发明的某些实施方式仅在一个部分下描述或仅在权利要求或实施例中描述。因此,还应理解,本发明的任何一个实施方式,包括仅在一个方面、部分下或仅在权利要求或实施例中描述的那些实施方式,可以与本发明的任何其他实施方式组合,除非特别否认或组合不当。
2.代表性工程化的2类VI型Cas及其衍生物
本发明的一个方面提供工程化的Cas13,例如基本上缺乏附带活性或具有增强的附带活性的那些。
在某些实施方式中,Cas13效应酶是2类VI型效应酶,其具有两个严格保守的RX4-6H(RXXXXH)样基序,这是高等真核生物和原核生物核苷酸结合(HEPN)结构域的特征。在某些实施方式中,含有两个HEPN结构域的CRISPR 2类VI型效应子先前已被表征,并且包括例如CRISPR Cas13a(C2c2)、Cas13b、Cas13c、Cas13d(包括工程化的变体CasRx)、Cas13e和Cas13f。
HEPN结构域经证明是RNA酶结构域并赋予结合和切割靶RNA分子的能力。所述靶RNA可以是任何合适形式的RNA,包括但不限于mRNA、tRNA、核糖体RNA、非编码RNA、lncRNA(长链非编码RNA)和核RNA。例如,在一些实施方式中,所述工程化的Cas13蛋白识别并切割位于开放阅读框(ORF)的编码链上的RNA靶标。
在一个实施方式中,所述2类VI型Cas13效应酶属于VI-E型和VI-F型亚型、或是Cas13e或Cas13f(如SEQ ID NO:50-56)。野生型VI-E型和VI-F型CRISPR-Cas效应蛋白与这些其他系统的效应子的直接比较显示出VI-E型和VI-F型CRISPR-Cas效应蛋白甚至比先前鉴定的最小的VI-D型/Cas13d效应子显著更小(例如,氨基酸少约20%)(参见图15),并且在与其他先前描述的效应蛋白(包括系统发育上最接近的亲属Cas13b)的一对一序列比对中具有小于30%的序列相似性。
像其他Cas13蛋白一样,2类VI-E和VI-F亚型效应子可用于多种应用中,并且特别适用于治疗性应用,因为它们比其他效应子(例如,CRISPR Cas13a、Cas13b、Cas13c和Cas13d/CasRx效应子)显著更小,这允许将编码效应子的核酸及它们的指导RNA编码序列包装到具有大小限制的递送系统(如AAV载体)中。此外,在指导序列特异性RNA酶活性激活后,主题工程化的Cas13的可检测的附带/非特异性RNA酶活性的缺乏使这些工程化的Cas13效应子在希望不受破坏的靶细胞中较不易于(如果不能免于)产生潜在危险的普遍脱靶RNA消化。
示例性VI-D型CRISPR-Cas效应蛋白包括Cas13d,如SEQ ID NO:101。示例性VI-E型和VI-F型CRISPR-Cas效应蛋白在下表中提供。
在上面的序列中,每个效应子中的两个RX4-6H(RXXXXH)基序加双下划线。在Cas13e.1中,由于基序侧翼的RR和HH序列,C-末端基序可具有两种可能性。在一个或两个这样的结构域处的突变可能产生Cas13e和Cas13f效应蛋白、其同源物、直系同源物、融合物、缀合物、衍生物或功能性片段的RNA酶死亡版本(或“dCas”),同时基本上保持它们结合指导RNA和与所述指导RNA互补的靶RNA的能力。
Cas效应子的对应DR编码序列在下面列出:
在一些实施方式中,主题工程化的Cas13效应酶(例如基本上缺乏附带活性或具有增强的附带活性的那些)基于野生型VI-D型、VI-E型和VI-F型CRISPR-Cas效应蛋白的“衍生物”,所述衍生物具有如下氨基酸序列,所述氨基酸序列与上述SEQ ID NO:50-56和101中的任一者的氨基酸序列具有至少约80%的序列同一性(例如,81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)。与SEQ ID NO:50-56和101中的任一者共享显著的蛋白序列同一性的这样的衍生性Cas效应子保留了SEQ ID NO:50-56和101的Cas的至少一种功能(参见下文),例如与包含Cas13d和SEQ ID NO:57-63的DR序列中的至少一个的crRNA结合并形成复合物的能力。例如,Cas13e.1衍生物可分别与SEQ ID NO:50、51、52、53、54、55或56共享85%的氨基酸序列同一性,并保留分别与具有SEQ ID NO:57、58、59、60、61、62或63的DR序列的crRNA结合并形成复合物的能力。
在某些实施方式中,所述衍生物与野生型Cas13之间的序列同一性基于由实施例1、2、4和5中的突变区域(如SEQ ID NO:16、20、24、28和32)定义的区域之外的区域。
在一些实施方式中,所述衍生物包含保守的氨基酸残基取代。在一些实施方式中,所述衍生物仅包含保守的氨基酸残基取代(即,所述衍生物中的所有氨基酸取代都是保守取代,并且没有不保守的取代)。
在一些实施方式中,所述衍生物将不超过1、2、3、4、5、6、7、8、9或10个氨基酸插入或缺失包含到Cas13d和SEQ ID NO:50-56的任一野生型序列中。只要保留野生型序列的至少一种功能,插入和/或缺失就可以聚集在一起,或在序列的整个长度上分开。这样的功能可以包括结合指导/crRNA的能力、RNA酶活性、结合和/或切割与指导/crRNA互补的靶RNA的能力。在一些实施方式中,插入和/或缺失不存在于RXXXXH基序中,或距RXXXXH基序5、10、15或20个残基内。
在一些实施方式中,所述衍生物保留结合指导RNA/crRNA的能力。
在一些实施方式中,所述衍生物保留指导/crRNA激活的RNA酶活性。
在一些实施方式中,在所结合的在序列方面与至少一部分靶RNA互补的指导/crRNA存在下,所述衍生物保留结合靶RNA和/或切割所述靶RNA的能力。
在其他实施方式中,由于例如RNA指导的RNA酶的一个或多个催化残基的突变,所述衍生物完全或部分丧失指导/crRNA激活的RNA酶活性。这样的衍生物有时称为dCas,如dCas13d和dCas13e.1。
因此,在某些实施方式中,所述衍生物可以经修饰以具有减弱的核酸酶/RNA酶活性,例如,与相应的野生型蛋白相比,核酸酶灭活至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少97%或100%。可以通过本领域已知的几种方法减弱核酸酶活性,例如,将突变引入蛋白的核酸酶(催化)结构域中。在一些实施方式中,鉴定出核酸酶活性的催化残基,并且这些氨基酸残基可以被不同的氨基酸残基(例如,甘氨酸或丙氨酸)取代以减弱核酸酶活性。在一些实施方式中,所述氨基酸取代是保守性氨基酸取代。在一些实施方式中,所述氨基酸取代是非保守性氨基酸取代。
在一些实施方式中,修饰包含在至少一个HEPN结构域中的一个或多个突变(例如,氨基酸缺失、插入或取代)。在一些实施方式中,在至少一个HEPN结构域中存在一个、两个、三个、四个、五个、六个、七个、八个、九个或更多个氨基酸取代。
例如,在一些实施方式中,所述一个或多个突变包含在与以下对应的氨基酸残基处的取代(例如,丙氨酸取代):SEQ ID NO:50的R84、H89、R739、H744、R740、H745,或SEQ IDNO:51的R97、H102、R770、H775,或SEQ ID NO:52的R77、H82、R764、H769,或SEQ ID NO:53的R79、H84、R766A、H771,或SEQ ID NO:54的R79、H84、R766、H771,或SEQ ID NO:55的R89、H94、R773、H778,或SEQ ID NO:56的R89、H94、R777、H782。
在某些实施方式中,所述一个或多个突变包含以下、基本上由以下组成、或由以下组成:(a)在所述区域内的1、2、3、4或5个所述15-20个连续氨基酸的延伸段内的取代;(b)对应于实施例4的Cas13d突变的突变,所述Cas13d突变保留野生型Cas13d(如SEQ ID NO:101)的至少约75%的指导RNA特异性切割,并且展现出野生型Cas13d(如SEQ ID NO:101)的小于约27.5%的附带效果;(c)对应于Cas13d突变的N1V7、N2V7、N2V8(cfCas13d)、N3V7或N15V4突变的突变;(d)对应于实施例4的Cas13d突变的突变,所述Cas13d突变保留野生型Cas13d(如SEQ ID NO:101)的约25%-75%之间的指导RNA特异性切割,并且展现出野生型Cas13d(如SEQ ID NO:101)的小于约27.5%的附带效果;(e)对应于Cas13d突变的N2V4、N2V5、N4V3、N6V3、N10V6、N15V2、N20V6或N20-Y910A突变的突变;(f)对应于实施例1、2或5的Cas13e突变的突变,所述Cas13e突变保留野生型Cas13e(如SEQ ID NO:4)的至少约75%的指导RNA特异性切割,并且展现出野生型Cas13e(如SEQ ID NO:4)的小于约25%的附带效果;(g)对应于Cas13e突变的M1V4、M2V2、M2V3、M2V4、M5V1、M6V2、M6V3、M6V4、M7V1、M7V2、M7V3、M7-Y55A、M7-Y61A、M11V1、M12V3、M15V1、M15V2、M15-Y643A、M15-Y647A、M16V1、M16V2、M17V2、M18V2、M18V3、M19V2、M19V3、或M19-IA突变的突变;(h)对应于实施例5的Cas13e突变的突变,所述Cas13e突变保留野生型Cas13e(如SEQ ID NO:4)的约25%-75%之间的指导RNA特异性切割,并且展现出野生型Cas13e(如SEQ ID NO:4)的小于约25%的附带效果;和/或(i)对应于Cas13e突变的M17YY(cfCas13e)、M8V4、M9V1、M11V2、M11V3、M13V1、M13V2、M13V3、M15V3、或M20V2突变的突变。
在某些实施方式中,所述一个或多个突变或所述两个或更多个突变可以在包含HEPN结构域的效应蛋白的催化活性结构域或与HEPN结构域同源的催化活性结构域中。在某些实施方式中,所述效应蛋白包含一个或多个以下突变:R84A、H89A、R739A、H744A、R740A、H745A(其中氨基酸位置对应于Cas13e.1的氨基酸位置)。
本领域技术人员将理解,不同的Cas13蛋白(如不同的Cas13d、Cas13e和Cas13f蛋白)中的对应氨基酸位置可以突变成相同效果。在这方面,图23A-23J提供几种代表性Cas13家族酶的示例性多序列比对。本领域技术人员可以容易地对在与图23A-23J和24A-24M中的任一序列共享实质性的序列同源性/同一性的任何Cas13家族蛋白中的突变进行作图,以确定“对应于”本文描述的示例性Cas13d和Cas13e突变的突变。
在某些实施方式中,一个或多个突变完全或部分消除蛋白的催化活性(例如,改变的切割速率、改变的特异性等)。
其他示例性(催化)残基突变包括:Cas13e.2的R97A、H102A、R770A、H775A,或Cas13f.1的R77A、H82A、R764A、H769A,或Cas13f.2的R79A、H84A、R766A、H771A,或Cas13f.3的R79A、H84A、R766A、H771A,或Cas13f.4的R89A、H94A、R773A、H778A,或Cas13f.5的R89A、H94A、R777A、H782A。在某些实施方式中,本文的任一R和/或H残基可以被G、V或I而不是A替代。
与缺乏突变的对应野生型蛋白相比,这些突变中的至少一个的存在导致具有减少的或减弱的指导序列依赖性RNA酶活性的衍生物。基本上缺乏附带效果的主题工程化的Cas13中的任何一个突变的额外存在可以减少/消除由非特异性RNA结合导致的脱靶效果。
在某些实施方式中,如本文描述的效应蛋白是“死”效应蛋白,如死Cas13e或Cas13f效应蛋白(即dCas13e和dCas13f)。在某些实施方式中,所述效应蛋白在HEPN结构域1(N-末端)中具有一个或多个突变。在某些实施方式中,所述效应蛋白在HEPN结构域2(C-末端)中具有一个或多个突变。在某些实施方式中,所述效应蛋白在HEPN结构域1和HEPN结构域2中具有一个或多个突变。
灭活的Cas或其衍生物或功能性片段可以与一个或多个异源/功能性结构域融合或缔合(例如,经由融合蛋白、接头肽、“GS”接头等)。这些功能性结构域可以具有多种活性,例如,甲基化酶活性、去甲基化酶活性、转录激活活性、转录抑制活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性、DNA切割活性、核酸结合活性、碱基编辑活性和开关活动(例如,光诱导型)。在一些实施方式中,所述功能性结构域是Krüppel相关盒(KRAB)、SID(例如SID4X)、VP64、VPR、VP16、Fok1、P65、HSF1、MyoD1、作用于RNA的腺苷脱氨酶(如ADAR1、ADAR2)、APOBEC、胞苷脱氨酶(AID)、TAD、小型-SOG、APEX和生物素-APEX。
在一些实施方式中,所述功能性结构域是碱基编辑结构域,例如,ADAR1(包括野生型或其ADAR2DD版本,具有或不具有E1008Q和/或E488Q突变)、ADAR2(包括野生型或其ADAR2DD版本,具有或不具有E1008Q和/或E488Q突变)、APOBEC或AID。
在一些实施方式中,所述功能性结构域可以包含一个或多个核定位信号(NLS)结构域。所述一个或多个异源功能性结构域可以包含至少两个或更多个NLS结构域。所述一个或多个NLS结构域可位于或接近或邻近所述效应蛋白(例如,Cas13e/Cas13f效应蛋白)的末端处,并且如果有两个或更多个NLS,则两者中的每一个可位于或接近或邻近所述效应蛋白(例如,Cas13e/Cas13f效应蛋白)的末端处。
在一些实施方式中,至少一个或多个异源功能性结构域可以位于或接近所述效应蛋白的氨基末端处,并且/或者其中至少一个或多个异源功能性结构域位于或接近所述效应蛋白的羧基末端处。所述一个或多个异源功能性结构域可以与所述效应蛋白融合。所述一个或多个异源功能性结构域可以与所述效应蛋白相连。所述一个或多个异源功能性结构域可以通过接头部分与所述效应蛋白连接。
在一些实施方式中,存在多个(例如,两个、三个、四个、五个、六个、七个、八个或更多个)相同或不同的功能性结构域。
在一些实施方式中,所述功能性结构域(例如,碱基编辑结构域)进一步与RNA结合结构域(例如,MS2)融合。
在一些实施方式中,所述功能性结构域与接头序列(例如,柔性接头序列或刚性接头序列)缔合或经由接头序列(例如,柔性接头序列或刚性接头序列)融合。示例性接头序列和功能性结构域序列在下表中提供。
VI-D型、VI-E型和VI-F型CRISPR Cas效应子的工程化的变体中基序和功能性结构域的氨基酸序列
接头1 GS
接头2 GSGGGGS(SEQ ID NO:70)
接头3 GGGGSGGGGSGGGGS(SEQ ID NO:71)
ADAR1DD-WT SEQ ID NO:72
ADAR1DD-E1008Q SEQ ID NO:73
ADAR2DD-WT SEQ ID NO:74
ADAR2DD-E488Q SEQ ID NO:75
AID-APOBEC1 SEQ ID NO:76
七鳃鳗_AID-APOBEC1 SEQ ID NO:77
APOBEC1_BE1 SEQ ID NO:78
所述一个或多个功能性结构域在灭活的Cas蛋白上的定位允许所述功能性结构域的正确的空间取向,从而以所归属的功能性效应影响靶标。例如,如果所述功能性结构域是转录激活子(例如,VP16、VP64或p65),则将所述转录激活子放置成允许其影响所述靶标的转录的空间取向。同样地,将转录阻遏子定位成影响所述靶标的转录,并且将核酸酶(例如,Fok1)定位成切割或部分切割所述靶标。在一些实施方式中,所述功能性结构域位于Cas/dCas的N-末端处。在一些实施方式中,所述功能性结构域位于Cas/dCas的C-末端处。在一些实施方式中,将灭活的CRISPR相关蛋白(dCas)修饰为包含在N-末端处的第一功能性结构域和在C-末端处的第二功能性结构域。
与一个或多个功能性结构域融合的灭活的CRISPR相关蛋白的多种实例及其使用方法描述于例如国际公布号WO 2017/219027中,将所述文献通过引用以其全文并且特别是关于本文描述的特征并入本文。
在一些实施方式中,可以不使用全长野生型(SEQ ID NO:50-56)或衍生性VI-E型和VI-F型Cas效应子,而使用其“功能性片段”。
如本文所用,“功能性片段”是指具有小于全长序列的野生型Cas13蛋白(如SEQ IDNO:50-56和101中的任一者)或其衍生物的片段。所述功能性片段中缺失的残基可以在N-末端、C-末端和/或内部。所述功能性片段保留野生型VI-D、VI-E或VI-F Cas的至少一种功能、或其衍生物的至少一种功能。因此,功能性片段相对于所讨论的功能而特别定义。例如,其中所述功能是结合crRNA和靶RNA的能力的功能性片段,相对于RNA酶功能而言可能不是功能性片段,因为丢失Cas两端的RXXXXH基序可能不会影响其结合crRNA和靶RNA的能力,但可能消除破坏RNA酶活性。在某些实施方式中,本发明的工程化的Cas13(包括工程化的Cas13的功能性片段)基本上保留对应的野生型Cas13的指导序列依赖性RNA酶活性,但基本上缺乏附带活性。
在一些实施方式中,与全长野生型序列相比,所述工程化的2类VI型效应蛋白或其衍生物或其功能性片段缺乏来自N-末端的约30、60、90、120、150或约180个残基。
在一些实施方式中,与全长野生型序列相比,所述工程化的2类VI型效应蛋白或其衍生物或其功能性片段缺乏来自C-末端的约30、60、90、120或约150个残基。
在一些实施方式中,与全长野生型序列相比,所述工程化的2类VI型效应蛋白或其衍生物或其功能性片段缺乏来自N-末端的约30、60、90、120、150或约180个残基,并且缺乏来自C-末端的约30、60、90、120或约150个残基。
在一些实施方式中,所述工程化的2类VI型Cas13效应蛋白或其衍生物或其功能性片段具有RNA酶活性,例如,指导/crRNA激活的特异性RNA酶活性。
在一些实施方式中,所述工程化的2类VI型Cas13效应蛋白或其衍生物或其功能性片段不具有实质性的/可检测的附带RNA酶活性。
本披露还提供本文描述的工程化的2类VI型Cas13效应酶的拆分版本(例如,VI-D型、VI-E型或VI-F型CRISPR-Cas效应蛋白)。所述工程化的Cas13的拆分版本可有利于递送。在一些实施方式中,将所述工程化的Cas13拆分成酶的两个部分,所述酶的两个部分合在一起基本上构成有功能的工程化的2类VI型Cas13。
所述拆分能以一个或多个催化结构域不受影响的方式进行。所述CRISPR相关蛋白可以作为核酸酶发挥作用,或者可以是灭活的酶,所述灭活的酶本质上是具有非常小的催化活性或没有催化活性(例如,由于其催化结构域中的一个或多个突变)的RNA结合蛋白。拆分型酶描述于例如Wright等人,“Rational design of a split-Cas9 enzyme complex[拆分型Cas9酶复合物的合理设计],”Proc.Nat’l.Acad.Sci.[美国国家科学院院刊]112(10):2984-2989,2015中,将所述文献通过引用以其全文并入本文。
例如,在一些实施方式中,核酸酶叶(nuclease lobe)和α-螺旋叶(α-helicallobe)经表达为单独的多肽。尽管所述叶自身并不相互作用,但crRNA将它们募集到三元复合物中,所述复合物重现全长CRISPR相关蛋白的活性并催化位点特异性切割。使用经修饰的crRNA通过防止二聚化来消除拆分型酶的活性,从而允许开发诱导型二聚化系统。
在一些实施方式中,可以例如通过采用雷帕霉素敏感性二聚化结构域将拆分型CRISPR相关蛋白与二聚化配偶体融合。这允许生成用于对蛋白活性进行时间控制的化学诱导型CRISPR相关蛋白。因此,所述CRISPR相关蛋白可以通过拆分成两个片段而成为化学诱导性,并且雷帕霉素敏感性二聚化结构域可以用于蛋白的受控重组。
拆分点典型地经由计算机模拟设计并克隆到构建体中。在此过程期间,可以将突变引入拆分型CRISPR相关蛋白中,并且可以去除非功能性结构域。
在一些实施方式中,所述拆分型CRISPR相关蛋白的两个部分或片段(即,N-末端和C-末端片段)可以形成完整的CRISPR相关蛋白,其包含野生型CRISPR相关蛋白的例如至少70%、至少80%、至少90%、至少95%或至少99%的序列。
本文描述的CRISPR相关蛋白(例如,VI-D型、VI-E型或VI-F型CRISPR-Cas效应蛋白)可以设计为自我激活或自我灭活。例如,可以将靶序列引入所述CRISPR相关蛋白的编码构建体中。因此,所述CRISPR相关蛋白可以切割所述靶序列以及编码所述蛋白的构建体,从而自我灭活它们的表达。构建自我灭活CRISPR系统的方法描述于例如Epstein和Schaffer,Mol.Ther.[分子疗法]24:S50,2016中,将所述文献通过引用以其全文并入本文。
在一些其他实施方式中,在弱启动子(例如,7SK启动子)的控制下表达的额外的crRNA可以靶向编码所述CRISPR相关蛋白的核酸序列以防止和/或阻断其表达(例如,通过防止所述核酸的转录和/或翻译)。用表达所述CRISPR相关蛋白、所述crRNA、和靶向编码所述CRISPR相关蛋白的核酸的crRNA的载体转染细胞,可导致编码所述CRISPR相关蛋白的核酸的高效破坏并降低所述CRISPR相关蛋白的水平,从而限制其活性。
在一些实施方式中,所述CRISPR相关蛋白的活性可以通过哺乳动物细胞中的内源性RNA特征(例如,miRNA)来调节。可以通过在编码所述CRISPR相关蛋白的mRNA的5’-UTR中使用miRNA互补序列来制造CRISPR相关蛋白开关。所述开关选择性地并且高效地响应靶细胞中的miRNA。因此,所述开关可以通过感应异质细胞群内的内源性miRNA活性来对Cas活性进行差异控制。因此,开关系统可以为基于细胞内miRNA信息的细胞类型选择性活性和细胞工程化提供框架(参见例如,Hirosawa等人,Nucl.Acids Res.[核酸研究]45(13):e118,2017)。
所述工程化的2类VI型Cas13效应子(例如基本上缺乏附带活性或具有增强的附带活性的那些,例如,工程化的VI-D型、VI-E型和VI-F型CRISPR-Cas效应蛋白)可以经诱导表达,例如,它们的表达可以是光诱导的或化学诱导的。这种机制允许激活所述CRISPR相关蛋白中的功能性结构域。光诱导性可以通过本领域已知的各种方法来实现,例如,通过设计如下融合复合物来实现,其中将CRY2 PHR/CIBN配对用于拆分型CRISPR相关蛋白中(参见例如,Konermann等人,“Optical control of mammalian endogenous transcription andepigenetic states[哺乳动物内源性转录和表观遗传状态的光学控制],”Nature[自然]500:7463,2013)。
化学诱导性可以例如通过设计如下融合复合物来实现,其中将FKBP/FRB(FK506结合蛋白/FKBP雷帕霉素结合结构域)配对用于拆分型CRISPR相关蛋白中。需要雷帕霉素来形成融合复合物,从而激活所述CRISPR相关蛋白(参见例如,Zetsche等人,“A split-Cas9architecture for inducible genome editing and transcription modulation[用于诱导型基因组编辑和转录调节的拆分型Cas9架构],”Nature Biotech.[自然生物技术]33:2:139-42,2015)。
此外,所述工程化的2类VI型Cas13效应子(例如基本上缺乏附带活性或具有增强的附带活性的那些)的表达可以通过诱导型启动子,例如四环素或强力霉素控制的转录激活(Tet-开和Tet-关表达系统)、激素诱导型基因表达系统(例如,蜕皮素诱导型基因表达系统)和阿拉伯糖诱导型基因表达系统来调节。当作为RNA递送时,RNA靶向效应蛋白的表达可以经由核糖开关进行调节,所述核糖开关可以感应小分子(像四环素)(参见例如,Goldfless等人,“Direct and specific chemical control of eukaryotic translationwith a synthetic RNA-protein interaction[通过合成的RNA-蛋白相互作用对真核生物的翻译进行直接和特异性的化学控制],”Nucl.Acids Res.[核酸研究]40:9:e64-e64,2012)。
诱导型CRISPR相关蛋白和诱导型CRISPR系统的各种实施方式描述于例如美国专利号8,871,445、美国公布号2016/0208243和国际公布号WO 2016/205764中,将各个文献通过引用以其全文并入本文。
在一些实施方式中,所述工程化的2类VI型Cas13效应子(例如基本上缺乏附带活性或具有增强的附带活性的那些)包括至少一个(例如,1、2、3、4、5、6、7、8、9或10个)附接至所述蛋白的N-末端或C-末端的核定位信号(NLS)。NLS的非限制性实例包括源自以下的NLS序列:SV40病毒大T抗原的NLS,其具有SEQ ID NO:79的氨基酸序列;来自核质蛋白的NLS(例如,具有SEQ ID NO:80的序列的核质蛋白二分NLS);c-myc NLS,其具有SEQ ID NO:81或82的氨基酸序列;hRNPA1 M9NLS,其具有SEQ ID NO:83的序列;来自输入蛋白-α的IBB结构域的SEQ ID NO:84的序列;肌瘤T蛋白的SEQ ID NO:85或86的序列;人p53的SEQ ID NO:87的序列;小鼠c-abl IV的SEQ ID NO:88的序列;流感病毒NS1的SEQ ID NO:89或90的序列;肝炎病毒δ抗原的SEQ ID NO:91的序列;小鼠Mx1蛋白的SEQ ID NO:92的序列;人聚(ADP-核糖)聚合酶的SEQ ID NO:93的序列;以及人糖皮质激素受体的SEQ ID NO:94的序列。在一些实施方式中,所述CRISPR相关蛋白包含至少一个(例如,1、2、3、4、5、6、7、8、9或10个)附接所述蛋白的N-末端或C-末端的核输出信号(NES)。在优选的实施方式中,附接C-末端和/或N-末端NLS或NES,用于在真核细胞(例如,人细胞)中进行最佳表达和核靶向。
在一些实施方式中,所述工程化的2类VI型Cas13效应子(例如基本上缺乏附带活性或具有增强的附带活性的那些)在一个或多个氨基酸残基处突变以改变一种或多种功能性活性。
例如,在一些实施方式中,所述工程化的2类VI型Cas13效应子(例如基本上缺乏附带活性或具有增强的附带活性的那些)在一个或多个氨基酸残基处突变以改变其解旋酶活性。
在一些实施方式中,所述工程化的2类VI型Cas13效应子(例如基本上缺乏附带活性或具有增强的附带活性的那些)在一个或多个氨基酸残基处突变以改变其核酸酶活性(例如,内切核酸酶活性或外切核酸酶活性),如不依赖于指导序列的附带核酸酶活性。
在一些实施方式中,所述工程化的2类VI型Cas13效应子(例如基本上缺乏附带活性或具有增强的附带活性的那些)在一个或多个氨基酸残基处突变以改变其与指导RNA功能性缔合的能力。
在一些实施方式中,所述工程化的2类VI型Cas13效应子(例如基本上缺乏附带活性或具有增强的附带活性的那些)在一个或多个氨基酸残基处突变以改变其与靶核酸功能性缔合的能力。
在一些实施方式中,本文描述的工程化的2类VI型Cas13效应子(例如基本上缺乏附带活性或具有增强的附带活性的那些)能够切割靶RNA分子。
在一些实施方式中,所述工程化的2类VI型Cas13效应子(例如基本上缺乏附带活性或具有增强的附带活性的那些)在一个或多个氨基酸残基处突变以改变其切割活性。例如,在一些实施方式中,所述工程化的2类VI型Cas13效应子(例如基本上缺乏附带活性或具有增强的附带活性的那些)可以包含一个或多个突变,所述突变使酶不能切割靶核酸。
在一些实施方式中,所述工程化的2类VI型Cas13效应子(例如基本上缺乏附带活性或具有增强的附带活性的那些)能够切割与指导RNA杂交的链互补的靶核酸链。
在一些实施方式中,本文描述的工程化的2类VI型Cas13效应子(例如基本上缺乏附带活性或具有增强的附带活性的那些)可以经工程化以具有一个或多个氨基酸残基的缺失,以减小酶的大小,同时保留一种或多种所希望的功能性活性(例如,核酸酶活性和与指导RNA功能上相互作用的能力)。截短的工程化的2类VI型Cas13效应子(例如基本上缺乏附带活性或具有增强的附带活性的那些)可以有利地与具有负载限制的递送系统组合使用。
在一些实施方式中,本文描述的工程化的2类VI型Cas13效应子(例如基本上缺乏附带活性或具有增强的附带活性的那些)可以与一种或多种肽标签,包括His标签、GST标签、V5标签、FLAG标签、HA标签、VSV-G标签、Trx标签或myc标签融合。
在一些实施方式中,本文描述的工程化的2类VI型Cas13效应子(例如基本上缺乏附带活性或具有增强的附带活性的那些)可以与可检测部分,例如GST、荧光蛋白(例如GFP、HcRed、DsRed、CFP、YFP或BFP)或酶(如HRP或CAT)融合。
在一些实施方式中,本文描述的工程化的2类VI型Cas13效应子(例如基本上缺乏附带活性或具有增强的附带活性的那些)可以与MBP、LexA DNA结合结构域或Gal4 DNA结合结构域融合。
在一些实施方式中,本文描述的工程化的2类VI型Cas13效应子(例如基本上缺乏附带活性或具有增强的附带活性的那些)可以与可检测标记(如荧光染料,包括FITC和DAPI)连接或缀合。
在本文的任一实施方式中,本文描述的工程化的2类VI型Cas13效应子(例如基本上缺乏附带活性或具有增强的附带活性的那些)与其他部分之间的连接可以经由共价化学键在所述CRISPR相关蛋白的N-末端或C-末端处,并且有时甚至在内部。所述连接可以被本领域已知的任何化学连接影响,所述化学连接例如肽连接、通过氨基酸(如D、E、S、T)的侧链或氨基酸衍生物(Ahx、β-Ala、GABA或Ava)连接、或PEG连接。
3.多核苷酸
本发明还提供编码本文描述的蛋白(例如,工程化的2类VI型Cas13蛋白,例如基本上缺乏附带活性或具有增强的附带活性的那些)的核酸。
在一些实施方式中,所述核酸是合成的核酸。在一些实施方式中,所述核酸是DNA分子。在一些实施方式中,所述核酸是RNA分子(例如,编码所述工程化的2类VI型Cas13蛋白(例如基本上缺乏附带活性或具有增强的附带活性的那些)、其衍生物或功能性片段的mRNA分子)。在一些实施方式中,将所述mRNA加帽、聚腺苷酸化、用5-甲基胞苷取代、用假尿苷取代、或其组合。
在一些实施方式中,所述核酸(例如,DNA)与调节元件(例如,启动子)可操作地连接以控制所述核酸的表达。在一些实施方式中,所述启动子是组成型启动子。在一些实施方式中,所述启动子是诱导型启动子。在一些实施方式中,所述启动子是细胞特异性启动子。在一些实施方式中,所述启动子是生物特异性启动子。
合适的启动子是本领域已知的并且包括例如pol I启动子、pol II启动子、polIII启动子、T7启动子、U6启动子、H1启动子、逆转录病毒劳斯肉瘤病毒LTR启动子、巨细胞病毒(CMV)启动子、SV40启动子、二氢叶酸还原酶启动子和β-肌动蛋白启动子。例如,U6启动子可用于调节本文描述的指导RNA分子的表达。
在一些实施方式中,一个或多个核酸存在于载体(例如,病毒载体或噬菌体)中。所述载体可以是克隆载体或表达载体。所述载体可以是质粒、噬菌粒、粘粒等。所述载体可以包括一个或多个允许所述载体在目的细胞(例如,细菌细胞或哺乳动物细胞)中繁殖的调节元件。在一些实施方式中,所述载体包括编码本文描述的CRISPR相关(Cas)系统的单个组分的核酸。在一些实施方式中,所述载体包括多个核酸,每个核酸编码本文描述的CRISPR相关(Cas)系统的组分。
在一个方面,本披露提供与本文描述的核酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核酸序列,即,编码如下的核酸序列:基本上缺乏附带活性的工程化的2类VI型Cas13蛋白、衍生物、功能性片段、或包括DR序列的指导/crRNA。
在另一方面,本披露还提供编码如下氨基酸序列的核酸序列,所述氨基酸序列与基本上缺乏附带活性的主题工程化的2类VI型Cas13蛋白的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性。
在一些实施方式中,所述核酸序列具有至少一部分(例如,至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、30、40、50、60、70、80、90或100个核苷酸,例如,连续或非连续核苷酸)与本文描述的序列相同。在一些实施方式中,所述核酸序列具有至少一部分(例如,至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、30、40、50、60、70、80、90或100个核苷酸,例如,连续或非连续核苷酸)与本文描述的序列不同。
在相关的实施方式中,本发明提供如下氨基酸序列,所述氨基酸序列具有至少一部分(例如,至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、30、40、50、60、70、80、90或100个氨基酸残基,例如,连续或非连续氨基酸残基)与本文描述的序列相同。在一些实施方式中,所述氨基酸序列具有至少一部分(例如,至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、30、40、50、60、70、80、90或100个氨基酸残基,例如,连续或非连续氨基酸残基)与本文描述的序列不同。
为了确定两个氨基酸序列或两个核酸序列的同一性百分比,出于最佳比较目的对序列进行比对(例如,可以在第一和第二氨基酸或核酸序列的一者或两者中引入空位以用于最佳比对,并且出于比较目的可以忽略非同源序列)。一般来说,出于比较目的而比对的参考序列的长度应是参考序列长度的至少80%,并且在一些实施方式中是参考序列长度的至少90%、95%或100%。然后比较对应的氨基酸位置或核苷酸位置处的氨基酸残基或核苷酸。当第一序列中的位置被与第二序列中的对应位置相同的氨基酸残基或核苷酸占据时,则分子在该位置处是相同的。将空位的数量和每个空位的长度考虑在内,两个序列之间的同一性百分比是所述序列共享的相同位置的数量的函数,需要引入所述空位以进行所述两个序列的最佳比对。出于本披露的目的,序列的比较和两个序列之间同一性百分比的确定可以使用具有空位罚分12、空位延伸罚分4、以及移码空位罚分5的Blosum 62评分矩阵来完成。
本文描述的蛋白(例如,基本上缺乏附带活性的工程化的2类VI型Cas13蛋白)可以作为核酸分子或多肽递送或使用。
在某些实施方式中,编码所述工程化的2类VI型Cas13蛋白(例如基本上缺乏附带活性或具有增强的附带活性的那些)、其衍生物或功能性片段的核酸分子经密码子优化以在宿主细胞或生物中表达。所述宿主细胞可以包括已建立的细胞系(如293T细胞)或分离的原代细胞。所述核酸可以经密码子优化以用于在任何目的生物(特别是人细胞或细菌)中使用。例如,所述核酸可以针对以下进行密码子优化:任何原核生物(如大肠杆菌)或任何真核生物,如人和其他非人真核生物,包括酵母、蠕虫、昆虫、植物和藻类(包括粮食作物、稻、玉米、蔬菜、水果、树木、草)、脊椎动物、鱼、非人哺乳动物(例如,小鼠、大鼠、兔子、狗、鸟(如鸡)、牲畜(母牛或牛、猪、马、绵羊、山羊等)、或非人灵长类动物)。密码子使用表易于获得,例如在www.kazusa.orjp/codon/上可获得的“密码子使用数据库(Codon UsageDatabase)”中,并且这些表能以多种方式进行调整。参见Nakamura等人,Nucl.Acids Res.[核酸研究]28:292,2000(将所述文献通过引用以其全文并入本文)。用于密码子优化特定序列以在特定宿主细胞中表达的计算机算法也是可获得的,如基因制造(Gene Forge)(Aptagen公司;宾夕法尼亚州雅各布斯(Jacobus,Pa))。
在这种情况下,经密码子优化的序列的实例是经优化以在以下中表达的序列:真核生物,例如人(即,经优化以在人中表达),或如本文所讨论的另一真核生物、动物或哺乳动物;参见例如,WO 2014/093622(PCT/US2013/074667)中的经SaCas9人密码子优化的序列。尽管这是优选的,但应理解其他实例是可能的,并且针对人以外的宿主物种的密码子优化或针对特定器官的密码子优化是已知的。一般来说,密码子优化是指在维持天然氨基酸序列的情况下通过以下方式修饰核酸序列以增强在目的宿主细胞中的表达的方法:用该宿主细胞的基因中更频繁使用或最频繁使用的密码子替代天然序列的至少一个密码子(例如,约或超过约1、2、3、4、5、10、15、20、25、50或更多个密码子)。多种物种对特定氨基酸的某些密码子展现出特定偏倚。密码子偏倚(生物之间密码子使用的差异)通常与信使RNA(mRNA)的翻译效率相关,而所述信使RNA(mRNA)的翻译效率又被认为尤其依赖于经翻译的密码子的特性和特定的转移RNA(tRNA)分子的可获得性。选定的tRNA在细胞中的优势通常反映出肽合成中最频繁使用的密码子。相应地,可以对基因进行定制以基于密码子优化在给定生物中实现最佳基因表达。密码子使用表易于获得,例如在http://www.kazusa.orjp/codon/上可获得的“密码子使用数据库”中,并且这些表能以多种方式进行调整。参见Nakamura,Y.等人“Codon usage tabulated from the international DNA sequencedatabases:status for the year 2000[从国际DNA序列数据库中制表的密码子使用:2000年的状态]”Nucl.Acids Res.[核酸研究]28:292(2000)。用于密码子优化特定序列以在特定宿主细胞中表达的计算机算法也是可获得的,如基因制造(Aptagen公司;宾夕法尼亚州雅各布斯)也是可获得的。在一些实施方式中,编码Cas的序列中的一个或多个密码子(例如,1、2、3、4、5、10、15、20、25、50或更多个或所有密码子)对应于特定氨基酸最频繁使用的密码子。
4.RNA指导物或crRNA
在一些实施方式中,本文描述的CRISPR系统包括至少RNA指导物(例如,gRNA或crRNA)。
多种RNA指导物的架构是本领域已知的(参见例如,国际公布号WO 2014/093622和WO 2015/070083,将各个文献的全部内容通过引用并入本文)。
在一些实施方式中,本文描述的CRISPR系统包括多种RNA指导物(例如,一种、两种、三种、四种、五种、六种、七种、八种或更多种RNA指导物)。
在一些实施方式中,所述RNA指导物包括crRNA。在一些实施方式中,所述RNA指导物包括crRNA,但不包括tracrRNA。
来自多个CRISPR系统的指导RNA的序列在本领域中通常是已知的,参见例如Grissa等人(Nucleic Acids Res.[核酸研究]35(网页服务器议题):W52-7,2007;Grissa等人,BMC Bioinformatics[BMC生物信息学]8:172,2007;Grissa等人,Nucleic Acids Res.[核酸研究]36(网页服务器议题):W145-8,2008;以及Moller和Liang,PeerJ[同行评审科学期刊]5:e3788,2017;在crispr.i2bc.paris-saclayfr/crispr/BLAST/CRISPRsBlast.php处的CRISPR数据库;以及在github.com/molleraj/MetaCRAST处可获得的MetaCRAST)。将所有文献通过引用并入本文。
在一些实施方式中,所述crRNA包括同向重复(DR)序列和间隔序列。在某些实施方式中,所述crRNA包含如下同向重复序列、基本上由其组成或由其组成,所述同向重复序列与指导序列或间隔序列(优选地在所述间隔序列的3’端处)连接。
一般来说,工程化的2类VI型Cas13蛋白(例如基本上缺乏附带活性或具有增强的附带活性的那些)与成熟的crRNA形成复合物,所述成熟的crRNA的间隔序列引导所述复合物与靶RNA序列特异性结合,所述靶RNA与所述间隔序列互补和/或与所述间隔序列杂交。所得的复合物包含所述工程化的2类VI型Cas13蛋白(例如基本上缺乏附带活性或具有增强的附带活性的那些)和与所述靶RNA结合的成熟的crRNA。
所述Cas13系统的同向重复序列通常非常保守,尤其是在末端处,例如,在5’端处的Cas13e的GCTG和Cas13f的GCTGT与在3’端处的Cas13e的CAGC和Cas13f的ACAGC反向互补。这种保守表明潜在地与基因座中的一种或多种蛋白相互作用的RNA茎环结构的强碱基配对。
在一些实施方式中,当在RNA中时,同向重复序列包含5’-S1a-Ba-S2a-L-S2b-Bb-S1b-3’的一般二级结构,其中区段S1a和S1b是反向互补序列并形成第一茎(S1),所述第一茎(S1)具有在Cas13e中的4个核苷酸和在Cas13f中的5个核苷酸;区段Ba和Bb不相互碱基配对,并形成对称的或接近对称的凸起(B),并且各具有在Cas13e中的5个核苷酸、以及分别在Cas13f中的5个(Ba)和4个(Bb)或6个(Ba)和5个(Bb)核苷酸;区段S2a和S2b是反向互补序列并形成第二茎(S2),所述第二茎(S2)具有在Cas13e中的5个碱基对和在Cas13f中的6或5个碱基对;并且L是在Cas13e中的8个核苷酸的环和在Cas13f中的5个核苷酸的环。
在某些实施方式中,S1a具有在Cas13e中的GCUG序列和在Cas13f中的GCUGU序列。
在某些实施方式中,S2a具有在Cas13e中的GCCCC序列和在Cas13f中的A/GCCUC G/A序列(其中第一个A或G可以不存在)。
在一些实施方式中,所述同向重复序列包含SEQ ID NO:57-63的核酸序列或由其组成。
如本文所用,“同向重复序列”可指CRISPR基因座中的DNA编码序列,或指在crRNA中由其编码的RNA。因此,当在RNA分子(如crRNA)的上下文中提到SEQ ID NO:57-63中的任一者时,每个T应理解为代表U。
在一些实施方式中,所述同向重复序列包含如下核酸序列或由其组成,所述核酸序列具有SEQ ID NO:57-63的多达1、2、3、4、5、6、7或8个核苷酸的缺失、插入或取代。在一些实施方式中,所述同向重复序列包含如下核酸序列或由其组成,所述核酸序列与SEQ IDNO:57-63具有至少80%、85%、90%、95%或97%的序列同一性(例如,由于SEQ ID NO:57-63中核苷酸的缺失、插入或取代)。在一些实施方式中,所述同向重复序列包含如下核酸序列或由其组成,所述核酸序列与SEQ ID NO:57-63中的任一者不同,但可以在严格杂交条件下与SEQ ID NO:57-63中的任一者的互补序列杂交,或者可以在生理条件下与SEQ ID NO:57-63中的任一者的互补序列结合。
在某些实施方式中,所述缺失、插入或取代不改变SEQ ID NO:57-63的总体二级结构(例如,茎和凸起及环的相对位置和/或大小不显著偏离原始茎、凸起和环的相对位置和/或大小)。例如,所述缺失、插入或取代可以在所述凸起或环区中,使得所述凸起的总体对称性大致保持相同。所述缺失、插入或取代可以在所述茎中,使得所述茎的长度不显著偏离原始茎的长度(例如,在两个茎的每一个中添加或缺失一个碱基对对应于总共4个碱基变化)。
在某些实施方式中,所述缺失、插入或取代导致衍生性DR序列,所述衍生性DR序列可在一个或两个茎中具有±1或2个碱基对,在所述凸起的一条或两条单链中具有±1、2或3个碱基,和/或在所述环区中具有±1、2、3或4个碱基。
在某些实施方式中,与SEQ ID NO:57-63中的任一者不同的任一上述同向重复序列保留在所述Cas13e或Cas13f蛋白中作为同向重复序列(作为SEQ ID NO:57-63的DR序列)发挥作用的能力。
在一些实施方式中,所述同向重复序列包含如下核酸或由其组成,所述核酸具有SEQ ID NO:57-63中的任一者的核酸序列,且具有初始三个、四个、五个、六个、七个或八个3’核苷酸的截短。
在经典的CRISPR系统中,指导序列(例如,crRNA)与其对应的靶序列之间的互补程度可以是约50%、60%、75%、80%、85%、90%、95%、97.5%、99%或100%。在一些实施方式中,所述互补程度是90%-100%。
指导RNA的长度可以是约5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75、100、125、150、175、200或更多个核苷酸。例如,为了在功能性工程化的Cas13e或Cas13f效应蛋白、或其同源物、直系同源物、衍生物、融合物、缀合物或功能性片段中使用,间隔子可以在10-60个核苷酸、20-50个核苷酸、25-45个核苷酸、25-35个核苷酸之间,或为约27、28、29、30、31、32或33个核苷酸。然而,为了在上述任一者的dCas版本中使用,间隔子可以在10-200个核苷酸、20-150个核苷酸、25-100个核苷酸、25-85个核苷酸、35-75个核苷酸、45-60个核苷酸之间,或为约46、47、48、49、50、51、52、53、54或55个核苷酸。
为了减少脱靶相互作用,例如,为了减少指导物与具有低互补性的靶序列相互作用,可以将突变引入所述CRISPR系统中,使得所述CRISPR系统可以区分具有大于80%、85%、90%或95%互补性的靶序列与脱靶序列。在一些实施方式中,所述互补程度为从80%至95%,例如,约83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%或95%(例如,区分具有18个核苷酸的靶标与具有1、2或3个错配的18个核苷酸的脱靶)。相应地,在一些实施方式中,指导序列与其对应的靶序列之间的互补程度大于94.5%、95%、95.5%、96%、96.5%、97%、97.5%、98%、98.5%、99%、99.5%或99.9%。在一些实施方式中,所述互补程度是100%。
本领域已知不需要完全的互补性,前提是有足够的互补性发挥作用。可以通过引入错配(例如,间隔序列与靶序列之间的一个或多个错配,如1或2个错配(包括沿着间隔子/靶标的错配的位置))来利用对切割效率的调节。错配(例如,双错配)位于越中心的位置(即,不在3’端或5’端处),切割效率受到的影响越大。相应地,通过选择沿着所述间隔序列的错配位置,可以调节切割效率。例如,如果希望靶标切割小于100%(例如,在细胞群中),可以在所述间隔序列中引入在间隔子和靶序列之间的1或2个错配。
已表明VI型CRISPR-Cas效应子采用多于一种RNA指导物,从而使这些效应子以及包括它们的系统和复合物能够实现靶向多个核酸的能力。在一些实施方式中,如本文描述的包含所述工程化的2类VI型Cas13蛋白(例如基本上缺乏附带活性或具有增强的附带活性的那些)的CRISPR系统包括多种RNA指导物(例如,两种、三种、四种、五种、六种、七种、八种、九种、十种、十五种、二十种、三十种、四十种或更多种RNA指导物)。在一些实施方式中,本文描述的CRISPR系统包括单条RNA链或编码单条RNA链的核酸,其中所述RNA指导物串联排列。所述单条RNA链可以包括相同RNA指导物的多个拷贝、不同RNA指导物的多个拷贝、或其组合。本文描述的VI-E型和VI-F型CRISPR-Cas效应蛋白的加工能力使这些效应子能够靶向多个靶核酸(例如,靶RNA)而不丧失活性。在一些实施方式中,所述VI-E型和VI-F型CRISPR-Cas效应蛋白可以与针对不同靶RNA的多种RNA指导物复合进行递送。在一些实施方式中,所述工程化的2类VI型Cas13蛋白(例如基本上缺乏附带活性或具有增强的附带活性的那些)可以与多种RNA指导物共同递送,每种RNA指导物对不同的靶核酸具有特异性。使用CRISPR相关蛋白进行多重复合(multiplexing)的方法描述于例如美国专利号9,790,490B2和EP3009511 B1中,将各个文献的全部内容通过引用明确并入本文。
crRNA的间隔子长度可以在约10-50个核苷酸的范围内,如15-50个核苷酸、20-50个核苷酸、25-50个核苷酸或19-50个核苷酸。在一些实施方式中,指导RNA的间隔子长度为至少16个核苷酸、至少17个核苷酸、至少18个核苷酸、至少19个核苷酸、至少20个核苷酸、至少21个核苷酸、或至少22个核苷酸。在一些实施方式中,所述间隔子长度为从15至17个核苷酸(例如,15、16或17个核苷酸)、从17至20个核苷酸(例如,17、18、19或20个核苷酸)、从20至24个核苷酸(例如,20、21、22、23或24个核苷酸)、从23至25个核苷酸(例如,23、24或25个核苷酸)、从24至27个核苷酸、从27至30个核苷酸、从30至45个核苷酸(例如,30、31、32、33、34、35、36、37、38、39、40、41、42、43、44或45个核苷酸)、从30或35至40个核苷酸、从41至45个核苷酸、从45至50个核苷酸(例如,45、46、47、48、49或50个核苷酸)或更长。在一些实施方式中,所述间隔子长度为从约15至约42个核苷酸。
在一些实施方式中,所述指导RNA的同向重复序列长度为15-36个核苷酸、为至少16个核苷酸、为从16至20个核苷酸(例如,16、17、18、19或20个核苷酸)、为20-30个核苷酸(例如,20、21、22、23、24、25、26、27、28、29或30个核苷酸)、为30-40个核苷酸(例如,30、31、32、33、34、35、36、37、38、39或40个核苷酸)、或为约36个核苷酸(例如,33、34、35、36、37、38或39个核苷酸)。在一些实施方式中,所述指导RNA的同向重复序列长度为36个核苷酸。
在一些实施方式中,所述crRNA/指导RNA的总体长度比上文任一间隔序列长度长约36个核苷酸。例如,所述crRNA/指导RNA的总体长度可以在45-86个核苷酸、或60-86个核苷酸、62-86个核苷酸、或63-86个核苷酸之间。
所述crRNA序列可以按以下方式修饰:允许在所述crRNA与所述工程化的2类VI型Cas13蛋白(例如基本上缺乏附带活性或具有增强的附带活性的那些)之间形成复合物并与靶标成功结合,同时不允许成功的核酸酶活性(即,没有核酸酶活性/没有导致插入缺失)。这些经修饰的指导序列称为“死crRNA”、“死指导物”或“死指导序列”。关于核酸酶活性,这些死指导物或死指导序列可以是无催化活性的或无构象活性的。死指导序列典型地比导致活性RNA切割的相应指导序列短。在一些实施方式中,死指导物比具有核酸酶活性的相应指导RNA短5%、10%、20%、30%、40%或50%。指导RNA的死指导序列的长度可以为从13至15个核苷酸(例如,长度为13、14或15个核苷酸)、长度为从15至19个核苷酸、或长度为从17至18个核苷酸(例如,长度为17个核苷酸)。
因此,在一个方面,本披露提供非天然存在的或工程化的CRISPR系统,所述CRISPR系统包括如本文描述的功能性工程化的2类VI型Cas13蛋白(例如基本上缺乏附带活性或具有增强的附带活性的那些)和crRNA,其中所述crRNA包含死crRNA序列,由此所述crRNA能够与靶序列杂交,使得将所述CRISPR系统引导至细胞中的目的靶RNA而没有可检测的核酸酶活性(例如,RNA酶活性)。
对死指导物的详细描述例如在国际公布号WO 2016/094872中进行描述,将所述文献通过引用以其全文并入本文。
可以生成作为诱导型系统的组分的指导RNA(例如,crRNA)。所述系统的诱导型性质允许对基因编辑或基因表达进行时空控制。在一些实施方式中,用于所述诱导型系统的刺激包括例如电磁辐射、声能、化学能和/或热能。
在一些实施方式中,指导RNA(例如,crRNA)的转录可以通过诱导型启动子,例如四环素或强力霉素控制的转录激活(Tet-开和Tet-关表达系统)、激素诱导型基因表达系统(例如,蜕皮素诱导型基因表达系统)和阿拉伯糖诱导型基因表达系统来调节。诱导型系统的其他实例包括例如小分子双杂交转录激活系统(FKBP、ABA等)、光诱导型系统(光敏色素、LOV结构域或隐花色素)或光诱导型转录效应子(LITE)。这些诱导型系统描述于例如WO2016205764和美国专利号8,795,965中,将所述两个文献通过引用以其全文并入本文。
化学修饰可以应用于crRNA的磷酸骨架、糖和/或碱基。骨架修饰(如硫代磷酸酯)修饰磷酸骨架上的电荷并有助于寡核苷酸的递送和核酸酶抗性(参见例如,Eckstein,“Phosphorothioates,essential components of therapeutic oligonucleotides[硫代磷酸酯:治疗性寡核苷酸的必要组分],”Nucl.Acid Ther.[核酸疗法],24,第374-387页,2014);糖的修饰(如2’-O-甲基(2’-OMe)、2’-F和锁核酸(LNA))增强碱基配对和核酸酶抗性两者(参见例如,Allerson等人“Fully 2’-modified oligonucleotide duplexes withimproved in vitro potency and stability compared to unmodified smallinterfering RNA[与未经修饰的小干扰RNA相比,完全2’修饰的寡核苷酸双链体具有改善的体外效力和稳定性],”J.Med.Chem.[药物化学杂志]48.4:901-904,2005)。化学修饰的碱基(如2-硫代尿苷或N6-甲基腺苷等)可允许更强或更弱的碱基配对(参见例如,Bramsen等人,“Development of therapeutic-grade small interfering RNAs by chemicalengineering[通过化学工程开发治疗级小干扰RNA],”Front.Genet.[遗传学前沿],2012年8月20日;3:154)。另外,RNA适于5’端和3’端两者与多种功能性部分(包括荧光染料、聚乙二醇或蛋白)缀合。
可以对化学合成的crRNA分子应用多种修饰。例如,用2’-OMe修饰寡核苷酸以改善核酸酶抗性可以改变沃森-克里克(Watson-Crick)碱基配对的结合能。此外,2’-OMe修饰可以影响寡核苷酸与转染试剂、蛋白或细胞中任何其他分子相互作用的方式。这些修饰的效果可以通过经验测试来确定。
在一些实施方式中,所述crRNA包括一个或多个硫代磷酸酯修饰。在一些实施方式中,所述crRNA包括用于增强碱基配对和/或增加核酸酶抗性目的的一个或多个锁核酸。
这些化学修饰的汇总可见于例如Kelley等人,“Versatility of chemicallysynthesized guide RNAs for CRISPR-Cas9 genome editing[用于CRISPR-Cas9基因组编辑的化学合成的指导RNA的多功能性],”J.Biotechnol.[生物技术杂志]233:74-83,2016;WO 2016205764;和美国专利号8,795,965B2中;将各个文献通过引用以其全文并入。
可以优化本文描述的RNA指导物(例如,crRNA)的序列和长度。在一些实施方式中,RNA指导物的优化长度可以通过鉴定crRNA的加工形式(即,成熟的crRNA)或通过对crRNA四环的经验长度研究来确定。
所述crRNA还可以包括一个或多个适配序列。适配子是具有特定的三维结构并可以与特定的靶分子结合的寡核苷酸或肽分子。所述适配子可以对基因效应子、基因激活子或基因阻遏子具有特异性。在一些实施方式中,所述适配子可以对蛋白具有特异性,而所述蛋白又对特定的基因效应子、基因激活子或基因阻遏子具有特异性并对其进行募集和/或与其结合。所述效应子、激活子或阻遏子能够以融合蛋白的形式存在。在一些实施方式中,所述指导RNA具有对相同的衔接蛋白具有特异性的两个或更多个适配序列。在一些实施方式中,所述两个或更多个适配序列对不同的衔接蛋白具有特异性。所述衔接蛋白可以包括例如MS2、PP7、Qβ、F2、GA、fr、JP501、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、φkCb5、φkCb8r、φkCb12r、φkCb23r、7s和PRR1。相应地,在一些实施方式中,所述适配子选自特异性结合如本文描述的任一种衔接蛋白的结合蛋白。在一些实施方式中,所述适配序列是MS2结合环(SEQ ID NO:95)。在一些实施方式中,所述适配序列是Qβ结合环(SEQ ID NO:96)。在一些实施方式中,所述适配序列是PP7结合环(SEQID NO:97)。对适配子的详细描述可见于例如Nowak等人,“Guide RNA engineering forversatile Cas9 functionality[针对多种Cas9功能的指导RNA工程化],”Nucl.Acid.Res.[核酸研究],44(20):9555-9564,2016;和WO 2016205764中,将所述文献通过引用以其全文并入本文。
在某些实施方式中,所述方法利用化学修饰的指导RNA。指导RNA化学修饰的实例包括但不限于在一个或多个末端核苷酸处掺入2’-O-甲基(M)、2’-O-甲基3’-硫代磷酸酯(MS)、或2’-O-甲基3’-硫基PACE(MSP)。与未经修饰的指导RNA相比,这样的化学修饰的指导RNA可以具有增加的稳定性和增加的活性,尽管中靶相对于脱靶特异性是不可预测的。参见Hendel,Nat Biotechnol.[自然生物技术]33(9):985-9,2015,将所述文献通过引用并入。化学修饰的指导RNA可进一步包括但不限于具有硫代磷酸酯键和锁核酸(LNA)核苷酸的RNA,所述锁核酸(LNA)核苷酸包含在核糖环的2’与4’碳之间的亚甲基桥。
本发明还涵盖用于递送多种核酸组分的方法,其中每种核酸组分对不同的目的靶基因座具有特异性,从而修饰多种目的靶基因座。复合物的核酸组分可以包含一个或多个蛋白结合RNA适配子。所述一个或多个适配子能够结合噬菌体外壳蛋白。所述噬菌体外壳蛋白可以选自Qβ、F2、GA、fr、JP501、MS2、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、φCb5、φCb8r、φCb12r、φCb23r、7s和PRR1。在某些实施方式中,所述噬菌体外壳蛋白是MS2。
5.靶RNA
所述靶RNA可以是任何目的RNA分子,包括天然存在的和工程化的RNA分子。所述靶RNA可以是mRNA、tRNA、核糖体RNA(rRNA)、微小RNA(miRNA)、干扰RNA(siRNA)、核酶、核糖开关、卫星RNA、微开关、微酶(microzyme)或病毒RNA。
在一些实施方式中,所述靶核酸与病症或疾病(例如,感染性疾病或癌症)相关。
因此,在一些实施方式中,本文描述的系统可用于通过靶向这些核酸来治疗病症或疾病。例如,与病症或疾病相关的靶核酸可以是在患病细胞(例如,癌细胞或肿瘤细胞)中过表达的RNA分子。所述靶核酸也可以是毒性RNA和/或突变的RNA(例如,具有剪接缺陷或突变的mRNA分子)。所述靶核酸还可以是对特定微生物(例如,致病性细菌)具有特异性的RNA。
6.复合物和细胞
本发明的一个方面提供工程化的2类VI型Cas13蛋白(例如基本上缺乏附带活性或具有增强的附带活性的那些)的复合物(如CRISPR/Cas13e或CRISPR/Cas13f复合物),所述复合物包含(1)工程化的2类VI型Cas13蛋白,例如基本上缺乏附带活性或具有增强的附带活性的那些(例如,如本文描述的工程化的Cas13e/Cas13f效应蛋白、其同源物、直系同源物、融合物、衍生物、缀合物、或功能性片段)中的任一者,和(2)本文描述的任一指导RNA,每个指导RNA包括设计为与靶RNA至少部分互补的间隔序列和与以下相容的DR序列:所述工程化的2类VI型Cas13蛋白,例如基本上缺乏附带活性或具有增强的附带活性的那些(例如,Cas13d、Cas13e/Cas13f效应蛋白)、其同源物、直系同源物、融合物、衍生物、缀合物、或功能性片段。
在某些实施方式中,所述复合物进一步包含所述指导RNA结合的靶RNA。
在相关方面,本发明还提供细胞,所述细胞包含本发明的任一复合物。在某些实施方式中,所述细胞是原核生物。在某些实施方式中,所述细胞是真核生物。
7.使用CRISPR系统的方法
如本文描述的具有工程化的Cas13(例如,工程化的2类VI型Cas13)蛋白(例如基本上缺乏附带活性或具有增强的附带活性的那些)的CRISPR/Cas系统具有多种类似基于对应的野生型Cas13的系统的效用,包括在多种细胞类型中修饰(例如,缺失、插入、易位、灭活或激活)靶多核苷酸或核酸。所述CRISPR系统在以下方面具有广泛的应用:例如核酸的跟踪和标记、富集测定(从背景提取所希望的序列)、控制干扰RNA或miRNA、检测循环肿瘤DNA、制备下一代文库、药物筛选、疾病诊断和预后、以及治疗各种遗传障碍。
与野生型相比,如本文描述的某些工程化的Cas13效应酶具有增强的附带效果,并因此对于利用增强的附带活性的效用(如DNA/RNA检测(例如,特异性高灵敏度酶促报告子解锁(SHERLOCK)))来说可以是比野生型Cas13效应酶更好的替代物。这样的附带活性增强的工程化的Cas13效应酶在本发明的一个方面的范围内。
RNA检测
在一个方面,本文描述的CRISPR系统可用于RNA检测中。如实施例中所示,当间隔序列为约30个核苷酸时,本发明的野生型Cas13(如Cas13e)在其指导RNA依赖性特异性RNA酶活性激活后展现出非特异性/附带RNA酶活性。因此,附带活性增强的(与野生型相比)本发明的工程化的CRISPR相关蛋白可以用CRISPR RNA(crRNA)重新编程以提供用于特定RNA感应的平台。此外,通过选择特定的间隔序列长度,并在识别其RNA靶标后,激活的CRISPR相关蛋白参与附近非靶向的RNA的增强的附带切割。这种crRNA编程的附带切割活性允许所述CRISPR系统通过触发程序性细胞死亡或通过经标记的RNA的非特异性降解来检测特定RNA的存在。
SHERLOCK方法(特异性高灵敏度酶促报告子解锁)提供基于报告RNA的核酸扩增和附带切割的具有渺摩尔(attomolar)灵敏度的体外核酸检测平台,从而允许实时检测靶标。为了实现信号检测,可以将检测与不同的等温扩增步骤组合。例如,重组酶聚合酶扩增(RPA)可以与T7转录偶联,以将扩增的DNA转化为RNA,用于后续检测。通过RPA进行扩增、T7RNA聚合酶将扩增的DNA转录为RNA、以及通过附带RNA切割介导的报告信号释放检测靶RNA的组合称为SHERLOCK。在SHERLOCK中使用CRISPR的方法详细描述于例如Gootenberg等人“Nucleic acid detection with CRISPR-Cas13a/C2c2[用CRISPR-Cas13a/C2c2进行核酸检测],”Science[科学],2017年4月28日;356(6336):438-442中,将所述文献通过引用以其全文并入本文。
本文描述的本发明提供突变体/变体2类VI型CRISPR/Cas效应酶,尤其是VI-D型、VI-E型和VI-F型Cas突变体/变体,其具有增强的附带效果,使得它们可以在基于附带效果的核酸检测测定(如SHERLOCK测定)中更有效。这样的突变体包括在实施例1、2、4和5以及图6、7、9-14、17D、17E、19C和19D中描述的任何一个突变体,与对应的野生型Cas13相比,所述突变体具有至少80%、85%、或87.5%或更高的附带切割效率,以及任选地更好的gRNA指导的切割。
在某些实施方式中,这样的Cas13突变体具有增强的附带效果,包含对应于以下的突变、基本上由其组成、或由其组成:Cas13d的N2-Y142A、N4-Y193A、N12-Y604A或N21V7突变,或Cas13e的M14V2、M16V3、M18V1、M19-G712A、M19-T725A或M19-C727A突变。
所述CRISPR相关蛋白可用于RNA印迹测定中,所述测定使用电泳按大小分离RNA样品。所述CRISPR相关蛋白可用于特异性结合和检测靶RNA序列。所述CRISPR相关蛋白也可以与荧光蛋白(例如,GFP)融合,并用于跟踪活细胞中的RNA定位。更特别地,可以灭活所述CRISPR相关蛋白,因为它们不再如上所述切割RNA。因此,CRISPR相关蛋白可用于确定RNA或特定剪接变体的定位、mRNA转录物的水平、转录物的上调或下调以及疾病特异性诊断。所述CRISPR相关蛋白可用于(活)细胞中的RNA的可视化,例如使用荧光显微镜检查术或流式细胞术,如荧光激活细胞分选术(FACS),其允许对细胞进行高通量筛选和回收细胞分选后的活细胞。关于如何检测DNA和RNA的详细描述可见于例如国际公布号WO 2017/070605中,将所述文献通过引用以其全文并入本文。
在一些实施方式中,本文描述的CRISPR系统可用于多重抗错荧光原位杂交(multiplexed error-robust fluorescence in situ hybridization,MERFISH)。这些方法描述于例如Chen等人,“Spatially resolved,highly multiplexed RNA profiling insingle cells[在单细胞中进行空间分辨的高度多重化RNA分析],”Science[科学],2015年4月24日;348(6233):aaa6090,将所述文献通过在本文中引用以其全文并入本文。
在一些实施方式中,本文描述的CRISPR系统可用于检测样品(例如,临床样品、细胞或细胞裂解物)中的靶RNA。当间隔序列具有选定的特定长度(如约30个核苷酸)时,当本文描述的工程化的Cas13(例如,VI-E型和/或VI-F型CRISPR-Cas效应蛋白)与靶核酸结合时,所述效应蛋白的附带RNA酶活性受到激活。在与目的靶RNA结合后,所述效应蛋白切割经标记的检测RNA以生成信号(例如,增加的信号或减少的信号),从而允许对样品中的靶RNA进行定性和定量检测。样品中的RNA的特异性检测和定量允许包括诊断在内的多种应用。在一些实施方式中,所述方法包括使样品与以下接触:i)RNA指导物(例如,crRNA)和/或编码所述RNA指导物的核酸,其中所述RNA指导物由同向重复序列和能够与所述靶RNA杂交的间隔序列组成;(ii)与野生型Cas13相比附带活性增强的工程化的2类VI型Cas13蛋白(如主题工程化的VI-E型或VI-F型CRISPR-Cas效应蛋白(Cas13e或Cas13f))和/或编码所述效应蛋白的核酸;和(iii)经标记的检测RNA;其中所述效应蛋白与所述RNA指导物缔合以形成复合物;其中所述RNA指导物与所述靶RNA杂交;并且其中在所述复合物与所述靶RNA结合后,所述效应蛋白展现出附带RNA酶活性并切割所述经标记的检测RNA;以及b)测量通过所述经标记的检测RNA的切割产生的可检测信号,其中所述测量提供对所述样品中单链靶RNA的检测。在一些实施方式中,所述方法进一步包括将所述可检测信号与参考信号进行比较并确定所述样品中靶RNA的量。
在一些实施方式中,所述测量使用以下进行:金纳米颗粒检测、荧光偏振、胶体相变/分散、电化学检测和基于半导体的感应。在一些实施方式中,所述经标记的检测RNA包括荧光发射染料对、荧光共振能量转移(FRET)对或猝灭剂/荧光团对。在一些实施方式中,在所述经标记的检测RNA经所述效应蛋白切割后,由所述经标记的检测RNA产生的可检测信号的量减少或增加。在一些实施方式中,所述经标记的检测RNA在经所述效应蛋白切割之前产生第一可检测信号,并且在经所述效应蛋白切割之后产生第二可检测信号。在一些实施方式中,当所述经标记的检测RNA经所述效应蛋白切割时产生可检测信号。在一些实施方式中,所述经标记的检测RNA包含经修饰的核碱基、经修饰的糖部分、经修饰的核酸连接、或其组合。在一些实施方式中,所述方法包括通过使用多个本发明的工程化的Cas13(如工程化的VI-E型和/或VI-F型CRISPR-Cas(Cas13e和/或Cas13f))系统,对样品中的多个独立靶RNA(例如,两个、三个、四个、五个、六个、七个、八个、九个、十个、十五个、二十个、三十个、四十个或更多个靶RNA)进行多通道检测,每个所述系统包括不同的直系同源效应蛋白和对应的RNA指导物,从而允许区分所述样品中的多个靶RNA。在一些实施方式中,所述方法包括使用本发明的工程化的Cas13(如工程化的VI-E型和/或VI-F型CRISPR-Cas)系统的多个实例,对样品中的多个独立靶RNA进行多通道检测,每个所述实例含有具有可区分的附带RNA酶底物的直系同源效应蛋白。使用CRISPR相关蛋白检测样品中的RNA的方法描述于例如美国专利公布号2017/0362644中,将所述文献的全部内容通过引用并入本文。
核酸的跟踪和标记
细胞过程依赖于蛋白、RNA和DNA间的分子相互作用网络。准确检测蛋白-DNA和蛋白-RNA相互作用是理解这样的过程的关键。体外邻近标记技术采用与报告基团(例如,可光激活基团)组合的亲和标签,以在体外标记目的蛋白或RNA附近的多肽和RNA。在UV辐照后,所述可光激活基团与紧邻加标签分子的蛋白和其他分子发生反应,从而标记它们。随后可回收和鉴定经标记的相互作用分子。例如,所述CRISPR相关蛋白可用于将探针靶向选定的RNA序列。这些应用也可以应用于动物模型中,用于疾病或难以培养的细胞类型的体内成像。跟踪和标记核酸的方法描述于例如美国专利号8,795,965、WO 2016205764和WO2017070605中;将各个文献通过本文引用以其全文并入本文。
RNA分离、纯化、富集和/或耗竭
本文描述的CRISPR系统(例如,CRISPR相关蛋白)可用于分离和/或纯化RNA。可以将所述CRISPR相关蛋白与亲和标签融合,所述亲和标签可用于分离和/或纯化RNA-CRISPR相关蛋白复合物。这些应用例如可用于分析细胞中的基因表达谱。
在一些实施方式中,所述CRISPR相关蛋白可用于靶向特定的非编码RNA(ncRNA),从而阻断其活性。在一些实施方式中,所述CRISPR相关蛋白可用于特异性富集特定RNA(包括但不限于增加稳定性等),或替代性地,特异性耗竭特定RNA(例如,特定的剪接变体、同种型等)。
这些方法描述于例如美国专利号8,795,965、WO 2016205764和WO 2017070605中;将各个文献通过本文引用以其全文并入本文。
高通量筛选
本文描述的CRISPR系统可用于制备下一代测序(NGS)文库。例如,为了创建有成本效益的NGS文库,可以使用所述CRISPR系统破坏靶基因产物的编码序列,并且可以通过下一代测序(例如,在离子激流(Ion Torrent)PGM系统上)同时筛选经所述CRISPR相关蛋白转染的克隆。关于如何制备NGS文库的详细描述可见于例如Bell等人,“A high-throughputscreening strategy for detecting CRISPR-Cas9 induced mutations using next-generation sequencing[用于使用下一代测序检测CRISPR-Cas9诱导的突变的高通量筛选策略],”BMC Genomics[BMC基因组学],15.1(2014):1002,将所述文献通过引用以其全文并入本文。
工程化的微生物
微生物(例如,大肠杆菌、酵母和微藻)广泛用于合成生物学。合成生物学的发展具有广泛的效用,包括各种临床应用。例如,可编程CRISPR系统可以用于拆分具有用于靶向细胞死亡的毒性结构域的蛋白,例如使用癌症关联的RNA作为靶转录物。此外,涉及蛋白-蛋白相互作用的途径可以在使用例如与适当效应子(如激酶或酶)的融合复合物的合成生物系统中受到影响。
在一些实施方式中,可以将靶向噬菌体序列的crRNA引入微生物中。因此,本披露还提供针对噬菌体感染接种微生物(例如,生产菌株)的方法。
在一些实施方式中,本文提供的CRISPR系统可用于对微生物进行工程化,例如以改善产率或改善发酵效率。例如,本文描述的CRISPR系统可用于对微生物(如酵母)进行工程化,以从可发酵糖生成生物燃料或生物聚合物,或降解源自作为可发酵糖的来源的农业废弃物的植物衍生的木质纤维素。更特别地,本文描述的方法可用于修饰生物燃料生产所需的内源性基因的表达和/或修饰可能干扰生物燃料合成的内源性基因。对微生物进行工程化的这些方法描述于例如Verwaal等人,“CRISPR/Cpf1 enables fast and simplegenome editing of Saccharomyces cerevisiae[CRISPR/Cpf1能实现对酿酒酵母的快速简单的基因组编辑],”Yeast[酵母]doi:10.1002/yea.3278,2017;和Hlavova等人,“Improving microalgae for biotechnology-from genetics to synthetic biology[改善用于生物技术的微藻——从遗传学到合成生物学],”Biotechnol.Adv.[生物技术进展],33:1194-203,2015,将所述两个文献通过引用以全文并入本文。
在一些实施方式中,本文提供的CRISPR系统可用于诱导细胞(例如,微生物,如工程化的微生物)的死亡或休眠。这些方法可用于诱导多种细胞类型的休眠或死亡,所述细胞类型包括原核细胞和真核细胞,包括但不限于哺乳动物细胞(例如,癌细胞或组织培养细胞)、原生动物、真菌细胞、受病毒感染的细胞、受细胞内细菌感染的细胞、受细胞内原生动物感染的细胞、受朊病毒感染的细胞、细菌(例如,致病性细菌和非致病性细菌)、原生动物、以及单细胞和多细胞寄生物。例如,在合成生物学领域,非常希望有控制工程化的微生物(例如,细菌)以防止它们繁殖或传播的机制。本文描述的系统可用作“杀灭开关(kill-switches)”以调节和/或防止工程化的微生物的繁殖或传播。此外,本领域需要现有抗生素治疗的替代物。本文描述的系统还可用于希望杀灭或控制特定微生物群(例如,细菌群)的应用中。例如,本文描述的系统可包括靶向属、种或株特异性的核酸(例如,RNA)并且可以递送至细胞的RNA指导物(例如,crRNA)。在与所述靶核酸复合和结合后,VI-E型和/或VI-F型CRISPR-Cas效应蛋白的附带RNA酶活性受到激活,从而导致微生物内非靶RNA的切割,最终导致休眠或死亡。在一些实施方式中,所述方法包括使细胞与本文描述的系统接触,所述系统包括VI-E型和/或VI-F型CRISPR-Cas效应蛋白或编码所述效应蛋白的核酸、以及RNA指导物(例如,crRNA)或编码所述RNA指导物的核酸,其中间隔序列与靶核酸(例如,属、株或种特异性RNA指导物)的至少15个核苷酸(例如,16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50或更多个核苷酸)互补。不希望受任何特定理论的束缚,所述VI-E型和/或VI-F型CRISPR-Cas效应蛋白对非靶RNA的切割可诱导程序性细胞死亡、细胞毒性、细胞凋亡、坏死、坏死性凋亡、细胞死亡、细胞周期停滞、细胞无反应性、细胞生长减少或细胞增殖减少。例如,在细菌中,所述VI-E型和/或VI-F型CRISPR-Cas效应蛋白对非靶RNA的切割可以是抑细菌的或杀细菌的。
在植物中的应用
本文描述的CRISPR系统在植物中具有多种效用。在一些实施方式中,所述CRISPR系统可用于对植物转录组进行工程化(例如,改善产量、制造具有希望的翻译后修饰的产物、或引入用于生产工业产物的基因)。在一些实施方式中,所述CRISPR系统可用于将希望的性状引入植物中(例如,对基因组不进行可遗传修饰),或调节植物细胞或整株植物中内源性基因的表达。
在一些实施方式中,所述CRISPR系统可用于鉴定、编辑和/或沉默编码特定蛋白(例如,过敏原蛋白(例如,花生、大豆、扁豆、豌豆、四季豆和绿豆中的过敏原蛋白))的基因。关于如何鉴定、编辑和/或沉默编码蛋白的基因的详细描述在例如以下中描述:Nicolaou等人,“Molecular diagnosis of peanut and legume allergy[花生和豆类过敏的分子诊断],”Curr.Opin.Allergy Clin.Immunol.[过敏和临床免疫学的当前观点]11(3):222-8,2011,和WO 2016205764 A1;将所述两个文献通过引用以全文并入本文。
混合筛选(Pooled-Screening)
如本文所述,混合CRISPR筛选是用于鉴定参与生物机制(如细胞增殖、药物抗性和病毒感染)的基因的强大工具。用本文描述的编码指导RNA(gRNA)的载体的文库批量转导细胞,并且在应用选择性激发之前和之后测量gRNA的分布。混合CRISPR筛选非常适用于影响细胞存活和增殖的机制,并且它们可以扩展至测量单个基因的活性(例如,通过使用工程化的报告细胞系)。一次只靶向一个基因的阵列CRISPR筛选使得使用RNA-seq作为读数成为可能。在一些实施方式中,如本文描述的CRISPR系统可用于单细胞CRISPR筛选中。关于混合CRISPR筛选的详细描述可见于例如Datlinger等人,“Pooled CRISPR screening withsingle-cell transcriptome read-out[具有单细胞转录组读数的混合CRISPR筛选],”Nat.Methods.[自然方法]14(3):297-301,2017,将所述文献通过引用以其全文并入本文。
饱和诱变(过度攻击(Bashing))
本文描述的CRISPR系统可用于原位饱和诱变。在一些实施方式中,混合指导RNA文库可用于对特定基因或调节元件进行原位饱和诱变。这样的方法可以揭示这些基因或调节元件(例如,增强子)的关键最小特征和离散脆弱性(discrete vulnerabilities)。这些方法描述于例如Canver等人,“BCL11A enhancer dissection by Cas9-mediated in situsaturating mutagenesis[通过Cas9介导的原位饱和诱变进行的BCL11A增强子解析],”Nature[自然]527(7577):192-7,2015中,将所述文献通过引用以其全文并入本文。
RNA相关应用
本文描述的CRISPR系统可具有多种RNA相关应用,例如,调节基因表达、降解RNA分子、抑制RNA表达、筛选RNA或RNA产物、确定lincRNA或非编码RNA的功能、诱导细胞休眠、诱导细胞周期停滞、减少细胞生长和/或细胞增殖、诱导细胞无反应性、诱导细胞凋亡、诱导细胞坏死、诱导细胞死亡和/或诱导程序性细胞死亡。对这些应用的详细描述可见于例如WO2016/205764 A1中,将所述文献通过引用以其全文并入本文。在不同的实施方式中,本文描述的方法可以在体外、在体内或离体进行。
例如,可以将本文描述的CRISPR系统向患有疾病或障碍的受试者施用,以靶向处于患病状态中的细胞(例如,癌细胞或受感染原感染的细胞)并诱导所述细胞中的细胞死亡。例如,在一些实施方式中,本文描述的CRISPR系统可用于靶向癌细胞并诱导所述癌细胞中的细胞死亡,其中所述癌细胞来自患有以下的受试者:威尔姆斯肿瘤、尤因肉瘤、神经内分泌肿瘤、胶质母细胞瘤、神经母细胞瘤、黑素瘤、皮肤癌、乳腺癌、结肠癌、直肠癌、前列腺癌、肝癌、肾癌、胰腺癌、肺癌、胆道癌、子宫颈癌、子宫内膜癌、食道癌、胃癌、头颈癌、甲状腺髓样癌、卵巢癌、神经胶质瘤、淋巴瘤、白血病、骨髓瘤、急性淋巴细胞白血病、急性骨髓性白血病、慢性淋巴细胞白血病、慢性骨髓性白血病、霍奇金淋巴瘤、非霍奇金淋巴瘤或膀胱癌。
调节基因表达
本文描述的CRISPR系统可用于调节基因表达。所述CRISPR系统可以与合适的指导RNA一起使用,以经由RNA加工的控制来靶向基因表达。所述RNA加工的控制可以包括例如RNA加工反应,如RNA剪接(例如,可变剪接)、病毒复制和tRNA生物合成。与合适的指导RNA组合的RNA靶向蛋白也可用于控制RNA激活(RNAa)。RNA激活是小RNA指导的和Argonaute(Ago)依赖性基因调节现象,其中启动子靶向的短双链RNA(dsRNA)在转录/表观遗传水平上诱导靶基因表达。RNAa导致基因表达的促进,因此可以通过破坏或减少RNAa来实现对基因表达的控制。在一些实施方式中,所述方法包括使用RNA靶向CRISPR作为例如干扰核糖核酸(如siRNA、shRNA或dsRNA)的取代物。调节基因表达的方法描述于例如WO 2016205764中,将所述文献通过引用以其全文并入本文。
控制RNA干扰
对干扰RNA或微小RNA(miRNA)的控制可以通过减少所述干扰RNA或miRNA在体内或体外的寿命来帮助减少脱靶效应。在一些实施方式中,靶RNA可以包括干扰RNA,即,参与RNA干扰途径的RNA,如小发夹RNA(shRNA)、小干扰(siRNA)等在一些实施方式中,靶RNA包括例如miRNA或双链RNA(dsRNA)。
在一些实施方式中,如果选择性地表达RNA靶向蛋白和合适的指导RNA(例如在空间或时间上,在受调节的启动子(例如组织或细胞周期特异性启动子)和/或增强子的控制下),则这可以用于保护细胞或系统(在体内或体外)免受那些细胞中的RNA干扰(RNAi)。在不需要RNAi的邻近组织或细胞中,或者出于对表达和不表达CRISPR相关蛋白和合适的crRNA的细胞或组织进行比较(即,分别为RNAi不受控制和受控制的情况)的目的,这可能是有用的。所述RNA靶向蛋白可用于控制或结合包含RNA或由其组成的分子,如核酶、核糖体或核糖开关。在一些实施方式中,所述指导RNA可以将所述RNA靶向蛋白募集到这些分子中,使得所述RNA靶向蛋白能够与它们结合。这些方法描述于例如WO 2016205764和WO2017070605中,将所述两个文献通过引用以其全文并入本文。
修饰核糖开关和控制代谢调节
核糖开关是信使RNA的调节区段,其结合小分子并继而调节基因表达。这种机制允许细胞感应这些小分子的细胞内浓度。特定的核糖开关典型地通过改变该基因的转录、翻译或剪接来调节其相邻基因。因此,在一些实施方式中,可以通过使用与合适的指导RNA组合的RNA靶向蛋白以靶向核糖开关来控制核糖开关活性。这可以通过切割所述核糖开关或与其结合来实现。使用CRISPR系统控制核糖开关的方法描述于例如WO 2016205764和WO2017070605中,将所述两个文献通过引用以其全文并入本文。
RNA修饰
在一些实施方式中,本文描述的CRISPR相关蛋白可以与碱基编辑结构域,如ADAR1、ADAR2、APOBEC或激活诱导的胞苷脱氨酶(AID)融合,并且可以用于修饰RNA序列(例如,mRNA)。在一些实施方式中,所述CRISPR相关蛋白包括一个或多个突变(例如,在催化结构域中),这使得所述主题CRISPR相关蛋白不能切割RNA(例如,本文描述的工程化的2类VI型Cas13蛋白的dCas13版本)。
在一些实施方式中,这样的CRISPR相关蛋白可以与RNA结合融合多肽一起使用,所述RNA结合融合多肽包含与RNA结合结构域(如MS2(也称为MS2外壳蛋白)、Qβ(也称为Qβ外壳蛋白)或PP7(也称为PP7外壳蛋白))融合的碱基编辑结构域(例如,ADAR1、ADAR2、APOBEC或AID)。所述RNA结合结构域MS2、Qβ和PP7的氨基酸序列在下文提供:
MS2(MS2外壳蛋白)(SEQ ID NO:98)
Qβ(Qβ外壳蛋白)(SEQ ID NO:99)
PP7(PP7外壳蛋白)(SEQ ID NO:100)
在一些实施方式中,所述RNA结合结构域可以与本文描述的系统的crRNA上(例如,当所述crRNA在效应子-crRNA复合物中时)的特定序列(例如,适配序列)或二级结构基序结合,从而将所述RNA结合融合多肽(其具有碱基编辑结构域)募集至所述效应子复合物中。例如,在一些实施方式中,所述CRISPR系统包括CRISPR相关蛋白、具有适配序列(例如,MS2结合环、Qβ结合环或PP7结合环)的crRNA、以及具有与RNA结合结构域融合的碱基编辑结构域的RNA结合融合多肽,所述RNA结合结构域与所述适配序列特异性结合。在该系统中,所述CRISPR相关蛋白与具有所述适配序列的crRNA形成复合物。此外,所述RNA结合融合多肽与所述crRNA结合(经由所述适配序列),从而形成可以修饰靶RNA的三分复合物(tripartitecomplex)。
使用CRISPR系统进行碱基编辑的方法描述于例如国际公布号WO 2017/219027中,将所述文献通过引用以其全文并且特别是关于其对RNA修饰的讨论并入本文。
RNA剪接
在一些实施方式中,本文描述的工程化的2类VI型Cas13蛋白(其基本上缺乏附带活性)的灭活的或dCas13版本(例如,在催化结构域中具有一个或多个另外的突变的工程化的CRISPR相关蛋白)可用于靶向RNA转录物上的特定剪接位点并与其结合。所述灭活的CRISPR相关蛋白与RNA的结合可在空间上抑制剪接体与转录物的相互作用,从而能够改变特定转录物同种型的生成频率。这样的方法可用于通过外显子跳跃(exon skipping)来治疗疾病,使得可以在成熟的蛋白中跳过具有突变的外显子。使用CRISPR系统改变剪接的方法描述于例如国际公布号WO 2017/219027中,将所述文献通过引用以其全文并且特别是关于其对RNA剪接的讨论并入本文。
治疗性应用
本文描述的CRISPR系统可以具有多种治疗性应用。这样的应用可基于主题工程化的Cas13(例如,工程化的CRISPR/Cas13e或Cas13f)系统的以下一种或多种体外和体内能力:诱导细胞衰老、诱导细胞周期停滞、抑制细胞生长和/或增殖、诱导细胞凋亡、诱导坏死等。
在一些实施方式中,新的工程化的CRISPR系统可用于治疗各种疾病和障碍,例如遗传障碍(例如,单基因疾病)、可通过核酸酶活性(例如,Pcsk9靶向、杜氏肌营养不良(DMD)、BCL11a靶向)治疗的疾病、以及多种癌症等。
在一些实施方式中,本文描述的CRISPR系统可用于编辑靶核酸以修饰所述靶核酸(例如,通过插入、缺失或突变一个或多个核酸残基)。
在一个方面,本文描述的CRISPR系统可用于治疗由RNA、毒性RNA和/或突变RNA(例如,剪接缺陷或截短)的过表达引起的疾病。例如,毒性RNA的表达可以与核包涵体的形成以及脑、心脏或骨骼肌的迟发型退行性变化相关。在一些实施方式中,所述障碍是强直性肌营养不良。在强直性肌营养不良中,所述毒性RNA的主要致病作用是隔离(sequester)结合蛋白并损害可变剪接的调节(参见例如,Osborne等人,“RNA-dominant diseases[RNA显性疾病],”Hum.Mol.Genet.[人类分子遗传学],2009年4月15日;18(8):1471-81)。遗传学家对强直性肌营养不良(营养不良性肌强直(DM))特别感兴趣,因为它产生极其广泛的临床特征。DM的经典形式(现在称为1型DM(DM1))由编码细胞溶质蛋白激酶的基因DMPK的3’-非翻译区(UTR)中CTG重复序列的扩增引起。如本文描述的CRISPR系统可以靶向过表达的RNA或毒性RNA,例如DMPK基因或DM1骨骼肌、心脏或脑中的任一错误调节的可变剪接。
本文描述的CRISPR系统还可以靶向影响RNA依赖性功能的反式作用突变,所述突变导致多种疾病,例如像普拉德-威利综合征(Prader Willi syndrome)、脊髓性肌萎缩(SMA)和先天性角化不良。可以使用本文描述的CRISPR系统治疗的疾病列表汇总于Cooper等人,“RNA and disease[RNA和疾病],”Cell[细胞],136.4(2009):777-793和WO 2016/205764 A1中,将所述两个文献通过引用以全文并入本文。本领域的技术人员将理解如何使用新的CRISPR系统治疗这些疾病。
本文描述的CRISPR系统还可用于治疗各种tau蛋白病,包括例如原发性和继发性tau蛋白病,如原发性年龄相关性tau蛋白病(PART)/神经原纤维缠结(NFT)优势型老年性痴呆(其中NFT类似于在阿尔茨海默病(AD)中见到的那些,但没有斑块)、拳击性痴呆(慢性创伤性脑病)和进行性核上性麻痹。tau蛋白病的可用列表和治疗这些疾病的方法描述于例如WO 2016205764中,将所述文献通过引用以其全文并入本文。
本文描述的CRISPR系统还可用于靶向破坏顺式作用剪接代码的突变,所述突变可导致剪接缺陷和疾病。这些疾病包括例如,由SMN1基因的缺失导致的运动神经元退行性疾病(例如,脊髓性肌萎缩)、杜氏肌营养不良(DMD)、17号染色体相关的额颞叶痴呆合并帕金森综合征(FTDP-17)、以及囊性纤维化。
本文描述的CRISPR系统可进一步用于抗病毒活性,特别是抗RNA病毒。所述CRISPR相关蛋白可以使用经选择以靶向病毒RNA序列的合适的指导RNA来靶向病毒RNA。
本文描述的CRISPR系统还可用于在受试者(例如,人受试者)中治疗癌症。例如,本文描述的CRISPR相关蛋白可以用靶向RNA分子的crRNA编程,所述RNA分子是异常的(例如,包含点突变或者经可变剪接)并见于癌细胞中,以诱导癌细胞中的细胞死亡(例如,经由细胞凋亡)。
本文描述的CRISPR系统还可用于在受试者(例如,人受试者)中治疗自身免疫疾病或障碍。例如,本文描述的CRISPR相关蛋白可以用靶向RNA分子的crRNA编程,所述RNA分子是异常的(例如,包含点突变或者经可变剪接)并见于负责引起自身免疫疾病或障碍的细胞中。
此外,本文描述的CRISPR系统还可用于在受试者中治疗感染性疾病。例如,本文描述的CRISPR相关蛋白可以用靶向RNA分子的crRNA编程,所述RNA分子由感染原(例如,细菌、病毒、寄生物或原生动物)表达,以靶向并诱导感染原细胞中的细胞死亡。所述CRISPR系统还可用于治疗细胞内感染原感染宿主受试者细胞的疾病。通过对所述CRISPR相关蛋白进行编程以靶向由感染原基因编码的RNA分子,可以靶向受感染原感染的细胞并诱导细胞死亡。
此外,体外RNA感应测定可用于检测特定RNA底物。所述CRISPR相关蛋白可用于活细胞中基于RNA的感应。应用的实例是通过感应例如疾病特异性RNA进行的诊断。
本文描述的CRISPR系统的治疗性应用的详细描述可见于例如美国专利号8,795,965、EP 3009511、WO 2016205764和WO 2017070605中;将各个文献通过引用以其全文并入本文。
细胞及其后代
在某些实施方式中,本发明的方法可用于将本文描述的CRISPR系统引入细胞中,并引起所述细胞和/或其后代改变一种或多种细胞产物(如抗体、淀粉、乙醇、或任何其他所希望的产物)的产生。这样的细胞及其后代在本发明的范围内。
在某些实施方式中,本文描述的方法和/或CRISPR系统导致细胞的一种或多种RNA产物的翻译和/或转录的修饰。例如,所述修饰可导致RNA产物的转录/翻译/表达增加。在其他实施方式中,所述修饰可导致RNA产物的转录/翻译/表达降低。
在某些实施方式中,所述细胞是原核细胞。
在某些实施方式中,所述细胞是真核细胞,如哺乳动物细胞,包括人细胞(原代人细胞或已建立的人细胞系)。在某些实施方式中,所述细胞是非人哺乳动物细胞,如来自非人灵长类动物(例如,猴)、母牛/公牛/牛、绵羊、山羊、猪、马、狗、猫、啮齿动物(如兔子、小鼠、大鼠、仓鼠等)的细胞。在某些实施方式中,所述细胞来自鱼(如鲑鱼)、鸟(如禽鸟,包括鸡、鸭、鹅)、爬行动物、贝类(例如,牡蛎、蛤蜊、龙虾、对虾)、昆虫、蠕虫、酵母等在某些实施方式中,所述细胞来自植物,如单子叶植物或双子叶植物。在某些实施方式中,所述植物是粮食作物,如大麦、木薯、棉花、落花生或花生、玉蜀黍、小米、油棕果、马铃薯、干豆、油菜籽或低芥酸菜籽(canola)、稻、黑麦、高粱、大豆、甘蔗、甜菜、向日葵和小麦。在某些实施方式中,所述植物是谷类(大麦、玉蜀黍、小米、稻、黑麦、高粱和小麦)。在某些实施方式中,所述植物是块茎(木薯和马铃薯)。在某些实施方式中,所述植物是糖料作物(甜菜和甘蔗)。在某些实施方式中,所述植物是含油作物(大豆、落花生或花生、油菜籽或低芥酸菜籽、向日葵和油棕果)。在某些实施方式中,所述植物是纤维作物(棉花)。在某些实施方式中,所述植物是树木(如桃树或油桃树、苹果树或梨树、坚果树(如杏仁树或核桃树或开心果树)、或柑橘树(例如,橙树、葡萄柚树或柠檬树))、草、蔬菜、水果或藻类。在某些实施方式中,所述植物是茄属植物;芸苔属(Brassica)植物;莴苣属(Lactuca)植物;菠菜属(Spinacia)植物;辣椒属(Capsicum)植物;棉花、烟草、芦笋、胡萝卜、卷心菜、西兰花、花椰菜、番茄、茄子、胡椒、生菜、菠菜、草莓、蓝莓、覆盆子、黑莓、葡萄、咖啡、可可等。
相关方面提供使用本文描述的CRISPR系统通过本发明的方法修饰的细胞或其后代。
在某些实施方式中,所述细胞在体外、在体内或离体进行修饰。
在某些实施方式中,所述细胞是干细胞。
8.递送
通过本披露和本领域的知识,本文描述的CRISPR系统或本文描述的其任一组分(Cas13蛋白、其衍生物、功能性片段或各种融合物或加合物,以及指导RNA/crRNA)、其核酸分子、和/或编码或提供其组分的核酸分子可以通过各种递送系统(如载体,例如质粒和病毒递送载体)使用本领域中任何合适的手段递送,所述CRISPR系统包含工程化的2类VI型Cas13蛋白,例如基本上缺乏附带活性或具有增强的附带活性的那些(如Cas13e或Cas13f)。这样的方法包括(但不限于)电穿孔、脂质转染、显微注射、转染、超声、基因枪等。
在某些实施方式中,所述CRISPR相关蛋白和/或任一RNA(例如,指导RNA或crRNA)和/或辅助蛋白可以使用合适的载体递送,所述载体例如质粒或病毒载体(如腺相关病毒(AAV)、慢病毒、腺病毒、逆转录病毒载体和其他病毒载体、或其组合)。可以将所述蛋白和一种或多种crRNA包装到一种或多种载体(例如,质粒或病毒载体)中。对于细菌应用,可以使用噬菌体将编码本文描述的CRISPR系统的任一组分的核酸递送至细菌。示例性噬菌体包括但不限于T4噬菌体、Mu、λ噬菌体、T5噬菌体、T7噬菌体、T3噬菌体、Φ29、M13、MS2、Qβ和ΦX174。
在一些实施方式中,通过例如肌内注射、静脉内施用、经皮施用、鼻内施用、口服施用或粘膜施用将所述载体(例如,质粒或病毒载体)递送至目的组织。这样的递送可以经由单剂量或多剂量进行。本领域技术人员应理解,本文待递送的实际剂量可取决于多种因素而大幅变化,如载体选择、靶细胞、生物、组织、待治疗受试者的一般状况、所寻求的转化/修饰的程度、施用途径、施用模式、所寻求的转化/修饰的类型等。
在某些实施方式中,所述递送经由腺病毒进行,其可以是含有至少1×105个颗粒(也称为颗粒单位,pu)的腺病毒的单剂量。在一些实施方式中,所述剂量优选地是至少约1×106个颗粒、至少约1×107个颗粒、至少约1×108个颗粒、和至少约1×109个颗粒的腺病毒。所述递送方法和所述剂量描述于例如WO 2016205764 A1和美国专利号8,454,972B2中,将所述两个文献通过引用以全文并入本文。
在一些实施方式中,所述递送经由质粒进行。所述剂量可以是足够数量的质粒以引发响应。在一些情况下,质粒组合物中质粒DNA的合适量可以是从约0.1至约2mg。质粒将通常包括(i)启动子;(ii)编码靶向核酸的CRISPR相关蛋白和/或辅助蛋白的序列,每个序列与启动子(例如,相同的启动子或不同的启动子)可操作地连接;(iii)可选择标志物;(iv)复制起点;以及(v)位于(ii)的下游并与其可操作地连接的转录终止子。质粒还可以编码CRISPR复合物的RNA组分,但这些组分中的一种或多种可以替代地在不同的载体上编码。施用频率在医学或兽医学从业者(例如,医师、兽医师)或本领域技术人员的范围内。
在另一实施方式中,所述递送经由脂质体或脂质转染配制品等进行,并且可以通过本领域技术人员已知的方法制备。这样的方法描述于例如WO 2016205764和美国专利号5,593,972、5,589,466、和5,580,859中,将各个文献通过引用以其全文并入本文。
在一些实施方式中,所述递送经由纳米颗粒或外泌体进行。例如,已表明外泌体在递送RNA方面特别有用。
将新的CRISPR系统的一种或多种组分引入细胞中的另外的手段是通过使用细胞穿透肽(CPP)。在一些实施方式中,细胞穿透肽与所述CRISPR相关蛋白连接。在一些实施方式中,所述CRISPR相关蛋白和/或指导RNA与一种或多种CPP偶联以有效地将它们转运到细胞(例如,植物原生质体)内。在一些实施方式中,所述CRISPR相关蛋白和/或一种或多种指导RNA由一种或多种环状或非环状DNA分子编码,所述环状或非环状DNA分子与一种或多种CPP偶联用于细胞递送。
CPP是少于35个氨基酸的短肽,所述短肽源自能够以非受体依赖性方式跨细胞膜转运生物分子的蛋白或嵌合序列。CPP可以是阳离子肽、具有疏水性序列的肽、两亲性肽、具有富含脯氨酸且抗微生物的序列的肽、以及嵌合肽或二分肽。CPP的实例包括例如Tat(其是1型HIV病毒复制所需的核转录激活蛋白)、穿膜肽、卡波西成纤维细胞生长因子(FGF)信号肽序列、整合素β3信号肽序列、聚精氨酸肽Args序列、富含鸟嘌呤的分子转运蛋白和甜箭肽。CPP和使用它们的方法描述于例如等人,“Prediction of cell-penetratingpeptides[细胞穿透肽的预测],”Methods Mol.Biol.[分子生物学方法],2015;1324:39-58;Ramakrishna等人,“Gene disruption by cell-penetrating peptide-mediateddelivery of Cas9 protein and guide RNA[通过细胞穿透肽介导的Cas9蛋白和指导RNA的递送来破坏基因],”Genome Res.[基因组研究],2014年6月;24(6):1020-7;以及WO2016205764 A1中;将各个文献通过引用以其全文并入本文。
用于本文描述的CRISPR系统的各种递送方法还描述于例如美国专利号8,795,965、EP 3009511、WO 2016205764和WO 2017070605中;将各个文献通过引用以其全文并入本文。
9.试剂盒
本发明的另一方面提供试剂盒,所述试剂盒包含本文描述的主题CRISPR/Cas系统的任意两种或更多种组分,所述主题CRISPR/Cas系统包含工程化的2类VI型Cas13蛋白,例如基本上缺乏附带活性或具有增强的附带活性的那些,如Cas13e和Cas13f蛋白、其衍生物、功能性片段或各种融合物或加合物、指导RNA/crRNA、其复合物、涵盖它们的载体、或涵盖它们的宿主。
在某些实施方式中,所述试剂盒进一步包括使用其中涵盖的组分的说明,和/或与可在别处获得的其他组分组合的说明。
在某些实施方式中,所述试剂盒进一步包含一种或多种核苷酸,例如对应于以下的一种或多种核苷酸:可用于将指导RNA编码序列插入载体中并将所述编码序列与所述载体的一种或多种控制元件可操作地连接的那些。
在某些实施方式中,所述试剂盒进一步包含一种或多种缓冲液,所述缓冲液可用于溶解任一所述组分和/或为一种或多种所述组分提供合适的反应条件。这样的缓冲液可以包括以下中的一种或多种:PBS、HEPES、Tris、MOPS、Na2CO3、NaHCO3、NaB、或其组合。在某些实施方式中,所述反应条件包括适当的pH,如碱性pH。在某些实施方式中,所述pH在7-10之间。
在某些实施方式中,任一种或多种所述试剂盒组分可以储存在合适的容器中。
实施例
实施例1工程化的Cas13e效应酶(其具有减少的附带效果)的鉴定和表征
本实施例表明,通过以下可以大幅减少Cas13酶(例如,Cas13e)的附带效果或非序列特异性内切核酸酶活性:引入减少Cas13e与潜在的RNA靶标(序列特异性或非序列特异性靶标)之间的亲和力的突变,从而不成比例地降低附带的非序列特异性内切核酸酶活性,同时基本上保持针对靶RNA的序列特异性内切核酸酶活性(部分是由于指导序列与所述靶RNA之间的结合)。参见图1。
使用I-TASSER网站(zhanglab.ccmb.med.umich.edu/I-TASSER)预测了Cas13e的3D结构。此外,使用NCBI网络工具(ncbi.nlm.nih.gov/
Structure/icn3d/full.html)或PyMOL对预测结构进行了可视化。基于相关的序列信息,在Cas13e中分析了在空间上接近两个HEPN RXXXXH序列的序列。参见图2。预测这些在空间上接近的序列参与Cas13e效应酶对靶RNA(指导序列特异性和非指导序列特异性靶RNA两者)的结合,然后靶RNA分子在Cas13e内切核酸酶的催化结构域中经切割。
基于这一理论,Cas13e中在空间上接近两个HEPN结构域的序列(例如,分别位于两个HEPN结构域周围的残基2-187和634-755,以及残基227-242之间的在空间上接近的区域)在整个目的区域上经系统地突变(参见图3)。在每个区域内,突变集中在可能参与RNA结合的那些残基(或RNA结合热点)上,即具有含氮和/或带正电荷的侧链基团的那些残基,如R、K、H、N或Q残基。基于Ala扫描诱变的原理,这些突变热点残基经系统地更改为Ala,以避免对总体蛋白折叠造成灾难性破坏。
为了便于进一步筛选和选择,向每个选定的诱变区域的末端(参见图3)引入了BpiI识别序列,即一端为GTCTTC(对应于ValPhe或VF的二肽序列),并且另一端为GAAGAC(对应于GluAsp或ED的二肽序列)。一般来说,在每对BpiI识别序列之间引入了5-8个突变。在一些突变区域,引入了Y/S/T>A型突变体。
为了便于进一步表征,构建了EGFP-mCherry双荧光报告系统(参见图4)。在该系统中,EGFP和mCherry的表达处于它们各自的SV40启动子的分开但相同的控制之下,以确保它们的mRNA比率在经转染的细胞中保持相对稳定。该系统的gRNA特异性地靶向EGFP编码序列(mRNA)。此外,每个测试的工程化的Cas13e在N-末端以及C-末端处都具有NLS(核定位序列)。使用了CMV启动子驱动所述工程化的Cas13e的表达。
EGFP和mCherry报告子的序列在SEQ ID NO:1和2中。gRNA是SEQ ID NO:3。野生型Cas13e蛋白是SEQ ID NO:4,并且其经密码子优化的多核苷酸编码序列是SEQ ID NO:5。
根据标准方法在24孔组织培养板中培养了人HEK293T细胞,然后使用标准聚乙烯亚胺(PEI)转染将双荧光报告系统质粒转染到细胞中。然后将经转染的细胞在37℃在CO2下培养48小时。使用FACS检测了EGFP和mCherry信号。
使用所述双荧光报告系统选择附带效果减少的工程化的Cas13e的标准如下:
1)与野生型Cas13e相比,突变体/工程化的Cas13e具有相似/相当的EGFP信号,这表明靶RNA的指导序列特异性切割(EGFP)不受所述工程化的Cas13e中的突变的影响或影响很小;
2)与核酸酶死亡的dCas13e相比,突变体/工程化的Cas13e具有相似/相当的mCherry信号,这表明所述工程化的Cas13e中不存在非靶RNA的非序列特异性切割(mCherry),就像dCas13e不能切割mCherry mRNA一样。
基于上述标准和进一步的表征,鉴定了5种不同的工程化的Cas13e,与野生型Cas13e相比,每种工程化的Cas13e都具有大幅减少的附带效果(参见图5-7),包括Mut-6、Mut-7、Mut-12、Mut-17和Mut-19。这些工程化的Cas13e的完整蛋白序列分别在SEQ ID NO:6-10中。编码序列分别是SEQ ID NO:11-15。
为了比较,在Mut-6突变区域中,对应的野生型序列和突变体序列在下面SEQ IDNO:16和17中列出,其中改变的序列加双下划线。对应的核苷酸序列在SEQ ID NO:18和19中。
LVNRDKNDGLFVESLLR(SEQ ID NO:16)
CTGGTGAACCGGGACAAGAACGACGGCCTGTTCGTGGAAAGCCTGCTGAGA(SEQ ID NO:18)
在Mut-7突变区域中,对应的野生型序列和突变体序列在下面SEQ ID NO:20和21中列出,其中改变的序列加双下划线。对应的核苷酸序列在SEQ ID NO:22和23中。
HEKYSKHDWYDEDTRA(SEQ ID NO:20)
CACGAGAAGTACAGCAAGCACGACTGGTACGACGAAGATACCCGGGCC(SEQ ID NO:22)
在Mut-12突变区域中,对应的野生型序列和突变体序列在下面SEQ ID NO:24和25中列出,其中改变的序列加双下划线。对应的核苷酸序列在SEQ ID NO:26和27中。
RVLDRLYGAVSGLKKN(SEQ ID NO:24)
AGAGTGCTGGATCGGCTGTATGGAGCCGTGTCCGGCCTGAAGAAGAAT(SEQ ID NO:26)
在Mut-17突变区域中,对应的野生型序列和突变体序列在下面SEQ ID NO:28和29中列出,其中改变的序列加双下划线。对应的核苷酸序列在SEQ ID NO:30和31中。
EKGKIRYHTVYEKGFR(SEQ ID NO:28)
GAAAAGGGCAAGATCCGGTACCACACAGTGTACGAAAAGGGCTTTAGA(SEQ ID NO:30)
在Mut-19突变区域中,对应的野生型序列和突变体序列在下面SEQ ID NO:32和33中列出,其中改变的序列加双下划线。对应的核苷酸序列在SEQ ID NO:34和35中。
GAHYIDFREILAQTMC(SEQ ID NO:32)
GGCGCCCACTACATCGACTTCCGGGAGATCCTGGCCCAGACCATGTGC(SEQ ID NO:34)
基于进一步的表征,Mut-17和Mut-19基本上消除了野生型Cas13e的附带效果,同时保持了相对高的指导序列特异性内切核酸酶活性。
此外,已证明本文描述的方法能够鉴定用于工程化的残基,即使这些残基在一级序列中远离HEPN结构域,但基于预测3D结构(使用通常可获得的工具,如PyMOL或I-TASSER)可证明其在空间上接近HEPN结构域。参见图8。
实施例2另外的工程化的Cas13e效应酶点突变(其具有减少的附带效果)的鉴定和表征
为了缩小Mut-17区域中影响邻近效果的关键氨基酸的范围,构建并测试了Mut-17区域中的一系列8个突变,包括M17.5、M17.6、M17.8、M17.9、M17.10、M17.11、M17.12和M17.13(参见图9)。M17.0-6与Mut-17相同。
为了比较,在M17.5突变区域中,对应的野生型序列和突变体序列在下面SEQ IDNO:28和36中列出,其中改变的序列加双下划线。
EKGKIRYHTVYEKGFR(SEQ ID NO:28)
在M17.6突变区域中,对应的野生型序列和突变体序列在下面SEQ ID NO:28和37中列出,其中改变的序列加双下划线。
EKGKIRYHTVYEKGFR(SEQ ID NO:28)
在M17.8突变区域中,对应的野生型序列和突变体序列在下面SEQ ID NO:28和38中列出,其中改变的序列加双下划线。
EKGKIRYHTVYEKGFR(SEQ ID NO:28)
在M17.9突变区域中,对应的野生型序列和突变体序列在下面SEQ ID NO:28和39中列出,其中改变的序列加双下划线。
EKGKIRYHTVYEKGFR(SEQ ID NO:28)
在M17.10突变区域中,对应的野生型序列和突变体序列在下面SEQ ID NO:28和40中列出,其中改变的序列加双下划线。
EKGKIRYHTVYEKGFR(SEQ ID NO:28)
在M17.11突变区域中,对应的野生型序列和突变体序列在下面SEQ ID NO:28和41中列出,其中改变的序列加双下划线。
EKGKIRYHTVYEKGFR(SEQ ID NO:28)
在M17.12突变区域中,对应的野生型序列和突变体序列在下面SEQ ID NO:28和42中列出,其中改变的序列加双下划线。
EKGKIRYHTVYEKGFR(SEQ ID NO:28)
在M17.13突变区域中,对应的野生型序列和突变体序列在下面SEQ ID NO:28和43中列出,其中改变的序列加双下划线。
EKGKIRYHTVYEKGFR(SEQ ID NO:28)
基于该进一步的表征,并且与先前的结果一致,Mut-17区域内的大多数测试的点突变对指导序列依赖性RNA酶活性没有显著影响(参见图11)-与野生型Cas13e.1相比,大多数突变体具有相当水平的指导序列依赖性RNA酶活性。
相比之下,点突变M17.6、M17.8和M17.9(SEQ ID NO:37-39)基本上将野生型Cas13e的附带效果消除至dCas13e.1的水平,而其他点突变与野生型Cas13e.1相比保留了不同程度的附带效果,包括在一些情况下增强的附带效果(参见图10)。因此,wtCas13e.1的Mut-17区域中的残基Y672和Y676似乎是影响野生型Cas13e.1的附带环切(circumcision)效果的两个关键残基。
类似地,为了缩小Mut-19区域中影响附带活性的关键氨基酸残基的范围,构建并测试了Mut-19区域中的一系列6个突变体(参见图12),包括M19.1、M19.2、M19.3、M19.4、M19.5和M19.6。
为了比较,在M19.1突变区域中,对应的野生型Cas13e.1序列和突变体序列在下面SEQ ID NO:32和44中列出,其中改变的序列加双下划线。
GAHYIDFREILAQTMC(SEQ ID NO:32)
在M19.2突变区域中,对应的野生型Cas13e.1序列和突变体序列在下面SEQ IDNO:32和45中列出,其中改变的序列加双下划线。
GAHYIDFREILAQTMC(SEQ ID NO:32)
在M19.3突变区域中,对应的野生型Cas13e.1序列和突变体序列在下面SEQ IDNO:32和46中列出,其中改变的序列加双下划线。
GAHYIDFREILAQTMC(SEQ ID NO:32)
在M19.4突变区域中,对应的野生型Cas13e.1序列和突变体序列在下面SEQ IDNO:32和47中列出,其中改变的序列加双下划线。
GAHYIDFREILAQTMC(SEQ ID NO:32)
在M19.5突变区域中,对应的野生型Cas13e.1序列和突变体序列在下面SEQ IDNO:32和48中列出,其中改变的序列加双下划线。
GAHYIDFREILAQTMC(SEQ ID NO:32)
在M19.6突变区域中,对应的野生型Cas13e.1序列和突变体序列在下面SEQ IDNO:32和49中列出,其中改变的序列加双下划线。
GAHYIDFREILAQTMC(SEQ ID NO:32)
基于该进一步的表征,并且与先前的结果一致,Mut-19区域内的大多数测试的点突变对指导序列依赖性RNA酶活性没有显著影响(参见图14)-与野生型Cas13e.1相比,大多数突变体具有相当水平的指导序列依赖性RNA酶活性。
相比之下,点突变M19.2和M19.5(SEQ ID NO:45和48)基本上将野生型Cas13e的附带效果消除至dCas13e.1的水平,而其他点突变与野生型Cas13e.1相比保留了不同程度的附带效果(参见图13)。因此,wtCas13e.1的Mut-19区域中的残基Y715似乎是影响野生型Cas13e.1的附带环切效果的关键残基。
实施例3Cas13在哺乳动物细胞中的附带效果
先前已在神经胶质瘤细胞和果蝇中发现了Cas13效应酶家族进行的附带RNA降解,但它在哺乳动物细胞中的存在尚未得到明确证实。基于如本文描述的用于检测附带效果的快速且灵敏的双荧光报告系统,本实施例表明,当靶向外源性基因和内源性基因时,Cas13确实可以在HEK293T细胞中诱导实质性的附带效果。特别地,证明了Cas13d介导转录组范围的RNA脱靶编辑,从而导致细胞生长停滞并降低细胞活力。
特别地,为了评价Cas13在哺乳动物细胞中的附带效果,将Cas13(Cas13a或Cas13d)与EGFP和mCherry编码序列以及靶向的(针对mCherry)或非靶向的(NT,对照)指导RNA(gRNA)一起共转染至HEK293T细胞中。在转染后48小时测量了靶向的mCherry和非靶向的EGFP的表达水平(图16A)。
发现与NT gRNA相比,在使用三种不同的mCherry gRNA的情况下,Cas13a和Cas13d不仅介导了预期的mCherry荧光强度的降低,而且还导致了EGFP荧光强度的显著降低(图16C)。该结果通过使用qPCR的EGFP和mCherry转录物分析得到进一步确认(图16B)。
这些发现共同表明,当靶向瞬时过表达的外源性基因时,在哺乳动物HEK293T细胞中可检测到Cas13介导的RNA减少的附带效果。
然而,附带效果不限于瞬时过表达的外源性基因。本文呈现的数据还表明,当靶向HEK293T中的内源性基因时,Cas13d可诱导附带效果。
流式细胞术实验表明,当靶向内源性PKMRPL4基因时,Cas13d介导的敲低诱导了实质性的附带切割(如通过EGFP和mCherry荧光的减少所指示的)(图16B),并且当靶向内源性PKM和PFN1基因时诱导了轻微的附带切割(图16D)。
此外,通过使用四种不同的gRNA(gRNA-1至gRNA-4)确定对RPL4的RNA靶向效率,观察到Cas13靶向对使用每种gRNA的RPL4的一致稳健敲低,以及对使用RPL4 gRNA-1、gRNA-3和gRNA-4(但不包括gRNA-2)的EGFP转录物的明显敲低(图16B,右分图)。这一观察结果与先前的报告一致,即,当靶向相同的或不同的转录物时,不同的gRNA展现出不同程度的附带效果,这可能是由于Cas13/gRNA复合物的稳定性所导致。
无论如何,这些发现令人信服地表明,当靶向外源性或内源性基因时,Cas13介导的RNA敲低在哺乳动物细胞中产生实质性的附带效果。
实施例4通过诱变消除Cas13d的附带效果
与实施例1和实施例2中所表明的有关Cas13e的内容一致,基于以下假设,本实施例表明其他Cas13(例如,Cas13d或CasRx)的附带效果也可以经由诱变而减弱(即使没有完全消除):改变HEPN结构域中靠近催化位点RXXXXH的RNA结合裂隙可以选择性地减少混杂的RNA结合和非靶切割,同时保持中靶RNA切割。
特别地,如之前一样,使用了公开可获得的在线工具TASSER预测Cas13d的3D结构,并且使用PyMOL对预测结构进行了可视化,以确定3D中各个结构性结构域的位置(参见图17B和17C)。
然后基于上文描述的双荧光方法设计了无偏筛选系统,其中将EGFP、mCherry、靶向EGFP的gRNA以及每个Cas13变体的编码序列插入到一个质粒中,用于在293T细胞中表达。在该系统中,EGFP的表达和mCherry的表达由相同的SV40启动子驱动,以确保报告基因在经转染的宿主细胞中大致相同的稳定表达。选择了对EGFP mRNA具有特异性的gRNA。Cas13d和变体的每个编码序列都具有N-末端和C-末端核定位信号(NLS),并且Cas13d和变体/突变体的表达由强CAG启动子驱动。
EGFP和mCherry编码序列分别是SEQ ID NO:1和2。gRNA的对应DNA序列是SEQ IDNO:3。野生型Cas13d蛋白序列是SEQ ID NO:101。野生型Cas13d的编码序列是SEQ ID NO:102。CAG启动子序列是SEQ ID NO:103。SV40启动子序列是SEQ ID NO:104。
选择了对应于残基77-328和458-961的Cas13d的HEPN1-I、HEPN1-II和HEPN2结构域,用于生成Cas13d诱变文库。首先,将这些区域分成21个小区段(N1-N21),每个区段为约36个残基。更特别地,这21个突变区域涵盖HEPN1-I(N1-N6)、HEPN1-II(N8-N10)、HEPN2(N14-N21)、Helical-1(N7)和Helical-2(N10-N14)结构域(图17C)。
为了便于后续的选择,在所述区段的每个末端处引入了BpiI限制酶识别位点(GTCTTC,对应于编码的残基VF;反向互补序列GAAGAC,对应于编码的残基ED)。当产生突变体时,所有非Ala残基都经Ala取代,并且所有Ala残基都经Val取代(例如,将所有非丙氨酸替代为丙氨酸,X>A;并且将丙氨酸替代为缬氨酸,A>V)。在每个区段侧翼的两个BpiI位点之间引入了约4-5个总突变。如此生成的各种突变体及它们对应的野生型序列(N1L1-N21L、N1R-N21R)在下面提供。
使用本发明的EGFP-mCherry双荧光报告系统对这些Cas13d突变体进行功能性筛选,以评估它们的附带切割活性相比于gRNA指导的切割活性。特别地,根据标准细胞培养方法,使人HEK293细胞在24孔组织培养板中生长至合适的密度,然后用PEI试剂以及表达每个突变体Cas13d和报告系统荧光蛋白的质粒转染所述细胞。将经转染的细胞在37℃在5%CO2下在培养箱中培养约48小时,然后用FACS测量所述细胞中的EGFP和mCherry信号。选择了导致gRNA靶向的EGFP信号的百分比低(EGFP+细胞的百分比较低,作为保存gRNA指导的切割的读数)且非靶向的mCherry信号的百分比高(mCherry+细胞的百分比较高,作为缺乏附带效果的读数)的突变体。
在本实验中,将无gRNA指导的切割的dCas13d用作阴性对照,并且将结果(平均值±s.e.m.)针对dCas13d的结果进行归一化并在下面列出。位于图17D左上区的Cas13d突变体具有低的附带效果(高mCherry信号)和高的gRNA指导的切割活性(低EGFP信号),并将其选择为所希望的低/无附带效果的突变体。
通过无活性的死Cas13d(在HEPN结构域中具有R295A、H300A、R849A和H854A突变的dCas13d)将EGFP和mCherry荧光强度归一化后,发现在N1、N2、N3或N15中具有突变位点的变体(特别是N1V7、N2V7、N2V8、N3V7和N15V4)展现出相对低的EGFP荧光强度但高的mCherry荧光强度,这表明这些变体保留了高的中靶活性但大大降低了附带活性(图17D)。
总体而言,这些突变体展现出小于27.5%的附带效果(例如,≥72.5%的mCherry+细胞)和≥75%的gRNA指导的切割(≤25%的EGFP+细胞)。它们包括:N1V7、N2V7、N2V8、N3V7和N15V4等(参见上表和图17D)。基于FACS数据(未显示),与野生型相比,这些突变体具有显著减少的附带效果。
此外,一些Cas13d突变体展现出低的附带效果(例如,≤27.5%的附带效果,或≥72.5%的mCherry+细胞)和中等的gRNA指导的切割(例如,25%≤EGFP+细胞≤75%),包括:N2V4、N2V5、N4V3、N6V3、N10V6、N15V2、N20V6、和N20-Y910A等(参见上表和图17D)。这些突变体的gRNA指导的切割效率可以通过例如使用多个靶向靶序列的不同位点的gRNA来进一步增强,并且附带效果将保持低。
换言之,本发明提供了具有基本上保留(例如,保留至少约50%、60%、70%、80%、85%、90%、95%、96%、97%、98%或99%)野生型水平的gRNA指导的切割,同时基本上减少/消除(至少约72.5%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)Cas13d附带效果的突变体。
由于N2V7和N2V8保留了相对高的指导RNA特异性切割且基本上消除了Cas13d附带效果,并且受这些突变体影响的残基非常接近,因此通过生成多种具有单个、双重、三重或四重组合突变的额外的突变体,对这些突变体的两个区域进行了进一步的诱变研究。这些突变体的序列和对应的野生型序列(N2C)在下面列出:
使用上述相同的测定,并在将数据用dCas13d的数据归一化后,选择了占据图17E左上角的突变体。
基于对所有这些突变体的综合分析,认为N2V8(携带A134V、A140V、A141V、A143V)具有优越的特征,因为它保留了相对高的指导RNA特异性切割,同时基本上消除了Cas13d附带效果。参见上面的数据以及图17D和17E。该突变体有时称为cfCas13d(无附带的Cas13d),用于进一步的功能性表征。
基于Cas13d的结构和PyMOL可视化,鉴定出各种有效变体的突变位点主要位于靠近两个HEPN结构域(RXXXXH-1、RXXXXH-2)的催化位点的α-螺旋中(图18A-18C),尤其是对于突变体N1V7、N2V7、N2V8和N15V4。参见图18A-18C。认为这些区域中的残基可能参与了Cas13d与靶RNA和/或非特异性RNA之间的结合,并且这些残基中的突变对于Cas13d对不同RNA靶标的亲和力有不同的/差异性的影响,因此对于对这些RNA靶标的切割效率有不同的/差异性的影响。
经鉴定的附带效果减少/消除的所希望的Cas13d突变体似乎共享以下特征:
1.突变主要位于HEPN1-1结构域(例如,残基90-292)、Helical2结构域(例如,残基536-690)和HEPN2结构域(例如,Cas13d中的残基690-967)内。
2.在Cas13d中,突变位于RXXXXH基序的170个残基内。
3.在3D结构中,大多数突变在由HEPN1和HEPN2结构域的RXXXXH基序形成的催化活性位点附近。
4.对于每个突变残基,用除Ala以外的残基(尤其是Val、Gly和Ile)进行取代对于减少/消除附带效果同样有效。
Cas13d中所希望的突变体的某些特定位置在下面列出:
有趣的是,大多数变体展现出低的双切割活性(图17D中的右上)或高的中靶切割活性但低的附带切割活性(图17D中的左上)。然而,几乎没有变体显示出低的中靶切割活性但高的附带切割活性(图17D中的右下)。这些结果表明在中靶切割活性和附带切割活性之间存在不同的结合机制。
为了确认cfCas13d消除了附带效果,使用其他三种不同gRNA靶向了EGFP,并且发现野生型Cas13d诱导了实质性的附带效果,但cfCas13d基本上没有诱导附带效果(图17F)。
接下来,研究了在非靶向的单链RNA探针存在下,纯化的Cas13d和cfCas13d蛋白对靶向的RNA的体外切割活性。发现cfCas13d展现出一致高效的中靶活性且基本上没有附带切割,而野生型Cas13d显示出明显的附带活性(图17G和17H)。这些结果进一步表明,cfCas13d大幅消除了附带效果。
另一方面,基于≥87.5%的附带切割效率(例如,≤12.5%的mCherry+细胞)以及与野生型相比更好的gRNA指导的切割(例如,≤4%的EGFP+细胞),上述筛选还产生了多个具有显著增强的附带效果的突变体。这些突变体包括:N2-Y142A、N4-Y193A、N12-Y604A、N21V7等。在这些突变体中,N2-Y142A位于在3D结构中朝向两个HEPN结构域延伸的Helical2结构域中。同时,N4-Y193A和N21V7分别在HEPN1和HEPN2结构域内,并且距离催化活性位点较远。这些突变体中涉及的残基在下面列出。
应理解,虽然在本文的诱变研究中使用了Ala,但在相同位置处的其他取代(尤其是具有小(烷基)侧链的那些,如Val或Ile、或Gly)也具有与Ala取代相似的效果。本文明确考虑和披露了这些突变,并且这些突变在本发明的范围内。
实施例5通过诱变消除Cas13e的附带效果
本实施例基于Cas13d突变体筛选和Cas13e的模拟结构分析的知识,提供了附带效果减少/消除的额外的Cas13e突变体(参见图19A)。
特别地,针对Cas13e开发了诱变文库,涵盖HEPN1和HEPN2结构域(图19B)。构建了至少90种不同的突变体,与野生型序列相比,每种突变体包含1-5个氨基酸残基变化。各种Cas13e突变体和对应的野生型序列(M1-M21)在下面列出。
使用本发明的EGFP-mCherry双荧光报告系统对这些Cas13e突变体进行功能性筛选,以评估它们的附带切割活性相比于gRNA指导的切割活性。特别地,根据标准细胞培养方法,使人HEK293细胞在24孔组织培养板中生长至合适的密度,然后用PEI试剂以及表达每个突变体Cas13e和报告系统荧光蛋白的质粒转染所述细胞。将经转染的细胞在37℃在5%CO2下在培养箱中培养约48小时,然后用FACS测量所述细胞中的EGFP和mCherry信号。选择了导致gRNA靶向的EGFP信号的百分比低(EGFP+细胞的百分比较低,作为保存gRNA指导的切割的读数)且非靶向的mCherry信号的百分比高(mCherry+细胞的百分比较高,作为缺乏附带效果的读数)的突变体。
在本实验中,将无gRNA指导的切割的dCas13e用作阴性对照,并且将结果(平均值±s.e.m.)针对dCas13e的结果进行归一化并在下面列出。位于图19C左上区的Cas13e突变体具有低的附带效果(高mCherry信号)和高的gRNA指导的切割活性(低EGFP信号),并将其选择为所希望的低/无附带效果的突变体。
在从诱变文库以及具有单个、双重、三重或四重突变的另外的不同组合筛选之后,鉴定了多种附带效果减少/消除的突变体。例如,与野生型Cas13e相比,Cas13e-M17YY(携带Y672A、Y676A)展现出类似高水平的EGFP敲低和更低的mCherry敲低(图19C和19D)。此外,在使用不同的EGFP gRNA或体外切割活性的情况下,Cas13e-M17YY观察到类似的结果,命名为cfCas13e(无附带的Cas13e),其显示出有效的中靶切割活性和大幅减少的附带效果(图19E-19G)。
总体而言,这些突变体展现出小于25%的附带效果(例如,≥75%的mCherry+细胞)和≥75%的gRNA指导的切割(≤25%的EGFP+细胞)。它们包括:M1V4、M2V2、M2V3、M2V4、M5V1、M6V2、M6V3、M6V4、M7V1、M7V2、M7V3、M7-Y55A、M7-Y61A、M11V1、M12V3、M15V1、M15V2、M15-Y643A、M15-Y647A、M16V1、M16V2、M17V2、M18V2、M18V3、M19V2、M19V3、M19-IA等(参见上表和图19C)。
此外,一些Cas13e突变体展现出低的附带效果(例如,≤25%的附带效果,或≥75%的mCherry+细胞)和中等的gRNA指导的切割(例如,25%≤EGFP+细胞≤75%),包括:M17YY、M8V4、M9V1、M11V2、M11V3、M13V1、M13V2、M13V3、M15V3、M20V2等(参见上表和图19C)。这些突变体的gRNA指导的切割效率可以通过例如使用多个靶向靶序列的不同位点的gRNA来进一步增强,并且附带效果将保持低。
换言之,本发明提供了具有基本上保留(例如,保留至少约50%、60%、70%、80%、85%、90%、95%、96%、97%、98%或99%)野生型水平的gRNA指导的切割,同时基本上减少/消除(至少约75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)附带效果的突变体。
尽管不希望受任何特定理论的束缚,但本文呈现的数据似乎表明了以下附带效果减少/消除的机制,部分基于对有效突变体在基于PyMOL可视化的Cas13效应酶的3D结构中的位置的分析。特别地,发现大多数具有所希望的效果(例如,附带效果减少/消除)的突变体在HEPN1/HEPN2结构域内具有突变,通常在RXXXXH催化活性位点附近。认为这些区域中的残基可能参与了Cas13e与靶RNA和/或非特异性RNA之间的结合,并且这些残基中的突变对于Cas13e对不同RNA靶标的亲和力有不同的/差异性的影响,因此对于对这些RNA靶标的切割效率有不同的/差异性的影响。
经鉴定的附带效果减少/消除的所希望的Cas13e突变体似乎共享以下特征:
1.突变位于HEPN1结构域和结构域间接头(IDL)区域(例如,Cas13e中的残基1-194)以及HEPN2结构域(例如,Cas13e中的残基620-775)内。
2.在Cas13e中,突变位于RXXXXH基序的125个残基内。
3.在3D结构中,大多数突变在由HEPN1和HEPN2结构域的RXXXXH基序形成的催化活性位点附近。
4.对于每个突变残基,用除Ala以外的残基(尤其是Val、Gly和Ile)进行取代对于减少/消除附带效果同样有效。本文明确考虑和披露了这些突变,并且这些突变在本发明的范围内。
Cas13e中所希望的突变体的某些特定位置在下面列出:
与先前鉴定的M17.15-1和M17.15-2突变体(Y672A、Y676A)相比,一种特定的突变体M17YY在很大程度上减少了附带效果(参见图13-14)。M17YY在本文中有时称为cfCas13e(无附带的Cas13e),用于进一步的功能性表征。
另一方面,基于≥60%的附带切割效率(例如,≤40%的mCherry+细胞)以及与野生型相比更好的gRNA指导的切割(例如,≤5.5%的EGFP+细胞),上述筛选还产生了多个具有显著增强的附带效果的突变体。这些突变体包括:M14V2、M16V3、M18V1、M19-G712A、M19-T725A、M19-C727A等。这些突变体主要位于由RXXXXH基序形成的两个催化活性位点之间。例如,M14V2位于在3D结构中在朝向两个HEPN结构域的β转角周围的Helical1-1结构域中。同时,M16V3、M18V1、M19-G712A、M19-T725A和M19-C727A具有在α-螺旋及其侧翼非结构化区域周围/附近的HEPN2结构域中的突变,全部都接近催化活性位点。这些突变体中涉及的残基在下面列出。
应理解,虽然在本文的诱变研究中使用了Ala,但在相同位置处的其他取代(尤其是具有小(烷基)侧链的那些,如Val或Ile、或Gly)也具有与Ala取代相似的效果。本文明确考虑和披露了这些突变,并且这些突变在本发明的范围内。
实施例6cfCas13d在哺乳动物细胞中的功能性表征
基于使用4种不同的靶向EGFP的gRNA(g1-g4),本实验表明cfCas13d具有与野生型Cas13d相似的高的gRNA指导的靶RNA切割,但没有展现出显著的附带效果。参见图17F。
gRNA-1,g1:GTCCTCCTTGAAGTCGATGCCCTTCAGCTC(SEQ ID NO:850)
gRNA-2,g2:AGCACTGCACGCCGTAGGTCAGGGTGGTCA(SEQ ID NO:3)
gRNA-3,g3:GCAGGACCATGTGATCGCGCTTCTCGTTGG(SEQ ID NO:851)
gRNA-4,g4:GAACTTCAGGGTCAGCTTGCCGTAGGTGGC(SEQ ID NO:852)
使用了纯化的野生型Cas13d、cfCas13d和dCas13d评估体外附带效果以及gRNA指导的靶RNA切割。结果表明,cfCas13d没有展现出任何可检测的附带效果(图17G),同时保留了相对高的指导RNA引导的靶RNA切割(图17H)。
用于确定gRNA引导的切割的ssRNA靶序列和crRNA是:
ssRNA-cy5-标记的:5’-CY5-GGCCAGUGAAUUCGAGCUCGGUACCCGGGGAUCCUCUAGAAAUAUGGAUUACUUGGUAGAACAGCAAUCUACUCGACCUGCAGGCAUGCAAGCUUGGCGU-BHQ2-3’(SEQ ID NO:853)和Cas13d-crRNA(SEQ ID NO:854)。
用于确定附带切割的ssRNA靶序列和crRNA是:ssRNA(SEQ ID NO:853)、Cas13d-crRNA(SEQ ID NO:854)和附带RNA-FMA-标记的:FAM-AAAGAUACGAGGGUGCUAUGUUUCCACGCUCC-BHQ1(SEQ ID NO:856)。
实施例7cfCas13e在哺乳动物细胞中的功能性表征
基于使用4种不同的靶向EGFP的gRNA(g1-g4),本实验表明cfCas13e具有与野生型Cas13e相似的高的gRNA指导的靶RNA切割,但没有展现出显著的附带效果。参见图19G。
gRNA-1,g1:AGCACTGCACGCCGTAGGTCAGGGTGGTCA(SEQ ID NO:3)
gRNA-2,g2:GTCCTCCTTGAAGTCGATGCCCTTCAGCTC(SEQ ID NO:850)
gRNA-3,g3:TCGCCGTCCAGCTCGACCAGGATGGGCACC(SEQ ID NO:857)
gRNA-4,g4:TTCGGGCATGGCGGACTTGAAGAAGTCGTG(SEQ ID NO:858)
使用了纯化的野生型Cas13e、cfCas13e和dCas13e评估体外附带效果以及gRNA指导的靶RNA切割。结果表明,cfCas13e没有展现出任何可检测的附带效果(图19E),同时保留了相对高的指导RNA引导的靶RNA切割(图19F)。
用于确定gRNA引导的切割的ssRNA靶序列和crRNA是:
ssRNA-cy5-标记的:5’-CY5-GGCCAGUGAAUUCGAGCUCGGUACCCGGGGAUCCUCUAGAAAUAUGGAUUACUUGGUAGAACAGCAAUCUACUCGACCUGCAGGCAUGCAAGCUUGGCGU-BHQ2-3’(SEQ ID NO:859)和Cas13e-crRNA(SEQ ID NO:860)。
用于确定附带切割的ssRNA靶序列和crRNA是:ssRNA
(SEQ ID NO:861)、Cas13e-crRNA(SEQ ID NO:862)和附带RNA-FMA-标记的:FAM-AAAGAUACGAGGGUGCUAUGUUUCCACGCUCC-BHQ1(SEQ ID NO:856)。
实施例8cfCas13d在哺乳动物细胞中的功效和特异性
为了评价内源性基因的表达水平是否会影响Cas13d的附带效果的程度,选择了一组23个在哺乳动物细胞中具有不同作用和差异性表达水平的内源性基因。然后针对每种转录物设计了1-6种gRNA(图20A)。针对这些靶基因选择的gRNA序列在下面列出。
用含有Cas13d、EGFP、mCherry、非靶(NT)gRNA或靶向每个内源性基因的gRNA的多合一(all-in-one)构建体以及含有由CAG启动子驱动的BFP的另一构建体转染HEK293细胞。BFP在这里用于将转染效率归一化。转染后约48小时,检查针对附带效果的EGFP和mCherry荧光强度以及针对RNA敲低活性的靶转录物水平(图20B)。
一般来说,内源性基因的表达水平增加与由Cas13d诱导的更突出的附带效果相关(图20B-20C)。特别地,与使用NT gRNA的Cas13d相比,在具有高表达水平的基因(ENO1、RPL4、CKB、BSG、RPS5和PPIA,CPM>=200;CPM,计数/百万)上观察到明显减少的双荧光强度,在具有中等表达水平的基因(RAF1、STAT3、EZH2、PEBEP1、NRAS、NF2、LENG8和CA2,50<CPM<200)上观察到中度但显著减少的双荧光强度,并且在具有低表达水平的基因(PPIB、ANXA4、NFKB1、SMARCA1、EGFR、PPARG、B4GALNT1和NEFM,CPM<=50)上仅观察到轻微减少的双荧光强度(图20B-20C)。
选择了三种单独的高表达的转录物,其中使用来自这些内源性基因的四种gRNA进行进一步的表征:RPL4-gRNA1、PPIA-gRNA1、PPIA-gRNA2和RPS5-gRNA1。发现与dCas13d组相比,Cas13d组的荧光强度一致明显减少,而cfCas13d组则没有这种减少(图20D-20G)。
同时,对于使用以下靶gRNA的一种中等表达的转录物和一种低表达的转录物:CA2-gRNA1和B4GALNT1-gRNA1,在Cas13d组中可轻微检测到减少的荧光强度,但在cfCas13d组中则没有这种情况(图20J和20K)。
一致地,Cas13d和cfCas13d靶向两者都展现出对这些基因的稳健敲低,如通过qPCR分析所确认的(图20I)。
这些结果指示,由Cas13介导的敲低诱导的附带效果与基因表达水平相关,并且这些附带效果可以通过cfCas13d消除。
为了确认cfCas13d的RNA干扰活性仍然广泛适用,在随机选择的HEK293细胞中的14种内源性转录物上测试了cfCas13d和Cas13d。发现cfCas13d和Cas13d展现出相当的高效RNA敲低活性(分别为82%±2%和93%±1%),这表明cfCas13d保留了对大多数内源性基因的高水平RNA干扰活性(图20H和20I)。
总的来说,这些结果指示cfCas13d展现出高的RNA干扰活性和极少的附带效果,这将最大限度地发挥其应用。
另一方面,获得了多种展现出双切割活性增加的低保真Cas13变体(图17D和19C的左下)。Cas13的这些变体更适合于核酸检测应用(如SHERLOCK)。
实施例9cfCas13d中转录组范围的附带效果的消除
为了全面检测Cas13d/cfCas13d介导的敲低的附带效果,在经Cas13d、cfCas13d或dCas13d处理的HEK293细胞中进行了转录组范围的RNA测序(RNA-seq)。
相对于dCas13d对照,在表达使用RPL4 gRNA3的Cas13d的细胞中鉴定了显著广泛的脱靶转录变化(分别为2007/6750个显著上调/下调的基因),以及显著的RPL4中靶敲低。未显示出如通过RNA测序确定的Cas13d与dCas13d介导的RPL4、PPIA、CA2或PPARG敲低之间的差异性转录物水平的散点图(n=3)。在这些显著变化中,鉴定了11个预测的RPL4 gRNA依赖性脱靶转录物中的1个(RPL4P5,一种经加工的假基因)(图21A)。当使用不同gRNA靶向RPL4时观察到相似的模式(数据未显示——与dCas13d相比,如通过RNA测序确定的,使用RPL4-g1或PPIA-g2进行由Cas13d介导的敲低诱导的差异性转录物水平的散点图(n=3))。
与dCas13d对照相比,当靶向PPIA、CA2或PPARG时,发现了多个Cas13d诱导的脱靶变化(图21A和21E)。
另外,在Cas13d组与dCas13d组之间显著下调的那些变化中,靶向具有相对高的表达水平的基因(RPL4、PPIA)比靶向具有相对低的表达水平的基因(CA2、PPARG)诱导了更多的附带切割,并且那些附带切割在高表达的基因上诱导了比低表达的基因更多的RNA转录物敲低(数据未显示——与dCas13d相比,由Cas13d介导的RPL4、PPIA敲低诱导的下调转录物的计数在统计学上减少)。减少的计数与内源性转录物的表达水平相关,与先前的结果一致(图20B和20C)。
与Cas13d相比,cfCas13d在靶向RPL4(下调的基因,6750相比于39)、PPIA(9289相比于8)、CA2(3519相比于18)和PPARG(1601相比于52)时显著减少了脱靶变化。此外,cfCas13d也可以像Cas13d那样靶向预测的gRNA依赖性脱靶位点,这表明cfCas13d中的突变会减少附带的脱靶切割,但不会减少gRNA依赖性脱靶切割(图21A和21E)(数据未显示——与dCas13d相比,如通过RNA测序确定的,使用RPL4-g1或PPIA-g2进行由cfCas13d介导的敲低诱导的差异性转录物水平的散点图(n=3))。
那些结果表明,cfCas13d几乎消除了Cas13d附带活性诱导的脱靶编辑,并且那些gRNA依赖性脱靶可以经由优化gRNA的设计来消除。
进一步分析表明,由靶向RPL4/PPIAgRNA的CasRx诱导的那些下调的基因大多数分布在代谢、生物合成过程、细胞周期和信号转导途径中,而cfCasRx在这些过程中展现出明显减少的脱靶变化(图21C和21D)。
当靶向RPL4时,虽然一些基因类似地下调(例如,TP53BP2、ZMPSTE24和FAM157C)或上调(例如,PPP1R3F),但大量的独特基因仅在RPL4-g1组或RPL4-g3组中发生变化。
此外,当靶向PPIA时,在PPIA-g1组与PPIA-g2组之间未发现下调的或上调的基因的重叠。此外,大部分来自靶向RPL4/PPIA的Cas13d的上调的基因富集在核小体组装和基因表达途径中,与切割事件后的细胞应激调节有关(数据未显示——具有由靶向RPL4/PPIA的Cas13d/cfCas13d造成的差异性表达水平的基因的批量RNA-seq分析,显示出对由靶向RPL4/PPIA的Cas13d诱导上调的基因的聚类分析)。
这些表明Cas13d介导的RNA减少的附带效果可以抑制细胞生长,这与先前的报告一致,即,Cas13诱导的大量宿主转录物降解导致细胞生长迟缓和休眠。
这些发现表明,cfCas13d保持了高特异性的中靶敲低,但Cas13d介导的RNA敲低诱导的附带效果大大减少或甚至完全消除。
实施例10对细胞生长的附带效果的消除
为了进一步确定由于体内Cas13d介导的RNA敲低诱导的附带效果对细胞功能的影响,通过使用具有靶向RPL4的强力霉素(dox)诱导型Cas13d/cfCas13d/dCas13d表达的piggyBac转座子系统构建了稳定的细胞系(图22A)。
在dox处理后,发现携带Cas13d的细胞克隆对细胞生长有显著的延缓作用,并且RPL4转录物明显减少。
相比之下,携带cfCas13d的细胞克隆对细胞生长没有展现出这样的变化,同时RPL4转录物也有类似的显著减少(图22B)。
这些发现表明,在HEK293T细胞中由Cas13d介导的RNA敲低诱导的附带效果可以导致严重的细胞生长延缓。同时,使用高保真cfCas13d进行的靶RNA敲低缓解细胞生长停滞。
实施例11cfCas13e在小鼠AMD模型中用于基因疗法的用途
年龄相关性黄斑变性(AMD)是一种在多达90%的患者中无法治疗的进行性病症,是全球老年人失明的主要原因。AMD的两种形式(湿性和干性)分别基于存在或不存在破坏性侵入视网膜的血管进行分类。虽然湿性AMD仅影响10%-15%的AMD患者,但它会突然出现,并且如果不进行治疗会迅速进展为失明。对湿性AMD背后的分子机制进行详细了解导致了几种稳健的FDA批准的疗法。
湿性AMD以脉络膜新生血管形成(CNV)为典型,其中新的未成熟的血管从下方的脉络膜向视网膜外层生长,通过布鲁赫膜的破裂进入视网膜下色素上皮(sub-RPE)或视网膜下腔。CNV是视力丧失的主要原因。
二十世纪八十年代末和二十世纪九十年代初的研究揭示了VEGF在血管生物学中的核心作用,这导致FDA批准的第一个针对湿性AMD的抗VEGF-A治疗——单克隆抗体安维汀(Avastin)(基因泰克公司(Genentech)的贝伐珠单抗)的开发。最近,在2011年,艾力雅(Eylea)(VEGF-TRAP-Eye;阿柏西普;再生元公司(Regeneron))获得了FDA批准用于治疗CNV。阿柏西普是一种重组融合蛋白,其由来自人VEGF受体1和2的胞外结构域的VEGF结合部分组成,这些部分与人IgG1免疫球蛋白的Fc部分融合。它与循环VEGF结合并起到像“VEGF陷阱(VEGF trap)”的作用,以抑制VEGF-A和VEGF-B以及胎盘生长因子(PGF)的活性,从而抑制脉络膜毛细血管中新血管的生长。
2013年底,成都康弘药业集团(Chengdu Kanghong Pharmaceutical Group)获得国家食品药品监督管理总局(CFDA)的批准将康柏西普用于治疗渗出性黄斑变性。相似地,康柏西普是一种重组融合蛋白,其由VEGFR1的第二Ig结构域以及VEGFR2的第三和第四Ig结构域与人IgG1的恒定区(Fc)组成。
本实施例利用湿性AMD的小鼠模型来表明cfCas13e与野生型Cas13e一样,可以高效地敲低VEGFA以减少CNV。
先前鉴定了两种靶向VEGFA的指导RNA分子gRNA-1(g1)和gRNA-2(g2),它们能够在哺乳动物细胞中引导高效率gRNA指导的VEGFAmRNA切割和表达敲低,尤其是当将它们组合(g1+g2)使用时。gRNA的对应DNA序列是:gRNA-1(g1)(SEQ ID NO:879)和gRNA-2(g2)(SEQID NO:880)。
在本实验中,将cfCas13e的编码序列(包括N-末端和C-末端处的两个NLS序列,在EFS启动子下)和两个gRNA的编码序列(g1+g2,在U6启动子的控制下)并入AAV9病毒载体(具有AAV9血清型)的两个ITR序列之间。将病毒颗粒直接注射到小鼠视网膜下腔中。在21天后,在实验小鼠的眼睛上使用了激光来模拟UV诱导的AMD。在七天后,确定了实验动物中CNV的程度(参见图19H和19I)。
在图19H中,将VEGFA靶mRNA的表达针对未处理的对照动物进行了归一化。显然,当仅提供非靶向(NT)指导RNA时,cfCase13e不影响VEGFA表达。相比之下,当提供g1和g2指导RNA两者时,cfCas13e高效地将VEGFA表达敲低至与野生型Cas13e相同的程度,并且敲低至几乎无法检测到的水平(图19H)。
作为另一对照,某些对照动物在激光治疗时也接受了阿柏西普或康柏西普治疗(图19H)。图19I的结果显示,与PBS对照相比,两种治疗均显著减少了CNV面积。值得注意的是,所有三种剂量的cfCas13e治疗(5E11、2E11和1E13 vg/kg)都显著减少了CNV(图19I)。与阿柏西普治疗和康柏西普治疗两者相比,2E11剂量在统计学上实现了显著更好(更低)的CNV面积(图19I)。
在本实验中,AAV9病毒载体的ITR序列为SEQ ID NO:881,并且用于驱动cfCas13e表达的EFS启动子的核苷酸序列为SEQ ID NO:882。
总之,通过3D结构和蛋白序列的组合分析,申请人设计、构建并通过筛选获得了大量附带效果减少或消除的突变体Cas13变体(以及附带效果增强的变体)。这些Cas13e和Cas13d突变体/变体的指导RNA介导的功能已通过体外生化反应、哺乳动物细胞中内源性基因表达敲低以及体内AMD小鼠模型中的基因疗法得到验证。
这些结果表明,根据本发明的方法和实施例,通过例如在HEPN结构域(HEPN1和HEPN2)内的RXXXXH催化活性位点中和周围引入点突变,可以将Cas13家族蛋白(包括但不限于Cas13d和Cas13e)的附带效果工程化。这些引入的突变可能不会影响相应的cfCas13蛋白与同源gRNA之间的结合,使得cfCas13突变体仍然可以受到激活以通过gRNA依赖性方式切割靶RNA。同时,与对应的野生型Cas13相比,cfCas13突变体的附带效果大大减少,从而消除了在基因疗法中使用Cas13的一个显著的风险。cfCas13突变体如何运作的可能(非限制性)机制在图22C中说明。
所述实施例的材料与方法在下面提供。
质粒的构建。
Cas13d(CasRx)基因和gRNA骨架序列由商业来源合成。生成了载体CAG-Cas13d-p2A-GFP和U6-DR-BpiI-BpiI-DR-EF1α-mCherry以通过瞬时转染敲低靶基因。将gRNA寡聚物退火并连接到BpiI位点。gRNA序列在下面列出。
细胞培养、转染和流式细胞术分析
HEK293T细胞系购自中国科学院干细胞库(Stem Cell Bank,Chinese Academy ofSciences)。将HEK293T细胞系在37℃下用5%CO2在培养箱中用补充有10%胎牛血清(吉布科公司(Gibco))、1%青霉素/链霉素(赛默飞世尔科技公司(Thermo Fisher Scientific))和0.1mM非必需氨基酸(吉布科公司)的DMEM(吉布科公司)培养。当细胞达到90%汇合时,将HEK293T细胞以1:4的比率传代到12孔板中。在12hr后,使用标准方案,用Lipofectamine3000(赛默飞世尔科技公司)将2μg/孔质粒转染到细胞中。转染后48hr,将50,000个EGFP和mCherry阳性细胞通过BD FACS Aria II分选用于RNA提取。对于mCherry敲低组,收集了12孔板的总细胞用于RNA提取。使用FlowJo V10.5.3分析了流式细胞术的结果。对于转基因细胞系,将细胞扩大培养用于dox(1μg/mL)诱导。
总RNA的收获和定量PCR。
通过向细胞中添加500μL的Trizol(英杰公司(Invitrogen))、200μL的氯仿来提取总RNA。在4℃下以12,000rpm离心15min后,将上清液转移至1.5mL无RNA酶的管中。添加100%异丙醇和75%酒精以沉淀并纯化RNA。根据制造商的说明,使用针对qPCR的HiScriptQ RT SuperMix(诺唯赞生物科技公司(Vazyme,Biotech))制备了cDNA。
使用AceQ qPCR SYBR Green预混物(诺唯赞生物科技公司)进行了qPCR反应。所有试剂均提前预冷。使用-ΔΔCt方法对qPCR结果进行了分析。
Cas13d突变体的设计和构建
首先生成了无偏多合一载体CAG-Cas13d-U6-DR-gRNA-SV40-EGFP-SV40-mCherry和CMV-Cas13e-SV40-EGFP-SV40-mCherry-U6-DR-gRNA-DR,其中gRNA靶向EGFP。然后,经由PCR进行的定点诱变和使用NEBuilder HiFi DNA组装预混物(新英格兰生物实验室公司(New England BioLabs))的Gibson组装方法引入了21个具有BpiI的Cas13突变体,每个突变体跨越36个氨基酸。
对于Cas13d,为了覆盖所有的可突变区域,通过将两个磷酸化的寡聚物(一个野生型寡聚物和另一个突变体寡聚物)连接到对应的经BpiI消化的骨架中,设计并生成了一百多个具有四个或五个随机氨基酸取代(将所有非丙氨酸替代为丙氨酸,X>A,并将丙氨酸替代为缬氨酸,A>V)的突变体。
为了鉴定突变体N2V8和N2V7内或附近的氨基酸的作用,生成了又一个17个氨基酸跨度的具有BpiI的Cas13突变体N2R,然后通过将退火的突变体寡聚物连接到对应的经BpiI消化的骨架中引入了单个、双重、三重或四重突变。
对于Cas13e,通过将退火的突变体寡聚物连接到对应的经BpiI消化的骨架中,生成了在两个区域(M17和M18)中具有四个或五个随机氨基酸取代的合理设计的突变体。
使用I-TASSER进行蛋白结构预测。
使用流式细胞术分析筛选高保真Cas13d
在48孔板中进行了Cas13突变体筛选,并在24孔板中进行了整合(consolidation)。转染用于筛选的前一天,将3×104个细胞/孔铺板在0.25mL的完全生长培养基中。在12小时后,将0.5μg质粒转染到具有1.25μg PEI的HEK293细胞中(DNA:PEI=1:2.5)。
对于24孔板,将1×105个细胞/孔铺板在0.5mL的完全生长培养基中,将0.8μg质粒转染到具有2.5μg PEI的HEK293细胞中。转染后48小时,通过BD FACS Aria II分析了细胞。使用FlowJo V10.5.3分析了流式细胞术的结果。
Cas13的蛋白纯化
根据如先前所述的方案进行了Cas13蛋白纯化。合成了针对Cas13d/cfCas13d/Cas13e/cfCas13e的人源化的经密码子优化的基因(华津公司(Huagene)),并且在用NEBuilder HiFi DNA组装克隆试剂盒(新英格兰生物实验室公司)通过BamHI和NotI消化质粒后,将所述基因克隆到细菌表达载体(pC013-Twinstrep-SUMO-huLwCas13a,质粒编号90097)中。
将表达构建体转化到BL21(DE3)(天根公司(TIANGEN))细胞中。用10mL的12hr生长培养物接种一升的LB肉汤生长培养基(胰蛋白胨10.0g;酵母提取物5.0g;NaCl 10.0g,生工生物工程公司(Sangon Biotech))。然后使细胞在37℃下生长至细胞密度A600为0.6,然后通过补充500mM IPTG诱导了SUMO-Cas13蛋白表达。使诱导的细胞在16℃下生长16-18小时,然后通过离心(4,000rpm,20min)收获。将收集的细胞重悬于缓冲液W(Strep-Tactin纯化缓冲液套装,IBA公司)中,并使用超声波匀浆器(新芝公司(Scientz))裂解。
通过离心去除了细胞碎片,并将澄清的裂解物加载到StrepTactin琼脂糖高效柱(StrepTrap HP,通用医疗集团(GE Healthcare))上。非特异性结合蛋白和污染物流出。用洗脱缓冲液(Strep-Tactin纯化缓冲液套装,IBA公司)洗脱了靶蛋白。通过SUMO蛋白酶去除了N-末端6x His/Twinstrep-SUMO标签(“6x His”披露为SEQ ID NO:947)(4℃,>20小时)。然后通过凝胶过滤(S200,通用医疗集团)对靶蛋白进行了最后的精制步骤(polishingstep)。通过SDS-PAGE评估了纯度>95%。
Cas13中靶和附带切割活性测定
如前所述,对Cas13核酸酶活性进行了荧光标记的ssRNA报告测定。对于中靶切割活性分析,使用以下进行了测定:45nM纯化的Cas13d/cfCas13d/Cas13e/cfCas13e、22.5nMcrRNA、125nM淬灭的荧光RNA报告子(生工生物工程公司)、1μL鼠RNA酶抑制剂(新英格兰生物实验室公司)、100ng的背景总人RNA(从HEK293T细胞培养物中纯化)和不同量的输入核酸靶标,除非另有说明,否则在核酸酶测定缓冲液(40mM Tris-HCl,包括25mM Tris-HCl(pH7.5)和25mM Tris-HCl(pH 7.0)、60mM NaCl、6mM MgCl2,pH 7.3)中。允许反应在荧光板读取器(德国耶拿分析仪器股份公司(Analytik Jena))上在37℃下进行1-3hr,每5min测量荧光动力学。
RNA-seq和分析
对于转录组测序,将35μg的多合一质粒转染到在10cm培养皿中培养的HEK293细胞中。然后分选出600,000个双阳性EGFP+/mCherry+(前15%)细胞,以制成用于测序的池。用基于TRIZOL的方法提取了总RNA,将其片段化,并根据制造商的说明,用针对qPCR的HiScriptQ RT SuperMix(诺唯赞生物科技公司)将其逆转录为cDNA。生成了RNA-seq文库,并使用诺禾致源公司(Novogene)的Illumina Hiseq X-ten平台评估了质量。细胞组(RPL4 gRNA1、RPL4 gRNA3、PPIA gRNA1、PPIA gRNA2、CA2 gRNA1和PPARG gRNA1)之间的差异性分析通过基于计数的方法limma完成,所述方法以R实现,并且voom参与归一化。首先通过BH调节的P值0.05筛选了显著表达的基因,将其用2倍变化进一步过滤。在用GSEA v3.0(博德研究所(Broad Institute),PreRanked模式)进行富集分析,并将limma的t统计输出作为排名度量、将1,000个基因集排列设置为默认后,通过收集来自KEGG的途径和来自GO的生物过程获得了基因集。FDR的P值<0.05的基因集将被视为显著富集。
生长曲线
在使用或不使用dox处理(1μg/mL)的情况下,将具有dCas13d/Cas13d/cfCas13d和RPL4 gRNA的单个细胞克隆以2×105个细胞/mL铺板在24孔板上。在24、48、72、96和120小时收集了细胞。通过自动细胞计数器(C10311,英杰公司)对细胞数目进行了计数。实验进行了三个重复。
细胞增殖的确定。
通过使用比色噻唑蓝(MTT)测定评估了细胞增殖。简言之,在使用或不使用dox处理(1μg/mL)的情况下,将具有dCas13d/Cas13d/cfCas13d和RPL4 gRNA的单个细胞克隆处理0、24、48、72、96或120小时。然后收集了每组细胞,并在使用或不使用dox处理(1μg/mL)的情况下将其进一步以2×105个细胞/mL铺板在24孔板上。在37℃孵育24小时的时间段后,添加四唑盐MTT(西格玛化学公司(Sigma-Chemie))至终浓度为2μg/mL,并继续孵育4小时。将细胞洗涤3次,最后用二甲亚砜裂解。MTT的代谢与细胞数目直接相关,并通过使用微板读取器(7500型;剑桥科技公司(Cambridge Technology),沃特敦(Watertown),马塞诸塞州)测量550nm(参考波长,690nm)处的吸光度来定量。实验进行了五个重复。
统计分析
通过Graphpad Prism 8执行的统计学检验包括双尾非配对双样品t检验或对数秩Mantel-Cox检验。针对每幅图使用的相应统计学检验在对应的图的图例中注明,并且显著的统计学差异注明为*P<0.05、**P<0.01、***P<0.001。所有值均报告为平均值±s.e.m.。
实施例12通过诱变消除Cas13f的附带效果
先前已在神经胶质瘤细胞、果蝇和哺乳动物细胞中发现了Cas13效应酶家族进行的附带RNA降解。基于如本文描述的用于检测附带效果的快速且灵敏的双荧光报告系统,本实施例表明,Cas13f确实可以在HEK293T细胞中诱导实质性的附带效果。基于以下发现,所述实施例还表明其他Cas13f的附带效果也可以经由诱变而减弱(如果未消除):改变HEPN结构域中靠近催化位点RXXXXH的RNA结合裂隙可以选择性地减少混杂的RNA结合和非靶切割,同时保持中靶RNA切割。
特别地,为了评价Cas13f在哺乳动物细胞中的附带效果,将不同的Cas13f变体与EGFP和mCherry编码序列以及靶向的(针对EGFP)指导RNA(gRNA)一起共转染至HEK293T细胞中。在转染后48小时测量了靶向的EGFP和非靶向的mCherry的表达水平(图25)。
使用了公开可获得的在线工具TASSER预测Cas13f的3D结构,并且使用PyMOL对预测结构进行了可视化,以确定3D中各个结构性结构域的位置(参见图26)。
然后基于本文描述的双荧光系统设计了无偏筛选系统,其中将EGFP、mCherry、靶向EGFP的gRNA以及每个Cas13变体的编码序列插入到质粒中,用于在293T细胞中表达。在该系统中,EGFP的表达和mCherry的表达由相同的SV40启动子驱动,以确保报告基因在经转染的宿主细胞中大致相同的稳定表达。选择了对EGFP mRNA具有特异性的gRNA。Cas13f和变体的每个编码序列都具有N-末端和C-末端核定位信号(NLS),并且Cas13f和变体/突变体的表达由强CAG启动子驱动。
EGFP和mCherry编码序列分别是SEQ ID NO:1和2。gRNA的对应DNA序列是SEQ IDNO:3。SV40启动子序列是SEQ ID NO:104。野生型Cas13f蛋白序列是SEQ ID NO:52。CAG启动子序列是SEQ ID NO:103。
选择了Cas13f的HEPN1、HEPN2、Helical1和Helical2结构域来生成Cas13f诱变文库。首先,将这些区域分成47个小区段(F1-F47),每个区段为约17个残基(图27)。
为了便于后续的选择,在所述区段的每个末端处引入了BpiI限制酶识别位点(GTCTTC,对应于编码的残基VF;反向互补序列GAAGAC,对应于编码的残基ED)。当产生突变体时,所有非Ala残基都经Ala取代,并且所有Ala残基都经Val取代(例如,将所有非丙氨酸替代为丙氨酸,X>A;并且将丙氨酸替代为缬氨酸,A>V)。在每个区段侧翼的两个BpiI位点之间引入了约4-5个总突变。如此生成的各种突变体及它们对应的野生型序列在下面提供。
使用本发明的EGFP-mCherry双荧光报告系统对这些Cas13f突变体进行功能性筛选,以评估它们的附带切割活性相比于gRNA指导的切割活性。特别地,根据标准细胞培养方法,使人HEK293细胞在24孔组织培养板中生长至合适的密度,然后用PEI试剂以及表达每个突变体Cas13f和报告系统荧光蛋白的质粒转染所述细胞。将经转染的细胞在37℃在5%CO2下在培养箱中培养约48小时,然后用FACS测量所述细胞中的EGFP和mCherry信号。选择了导致gRNA靶向的EGFP信号的百分比低(EGFP+细胞的百分比较低,作为保存gRNA指导的切割的读数)且非靶向的mCherry信号的百分比高(mCherry+细胞的百分比较高,作为缺乏附带效果的读数)的突变体。
在本实验中,将无gRNA指导的切割的dCas13f用作阴性对照,并且将结果(平均值±s.e.m.)针对dCas13f的结果进行归一化并在下面列出。位于图28左上区的Cas13f突变体/变体具有低的附带效果(高mCherry信号)和高的gRNA指导的切割活性(低EGFP信号),并将其选择为所希望的低/无附带效果的突变体。
通过无活性的死Cas13f(在HEPN结构域中具有R77A、H82A、R764A和H769A突变的dCas13f)将EGFP和mCherry荧光强度归一化后,发现在F10、F38、F40或F46中具有突变位点的变体(特别是F10V1、F10V4、F38V2、F40V2、F40V4、F46V1和F46V3)与野生型相比展现出相对低的EGFP荧光强度但高(或低)得多的mCherry荧光强度,这表明这些变体保留了高的中靶活性但大大降低(或增强)了附带活性(图28)。
通过生成多种具有单个或多个(例如,双重、三重或四重)组合突变的额外的突变体,在这些突变体的这些区域(F10V1、F10V4、F38V2、F40V2、F40V4、F46V1和F46V3)中或附近进行了进一步的诱变研究。这些突变体/变体的序列在下面列出:
在本实验中,将无gRNA指导的切割的dCas13f用作阴性对照,并且将结果(平均值±s.e.m.)针对dCas13f的结果进行归一化并在下面列出。位于图29左上区的Cas13f突变体具有低的附带效果(高mCherry信号)和高的gRNA指导的切割活性(低EGFP信号),并将其选择为所希望的低/无附带效果的突变体。
总体而言,一些Cas13f突变体展现出低的附带效果(例如,≤25%的附带效果,或≥75%的mCherry+细胞)和高(例如,EGFP+细胞≤25%)至中等的gRNA指导的切割(例如,25%≤EGFP+细胞≤75%),包括:F40S23((Y666A、Y677A),SEQ ID NO:1635)和F40S27等(参见下表以及图28和图29)。基于FACS数据(未显示),与野生型相比,这些突变体具有显著减少的附带效果。
其他突变体/变体保留了高的gRNA指导的切割(例如,EGFP+细胞≤25%),但也展现出高于野生型水平的附带活性(例如,≤25%的mCherry+细胞)。参见上表。这些突变体/变体可用于更好/更敏感的检测方法,如SHERLOCK。

Claims (39)

1.一种工程化的Cas13效应酶,其中所述工程化的Cas13相对于氨基酸序列如SEQ IDNO: 4所示的野生型Cas13e.1的突变为Y672A和Y676A。
2.如权利要求1所述的工程化的Cas13效应酶,所述工程化的Cas13效应酶进一步包含核定位信号序列或核输出信号。
3.如权利要求2所述的工程化的Cas13效应酶,所述工程化的Cas13效应酶包含N-末端和/或C-末端NLS。
4.一种多核苷酸,所述多核苷酸编码如权利要求1-3中任一项所述的工程化的Cas13效应酶。
5.如权利要求4所述的多核苷酸,所述多核苷酸经密码子优化以在真核生物中表达。
6.一种载体,所述载体包含如权利要求4或5所述的多核苷酸。
7.如权利要求6所述的载体,其中所述多核苷酸与启动子和任选的增强子可操作地连接。
8.如权利要求7所述的载体,其中所述启动子是组成型启动子、诱导型启动子、泛素启动子或组织特异性启动子。
9.如权利要求6-8中任一项所述的载体,所述载体是质粒。
10.如权利要求6-8中任一项所述的载体,所述载体是逆转录病毒载体、噬菌体载体、腺病毒载体、单纯疱疹病毒载体、AAV载体或慢病毒载体。
11.如权利要求10所述的载体,其中所述AAV载体是血清型AAV1、AAV2、AAV4、AAV5、AAV6、AAV7、AAVrh74、AAV8、AAV9、AAV10、AAV 11、AAV 12或AAV 13的重组AAV载体。
12.一种递送系统,所述递送系统包含 (1) 递送媒介物,和 (2) 如权利要求1-3中任一项所述的工程化的Cas13效应酶、如权利要求4或5所述的多核苷酸、或如权利要求6-11中任一项所述的载体。
13.如权利要求12所述的递送系统,其中所述递送媒介物是纳米颗粒、脂质体、外泌体、微泡或基因枪。
14.一种细胞或其后代,所述细胞或其后代包含如权利要求1-3中任一项所述的工程化的Cas13效应酶、如权利要求4或5所述的多核苷酸、或如权利要求6-11中任一项所述的载体,其中所述细胞或其后代不是植物细胞。
15.如权利要求14所述的细胞或其后代,所述细胞或其后代是真核细胞或原核细胞,其中所述细胞或其后代不是植物细胞。
16.一种非人多细胞真核生物,所述非人多细胞真核生物包含如权利要求14或15所述的细胞,其中所述非人多细胞真核生物不是植物。
17.如权利要求16所述的非人多细胞真核生物,所述非人多细胞真核生物是针对人遗传障碍的动物模型。
18.一种非治疗性的修饰靶RNA的方法,所述方法包括使所述靶RNA与CRISPR-Cas13复合物接触,所述CRISPR-Cas13复合物包含如权利要求1-3中任一项所述的工程化的Cas13效应酶和与所述靶RNA的至少15个核苷酸互补的间隔序列;其中在所述复合物通过所述间隔序列与所述靶RNA结合后,所述工程化的Cas13效应酶修饰所述靶RNA。
19.如权利要求18所述的方法,其中通过由所述工程化的Cas13效应酶进行切割来修饰所述靶RNA。
20.如权利要求18或19所述的方法,其中所述靶RNA是mRNA、tRNA、rRNA、非编码RNA、lncRNA或核RNA。
21.如权利要求18或19所述的方法,其中所述靶RNA在细胞内。
22.如权利要求21所述的方法,其中所述细胞是癌细胞。
23.如权利要求21所述的方法,其中所述细胞受感染原感染。
24.如权利要求23所述的方法,其中所述感染原是病毒、朊病毒、原生动物、真菌或寄生物。
25.如权利要求21所述的方法,其中所述细胞是神经元细胞。
26.如权利要求21所述的方法,其中所述CRISPR-Cas13复合物由以下编码:编码所述工程化的Cas13效应酶的第一多核苷酸,以及包含或编码能够与所述靶RNA结合的间隔RNA的第二多核苷酸,其中将所述第一多核苷酸和所述第二多核苷酸引入所述细胞中。
27.如权利要求26所述的方法,其中通过相同的载体将所述第一多核苷酸和所述第二多核苷酸引入所述细胞中。
28.如权利要求21所述的方法,所述方法导致以下中的一项或多项:(i) 体外诱导细胞衰老;(ii) 体外细胞周期停滞;(iii) 体外细胞生长抑制;(iv) 体外诱导无反应性;(v)体外诱导细胞凋亡;以及 (vi) 体外诱导坏死。
29.包含如权利要求1-3中任一项所述的工程化的Cas13效应酶或编码所述工程化的Cas13效应酶的多核苷酸以及与病症或疾病相关的靶RNA的至少15个核苷酸互补的间隔序列的CRISPR-Cas复合物在制备用于在有需要的受试者中治疗所述病症或疾病的药物中的用途。
30.如权利要求29所述的用途,其中所述病症或疾病是神经病症、癌症或感染性疾病。
31.如权利要求30所述的用途,其中所述癌症是威尔姆斯肿瘤、尤因肉瘤、神经内分泌肿瘤、胶质母细胞瘤、神经母细胞瘤、黑素瘤、皮肤癌、乳腺癌、结肠癌、直肠癌、前列腺癌、肝癌、肾癌、胰腺癌、肺癌、胆道癌、子宫颈癌、子宫内膜癌、食道癌、胃癌、头颈癌、甲状腺髓样癌、卵巢癌、神经胶质瘤、淋巴瘤、白血病、骨髓瘤、霍奇金淋巴瘤、非霍奇金淋巴瘤或膀胱癌。
32.如权利要求31所述的用途,其中所述白血病为急性淋巴细胞白血病、急性骨髓性白血病、慢性淋巴细胞白血病或慢性骨髓性白血病。
33.如权利要求30所述的用途,其中所述神经病症是青光眼,与年龄相关的RGC丧失,视神经损伤,视网膜缺血,莱伯遗传性视神经病变,与RGC神经元退化相关的神经病症,与有需要的受试者的纹状体中功能性神经元退化相关的神经病症,帕金森病,阿尔茨海默病,亨廷顿病,精神分裂症,抑郁症,药物成瘾,运动障碍,双相障碍,自闭症谱系障碍或功能失调。
34.如权利要求33所述的用途,其中所述运动障碍为舞蹈病、舞蹈徐动症或动作障碍。
35.一种CRISPR-Cas复合物,所述CRISPR-Cas复合物包含如权利要求1-3中任一项所述的工程化的Cas13效应酶和指导RNA,所述指导RNA包含与所述工程化的Cas13效应酶结合的DR序列和间隔序列,所述间隔序列设计成与靶RNA互补并与其结合。
36.如权利要求35所述的CRISPR-Cas复合物,其中所述靶RNA由真核DNA编码。
37.如权利要求36所述的CRISPR-Cas复合物,其中所述真核DNA是非人哺乳动物DNA、非人灵长类动物DNA、人DNA、植物DNA、昆虫DNA、鸟DNA、爬行动物DNA、啮齿动物DNA、鱼DNA、蠕虫/线虫DNA、酵母DNA。
38.如权利要求35-37中任一项所述的CRISPR-Cas复合物,其中所述靶RNA是mRNA。
39.如权利要求35-37中任一项所述的CRISPR-Cas复合物,所述CRISPR-Cas复合物进一步包含靶RNA,所述靶RNA包含能够与所述间隔序列杂交的序列。
CN202180018124.0A 2020-09-30 2021-09-29 工程化的CRISPR/Cas13系统及其用途 Active CN116096875B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410088378.5A CN118109438A (zh) 2020-09-30 2021-09-29 工程化的CRISPR/Cas13系统及其用途

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
CNPCT/CN2020/119559 2020-09-30
CN2020119559 2020-09-30
PCT/CN2021/079821 WO2022188039A1 (en) 2021-03-09 2021-03-09 Engineered crispr/cas13 system and uses thereof
CNPCT/CN2021/079821 2021-03-09
PCT/CN2021/121926 WO2022068912A1 (en) 2020-09-30 2021-09-29 Engineered crispr/cas13 system and uses thereof

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202410088378.5A Division CN118109438A (zh) 2020-09-30 2021-09-29 工程化的CRISPR/Cas13系统及其用途

Publications (2)

Publication Number Publication Date
CN116096875A CN116096875A (zh) 2023-05-09
CN116096875B true CN116096875B (zh) 2023-12-01

Family

ID=84284882

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202180018124.0A Active CN116096875B (zh) 2020-09-30 2021-09-29 工程化的CRISPR/Cas13系统及其用途
CN202410088378.5A Pending CN118109438A (zh) 2020-09-30 2021-09-29 工程化的CRISPR/Cas13系统及其用途

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202410088378.5A Pending CN118109438A (zh) 2020-09-30 2021-09-29 工程化的CRISPR/Cas13系统及其用途

Country Status (3)

Country Link
US (1) US20220389398A1 (zh)
EP (1) EP4222253A1 (zh)
CN (2) CN116096875B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4110933A4 (en) 2020-02-28 2024-02-21 HuidaGene Therapeutics Co., Ltd. TYPE VI-E AND TYPE VI-F CRISPR CAS SYSTEMS AND USES THEREOF
WO2023185878A1 (en) * 2022-03-28 2023-10-05 Huidagene Therapeutics Co., Ltd. Engineered crispr-cas13f system and uses thereof
WO2024124238A1 (en) * 2022-12-09 2024-06-13 Amber Bio Inc. Gene-modifying endonucleases
CN115948401A (zh) * 2022-12-19 2023-04-11 中国科学技术大学 一种多靶点rna靶向敲低系统及应用
CN116333081B (zh) * 2022-12-27 2025-09-19 大连海洋大学 长牡蛎CgVg功能域DUF1943和VWD重组蛋白及应用
WO2024155245A2 (en) * 2023-01-18 2024-07-25 National Science And Technology Development Agency Mutant cas13b with improved efficiency
CN116162609A (zh) * 2023-03-28 2023-05-26 尧唐(上海)生物科技有限公司 Cas13蛋白、CRISPR-Cas系统及其应用

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109642231A (zh) * 2016-06-17 2019-04-16 博德研究所 Vi型crispr直向同源物和系统
WO2020028555A2 (en) * 2018-07-31 2020-02-06 The Broad Institute, Inc. Novel crispr enzymes and systems

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11168322B2 (en) * 2017-06-30 2021-11-09 Arbor Biotechnologies, Inc. CRISPR RNA targeting enzymes and systems and uses thereof
CN112020560B (zh) * 2018-04-25 2024-02-23 中国农业大学 一种RNA编辑的CRISPR/Cas效应蛋白及系统
EP4110933A4 (en) * 2020-02-28 2024-02-21 HuidaGene Therapeutics Co., Ltd. TYPE VI-E AND TYPE VI-F CRISPR CAS SYSTEMS AND USES THEREOF
EP4305157A1 (en) * 2021-03-09 2024-01-17 Huidagene Therapeutics (Singapore) Pte. Ltd. Engineered crispr/cas13 system and uses thereof

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109642231A (zh) * 2016-06-17 2019-04-16 博德研究所 Vi型crispr直向同源物和系统
WO2020028555A2 (en) * 2018-07-31 2020-02-06 The Broad Institute, Inc. Novel crispr enzymes and systems

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
RNA Targeting by Functionally Orthogonal Type VI-A CRISPR-Cas Enzymes;Alexandra East-Seletsky;cell press;第373-383 *

Also Published As

Publication number Publication date
CN118109438A (zh) 2024-05-31
US20220389398A1 (en) 2022-12-08
EP4222253A1 (en) 2023-08-09
CN116096875A (zh) 2023-05-09

Similar Documents

Publication Publication Date Title
CN116590257B (zh) VI-E型和VI-F型CRISPR-Cas系统及其用途
CN116096875B (zh) 工程化的CRISPR/Cas13系统及其用途
WO2022068912A1 (en) Engineered crispr/cas13 system and uses thereof
AU2018341985B2 (en) CRISPR/Cas system and method for genome editing and modulating transcription
WO2022188039A1 (en) Engineered crispr/cas13 system and uses thereof
WO2023274226A1 (en) Crispr/cas system and uses thereof
EP3455357A1 (en) Type vi crispr orthologs and systems
KR20180034402A (ko) 신규한 crispr 효소 및 시스템
AU2016279077A1 (en) Novel CRISPR enzymes and systems
WO2023227028A1 (zh) 新型Cas效应蛋白、基因编辑系统及用途
US20250270529A1 (en) Engineered crispr-cas13f system and uses thereof
WO2023030340A1 (en) Novel design of guide rna and uses thereof
US20180105835A1 (en) TARGETED RNA KNOCKDOWN AND KNOCKOUT BY TYPE III-A Csm COMPLEXES
BR122023003757B1 (pt) Sistema de repetição palindrômica curta agrupada e regularmente interespaçada (crispr)-cas, proteína de fusão, e método de modificação de um rna-alvo

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20231219

Address after: Room 1002, Unit 1, Building 7, No. 160, Basheng Road, Free Trade Experimental Zone, Pudong New Area, Shanghai, March 2012

Patentee after: Huida (Shanghai) Biotechnology Co.,Ltd.

Patentee after: Huida Gene Therapy (Singapore) Private Ltd.

Address before: 200131 Room 1002, Unit 1, Building 7, No. 160 Basheng Road, Free Trade Pilot Zone, Pudong New Area, Shanghai

Patentee before: Huida (Shanghai) Biotechnology Co.,Ltd.

TR01 Transfer of patent right