TW202426636A - 新型crispr酶以及系統 - Google Patents
新型crispr酶以及系統 Download PDFInfo
- Publication number
- TW202426636A TW202426636A TW113106828A TW113106828A TW202426636A TW 202426636 A TW202426636 A TW 202426636A TW 113106828 A TW113106828 A TW 113106828A TW 113106828 A TW113106828 A TW 113106828A TW 202426636 A TW202426636 A TW 202426636A
- Authority
- TW
- Taiwan
- Prior art keywords
- sequence
- domain
- crispr
- patent application
- protein
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/111—General methods applicable to biologically active non-coding nucleic acids
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P21/00—Drugs for disorders of the muscular or neuromuscular system
- A61P21/04—Drugs for disorders of the muscular or neuromuscular system for myasthenia gravis
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P27/00—Drugs for disorders of the senses
- A61P27/02—Ophthalmic agents
- A61P27/06—Antiglaucoma agents or miotics
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P35/00—Antineoplastic agents
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8201—Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases [RNase]; Deoxyribonucleases [DNase]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6832—Enhancement of hybridisation reaction
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/16—Aptamers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPR]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/35—Nature of the modification
- C12N2310/351—Conjugate
- C12N2310/3519—Fusion with another nucleic acid
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/80—Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A50/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
- Y02A50/30—Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Biomedical Technology (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Medicinal Chemistry (AREA)
- Cell Biology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Animal Behavior & Ethology (AREA)
- Pharmacology & Pharmacy (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- General Chemical & Material Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Ophthalmology & Optometry (AREA)
- Epidemiology (AREA)
- Mycology (AREA)
- Analytical Chemistry (AREA)
- Immunology (AREA)
- Neurology (AREA)
- Physical Education & Sports Medicine (AREA)
- Orthopedic Medicine & Surgery (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
Abstract
本發明提供了用於靶向核酸的系統、方法和組成物。具體地說,本發明提供了包含新型DNA-靶向CRISPR效應蛋白和至少一種靶向核酸組分如指導RNA的非天然存在的或工程化的DNA靶向系統。在此還揭露並且要求保護用於製備和使用此類系統、方法和組成物之方法和此類系統、方法和組成物的用途以及來自此類方法和用途之產物。
Description
[相關申請並藉由引用結合]
本申請要求於2015年6月18日提交的美國臨時62/181,739;於2015年7月16日提交的美國臨時62/193,507;2015年8月5日提交的美國臨時62/201,542;2015年8月16日提交的美國臨時62/205,733;2015年9月24日提交的美國臨時62/232,067;2015年12月18日提交的美國申請案序號14/975,085以及歐洲申請案號16150428.7的權益和優先權。
將前述申請及其中或它們的訴訟期間(“應用引用文獻”)所引用的所有文獻或在此引用文獻中引用或參考的所有文獻,以及在此或在藉由引用結合在此的任何文獻中提到的任何產品的任何廠商說明書、描述、產品規格和產品清單均藉由引用結合在此,並且可以應用於本發明的實踐中。更具體地,所有參考的文獻藉由引用結合在此,其程度如同將每個單獨的文獻具體並單獨地指明藉由引用結合在此。
[聯邦資助研究的聲明]
本發明係根據由美國國立衛生研究院(National Institutes of Health)授予的批准號MH100706在政府支持下進行。
美國政府享有本發明的某些權利。
[序列表]
本申請含有一份已經以ASCII格式電子遞交的序列表並且該序列表藉由引用以其整體結合在此。創建於2015年12月17日的所述ASCII副本名稱為47627.05.2123_SL.txt並且大小為2,467,205位組。
本發明總體涉及用於控制涉及序列靶向諸如基因轉錄物的干擾或核酸編輯的基因表現的系統、方法以及組成物,該等系統、方法以及組成物可以使用與成簇規律間隔短迴文重複序列(CRISPR)及其組分相關的載體系統。
基因體定序技術和分析方法的最新進展明顯加速了對與不同範圍的生物學功能和疾病相關聯的遺傳因子進行編目和映射的能力。精確的基因組靶向技術對於藉由允許個體遺傳元件的選擇性干擾而使得因果性遺傳變異的系統性逆向工程成為可能,以及推進合成生物學、生物技術學和醫療應用係需要的。雖然基因組編輯技術諸如設計師的鋅指、轉錄活化物樣效應物(TALE)或歸巢大範圍核酸酶(homing meganucleases)可以用於產生靶向基因組干擾,但是仍然需要採用新策略和分子機制並且負擔的起的、易於建立的、可擴展的且便於靶向真核基因組內的多個位置的新基因組工程技術。這將為基因組工程和生物技術的新應用提
供主要資源。
細菌和古細菌的(archaeal)適應性免疫的CRISPR-Cas系統顯示出蛋白質組成和基因組座位體系結構的極端多樣性。CRISPR-Cas系統座位具有超過50種的基因家族並且不存在嚴格的通用基因,這表明了座位體系結構的快速進化和極端多樣性。到目前為止,採用了多分支方法,針對93種Cas蛋白存在約395種表現譜的全面cas基因鑒定。分類包括特徵基因表現譜加上座位體系結構的特徵。提出了新的CRISPR-Cas系統分類,其中該等系統寬泛地分成兩類,具有多亞基效應物複合物的第1類和具有單亞基效應物模組的第2類,藉由Cas9蛋白來舉例說明。與第2類CRISPR-Cas系統相關聯的新型效應蛋白可以被開發為強有力的基因組工程工具並且推定的新型效應蛋白的預測及其工程化和優化係重要的。
本申請案中的任何文獻的引用或鑒定並不承認該文獻作為本發明的先前技術而可以獲得。
對於具有一系列廣泛應用的靶向核酸或多核苷酸(例如,DNA或RNA或其任何雜交體或衍生物)的替代性且穩健的系統和技術存在著迫切需要。本發明著手解決這種需要並且提供了相關優點。將本發明的新型DNA或RNA靶向系統添加到基因組和表觀基因組(epigenomic)靶向技術的全能文庫(repertoire)可以藉由直接的檢測、分析和操縱來轉化特定靶位點的研究和干擾或編輯。為了有效而無有害作用地利用本發明的DNA或RNA靶向系
統用於基因組或表觀基因組的靶向,瞭解該等DNA或RNA靶向工具的工程化和優化方面是關鍵的。
本發明提供了一種修飾與感興趣的靶座位相關聯的或在該靶座位處的序列之方法,該方法包括將包含推定的V型CRISPR-Cas座位效應蛋白和一種或多種核酸組分的非天然存在或工程化的組成物遞送至所述座位,其中效應蛋白與一種或多種核酸組分形成複合物並且在所述複合物與感興趣的座位結合後,效應蛋白誘導對與感興趣的靶座位相關聯的或在該靶座位處的序列的修飾。在一較佳的實施方式中,修飾係股斷裂的引入。在一較佳的實施方式中,與感興趣的靶座位相關聯的或在該靶座位處的序列包括DNA並且效應蛋白由亞型V-A CRISPR-Cas座位或亞型V-B CRISPR-Cas座位編碼。
應瞭解,除非另外表明,否則術語Cas酶、CRISPR酶、CRISPR蛋白、Cas蛋白和CRISPR Cas通常是可以互換使用的並且在所有在此參考方面處以類推方式指進一步描述在本發明中的新型CRISPR效應蛋白,諸如藉由具體參考Cas9。在此所述的CRISPR效應蛋白較佳的是Cpf1效應蛋白。
本發明提供了一種修飾與感興趣的靶座位相關聯的或在該靶座位處的序列之方法,該方法包括將包含Cpf1座位效應蛋白和一種或多種核酸組分的非天然存在或工程化的組成物遞送至與座位相關聯或在該座位處的所述序列,其中Cpf1效應蛋白與一種或多種核酸組分形成複合物並且在所述複合物與感興趣的座位結合後,效應蛋白誘導對與感興趣的靶座位相關聯的或在該靶
座位處的序列的修飾。在一較佳的實施方式中,修飾係股斷裂的引入。在一較佳的實施方式中,Cpf1效應蛋白與核酸組分;有利地工程化的或非天然存在的核酸組分形成複合物。對與感興趣的靶座位相關聯的或在該靶座位處的序列的修飾的誘導可以是Cpf1效應蛋白-核酸指導的。在一較佳的實施方式中,核酸組分係CRISPR RNA(crRNA)。在一較佳的實施方式中,核酸組分係成熟crRNA或指導RNA,其中成熟crRNA或指導RNA包含間隔區序列(或指導序列)和同向重複序列或它們的衍生物。在一較佳的實施方式中,間隔區序列或其衍生物包含種子序列,其中種子序列對識別和/或雜交於靶座位處的序列係關鍵的。在一較佳的實施方式中,FnCpf1指導RNA的種子序列大約在間隔區序列(或指導序列)的5'端上的前5個核苷酸(nt)之內。在一較佳的實施方式中,股斷裂係交錯切割的,產生了5'突出端。在一較佳的實施方式中,與感興趣的靶座位相關聯的或在該靶座位處的序列包括直鏈DNA或超螺旋DNA。
本發明的方面涉及具有一種或多種非天然存在或工程化或修飾或優化的核酸組分的Cpf1效應蛋白複合物。在一較佳的實施方式中,複合物的核酸組分可以包含連接至同向(direct)重複序列的指導序列,其中同向重複序列包括一個或多個莖環或優化的二級結構。在一較佳的實施方式中,同向重複序列具有16個核苷酸的最小長度並且具有單一莖環。在另外的實施方式中,同向重複序列具有長於16個核苷酸,較佳的是(preferrably)超過17個核苷酸的長度,並且具有超過一個的莖環或優化的二級結構。在一較佳的實施方式中,同向重複序列可以被修飾成包含一種或
多種蛋白質結合的RNA適配體。在一較佳的實施方式中,一個或多個適配體可以被包含作為優化的二級結構的一部分。此類適配體可以能夠結合噬菌體外殼蛋白。噬菌體外殼蛋白可以選自下組,該組包括下項:Qβ、F2、GA、fr、JP501、MS2、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、ΦCb5、ΦCb8r、ΦCb12r、ΦCb23r、7s和PRR1。在一較佳的實施方式中,噬菌體外殼蛋白係MS2。本發明還提供了複合物的核酸組分,該核酸組分的長度為30或更多個、40或更多個,或50或更多個核苷酸。
本發明提供了基因組編輯之方法,其中該方法包括兩輪或更多輪的Cpf1效應蛋白靶向和切割。在某些實施方式中,第一輪包括Cpf1效應蛋白切割與遠離種子序列的靶座位相關聯的序列並且第二輪包括Cpf1效應蛋白切割靶座位處的序列。在本發明的較佳的實施方式中,藉由Cpf1效應蛋白進行的第一輪靶向產生了indel並且藉由Cpf1效應蛋白進行的第二輪靶向可以經由同源定向修復(HDR)進行修復。在本發明的一個最較佳的實施方式中,藉由Cpf1效應蛋白進行的一輪或多輪靶向產生了可以藉由修復模板的插入來修復的交錯切割。
本發明提供了基因組編輯或修飾與感興趣的靶座位相關聯的或在該靶座位處的序列之方法,其中該方法包括將Cpf1效應蛋白複合物引入到任何所希望的細胞類型,原核細胞或真核細胞中,由此Cpf1效應蛋白複合物有效地用於將DNA插入物整合到原核細胞或真核細胞的基因組中。在較佳的實施方式中,細胞
係真核細胞並且基因組係哺乳動物基因組。在較佳的實施方式中,DNA插入物的整合藉由基於非同源末端連接(NHEJ)的基因插入機制來實現。在較佳的實施方式中,DNA插入物係外源引入的DNA模板或修復模板。在一個較佳的實施方式中,外源引入的DNA模板或修復模板與Cpf1效應蛋白複合物或一種組分或用於表現複合物組分的多核苷酸載體一起遞送。在一個更較佳的實施方式中,真核細胞係不分裂的細胞(例如,其中經由HDR進行基因組編輯係特別具有挑戰性的不分裂細胞)。在人類細胞中的基因組編輯的較佳的方法中,Cpf1效應蛋白可以包括但不限於FnCpf1、AsCpf1和LbCpf1效應蛋白。
本發明還提供了一種修飾感興趣的靶座位之方法,該方法包括將包含C2c1座位效應蛋白和一種或多種核酸組分的非天然存在或工程化的組成物遞送至所述座位,其中C2c1效應蛋白與一種或多種核酸組分形成複合物並且在所述複合物與感興趣的座位結合後,效應蛋白誘導對感興趣的靶座位的修飾。在一較佳的實施方式中,修飾係股斷裂的引入。
在此類方法中,感興趣的靶座位可以包含在體外的DNA分子中。在一較佳的實施方式中,DNA分子係質粒。
在此類方法中,感興趣的靶座位可以包含在細胞內的DNA分子中。細胞可以是原核細胞或真核細胞。細胞可以是哺乳動物細胞。哺乳動物細胞可以是非人類靈長類動物、牛、豬、齧齒動物或小鼠細胞。細胞可以是非哺乳動物真核細胞諸如家禽、魚或蝦的細胞。細胞還可以是植物細胞。植物細胞可以是栽培植
物諸如木薯、玉米、高粱、小麥或稻具有的細胞。植物細胞還可以是藻類、樹或蔬菜具有的細胞。藉由本發明引入到細胞的修飾可以使得細胞和細胞的子代被改變以改進生物產物諸如抗體、澱粉、乙醇或其他所希望的細胞輸出物的產生。藉由本發明引入到細胞的修飾可以使得細胞和細胞的子代包括使所產生的生物產物發生變化的改變。
本發明提供了一種修飾感興趣的靶座位之方法,該方法包括將包含VI型CRISPR-Cas座位效應蛋白和一種或多種核酸組分的非天然存在或工程化的組成物遞送至所述座位,其中效應蛋白與一種或多種核酸組分形成複合物並且在所述複合物與感興趣的座位結合後,效應蛋白誘導對感興趣的靶座位的修飾。在一較佳的實施方式中,修飾係股斷裂的引入。
在一較佳的實施方式中,感興趣的靶座位包括DNA。
在此類方法中,感興趣的靶座位可以包含在細胞內的DNA分子中。細胞可以是原核細胞或真核細胞。細胞可以是哺乳動物細胞。哺乳動物細胞可以是非人類哺乳動物,例如靈長類動物、牛、羊、豬類、犬、齧齒動物、兔科諸如猴、母牛、綿羊、豬、狗、兔、大鼠或小鼠的細胞。細胞可以是非哺乳動物真核細胞諸如家禽鳥類(例如雞)、脊椎動物魚(例如鮭魚)或甲殼類動物(例如牡蠣、蛤(claim)、龍蝦、蝦)的細胞。細胞還可以是植物細胞。植物細胞可以是單子葉植物或雙子葉植物具有的細胞或栽培植物或糧食植物諸如木薯、玉米、高粱、大豆、小麥、燕麥或稻具有的細胞。植物細胞還可以是藻類、樹或生產植物、果實或蔬菜(例
如,樹類諸如柑橘樹,例如桔子樹、葡萄柚樹或檸檬樹;桃樹或油桃樹;蘋果樹或梨樹;堅果樹諸如杏樹或核桃樹或阿月渾子樹;茄屬植物;芸苔屬植物;萵苣屬植物;菠菜屬植物;辣椒屬植物;棉花、煙草、蘆筍、胡蘿蔔、甘藍、青花菜、花椰菜、番茄、茄子、胡椒、萵苣、菠菜、草莓、藍莓、覆盆子、黑莓、葡萄、咖啡、可可等)具有的細胞。
在任一所述方法中,感興趣的靶座位可以是感興趣的基因組或表觀基因組的座位。在任一所述方法中,複合物可以使用用於多重用途的多個指導序列進行遞送。在任一所述方法中,可以使用超過一種的蛋白質。
在本發明的較佳的實施方式中,在不存在推定的反式啟動crRNA(tracr RNA)序列條件下,發生與感興趣的靶座位相關聯的或在該靶座位處的序列的生物化學的或體外或體內的切割,例如藉由FnCpf1效應蛋白進行切割。在本發明的其他實施方式中,在存在推定的反式啟動crRNA(tracr RNA)序列條件下,可以發生切割,例如藉由其他CRISPR家族效應蛋白進行切割,然而,在評價FnCpf1座位之後,申請人推斷藉由Cpf1效應蛋白複合物進行的靶DNA切割不需要tracrRNA。申請人確定僅包含Cpf1效應蛋白和crRNA(包含同向重複序列和指導序列的指導RNA)的Cpf1效應蛋白複合物足以切割靶DNA。因此,本發明提供了修飾如上文所述的感興趣的靶座位之方法,其中效應蛋白係Cpf1蛋白並且效應蛋白在不存在tracr的條件下與靶序列複合。
在任一上述方法中,效應蛋白(例如Cpf1)和核酸組
分可以經由編碼該蛋白質和/或一種或多種核酸組分的一個或多個多核苷酸分子來提供,並且其中一個或多個多核苷酸分子被可操作地構造成用於表現蛋白和/或一種或多種核酸組分。一個或多個多核苷酸分子可以包含被可操作地構造成用於表現蛋白質和/或一種或多種核酸組分的一個或多個調節元件。一個或多個多核苷酸分子可以包含在一個或多個載體中。本發明包括此或此類核苷酸分子例如被可操作地構造成用於表現蛋白質的此類多核苷酸分子,和/或一種或多種核酸組分以及此或此類載體。
在任一上述方法中,股斷裂可以是單股斷裂或雙股斷裂。
調節元件可以包括誘導型啟動子。多核苷酸和/或載體系統可以包括誘導型系統。
在任一上述方法中,一個或多個多核苷酸分子可以包含在遞送系統中,或者一種或多種載體可以包含在遞送系統中。
在任一上述方法中,非天然存在或工程化的組成物可以經由脂質體、粒子(例如奈米粒子)、外來體(exosome)、微泡、基因槍或一種或多種載體例如核酸分子或病毒載體遞送。
本發明還提供了一種非天然存在或工程化的組成物,該組成物係具有如在此所討論的或任一在此所述方法中所限定的特性的組成物。
本發明還提供了一種包含一種或多種載體的載體系統,該等一種或多種載體包含編碼非天然存在或工程化的組成物
(為具有如在此所討論的或任一在此所述方法中所限定的特性的組成物)的組分的一個或多個多核苷酸分子。
本發明還提供了一種包含一種或多種載體或一個或多個多核苷酸分子的遞送系統,該等一種或多種載體或一個或多個多核苷酸分子包括編碼非天然存在或工程化的組成物(為具有如在此所討論的或任一在此所述方法中所限定的特性的組成物)的組分的一個或多個多核苷酸分子。
本發明還提供了在治療性治療方法中使用的一種非天然存在或工程化的組成物,或編碼所述組成物的組分的一種或多種多核苷酸,或包括編碼所述組成物的組分的一種或多種多核苷酸的載體或遞送系統。治療性治療方法可以包括基因或基因組編輯,或基因治療。
本發明還涵蓋用於預測新的第2類CRISPR-Cas系統和鑒定其中組分的計算方法和演算法。
本發明還提供了其中效應蛋白的一個或多個胺基酸殘基可以被修飾,例如工程化或非天然存在的效應蛋白或Cpf1的方法和組成物。在一實施方式中,修飾可以包括效應蛋白的一個或多個胺基酸殘基的突變。一個或多個突變可以處於效應蛋白的一個或多個催化活性結構域中。與缺乏所述一個或多個突變的效應蛋白相比,該效應蛋白可以具有降低或廢除的核酸酶活性。效應蛋白不可以引導感興趣的靶座位處的一條或另一條DNA或RNA股的切割。效應蛋白不可以引導感興趣的靶座位處的DNA或RNA股的切割。在一較佳的實施方式中,一個或多個突變可以包括兩
個突變。在一較佳的實施方式中,Cpf1效應蛋白中的一個或多個胺基酸殘基被修飾,例如工程化或非天然存在的效應蛋白或Cpf1。在一較佳的實施方式中,Cpf1效應蛋白係FnCpf1效應蛋白。在一較佳的實施方式中,一個或多個修飾的或突變的胺基酸殘基係參照FnCpf1效應蛋白的胺基酸位置編碼的D917A、E1006A或D1255A。在另外的較佳的實施方式中,一種或多種突變胺基酸殘基係參照AsCpf1中的胺基酸位置的D908A、E993A、D1263A或者是參照LbCpf1中的胺基酸位置的LbD832A、E925A、D947A或D1180A。
本發明還提供了處於包含RuvC結構域的效應蛋白的催化活性結構域中的一個或多個突變或兩個或更多個突變。在本發明的一些實施方式中,RuvC結構域可以包括RuvCI、RuvCII或RuvCIII結構域,或與RuvCI、RuvCII或RuvCIII結構域等或與如任一在此所述方法中所述的任何相關結構域同源的催化活性結構域。效應蛋白可以包含一個或多個異源功能結構域。一個或多個異源功能結構域可以包括一個或多個核定位信號(NLS)結構域。一個或多個異源功能結構域可以包括至少兩個或更多個NLS結構域。一個或多個NLS結構域可以定位成處於或靠近或接近效應蛋白(例如Cpf1)的末端,並且如果是兩個或更多個NLS的話,則兩個中的每個可以定位成處於或靠近或接近效應蛋白(例如Cpf1)的末端。一個或多個異源功能結構域可以包括一個或多個轉錄啟動結構域。在一較佳的實施方式中,轉錄啟動結構域可以包括VP64。一個或多個異源功能結構域可以包括一個或多個轉錄阻遏結構域。在一較佳的實施方式中,轉錄阻遏結構域包括KRAB結構域或SID結構域(例如SID4X)。一個或多個異源功能結構域可以包括
一個或多個核酸酶結構域。在一較佳的實施方式中,核酸酶結構域包括Fok1。
本發明還提供了具有以下活性中的一種或多種的一個或多個異源功能結構域:修飾烷酶活性、去甲酶活性、轉錄啟動活性、轉錄阻遏活性、轉錄釋放因子活性、組蛋白修飾活性、核酸酶活性、單股RNA切割活性、雙股RNA切割活性、單股DNA切割活性、雙股DNA切割活性以及核酸結合活性。至少一個或多個異源功能結構域可以處於或靠近效應蛋白的胺基末端並且/或者其中至少一個或多個異源功能結構域處於或靠近效應蛋白的羧基末端。一個或多個異源功能結構域可以融合至效應蛋白。一個或多個異源功能結構域可以系接至效應蛋白。一個或多個異源功能結構域可以藉由接頭部分連接至效應蛋白。
本發明還提供了效應蛋白(例如Cpf1),包括來自於來自包括下項的屬的生物體的效應蛋白(例如Cpf1):鏈球菌屬(Streptococcus)、彎曲桿菌屬(Campylobacter)、硝化裂化菌屬(Nitratifractor)、葡萄球菌屬(Staphylococcus)、細小棒菌屬(Parvibaculum)、羅氏菌屬(Roseburia)、奈瑟氏菌屬(Neisseria)、葡糖醋桿菌屬(Gluconacetobacter)、固氮螺菌屬(Azospirillum)、螺旋體屬(Sphaerochaeta)、乳酸桿菌屬(Lactobacillus)、真細菌屬(Eubacterium)、棒狀桿菌屬(Corynebacter)、肉桿菌屬(Carnobacterium)、紅細菌屬(Rhodobacter)、李斯特菌屬(Listeria)、帕魯迪菌屬(Paludibacter)、梭菌屬(Clostridium)、毛螺旋菌科(Lachnospiraceae)、梭狀菌屬(Clostridiaridium)、纖毛菌屬(Leptotrichia)、弗朗西絲菌屬(Francisella)、軍團桿菌屬
(Legionella)、脂環酸芽孢桿菌屬(Alicyclobacillus)、甲烷嗜甲基菌(Methanomethyophilus)、卟啉單胞菌屬(Porphyromonas)、普雷沃菌屬(Prevotella)、擬桿菌門(Bacteroidetes)、創傷球菌屬(Helcococcus)、鉤端螺旋體屬(Letospira)、脫硫弧菌屬(Desulfovibrio)、脫硫鹽鹼桿菌屬(Desulfonatronum)、豐祐菌科(Opitutaceae)、腫塊芽孢桿菌屬(Tuberibacillus)、芽孢桿菌屬(Bacillus)、短芽孢桿菌屬(Brevibacilus)、甲基桿菌屬(Methylobacterium)或胺基酸球菌屬(Acidaminococcus)。
本發明還提供了效應蛋白(例如Cpf1),包括來自於來自下項的生物體的效應蛋白(例如Cpf1):變異鏈球菌(S.mutans)、無乳鏈球菌(S.agalactiae)、似馬鏈球菌(S.equisimilis)、血鏈球菌(S.sanguinis)、肺炎鏈球菌(S.pneumonia);空腸彎曲桿菌(C.jejuni)、大腸彎曲桿菌(C.coli);鹽水硝化破壞菌(N.salsuginis)、替加硝化破壞菌(N.tergarcus);耳葡萄球菌(S.auricularis)、肉葡萄球菌(S.carnosus);腦膜炎奈瑟氏菌(N.meningitides)、淋病奈瑟氏菌(N.gonorrhoeae);單核增生李斯特菌(L.monocytogenes)、伊氏李斯特菌(L.ivanovii);肉毒梭菌(C.botulinum)、艱難梭菌(C.difficile)、破傷風梭菌(C.tetani)、索氏梭菌(C.sordellii)。
效應蛋白可以包括嵌合效應蛋白,該嵌合效應蛋白包含來自第一效應蛋白(例如Cpf1)異種同源物的第一片段和來自第二效應蛋白(例如Cpf1)異種同源物的第二片段,並且其中第一效應蛋白異種同源物和第二效應蛋白異種同源物是不同的。第一效應蛋白(例如Cpf1)異種同源物和第二效應蛋白(例如Cpf1)異種同源物中的至少一者可以包括來自於包括下項的生物體的效
應蛋白(例如Cpf1):鏈球菌屬、彎曲桿菌屬、硝化裂化菌屬、葡萄球菌屬、細小棒菌屬、羅氏菌屬、奈瑟氏菌屬、葡糖醋桿菌屬、固氮螺菌屬、螺旋體屬、乳酸桿菌屬、真細菌屬、棒狀桿菌屬、肉桿菌屬、紅細菌屬、李斯特菌屬、帕魯迪菌屬、梭菌屬、毛螺旋菌科、梭狀菌屬、纖毛菌屬、弗朗西絲菌屬、軍團桿菌屬、脂環酸芽孢桿菌屬、甲烷嗜甲基菌、卟啉單胞菌屬、普雷沃菌屬、擬桿菌門、創傷球菌屬、鉤端螺旋體屬、脫硫弧菌屬、脫硫鹽鹼桿菌屬、豐祐菌科、腫塊芽孢桿菌屬、芽孢桿菌屬、短芽孢桿菌屬、甲基桿菌屬或胺基酸球菌屬;例如包含第一片段和第二片段的嵌合效應蛋白,其中第一片段和第二片段中的每個選自包括下項的生物體的Cpf1:鏈球菌屬、彎曲桿菌屬、硝化裂化菌屬、葡萄球菌屬、細小棒菌屬、羅氏菌屬、奈瑟氏菌屬、葡糖醋桿菌屬、固氮螺菌屬、螺旋體屬、乳酸桿菌屬、真細菌屬、棒狀桿菌屬、肉桿菌屬、紅細菌屬、李斯特菌屬、帕魯迪菌屬、梭菌屬、毛螺旋菌科、梭狀菌屬、纖毛菌屬、弗朗西絲菌屬、軍團桿菌屬、脂環酸芽孢桿菌屬、甲烷嗜甲基菌、卟啉單胞菌屬、普雷沃菌屬、擬桿菌門、創傷球菌屬、鉤端螺旋體屬、脫硫弧菌屬、脫硫鹽鹼桿菌屬、豐祐菌科、腫塊芽孢桿菌屬、芽孢桿菌屬、短芽孢桿菌屬、甲基桿菌屬或胺基酸球菌屬,其中第一片段和第二片段並非來自相同細菌;例如,包含第一片段和第二片段的嵌合效應蛋白,其中第一片段和第二片段中的每個選自下項的Cpf1:變異鏈球菌、無乳鏈球菌、似馬鏈球菌、血鏈球菌、肺炎鏈球菌;空腸彎曲桿菌、大腸彎曲桿菌;鹽水硝化破壞菌、替加硝化破壞菌;耳葡萄球菌、肉葡萄球菌;腦膜炎奈瑟氏菌、淋病奈瑟氏菌;單核增生李斯特菌、伊氏李斯特菌;肉毒梭菌、艱難梭菌、破傷風梭菌、索氏梭菌;土拉熱弗朗西絲菌(Francisella tularensis)1、易北普雷沃菌(Prevotella albensis)、毛螺旋菌科細菌(Lachnospiraceae bacterium)MC2017 1、解朊丁酸弧菌(Butyrivibrio proteoclasticus)、佩萊格裡尼菌科細菌(Peregrinibacteria bacterium)GW2011_GWA2_33_10、儉菌總門(Parcubacteria)細菌GW2011_GWC2_44_17、密斯氏菌屬(Smithella)某種SCADC、胺基酸球菌屬某種BV3L6、毛螺旋菌科細菌MA2020、候選白蟻甲烷枝原體(Candidatus Methanoplasma termitum)、挑剔真細菌(Eubacterium eligens)、牛莫拉氏菌(Moraxella bovoculi)237、稻田鉤端螺旋體(Leptospira inadai)、毛螺旋菌科細菌ND2006、狗口腔卟啉單胞菌(Porphyromonas crevioricanis)3、解糖腖普雷沃菌(Prevotella disiens)和獼猴卟啉單胞菌(Porphyromonas macacae),其中第一片段和第二片段並非來自相同細菌。
在本發明的較佳的實施方式中,效應蛋白來源於Cpf1座位(在此此類效應蛋白也稱之為“Cpf1p”),例如Cpf1蛋白(並且此類效應蛋白或Cpf1蛋白或來源於Cpf1座位的蛋白質也稱之為“CRISPR酶”)。Cpf1座位包括但不限於圖64中列出的細菌物種的Cpf1座位。在一更較佳的實施方式中,Cpf1p來源於選自下項的細菌物種:土拉熱弗朗西絲菌1、易北普雷沃菌、毛螺旋菌科細菌MC2017 1、解朊丁酸弧菌、佩萊格裡尼菌科細菌GW2011_GWA2_33_10、儉菌總門細菌GW2011_GWC2_44_17、密斯氏菌屬某種SCADC、胺基酸球菌屬某種BV3L6、毛螺旋菌科細菌MA2020、候選白蟻甲烷枝原體、挑剔真細菌、牛莫拉氏菌237、稻田鉤端螺旋體、毛螺旋菌科細菌ND2006、狗口腔卟啉單胞菌3、解糖腖普雷沃菌和獼猴卟啉單胞菌。在某些實施方式中,Cpf1p來源於選自胺基酸球菌屬某種BV3L6、毛螺旋菌科細菌MA2020的細
菌物種。在某些實施方式中,效應蛋白來源於土拉熱弗朗西絲菌1的亞種,包括但不限於土拉熱弗朗西絲菌新殺手(Novicida)亞種。
在本發明的另外的實施方式中,原型間隔區鄰近模體(PAM)或PAM-樣模體引導效應蛋白複合物與感興趣的靶座位的結合。在本發明的一個較佳的實施方式中,PAM係5' TTN,其中N係A/C/G或T並且效應蛋白係FnCpf1p。在本發明的另一個較佳的實施方式中,PAM係5' TTTV,其中V係A/C或G並且效應蛋白係AsCpf1、LbCpf1或PaCpf1p。在某些實施方式中,PAM係5' TTN,其中N係A/C/G或T,效應蛋白係FnCpf1p,並且PAM位於原型間隔區的5'端的上游。在本發明的某些實施方式中,PAM係5' CTA,其中效應蛋白係FnCpf1p,並且PAM位於原型間隔區或靶座位的5'端的上游。在較佳的實施方式中,本發明提供了用於RNA指導的基因組編輯核酸酶的擴大的靶向範圍,其中Cpf1家族的富含T的PAM允許對富含AT基因組的靶向和編輯。
在某些實施方式中,CRISPR酶被工程化並且可以包含降低或消除核酸酶活性的一個或多個突變。FnCpf1p RuvC結構域中的胺基酸位置包括但不限於D917A、E1006A、E1028A、D1227A、D1255A、N1257A、D917A、E1006A、E1028A、D1227A、D1255A和N1257A。申請人還鑒定了與PD-(D/E)XK核酸酶超家族和HincII內切核酸酶樣最類似的推定的第二核酸酶結構域。在此推定的核酸酶結構域中產生的大幅度降低核酸酶活性的點突變包括但不限於N580A、N584A、T587A、W609A、D610A、K613A、E614A、D616A、K624A、D625A、K627A和Y629A。在一較佳的實施方式
中,FnCpf1p RuvC結構域中的突變係D917A或E1006A,其中D917A或E1006A突變使FnCpf1效應蛋白的DNA切割活性完全失活。在另一個實施方式中,FnCpf1p RuvC結構域中的突變係D1255A,其中突變的FnCpf1效應蛋白具有明顯降低的核溶解活性。
AsCpf1p RuvC結構域中的胺基酸位置包括但不限於908、993和1263。在一較佳的實施方式中,AsCpf1p RuvC結構域中的突變係D908A、E993A和D1263A,其中D908A、E993A和D1263A突變使AsCpf1效應蛋白的DNA切割活性完全失活。LbCpf1p RuvC結構域中的胺基酸位置包括但不限於832、947或1180。在一較佳的實施方式中,LbCpf1p RuvC結構域中的突變係LbD832A、E925A、D947A或D1180A,其中LbD832A、E925A、D947A或D1180A突變使LbCpf1效應蛋白的DNA切割活性完全失活。
突變還可以在鄰近殘基處,例如在靠近以上指出的參與核酸酶活性的那些的胺基酸處形成。在一些實施方式中,僅RuvC結構域係失活的,並且在其他實施方式中,另一推定的核酸酶結構域係失活的,其中效應蛋白複合物充當切口酶並且僅切割一條DNA股。在一較佳的實施方式中,其他推定的核酸酶結構域係HincII樣內切核酸酶結構域。在一些實施方式中,使用兩種FnCpf1、AsCpf1或LbCpf1變體(各自不同的切口酶)來增加特異性,使用兩種切口酶變體來切割靶標處的DNA(其中兩種切口酶切割DNA股,同時使脫靶修飾最小化或消除,其中僅一條DNA股被切割並且隨後進行修復)。在較佳的實施方式中,Cpf1效應蛋白
以包含兩個Cpf1效應蛋白分子的同源二聚體形式切割與感興趣的靶座位相關聯的或在該靶座位處的序列。在一較佳的實施方式中,同源二聚體可以包含在其對應RuvC結構域中含有不同的突變的兩個Cpf1效應蛋白分子。
本發明涵蓋使用兩種或更多種切口酶的方法,具體地雙或雙重切口酶方法。在一些方面和實施方式中,可以遞送單一類型的FnCpf1、AsCpf1或LbCpf1切口酶,例如如在此所述的修飾的FnCpf1、AsCpf1或LbCpf1或修飾的FnCpf1、AsCpf1或LbCpf1切口酶。這使得靶DNA由兩種FnCpf1切口酶結合。此外,還設想的是可以使用不同的異種同源物,例如DNA的一條股(例如編碼股)上的FnCpf1、AsCpf1或LbCpf1切口酶和非編碼或相反DNA股上的異種同源物。異種同源物可以是但不限於Cas9切口酶諸如SaCas9切口酶或SpCas9切口酶。可能有利的是使用需要不同PAM並且還可以具有不同指導要求的兩種不同的異種同源物,由此允許使用者的更大程度的控制。在某些實施方式中,DNA切割涉及至少四種類型的切口酶,其中每種類型被指導到不同的靶DNA序列,其中每對在一個DNA股中引入第一切口並且第二對在第二條DNA股中引入切口。在此類方法中,至少兩對單股斷裂被引入到靶DNA中,其中在引入第一對單股斷裂和第二對單股斷裂後,第一對單股斷裂與第二對單股斷裂之間的靶序列被切斷。在某些實施方式中,異種同源物中的一者或兩者是可控的,例如是可誘導的。
在本發明的某些實施方式中,指導RNA或成熟crRNA包含同向重複序列和指導序列或間隔區序列、基本上由或由同向
重複序列和指導序列或間隔區序列組成。在某些實施方式中,指導RNA或成熟crRNA包含連接至指導序列或間隔區序列的同向重複序列、基本上由或由該同向重複序列組成。在某些實施方式中,指導RNA或成熟crRNA包含19個核苷酸的部分同向重複序列,接著是20-30個核苷酸的指導序列或間隔區序列,有利地約20個核苷酸、23-25個核苷酸或24個核苷酸。在某些實施方式中,效應蛋白係FnCpf1、AsCpf1或LbCpf1效應蛋白並且需要至少16個核苷酸的指導序列以實現可檢測的DNA切割並且需要最小17個核苷酸的指導序列以實現有效的體外DNA切割。在某些實施方式中,同向重複序列位於指導序列或間隔區序列的上游(即5’)。在一較佳的實施方式中,FnCpf1、AsCpf1或LbCpf1指導RNA的種子序列(即為識別和/或雜交於靶座位處的序列所必不可少的序列)大約在指導序列或間隔區序列的5'端上的前5個核苷酸之內。
在本發明的較佳的實施方式中,成熟crRNA包括莖環或優化的莖環結構或優化的二級結構。在較佳的實施方式中,成熟crRNA在同向重複序列中包括莖環或優化的莖環結構,其中莖環或優化的莖環結構對切割活性是重要的。在某些實施方式中,成熟crRNA較佳的是包括單一莖環。在某些實施方式中,同向重複序列較佳的是包括單一莖環。在某些實施方式中,效應蛋白複合物的切割活性藉由引入影響莖環RNA雙股體結構的突變來修飾。在較佳的實施方式中,可以引入保持莖環的RNA雙股體的突變,由此效應蛋白複合物的切割活性被保持。在其他較佳的實施方式中,可以引入擾亂莖環的RNA雙股體結構的突變,由此效應蛋白複合物的切割活性被完全廢除。
在在此所述方法或組成物中的任一種中,本發明還提供了編碼被密碼子優化為在真核細胞或原核細胞中表現的效應蛋白的核苷酸序列。在本發明的一個實施方式中,密碼子優化的效應蛋白係FnCpf1p、AsCpf1或LbCpf1並且是針對在真核細胞或生物體中的可操作性進行密碼子優化,該真核細胞或生物體為例如如在此任何地方提到的此細胞或生物體,例如但不限於酵母細胞或哺乳動物細胞或生物體,包括小鼠細胞、大鼠細胞和人類細胞或非人類真核生物體,例如植物。
在本發明的某些實施方式中,至少一個核定位信號(NLS)附接到編碼Cpf1效應蛋白的核酸序列。在較佳的實施方式中,至少一個或多個C末端或N末端的NLS被附接(並且因此一種或多種核酸分子編碼Cpf1效應蛋白可以包括編碼一個或多個NLS,使得表現的產物具有附接或連接的一個或多個NLS)。在一較佳的實施方式中,C末端的NLS被附接以用於真核細胞較佳的是人類細胞中的最佳表現和核靶向。在一較佳的實施方式中,密碼子優化的效應蛋白係FnCpf1p、AsCpf1或LbCpf1並且指導RNA的間隔區長度為從15至35個核苷酸。在某些實施方式中,指導RNA的間隔區長度為至少16個核苷酸,諸如至少17個核苷酸。在某些實施方式中,間隔區長度為從15至17個核苷酸、從17至20個核苷酸、從20至24個核苷酸,例如20、21、22、23或24個核苷酸、從23至25個核苷酸,例如23、24或25個核苷酸、從24至27個核苷酸、從27-30個核苷酸、從30-35個核苷酸或35個核苷酸或更長。在本發明的某些實施方式中,密碼子優化的效應蛋白係FnCpf1p並且指導RNA的同向重複序列長度為至少16個核苷酸。在某些實施方式中,密碼
子優化的效應蛋白係FnCpf1p並且指導RNA的同向重複序列長度為從16至20個核苷酸,例如16、17、18、19或20個核苷酸。在某些較佳的實施方式中,指導RNA的同向重複長度為19個核苷酸。
本發明還涵蓋用於遞送多個核酸組分的方法,其中每個核酸組分對不同的感興趣的靶座位具有特異性,從而修飾多個感興趣的靶座位。複合物的核酸組分可以包含一個或多個蛋白質結合的RNA適配體。一個或多個適配體可以能夠結合噬菌體外殼蛋白。噬菌體外殼蛋白可以選自下組,該組包括下項:Qβ、F2、GA、fr、JP501、MS2、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、ΦCb5、ΦCb8r、ΦCb12r、ΦCb23r、7s和PRR1。在一較佳的實施方式中,噬菌體外殼蛋白係MS2。本發明還提供了複合物的核酸組分,該核酸組分的長度為30或更多個、40或更多個,或50或更多個核苷酸。
本發明還涵蓋具有細胞、組分和/或系統中存在的痕量陽離子的本發明的細胞、組分和/或系統。有利地,陽離子係鎂,諸如Mg2+。陽離子可以痕量存在。對於陽離子(有利地是Mg2+),較佳的範圍可以是約1mM至約15mM。對於基於人類的細胞、組分和/或系統,較佳的濃度可以是約1mM,並且對於基於細菌的細胞、組分和/或系統,較佳的濃度可以是約10mM至約15mM。參見,例如加西烏納斯(Gasiunas)等人,美國國家科學院院刊(PNAS),2012年9月4日線上公開,www.pnas.org/cgi/doi/10.1073/pnas.1208507109.
因此,本發明的目的在於,在本發明內不涵蓋任何先前已知的產品、製備該產品的過程或使用該產品之方法,使得申請人保留和在此揭露放棄任何先前已知的產品、過程或方法的權利。進一步指出的是,在本發明的範圍之內,本發明並非旨在涵蓋任何產品、過程或該產品的製備或使用該產品的方法,其不符合USPTO(35 U.S.C.§112,第一段)或EPO(EPC第83條)的書面說明和實施要求,使得申請人保留和在此揭露放棄任何先前所述的產品、製備該產品的過程或使用該產品的方法之權利。可能有利的是在本發明實踐中遵照EPC第53條(c)和EPC規則28(b)和(c)。在此沒任何東西被解釋為約定的。
指出的是,在本揭露中並且特別是在本申請專利範圍和/或段落中,術語諸如“包括(comprises)”、“包括(comprised)”、“包括(comprising)”等可以具有在美國專利法中屬於它的含義;例如,它們可以意指“包括(includes)”、“包括(included)”、"包括(including)”等;並且該等術語諸如“基本上由......組成(consisting essentially of)”和“基本上由......組成(consists essentially of)”具有在美國專利法中歸於它們的含義。
該等和其他實施方式揭露於以下詳細說明中或根據其是清楚的並且由其涵蓋。
本發明的新穎特徵在所附申請專利範圍中具體闡述。藉由參考對說明性實施方式進行闡述的以下詳細說明,將獲得對本發明的特徵和優點的更好理解,在該等實施方式中利用了本發
明的原理,並且在該等附圖中:
圖1A-1B描繪了CRISPR-Cas系統的新分類。第1類包括多亞基crRNA-效應物複合物(Cascade)並且第2類包括單亞基crRNA-效應物複合物(Cas9樣)。
圖2提供了CRISPR-Cas的分子組構。
圖3A-3D提供了I型和III型效應複合物的結構:共同的體系結構/共同的祖先,儘管存在廣泛的序列趨異性。
圖4示出了作為以RNA識別模體(RRM)為中心的系統的CRISPR-Cas。
圖5A-5D示出了Cas1系統發育,其中自我調整模組和crRNA-效應物模組的重組顯示出CRISPR-Cas進化的主要方面。
圖6示出了CRISPR-Cas種群調查,具體地是CRISPR-Cas型/亞型在古生菌和細菌之中的分佈。
圖7描繪了用於鑒定Cas候選物的流程。
圖8A-8D描繪了第2類系統的完整座位的組構。
圖9A-9B描繪了C2c1鄰近群體。
圖10A-10C描繪了Cas1樹。
圖11A-11B描繪了第2類家族的結構域組構。
圖12A-12B描繪了第2類蛋白質(SEQ ID NO 246-428,分別按出現的順序)的TnpB同源區。
圖13A-13B描繪了C2c2鄰近群體。
圖14A-14E描繪了C2c2家族(SEQ ID NO 429-1032,分別按出現的順序)中的HEPN RxxxxH模體。
圖15描繪了C2C1:1.酸土脂環酸芽孢桿菌ATCC 49025(SEQ ID NO 1034-1037,分別按出現的順序)。
圖16描繪了C2C1:4.硫岐化脫硫鹽鹼桿菌(Desulfonatronum thiodismutans)菌株MLF-1(SEQ ID NO 1038-1041,分別按出現的順序)。
圖17描繪了C2C1:5.豐祐菌科細菌TAV5(SEQ ID NO 1042-1045,分別按出現的順序)。
圖18描繪了C2C1:7.嗜熱澱粉芽孢桿菌菌株B4166(SEQ ID NO 1046-1049,分別按出現的順序)。
圖19描繪了C2C1:9.芽胞桿菌屬某種NSP2.1(SEQ ID NO 1050-1053,分別按出現的順序)。
圖20描繪了C2C2:1.毛螺旋菌科細菌MA2020(SEQ ID NO 1054-1057,分別按出現的順序)。
圖21描繪了C2C2:2.毛螺旋菌科細菌NK4A179(SEQ ID NO 1058-1064,分別按出現的順序)。
圖22描繪了C2C2:3.嗜胺梭菌([Clostridium]aminophilum)DSM 10710(SEQ ID NO 1065-1068,分別按出現的
順序)。
圖23描繪了C2C2:4.毛螺旋菌科細菌NK4A144(SEQ ID NO 1069和1070,分別按出現的順序)。
圖24描繪了C2C2:5.雞肉桿菌(Carnobacterium gallinarum)DSM 4847(SEQ ID NO 1071-1074,分別按出現的順序)。
圖25描繪了C2C2:6.雞肉桿菌(Carnobacterium gallinarum)DSM 4847(SEQ ID NO 1075-1081,分別按出現的順序)。
圖26描繪了C2C2:7.產丙酸帕魯迪菌(Paludibacter propionicigenes)WB4(SEQ ID NO:1082)。
圖27描繪了C2C2:8.血清型斯氏李斯特菌1/2b(SEQ ID NO 1083-1086,分別按出現的順序)。
圖28描繪了C2C2:9.威氏李斯特菌FSL R9-0317(SEQ ID NO:1087)。
圖29描繪了C2C2:10.李斯特菌屬細菌FSL M6-0635(SEQ ID NO 1088和1091,分別按出現的順序)。
圖30描繪了C2C2:11.韋德(wadei)纖毛菌F0279(SEQ ID NO:1092)。
圖31描繪了C2C2:12.韋德纖毛菌F0279(SEQ ID NO 1093-1099,分別按出現的順序)。
圖32描繪了C2C2:14.沙氏(shahii)纖毛菌屬DSM 19757(SEQ ID NO 1100-1103,分別按出現的順序)。
圖33描繪了C2C2:15.莢膜紅細菌SB 1003(SEQ ID NO 1104和1105,分別按出現的順序)。
圖34描繪了C2C2:16.莢膜紅細菌R121(SEQ ID NO 1106和1107,分別按出現的順序)。
圖35描繪了C2C2:17.莢膜紅細菌R121(SEQ ID NO 1108和1109,分別按出現的順序)。
圖36描繪了DR樹。
圖37描繪了C2C2樹。
圖38A-38BB示出了Cas-Cpf1異種同源物(SEQ ID NO 1033和1110-1166,分別按出現的順序)的序列比對。
圖39A-39B示出了Cpf1座位比對的綜述。
圖40A-40X示出了PACYC184 FnCpf1(PY001)載體構建體(SEQ ID NO:1167和SEQ ID NO 1168-1189,分別按出現的順序)。
圖41A-41I示出了人源化PaCpf1的序列,其中核苷酸序列為SEQ ID NO:1190並且蛋白質序列為SEQ ID NO:1191。
圖42描繪了PAM激發測定。
圖43描繪了內源性FnCpf1座位的示意圖。pY0001係具有部分FnCpf1座位的pACY184骨架(來自NEB)。FnCpf1座位被
PCR擴增成三個片段並且使用吉普森(Gibson)元件將該等片段選殖到Xba1和Hind3切割的pACYC184中。PY0001含有從255bp的乙醯轉移酶3'序列至第四間隔區序列的內源性FnCpf1座位。僅間隔區1-3係潛在地具有活性的,因為間隔區4不再側接同向重複序列。
圖44描繪了PAM文庫(library),其按出現的順序分別揭露了SEQ ID NO 1192-1195。兩個PAM文庫(左和右)均處於pUC19中。左PAM文庫的複雜度為48~65k並且右PAM文庫的複雜度為47~16k。兩個文庫被製備有>500的表現度。
圖45A-45E描繪了FnCpf1 PAM篩選計算分析。在對篩選DNA定序之後,提取出對應於左PAM或右PAM的區。對於每個樣品,將定序文庫中存在的PAM數目與文庫中預期的PAM數目(對於左文庫為4^8,對於右文庫為4^7)進行比較。圖44A描繪了左文庫示出PAM缺失。為了量化此缺失,計算了富集比。針對兩種條件(對照pACYC或含有FnCpf1的pACYC),根據
針對文庫中的每種PAM計算該比率。
繪製的分佈顯示在對照樣品中幾乎沒有富集並且在兩種生物複製本(bioreps)中有富集。圖44B-44D描繪了PAM比率的分佈。圖44E顯示,收集比率為8之上的PAM,並且繪製頻率分佈,揭示出5' YYN PAM。
圖46描繪了土拉熱弗朗西絲菌Cpf1座位的RNA定序(RNAseq)分析,該分析顯示CRISPR座位被啟動表現。除Cpf1和Cas基因之外,兩種小的非編碼轉錄物被高度轉錄,這兩種非編碼轉錄物可能是推定的tracrRNA。CRISPR陣列也被表現。兩種推
定的tracrRNA和CRISPR陣列以與Cpf1和Cas基因相同的方向進行轉錄。在此藉由RNA定序實驗鑒定的所有RNA轉錄物映射到座位。在對FnCpf1座位進一步評價之後,申請人推斷藉由Cpf1效應蛋白複合物進行靶DNA切割不需要tracrRNA。申請人確定僅包含Cpf1效應蛋白和crRNA(包含同向重複序列和指導序列的指導RNA)的Cpf1效應蛋白複合物足以切割靶DNA。
圖47描繪了放大的Cpf1 CRISPR陣列。可以鑒定出許多不同的短轉錄物。在此繪圖中,將所有鑒定的RNA轉錄物映射到Cpf1座位。
圖48描繪了在選擇小於85個核苷酸長的轉錄物之後鑒定出的兩種推定的tracrRNA。
圖49描繪了放大的推定的tracrRNA 1(SEQ ID NO:1196)和CRISPR陣列。
圖50描繪了放大的推定的tracrRNA 2,其按出現的順序分別揭露了SEQ ID NO 1197-1203。
圖51描繪了推定的crRNA序列(重複序列為藍色,間隔區為黑色)(SEQ ID NO 1205和1206,分別按出現的順序)。
圖52示出了用於在體內證實預測的FnCpf1 PAM的測定的示意圖。
圖53示出了用編碼具有5' TTN PAM的內源性間隔區1的pUC19轉化的攜帶FnCpf1座位的細胞和對照細胞。
圖54示出了指明FnCpf1座位中的推定的tracrRNA序
列位置、crRNA(SEQ ID NO:1207)以及pUC原型間隔區載體的示意圖。
圖55係示出了在細胞裂解物中培養的具有TTa PAM的PCR片段和原型間隔區1序列的凝膠。
圖56係示出了在細胞裂解物中培養的具有不同的PAM的pUC-間隔區1的凝膠。
圖57係示出了在細胞裂解物中培養之後的BasI消化的凝膠。
圖58係示出了三種推定的crRNA序列(SEQ ID NO:1208)的消化結果的凝膠。
圖59係示出了對針對含有靶位點:5'-TTAgagaagtcatttaataaggccactgttaaaa-3'的靶DNA片段(SEQ ID NO:1209)的不同長度的間隔區的測試的凝膠。結果顯示在體外crRNA 1-7介導了使用FnCpf1對靶DNA的成功切割。crRNA 8-13不有利於靶DNA的切割。分別按出現的順序揭露了SEQ ID NO 1210-1248。
圖60係指明了最小FnCpf1座位的示意圖。
圖61係指明了最小Cpf1指導序列(SEQ ID NO:1249)的示意圖。
圖62A-62E描繪了PaCpf1 PAM篩選計算分析。在對篩選DNA定序之後,提取出對應於左PAM或右PAM的區。對於每個樣品,將定序文庫中存在的PAM數目與文庫中預期的PAM數目(4^7)進行比較。(圖62A)左文庫顯示出非常輕微的PAM缺失。
為了量化此缺失,計算了富集比。針對兩種條件(對照pACYC或含有PaCpf1的pACYC),根據以下公式針對文庫中的每種PAM計算該比率:
繪製的分佈顯示在對照樣品中幾乎沒有富集並且在兩種生物複製本中有富集。圖62B-62D描繪了PAM比率的分佈。圖62E顯示,收集比率為4.5之上的所有PAM,並且繪製頻率分佈,揭示出5' TTTV PAM,其中V係A或C或G。
圖63示出了被描繪為CBh-NLS-huPaCpf1-NLS-3xHA-pA的人類密碼子優化的PaCpf1序列的載體圖譜。
圖64A-64B示出了不同細菌中的51 Cpf1座位的系統發育樹。突出顯示框指示基因參考號:1-17。使用預測的成熟crRNA測試加框/編號的異種同源物在體外的切割活性;在其編號周圍具有框的異種同源物在體外測定中顯示出活性。
圖65A-65H顯示出具有3849個核苷酸的基因長度的毛螺旋菌科細菌MC2017 1 Cpf1(圖64中的參考號3)的人類密碼子優化序列的細節。圖65A:密碼子適應指數(CAI)。密碼子使用頻率沿基因序列長度的分佈。就高基因表現水平而言,在所希望的表現生物體中1.0 CAI被認為是完美的,並且>0.8的CAI被認為是良好的。圖65B:最佳的密碼子的頻率(FOP)。在計算的密碼子品質組中的密碼子分佈百分比。該值對於在所希望的表現生物體中針對給定胺基酸具有最大使用頻率的密碼子被設定為100。圖
65C:GC含量調整。GC含量的理想百分比範圍為介於30%-70%之間。60bp視窗中的%GC含量的峰已被移除。圖65D:限制性內切酶和順式作用元件。圖65E:移除重複序列。圖65F-G:優化序列(優化序列長度:3849,GC% 54.70)(SEQ ID NO:1250)。圖65H:蛋白質序列(SEQ ID NO:1251)。
圖66A-66H顯示出具有3873個核苷酸的基因長度的解朊丁酸弧菌Cpf1(圖64中的參考號4)的人類密碼子優化序列的細節。圖66A:密碼子適應指數(CAI)。密碼子使用頻率沿基因序列長度的分佈。就高基因表現水平而言,在所希望的表現生物體中1.0 CAI被認為是完美的,並且>0.8的CAI被認為是良好的。圖66B:最佳的密碼子的頻率(FOP)。在計算的密碼子品質組中的密碼子分佈百分比。該值對於在所希望的表現生物體中針對給定胺基酸具有最大使用頻率的密碼子被設定為100。圖66C:GC含量調整。GC含量的理想百分比範圍為介於30%-70%之間。60bp視窗中的%GC含量的峰已被移除。圖66D:限制性內切酶和順式作用元件。圖66E:移除重複序列。圖66F-G:優化序列(優化序列長度:3873,GC% 54.05)(SEQ ID NO:1252)。圖66H:蛋白質序列(SEQ ID NO:1253)。
圖67A-67H顯示出具有4581個核苷酸的基因長度的佩萊格裡尼菌科細菌GW2011_GWA2_33_10 Cpf1(圖64中的參考號5)的人類密碼子優化序列的細節。圖67A:密碼子適應指數
(CAI)。密碼子使用頻率沿基因序列長度的分佈。就高基因表現水平而言,在所希望的表現生物體中1.0 CAI被認為是完美的,並且>0.8的CAI被認為是良好的。圖67B:最佳的密碼子的頻率(FOP)。在計算的密碼子品質組中的密碼子分佈百分比。該值對於在所希望的表現生物體中針對給定胺基酸具有最大使用頻率的密碼子被設定為100。圖67C:GC含量調整。GC含量的理想百分比範圍為介於30%-70%之間。60bp視窗中的%GC含量的峰已被移除。圖67D:限制性內切酶和順式作用元件。圖67E:移除重複序列。圖67F-G:優化序列(優化序列長度:4581,GC% 50.81)(SEQ ID NO:1254)。圖67H:蛋白質序列(SEQ ID NO:1255)。
圖68A-68H顯示出具有4206個核苷酸的基因長度的儉菌總門細菌GW2011_GWC2_44_17 Cpf1(圖64中的參考號6)的人類密碼子優化序列的細節。圖68A:密碼子適應指數(CAI)。密碼子使用頻率沿基因序列長度的分佈。就高基因表現水平而言,在所希望的表現生物體中1.0 CAI被認為是完美的,並且>0.8的CAI被認為是良好的。圖68B:最佳的密碼子的頻率(FOP)。在計算的密碼子品質組中的密碼子分佈百分比。該值對於在所希望的表現生物體中針對給定胺基酸具有最大使用頻率的密碼子被設定為100。圖68C:GC含量調整。GC含量的理想百分比範圍為介於30%-70%之間。60bp視窗中的%GC含量的峰已被移除。圖68D:限制性內切酶和順式作用元件。圖68E:移除重複序列。圖68F-G:優化序列(優化序列長度:4206,GC% 52.17)(SEQ ID NO:1256)。圖68H:蛋白質序列(SEQ ID NO:1257)。
圖69A-69H顯示出具有3900個核苷酸的基因長度的密斯氏菌屬某種SCADC Cpf1(圖64中的參考號7)的人類密碼子優化序列的細節。圖69A:密碼子適應指數(CAI)。密碼子使用頻率沿基因序列長度的分佈。就高基因表現水平而言,在所希望的表現生物體中1.0 CAI被認為是完美的,並且>0.8的CAI被認為是良好的。圖69B:最佳的密碼子的頻率(FOP)。在計算的密碼子品質組中的密碼子分佈百分比。該值對於在所希望的表現生物體中針對給定胺基酸具有最大使用頻率的密碼子被設定為100。圖69C:GC含量調整。GC含量的理想百分比範圍為介於30%-70%之間。60bp視窗中的%GC含量的峰已被移除。圖69D:限制性內切酶和順式作用元件。圖69E:移除重複序列。圖69F-G:優化序列(優化序列長度:3900,GC% 51.56)(SEQ ID NO:1258)。圖69H:蛋白質序列(SEQ ID NO:1259)。
圖70A-70H顯示出具有4071個核苷酸的基因長度的胺基酸球菌屬某種BV3L6 Cpf1(圖64中的參考號8)的人類密碼子優化序列的細節。圖70A:密碼子適應指數(CAI)。密碼子使用頻率沿基因序列長度的分佈。就高基因表現水平而言,在所希望的表現生物體中1.0 CAI被認為是完美的,並且>0.8的CAI被認為是良好的。圖70B:最佳的密碼子的頻率(FOP)。在計算的密碼子品質組中的密碼子分佈百分比。該值對於在所希望的表現生物體中針對給定胺基酸具有最大使用頻率的密碼子被設定為100。圖70C:GC含量調整。GC含量的理想百分比範圍為介於30%-70%之間。60bp視窗中的%GC含量的峰已被移除。圖70D:限制性內切酶和順式作用元件。圖70E:移除重複序列。圖70F-G:優化序列(優化序
列長度:4071,GC% 54.89)(SEQ ID NO:1260)。圖70H:蛋白質序列(SEQ ID NO:1261)。
圖71A-71H顯示出具有3768個核苷酸的基因長度的毛螺旋菌科細菌MA2020 Cpf1(圖64中的參考號9)的人類密碼子優化序列的細節。圖71A:密碼子適應指數(CAI)。密碼子使用頻率沿基因序列長度的分佈。就高基因表現水平而言,在所希望的表現生物體中1.0 CAI被認為是完美的,並且>0.8的CAI被認為是良好的。圖71B:最佳的密碼子的頻率(FOP)。在計算的密碼子品質組中的密碼子分佈百分比。該值對於在所希望的表現生物體中針對給定胺基酸具有最大使用頻率的密碼子被設定為100。圖71C:GC含量調整。GC含量的理想百分比範圍為介於30%-70%之間。60bp視窗中的%GC含量的峰已被移除。圖71D:限制性內切酶和順式作用元件。圖71E:移除重複序列。圖71F-G:優化序列(優化序列長度:3768,GC% 51.53)(SEQ ID NO:1262)。圖71H:蛋白質序列(SEQ ID NO:1263)。
圖72A-72H顯示出具有3864個核苷酸的基因長度的候選白蟻甲烷枝原體Cpf1(圖64中的參考號10)的人類密碼子優化序列的細節。圖72A:密碼子適應指數(CAI)。密碼子使用頻率沿基因序列長度的分佈。就高基因表現水平而言,在所希望的表現生物體中1.0 CAI被認為是完美的,並且>0.8的CAI被認為是良好的。圖72B:最佳的密碼子的頻率(FOP)。在計算的密碼子品質組中的密碼子分佈百分比。該值對於在所希望的表現生物體中針對給定胺基酸具有最大使用頻率的密碼子被設定為100。圖72C:
GC含量調整。GC含量的理想百分比範圍為介於30%-70%之間。60bp視窗中的%GC含量的峰已被移除。圖72D:限制性內切酶和順式作用元件。圖72E:移除重複序列。圖72F-G:優化序列(優化序列長度:3864,GC% 52.67)(SEQ ID NO:1264)。圖72H:蛋白質序列(SEQ ID NO:1265)。
圖73A-73H顯示出具有3996個核苷酸的基因長度的挑剔真細菌Cpf1(圖64中的參考號11)的人類密碼子優化序列的細節。圖73A:密碼子適應指數(CAI)。密碼子使用頻率沿基因序列長度的分佈。就高基因表現水平而言,在所希望的表現生物體中1.0 CAI被認為是完美的,並且>0.8的CAI被認為是良好的。圖73B:最佳的密碼子的頻率(FOP)。在計算的密碼子品質組中的密碼子分佈百分比。該值對於在所希望的表現生物體中針對給定胺基酸具有最大使用頻率的密碼子被設定為100。圖73C:GC含量調整。GC含量的理想百分比範圍為介於30%-70%之間。60bp視窗中的%GC含量的峰已被移除。圖73D:限制性內切酶和順式作用元件。圖73E:移除重複序列。圖73F-G:優化序列(優化序列長度:3996,GC% 50.52)(SEQ ID NO:1266)。圖73H:蛋白質序列(SEQ ID NO:1267)。
圖74A-74H顯示出具有4269個核苷酸的基因長度的牛莫拉氏菌237 Cpf1(圖64中的參考號12)的人類密碼子優化序列的細節。圖74A:密碼子適應指數(CAI)。密碼子使用頻率沿基因序列長度的分佈。就高基因表現水平而言,在所希望的表現生物體中1.0 CAI被認為是完美的,並且>0.8的CAI被認為是良好的。圖
74B:最佳的密碼子的頻率(FOP)。在計算的密碼子品質組中的密碼子分佈百分比。該值對於在所希望的表現生物體中針對給定胺基酸具有最大使用頻率的密碼子被設定為100。圖74C:GC含量調整。GC含量的理想百分比範圍為介於30%-70%之間。60bp視窗中的%GC含量的峰已被移除。圖74D:限制性內切酶和順式作用元件。圖74E:移除重複序列。圖74F-G:優化序列(優化序列長度:4269,GC% 53.58)(SEQ ID NO:1268)。圖74H:蛋白質序列(SEQ ID NO:1269)。
圖75A-75H顯示出具有3939個核苷酸的基因長度的稻田鉤端螺旋體Cpf1(圖64中的參考號13)的人類密碼子優化序列的細節。圖75A:密碼子適應指數(CAI)。密碼子使用頻率沿基因序列長度的分佈。就高基因表現水平而言,在所希望的表現生物體中1.0 CAI被認為是完美的,並且>0.8的CAI被認為是良好的。圖75B:最佳的密碼子的頻率(FOP)。在計算的密碼子品質組中的密碼子分佈百分比。該值對於在所希望的表現生物體中針對給定胺基酸具有最大使用頻率的密碼子被設定為100。圖75C:GC含量調整。GC含量的理想百分比範圍為介於30%-70%之間。60bp視窗中的%GC含量的峰已被移除。圖75D:限制性內切酶和順式作用元件。圖75E:移除重複序列。圖75F-G:優化序列(優化序列長度:3939,GC% 51.30)(SEQ ID NO:1270)。圖75H:蛋白質序列(SEQ ID NO:1271)。
圖76A-76H顯示出具有3834個核苷酸的基因長度的毛螺旋菌科細菌ND2006 Cpf1(圖64中的參考號14)的人類密碼子
優化序列的細節。圖76A:密碼子適應指數(CAI)。密碼子使用頻率沿基因序列長度的分佈。就高基因表現水平而言,在所希望的表現生物體中1.0 CAI被認為是完美的,並且>0.8的CAI被認為是良好的。圖76B:最佳的密碼子的頻率(FOP)。在計算的密碼子品質組中的密碼子分佈百分比。該值對於在所希望的表現生物體中針對給定胺基酸具有最大使用頻率的密碼子被設定為100。圖76C:GC含量調整。GC含量的理想百分比範圍為介於30%-70%之間。60bp視窗中的%GC含量的峰已被移除。圖76D:限制性內切酶和順式作用元件。圖76E:移除重複序列。圖76F-G:優化序列(優化序列長度:3834,GC% 51.06)(SEQ ID NO:1272)。圖76H:蛋白質序列(SEQ ID NO:1273)。
圖77A-77H顯示出具有3930個核苷酸的基因長度的狗口腔卟啉單胞菌3 Cpf1(圖64中的參考號15)的人類密碼子優化序列的細節。圖77A:密碼子適應指數(CAI)。密碼子使用頻率沿基因序列長度的分佈。就高基因表現水平而言,在所希望的表現生物體中1.0 CAI被認為是完美的,並且>0.8的CAI被認為是良好的。圖77B:最佳的密碼子的頻率(FOP)。在計算的密碼子品質組中的密碼子分佈百分比。該值對於在所希望的表現生物體中針對給定胺基酸具有最大使用頻率的密碼子被設定為100。圖77C:GC含量調整。GC含量的理想百分比範圍為介於30%-70%之間。60bp視窗中的%GC含量的峰已被移除。圖77D:限制性內切酶和順式作用元件。圖77E:移除重複序列。圖77F-G:優化序列(優化序列長度:3930,GC% 54.42)(SEQ ID NO:1274)。圖77H:蛋白質序列(SEQ ID NO:1275)。
圖78A-78H顯示出具有4119個核苷酸的基因長度的解糖腖普雷沃菌Cpf1(圖64中的參考號16)的人類密碼子優化序列的細節。圖78A:密碼子適應指數(CAI)。密碼子使用頻率沿基因序列長度的分佈。就高基因表現水平而言,在所希望的表現生物體中1.0 CAI被認為是完美的,並且>0.8的CAI被認為是良好的。圖78B:最佳的密碼子的頻率(FOP)。在計算的密碼子品質組中的密碼子分佈百分比。該值對於在所希望的表現生物體中針對給定胺基酸具有最大使用頻率的密碼子被設定為100。圖78C:GC含量調整。GC含量的理想百分比範圍為介於30%-70%之間。60bp視窗中的%GC含量的峰已被移除。圖78D:限制性內切酶和順式作用元件。圖78E:移除重複序列。圖78F-G:優化序列(優化序列長度:4119,GC% 51.88)(SEQ ID NO:1276)。圖78H:蛋白質序列(SEQ ID NO:1277)。
圖79A-79H顯示出具有3888個核苷酸的基因長度的獼猴卟啉單胞菌Cpf1(圖64中的參考號17)的人類密碼子優化序列的細節。圖79A:密碼子適應指數(CAI)。密碼子使用頻率沿基因序列長度的分佈。就高基因表現水平而言,在所希望的表現生物體中1.0 CAI被認為是完美的,並且>0.8的CAI被認為是良好的。圖79B:最佳的密碼子的頻率(FOP)。在計算的密碼子品質組中的密碼子分佈百分比。該值對於在所希望的表現生物體中針對給定胺基酸具有最大使用頻率的密碼子被設定為100。圖79C:GC含量調整。GC含量的理想百分比範圍為介於30%-70%之間。60bp視窗中的%GC含量的峰已被移除。圖79D:限制性內切酶和順式作用元件。圖79E:移除重複序列。圖79F-G:優化序列(優化序列長度:
3888,GC% 53.26)(SEQ ID NO:1278)。圖79H:蛋白質序列(SEQ ID NO:1279)。
圖80A-80I示出了每個異種同源物(是指圖64中的編碼參考號3-17)的同向重複(DR)序列以及它們的預測折疊結構。分別按出現的順序揭露了SEQ ID NO 1280-1313。
圖81示出了人類Emx1座位的PCR擴增子的切割。分別按出現的順序揭露了SEQ ID NO 1314-1318。
圖82A-82B示出了5' DR的截短對切割活性的影響。圖82A示出了其中指明了使用5 DR截短物的切割結果的凝膠。圖82B示出了其中crDNA △DR5擾亂5'端的莖環的圖。這指明5'端處的莖環係為切割活性所必需的。分別按出現的順序揭露了SEQ ID NO 1319-1324。
圖83示出了crRNA-DNA靶錯配對切割效率的影響。分別按出現的順序揭露了SEQ ID NO 1325-1335。
圖84示出了使用純化的弗朗西絲菌屬Cpf1和普雷沃菌屬Cpf1的DNA切割。揭露了SEQ ID NO:1336。
圖85A-85B示出了DR二級結構的圖。圖85A示出了FnCpf1 DR二級結構(SEQ ID NO:1337)(莖環突出顯示)。圖85B示出了PaCpf1 DR二級結構(SEQ ID NO:1338)(莖環突出顯示,除了環區中的單個鹼基不同之外都相同)。
圖86示出了FnCp1座位的RNA定序分析的另外描繪。
圖87A-87B示出了成熟crRNA序列的示意圖。圖87A
示出了FnCpf1的成熟crRNA序列。圖87B示出了PaCpf1的成熟crRNA序列。分別按出現的順序揭露了SEQ ID NO 1339-1342。
圖88示出了使用人類密碼子優化的新殺手弗朗西絲菌FnCpf1的DNA切割。上條帶對應於未切割的全長片段(606bp)。預期的~345bp和~261bp大小的切割產物由三角形指示。
圖89示出了體外異種同源物測定,展示了Cpf1異種同源物進行的切割。
圖90A-90C示出了來自體外切割測定的計算得出的PAM。
圖91示出了為交錯方式的Cpf1切割,產生了5'突出端。分別按出現的順序揭露了SEQ ID NO 1343-1345。
圖92示出了間隔區長度對切割的影響。分別按出現的順序揭露了SEQ ID NO 1346-1352。
圖93示出了HEK293T細胞中FnCpf1介導的indel的SURVEYOR數據。
圖94A-94F示出了與野生型FnCpf1座位的轉錄物的加工相比的在缺失FnCpf1座位部分時的轉錄物的加工。圖95B、95D和95F對加工的間隔區進行放大。分別按出現的順序揭露了SEQ ID NO 1353-1401。
圖95A-95E顯示土拉熱弗朗西絲菌新殺手亞種U112 Cpf1 CRISPR座位提供了針對含有側接5'-TTN PAM的原型間隔區的質粒的轉化的免疫。圖95A示出了土拉熱弗朗西絲菌新殺手亞
種U112(NC_008601)中發現的兩種CRISPR座位的組構。對FnCas9和FnCpf1的結構域組構進行了比較。圖95B提供了用於發現PAM位置和同一性的質粒缺失測定的示意性說明。用含有側接隨機化5'或3' PAM序列的匹配原型間隔區的質粒的文庫轉化具有異源FnCpf1座位質粒(pFnCpf1)或空載體對照的感受態大腸桿菌並且使用抗生素進行選擇以缺失攜帶成功靶向的PAM的質粒。提取出來自存活群落的質粒並且對該等質粒進行定序以確定缺失的PAM序列。圖95C-95D示出了如藉由質粒缺失測定確定的FnCpf1 PAM的序列圖示。位置處的字母高度由信息量來確定;誤差條顯示出的95%貝葉斯(Bayesian)置信區間。圖95E顯示具有pFnCpf1的大腸桿菌對攜帶5'-TTN PAM的質粒展示出穩健的干擾(n=3,誤差條表示平均值±平均數標準誤差(S.E.M.))。
圖96A-96C顯示大腸桿菌中FnCpf1和CRISPR陣列的異源表現足以介導質粒DNA干擾和crRNA成熟。土拉熱弗朗西絲菌新殺手亞種U112的小RNA定序(圖96A)揭示出FnCpf1 CRISPR陣列的轉錄和加工。成熟crRNA開始於19個核苷酸的部分同向重複序列,接著是23-25個核苷酸的間隔區序列。用攜帶合成啟動子驅動的FnCpf1和CRISPR陣列的質粒轉化的大腸桿菌的小RNA定序(圖96B)顯示crRNA加工與Cas基因以及FnCpf1座位中其他序列元件無關。圖96C描繪了具有FnCpf1 CRISPR座位的不同截短物的大腸桿菌並且顯示僅FnCpf1和CRISPR陣列係為質粒DNA干擾所需要的(n=3,誤差條顯示平均值±平均數標準誤差)。揭露了SEQ ID NO:1580。
圖97A-97E顯示FnCpf1藉由crRNA來進行靶向以切割體外DNA。圖97A係FnCpf1 crRNA-DNA靶向複合物的示意圖。切割位點由紅色箭頭指示(SEQ ID NO 1402和1403,分別按出現順序揭露)。FnCpf1和crRNA以crRNA和Mg2+依賴性方式單獨介導RNA指導的靶DNA切割(圖97B)。圖97C顯示FnCpf1切割直鏈DNA和超螺旋DNA兩者。圖97D顯示來自FnCpf1消化的靶標的桑格(Sanger)定序痕跡顯示出交錯的突出端(SEQ ID NO 1404和1406,分別按出現的順序揭露)。非模板的另外腺嘌呤(指代為N)的添加係定序中使用的聚合酶的偽影(artifact)。反向引物讀取表示為反向互補序列以有助於視覺化。圖97E顯示切割依賴於5' PAM處的鹼基配對。FnCpf1僅可識別正確地沃森-克裡克配對(Watson-Crick paired)的DNA中的PAM。
圖98A-98B顯示FnCpf1的C末端RuvC結構域中的催化殘基係為DNA切割所需的。圖98A示出了FnCpf1結構域結構,其中RuvC催化殘基被突出顯示。基於與嗜熱棲熱菌(Thermus thermophilus)RuvC(PDB ID:4EP5)的序列同源性來鑒定催化殘基。圖98B描繪了天然型TBE PAGE凝膠,其顯示FnCpf1的RuvC催化殘基突變(D917A和E1006A)和SpCas9的RuvC催化殘基突變(D10A)阻止雙股DNA的切割。使TBE-尿素PAGE凝膠變性顯示FnCpf1的RuvC催化殘基突變(D917A和E1006A)阻止DNA切口產生活性,而SpCas9的RuvC催化殘基突變(D10A)使得靶位點產生切口。
圖99A-99E示出了體外FnCpf1核酸酶活性的crRNA要
求。圖99A示出了間隔區長度對FnCpf1切割活性的影響。圖99B示出了crRNA-靶DNA錯配對FnCpf1切割活性的影響。圖99C展示了同向重複序列長度對FnCpf1切割活性的影響。圖99D顯示FnCpf1切割活性取決於同向重複序列RNA結構的莖中的二級結構。圖99E顯示FnCpf1切割活性不受環突變影響,而是對同向重複序列的3'-大部分鹼基中的突變具有敏感性。分別按出現的順序揭露了SEQ ID NO 1407-1433。
圖100A-100F提供了Cpf1家族蛋白多樣性和功能的分析。圖100A-100B示出了針對功能分析所選擇的16種Cpf1異種同源物的系統發育比較。保守序列以深灰色示出。突出顯示了RuvC結構域、橋螺旋(bridge helix)和鋅指。圖100C示出了來自16種Cpf1家族蛋白的同向重複序列的比對。在crRNA成熟後移除的序列為灰色。非保守序列為紅色。莖雙股體被突出顯示為灰色。圖100D描繪了成熟crRNA中的同向重複序列的RNAfold(勞倫茲(Lorenz)等人,2011)預測。示出了對FnCpf1以及三個保守性較低的異種同源物的預測。圖100E顯示具有類似的同向重複序列的異種同源物crRNA能夠與FnCpf1一起用於介導靶DNA切割。圖100F示出了使用含有隨機化PAM側接的原型間隔區的質粒文庫的體外切割所鑒定的8種Cpf1家族蛋白的PAM序列。分別按出現的順序揭露了SEQ ID NO 1434-1453。
圖101A-101E顯示在人類細胞系中Cpf1介導穩健的基因組編輯。圖101A係示出了各個Cpf1家族蛋白在使用CMV驅動的表現載體的HEK 293FT細胞中的表現的示意圖(schemative)。
使用含有融合至crRNA序列的U6啟動子的PCR片段,相應的crRNA被表現。使用Surveyor核酸酶測定或靶向深度定序來分析轉染細胞。圖101B(上面)描繪了DNMT1-靶向crRNA 3的序列,並且定序讀取(下面)示出了代表性的indel。圖101B分別按出現的順序揭露了SEQ ID NO 1454-1465。圖101C提供了體外切割活性和體內切割活性的比較。DNMT1靶區進行PCR擴增並且使用基因組片段來測試Cpf1介導的切割。所有的8種Cpf1家族蛋白質示出了體外DNA切割(上面)。候選物7-AsCpf1和13-Lb3Cpf1促進人類細胞中的穩健的indel形成(底部)。圖101D示出了人類DNMT1座位中的Cpf1和SpCas9靶序列(SEQ ID NO 1466-1473,分別按出現的順序揭露)。圖101E提供了Cpf1和SpCas9基因組編輯效率的比較。靶位點對應於圖101D中所示的序列。
圖102A-102D示出了用於鑒定FnCpf1 PAM的體外質粒缺失測定。(還參見圖95)。圖102A:用攜帶隨機化5' PAM序列的質粒的文庫對具有pFnCpf1的大腸桿菌的轉化。質粒的亞群被缺失。繪圖按排序後的順序示出了缺失水平。缺失被測定為相比於pACYC184大腸桿菌對照的標準化豐度倍數比的負log2。使用閾值為3.5以上的PAM來產生序列圖示。圖102B:用攜帶隨機化3' PAM序列的質粒的文庫對具有pFnCpf1的大腸桿菌的轉化。質粒的亞群被缺失。繪圖按排序後的順序示出了缺失水平。缺失被測定為相比於pACYC184大腸桿菌對照的標準化豐度倍數比的負log2並且使用閾值為3.5以上的PAM來產生序列圖示。圖102C:攜帶隨機化5' PAM序列的質粒的輸入文庫。繪圖按排序後的順序示出了缺失水平。缺失被測定為相比於pACYC184大腸桿菌對照的標準化豐
度倍數比的負log2。使用閾值為3.5以上的PAM來產生序列圖示。圖102D:超過5' PAM的2和3位置處的配對鹼基組合的顯著性閾值的獨特PAM的數目。
圖103A-103B示出了FnCpf1蛋白純化。(還參見圖97)。圖103A描繪了FnCpf1的考馬斯藍(Coomassie blue)染色的丙烯醯胺凝膠,其示出了分散式純化。從Ni-NTA柱中洗提出恰好高於160kD的條帶,該帶與MBP-FnCpf1融合物(189.7kD)的大小一致。在添加TEV蛋白酶之後,出現較低分子量的條帶,該帶與不含FnCpf1的147kD大小一致。圖103B:fnCpf1的大小排阻凝膠過濾。FnCpf1在大約300kD大小(62.65mL)下洗提出,表明Cpf1可能以二聚體存在於溶液中。圖103C示出了用於校準Superdex 200柱的蛋白質標準物。BDex=藍葡聚糖(空隙體積),Ald=醛縮酶(158kD),Ov=卵白蛋白(44kD),RibA=核糖核酸酶(13.7kD),Apr=抑肽酶(6.5kD)。圖103D:Superdex 200柱的校準曲線。Ka被計算為(洗提體積-空隙體積)/(幾何柱體積-空隙體積)。對標準物進行繪圖並且擬合成對數曲線。
圖104A-104E示出了FnCpf1切割型式。(還參見圖97)。來自FnCpf1消化的DNA靶的桑格定序痕跡顯示出交錯的突出端。非模板的另外腺嘌呤(指代為N)的添加係定序中使用的聚合酶的偽影。針對在原型間隔區1(圖104A)、原型間隔區2(圖104B)、原型間隔區3(圖104C)和靶標DNMT1和EMX1(圖104D)情況下的不同TTN PAM示出了桑格痕跡。(-)股序列係反向互補的以示出上股序列。切割位點由紅色三角形指示。較小的三角形指示推
定的替代性切割位點。圖104E示出了PAM-遠端的crRNA-靶DNA錯配對FnCpf1切割活性的影響。分別按出現的順序揭露了SEQ ID NO 1474-1494。
圖105A-105B示出了FnCpf1(SEQ ID NO:1495)、AsCpf1(SEQ ID NO:1496)和LbCpf1(SEQ ID NO:1497)的胺基酸序列比對。(還參見圖100)。保守的殘基用紅色背景突出顯示並且保守的突變用輪廓和紅色字體突出顯示。比對上方(FnCpf1)和下方(LbCpf1)的二級結構預測被突出顯示。α螺旋示出為波紋符號並且β股示出為短劃線。圖95A中鑒定的蛋白質結構域也被突出顯示。
圖106A-106D提供了對應於針對哺乳動物實驗所選擇的16種Cpf1家族蛋白的細菌基因組座位圖譜。(還參見圖100)。圖106A-106D分別按出現的順序揭露了SEQ ID NO 1498-1513。
圖107A-107E示出了Cpf1家族蛋白的體外特性。圖107A係用於使用Cpf1家族蛋白的體外PAM篩選的示意圖。藉由各種Cpf1家族蛋白以及它們的相應crRNA切割具有隨機化5' PAM序列的質粒的文庫。純化未切割的質粒DNA並且對其進行定序以鑒定缺失的特異性PAM模體。圖107B指示了針對7-AsCpf1超過5' PAM的2和3位置處的配對鹼基組合的顯著性閾值的獨特序列的數目。圖107C指示了針對13-LbCpf1超過5”PAM的2、3和4位置處的三三鹼基組合的顯著性閾值的獨特PAM的數目。圖107D-107E E和F示出了來自7-AsCpf1消化的靶標(圖107E)和13-LbCpf1消化的靶標(圖107F)的桑格(Sanger)定序痕跡並且顯示出交錯的突出
端。非模板的另外腺嘌呤(指代為N)的添加係定序中使用的聚合酶的偽影。切割位點由紅色三角形指示。較小的三角形指示推定的替代性切割位點。圖107D-107E分別按出現的順序揭露了SEQ ID NO 1514-1519。
圖108A-108F指示了附加座位處的人類細胞基因組編輯效率。Surveyor凝膠示出了對藉由每種Cpf1家族蛋白在DNMT1靶位點1(圖108A)、2(圖108B)和4(圖108C)處實現的indel效率的量化。圖108A-108C指示了附加座位處的人類細胞基因組編輯效率和DNMT靶位點切割的桑格定序。Surveyor凝膠示出了對藉由每種Cpf1家族蛋白在EMX1靶位點1(圖108D)和2(圖108E)處實現的indel效率的量化。AsCpf1和LbCpf1與DNMT1靶位點2、3和4的indel分佈(圖108F)。青色條表示總的indel覆蓋度;藍色條表示indel的3'端的分佈。對每個靶標,PAM序列用紅色表示並且靶序列用淡藍色表示。
圖109A-109C描繪了Cpf1核酸酶初級結構的計算分析,揭示了三個不同的區。第一係C末端RuvC樣結構域,其係僅功能表征的結構域。第二係N末端α-螺旋區並且第三係位於RuvC樣結構域與α-螺旋區之間的混合的α區和β區。
圖110A-110E描繪了AsCpf1Rad50比對(PDB4W9M)。分別按出現的順序揭露了SEQ ID NO 1520和1521。圖110C描繪了AsCpf1 RuvC比對(PDB 4LD0)。分別按出現的順序揭露了SEQ ID NO 1522和1523。圖110D-110E描繪了AsCpf1和FnCpf1的比對,該比對鑒定出FnCpf1中的Rad50結構域。分別按出現的順序揭露了
SEQ ID NO 1524和1525。
圖111描繪了Rad50(4W9M)與DNA複合的結構。DNA相互作用殘基係突出顯示的(為紅色)。
圖112描繪了RuvC(4LD0)與霍利迪連接體(holiday junction)複合的結構。DNA相互作用殘基以紅色突出顯示。
圖113描繪了AsCpf1與位點特異性重組酶XerD的區比對的blast。XerD活性位點區係LYWTGMR(SEQ ID NO:1),其中R係催化殘基。分別按出現的順序揭露了SEQ ID NO 1526-1527。
圖114描繪了Cpf1異種同源物中保守的區(黃色框)並且雖然R不是保守的,但是高度保守的天冬胺酸(橙色框)恰好係該區的C末端,以及附近的具有絕對保守的精胺酸的保守區(藍色框)。天冬胺酸係LbCpf1中的D732。分別按出現的順序揭露了SEQ ID NO 1204和1528-1579。
圖115A示出了實驗,其中在轉染前24h,每24孔接種150,000個HEK293T細胞。使用Lipofectamin2000用400ng huAsCpf1質粒和100ng包含針對GRIN28的一個指導序列和以串聯方式置於U6啟動子後面的針對EMX1的一個指導序列的串聯(tandem)指導質粒轉染細胞。轉染後72h收穫細胞並且使用SURVEYOR核酸酶測定來測定由串聯指導序列介導的AsCpf1活性。
圖115B展示出GRIN28和EMX1基因兩者中的indel資訊。
圖116示出了在EDTA濃度增加(和Mg2+濃度降低)的情況下陣列的FnCpf1切割。緩衝液係20mM TrisHCl pH 7(室溫),50mM KCl並且包括鼠類RNA酶抑制劑以防止RNA由於從蛋白質純化留下的潛在痕量的非特異性RNA酶而降解。
在此的圖僅是出於說明目的並且不一定按比例繪製。
本申請描述了功能上不同於先前所述的CRISPR-Cas9系統的新型RNA指導的核酸內切酶(例如,Cpf1效應蛋白)並且因此在此與該等新型內切核酸酶相關聯的元件術語相應地被修改。在此所述的Cpf1相關CRISPR陣列被加工為成熟crRNA而不需要附加tracrRNA。在此所述的crRNA包含間隔區序列(或指導序列)和同向重複序列並且Cpf1p-crRNA複合物本身足以有效地切割靶DNA。在此所述的種子序列,例如FnCpf1指導RNA的種子序列大約在間隔區序列(或指導序列)的5'端上的前5個核苷酸之內並且種子序列內的突變不利地影響Cpf1效應蛋白複合物的切割活性。
總的來說,CRISPR系統特徵在於在靶序列的位點處促進CRISPR複合物形成的元件(也稱之為內源性CRISPR系統情況下的原型間隔區)。在形成CRISPR複合物的情況下,“靶序列”係指指導序列被設計為所靶向的序列,例如與其具有互補性的序列,其中靶序列與指導序列之間的雜交促進CRISPR複合物的形成。指導序列藉由其而與靶序列互補對切割活性係重要的部分在此稱之為種子序列。靶序列可包括任何多核苷酸,諸如DNA或RNA多核
苷酸並且包含在感興趣的靶座位之內。在一些實施方式中,靶序列位於細胞的核或細胞質中。在此所述的本發明涵蓋第2類CRISPR-Cas系統的新型效應蛋白,其中Cas9係示例性效應蛋白並且因此本申請中用於描述新型效應蛋白的術語可以與用於描述CRISPR-Cas9系統的術語相關。
CRISPR-Cas座位具有超過50種的基因家族並且不存在嚴格的通用基因。因此,單一進化樹係不可行的並且需要多分支方法來鑒定新家族。到目前為止,針對93種Cas蛋白存在395種表現譜的全面cas基因鑒定。分類包括特徵基因表現譜加上座位體系結構的特徵。新的CRISPR-Cas系統分類提出在圖1中。第1類包括多亞基crRNA-效應物複合物(Cascade)並且第2類包括單亞基crRNA-效應物複合物(Cas9樣)。圖2提供了CRISPR-Cas的分子組構。圖3提供了I型和III型效應複合物的結構:共同的體系結構/共同的祖先,儘管存在廣泛的序列趨異性。圖4示出了作為以RNA識別模體(RRM)為中心的系統的CRISPR-Cas。圖5示出了Cas1系統發育,其中自我調整模組和crRNA-效應物模組的重組顯示出CRISPR-Cas進化的主要方面。圖6示出了CRISPR-Cas種群調查,具體地在古生菌和細菌之中CRISPR-Cas型/亞型的分佈。
CRISPR-Cas系統的作用通常被分為三個階段:(1)自我調整或間隔區整合,(2)CRISPR座位初級轉錄物(前crRNA)的加工和包含間隔區和對應於CRISPR重複序列的5'和3'片段可變區的crRNA的成熟,以及(3)DNA(或RNA)干擾。大多數的已知CRISPR-Cas系統中存在的兩種蛋白質Cas1和Cas2足以用於將間
隔區插入到CRISPR盒中。這兩種蛋白質形成為此自我調整過程所需要的複合物;Cas1的內切核酸酶活性係為間隔區整合所需要的,而Cas2似乎執行非酶性功能。Cas1-Cas2複合物表示CRISPR-Cas的高度保守的“資訊加工”模組,該模組似乎准自主(quasi-autonomous)於系統的其餘部分。(參見CRISPR-Cas系統的注釋和分類(Annotation and Classification of CRISPR-Cas Systems),馬卡洛夫.KS(Makarova KS)、庫尼恩.EV(Koonin EV),分子生物學方法(Methods Mol Biol.)2015;1311:47-75)。
先前所述的第2類系統,即II型和推定的V型僅由cas操縱子中的三個或四個基因組成,即包括自我調整模組(不參與干擾的cas1-cas2基因對)的cas1和cas2基因,負責干擾但還有助於前crRNA加工和自我調整的單一多結構域效應蛋白,以及常常在至少一些II型系統中可有可無的具有不典型功能的第四基因(並且在一些情況下第四基因係cas4(生物化學或電腦類比證據顯示Cas4係具有三個半胱胺酸C末端簇的PD-(DE)xK超家族核酸酶;具有5'-ssDNA外切核酸酶活性)或編碼失活的ATP酶的csn2)。在大多數情況下,CRISPR陣列和稱為tracrRNA(反式編碼小CRISPR RNA)的不同RNA種類的基因與第2類cas操縱子相鄰。tracrRNA與對應CRISPR陣列內的重複序列部分同源並且是為前crRNA的加工所必需的,該加工由不與CRISPR-Cas座位相關聯的普遍存在的細菌酶RNA酶III催化。
Cas1係大多數CRISPR-Cas系統中存在的最保守的蛋白質並且相比於其他Cas蛋白進化較慢。因此,Cas1系統發育已用
作CRISPR-Cas系統分類的指南。生物化學或電腦類比證據顯示Cas1係金屬依賴性的去氧核糖核酸酶。大腸桿菌中Cas1的缺失使得對DNA損傷的敏感性增加並且使得染色體分離減弱,如在“CRISPR-Cas系統在細菌抗病毒免疫和DNA修復中的雙重功能(A dual function of the CRISPR-Cassystem in bacterial antivirus immunity and DNA repair)”,巴布.M(Babu M)等人分子微生物學(Mol Microbiol)79:484-502(2011)中所述。生物化學或電腦類比證據顯示Cas 2係對富含U的區具有特異性的RNA酶並且是雙股的DNA酶。
本發明的方面涉及與第2類CRISPR-Cas系統相關聯的新型效應蛋白的鑒定和工程化。在一較佳的實施方式中,效應蛋白包含單亞基的效應物模組。在另一個實施方式中,效應蛋白在原核細胞或真核細胞中具有功能以便用於體外、體內或離體應用。本發明的一個方面涵蓋用於預測新的第2類CRISPR-Cas系統和鑒定其中組分的計算方法和演算法。
在一個實施方式中,鑒定新型第2類CRISPR-Cas座位的計算方法包括以下步驟:檢測編碼Cas1蛋白的所有疊連群;鑒定20kB cas1基因內的所有預測蛋白編碼基因;將鑒定的基因與Cas蛋白特異性表現譜和預測的CRISPR陣列進行比較;選擇含有大於500個胺基酸(>500aa)的蛋白質的未分類候選CRISPR-Cas座位;使用PSI-BLAST和HHPred分析選擇的候選物,從而分離和鑒定新型第2類CRISPR-Cas座位。除以上提到的步驟之外,候選物的另外分析可以藉由搜索基因組學資料庫尋找另外同源物來進行。
在一個方面中,檢測編碼Cas1蛋白的所有疊連群藉由GenemarkS進行,GenemarkS為基因預測程序,如“GeneMarkS:用於預測生物基因組中的基因啟動子(starts)的自培訓方法(GeneMarkS:a self-training method for prediction of gene starts in microbial genomes),發現調節區中的序列模體的意義(Implications for finding sequence motifs in regulatory regions)”,約翰.貝瑟麥(John Besemer),亞歷山大.羅明納茲(Alexandre Lomsadze)和馬克.波羅多夫斯基(Mark Borodovsky),核酸研究(Nucleic Acids Research)(2001)29,第2607-2618頁中所述,該文獻藉由引用結合在此。
在一個方面中,鑒定所有預測蛋白編碼基因藉由以下方式進行:將鑒定基因與Cas蛋白特異性表現譜進行比較並且根據NCBI保守結構域資料庫(CDD)注釋它們,該CDD係由用於古結構域和全長蛋白的充分注釋的多重序列比對模型的集合組成的單子注釋資源。該等可用作位置特異性評分矩陣(PSSM)以經由RPS-BLAST快速鑒定蛋白質序列中的保守結構域。CDD內容物包括NCBI管理的(curated)結構域,該結構域使用3D結構資訊來明確地限定結構域邊界並且提供對序列/結構/功能關係的見解,以及結構域模型,該等模型從許多外來源資料庫(Pfam、SMART、COG、PRK、TIGRFAM)導入。在另一個方面中,使用PILER-CR程序預測CRISPR陣列,該程序係用於發現CRISPR重複序列的公共領域軟體,如“PILER-CR:CRISPR重複序列的快速且精確的鑒定”,愛德格,R.C.(Edgar,R.C.)生物資訊學(Bioinformatics),1月20日;8:18(2007)中所述,該文獻藉由引用結合在此。
在另一個方面中,使用PSI-BLAST(位置特異性反覆運算基本局部比對搜索工具)進行逐案分析。PSI-BLAST由使用蛋白質-蛋白質BLAST檢測的在給定得分閾值之上的序列的多重序列比對得出位置特異性評分矩陣(PSSM)或表現譜。此PSSM用於進一步搜索資料庫以尋找新的匹配,並且進行校正以使用該等新檢測到的序列進行後續反覆運算。因此,PSI-BLAST提供了一種檢測蛋白質之間的遠源關係之手段。
在另一個方面中,使用HHpred進行逐案分析,該HHpred係一種用於序列資料庫搜索和結構預測之方法,該方法與BLAST或PSI-BLAST一樣易於使用並且同時在發現遠距離同源物方面更具有敏感性。實際上,HHpred敏感性同目前可獲得的用於結構預測的最強有力的服務器具有競爭力。HHpred係第一個基於表現譜隱蔽瑪律科夫(Markov)模型(HMM)的配對比較的伺服器。最常規的序列搜索方法搜索序列資料庫諸如UniProt或NR,而HHpred搜索比對資料庫如Pfam或SMART。這極大簡化了許多序列家族而不是雜亂的單一序列的命中(hit)列表。所有大型可公共獲得的表現譜和比對資料庫可藉由HHpred獲得。HHpred接受單一查詢序列或多重比對作為輸入值。僅在數分鐘內,HHpred以類似於PSI-BLAST格式的易讀格式返回搜索結果。搜索選擇包括局部比對或總體比對和二級結構相似性評分。HHpred可產生配對的查詢模板序列比對、合併的查詢模板多重比對(例如,對於可遞搜索)以及根據HHpred比對藉由MODELLER軟體計算的3D結構模型。
其中核酸係DNA或RNA並且在一些方面中還可以是
指DNA-RNA雜交體或其衍生物的術語“核酸靶向系統”總體是指涉及DNA或RNA靶向CRISPR相關(“Cas”)基因的表現或引導該等基因的活性的轉錄物和其他元件,該等轉錄物和其他元件可包括編碼DNA或RNA靶向Cas蛋白的序列和包含CRISPR RNA(crRNA)的DNA或RNA靶向指導RNA以及(在CRISPR-Cas9系統並非所有系統中)反式啟動CRISPR-Cas系統RNA(tracrRNA)序列或來自DNA或RNA靶向CRISPR座位的其他序列或轉錄物。在在此所述的Cpf1 DNA靶向的RNA指導型內切核酸酶系統中,tracrRNA序列不是需要的。總的來說,RNA靶向系統的特徵在於在靶RNA序列的位點處促進RNA靶向複合物形成的元件。在形成DNA或RNA靶向複合物的情況下,“靶序列”係指DNA或RNA靶向指導RNA被設計為與其具有互補性的DNA或RNA序列,其中靶序列與RNA靶向指導RNA之間的雜交促進RNA靶向複合物的形成。在一些實施方式中,靶序列位於細胞的核或細胞質中。
在本發明的一個方面中,本申請的新型DNA靶向系統(還稱之為DNA靶向CRISPR-Cas或CRISPR-Cas DNA靶向系統)係基於鑒定的型V(例如亞型V-A和亞型V-B)Cas蛋白的,該等蛋白不需要產生定制蛋白來靶向特異性DNA序列,相反,單一效應蛋白或酶可以由RNA分子程式設計來識別特異性DNA靶,換句話說,可以使用所述RNA分子來將酶募集至特異性DNA靶。本發明的方面具體涉及DNA靶向的RNA指導型Cpf1 CRISPR系統。
在本發明的一個方面中,本申請的新型RNA靶向系統(還稱之為RNA或RNA靶向CRISPR-Cas或CRISPR-Cas系統RNA
靶向系統)係基於鑒定的VI型Cas蛋白的,該等蛋白不需要產生定制蛋白來靶向特異性RNA序列,相反,單一酶可由RNA分子程式設計來識別特異性RNA靶,換句話說,可使用所述RNA分子來將酶募集至特異性RNA靶。
在此所述的核酸靶向系統、載體系統、載體和組成物可以用於多種核酸靶向應用,改變或修改基因產物諸如蛋白質的合成、核酸切割、核酸編輯、核酸剪接;靶核酸的運輸、靶核酸的追蹤、靶核酸的分離、靶核酸的視覺化等中。
如在此所用的,Cas蛋白或CRISPR酶係指新的CRISPR-Cas系統分類中呈現的任一種蛋白質。在一有利的實施方式中,本發明涵蓋V型CRISPR-Cas座位,例如Cpf1編碼座位(指代為亞型V-A)中鑒定的效應蛋白。目前,亞型V-A座位涵蓋cas1、cas2、不同的基因指代的cpf1以及CRISPR陣列。Cpf1(CRISPR相關蛋白Cpf1,亞型PREFRAN)係大蛋白質(約1300個胺基酸),其含有與Cas9的相應結構域同源的RuvC樣核酸酶結構域以及Cas9的特徵性富精胺酸簇的對應物。然而,Cpf1缺乏所有Cas9蛋白中存在的HNH核酸酶結構域,並且RuvC樣結構域在Cpf1序列中是連續的,這與其中含有包含HNH結構域的長插入物的Cas9相反。因此,在特定實施方式中,CRISPR-Cas酶僅包含RuvC樣核酸酶結構域。
Cpf1基因可以見於若干種不同的細菌基因組中,典型地與cas1、cas2和cas4基因以及CRISPR盒(例如,弗朗西絲菌屬cf.新殺手Fx1(Francisella cf.novicida Fx1)的FNFX1_1431-
FNFX1_1428)在同一座位中。因此,此推定的新型CRISPR-Cas系統的佈置似乎類似於II-B型的佈置。此外,與Cas9類似,Cpf1蛋白含有與轉位子ORF-B同源的便於鑒定的C末端區並且包含活性的RuvC樣核酸酶、富含精胺酸的區和Zn指(不存在於Cas9中)。然而,與Cas9不同,Cpf1還存在於沒有CRISPR-Cas環境的若干種基因組中並且其與ORF-B的相對較高相似性表明其可能是轉位子組分。表明如果此是真正的CRISPR-Cas系統並且Cpf1係Cas9的功能類似物,則其將是新型CRISPR-Cas類型,即V型(參見CRISPR-Cas系統的注釋和分類,馬卡洛夫.KS(Makarova KS)、庫尼恩.EV(Koonin EV),分子生物學方法(Methods Mol Biol.)2015;1311:47-75)。然而,如在此所述,將Cpf1指代為亞型V-A以將其與C2c1p區分,該C2c1p不具有相同的結構域結構並且因此被指代為亞型V-B。
在一有利的實施方式中,本發明涵蓋包含在指代為亞型V-A的Cpf1座位中鑒定的效應蛋白的組成物和系統。
本發明的方面還涵蓋在此所述的組成物和系統在基因組工程中例如用於在體外、體內或離體中改變或操縱原核細胞或真核細胞中的一種或多種基因的表現或一種或多種基因產物的方法和用途。
在本發明的實施方式中,術語成熟crRNA和指導RNA以及單一指導RNA如前面引用的文獻諸如WO 2014/093622(PCT/US2013/074667)中那樣可互換地使用。總的來說,指導序列係與靶多核苷酸序列具有足夠互補性以與靶序列雜交並引導
CRISPR複合物與靶序列的序列特異性結合的任何多核苷酸序列。在一些實施方式中,當使用適合比對演算法進行最佳比對時,指導序列與其相應靶序列之間的互補程度係約或超過約50%、60%、75%、80%、85%、90%、95%、97.5%、99%、或更大。最佳比對可以藉由使用用於比對序列的任何適合的演算法來確定,該等演算法的非限制性實例包括史密斯-沃特曼(Smith-Waterman)演算法、尼德曼-溫施演算法(Needleman-Wunsch algorithm)、基於巴羅斯-惠勒(Burrows-Wheeler)轉換的演算法(例如,巴羅斯-惠勒比對儀)、ClustalW、Clustal X、BLAT、諾沃比對(Novoalign)(諾沃克拉夫特技術公司(Novocraft Technologies);可在www.novocraft.com處獲得)、ELAND(加利福尼亞州聖迭哥億明達(Illumina,San Diego,CA))、SOAP(可在soap.genomics.org.cn處獲得)、以及Maq(可在maq.sourceforge.net處獲得)。在一些實施方式中,指導序列的長度係約或超過約5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75、或更多個核苷酸。在一些實施方式中,指導序列的長度係小於約75、50、45、40、35、30、35、25、20、15、12、或更少個核苷酸。較佳的是指導序列係10-30個核苷酸長。指導序列引導CRISPR複合物與靶序列的序列特異性結合的能力可以藉由任何適合的測定來評估。例如,足以形成CRISPR複合物的CRISPR系統的組分(包括有待測試的指導序列)可以諸如藉由用編碼CRISPR序列組分的載體進行轉染來提供給具有相應靶序列的宿主細胞,隨後諸如藉由在此所述的Surveyor測定評估靶序列內的優先切割。類似地,靶多核苷酸序列的切割可以在試管中
藉由以下方式進行評估:藉由提供靶序列、CRISPR複合物的組分(包括有待測試的指導序列)和不同於測試指導序列的對照指導序列並且在測試指導序列反應與對照指導序列反應之間比較靶序列處的結合或切割速率。其他測定係可能的,並且是熟習該項技術者能夠想到的。指導序列可以被選擇為靶向任何靶序列。在一些實施方式中,靶序列係細胞基因組中的序列。示例性靶序列包括靶基因組中獨特的那些。
總的來說,在整個說明書中,術語“載體”係指能夠轉運它所連接的另一個核酸的核酸分子。載體包括但不限於,單股、雙股或部分雙股的核酸分子;包含一個或多個游離端、不包含游離端(例如,環狀)的核酸分子;包含DNA、RNA或二者的核酸分子;以及本領域已知的其他種類的多核苷酸。一種類型的載體係“質粒”,該質粒係指一種環狀雙股DNA環,可以諸如藉由標準分子選殖技術向該環中插入另外的DNA區段。另一種類型的載體係病毒載體,其中病毒來源的DNA或RNA序列存在於包裝到病毒(例如,逆轉錄病毒、複製缺陷型逆轉錄病毒、腺病毒、複製缺陷型腺病毒、腺伴隨病毒)中的載體中。病毒載體還包括由病毒攜帶來轉染到宿主細胞中的多核苷酸。某些載體能夠在它們被引入至其中的宿主細胞中自主複製(例如,具有細菌複製起點的細菌載體以及附加型哺乳動物載體)。其他載體(例如,非附加型哺乳動物載體)在引入到宿主細胞後被整合到宿主細胞的基因組中,並且從而隨著宿主基因組一起複製。此外,某些載體能夠引導它們可操作地連接的基因的表現。此類載體在此被稱為“表現載體”。用於真核細胞並且在真核細胞中產生表現的載體可以在此稱之為
“真核表現載體”。在重組DNA技術中採用的常見表現載體常常是質粒形式。
重組表現載體可以包含處於適用於在宿主細胞中表現核酸的形式的本發明的核酸,這意味著重組表現載體包含一個或多個調節元件,該等調節元件可以基於用於表現的宿主細胞來選擇,可操作地連接至有待表現的核酸序列。在重組表現載體內,“可操作地連接”旨在意指感興趣的核苷酸序列以允許核苷酸序列表現(例如,在體外轉錄/翻譯系統中或當該載體被引入到宿主細胞時在宿主細胞中)的方式連接至一個或多個調節元件。
術語“調節元件”旨在包括啟動子、增強子、內部核糖體進入位點(IRES)以及其他表現控制元件(例如,轉錄終止信號,諸如多聚腺苷酸化信號和聚U序列)。此類調節元件描述於例如高德爾(Goeddel),基因表現技術:酶學方法(GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY)185,學術出版社(Academic Press),加利福尼亞州聖迭哥(1990)中。調節元件包括引導核苷酸序列在許多類型的宿主細胞中連續表現的那些元件和引導核苷酸序列僅在某些宿主細胞中表現的那些元件(例如,組織特異性調節序列)。組織特異性啟動子可以引導主要在希望的感興趣的組織諸如肌肉、神經元、骨骼、皮膚、血液、特定器官(例如,肝臟、胰臟)、或特定細胞類型(例如,淋巴細胞)中的表現。調節元件還可以時間依賴性方式諸如細胞週期依賴性或發育階段依賴性方式引導表現,這可以是或也可以不是組織特異性或細胞類型特異性的。在一些實施方式中,載體
包含一個或多個pol III啟動子(例如,1、2、3、4、5、或更多個pol III啟動子)、一個或多個pol II啟動子(例如,1、2、3、4、5、或更多個pol II啟動子)、一個或多個pol I啟動子(例如,1、2、3、4、5、或更多個pol I啟動子)、或其組合。pol III啟動子的實例包括但不限於,U6和H1啟動子。pol II啟動子的實例包括但不限於,逆轉錄病毒勞斯氏肉瘤病毒(Rous sarcoma virus)(RSV)LTR啟動子(視情況具有RSV增強子)、巨細胞病毒(CMV)啟動子(視情況具有CMV增強子)[例如,參見博沙特(Boshart)等人,細胞(Cell),41:521-530(1985)]、SV40啟動子、二氫葉酸還原酶啟動子、β-肌動蛋白啟動子、磷酸甘油激酶(PGK)啟動子、以及EF1α啟動子。術語“調節元件”還涵蓋增強子元件,諸如WPRE;CMV增強子;HTLV-I的LTR中的R-U5'區段(分子細胞生物學(Mol.Cell.Biol.),第8(1)卷,第466-472頁,1988);SV40增強子;以及兔β-球蛋白的外顯子2與3之間的內含子序列(美國國家科學院院刊(Proc.Natl.Acad.Sci.USA.),第78(3)卷,第1527-31頁,1981)。熟習該項技術者將瞭解的是,表現載體的設計可以取決於如有待轉化的宿主細胞的選擇、所希望的表現水平等的此類因素。載體可以引入到宿主細胞中從而產生由在此所述的核酸編碼的轉錄物、蛋白質或肽,包括融合蛋白或肽(例如,成簇規律間隔短迴文重複序列(CRISPR)轉錄物、蛋白質、酶、其突變體形式、其融合蛋白等)。
有利的載體包括慢病毒和腺伴隨病毒並且此類載體類型還可以針對靶向的特定細胞類型來選擇。
如在此所用,術語型V CRISPR-Cas座位效應蛋白的“crRNA”或“指導RNA”或“單一指導RNA”或“sgRNA”或“一種或多種核酸組分”包括與靶核酸序列具有足夠互補性以與靶核酸序列雜交並引導核酸靶向複合物與靶核酸序列的序列特異性結合的任何多核苷酸序列。在一些實施方式中,當使用適合比對演算法進行最佳比對時,互補程度係約或超過約50%、60%、75%、80%、85%、90%、95%、97.5%、99%、或更大。最佳比對可以藉由使用用於比對序列的任何適合的演算法來確定,該等演算法的非限制性實例包括史密斯-沃特曼演算法、尼德曼-溫施演算法、基於巴羅斯-惠勒轉換的演算法(例如,巴羅斯-惠勒比對儀)、ClustalW、Clustal X、BLAT、諾沃比對(諾沃克拉夫特技術公司;可在www.novocraft.com處獲得)、ELAND(加利福尼亞州聖迭哥億明達)、SOAP(可在soap.genomics.org.cn處獲得)、以及Maq(可在maq.sourceforge.net處獲得)。指導序列(在核酸靶向指導RNA內)引導核酸靶向複合物與靶核酸序列的序列特異性結合的能力可以是藉由任何適合的測定來評估。例如,足以形成核酸靶向複合物的核酸靶向CRISPR系統的組分(包括有待測試的指導序列)可以諸如藉由用編碼核酸靶向複合物組分的載體進行轉染來提供給具有相應靶核酸序列的宿主細胞,隨後諸如藉由在此所述的Surveyor測定評估靶核酸序列內的優先靶向(例如切割)。類似地,靶核酸序列的切割可以在試管中藉由以下方式進行評估:藉由提供靶核酸序列、核酸靶向複合物的組分(包括有待測試的指導序列)和不同於測試指導序列的對照指導序列,並且在測試指導序列反應與對照指導序列反應之間比較靶序列處的結合或切割速率。
其他測定係可能的,並且是熟習該項技術者能夠想到的。指導序列和因此核酸靶向指導RNA可以被選擇成靶向任何靶核苷酸序列。靶序列可以是DNA。靶序列可以是任何RNA序列。在一些實施方式中,靶序列可以是選自下組的RNA分子內的序列,該組由以下各項組成:信使RNA(mRNA)、前mRNA、核糖體RNA(rRNA)、轉移RNA(tRNA)、微小RNA(miRNA)、小干擾RNA(siRNA)、小核RNA(snRNA)、小核仁RNA(snoRNA)、雙股RNA(dsRNA)、非編碼RNA(ncRNA)、長的非編碼RNA(lncRNA)以及細胞質小RNA(scRNA)。在一些較佳的實施方式中,靶序列可以是選自由mRNA、前mRNA和rRNA組成的組的RNA分子內的序列。在一些較佳的實施方式中,靶序列可以是選自由ncRNA和lncRNA組成的組的RNA分子內的序列。在一些更較佳的實施方式中,靶序列可以是mRNA分子或前mRNA分子內的序列。
在一些實施方式中,核酸靶向指導RNA被選擇以減小該RNA靶向指導RNA內的二級結構程度。在一些實施方式中,當進行最佳折疊時,核酸靶向指導RNA的約或小於約75%、50%、40%、30%、25%、20%、15%、10%、5%、1%,或更少的核苷酸參與自互補鹼基配對。最佳折疊可以是藉由任何適合的多核苷酸折疊演算法來確定。一些程序係基於計算最小吉布斯自由能。一種這樣的演算法的實例係mFold,如藉由朱克(Zuker)和施蒂格勒(Stiegler)(核酸研究9(1981),133-148)。另一個示例性折疊演算法係使用質心結構預測演算法的線上網站伺服器RNAfold,它係維也納大學的理論化學研究所開發的(例如,參見A.R..格魯伯(A.R.Gruber)等人,2008,細胞106(1):23-24;以及PA.凱爾(PA
Carr)和GM.丘奇(GM Church),2009,自然生物技術(Nature Biotechnology)27(12):1151-62)。
“tracrRNA”序列或類似術語包括與crRNA序列具有足夠互補性以進行雜交的任何多核苷酸序列。如上文所指出的,在本發明的實施方式中,tracrRNA不是為Cpf1效應蛋白複合物的切割活性所需要的。
申請人還進行了激發實驗以驗證V型/VI型蛋白諸如Cpf1/C2c1/C2c2的DNA靶向和切割能力。此實驗與大腸桿菌中的StCas9異源表現的類似工作(薩普拉諾薩克斯,R.(Sapranauskas,R.)等人核酸研究39,9275-9282(2011))極為相似。申請人將含有PAM和抗性基因兩者的質粒引入到異源大腸桿菌中,並且然後接種在相應抗生素上。如果存在質粒的DNA切割,則申請人觀察不到有活力的群落。
在進一步細節中,如下針對DNA靶進行測定。在此測定中使用兩種大腸桿菌菌株。一種攜帶編碼來自細菌菌株的內源性效應蛋白座位的質粒。另一種菌株攜帶空質粒(例如pACYC184,對照菌株)。將所有可能的7或8bp PAM序列呈遞在抗生素抗性質粒(具有胺苄青黴素抗性基因的pUC19)上。將PAM定位成靠近原型間隔區1的序列(內源性效應蛋白座位中的第一間隔區的DNA靶)。選殖了兩個PAM文庫。一個具有原型間隔區的8個隨機bp 5'(例如總的65536個不同PAM序列=複雜度)。另一個文庫具有原型間隔區的7個隨機bp 3'(例如總複雜度係16384個不同的PAM)。將兩個文庫選殖成具有平均500個質粒/可能的PAM。用5'PAM和
3'PAM文庫在單獨的轉化中轉化測試菌株和對照菌株並且將轉化的細胞分別接種在胺苄青黴素板上。使用質粒的識別和隨後的切割/干擾使得細胞對胺苄青黴素易感並且阻止了生長。轉化後大約12h,收穫由測試菌株和對照菌株形成的所有群落並且分離出質粒DNA。使用質粒DNA作為用於PCR擴增和隨後的深度定序的模板。未轉化的(untransfomed)文庫中的所有PAM的表現度顯示轉化細胞中的PAM的預期表現度。對照菌株中發現的所有PAM的表現度顯示真實的表現度。測試菌株中的所有PAM的表現度顯示哪個PAM未被酶識別並且與對照菌株的比較允許提取出缺失的PAM的序列。
在CRISPR-Cas9系統的一些實施方式中,當進行最佳比對時,tracrRNA序列與crRNA序列之間的互補程度係沿兩者中較短者的長度。如在此所述的,在本發明的實施方式中,tracrRNA係不需要的。在先前所述的CRISPR-Cas系統(例如CRISPR-Cas9系統)的一些實施方式中,嵌合合成的指導RNA(sgRNA)設計可以在crRNA與tracrRNA之間摻入至少12bp的雙股體結構,然而在在此所述的Cpf1 CRISPR系統中此類嵌合RNA(chi-RNA)係不可能的,因為該系統不利用tracrRNA。
為了最小化毒性和脫靶效應,重要的是控制所遞送的核酸靶向指導RNA的濃度。核酸靶向指導RNA的最佳濃度可以藉由以下方式來確定:測試不同濃度的細胞模型或非人類真核動物模型並且使用深度定序分析潛在的脫靶基因組座位處的修飾程度。得到最高的中靶(on-target)修飾水平同時使脫靶修飾水平最小化
的濃度應被選擇用於體內遞送。核酸靶向系統有利地是來源於V型/VI型CRISPR系統。在一些實施方式中,核酸靶向系統的一個或多個元件係來源於包含內源性RNA靶向系統的特定生物體。在本發明的較佳的實施方式中,RNA靶向系統係V型/VI型CRISPR系統。在特定實施方式中,V型/VI型RNA靶向Cas酶係Cpf1/C2c1/C2c2。Cas蛋白的非限制性實例包括Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也稱為Csn1和Csx12)、Cas10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4,其同源物,或其修飾版本。在實施方式中,諸如在此提及的Cpf1/C2c1/C2c2的V型/VI型蛋白還涵蓋諸如Cpf1/C2c1/C2c2的V型/VI型蛋白的同源物或異種同源物。術語“異種同源物(orthologue)”(在此也稱之為“異種同源物(ortholog)”)和“同源物(homologue)”(在此也稱之為“同源物(homolog)”)係本領域熟知的。作為進一步指導,如在此所用的蛋白質的“同源物”係屬於同一種類的蛋白質,該蛋白質執行與作為其同源物的蛋白質相同或類似的功能。同源蛋白可以是但不需要是結構相關的,或僅是部分結構相關的。如在此所用的蛋白質的“異種同源物”係屬於不同種類的蛋白質,該蛋白質執行與作為其異種同源物的蛋白質相同或類似的功能。直向同源蛋白可以是但不需要是結構相關的,或僅是部分結構相關的。同源物和異種同源物可以是藉由同源模擬(例如,參見格里爾(Greer),科學(Science)第228卷(1985)1055,和布倫德爾(Blundell)等人
歐洲生物化學雜誌(Eur J Biochem)第172卷(1988),513)或“結構BLAST”(戴伊.F(Dey F),克利夫.張.Q(Cliff Zhang Q),彼德雷.D(Petrey D),霍尼格.B(Honig B),針對“結構BLAST”:使用結構關係推斷功能(Toward a "structural BLAST":using structural relationships to infer function),蛋白質科學(Protein Sci.),2013年4月;22(4):359-66.doi:10.1002/pro.2225。)來鑒定。還參見CRISPR-Cas座位領域中的什馬科夫(Shmakov)等人(2015)的申請。同源蛋白可以是但不需要是結構相關的,或僅是部分結構相關的。在特定實施方式中,如在此提及的Cpf1的同源物或異種同源物與Cpf1具有至少80%、更較佳的是至少85%、甚至更較佳的是至少90%例如像至少95%的序列同源性或一致性。在另外的實施方式中,如在此提及的Cpf1的同源物或異種同源物與野生型Cpf1具有至少80%、更較佳的是至少85%、甚至更較佳的是至少90%例如像至少95%的序列一致性。在Cpf1具有一個或更多個突變的情況下(突變型),如在此提及的所述Cpf1的同源物或異種同源物與突變型Cpf1具有至少80%、更較佳的是至少85%、甚至更較佳的是至少90%例如像至少95%的序列一致性。
在一個實施方式中,V型Cas蛋白可以是包括但不限於下項的屬的生物體的異種同源物:胺基酸球菌屬某種、毛螺旋菌科細菌或牛莫拉氏菌;在特定實施方式中,V型Cas蛋白可以是包括但不限於下項的物種的生物體的異種同源物:胺基酸球菌屬某種BV3L6;毛螺旋菌科細菌ND2006(LbCpf1)或牛莫拉氏菌237。在特定實施方式中,如在此提及的Cpf1的同源物或異種同源物與在此揭露的Cpf1序列中的一種或多種具有至少80%、更較佳的是
至少85%、甚至更較佳的是至少90%例如像至少95%的序列同源性或一致性。在另外的實施方式中,如在此提及的Cpf的同源物或異種同源物與野生型FnCpf1、AsCpf1或LbCpf1具有至少80%、更較佳的是至少85%、甚至更較佳的是至少90%例如像至少95%的序列一致性。
在特定實施方式中,本發明的Cpf1蛋白與FnCpf1、AsCpf1或LbCpf1具有至少60%、更具體地至少70諸如至少80%、更較佳的是至少85%、甚至更較佳的是至少90%例如像至少95%的序列同源性或一致性。在另外的實施方式中,如在此提及的Cpf1蛋白與野生型AsCpf1或LbCpf1具有至少60%,諸如至少70%、更具體地至少80%、更較佳的是至少85%、甚至更較佳的是至少90%例如像至少95%的序列一致性。在特定實施方式中,本發明的Cpf1蛋白與FnCpf1具有小於60%的序列一致性。技術人員將理解這包括Cpf1蛋白的截短形式,由此定序一致性係在截短形式的長度上測定。
鑒定CRISPR-Cas系統酶的異種同源物的一些方法可以包括鑒定感興趣的基因組中的tracr序列。鑒定tracr序列可以與以下步驟相關:搜索資料庫中的同向重複序列或tracr配對序列以鑒定包含CRISPR酶的CRISPR區。在正義方向和反義方向上搜索側接CRISPR酶的CRISPR區中的同源序列。尋找轉錄終止子和二級結構。鑒定不是同向重複序列或tracr配對序列但與同向重複序列或
tracr配對序列具有超過50%的一致性的任何序列以作為潛在的tracr序列。獲取潛在的tracr序列並且分析與其相關聯的轉錄終止子序列。在此系統中,RNA定序數據揭示藉由計算鑒定的潛在tracrRNA僅有微弱表現,這表明了tracrRNA可能不是為本發明系統的功能所需的可能性。在對FnCpf1座位進一步評價並加上體外切割結果之後,申請人推斷藉由Cpf1效應蛋白複合物進行靶DNA切割不需要tracrRNA。申請人確定僅包含Cpf1效應蛋白和crRNA(包含同向重複序列和指導序列的指導RNA)的Cpf1效應蛋白複合物足以切割靶DNA。
應瞭解,在此所述的任一功能可以被工程化到來自其他異種同源物的CRISPR酶中,包括包含來自多個異種同源物的片段的嵌合酶。在此其他地方描述了此類異種同源物的實例。因此,嵌合酶可以包含包括但不限於下項的屬的生物體的CRISPR酶異種同源物的片段:棒狀桿菌屬、薩特氏菌屬(Sutterella)、軍團桿菌屬、密螺旋體屬、產線菌屬(Filifactor)、真細菌屬、鏈球菌屬、乳酸桿菌屬、支原體屬、擬桿菌屬、黃沃拉菌屬(Flaviivola)、黃桿菌屬、螺旋體屬、固氮螺菌屬、葡糖醋桿菌屬、奈瑟氏菌屬、羅氏菌屬、細小棒菌屬、葡萄球菌屬、硝化裂化菌屬、支原體屬以及彎曲桿菌屬。嵌合酶可以包含第一片段和第二片段並且片段可以是屬於在此所提到的屬或在此所提到的物種的生物體的CRISPR酶異種同源物的;有利的是,片段來自不同物種的CRISPR酶異種同源物。
在實施方式中,V型/VI型RNA靶向效應蛋白,具體地
是如在此提及的Cpf1/C2c1/C2c2還涵蓋Cpf1/C2c1/C2c2的功能變體或其同源物或其異種同源物。如在此所用的蛋白質的“功能變體”係指此蛋白質的變體,該變體保留該蛋白的至少部分活性。功能變體可以包括突變體(其可以是插入、缺失或置換突變體),包括同質多形體等。還包括在功能變體內的是此蛋白質與別的,通常是不相關的核酸、蛋白質、多肽或肽的融合產物。功能變體可以是天然存在的或可以是人造的。有利的實施方式可以包括工程化的或非天然存在的V型/VI型RNA靶向效應蛋白,例如Cpf1/C2c1/C2c2或其異種同源物或同源物。
在一個實施方式中,編碼V型/VI型RNA靶向效應蛋白,具體地是Cpf1/C2c1/C2c2或其異種同源物或同源物的一個或多個核酸分子可以被密碼子優化為在真核細胞中表現。真核生物可以是在此所討論的。一個或多個核酸分子可以是工程化的或非天然存在的。
在一個實施方式中,V型/VI型RNA靶向效應蛋白,具體地是Cpf1/C2c1/C2c2或其異種同源物或同源物可以包含一個或多個突變(並且因此編碼所述效應蛋白的一個或多個核酸分子可以具有一個或多個突變)。突變可以是人工引入的突變並且可以包括但不限於催化結構域中的一個或多個突變。參照Cas9酶,催化結構域的實例可以包括但不限於RuvC I、RuvC II、RuvC III以及HNH結構域。
在一個實施方式中,V型/VI型蛋白,諸如Cpf1/C2c1/C2c2或其異種同源物或同源物可以用作融合至或可操
作地連接至功能結構域的通用的核酸結合蛋白。示例性功能結構域可以包括但不限於,翻譯起始區、翻譯活化物、翻譯阻遏物、核酸酶(具體地是核糖核酸酶)、剪接體、珠粒、光誘導型/控制型的結構域或化學誘導型/控制型的結構域。
在一些實施方式中,未修飾的核酸靶向效應蛋白可以具有切割活性。在一些實施方式中,RNA靶向效應蛋白可以引導靶序列或靠近靶序列的位置處的,諸如靶序列內和/或靶序列補體內或與靶序列相關聯的序列處的一條或兩條核酸(DNA或RNA)股的切割。在一些實施方式中,核酸靶向效應蛋白可以引導從靶序列的第一個或最後一個核苷酸開始的約1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500或更多個鹼基對內的一條或兩條DNA或RNA股的切割。在一些實施方式中,切割可以是交錯的,即產生黏性末端。在一些實施方式中,切割係交錯切割的,產生了5'突出端。在一些實施方式中,切割係交錯切割的,產生了具有1至5個核苷酸,較佳的是4或5個核苷酸的5'突出端。在一些實施方式中,切割位點遠離PAM,例如切割發生在非靶股上的第18核苷酸後面和靶股上的第23核苷酸後面(圖97A)。在一些實施方式中,切割位點出現在非靶股上的第18核苷酸(從PAM開始計數)後面和靶股上的第23核苷酸(從PAM開始計數)後面(圖97A)。在一些實施方式中,載體編碼可以相對於相應野生型酶發生突變的核酸靶向效應蛋白,使得突變型核酸靶向效應蛋白缺乏切割含有靶序列的靶多核苷酸的一條或兩條DNA或RNA股的能力。作為另一個實例,Cas蛋白的兩個或更多個催化結構域(例如Cas9蛋白的RuvC I、RuvC II和RuvC III或HNH結構域)可以突變成產
生實質性缺乏所有DNA切割活性的突變型Cas蛋白。如在此所述,Cpf1效應蛋白的相應催化結構域也可以突變成產生缺乏所有DNA切割活性或具有實質性降低的DNA切割活性的突變型Cpf1效應蛋白。在一些實施方式中,當突變型酶的RNA切割活性不超過該酶的非突變形式的核酸切割活性的約25%、10%、5%、1%、0.1%、0.01%或更少時,核酸靶向效應蛋白可以被認為是實質性缺乏所有RNA切割活性的;一個實例可以是當突變形式的核酸切割活性係零或與非突變形式相比是可忽視的時候。效應蛋白可以參照與具有來自V型/VI型CRISPR系統的多個核酸酶結構域的最大核酸酶享有同源性的酶的一般類別來鑒定。最較佳的是,效應蛋白係V型/VI型蛋白諸如Cpf1/C2c1/C2c2。在另外的實施方式中,效應蛋白係V型蛋白。關於衍生,申請人表示,就與野生型酶具有高度的序列同源性的意思而言,衍生的酶在很大程度上是基於野生型酶的,但是該衍生的酶係已經以本領域已知或在此所述的一些方式發生突變的(修飾的)。
同樣,應瞭解,除非另外表明,否則術語Cas和CRISPR酶和CRISPR蛋白和Cas蛋白通常是可以互換使用的並且在所有在此參考方面處以類推方式指進一步描述在本發明中的新型CRISPR效應蛋白,諸如藉由具體參考Cas9。如以上提到的,在此使用的許多殘基編號係指來自V型/VI型CRISPR座位的效應蛋白。然而,應瞭解本發明包括來自其他微生物物種的更多效應蛋白。在某些實施方式中,效應蛋白可以是組成型存在的或誘導型存在的或條件型存在的或被給予或遞送的。效應蛋白優化可以用於增強功能或用於開發新功能,其可產生嵌合效應蛋白。並且如在此
所述的效應蛋白可以被修飾成用作通用的核酸結合蛋白。
典型地,在核酸靶向系統的情況下,核酸靶向複合物(包含雜交至靶序列並與一種或多種核酸靶向效應蛋白複合的指導RNA)的形成產生靶序列中或靶序列附近(例如,從靶序列開始的1、2、3、4、5、6、7、8、9、10、20、50、或更多個鹼基對內)的一條或兩條DNA或RNA股的切割。如在此所用的術語“與感興趣的靶座位相關聯的一種或多種序列”係指在靶序列的附近(例如從靶序列開始的1、2、3、4、5、6、7、8、9、10、20、50、或更多個鹼基對內,其中靶序列包含在感興趣的靶座位內)的序列。
在本發明中,密碼子優化序列的一個實例係被優化為在真核生物,例如人類(即被優化為在人類中表現),或其他真核生物,如在此所討論的動物或哺乳動物中表現的序列;例如參見作為密碼子優化序列的一個實例的WO 2014/093622(PCT/US2013/074667)中的SaCas9人類密碼子優化序列(根據本領域知識和本揭露,特別是關於效應蛋白(例如Cpf1)的密碼子優化編碼的一個或多個核酸分子係在技術人員的知識範圍內的)。雖然這係較佳的,但是應瞭解,其他實例係可能的並且除人類之外的宿主物種的密碼子優化,或特定器官的密碼子優化係已知的。在一些實施方式中,編碼DNA/RNA靶向Cas蛋白的酶編碼序列被密碼子優化為在特定細胞諸如真核細胞中表現。真核細胞可以是特定生物體具有的或來源於該特定生物體的那些細胞,該特定生物體係諸如植物或哺乳動物,包括但不限於人類或非人類真核生物,或如在此討論的動物或哺乳動物,例如小鼠、大鼠、兔、狗、
家畜或非人類哺乳動物或靈長類動物。在一些實施方式中,對於人類或動物而言很可能使得他們(它們)受苦而沒有任何實質性醫學益處的用於修飾人類的種系遺傳一致性的方法和/或用於修飾動物的遺傳一致性的方法,以及還有作為這樣的方法的結果的動物,可以被排除在外。總的來說,密碼子優化係指在維持天然胺基酸序列的情況下藉由以下方式修飾核酸序列來增強在感興趣的宿主細胞中的表現的方法:藉由用該宿主細胞的基因中更頻繁使用或最頻繁使用的密碼子替換天然序列的至少一個密碼子(例如,約或超過約1、2、3、4、5、10、15、20、25、50或更多個密碼子)。不同的物種對於具有特定胺基酸的某些密碼子表現出特定偏倚性。密碼子偏倚性(生物體之間密碼子使用的差異)常常與信使RNA(mRNA)的翻譯效率相關,而該翻譯效率則被認為依賴於(除其他之外)被翻譯的密碼子的特性和特定轉移RNA(tRNA)分子的可獲得性。細胞中選擇的tRNA的超優勢度通常是肽合成中最頻繁使用的密碼子的反映。因此,基因可以被定制為基於密碼子優化在給定生物體中最佳基因表現。密碼子使用表係易於獲得的,例如在從www.kazusa.orjp/codon/獲得的“密碼子使用資料庫”中並且該等表可以藉由多種方式來調整適用。參見,中村,Y.(Nakamura,Y.)等人,“從國際DNA序列資料庫中製表的密碼子使用:2000年的狀態(Codon usage tabulated from the international DNA sequence databases:status for the year 2000)”核酸研究28:292(2000)。用於密碼子優化特定序列以在特定宿主細胞中表現的電腦演算法也是可得的,諸如基因製造(Gene Forge)(賓夕法尼亞州雅各斯的Aptagen公司(Aptagen;Jacobus,PA))也是可得
的。在一些實施方式中,編碼DNA/RNA靶向Cas蛋白的序列中的一個或多個密碼子(例如1、2、3、4、5、10、15、20、25、50個、或更多個、或所有密碼子)對應於特定胺基酸的最頻繁使用的密碼子。對於酵母的密碼子使用,參考從http://www.yeastgenome.org/community/codon_usage.shtml獲得的線上酵母基因組資料庫或酵母的密碼子選擇(Codon selection in yeast),本特澤恩(Bennetzen)和哈爾(Hall),生物化學雜誌(J Biol Chem.),1982年3月25日;257(6):3026-31。對於植物(包括藻類)的密碼子使用,參考高等植物、綠藻和藍藻細菌的密碼子使用(Codon usage in higher plants,green algae,and cyanobacteria),坎貝爾(Campbell)和哥瑞(Gowri),植物生理學(Plant Physiol.),1990年1月;92(1):1-11;以及植物基因的密碼子使用(Codon usage in plant genes),瑪瑞(Murray)等人,核酸研究,1989年1月25日;17(2):477-98;或不同植物和藻類譜系中的葉綠體基因和藍色小體基因的密碼子偏倚性的選擇(Selection on the codon bias of chloroplast and cyanelle genes in different plant and algal lineages),莫爾頓.BR(Morton BR),分子進化雜誌(J Mol Evol),1998年4月;46(4):449-59。
在一些實施方式中,載體編碼包含一個或多個核酸定位序列(NLS)(諸如約或超過約1、2、3、4、5、6、7、8、9、10個或更多個NLS)的核酸靶向效應蛋白,諸如V型/VI型RNA靶向效應蛋白,具體地是Cpf1/C2c1/C2c2或其異種同源物或同源物。在一些實施方式中,RNA靶向效應蛋白包含處於或靠近胺基末端的約或超過約1、2、3、4、5、6、7、8、9、10個、或更多個NLS,
處於或靠近羧基末端的約或超過約1、2、3、4、5、6、7、8、9、10個、或更多個NLS,或該等的組合(例如在胺基末端處的零個或至少一個或多個NLS以及在羧基末端處的零個或至少一個或多個NLS)。當存在超過一個的NLS時,每一個可以被選擇為不依賴於其他NLS,使得單一NLS可以存在於超過一個的拷貝中和/或與一個或多個其他NLS相組合存在於一個或多個拷貝中。在一些實施方式中,當NLS的最近的胺基酸係在從N末端或C末端沿著該多肽鏈的約1、2、3、4、5、10、15、20、25、30、40、50個、或更多個胺基酸之內時,NLS可以被認為靠近該N末端或C末端。NLS的非限制性實例包括來源於以下項的NLS序列:SV40病毒大T抗原的NLS,其具有胺基酸序列PKKKRKV(SEQ ID NO:2);來自核質蛋白的NLS(例如,具有序列KRPAATKKAGQAKKKK(SEQ ID NO:3)的核質蛋白二分NLS);c-myc NLS,其具有胺基酸序列PAAKRVKLD(SEQ ID NO:4)或RQRRNELKRSP(SEQ ID NO:5);hRNPA1 M9 NLS,其具有序列NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(SEQ ID NO:6);來自輸入蛋白-α的IBB結構域的序列RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(SEQ ID NO:7);肌瘤T蛋白的序列VSRKRPRP(SEQ ID NO:8)和PPKKARED(SEQ ID NO:9);人類p53的序列PQPKKKPL(SEQ ID NO:10);小鼠c-abl IV的序列SALIKKKKKMAP(SEQ ID NO:11);流感病毒NS1的序列DRLRR(SEQ ID NO:12)和PKQKKRK(SEQ ID NO:13);肝炎病毒δ抗原的序列RKLKKKIKKL(SEQ ID NO:14);小鼠Mx1蛋白的序列REKKKFLKRR(SEQ ID NO:15);
人類聚(ADP-核糖)聚合酶的序列KRKGDEVDGVDEVAKKKSKK(SEQ ID NO:16);以及類固醇激素受體(人類)糖皮質激素的序列RKCLQAGMNLEARKTKK(SEQ ID NO:17)。總的來說,一個或多個NLS具有足以驅動DNA/RNA靶向Cas蛋白在真核細胞的核中以可檢測的量積累的強度。總的來說,核定位活性的強度可以來源於核酸靶向效應蛋白中的NLS數目、使用的一個或多個特定NLS、或該等因素的組合。可以藉由任何合適的技術進行核中積累的檢測。例如,可檢測標記可以融合至核酸靶向蛋白,使得細胞內的位置可以被視覺化,諸如與檢測核的位置的手段(例如,對核具有特異性的染料,諸如DAPI)相組合。還可以將細胞核從細胞中分離出來,然後可以藉由任何適合的用於檢測蛋白質的方法分析其內容物,諸如免疫組織化學、西方墨點或酶活性測定。還可以藉由以下方式間接地確定核中的積累:諸如藉由測定核酸靶向複合物形成的作用(例如,測定在靶序列處的DNA或RNA切割或突變、或測定由於DNA或RNA靶向複合物形成和/或DNA或RNA靶向Cas蛋白活性的影響而改變的基因表現活性),與沒有暴露於核酸靶向Cas蛋白或核酸靶向複合物、或暴露於缺乏一個或多個NLS的核酸靶向Cas蛋白的對照進行比較。在在此所述的Cpf1效應蛋白複合物和系統的較佳的實施方式中,密碼子優化的Cpf1效應蛋白包含附接至該蛋白質的C末端的NLS。在某些實施方式中,其他定位標籤可以融合至Cas蛋白,諸如但不限於將Cas定位至細胞中的特定位點,該等特定位點係諸如細胞器,諸如線粒體、質粒、葉綠體、囊泡、高爾基體(核的或細胞的)、細胞膜、核糖體、小核體(nucleoluse)、ER、細胞骨架、液泡、中心體、核小體、顆
粒、中心粒等。
在一些實施方式中,驅動核酸靶向系統的一種或多種元件表現的一種或多種載體被引入到宿主細胞中,以使得該核酸靶向系統的該等元件的表現能引導核酸靶向複合物在一個或多個靶位點處形成。例如,核酸靶向效應酶和核酸靶向指導RNA可以各自可操作地連接至單獨載體上的單獨調節元件。核酸靶向系統的一種或多種RNA可以被遞送至轉基因核酸靶向效應蛋白動物或哺乳動物,例如組成型地或誘導型地或條件型地表現核酸靶向效應蛋白的動物或哺乳動物;或以其他方式表現核酸靶向效應蛋白或具有含有核酸靶向效應蛋白的細胞的動物或哺乳動物,諸如藉由在先向該等動物或哺乳動物給予編碼或體內表現核酸靶向效應蛋白的一種或多種載體的方式。可替代地,從相同或不同調節元件表現的該等元件的兩種或更多種可以組合在單一載體中,其中一種或多種另外的載體提供核酸靶向系統在第一載體中不包含的任何組分。組合於單一載體中的核酸靶向系統元件可以佈置為任何適合的取向,諸如一個元件位於相對於第二元件的5'(“上游”)或相對於該第二元件的3'(“下游”)。一個元件的編碼序列可以位於第二元件的編碼序列的相同股或相反股上,並且取向為相同或相反方向。在一些實施方式中,單一啟動子驅動編碼核酸靶向效應蛋白的轉錄物和嵌入一種或多種內含子序列之內(例如,各自在不同內含子中、兩個或更多個在至少一個內含子中,或所有在單一內含子中)的核酸靶向指導RNA的表現。在一些實施方式中,核酸靶向效應蛋白和核酸靶向指導RNA可以可操作地連接至同一個啟動子並且從該同一啟動子表現。用於表現核酸靶向系統的一
個或多個元件的遞送媒介物、載體、粒子、奈米粒子、配製物以及其組分如前述文獻諸如WO 2014/093622(PCT/US2013/074667)中所使用的。在一些實施方式中,載體包含一個或多個插入位點,諸如限制性內切核酸酶識別序列(也稱之為“選殖位點”)。在一些實施方式中,一個或多個插入位點(例如,約或超過約1、2、3、4、5、6、7、8、9、10個、或更多個插入位點)位於一種或多種載體的一個或多個序列元件的上游和/或下游。當使用多個不同的指導序列時,可以使用單一表現構建體來使核酸靶向活性靶向細胞內的多個不同的相應靶序列。例如,單一載體可以包含約或超過約1、2、3、4、5、6、7、8、9、10、15、20個、或更多個指導序列。在一些實施方式中,可以提供約或超過約1、2、3、4、5、6、7、8、9、10個、或更多個含有此指導序列的載體,並且視情況將其遞送至細胞中。在一些實施方式中,載體包含可操作地連接至編碼核酸靶向效應蛋白的酶編碼序列的調節元件。可以單獨地遞送核酸靶向效應蛋白或一個或多個核酸靶向指導RNA;並且有利的是該等中的至少一者經由粒子複合物遞送。核酸靶向效應蛋白mRNA可以在核酸靶向指導RNA在給出時間以待核酸靶向效應蛋白表現之前遞送。核酸靶向效應蛋白mRNA可以在給予核酸靶向指導RNA之前1-12小時(較佳的是約2-6小時)給予。可替代地,核酸靶向效應蛋白mRNA和核酸靶向指導RNA可以一起給予。有利地,指導RNA的第二加強劑量可以在初始給予核酸靶向效應蛋白mRNA+指導RNA之後1-12小時(較佳的是約2-6小時)給予。為了實現最有效的基因組修飾水平,核酸靶向效應蛋白mRNA和/或指導RNA的附加給予可能是有用的。
在一個方面中,本發明提供了用於使用核酸靶向系統的一個或多個元件的方法。本發明的核酸靶向複合物提供了一種用於修飾靶DNA或RNA(單股或雙股、直鏈或超螺旋的)的有效手段。本發明的核酸靶向複合物具有多種多樣的效用,包括修飾(例如,缺失、插入、易位、失活、啟動)許多細胞類型中的靶DNA或RNA。這樣,本發明的核酸靶向複合物在例如基因治療、藥物篩選、疾病診斷以及預後方面具有廣泛的應用。示例性核酸靶向複合物包含與雜交至感興趣的靶座位內的靶序列的指導RNA複合的DNA或RNA靶向效應蛋白。
在一個實施方式中,本發明提供了一種切割靶RNA之方法。該方法可以包括使用結合靶RNA的核酸靶向複合物修飾靶RNA並且實施所述靶RNA的切割。在一實施方式中,本發明的核酸靶向複合物在被引入到細胞中時可以產生RNA序列的斷裂(例如單股或雙股斷裂)。例如,該方法可以用於切割細胞中的疾病相關RNA。例如,可以將包含有待整合的側接上游序列和下游序列的序列的外源性RNA模板引入到細胞中。上游序列和下游序列與RNA中整合位點的任一側享有序列相似性。當希望時,供體RNA可以是mRNA。外源性RNA模板包含有待整合的序列(例如,突變型RNA)。供整合的序列可以是對細胞而言內源或外源的序列。有待整合的序列的實例包括編碼蛋白質的RNA或非編碼RNA(例如,微小RNA)。因此,供整合的序列可以可操作地連接至一種或多種適當的控制序列。可替代地,有待整合的序列可以提供調節功能。外源性RNA模板中的上游序列和下游序列被選擇為促進感興趣的RNA序列與供體RNA之間的重組。上游序列係與供整合的靶向位
點的上游的RNA序列享有序列相似性的RNA序列。類似地,下游序列係與整合的靶向位點的下游的RNA序列享有序列相似性的RNA序列。外源性RNA模板中的上游序列和下游序列與靶向的RNA序列可以具有75%、80%、85%、90%、95%或100%序列一致性。較佳的是,外源性RNA模板中的上游序列和下游序列與靶向的RNA序列具有約95%、96%、97%、98%、99%或100%序列一致性。在一些方法中,外源性RNA模板中的上游序列和下游序列與靶向的RNA序列具有約99%或100%序列一致性。上游序列或下游序列可以包含從約20bp至約2500bp,例如約50、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400或2500bp。在一些方法中,示例性上游序列或下游序列具有約200bp至約2000bp、約600bp至約1000bp,或更具體地約700bp至約1000bp。在一些方法中,外源性RNA模板可以進一步包含標記物。此標記物可以使得容易地篩選靶向的整合。適合的標記物的實例包括限制性位點、螢光蛋白或選擇標記物。可以使用重組技術構建本發明的外源性RNA模板(例如參見,薩姆布魯克(Sambrook)等人,2001和奧蘇貝爾(Ausubel)等人,1996)。在用於藉由整合外源性RNA模板來修飾靶RNA的方法中,藉由核酸靶向複合物將斷裂(例如在雙股或單股DNA或RNA中的雙股或單股斷裂)引入到DNA或RNA序列中,經由與外源性RNA模板的同源重組而修復該斷裂,這樣使得將該模板整合到RNA靶中。雙股斷裂的存在促進模板的整合。在其他實施方式中,本發明提供了一種修飾RNA在真核細胞中的表現的方法。該方法包括藉由使用結合DNA或
RNA(例如,mRNA或前mRNA)的核酸靶向複合物增加或減少靶多核苷酸的表現。在一些方法中,可以使靶RNA失活以實施細胞中的表現的修飾。例如,在RNA靶向複合物與細胞中的靶序列結合後,靶RNA失活,這樣使得該序列不被翻譯,該編碼蛋白不被產生,或者該序列不會像野生型序列一樣起作用。例如,可以使蛋白質或微小RNA編碼序列失活,這樣使得該蛋白質或微小RNA或前微小RNA轉錄物不被產生。RNA靶向複合物的靶RNA可以是對真核細胞而言內源或外源的任何RNA。例如,靶RNA可以是駐留在真核細胞核內的RNA。靶RNA可以是編碼基因產物(例如,蛋白質)的序列(mRNA或前mRNA)或非編碼序列(例如,ncRNA、lncRNA、tRNA或rRNA)。靶mRNA的實例包括與傳訊生物化學途徑相關聯的序列,例如傳訊生物化學途徑相關的RNA。靶RNA的實例包括疾病相關的RNA。“疾病相關”RNA係指與非疾病對照的組織或細胞相比,在來源於疾病影響的組織的細胞中產生異常水平或異常形式的翻譯產物的任何RNA。它可以是由以異常高的水平表現的基因轉錄的RNA;它可以是由以異常低的水平表現的基因轉錄的RNA,其中改變的表現與疾病的發生和/或進展相關。疾病相關RNA還是指由下述基因轉錄的RNA:該基因具有一個或多個突變或直接負責或與一個或多個負責疾病的病因學的基因連鎖不平衡的遺傳變異的基因。翻譯的產物可以是已知或未知的,並且可以是處於正常或異常水平。RNA靶向複合物的靶RNA可以是對真核細胞而言內源或外源的任何RNA。例如,靶RNA可以是駐留在真核細胞核內的RNA。靶RNA可以是編碼基因產物(例如,蛋白質)的序列(mRNA或前mRNA)或非編碼序列(例如,ncRNA、
lncRNA、tRNA或rRNA)。
在一些實施方式中,該方法可以包括使得核酸靶向複合物結合靶DNA或RNA來實施所述靶DNA或RNA的切割,從而修飾該靶DNA或RNA,其中該核酸靶向複合物包含與雜交至所述靶DNA或RNA內的靶序列的指導RNA複合的核酸靶向效應蛋白。在一個方面中,本發明提供了一種修飾DNA或RNA在真核細胞中的表現之方法。在一些實施方式中,該方法包括使得核酸靶向複合物結合DNA或RNA,以使得所述結合導致所述DNA或RNA的表現增加或減少;其中該核酸靶向複合物包含與指導RNA複合的核酸靶向效應蛋白。類似的考慮因素和條件適用如上文針對修飾靶DNA或RNA的方法。實際上,該等取樣、培養和重新引入選擇跨本發明的多個方面而適用。在一個方面中,本發明提供了修飾真核細胞中的靶DNA或RNA的方法,該等方法可以是在體內、離體或在體外。在一些實施方式中,該方法包括從人類或非人類動物取樣細胞或細胞群體,並且修飾該細胞或該等細胞。培養可以發生在離體的任何階段。該細胞或該等細胞甚至可以被重新引入非人類動物或植物中。對於重新引入的細胞,特別較佳的是該等細胞係幹細胞。
實際上,在本發明的任何方面中,核酸靶向複合物可以包含與雜交至靶序列的指導RNA複合的核酸靶向效應蛋白。
本發明涉及用於控制涉及DNA或RNA序列靶向的基因表現的系統、方法以及組成物的工程化和優化,該等系統、方法以及組成物與核酸靶向系統及其組分相關。在有利的實施方式
中,效應酶係V型/VI型蛋白諸如Cpf1/C2c1/C2c2。本發明方法的一個優點係CRISPR系統最小化了或避免了脫靶結合及其產生的副作用。這係使用佈置為對靶DNA或RNA具有高度序列特異性的系統來實現的。
關於核酸靶向複合物或系統,較佳的是,crRNA序列具有一個或多個莖環或髮夾並且具有30個或更多個核苷酸的長度,40或更多個核苷酸的長度,或50個或更多個核苷酸的長度;crRNA序列的長度介於10個至30個核苷酸之間,核酸靶向效應蛋白係V型/VI型Cas酶。在某些實施方式中,crRNA序列的長度介於42個與44個核苷酸之間,並且核酸靶向Cas蛋白係土拉熱弗朗西絲菌新殺手亞種U112的Cpf1。在某些實施方式中,crRNA包含具有19個核苷酸的同向重複序列和具有介於23個與25個之間核苷酸的間隔區序列、基本上由或由該同向重複序列和該間隔區序列組成,並且核酸靶向Cas蛋白係土拉熱弗朗西絲菌新殺手亞種U112的Cpf1。
使用兩種不同的適配體(各自與不同的核酸靶向指導RNA締合)允許藉由不同的核酸靶向指導RNA來使用活化物-轉接蛋白融合物和阻遏物-轉接蛋白融合物,以啟動一種DNA或RNA的表現,同時阻遏另一種。它們可以與它們的不同指導RNA一起、或大體上一起以多重途徑給予。大量的這樣的修飾核酸靶向指導RNA(例如10或20或30個等)可以同時全部使用,而僅需要遞送一個(或至少最小數目的)效應蛋白分子,因為相對較小數目的效應蛋白分子可以與大量的修飾指導序列一起使用。轉接蛋白可以與一個或多個活化物或一個或多個阻遏物締合(較佳的是連接
或融合)。例如,轉接蛋白可以與第一活化物和第二活化物締合。第一活化物和第二活化物可以是相同的,但是它們較佳的是不同的活化物。可以使用三個或更多個或甚至四個或更多個活化物(或阻遏物),但是包裝尺寸可能限制大於5個不同功能結構域的數目。較佳的是使用接頭,藉由與轉接蛋白的直接融合來使用,其中兩個或更多個結構功能域與轉接蛋白締合。適合接頭可以包括GlySer接頭。
還設想的是作為整體的核酸靶向效應蛋白指導RNA複合物可以與兩個或更多個結構功能域締合。例如,可以存在與核酸靶向效應蛋白締合的兩個或更多個功能結構域,或者可以存在與指導RNA締合(經由一種或多種適轉接蛋白)的兩個或更多個功能結構域,或者可以存在與核酸靶向效應蛋白締合的一個或多個功能結構域和與指導RNA締合(經由一種或多種適轉接蛋白)的一個或多個功能結構域。
轉接蛋白與活化物或阻遏物之間的融合物可以包含接頭。例如,可以使用GlySer接頭GGGS(SEQ ID NO:18)。根據需要,它們可以3個((GGGGS)3(SEQ ID NO:19))或6個(SEQ ID NO:20)、9個(SEQ ID NO:21)或甚至12個(SEQ ID NO:22)或更多個的重複單元來使用以提供適合的長度。指導RNA與功能結構域(活化物或阻遏物)之間、核酸靶向Cas蛋白(Cas)與功能結構域(活化物或阻遏物)之間可以使用接頭。接頭用於工程化適當的“機械柔性”度。
本發明包括包含核酸靶向效應蛋白和指導RNA的核
酸靶向複合物,其中核酸靶向效應蛋白包含至少一個突變,使得核酸靶向效應蛋白具有不超過不具有該至少一個突變的核酸靶向效應蛋白的活性的5%的活性,和視情況至少一個或多個核定位序列;指導RNA包含能夠與細胞中的感興趣的RNA中的靶序列雜交的指導序列;並且其中:核酸靶向效應蛋白與兩個或更多個功能結構域締合;或者指導RNA的至少一個環係藉由插入結合一種或多種轉接蛋白的一種或多種不同的RNA序列來修飾的,並且其中該轉接蛋白與兩個或更多個功能結構域締合;或者核酸靶向Cas蛋白與一個或多個功能結構域締合並且指導RNA的至少一個環係藉由插入結合一種或多種轉接蛋白的一種或多種不同的RNA序列來修飾的,並且其中該轉接蛋白與一個或多個功能結構域締合。
在一個方面中,本發明提供了一種產生包含突變型疾病相關基因的模型真核細胞之方法。在一些實施方式中,疾病相關基因係與患病或發展病的風險的增加相關聯的任何基因。在一些實施方式中,該方法包括(a)將一種或多種載體引入到真核細胞中,其中一種或多種載體驅動以下項中的一個或多個的表現:Cpf1酶和包含連接至同向重複序列的指導序列的受保護的指導RNA;並且(b)使得CRISPR複合物結合靶多核苷酸以實施所述疾病相關基因內的靶多核苷酸的切割,其中CRISPR複合物包含與包含雜交至靶多核苷酸內的靶序列的序列的指導RNA複合的Cpf1酶,從而產生包含突變型疾病相關基因的模型真核細胞。在一些實施方式中,所述切割包括藉由所述Cpf1酶切割靶序列的位置處的一條或兩條股。在一些實施方式中,所述切割使得靶基因的轉錄減少。在一些實施方式中,該方法進一步包括使用外源性模板
多核苷酸藉由基於非同源末端連接(NHEJ)的基因插入機制修復所述切割的靶多核苷酸,其中所述修復產生包括所述靶多核苷酸的一個或多個核苷酸的插入、缺失或取代的突變。在一些實施方式中,所述突變使得來自包含靶序列的基因的蛋白質表現發生一個或多個胺基酸的變化。
在一方面中,本發明提供了如在此所討論之方法,其中該宿主係真核細胞。在一方面中,本發明提供了如在此所討論之方法,其中該宿主係哺乳動物細胞。在一方面中,本發明提供了如在此所討論之方法,其中該宿主係非人類真核細胞。在一方面中,本發明提供了如在此所討論之方法,其中該非人類真核細胞係非人類哺乳動物細胞。在一方面中,本發明提供了如在此所討論之方法,其中非人類哺乳動物細胞可以是包括但不限於,靈長類動物、牛、羊、豬類、犬、齧齒動物、兔科諸如猴、母牛、綿羊、豬、狗、兔、大鼠或小鼠的細胞。在一方面中,本發明提供了如在此所討論之方法,該細胞可以是非哺乳動物真核細胞諸如家禽鳥類(例如雞)、脊椎動物魚(例如鮭魚)或甲殼類動物(例如牡蠣、蛤、龍蝦、蝦)的細胞。在一方面中,本發明提供了如在此所討論之方法,該非人類真核細胞係植物細胞。植物細胞可以是單子葉植物或雙子葉植物具有的細胞或栽培植物或糧食植物諸如木薯、玉米、高粱、大豆、小麥、燕麥或稻具有的細胞。植物細胞還可以是藻類、樹或生產植物、果實或蔬菜(例如,樹類諸如柑橘樹,例如桔子樹、葡萄柚樹或檸檬樹;桃樹或油桃樹;蘋果樹或梨樹;堅果樹諸如杏樹或核桃樹或阿月渾子樹;茄屬植物;芸苔屬植物;萵苣屬植物;菠菜屬植物;辣椒屬植物;棉花、煙草、
蘆筍、胡蘿蔔、甘藍、青花菜、花椰菜、番茄、茄子、胡椒、萵苣、菠菜、草莓、藍莓、覆盆子、黑莓、葡萄、咖啡、可可等)具有的細胞。
在一個方面中,本發明提供了一種用於開發調控與疾病相關基因相關聯的細胞傳訊事件的生物活性劑之方法。在一些實施方式中,疾病相關基因係與患病或發展病的風險的增加相關聯的任何基因。在一些實施方式中,該方法包括(a)使測試化合物與任一種以上所述實施方式的模型細胞接觸;並且(b)檢測指示與所述疾病相關基因中的所述突變相關聯的細胞傳訊事件的減少或增加的讀出變化,從而開發調控與所述疾病相關基因相關聯的所述細胞傳訊事件的所述生物活性劑。
在一個方面中,本發明提供了一種藉由在一個或多個細胞的基因中引入一個或多個突變來選擇一個或多個細胞之方法,該方法包括:將一種或多種載體引入到一個或多個細胞中,其中一種或多種載體驅動以下項中的一個或多個的表現:Cpf1、連接至同向重複序列的指導序列,以及編輯模板;其中編輯模板包含廢除Cpf1切割的一個或多個突變;使得編輯模板與有待選擇的一個或多個細胞中的靶多核苷酸同源重組;使得Cpf1 CRISPR-Cas複合物結合靶多核苷酸以實施所述基因內的靶多核苷酸的切割,其中Cpf1 CRISPR-Cas複合物包含與(1)雜交至靶多核苷酸內的靶序列的指導序列,和(2)同向重複序列複合的Cpf1,其中Cpf1 CRISPR-Cas複合物與靶多核苷酸的結合誘導細胞死亡,從而使得其中已引入一個或多個突變的一個或多個細胞被選擇;此Cpf1包
括本發明的拆分的Cpf1。在本發明的另一個較佳的實施方式中,有待選擇的細胞可以是真核細胞。本發明的方面允許在不需要選擇標記物或可能包括反選擇系統的兩步法的情況下選擇特異性細胞。在特定實施方式中,模型真核細胞包含在模型真核生物體之內。
在一個方面中,本發明提供了一種包含同向重複序列的下游的指導序列的重組多核苷酸,其中在表現時,指導序列引導Cpf1 CRISPR-Cas複合物與真核細胞中存在的相應靶序列的序列特異性結合。在一些實施方式中,靶序列係真核細胞中存在的病毒序列。在一些實施方式中,靶序列係原癌基因或癌基因。
在一個方面中,本發明提供了一種包含以下項的載體系統或真核宿主細胞:(a)可操作地連接至同向重複序列的第一調節元件和用於將一種或多種指導序列(包括如在此所述的任一種修飾指導序列)插入DR序列的下游的一個或多個插入位點,其中在表現時,指導序列引導Cpf1 CRISPR-Cas複合物與真核細胞中的靶序列的序列特異性結合,其中Cpf1 CRISPR-Cas複合物包含與雜交至靶序列的指導序列(和視情況DR序列)複合的Cpf1(包括如在此所述的任一種修飾酶);和/或(b)可操作地連接至編碼包含核定位序列和/或NES的所述Cpf1酶的酶編碼序列的第二調節元件。在一些實施方式中,宿主細胞包含組分(a)和(b)。在一些實施方式中,組分(a)、組分(b)或組分(a)和(b)被穩定地整合到宿主真核細胞的基因組中。在一些實施方式中,組分(a)進
一步包含可操作地連接至第一調節元件的兩種或更多種指導序列,其中當表現時,兩種或更多種指導序列中的每種引導Cpf1 CRISPR-Cas複合物與真核細胞中的不同靶序列的序列特異性結合。在一些實施方式中,CRISPR酶包含具有足以驅動所述CRISPR酶在真核細胞的核中和/或之外以可檢測的量積累的強度的一個或多個核定位序列和/或核輸出序列或NES。在一些實施方式中,Cpf1酶來源於土拉熱弗朗西絲菌1、土拉熱弗朗西絲菌新殺手亞種、易北普雷沃菌、毛螺旋菌科細菌MC2017 1、解朊丁酸弧菌、佩萊格裡尼菌科細菌GW2011_GWA2_33_10、儉菌總門細菌GW2011_GWC2_44_17、密斯氏菌屬某種SCADC、胺基酸球菌屬某種BV3L6、毛螺旋菌MA2020、候選白蟻甲烷枝原體、挑剔真細菌、牛莫拉氏菌237、稻田鉤端螺旋體、毛螺旋菌科細菌ND2006、狗口腔卟啉單胞菌3、解糖腖普雷沃菌或獼猴卟啉單胞菌的Cpf1,包括如在此所述的任一種修飾酶,並且可以進一步包含Cpf1的改變或突變,並且可以是嵌合Cpf1。在一些實施方式中,CRISPR酶被密碼子優化為在真核細胞中表現。在一些實施方式中,CRISPR酶引導靶序列位置處的一條或兩條股的切割。在一較佳的實施方式中,股斷裂係交錯切割的,產生了5'突出端。在一些實施方式中,Cpf1缺乏DNA股切割活性(例如,與野生型酶或不具有降低核酸酶活性的突變或改變的酶相比的不超過5%的核酸酶活性)。在一些實施方式中,第一調節元件係聚合酶III啟動子。在一些實施方式中,第二調節元件係聚合酶II啟動子。在一些實施方式中,同向重複序列具有16個核苷酸的最小長度並且具有單一莖環。在另外的實施方式中,同向重複序列具有長於16個核苷酸,
較佳的是超過17個核苷酸的長度,並且具有超過一個的莖環或優化的二級結構。在一些實施方式中,指導序列的長度係至少16、17、18、19、20、25個核苷酸,或介於16個-30個、或介於16個-25個、或介於16個-20個核苷酸之間。
在一個方面中,本發明提供了一種包含在此所述的一種或多種組分的套組(kit)。在一些實施方式中,套組包括如在此所述的載體系統或宿主細胞和用於使用套組的說明書。
修飾的Cpf1酶
Cpf1核酸酶初級結構的計算分析揭示了三個不同的區(圖1)。第一係C末端RuvC樣結構域,其係僅功能表征的結構域。第二係N末端α-螺旋區並且第三係位於RuvC樣結構域與α-螺旋區之間的混合的α區和β區。
預測非結構化區的若干小片段在Cpf1初始結構之內。對於小的蛋白質序列的拆分和插入而言,不同的Cpf1異種同源物內的暴露於溶劑且不保守的非結構化區係較佳的側面(圖2和3)。另外,該等側面可以用於在Cpf1異種同源物之間產生嵌合蛋白。
基於以上資訊,可以產生突變體,該等突變體使得酶失活或將雙股核酸酶修飾為具有切口酶活性。在替代實施方式中,此資訊用於開發具有減小的脫靶效應的酶(在此其他地方所述的)。
在某些以上所述的Cpf1酶中,酶係藉由一個或多個殘基的突變來修飾的,該等殘基包括但不限於根據FnCpf1蛋白或任何相應的異種同源物的位置D917、E1006、E1028、D1227、D1255A、
N1257。在一個方面中,本發明提供了一種在此所討論的組成物,其中Cpf1酶係失活的酶,該酶包含選自下組的一個或多個突變,該組由下項組成:根據FnCpf1蛋白的D917A、E1006A、E1028A、D1227A、D1255A、N1257A、D917A、E1006A、E1028A、D1227A、D1255A和N1257A,或Cpf1異種同源物中的相應位置。在一個方面中,本發明提供了一種在此所討論的組成物,其中CRISPR酶包含根據FnCpf1蛋白的D917或E1006和D917或D917和D1255,或Cpf1異種同源物中的相應位置。
在某些以上所述的Cpf1酶中,酶係藉由一個或多個殘基(在RuvC結構域中)的突變來修飾的,該等殘基包括但不限於參照AsCpf1(胺基酸球菌屬某種BV3L6)的胺基酸位置編碼的位置R909、R912、R930、R947、K949、R951、R955、K965、K968、K1000、K1002、R1003、K1009、K1017、K1022、K1029、K1035、K1054、K1072、K1086、R1094、K1095、K1109、K1118、K1142、K1150、K1158、K1159、R1220、R1226、R1242和/或R1252。
在某些以上所述的非天然存在的CRISPR酶中,酶係藉由一個或多個殘基(在RAD50結構域中)的突變來修飾的,該等殘基包括但不限於參照AsCpf1(胺基酸球菌屬某種BV3L6)的胺基酸位置編碼的位置K324、K335、K337、R331、K369、K370、R386、R392、R393、K400、K404、K406、K408、K414、K429、K436、K438、K459、K460、K464、R670、K675、R681、K686、K689、R699、K705、R725、K729、K739、K748和/或K752。
在某些Cpf1酶中,酶係藉由一個或多個殘基的突變來
修飾的,該等殘基包括但不限於參照AsCpf1(胺基酸球菌屬某種BV3L6)的胺基酸位置編碼的位置R912、T923、R947、K949、R951、R955、K965、K968、K1000、R1003、K1009、K1017、K1022、K1029、K1072、K1086、R1103、R1226和/或R1252。
在某些實施方式中,Cpf1酶係藉由一個或多個殘基的突變來修飾的,該等殘基包括但不限於參照LbCpf1(毛螺旋菌科細菌ND2006)的胺基酸位置編碼的位置R833、R836、K847、K879、K881、R883、R887、K897、K900、K932、R935、K940、K948、K953、K960、K984、K1003、K1017、R1033、R1138、R1165和/或R1252。
在某些實施方式中,Cpf1酶係藉由一個或多個殘基的突變來修飾的,該等殘基包括但不限於參照AsCpf1(胺基酸球菌屬某種BV3L6)的胺基酸位置編碼的位置K15、R18、K26、Q34、R43、K48、K51、R56、R84、K85、K87、N93、R103、N104、T118、K123、K134、R176、K177、R192、K200、K226、K273、K275、T291、R301、K307、K369、S404、V409、K414、K436、K438、K468、D482、K516、R518、K524、K530、K532、K548、K559、K570、R574、K592、D596、K603、K607、K613、C647、R681、K686、H720、K739、K748、K757、T766、K780、R790、P791、K796、K809、K815、T816、K860、R862、R863、K868、K897、R909、R912、T923、R947、K949、R951、R955、K965、
K968、K1000、R1003、K1009、K1017、K1022、K1029、A1053、K1072、K1086、F1103、S1209、R1226、R1252、K1273、K1282和/或K1288。
在某些實施方式中,酶係藉由一個或多個殘基的突變來修飾的,該等殘基包括但不限於參照FnCpf1(新殺手法蘭西斯菌(Francisella novicida)U112)的胺基酸位置編碼的位置K15、R18、K26、R34、R43、K48、K51、K56、K87、K88、D90、K96、K106、K107、K120、Q125、K143、R186、K187、R202、K210、K235、K296、K298、K314、K320、K326、K397、K444、K449、E454、A483、E491、K527、K541、K581、R583、K589、K595、K597、K613、K624、K635、K639、K656、K660、K667、K671、K677、K719、K725、K730、K763、K782、K791、R800、K809、K823、R833、K834、K839、K852、K858、K859、K869、K871、R872、K877、K905、R918、R921、K932、I960、K962、R964、R968、K978、K981、K1013、R1016、K1021、K1029、K1034、K1041、K1065、K1084和/或K1098。
在某些實施方式中,酶係藉由一個或多個殘基的突變來修飾的,該等殘基包括但不限於參照LbCpf1(毛螺旋菌科細菌ND2006)的胺基酸位置編碼的位置K15、R18、K26、K34、R43、K48、K51、R56、K83、K84、R86、K92、R102、K103、K116、K121、R158、E159、R174、R182、K206、K251、K253、K269、K271、K278、P342、K380、R385、K390、K415、K421、K457、K471、A506、R508、K514、K520、K522、K538、Y548、K560、
K564、K580、K584、K591、K595、K601、K634、K640、R645、K679、K689、K707、T716、K725、R737、R747、R748、K753、K768、K774、K775、K785、K787、R788、Q793、K821、R833、R836、K847、K879、K881、R883、R887、K897、K900、K932、R935、K940、K948、K953、K960、K984、K1003、K1017、R1033、K1121、R1138、R1165、K1190、K1199和/或K1208。
在某些實施方式中,酶係藉由一個或多個殘基的突變來修飾的,該等殘基包括但不限於參照MbCpf1(牛莫拉氏菌237)的胺基酸位置編碼的位置K14、R17、R25、K33、M42、Q47、K50、D55、K85、N86、K88、K94、R104、K105、K118、K123、K131、R174、K175、R190、R198、I221、K267、Q269、K285、K291、K297、K357、K403、K409、K414、K448、K460、K501、K515、K550、R552、K558、K564、K566、K582、K593、K604、K608、K623、K627、K633、K637、E643、K780、Y787、K792、K830、Q846、K858、K867、K876、K890、R900、K901、M906、K921、K927、K928、K937、K939、R940、K945、Q975、R987、R990、K1001、R1034、I1036、R1038、R1042、K1052、K1055、K1087、R1090、K1095、N1103、K1108、K1115、K1139、K1158、R1172、K1188、K1276、R1293、A1319、K1340、K1349和/或K1356。
去活的/失活的Cpf1蛋白
在Cpf1蛋白具有核酸酶活性的情況下,Cpf1蛋白可以被修飾成具有減弱的核酸酶活性,例如,與野生型酶相比,具有至少70%、至少80%、至少90%、至少95%、至少97%或100%的核
酸酶失活;或者換句話說,Cpf1酶有利地具有非突變型或野生型Cpf1酶或CRISPR酶的核酸酶活性的約0%,或不超過非突變型或野生型Cpf1酶的核酸酶活性的約3%或約5%或約10%,該等酶例如是屬於非突變型或野生型新殺手法蘭西斯菌U112(FnCpf1)、胺基酸球菌屬某種BV3L6(AsCpf1)、毛螺旋菌科細菌ND2006(LbCpf1)或牛莫拉氏菌237(MbCpf1 Cpf1酶或CRISPR酶)的。有可能藉由將突變引入到Cpf1和其異種同源物的核酸酶結構域中實現此舉。
更具體地,失活的Cpf1酶包括在AsCpf1的胺基酸位置As908、As993、As1263或Cpf1異種同源物中的相應位置突變的酶。另外,失活的Cpf1酶包括在LbCpf1的胺基酸位置Lb832、925、947或1180或Cpf1異種同源物中的相應位置突變的酶。更具體地,失活的Cpf1酶包括包含AsCpf1的突變AsD908A、AsE993A、AsD1263A或Cpf1異種同源物中的相應突變中的一個或多個的酶。另外,失活的Cpf1酶包括包含LbCpf1的突變LbD832A、E925A、D947A或D1180A或Cpf1異種同源物中的相應突變中的一個或多個的酶。
失活的Cpf1 CRISPR酶可以具有締合的(例如經由融合蛋白)一個或多個功能結構域,包括例如來自包括下項,或基本上由或由下項組成的組的一個或多個結構域:修飾烷酶活性、去甲酶活性、轉錄啟動活性、轉錄阻遏活性、轉錄釋放因子活性、組蛋白修飾活性、RNA切割活性、DNA切割活性、核酸結合活性以及分子開關(例如光誘導型的)。較佳的結構域係Fok1、VP64、P65、HSF1、MyoD1。在提供的是Fok1的情況下,有利的是提供多
個Fok1功能結構域以實現功能二聚體並且gRNA被設計為提供適當間隔以用於功能性的使用(Fok1),如蔡(Tsai)等人自然生物技術,第32卷,第2期,2014年6月)中具體描述的。轉接蛋白可以利用已知的接頭來附接此類功能結構域。在一些情況下,有利的是另外提供至少一個NLS。在一些情況下,將NLS定位在N末端處係有利的。當包含超過一個的功能結構域時,功能結構域可以是相同或不同的。
總的來說,一個或多個功能結構域在失活的Cpf1酶上的定位係允許功能結構域的正確空間取向,從而以屬性化的功能效應影響靶的定位。例如,如果功能結構域係轉錄活化物(例如,VP64或p65),則轉錄活化物被定位成允許其影響靶的轉錄的空間取向。同樣地,轉錄阻遏物將有利地定位成影響靶的轉錄,並且核酸酶(例如Fok1)將有利地定位成切割或部分切割靶。此可以包括除CRISPR酶的N末端/C末端之外的位置。
去穩定化的Cpf1
在某些實施方式中,如在此所述的根據本發明的效應蛋白(CRISPR酶;Cpf1)與去穩定化的結構域(DD)締合或融合。在一些實施方式中,DD係ER50。在一些實施方式中,此DD的相應的穩定化配位基係4HT。這樣,在一些實施方式中,至少一個DD中的一個係ER50並且因此穩定化配位基係4HT或CMP8。在一些實施方式中,DD係DHFR50。在一些實施方式中,此DD的相應的穩定化配位基係TMP。這樣,在一些實施方式中,至少一個DD中的一個係DHFR50並且因此穩定化配位基係TMP。在一些實施方式中,
DD係ER50。在一些實施方式中,此DD的相應的穩定化配位基係CMP8。因此,在ER50系統中CMP8可以是4HT的替代性穩定化配位基。雖然有可能CMP8和4HT可以/應該使用在競爭事件中,但是一些細胞類型可以對這兩種配位基中的一個或另一個更易感,並且根據本揭露和本領域的知識,技術人員可以使用CMP8和/或4HT。
在一些實施方式中,在一個或兩個DD融合至CRISPR酶的C末端的情況下,一個或兩個DD可以融合至CRISPR酶的N末端。在一些實施方式中,至少兩個DD與CRISPR酶締合並且該等DD係相同的DD,即該等DD係同源的。因此,兩個(或兩個或更多個)DD可以是ER50 DD。這在一些實施方式中是較佳的。可替代地,兩個(或兩個或更多個)DD可以是DHFR50 DD。這在一些實施方式中也是較佳的。在一些實施方式中,至少兩個DD與CRISPR酶締合並且該等DD係不同的DD,即該等DD係異源的。因此,一個DD可以是ER50,而一個或多個DD或任何其他DD可以是DHFR50。具有為異源的兩個或更多個DD可能是有利的,因為其將提供更大的降解控制水平。在N末端或C末端處超過一個的DD的銜接融合可以增強降解;並且此銜接融合可以是例如ER50-ER50-C2c2或DHFR-DHFR-Cpf1。設想的是高的降解水平將在不存在任一穩定化配位基的情況下發生,中等的降解水平將在不存在一種穩定化配位基並且存在其他(或另一)穩定化配位基的情況下發生,而低的降解水平將在存在兩種(兩種或更多種)穩定化配位基的情況下發生。控制還可以藉由具有N末端的ER50 DD和C末端的DHFR50 DD來賦予。
在一些實施方式中,CRISPR酶與DD的融合物包括在DD與CRISPR酶之間的接頭。在一些實施方式中,接頭為GlySer接頭。在一些實施方式中,DD-CRISPR酶進一步包含至少一個核輸出信號(NES)。在一些實施方式中,DD-CRISPR酶包含兩個或更多個NES。在一些實施方式中,DD-CRISPR酶包含至少一個核定位信號(NLS)。這可以與NES相附加。在一些實施方式中,CRISPR酶包含下項或基本上由或由下項組成:作為CRISPR酶與DD之間的接頭或作為該接頭的一部分的定位(核輸入或輸出)信號。HA或Flag標籤作為接頭也在本發明的範圍之內。申請人使用NLS和/或NES作為接頭並且還使用如最高至(GGGGS)3的GS一樣短的甘胺酸絲胺酸接頭。
去穩定化結構域具有向寬範圍的蛋白質賦予不穩定性的一般效用;例如參見宮崎(Miyazaki),美國化學學會雜誌(J Am Chem Soc.),2012年3月7日;134(9):3942-3945,該文獻藉由引用結合在此。CMP8或4-羥基他莫苷芬(4-hydroxytamoxifen)可以是去穩定化的結構域。更一般地說,哺乳動物DHFR的溫度敏感突變體(DHFRts),N端法則的去穩定化殘基被發現在許可溫度下是穩定的,但是在37℃下是不穩定的。向表現DHFRts的細胞添加甲胺蝶呤即哺乳動物DHFR的高親和力配位基部分地抑制了蛋白質的降解。這重要地證明了小分子配位基可以穩定化細胞中以其他方式被靶向降解的蛋白質。雷帕黴素(rapamycin)衍生物用於穩定化mTOR的FRB結構域(FRB*)的不穩定突變體並且恢復融合激酶GSK-3β.6,7的功能。此系統證明了配位基依賴性的穩定性代表了用於調節複合物生物環境中的特異性蛋白的功能的有吸引力
的策略。用於控制蛋白質活性的系統可以涉及當藉由雷帕黴素誘導的FK506結合蛋白和FKBP12的二聚化發生泛素互補時DD變成功能性的。人類FKBP12或ecDHFR蛋白的突變體可以被工程化為分別在不存在其高親和力配位基Shield-1或甲氧苄啶(TMP)的情況下是代謝不穩定的。該等突變體係可用於本發明的實踐中的一些可能去穩定化的結構域(DD)並且與CRISPR酶形成融合物的DD的不穩定性使得蛋白酶體對整個融合蛋白的CRISPR蛋白進行降解。Shield-1和TMP結合DD並且以劑量依賴性的方式穩定化DD。雌激素受體配位基結合結構域(ERLBD,ERS1的殘基305-549)也可以被工程化為去穩定化的結構域。因為雌激素受體傳訊途徑涉及多種疾病諸如乳腺癌,該途徑已被廣泛研究並且已經開發出雌激素受體的許多激動劑和拮抗劑。因此,相容的ERLBD和藥物對是已知的。存在結合ERLBD的突變體但不結合其野生型形式的配位基。藉由使用該等編碼三個突變(L384M、M421G、G521R)12的突變體結構域中的一個,有可能使用不擾亂內源性雌激素敏感網路的配位基來調節ERLBD源的DD的穩定性。可以引入另外的突變(Y537S)以進一步去穩定化ERLBD並且將其構造為潛在的DD候選物。四突變體係有利的DD改進。突變體ERLBD可以被融合至CRISPR酶並且其穩定性可以使用配位基來調控或擾亂,由此CRISPR酶具有DD。另一種DD可以是基於突變型FKBP蛋白、由Shield1配位基穩定化的12-kDa(107個胺基酸)的標籤;例如參見,自然方法(Nature Methods)5,(2008)。例如,DD可以是修飾的FK506結合蛋白12(FKBP12),其結合合成的、生物惰性的小分子Shield-1並且由該Shield-1可逆地穩定化;例如參見巴納斯特.LA
(Banaszynski LA)、陳.LC(Chen LC)、梅娜德-史密斯.LA(Maynard-Smith LA)、黃.AG(Ooi AG)、萬德萊斯.TJ(Wandless TJ),一種使用合成的小分子調節活細胞中的蛋白質功能的快速可逆並可調之方法(A rapid,reversible,and tunable method to regulate protein function in living cells using synthetic small molecules),細胞,2006;126:995-1004;巴納斯特.LA、塞爾米厄.MA(Sellmyer MA)、康塔格.CH(Contag CH)、萬德萊斯.TJ,索恩.SH(Thorne SH),活小鼠中的蛋白質穩定性和功能的化學控制(Chemical control of protein stability and function in living mice),自然醫學(Nat Med.)2008;14:1123-1127;梅娜德-史密斯.LA,陳.LC,巴納斯特.LA,黃.AG,萬德萊斯.TJ,一種用於使用生物沈默的小分子工程化條件蛋白穩定性之定向法(A directed approach for engineering conditional protein stability using biologically silent small molecules),生物化學雜誌(The Journal of biological chemistry),2007;282:24866-24872;以及羅德里格斯(Rodriguez),化學生物學(Chem Biol.)2012年3月23日;19(3):391-398-所有文獻藉由引用結合在此並且在選擇與本發明的實踐中的CRISPR酶締合的DD中可以應用在本發明的實踐中。如可以看出的,本領域知識包括許多DD,並且DD可以有利地藉由接頭與CRISPR酶締合,例如融合,由此DD在存在配位基的情況下可以是穩定化的並且當不存在該配位基時,DD可以是去穩定化的,由此CRISPR酶被完全去穩定化,或者DD在不存在配位基的情況下可以是穩定化的並且當存在配位基時,DD可以變成去穩定化的;DD允許CRISPR酶和因此CRISPR-Cas複合物或系統被調節或控制-可以說開啟或
關閉,從而提供用於例如在體內或體外環境中調節或控制系統的手段。例如,當感興趣的蛋白質與DD標籤作為融合物一起表現時,該蛋白質被去穩定化並且在細胞中例如被蛋白酶體快速降解。因此,不存在穩定化的配位基使得DD締合的Cas被降解。當新的DD被融合至感興趣的蛋白質時,該DD的不穩定性被賦予至感興趣的蛋白質,從而使得整個融合蛋白快速降解。Cas的峰值活性有時對降低脫靶效應係有益的。因此,高活性的突釋(bursts)係較佳的。本發明能夠提供此類峰值。在某種意義上,該系統係誘導型的。在一些其他意義上,在不存在穩定化配位基情況下系統被阻遏並且在存在穩定化配位基的情況下系統被去阻遏。
降低脫靶效應的酶突變
在一個方面中,本發明提供了一種非天然發生的或工程化的CRISPR酶,較佳的是第2類CRISPR酶,較佳的是如在此所述的型V或VI CRISPR酶,諸如較佳的是,但不限於如在此其他地方所述的具有使得脫靶效應降低的一個或多個突變的Cpf1,即用於諸如當與指導RNA複合時對靶座位實施修飾但降低或消除朝向脫靶的活性的改進CRISPR酶,以及用於諸如當與指導RNA複合時增加CRISPR酶活性的改進CRISPR酶。應該理解的是,如下文所述的突變型酶可以用於在此其他地方所述的根據本發明的任一方法中。如在此其他地方所述的方法、產物、組成物和用途中的任一種係同樣適用於如下文進一步詳述的突變型CRISPR酶。應該理解的是,在如在此所述的方面和實施方式中,當提及或解讀作為CRISPR酶的Cpf1時,功能CRISPR-Cas系統的重構較佳的是不需要
或不依賴於tracr序列並且/或者同向重複序列係指導(靶或間隔區)序列的5'(上游)。
作為進一步指導,提供了以下的特定方面和實施方式。
發明者已經出人意料地確定,可以對CRISPR酶進行修飾,該等修飾使得相比於未修飾CRISPR酶脫靶活性降低並且/或者相比於未修飾CRISPR酶靶活性增加。因此,在本發明的某些方面中,在此提供了可以在寬範圍的基因修飾應用中具有效用的改進CRISPR酶。在此還提供了CRISPR複合物、組成物和系統以及方法和用途,所有包含了在此揭露的修飾CRISPR酶。
在本揭露中,術語“Cas”可以意指“Cpf1”或CRISPR酶。在本發明的此方面情況下,Cpf1或CRISPR酶係突變的或修飾的,“由此相比於未修飾酶CRISPR複合物中的酶具有降低的修飾一個或多個脫靶座位的能力”(或類似表現);並且,當閱讀本申請時,術語“Cpf1”或“Cas”或“CRISPR酶”等意指包括根據本發明的突變或修飾的Cpf1或Cas或CRISPR酶,即“由此相比於未修飾酶CRISPR複合物中的酶具有降低的修飾一個或多個脫靶座位的能力”(或類似表現)。
在一個方面中,提供了一種如在此所限定的工程化的Cpf1蛋白,諸如Cpf1,其中該蛋白與包含RNA的核酸分子複合以形成CRISPR複合物,其中當處於CRISPR複合物中時,核酸分子靶向一個或多個靶多核苷酸座位,與未修飾Cpf1蛋白相比,該蛋白包含至少一種修飾,並且其中相比於包含未修飾Cpf1蛋白的複合物,包含修飾蛋白的CRISPR複合物具有改變的活性。應該理解的
是,當在此提及CRISPR“蛋白”時,Cpf1蛋白較佳的是修飾的CRISPR酶(例如具有增加或降低(或沒有)酶活性),諸如非限制性地包括Cpf1。術語“CRISPR蛋白”可以與“CRISPR酶”可互換地使用,而不考慮相比於野生型CRISPR蛋白,該CRISPR蛋白是否被改變,諸如增加或降低(或沒有)酶活性。
在一個方面中,工程化的CRISPR蛋白的活性改變包括關於包含RNA的核酸分子或靶多核苷酸座位的結合特性改變,關於包含RNA的核酸分子或靶多核苷酸座位的結合動力學改變,或關於包含RNA的核酸分子或靶多核苷酸座位的相比於脫靶多核苷酸座位的結合特異性改變。
在一些實施方式中,未修飾Cas具有DNA切割活性,諸如Cpf1。在一些實施方式中,Cas引導靶序列位置處的,諸如靶序列內和/或靶序列補體內的一條或兩條股的切割。在一些實施方式中,Cas引導從靶序列的第一個或最後一個核苷酸開始的約1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500或更多個鹼基對內的一條或兩條股的切割。在一些實施方式中,載體編碼相對於相應野生型酶發生突變的Cas,使得突變型Cas缺乏切割含有靶序列的靶多核苷酸的一條或兩條股的能力。在一些實施方式中,當突變型酶的DNA切割活性不超過該酶的非突變形式的DNA切割活性的約25%、10%、5%、1%、0.1%、0.01%或更少時,Cas被認為是實質性缺乏所有DNA切割活性的;一實例可以是當突變形式的DNA切割活性係零或與非突變形式相比係可忽視的時候。因此,Cas可以包含一個或多個突變並且可以在融合或未融
合至功能結構域的情況下用作通用DNA結合蛋白。該等突變可以是人工引入的突變或者增功能或失功能突變。在本發明的一方面中,Cas酶可以融合至蛋白質,例如TAG,和/或誘導型/控制型結構域諸如化學誘導型/控制型結構域。本發明中的Cas可以是嵌合的Cas蛋白;例如,藉由成為嵌合體而具有增強功能的Cas。嵌合Cas蛋白可以是含有來自超過一種的天然存在的Cas的片段的新Cas。該等可以包括一種Cas9同源物的一個或多個N末端片段與另一種Cas同源物的一個或多個C末端片段的融合物。Cas可以呈mRNA形式被遞送至細胞中。Cas的表現可以在誘導型啟動子的控制下。本發明的目的明確是避免已知突變上的讀取。實際上,短語“由此相比於未修飾酶CRISPR複合物中的酶具有降低的修飾一個或多個脫靶座位的能力並且/或者由此相比於未修飾酶CRISPR複合物中的酶具有增加的修飾一個或多個靶座位的能力”(或類似表現)”不意圖讀取僅產生切口酶或無效Cas的突變或已知的Cas9突變。然而,這不是說本發明的一種或多種修飾或一個或多個突變,“由此相比於未修飾酶CRISPR複合物中的酶具有降低的修飾一個或多個脫靶座位的能力並且/或者由此相比於未修飾酶CRISPR複合物中的酶具有增加的修飾一個或多個靶座位的能力”(或類似表現)”不可以與產生為切口酶或無效酶的突變組合。此無效酶可以是增強的核酸分子結合劑。並且此切口酶可以是增強的切口酶。例如,將溝中和溝附近的一個或多個中性胺基酸和/或Cas中緊密接近核酸(例如,DNA、cDNA、RNA、gRNA)的其他位置中的其他帶電荷的殘基改變為一個或多個帶正電荷的胺基酸可以“由此使得相比於未修飾酶CRISPR複合物中的酶具有降低的
修飾一個或多個脫靶座位的能力並且/或者由此使得相比於未修飾酶CRISPR複合物中的酶具有增加的修飾一個或多個靶座位的能力”,例如產生更多切割。因為此切割可以是增強的中靶切割和脫靶切割兩者(超切割的Cpf1),使用了本領域已知的截短指導序列或截短sgRNA(例如參見付(Fu)等人,“使用截短的指導RNA改進CRISPR-Cas核酸酶特異性(Improving CRISPR-Cas nuclease specificity using truncated guide RNAs)”,自然生物技術,32,279-284(2014)doi:10.1038/nbt.2808,2013年12月17日接收,2014年1月06日接受,2014年1月26日線上公開,2014年1月29日線上修正)以使得靶活性增強而沒有較高的脫靶切割或用於產生超切割的切口酶,或用於與使得Cas無效用作超結合劑的突變組合。
在某些實施方式中,工程化的Cpf1蛋白的活性改變包括靶向效率增加或脫靶結合減少。在某些實施方式中,工程化的Cpf1蛋白的活性改變包括切割活性的修飾。
在某些實施方式中,活性改變包括關於包含RNA的核酸分子或靶多核苷酸座位的結合特性改變,關於包含RNA的核酸分子或靶多核苷酸座位的結合動力學改變,或關於包含RNA的核酸分子或靶多核苷酸座位的相比於脫靶多核苷酸座位的結合特異性改變。
在某些實施方式中,活性改變包括靶向效率增加或脫靶結合減少。在某些實施方式中,活性改變包括切割活性的修飾。在某些實施方式中,活性改變包括關於靶多核苷酸座位的切割活性增加。在某些實施方式中,活性改變包括關於靶多核苷酸座位
的切割活性減少。在某些實施方式中,活性改變包括關於脫靶多核苷酸座位的切割活性減少。在某些實施方式中,活性改變包括關於脫靶多核苷酸座位的切割活性增加。
因此,在某些實施方式中,相比於脫靶多核苷酸座位,存在對靶多核苷酸座位的特異性的增加。在其他實施方式中,相比於脫靶多核苷酸座位,存在對靶多核苷酸座位的特異性的降低。
在本發明的一方面中,工程化的Cpf1蛋白的活性改變包括解旋酶動力學的改變。
在本發明的一方面中,工程化的Cpf1蛋白包含改變該蛋白質與包含RNA的核酸分子,或靶多核苷酸座位的股,或脫靶多核苷酸座位的股的締合的修飾。在本發明的一方面中,工程化的Cpf1蛋白包含改變CRISPR複合物的形成的修飾。
在某些實施方式中,改變的Cpf1蛋白包含改變核酸分子對多核苷酸座位的靶向的修飾。在某些實施方式中,修飾包括蛋白質中與核酸分子締合的區中的突變。在某些實施方式中,修飾包括蛋白質中與靶多核苷酸座位的股締合的區中的突變。在某些實施方式中,修飾包括蛋白質中與脫靶多核苷酸座位的股締合的區中的突變。在某些實施方式中,修飾或突變包括蛋白質中與包含RNA的核酸分子、或靶多核苷酸座位的股、或脫靶多核苷酸座位的股締合的區中的正電荷的減少。在某些實施方式中,修飾或突變包括蛋白質中與包含RNA的核酸分子、或靶多核苷酸座位的股、或脫靶多核苷酸座位的股締合的區中的負電荷的減少。在某些實施方式中,修飾或突變包括蛋白質中與包含RNA的核酸分
子、或靶多核苷酸座位的股、或脫靶多核苷酸座位的股締合的區中的正電荷的增加。在某些實施方式中,修飾或突變包括蛋白質中與包含RNA的核酸分子、或靶多核苷酸座位的股、或脫靶多核苷酸座位的股締合的區中的負電荷的增加。在某些實施方式中,修飾或突變增加了蛋白質與包含RNA的核酸分子、或靶多核苷酸座位的股、或脫靶多核苷酸座位的股之間的空間位阻。在某些實施方式中,修飾或突變包括Lys、His、Arg、Glu、Asp、Ser、Gly或Thr的取代。在某些實施方式中,修飾或突變包括Gly、Ala、Ile、Glu或Asp的取代。在某些實施方式中,修飾或突變包括結合溝中的胺基酸取代。
在一個方面中,本發明提供了:
一種如在此所限定的非天然存在的CRISPR酶,諸如Cpf1,其中:
該酶與指導RNA複合以形成CRISPR複合物,
當處於CRISPR複合物中時,指導RNA靶向一個或多個靶多核苷酸座位並且該酶改變該多核苷酸座位,並且
該酶包含至少一個修飾,
由此相比於未修飾酶CRISPR複合物中的酶具有降低的修飾一個或多個脫靶座位的能力並且/或者由此相比於未修飾酶CRISPR複合物中的酶具有增加的修飾一個或多個靶座位的能力。
在任一這樣的非天然存在的CRISPR酶中,修飾可以包括該酶的一個或多個胺基酸殘基的修飾。
在任一這樣的非天然存在的CRISPR酶中,修飾可以包括位於包含為未修飾酶中的帶正電荷的殘基的區中的一個或多個胺基酸殘基的修飾。
在任一這樣的非天然存在的CRISPR酶中,修飾可以包括未修飾酶中的一個或多個帶正電荷的胺基酸殘基的修飾。
在任一這樣的非天然存在的CRISPR酶中,修飾可以包括未修飾酶中的一個或多個不帶正電荷的胺基酸殘基的修飾。
修飾可以包括未修飾酶中的一個或多個不帶電荷的胺基酸殘基的修飾。
修飾可以包括未修飾酶中的一個或多個帶負電荷的胺基酸殘基的修飾。
修飾可以包括未修飾酶中的一個或多個疏水性胺基酸殘基的修飾。
修飾可以包括未修飾酶中的一個或多個極性胺基酸殘基的修飾。
在某些以上所述的非天然存在的CRISPR酶中,修飾可以包括位於溝中的一個或多個殘基的修飾。
在某些以上所述的非天然存在的CRISPR酶中,修飾可以包括位於溝的外面的一個或多個殘基的修飾。
在某些以上所述的非天然存在的CRISPR酶中,修飾包括一個或多個殘基的修飾,其中一個或多個殘基包括精胺酸、
組胺酸或賴胺酸。
在任一以上所述的非天然存在的CRISPR酶中,該酶可以是藉由所述一個或多個殘基的突變來修飾的。
在某些以上所述的非天然存在的CRISPR酶中,該酶係藉由所述一個或多個殘基的突變來修飾的,並且其中突變包括使用丙胺酸取代未修飾酶中的殘基。
在某些以上所述的非天然存在的CRISPR酶中,該酶係藉由所述一個或多個殘基的突變來修飾的,並且其中突變包括使用天冬胺酸或穀胺酸取代未修飾酶中的殘基。
在某些以上所述的非天然存在的CRISPR酶中,該酶係藉由所述一個或多個殘基的突變來修飾的,並且其中突變包括使用絲胺酸、蘇胺酸、天冬醯胺或穀胺醯胺取代未修飾酶中的殘基。
在某些以上所述的非天然存在的CRISPR酶中,該酶係藉由所述一個或多個殘基的突變來修飾的,並且其中突變包括使用丙胺酸、甘胺酸、異亮胺酸、亮胺酸、蛋胺酸、苯丙胺酸、色胺酸、酪胺酸或纈胺酸取代未修飾酶中的殘基。
在某些以上所述的非天然存在的CRISPR酶中,該酶係藉由所述一個或多個殘基的突變來修飾的,並且其中突變包括使用極性胺基酸殘基取代未修飾酶中的殘基。
在某些以上所述的非天然存在的CRISPR酶中,該酶係藉由所述一個或多個殘基的突變來修飾的,並且其中突變包括
使用為非極性胺基酸殘基的胺基酸殘基取代未修飾酶中的殘基。
在某些以上所述的非天然存在的CRISPR酶中,該酶係藉由所述一個或多個殘基的突變來修飾的,並且其中突變包括使用帶負電的胺基酸殘基取代未修飾酶中的殘基。
在某些以上所述的非天然存在的CRISPR酶中,該酶係藉由所述一個或多個殘基的突變來修飾的,並且其中突變包括使用為非帶負電荷的胺基酸殘基的胺基酸殘基取代未修飾酶中的殘基。
在某些以上所述的非天然存在的CRISPR酶中,該酶係藉由所述一個或多個殘基的突變來修飾的,並且其中突變包括使用不帶電荷的胺基酸殘基取代未修飾酶中的殘基。
在某些以上所述的非天然存在的CRISPR酶中,該酶係藉由所述一個或多個殘基的突變來修飾的,並且其中突變包括使用為不帶電荷的胺基酸殘基的胺基酸殘基取代未修飾酶中的殘基。
在某些以上所述的非天然存在的CRISPR酶中,該酶係藉由所述一個或多個殘基的突變來修飾的,並且其中突變包括使用疏水性胺基酸殘基取代未修飾酶中的殘基。
在某些以上所述的非天然存在的CRISPR酶中,該酶係藉由所述一個或多個殘基的突變來修飾的,並且其中突變包括
使用為非疏水性胺基酸殘基的胺基酸殘基取代未修飾酶中的殘基。
在一些實施方式中,CRISPR酶,諸如較佳的是Cpf1酶來源於土拉熱弗朗西絲菌1、土拉熱弗朗西絲菌新殺手亞種、易北普雷沃菌、毛螺旋菌科細菌MC2017 1、解朊丁酸弧菌、佩萊格裡尼菌科細菌GW2011_GWA2_33_10、儉菌總門細菌GW2011_GWC2_44_17、密斯氏菌屬某種SCADC、胺基酸球菌屬某種BV3L6、毛螺旋菌MA2020、候選白蟻甲烷枝原體、挑剔真細菌、牛莫拉氏菌237、稻田鉤端螺旋體、毛螺旋菌科細菌ND2006、狗口腔卟啉單胞菌3、解糖腖普雷沃菌或獼猴卟啉單胞菌的Cpf1(例如,如在此所述修飾的該等生物體中的一種的Cpf1)並且可以進一步包含突變或改變,並且可以是嵌合Cpf1。
在某些實施方式中,Cpf1蛋白包含一個或多個核定位信號(NLS)結構域。在某些實施方式中,Cpf1蛋白包含至少兩個或更多個NLS。
在某些實施方式中,Cpf1蛋白包括嵌合的CRISPR蛋白,該嵌合的CRISPR蛋白包含來自第一CRISPR異種同源物的第一片段和來自第二CRISPR異種同源物的第二片段,並且第一CRISPR異種同源物和第二CRISPR異種同源物係不同的。
在某些實施方式中,酶係藉由在此列出的任一個殘基或對應異種同源物中的相應殘基的突變來修飾的,或包含修飾,例如包括藉由該突變進行的修飾、基本上由或由藉由該突變進行的修飾組成;或者該酶包含根據整個本申請中的揭露內容的任何
一個(單個)、兩個(雙重)、三個(三重)、四個(四重)或更多個位置的,或CRISPR酶異種同源物中的相應殘基或位置的修飾、基本由或由該修飾組成,例如包含在此所列舉的任一種Cpf1殘基的或CRISPR酶異種同源物中的相應殘基或位置的修飾、基本上由或由該修飾組成的酶。在此酶中,每個殘基可以藉由使用丙胺酸殘基的取代來修飾。
申請人最近描述了一種用於產生具有增強的特異性的Cas9異種同源物之方法(斯萊馬克爾(Slaymaker)等人2015“具有提高的特異性的合理工程化Cas9核酸酶(Rationally engineered Cas9 nucleases with improved specificity)”)。此策略可以用於增強Cpf1異種同源物的特異性。用於誘變的初級殘基較佳的是RuvC結構域中的所有帶正電荷的殘基。另外的殘基係在不同異種同源物之間為保守的帶正電荷的殘基。
在某些實施方式中,Cpf1的特異性可以藉由使穩定化非靶向DNA股的殘基發生突變來改進。
在某些以上所述的非天然存在的Cpf1酶中,酶係藉由一個或多個殘基(在RuvC結構域中)的突變來修飾的,該等殘基包括但不限於參照AsCpf1(胺基酸球菌屬某種BV3L6)的胺基酸位置編碼的位置R909、R912、R930、R947、K949、R951、R955、K965、K968、K1000、K1002、R1003、K1009、K1017、K1022、K1029、K1035、K1054、K1072、K1086、R1094、K1095、K1109、K1118、K1142、K1150、K1158、K1159、R1220、R1226、R1242和/或R1252。
在某些以上所述的非天然存在的Cpf1酶中,酶係藉由一個或多個殘基(在RAD50結構域中)的突變來修飾的,該等殘基包括但不限於參照AsCpf1(胺基酸球菌屬某種BV3L6)的胺基酸位置編碼的位置K324、K335、K337、R331、K369、K370、R386、R392、R393、K400、K404、K406、K408、K414、K429、K436、K438、K459、K460、K464、R670、K675、R681、K686、K689、R699、K705、R725、K729、K739、K748和/或K752。
在某些以上所述的非天然存在的Cpf1酶中,酶係藉由一個或多個殘基的突變來修飾的,該等殘基包括但不限於參照AsCpf1(胺基酸球菌屬某種BV3L6)的胺基酸位置編碼的位置R912、T923、R947、K949、R951、R955、K965、K968、K1000、R1003、K1009、K1017、K1022、K1029、K1072、K1086、R1103、R1226和/或R1252。
在某些實施方式中,酶係藉由一個或多個殘基的突變來修飾的,該等殘基包括但不限於參照LbCpf1(毛螺旋菌科細菌ND2006)的胺基酸位置編碼的位置R833、R836、K847、K879、K881、R883、R887、K897、K900、K932、R935、K940、K948、K953、K960、K984、K1003、K1017、R1033、R1138、R1165和/或R1252。
在某些實施方式中,Cpf1酶係藉由一個或多個殘基的突變來修飾的,該等殘基包括但不限於參照AsCpf1(胺基酸球菌屬某種BV3L6)的胺基酸位置編碼的位置K15、R18、K26、Q34、R43、K48、K51、R56、R84、K85、K87、N93、R103、N104、T118、
K123、K134、R176、K177、R192、K200、K226、K273、K275、T291、R301、K307、K369、S404、V409、K414、K436、K438、K468、D482、K516、R518、K524、K530、K532、K548、K559、K570、R574、K592、D596、K603、K607、K613、C647、R681、K686、H720、K739、K748、K757、T766、K780、R790、P791、K796、K809、K815、T816、K860、R862、R863、K868、K897、R909、R912、T923、R947、K949、R951、R955、K965、K968、K1000、R1003、K1009、K1017、K1022、K1029、A1053、K1072、K1086、F1103、S1209、R1226、R1252、K1273、K1282和/或K1288。
在某些實施方式中,Cpf1酶係藉由一個或多個殘基的突變來修飾的,該等殘基包括但不限於參照FnCpf1(新殺手法蘭西斯菌U112)的胺基酸位置編碼的位置K15、R18、K26、R34、R43、K48、K51、K56、K87、K88、D90、K96、K106、K107、K120、Q125、K143、R186、K187、R202、K210、K235、K296、K298、K314、K320、K326、K397、K444、K449、E454、A483、E491、K527、K541、K581、R583、K589、K595、K597、K613、K624、K635、K639、K656、K660、K667、K671、K677、K719、K725、K730、K763、K782、K791、R800、K809、K823、R833、K834、K839、K852、K858、K859、K869、K871、R872、K877、K905、R918、R921、K932、I960、K962、R964、R968、K978、K981、K1013、R1016、K1021、K1029、K1034、K1041、K1065、K1084和/或K1098。
在某些實施方式中,Cpf1酶係藉由一個或多個殘基的
突變來修飾的,該等殘基包括但不限於參照LbCpf1(毛螺旋菌科細菌ND2006)的胺基酸位置編碼的位置K15、R18、K26、K34、R43、K48、K51、R56、K83、K84、R86、K92、R102、K103、K116、K121、R158、E159、R174、R182、K206、K251、K253、K269、K271、K278、P342、K380、R385、K390、K415、K421、K457、K471、A506、R508、K514、K520、K522、K538、Y548、K560、K564、K580、K584、K591、K595、K601、K634、K640、R645、K679、K689、K707、T716、K725、R737、R747、R748、K753、K768、K774、K775、K785、K787、R788、Q793、K821、R833、R836、K847、K879、K881、R883、R887、K897、K900、K932、R935、K940、K948、K953、K960、K984、K1003、K1017、R1033、K1121、R1138、R1165、K1190、K1199和/或K1208。
在某些實施方式中,酶係藉由一個或多個殘基的突變來修飾的,該等殘基包括但不限於參照MbCpf1(牛莫拉氏菌237)的胺基酸位置編碼的位置K14、R17、R25、K33、M42、Q47、K50、D55、K85、N86、K88、K94、R104、K105、K118、K123、K131、R174、K175、R190、R198、I221、K267、Q269、K285、K291、K297、K357、K403、K409、K414、K448、K460、K501、K515、K550、R552、K558、K564、K566、K582、K593、K604、K608、K623、K627、K633、K637、E643、K780、Y787、K792、K830、Q846、K858、K867、K876、K890、R900、K901、M906、K921、K927、K928、K937、K939、R940、K945、Q975、R987、R990、K1001、R1034、I1036、R1038、R1042、K1052、K1055、K1087、R1090、K1095、N1103、K1108、K1115、K1139、K1158、R1172、
K1188、K1276、R1293、A1319、K1340、K1349和/或K1356。
在任一非天然存在的CRISPR酶中:
在靶標與一個或多個脫靶座位的相應序列之間可以存在單個錯配;並且/或者
在靶標與一個或多個脫靶座位的相應序列之間可以存在兩個、三個或四個或更多個錯配,並且/或者
其中在(ii)中所述兩個、三個或四個或更多個錯配係連續的。
在任一非天然存在的CRISPR酶中,相比於未修飾酶CRISPR複合物中的酶可以具有降低的修飾一個或多個脫靶座位的能力並且其中相比於未修飾酶CRISPR複合物中的酶具有增加的修飾所述靶座位的能力。
在任一非天然存在的CRISPR酶中,相比於未修飾酶的相對差異,當在CRISPR複合物中時酶在靶標與至少一個脫靶座位之間的修飾能力的相對差異可以是增加的。
在任一非天然存在的CRISPR酶中,CRISPR酶可以包含一個或多個另外的突變,其中一個或多個另外的突變係處於一個或多個催化活性結構域中。
在此類非天然存在的CRISPR酶中,與缺乏所述一個或多個另外的突變的酶相比,CRISPR酶可以具有降低或廢除的核酸酶活性。
在一些此類非天然存在的CRISPR酶中,CRISPR酶不
引導靶序列位置處的一條或另一條DNA股的切割。
在CRISPR酶在一個或多個催化活性結構域中包含一個或多個另外的突變的情況下,一個或多個另外的突變可以是處於包含RuvCI、RuvCII或RuvCIII的CRISPR酶的催化活性結構域中。
在不受理論束縛的情況下,在本發明的一方面中,描述的方法和突變對產生中靶位點處的切割並避免脫靶位點處的那些構象狀態的位置提供了增強的CRISPR酶結構域(例如Cpf1結構域)的構象重排。CRISPR酶以一系列的協調步驟切割靶DNA。首先,PAM相互作用結構域識別靶DNA的PAM序列5'。PAM結合之後,對靶序列的前10-12個核苷酸(種子序列)進行取樣以用於gRNA:DNA互補,一種依賴於DNA雙股體分離的方法。如果種子序列核苷酸互補gRNA,則DNA的剩餘部分被解旋並且gRNA的全長度與靶DNA股雜交。核苷酸溝可以藉由與DNA磷酸骨架的正電荷的非特異性相互作用來穩定化非靶向的DNA股並且促進解旋。在對抗cDNA:ncDNA再次雜交的競爭中,RNA:cDNA和CRISPR酶:ncDNA相互作用驅動DNA解旋。其他CRISPR酶結構域也可以影響核酸酶結構域的構象,例如連接不同結構域的接頭。因此,所提供的方法和突變涵蓋但不限於RuvCI、RuvCIII、RuvCIII和接頭。藉由靶DNA結合,包括種子序列相互作用以及與靶DNA股和非靶DNA股的相互作用引起的例如Cpf1的構象變化確定了結構域是否被定位成觸發核酸酶活性。因此,在此所提供的方法和突變展示並實現了超過PAM識別和RNA-DNA鹼基配對的修飾。
在一方面中,本發明提供了如在此所限定的CRISPR
核酸酶,諸如Cpf1,當涉及中靶相互作用時其具有朝向與切割活性相關聯的構象的改進平衡並且/或者當涉及脫靶相互作用時其具有遠離與切割活性相關聯的構象的改進平衡。在一個方面中,本發明提供了具有改進的校對功能的Cas(例如Cpf1)核酸酶,即採用一在中靶位點處具有核酸酶活性的構象的Cas(例如Cpf1)核酸酶,並且該構象在脫靶位點處具有增加的不利性。斯騰伯格(Sternberg)等人(自然527(7576):110-3,doi:10.1038/nature15544,2015年10月28日線上公開,電子版2015年10月28日)使用了螢光共振能量轉移(FRET)實驗來檢測Cas(例如Cpf1)催化結構域在與中靶DNA和脫靶DNA締合時的相對取向,並且這可以外推到本發明的CRISPR酶(例如Cpf1)。
本發明進一步提供了用於使用修飾的指導RNA調控核酸酶活性和/或特異性的方法和突變。如所討論的,中靶核酸酶活性可以是增加的或減少的。另外,脫靶核酸酶活性可以是增加的或減少的。此外,對中靶活性的特異性相比於對脫靶活性的特異性可以存在增加或減少。修飾指導RNA包括但不限於,截短的指導RNA、無效指導RNA、化學上修飾的指導RNA、與功能結構域締合的指導RNA、包含功能結構域的修飾指導RNA、包含適配體的修飾指導RNA、包含轉接蛋白的修飾指導RNA以及包含添加或修飾的環的指導RNA。在一些實施方式中,一個或多個功能結構域與無效gRNA(dRNA)締合。在一些實施方式中,與CRISPR酶複合的dRNA引導功能結構域在一個基因座位處的基因調節,同時gRNA引導CRISPR酶在另一個座位處的DNA切割。在一些實施方式中,dRNA被選擇為與脫靶調節相比使對感興趣的基因座位的
調節選擇性最大化。在一些實施方式中,dRNA被選擇為最大化靶基因調節並且最小化靶標切割。
出於以下討論的目的,提及功能結構域可以是與CRISPR酶締合的功能結構域或者與轉接蛋白締合的功能結構域。
在本發明的實踐中,可以在不與Cas(例如Cpf1)蛋白碰撞的情況下藉由插入可以募集轉接蛋白的一個或多個不同RNA環或一個或多個不同序列來擴展gRNA的環,該等轉接蛋白可以結合一個或多個不同RNA環或者一個或多個不同序列。該等轉接蛋白可以包括但不限於,存在於各種噬菌體外殼蛋白內的正交RNA結合蛋白/適配體組合。此類外殼蛋白列表包括但不限於:Qβ、F2、GA、fr、JP501、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、ΦCb5、ΦCb8r、ΦCb12r、ΦCb23r、7s以及PRR1。該等轉接蛋白或正交RNA結合蛋白可以進一步募集包含一個或多個功能結構域的效應蛋白或融合物。在一些實施方式中,功能結構域可以是選自下組,該組由以下各項組成:易位酶結構域、整合酶結構域、重組酶結構域、解離酶結構域、轉化酶結構域、蛋白酶結構域、DNA甲基轉移酶結構域、DNA羥甲基酶結構域、DNA脫甲基酶結構域、組蛋白乙醯化酶結構域、組蛋白脫乙醯化酶結構域、核酸酶域、阻遏物結構域、活化物結構域、核定位信號結構域、轉錄調節蛋白質(或轉錄複合物募集)結構域、細胞攝取活性相關結構域、核酸結合結構域、抗體呈遞結構域、組蛋白修飾酶、組蛋白修飾酶的募集物;組蛋白修飾酶、組蛋白甲基轉移酶、組蛋白去甲酶、組
蛋白激酶、組蛋白磷酸酶、組蛋白核糖基酶、組蛋白脫核糖基酶、組蛋白泛素酶、組蛋白脫泛素酶、組蛋白生物素酶以及組蛋白尾蛋白酶的抑制劑。在一些較佳的實施方式中,功能結構域係轉錄啟動結構域,諸如但不限於,VP64、p65、MyoD1、HSF1、RTA、SET7/9或組蛋白乙醯轉移酶。在一些實施方式中,功能結構域係轉錄阻遏結構域,較佳的是KRAB。在一些實施方式中,轉錄阻遏結構域係SID或SID的串聯體(例如SID4X)。在一些實施方式中,功能結構域係表觀遺傳修飾結構域,以便提供表觀遺傳修飾酶。在一些實施方式中,功能結構域係啟動結構域,它可以是P65啟動結構域。在一些實施方式中,功能結構域係脫胺酶,諸如胞苷脫胺酶。胞苷脫胺酶(deaminese)可以被引導至靶核酸,在這兒胞苷脫胺酶引導胞苷至尿苷的轉化,產生C至T的取代(在互補股上G變成A)。在此實施方式中,可以在不存在DNA切割的情況下實施核苷酸取代。
在一個方面中,本發明還提供了用於調控Cas(例如Cpf1)結合活性和/或結合特異性的方法和突變。在某些實施方式中,使用了缺乏核酸酶活性的Cas(例如Cpf1)蛋白。在某些實施方式中,採用了促進Cas(例如Cpf1)核酸酶的結合但不促進其核酸酶活性的修飾指導RNA。在此類實施方式中,中靶結合可以被增加或減少。另外,在此類實施方式中,脫靶結合可以被增加或減少。另外,對於中靶結合相比於脫靶結合的特異性可以存在增加或減少。
在特定實施方式中,脫靶切割的減少係藉由以下方式
確保的:藉由去穩定化股分離,更具體地是藉由在Cpf1酶中引入減少DNA相互作用區中的正電荷的突變(如在此所述的以及斯萊馬克爾等人2016(科學,1;351(6268):84-8)進一步對Cas9的舉例說明)。在另外的實施方式中,脫靶切割的減少係藉由以下方式確保的:藉由將影響靶股與指導RNA序列之間的相互作用,更具體地是擾亂Cpf1與靶DNA股的磷酸骨架之間的相關作用的突變引入到Cpf1酶中,以此方式使得靶特異性活性保留而脫靶活性降低(如克萊因史迪華(Kleinstiver)等人2016自然,28;529(7587):490-5對Cas9描述的)。在特定實施方式中,脫靶活性係藉由修飾Cpf1來降低的,其中相比於野生型Cpf1,與靶股和非靶股的相互作用均被修飾。
可以不同組合被採用來增加或減少活性和/或使中靶活性相比於脫靶活性的特異性增加或減少,或增加或減少結合和/或使中靶結合相比於脫靶結合的特異性增加或減少的方法和突變可以用於補償或增強被形成來促進其他效應的突變或修飾。被形成來促進其他效應的此類突變或修飾包括Cas(例如Cpf1)的突變或修飾和/或對指導RNA所進行的突變或修飾。在某些實施方式中,該等方法和突變與化學修飾的指導RNA一起使用。指導RNA化學修飾的實例包括但不限於在一個或多個末端核苷酸處摻入2'-O-甲基(M)、2'-O-甲基3'硫代磷酸酯(MS)或2'-O-甲基3'硫代PACE(MSP)。與未修飾的指導RNA相比,此類化學修飾的指導RNA可以具有增加的穩定性和增加的活性,但是中靶相比於脫靶的特異性係不可測的。(參見,亨戴爾,2015,自然生物技術33(9):985-9,doi:10.1038/nbt.3290,2015年6月29日線上公開)。化學修飾的指
導RNA進一步包括但不限於具有硫代磷酸酯鍵和鎖定核酸(LNA)核苷酸的RNA,該鎖定核酸(LNA)核苷酸包含在核糖環的2'碳與4'碳之間的亞甲基橋。本發明的方法和突變用於使用化學修飾的指導RNA調控Cas(例如Cpf1)核酸酶活性和/或結合。
在一方面中,本發明提供了用於調控如在此所限定的根據本發明的Cas(例如Cpf1)蛋白的結合和/或結合特異性的方法和突變,該等蛋白包含功能結構域諸如核酸酶、轉錄活化物、轉錄阻遏物等。例如,可以使得Cas(例如Cpf1)蛋白無核酸酶或藉由引入突變使得Cas(例如Cpf1)蛋白具有改變或降低的核酸酶活性,該等突變係例如像在此其他地方所述的Cpf1突變,並且包括如在此任何地方所述的例如參照FnCpf1p RuvC結構域的胺基酸位置的D917A、E1006A、E1028A、D1227A、D1255A、N1257A、D917A、E1006A、E1028A、D1227A、D1255A和N1257A;或例如參照推定的第二核酸酶結構域的N580A、N584A、T587A、W609A、D610A、K613A、E614A、D616A、K624A、D625A、K627A和Y629A。核酸酶缺乏的Cas(例如Cpf1)蛋白適用於RNA指導的靶序列依賴性的功能結構域遞送。本發明提供了用於調控Cas(例如Cpf1)蛋白的結合的方法和突變。在一個實施方式中,功能結構域包括VP64,提供了RNA指導的轉錄因子。在另一個實施方式中,功能結構域包括Fok I,提供了RNA指導的核酸酶活性。參考美國專利公開2014/0356959、美國專利公開2014/0342456、美國專利公開2015/0031132,以及瑪裡,P.(Mali,P.)等人,2013,科學339(6121):823-6,doi:10.1126/science.1232033,2013年1月3日線上公開,並且藉由在此的傳授內容,本發明包括了該等文獻結合在
此的教義應用的方法和材料。在某些實施方式中,中靶結合被增加。在某些實施方式中,脫靶結合被減少。在某些實施方式中,中靶結合被減少。在某些實施方式中,脫靶結合被增加。因此,本發明還提供了功能化的Cas(例如Cpf1)結合蛋白的中靶結合相比於脫靶結合增加或減少的特異性。
用作RNA指導的結合蛋白的Cas(例如Cpf1)不限於無核酸酶的Cas(例如Cpf1)。具有核酸酶活性的Cas(例如Cpf1)酶當與某些指導RNA一起使用時也可以用作NA指導的結合蛋白。例如,短指導RNA和包含與靶錯配的核苷酸的指導RNA可以促進RNA引導的Cas(例如Cpf1)與靶序列的結合,幾乎沒有或沒有產生靶切割。(例如參見,達爾曼(Dahlman)等人,2015,自然生物技術33(11):1159-1161,doi:10.1038/nbt.3390,2015年10月05日線上公開)。在一個方面中,本發明提供了用於調控包含核酸酶活性的Cas(例如Cpf1)蛋白的結合的方法和突變。在某些實施方式中,中靶結合被增加。在某些實施方式中,脫靶結合被減少。在某些實施方式中,中靶結合被減少。在某些實施方式中,脫靶結合被增加。在某些實施方式中,中靶結合相比於脫靶結合的特異性存在增加或減少。在某些實施方式中,指導RNA-Cas(例如Cpf1)酶的核酸酶活性也被調控。
RNA-DNA異源雙股體形成對整個靶區(不僅僅是最靠近PAM的種子區序列)的切割活性和特異性係重要的。因此,截短的指導RNA顯示出降低的切割活性和特異性。在一個方面中,本發明提供了用於使用改變的指導RNA增加活性和特異性的方法
和突變。
本發明還證明可以使得Cas(例如Cpf1)核酸酶特異性的修飾與靶向範圍的修飾一致。Cas(例如Cpf1)突變體可以被設計成具有增加的靶特異性以及PAM識別的調節性修飾,例如藉由選擇改變PAM特異性的突變並且將該等突變與增加(或者如果需要,減少)中靶序列相比於脫靶序列的特異性的核苷酸溝突變相結合來設計。在一個此實施方式中,PI結構域殘基發生突變以調節希望的PAM序列的識別同時一個或多個核苷酸溝胺基酸發生突變以改變靶特異性。在此所述的Cas(例如Cpf1)方法和修飾可以用於抵消由PAM識別的改變產生的特異性損失,增強由PAM識別的改變產生的特異性增益,抵消由PAM識別的改變產生的特異性增益或增強由PAM識別的改變產生的特異性喪失。
該等方法和突變可以與具有改變的PAM識別的Cas(例如Cpf1)酶一起使用。包括的PAM的非限制性實例為如在此任何地方所述的。
在另外的實施方式中,該等方法和突變用於修飾蛋白質。
在任一非天然存在的CRISPR酶中,CRISPR酶可以包含一個或多個異源結構域。
一個或多個異源功能結構域可以包括一個或多個核定位信號(NLS)結構域。一個或多個異源功能結構域可以包括至少兩個或更多個NLS。
一個或多個異源功能結構域可以包括一個或多個轉錄啟動結構域。轉錄啟動結構域可以包括VP64。
一個或多個異源功能結構域可以包括一個或多個轉錄阻遏結構域。轉錄阻遏結構域可以包括KRAB結構域或SID結構域。
一個或多個異源功能結構域可以包括一個或多個核酸酶結構域。一個或多個核酸酶結構域可以包括Fok1。
一個或多個異源功能結構域可以具有以下活性中的一種或多種:修飾烷酶活性、去甲酶活性、轉錄啟動活性、轉錄阻遏活性、轉錄釋放因子活性、組蛋白修飾活性、核酸酶活性、單股RNA切割活性、雙股RNA切割活性、單股DNA切割活性、雙股DNA切割活性以及核酸結合活性。
至少一個或多個異源功能結構域可以處於或靠近酶的胺基末端和/或處於或靠近酶的羧基末端。
一個或多個異源功能結構域可以藉由接頭部分融合至CRISPR酶,或系接至CRISPR酶,或連接至CRISPR酶。
在任一非天然存在的CRISPR酶中,CRISPR酶可以包括來自於來自包括下項的屬的生物體的CRISPR酶:土拉熱弗朗西絲菌1、土拉熱弗朗西絲菌新殺手亞種、易北普雷沃菌、毛螺旋菌
科細菌MC2017 1、解朊丁酸弧菌、佩萊格裡尼菌科細菌GW2011_GWA2_33_10、儉菌總門細菌GW2011_GWC2_44_17、密斯氏菌屬某種SCADC、胺基酸球菌屬某種BV3L6、毛螺旋菌MA2020、候選白蟻甲烷枝原體、挑剔真細菌、牛莫拉氏菌237、稻田鉤端螺旋體、毛螺旋菌科細菌ND2006、狗口腔卟啉單胞菌3、解糖腖普雷沃菌或獼猴卟啉單胞菌(例如,如在此所述修飾的該等生物體中的一種的Cpf1)並且可以進一步包含突變或改變,並且可以是嵌合Cas(例如Cpf1)。
在任一非天然存在的CRISPR酶中,CRISPR酶可以包括嵌合的Cas(例如Cpf1)酶,該嵌合的Cas(例如Cpf1)酶包含來自第一Cas(例如Cpf1)異種同源物的第一片段和來自第二Cas(例如Cpf1)異種同源物的第二片段,並且第一Cas(例如Cpf1)異種同源物和第二Cas(例如Cpf1)異種同源物係不同的。第一Cas(例如Cpf1)異種同源物和第二Cas(例如Cpf1)異種同源物中的至少一者可以包括來自包括下項的生物體的Cas(例如Cpf1):土拉熱弗朗西絲菌1、土拉熱弗朗西絲菌新殺手亞種、易北普雷沃菌、毛螺旋菌科細菌MC2017 1、解朊丁酸弧菌、佩萊格裡尼菌科細菌GW2011_GWA2_33_10、儉菌總門細菌GW2011_GWC2_44_17、密斯氏菌屬某種SCADC、胺基酸球菌屬某種BV3L6、毛螺旋菌科細菌MA2020、候選白蟻甲烷枝原體、挑剔真細菌、牛莫拉氏菌237、稻田鉤端螺旋體、毛螺旋菌科細菌ND2006、狗口腔卟啉單胞菌3、解糖腖普雷沃菌或獼猴卟啉單胞菌。
在任一非天然存在的CRISPR酶中,編碼CRISPR酶的
核苷酸序列可以被密碼子優化為在真核生物中表現。
在任一非天然存在的CRISPR酶中,細胞可以是真核細胞或原核細胞;其中CRISPR複合物在細胞中是可操作的,並且由此相比於未修飾酶CRISPR複合物的酶具有降低的修飾細胞的一個或多個脫靶座位的能力並且/或者由此相比於未修飾酶CRISPR複合物中的酶具有增加的修飾一個或多個靶座位的能力。
因此,在一個方面中,本發明提供了一種包含如在此所限定的工程化的CRISPR蛋白或系統的真核細胞。
在某些實施方式中,如在此所述的方法可以包括提供Cas(例如Cpf1)轉基因細胞,其中提供或引入了編碼一個或多個指導RNA的一種或多種核酸,在該細胞中該等核酸可操作地與包含一種或多種感興趣的基因的啟動子的調節元件連接。如在此所用,術語“Cas轉基因細胞”係指細胞諸如真核細胞,其中Cas基因已經是基因組整合的。根據本發明,細胞的性質、類型或來源不是特別限制的。另外,Cas轉基因被引入細胞中的方式可以變化並且可以是如本領域已知的任何方法。在某些實施方式中,Cas轉基因細胞係藉由將Cas轉基因引入分離細胞中來獲得的。在某些其他實施方式中,Cas轉基因細胞係藉由從Cas轉基因生物體中分離細胞來獲得的。作為實例而非限制,如在此提及的Cas轉基因細胞可以是來源於Cas轉基因真核生物,諸如Cas敲入真核生物。參考WO 2014/093622(PCT/US13/74667),該專利藉由引用結合在此。轉讓給桑加莫生物科技公司(Sangamo BioSciences,Inc.)的美國專利公開案號20120017290和20110265198中的針對靶向玫瑰屬(Rosa)
座位的方法可以被修改成利用本發明的CRISPR Cas系統。轉讓給策勒克提斯公司(Cellectis)的美國專利公開案號20130236946中的針對靶向玫瑰屬座位的方法也可以被修改成利用本發明的CRISPR Cas系統。作為另外的實例,參考普萊特(Platt)等人(細胞;159(2):440-455(2014)),描述了Cas9敲入小鼠,該文獻藉由引用結合在此,並且其可以外推到如在此所限定的本發明CRISPR酶。Cas轉基因可以進一步包含Lox-Stop-polyA-Lox(LSL)盒,從而使得Cas表現藉由Cre重組酶可誘導。可替代地,Cas轉基因細胞可以是藉由將Cas轉基因引入分離細胞中來獲得的。轉基因的遞送系統在本領域是熟知的。作為實例,也如在此其他地方所述的,Cas轉基因可以藉由載體(例如AAV、腺病毒、慢病毒)和/或粒子和/或奈米粒子遞送來遞送。
技術人員應理解的是,細胞(諸如在此提及的Cas轉基因細胞)除具有整合的Cas基因或產生自Cas在與能夠將Cas指導至靶座位的RNA複合時的序列特異性作用的突變(例如像一個或多個致癌性突變)之外可以進一步包含基因組的改變,例如但不限於普萊特等人(2014);陳等人,(2014)或庫馬爾(Kumar)等人(2009)。
本發明還提供了一種包含如在此所述的諸如在此部分所述的工程化CRISPR蛋白的組成物。
本發明還提供了一種包含CRISPR-Cas複合物的非天然存在的工程化組成物,該CRISPR-Cas複合物包含以上所述的任何非天然存在的CRISPR酶。
在一個方面中,本發明提供了一種包含一種或多種載體的載體系統,其中一種或多種載體包含:
a)可操作地連接至編碼如在此所限定的工程化CRISPR蛋白的核苷酸序列的第一調節元件;並且視情況
b)可操作地連接至編碼包含指導RNA的一個或多個核酸分子的一種或多種核苷酸序列的第二調節元件,該指導RNA包含指導序列、同向重複序列,視情況其中組分(a)和(b)位於相同或不同的載體上。
本發明還提供了一種非天然存在的工程化組成物,該組成物包含:
被可操作地構造成用於將CRISPR-Cas複合物組分或包含或編碼所述組分的一種或多種多核苷酸序列遞送至細胞中的遞送系統,並且其中所述CRISPR-Cas複合物在該細胞中是可操作的,
CRISPR-Cas複合物組分或編碼細胞中的轉錄和/或翻譯的一種或多種多核苷酸序列,該等CRISPR-Cas複合物組分包含:
(I)如在此所述的非天然存在的CRISPR酶(例如,工程化的Cpf1);
(II)CRISPR-Cas指導RNA,包含:
指導序列,以及
同向重複序列,
其中相比於未修飾酶CRISPR複合物中的酶具有降低的修飾
一個或多個脫靶座位的能力並且/或者由此相比於未修飾酶CRISPR複合物中的酶具有增加的修飾一個或多個靶座位的能力。
在一個方面中,本發明還提供了一種包含如在此所述的諸如在此部分所述的工程化CRISPR蛋白的系統。
在任何此類組成物中,遞送系統可以包括酵母系統、脂質轉染系統、微注射系統、基因槍系統、病毒體、脂質體、免疫脂質體、聚陽離子、脂質:核酸軛合物或人工病毒體,如在此其他地方所限定的。
在任何此類組成物中,遞送系統可以包括包含一種或多種載體的載體系統,並且其中組分(II)包含可操作地連接至包含指導序列、同向重複序列的多核苷酸序列的第一調節元件,並且視情況,並且其中組分(I)包含可操作地連接至編碼CRISPR酶的多核苷酸序列的第二調節元件。
在任何此類組成物中,遞送系統可以包括包含一種或多種載體的載體系統,並且其中組分(II)包含可操作地連接至指導序列和同向重複序列的第一調節元件,並且其中組分(I)包含可操作地連接至編碼CRISPR酶的多核苷酸序列的第二調節元件。
在任何此類組成物中,組成物可以包含超過一個的指導RNA,並且每個指導RNA具有不同的靶標,由此存在多重作用。
在任何此類組成物中,一種或多種多核苷酸序列可以在一個載體上。
本發明還提供了一種包含一種或多種載體的工程化、
非天然存在的成簇規律間隔短迴文重複序列(CRISPR)-CRISPR相關(Cas)(CRISPR-Cas)載體系統,該等載體包含:
a)可操作地連接至編碼在此的任何一種本發明構建體的非天然存在的CRISPR酶的核苷酸序列的第一調節元件;以及
b)可操作地連接至編碼一個或多個指導RNA的一種或多種核苷酸序列的第二調節元件,該指導RNA包含指導序列、同向重複序列,
其中:
組分(a)和(b)位於相同或不同的載體上,
形成了CRISPR複合物;
指導RNA靶向靶多核苷酸座位並且該酶改變該多核苷酸座位,並且
相比於未修飾酶CRISPR複合物中的酶具有降低的修飾一個或多個脫靶座位的能力並且/或者由此相比於未修飾酶CRISPR複合物中的酶具有增加的修飾一個或多個靶座位的能力。
在此系統中,組分(I)可以包含可操作地連接至包含指導序列、同向重複序列的多核苷酸序列的第一調節元件,並且其中組分(II)可以包含可操作地連接至編碼CRISPR酶的多核苷酸序列的第二調節元件。在此系統中,其中可適用的指導RNA可以包括嵌合RNA。
在此系統中,組分(I)可以包含可操作地連接至指
導序列和同向重複序列的第一調節元件,並且其中組分(II)可以包含可操作地連接至編碼CRISPR酶的多核苷酸序列的第二調節元件。此系統可以包含超過一個的指導RNA,並且每個指導RNA具有不同的靶標,由此存在多重作用。組分(a)和(b)可以在相同載體上。
在包含載體的任何此類系統中,一種或多種載體可以包括一種或多種病毒載體,諸如一個或多個逆轉錄病毒、慢病毒、腺病毒、腺伴隨病毒或單純皰疹病毒。
在包含調節元件的任何此類系統中,至少一種所述調節元件可以包括組織特異性啟動子。組織特異性啟動子可以引導哺乳動物血細胞中、哺乳動物肝細胞中或哺乳動物眼部細胞中的表現。
在任一上述組成物或系統中,同向重複序列可以包含一個或多個蛋白質相互作用的RNA適配體。一個或多個適配體可以位於四核苷酸環中。一個或多個適配體可以能夠結合MS2噬菌體外殼蛋白。
在任一上述組成物或系統中,細胞可以是真核細胞或原核細胞;其中CRISPR複合物在細胞中是可操作的,並且由此相比於未修飾酶CRISPR複合物的酶具有降低的修飾細胞的一個或多個脫靶座位的能力並且/或者由此相比於未修飾酶CRISPR複合物中的酶具有增加的修飾一個或多個靶座位的能力。
本發明還提供了一種任一上述組成物或來自任一上
述系統的CRISPR複合物。
本發明還提供了一種在細胞中修飾感興趣的座位之方法,該方法包括使細胞與在此所述的工程化CRISPR酶(例如工程化的Cpf1)、組成物中的任一種或在此所述的系統或載體系統中的任一種接觸,或者其中該細胞包含在該細胞內存在的任一在此所述的CRISPR複合物。在此類方法中,細胞可以是原核細胞或真核細胞,較佳的是真核細胞。在此類方法中,生物體可以包括細胞。在此類方法中,生物體可以不是人類或其他動物。
任何此方法可以是離體的或在體外。
在某些實施方式中,在細胞中編碼所述指導RNA或Cas蛋白中的至少一種的核苷酸序列可操作地與包含感興趣的基因的啟動子的調節元件連接,由此至少一種CRISPR-Cas系統組分的表現由感興趣的基因的啟動子驅動。“可操作地連接的”旨在意指編碼指導RNA和/或Cas的核苷酸序列以允許核苷酸序列表現的方式被連接至一個或多個調節元件,也如在此其他地方所提及的。術語“調節元件”也被在此其他地方描述。根據本發明,調節元件包括感興趣的基因的啟動子,諸如較佳的是感興趣的內源性基因的啟動子。在某些實施方式中,啟動子處於其內源性基因組位置。在此類實施方式中,編碼CRISPR和/或Cas的核酸在其天然基因組位置處的感興趣的基因的啟動子的轉錄控制下。在某些其他實施方式中,啟動子被提供在(單獨的)核酸分子諸如載體或質粒,或其他染色體外核酸上,即啟動子不被提供在其天然基因組位置處。在某些實施方式中,啟動子被基因組整合在非天然的基因組
位置處。
任何此類方法,所述修飾可以包括調控基因表現。所述調節基因表現可以包括啟動基因表現和/或阻遏基因表現。因此,在一個方面中,本發明提供了一種調控基因表現之方法,其中該方法包括將如在此所述的工程化的CRISPR蛋白或系統引入到細胞中。
本發明還提供了一種治療有需要的個體的疾病、病症或感染之方法,該方法包括給予有效量的在此所述的工程化CRISPR酶(例如工程化的Cpf1)、組成物、系統或CRISPR複合物中的任一種。疾病、病症或感染可以包括病毒感染。病毒感染可以是HBV。
本發明還提供了以上所述的工程化CRISPR酶(例如工程化的Cpf1)、組成物、系統或CRISPR複合物中的任一種用於基因或基因組編輯之用途。
本發明還提供了一種改變感興趣的基因組座位在哺乳動物細胞中的表現之方法,該方法包括使細胞與在此所述的工程化CRISPR酶(例如工程化的Cpf1)、組成物、系統或CRISPR複合物接觸並且從而遞送CRISPR-Cas(載體)並且使得CRISPR-Cas複合物形成且結合靶標,並且測定基因組座位的表現是否已經被改變,諸如增加或減少的表現,或基因產物的修飾。
本發明還提供了以上所述的用作治療劑的工程化CRISPR酶(例如工程化的Cpf1)、組成物、系統或CRISPR複合物
中的任一種。治療劑可以用於基因或基因組編輯,或基因治療。
在某些實施方式中,如在此所述的工程化CRISPR酶(例如工程化的Cpf1)的活性包括基因組DNA切割,視情況使得基因的轉錄減少。
在一個方面中,本發明提供了一種根據如在此所述的方法而具有改變的基因組座位表現之分離細胞,其中改變的表現係與未經受改變基因組座位表現的方法的細胞相比較的。在一個相關的方面中,本發明提供了一種由此細胞建立的細胞系。
在一個方面中,本發明提供了一種藉由操縱例如HSC(造血幹細胞)的感興趣基因組座位中的靶序列來修飾生物體或非人類生物體的方法,例如其中感興趣的基因組座位與異常的蛋白質表現或與疾病病狀或狀態相關聯的突變相關聯,該方法包括:
遞送至HSC,例如,經由使HSC與含有非天然存在或工程化的組成物的粒子接觸來進行,該組成物包含:
I. CRISPR-Cas系統指導RNA(gRNA)多核苷酸序列,該序列包括:
(a)能夠雜交至HSC中的靶序列的指導序列,
(b)同向重複序列,以及
II. CRISPR酶,視情況包含至少一個或多個核定位序列,
其中,指導序列引導CRISPR複合物與靶序列的序列特異性結合,並且
其中CRISPR複合物包含與(1)雜交至靶序列的指導序列複合的CRISPR酶;並且
該方法可以視情況還包括遞送HDR模板,例如經由使含有HDR模板的粒子接觸HSC,或使HSC接觸含有HDR模板的另一個粒子來進行,其中HDR模板提供了蛋白質的正常形式或較少異常形式的表現;其中“正常的”係對於野生型來說的,並且“異常的”可以是導致病狀或疾病狀態的蛋白質表現;並且
視情況,該方法可以包括從生物體或非人類生物體分離或獲得HSC,視情況擴增HSC群體,使一個或多個粒子與HSC進行接觸以獲得修飾的HSC群體,視情況擴增修飾HSC的群體,並且視情況向生物體或非人類生物體給予修飾HSC。
在一個方面中,本發明提供了一種藉由操縱例如HSC的感興趣基因組座位中的靶序列來修飾生物體或非人類生物體之方法,例如其中感興趣的基因組座位與與異常的蛋白質表現或與疾病病狀或狀態相關聯的突變相關聯,該方法包括:遞送至HSC,例如經由使HSC與含有非天然存在或工程化的組成物的粒子接觸來進行,該組成物包含:I.(a)能夠雜交至HSC中的靶序列的指導序列,和(b)至少一種或多種同向重複序列,以及II.視情況具有一個或多個NLS的CRISPR酶,並且指導序列引導CRISPR複合物與靶序列的序列特異性結合,並且其中CRISPR複合物包含與雜交至靶序列的指導序列複合的CRISPR酶;並且
該方法可以視情況還包括遞送HDR模板,例如經由使含有HDR模板的粒子接觸HSC,或使HSC接觸含有HDR模板的另一個
粒子來進行,其中HDR模板提供了蛋白質的正常形式或較少異常形式的表現;其中“正常的”係對於野生型來說的,並且“異常的”可以是導致病狀或疾病狀態的蛋白質表現;及
視情況,該方法可以包括從生物體或非人類生物體分離或獲得HSC,視情況擴增HSC群體,使一個或多個粒子與HSC進行接觸以獲得修飾的HSC群體,視情況擴增修飾HSC的群體,並且視情況向生物體或非人類生物體給予修飾HSC。
遞送可以是對編碼CRISPR複合物中的任何一個或多個或全部的、有利地連接至用於體內表現的一個或多個調節元件的一種或多種多核苷酸的遞送,例如經由含有包含可操作地連接至一個或多個調節元件的一種或多種多核苷酸的載體的一個或多個粒子來進行。編碼CRISPR酶、指導序列、同向重複序列的多核苷酸中的任一種或全部可以是RNA。應瞭解的是,在提及是RNA且被稱為“包含”特徵此同向重複序列的多核苷酸的情況下,RNA序列包含該特徵。在多核苷酸係DNA且被稱為包含特徵此同向重複序列的情況下,DNA序列被或可以被轉錄成包含所討論特徵的RNA。在特徵係蛋白質諸如CRISPR酶的情況下,所提及的DNA或RNA序列被或可以被翻譯(並且在DNA的情況下,首先進行轉錄)。
在某些實施方式中,本發明提供了一種藉由操縱HSC的感興趣基因組座位中的靶序列來修飾生物體,例如包括人類的哺乳動物或非人類哺乳動物或生物體之方法,例如其中感興趣的基因組座位與與異常的蛋白質表現或與疾病病狀或狀態相關聯的突變相關聯,該方法包括遞送,例如經由非天然存在或工程化的
組成物與HSC的接觸來進行,其中組成物包含一個或多個粒子,該等粒子包含可操作地編碼組成物以用於對該組成物進行表現的病毒、質粒或一種或多種核酸分子載體(例如RNA),其中該組成物包含:(A)I.可操作地連接至CRISPR-Cas系統RNA多核苷酸序列的第一調節元件,其中多核苷酸序列包含(a)能夠與真核細胞中的靶序列雜交的指導序列,(b)同向重複序列,以及II.可操作地連接至編碼包含至少一個或多個核定位序列(或者如一些實施方式中的視情況至少一個或多個核定位序列可以不涉及NLS)的CRISPR酶的酶編碼序列的第二調節元件,其中(a)、(b)和(c)被佈置為5'至3'取向,其中組分I和II位於系統的相同或不同載體上,其中當轉錄時,並且指導序列引導CRISPR複合物與靶序列的序列特異性結合,並且其中CRISPR複合物包含與雜交至靶序列的指導序列複合的CRISPR酶,或(B)包含含有一種或多種載體的載體系統的非天然存在或工程化的組成物,該等載體包含I.可操作地連接至(a)能夠與真核細胞中的靶序列雜交的指導序列和(b)至少一種或多種同向重複序列的第一調節元件,II.可操作地連接至編碼CRISPR酶的酶編碼序列的第二調節元件,並且視情況,在可適用的情況下,其中組分I和II位於系統的相同或不同載體上,其中當轉錄時,並且指導序列引導CRISPR複合物與靶序列的序列特異性結合,並且其中CRISPR複合物包含與雜交至靶序列的指導序列複合的CRISPR酶;該方法可以視情況還包括遞送HDR模板,例如經由使含有HDR模板的粒子接觸HSC,或使HSC接觸含有HDR模板的另一個粒子來進行,其中HDR模板提供了蛋白質的正常形式或較少異常形式的表現;其中“正常的”係對於野生型來說的,
並且“異常的”可以是導致病狀或疾病狀態的蛋白質表現;並且視情況,該方法可以包括從生物體或非人類生物體分離或獲得HSC,視情況擴增HSC群體,使一個或多個粒子與HSC進行接觸以獲得修飾的HSC群體,視情況擴增修飾HSC的群體,並且視情況向生物體或非人類生物體給予修飾HSC。在一些實施方式中,組分I、II和III位於相同載體上。在其他實施方式中,組分I和II位於相同載體上,而組分III位於另一載體上。在其他實施方式中,組分I和III位於相同載體上,而組分II位於另一載體上。在其他實施方式中,組分II和III位於相同載體上,而組分I位於另一載體上。在其他實施方式中,組分I、II和III中的每個位於不同載體上。本發明還提供了一種如在此所述的病毒或質粒載體系統。
對於操縱靶序列,申請人還意指靶序列的表觀遺傳操縱。這可以是針對靶序列的染色質狀態的,諸如藉由對靶序列的甲基化狀態的修飾(即甲基化或甲基化圖案或CpG島的添加或移除)、組蛋白修飾、增加或降低靶序列的可及性,或藉由促進3D折疊。應瞭解的是,在提及一種藉由操縱感興趣基因組座位中的靶序列來修飾生物體或包括人類的哺乳動物或非人類哺乳動物或生物體的方法的情況下,這可適用於作為整體的生物體(哺乳動物)或僅來自該生物體的單個細胞或細胞群體(如果生物體係多細胞的)。在人類的情況下,例如,申請人尤其設想了單個細胞或細胞群體並且該等可以較佳的是進行離體修飾並且接著重新引入。在此情況下,活組織檢查或其他組織或生物流體樣品可能是必需的。就這一點而言,幹細胞也是特別較佳的。但是,當然,也設想了體內實施方式。並且本發明對於HSC是特別有利的。
在一些實施方式中本發明包括一種藉由操縱HSC中感興趣的基因組座位中的DNA雙股體的相反股上的第一靶序列和第二靶序列來修飾生物體或非人類生物體的方法,例如其中感興趣的基因組座位與與異常的蛋白質表現或與疾病病狀或狀態相關聯的突變相關聯,該方法包括遞送,例如藉由使HSC與包含非天然存在或工程化的組成物的一個或多個粒子接觸,該組成物包含:
I. 第一CRISPR-Cas(例如Cpf1)系統RNA多核苷酸序列,其中該第一多核苷酸序列包含:
(a)能夠與該第一靶序列雜交的第一指導序列,
(b)第一同向重複序列,以及
II. 第二CRISPR-Cas(例如Cpf1)系統指導RNA多核苷酸序列,其中該第二多核苷酸序列包含:
(a)能夠與該第二靶序列雜交的第二指導序列,
(b)第二同向重複序列,以及
III. 編碼包含至少一個或多個核定位序列和包含一個或多個突變的CRISPR酶的多核苷酸序列,其中(a)、(b)和(c)被佈置為5'至3'取向;或
IV. I.至III.中的一個或多個例如第一同向重複序列和第二同向重複序列、CRISPR酶的一種或多種的表現產物;
其中當轉錄時,第一指導序列和第二指導序列分別引導第一CRISPR複合物和第二CRISPR複合物與第一靶序列和第二靶序列
的序列特異性結合,其中第一CRISPR複合物包含與(1)雜交至第一靶序列的第一指導序列複合的CRISPR酶,其中第二CRISPR複合物包含與(1)雜交至第二靶序列的第二指導序列複合的CRISPR酶,其中編碼CRISPR酶的多核苷酸序列係DNA或RNA,並且其中第一指導序列引導DNA雙股體中靠近第一靶序列的一條股的切割並且第二指導序列引導靠近第二靶序列的另一條股的切割,從而誘導雙股斷裂,從而修飾生物體或非人類生物體;並且該方法可以視情況還包括遞送HDR模板,例如經由使含有HDR模板的粒子接觸HSC,或使HSC接觸含有HDR模板的另一個粒子來進行,其中HDR模板提供了蛋白質的正常形式或較少異常形式的表現;其中“正常的”係對於野生型來說的,並且“異常的”可以是導致病狀或疾病狀態的蛋白質表現;並且視情況,該方法可以包括從生物體或非人類生物體分離或獲得HSC,視情況擴增HSC群體,使一個或多個粒子與HSC進行接觸以獲得修飾的HSC群體,視情況擴增修飾HSC的群體,並且視情況向生物體或非人類生物體給予修飾HSC。在本發明的一些方法中,編碼CRISPR酶的多核苷酸序列、第一指導序列和第二指導序列、第一同向重複序列和第二同向重複序列中的任一種或全部。在本發明的另外實施方式中,編碼編碼CRISPR酶的序列的多核苷酸序列、第一指導序列和第二指導序列、第一同向重複序列和第二同向重複序列係RNA並且經由脂質體、奈米粒子、外來體、微泡或基因槍來遞送;但是,有利的是遞送經由粒子來遞送。在本發明的某些實施方式中,第一同向重複序列和第二同向重複序列享有100%一致性。在一些實施方式中,多核苷酸可以被包含在包含一種或多種載體的載體系統之內。在
較佳的實施方式中,第一CRISPR酶具有一個或多個突變,使得該酶係互補股切口酶,並且第二CRISPR酶具有一個或多個突變,使得該酶係非互補股切口酶。可替代地,第一酶可以是非互補股切口酶,並且第二酶可以是互補股切口酶。在本發明的較佳的方法中,引導DNA雙股體中的靠近第一靶序列的一條股的切割的第一指導序列和引導靠近第二靶序列的另一條股的切割的第二指導序列使得5'突出端產生。在本發明的實施方式中,5'突出端具有至多200個鹼基對,較佳的是至多100個鹼基對或更較佳的是至多50個鹼基對。在本發明的實施方式中,5'突出端具有至少26個鹼基對,較佳的是至少30個鹼基對或更較佳的是至少34-50個鹼基對。
在一些實施方式中本發明包括一種藉由操縱例如HSC中感興趣的基因組座位中的DNA雙股體的相反股上的第一靶序列和第二靶序列來修飾生物體或非人類生物體的方法,例如其中感興趣的基因組座位與與異常的蛋白質表現或與疾病病狀或狀態相關聯的突變相關聯,該方法包括遞送,例如藉由使HSC與包含非天然存在或工程化的組成物的一個或多個粒子接觸,該組成物包含:
I. 可操作地連接至
(a)能夠與該第一靶序列雜交的第一指導序列,以及
(b)至少一種或多種指導重複序列的第一調節元件,
II. 可操作地連接至
(a)能夠與該第二靶序列雜交的第二指導序列,以及
(b)至少一種或多種指導重複序列的第一調節元件,
III. 可操作地連接至編碼CRISPR酶(例如Cpf1)的酶編碼序列的第三調節元件,以及
V. I.至IV.中的一個或多個例如第一同向重複序列和第二同向重複序列、CRISPR酶的一種或多種的表現產物;
其中組分I、II、III和IV位於系統的相同或不同載體上,當轉錄時,第一指導序列和第二指導序列分別引導第一CRISPR複合物和第二CRISPR複合物與第一靶序列和第二靶序列的序列特異性結合,其中第一CRISPR複合物包含與(1)雜交至第一靶序列的第一指導序列複合的CRISPR酶,其中第二CRISPR複合物包含與雜交至第二靶序列的第二指導序列複合的CRISPR酶,其中編碼CRISPR酶的多核苷酸序列係DNA或RNA,並且其中第一指導序列引導DNA雙股體中靠近第一靶序列的一條股的切割並且第二指導序列引導靠近第二靶序列的另一條股的切割,從而誘導雙股斷裂,從而修飾生物體或非人類生物體;並且該方法可以視情況還包括遞送HDR模板,例如經由使含有HDR模板的粒子接觸HSC,或使HSC接觸含有HDR模板的另一個粒子來進行,其中HDR模板提供了蛋白質的正常形式或較少異常形式的表現;其中“正常的”係對於野生型來說的,並且“異常的”可以是導致病狀或疾病狀態的蛋白質表現;並且視情況,該方法可以包括從生物體或非人類生物體分離或獲得HSC,視情況擴增HSC群體,使一個或多個粒子與HSC進行接觸以獲得修飾的HSC群體,視情況擴增修飾HSC的群體,並且視情況向生物體或非人類生物體給予修飾HSC。
本發明還提供了一種如在此所述的載體系統。該系統可以包含一個、兩個、三個或四個不同載體。組分I、II、III和IV可以因此位於一個、兩個、三個或四個不同載體上,並且在此設想了可能的組分位置的所有組合,例如:組分I、II、III和IV可以位於同一載體上;組分I、II、III和IV可以各自位於不同載體上;組分I、II、III和IV可以位於總共兩個或三個不同載體上,包括設想的所有位置組合等。在本發明的一些方法中,編碼CRISPR酶的多核苷酸序列、第一指導序列和第二指導序列、第一同向重複序列和第二同向重複序列中的任一種或全部是RNA。在本發明的另外實施方式中,第一同向重複序列和第二同向重複序列享有100%一致性。在較佳的實施方式中,第一CRISPR酶具有一個或多個突變,使得該酶係互補股切口酶,並且第二CRISPR酶具有一個或多個突變,使得該酶係非互補股切口酶。另選地,第一酶可以是非互補股切口酶,並且第二酶可以是互補股切口酶。在本發明的另一個實施方式中,病毒載體中的一個或多個經由脂質體、奈米粒子、外來體、微泡或基因槍來遞送;但是,粒子遞送係有利的。
在本發明的較佳的方法中,引導DNA雙股體中的靠近第一靶序列的一條股的切割的第一指導序列和引導靠近第二靶序列的另一條股的切割的第二指導序列使得5'突出端產生。在本發明的實施方式中,5'突出端具有至多200個鹼基對,較佳的是至多100個鹼基對或更較佳的是至多50個鹼基對。在本發明的實施方式中,5'突出端具有至少26個鹼基對,較佳的是至少30個鹼基對或更較佳的是至少34-50個鹼基對。
在一些實施方式中本發明包括一種藉由以下方式來修飾例如HSC中的感興趣的基因組座位的方法:例如其中感興趣的基因組座位與與異常的蛋白質表現或與疾病病狀或狀態相關聯的突變相關聯,藉由將該突變引入到HSC中,例如藉由使HSC與包含具有一個或多個突變的Cas蛋白和分別靶向HSC中的DNA分子的第一條股和第二條股的兩個指導RNA的一個或多個粒子接觸,由此指導RNA靶向DNA分子並且Cas蛋白切口DNA分子的第一條股和第二條股中的每條,由此HSC中的靶標被改變;並且,其中Cas蛋白和兩個指導RNA並不是同時天然存在的並且該方法可以視情況還包括遞送HDR模板,例如經由使含有HDR模板的粒子接觸HSC,或使HSC接觸含有HDR模板的另一個粒子來進行,其中HDR模板提供了蛋白質的正常形式或較少異常形式的表現;其中“正常的”係對於野生型來說的,並且“異常的”可以是導致病狀或疾病狀態的蛋白質表現;並且視情況,該方法可以包括從生物體或非人類生物體分離或獲得HSC,視情況擴增HSC群體,使一個或多個粒子與HSC進行接觸以獲得修飾的HSC群體,視情況擴增修飾HSC的群體,並且視情況向生物體或非人類生物體給予修飾HSC。在本發明的較佳的方法中,Cas蛋白切口DNA分子的第一條股和第二條股中的每條使得5'突出端產生。在本發明的實施方式中,5'突出端具有至多200個鹼基對,較佳的是至多100個鹼基對或更較佳的是至多50個鹼基對。在本發明的實施方式中,5'突出端具有至少26個鹼基對,較佳的是至少30個鹼基對或更較佳的是至少34-50個鹼基對。在本發明的一個方面中,Cas蛋白被密碼子優化為在真核細胞,較佳的是哺乳動物細胞或人類細胞中表現。本發明
的方面涉及被減少的基因產物或被進一步引入到編碼基因產物的DNA分子中的模板多核苷酸或藉由允許兩個5’突出端重新退火並連接而被精確切斷的間插序列的表現、或被改變的基因產物的活性或功能、或被增加的基因產物的表現。在本發明的一個實施方式中,基因產物係蛋白質。
在一些實施方式中本發明包括一種藉由以下方式來修飾例如HSC中感興趣的基因組座位之方法:例如其中感興趣的基因組座位與與異常的蛋白質表現或與疾病病狀或狀態相關聯的突變相關聯,藉由將該突變引入到HSC中,例如藉由使HSC與包含下項的一個或多個粒子接觸:
a)可操作地連接至分別靶向HSC的雙股DNA分子的第一條股和第二條股的兩個CRISPR-Cas系統指導RNA中的每個的第一調節元件,以及
b)可操作地連接至Cas(例如Cpf1)蛋白的第二調節元件,或
c)a)或b)的一種或多種表現產物,
其中組分(a)和(b)位於系統的相同或不同載體上,由此指導RNA靶向HSC的DNA分子並且Cas蛋白切口HSC中的DNA分子的第一條股和第二條股中的每條;並且其中Cas蛋白和兩個指導RNA並不同時天然存在;並且該方法可以視情況還包括遞送HDR模板,例如經由使含有HDR模板的粒子接觸HSC,或使HSC接觸含有HDR模板的另一個粒子來進行,其中HDR模板提供了蛋白質的
正常形式或較少異常形式的表現;其中“正常的”係對於野生型來說的,並且“異常的”可以是導致病狀或疾病狀態的蛋白質表現;並且視情況,該方法可以包括從生物體或非人類生物體分離或獲得HSC,視情況擴增HSC群體,使一個或多個粒子與HSC進行接觸以獲得修飾的HSC群體,視情況擴增修飾HSC的群體,並且視情況向生物體或非人類生物體給予修飾HSC。在本發明的方面中,指導RNA可以包含融合至同向重複序列的指導序列。本發明的方面涉及被減少的基因產物或被進一步引入到編碼基因產物的DNA分子中的模板多核苷酸或藉由允許兩個5’突出端重新退火並連接而被精確切斷的間插序列的表現、或被改變的基因產物的活性或功能、或被增加的基因產物的表現。在本發明的一個實施方式中,基因產物係蛋白質。在本發明的較佳的實施方式中,系統的載體係病毒載體。在另一個實施方式中,系統的載體經由脂質體、奈米粒子、外來體、微泡或基因槍來遞送;並且粒子係較佳的。在一個方面中,本發明提供了一種修飾HSC中的靶多核苷酸的方法。在一些實施方式中,該方法包括使得CRISPR複合物結合靶多核苷酸來實施所述靶多核苷酸的切割,從而修飾該靶多核苷酸,其中該CRISPR複合物包含與雜交至所述靶多核苷酸內的靶序列的指導序列複合的CRISPR酶,其中所述指導序列連接至同向重複序列。在一些實施方式中,所述切割包括藉由所述CRISPR酶切割靶序列的位置處的一條或兩條股。在一些實施方式中,所述切割使得靶基因的轉錄減少。在一些實施方式中,該方法進一步包括使用外源性模板多核苷酸藉由同源重組修復所述切割的靶多核苷酸,其中所述修復產生包括所述靶多核苷酸的一個或多個核苷酸的插入、
缺失或取代的突變。在一些實施方式中,所述突變使得由包含靶序列的基因表現的蛋白質中發生一個或多個胺基酸的變化。在一些實施方式中,該方法進一步包括例如經由一個或多個粒子將一個或多個載體或其一種或多種表現產物遞送至例如所述HSC,其中一個或多個載體驅動以下項中的一個或多個的表現:CRISPR酶、連接至同向重複序列的指導序列。在一些實施方式中,所述載體被遞送至受試者中的例如HSC。在一些實施方式中,所述修飾發生在細胞培養中的所述HSC中。在一些實施方式中,該方法進一步包括在所述修飾之前將所述HSC從受試者分離。在一些實施方式中,該方法進一步包括將所述HSC和/或衍生自其的細胞返回至所述受試者。
在一個方面中,本發明提供了一種產生例如包含突變型疾病相關基因的HSC之方法。在一些實施方式中,疾病相關基因係與患病或發展病的風險的增加相關聯的任何基因。在一些實施方式中,該方法包括(a)例如經由一個或多個粒子將一種或多種載體或其一種或多種表現產物遞送至HSC中,其中一種或多種載體驅動以下項中的一個或多個的表現:CRISPR酶、連接至同向重複序列的指導序列。並且(b)使得CRISPR複合物結合靶多核苷酸以實施所述疾病相關基因內的靶多核苷酸的切割,其中CRISPR複合物包含與雜交至靶多核苷酸內的靶序列的指導序列複合的CRISPR酶,並且視情況,在可適用的情況下,從而產生包含突變型疾病相關基因的HSC。在一些實施方式中,所述切割包括藉由所述CRISPR酶切割靶序列的位置處的一條或兩條股。在一些實施方式中,所述切割使得靶基因的轉錄減少。在一些實施方
式中,該方法進一步包括使用外源性模板多核苷酸藉由同源重組修復所述切割的靶多核苷酸,其中所述修復產生包括所述靶多核苷酸的一個或多個核苷酸的插入、缺失或取代的突變。在一些實施方式中,所述突變使得來自包含靶序列的基因的蛋白質表現發生一個或多個胺基酸的變化。在一些實施方式中,修飾HSC被給予至動物以由此產生動物模型。
在一個方面中,本發明提供了修飾例如HSC中的靶多核苷酸的方法。在一些實施方式中,該方法包括使得CRISPR複合物結合靶多核苷酸來實施所述靶多核苷酸的切割,從而修飾該靶多核苷酸,其中該CRISPR複合物包含與雜交至所述靶多核苷酸內的靶序列的指導序列複合的CRISPR酶,其中所述指導序列連接至同向重複序列。在其他實施方式中,本發明提供了一種修飾多核苷酸在來自例如HSC的真核細胞中的表現之方法。該方法包括藉由使用結合HSC中的多核苷酸的CRISPR複合物增加或減少靶多核苷酸的表現;有利的是CRISPR複合物經由一個或多個粒子遞送。
在一些方法中,靶多核苷酸可以被失活以實施方式如HSC中表現的修飾。例如,在CRISPR複合物與細胞中的靶序列結合後,靶多核苷酸失活,這樣使得該序列不被轉錄,該編碼蛋白不被產生,或者該序列不會像野生型序列一樣起作用。
在一些實施方式中,CRISPR-Cas系統的RNA,例如指導RNA或gRNA可以被修飾;例如以包含適配體或功能結構域。適配體係一種結合特異性靶分子的合成寡核苷酸;例如,已經藉由重複數輪的體外選擇或SELEX(指數富集配位基系統進化法)被
工程化為結合不同分子的核苷酸分子靶向諸如小分子、蛋白質、核酸以及甚至細胞、組織和生物體。適配體係有用的,因為它們提供比得上抗體的分子識別特性。除了其區分識別之外,適配體提供了超過抗體的優勢,包括它們在治療性應用中幾乎不或不引發免疫原性。因此,在本發明的實踐中,酶或RNA中的任一者或兩者可以包含功能結構域。
在一些實施方式中,功能結構域係轉錄啟動結構域,較佳的是VP64。在一些實施方式中,功能結構域係轉錄阻遏結構域,較佳的是KRAB。在一些實施方式中,轉錄阻遏結構域係SID或SID的串聯體(例如SID4X)。在一些實施方式中,功能結構域係表觀遺傳修飾結構域,以便提供表觀遺傳修飾酶。在一些實施方式中,功能結構域係啟動結構域,它可以是P65啟動結構域。在一些實施方式中,功能結構域包括核酸酶活性。在一個此實施方式中,功能結構域包括Fok1。
本發明還提供了一種包含以上所述的或來自任一以上所述方法的修飾CRISPR酶、組成物、系統或複合物中的任一種的體外或離體細胞。細胞可以是真核細胞或原核細胞。本發明還提供了此類細胞的子代。本發明還提供了一種任何此細胞或任一此子代的產物,其中該產物係如藉由CRISPR複合物的修飾CRISPR酶修飾的所述一個或多個靶座位的產物。產物可以是肽、多肽或蛋白質。一些此類產物可以藉由CRISPR複合物的修飾CRISPR酶來修飾。在一些此類修飾產物中,靶座位的產物物理上不同於未經所述修飾CRISPR酶修飾的所述靶座位的產物。
本發明還提供了一種包含編碼以上所述的任一非天然存在的CRISPR酶的多核苷酸序列的多核苷酸分子。
任一此多核苷酸可以進一步包含可操作地連接至編碼非天然存在的CRISPR酶的多核苷酸序列的一個或多個調節元件。
在包含一個或多個調節元件的任一此多核苷酸中,一個或多個調節元件可以被可操作地構造成用於非天然存在的CRISPR酶在真核細胞中的表現。真核細胞可以是人類細胞。真核細胞可以是齧齒動物細胞,視情況小鼠細胞。真核細胞可以是酵母細胞。真核細胞可以是中國倉鼠卵巢(CHO)細胞。真核細胞可以是昆蟲細胞。
在包含一個或多個調節元件的任一此多核苷酸中,一個或多個調節元件可以被可操作地構造成用於非天然存在的CRISPR酶在原核細胞中的表現。
在包含一個或多個調節元件的任一此多核苷酸中,一個或多個調節元件可以被可操作地構造成用於非天然存在的CRISPR酶在體外系統中的表現。
本發明還提供了一種包含任一上述多核苷酸分子的表現載體。本發明還提供了此或此類核苷酸分子例如被可操作地構造成用於表現蛋白質的此類多核苷酸分子,和/或一種或多種核酸組分,以及此或此類載體。
本發明進一步提供了一種使Cas(例如Cpf1)形成突
變或形成突變或修飾的Cas(例如Cpf1)之方法,該突變或修飾的Cas(例如Cpf1)係如在此所述的根據本發明的CRISPR酶的異種同源物,該方法包括確定使得異種同源物可以緊密接近或可以觸及核酸分子,例如DNA、RNA、gRNA等的一個或多個胺基酸,和/或類似於或對應於如在此所述的根據本發明的CRISPR酶中的在此鑒定的一個或多個胺基酸的一個或多個胺基酸,和合成或製備或表現包含下項、由或基本由下項組成的異種同源物:一個或多個修飾和/或一個或多個突變,或如在此所討論的進行突變例如將中性胺基酸修飾例如改變或突變為帶電荷的例如帶正電荷的胺基酸,例如由丙胺酸變為例如賴胺酸。此修飾異種同源物可以用於CRISPR-Cas系統中;並且表現此修飾異種同源物的一個或多個核酸分子可以用於遞送編碼如在此所討論的CRISPR-Cas系統組分的分子的載體或其他遞送系統中。
在一個方面中,本發明提供了有效中靶活性並且最小化脫靶活性。在一個方面中,本發明提供了由CRISPR蛋白進行的有效中靶切割並且最小化由CRISPR蛋白進行的脫靶切割。在一個方面中,本發明提供了在無DNA切割情況下CRISPR蛋白在基因座位處的特異性結合。在一個方面中,本發明提供了CRISPR蛋白在基因座位處的有效的指導序列引導的中靶結合並且最小化CRISPR蛋白的脫靶結合。因此,在一個方面中,本發明提供了靶特異性基因調節。在一個方面中,本發明提供了在無DNA切割情況下CRISPR酶在基因座位處的特異性結合。因此,在一個方面中,本發明使用單一CRISPR酶提供一個基因座位處的切割和不同基因座位處的基因調節。在一個方面中,本發明使用一種或多種
CRISPR蛋白和/或酶提供多個靶標的正交啟動和/或抑制和/或切割。
在另一個方面中,本發明提供了一種功能性篩選離體或體內細胞庫中的基因組中基因之方法,該方法包括給予或表現包含多個CRISPR-Cas系統指導RNA(gRNA)的文庫並且其中該篩選進一步包括CRISPR酶的使用,其中CRISPR複合物被修飾成包含異源功能結構域。在一個方面中,本發明提供了一種用於篩選基因組之方法,該方法包括向宿主給予文庫或者在宿主體內表現文庫。在一方面中,本發明提供了一種如在此討論之方法,該方法進一步包括向宿主給予活化物或在宿主中表現活化物。在一方面中,本發明提供了如在此所討論之方法,其中該活化物附接至CRISPR蛋白。在一方面中,本發明提供了如在此所討論之方法,其中該活化物附接至CRISPR蛋白的N末端或C末端。在一方面中,本發明提供了如在此所討論之方法,其中該活化物附接至gRNA環。在一方面中,本發明提供了一種如在此討論之方法,該方法進一步包括向宿主給予阻遏劑或在宿主中表現阻遏劑。在一方面中,本發明提供了如在此所討論之方法,其中該篩選包括影響並檢測基因啟動、基因抑制或座位中的切割。
在一個方面中,本發明提供了如在此所討論之方法,其中該宿主係真核細胞。在一方面中,本發明提供了如在此所討論之方法,其中該宿主係哺乳動物細胞。在一方面中,本發明提供了如在此所討論之方法,其中該宿主係非人類真核細胞。在一方面中,本發明提供了如在此所討論之方法,其中該非人類真核
細胞係非人類哺乳動物細胞。在一方面中,本發明提供了如在此所討論之方法,其中非人類哺乳動物細胞可以是包括但不限於,靈長類動物、牛、羊、豬類、犬、齧齒動物、兔科諸如猴、母牛、綿羊、豬、狗、兔、大鼠或小鼠的細胞。在一方面中,本發明提供了如在此所討論之方法,該細胞可以是非哺乳動物真核細胞諸如家禽鳥類(例如雞)、脊椎動物魚(例如鮭魚)或甲殼類動物(例如牡蠣、蛤、龍蝦、蝦)的細胞。在一個方面中,本發明提供了如在此所討論之方法,該非人類真核細胞係植物細胞。植物細胞可以是單子葉植物或雙子葉植物具有的細胞或栽培植物或糧食植物諸如木薯、玉米、高粱、大豆、小麥、燕麥或稻具有的細胞。植物細胞還可以是藻類、樹或生產植物、果實或蔬菜(例如,樹類諸如柑橘樹,例如桔子樹、葡萄柚樹或檸檬樹;桃樹或油桃樹;蘋果樹或梨樹;堅果樹諸如杏樹或核桃樹或阿月渾子樹;茄屬植物;芸苔屬植物;萵苣屬植物;菠菜屬植物;辣椒屬植物;棉花、煙草、蘆筍、胡蘿蔔、甘藍、青花菜、花椰菜、番茄、茄子、胡椒、萵苣、菠菜、草莓、藍莓、覆盆子、黑莓、葡萄、咖啡、可可等)具有的細胞。
在一方面中,本發明提供了如在此所討論之方法,該方法包括遞送CRISPR-Cas複合物或其一種或多種組分或對其編碼的一個或多個核酸分子,其中所述一個或多個核酸分子可操作地連接至一種或多種調節序列並且在體內表現。在一方面中,本發明提供了如在此所討論之方法,其中該體內表現係經由慢病毒、腺病毒或AAV。在一個方面中,本發明提供了如在此所討論之方法,其中該遞送係經由粒子、奈米粒子、脂質或細胞穿透肽(CPP)。
在特定的實施方式中,將CRISPR-Cas複合物靶向葉綠體可能是感興趣的。在許多情況下,此靶向可以是藉由稱為葉綠體轉運肽(CTP)或質體轉運肽的N末端延伸的存在來實現的。如果表現的多肽將要在植物質粒(例如葉綠體)中區室化,則來自細菌來源的染色體轉基因必須具有融合至編碼表現多肽的序列的編碼CTP序列的序列。因此,將外源性多肽定位至葉綠體常常藉由將編碼CTP序列的多核苷酸序列可操作地連接至編碼外源性多肽的多核苷酸的5'區來實現。在易位到葉綠體中的過程中,在處理步驟中去除CTP。然而,處理效率可以受CTP的胺基酸序列和肽的NH2末端處的附近序列影響。已被描述用於靶向至葉綠體的其他選擇係玉米cab-m7信號序列(美國專利7,022,896、WO 97/41228)、豌豆麩胱甘肽還原酶信號序列(WO 97/41228)以及US2009029861中描述的CTP。
在一方面中,本發明提供了一對CRISPR-Cas複合物,每個複合物包含含有能夠與細胞中的感興趣的基因組座位中的靶序列雜交的指導序列的指導RNA(gRNA),其中每個sgRNA的至少一個環係藉由插入結合一種或多種轉接蛋白的一種或多種不同RNA序列來修飾的,並且其中該轉接蛋白與一個或多個功能結構域締合,其中每個CRISPR-Cas的每個gRNA包含具有DNA切割活性的功能結構域。在一個方面中,本發明提供了如在此所討論的成對的CRISPR-Cas複合物,其中DNA切割活性係歸因於Fok1核酸酶。
在一個方面中,本發明提供了一種用於切割感興趣的
基因組座位中的靶序列之方法,該方法包括向細胞遞送CRISPR-Cas複合物或其一種或多種組分或對其編碼的一個或多個核酸分子,其中所述一個或多個核酸分子可操作地連接至一個或多個調節序列並且在體內表現。在一方面中,本發明提供了如在此所討論之方法,其中該遞送係經由慢病毒、腺病毒或AAV。在一方面中,本發明提供了如在此所討論之方法或如在此所討論的成對的CRISPR-Cas複合物,其中該對中的第一複合物的靶序列係處於雙股DNA的第一條股上並且該對中的第二複合物的靶序列係處於雙股DNA的第二條股上。在一方面中,本發明提供了如在此所討論之方法或如在此所討論的成對的CRISPR-Cas複合物,其中該第一複合物和該第二複合物的靶序列彼此接近,使得DNA以促進同源定向修復的方式切割。在一方面中,一種在此的方法可以進一步包括將模板DNA引入到細胞中。在一個方面中,一種在此的方法或者在此的成對的CRISPR-Cas複合物可以涉及其中每個CRISPR-Cas複合物具有CRISPR酶,該CRISPR酶被突變為使得它具有不超過未突變CRISPR酶的核酸酶活性的約5%的核酸酶活性。
在一個方面中,本發明提供了一種如在此所討論的文庫、方法或複合物,其中gRNA被修飾為具有至少一個非編碼功能環,例如其中該至少一個非編碼功能環是具有阻遏作用的;例如,其中該至少一個非編碼功能環包含Alu。
在一個方面中,本發明提供了一種用於改變或修飾基因產物的表現之方法。所述方法可以包括將工程化的非天然存在的CRISPR-Cas系統引入到含有並表現編碼基因產物的DNA分子
的細胞中,該CRISPR-Cas系統包含Cas蛋白和靶向DNA分子的指導RNA,由此該指導RNA靶向編碼基因產物的DNA分子並且該Cas蛋白切割編碼該基因產物的DNA分子,由此改變該基因產物的表現;並且其中Cas蛋白和指導RNA並不同時天然存在。本發明進一步包括密碼子優化為在真核細胞中表現的Cas蛋白。在一較佳的實施方式中,真核細胞係哺乳動物細胞,並且在一更較佳的實施方式中,哺乳動物細胞係人類細胞。在本發明的另一個實施方式中,基因產物的表現減少。
在一方面中,本發明提供了改變的細胞和那些細胞的子代,以及由該等細胞產生的產物。本發明的CRISPR-Cas(例如Cpf1)蛋白和系統用於產生包含修飾的靶座位的細胞。在一些實施方式中,該方法可以包括使得核酸靶向複合物結合靶DNA或RNA來實施所述靶DNA或RNA的切割,從而修飾該靶DNA或RNA,其中該核酸靶向複合物包含與雜交至所述靶DNA或RNA內的靶序列的指導RNA複合的核酸靶向效應蛋白。在一個方面中,本發明提供了一種修復細胞中的遺傳座位的方法。在另一個方面中,本發明提供了一種修飾DNA或RNA在真核細胞中的表現的方法。在一些實施方式中,該方法包括使得核酸靶向複合物結合DNA或RNA,以使得所述結合導致所述DNA或RNA的表現增加或減少;其中該核酸靶向複合物包含與指導RNA複合的核酸靶向效應蛋白。類似的考慮因素和條件適用如上文針對修飾靶DNA或RNA的方法。實際上,該等取樣、培養和重新引入選擇跨本發明的多個方面而適用。在一個方面中,本發明提供了修飾真核細胞中的靶DNA或RNA的方法,該等方法可以是在體內、離
體或在體外。在一些實施方式中,該方法包括從人類或非人類動物取樣細胞或細胞群體,並且修飾該細胞或該等細胞。培養可以發生在離體的任何階段。此類細胞可以是但不限於植物細胞、動物細胞、任何生物體的特定細胞類型,包括幹細胞、免疫細胞、T細胞、B細胞、樹突細胞、心血管細胞、上皮細胞、幹細胞等。細胞可以根據本發明進行修飾以產生例如受控量的基因產物,該等受控量可以是增加的或減少的,這取決於用途,並且/或者發生突變。在某些實施方式中,細胞的基因組座位被修復。該細胞或該等細胞甚至可以被重新引入非人類動物或植物中。對於重新引入的細胞,可以較佳的是該等細胞係幹細胞。
在一方面中,本發明提供了暫態包含CRISPR系統或組分的細胞。例如,CRISPR蛋白或酶和核酸被暫態提供給細胞並且基因組座位被改變,然後CRISPR系統的一種或多種組分的量進行衰減。隨後,獲得了CRISPR介導的遺傳改變的細胞、該等細胞子代以及包含該等細胞的生物體包含減少量的一種或多種CRISPR系統組分,或者不再含有該等一種或多種CRISPR系統組分。一非限制性實例係諸如在此進一步描述的自失活的CRISPR-Cas系統。因此,本發明提供了包含一種或多種CRISPR-Cas系統改變的遺傳座位,但基本上缺乏一種或多種CRISPR系統組分的細胞和生物體,以及該等細胞和生物體的子代。在某些實施方式中,CRISPR系統組分係基本上不存在的。此類細胞、組織和生物體有利地包含所希望的或所選擇的遺傳改變,但是喪失了潛在地可能起非特異性作用、產生安全問題或妨礙監管審批的CRISPR-Cas組分或其剩餘部分。同樣,本發明提供了由細
胞、生物體以及細胞和生物體的子代產生的產物。
誘導型Cpf1 CRISPR-Cas系統(“拆分的-Cpf1”)
在一方面中,本發明提供了一種非天然存在或工程化的誘導型Cpf1 CRISPR-Cas系統,該系統包含:
附接至誘導型二聚體的第一半部的第一Cpf1融合構建體,以及
附接至誘導型二聚體的第二半部的第二Cpf1融合構建體,
其中第一Cpf1融合構建體被可操作地連接至一個或多個核定位信號,
其中第二Cpf1融合構建體被可操作地連接至一個或多個核輸出信號,
其中與誘導物能量源的接觸使得誘導型二聚體的第一半部和第二半部合在一起,
其中使誘導型二聚體的第一半部和第二半部合在一起允許第一Cpf1融合構建體和第二Cpf1融合構建體組成功能性Cpf1 CRISPR-Cas系統,
其中Cpf1 CRISPR-Cas系統包含含有能夠與細胞中的感興趣的基因組座位中的靶序列雜交的指導序列的指導RNA(gRNA),並且
其中功能性Cpf1 CRISPR-Cas系統結合靶序列並且視情況編輯基因組座位以改變基因表現。
在本發明的一個方面中,在誘導型Cpf1 CRISPR-Cas系統中,誘導型二聚體係或包含誘導型異源二聚體或基本上由或由該誘導型異源二聚體組成。在一個方面中,在誘導型Cpf1 CRISPR-Cas系統中,誘導型異源二聚體的第一半部或第一部分或第一片段係或包含FKBP(視情況FKBP12)或由或基本上由該FKBP組成。在本發明的一個方面中,在誘導型Cpf1 CRISPR-Cas系統中,誘導型異源二聚體的第二半部或第二部分或第二片段係或包含FRB或由或基本上由該FRB組成。在本發明的一個方面中,在誘導型Cpf1 CRISPR-Cas系統中,第一Cpf1融合構建體的安排係或包含N'末端Cpf1部分-FRB-NES或由或基本上由該N'末端Cpf1部分-FRB-NES組成。在本發明的一個方面中,在誘導型Cpf1 CRISPR-Cas系統中,第一Cpf1融合構建體的安排係或包含NES-N'末端Cpf1部分-FRB-NES或由或基本上由該NES-N'末端Cpf1部分-FRB-NES組成。在本發明的一個方面中,在誘導型Cpf1 CRISPR-Cas系統中,第二Cpf1融合構建體的安排係或包含C'末端Cpf1部分-FKBP-NLS或基本上由或由該C'末端Cpf1部分-FKBP-NLS組成。在一個方面中,本發明提供了誘導型Cpf1 CRISPR-Cas系統,第二Cpf1融合構建體的安排係或包含NLS-C'末端Cpf1部分-FKBP-NLS或由或基本上由該NLS-C'末端Cpf1部分-FKBP-NLS組成。在一個方面中,在誘導型Cpf1 CRISPR-Cas系統中,可以存在將Cpf1部分與誘導型二聚體的半部或部分或片段分開的接頭。在一個方面中,在誘導型Cpf1 CRISPR-Cas系統中,誘導物能量源係或包含雷帕黴素或基本上由或由雷帕黴素組成。在一個方面中,在誘導型Cpf1 CRISPR-Cas系統中,誘
導型二聚體係誘導型同源二聚體。在一個方面中,在誘導型Cpf1 CRISPR-Cas系統中,Cpf1係FnCpf1。在一個方面中,在誘導型Cpf1 CRISPR-Cas系統中,一個或多個功能結構域與Cpf1的一部分或兩部分締合,例如功能結構域視情況包括轉錄活化物、轉錄因子(transcriptional)或核酸酶諸如Fok1核酸酶。在一個方面中,在誘導型Cpf1 CRISPR-Cas系統中,功能性Cpf1 CRISPR-Cas系統結合靶序列並且酶係無效Cpf1,該無效Cpf1視情況與不具有至少一個突變的Cpf1相比具有至少97%或100%減弱的核酸酶活性(或不超過3%且有利地0%核酸酶活性)。本發明進一步包括並且本發明的一個方面提供了編碼如在此所討論的誘導型Cpf1 CRISPR-Cas系統的多核苷酸。
在一個方面中,本發明提供了一種用於遞送第一Cpf1融合構建體的載體,根據如在此所討論的,該第一Cpf1融合構建體被附接至誘導型二聚體的第一半部或部分或片段並且可操作地連接至一個或多個核定位信號。在一方面中,本發明提供了一種用於遞送第二Cpf1融合構建體的載體,該第二Cpf1融合構建體被附接至誘導型二聚體的第二半部或部分或片段並且可操作地連接至一個或多個核輸出信號。
在一方面中,本發明提供了一種用於遞送以下兩者的載體:第一Cpf1融合構建體,如在此所討論的,該第一Cpf1融合構建體被附接至誘導型二聚體的第一半部或部分或片段並且可操作地連接至一個或多個核定位信號;以及第二Cpf1融合構建體,如在此所討論的,該第二Cpf1融合構建體被附接至誘導型
二聚體的第二半部或部分或片段並且可操作地連接至一個或多個核輸出信號。
在一方面中,載體可以是單一質粒或表現盒。
在一方面中,本發明提供了一種用在此所討論的或表現如在此所討論的誘導型Cpf1 CRISPR-Cas系統的任一載體轉化的真核宿主細胞或細胞系。
在一方面中,本發明提供了一種用在此所討論的或表現在此所討論的誘導型Cpf1 CRISPR-Cas系統的任一載體轉化的轉基因生物體,或它們的子代。在一個方面中,本發明提供了一種組成型地表現如在此所討論的誘導型Cpf1 CRISPR-Cas系統的模型生物體。
在一方面中,本發明提供了非天然存在或工程化的誘導型Cpf1 CRISPR-Cas系統,該系統包含:
附接至誘導型異源二聚體的第一半部的第一Cpf1融合構建體,以及
附接至誘導型異源二聚體的第二半部的第二Cpf1融合構建體,
其中第一Cpf1融合構建體被可操作地連接至一個或多個核定位信號,
其中第二CPf1融合構建體被可操作地連接至核輸出信號,
其中與誘導物能量源的接觸使得誘導型異源二聚體的第一
半部和第二半部合在一起,
其中使誘導型異源二聚體的第一半部和第二半部合在一起允許第一Cpf1融合構建體和第二Cpf1融合構建體組成功能性Cpf1 CRISPR-Cas系統,
其中Cpf1 CRISPR-Cas系統包含含有能夠與細胞中的感興趣的基因組座位中的靶序列雜交的指導序列的指導RNA(gRNA),並且
其中功能性Cpf1 CRISPR-Cas系統編輯基因組座位以改變基因表現。
在一方面中,本發明提供了一種治療有需要的受試者的方法,該方法包括藉由用如在此所討論的多核苷酸或在此討論的任一載體轉化受試者來誘導基因編輯,並且向受試者給予誘導物能量源。本發明包括此多核苷酸或載體在藥物,例如用於治療受試者的此藥物的製造中,或用於治療受試者的此方法之用途。本發明包括在治療有需要的受試者的方法中使用的如在此所討論的多核苷酸或在此所討論的任一載體,該方法包括誘導基因編輯,其中該方法進一步包括向受試者給予誘導物能量源。在一個方面中,在該方法中,還提供了修復模板,例如藉由包含所述修復模板的載體來遞送。
本發明還提供了一種治療有需要的受試者之方法,該方法包括藉由用在此所討論的多核苷酸或在此所討論的任一載體轉化受試者來誘導轉錄啟動或阻遏,其中所述多核苷酸或
載體編碼或包含催化失活的Cpf1和如在此所討論的一個或多個締合的功能結構域;該方法進一步包括向受試者給予誘導物能量源。本發明還提供了在治療有需要的受試者的方法中使用的在此所討論的多核苷酸或在此所討論的任一載體,該方法包括誘導轉錄啟動或阻遏,其中該方法進一步包括向受試者給予誘導物能量源。
因此,本發明尤其包括同源二聚體以及異源二聚體、例如藉由突變產生的無效Cpf1或基本上不具有核酸酶活性的Cpf1、其中存在一個或多個NLS和/或一個或多個NES的系統或複合物;連接至拆分Cpf1的一個或多個功能結構域;包括治療方法的方法,以及用途。
應瞭解的是,在此提及Cpf1、Cpf1蛋白或Cpf1酶的情況下,這包括本發明的拆分Cpf1。在一個方面中,本發明提供了一種用於改變或修飾基因產物的表現的方法。所述方法可以包括將工程化的非天然存在的Cpf1 CRISPR-Cas系統引入到含有並表現編碼基因產物的DNA分子的細胞中,該Cpf1 CRISPR-Cas系統包含Cpf1蛋白和靶向DNA分子的指導RNA,由此該指導RNA靶向編碼基因產物的DNA分子並且該Cpf1蛋白切割編碼該基因產物的DNA分子,由此改變該基因產物的表現;並且其中Cpf1蛋白和指導RNA並不同時天然存在。本發明包括包含連接至同向重複序列(DR)的指導序列的指導RNA。本發明進一步包括密碼子優化為在真核細胞中表現的Cpf1蛋白。在一較佳的實施方式中,真核細胞係哺乳動物細胞,並且在一更較佳的實施
方式中,哺乳動物細胞係人類細胞。在本發明的另一個實施方式中,基因產物的表現減少。
在一個方面中,本發明提供了一種工程化的非天然存在的Cpf1 CRISPR-Cas系統,該Cpf1 CRISPR-Cas系統包含Cpf1蛋白和靶向編碼細胞中基因產物的DNA分子的指導RNA,由此該指導RNA靶向編碼基因產物的DNA分子並且該Cpf1蛋白切割編碼該基因產物的DNA分子,由此改變該基因產物的表現;並且其中Cpf1蛋白和指導RNA並不同時天然存在;此Cpf1包括本發明的拆分的Cpf1。本發明包括包含連接至DR序列的指導序列的指導RNA。本發明進一步包括密碼子優化為在真核細胞中表現的Cpf1蛋白。在一較佳的實施方式中,真核細胞係哺乳動物細胞,並且在一更較佳的實施方式中,哺乳動物細胞係人類細胞。在本發明的另一個實施方式中,基因產物的表現減少。
在另一個方面中,本發明提供了一種包含一種或多種載體的工程化的非天然存在的載體系統,該等載體包含可操作地連接至靶向編碼基因產物的DNA分子的Cpf1 CRISPR-Cas系統指導RNA的第一調節元件以及可操作地連接至Cpf1蛋白的第二調節元件;此Cpf1包括本發明的拆分的Cpf1。組分(a)和(b)可以位於系統的相同或不同的載體上。指導RNA靶向編碼細胞中的基因產物的DNA分子並且Cpf1蛋白切割編碼該基因產物的該DNA分子,由此改變該基因產物的表現;並且其中Cpf1蛋白和指導RNA並不同時天然存在。本發明包括包含連接至DR序列的指導序列的指導RNA。本發明進一步包括密碼子優化為在真
核細胞中表現的Cpf1蛋白。在一較佳的實施方式中,真核細胞係哺乳動物細胞,並且在一更較佳的實施方式中,哺乳動物細胞係人類細胞。在本發明的另一個實施方式中,基因產物的表現減少。
在一個方面中,本發明提供了一種包含一種或多種載體的載體系統。在一些實施方式中,該系統包含:(a)可操作地連接至DR序列的第一調節元件和用於將一種或多種指導序列插入DR序列的下游的一個或多個插入位點,其中在表現時,指導序列引導Cpf1 CRISPR-Cas複合物與真核細胞中的靶序列的序列特異性結合,其中Cpf1 CRISPR-Cas複合物包含與(1)雜交至靶序列的指導序列,和(2)DR序列複合的Cpf1;和(b)可操作地連接至編碼包含核定位序列的所述Cpf1酶的酶編碼序列的第二調節元件;其中組分(a)和(b)位於系統的相同或不同的載體上;此Cpf1包括本發明的拆分的Cpf1。在一些實施方式中,組分(a)進一步包含可操作地連接至第一調節元件的兩種或更多種指導序列,其中當表現時,兩種或更多種指導序列中的每種引導Cpf1 CRISPR-Cas複合物與真核細胞中的不同靶序列的序列特異性結合。
在一些實施方式中,Cpf1 CRISPR-Cas複合物包含具有足以驅動所述Cpf1 CRISPR-Cas複合物在真核細胞的核中以可檢測的量積累的強度的一個或多個核定位序列。在不希望受到理論約束的情況下,據信核定位序列不是為真核生物中的Cpf1
CRISPR-Cas複合物活性所需要的,但是包括此類序列增強系統的活性,特別是對於靶向核中的核酸分子而言。
在一些實施方式中,Cpf1酶係選自下組的細菌物種的Cpf1,該組由下項組成:土拉熱弗朗西絲菌1、土拉熱弗朗西絲菌新殺手亞種、易北普雷沃菌、毛螺旋菌科細菌MC2017 1、解朊丁酸弧菌、佩萊格裡尼菌科細菌GW2011_GWA2_33_10、儉菌總門細菌GW2011_GWC2_44_17、密斯氏菌屬某種SCADC、胺基酸球菌屬某種BV3L6、毛螺旋菌MA2020、候選白蟻甲烷枝原體、挑剔真細菌、牛莫拉氏菌237、稻田鉤端螺旋體、毛螺旋菌科細菌ND2006、狗口腔卟啉單胞菌3、解糖腖普雷沃菌和獼猴卟啉單胞菌,並且可以包括來源於該等生物體的突變型CPf1。酶可以是Cpf1同源物或異種同源物。在一些實施方式中,Cpf1被密碼子優化為在真核細胞中表現。在一些實施方式中,Cpf1引導靶序列位置處的一條或兩條股的切割。在一較佳的實施方式中,股斷裂係交錯切割的,產生了5'突出端。在一些實施方式中,第一調節元件係聚合酶III啟動子。在一些實施方式中,第二調節元件係聚合酶II啟動子。在一些實施方式中,同向重複序列具有16個核苷酸的最小長度並且具有單一莖環。在另外的實施方式中,同向重複序列具有長於16個核苷酸,較佳的是超過17個核苷酸的長度,並且具有超過一個的莖環或優化的二級結構。
在一個方面中,本發明提供了一種包含以下項的真核宿主細胞:(a)可操作地連接至同向重複序列的第一調節元件和用於將一種或多種指導序列插入DR序列的下游的一個或多個插入位
點,其中在表現時,指導序列引導Cpf1 CRISPR-Cas複合物與真核細胞中的靶序列的序列特異性結合,其中Cpf1 CRISPR-Cas複合物包含與(1)雜交至靶序列的指導序列,和(2)DR序列複合的Cpf1;和/或(b)可操作地連接至編碼包含核定位序列的所述Cpf1酶的酶編碼序列的第二調節元件。在一些實施方式中,宿主細胞包含組分(a)和(b);此Cpf1包括本發明的拆分的Cpf1。在一些實施方式中,組分(a)、組分(b)或組分(a)和(b)被穩定地整合到宿主真核細胞的基因組中。在一些實施方式中,組分(a)進一步包含可操作地連接至第一調節元件的兩種或更多種指導序列,其中當表現時,兩種或更多種指導序列中的每種引導Cpf1 CRISPR-Cas複合物與真核細胞中的不同靶序列的序列特異性結合。在一些實施方式中,CPf1被密碼子優化為在真核細胞中表現。在一些實施方式中,Cpf1引導靶序列位置處的一條或兩條股的切割。在一較佳的實施方式中,股斷裂係交錯切割的,產生了5'突出端。在一些實施方式中,Cpf1缺乏DNA股切割活性。在一些實施方式中,第一調節元件係聚合酶III啟動子。在一些實施方式中,同向重複序列具有16個核苷酸的最小長度並且具有單一莖環。在另外的實施方式中,同向重複序列具有長於16個核苷酸,較佳的是超過17個核苷酸的長度,並且具有超過一個的莖環或優化的二級結構。在一方面中,本發明提供了一種非人類真核生物體;較佳的是多細胞真核生物體,該等生物體包含根據任何所述實施方式的真核宿主細胞。在其他方面中,本發明提供了一種真核生物體;較佳的是多細胞真核生物體,該等生物體包含根據任何所述實施方式的真核宿主細胞。在該等方面的一些實施方式中,該生
物體可以是動物;例如,哺乳動物。而且,該生物體可以是節肢動物,諸如昆蟲。生物體還可以是植物。另外,生物體可以是真菌。
在一個方面中,本發明提供了一種包含在此所述的一種或多種組分的套組。在一些實施方式中,套組包括載體系統和用於使用套組的說明書。在一些實施方式中,該載體系統包含:(a)可操作地連接至同向重複序列的第一調節元件和用於將一種或多種指導序列插入DR序列的下游的一個或多個插入位點,其中在表現時,指導序列引導Cpf1 CRISPR-Cas複合物與真核細胞中的靶序列的序列特異性結合,其中Cpf1 CRISPR-Cas複合物包含與(1)雜交至靶序列的指導序列,和(2)DR序列複合的Cpf1;和/或(b)可操作地連接至編碼包含核定位序列的所述Cpf1酶的酶編碼序列的第二調節元件並且有利的是此Cpf1包括本發明的拆分Cpf1。在一些實施方式中,套組包括位於系統的相同或不同的載體上的組分(a)和(b)。在一些實施方式中,組分(a)進一步包含可操作地連接至第一調節元件的兩種或更多種指導序列,其中當表現時,兩種或更多種指導序列中的每種引導Cpf1 CRISPR-Cas複合物與真核細胞中的不同靶序列的序列特異性結合。在一些實施方式中,Cpf1包含具有足以驅動所述Cpf1在真核細胞的核中以可檢測的量積累的強度的一個或多個核定位序列。在一些實施方式中,Cpf1酶係選自下組的細菌物種的Cpf1,該組由下項組成:土拉熱弗朗西絲菌1、土拉熱弗朗西絲菌新殺手亞種、易北普雷沃菌、毛螺旋菌科細菌MC2017 1、解朊丁酸弧菌、佩萊格裡尼菌科細菌GW2011_GWA2_33_10、儉菌總門細菌
GW2011_GWC2_44_17、密斯氏菌屬某種SCADC、胺基酸球菌屬某種BV3L6、毛螺旋菌MA2020、候選白蟻甲烷枝原體、挑剔真細菌、牛莫拉氏菌237、稻田鉤端螺旋體、毛螺旋菌科細菌ND2006、狗口腔卟啉單胞菌3、解糖腖普雷沃菌和獼猴卟啉單胞菌,並且可以包括來源於該等生物體的突變型CPf1。酶可以是Cpf1同源物或異種同源物。在一些實施方式中,Cpf1被密碼子優化為在真核細胞中表現。在一些實施方式中,Cpf1引導靶序列位置處的一條或兩條股的切割。在一較佳的實施方式中,股斷裂係交錯切割的,產生了5'突出端。在一些實施方式中,CRISPR酶缺乏DNA股切割活性。在一些實施方式中,同向重複序列具有16個核苷酸的最小長度並且具有單一莖環。在另外的實施方式中,同向重複序列具有長於16個核苷酸,較佳的是超過17個核苷酸的長度,並且具有超過一個的莖環或優化的二級結構。
在一個方面中,本發明提供了一種修飾真核細胞中的靶多核苷酸的方法。在一些實施方式中,該方法包括使得Cpf1 CRISPR-Cas複合物結合靶多核苷酸來實施所述靶多核苷酸的切割,從而修飾該靶多核苷酸,其中該Cpf1 CRISPR-Cas複合物包含與雜交至所述靶多核苷酸內的靶序列的指導序列複合的Cpf1,其中所述指導序列連接至同向重複序列。在一些實施方式中,所述切割包括藉由所述Cpf1切割靶序列的位置處的一條或兩條股;此Cpf1包括本發明的拆分的Cpf1。在一些實施方式中,所述切割使得靶基因的轉錄減少。在一些實施方式中,該方法進一步包括使用外源性模板多核苷酸藉由同源重組修復所述切割的靶多核苷酸,其中所述修復產生包括所述靶多核苷酸的一個或多個核苷酸的插
入、缺失或取代的突變。在一些實施方式中,所述突變使得由包含靶序列的基因表現的蛋白質中發生一個或多個胺基酸的變化。在一些實施方式中,該方法進一步包括將一個或多個載體遞送至所述真核細胞,其中一個或多個載體驅動以下項中的一個或多個的表現:Cpf1,和連接至DR序列的指導序列。在一些實施方式中,所述載體被遞送至受試者中的真核細胞。在一些實施方式中,所述修飾發生在細胞培養中的所述真核細胞中。在一些實施方式中,該方法進一步包括在所述修飾之前將所述真核細胞從受試者分離。在一些實施方式中,該方法進一步包括將所述真核細胞和/或衍生自其的細胞返回至所述受試者。
在一個方面中,本發明提供了一種修飾多核苷酸在真核細胞中的表現之方法。在一些實施方式中,該方法包括使得Cpf1 CRISPR-Cas複合物結合該多核苷酸,以使得所述結合導致所述多核苷酸的表現增加或減少;其中Cpf1 CRISPR-Cas複合物包含與雜交至所述多核苷酸內的靶序列的指導序列複合的Cpf1,其中所述指導序列連接至同向重複序列;此Cpf1包括本發明的拆分的Cpf1。在一些實施方式中,該方法進一步包括將一個或多個載體遞送至所述真核細胞,其中一個或多個載體驅動以下項中的一個或多個的表現:Cpf1,和連接至DR序列的指導序列。
在一個方面中,本發明提供了一種產生包含突變型疾病相關基因的模型真核細胞的方法。在一些實施方式中,疾病相關基因係與患病或發展病的風險的增加相關聯的任何基因。在一些實施方式中,該方法包括(a)將一個或多個載體引入到真核細
胞中,其中一個或多個載體驅動以下項中的一個或多個的表現:Cpf1,和連接至同向重複序列的指導序列;並且(b)使得Cpf1 CRISPR-Cas複合物結合靶多核苷酸以實施所述疾病相關基因內的靶多核苷酸的切割,其中Cpf1 CRISPR-Cas複合物包含與(1)雜交至靶多核苷酸內的靶序列的指導序列,和(2)DR序列複合的Cpf1,從而產生包含突變型疾病相關基因的模型真核細胞;此Cpf1包括本發明的拆分的Cpf1。在一些實施方式中,所述切割包括藉由所述Cpf1切割靶序列的位置處的一條或兩條股。在一較佳的實施方式中,股斷裂係交錯切割的,產生了5'突出端。在一些實施方式中,所述切割使得靶基因的轉錄減少。在一些實施方式中,該方法進一步包括使用外源性模板多核苷酸藉由同源重組修復所述切割的靶多核苷酸,其中所述修復產生包括所述靶多核苷酸的一個或多個核苷酸的插入、缺失或取代的突變。在一些實施方式中,所述突變使得來自包含靶序列的基因的蛋白質表現發生一個或多個胺基酸的變化。
在一個方面中,本發明提供了一種用於開發調控與疾病相關基因相關聯的細胞傳訊事件的生物活性劑之方法。在一些實施方式中,疾病相關基因係與患病或發展病的風險的增加相關聯的任何基因。在一些實施方式中,該方法包括(a)使測試化合物與任一種所述實施方式的模型細胞接觸;並且(b)檢測指示與所述疾病相關基因中的所述突變相關聯的細胞傳訊事件的減少或增加的讀出變化,從而開發調控與所述疾病相關基因相關聯的所述細胞傳訊事件的所述生物活性劑。
在一個方面中,本發明提供了一種包含同向重複序列的下游的指導序列的重組多核苷酸,其中在表現時,指導序列引導Cpf1 CRISPR-Cas複合物與真核細胞中存在的相應靶序列的序列特異性結合。在一些實施方式中,靶序列係真核細胞中存在的病毒序列。在一些實施方式中,靶序列係原癌基因或癌基因。
在一個方面中,本發明提供了一種藉由在一個或多個細胞的基因中引入一個或多個突變來選擇一個或多個細胞的方法,該方法包括:將一種或多種載體引入到一個或多個細胞中,其中一種或多種載體驅動以下項中的一個或多個的表現:Cpf1、連接至同向重複序列的指導序列,以及編輯模板;其中編輯模板包含廢除Cpf1切割的一個或多個突變;使得編輯模板與有待選擇的一個或多個細胞中的靶多核苷酸同源重組;使得Cpf1 CRISPR-Cas複合物結合靶多核苷酸以實施所述基因內的靶多核苷酸的切割,其中Cpf1 CRISPR-Cas複合物包含與(1)雜交至靶多核苷酸內的靶序列的指導序列,和(2)同向重複序列複合的Cpf1,其中Cpf1 CRISPR-Cas複合物與靶多核苷酸的結合誘導細胞死亡,從而使得其中已引入一個或多個突變的一個或多個細胞被選擇;此Cpf1包括本發明的拆分的Cpf1。在本發明的另一個較佳的實施方式中,有待選擇的細胞可以是真核細胞。本發明的方面允許在不需要選擇標記物或可能包括反選擇系統的兩步法的情況下選擇特異性細胞。
在此存在短語“此Cpf1包括本發明的拆分Cpf1”或類似文本;並且這係表明在此的實施方式中的Cpf1可以是如在此所
討論的拆分Cpf1。
在一方面中,本發明涉及一種非天然存在或工程化的誘導型Cpf1 CRISPR-Cas系統,該系統包含附接至誘導型異源二聚體的第一半部的第一Cpf1融合構建體和附接至誘導型異源二聚體的第二半部的第二Cpf1融合構建體,其中第一CPf1融合構建體被可操作地連接至一個或多個核定位信號,其中第二CPf1融合構建體被可操作地連接至核輸出信號,其中與誘導物能量源的接觸使得誘導型異源二聚體的第一半部和第二半部合在一起,其中使誘導型異源二聚體的第一半部和第二半部合在一起允許第一Cpf1融合構建體和第二Cpf1融合構建體組成功能性Cpf1 CRISPR-Cas系統,其中Cpf1 CRISPR-Cas系統包含含有能夠與細胞中的感興趣的基因組座位中的靶序列雜交的指導序列的指導RNA(gRNA),並且其中功能性Cpf1 CRISPR-Cas系統編輯基因組座位以改變基因表現。在本發明的一個實施方式中,誘導型異源二聚體的第一半部係FKBP12並且誘導型異源二聚體的第二半部係FRB。在本發明的另一個實施方式中,誘導物能量源係雷帕黴素。
可以認為誘導物能量源係簡單的誘導物或二聚化劑。術語“誘導物能量源”在此至始至終的使用是一致的。誘導物能量源(或誘導物)用來重構Cpf1。在一些實施方式中,誘導物能量源藉由誘導型二聚體的兩個半部的作用使得Cpf1的兩個部分合在一起。因此在存在誘導物能量源的條件下誘導型二聚體的兩個半部變得更強韌。在不存在誘導物能量源的情況下,二聚體的兩個半部將不形成為二聚體(進行二聚化)。
因此,誘導型二聚體的兩個半部與誘導物能量源合作以二聚化二聚體。這進而藉由使得Cpf1的第一部分和第二部分合在一起來重構Cpf1。
CRISPR酶融合構建體各自包含拆分Cpf1的一部分。該等較佳的是經由接頭諸如在此所述的GlySer接頭融合至二聚體的兩個半部中的一個。二聚體的兩個半部可以是合在一起形成同源二聚體的基本上相同的兩個單體,或者它們可以是合在一起形成異源二聚體的不同單體。這樣,兩個單體可以被認為是全長二聚體的一個半部。
Cpf1係拆分的,在某種意義上,Cpf1酶的兩個部分基本上包含有功能的Cpf1。Cpf1可以用作基因組編輯酶(當與靶DNA和指導序列形成複合物時),諸如切口酶或核酸酶(切割DNA的兩條股),或者該Cpf1可以是無效Cpf1,該無效Cpf1實質上是典型地由於其催化結構域中的一個或多個突變而具有非常小或沒有催化活性的DNA結合蛋白。
拆分Cpf1的兩個部分可以被認為是拆分Cpf1的N'末端部分和C'末端部分。融合典型地是在Cpf1的拆分點處。換句話說,拆分Cpf1的N'末端部分的C'末端融合至一個二聚體半部,而C'末端部分的N'末端融合至另一個二聚體半部。
Cpf1不是必須被拆分,在某種意思上,斷裂係新創建的。拆分點典型地是經由電腦類比設計的並且選殖到構建體中。合起來,拆分Cpf1的兩個部分N'末端部分和C'末端部分形成全長Cpf1,該全長Cpf1包含較佳的是至少70%或更多的野生型胺基酸
(或編碼它們的核苷酸)、較佳的是至少80%或更多、較佳的是至少90%或更多、較佳的是至少95%或更多,並且最較佳的是至少99%或更多的野生型胺基酸(或編碼它們的核苷酸)。也許可以進行一些修整,並且設想到突變。非功能結構域可以全部被去除。重要的是兩個部分可以被結合在一起並且所希望的Cpf1功能被恢復或重構。
二聚體可以是同源二聚體或異源二聚體。
一個或多個,較佳的是兩個NLS可以用於可操作地連接至第一Cpf1構建體。一個或多個,較佳的是兩個NES可以用於可操作地連接至第一Cpf1構建體。NLS和/或NES較佳的是側接拆分二聚體(即半二聚體)融合物,即一個NLS可以被定位在第一Cpf1構建體的N'末端處並且一個NLS可以在第一Cpf1構建體的C'末端處。類似地,一個NES可以被定位在第二Cpf1構建體的N'末端處並且一個NES可以在第二Cpf1構建體的C'末端處。在提及N'末端或C'末端的情況下,應瞭解的是該等對應於相應核苷酸序列中的5'端和3'端。
較佳的安排係,第一Cpf1構建體被安排為5'-NLS-(N'末端Cpf1部分)-接頭-(二聚體的第一半部)-NLS-3'。較佳的安排係,第二Cpf1構建體被安排為5'-NES-(二聚體的第二半部)-接頭-(C'末端Cpf1部分)-NES-3'。合適的啟動子較佳的是在該等構建體中的每個的上游。兩個構建體可以單獨或一起遞送。
在一些實施方式中,可操作地連接至第二CPf1構建體的一個或多個NES中的一個或全部可以對換成NLS。然而,這典
型地可能不是較佳的並且在其他實施方式中,可操作地連接至第二Cpf1構建體的定位信號係一個或多個NES。
還應瞭解的是,NES可以被可操作地連接至拆分Cpf1的N'末端片段並且NLS可以被可操作地連接至拆分Cpf1的C'末端片段。然而,可以較佳的安排係其中NLS被可操作地連接至拆分Cpf1的N'末端片段並且NES被可操作地連接至拆分Cpf1的C'末端片段。
NES用作將第二Cpf1融合構建體定位在核的外面,至少直到提供了誘導物能量源為止(例如,至少直到能量源被提供給誘導物以執行其功能為止)。誘導物的存在刺激了細胞質內兩個Cpf1融合物的二聚化並且使得其熱力學上值得用於將第一Cpf1融合物和第二Cpf1融合物二聚化成定位至核。在不受理論束縛的情況下,申請人相信NES將第二Cpf1融合物隔離至細胞質(即核的外面)。第一Cpf1融合物上的NLS將其定位至核。在兩種情況下,申請人使用NES或NLS來將平衡(核轉運的平衡)移動至所希望的方向。二聚化典型地發生在核的外面(非常少的部分可能發生在核中)並且二聚化複合物上的NLS將核轉運的平衡改變為核定位,所以二聚化的並因此重構的Cpf1進入核。
有利地,申請人能夠重構拆分Cpf1的功能。使用暫態轉染來證明該構想並且二聚化發生在存在誘導物能量源的背景下。對於Cpf1的單獨片段,沒有看到活性。然後使用藉由慢病毒遞送的穩定表現來研究這一點並且顯示可以使用拆分Cpf1方法。
本發明的拆分Cpf1方法係有益的,因為其使得Cpf1活
性係可誘導的,從而允許時間控制。此外,可以使用不同的定位序列(即,NES和NLS為較佳的)以降低來自自組裝複合物的背景活性。組織特異性啟動子,例如針對第一Cpf1融合構建體和第二Cpf1融合構建體中每個的組織特異性啟動子也可以用於組織特異性靶向,從而提供空間控制。如果需要,兩個不同的組織特異性啟動子可以用於產生更精細程度的控制。對於階段特異性啟動子可以使用相同方法,或者可以存在階段特異性啟動子和組織特異性啟動子的混合物,其中第一Cpf1融合構建體和第二Cpf1融合構建體中的一個在組織特異性啟動子的控制下(即可操作地連接至或包含該組織特異性啟動子),而第一Cpf1融合構建體和第二Cpf1融合構建體中的另一個在階段特異性啟動子的控制下(即可操作地連接至或包含該階段特異性啟動子)。
誘導型Cpf1 CRISPR-Cas系統包含如在此所述的例如像可操作地連接至第一Cpf1融合構建體的一個或多個核定位序列(NLS)。理想的是,該等核定位序列具有足以驅動所述第一Cpf1融合構建體在真核細胞的核中以可檢測的量積累的強度。在不希望受到理論約束的情況下,據信核定位序列不是為真核生物中的Cpf1 CRISPR-Cas複合物活性所需要的,但是包括此類序列增強系統的活性,特別是對於靶向核中的核酸分子而言,並且有助於本發明的2-部分系統的操作。
同樣地,第二Cpf1融合構建體被可操作地連接至核輸出序列(NES)。實際上,其可以連接至一個或多個核輸出序列。換句話說,與第二Cpf1融合構建體一起使用的輸出序列的數目較
佳的是1或2或3。典型地,2係較佳的,但是1是足夠的並且在一些實施方式中1係較佳的。NLS和NES的適合實例係本領域已知的。例如,較佳的核輸出信號(NES)係人類蛋白酪胺酸激酶2。較佳的信號將是物種特異性的。
在使用FRB和FKBP系統的情況下,FKBP較佳的是側接核定位序列(NLS)。在使用FRB和FKBP系統的情況下,較佳的安排係N'末端Cpf1-FRB-NES:C'末端Cpf1-FKBP-NLS。因此,第一Cpf1融合構建體將包含C'末端Cpf1部分並且第二Cpf1融合構建體將包含N'末端Cpf1部分。
本發明的另一有益方面係其可以迅速地開啟,即其具有快速應答。據信,在不受理論束縛的情況下,藉由現有(已經存在的)融合構建體(藉由與誘導物能量源接觸)可以比藉由新融合構建體的表現(尤其是翻譯)更迅速地誘導Cpf1活性。這樣,第一Cpf1融合構建體和第二Cpf1融合構建體可以提前即在需要Cpf1活性之前表現在靶細胞中。然後Cpf1活性可以進行時間控制並且然後藉由添加誘導物能量源迅速地進行重構,理想地,該重構比藉由例如載體遞送的Cpf1的表現(包括轉錄的誘導)作用更迅速(以二聚化異源二聚體並且從而提供Cpf1活性)。
除非另外表明,否則術語Cpf1或Cpf1酶和CRISPR酶在此可互換地使用。
申請人證明出CPf1可以被拆分為兩組分,該兩組分在重新合在一起時重構成功能核酸酶。採用雷帕黴素敏感的二聚化結構域,申請人產生了用於Cpf1介導的基因組編輯和轉錄調控
的時間控制的化學誘導型Cpf1。換言之,申請人證明出可以藉由將Cpf1拆分為兩片段來使得其為化學誘導型的並且證明出雷帕黴素敏感的二聚化結構域可以用於Cpf1的受控重組裝。申請人表明重組裝的Cpf1可以用於介導基因組編輯(藉由核酸酶/切口酶活性)以及轉錄調控(作為DNA結合結構域,所謂的“無效Cpf1”)。
這樣,雷帕黴素敏感的二聚化結構域的使用係較佳的。Cpf1的重組裝係較佳的。重組裝可以藉由結合活性的恢復來確定。在Cpf1係切口酶或誘導雙股斷裂的情況下,在此描述了相比於野生型的適合比較百分比。
雷帕黴素處理可以持續12天。劑量可以是200nM。此時間劑量和/或莫耳劑量係用於人類胚腎293FT(HEK293FT)細胞系的適當劑量的一個實例並且此劑量也可以用於其他細胞系。對於體內治療性用途,此數位可以外推為例如mg/kg。然而,還設想,在此也使用用於向受試者給予雷帕黴素的標準劑量。關於“標準劑量”,其意指雷帕黴素的正常治療性用途或初期指示下的劑量(即當給予雷帕黴素以用於防止器官排斥時所用的劑量)。
值得注意的是,Cpf1-FRB/FKBP片段的較佳的安排係分開的並且是失活的,直到FRB和FKBP的雷帕黴素誘導的二聚化使得功能性全長Cpf1核酸酶的重組裝產生為止。因此,較佳的是,附接至誘導型異源二聚體的第一半部的第一Cpf1融合構建體與附接至誘導型異源二聚體的第二半部的第二Cpf1融合構建體分開遞送和/或分開定位。
為了隔離細胞質中的Cpf1(N)-FRB片段,在該片段不
太可能與核定位的Cpf1(C)-FKBP片段二聚化的情況下,較佳的是在Cpf1(N)-FRB上使用來自人類蛋白酪胺酸激酶2的單個核輸出序列(NES)(Cpf1(N)-FRB-NES)。在雷帕黴素存在下,Cpf1(N)-FRB-NES與Cpf1(C)-FKBP-2xNLS二聚化以重構完全的Cpf1蛋白,這使得核運輸(trafficking)的平衡朝核輸入移動並且允許DNA靶向。
高劑量的Cpf1可以加劇表現出與指導股具有很少錯配的脫靶(OT)序列處的indel頻率。如果錯配係非連續的和/或在指導序列的種子區的外面,則此類序列係特別易感的。因此,Cpf1活性的時間控制可以用於減少長期表現實驗中的劑量並且因此與組成型活性Cpf1相比產生降低的脫靶indel。
較佳的是病毒遞送。具體地說,設想了慢病毒或AAV遞送載體。申請人產生了類似於慢病毒CRISPR質粒的拆分的-Cpf1慢病毒構建體。拆分片段應該足夠小以適於AAV的~4.7kb大小限制。
申請人證明出拆分Cpf1的穩定、低拷貝表現可以用於在靶向的座位處誘導大量indel,而在脫靶位點處沒有明顯的突變。申請人選殖了Cpf1片段(基於拆分5的2部分,在此所述的)。
也可以使用包含VP64反式啟動結構域的無效Cpf1,例如該無效Cpf1添加到Cpf1(C)-FKBP-2xNLS中(無效-Cpf1(C)-FKBP-2xNLS-VP64)。該等片段重構成催化失活的Cpf1-VP64融合物(無效-Cpf1-VP64)。轉錄啟動係在雷帕黴素存在下藉由VP64誘導的,以便誘導Cpf1(C)-FKBP融合物與Cpf1(N)-FRB融合物的二聚化。換句話說,申請人測試了拆分的無效-Cpf1-VP64的可誘導
性並且顯示出轉錄啟動係在雷帕黴素存在下藉由拆分的無效-Cpf1-VP64誘導的。這樣,本發明的誘導型Cpf1可以與一個或多個功能結構域,諸如轉錄活化物或阻遏物或核酸酶(諸如Fok1)締合。功能結構域可以與拆分Cpf1的一個部分結合或融合。
較佳的安排係第一Cpf1構建體被安排為5'-第一定位信號-(N'末端CPf1部分)-接頭-(二聚體的第一半部)-第一定位信號-3'並且第二Cpf1構建體被安排為5'-第二定位信號-(二聚體的第二半部)-接頭-(C'末端Cpf1部分)-第二定位信號-功能結構域-3'。在此,功能結構域置於第二Cpf1構建體的3'端處。可替代地,功能結構域可以置於第一Cpf1構建體的5'端處。一個或多個功能結構域可以使用在3'端或5'端處或兩個端處。合適的啟動子較佳的是在該等構建體的每個的上游。兩個構建體可以單獨或一起遞送。定位信號可以是NLS或NES,只要它們在每個構建體上不是相互混合的。
在一個方面中,本發明提供了一種誘導型Cpf1 CRISPR-Cas系統,其中Cpf1與不具有至少一個突變的Cpf1酶相比具有至少97%或100%減弱的核酸酶活性。
因此,還較佳的是,Cpf1係無效Cpf1。理想的是,拆分應該總是使得一個或多個催化結構域不受影響。對於無效-Cpf1,意圖在於發生DNA結合,但不顯示切割或切口酶活性。
在一個方面中,本發明提供了一種如在此所討論的誘導型Cpf1 CRISPR-Cas系統,其中一個或多個功能結構域與Cpf1締合。此功能結構域可以與拆分Cpf1的一個部分或兩個部分締合(即結合或融合)。可以存在與拆分Cpf1的兩個部分中的每個締合的功
能結構域。因此該等功能結構域可以典型地被提供作為第一Cpf1融合構建體和/或第二Cpf1融合構建體的一部分,作為該構建體內的融合物。功能結構域典型地經由接頭諸如在此所討論的GlySer接頭來融合。一個或多個功能結構域可以是轉錄啟動結構域或阻遏結構域。儘管它們可以是不同的結構域,但是較佳的是,所有的功能結構域係活化物或阻遏物並且不使用兩者的混合物。
轉錄啟動結構域可以包括VP64、p65、MyoD1、HSF1、RTA或SET7/9。
在一個方面中,本發明提供了一種如在此所討論的誘導型Cpf1 CRISPR-Cas系統,其中與Cpf1締合的一個或多個功能結構域係轉錄阻遏結構域。
在一個方面中,本發明提供了一種如在此所討論的誘導型Cpf1 CRISPR-Cas系統,其中轉錄阻遏結構域係KRAB結構域。
在一個方面中,本發明提供了一種如在此所討論的誘導型Cpf1 CRISPR-Cas系統,其中轉錄阻遏結構域係NuE結構域、NcoR結構域、SID結構域或SID4X結構域。
在一個方面中,本發明提供了一種如在此所討論的誘導型Cpf1 CRISPR-Cas系統,其中與轉接蛋白締合的一個或多個功能結構域具有一種或多種活性,包括修飾烷酶活性、去甲酶活性、轉錄啟動活性、轉錄阻遏活性、轉錄釋放因子活性、組蛋白修飾活性、RNA切割活性、DNA切割活性、DNA整合活性或核酸結合活性。
在一些實施方式中,組蛋白修飾結構域也是較佳的。以下討論了示例性組蛋白修飾結構域。易位酶結構域、HR(同源重組)機構結構域、重組酶結構域、和/或整合酶結構域作為本發明的功能結構域也是較佳的。在一些實施方式中,DNA整合活性包括HR機構結構域、整合酶結構域、重組酶結構域和/或易位酶結構域。
在一個方面中,本發明提供了一種如在此所討論的誘導型Cpf1 CRISPR-Cas系統,其中DNA切割活性歸因於核酸酶。
在一個方面中,本發明提供了一種如在此所討論的誘導型Cpf1 CRISPR-Cas系統,其中核酸酶包括Fok1核酸酶。
對於本發明的拆分Cpf1系統係較佳的此類功能結構域的用途也詳細討論在康爾曼(Konermann)等人(“使用工程化的CRISPR-Cas9複合物的基因組規模的轉錄啟動(Genome-scale transcriptional activation with an engineered CRISPR-Cas9 complex)”自然2014年12月11日公開)中。
本發明的系統可以與任何指導序列一起使用。
在某些實施方式中可以使用修飾指導序列。特別較佳的是具體化以上提到的康爾曼 自然2014年12月11日論文的傳授內容的指導序列。該等指導序列被修飾為使得蛋白結合RNA部分(諸如適配體)被添加。這樣的一個或多個部分可以替換指導序列的一部分。然後相應的RNA結合蛋白結構域可以用於識別RNA並且將功能結構域,諸如在此所述的那些募集至指導序列。此指
導序列主要是與無效-Cpf1一起使用,從而產生轉錄啟動或阻遏或藉由核酸酶諸如Fok1的DNA切割。此類指導序列與無效-Cpf1的組合使用係有力的,並且該組合的使用在Cpf1本身也與其自身功能結構域(如在此所討論的)締合的情況下是特別有力的。當根據本發明誘導無效-Cpf1(具有或不具有其自身締合的功能結構域)進行重構,即該無效-Cpf1係拆分Cpf1時,那麼該工具係特別有用的。
也較佳的是用於本發明的指導RNA(gRNA)可以包含能夠與細胞中的感興趣的基因組座位中的靶序列雜交的指導序列,其中gRNA係藉由插入結合一種或多種轉接蛋白的一種或多種不同RNA序列來修飾的,並且其中該轉接蛋白與一個或多個功能結構域締合。Cpf1可以包含至少一個突變,以使得Cpf1酶具有不超過不具有該至少一個突變的Cpf1酶的核酸酶活性的5%的核酸酶活性;和/或至少一個或多個核定位序列。還提供了一種非天然存在或工程化的組成物,該組成物包含:包含能夠與細胞中的感興趣的基因組座位中的靶序列雜交的指導序列的一個或多個指導RNA(gRNA)、包含至少一個或多個核定位序列的Cpf1酶,其中CPf1酶包含至少一個突變,使得Cpf1酶具有不超過不具有該至少一個突變的Cpf1酶的核酸酶活性的5%的核酸酶活性,其中至少一個gRNA係藉由插入結合一種或多種轉接蛋白的一種或多種不同的RNA序列來修飾的,並且其中該轉接蛋白與一個或多個功能結構域締合。
gRNA較佳的是藉由插入結合一種或多種轉接蛋白的
一種或多種不同的RNA序列來修飾的。插入的結合一種或多種轉接蛋白的一種或多種不同的RNA序列較佳的是一種適配體序列或特異於相同或不同的一種或多種轉接蛋白的兩種或更多種適配體序列。轉接蛋白較佳的是包括:MS2、PP7、Qβ、F2、GA、fr、JP501、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、ΦCb5、ΦCb8r、ΦCb12r、ΦCb23r、7s、PRR1。尤其穩定地表現拆分的無效-Cpf1的細胞系可以是有用的。
申請人證明出Cpf1可以被拆分為兩個不同的片段,該等片段在使用化學品誘導重新合在一起時重構成功能性全長Cpf1核酸酶。拆分Cpf1體系結構將有用於多種應用。例如,拆分CPf1可以允許遺傳策略用於藉由將每個片段放在不同的組織特異性啟動子下來將Cpf1活性限制於交叉的細胞群體。另外,不同的化學誘導型二聚化結構域諸如APA和赤黴素也是可以採用的。
誘導物能量源較佳的是化學品誘導。
拆分部位或位置係Cpf1酶的第一部分與第二部分分開所在的那個點。在一些實施方式中,第一部分包含或編碼胺基酸1至X,而第二部分包含或編碼胺基酸X+1至末端。在此實例中,編碼係連續的,但這並非是總是需要的,因為胺基酸(或編碼它們的核苷酸)可以從拆分末端中的任一個末端開始修整,前提條件係保留了足夠的DNA結合活性和(如果需要)DNA切口酶或切割活性,例如與野生型Cpf1相比保留了至少40%、50%、60%、70%、80%、90%或95%活性。
在此提供的示例性編碼可以參考野生型蛋白質,較佳的是野生型FnCpf1。然而,設想的是,可以使用野生型Cpf1諸如FnCpf1蛋白的突變體。編碼還可以不完全遵循FnCpf1編碼,因為例如可以使用一些N'或C'末端截短或缺失,但是這可以使用標準序列比對工具來解決。異種同源物作為序列比對工具也是較佳的。
因此,拆分部位可以利用熟習該項技術者例如基於晶體資料和/或計算結構預測來選擇。
例如,Cpf1核酸酶初級結構的計算分析揭示了三個不同的區(圖1)。第一係C末端RuvC樣結構域,其係僅功能表征的結構域。第二係N末端α-螺旋區並且第三係位於RuvC樣結構域與α-螺旋區之間的混合的α區和β區。預測非結構化區的若干小片段在Cpf1初始結構之內。不同的Cpf1異種同源物內的暴露於溶劑且不保守的非結構化區可以代表用於拆分的較佳的側面(圖2和圖3)。
下表呈現出AsCpf1和LbCpf1內的非限制性潛在的拆分區。此區內的拆分位點可以是合適的。
對於Fn、As和Lb Cpf1突變體,應該很容易理解潛在的拆分位點的相應位置係例如基於序列比對的。對於非Fn、非As和非Lb酶,如果異種同源物與預期Cpf1之間存在相對較高的同源度,則可以使用異種同源物的晶體結構,或可以使用計算預測。
理想的是,拆分部位應該位於區或環內。較佳的是,
拆分部位出現在胺基酸序列的中斷不引起結構特徵(例如,α螺旋或β片層)的部分或全部破壞的地方。結構化的區(未在晶體結構中顯現的區,因為該等區係未結構化的從而足以被“凍結”在晶體中)常常是較佳的選擇。申請人可以例如在Cpf1表面上暴露的未結構化區中進行拆分。
申請人可以遵循作為較佳的實例及作為指導提供的以下程序。因為未結構化區未在結晶結構中顯現,所以申請人將晶體的周圍胺基酸序列與Cpf1的初級胺基酸序列進行相互參考。每個未結構化區可以由例如約3至10個胺基酸組成,不顯現在晶體中。因此申請人在該等胺基酸之間進行拆分。為了包括更多潛在的拆分側面,申請人包括了位於Cpf1的外面的環中的拆分,使用了與未結構化區相同的標準。
在一些實施方式中,拆分部位係在Cpf1的外面環中。在其他較佳的實施方式中,拆分部位係在Cpf1的未結構化區中。未結構化區典型地是高柔性的外面環,該外面環的結構不能容易地由晶體圖案來確定。
一旦拆分部位已被鑒定出,可以設計適合的構建體。
典型地,NES被定位在拆分胺基酸的第一部分的N'末端(或編碼該部分的核苷酸的5'端)。在那樣的情況下,NLS被定位在拆分胺基酸的第二部分的C'末端(或編碼該部分的核苷酸的3'端)。以這種方式,第一Cpf1融合構建體可以被可操作地連接至一個或多個核輸出信號並且第二Cpf1融合構建體可以被可操作地連接至核定位信號。
當然,可以提供相反的安排,其中NLS被定位在拆分胺基酸的第一部分的N'末端(或編碼該部分的核苷酸的5'端)。在那樣的情況下,NES被定位在拆分胺基酸的第二部分的C'末端(或編碼該部分的核苷酸的3'端)。因此,第一Cpf1融合構建體可以被可操作地連接至一個或多個核定位信號並且第二Cpf1融合構建體可以被可操作地連接至核輸出信號。
使得兩個部分(拆分的任一側面)具有大致相同的長度的拆分對於包裝目的可能是有利的。例如,認為當轉錄物具有大約相同大小時維持兩個片段之間的化學計量係容易的。
在某些實例中,人類密碼子優化的Cpf1諸如FnCpf1的N末端和C末端片段被分別融合至FRB和FKBP二聚化結構域。此安排可以是較佳的。它們可以被轉換(即N'末端融合至FKBP並且C'末端融合至FRB)。
在此較佳的是使用接頭諸如(GGGGS)3來將Cpf1片段與二聚化結構域分開。(GGGGS)3係較佳的,因為它係相對長的接頭(15個胺基酸)。甘胺酸殘基係最柔性的並且絲胺酸殘基增加接頭處於蛋白質之外的機會。(GGGGS)6(GGGGS)9或(GGGGS)12可以較佳的是用作替代物。其他較佳的替代物係(GGGGS)1、(GGGGS)2、(GGGGS)4、(GGGGS)5、(GGGGS)7、(GGGGS)8、(GGGGS)10、或(GGGGS)11。
例如,(GGGGS)3可以包含在N'末端Cpf1片段與FRB之間。例如,(GGGGS)3可以包含在FKB與C'末端Cpf1片段之間。
替代性接頭係可用的,當高柔性接頭被認為作用最好,以使得Cpf1的2個部分合在一起並因此重構Cpf1活性的機會最大。一個替代方案係核質蛋白的NLS可以用作接頭。
接頭也可以用在Cpf1與任何功能結構域之間。同樣,在此可以使用(GGGGS)3接頭(或因此6、9或12個重複版本)或者可以將核質蛋白的NLS用作CPf1與功能結構域之間的接頭。
設想了FRB/FKBP系統的替代物。例如ABA和赤黴素系統。
因此,FKBP家族的較佳的實例係以下誘導型系統中的任一種。在FK506存在下與鈣調磷酸酶A(CNA)二聚化的FKBP;在FKCsA存在下與CyP-Fas二聚化的FKBP;在雷帕黴素存在下與FRB二聚化的FKBP;在庫馬黴素(Coumermycin)存在下與GryB二聚化的GyrB;在赤黴素(Gibberellin)存在下與GID1二聚化的GAI;或在HaXS存在下與HaloTag二聚化的Snap-tag。
FKBP家族本身內的替代物也是較佳的。例如,在FK1012存在下進行同源二聚化(即一個FKBP與另一個FKBP二聚化)的FKBP。因此,還提供了一種非天然存在或工程化的誘導型Cpf1 CRISPR-Cas系統,該系統包含:
附接至誘導型同源二聚體(homoodimer)的第一半部的第一Cpf1融合構建體,以及
附接至誘導型同源二聚體的第二半部的第二Cpf1融合構建體,
其中第一Cpf1融合構建體被可操作地連接至一個或多個核定
位信號,
其中第二Cpf1融合構建體被可操作地連接至(視情況一個或多個)核輸出信號,
其中與誘導物能量源的接觸使得誘導型同源二聚體的第一半部和第二半部合在一起,
其中使誘導型同源二聚體的第一半部和第二半部合在一起允許第一CPf1融合構建體和第二CPf1融合構建體組成功能性Cpf1 CRISPR-Cas系統,
其中Cpf1 CRISPR-Cas系統包含含有能夠與細胞中的感興趣的基因組座位中的靶序列雜交的指導序列的指導RNA(gRNA),並且
其中功能性Cpf1 CRISPR-Cas系統結合靶序列並且視情況編輯基因組座位以改變基因表現。
在一個實施方式中,同源二聚體較佳的是FKBP並且誘導物能量源較佳的是FK1012。在另一個實施方式中,同源二聚體較佳的是GryB並且誘導物能量源較佳的是庫馬黴素。在另一個實施方式中,同源二聚體較佳的是ABA並且誘導物能量源較佳的是赤黴素。
在其他實施方式中,二聚體係異源二聚物。異源二聚體的較佳的實例係以下誘導型系統中的任一種:在FK506存在下與鈣調磷酸酶A(CNA)二聚化的FKBP;在FKCsA存在下與CyP-Fas二聚化的FKBP;在雷帕黴素存在下,在庫馬黴素存在下,與
FRB二聚化的FKBP;在赤黴素存在下與GID1二聚化的GAI;在HaXS存在下與HaloTag二聚化的Snap-tag。
申請人使用了FKBP/FRB,因為其係得到充分表徵的,並且兩個結構域係足以小(<100個胺基酸)至有助於包裝的。此外,雷帕黴素已使用較長時間並且副作用係充分瞭解的。大的二聚化結構域(>300aa)也應該起作用但是可能需要較長的接頭來允許Cpf1重構進行。
保羅穆魯甘(Paulmurugan)和甘比爾(Gambhir)(癌症研究(Cancer Res),2005年8月15日65;7413)討論了FRB/FKBP/雷帕黴素系統的背景。另一有用論文係克拉布特裡(Crabtree)等人(化學和生物學(Chemistry & Biology)13,99-107,2006年1月)。
在一個實例中,構建了單一載體,一種表現盒(質粒)。gRNA係在U6啟動子的控制下。使用了兩種不同的Cpf1拆分。拆分Cpf1構建體基於的是側接NLS的第一Cpf1融合構建體,其中FKBP經由GlySer接頭融合至拆分CPf1的C末端部分;以及側接NES的第二CPf1融合構建體,其中FRB經由GlySer接頭與拆分CPf1的N末端部分融合。為了分開第一Cpf1融合構建體和第二Cpf1融合構建體,在轉錄上使用P2A拆分。拆分Cpf1在雷帕黴素存在下顯示出與野生型類似的插入缺失資訊,但是在雷帕黴素不存在下顯示出比野生型顯著更少的indel資訊。
因此,提供了單一載體。該載體包含:
附接至誘導型二聚體的第一半部的第一Cpf1融合構建體,以及
附接至誘導型二聚體的第二半部的第二Cpf1融合構建體,
其中第一Cpf1融合構建體被可操作地連接至一個或多個核定位信號,
其中第二CPf1融合構建體被可操作地連接至一個或多個核輸出信號,
其中與誘導物能量源的接觸使得誘導型異源二聚體的第一半部和第二半部合在一起,
其中使誘導型異源二聚體的第一半部和第二半部合在一起允許第一CPf1融合構建體和第二CPf1融合構建體組成功能性Cpf1 CRISPR-Cas系統,
其中Cpf1 CRISPR-Cas系統包含含有能夠與細胞中的感興趣的基因組座位中的靶序列雜交的指導序列的指導RNA(gRNA),並且
其中功能性Cpf1 CRISPR-Cas系統結合靶序列並且視情況編輯基因組座位以改變基因表現。該等元件較佳的是被提供於單一構建體,例如一種表現盒上。
第一Cpf1融合構建體較佳的是在每個末端側接至少一個核定位信號。第二CPf1融合構建體較佳的是在每個末端側接至少一個核輸出信號。
還提供了一種治療有需要的受試者的方法,該方法包括藉由用編碼系統的多核苷酸或任一本發明載體轉化受試者來誘導基因編輯,並且向受試者給予誘導物能量源。還可以提供適合的修復模板,例如藉由包含所述修復模板的載體來遞送。
還提供了一種治療有需要的受試者的方法,該方法包括藉由用編碼本發明的系統的多核苷酸或任一本發明載體轉化受試者來誘導轉錄啟動或阻遏,其中所述多核苷酸或載體編碼或包含催化失活的Cpf1和一個或多個締合的功能結構域;該方法進一步包括向受試者給予誘導物能量源。
還提供了包含在所述治療方法中使用的本發明系統的組成物。還提供了本發明系統在用於此類治療方法的藥物的製造中的用途。
在此或在在此引用的文獻中描述了由本發明系統可治療的病狀實例。
單一載體可以包含轉錄物拆分劑,例如P2A。P2A將轉錄物拆分為兩部分,以分開第一CPf1融合構建體和第二CPf1融合構建體。拆分係歸因於“核糖體跳過(ribosomal skipping)”。實質上,核糖體在翻譯過程中跳過胺基酸,這使蛋白質股斷裂並且產生兩個分開的多肽/蛋白質。單一載體還有用於其中低背景活性不是所關注的但是需要高誘導活性的應用中。
一個實例係選殖的胚胎幹細胞系的產生。正常程序係用編碼wt CPf1或Cpf1切口酶的質粒暫態轉染。該等質粒產生Cpf1
分子,該等Cpf1分子持續若干天保留活性並且具有較高的脫靶活性機會。使用單一表現載體用於拆分Cpf1使得將“高Cpf1活性”限制於較短的時間窗(例如,一劑量的誘導物,諸如雷帕黴素)。在不是連續(每日的)誘導物(例如雷帕黴素)治療的情況下,單一表現的拆分Cpf1載體的活性較低並且呈現出減小的產生不想要的脫靶效應的機會。
在一些實施方式中誘導的Cpf1活性的峰值係有益的並且使用單一遞送載體可以更容易地發生,但是藉由雙重載體系統(每個載體遞送拆分CPf1的一個半部)也是可能的。峰值可以是高活性並且持續短時間尺度,典型地誘導物的壽命。
因此,提供了一種用於產生選殖的胚胎幹細胞系之方法,該方法包括用編碼本發明的系統的多核苷酸或表現本發明的拆分Cpf1的一種本發明載體轉染一個或多個胚胎幹細胞並且給予本發明的誘導物能量源或使一個或多個幹細胞與本發明能量源接觸以誘導Cpf1的重構。可以提供修復模板。
對於在此所述的所有方法,應瞭解的是,將需要適合的gRNA或指導序列。
在功能結構域等與酶的一個或另一個部分“締合”的情況下,該等典型地是融合物。在此術語“與......締合”係關於一個分子如何相對於另一個“締合的”,例如CPf1的部分與功能結構域之間的締合使用的。在此類蛋白質-蛋白質相互作用的情況下,此締合可以按照抗體識別表位的方式進行的識別來觀察。可替代地,一種蛋白質可以與另一種蛋白質經由兩者的融合來締合,例如一
種亞基融合至另一種亞基。典型地藉由將一個蛋白質的胺基酸序列添加到另一個蛋白質的胺基酸序列上,例如經由將編碼每個蛋白質或亞基的核苷酸序列剪接在一起來進行融合。可替代地,這可以實質上視為兩個分子之間的結合或直接連接,諸如融合蛋白。在任何情況下,融合蛋白可以包含兩個感興趣的亞基之間(即酶與功能結構域之間或轉接蛋白與功能結構域之間)的接頭。因此,在一些實施方式中,CPf1的部分藉由結合功能結構域來與該功能結構域締合。在其他實施方式中,CPf1與功能結構域締合,因為兩者視情況經由中間接頭融合在一起。接頭的實例包括在此所討論的GlySer接頭。
誘導物的其他實例包括光和激素類。對於光,誘導型二聚體可以是異源二聚體並且包含二聚體的第一光-誘導型半部和二聚體的第二(且互補的)光-誘導型半部。第一光-誘導型二聚體半部和第二光-誘導型二聚體半部的較佳的實例係CIB1和CRY2系統。CIB1結構域係光敏感隱花色素2(CRY2)的異源二聚體結合配偶體。
在另一個實例中,藍光-響應的磁體二聚化系統(正磁體和反磁體)可以融合至拆分Cpf1蛋白的兩個部分。響應於光刺激,正磁體和反磁體進行二聚化並且Cpf1重組裝。例如,此類系統結合尼洪佳吉(Nihongaki)等人(自然生物技術33,755-790,2015)中的Cas9進行描述。
本發明包括的誘導物能量源可以是熱、超音波、電磁能或化學品。在本發明的一個較佳的實施方式中,誘導物能量源
可以是抗生素、小分子、激素、激素衍生物、類固醇或類固醇衍生物。在一個更較佳的實施方式中,誘導物能量源可以是脫落酸(abscisic acid)(ABA)、多西環素(doxycycline)(DOX)、cumate、雷帕黴素、4-羥基他莫昔芬(4-hydroxytamoxifen)(4OHT)、雌激素或蛻皮激素。本發明提供的是,至少一種開關可以選自下組,該組由下項組成:基於抗生素的誘導型系統、基於電磁能的誘導型系統、基於小分子的誘導型系統、基於核受體的誘導型系統以及基於激素的誘導型系統。在一個更較佳的實施方式中,至少一種開關可以選自下組,該組由下項組成:四環素(Tet)/DOX誘導型系統、光誘導型系統、ABA誘導型系統、cumate阻遏物/操縱子系統、4OHT/雌激素誘導型系統、基於蛻皮激素的誘導型系統以及FKBP12/FRAP(FKBP12-雷帕黴素複合物)誘導型系統。此類誘導物也在此以及在PCT/US2013/051418中被討論,該專利藉由引用結合在此。
總的來說,可以由Cpf1,無論是wt、切口酶還是無效-Cpf1(具有或不具有締合的功能結構域),形成的任何用途可以使用本發明的拆分Cpf1方法實現。益處係保持Cpf1活性的可誘導性質。
作為另一個實例,可以形成拆分CPf1與螢光蛋白如GFP的融合物。這將允許基因組座位的成像(參見“藉由優化的CRISPR/Cas系統使活人類細胞中的基因組座位動態成像(Dynamic Imaging of Genomic Loci in Living Human Cells by an Optimized CRISPR/Cas System)”陳.B等人 細胞2013),但是以
誘導方式進行。這樣,在一些實施方式中,一個或多個Cpf1部分可以與螢光蛋白例如GFP締合(並且具體地是融合)。
另外的實驗研究了當中靶切割處於相同水平時,野生型(wt)和拆分Cpf1之間的脫靶切割是否存在差異。為了進行此舉,申請人使用wt和拆分Cpf1質粒的暫態轉染並且在不同時間點進行收穫。在發現一組其中中靶切割在+/-5%之內的樣品之後,申請人尋找脫靶啟動。申請人在沒有指導序列(使用慢病毒)的情況下使細胞系具有wt或拆分Cpf1的穩定表現。在抗生素選擇之後,使用單獨的慢病毒遞送指導序列並且在不同的時間點進行收穫以測定中靶/脫靶切割。
申請人將去穩定化序列(PEST,參見“mRNA-和蛋白質-去穩定化元件用於開發高度應答的報導系統之用途(Use of mRNA- and protein-destabilizing elements to develop a highly responsive reporter system)”文.DC(Voon DC)等人 核酸研究2005)引入到FRB(N)Cpf1-NES片段中以促進較快的降解並且因此促進拆分無效-Cpf1-VP64複合物穩定性的降低。
在本說明書中如其他地方所述的此類去穩定化序列(包括PEST)與拆分Cpf1系統一起使用可能是有利的。
產生了穩定地表現拆分的無效-Cpf1-VP64和MS2-p65-HSF1+指導序列的細胞系。PLX抗性篩選可以證明不可逆的、時控轉錄啟動可以用於藥物篩選中。當拆分的無效-Cpf1-VP64係不可逆的時,此方法可能是有利的。
在一個方面中,本發明提供了一種非天然存在或工程化的Cpf1 CRISPR-Cas系統,該系統可以包含至少一種開關,其中所述Cpf1 CRISPR-Cas系統的活性係藉由與關於該開關的至少一種誘導物能量源接觸來控制的。在本發明的一個實施方式中,關於至少一種開關的控制或所述Cpf1 CRISPR-Cas系統的活性可以得到啟動、增強、終止或阻遏。與至少一種誘導物能量源的接觸可以產生第一效應和第二效應。第一效應可以是下項中的一種或多種:核輸入、核輸出、次級組分(諸如效應分子)的募集、(蛋白質、DNA或RNA的)構象變化、切割、貨物(cargo)(諸如籠裝分子或輔助因子)的釋放、締合或解離。第二效應可以是下項中的一種或多種:關於至少一種開關的控制或所述Cpf1 CRISPR-Cas系統的活性的啟動、增強、終止或阻遏。在一個實施方式中,第一效應和第二效應可以級聯發生。
在本發明的另一個方面中,Cpf1 CRISPR-Cas系統可以進一步包含至少一個或多個核定位信號(NLS)、核輸出信號(NES)、功能結構域、柔性接頭、突變、缺失、改變或截短。NLS、NES或功能結構域中的一個或多個可以是條件型地啟動或失活。在另一個實施方式中,突變可以是下項中的一種或多種:轉錄因子同源區中的突變、DNA結合結構域中的突變(諸如使鹼性螺旋環螺旋的鹼性殘基突變)、內源性NLS中的突變或內源性NES中的突變。本發明包括的誘導物能量源可以是熱、超音波、電磁能或化學品。在本發明的一個較佳的實施方式中,誘導物能量源可以是抗生素、小分子、激素、激素衍生物、類固醇或類固醇衍生物。在一個更較佳的實施方式中,誘導物能量源可以是脫落酸(ABA)、
多西環素(DOX)、cumate、雷帕黴素、4-羥基他莫昔芬(4OHT)、雌激素或蛻皮激素。本發明提供的是,至少一種開關可以選自下組,該組由下項組成:基於抗生素的誘導型系統、基於電磁能的誘導型系統、基於小分子的誘導型系統、基於核受體的誘導型系統以及基於激素的誘導型系統。在一個更較佳的實施方式中,至少一種開關可以選自下組,該組由下項組成:四環素(Tet)/DOX誘導型系統、光誘導型系統、ABA誘導型系統、cumate阻遏物/操縱子系統、4OHT/雌激素誘導型系統、基於蛻皮激素的誘導型系統以及FKBP12/FRAP(FKBP12-雷帕黴素複合物)誘導型系統。
如本申請中詳述的控制的方面涉及至少一種或多種開關。如在此所用的術語“開關”係指組分系統或集合,其以協調方式起作用,以影響生物功能的變化,包括生物功能的所有方面,諸如該功能的啟動、阻遏、增強或終止。在一個方面中,術語開關涵蓋基因開關,該基因開關包括基因調節蛋白和該等蛋白質識別的特異性DNA序列的基本組分。在一個方面中,開關涉及在基因調節中使用的誘導和阻遏系統。總的來說,除非存在允許基因表現的一些分子(稱為誘導物),否則誘導型系統可以是關閉的。該分子被稱為“誘導表現”。此發生的方式依賴於控制機制以及細胞類型中的差異。阻遏系統係除了在一些分子(稱為輔阻遏物)的存在下之外,抑制基因表現的系統。該分子被稱為“阻遏表現”。這藉由其發生的方式依賴於控制機制以及細胞類型中的差異。如在此所用的術語“誘導型的”可以涵蓋開關的所有方面,與涉及的分子機制無關。因此,如由本發明包括的開關可以包括但不限於基於抗生素的誘導型系統、基於電磁能的誘導型系統、基於小分
子的誘導型系統、基於核受體的誘導型系統以及基於激素的誘導型系統。在較佳的實施方式中,開關可以是四環素(Tet)/DOX誘導型系統、光誘導型系統、脫落酸(ABA)誘導型系統、cumate阻遏物/操縱子系統、4OHT/雌激素誘導型系統、基於蛻皮激素的誘導型系統或FKBP12/FRAP(FKBP12-雷帕黴素複合物)誘導型系統。
本發明的Cpf1 CRISPR-Cas系統可以被設計為以時間和空間精確方式調控或改變個別內源性基因的表現。Cpf1 CRISPR-Cas系統可以被設計為結合感興趣的基因的啟動子序列以改變基因表現。Cpf1可以被拆分為兩個半部,其中一個半部融合至隱花色素異源二聚體(隱花色素-2或CIB1)的一個半部,而剩餘的隱花色素配偶體融合至Cpf1的另一半部。在一些方面中,轉錄效應物結構域還可以包含在Cpf1 CRISPR-Cas系統中。效應物結構域可以是活化物,諸如VP16、VP64或p65,或阻遏物諸如KRAB、EnR或SID。在未受刺激狀態,一個半部的Cpf1-隱花色素2蛋白質定位至感興趣的基因的啟動子,但不結合CIB1-效應蛋白。在用藍光譜光刺激後,隱花色素-2被啟動,經歷構象變化,並且揭示出其結合結構域。CIB1進而結合隱花色素-2,使得Cpf1的第二半部定位至感興趣的基因的啟動子區並且開啟可以產生基因過表現或沈默的基因組編輯。LITE的方面進一步描述於劉,H等人,科學,2008和甘迺迪.M(Kennedy M)等人,自然方法(Nature Methods)2010中,該等文獻的內容藉由引用以其整體結合在此。
可以進一步調控功能的活化物和阻遏物結構域可以
基於物種、強度、機制、持續時間、大小或任何數目的其他參數進行選擇。較佳的效應物結構域包括但不限於易位酶結構域、整合酶結構域、重組酶結構域、解離酶結構域、轉化酶結構域、蛋白酶結構域、DNA甲基轉移酶結構域、DNA脫甲基酶結構域、組蛋白乙醯化酶結構域、組蛋白脫乙醯化酶結構域、核酸酶結構域、阻遏物結構域、活化物結構域、核定位信號結構域、轉錄-蛋白質募集結構域、細胞攝取活性相關結構域、核酸結合結構域或抗體呈遞結構域。
同樣產生化學品誘導型系統存在若干種不同的方式:1.由脫落酸(ABA)誘導的基於ABI-PYL的系統(例如參見,stke.sciencemag.org/cgi/content/abstract/sigtrans;4/164/rs2處的網站),2.由雷帕黴素(或基於雷帕黴素的相關化學品)誘導的基於FKBP-FRB的系統(例如參見,nature.com/nmeth/journal/v2/n6/full/nmeth763.html處的網站),3.由赤黴素(GA)誘導的基於GID1-GAI的系統(例如參見,nature.com/nchembio/journal/v8/n5/full/nchembio.922.html處的網站)。
由本發明涵蓋的另一個系統係基於亞細胞定位中的變化的化學品誘導型系統。申請人還瞭解了一種被工程化為靶向感興趣的基因組座位的誘導型Cpf1 CRISPR-Cas系統,其中Cpf1酶被拆分為進一步連接至化學品或能量敏感蛋白質的不同部分的兩個融合構建體。在化學結合或能量轉移至化學品或能量敏感蛋白質之後,此化學品或能量敏感蛋白質使得CPf1酶的任一個半部的
亞細胞定位產生變化(即Cpf1酶的任一個半部從細胞質轉運到細胞的核中)。融合構建體從一個亞細胞區室或細胞器(在其中它的活性由於缺乏用於重構的Cpf1 CRISPR-Cas系統的底物而被隔離)到另一個亞細胞區室或細胞器(在其中存在底物)的這種轉運允許該等組分合在一起並且重構功能活性,並且然後允許該等組分與其所需底物(即哺乳動物核中的基因組DNA)接觸,並且產生靶基因表現的啟動或阻遏。
考慮了其他誘導型系統,諸如但不限於藉由下項進行的調節:重金屬[梅奧.KE(Mayo KE)等人,細胞1982,29:99-108;瑟爾.PF(Searle PF)等人,分子細胞生物學(Mol Cell Biol)1985,5:1480-1489和布林斯特.RL(Brinster RL)等人,自然(倫敦)1982,296:39-42]、類固醇激素[海恩斯.NE(Hynes NE)等人,美國國家科學院院刊1981,78:2038-2042;克勞克.G(Klock G)等人,自然(倫敦)1987,329:734-736和李.F(Lee F)等人,自然(倫敦)1981,294:228-232。]、熱休克[努爾.L(Nouer L):熱休克應答(Heat Shock Response),波卡拉頓(Boca Raton),FL:CRC;1991]並且已經開發了其他試劑[瑪律利克.A(Mullick A),馬西.B(Massie B):轉錄、翻譯以及基因表現的控制(Transcription,translation and the control of gene expression),在由斯皮爾.RE(Speir RE)編輯的細胞技術的百科全書(Encyclopedia of Cell Technology)中,威力公司(Wiley);2000:1140-1164以及菲斯尼格.M(Fussenegger M),生物技術進展(Biotechnol Prog)2001,17:1-51]。然而,對於該等誘導型哺乳動物啟動子存在局限性,諸如“關閉”狀態的“洩露”和誘導物(熱休克、重金屬、糖皮質激素等)的多效性。昆蟲激素
(蛻皮激素)的使用已在降低哺乳動物細胞中的細胞過程干擾的嘗試中提出[諾.D(No D)等人,美國國家科學院院刊1996,93:3346-3351]。另一種優良系統使用雷帕黴素作為誘導物[裡韋拉.VM(Rivera VM)等人,自然醫學1996,2:1028-1032],但雷帕黴素作為免疫抑制劑的作用係其體內使用的主要限制,並且因此需要發現用於控制基因表現的生物學惰性化合物[塞斯.E(Saez E)等人,美國國家科學院院刊2000,97:14512-14517]。
在特定實施方式中,在此所述的基因編輯系統處於密碼殺傷開關的控制下,該密碼殺傷開關(passcode kill switch)係當改變細胞條件時有效地殺傷宿主細胞的機制。這係藉由引入雜交體LacI-GalR家族轉錄因子來確保的,該等轉錄因子需要IPTG的存在以進行轉換(尚(Chan)等人2015自然 自然化學生物學(Nature Chemical Biology)doi:10.1038/nchembio.1979),並且可以用於驅動編碼對細胞存活關鍵的酶的基因。藉由將對不同化學品敏感的不同轉錄因子相結合,可以產生“代碼”。此系統可以用於在空間和時間上控制CRISPR誘導的遺傳修飾的程度,這在包括治療性應用的不同領域中可能是有意義的並且避免GMO從其預定的環境中“逃逸”也可能是有意義的。
自失活系統
一旦細胞基因組中的基因的所有拷貝已被編輯,則該細胞中的連續的CRISRP/Cpf1表現不再需要。實際上,持續的表現在非預定基因組位點等處的脫靶效應情況下將是不希望的。因此,時間限制的表現將是有用的。誘導型表現提供了一種途徑,但是
此外,申請人設想了依賴於CRISPR載體本身內的非編碼指導靶序列的用途的自失活CRISPR-Cpf1系統。因此,在表現開始之後,CRISPR系統將使得其自身破壞,但是在完全破壞之前,其將有編輯靶基因的基因組拷貝的時間(在二倍體細胞中的正常點突變的情況下,其需要至多兩次編輯)。簡單地,自失活CRISPR-Cas系統包括附加RNA(即指導RNA),該附加RNA靶向CRISPR酶本身的編碼序列或靶向與存在於以下項中的一種或多種中的獨特序列互補的一種或多種非編碼指導靶序列:
(a)在驅動非編碼RNA元件的表現的啟動子之內,
(b)在驅動Cpf1基因的表現的啟動子之內,
(c)在Cpf1編碼序列中的ATG翻譯起始密碼子的100bp之內,
(d)在病毒遞送載體,例如在AAV基因組中的反向末端重複序列(iTR)之內。
此外,RNA可以經由載體,例如單獨的載體或編碼CRISPR複合物的同一載體來遞送。當藉由單獨的載體來提供時,靶向Cpf1表現的CRISPR RNA可以依序或同時給予。當依序給予時,在意圖用於例如基因編輯或基因工程化的CRISPR RNA之後,將遞送靶向Cpf1表現的CRISPR RNA。此時間段可以是數分鐘(例如5分鐘、10分鐘、20分鐘、30分鐘、45分鐘、60分鐘)的時間。此時間段可以是數小時(例如2小時、4小時、6小時、8小時、12小時、24小時)的時間。此時間段可以是數天(例如2天、3天、4天、7
天)的時間。此時間段可以是數週(例如2週、3週、4週)的時間。此時間段可以是數月(例如2個月、4個月、8個月、12個月)的時間。此時間段可以是數年(例如2年、3年、4年)的時間。在此方式中,Cas酶與能夠與第一靶標諸如感興趣的一個基因組座位或多個基因組座位雜交的第一gRNA締合並且負責所希望的CRISPR-Cas系統的一種或多種功能(例如,基因工程化);並且隨後Cpf1酶可以接著與能夠與包含至少一部分的Cpf1或CRISPR盒的序列雜交的第二gRNA締合。在該gRNA靶向編碼Cpf1蛋白的表現的序列的情況下,該酶受到阻礙並且系統發生自失活。以相同方式,經由如在此解釋的例如脂質體、脂轉染、奈米粒子、微泡施用的靶向Cpf1表現的CRISPR RNA可以依序或同時給予。類似地,自失活可以用於對用來靶向一個或多個靶標的一個或多個指導RNA進行失活。
在一些方面中,提供了單一gRNA,該單一gRNA能夠與CRISPR酶起始密碼子下游的序列雜交,由此在一段時間後,存在CRISPR酶表現的喪失。在一些方面中,提供了一個或多個gRNA,該等gRNA能夠與編碼CRISPR-Cas系統的多核苷酸的一個或多個編碼或非編碼區雜交,由此在一段時間後,存在一種或多種、或在一些情況下全部的CRISPR-Cas系統的失活。在系統的一些方面中,並且不受理論限制,細胞可以包含多種CRISPR-Cas複合物,其中第一亞組的CRISPR複合物包含能夠靶向有待編輯的一個基因組座位或多個基因組座位的第一gRNA,並且第二亞組的CRISPR複合物包含能夠靶向編碼CRISPR-Cas系統的多核苷酸的至少一個第二gRNA,其中第一亞組的CRISPR複合物介導靶向的
一個基因組座位或多個基因組座位的編輯並且第二亞組的CRISPR複合物最終使CRISPR-Cas系統失活,從而使細胞中的進一步CRISPR-Cas表現失活。
因此,本發明提供了一種包含用於遞送至真核細胞的一種或多種載體,其中一種或多種載體編碼:(i)CRISPR酶,更具體地是Cpf1;(ii)能夠雜交至細胞中的靶序列的第一指導RNA;以及(iii)能夠雜交至編碼CRISPR酶的載體中的一個或多個靶序列的第二指導RNA,當在該細胞中表現時,第一指導RNA引導第一CRISPR複合物與該細胞中的靶序列的序列特異性結合;第二指導RNA引導第二CRISPR複合物與編碼CRISPR酶的載體中的靶序列的序列特異性結合;CRISPR複合物包含結合指導RNA的CRISPR酶,由此指導RNA可以與其靶序列雜交;並且第二CRISPR複合物使CRISPR-Cas系統失活以阻止細胞對CRISPR酶的連續表現。
在此其他地方揭露了一種或多種載體、編碼的酶、指導序列等的另外特性。該系統可以編碼(i)CRISPR酶,更具體地是Cpf1;(ii)包含能夠雜交至細胞中的第一靶序列的序列的第一gRNA,(iii)能夠雜交至編碼CRISPR酶的載體的第二指導RNA。類似地,酶可以包含一個或多個NLS等。
不同編碼序列(CRISPR酶、指導RNA)可以包含在單一載體上或多個載體上。例如,有可能編碼在一個載體上的酶和在另一個載體上的不同RNA序列,或者有可能編碼在一個載體上的酶和一個gRNA以及在另一個載體上的剩餘gRNA或任何其他
前突變。總的來說,使用總共一個或多個不同載體的系統係較佳的。
在使用多種載體的情況下,有可能以不相等的數目遞送它們,並且理想的是,其中編碼第一指導RNA的載體相對於編碼第二指導RNA的載體是過量的,從而有助於延遲CRISPR系統的最終失活,直到基因組編輯具有了發生的機會為止。
第一指導RNA可以靶向基因組內的感興趣的任何靶序列,如在此其他地方所述的。第二指導RNA靶向編碼CRISPR Cas9酶的載體內的序列,並且從而使來自該載體的酶的表現失活。因此,載體中的靶序列必須能夠使表現失活。適合的靶序列可以是例如在Cpf1編碼序列的翻譯起始密碼子附近或之內,在驅動非編碼RNA元件的表現的啟動子中的非編碼序列中,在驅動Cpf1基因的表現的啟動子之內,在Cpf1編碼序列中的ATG翻譯起始密碼子的100bp之內,和/或在病毒遞送載體,例如AAV基因組中的反向末端重複序列(iTR)之內。靠近此區域的雙股斷裂可以誘導Cpf1編碼序列的移碼,使得蛋白質表現喪失。用於使指導RNA“自失活”的替代性靶序列將旨在編輯/失活為CRISPR-Cpf1系統的表現或為載體的穩定性所需要的調節區/序列。例如,如果Cpf1編碼序列的啟動子被破壞,那麼轉錄可以被抑制或阻止。類似地,如果載體包含用於複製、維持性或穩定性的序列,那麼有可能靶向該等序列。例如,在AAV載體中,有用的靶序列係在iTR之內。其他有用的供靶向的序列可以是啟動子序列、多聚腺苷酸化(polyadenlyation)位點等。
此外,如果指導RNA以陣列格式表現,則同時靶向兩個啟動子的“自失活”指導RNA將使得間插核苷酸從CRISPR-Cas表現構建體內切除,有效地使得其完全失活。類似地,在指導RNA靶向兩個ITR,或同時靶向兩種或更多種其他CRISPR-Cas組分的情況下,發生間插核苷酸的切除。總的來說,如在此解釋的自失活係適用於CRISPR-Cpf1系統的,以便提供CRISPR-Cpf1的調節。例如,如在此解釋的自失活可以適用於如在此解釋的突變,例如擴增病症的CRISPR修復。作為此自失活的結果,CRISPR修復僅僅具有暫態活性。
向“自失活”指導RNA的5'端添加非靶向核苷酸(例如1-10個核苷酸,較佳的是1-5個核苷酸)可以用於延遲其加工和/或修飾其效力以作為確保CRISPR-Cpf1停止之前的靶向的基因組座位處的編輯的手段。
在自失活AAV-CRISPR-Cpf1系統的一個方面中,可以建立共表現感興趣的一種或多種gRNA靶向基因組序列(例如1-2、1-5、1-10、1-15、1-20、1-30)的質粒,其中靶向LbCpf1序列的“自失活”gRNA處於或靠近工程化的ATG起始位點(例如,在5個核苷酸之內、在15個核苷酸之內、在30個核苷酸之內、在50個核苷酸之內、在100個核苷酸之內)。U6啟動子區中的調節序列也可以用gRNA靶向。U6驅動的gRNA可以被設計為陣列格式,使得多個gRNA序列可以同時被釋放。當首先被遞送至靶組織/細胞(離開的細胞)時,gRNA開始積累,同時Cpf1水平在核中上升。Cpf1與介導CRISPR-Cpf1質粒的基因組編輯和自失活的所有gRNA複合。
自失活CRISPR-Cpf1系統的一個方面係由1至4或更多個不同指導序列;例如高達約20或約30個指導序列以單獨或串聯的陣列格式的表現。每個單個自失活指導序列可以靶向不同的靶標。這樣可以從例如一個嵌合pol3轉錄物開始加工。可以使用Pol3啟動子諸如U6或H1啟動子。Pol2啟動子諸如在此所提到的那些。反向末端重複(iTR)序列可以側接Pol3啟動子-一個或多個gRNA-Pol2啟動子-Cpf1。
嵌合串聯的陣列轉錄物的一個方面在於一種或多種指導序列編輯一個或多個靶標,而一個或多個自失活指導序列使CRISPR/Cpf1系統失活。因此,例如,用於修復擴增病症的所述CRISPR-Cpf1系統可以直接與在此所述的自失活CRISPR-Cpf1系統相結合。此系統可以例如具有針對供修復的靶區的兩個指導序列以及針對CRISPR-Cpf1的自失活的至少一個第三指導序列。參考申請案序號PCT/US2014/069897,題為“在核苷酸重複病症中使用Crispr-Cas系統的組成物和方法(Compositions And Methods Of Use Of Crispr-Cas Systems In Nucleotide Repeat Disorders)”,2014年12月12日以WO/2015/089351公開。
使用Cpf1的基因編輯或改變靶座位
雙股斷裂或一條股的單股斷裂應該有利地足以靠近靶位置,由此使得校正發生。在一實施方式中,距離不超過50、100、200、300、350或400個核苷酸。雖然不希望受理論約束,但是據信斷裂應該足以靠近靶位置,由此使得斷裂在在端切除過程中遭受外切核酸酶介導的移除的區之內。如果靶位置與斷裂之間
的距離太大,則突變可能不被包含在端切除中,並且因此可能不被校正,因為模板核苷酸序列僅可以用於校正端切除區內的序列。
在一個實施方式中,其中指導RNA和V型/VI型分子,具體地是Cpf1/C2c1/C2c2或其異種同源物或同源物,較佳的是Cpf1核酸酶誘導雙股斷裂,目的是為了誘導HDR-介導的校正,切割位點在離靶位置的0-200bp之間(例如0至175、0至150、0至125、0至100、0至75、0至50、0至25、25至200、25至175、25至150、25至125、25至100、25至75、25至50、50至200、50至175、50至150、50至125、50至100、50至75、75至200、75至175、75至150、75至125、75至100bp)。在一個實施方式中,切割位點係在離靶位置的0-100bp之間(例如0至75、0至50、0至25、25至100、25至75、25至50、50至100、50至75或75至100bp)。在另一個實施方式中,與Cpf1或其異種同源物或同源物複合的兩個或更多個指導RNA可以用於誘導多重斷裂,目的是為了誘導HDR介導的校正。
同源臂應該至少延伸至其中可以發生端切除的區,例如為了允許切除的單股突出端查找供體模板內的互補區。總體長度可能受參數諸如質粒大小或病毒包裝限制所限制。在一個實施方式中,同源臂可以不延伸到重複元件中。示例性同源臂長度包括至少50、100、250、500、750或1000個核苷酸。
如在此所用的,靶位置係指靶核酸或靶基因(例如染色體)上的藉由V型/VI型,具體地是Cpf1/C2c1/C2c2或其異種同源物或同源物,較佳的是Cpf1分子依賴性過程修飾的位點。例如,靶位置可以是進行靶核酸的修飾Cpf1分子切割和模板核酸引導的
修飾例如校正的靶位置。在一實施方式中,靶位置可以是處於靶核酸上的兩個核苷酸例如相鄰核苷酸之間、向其中添加一個或多個核苷酸的的位點。靶位置可以包含藉由模板核酸改變例如校正的一個或多個核苷酸。在一實施方式中,靶位置處於靶序列(例如指導RNA所結合的序列)之內。在一實施方式中,靶位置處於靶序列(例如指導RNA所結合的序列)的上游或下游。
如在此所用的術語模板核酸係指可以與V型/VI型分子,具體地是Cpf1/C2c1/C2c2或其異種同源物或同源物,較佳的是Cpf1分子和指導RNA分子結合使用來改變靶位置的結構的核酸序列。在一個實施方式中,靶核酸被修飾為典型地是在或靠近一個或多個切割位點處具有模板核酸的序列的一部分或全部。在一實施方式中,模板核酸係單股的。在一替代性實施方式中,模板核酸係雙股的。在一實施方式中,模板核酸係DNA,例如雙股DNA。在一替代性實施方式中,模板核酸係單股DNA。
在一實施方式中,模板核酸藉由參與同源重組改變了靶位置的結構。在一實施方式中,模板核酸改變了靶位置的序列。在一實施方式中,模板核酸使得修飾的或非天然發生的鹼基摻入到靶核酸中。
模板序列可以與靶序列一起經歷斷裂介導或催化的重組。在一實施方式中,模板核酸可以包含對應於靶序列上的被Cpf1介導的切割事件切割的位點的序列。在一實施方式中,模板核酸可以包含對應於兩者,即靶序列上的在第一Cpf1介導的事件中被切割的第一位點和靶序列上的在第二Cpf1介導的事件中被切
割的第二位點的序列。
在某些實施方式中,模板核酸可以包含使得翻譯序列的編碼序列中發生改變的序列,例如使得蛋白質產物中的一個胺基酸取代另一個胺基酸,例如使得突變型對偶基因轉化為野生型對偶基因,野生型對偶基因轉化為突變型對偶基因,和/或引入終止密碼子、插入胺基酸胺基、缺失胺基酸殘基,或使得無意義突變發生的序列。在某些實施方式中,模板核酸可以包含使得非編碼序列中發生改變,例如外顯子中或5'或3'非翻譯區或非轉錄區中發生改變的序列。此類改變包括控制元件,例如啟動子、增強子中的改變,以及順式作用或反式作用控制元件中的改變。
可以使用與靶基因中的靶位置具有同源性的模板核酸以改變靶序列的結構。模板序列可以用於改變不想要的結構,例如不想要的或突變的核苷酸。模板核酸可以包含當整合時產生下項的序列:降低正控制元件的活性;增加正控制元件的活性;降低負控制元件的活性;增加負控制元件的活性;減少基因的表現;增加基因的表現;增加對病症或疾病的抗性;增加對病毒進入的抗性;校正突變或改變不想要的胺基酸殘基,賦予、增加、廢除或減少基因產物的生物特性,例如增加酶的酶活性,或增加基因產物與另一個分子相互作用的能力。
模板核酸可以包含使得靶序列的1、2、3、4、5、6、7、8、9、10、11、12或更多個核苷酸的序列中發生變化的序列。在一個實施方式中,模板核酸的長度可以是20+/-10、30+/-10、40+/-10、50+/-10、60+/-10、70+/-10、80+/-10、90+/-10、100+/-10、110+/-
10、120+/-10、130+/-10、140+/-10、150+/-10、160+/-10、170+/-10、180+/-10、190+/-10、200+/-10、210+/-10或220+/-10個核苷酸。在一實施方式中,模板核酸的長度可以是30+/-20、40+/-20、50+/-20、60+/-20、70+/-20、80+/-20、90+/-20、100+/-20、110+/-20、120+/-20、130+/-20、140+/-20、150+/-20、160+/-20、170+/-20、180+/-20、190+/-20、200+/-20、210+/-20或220+/-20個核苷酸。在一實施方式中,模板核酸的長度係10至1,000、20至900、30至800、40至700、50至600、50至500、50至400、50至300、50至200或50至100個核苷酸。
模板核酸包含以下組分:[5'同源臂]-[替換序列]-[3'同源臂]。同源臂提供了染色體中的重組,因此用替換序列替換了不希望的元件,例如突變或特徵。在一實施方式中,同源臂側接最遠的切割位點。在一實施方式中,5'同源臂的3'端係靠近替換序列的5'端的位置。在一實施方式中,5'同源臂可以從替換序列的5'端延伸至少10、20、30、40、50、100、200、300、400、500、600、700、800、900、1000、1500或2000個核苷酸5'。在一實施方式中,3'同源臂的5'端係靠近替換序列的3'端的位置。在一實施方式中,3'同源臂可以從替換序列的3'端延伸至少10、20、30、40、50、100、200、300、400、500、600、700、800、900、1000、1500或2000個核苷酸3'。
在某些實施方式中,一個或兩個同源臂可以被縮短以避免包括某些序列重複元件。例如,5'同源臂可以被縮短以避免序列重複元件。在其他實施方式中,3'同源臂可以被縮短以避免序列
重複元件。在一些實施方式中,5'同源臂和3'同源臂兩者都可以被縮短以避免包括某些序列重複元件。
在某些實施方式中,用於校正突變的模板核酸可以被設計為用作單股的寡核苷酸。當使用單股的寡核苷酸時,5'同源臂和3'同源臂的長度可以在高達約200個鹼基對(bp)的範圍內,例如長度為至少25、50、75、100、125、150、175或200bp。
Cpf1效應蛋白複合物系統促進的非同源末端連接
在某些實施方式中,核酸酶誘導的非同源末端連接(NHEJ)可以用於靶基因特異性敲除。核酸酶誘導的NHEJ還可以用於去除(例如缺失)感興趣的基因中的序列。總體上,NHEJ藉由使兩個末端連接在一起來修復DNA的雙股斷裂;然而,總體上,只要兩個相容末端在恰好它們藉由雙鍵斷裂形成時被完美連接,原始序列就被恢復。在末端重新連接之前,雙鍵斷裂的DNA末端常常是酶加工的受試者,在一條或兩條股處產生核苷酸的添加或去除。這使得NHEJ修復位點處的DNA序列中存在插入和/或缺失(indel)突變。該等突變中的三分之二典型地改變閱讀框並且因此產生非功能蛋白。另外,維持閱讀框但插入或缺失大量的序列的突變可以破壞蛋白質的功能性。這係座位依賴性的,因為關鍵功能結構域中的突變可能比蛋白質的非關鍵區中的突變耐受性低。由NHEJ產生的indel突變在性質上是不可預測的;然而,在給定的斷裂位點處,某些indel序列係有利的並且是以群體來過度表示的,很可能是由於小的微同源區。缺失的長度可以廣泛地變化;最常見是在1-50bp範圍中,但是它們可以輕易大於50bp,例如它們可
以輕易達到大於約100-200bp。插入往往是較短的並且常常包含緊密圍繞斷裂位點的序列的短的重複。然而,有可能獲得大的插入,並且在該等情況下,插入的序列常常被跟蹤至基因組的其他區域或跟蹤至細胞中存在的質粒DNA。
因為NHEJ係誘變的方法,所以其還可以用於缺失小序列模體,只要特異性最終序列的產生是不需要的。如果雙股斷裂被靶向靠近短的靶序列,則由NHEJ修復導致的缺失突變常常跨越並且因此去除不想要的核苷酸。對於較大的DNA區段的缺失,引入兩個雙股斷裂(序列的每側上一個雙股斷裂)可以在末端之間產生NHEJ,其中去除了整個間插序列。這兩個方法可以用於缺失特異性DNA序列;然而,NHEJ的易出錯的性質仍可能在修復位點產生indel突變。
雙股切割的V型/VI型分子,具體地是Cpf1/C2c1/C2c2或其異種同源物或同源物,較佳的是Cpf1分子和單股或切口酶V型/VI型分子,具體地是Cpf1/C2c1/C2c2或其異種同源物或同源物,較佳的是Cpf1分子兩種均可以用於在此所述的方法和組成物中以產生NHEJ介導的indel。靶向基因,例如編碼區,例如感興趣基因的早期編碼區的NHEJ介導的indel可以用於敲除感興趣的基因(即消除該感興趣基因的表現)。例如,感興趣基因的早期編碼區包含緊跟著轉錄起始位點的序列,在編碼序列的第一外顯子內,或在轉錄起始位點的500bp內(例如,小於500、450、400、350、300、250、200、150、100或50bp)。
在一個實施方式中,其中指導RNA和V型/VI型分子,
具體地是Cpf1/C2c1/C2c2或其異種同源物或同源物,較佳的是Cpf1核酸酶產生了雙股斷裂,目的是為了誘導NHEJ介導的indel,指導RNA可以被構造成用於將一個雙股斷裂定位成緊密接近靶位置的核苷酸。在一實施方式中,切割位點可以是在離靶位置的0-500bp之間(例如,離靶位置少於500、400、300、200、100、50、40、30、25、20、15、10、9、8、7、6、5、4、3、2或1bp)。
在一實施方式中,其中與V型/VI型分子,具體地是Cpf1/C2c1/C2c2或其異種同源物或同源物,較佳的是Cpf1切口酶複合的兩個指導RNA誘導了兩個單股斷裂,目的是為了誘導NHEJ介導的indel,兩個指導RNA可以被構造成用於將兩個單股斷裂定位成向靶位置的核苷酸提供NHEJ修復。
Cpf1效應蛋白複合物可以遞送功能效應物
與藉由使DNA水平上的基因突變來永久性消除表現的CRISPR-Cas介導的基因敲除不同,CRISPR-Cas敲低(knockdown)允許藉由使用人工轉錄因素來暫時減少基因表現。使Cpf1蛋白諸如FnCpf1蛋白的兩個DNA切割結構域中的關鍵殘基突變(例如,FnCpf1蛋白的D917A和H1006A突變或根據AsCpf1蛋白的D908A、E993A、D1263A或根據LbCpf1蛋白的D832A、E925A、D947A或D1180A)使得催化失活的Cpf1產生。催化失活的Cpf1與指導RNA複合並且定位至由指導RNA的靶向結構域所指定的DNA序列,然而該Cpf1不切割靶DNA。失活的Cpf1蛋白諸如FnCpf1蛋白(例如D917A和H1006A突變)與效應物結構域例如轉錄阻遏結構域的融合能夠將效應物募集至由指導RNA所指定的任何DNA位點。在某
些實施方式中,Cpf1可以被融合至轉錄阻遏結構域並且被募集至基因的啟動子區。特別是對於基因阻遏,在此預期的是,阻斷內源性轉錄因子的結合位點將有助於下調基因表現。在另一個實施方式中,失活的Cpf1可以融合至染色質修飾蛋白。改變染色質狀態可以使得靶基因表現減少。
在一實施方式中,指導RNA分子可以被靶向已知的轉錄應答元件(例如,啟動子、增強子等)、已知的上游啟動序列,和/或疑似能夠控制靶DNA的表現的未知或已知功能的序列。
在一些方法中,可以使靶多核苷酸失活以實施細胞中的表現的修飾。例如,在CRISPR複合物與細胞中的靶序列結合後,靶多核苷酸失活,這樣使得該序列不被轉錄,該編碼蛋白不被產生,或者該序列不會像野生型序列一樣起作用。例如,可以使蛋白質或微小RNA編碼序列失活,這樣使得該蛋白質不被產生。
在某些實施方式中,CRISPR酶包含選自由D917A、E1006A和D1225A組成的組的一個或多個突變,並且/或者一個或多個突變係在CRISPR酶的RuvC結構域中或者是如在此所討論的其他方式的突變。在一些實施方式中,CRISPR酶在催化結構域中具有一個或多個突變,其中當轉錄時,同向重複序列形成單一莖環並且指導序列引導CRISPR複合物與靶序列的序列特異性結合,並且其中酶進一步包含功能結構域。在一些實施方式中,功能結構域係轉錄啟動結構域,較佳的是VP64。在一些實施方式中,功能結構域係轉錄阻遏結構域,較佳的是KRAB。在一些實施方式中,轉錄阻遏結構域係SID或SID的串聯體(例如SID4X)。在一些實施
方式中,功能結構域係表觀遺傳修飾結構域,以便提供表觀遺傳修飾酶。在一些實施方式中,功能結構域係啟動結構域,它可以是P65啟動結構域。
Cpf1效應蛋白複合物或其組分的遞送
藉由本揭露和本領域知識,CRISPR-Cas系統,特別是在此所述的新型CRISPR系統或其組分或其核酸分子(包括例如HDR模板)或編碼或提供其組分的核酸分子可以藉由在此一般和詳細描述的遞送系統來遞送。
載體遞送,例如質粒、病毒遞送:CRISPR酶,例如Cpf1和/或任一本發明RNA,例如指導RNA可以使用任何適合載體例如質粒或病毒載體諸如腺伴隨病毒(AAV)、慢病毒、腺病毒或其他病毒載體類型、或它們的組合來遞送。Cpf1和一個或多個指導RNA可以包裝到一種或多種載體例如質粒或病毒載體中。在一些實施方式中,載體例如質粒或病毒載體,例如,藉由肌肉注射遞送至感興趣的組織中,而有時遞送係經由靜脈內、經皮、鼻內、經口、黏膜或其他遞送方法進行的。此遞送可以經由單劑量或多劑量來進行。熟習該項技術者應理解的是,在此有待遞送的實際劑量可以在很大程度上取決於多種因素而變化,諸如載體選擇、靶細胞、生物體、或組織、有待治療的受試者的一般狀況、所尋求的轉化/修飾的程度、給藥途徑、給藥方式、所尋求的轉化/修飾的類型等。
此劑型可以進一步含有,例如,載體(水、鹽水、乙醇、甘油、乳糖、蔗糖、磷酸鈣、明膠、葡聚糖、瓊脂、果膠、花
生油、芝麻油等等)、稀釋劑、藥學上可接受的載體(例如,磷酸鹽緩衝鹽水)、藥學上可接受的賦形劑、和/或本領域已知的其他化合物。該劑型可以進一步含有一種或多種藥學上可接受的鹽,例如像,無機酸鹽諸如鹽酸鹽、氫溴酸鹽、磷酸鹽、硫酸鹽等;以及有機酸鹽,諸如乙酸鹽、丙酸鹽、丙二酸鹽、苯甲酸鹽等。另外,在此也可以存在輔助物質,諸如潤濕劑或乳化劑、pH緩衝物質、凝膠或膠凝材料、調味劑、著色劑、微球體、聚合物、懸浮劑等。此外,也可以存在一種或多種其他常規藥用成分,諸如防腐劑、保濕劑、懸浮劑、表面活性劑、抗氧化劑、抗結劑、填充劑、螯合劑、包衣劑、化學穩定劑等,尤其是在該劑型係呈可重構形式時。適合的示例性成分包括微晶纖維素、羧甲基纖維素鈉、聚山梨酯80、苯乙醇、三氯三級丁醇、山梨酸鉀、抗壞血酸、二氧化硫、沒食子酸丙酯、對羥基苯甲酸酯、乙基香蘭素、甘油、苯酚、對氯酚、明膠、白蛋白以及它們的組合。藥學上可接受的賦形劑的徹底論述可獲自雷明頓藥物科學(REMINGTON'S PHARMACEUTICAL SCIENCES)(馬克出版公司,紐約1991),該文獻藉由引用結合在此。
在在此的一個實施方式中,遞送係經由腺病毒進行的,其可以是含有至少1×105個腺病毒載體粒子(也稱為粒子單位,pu)的單次加強劑量。在在此的一實施方式中,該劑量較佳的是腺病毒載體的至少約1×106個粒子(例如,約1×106-1×1012個粒子),更較佳的是至少約1×107個粒子、更較佳的是至少約1×108個粒子(例如,約1×108-1×1011個粒子或約1×108-1×1012個粒子),並且最較佳的是至少約1×100個粒子(例如約1×109-1×1010
個粒子或約1×109-1×1012個粒子),或甚至至少約1×1010個粒子(例如,約1×1010-1×1012個粒子)。可替代地,該劑量包含不超過約1×1014個粒子,較佳的是不超過約1×1013個粒子,甚至更較佳的是不超過約1×1012個粒子,甚至更較佳的是不超過約1×1011個粒子,並且最較佳的是不超過約1×1010個粒子(例如,不超過約1×109個粒子)。因此,該劑量可以含有單劑量的腺病毒載體,其具有例如約1×106粒子單位(pu)、約2×106pu、約4×106pu、約1×107pu、約2×107pu、約4×107pu、約1×108pu、約2×108pu、約4×108pu、約1×109pu、約2×109pu、約4×109pu、約1×1010pu、約2×1010pu、約4×1010pu、約1×1011pu、約2×1011pu、約4×1011pu、約1×1012pu、約2×1012pu或約4×1012pu的腺病毒。參見,例如,在2013年6月4日授權的授予納貝爾(Nabel)等人的美國專利案號8,454,972 B2中的腺病毒載體;該專利藉由引用結合在此,以及在其第29欄第36-58行的劑量。在在此的一個實施方式中,腺病毒係經由多劑量來遞送的。
在在此的一個實施方式中,該遞送係經由AAV進行的。用於針對人類的AAV的體內遞送的治療有效劑量被認為處於含有從約1×1010至約1×1010個功能AAV/ml溶液的從約20至約50ml的鹽水溶液的範圍內。劑量可以被調整以便相對於任何副作用平衡治療益處。在在此的一個實施方式中,AAV劑量大致處於從約1×105至1×1050個基因組AAV、從約1×108至1×1020個基因組AAV、從約1×1010至約1×1016個基因組、或約1×1011至約1×1016個基因組AAV的濃度範圍內。人類劑量可以是約1×1013個基因組AAV。此類濃度可以從約0.001ml至約100ml、約0.05至約50ml、或約10
至約25ml的載體溶液進行遞送。藉由建立劑量應答曲線的常規試驗,熟習該項技術者可以容易地確立其他有效劑量。參見,例如,2013年3月26日授權的授予哈加(Hajjar)等人的美國專利案號8,404,658 B2,在第27欄,第45-60行。
在在此的一實施方式中,該遞送係經由質粒進行的。在此類的質粒組成物中,該劑量應該是足以引發應答的質粒的量。例如,在質粒組成物中的質粒DNA的適當量可以是從約0.1至約2mg,或從約1μg至約10μg/70kg個體。本發明的質粒大體上包含(i)啟動子;(ii)編碼CRISPR酶的序列,該序列可操作地連接至所述啟動子;(iii)選擇標記物;(iv)複製起點;以及(v)在(ii)的下游並可操作地連接至(ii)的轉錄終止子。質粒還可以編碼CRISPR複合物的RNA組分,但是該等組分中的一個或多個還可以被編碼在不同的載體上。
在此的劑量係基於平均70kg個體的。給藥頻率在醫學或獸醫學從業者(例如醫師、獸醫師)或本領域熟練的科學家的範圍之內。還應注意的是,實驗中使用的小鼠典型地是約20g並且來自小鼠實驗的小鼠可以提高至70kg的個體。
用於在此提供的組成物的劑量包括用於重複給予或重複給藥的劑量。在特定實施方式中,在數週、數月或數年的時間內進行重複給予。可以進行合適的測定來獲得最佳劑量方案。重複的給藥可以允許較低劑量的使用,這可以有利地影響脫靶修飾。
在一些實施方式中,本發明的RNA分子以脂質體或脂
轉染配製物等遞送並且可以是藉由熟習該項技術者已熟知的方法來製備。此類方法描述於例如美國專利案號5,593,972、5,589,466、以及5,580,859中,該等專利藉由引用結合在此。已開發了特別旨在增強並改進siRNA到哺乳動物細胞的遞送的遞送系統(例如,參見,沈(Shen)等人FEBS快報(FEBS Let.)2003,539:111-114;夏(Xia)等人,自然生物技術2002,20:1006-1010;賴希(Reich)等人,分子視覺(Mol.Vision.)2003,9:210-216;索倫森(Sorensen)等人,分子生物學雜誌(J.Mol.Biol.)2003,327:761-766;路易士(Lewis)等人,自然遺傳學(Nat.Gen.)2002,32:107-108以及西梅奧尼(Simeoni)等人,核酸研究(NAR)2003,31,11:2717-2724)並且該等遞送系統可以適用於本發明。siRNA最近已成功用於抑制靈長類動物中的基因表現(參見,例如托倫蒂諾(Tolentino)等人,視網膜(Retina)24(4):660,該文獻也可以適用於本發明)。
實際上,RNA遞送係可用的體內遞送方法。有可能使用脂質體或奈米粒子將Cpf1和gRNA(以及例如HR修復模板)遞送至細胞中。因此,本發明的CRISPR酶諸如Cpf1的遞送和/或RNA的遞送可以呈RNA形式並且經由微泡、脂質體或一個粒子或多個粒子來進行。例如,Cpf1 mRNA和gRNA可以包裝到脂質體粒子中以進行體內遞送。脂質體轉染試劑諸如來自生命技術公司(Life Technologies)的lipofectamine和市場上的其他試劑可以有效地將RNA分子遞送至肝臟中。
RNA遞送手段還較佳的是包括經由粒子的RNA遞送(卓.S.(Cho,S.)、金伯格.M.(Goldberg,M.)、松.S.(Son,S.)、
許.Q.(Xu,Q.)、楊.F.(Yang,F.)、梅.Y.(Mei,Y.)、博加特廖夫.S.(Bogatyrev,S.)、朗格.R.(Langer,R.)和安德森.D.(Anderson,D.),用於將小干擾RNA遞送至內皮細胞的脂質樣奈米粒子(Lipid-like nanoparticles for small interfering RNA delivery to endothelial cells),先進功能材料(Advanced Functional Materials),19:3112-3118,2010)或外來體(施羅德.A.(Schroeder,A.)、萊文斯.C.(Levins,C.)、科迪斯.C.(Cortez,C.)、朗格.R.和安德森.D.,用於siRNA遞送的基於脂質的奈米治療劑(Lipid-based nanotherapeutics for siRNA delivery),內科醫學雜誌(Journal of Internal Medicine),267:9-21,2010,PMID:20059641)。實際上,已經表明外來體在遞送siRNA中特別有用,其為與CRISPR系統有一些相似之處的系統。例如,艾爾安達盧西.S(El-Andaloussi S)等人(“外來體介導的體外和體內siRNA遞送”(“Exosome-mediated delivery of siRNA in vitro and in vivo.”),自然實驗手冊(Nat Protoc.)2012年12月;7(12):2112-26.doi:10.1038/nprot.2012.131,電子版2012年11月15日)描述了外來體如何對於跨不同的生物障壁的藥物遞送係有希望的工具並且可以用於體外和體內遞送siRNA。其途徑在於藉由轉染一包含與肽配位基融合的外來體蛋白的表現載體產生靶向的外來體。然後將該等外來體純化並且由轉染的細胞上清液進行表徵,然後將RNA載入到外來體中。根據本發明的遞送或給藥可以使用外來體進行,特別是但不限於腦。維生素E(α-生育酚)可以與CRISPR Cas軛合並且與高密度脂蛋白(HDL)一起遞送至腦,例如以與烏諾(Uno)等人完成的用於將短干擾RNA(siRNA)遞送至腦的類似方式(人類基因治療(HUMAN GENE
THERAPY)22:711-719(2011年6月))。經由用磷酸鹽緩衝鹽水(PBS)或游離TocsiBACE或Toc-siBACE/HDL充滿的並且與腦灌注套組3(Brain Infusion Kit 3)(Alzet)連接的微滲透壓泵(型號1007D;Alzet,庫栢蒂諾(Cupertino),加利福尼亞州(CA))灌注小鼠。將一腦灌注插管置於在正中線的前囪的後方約0.5mm,用於灌注到背側第三腦室中。烏諾等人發現,藉由相同的ICV灌注方法,少至3nmol的Toc-siRNA與HDL可以誘導相當程度的靶減少。在本發明中對於人類可以考慮類似劑量的軛合至α-生育酚並且與HDL共同給予靶向腦的CRISPR Cas,例如,可以考慮靶向腦的約3nmol至約3μmol的CRISPR Cas。鄒(Zou)等人(人類基因治療22:465-475(2011年4月))描述了靶向PKCγ的短髮夾RNA的慢病毒介導的遞送方法,其用於在大鼠脊髓中的體內基因沈默。鄒等人藉由鞘內導管給予約10μl的具有1×109個轉導單位(TU)/ml的滴度的重組慢病毒。在本發明中對於人類可以考慮類似劑量的在靶向腦的慢病毒載體中表現的CRISPR Cas,例如,可以考慮靶向腦的在具有1×109個轉導單位(TU)/ml的滴度的慢病毒中的約10-50ml的CRISPR Cas。
可以例如藉由電穿孔轉染包含Cpf1和crRNA的預組裝的重組體CRISPR-Cpf1複合物,從而產生高突變率且不存在可檢測的脫靶突變。戶珥,J.K.(Hur,J.K.)等人,藉由電穿孔Cpf1核糖核蛋白在小鼠中進行的靶向誘變(Targeted mutagenesis in mice by electroporation of Cpf1 ribonucleoproteins),自然生物技術,2016年6月6日doi:10.1038/nbt.3596.[電子版先於印刷版]
就腦的局部遞送而言,這可以藉由不同方式來實現。例如,可以例如藉由注射紋狀體內(intrastriatally)遞送材料。注射可以經由顱骨切開術立體定位地進行。
增強NHEJ或HR效率也有助於遞送。較佳的是,藉由共表現末端加工酶諸如Trex2(杜米特拉切(Dumitrache)等人 遺傳學(Genetics),2011年8月;188(4):787-797)來增強NHEJ效率。較佳的是,藉由暫態地抑制NHEJ機構諸如Ku70和Ku86來增加HR效率。HR效率還可以藉由共表現原核生物或真核生物同源重組酶諸如RecBCD、RecA來增加。
包裝和啟動子
將本發明的Cpf1編碼核酸分子例如DNA包裝到載體例如病毒載體中以介導體內修飾的方式包括:
˙為了實現NHEJ介導的基因敲除:
˙單病毒載體:
˙含有兩個或更多個表現盒的載體:
˙啟動子-Cpf1編碼核酸分子-終止子
˙啟動子-gRNA1-終止子
˙啟動子-gRNA2-終止子
˙啟動子-gRNA(N)-終止子(一直到載體的大小限制)
˙雙病毒載體:
˙含有用於驅動Cpf1表現的一表現盒的載體1
˙啟動子-Cpf1編碼核酸分子-終止子
˙含有用於驅動一個或多個指導RNA表現的一個或多個表現盒的載體2
˙啟動子-gRNA1-終止子
˙啟動子-gRNA(N)-終止子(一直到載體的大小限制)
˙用於介導同源定向修復。
˙除了以上所述的單病毒載體和雙病毒載體途徑之外,另外的載體可以用於遞送同源定向修復模板。
用於驅動Cpf1編碼核酸分子表現的啟動子可以包括:-AAV ITR可以充當一啟動子:這對於消除另外的啟動子元件(可能在載體中佔用空間)的需要係有利的。空出來的另外的空間可以用於驅動另外的元件(gRNA等)的表現。另外,ITR活性係相對較弱的,因此可以用於降低由於Cpf1的過表現所致的潛在毒性。
-對於遍存表現,可以使用的啟動子包括:CMV、CAG、CBh、PGK、SV40、鐵蛋白重鏈或輕鏈等。
對於腦或其他CNS表現,可以使用啟動子:用於所有神經元的突觸蛋白I(SynapsinI)、用於興奮性神經元的CaMKIIα、用於GABA能神經元的GAD67或GAD65或VGAT等。
對於肝臟表現,可以使用白蛋白啟動子。
對於肺表現,可以使用SP-B。
對於內皮細胞,可以使用ICAM。
對於造血細胞,可以使用IFNβ或CD45。
對於成骨細胞,可以使用OG-2。
用來驅動指導RNA的啟動子可以包括:
-Pol III啟動子諸如U6或H1
-使用Pol II啟動子和內含子盒來表現gRNA
腺伴隨病毒(AAV)
Cpf1和一個或多個指導RNA可以使用腺伴隨病毒(AAV)、慢病毒、腺病毒或其他質粒或病毒載體類型進行遞送,具體地說,使用來自以下文獻的配方和劑量:例如,美國專利案號8,454,972(針對腺病毒的配方、劑量)、8,404,658(針對AAV的配方、劑量)和5,846,946(針對DNA質粒的配方、劑量)以及來自臨床試驗和關於涉及慢病毒、AAV和腺病毒的臨床試驗的出版物。例如,對於AAV,給藥途徑、配方和劑量可以如美國專利案號8,454,972並且如涉及AAV的臨床試驗。對於腺病毒,給藥途徑、配方和劑量可以如美國專利案號8,404,658並且如涉及腺病毒的臨床試驗。對於質粒遞送,給藥途徑、配方和劑量可以如美國專利案號5,846,946並且如涉及質粒的臨床研究。劑量可以基於或外推為平均70kg的個體(例如成人男性),並且可以針對患者、受試者、不同重量和物種的哺乳動物進行調整。給藥頻率在醫學或獸醫學從業者(例如醫師、獸醫師)的範圍之內,其取決於常規因素,包
括患者或受試者的年齡、性別、一般健康狀況、其他狀況以及著手解決的特定病狀或症狀。可以將病毒載體注射到感興趣的組織中。對於細胞類型特異性基因組修飾,Cpf1的表現可以由細胞類型特異性啟動子驅動。例如,肝臟特異性表現可以使用白蛋白啟動子,並且神經元特異性表現(例如靶向CNS病症)可以使用突觸蛋白I啟動子。
就體內遞送而言,AAV相比於其他病毒載體係有利的,這係由於幾個原因:
低毒性(這可以歸因於純化方法不需要細胞粒子的可以啟動免疫應答的超速離心)以及
引起插入誘變的低概率,原因在於它未整合到宿主基因組中。
AAV具有4.5或4.75Kb的包裝限制。這意味著Cpf1以及啟動子和轉錄終止子必須都配合在同一個病毒載體中。大於4.5或4.75Kb的構建體將導致病毒產生的顯著降低。SpCas9係相當大的,該基因自身超過4.1Kb,使其難於包裝到AAV中。因此本發明的實施方式包括利用更短的Cpf1同源物。
關於AAV,AAV可以是AAV1、AAV2、AAV5或任何其組合。可以相對於有待被靶向的細胞來選擇AAV;例如,可以選擇用於靶向腦或神經元細胞的AAV血清型1、2、5或雜交體衣殼AAV1、AAV2、AAV5或其任何組合;並且可以選擇用於靶向心臟組織的AAV4。AAV8可用於遞送至肝臟。在此的啟動子和載體係單獨較佳的。關於該等細胞的某些AAV血清型的列表(參見,格
林姆.D(Grimm,D.)等人,病毒學雜誌(J.Virol.)82:5887-5911(2008))如下:
慢病毒
慢病毒係複雜的反轉錄病毒,其具有在有絲分裂細胞和有絲分裂後細胞兩者中感染並表現其基因的能力。最為人熟知的慢病毒係人類免疫缺陷病毒(HIV),其利用其他病毒的包膜糖蛋白來靶向廣泛範圍的細胞類型。
慢病毒可以如下製備。在選殖pCasES10(含有慢病毒轉移質粒骨架)之後,將處於低傳代數(p=5)的HEK293FT接種在T-75燒瓶中,以在轉染之前的一天在具有10%胎牛血清而沒有抗生素的DMEM中50%匯合。在20小時之後,將培養基更換為OptiMEM(無血清)培養基,並且在4小時後進行轉染。將細胞用10μg的慢病毒轉移質粒(pCasES10)和下列包裝質粒轉染:5μg的pMD2.G(VSV-g假型)和7.5μg的psPAX2(gag/pol/rev/tat)。在具有陽離子脂質遞送劑(50μL的Lipofectamine 2000和100μl的
Plus試劑)的4mL OptiMEM中進行轉染。在6小時之後,將培養基更換為具有10%胎牛血清的無抗生素的DMEM。該等方法在細胞培養過程中使用血清,但是較佳的是無血清的方法。
慢病毒可以如下純化。在48小時後收穫病毒上清液。首先清除上清液的碎片並藉由0.45μm的低蛋白結合(PVDF)過濾器進行過濾。然後將它們在超速離心機中以24,000rpm旋轉2小時。將病毒沈澱重新懸浮在50μl的DMEM中,在4℃下過夜。然後將它們等分,並且立即在-80℃下冷凍。
在另一個實施方式中,還考慮了基於馬傳染性貧血病毒(EIAV)的最小非靈長類動物慢病毒載體,特別是對於眼部基因治療而言(例如,參見巴拉岡(Balagaan),基因醫學雜誌(J Gene Med)2006;8:275-285)。在另一個實施方式中,還考慮了RetinoStat®,經由視網膜下注射遞送用於治療濕型年齡相關性黃斑變性的、表現血管生成抑制性蛋白(內皮抑素和血管抑素)的基於馬傳染性貧血病毒的慢病毒基因治療載體(例如,參見,賓利(Binley)等人,人類基因治療23:980-991(2012年9月))並且此載體可以被修改用於本發明的CRISPR-Cas系統。
在另一個實施方式中,自滅活慢病毒載體可以用於和/或適於本發明的CRISPR-Cas系統,該自滅活慢病毒載體具有靶向由HIV tat/rev共用的共有外顯子的siRNA、核仁定位TAR誘餌、和抗CCR5特異性錘頭狀核酶(例如,參見,迪吉斯托(DiGiusto)等人(2010)科學轉化醫學(Sci Transl Med)2:36ra43)。可以收集最少2.5×106個CD34+細胞/每千克患者體重並且以2×106個細
胞/ml的密度在X-VIVO 15培養基(龍沙公司(Lonza))中預刺激16至20小時,該培養基含有2μmol/L-穀胺醯胺、幹細胞因子(100ng/ml)、Flt-3配位基(Flt-3L)(100ng/ml)和促血小板生成素(10ng/ml)(CellGenix公司)。可以用慢病毒以感染複數5在75-cm2的包被有纖連蛋白(25mg/cm2)(重組人纖維連接片斷(RetroNectin),寶生物工程株式會社(Takara Bio Inc.))的組織培養瓶中轉導預刺激的細胞16至24小時。
慢病毒載體已揭露於帕金森病的治療中,例如參見美國專利公開案號20120295960以及美國專利案號7303910和7351585。慢病毒載體還已揭露於眼部疾病的治療中,例如參見美國專利公開案號20060281180、20090007284、US20110117189;US20090017543;US20070054961、US20100317109。還已揭露了將慢病毒載體遞送至腦,例如參見美國專利公開案號20110293571;US20110293571、US20040013648、US20070025970、US20090111106和美國專利案號US7259015。
RNA遞送
RNA遞送:該CRISPR酶,例如Cpf1,和/或任一本發明的RNA,例如指導RNA,也可以RNA的形式遞送。可以使用體外轉錄產生Cpf1 mRNA。例如,可以使用含有下列元件的PCR盒來合成Cpf1 mRNA:來自β球蛋白-polyA尾(一串120個或更多個的腺嘌呤)的T7_啟動子-科紮克(kozak)序列(GCCACC)-Cpf1-3' UTR。該盒可以用於經由T7聚合酶的轉錄。也可以使用體外轉錄從含有T7_啟動子-GG-指導RNA序列的盒來轉錄指導RNA。
為了增強表現並且降低可能的毒性,可以例如使用假-U或5-甲基-C將該CRISPR酶編碼序列和/或指導RNA修飾為包含一種或多種修飾核苷酸。
目前,mRNA遞送方法係特別有希望用於肝臟遞送。
關於RNA遞送的許多臨床工作已集中於RNAi或反義子上,但是該等系統可以適於遞送用於實施本發明的RNA。因此應該相應地理解下文關於RNAi等的參考。
粒子遞送系統和/或配製物:
已知若干種類型的粒子遞送系統和/或配製物可用於不同範圍的生物醫學應用中。總的來說,粒子被限定為關於其轉運和特性以整體單位表現的小物體。根據直徑將粒子進一步分類。粗粒子覆蓋介於2,500與10,000奈米之間的範圍。細粒子的大小介於100與2,500奈米之間。超細粒子或奈米粒子的大小大體上介於1與100奈米之間。100-nm限制的基準係在於區分粒子與本體材料的新特性典型地出現在100nm以下的臨界長度尺度下的事實。
如在此所用,粒子遞送系統/配製物被限定為包含根據本發明的粒子的任何生物遞送系統/配製物。根據本發明的粒子係具有小於100微米(μm)的最大尺寸(例如,直徑)的任一實體。在一些實施方式中,本發明粒子具有小於10μm的最大尺寸。在一些實施方式中,本發明粒子具有小於2000奈米(nm)的最大尺寸。在一些實施方式中,本發明粒子具有小於1000奈米(nm)的最大尺寸。在一些實施方式中,本發明粒子具有小於900nm、800nm、
700nm、600nm、500nm、400nm、300nm、200nm或100nm的最大尺寸。典型地,本發明粒子具有500nm或更小的最大尺寸(例如,直徑)。在一些實施方式中,本發明粒子具有250nm或更小的最大尺寸(例如,直徑)。在一些實施方式中,本發明粒子具有200nm或更小的最大尺寸(例如,直徑)。在一些實施方式中,本發明粒子具有150nm或更小的最大尺寸(例如,直徑)。在一些實施方式中,本發明粒子具有100nm或更小的最大尺寸(例如,直徑)。例如具有50nm或更小的最大尺寸的較小粒子使用在本發明的一些實施方式中。在一些實施方式中,本發明粒子具有介於25nm與200nm之間的範圍內的最大尺寸。
使用多種不同的技術進行粒子表徵(包括例如表徵形貌、尺寸等)。常見的技術係電子顯微術(TEM、SEM)、原子力顯微術(AFM)、動態光散射(DLS)、X-射線光電子光譜法(XPS)、粉末X-射線衍射(XRD)、傅裡葉變換紅外光譜(FTIR)、基質輔助的雷射解吸/電離-飛行時間質譜(MALDI-TOF)、紫外可見光譜、雙偏振干涉法和核磁共振(NMR)。可以對於天然粒子(即載入前)或在載入貨物(在此貨物係指例如CRISPR-Cas系統的一種或多種組分,例如CRISPR酶或mRNA或指導RNA或它們的任何組合,並且可以包括附加載體和/或賦形劑)之後進行表徵(尺寸測量)以為本發明的任何體外、離體和/或體內應用的遞送提供具有最佳尺寸的粒子。在某些較佳的實施方式中,粒子尺寸(例如直徑)表徵係基於使用動態光散射(DLS)的測量。關於粒子、其製備和使用方法以及其測量參考美國專利案號8,709,843;美國專利案號6,007,845;美國專利案號5,855,913;美國專利案號5,985,309;美
國專利案號5,543,158;以及詹姆斯.E..達爾曼(James E.Dahlman)和卡曼.巴恩斯(Carmen Barnes)等人 自然奈米科技(Nature Nanotechnology)(2014)的出版物,2014年5月11日線上公開,doi:10.1038/nnano.2014.84。
本發明範圍內的粒子遞送系統可以任何形式提供,包括但不限於固體、半固體、乳液或膠體粒子。這樣,在此所述的任一遞送系統,包括但不限於例如基於脂質的系統、脂質體、膠束、微泡、外來體或基因槍可以被提供作為本發明範圍內的粒子遞送系統。
粒子
應瞭解的是,在適當情況下,在此關於粒子或奈米粒子的參考可以是可互換的。可以使用粒子或脂質包膜同時遞送CRISPR酶mRNA和指導RNA;例如,本發明的CRISPR酶和RNA,例如作為複合物可以經由如達爾曼等人、WO2015089419 A2和在此引用的文獻中的粒子諸如7C1遞送(例如參見,詹姆斯.E..達爾曼和卡曼.巴恩斯等人 自然奈米科技(2014)2014年5月11日線上公開,doi:10.1038/nnano.2014.84),例如遞送粒子包含脂質或類脂質(lipidoid)和親水性聚合物,例如陽離子脂質和親水性聚合物,例如其中陽離子脂質包括1,2-二油醯基-3-三甲基銨-丙烷(DOTAP)或1,2-二十四醯基-sn-甘油基-3-磷酸膽鹼(DMPC)並且/或者其中親水性聚合物包括乙二醇或聚乙二醇(PEG);並且/或者其中粒子進一步包含膽固醇(例如來自配方1=DOTAP 100、DMPC 0、PEG 0、膽固醇0;配方編號2=DOTAP 90、DMPC 0、PEG 10、膽固醇
0;配方編號3=DOTAP 90、DMPC 0、PEG 5、膽固醇5的粒子),其中粒子使用有效、多步方法形成,其中首先將效應蛋白和RNA例如在室溫下例如以1:1莫耳比於例如無菌無核酸酶的1X PBS中混合在一起;並且單獨地,將適用於配方的DOTAP、DMPC、PEG和膽固醇溶解在醇,例如100%乙醇中;並且將兩種溶液混合在一起以形成含有複合物的粒子)。
可以使用粒子或脂質包膜同時遞送核酸靶向效應蛋白(諸如型V蛋白諸如Cpf1)mRNA和指導RNA。適合粒子的實例包括但不限於在US 9,301,923中描述的那些。
例如,蘇.X、弗裡克.J(Fricke J),卡瓦納.DG(Kavanagh DG),歐文.DJ(Irvine DJ)(“使用脂質包膜的pH響應性聚合物奈米粒子的體外和體內mRNA遞送(In vitro and in vivo mRNA delivery using lipid-enveloped pH-responsive polymer nanoparticles)”分子藥劑學(Mol Pharm.)2011年6月6;8(3):774-87.doi:10.1021/mp100390w,電子版2011年4月1日)描述了生物可降解的核-殼結構化的奈米粒子,其具有由磷脂雙層殼包膜的聚(β-胺基酯)(PBAE)核。該等被開發為用於體內mRNA遞送。該pH響應性PBAE組分被選擇為促進內體破壞,而該脂質表面層被選擇為將聚陽離子核的毒性降低到最低限度。因此,該等對於遞送本發明的RNA是較佳的。
在一個實施方式中,考慮了基於自組裝生物黏附聚合物的粒子/奈米粒子,其可以適用於肽的經口遞送、肽的靜脈內遞送以及肽的鼻遞送,均遞送至腦。其他實施方式,還考慮了諸如
疏水性藥物的經口吸收和眼部遞送。分子包膜技術涉及被保護並遞送至疾病位點的工程化聚合物包膜(例如參見,馬薩,M.(Mazza,M.)等人ACS奈米(ACSNano),2013.7(2):1016-1026;秀,A.(Siew,A.)等人 分子藥劑學,2012.9(1):14-28;拉拉特薩,A.(Lalatsa,A.)等人 控釋雜誌(J Contr Rel),2012.161(2):523-36;拉拉特薩,A.等人,分子藥劑學,2012.9(6):1665-80;拉拉特薩,A.等人 分子藥劑學,2012.9(6):1764-74;加勒特,N.L.(Garrett,N.L.)等人 生物光電雜誌(J Biophotonics),2012.5(5-6):458-68;加勒特,N.L.等人 拉曼光譜雜誌(J Raman Spect),2012.43(5):681-688;艾哈邁德,S.(Ahmad,S.)等人 皇家學會介面雜誌(J Royal Soc Interface)2010.7:S423-33;烏切克布,I.F.(Uchegbu,I.F.)藥物遞送專家評論(Expert Opin Drug Deliv),2006.3(5):629-40;曲,X.(Qu,X.)等人 生物大分子,2006.7(12):3452-9和烏切克布.I.F.等人 國際藥學雜誌(Int J Pharm),2001.224:185-199)。考慮了約5mg/kg的劑量,呈單劑量或多劑量形式,這取決於靶組織。
在一個實施方式中,可以使用由丹.安德森實驗室(Dan Anderson’s lab)在MIT開發的可以將RNA遞送至癌細胞以便使腫瘤生長停止的粒子/奈米粒子並且/或者使該等粒子/奈米粒子適於本發明的CRISPR Cas系統。具體地說,安德森實驗室開發了用於新生物材料和奈米配製物的合成、純化、表徵和配製的全自動化組合系統。例如參見,阿拉比(Alabi)等人,美國國家科學院院刊,2013年8月6號;110(32):12881-6;張等人,先進材料(Adv Mater.),2013年9月6日;25(33):4641-5;蔣(Jiang)等人,奈米快報(Nano Lett.),2013年3月13日;13(3):1059-64;卡拉吉安尼
斯(Karagiannis)等人,ACS奈米,2012年10月23日;6(10):8484-7;懷特海德(Whitehead)等人,ACS奈米,2012年8月28日;6(8):6922-9以及李等人,自然奈米技術,2012年6月3日;7(6):389-93。
美國專利申請20110293703涉及類脂質化合物,該等化合物在多核苷酸的給藥中也是特別有用的,其可以適用於遞送本發明的CRISPR Cas系統。在一個方面中,胺基醇類脂質化合物與有待遞送至細胞或受試者的藥劑結合而形成微粒子、奈米粒子、脂質體、或膠束。有待藉由粒子、脂質體、或膠束遞送的藥劑可以呈氣體、液體、或固體的形式,並且該藥劑可以是一種多核苷酸、蛋白質、肽、或小分子。胺基醇類脂質化合物可以與其他胺基醇類脂質化合物、聚合物(合成的或天然的)、表面活性劑、膽固醇、碳水化合物、蛋白質、脂質等結合而形成該等粒子。然後該等粒子可以視情況與藥物賦形劑結合而形成藥物組成物。
美國專利公開案號20110293703也提供了製備胺基醇類脂質化合物的方法。使胺的一種或多種等效物與環氧化物封端化合物的一種或多種等效物在適當條件下反應而形成本發明的胺基醇類脂質化合物。在某些實施方式中,胺的所有胺基基團與環氧化物封端化合物充分反應而形成三級胺。在其他實施方式中,胺的所有胺基基團未與環氧化物封端化合物完全反應形成三級胺,由此生成在胺基醇類脂質化合物中的一級胺或二級胺。該等一級胺或二級胺照原樣留下或者可以與另一種親電子劑諸如一種不同的環氧化物封端化合物反應。正如熟習該項技術者應瞭解的,胺
與未過量的環氧化物封端化合物反應將產生多種不同的具有不同數目的尾部的胺基醇類脂質化合物。某些胺類可以被兩個環氧化物衍生的化合物尾部完全功能化,而其他分子不會被環氧化物衍生的化合物尾部完全功能化。例如,二胺或多胺可以包括離開該分子的不同胺基部分的一個、二個、三個、或四個環氧化物衍生的化合物尾部,從而產生一級胺、二級胺和三級胺。在某些實施方式中,並不是所有胺基基團都被完全功能化。在某些實施方式中,使用了相同類型的環氧化物封端化合物中的兩種。在其他實施方式中,使用了兩種或更多種不同的環氧化物封端化合物。胺基醇類脂質化合物的合成係用或不用溶劑進行的,並且該合成可以在從30℃-100℃的範圍內,較佳的是在大約50℃-90℃的較高溫度下進行。視情況,可以將製備的胺基醇類脂質化合物純化。例如,可以純化胺基醇類脂質化合物的混合物以產生具有特定數目的環氧化物衍生的化合物尾部的胺基醇類脂質化合物。或者,該混合物可以被純化而產生特定的立體異構物或區域異構物。也可以使用鹵代烷(例如,碘甲烷)或其他烷化劑將該等胺基醇類脂質化合物烷化,並且/或者它們可以被醯化。
美國專利公開案號20110293703還提供了藉由發明方法製備的胺基醇類脂質化合物的文庫。可以使用涉及液體處理器、機器人、微量滴定板、電腦等的高通量技術製備和/或篩選該等胺基醇類脂質化合物。在某些實施方式中,篩選了該等胺基醇類脂質化合物的將多核苷酸或其他藥劑(例如,蛋白質、肽、小分子)轉染到細胞中的能力。
美國專利公開案號20130302401涉及已經使用組合聚合製備的一類聚(β-胺基醇)(PBAA)。該等發明的PBAA可以在生物技術和生物醫學應用中用作塗層(諸如用於醫療裝置或植入物的膜或多層膜的塗層)、添加劑、材料、賦形劑、生物防汙劑(non-biofouling agent)、微圖案化劑、以及細胞封裝劑。當用作表面塗層時,該等PBAA在體外和體內均引發不同水平的炎症,這取決於它們的化學結構。這類材料的巨大化學多樣性允許我們鑒定出在體外抑制巨噬細胞啟動的聚合物塗層。此外,在羧化聚苯乙烯微粒的皮下移植之後,該等塗層減少了炎症細胞的募集,並且減輕了纖維化。該等聚合物可以用於形成用於細胞封裝的聚合電解質複合物膠囊。本發明還可以具有許多其他的生物應用,諸如抗微生物塗層、DNA或siRNA遞送、以及幹細胞組織工程。美國專利公開案號20130302401的傳授內容可以適用於本發明的CRISPR Cas系統。在一些實施方式中,可以使用基於糖的粒子,例如如在此所述的GalNAc並且參考WO2014118272(藉由引用結合在此)以及耐爾,JK(Nair,JK)等人,2014,美國化學學會雜誌(Journal of the American Chemical Society)136(49),16958-16961)以及在此的傳授內容,除非另外表明,否則特別涉及適用於所有粒子的遞送。
在另一個實施方式中,考慮了脂質奈米粒子(LNP)。抗轉甲狀腺素蛋白小干擾RNA已被封裝在脂質奈米粒子中並且遞送至人類(例如參見,科爾賀(Coelho)等人,新英格蘭醫學雜
誌(N Engl J Med)2013;369:819-29),並且此系統可以適於並應用於本發明的CRISPR Cas系統。考慮了靜脈內給予約0.01至約1mg/kg體重的劑量。考慮了降低輸注相關反應的風險的藥物,諸如考慮到地塞米松(dexamethasone)、對乙醯胺基酚(acetampinophen)、苯海拉明(diphenhydramine)或西替利嗪(cetirizine)、以及雷尼替丁(ranitidine)。還考慮了約0.3mg/kg的多劑量,每4週一次,五個劑量。
LNP已經顯示在將siRNA遞送至肝臟中是高度有效的(例如參見塔韋內羅(Tabernero)等人,癌症發現(Cancer Discovery),2013年4月,第3卷,第4期,第363-470頁),並且因此被考慮用於將編碼CRISPR Cas的RNA遞送至肝臟。可以考慮6mg/kg的LNP的約四個劑量的用量,每兩週一次。塔韋內羅等人證明,在以0.7mg/kg給予LNP前2個週期之後,觀察到腫瘤消退,並且在6個週期結束之後,患者已經實現了部分應答,具有淋巴結轉移完全消退以及肝臟腫瘤的顯著萎縮。在此患者中給予40個劑量之後獲得完全應答,在接受經過26個月的劑量之後其保持緩解和完全治療。具有RCC和在用VEGF途徑抑制劑進行的在先治療之後進展的包括腎臟、肺以及淋巴結的肝外位點疾病的兩位患者在所有位點的疾病都保持穩定大約8至12個月,並且一位具有PNET和肝轉移的患者繼續在18個月(36個劑量)的延伸研究中保持疾病穩定。
然而,必須將LNP的電荷考慮在內。當陽離子脂質與帶負電的脂質結合時,誘導促進細胞內遞送的非雙層結構。因為
帶電荷的LNP在靜脈內注射之後迅速從循環中清除,所以開發了具有低於7的pKa值的可電離陽離子脂質(例如參見,羅辛(Rosin)等人,分子治療(Molecular Therapy),第19卷,第12期,第1286-2200頁,2011年12月)。帶負電荷的聚合物諸如RNA可以低pH值(例如,pH 4)載入到LNP中,在此pH時可電離脂質展示出正電荷。然而,在生理學pH值下,LNP表現出與更長的循環時間相容的低表面電荷。已經關注了四種可電離陽離子脂質,即1,2-二亞油醯基-3-二甲基銨-丙烷(DLinDAP)、1,2-二亞油基氧基-3-N,N-二甲基胺基丙烷(DLinDMA)、1,2-二亞油基氧基-酮基-N,N-二甲基-3-胺基丙烷(DLinKDMA)、以及1,2-二亞油基-4-(2-二甲基胺基乙基)-[1,3]-二氧戊環(DLinKC2-DMA)。已經表明,含有該等脂質的LNP siRNA系統在體內肝細胞中表現出顯著不同的基因沈默特性,具有根據採用因子VII基因沈默模型的DLinKC2-DMA>DLinKDMA>DLinDMA>>DLinDAP系列而變化的潛能(例如參見,羅辛等人,分子治療,第19卷,第12期,第1286-2200頁,2011年12月)。可以考慮1μg/ml LNP或LNP中或與LNP相關聯的CRISPR-Cas RNA的劑量,尤其是對於含有DLinKC2-DMA的配製物而言。
LNP的製備和CRISPR Cas封裝可以使用和/或改編自羅辛等人,分子治療,第19卷,第12期,第1286-2200頁,2011年12月)。陽離子脂質1,2-二亞油醯基-3-二甲基銨-丙烷(DLinDAP)、1,2-二亞油基氧基-3-N,N-二甲基胺基丙烷(DLinDMA)、1,2-二亞油基氧基酮基-N,N-二甲基-3-胺基丙烷(DLinK-DMA)、1,2-二亞油基-4-(2-二甲基胺基乙基)-[1,3]-二氧戊環(DLinKC2-DMA)、(3-
o-[2"-(甲氧基聚乙二醇2000)琥珀醯]-1,2-二肉豆蔻醯基-sn-乙二醇(PEG-S-DMG)、以及R-3-[(ω-甲氧基-聚(乙二醇)2000)胺甲醯]-1,2-二肉豆蔻醯氧基丙基-3-胺(PEG-C-DOMG)可以由泰米拉製藥公司(Tekmira Pharmaceuticals)(溫哥華(Vancouver),加拿大(Canada))提供或合成。膽固醇可以購自西格瑪公司(Sigma)(聖路易斯(St Louis),密蘇里州(MO))。特異性CRISPR Cas RNA可以封裝在含有DLinDAP、DLinDMA、DLinK-DMA和DLinKC2-DMA的LNP中(陽離子脂質:DSPC:CHOL:PEGS-DMG或PEG-C-DOMG,莫耳比為40:10:40:10)。在需要時,可以摻入0.2% SP-DiOC18(英傑公司(Invitrogen),伯靈頓(Burlington),加拿大)來評估細胞攝取、細胞內遞送和生物分佈。可以藉由以下方式來進行封裝:將由陽離子脂質:DSPC:膽固醇:PEG-c-DOMG(40:10:40:10莫耳比)組成的脂質混合物溶解在乙醇中,直至最終脂質濃度為10mmol/l。可以將脂質的此乙醇溶液逐滴添加到pH 4.0的50mmol/l檸檬酸鹽中以形成多層囊泡,從而產生30%(體積/體積)乙醇的終濃度。在使用擠出機(北方脂質公司(Northern Lipids),溫哥華,加拿大)藉由兩個重疊的80nm Nuclepore聚碳酸酯過濾器擠出多層囊泡之後,可以形成大的單層囊泡。可以藉由如下步驟實現封裝:將溶解在含有30%乙醇(體積/體積)的pH 4.0的50mmol/l檸檬酸鹽中的2mg/ml的RNA逐滴添加到擠出的預成形的大單層囊泡中,並且在31℃下培養30分鐘,伴隨持續混合直至最終的RNA/脂質重量比為0.06/1(重量/重量)。藉由使用Spectra/Por 2再生纖維素透析膜在pH 7.4的磷酸鹽緩衝鹽水(PBS)中透析16小時進行乙醇的去除以及配製緩衝液的中和。可以使用NICOMP
370型粒徑分析儀、囊泡/強度模式以及高斯擬合藉由動態光散射測定奈米粒子粒徑分佈(Nicomp粒徑分析儀,聖巴巴拉市(Santa Barbara),加利福尼亞州)。對於所有三個LNP系統的粒徑可以是~70nm的直徑。可以藉由使用VivaPureD MiniH柱(賽多利斯斯泰迪生物技術公司(Sartorius Stedim Biotech))從分析前後收集的樣品中去除游離RNA來確定RNA封裝效率。可以從洗提的奈米粒子中提取封裝的RNA並且將其在260nm下量化。藉由使用來自美國瓦克化學公司(Wako Chemicals USA)(里士滿(Richmond),維吉尼亞州(VA))的膽固醇E酶測定法測量囊泡中的膽固醇含量來確定RNA與脂質的比率。與在此的LNP和PEG脂質的論述結合,PEG化的脂質體或LNP同樣適合於CRISPR-Cas系統或其組分的遞送。
大LNP的製備可以使用和/或改編自羅辛等人,分子治療,第19卷,第12期,第1286-2200頁,2011年12月。可以在含有50:10:38.5莫耳比的DLinKC2-DMA、DSPC和膽固醇的乙醇中製備脂質預混物溶液(20.4mg/ml總脂質濃度)。可以0.75:1的莫耳比(乙酸鈉:DLinKC2-DMA)將乙酸鈉添加到脂質預混物中。隨後可以藉由將該混合物與1.85倍體積的檸檬酸鹽緩衝液(10mmol/l,pH 3.0)在劇烈攪拌下合併來使脂質水合,從而使得自發脂質體在含有35%乙醇的水性緩衝液中形成。可以在37℃下培養該脂質體溶液以允許粒徑的時間依賴性增加。可以藉由動態光散射(奈米粒徑電位分析儀(Zetasizer Nano ZS),瑪律文儀器公司(Malvern Instruments),烏斯特郡(Worcestershire),英國(UK))在培養過程中的不同時間處去除等分試樣來研究脂質體尺寸的變
化。一旦實現所希望的粒徑,可以將水性PEG脂質溶液(儲備溶液=在35%(體積/體積)乙醇中的10mg/ml PEG-DMG)添加到該脂質體混合物中,以產生3.5%總脂質的最終PEG莫耳濃度。在添加PEG-脂質之後,該等脂質體應該其大小,有效抑制進一步生長。然後可以大約1:10(重量:重量)的RNA與總脂質比率將RNA添加到空脂質體中,然後在37℃下培養30分鐘以形成載入的LNP。隨後可以將該混合物在PBS中透析過夜,並且用0.45-μm的注射過濾器(syringe filter)進行過濾。
球形核酸(SNATM)構建體和其他奈米粒子(尤其是金奈米粒子)也被考慮作為將CRISPR-Cas系統遞送至預期靶標的手段。重要資料表明,基於核酸功能化的金奈米粒子的AuraSense治療性球形核酸(SNATM)構建體係可用的。
可以與在此的教授內容結合使用的文獻包括:卡特勒(Cutler)等人,美國化學學會雜誌2011 133:9254-9257,郝(Hao)等人,Small.2011 7:3158-3162,張等人,ACS奈米2011 5:6962-6970,卡特勒等人,美國化學學會雜誌2012 134:1376-1391,楊(Young)等人,奈米快報2012 12:3867-71,鄭(Zheng)等人,美國國家科學院院刊2012 109:11975-80,米爾金(Mirkin),奈米醫學(Nanomedicine)2012 7:635-638張等人 美國化學學會雜誌2012 134:16488-1691,因特勞布(Weintraub),自然2013 495:S14-S16,崔(Choi)等人,美國國家科學院院刊2013 110(19):7625-7630,詹森(Jensen)等人,科學轉化醫學5,209ra152(2013)以及米爾金等人,Small,10:186-192。
具有RNA的自組裝奈米粒子可以用PEG化的聚乙烯亞胺(PEI)構建,其中Arg-Gly-Asp(RGD)肽配位基附接在聚乙二醇(PEG)的遠端。此系統已作為例如靶向表現整聯蛋白的腫瘤新血管系統的手段和作為遞送抑制血管內皮生長因子受體2(VEGF R2)表現以及由此實現腫瘤血管新生的siRNA的手段(例如參見,施弗勒斯(Schiffelers)等人,核酸研究,2004,第32卷,第19期)。奈米叢(Nanoplexes)可以藉由以下方式製備:將等體積的陽離子聚合物水性溶液和核酸水性溶液混合,以在2至6範圍內產生可電離氮(聚合物)相比磷酸鹽(核酸)的淨莫耳過量。在陽離子聚合物與核酸之間的靜電相互作用使得聚複合物(polyplexes)形成,該聚複合物具有約100nm的平均粒徑分佈,因此在此稱之為奈米叢。設想了CRISPR Cas的約100至200mg的劑量,用於施弗勒斯等人的自組裝奈米粒子中的遞送。
巴特利特(Bartlett)等人的奈米叢(美國國家科學院院刊,2007年9月25日,第104卷,第39期)也可以適用於本發明。巴特利特等人的奈米叢藉由以下方式製備:將等體積的陽離子聚合物水性溶液和核酸水性溶液混合,以在2至6範圍內產生可電離氮(聚合物)相比磷酸鹽(核酸)的淨莫耳過量。在陽離子聚合物與核酸之間的靜電相互作用使得聚複合物形成,該聚複合物具有約100nm的平均粒徑分佈,因此在此稱為奈米叢。巴特利特等人的DOTA-siRNA合成如下:1,4,7,10-四氮雜環十二烷-1,4,7,10-四乙酸單(N-羥基琥珀醯亞胺酯)(DOTA-NHS酯)訂購自Macrocyclics公司(達拉斯(Dallas),德克薩斯州(TX))。將於碳酸鹽緩衝液(pH 9)中的具有100倍莫耳過量的DOTA-NHS-酯的胺修飾的
RNA有義股添加到微量離心管中。藉由在室溫攪拌4h使該等內容物反應。將該DOTA-RNA有義軛合物用乙醇沈澱,重新懸浮在水中,並且退火到未修飾的反義股上以產生DOTA-siRNA。所有液體用Chelex-100(伯樂公司(Bio-rad),赫庫斯(Hercules),加利福尼亞州)預處理,以便去除痕量金屬污染物。可以藉由使用含有環糊精的聚陽離子形成Tf靶向和非靶向的siRNA奈米粒子。典型地,以3(+/-)的進料比和0.5克/升的siRNA濃度在水中形成奈米粒子。用Tf(金剛烷-PEG-Tf)修飾在靶向奈米粒子表面上的百分之一的金剛烷-PEG分子。將奈米粒子懸浮在用於注射的5%(重量/體積)葡萄糖載體溶液中。
大衛斯(Davis)等人(自然,第464卷,2010年4月15日)進行了使用靶向的奈米粒子遞送系統的RNA臨床試驗(臨床試驗登記號NCT00689065)。在21天週期的第1、3、8和10天藉由30min的靜脈內輸注對患有標準護理治療難治的實體癌的患者給予靶向的奈米粒子劑量。該等奈米粒子由合成遞送系統組成,該系統含有:(1)線性的、基於環糊精的聚合物(CDP),(2)展示在奈米粒子外部上的用於接合癌細胞表面上的TF受體(TFR)的人轉鐵蛋白(TF)靶向配位基,(3)親水性聚合物(用於促進奈米粒子在生物流體中的穩定性的聚乙二醇(PEG)),以及(4)被設計為降低RRM2(先前在臨床中使用的序列指代為siR2B+5)表現的siRNA。長久以來已知TFR在惡性細胞中被下調,並且RRM2係一種確立的抗癌靶標。已經顯示該等奈米粒子(臨床版本指代為CALAA-01)在非人類靈長類動物中的多劑量研究中耐受性良好。雖然已經藉由脂質體遞送向患有慢性粒細胞白血病的單一患者給
予了siRNA,但是大衛斯等人的臨床試驗係初期人類試驗,該試驗用靶向遞送系統全身性地遞送siRNA並且治療患有實體癌的患者。為了確定該靶向遞送系統是否能夠將功能性siRNA有效遞送至人類腫瘤,大衛斯等人研究了來自三個不同的劑量組群的三位患者的活組織檢查;患者A、B和C,他們均患有轉移性黑素瘤並且分別接受了18、24和30mg m-2 siRNA的CALAA-01劑量。還可以針對本發明的CRISPR Cas系統考慮類似的劑量。用含有線性的基於環糊精的聚合物(CDP)、展示在奈米粒子外部上的用於接合癌細胞表面上的TF受體(TFR)的人轉鐵蛋白(TF)靶向配位基和/或親水聚合物(例如,用於促進奈米粒子在生物流體中的穩定性的聚乙二醇(PEG))的奈米粒子,可以實現本發明的遞送。
就本發明而言,較佳的是使用奈米粒子或脂質包膜遞送CRISPR複合物的一種或多種組分,例如CRISPR酶或mRNA或指導RNA。其他遞送系統或載體可以與本發明奈米粒子方面結合使用。
總的來說,“奈米粒子”係指具有小於1000nm直徑的任何粒子。在某些較佳的實施方式中,本發明奈米粒子具有500nm或更小的最大尺寸(例如,直徑)。在其他較佳的實施方式中,本發明奈米粒子具有介於25nm與200nm之間的範圍內的最大尺寸。在其他較佳的實施方式中,本發明奈米粒子具有100nm或更小的最大尺寸(例如,直徑)。在其他較佳的實施方式中,本發明奈米粒子具有在35nm與60nm之間的範圍內的最大尺寸。
本發明中涵蓋的奈米粒子(Nanoarticles)可以提供為
不同的形式,例如為固體奈米粒子(例如金屬(諸如銀、金、鐵、鈦)、非金屬、基於脂質的固體、聚合物)、奈米粒子的懸浮液、或它們的組合。可以製備金屬、絕緣體和半導體奈米粒子,以及雜合結構(例如核-殼奈米粒子)。如果由半導體材料製備的奈米粒子足夠小(典型地亞-10nm)以至於出現電子能級的量子化,則該等奈米粒子還可以是標記量子點。此類奈米級粒子作為藥物載體或成像劑用於生物醫學應用中並且可以適於本發明中的類似目的。
半固體和軟奈米粒子以被製造出並且處於本發明的範圍之內。半固體性質的原型奈米粒子係脂質體。目前,不同類型的脂質體奈米粒子在臨床上用作用於抗癌藥物和疫苗的遞送系統。具有一半親水性和另一半疏水性的奈米粒子被稱為雙面(Janus)粒子並且用於穩定化乳液是特別有效的。它們可以在水/油介面處自組裝並且充當固體表面活性劑。
美國專利案號8,709,843(藉由引用結合在此)提供了用於將含有治療劑的粒子靶向遞送至組織、細胞和細胞內區室的藥物遞送系統。本發明提供了包含軛合至表面活性劑、親水性聚合物或脂質的聚合物的靶向粒子。
美國專利案號6,007,845(藉由引用結合在此)提供了下述粒子:該等粒子具有藉由將多官能化合物與一種或多種疏水性聚合物和一種或多種親水性聚合物共價地連接而形成的多嵌段共聚合物的核,並且含有生物活性材料。
美國專利案號5,855,913(藉由引用結合在此)提供了下述顆粒組成物:該組成物含有具有小於0.4g/cm3振實密度以及
介於5μm與30μm之間的平均直徑的空氣動力學光粒子,在其表面上摻入了表面活性劑,以用於向肺部系統的藥物遞送。
美國專利案號5,985,309(藉由引用結合在此)提供了下述粒子:該等粒子摻入了表面活性劑和/或帶正電荷或帶負電荷的治療劑或診斷劑和帶相反電荷的分子的親水性或疏水性複合物,以用於向肺部系統的遞送。
美國專利案號5,543,158(藉由引用結合在此)提供了生物可降解可注射粒子,該等粒子具有生物可降解實心核,該核在其表面上含有生物活性材料和聚(烷撐二醇)部分。
WO2012135025(也以US20120251560公開)(藉由引用結合在此)描述了軛合的聚乙烯亞胺(PEI)聚合物和軛合的氮雜大環(統稱為“一個軛合微質體(lipomer)”或“多個微質體(lipomers)”)。在某些實施方式中,可以設想的是,此類軛合微質體可以用於CRISPR-Cas系統的情況中以在體外、離體和在體內實現基因組干擾,從而修飾基因表現,包括蛋白質表現的調控。
在一個實施方式中,奈米粒子可以是環氧化物修飾的脂質-聚合物,有利地是7C1(例如參見,詹姆斯.E..達爾曼和卡曼.巴恩斯等人,自然奈米科技(2014)2014年5月11日線上公開,doi:10.1038/nnano.2014.84)。C71係藉由使C15環氧化物封端脂質與PEI600以14:1莫耳比反應合成的,並且與C14PEG2000一起進行配製以產生奈米粒子(直徑介於35與60nm之間),該等奈米粒子在PBS溶液中穩定至少40天。
環氧化物修飾的脂質-聚合物可以用於將本發明的CRISPR-Cas系統遞送至肺部、心血管或腎細胞,然而,熟習該項技術者可以將該系統適配成遞送其他靶器官。設想了在從約0.05至約0.6mg/kg範圍內的劑量。還設想了在數天或數週內的劑量,總劑量為約2mg/kg。
外來體
外來體係轉運RNA和蛋白質的內源性奈米囊泡,並且可以將RNA遞送至腦和其他靶器官。為了降低免疫原性,阿爾瓦雷斯-爾維蒂(Alvarez-Erviti)等人(2011,自然生物技術29:341)使用了用於外來體產生的自我衍生的樹突細胞。藉由將樹突細胞工程化為表現Lamp2b(一種外來體膜蛋白,融合至神經元特異性RVG肽)實現對腦的靶向。藉由電穿孔使純化的外來體載入外源性RNA。靜脈內注射的RVG靶向的外來體將GAPDH siRNA特異性地遞送至腦中的神經元、小膠質細胞、少突神經膠質細胞,導致特異性的基因敲低。預暴露於RVG外來體未減弱敲低,並且在其他組織中未觀察到非特異性攝取。藉由BACE1的強的mRNA(60%)和蛋白質(62%)敲低證明了外來體介導的siRNA遞送的治療潛能,BACE1係一種阿茲海默症中的治療靶標。
為了獲得免疫惰性的外來體庫,阿爾瓦雷斯-爾維蒂等人收穫了來自具有同源主要組織相容性複合體(MHC)單倍型的近交C57BL/6小鼠的骨髓。由於未成熟樹突細胞產生大量的缺乏T細胞啟動劑諸如MHC-II和CD86的外來體,阿爾瓦雷斯-爾維蒂(Alvarez-Erviti)等人選擇了具有粒細胞/巨噬細胞集落刺激因子
(GM-CSF)的樹突細胞,持續7天。次日,使用良好建立的超速離心方案從培養上清液中純化外來體。產生的外來體在物理上是均質的,具有直徑為80nm的粒徑分佈峰,如藉由奈米粒子跟蹤分析(NTA)和電子顯微鏡檢查所測定。阿爾瓦雷斯-爾維蒂等人獲得了6-12μg的外來體(基於蛋白質濃度測量的)/106個細胞。
其次,阿爾瓦雷斯-爾維蒂等人研究了使用適於奈米級應用的電穿孔方案給修飾的外來體載入外源性貨物的可能性。由於電穿孔對於奈米級的膜粒子尚未良好表徵,使用非特異性Cy5標記的RNA用於電穿孔方案的經驗優化。在外來體超速離心和溶解之後測定了封裝的RNA量。在400V和125μF下的電穿孔產生RNA的最大保留並且用於所有的後續實驗。
阿爾瓦雷斯-爾維蒂等人向正常C57BL/6小鼠給予被封裝在150μg的RVG外來體中的150μg的每種BACE1 siRNA並且將敲低效率與四個對照進行比較:未處理的小鼠、僅用RVG外來體注射的小鼠、用與一種體內陽離子脂質體試劑複合的BACE1 siRNA注射的小鼠、以及用與RVG-9R複合的BACE1 siRNA注射的小鼠,該RVG肽與靜電結合siRNA的9個D-精胺酸軛合。在給藥之後3天,分析皮層組織樣品,並且在siRNA-RVG-9R處理的和siRNARVG外來體處理的小鼠中均觀察到顯著的蛋白質敲低(45%,P<0.05,相對於62%,P<0.01),這係由於BACE1 mRNA水平的顯著降低(分別為66%[+或-]15%,P<0.001和61%[+或-]13%,P<0.01)。此外,申請人證明了在RVG-外來體處理的動物中總[β]-澱粉樣蛋白1-42水平上的顯著降低(55%,P<0.05),該β澱粉樣
蛋白為在阿茲海默症理學中的澱粉樣白斑的主要成分。所觀察到的降低大於在心室內注射BACE1抑制劑之後的正常小鼠中展示的β澱粉樣蛋白1-40降低。阿爾瓦雷斯-爾維蒂等人在BACE1切割產物上進行了5'-cDNA末端快速擴增(RACE),其提供了經由siRNA的RNAi-介導的敲低的證據。
最後,阿爾瓦雷斯-爾維蒂等人藉由評估IL-6、IP-10、TNFα和IFN-α血清濃度研究了RNA-RVG外來體是否誘導了體內免疫應答。在外來體處理之後,類似於與強有力地刺激IL-6分泌的siRNA-RVG-9R相反的siRNA轉染試劑處理,登記了在所有細胞介素上的非顯著性變化,證實了該外來體處理的免疫惰性屬性(profile)。假定外來體僅封裝20%的siRNA,用RVG-外來體的遞送比RVG-9R遞送顯得更有效,因為用少五倍的siRNA實現了相當的mRNA敲低和更好的蛋白質敲低,而沒有相應水平的免疫刺激。這個實驗證明了RVG-外來體技術的治療潛力,其潛在地適合於與神經變性疾病相關的基因的長期沈默。阿爾瓦雷斯-爾維蒂等人的外來體遞送系統可以適用於將本發明的CRISPR-Cas系統遞送至治療靶標,尤其是神經變性疾病。對於本發明可以考慮封裝在約100至1000mg的RVG外來體中的約100至1000mg的CRISPR Cas的劑量。
艾爾.安達盧西(El-Andaloussi)等人(自然實驗手冊(Nature Protocols)7,2112-2126(2012))揭露了可以如何利用來源於培養的細胞的外來體用於體外和體內遞送RNA。這個方案首先描述了藉由轉染一種包含與肽配位基融合的外來體蛋白的表現
載體產生靶向的外來體。接著,艾爾.安達盧西等人解釋了如何純化和表徵來自轉染的細胞上清液的外來體。接著,艾爾.安達盧西等人詳述了將RNA載入到外來體中的關鍵步驟。最後,艾爾.安達盧西等人概述了如何使用外來體有效地在體外遞送RNA以及體內遞送至小鼠腦中。還提供了預期結果的實例,其中外來體介導的RNA遞送藉由功能測定和成像來評價。整個方案進行~3週。根據本發明的遞送或給藥可以使用從自我衍生的樹突細胞產生的外來體來進行。根據在此的教授內容,這可以應用在本發明的實踐中。
在另一個實施方式中,考慮了瓦爾葛籣(Wahlgren)等人的血漿外來體(核酸研究,2012年,第40卷,第17期,e130)。外來體係由包括樹突細胞(DC)、B細胞、T細胞、肥大細胞、上皮細胞和腫瘤細胞的許多細胞類型產生的奈米尺寸的囊泡(30-90nm大小)。該等囊泡藉由晚期內體的向內出芽而形成,並且然後在與質膜融合後釋放到細胞外環境。因為外來體天然地在細胞之間運送RNA,所以這種特性在基因治療中可能有用,並且根據本揭露可以應用在本發明的實踐中。
來自血漿的外來體可以藉由以下方式製備:以900g離心血沈棕黃層20min以便分離血漿,然後收穫細胞上清液,以300g離心10min以便消除細胞,並且以16500g離心30min,然後藉由0.22mm過濾器進行過濾。藉由以120000g超速離心70min使外來體沈澱。根據在RNAi人類/小鼠啟動(Starter)套組(凱傑公司(Quiagen),希爾頓(Hilden),德國)中的製造商說明進行siRNA到外來體中的化學轉染。siRNA以終濃度2mmol/ml添加到100ml
PBS中。在添加HiPerFect轉染試劑之後,將該混合物在室溫下培養10min。為了去除過量的膠束,使用醛/硫酸鹽乳膠珠再分離外來體。可以類似於siRNA進行CRISPR Cas到外來體中的化學轉染。外來體可以與從健康供體的外週血中分離的單核細胞和淋巴細胞共培養。因此,可以考慮的是,可以將含有CRISPR Cas的外來體引入到人類的單核細胞和淋巴細胞中並且以自體方式再引入到人類中。因此,可以使用血漿外來體進行根據本發明的遞送或給藥。
脂質體
可以用脂質體進行根據本發明的遞送或給藥。脂質體係球形囊泡結構,其由圍繞內部水性區室的單層或多層脂質雙層以及相對不可滲透的外部親脂性磷脂雙層構成。脂質體作為藥物遞送載體受到了相當的重視,因為它們係生物相容、無毒的,可以遞送親水性和親脂性藥物分子,保護它們的貨物免於被血漿酶降解,並且轉運它們的負荷跨過生物膜和血腦障壁(BBB)(對於評述,例如參見,斯普奇(Spuch)和納瓦羅(Navarro),藥物遞送雜誌(Journal of Drug Delivery),第2011卷,文獻標識碼469679,第12頁,2011.doi:10.1155/2011/469679)。
可以由幾種不同類型的脂質製造脂質體;然而,磷脂最常用來產生作為藥物載體的脂質體。雖然當脂質膜與一種水性溶液混合時脂質體形成係自發的,但是也可以藉由使用均質機、超音波破碎器、或擠出設備藉由以振盪的形式施加力使其加速(對於評述,例如參見,斯普奇和納瓦羅,藥物遞送雜誌,第2011卷,文獻標識碼469679,第12頁,2011.doi:10.1155/2011/469679)。
可以將幾種其他的添加劑添加到脂質體中,以便修飾其結構和特性。例如,可以將膽固醇或鞘磷脂添加到脂質體混合物中,以便幫助穩定化脂質體結構並且防止脂質體內部貨物的洩漏。此外,脂質體由氫化卵磷脂醯膽鹼或卵磷脂醯膽鹼、膽固醇和磷酸二鯨蠟脂製備,並且脂質體的平均囊泡尺寸被調整到約50nm和100nm。(對於評述,例如參見,斯普奇和納瓦羅,藥物遞送雜誌,第2011卷,文獻標識碼469679,第12頁,2011.doi:10.1155/2011/469679)。
脂質體配製物可以是主要由天然磷脂和脂質諸如1,2-二硬脂醯-sn-甘油基-3-磷脂醯膽鹼(DSPC)、鞘磷脂、卵磷脂醯膽鹼和單唾液醯神經節苷酯構成。因為這種配製物僅由磷脂組成,所以脂質體配製物已經遇到了許多挑戰,其中之一係在血漿中的不穩定性。已經做出戰勝該等挑戰的若干嘗試,特別是在脂質膜的處理方面。該等嘗試之一集中於膽固醇的處理。將膽固醇添加到常規配製物中減緩了封裝的生物活性化合物到血漿中的迅速釋放,或者添加1,2-二油醯基-sn-甘油基-3-磷酸乙醇胺(DOPE)增加穩定性(對於評述,例如參見,斯普奇和納瓦羅,藥物遞送雜誌,第2011卷,文獻標識碼469679,第12頁,2011.doi:10.1155/2011/469679)。
在一個特別有利的實施方式中,特洛伊木馬(Trojan Horse)脂質體(也稱為分子特洛伊木馬)係令人希望的並且方案可見於http://cshprotocols.cshlp.org/content/2010/4/pdb.prot5407.long。該
等粒子允許轉基因在血管內注射之後遞送至整個腦。在不受限制的情況下,據信表面軛合有特異性抗體的中性脂質粒子允許經由胞吞作用跨過血腦障壁。申請人假定利用特洛伊木馬脂質體將核酸酶的CRISPR家族經由血管內注射遞送至腦,這將允許全腦轉基因動物,而不需要胚胎操縱。對於脂質體中的體內給藥,可以考慮約1-5g的DNA或RNA。
在另一個實施方式中,CRISPR Cas系統或其組分可以脂質體諸如穩定的核酸脂質粒子(SNALP)來給予(例如,參見,莫里西等人,自然生物技術,第23卷,第8期,2005年8月)。考慮每日靜脈內注射約1、3或5mg/kg/天的SNALP中的被靶向的特異性CRISPR Cas。日治療可以經過約三天,並且然後每週治療持續約五週。在另一個實施方式中,還考慮了藉由以約1或2.5mg/kg的劑量靜脈內注射給予封裝有特異性CRISPR Cas的SNALP(例如參見,齊默爾曼(Zimmerman)等人,自然快報(Nature Letters),第441卷,2006年5月4日)。該SNALP配製物可以含有為2:40:10:48的莫耳百分比的脂質3-N-[(w甲氧基聚(乙二醇)2000)胺甲醯]-1,2-二肉豆蔻氧基-丙胺(PEG-C-DMA)、1,2-二亞油基氧基-N,N-二甲基-3-胺基丙烷(DLinDMA)、1,2-二硬脂醯-sn-甘油基-3-磷酸膽鹼(DSPC)和膽固醇(例如參見,齊默爾曼等人,自然快報,第441卷,2006年5月4日)。
在另一個實施方式中,已經證明穩定的核酸-脂質粒子(SNALP)將分子有效地遞送至高度血管化的HepG2-衍生的肝臟腫瘤,但是不遞送至血管化不良的HCT-116衍生的肝臟腫瘤(例
如參見,李,基因治療(2012)19,775-780)。可以藉由以下方式製備SNALP脂質體:使用25:1的脂質/siRNA比率和48/40/10/2的膽固醇/D-Lin-DMA/DSPC/PEG-C-DMA的莫耳比,用二硬脂醯磷脂醯膽鹼(DSPC)、膽固醇和siRNA配製D-Lin-DMA和PEG-C-DMA。生成的SNALP脂質體的大小為約80-100nm。
在又另一個實施方式中,SNALP可以包含合成膽固醇(西格瑪-奧德里奇公司(Sigma-Aldrich),聖路易斯,密蘇里州,美國)、二棕櫚醯磷脂醯膽鹼(阿凡提極地脂質公司(Avanti Polar Lipids),阿拉巴斯特(Alabaster),阿拉巴馬州(AL),美國)、3-N-[(w-甲氧基聚(乙二醇)2000)胺甲醯]-1,2-二肉豆蔻氧基丙基胺,以及陽離子的1,2-二亞油基氧基-3-N,N二甲基胺基丙烷(例如參見,蓋斯伯特(Geisbert)等人,柳葉刀(Lancet)2010;375:1896-905)。例如可以考慮靜脈內推注給予約2mg/kg總CRISPR Cas/劑的劑量。
在又另一個實施方式中,SNALP可以包含合成膽固醇(西格瑪-奧德里奇公司)、1,2-二硬脂醯基-sn-甘油基-3-磷酸膽鹼(DSPC;阿凡提極地脂質公司)、PEG-cDMA,以及1,2-二亞油基氧基-3-(N;N-二甲基)胺基丙烷(DLinDMA)(例如參見,賈奇(Judge),臨床研究雜誌(J.Clin.Invest.)119:661-673(2009))。用於體內研究的配製物可以包含約9:1的最終脂質/RNA質量比。
已經由阿爾尼拉姆製藥公司(Alnylam Pharmaceuticals)的巴羅斯(Barros)和格羅布(Gollob)評論了RNAi奈米藥物的安全性曲線(例如參見,先進藥物遞送評論
(Advanced Drug Delivery Reviews)64(2012)1730-1737)。穩定的核酸脂質粒子(SNALP)由四種不同的脂質構成一在低pH下為陽離子的可電離脂質(DLinDMA)、中性輔助脂質、膽固醇以及可擴散的聚乙二醇(PEG)-脂質。該粒子的直徑為大約80nm並且在生理pH下是電中性的。在配製過程中,該可電離脂質用於在粒子形成過程中使脂質與陰離子RNA縮合。當在漸增的酸性內體條件下帶正電荷時,該可電離的脂質還介導了SNALP與內體膜的融合,從而能夠將RNA釋放到細胞質中。該PEG-脂質在配製過程中穩定化粒子並且減少聚集,並且隨後提供改進藥代動力學特性的中性的親水性外部。
到目前為止,已經使用具有RNA的SNALP配製物開始兩個臨床項目。泰米拉製藥公司最近在具有升高的LDL膽固醇的成年志願者中完成了SNALP-ApoB I期單劑量研究。ApoB主要是在肝臟和空腸中表現,並且是為VLDL和LDL的組裝和分泌所必需的。十七位受試者接受了SNALP-ApoB的單劑量(跨7個劑量水平的劑量遞增)。沒有肝臟毒性(預期為基於臨床前研究的潛在劑量限制性毒性)的證據。處於最高劑量的(兩位中的)一位受試者經歷了與免疫系統刺激一致的流感樣症狀,並且做出結束該試驗的決定。
阿爾尼拉姆製藥公司已經類似地推出了ALN-TTR01,其採用以上所述的SNALP技術並且靶向突變體和野生型TTR的肝細胞產生,以治療TTR澱粉樣變性(ATTR)。已經描述了三種ATTR綜合症:家族性澱粉樣變性多神經病(FAP)和家族性澱粉樣心肌
病(FAC)-兩者均由TTR中的常染色體顯性突變引起;以及由野生型TTR引起的老年全身性澱粉樣變性(SSA)。最近在具有ATTR的患者中完成了ALN-TTR01的安慰劑對照單劑量遞增I期試驗。向31位患者(23位用研究藥物,8位用安慰劑)在0.01至1.0mg/kg(基於siRNA)的劑量範圍內以15分鐘靜脈內輸注給予ALN-TTR01。治療耐受性良好,其中在肝功能試驗中沒有顯著增加。在0.4mg/kg時在23位患者的3位中注意到輸注相關反應;所有患者均對減慢輸注速率做出了響應並且所有患者繼續參與研究。在處於1mg/kg的最高劑量(如根據臨床前和NHP研究預期的)的兩位患者中注意到血清細胞介素IL-6、IP-10和IL-1ra的最小與暫態升高。在1mg/kg時觀察到ALN-TTR01的預期藥效動力學效應,即,血清TTR的降低。
在又另一個實施方式中,可以藉由將陽離子脂質、DSPC、膽固醇以及PEG-脂質例如以40:10:40:10的莫耳比分別溶解在例如乙醇中來製備SNALP(參見,森普爾(Semple)等人,自然生物技術,第28卷,第2期,2010年2月,第172-177頁)。將該脂質混合物添加到水性緩衝液中(50mM檸檬酸鹽,pH 4),混合至最終的乙醇和脂質濃度分別為30%(體積/體積)和6.1mg/ml,並且使得其在22℃下平衡2min,然後擠出。使用Lipex擠出儀(北方脂質公司),在22℃下將水合脂質擠出藉由兩個重疊的80nm孔徑大小的過濾器(Nuclepore),直到獲得如藉由動態光散射分析測定的70-90nm直徑的囊泡為止。這大致需要1-3道次。將該siRNA(溶解在50mM檸檬酸鹽中,pH為4的含有30%乙醇的水性溶液)以約~5ml/min的速率在混合下添加到預平衡的(35℃)囊泡中。
在達到0.06(重量/重量)的最終靶siRNA/脂質比率之後,將該混合物在35℃下另外培養30min,以允許囊泡重組和siRNA的封裝。然後去除乙醇並且藉由透析或切向流滲濾用PBS(155mM NaCl,3mM Na2HPO4,1mM KH2PO4,pH 7.5)替換外部緩衝液。使用受控的逐步稀釋法工藝將siRNA封裝在SNALP中。KC2-SNALP的脂質組分為以57.1:7.1:34.3:1.4的莫耳比使用的DLin-KC2-DMA(陽離子脂質)、二棕櫚醯磷脂醯膽鹼(DPPC;阿凡提極地脂質公司)、合成膽固醇(西格瑪公司)和PEG-C-DMA。在形成載入的粒子後,將SNALP在PBS中透析並且在使用之前藉由0.2μm的過濾器滅菌過濾。平均粒徑為75-85nm,並且將90%-95%的siRNA封裝在脂質粒子之內。用於體內測試的在配製物中的最終siRNA/脂質比率係~0.15(重量/重量)。在臨使用之前將含有因子VII siRNA的LNP-siRNA系統在無菌PBS中稀釋到適當濃度,並且藉由側尾靜脈以10ml/kg的總體積靜脈內給藥。這種方法和該等系統可以外推到本發明的CRISPR Cas系統。
其他脂質
其他陽離子脂質,諸如胺基脂質2,2-二亞油基-4-二甲基胺基乙基-[1,3]-二氧戊環(DLin-KC2-DMA)可以類似於SiRNA地用來封裝CRISPR Cas或其組分或對其編碼的一個或多個核酸分子(例如參見,加雅拉曼(Jayaraman),德國應用化學(Angew.Chem.Int.Ed.)2012,51,8529-8533),並且因此可以應用於本發明的實踐中。可以考慮具有下列脂質組成的預成型囊泡:分別處於莫耳比40/10/40/10的胺基脂質、二硬脂醯磷脂醯膽鹼
(DSPC)、膽固醇和(R)-2,3-雙(十八烷氧基)丙基-1-(甲氧基聚(乙二醇)2000)丙基碳酸酯(PEG-脂質),以及大約0.05(w/w)的FVII siRNA/總脂質比率。為了確保在70-90nm範圍內的窄粒徑分佈以及0.11±0.04(n=56)的低多分散性指數,可以在添加指導RNA之前將粒子藉由80nm的膜擠出達三次。可以使用含有高度有效的胺基脂質16的粒子,其中四種脂質組分16、DSPC、膽固醇和PEG-脂質的莫耳比(50/10/38.5/1.5)可以被進一步優化,以增強體內活性。
邁克爾S D科爾曼(Michael S D Kormann)等人(“在小鼠中遞送化學修飾的mRNA之後治療蛋白的表現(Expression of therapeutic proteins after delivery of chemically modified mRNA in mice:Nature Biotechnology)”:自然生物技術,第29卷,第154-157頁,(2011))描述了脂質包膜用於遞送RNA的用途。脂質包膜的用途在本發明中也是較佳的。
在另一個實施方式中,脂質可以與本發明的CRISPR Cas系統或其一種或多種組分或對其編碼的一個或多個核酸分子一起配製而形成脂質奈米粒子(LNP)。脂質包括但不限於,DLin-KC2-DMA4、C12-200和輔助脂質二硬脂醯磷脂醯膽鹼、膽固醇和PEG-DMG,可以使用自發囊泡形成程序將其與CRISPR Cas而不是siRNA一起配製(例如參見,諾沃布塞瓦(Novobrantseva),分子治療-核酸(Molecular Therapy-Nucleic Acids)(2012)1,e4;doi:10.1038/mtna.2011.3)。組分莫耳比可以是約50/10/38.5/1.5(DLin-KC2-DMA或C12-200/二硬脂醯磷脂醯膽鹼/膽固醇/PEG-
DMG)。在DLin-KC2-DMA和C12-200脂質奈米粒子(LNP)的情況下,最終脂質:siRNA重量比可以分別是~12:1和9:1。配製物可以具有~80nm的平均粒子直徑,具有>90%的包封效率。可以考慮3mg/kg的劑量。
泰米拉公司在美國和國外具有一組針對LNP和LNP配製物的不同方面的大約95個同族專利(例如參見,美國專利案號7,982,027;7,799,565;8,058,069;8,283,333;7,901,708;7,745,651;7,803,397;8,101,741;8,188,263;7,915,399;8,236,943和7,838,658以及歐洲專利案號1766035;1519714;1781593和1664316),所有該等專利均可用於和/或適於本發明。
該CRISPR Cas系統或其組分或對其編碼的一個或多個核酸分子可以封裝在PLGA微球中進行遞送,諸如進一步描述於美國公開申請20130252281和20130245107以及20130244279(轉讓給Moderna Therapeutics公司)中,該等申請涉及包含修飾的核酸分子的組成物的配製物方面,該等核酸分子可以編碼蛋白質、蛋白質先質、或該蛋白質或該蛋白質先質的部分或完全加工形式。該配製物可以具有50:10:38.5:1.5-3.0(陽離子脂質:融合脂質:膽固醇:PEG脂質)的莫耳比。PEG脂質可以選自但不限於PEG-c-DOMG、PEG-DMG。該融合脂質可以是DSPC。還參見,施魯姆(Schrum)等人,工程化核酸的遞送和配製(Delivery and Formulation of Engineered Nucleic Acids),美國公開申請20120251618。
Nanomerics公司的技術著手解決針對廣泛治療學的
生物利用度挑戰,包括基於低分子量疏水性藥物、肽以及核酸(質粒、siRNA、miRNA)的治療學。該技術已經證明了明顯優勢的特異性的給藥途徑包括口服途徑、跨血腦障壁的轉運、向實性瘤以及眼部的遞送。例如參見,馬薩等人,2013,ACS奈米,2013年2月26日;7(2):1016-26;烏切克布(Uchegbu)和秀,2013,製藥科學雜誌(J Pharm Sci.)102(2):305-10和拉拉特薩等人,2012,控釋雜誌,2012年7月20日;161(2):523-36。
美國專利公開案號20050019923描述了用於向哺乳動物身體遞送生物活性分子諸如多核苷酸分子、肽和多肽和/或藥劑的陽離子樹狀聚合物。該等樹狀聚合物適合於將生物活性分子的遞送靶向至例如肝臟、脾、肺、腎或心臟(或甚至腦)。樹狀聚合物係由簡單的支化單體單元以逐步方式製備的合成性3維大分子,其性質和功能性可以容易地進行控制和改變。樹狀聚合物經由向多功能核(發散式合成法)或朝向多功能核(收斂式合成法)重複加成結構單元來合成,並且結構單元的3維殼的每次加成使得更高級別的樹狀聚合物形成。聚丙烯亞胺樹狀聚合物從二胺基丁烷核開始,藉由對一級胺的丙烯腈的雙邁克爾加成反應向其上添加兩倍數目的胺基基團,然後進行腈的氫化。這導致胺基基團的加倍。聚丙烯亞胺樹狀聚合物含有100%的可質子化氮以及高達64個末端胺基基團(5級,DAB 64)。可質子化基團通常是能夠在中性pH下接受質子的胺基。樹狀聚合物作為基因遞送劑的用途在很大程度上集中於聚醯胺-胺和含磷化合物的用途,其中胺/醯胺的混合物或N--P(O2)S分別作為軛合單元,沒有報導關於更低級別的聚丙烯亞胺樹狀聚合物用於基因遞送的用途的工作。還研究了作為pH
敏感的控制釋放系統的聚丙烯亞胺樹狀聚合物,其用於藥物遞送以及當被外週胺基酸基團化學修飾時用於它們的客體分子的封裝。還研究了聚丙烯亞胺樹狀聚合物的細胞毒性和其與DNA的相互作用以及DAB 64的轉染效力。
美國專利公開案號20050019923係基於與早期報導相反的觀察:陽離子樹狀聚合物諸如聚丙烯亞胺樹狀聚合物展示出適當的特性,諸如特異性靶向和低毒性,其用於靶向遞送生物活性分子諸如遺傳物質。此外,陽離子樹狀聚合物的衍生物也展示出適用於生物活性分子的靶向遞送的特性。還參見,生物活性聚合物(Bioactive Polymers)、美國公開申請20080267903,其揭露“不同的聚合物,包括陽離子聚胺聚合物和樹枝狀聚合物顯示出具有抗增殖活性,並且因此可用於治療特徵為不希望的細胞增殖的病症,諸如新生物和腫瘤、炎性病症(包括自身免疫性病症)、牛皮癬和動脈粥樣硬化。該等聚合物可以作為活性劑單獨使用,或者作為其他治療劑(諸如藥物分子或用於基因治療的核酸)的遞送載體。在此類情況下,聚合物的自身固有的抗腫瘤活性可以補足有待遞送的藥劑的活性。該等專利出版物的揭露內容可以與在此的教授內容結合使用,以用於遞送一種或多種CRISPR Cas系統或其一種或多種組分或對其編碼的一個或多個核酸分子。
超電荷蛋白
超電荷蛋白係一類具有非常高的正或負的理論淨電荷的工程化或天然存在的蛋白質並且可以用於遞送一種或多種CRISPR Cas系統或其一種或多種組分或對其編碼的一個或多個核
酸分子。超負電荷蛋白和超正電荷蛋白兩者都表現出顯著的抵抗熱誘導或化學誘導的聚集的能力。超正電荷蛋白還能夠穿透哺乳動物細胞。使貨物諸如質粒DNA、RNA或其他蛋白質與該等蛋白質締合可以使得該等大分子到體外和體內的哺乳動物細胞中的功能遞送成為可能。劉大衛實驗室(David Liu’s lab)在2007年報導了超電荷蛋白的創建和表徵(勞倫斯(Lawrence)等人,2007,美國化學學會雜誌129,10110-10112)。
RNA和質粒DNA到哺乳動物細胞中的非病毒遞送對於研究和治療應用都是有價值的(阿肯克(Akinc)等人,2010,自然生物技術26,561-569)。純化的+36 GFP蛋白(或其他超正電荷蛋白)與RNA在適當的無血清培養基中混合並且使得其在添加到細胞中之前複合。在這個階段血清的包含抑制超電荷蛋白-RNA複合物的形成並且降低治療效果。已經發現以下方案對於多種細胞系係有效的(麥克諾頓(McNaughton)等人,2009,美國國家科學院院刊106,6111-6116)(然而,應當進行改變蛋白質和RNA劑量的預試驗來優化用於特異性細胞系的程序):
(1)在治療前一天,以1×105個細胞/孔接種於48孔板中。
(2)在治療當天,將純化的+36 GFP蛋白在無血清的培養基中稀釋至終濃度200nM。添加RNA到50nM的終濃度。渦旋混合並且在室溫下培養10min。
(3)在培養過程中,從細胞抽出培養基並且再次用PBS洗滌。
(4)在培養+36 GFP和RNA之後,向細胞添加蛋白質-RNA複合物。
(5)將細胞與複合物在37℃下培養4h。
(6)在培養之後,抽出培養基並且用20U/mL的肝素PBS洗滌三次。用含血清的培養基另外培養細胞48h或更長,這取決於用於活性的測定。
(7)藉由免疫印跡、qPCR、表型分析或其他適當的方法分析細胞。
劉大衛實驗室已經進一步發現+36 GFP在一系列細胞中是有效的質粒遞送試劑。由於質粒DNA係比siRNA大的貨物,有效複合質粒需要成比例地更大的+36 GFP蛋白。為了有效質粒遞送,申請人已經開發了帶有C末端HA2肽標籤的+36 GFP變體,這種肽係已知的來源於流感病毒血凝素蛋白的內體破壞肽。以下方案在多種細胞中是有效的,但是如上所述,建議針對特異性細胞系和遞送應用優化質粒DNA和超電荷蛋白的劑量。
(1)在治療前一天,以1×105/孔接種於48孔板中。(2)在治療當天,
將純化的þ36 GFP蛋白在無血清的培養基中稀釋至終濃度2mM。添加1mg質粒DNA。渦旋混合並且在室溫下培養10min。
(3)在培養過程中,從細胞抽出培養基並且再次用PBS洗滌。
(4)在培養þ36 GFP和質粒DNA之後,向細胞輕輕添
加蛋白質-DNA複合物。
(5)將細胞與複合物在37℃下培養4h。
(6)在培養之後,抽出培養基並且用PBS洗滌。在含血清培養基中培養細胞,並且另外培養24-48h。
(7)在適當時分析質粒遞送(例如,藉由質粒驅動的基因表現)。
還參見,例如,麥克諾頓等人,美國國家科學院院刊106,6111-6116(2009);克羅尼肯(Cronican)等人,ACS化學生物學(ACS Chemical Biology)5,747-752(2010);克羅尼肯等人,化學與生物學(Chemistry & Biology)18,833-838(2011);湯普森(Thompson)等人,酶學方法(Methods in Enzymology)503,293-319(2012);湯普森,D.B.等人,化學與生物學19(7),831-843(2012)。超電荷蛋白的該等方法可以用於和/或適於本發明的CRISPR Cas系統的遞送。劉博士的該等系統和在此的文獻結合在此的教授內容可以用於遞送一種或多種CRISPR Cas系統或其一種或多種組分或對其編碼的一個或多個核酸分子。
細胞穿透肽(CPP)
在又另一個實施方式中,考慮了細胞穿透肽(CPP)用於CRISPR Cas系統的遞送。CPP係促進不同分子貨物(從奈米級粒子至小化學分子和大的DNA片段)的細胞攝取的短肽。如在此所用的術語“貨物”包括但不限於下組,該組由下項組成:治療劑、診斷性探針、肽、核酸、反義寡核苷酸、質粒、蛋白質、粒子
(包括奈米粒子)、脂質體、發色團、小分子以及放射性物質。在本發明的方面中,貨物還可以包括CRISPR Cas系統的任何組分或整個功能性CRISPR Cas系統。本發明的方面進一步提供了用於將所希望的貨物遞送至受試者中的方法,該等方法包括:(a)製備包含本發明的細胞穿透肽和所希望的貨物的複合物,並且(b)向受試者口服地、關節內地、腹膜內地、鞘內地、動脈內地(intrarterially)、鼻內地、實質內地(intraparenchymally)、皮下地、肌內地、靜脈內地、真皮地、直腸內地或局部地給予複合物。貨物藉由經由共價鍵的化學連接或藉由非共價的相互作用與肽締合。
CPP的功能是將貨物遞送至細胞中,這係通常藉由胞吞作用發生的過程,其中貨物被遞送至活哺乳動物細胞的內體。細胞穿透肽具有不同的尺寸、胺基酸序列並且帶電荷,但是所有CPP具有獨特的特性,該特性係易位質膜的能力,並且促進不同分子貨物到細胞質或細胞器的遞送。CPP易位可以被分類成三種主要的進入機制:直接穿透膜中、胞吞作用介導的進入,以及藉由暫態結構的形成的易位。CPP在醫學中發現了許多應用,在治療不同疾病包括癌症中作為藥物遞送劑,和病毒抑制劑以及用於細胞標記的造影劑。後者的實例包括充當用於GFP、MRI造影劑或量子點的載體。CPP作為用於研究和醫學的體外及體內遞送載體具有極大潛力。CPP典型地具有下述的胺基酸組成,該胺基酸組成含有高相對豐度的帶正電荷的胺基酸諸如賴胺酸或精胺酸或具有含有極性/帶電荷胺基酸和非極性、疏水性胺基酸的交替圖案的序列。這兩種結構類型被分別稱之為聚陽離子或兩親性分子。CPP的第
三種類別係疏水性肽,其僅含有具有低淨電荷極性殘基或具有對細胞攝取係關鍵的疏水性胺基酸基團。所發現的原始CPP中之一係來自人類免疫缺陷病毒1(HIV-1)的反啟動轉錄活化物(Tat),發現該Tat被培養物中的多種細胞類型從周圍培養基中有效攝取。從此以後,多種已知的CPP得到了相當地擴展並且產生了具有更有效的效應蛋白轉導特性的小分子合成類似物。CPP包括但不限於穿透素、Tat(48-60)、轉運素和(R-AhX-R4)(Ahx=胺基己醯基)。
美國專利8,372,951提供了來源於嗜酸性粒細胞陽離子蛋白(ECP)的CPP,該CPP表現出非常高的細胞穿透效率和低毒性。還提供了將帶有其貨物的CPP遞送至脊椎動物受試者中的方面。CPP的另外方面和其遞送描述於美國專利8,575,305;8,614,194和8,044,019中。CPP可以用於遞送CRISPR-Cas系統或其組分。可以用於遞送CRISPR-Cas系統或其組分的CPP也被提供於蘇雷什.羅摩克裡希納(Suresh Ramakrishna)、阿布誇庫戴德(Abu-Bonsrah Kwaku Dad)、賈格迪什.拜洛兒(Jagadish Beloor)等人寫的手稿“藉由細胞穿透肽介導的Cas9蛋白和指導RNA的遞送進行的基因破壞(Gene disruption by cell-penetrating peptide-mediated delivery of Cas9protein and guide RNA)”,基因組研究(Genome Res.),2014年4月2日,[電子版先於印刷版],該文獻藉由引用以其整體結合在此,其中展示出的是用CPP軛合的重組Cas9蛋白和CPP複合的指導RNA的處理導致人類細胞系中的內源性基因破壞。在論文中,Cas9蛋白經由硫醚鍵軛合至CPP,而指導RNA與CPP複合,形成了稠合的帶正電荷的粒子。已表明,用修飾的Cas9和指導RNA對人類細胞(包括胚胎幹細胞、真皮成纖維細胞、HEK293T
細胞、HeLa細胞和胚胎癌細胞)的同時處理和依序處理產生有效的基因破壞,其中相對於質粒轉染脫靶突變減少。
可植入裝置
在另一個實施方式中,還考慮了可植入裝置用於遞送CRISPR Cas系統或其一種或多種組分或對其編碼的一個或多個核酸分子。例如,美國專利公開20110195123揭露了可植入的醫療器械,其局部地且在一長時間段內洗提藥物,包括了若干種類型的此設備、實施的治療方式和植入方法。該裝置包含聚合物基材,諸如,例如用作裝置主體的基質,以及藥物,並且在一些情況下包含另外的支架材料,諸如金屬或另外的聚合物,以及增強能見度和成像的材料。可植入的遞送裝置在提供局部且一長時間段內的釋放方面可能是有利的,其中藥物直接釋放到患病區域諸如腫瘤、炎症、退化的細胞外基質(ECM),或用於針對症狀的目的,或者釋放到損傷的平滑肌細胞,或者用於預防。一種藥物係如以上揭露的RNA,並且這個系統可以用於和/或適於本發明的CRISPR Cas系統。在一些實施方式中,植入方式係針對包括近距離放射療法和針吸活組織檢查的其他治療的當今開發和使用的現有植入程序。在這樣的情況下,在本發明中描述的新植入物的尺寸類似於原始植入物。典型地,在同一的治療程序中,植入了幾個裝置。
美國專利公開20110195123提供了一種藥物遞送可植入或可插入系統,包括適用於空腔諸如腹腔和/或其中藥物遞送系統未被錨定或附接的任何其他類型的給藥的系統,該等系統包括
生物穩定的和/或可降解的和/或生物可吸收的聚合物基材,該基材可以例如視情況是基質。應當指出的是術語“插入”也包括植入。該藥物遞送系統較佳的是如美國專利公開20110195123中描述的“裝填器(Loder)”那樣實施。
聚合物或多種聚合物係生物相容的,其結合一種藥劑和/或多種藥劑,使得藥劑以控制的速率釋放,其中該聚合物基材諸如基質的總體積,例如在一些實施方式中是視情況並且較佳的是不大於容許達到該藥劑的治療水平的最大體積。作為一非限制性實例,這樣的體積較佳的是在0.1m3至1000mm3的範圍內,正如該藥劑負荷的體積所要求的。該裝填器視情況是較大的,例如當結合有其尺寸由功能性決定的裝置例如而不限於,膝關節、宮內節育環或子宮頸環等時。
在一些實施方式中,該藥物遞送系統(用於遞送該組成物)被設計為較佳的是採用可降解聚合物,其中主要釋放機制係本體溶蝕(bulk erosion);或者在一些實施方式中,使用了不可降解的、或緩慢降解的聚合物,其中主要釋放機制係擴散而不是本體溶蝕,使得外部部分用作膜,並且其內部部分用作藥物貯庫,該藥物貯庫在延長的時間段內(例如從約一週至約幾個月)實際上不受環境的影響。還可以視情況使用具有不同釋放機制的不同聚合物的組合。在總藥物釋放期的重要時段期間,在表面處的濃度梯度較佳的是維持為有效恒定,並且因此擴散速率係有效恒定的(稱為“零模式”擴散)。關於術語“恒定”,它意指較佳的是維持在治療有效性的低閾值以上的擴散速率,但是可以仍然視情況具
有初期突釋的特徵和/或可以發生波動,例如增加和降低到一定程度。擴散速率較佳的是被如此維持一長時間段,並且可以考慮使它相對於一定的水平是恒定的,以便優化治療有效期,例如有效沈默期。
藥物遞送系統視情況並且較佳的是被設計為保護基於核苷酸的治療劑免於降解,而無論是化學性質還是由於受試者體內的酶和其他因素的攻擊。
美國專利公開20110195123的藥物遞送系統視情況與感測和/或啟動設備相關聯,該等設備藉由啟動和/或加速/減速的無創和/或微創方法在該裝置的植入之時和/或之後被操作,該等方法例如視情況包括但不限於熱力加熱和冷卻、雷射光束和超音波,包括聚焦超音波和/或RF(射頻)方法或裝置。
根據美國專利公開20110195123的一些實施方式,用於局部遞送的位點可以視情況包括特徵為高度異常的細胞增殖和受抑制的細胞凋亡的靶位點,包括腫瘤、活動性和/或慢性炎症和感染,包括自身免疫性疾病狀態、退化組織(包括肌肉和神經組織)、慢性疼痛、退行性位點,以及用於增強組織再生的骨折位置以及其他傷口位置,以及損傷的心肌、平滑肌和橫紋肌。
用於植入該組成物的位點、或靶位點,較佳的是其特徵為用於靶向局部遞送的足夠小的半徑、面積和/或體積。例如,該靶位點視情況具有在從約0.1mm至約5cm範圍內的直徑。
該靶位點的位置較佳的是針對最大治療效力而選擇。
例如,該藥物遞送系統的組成物(視情況與如上所述的用於植入的裝置一起)視情況並且較佳的是被植入在腫瘤環境或與腫瘤環境相關聯的血供之內或附近。
例如該組成物(視情況與該裝置一起)視情況植入在胰臟、前列腺、乳房、肝臟之內或附近,經由接管(nipple)進行,植入在血管系統之內,等等。
靶位置視情況選自下組,該組包括下項、基本上由、或由下項組成(僅僅作為非限制性實例,因為視情況身體內的任何位點可以適合於植入裝填器):1.在退行性位點處的腦,像在帕金森病或阿茲海默症中在基底神經節、白質和灰質處;2.如在肌萎縮側索硬化(ALS)的情況下的脊柱;3.預防HPV感染的子宮頸;4.活動性或慢性炎性關節;5.在牛皮癬情況下的真皮;6.用於止痛作用的交感神經位點和感覺神經位點;7.骨內植入;8.急性和慢性感染位點;9.陰道內;10.耳內--聽覺系統、內耳的迷路、前庭系統;11.氣管內;12.心內;冠狀動脈、心外膜;13.膀胱;14.膽道系統;15.實質組織,包括但不限於腎、肝臟、脾;16.淋巴結;17.唾液腺;18.牙齦;19.關節內(進入關節);20.眼內;21.腦組織;22.腦室;23.空腔,包括腹腔(例如但不限於,卵巢癌);24.食管內以及25.直腸內。
視情況,該系統(例如含有該組成物的裝置)的插入與向在靶位點處和該位點附近的ECM注射材料相關聯,從而影響該靶位點和此位點附近的ECM中的局部pH和/或溫度和/或影響該藥物擴散和/或藥物動力學的其他生物因素。
視情況,根據一些實施方式,所述藥劑的釋放可以與感測和/或啟動設備相關聯,該等設備藉由啟動和/或加速/減速的無創和/或微創方法和/或別的方法在插入之前和/或之時和/或之後被操作,所述方法包括雷射光束、放射、熱力加熱和冷卻、和超音波,包括聚焦超音波和/或RF(射頻)方法或裝置、以及化學啟動劑。
根據美國專利公開20110195123的其他實施方式,藥物較佳的是包括RNA,例如,對於局限性癌症情況,在乳房、胰臟、腦、腎、膀胱、肺以及前列腺中,如下文所述。儘管使用RNAi進行舉例說明,但是許多藥物係適用於封裝在裝填器中的,並且可以與本發明結合使用,只要此類藥物可以用裝填器基材例如像基質封裝,並且此系統可以用於和/或適於遞送本發明的CRISPR Cas系統。
作為特殊應用的另一個實例,神經肌肉退行性疾病由於異常基因表現而發生。RNA的局部遞送可以具有干擾此異常基因表現的治療特性。包括小藥物和大分子的抗凋亡、抗炎症和抗退行性藥物的局部遞送也可以視情況是治療性的。在這樣的情況下,該裝填器用於以恒定速率和/或藉由單獨植入的專用裝置延長釋放。這都可以用於和/或適於本發明的CRISPR Cas系統。
作為特殊應用的又另一個實例,用基因修飾劑治療精神和認知障礙。基因敲低係一治療選擇。向中樞神經系統位點局部遞送藥劑的裝填器係對於精神障礙和認知障礙的治療選擇,該等精神障礙和認知障礙包括但不限於,精神病、雙極疾病、神經
性病症和行為疾病(behavioral maladies)。該等裝填器也可以在特定腦位點進行植入時局部遞送包括小藥物和大分子的藥物。這都可以用於和/或適於本發明的CRISPR Cas系統。
作為特殊應用的另一個實例,在局部位點的先天性和/或適應性免疫介質的沈默能夠預防器官移植排斥。用植入到移植器官和/或植入位點中的裝填器局部遞送RNA和免疫調節試劑使得藉由排斥性免疫細胞(諸如針對移植器官而被啟動的CD8)產生局部免疫抑制。這都可以用於和/或適於本發明的CRISPR Cas系統。
作為特殊應用的另一個實例,包括VEGF和血管生成素及其他的血管生長因子對於新血管形成係必需的。該等因子、肽、肽類比物的局部遞送或抑制它們的阻遏物係重要的治療模式;使阻遏物沈默以及用裝填器局部遞送刺激血管發生的該等因子、肽、大分子和小藥物對於周圍血管疾病、全身性血管疾病和心血管疾病係具有治療性的。
插入的方法,諸如植入,可以視情況已用於其他類型的組織植入和/或用於插入和/或用於組織取樣,視情況在此類方法中沒有修改,或者可替代地視情況僅僅具有非重點修改。此類方法視情況包括但不限於,近距離放射療法、活組織檢查、用和/或不用超音波的內窺鏡檢查諸如ERCP、進入腦組織的立體定位法、腹腔鏡檢查,包括用腹腔鏡進入關節、腹器官、膀胱壁和體腔的植入。
在此所討論的可植入裝置技術可以與在此的教授內容一起使用並且因此,藉由本揭露和本領域知識,CRISPR-Cas系
統或其組分或其核酸分子或編碼組分或提供組分的核酸分子可以經由可植入裝置遞送。
患者特異性篩選方法
靶向DNA,例如三核苷酸重複序列的核酸靶向系統可以用於篩選存在此類重複序列的患者或患者樣品。重複序列可以是核酸靶向系統的RNA的靶標,並且如果藉由核酸靶向系統與其存在結合,則可以檢測出該結合,從而表明此類序列存在。因此,核酸靶向系統可以用於篩選存在此類重複序列的患者或患者樣品。然後可以向患者給予一種或多種適合的化合物以解決此病狀;或可以給予核酸靶向系統以結合此病狀並且產生插入、缺失或突變並且緩解此病狀。
本發明使用核酸結合靶DNA序列。
CRISPR效應蛋白mRNA和指導RNA
也可以單獨遞送CRISPR酶mRNA和指導RNA。CRISPR酶mRNA可以在指導RNA在給出時間以待CRISPR酶表現之前遞送。CRISPR酶mRNA可以在給予指導RNA之前1-12小時(較佳的是約2-6小時)給予。
可替代地,CRISPR酶mRNA和指導RNA可以一起給予。有利地,指導RNA的第二加強劑量可以在初始給予CRISPR酶mRNA+指導RNA之後1-12小時(較佳的是約2-6小時)給予。
本發明的CRISPR效應蛋白,即Cpf1效應蛋白在此有時稱之為CRISPR酶。應瞭解的是,效應蛋白係基於或來源於酶,
所以術語“效應蛋白”當然包括一些實施方式中的“酶”。然而,還應瞭解的是,根據在一些實施方式中的需要,效應蛋白可以具有DNA或RNA結合,但是不一定具有切割或切口活性,包括無效Cas效應蛋白功能。
為了實現最有效的基因組修飾水平,CRISPR酶mRNA和/或指導RNA的附加給予可能是有用的。在一些實施方式中,當特別是在治療方法中遺傳疾病被靶向時,表型改變較佳的是基因組修飾的結果並且較佳的是其中提供了修復模板以校正或改變表型。
在一些實施方式中,可以被靶向的疾病包括與引起疾病的剪接缺陷相關的那些。
在一些實施方式中,細胞靶標包括造血幹細胞/祖細胞(CD34+);人類T細胞;以及眼(視網膜細胞)-例如光受體先質細胞。
在一些實施方式中,基因靶包括:人類β球蛋白-HBB(用於治療鐮狀細胞貧血,包括藉由刺激基因轉變(使用緊密相關的HBD基因作為內源性模板)進行);CD3(T細胞);以及CEP920-視網膜(眼)。
在一些實施方式中,疾病靶標也可以包括:癌症;鐮狀細胞貧血(基於點突變);HIV;β-地中海貧血;以及眼睛或眼部疾病-例如引起萊伯氏先天性黑矇(Leber Congenital Amaurosis)(LCA)的剪接缺陷。
在一些實施方式中,遞送方法包括:酶-指導序列複合物(核糖核蛋白)的陽離子脂質介導的“直接遞送”以及質粒DNA的電穿孔。
本發明方法可以進一步包括模板的遞送,諸如修復模板,該等修復模板可以是dsODN或ssODN,參見下文。模板遞送可以是經由與任一或所有CRISPR酶或指導序列的遞送同時發生或分開並且經由相同遞送機制或不同遞送機制。在一些實施方式中,較佳的是,模板與指導序列一起遞送,並且也較佳的是與CRISPR酶一起遞送。一實例可以是AAV載體。
本發明方法可以進一步包括:(a)將包含互補於由所述雙股斷裂創建的突出端的突出端的雙股寡去氧核苷酸(dsODN)遞送至細胞,其中所述dsODN被整合到感興趣的座位中;或-(b)將單股寡去氧核苷酸(ssODN)遞送至細胞,其中所述ssODN充當用於所述雙股斷裂的同源定向修復的模板。本發明方法可以用於預防或治療個體的疾病,視情況其中所述疾病由所述感興趣的座位中的缺陷導致。本發明方法可以在個體中體內進行或者在取自個體的細胞上離體進行,視情況其中所述細胞被返回至個體。
為了最小化毒性和脫靶效應,重要的是控制所遞送的CRISPR酶mRNA和指導RNA的濃度。CRISPR酶mRNA和指導RNA的最佳濃度可以藉由以下方式來確定:測試不同濃度的細胞模型或動物模型並且使用深度定序分析潛在的脫靶基因組座位處的修飾程度。例如,對於人類基因組的EMX1基因中的指導序列靶向5'-GAGTCCGAGCAGAAGAAGAA-3'(SEQ ID NO:23),深度定序可
以用於評估以下兩個脫靶座位處的修飾水平:1:5'-GAGTCCTAGCAGGAGAAGAA-3'(SEQ ID NO:24)和2:5'-GAGTCTAAGCAGAAGAAGAA-3'(SEQ ID NO:25)。得到最高的中靶修飾水平同時使脫靶修飾水平最小化的濃度應被選擇用於體內遞送。
誘導型系統
在一些實施方式中,CRISPR酶可以形成誘導型系統的組分。該系統的誘導性質允許使用能量形式時間空間控制基因編輯或基因表現。能量形式可以包括但不限於,電磁輻射、聲能、化學能以及熱能。誘導型系統的實例包括四環素誘導型啟動子(Tet-開或Tet-關)、小分子雙雜交轉錄啟動系統(FKBP、ABA等)、或光誘導型系統(光敏色素、LOV結構域或隱花色素)。在一個實施方式中,CRISPR酶可以是光誘導型轉錄效應物(LITE)的一部分,從而以序列特異性方式引導轉錄活性的變化。光誘導型系統的組分可以包括CRISPR酶、光反應性細胞色素異源二聚體(例如,來自阿拉伯芥)、以及轉錄啟動/阻遏結構域。誘導型DNA結合蛋白及其使用方法的其他實例提供於US 61/736,465和US 61/721,283以及WO 2014/018423 A2中,該等專利藉由引用以其整體結合在此。
自失活系統
一旦細胞基因組中的基因的所有拷貝已被編輯,則該細胞中的連續的CRISRP/Cpf1p表現不再需要。實際上,持續的表現在非預定基因組位點等處的脫靶效應情況下將是不希望的。因此,時間限制的表現將是有用的。誘導型表現提供了一途徑,但
是此外,申請人已經工程化出依賴於CRISPR載體本身內的非編碼指導靶序列的用途的自失活CRISPR系統。因此,在表現開始之後,CRISPR-Cas系統將使得其自身破壞,但是在完全破壞之前,其將有編輯靶基因的基因組拷貝的時間(在二倍體細胞中的正常點突變的情況下,其需要至多兩次編輯)。簡單地,自失活CRISPR-Cas系統包括靶向CRISPR酶本身的編碼序列或靶向與存在於以下項中的一種或多種中的獨特序列互補的一種或多種非編碼指導靶序列的附加RNA(即指導RNA):
(a)在驅動非編碼RNA元件的表現的啟動子之內,
(b)在驅動Cpf1效應蛋白基因的表現的啟動子之內,
(c)在Cpf1效應蛋白編碼序列中的ATG翻譯起始密碼子的100bp之內,
(d)在病毒遞送載體,例如在AAV基因組中反向末端重複序列(iTR)之內。
此外,RNA可以經由載體,例如單獨的載體或編碼CRISPR複合物的同一載體來遞送。當藉由單獨的載體來遞送時,靶向Cas表現的CRISPR RNA可以依序或同時給予。當依序給予時,在意圖用於例如基因編輯或基因工程化的CRISPR RNA之後,將遞送靶向Cas表現的CRISPR RNA。此時間段可以是數分鐘(例如5分鐘、10分鐘、20分鐘、30分鐘、45分鐘、60分鐘)的時間。此時間段可以是數小時(例如2小時、4小時、6小時、8小時、12小時、24小時)的時間。此時間段可以是數天(例如2天、3天、4天、7天)
的時間。此時間段可以是數週(例如2週、3週、4週)的時間。此時間段可以是數月(例如2個月、4個月、8個月、12個月)的時間。此時間段可以是數年(例如2年、3年、4年)的時間。在此方式中,Cas酶與能夠與第一靶標諸如感興趣的一個基因組座位或多個基因組座位雜交的第一gRNA締合並且負責所希望的CRISPR-Cas系統的一種或多種功能(例如,基因工程化);並且隨後Cas酶可以接著與能夠與包含至少一部分的Cas或CRISPR盒的序列雜交的第二gRNA締合。在指導RNA靶向編碼Cas蛋白的表現的序列的情況下,該酶受到阻礙並且系統發生自失活。以相同方式,經由如在此解釋的例如脂質體、脂轉染、粒子、微泡施用的靶向Cas表現的CRISPR RNA可以依序或同時給予。類似地,自失活可以用於對用來靶向一個或多個靶標的一個或多個指導RNA進行失活。
在一些方面中,提供了單一gRNA,該單一gRNA能夠與CRISPR酶起始密碼子下游的序列雜交,由此在一段時間後,存在CRISPR酶表現的喪失。在一些方面中,提供了一個或多個gRNA,該等gRNA能夠與編碼CRISPR-Cas系統的多核苷酸的一個或多個編碼或非編碼區雜交,由此在一段時間後,存在一種或多種、或在一些情況下全部的CRISPR-Cas系統的失活。在系統的一些方面中,並且不受理論限制,細胞可以包含多種CRISPR-Cas複合物,其中第一亞組的CRISPR複合物包含能夠靶向有待編輯的一個基因組座位或多個基因組座位的第一指導RNA,並且第二亞組的CRISPR複合物包含能夠靶向編碼CRISPR-Cas系統的多核苷酸的至少一個第二指導RNA,其中第一亞組的CRISPR複合物介導靶向的一個基因組座位或多個基因組座位的編輯並且第二亞組的
CRISPR複合物最終使CRISPR-Cas系統失活,從而使細胞中的進一步CRISPR-Cas表現失活。
因此,本發明提供了一種包含用於遞送至真核細胞的一種或多種載體,其中一種或多種載體編碼:(i)CRISPR酶;(ii)能夠雜交至細胞中的靶序列的第一指導RNA;(iii)能夠雜交至編碼CRISPR酶的載體中的一個或多個靶序列的第二指導RNA,當在該細胞中表現時,第一指導RNA引導第一CRISPR複合物與該細胞中的靶序列的序列特異性結合;第二指導RNA引導第二CRISPR複合物與編碼CRISPR酶的載體中的靶序列的序列特異性結合;CRISPR複合物包含結合指導RNA的CRISPR酶,由此使得指導RNA可以與其靶序列雜交;並且第二CRISPR複合物使CRISPR-Cas系統失活以阻止細胞對CRISPR酶的連續表現。
不同編碼序列(CRISPR酶和指導RNA)可以包含在單一載體上或多個載體上。例如,有可能編碼在一個載體上的酶和在另一個載體上的不同RNA序列,或者有可能編碼在一個載體上的酶和一個指導RNA以及在另一個載體上的剩餘指導RNA或任何其他前突變。總的來說,使用總共一個或多個不同載體的系統係較佳的。
在使用多種載體的情況下,有可能以不相等的數目遞送它們,並且理想的是,其中編碼第一指導RNA的載體相對於編碼第二指導RNA的載體係過量的,從而有助於延遲CRISPR系統的最終失活,直到基因組編輯具有了發生的機會為止。
第一指導RNA可以靶向基因組內的感興趣的任何靶
序列,如在此其他地方所述的。第二指導RNA靶向編碼CRISPR Cpf1酶的載體內的序列,並且從而使來自該載體的酶的表現失活。因此,載體中的靶序列必須能夠使表現失活。適合的靶序列可以是例如在Cpf1p編碼序列的翻譯起始密碼子附近或之內,在驅動非編碼RNA元件的表現的啟動子中的非編碼序列中,在驅動Cpf1p基因的表現的啟動子之內,在Cas編碼序列中的ATG翻譯起始密碼子的100bp之內,和/或在病毒遞送載體,例如AAV基因組中的反向末端重複序列(iTR)之內。靠近此區域的雙股斷裂可以誘導Cas編碼序列的移碼,使得蛋白質表現喪失。用於使指導RNA“自失活”的替代性靶序列將旨在編輯/失活為CRISPR-Cpf1系統的表現或為載體的穩定性所需要的調節區/序列。例如,如果Cas編碼序列的啟動子被破壞,那麼轉錄可以被抑制或阻止。類似地,如果載體包含用於複製、維持性或穩定性的序列,那麼有可能靶向該等序列。例如,在AAV載體中,有用的靶序列係在iTR之內。其他有用的供靶向的序列可以是啟動子序列、多聚腺苷酸化(polyadenlyation)位點等。
此外,如果指導RNA以陣列格式表現,則同時靶向兩個啟動子的“自失活”指導RNA將使得間插核苷酸從CRISPR-Cas表現構建體內切除,有效地使得其完全失活。類似地,在指導RNA靶向兩個ITR,或同時靶向兩種或更多種其他CRISPR-Cas組分的情況下,發生間插核苷酸的切除。總的來說,如在此解釋的自失活係適用於CRISPR-Cas系統的,以便提供CRISPR-Cas的調節。例如,如在此解釋的自失活可以適用於如在此解釋的突變,例如擴增病症的CRISPR修復。作為此自失活的結果,CRISPR修復僅僅具
有暫態活性。
向“自失活”指導RNA的5'端添加非靶向核苷酸(例如1-10個核苷酸,較佳的是1-5個核苷酸)可以用於延遲其加工和/或修飾其效力以作為確保CRISPR-Cas停止之前的靶向的基因組座位處的編輯的手段。
在自失活AAV-CRISPR-Cas系統的一個方面中,可以建立共表現感興趣的一種或多種指導RNA靶向基因組序列(例如1-2、1-5、1-10、1-15、1-20、1-30)的質粒,其中靶向SpCas9序列的“自失活”指導RNA處於或靠近工程化的ATG起始位點(例如,在5個核苷酸之內、在15個核苷酸之內、在30個核苷酸之內、在50個核苷酸之內、在100個核苷酸之內)。U6啟動子區中的調節序列也可以用指導RNA靶向。U6驅動的指導RNA可以被設計為陣列格式,使得多個指導RNA序列可以同時被釋放。當首先被遞送至靶組織/細胞(離開的細胞)時,指導RNA開始積累,同時Cas水平在核中上升。Cas與介導CRISPR-Cas質粒的基因組編輯和自失活的所有指導RNA複合。
自失活CRISPR-Cas系統的一個方面係由1至4或更多個不同指導序列;例如高達約20或約30個指導序列以單獨或串聯的陣列格式的表現。每個單個自失活指導序列可以靶向不同的靶標。這樣可以從例如一嵌合pol3轉錄物開始加工。可以使用Pol3啟動子諸如U6或H1啟動子。Pol2啟動子諸如在此所提到的那些。反向末端重複(iTR)序列可以側接Pol3啟動子-一個或多個指導RNA-Pol2啟動子-Cas。
串聯的陣列轉錄物的一個方面在於一種或多種指導序列編輯一個或多個靶標,而一個或多個自失活指導序列使CRISPR-Cas系統失活。因此,例如,用於修復擴增病症的所述CRISPR-Cas系統可以直接與在此所述的自失活CRISPR-Cas系統相結合。此系統可以例如具有針對供修復的靶區的兩個指導序列以及針對CRISPR-Cas的自失活的至少一個第三指導序列。參考申請案序號PCT/US2014/069897,題為“在核苷酸重複病症中使用Crispr-Cas系統的組成物和方法”,2014年12月12日以WO/2015/089351公開。
指導RNA可以是控制指導序列。例如,其可以被工程化為靶向編碼CRISPR酶本身的核酸序列,如US2015232881A1中所描述,該專利的揭露內容藉由引用結合在此。在一些實施方式中,系統或組成物可以僅提供有被工程化為靶向編碼CRISPR酶的核酸序列的指導RNA。此外,該系統或組成物可以提供有被工程化為靶向編碼CRISPR酶的核酸序列以及編碼CRISPR和視情況第二指導RNA和另外視情況修復模板的核酸序列的指導RNA。第二指導RNA可以是CRISPR系統或組成物(如在此所限定的此治療性、診斷性、敲除性等)的主要靶標。以這種方式,該系統或組成物是自失活的。這係關於US2015232881A1(也如在此其他地方引用的WO2015070083(A1)所公開的)中的Cas9進行舉例說明的,並且可以外推到Cpf1。
在多重(串聯)靶向方法中使用的根據本發明的酶
發明者已證實,在此所限定的CRISPR酶可以採用沒
有喪失活性的超過一個的RNA指導序列。這使得能夠使用如在此所限定的CRISPR酶、系統或複合物用於靶向多個DNA靶標、基因或基因座位,其中單一酶、系統或複合物如在此所限定的。指導RNA可以是串聯地安排的,視情況藉由核苷酸序列諸如如在此所限定的同向重複序列分開。不同指導RNA的位置係使得串聯不影響活性。應注意的是,術語“CRISPR-Cas系統”、“CRISP-Cas複合物”、“CRISPR複合物”和“CRISPR系統”係可互換使用的。另外,術語“CRISPR酶”、“Cas酶”或“CRISPR-Cas酶”可以是可互換使用的。在較佳的實施方式中,所述CRISPR酶、CRISP-Cas酶或Cas酶係Cpf1,或者是在此其他地方所述的Cpf1的修飾或突變型變體中的任一種。
在一個方面中,本發明提供了一非天然存在或工程化的CRISPR酶,較佳的是第2類CRISPR酶,較佳的是如在此所述的型V或VI CRISPR酶,諸如但不限於如在此其他地方所述的Cpf1,以用於串聯或多重靶向。應該理解的是,如在此其他地方所述的根據本發明的CRISPR(或CRISPR-Cas或Cas)酶、複合物或系統中的任一種可以用於此方法中。如在此其他地方所述的方法、產物、組成物和用途中的任一種係同樣適用於如下文進一步詳述的多重或串聯靶向方法。作為進一步指導,提供了以下的特定方面和實施方式。
在一個方面中,本發明提供了如在此所限定的Cpf1酶、複合物或系統用於靶向多個基因座位的用途。在一個實施方式中,這可以藉由使用多個(串聯或多重)指導RNA(gRNA)序列來建
立。
在一個方面中,本發明提供了用於使用如在所限定的Cpf1酶、複合物或系統中的一個或多個元件用於串聯或多重靶向的方法,其中所述CRISP系統包含多個指導RNA序列。較佳的是,所述gRNA序列藉由核苷酸序列,諸如如在此其他地方所限定的同向重複序列分開。
如在此所限定的Cpf1酶、系統或複合物提供了一種用於修飾多個靶多核苷酸的有效手段。如在此所限定的Cpf1酶、系統或複合物具有多種多樣的效用,包括修飾(例如,缺失、插入、易位、失活、啟動)許多細胞類型中的一個或多個靶多核苷酸。這樣,如在此所限定的本發明Cpf1酶、系統或複合物在例如基因治療、藥物篩選、疾病診斷以及預後方面具有廣泛的應用,包括靶向單一CRISPR系統內的多個基因座位。
在一個方面中,本發明提供了如在此所限定的Cpf1酶、系統或複合物,即具有Cpf1蛋白和多個指導RNA的Cpf1 CRISPR-Cas複合物,該Cpf1蛋白具有與其締合的至少一個去穩定化結構域,該等指導RNA靶向多個核酸分子諸如DNA分子,由此每個所述多個指導RNA特異性地靶向其相應的核酸分子,例如DNA分子。每個核酸分子靶向例如可以編碼基因產物或包括基因座位的DNA分子。因此使用多個指導RNA能夠靶向多個基因座位或多基因。在一些實施方式中,Cpf1酶可以切割編碼基因產物的DNA分子。在一些實施方式中,基因產物的表現被改變。Cpf1蛋白和指導RNA並不同時天然存在。本發明包括包含串聯地安排的指導序列的指
導RNA。本發明進一步包括密碼子優化為在真核細胞中表現的Cpf1蛋白的編碼序列。在一較佳的實施方式中,真核細胞係哺乳動物細胞、植物細胞或酵母細胞,並且在一個更較佳的實施方式中,哺乳動物細胞係人類細胞。基因產物的表現可以被減少。Cpf1酶可以形成CRISPR系統或複合物的一部分,該CRISPR系統或複合物進一步包含串聯安排的指導RNA(gRNA),包括2、3、4、5、6、7、8、9、10、15、25、25、30個或超過30個的一組指導序列,每個指導序列能夠與細胞中感興趣的基因組座位中的靶序列特異性地雜交。在一些實施方式中,功能性Cpf1 CRISPR系統或複合物結合多個靶序列。在一些實施方式中,功能性CRISPR系統或複合物可以編輯多種靶序列,例如靶序列可以包含基因組座位,並且在一些實施方式中,可以存在基因表現的改變。在一些實施方式中,功能性CRISPR系統或複合物可以進一步包含功能結構域。在一些實施方式中,本發明提供了一種用於改變或修飾多種基因產物的表現的方法。該方法可以包括引入到含有所述靶核酸,例如DNA分子,或含有和表現靶核酸,例如DNA分子的細胞中;例如,靶核酸可以編碼基因產物或提供基因產物(例如,調節序列)的表現。
在較佳的實施方式中,用於多重靶向的CRISPR酶係Cpf1,或者CRISPR系統或複合物包含Cpf1。在一些實施方式中,用於多重靶向的CRISPR酶係AsCpf1,或者用於多重靶向的CRISPR系統或複合物包含AsCpf1。在一些實施方式中,CRISPR酶係LbCpf1,或者CRISPR系統或複合物包含LbCpf1。在一些實施方式中,用於多重靶向的Cpf1酶切割DNA的兩條股以產生雙股斷裂
(DSB)。在一些實施方式中,用於多重靶向的CRISPR酶係切口酶。在一些實施方式中,用於多重靶向的Cpf1酶係雙重切口酶。在一些實施方式中,用於多重靶向的Cpf1酶係Cpf1酶,諸如如在此其他地方所限定的DD Cpf1酶。
在一些一般實施方式中,用於多重靶向的Cpf1酶與一個或多個功能結構域締合。在一些更具體的實施方式中,用於多重靶向的CRISPR酶係如在此其他地方所限定的無效Cpf1。
在一個方面中,本發明提供了一種用於遞送如在此所限定的多靶向中使用的Cpf1酶、系統或複合物,或如在此所限定的多核苷酸的手段。此類遞送手段的非限制性實例係例如一個或多個粒子,該一個或多個粒子遞送複合物的一種或多種組分、包含在此所討論的一種或多種多核苷酸(例如編碼CRISPR酶,提供編碼CRISPR複合物的核苷酸)的一種或多種載體。在一些實施方式中,載體可以是質粒或病毒載體諸如AAV或慢病毒。使用質粒暫態轉染到例如HEK細胞中可能是有利的,特別是考慮到AAV的大小限制以及考慮到雖然Cpf1適配於AAV,但是可能達到另外的指導RNA的上限。
還提供了一種組成型地表現如在此使用的Cpf1酶、複合物或系統的模型,該模型用於多重靶向中。生物體可以是轉基因的並且可以用本發明的載體轉染或者可以是如此轉染的生物體的後代。在另一個方面中,本發明提供了包含如在此所限定的CRISPR酶、系統和複合物,或如在此所述的多核苷酸或載體的組成物。還提供了包含較佳的是呈串聯安排格式的多個指導RNA的
Cpf1 CRISPR系統或複合物。所述不同的指導RNA可以藉由核苷酸序列諸如同向重複序列分開。
還提供了一種治療受試者,例如有需要的受試者之方法,該方法包括藉由用編碼Cpf1 CRISPR系統或複合物的多核苷酸或在此所述的多核苷酸或載體中的任一種轉化受試者來誘導基因編輯,並且向受試者給予它們。還可以提供適合的修復模板,例如藉由包含所述修復模板的載體來遞送。還提供了一種治療受試者,例如有需要的受試者的之方法,該方法包括藉由用在此所述的多核苷酸或載體轉化受試者來誘導多個靶基因座位的轉錄啟動或阻遏,其中所述多核苷酸或載體編碼或包含Cpf1酶、包含較佳的是呈串聯安排的多個指導RNA的複合物或系統。在離體發生,例如在細胞培養物中發生任何處理的情況下,那麼應瞭解的是,術語“受試者”可以藉由短語“細胞或細胞培養物”來替換。
提供了用於如在此任何地方所限定的治療方法中的組成物,該等組成物包含Cpf1酶、包含較佳的是呈串聯安排的多個指導RNA的複合物或系統,或編碼或包含所述Cpf1酶、包含較佳的是呈串聯安排的多個指導RNA的複合物或系統的多核苷酸或載體。可以提供包含此類組成物的成套套組。還提供了所述組成物在用於此類治療方法的藥物的製造中的用途。還藉由本發明提供了Cpf1 CRISPR系統在篩選,例如增功能篩選中的用途。被人工驅使過表現基因的細胞能夠藉由負反饋回路來下調隨時間變化的基因(重新建立平衡)。在開始篩選的時候,未被調節的基因可能再一次減少。使用誘導型Cpf1活化物允許就在篩選之前誘導轉錄
並且因此使假陰性命中的可能性最小化。因此,藉由本發明在篩選,例如增功能篩選中的使用,假陰性結果的可能性可以被最小化。
在一個方面中,本發明提供了一種工程化的非天然存在的CRISPR系統,該CRISPR系統包含Cpf1蛋白和各自特異性地靶向編碼細胞中基因產物的DNA分子的多個指導RNA,由此多個指導RNA各自靶向它們的編碼基因產物的特異性DNA分子並且該Cpf1蛋白切割編碼該基因產物的靶DNA分子,由此改變該基因產物的表現;並且其中CRISPR蛋白和指導RNA並不同時天然存在。本發明包括包含較佳的是藉由核苷酸序列諸如同向重複序列分開的多個指導序列的多個指導RNA。在本發明的一實施方式中,CRISPR蛋白係V型或VI型CRISPR-Cas蛋白並且在一更較佳的實施方式中,CRISPR蛋白係Cpf1蛋白。本發明進一步包括密碼子優化為在真核細胞中表現的Cpf1蛋白。在一較佳的實施方式中,真核細胞係哺乳動物細胞,並且在一更較佳的實施方式中,哺乳動物細胞係人類細胞。在本發明的另一個實施方式中,基因產物的表現減少。
在另一個方面中,本發明提供了一種包含一種或多種載體的工程化的非天然存在的載體系統,該等載體包含可操作地連接至各自特異性地靶向編碼基因產物的DNA分子的多個Cpf1 CRISPR系統指導RNA的第一調節元件以及編碼CRISPR蛋白的可操作地連接的第二調節元件。兩個調節元件可以位於系統的相同載體上或不同載體上。多個指導RNA靶向編碼細胞中多種基因產
物的多個DNA分子並且CRISPR蛋白可以切割編碼基因產物的多個DNA分子(該CRISPR蛋白可以切割一條或兩條股或者基本上不具有核酸酶活性),由此改變多種基因產物;並且其中CRISPR蛋白和多個指導RNA並不同時天然存在。在一較佳的實施方式中,CRISPR蛋白係Cpf1蛋白,其視情況被密碼子優化為在真核細胞中表現。在一較佳的實施方式中,真核細胞係哺乳動物細胞、植物細胞或酵母細胞,並且在一個更較佳的實施方式中,哺乳動物細胞係人類細胞。在本發明的另一個實施方式中,多種基因產物中的每種的表現被改變,較佳的是被減少。
在一個方面中,本發明提供了一種包含一種或多種載體的載體系統。在一些實施方式中,該系統包含:(a)可操作地連接至同向重複序列的第一調節元件和用於將一種或多種指導序列插入同向重複序列的上游或下游(無論哪一種都適用)的一個或多個插入位點,其中在表現時,一種或多種指導序列引導CRISPR複合物與真核細胞中的一個或多個靶序列的序列特異性結合,其中CRISPR複合物包含與雜交至一個或多個靶序列的一種或多種指導序列複合的Cpf1酶;和(b)可操作地連接至編碼較佳的是包含至少一個核定位序列和/或至少一個NES的所述Cpf1酶的酶編碼序列的第二調節元件;其中組分(a)和(b)位於系統的相同或不同的載體上。在一些實施方式中,組分(a)進一步包含可操作地連接至第一調節元件的兩種或更多種指導序列,其中當表現時,兩種或更多種指導序列中的每種引導Cpf1 CRISPR複合物與真核細胞中的不同靶序列的序列特異性結合。在一些實施方式中,CRISPR複合物包含具有足以驅動所述Cpf1 CRISPR複合物在真核
細胞的核中和/或之外以可檢測的量積累的強度的一個或多個核定位序列和/或一個或多個NES。在一些實施方式中,第一調節元件係聚合酶III啟動子。在一些實施方式中,第二調節元件係聚合酶II啟動子。在一些實施方式中,每個指導序列的長度係至少16、17、18、19、20、25個核苷酸,或介於16個-30個、或介於16個-25個、或介於16個-20個核苷酸之間。
重組表現載體可以包含編碼用於如在此所限定的多靶向中的Cpf1酶、系統或複合物的多核苷酸,該等多核苷酸處於適用於在宿主細胞中表現核酸的形式,這意味著重組表現載體包含一個或多個調節元件,該等調節元件可以基於用於表現的宿主細胞來選擇,可操作地連接至有待表現的核酸序列。在重組表現載體內,“可操作地連接”旨在意指感興趣的核苷酸序列以允許核苷酸序列表現(例如,在體外轉錄/翻譯系統中或當該載體被引入到宿主細胞時在宿主細胞中)的方式連接至一個或多個調節元件。
在一些實施方式中,宿主細胞係用包含編碼用於如在此所限定的多靶向中的Cpf1酶、系統或複合物的多核苷酸的一種或多種載體暫態轉染或非暫態轉染的。在一些實施方式中,細胞當天然存在在受試者中時被轉染。在一些實施方式中,轉染的細胞係從受試者中獲得的。在一些實施方式中,細胞係來源於從受試者中獲得的細胞,諸如細胞系。用於組織培養的多種多樣的細胞系係本領域已知的並且在此在其他地方舉例說明。細胞系可從
熟習該項技術者已知的多種來源獲得(例如,參見美國典型培養物保藏中心(ATCC)(維吉尼亞州馬納薩斯(Manassus,Va.)))。在一些實施方式中,將用包含編碼用於如在此所限定的多靶向中的Cpf1酶、系統或複合物的多核苷酸的一種或多種載體轉染的細胞用於建立一種包含一種或多種載體衍生序列的新細胞系。在一些實施方式中,將用如在此所述的用於多靶向的Cpf1 CRISPR系統或複合物的組分暫態轉染(諸如藉由暫態轉染一種或多種載體或用RNA轉染)並且藉由Cpf1 CRISPR系統或複合物的活性修飾的細胞用於建立一種包括含有修飾但缺乏任何其他外源性序列的細胞的細胞系。在一些實施方式中,將用包含編碼用於如在此所限定的多靶向中的Cpf1酶、系統或複合物的多核苷酸的一種或多種載體暫態轉染或非暫態轉染的細胞,或來源於此類細胞的細胞系用於評估一種或多種測試化合物。
術語“調節元件”如在此其他地方所限定。
有利的載體包括慢病毒和腺伴隨病毒並且所述載體類型還可以針對靶向的特定細胞類型來選擇。
在一個方面中,本發明提供了一種包含以下項的真核宿主細胞:(a)可操作地連接至同向重複序列的第一調節元件和用於將一個或多個指導RNA序列插入同向重複序列的上游或下游(無論哪一種都適用)的一個或多個插入位點,其中在表現時,
一種或多種指導序列引導Cpf1 CRISPR複合物與真核細胞中的對應的一個或多個靶序列的序列特異性結合,其中Cpf1 CRISPR複合物包含與雜交至對應的一個或多個靶序列的一種或多種指導序列複合的Cpf1酶;和/或(b)可操作地連接至編碼包含較佳的是至少一個核定位序列和/或NES的所述Cpf1酶的酶編碼序列的第二調節元件。在一些實施方式中,宿主細胞包含組分(a)和(b)。在一些實施方式中,組分(a)、組分(b)或組分(a)和(b)被穩定地整合到宿主真核細胞的基因組中。在一些實施方式中,組分(a)進一步包含可操作地連接至第一調節元件,並且視情況藉由同向重複序列分開的兩種或更多種指導序列,其中當表現時,兩種或更多種指導序列中的每種引導Cpf1 CRISPR複合物與真核細胞中的不同靶序列的序列特異性結合。在一些實施方式中,Cpf1酶包含具有足以驅動所述CRISPR酶在真核細胞的核中和/或之外以可檢測的量積累的強度的一個或多個核定位序列和/或核輸出序列或NES。
在一些實施方式中,Cpf1酶係V型或VI型CRISPR系統酶。在一些實施方式中,Cpf1酶係Cpf1酶。在一些實施方式中,Cpf1酶來源於土拉熱弗朗西絲菌1、土拉熱弗朗西絲菌新殺手亞種、易北普雷沃菌、毛螺旋菌科細菌MC2017 1、解朊丁酸弧菌、佩萊格裡尼菌科細菌GW2011_GWA2_33_10、儉菌總門細菌GW2011_GWC2_44_17、密斯氏菌屬某種SCADC、胺基酸球菌屬某種BV3L6、毛螺旋菌MA2020、候選白蟻甲烷枝原體、挑剔真細菌、牛莫拉氏菌237、稻田鉤端螺旋體、毛螺旋菌科細菌ND2006、狗口腔卟啉單胞菌3、解糖腖普雷沃菌或獼猴卟啉單胞菌的Cpf1,
並且可以進一步包含如在此其他地方所限定的Cpf1的改變或突變,並且可以是嵌合Cpf1。在一些實施方式中,Cpf1酶被密碼子優化為在真核細胞中表現。在一些實施方式中,CRISPR酶引導靶序列位置處的一條或兩條股的切割。在一些實施方式中,第一調節元件係聚合酶III啟動子。在一些實施方式中,第二調節元件係聚合酶II啟動子。在一些實施方式中,一種或多種指導序列的長度(各自)係至少16、17、18、19、20、25個核苷酸,或介於16個-30個、或介於16個-25個、或介於16個-20個核苷酸之間。當使用多個指導RNA時,它們較佳的是藉由同向重複序列分開。在一個方面中,本發明提供了一非人類真核生物體;較佳的是多細胞真核生物體,該等生物體包含根據任何所述實施方式的真核宿主細胞。在其他方面中,本發明提供了一真核生物體;較佳的是多細胞真核生物體,該等生物體包含根據任何所述實施方式的真核宿主細胞。在該等方面的一些實施方式中,該生物體可以是動物;例如,哺乳動物。而且,該生物體可以是節胺動物,諸如昆蟲。生物體還可以是植物。此外,生物體可以是真菌。
在一個方面中,本發明提供了一種包含在此所述的一種或多種組分的套組。在一些實施方式中,套組包括載體系統和用於使用套組的說明書。在一些實施方式中,該載體系統包含:(a)可操作地連接至同向重複序列的第一調節元件和用於將一種或多種指導序列插入同向重複序列的上游或下游(無論哪一種都適用)的一個或多個插入位點,其中在表現時,指導序列引導Cpf1 CRISPR複合物與真核細胞中的靶序列的序列特異性結合,其中Cpf1 CRISPR複合物包含與雜交至靶序列的指導序列複合的Cpf1
酶;和/或(b)可操作地連接至編碼包含核定位序列的所述Cpf1酶的酶編碼序列的第二調節元件。在一些實施方式中,套組包括位於系統的相同或不同的載體上的組分(a)和(b)。在一些實施方式中,組分(a)進一步包含可操作地連接至第一調節元件的兩種或更多種指導序列,其中當表現時,兩種或更多種指導序列中的每種引導CRISPR複合物與真核細胞中的不同靶序列的序列特異性結合。在一些實施方式中,Cpf1酶包含具有足以驅動所述CRISPR酶在真核細胞的核中以可檢測的量積累的強度的一個或多個核定位序列。在一些實施方式中,CRISPR酶係V型或VI型CRISPR系統酶。在一些實施方式中,CRISPR酶係Cpf1酶。在一些實施方式中,Cpf1酶來源於土拉熱弗朗西絲菌1、土拉熱弗朗西絲菌新殺手亞種、易北普雷沃菌、毛螺旋菌科細菌MC2017 1、解朊丁酸弧菌、佩萊格裡尼菌科細菌GW2011_GWA2_33_10、儉菌總門細菌GW2011_GWC2_44_17、密斯氏菌屬某種SCADC、胺基酸球菌屬某種BV3L6、毛螺旋菌MA2020、候選白蟻甲烷枝原體、挑剔真細菌、牛莫拉氏菌237、稻田鉤端螺旋體、毛螺旋菌科細菌ND2006、狗口腔卟啉單胞菌3、解糖腖普雷沃菌或獼猴卟啉單胞菌的Cpf1(例如,被修飾成具有或締合於至少一個DD),並且可以進一步包含Cpf1的改變或突變,並且可以是嵌合Cpf1。在一些實施方式中,DD-CRISPR酶被密碼子優化為在真核細胞中表現。在一些實施方式中,DD-CRISPR酶引導靶序列位置處的一條或兩條股的切割。在一些實施方式中,DD-CRISPR酶缺乏或基本上缺乏DNA股切割活性(例如,與野生型酶或不具有降低核酸酶活性的突變或改變的酶相比的不超過5%的核酸酶活
性)。在一些實施方式中,第一調節元件係聚合酶III啟動子。在一些實施方式中,第二調節元件係聚合酶II啟動子。在一些實施方式中,指導序列的長度係至少16、17、18、19、20、25個核苷酸,或介於16個-30個、或介於16個-25個、或介於16個-20個核苷酸之間。
在一個方面中,本發明提供了一種修飾宿主細胞諸如真核細胞中的多種靶多核苷酸之方法。在一些實施方式中,該方法包括使得Cpf1 CRISPR複合物結合多種靶多核苷酸,例如來實施所述多種靶多核苷酸的切割,從而修飾多種靶多核苷酸,其中該Cpf1 CRISPR複合物包含與多個指導序列複合的Cpf1酶,每個指導序列雜交至所述靶多核苷酸內的特異性靶序列,其中所述多個指導序列連接至同向重複序列。在一些實施方式中,所述切割包括藉由所述Cpf1酶切割每個靶序列的位置處的一條或兩條股。在一些實施方式中,所述切割使得多個靶基因的轉錄減少。在一些實施方式中,該方法進一步包括使用外源性模板多核苷酸藉由同源重組修復一種或多種所述所述切割的靶多核苷酸,其中所述修復產生包括一種或多種所述靶多核苷酸的一個或多個核苷酸的插入、缺失或取代的突變。在一些實施方式中,所述突變使得由包含一個或多個靶序列的基因表現的蛋白質中發生一個或多個胺基酸的變化。在一些實施方式中,該方法進一步包括將一個或多個載體遞送至所述真核細胞,其中一個或多個載體驅動以下項中的一個或多個的表現:Cpf1酶和連接至同向重複序列的多個指導RNA序列。在一些實施方式中,所述載體被遞送至受試者中的真核細胞。在一些實施方式中,所述修飾發生在細胞培養中的所述真核細胞
中。在一些實施方式中,該方法進一步包括在所述修飾之前將所述真核細胞從受試者分離。在一些實施方式中,該方法進一步包括將所述真核細胞和/或衍生自其的細胞返回至所述受試者。
在一個方面中,本發明提供了一種修飾多種多核苷酸在真核細胞中的表現的方法。在一些實施方式中,該方法包括使得Cpf1 CRISPR複合物結合多種多核苷酸,以使得所述結合導致所述多核苷酸的表現增加或減少;其中Cpf1 CRISPR複合物包含與多個指導序列複合的Cpf1酶,每個指導序列雜交至其自身的在所述多核苷酸內的靶序列,其中所述指導序列連接至同向重複序列。在一些實施方式中,該方法進一步包括將一個或多個載體遞送至所述真核細胞,其中一個或多個載體驅動以下項中的一個或多個的表現:Cpf1酶和連接至同向重複序列的多個指導序列。
在一個方面中,本發明提供了一種包含同向重複序列的上游或下游(無論哪一種都適用)的多個指導RNA序列的重組多核苷酸,其中在表現時,每個指導序列引導Cpf1 CRISPR複合物與其在真核細胞中存在的相應靶序列的序列特異性結合。在一些實施方式中,靶序列係真核細胞中存在的病毒序列。在一些實施方式中,靶序列係原癌基因或癌基因。
本發明的方面涵蓋可以包含指導RNA(gRNA)和如在此所限定的Cpf1酶的非天然存在或工程化的組成物,該指導RNA包含能夠與細胞中感興趣的基因組座位中的靶序列雜交的指導序列,該Cpf1酶可以包含至少一個或多個核定位序列。
本發明的一個方面涵蓋藉由將在此所述的任一組成
物引入到細胞中來修飾感興趣的基因組座位以改變該細胞中的基因表現的方法。
本發明的一個方面在於以上元件包含在單一組成物中或包含在單獨組成物中。該等組成物可以有利地應用於宿主以引起基因組水平上的功能效應。
如在此所用,術語“指導RNA”或“gRNA”具有如在此其他地方使用的含義(leaning)並且包括與靶核酸序列具有足夠互補性以與靶核酸序列雜交並引導核酸靶向複合物與靶核酸序列的序列特異性結合的任何多核苷酸序列。每個gRNA可以被設計成包含特異於相同或不同轉接蛋白的多個結合識別位點(例如適配體)。每個gRNA可以被設計成結合位於轉錄起始位點(即TSS)的上游的啟動子區-1000 - +1核酸,較佳的是-200核酸。此定位改善了影響基因啟動(例如,轉錄活化物)或基因抑制(例如,轉錄阻遏物)的功能結構域。修飾gRNA可以是組成物中包含的靶向一個或多個靶座位的一個或多個修飾gRNA(例如至少1個gRNA、至少2個gRNA、至少5個gRNA、至少10個gRNA、至少20個gRNA、至少30個gRNA、至少50個gRNA)。所述多個gRNA序列可以是串聯安排的並且較佳的是藉由同向重複序列分開。
因此,如在此所限定的gRNA、CRISPR酶可以各自單獨地包含在組成物中並且單獨或共同地給予至宿主。可替代地,該等組分可以提供於單一組成物中以用於向宿主給予。對宿主的給藥可以經由技術人員已知的或在此描述的用於遞送至宿主的病毒載體(例如,慢病毒載體、腺病毒載體、AAV載體)進行。如在
此解釋的,使用不同的選擇標記物(例如,對於慢病毒gRNA選擇)和gRNA濃度(例如,取決於是否使用多個gRNA)可能對引起改善的效應是有利的。基於此構想,若干種變體適合用於引起基因組座位事件,包括DNA切割、基因啟動或基因失活。使用提供的組成物,熟習該項技術者可以使用相同或不同功能結構域有利地且特異性地靶向單一或多個座位以引起一個或多個基因組座位事件。組成物可以應用在用於篩選細胞中文庫和體內功能模型(例如,lincRNA的基因啟動和功能的鑒定;增功能模型;失功能模型;使用本發明組成物來建立細胞系和轉基因動物以用於優化和篩選目的)的多種多樣的方法中。
本發明包括本發明的組成物用於建立和利用條件型或誘導型CRISPR轉基因細胞/動物的用途;例如參見,普萊特(Platt)等人,細胞(2014),159(2):440-455,或在此引用的PCT專利出版物,諸如WO 2014/093622(PCT/US2013/074667)。例如,細胞或動物諸如非人類動物,例如脊椎動物或哺乳動物,諸如齧齒動物,例如小鼠、大鼠或其他實驗室或野生動物,例如貓、狗、羊等,可以進行“敲入”,由此類似於普萊特等人該動物條件型地或可誘導型地表現Cpf1。因此靶細胞或動物包含條件型或可誘導型(例如呈Cre依賴性構建體的形式)的CRISRP酶(例如Cpf1),在引入到靶細胞中的載體表現時,載體表現Cre,從而誘導或產生了靶細胞中的CRISRP酶(例如Cpf1)表現的條件。藉由應用如在此所限定的教授內容和組成物以及創建CRISPR複合物的已知方法,誘導型基因組事件還可以是本發明的一個方面。此類誘導型事件的實例已在此其他地方有所描述。
在一些實施方式中,當特別是在治療方法中遺傳疾病被靶向時,表型改變較佳的是基因組修飾的結果並且較佳的是其中提供了修復模板以校正或改變表型。
在一些實施方式中,可以被靶向的疾病包括與引起疾病的剪接缺陷相關的那些。
在一些實施方式中,細胞靶標包括造血幹細胞/祖細胞(CD34+);人類T細胞;以及眼(視網膜細胞)-例如光受體先質細胞。
在一些實施方式中,基因靶包括:人類β球蛋白-HBB(用於治療鐮狀細胞貧血,包括藉由刺激基因轉變(使用緊密相關的HBD基因作為內源性模板)進行);CD3(T細胞);以及CEP920-視網膜(眼)。
在一些實施方式中,疾病靶標也可以包括:癌症;鐮狀細胞貧血(基於點突變);HBV、HIV;β-地中海貧血;以及眼睛或眼部疾病-例如引起萊伯氏先天性黑矇(LCA)的剪接缺陷。
在一些實施方式中,遞送方法包括:酶-指導序列複合物(核糖核蛋白)的陽離子脂質介導的“直接遞送”以及質粒DNA的電穿孔。
在此所述的方法、產物和用途可以用於非治療性目的。此外,任一在此所述方法可以應用於體外離體中。
在一個方面中,提供了非天然存在或工程化的組成物,該組成物包含:
I.兩種或更多種CRISPR-Cas系統多核苷酸序列,該等多核苷酸序列包含:
(a)能夠雜交至多核苷酸座位中的第一靶序列的第一指導序列,
(a)能夠雜交至多核苷酸座位中的第二靶序列的第二指導序列,
(c)同向重複序列,
以及
II.Cpf1酶或編碼它的第二多核苷酸序列,
其中當轉錄時,第一指導序列和第二指導序列分別引導第一Cpf1 CRISPR複合物和第二Cpf1 CRISPR複合物與第一靶序列和第二靶序列的序列特異性結合,
其中第一CRISPR複合物包含與可雜交至第一靶序列的第一指導序列複合的Cpf1酶,
其中第二CRISPR複合物包含與可雜交至第二靶序列的第二指導序列複合的Cpf1酶,並且
其中第一指導序列引導DNA雙股體中的靠近第一靶序列的一條股的切割並且第二指導序列引導靠近第二靶序列的另一條股的切割,誘導雙股斷裂,從而修飾生物體或非人類或非動物生物體。類似地,可以設想包含超過兩個的指導RNA的組成物,例如每個RNA特異於一靶標,並且串聯安排在如在此所述的組成物或
CRISPR系統或複合物中。
在另一個實施方式中,Cpf1作為蛋白質遞送至細胞中。在另一個且特別較佳的實施方式中,Cpf1作為蛋白質或作為編碼它的核苷酸序列遞送至細胞中。作為蛋白質向細胞的遞送可以包括核糖核蛋白(RNP)複合物的遞送,其中蛋白質與多個指導序列複合。
在一個方面中,提供了藉由本發明的組成物、系統或修飾酶修飾或包含該等組成物、系統或修飾酶的宿主細胞和細胞系,包括幹細胞及其子代。
在一個方面中,提供了細胞治療的方法,其中例如取樣或培養了單個細胞或細胞群體,其中一個或多個細胞係或已經係如在此所述進行離體修飾的,並且然後被重新引入(取樣的細胞)或引入(培養的細胞)到生物體中。就這一點而言,幹細胞,無論胚胎幹細胞或誘導多能幹細胞或全能幹細胞也是特別較佳的。但是,當然,也設想了體內實施方式。
本發明方法可以進一步包括模板的遞送,諸如修復模板,該等修復模板可以是dsODN或ssODN,參見下文。模板遞送可以是經由與任一或所有CRISPR酶或指導RNA的遞送同時發生或分開並且經由相同遞送機制或不同遞送機制。在一些實施方式中,較佳的是,模板與指導RNA一起遞送,並且也較佳的是與CRISPR酶一起遞送。一個實例可以是AAV載體,其中CRISPR酶係AsCpf1或LbCpf1。
本發明方法可以進一步包括:(a)將包含互補於由所述雙股斷裂創建的突出端的突出端的雙股寡去氧核苷酸(dsODN)遞送至細胞,其中所述dsODN被整合到感興趣的座位中;或-(b)將單股寡去氧核苷酸(ssODN)遞送至細胞,其中所述ssODN充當用於所述雙股斷裂的同源定向修復的模板。本發明方法可以用於預防或治療個體的疾病,視情況其中所述疾病由所述感興趣的座位中的缺陷導致。本發明方法可以在個體中體內進行或者在取自個體的細胞上離體進行,視情況其中所述細胞被返回至個體。
本發明還包括根據使用用於如在此所限定的串聯或多靶向中的CRISPR酶或Cas酶或Cpf1酶或CRISPR-CRISPR酶或CRISPR-Cas系統或CRISPR-Cpf1系統獲得產物。
套組
在一個方面中,本發明提供了含有在以上方法和組成物中所揭露的任何一個或多個元件的套組。在一些實施方式中,套組包括如在此教授的載體系統和用於使用套組的說明書。元件可以單獨地或組合地提供,並且可以被提供於任何適合的容器中,諸如小瓶、瓶子或管。套組可以包括gRNA和如在此所述的非結合保護子股。套組可以包括gRNA以及與指導序列至少部分地結合的保護子股(即pgRNA)。因此,套組可以包括呈如在此所述的部分雙股核苷酸序列的pgRNA。在一些實施方式中,套組包括一種或多種語言,例如超過一種語言的說明書。說明書可以是針對在此所述的應用和方法的。
在一些實施方式中,套組包括在利用在此所述的一個
或多個元件的方法中使用的一種或多種試劑。試劑可以提供於任何適合容器中。例如,套組可以提供一種或多種反應或存儲緩衝液。可以按在具體測定中可用的形式或按在使用之前需要添加一種或多種其他組分的形式(例如按濃縮或凍乾形式)提供試劑。緩衝液可以是任何緩衝液,包括但不限於碳酸鈉緩衝液、碳酸氫鈉緩衝液、硼酸鹽緩衝液、Tris緩衝液、MOPS緩衝液、HEPES緩衝液及其組合。在一些實施方式中,緩衝液係鹼性的。在一些實施方式中,緩衝液具有從約7至約10的pH。在一些實施方式中,套組包括一種或多種寡核苷酸,該一種或多種寡核苷酸對應於用於插入到載體中的指導序列,以便可操作地連接該指導序列和調節元件。在一些實施方式中,套組包括同源重組模板多核苷酸。在一些實施方式中,套組包括在此所述的一種或多種載體和/或一種或多種多核苷酸。套組可以有利地允許提供本發明的系統的所有元件。
在一個方面中,本發明提供了用於使用CRISPR系統的一個或多個元件的方法。本發明的CRISPR複合物提供了一種用於修飾靶多核苷酸的有效手段。本發明的CRISPR複合物具有多種多樣的效用,包括修飾(例如,缺失、插入、易位、失活、啟動)許多細胞類型中的靶多核苷酸。這樣,本發明的CRISPR複合物在例如基因治療、藥物篩選、疾病診斷以及預後方面具有廣泛的應用。示例性CRISPR複合物包含與雜交至靶多核苷酸內的靶序列的指導序列複合的CRISPR效應蛋白。在某些實施方式中,同向重複序列連接至指導序列。
在一個實施方式中,本發明提供了一種切割靶多核苷酸的方法。該方法包括使用結合靶多核苷酸的CRISPR複合物修飾靶多核苷酸並且實施所述靶多核苷酸的切割。典型地,本發明的CRISPR複合物在被引入到細胞中時產生基因組序列的斷裂(例如單股或雙股斷裂)。例如,該方法可以用於切割細胞中的疾病相關基因。
藉由CRISPR複合物產生的斷裂可以藉由修復過程來修復,諸如易出錯的非同源末端連接(NHEJ)途徑或高保真性同源定向修復(HDR)。在該等修復過程期間,可以將一個外源性多核苷酸模板引入到基因組序列中。在一些方法中,該HDR過程被用於修飾基因組序列。例如,可以將包含有待整合的側接有一個上游序列和一個下游序列的序列的外源性多核苷酸模板引入到細胞中。上游序列和下游序列與染色體中整合位點的任一側享有序列相似性。
在希望的情況下,供體多核苷酸可以是DNA,例如DNA質粒、細菌人工染色體(BAC)、酵母人工染色體(YAC)、病毒載體、一段線性DNA、PCR片段、裸核酸或與遞送媒介物(諸如脂質體或泊洛沙姆)複合的核酸。
外源性多核苷酸模板包含有待整合的序列(例如,突變型基因)。供整合的序列可以是對細胞而言內源或外源的序列。有待整合的序列的實例包括編碼蛋白質的多核苷酸或非編碼RNA(例如,微小RNA)。因此,供整合的序列可以可操作地連接至一種或多種適當的控制序列。可替代地,有待整合的序列可以提供
調節功能。
外源性多核苷酸模板中的上游序列和下游序列被選擇為促進感興趣的染色體序列與供體多核苷酸之間的重組。上游序列係與供整合的靶向位點的上游的基因組序列享有序列相似性的核酸序列。類似地,下游序列係與整合的靶向位點的下游的染色體序列享有序列相似性的核酸序列。外源性多核苷酸模板中的上游序列和下游序列與靶向的基因組序列可以具有75%、80%、85%、90%、95%或100%序列一致性。較佳的是,外源性多核苷酸模板中的上游序列和下游序列與靶向的基因組序列具有約95%、96%、97%、98%、99%或100%序列一致性。在一些方法中,外源性多核苷酸模板中的上游序列和下游序列與靶向的基因組序列具有約99%或100%序列一致性。
上游序列或下游序列可以包含從約20bp至約2500bp,例如約50、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400或2500bp。在一些方法中,示例性上游序列或下游序列具有約200bp至約2000bp、約600bp至約1000bp,或更具體地約700bp至約1000bp。
在一些方法中,外源性多核苷酸模板可以進一步包含標記物。此標記物可以使得容易地篩選靶向的整合。適合的標記物的實例包括限制位點、螢光蛋白或選擇標記物。可以使用重組技術構建本發明的外源性多核苷酸模板(例如參見,薩姆布魯克(Sambrook)等人,2001和奧蘇貝爾(Ausubel)等人,1996)。
在一用於藉由整合外源性多核苷酸模板來修飾靶多核苷酸的示例性方法中,藉由CRISPR複合物將雙股斷裂引入到基因組序列中,經由同源重組外源性多核苷酸模板而修復該斷裂,這樣使得將該模板整合到基因組中。雙股斷裂的存在促進模板的整合。
在其他實施方式中,本發明提供了一種修飾多核苷酸在真核細胞中的表現之方法。該方法包括藉由使用結合多核苷酸的CRISPR複合物增加或減少靶多核苷酸的表現。
在一些方法中,可以使靶多核苷酸失活以實施細胞中的表現的修飾。例如,在CRISPR複合物與細胞中的靶序列結合後,靶多核苷酸失活,這樣使得該序列不被轉錄,該編碼蛋白不被產生,或者該序列不會像野生型序列一樣起作用。例如,可以使蛋白質或微小RNA編碼序列失活,這樣使得該蛋白質不被產生。
在一些方法中,控制序列可以失活,使得其不再作為控制序列起作用。如在此使用,“控制序列”係指影響核酸序列的轉錄、翻譯或可及性的任何核酸序列。控制序列的實例包括啟動子、轉錄終止子和增強子,它們係控制序列。失活的靶序列可以包括缺失突變(即,缺失一個或多個核苷酸)、插入突變(即,插入一個或多個核苷酸)或無義突變(即,用另一個核苷酸取代一個單核苷酸,這樣使得引入終止密碼子)。在一些方法中,靶序列的失活導致該靶序列的“敲除”。
CRISPR Cas系統的示例性使用方法
本發明提供了一種非天然存在的或工程化的組成物、或編碼所述組成物的組分的一種或多種多核苷酸、或含有編碼所述組成物的組分一種或多種多核苷酸的載體或遞送系統,其用於體內、離體或體外修飾靶細胞並且該修飾可以改變細胞使得一旦修飾,CRISPR修飾細胞的子代或細胞系保留改變的表型的方式實施。該等修飾的細胞和子代可以是多細胞生物體的一部分,諸如在將CRISPR系統應用於所希望的細胞類型的情況下的植物或動物。CRISPR發明可以是一種治療性治療方法。治療性治療方法可以包括基因或基因組編輯,或基因治療。
失活的CRISPR Cpf1酶用於檢測方法諸如FISH之用途
在一個方面中,本發明提供了一種包含在此所述的催化失活Cas蛋白,較佳的是失活Cpf1(dCpf1)的工程化、非天然發生的CRISPR-Cas系統,以及此系統在檢測方法諸如螢光原位雜交(FISH)的檢測方法中之用途。缺乏產生DNA雙股斷裂的能力的dCpf1可以與標記物諸如螢光蛋白,諸如增強型綠色螢光蛋白(eEGFP)融合,並且與小指導RNA共表現以靶向體內的臂間、中心和端粒的(teleomeric)重複序列。dCpf1系統可以用於視覺化人類基因組中的重複序列和單個基因兩者。標記的dCpf1 CRISPR-cas系統的此類新應用在成像細胞和研究機能核體系結構中,特別是在小核體積或複合物3-D結構的情況下可能是重要的。(陳.B、吉伯.LA(Gilbert LA)、克伊米尼.BA(Cimini BA)、斯尼茨鮑爾.J(Schnitzbauer J)、張.W、李.GW、派克.J(Park J)、布萊克本.EH(Blackburn EH)、魏斯曼.JS(Weissman JS)、齊.LS(Qi LS)、
黃.B(Huang B),2013,藉由優化的CRISPR/Cas系統使活人類細胞中的基因組座位動態成像,細胞155(7):1479-91.doi:10.1016/j.cell.2013.12.001.)
用CRISPR Cas系統或複合物(例如,Cpf1-RNA複合物)修飾靶標
在一個方面中,本發明提供了修飾真核細胞中的靶多核苷酸的方法,該等方法可以是在體內、離體或在體外。在一些實施方式中,該方法包括從人類或非人類動物取樣細胞或細胞群體,並且修飾該細胞或該等細胞。培養可以發生在離體的任何階段。該細胞或該等細胞甚至可以被重新引入非人類動物或植物中。對於重新引入的細胞,特別較佳的是該等細胞係幹細胞。
在一些實施方式中,該方法包括使得CRISPR複合物結合靶多核苷酸來實施所述靶多核苷酸的切割,從而修飾該靶多核苷酸,其中該CRISPR複合物包含與雜交至或可雜交至所述靶多核苷酸內的靶序列的指導序列複合的CRISPR酶。
在一個方面中,本發明提供了一種修飾多核苷酸在真核細胞中的表現之方法。在一些實施方式中,該方法包括使得CRISPR複合物結合該多核苷酸,以使得所述結合導致所述多核苷酸的表現增加或減少;其中CRISPR複合物包含與雜交至或可雜交至所述多核苷酸內的靶序列的指導序列複合的CRISPR酶。類似的考慮因素和條件適用如上文針對修飾靶多核苷酸之方法。實際上,該等取樣、培養和重新引入選擇跨本發明的多個方面而適用。
實際上,在本發明的任何方面中,CRISPR複合物可以包含與雜交至或可雜交至靶序列的指導序列複合的CRISPR酶。類似的考慮因素和條件適用如上文針對修飾靶多核苷酸的方法。
因此,在在此所述的任一非天然存在的CRISPR酶中包含至少一種修飾並且由此該酶具有某些改善的能力。具體地說,任一酶能夠與指導RNA形成CRISPR複合物。當形成此複合物時,指導RNA能夠結合靶多核苷酸序列並且酶能夠修飾靶座位。此外,與未修飾酶相比,CRISPR複合物中的酶具有降低的修飾一個或多個脫靶座位的能力。
此外,在此所述的修飾CRISPR酶涵蓋下述的酶:由此在CRISPR複合物中該酶與未修飾酶相比具有增加的修飾一個或多個靶座位的能力。此功能可以單獨提供或者與以上所述的降低的修飾一個或多個脫靶座位的能力的功能組合提供。任何此類酶可以提供有如在此所述的對CRISPR酶的任一另外修飾,諸如與藉由一個或多個締合的異源功能結構域提供的任何活性、任何降低核酸酶活性的另外突變等組合。
在本發明的有利實施方式中,修飾CRISPR酶相比於未修飾酶被提供有降低的修飾一個或多個脫靶座位的能力並且相比於未修飾酶被提供有增加的修飾一個或多個靶座位的能力。在與對酶的另外修飾組合的情況下,可以實現顯著增強的特異性。例如,提供了此類有利實施方式與一個或多個另外的突變的組合,其中一個或多個另外的突變係處於一個或多個催化活性結構域之中。此類另外的催化突變可以賦予如在此其他地方詳細所述的切
口酶功能性。在此類酶中,可以實現增強的特異性,這歸因於關於酶活性的改善特異性。
可以對坐落於位於RuvC-III結構域與HNH結構域之間的帶正電荷的區/溝中的胺基酸殘基進行如以上所述的降低脫靶效應和/或增強中靶效應的突變。應瞭解的是,任一以上所述的功能效應可以藉由上述溝內的胺基酸的修飾來實現,但是還藉由相鄰於此溝或在此溝之外的胺基酸的修飾來實現。
可以被工程化到如在此所述的修飾CRISPR酶的另外功能包括以下項。1.破壞DNA:蛋白質相互作用而不影響蛋白質三級或二級結構的修飾CRISPR酶。此CRISPR酶包含接觸RNA:DNA雙股體的任一部分的殘基。2.響應於DNA結合(中靶或脫靶)削弱內部蛋白質相互作用使Cpf1保持為核酸酶切割所必需的構象的修飾CRISPR酶。例如,微弱抑制,但是仍允許HNH結構域(定位在易裂的磷酸鹽處)的核酸酶構象的修飾。3.響應於DNA結合(中靶或脫靶)增強內部蛋白質相互作用使Cpf1保持為抑制核酸酶活性的構象的修飾CRISPR酶。例如:將HNH結構域穩定為呈遠離易裂的磷酸鹽的構象的修飾。可以與如在此其他地方詳細所述的對CRISPR酶的任何其他修飾組合來提供任何此另外的功能增強。
任一在此所述的改善功能性可以對任何CRISPR酶,諸如Cpf1酶進行。然而,應瞭解,在此所述的任一功能性可以被工程化到來自其他異種同源物的Cpf1酶中,包括包含來自多個異種同源物的片段的嵌合酶。
核酸、胺基酸和蛋白質、調節序列、載體等
本發明使用核酸結合靶DNA序列。這係有利的,因為核酸的製備比蛋白質更容易且更便宜,並且特異性根據其中尋求同源性的一段序列長度而改變。多靶指的複雜3-D定位例如是不需要的。術語“多核苷酸”、“核苷酸”、“核苷酸序列”、“核酸”以及“寡核苷酸”係可互換使用的。它們係指任何長度的核苷酸(去氧核糖核苷酸或核糖核苷酸)的聚合形式或其類似物。多核苷酸可以具有任何三維結構並且可以執行任何已知或未知的功能。以下各項係多核苷酸的非限制性實例:基因或基因片段的編碼區或非編碼區、由連鎖分析定義的多個座位(一個座位)、外顯子、內含子、信使RNA(mRNA)、轉移RNA、核糖體RNA、短干擾RNA(siRNA)、短髮夾RNA(shRNA)、微RNA(miRNA)、核糖核酸酶、cDNA、重組多核苷酸、分枝多核苷酸、質粒、載體、分離的任何序列的DNA、分離的任何序列的RNA、核酸探針以及引物。該術語還涵蓋具有合成骨架的核酸樣結構,參見例如埃克斯坦(Eckstein),1991;巴塞折(Baserga)等人,1992;米利根(Milligan),1993;WO 97/03211;WO 96/39154;馬塔(Mata),1997;施特勞斯-紹庫普(Strauss-Soukup),1997;以及紮姆斯塔格(Samstag),1996。多核苷酸可以包含一個或多個修飾核苷酸,諸如甲基化核苷酸和核苷酸類似物。如果存在的話,對核苷酸結構的修飾可以在聚合物組裝之前或之後賦予。核苷酸的序列可以被非核苷酸組分中斷。多核苷酸可以在聚合之後諸如藉由與標記組分軛合來進一步修飾。如在此所用,術語“野生型”係熟習該項技術者理解的技術術語並且意指在自然界中出現的典型式的生物體、菌株、基因或特徵,與突變體或變體形式區分。“野生型”可以是底線。如在此所用,術
語“變體”應理解為意指具有源自自然界中存在的模式的性質展示。術語“非天然存在的”或“工程化的”係可互換使用的並且係指涉及人工處理。該等術語當提及核酸分子或多肽時意指核酸分子或多肽至少基本上與至少一種其他組分分離,該至少一種其他組分在自然界中與該核酸分子或多肽天然締合並且如自然界中發現的。“互補”係指核酸藉由傳統的沃森-克裡克鹼基配對或其他非傳統類型來與另一個核酸序列形成氫鍵的能力。互補百分比表示核酸分子中可與第二核酸序列形成氫鍵(例如,沃森-克裡克鹼基配對)的殘基百分比(例如,10分之5、6、7、8、9、10係50%、60%、70%、80%、90%以及100%互補)。“完美互補”意指核酸序列的所有連續殘基都將與第二核酸序列中同樣數目的連續殘基形成氫鍵。如在此所用的“基本上互補”係指在8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、或更多個核苷酸上的至少60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%、或100%的互補程度,或者是指在嚴格條件下雜交的兩個核酸。如在此所用,用於雜交的“嚴格條件”係指與靶序列具有互補的核酸與靶序列顯著雜交並且基本上不與非靶序列雜交的條件。嚴格條件通常是依賴序列的並且根據多種因素而改變。總的來說,該序列越長,該序列與其靶序列特異性雜交的溫度越高。嚴格條件的非限制性實例詳細描述於媞撒(Tijssen)(1993),生物化學和分子生物學實驗室技術-與核酸探針雜交第I部分,第二章“雜交理論和核酸探針測定策略的綜述”(Laboratory Techniques In Biochemistry And Molecular Biology-Hybridization With Nucleic Acid Probes Part I,Second Chapter“Overview of
principles of hybridization and the strategy of nucleic acid probe assay”),紐約愛思維爾公司(Elsevier,N.Y.)。在參考多核苷酸序列時,那麼還設想互補或部分互補的序列。該等序列較佳的是能夠在高嚴格條件下與參考序列雜交。總體上,為了使雜交率最大化,選擇相對低的嚴格雜交條件:低於熔點(Tm)約20℃至25℃。該Tm係50%特定靶序列在限定的離子強度和pH的溶液中與完美互補探針雜交的溫度。總體上,為了要求至少約85%核苷酸互補的雜交序列,選擇高嚴格洗滌條件為低於該Tm約5℃至15℃。為了要求至少約70%核苷酸互補的雜交序列,選擇中等嚴格洗滌條件為低於該Tm約15℃至30℃。高容許(極低嚴格)洗滌條件可以是低至在該Tm之下50℃,從而允許在雜交序列之間高錯配水平。熟習該項技術者將認識到,雜交和洗滌階段的其他物理和化學參數也可被改變為影響來自靶標與探針序列之間特定同源性水平的可檢測雜交信號的結果。較佳的是高嚴格條件包括在50%甲醯胺、5×SSC以及1% SDS中在42℃下培養或者在5×SSC和1% SDS中在65℃下培養,在0.2×SSC和0.1% SDS中在65℃下洗滌。“雜交”係指其中一個或多個多核苷酸反應形成經由核苷酸殘基的鹼基之間氫鍵鍵合而穩定的複合物的反應。氫鍵可以藉由沃森-克裡克鹼基配對、Hoogstein鍵合或以任何其他序列特異性方式形成該複合物可包含形成雙股體結構的兩條股、形成多股複合物的三條或更多條股、單一自雜交股或該等的任何組合。雜交反應可以構成在更廣泛的方法中的步驟,諸如PCR起始、或酶切割多核苷酸。能夠與給定序列雜交的序列被稱為給定序列的“補體”。如在此所用,術語“基因組座位(genomic locus)”或“座位(locus)”(複數係座位(loci))
係染色體上的基因或DNA序列的特定位點。“基因”係指編碼在生物體中具有功能作用的多肽或RNA股的DNA或RNA片段並且因此係活生物體中的遺傳分子單元。出於本發明的目的,可以認為基因包含調節基因產物產生的區域,無論此類調節序列是否與編碼序列和/或轉錄序列相鄰。因此,基因包括但不一定限於,啟動子序列、終止子、翻譯調節序列諸如核糖體結合位點和內部核糖體進入位點、增強子、沈默子、絕緣子、邊界元件、複製起點、基質附著位點以及座位控制區。如在此所用,“基因組座位的表現”或“基因表現”係來自基因的資訊用於合成功能基因產物所藉由的過程。基因表現產物常常是蛋白質,但在非蛋白編碼基因諸如rRNA基因或tRNA基因中,該產物係功能RNA。所有已知生命(真核生物(包括多細胞生物體)、原核生物(細菌和古生菌)以及病毒)使用基因表現過程產生功能產物以生存。如在此所用,基因或核酸的“表現”不僅涵蓋細胞基因表現,而且涵蓋選殖系統和任何其他背景中的核酸轉錄和翻譯。如在此所用,“表現”還是指多核苷酸從DNA模板轉錄(諸如轉錄成mRNA或其他RNA轉錄物)所藉由的過程和/或轉錄的mRNA隨後翻譯成肽、多肽或蛋白質所藉由的過程。轉錄物和編碼的多肽可以統稱為“基因產物”。如果多核苷酸來源於基因組DNA,則在真核細胞中表現可以包括mRNA的剪接。在此可互換使用的術語“多肽”、“肽”和“蛋白質”係指具有任何長度的胺基酸聚合物。該聚合物可以是線性或支化的,它可以包含修飾胺基酸,並且它可以被非胺基酸中斷。該等術語還涵蓋已修飾的胺基酸聚合物;例如,二硫鍵形成、糖基化、脂化、乙醯化、磷酸化活任何其他操縱,諸如與標記組分軛合。如在此所用,
術語“胺基酸”包括天然和/或非天然或合成的胺基酸,包括甘胺酸和D或L光學異構物,以及胺基酸類似物和肽模擬物。如在此所用,術語“結構域”或“蛋白質結構域”係指可以存在並且獨立於其餘蛋白質鏈起作用的一部分蛋白質序列。如本發明的多個方面中所述的,序列一致性與序列同源性相關。同源性比較可以藉由眼睛來進行,或者更通常地借助於容易獲得的序列比較程式來進行。該等商業上可用的電腦程式可以計算兩個或更多更序列之間的同源性百分比(%)並且還可以計算兩個或更多更胺基酸或核酸序列所享有的序列一致性。
在本發明的多個方面中,術語“指導RNA”係指包含推定或鑒定的crRNA序列或指導序列的多核苷酸序列。
如在此所用,術語“野生型”係熟習該項技術者理解的技術術語並且意指在自然界中出現的典型式的生物體、菌株、基因或特徵,與突變體或變體形式區分。“野生型”可以是底線。
如在此所用,術語“變體”應理解為意指具有源自自然界中存在的模式的性質展示。
術語“非天然存在的”或“工程化的”係可互換使用的並且係指涉及人工處理。該等術語當提及核酸分子或多肽時意指核酸分子或多肽至少基本上與至少一種其他組分分離,該至少一種其他組分在自然界中與該核酸分子或多肽天然締合並且如自然界中發現的。在所有方面和實施方式中,無論它們是否包括該等術語,都應當理解,較佳的是,它們可以是視情況並且因此較佳的是包括或並不較佳的是不包括。此外,術語“非天然存在的”和
“工程化的”可以是可互換使用的並且因此也可以單獨或組合使用,並且在兩者一起提及時,它們可以彼此替換。具體地說,“工程化的”較佳的是代替“非天然存在的”或“非天然存在的和/或工程化的”。
序列同源性可以藉由任何本領域已知的多種電腦程式例如BLAST或FASTA來生成。用於進行此種比對的適合電腦程式係GCG威斯康辛.貝斯菲特(Wisconsin Bestfit)套裝軟體(美國威斯康辛大學(University of Wisconsin,U.S.A);德弗羅(Devereux)等人,1984,核酸研究(Nucleic Acids Res.)12:387)。可以進行序列比較的其他軟體的實例包括但不限於,BLAST套裝軟體(參見奧蘇貝爾等人,1999同上-第18章)、FASTA(安特斯庫爾等人,1990,分子生物學(J.Mol.Biol.),403-410)和GENEWORKS比較工具套件。BLAST和FASTA兩種均可用於離線和線上搜索(參見奧蘇貝爾等人,1999同上,第7-58頁至第7-60頁)。然而,較佳的是使用GCG貝斯菲特程式。序列同源性百分比(%)可以對連續序列計算,即將一個序列與另一個序列比對並且將在一個序列中的每個胺基酸或核苷酸與另一個序列中的相應胺基酸或核苷酸直接比較,每次一個殘基。這被稱為“無空位”比對。典型地,此類無空位比對僅對相對短的多個殘基進行。儘管這係一種非常簡單且連貫的方法,但是它未能考慮到例如,在序列的另外相同鹼基對中,一個插入或缺失可以引起後面的胺基酸殘基無法比對,因此可能導致在進行總體比對時同源性%大大減小。因此,大部分序列比較方法被設計為產生最佳比對,從而考慮到可能的插入和缺失而不會過度不利於總體同源性或一致性得分。這藉由在序列比對中插
入“空位”以試圖最大化局部同源性或一致性來實現。然而,該等更複雜的方法將“空位罰分”分配給出現在比對中的每個空位,以使得對於相同數目的相同胺基酸,與盡可能少的空位(影響兩個比較的序列之間的較高相關性)的序列比對可以實現比具有許多空位的序列更高的得分。“親和力空位成本(Affinity gap cost)”典型地用於對空位的存在承擔相對高的成本並且對空位中的每個後續殘基施加較小的罰分。這係最常使用的空位評分系統。高空位罰分當然可以產生與較少空位的最佳比對。大部分比對程式允許修改空位罰分。然而,較佳的是當使用此類軟體進行序列比較時使用預設值。例如,當使用GCG威斯康辛.貝斯菲特套裝軟體時,胺基酸的默認空位罰分對於空位係-12並且對於每個延伸係-4。因此最大同源性%的計算首先需要產生最佳比對,考慮到空位罰分。用於進行此種比對的適合的電腦軟體係GCG威斯康辛.貝斯菲特套裝軟體(德弗羅等人,1984核酸研究12 p387)。可以進行序列比較的其他軟體的實例包括但不限於,BLAST套裝軟體(參見奧蘇貝爾等人,1999,分子生物學短方案,第4版-第18章)、FASTA(安特斯庫爾等人,1990分子雜誌生物學403-410)和GENEWORKS比較工具套件。BLAST和FASTA兩種均可用於離線和線上搜索(參見奧蘇貝爾等人,1999,分子生物學短方案,第7-58頁至第7-60頁)。然而,對於一些應用,較佳的是使用GCG貝斯菲特程式。一種稱為BLAST 2序列的新工具也可用於比較蛋白質和核苷酸序列(參見FEMS微生物學概述(FEMS Microbiol Lett.)1999 174(2):247-50;FEMS微生物學概述1999 177(1):187-8以及國家健康研究所網站的國家生物技術資訊中心網站)。儘管可以根
據一致性測量最終同源性%,但是比對方法本身典型地並不是基於不全則無的成對比較。相反,通常使用標準的相似性評分矩陣,它基於化學相似性或進化距離將得分分配給每個成對比較。通常使用的這種矩陣的實例係BLOSUM62矩陣-這係BLAST程式套件的預設矩陣。GCG威斯康辛程式通常使用公用的預設值或自訂符號比較表,如果提供的話(詳細內容,參見使用者手冊)。對於一些應用,較佳的是對於GCG套裝軟體使用公用預設值,並且在其他軟體的情況下,使用預設矩陣,諸如BLOSUM62。可替代地,可以使用DNASISTM(日立軟體公司)中的多重比對特徵,基於與CLUSTAL類似的演算法計算同源性百分比(希金斯.DG(Higgins DG)和夏普.PM(Sharp PM)(1988),基因73(1),237-244)。一旦軟體生成最佳比對,可以計算同源性%,較佳的是序列一致性%。軟體典型地進行作為序列比較的一部分的此計算並且生成多個結果。該等序列還可以具有胺基酸殘基的缺失、插入或取代,這產生沈默變化並且形成功能上等效的物質。可以基於胺基酸特徵(諸如殘基的極性、電荷、可溶性、疏水性、親水性、和/或兩親性)的類似性來進行有目的的胺基酸取代並且因此將胺基酸以官能團分組在一起是有用的。胺基酸可以基於其單獨的側鏈的特徵來分組在一起。然而,包括突變資料也會更有用。出於結構原因,因此衍生的幾組胺基酸可能是保守的。這幾組可以卞氏圖表形式描述(利文斯敦.C.D.(Livingstone C.D.)和巴頓.G.J.(Barton G.J.)(1993)“蛋白質序列比對:用於分層分析殘基保守性的策略(Protein sequence alignments:a strategy for the hierarchical analysis of residue conservation)”生物科學中的電腦應用
(Comput.Appl Biosci.)9:745-756)(泰勒.W.R.(Taylor W.R.)(1986)“胺基酸保守性分類(The classification of amino acid conservation)”理論生物學雜誌(J.Theor.Biol.)119;205-218)。可以例如根據下表進行保守性取代,該表描述了普遍接受的胺基酸卞氏圖表分組。
在此可互換使用的術語“受試者”、“個體”和“患者”係指脊椎動物,較佳的是哺乳動物,更較佳的是人類。哺乳動物包括但不限於,鼠類、猴類、人類、家畜、競技動物、以及寵物。還涵蓋體內獲得或體外培養的生物實體的組織、細胞以及其子代。
術語“治療藥”、“能治療的藥劑”或“治療劑”係可互換使用的並且係指當給予受試者時賦予一些有利作用的分子或化合物。有利作用包括實現診斷確定;緩解疾病、症狀、病症或病理病狀;減少或預防疾病、症狀、病症或病狀的發作;以及大體上消除疾病、症狀、病症或病理病狀。
如在此所用,“治療”或“進行治療”或“減輕”或“緩解”係在此可互換使用的。該等術語係指一種用於獲得有利或希望的結果的方法,該等結果包括但不限於治療益處和/或預防益處。治療益處意指在治療中的一種或多種疾病、病狀、症狀中的任何治療上的相關改進或對該等疾病的作用。對於預防益處,組成物可
以給予至處於發展具體的疾病、病狀或症狀的風險中的受試者,或給予報告疾病的一種或多種生理學症狀的受試者,儘管這種疾病、病狀或症狀可能還未得到證實。
術語“有效量”或“治療有效量”係指藥劑足以實現有利或希望的結果的量。治療有效量可以根據以下各項中的一種或多種來改變:受試者和正在治療的疾病病狀、受試者的體重和年齡、疾病病狀的嚴重性、給藥方式等,該等可以容易藉由熟習該項技術者確定。該術語還適合於將藉由在此所述的任何一種成像方法提供檢測圖像的劑量。該特定劑量可以根據以下各項中的一種或多種來改變:所選擇的具體藥劑、隨後的給藥方案(無論它是否與其他化合物組合)、給藥時間、成像的組織、以及其中攜帶它的物理遞送系統。
本發明的若干方面涉及包含一種或多種載體的載體系統或這樣的載體。載體可以被設計為在原核細胞或真核細胞中表現CRISPR轉錄物(例如,核酸轉錄物、蛋白質或酶)。例如,CRISPR轉錄物可以在細菌細胞諸如大腸桿菌、昆蟲細胞(使用桿狀病毒表現載體)、酵母細胞、或哺乳動物細胞中表現。適合的宿主細胞在高德爾,基因表現技術:酶學方法185,學術出版社,加利福尼亞州聖迭哥(1990)中進行進一步討論。可替代地,重組表現載體可以例如使用T7啟動子調節序列和T7聚合酶來進行體外轉錄和翻譯。
本發明的實施方式包括可以含有可發生的同源取代(取代和替換二者在此用於意指存在的胺基酸殘基或核苷酸與替
代性殘基或核苷酸的互換)的序列(多核苷酸或多肽二者),該同源取代即在胺基酸的情況下的同比取代,諸如鹼對鹼、酸對酸、極性對極性等。也可以發生非同源性取代,即從一類殘基到另一類殘基或者可替代地涉及包含非天然胺基酸諸如鳥胺酸(在下文中稱為Z)、二胺基丁酸鳥胺酸(在下文中稱為B)、正亮胺酸鳥胺酸(在下文中稱為O)、吡啶基丙胺酸、噻吩丙胺酸、萘基丙胺酸以及苯基甘胺酸。變體胺基酸序列可以包含適合的間隔基團,該等間隔基團可以插入在該序列的任何兩個胺基酸殘基之間,包括烷基諸如甲基、乙基或丙基以及胺基酸間隔物諸如甘胺酸或β-丙胺酸殘基。涉及在類肽形式中存在一個或多個胺基酸殘基的另一種變型形式可以被熟習該項技術者很好地理解。為免生疑,“類肽形式”用於指示變體胺基酸殘基,其中α-碳取代基係在殘基的氮原子上而不是α-碳上。用於製備類肽形式的肽的方法係本領域已知的,例如西蒙.RJ(Simon RJ)等人,美國國家科學院院刊(PNAS)(1992)89(20),9367-9371以及奧爾韋爾.DC(Horwell DC),生物技術趨勢(Trends Biotechnol.)(1995)13(4),132-134。
同源建模:在其他Cpf1異種同源物中的相應殘基可以藉由以下方法來鑒定:張等人,2012(自然(Nature);490(7421):556-60)和陳等人,2015(科學公共圖書館計算生物學(PLoS Comput Biol);11(5):e1004248)一預測由結構域模體介面介導的相互作用的計算蛋白質-蛋白質相互作用(PPI)方法。PrePPI(預測的PPI)係一種基於結構的PPI預測方法,該方法使用貝葉斯統計框架將結構證據與非結構證據組合。該方法涉及查詢蛋白質的鹼基對並且使用結構比對鑒定與其實驗上確定的結構或同源模型
相對應的結構示意圖。結構比對進一步用於藉由考慮整體和局部幾何關係來鑒定近處和遠處的結構鄰近物。無論何時結構示意圖的兩個鄰近物形成蛋白質資料庫中報導的複合物,這定義了用於建模兩種查詢蛋白質之間的相互作用的模板。複合物模型係藉由在模板的相應結構鄰近物上疊加代表性結構來創建的。此方法進一步描述於戴伊等人,2013(蛋白質科學(Prot Sci);22:359-66)。
出於本發明的目的,擴增意指採用能夠以適當保真度複製靶序列的引物和聚合酶的任何方法。擴增可以是藉由天然或重組DNA聚合酶諸如TaqGoldTM、T7 DNA聚合酶、大腸桿菌DNA聚合酶的克列諾片段、以及逆轉錄酶。一種較佳的擴增方法係PCR。
在某些方面中,本發明涉及載體。如在此所用,“載體”係一種允許或說明實體從一個環境轉移到另一個環境中的工具。它係複製子,諸如質粒、噬菌體或黏粒,可以向該複製子中插入另一個DNA區段以便使得該插入的區段複製。通常,載體在與適當控制元件締合時能夠複製。總的來說,術語“載體”係指能夠轉運它所連接的另一個核酸的核酸分子。載體包括但不限於,單股、雙股或部分雙股的核酸分子;包含一個或多個游離端、不包含游離端(例如,環狀)的核酸分子;包含DNA、RNA或二者的核酸分子;以及本領域已知的其他種類多核苷酸。一種類型的載體係“質粒”,該質粒係指環狀雙股DNA環,可以諸如藉由標準分子選殖技術向該環中插入另外的DNA區段。另一種類型的載體係病毒載體,其中病毒來源的DNA或RNA序列存在於包裝到病毒(例如,逆轉錄病毒、複製缺陷型逆轉錄病毒、腺病毒、複製缺
陷型腺病毒、以及腺相關病毒(AAV))中的載體中。病毒載體還包括由轉染到宿主細胞中的病毒攜帶的多核苷酸。某些載體能夠在引入它們的宿主細胞中自主複製(例如,具有細菌複製起點的細菌載體和附加型哺乳動物載體)。其他載體(例如,非附加型哺乳動物載體)在引入到宿主細胞後被整合到宿主細胞的基因組中,並且因此隨著宿主基因組一起複製。此外,某些載體能夠引導它們可操作地連接的基因的表現。此類載體在此被稱為“表現載體”。在重組DNA技術中實用的常見表現載體常常是質粒形式。
重組表現載體可以包含處於適用於核酸在宿主細胞中表現的形式的本發明的核酸,這意味著重組表現載體包含一個或多個調節元件,該等調節元件可以基於用於表現的宿主細胞來選擇,可操作地連接至有待表現的核酸序列。在重組表現載體內,“可操作地連接”旨在意指感興趣的核苷酸序列以允許核苷酸序列表現(例如,在體外轉錄/翻譯系統中或當該載體被引入到宿主細胞時在宿主細胞中)的方式連接至一個或多個調節元件。關於重組和選殖方法,參考2004年9月2日作為US 2004-0171156 A1公開的美國專利申請10/815,730,該等專利的內容藉由引用以其整體結合在此。
本發明的多個方面涉及指導RNA和(任選修飾或突變的)CRISPR酶(例如,Cpf1)的雙順反子載體。指導RNA和(任選修飾或突變的)CRISPR酶的雙順反子表現載體係較佳的。總的來說並且具體的說,在此實施方式中(任選修飾或突變的)CRISPR酶係較佳的是藉由CBh啟動子驅動。該RNA可以是較佳的是藉由
Pol III啟動子諸如U6啟動子驅動。理想的是,將兩者組合。
在一些實施方式中,提供了指導RNA中的環。這可以是髮夾環或四員環。該環較佳的是GAAA,但不限於此序列或者確實係僅4bp的長度。實際上,用於髮夾結構中的較佳的成環序列的長度係四個核苷酸,並且最較佳的是具有序列GAAA。然而,也可以使用較長或較短的環序列,如可以是替代性序列。該等序列較佳的是包含核苷酸三聯體(例如,AAA)和另一個核苷酸(例如C或G)。成環序列的實例包括CAAA和AAAG。在實踐在此揭露的任何方法時,可以經由本領域已知的一種或多種方法來將適合的載體引入到細胞或胚胎中,該等方法包括但不限於,微注射、電穿孔、聲孔效應、基因槍、磷酸鈣介導的轉染、陽離子轉染、脂質體轉染、樹枝狀轉染、熱激轉染、核轉染、磁轉染、脂轉染、刺穿轉染、光學轉染、專有劑增強的核酸攝取、以及經由脂質體、免疫脂質體、病毒體或人工病毒體遞送。在一些方法中,載體藉由微注射引入到胚胎中。這種或該等載體可以微注射到胚胎的核或胞質中。在一些方法中,這種或該等載體可以藉由核轉染引入到細胞中。
術語“調節元件”旨在包括啟動子、增強子、內部核糖體進入位點(IRES)以及其他表現控制元件(例如,轉錄終止信號,諸如多聚腺苷酸化信號和聚U序列)。此類調節元件描述於例如高德爾,基因表現技術:酶學方法185,學術出版社,加利福尼亞州聖迭哥(1990)中。調節元件包括引導核苷酸序列在許多類型的宿主細胞中連續表現的那些元件和引導核苷酸序列僅在某些宿
主細胞中表現的那些元件(例如,組織特異性調節序列)。組織特異性啟動子可以引導主要在希望的感興趣的組織諸如肌肉、神經元、骨骼、皮膚、血液、特定器官(例如,肝臟、胰臟)、或特定細胞類型(例如,淋巴細胞)中的表現。調節元件還可以時間依賴性方式諸如細胞週期依賴性或發育階段依賴性方式引導表現,這可以是或也可以不是組織特異性或細胞類型特異性的。在一些實施方式中,載體包含一個或多個pol III啟動子(例如,1、2、3、4、5、或更多個pol III啟動子)、一個或多個pol II啟動子(例如,1、2、3、4、5、或更多個pol II啟動子)、一個或多個pol I啟動子(例如,1、2、3、4、5、或更多個pol I啟動子)、或其組合。pol III啟動子的實例包括但不限於,U6和H1啟動子。pol II啟動子的實例包括但不限於,逆轉錄病毒勞斯氏肉瘤病毒(RSV)LTR啟動子(視情況具有RSV增強子)、巨細胞病毒(CMV)啟動子(視情況具有CMV增強子)[例如,參見博沙特等人,細胞,41:521-530(1985)]、SV40啟動子、二氫葉酸還原酶啟動子、β-肌動蛋白啟動子、磷酸甘油激酶(PGK)啟動子、以及EF1α啟動子。術語“調節元件”還涵蓋增強子元件,諸如WPRE;CMV增強子;HTLV-I的LTR中的R-U5’區段(分子細胞生物學,第8(1)卷,第466-472頁,1988);SV40增強子;以及兔β-球蛋白的外顯子2與3之間的內含子序列(美國國家科學院院刊,第78(3)卷,第1527-31頁,1981)。熟習該項技術者將瞭解的是,表現載體的設計可以取決於諸如有待轉化的宿主細胞的選擇、所希望的表現水平等因素。載體可以引入到宿主細胞中從而產生由在此所述的核酸編碼的轉錄物、蛋白質或肽,包括融合蛋白或肽(例如,成簇規律間隔短迴文重複
序列(CRISPR)轉錄物、蛋白質、酶、其突變體形式、其融合蛋白等)。關於調節序列,參考美國專利申請10/491,026,該專利申請的內容藉由引用以其整體結合在此。關於啟動子,參考PCT公開WO 2011/028929和美國申請12/511,940,該等專利申請的內容藉由引用以其整體結合在此。
載體可以被設計為在原核細胞或真核細胞中表現CRISPR轉錄物(例如,核酸轉錄物、蛋白質或酶)。例如,CRISPR轉錄物可以在細菌細胞諸如大腸桿菌、昆蟲細胞(使用桿狀病毒表現載體)、酵母細胞、或哺乳動物細胞中表現。適合的宿主細胞在高德爾,基因表現技術:酶學方法185,學術出版社,加利福尼亞州聖迭哥(1990)中進行進一步討論。可替代地,重組表現載體可以例如使用T7啟動子調節序列和T7聚合酶來進行體外轉錄和翻譯。
載體可以在原核生物或原核細胞中引入並增殖。在一些實施方式中,使用原核生物擴增有待引入到真核細胞的載體拷貝或者作為產生有待引入真核細胞的載體的中間載體(例如,擴增作為病毒載體包裝系統的一部分的質粒)。在一些實施方式,使用原核生物擴增載體拷貝並表現一種或多種核酸,以便提供用於遞送至宿主細胞或宿主生物體的一種或多種蛋白質來源。原核生物中的蛋白質表現最常在具有載體的大腸桿菌中進行,該等載體含有引導融合蛋白或非融合蛋白表現的組成型啟動子或誘導型啟動子。融合載體將許多胺基酸添加到其中編碼的蛋白質,諸如添加到重組蛋白的胺基末端。該等融合載體可以用於一種或多種目
的,諸如:(i)增加重組蛋白的表現;(ii)增加重組蛋白的溶解度;以及(iii)藉由充當親和純化中的配位基來幫助純化重組蛋白。通常,在融合表現載體中,蛋白水解切割位點被引入在融合部分與重組蛋白的接點處,以使得重組蛋白能夠與融合部分分離,從而隨後純化該融合蛋白。此類酶及其同源識別序列包括凝血因子Xa、凝血酶以及腸激酶。示例性融合表現載體包括pGEX(法瑪西亞生物技術公司(Pharmacia Biotech Inc);史密斯和詹森(Johnson),1988.基因67:31-40)、pMAL(普利茅斯貝弗莉的新英格蘭生物實驗室(New England Biolabs,Beverly,Mass.))以及pRIT5(新澤西州皮斯卡塔韋的法瑪西亞公司(Pharmacia,Piscataway,N.J.)),它們將麩胱甘肽S-轉移酶(GST)、麥芽糖E結合蛋白或蛋白A融合至靶重組蛋白。適合的誘導型非融合大腸桿菌表現載體的實例包括pTrc(阿蘭恩(Amrann)等人,(1988)基因69:301-315)和pET 11d(司圖登爾(Studier)等人,基因表現技術:酶學方法185,學術出版社,加利福尼亞州聖迭哥(1990)60-89)。在一些實施方式中,載體係酵母表現載體。用於在酵母釀酒酵母中表現的載體的實例包括pYepSec1(班得瑞(Baldari)等人,1987.歐洲分子生物學學會雜誌(EMBO J.)6:229-234)、pMFa(奎讓(Kuijan)和赫斯奎茲(Herskowitz),1982.細胞30:933-943)、pJRY88(舒爾茨(Schultz)等人,1987.基因54:113-123)、pYES2(加利福尼亞州聖達戈的英傑公司(Invitrogen Corporation,San Diego,Calif.))以及picZ(加利福尼亞州聖達戈的英傑公司)。在一些實施方式中,載體在使用桿狀病毒表現載體的昆蟲細胞中驅動蛋白質表現。可用於在培養的昆蟲細胞(例如,SF9細胞)表現蛋白質的桿狀病毒
載體包括pAc系列(史密斯等人,1983分子細胞生物學3:2156-2165)和pVL系列(拉克樓(Lucklow)和薩默斯(Summers),1989.病毒學(Virology)170:31-39)。
在一些實施方式中,載體能夠使用哺乳動物表現載體驅動一種或多種序列在哺乳動物細胞中表現。哺乳動物表現載體的實例包括pCDM8(錫德(Seed),1987.自然329:840)和pMT2PC(考夫曼(Kaufman)等人,1987.歐洲分子生物學學會雜誌6:187-195)。當用於哺乳動物細胞時,表現載體的控制功能典型地是由一個或多個調節元件提供的。例如,常用的啟動子係來源於多瘤、腺病毒2、巨細胞病毒、猿猴病毒40、以及在此揭露和本領域已知的其他來源。對於原核細胞和真核細胞二者的其他適合表現系統,參見例如薩姆布魯克等人,分子選殖:實驗室手冊(MOLECULAR CLONING:A LABORATORY MANUAL.)第2版,冷泉港實驗室(Cold Spring Harbor Laboratory),冷泉港實驗室出版社(Cold Spring Harbor Laboratory Press),紐約冷泉港(Cold Spring Harbor,N.Y.),1989中的第16章和第17章。
在一些實施方式中,重組哺乳動物表現載體能夠引導核酸優先在特定細胞類型中表現(例如,組織特異性調節元件用於表現核酸)。組織特異性調節元件係本領域已知的。適合的組織特異性啟動子的非限制性實例包括白蛋白啟動子(肝特異性;平克特(Pinkert)等人,1987.基因與發育(Genes Dev.)1:268-277)、淋巴特異性啟動子(卡拉梅(Calame)和伊頓(Eaton),1988.免疫學進展(Adv.Immunol.)43:235-275)(具體地說T細胞受體(維
諾托(Winoto)和巴爾的摩(Baltimore),1989.歐洲分子生物學學會雜誌8:729-733)和免疫球蛋白類(班恩吉(Baneiji)等人,1983.細胞33:729-740;奎因(Queen)和巴爾的摩,1983.細胞33:741-748)的啟動子)、神經元特異性啟動子(例如,神經絲啟動子;伯恩(Byrne)和瑞德爾(Ruddle),1989.美國國家科學院院刊)86:5473-5477)、胰臟特異性啟動子(埃德隆德(Edlund)等人,1985.科學(Science)230:912-916)、以及乳腺特異性啟動子(乳清啟動子;美國專利案號4,873,316和歐洲申請公開號264,166)。還涵蓋發育調節啟動子,例如鼠科hox啟動子(克塞爾(Kessel)和(格魯斯),1990.科學249:374-379)和α-胎蛋白啟動子(康珀斯(Campes)和蒂爾曼(Tilghman),1989.基因與發育3:537-546)。關於原核載體和真核載體,參考美國專利6,750,059,該專利的內容藉由引用以其整體結合在此。本發明的其他實施方式可以涉及病毒載體的使用,關於此使用參考美國專利申請13/092,085,該專利申請的內容藉由引用以其整體結合在此。組織特異性調節元件係本領域已知的並且就這一點而言,參考美國專利7,776,321,該專利的內容藉由引用以其整體結合在此。在一些實施方式中,調節元件可操作地連接至CRISPR系統的一個或多個元件,以便驅動該CRISPR系統的一個或多個元件表現。總的來說,CRISPR(成簇規律間隔短迴文重複序列)也稱為SPIDR(間隔區間隔同向重複序列),它構成通常對特定細菌種類特異的DNA座位家族。CRISPR座位包括大腸桿菌中識別的不同類別的間隔短序列重複序列(SSR)(石野(Ishino)等人,細菌學雜誌(J.Bacteriol.),169:5429-5433[1987];以及中田(Nakata)等人,細菌學雜誌,171:3553-
3556[1989])、以及相關基因。類似的間隔SSR已在地中海富鹽菌、釀膿鏈球菌、魚腥藻屬、以及結核分枝桿菌中鑒定(參見,葛籣恩(Groenen)等人,分子微生物學(Mol.Microbiol.),10:1057-1065[1993];霍(Hoe)等人,新發傳染病(Emerg.Infect.Dis.),5:254-263[1999];馬塞波爾(Masepohl)等人,生物化學與生物物理學雜誌(Biochim.Biophys.Acta 1307:26-30[1996];以及莫西卡(Mojica)等人,分子微生物學),17:85-93[1995])。CRISPR座位與其他SSR的典型不同之處在於重複序列結構,該結構稱為短規律間隔重複序列(SRSR)(詹森(Janssen)等人,組學:整合生物學雜誌(OMICS J.Integ.Biol.),6:23-33[2002];以及莫西卡等人,分子微生物學),36:244-246[2000])。總的來說,該等重複序列係成簇出現的短元件,它們由具有基本上恒定的長度的獨特間插序列規律地間隔開(莫西卡等人,[2000],同上)。儘管該等重複序列在菌株之間係高度保守的,但是間隔重複序列的數目和間隔區的序列典型地因菌株不同而不同(凡埃姆登(van Embden)等人,細菌學雜誌,182:2393-2401[2000])。CRISPR座位已在超過40種原核生物中鑒定(例如,參見,詹森等人,分子微生物學,43:1565-1575[2002];以及莫西卡等人,[2005]),包括但不限於,氣火菌屬、火棒菌屬、硫化葉菌屬、古生球菌屬、鹽盒菌屬、甲烷桿菌屬、甲烷球菌屬、甲烷八疊球菌屬、甲烷八疊球菌屬、火球菌屬、嗜酸菌屬、熱原體屬、棒狀桿菌屬、分枝桿菌屬、鏈黴菌屬、產水菌屬、卟啉單胞菌屬、綠硫菌屬、棲熱菌屬、芽孢桿菌屬、李斯特菌屬、葡萄球菌屬、梭菌屬、高溫厭氧桿菌屬、支原體屬、梭菌屬、固氮弓菌屬(Azarcus)、色桿菌屬、奈瑟氏菌屬、亞硝化單胞
菌屬、脫硫弧菌屬、地桿菌屬、黏球菌屬、彎曲桿菌屬、沃廉菌屬、不動桿菌屬、歐文氏菌屬、埃希菌屬、軍團桿菌屬、甲基球菌屬、巴氏桿菌屬、發光桿菌屬、沙門氏菌屬、黃單胞菌屬、耶爾森菌屬、密螺旋體屬、以及熱袍菌屬。
總的來說,如本申請所用的“核酸靶向系統”總體上是指涉及表現核酸靶向CRISPR相關(“Cas”)基因或引導該等基因活性的轉錄物和其他元件(在此也稱為效應蛋白),該等基因包括編碼核酸靶向Cas(效應)蛋白和指導RNA的序列或來自核酸靶向CRISPR座位的其他序列和轉錄物。在一些實施方式中,核酸靶向系統的一個或多個元件係來源於V型/VI型核酸靶向CRISPR系統。在一些實施方式中,核酸靶向系統的一個或多個元件係來源於包含內源性核酸靶向CRISPR系統的特定生物體。總的來說,核酸靶向系統的特徵係在靶序列的位點處促進核酸靶向複合物形成的元件。在形成核酸靶向複合物的情況下,“靶序列”係指指導序列被設計為與其具有互補性的序列,其中靶序列與指導RNA之間的雜交促進了DNA或RNA靶向複合物的形成。並不一定需要完全互補,只要存在引起雜交並且促進核酸靶向複合物形成的足夠互補性。靶序列可以包括RNA多核苷酸。在一些實施方式中,靶序列位於細胞的核或胞質中。在一些實施方式中,該靶序列可以是在真核細胞的細胞器中,例如線粒體或葉綠體。可以用於重組到包含靶序列的靶向座位中的序列或模板被稱為“編輯模板”或“編輯RNA”或“編輯序列”。在本發明的多個方面中,外源性模板RNA可以被稱為編輯模板。在本發明的一個方面中,重組係同源重組。
典型地,在內源性核酸靶向系統的情況下,核酸靶向複合物(包含雜交至靶序列並與一種或多種核酸靶向效應蛋白複合的指導RNA)的形成產生靶序列中或靶序列附近(例如,從靶序列開始的1、2、3、4、5、6、7、8、9、10、20、50、或更多個鹼基對內)的一條或兩條RNA股的切割。在一些實施方式中,驅動核酸靶向系統的一個或多個元件表現的一種或多種載體被引入到宿主細胞中,以使得該核酸靶向系統的該等元件的表現能引導核酸靶向複合物在一個或多個靶位點處形成。例如,核酸靶向效應蛋白和指導RNA可以各自可操作地連接至單獨載體上的單獨調節元件。可替代地,由相同或不同調節元件表現的該等元件的兩種或更多種可以組合在單一載體中,其中一種或多種另外的載體提供核酸靶向系統在第一載體中不包含的任何組分。在單一載體中組合的核酸靶向系統元件可以佈置為任何適合的取向,諸如一個元件位於相對於第二元件的5'(“上游”)或相對於該第二元件的3'(“下游”)。一個元件的編碼序列可以位於第二元件的編碼序列的相同股或相反股上,並且取向為相同或相反方向。在一些實施方式中,單一啟動子驅動編碼核酸靶向效應蛋白的轉錄物和嵌入一種或多種內含子序列之內(例如,各自在不同內含子中、兩種或更多種在至少一個內含子中,或所有在單一內含子中)的指導RNA的表現。在一些實施方式中,核酸靶向效應蛋白和指導RNA可操作地連接至同一啟動子並且從該同一啟動子表現。
總的來說,指導序列係與靶多核苷酸序列具有足夠互補性以與靶序列雜交並引導核酸靶向複合物與靶序列的序列特異性結合的任何多核苷酸序列。在一些實施方式中,當使用適合比
對演算法進行最佳比對時,指導序列與其相應靶序列之間的互補程度係約或超過約50%、60%、75%、80%、85%、90%、95%、97.5%、99%、或更大。最佳比對可以藉由使用用於比對序列的任何適合的演算法來確定,該等演算法的非限制性實例包括史密斯-沃特曼演算法、尼德曼-溫施演算法、基於巴羅斯-惠勒轉換的演算法(例如,巴羅斯-惠勒比對儀)、ClustalW、Clustal X、BLAT、諾沃比對(諾沃克拉夫特技術公司,ELAND(加利福尼亞州聖迭哥億明達公司))、SOAP(可在soap.genomics.org.cn處獲得)、以及Maq(可在maq.sourceforge.net處獲得)。在一些實施方式中,指導序列的長度係約或超過約5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75、或更多個核苷酸。在一些實施方式中,指導序列的長度係小於約75、50、45、40、35、30、25、20、15、12、或更少個核苷酸。指導序列引導核酸靶向複合物與靶序列的序列特異性結合的能力可以是藉由任何適合的測定來評估。例如,足以形成核酸靶向複合物的核酸靶向系統的組分(包括有待測試的指導序列)可以諸如藉由用編碼核酸靶向CRISPR序列的該等組分的載體進行轉染來提供給具有相應靶序列的宿主細胞,隨後諸如藉由在此所述的Surveyor測定評估靶序列內或附近的優先切割。類似地,靶多核苷酸序列(或其附近的序列)的切割可以在試管中藉由以下方式進行評估:提供靶序列、核酸靶向複合物的組分(包括有待測試的指導序列)和不同於測試指導序列的對照指導序列並且在測試指導序列反應與對照指導序列反應之間比較靶序列處或附近的結合或切割速率。其他測定係可能的,並且將是熟習該項技術者能夠
想到的。
指導序列可以被選擇為靶向任何靶序列。在一些實施方式中,靶序列係基因轉錄物或mRNA中的序列。
在一些實施方式中,靶序列係細胞基因組中的序列。
在一些實施方式中,指導序列被選擇為減小該指導序列內的二級結構程度。二級結構可以是藉由任何適合的多核苷酸折疊演算法來確定。一些程式係基於計算最小吉布斯自由能。一種這樣演算法的實例係mFold,如藉由朱克和施蒂格勒(核酸研究9(1981),133-148)。另一個示例性折疊演算法係維也納大學的理論化學研究所使用質心結構預測演算法開發的線上網站伺服器RNAfold(例如,參見A.R..格魯伯(A.R.Gruber)等人,2008,細胞106(1):23-24;以及PA.凱爾(PA Carr)和GM.丘奇(GM Church),2009,自然生物技術(Nature Biotechnology)27(12):1151-62)。其他演算法可以見於美國申請案序號TBA(代理檔號44790.11.2022;廣泛參考BI-2013/004A);藉由引用結合在此。
在一些實施方式中,還提供了重組模板。重組模板可以是如在此所述的另一種載體的組分,它包含在單獨的載體中或者作為單獨的多核苷酸提供。在一些實施方式中,重組模板被設計為充當同源重組中的模板,諸如在由作為核酸靶向複合物的一部分的核酸靶向效應蛋白切割或分解的靶序列內或附近。模板多核苷酸可以具有任何適合的長度,諸如長度係約或超過約10、15、20、25、50、75、100、150、200、500、1000或更多個核苷酸。在一些實施方式中,模板多核苷酸係與包含該靶序列的多核苷酸部
分互補的。當最佳比對時,模板多核苷酸可以與靶序列的一個或多個核苷酸重疊(例如約或超過約1、5、10、15、20、25、30、35、40、45、50、60、70、80、90、100或更多個核苷酸)。在一些實施方式中,當模板序列和包含靶序列的多核苷酸最佳比對時,模板多核苷酸最近的核苷酸係在來自靶序列的約1、5、10、15、20、25、50、75、100、200、300、400、500、1000、5000、10000或更多個核苷酸中。
在一些實施方式中,核酸靶向效應蛋白係包含一個或多個異源蛋白結構域(例如,約或超過約1、2、3、4、5、6、7、8、9、10或更多個結構域,還有核酸靶向效應蛋白)的融合蛋白的一部分。在一些實施方式中,CRISPR效應蛋白係包含一個或多個異源蛋白結構域(例如,約或超過約1、2、3、4、5、6、7、8、9、10或更多個結構域,還有CRISPR酶)的融合蛋白的一部分。CRISPR酶融合蛋白可以包含任何另外的蛋白序列和視情況在任何兩個結構域之間的接頭序列。可以融合至CRISPR酶的蛋白結構域的實例包括但不限於,表位標籤、報導基因序列、以及具有以下活性中的一種或多種活性的蛋白結構域:修飾烷酶活性、去甲酶活性、轉錄啟動活性、轉錄阻遏活性、轉錄釋放因子活性、組蛋白修飾活性、RNA切割活性以及核酸結合活性。表位標籤的非限制性實例包括組胺酸(His)標籤、V5標籤、FLAG標籤、流感血球凝集素(HA)標籤、Myc標籤、VSV-G標籤、以及硫氧還蛋白(Trx)標籤。報導基因的實例包括但不限於,麩胱甘肽-S-轉移酶(GST)、辣根過氧化物酶(HRP)、氯黴素乙醯轉移酶(CAT)、β-半乳糖苷酶、β-葡萄糖醛酸酶、螢光素酶、綠色螢光蛋白(GFP)、
HcRed、DsRed、青色螢光蛋白(CFP)、黃色螢光蛋白(YFP)、以及自身螢光蛋白(包括藍色螢光蛋白(BFP))。CRISPR酶可以融合至編碼結合DNA分子或結合其他細胞分子的蛋白質或蛋白質片段的基因序列,該蛋白質包括但不限於,麥芽糖結合蛋白(MBP)、S-標籤、Lex A DNA結合結構域(DBD)融合物、GAL4 DNA結合結構域融合物、以及單純皰疹病毒(HSV)BP16蛋白融合物。可以形成包含CRISPR酶的融合蛋白的一部分的附加結構域描述於US20110059502,該專利藉由引用結合在此。在一些實施方式中,標記的CRISPR酶用於識別靶序列的位置。
在一些實施方式中,CRISPR酶可以形成誘導型系統的一種組分。該系統的誘導性質允許使用能量形式時間空間控制基因編輯或基因表現。能量形式可以包括但不限於,電磁輻射、聲能、化學能以及熱能。誘導型系統的實例包括四環素誘導型啟動子(Tet-開或Tet-關)、小分子雙雜交轉錄啟動系統(FKBP、ABA等)、或光誘導型系統(光敏色素、LOV結構域或隱花色素)。在一個實施方式中,CRISPR酶可以是以序列特異性方式引導轉錄活性改變的光誘導型轉錄效應物(LITE)的一部分。光誘導型系統的組分可以包括CRISPR酶、光反應性細胞色素異源二聚體(例如,來自阿拉伯芥)、以及轉錄啟動/阻遏結構域。誘導型DNA結合蛋白及其使用方法的其他實例提供於US 61/736465和US 61/721,283以及WO 2014/018423以及US8889418、US8895308、US20140186919、US20140242700、US20140273234、US20140335620、WO2014093635中,該等專利藉由引用以其整體結合在此。
遞送
在一些方面中,本發明提供了包括以下各項的方法:向宿主細胞遞送一種或多種多核苷酸,諸如在此所述的一種或多種載體、其一種或多種轉錄物和/或由其轉錄的一種或多種蛋白質。在一些方面中,本發明進一步提供了藉由此類方法產生的細胞以及包含此類細胞或由此類細胞產生的生物體(諸如動物、植物或真菌)。在一些實施方式中,將核酸靶向效應蛋白與指導RNA組合(以及視情況與其複合)遞送到細胞中。常規的基於病毒和非病毒的基因轉移方法可以用於在哺乳動物細胞或靶組織中引入核酸。此類方法可以用於向培養基或宿主生物體中的細胞給予編碼核酸靶向系統的組分的核酸。非病毒載體遞送系統包括DNA質粒、RNA(例如在此所述的載體的轉錄物)、裸核酸、以及與遞送媒介物諸如脂質體複合的核酸。病毒載體遞送系統包括DNA和RNA病毒,該等病毒在遞送至細胞後具有附加型基因組或整合型基因組。對於基因治療程序的綜述,參見安德森(Anderson),科學256:808-813(1992);納貝爾(Nabel)和費爾格納(Felgner),TIBTECH 11:211-217(1993);三穀(Mitani)和卡斯基(Caskey),TIBTECH 11:162-166(1993);狄龍(Dillon),TIBTECH 11:167-175(1993);米勒(Miller),自然357:455-460(1992);範布倫特(Van Brunt),生物技術(Biotechnology)6(10):1149-1154(1988);比涅(Vigne),恢復神經學和神經科學(Restorative Neurology and Neuroscience)8:35-36(1995);克雷默(Kremer)和佩里科代(Perricaudet),英國醫學公報(British Medical Bulletin)51(1):31-44(1995);哈嗒嗒(Haddada)等人,微生物學和免疫學的前沿課題(Current Topics
in Microbiology and Immunology),竇爾弗勒(Doerfler)和博姆(Böhm)(編輯)(1995);以及餘(Yu)等人,基因治療(Gene Therapy)1:13-26(1994)。
非病毒遞送核酸的方法包括包括脂質轉染、核轉染、微注射、基因槍、病毒體、脂質體、免疫脂質體、聚陽離子或脂質:核酸軛合物、裸DNA、人工病毒體遞送、以及藥劑增強DNA攝取。脂質轉染描述於例如美國專利案號5,049,386、4,946,787;以及4,897,355)並且脂質轉染試劑係商業上銷售的(例如,TransfectamTM和LipofectinTM)。適用於多核苷酸的有效受體識別脂質轉染的陽離子脂質和中性脂質包括以下各項中的那些:費爾格納WO 91/17424;WO 91/16024。遞送可以是遞送至細胞(例如,體外或離體給予)或靶組織(例如,體內給予)。
脂質:核酸複合物(包括靶向脂質體,諸如免疫脂質複合物)的製備係熟習該項技術者已熟知的(例如,參見克裡斯特爾(Crystal),科學270:404-410(1995);布萊澤(Blaese)等人,癌症基因治療(Cancer Gene Ther.)2:291-297(1995);貝爾(Behr)等人,生物共軛化學(Bioconjugate Chem.)5:382-389(1994);雷米(Remy)等人,生物共軛化學5:647-654(1994);高(Gao)等人,基因治療2:710-722(1995);艾哈邁德(Ahmad)等人,癌症研究52:4817-4820(1992);美國專利案號4,186,183、4,217,344、4,235,871、4,261,975、4,485,054、4,501,728、4,774,085、4,837,028、以及4,946,787)。
使用用於遞送核酸的基於RNA或DNA病毒的系統利
用了用於將病毒靶向身體內的特定細胞並且將病毒有效負載運輸到核內的高度進化的方法。病毒載體可以直接給予至患者(體內)或者它們可以用於體外處理細胞,並且修飾細胞可以視情況給予至患者(離體)。常規基於病毒的系統可以包括用於基因轉移的逆轉錄病毒、慢病毒、腺病毒、腺相關病毒以及單純皰疹病毒載體。藉由逆轉錄病毒、慢病毒、以及腺相關病毒基因轉移方法整合在宿主基因組中是可能的,這常常導致插入的轉基因長期表現。另外,高轉導效率已在許多不同細胞類型和靶組織中觀察到。
逆轉錄病毒的趨向性可以藉由結合外源包膜蛋白來改變,從而擴增靶細胞的潛在靶群體。慢病毒載體係能夠轉導或感染非分裂細胞並典型地產生高病毒滴度的逆轉錄病毒載體。逆轉錄病毒基因轉移系統的選擇因此將取決於靶組織。逆轉錄病毒載體包含具有多至6-10kb外源序列的包裝容量的順式作用長末端重複序列。最小量順式作用LTR係足以複製並包裝該等載體的,然後使用該等載體將治療基因整合到靶細胞中,以提高永久性轉基因表現。廣泛使用的逆轉錄病毒載體包括基於以下各項的那些:鼠白血病病毒(MuLV)、長臂猿白血病病毒(GaLV)、猴免疫缺陷病毒(SIV)、人免疫缺陷病毒(HIV)、以及其組合(例如,參見,布奇謝爾(Buchscher)等人,病毒學雜誌(J.Virol.)66:2731-2739(1992);約翰(Johann)等人,病毒學雜誌66:1635-1640(1992);紹姆內爾費爾特(Sommnerfelt)等人,病毒學176:58-59(1990);威爾遜(Wilson)等人,病毒學雜誌63:2374-2378(1989);米勒等人,病毒學雜誌65:2220-2224(1991);PCT/US94/05700)。在其中短暫表現係較佳的應用中,可以使用基於腺病毒的系統。基於腺
病毒的載體能夠在許多細胞類型中具有極高轉導效率並且並不要求細胞分裂。使用此類載體,已獲得高滴度和表現水平。此載體可以在相對簡單的系統中大量產生。腺相關病毒(“AAV”)載體也可以用於使用靶核酸轉導細胞,例如用於體外產生核酸和肽並且用於體內和離體基因治療程序(例如,參見,韋斯特(West)等人,病毒學(Virology)160:38-47(1987);美國專利案號4,797,368;WO 93/24641;科廷(Kotin)等人,人類基因治療(Human Gene Therapy)5:793-801(1994);繆斯茲卡(Muzyczka),臨床研究雜誌(J.Clin.Invest.)94:1351(1994)。重組AAV載體的結構描述於許多出版物中,包括美國專利案號5,173,414;特拉辛(Tratschin)等人,分子細胞生物學5:3251-3260(1985);特拉辛等人,分子細胞生物學4:2072-2081(1984);賀莫納特和繆斯茲卡(Hermonat & Muzyczka),美國國家科學院院刊81:6466-6470(1984);以及薩莫爾斯基(Samulski)等人,病毒學雜誌63:03822-3828(1989)。
對於DNA/RNA或DNA/DNA或RNA/RNA或蛋白質/RNA的選項
在一些實施方式中,CRISPR系統的組分可以不同形式遞送,諸如DNA/RNA或RNA/RNA或蛋白質/RNA的組合。例如,Cpf1可以作為DNA編碼多核苷酸或RNA-編碼多核苷酸或作為蛋白質遞送。指導序列可以作為DNA編碼多核苷酸或RNA遞送。預想所有可能的組合,包括混合遞送形式。
在一些實施方式中,所有此類組合(DNA/RNA或DNA/DNA或RNA/RNA或蛋白質/RNA)。
在一些實施方式中,當Cpf1以蛋白質形式遞送時,可以將它與一種或多種指導序列預先組裝。
奈米線團
另外,CRISPR可以使用奈米線團(nanoclew)遞送,例如如孫.W(Sun W)等人,用抗癌藥物遞送的繭樣可自降解DNA線團(Cocoon-like self-degradable DNA nanoclew for anticancer drug delivery),美國化學學會雜誌(J Am Chem Soc.),2014年10月22日;136(42):14722-5.doi:10.1021/ja5088024.電子版2014年10月13日;或者在孫.W等人,用於有效遞送基因組編輯的CRISPR-Cas9的自組裝DNA奈米線團(Self-Assembled DNA Nanoclews for the Efficient Delivery of CRISPR-Cas9 for Genome Editing.),應用化學國際英語版(Angew Chem Int Ed Engl.),2015年10月5日;54(41):12029-33.doi:10.1002/anie.201506030.電子版2015年8月27日。
除非另外指明,本發明的實施採用處於本領域技能範圍內的免疫學、生物化學、化學、分子生物學、微生物學、細胞生物學、基因組學以及重組DNA的常規技術。參見薩姆布魯克、弗裡奇(Fritsch)和馬尼亞蒂斯(Maniatis),分子選殖:實驗室手冊,第2版(1989);分子生物學通用方法(F.M..奧蘇貝爾等人編著(1987));系列叢書 酶學方法(學術出版社公司):PCR 2:實踐方法(M.J..麥克弗森(M.J.MacPherson)、B.D..黑姆斯(B.D.Hames)以及G.R.泰勒編著(1995)),哈洛(Harlow)和拉內(Lane)編著(1988)抗體、實驗室手冊和動物細胞培養(ANTIBODIES,A
LABORATORY MANUAL,and ANIMAL CELL CULTURE)(R.I.費施奈伊(Freshney)編著(1987))。
遺傳和表觀遺傳條件的模型
本發明的一種方法可以用於創建可用於建模和/或研究感興趣的遺傳或表觀遺傳條件的植物、動物或細胞,諸如藉由感興趣的突變模型或疾病模型。如在此所用,“疾病”係指受試者的疾病、病狀或適應症。例如,本發明的一種方法可以用於創建包含與疾病相關聯的一種或多種核酸序列中的修飾的動物或細胞、或者其中與疾病相關聯的一種或多種核酸序列的表現發生改變的植物、動物或細胞。這種核酸序列可以編碼疾病相關蛋白序列或者可以是疾病相關控制序列。因此,應理解在本發明的多個實施方式中,植物、受試者、患者、生物體或細胞可以是非人類受試者、患者、生物體或細胞。因此,本發明提供了藉由本發明產生的植物、動物或細胞、或其子代。該子代可以是產生的植物或動物的選殖,或者可以由藉由與相同種類的其他個體雜交以使另外希望的性狀滲入其後代來進行的有性繁殖產生。在多細胞生物體(具體的是動物或植物)的情況下,該細胞可以是體內或離體的。在其中細胞處於培養中的情況下,如果滿足適當的培養條件並且較佳的是如果細胞適合地適用於此目的(例如幹細胞),則可以建立細胞系。還設想藉由本發明產生的細菌細胞系。因此,還設想細胞系。
在一些方法中,該疾病模型可以用於使用該疾病研究中常用的措施研究突變對動物或細胞和疾病的發展和/或進展的
影響。可替代地,這種疾病模型適用於研究藥物活性化合物對該疾病的影響。
在一些方法中,該疾病模型可以用於評定可能的基因治療策略的效力。即,疾病相關基因或多核苷酸可以被修飾為使得疾病發展和/或進展受到抑制或減少。具體地說,該方法包括修飾疾病相關基因或多核苷酸,以使得能產生改變的蛋白質並因此使得動物或細胞具有改變的應答。因此,在一些方法中,基因修飾動物可以與易於發展疾病的動物比較,以使得可以評定基因治療事件的作用。
在另一個實施方式中,本發明提供了一種開發調控與疾病相關基因相關聯的細胞傳訊事件的生物活性劑之方法。該方法包括使測試化合物與包含驅動一種或多種CRISPR酶表現的一種或多種載體和連接至指導序列的同向重複序列的細胞接觸;並且檢測指示與例如細胞所含有的疾病相關基因中的突變相關聯的細胞傳訊事件的減少或增加的讀出變化。
細胞模型或動物模型可以與本發明用於篩查細胞功能變化的方法組合來構造。這種模型可以用於研究藉由本發明的CRISPR複合物修飾的基因組序列對感興趣的細胞功能的影響。例如,細胞功能模型可以用研究修飾的基因組序列對細胞內傳訊或細胞外傳訊的影響。可替代地,細胞功能模型可以用研究修飾的基因組序列對感官知覺的影響。在一些此類模型中,修飾模型中與傳訊生物化學途徑相關聯的一個或多個基因組序列。
已特別研究了幾種疾病模型。該等包括從新自閉症危
險基因CHD8、KATNAL2和SCN2A;以及綜合症自閉症(安格曼綜合症)基因UBE3A。該等基因和所得自閉症模型當然是較佳的,但足以顯示本發明對基因和相應模型的廣泛適用性。當與傳訊生物化學途徑相關聯的一個或多個基因組序列與候選藥劑接觸時,該等基因組序列的改變的表現可以是藉由評定測試模型細胞與對照細胞之間相應基因的mRNA水平差異來確定。可替代地,與傳訊生物活性途徑相關聯的序列的差異表現係藉由檢測編碼的多肽或基因產物的水平的差異來確定的。
為了評定mRNA轉錄物或相應多核苷酸水平的試劑誘導的改變,樣品中含有的核酸首先根據本領域的標準方法來提取。例如,mRNA可以根據薩姆布魯克等人(1989)所列出的程序使用不同的分解酶或化學品溶液來分離,或者藉由核酸結合樹脂遵循製造商提供的附帶說明來提取。然後藉由擴增程序或常規雜交測定(例如,RNA印跡分析)根據本領域廣泛已知的方法或者基於在此舉例說明的方法來檢測提取的核酸樣品中含有的mRNA。
出於本發明的目的,擴增意指採用能夠以適當保真度複製靶序列的引物和聚合酶的任何方法。擴增可以是藉由天然或重組DNA聚合酶諸如TaqGoldTM、T7 DNA聚合酶、大腸桿菌DNA聚合酶的克列諾片段、以及逆轉錄酶。一種較佳的擴增方法係PCR。具體地說,分離的RNA可以經受逆轉錄測定,該測定與定量聚合酶鏈反應(RT-PCR)結合以便量化與傳訊生物化學途徑相關聯的序列的表現水平。
基因表現水平的檢測可以是在擴增測定中即時進行
的。在一個方面中,擴增的產物可以用螢光DNA結合劑直接視覺化的,該等結合劑包括但不限於DNA嵌入劑和DNA溝結合劑。因為結合到雙股DNA分子中的嵌入劑的量典型地與擴增的DNA產物的量成比例,所以可以藉由使用本領域的常規光學系統量化嵌入染料的螢光來確定擴增產物的量。適用於此應用的DNA結合染料包括SYBR綠、SYBR藍、DAPI、碘化丙啶、Hoeste,SYBR金、溴化乙錠(ethidium bromide)、吖啶、普羅黃素、吖啶橙、吖啶黃、氟香豆素、玫瑰樹鹼(ellipticine)、道諾黴素(daunomycin)、氯喹、遠端黴素(distamycin)D、色黴素(chromomycin)、胡米溴銨(homidium)、光輝黴素(mithramycin)、聚吡啶釕(ruthenium polypyridyl)、安麯黴素(anthramycin)、以及類似物。
在另一個方面中,其他螢光標記諸如序列特異性探針可以用於擴增反應中,以幫助檢測和量化擴增產物。基於探針的定量擴增依賴於希望的擴增產物的序列特異性檢測。它利用螢光的靶特異性探針(例如,TaqMan®探針),從而獲得增加的特異性和靈敏度。本領域中已建立了用於進行基於探針的定量擴增的方法並且在美國專利案號5,210,015中教授了該等方法。
在另一個方面中,進行使用雜交探針的常規雜交測定,該等雜交探針與和傳訊生物化學途徑相關聯的序列享有序列同源性。典型地,在雜交反應中允許探針與和來源於測試受試者的生物樣品內的傳訊生物化學途徑相關聯的序列形成穩定的複合物。熟習該項技術者將瞭解的是,在使用反義股作為探針核酸的情況下,樣品中提供的靶多核苷酸被選擇為與反義核酸的序列互補。
相反地,在核苷酸探針係有義核酸的情況下,靶多核苷酸被選擇為與有義核酸的序列互補。
雜交可以是在不同嚴格性的條件下進行。用於實踐本發明的適合雜交條件係使得探針與和傳訊生物化學途徑相關聯的序列之間的識別相互作用係足夠特異的且足夠穩定的。增加雜交反應嚴格性的條件係本領域廣泛已知和公開的。例如,參見,(薩姆布魯克等人,(1989);非輻射原位雜交應用手冊(Nonradioactive In Situ Hybridization Application Manual),德國寶靈曼公司(Boehringer Mannheim),第二版)雜交測定可以使用任何固相支撐體上固定的探針來形成,該固相支撐體包括但不限於硝化纖維、玻璃、矽、以及各種各樣的基因陣列。較佳的雜交測定市在高密度基因晶片上進行的,如美國專利案號5,445,934所述的。
對於在雜交測定過程中形成的探針靶標複合物的常規檢測,核苷酸探針被軛合至可檢測標記。適用於本發明的可檢測標記包括藉由光化學手段、生物化學手段、光譜手段、免疫化學手段、電學手段、光學手段或化學手段可檢測的任何組成物。多種多樣的適當可檢測標記係本領域已知的,它們包括螢光標記或化學發光標記、放射性同位素標記、酶標記或其他配位基。在較佳的實施方式中,將可能希望採用螢光標記或酶標記,諸如地地麩新配質、β半乳糖苷酶、脲酶、鹼性磷酸酶或過氧化物酶、抗生物素蛋白/生物素複合物。
用於檢測或量化雜交強度的檢測方法將典型地取決於以上選擇的標記。例如,放射性標記可以是使用攝影膠片或感
光成像儀檢測的。螢光標記物可以是使用檢測發射光的光探測器檢測和量化的。酶標記典型地是藉由提供具有底物的酶並測量由酶對該底物的作用產生的反應產物來檢測的;並且最後比色標記係藉由簡單視覺化染色標記來檢測的。
與傳訊生物化學途徑相關聯的序列表現的藥劑誘導的變化也可以藉由檢查相應基因產物來確定。測定蛋白質水平典型地涉及a)將生物樣品中含有的蛋白質與特異性結合和信號生傳導生物化學途徑相關聯的蛋白質的藥劑接觸;並且(b)鑒定所形成的任何藥劑:蛋白質複合物。在此實施方式的一個方面中,特異性結合與傳訊生物化學途徑相關聯的蛋白質的藥劑係抗體,較佳的是單株抗體。
該反應係藉由以下各項來進行的:在將允許藥劑與和傳訊生物化學途徑相關聯的蛋白質之間形成複合物的條件下,將該藥劑與和來源於測試樣品的傳訊生物化學途徑相關的蛋白質樣品接觸。複合物的形成可以是根據本領域的程序直接或間接檢測的。在直接檢測方法中,該等藥劑供應有可檢測標記並且未反應的藥劑可以從該複合物中去除;剩餘標記的量因此指示所形成的複合物的量。對於這種方法,較佳的是選擇甚至在嚴格洗滌條件過程中仍然附接至該等藥劑的標記。較佳的是,該標記並不干擾結合反應。在替代方案中,間接檢測程序可以使用含有以化學方式或酶方式引入的標記的藥劑。希望的標記通常並不干擾所得藥劑:多肽複合物的結合或穩定性。然而,該標記典型地被設計為易於接近抗體,以有效結合並因此生成可檢測信號。
適用於檢測蛋白質水平的多種多樣的標記係本領域已知的。非限制性實例包括放射性同位素、酶類、膠態金屬、螢光化合物、生物發光化合物、以及化學發光化合物。
在結合反應過程中形成的藥劑:多肽複合物的量可以是藉由標準定量測定來量化的。如上所述,藥劑:多肽複合物的形成可以是藉由保留在結合位點處的標記的量來直接測量的。在一個替代方案中,測試與傳訊生物化學途徑相關聯的蛋白質與標記的類似物競爭特異性藥劑上的結合位點的能力。在此競爭性測定中,捕獲的標記的量與和存在於測試樣品中的傳訊生物化學途徑相關聯的蛋白質序列的量成反比。
用於基於以上列出的一般原則進行蛋白質分析的多種技術係本領域可用的。該等技術包括但不限於,放射免疫測定、ELISA(酶聯免疫放射測定法)、“夾層”免疫測定、免疫放射測定法、原位免疫測定(例如使用膠態金、酶或放射性同位素標記)、蛋白印跡分析、免疫沈澱測定、免疫螢光測定、以及SDS-PAGE。
特異性識別或結合與傳訊生物化學途徑相關聯的蛋白質的抗體係較佳的是用於進行上述蛋白質分析。當希望時,可以使用識別特定類型的翻譯後修飾(例如傳訊生物化學途徑誘導的修飾)的抗體。翻譯後修飾包括但不限於,糖基化、脂化、乙醯化、以及磷酸化。該等抗體可以從商業供應商購買。例如,特異性識別酪胺酸磷酸化蛋白質的抗磷酸酪胺酸抗體可從許多供應商購買,該等供應商包括英傑公司(Invitrogen)和珀金埃爾默公司(Perkin Elmer)。抗磷酸酪胺酸抗體特別適用於檢測響應於ER脅
迫而在其酪胺酸殘基上有差異地磷醯化的蛋白質。此類蛋白質包括但不限於,真核生物翻譯起始因子2α(eIF-2α)。可替代地,該等抗體可以是使用多株抗體或單株抗體技術藉由用展示希望的翻譯後修飾的靶蛋白免疫宿主動物或抗體產物細胞來生成。
在實踐主題方法中,可能希望的是辨別與傳訊生物化學途徑相關聯的蛋白質在不同身體組織、不同細胞類型和/或不同亞細胞結構中的表現模式。該等研究可以藉由使用能夠結合蛋白質標記物的組織特異性、細胞特異性或亞細胞結構特異性抗體來進行,該等蛋白質標記物優先在某些組織、細胞類型或亞細胞結構中表現。
與傳訊生物化學途徑相關聯的基因的改變的表現也可以是藉由檢查基因產物活性相對於對照細胞的變化來確定。用於與傳訊生物化學途徑相關聯的蛋白質的藥劑誘導性活性變化的測定將依賴於研究中的生物活性和/或信號轉導途徑。例如,在該蛋白質係激酶的情況下,該蛋白質使一種或多種下游底物磷酸化的能力的變化可以是藉由本領域已知的多種測定來確定的。代表性測定包括但不限於,使用識別磷酸化蛋白的抗體諸如抗磷酸酪胺酸抗體的免疫印跡和免疫沈澱反應。此外,激酶活性可以是藉由高流通量化學發光測定諸如AlphaScreenTM(可商購自珀金埃爾默公司)和eTagTM測定(錢-慧(Chan-Hui)等人,(2003)臨床免疫學(Clinical Immunology)111:162-174)來檢測的。
在與傳訊生物化學途徑相關聯的蛋白質係導致細胞內pH條件波動的信號級聯放大的一部分的情況下,pH敏感分子諸
如螢光pH染料可以用作報導分子。在另一個實例中,在與傳訊生物化學途徑相關聯的蛋白質係離子通道的情況下,可以監測膜電位和/或細胞內離子濃度的波動。許多商用套組和高流通量裝置係特別適用於快速且強勁地篩選離子通道的調節劑。代表性儀器包括FLIPRTM(分子機器公司(Molecular Devices,Inc.))和VIPR(極光生物科學公司(Aurora Biosciences))。該等儀器能夠同時檢測微板的1000個樣品孔中的反應並且在一秒或甚至一微秒內提供即時測量值和功能資料。
在實踐在此揭露的任何方法時,可以經由本領域已知的一種或多種方法來將適合的載體引入到細胞或胚胎中,該等方法包括但不限於,微注射、電穿孔、聲孔效應、基因槍、磷酸鈣介導的轉染、陽離子轉染、脂質體轉染、樹枝狀轉染、熱激轉染、核轉染、磁轉染、脂轉染、刺穿轉染、光學轉染、專有劑增強的核酸攝取、以及經由脂質體、免疫脂質體、病毒體或人工病毒體遞送。在一些方法中,載體藉由微注射引入到胚胎中。這種或該等載體可以微注射到胚胎的核或胞質中。在一些方法中,這種或該等載體可以藉由核轉染引入到細胞中。
CRISPR複合物的靶多核苷酸可以是對於真核細胞而言內源或外源的任何多核苷酸。例如,靶多核苷酸可以是駐留在真核細胞核內的多核苷酸。靶多核苷酸可以是編碼基因產物(例如,蛋白質)的序列或非編碼序列(例如,調節多核苷酸或無用DNA)。
靶多核苷酸的實例包括與傳訊生物化學途徑相關聯
的序列,例如傳訊生物化學途徑相關基因或多核苷酸。靶多核苷酸的實例包括疾病相關基因或多核苷酸。“疾病相關”基因或多核苷酸係指與非疾病對照的組織或細胞相比,在來源於疾病影響的組織的細胞中產生異常水平或異常形式的轉錄產物或翻譯產物的任何基因或多核苷酸。它可以是以異常高的水平表現的基因;它可以是以異常低的水平表現的基因,其中改變的表現與疾病的發生和/或進展相關。疾病相關基因還是指具有一個或多個突變或直接負責或與一個或多個負責疾病的病因學的基因連鎖不平衡的遺傳變異的基因。轉錄或翻譯的產物可以是已知或未知的,並且可以是處於正常或異常水平。
CRISPR複合物的靶多核苷酸可以是對於真核細胞而言內源或外源的任何多核苷酸。例如,靶多核苷酸可以是駐留在真核細胞核內的多核苷酸。靶多核苷酸可以是編碼基因產物(例如,蛋白質)的序列或非編碼序列(例如,調節多核苷酸或無用DNA)。在不希望受到理論約束的情況下,認為靶序列應該與PAM(原型間隔區相鄰模體)相關聯;即,由CRISPR複合物識別的短序列。對於PAM的精確序列和長度要求根據所使用的CRISPR酶而不同,但PAM典型地是與原型間隔區(即,靶序列)相鄰的2-5個鹼基對序列。PAM序列的實例給出在以下實例部分中,並且技術人員將能夠鑒定與給定的CRISPR酶一起使用的其他PAM序列。此外,PAM相互作用(PI)結構域的工程化可以允許程式設計PAM特異性,提高靶位點識別保真度,並且增加Cas(例如Cas9)基因組工程化平臺的多功能性。Cas蛋白諸如Cas9蛋白可以被工程化以改變其PAM特異性,例如如克萊因史迪華BP(Kleinstiver BP)等人,
具有改變的PAM特異性的工程化CRISPR-Cas9(Engineered CRISPR-Cas9 nucleases with altered PAM specificities),自然,2015年7月23日;523(7561):481-5.doi:10.1038/nature14592。
CRISPR複合物的靶多核苷酸可以包括多個疾病相關基因和多核苷酸以及傳訊生物化學途徑相關基因和多核苷酸,如以下各項中列出的:美國臨時專利申請61/736,527和61/748,427,這兩份專利申請分別具有廣泛的參考文獻BI-2011/008/WSGR檔號44063-701.101和BI-2011/008/WSGR文件號44063-701.102,這兩份專利申請均題為用於序列操縱的系統方法和組成物(SYSTEMS METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION),它們分別在2012年12月12日和2013年1月2日提交,以及PCT申請PCT/US2013/074667,該申請題為用於序列操縱和治療應用的系統、方法和組成物的遞送、工程化和優化(DELIVERY,ENGINEERING AND OPTIMIZATION OF SYSTEMS,METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION AND THERAPEUTIC APPLICATIONS)且在2013年12月12日提交,所有該等專利申請的內容均藉由引用以其整體結合在此。
靶多核苷酸的實例包括與傳訊生物化學途徑相關聯的序列,例如傳訊生物化學途徑相關基因或多核苷酸。靶多核苷酸的實例包括疾病相關基因或多核苷酸。“疾病相關”基因或多核苷酸係指與非疾病對照的組織或細胞相比,在來源於疾病影響的組織的細胞中產生異常水平或異常形式的轉錄產物或翻譯產物的
任何基因或多核苷酸。它可以是以異常高的水平表現的基因;它可以是以異常低的水平表現的基因,其中改變的表現與疾病的發生和/或進展相關。疾病相關基因還是指具有一個或多個突變或直接負責或與一個或多個負責疾病的病因學的基因連鎖不平衡的遺傳變異的基因。轉錄或翻譯的產物可以是已知或未知的,並且可以是處於正常或異常水平。
全基因組敲除篩選
在此所述的CRISPR蛋白質和系統可以用於進行有效且性價比高的功能基因組篩選。此類篩選可以利用基於CRISPR效應蛋白的全基因組文庫。此類篩選和文庫可以提供對基因功能的確定,涉及細胞途徑基因,並且基因表現中的任何改變可以如何形成特定生物過程。本發明的優點係CRISPR系統避免了脫靶結合及其產生的副作用。這係使用安排為對靶DNA具有高度序列特異性的系統來實現的。在本發明的較佳的實施方式中,CRISPR效應蛋白複合物係Cpf1效應蛋白複合物。
在本發明的實施方式中,全基因組文庫可以包含多個在此所述的Cpf1指導RNA,該等RNA包含能夠靶向真核細胞群體中的多個基因組座位中的多個靶序列的指導序列。細胞群體可以是胚胎幹細胞(ES)群體。基因組座位中的靶序列可以是非編碼序列。非編碼序列可以是內含子、調節序列、剪接位點、3’UTR、5’UTR、或多聚腺苷酸化信號。一種或多種基因產物的基因功能可以是藉由所述靶向來改變。該靶向可以導致基因功能敲除。基因產物的靶向可以包含超過一個的指導RNA。基因產物可以被每
個基因2、3、4、5、6、7、8、9或10個指導RNA,較佳的是3至4個指導RNA靶向。脫靶修飾可以是藉由採用由Cpf1效應蛋白複合物生成的交錯雙股斷裂或者藉由利用類似於CRISPR-Cas9系統中使用的方法來最小化(例如,參見,RNA-指導Cas9核酸酶的DNA靶向特異性(DNA targeting specificity of RNA-guided Cas9 nucleases)徐,P.(Hsu,P.,)、斯科特,D.(Scott,D.)、溫斯坦,J.(Weinstein,J.)、拉恩,FA.(Ran,FA.)、康爾曼,S.(Konermann,S.)、瓦拉,V.(Agarwala,V.)、李,Y.(Li,Y.)、法恩,E.(Fine,E.)、吳,X.(Wu,X.)、謝萊姆,O.(Shalem,O.)、科瑞迪克,TJ.(Cradick,TJ.)、瑪律拉菲尼,LA.(Marraffini,LA.)、包,G.(Bao,G.)、以及張,F.(Zhang,F.),自然生物技術(Nat Biotechnol)doi:10.1038/nbt.2647(2013)),文獻藉由引用結合在此。該靶向可以是針對約100個或更多個序列。該靶向可以是針對約1000個或更多個序列。該靶向可以是針對約20,000個或更多個序列。該靶向可以是針對整個基因組。該靶向可以是針對集中於相關或希望的途徑中的一組靶序列。該途徑可以是免疫途徑。該途徑可以是細胞分裂途徑。
本發明的一個方面包括全基因組文庫,該全基因組文庫可以包含多個Cpf1指導RNA,該等指導RNA可以包含能夠靶向多個基因組座位中的多個靶序列的指導序列,其中所述靶向導致基因功能敲除/敲低。此文庫可以潛在地包含靶向生物體基因組中的各個和每個基因的指導RNA。
在本發明的一些實施方式中,生物體或受試者係真核
生物(包括哺乳動物,包括人類)或非人類真核生物或非人類動物或非人類哺乳動物。在一些實施方式中,生物體或受試者係非人類動物,並且可以是節肢動物,例如昆蟲,或者可以是線蟲。在本發明的一些方法中,生物體或受試者係植物。在本發明的一些方法中,生物體或受試者係哺乳動物或非人類哺乳動物。非人類哺乳動物可以是例如齧齒動物(較佳的是小鼠或大鼠)、有蹄動物或靈長類動物。在本發明的一些方法中,生物體或受試者係藻類,包括微藻類,或者是真菌類。
基因功能的敲除/敲低可以包括:在細胞群體的每個細胞中引入包含工程化非天然存在的Cpf1效應蛋白系統的一種或多種載體的一個載體系統,該效應蛋白系統包含I.Cpf1效應蛋白和II.一個或多個指導RNA,其中組分I和組分II可以是處於該系統的相同或不同載體上;將組分I和II整合到每個細胞中,其中該指導序列靶向每個細胞中的獨特基因,其中該Cpf1效應蛋白可操作地連接至調節元件,其中在轉錄時,包含指導序列的該指導RNA引導Cpf1效應蛋白系統與對應於該獨特基因的基因組座位的靶序列的序列特異性結合;藉由Cpf1效應蛋白誘導基因組座位切割;並且確認細胞群體的每個細胞中的多個獨特基因中的不同敲除/敲低突變,從而生成基因敲除/敲低細胞文庫。本發明包括細胞群體係真核細胞群體,並且在較佳的實施方式中,細胞群體係胚胎幹(ES)細胞群體。
該一種或多種載體可以是質粒載體。該載體可以是包含Cpf1效應蛋白、gRNA和視情況進入靶細胞中的選擇標記物的單
一載體。在不受理論約束的情況下,藉由單一載體同時遞送Cpf1效應蛋白和gRNA的能力使得能夠應用於任何感興趣的細胞類型,而不需要首先生成表現Cpf1效應蛋白的細胞系。調節元件可以是誘導型啟動子。誘導型啟動子可以是多西環素誘導型啟動子。在本發明的一些方法中,指導序列的表現係處於T7啟動子的控制下並且係由T7聚合酶的表現來驅動。不同敲除/敲低突變的確認可以是藉由全外顯子組定序進行的。敲除/敲低突變可以在100個或更多個獨特基因中實現。敲除/敲低突變可以在1000個或更多個獨特基因中實現。敲除/敲低突變可以在20,000個或更多個獨特基因中實現。敲除/敲低突變可以在整個基因組中實現。基因功能的敲除/敲低可以在多個獨特基因中實現,該等獨特基因在特定生理途徑或條件下起作用。該途徑或條件可以是免疫途徑或條件。該途徑或條件可以是細胞分裂途徑或條件。
本發明還提供了包含在此提及的全基因組文庫的套組。該套組可以包含單個容器,該容器包含含有本發明的文庫的載體或質粒。該套組還可以包含含有獨特Cpf1效應蛋白系統指導RNA的選擇的面板,該指導RNA包含來自本發明的文庫的指導序列,其中該選擇指示特定生理條件。本發明包括的是,靶向係針對約100個或更多個序列、約1000或更多個序列或者約20,000個或更多個序列或整個基因組。另外,一組靶序列可以集中於相關或希望的途徑中,諸如免疫途徑或細胞分裂。
在本發明的另一個方面中,Cpf1效應蛋白可以包含一個或多個突變並且可以在融合或未融合至功能結構域的情況下用
作通用DNA結合蛋白。該等突變可以是人工引入的突變或者增功能突變或失功能突變。該等突變已如在此所述地進行表徵。在本發明的一個方面中,功能結構域可以是轉錄啟動結構域,該結構域可以是VP64。在本發明的其他方面中,功能結構域可以是轉錄阻遏蛋白結構域,該結構域可以是KRAB或SID4X。本發明的其他方面涉及融合至結構域的突變的Cpf1效應蛋白,該等結構域包括但不限於,轉錄活化物、阻遏物、重組酶、易位酶、組蛋白改型物、去甲酶、DNA甲基轉移酶、隱花色素、光誘導型/控制型結構域或者化學誘導型/控制型結構域。本發明的一些方法可以包括誘導靶基因的表現。在一個實施方式中,藉由靶向真核細胞群體中的多個基因組座位中的多個靶序列誘導表現係藉由使用功能結構域進行的。
用於CRISPR-Cas9系統中的方法適用於利用Cpf1效應蛋白複合物實踐本發明並且參考以下各項:
人類細胞中的基因組規模的CRISPR-Cas9敲除篩選(Genome-Scale CRISPR-Cas9 Knockout Screening in Human Cells)。沙萊姆,O.(Shalem,O.)、珊亞納,NE.(Sanjana,NE.)、哈特諾斯,E.(Hartenian,E.)、石,X.(Shi,X.)、斯科特,DA.(Scott,DA.)、邁克爾森,T.(Mikkelson,T.)、赫克爾,D.(Heckl,D.)、埃伯特,BL.(Ebert,BL.)、羅特,DE.(Root,DE.)、多恩奇,JG.(Doench,JG.)、張,F.(Zhang,F.),科學,12月12日(2013)。[電子版先於印刷版];以最終編輯形式出版為:科學,2014年1月3日;343(6166):84-87。
沙萊姆等人涉及一種探察全基因組規模的基因功能的新方式。他們的研究顯示具有64,751個獨特指導序列的基因組規模的CRISPR-Cas9敲除(GeCKO)文庫靶向的18,080個基因的遞送能夠在人類細胞中進行陰性和陽性選擇篩選。首先,作者們證實使用GeCKO文庫鑒定了癌症和多能幹細胞中的細胞活力所必須的基因。接著,在黑色素瘤模型中,作者們篩選其喪失涉及對維羅非尼(抑制蛋白激酶BRAF的治療劑)的抗性的基因。他們的研究顯示最高評級的候選物包括先前驗證的基因NF1和MED12以及新型命中基因NF2、CUL3、TADA2B、以及TADA1。作者們在靶向相同基因的獨立的指導RNA與高命中確認率之間觀察到高水平的一致性,並且因此證實允許用Cas9進行基因組規模篩選。
還參考美國專利公開案號US20140357530;以及PCT專利公開WO2014093701,該等專利藉由引用結合在此。還參考2015年10月22日題為“研究者鑒定了CRISPR-Cas基因組編輯工具的可潛在替代方案:新Cas酶闡明CRISPR-Cas系統的進化(Researchers identify potential alternative to CRISPR-Cas genome editing tools:New Cas enzymes shed light on evolution of CRISPR-Cas systems)”的NIH通訊稿,該通訊稿藉由引用結合在此。
功能變化和篩選
在另一個方面中,本發明提供了一種功能性評定和篩選基因的方法。使用本發明的CRISPR系統精確遞送功能結構域以藉由精確改變特定感興趣的座位上的甲基化位點來啟動或阻遏基因或者改變外遺傳狀態,這可以與一個或多個指導RNA一起應用
於單個細胞或細胞群體或者與文庫一起應用於離體或體內細胞庫中的基因組,包括給予或表現包含多個指導RNA(gRNA)的文庫並且其中該篩選進一步包括使用Cpf1效應蛋白,其中包含該Cpf1效應蛋白的CRISPR複合物被修飾為包含異源功能結構域。在一個方面中,本發明提供了一種用於篩選基因組之方法,該方法包括向宿主給予文庫或者在宿主體內表現文庫。在一方面中,本發明提供了如在此討論之方法,該方法進一步包括向宿主給予活化物或在宿主中表現活化物。在一方面中,本發明提供了如在此所討論之方法,其中該活化物附接至Cpf1效應蛋白。在一方面中,本發明提供了如在此所討論之方法,其中該活化物附接至Cpf1效應蛋白的N末端或C末端。在一方面中,本發明提供了如在此所討論之方法,其中該活化物附接至gRNA環。在一個方面中,本發明提供了如在此討論之方法,該方法進一步包括向宿主給予阻遏劑或在宿主中表現阻遏劑。在一方面中,本發明提供了如在此所討論之方法,其中該篩選包括影響並檢測基因啟動、基因抑制或座位中的切割。
在一方面中,本發明提供了有效中靶活性並且最小化脫靶活性。在一方面中,本發明提供了由Cpf1效應蛋白進行的有效中靶切割並且最小化由Cpf1效應蛋白進行的脫靶切割。在一方面中,本發明提供了在無DNA切割情況下Cpf1效應蛋白在基因座位處的特異性結合。因此,在一方面中,本發明提供了靶特異性基因調節。在一方面中,本發明提供了在無DNA切割情況下Cpf1效應蛋白在基因座位處的特異性結合。因此,在一方面中,本發明使用單一Cpf1效應蛋白提供在一個基因座位處的切割和在一個
不同的基因座位處的基因調節。在一方面中,本發明使用一種或多種Cpf1效應蛋白和/或酶提供多個靶標的正交啟動和/或抑制和/或切割。
在一方面中,本發明提供了如在此所討論之方法,其中該宿主係真核細胞。在一個方面中,本發明提供了如在此所討論之方法,其中該宿主係哺乳動物細胞。在一個方面中,本發明提供了如在此所討論之方法,其中該宿主係非人類真核生物。在一個方面中,本發明提供了如在此所討論之方法,其中該非人類真核生物係非人類哺乳動物。在一方面中,本發明提供了如在此所討論之方法,其中該非人類哺乳動物係小鼠。在一方面中,本發明提供了如在此所討論之方法,該方法包括遞送Cpf1效應蛋白複合物或其一種或多種組分或對其編碼的一個或多個核酸分子,其中所述一個或多個核酸分子可操作地連接至一個或多個調節序列並且在體內表現。在一方面中,本發明提供了如在此所討論之方法,其中該體內表現係經由慢病毒、腺病毒或AAV。在一方面中,本發明提供了如在此所討論之方法,其中該遞送係經由粒子、奈米粒子、脂質或細胞穿透肽(CPP)。
在一方面中,本發明提供了一對包含Cpf1效應蛋白的CRISPR複合物,每個複合物包含含有能夠與細胞中感興趣的基因組座位中的靶序列雜交的指導序列的指導RNA(gRNA),其中每個gRNA的至少一個環係藉由插入結合一種或多種轉接蛋白的一種或多種不同RNA序列來修飾的,並且其中該轉接蛋白與一個或多個功能結構域締合,其中每個Cpf1效應蛋白複合物的每個gRNA
包含具有DNA切割活性的功能結構域。在一方面中,本發明提供了如在此所討論的成對的Cpf1效應蛋白複合物,其中DNA切割活性係歸因於Fok1核酸酶。
在一方面中,本發明提供了一種用於切割感興趣的基因組座位中的靶序列之方法,該方法包括向細胞遞送Cpf1效應蛋白複合物或其一種或多種組分或對其編碼的一個或多個核酸分子,其中所述一個或多個核酸分子可操作地連接至一個或多個調節序列並且在體內表現。在一方面中,本發明提供了如在此所討論之方法,其中該遞送係經由慢病毒、腺病毒或AAV。在一方面中,本發明提供了如在此所討論之方法或如在此所討論的成對的Cpf1效應蛋白複合物,其中該對中的第一複合物的靶序列係處於雙股DNA的第一條股上並且該對中的第二複合物的靶序列係處於雙股DNA的第二條股上。在一方面中,本發明提供了如在此所討論之方法或如在此所討論的成對的Cpf1效應蛋白複合物,其中該第一複合物和該第二複合物的靶序列彼此接近,使得DNA以促進同源定向修復的方式切割。在一方面中,在此的方法可以進一步包括將模板DNA引入到細胞中。在一個方面中,一種在此的方法或者在此的成對的Cpf1效應蛋白複合物可以涉及其中每個Cpf1效應蛋白複合物具有Cpf1效應酶,該Cpf1效應酶被突變為使得它具有不超過未突變Cpf1效應酶的核酸酶活性的約5%的核酸酶活性。
在一方面中,本發明提供了如在此所討論的文庫、方法或複合物,其中gRNA被修飾為具有至少一個非編碼功能環,例如其中該至少一個非編碼功能環係有阻遏作用的;例如,其中該
至少一個非編碼功能環包含Alu。
在一個方面中,本發明提供了用於改變或修飾基因產物的表現之方法。所述方法可以包括將工程化的非天然存在的CRISPR系統引入到含有並表現編碼基因產物的DNA分子的細胞中,該CRISPR系統包含Cpf1效應蛋白和靶向DNA分子的指導RNA,由此該指導RNA靶向編碼基因產物的DNA分子並且該Cpf1效應蛋白切割編碼該基因產物的DNA分子,由此改變該基因產物的表現;並且其中Cpf1效應蛋白和指導RNA並不一起天然存在。本發明包括含有連接至同向重複序列的指導序列的指導RNA。本發明進一步包括密碼子優化為在真核細胞中表現的Cpf1效應蛋白。在一較佳的實施方式中,真核細胞係哺乳動物細胞,並且在一更較佳的實施方式中,哺乳動物細胞係人類細胞。在本發明的另一個實施方式中,基因產物的表現減少。
在一些實施方式中,一個或多個功能結構域與Cpf1效應蛋白締合。在一些實施方式中,一個或多個功能結構域與轉接蛋白,例如如與康爾曼等人(自然517,583-588,2015年1月29日)的修飾指導序列一起使用。在一些實施方式中,一個或多個功能結構域與無效gRNA(dRNA)締合。在一些實施方式中,與活性Cpf1效應蛋白的dRNA複合物藉由基因座位上的功能結構域來引導基因調節,而gRNA藉由另一個座位處的活性Cpf1效應蛋白來引導DNA切割,例如由達爾曼(Dahlman)等人“使用催化活性的Cas9核酸酶的正交基因控制(Orthogonal gene control with a catalytically active Cas9 nuclease)”(出版中)在CRISPR-Cas9系
統中類似描述的。在一些實施方式中,dRNA被選擇為與脫靶調節相比使對感興趣的基因座位的調節選擇性最大化。在一些實施方式中,dRNA被選擇為最大化靶基因調節並且最小化靶標切割。
出於以下討論的目的,提及功能結構域可以是與Cpf1效應蛋白締合的功能結構域或者與轉接蛋白締合的功能結構域。
在本發明的實踐中,可以在不與Cpf1蛋白碰撞的情況下藉由插入可以募集轉接蛋白的一個或多個不同RNA環或一個或多個不同序列擴展gRNA的環,該等轉接蛋白可以結合一個或多個不同RNA環或者一個或多個不同序列。該等轉接蛋白可以包括但不限於,存在於各種噬菌體外殼蛋白內的正交RNA結合蛋白/適配體組合。此類外殼蛋白列表包括但不限於:Qβ、F2、GA、fr、JP501、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、ΦCb5、ΦCb8r、ΦCb12r、ΦCb23r、7s以及PRR1。該等轉接蛋白或正交RNA結合蛋白可以進一步募集包含一個或多個功能結構域的效應蛋白或融合物。在一些實施方式中,功能結構域可以是選自下組,該組由以下各項組成:易位酶結構域、整合酶結構域、重組酶結構域、解離酶結構域、轉化酶結構域、蛋白酶結構域、DNA甲基轉移酶結構域、DNA羥甲基酶結構域、DNA脫甲基酶結構域、組蛋白乙醯化酶結構域、組蛋白脫乙醯化酶結構域、核酸酶域、阻遏物結構域、活化物結構域、核定位信號結構域、轉錄調節蛋白質(或轉錄複合物募集)結構域、細胞攝取活動相關結構域、核酸結合結構域、抗體呈遞結構域、組蛋白修飾酶、組蛋白修飾酶的募集物;組蛋白修飾酶、組
蛋白甲基轉移酶、組蛋白去甲酶、組蛋白激酶、組蛋白磷酸酶、組蛋白核糖基酶、組蛋白脫核糖基酶、組蛋白泛素酶、組蛋白脫泛素酶、組蛋白生物素酶以及組蛋白尾蛋白酶的抑制劑。在一些較佳的實施方式中,功能結構域係轉錄啟動結構域,諸如但不限於,VP64、p65、MyoD1、HSF1、RTA、SET7/9或組蛋白乙醯轉移酶。在一些實施方式中,功能結構域係轉錄阻遏結構域,較佳的是KRAB。在一些實施方式中,轉錄阻遏結構域係SID或SID的串聯體(例如SID4X)。在一些實施方式中,功能結構域係表觀遺傳修飾結構域,以便提供表觀遺傳修飾酶。在一些實施方式中,功能結構域係啟動結構域,它可以是P65啟動結構域。
在一些實施方式中,一個或多個功能結構域係NLS(核定位序列)或NES(核輸出信號)。在一些實施方式中,一個或多個功能結構域係轉錄啟動結構域,包括VP64、p65、MyoD1、HSF1、RTA、SET7/9以及組蛋白乙醯轉移酶。在此提及的其他啟動(或活化物)結構域(關於與CRISPR酶締合的那些結構域)包括任何已知的轉錄啟動結構域並且確切的是VP64、p65、MyoD1、HSF1、RTA、SET7/9或組蛋白乙醯轉移酶。
在一些實施方式中,一個或多個功能結構域係轉錄阻遏蛋白結構域。在一些實施方式中,轉錄阻遏蛋白結構域係KRAB結構域。在一些實施方式中,轉錄阻遏蛋白結構域係NuE結構域、NcoR結構域、SID結構域或SID4X結構域。
在一些實施方式中,一個或多個功能結構域具有一種或多種活性,包括修飾烷酶活性、去甲酶活性、轉錄啟動活性、
轉錄阻遏活性、轉錄釋放因子活性、組蛋白修飾活性、RNA切割活性、DNA切割活性、DNA整合活性或核酸結合活性。
在一些實施方式中,組蛋白修飾結構域也是較佳的。以下討論了示例性組蛋白修飾結構域。易位酶結構域、HR(同源重組)機構結構域、重組酶結構域、和/或整合酶結構域作為本發明功能結構域也是較佳的。在一些實施方式中,DNA整合活性包括HR機構結構域、整合酶結構域、重組酶結構域和/或易位酶結構域。在一些實施方式中,組蛋白乙醯轉移酶係較佳的。
在一些實施方式中,DNA切割活性係歸因於核酸酶。在一些實施方式中,核酸酶包括Fok1核酸酶。參見,“用於高特異性基因組編輯的二聚CRISPR RNA指導FokI核酸酶(Dimeric CRISPR RNA-guided FokI nucleases for highly specific genome editing)”,盛達爾.Q..蔡(Shengdar Q.Tsai)、尼古拉斯.維肯恩(Nicolas Wyvekens)、采德.凱特爾(Cyd Khayter)、詹尼弗.A..福登布(Jennifer A.Foden)、維沙爾.撒帕爾(Vishal Thapar)、迪派克.雷恩(Deepak Reyon)、馬修.J..古德溫(Mathew J.Goodwin)、馬丁.J..阿裡耶(Martin J.Aryee)、J..基斯.薑俊(J.Keith Joung),自然生物技術32(6):569-77(2014),它涉及在人類細胞中識別擴展序列並以高效率編輯內源性基因的二聚RNA指導FokI核酸酶。
在一些實施方式中,一個或多個功能結構域附接至Cpf1效應蛋白,以使得在結合sgRNA和靶標時,功能結構域係呈允許功能結構域以其屬性功能起作用的空間取向。
在一些實施方式中,一個或多個功能結構域附接至轉
接蛋白,以使得在Cpf1效應蛋白結合gRNA和靶標時,功能結構域係處於允許功能結構域以其屬性功能起作用的空間定向中。
在一方面中,本發明提供了如在此所討論的組成物,其中一個或多個功能結構域經由如在此所討論的接頭、視情況GlySer接頭附接至Cpf1效應蛋白或轉接蛋白。
內源性轉錄阻遏常常是藉由染色質修飾酶諸如組蛋白甲基轉移酶(HMT)和脫乙醯化酶(HDAC)介導的。阻遏組蛋白效應物結構域係已知的並且下文提供了一示例性列表。在該示例性表格中,優先使用有助於有效病毒包裝(例如經由AAV)的小型蛋白質和功能截短物。然而,總的來說,該等結構域可以包括HDAC、組蛋白甲基轉移酶(HMT)和組蛋白乙醯轉移酶(HAT)抑制劑、以及HDAC和HMT募集蛋白。在一些實施方式中,功能結構域可以是或者包括HDAC效應物結構域、HDAC募集物效應物結構域、組蛋白甲基轉移酶(HMT)效應物結構域、組蛋白甲基轉移酶(HMT)募集物效應物結構域、或組蛋白乙醯轉移酶抑制劑效應物結構域。
HDAC效應物結構域
因此,本發明的阻遏蛋白結構域可以是選自組蛋白甲基轉移酶(HMT)、組蛋白脫乙醯酶(HDAC)、組蛋白乙醯轉移酶(HAT)抑制劑、以及HDAC和HMT募集蛋白。
HDAC結構域可以是以上表中的那些結構域中的任一種,即:HDAC8、RPD3、MesoLo4、HDAC11、HDT1、SIRT3、HST2、CobB、HST2、SIRT5、Sir2A、或SIRT6。
在一些實施方式中,功能結構域可以是HDAC募集物效應物結構域。較佳的實例包括以下表中的那些,即MeCP2、MBD2b、Sin3a、NcoR、SALL1、RCOR1。NcoR係本發明實例中舉例說明的,並且儘管它係較佳的,但設想的是該類別中的其他結構域也將是有用的。
HDAC募集物效應物結構域的表
在一些實施方式中,功能結構域可以是甲基轉移酶(HMT)效應物結構域。較佳的實例包括下表中的那些,即NUE、vSET、EHMT2/G9A、SUV39H1、dim-5、KYP、SUVR4、SET4、SET1、SETD8、以及TgSET8。NUE係本發明實例中舉例說明的,並且儘管它係較佳的,但設想的是該類別中的其他結構域也將是有用的。
組蛋白甲基轉移酶(HMT)效應物結構域的表
在一些實施方式中,功能結構域可以是組蛋白甲基轉
移酶(HMT)募集物效應物結構域。較佳的實例包括以下表中的那些,即Hp1a、PHF19、以及NIPP1。
組蛋白甲基轉移酶(HMT)募集物效應物結構域的表
在一些實施方式中,功能結構域可以是組蛋白乙醯轉移酶抑制劑效應物結構域。較佳的實例包括以下表中列出的SET/TAF-1β。
組蛋白乙醯轉移酶抑制劑效應物結構域的表
還較佳的是靶向除啟動子或啟動子近側元件之外的內源性(調節)控制元件(諸如增強子和沈默子)。因此,除靶向啟動子之外,本發明還可以用於靶向內源性控制元件(包括增強子和沈默子)。該等控制元件可以位於轉錄起始位點(TSS)上游和下游,從距離TSS的200bp開始到100kb遠。已知控制元件的靶向可以用於啟動或阻遏感興趣的基因。在一些情況下,單一控制元件可以影響多個靶基因的轉錄。單一控制元件的靶向可以因此用於同時控制多基因的轉錄。
在另一個方面中,推定的控制元件的靶向(例如,藉由針對推定的控制元件區域以及該元件周圍200bp至100kB)可以用作驗證此類元件(藉由測量感興趣的基因的轉錄)或者檢測新型控制元件(例如,藉由針對感興趣的基因的TSS的上游和下游的100kb)的手段。此外,推定的控制元件的靶向可以適用於理解疾病遺傳原因的情況。與疾病表型相關聯的許多突變和常見SNP變體位於編碼區之外。使用在此所述的啟動或阻遏系統靶向此類區域,可以接著讀出a)一組推定的靶標(例如,最緊密接近控制元件來定位的一組基因)的轉錄或者b)藉由RNAseq或微陣列進行整體轉錄組讀出。這允許鑒定疾病表型中涉及的最可能的候選基因。此類候選基因可以適用作新型藥物靶標。
在此提及了組蛋白乙醯轉移酶(HAT)抑制劑。然而,在一些實施方式中,替代物係針對包含乙醯轉移酶、較佳的是組蛋白乙醯轉移酶的一個或多個功能結構域。該等適用於表觀基因組學領域,例如適用於探察表觀基因組的方法。探察表觀基因組
的方法可以包括例如靶向表觀基因組序列。靶向表觀基因組序列可以包括將指導序列引導至表觀基因組靶序列。在一些實施方式中,表觀基因組靶序列可以包括啟動子、沈默子或增強子序列。
使用連接至在此所述的Cpf1效應蛋白、較佳的是無效Cpf1效應蛋白、更較佳的是無效-FnCpf1效應蛋白的功能結構域靶向表觀基因組序列,可以用於啟動或阻遏啟動子、沈默子或增強子。
乙醯轉移酶的實例係已知的,但在一些實施方式中可以包括組蛋白乙醯轉移酶。在一些實施方式中,組蛋白乙醯轉移酶可以包含人類乙醯轉移酶p300的催化核心(傑爾巴遲(Gerbasch)和雷迪(Reddy),自然生物技術,2015年4月6日)。
在一些較佳的實施方式中,功能結構域連接至無效-Cpf1效應蛋白,以靶向並啟動表觀基因組序列,諸如啟動子或增強子。還可以提供引導至此類啟動子或增強子的一種或多種指導序列,以引導CRISPR酶與此類啟動子或增強子結合。
術語“與...締合”在此用於係指功能結構域與Cpf1效應蛋白或轉接蛋白締合。它係關於一個分子如何與另一個分子“締合”,例如轉接蛋白與功能結構域之間或者Cpf1效應蛋白與功能結構域之間。在此類蛋白質-蛋白質相互作用的情況下,此締合可以按照抗體識別表位的方式進行的識別來觀察。可替代地,一種蛋白質可以與另一種蛋白質經由兩者的融合來締合,例如一種亞基融合至另一種亞基。典型地藉由將一種蛋白質的胺基酸序列添加到另一種蛋白質的胺基酸序列上,例如經由將編碼每種蛋白質或
亞基的核苷酸序列剪接在一起來發生融合。可替代地,這可以實質上視為兩個分子之間的結合或直接連接,諸如融合蛋白。在任何情況下,融合蛋白可以包含兩個感興趣的亞基之間(即酶與功能結構域之間或轉接蛋白與功能結構域之間)的接頭。因此,在一些實施方式中,Cpf1效應蛋白或轉接蛋白藉由結合功能結構域來與該功能結構域締合。在其他實施方式中,Cpf1效應蛋白或轉接蛋白與功能結構域締合,因為兩者視情況經由中間接頭融合在一起。
功能結構域或融合蛋白的附接可以是經由接頭,例如柔性甘胺酸-絲胺酸(GlyGlyGlySer)或(GGGS)3或者硬性α-螺旋形接頭諸如(Ala(GluAlaAlaAlaLys)Ala)。在此較佳的是使用接頭諸如(GGGGS)3分開蛋白質或肽結構域。(GGGGS)3係較佳的,因為它係相對長的接頭(15個胺基酸)。甘胺酸殘基係最柔性的並且絲胺酸殘基增加接頭處於蛋白質之外的機會。(GGGGS)6(GGGGS)9或(GGGGS)12可以較佳的是用作替代物。其他較佳的替代物係(GGGGS)1、(GGGGS)2、(GGGGS)4、(GGGGS)5、(GGGGS)7、(GGGGS)8、(GGGGS)10、或(GGGGS)11。替代性接頭係可用的,但高柔性接頭被認為是作用最好,以使得Cpf1的2個部分合在一起並因此重構Cpf1活性的機會最大。一替代方案係核質蛋白的NLS可以用作接頭。例如,接頭也可以用在Cpf1與任何功能結構域之間。同樣,在此可以使用(GGGGS)3接頭(或因此6、9或12個重複版本)或者可以將核質蛋白的NLS用作Cpf1與功能結構域之間的接頭。
飽和誘變
在此所述的一種或多種Cpf1效應蛋白系統可以用於進行基因組座位連同細胞表型的飽和誘變或深度掃描誘變-例如以用於測定基因表現、藥物抗性和疾病逆轉所需要的功能元件的關鍵性最小特徵和不連續易損性。飽和誘變或深度掃描誘導意指在基因組座位中每個或基本上每個DNA鹼基被切割。Cpf1效應蛋白指導RNA的文庫可以被引入到細胞群體中。該文庫可以被引入為使得每個細胞接收單一指導RNA(gRNA)。在其中該文庫藉由轉導如在此所述的病毒載體來引入的情況下,使用低感染複數(MOI)。該文庫可以包括靶向在基因組座位中的(原型間隔區相鄰模體)(PAM)序列上游的每個序列的gRNA。該文庫對於基因組座位中的每1000個鹼基對可以包括PAM序列上游的至少100個非重疊基因組座位序列。該文庫可以包括靶向至少一個不同PAM序列上游的序列的gRNA。Cpf1效應蛋白系統可以包含超過一個Cpf1蛋白。可以使用在此所述的任何Cpf1效應蛋白,包括識別不同PAM序列的異種同源物或工程化Cpf1效應蛋白。gRNA的脫靶位點的頻率可以是小於500。可以生成脫靶得分以選擇具有最低脫靶位點的gRNA。在單個實驗中,確定與gRNA靶位點處的切割相關聯的任何表型可以是藉由使用靶向相同位點的gRNA來證實。靶位點的確認也可以是藉由使用如在此所述的修飾的Cpf1效應蛋白和靶向感興趣的基因組位點的兩個gRNA來進行的。在不希望受到理論約束的情況下,如果在確認實驗中觀察到表型的變化,則靶位點係準確命中的。
基因組座位可以包含至少一個連續的基因組區域。該至少一個連續基因組區域可以包含多至整個基因組。該至少一個
連續基因組區域可以包含該基因組的功能元件。該功能元件可以是處於非編碼區、編碼基因、內含子區域、啟動子或增強子。該至少一個連續的基因組區域可以包含至少1kb、較佳的是至少50kb的基因組DNA。該至少一個連續基因組區域可以包含轉錄因子結合位點。該至少一個連續基因組區域可以包含DNA酶I超敏區域。該至少一個連續基因組區域可以包含轉錄增強子或阻遏子元件。該至少一個連續基因組區域可以包含富含表觀遺傳特徵的位點。該至少一個連續基因組DNA區域可以包含表觀遺傳絕緣子。該至少一個連續基因組區域可以包含物理上相互作用的兩個或更多個基因組區域。相互作用的基因組區域可以是藉由“4C技術”來確定。4C技術允許對於與選擇的DNA片段物理相互作用的DNA區段以無偏性方式篩選整個基因組,如趙(Zhao)等人((2006)自然遺傳學(Nat Genet)38,1341-7)和美國專利8,642,295中所述的,這兩份文獻藉由引用以其整體結合在此。表觀遺傳特徵可以是組蛋白乙醯化、組蛋白甲基化、組蛋白泛素化、組蛋白磷酸化、DNA甲基化或其缺失。
用於飽和誘變或深度掃描誘變的一種或多種Cpf1效應蛋白系統可以用於細胞群體中。一種或多種Cpf1效應蛋白系統可以用於真核細胞中,該等真核細胞包括但不限於哺乳動物細胞和植物細胞。細胞群體可以是真核細胞。真核細胞群體可以是胚胎幹細胞(ES)、神經元細胞、上皮細胞、免疫細胞、內分泌細胞、肌肉細胞、紅細胞、淋巴細胞、植物細胞或酵母細胞。
在一個方面中,本發明提供了篩選與表型變化相關聯
的功能元件之方法。文庫可以被引入到適於含有Cpf1效應蛋白的細胞群體。該等細胞基於表型可以被分成至少兩組。該表型可以是基因表現、細胞生長或細胞活力。確定存在於每組中的指導RNA的相對表現度,由此藉由每組中的指導RNA的表現度來確定與表型變化相關聯的基因組位點。表型變化可以是感興趣的基因表現的變化。感興趣的基因可以是上調、下調或敲除的。該等細胞可以被分為高表現組和低表現組。細胞群體可以包括用於確定表型的報導基因構建體。該報導基因構建體可以包含可檢測標記物。細胞可以藉由使用可檢測標記物來分類。
在另一個方面中,本發明提供了篩選與對化學化合物的抗性相關聯的基因組位點之方法。化學化合物可以是藥物或殺蟲劑。文庫可以被引入到適於含有Cpf1效應蛋白的細胞群體中,其中該群體中的每個細胞含有不超過一個的指導RNA;用化學化合物處理細胞群體;並且與早時間點相比,在較晚時間點用化學化合物處理後確定指導RNA的表現度,由此藉由富集指導RNA來確定與對化學化合物的抗性相關聯的基因組位點。gRNA的表現度可以是藉由深度定序方法確定的。
用於CRISPR-Cas9系統中的方法適用於利用Cpf1效應蛋白複合物實踐本發明並且參考以下文章:題為藉由Cas9-誘導的原位飽和誘變進行BCL11A增強子分割(BCL11A enhancer dissection by Cas9-mediated in situ saturating mutagenesis)康維爾M.C.(Canver,M.C.)、史密斯E.C.(Smith,E.C.)、謝爾F.(Sher,F.)、派因洛L.(Pinello,L.)、珊亞納N.E.(Sanjana,N.E.)、沙萊姆O.
(Shalem,O.)、陳D.D.(Chen,D.D.)、舒普P.G.(Schupp,P.G.)、維佳莫爾D.S.(Vinjamur,D.S.)、加西亞S.P.(Garcia,S.P.)、呂克S.(Luc,S.)、栗田R.(Kurita,R.)、納卡穆拉Y.(Nakamura,Y.)、藤原Y.(Fujiwara,Y.)、馬艾達T.(Maeda,T.)、元G.(Yuan,G.)、張F.(Zhang,F.)、奧爾金S.H.(Orkin,S.H.)、以及鮑爾D.E.(Bauer,D.E.)DOI:10.1038/nature15521,2015年9月16日網上公開,該文章藉由引用結合在此並且在下文中簡要討論:
康維爾等人涉及進行人和小鼠BCL11A紅系增強子的原位飽和誘變的新型合併的CRISPR-Cas9指導RNA文庫,該等紅系增強子先前被鑒定為係與胎血紅蛋白(HbF)水平相關聯的增強子並且該增強子的小鼠異種同源物係紅系BCL11A表現所必需的。此方法揭示了該等增強子關鍵性最小特徵和離散缺點。藉由編輯原代人祖細胞和小鼠誘變,作者們確認BCL11A紅系增強子作為用於HbF再誘導的靶標。作者們製成報告治療性基因組編輯的詳細增強子圖。
使用Cpf1系統修飾細胞或生物體之方法
在一些實施方式中,本發明包括修飾細胞或生物體之方法。細胞可以是原核細胞或真核細胞。細胞可以是哺乳動物細胞。哺乳動物細胞可以是非人類靈長類動物、牛、豬、齧齒動物或小鼠細胞。細胞可以是非哺乳動物真核細胞諸如家禽、魚或蝦的細胞。細胞還可以是植物細胞。植物細胞可以是栽培植物諸如木薯、玉米、高粱、小麥或稻具有的細胞。植物細胞還可以是藻類、樹或蔬菜具有的細胞。藉由本發明引入到細胞的修飾可以使
得細胞和細胞的子代被改變以改進生物產物諸如抗體、澱粉、乙醇或其他所希望的細胞輸出物的產生。藉由本發明引入到細胞的修飾可以使得細胞和細胞的子代包括使所產生的生物產物發生變化的改變。
該系統可以包含一種或多種不同載體。在本發明的一方面中,Cas蛋白被密碼子優化為在所希望的細胞類型,優先地是真核細胞,較佳的是哺乳動物細胞或人類細胞中表現。
包裝細胞典型地用於形成能夠感染宿主細胞的病毒粒子。此類細胞包括包裝腺病毒的293細胞和包裝逆轉錄病毒的ψ2細胞或PA317細胞。基因治療中使用的病毒載體通常是藉由產生將核酸載體包裝到病毒粒子中的細胞系來生成的。該等載體典型地含有包裝並隨後整合到宿主中所需要的最小病毒序列、被有待表現的一個或多個多核苷酸的表現盒替換的其他病毒序列。失去的病毒功能典型地是由包裝的細胞系反向供應的。例如,基因治療中使用的AAV載體典型地僅具有來自AAV基因組的ITR序列,該等序列係包裝並整合到宿主基因組中所需要的。病毒DNA被包裝在一個細胞系中,該細胞系含有編碼其他AAV基因即rep和cap但缺乏ITR序列的輔助質粒。該細胞系還可以用作為輔助物的腺病毒感染。輔助病毒促進AAV載體複製和來自輔助質粒的AAV基因表現。輔助質粒由於缺乏ITR序列而未大量包裝。腺病毒的污染可以是藉由例如進行腺病毒比AAV更敏感的熱處理來減少的。
遞送
本發明涉及經由至少一種奈米粒子複合物遞送的
CRISPR複合物的至少一種組分,例如RNA。在一些方面中,本發明提供了包括以下各項的方法:向宿主細胞遞送一種或多種多核苷酸,諸如在此所述的一種或多種載體、其一種或多種轉錄物和/或由其轉錄的一種或多種蛋白質。在一些方面中,本發明進一步提供了藉由此類方法產生的細胞以及包含此類細胞或由此類細胞產生的動物。在一些實施方式中,將CRISPR酶與指導序列組合(以及視情況與其複合)遞送到細胞中。常規的基於病毒和非病毒的基因轉移方法可以用於在哺乳動物細胞或靶組織中引入核酸。此類方法可以用於向培養基或宿主生物體中的細胞給予編碼CRISPR系統的組分的核酸。非病毒載體遞送系統包括DNA質粒、RNA(例如在此所述的載體的轉錄物)、裸核酸、以及與遞送媒介物脂質體複合的核酸。病毒載體遞送系統包括DNA和RNA病毒,該等病毒在遞送至細胞後具有附加型基因組或整合型基因組。對於基因治療程序的綜述,參見安德森,科學256:808-813(1992);納貝爾和費爾格納,TIBTECH 11:211-217(1993);三穀和卡斯基,TIBTECH 11:162-166(1993);狄龍,TIBTECH 11:167-175(1993);米勒,自然357:455-460(1992);範布倫特,生物技術6(10):1149-1154(1988);比涅,恢復神經學和神經科學8:35-36(1995);克雷默和佩里科代,英國醫學公報51(1):31-44(1995);哈嗒嗒等人,微生物學和免疫學的前沿課題,竇爾弗勒和博姆(編輯)(1995);以及余等人,基因治療1:13-26(1994)。
非病毒遞送核酸的方法包括包括脂質轉染、微注射、基因槍、病毒體、脂質體、免疫脂質體、聚陽離子或脂質:核酸軛合物、裸DNA、人工病毒體遞送、以及藥劑增強DNA攝取。脂質
轉染描述於例如美國專利案號5,049,386、4,946,787;以及4,897,355)並且脂質轉染試劑係商業上銷售的(例如,TransfectamTM和LipofectinTM)。適用於多核苷酸的有效受體識別脂質轉染的陽離子脂質和中性脂質包括以下各項中的那些:費爾格納WO 91/17424;WO 91/16024。遞送可以是遞送至細胞(例如,體外或離體給予)或靶組織(例如,體內給予)。
脂質:核酸複合物(包括靶向脂質體,諸如免疫脂質複合物)的製備係熟習該項技術者已熟知的(例如,參見克裡斯特爾(Crystal),科學270:404-410(1995);布萊澤等人,癌症基因治療2:291-297(1995);貝爾等人,生物共軛化學5:382-389(1994);雷米等人,生物共軛化學5:647-654(1994);高等人,基因治療2:710-722(1995);艾哈邁德等人,癌症研究52:4817-4820(1992);美國專利案號4,186,183、4,217,344、4,235,871、4,261,975、4,485,054、4,501,728、4,774,085、4,837,028、以及4,946,787)。
使用用於遞送核酸的基於RNA或DNA病毒的系統利用了用於將病毒靶向身體內的特定細胞並且將病毒有效負載運輸到核內的高度進化的方法。病毒載體可以直接給予至患者(體內)或者它們可以用於體外處理細胞,並且修飾細胞可以視情況給予至患者(離體)。常規基於病毒的系統可以包括用於基因轉移的逆轉錄病毒、慢病毒、腺病毒、腺相關病毒以及單純皰疹病毒載體。藉由逆轉錄病毒、慢病毒、以及腺相關病毒基因轉移方法整合在宿主基因組中是可能的,這常常導致插入的轉基因長期表現。另外,高轉導效率已在許多不同細胞類型和靶組織中觀察到。
逆轉錄病毒的趨向性可以藉由結合外源包膜蛋白來改變,從而擴增靶細胞的潛在靶群體。慢病毒載體係能夠轉導或感染非分裂細胞並典型地產生高病毒滴度的逆轉錄病毒載體。逆轉錄病毒基因轉移系統的選擇因此將取決於靶組織。逆轉錄病毒載體包含具有多至6-10kb外源序列的包裝容量的順式作用長末端重複序列。最小量順式作用LTR係足以複製並包裝該等載體的,然後使用該等載體將治療基因整合到靶細胞中,以提高永久性轉基因表現。廣泛使用的逆轉錄病毒載體包括基於以下各項的那些:鼠白血病病毒(MuLV)、長臂猿白血病病毒(GaLV)、猴免疫缺陷病毒(SIV)、人免疫缺陷病毒(HIV)、以及其組合(例如,參見,布奇謝爾等人,病毒學雜誌66:2731-2739(1992);約翰等人,病毒學雜誌66:1635-1640(1992);紹姆內爾費爾特等人,病毒學176:58-59(1990);威爾遜等人,病毒學雜誌63:2374-2378(1989);米勒等人,病毒學雜誌65:2220-2224(1991);PCT/US94/05700)。
在另一個實施方式中,預期可卡耳水泡病毒包膜假型化逆轉錄病毒載體粒子(例如,參見轉讓給福瑞德哈金森腫瘤研究中心(Fred Hutchinson Cancer Research Center)的美國專利公開案號20120164118)。可卡耳病毒係在水泡病毒屬中,並且係哺乳動物的水泡性口炎的致病物。可卡耳病毒最初從千里達拉島(Trinidad)的蟎蟲中分離(喬恩克爾(Jonkers)等人,美國獸醫研究雜誌(Am.J.Vet.Res.)25:236-242(1964)),並且在千里達拉島、巴西和阿根廷已從昆蟲、牛和馬中鑒定到感染。感染哺乳動物的許多水泡病毒已從天然感染的節肢動物中分離,這表明它們係載體傳播(vector-borne)的。水泡病毒抗體在生活於農村地區
的人中是常見,而該等病毒係地方性的並且係實驗室採集的;人類的感染通常導致流感樣症狀。可卡耳病毒包膜糖蛋白與VSV-G Indiana享有71.5%胺基酸水平的一致性,並且水泡病毒包膜基因的系統發育比較顯示可卡耳病毒在血清學上不同於水泡病毒內的VSV-G Indiana病毒株,但與其緊密相關。喬恩克爾等人,美國獸醫研究雜誌25:236-242(1964)和特拉瓦索斯達羅薩(Travassos da Rosa)等人,美國熱帶醫學和衛生雜誌(Am.J.Tropical Med.& Hygiene)33:999-1006(1984)。可卡耳水泡病毒包膜蛋白假型化逆轉錄病毒載體粒子可以包括慢病毒、α逆轉錄病毒、β逆轉錄病毒、γ逆轉錄病毒、δ逆轉錄病毒以及ε逆轉錄病毒載體粒子,該等載體可以可以包含逆轉錄病毒Gag、Pol、和/或一種或多種輔助蛋白以及可卡耳水泡病毒包膜蛋白。在該等實施方式的某些方面中,Gag、Pol和輔助蛋白係慢病毒和/或γ逆轉錄病毒的。本發明提供了含有以下各項或基本上由以下各項組成的AAV:編碼CRISPR系統的外源性核酸分子,例如包含第一盒或基本上由該第一盒組成的多個盒,該第一盒包含啟動子、編碼CRISPR-相關(Cas)蛋白(推定的核酸酶或解旋酶蛋白)例如Cpf1的核酸分子和終止子或基本上尤其組成,以及兩個或更多個、有利地多至包裝尺寸限度的載體,例如總計(包括該第一盒)五個包含啟動子、編碼指導RNA(gRNA)的核酸分子和終止子或基本上由其組成的盒(例如,每個盒示意性表示為啟動子-gRNA1-終止子、啟動子-gRNA2-終止子...啟動子-gRNA(N)-終止子(其中N係可以插入的數值,該數值係載體包裝尺寸限度的上限),或者兩個或更多個單獨的rAAV,各自含有CRISPR系統的一個或超過一個盒,例如第一個rAAV含有啟動子、
編碼Cas例如Cas(Cpf1)的核酸分子和終止子或基本上由其組成的第一盒,並且第二rAAV含有多個、四個包含啟動子、編碼指導RNA(gRNA)的核酸分子和終止子或基本上由其組成的盒(例如,每個盒示意性表示為啟動子-gRNA1-終止子、啟動子-gRNA2-終止子...啟動子-gRNA(N)-終止子(其中N係可以插入的數值,該數值係在該載體的包裝尺寸限度的上限內)。由於rAAV係DNA病毒,所以在此關於AAV或rAAV的討論中的核酸分子有利地是DNA。在一些實施方式中,該啟動子有利地是人類突觸蛋白I啟動子(hSyn)。用於將核酸遞送至細胞的其他方法係熟習該項技術者已知的。例如,參見US20030087817,該專利藉由引用結合在此。
在一些實施方式中,宿主細胞係用在此所述的一種或多種載體暫態轉染或非暫態轉染的。在一些實施方式中,細胞當天然存在於受試者中時被轉染。在一些實施方式中,轉染的細胞係從受試者中獲得的。在一些實施方式中,細胞係來源於從受試者中獲得的細胞,諸如細胞系。用於組織培養的多種多樣的細胞系係本領域已知的。細胞系包括但不限於,C8161、CCRF-CEM、MOLT、mIMCD-3、NHDF、HeLa-S3、Huh1、Huh4、Huh7、HUVEC、HASMC、HEKn、HEKa、MiaPaCell、Panc1、PC-3、TF1、CTLL-2、C1R、Rat6、CV1、RPTE、A10、T24、J82、A375、ARH-77、Calu1、SW480、SW620、SKOV3、SK-UT、CaCo2、P388D1、SEM-K2、WEHI-231、HB56、TIB55、Jurkat、J45.01、LRMB、Bcl-1、BC-3、IC21、DLD2、Raw264.7、NRK、NRK-52E、MRC5、MEF、Hep G2、HeLa B、HeLa T4、COS、COS-1、COS-6、COS-M6A、BS-C-1猴腎上皮細胞、BALB/3T3小鼠胚成纖維細胞、3T3 Swiss、
3T3-L1、132-d5人胎兒成纖維細胞;10.1小鼠成纖維細胞、293-T、3T3、721、9L、A2780、A2780ADR、A2780cis、A172、A20、A253、A431、A-549、ALC、B16、B35、BCP-1 cells、BEAS-2B、bEnd.3、BHK-21、BR 293、BxPC3、C3H-10T1/2、C6/36、Cal-27、CHO、CHO-7、CHO-IR、CHO-K1、CHO-K2、CHO-T、CHO Dhfr -/-、COR-L23、COR-L23/CPR、COR-L23/5010、COR-L23/R23、COS-7、COV-434、CML T1、CMT、CT26、D17、DH82、DU145、DuCaP、EL4、EM2、EM3、EMT6/AR1、EMT6/AR10.0、FM3、H1299、H69、HB54、HB55、HCA2、HEK-293、HeLa、Hepa1c1c7、HL-60、HMEC、HT-29、Jurkat、JY細胞、K562細胞、Ku812、KCL22、KG1、KYO1、LNCap、Ma-Mel 1-48、MC-38、MCF-7、MCF-10A、MDA-MB-231、MDA-MB-468、MDA-MB-435、MDCK II、MDCK II、MOR/0.2R、MONO-MAC 6、MTD-1A、MyEnd、NCI-H69/CPR、NCI-H69/LX10、NCI-H69/LX20、NCI-H69/LX4、NIH-3T3、NALM-1、NW-145、OPCN/OPCT細胞系、Peer、PNT-1A/PNT 2、RenCa、RIN-5F、RMA/RMAS、Saos-2細胞、Sf-9、SkBr3、T2、T-47D、T84、THP1細胞系、U373、U87、U937、VCaP、Vero細胞、WM39、WT-49、X63、YAC-1、YAR、以及其轉基因品種。細胞系可從熟習該項技術者已知的多種來源獲得(例如,參見美國典型培養物保藏中心(ATCC)(維吉尼亞州馬納薩斯))。在一些實施方式中,用在此所述的一種或多種載體轉染的細胞用於建立包含一種或多種載體來源的序列的新細胞系。在一些實施方式中,將用如在此所述的CRISPR系統的組分暫態轉染(諸如藉由暫態轉染一種或多種載體或用RNA轉染)並且藉由CRISPR複合物的活性修飾的細胞用於建立包括含有修
飾但缺乏任何其他外源性序列的細胞的細胞系。在一些實施方式中,將用在此所述的一種或多種載體暫態轉染或非暫態轉染的細胞或來源於此類細胞的細胞系用於評定一種或多種測試化合物。
在一些實施方式中,在此所述的一種或多種載體用於產生非人類轉基因動物或轉基因植物。在一些實施方式中,轉基因動物係哺乳動物,諸如小鼠、大鼠或兔。用於產生轉基因動物和植物的方法係本領域已知的並且通常以細胞轉染方法諸如在此所述的方法開始。在另一個實施方式中,可以預期具有針陣列的流體遞送裝置(例如,參見轉讓給福瑞德哈金森腫瘤研究中心的美國專利公開案號20110230839)用於將CRISPR Cas遞送至實體組織。美國專利公開案號20110230839的用於將流體遞送至實體組織的裝置可以包括按陣列安排的多個針;多個內存,每個內存與該多個針中的一個對應針流體連通;以及多個制動器,該多個制動器可操作地連接至該多個內存中的對應內存並且被配置為控制該內存內的流體壓力。在某些實施方式中,該多個制動器中的每個制動器可以包括多個柱塞之一,該多個柱塞中的每個柱塞的第一端被接收在該多個內存中的對應內存中,並且在某些另外的實施方式中,該多個柱塞中的該等柱塞在第二端可操作地連接在一起,以便可同時下壓。某些另外的實施方式可以包括柱塞驅動器,該柱塞驅動器被配置為以選擇性可變速率壓下所有該多個柱塞。在其他實施方式中,該多個制動器中的每個制動器可以包括具有第一端和第二端的多個流體傳輸線中的一個流體傳輸線,該多個流體傳輸線中的每個流體傳輸線的第一端連接至該多個內存中的一個對應內存。在其他實施方式中,該裝置可以包括一個流體壓力
來源,並且該多個制動器中的每個制動器包括該流體壓力來源與該多個內存中的一個對應內存之間的流體連接。在另外的實施方式中,流體壓力來源可以包括以下各項中的至少一種:壓縮器、真空貯氣筒、蠕動泵、主缸、微流體泵、以及閥。在另一個實施方式中,該多個針中的每個針可以包括沿著其長度分佈的多個埠。
在一個方面中,本發明提供了修飾真核細胞中的靶多核苷酸的方法。在一些實施方式中,該方法包括使得核酸靶向複合物結合靶多核苷酸來實施所述靶多核苷酸的切割,從而修飾該靶多核苷酸,其中該核酸靶向複合物包含與雜交至所述靶多核苷酸內的靶序列的指導RNA複合的核酸靶向效應蛋白。
在另一個方面中,本發明提供了修飾多核苷酸在真核細胞中的表現之方法。在一些實施方式中,該方法包括允許核酸靶向複合物結合該多核苷酸,以使得所述結合導致所述多核苷酸的表現增加或減少;其中該核酸靶向複合物包含與雜交至所述多核苷酸內的靶序列的指導RNA複合的核酸靶向效應蛋白。
CRISPR複合物組分可以是藉由與轉運部分軛合或締合來遞送(例如,改編自美國專利案號8,106,022;8,313,772)。核酸遞送策略可以例如用於改進指導RNA或信使RNA或編碼CRISPR複合物組分的編碼DNA的遞送。例如,RNA可以結合修飾的RNA核苷酸來提高穩定性、減小免疫刺激並且/或者改進特異性(參見德勒埃維,葛籣.F.(Deleavey,Glen F.)等人,2012,化學與生物學(Chemistry & Biology),第19卷,第8期,937-954;紮利皮斯科(Zalipsky),1995,先進藥物遞送評論(Advanced Drug
Delivery Reviews)16:157-182;卡利色提(Caliceti)和威羅尼(Veronese),2003,先進藥物輸送評論55:1261-1277)。已描述可以用於修飾核酸諸如gRNA以進行更有效的遞送的不同構建體,諸如可以適於修飾gRNA以便具有更大疏水性和非離子性從而提高細胞進入的可逆性電荷中和磷酸三酯骨架修飾(米德.BR(Meade BR)等人,2014,自然生物技術32,1256-1261)。在其他替代實施方式中,選定的RNA模體可以適用於介導細胞轉染(麥哲倫.M.(Magalhães M.)等人,分子治療(Molecular Therapy)(2012);203,616-624)。類似地,適配體可以適於例如藉由將適配體附加至gRNA來遞送CRISPR複合物組分(塔恩(Tan)等人,2011,生物技術趨勢(Trends in Biotechnology),2011年12月,第29卷,第12期)。
在一些實施方式中,三觸角N-乙醯基半乳糖胺(GalNAc)與寡核苷酸組分的軛合可以用於改進遞送,例如選擇細胞類型例如肝細胞的遞送(參見WO2014118272,該專利藉由引用結合在此;耐爾,JK(Nair,JK)等人,2014,美國化學學會雜誌(Journal of the American Chemical Society)136(49),16958-16961)。這可以被認為是基於糖的粒子並且在此提供了關於其他粒子遞送系統和/或配製物的其他詳情。GalNAc因此可以被認為是在此所述的其他粒子的意義上的粒子,以使得一般用途和其他考慮因素(例如所述粒子的遞送)也應用於GalNAc粒子。溶液相軛合策略可以例如用於將作為PFP(五氟苯酚)酯啟動的三觸角GalNAc簇(分子量~2000)附接到5'-己基胺基修飾的寡核苷酸上(5'-HA ASO,分子量~8000Da;奧斯塔蓋得(stergaard)等人,
生物共軛化學,2015,26(8),第1451-1455頁)。類似地,已描述用於體內核酸遞送的聚(丙烯酸酯)聚合物(參見WO2013158141,該專利藉由引用結合在此)。在其他替代實施方式中,為了改進遞送,可以使用預先混合的CRISPR奈米粒子(或蛋白質複合物)與天然存在的血清蛋白(阿克尼克.A(Akinc A)等人,2010,分子治療(Molecular Therapy),第18卷第7期,1357-1364)。
篩選技術可用於鑒定遞送增強子,例如藉由篩選化學文庫(吉爾埃倫.J.(Gilleron J.)等人,2015,核酸研究43(16):7984-8001)。還已描述了用於測定遞送媒介物諸如奈米粒子的效率的方法,該等方法可以用於鑒定對於CRISPR組分的有效遞送媒介物(參見薩哈義.G.(Sahay G.)等人,2013,自然生物技術31,653-658)。
在一些實施方式中,蛋白質CRISPR組分的遞送可以是藉由將功能肽(諸如改變蛋白質疏水性的肽)添加到該蛋白質中,例如以便改進體內功能來實現。CRISPR組分蛋白可以類似地被修飾為促進隨後的化學反應。例如,胺基酸可以被添加到具有經受點擊化學的基團的蛋白質中(尼基克.I.(Niki I.)等人,2015,自然實驗手冊(Nature Protocols)10,780-791)。在這種類型的實施方式中,點擊化學基團那麼可以用於添加多種多樣的替代性結構,諸如用於穩定的聚(乙二醇)、細胞穿透肽、RNA適配體、脂質、或碳水化合物諸如GalNAc。在其他替代方案中,CRISPR組分蛋白可以被修飾為適應進入細胞蛋白(參見斯文森(Svensen)等人,2012,藥理學趨勢(Trends in Pharmacological Sciences),第33卷,
第4期),例如藉由將細胞穿透肽添加到該蛋白質(參見考夫曼,W..伯克利(Kauffman,W.Berkeley)等人,2015,生物化學趨勢(Trends in Biochemical Sciences),第40卷,第12期,749-764;科倫(Koren)和托爾基林(Torchilin),2012,分子醫學趨勢(Trends in Molecular Medicine),第18卷,第7期)。在另一個替代實施方式中,患者或受試者可以用有助於CRISPR組分隨後遞送的化合物或配製物預處理。
Cpf1效應蛋白複合物可以用於植物中
一種或多種Cpf1效應蛋白系統(例如,單一或多重)可以與農作物基因組的研究進展結合來使用。在此所述的系統可以用於進行有效且性價比高的植物基因或基因組探察或編輯或操縱,例如,快速研究並且/或者選擇並且/或者探察並且/或者比較並且/或者操縱並且/或者轉化植物基因或基因組;例如,以為一種或多種植物創建、鑒定、發展、優化或賦予一種或多種性狀或一種或多種特徵或者以轉化植物基因組。因此可以存在植物、具有新性狀或特徵組合的新植物或具有增強的性狀的新植物的改進的產生方法。一種或多種Cpf1效應蛋白系統可以用於植物中,以定點整合(SDI)或基因編輯(GE)或任何近反向育種(Near Reverse Breeding,NRB)或反向育種(RB)技術。利用在此所述的Cpf1效應蛋白系統的方面可能類似於CRISPR-Cas(例如,CRISPR-Cas9)系統在植物中的使用,並且參考亞利桑那大學(University of Arizona)網站“CRISPR-PLANT”(http://www.genome.arizona.edu/crispr/)(得到賓州州立大學
(Penn State)和AGI的支持)。本發明的實施方式可以用於在植物中或在先前已使用RNAi或類似基因組編輯技術的情況中進行基因組編輯。例如,參見涅克拉索夫(Nekrasov),“植物基因組編輯一點通:在模型和農作物植物中使用CRISPR-Cas系統進行靶向誘變(Plant genome editing made easy:targeted mutagenesis in model and crop plants using the CRISPR-Cas system)”,植物方法(Plant Methods)2013,9:39(doi:10.1186/1746-4811-9-39);布魯克斯(Brooks),“在第一代番茄中使用CRISPR-Cas9系統進行有效基因編輯(Efficient gene editing in tomato in the first generation using the CRISPR-Cas9 system)”,植物生理學(Plant Physiology),2014年9月,第114.247577頁;單(Shan),“使用CRISPR-Cas系統進行農作物植物的靶向基因組修飾(Targeted genome modification of crop plants using a CRISPR-Cas system)”,自然生物技術31,686-688(2013);馮(Feng),“在植物中使用CRISPR/Cas系統進行有效基因組編輯(Efficient genome editing in plants using a CRISPR/Cas system)”,細胞研究(Cell Research)(2013)23:1229-1232.doi:10.1038/cr.2013.114;2013年8月20日線上公開;謝(Xie),“在植物中使用CRISPR-Cas系統進行RNA指導的基因組編輯(RNA-guided genome editing in plants using a CRISPR-Cas system)”,分子植物(Mol Plant.),2013年11月;6(6):1975-83.doi:10.1093/mp/sst119.電子版2013年8月17日;許(Xu),“在稻中使用根癌土壤桿菌介導的CRISPR-Cas系統進行基因靶向(Gene targeting using the Agrobacterium tumefaciens-mediated CRISPR-Cas system in rice)”,稻(Rice)2014,7:5(2014),週(Zhou)等
人,“在異型雜交木多年生楊樹中利用SNP進行二對偶基因CRISPR突變揭示了4-香豆酸:CoA連接酶特異性和豐餘性(Exploiting SNPs for biallelic CRISPR mutations in the outcrossing woody perennial Populus reveals 4-coumarate:CoA ligase specificity and Redundancy)”,新植物學家(New Phytologist)(2015)(論壇)1-4(僅可在www.newphytologist.com處線上獲得);卡利安多(Caliando)等人,“使用在宿主基因組中穩定攜帶的CRISPR裝置進行靶向DNA降解(Targeted DNA degradation using a CRISPR device stably carried in the host genome)”,自然通訊(NATURE COMMUNICATIONS)6:6989,DOI:10.1038/ncomms7989,www.nature.com/naturecommunications DOI:10.1038/ncomms7989;美國專利案號6,603,061-土壤桿菌屬介導的植物轉化方法(Agrobacterium-Mediated Plant Transformation Method);美國專利案號7,868,149-植物基因組序列及其用途(Plant Genome Sequences and Uses Thereof)以及US 2009/0100536-具有增強的農藝性狀的轉基因植物(Transgenic Plants with Enhanced Agronomic Traits),每份文獻的所有內容和揭露均藉由引用以其整體結合在此。在本發明的實踐中,莫雷爾(Morrell)等人“農作物基因組:發展與應用(Crop genomics:advances and applications)”,遺傳學自然評論(Nat Rev Genet.),2011年12月29日;13(2):85-96的內容和揭露;每份文獻藉由引用結合在此,包括關於在此的實施方式可以如何用於植物一樣。因此,除非另外表明,否則在此提及動物細胞也可以將必要的修正應用於植物細胞;並且,在此具有減小的脫靶效應的酶和採用此類酶的系統可以用於植物應用,
包括在此提及的那些。
Cpf1-CRISPR系統對植物和酵母的應用
定義:
總的來說,術語“植物”涉及植物界中藉由細胞分裂特徵性生長、含有葉綠體並具有包含纖維素的細胞壁的任何不同光合作用生物體、真核生物體、單細胞生物體或多細胞生物體。術語植物涵蓋單子葉植物和雙子葉植物。確切的說,該等植物旨在包括但不限於被子植物和裸子植物,諸如刺槐、苜蓿、莧、蘋果、杏、洋薊、灰樹、蘆筍、鱷梨、香蕉、大麥、豆、甜菜、樺樹、山毛櫸、黑莓、藍莓、花椰菜、芽球甘藍、捲心菜、油菜(canola)、哈密瓜、胡蘿蔔、木薯、菜花、雪松、穀類、芹菜、栗樹、櫻桃、大白菜、柑橘、克萊門小柑橘、三葉草、咖啡、穀物、棉花、豇豆、黃瓜、柏樹、茄子、榆樹、菊苣、桉樹、茴香、無花果、樅樹、天竺葵、葡萄、葡萄柚、落花生(groundnut)、地櫻桃、樹膠鐵杉、山核桃、羽衣甘藍、奇異果、甘藍、落葉松、生菜、韭蔥、檸檬、酸橙、洋槐、松樹、掌葉鐵線蕨、玉米(maize)、芒果、楓樹、甜瓜、小米、蘑菇、芥菜、堅果、橡樹、燕麥、油棕樹、秋葵、洋蔥、桔子、觀賞植物或花或樹、木瓜、棕櫚樹、歐芹、防風草、豌豆、桃樹、花生(peanut)、梨樹、泥煤苔(peat)、胡椒、柿子樹、木豆、松樹、鳳梨、車前草、李子、石榴、馬鈴薯、南瓜、菊苣、蘿蔔、油菜籽、覆盆子、稻穀、黑麥、高梁、紅花、黃華柳、大豆、菠菜、雲杉、南瓜、草莓、甜菜、甘蔗、向日葵、甘薯、甜玉米、橘子、茶、煙草、番茄、樹木、黑小麥、草坪草、蕪菁、葡萄樹、
胡桃、西洋菜、西瓜、小麥、山藥、紫杉、以及綠皮西葫蘆。術語植物還涵蓋藻類,該等藻類主要係統一標準主要為缺乏根、葉和表徵高等植物的其他器官的光合自養生物。
用於使用在此所述的Cpf1系統進行基因組編輯的方法可以用於對基本上任何植物賦予所希望的性狀。各種各樣的植物和植物細胞系統可以使用本揭露的核酸構建體和以上提及的各種轉化方法來工程化為如在此所述的希望的生理學和農藝學特徵。在較佳的實施方式中,用於工程化的靶植物和植物細胞包括但不限於,那些單子葉植物和雙子葉植物,諸如農作物,包括穀類作物(例如,小麥、玉米、稻米、小米、大麥)、果實農作物(例如,番茄、蘋果、梨、草莓、桔子)、草料作物(例如,苜蓿)、根用蔬菜作物(例如,胡蘿蔔、馬鈴薯、甜萊、山藥)、葉用蔬菜作物(例如,生菜、菠菜);有花植物(例如,矮牽牛、玫瑰、菊花)、針葉樹和松樹(例如,冷杉、雲杉);植物治理法中使用的植物(例如,重金屬積累的植物);油料作物(例如,向日葵、油菜籽)和用於實驗目的的植物(例如,擬南芥屬)。因此,該等方法和CRISPR-Cas系統可以用於廣泛範圍的植物,例如像屬於以下目的雙子葉植物:木蘭目(Magniolales)、八角目(Illiciales)、樟目(Laurales)、胡椒目(Piperales)、馬兜鈴目(Aristolochiales)、睡蓮目(Nymphaeales)、毛茛目(Ranunculales)、罌粟目(Papaverales)、瓶子草科(Sarraceniaceae)、昆欄樹目(Trochodendrales)、金縷梅目(Hamamelidales)、杜仲目(Eucommiales)、塞子木目(Leitneriales)、楊梅目(Myricales)、殼鬥目(Fagales)、木麻黃目(Casuarinales)、石竹目(Caryophyllales)、肉穗果目(Batales)、
寥目(Polygonales)、藍雪目(Plumbaginales)、五椏果目(Dilleniales)、山茶目(Theales)、錦葵目(Malvales)、蕁麻目(Urticales)、玉蕊目(Lecythidales)、堇菜目(Violales)、楊柳目(Salicales)、白花菜目(Capparales)、杜鵑花目(Ericales)、岩梅目(Diapensiales)、柿樹目(Ebenales)、報春花目(Primulales)、薔薇目(Rosales)、豆目(Fabales)、川草目(Podostemales)、小二仙草目(Haloragales)、桃金娘目(Myrtales)、山茱萸目(Cornales)、山龍眼目(Proteales)、檀香目(San tales)、大花草目(RaffIesiales)、衛矛目(Celastrales)、大戟目(Euphorbiales)、鼠李目(Rhamnales)、無患子目(Sapindales)、胡桃目(Juglandales)、牻牛兒苗目(Geraniales)、遠志目(Polygalales)、傘形目(Umbellales)、龍膽目(Gentianales)、花蔥目(Polemoniales)、唇形目(Lamiales)、車前草目(Plantaginales)、玄參目(Scrophulariales)、桔梗目(Campanulales)、茜草目(Rubiales)、川續斷目(Dipsacales)以及菊目(Asterales);該等方法和CRISPR-Cas可以用於單子葉植物,諸如屬於以下目的單子葉植物:澤瀉目(Alismatales)、水鱉目(Hydrocharitales)、茨藻目(Najadales)、黴草目(Triuridales)、鴨蹠草目(Commelinales)、穀精草目(Eriocaulales)、帚燈草目(Restionales)、禾本目(Poales)、燈芯草目(Juncales)、莎草科(Cyperales)、香蒲目(Typhales)、鳳梨目(Bromeliales)、薑目(Zingiberales)、檳榔目(Arecales)、環花目(Cyclanthales)、露兜樹目(Pandanales)、天南星目(Arales)、百合目(Lilliales)以及蘭目(Orchid ales),或者用於屬於裸子植物的植物,例如屬於松杉目(Pinales)、銀杏目(Ginkgoales)、蘇鐵目(Cycadales)、
南洋杉目(Araucariales)、柏目(Cupressales)以及麻黃目(Gnetales)。
在此所述的Cpf1 CRISPR系統和使用方法可以用於廣泛範圍的植物種類,包括在下面的雙子葉植物、單子葉植物或裸子植物屬的非限制性列表中:顛茄屬(Atropa)、油丹屬(Alseodaphne)、腰果屬(Anacardium)、落花生屬(Arachis)、瓊楠屬(Beilschmiedia)、芸苔屬(Brassica)、紅花屬(Carthamus)、木防己屬(Cocculus)、巴豆屬(Croton)、甜瓜屬(Cucumis)、柑橘屬(Citrus)、西瓜屬(Citrullus)、辣椒屬(Capsicum)、長春花屬(Catharanthus)、椰子屬(Cocos)、咖啡屬(Coffea)、南瓜屬(Cucurbita)、胡蘿蔔屬(Daucus)、杜氏木屬(Duguetia)、花菱草屬(Eschscholzia)、榕屬(Ficus)、草莓屬(Fragaria)、海罌粟屬(Glaucium)、大豆屬(Glycine)、棉屬(Gossypium)、向日葵屬(Helianthus)、橡膠樹屬(Hevea)、天仙子屬(Hyoscyamus)、萵苣屬(Lactuca)、卷枝藤屬(Landolphia)、亞麻屬(Linum)、木薑子屬(Litsea)、番茄屬(Lycopersicon)、羽扇豆屬(Lupinus)、木薯屬(Manihot)、馬郁蘭屬(Majorana)、蘋果屬(Malus)、苜蓿屬(Medicago)、煙草屬(Nicotiana)、木犀欖屬(Olea)、銀膠菊屬(Parthenium)、罌粟屬(Papaver)、鱷梨屬(Persea)、菜豆屬(Phaseolus)、黃連木屬(Pistacia)、豌豆屬(Pisum)、梨屬(Pyrus)、李屬(Prunus)、蘿蔔屬(Raphanus)、蓖麻屬(Ricinus)、千里光屬(Senecio)、防己屬(Sinomenium)、千金藤屬(Stephania)、歐白芥屬(Sinapis)、茄屬(Solanum)、可可屬(Theobroma)、三葉
草屬(Trifolium)、胡蘆巴屬(Trigonella)、蠶豆屬(Vicia)、蔓長春花屬(Vinca)、葡萄屬(Vilis)以及豇豆屬(Vigna);以及蔥屬(Allium)、須芒草屬(Andropogon)、畫眉草屬(Aragrostis)、天門冬屬(Asparagus)、燕麥屬(Avena)、狗牙根屬(Cynodon)、油棕屬(Elaeis)、羊茅屬(Festuca)、羊茅黑麥草屬(Festulolium)、萱草屬(Heterocallis)、大麥屬(Hordeum)、浮萍屬(Lemna)、毒麥屬(Lolium)、芭蕉屬(Musa)、稻屬(Oryza)、黍屬(Panicum)、狼尾草屬(Pannesetum)、梯牧草屬(Phleum)、早熟禾屬(Poa)、黑麥屬(Secale)、高粱屬(Sorghum)、小麥屬(Triticum)、玉蜀黍屬(Zea)、冷杉屬(Abies)、杉木屬(Cunninghamia)、麻黃屬(Ephedra)、雲杉屬(Picea)、松屬(Pinus)、以及黃杉屬(Pseudotsuga)。
Cpf1 CRISPR系統和使用方法也可以用於廣泛範圍的“藻類”或“藻類細胞”;包括例如選自若干真核生物門的藻類,包括紅藻門(紅藻)、綠藻門(綠藻)、褐藻門(褐藻)、矽藻門(矽藻)、真眼點藻綱以及溝鞭藻類,以及原核生物門藍藻細菌(藍綠藻類)。術語“藻類”包括例如選自以下各項的藻類:雙眉藻屬(Amphora)、魚腥藻屬(Anabaena)、纖維藻屬(Anikstrodesmis)、叢粒藻屬(Botryococcus)、角毛藻屬(Chaetoceros)、衣藻屬(Chlamydomonas)、綠藻屬(Chlorella)、綠球藻屬(Chlorococcum)、小環藻屬(Cyclotella)、筒柱藻屬(Cylindrotheca)、杜氏藻屬(Dunaliella)、球石藻屬(Emiliana)、眼蟲屬(Euglena)、紅球藻屬(Hematococcus)、等鞭金藻屬
(Isochrysis)、單鞭金藻屬(Monochrysis)、單針藻屬(Monoraphidium)、微綠球藻屬(Nannochloris)、擬微綠球藻屬(Nannnochloropsis)、舟形藻屬(Navicula)、腎鞭藻屬(Nephrochleris)、腎片藻屬(Nephresolmis)、菱形藻屬(Nitzschia)、節球藻屬(Nodularia)、念珠藻屬(Nostoc)、髓球藻屬(Oochromonas)、卵囊藻(Oocystis)、顫藻(Oscillartoria)、巴夫藻屬(Pavlova)、褐指藻屬(Phaeodactylum)、扁藻屬(Playtmonas)、顆石藻屬(Pleurochrysis)、紫菜屬(Porhyra)、假魚腥藻(Pseudoanabaena)、塔胞藻屬(Pyramimonas)、裂絲藻屬(Stichococcus)、聚球藻屬(Synechococcus)、集胞藻屬(Synechocystis)、四片藻屬(Tetraselmis)、海鏈藻屬(Thalassiosira)、以及束毛藻屬(Trichodesmium)。
植物的一部分即“植物組織”可以根據本發明的方法進行處理以產生改進的植物。植物組織還涵蓋植物細胞。如在此所用的術語“植物細胞”係指活體植物的個體單元,在完整全株或在體外組織培養基中、在培養基或瓊脂上、在生長培養基或緩衝液的懸浮液中或作為高等組織單元一部分生長的分離形式,例如像植物組織、植物器官或全株。
“原生質體”係指植物細胞使用例如機械或酶促方式完全去除或部分去除保護性細胞壁從而形成的活體植物的完整生物化學活性單元,該活性單元在適當生長條件下可以重新形成細胞壁、增殖並再生成全株。
術語“轉化”廣泛地是指植物宿主藉由借助於土壤桿
菌或各種化學或物理方法之一來引入DNA從而進行遺傳修飾的過程。如在此所用,術語“植物宿主”係指植物,包括植物的任何細胞、組織、器官或子代。許多適合的植物組織或植物細胞可以被轉化,並且包括但不限於,原生質體、體細胞胚胎、花粉、葉、幼苗、莖、愈傷組織、匍伏莖、試管塊莖、以及胚芽。植物組織還是指這種植物的任何殖株、種子、子代、繁殖體(無論是有性繁殖產生或無性繁殖產生)、以及任何該等的後代諸如切塊或種子。
如在此所用術語“轉化的”係指已引入外源DNA分子諸如構建體的細胞、組織、器官或生物體。引入的DNA分子可以整合到受體細胞、組織、器官或生物體的基因組DNA中,以使得引入的DNA分子被傳輸到隨後的子代中。在該等實施方式中,“轉化的”或“轉基因的”細胞或植物也可以包括細胞或植物的子代以及藉由育種程式採用這種轉化的植物作為雜交的母體並表現出因引入的DNA分子的存在而產生的改變的表型的子代。較佳的是,轉基因植物係能育的並且能夠將引入的DNA藉由有性繁殖傳輸到子代中。
術語“子代”諸如轉基因植物的子代係由植物或轉基因植物生出的、由其產生的或從其來源的子代。引入的DNA分子還可以暫態轉染到受體細胞中,以使得引入的DNA分子未被隨後的子代繼承並因此不認為是“轉基因的”。因此,如在此所用,“非轉基因”植物或植物細胞係不含有穩定整合到其基因組中的外源DNA的植物。
如在此所用,術語“植物啟動子”係能夠開啟植物細胞
內的轉錄(無論其起源是否是植物細胞)的啟動子。示例性的適合植物啟動子包括但不限於,從植物、植物病毒和包含在植物細胞內表現的基因的細菌諸如土壤桿菌屬或根瘤菌屬中獲得的啟動子。
如在此所用,“真菌細胞”係指真菌界內的任何類型的真核細胞。真菌界內的種系包括子囊菌門、擔子菌門、芽枝黴門(Blastocladiomycota)、壺菌門、球囊菌門(Glomeromycota)、微孢子蟲目、以及新美鞭菌門(Neocallimastigomycota)。真菌細胞可以包括酵母、黴菌、以及絲狀真菌。在一些實施方式中,該真菌細胞係酵母細胞。
如在此所用,術語“酵母細胞”係指子囊菌門和擔子菌門內的任何真菌細胞。酵母細胞可以包括芽殖酵母細胞、裂殖酵母細胞、以及黴菌細胞。在不限於該等生物體的情況下,實驗室和工業環境中使用的許多類型的酵母係子囊菌門的一部分。在一些實施方式中,酵母細胞係釀酒酵母、馬克思克魯維酵母(Kluyveromyces marxianus)、或東方伊薩酵母(Issatchenkia orientalis)細胞。其他酵母細胞可以包括但不限於假絲酵母屬某些種(例如,白色念珠菌)、亞羅酵母屬某些種(例如,亞羅解脂酵母)、畢赤酵母屬某些種(例如,巴斯德畢赤酵母)、克魯維酵母屬某些種(例如,產乳糖酶酵母和馬克思克魯維酵母)、鏈孢黴屬某些種(例如,粗糙脈孢菌)、鐮刀菌某些種(例如,尖孢鐮刀菌)、以及伊薩酵母屬某些種(例如,東方伊薩酵母,又稱為庫德里阿茲威畢赤酵母(Pichia kudriavzevii)和酸性嗜熱假絲酵母(Candida
acidothermophilum))。在一些實施方式中,該真菌細胞係絲狀真菌細胞。如在此所用,術語“絲狀真菌細胞”係指以細絲(即菌絲或菌絲體)生長的任何類型的真菌細胞。絲狀真菌細胞的實例可以包括但不限於,麯黴屬某些種(例如,黑麯黴)、木黴屬某些種(例如,裡氏木黴)、根黴屬某些種(例如,稻根黴菌)、以及被孢黴屬某些種(例如,深黃被孢黴)。
在一些實施方式中,該真菌細胞係工業菌株。如在此所用,“工業菌株”係指工業過程中使用的或由工業過程分離的任何真菌細胞菌株,該工業過程例如以商業或工業規模生產產品。工業菌株可以是典型地用於工業過程的真菌種類,或者它可以是指也可用於非工業目的(例如,實驗室研究)的真菌種類分離株。工業過程的實例可以包括發酵(例如,在食品或飲料產品生產中)、蒸餾、生物燃料生產、化合物生產、以及多肽生產。工業菌株的實例可以包括但不限於,JAY270和ATCC4124。
在一些實施方式中,該真菌細胞係多倍體細胞。如在此所用,“多倍體”細胞可以是指其基因組以超過一個拷貝存在的任何細胞。多倍體細胞可以是指以多倍體狀態天然發現的細胞類型,或者它可以是指已誘導為以多倍體狀態存在(例如,藉由特異性調節、改變、滅活、啟動、或者減數分裂、胞質分裂或DNA複製的修飾)的細胞。多倍體細胞可以是指其整個基因組為多倍體的細胞,或者它可以是指在特定感興趣的基因組座位中為多倍體的細胞。在不希望受到理論約束的情況下,認為與在單倍體細胞中相比指導RNA的豐度在多倍體細胞的基因組工程中可能是更
常見的速率限制性組分,並且因此使用在此所述的Cpf1 CRISPRS系統的方法可以利用使用某種真菌細胞類型的優點。
在一些實施方式中,該真菌細胞係二倍體細胞。如在此所用,“二倍體”細胞可以是指其基因組以兩個拷貝存在的任何細胞。二倍體細胞可以是指以二倍體狀態天然發現的細胞類型,或者它可以是指已誘導為以二倍體狀態存在(例如,藉由特異性調節、改變、滅活、啟動、或者減數分裂、胞質分裂或DNA複製的修飾)的細胞。例如,釀酒酵母菌株S228C可以維持在單倍體狀態或二倍體狀態中。二倍體細胞可以是指其整個基因組為二倍體的細胞,或者它可以是指在特定感興趣的基因組座位中為二倍體的細胞。在一些實施方式中,該真菌細胞係單倍體細胞。如在此所用,“單倍體”細胞可以是指其基因組以一個拷貝存在的任何細胞。單倍體細胞可以是指以單倍體狀態天然發現的細胞類型,或者它可以是指已誘導為以單倍體狀態存在(例如,藉由特異性調節、改變、滅活、啟動、或者減數分裂、胞質分裂或DNA複製的修飾)的細胞。例如,釀酒酵母菌株S228C可以維持在單倍體狀態或二倍體狀態中。單倍體細胞可以是指其整個基因組為單倍體的細胞,或者它可以是指在特定感興趣的基因組座位中為單倍體的細胞。
如在此所用,“酵母表現載體”係指含有編碼RNA和/或多肽的一個或多個序列的核酸並且可以進一步含有控制一個或多個核酸表現的任何希望的元件、以及使得能夠在酵母細胞內複製並維持表現載體的任何元件。許多適合的酵母表現載體及其特
徵係本領域已知的;例如,不同載體和技術示出在酵母方案(Yeast Protocols),第2版,肖,W.(Xiao,W.)編輯(胡馬納出版社(Humana Press),紐約,2007)和巴克霍爾茲,R.G.(Buckholz,R.G.)和格利森,M.A.(Gleeson,M.A.)(1991)生物技術(NY)9(11):1067-72。酵母載體可以包含但不限於,著絲粒(CEN)序列、自主性複製序列(ARS)、可操作地連接至感興趣的序列或基因的啟動子諸如RNA聚合酶III啟動子、終止子諸如RNA聚合物III終止子、複製起點、以及標記物基因(例如,營養缺陷型、抗生素型或其他選擇標記物)。用於酵母的表現載體的實例可以包括質粒、酵母人工染色體、2μ質粒、酵母整合型質粒、酵母複製型質粒、穿梭載體、以及附加型質粒。
Cpf1 CRISP系統組分穩定整合在植物和植物細胞的基因組中
在特定實施方式中,設想的是引入編碼Cpf1 CRISPR系統組分的多核苷酸,以穩定整合到植物細胞基因組中。在該等實施方式中,轉化載體或表現系統的設計可以根據指導RNA和/或Cpf1基因表現的時間、位置和條件來調整。
在特定實施方式中,設想的是將Cpf1 CRISPR系統的組分穩定引入到植物細胞的基因組DNA中。另外地或可替代地,設想的是引入Cpf1 CRISPR系統的組分,以穩定整合到植物細胞器的DNA中,該細胞器諸如但不限於質粒、線粒體或葉綠體。
用於穩定整合到植物細胞基因組中的表現系統可以包含以下元件中的一個或多個:可以用於在植物細胞中表現RNA和/或Cpf1酶的啟動子元件;增強表現的5'非翻譯區;在某些細胞
諸如單子葉植物細胞內進一步增強表現的內含子元件;提供了用於插入指導RNA和/或Cpf1基因序列以及其他希望的元件的便利限制性位點的多株位點;以及提供對表現轉錄物的有效終止的3'非翻譯區。
表現系統的元件可以是處於一個或多個表現構建體上,該一個或多個表現構建體係環狀的,諸如質粒或轉化載體,或者是非環狀的,諸如線性雙股DNA。
在一個特定實施方式中,Cfp1 CRISPR表現系統包含至少:
(a)編碼與植物中的靶序列雜交的指導RNA(gRNA)的核苷酸序列,並且其中該指導RNA包含指導序列和同向重複序列,以及
(b)編碼Cpf1蛋白的核苷酸序列,
其中組分(a)或(b)位於相同或不同構建體上,並且由此不同核苷酸序列可以處於植物細胞內可操作的相同或不同調節元件的控制下。
含有Cpf1 CRISPR系統的組分的一個或多個DNA構建體和(在適用情況下)模板序列可以藉由多種常規技術引入到植物、植物部分或植物細胞的基因組中。該過程大體上包括以下步驟:選擇一適合的宿主細胞或宿主組織、將該一個或多個構建體引入到該宿主細胞或宿主組織中、以及由其再生植物細胞或植物。
在特定實施方式中,DNA構建體可以使用諸如但不限於電穿孔、微注射、植物細胞原生質體的氣溶膠波束注射來引入到植物細胞中,或者DNA構建體可以使用基因槍方法諸如DNA粒子轟擊來直接引入到植物組織(還參見,付(Fu)等人,轉基因研究(Transgenic Res.)2000年2月;9(1):11-9)。粒子轟擊的基礎係使包覆有感興趣的一種或多種基因的粒子朝向細胞加速,從而導致粒子穿透原生質並且典型地穩定整合到基因組中。(例如,參見克萊因(Klein)等人,自然(1987);克萊因等人,生物/技術(Bio/Technology)(1992);卡薩斯(Casas)等人,美國國家科學院院刊(1993).)。
在特定實施方式中,含有Cpf1 CRISPR系統組分的DNA構建體可以是藉由土壤桿菌介導的轉化引入到該植物中。該DNA構建體可以與適合T-DNA側翼區組合並且被引入到常規根瘤土壤桿菌宿主載體中。外源DNA可以是藉由感染植物或藉由將植物原生質體與含有一個或多個Ti(根瘤誘導)質粒的土壤桿菌一起培育來結合到植物基因組中。(例如,參見弗拉麗(Fraley)等人,(1985);羅傑斯(Rogers)等人,(1987);以及美國專利案號5,563,055)。
植物啟動子
為了確保植物細胞內的適當表現,在此描述的Cpf1 CRISPR系統的組分典型地是置於植物啟動子即植物細胞內可操作的啟動子的控制下。設想使用不同類型的啟動子。
植物組成型啟動子係能夠表現它在所有或幾乎所有
植物組織中在植物的所有或幾乎所有發育階段過程中控制的開放讀碼框(ORF)的啟動子(稱為“組成型表現”)。組成型啟動子的一個非限制性實例係花椰菜花葉病毒35S啟動子。“調節型啟動子”係指不以組成性方式而是以時間和/或空間調節方式引導基因表現的啟動子並且包括組織特異型啟動子、組織優選型啟動子和誘導型啟動子。不同啟動子可以在不同組織或細胞類型中、或在不同發育階段、或響應於不同環境條件來引導基因表現。在特定實施方式中,一種或多種Cpf1 CRISPR組分在組成型啟動子諸如花椰菜花葉病毒35S啟動子的控制下表現,組織優選型啟動子可以用於靶向在特定植物組織內的某些細胞類型,例如葉或根的維管細胞或種子的特定細胞內的增強的表現。用於Cpf1 CRISPR系統的特定啟動子的實例可見於川又(Kawamata)等人,(1997)植物細胞生理學(Plant Cell Physiol)38:792-803;山本(Yamamoto)等人,(1997)植物雜誌(Plant J)12:255-65;海厄(Hire)等人,(1992)植物分子生物學(Plant Mol Biol)20:207-18;庫斯特(Kuster)等人,(1995)植物分子生物學29:759-72;以及卡帕那(Capana)等人,(1994)植物分子生物學25:681-91。
允許時間空間控制基因編輯或基因表現的誘導型啟動子的實例可以使用能量形式。能量形式可以包括但不限於,聲能、電磁輻射、化學能和/或熱能。誘導型系統的實例包括四環素誘導型啟動子(Tet-On或Tet-Off)、小分子雙雜交轉錄啟動系統(FKBP、ABA等)、或光誘導型系統(光敏色素、LOV結構域或隱花色素),諸如以序列特異性方式引導轉錄活性改變的光誘導型轉錄效應物(LITE)。光誘導型系統的組分可以包括Cpf1 CRISPR酶、
光反應性細胞色素異源二聚體(例如,來自阿拉伯芥)、以及轉錄啟動/阻遏結構域。誘導型DNA結合蛋白及其使用方法的其他實例提供於US 61/736465和US 61/721,283中,該等專利藉由引用以其整體結合在此。
在特定實施方式中,暫態表現或誘導型表現可以是藉由使用例如化學品調節啟動子來實現的,即由此外源性化學品的應用誘導基因表現。基因表現的調節可以是藉由化學物阻抑型啟動子來獲得,其中化學物的應用阻遏基因表現。化學品誘導型啟動子包括但不限於,由苯磺醯胺除草劑安全劑啟動的玉米ln2-2啟動子(德.威力德爾(De Veylder)等人,(1997)植物細胞生理學38:568-77)、由用作苗前除草劑的疏水性親電子化合物啟動的玉米GST啟動子(GST-11-27,WO93/01294)、以及由水楊酸啟動的煙草PR-1啟動子(奧諾(Ono)等人,(2004)生物科學、生物技術和生物化學(Biosci Biotechnol Biochem)68:803-7)。在此還可以使用藉由抗生素調節的啟動子,諸如四環素誘導型啟動子和四環素阻抑型啟動子(加茨(Gatz)等人,(1991)分子遺傳學和普通遺傳學(Mol Gen Genet)227:229-37;美國專利案號5,814,618和5,789,156)。
特定植物細胞器中的易位和/表現
表現系統可以包含在特定植物細胞器中易位和/或表現的元件。
葉綠體靶向
在特定實施方式中,設想的是Cpf1 CRISPR系統用於特別修飾葉綠體基因或者確保葉綠體中表現。出於此目的,使用葉綠體轉化方法或者將Cpf1 CRISPR組分區室化至葉綠體的方法。例如,在質粒基因組中遺傳修飾的引入可以減少生物安全性問題,諸如藉由花粉的基因流。
葉綠體轉化方法係本領域已知的並且包括粒子轟擊、PEG處理和微注射。另外,涉及轉化盒從核基因組易位到質粒的方法可以如WO2010061186所述地使用。
可替代地,設想的是,將一種或多種Cpf1 CRISPR組分靶向植物葉綠體。這係藉由在表現構建體中結合編碼葉綠體轉運肽(CTP)或質體轉運肽的序列來實現的,該序列可操作地連接至編碼Cpf1蛋白的序列的5’區。在易位到葉綠體中的過程中,在處理步驟中去除CTP。表現蛋白的葉綠體靶向係技術人員已熟知的(例如,參見蛋白質轉運到葉綠體中(Protein Transport into Chloroplasts),2010,植物生物學年評(Annual Review of Plant Biology),第61卷:157-180)。在此類實施方式中,還希望將指導RNA靶向植物葉綠體。例如在US 20040142476中描述了可以用於借助於葉綠體定位序列來將指導RNA易位到葉綠體中的方法和構建體,該專利藉由引用結合在此。構建體的此類變型可以結合到本發明的表現系統中,以有效易位Cpf1-指導RNA。
在藻類細胞中引入編碼CRISPR-Cpf1系統的多核苷酸。
轉基因藻類(或其他植物諸如芸苔)可以特別適用於生產植物油或生物燃料諸如醇(具體地是甲醇和乙醇)或其他產
品。該等藻類可以被工程化以表現或過量表現用於油或生物燃料工業中的高水平油或醇。
US 8945839描述了一種用於使用Cas9工程化微藻(萊茵衣藻細胞)種類)的方法。使用類似工具,在此所述的Cpf1 CRISPR系統的方法可以應用於衣藻屬種類和其他藻類上。在特定實施方式中,Cpf1和指導RNA引入使用載體表現的藻類中,該載體在組成型啟動子的控制下表現Cpf1,諸如Hsp70A-Rbc S2或βBeta2-微管蛋白。指導RNA視情況使用含有T7啟動子的載體遞送。可替代地,Cas9 mRNA和體外轉錄的指導RNA可以是遞送至藻類細胞中。電穿孔方法對於技術人員而言是可用的,諸如來自基因領域衣藻屬工程化套組(GeneArt Chlamydomonas Engineering kit)的標準推薦方法。
在特定實施方式中,在此使用的內切核酸酶係拆分的Cpf1酶。拆分的Cpf1酶優先用於藻類中以進行靶向基因組修飾,如在WO 2015086795中對於Cas9已描述的。使用Cpf1拆分系統係特別適用於基因組靶向的誘導型方法,並且避免了藻類細胞中Cpf1過量表現的潛在毒性作用。在特定實施方式中,所述Cpf1拆分結構域(RuvC和HNH結構域)可以同時或依次引入到細胞中,以使得所述一個或多個拆分的Cpf1結構域具有藻類細胞中的靶核酸序列。拆分的Cpf1與野生型Cpf1相比減小的尺寸允許使用將CRISPR系統遞送至細胞的其他方法,諸如使用如在此所述的細胞穿透肽。用於生成遺傳修飾性藻類的此方法係特別感興趣的。
在酵母細胞中引入編碼Cpf1組分的多核苷酸。
在特定實施方式中,本發明涉及使用Cpf1 CRISPR系統進行酵母細胞的基因組編輯。用於轉化可用於引入編碼Cpf1 CRISPR系統組分的多核苷酸的酵母細胞的方法係技術人員已熟知的並藉由河合(Kawai)等人,2010,生物工程缺陷(Bioeng Bugs.),2010年11月-12月;1(6):395-403)。非限制性實例包括藉由乙酸鋰處理(可以進一步包括攜帶者DNA和PEG處理)、轟擊或藉由電穿孔來轉化酵母細胞。
在植物和植物細胞中暫態表現Cpf1 CRISP系統組分
在特定實施方式中,設想的是,在植物細胞中暫態表現指導RNA和/或Cpf1基因。在該等實施方式中,Cpf1 CRISPR系統可以確保僅當指導RNA和Cpf1蛋白二者均存在於細胞中時修飾靶基因,以使得基因組修飾可以得到進一步控制。當Cpf1酶的表現係暫態的時,由此類植物細胞再生的植物典型地不含有外源DNA。在特定實施方式中,Cpf1酶係由植物細胞穩定表現的並且指導序列係暫態表現的。
在特定實施方式中,Cpf1 CRISPR系統組分可以是使用植物病毒載體引入在植物細胞中(蘇爾他弗(Scholthof)等人,1996,植物病理學年度評審(Annu Rev Phytopathol.)1996;34:299-323)。在另外的特定實施方式中,所述病毒載體係來自DNA病毒的載體。例如,雙粒病毒組(例如,捲心菜曲葉病毒、豆黃矮病毒、小麥矮化病毒、番茄曲葉病毒、玉米條紋病毒、煙草曲葉病毒或番茄金色花葉病毒)或矮縮病毒組(例如蠶豆壞死黃脈病毒)。在另外的特定實施方式中,所述病毒載體係來自RNA病毒的載體。
例如,煙草脆裂病毒組(例如,煙草擾亂病毒、煙草花葉病毒)、馬鈴薯X病毒組(例如,馬鈴薯X病毒)、或大麥病毒組(例如,大麥條紋花葉病毒)。植物病毒複製基因組係非整合型載體。
在特定實施方式中,用於暫態表現Cpf1 CRISPR構建體的載體例如是pEAQ載體,該載體被專門定制用於在原生質體中進行土壤桿菌介導的暫態表現(塞恩思伯裡.F.(Sainsbury F.)等人,植物生物技術雜誌(Plant Biotechnol J.),2009年9月;7(7):682-93)。使用修飾的捲心菜曲葉病毒(CaLCuV)載體證明基因組位置的精確靶向,以在表現CRISPR酶的穩定轉基因植物中表現gRNA(科技報告(Scientific Reports)5,文章編號:14926(2015),doi:10.1038/srep14926)。
在特定實施方式中,編碼指導RNA和/或Cpf1基因的雙股DNA片段可以被暫態引入到植物細胞中。在此類實施方式中,以足夠的量提供引入的雙股DNA片段以修飾細胞,但在預期時間段過去之後或者在一次或多次細胞分裂之後不再持續。用於在植物中直接DNA轉移的方法係技術人員已知的(例如,參見大衛(Davey)等人,植物分子生物學,1989年9月;13(3):273-85。)
在其他實施方式中,編碼Cpf1蛋白的RNA多核苷酸被引入到植物細胞中,然後藉由生成足夠量的蛋白質的宿主細胞翻譯並加工以修飾該細胞(在至少一個指導RNA存在下),該引入在預期時間段過去之後或者在一次或多次細胞分裂之後不再持續。用於將mRNA引入到植物原生質體以進行暫態表現的方法係技術人員已知的(例如,參見加利耶(Gallie),植物細胞報告(Plant
Cell Reports)(1993),13;119-122)。
還設想了以上描述的不同方法的組合。
將Cpf1 CRISPR組分遞送至植物細胞
在特定實施方式中,感興趣的是將Cpf1 CRISPR系統的一種或多種組分直接遞送至植物細胞。這尤其對於生成非轉基因植物係感興趣的(參見下文)。在特定實施方式中,在植物或植物細胞外製備一種或多種Cpf1組分並且將該一種或多種Cpf1組分遞送至細胞。例如,在特定實施方式中,體外製備Cpf1蛋白,之後引入到植物細胞中。Cpf1蛋白可以是藉由熟習該項技術者已知的不同方法來製備並且包括重組產生。在表現之後,Cpf1蛋白被分離,在需要時被折疊,被純化並視情況處理以去除任何純化標籤諸如His-標籤。一旦獲得粗的、部分純化的、或更完全純化的Cpf1蛋白,就可以將該蛋白引入到植物細胞中。
在特定實施方式中,該Cpf1蛋白與靶向感興趣的基因的指導RNA混合,以形成預組裝的核糖核蛋白。
單獨組分或預組裝核糖核蛋白可以經由電穿孔、藉由用Cpf1相關基因產品包覆的粒子轟擊、藉由化學轉染或藉由轉運穿過細胞膜的一些其他方式來引入到植物細胞中。例如,已證明用預組裝CRISPR核糖核蛋白轉染植物原生質體確保了植物基因組的靶向修飾(如藉由吳(Woo)等人,自然生物技術,2015;DOI:10.1038/nbt.3389所述的)。
在特定實施方式中,Cpf1 CRISPR系統組分係使用奈
米粒子引入到植物細胞中。該等組分,無論是蛋白質或核酸或其組合都可以上載到奈米粒子上或包裝在奈米粒子中並且適用於該等植物(例如像WO 2008042156和US 20130185823所述的)。具體地說,本發明的實施方式包括上載有以下各項或包裝有以下各項的奈米粒子:編碼Cpf1蛋白的一個或多個DNA分子、編碼指導RNA的DNA分子和/或如WO2015089419所述的分離的指導RNA。
將Cpf1 CRISPR系統的一種或多種組分引入到植物細胞中的其他方式係藉由使用細胞穿透肽(CPP)。因此,在特定實施方式中,本發明包括含有連接至Cpf1蛋白的細胞穿透肽的組成物。在本發明的特定實施方式中,Cpf1蛋白和/或指導RNA連接一個或多個CPP,以在植物原生質體內有效轉運它們;還參見 羅摩克裡希納(Ramakrishna)(20140基因組研究(Genome Res.),2014年6月;24(6):1020-7,人類細胞中的Cas9(Cas9 in human cells))。在其他實施方式中,該Cpf1基因和/或指導RNA係藉由連接至一個或多個CPP以進行植物原生質體遞送的一個或多個環狀或非環狀DNA分子來編碼。該等植物原生質體然後再生成植物細胞並進一步再生成植物。CPP通常被描述為來源於蛋白質或來源於能夠以受體獨立性方式轉運生物分子穿過細胞膜的嵌合序列的小於35個胺基酸的短肽。CPP可以是陽離子肽、具有疏水性序列的肽、兩親性肽、具有脯胺酸富集序列和抗微生物序列的肽、以及嵌合肽或二分肽(普吉(Pooga)和朗格爾(Langel)2005)。CPP能夠穿透生物膜並且同樣引發不同生物分子移動穿過細胞膜進入細胞質並改進其細胞內路線,並且因此有助於生物分子與靶標相互作用。CPP的實例包括其他各項:Tat(它係一種1型HIV進行病
毒複製所需要的核轉錄啟動蛋白)、穿膜肽、卡波西成纖維細胞增長因子(FGF)信號肽序列、整聯蛋白β3信號肽序列;聚精胺酸肽Args序列、富含鳥嘌呤分子轉運體、甜箭頭肽等...
使用Cpf1 CRISPR系統製備遺傳修飾的非轉基因植物
在特定實施方式中,在此所述的方法用於修飾內源性基因或修飾其表現而不會永久性引入到任何外源性基因的植物的基因組中,包括編碼CRISPR組分的外源性基因,以便避免在植物基因組中存在外源DNA。這可能是感興趣的,因為非轉基因植物的調節要求較不嚴格。
在特定實施方式中,這係藉由Cpf1 CRISPR組分的暫態表現來保證的。在特定實施方式中,一種或多種Cpf1 CRISPR組分係在一種或多種病毒載體上表現的,該一種或多種表現載體產生足夠的Cpf1蛋白和指導RNA,以一致地穩定地確保根據在此所述的方法修飾感興趣的基因。
在特定實施方式中,在植物原生質體中確保Cpf1 CRISPR構建體的暫態表現並且因此該構建體並未整合到基因組中。有限表現窗可以足以允許Cpf1 CRISPR系統確保如在此所述的靶基因的修飾。
在特定實施方式中,Cpf1 CRISPR系統的不同組分借助於上文所述的粒子遞送分子諸如奈米粒子或CPP分子單獨或混合地引入在植物細胞、原生質體或植物組織中。
Cpf1 CRISPR組分的表現可以藉由Cpf1核酸酶的直
接活性和視情況引入模板DNA或者藉由修飾使用如在此所述的Cpf1 CRISPR系統靶向的基因來誘導基因組的靶向修飾。上文所述的不同策略允許Cpf1介導的靶向基因組編輯而不需要將Cpf1 CRISPR組分引入到植物基因組中。暫態引入到植物細胞中的組分典型地在雜交時去除。
檢測植物基因組選擇標記物的修飾
在特定實施方式中,當方法涉及植物基因組內源性靶基因的修飾時,任何適合的方法可以用於在植物、植物部分或植物細胞用Cpf1 CRISPR系統感染或轉染之後確定基因靶向或靶向誘變是否發生在靶位點。在該方法涉及靶基因引入的情況下,轉化的植物細胞、愈傷組識、組織或植物可以是藉由選擇或篩選存在轉基因或由轉基因編碼的性狀的工程化植物材料來鑒定和分離。物理方法和生物化學方法可以用於鑒定含有插入的基因構建體或內源性DNA修飾的植物或植物細胞轉化株。該等方法包括但不限於:1)用於檢測並確定重組DNA插入物或修飾的內源性基因的結構的dna印跡分析或PCR擴增;2)用於檢測並檢查基因構建體的RNA轉錄物的rna印跡、S1 RNA酶保護、引物延伸或逆轉錄酶PCR擴增;3)用於檢測酶或核糖核酸酶的酶法測定,其中此類基因產物係由基因構建體編碼的或者表現受到遺傳修飾的影響;4)蛋白質凝膠電泳、西方墨點技術、免疫沈澱反應或酶聯免疫分析,其中基因構建體或內源性基因產物係蛋白質。附加技術諸如原位雜交、酶染色以及免疫染色也可以用於檢測重組構建體的存在或表現或者檢測特定植物器官和組織中的內源性基因修飾。用於完成
所有該等測定的方法係熟習該項技術者熟知的。
另外地(或者可替代地),編碼Cpf1 CRISPR組分的表現系統典型地被設計為包含一種或多種選擇標記物或可檢測標記物,該等標記物提供一種分離或有效選擇含有Cpf1 CRISPR系統並且/或者已在早期階段且以大規模地被該系統修飾的細胞的方式。
在土壤桿菌介導的轉化的情況下,標記物盒可以與側接T-DNA邊界相鄰或處於該等邊界之間並且包含在二元載體之內。在另一個實施方式中,標記物盒可以處於T-DNA之外。選擇標記物盒也可以處於與表現盒相同的T-DNA邊界內或與該等邊界相鄰或者可以處於二元載體上的第二T-DNA內的其他位置處(例如,2 T-DNA系統)。
對於粒子轟擊或使用原生質體轉化,表現系統可以包含一種或多種分離的線性片段或者可以是含有細菌複製元件、細菌選擇標記物或其他可檢測元件的較大構建體的一部分。包含編碼指導序列和/或Cpf1的多核苷酸的這個或該等表現盒可以是物理連接至標記物盒或者可以是與編碼標記物盒的第二核酸分子混合。標記物盒包含表現允許有效選擇轉化細胞的可檢測標記物或選擇標記物的必需元件。
基於選擇標記物的細胞選擇程序將取決於標記物基因的性質。在特定實施方式中,使用選擇標記物,即允許基於標記物的表現直接選擇細胞的標記物。選擇標記物可以賦予陽性選擇或陰性選擇並且對於外部底物的存在係有條件的或沒有條件的(米琪(Miki)等人2004,107(3):193-232)。常見地,將抗生素或
除草劑抗性基因用作標記物,由此藉由在含有抑制量的抗生素或除草劑(標記物基因對其賦予抗性)的培養基上生長工程化植物材料來進行選擇。此類細菌的實例係對抗生素諸如潮黴素(hpt)和潮黴素(nptII)賦予抗性的基因和對除草劑諸如草銨膦(bar)和氯磺隆(als)賦予抗性的基因,
轉化植物和植物細胞也可以藉由篩選可見標記物,典型地為能夠處理有色底物(例如,β-葡糖醛酸糖苷酶、螢蟲素酶、B或C1基因)的活性來鑒定的。此類選擇和篩選方法係熟習該項技術者所熟知的。
植物培養和再生
在特定實施方式中,具有修飾基因組並且藉由在此所述的任何方法產生或獲得的植物細胞可以被培養至再生成具有轉化或修飾表型並因此具有所希望的表型的全株。常規再生技術係熟習該項技術者熟知的。此類再生技術的特定實例依賴於組織培養生長培養基中某些植物激素的操縱,並且典型地依賴於已與所希望的核苷酸序列一起引入的殺生物劑和/或除草劑標記物。在另外的特定實施方式中,植物再生係從培養的原生質體、植物愈傷組織、外植體、器官、花粉、胚胎或其部分獲得的(例如,參見埃文斯(Evans)等人(1983),植物細胞培養手冊(Handbook of Plant Cell Culture),克萊(Klee)等人(1987)植物生物學年評(Ann.Rev.of Plant Phys.))。
在特定實施方式中,如在此所述的轉化或改進的植物可以自體受精以提供本發明的純合改進植物(對於DNA修飾係純
合的)種子,或者可以與非轉基因植物或不同的改進植物雜交以提供純合植物的種子。當重組DNA引入到植物細胞中時,這種雜交所得植物係對於重組DNA分子為雜合的植物。藉由與改進植物雜交並包含遺傳修飾(可以是重組DNA)的此類純合植物和雜合植物在此被稱為“子代”。子代植物係從原始轉基因植物傳代並且含有藉由在此提供的方法引入的基因組修飾或重組DNA分子的植物。可替代地,遺傳修飾植物可以是藉由以上所述方法之一使用Cfp1酶來獲得的,因此無外源DNA結合到該基因組中。藉由進一步育種獲得的此類植物的子代也可以含有遺傳修飾。育種係藉由常用於不同農作物的任何育種方法來進行(例如,阿拉爾(Allard),植物育種原則(Principles of Plant Breeding),紐約約翰威立國際出版公司(John Wiley & Sons,NY,U.of CA),美國加利福尼亞州大衛斯(Davis,CA)50-98(1960)。
生成具有增強的農藝性狀的植物
在此提供的基於Cpf1的CRISPR系統可以用於引入靶向雙股或單股斷裂並且/或者引入基因活化物和或阻遏物並且(不限於)可以用於基因靶向、基因置換、靶向誘變、靶向缺失或插入、靶向倒位和/或靶向易位。藉由在單個細胞中共表現涉及實現多個修飾的多個靶向RNA,可以確保多重基因組修飾。此技術可以用於高度精確工程化植物以使其具有改進的特徵,包括增強的營養品質、增加的對疾病的抗性和對生物和非生物脅迫的抗性、以及增加的有商業價值的植物產品或異源化合物的產生。
在特定實施方式中,如在此所述的Cpf1 CRISPR系統
可以用於在內源性DNA序列中引入靶向雙股斷裂(DSB)。該DSB啟動細胞DNA修復途徑,該修復途徑可以用於實現所希望的斷裂位點附近的DNA序列修飾。當內源性基因失活可以賦予或促成所希望的性狀時,這係感興趣的。在特定實施方式中,在DSB位點處促成使用模板序列的同源重組,以便引入感興趣的基因。
在特定實施方式中,Cpf1 CRISPR系統可以用作融合至或可操作地連接至功能結構域以啟動和/或阻遏內源性植物基因的通用核酸結合蛋白。示例性功能結構域可以包括但不限於,翻譯起始區、翻譯活化物、翻譯阻遏物、核酸酶(具體地是核糖核酸酶)、剪接體、珠粒、光誘導型/控制型結構域或化學誘導型/控制型結構域。典型地,在該等實施方式中,該Cpf1蛋白包含至少一個突變,以使得它具有不超過不具有該至少一個突變的Cpf1蛋白的活性的5%的活性;指導RNA包含能夠與靶序列雜交的指導序列。
在此所述的方法通常導致生成“改進植物”,在這點上它們與野生型植物相比具有一種或多種希望的性狀。在特定實施方式中,獲得的該等植物、植物細胞或植物部分係包含整合到所有或部分植物細胞的基因組中的內源性DNA序列的轉基因植物。在特定實施方式中,獲得非轉基因遺傳修飾植物、植物部分或細胞,在這點上沒有內源性DNA序列結合到植物的任何植物細胞的基因組中。在此類實施方式中,改進植物係非轉基因的。當僅確保內源性基因的修飾並且在植物基因組中未引入或維持外源性基因時,所得遺傳修飾農作物不含有外源基因並且因此可以基本上
認為是非轉基因的。在下文中更詳細地描述了用於植物基因組編輯的Cpf1 CRISPR系統的不同應用:
a)引入一種或多種外源基因以賦予一感興趣的農藝性狀
本發明提供了基因組編輯或修飾與感興趣的靶座位相關聯的或在該靶座位處的序列之方法,其中該方法包括將Cpf1效應蛋白複合物引入到植物細胞中,由此Cpf1效應蛋白複合物有效地用於將DNA插入物(例如編碼感興趣的外源基因的插入物)整合到植物細胞的基因組中。在較佳的實施方式中,DNA插入物的整合係藉由用外源引入的DNA模板或修復模板進行HR來促成的。典型地,外源引入的DNA模板或修復模板與Cpf1效應蛋白複合物或一組分或用於表現複合物組分的多核苷酸載體一起來遞送。
在此提供的Cpf1 CRISPR系統允許靶向基因遞送。已經越來越清楚的是,表現感興趣的基因的效率在很大程度上是由整合到基因組中的位置來確定的。本發明方法允許將外源基因靶向整合到基因組中希望的位置處。該位置可以是基於先前生成事件的資訊來選擇的或者可以藉由在此任何位置揭露的方法來選擇的。
在特定實施方式中,在此提供的方法包括(a)將包含指導RNA(包含同向重複序列和指導序列)的Cpf1 CRISPR複合物引入到細胞中,其中該指導序列與植物細胞內源性靶序列雜交;(b)將在指導序列與靶序列雜交時與指導RNA複合並且誘導處於或靠近指導序列所靶向的序列的雙股斷裂的Cpf1效應分子引入到該植物細胞中;並且(c)將編碼HDR修復模板的核苷酸序列引入到細胞中,該修復模板編碼感興趣的基因並且作為HDR的結果被
引入到DS斷裂位置中。在特定實施方式中,引入的步驟可以包括將編碼Cpf1效應蛋白、指導RNA和修復模板的一個或多個多核苷酸遞送到植物細胞中。在特定實施方式中,該等多核苷酸係藉由DNA病毒(例如,雙粒病毒組)或RNA病毒(例如,煙草脆裂病毒組)來遞送到細胞中的。在特定實施方式中,引入步驟包括將含有編碼Cpf1效應蛋白、指導RNA和修復模板的一個或多個多核苷酸序列的T-DNA遞送到植物細胞中,其中該遞送係經由土壤桿菌。編碼Cpf1效應蛋白的核酸序列可以是可操作地連接至啟動子,諸如組成型啟動子(例如,花椰菜花葉病毒35S啟動子)或細胞特異型或誘導型啟動子。在特定實施方式中,多核苷酸係藉由微粒轟擊來引入的。在特定實施方式中,該方法進一步包括在引入步驟後篩選植物細胞,以確定是否引入修復模板,即模板基因。在特定實施方式中,該等方法包括由植物細胞再生植物的步驟。在另外的實施方式中,該等方法包括雜交育種該植物以獲得遺傳上希望的植物譜系。編碼感興趣的性狀的外源基因的實例列出在下文中。
b)編輯內源性基因以賦予感興趣的農藝性狀
本發明提供了基因組編輯或修飾與感興趣的靶座位相關聯的或在該靶座位處的序列之方法,其中該方法包括將Cpf1效應蛋白複合物引入到植物細胞中,由此Cpf1效應蛋白複合物修飾植物內源性基因的表現。這可以不同方式來實現。在特定實施方式中,消除內源性基因的表現係希望的並且使用Cpf1 CRISPR複合物靶向並裂解內源性基因,以便修飾基因表現。在該等實施方
式中,在此提供的方法包括(a)將包含指導RNA(包含同向重複序列和指導序列)的Cpf1 CRISPR複合物引入到植物細胞中,其中該指導序列與植物細胞基因組的感興趣的基因內的靶序列雜交;並且(b)將Cpf1效應分子引入到該細胞中,當結合指導RNA時,該效應蛋白包含與靶序列雜交、確保處於或靠近指導序列所靶向的序列的雙股斷裂的指導序列;在特定實施方式中,引入的步驟可以包括將編碼Cpf1效應蛋白和指導RNA的一個或多個多核苷酸遞送到植物細胞中。
在特定實施方式中,該等多核苷酸係藉由DNA病毒(例如,雙粒病毒組)或RNA病毒(例如,煙草脆裂病毒組)來遞送到細胞中的。在特定實施方式中,引入步驟包括將含有編碼Cpf1效應蛋白和指導RNA的一個或多個多核苷酸序列的T-DNA遞送到植物細胞中,其中該遞送係經由土壤桿菌。編碼Cpf1 CRISPR系統組分的多核苷酸序列可以是可操作地連接至啟動子,諸如組成型啟動子(例如,花椰菜花葉病毒35S啟動子)或細胞特異型或誘導型啟動子。在特定實施方式中,多核苷酸係藉由微粒轟擊來引入的。在特定實施方式中,該方法進一步包括在引入步驟後篩選植物細胞,以確定是否修飾感興趣的基因的表現。在特定實施方式中,該等方法包括由植物細胞再生植物的步驟。在另外的實施方式中,該等方法包括雜交育種該植物以獲得遺傳上希望的植物譜系。
在以上所述方法的特定實施方式中,抗病性農作物係藉由靶向突變疾病易感性基因或編碼植物防衛基因的負調節物的
基因(例如,Mlo基因)來獲得的。在一特定實施方式中,抗除草劑農作物係藉由靶向取代植物基因諸如編碼乙醯乳酸合酶(ALS)和原卟啉原氧化酶(PPO)的基因的特定核苷酸來生成的。在特定實施方式中,藉由靶向突變編碼非生物脅迫耐受性的負調節物的基因而產生的乾旱耐鹽農作物、藉由靶向突變Waxy基因而產生的低直鏈澱粉穀物、藉由靶向突變糊粉層中的主要脂肪酶基因而產生的具有降低的酸敗性的稻穀或其他穀物等。在特定實施方式中,編碼感興趣的性狀的內源性基因的更廣泛列表列出在下文中。
c)藉由Cpf1 CRISPR系統調節內源性基因以賦予感興趣的農藝性狀
在此還提供了用於使用在此提供的Cpf1蛋白調節(即,啟動或阻遏)內源性基因表現的方法。此類方法利用藉由Cpf1複合物靶向植物基因組的一個或多個不同RNA序列。更具體地說,一個或多個不同RNA序列結合兩個或更多個轉接蛋白(例如,適配體),由此每個轉接蛋白與一個或多個功能結構域締合並且其中與該轉接蛋白締合的一個或多個結構域中的至少一個功能結構域具有一種或多種活性,包括修飾烷酶活性、去甲酶活性、轉錄啟動活性、轉錄阻遏活性、轉錄釋放因子活性、組蛋白修飾活性、DNA整合活性、RNA切割活性、DNA切割活性或核酸結合活性。該等功能結構域用於調控內源性植物基因的表現以便獲得所希望的性狀。典型地,在該等實施方式中,該Cpf1蛋白具有一個或多個突變,以使得它具有不超過不具有該至少一個突變的Cpf1效應蛋白的核酸酶活性的5%的核酸酶活性。
在特定實施方式中,在此提供的方法包括以下步驟:(a)將包含指導RNA(包含同向重複序列和指導序列)的Cpf1 CRISPR複合物引入到細胞中,其中該指導序列與植物細胞內源性靶序列雜交;(b)將在指導序列與靶序列雜交時與指導RNA複合的Cpf1效應分子引入到植物細胞中;並且其中指導RNA被修飾為包含結合功能結構域的不同RNA序列(適配體)和/或Cpf1效應蛋白被修飾為使得它連接至功能結構域。在特定實施方式中,引入的步驟可以包括將編碼(修飾的)Cpf1效應蛋白和(修飾的)指導RNA的一個或多個多核苷酸遞送到植物細胞中。在此任何位置處描述了用於該等方法中的Cpf1 CRISPR系統組分的詳情。
在特定實施方式中,該等多核苷酸係藉由DNA病毒(例如,雙粒病毒組)或RNA病毒(例如,煙草脆裂病毒組)來遞送到細胞中的。在特定實施方式中,引入步驟包括將含有編碼Cpf1效應蛋白和指導RNA的一個或多個多核苷酸序列的T-DNA遞送到植物細胞中,其中該遞送係經由土壤桿菌。編碼Cpf1 CRISPR系統的一種或多種組分的核酸序列可以是可操作地連接至啟動子,諸如組成型啟動子(例如,花椰菜花葉病毒35S啟動子)或細胞特異型或誘導型啟動子。在特定實施方式中,多核苷酸係藉由微粒轟擊來引入的。在特定實施方式中,該方法進一步包括在引入步驟後篩選植物細胞,以確定是否修飾感興趣的基因的表現。在特定實施方式中,該等方法包括由植物細胞再生植物的步驟。在另外的實施方式中,該等方法包括雜交育種該植物以獲得遺傳上希望的植物譜系。編碼感興趣的性狀的內源性基因的更廣泛列表列出在下文中。
使用Cpf1修飾多倍體植物
許多植物係多倍體,這意味著它們攜帶其基因組的複製拷貝,有時多至六個,像在小麥中。根據本發明利用Cpf1 CRISPR效應蛋白的方法可以“多重”影響基因的所有拷貝或者一次靶向許多基因。例如,在特定實施方式中,本發明的方法用於同時確保不同基因中負責抑制針對疾病的防衛的失功能突變。在特定實施方式中,本發明的方法用於同時抑制小麥植物細胞內TaMLO-Al、TaMLO-Bl和TaMLO-Dl核酸序列的表現並且由該細胞再生小麥植物,以便確保該小麥植物抵抗白粉病(還參見WO2015109752)。
賦予農藝性狀
如上文所述的,在特定實施方式中,本發明涵蓋如在此所述的Cpf1 CRISPR用於插入感興趣的DNA(包括一個或多個植物可表現基因)的用途。在另外的特定實施方式中,本發明涵蓋使用如在此所述的Cpf1系統用於部分或完全缺失一個或多個植物表現基因的方法和工具。在另外的特定實施方式中,本發明涵蓋使用如在此所述的Cpf1系統確保一種或多種植物表現基因藉由突變、驅動、插入一個或多個核苷酸來修飾的方法和工具。在另外的特定實施方式中,本發明涵蓋如在此所述的Cpf1 CRISPR系統確保藉由特定修飾引導一個或多個植物表現基因的表現的一種或多種調節元件來修飾所述基因的表現。
在特定實施方式中,本發明涵蓋涉及引入內源性基因和/或靶向內源性基因以及其調節元件的方法,諸如以下列出的基因:
1.賦予對害蟲或疾病的抗性的基因:
‧植物疾病抗性基因。植物可以用選殖的抗性基因轉化以工程化對特定病原體菌株具有抗性的植物。參見,例如,鐘斯(Jones)等人,科學266:789(1994)(對黃枝孢黴的抗性的番茄Cf-9基因的選殖(cloning of the tomato Cf-9 gene for resistance to Cladosporium fulvum));馬丁(Martin)等人,科學262:1432(1993)(對丁香假單胞菌番茄致病變種的抗性的番茄Pto基因編碼蛋白激酶(tomato Pto gene for resistance to Pseudomonas syringae pv.tomato encodes a protein kinase));麥德瑞諾斯(Mindrinos)等人,細胞78:1089(1994)(擬南芥可以是對丁香假單胞菌的抗性的RSP2基因(Arabidopsmay be RSP2 gene for resistance to Pseudomonas syringae))。
‧賦予對害蟲諸如大豆囊胞線蟲的抗性的基因。例如,參見PCT公開號96/30517;PCT申請WO 93/19181。
‧蘇雲金芽孢桿菌蛋白,例如,參見,熱塞(Geiser)等人,基因48:109(1986)。
‧凝集素,例如,參見,凡.達默(Van Damme)等人,植物分子生物學24:25(1994。
‧維生素結合蛋白,諸如抗生物素蛋白,參見PCT申請US93/06487,該申請教授了抗生物素蛋白和抗生物素蛋白同源物作為針對害蟲的殺幼蟲劑的用途。
‧酶抑制劑諸如蛋白酶或朊酶抑制劑或澱粉酶抑制劑。參
見,例如,亞伯(Abe)等人,生物化學雜誌262:16793(1987);赫伯(Huub)等人,植物分子生物學21:985(1993),角穀(Sumitani)等人,生物科學、生物技術和生物化學57:1243(1993)以及美國專利案號5,494,813。
‧昆蟲特有的激素或資訊素,諸如蛻皮甾類或保幼激素、或其變體、基於它的模擬物、或其拮抗劑或激動劑。參見,例如,哈莫克(Hammock)等人,自然344:458(1990)。
‧昆蟲特有的肽或神經肽,該等肽在表現時破壞受影響害蟲的生理學。例如,雷根(Regan),生物化學雜誌269:9(1994)以及普拉特(Pratt)等人,生物化學和生物物理學研究通訊(Biochem.Biophys.Res.Comm.)163:1243(1989)。還參見美國專利案號5,266,317。
‧在自然界中由蛇、黃蜂或任何其他生物體產生的昆蟲特有的毒液。例如,參見龐(Pang)等人,基因116:165(1992)。
‧引起單萜、倍半萜、類固醇、異羥肟酸、苯丙素衍生物或具有殺昆蟲活性的另一種非蛋白質分子超積累的酶。
‧涉及生物活性分子修飾(包括翻譯後修飾)的酶;例如,糖解酶、蛋白水解酶、脂解酶、核酸酶、環化酶、轉胺酶、酯酶、水解酶、磷酸酶、激酶、磷酸化酶、聚合酶、彈性蛋白酶、殼多糖酶以及葡聚糖酶,無論是天然還是合成的。參見PCT申請WO93/02197,克雷默(Kramer)等人,昆蟲生物化學與分子生物學(Insect Biochem.Molec.Biol.23:691(1993)以及卡瓦萊克
(Kawalleck)等人,植物分子生物學(Plant Molec.Biol.)21:673(1993)。
‧刺激信號轉導的分子。例如,參見博泰拉(Botella)等人,植物分子生物學24:757(1994)以及格裡斯(Griess)等人,植物生理學(Plant Physiol.)104:1467(1994)。
‧病毒侵入蛋白或源於此的複合物毒素。參見比奇(Beachy)等人,植物病理學年度回顧(Ann.rev.Phytopathol.)28:451(1990)。
‧在自然界中由病原體或寄生蟲產生的發育阻滯蛋白(Developmental-arrestive protein)。參見蘭布(Lamb)等人,生物/技術10:1436(1992)以及杜巴特(Toubart)等人,植物雜誌2:367(1992)。
‧在自然界中由植物產生的發育阻滯蛋白。例如,洛格曼(Logemann)等人,生物/技術10:305(1992)。
‧在植物中,病原體常常是宿主特異性的。例如,一些鐮刀菌種類將引起番茄枯萎病但僅攻擊番茄,而其他鐮刀菌種類僅攻擊小麥。植物具有現存和誘導的防衛以抵抗大部分病原體。跨植物各代的突變和重組事件導致引起易感性的遺傳變異性,特別是當病原體以比植物更大頻率繁殖時。在植物中可以存在非宿主抗性,例如宿主和病原體係不相容的或者可以存在針對所有病原體種族的部分抗性,該等抗性典型地是藉由許多基因來控制的,並且/或者也存在對一些病原體種族而不是其他種族的完全抗性。此抗性典型地是藉由幾種基因控制的。使用多種方法和CRISP-cpf1
系統組分,現在存在在此預先誘導特異性突變的新工具。因此,可以分析抗性基因來源基因組,並且在具有所希望的特徵或形狀的植物中,使用誘導抗性基因增加的方法和Cpf1 CRISPR系統組分。本發明系統可以比先前的誘變劑更精確地完成此分析並且因此加速並改進植物育種程式。
2.涉及植物疾病的基因,諸如WO 2013046247列出的基因:
‧稻穀病害:稻梨孢、宮部旋孢腔菌、立枯絲核菌、藤倉赤黴;小麥病害:白粉病菌、禾穀鐮刀菌、燕麥鐮刀菌(F.avenaceum)、黃色鐮刀菌、雪黴葉枯菌、條形柄鏽菌、禾柄鏽菌、隱匿柄鏽菌、粉紅雪腐病菌(Micronectriella nivale)、核瑚菌屬某種(Typhula sp.)、小麥黑粉菌、小麥網腥黑穗病菌(Tilletia caries)、小麥基腐病菌、禾生球腔菌、小麥殼多孢、偃麥草核腔菌;大麥病害:白粉病菌(Erysiphe graminis)、禾穀鐮刀菌、燕麥鐮刀菌、黃色鐮刀菌、雪黴葉枯菌、條形柄鏽菌、禾柄鏽菌、大麥柄鏽菌、裸黑粉菌、大麥雲紋斑病菌、圓核腔菌、禾旋孢腔菌、麥類核腔菌、立枯絲核菌:玉米病害:玉米黑粉菌、異旋孢腔菌、高粱膠尾孢、多堆柄鏽菌、玉米灰斑病菌、立枯絲核菌;
‧柑橘病害:柑橘間座殼菌(Diaporthe citri)、柑橘痂囊腔菌(Elsinoe fawcetti)、指狀青黴菌、桔青黴菌(P.italicum)、寄生疫黴、柑橘褐腐疫黴;蘋果病害:蘋果鏈核盤菌(Monilinia mali)、蘋果樹腐爛病菌(Valsa ceratosperma)、蘋果白粉病菌、互隔交鏈孢菌蘋果致病型、蘋果黑星病菌、尖孢炭疽(Colletotrichum
acutatum)、惡疫黴;
‧梨病害:梨黑星病菌(Venturia nashicola)、梨黑星菌(V.pirina)、互隔交鏈孢黴日本梨致病型、梨膠鏽菌(Gymnosporangium haraeanum)、惡疫黴;
‧桃病害:褐腐病菌、嗜果枝孢菌(Cladosporium carpophilum)、擬莖點黴屬某種(Phomopsis sp.);
‧葡萄病害:痂囊腔菌(Elsinoe ampelina)、檬果炭疽病菌、葡萄白粉菌(Uninula necator)、葡萄銹病菌(Phakopsora ampelopsidis)、葡萄球座菌、葡萄霜黴菌;
‧柿子病害:柿盤長孢(Gloesporium kaki)、柿角斑病菌(Cercospora kaki)、柿葉球腔菌(Mycosphaerela nawae);
‧瓠果病害:瓜類炭疽菌、黃瓜白粉病菌、甜瓜球腔菌(Mycosphaerella melonis)、尖孢鐮刀菌、黃瓜霜黴病菌、疫黴屬某種、腐黴屬某種;
‧番茄病害:茄鏈格孢菌、番茄葉黴病菌(Cladosporium fulvum)、致病疫黴菌;
‧茄子病害:茄褐紋病菌(Phomopsis vexans)、二孢白粉菌;十字花科蔬菜病害:蘿蔔鏈格孢菌(Alternaria japonica)、白菜白斑病菌(Cercosporella brassicae)、根腫病菌(Plasmodiophora brassicae)、寄生霜黴菌;
‧大蔥病害:蔥柄鏽菌(Puccinia allii)、大蔥霜黴(Peronospora destructor);
‧大豆病害:大豆紫斑病菌、大豆痂囊腔菌(Elsinoe glycines)、菜豆間座殼大豆變種、大豆殼針孢、大豆尾孢、豆薯層鏽菌、大豆疫黴病菌、立枯絲核菌、棒抱葉斑病菌(Corynespora casiicola)、核盤菌;
‧菜豆病害:菜豆炭疽病菌;
‧花生病害:花生黑斑病菌(Cercospora personata)、花生褐斑病菌、齊整小核菌;
‧豌豆病害豌豆:豌豆白粉菌;
‧馬鈴薯病害:茄鏈格孢菌、致病疫黴菌、馬鈴薯疫黴緋腐病菌、馬鈴薯粉狀瘡痂病菌(Spongospora subterranean,f.sp.Subterranean);
‧草莓病害:薄草單絲殼菌(Sphaerotheca humuli)、檬果炭疽病菌;
‧茶病害;茶網餅病菌(Exobasidium reticulatum)、荼白星病菌(Elsinoe leucospila)、擬盤多毛孢屬某種、荼炭疽菌(Colletotrichum theae-sinensis);
‧煙草病害:煙草赤星病菌(Alternaria longipes)、二孢白粉菌、煙草炭疽病菌(Colletotrichum tabacum)、煙草霜黴菌、煙草疫黴菌(Phytophthora nicotianae);
‧油菜籽病害:核盤菌、立枯絲核菌;
‧棉花病害:立枯絲核菌;
‧甜菜病害:甜菜尾孢菌(Cercospora beticola)、水稻紋枯病菌、螺殼狀絲囊黴(Aphanomyces cochlioides);
‧玫瑰病害:薔薇雙殼菌(Diplocarpon rosae)、薔薇單絲殼茵(Sphaerotheca pannosa)、薔薇霜黴(Peronospora sparsa);
‧菊花和菊科病害:萵苣盤枝黴、野菊殼針抱(Septoria chrysanthemi-indici)、堀氏菊柄鏽菌(Puccinia horiana);
‧各種植物的病害:瓜果腐黴病菌、德巴厘氏腐黴(Pythium debarianum)、禾草腐黴、畸雌腐黴、終極腐黴、灰葡萄孢菌、核盤菌;
‧蘿蔔病害:甘藍鏈格孢;
‧結縷草病害:同果核盤菌、立枯絲核菌;
‧香蕉病害:香蕉黑條葉斑病菌、香蕉黃條葉斑病菌;
‧向日葵病害:向日葵霜黴病菌;
‧在不同植物生長早期階段由以下各項引起的種子疾病或疾病:麯黴屬某些種、青黴屬某些種、鐮刀菌某些種、赤黴菌某些種、木黴屬某些種、根串珠黴屬某些種、根黴屬某些種、毛黴菌某些種、伏革菌屬某些種、莖點黴屬某些種、絲核菌某些種、色二孢屬某些種等;
‧各種植物由桿菌屬某些種、油壺菌屬某些種等介導的病毒病。
3.賦予對除草劑的抗性的基因的實例:
‧對抑制生長點或分生組織的除草劑的抗性,該除草劑諸如咪唑啉酮或硫醯脲,例如分別在李等人,歐洲分子生物學學會雜誌7:1241(1988)以及米琪等人,理論與應用遺傳學(Theor.Appl.Genet.)80:449(1990)。
‧草甘膦耐受性(分別由例如突變體5-烯醇丙酮莽草酸-3-磷酸合酶(EPSP)基因、aroA基因和草甘膦乙醯轉移酶(GAT)基因賦予的抗性)、或者對於其他膦羧基化合物諸如草銨膦的抗性(由來自鏈黴菌種類的草丁膦乙醯基轉移酶(PAT)基因賦予,該鏈黴菌種類包括吸水鏈黴菌和綠色產色鏈黴菌(Streptomyces viridichromogenes))、以及對吡啶氧基或苯氧基丙酸和環異己酮的抗性(由ACC酶抑制劑編碼基因賦予)。參見,例如美國專利案號4,940,835和美國專利6,248,876、美國專利案號4,769,061、歐洲專利案號0 333 033以及美國專利案號4,975,374。還參見歐洲專利案號0242246,德格瑞夫(DeGreef)等人,生物/技術7:61(1989),馬歇爾(Marshall)等人,理論與應用遺傳學83:435(1992),卡斯爾(Castle)等人的WO 2005012515,以及WO 2005107437。
‧對抑制光合成的除草劑的抗性,該除草劑諸如三(psbA和gs+基因)或苯基氰(腈水解酶基因),以及麩胱甘肽s-轉移酶,在瑞茲伯勒(Przibila)等人,植物細胞(Plant Cell)3:169(1991),美國專利案號4,810,648,以及海耶斯等人,生物化學雜誌285:173(1992)。
‧編碼使除草劑去毒的酶或對抑制具有抗性的突變體穀胺醯胺合酶的基因,例如在美國專利申請案序號11/760,602中。或
者去毒酶係編碼草丁膦乙醯轉移酶的酶(諸如來自鏈黴菌種類的bar或pat蛋白)。草丁膦乙醯轉移酶係例如描述於美國專利案號5,561,236;5,648,477;5,646,024;5,273,894;5,637,489;5,276,268;5,739,082;5,908,810以及7,112,665。
‧羥基苯丙酮酸雙氧化酶(HPPD)抑制劑,即天然存在的HPPD抗病性酶,或者編碼突變或嵌合HPPD酶的基因,如WO 96/38567、WO 99/24585、以及WO 99/24586、WO 2009/144079、WO 2002/046387、或美國專利案號6,768,044中所述的。
4.涉及非生物脅迫耐受性的基因的實例:
‧能夠在植物細胞或植物中減少聚(ADP核糖)聚合酶(PARP)基因的表現/或活性的轉基因,如WO 00/04173或WO/2006/045633所述的。
‧能夠減少該等植物或植物細胞的PARG編碼基因的表現和/或活性的轉基因,例如在WO 2004/090140中。
‧編碼煙醯胺腺嘌呤二核苷酸補救合成途徑的植物功能酶的轉基因,該等酶包括煙醯胺酶、煙醯酸磷酸核糖基轉移酶、煙酸單核苷酸腺嘌呤轉移酶、煙醯胺腺嘌呤二核苷酸合成酶或煙醯胺磷酸核糖基轉移酶,例如在EP 04077624.7、WO 2006/133827、PCT/EP07/002,433、EP 1999263、或WO 2007/107326中所述的。
‧涉及碳水化合物生物合成的酶包括例如EP 0571427、WO 95/04826、EP 0719338、WO 96/15248、WO 96/19581、WO 96/27674、WO 97/11188、WO 97/26362、WO 97/32985、WO 97/42328、WO
97/44472、WO 97/45545、WO 98/27212、WO 98/40503、WO99/58688、WO 99/58690、WO 99/58654、WO 00/08184、WO 00/08185、WO 00/08175、WO 00/28052、WO 00/77229、WO 01/12782、WO 01/12826、WO 02/101059、WO 03/071860、WO 2004/056999、WO 2005/030942、WO 2005/030941、WO 2005/095632、WO 2005/095617、WO 2005/095619、WO 2005/095618、WO 2005/123927、WO 2006/018319、WO 2006/103107、WO 2006/108702、WO 2007/009823、WO 00/22140、WO 2006/063862、WO 2006/072603、WO 02/034923、EP 06090134.5、EP 06090228.5、EP 06090227.7、EP 07090007.1、EP 07090009.7、WO 01/14569、WO 02/79410、WO 03/33540、WO 2004/078983、WO 01/19975、WO 95/26407、WO 96/34968、WO 98/20145、WO 99/12950、WO 99/66050、WO 99/53072、美國專利案號6,734,341、WO 00/11192、WO 98/22604、WO 98/32326、WO 01/98509、WO 01/98509、WO 2005/002359、美國專利案號5,824,790、美國專利案號6,013,861、WO 94/04693、WO 94/09144、WO 94/11520、WO 95/35026或WO 97/20936中所述的酶,或者如EP 0663956、WO 96/01904、WO 96/21023、WO 98/39460、以及WO 99/24593所揭露的涉及多聚果糖(尤其是菊粉和果聚糖類型)的產生的酶,如WO 95/31553、US 2002031826、美國專利案號6,284,479、美國專利案號5,712,107、WO 97/47806,WO 97/47807,WO 97/47808以及WO 00/14249揭露的涉及α-1,4-葡聚糖的產生的酶,如WO 00/73422所揭露的涉及α-1,6分支α-1,4-葡聚糖的產生的酶,如在例如WO 00/47727、WO 00/73422、EP 06077301.7、美國專利案號5,908,975以及EP 0728213所揭露的涉及交替糖的
產生的酶,如例如在WO 2006/032538、WO 2007/039314、WO 2007/039315、WO 2007/039316、JP 2006304779以及WO 2005/012529所揭露的涉及透明質酸的產生的酶。
‧改進抗旱性的基因。例如,WO 2013122472揭露了功能性泛素蛋白連接酶蛋白(UPL)、更確切地說是UPL3的缺乏或水平降低導致所述植物對水的需求減少或者對乾旱的抗性提高。具有增加的耐旱性的轉基因植物的其他實例揭露於例如US 2009/0144850、US 2007/0266453、以及WO 2002/083911。US2009/0144850描述了由於DR02核酸表現的改變而顯示耐旱性表型的植物。US 2007/0266453描述了由於DR03核酸表現的改變而顯示耐旱性表型的植物並且WO 2002/08391 1描述了由於保衛細胞中表現的ABC轉運體活性降低而具有增加的對乾旱脅迫的耐受性的植物。另一個實例係春日(Kasuga)和合著者(1999)的著作,他們描述了在正常生長條件下編碼DREB1 A的cDNA在轉基因植物中的過表現啟動了許多脅迫耐受性基因的表現並且導致對乾旱、鹽負荷以及寒冷的耐受性提高。然而,在正常生長條件下DREB1A的表現也導致嚴重生長遲緩(春日(1999)自然生物技術17(3)287-291)。
在另外的特定實施方式中,農作物植物可以是藉由影響特定植物性狀來改進的。例如,藉由開發耐殺蟲劑植物、提高植物的抗病性、提高昆蟲和線蟲抗性、提高植物針對寄生雜草的抗性、提高植物耐旱性、提高植物營養價值、提高植物脅迫耐受性、避免自花授粉、植物飼料可消化性生物質、穀物產量等等。
在下文中提供了若干特定的非限制性實例。
除單一基因的靶向突變之外,Cpf1 CRISPR複合物可以被設計允許在植物中靶向突變多基因、缺失染色體片段、位點特異性整合轉基因、體內定點誘變、以及精確基因置換或對偶基因交換。因此,在此所述的方法在基因發現和驗證、突變和順基因育種、以及雜交育種中具有廣泛的應用。該等應用有助於產生新一代的具有各種改進的農藝形狀的遺傳修飾農作物,該等農藝形狀諸如除草劑耐受性、抗病性、非生物脅迫耐受性、高產率、以及優等品質。
使用Cpf1基因創建雄性不育植物
雜交植物與自交植物相比典型地具有有利的農藝形狀。然而,對於自花授粉植物,雜種傳代可能是有挑戰的。在不同植物類型中,基因已被修飾,這對於植物能育性,更具體地說雄性能育性係重要的。例如,在玉米中,至少兩種基因已被修飾,這在能育性方面係重要的(關於新植物育種分子技術的阿米塔布莫漢蒂國際會議(Amitabh Mohanty International Conference on New Plant Breeding Molecular Technologies),技術發展與管理,2014年10月9-10日,印度齋蒲爾(Jaipur,India);斯維塔佘(Svitashev)等人,植物生理學,2015年10月;169(2):931-45;久卡諾維奇(Djukanovic)等人,植物雜誌,2013年12月;76(5):888-99)。在此提供的方法可以用於靶向雄性能育性所需要的基因,以便生成雄性不育植物,該等植物可以易於雜交以生成雜種。在特定實施方式中,在此提供的Cpf1 CRISPR系統用於靶向誘變細胞色
素P450-樣基因(MS26)或大範圍核酸酶基因(MS45),從而向玉米植物賦予雄性不育性。像這樣遺傳改變的玉米植物可以用於雜交育種程式中。
增加植物的能育性階段
在特定實施方式中,在此提供的方法用於延長植物諸如稻米植物的能育性階段。例如,可以靶向稻米能育性階段基因諸如Ehd3,以便生成基因中的突變並且可以選擇小植物以延長再生植物能育性階段(如CN 104004782中所述的)
使用Cpf1生成感興趣的農作物的遺傳變異
作物植物中野生種質和遺傳變異的可用性係農作物改進程序的關鍵,但是來自作物植物的種質的可用多樣性係有限的。本發明設想了用於生成感興趣的種質的遺傳變異的多樣性的方法。在Cpf1 CRISPR系統的此應用中,提供了靶向植物基因組中的不同位置的指導RNA文庫並且該文庫與Cpf1效應蛋白一起引入到植物細胞中。以這種方式,可以生成基因組規模的點突變和基因敲除的集合。在特定實施方式中,該等方法包括由如此獲得的細胞生成植物部分或植物並且篩選感興趣的性狀的細胞。靶基因可以包含編碼區和非編碼區二者。在特定實施方式中,該性狀係脅迫耐受性的並且該方法係用於生成脅迫耐受性農作物種類。
使用Cpf1影響果實催熟
催熟(Ripening)係果實和蔬菜成熟過程中的正常階段。僅在催熟開始後的幾天,催熟致使果實或蔬菜不可食用。此
過程對農民和消費者造成大量損失。在特定實施方式中,本發明的方法可以用於減少乙烯產生。這係藉由確保以下各項中的一種或多種來保證的:a.抑制ACC合酶基因表現。ACC(1-胺基環丙烷-1-羧酸)合酶係負責將S-腺苷甲硫胺酸(SAM)轉化成ACC的酶;這係乙烯生物合成中的第二個步驟至最後一個步驟。當合酶基因的反義(“鏡像”)或截短的拷貝插入到植物基因組中時會阻礙酶表現;b.插入ACC脫胺酶基因。從一種常見的非致病性土壤細菌綠針假單胞菌(Pseudomonas chlororaphis)獲得編碼該酶的基因。它將ACC轉化為一種不同的化合物,從而減少可用於產生乙烯的ACC量;c.插入SAM水解酶基因。此方法類似於ACC脫胺酶,其中當乙烯先質代謝物的量減少時乙烯產生受到阻礙;在此情況下,SAM被轉化為高絲胺酸。從大腸桿菌T3噬菌體獲得編碼該酶的基因,以及d.抑制ACC氧化酶基因表現。ACC氧化酶係催化ACC氧化成乙烯的酶,這係乙烯生物合成途徑中的最後一個步驟。使用在此所述的方法,下調ACC氧化酶基因,導致乙烯產生受到抑制,從而延遲果實催熟。在特定實施方式中,對於以上所述修飾另外地或可替代地,在此所述方法用於修飾乙烯受體,以便干擾由果實獲得的乙烯信號。在特定實施方式中,修飾,更具體地說抑制編碼乙烯結合蛋白的ETR1基因的表現。在特定實施方式中,對於在此所述修飾附加地或可替代地,在此所述的方法用於修飾編碼多聚半乳糖醛酸酶(PG)的基因的表現,該PG係負責分解果膠(維持植物細胞壁完整性的物質)的酶。果膠分解發生在催熟過程開始時,從而導致水果軟化。因此,在特定實施方式中,在此所述的方法用於在PG基因中引入突變或者用於抑制PG基因的啟動,以
便減少所產生的PG酶的量,從而延遲果膠降解。
因此在特定實施方式中,該等方法包括使用Cpf1 CRISPR系統確保如上所述的植物細胞基因組的一種或多種修飾並且由該細胞再生植物。在特定實施方式中,該植物係番茄植物。
增加植物的保存期限
在特定實施方式中,本發明的方法用於修飾涉及產生影響植物或植物部分的保存期限的化合物的基因。更具體地說,該修飾係在防止馬鈴薯塊莖中的還原糖積累的基因中。在高溫處理時,該等還原糖與游離胺基酸反應,從而產生棕色苦味產物和高水平的丙烯醯胺,該丙烯醯胺係潛在致癌物。在特定實施方式中,在此提供的方法用於減少或抑制液泡轉化酶基因(VInv)的表現,該液泡轉化酶基因編碼將蔗糖分解為葡萄糖和果糖的蛋白質(克拉森(Clasen)等人,DOI:10.1111/pbi.12370)。
使用Cpf1 CRISPR系統確保增值的性狀
在特定實施方式中,Cpf1 CRISPR系統用於產生營養提高的農作物。在特定實施方式中,在此提供的方法適於生成“功能性食品”,即可以提供超過它所含有的傳統營養物的健康益處的修飾的食品或食品成分,並且/或者適於生成“營養食品”,即可以被視為食品或食品的一部分並且提供健康益處(包括預防和治療疾病)的物質。在特定實施方式中,營養食品適用於預防和/或治療癌症、糖尿病、心血管疾病以及高血壓中的一種或多種。
營養提高的農作物實例包括(紐厄爾麥格盧林
(Newell-McGloughlin),植物生理學,2008年7月,第147卷,第939-953頁);
- 修飾蛋白品質、含量和/或胺基酸組成,諸如對於以下各項所描述的:百喜草(盧西亞尼(Luciani)等人,2005,佛羅里達遺傳會議海報(Florida Genetics Conference Poster))、油菜(勒斯勒爾(Roesler)等人,1997,植物生理學11375-81)、玉米(克倫威爾(Cromwell)等人,1967,1969農林科學(J Anim Sci)26 1325-1331,歐.昆(O’Quin)等人,2000農林科學78 2144-2149,陽(Yang)等人2002,轉基因研究11 11-20,楊(Young)等人2004,植物雜誌38 910-922)、馬鈴薯(餘.J(Yu J)和奧(Ao),1997植物學報(Acta Bot Sin)39 329-334;查克拉博蒂(Chakraborty)等人2000,美國國家科學院院刊97 3724-3729;李等人(2001)中國科學通報(Chin Sci Bull)46 482-484)、稻米(卡茲伯(Katsube)等人,1999,植物生理學120 1063-1074)、大豆(丁金斯(Dinkins)等人,2001,拉普(Rapp),2002,植物體外細胞與發育生物學(In Vitro Cell Dev Biol Plant)37 742-747)、甘薯(厄尼安(Egnin)和普拉卡什(Prakash)1997,體外細胞與發育生物學(In Vitro Cell Dev Biol)33 52A)。
- 必需胺基酸含量,諸如對於以下各項所描述的:油菜(法爾科(Falco)等人,1995,生物/技術13 577-582)、羽扇豆(懷特(White)等人,2001,食品與農業科學雜誌(J Sci Food Agric)81 147-154)、玉米(萊(Lai)和梅辛(Messing),2002,2008年農業與生物技術戰略公司轉基因作物資料庫(Agbios 2008 GM
crop database)(2008年3月11日))、馬鈴薯(澤(Zeh)等人,2001,植物生理學127 792-802)、高粱(趙等人,2003,克拉維爾科學出版社(Kluwer Academic Publishers),荷蘭多德雷赫特(Dordrecht,The Netherlands),第413-416頁)、大豆(法爾科等人,1995生物/技術13 577-582;加利爾(Galili)等人,2002植物科學的關鍵評論(Crit Rev Plant Sci)21 167-204)。
- 油類和脂肪酸,例如對於油菜(德赫士(Dehesh)等人,(1996)植物雜誌9 167-172[PubMed];德韋基奧(Del Vecchio)(1996)關於脂肪、油類和相關材料的國際新聞通告(INFORM International News on Fats,Oils and Related Materials)7 230-243;勒斯勒爾等人,(1997)植物生理學113 75-81[PMC免費文獻][PubMed];弗羅曼(Froman)和於爾森(Ursin)(2002,2003),美國化學學會論文摘要(Abstracts of Papers of the American Chemical Society)223 U35;詹姆斯(James)等人,(2003)美國臨床營養學雜誌(Am J Clin Nutr)77 1140-1145[PubMed];農業與生物技術戰略公司(2008,同上);棉花(coton)(查普曼(Chapman)等人,(2001).美國石油化學家協會雜誌(J Am Oil Chem Soc)78 941-947;劉等人,(2002)美國營養學院雜誌(J Am Coll Nutr)21 205S-211S[PubMed];歐尼爾(O'Neill)(2007)澳大利亞生命科學家(Australian Life Scientist).http://www.biotechnews.com.au/index.php/id;866694817;fp;4;fpid;2(2008年6月17日)、亞麻籽(阿巴迪(Abbadi)等人,2004,植物細胞16:2734-2748)、玉米(楊等人,2004,植物雜誌38 910-922)、油棕(嘉拉尼(Jalani)等人,1997,美國石油化學家協會雜
誌74 1451-1455;帕爾維姿(Parveez),2003,農業生物科技網(AgBiotechNet)113 1-8)、稻米(阿奈(Anai)等人,2003,植物細胞報告(Plant Cell Rep)21 988-992)、大豆(雷迪(Reddy)和湯瑪斯(Thomas),1996,自然生物技術14 639-642;金尼(Kinney)和克沃爾頓(Kwolton),1998,黑人學術和專業(Blackie Academic and Professional),倫敦,第193-213頁)、向日葵(阿爾卡迪亞(Arcadia),生物科學(Biosciences)2008)
- 碳水化合物,諸如對於以下各項所描述的果聚糖:菊苣(斯米肯恩(Smeekens)(1997)植物科學趨勢(Trends Plant Sci)2 286-287,施普倫格(Sprenger)等人,(1997)FEBS快報400 355-358,思維尼爾(Sévenier)等人,(1998)自然生物技術16 843-846)、玉米(菜密(Caimi)等人,(1996)植物生理學110 355-363)、馬鈴薯(黑爾韋格(Hellwege)等人,1997植物雜誌12 1057-1065)、甜菜(斯米肯恩等人,1997,同上);菊粉,諸如對於馬鈴薯(赫勒韋格(Hellewege)等人,2000,美國國家科學院院刊97 8699-8704)所述的;澱粉,諸如對於稻米所述的(施瓦爾(Schwall)等人,(2000)自然生物技術18 551-554,蔣(Chiang)等人,(2005)分子育種(Mol Breed)15 125-143),
- 維生素類和類葫蘿蔔素,諸如對於以下各項所述的:油菜(新穀(Shintani)和黛拉彭娜(DellaPenna)(1998)科學282 2098-2100)、玉米(羅徹福德(Rocheford)等人,(2002).美國營養學院雜誌21 191S-198S,卡洪(Cahoon)等人,(2003)自然生物技術21 1082-1087,陳等人,(2003)美國國家科學院院刊100 3525-
3530)、芥菜耔(休梅克(Shewmaker)等人,(1999)植物雜誌20 401-412)、馬鈴薯(杜克勒(Ducreux)等人,2005,實驗植物學雜誌(J Exp Bot)56 81-89)、稻米(葉(Ye)等人,(2000)科學287 303-305)、草莓(阿吉厄斯(Agius)等人,(2003),自然生物技術21 177-181)、番茄(羅薩蒂(Rosati)等人,(2000)植物雜誌24 413-419,弗雷澤(Fraser)等人,(2001)食品與農業科學雜誌81 822-827,梅塔(Mehta)等人,(2002)自然生物技術20 613-618,迪則.德.拉.加爾薩(Díaz de la Garza)等人,(2004)美國國家科學院院刊101 13720-13725,恩非斯(Enfissi)等人,(2005)植物生物技術雜誌3 17-27,黛拉彭娜(2007)美國國家科學院院刊104 3675-3676。
- 功能性次級代謝產物,諸如對於以下各項描述的:蘋果(芪類,斯贊卡斯基(Szankowski)等人,(2003)植物細胞報告22:141-149)、苜蓿(白藜蘆醇,希普斯金德(Hipskind)和派瓦(Paiva)(2000)分子植物微生物的相互作用(Mol Plant Microbe Interact)13 551-562)、獼猴桃(白藜蘆醇,小林(Kobayashi)等人,(2000)植物細胞報告19 904-910)、玉米和大豆(黃酮類,餘等人,(2000)植物生理學124 781-794)、馬鈴薯(花青素和生物鹼糖苷,魯卡斯瑟維克茨(Lukaszewicz)等人,(2004)農業與食品化學雜誌(J Agric Food Chem)52 1526-1533)、稻米(黃酮類和白藜蘆醇,斯塔克-勞任森(Stark-Lorenzen)等人,(1997)植物細胞報告16 668-673,信(Shin)等人,(2006)植物生物技術雜誌4 303-315)、番茄(+白藜蘆醇、綠原酸、黃酮類、芪;羅薩蒂等人,(2000)同上,繆爾(Muir)等人,(2001)自然19 470-474,
尼吉威戈(Niggeweg)等人,(2004)自然生物技術22 746-754,焦維納佐(Giovinazzo)等人,(2005)植物生物技術雜誌3 57-69)、小麥(咖啡酸和咖啡酸、白藜蘆醇;美國合眾國際新聞社(United Press International)(2002));以及
- 礦物質可用性,諸如對於以下各項所述的:苜蓿(植酸酶,奧斯丁-菲力浦斯(Austin-Phillips)等人,(1999)http://www.molecularfarming.com/nonmedical.html)、生菜(Lettuse)(鐵,戈托等人,(2000)理論與應用遺傳學(Theor Appl Genet)100 658-664)、稻米(鐵,盧卡(Lucca)等人,(2002)美國營養學院雜誌21 184S-190S)、玉米、大豆和小麥(植酸酶,德拉卡卡基(Drakakaki)等人,(2005)植物分子生物學59 869-880,丹茂(Denbow)等人,(1998)養禽科學(Poult Sci)77 878-881,布林克-佩德森(Brinch-Pedersen)等人,(2000)分子育種6 195-206)。
在特定實施方式中,增值的性狀與存在於植物中的化合物的設想的健康益處相關。例如,在特定實施方式中,藉由應用本發明的方法來確保以下化合物中的一種或多種化合物的合成的修改或者誘導/增加它們的合成,以獲得增值的農作物:
- 類葫蘿蔔素,諸如存在於胡蘿蔔中的α-胡蘿蔔素,該α-胡蘿蔔素中和可引起對細胞的損害的自由基;或者存在於各種果實和蔬菜中的β-胡蘿蔔素,該β-胡蘿蔔素中和自由基
- 存在於綠色蔬菜中的葉黃素,該葉黃素有助於維持健康視力
- 存在於番茄和番茄產品中的番茄紅素,該番茄紅素認為降低前列腺癌風險
- 存在於柑橘和玉米中的玉米黃素,該玉米黃素有助於維持健康視力
- 膳食纖維,諸如存在於麥麩中的不溶性纖維,該不溶性纖維可以降低乳腺癌和/或結腸癌風險;以及存在於燕麥中的β葡聚糖;存在於車前子(Psylium)和全穀粒中的可溶性纖維,該可溶性纖維可以降低心血管疾病(CVD)風險
- 脂肪酸,諸如ω-3脂肪酸,該等ω-3脂肪酸可以降低CVD風險並提高心理功能和視功能;共軛亞油酸,該共軛亞油酸可以改進身體組成,可以減小某些癌症風險;以及GLA,該GLA可以降低癌症和CVD的炎症風險,可以改進身體組成
- 黃酮類,諸如存在於小麥中的羥基苯乙烯,該等羥基苯乙烯具有抗氧化劑樣活性,可以降低退行性疾病風險;存在於果實和蔬菜中的黃酮醇、兒茶酚類和鞣酸類,該等黃酮醇、兒茶酚類和鞣酸類中和自由基並且可以降低癌症風險
- 葡萄糖異硫氰酸酯、吲哚、異硫氰酸酯,諸如存在於十字花科蔬菜(花椰菜、羽衣甘藍)、辣根屬中的蘿蔔硫素,該蘿蔔硫素中和自由基,可以降低癌症風險
- 酚類,諸如存在於葡萄中的芪類,該等芪類可以降低退行性疾病、心臟病和癌症的風險,可以延年益壽功效;以及存在於蔬菜和柑橘中的咖啡酸和阿魏酸,它們具有抗氧化劑樣活性,可
以降低退行性疾病、心臟病和眼病的風險;以及存在於可可中的表兒茶素,該表兒茶素具有抗氧化劑樣活性,可以降低退行性疾病和心臟病的風險
- 存在於玉米、大豆、小麥以及木制油中的植物甾烷醇/固醇類,它們可以藉由降低血膽固醇水平來降低冠心病的風險
- 存在於洋姜、胡蔥、洋蔥粉中的果聚糖、菊糖、低聚果糖,它們可以提高胃腸道健康
- 存在於大豆中的皂苷類,它們可以降低LDL膽固醇
- 存在於大豆中的大豆蛋白質,它可以降低心臟病風險
- 植物雌激素,諸如存在於大豆中的異黃酮,該等異黃酮可以減少絕經期症狀(諸如熱潮紅),可以減少骨質疏鬆症和CVD;以及存在於亞麻、黑麥和蔬菜中的木脂素類,該等木脂素類可以防止心臟病和一些癌症,可以降低LDL膽固醇、總膽固醇
- 硫化物和硫醇類,諸如存在於洋蔥、大蒜、橄欖、韭蔥以及青蔥(scallon)中的二烯丙基硫;以及存在於十字花科蔬菜中的烯丙基甲基三硫、二硫醇硫酮,它們可以降低LDL膽固醇,說明維持健康免疫系統
- 鞣酸,諸如存在於蔓越橘、可可中的原花色素,它可以提高泌尿道健康,可以降低CVD和高血壓風險
- 等等。
此外,本發明的方法還設想了修改蛋白質/澱粉功能
性、保質期、味道/美學、纖維品質、以及減少過敏原、抗營養素以及毒素的形狀。
因此,本發明涵蓋了用於產生具有營養增加價值的植物的方法,所述方法包括使用如在此所述的Cpf1 CRISPR系統將編碼涉及產生增加的營養價值的組分的酶的基因引入到植物細胞中並且由所述植物細胞再生植物,所述植物的特徵在於增加的營養價值的所述組分的表現增加。在特定實施方式中,Cpf1 CRISPR系統用於例如藉由修飾控制此化合物代謝的一種或多種轉錄因子來間接修改該等化合物的內源性合成。上文描述了用於將感興趣的基因引入到植物細胞並且/或者使用Cpf1 CRISPR系統修飾內源性基因的方法。
在已修飾為賦予增值性狀的植物中的一些特定修飾實例係:例如藉由用硬脂醯-ACP去飽和酶的反義基因轉化植物以增加植物硬脂酸含量的具有修飾的脂肪酸代謝的植物。參見,庫內爾特頓(Knultzon)等人,美國國家科學院院刊89:2624(1992)。另一個實例涉及例如藉由選殖並且然後再引入與可以負責特徵為低水平植酸的玉米突變體的單一對偶基因相關聯的DNA來減小植酸酯含量。參見瑞博(Raboy)等人,Maydica 35:383(1990)。
類似地,在強啟動子控制下調節玉米糊粉層中黃酮類的產生的玉米(玉蜀黍)Tfs C1和R的表現導致擬南芥屬(Arabidopsis)(阿拉伯芥)中的花色素苷高積累速率,推測係藉由啟動整個途徑(布魯斯(Bruce)等人,2000,植物細胞12:65-80)。黛拉彭娜(韋爾施(Welsch)等人,2007植物生物學年評57:
711-738)發現Tf RAP2.2及其相互作用配位基SINAT2增加擬南芥葉中的胡蘿蔔素形成作用。在轉基因擬南芥中表現Tf Dof1誘導了編碼用於產生碳架、標記性增加胺基酸含量以及減少Glc水平的酶的基因的上調(柳澤(Yanagisawa),2004植物細胞生理學45:386-391),並且DOF Tf AtDof1.1(OBP2)上調了擬南芥的葡萄糖異硫氰酸酯生物合成途徑中的所有步驟(希瑞克茲(Skirycz)等人,2006植物雜誌47:10-24)。
減少植物中的過敏原
在特定實施方式中,在此提供的方法可以用於生成具有減少的水平的過敏原的植物,從而使得它們對於消費者而言更安全。在特定實施方式中,該等方法包括修飾負責產生植物過敏原的一種或多種基因的表現。例如,在特定實施方式中,該等方法包括下調植物細胞諸如黑麥草植物細胞中的Lol p5基因的表現並且由該細胞再生植物以便減少所述植物的花粉的過敏原性(巴拉(Bhalla)等人,1999,美國國家科學院院刊,第96卷:11676-11680)。
花生過敏和對豆類過敏總體上是真實而嚴重的健康問題。本發明的Cpf1效應蛋白系統可以用於鑒定並且然後編碼或沈默編碼此類豆類的過敏原性蛋白的基因。在不限於此類基因和蛋白質的情況下,尼柯拉烏(Nicolaou)等人鑒定了花生、大豆、扁豆、羽扇豆、青豆、以及綠豆中的過敏原性蛋白。參見,尼柯拉烏等人,過敏症及臨床免疫學當代觀點(Current Opinion in Allergy and Clinical Immunology)2011;11(3):222)。
用於感興趣的內源性基因的篩選方法
在此提供的方法進一步允許鑒定編碼涉及產生增加的營養價值的組分的酶的有價值基因或者通常是影響跨種類、門和植物界的感興趣的農藝性狀的基因。藉由使用如在此所用的Cpf1 CRISPR系統選擇性靶向例如編碼植物代謝途徑的酶的基因,可以鑒定負責植物某些營養方面的基因。類似地,藉由選擇性靶向可以影響所希望的農藝性狀的基因,可以鑒定相關基因。因此,本發明涵蓋了用於編碼涉及產生具有特定營養價值和/或農藝性狀的化合物的酶的基因的篩選方法。
在植物和酵母中進一步應用Cpf1-CRISPR系統
在生物燃料生產中使用Cpf1 CRISPR系統
如在此所述的“生物燃料”係由植物和植物來源的資源製成的代用燃料。可再生生物燃料可以從有機物質中提取,該有機物質的能量已藉由碳固定方法來獲得或者藉由使用或轉化生物質來製成。此生物質可以直接用於生物燃料或者可以藉由熱轉化、化學轉化和生物化學轉化來轉化成含有能量的物質。此生物質轉化可以形成固體、液體或氣體形式的燃料。存在兩種類型的生物燃料:生物乙醇和生物柴油。生物乙醇主要係藉由纖維素(澱粉)的糖發酵過程來產生的,該纖維素大部分來源於玉米和甘蔗。在另一個方面中,生物柴油主要係由油料作物諸如油菜籽、棕櫚和大豆產生的。生物燃料主要用於運輸。
增強用於生物燃料生產的植物特性
在特定實施方式中,使用在此所述的Cpf1 CRISPR系統的方法用於改變細胞壁的特性,以便促進關鍵性水解劑進入,從而更有效地釋放用於發酵的糖。在特定實施方式中,修改纖維素和/或木質素的生物合成。纖維素係細胞壁的主要組分。纖維素和木質素的生物合成係共調節的。藉由減少植物中的木質素比例,可以增加纖維素的比例。在特定實施方式中,在此所述的方法用於下調植物中的木質素生物合成,以便增加可發酵的碳水化合物。更具體地說,在此所述的方法用於下調選自下組的至少一種第一木質素生物合成基因,該組由以下各項組成:4-香豆酸酯3-羥化酶(C3H)、苯丙胺酸胺裂解酶(PAL)、肉桂酸酯4-羥化酶(C4H)、羥基肉桂醯轉移酶(HCT)、咖啡酸O-甲基轉移酶(COMT)、咖啡醯氧基CoA 3-O-甲基轉移酶(CCoAOMT)、阿魏酸酯5-羥化酶(F5H)、肉桂醇脫氫酶(CAD)、肉桂醯CoA-還原酶(CCR)、4-香豆酸酯-CoA連接酶(4CL)、單木質醇-木質素-特異性糖基轉移酶、以及醛脫氫酶(ALDH),如WO 2008064289 A2所揭露的。
在特定實施方式中,在此所述的方法用於產生在發酵過程中生成低水平乙酸的植物生物質(還參見WO 2010096488)。更具體地說,在此揭露的方法用於生成與CaslL同源的突變,以減少多糖乙醯化。
修飾用於生物燃料生產的酵母
在特定實施方式中,在此提供的Cpf1酶用於藉由重組微生物進行生物乙醇生產。例如,Cpf1可以用於工程化微生物,諸如酵母,以由可發酵糖類生成生物燃料或生物聚合物並且視情
況能夠降解來源於作為可發酵糖來源的農業廢棄物的植物來源的木質纖維素。更具體地說,本發明提供了多種方法,憑藉該等方法Cpf1 CRISPR複合物用於將生物燃料生產所需要的外源基因引入到微生物中並且/或者修飾可能干擾生物燃料合成的內源性基因。更具體地說,該等方法包括將編碼涉及丙酮酸酯轉化為乙醇或另一種感興趣的產物的酶的一種或多種核苷酸序列引入到微生物諸如酵母中。在特定實施方式中,該等方法確保引入允許微生物降解纖維素的一種或多種酶諸如纖維素酶。在另外的實施方式中,Cpf1 CRISPR複合物用於修飾與生物燃料產生途徑競爭的內源性代謝途徑。
因此,在更特定的實施方式中,在此所述的方法用於如下地修飾微生物:
以引入至少一種異源核酸或增加編碼植物細胞壁降解酶的至少一種內源性核酸的表現,以使得所述微生物能夠表現所述核酸並且能夠產生並分泌所述植物細胞壁降解酶;
以引入至少一種異源核酸或增加編碼將丙酮酸酯轉化為乙醛的酶的至少一種內源性核酸視情況連同編碼將乙醛轉化為乙醇的酶的至少一種異源核酸的表現,以使得所述宿主細胞能夠表現所述核酸;並且/或者
以修飾編碼所述宿主細胞的代謝途徑中的酶的至少一種核酸,其中所述途徑產生除來自丙酮酸酯的乙醛或來自乙醛的乙醇之外的代謝物,並且其中所述修飾導致所述代謝物的產生減少,或者以引入編碼所述酶的抑制劑的至少一種核酸。
修飾用於生產植物油或生物燃料的藻類和植物
轉基因藻類或其他植物諸如芸苔可以例如特別適用於生產植物油或生物燃料諸如醇(具體地是甲醇和乙醇)。該等藻類可以被工程化以表現或過量表現用於油或生物燃料工業中的高水平油或醇。
根據本發明的特定實施方式,Cpf1 CRISPR系統用於生成適用於生物燃料生產的富含脂質的矽藻類。
在特定實施方式中,設想的是特異性修飾涉及改變由藻類細胞產生的脂質的量和/或脂質的品質的基因。編碼涉及脂肪酸合成途徑的酶的基因的實例可以編碼具有例如以下活性的蛋白質:乙醯CoA羧化酶、脂肪酸合酶、3-酮乙基_醯基-載體蛋白合酶III、甘油-3-磷酸脫氫酶(G3PDH)、烯醯-醯基載體蛋白還原酶(烯醯-ACP-還原酶)、甘油-3-磷酸醯基轉移酶、溶血磷脂醯基轉移酶或二醯甘油醯基轉移酶、磷脂:二醯甘油二醯甘油、磷脂酸磷酸酶、脂肪酸硫酯酶諸如軟脂醯蛋白硫酯酶、或者蘋果酸酶活性。在另外的實施方式中,設想的是生成具有增加的脂質積累的矽藻類。這可以是藉由靶向減少脂質異化的基因來實現的。對於用於本發明的方法中特別感興趣的是涉及啟動三醯甘油和游離脂肪酸的基因,以及直接涉及脂肪酸的β氧化的基因,諸如醯基-CoA合成酶、3-酮乙基-CoA硫解酶、醯基-CoA氧化酶活性以及磷葡萄糖變位酶。在此所述的Cpf1 CRISPR系統和方法可以用於特異性啟動矽藻類中的此類基因,以便增加其脂質含量。
諸如微藻的生物體廣泛用於合成生物學。斯迪維塞克
(Stovicek)等人(代謝工程通信(Metab.Eng.Comm.),2015;2:13描述了工業用酵母諸如釀酒酵母的基因組編輯,以有效產生用於工業生產的有力菌株。斯迪維塞克使用了對酵母密碼子優化的CRISPR-Cas9系統來同時破壞內源性基因的兩個對偶基因並且敲除異源基因。Cas9和gRNA由基因組或附加型2μ基載體位置表現。作者們還證實基因破壞效率可以藉由優化Cas9和gRNA表現水平來提高。拉維瓦(Hlavová)等人(生物技術進展(Biotechnol.Adv.)2015)討論了使用諸如CRISPR的技術靶向核基因和葉綠體基因進行插入誘變和篩選來開發微藻種類或菌株。斯迪維塞克和拉維瓦的方法可以適用於本發明的Cpf1效應蛋白系統。
US 8945839描述了用於使用Cas9工程化微藻(萊茵衣藻細胞)種類)的方法。使用類似工具,在此所述的Cpf1 CRISPR系統的方法可以應用於衣藻屬種類和其他藻類上。在特定實施方式中,Cpf1和指導RNA引入使用載體表現的藻類中,該載體在組成型啟動子的控制下表現Cpf1,諸如Hsp70A-Rbc S2或βBeta2-微管蛋白。指導RNA將使用含有T7啟動子的載體遞送。可替代地,Cpf1 mRNA和體外轉錄的指導RNA可以是遞送至藻類細胞中。電穿孔方法遵循來自基因領域衣藻屬工程化套組的標準推薦方法。
使用Cpf1生成能夠進行脂肪酸生產的微生物
在特定實施方式中,本發明的方法用於生成能夠產生脂肪酸酯諸如脂肪酸甲酯(“FAME”)和脂肪酸乙酯(“FAEE”)的遺傳工程化微生物。
典型地,宿主細胞可以被工程化以藉由表現或過表現
編碼硫酯酶的基因、編碼醯基-CoA合酶的基因以及編碼酯合酶的基因來由存在於培養基中的碳源諸如醇產生脂肪酸酯。因此,在此提供的方法用於修飾微生物,以便過表現或引入硫酯酶基因、編碼脂醯CoA合酶的基因、以及編碼酯合酶的基因。在特定實施方式中,硫酯酶基因係選自tesA、'tesA、tesB,fatB、fatB2,fatB3,fatA1、或fatA。在特定實施方式中,編碼醯基-CoA合酶的基因係選自fadDJadK、BH3103、pfl-4354、EAV15023、fadD1、fadD2、RPC_4074、fadDD35、fadDD22、faa39、或編碼具有相同特性的酶的鑒定的基因。在特定實施方式中,編碼酯合酶的基因係編碼來自以下各項的合酶/醯基-CoA:二醯基甘油醯基轉移酶或其變體的基因:霍霍巴、不動桿菌屬某種ADP、泊庫島食烷菌、銅綠假單胞菌、亞德海床桿菌(Fundibacter jadensis)、阿拉伯芥、或真養產鹼桿菌。另外地或可替代地,在此提供的方法用於減少以下各項中的至少一種基因在所述微生物中的表現:編碼醯基-CoA脫氫酶的基因、編碼外膜蛋白受體的基因、以及編碼脂肪酸生物合成轉錄調節因子的基因。在特定實施方式中,諸如藉由引入突變來滅活該等基因中的一種或多種。在特定實施方式中,編碼醯基-CoA脫氫酶的基因係fadE。在特定實施方式中,編碼脂肪酸生物合成的轉錄調節因子的基因編碼DNA轉錄阻遏因子,例如fabR。
另外地或可替代地,所述微生物被修飾為減少以下各項中的至少一種基因的表現:編碼丙酮酸甲酸裂解酶的基因、編碼乳酸脫氫酶的基因或二者。在特定實施方式中,編碼丙酮酸甲酸裂解酶的基因係pflB。在特定實施方式中,編碼乳酸脫氫酶的基
因係IdhA。在特定實施方式中,諸如藉由在其中引入突變來滅活該等基因中的一種或多種。
在特定實施方式中,微生物係選自埃希菌屬、芽孢桿菌屬、乳酸桿菌屬、紅球菌屬、聚球藍細菌屬、集胞藻屬(Synechoystis)、假單胞菌屬、麯黴屬、木黴屬、鏈孢黴屬、鐮刀菌屬、腐質黴屬(Humicola)、根毛黴屬、克魯維酵母屬、畢赤酵母屬、毛黴菌屬、蝕絲黴屬、青黴菌屬、平革菌屬、側耳屬(Pleurotus)、栓菌屬(Trametes)、金孢子菌屬、酵母菌屬、寡養單胞菌(Stenotrophamonas)、裂殖酵母屬、亞羅酵母屬或鏈黴菌屬。
使用Cpf1生成能夠進行有機酸生產的微生物
在此提供的方法進一步用於工程化能夠更具體地說由戊糖或己糖生產有機酸的微生物。在特定實施方式中,該等方法包括將外源性LDH基因引入到微生物中。在特定實施方式中,所述微生物中的有機酸生產另外地或可替代地藉由滅活編碼涉及內源性代謝途徑的蛋白質的內源性基因來增加,該代謝途徑產生除感興趣的有機酸之外的代謝物,並且/或者其中該內源性代謝途徑消耗有機酸。在特定實施方式中,該修飾確保減少除感興趣的有機酸之外的代謝物的產生。根據特定實施方式,該等方法用於引入其中消耗有機酸的內源性途徑或編碼涉及產生除感興趣的有機酸之外的代謝物的內源性途徑的產物的基因的至少一種工程化基因缺失和/或滅活。在特定實施方式中,該至少一種工程化基因缺失或滅活係處於編碼選自下組的酶的一種或多種基因中:丙酮
酸脫羧酶(pdc)、延胡索酸還原酶、醇脫氫酶(adh)、乙醛脫氫酶、磷酸烯醇丙酮酸羧化酶(ppc)、D-乳酸脫氫酶(d-ldh)、L-乳酸脫氫酶(1-ldh)、乳酸2-單加氧酶。
在其他實施方式中,該至少一種工程化基因缺失和/或滅活係處於編碼丙酮酸脫羧酶(pdc)的內源性基因中。
在另外的實施方式中,微生物被工程化以產生乳酸,並且該至少一種工程化基因缺失和/或滅活係處於編碼乳酸脫氫酶的內源性基因中。另外地或可替代地,微生物包含至少一種工程化基因缺失或者編碼細胞色素依賴性乳酸脫氫酶諸如細胞色素B2依賴性L-乳酸脫氫酶的內源性基因的滅活。
使用Cpf1生成改進的利用木糖或纖維二糖的酵母菌株
在特定實施方式中,Cpf1 CRISPR系統可以用於選擇改進的利用木糖或纖維二糖的酵母菌株。易錯PCR可以用於擴增涉及木糖利用或纖維二糖利用途徑的一種(或多種)基因。涉及木糖利用途徑和纖維二糖利用途徑的基因的實例可以包括但不限於,以下所述的那些:巴,S.J.(Ha,S.J.)等人,(2011)美國國家科學院院刊108(2):504-9和加拉茲卡,J.M.(Galazka,J.M.)等人,(2010)科學330(6000):84-6。各自在這種選擇的基因中包含隨機突變的雙股DNA分子的所得文庫可以與Cpf1 CRISPR系統的組分共轉化到酵母菌株(例如S288C)中並且可以選擇具有增加的木糖或纖維二糖利用能力的菌株,如WO2015138855所述的。
使用Cpf1生成用於類異戊二烯生物合成的改進的酵母菌株
達塔司傑克奇納思(Tadas Jakoinas)等人描述了多種CRISPR/Cas9系統在麵包酵母釀酒酵母的一個轉化步驟中用於基因組工程化多至5個不同基因組座位的成功應用(代謝工程 第28卷,2015年3月,第213-222頁),從而得到具有高甲羥戊酸酯(它係工業上重要的異戊二烯生物合成途徑的關鍵性中間體)產量的菌株。在特定實施方式中,Cpf1 CRISPR系統可以應用於如在此所述的用於鑒定在異戊二烯合成中使用的另外高產的酵母菌株的多種基因組工程化方法中。
使用Cpf1生成產乳酸酵母菌株
在另一個實施方式中,涵蓋多種Cpf1 CRISPR系統的成功應用。與弗羅茨瓦夫斯迪維塞克(Vratislav Stovicek)等人(代謝工程通訊(Metabolic Engineering Communications),第2卷,2015年12月,第13-22頁)類似地,改進的產乳酸菌株可以單一轉化事件來設計並獲得。在一個特定實施方式中,Cpf1 CRISPR系統用於同時插入異源乳酸脫氫酶基因並破壞兩個內源性基因PDC1和PDC5基因。
在植物中進一步應用Cpf1 CRISPR系統
在特定實施方式中,CRISPR系統以及較佳的是在此所述的Cpf1 CRISPR系統可以用於視覺化遺傳元件動力學。例如,CRISPR成像可以視覺化重複或非重複基因組序列,報導端粒長度變化和端粒移動,並且監控整個細胞週期中的基因座位動力學(陳等人,細胞,2013)。該等方法也可以適用於植物。
CRISPR系統以及較佳的是在此所述的Cpf1 CRISPR系統的其他應用係體外和體內靶向基因破壞陽性選擇篩選(馬利娜(Malina)等人,基因與發育(Genes and Development),2013)。該等方法也可以適用於植物。
在特定實施方式中,失活Cpf1內切核酸酶與組蛋白修飾酶的融合可以在複雜的表觀基因組中引入自訂變化(魯斯克(Rusk)等人,自然方法(Nature Methods),2014)。該等方法也可以適用於植物。
在特定實施方式中,CRISPR系統以及較佳的是在此所述的Cpf1 CRISPR系統可以用於純化一個特定部分的染色質並且鑒定相關蛋白,從而闡明它們在轉錄中的調節作用(瓦爾錐普(Waldrip)等人,表觀遺傳學(Epigenetics),2014)。該等方法也可以適用於植物。
在特定實施方式中,本發明可以用在植物系統中的病毒清除療法,因為它能夠切割病毒DNA和RNA。以前的人類系統研究已證明利用CRISPR靶向丙型肝炎的單股RNA病毒(A..普裡斯(A.Price)等人,美國國家科學院院刊,2015)以及乙型肝炎的雙股DNA病毒(V..拉曼那(V.Ramanan)等人,科技報告(Sci.Rep),2015)係成功的。該等方法還可以適於在植物中使用Cpf1 CRISPR系統。
在特定實施方式中,本發明可以用於改變基因組複雜度。在另一個特定實施方式中,CRISPR系統以及較佳的是在此所述的Cpf1 CRISPR系統可以用於破壞或改變染色體數目並且生成
僅含有來自一個母體的染色體的單倍體植物。此類植物可以被誘導以經受染色體複製並且被轉化成僅含有純合對偶基因的二倍體植物(卡裡米-阿石提亞尼(Karimi-Ashtiyani)等人,美國國家科學院院刊,2015;安東(Anton)等人,2014)。該等方法也可以適用於植物。
在特定實施方式中,在此所述的Cpf1 CRISPR系統可以用於自切割。在該等實施方式中,Cpf1酶和gRNA的啟動子可以是組成型啟動子並且第二gRNA被引入在相同轉化盒中,但受到誘導型啟動子的控制。此第二gRNA可以被設計以誘導Cpf1基因中的位點特異性切割,以便創建非功能性Cpf1。在另一個特定實施方式中,第二gRNA在轉化盒的兩端誘導切割,從而使得該盒從宿主基因組中去除。此系統提供受控的細胞暴露於Cas酶的持續時間並且進一步最小化脫靶編輯。另外,CRISPR/Cas盒兩端的切割可以用於生成具有雙對偶基因突變的無轉基因T0植物(如對於Cas9所描述的,例如,莫耳(Moore)等人,核酸研究,2014;舍費爾(Schaeffer)等人,植物科學,2015)。莫耳等人的方法可以適用於在此所述的Cpf1 CRISPR系統。菅野(Sugano)等人(植物生理學2014年3月;55(3):475-81.doi:10.1093/pcp/pcu014.電子版2014年1月18日)報導了CRISPR-Cas9對於地錢屬地錢(Marchantia polymorpha L.)中的靶向誘導的應用,該地錢已做完用於研究陸生植物進化的模型種類。地錢的U6啟動子被鑒定並選殖,以表現gRNA。gRNA的靶序列被設計為破壞編碼地錢中的生長素響應因子1(ARF1)的基因。使用土壤桿菌介導的轉化,菅野等人分類了配子體世代的地錢的穩定突變體。基於CRISPR-Cas9的體內定點
誘變係使用表現Cas9的花椰菜花葉病毒35S或地錢EF1α啟動子來實現的。顯示生長素耐受表型的分離突變體個體係非嵌合的。此外,穩定的突變體係藉由T1植物的無性繁殖來產生的。arf1複對偶基因容易使用基於CRIPSR-Cas9的靶向誘變來建立。菅野等人的方法可以適用於本發明的Cpf1效應蛋白系統。
卡巴迪(Kabadi)等人(核酸研究,2014年10月29日;42(19):e147.doi:10.1093/nar/gku749.電子版2014年8月13日)開發了由藉由常規金門(Golden Gate)選殖方法結合到載體中的獨立RNA聚合酶III啟動子表現Cas9變體、報導基因和多至四個sgRNA的單一慢病毒系統。每個sgRNA被有效地表現並且可以介導無限增殖細胞和原代人類細胞中的多重基因編輯和持續的轉錄啟動。卡巴迪等人的方法可以適用於本發明的Cpf1效應蛋白系統。
林(Ling)等人(BMC植物生物學(BMC Plant Biology)2014,14:327)開發了基於pGreen或pCAMBIA骨架以及gRNA的CRISPR-Cas9二元載體集合。此工具包不需要除BsaI之外的限制酶來在僅僅一個選殖步驟中以高效率生成具有玉米密碼子優化的Cas9和一種或更多種gRNA的最終構建體。此工具包係使用玉米原生質體、轉基因玉米品系和轉基因擬南芥品系來驗證的並且顯示表現出高效率和高特異性。更重要地是,使用此工具包,檢測T1代轉基因幼苗中的三種擬南芥基因的靶向突變。此外,多個基因突變可以由下一代繼承。(指導RNA)模組載體集合,作為用於植物多重基因組編輯的工具包。林等人的工具包可以適用於本發明的Cpf1效應蛋白系統。
用於經由CRISPR-Cpf1進行靶向植物基因組編輯的方案基於系列文獻分子生物學方法(Methods in Molecular Biology,第239-255頁,2015年2月10日的)第1284卷中對於CRISPR-Cas9系統所揭露的那些方法也是可用的。描述了使用阿拉伯芥和本塞姆氏煙草原生質體來設計、構建並評價植物密碼子優化的Cas9(pcoCas9)介導的基因組編輯的雙gRNA的詳細程序。還討論了在全株植物中應用CRISPR-Cas9系統生成靶向基因組修飾的策略。在此章中描述的方案可以適用於本發明的Cpf1效應蛋白系統。
彼得森(Petersen)(“朝向精確乙二醇工程化植物(Towards precisely glycol engineered plants)”,植物生物技術丹麥年會(Plant Biotech Denmark Annual meeting)2015,丹麥哥本哈根(Copenhagen,Denmark))開發了使用CRISPR/Cas9工程化擬南芥中的基因組變化以便例如乙二醇工程化擬南芥以用於生產具有所希望的翻譯後修飾的蛋白質和產物的方法。赫布林斯察普(Hebelstrup)等人(植物科學前沿(Front Plant Sci.),2015年4月23日;6:247)列出了在植物中提供澱粉生物工程的農作物,該等農作物表現澱粉修飾酶並且直接產生通常藉由工業化學處理和/或物理處理澱粉來製成的產物。彼得森和赫布林斯察普的方法可以適用於本發明的Cpf1效應蛋白系統。
馬(Ma)等人(分子植物(Mol Plant.),2015年8月3日;8(8):1274-84.doi:10.1016/j.molp.2015.04.007)報導了利用植物密碼子優化的Cas9基因以在單子葉植物和雙子葉植物中方便且
高效地進行多重基因組編輯的穩健CRISPR-Cas9載體系統。馬等人設計了快速生成多個sgRNA表現盒的基於PCR的程序,該等表現盒可以在一輪選殖中藉由金門連接或吉布森(Gibson)組裝來組裝到二元CRISPR-Cas9載體中。使用此系統,馬等人編輯了在具有平均85.4%突變率的稻米中的46個靶位點,該等突變大部分係處於雙對偶基因狀態和純合狀態。馬等人提供了藉由同時靶向多個(多至八個)基因家族成員、生物合成途徑中的多基因或者單一基因中的多個位點來進行T0稻米和T1擬南芥植物中的失功能基因突變的實例。馬等人的方法可以適用於本發明的Cpf1效應蛋白系統。
勞德邇(Lowder)等人(植物生理學,2015年8月21日.pii:pp.00636.2015)還開發了能夠在植物中對表現的基因、沈默的基因或非編碼基因進行多重基因組編輯和轉錄調節的CRISPR-Cas9工具包。此工具包為研究者提供了使用金門選殖方法和通路(Gateway)選殖方法快速且有效地組裝單子葉植物和雙子葉植物的功能性CRISPR-Cas9 T-DNA構建體的方案和試劑。它具有一套完整的能力,包括植物內源性基因的多重基因編輯和轉錄啟動或阻遏。基於T-DNA的轉化技術係現代植物生物技術、遺傳學、分子生物學和生理學的基礎。像這樣,申請人開發了用於將Cas9(WT、切口酶或dCas9)和一種或多種gRNA組裝到感興趣的T-DNA目標載體中的方法。組裝方法係基於金門組裝和多位點通路(MultiSite Gateway)重組。對於組裝需要三態模組。第一模組係含有無啟動子Cas9或其側接attL1和attR5位點的衍生物基因的Cas9入門載體。第二模組係含有側接attL5和attL2位點的入門
gRNA表現盒的gRNA入門載體。第三模組包括為Cas9表現提供啟動子選擇的含attR1-attR2目標T-DNA載體。勞德邇等人的工具包可以適用於本發明的Cpf1效應蛋白系統。
在一有利實施方式中,該植物可以是樹。本發明還利用在此揭露的CRISPR Cas系統用於草本系統(例如,參見,貝爾哈吉(Belhaj)等人,植物方法(Plant Methods)9:39和哈里森(Harrison)等人,基因與發育28:1859-1872)。在一特別有利的實施方式中,本發明的CRISPR Cas系統可以靶向樹的單核苷酸多態性(SNP)(例如,參見,週等人,新植物學家(New Phytologist),第208卷,第2期,第298-301頁,2015年10月)。在週等人的研究中,作者們在木質多年生楊樹中使用4-香豆酸酯:CoA連接酶(4CL)基因家族作為個案研究來採用CRISPR Cas系統並且對於所靶向的兩個4CL基因實現100%突變效率,其中每個轉化株檢查攜帶的雙對偶基因修飾。在週等人的研究中,CRISPR-Cas9系統對於單核苷酸多態性(SNP)高度敏感,因為對第三4CL基因的切割因靶序列中的SNP而消除。該等方法可以適用於本發明的Cpf1效應蛋白系統。
週等人的方法(新植物學家,第208卷,第2期,第298-301頁,2015年10月)可以如下地適用於本發明。對於CRISPR-Cas9編輯,靶向分別與木質素和黃酮類生物合成相關聯的兩種4CL基因4CL1和4CL2。通常用於轉化的歐洲山楊×銀白楊(Populus tremula×alba)殖株717-1B4係與基因體定序的毛果楊趨異的。因此,由參考基因組設計的4CL1和4CL2 gRNA用內部717 RNA-序列
資料探察,以確保不存在可能限制Cas效率的SNP。還包括對於4CL1的基因組複製物4CL5設計的第三gRNA。相應717序列在PAM附近/內部的每個對偶基因中具有一個SNP,對偶基因二者預期消除了由4CL5-gRNA進行的靶向。所有三個gRNA靶向位點都係位於第一外顯子內。對於717轉化,gRNA由苜蓿屬U6.6啟動子表現,連同在二元載體內的CaMV 35S啟動子控制下表現人類密碼子優化的Cas。使用僅Cas的載體的轉化可以充當對照。隨機選擇的4CL1和4CL2品系經受擴增子定序。然後處理資料並且確認所有情況中的雙對偶基因突變。該等方法可以適用於本發明的Cpf1效應蛋白系統。
在植物中,病原體常常是宿主特異性的。例如,尖孢鐮刀菌某種番茄專化型(Fusarium oxysporum f.sp.lycopersici)引起番茄枯萎病但僅攻擊番茄,而尖孢鐮刀菌某種柄鏽菌小麥專化型(F.oxysporum f. dianthii Puccinia graminis f.sp.tritici)僅攻擊小麥。植物具有現存和誘導的防衛以抵抗大部分病原體。跨植物各代的突變和重組事件導致引起易感性的遺傳變異性,特別是當病原體以比植物更大頻率繁殖時。在植物中,可以存在非宿主抗性,例如,宿主和病原體係不相容的。還可以存在典型地受到許多基因控制的水平抗性,例如針對所有病原體種族的部分抗性,以及典型地受到幾種基因控制的垂直抗性,例如對一些病原體種族而不是其他種族的競爭性抗性。在基因對基因的水平中,植物和病原體一起進化,並且在一者中的遺傳變化與另一者中的變化平衡。因此,使用自然變異,培育者組合大部分對於產量、品質、均勻性、抵抗力、抗性的可用基因。抗性基因的來源包括天然或
外來品種、祖傳品種、野生植物近緣種、以及誘發突變,例如用誘變劑處理植物材料。使用本發明,為植物育種者提供誘導突變的新工具。因此,熟習該項技術者可以分析抗性基因來源的基因組,並且在具有所希望的特徵或性狀的品種中採用本發明誘導產生抗性基因,這具有比先前的誘變劑更大的精確度,並且因此加速並改進植物育種程式。
改進的植物和酵母細胞
本發明還提供了藉由在此所述的方法可獲得並藉由該等方法獲得的植物和酵母細胞。藉由在此所述的方法獲得的改進的植物可以適用於藉由表現確保例如對植物害蟲、除草劑、乾旱、低溫或高溫、過量水等耐受的基因來進行食品或飼料生產。
藉由在此所述的方法獲得的改進的植物,具體地是農作物和藻類可以適用於藉由表現例如比野生型中通常所見更高的蛋白質、碳水化合物、營養素或維生素水平來進行食品或飼料生產。就這一點而言,改進的植物,具體地是豆類和塊莖類係較佳的。
改進的藻類或其他植物諸如芸苔可以例如特別適用於生產植物油或生物燃料諸如醇(具體地是甲醇和乙醇)。該等藻類可以被工程化以表現或過量表現用於油或生物燃料工業中的高水平油或醇。
本發明還提供了改進的植物部分。植物部分包括但不限於,葉、莖、根、塊莖、種子、胚乳、胚珠、以及花粉。如在此
所設想的植物部分可以是有活力的、無活力的、可再生的、和/或不可再生的。
在此還涵蓋的是提供根據本發明的方法生成的植物細胞和植物。在本發明的範圍內還包括藉由傳統育種方法產生的含有遺傳修飾的植物的配子、種子、胚胎(合子胚或體細胞胚)、子代或雜種。此類植物可以含有插入在靶序列處或代替靶序列的異源或外源DNA序列。可替代地,此類植物可以僅含有在一個或多個中的變化(突變、缺失、插入、取代)。這樣,此類植物與祖代植物的不同之處僅在於特定修飾的存在。
因此,本發明提供了藉由本發明產生的植物、動物或細胞、或其子代。該子代可以是產生的植物或動物的選殖,或者可以由藉由與相同種類的其他個體雜交以使另外希望的性狀滲入其後代來進行的有性繁殖產生。在多細胞生物體(具體的是動物或植物)的情況下,該細胞可以是體內或離體的。
Cpf1效應蛋白複合物可以用於非人類生物體/動物
在一個方面中,本發明提供了非人類真核生物體;較佳的是多細胞真核生物體,該等生物體包含根據任何所述實施方式的真核宿主細胞。在其他方面中,本發明提供了真核生物體;較佳的是多細胞真核生物體,該等生物體包含根據任何所述實施方式的真核宿主細胞。在該等方面的一些實施方式中,該生物體可以是動物;例如,哺乳動物。而且,該生物體可以是節肢動物,諸如昆蟲。生物體還可以是植物。另外,生物體可以是真菌。
本發明還可以擴展到其他農業應用,例如像農場和生產動物。例如,豬具有許多特徵,該等特徵使得它們作為生物醫學模型係有吸引力的,尤其是在再生醫學中。具體地說,具有重症聯合免疫缺陷(SCID)的豬可以提供用於再生醫學、異種移植(也在此的其他位置討論)以及腫瘤發展的有用模型並且將有助於開發用人類SCID患者的治療。李等人(美國國家科學院院刊,2014年5月20日;111(20):7260-5)利用報導基因指導的轉錄活化物樣效應核酸酶(TALEN)系統,以高效率生成體細胞中的重組啟動基因(RAG)2的靶向修飾,包括影響兩種對偶基因的一些修飾。Cpf1效應蛋白可以適用於類似的系統。
李等人的方法(美國國家科學院院刊,2014年5月20日;111(20):7260-5)可以與如下類似地適用於本發明。突變的豬係藉由靶向修飾胎兒成纖維細胞中的RAG2,隨後進行SCNT和胚胎轉移來產生的。編碼CRISPR Cas和報導基因的構建體被電穿孔到胎兒來源的成纖維細胞中。在48h後,表現綠色螢光蛋白的轉染細胞以估計每孔一個單一細胞的稀釋分到96孔板的單個孔中。RAG2的靶向修飾係藉由擴增側接任何CRISPR Cas切割位點的基因組DNA片段隨後對PCR產物進行定序來篩選的。在篩選並確保不存在位點外突變之後,將攜帶RAG2的靶向修飾的細胞用於SCNT。去除極體連同卵母細胞的一部分相鄰細胞質(推測含有中期II板),並且使供體細胞置於卵黃周隙中。然後電穿孔重構的胚胎,以將供體細胞與卵母細胞融合,並且然後化學啟動。將啟動的胚胎在具有0.5μM Scriptaid(S7817;西格馬阿德里奇公司)豬受精卵培養基(Porcine Zygote Medium)3(PZM3)中培養14-16
h。然後洗滌胚胎以去除Scriptaid並且在PZM3中培養,直到它們轉移到代孕豬的輸卵管為止。
本發明還可應用於修飾其他動物諸如牛的SNP。塔恩(Tan)等人(美國國家科學院院刊,2013年10月8日;110(41):16526-16531)使用質粒、rAAV和寡核苷酸模板擴增家畜基因編輯工具包,以包括轉錄活化物樣(TAL)效應核酸酶(TALEN)和成簇規律間隔短迴文重複序列(CRISPR)/Cas9-刺激性同源定向修復(HDR)。根據他們的方法將基因特異性gRNA序列選殖到丘奇實驗室(Church lab)gRNA載體(Addgene ID:41824)中(馬里.P(Mali P)等人,(2013)經由Cas9進行RNA指導的人類基因組工程化(RNA-Guided Human Genome Engineering via Cas9)。科學339(6121):823-826)。Cas9核酸酶係藉由共轉染hCas9質粒(Addgene ID:41815)或由RCIScript-hCas9合成的mRNA來提供的。此RCIScript-hCas9係藉由將來自hCas9質粒(涵蓋hCas9 cDNA)的XbaI-AgeI片段亞選殖到RCIScript質粒中來構建。
霍(Heo)等人(幹細胞與發育(Stem Cells Dev.),2015年2月1日;24(3):393-402.doi:10.1089/scd.2014.0278.電子版2014年11月3日)報導了在牛基因組中使用牛多能細胞和成簇規律間隔短迴文重複序列(CRISPR)/Cas9核酸酶的高效基因靶向。首先,霍等人藉由異位表現山中因子(yamanaka factor)並且進行GSK3β和MEK抑制劑(2i)處理來由牛體成纖維細胞生成誘導的多能幹細胞(iPSC)。霍等人觀察到,該等牛iPSC在畸胎瘤的基因表現和發育潛力方面高度類似於天然多能幹細胞。此外,對於牛
NANOG座位特異的CRISPR-Cas9核酸酶在牛iPSC和胚胎的牛基因組中顯示高度有效的編輯。
Igenity®提供了對諸如牛的動物執行並傳播經濟上重要的經濟性狀的性狀的譜圖分析,該等性狀諸如胴體組成、胴體質量、母體和繁殖性狀以及平均日增重。綜合性Igenity®譜圖的分析以DNA標記物(最常是單核苷酸多態性或SNP)的發現開始。在Igenity®譜圖之後的所有標記物係藉由科研機構的獨立科學家發現的,該等研究機構包括大學、研究團體以及政府機構諸如USDA。然後在驗證群體中分析Igenity®的標記物。Igenity®使用代表各種生產環境和生物類型的多種資源種群,通常與來自牛肉產業的種畜、母犢牛、飼育場和/或包裝部門的行業夥伴一起工作,以收集不能普遍獲得的表型。牛基因組資料庫係廣泛可用的,例如,參見NAGRP牛基因組協調程序(http://www.animalgenome.org/cattle/maps/db.html)。因此,本發明可以適用於靶向牛SNP。熟習該項技術者可以利用用於靶向SNP的以上方案並且將它們應用於牛SNP,例如,如塔恩等人或霍等人所述的。
清澗.鄒(Qingjian Zou)等人(分子細胞生物學雜誌(Journal of Molecular Cell Biology),在2015年10月12日線上先行公開)證明藉由靶向狗肌生成抑制蛋白(MSTN)基因的第一外顯子(骨骼肌質量的負調節物)增加狗的肌肉質量。首先,藉由將sgRNA靶向的MST與Cas9載體共轉染到犬胚胎成纖維細胞(CEF)來驗證sgRNA的效率。之後,藉由微注射具有正常形態學的胚胎
與Cas9 mRNA和MSTN sgRNA的混合物並且將受精卵自身移植到同一母狗的輸卵管來生成MSTN KO狗。與其野生型同窩出生母狗相比,敲除小狗在大腿上顯示明顯的肌肉表型。這也可以使用在此提供的Cpf1 CRISPR系統來進行。
家畜-豬
在一些實施方式中,家畜中的病毒靶標可以包括豬CD163,例如在豬巨噬細胞上。CD163與PRRSv(豬繁殖與呼吸綜合症病毒,它係一種動脈炎病毒)的感染(認為是藉由病毒細胞侵入)相關聯。PRRSv的感染,特別是對豬肺泡巨噬細胞(可見於肺中)的感染導致先前不能治癒的豬綜合症(“神秘病”或“藍耳病”),從而使得家豬遭受(包括)生殖障礙、體重減輕和高死亡率。常常可見機會性感染諸如流行性肺炎、腦膜炎和耳腫脹,這係因為藉由巨噬細胞活性喪失會引起免疫缺陷。由於抗生素使用的增加和經濟損失(估計每年660百萬美元),這也具有重大的經濟和環境影響。
如密蘇裡大學(University of Missouri)的克莉絲汀.W.惠特沃思和蘭德爾.普萊瑟(Randall Prather)博士等人與Genus公司合作(自然生物技術3434,2015年12月07日線上公開)報導的,使用CRISPR-Cas9靶向CD163並且編輯的豬的後代當暴露於PRRSv時是有抗性的。在CD163的外顯子7中均具有突變的一個雄性起始者和一種雌性起始者二者繁殖產生後代。雄性起始者在對偶基因的外顯子7中具有11-bp的缺失,這導致移碼突變以及結構域5中的胺基酸45的錯義翻譯和胺基酸64處的後一個提前終止
密碼子。另一個對偶基因具有外顯子7中的2-bp添加和前述內含子中的377-bp缺失,這被預測為引起結構域5的前49個胺基酸的表現,隨後是在胺基酸85處的提前終止密碼子。母豬在一個對偶基因中具有7bp添加,該添加在翻譯時預測表現結構域5的前48個胺基酸,隨後是在胺基酸70處的提前終止密碼子。母豬的另一個對偶基因係不可擴增的。預測選定的後代係無效突變動物(CD163-/-),即CD163敲除。
因此,在一些實施方式中,豬肺泡巨噬細胞可以被CRISPR蛋白靶向。在一些實施方式中,豬CD163可以被CRISPR蛋白靶向。在一些實施方式中,豬CD163可以藉由誘導DSB或藉由插入或缺失來敲除,例如靶向外顯子7的缺失或修飾,包括以上所述的那些缺失或修飾中的一種或多種,或者在該基因的其他區域中,例如外顯子5的缺失或修飾。
還設想了編輯的豬及其子代,例如CD163敲除豬。這可以是出於家畜、育種或建模目的(即,豬模型)。還提供了包含基因敲除的精液。
CD163係清道夫受體富含半胱胺酸(SRCR)超家族的成員。基於體外研究,蛋白質的SRCR結構域5係負責啟封和釋放病毒基因組的結構域。這樣,也可以靶向SRCR超家族的其他成員,以便評定對其他病毒的抗性。PRRSV也是哺乳動物動脈炎病毒組的成員,該病毒組還包括鼠科乳酸脫氫酶病毒、猴出血熱病毒以及馬動脈炎病毒。該等動脈炎病毒享有重要的發病機理特徵,包括巨噬細胞向性和引起嚴重疾病和持續感染二者的能力。因此,
動脈炎病毒以及具體地乳酸脫氫酶病毒、猴出血熱病毒和馬動脈炎病毒可以例如藉由豬CD163或其在其他種類中的同源物,並且還提供鼠科、猴和馬的模型以及敲除。
實際上,此方法可以擴展到引起其他家畜疾病且可以傳播到人類的病毒或細菌,諸如豬流感病毒(SIV)菌株,包括丙型流感和稱為H1N1、H1N2、H2N1、H3N1、H3N2以及H2N3的甲型流感亞型,以及以上提及的肺炎、腦膜炎和水腫。
使用RNA-指導的Cpf1效應蛋白複合物進行治療性靶向
如將清楚的,設想的是本發明系統可以用於靶向任何感興趣的多核苷酸序列。本發明提供了非天然存在的或工程化的組成物、或編碼所述組成物的組分的一種或多種多核苷酸、或含有編碼所述組成物的組分一種或多種多核苷酸的載體或遞送系統,其用於體內、離體或體外修飾靶細胞並且該修飾可以改變細胞使得一旦修飾,CRISPR修飾細胞的子代或細胞系保留改變的表型的方式實施。該等修飾的細胞和子代可以是多細胞生物體的一部分,諸如在將CRISPR系統應用於所希望的細胞類型的情況下的植物或動物。CRISPR發明可以是治療性治療方法。治療性治療方法可以包括基因或基因組編輯,或基因治療。
治療病原體,如細菌、真菌和寄生蟲病原體
本發明還可以適用於治療細菌、真菌和寄生蟲病原體。大部分研究工作集中於開發新的抗生素,然而一旦開發,就會經受相同的抗藥性問題。本發明提供了克服該等困難的新型基於
CRISPR的替代方案。另外,與現存的抗生素不同,基於CRISPR的治療可以是製成病原體特異性的,從而誘導靶病原體的細菌細胞死亡同時避免有益細菌死亡。
蔣(Jiang)等人(“使用CRISPR-Cas對細菌基因組進行RNA指導編輯(RNA-guided editing of bacterial genomes using CRISPR-Cas systems)”,自然生物技術,第31卷,第233-9頁,2013年3月)使用CRISPR-Cas9系統來突變或殺死肺炎鏈球菌或大腸桿菌。將精確突變引入到基因組中的工作依賴於靶基因組位點處的雙-RNA:Cas9-引導的切割以殺死未突變細胞,並且不再需要選擇標記物或反選擇系統。CRISPR系統已用於逆轉抗生素抗性並且消除各菌株之間的抗性轉移。比克考爾德(Bickard)等人證實重編程式以靶向致病基因的Cas9殺死了致命的金黃色葡萄球菌而不是無毒的金黃色葡萄球菌。將核酸酶重編程式以靶向抗生素抗性基因,破壞了具有抗生素抗性基因的葡萄球菌質粒並且針對質粒攜帶的抗性基因的傳播進行免疫。(參見,比卡爾德(Bikard)等人,“探索產生序列特異性抗微生物劑的CRISPR-Cas核酸酶(Exploiting CRISPR-Cas nucleases to produce sequence-specific antimicrobials)”,自然生物技術,第32卷,1146-1150,doi:10.1038/nbt.3043,2014年10月05日線上公開)。比卡爾德證實CRISPR-Cas9抗微生物劑在體內起到殺死老鼠皮膚定位模型中的金黃色葡萄球菌的作用。類似地,優素福(Yosef)等人使用CRISPR系統來靶向編碼賦予β內醯胺類抗生素抗性的酶的基因(參見優素福等人,“程式設計以敏化並殺死抗生素抗性細菌的溫和和烈性噬菌體(Temperate and lytic bacteriophages programmed to sensitize
and kill antibiotic-resistant bacteria)”,美國國家科學院院刊,第112卷,第7267-7272頁,doi:10.1073/pnas.1500107112,2015年5月18日線上公開)。
CRISPR系統可以用於編輯對其他遺傳方法具有抗性的寄生蟲基因組。例如,已顯示CRISPR-Cas9系統能將雙股斷裂引入到約氏瘧原蟲基因組(參見,張等人,“使用CRISPR/Cas9系統有效編輯瘧原蟲基因組(Efficient Editing of Malaria Parasite Genome Using the CRISPR/Cas9 System)”,mBio.,第5卷,e01414-14,2014年7月-8月)。古爾巴爾(Ghorbal)等人(“使用CRISPR-Cas9系統在人類瘧原蟲鐮狀瘧原蟲中進行基因組編輯(Genome editing in the human malaria parasite Plasmodium falciparumusing the CRISPR-Cas9 system)”,自然生物技術,第32卷,第819-821頁,doi:10.1038/nbt.2925,2014年6月1日線上公開)修飾了兩種基因orc1和kelch13的序列,這兩種基因分別在基因沈默和形成對青蒿素的抗性中具有推定的作用。儘管對於該修飾沒有直接選擇,但是在適當位點改變的寄生蟲以極高效率恢復,這表明使用此系統可以生成中性突變或甚至有害突變。CRISPR-Cas9還用於修飾其他致病性寄生蟲的基因組,包括剛地弓形蟲(參見沈等人,“使用CRISPR/CAS9在剛地弓形蟲的不同菌株中進行有效基因破壞(Efficient gene disruption in diverse strains of Toxoplasma gondii using CRISPR/CAS9)”,mBio,第5卷:e01114-14,2014;以及西迪克(Sidik)等人,“使用CRISPR/Cas9進行剛地弓形蟲的有效基因組工程化(Efficient Genome Engineering of Toxoplasma gondii Using CRISPR/Cas9)”,公共科學圖書館綜合,第9卷,e100450,
doi:10.1371/journal.pone.0100450,2014年6月27日線上公開)。
維亞斯(Vyas)等人(“白色念珠菌CRISPR系統允許對必需基因和基因家族進行遺傳工程化(A Candida albicans CRISPR system permits genetic engineering of essential genes and gene families)”,科學進展(Science Advances),第1卷,e1500248,DOI:10.1126/sciadv.1500248,2015年4月3日)採用CRISPR系統來克服白色念珠菌中長期存在的遺傳工程化障礙並且在幾種不同基因的兩個拷貝的單一實驗中進行有效突變。在其他幾種機制促成抗藥性的有機體中,維亞斯產生不再顯示母體臨床分離物Can90顯示的對氟康唑或放線菌酮的抗性的純合雙突變體。維亞斯還藉由創建條件對偶基因來獲得白色念珠菌的必需基因中的純合的失功能突變。對於核糖體RNA加工所需要的DCR1無效對偶基因在低溫下是致命的,但是在高溫下是可存活的。維亞斯使用引入無效突變的修復模板和不能在16℃下生長的分離的dcr1/dcr1突變體。
本發明的CRISPR系統藉由破壞染色體座位來用於鐮狀瘧原蟲中。古爾巴爾等人(“使用CRISPR-Cas9系統在人類瘧原蟲鐮狀瘧原蟲中進行基因組編輯”,自然生物技術,32,819-821(2014),DOI:10.1038/nbt.2925,2014年6月1日)採用CRISPR系統來在瘧疾基因組中引入特異性基因敲除和單一核苷酸取代。為了使CRISPR-Cas9系統適於鐮狀瘧原蟲,古爾巴爾等人生成在也攜帶藥物選擇標記物ydhodh的pUF1-Cas9附加體中的瘧原蟲調節元件控制下並且用於轉錄sgRNA的表現載體,該附加體給予對鐮狀瘧原蟲 二氫乳清酸脫氫酶(PfDHODH)抑制劑DSM1的抗性,使
用鐮狀瘧原蟲U6小核(sn)RNA調節元件,將用於同源重組修復的指導RNA和供體DNA模板置於相同質粒pL7上。還參見,張.C.等人(“使用CRISPR/Cas9系統有效編輯瘧原蟲基因組(Efficient editing of malaria parasite genome using the CRISPR/Cas9 system)”,MBio,2014年7月1日;5(4):E01414-14,doi:10.1128/MbIO.01414-14)和瓦格納等人(“鐮狀瘧原蟲中的有效CRISPR-Cas9介導的基因組編輯(Efficient CRISPR-Cas9-mediated genome editing in Plasmodium falciparum)”,自然方法11,915-918(2014),DOI:10.1038/nmeth.3063)。
治療病原體,如病毒病原體,諸如HIV
Cas-介導的基因組編輯可以用於在軀體組織中引入保護性突變,以對抗非遺傳性疾病或複雜疾病。例如,淋巴細胞中NHEJ-介導的CCR5受體滅活(隆巴爾多(Lombardo)等人,自然生物技術,2007年11月;25(11):1298-306)可以是用於避免HIV感染的可行策略,而PCSK9(科恩(Cohen)等人,自然遺傳學,2005年2月;37(2):161-5)或血管生成素(木蘇努魯(Musunuru)等人,新英格蘭醫學雜誌,2010年12月2日;363(23):2220-7)的缺失可以提供針對具有他汀類抗性的血膽固醇過多或高血脂症的治療作用。儘管該等靶標也可以使用siRNA介導的蛋白質敲低來解決,但是NHEJ介導的基因失活優點係實現永久性治療益處而不需要持續治療的能夠。正如所有基因治療一樣,確定每個提出的治療性用途具有有利的益處-危險比率當然是重要的。
將編碼Cas9和指導RNA的質粒DNA連同修復模板一
起流體動力學遞送到酪胺酸血症成年小鼠模型的肝臟中,已顯示此遞送能夠校正突變體Fah基因並且在約250分之一個細胞中挽救野生型Fah蛋白質的表現(自然生物技術,2014年6月;32(6):551-3)。另外,臨床試驗成功地使用ZF核酸酶,藉由離體敲除CCR5受體來對抗HIV感染。在所有患者中,HIV DNA水平降低,並且在四分之一的患者中,HIV RNA變得不可檢測(特巴斯(Tebas)等人,新英格蘭醫學雜誌,2014年3月6日;370(10):901-10)。這兩種結果都表明了可程式設計核酸酶作為一種新治療平臺的希望。
在另一個實施方式中,自滅活慢病毒載體可以用於並且/或者適於本發明的CRISPR-Cas系統,該自滅活慢病毒載體具有靶向由HIV tat/rev共用的共有外顯子的siRNA、核仁定位TAR誘餌、和抗CCR5特異性錘頭狀核酶(例如,參見,迪吉斯托等人(2010)科學轉化醫學2:36ra43)。可以收集最少2.5×106個CD34+細胞/每千克患者體重並且以2×106個細胞/ml的密度在X-VIVO 15培養基(龍沙公司)中預刺激16至20小時,該培養基含有2μmol/L-穀胺醯胺、幹細胞因子(100ng/ml)、Flt-3配位基(Flt-3L)(100ng/ml)和促血小板生成素(10ng/ml)(CellGenix公司)。可以用慢病毒以感染複數5在75-cm2的包被有纖連蛋白(25mg/cm2)(重組人纖維連接片斷(RetroNectin),寶生物工程株式會社)的組織培養瓶中轉導預刺激的細胞16至24小時。
藉由本領域的知識和本揭露中的教義,技術人員可以校正HSC至免疫缺陷條件,諸如HIV/AIDS,包括使HSC與靶向並敲除CCR5的CRISPR-Cas9系統接觸。靶向並敲除含有CCR5-和-
Cpf1蛋白的粒子的指導RNA(以及有利地雙指導方法,例如一對不同的指導RNA;例如,靶向原代人類CD4+ T細胞和CD34+造血幹細胞以及祖細胞(HSPC)中的兩種臨床相關基因B2M和CCR5的指導RNA)與HSC接觸。可以給予如此接觸的細胞;並且視情況處理/擴增;參考卡蒂亞(Cartier)。還參見,凱門(Kiem),“用於HIV疾病的基於造血幹細胞的基因治療(Hematopoietic stem cell-based gene therapy for HIV disease)”,細胞幹細胞(Cell Stem Cell.),2012年2月3日;10(2):137-147;該文獻連同其引用的文獻一起藉由引用結合在此;曼達爾(Mandal)等人,“使用CRISPR/Cas9有效消除人類造血幹細胞和效應細胞中的基因(Efficient Ablation of Genes in Human Hematopoietic Stem and Effector Cells using CRISPR/Cas9),”細胞幹細胞,第15卷,第5期,第643-652頁,2014年11月6日;該文獻連同其引用的文獻一起藉由引用結合在此。還參考“藉由編輯HIV-1整合的前病毒DNA來抑制HIV-1表現的CRISPR/Cas9系統(CRISPR/Cas9 system to suppress HIV-1 expression by editing HIV-1 integrated proviral DNA)”科技報告| 3:2510 | DOI:10.1038/srep02510,該文獻連同其所引用的文獻一起藉由引用結合在此,作為用於使用CRISPR-Cpf1系統對抗HIV/AIDS的另一種方式。
用於HIV治療的基因組編輯的基本原理起源於以下觀察:對於CCR5(病毒的細胞共受體)中的失功能突變純合的個體對感染具有高抗性並且以其他方式獲得健康,這表明藉由基因組編輯模擬此突變可能是安全且有效的治療策略[劉,R.等人,細胞86,367-377(1996)]。當HIV感染的患者被給予來自對失功能
CCR5突變純合的供體的同種異體骨髓移植,從而導致不可檢測的HIV水平和正常CD4 T細胞計數的恢復時,這個想法在臨床上得到證實[胡特爾,G.(Hutter,G.)等人,新英格蘭醫學雜誌(The New England journal of medicine)360,692-698(2009)]。儘管骨髓移植對於大部分HIV患者而言由於成本和潛在移植物對抗宿主疾病而是不現實的治療策略,但將患者自身T細胞轉化為CCR5的HIV治療則係希望的。
使用ZFN和NHEJ敲除人源化小鼠HIV模型中的CCR5的早期研究顯示CCR5編輯的CD4 T細胞的移植提高了病毒載量和CD4 T-細胞計數[佩雷斯,E.E.(Perez,E.E.)等人,自然生物技術26,808-816(2008)]。重要的是,該等模型還顯示HIV感染導致CCR5裸細胞的選擇,這表明編輯賦予了適合的優點並且潛在地允許少量編輯的細胞形成治療效果。
作為這個研究和其他希望的臨床前研究的結果,現在已在人類中測試了敲除人類T細胞中的CCR5的基因組編輯治療[霍爾特,N.(Holt,N.)等人,自然生物技術28,839-847(2010);李,L.等人,分子治療:美國基因治療協會雜誌(Molecular therapy:the journal of the American Society of Gene Therapy)21,1259-1269(2013)]。在最近的I期臨床試驗中,來自患有HIV的患者的CD4+ T細胞被去除,用設計敲除CCR5基因的ZFN編輯,並且自身移植回到患者中[特巴斯,P.等人,新英格蘭醫學雜誌370,901-910(2014)]。
在另一個研究(曼達爾等人,細胞幹細胞,第15卷,
第5期,第643-652頁,2014年11月6日)中,CRISPR-Cas9已靶向人類CD4+ T細胞和CD34+造血幹細胞和祖細胞(HSPC)中的兩種臨床相關基因B2M和CCR5。使用單一RNA指導序列引起HSPC中而不是T細胞中的高效誘變。雙重指導方法提高了兩種細胞類型中的基因缺失效力。經受使用CRISPR-Cas9的基因組編輯的HSPC保留多譜系潛能。預測的中靶和脫靶突變係經由HSPC中的靶序列定序來檢查的並且低水平的脫靶誘變僅在一個位點處觀察到。該等結果表明CRISPR-Cas9可以有效消除HSPC中具有最小脫靶誘變的基因,該等HSPC對於具有基於造血細胞的治療具有廣泛的適用性。
王等人(公共科學圖書館綜合,2014年12月26日;9(12):e115987.doi:10.1371/journal.pone.0115987)使用表現CRISPR相關蛋白9(Cas9)和CCR5指導RNA的慢病毒載體經由Cas9和單一指導RNA(指導RNA)來沈默CCR5。王等人證實表現Cas9和CCR5指導RNA的慢病毒載體到HIV-1易感性人類CD4+細胞中的單輪轉導產生高頻率的CCR5基因破壞。CCR5基因破壞的細胞不僅抵抗R5-向性HIV-1,包括傳輸/起始者(T/F)HIV-1分離株,而且在R5-向性HIV-1感染過程中比CCR5基因未破壞細胞具有選擇優勢。與在甚至轉導後84天仍穩定轉導的細胞中的該等CCR5指導RNA高度同源的潛在脫靶位點處的基因組突變藉由T7內切核酸酶I測定未檢測到。
法恩(Fine)等人(科技報告,2015年7月1日;5:10777.doi:10.1038/srep10777)鑒定了表現化膿鏈球菌Cas9(SpCas9)蛋
白片段的雙盒系統,該等蛋白片段在細胞中拼接在一起形成能夠進行位點特異性DNA切割的功能蛋白。使用特定CRISPR指導股,法恩等人證明此系統作為單一Cas9並且作為一對Cas9切割酶來切割人類HEK-293T細胞內的HBB和CCR5基因的效力。反式拼接的SpCas9(tsSpCas9)與野生型SpCas9(wtSpCas9)相比在標準轉染劑量下展示~35%的核酸酶活性,但是在較低給藥劑量下具有基本上降低的活性。tsSpCas9相對於wtSpCas9大大減小的開放閱讀框長度潛在地允許更複雜且更長的遺傳元件包裝到AAV載體中,包括組織特異性啟動子、多重指導RNA表現、以及與SpCas9的效應物結構域融合物。
李等人(普通病毒學雜誌(J Gen Virol.),2015年8月;96(8):2381-93.doi:10.1099/vir.0.000139.電子版2015年4月8日)證明CRISPR-Cas9可以有效介導細胞系中的CCR5座位的編輯,從而導致細胞表面上的CCR5表現的敲除。下一代定序揭示在預測的CCR5切割位點周圍引入了不同的突變。對於所分析的三種最有效的指導RNA中的每一種,在15個最高得分的潛在位點處未檢測到脫靶效應。藉由構建攜帶CRISPR-Cas9組分的嵌合Ad5F35腺病毒,李等人有效轉導原代CD4+ T-淋巴細胞並且破壞CCR5表現,並且正性轉導細胞被賦予了HIV-1抗性。
熟習該項技術者可以利用例如霍爾特,N.等人,自然生物技術28,839-847(2010);李,L.等人,分子治療:美國基因治療協會雜誌21,1259-1269(2013);曼達爾等人,細胞幹細胞,第15卷,第5期,第643-652頁,2014年11月6日;王等人(公共科
學圖書館綜合,2014年12月26日;9(12):e115987.doi:10.1371/journal.pone.0115987);法恩等人(科技報告,2015年7月1日;5:10777.doi:10.1038/srep10777)以及李等人(普通病毒學雜誌,2015年8月;96(8):2381-93.doi:10.1099/vir.0.000139.電子版2015年4月8日)的以上研究用於使用本發明的CRISPR Cas系統靶向CCR5。
治療病原體,如病毒病原體,諸如HBV
本發明還可以適用於治療乙型肝炎病毒(HBV)。然而,CRISPR Cas系統必須適於藉由例如優化劑量和序列來避免RNAi的缺點,諸如過度緊張的(oversatring)內源性小RNA途徑的風險(例如,參見,格林姆(Grimm)等人,自然,第441卷,2006年5月26日)例如,考慮諸如每位人類約1-10×1014個粒子的低劑量。在另一個實施方式中,針對HBV的CRISPR Cas系統可以脂質體諸如穩定的核酸脂質粒子(SNALP)來給予(例如,參見,莫里西等人,自然生物技術,第23卷,第8期,2005年8月)。考慮了每日靜脈內注射約1、3或5mg/kg/天的靶向SNALP中的HBV RNA的CRISPR Cas。日治療可以經過約三天,並且然後每週治療持續約五週。在另一個實施方式中,陳等人(基因治療(2007)14,11-19)的系統可以用於並且/或者適於本發明的CRISPR Cas系統。陳等人使用雙股腺相關病毒8-假病毒載體(dsAAV2/8)遞送shRNA。單次給予攜帶HBV-特異性shRNAA的dsAAV2/8載體(每隻小鼠1×1012個載體基因組)有效抑制HBV轉基因小鼠肝臟中的HBV蛋白、mRNA和複製DNA的穩定水平,從而使得循環中的HBV載量降低
多至2-3 log10。在載體給予後顯著HBV抑制持續至少120天。shRNA的治療效果係靶序列依賴性的並且並不涉及干擾素啟動。對於本發明,針對HBV的CRISPR Cas系統可以選殖到AAV載體諸如dsAAV2/8載體中並且例如以每位患者約1×1015個載體染色體至約1×1016個載體染色體的劑量給予。在另一個實施方式中,伍德爾(Wooddell)等人(分子治療,第21卷,第5期,973-985,2013年5月)的方法可以用於並且/或者適於本發明的CRISPR Cas系統。伍德爾等人還證實肝細胞靶向的N-乙醯半乳糖胺軛合的蜂毒肽樣肽(NAG-MLP)與肝臟向性膽固醇軛合的siRNA(chol-siRNA)靶向性凝血因子VII(F7)的簡單共注射引起小鼠和非人類靈長類動物中的有效F7敲低而不會有臨床化學變化或細胞介素的誘導。使用HBV感染的暫態和轉基因小鼠模型,伍德爾等人證實NAG-MLP與靶向保守性HBV序列的強效chol-siRNA的單次共注射引起病毒RNA、蛋白質和病毒DNA的複對數抑制,該效果持續時間長。對於本發明,可以設想例如約6mg/kg NAG-MLP與6mg/kg HBV特異性CRISPR Cas的靜脈內共注射。在替代方案中,可以在第一天遞送約3mg/kg NAG-MLP和3mg/kg HBV特異性CRISPR Cas,隨後在兩週後給予約2-3mg/kg NAG-MLP和2-3mg/kg HBV特異性CRISPR Cas。
林等人(分子治療-核酸(Mol Ther Nucleic Acids.)2014年8月19日;3:e186.doi:10.1038/mtna.2014.38)設計了針對基因型A HBV的八種gRNA。在使用HBV-特異性gRNA時,CRISPR-Cas9系統在用HBV表現載體轉染的Huh-7細胞中顯著減少HBV核心和表面蛋白。在八種篩選的gRNA中,鑒定了兩種有效的gRNA。
靶向保守性HBV序列的gRNA作用於不同基因型。使用流體動力學-HBV持久性小鼠模型,林等人進一步證明此系統可以切割含有肝內HBV基因組的質粒並且促進其在體內清除,從而使得血清表面抗原水平降低。該等資料表明CRISPR-Cas9系統可以破壞體外和體內二者的HBV表現模板,這表明其根除持久性HBV感染的可能性。
董(Dong)等人(抗病毒研究(Antiviral Res.),2015年6月;118:110-7.doi:10.1016/j.antiviral.2015.03.015.電子版2015年4月3日)使用CRISPR-Cas9系統靶向HBV基因組並且有效抑制HBV感染。董等人合成了靶向HBV保守區的四種單一指導RNA(指導RNA)。具有Cas9的該等指導RNA的表現減少了在Huh7細胞以及HBV-複製細胞HepG2.2.15中的病毒產生。董等人進一步證明CRISPR-Cas9直接切割和切割介導的誘變發生在轉染細胞的HBV cccDNA中。在攜帶HBV cccDNA的小鼠模型中,經由快速尾靜脈內注射指導RNA-Cas9質粒引起低水平的cccDNA和HBV蛋白。
林等人(普通病毒學雜誌,2015年8月;96(8):2252-61.doi:10.1099/vir.0.000159.電子版2015年4月22日)設計了靶向不同HBV基因型的保守區的八種指導RNA(gRNA),該等指導RNA可以在體外和體內顯著抑制HBV複製,以研究使用CRISPR-Cas9系統破壞HBV DNA模板的可能性。HBV特異性gRNA/Cpf1系統可以抑制細胞內不同基因型的HBV的複製,並且病毒DNA藉由單一gRNA/Cpf1系統顯著減少並且藉由不同gRNA/Cpf1系統的組合來清除。
王等人(世界胃腸病學雜誌(World J Gastroenterol.),2015年8月28日;21(32):9554-65.doi:10.3748/wjg.v21.i32.9554)設計了針對基因型A-D HBV的15種gRNA。選擇涵蓋HBV調節區域的兩種gRNA(雙-gRNA)的十一種組合。每種gRNA和11種雙gRNA對抑制HBV(基因型A-D)複製的效率係藉由測量培養基上清液中的HBV表面抗原(HBsAg)或e抗原(HBeAg)來檢查的。HBV-表現載體的破壞係在用雙-gRNA和HBV-表現載體共轉染的HuH7細胞中使用聚合酶鏈反應(PCR)和定序方法檢查的,並且cccDNA的破壞係在HepAD38細胞中使用KCl沈澱法、質粒安全性ATP依賴性DNA酶(PSAD)消化法、滾環擴增法以及定量PCR組合法來檢查的。該等gRNA的細胞毒性係藉由線粒體四唑測定來評估的。所有gRNA可以顯著減少培養上清液中的HBsAg或HBeAg產生,該產生依賴於gRNA所針對的區域。所有雙gRNA均可以有效抑制基因型A-D HBV的HBsAg和/或HBeAg產生,並且雙gRNA抑制HBsAg和/或HBeAg產生的效力與單獨使用的單一gRNA相比顯著增加。另外,藉由PCR直接定序,我們確認該等雙gRNA可以藉由去除兩種使用的gRNA的切割位點之間的片段來特異性破壞HBV表現模板。最重要的是,gRNA-5和gRNA-12組合不僅可以有效抑制HBsAg和/或HBeAg產生,而且破壞HepAD38細胞中的cccDNA儲層。
卡利莫瓦(Karimova)等人(科技報告,2015年9月3日;5:13734.doi:10.1038/srep13734)鑒定了在HBV基因組的S和X區域內由Cas9切割酶進行的特異性和有效性切割所靶向的交叉基因保守性HBV序列。此方法不僅破壞了報導細胞系中的附加型
cccDNA和染色體整合HBV靶位點,而且破壞長期感染和重新感染的肝癌細胞系中的HBV複製。
熟習該項技術者可以利用例如林等人(分子治療-核酸,2014年8月19日;3:e186.doi:10.1038/mtna.2014.38)、董等人(抗病毒研究,2015年6月;118:110-7.doi:10.1016/j.antiviral.2015.03.015.電子版2015年4月3日)、劉等人(普通病毒學雜誌,2015年8月;96(8):2252-61.doi:10.1099/vir.0.000159.電子版2015年4月22日)、王等人(世界胃腸病學雜誌,2015年8月28日;21(32):9554-65.doi:10.3748/wjg.v21.i32.9554)、以及卡利莫瓦等人(科技報告,2015年9月3日;5:13734.doi:10.1038/srep13734)的以上研究用於使用本發明的CRISPR Cas系統靶向HBV。
慢性乙型肝炎病毒(HBV)感染係流行的、致命的並且極少治癒的,這係因為病毒附加型DNA(cccDNA)在感染的細胞中持久性存在。拉曼那等人(拉曼那.V、舍羅曼.A(Shlomai A)、考克斯.DB(Cox DB)、施瓦茲.RE(Schwartz RE)、米凱利迪斯.E(Michailidis E)、巴塔.A(Bhatta A)、斯科特.DA、張.F、賴斯.CM(Rice CM)、巴蒂亞.SN(Bhatia SN),科技報告,2015年6月2日;5:10833.doi:10.1038/srep10833,2015年6月2日線上公開)顯示CRISPR/Cas9系統可以特異性靶向並切割HBV基因組中的保守區,從而能夠強烈抑制病毒基因表現和複製。當Cas9和適當選擇的指導RNA持續表現時,他們證明Cas9切割cccDNA並且cccDNA和病毒基因表現和複製的其他參數顯著降低。因此,他們證實直接靶
向病毒附加型DNA係一種控制病毒並且可能治癒患者的新型治療方法。這也描述於在布羅德研究所(Broad Institute)等人名下的WO2015089465 A1中,該專利的內容藉由引用結合在此。
在一些實施方式中,這樣靶向HBV中的病毒附加型DNA係較佳的。
本發明還可以適用於治療病原體,例如細菌、真菌和寄生蟲病原體。大部分研究工作集中於開發新的抗生素,然而一旦開發,就會經受相同的抗藥性問題。本發明提供了克服該等困難的新型基於CRISPR的替代方案。另外,與現存的抗生素不同,基於CRISPR的治療可以是製成病原體特異性的,從而誘導靶病原體的細菌細胞死亡同時避免有益細菌死亡。
本發明還可以適用於治療丙型肝炎病毒(HCV)。羅埃爾維奇(Roelvinki)等人(分子治療,第20卷,第9期,1737-1749,2012年9月)的方法可以適用於本發明的CRISPR Cas系統。例如,AAV載體諸如AAV8可以是考慮的載體並且例如可以考慮每千克體重約1.25×1011至1.25×1013個載體基因組(vg/kg)。本發明還可以適用於治療病原體,諸如細菌、真菌和寄生蟲病原體。大部分研究工作集中於開發新的抗生素,然而一旦開發,就會經受相同的抗藥性問題。本發明提供了克服該等困難的新型基於CRISPR的替代方案。另外,與現存的抗生素不同,基於CRISPR的治療可以是製成病原體特異性的,從而誘導靶病原體的細菌細胞死亡同時避免有益細菌死亡。
蔣等人(“使用CRISPR-Cas對細菌基因組進行RNA指
導編輯”,自然生物技術,第31卷,第233-9頁,2013年3月)使用CRISPR-Cas9系統來突變或殺死肺炎鏈球菌或大腸桿菌。將精確突變引入到基因組中的工作依賴於靶基因組位點處的雙-RNA:Cas9-引導的切割以殺死未突變細胞,並且不再需要選擇標記物或反選擇系統。CRISPR系統已用於逆轉抗生素抗性並且消除各菌株之間的抗性轉移。比克考爾德(Bickard)等人證實重編程式以靶向致病基因的Cas9殺死了致命的金黃色葡萄球菌而不是無毒的金黃色葡萄球菌。將核酸酶重編程式以靶向抗生素抗性基因,破壞了具有抗生素抗性基因的葡萄球菌質粒並且針對質粒攜帶的抗性基因的傳播進行免疫。(參見,比卡爾德等人,“探索產生序列特異性抗微生物劑的CRISPR-Cas核酸酶”,自然生物技術,第32卷,1146-1150,doi:10.1038/nbt.3043,2014年10月05日線上公開)。比卡爾德證實CRISPR-Cas9抗微生物劑在體內起到殺死老鼠皮膚定位模型中的金黃色葡萄球菌的作用。類似地,優素福等人使用一種CRISPR系統來靶向編碼賦予β內醯胺類抗生素抗性的酶的基因(參見優素福等人,“程式設計以敏化並殺死抗生素抗性細菌的溫和和烈性噬菌體”,美國國家科學院院刊,第112卷,第7267-7272頁,doi:10.1073/pnas.1500107112,2015年5月18日線上公開)。
CRISPR系統可以用於編輯對其他遺傳方法具有抗性的寄生蟲基因組。例如,已顯示CRISPR-Cas9系統能將雙股斷裂引入到約氏瘧原蟲基因組(參見,張等人,“使用CRISPR/Cas9系統有效編輯瘧原蟲基因組”,mBio.,第5卷,e01414-14,2014年7月-8月)。古爾巴爾等人(“使用CRISPR-Cas9系統在人類瘧原蟲鐮狀瘧原蟲中進行基因組編輯”,自然生物技術,第32卷,第819-821頁,
doi:10.1038/nbt.2925,2014年6月1日線上公開)修飾了兩種基因orc1和kelch13的序列,這兩種基因分別在基因沈默和形成對青蒿素的抗性中具有推定的作用。儘管對於該修飾沒有直接選擇,但是在適當位點改變的寄生蟲以極高效率恢復,這表明使用此系統可以生成中性突變或甚至有害突變。CRISPR-Cas9還用於修飾其他致病性寄生蟲的基因組,包括剛地弓形蟲(參見沈等人,“使用CRISPR/CAS9在剛地弓形蟲的不同菌株中進行有效基因破壞”,mBio,第5卷:e01114-14,2014;以及西迪克等人,“使用CRISPR/Cas9進行剛地弓形蟲的有效基因組工程化”,公共科學圖書館綜合,第9卷,e100450,doi:10.1371/journal.pone.0100450,2014年6月27日線上公開)。
維亞斯等人(“白色念珠菌CRISPR系統允許對必需基因和基因家族進行遺傳工程化”,科學進展,第1卷,e1500248,DOI:10.1126/sciadv.1500248,2015年4月3日)採用CRISPR系統來克服白色念珠菌中長期存在的遺傳工程化障礙並且在幾種不同基因的兩個拷貝的單一實驗中進行有效突變。在其他幾種機制促成抗藥性的有機體中,維亞斯產生不再顯示母體臨床分離物Can90顯示的對氟康唑或放線菌酮的抗性的純合雙突變體。維亞斯還藉由創建條件對偶基因來獲得白色念珠菌的必需基因中的純合的失功能突變。對於核糖體RNA加工所需要的DCR1無效對偶基因在低溫下是致命的,但是在高溫下是可存活的。維亞斯使用引入無效突變的修復模板和不能在16℃下生長的分離的dcr1/dcr1突變體。
用遺傳方面或表觀遺傳方面治療疾病
本發明的CRISPR-Cas系統可以用於校正先前使用TALEN和ZFN嘗試時有限成功的遺傳突變,並且已被鑒定為Cas9系統的潛在靶標,包括如在描述使用Cas9系統靶向座位以使用基因治療來治療性解決疾病的方法的愛迪塔斯醫藥公司(Editas Medicine)的公開申請中,包括格盧克曼(Gluckmann)等人的WO 2015/048577 CRISPR相關方法和組成物(CRISPR-RELATED METHODS AND COMPOSITIONS);格盧克曼等人的WO 2015/070083具有控制的gRNA的CRISPR相關方法和組成物(CRISPR-RELATED METHODS AND COMPOSITIONS WITH GOVERNING gRNAS);在一些實施方式中,提供了原發性開角型青光眼(POAG)的治療、預防或診斷。該靶標較佳的是MYOC基因。這描述於WO2015153780中,該專利的揭露內容藉由引用結合在此。
參考馬埃德爾(Maeder)等人的WO2015/134812用於治療Usher症候群和色素性視網膜炎的CRISPR/CAS相關方法和組成物(CRISPR/CAS-RELATED METHODS AND COMPOSITIONS FOR TREATING USHER SYNDROME AND RETINITIS PIGMENTOSA)。藉由在此的教義,本發明包括了該等文獻結合在此的教義應用的方法和材料。在眼睛和聽覺基因治療的一方面中,用於治療Usher症候群和色素性視網膜炎的方法和組成物可以適於本發明的CRISPR-Cas系統(例如,參見WO 2015/134812)。在一實施方式中,WO 2015/134812涉及藉由基因編輯治療IIA型Usher症候群(USH2A、USH11A)和色素性視網膜炎39(RP39)或延遲其發作或進展,該基因編輯例如使用CRISPR-
Cas9介導的方法校正USH2A基因的位置2299處的鳥嘌呤缺失(例如,置換USH2A基因的位置2299處的缺失的鳥嘌呤殘基)。使用Cpf1可以實現類似的效果。在一相關方面中,藉由使用一種或多種核酸酶、一種或多種切割酶或其組合來靶向突變,例如以誘導使用供體模板的HDR,以校正點突變(例如,單一核苷酸,例如鳥嘌呤缺失)。突變體USH2A基因的改變或校正可以是藉由任何機制介導的。可能與突變體HSH2A基因的改變(例如,校正)相關聯的示例性機制包括但不限於,非同源性末端接合、微同源性介導的末端接合(MMEJ)、同源定向修復(例如,內源性供體模板介導的)、SDSA(合成依賴性鏈退火)、單股退火或單股侵人。在一實施方式中,用於治療Usher症候群和色素性視網膜炎的方法可以包括獲取由受試者攜帶的突變的知識,例如藉由定序USH2A基因的適當部分。
還參考WO 2015/138510並且藉由在此的教義,本發明(使用CRISPR-Cas9系統)包括提供對萊伯氏先天性黑內障10(LCA 10)的治療或對其發作或進展的延遲。LCA 10係由CEP290基因的突變引起的,該突變例如a c.2991+1655,係在內含子26中引起隱蔽剪接位點的CEP290基因中的腺嘌呤到鳥嘌呤的突變。這係CEP290的內含子26的核苷酸1655處的突變,例如A到G的突變。CEP290也稱為:CT87;MKS4;POC3;rd16;BBS14;JBTS5;LCAJO;NPHP6;SLSN6;以及3H11Ag(例如,參見,WO 2015/138510)。在基因治療的一個方面中,本發明涉及在CEP290基因的至少一個對偶基因的LCA靶位置位點附近引入一個或多個斷裂(例如,c.2991+1655;A至G)。改變LCA10靶位置係指(1)緊密接近或
包括LCA10靶位置處斷裂誘導性引入indel(在此也稱為NHEJ-介導的indel引入(例如c.2991+1655A到G),或者(2)基因組序列的斷裂引入的缺失(在此也稱為NHEJ-介導的缺失),包括LCA10靶位置處的突變(例如,c.2991+1655A到G)。兩種方法都產生由LCA 10靶位置處的突變引起的隱蔽剪接位點的喪失或破壞。因此,特別設想Cpf1治療LCA的用途。
研究者考慮基因治療是否可以用於治療廣泛範圍的疾病。預想本發明基於Cpf1效應蛋白的CRISPR系統用於此類治療用途,包括但不限於進一步列舉的靶區域並且使用如下遞送方法。可以使用本發明系統有效治療的病狀或疾病的一些實例被包括於基因的實例和在此所包含的參考文獻中並且還提供目前與那些病狀相關聯的基因。所舉例說明的基因和病狀並不是詳盡的。
治療循環系統疾病
本發明還考慮向血液或造血幹細胞遞送CRISPR-Cas系統,具體地是在此所述的新型CRISPR效應蛋白系統。先前已描述了瓦爾葛籣(Wahlgren)等人(核酸研究,2012,第40卷,第17期e130)的血漿外來體並且該等血漿外來體可以用於將CRISPR Cas系統遞送至血液。本發明的核酸靶向系統還考慮治療血紅蛋白病,諸如地中海貧血和鐮狀細胞疾病。例如,參見,關於可以被本發明的CRISPR Cas系統靶向的潛在靶標的國際專利公開案號WO 2013/126794。
德拉科布盧(Drakopoulou)“評論文章,基於造血幹細胞的基因治療用於β地中海貧血的持續挑戰(Review Article,
The Ongoing Challenge of Hematopoietic Stem Cell-Based Gene Therapy for β-Thalassemia),”國際幹細胞雜誌(Stem Cells International),第2011卷,文章ID 987980,10頁,doi:10.4061/2011/987980,該文獻連同其引用的文獻如同完全列出一樣藉由引用結合在此,該文獻討論了使用遞送β-球蛋白或γ-球蛋白的基因的慢病毒修飾HSC。與使用慢病毒相比,藉由本領域的知識和本揭露的教義,技術人員可以使用靶向並校正突變的CRISPR-Cas系統(例如,具有遞送β-球蛋白或γ-球蛋白,有利地是非鐮狀β-球蛋白或γ-球蛋白的編碼序列的適合HDR模板)校正關於β地中海貧血的HSC;具體地說,指導RNA可以靶向引起β地中海貧血的突變,並且HDR可以提供對於β-球蛋白或γ-球蛋白的適當表現的編碼。使靶向含有突變-和-Cas蛋白的粒子的指導RNA與攜帶突變的HSC接觸。該粒子還可以含有校正對於β-球蛋白或γ-球蛋白的適當表現的突變的適合HDR;或者HSC可以與含有或遞送HDR模板的第二粒子或載體接觸。可以給予如此接觸的細胞;並且視情況處理/擴增;參考卡蒂亞。就這一點而言,參考:卡瓦紮娜(Cavazzana),“主要經由移植用慢病毒βA-T87Q-球蛋白載體離體轉導的自體造血幹細胞來進行β地中海貧血的基因治療的結果(Outcomes of Gene Therapy for β-Thalassemia Major via ransplantation of AutologousHematopoietic Stem Cells Transduced Ex Vivo with a Lentiviral βA-T87Q-Globin Vector)。”tif2014.org/abstractFiles/Jean%20Antoine%20Ribeil_Abstract.pdf;卡瓦紮娜-卡爾沃(Calvo),“在基因治療人類β-地中海貧血後的輸血自主性和HMGA2啟動(Transfusion independence and HMGA2
activation after gene therapy of human β-thalassaemia)”,自然467,318-322(2010年9月16日)doi:10.1038/nature09328;尼安慧思(Nienhuis),“地中海貧血的基因治療的發展(Development of Gene Therapy for Thalassemia)”,冷泉港醫學觀點(Cold Spring Harbor Perpsectives in Medicine),doi:10.1101/cshperspect.a011833(2012),LentiGlobin BB305,它係含有工程化β-球蛋白基因的慢病毒載體(βA-T87Q);以及謝(Xie)等人,“在患者特異性iPSC中使用CRISPR/Cas9和分段控制來無縫基因校正β地中海貧血性突變(Seamless gene correction of β-thalassaemia mutations in patient-specific iPSCs using CRISPR/Cas9 and piggyback)”,基因組研究gr.173427.114(2014)http://www.genome.org/cgi/doi/10.1101/gr.173427.114(冷泉港實驗室出版社);這係卡瓦紮娜涉及人類β-地中海貧血的工作主題和謝的工作主題,所有該等文獻連同其中引用或者與其相關聯的所有文獻一起藉由引用結合在此。在本發明中,HDR模板可以提供表現工程化β球蛋白基因(例如βA-T87Q)或者如謝所述的β-球蛋白的HSC。
許(Xu)等人(科技報告,2015年7月9日;5:12065.doi:10.1038/srep12065)已設計直接靶向球蛋白基因中的內含子2突變位點IVS2-654的TALEN和CRISPR-Cas9。許等人使用TALEN和CRISPR-Cas9觀察到在IVS2-654座位處的不同雙股斷裂(DSB)頻率,並且當與piggyBac轉位子供體組合時TALEN介導與CRISPR-Cas9相比更高的同源基因靶向效率。另外,與TALEN相比,對於CRISPR-Cas9觀察到更明顯的脫靶事件。最終,使用OP9共培
養系統選擇用於成紅細胞分化的TALEN校正的iPSC選殖並且檢測到比未校正細胞相對更高的HBB轉錄。
宋(Song)等人(幹細胞與發育,2015年5月1日;24(9):1053-65.doi:10.1089/scd.2014.0347.電子版2015年2月5日)使用CRISPR/Cas9校正β-Thal iPSC;基因校正的細胞展現出正常的核型和完整的多能性,因為人類胚胎幹細胞(hESC)未顯示脫靶效應。然後,宋等人評價了基因校正的β-Thal iPSC的分化效率。宋等人發現在造血分化過程中,基因校正的β-Thal iPSC顯示增加的胚狀體比率和不同的造血祖細胞百分比。更重要地是,基因校正的β-Thal iPSC品系恢復了HBB表現並且與未校正組相比減少了活性氧產生。宋等人的研究表明β-Thal iPSC的造血分化效率一旦藉由CRISPR-Cas9系統校正就會極大地提高。類似的方法可以利用在此所述的CRISPR-Cas系統,例如包含Cpf1效應蛋白的系統來進行。
鐮狀細胞性貧血係常染色體隱性遺傳性疾病,其中紅血細胞變成鐮刀狀。它係由位於染色體11的短臂上的β球蛋白基因中的單鹼基取代所引起的。因此,產生纈胺酸而不是產生引起鐮狀血紅蛋白(HbS)產生的穀胺酸。這導致形成扭曲性狀的紅細胞。由於此異常性狀,可以阻斷小血管,從而引起對骨骼、脾臟和皮膚組織的嚴重損害。這可以導致疼痛發作、頻繁感染、手足綜合症或甚至多器官衰竭。扭曲紅細胞也更易於發生紅細胞溶解,從而導致嚴重貧血。如在β地中海貧血的情況下,鐮狀細胞貧血可以是藉由用CRISPR-Cas系統修飾HSC來校正的。該系統允許藉由切
割其DNA並且然後讓其自身修復來特異性編輯細胞的基因組。Cas蛋白藉由RNA指導序列插入並引導至突變點並且然後它在該點切割DNA。同時,插入健康版本的序列。此序列藉由細胞自身修復系統使用來固定誘導的切割。以這種方式,CRISPR-Cas允許校正在先前獲得的幹細胞中的突變。藉由本領域的知識和本揭露的教義,技術人員可以使用靶向並校正突變的CRISPR-Cas系統(例如,具有遞送β-球蛋白,有利地是非鐮狀β-球蛋白的編碼序列的適合HDR模板)校正關於鐮狀細胞性貧血的HSC;具體地說,指導RNA可以靶向引起鐮狀細胞性貧血的突變,並且HDR可以提供對於β-球蛋白的適當表現的編碼。使靶向含有突變-和-Cas蛋白的粒子的指導RNA與攜帶突變的HSC接觸。該粒子還可以含有校正對於β-球蛋白的適當表現的突變的適合HDR;或者HSC可以與含有或遞送HDR模板的第二粒子或載體接觸。可以給予如此接觸的細胞;並且視情況處理/擴增;參考卡蒂亞。HDR模板可以提供表現工程化β球蛋白基因(例如βA-T87Q)或者如謝所述的β-球蛋白的HSC。
威廉姆斯(Williams)“擴展用於造血幹細胞基因治療的適應症(Broadening the Indications for Hematopoietic Stem Cell Genetic Therapies)”,細胞幹細胞13:263-264(2013),該文獻連同其所引用的文獻如同完全列出一樣藉由引用結合在此,該文獻報導了到來自患有溶酶體貯積症、異染性腦白質營養不良疾病(MLD)、由芳基硫酸酯酶A缺乏症(ARSA)引起的遺傳疾病的患者的HSC/P細胞中的慢病毒介導的基因轉移,從而導致神經脫髓鞘;以及到患有威斯科特-奧爾德里奇綜合症(Wiskott-Aldrich syndrome,WAS)的患者(患有WAS蛋白缺乏症的患者,該WAS
蛋白係調節血細胞譜系中的細胞骨架功能的小GTP酶CDC42的效應蛋白,並且因此該等患者罹患免疫缺陷伴隨復發性感染、自身免疫性症狀、以及血小板減少伴隨異常小且功能失調的血小板,從而導致過量出血和白血病與淋巴瘤的風險增加)的HSC中的慢病毒介導的基因轉移。與使用慢病毒相比,藉由本領域的知識和本揭露的教義,技術人員可以使用靶向並校正突變(芳基硫酸酯酶A缺乏症(ARSA))的CRISPR-Cas系統(例如,具有遞送ARSA的編碼序列的適合HDR模板)校正關於MLD(芳基硫酸酯酶A缺乏症(ARSA))的HSC;具體地說,指導RNA可以靶向引起MLD(缺陷性ARSA)的突變,並且HDR可以提供對於ARSA的適當表現的編碼。使靶向含有突變-和-Cas蛋白的粒子的指導RNA與攜帶突變的HSC接觸。該粒子還可以含有校正對於ARSA的適當表現的突變的適合HDR;或者HSC可以與含有或遞送HDR模板的第二粒子或載體接觸。可以給予如此接觸的細胞;並且視情況處理/擴增;參考卡蒂亞。與使用慢病毒相比,藉由本領域的知識和本揭露的教義,技術人員可以使用靶向並校正突變(WAS蛋白缺乏症)的CRISPR-Cas系統(例如,具有遞送WAS蛋白的編碼序列的適合HDR模板)校正關於WAS的HSC;具體地說,指導RNA可以靶向引起WAS(WAS蛋白缺乏症)的突變,並且HDR可以提供對於WAS蛋白的適當表現的編碼。使靶向含有突變-和-Cpf1蛋白的粒子的指導RNA與攜帶突變的HSC接觸。該粒子還可以含有校正對於WAS蛋白的適當表現的突變的適合HDR;或者HSC可以與含有或遞送HDR模板的第二粒子或載體接觸。可以給予如此接觸的細胞;並且視情況處理/擴增;參考卡蒂亞。
瓦特(Watts),“造血幹細胞擴增和基因治療(Hematopoietic Stem Cell Expansion and Gene Therapy)”,細胞療法(Cytotherapy)13(10):1164-1171.doi:10.3109/14653249.2011.620748(2011),該文獻連同其所引用的文獻如同完全列出一樣藉由引用結合在此,該文獻討論了作為許多病症的有高度吸引力的治療選項的造血幹細胞(HSC)基因治療,例如病毒介導的HSC基因治療,該等病症包括血液學病狀、免疫缺陷(包括HIV/AIDS)、以及其他遺傳病症,如溶酶體儲存病,包括SCID-X1、ADA-SCID、β-地中海貧血、X-連鎖的CGD、威斯科特-奧爾德里奇綜合症、範科尼貧血、腎上腺腦白質營養不良(ALD)、以及異染性腦白質營養不良(MLD)。
轉讓給策勒克提斯公司(Cellectis)的美國專利公開案號20110225664、20110091441、20100229252、20090271881以及20090222937涉及CREI變體,其中兩個I-CreI單體中的至少一個具有至少兩個取代,一個取代係在分別位於I-CreI的從位置26至40和從位置44至77的LAGLIDADG(SEQ ID NO:26)核心結構域的兩個功能子結構域的每一個中,所述變體能夠切割來自人類白細胞介素-2受體γ鏈(IL2RG)基因(也稱為常見細胞介素受體γ鏈基因或γC基因)的DNA靶序列。在美國專利公開案號20110225664、20110091441、20100229252、20090271881以及20090222937中鑒定的靶序列可以用於本發明的核酸靶向系統。
幾種聯合免疫缺陷(SCID)由T淋巴細胞成熟的缺陷引起,通常與B淋巴細胞的功能缺陷相關聯(卡瓦紮娜-卡爾沃等
人,醫學年鑒(Annu.Rev.Med.),2005,56,585-602;費舍爾等人,免疫學綜述(Immunol.Rev.),2005,203,98-109)。據估計總發病率係75 000出生兒中有一例。患有未治療的SCID的患者經受多重機會的微生物感染,並且通常活不過一年。SCID可以是藉由進行來自家族供體的造血幹細胞移植來治療。與供體的組織相容性可以廣泛地變化。在腺甙脫胺酶(ADA)缺乏症(係SCID的形式之一)的情況下,患者可以藉由注射重組腺甙脫胺酶來治療。
由於ADA基因已在SCID患者中顯示係突變的(吉布列托(Giblett)等人,柳葉刀(Lancet),1972,2,1067-1069),所以已鑒定涉及SCID的幾種其他基因(卡瓦紮娜-卡爾沃等人,醫學年鑒,2005,56,585-602;費舍爾等人,免疫學綜述,2005,203,98-109)。對於SCID存在四種主要原因:(i)最頻繁形式的SCID係SCID-X1(X-連鎖SCID或X-SCID),它由IL2RG基因的突變引起,從而導致成熟型T淋巴細胞和NK細胞的缺乏。IL2RG編碼γC蛋白(野口(Noguchi)等人,細胞,1993,73,147-157),該蛋白係至少五種介白素受體複合物的常見組分。該等受體藉由JAK3激酶(馬基(Macchi)等人,自然,1995,377,65-68)啟動幾種靶標,滅活形成與γC滅活相同的綜合症;(ii)ADA基因中的突變導致嘌呤代謝缺陷,這對於淋巴細胞先質係致命的,進而導致B細胞、T細胞和NK細胞的准缺乏;(iii)V(D)J重組係免疫球蛋白和T淋巴細胞受體(TCR)成熟中的必需步驟。涉及此過程的三種基因重組啟動基因1和2(RAG1和RAG2)以及Artemis中的突變導致成熟T淋巴細胞和B淋巴細胞的缺乏;並且(iv)還已報導了參與T細胞特異性傳訊的其他基因諸如CD45中的突變,儘管它們代表少數情
況(卡瓦紮娜-卡爾沃等人,醫學年鑒,2005,56,585-602;費舍爾等人,免疫學綜述,2005,203,98-109)。因為當鑒定它們的遺傳鹼基時,不同SCID形式出於兩種主要的原因已成為基因治療方法的範例(費舍爾等人,免疫學綜述,2005,203,98-109)。首先,如在所有血液疾病中,可以設想離體治療。造血幹細胞(HSC)可以從骨髓中恢復,並且保持對於少量細胞分裂的多能性特徵。因此,它們可以在體外處理,並且然後重新注射到患者中,在患者中它們重新填充骨髓。其次,由於在SCID患者中淋巴細胞的成熟受到損害,所以校正的細胞具有選擇性優點。因此,少量校正的細胞可以恢復功能免疫系統。此假設藉由以下各項得到幾次證實:(i)免疫功能的部分恢復與SCID患者中的突變逆轉相關聯(赫希霍恩(Hirschhorn)等人,自然遺傳學,1996,13,290-295;斯蒂芬(Stephan)等人,新英格蘭醫學雜誌,1996,335,1563-1567;布索(Bousso)等人,美國國家科學院院刊2000,97,274-278;瓦達(Wada)等人,美國國家科學院院刊2001,98,8697-8702;西小森(Nishikomori)等人,血液,2004,103,4565-4572);(ii)造血細胞體外SCID-X1缺陷的校正(坎多迪(Candotti)等人,血液,1996,87,3097-3102;卡瓦紮娜-卡爾沃等人,血液,1996,血液,88,3901-3909;泰勒等人,血液,1996,87,3103-3107;哈斯因-貝伊(Hacein-Bey)等人,血液,1998,92,4090-4097);(iii)動物模型體內SCID-X1(蘇達斯(Soudais)等人,血液,2000,95,3071-3077;蔡等人,血液,2002,100,72-79)、JAK-3(邦廷(Bunting)等人,自然醫學,1998,4,58-64;邦廷等人,人類基因治療(Hum.Gene Ther.),2000,11,2353-2364)以及RAG2(耶茨(Yates)等人,血液,2002,
100,3942-3949)缺乏的校正;以及(iv)基因治療臨床試驗的結果(卡瓦紮娜-卡爾沃等人,科學,2000,288,669-672;愛烏蒂(Aiuti)等人,自然醫學,2002;8,423-425;加斯帕(Gaspar)等人,柳葉刀,2004,364,2181-2187)。
轉讓給兒童醫學中心社團和哈佛大學校長和校友會的美國專利公開案號20110182867涉及經由BCL11A表現或活性抑制劑諸如RNAi和抗體調控造血祖細胞內的胎兒血紅蛋白表現(HbF)的方法和用途。美國專利公開案號20110182867中所揭露的靶標諸如BCL11A可以被本發明的CRISPR Cas系統靶向以用於調控胎兒血紅蛋白表現。對於另外的BCL11A靶標,還參見鮑爾等人(科學,2013年10月11日:第342卷,第6155期,第253-257頁)和許等人(科學,2011年11月18日:第334卷,第6058期,第993-996頁)。
藉由本領域的知識和本揭露的教義,技術人員可以校正關於遺傳性血液學病症的HSC,例如β地中海貧血、血友病、或遺傳性溶酶體貯積病。
HSC-遞送並編輯造血幹細胞;以及特定疾病。
術語“造血幹細胞”或“HSC”意指廣泛包括認為是HSC的那些細胞,例如產生所有其他血細胞並且來源於中胚層;位於大部分骨骼核心所含有的紅骨髓中的血細胞。本發明的HSC包括具有藉由以下各項鑒定的造血幹細胞表型的細胞:小尺寸、譜系(lin)標記物的缺乏、以及屬於分化系列簇的標記物,如:CD34、CD38、CD90、CD133、CD105、CD45、以及還有c-kit(幹
細胞因子的受體)。造血幹細胞對於用於檢測譜系定型的標記物呈陰性,並且因此稱為Lin-;並且在它們藉由FACS純化的過程中,對於人類有許多多至14種不同的成熟血液譜系標記物,例如對於髓細胞的CD13和CD33、對於紅系細胞的CD71、對於B細胞的CD19、對於巨核細胞的CD61等人;以及,對於B細胞的B220(鼠科CD45)、對於單核細胞的Mac-1(CD11b/CD18)、對於粒細胞的Gr-1、對於紅系細胞的Ter119、對於T細胞的117Ra、CD3、CD4、CD5、CD8等等。小鼠HSC標記物:CD34lo/-、SCA-1+、Thy1.1+/lo、CD38+、C-kit+、lin-,並且人類HSC標記物:CD34+、CD59+、Thy1/CD90+、、CD38lo/-、C-kit/CD117+、以及lin-。HSC係藉由標記物鑒定的。因此,於在此討論的實施方式中,HSC可以是CD34+細胞。HSC也可以是造血幹細胞CD34-/CD38-。在細胞表面缺乏c-kit且在本領域視為HSC的幹細胞係處於本發明的範圍內,與本領域同樣視為HSC的CD133+細胞一樣。
CRISPR-Cas(例如Cpf1)系統可以被工程化以靶向HSC內的一個遺傳座位或多個遺傳座位。可以製備有利地密碼子優化用於真核細胞以及具體地哺乳動物細胞,例如人類細胞,例如HSC的Cas(例如Cpf1)蛋白和靶向HSC中的一個座位或多個座位,例如基因EMX1的sgRNA。該等可以經由粒子來遞送。該等粒子可以是藉由混合的Cas(例如Cpf1)蛋白和gRNA來形成。gRNA和Cas(例如Cpf1)蛋白混合物可以例如與包含以下各項或基本上由以下各項組成或者由以下各項組成的混合物混合:表面活性劑、磷脂、生物可降解聚合物、脂蛋白以及醇,由此可以形成含有gRNA和Cas(例如Cpf1)蛋白的粒子。本發明包括如此製備的粒子和來
自這種方法的粒子以及其用途。
更普遍地說,粒子可以使用有效方法來形成。首先,可以按適合的莫耳比,例如3:1至1:3或者2:1至1:2或1:1莫耳比,在適合的溫度下,例如15-30℃,例如20-25℃,例如室溫,持續適合的時間,例如15-45分鐘,例如30分鐘,有利地在無菌無核酸酶緩衝液,例如1X PBS中,混合Cas(例如Cpf1)蛋白和靶向基因EMX1或控制基因LacZ的gRNA。單獨地,可以將粒子組分,諸如或者包括:表面活性劑,例如陽離子脂質,例如1,2-二油醯-3-三甲基銨-丙烷(DOTAP);磷脂,例如,二豆蔻醯磷脂醯膽鹼(DMPC);生物可降解聚合物,諸如乙二醇聚合物或PEG,以及脂蛋白,諸如低密度脂蛋白,例如膽固醇,溶解於醇中,有利地是C1-6烷基醇,諸如甲醇、乙醇、異丙醇,例如100%乙醇。兩種溶液可以混合在一起以形成含有Cas(例如Cpf1)-gRNA複合物的粒子。在某些實施方式中,該粒子可以含有HDR模板。該粒子可以是與含有gRNA+Cas(例如Cpf1)蛋白的粒子聯合給予的粒子,或者即除了使HSC與含有gRNA+Cas(例如Cpf1)蛋白的粒子接觸之外,還使HSC與含有HDR模板的粒子接觸;或者使HSC與含有所有gRNA、Cas(例如Cpf1)和HDR模板的粒子接觸。該HDR模板可以藉由單獨的載體給予,由此在第一種情況下粒子穿透HSC細胞並且單獨的載體也穿透該細胞,其中該HSC基因組係藉由gRNA+Cas(例如Cpf1)修飾的並且該HDR模板也是存在,由此藉由該HDR修飾基因組座位;例如,這可以導致校正突變。
在該等粒子形成之後,可以用每孔15ug Cas(例如
Cpf1)蛋白轉染96孔板中的HSC。在轉染後三天,可以收穫HSC,並且可以定量在EMX1座位處的插入和缺失(indel)的數目。
這說明了HSC可以如何使用靶向HSC中感興趣的一個基因組座位或多個基因組座位的CRISPR-Cas(例如Cpf1)來修飾。有待修飾的HSC可以是在體內,即在生物體中,例如在人類或非人類真核細胞中,例如動物,諸如魚,例如斑馬魚;哺乳動物,例如靈長類動物,例如猿、黑猩猩、獼猴;齧齒動物,例如小鼠、兔、大鼠、犬或狗;家畜(母牛/牛、羊/綿羊、山羊或豬);家禽或家禽類,例如雞。有待修飾的HSC可以是在體外,例如這種生物體體外。並且,修飾的HSC可以離體使用,即這種生物體的一種或多種HSC可以從該生物體獲得或從該生物體分離,視情況這種或該等HSC可以被擴增,這種或該等HSC係藉由包含靶向HSC中的一個遺傳座位或多個遺傳座位的CRISPR-Cas(例如Cpf1)的一種組成物,例如藉由使這種或該等HSC與該組成物接觸來修飾的,例如其中該組成物包含含有CRISPR酶和靶向HSC中的一個遺傳座位或多個遺傳座位的一種或多種gRNA的粒子,諸如藉由將gRNA和Cas(例如Cpf1)蛋白混合物與包含以下各項或基本上由以下各項組成或由以下各項組成的一種混合物混合來獲得或可獲得的粒子:磷脂、生物可降解聚合物、脂蛋白以及醇(其中一種或多種gRNA靶向HSC中的一個遺傳座位或多個遺傳座位),從而視情況擴增所產生的修飾的HSC並且向該生物體給予產生的修飾的HSC。在一些情況下,分離或獲得的HSC可以是來自第一生物體,諸如來自與第二生物體相同種類的生物體,並且第二生物體可以是向其給予所產生的修飾的HSC的生物體,例如第一生物體係該
第二生物體的供體(諸如第二生物體的親屬,如父母或兄弟姐妹)。修飾的HSC可以具有解決或緩解或減輕個體或受試者或患者的疾病或病狀狀態的症狀的遺傳修飾。例如在第一生物體供體到第二生物體的情況下,修飾的HSC可以具有使得HSC含有與第二生物體更類似的一種或多種蛋白質例如表面標記物或蛋白質的遺傳修飾。修飾的HSC可以具有刺激個體或受試者或患者的疾病或病狀狀態的遺傳修飾並且再次給予非人類生物體,以便製備一種動物模型。根據本揭露和本領域的知識,HSC的擴增係在技術人員的知識範圍內,例如,參見,李,“藉由克服CUL4-介導的HOXB4降解來改進成人造血幹細胞的離體擴增(Improved ex vivo expansion of adult hematopoietic stem cells by overcoming CUL4-mediated degradation of HOXB4)”。血液,2013年5月16日;121(20):4082-9.doi:10.1182/blood-2012-09-455204.電子版2013年3月21日。
如對於提高活性所指示的,gRNA可以是與Cas(例如Cpf1)蛋白預先複合,之後將整個複合物配製在粒子中。可以按已知有助於將核酸遞送至細胞的不同組分的不同莫耳比來製備配製物(例如1,2-二油醯基-3-三甲基銨-丙烷(DOTAP)、1,2-雙十四醯基-sn-丙三醇-3-磷酸膽鹼(DMPC)、聚乙二醇(PEG)以及膽固醇)。例如DOTAP:DMPC:PEG:膽固醇莫耳比可以是DOTAP 100、DMPC 0、PEG 0、膽固醇0;或者DOTAP 90、DMPC 0、PEG 10、膽固醇0;或者DOTAP 90、DMPC 0、PEG 5、膽固醇5;DOTAP 100、DMPC 0、PEG 0、膽固醇0。本發明因此包括將gRNA、Cas(例如Cpf1)蛋白和形成粒子的組分混合;以及來自此混合的粒子。
在一較佳的實施方式中,含有Cas(例如Cpf1)-gRNA複合物的粒子可以是藉由較佳的是以酶:指導RNA的1:1莫耳比將Cas(例如Cpf1)蛋白和一種或多種gRNA混合在一起來形成。單獨地,將已知有助於遞送核酸的不同組分(例如,DOTAP、DMPC、PEG以及膽固醇)較佳的是溶解於乙醇中。將兩種溶液混合在一起以形成含有Cas(例如Cpf1)-gRNA複合物的粒子。在形成粒子後,Cas(例如Cpf1)-gRNA複合物可以轉染到細胞(例如HSC)中。可以採用條形編碼(Bar coding)。可以條形編碼該等粒子、Cas-9和/或gRNA。
在一實施方式中,本發明包括製備含有gRNA-和-Cas(例如Cpf1)蛋白的粒子之方法,該方法包括將gRNA和Cas(例如Cpf1)蛋白混合物與包含以下各項或基本上由以下各項組成或者由以下各項組成的混合物混合:表面活性劑、磷脂、生物可降解聚合物、脂蛋白以及醇。一實施方式包括來自該方法的含有gRNA-和-Cas(例如Cpf1)蛋白的粒子。在一實施方式中,本發明包括該粒子在藉由操縱感興趣的基因組座位中的靶序列來修飾感興趣的基因組座位或者生物體或非人類生物體的方法中的用途,該方法包括使含有感興趣的基因組座位的細胞與其中該gRNA靶向該感興趣的基因組座位的該粒子接觸;或者包括藉由操縱感興趣的基因組座位中的靶序列來修飾感興趣的基因組座位或者生物體或非人類生物體之方法,該方法包括使含有感興趣的基因組座位的細胞與其中該gRNA靶向該感興趣的基因組座位的該粒子接觸。在該等實施方式中,感興趣的基因組座位有利地是HSC中的基因組座位。
治療應用的考慮因素:基因組編輯治療的考慮因素係序列特異性核酸酶諸如Cpf1核酸酶變體的選擇。每種核酸酶變體可以具有其自身獨特的一組優勢和缺點,許多該等優勢和缺點在治療情況下必須平衡以使治療益處最大化。迄今為止,使用核酸酶的兩種治療編輯方法已表現出很大的希望:基因破壞和基因校正。基因破壞涉及在遺傳元件內創建靶向的indel的NHEJ刺激,常常引起對患者有益的失功能突變。相反,基因校正使用HDR直接逆轉引起疾病的突變,從而恢復功能同時保留校正的元件的生理調節。HDR也可以用於將治療的轉基因插入到基因組內限定的“安全港”座位中,以恢復失去的基因功能。對於有效的特異性編輯治療,必須在靶細胞群體中實現足夠高水平的修飾以逆轉疾病症狀。此治療修飾“閾值”係藉由在治療之後編輯的細胞的適合度和逆轉症狀所需要的基因產物的量來決定的。關於適合度,相對於其未編輯對應物,編輯對靶細胞產生三種潛在結果:適合度增加、中度或者減小。在適合度增加的情況下,例如在SCID-X1的治療中,修飾的造血祖細胞相對於其未編輯的對應物來選擇性擴增。SCID-X1係由IL2RG基因中的突變引起的疾病,該基因的功能對於造血淋巴細胞譜系的適當發育係需要的[倫納德,W.J.(Leonard,W.J.)等人,免疫學綜述(Immunological reviews)138,61-86(1994);考杉斯基,K.(Kaushansky,K.)和威廉姆斯,W.J.威廉姆斯血液學(Williams hematology),(麥格勞-希爾醫學出版社(McGraw-Hill Medical),紐約,2010)]在患者接受SCID-X1的病毒基因治療的臨床試驗中並且在SCID-X1突變自發校正的少量實例中,校正的造血祖細胞能夠克服此發育阻斷並且相對於其疾病對應物而擴
增以介導治療[布索,P.等人,美國國家科學院院刊97,274-278(2000);哈斯因-貝伊-阿比納,S.(Hacein-Bey-Abina,S.)等人,新英格蘭醫學雜誌346,1185-1193(2002);加斯帕,H.B.等人,柳葉刀364,2181-2187(2004)]。在此情況下,當編輯的細胞具有一選擇性優點時,甚至低數目的編輯細胞也可以藉由擴增來增殖,從而為患者提供治療益處。相比之下,對於其他造血疾病如慢性肉芽腫病症(CGD)的編輯可以不誘導對於編輯的造血祖細胞的適合度的變化,從而增加治療修飾閾值。CGD係藉由編碼吞噬細胞氧化酶蛋白的基因中的突變引起的,該等氧化酶蛋白通常被中性粒細胞用來產生殺死病原體的活性氧[慕克吉,S.(Mukherjee,S.)和思拉舍,A.J.(Thrasher,A.J.)基因525,174-181(2013)]。由於該等基因的功能障礙並不影響造血祖細胞適合度或發育,而僅影響成熟造血細胞類型抵禦感染的能力,所以在此疾病中編輯細胞可能並不優先擴增。實際上,在基因治療試驗中未觀察到CGD中基因校正細胞的選擇性優點,從而引起長期細胞移植的困難[梅爾奇,H.L.(Malech,H.L.)等人,美國國家科學院院刊94,12133-12138(1997);康,H.J.(Kang,H.J.)等人,分子治療:美國基因治療協會雜誌19,2092-2101(2011)]。這樣,相對於其中編輯對於靶細胞形成增加的適合度的疾病,治療其中編輯形成中度適合度優點的疾病諸如CGD可能需要顯著更高水平的編輯。如果編輯加強適合度優點,如恢復癌細胞中的腫瘤抑制基因的功能的情況,修飾細胞可以戰勝其疾病對應物,從而使得治療益處相對於編輯率較低。此後一類疾病特別難以用基因組編輯療法來治療。
除細胞適合度之外,治療疾病所需要的基因產物的量
還影響必須實現逆轉症狀的治療性基因組編輯的最小水平。B型血友病係其中基因產物水平少量變化可以導致臨床結果顯著變化的疾病。此疾病係藉由編輯因子IX的基因的突變引起的,該因子IX係通常由肝臟分泌到血液中的蛋白質,其中它充當凝血級聯組分。B型血友病的臨床嚴重性與因子IX活性的量相關。嚴重疾病與小於正常活性的1%相關聯,而較輕微形式的疾病與大於因子IX活性的1%相關聯[考杉斯基,K.和威廉姆斯,W.J.威廉姆斯血液學,(麥格勞-希爾醫學出版社,紐約,2010);洛夫維斯特,T.(Lofqvist,T.)等人,內科醫學雜誌(Journal of internal medicine)241,395-400(1997)]。這表明可以使甚至小百分比的肝細胞恢復因子IX表現的編輯治療可以對臨床結果具有極大的影響。在出生後立即使用ZFN校正B型血友病小鼠模型的研究表明3%-7%校正足以逆轉疾病症狀,從而為此假設提供臨床前證據[李,H.等人,自然475,217-221(2011)]。
其中基因產物水平的少量變化可以影響臨床結果的病症和其中對於編輯細胞存在適合度優點的疾病係基因組編輯治療的理想靶標,因為治療修飾閾值係低到足以允許給予當前技術高成功機會。現在已在臨床前水平和I期臨床試驗中成功使用編輯治療靶向該等疾病。延長對於編輯細胞具有中度適合度優點的疾病的該等希望的結果,或者在治療需要更大量的基因產物的情況下,需要改進DSB修復途徑操縱和核酸酶遞送。以下表示出基因組編輯對於治療模型的應用的一些實例,並且以下表的參考文獻和那些參考文獻所引用的文獻如同完全列出一樣藉由引用結合在此。
有利地經由在此所述的遞送系統例如粒子遞送系統,使用CRISPR-Cas(例如Cpf1)系統藉由HDR介導的突變校正或者HDR介導的校正基因序列插入進行靶向,解決以上表中的每種病狀,係根據本揭露和本領域知識的技術人員的知識範圍內。因此,一實施方式包括使攜帶B型血友病、SCID(例如,SCID-X1、ADA-SCID)或遺傳性高酪胺酸血症突變的HSC與含有gRNA-和-Cas(例如Cpf1)蛋白的粒子接觸,從而靶向關於B型血友病、SCID(例如,SCID-X1、ADA-SCID)或遺傳性高酪胺酸血症的感興趣的基因組座位(例如,如李、吉諾維斯或殷所述)。該粒子還可以含有校正突變的適合HDR模板;或者HSC可以與含有或遞送HDR模板的第二粒子或載體接觸。就這一點而言,必須提及的是B型血友病係一種藉由編碼因子IX(決定性凝血級聯組分)的基因的失功能突變引起的X連鎖隱性病症。在嚴重受影響個體中使因子IX活性恢復至超過其水平的1%可以使該疾病轉變成嚴重程度較輕的形式,因為重組因子IX輸注到從年輕時期開始預防的此類患者中以達到此類水平,極大地改善了臨床併發症。藉由本領域的知識和本揭露的教義,技術人員可以使用靶向並校正突變(由編碼因子IX的基因中的失功能突變引起的X連鎖隱性病症)的CRISPR-Cas(例如Cpf1)系統(例如,具有遞送因子IX的編碼序列的適合HDR模板)
校正關於B型血友病的HSC;具體地說,gRNA可以靶向引起B型血友病的突變,並且HDR可以提供對於因子IX的適當表現的編碼。使靶向含有突變-和-Cas(例如Cpf1)蛋白的粒子的gRNA與攜帶突變的HSC接觸。該粒子還可以含有校正對於因子IX的適當表現的突變的適合HDR;或者HSC可以與含有或遞送HDR模板的第二粒子或載體接觸。可以給予如此接觸的細胞;並且視情況處理/擴增;參考卡蒂亞,在此討論的。
在卡蒂亞,“小型討論會:X連鎖腎上腺腦白質營養不良、X連鎖腎上腺腦白質營養不良的造血幹細胞移植和造血幹細胞基因治療(MINI-SYMPOSIUM:X-Linked Adrenoleukodystrophypa,Hematopoietic Stem Cell Transplantation and Hematopoietic Stem Cell Gene Therapy in X-Linked Adrenoleukodystrophy)”,腦病理學(Brain Pathology)20(2010)857-862中,該文獻連同其所引用的文獻如同完全列出一樣藉由引用結合在此,認識到同種異體造血幹細胞移植(HSCT)用於將正常溶酶體酶遞送到患有賀勒氏疾病的患者大腦中,並且討論了治療ALD的HSC基因治療。在兩位患者中,在粒細胞集落刺激因子(G-CSF)轉移後收集外週CD34+細胞並且用骨髓增生性肉瘤病毒增強子、缺失的負控制區域、dl587rev引物結合位點取代的(MND)-ALD慢病毒載體轉導。在低濃度細胞介素存在下在16h過程中用MND-ALD載體轉導來自患者的CD34+細胞。在轉導後冷凍轉導的CD34+細胞,以對5%細胞進行各種安全性測試,該等安全性測試具體地說包括三種複製能力的慢病毒(RCL)測定。CD34+細胞的轉導效率範圍係35%至50%,其中慢病毒整合拷貝的平均值
係0.65與0.70之間。在融化轉導的CD34+細胞之後,用超過4.106轉導的CD34+細胞再輸注患者,然後用白消安和環磷醯胺進行完全骨髓消除。消除患者的HSC以利於移植基因校正的HSC。兩位患者在第13天與第15天之間出現造血恢復。第一位患者在12個月出現幾乎完全的免疫恢復,而第二位患者在9個月出現此恢復。與使用慢病毒相比,藉由本領域的知識和本揭露的教義,技術人員可以使用靶向並校正突變的CRISPR-Cas(Cpf1)系統(例如,具有適合HDR模板)校正關於ALD的HSC;確切地說,gRNA可以靶向ABCD1中的突變,該ABCD1係位於X染色體上的編碼過氧化物酶體膜轉運體蛋白ALD的基因,並且HDR可以提供對於該蛋白質的適當表現的編碼。使靶向含有突變-和-Cas(Cpf1)蛋白的粒子的gRNA與攜帶突變的HSC例如CD34+細胞接觸,如卡蒂亞所述。該粒子還可以含有校正對於過氧化物酶體膜轉運體蛋白的表現的突變的適合HDR;或者HSC可以與含有或遞送HDR模板的第二粒子或載體接觸。如此接觸的細胞視情況可以如卡蒂亞所述地處理。如此接觸的細胞可以如卡蒂亞所述地給予。
參考WO 2015/148860,藉由在此的教義,本發明包括該等文獻結合在此的教義應用的方法和材料。在血液相關疾病基因治療的一方面中,用於治療β地中海貧血的方法和組成物可以適於本發明的CRISPR-Cas系統(例如,參見WO 2015/148860)。在一實施方式中,WO 2015/148860涉及例如藉由改變B-細胞CLL/淋巴瘤11A(BCL11A)的基因來治療或預防β地中海貧血或其症狀。該BCL11A基因也稱為B-細胞CLL/淋巴瘤11A、BCL11A-L、BCL11A-S、BCL11AXL、CTIP 1、HBFQTL5以及ZNF。BCL11A編碼涉及
調節球蛋白基因表現的鋅指蛋白。藉由改變BCL11A基因(例如,BCL11A基因的一個或兩個對偶基因),可以增加β球蛋白的水平。γ球蛋白可以替換血紅蛋白複合物中的β球蛋白並且有效攜帶氧氣到組織中,從而改善β地中海貧血病表型。
參考WO 2015/148863,並且藉由在此的教義,本發明包括該等文獻中適於本發明的CRISPR-Cas系統的方法和材料。在治療和預防遺傳性血液疾病鐮狀細胞疾病的一個方面中,WO 2015/148863包括改變BCL11A基因。藉由改變BCL11A基因(例如,BCL11A基因的一個或兩個對偶基因),可以增加β球蛋白的水平。γ球蛋白可以替換血紅蛋白複合物中的β球蛋白並且有效攜帶氧氣到組織中,從而改善鐮狀細胞疾病表型。
在本發明的一方面中,藉由調整本發明的CRISPR-Cas系統來包括涉及編輯靶核酸序列或者調解靶核酸序列的表現的方法和組成物以及其結合癌症免疫治療的應用。參考WO 2015/161276中的基因治療的應用,該專利涉及可以用於藉由改變一種或多種T細胞表現的基因來影響T細胞增殖、存活和/或功能的方法和組成物,該等T細胞表現的基因例如是FAS、BID、CTLA4、PDCD1、CBLB、PTPN6、TRAC和/或TRBC基因中的一種或多種。在一個相關方面中,T-細胞增殖係藉由改變一種或多種T細胞表現的基因,例如CBLB和/或PTPN6基因、FAS和/或BID基因、CTLA4和/或PDCDI、和/或TRAC和/或TRBC基因來影響。
在患者惡性腫瘤中嵌合抗原受體(CAR)19 T細胞展示出抗白血病作用。然而,白血病患者常常並不具有足夠收集的
T細胞,這意味著治療必須涉及來自供體的修飾的T細胞。因此,存在建立供體T細胞銀行的興趣。凱西姆(Qasim)等人(“Talen工程化通用CAR19 T細胞在B-ALL中的第一臨床應用(First Clinical Application of Talen Engineered Universal CAR19 T Cells in B-ALL)”,第57屆ASH年會和博覽會(ASH 57th Annual Meeting and Exposition),2015年12月5-8日,摘要2046(https://ash.confex.com/ash/2015/webprogram/Paper81653.html,2015年11月線上公開)討論了修飾CAR19 T細胞以藉由破壞T細胞受體表現和CD52靶向來消除移植物抗宿主病風險。此外,靶向CD52細胞以使得它們對阿侖單抗不敏感,並因此允許阿侖單抗預防宿主介導的人類白細胞抗原(HLA)錯配的CAR19 T-細胞排斥。研究者使用第三代自滅活載體編碼連接至RQR8的4g7 CAR19(CD19 scFv-4-1BB-CD3ζ),然後用兩對TALEN mRNA電穿孔細胞,以對T細胞受體(TCR)α恒定鏈座位和CD52基因座位進行多重靶向。使用CliniMacs α/β TCR缺失來消耗離體擴增之後仍表現TCR的細胞,從而產生具有<1% TCR表現的T細胞產物(UCART19),85%的細胞表現CAR19並且64%變成CD52陰性。給予修飾的CAR19 T細胞,以治療患者的復發性急性淋巴母細胞白血病。在此提供的教義提供了用於提供修飾的造血幹細胞及其子代的有效方法,該等細胞包括但不限於,血液骨髓系和淋巴系的細胞,包括T細胞、B細胞、單核細胞、巨噬細胞、中性粒細胞、嗜鹼性粒細胞、嗜酸性粒細胞、紅細胞、樹突細胞、以及巨核細胞或血小板、以及中性殺傷性細胞以及其先質或祖細胞。此類細胞可以是藉由敲除、敲入或以其他方式調控靶標,例如以去除或調控如上
所述的CD52,以及其他靶標(包括但不限於CXCR4和PD-1)來修飾。因此,本發明的組成物、細胞和方法可以用於調控免疫反應並且用於結合向患者給予T細胞或其他細胞的修改來治療(不限於)惡性腫瘤、病毒感染以及免疫症狀。
參考WO 2015/148670並且藉由在此的教義,本發明包括此文獻結合在此的教義應用的方法和材料。在基因治療的一個方面中,包括用於編輯與人類免疫缺陷病毒(HIV)和獲得性免疫缺陷綜合症(AIDS)相關或有關的靶序列的方法和組成物。,在此描述的發明包括藉由在C-C趨化因子受體類型5(CCR5)的基因中引入一個或多個突變來預防和治療HIV感染和AIDS。該CCR5基因也稱為CKR5、CCR-5、CD195、CKR-5、CCCKR5、CMKBR5、IDDM22、以及CC-CKR-5。在另一個方面中,在此描述的發明包括提供對於HIV感染的預防或減少和/或對HIV進入宿主細胞的能力的預防或減小,例如在已感染的受試者中。HIV的示例性宿主細胞包括但不限於,CD4細胞、T細胞、腸道相關淋巴組織(GALT)、巨噬細胞、樹突細胞、骨髓先質細胞、以及小膠質細胞。病毒進入宿主細胞需要病毒糖蛋白gp41和gp120與CD4受體和共受體例如CCR5相互作用。如果在宿主細胞表面不存在共受體例如CCR5,則病毒不能結合並進入宿主。疾病的進展因此受到阻礙。藉由敲除或敲下宿主細胞內的CCR5,例如藉由引入保護性突變(諸如CCR5δ32突變),阻止了HIV病毒進入宿主細胞。
X連鎖慢性肉芽腫病(CGD)係由於吞噬細胞NADPH氧化酶活性缺乏或減小而產生的宿主防禦性遺傳病症。使用靶向
或校正突變(吞噬細胞NADPH氧化酶活性缺乏或減小)的CRISPR-Cas(Cpf1)系統(例如,具有遞送吞噬細胞NADPH氧化酶的編碼序列的HDR模板);具體地說,gRNA可以靶向引起CGD(吞噬細胞NADPH氧化酶缺乏症)的突變,並且HDR可以提供對於吞噬細胞NADPH氧化酶的適當表現的編碼。使靶向含有突變-和-Cas(Cpf1)蛋白的粒子的gRNA與攜帶突變的HSC接觸。該粒子還可以含有校正對於吞噬細胞NADPH氧化酶的適當表現的突變的適合HDR;或者HSC可以與含有或遞送HDR模板的第二粒子或載體接觸。可以給予如此接觸的細胞;並且視情況處理/擴增;參考卡蒂亞。
範科尼貧血:在至少15種基因(FANCA、FANCB、FANCC、FANCD1/BRCA2、FANCD2、FANCE、FANCF、FANCG、FANCI、FANCJ/BACH1/BRIP1、FANCL/PHF9/POG、FANCM、FANCN/PALB2、FANCO/Rad51C、以及FANCP/SLX4/BTBD12)上的突變可以引起範科尼貧血。由該等基因產生的蛋白質涉及稱為FA途徑的細胞過程。當形成新DNA拷貝(稱為DNA複製)的過程由於DNA損害而阻斷時,該FA途徑接通(啟動)。該FA途徑將某些蛋白質發送到損害區域,從而觸發DNA修復,以便可以繼續DNA複製。FA途徑具體負責稱為鏈間交聯(ICL)的某種類型的DNA損害。當DNA相反股上的兩個DNA構建塊(核苷酸)異常附接或連接在一起時,會停止DNA複製過程,從而出現ICL。ICL可以是藉由體內產生的有毒物質累積或者藉由用某些癌症治療藥物進行治療引起的。與范科尼貧血相關聯的八種蛋白質組合在一起形成稱為FA核心複合物的複合物。該FA核心複合物啟動稱為FANCD2和
FANCI的兩種蛋白質。這兩種蛋白質的啟動將DNA修復蛋白帶到ICL區域,以便去除交聯並且可以繼續DNA修復。FA核心複合物。更具體地說,FA核心複合物係由FANCA、FANCB、FANCC、FANCE、FANCF、FANCG、FANCL、以及FANCM組成的核多蛋白複合物,充當E3泛素連接酶並且介導ID複合物的啟動,該ID複合物係由FANCD2和FANCI組成的異源二聚體。一旦單泛素化,它就與FA途徑下游的經典腫瘤抑制物相互作用,該等抑制物包括FANCD1/BRCA2、FANCN/PALB2、FANCJ/BRIP1、以及FANCO/Rad51C,並且由此藉由同源重組(HR)幫助DNA修復。80%至90%的FA情況係由於三種基因FANCA、FANCC、以及FANCG之一的突變。該等基因提供用於產生FA核心複合物組分的指示。與FA核心複合物相關聯的此類基因中的突變將使得複合物無功能並且破壞整個FA途徑。因此,DNA損害未得到有效修復並且ICL隨著時間累積。蓋澤爾哈特(Geiselhart),“評論文章,藉由範科尼貧血途徑破壞的傳訊導致造血幹細胞生物學功能障礙:基本機制和潛在治療策略(Review Article,Disrupted Signaling through the Fanconi Anemia Pathway Leads to Dysfunctional Hematopoietic Stem Cell Biology:Underlying Mechanisms and Potential Therapeutic Strategies)”,貧血(Anemia),第2012卷(2012),文章ID 265790,http://dx.doi.org/10.1155/2012/265790討論了FA和涉及編碼FANCC基因的引起體內HSC校正的慢病毒股骨內排斥的動物實驗。使用靶向並校正與FA相關的一個或多個突變的CRISPR-Cas(Cpf1)系統,例如具有分別靶向引起FA的突變FANCA、FANCC、或FANCG中的一個或多個並且提供FANCA、FANCC、或
FANCG中的一個或多個的校正表現的一種或多種gRNA和一種或HDR模板的CRISPR-Cas(Cpf1)系統,;例如,gRNA可以靶向關於FANCC的突變,並且HDR可以提供對於FANCC的適當表現的編碼。使靶向含有一個或多個突變(例如,涉及FA的一個或多個突變,諸如關於FANCA、FANCC或FANCG的任何一種或多種的一個或多個突變)-和-Cas(Cpf1)蛋白的粒子的gRNA與攜帶這種或該等突變的HSC接觸。該粒子還可以含有校正對於涉及FA的一種或多種蛋白質的適當表現的突變,諸如FANCA、FANCC或FANCG中的一個或多個突變的適合HDR模板;或者HSC可以與含有或遞送HDR模板的第二粒子或載體接觸。可以給予如此接觸的細胞;並且視情況處理/擴增;參考卡蒂亞。
在此討論的粒子(例如,關於含有一種或多種gRNA和Cas(Cpf1),視情況一種或多種HDR模板,或者一種或多種HDR模板的粒子;例如關於B型血友病、SCID、SCID-X1、ADA-SCID、遺傳性高酪胺酸血症、β-地中海貧血、X連鎖CGD、威斯科特-奧爾德里奇綜合症(Wiskott-Aldrich syndrome)、範科尼貧血(Fanconi anemia)、腎上腺腦白質營養不良(ALD)、異染性腦白質營養不良(MLD)、HIV/AIDS、免疫缺陷疾病、血液疾病、或者遺傳性溶酶體貯積病)有利地藉由將一種或多種gRNA和Cas(Cpf1)蛋白的混合物(視情況含有一種或多種HDR模板或者當關於一種或多種模板的單獨粒子係希望的時此類混合物僅含有一種或多種HDR模板)與包含表面活性劑、磷脂、生物可降解聚合物、脂蛋白以及醇或基本上由其組成或由其組成的混合物混合來獲得或可獲得(其中一種或多種gRNA靶向HSC中的一個遺傳座位或多個遺傳
座位)。
實際上,本發明尤其適用於使用基因組編輯治療造血性遺傳病症,以及適用於治療免疫缺陷病症,諸如遺傳性免疫缺陷病症,尤其藉由使用在此討論的粒子技術。遺傳性免疫缺陷病係其中本發明的基因組編輯干預可以成功的疾病。原因包括:其中免疫細胞係子集的造血細胞係治療可進入的。它們可以從身體內去除並且自體或同種異體移植。另外,某些遺傳免疫缺陷病例如重症綜合性免疫缺陷(SCID)形成免疫細胞的增殖性缺點。藉由少見的自發性“逆轉”突變校正引起SCID的遺傳性病變表明校正甚至一個淋巴細胞祖細胞可以足以恢復患者的免疫功能.../../../Users/t_kowalski/AppData/Local/Microsoft/Windows/Temporary Internet Files/Content.Outlook/GA8VY8LK/Treating SCID for Ellen.docx-_ENREF_1。參見布索,P.等人,來源於體內單個人類T細胞先質的T細胞全部組成部分的多樣性、功能性和穩定性(Diversity,functionality,and stability of the T cell repertoire derived in vivo from a single human T cell precursor)。美國國家科學院院刊97,274-278(2000)。編輯細胞的選擇性優點使得甚至低水平的編輯引起治療效果。本發明的此效果可以見於SCID、威斯科特-奧爾德里奇綜合症、以及在此提及的其他病狀中,包括其他遺傳性造血病症,諸如α地中海貧血和β地中海貧血,其中血紅細胞缺乏不利地影響紅系祖細胞的適合度。
NHEJ和HDR DSB修復的活性隨著細胞類型和細胞狀態而顯著改變。NHEJ不是藉由細胞週期高度調節的並且它在各細
胞類型中均是有效的,從而在可進入靶細胞群體中允許高水平的基因破壞。相比之下,HDR主要在S/G2期過程中起作用,並且因此限於活躍分裂的細胞,從而、限制了需要有絲分裂細胞的精確基因組修飾的治療[奇奇阿,A.(Ciccia,A.)和埃利奇,S.J.(Elledge,S.J.)分子細胞(Molecular cell)40,179-204(2010);查普曼,J.R.等人,分子細胞47,497-510(2012)]。
經由HDR校正的效率可以是藉由靶向座位的表觀遺傳狀態或序列或所使用的特定修復模板構造(單股對比雙股、長同源臂對比短同源臂)來控制的[哈斯因-貝伊-阿比納,S.等人,新英格蘭醫學雜誌346,1185-1193(2002);加斯帕,H.B.等人,柳葉刀364,2181-2187(2004);博伊默,K.J.(Beumer,K.J.)等人,G3(2013)]。靶細胞中NHEJ和HDR機構的相對活性也可以影響基因校正效率,因為該等途徑可以競爭恢復DSB[博伊默,K.J.等人,美國國家科學院院刊105,19821-19826(2008)]。HDR還增強NHEJ策略中不可見的遞送挑戰,因為它需要同時遞送核酸酶和修復模板。在實踐中,該等限制到目前為止導致治療上相關的細胞類型中的HDR水平較低。臨床翻譯因此主要集中於治療疾病的NHEJ策略,儘管對於B型血友病和遺傳性高酪胺酸血症的小鼠模型目前已描述了概念驗證的臨床前HDR治療[李,H.等人,自然475,217-221(2011);殷,H.等人,自然生物技術32,551-553(2014)]。
任何給定的基因組編輯應用可以包括蛋白、小RNA分子、和/或修復模板的組合,使得該等多個部分的遞送基本上比小分子治療劑更具有挑戰性。已開發用於遞送基因組編輯工具的兩
種主要策略:離體和體內。在離體治療中,從身體內取出患病細胞,進行編輯並且然後將它移植回到患者中。離體編輯具有允許良好限定靶細胞群體並且指定遞送到細胞的治療分子的特定劑量的優點。當脫靶修飾係所關心的問題時,後一種考慮因素可能是特別重要的,因為滴定核酸酶的量可以減少突變(徐等人,2013)。離體方法的另一個優點典型地是由於蛋白質和核酸到用於研究和基因治療應用的培養基的細胞中的有效遞送系統的開發而可以實現的高編輯率。
離體方法可能存在限制應用於少數疾病的缺點。例如,靶細胞必須能夠存活於身體之外的操縱。對於許多組織,如大腦,在身體之外培養細胞係主要的挑戰,因為細胞難以存活或者失去其體內功能所需要的特徵。因此,鑒於本揭露和本領域的知識,關於具有適於離體培養和操縱的成體幹細胞群體的組織(諸如造血系統)的離體治療,可以藉由CRISPR-Cas(Cpf1)系統。[邦恩,H.F.(Bunn,H.F.)和阿斯特爾,J.(Aster,J.),血液病的病理生理學(Pathophysiology of blood disorders),(麥格勞-希爾出版社,紐約,2011)]
體內基因組編輯設計將編輯系統直接遞送到其天然組織的細胞類型中。體內編輯允許治療其中受影響細胞群不適於離體操縱的疾病。另外,將核酸酶遞送至原位細胞允許治療多個組織和細胞類型。該等特徵可能允許體內治療應用於比離體治療更廣泛的疾病範圍。
到此為止,體內編輯已大部分藉由使用具有限定的組
織特異性趨向性的病毒載體來實現。此類載體目前在貨物負載力和趨向性方面係有限的,這使得這種模式的治療局限於其中使用臨床上有用的載體的轉導係有效的器官系統,諸如肝臟、肌肉和眼睛[科特曼,M.A.(Kotterman,M.A.)和謝弗,D.V.(Schaffer,D.V.)遺傳學自然評論(Nature reviews.Genetics)15,445-451(2014);阮,T.H.(Nguyen,T.H.)和費裡,N.(Ferry,N.),基因治療11增刊1,S76-84(2004);博伊,S.E.(Boye,S.E.)等人,分子治療:美國基因治療協會雜誌21,509-519(2013)]。
體內遞送的潛在障壁係可以響應於治療所需要的大量病毒而形成的免疫反應,但是此現象並不是基因編輯所獨有的並且在其他基於病毒的基因治療中也觀察到[貝西,N.(Bessis,N.)等人,基因治療11增刊1,S10-17(2004)]。還可能的是來自編輯的核酸酶本身的肽在MHC I類分子上呈遞以刺激免疫反應,儘管幾乎沒有證據支援此情況以臨床前水平發生。關於此治療模式的另一個主要難題係控制體內基因組編輯核酸酶的分佈以及隨後的劑量,從而導致可能難以預測的脫靶突變特徵。然而,鑒於本揭露和本領域的知識,包括使用用於治療癌症的基於病毒-和-粒子的治療,例如藉由粒子或病毒遞送的HSC體內修飾係技術人員的知識範圍內。
離體編輯治療:關於造血細胞純化、培養和移植的長期存在的臨床專業知識使得影響血液系統的疾病諸如SCID、範科尼貧血、威斯科特-奧爾德里奇綜合症以及鐮狀細胞貧血成為離體編輯治療的集中點。集中於造血細胞的另一個原因係,由於先前
設計血液病症的基因治療的努力,已經存在相對高效率的遞送系統。在該等優點的情況下,這種治療模式可以適用於其中編輯細胞具有適合度優點的疾病,以使得少量移植的編輯細胞可以擴展並且治療疾病。一種這樣的疾病係HIV,其中感染導致對CD4+ T細胞的適合度缺點。
離體編輯治療最近擴展包括基因校正策略。在來自吉諾維斯和同事的最新論文中克服了對於HDR的離體障壁,他們實現在從罹患SCID-X1的患者獲得的造血幹細胞(HSC)中突變的IL2RG基因的基因校正[吉諾維斯,P.等人,自然510,235-240(2014)]。吉諾維斯等人使用多模態策略完成HSC中的基因校正。首先,使用含有編碼IL2RG的治療性cDNA的HDR模板的整合有效性慢病毒轉導HSC。在轉導之後,用編碼靶向IL2RG中的突變熱點的ZFN的mRNA電穿孔細胞,以刺激基於HDR的基因校正。為了增加HDR比率,使用小分子優化培養條件以鼓勵HSC分裂。在優化的培養條件下,在培養中以治療相關速率獲得核酸酶和HDR模板、來自SCID-X1患者的基因校正的HSC。來自未受影響的個體的經受相同基因校正程序的HSC可以在小鼠中維持長期造血,這係HSC功能的優質標準。HSC能夠產生所有造血細胞類型並且可以自體移植,從而使得它們成為所有造血性遺傳病症的極其有價值的細胞群體[魏斯曼,I.L.(Weissman,I.L.)和靜留,J.A.(Shizuru,J.A.)血液112,3543-3553(2008)]。理論上,基因校正的HSC可以用於治療廣泛範圍的遺傳性血液病症,這使得此研究成為治療性基因組編輯的令人興奮的重大發現。
體內編輯治療:體內編輯可以有利地根據本揭露和本領域的治療來使用。對於其中遞送有效的器官系統,已存在許多令人興奮的臨床前治療成功案例。成功的體內編輯治療的第一個實例在B型血友病的小鼠模型中得到證實[李,H.等人,自然475,217-221(2011)]。如前所述,B型血友病係藉由編碼因子IX(決定性凝血級聯組分)的基因的失功能突變引起的X連鎖隱性病症。在嚴重受影響個體中使因子IX活性恢復至超過其水平的1%可以使該疾病轉變成嚴重程度較輕的形式,因為重組因子IX輸注到從年輕時期開始預防的此類患者中以達到此類水平,極大地改善了臨床併發症[洛夫維斯特,T.等人,內科醫學雜誌241,395-400(1997)]。因此,改變患者臨床結果僅需要低水平的HDR基因校正。此外,因子IX係由肝臟合成和分泌的,該肝臟係可以藉由編碼編輯系統的病毒載體有效轉導的器官。
使用編碼ZFN和校正的HDR模板的親肝腺相關病毒(AAV)血清型,獲得小鼠肝臟內突變的人源化因子IX基因的多至7%基因校正[李,H.等人,自然475,217-221(2011)]。這使得凝血因子形成動力學(凝血級聯功能的測量值)得到改進,這首先表明體內編輯治療不僅是可行的而且是有效的。如在此所討論的,技術人員根據在此的教義和本領域的知識(例如,李)使用含有HDR模板的粒子和靶向X連鎖隱性病症的突變以逆轉失功能突變的CRISPR-Cas(Cpf1)系統來解決B型血友病。
建立此研究,其他組最近使用利用CRISPR-Cas的肝臟體內基因組編輯,以成功治療遺傳性高酪胺酸血症的小鼠模型
並且形成提供針對心血管疾病的保護的突變。這兩種不同的應用表明用於涉及肝功能缺陷的病症的這種方法的多功能性[殷,H.等人,自然生物技術32,551-553(2014);丁,Q.(Ding,Q.)等人,循環研究(Circulation research)115,488-492(2014)]。體內編輯對於其他器官系統的應用係必需的,以證明此策略係廣泛可用的。目前,已進行優化病毒和非病毒載體的努力,以擴展可以用此治療模式治療的病症範圍[科特曼,M.A.和謝弗,D.V.遺傳學自然評論15,445-451(2014);殷,H.等人,遺傳學自然評論15,541-555(2014)]。如在此所討論的,技術人員根據在此的教義和本領域的知識(例如,殷)使用含有HDR模板的粒子和靶向突變的CRISPR-Cas(Cpf1)系統來解決遺傳性高酪胺酸血症。
靶向缺失,治療應用:基因的靶向缺失可以是較佳的。因此,較佳的是涉及免疫缺陷病症、血液學病狀或遺傳性溶酶體貯積病,例如B型血友病、SCID、SCID-X1、ADA-SCID、遺傳性高酪胺酸血症、β-地中海貧血、X連鎖CGD、威斯科特-奧爾德里奇綜合症、範科尼貧血、腎上腺腦白質營養不良(ALD)、異染性腦白質營養不良(MLD)、HIV/AIDS、其他代謝性病症的基因,編碼涉及疾病的錯誤折疊蛋白質的基因,導致涉及疾病的功能缺失的基因;總體上,在HSC中可以使用具有認為有利的粒子系統的任何在此討論的遞送系統靶向的突變。
在本發明中,CRISPR酶的免疫原性具體地可以根據騰格裡(Tangri)等人相對於紅細胞生成素首先陳敘並隨後發展的方法來減小。因此,定向進化或合理設計可以用於減少大部分種
類(人類或其他種類)中的CRISPR酶(例如Cpf1)的免疫原性。
基因組編輯:本發明的CRISPR/Cas(Cpf1)系統可以用於校正先前使用TALEN和ZFN以及慢病毒(包括如在此所討論的)嘗試時有限成功的基因突變。還參見WO2013163628。
治療大腦、中樞神經和免疫系統的疾病
本發明還考慮將CRISPR-Cas系統遞送到大腦或神經元。例如,RNA干擾(RNAi)藉由減少杭丁頓氏症的致病基因HTT的表現來提供針對這種病症的治療潛力(例如,參見,麥克布賴德(McBride)等人,分子治療,第19卷,第12期,2011年12月,第2152-2162頁),因此申請者假設它可以用於並且/或者適於CRISPR-Cas系統。該CRISPR-Cas系統可以使用減去反義序列脫靶可能性的演算法來生成。CRISPR-Cas序列可以靶向小鼠、恒河猴或人類亨廷頓蛋白的外顯子52中的序列並且在病毒載體諸如AAV中表現。動物(包括人類)可以使用每個腦半球約三次顯微注射(總計六次注射):前連台的頭側前1mm(12μl)並且其餘兩次注射(分別是12μl和10μl)與前一次注射的尾側間隔3mm和6mm,其中AAV係1e12vg/ml,速率係約1μl/min,並且將針再放置於原處5分鐘以允許注人,以從針尖擴散。
迪非莉婭(DiFiglia)等人(美國國家科學院院刊,2007年10月23日,第104期,第43卷,17204-17209)觀察到單次給予到成人紋狀體的siRNA靶向Htt中可以沈默突變體Htt,減輕神經元病理,並且延遲在快速起效的病毒轉基因小鼠HD模型中觀察到的異常行為表型。迪非莉婭用2μl的10μM Cy3-標記的cc-siRNA-
Htt或未軛合siRNA-Htt注射到小鼠紋狀體內中。在本發明中對於人類可以考慮類似劑量的靶向Htt的CRISPR Cas,例如可以紋狀體內注射約5-10ml 10μM靶向Htt的CRISPR Cas。
在另一個實例中,布德羅(Boudreau)等人(分子治療,第17卷第6期,2009年6月)將5μl表現htt-特異性RNAi病毒(在4×1012個病毒基因組/ml下)的重組AAV血清型2/1載體注射到紋狀體中。在本發明中對於人類可以考慮類似劑量的靶向Htt的CRISPR Cas,例如可以紋狀體內注射約10-20ml(4×1012個病毒基因組/ml)靶向Htt的CRISPR Cas。
在另一個實例中,可以連續給予靶向HTT的CRISPR Cas(例如,參見,餘等人,細胞150,895-908,2012年8月31日)。余等人利用遞送0.25ml/h的滲透泵(型號2004)遞送300mg/天的ss-siRNA或磷酸鹽緩衝鹽水(PBS)(西格瑪奧德里奇公司),持續28天,並且使用設計為遞送0.5μl/h的泵(型號2002)遞送75mg/天的陽性對照MOE ASO,持續14天。用以無菌PBS稀釋的ss-siRNA或MOE填充泵(杜雷克特公司(Durect Corporation)),並且然後在37℃培養24或48小時(型號2004),之後移植。用2.5%異氟烷麻醉小鼠並且然後在顱底做出中線切口。使用立體定位引導件,將插管移植到右側腦室並且用樂泰膠固定。將附接至Alzet微型滲透泵的導管附接到該插管,並且將泵置於中肩胛區域皮下。切口用5.0尼龍縫線閉合。在本發明中對於人類可以考慮類似劑量的靶向Htt的CRISPR Cas,例如可以給予約500至1000g/天的靶向Htt的CRISPR Cas。
在連續輸注的另一個實例中,斯泰爾斯(Stiles)等人(實驗神經病學(Experimental Neurology)233(2012)463-471)將具有鈦針尖的腦實質內導管移植到右核殼中。將導管連接到皮下植入腹部的SynchroMed® II型泵(美敦力公司(Medtronic Neurological),明尼蘇達州明尼阿波利斯市(Minneapolis,MN))。在7天輸注6μL/天的磷酸鹽緩衝鹽水之後,用測試品再次填充泵並且程式設計以用於連續遞送7天。以約0.1至0.5μL/min的不同輸注速率輸注約2.3至11.52mg/d的siRNA。在本發明中對於人類可以考慮類似劑量的靶向Htt的CRISPR Cas,例如可以給予約20至200mg/天的靶向Htt的CRISPR Cas。在另一個實例中,轉讓給桑加莫公司的美國專利公開案號20130253040的方法也可以從TALES修改為本發明的核酸靶向系統,以用於治療杭丁頓氏症。
在另一個實例中,轉讓給桑加莫公司的美國專利公開案號20130253040(WO2013130824)的方法也可以從TALES修改為本發明的CRISPR Cas系統,以用於治療杭丁頓氏症。
在布羅德研究所等人名下的WO2015089354 A1(藉由引用結合在此)描述針對杭丁頓氏症(HP)的靶標。關於杭丁頓氏症的CRISPR複合物的可能的靶基因:PRKCE;IGF1;EP300;RCOR1;PRKCZ;HDAC4;以及TGM2。因此,在本發明的一些實施方式中,PRKCE;IGF1;EP300;RCOR1;PRKCZ;HDAC4;以及TGM2中的一種或多種可以被選擇為用於杭丁頓氏症的靶標。
其他三核苷酸重複序列病症。該等病症可以包括以下各項中的任一種:I類包括杭丁頓氏症(HD)和脊髓小腦性共濟失
調;II類擴增係在表型上多樣的,其中異種擴增通常數量較小但也可見於基因外顯子。並且III類包括脆性X綜合症、強直性肌營養不良、兩種脊髓小腦性共濟失調、青少年肌陣攣癲癇、以及弗裡德賴希氏共濟失調。
本發明的另一個方面涉及利用CRISPR-Cas系統校正已鑒定為與拉福拉病相關聯的EMP2A和EMP2B基因中的缺陷。拉福拉病係常染色體隱性病狀,它的特徵在於在青年期可以作為癲癇發作開始的進行性肌陣攣性癲痼。該疾病的幾種情況可以是由已鑒定的基因中突變引起的。該疾病引起驚厥、肌肉痙攣、行走困難、癡呆、以及最終死亡。目前沒有已證明針對疾病進展有效的治療。與癲癇相關聯的其他遺傳性異常也可以是藉由CRISPR-Cas系統靶向的並且潛在遺傳學在癲癇遺傳學和遺傳性癲癇(Genetics of Epilepsy and Genetic Epilepsies中進一步描述,該文獻由朱利亞諾.阿文濟尼(Giuliano Avanzini)、傑佛瑞L.諾貝爾斯(Jeffrey L.Noebels)編輯,馬里亞尼兒科神經學基礎(Mariani Foundation Paediatric Neurology):20;2009)。
轉讓給桑加莫生物科技公司的美國專利公開案號20110158957中涉及滅活T細胞受體(TCR)基因的方法也可以被修改成本發明的CRISPR Cas系統。在另一個實例中,轉讓給桑加莫生物科技公司的美國專利公開案號20100311124和轉讓給策勒克提斯公司的美國專利公開案號20110225664中均涉及滅活穀胺醯胺合成酶基因表現基因的方法也可以被修改成本發明的CRISPR Cas系統。
用於大腦的遞送選項包括將DNA或RNA形式的CRISPR酶和指導RNA封裝成脂質體並且與特洛伊木馬分子軛合以進行跨血腦障壁(BBB)遞送。已顯示特洛伊木馬分子有效於將B-gal表現載體遞送到非人類靈長動物大腦中。相同方法可以用於遞送含有CRISPR酶和指導RNA的載體。例如,夏CF(Xia CF)和博阿多RJ(Boado RJ),巴德里奇WM(Pardridge WM)(“經由人類胰島素受體使用抗生物素蛋白-生物素技術對siRNA進行抗體介導的靶向(Antibody-mediated targeting of siRNA via the human insulin receptor using avidin-biotin technology)”。分子藥劑學(Mol Pharm.),2009年5月-6月;6(3):747-51.doi:10.1021/mp800194)描述了將短干擾RNA(siRNA)遞送到培養基中的細胞中的方式,並且在體內藉由組合使用受體特異性單株抗體(mAb)和抗生物素蛋白-生物素技術係可能的。作者們還報導了因為靶向mAb與siRNA之間的鍵藉由抗生物素蛋白-生物素技術係穩定的,所以在靜脈內給予靶向的siRNA之後在體內觀察到遠距離位點諸如大腦處的RNAi效果。
張等人(分子治療,2003年1月;7(1):11-8.)描述了編碼報導物諸如螢光素酶的表現質粒封裝在包含85nm聚乙二醇化免疫脂質體的“人工病毒”內部的方式,該免疫脂質體與人胰島素受體(HIR)的單株抗體(MAb)一起靶向獼猴大腦中。在靜脈內注射之後,HIRMAb使得攜帶外源性基因的脂質體經受跨血腦障壁的轉胞吞作用和跨神經元質膜的胞吞作用。與大鼠相比,在獼猴中大腦螢光素酶基因表現水平高50倍。藉由組織化學和共焦顯微術二者證實了靈長類動物大腦中β-半乳糖苷酶基因的廣泛
神經元表現。作者們指示此方法在24小時內形成可行的可逆成人轉基因。因此,使用免疫脂質體係較佳的。該等可以結合抗體一起用於靶向特異性組織或細胞表面蛋白。
阿茲海默症
美國專利公開案號20110023153描述了使用鋅指核酸酶遺傳性修飾與阿茲海默症相關聯的細胞、動物和蛋白質。一旦修飾,細胞和動物就可以使用已知方法進一步測試,以使用AD研究中常用的測量(諸如但不限於,學習和記憶、焦慮、抑鬱、成癮、以及感覺運動功能)以及測量行為、功能、病理學、代謝和生物化學功能的測定來研究靶向突變對於AD的發展和/或進展的作用。
本揭露包括編輯編碼與AD相關聯的蛋白質的任何染色體序列。AD相關蛋白典型地是基於AD相關蛋白與AD病症的實驗相關性來選擇。例如,AD相關蛋白的產生率或循環濃度在患有AD病症的群體中相對於不存在AD病症的群體有所升高或降低。蛋白質水平的差異可以適於蛋白質組學技術來評估,該等技術包括但不限於,西方墨點法、免疫組織化學染色、酶聯免疫吸附測定(ELISA)、以及質譜法。可替代地,AD相關蛋白可以是藉由使用基因組技術獲得編碼該等蛋白質的基因的基因表現譜來鑒定,該等基因組技術包括但不限於DNA微陣列分析、基因表現序列分析(SAGE)、以及定量即時聚合酶鏈反應(Q-PCR)。
例如,阿茲海默症相關蛋白的實例可以包括由VLDLR基因編碼的極低密度脂蛋白受體蛋白(VLDLR)、由UBA1
基因編碼的泛素樣修飾劑啟動酶1(UBA1)、或由UBA3基因編碼的NEDD8啟動酶E1催化亞基蛋白(UBE1C)。
作為非限制性實例,與AD相關聯的蛋白質包括但不限於如下所列出的蛋白質:染色體序列編碼蛋白質,ALAS2 δ-胺乙醯丙酸合酶2(ALAS2);ABCA1 ATP-結合盒式轉運體(ABCA1);ACE血管緊張素轉化酶I(ACE);APOE載脂蛋白E先質(APOE);APP澱粉樣先質蛋白(APP);AQP1水通道蛋白1(AQP1);BIN1 Myc盒依賴性相互作用蛋白1或橋連整合蛋白1(BIN1);BDNF腦衍生神經元營養因子(BDNF);BTNL8嗜乳脂蛋白樣蛋白8(BTNL8);C1ORF49染色體1開放閱讀框49;CDH4鈣黏蛋白-4;CHRNB2神經元乙醯膽鹼受體亞基β-2;CKLFSF2 CKLF樣MARVEL跨膜結構域蛋白2(CKLFSF2);CLEC4E C-型凝集素結構域家族4成員e(CLEC4E);CLU聚集素蛋白(也稱為載脂蛋白J);CR1紅細胞補體受體1(CR1,也稱為CD35;C3b/C4b受體和免疫黏附受體);CR1L紅細胞補體受體1(CR1L);CSF3R粒細胞集落刺激因子3受體(CSF3R);CST3血清胱抑素C或血清胱抑素3;CYP2C細胞色素P450 2C;DAPK1死亡相關蛋白激酶1(DAPK1);ESR1雌激素受體1;FCAR IgA受體的Fc片段(FCAR,也稱為CD89);FCGR3B IgG Fc片段低親和力受體IIIb(FCGR3B或CD16b);FFA2游離脂肪酸受體2(FFA2);FGA纖維蛋白原(因子I);GAB2 GRB2-相關性結合蛋白2(GAB2);GAB2 GRB2-相關性結合蛋白2(GAB2);GALP甘丙肽樣肽;GAPDHS精子發生的甘油醛-3-磷酸脫氫酶(GAPDHS);GMPB GMBP;HP結合珠蛋白(HP);HTR7 5-羥色胺(血清素)受體7
(腺苷酸環化酶連接);IDE胰島素降解酶;IF127 IF127;IFI6干擾素α誘導型蛋白6(IFI6);IFIT2具有三角形四肽(tetratricopeptide)重複單元的干擾素誘導型蛋白2(IFIT2);IL1RN介白素-1受體拮抗劑(IL-1RA);IL8RA介白素8受體α(IL8RA或CD181);IL8RB介白素8受體β(IL8RB);JAG1Jagged 1(JAG1);KCNJ15整流鉀通道子家族J成員15(KCNJ15);LRP6低密度脂蛋白受體相關蛋白6(LRP6);MAPT微管相關蛋白τ(MAPT);MARK4 MAP/微管親和力調節激酶4(MARK4);MPHOSPH1 M期磷蛋白1;MTHFR 5,10-亞甲基四氫葉酸還原酶;MX2干擾素誘導型GTP-結合蛋白Mx2;NBN Nibrin(也稱為NBN);NCSTN呆蛋白;NIACR2煙酸受體2(NIACR2,也稱為GPR109B);NMNAT3煙醯胺核苷酸腺苷轉移酶3;NTM Neurotrimin(或HNT);ORM1血清類黏蛋白(Orosmucoid)1(ORM1)或α-1-酸糖蛋白1;P2RY13 P2Y嘌呤受體13(P2RY13);PBEF1煙醯胺磷酸核糖轉移酶(NAmPRT酶或Nampt)也稱為前-B-細胞集落增強因子1(PBEF1)或內脂素;PCK1磷酸烯醇丙酮酸羧化激酶;PICALM磷脂醯肌醇結合網格蛋白裝配蛋白(PICALM);PLAU尿激酶纖溶酶原啟動物(PLAU);PLXNC1叢狀蛋白C1(PLXNC1);PRNP朊病毒蛋白;PSEN1早老素蛋白1(PSEN1);PSEN2早老素蛋白2(PSEN2);PTPRA蛋白酪胺酸激酶磷酸酶受體A型蛋白(PTPRA);RALGPS2具有PH結構域和SH3結合模體的Ral GEF 2(RALGPS2);RGSL2 G蛋白傳訊樣調節因子2(RGSL2);SELENBP1硒結合蛋白1(SELNBP1);SLC25A37線粒體轉鐵蛋白(Mitoferrin)-1;SORL1選蛋白
(sortilin)相關受體L(DLR類)含A重複單元蛋白(SORL1);TF運鐵蛋白;TFAM線粒體轉錄因子A;TNF腫瘤壞死因子;TNFRSF10C腫瘤壞死因子受體超家族成員10C(TNFRSF10C);TNFSF10腫瘤壞死因子受體超家族(TRAIL)成員10a(TNFSF10);UBA1泛素樣修飾物啟動酶1(UBA1);UBA3 NEDD8-啟動酶E1催化亞基蛋白(UBE1C);UBB泛素B蛋白(UBB);UBQLN1泛醌蛋白(Ubiquilin)-1;UCHL1泛素羧基末端酯酶L1蛋白(UCHL1);UCHL3泛素羧基末端水解酶同工酶L3蛋白(UCHL3);VLDLR極低密度脂蛋白受體蛋白(VLDLR)
在示例性實施方式中,與AD相關聯且染色體序列被編輯的蛋白質可以是由VLDLR基因編碼的極低密度脂蛋白受體蛋白(VLDLR)、由UBA1基因編碼的泛素樣修飾物啟動酶1(UBA1)、由UBA3基因編碼的NEDD8-啟動酶E1催化亞基蛋白(UBE1C)、由AQP1基因編碼的水通道蛋白1(AQP1)、由UCHL1基因編碼的泛素羧基末端酯酶L1蛋白(UCHL1)、由UCHL3基因編碼的泛素羧基末端水解酶同工酶L3蛋白(UCHL3)、由UBB基因編碼的泛素B蛋白(UBB)、由MAPT基因編碼的微管相關蛋白τ(MAPT)、由PTPRA基因編碼的蛋白酪胺酸磷酸酶受體A型蛋白(PTPRA)、由PICALM基因編碼的磷脂醯肌醇結合網格蛋白裝配蛋白(PICALM)、由CLU基因編碼的聚集素蛋白(也稱為載脂蛋白J)、由PSEN1基因編碼的早老素蛋白1、由PSEN2基因編碼的早老素蛋白2、由SORL1基因編碼的選蛋白相關受體L(DLR類)含A重複單元蛋白(SORL1)、由APP基因編碼的澱粉樣前蛋白(APP)、由APOE基因編碼的載脂蛋白E先質(APOE)、
或者由BDNF基因編碼的腦衍生神經元營養因子(BDNF)。在一示例性實施方式中,遺傳修飾的動物係大鼠,並且編碼與AD相關聯的蛋白質的編輯的染色體序列如下:APP澱粉樣前蛋白(APP)NM_019288;AQP1水通道蛋白1(AQP1)NM_012778;BDNF腦衍生神經元營養因子NM_012513;CLU聚集素蛋白(也稱為載脂蛋白J)NM_053021;MAPT微管相關蛋白τ(MAPT)NM_017212;PICALM磷脂醯肌醇結合網格蛋白裝配蛋白(PICALM)NM_053554;PSEN1早老素蛋白1(PSEN1)NM_019163;PSEN2早老素蛋白2(PSEN2)NM_031087;PTPRA蛋白酪胺酸激酶磷酸酶受體A型蛋白(PTPRA)NM_012763;SORL1選蛋白相關受體L(DLR類)含A重複單元蛋白(SORL1)NM_053519;XM_001065506;XM_217115;UBA1泛素樣修飾物啟動酶1(UBA1)NM_001014080;UBA3 NEDD8-啟動酶E1催化亞基蛋白(UBE1C)NM_057205;UBB泛素B蛋白(UBB)NM_138895;UCHL1泛素羧基末端酯酶L1蛋白(UCHL1)NM_017237;UCHL3泛素羧基末端水解酶同工酶L3蛋白(UCHL3)NM_001110165;VLDLR極低密度脂蛋白受體蛋白(VLDLR)NM_013155
動物或細胞可以包含編碼與AD相關聯的蛋白質的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或更多個破壞的染色體序列和編碼與AD相關聯的蛋白質的0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或更多個染色體整合序列。
編輯或整合的染色體序列可以被修飾為編碼與AD相關聯的改變的蛋白質。在AD相關染色體序列中的許多突變已與AD相關聯。例如,APP中的V7171(即,在位置717處的纈胺酸被改變成異亮胺酸)錯義突變引起家族性AD。在早老素蛋白-1中的多重突變諸如H163R(即在位置163處的組胺酸被改變成精胺酸)、A246E(即在位置246處的丙胺酸被改變成穀胺酸)、L286V(即在位置286處的亮胺酸被改變成纈胺酸)以及C410Y(即在位置410處的半胱胺酸被改變成酪胺酸)引起家族性3型阿茲海默症。在早老素蛋白-2中的突變諸如N141I(即在位置141處的天冬醯胺被改變成異亮胺酸)、M239V(即在位置239處的甲硫胺酸被改變成纈胺酸)、以及D439A(即在位置439處的天冬胺酸被改變成丙胺酸)引起家族性4型阿茲海默症。AD相關基因的遺傳性變型與疾病的其他相關性係本領域已知的。參見,例如華陵(Waring)等人(2008),神經學檔案(Arch.Neurol.)65:329-334,該文獻的揭露內容藉由引用以其整體結合在此。
分泌酶病症
美國專利公開案號20110023146描述了使用鋅指核酸酶遺傳性修飾與分泌酶相關病症相關聯的細胞、動物和蛋白質。分泌酶係將前蛋白加工成其生物活性形式所必需的。分泌酶途徑的不同組分的缺陷導致許多病症,具體地是具有標誌性澱粉狀蛋白生成或澱粉樣蛋白斑的那些病症,諸如阿茲海默症(AD)。
分泌酶病症和與該等病症相關聯的蛋白質係造成許多病症的易感性、病症的存在、病症的嚴重性或其任何組合的一
組不同的蛋白質。本揭露包括編輯編碼與分泌酶病症相關聯的蛋白質的任何染色體序列。與分泌酶病症相關聯的蛋白質典型地是基於分泌酶相關蛋白與分泌酶病症的發展的實驗相關性來選擇的。例如,與分泌酶病症相關聯的蛋白質的產生率或循環濃度在患有分泌酶病症的群體中相對於未患有分泌酶病症的群體有所升高或降低。蛋白質水平的差異可以適於蛋白質組學技術來評估,該等技術包括但不限於,西方墨點法、免疫組織化學染色、酶聯免疫吸附測定(ELISA)、以及質譜法。可替代地,與分泌酶病症相關聯的蛋白質可以是藉由使用基因組技術獲得編碼該等蛋白質的基因的基因表現譜來鑒定,該等基因組技術包括但不限於DNA微陣列分析、基因表現序列分析(SAGE)、以及定量即時聚合酶鏈反應(Q-PCR)。
作為非限制性實例,與分泌酶病症相關聯的蛋白質包括PSENEN(早老素增強子2同源物(秀麗隱桿線蟲))、CTSB(組織蛋白酶B)、PSEN1(早老素1)、APP(澱粉樣β(A4)先質蛋白)、APH1B(前咽缺陷性1同源物B(秀麗隱桿線蟲))、PSEN2(早老素2(阿茲海默症4))、BACE1(β-位點APP-切割酶1)、ITM2B(整合膜蛋白2B)、CTSD(組織蛋白酶D)、NOTCH1(Notch同源物1,易位相關(果蠅))、TNF(腫瘤壞死因子(TNF超家族,成員2))、INS(胰島素)、DYT10(肌張力障礙10)、ADAM17(ADAM金屬肽酶結構域17)、APOE(載脂蛋白E)、ACE(血管緊張素轉化酶1(肽基二肽酶A)1)、STN(他汀類)、TP53(腫瘤蛋白p53)、IL6(介白素6(干擾素,β2))、NGFR(神經生長因子受體(TNFR超家族,成員16))、IL1B(介白素1,β)、ACHE(乙醯膽鹼酯酶(Yt
血型))、CTNNB1(鏈蛋白(鈣黏蛋白相關蛋白),β1,88kDa)、IGF1(胰島素樣生長因子1(生長調節素C))、IFNG(干擾素,γ)、NRG1(神經調節蛋白1)、CASP3(半胱天冬酶3,細胞凋亡相關半胱胺酸肽酶)、MAPK1(絲裂原啟動蛋白激酶1)、CDH1(鈣黏蛋白1,1型,E-鈣黏蛋白(上皮))、APBB1(澱粉樣β(A4)先質蛋白結合,家族B,成員1(Fe65))、HMGCR(3-羥基-3-甲基戊二醯-輔酶A還原酶)、CREB1(cAMP應答元件結合蛋白1)、PTGS2(前列腺素-內過氧化物合酶2(前列腺素G/H合醇和環氧合酶))、HES1(長毛和裂口增強蛋白1,(果蠅))、CAT(過氧化氫酶)、TGFB1(轉化生長因子,β1)、ENO2(烯醇酶2(γ,神經元))、ERBB4(v-erb-a成紅細胞白血病病毒癌基因同源物4(鳥類))、TRAPPC10(運輸蛋白顆粒複合物10)、MAOB(單胺氧化酶B)、NGF(神經生長因子(β多肽))、MMP12(基質金屬蛋白酶12(巨噬細胞彈力蛋白酶))、JAG1(jagged 1(阿拉吉歐綜合症))、CD40LG(CD40配位基)、PPARG(過氧化物酶體增殖物啟動受體γ)、FGF2(成纖維細胞生長因子2(基底))、IL3(介白素3(集落刺激因子,多個))、LRP1(低密度脂蛋白受體相關蛋白1)、NOTCH4(Notch同源物4(果蠅))、MAPK8(絲裂原-啟動蛋白激酶8)、PREP(脯肽醯內肽酶)、NOTCH3(Notch同源物3(果蠅))、PRNP(朊病毒蛋白)、CTSG(組織蛋白酶G)、EGF(表皮生長因子(β-尿抑胃素))、REN(腎素)、CD44(CD44分子(印度血型))、SELP(選擇素P(顆粒膜蛋白140kDa,抗原CD62))、GHR(生長激素受體)、ADCYAP1(腺苷酸環化酶啟動多肽1(垂體))、INSR(胰島素受體)、GFAP(膠質原酸性纖維蛋白)、MMP3(基質金屬蛋白酶3(溶基質素1,
前明膠酶(progelatinase)))、MAPK10(絲裂原-啟動蛋白激酶10)、SP1(Sp1轉錄因子)、MYC(v-myc髓細胞組織增生病毒癌基因同源物(鳥類))、CTSE(組織蛋白酶E)、PPARA(過氧化物酶體增殖物-啟動受體α)、JUN(jun癌基因)、TIMP1(TIMP金屬肽酶抑制劑1)、IL5(介白素5(集落刺激因子,嗜酸性粒細胞))、IL1A(介白素1,α)、MMP9(基質金屬肽酶9(明膠酶B,92kDa明膠酶,92kDa IV型膠原酶))、HTR4(5-羥色胺(血清素)受體4)、HSPG2(硫酸類肝素蛋白多糖2)、KRAS(v-Ki-ras2柯爾斯頓大鼠肉瘤病毒癌基因同源物)、CYCS(細胞色素c,軀體)、SMG1(SMG1同源物,磷脂醯肌醇3-激酶相關激酶(秀麗隱桿線蟲))、IL1R1(介白素1受體,I型)、PROK1(前動力蛋白1)、MAPK3(絲裂原-啟動蛋白激酶3)、NTRK1(神經營養性酪胺酸激酶,受體,1型)、IL13(介白素13)、MME(膜金屬內肽酶)、TKT(轉酮醇酶)、CXCR2(趨化因子(C-X-C模體)受體2)、IGF1R(胰島素樣生長因子1受體)、RARA(視黃酸受體,α)、CREBBP(CREB結合蛋白)、PTGS1(前列腺素-內過氧化物合酶1(前列腺素G/H合酶和環氧合酶))、GALT(半乳糖-1磷酸尿甙基轉化酶)、CHRM1(膽鹼能受體,毒蕈鹼型1)、ATXN1(共濟失調蛋白(ataxin)1)、PAWR(PRKC,細胞凋亡,WT1,調節劑)、NOTCH2(Notch同源物2(果蠅))、M6PR(甘露糖-6-磷酸受體(陽離子依賴型))、CYP46A1(細胞色素P450,家族46,子家族A,多肽1)、CSNK1 D(酪蛋白激酶1,δ)、MAPK14(絲裂原-啟動蛋白激酶14)、PRG2(蛋白多糖2,骨髓(自然殺傷細胞啟動劑,嗜酸性粒細胞顆粒樣主要鹼性蛋白))、PRKCA(蛋白激酶C,α)、L1 CAM(L1細胞黏附分子)、CD40(CD40
分子,TNF受體超家族成員5)、NR1I2(核受體子家族1,I組,成員2)、JAG2(jagged 2)、CTNND1(連環素(鈣黏蛋白相關蛋白),δ 1)、CDH2(鈣黏蛋白2,1型,N-鈣黏蛋白(神經元))、CMA1(糜酶1,肥大細胞)、SORT1(選蛋白1)、DLK1(δ-樣1同源物(果蠅))、THEM4(硫酯酶超家族成員4)、JUP(接合斑珠蛋白)、CD46(CD46分子,補體調節蛋白)、CCL11(趨化因子(C-C模體)配位基11)、CAV3(小窩蛋白3)、RNASE3(核糖核酸酶,RNA酶A家族,3(嗜酸性粒細胞陽離子蛋白))、HSPA8(熱休克70kDa蛋白8)、CASP9(半胱天冬酶9,細胞凋亡相關半胱胺酸肽酶)、CYP3A4(細胞色素P450,家族3,子家族A,多肽4)、CCR3(趨化因子(C-C模體)受體3)、TFAP2A(轉錄因子AP-2α(啟動增強子結合蛋白2α))、SCP2(固醇載體蛋白2)、CDK4(週期蛋白依賴性激酶4)、HIF1A(低氧誘導因子1,α亞基(鹼性螺旋-環-螺旋轉錄因子))、TCF7L2(轉錄因子7-樣2(T-細胞特異性,HMG-盒))、IL1R2(介白素1受體,II型)、B3GALTL(β 1,3-半乳糖基轉移酶樣)、MDM2(Mdm2 p53結合蛋白同源物(小鼠))、RELA(v-rel網狀內皮組織增殖病毒癌基因同源物A(鳥類))、CASP7(半胱天冬酶7,細胞凋亡相關半胱胺酸肽酶)、IDE(胰島素降解酶)、FABP4(脂肪酸結合4,脂肪細胞)、CASK(鈣/鈣調蛋白依賴性絲胺酸蛋白激酶(MAGUK家族))、ADCYAP1R1(腺苷酸環化酶啟動多肽1(垂體)受體I型)、ATF4(啟動轉錄因子4(tax-應答增強子元件B67))、PDGFA(血小板源生長因子α多肽)、C21或f33(染色體21開放閱讀框33)、SCG5(分泌粒蛋白V(7B2蛋白))、RNF123(環指蛋白123)、NFKB1(B細胞中輕κ多肽基因增強子的核因子1)、
ERBB2(v-erb-b2成紅細胞白血病病毒癌基因同源物2,神經/成膠質細胞瘤源癌基因同源物(鳥類))、CAV1(小窩蛋白1,小凹蛋白,22kDa)、MMP7(基質金屬肽酶7(基質溶解因子,子宮))、TGFA(轉化生長因子,α)、RXRA(類視黃醇X受體,α)、STX1A(突觸融合蛋白1A(大腦))、PSMC4(蛋白酶體(先質,巨蛋白因子)26S亞基,ATP酶,4)、P2RY2(嘌呤受體P2Y,G-蛋白偶聯,2)、TNFRSF21(腫瘤壞死因子受體超家族,成員21)、DLG1(盤狀,大同源物1(果蠅))、NUMBL(numb同源物(果蠅)樣)、SPN(載唾液酸蛋白)、PLSCR1(磷脂促翻轉酶1)、UBQLN2(泛醌蛋白2)、UBQLN1(泛醌蛋白1)、PCSK7(前蛋白轉化酶枯草桿菌蛋白酶/kexin 7型)、SPON1(脊椎蛋白1,細胞外基質蛋白)、SILV(銀同源物(小鼠))、QPCT(穀胺醯胺醯肽環轉移酶)、HESS(長毛和裂口增強蛋白5(果蠅))、GCC1(含GRIP和捲曲螺旋結構域1)、以及其任何組合。
遺傳修飾的動物或細胞可以包含編碼與分泌酶病症相關聯的蛋白質的1、2、3、4、5、6、7、8、9,10或更多個破壞的染色體序列和編碼與分泌酶病症相關聯的破壞蛋白質的0、1、2、3、4、5、6、7、8、9、10或更多個染色體整合序列。
ALS
美國專利公開案號20110023144描述了使用鋅指核酸酶遺傳性修飾與肌萎縮性側索硬化(ALS)疾病相關聯的細胞、動物和蛋白質。ALS的特徵在於涉及隨意運動的大腦皮層、腦幹和脊髓中某些神經細胞的逐漸穩定的變性。
運動神經元紊亂和與該等病症相關聯的蛋白質係造成對發展運動神經元紊亂的易感性、運動神經元紊亂的存在、運動神經元紊亂的嚴重性或其任何組合的一組不同的蛋白質。本揭露包括編輯編碼與一特定運動神經元紊亂ALS病相關聯的蛋白質的任何染色體序列。與ALS相關聯的蛋白質典型地是基於ALS相關蛋白與ALS的實驗相關性來選擇的。例如,與ALS相關聯的蛋白質的產生率或循環濃度在患有ALS的群體中相對於未患有ALS的群體有所升高或降低。蛋白質水平的差異可以適於蛋白質組學技術來評估,該等技術包括但不限於,西方墨點法、免疫組織化學染色、酶聯免疫吸附測定(ELISA)、以及質譜法。可替代地,與ALS相關聯的蛋白質可以是藉由使用基因組技術獲得編碼該等蛋白質的基因的基因表現譜來鑒定,該等基因組技術包括但不限於DNA微陣列分析、基因表現序列分析(SAGE)、以及定量即時聚合酶鏈反應(Q-PCR)。
作為非限制性實例,與ALS相關聯的蛋白質包括但不限於以下蛋白質:SOD1超氧化物歧化酶1(可溶性)、ALS3肌萎縮側索硬化3;SETX senataxin ALS5肌萎縮側索硬化5;FUS肉瘤融合蛋白ALS7肌萎縮側索硬化7;ALS2肌萎縮側索硬化2 DPP6二肽基-肽酶6;NEFH神經絲,重多肽PTGS1前列腺素內過氧化物合酶1;SLC1A2溶質運載蛋白家族1(神經膠質高親和力穀胺酸轉運體)成員2 TNFRSF10B腫瘤壞死因子受體超家族成員10b;PRPH外週蛋白HSP90AA1熱休克蛋白90kDa α(細胞溶質),類別A成員1;GRIA2穀胺酸受體,離子移變,AMPA 2 IFNG干擾素,γ;S100B S100鈣結合蛋白B FGF2成纖
維細胞生長因子2;AOX1醛氧化酶1 CS檸檬酸合酶;TARDBP TAR DNA結合蛋白TXN硫氧還蛋白;RAPH1 Ras締合(RaIGDS/AF-6)和普列克底物蛋白同源結構域1 MAP3K5絲裂原啟動蛋白激酶5;NBEAL1蛋白激酶錨定蛋白(neurobeachin)樣1 GPX1麩胱甘肽過氧化物酶1;ICA1L胰島細胞自身抗原1.69kDa-樣RAC1 ras相關C3肉毒菌毒素底物1;MAPT微管相關蛋白tau ITPR2肌醇1,4,5-三磷酸鹽受體,2型;ALS2CR4肌萎縮側索硬化2(青少年)染色體區,候選物4GLS穀胺醯胺酶;ALS2CR8肌萎縮側索硬化2(青少年)染色體區,候選物8 CNTFR睫狀神經營養因子受體;ALS2CR11肌萎縮側索硬化2(青少年)染色體區,候選物11 FOLH1葉酸水解酶1;FAM117B具有序列相似性117的家族,成員B P4HB脯胺醯4-羥化酶β多肽;CNTF睫狀神經營養因子SQSTM1死骨片(sequestosome)1;STRADB STE20-相關激酶接合蛋白β NAIP NLR家族,細胞凋亡抑制蛋白;YWHAQ酪胺酸3-單氧酶/色胺酸(tryptoph)5-單氧酶啟動蛋白,Θ多肽SLC33A1溶質運載蛋白家族33(乙醯-CoA轉運體),成員1;TRAK2運輸蛋白驅動蛋白結合2圖4圖4同源物,SAC1脂質磷酸酶結構域;NIF3L1 NIF3 NGG1相互作用因子3-樣1 INA互聯蛋白神經元中間絲狀體蛋白,α;PARD3B par-3分區缺陷性3同源物B COX8A細胞色素c氧化酶亞基VIIIA;CDK15週期蛋白依賴性激酶15 HECW1含有HECT、C2和WW結構域E3泛素蛋白連接酶1;NOS1一氧化氮合酶1 MET met原癌基因;SOD2超氧化物歧化酶2,線粒體HSPB1熱休克27kDa蛋白1;NEFL神經絲,輕多肽CTSB組織蛋白酶B;ANG血管生成素,核糖
核酸酶,RNA酶家族,5 HSPA8熱休克70kDa蛋白8;VAPB VAMP(囊泡相關膜蛋白)相關蛋白B和C ESR1雌激素受體1;SNCA突觸核蛋白,α HGF肝細胞生長因子;CAT過氧化氫酶ACTB肌動蛋白,β;NEFM神經絲,中等多肽TH酪胺酸羥化酶;BCL2 B-細胞CLL/淋巴瘤2 FAS Fas(TNF受體超家族,成員6);CASP3半胱天冬酶3,細胞凋亡相關半胱胺酸肽酶CLU叢生蛋白;SMN1調聚的運動神經元1的存活G6PD葡萄糖-6-磷酸脫氫酶;BAX BCL2-締合X蛋白HSF1熱休克轉錄因子1;RNF19A環指蛋白19A JUN jun癌基因;ALS2CR12肌萎縮側索硬化2(青少年)染色體區,候選物12 HSPA5熱休克70kDa蛋白5;MAPK14絲裂原啟動蛋白激酶14 IL10介白素10;APEX1 APEX核酸酶(多功能DNA修復酶)1 TXNRD1硫氧還蛋白還原酶1;NOS2一氧化氮合酶2,誘導型TIMP1 TIMP金屬肽酶抑制劑1;CASP9半胱天冬酶9,細胞凋亡相關半胱胺酸肽酶XIAP細胞凋亡X-連鎖抑制劑;GLG1 golgi糖蛋白1 EPO紅細胞生成素;VEGFA血管內皮生長因子A ELN彈性蛋白;GDNF膠質細胞源性神經營養因子NFE2L2核因子(紅細胞源性2)樣2;SLC6A3溶質運載蛋白家族6(神經遞質蛋白4轉運體,多巴胺),成員3 HSPA4熱休克70kDa蛋白4;APOE載脂蛋白E PSMB8蛋白酶體(先質、巨蛋白因子(macropain))亞基,β型,8;DCTN1動力蛋白啟動蛋白1 TIMP3 TIMP金屬肽酶抑制劑3;KIFAP3驅動蛋白締合蛋白3 SLC1A1溶質運載蛋白家族1(神經元/上皮高親和力穀胺酸轉運體,系統Xag),成員1;SMN2運動神經元2的存活,著絲粒CCNC週期蛋白C;MPP4膜蛋白,棕櫚醯化4
STUB1 STIP1同源物和含U-框蛋白1;ALS2澱粉樣β(A4)先質蛋白PRDX6過氧化物氧化還原酶6;SYP突觸素CABIN1鈣調磷酸酶結合蛋白1;CASP1半胱天冬酶1,細胞凋亡相關半胱胺酸肽酶GART磷酸核糖基甘胺醯脫甲醯基轉移酶、磷酸核糖基甘胺醯脫合成酶、磷酸核糖基甘胺醯唑基合成酶;CDK5週期蛋白依賴性激酶5 ATXN3共濟失調蛋白3;RTN4網狀內皮素4C1QB補體組分1,q亞組分,B鏈;VEGFC神經生長因子受體HTT亨廷頓蛋白;PARK7帕金森病7 XDH黃嘌呤脫氫酶;GFAP膠質原酸性纖維蛋白MAP2微管相關蛋白2;CYCS細胞色素c,軀體FCGR3B IgG的Fc片段,低親和力IIIb;CCS超氧化物歧化酶的銅分子伴侶UBL5泛素樣5;MMP9基質金屬肽酶9SLC18A3溶質運載蛋白家族18(囊泡乙醯膽鹼)成員3;TRPM7暫態型受體潛在陽離子通道,超家族M,成員7 HSPB2熱休克27kDa蛋白2;AKT1 v-akt小鼠胸腺瘤病毒癌基因同源物1 DERL1 Der1-樣結構域家族,成員1;CCL2趨化因子(C─C模體)配位基2 NGRN神經元蛋白(neugrin),神經突增生相關;GSR麩胱甘肽還原酶TPPP3促微管蛋白聚合的蛋白質家族成員3;APAF1細胞凋亡肽酶活化物1 BTBD10 BTB(POZ)結構域活化物10;GLUD1穀胺酸脫氫酶1 CXCR4趨化因子(C--X─C模體)受體4;SLC1A3溶質運載蛋白家族1(神經膠質高親和力穀胺酸轉運體)成員3 FLT1 fms-相關酪胺酸激酶1;PON1對氧磷酶1 AR雄激素受體;LIF白血病抑制因子ERBB3 v-erb-b2成紅細胞病毒癌基因同源物3;LGALS1凝集素,半乳糖苷-結合,溶質,1CD44 CD44分子;TP53腫瘤蛋白p53 TLR3 toll樣受體3;GRIA1穀
胺酸受體,離子移變,AMPA 1GAPDH甘油醛-3-磷酸脫氫酶;GRIK1穀胺酸受體離子移變,紅藻胺酸1 DES肌間線蛋白;CHAT膽鹼乙醯轉移酶FLT4 fms相關酪胺酸激酶4;CHMP2B染色質修飾蛋白BAG1 BCL2相關永生基因;MT3金屬硫蛋白3 CHRNA4膽鹼能受體,煙酸,α4;GSS麩胱甘肽合成酶BAK1 BCL2-拮抗劑/殺傷細胞1;KDR激酶插入結構域受體(III型受體酪胺酸激酶)GSTP1麩胱甘肽s-轉移酶pi 1;OGG1 8-氧橋鳥嘌呤DNA糖苷酶IL6介白素6(干擾素,β2)。
動物或細胞可以包含編碼與ALS相關聯的蛋白質的1、2、3、4、5、6、7、8、9,10或更多個破壞的染色體序列和編碼與ALS相關聯的破壞蛋白質的0、1、2、3、4、5、6、7、8、9、10或更多個染色體整合序列。與ALS相關聯的較佳的蛋白質包括SOD1(超氧化物歧化酶1)、ALS2(肌萎縮性側索硬化2)、FUS(肉瘤融合蛋白)、TARDBP(TAR DNA結合蛋白)、VAGFA(血管內皮生長因子A)、VAGFB(血管內皮生長因子B)、以及VAGFC(血管內皮生長因子C)、以及其任何組合。
自閉症
美國專利公開案號20110023145描述了使用鋅指核酸酶遺傳性修飾與自閉症譜系障礙(ASD)相關聯的細胞、動物和蛋白質。自閉症譜系障礙(ASD)係一組特徵在於社交交互和溝通的定性損傷、以及行為、興趣和活動的限制性重複和刻板模式的病症。三種病症自閉症、亞斯伯格症候群(AS)和未另行規定的廣泛性發育障礙(PDD-NOS)係具有不同嚴重程度、相關智力功能
和醫學病狀的連續性病症。ASD係主要的遺傳確定的病症,其中遺傳力係約90%。
美國專利公開案號20110023145包括編輯編碼與ASD相關聯的蛋白質的任何染色體序列,它們可以適用於本發明的CRISPR Cas系統。與ASD相關聯的蛋白質典型地是基於和ASD相關聯的蛋白質與ASD的發病率或指征的實驗相關性來選擇。例如,與ASD相關聯的蛋白質的產生率或循環濃度在患有ASD的群體中相對於不存在ASD的群體有所升高或降低。蛋白質水平的差異可以適於蛋白質組學技術來評估,該等技術包括但不限於,西方墨點法、免疫組織化學染色、酶聯免疫吸附測定(ELISA)、以及質譜法。可替代地,與ASD相關聯的蛋白質可以是藉由使用基因組技術獲得編碼該等蛋白質的基因的基因表現譜來鑒定,該等基因組技術包括但不限於DNA微陣列分析、基因表現序列分析(SAGE)、以及定量即時聚合酶鏈反應(Q-PCR)。
可能與和ASD相關聯的蛋白質相關的疾病狀態或病症的非限制性實例包括自閉症、亞斯伯格症候群(AS)、未另行規定的廣泛性發育障礙(PDD-NOS)、雷特氏綜合症(Rett's syndrome)、結節性硬化、苯酮尿症(phenylketonuria)、史-倫-奧三氏綜合症(Smith-Lemli-Opitz syndrome)、以及脆性X綜合症。作為非限制性實例,與ASD相關聯的蛋白質包括但不限於以下蛋白質:ATP10C胺磷脂轉運的ATP酶(ATP10C)METMET受體酪胺酸激酶;BZRAP1 MGLUR5(GRM5)代謝型穀胺酸受體5(MGLUR5);CDH10鈣黏蛋白-10 MGLUR6(GRM6)代謝型穀
胺酸受體6(MGLUR6);CDH9鈣黏蛋白-9 NLGN1神經連接蛋白-1;CNTN4接觸蛋白-4 NLGN2神經連接蛋白-2;CNTNAP2接觸蛋白相關蛋白樣2(CNTNAP2)SEMA5A神經連接蛋白-3;DHCR7 7-脫氫膽甾醇還原酶(DHCR7)NLGN4X神經連接蛋白-4 X-連接;DOC2A含雙C2-樣結構域蛋白α NLGN4Y神經連接蛋白-4Y-連接;DPP6二肽基胺肽酶樣蛋白6 NLGN5神經連接蛋白-5;EN2鋸齒蛋白2(EN2)NRCAM神經元細胞黏附分子(NRCAM);MDGA2脆性X精神發育遲緩1(MDGA2)NRXN1軸突蛋白-1;FMR2(AFF2)AF4/FMR2家族成員2 OR4M2嗅覺受體4M2;FOXP2叉頭框蛋白P2(FOXP2)OR4N4嗅覺受體4N4;FXR1脆性X精神發育遲緩,常染色體同源物1(FXR1)OXTR催產素受體(OXTR);FXR2脆性X精神發育遲緩,常染色體同源物2(FXR2)PAH苯基丙胺酸羥化酶(PAH);GABRA1 γ胺基丁酸受體亞基α-1(GABRA1)PTEN磷酸酶和張力蛋白同源物(PTEN);GABRA5 GABAA(γ胺基丁酸)受體α5亞基(GABRA5)PTPRZ1受體型酪胺酸蛋白磷酸酶ζ(PTPRZ1);GABRB1 γ胺基丁酸受體亞基β-1(GABRB1)RELN顫蛋白(Reelin);GABRB3 GABAA(γ胺基丁酸)受體β3亞基(GABRB3)RPL10 60S核糖體蛋白L10;GABRG1 γ胺基丁酸受體亞基γ-1(GABRG1)SEMA5A臂板蛋白-5A(SEMA5A);HIRIP3 HIRA-相互作用蛋白3 SEZ6L2癲癇相關6同源物(小鼠)樣2;HOXA1同源框蛋白Hox-A1(HOXA1)SHANK3 SH3和多個錨蛋白重複結構域3(SHANK3);IL6介白素-6 SHBZRAP1 SH3和多個錨蛋白重複結構域3(SHBZRAP1);LAMB1層黏連蛋白亞基β-1(LAMB1)SLC6A4
血清素轉運體(SERT);MAPK3絲裂原啟動蛋白激酶3 TAS2R1味覺受體2型成員1 TAS2R1;MAZ Myc-相關鋅指蛋白TSC1結節性硬化蛋白1;MDGA2含MAM結構域的糖基磷脂醯肌醇錨2(MDGA2)TSC2結節性硬化蛋白2;MECP2甲基CpG結合蛋白2(MECP2)UBE3A泛素蛋白連接酶E3A(UBE3A);MECP2甲基CpG結合蛋白2(MECP2)WNT2無翼型(Wingless-type)蛋白MMTV整合位點家族,成員2(WNT2)
與ASD相關聯且其染色體序列被編輯的蛋白質的性質可以並且將發生改變。在較佳的實施方式中,與ASD相關聯且其染色體序列被編輯的蛋白質可以是由BZRAP1基因編碼的苯二氮類受體(外週)相關蛋白1(BZRAP1)、由AFF2基因(也稱為MFR2)編碼的AF4/FMR2家族成員2蛋白(AFF2)、由FXR1基因編碼的脆性X精神發育遲緩常染色體同源蛋白1(FXR1)、由FXR2基因編碼的脆性X精神發育遲緩常染色體同源蛋白2(FXR2)、由MDGA2基因編碼的含MAM結構域的糖基磷脂醯肌醇錨蛋白2(MDGA2)、由MECP2基因編碼的甲基CpG結合蛋白2(MECP2)、由MGLUR5-1基因(也稱為GRM5)編碼的代謝型穀胺酸受體5(MGLUR5)、由NRXN1基因編碼的軸突蛋白1、或者由SEMA5A基因編碼的臂板蛋白-5A(SEMA5A)。在一示例性實施方式中,遺傳修飾的動物係大鼠,並且編碼與ASD相關聯的蛋白質的編輯的染色體序列係如以下所列出的:BZRAP1苯二氮類受體(外週)相關蛋白1(BZRAP1)XM_002727789、XM_213427、XM_002724533、XM_001081125;AFF2(FMR2)AF4/FMR2家族成員(AFF2)2 XM_219832、XM_001054673;FXR1
脆性X精神發育遲緩常染色體同源蛋白1(FXR1)NM_001012179;FXR2脆性X精神發育遲緩常染色體同源蛋白2(FXR2)NM_001100647;MDGA2含MAM結構域的糖基磷脂醯肌醇錨蛋白2(MDGA2)NM_199269;MECP2甲基CpG結合蛋白2(MECP2)NM_022673;MGLUR5代謝型穀胺酸受體5(MGLUR5)NM_017012(GRM5);NRXN1軸突蛋白1 NM_021767;SEMA5A臂板蛋白-5A(SEMA5A)NM_001107659。
三核苷酸重複序列擴增病症
美國專利公開案號20110016540描述了使用鋅指核酸酶遺傳性修飾與三核苷酸重複序列擴增病症相關聯的細胞、動物和蛋白質。三核苷酸重複序列擴增病症係涉及發育神經生物學的複雜的進展性病症並且常常影響認知功能以及感知運動功能。
三核苷酸重複序列擴增蛋白係與發展三核苷酸重複序列擴增病症的易感性、三核苷酸重複序列擴增病症的存在、三核苷酸重複序列擴增病症的嚴重性或其任何組合相關聯的一組不同的蛋白質。三核苷酸重複序列擴增病症被分成藉由重複序列類型確定的兩類。最常見的重複序列係三聯體CAG,該三聯體當存在於基因的編碼區時編碼胺基酸穀胺醯胺(Q)。因此,該等病症被稱為聚穀胺醯胺(polyQ)病症並且包括以下疾病:杭丁頓氏症(HD);脊延髓肌萎縮症(SBMA);脊髓小腦性共濟失調(1、2、3、6、7、以及17型SCA);以及齒狀核紅核蒼白球雷維體萎縮(Dentatorubro-Pallidoluysian Atrophy,DRPLA)。其餘三核苷酸重複序列擴增病症並不涉及CAG三聯體或者該CAG三聯體並不在
該基因的編碼區內,並且因此被稱為非聚穀胺醯胺病症。非聚穀胺醯胺病症包括脆性X綜合症(FRAXA);脆性XE精神發育遲緩(FRAXE);弗裡德賴希氏共濟失調(FRDA);強直性肌營養不良(DM);以及脊髓小腦性共濟失調(8型和12型SCA)。
與三核苷酸重複序列擴增病症相關聯的蛋白質典型地是基於和三核苷酸重複序列擴增病症相關聯的蛋白質與三核苷酸重複序列擴增病症的實驗相關性來選擇的。例如,與三核苷酸重複序列擴增病症相關聯的蛋白質的產生率或循環濃度在患有三核苷酸重複序列擴增病症的群體中相對於不存在三核苷酸重複序列擴增病症的群體有所升高或降低。蛋白質水平的差異可以適於蛋白質組學技術來評估,該等技術包括但不限於,西方墨點法、免疫組織化學染色、酶聯免疫吸附測定(ELISA)、以及質譜法。可替代地,與三核苷酸重複序列擴增病症相關聯的蛋白質可以是藉由使用基因組技術獲得編碼該等蛋白質的基因的基因表現譜來鑒定,該等基因組技術包括但不限於DNA微陣列分析、基因表現序列分析(SAGE)、以及定量即時聚合酶鏈反應(Q-PCR)。
與三核苷酸重複序列擴增病症相關聯的蛋白質的非限制性實例包括AR(雄激素受體)、FMR1(脆性X精神發育遲緩1)、HTT(亨廷頓蛋白)、DMPK(肌營養不良性肌強直症蛋白激酶)、FXN(費氏共濟失調蛋白(frataxin))、ATXN2(共濟失調蛋白2)、ATN1(萎縮蛋白(atrophin)1)、FEN1(翼結構特異性內切核酸酶1)、TNRC6A(含三核苷酸重複序列6A)、PABPN1(聚(A)結合蛋白,核1)、JPH3(親聯蛋白3)、MED15(仲介體複合物
亞基15)、ATXN1(共濟失調蛋白1)、ATXN3(共濟失調蛋白3)、TBP(TATA框結合蛋白)、CACNA1A(鈣通道,電壓依賴型,P/Q型,α1A亞基)、ATXN80S(ATXN8相反股(非蛋白質編碼股))、PPP2R2B(蛋白磷酸酶2,調節亞基B,β)、ATXN7(共濟失調蛋白7)、TNRC6B(含三核苷酸重複序列6B)、TNRC6C(含三核苷酸重複序列6C)、CELF3(CUGBP,Elav-樣家族成員3)、MAB21L1(mab-21-樣1(秀麗隱桿線蟲))、MSH2(mutS同源物2,結腸癌,非息肉病性1型(大腸桿菌))、TMEM185A(跨膜蛋白185A)、SIX5(SIX同源框5)、CNPY3(冠層3同源物(斑馬魚))、FRAXE(脆性位點,葉酸類型,少見,fra(X)(q28)E)、GNB2(鳥嘌呤核苷酸結合蛋白(G蛋白),β多肽2)、RPL14(核糖體蛋白L14)、ATXN8(共濟失調蛋白8)、INSR(胰島素受體)、TTR(甲狀腺素運載蛋白)、EP400(E1A結合蛋白p400)、GIGYF2(GRB10相互作用GYF蛋白2)、OGG1(8-氧橋鳥嘌呤DNA糖苷酶)、STC1(斯鈣素1)、CNDP1(肌肽二肽酶1(金屬肽酶M20家族))、C10orf2(染色體10開放閱讀框2)、MAML3策劃蛋白(mastermind)樣3(果蠅)、DKC1(先天性角化不良1,角化不良蛋白)、PAXIP1(PAX相互作用(與轉錄啟動結構域相互作用)蛋白1)、CASK(鈣/鈣調蛋白依賴性絲胺酸蛋白激酶(MAGUK家族))、MAPT(微管相關蛋白tau)、SP1(Sp1轉錄因子)、POLG(聚合酶(DNA定向),γ)、AFF2(AF4/FMR2家族,成員2)、THBS1(血小板反應蛋白1)、TP53(腫瘤蛋白p53)、ESR1(雌激素受體1)、CGGBP1(CGG三聯體重複序列結合蛋白1)、ABT1(基本轉錄啟動物1)、KLK3(激肽釋放酶相關肽酶3)、PRNP(朊病毒蛋白)、JUN(jun癌基因)、KCNN3(鉀中間/小電
導鈣啟動通道,子家族N,成員3)、BAX(BCL2相關X蛋白)、FRAXA(脆性位點,葉酸類型,少見,fra(X)(q27.3)A(巨睾丸症,精神發育遲緩))、KBTBD10(含kelch重複序列和BTB(POZ)結構域10)、MBNL1(盲肌樣(果蠅))、RAD51(RAD51同源物(RecA同源物,大腸桿菌)(釀酒酵母))、NCOA3(核受體共啟動物3)、ERDA1(擴增的重複序列結構域,CAG/CTG 1)、TSC1(結節性硬化1)、COMP(軟骨寡聚基質蛋白)、GCLC(穀胺酸-半胱胺酸連接酶,催化亞基)、RRAD(與糖尿病相關聯的Ras相關)、MSH3(mutS同源物3(大腸桿菌))、DRD2(多巴胺受體D2)、CD44(CD44分子(印度血型))、CTCF(CCCTC-結合因子(鋅指蛋白))、CCND1(週期蛋白D1)、CLSPN(卡環(claspin)同源物(非洲爪蟾))、MEF2A(肌細胞增強因子2A)、PTPRU(蛋白質酪胺酸磷酸酶,受體類型,U)、GAPDH(甘油醛-3-磷酸脫氫酶)、TRIM22(含三重模體22)、WT1(韋爾姆斯氏瘤1)、AHR(芳香烴受體)、GPX1(麩胱甘肽過氧化物酶1)、TPMT(硫嘌呤S-甲基轉移酶)、NDP(諾裡病(假神經膠質瘤))、ARX(無芒相關同源框)、MUS81(MUS81內切核酸酶同源物(釀酒酵母))、TYR(酪胺酸酶(眼皮膚白化病IA))、EGR1(早期生長反應因子1)、UNG(尿嘧啶-DNA糖苷酶)、NUMBL(numb同源物(果蠅)-樣)、FABP2(脂肪酸結合蛋白2,腸)、EN2(鋸齒形同源框2)、CRYGC(晶狀體蛋白,γC)、SRP14(信號識別顆粒14kDa(同源Alu RNA結合蛋白))、CRYGB(晶狀體蛋白,γB)、PDCD1(程式性細胞死亡1)、HOXA1(同源框A1)、ATXN2L(共濟失調蛋白2-樣)、PMS2(增加的PMS2減數分裂後分離2(釀酒酵母))、GLA(半乳糖苷酶,α)、CBL(Cas-Br-
M(鼠)同向性逆轉錄病毒轉化序列)、FTH1(鐵蛋白,重多肽1)、IL12RB2(介白素12受體,β2)、OTX2(正小齒同源框2)、HOXA5(同源框A5)、POLG2(聚合酶(DNA定向),γ2,輔助亞基)、DLX2(末梢更少(distal-less)同源框2)、SIRPA(信號調節蛋白α)、OTX1(正小齒同源框1)、AHRR(芳香烴受體阻遏物)、MANF(中腦星形膠質細胞源性神經元營養因子)、TMEM158(跨膜蛋白158(基因/偽基因))、以及ENSG00000078687。
與三核苷酸重複序列擴增病症相關聯的較佳的蛋白質包括HTT(亨廷頓蛋白)、AR(雄激素受體)、FXN(費氏共濟失調蛋白)、Atxn3(共濟失調蛋白)、Atxn1(共濟失調蛋白)、Atxn2(共濟失調蛋白)、Atxn7(共濟失調蛋白)、Atxn10(共濟失調蛋白)、DMPK(肌營養不良性肌強直症蛋白激酶)、Atn1(萎縮蛋白1)、CBP(creb結合蛋白)、VLDLR(極低密度脂蛋白受體)、以及其任何組合。
治療聽力疾病
本發明還考慮將CRISPR-Cas系統遞送到一隻耳朵或兩隻耳朵。
研究者調查基因治療是否可以用於幫助進行目前的耳聾治療,即,電子耳蝸。耳聾往往係由不能將信號傳播到聽覺神經元的毛細胞喪失或損傷來引起的。在此類情況下,電子耳蝸可以用於響應於聲音並且將電信號傳輸到神經元。但是該等神經元常常變性並且從耳蝸縮回,因為受損的毛細胞釋放較少的生長因子。
美國專利申請20120328580描述了使用注射器諸如單劑量注射器將藥物組成物注射到耳朵(例如,耳朵給藥),諸如注射到耳蝸腔(luminae)(例如,膜蝸管、Sc前庭、以及Sc定音鼓)。例如,可以藉由鼓室內注射(例如,注射到中耳)和/或注射到外耳、中耳和/或內耳來給予一種或多種在此所述的化合物。此類方法在本領域中常規用於例如將類固醇和抗生素給予到人耳朵中。注射可以是例如藉由耳朵的圓窗或藉由耳蝸膠囊。其他內耳給藥方法係本領域已知的(例如,參見,索爾特(Salt)和普龍特科(Plontke),今日藥物發現(Drug Discovery Today),10:1299-1306,2005)。
在另一種給藥模式中,藥物組成物可以經由導管或泵原位給藥。導管或泵可以例如將藥物組成物引導到耳蝸腔或耳朵圓窗和/或結腸(colon)腔。適用於將一種或多種在此所述的化合物給予到耳朵例如人類耳朵的示例性藥物遞送裝置和方法係由麥肯納(McKenna)等人(美國公佈號2006/0030837)和雅各森(Jacobsen)等人(美國專利案號7,206,639)描述的。在一些實施方式中,導管或泵在手術程序過程中可以定位在例如患者的耳朵(例如,外耳、中耳和/或內耳)。在一些實施方式中,導管或泵在不需要進行手術程序的情況下可以定位在例如患者的耳朵(例如,外耳、中耳和/或內耳)。
可替代地,一種或多種在此所述的化合物可以與戴在外耳的機械裝置諸如電子耳蝸或助聽器結合給予。適用於本發明的示例性電子耳蝸係由埃奇(Edge)等人(美國公開號
2007/0093878)描述的。
在一些實施方式中,以上所述給藥模式可以任何順序組合並且可以是同時的或交替的。
可替代地或另外地,本發明可以根據食品與任何藥品管理局批准的方法來給予,例如,如CDER資料標準手冊(CDER Data Standards Manual)版本號004(在fda.give/cder/dsm/DRG/drg00301.htm處可獲得)所述的。
總的來說,美國專利申請20120328580所述的細胞治療方法可以用於促進細胞體外完全分化或部分分化成或分化為內耳成熟細胞類型(例如,毛細胞)。由此類方法獲得的細胞然後可以移植或植入到需要此治療的患者中。以下描述了實踐該等方法所需要的細胞培養方法,包括用於鑒定和選擇適合細胞類型的方法、用於促進所選擇細胞完全分化或部分分化的方法、以及用於植入完全或部分分化的細胞的方法。
適用於本發明的細胞包括但不限於,當例如在體外與一種或多種在此所述的化合物接觸時能夠完全分化或部分分化成內耳成熟細胞例如毛細胞(例如,內和/或外毛細胞)的細胞。能夠分化成毛細胞的示例性細胞包括但不限於,幹細胞(例如,內耳幹細胞、成體幹細胞、骨髓源性幹細胞、胚胎幹細胞、間充質幹細胞、皮膚乾細胞、iPS細胞、以及脂肪源性幹細胞)、祖細胞(例如,內耳祖細胞)、支援細胞(例如,戴特斯細胞(Deiters' cell)、柱細胞、內指細胞、覆蓋細胞(tectal cell)以及漢森細胞(Hensen's cell))、和/或生殖細胞。李等人(美國公開號2005/0287127)和李
等人(美國專利序號11/953,797)描述了使用幹細胞替換內耳感覺細胞。在埃奇等人PCT/US2007/084654中描述使用骨髓源性幹細胞替換內耳感覺細胞。在例如高橋等人,細胞,第131卷,第5期,第861-872頁(2007);高橋和山中,細胞126,663-76(2006);沖田(Okita)等人,自然448:260-262(2007);餘,J.等人,科學318(5858):1917-1920(2007);納卡加瓦(Nakagawa)等人,自然生物技術26:101-106(2008);以及卓瑞斯(Zaehres)和肖勒(Scholer),細胞131(5):834-835(2007)。此類適合的細胞可以是藉由分析(例如,定性或定量)一種或多種組織特異性基因的存在來鑒定的。例如,基因表現可以是藉由檢測一種或多種組織特異性基因的蛋白質產物來檢測的。蛋白質檢測技術涉及使用針對適當抗原的抗體染色蛋白質(例如,使用細胞提取物或全細胞)。在此情況下,適當抗原係組織特異性基因表現的蛋白質產物。儘管,理論上,第一抗體(即,結合抗原的抗體)可以被標記,但是更常見的是(並且提高視覺化)使用針對該第一抗體的第二抗體(例如,抗IgG)。此第二抗體與螢光染料或用於比色反應的適當的酶或金珠(用於電子顯微術)或者與生物素-抗生物素蛋白系統軛合,以使得第一抗體的位置以及因此抗原的位置可以被識別。
本發明的CRISPR Cas分子可以藉由將藥物組成物直接應用於外耳來遞送到耳朵,其中組成物藉由美國公開的申請20110142917來修改。在一些實施方式中,將藥物組成物應用於耳道。遞送到耳朵還可以被稱為耳朵遞送或耳部遞送。
在一些實施方式中,本發明的RNA分子以脂質體或脂
轉染配製物等遞送並且可以是藉由熟習該項技術者已熟知的方法來製備。此類方法描述於例如美國專利案號5,593,972、5,589,466、以及5,580,859中,該等專利藉由引用結合在此。
已開發了特別旨在增強並改進siRNA到哺乳動物細胞的遞送的遞送系統(例如,參見,沈等人,FEBS快報2003,539:111-114;夏(Xia)等人,自然生物技術2002,20:1006-1010;賴希(Reich)等人,分子視覺(Mol.Vision.)2003,9:210-216;索倫森(Sorensen)等人,分子生物學雜誌2003,327:761-766;路易士(Lewis)等人,自然遺傳學2002,32:107-108以及西梅奧尼(Simeoni)等人,核酸研究(NAR)2003,31,11:2717-2724)並且該等遞送系統可以適用於本發明。siRNA最近已成功用於抑制靈長類動物中的基因表現(參見,例如托倫蒂諾(Tolentino)等人,視網膜(Retina)24(4):660,該文獻也可以適用於本發明)。
齊(Qi)等人揭露了用於藉由可以適用於本發明的核酸靶向系統的新型蛋白遞送技術來經由完整圓窗有效siRNA轉染到內耳中(參見,例如,齊等人,基因治療(2013),1-9)。具體地說,可以藉由完整圓窗滲透將Cy3-標記的siRNA轉染到內耳(包括內外毛細胞)、壺腹脊、橢圓囊斑以及球囊斑的細胞中的TAT雙股RNA結合結構域(TAT-DRBD)成功用於體內遞送雙股siRNA,以用於治療各種內耳疾病並且保護聽力功能。可以考慮約40μl 10mM RNA作為給予至耳朵的劑量。
根據雷亞利(Rejali)等人(聽覺研究(Hear Res.),2007年6月;228(1-2):180-7),電子耳蝸功能可以是藉由良好地保
留螺旋神經節神經元來提高的,該等神經元係電子耳蝸電刺激的靶標,並且腦源性神經營養因子(BDNF)先前已顯示增強實驗性耳聾耳朵中存活的螺旋神經節。雷亞利等人測試了改進的電子耳蝸電極設計,該設計包括藉由具有BDNF基因插入物的病毒載體轉導的成纖維細胞塗層。為了完成這種類型的離體基因轉移,雷亞利等人使用具有BDNF基因盒插入物的腺病毒轉導豚鼠成纖維細胞,並且確定該等細胞分泌BDNF並且然後使BDNF分泌細胞經由瓊脂糖凝膠附接到電子耳蝸電極並且將電極植入在鼓階中。雷亞利等人確定BDNF表現電極當與對照電極相比時在植入48小時後能夠保留顯著更多的耳蝸基底轉彎處的螺旋神經節神經元,並且證實了將電子耳蝸與離體基因轉移組合用於增強螺旋神經節神經元存活的可行性。這種系統可以適用於本發明的核酸靶向系統,以用於遞送到耳朵。
穆克埃爾西(Mukherjea)等人(抗氧劑與氧化還原信號(Antioxidants & Redox Signaling),第13卷,第5期,2010)用文獻證明使用短干擾(si)RNA敲低NOX3消除了順鉑耳毒性,如藉由防止OHC損傷並且減小聽腦幹反應(ABR)中的閾值移位來證實的。向大鼠給予不同劑量的siNOX3(0.3、0.6、以及0.9μg)並且藉由即時RT-PCR評價NOX3表現。所使用的最低劑量的NOX3siRNA(0.3μg)當與經鼓膜給予亂序siRNA或未處理的耳蝸相比時並未顯示NOX3 mRNA的任何抑制。然而,與對照的亂序siRNA相比,給予較高劑量的NOX3 siRNA(0.6和0.9μg)減少了NOX3表現。這種系統可以適用於本發明的CRISPR Cas系統,以用於經鼓膜給予約2mg至約4mg劑量的CRISPR Cas,以給予至人類。
榮格(Jung)等人(分子治療,第21卷,第4期,834-841,2013年4月)證實橢圓囊中的Hes5水平在應用siRNA之後有所減小並且該等橢圓囊中的毛細胞數目顯著高於隨後的對照治療。資料表明siRNA技術可以適用於誘導內耳的修復和再生並且Notch傳訊途徑係對於特異性基因表現抑制可能有用的靶標。榮格等人將2μl體積的8μg Hes5 siRNA(藉由將無菌生理鹽水添加到凍幹siRNA中來製備)注射到耳朵的前庭上皮中。這種系統可以適用於本發明的CRISPR Cas系統,以用於將約1mg至約30mg劑量的CRISPR Cas給予到耳朵的前庭上皮中,以給予至人類。
不分裂細胞中的基因靶向(神經元和肌肉)
不分裂(尤其是不分裂的完全分化)細胞類型存在例如基因靶向或基因組工程化的問題,因為同源重組(HR)在G1細胞週期階段通常受到抑制。然而,當研究細胞控制正常DNA修復系統的機制時,迪羅謝(Durocher)發現了使得HR在不分裂細胞中保持“關閉”的先前未知的開關並且設計了將此開關切換回來的策略。奧爾特威恩(Orthwein)等人(在加拿大渥太華的西奈山醫院的丹尼爾.迪羅謝實驗室(Daniel Durocher’s lab at the Mount Sinai Hospital in Ottawa,Canada)最近的報導(自然16142,2015年12月9日線上公開)顯示HR的抑制可以取消並且基因靶向在腎臟(293T)細胞和骨肉瘤(U2OS)細胞中成功地推斷。已知腫瘤抑制基因BRCA1、PALB2和BRAC2促進HR進行DNA DSB修復。發現BRCA1與PALB2-BRAC2的複合物形成係藉由PALB2上的泛素位點來控制的,以使得E3泛素連接酶對該位點起作用。此E3泛素
連接酶係由與滯蛋白-3(CUL3)-RBX1複合的KEAP1(PALB2相互作用蛋白)組成。PALB2泛素化抑制了它與BRCA1的相互作用並且被去泛素化酶USP11抵消,該去泛素化酶自身處於細胞週期控制下。BRCA1-PALB2相互作用的恢復與DNA末端切除的啟動組合足以誘導G1中的同源重組,如藉由許多方法測量的,該等方法包括針對USP11或KEAP1(由pX459載體表現)的基於CRISPR-Cas9的基因靶向測定。然而,當在切除-感受態G1細胞中BRCA1-PALB2相互作用使用KEAP1缺失或PALB2-KR突變體的表現來恢復時,檢測到基因靶向事件的強勁增加。
因此,在一些實施方式中,在細胞,尤其是不分裂的完全分化細胞類型中的HR重啟動係較佳的。在一些實施方式中,BRCA1-PALB2相互作用的促進在一些實施方式中是較佳的。在一些實施方式中,靶細胞係不分裂細胞。在一些實施方式中,靶細胞係神經元或肌細胞。在某些實施方式中,靶細胞係在體內靶向的。在一些實施方式中,細胞係在G1中並且HR被抑制。在一些實施方式中,使用KEAP1缺失,例如抑制KEAP1活性的表現係較佳的。KEAP1缺失可以是藉由siRNA來實現的,例如,如奧爾特威恩等人所述的。可替代地,PALB2-KR突變體(在BRCA1-相互作用結構域中不存在所有八個Lys殘基)的表現係較佳的,它與KEAP1缺失組合或者單獨。PALB2-KR與BRCA1相互作用,不論係在哪個細胞週期位置。因此,在一些實施方式中,BRCA1-PALB2相互作用的促進或恢復(尤其在G1細胞中)係較佳的,尤其在靶細胞係不分裂的情況下或者在去除和還原(離體基因靶向)係有問題的(例如神經元或肌肉細胞)的情況下。KEAP1 siRNA係從賽默飛
世爾公司(ThermoFischer)獲得的。在一些實施方式中,BRCA1-PALB2複合物可以被遞送到G1細胞。在一些實施方式中,可以例如藉由增加去泛素化酶USP11的表現來促進PALB2去泛素化,因此設想的是可以提供構建體來促進或上調去泛素化酶USP11的表現或活性。
治療眼睛疾病
本發明還考慮將CRISPR-Cas系統遞送到一隻眼睛或兩隻眼睛。
在本發明的特定實施方式中,CRISPR-Cas系統可以用於校正由幾種遺傳性突變引起的眼部缺陷,該等遺傳性突變在遺傳性眼睛疾病(Genetic Diseases of the Eye),第二版,埃利阿斯I.特拉布勒西(Elias I.Traboulsi),哈佛大學出版社,2012中進一步描述。
對於給予至眼睛,慢病毒載體,具體地是馬傳染性貧血病毒(EIAV)係特別較佳的。
在另一個實施方式中,還考慮基於馬傳染性貧血病毒(EIAV)的最小非靈長類動物慢病毒載體,特別是對於眼部基因治療(例如,參見巴拉岡,基因醫學雜誌2006;8:275-285,2005年11月21日威力出版公司(Wiley InterScience)線上公開(www.interscience.wiley.com)。DOI:10.1002/jgm.845)。考慮具有驅動靶基因表現的巨細胞病毒(CMV)啟動子的載體。考慮所有前房內、視網膜下、眼內以及玻璃體內注射(例如,參見,巴拉
岡,基因醫學雜誌2006;8:275-285,2005年11月21日威力出版公司線上公開(www.interscience.wiley.com)。DOI:10.1002/jgm.845)。可以借助於手術顯微鏡進行眼內注射。對於視網膜下注射和玻璃體內注射,眼睛可以藉由輕微數位壓力和使用接觸透鏡系統查看的眼底來脫垂,該接觸透鏡系統由在用玻璃顯微鏡載片蓋玻片覆蓋的角膜上的一滴偶合介質溶液組成。對於視網膜下注射,安裝在5-μl漢密爾頓氏注射器上的10-mm 34號針尖端可以在直接視覺化下藉由上部赤道鞏膜朝向後極切向推進,直到針孔在視網膜下間隙中可見為止。然後,可以注射2μl載體懸浮液,以產生上部大泡狀視網膜脫離,因此證實視網膜下載體給予。此方法創建自封合鞏膜切開術,允許載體懸浮液保留在視網膜下間隙中,直到它被RPE吸收為止,通常在該程序的48h內。此程序可以在下眼半球中重複,以產生下部視網膜脫離。此技術使得約70%視網膜神經感覺層和RPE暴露於載體懸浮液中。對於玻璃體內注射,針尖可以推進藉由鞏膜到角鞏膜緣後部1mm,並且將2μl載體懸浮液注射到玻璃體腔中。對於前房內注射,針尖可以藉由角鞏膜緣穿刺,朝向角膜中央推進,並且可以注射2μl載體懸浮液。對於前房內注射,針尖可以藉由角鞏膜緣穿刺,朝向角膜中央推進,並且可以注射2μl載體懸浮液。該等載體可以1.0-1.4×1010或者1.0-1.4 x 109轉導單位(TU)/ml注射。
在另一個實施方式中,還考慮了RetinoStat®,一種經由視網膜下注射遞送用於治療濕型年齡相關性黃斑變性的、表現血管生成抑制性蛋白(內皮抑素和血管抑素)的基於馬傳染性貧血病毒的慢病毒基因治療載體(例如,參見,賓利(Binley)等人,
人類基因治療23:980-991(2012年9月))。這種載體可以被修飾用於本發明的CRISPR-Cas系統。每隻眼睛可以用總體積100μl的1.1×105轉導單位/眼睛(TU/眼睛)的劑量的RetinoStat®治療。
在另一個實施方式中,可以考慮將E1-缺失、部分E3-缺失、E4-缺失腺病毒載體遞送至眼睛。向患有晚期新生血管性年齡相關性黃斑變性(AMD)的二十八位患者給予表現人類色素上皮細胞源性因子(AdPEDF.ll)的E1-缺失、部分E3-缺失、E4-缺失腺病毒載體的單次靜脈內注射(參見,例如,坎波基亞羅(Campochiaro)等人,人類基因治療17:167-176(2006年2月))。研究106至109.5粒子單位(PU)範圍內的劑量,並且不存在與AdPEDF.ll相關的嚴重不良事件並且不存在劑量限制性毒性(參見,例如,坎波基亞羅等人,人類基因治療17:167-176(2006年2月))。腺病毒載體介導的眼部基因轉移似乎係一種用於治療眼部病症的可行方法並且可以適用於CRISPR Cas系統。
在另一個實施方式中,RXi製藥公司(RXi Pharmaceuticals)的sd-rxRNA®系統可以用於和/或適於將CRISPR Cas遞送至眼睛。在此系統中,單次玻璃體內給予3μg sd-rxRNA,導致PPIB mRNA水平的序列特異性減小,持續14天。sd-rxRNA®系統可以適用於本發明的核酸靶向系統,考慮CRISPR給予人類的約3至20mg的劑量。
米林頓-瓦爾德(Millington-Ward)等人(分子治療,第19卷,第4期,642-649,2011年4月)描述了將基於RNA干擾(RNAi)的視紫紅質抑制物和由於變性位置處的核苷酸變化而抵
抗抑制的密碼子修飾的視紫紅質替換基因遞送到RNAi靶位點的腺相關病毒(AAV)載體。藉由米林頓-瓦爾德等人將6.0×108vp或1.8×1010vp AAV注射液視網膜下注射到眼睛。米林頓-瓦爾德等人的AAV載體可以適用於本發明的CRISPR Cas系統,考慮給予至人類的約2×1011至約6×1013vp的劑量。
達爾卡拉(Dalkara)等人(科學轉化醫學(Sci Transl Med)5,189ra76(2013))也涉及改變無害注射到眼睛玻璃體液中之後將野生型版本的缺陷基因遞送到整個視網膜的AAV載體的體內定向進化。達爾卡拉描述了7聚體肽展示文庫和藉由DNA改組來自AAV1、2、4、5、6、8、以及9的cap基因來構建的AAV文庫。包裝在CAG或Rho啟動子下表現GFP的rcAAV文庫和rAAV載體,並且藉由定量PCR獲得抗去氧核糖核酸酶的基因組滴度。合併該等文庫,並且進行兩輪進化,每次進化由初始文庫多樣性和隨後的三次體內選擇步驟組成。在每個此步驟中,向P30 rho-GFP小鼠玻璃體內注射2ml碘克沙醇純化的磷酸鹽緩衝鹽水(PBS)透析文庫,其中基因組滴度係約1×1012vg/ml。達爾卡拉等人的AAV系統可以適用於本發明的核酸靶向系統,考慮給予人類的約1×1015至約1×1016vg/ml的劑量。
在一特定實施方式中,可以靶向視紫紅質基因以用於治療色素性視網膜炎(RP),其中轉讓給桑加莫生物科技公司的美國專利案號20120204282的系統可以根據本發明的CRISPR Cas系統進行修改。
在另一個實施方式中,轉讓給策勒克提斯公司的美國
專利公開案號20130183282的方法係涉及切割來自人類視紫紅質基因的靶序列的方法,該方法也可以被修改成本發明的核酸靶向系統。
轉讓給中央研究院(Academia Sinica)的美國專利公開案號20130202678涉及用於治療視網膜病變和威脅視力的眼科病症的方法,該等方法涉及將Puf-A基因(該基因在視網膜神經節和眼組織的色素細胞中表現並且展示獨特的抗細胞凋亡活性)遞送到眼睛的視網膜下間隙或玻璃體內間隙。具體地說,希望的靶標係zgc:193933、prdm1a、spata2、tex10、rbb4、ddx3、zp2.2、Blimp-1以及HtrA2,所有該等靶標均可以被本發明的核酸靶向系統靶向。
吳(細胞幹細胞,13:659-62,2013)設計了一種將Cas9引導到在小鼠中引起白內障的單一鹼基對突變的指導RNA,其中它誘導DNA切割。然後使用另一個野生型對偶基因或者給予受精卵的寡核苷酸,修復機制校正破壞的對偶基因的序列並且校正突變體小鼠中引起白內障的遺傳性缺陷。
美國專利公開案號20120159653描述了使用鋅指核酸酶遺傳性修飾與黃斑變性(MD)相關聯的細胞、動物和蛋白質。黃斑變性(MD)係老年人視力缺損的主要原因,但是也是兒童疾病諸如眼底黃色斑點症、索斯比氏眼底病(Sorsby fundus)以及致命性兒童神經變性疾病的標誌性症狀,其中發作年齡最早到嬰兒期。黃斑變性由於視網膜損害而導致視野(黃斑)中心的視力喪失。目前存在的動物模型並未概括疾病在人類中所觀察到的主要標誌。包含編碼與MD相關聯的蛋白質的突變體基因的可用動物模
型也產生高度可變的表型,這使得對人類疾病的翻譯和治療發展成為問題。
美國專利公開案號20120159653的一方面涉及編輯編碼與MD相關聯的蛋白質的任何染色體序列,它們可以適用於本發明的核酸靶向系統。與MD相關聯的蛋白質典型地是基於和MD相關聯的蛋白質與MD病症的實驗相關性來選擇。例如,與MD相關聯的蛋白質的產生率或循環濃度在患有MD病症的群體中相對於不存在MD病症的群體有所升高或降低。蛋白質水平的差異可以適於蛋白質組學技術來評估,該等技術包括但不限於,西方墨點法、免疫組織化學染色、酶聯免疫吸附測定(ELISA)、以及質譜法。可替代地,與MD相關聯的蛋白質可以是藉由使用基因組技術獲得編碼該等蛋白質的基因的基因表現譜來鑒定,該等基因組技術包括但不限於DNA微陣列分析、基因表現序列分析(SAGE)、以及定量即時聚合酶鏈反應(Q-PCR)。
作為非限制性實例,與MD相關聯的蛋白質包括但不限於以下蛋白質:(ABCA4)ATP-結合盒,子家族A(ABC1),成員4:ACHM1全色盲(桿狀細胞單色型色覺(rod monochromacy))1;ApoE載脂蛋白E(ApoE);C1QTNF5(CTRP5)C1q和腫瘤壞死因子相關蛋白5(C1QTNF5);C2補體組分2(C2);C3補體組分(C3);CCL2趨化因子(C-C模體)配位基2(CCL2);CCR2趨化因子(C-C模體)受體2(CCR2);CD36分化抗原簇36;CFB補體因子B;CFH補體因子;CFH H;CFHR1補體因子H相關1;CFHR3補體因子H相關3;CNGB3環狀核苷酸閘控通道β3;CP血漿銅藍蛋
白(CP);CRP C反應蛋白(CRP);CST3抑半胱胺酸蛋白酶蛋白C或抑半胱胺酸蛋白酶蛋白3(CST3);CTSD組織蛋白酶D(CTSD);CX3CR1趨化因子(C-X3-C模體)受體1;ELOVL4伸長的極長鏈脂肪酸4;ERCC6切補修復交叉互補齧齒動物修復缺陷,互補群6;FBLN5腓骨蛋白-5;FBLN5腓骨蛋白5;FBLN6腓骨蛋白6;FSCN2成束蛋白(FSCN2);HMCN1半椎蛋白(Hemicentrin)1;HMCN1半椎蛋白1;HTRA1 HtrA絲胺酸肽酶1(HTRA1);HTRA1 HtrA絲胺酸肽酶1;IL-6介白素6;IL-8介白素8;LOC387715假定蛋白;PLEKHA1含普列克底物蛋白同源結構域家族A成員1(PLEKHA1);PROM1 Prominin 1(PROM1或CD133);PRPH2外週蛋白-2;RPGR色素性視網膜炎GTP酶調節劑;SERPING1絲胺酸蛋白酶抑制劑肽酶抑制劑,進化支(clade)G,成員1(C1抑制劑);TCOF1糖蜜TIMP3金屬蛋白酶抑制劑3(TIMP3);TLR3 Toll樣受體3。
與MD相關聯且其染色體序列被編輯的蛋白質的性質可以並且將發生改變。在較佳的實施方式中,與MD相關聯且其染色體序列被編輯的蛋白質可以是由ABCR基因編碼的ATP結合盒子家族A(ABC1)成員4蛋白(ABCA4)、由APOE基因編碼的載脂蛋白E蛋白(APOE)、由CCL2基因編碼的趨化因子(C-C模體)配位基2蛋白(CCL2)、由CCR2基因編碼的趨化因子(C-C模體)受體2蛋白(CCR2)、由CP基因編碼的血漿銅藍蛋白(CP)、由CTSD基因編碼的組織蛋白酶D蛋白(CTSD)、或者由TIMP3基因編碼的金屬蛋白酶抑制劑3蛋白質(TIMP3)。在一示例性實施方式中,遺傳修飾的動物係大鼠,並且編碼與MD相關聯的蛋白質的編輯的染色體序列可以是:(ABCA4)ATP結合盒子家族A(ABC1)成員4
NM_000350;APOE載脂蛋白E(APOE)NM_138828;CCL2趨化因子(C-C模體)配位基2(CCL2)NM_031530;CCR2趨化因子(C-C模體)受體2(CCR2)NM_021866;CP血漿銅藍蛋白(CP)NM_012532;CTSD組織蛋白酶D(CTSD)NM_134334;TIMP3金屬蛋白酶抑制劑3(TIMP3)NM_012886。動物或細胞可以包含編碼與MD相關聯的蛋白質的1、2、3、4、5、6、7或更多個破壞的染色體序列和編碼與MD相關聯的破壞蛋白質的0、1、2、3、4、5、6、7或更多個染色體整合序列。
編輯或整合的染色體序列可以被修飾為編碼與MD相關聯的改變的蛋白質。在MD相關染色體序列中的許多突變已與MD相關聯。與MD相關聯的染色體序列中的突變的非限制性實例包括可以引起MD的那些突變,包括在ABCR蛋白質,E471K(即在位置471處的穀胺酸被改變成賴胺酸)、R1129L(即在位置1129處的精胺酸被改變成亮胺酸)、T1428M(即在位置1428處的蘇胺酸被改變成甲硫胺酸)、R1517S(即在位置1517處的精胺酸被改變成絲胺酸)、I1562T(即在位置1562處的異亮胺酸被改變成蘇胺酸)、以及G1578R(即在位置1578處的甘胺酸被改變成精胺酸);在CCR2蛋白質中,V64I(即在位置192處的纈胺酸被改變成異亮胺酸);在CP蛋白質中,G969B(即在位置969處的甘胺酸被改變成天冬醯胺或天冬胺酸);在TIMP3蛋白質,S156C(即在位置156處的絲胺酸被改變成半胱胺酸)、G166C(即在位置166處的甘胺酸被改變成半胱胺酸)、G167C(即在位置167處的甘胺酸被改變成半胱胺酸)、Y168C(即在位置168處的酪胺酸被改變成半胱胺酸)、S170C(即在位置170處的絲胺酸被改變成半胱胺酸)、Y172C(即
在位置172處的酪胺酸被改變成半胱胺酸)、以及S181C(即在位置181處的絲胺酸被改變成半胱胺酸)。MD相關基因的遺傳性變型與疾病的其他相關性係本領域已知的。
CRISPR系統適用於校正由常染色體顯性基因引起的疾病。例如,使用CRISPR/Cas9去除引起眼睛受體喪失的常染色體顯性基因。巴科迪,B.(Bakondi,B.)等人,體內CRISPR/Cas9基因編輯常染色體顯性色素性視網膜炎的S334ter-3大鼠模型中的視網膜營養性萎縮症(In Vivo CRISPR/Cas9 Gene Editing Corrects Retinal Dystrophy in the S334ter-3 Rat Model of Autosomal Dominant Retinitis Pigmentosa)。分子治療,2015;DOI:10.1038/mt.2015.220。
治療循環系統疾病和肌肉疾病
本發明還考慮將在此所述的CRISPR-Cas系統例如Cpf1效應蛋白系統遞送到心臟。對於心臟,心肌向性腺相關病毒(AAVM)係較佳的,具體地是在心臟中顯示優先基因轉移的AAVM41(參見,例如,林-陽尕(Lin-Yanga)等人,美國國家科學院院刊,2009年3月10日,第106卷,第10期)。給藥可以是全身性的或局部的。對於全身性給藥,考慮約1-10×1014個載體基因組的劑量。還參見,例如,艾拉裡奧(Eulalio)等人,(2012)自然492:376和蘇摩素塔拉姆(Somasuntharam)等人(2013)生物材料(Biomaterials)34:7790。
例如美國專利公開案號20110023139描述了使用鋅指核酸酶遺傳性修飾與心血管疾病相關聯的細胞、動物和蛋白質。心血管疾病通常包括高血壓、心臟病發作、心力衰竭、以及卒中
和TIA。涉及心血管疾病的任何染色體序列或者由涉及心血管疾病的任何染色體序列編碼的蛋白質可以用於本揭露描述的方法中。心血管相關蛋白典型地是基於心血管相關蛋白與心血管疾病發展的實驗相關性來選擇。例如,心血管相關蛋白的產生率或循環濃度在患有心血管病症的群體中相對於不存在心血管病症的群體有所升高或降低。蛋白質水平的差異可以適於蛋白質組學技術來評估,該等技術包括但不限於,西方墨點法、免疫組織化學染色、酶聯免疫吸附測定(ELISA)、以及質譜法。可替代地,心血管相關蛋白可以是藉由使用基因組技術獲得編碼該等蛋白質的基因的基因表現譜來鑒定,該等基因組技術包括但不限於DNA微陣列分析、基因表現序列分析(SAGE)、以及定量即時聚合酶鏈反應(Q-PCR)。
作為非限制性實例,染色體序列可以包括但不限於,IL1B(介白素1,β)、XDH(黃嘌呤脫氫酶)、TP53(腫瘤蛋白p53)、PTGIS(前列腺素12(前列環素)合酶)、MB(肌紅蛋白)、IL4(介白素4)、ANGPT1(血管生成素1)、ABCG8(ATP-結合盒,子家族G(WHITE),成員8)、CTSK(組織蛋白酶K)、PTGIR(前列腺素12(前列環素)受體(IP))、KCNJ11(鉀整流通道,子家族J,成員11)、INS(胰島素)、CRP(C-反應蛋白,穿透素相關)、PDGFRB(血小板源生長因子受體,β多肽)、CCNA2(週期蛋白A2)、PDGFB(血小板源生長因子β多肽(猴肉瘤病毒(v-sis)癌基因同源物))、KCNJ5(鉀整流通道,子家族J,成員5)、KCNN3(鉀中間體/小電導鈣啟動通道,子家族N,成員3)、CAPN10(鈣蛋白酶10)、PTGES(前列腺素E合酶)、ADRA2B(腎上腺素性,α-2B-,受體)、ABCG5
(ATP-結合盒,子家族G(WHITE)、成員5)、PRDX2(過氧化物還原酶2)、CAPN5(鈣蛋白酶5)、PARP14(聚(ADP-核糖)聚合酶家族,成員14)、MEX3C(mex-3同源物C(秀麗隱桿線蟲))、ACE血管緊張素I轉化酶(肽基-二肽酶A)1)、TNF(腫瘤壞死因子(TNF超家族,成員2))、IL6(介白素6(干擾素,β2))、STN(他汀類)、絲胺酸蛋白酶抑制劑E1(絲胺酸蛋白酶抑制劑肽酶抑制劑,進化支E(微管連接蛋白,纖溶酶原啟動物抑制劑1型)、成員1)、ALB(白蛋白)、ADIPOQ(脂聯素,含有C1Q和膠原蛋白結構域)、APOB(載脂蛋白B(包含Ag(x)抗原))、APOE(載脂蛋白E)、LEP(瘦蛋白)、MTHFR(5,10-亞甲基四氫葉酸還原酶(NADPH))、APOA1(載脂蛋白A-I)、EDN1(內皮素1)、NPPB(利鈉肽先質B)、NOS3(一氧化氮合酶3(內皮細胞))、PPARG(過氧化物酶體增殖物啟動受體γ)、PLAT(纖溶酶原啟動物,組織)、PTGS2(前列腺素-內過氧化物合酶2(前列腺素G/H合酶和環氧合酶))、CETP(膽固醇酯轉移蛋白,血漿)、AGTR1(血管緊張素II受體,1型)、HMGCR(3-羥基-3-甲基戊二醯-輔酶A還原酶)、IGF1(胰島素樣生長因子1(生長調節素C))、SELE(選擇素E)、REN(腎素)、PPARA(過氧化物酶體增殖物啟動受體α)、PON1(對氧磷酶1)、KNG1(激肽原1)、CCL2(趨化因子(C-C模體)配位基2)、LPL(脂蛋白連接酶)、VWF(血管假性血友病因子)、F2(凝血因子II(凝血酶))、ICAM1(細胞間黏附分子1)、TGFB1(轉化生長因子,β1)、NPPA(利鈉肽先質A)、IL10(介白素10)、EPO(紅細胞生成素)、SOD1(超氧化物歧化酶1,可溶)、VCAM1(血管細胞黏附分子1)、IFNG(干擾素,γ)、LPA(脂蛋白,Lp(a))、MPO(髓過氧化物酶)、
ESR1(雌激素受體1)、MAPK1(絲裂原啟動蛋白激酶1)、HP(結合珠蛋白)、F3(凝血因子III(促凝血酶原激酶,組織因子))、CST3(半胱胺酸蛋白酶抑制劑C)、COG2(低聚高爾基體複合物組分2)、MMP9(基質金屬肽酶9(明膠酶B,92kDa明膠酶,92kDaIV型膠原蛋白酶))、絲胺酸蛋白酶抑制劑C1(絲胺酸蛋白酶抑制劑肽酶抑制劑,進化支C(抗凝血酶)、成員1)、F8(凝血因子VIII,促凝血組分)、HMOX1(血紅素氧化酶(脫環)1)、APOC3(載脂蛋白C-III)、IL8(介白素8)、PROK1(脫環1)、CBS(胱硫醚-β-合酶)、NOS2(一氧化氮合酶2,誘導型)、TLR4(toll-樣受體4)、SELP(選擇素P(顆粒膜蛋白140kDa,抗原CD62))、ABCA1(ATP-結合盒,子家族A(ABC1)、成員1)、AGT(血管緊張素原(絲胺酸蛋白酶抑制劑肽酶抑制劑,進化支A,成員8))、LDLR(低密度脂蛋白受體)、GPT(穀胺酸-丙酮酸轉胺酶(丙胺酸轉胺酶))、VEGFA(血管內皮生長因子A)、NR3C2(核受體子家族3,C組,成員2)、IL18(介白素18(干擾素-γ-誘導因子))、NOS1(一氧化氮合酶1(神經元))、NR3C1(核受體子家族3,C組,成員1(糖皮質激素受體))、FGB(纖維蛋白原β鏈)、HGF(肝細胞生長因子(肝細胞生成素A;散射因子))、IL1A(介白素1,α)、RETN(抵抗素)、AKT1(v-akt鼠胸腺瘤病毒癌基因同源物1)、LIPC(脂肪酶,肝臟)、HSPD1(熱休克60kDa蛋白1(伴侶蛋白))、MAPK14(絲裂原啟動蛋白激酶14)、SPP1(分泌型磷蛋白1)、ITGB3(整聯蛋白,β3(血小板糖蛋白111a,抗原CD61))、CAT(過氧化氫酶)、UTS2(尿緊張素2)、THBD(血栓調節蛋白)、F10(凝血因子X)、CP(血漿銅藍蛋白(鐵氧化酶))、TNFRSF11B(腫瘤壞死因子受體超家族,
成員11b)、EDNRA(內皮素受體A型)、EGFR(表皮生長因子受體(成紅細胞白血病病毒(v-erb-b)癌基因同源物,鳥類))、MMP2(基質金屬肽酶2(明膠酶A,72kDa明膠酶,72kDaIV型膠原酶))、PLG(纖溶酶原)、NPY(神經肽Y)、RHOD(ras同源物基因家族,成員D)、MAPK8(絲裂原啟動蛋白激酶8)、MYC(v-myc髓細胞組織增生病毒癌基因同源物(鳥類))、FN1(纖連蛋白1)、CMA1(糜酶1,肥大細胞)、PLAU(纖溶酶原啟動物,尿激酶)、GNB3(鳥嘌呤核苷酸結合蛋白(G蛋白),β多肽3)、ADRB2(腎上腺素性,β-2-,受體,表面)、APOA5(載脂蛋白A-V)、SOD2(超氧化物歧化醇2,線粒體)、F5(凝血因子V(促凝血球蛋白原,易變因子))、VDR(維生素D(1,25-二羥基維生素D3)受體)、ALOX5(花生四烯酸5-脂加氧酶)、HLA-DRB1(主要組織相容性複合物,II類,DRB1)、PARP1(聚(ADP-核糖)聚合酶1)、CD40LG(CD40配位基)、PON2(對氧磷酶2)、AGER(高級糖基化末端產物特異性受體)、IRS1(胰島素受體底物1)、PTGS1(前列腺素-內過氧化物合酶1(前列腺素G/H合酶和環氧合酶))、ECE1(內皮素轉化酶1)、F7(凝血因子VII(血清凝血素轉化加速物))、URN(介白素1受體拮抗劑)、EPHX2(環氧化物酶2,細胞質)、IGFBP1(胰島素-樣生長因子結合蛋白1)、MAPK10(絲裂原啟動蛋白激酶10)、FAS(Fas(TNF受體超家族,成員6))、ABCB1(ATP-結合盒,子家族B(MDR/TAP),成員1)、JUN(jun癌基因)、IGFBP3(胰島素-樣生長因子結合蛋白3)、CD14(CD14分子)、PDE5A(磷酸二酯酶5A,cGMP-特異性)、AGTR2(血管緊張素II受體,2型)、CD40(CD40分子,TNF受體超家族成員5)、LCAT(卵磷脂-膽固醇醯基轉移酶)、
CCR5(趨化因子(C-C模體)受體5)、MMP1(基質金屬肽酶1(間質膠原酶))、TIMP1(TIMP金屬肽酶抑制劑1)、ADM(腎上腺髓質素)、DYT10(肌張力障礙10)、STAT3(信號轉導物和轉錄啟動物3(急性期反應因子))、MMP3(基質金屬肽酶3(基質溶素1,前明膠酶))、ELN(彈性蛋白)、USF1(上游轉錄因子1)、CFH(補體因子H)、HSPA4(熱休克70kDa蛋白4)、MMP12(基質金屬肽酶12(巨噬細胞彈性蛋白酶))、MME(膜金屬內肽酶)、F2R(凝血因子II(凝血酶)受體)、SELL(選擇素L)、CTSB(組織蛋白酶B)、ANXA5(膜聯蛋白A5)、ADRB1(腎上腺素性,β-1-,受體)、CYBA(細胞色素b-245,α多肽)、FGA(纖維蛋白原α鏈)、GGT1(γ-穀胺醯轉移酶1)、LIPG(脂肪酶,內皮)、HIF1A(低氧誘導因子1,α亞基(鹼性螺旋環螺旋轉錄因子))、CXCR4(趨化因子(C-X-C模體)受體4)、PROC(蛋白C(凝血因子滅活物Va和VIIIa))、SCARB1(清道夫受體B類,成員1)、CD79A(CD79a分子,免疫球蛋白-相關α)、PLTP(磷脂轉移蛋白)、ADD1(內收蛋白1(α))、FGG(纖維蛋白原γ鏈)、SAA1(血清澱粉樣蛋白A1)、KCNH2(鉀電壓閘控通道,子家族H(eag-相關),成員2)、DPP4(二肽基-肽酶4)、G6PD(葡萄糖-6-磷酸脫氫酶)、NPR1(利鈉肽受體A/鳥苷酸環化酶A(心房利鈉肽受體A))、VTN(玻連蛋白)、KIAA0101(KIAA0101)、FOS(FBJ鼠骨肉瘤病毒癌基因同源物)、TLR2(toll-樣受體2)、PPIG(肽基脯胺醯異構酶G(親環蛋白G))、IL1R1(介白素1受體,I型)、AR(雄激素受體)、CYP1A1(細胞色素P450,家族1,子家族A,多肽1)、絲胺酸蛋白酶抑制劑A1(絲胺酸蛋白酶抑制劑肽酶抑制劑,進化支A(α-1抗蛋白酶,抗胰蛋
白酶),成員1)、MTR(5-甲基四氫葉酸-高半胱胺酸甲基轉移酶)、RBP4(視黃醇結合蛋白4,血漿)、APOA4(載脂蛋白A-IV)、CDKN2A(週期蛋白依賴性激酶抑制劑2A(黑色素瘤,p16,抑制CDK4))、FGF2(成纖維細胞生長因子2(鹼性))、EDNRB(內皮素受體B型)、ITGA2(整聯蛋白,α2(CD49B,VLA-2受體的α2亞基))、CABIN1(鈣調磷酸酶結合蛋白1)、SHBG(性激素-結合球蛋白)、HMGB1(高遷移率族蛋白1)、HSP90B2P(熱休克蛋白90kDaβ(Grp94),成員2(假基因))、CYP3A4(細胞色素P450,家族3,子家族A,多肽4)、GJA1(間隙連接蛋白,α1,43kDa)、CAV1(小窩蛋白1,小凹蛋白,22kDa)、ESR2(雌激素受體2(ERβ))、LTA(淋巴毒素α(TNF超家族,成員1))、GDF15(生長分化因子15)、BDNF(腦源性神經營養因子)、CYP2D6(細胞色素P450,家族2,子家族D,多肽6)、NGF(神經生長因子(β多肽))、SP1(Sp1轉錄因子)、TGIF1(TGFB-誘導因子同源框1)、SRC(v-src肉瘤(施密特-魯平(Schmidt-Ruppin)A-2)病毒癌基因同源物(鳥類))、EGF(表皮生長因子(β-尿抑胃素))、P1K3CG(磷酸肌醇-3-激酶,催化型,γ多肽)、HLA-A(主要組織相容性複合物,I類,A)、KCNQ1(鉀電壓閘控通道,KQT-樣子家族,成員1)、CNR1(大麻素受體1(大腦))、FBN1(原纖蛋白1)、CHKA(膽鹼激酶α)、BEST1(斑萎蛋白1)、APP(澱粉樣蛋白β(A4)先質蛋白)、CTNNB1(鏈蛋白(鈣黏蛋白-相關蛋白)、β1,88kDa)、IL2(介白素2)、CD36(CD36分子(血小板反應蛋白受體))、PRKAB1(蛋白激酶,AMP-啟動型,β1非催化型亞基)、TPO(甲狀腺過氧化物酶)、ALDH7A1(醛脫氫酶7家族,成員A1)、CX3CR1(趨化因子(C-X3-C模體)受體
1)、TH(酪胺酸羥化酶)、F9(凝血因子IX)、GH1(生長激素1)、TF(轉鐵蛋白)、HFE(血色素沈著)、IL17A(介白素17A)、PTEN(磷酸酶和張力蛋白同源物)、GSTM1(麩胱甘肽s-轉移酶mu1)、DMD(肌萎縮蛋白)、GATA4(GATA結合蛋白4)、F13A1(凝血因子XIII,A1多肽)、TTR(甲狀腺素運載蛋白)、FABP4(脂肪酸結合蛋白4,脂肪細胞)、PON3(對氧磷酶3)、APOC1(載脂蛋白C-I)、INSR(胰島素受體)、TNFRSF1B(腫瘤壞死因子受體超家族,成員1B)、HTR2A(5-羥色胺(血清素)受體2A)、CSF3(集落刺激因子3(粒細胞))、CYP2C9(細胞色素P450,家族2,子家族C,多肽9)、TXN(硫氧還蛋白)、CYP11B2(細胞色素P450,家族11,子家族B,多肽2)、PTH(甲狀旁腺素)、CSF2(集落刺激因子2(粒細胞-巨噬細胞))、KDR(激酶插入結構域受體(III型受體酪胺酸激酶))、PLA2G2A(磷脂酶A2,IIA族(血小板,滑液))、B2M(β-2-微球蛋白)、THBS1(血小板反應蛋白1)、GCG(胰高血糖素)、RHOA(ras同源物基因家族,成員A)、ALDH2(醛脫氫酶2家族(線粒體))、TCF7L2(轉錄因子7-樣2(T-細胞特異性,HMG-框))、BDKRB2(緩激肽受體B2)、NFE2L2(核因子(紅細胞源性2)-樣2)、NOTCH1(Notch同源物1,易位-相關(果蠅))、UGT1A1(UDP葡萄糖醛酸轉移酶1家族,多肽A1)、IFNA1(干擾素,α1)、PPARD(過氧物酶體增生啟動受體δ)、SIRT1(去乙醯化酶(沈默交配型資訊調節2同源物)1(釀酒酵母))、GNRH1(促性腺素釋放激素1(黃體化釋放激素))、PAPPA(妊娠相關血漿蛋白A,冠毛素1)、ARR3(抑制蛋白3,視黃醛(X-抑制蛋白))、NPPC(利鈉肽先質C)、AHSP(α血紅蛋白穩定蛋白)、PTK2(PTK2蛋白酪
胺酸激酶2)、IL13(介白素13)、MTOR(雷帕黴素機制靶標(絲胺酸/蘇胺酸激酶))、ITGB2(整聯蛋白,β2(補體組分3受體3和4亞基))、GSTT1(麩胱甘肽s-轉移酶θ1)、IL6ST(介白素6信號轉導蛋白(gp130,制癌蛋白M受體))、CPB2(羧基肽酶B2(血漿))、CYP1A2(細胞色素P450,家族1,子家族A,多肽2)、HNF4A(肝蛋白核因子4,α)、SLC6A4(溶質運載蛋白家族6(神經遞質轉運體,血清素),成員4)、PLA2G6(磷脂酶A2,VI組(細胞溶質,鈣不依賴性))、TNFSF11(腫瘤壞死因子(配位基)超家族,成員11)、SLC8A1(溶質運載蛋白家族8(納/鈣交換蛋白),成員1)、F2RL1(凝血因子II(凝血酶)受體-樣1)、AKR1A1(醛酮還原酶家族1,成員A1(醛還原酶))、ALDH9A1(醛脫氫酶9家族,成員A1)、BGLAP(骨髓γ-羧基穀胺酸(gla)蛋白)、MTTP(線粒體甘油三酯轉移蛋白)、MTRR(5-甲基四氫葉酸-高半胱胺酸甲基轉移酶還原酶)、SULT1A3(磺基轉移酶家族,細胞溶質,1A,苯酚優選型,成員3)、RAGE(腎腫瘤抗原)、C4B(補體組分4B(Chido血型)、P2RY12(嘌呤受體P2Y,G-蛋白偶聯,12)、RNLS(腎胺酶,FAD-依賴型胺氧化酶)、CREB1(cAMP反應元件結合蛋白1)、POMC(阿黑皮素原)、RAC1(ras-相關C3肉毒毒素底物1(rho家族,小GTP結合蛋白Rac1))、LMNA(核纖層蛋白NC)、CD59(CD59分子,補體調節蛋白)、SCN5A(鈉通道,電壓閘控,V型,α亞基)、CYP1B1(細胞色素P450,家族1,子家族B,多肽1)、MIF(巨噬細胞遷移抑制劑y因子(糖基化-抑制因子))、MMP13(基質金屬肽酶13(膠原酶3))、TIMP2(TIMP金屬肽酶抑制劑2)、CYP19A1(細胞色素P450,家族19,子家族A,多肽1)、CYP21A2(細胞色素P450,
家族21,子家族A,多肽2)、PTPN22(蛋白酪胺酸磷酸酶,非-受體型22(淋巴樣))、MYH14(肌球蛋白,重鏈14,非肌肉)、MBL2(甘露糖-結合凝集素(蛋白C)2,可溶(調理素缺陷))、SELPLG(選擇素P配位基)、AOC3(胺氧化酶,含銅3(血管黏附蛋白1))、CTSL1(組織蛋白酶L1)、PCNA(增生細胞核抗原)、IGF2(胰島素樣生長因子2(生長調節素A))、ITGB1(整聯蛋白,β1(纖連蛋白受體,β多肽,抗原CD29包括MDF2、MSK12))、CAST(鈣蛋白酶抑素)、CXCL12(趨化因子(C-X-C模體)配位基12(基質細胞衍生因子1))、IGHE(免疫球蛋白重結構域ε)、KCNE1(鉀電壓閘控通道,Isk-相關家族,成員1)、TFRC(轉鐵蛋白受體(p90,CD71))、COL1A1(膠原,I型,α1)、COL1A2(膠原,I型,α2)、IL2RB(介白素2受體,β)、PLA2G10(磷脂酶A2,X組)、ANGPT2(血管生成素2)、PROCR(蛋白C受體,內皮(EPCR))、NOX4(NADPH氧化酶4)、HAMP(鐵調素抗微生物肽)、PTPN11(蛋白酪胺酸磷酸酶,非受體型11)、SLC2A1(溶質運載蛋白家族2(促葡萄糖轉運體),成員1)、IL2RA(介白素2受體,α)、CCL5(趨化因子(C-C模體)配位基5)、IRF1(干擾素調節因子1)、CFLAR(CASP8和FADD樣細胞凋亡調節劑)、CALCA(降鈣素-相關多肽α)、EIF4E(真核細胞翻譯起始因子4E)、GSTP1(麩胱甘肽s-轉移酶pi1)、JAK2(Janus激酶2)、CYP3A5(細胞色素P450,家族3,子家族A,多肽5)、HSPG2(硫酸類肝素蛋白多糖2)、CCL3(趨化因子(C-C模體)配位基3)、MYD88(骨髓分化主反應基因(88))、VIP(血管活性腸肽)、SOAT1(甾醇O-醯基轉移酶1)、ADRBK1(腎上腺素性,β,受體激酶1)、NR4A2(核受體子家族4,A組,成員2)、
MMP8(基質金屬肽酶8(中性粒細胞膠原酶))、NPR2(利鈉肽受體B/鳥苷酸環化酶B(心房利鈉肽受體B))、GCH1(GTP環化水解酶1)、EPRS(穀醯基-脯胺醯-tRNA合成酶)、PPARGC1A(過氧物酶體增生啟動受體γ,共啟動物1α)、F12(凝血因子XII(接觸因子))、PECAM1(血小板/內皮細胞黏附分子)、CCL4(趨化因子(C-C模體)配位基4)、絲胺酸蛋白酶抑制劑A3(絲胺酸蛋白酶抑制劑肽酶抑制劑,進化支A(α-1抗蛋白酶,抗胰蛋白酶),成員3)、CASR(鈣敏感受體)、GJA5(間隙連接蛋,α5,40kDa)、FABP2(脂肪酸結合蛋白2,腸)、TTF2(轉錄終止因子,RNA聚合酶II)、PROS1(蛋白S(α))、CTF1(心肌營養蛋白1)、SGCB(肌聚糖,β(43kDa肌萎縮蛋白-相關糖蛋白))、YME1L1(YME1樣1(釀酒酵母))、CAMP(抗菌肽抗微生物肽)、ZC3H12A(含鋅指CCCH-型12A)、AKR1B1(醛酮還原酶家族1,成員B1(醛糖還原酶))、DES(肌間線蛋白)、MMP7(基質金屬肽酶7(基質溶解因子,子宮))、AHR(芳香烴受體)、CSF1(集落刺激因子1(巨噬細胞))、HDAC9(組蛋白脫乙醯酶9)、CTGF(結締組織生長因子)、KCNMA1(大電導鈣啟動鉀通道,子家族M,α成員1)、UGT1A(UDP葡萄糖醛酸轉移酶1家族,多肽A複合物座位)、PRKCA(蛋白激酶C,α)、COMT(兒茶酚-.β.-甲基轉移酶)、S100B(S100鈣結合蛋白B)、EGR1(早期生長反應因子1)、PRL(催乳素)、IL15(介白素15)、DRD4(多巴胺受體D4)、CAMK2G(鈣/鈣調蛋白-依賴性蛋白激酶IIγ)、SLC22A2(溶質運載蛋白家族22(有機陽離子轉運體),成員2)、CCL11(趨化因子(C-C模體)配位基11)、PGF(B321胎盤生長因子)、THPO(促血小板生成素)、GP6(糖蛋白VI(血
小板))、TACR1(速激肽受體1)、NTS(神經降壓素)、HNF1A(HNF1同源框A)、SST(生長激素抑制素)、KCND1(鉀電壓閘控通道,Shal-相關子家族,成員1)、LOC646627(磷脂酶抑制劑)、TBXAS1(凝血脂素A合酶1(血小板))、CYP2J2(細胞色素P450,家族2,子家族J,多肽2)、TBXA2R(凝血脂素A2受體)、ADH1C(醇脫氫酶1C(I類)、γ多肽)、ALOX12(花生四烯酸12-脂加氧酶)、AHSG(α-2-HS-糖蛋白)、BHMT(甜菜鹼-高半胱胺酸甲基轉移酶)、GJA4(間隙連接蛋,α4,37kDa)、SLC25A4(溶質運載蛋白家族25(線粒體運載蛋白;腺嘌呤核苷酸轉運體),成員4)、ACLY(ATP檸檬酸裂合酶)、ALOX5AP(花生四烯酸5-脂加氧酶-啟動蛋白)、NUMA1(核有絲分裂器蛋白1)、CYP27B1(細胞色素P450,家族27,子家族B,多肽1)、CYSLTR2(半胱胺醯白三烯受體2)、SOD3(超氧化物歧化酶3,細胞外)、LTC4S(白三烯C4合酶)、UCN(尿皮素)、GHRL(饑餓素/肥胖抑制素前多肽原)、APOC2(載脂蛋白C-II)、CLEC4A(C-型凝集素結構域家族4,成員A)、KBTBD10(含有kelch重複和BTB(POZ)結構域10)、TNC(腱生蛋白C)、TYMS(胸苷酸合酶)、SHC1(SHC(含有Src同源物y2結構域)轉化蛋白1)、LRP1(低密度脂蛋白受體-相關蛋白1)、SOCS3(細胞介素傳訊抑制物3)、ADH1B(醇脫氫酶1B(I類)、β多肽)、KLK3(激肽釋放酶-相關肽酶3)、HSD11B1(羥基類固醇(11-β)脫氫酶1)、VKORC1(維生素K環氧化物還原酶複合物,亞基1)、絲胺酸蛋白酶抑制劑B2(絲胺酸蛋白酶抑制劑肽酶抑制劑,進化支B(卵白蛋白),成員2)、TNS1(張力蛋白1)、RNF19A(環指蛋白19A)、EPOR(紅細胞生成素受體)、ITGAM(整聯蛋白,αM(補體組分3受體
3亞基))、PITX2(成對樣同源結構域2)、MAPK7(絲裂原啟動蛋白激酶7)、FCGR3A(IgG的Fc片段,低親和力111a,受體(CD16a))、LEPR(瘦蛋白受體)、ENG(內皮因子)、GPX1(麩胱甘肽過氧化物酶1)、GOT2(穀胺酸草醯轉胺酶2,線粒體(天冬胺酸胺基轉移酶2))、HRH1(組胺受體H1)、NR112(核受體子家族1,I組,成員2)、CRH(促腎上腺激素釋放激素)、HTR1A(5-羥色胺(血清素)受體1A)、VDAC1(電壓-依賴性陰離子通道1)、HPSE(乙醯肝素酶)、SFTPD(表面活性劑蛋白D)、TAP2(轉運體2,ATP-結合盒,子家族B(MDR/TAP))、RNF123(環指蛋白123)、PTK2B(PTK2B蛋白酪胺酸激酶2β)、NTRK2(神經營養性酪胺酸激酶,受體,2型)、IL6R(介白素6受體)、ACHE(乙醯膽鹼酯酶(Yt血型))、GLP1R(胰高血糖素樣肽1受體)、GHR(生長激素受體)、GSR(麩胱甘肽還原酶)、NQO1(NAD(P)H脫氫酶,醌1)、NR5A1(核受體子家族5,A組,成員1)、GJB2(間隙連接蛋,β2,26kDa)、SLC9A1(溶質運載蛋白家族9(鈉/氫交換蛋白),成員1)、MAOA(單胺氧化酶A)、PCSK9(前蛋白轉化酶枯草桿菌蛋白酶/kexin9型)、FCGR2A(IgG的Fc片段,低親和力IIa,受體(CD32))、絲胺酸蛋白酶抑制劑F1(絲胺酸蛋白酶抑制劑肽酶抑制劑,進化支F(α-2抗纖維蛋白溶素,色素上皮源性因子),成員1)、EDN3(內皮素3)、DHFR(二氫葉酸還原酶)、GAS6(生長停滯-特異性6)、SMPD1(鞘磷脂磷酸二酯酶1,酸性溶酶體)、UCP2(解偶聯蛋白2(線粒體,質子運載蛋白))、TFAP2A(轉錄因子AP-2α(啟動增強子結合蛋白2α))、C4BPA(補體組分4結合蛋白,α)、絲胺酸蛋白酶抑制劑F2(絲胺酸蛋白酶抑制劑肽酶抑制劑,進化支F(α-2
抗纖維蛋白溶素,色素上皮源性因子),成員2)、TYMP(胸苷磷酸化酶)、ALPP(鹼性磷酸酶,胎盤(Regan同工酶))、CXCR2(趨化因子(C-X-C模體)受體2)、SLC39A3(溶質運載蛋白家族39(鋅轉運體),成員3)、ABCG2(ATP-結合盒,子家族G(WHITE),成員2)、ADA(腺苷脫胺酶)、JAK3(Janus激酶3)、HSPA1A(熱休克70kDa蛋白1A)、FASN(脂肪酸合酶)、FGF1(成纖維細胞生長因子1(酸性))、F11(凝血因子XI)、ATP7A(ATP酶,Cu++轉運,α多肽)、CR1(補體組分(3b/4b)受體1(Knops血型))、GFAP(膠質纖維酸性蛋白)、ROCK1(Rho-相關,含捲曲螺旋蛋白激酶1)、MECP2(甲基CpG結合蛋白2(蕾特氏綜合症))、MYLK(肌球蛋白輕鏈激酶)、BCHE(丁醯膽鹼酯酶)、LIPE(脂肪酶,激素敏感性)、PRDX5(過氧化物還原酶5)、ADORA1(腺苷A1受體)、WRN(維爾納綜合症,RecQ螺旋酶樣)、CXCR3(趨化因子(C-X-C模體)受體3)、CD81(CD81分子)、SMAD7(SMAD家族成員7)、LAMC2(核纖層蛋白in,γ2)、MAP3K5(絲裂原啟動蛋白激酶激酶激酶5)、CHGA(嗜鉻粒蛋白A(甲狀旁腺分泌蛋白1))、IAPP(胰島澱粉樣多肽)、RHO(視紫紅質)、ENPP1(核苷酸內焦磷酸酶/磷酸二酯酶1)、PTHLH(甲狀旁腺素樣激素)、NRG1(神經調節蛋白1)、VEGFC(血管內皮生長因子C)、ENPEP(穀醯基胺基肽酶(胺基肽酶A))、CEBPB(CCAAT/增強子結合蛋白(C/EBP)、β)、NAGLU(N-乙醯葡糖胺糖苷酶,α-)、F2RL3(凝血因子II(凝血酶)受體樣3)、CX3CL1(趨化因子(C-X3-C模體)配位基1)、BDKRB1(緩激肽受體B1)、ADAMTS13(具有血小板反應蛋白1型模體的ADAM金屬肽酶,13)、ELANE(彈性蛋白酶,
中性粒細胞表現)、ENPP2(核苷酸內焦磷酸酶/磷酸二酯酶2)、CISH(含有細胞介素誘導型SH2的蛋白)、GAST(胃泌素)、MYOC(肌纖蛋白,小梁網誘導型糖皮質激素反應)、ATP1A2(ATP酶,Na+/K+轉運,α2多肽)、NF1(神經纖維瘤蛋白1)、GJB1(間隙連接蛋,β1,32kDa)、MEF2A(肌細胞增強因子2A)、VCL(黏著斑蛋白)、BMPR2(骨形態蛋白受體,II型(絲胺酸/蘇胺酸激酶))、TUBB(微管蛋白,β)、CDC42(細胞分裂週期42(GTP結合蛋白,25kDa))、KRT18(角蛋白18)、HSF1(熱休克轉錄因子1)、MYB(v-myb成髓細胞血症病毒癌基因同源物(鳥類))、PRKAA2(蛋白激酶,AMP-啟動,α2催化型亞基)、ROCK2(Rho-相關,含捲曲螺旋蛋白激酶2)、TFPI(組織因子途徑抑制劑(脂蛋白-相關凝血抑制劑))、PRKG1(蛋白激酶,cGMP-依賴性,I型)、BMP2(骨形態蛋白2)、CTNND1(鏈蛋白(鈣黏蛋白-相關蛋白)、δ1)、CTH(胱胺醚酶(胱硫醚γ-裂合酶))、CTSS(組織蛋白酶S)、VAV2(vav2鳥嘌呤核苷酸交換因子)、NPY2R(神經肽Y受體Y2)、IGFBP2(胰島素樣生長因子結合蛋白2,36kDa)、CD28(CD28分子)、GSTA1(麩胱甘肽s-轉移酶α1)、PPIA(肽基脯胺醯異構酶A(親環蛋白A))、APOH(載脂蛋白H(β-2-糖蛋白I))、S100A8(S100鈣結合蛋白A8)、IL11(介白素11)、ALOX15(花生四烯酸15-脂加氧酶)、FBLN1(腓骨蛋白1)、NR1H3(核受體子家族1,H組,成員3)、SCD(硬脂醯-CoA去飽和酶(δ-9-去飽和酶))、GIP(胃抑制劑y多肽)、CHGB(嗜鉻粒蛋白B(分泌粒蛋白1))、PRKCB(蛋白激酶C,β)、SRD5A1(類固醇-5-α-還原酶,α多肽1(3-氧代-5α-類固醇δ4-脫氫酶α1))、HSD11B2(羥基類固醇(11-β)脫氫酶2)、CALCRL
(降鈣素受體樣)、GALNT2(UDP-N-乙醯基-α-D-半乳糖胺:多肽N-乙醯基胺基半乳糖轉移酶2(GalNAc-T2))、ANGPTL4(血管生成素樣4)、KCNN4(鉀中間體/小電導鈣-啟動通道,子家族N,成員4)、PIK3C2A(磷酸肌醇-3-激酶,2類,α多肽)、HBEGF(肝素結合EGF樣生長因子)、CYP7A1(細胞色素P450,家族7,子家族A,多肽1)、HLA-DRB5(主要組織相容性複合物,II類,DRβ5)、BNIP3(BCL2/腺病毒E1B19kDa相互作用蛋白3)、GCKR(葡糖激酶(己糖激酶4)調節劑)、S100A12(S100鈣結合蛋白A12)、PADI4(肽基精胺酸脫亞胺酶,IV型)、HSPA14(熱休克70kDa蛋白14)、CXCR1(趨化因子(C-X-C模體)受體1)、H19(H19,母系印記表現的轉錄物(非蛋白編碼))、KRTAP19-3(角蛋白相關蛋白19-3)、IDDM2(胰島素-依賴性糖尿病2)、RAC2(ras-相關C3肉毒毒素底物2(rho家族,小GTP結合蛋白Rac2))、RYR1(利阿諾定(ryanodine)受體1(骨骼))、CLOCK(clock同源物(小鼠))、NGFR(神經生長因子受體(TNFR超家族,成員16))、DBH(多巴胺β-羥化酶(多巴胺β-單加氧酶))、CHRNA4(膽鹼能受體,煙鹼型,α4)、CACNA1C(鈣通道,電壓-依賴性,L型,α1C亞基)、PRKAG2(蛋白激酶,AMP-啟動,γ2非-催化型亞基)、CHAT(膽鹼乙醯轉移酶)、PTGDS(前列腺素D2合酶21kDa(大腦))、NR1H2(核受體子家族1,H組,成員2)、TEK(TEK酪胺酸激酶,內皮)、VEGFB(血管內皮生長因子B)、MEF2C(肌細胞增強因子2C)、MAPKAPK2(絲裂原啟動蛋白激酶-啟動蛋白激酶2)、TNFRSF11A(腫瘤壞死因子受體超家族,成員11a,NFKB啟動物)、HSPA9(熱休克70kDa蛋白9(致死蛋白))、CYSLTR1(半胱胺醯白三烯受體
1)、MAT1A(甲硫胺酸腺苷轉移酶I,α)、OPRL1(鴉片受體樣1)、IMPA1(肌醇(myo)-1(或4)-單磷酸酶1)、CLCN2(氯通道2)、DLD(二氫硫辛醯胺脫氫酶)、PSMA6(蛋白酶體(先質,巨蛋白因子)亞基,α型,6)、PSMB8(蛋白酶體(先質,巨蛋白因子)亞基,β型,8(大多功能肽酶7))、CHI3L1(殼多糖酶3樣1(軟骨糖蛋白-39))、ALDH1B1(醛脫氫酶1家族,成員B1)、PARP2(聚(ADP-核糖)聚合酶2)、STAR(生成類固醇的急性調節蛋白)、LBP(脂多糖結合蛋白)、ABCC6(ATP-結合盒,子家族C(CFTR/MRP),成員6)、RGS2(G-蛋白傳訊調節劑2,24kDa)、EFNB2(肝配蛋白-B2)、GJB6(間隙連接蛋,β6,30kDa)、APOA2(載脂蛋白A-II)、AMPD1(腺苷單磷酸單磷酸1)、DYSF(dysferlin,肢帶肌肉萎縮症2B(常染色體隱性))、FDFT1(法呢基二磷酸法呢基轉移酶1)、EDN2(內皮素2)、CCR6(趨化因子(C-C模體)受體6)、GJB3(間隙連接蛋,β3,31kDa)、IL1RL1(介白素1受體樣1)、ENTPD1(核苷酸內三磷酸酯二磷酸水解酶1)、BBS4(巴比二氏綜合症(Bardet-Biedlsyndrome)4)、CELSR2(鈣黏蛋白,EGFLAG七次跨膜G-型受體2(flamingo同源物,果蠅))、F11R(F11受體)、RAPGEF3(Rap鳥嘌呤核苷酸交換因子(GEF)3)、HYAL1(透明質酸胺基葡糖苷酶1)、ZNF259(鋅指蛋白259)、ATOX1(ATX1抗氧化劑蛋白1同源物(酵母))、ATF6(啟動轉錄因子6)、KHK(已酮糖激酶(果糖激酶))、SAT1(亞精胺/精胺N1-乙醯轉移酶1)、GGH(γ-穀醯基水解酶(軛合酶,葉醯聚γ穀醯基水解酶))、TIMP4(TIMP金屬肽酶抑制劑4)、SLC4A4(溶質運載蛋白家族4,碳酸氫鈉共轉運體,成員4)、PDE2A(磷酸二酯酶2A,cGMP-刺激)、
PDE3B(磷酸二酯酶3B,cGMP-抑制)、FADS1(脂肪酸去飽和酶1)、FADS2(脂肪酸去飽和酶2)、TMSB4X(胸腺素β4,X-連鎖)、TXNIP(硫氧還蛋白相互作用蛋白)、LIMS1(LIM和衰老細胞抗原樣結構域1)、RHOB(ras同源物基因家族,成員B)、LY96(淋巴細胞抗原96)、FOXO1(叉頭框O1)、PNPLA2(含馬鈴薯糖蛋白樣磷脂酶結構域2)、TRH(促甲狀腺激素釋放激素)、GJC1(間隙連接蛋,γ1,45kDa)、SLC17A5(溶質運載蛋白家族17(陰離子/糖轉運體),成員5)、FTO(脂肪量和肥胖相關)、GJD2(間隙連接蛋,δ2,36kDa)、PSRC1(脯胺酸/絲胺酸富集捲曲螺旋1)、CASP12(盒12(基因/假基因))、GPBAR1(G蛋白-偶聯膽汁酸受體1)、PXK(含PX結構域絲胺酸/蘇胺酸激酶)、IL33(介白素33)、TRIB1(tribbles同源物1(果蠅))、PBX4(前-B-細胞白血病同源框4)、NUPR1(核蛋白,轉錄調節劑,1)、15-Sep(15kDa硒蛋白)、CILP2(軟骨中間層蛋白2)、TERC(端粒酶RNA組分)、GGT2(γ-穀胺醯轉移酶2)、MT-CO1(線粒體編碼的細胞色素c氧化酶I)、以及UOX(尿酸氧化酶,假基因)。任何該等序列可以是CRISPR-Cas系統的靶標,例如以處理突變。
在另一個實施方式中,染色體序列可以是進一步選自Pon1(對氧磷酶1)、LDLR(LDL受體)、ApoE(載脂蛋白E)、Apo B-100(載脂蛋白B-100)、ApoA(載脂蛋白(a))、ApoA1(載脂蛋白A1)、CBS(胱硫醚B-合酶)、糖蛋白IIb/IIb、MTHRF(5,10-亞甲四氫葉酸還原酶(NADPH)、以及其組合。在一次反覆運算中,染色體序列和由涉及心血管疾病的染色體序列編碼的蛋白可以是選自Cacna1C、Sod1、Pten、Ppar(alpha)、Apo E、Leptin、以及其
作為CRISPR-Cas系統的一個或多個靶標的組合。
治療肝臟和腎臟的疾病
本發明還考慮將在此所述的CRISPR-Cas系統例如Cpf1效應蛋白系統遞送到肝臟和/或腎臟。誘導治療性核酸的細胞攝取的遞送策略包括物理力或載體系統,諸如基於病毒、脂質或複合物的遞送系統或奈米載體。從最初具有不太可能的臨床相關性的應用開始,當核酸使用全身性流體動力學高壓注射來發送到腎細胞時,廣泛範圍的基因治療病毒和非病毒載體已經用於靶向不同動物腎臟疾病模型的體內轉錄後事件(喬鮑.由裡夫斯(Csaba Révész)和皮特.哈馬爾(Péter Hamar)(2011).靶向腎臟中的RNA的遞送方法(Delivery Methods to Target RNAs in the Kidney),基因治療應用(Gene Therapy Applications),春生.康(Chunsheng Kang)教授(編輯),ISBN:978-953-307-541-9,InTech,可獲自:http://www.intechopen.com/books/gene-therapy-applications/delivery-methods-to-target-rnas-inthe-kidney)。到腎臟中的遞送方法可以包括袁(Yuan)等人(美國腎臟生理學雜誌(Am J Physiol Renal Physiol)295:F605-F617,2008)中所述的那些方法,他們研究了靶向花生四烯酸代謝的12/15-脂加氧酶(12/15-LO)途徑的小干擾RNA(siRNA)的體內遞送是否可以改善鏈脲黴素注射的1型糖尿病小鼠模型中的腎損傷和糖尿病腎病(DN)。為了實現更大的體內進入和腎臟中的siRNA表現,袁等人使用與膽固醇軛合的雙股12/15-LO siRNA寡核苷酸。將約400μg siRNA皮下注射到小鼠中。袁等人的方法可以適用於本發明的CRISPR Cas系統,
考慮向人皮下注射1-2g與膽固醇軛合的CRISPR Cas,以用於遞送到腎臟。
莫里托裡斯(Molitoris)等人(美國腎臟病學會雜誌(J Am Soc Nephrol)20:1754-1764,2009)利用近端小管細胞(PTC)作為腎臟內的寡核苷酸重吸收位點,以測試siRNA靶向細胞凋亡途徑中的關鍵蛋白p53的效率,從而防止腎臟損傷。在缺血性損傷後4h靜脈內注射對於p53的合成的裸siRNA最大限度地保護了PTC和腎功能。莫里托裡斯等人的資料表明將siRNA快速遞送到近端小管細胞採用靜脈內注射。對於劑量反應性分析,用0.33;1、3或5mg/kg劑量的siP53注射大鼠,在相同的四個時間點給予,分別產生累積劑量1.32;4、12以及20mg/kg。與PBS處理的缺血對照大鼠相比較,所有測試的siRNA劑量在第一天產生了SCr降低作用,其中更高的劑量在經過大約五天中更有效12mg/kg和20mg/kg的累積劑量提供了最好的保護作用。莫里托裡斯等人的方法可以適用於本發明的CRISPR Cas系統,對於人類考慮用於遞送到腎臟的12和20mg/kg累積。
湯普森(Thompson)等人(核酸治療(Nucleic Acid Therapeutics),第22卷,第4期,2012)報導了在齧齒動物和非人類靈長類動物中靜脈內注射之後合成的小干擾RNA I5NP的毒物學特徵和藥代動力學特徵。I5NP被設計經由RNA干擾(RNAi)途徑作用,以暫時抑制促細胞凋亡蛋白p53的表現,並且被開發來防止細胞經受在主要心臟手術過程中可能出現的急性缺血/再灌注損傷諸如急性腎損傷以及在腎臟移植之後可能出現的移植物功能
延遲。在齧齒類中的800mg/kg I5NP以及在非人類靈長動物中的1,000mg/kg I5NP的劑量對於引起不良作用係需要的,在猴中被分離為引導對血液的作用,包括補體的亞臨床啟動和凝血時間的輕度增加。在大鼠中,使用I5NP的大鼠類似物未觀察到另外的不良作用,這表明該等作用可能表示合成型RNA雙股體的分類作用,而不是與I5NP的預期藥理活性相關的毒性。總之,該等資料支援用於在急性缺血/再灌注損傷之後保留腎功能的I5NP的靜脈內給藥的臨床測試。在猴子中無觀察到的不良反應的水平(NOAEL)係500mg/kg。在猴子中在以多至25mg/kg的劑量水平靜脈內給藥之後未觀察到對心血管、呼吸和神經系統參數的作用。因此,對於向人類的腎臟靜脈內給予CRISPR Cas可以考慮類似劑量。
清水(Shimizu)等人(美國腎臟病學會雜誌21:622-633,2010)開發了經由基於聚(乙二醇)-聚(L-賴胺酸)的媒介物將siRNA靶向遞送到腎小球的系統。該siRNA/奈米載體複合物的直徑係約10至20nm,該直徑係將允許它移動跨過穿孔內皮細胞而接近腎小球膜的大小。在腹膜內注射螢光標記的siRNA/奈米載體複合物之後,清水等人在血液循環中檢測到siRNA,持續一段延長的時間。在腎小球腎炎的小鼠模型中,絲裂原啟動蛋白激酶1(MAPK1)siRNA/奈米載體複合物的重複腹膜內給藥抑制了腎小球MAPK1 mRNA和蛋白質表現。為了研究siRNA累積,向BALBc小鼠給予與PIC奈米載體複合的Cy5標記的siRNA(0.5ml,5nmol的siRNA含量)、裸露的Cy5標記的siRNA(0.5ml,5nmol)、或封裝在HVJ-E中的Cy5標記的siRNA(0.5ml,5nmol的siRNA含量)。清水等人的方法可以適用於本發明的CRISPR Cas系統,對於人類
考慮在約1-2升內約10-20μmol與奈米載體複合的CRISPR Cas,以腹膜內給藥並且遞送到腎臟。
到腎臟的遞送方法概括如下:
靶向肝臟或肝臟細胞
提供了靶向的肝臟細胞。此細胞可以是在體外或在體內。肝細胞係較佳的。CRISPR蛋白質諸如在此的Cpf1的遞送可以是經由病毒載體,尤其是AAV(並且具體地是AAV2/6)載體。該等載體可以是藉由靜脈內注射來給予的。
肝臟的較佳的靶標(無論是在體外或在體內)係白蛋白基因。這係所謂的“安全港”,因為白蛋白以極高水平表現並且因此耐受在成功基因編輯之後的白蛋白產生的一些減少。它也是較佳的,因為由白蛋白啟動子/增強子看出的高水平表現允許實現有用水平的校正或轉基因產生(由插入的供體模板產生),即使僅一小部分肝細胞被編輯。
韋克斯勒(Wechsler)等人證實白蛋白的內含子1(報導在美國血液學會第57屆年會和博覽會(57th Annual Meeting and Exposition of the American Society of Hematology)-摘要在https://ash.confex.com/ash/2015/webprogram/Paper86495.html處可線上獲得並且在2015年12月6日給出)係適合的靶位點。他們的研
究使用Zn指切割DNA的此靶位點,並且可以生成適合的指導序列以指導CRISPR蛋白在相同位點處的切割。
使用高度表現的基因(具有高活性增強子/啟動子的基因)諸如白蛋白內的靶標也可以允許使用無啟動子供體模板,如藉由韋克斯勒報導的,並且這在肝臟靶向之外也是廣泛適用的。高度表現基因的其他實例係已知的。
其他肝臟疾病
在特定實施方式中,本發明的CRISPR蛋白用於治療肝臟病症,諸如甲狀腺素運載蛋白澱粉樣變性(ATTR)、α-1抗胰蛋白酶缺乏症以及其他基於肝臟的先天性代謝障礙。FAP係由編碼甲狀腺素運載蛋白(TTR)的基因中的突變引起的。雖然它係常染色體顯性疾病,但是並非所有的載體都發展該疾病。在TTR基因中存在已知與該疾病相關聯的超過100個突變。常見突變的實例包括V30M。藉由使用iRNA的研究已證明基於基因沈默的TTR治療原則(上田(Ueda)等人,2014,翻譯性神經變性(Transl Neurogener.)3:19)。威爾森氏病(WD)係由編碼肝細胞中專一可見的ATP7B的基因中的突變引起的。存在與WD相關聯的500個突變,其中它在特定地區諸如東亞的患病率增加。其他實例係AIATD(由SERPINA1基因中的突變引起的常染色體隱性疾病)和PKU(由苯丙胺酸羥化酶(PAH)基因中的突變引起的常染色體隱性疾病)。
肝臟相關血液病症,尤其是血友病並且具體地是B型血友病
在小鼠(體外和體內)和非人類靈長類動物(體內)
中已實現成功的肝細胞基因編輯,這顯示藉由肝細胞中的基因編輯/基因組工程化來治療血液病症係可行的。具體地說,在非人類靈長類動物中已顯示肝細胞的人類F9(hF9)基因的表現,這指示人類B型血友病的治療。
韋克斯勒等人在美國血液學會第57屆年會和博覽會(摘要在2015年12月6日給出並且在https://ash.confex.com/ash/2015/webprogram/Papcr86495.html處可線上獲得)報導了他們藉由體內基因編輯成功表現了來自非人類靈長類動物的肝細胞的F9(hF9)。這係使用1)靶向白蛋白座位的內含子1的兩種鋅指核酸酶(ZFN)以及2)人類F9供體模板來實現的。在靜脈內注射的單獨親肝性腺相關病毒血清型2/6(AAV2/6)上編碼ZFN和供體模板,從而使得hF9基因的校正拷貝靶向插入到一定比例的肝臟肝細胞的白蛋白座位中。
白蛋白座位被選擇為“安全港”,因為此最豐富的血漿蛋白質的產生超過10g/天,並且良好耐受那些水平的中等降低。藉由高活性白蛋白增強子/啟動子驅動,基因組編輯的肝細胞產生治療量的正常hFIX(hF9),而不是白蛋白。示出hF9轉基因在白蛋白座位處的靶向整合和此基因到白蛋白轉錄物中的剪接。
小鼠研究:經由尾靜脈注射向C57BL/6小鼠給予媒介物(n=20)或編碼小鼠代理試劑的1.0x1013個載體基因組(vg)/kg的AAV2/6載體(n=25)。在治療的小鼠中的血漿hFIX的ELISA分析顯示持續6個月研究持續時間的50-1053ng/mL峰值水平。來自小鼠血漿的FIX活性水平證實與表現水平相稱的生物活性。
非人類靈長類動物(NHP)研究:以1.2x1013vg/kg單次靜脈內共輸注編碼NHP靶向白蛋白特異性ZEN的AAV2/6載體和人類F9供體(n=5/組),導致在此大動物模型中>50ng/mL(>正常水平的1%)。使用較高AAV2/6劑量(多至1.5x1014vg/kg)在幾隻動物中產生多至1000ng/ml(或正常水平的20%)的血漿hFIX水平並且在單一動物中產生多至2000ng/ml(或正常水平的50%)的血漿水平,持續研究的持續時間(3個月)。
治療在小鼠和NHP中良好耐受,其中沒有顯著毒物學發現與治療劑量的兩種種類之一的AAV2/6 ZFN+供體治療相關。桑加莫公司(美國加利福尼亞州)已經適用於FDA許可並且已經得到批准,進行世界首次體內基因組編輯應用的人類臨床試驗。這在脂蛋白脂肪酶缺乏症的Glybera基因療法治療的EMEA批准之後進行。
因此,在一些實施方式中,較佳的是使用任何或所有以下各項:
AAV(具體地是AAV2/6)載體,較佳的是藉由靜脈內注射來給予;
作為用於基因編輯/插入轉基因/模板的靶標的白蛋白-尤其是在白蛋白的內含子1處;
人類F9供體模板;和/或
無啟動子供體模板。
B型血友病
因此,在一些實施方式中,較佳的是本發明用於治療B型血友病。這樣較佳的是提供一種模板並且此模板係人類F9基因。將瞭解的是hF9模板包含wt版本或“校正”版本的hF9,以使得該治療係有效的。
在一替代實施方式中,可以遞送F9的B型血友病版本,以便創建模型生物體、細胞或細胞系(例如鼠或非人類靈長類動物模型生物體、細胞或細胞系),該模型生物體、細胞或細胞系具有或攜帶B型血友病表型,即沒有產生wt F9的能力。
A型血友病
在一些實施方式中,F9(因子IX)基因可以被以上所述F8(因子VIII)基因替換,從而使得能夠治療A型血友病(藉由提供校正的F8基因)並且/或者創建A型血友病模型生物體、細胞或細胞系(藉由提供未校正的A型血友病版本的F8基因)。
C型血友病
在一些實施方式中,F9(因子IX)基因可以被以上所述F11(因子XI)基因替換,從而使得能夠治療C型血友病(藉由提供校正的F11基因)並且/或者創建C型血友病模型生物體、細胞或細胞系(藉由提供未校正的C型血友病版本的F11基因)。
治療上皮細胞和肺部疾病
本發明還考慮將在此所述的CRISPR-Cas系統例如Cpf1效應蛋白系統遞送到一側或兩側肺部。
儘管基於AAV-2的載體最初提出用於CFTR遞送到CF
氣道,但是其他血清型諸如AAV-1、AAV-5、AAV-6、以及AAV-9在各種各樣的肺上皮細胞模型中展現出提高的基因轉移效率(參見,例如,分子治療,第17卷,第12期,2067-2077,2009年12月)。證實在體外轉導的人類氣道上皮細胞中AAV-1比AAV-2和AAV-5更有效~100倍,5儘管體內AAV-1轉導的鼠氣管內氣道上皮細胞具有等於AAV-5的效率。其他研究已顯示,在針對體外人類氣道上皮(HAE)的基因遞送上,AAV-5比AAV-2更有效50倍,並且在體內小鼠肺氣道上皮中顯著更有效。還已顯示在體外人類氣道上皮細胞中和在體內鼠類氣道中,AAV-6比AAV-2更有效。8更為近期的分離物AAV-9顯示在體內鼠類鼻和肺泡上皮中展示了比AAV-5更大的基因轉移效率,其中持續超過9個月檢測出基因表現,這表明AAV可以使得能夠在體內進行長期基因表現,這對於CFTR基因遞送載體而言是一種理想特性。此外,證明了AAV-9可以被再次給予至鼠類的肺部,而不喪失CFTR表現並且具有最低限度的免疫結果。可以在CF和非CF HAE培養物的頂面上用100μl的AAV載體接種,持續數小時(參見,例如,李等人,分子治療,第17卷,第12期,2067-2077,2009年12月)。MOI可以從1×103到4×105個載體基因組/細胞而變化,這取決於病毒濃度和該等實驗的目的。以上引用的載體被考慮用於本發明的遞送和/或給藥。
薩莫拉(Zamora)等人(美國呼吸道與危重護理學雜誌(Am J Respir Crit Care Med),第183卷,第531-538頁,2011)報導了針對人類感染性疾病治療的RNA干擾治療法的應用實例以及抗病毒藥物在呼吸道合胞病毒(RSV)感染的肺移植受體中的隨機試驗。薩莫拉等人進行
了一項在具有RSV呼吸道感染的LTX受體中的隨機化、雙盲、安慰劑對照的試驗。允許患者接受針對RSV的護理標準。每天給予霧化的ALN-RSV01(0.6mg/kg)或安慰劑,持續3天。此研究表明可以向患有RSV感染的LTX受體安全地給予靶向RSV的RNAi治療劑。ALN-RSV01的三個每日劑量並不導致任何呼吸道症狀的加重或肺功能的損害,並且未展示任何出全身性致炎作用,諸如細胞介素或CRP的誘導。在吸入之後,藥代動力學僅顯示低的、短暫的全身性暴露,與臨床前動物資料一致,表明靜脈內或藉由吸入給予的ALN-RSV01藉由外切核酸酶介導的消化和腎臟排泄而從循環中快速清除。薩莫拉等人的方法可以適用於本發明的CRISPR Cas系統,並且對於本發明可以考慮霧化的CRISPR Cas,例如使用0.6mg/kg的劑量。
對肺病進行治療的受試者可以例如每側肺部接受藥物有效量的支氣管遞送的霧化的AAV載體系統,同時自發地呼吸。這樣,總的來說,對於AAV遞送,霧化的遞送係較佳的。腺病毒或AAV粒子可以用於遞送。可以將適合的基因構建體選殖到遞送載體中,該等基因構建體各自可操作地連接到一種或多種調節序列。在此情況下,提供以下構建體作為實例:對於Cas(Cpf1)的Cbh或EF1a啟動子、對於指導RNA的U6或H1啟動子。較佳的安排係使用CFTRδ508靶向指導、δF508突變的修復模板以及密碼子優化的Cpf1酶,其中具有視情況一種或多種核定位信號或序列(一個或多個NLS),例如兩個(2)NLS。設想沒有NLS的構建體。
治療肌肉系統疾病
本發明還考慮將在此所述的CRISPR-Cas系統例如Cpf1效應蛋白系統遞送到一個或多個肌肉。
博爾特蘭薩(Bortolanza)等人(分子治療,第19卷,第11期,2055-2064,2011年11月)證實,在FRG1小鼠中在面肩肱型肌營養不良(FSHD)發作之後,RNA干擾表現盒的全身性遞送導致劑量依賴性長期FRG1敲低,而沒有毒性跡象。博爾特蘭薩等人發現,單次靜脈內注射5×1012vg的rAAV6-sh1FRG1挽救了FRG1小鼠的肌肉組織病理學和肌肉功能。詳細地說,使用25號泰爾茂(Terumo)注射器將200μl含有2×1012或5×1012vg載體的生理溶液注射到尾靜脈中。博爾特蘭薩等人的方法可以適用於表現CRISPR Cas的AAV並且可以約2×1015或2×1016vg載體的劑量注射到人類中。
杜蒙特科(Dumonceaux)等人(分子治療,第18卷,第5期,881-887,2010年5月)使用針對肌肉生長抑制素受體AcvRIIb mRNA(sh-AcvRIIb)的RNA干擾技術抑制肌肉生長抑制素途徑。由載體化U7外顯子跳躍技術(U7-DYS)介導准肌營養不良蛋白(quasi-dystrophin)的恢復。將攜帶單獨的sh-AcvrIIb構建體、單獨的U7-DYS構建體、或這兩種構建體的組合的腺相關載體注射到營養不良mdx小鼠的脛骨前肌(TA)肌肉中。以1011個AAV病毒基因組進行注射。杜蒙特科等人的方法可以適用於表現CRISPR Cas的AAV並且以約1014或1015vg載體的劑量注射到人類中。
木內(Kinouchi)等人(基因治療(2008)15,1126-
1130)報導了藉由未經化學修飾的siRNA與缺端膠原(ATCOL)形成奈米粒子來體內siRNA遞送到正常或患病小鼠骨骼肌的有效性。ATCOL介導的靶向肌肉生長抑制素(骨骼肌生長的負調節劑)的siRNA在小鼠骨骼肌中的局部應用或者靜脈內應用在應用之後幾週內引起肌肉質量的顯著增加。該等結果顯示siRNA的ATCOL介導的應用係用於包括肌肉萎縮在內的疾病的未來治療用途的強大工具。根據製造商的說明,將MstsiRNA(終濃度,10mM)與ATCOL(對於局部給藥的終濃度,0.5%)(AteloGene,高研株式會社(Kohken),日本東京(Tokyo,Japan))混合。在藉由耐波他(Nembutal)(25mg/kg,腹膜內注射)麻醉小鼠(20週大的雄性C57BL/6)之後,將Mst-siRNA/ATCOL複合物注射到咬肌和股二頭肌中。木內等人的方法可以適用於CRISPR Cas並且可以注射到人類中,例如以40μM溶液的約500至1000ml的劑量注射到肌肉中。哈格斯特龍(Hagstrom)等人(分子治療,第10卷,第2期,2004年8月)描述了使得能夠將核酸有效且可重複地遞送到遍及哺乳動物四肢肌肉的肌細胞(肌纖維)的血管內、非病毒方法。該程式涉及將裸質粒DNA或siRNA注射到暫時由止血帶或血壓袖帶分離的肢體的遠端靜脈中。藉由以足夠的體積將其迅速注射來促進向肌纖維的核酸遞送,使得該核酸溶液能夠溢出到肌肉組織中。在小動物和大動物中都以最低毒性實現在骨骼肌中的高水平轉基因表現。還獲得了向四肢肌肉遞送siRNA的證據。為了將質粒DNA靜脈內注射到恒河猴中,將三通旋塞連接到各自載入有單個注射器的兩個注射器泵(型號PHD 2000;哈佛儀器公司(Harvard Instruments))上。在罌粟鹼注射五分鐘之後,以1.7或2.0ml/s的速
率注射pDNA(15.5到25.7mg,在40-100ml鹽水中)。對於表現本發明的CRISPR Cas的質粒DNA,這可以按比例增加,其中對於人類注射在800到2000ml鹽水中的約300到500mg。對於將腺病毒載體注射到大鼠中,注射在3ml正常生理鹽水溶液(NSS)中的2×109個感染粒子。對於表現本發明的CRISPR Cas的質粒DNA,這可以按比例增加,其中對於人類注射在10升NSS中的約1×1013個感染粒子。對於siRNA,以12.5μg的siRNA注射到大鼠的大隱靜脈中,並且以750μg的siRNA注射到靈長類動物的大隱靜脈中。對於本發明的CRISPR Cas,這可以按比例增加,例如,其中將約15至約50mg注射到大隱靜脈中。
例如,還參見WO2013163628 A2,突變基因的遺傳校正(Genetic Correction of Mutated Genes),杜克大學(Duke University)的公開申請,描述了例如校正框移突變的努力,該框移突變引起提前終止密碼子和可以經由核酸酶介導的非同源末端接合進行校正的截短基因產物,該基因產物諸如引起杜氏肌營養不良(“DMD”)的那些基因產物,該杜氏肌營養不良係一種隱性遺傳的、致命的、X連鎖疾病,其導致由肌營養不良蛋白基因突變所致的肌肉變性。引起DMD的大多數肌營養不良蛋白突變係破壞閱讀框並且引起肌營養不良蛋白基因的提前翻譯終止的外顯子缺失。肌營養不良蛋白係細胞質蛋白,它提供負責調節肌細胞完整性和功能的細胞膜肌營養不良蛋白聚糖複合物的結構穩定性。如在此可互換地使用的肌營養不良蛋白基因或“DMD基因”係在座位Xp21處的2.2兆鹼基。初級轉錄測量了約2,400kb,其中成熟mRNA係約14kb。79個外顯子編碼超過3500個胺基酸的蛋白質。在DMD
患者中,外顯子51常常接近破壞框的缺失並且已在臨床試驗中被靶向用於基於寡核苷酸的外顯子跳躍。對於外顯子51跳躍化合物依替利森(eteplirsen)的臨床試驗,最近報導了跨48週的顯著功能益處,與基線相比具平均47%的肌營養不良蛋白陽性纖維。外顯子51中的突變理想地適合於藉由基於NHEJ的基因組編輯進行永久性校正。
轉讓給策勒克提斯公司的美國專利公開案號20130145487的方法涉及切割來自人類肌營養不良蛋白基因(DND)的靶序列的大範圍核酸酶變體,該方法也可以被修改成本發明的核酸靶向系統。
治療皮膚疾病
本發明還考慮將在此所述的CRISPR-Cas系統例如Cpf1效應蛋白系統遞送到皮膚。
希克森(Hickerson)等人(分子治療-核酸(2013)2,e129)涉及用於向人類和鼠類皮膚遞送自我遞送(sd)-siRNA的機動化的微針陣列皮膚遞送裝置。將基於siRNA的皮膚治療劑轉化到臨床的主要挑戰係有效遞送系統的開發。在多種皮膚遞送技術中已經投入了大量的努力,但是成功有限。在其中用siRNA治療皮膚的臨床研究中,與皮下針注射相關聯的劇烈疼痛排除了試驗中額外患者的納入,這凸顯了對於改進的、更為“患者友好的”(即,很少或沒有疼痛)遞送方法的需要。微針代表將包括siRNA在內的大帶電貨物遞送穿過一級障壁角質層的有效途徑,並且通常被認為比常規皮下針疼痛更少。機動化的“衝壓型”微針裝置,包括由
希克森等人使用的機動化微針陣列(MMNA)裝置,已經顯示在無毛小鼠研究中是安全的並且引起很少的疼痛或不引起疼痛,其證據為:(i)在美容業中廣泛使用以及(ii)其中幾乎所有志願者都發現使用該裝置比流感疫苗針劑(flushot)疼痛少得多的有限測試,這表明使用此裝置的siRNA遞送將產生比使用皮下針注射的先前臨床試驗中所體驗的少得多的疼痛。該MMNA裝置(作為Triple-M或Tri-M由韓國首爾(Seoul,South Korea)的Bomtech電子有限公司銷售)適於將siRNA遞送到小鼠和人類皮膚。將sd-siRNA溶液(高達300μl的0.1mg/mlRNA)引入到設定為0.1mm深度的一次性Tri-M針盒(Bomtech公司)的腔室中。為了處理人類皮膚,在處理之前將未鑒定的皮膚(在外科手術之後立即獲得)手動拉伸並且釘在軟木平臺上。使用具有28號0.5英吋針頭的胰島素注射器進行所有皮內注射。該MMNA裝置和希克森等人的方法可以用於並且/或者適於例如以高達300μl的0.1mg/mlCRISPR Cas的劑量將本發明的CRISPR Cas遞送到皮膚。
裡奇曼(Leachman)等人(分子治療,第18卷,第2期,442-446,2010年2月)涉及利用基於第一短干擾RNA(siRNA)的皮膚治療劑用於治療罕見皮膚病症先天性厚甲(PC)的Ib期臨床試驗,先天性厚甲係常染色體顯性綜合症,包括致殘性的掌蹠角化病。此siRNA(稱為TD101)特異性地並強有力地靶向角蛋白6a(K6a)N171K突變體mRNA,而不影響野生型K6a mRNA。
鄭等人(美國國家科學院院刊,2012年7月24日,第109卷,第30期,11975-11980)證實,球形核酸奈米粒子軛合物
(SNA-NC)係由高度定向的、共價固定的siRNA的緻密殼圍繞的金核,它在應用之後數小時內自由地穿透幾乎100%體外角化細胞、小鼠皮膚、以及人類表皮。鄭等人證明,在人類皮膚中單次應用25nM的表皮生長因子受體(EGFR)SNA-NC持續60小時顯示出有效的基因敲低。對於向皮膚給予的在SNA-NC中固定的CRISPR Cas,可以考慮類似劑量。
癌症
在一些實施方式中,提供了癌症的治療、預防或診斷。靶標較佳的是以下各項中的一種或多種:FAS、BID、CTLA4、PDCD1、CBLB、PTPN6、TRAC或TRBC基因。該癌症可以是以下各種中的一種或多種:淋巴瘤、慢性淋巴細胞白血病(CLL)、B細胞急性淋巴細胞白血病(B-ALL)、急性成淋巴細胞性白血病、急性髓性白血病、非霍奇金淋巴瘤(NHL)、彌漫性大細胞淋巴瘤(DLCL)、多發性骨髓瘤、腎細胞癌(RCC)、成神經細胞瘤、結腸直腸癌、乳腺癌、卵巢癌、黑色素瘤、肉瘤、前列腺癌、肺癌、食管癌、肝細胞癌、胰腺癌、星形細胞瘤、間皮瘤、頭頸癌、以及成神經管細胞瘤。這可以用工程化嵌合抗原受體(CAR)T細胞執行。這描述於WO2015161276中,該專利的揭露內容藉由引用結合在此並且如下文所述。
在一些實施方式中,適用於治療或預防癌症的靶基因可以包括WO2015048577中所述的那些靶基因,該專利的揭露內容藉由引用結合在此。
Usher症候群或色素性視網膜炎-39
在一些實施方式中,提供了Usher症候群或色素性視網膜炎-39的治療、預防或診斷。該靶標較佳的是USH2A基因。在一些實施方式中,提供了在位置2299處的G缺失(2299delG)的校正。這描述於WO2015134812A1中,該專利的揭露內容藉由引用結合在此。
囊性纖維化(CF)
在一些實施方式中,提供了囊性纖維化的治療、預防或診斷。該靶標較佳的是SCNN1A或CFTR基因。這描述於WO2015157070中,該專利的揭露內容藉由引用結合在此。
施萬克(Schwank)等人(細胞幹細胞,13:653-58,2013)使用CRISPR-Cas9校正與人類幹細胞的囊性纖維化相關聯的缺陷。該組的靶標係離子通道囊性纖維化跨膜導體受體(CFTR)的基因。CFTR中的缺失引起囊性纖維化患者中的蛋白質錯誤折疊。使用由來自患有囊性纖維化的兩位兒童的細胞樣品開發的培養的腸道幹細胞,施萬克等人能夠使用CRISPR連同含有有待插入的修復性序列的供體質粒校正該缺陷。然後研究者將該等細胞生長成腸道“細胞器”或微型腸,並且證實它們能夠正常起作用。在此情況下,約一半選殖的細胞器經受適當的遺傳校正。
HIV和AIDS
在一些實施方式中,提供了HIV和AIDS的治療、預防或診斷。該靶標較佳的是HIV中的CCR5基因。這描述於WO2015148670A1中,該專利的揭露內容藉由引用結合在此。
β地中海貧血
在一些實施方式中,提供了β地中海貧血的治療、預防或診斷。該靶標較佳的是BCL11A基因。這描述於WO2015148860中,該專利的揭露內容藉由引用結合在此。
鐮狀細胞疾病(SCD)
在一些實施方式中,提供了鐮狀細胞疾病(SCD)的治療、預防或診斷。該靶標較佳的是HBB或BCL11A基因。這描述於WO2015148863中,該專利的揭露內容藉由引用結合在此。
單純性皰疹病毒1和2
在一些實施方式中,提供了HSV-1(單純性皰疹病毒1)的治療、預防或診斷。該靶標較佳的是在HSV-1中的UL19、UL30、UL48或UL50基因。這描述於WO2015153789中,該專利的揭露內容藉由引用結合在此。
在其他實施方式中,提供了HSV-2(單純性皰疹病毒2)的治療、預防或診斷。該靶標較佳的是在HSV-2中的UL19、UL30、UL48或UL50基因。這描述於WO2015153791中,該專利的揭露內容藉由引用結合在此。
在一些實施方式中,提供了原發性開角型青光眼(POAG)的治療、預防或診斷。該靶標較佳的是MYOC基因。這描述於WO2015153780中,該專利的揭露內容藉由引用結合在此。
過繼細胞治療
本發明還考慮使用在此所述的CRISPR-Cas系統例如Cpf1效應蛋白系統修飾用於過繼治療的細胞。本發明的多個方面因此涉及過繼性轉移對於選定抗原諸如腫瘤相關抗原特異的免疫系統細胞諸如T細胞(參見,毛斯(Maus)等人,2014,用於癌症或病毒的過繼性免疫治療(Adoptive Immunotherapy for Cancer or Viruses),免疫學年度綜述(Annual Review of Immunology),第32卷:189-225;羅森伯格(Rosenberg)和羅斯替弗(Restifo),2015,作為用於人類癌症的個體化免疫治療的過繼性細胞轉移(Adoptive cell transfer as personalized immunotherapy for human cancer),科學,第348卷,第6230期,第62-68頁;以及羅斯替弗等人,2015,用於癌症的過繼性免疫治療:利用T細胞反應(Adoptive immunotherapy for cancer:harnessing the T cell response.)自然綜述免疫學12(4):269-281;以及詹森(Jenson)和裡德爾(Riddell),2014,使用嵌合抗原受體修飾性T細胞設計並實施過繼治療(Design and implementation of adoptive therapy with chimeric antigen receptor-modified T cells.)免疫學綜述257(1):127-144)。不同策略可以例如用於藉由改變T細胞受體(TCR)的特異性,例如藉由引起具有選定的肽特異性的新TCR α和β鏈來遺傳性修飾T細胞(參見,美國專利案號8,697,854;PCT專利公開:WO2003020763、WO2004033685、WO2004044004、WO2005114215、WO2006000830、WO2008038002、WO2008039818、WO2004074322、WO2005113595、WO2006125962、WO2013166321、WO2013039889、WO2014018863、WO2014083173;美國專利案號8,088,379)。
作為TCR修飾的替代方案或者除TCR修飾之外,可以
使用嵌合抗原受體(CAR),以便生成對於選定靶標諸如惡性腫瘤細胞特異的免疫反應細胞諸如T細胞,其中已經描述了各種各樣的受體嵌合構建體(參見美國專利案號5,843,728;5,851,828;5,912,170;6,004,811;6,284,240;6,392,013;6,410,014;6,753,162;8,211,422;以及PCT公開WO9215322)。替代性CAR構建體可以被表徵為屬於連續世代。第一代CAR典型地由對於抗原特異的抗體單股可變片段組成,例如包括連接至特異性抗體的VH的VL,藉由柔性接頭連接,例如藉由CD8α鉸鏈區和CD8α跨膜結構域,連接至CD3ζ或FcRγ的跨膜和細胞內傳訊結構域(scFv-CD3ζ或scFv-FcRγ;參見美國專利案號7,741,465;美國專利案號5,912,172;美國專利案號5,906,936)。第二代CAR結合一種或多種共刺激分子的細胞內結構域,諸如內結構域內的CD28、OX40(CD134)或4-1BB(CD137)(例如scFv-CD28/OX40/4-1BB-CD3ζ;參見美國專利案號8,911,993;8,916,381;8,975,071;9,101,584;9,102,760;9,102,761)。第三代CAR包括共刺激內結構域的組合,諸如CD3ζ-鏈、CD97、GDI 1a-CD18、CD2、ICOS、CD27、CD154、CDS、OX40、4-1BB、或CD28傳訊結構域(例如scFv-CD28-4-1BB-CD3ζ或scFv-CD28-OX40-CD3ζ;參見美國專利案號8,906,682;美國專利案號8,399,645;美國專利案號5,686,281;PCT公開號WO2014134165;PCT公開號WO2012079000)。可替代地,共刺激可以藉由在抗原特異性T細胞中表現CAR來調控,該T細胞被選擇為在其天然αβTCR接合之後啟動並擴增,例如在伴隨共刺激的情況下藉由專職抗原呈遞細胞上的抗原。此外,另外的工程化受體可以被提供在免疫反應細胞中,例如以提高T細胞攻擊的靶向並且/或者最小化副作用。
替代技術可以用於轉化免疫反應靶細胞,諸如原生質體融合、脂轉染、轉染或電穿孔。可以使用各種各樣的載體,諸如逆轉錄病毒載體、慢病毒載體、腺病毒載體、腺相關病毒載體、質粒或轉位子,諸如睡美人轉位子(參見美國專利案號6,489,458;7,148,203;7,160,682;7,985,739;8,227,432),該等載體可以用於例如使用藉由CD3ζ和CD28或CD137傳導信號的第2代抗原特異性CAR來引入CAR。病毒載體可以例如包括基於HIV、SV40、EBV、HSV或BPV的載體。
靶向轉化的細胞可以例如包括T細胞、自然殺傷細胞(NK)、細胞毒性T淋巴細胞(CTL)、調節T細胞、人類胚胎幹細胞、腫瘤浸潤淋巴細胞(TIL)或淋巴樣細胞可以由其分化的多能幹細胞。表現希望的CAR的T細胞可以例如藉由與γ-輻射啟動和增殖細胞(AaPC)共培養來選擇,該等啟動和增殖細胞共表現癌症抗原和共刺激分子。過程化CAR T細胞可以例如藉由在可溶性因子諸如IL-2和IL-21存在下在AaPC上共培養來擴增。此擴增可以例如被執行來提供記憶CAR+ T細胞(該等細胞可以例如藉由非酶數位陣列和/或多板型(multi-panel)流式細胞術來測定)。以這種方式,可以提供具有針對攜帶抗原的腫瘤的特異性細胞毒性活性的CAR T細胞(視情況與希望的趨化因子諸如干擾素-γ的產生相結合)。這種類型的CAR T細胞例如可以用於動物模型中,例如以威懾腫瘤異種移值物。
方法諸如上述方法可以適於提供例如藉由給予有效量的免疫反應細胞來治療患有諸如瘤形成的疾病的患者並且/或
者增加該患者的存活的方法,該免疫反應細胞包含結合選定抗原的抗原識別受體,其中該結合啟動免疫反應細胞,從而治療或預防該疾病(諸如瘤形成、病原體感染、自身免疫病症或同種異體移植反應)。在具有或不具有淋巴細胞耗竭過程的情況下,例如在使用環磷醯胺的情況下,CAR T細胞治療的給藥可以例如涉及給予106至109個細胞/kg。
在一個實施方式中,可以向經受免疫抑制治療的患者給予該治療。該等細胞或細胞群體可以被製成由於編碼至少一種免疫抑制劑的受體的基因滅活而抵抗此免疫抑制劑。在不受理論約束的情況下,在患者內免疫抑制治療應說明選擇並擴增根據本發明的免疫反應細胞或T細胞。
可以任何常規方式執行根據本發明的細胞或細胞群體的給藥,該等方式包括藉由霧化吸入、注射、攝取、輸血、植入或移植。可以向患者皮下、真皮內、瘤內、節點內、髓內、肌內、藉由靜脈內注射或淋巴管內注射、或者腹膜內給予該等細胞或細胞群體。在一個實施方式中,本發明的細胞組成物較佳的是藉由靜脈內注射來給予。
該等細胞或細胞群體的給予可以由104-109個細胞/kg體重、較佳的是105至106個細胞/kg體重(包括該等範圍內細胞數目的所有整數值)的給予組成。在具有或不具有淋巴細胞耗竭過程的情況下,例如在使用環磷醯胺的情況下,CAR T細胞治療的給藥可以例如涉及給予106至109個細胞/kg。該等細胞或細胞群體可以一個或多個劑量給予。在另一個實施方式中,細胞的有效劑
量係作為單一劑量給予。在另一個實施方式中,細胞的有效劑量係超過一個劑量持續一段時間來給予。給藥的時間係在管理醫生的判斷內並且取決於患者的臨床病狀。該等細胞或細胞群體可以是從任何來源諸如血庫或供體獲得。雖然個體需要不同,但是特定疾病或病狀的給定細胞類型的有效量的最佳範圍的確定係在熟習該項技術者知識內的。有效量意指提供治療或預防益處的量。給予的劑量將取決於接受者的年齡、健康和體重、同期治療(如果有的話)的類型、治療的頻率以及希望的作用性質。
在另一個實施方式中,胃腸外給予有效量的細胞或包含那些細胞的組成物。給藥可以是靜脈內給藥。給藥可以是藉由在腫瘤內注射來直接進行的。
為了防止可能的不良反應,可以用轉基因安全開關裝備工程化免疫反應細胞,該轉基因安全開關係致使該等細胞易於暴露於特定信號的轉基因形式。例如,單純皰疹病毒胸苷激酶(TK)可以這種方式使用,例如藉由在幹細胞移植之後引入到用作供體淋巴細胞輸注的同種異體T淋巴細胞中(格雷科(Greco)等人,使用TK自殺基因提高細胞治療的安全性(Improving the safety of cell therapy with the TK-suicide gene.)藥理學前沿(Front.Pharmacol.)2015;6:95)。在此類細胞中,核苷前藥諸如更昔洛韋或阿昔洛韋的給予引起細胞死亡。替代性安全開關構建體包括誘導型半胱天冬酶9,例如藉由給予使兩個非功能icasp9分子連接在一起形成活性酶的小分子二聚體來觸發。已描述了實施細胞增殖控制的各種各樣的替代方法(參見美國專利公開案號
20130071414;PCT專利公開WO2011146862;PCT專利公開WO2014011987;PCT專利公開WO2013040371;週等人,血液2014,123/25:3895-3905;迪.史塔西(Di Stasi)等人,新英格蘭醫學雜誌2011;365:1673-1683;薩德薩德.M(Sadelain M)等人,新英格蘭醫學雜誌2011;365:1735-173;拉莫斯(Ramos)等人,幹細胞28(6):1107-15(2010))。
在過繼治療的另一個改進方案中,如在此所述的CRISPR-Cas系統進行的基因組編輯可以用於使免疫反應細胞適於替代性實施方案,例如提供編輯的CAR T細胞(參見,白羅(Poirot)等人,2015,用於“現成的”過繼性T細胞免疫反應的多重基因組編輯T細胞製造平臺(Multiplex genome edited T-cell manufacturing platform for "off-the-shelf" adoptive T-cell immunotherapies),癌症研究75(18):3853)。例如,免疫反應細胞可以被編輯為缺失一些或所有類別的HLA II型和/或I型分子的表現,或者敲除可以抑制所希望的免疫反應的選定基因諸如PD1基因。
細胞可以使用如在此所述的任何CRISPR系統及其使用方法來編輯。CRISPR系統可以藉由在此所述的任何方法來遞送到免疫細胞。在較佳的實施方式中,細胞被離體編輯並且轉移到有需要的受試者中。可以編輯免疫反應細胞、CAR T細胞或用於過繼性細胞轉移的任何細胞。編輯可以被進行來消除潛在的同種異體反應性T-細胞受體(TCR)、破壞化學治療劑的靶標、阻斷免疫校驗點、啟動T細胞並且/或者增加功能耗盡或功能障礙的CD8+
T-細胞的分化和/或增殖(參見PCT專利公開:WO2013176915、WO2014059173、WO2014172606、WO2014184744、以及WO2014191128)。編輯可以導致基因滅活。
藉由滅活基因,期望感興趣的基因不以功能蛋白形式表現。在一個特定實施方式中,CRISPR系統特異性催化在一個靶向基因中的切割,從而滅活所述靶基因。引起的核酸股斷裂通常藉由同源重組或非同源末端接合(NHEJ)的不同機制來修復。然而,NHEJ係不完美的修復過程,它常常導致切割位點處的DNA序列改變。藉由非同源末端接合(NHEJ)的修復常常形成小插入或缺失(Indel)並且可以用於創建特定基因敲除。其中發生切割誘導型誘變事件的細胞可以藉由本領域已熟知的方法來鑒定和/或選擇。
T細胞受體(TCR)係響應於抗原呈遞而參與啟動T細胞的細胞表面受體。TCR通常是由組裝形成異源二聚體的兩條股α和β形成,並且與CD3-轉導亞基締合形成存在於細胞表面的T細胞受體複合物。TCR的每條α和β鏈由免疫球蛋白樣N-末端可變區(V)和恒定(C)區、疏水性跨膜結構域、以及短胞質區。如對於免疫球蛋白分子,α和β鏈的可變區係藉由V(D)J重組從而在T細胞群體內形成多種抗原特異性來生成。然而,與識別完整抗原的免疫球蛋白相比,T細胞藉由與MHC分子締合的加工肽片段來啟動,從而將額外維度引入到由T細胞進行的抗原識別中,這被稱為MHC限制。藉由T細胞受體識別供體與受體之間的MHC差異導致T細胞增殖和移植物抗宿主疾病(GVHD)的潛在發展。TCRα或TCRβ的滅
活可以導致TCR從T細胞表面消除,從而阻止了同種抗原的識別並因此產生GVHD。然而,TCR破壞通常導致CD3傳訊組分的消除並且改變其他T細胞擴增的方式。
同種異體細胞被宿主免疫細胞快速排斥。已證明存在於非輻射血液產品中的同種異體淋巴細胞將持續不超過5至6天(博尼,穆拉斯基(Boni,Muranski)等人,2008血液1;112(12):4746-54)。因此,為防止同種異體細胞的排斥,宿主免疫系統通常不得不受到一定程度的抑制。然而,在過繼性細胞轉移的情況下,使用免疫抑制藥物也對引入的治療性T細胞具有有害作用。因此,為了在該等病狀中有效使用過繼性免疫治療方法,引入的細胞將需要抵抗免疫抑制治療。因此,在一個特定實施方式中,本發明進一步包括修飾T細胞較佳的是藉由滅活編碼免疫抑制劑的靶標的至少一種基因以使其抵抗免疫抑制劑的步驟。免疫抑制劑係藉由幾種作用機制之一來抑制免疫功能的藥劑。免疫抑制劑可以是但不限於,鈣調磷酸酶抑制劑、雷帕黴素的靶標、介白素-2受體α-鏈阻斷劑、肌苷單磷酸脫氫酶的抑制劑、二氫葉酸還原酶的抑制劑、皮質類固醇或免疫抑制抗代謝物。本發明允許藉由滅活免疫抑制劑在T細胞中的靶標來對用於免疫治療的T細胞賦予免疫抑制抗性。作為非限制性實例,免疫抑制劑的靶標可以是免疫抑制劑的受體,諸如:CD52、糖皮質激素受體(GR)、FKBP家族基因成員以及親環蛋白家族基因成員。
免疫檢驗點係減慢或停止免疫反應並且防止受到免疫細胞的未控制活性的過度組織損害的抑制途徑。在某些實施方
式中,靶向的免疫檢驗點係程式性死亡-1(PD-1或CD279)基因(PDCD1)。在其他實施方式中,靶向的免疫檢驗點係細胞毒性T-淋巴細胞相關抗原(CTLA-4)。在另外的實施方式中,靶向的免疫檢驗點係CD28和CTLA4 Ig超家族的另一個成員,諸如BTLA、LAG3、ICOS、PDL1或KIR。在另外的實施方式中,靶向的免疫檢驗點係TNFR超家族的成員,諸如CD40、OX40、CD137、GITR、CD27或TIM-3。
另外的免疫檢驗點包括含有Src同源2結構域的蛋白酪胺酸磷酸酶1(SHP-1)(沃森.HA等人,SHP-1:用於癌症免疫治療的下一個檢驗點靶標(SHP-1:the next checkpoint target for cancer immunotherapy)?生物化學學會彙報(Biochem Soc Trans.),2016年4月15日;44(2):356-62)。SHP-1係一種廣泛表現的抑制性蛋白酪胺酸磷酸酶(PTP)。在T細胞中,它係抗原依賴性啟動和增殖的負調節劑。它係一種細胞溶質蛋白,並且因此不適於抗體介導的治療,但是它在啟動和增殖中的作用使得它成為過繼轉移策略中用於遺傳操縱的有吸引力靶標,諸如嵌合抗原受體(CAR)T細胞。免疫檢驗點還可以包括具有Ig和ITIM結構域的T細胞免疫受體(TIGIT/Vstm3/WUCAM/VSIG9)和VISTA(勒.梅西埃.I(Le Mercier I)等人,(2015)除CTLA-4和PD-1之外的第Z代負檢驗點調節劑(Beyond CTLA-4 and PD-1,the generation Z of negative checkpoint regulators)。免疫學前沿6:418)。
WO2014172606涉及使用MT1和/或MT1抑制劑增加耗盡的CD8+ T-細胞的增殖和/或活性並且減少CD8+ T-細胞耗盡
(例如,減少功能耗盡或不反應的CD8+免疫細胞)。在某些實施方式中,在過繼轉移的T細胞中藉由基因編輯靶向金屬硫蛋白。
在某些實施方式中,基因編輯的靶標可以是涉及免疫檢驗點蛋白的表現的至少一個靶向座位。此類靶標可以包括但不限於,CTLA4、PPP2CA、PPP2CB、PTPN6、PTPN22、PDCD1、ICOS(CD278)、PDL1、KIR、LAG3、HAVCR2、BTLA、CD160、TIGIT、CD96、CRTAM、LAIR1、SIGLEC7、SIGLEC9、CD244(2B4)、TNFRSF10B、TNFRSF10A、CASP8、CASP10、CASP3、CASP6、CASP7、FADD、FAS、TGFBRII、TGFRBRI、SMAD2、SMAD3、SMAD4、SMAD10、SKI、SKIL、TGIF1、IL10RA、IL10RB、HMOX2、IL6R、IL6ST、EIF2AK4、CSK、PAG1、SIT1、FOXP3、PRDM1、BATF、VISTA、GUCY1A2、GUCY1A3、GUCY1B2、GUCY1B3、MT1、MT2、CD40、OX40、CD137、GITR、CD27、SHP-1或TIM-3。在較佳的實施方式中,靶向涉及PD-1或CTLA-4基因的表現的基因座位。在其他較佳的實施方式中,靶向基因的組合,諸如但不限於PD-1和TIGIT。
在其他實施方式中,編輯至少兩種基因。基因對可以包括但不限於,PD1和TCRα、PD1和TCRβ、CTLA-4和TCRα、CTLA-4和TCRβ、LAG3和TCRα、LAG3和TCRβ、Tim3和TCRα、Tim3和TCRβ、BTLA和TCRα、BTLA和TCRβ、BY55和TCRα、BY55和TCRβ、TIGIT和TCRα、TIGIT和TCRβ、B7H5和TCRα、B7H5和TCRβ、LAIR1和TCRα、LAIR1和TCRβ、SIGLEC10和TCRα、SIGLEC10和TCRβ、2B4和TCRα、2B4和TCRβ。
無論是在T細胞的遺傳修飾之前還是之後,T細胞都可以通常使用例如以下各項所述的方法來啟動並擴增:美國專利6,352,694;6,534,055;6,905,680;5,858,358;6,887,466;6,905,681;7,144,575;7,232,566;7,175,843;5,883,223;6,905,874;6,797,514;6,867,041;以及7,572,631。該細胞可以在體外或在體內擴增。
除非另外指明,本發明的實施採用處於本領域技能範圍內的免疫學、生物化學、化學、分子生物學、微生物學、細胞生物學、基因組學以及重組DNA的常規技術。參見,分子選殖:實驗手冊,第2版(1989)(薩姆布魯克、弗裡奇和馬尼亞蒂斯);分子選殖:實驗手冊,第4版(2012)(格林和薩姆布魯克);分子生物學通用方法(1987)(F.M.奧蘇貝爾等人編著);系列叢書 酶學方法(學術出版社公司);PCR 2:實踐方法(1995)(M.J..麥克弗森、B.D..黑姆斯以及G.R..泰勒編著);抗體、實驗室手冊(1988)(哈洛和拉內編著);抗體、實驗室手冊,第2版(2013)(E.A..格林菲爾德(E.A.Greenfield)編著);以及動物細胞培養(1987)(R.I.費施奈伊編著)。
除非另外指示,否則本發明的實踐採用用於生成遺傳修飾小鼠的常見技術。參見瑪律滕.H..霍夫卡爾(Marten H.Hofker)和讓.凡.德瑞森(Jan van Deursen),轉基因小鼠方法和方案(TRANSGENIC MOUSE METHODS AND PROTOCOLS),第2版(2011)。
基因驅動
本發明還考慮使用在此所述的CRISPR-Cas系統例如
Cpf1效應蛋白系統來提供RNA指導的基因驅動,例如在與PCT專利公開WO 2015/105928中所述的基因驅動類似的系統中。這種類型的系統可以例如提供用於藉由將編碼RNA指導的DNA核酸酶和一種或多種指導RNA的核酸序列引入到生殖細胞中來改變真核生殖細胞的方法。指導RNA可以被設計為與生殖細胞的基因組DNA上的一個或多個靶位置互補。編碼RNA指導的DNA核酸酶的核酸序列和編碼指導RNA的核酸序列可以被提供在構建體上的側翼序列之間,其中啟動子被安排為使得生殖細胞可以表現RNA指導的DNA核酸酶和指導RNA,連同也位於側翼序列之間的任何希望的貨物編碼序列。側翼序列將典型地包括與選定的靶染色體上的相應序列相同的序列,以使得側翼序列與由該構建體編碼的元件一起作用,以促進外源核酸構建體序列藉由諸如同源重組的機制插入到基因組DNA中,以致使生殖細胞對於外源核酸序列係純合的。以這種方式,基因驅動系統能夠使希望的貨物基因滲入到整個育種群體中(甘茨(Gantz)等人,2015,用於群體修飾瘧疾載體蚊子斯氏按蚊的高效Cas9-介導的基因驅動(Highly efficient Cas9-mediated gene drive for population modification of the malaria vector mosquito Anopheles stephensi),美國國家科學院院刊2015,2015年11月23日先於印刷版公開,doi:10.1073/pnas.1521077112;厄斯維特(Esvelt)等人,2014,關於用於改變野生群體的RNA指導的基因驅動(Concerning RNA-guided gene drives for the alteration of wild populations)eLife 2014;3:e03401)。在選擇的實施方式中,可以選擇在基因組中具有幾個潛在脫靶位點的靶序列。使用多個指導RNA靶向靶座位內的多個位點可以增加切割頻率並且阻礙驅
動抵抗對偶基因的進化。截短的指導RNA可以減少脫靶切割。可以使用成對的切口酶代替核酸酶來進一步增加特異性。基因驅動構建體可以包括編碼轉錄調節劑的貨物序列,例如以啟動同源重組基因並且/或者阻遏非同源末端接合。靶位點可以在必需基因內選擇,以使得非同源末端接合事件可以引起致死性而不是形成驅動抵抗的對偶基因。基因驅動構建體可以被工程化為在一系列溫度下在一系列宿主中起作用(給(Cho)等人,2013,使用小分子快速且可調地控制秀麗隱桿線蟲中的蛋白質穩定性(Rapid and Tunable Control of Protein Stability in Caenorhabditis elegans Using a Small Molecule),公共科學圖書館綜合8(8):e72393.doi:10.1371/journal.pone.0072393)。
異種移植
本發明還考慮使用在此所述的CRISPR-Cas系統例如Cpf1效應蛋白系統來提供RNA指導的DNA核酸酶,該核酸酶適於用於提供用於移植的修飾組織。例如,RNA指導的DNA核酸酶可以用於例如藉由破壞編碼由人類免疫系統識別的表位的基因(即異種抗原基因)的表現來敲除、敲低或破壞動物諸如轉基因豬(諸如人類血紅素加氧酶-1轉基因豬系列)中的選定基因。用於破壞的候選豬基因可以例如包括α(1,3)-半乳糖基轉移酶和單磷酸胞苷-N-乙醯神經胺酸羥化酶基因(參見PCT專利公開WO 2014/066505)。此外,可以破壞編碼內源性逆轉錄病毒的基因,例如編碼所有豬內源性逆轉錄病毒的基因(參見楊等人,2015,豬內源性逆轉錄病毒(PERV)的全基因組滅活(Genome-wide inactivation of porcine
endogenous retroviruses(PERVs)),科學,2015年11月27日:第350卷,第6264期,第1101-1104頁)。此外,RNA-指導的DNA核酸酶可以用於靶向一個位點,以用於整合異種移植供體動物中的額外基因諸如人類CD55基因,以提高防止超急排斥。
一般基因治療考慮因素
疾病相關基因和多核苷酸的實例和疾病特定資訊係從麥考斯克-南森遺傳醫學研究所(McKusick-Nathans Institute of Genetic Medicine)、約翰霍普金斯大學(馬里蘭州巴爾的摩)(Johns Hopkins University(Baltimore,Md.))和國家生物技術資訊中心(National Center for Biotechnology Information)、國家醫學圖書館(馬里蘭州貝塞斯達)(National Library of Medicine(Bethesda,Md.))可獲得的,在世界互聯網上可獲得的。
該等基因和途徑中的突變可能導致產生影響功能的不適當蛋白質或不適當量的蛋白質。來自2012年12月12日提交的美國臨時申請61/736,527的基因、疾病和蛋白質的另外實例藉由引用結合在此。此類基因、蛋白質和途徑可以是本發明的CRISPR複合物的靶多核苷酸。疾病相關基因和多核苷酸的實例列出在表A和表B中。傳訊生物化學途徑相關基因和多核苷酸的實例列出在表C中。
本發明的實施方式還涉及牽涉敲除基因、擴增基因並修復與DNA重複序列不穩定性和神經病症相關聯的特定突變的方法和組成物(羅伯特.D..威爾斯、鐵雄蘆沢(Tetsuo Ashizawa),基因不穩定性和神經疾病(Genetic Instabilities and Neurological Diseases),第二版,學術出版社,2011年10月13日-醫學
(Medical))。已發現串聯重複序列的特定方面係超過二十種人類疾病的原因(重複序列不穩定性的新觀點:RNA‧DNA雜交體的作用(New insights into repeat instability:role of RNA.DNA hybrids)。麥基弗.EI(McIvor EI)、波拉克.U(Polak U)、納皮爾拉拉.M(Napierala M.),RNA生物學(RNA Biol.),2010年9月-10月;7(5):551-8)。本發明效應蛋白系統可以用於校正基因組不穩定性的該等缺陷。
本發明的幾個其他方面涉及校正與廣泛範圍的遺傳疾病相關聯的缺陷,該等疾病在國立衛生研究院(National Institutes of Health)網站上的主題小節遺傳病症下進一步描述(網址係在health.nih.gov/topic/GeneticDisorders)。遺傳性腦病可以包括但不限於,腎上腺腦白質營養不良、胼胝體發育不全、艾卡爾迪綜合症、阿爾珀斯病、阿耳茨海默病、巴斯綜合症、貝敦氏病、CADASIL、小腦變性、法布裡病、格-施-沙病(Gerstmann-Straussler-Scheinker Disease)、杭丁頓氏症、以及其他三聯體重複序列病症、利氏病、萊施-奈恩綜合症、門克斯病、線粒體肌病以及NINDS空洞腦。該等疾病在國立衛生研究院網站上的小節遺傳性腦部病症下進一步描述。
Cas9發展和使用
本發明可以基於以下文獻中列出的CRISPR-Cas9發展和使用的方面來說明和擴展,並且特別是涉及細胞和生物體中的CRISPR蛋白複合物的遞送和RNA指導內切核酸酶的使用:
使用CRISPR/Cas系統的多重基因組工程化(Multiplex
genome engineering using CRISPR/Cas systems)。叢,L.(Cong,L.)、拉恩,F.A.(Ran,F.A.)、科克斯,D.(Cox,D.)、林,S.、巴雷德,R.(Barretto,R.)、哈比蔔,N.(Habib,N.)、徐,P.D.、吳,X.、蔣,W.、馬拉非尼,L.A.(Marraffini,L.A.)、以及張,F.,科學,2月15日;339(6121):819-23(2013);
使用CRISPR-Cas對細菌基因組進行RNA指導編輯。蔣.W.、畢卡德.D(Bikard D.)、科克斯.D.、張.F、馬拉非尼.L.A.自然生物技術,3月;31(3):233-9(2013);
藉由CRISPR/Cas介導的基因組工程化來一步生成攜帶多基因中的突變的小鼠(One-Step Generation of Mice Carrying Mutations in Multiple Genes by CRISPR/Cas-Mediated Genome Engineering)。王.H.、楊.H.、希瓦里拉.CS.(Shivalila CS.)、道拉提.MM.(Dawlaty MM.)、成.AW.、張.F.、耶尼施.R(Jaenisch R.),細胞,5月9日;153(4):910-8(2013);
哺乳動物內源性轉錄和外遺傳狀態的光控制(Optical control of mammalian endogenous transcription and epigenetic states)。康爾曼.S、布裡格姆.MD(Brigham MD)、特雷維諾.AE(Trevino AE)、徐.PD、海頓裡希.M(Heidenreich M)、叢.L、普萊特.RJ(Platt RJ)、斯科特.DA、丘奇.GM、張.F,自然8月22日;500(7463):472-6.doi:10.1038/Nature12466.電子版2013年8月23日(2013);
用於增強基因組編輯特異性的RNA指導的CRISPR Cas9的雙重切口(Double Nicking by RNA-Guided CRISPR Cas9 for
Enhanced Genome Editing Specificity)。拉恩,FA.、徐,PD.、林,CY.、根特柏格,JS.(Gootenberg,JS.)、康爾曼,S.、特雷維諾,AE.、斯科特,DA.、井上,A.(Inoue,A.)、的場,S.(Matoba,S.)、張,Y.、以及張,F.,細胞,8月28日.pii:S0092-8674(13)01015-5(2013-A);
靶向RNA-指導的Cas9核酸酶的特異性的DNA(DNA targeting specificity of RNA-guided Cas9 nucleases)。徐,P.、斯科特,D.、溫斯坦,J.、拉恩,FA.、康爾曼,S.、瓦拉,V.、李,Y.、法恩,E.、吳,X.、謝萊姆,O.、科瑞迪克,TJ.、瑪律拉菲尼,LA.、包,G.、以及張,F.,自然生物技術doi:10.1038/nbt.2647(2013);
使用CRISPR-Cas9系統的基因組工程化(Genome engineering using the CRISPR-Cas9 system)。拉恩,FA.、徐,PD.、賴特,J.、瓦拉,V.、斯科特,DA.、張,F.,自然實驗手冊,11月;8(11):2281-308(2013-B);
人類細胞中的基因組規模的CRISPR-Cas9敲除篩選。沙萊姆,O.、珊亞納,NE.、哈特諾斯,E.、石,X.、斯科特,DA.、邁克爾森,T.、赫克爾,D.、埃伯特,BL.、羅特,DE.、多恩奇,JG.、張,F.,科學,12月12日(2013)。[電子版先於印刷版];
與指導RNA和靶向RNA複合的cas9的晶體結構(Crystal structure of cas9 in complex with guide RNA and target DNA)。西松,H.(ishimasu,H.)、拉恩,FA.、徐,PD.、康爾曼,S.、舍哈塔,SI.(Shehata,SI.)、多哈曼,N(Dohmae,N.)、石穀,R.(shitani,R.)、張,F.、Nureki,O.,細胞,2月27日,156(5):935-49(2014);
哺乳動物細胞中CRISPR內切核酸酶Cas9的全基因組結合吳.X.、斯科特.DA.、克裡茨.AJ.(Kriz AJ.)、邱.AC.、徐.PD.、達頓.DB(Dadon DB.)、成.AW.、特雷維諾.AE.、康爾曼.S.、陳.S.、耶尼施.R.、張.F.、夏普.PA.自然生物技術4月20日doi:10.1038/nbt.2889(2014);
用於基因組編輯和癌症建模的CRISPR-Cas9敲入小鼠(CRISPR-Cas9 Knockin Mice for Genome Editing and Cancer Modeling)。普萊特.RJ、陳.S、週.Y、嚴.MJ(Yim MJ)、斯維奇.L(Swiech L)、肯普頓.HR(Kempton HR)、達爾曼.JE(Dahlman JE)、帕納斯.O(Parnas O)、艾森哈爾.TM(Eisenhaure TM)、約瓦諾維奇.M(Jovanovic M)、格雷厄姆.DB(Graham DB)、卷卷瓦拉.S(Jhunjhunwala S)、海頓裡希.M、賽維爾.RJ(Xavier RJ)、朗格.R、安德森.DG、哈科恩.N(Hacohen N)、雷格夫.A(Regev A)、馮.G、夏普.PA、張.F,細胞159(2):440-455 DOI:10.1016/j.cell.2014.09.014(2014);
用基因組工程化的CRISPR-Cas9的發展和應用(Development and Applications of CRISPR-Cas9 for Genome Engineering),徐.PD、朗格.ES、張.F.,細胞6月5日;157(6):1262-78(2014)。
使用CRISPR/Cas9系統的人類細胞的遺傳篩選(Genetic screens in human cells using the CRISPR/Cas9 system),王.T、魏.JJ、薩巴蒂尼.DM(Sabatini DM)、朗格.ES.,科學,1月3日;343(6166):80-84.doi:10.1126/science.1246981(2014);
用於CRISPR-Cas9-介導的基因滅活的高活性sgRNA的合理設計(Rational design of highly active sgRNAs for CRISPR-Cas9-mediated gene inactivation),多恩奇.JG、哈特諾斯.E、格雷厄姆.DB、托特瓦.Z(Tothova Z)、赫格德.M(Hegde M)、史密斯.I、蘇倫德.M(Sullender M)、埃伯特.BL、賽維爾.RJ、羅特.DE..(2014年9月3日線上公開)自然生物技術12月;32(12):1262-7(2014);
使用CRISPR-Cas9體內探察哺乳動物大腦的基因功能(In vivo interrogation of gene function in the mammalian brain using CRISPR-Cas9),斯維奇.L、海頓裡希.M、海頓裡希.A(Banerjee A)、哈比卜.N、李.Y、特龍貝塔.J(Trombetta J)、蘇爾.M(Sur M)、張.F.,(2014年10月19日線上公開)自然生物技術1月;33(1):102-6(2015);
藉由工程化CRISPR-Cas9複合物進行基因組規模的轉錄啟動(Genome-scale transcriptional activation by an engineered CRISPR-Cas9 complex),康爾曼.S、布裡格姆.MD、特雷維諾.AE、薑俊.J、阿布德耶爾.OO(Abudayyeh OO)、巴爾塞納.C(Barcena C)、徐.PD、哈比蔔.N、根特柏格.JS、西松.H、Nureki O、張.F.,自然1月29日;517(7536):583-8(2015)。
用於誘導型基因組編輯和轉錄調節的拆分Cas9體系結構(A split-Cas9 architecture for inducible genome editing and transcription modulation),蔡徹.B(Zetsche B)、沃爾茲.SE(Volz SE)、張.F.,(2015年2月02日線上公開)自然生物技術2月;33(2):139-42(2015);
腫瘤生長和轉移的小鼠模型中的全基因組CRISPR篩選(Genome-wide CRISPR Screen in a Mouse Model of Tumor Growth and Metastasis),陳.S、珊亞納.NE、鄭.K、沙萊姆.O、李.K、石.X、斯科特.DA、宋.J、潘.JQ、韋斯萊德爾.R(Weissleder R)、李.H、張.F、夏普.PA,細胞160,1246-1260,2015年3月12日(小鼠中的多重篩選),以及
使用金黃色葡萄球菌Cas9的體內基因組編輯(In vivo genome editing using Staphylococcus aureus Cas9),拉恩.FA.、宋.L、嚴.WX、斯科特.DA,根特柏格.JS、克裡茨.AJ、蔡徹.B、沙萊姆.O、吳.X、馬卡洛夫.KS、庫尼恩.EV、夏普.PA、張.F.,(2015年4月01日線上公開),自然,4月9日;520(7546):186-91(2015)。
沙萊姆等人,“使用CRISPR-Cas9的高通量功能基因組學(High-throughput functional genomics using CRISPR-Cas9)”,遺傳學自然評論(Nature Reviews Genetics)16,299-311(2015年5月)。
許等人,“改進的CRISPR sgRNA設計的序列決定簇(Sequence determinants of improved CRISPR sgRNA design)”,基因組研究25,1147-1157(2015年8月)。
帕納斯等人,“在原代免疫細胞解剖調節網路的全基因組CRISPR篩選(A Genome-wide CRISPR Screen in Primary Immune Cells to Dissect Regulatory Networks)”,細胞162,675-686(2015年7月30日)。
拉曼那等人,“病毒DNA的CRISPR/Cas9分割有效抑制了乙型肝炎病毒(CRISPR/Cas9 cleavage of viral DNA efficiently suppresses hepatitis B virus)”,科技報告5:10833.doi:10.1038/srep10833(2015年6月2日)
西松等人,“金黃色葡萄球菌Cas9的晶體結構(Crystal Structure of Staphylococcus aureus Cas9)”,細胞162,1113-1126(2015年8月27日)
藉由Cas9-誘導的原位飽和誘變進行BCL11A增強子分割,康維爾等人,自然527(7577):192-7(2015年11月12日)doi:10.1038/nature15521.電子版2015年9月16日。
Cpf1係第2類CRISPR-Cas系統的單一RNA指導的內切核酸酶(Cpf1 Is a Single RNA-Guided Endonuclease of a Class 2 CRISPR-Cas System),蔡徹等人,細胞163,759-71(2015年9月25日)。
不同的第2類CRISPR-Cas系統的發現和功能表征(Discovery and Functional Characterization of Diverse Class 2 CRISPR-Cas Systems),什馬科夫等人,分子細胞,60(3),385-397doi:10.1016/j.molcel.2015.10.008電子版2015年10月22日。
具有提高的特異性的合理工程化的Cas9核酸酶(Rationally engineered Cas9 nucleases with improved specificity),斯萊馬克爾等人,科學,2016年1月1日351(6268):84-88 doi:10.1126/science.aad5227.電子版2015年12月1日。[電子版先於
印刷版]。
該等文獻各自藉由引用結合在此,它們可以被考慮用於實踐本發明,並且如以下簡要討論的:
叢等人基於嗜熱鏈球菌Cas9並且還基於釀膿鏈球菌Cas9來工程化用於真核細胞的II型CRISPR-Cas系統,並且證明Cas9核酸酶可以藉由短RNA來指導以誘導人類和小鼠細胞中的精確DNA切割。他們的研究顯示Cas9在轉化成切口酶後可以用於促進具有最小誘變活性的真核細胞中的同源定向修復。另外,他們的研究證實多個指導序列可以被編碼成單一CRISPR陣列,以使得能夠在哺乳動物基因組內的多個內源性基因組座位位點處同時進行編輯,這證明RNA指導的核酸酶技術的容易可程式設計性和廣泛適用性。使用RNA程式設計細胞內的序列特異性DNA切割的這種能力限定了一類新的基因組工程化工具。該等研究進一步顯示其他CRISPR作為可能可移植到哺乳動物細胞中並且也可以介導哺乳動物基因組切割。重要的是,可以設想CRISPR-Cas系統的幾個方面可以被進一步改進以增加其效率和多功能性。
蔣等人使用與雙RNA複合的成簇的、規律間隔的、短迴文重複序列(CRISPR)相關Cas9內切核酸酶,在肺炎鏈球菌和大腸桿菌的基因組中引入精確突變。該方法依賴於靶基因組位點處的雙-RNA:Cas9-引導的切割以殺死未突變細胞,並且不再需要選擇標記物或反選擇系統。該研究報導了藉由改變短CRISPR RNA(crRNA)的序列以形成編輯模板上攜帶的單個核苷酸或多個核苷酸來重新程式設計雙RNA:Cas9特異性。該研究顯示同時使用
兩個crRNA能夠進行多重誘變。另外,當該方法與重組組合使用時,在肺炎鏈球菌中幾乎100%使用所述方法恢復的細胞含有希望的突變,並且在大腸桿菌中65%恢復的細胞含有該突變。
王等人(2013)使用用於一步生成攜帶多基因中的突變的小鼠的CRISPR-Cas系統,該等突變通常是在多個步驟中藉由在胚胎幹細胞中連續重組和/或具有單個突變的小鼠的耗時互交來生成的。CRISPR-Cas系統將極大地加速功能冗余基因和上位基因相互作用的體內研究。
康爾曼等人(2013)解決了本領域中對於通用和穩健技術的需要,該等技術使得能夠光學和化學調節基於DNA結合結構域的CRISPR Cas9酶並且還調節轉錄啟動物樣效應物。
拉恩等人(2013-A)描述了將Cas9切口酶突變體與成對的指導RNA組合以引入靶向雙股斷裂之方法。這解決了來自微生物CRISPR-Cas系統的Cas9核酸酶藉由指導序列被靶向特異性基因組座位的問題,該等指導序列可以耐受與DNA靶標的某些錯配並且因此促成不希望的脫靶誘變。因為基因組中的個別切口以高保真度修復,因此經由適當偏移的指導RNA進行同時切口對於雙股斷裂係需要的並且擴大了用於靶向切割的特異性識別的鹼基數目。作者們證實使用成對切口可以在細胞系中減少50倍至1,500倍的脫靶活性並且促進小鼠受精卵中的基因敲除,而不用犧牲中靶切割效率。此通用策略使得能夠進行需要高特異性的各種各樣的基因組編輯應用。
徐等人(2013)表徵了人類細胞中的SpCas9靶向特異性,
以告知靶位點的選擇並避免脫靶效應。該研究評價了>700種指導RNA變體和293T和293FT細胞中>100個預測的基因組脫靶座位處的SpCas9誘導型indel突變水平。作者們指示SpCas9以序列依賴性方式容忍指導RNA與靶DNA之間的不同位置處的錯配,對錯配的數目、位置和分佈敏感。作者們進一步證實SpCas9-介導的切割未受到DNA甲基化的影響並且SpCas9和gRNA的劑量可以被滴定來最小化脫靶修飾。另外,為了促進哺乳動物基因組工程化應用,作者們的報導提供了一種指導靶序列的選擇和驗證以及脫靶分析的基於網路的軟體工具。
拉恩等人(2013-B)描述了一組用於在哺乳動物細胞中經由非同源末端接合(NHEJ)或同源定向修復(HDR)進行Cas9介導的基因組編輯以及生成用於下游功能研究的修飾的細胞系的工具。為了最小化脫靶切割,作者們進一步描述一種使用具有成對指導RNA的Cas9切口酶的雙切口策略。該等作者們提供的方案在實驗上推導了用於選擇靶位點、評價切割效率並分析脫靶活性的準則。該等研究顯示以靶向設計開始,基因修飾可以在僅僅1-2週內實現,並且修飾的選殖細胞系可以在2-3週內得到。
沙萊姆等人描述了探察全基因組規模的基因功能的新方式。他們的研究顯示具有64,751個獨特指導序列的基因組規模的CRISPR-Cas9敲除(GeCKO)文庫靶向的18,080個基因的遞送能夠在人類細胞中進行陰性和陽性選擇篩選。首先,作者們證實使用GeCKO文庫鑒定了癌症和多能幹細胞中的細胞活力所必須的基因。接著,在黑色素瘤模型中,作者們篩選其喪失涉及對維羅非
尼(抑制蛋白激酶BRAF的治療劑)的抗性的基因。他們的研究顯示最高評級的候選物包括先前驗證的基因NF1和MED12以及新型命中基因NF2、CUL3、TADA2B、以及TADA1。作者們在靶向相同基因的獨立的指導RNA與高命中確認率之間觀察到高水平的一致性,並且因此證實允許用Cas9進行基因組規模篩選。
西松等人報導了與sgRNA複合的釀膿鏈球菌Cas9的晶體結構以及其在2.5A°解析度下的靶DNA。該結構揭示了由靶向識別和核酸酶裂片(lobe)組成的二裂片體系結構,在其介面處帶正電荷的溝中提供sgRNA:DNA異源雙股核酸分子。識別裂片對於結合sgRNA和DNA係必需的,而核酸酶裂片含有HNH和RuvC核酸酶結構域,該等結構域被適當地定位來分別切割靶DNA的互補股和非互補股。核酸酶裂片還含有負責與原型間隔區相鄰模體(PAM)相互作用的羧基末端結構域。此高分辨結構和伴隨的功能分析已揭示了藉由Cas9進行的RNA指導的DNA靶向的分子機制,從而為新的通用型基因組編輯技術的合理設計做準備。
吳等人由裝載有小鼠胚胎幹細胞(mESC)中的單一指導RNA(sgRNA)的釀膿鏈球菌繪製無催化活性Cas9(dCas9)的全基因組結合位點。作者們證實四種測試的sgRNA各自使得dCas9靶向幾十個與幾千個之間的基因組位點,頻繁地表徵為sgRNA和NGG原型間隔區相鄰模體(PAM)中的5-核苷酸種子區。染色質難接近性減少了dCas9與具有匹配的種子序列的其他位點的結合;因此70%脫靶位點與基因相關聯。作者們證實在用催化活性的Cas9轉染的mESC中295 dCas9結合位點的靶向定序鑒定了在背景水平
上突變的僅一個位點。作者們提出用於Cas9結合和切割的兩階段模型,其中種子匹配觸發結合但擴大的與靶DNA的配對對於切割是需要的。
普萊特等人建立了Cre-依賴性Cas9敲入小鼠。作者們證實了使用神經元、免疫細胞和內皮細胞中的指導RNA的腺相關病毒(AAV)、慢病毒或粒子介導的遞送進行的體內以及離體基因組編輯。
徐等人(2014)係大體上討論了CRISPR-Cas9從酸乳到基因組編輯的歷史(包括細胞遺傳篩選)的評論性文章。
王等人(2014)涉及適用於使用基因組規模的慢病毒單一指導RNA(sgRNA)文庫的陽性選擇和陰性選擇的合併的失功能遺傳篩選方法。
多恩奇等人創建了sgRNA庫,鋪在一組六種內源性小鼠基因和三種內源性人類基因的所有可能的靶位點上,並且藉由抗體染色和流式細胞術定量評定它們產生靶基因的無效對偶基因的能力。作者們證實PAM的優化提高活性並且也提高一組用於設計sgRNA的線上工具。
斯維奇等人證實AAV介導的SpCas9基因組編輯可以能夠進行大腦中的基因功能的反向遺傳學研究。
康爾曼等人(2015)討論了在使用或不使用接頭的情況下將多個效應物結構域例如轉錄啟動物、功能和表觀基因組調節物附接在指導序列諸如莖環或四核苷酸環上的適當位置處的能力。
蔡徹等人證實Cas9酶可以拆分成兩個並且因此可以控制用於啟動的Cas9的組裝。
陳等人涉及藉由證實小鼠全基因組體內CRISPR-Cas9篩選揭示了基因調節肺部轉移來進行多重篩選。
拉恩等人(2015)涉及SaCas9以及其編輯基因組的能力並且證實不能從生物化學測定外推。
沙萊姆等人(2015)描述其中無催化活性Cas9(dCas9)融合物用於在合成上阻遏(CRISPRi)或啟動(CRISPRa)表現,從而顯示使用基因組規模的篩選的Cas9的進展的方式,該等篩選包括排列和合併的篩選、滅活基因組座位的敲除方法以及調節轉錄活性的策略。
許等人(2015)評定了有助於基於CRISPR的篩選的單一指導RNA(sgRNA)效率的DNA序列特徵。作者們探尋了CRISPR/Cas9敲除的效率和切割位點處的核苷酸偏好。作者們還發現CRISPRi/a的序列偏好基本上不同於CRISPR/Cas9敲除的序列偏好。
帕納斯等人(2015)將全基因組合並的CRISPR-Cas9文庫引入到樹突細胞(DC)中,以鑒定控制細菌性脂多糖(LPS)對腫瘤壞死因子(Tnf)的誘導。鑒定Tlr4傳訊的已知調節劑和先前未知的候選物並且將其分成對於對LPS的正則反應具有不同作用的三種功能模組。
拉曼那等人(2015)證實了感染細胞中的病毒附加體DNA
(cccDNA)的切割。HBV基因組在感染的肝細胞的核中作為稱為共價閉環DNA(cccDNA)的3.2kb雙股附加型DNA種類存在,該共價閉環DNA係在HBV生命週期中其複製不受當前治療的抑制的關鍵性組分。作者們證實特異性靶向HBV的高度保守區的sgRNA強烈抑制了病毒複製和缺失的cccDNA。
西松等人(2015)報導了與單一指導RNA(sgRNA)及其雙股DNA靶標複合的SaCas9的晶體結構,該單一指導RNA含有5'-TTGAAT-3' PAM和5'-TTGGGT-3' PAM。SaCas9與SpCas9的結構比較突出顯示了結構保守性和趨異性,這解釋了它們不同的PAM特異性和直源sgRNA識別。
康維爾等人(2015)證實基於CRISPR-Cas9的非編碼基因組元件的功能研究。作者們開發了進行人類和小鼠BCL11A增強子的原位飽和誘變的合併的CRISPR-Cas9指導RNA文庫,這揭示了該等增強子的關鍵性特徵。
蔡徹等人(2015)報導了來自新殺手法蘭西斯菌U112的、具有不同於Cas9的特徵的第2類CRISPR核酸酶Cpt1的表徵。Cpf1係一種缺乏tracrRNA的單一RNA指導的內切核酸酶,它利用T富集的原型間隔區相鄰模體,並且經由交錯雙股斷裂來切割DNA。
什馬科夫等人(2015)報導了三種不同的第2類CRISPR-Cas系統。兩種系統性CRISPR酶(C2c1和C2c3)含有與Cpf1相關性較遠的RuvC樣內切核酸酶結構域。不同於Cpf1,C2c1取決於用於DNA切割的crRNA和tracrRNA。第三種酶(C2c2)含有兩個預測的HEPN RNA酶結構域並且係tracrRNA獨立的。
斯萊馬克爾等人(2016)報導了使用結構指導的蛋白質工程化來提高釀膿鏈球菌Cas9(SpCas9)的特異性。作者們開發了維持強勁的中靶切割同時具有減小的脫靶效應的“特異性增強”的SpCas9(eSpCas9)變體。
同樣地,“用於高特異性基因組編輯的二聚CRISPR RNA指導FokI核酸酶”,盛達爾.Q..蔡、尼古拉斯.維肯恩、采德.凱特爾、詹尼弗.A..福登布、維沙爾.撒帕爾、迪派克.雷恩、馬修.J..古德溫、馬丁.J..阿裡耶、J..基斯.姜俊,自然生物技術32(6):569-77(2014),涉及在人類細胞中識別擴展序列並以高效率編輯內源性基因的二聚RNA指導FokI核酸酶。
美國專利案號8,697,359、8,771,945、8,795,965、8,865,406、8,871,445、8,889,356、8,889,418、8,895,308、8,906,616、8,932,814、8,945,839、8,993,233以及8,999,641;美國專利公開2014-0310830(美國申請案序號14/105,031)、US 2014-0287938 A1(美國申請案序號14/213,991)、US 2014-0273234 A1(美國申請案序號14/293,674)、US2014-0273232 A1(美國申請案序號14/290,575)、US 2014-0273231(美國申請案序號14/259,420)、US 2014-0256046 A1(美國申請案序號14/226,274)、US 2014-0248702 A1(美國申請案序號14/258,458)、US 2014-0242700 A1(美國申請案序號14/222,930)、US 2014-0242699 A1(美國申請案序號14/183,512)、US 2014-0242664 A1(美國申請案序號14/104,990)、US 2014-0234972 A1(美國申請案序號14/183,471)、US 2014-0227787 A1(美國申請案序號14/256,912)、US 2014-0189896 A1(美國申請
案序號14/105,035)、US 2014-0186958(美國申請案序號14/105,017)、US 2014-0186919 A1(美國申請案序號14/104,977)、US 2014-0186843 A1(美國申請案序號14/104,900)、US 2014-0179770 A1(美國申請案序號14/104,837)以及US 2014-0179006 A1(美國申請案序號14/183,486)、US 2014-0170753(美國申請案序號14/183,429);US 2015-0184139(美國申請案序號14/324,960);14/054,414,歐洲專利申請EP 2 771 468(EP13818570.7)EP 2 764 103(EP13824232.6)、以及EP 2 784 162(EP14170383.5);以及PCT專利公開WO 2014/093661(PCT/US2013/074743)、WO 2014/093694(PCT/US2013/074790)、WO 2014/093595(PCT/US2013/074611)、WO 2014/093718(PCT/US2013/074825)、WO 2014/093709(PCT/US2013/074812)、WO 2014/093622(PCT/US2013/074667)、WO 2014/093635(PCT/US2013/074691)、WO 2014/093655(PCT/US2013/074736)、WO 2014/093712(PCT/US2013/074819)、WO 2014/093701(PCT/US2013/074800)、WO 2014/018423(PCT/US2013/051418)、WO 2014/204723(PCT/US2014/041790)、WO 2014/204724(PCT/US2014/041800)、WO 2014/204725(PCT/US2014/041803)、WO 2014/204726(PCT/US2014/041804)、WO 2014/204727(PCT/US2014/041806)、WO 2014/204728(PCT/US2014/041808)、WO 2014/204729(PCT/US2014/041809)、WO 2015/089351(PCT/US2014/069897)、WO 2015/089354(PCT/US2014/069902)、WO 2015/089364(PCT/US2014/069925)、WO 2015/089427(PCT/US2014/070068)、WO 2015/089462(PCT/US2014/070127)、WO 2015/089419
(PCT/US2014/070057)、WO 2015/089465(PCT/US2014/070135)、WO 2015/089486(PCT/US2014/070175)、PCT/US2015/051691、PCT/US2015/051830。還參考美國臨時專利申請61/758,468;61/802,174;61/806,375;61/814,263;61/819,803和61/828,130,它們分別在2013年1月30日;2013年3月15日;2013年3月28日;2013年4月20日;2013年5月6日以及2013年5月28日提交。還參考在2013年6月17日提交的美國臨時專利申請61/836,123。還另外參考美國臨時專利申請61/835,931、61/835,936、61/835,973、61/836,080、61/836,101、以及61/836,127,該等專利各自在2013年6月17日提交。還參考2013年8月5日提交的美國臨時專利申請61/862,468和61/862,355;在2013年8月28日提交的61/871,301;在2013年9月25日提交的61/960,777以及2013年10月28日提交的61/961,980。進一步參考:在2014年10月28日提交的PCT/US2014/62558,以及美國臨時專利申請案序號:各自在2013年12月12日提交的61/915,148、61/915,150、61/915,153、61/915,203、61/915,251、61/915,301、61/915,267、61/915,260、and 61/915,397;在2013年1月29日和2013年2月25日提交的61/757,972和61/768,959;二者均在2014年6月11日提交的62/010,888和62/010,879;各自在2014年6月10日提交的62/010,329、62/010,439和62/010,441;各自在2014年2月12日提交的61/939,228和61/939,242;在2014年4月15日提交的61/980,012;在2014年8月17日提交的62/038,358;各自在2014年9月25日提交的62/055,484、62/055,460和62/055,487;以及在2014年10月27日提交的62/069,243。參考指定尤其是美國的2014年6月10日提交的申請案號PCT/US14/41806的PCT申請。參考2014年1月22日提交的美國
臨時專利申請61/930,214。參考指定尤其是美國的2014年6月10日提交的申請案號PCT/US14/41806的PCT申請。
還參考2015年6月17日的美國申請62/180,709,保護性指導RNA(PGRNA)(PROTECTED GUIDE RNAS(PGRNAS));2014年12月12日提交的美國申請62/091,455,保護性指導RNA(PGRNA);2014年12月24日提交的美國申請62/096,708,保護性指導RNA(PGRNA);2014年12月12日的美國申請62/091,462、2014年12月23日的62/096,324、2015年6月17日的62/180,681、以及2015年10月5日的62/237,496,用於CRISPR轉錄因子的無效指導序列(DEAD GUIDES FOR CRISPR TRANSCRIPTION FACTORS);2014年12月12日的美國申請62/091,456和2015年6月17日的62/180,692,用於CRISPR-CAS系統的護送指導序列和功能化指導序列(ESCORTED AND FUNCTIONALIZED GUIDES FOR CRISPR-CAS SYSTEMS);2014年12月12日的美國申請62/091,461,用於關於造血幹細胞(HSC)的基因組編輯的CRISPR-CAS系統和組成物的遞送、使用和治療性應用(DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR GENOME EDITING AS TO HEMATOPOETIC STEM CELLS(HSCs));2014年12月19日的美國申請62/094,903,藉由基因組規格的插入物捕獲定序來無偏地鑒定雙股斷裂和基因組重新排列(UNBIASED IDENTIFICATION OF DOUBLE-STRAND BREAKS AND GENOMIC REARRANGEMENT BY GENOME-WISE INSERT CAPTURE SEQUENCING);2014年12月24日的美國申請62/096,761,用於序列操縱的系統、方法和最
佳酶和指導支架的工程化(ENGINEERING OF SYSTEMS,METHODS AND OPTIMIZED ENZYME AND GUIDE SCAFFOLDS FOR SEQUENCE MANIPULATION);2014年12月30日的美國申請62/098,059、2015年6月18日的62/181,641、以及2015年6月18日的62/181,667,RNA靶向系統(RNA-TARGETING SYSTEM);2014年12月24日的美國申請62/096,656和2015年6月17日的62/181,151,具有不穩定結構域或與該結構域締合的CRISPR(CRISPR HAVING OR ASSOCIATED WITH DESTABILIZATION DOMAINS);2014年12月24日的美國申請62/096,697,具有AAV或與該AAV締合的CRISPR(CRISPR HAVING OR ASSOCIATED WITH AAV);2014年12月30日的美國申請62/098,158,工程化CRISPR複合物插入的靶向系統(ENGINEERED CRISPR COMPLEX INSERTIONAL TARGETING SYSTEMS);2015年4月22日的美國申請62/151,052,用於細胞外外來體報導的細胞靶向(CELLULAR TARGETING FOR EXTRACELLULAR EXOSOMAL REPORTING);2014年9月24日的美國申請62/054,490,用於使用粒子遞送組成物靶向病症和疾病的CRISPR-CAS系統和組成物的遞送、使用和治療性應用(DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR TARGETING DISORDERS AND DISEASES USING PARTICLE DELIVERY COMPONENTS);2014年2月12日的美國申請61/939,154,用於使用最佳功能的CRISPR-CAS系統進行序列操縱的系統、方法和組成物(SYSTEMS,METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION WITH
OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS);2014年9月25日的美國申請62/055,484,用於使用最佳功能的CRISPR-CAS系統進行序列操縱的系統、方法和組成物;2014年12月4日的美國申請62/087,537,用於使用最佳功能的CRISPR-CAS系統進行序列操縱的系統、方法和組成物;2014年9月24日的美國申請62/054,651,用於體內調節多種癌症突變的競爭的CRISPR-CAS系統和組成物的遞送、使用和治療性應用(DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR MODELING COMPETITION OF MULTIPLE CANCER MUTATIONS IN VIVO);2014年10月23日的美國申請62/067,886,用於體內調節多種癌症突變的競爭的CRISPR-CAS系統和組成物的遞送、使用和治療性應用;2014年9月24日的美國申請62/054,675和2015年6月17日的62/181,002,CRISPR-CAS系統和組成物在神經元細胞/組織中的遞送、使用和治療性應用(DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS IN NEURONAL CELLS/TISSUES);2014年9月24日的美國申請62/054,528,CRISPR-CAS系統和組成物在免疫疾病或病症中的遞送、使用和治療性應用(ELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS IN IMMUNE DISEASES OR DISORDERS);2014年9月25日的美國申請62/055,454,用於使用細胞穿透肽(CPP)靶向病症和疾病的CRISPR-CAS系統和組成物的遞送、使用和治療性應用(DELIVERY,USE AND THERAPEUTIC APPLICATIONS
OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR TARGETING DISORDERS AND DISEASES USING CELL PENETRATION PEPTIDES(CPP));2014年9月25日的美國申請62/055,460,多功能-CRISPR複合物和/或最佳酶連接的功能性-CRISPR複合物(MULTIFUNCTIONAL-CRISPR COMPLEXES AND/OR OPTIMIZED ENZYME LINKED FUNCTIONAL-CRISPR COMPLEXES);2014年12月4日的美國申請62/087,475和2015年6月18日的62/181,690,使用最佳CRISPR-CAS系統的功能性篩選(FUNCTIONAL SCREENING WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS);2014年9月25日的美國申請62/055,487,使用最佳CRISPR-CAS系統的功能性篩選;2014年12月4日的美國申請62/087,546和2015年6月18日的62/181,687,多功能-CRISPR複合物和/或最佳酶連接的功能性-CRISPR複合物;以及2014年12月30日的美國申請62/098,285,腫瘤生長和轉移的CRISPR介導的體內調節和遺傳篩選(CRISPR MEDIATED IN VIVO MODELING AND GENETIC SCREENING OF TUMOR GROWTH AND METASTASIS)。
還參考2015年6月18日的美國申請62/181,659和2015年8月19日的62/207,318,用於序列操縱的CAS9異種同源物和變體的系統、方法、酶以及指導支架的工程化和優化(ENGINEERING AND OPTIMIZATION OF SYSTEMS,METHODS,ENZYME AND GUIDE SCAFFOLDS OF CAS9 ORTHOLOGS AND VARIANTS FOR SEQUENCE MANIPULATION)。參考2015年6月18日的美國申請62/181,663和2015年10月22日的62/245,264,新型CRISPR酶以
及系統(NOVEL CRISPR ENZYMES AND SYSTEMS);2015年6月18日的美國申請62/181,675、2015年10月22日的62/285,349、2016年2月17日的62/296,522、以及2016年4月8日的62/320,231,新型CRISPR酶以及系統;2015年9月24日的美國申請62/232,067、2015年12月18日的美國申請14/975,085、歐洲申請案號16150428.7、2015年8月16日的美國申請62/205,733、2015年8月5日的美國申請62/201,542、2015年7月16日的美國申請62/193,507、以及2015年6月18日的美國申請62/181,739,該等專利各自題為新型CRISPR酶以及系統;以及2015年10月22日的美國申請62/245,270,新型CRISPR酶以及系統。還參考2014年2月12日的美國申請61/939,256和2014年12月12日的WO 2015/089473(PCT/US2014/070152),該等專利各自題為具有用於序列操縱的新體系結構的系統、方法和最佳指導組成物的工程化(ENGINEERING OF SYSTEMS,METHODS AND OPTIMIZED GUIDE COMPOSITIONS WITH NEW ARCHITECTURES FOR SEQUENCE MANIPULATION)。還參考2015年8月15日的PCT/US2015/045504、2015年6月17日的美國申請62/180,699以及2014年8月17日的美國申請62/038,358,該等專利各自題為使用CAS9切口酶的基因組編輯(GENOME EDITING USING CAS9 NICKASES)。
每一份該等專利、專利公開和申請、以及其中或它們的訴訟期間(“應用引用文獻”)所引用的所有文獻或在此應用引用文獻中引用或參考的所有文獻,連同在此或在藉由引用結合在此的任何文獻中提到的任何產品的任何說明書、描述、產品規格和產品清單均藉由引用結合在此,並且可以應用於本發明的實踐
中。所有文獻(例如,該等專利、專利公開和申請以及應用引用文獻)藉由引用結合在此,其程度如同將每個單獨的文獻具體並單獨地指明藉由引用結合在此。
本發明的有效性已經得到證實。可以例如藉由電穿孔轉染包含Cpf1和crRNA的預組裝的重組體CRISPR-Cpf1複合物,從而產生高突變率且不存在可檢測的脫靶突變。戶珥,J.K.等人,藉由電穿孔Cpf1核糖核蛋白在小鼠中進行的靶向誘變,自然生物技術2016年6月6日doi:10.1038/nbt.3596。[電子版先於印刷版]。全基因組分析顯示Cpf1係高度特異的。藉由一個測量,對於人類HEK293T細胞中的SpCas9確定的體外切割位點顯著少於對於SpCas9的體外切割位點。基姆,D等人,全基因組分析揭示了人類細胞中的Cpf1內切核酸酶的特異性(Genome-wide analysis reveals specificities of Cpf1 endonucleases in human cells),自然生物技術,2016年6月6日doi:10.1038/nbt.3609。[電子版先於印刷版]。在採用由含有發明的tRNA的陣列加工的gRNA的果蠅中證實了一種採用Cpf1的有效複用系統。波特,F.(Port,F.)等人,在具有tRNA-側接的Cas9和Cpf1 gRNA的動物中的CRISPR工具箱的擴增(Expansion of the CRISPR toolbox in an animal with tRNA-flanked Cas9 and Cpf1 gRNAs)。doi:http://dx.doi.org/10.1101/046417。
本發明將在以下實例中進一步說明,該等實例僅出於說明目的給出並且不旨在以任何方式限制本發明。
實例
實例1:適應性免疫系統的起源和進化
CRISPR-Cas系統在古細菌和細菌基因組中的分類和注解。CRISPR-Cas座位具有超過50種的基因家族並且不存在嚴格的通用基因,這表明了座位體系結構的快速進化、極端多樣性。因此,單一進化樹係不可行的並且需要多分支方法。到目前為止,針對93種Cas蛋白存在395種表現譜的全面cas基因鑒定。分類包括特徵基因表現譜加上座位體系結構的特徵。
新的CRISPR-Cas系統分類提出在圖1中。第1類包括多亞基crRNA-效應物複合物(Cascade)並且第2類包括單亞基crRNA-效應物複合物(Cas9樣)。圖2提供了CRISPR-Cas的分子組構。圖3提供了I型和III型效應物複合物的結構:共同的體系結構/共同的祖先,儘管存在廣泛的序列趨異性。圖4示出了作為以RNA識別模體(RRM)為中心的系統的CRISPR-Cas。圖5示出了Cas1系統發育,其中自我調整模組和crRNA-效應物模組的重組顯示出CRISPR-Cas進化的主要方面。圖F示出了CRISPR-Cas種群調查,具體地是CRISPR-Cas型/亞型在古生菌和細菌之中的分佈。
Cas1並不總是連接至CRISPR-Cas系統,因此可能存在“單獨”Cas1的兩條分支,這說明功能和起源與可能的新型可動遺傳因子可能存在差異(參見馬卡洛夫、格魯帕維克(Krupovic)、庫尼恩,遺傳學前沿(Frontiers Genet)2014)。三個casposon家族的基因組組構可以提供一些線索。除Cas1和PolB之外,casposon結合不同基因,包括各種核酸酶(格魯帕維克等人,BMC生物學(BMC Biology)2014)。一個家族具有蛋白質引發的聚合酶,另一個家族具有RNA引發的聚合酶。除不同廣古菌和奇古菌之外,
casposon可見於表明橫向流動的幾種細菌中。Casposon Cas1(易位酶/整合酶)顯示Cas1種系發生中的basal進化枝。
細菌和古細菌利用CRISPR在原核生物和真核生物中經由基因組操縱來進行適應性免疫。Cas 1提供了用於基因組操縱的現成工具。casposon和CRISPR中存在類似整合機制,特別是藉由複製/黏貼不能切割複製部分來進行複製依賴性獲取(格魯帕維克等人,BMC生物學2014)。Cas1係真實的整合酶(努涅斯.JK(Nuñez JK)、李.AS(Lee AS)、昂熱爾曼.A(Engelman A)、竇得那.JA(Doudna JA),在CRISPR-Cas適應性免疫過程中的整合酶介導的間隔區獲取(Integrase-mediated spacer acquisition during CRISPR-Cas adaptive immunity),自然,2015年2月18日)。在casposon與CRISPRT的末端反向重複序列之間存在相似性(格魯帕維克等人,BMC生物學2014)。CRISPR-Cas可以來源於casposon和先天性免疫座位(庫尼恩、格魯帕維克,遺傳學自然評論,2015)。原核生物和動物中的適應性免疫系統的進化可以是已沿著與先天性免疫座位處的轉位子整合平行的過程進行(庫尼恩、格魯帕維克,遺傳學自然評論,2015)。RAG1易位酶(脊椎動物中的V(D)J重組的關鍵酶)可以來源於Transib轉位子(卡皮托諾夫.VV(Kapitonov VV)、朱卡.J(Jurka J),RAG1核心和V(D)J重組信號序列時來源於Transib轉位子(RAG1 core and V(D)J recombination signal sequences were derived from Transib transposons),公共科學圖書館生物學(PLoS Biol.)2005年6月;3(6):e181),然而,沒有Transib編碼RAG2。RAG1和RAG2編碼的轉位子描述於卡皮托諾夫、庫尼恩,生物學指導(Biol Direct)2015並且Transib易位酶
系統發育被給出在卡皮托諾夫、庫尼恩,生物學指導2015中。纖毛蟲中的防禦性DNA消除從PiggyMAc轉位子和先天性免疫系統RNAi演變而來(斯瓦特.EC(Swart EC)、諾瓦茨基.M(Nowacki M),藉由sRNA-靶向的DNA缺失來抵禦並編輯基因組的真核生物方式(The eukaryotic way to defend and edit genomes by sRNA-targeted DNA deletion),紐約科學院年鑒2015)。
分類的相對穩定性說明最流行的CRISPR-Cas系統變體係已經知道的。然而,少數目前不可分類的變體的存在說明另外類型和亞型仍有待表徵(馬卡洛夫等人2015。CRISPR-Cas系統和cas基因的進化性分類(Evolutionary classification of CRISPR-Cas systems and cas genes))。
轉位子對於適應性免疫和涉及DNA操縱的其他系統的進化起到關鍵性作用。第1類CRISPR-Cas來源於轉位子但僅用於自我調整模組。第2類CRISPR-Cas具有自我調整功能和效應物功能二者,其中模組可以從不同轉位子進化。
實例2:新預測的第2類CRISPR-Cas系統以及其來自可易位件的獨立起源的證據
細菌和古細菌的適應性免疫的CRISPR-Cas系統顯示出蛋白質組成和基因組座位體系結構的極端多樣性。該等系統寬泛地分成兩類,具有多亞單元效應物複合物的第1類和具有單亞單元效應物模組的第2類,藉由Cas9蛋白來舉例說明。申請人開發了用於預測推定的新第2類CRISPR-Cas系統的簡單計算流程。使用此流程分析完整細菌基因組的資料庫使得能夠鑒定兩種新的變體,
該等變體各自在不同細菌中表現出來並且含有cas1和cas2基因連同編碼預測作為效應物模組起作用的大蛋白質的第三基因。在該等座位的第一個座位中,推定的效應蛋白(C2c1p)含有RuvC-樣核酸酶結構域並且類似於先前描述的Cpf1蛋白,即V型CRISPR-Cas系統的預測效應物;因此,新推定系統被分類為V-B亞型。蛋白質序列的深入比較表明含RuvC的效應蛋白Cas9、Cpf1和C2C1p獨立地從不同組的轉位子編碼的TnpB蛋白質進化。第二組新推定的CRISPR-Cas座位涵蓋了含有具有預測的RNA酶活性的兩個高度趨異性HEPN結構域的大蛋白質。考慮到預測的效應蛋白的新穎性,該等座位被分類為可能靶向mRNA的新VI型CRISPR-Cas。總之,此分析的結果顯示第2類CRISPR-Cas系統在多種獨立的情景上藉由將不同Cas1-Cas2-編碼的自我調整模組與來源於不同可動遺傳因子的效應蛋白組合來進化。此進化路徑最可能產生仍有待發現的第2類系統的多種變體。
CRISPR-Cas適應性免疫系統存在於~45%細菌和~90%古細菌基因組中並且顯示Cas蛋白質組成和序列以及基因組座位體系結構的極端多樣性。基於其crRNA-效應物複合物的結構組織化,該等系統被分類兩類,即具有多亞基效應物複合物的第1類和具有單一亞基效應物複合物的第2類(馬卡洛夫,2015)。第1類系統係更常見的並且不同於第2類系統。第1類目前藉由由許多古細菌和細菌基因組編碼的12種不同亞型表示,而第2類系統包括II型系統和推定的V型系統的三種亞型,該等亞型總體可見於約10%的定序細菌基因組(具有涵蓋推定型系統的單一古細菌基因組)。第2類系統典型地僅含有cas操縱子中的三個或四個基因,即
涉及自我調整而不涉及干擾的cas1-cas2基因對、負責干擾而且有助於前crRNA加工和自我調整的單一多結構域效應蛋白、以及常常是具有在至少一些II型系統中可分配的未表徵功能的第四種基因。在大多數情況下,CRISPR陣列和稱為tracrRNA(反式編碼的小CRISPR RNA)的不同RNA種類的基因與第2類cas操縱子相鄰(吉林斯基(Chylinski),2014)。tracrRNA與對應CRISPR陣列內的重複序列部分同源並且係為前crRNA的加工所必需的,該加工不與CRISPR-Cas座位相關聯的普遍存在的細菌酶RNA酶III催化(德爾特切瓦(Deltcheva),2011)(吉林斯基,2014;吉林斯基,2013)。
II型多結構域效應蛋白Cas9已在功能和結構方面以精巧詳情表徵。在不同細菌中,Cas9蛋白涵蓋約950個與1,400個之間的胺基酸並且含有兩個核酸酶結構域,即RuvC-樣(RNA酶H折疊)和HNH(McrA-樣)核酸酶(馬卡洛夫,2011)。Cas9的晶體結構揭示了具有不同靶向識別和核酸酶裂片的蛋白質的二裂片組構,其中後者具有RuvC和HNH結構域(西松,2014)(金科(Jinek),2014)。每一個Cas9核酸酶結構域對於一條靶DNA股的切割係需要的(金科,2012;撒普拉那斯卡(Sapranauskas),2011)。最近,Cas9已顯示有助於CRISPR反應的所有三個階段,它不僅靶向DNA切割(干擾)而且靶向自我調整和前-crRNA加工(金科,2012)。更確切地說,Cas9的核酸酶裂片中的不同結構域已顯示在自我調整階段過程中識別並結合病毒DNA中的原型間隔區相關模體(PAM)(西松,2014)(金科,2014)(黑勒爾(Heler),2015;魏,2015)。在CRISPR反應的此階段,Cas9與涉及所有CRISPR-Cas
系統中的間隔區獲取的兩種蛋白質Cas1和Cas2形成複合物(黑勒爾,2015;魏,2015)。
與tracrRNA組合的Cas9蛋白最近已成為用於新生成的基因編輯和工程化方法的關鍵性工具(加西烏納斯,2013;馬里,2013;桑普森,2014;叢,2015)。Cas9在基因組編輯中的此效用取決於以下事實,在II型CRISPR-Cas系統中,與其他類型的CRISPR-Cas系統不同,對於靶DNA識別和切割所需要的所有活性在單一、儘管較大的多結構域蛋白質中組裝。II型系統的此特徵極大地促進用於基因組操縱的有效工具的設計。重要的是,並非所有的Cas9變體都係相等的。迄今為止大部分工作已使用來自釀膿鏈球菌的Cas9來完成,但是其他Cas9種類可以提供實質性優點。作為適當的例子,使用來自金黃色葡萄球菌的、比化膿鏈球菌蛋白質短約300個胺基酸的Cas9的最近實驗已允許將Cas9包裝到腺相關病毒載體中,從而引起用於體內基因組編輯的CRISPR-Cas效用的主要增強(拉恩,2015)。
II型CRISPR-Cas系統目前被分成3種亞型(II-A、II-B和II-C)(馬卡洛夫,2011)(方法拉(Fonfara),2014;吉林斯基,2013;吉林斯基,2014)。除所有II型座位所共用的cas1、cas2和cas9基因之外,II-A亞型的特徵係編碼滅活ATP酶的額外基因csn2(納姆(Nam),2011;古(Koo),2012;李,2012),該ATP酶在間隔區獲取中起到很少的表徵作用(巴蘭岡(Barrangou),2007;阿爾斯蘭(Arslan),2013)(黑勒爾,2015)。II-B亞型系統缺乏csn2但是反而含有另外具有I型系統典型特徵並且編碼recB家族5’-3’外
切核酸酶的cas4基因,該外切核酸酶有助於藉由生成重組基因座(recombinogeneci)DNA末端進行間隔區獲取(張,2012)(萊馬克(Lemak),2013;萊馬克,2014)。II-B亞型的cas1和cas2基因與提示此II型亞型的重組起源的I型CRISPR-Cas系統的對應蛋白質最密切相關(吉林斯基,2014)。
II-C亞型CRISPR-Cas系統係僅由cas1、cas2和cas9基因組成的最少種類(吉林斯基,2013;庫尼恩,2013;吉林斯基,2014)。然而,值得注意地是,已顯示在空腸彎麴菌中,藉由II-C系統進行間隔區獲取需要由噬菌體編碼的Cas4的參與(胡頓(Hooton),2014)。II-C亞型的另一種不同特徵係藉由轉錄形成一些crRNA,該轉錄涉及由內部替代性啟動子進行的轉錄,與所有其他實驗表徵的CRISPR-Cas系統中觀察到的加工相反(張,2013)。
最近,V型CRISPR-Cas系統的存在已藉由細菌基因組的比較性分析來預測到。該等推定的新型CRISPR-Cas系統在幾種細菌基因組中表現出來,特別是來自弗朗西絲菌屬和古細菌alvus甲烷嗜甲基菌(Methanomethylophilus alvus)的那些細菌基因組(韋斯特高(Vestergaard),2014)。所有推定的V型座位涵蓋cas1、cas2、表示為cpf1的不同基因以及CRISPR陣列(舒德爾(Schunder),2013)(馬卡洛夫,2015)。Cpf1係一種大蛋白質(約1300個胺基酸),它含有與Cas9的相應結構域同源的RuvC樣核酸酶結構域以及Cas9的特徵性富精胺酸簇的對應物。然而,Cpf1缺乏所有Cas9蛋白中存在的HNH核酸酶結構域,並且RuvC樣結構域在Cpf1序列中是連續的,這與其中含有包含HNH結構域的長插入物的Cas9相反(吉
林斯基,2014;馬卡洛夫,2015)。在Cas9和Cpf1的結構域體系結構中的該等主要差異表明含有Cpf1的系統應被分成一個新型。推定的V型系統的組成提示Cpf1係單一亞基效應物複合物並且因此該等系統被分配給第2類CRISPR-Cas。一些推定的V型座位編碼Cas4並且因此類似於II-B亞型座位,而其他座位缺乏Cas4並且因此類似於II-C亞型。
已顯示Cas9和Cpf1蛋白質的最近同源物係在IS605家族轉位子中編碼的並且含有RuvC-樣核酸酶結構域以及在Cpf1中具有對應物的Zn-指的TnpB蛋白質。此外,已鑒定含有插入到RuvC-樣結構域的HNH結構域並且顯示與Cas9的高序列相似性的TnpB同源物。TnpB在轉位子中的作用仍不確定,因為已顯示此蛋白質並不是易位所需要的。
考慮到Cas9和Cpf1與轉位子編碼的蛋白質的同源性,申請人假設第2類CRISPR-Cas系統已在多種情景中因為轉位子與cas1-cas2座位之間的重組而進化。因此,申請人設計了一種鑒定可以是第2類新型變體的候選物的基因組座位的簡單計算策略。在此申請人描述了此方法用於鑒定此類候選物的兩個組別的第一種應用,這兩個組別之一似乎係V型的不同亞型而第二個組別似乎具有VI型的品質。第2類CRISPR-Cas系統的新變體作為用於基因組編輯和表現調節的潛在工具受到明顯的關注。
用於檢測候選的新型第2類CRISPR-Cas座位的資料庫搜索策略。申請人實施了鑒定候選的新型第2類CRISPR-Cas系統的直接計算方法(圖7.流程)。因為絕大多數CRISPR-Cas座位涵
蓋cas1基因(馬卡洛夫,2011;馬卡洛夫,2015)並且Cas1序列係所有Cas蛋白質中最高度保守的序列(健內,2012),申請人推斷cas1係使用利用Cas1譜圖進行的翻譯PSI-BLAST搜索鑒定候選的新座位的最可能的錨點。在檢測編碼Cas1的所有疊連群之後,使用GenemarkS預測cas1基因上游和下游的20KB區域內的蛋白質編碼基因。使用NCBI CDD和Cas蛋白特異性譜圖標注該等預測的基因,並且使用PILER-CR程序預測CRISPR陣列。此程式提供了檢測的CRISPR-Cas座位到已知亞基的分配。選擇含有大(>500aa)蛋白質的未分類的候選CRISPR-Cas座位作為新型第2類系統的候選物,假定此類蛋白質特徵性存在於在II型和V型中(分別是Cas9和Cpf1)。根據具體情況使用PSI-BLAST和HHpred分析用此標準檢測的所有34個候選座位。在候選座位中編碼的蛋白質序列進一步用作搜索另外的同源物的巨集基因組學資料庫的查詢,並且如上所指示地分析該等搜索中檢測的長疊連群。此分析流程產生牢固連接至CRISPR-Cas系統的兩組座位。
推定的V-B型系統。第一組候選座位暫時指示命名為C2c1(第2類候選物1),它在來自四種主要門,包括桿菌門、疣微菌門、α變形菌門以及δ變形菌門的細菌基因組中表現出來(圖8“第2類系統的完整座位的組構”)。所有C2c1座位編碼了Cas1-Cas4融合物、Cas2以及申請人表示為C2c1p的大蛋白質,並且典型地與CRISPR陣列相鄰(圖9,C2c1鄰近群體)。在Cas1的系統發育樹中,對應Cas1蛋白與I-U型系統(圖10,Cas1樹)成簇,該系統係其中可見Cas1-Cas4融合物的唯一系統。C2c1p蛋白由大約1200個胺基酸組成,並且HHpred搜索檢測了此蛋白質的C末端部分與IS605家
族的轉位子中編碼的TnpB蛋白子集之間的顯著相似性。相反,在和其他組的TnpB蛋白質類似的C2c1p與Cas9或Cpf1之間未檢測到顯著相似性(吉林斯基,2014)(馬卡洛夫,2015;馬卡洛夫,2015)。因此,C2c1p的結構域體系結構類似於Cpf1的結構域體系結構並且不同於Cas9的結構域體系結構,儘管所有三種Cas蛋白似乎都係從TnpB家族進化(圖11“第2類家族的結構域組構”)。C2c1p的N末端區域未顯示與其他蛋白質的顯著相似性。二級結構預測指示此區域主要採用α螺旋構象。與TnpB具有相似性的兩個區段涵蓋具有D..E..D特徵的RuvC樣核酸酶的三個催化模體(圖12“第2類蛋白質中的TnpB同源區”);與Cas9蛋白中的橋螺旋(也稱為富精胺酸簇)相對應的區域涉及crRNA結合;並且似乎係TnpB的Zn指的對應物的小區域(然而,在C2C1p中替換Zn結合半胱胺酸殘基,這指示此蛋白質並不結合鋅)。C2c1p與Cpf1的結構域體系結構的相似性表明C2c1座位最好分類成V-B亞型,在此情況下編碼Cpf1的座位變成V-A亞型。
儘管與此系統相關聯的cas1基因具有相似性,但是在對應陣列中的CRISPR重複序列係高度異質的,雖然所有該等重複序列都係36-37bp長並且可以被分類成未結構化的(折疊能量△G係-0.5-4.5kcal/mol,而高迴文CRISPR具有低於-7的△G)。根據CRISPRmap(蘭格(Lange),2013)分類方案,幾種V-B亞型重複序列與II型重複序列共用一些序列相似性或結構相似性。
考慮到推定的V-B亞型CRISPR-Cas系統在機制上類似於II型系統的可能性,申請人試圖鑒定對應基因組座位中的
tracrRNA。
來自V-B型CRISPR陣列的間隔區與非冗餘核苷酸序列資料庫的比較鑒定了與不同細菌基因組的幾種匹配。考慮到對於具有推定的V-B型CRISPR-Cas系統的細菌而言沒有噬菌體係已知的,該等匹配的相關性難以評定。
推定的VI型系統。第二組候選CRISPR-Cas座位表示為C2c2,係在來自5種主要細菌門α變形菌門、桿菌門、梭菌綱、梭桿菌門以及擬桿菌門的基因組中鑒定的(圖8“第2類系統的完整座位的組構”)。與c2c1類似的是,C2c2座位涵蓋cas1和cas2基因連同大蛋白質(C2c2p)和CRISPR陣列;然而,與C2c1不同的是,C2c2p常常緊挨著CRISPR陣列而不是cas1-cas2來編碼(圖13,C2c2鄰近群體)。在Cas1系統發育樹中,來自C2c2座位的Cas1蛋白分佈在兩種進化枝中。第一進化枝包括來自梭菌綱的Cas1並且連同小III-A型分支位於II型子樹內(圖10,Cas1樹)。第二進化枝由來自纖毛菌屬的C2c2座位的Cas1蛋白組成並且安置在主要含有來自III-A型CRISPR-Cas系統的Cas1蛋白的混合型分支內。使用HHpred和PSI-BLAST的資料庫搜索未在C2c2p與其他蛋白質之間檢測到序列相似性。然而,檢查C2c2p蛋白序列的多重比對能夠鑒定具有HEPN結構域特徵的兩種嚴格保守的RxxxxH模體(阿南他拉曼(Anantharaman),2013)。二級結構預測指示該等模體位於與HEPN結構域結構相容的結構環境內,如與C2c2p的對應部分的總體二級結構預測一樣。HEPN結構係已顯示或預測具有RNA酶活性並且通常與各種防禦系統相關聯的小(~150aa)α螺旋結構域(阿
南他拉曼,2013)(圖14,C2c2家族中的HEPN RxxxxH模體)。除催化性RxxxxH模體之外,HEPN結構域序列顯示少許保守性。因此,可能出現C2c2p含有兩個活性HEPN結構域。HEPN結構域對於CRISPR-Cas系統並不是新的,因為它常常與存在於許多III型CRISPR-Cas系統中的Csm6和Csx1蛋白質的CARF(CRISPR相關羅斯曼折疊)結構域締合(馬卡洛夫,2014)。該等蛋白質並不屬於自我調整模組或效應物複合物,而是似乎係存在於大部分CRISPR-Cas系統中並且涉及程式性細胞死亡以及在CRISPR反應過程中的調節功能的相關免疫模組的組分(庫尼恩,2013;馬卡洛夫,2012;馬卡洛夫,2013)。然而,C2c2p與Csm6和Csx1的不同之處在於除Cas1和Cas2之外,此大許多的蛋白質係C2c2座位中編碼的唯一蛋白質。因此,似乎C2c2p係該等推定的新型CRISPR-Cas系統的效應物並且HEPN結構域係其催化部分。在該等預測的HEPN結構域之外,C2c1p序列未顯示與其他蛋白質的可檢測相似性並且預測採用混合型α/β二級結構。
C2c2座位中的CRISPR陣列係高度異質的,其中長度係35至39bp,並且係未結構化的(折疊能量係-0.9至4.7kcal/mol)。根據CRISPRmap(蘭格,2013),該等CRISPR並不屬於任何建立的結構類別並且被分配至6個超類中的3個超類。僅來自斯氏利斯特菌(Listeria seeligeri)的CRISPR被分配至通常與II-C型系統相關聯的序列家族24。
C2c2座位的間隔區分析鑒定了與來自威氏李斯特菌(Listeria weihenstephanensis)的基因組序列和對於噬菌體基因組
的兩個未完成命中相同的30個核苷酸區域。
考慮到C2c2獨特預測的效應物複合物,該等系統似乎具有作為推定的VI型CRISPR-Cas的品質。此外,考慮到所有實驗表徵和酶促活性的HEPN結構域係RNA酶,VI型系統可能在mRNA水平下起作用。
申請人申請預測新第2類CRISPR-cas系統的簡單的直接計算策略。先前描述的第2類系統,即II型和推定的V型,由包括自我調整模組和含有效應物模組的單一大蛋白質的cas1和cas2基因(並且在一些情況下也有cas4)組成。因此,申請人推測含有cas1和大蛋白質的任何基因組座位可以是應進行詳細研究的新型第2類系統的潛在候選物。使用用於蛋白質序列比較的靈敏方法的此類分析能夠鑒定兩種強候選物,其中一種係先前描述的推定的V型的亞型,而另一種在新預測的效應蛋白存在強度方面具有作為一種新的推定的VI型的品質。許多該等新系統出現在未涵蓋其他CRISPR-Cas座位的細菌基因組中,這說明V型和VI型系統可以自發起作用。
與先前的分析結果組合,(吉林斯基,2014;馬卡洛夫,2011),推定的V-B型的鑒定揭示了第2類CRISPR-Cas系統進化的主導主題。此類別的所有目前已知的系統的效應蛋白似乎從編碼含有RuvC-樣結構域的TnpB蛋白質的可易位件庫進化。TnpB的RuvC-樣結構域和第2類效應蛋白的同源結構域的序列對於可靠的系統發育分析而言太趨異。儘管如此,但是對於II型系統的效應蛋白Cas9,特定祖蛋白(ancestor)似乎容易鑒定,即在藍細菌中特
別豐富的TnpB樣蛋白家族,該蛋白家族與Cas9顯示相對高的序列相似性並且與它共用整個結構域體系結構,即RuvC樣和HNH核酸酶結構域和富精胺酸橋螺旋(吉林斯基,2014)(圖11,“第2類家族的結構域組構”;圖12,“第2類蛋白質中的TnpB同源區”)。與Cas9不同,它不可能將Cpf1和C2c1追蹤至特定TnpB家族;儘管位於RuvC-樣核酸酶的催化殘基中心的所有模體均具有保守性,但是該等蛋白質僅與TnpB屬性譜圖顯示有限的相似性。然而,考慮到C2c1p與Cpf1未顯示可檢測的序列相似性,在RuvC-模體與明確不相關的N-末端區域之間含有不同插入,似乎最可能的是Cpf1和C2c1獨立地來源於TnpB編碼元件庫內的不同家族。
有意義的是TnpB蛋白似乎被“預先設計”用於第2類CRISPR-Cas效應物複合物,以使得它們明顯在多種不同的情景中募集。可想像地,TnpB蛋白的此類效用必須使用其預測的能力來切割單股DNA同時經由在Cas9中已顯示結合crRNA的富R橋螺旋結合RNA分子(金科,2014;西松,2014)。對於TnpB的功能瞭解較少。此蛋白質並不是易位所需要的,並且在一種情況中,已顯示下調易位(帕斯捷爾納克(Pasternak),2013)但是它們的作用機制仍未知。TnpB的實驗研究可能解釋了第2類CRISPR-Cas系統的機制方面。應注意Cpf1和C2c1的機制可以彼此類似但結合基本上不同於Cas9,因為前兩種蛋白質缺乏在Cas9中負責切割靶DNA股之一的HNH結構域(加西烏納斯,2012)(金科,2012)(陳,2014)。因此,Cpf1和C2c1的利用可以帶來另外的基因組編輯可能性。
在進化方面中,引人注意的是第2類CRISPR-Cas似乎完全來源於不同的可易位件,給出了關於來自不同轉位子家族的cas1基因的可能起源的最新證據(庫尼恩,2015;格魯帕維克,2014)。此外,來自不同TnpB家族的效應蛋白的可能獨立起源連同對應cas1蛋白的不同系統發育親和性強烈提示第2類系統已在多種情景中藉由不同自我調整模組與產生效應蛋白的轉位子來源核酸酶組合來進化。此進化模式似乎係作為CRISPR-Cas進化特徵的最終的模組性表現形式(馬卡洛夫,2015),這提示自我調整模組和效應物模組的另外組合可能存在於自然界中。
推定的VI型CRISPR-Cas系統涵蓋了含有可能具有RNA酶活性的兩個預測的HEPN結構域的預測的新型效應蛋白。HEPN結構不是其他CRISPR-Cas系統中的效應物複合物的部分,但是涉及許多防禦功能,包括預測的在不同CRISPR-Cas系統中的輔助作用(阿南他拉曼,2013)(馬卡洛夫,2015)。HEPN結構域作為預測的效應物模組的催化部分存在提示VI型系統靶向並切割mRNA。先前,已報導了對於某些III型CRISPR-Cas系統的mRNA靶向(黑爾(Hale),2014;黑爾,2009)(彭(Peng),2015)。儘管HEPN結構域迄今為止未在真實易位件中檢測到,但是它們的特徵係高橫向流動並且與可動遺傳因子諸如毒素抗毒素單元成整體(阿南他拉曼,2013)。因此,推定的VI型系統似乎適合第2類CRISPR-Cas來自可動部件的模組進化的一般範例,並且預期藉由分析基因組和巨集基因組學資料來發現另外的變體和新類型。
模組進化係CRISPR-Cas系統的關鍵性特徵。此進化
模式似乎係第2類系統中最明顯的,它藉由來自不同的其他CRISPR-Cas系統的自我調整模組與似乎在多種獨立的情景下從可動遺傳因子募集的效應蛋白組合來進化。考慮到可動遺傳因子在細菌中的極端多樣性,似乎可能的是第2類CRISPR-Cas系統的效應物模組也是高度不同的。在此申請人採用描述CRISPR-Cas系統的兩種新變體的簡單計算方法,但是更多變體可能存在於已定序的細菌基因組中。儘管預期大部分(如果不是所有)該等新CRISPR-Cas系統係少見的,但是它們可以採用新策略和分子機制並且可以為基因組工程化和生物技術中的新應用提供主要資源。
使用TBLASTN程式,使用Cas1譜圖作為查詢來搜索NCBI WGS資料庫。其中已鑒定Cas1命中的疊連群或全基因組部分的序列從同一資料庫中檢索。使用GENMARK切割並翻譯Cas1基因周圍的區域。針對來自CDD資料庫(瑪琪樂-鮑爾(Marchler-Bauer),2009)的特徵集合和在FTP處可獲得的特定Cas特徵搜索每種基因的預測的蛋白質,其中命中優先於Cas蛋白質。將先前開發的鑒定CRISPR座位的完整性的程序應用於每個座位。
使用CRISPRmap(蘭格,2013)進行重複序列分類。
反覆運算性譜圖用PSI-BLAST(安特斯庫爾,1997)搜索並且使用基於組成的統計學和低複雜度過濾關閉(filtering turned off)搜索兩個NCBI非冗餘(NR)資料庫的相似性較遠的序列。使用TBLAST程式針對WGS搜索每種鑒定的非冗餘蛋白質。使用HHpred,使用默認參數鑒定遠端序列相似性(塞汀(Soding),2005)。使用MUSCLE(愛德格,2004)構建多重序列比對。使用
Jpred 4預測蛋白質二級結構(德羅茲德斯基(Drozdetskiy),2015)。
選擇的基因候選物
基因ID:A;基因類型:C2C1;生物體:5.豐祐菌科細菌TAV5;間隔區長度-模式(範圍):34(33至37);DR1:GCCGCAGCGAAUGCCGUUUCACGAAUCGUCAGGCGG(SEQ ID NO:27);DR2:無;tracrRNA1:GCUGGAGACGUUUUUUGAAACGGCGAGUGCUGCGGAUAGCGAGUUUCUCUUGGGGAGGCGCUCGCGGCCACUUUU(SEQ ID NO:28);tracrRNA2:無;蛋白質序列:
基因ID:B;基因類型:C2C1;生物體:7.嗜熱澱粉芽孢桿菌菌株B4166;間隔區長度-模式(範圍):37(35-38);DR1:GUCCAAGAAAAAAGAAAUGAUACGAGGCAUUAGCAC(SEQ ID NO:30);DR2:無;tracrRNA1:
基因ID:C;基因類型:C2C1;生物體:9.芽孢桿菌某種NSP2.1;間隔區長度-模式(範圍):36(35-42);DR1:GUUCGAAAGCUUAGUGGAAAGCUUCGUGGUUAGCAC(SEQ ID NO:33);DR2:無;tracrRNA1:CACGGAUAAUCACGACUUUCCACUAAGCUUUCGAAUUUUAUGAUGCGAGCAUCCUCUCAGGUCAAAAAA(SEQ ID NO:34);tracrRNA2:無;蛋白質序列:
基因ID:D;基因類型:C2C2;生物體:4.毛螺菌科細菌(Lachnospiraceae bacterium)NK4A144 G619;間隔區長度-模式(範圍):35;DR1:GUUUUGAGAAUAGCCCGACAUAGAGGGCAAUAGAC(SEQ ID NO:36);DR2:GUUAUGAAAACAGCCCGACAUAGAGGGCAAUAGACA(SEQ ID NO:37);tracrRNA1:無;tracrRNA2:無;蛋白質序列:
基因ID:E;基因類型:C2C2;生物體:8.斯氏利斯特菌血清變型1/2b str.SLCC3954;間隔區長度-模式(範圍):30;DR1:GUUUUAGUCCUCUUUCAUAUAGAGGUAGUCUCUUAC(SEQ ID NO:39);DR2:無;tracrRNA1:
基因ID:F;基因類型:C2C2;生物體:12.wadei纖毛菌屬F0279;間隔區長度-模式(範圍):31;DR1:GUUUUAGUCCCCUUCGUUUUUGGGGUAGUCUAAAUC(SEQ ID NO:42);DR2:無;tracrRNA1:
(SEQ ID NO:43);tracrRNA2:AUUUAGAUUACCCCUUUAAUUUAUUUUACCAUAUUUUUCUCAUAAUGCAAACUAAUAUUCCAAAAUUUUU(SEQ ID NO:44);蛋白質序列:
基因ID:G;基因類型:C2C2;生物體:14.shahii纖毛菌屬DSM 19757 B031;間隔區長度-模式(範圍):30(30-32);DR1:GUUUUAGUCCCCUUCGAUAUUGGGGUGGUCUAUAUC(SEQ ID NO:46);DR2:無;tracrRNA1:
基因ID:H;基因類型:Cpf1;生物體:土拉熱弗朗西絲菌新殺手亞種U112間隔區長度-模式(範圍):31;DR1:GUCUAAGAACUUUAAAUAAUUUCUACUGUUGUAGAU(SEQ
ID NO:49);DR2:無;tracrRNA1:AUCUACAAAAUUAUAAACUAAAUAAAGAUUCUUAUAAUAACUUUAUAUAUAAUCGAAAUGUAGAGAAUUUU(SEQ ID NO:50);tracrRNA2:無;蛋白質序列:
用於合成的基因
對於基因A至H,優化以進行人類表現並且將以下DNA序列附加到每個基因末端。注意此DNA序列含有終止密碼子(已加底線),因此不用將任何終止密碼子添加到密碼子優化的基因序列:
對於優化,避免以下限制性位點:BamHI、EcoRI、HindIII、BsmBI、BsaI、BbsI、AgeI、XhoI、NdeI、NotI、KpnI、BsrGI、SpeI、XbaI、NheI
將該等基因選殖到簡單的哺乳動物表現載體中:
>A
>B
>C
>D
>E
>F
>G
>H
對於A-座位至G-座位,將該等基因選殖並插入到低拷貝質粒中。使用不含有Amp抗性的載體。
>A-座位
>B-座位
>C-座位
>D-座位
>E-座位
>F-座位
>G-座位
實例3:Cpf1和相關組分的進一步評價
申請人使用Cas-Cpf1異種同源物進行序列比對並且比較結構域結構和組構(圖38A-圖38N)。Cpf1座位比對的綜述示出在圖39中。
以下列出了不同異種同源物中的Cpf1座位序列:
>KKP36646_(修飾的)假定蛋白UR27_C0015G0004[儉菌總門細菌GW2011_GWA2_33_10]
>KKR91555_(修飾的)假定蛋白UU43_C0004G0003[儉菌總門(佛爾扣菌(Falkowbacteria))細菌GW2011_GWA2_41_14]
>KDN25524_(修飾的)假定蛋白MBO_03467[牛莫拉氏菌237]
>KKT48220_(修飾的)假定蛋白UW39_C0001G0044[儉菌總門細菌GW2011_GWC2_44_17]
>WP_031492824_(修飾的)假定蛋白[溶糊精琥珀酸弧菌]
>KKT50231_(修飾的)假定蛋白UW40_C0007G0006[儉菌總門細菌GW2011_GWF2_44_17]
>WP_004356401_(修飾的)假定蛋白[解糖腖普雷沃菌]
>CCB70584_(修飾的)未知功能蛋白質[嗜鰓黃桿菌(Flavobacterium branchiophilum)FL-15]
>WP_005398606_(修飾的)假定蛋白[孔茲氏創傷球菌(Helcococcus kunzii)]
>WP_021736722_(修飾的)CRISPR相關蛋白Cpf1,PREFRAN亞型[胺基酸球菌屬某種BV3L6]
>WP_004339290_(修飾的)假定蛋白[土拉熱弗朗西
絲菌]
>WP_022501477_(修飾的)假定蛋白[真細菌某種CAG:76]
>WP_014550095_(修飾的)假定蛋白[土拉熱弗朗西絲菌]
>WP_003034647_(修飾的)假定蛋白[土拉熱弗朗西絲菌]
>FnCpf1土拉熱弗朗西絲菌新殺手亞種U112,全基因組
>KKQ38174_(修飾的)假定蛋白US54_C0016G0015[Microgenomates(羅斯曼菌(Roizmanbacteria))細菌GW2011_GWA2_37_7]
>WP_022097749_(修飾的)假定蛋白[挑剔真細菌CAG:72]
>WP_012739647_(修飾的)假定蛋白[[真細菌]挑剔]
>WP_045971446_(修飾的)假定蛋白[黃桿菌屬某種316]
>WP_044110123_(修飾的)假定蛋白[短普雷沃菌(Prevotella brevis)]
>WP_036388671_(修飾的)假定蛋白[山羊莫拉氏菌(Moraxella caprae)]
>WP_020988726_(修飾的)CRISPR相關蛋白Cpf1,PREFRAN亞型[稻田鉤端螺旋體]
>WP_023936172_(修飾的)外切核酸酶SbcC[狗口腔卟啉單胞菌]
>WP_009217842_(修飾的)假定蛋白[口腔類擬桿菌(Bacteroidetes oral taxon)274]
>WP_036890108_(修飾的)假定蛋白[狗口腔卟啉單胞菌]
>WP_036887416_(修飾的)假定蛋白[狗口腔卟啉單胞菌]
>WP_023941260_(修飾的)外切核酸酶SbcC[犬口腔卟啉單胞菌]
>WP_037975888_(修飾的)假定蛋白[窮氏互養菌(Synergistes jonesii)]
>EFI70750_(修飾的)保守性假定蛋白[布氏普雷沃菌(Prevotella bryantii)B14]
>WP_024988992_(修飾的)假定蛋白[易北普雷沃菌]
>WP_039658684_(修飾的)假定蛋白[密斯氏菌屬某種SC_K08D17]
>WP_037385181_(修飾的)假定蛋白[密斯氏菌屬某種SCADC]
>WP_039871282_(修飾的)假定蛋白[布氏普雷沃菌]
>EKE28449_(修飾的)假定蛋白ACD_3C00058G0015[未培養細菌(gcode 4)]
>WP_018359861_(修飾的)假定蛋白[獼猴卟啉單胞菌]
>WP_013282991_(修飾的)假定蛋白[解朊丁酸弧菌]
>AIZ56868_(修飾的)假定蛋白Mpt1_c09950[候選白蟻甲烷枝原體]
>WP_027407524_(修飾的)假定蛋白[厭氧弧菌屬(Anaerovibrio)某種RM50]
>WP_044910712_(修飾的)假定蛋白[毛螺菌科細菌MC2017]
>WP_027216152_(修飾的)假定蛋白[溶纖維丁酸弧
菌]
>WP_016301126_(修飾的)假定蛋白[毛螺菌科細菌COE1]
>WP_035635841_(修飾的)假定蛋白[毛螺菌科細菌ND2006]
>WP_015504779_(修飾的)外切核酸酶SbcC[候選alvus甲烷嗜甲基菌(Candidatus Methanomethylophilus alvus)]
>WP_044910713_(修飾的)假定蛋白[毛螺菌科細菌MC2017]
>KKQ36153_(修飾的)假定蛋白US52_C0007G0008[候選的分裂WS6細菌GW2011_GWA2_37_6]
>WP_044919442_(修飾的)假定蛋白[毛螺菌科細菌MA2020]
>WP_035798880_(修飾的)假定蛋白[丁酸弧菌屬某種NC3005]
>WP_027109509_(修飾的)假定蛋白[毛螺菌科細菌NC2008]
>WP_029202018_(修飾的)假定蛋白[口小桿菌
屬某種(Oribacterium sp.)NK2B42]
>WP_028248456_(修飾的)假定蛋白[瘤胃假丁酸弧菌(Pseudobutyrivibrio ruminis)]
MYYQNLTKMYPISKTLRNELIPVGKTLENIRKNGILEADIQRKADYEHVKKLMDNYHKQLINEALQGVHLSDLSDAYDLY
>WP_028830240_(修飾的)假定蛋白[Proteocatella sphenisci]
申請人生成如圖40A-圖40L(例如,PACYC184 fnCpf1(PY001))和圖41A-圖41E(例如,PaCpf1)所示的載體構建體。
用於檢測FnCpf1的推定的PAM序列的PAM激發測定(圖42):申請人從新殺手法蘭西斯菌(Fn)中分離Cpf1座位(圖43)並且將其轉化到大腸桿菌中。在大腸桿菌中表現來自pACYC184的座位,類似於撒普拉那斯卡等人所述的實驗。
具有pACYC-FnCpf1座位的大腸桿菌=Cpf1+
具有空pACYC184的大腸桿菌=對照
申請人用PAM文庫質粒轉化Cpf1+和對照大腸桿菌。獲得兩個PAM文庫(圖44)。PAM文庫係含有31bp原型間隔區序列的pUC19質粒,該原型間隔區序列匹配FnCpf1座位中的間隔區1。PAM左文庫具有在原型間隔區的5’端處的8nt簡並性PAM。PAM右文庫具有在原型間隔區的3’端處的7nt簡並性PAM。申請人接種Cpf1+和對照大腸桿菌並且在~12h之後收穫所有菌落。每個菌落代表不會引起Cpf1進行切割/干擾的PAM-pUC19轉化事件。該等PAM-pUC19質粒不會攜帶可識別PAM。申請人藉由所有菌落的定序確定與對照相比哪些PAM-pUC19質粒不再存在,並且鑒定該等質粒含有可識別PAM。
pY0001的選殖:pY0001係具有部分FnCpf1座位的pACYC184骨架(來自NEB)。pY0001含有來自第4間隔區序列的255bp乙醯轉移酶3’序列的內源性FnCpf1座位。僅間隔區1-3係潛在地具有活性的,因為間隔區4不再側接同向重複序列。
申請人PCR擴增3個片段的FnCpf1座位並且使用吉布森元件將該等座位選殖到Xba1和Hind3切割的pACYC184中。
Cpf1 PAM篩選計算分析
在對篩選DNA定序之後,申請人提取出對應於左PAM或右PAM的區域。對於每個樣品,將定序文庫中存在的PAM數目與文庫中預期的PAM數目(對於左文庫為4^8,對於右文庫為4^7)進行比較。
左文庫示出PAM缺失。為了量化此缺失,申請人計算了富集比。針對兩種條件(對照pACYC或含有PaCpf1的pACYC),申請人將文庫中的每種PAM比率計算為:
申請人確定繪製的分佈顯示在對照樣品中幾乎沒有富集並且在兩種生物複製本中有富集。申請人收集比率超過8的所有PAM,並且繪製頻率分佈圖,揭示了5’YYN PAM(圖45A-圖45E)。申請人確認PAM係TTN,其中N係A/C/G或T。
申請人對tolerances弗朗西絲菌Cpf1座位進行RNA定序並且RNAseq分析顯示CRISPR座位表現活躍(圖46)。FnCpf1座位的RNAseq分析的另一個描繪示出在圖86中。除Cpf1和Cas基因之外,兩種小的非編碼轉錄物被高度轉錄,申請人推測的這兩種非編碼轉錄物係推定的tracrRNA。CRISPR陣列也被表現。兩種推定的tracrRNA和CRISPR陣列以與Cpf1和Cas基因相同的方向進行轉錄。在此藉由RNA定序實驗鑒定的所有RNA轉錄物映射到座位。放大Cpf1 CRISPR陣列,申請人鑒定了許多不同的短轉錄物。在此圖中,將所有鑒定的RNA轉錄物映射到Cpf1座位(圖47)。在選擇
小於85個核苷酸長度的轉錄物之後,申請人鑒定兩種推定的tracrRNA(圖48)。圖49示出了推定的tracrRNA 1和CRISPR陣列的放大的透視圖。圖50示出了推定的tracrRNA 2的放大的透視圖。圖51中指示了推定的crRNA序列。
申請人使用U6 PCR產物測試哺乳動物細胞中的功能:間隔區(DR-間隔區-DR)(在某些方面間隔區可以被稱為crRNA或指導RNA或者如本申請所述的類似術語)並且追蹤其他鑒定的Cpf1座位。
實例4:對於FnCpf1的其他確認實驗
申請人藉由使用圖52所列出的測定證實預測的FnCpf1 PAM係在體內的TTN。申請人用編碼具有5'TTN PAM的內源性間隔區1的pUC19轉化攜帶FnCpf1座位的細胞和對照細胞(圖53)。簡言之,在體內PAM確認測定中,用10ng攜帶原型間隔區1的質粒轉化50μl具有FnCpf1座位(測試菌株)或具有空pACYC184(對照菌株)的感受態大腸桿菌。前述原型間隔區序列係預測的PAM序列(TTC、TTG、TTA以及TTT)。在轉化之後,將細胞稀釋1:2000並且接種在含有氨苄西林和氯黴素的LB瓊脂板上。僅具有完整原型間隔區質粒的細胞可以形成菌落。在接種~14h後對具有菌落的板成像,並且使用ImageJ軟體計數菌落。
申請人進行細胞裂解物切割測定,以進一步驗證FnCpf1切割。用於細胞裂解物切割測定的方案如下:
體外切割反應。切割緩衝液:100mM HEPES pH 7.5、
500mM KCl、25mM MgCl2、5mM DTT、25%甘油。可以製備沒有DTT的儲備液。
製備細胞裂解物
裂解緩衝液:20mM Hepes pH 7.5、100mM氯化鉀[KCl]、5mM氯化鎂[MgCl2]、1mM二硫蘇糖醇[DTT]、5%甘油、0.1% Triton X-100,補充有10x羅氏(Roche)蛋白酶抑制劑混合物。可以維持裂解緩衝液w/o羅氏蛋白酶抑制劑和DTT的濃儲備液。保持在-20℃下。
用推薦量的具有Lipofectamine 2000的DNA轉染HEK細胞。
- 500ng/24孔
- 2000ng/6孔
在轉染後24-72小時收穫具有裂解緩衝液的細胞
-吸掉培養基
-用DPBS輕輕沖洗
-吸掉DPBS
-使用50ul裂解緩衝液/24孔或250ul/6孔
-置於冰上5min
-轉移到埃彭道夫管中
-冰凍15分鐘
-在高功率下超音波處理,50%工作循環,持續5-10min
-以最大速率旋轉減慢冷卻,持續20min
-將上清液轉移到新管中
-在PCR條管中等分試樣,每個條管10ul並且在-80℃下冷凍
指導RNA的體外轉錄
套組方案:可以在網址www.neb.com/products/e2030-hiscribe-t7-in-vitro-transcription-kit處獲得資訊
取用100uM儲備寡核苷酸
在10ul反應物中退火:
1ul T7“正向”股=“XRP2649”
1ul T7“反向”寡核苷酸
1ul TaqB緩衝液
7ul水
在未進行37℃培養步驟的情況下運行PNK PCR程式(基本上加熱至95℃,持續5min並且緩慢冷卻至4℃但不像surveyor退火一樣慢)。Nanodrop退火的寡核苷酸:用水標準化至500ng/ul(通常對於120nt寡核苷酸係1000-2000ng/ul)
對於T7轉錄,遵循套組說明書(但大小減短4x)
10ul反應物
1ul 10x緩衝液
1ul T7轉錄酶
0.5ul rNTP
0.5ul HMW mix
1ul DNA模板(退火)
6ul水
在42℃(較佳的是循環變溫器)中轉錄至少2-3小時,運行過夜。產率應係約1000-2000ng/ul的RNA。形成白色殘餘物係正常的。
DNA的製備
對於pUC19,用HindIII線性化並且進行柱純化
→將需要300-400ng質粒/反應,因此切割需要的量
對於gDNA,用PCR擴增wt細胞DNA
→進行多個PCR反應,合併並進行柱純化
→將產物濃縮至約100-200ng/ul
保持在-20℃
20ul反應物
10ul裂解物(這係預先等分的試樣)
2ul裂解緩衝液(NEB緩衝液3)
1ul RNA(直接來自以上產物;不需要純化)
1ul DNA(直接來自以上產物)
6ul水
在37℃下培養1-2小時(30min係足夠的)
柱純化該反應物
在2% E-gel上進行
細胞裂解物切割測定使用如圖54所示的位置1、2、3、4以及5處的tracrRNA。細胞裂解物切割測定(1)(圖55)係指示了在細胞裂解物中培養的具有TTa PAM的PCR片段和原型間隔區1序列的凝膠。細胞裂解物切割測定(2)(圖56)係示出了在細胞裂解物中培養的具有不同的PAM的pUC-間隔區1的凝膠。細胞裂解物切割測定(3)(圖57)係示出了在細胞裂解物中培養之後的BasI消化的凝膠。細胞裂解物切割測定(4)(圖58)係示出了三種推定的crRNA序列的消化結果的凝膠。
申請人還確定了間隔區長度對於切割效率的影響。申請人測試了對針對含有靶位點:5'-TTAgagaagtcatttaataaggccactgttaaaa-3'的靶DNA片段(SEQ ID NO:119)的不同長度的間隔區的凝膠。對於此實驗,將含有間隔區(5’-TTcgagaagucauuuaauaaggccacuguuaaaa-3’(SEQ ID NO:120))的pUC19質粒處理成以下狀態:
2ul含有Cpf1的細胞裂解物
2ul具有間隔區的pUC19 DNA(300ng)
1ul crRNA(500ng)
2ul NEBuffer 3
2ul 40mM DTT
0.3ul BsaI
10.7ul ddH2O
在37℃下培養30分鐘,接著用RNA酶處理5分鐘。然後使用Qiagen PCR純化套組純化反應物並且在2% Invitrogen E-gel EX上分析。圖59係顯示在體外crRNA 1-7介導了使用FnCpf1對靶DNA的成功切割而crRNA 8-13並不利於靶DNA的切割的凝膠。
申請人得到了最少的Fn Cpf1座位(圖60)並且還闡明了最少的Cpf1指導(圖61)。申請人還切割了人類Emx1座位的PCR擴增子(圖81)。將EMX擴增子處理成以下狀態:
2ul含有Cpf1的細胞裂解物
3ul具有間隔區的pUC19 DNA(300ng)
1ul crRNA(500ng)
2ul NEBuffer 3
2ul 40mM DTT
0.3ul BsaI
9.7ul ddH2O
在37℃下培養30分鐘,接著用RNA酶處理5分鐘。然
後使用Qiagen PCR純化套組純化反應物並且在2% Invitrogen E-gel EX上分析。
申請人進一步研究了5’ DR的截短對切割活性的影響(圖82A-圖82B)。對於此實驗,將含有間隔區(5’-TTcgagaagucauuuaauaaggccacuguuaaaa-3’(SEQ ID NO:121))的pUC19質粒處理成以下狀態:
2ul含有Cpf1的細胞裂解物
2ul具有間隔區的pUC19 DNA(300ng)
1ul crRNA(500ng)
2ul NEBuffer 3
2ul 40mM DTT
0.3ul BsaI
10.7ul ddH2O
在37℃下培養30分鐘,接著用RNA酶處理5分鐘。然後使用Qiagen PCR純化套組純化反應物並且在2% Invitrogen E-gel EX上分析。申請人確定crDNA δDR5破壞了5’端的莖環並且這顯示5’端的莖環係對於切割活性所必需的(圖82B)。
申請人研究了crRNA-DNA靶錯配對切割效率的影響(圖83)。對於此實驗,將含有間隔區(5’-TTcgagaagucauuuaauaaggccacuguuaaaa-3’(SEQ ID NO:122))的pUC19質粒處理成以下狀態:
2ul含有Cpf1的細胞裂解物
2ul具有間隔區的pUC19 DNA(300ng)
1ul crRNA(500ng)
2ul NEBuffer 3
2ul 40mM DTT
0.3ul BsaI
10.7ul ddH2O
在37℃下培養30分鐘,接著用RNA酶處理5分鐘。然後使用Qiagen PCR純化套組純化反應物並且在2% Invitrogen E-gel EX上分析。圖83所示的凝膠中的各泳道由含有Cpf1的細胞裂解物、具有TTc原型間隔區的pUC19、以及相應crRNA組成,如1-11所指示的。
申請人研究了FnCpf1p RuvC結構域並且已鑒定可以將FnCpf1效應蛋白轉化成切口酶的胺基酸突變,由此該效應蛋白具有基本上減小的核酸酶活性並且僅一條DNA股被切口和/或切割。FnCpf1p RuvC結構域中的胺基酸位置包括但不限於D917A、E1006A、E1028A、D1227A、D1255A、N1257A、D917A、E1006A、E1028A、D1227A、D1255A和N1257A。AsCpf1中的胺基酸位置對應於AsD908A、AsE993A、AsD1263A。LbCpf1中的胺基酸位置對應於LbD832A。
申請人還鑒定了與PD-(D/E)XK核酸酶超家族和
HincII內切核酸酶樣最類似的推定的第二核酸酶結構域。在此推定的核酸酶結構域中產生的大幅度降低核酸酶活性的點突變包括但不限於N580A、N584A、T587A、W609A、D610A、K613A、E614A、D616A、K624A、D625A、K627A和Y629A。
申請人使用FnCpf1p進行質粒切割實驗並且所述質粒的定序將提供關於切割位點係黏性還是鈍性的資訊。申請人將由適合複合物中的FnCpf1p的晶體結構闡明關於此蛋白質的不同結構域的其他詳情。對於FnCpf1座位件在人類細胞中的活性的優化,申請人將嘗試不同的crRNA體系結構並且嘗試比在此所述更多的靶標。
申請人使用純化的弗朗西絲菌和普雷沃菌Cpf1切割DNA(圖84)。對於此實驗,將含有間隔區(5’-TTcgagaagucauuuaauaaggccacuguuaaaa-3’(SEQ ID NO:123))的pUC19質粒處理成以下狀態:
2ul純化的蛋白質溶液
2ul具有間隔區的pUC19 DNA(300ng)
1ulcrRNA(500ng)
2ulNEBuffer 3
2ul40 mM DTT
0.3ulBsaI
10.7ulddH2O
在37℃下培養30分鐘,接著用RNA酶處理5分鐘。然後使用Qiagen PCR純化套組純化反應物並且在2% Invitrogen E-gel EX上分析。在圖84中示出的凝膠的分析指示PaCpf1可以與FnCpf1 crRNA一起作用,儘管該活性不像FnCpf1一樣高。申請人推斷這係有意義的,考慮到PaCpf1和FnCpf1的莖環序列係幾乎相同的(僅1個鹼基不同)(參見圖85A-圖85B)。這在圖87A-圖87B中所示的FnCpf1和PaCpf1的成熟crRNA序列中進一步突出。在本發明的較佳的實施方式中,生物化學或體外切割可以不需要用於Cpf1p CRISPR系統的有效功能的tracr序列。包含莖環或進一步優化的莖環結構對於切割活性而言是重要的。
藉由人類密碼子優化的新殺手弗朗西絲菌FnCpf1p進行DNA切割。
申請人還顯示FnCpf1p切割在人類細胞中的DNA。將400ng人類密碼子優化的FnCpf1p和100ng U6::crRNA轉染到24孔板中的每個孔中的HEK293T細胞(~240,000個細胞)。採用包含基於5’-ctgatggtccatgtctgttactcg-3’(SEQ ID NO:124)(即,前20、21、22、23或所有24nt)的長度為20-24nt的間隔區序列的五種crRNA。crRNA進一步包含PaCpf1在間隔區的5’處的20nt 5’重複序列。申請人早期確定來自PaCpf1的重複序列可以被FnCpf1識別。
在~60h之後收穫DNA並且藉由SURVEYOR核酸酶測定進行分析。用於DNMT1的SURVEYOR引物係5’-ctgggactcaggcgggtcac-3’(SEQ ID NO:125)(正向)和5’-cctcacacaacagcttcatgtcagc-3’(SEQ ID NO:126)(反向)。對於
所有五種crRNA(間隔區長度20-24nt)觀察到與預期的~345bp和~261bp的切割產物符合的切割的DNA片段。(圖88)。
實例5:對於PaCpf1的其他確認實驗
對於易北普雷沃菌Cpf1(PaCpf1)進行PAM計算篩選,這與如實例3詳述的對於FnCpf1進行的篩選類似。在對篩選DNA定序之後,提取出對應於左PAM或右PAM的區。對於每個樣品,將定序文庫中存在的PAM數目與文庫中預期的PAM數目(4^7)進行比較。左文庫顯示出非常輕微的PAM缺失。為了量化此缺失,計算了富集比。針對兩種條件(對照pACYC或含有PaCpf1的pACYC),根據以下公式針對文庫中的每種PAM計算該比率:
繪製的分佈顯示在對照樣品中幾乎沒有富集並且在兩種生物複製本中有富集。收集比率超過4.5的所有PAM,並且繪製頻率分佈圖,揭示了5’TTTV PAM,其中V係A或C或G(圖62A-圖62E)。
申請人將由適合複合物中的PaCpf1p的晶體結構闡明關於此蛋白質的不同結構域的其他詳情。對於PaCpf1座位件在人類細胞中的活性的優化,申請人將以不同的crRNA(指導RNA)體系結構和不同優化的PaCpf1效應蛋白為工作物件。申請人已如下地人類密碼子優化PaCpf1序列:
NLS(底線)
GS接頭(粗體)
3×HA標籤(斜體)
用於人類密碼子優化的PaCpf1序列的載體圖譜提供
在圖63中。
實例6:Cpf1異種同源物
申請人分析Cpf1異種同源物的擴增庫(圖64)。對於幾種Cpf1座位件獲得人類密碼子優化序列(圖65-圖79)。申請人也得到了每種異種同源物的同向重複(DR)序列及其預測的折疊結構(圖80A-圖80I)。
申請人基於效應蛋白的大小來進一步研究Cpf1異種同源物,即較小效應蛋白允許更容易包裝到載體中並且包裝在PAM組成上。所有方面允許在原核細胞和真核細胞中進一步優化,較佳的是對於哺乳動物細胞(即人類細胞)中的有效活性。
申請人證實以下座位的效應蛋白異種同源物在體外切割測定中顯示活性:佩萊格裡尼菌科細菌GW2011_GWA2_33_10 Cpf1、胺基酸球菌屬某種BV3L6 Cpf1、土拉熱弗朗西絲菌1 Cpf1、牛莫拉氏菌237 Cpf1、毛螺菌科細菌ND2006 Cpf1、毛螺菌科細菌MA2020 Cpf1、獼猴卟啉單胞菌Cpf1、狗口腔卟啉單胞菌3 Cpf1、易北普雷沃菌Cpf1(圖64)。
在藉由異種同源物進行的體外切割測定中,收穫了表現Cpf1異種同源物的HEK293細胞並且用靶向選殖到pUC19質粒的人工間隔區的預測的成熟crRNA培養裂解物。間隔區在8個簡並性鹼基之前,以允許經由定序確定PAM。較低的帶表示由Cpf1酶進行的切割(圖89)。
申請人由體外切割測定確定計算得出的PAM(圖90)。
切斷來自圖89的未切割DNA(較高的帶)並且擴增以進行下一代定序。計算每種8聚體的豐度並且使用與輸入文庫相比的對數比率,以量化富集。彙編具有大於4的對數比率的單個8聚體並且將其用於使用Weblogo測定共有PAM。
申請人進一步確定Cpf1p效應蛋白以交錯切割的方式切割,產生了5’突出端。收穫純化的FnCpf1蛋白並且用crRNA培養並且將相應靶標選殖到pUC19中。凝膠提取切割的產物並且提交以進行桑格定序。不對稱的讀取顯示存在交錯切割(圖91)。在本發明的一較佳的實施方式中,申請人證實與模板(例如,外源性模板)的體內交錯連接。
申請人還確定了間隔區長度對於效應蛋白切割能力的影響(圖92)。收穫純化的FnCpf1蛋白並且用crRNA培養並且將相應靶標選殖到pUC19中。大於17nt的間隔區長度切割至完成,而17nt間隔區顯示減少的活性並且小於17nt的間隔區係無活性的。
申請人證實FnCpf1了HEK293T細胞中的indel形成。
用350ng huFnCpf1質粒和150ng U6::crRNA轉染~280,000 HEK細胞/24孔。在轉染後三天收穫細胞並且藉由SURVEYOR核酸酶測定進行分析。未切割的PCR片段大小係606bp。對於crRNA DNMT1-1,預期的片段大小係~418bp和~188bp並且對於crRNA DNMT1-3係~362bp和~244bp(圖93)。
DNMT1-1間隔區序列:cctcactcctgctcggtgaattt(SEQ ID NO:128)
DNMT1-3間隔區序列:ctgatggtccatgtctgttactc(SEQ ID NO:129)
申請人藉由確定當座位的某些序列缺失時轉錄物是否被加工來鑒定Cpf1系統實現切割所需要的元件(圖94A-圖94F)。缺失的序列可以包括但不限於,Cas1基因、Cas2基因和tracr。因此,在本發明的一較佳的實施方式中,申請人證實該tracr不是功能性Cpf1系統或複合物實現切割所需要的元件。
實例7:異源
質粒的程序性生成
為了生成用於異源表現的FnCpf1座位,使用Herculase II聚合酶(安捷倫科技公司)PCR擴增來自新殺手弗朗西絲菌的基因組DNA並且使用吉布森選殖(新英格蘭生物實驗室)將其選殖到pACYC-184中。將具有質粒的細胞用Z-感受態套組(Zymo公司)製成感受態的。
細菌RNA定序
藉由首先將新殺手弗朗西絲菌(由大衛.魏斯(David Weiss)惠贈)或大腸桿菌重新懸浮在TRIzol中並且然後在BeadBeater(BioSpec Products公司)中用氧化鋯/二氧化矽珠粒(BioSpec Products公司)均質化該細菌持續3個一分鐘循環,將RNA從固定相細菌中分離。藉由Direct-Zol RNA小量製備方案(Zymo公司)從均質化樣品中純化總的RNA,用TURBO DNA酶(生命技術公司)對其進行DNA酶處理,並且用T4多核苷酸激酶
(新英格蘭生物實驗室)進行3’脫磷酸化。用細菌Ribo-Zero rRNA去除套組(億明達公司)去除rRNA。使用億明達的NEBNext® Small RNA Library Prep Set(新英格蘭生物實驗室)由rRNA-缺失的RNA製備RNA文庫並且使用Pippin Prep(聖徒科學公司(Sage Science))進行大小選擇。
對於FnCpf1座位的異源大腸桿菌表現,使用先前描述的CRISPR RNA定序方法的衍生物由rRNA-缺失RNA製備RNA定序的文庫(海德里希(Heidrich)等人,2015。簡言之,轉錄物以大腸桿菌Poly(A)聚合酶(新英格蘭生物實驗室)進行poly-A加尾,使用T4 RNA連接酶1(ssRNA連接酶)高濃縮物(High Concentration)(新英格蘭生物實驗室)將其與5’ RNA銜接子連接,並且使用AffinityScript多溫度逆轉錄酶(安捷倫技術公司)進行逆轉錄。使用條形編碼的引物使用Herculase II聚合酶(安捷倫技術公司)PCR擴增cDNA。RNA-定序分析
在MiSeq(億明達公司)上對製備的cDNA文庫進行定序。基於相關條形編碼鑒定每種樣品的讀取,並且使用BWA將其與適當RefSeq參考基因組進行比對(李和德賓(Durbin),2009)。使用成對末端比對,使用皮卡(Picard)工具(http://broadinstitute.github.io/picard)提取整個轉錄物序列,並且使用Geneious 8.1.5.分析哲學序列。
體內FnCpf1 PAM篩選
使用合成的寡核苷酸(IDT)構建隨機化PAM質粒文庫,該寡核苷酸由間隔區1靶標上游或下游的7個隨機化核苷酸組
成(輔助表S8)。藉由退火到短引物並且使用大的克列諾片段(新英格蘭生物實驗室)用於第二條股合成來製成雙股隨機化ssDNA寡核苷酸。使用吉布森選殖將dsDNA產物組裝到線性pUC19中(新英格蘭生物實驗室)。用選殖的產物轉化感受態的Stb13大腸桿菌(英傑公司),並且收集併合並超過107個細胞。使用Maxi-prep套組(凱傑公司)收穫質粒DNA。我們將360ng合併的文庫轉化到攜帶FnCpf1座位或pACYC184對照的大腸桿菌中。在轉化之後,將細胞接種在氨苄西林上。在生長16小時後,收穫>4*106個細胞並且使用Maxi-prep套組(凱傑公司)提取質粒DNA。擴增靶PAM區域並且以單端150個循環使用MiSeq(億明達公司)進行定序。
計算的PAM發現流程
將PAM區域提取、計數並且標準化成每種樣品的總讀取。對於給定的PAM,將富集測量為與pACYC184對照相比的對數比率,其中具有0.01假計數調整。收集超過3.5富集閾值的PAM並且將其用於生成序列圖示(克魯克斯(Crooks)等人,2004)。
PAM確認
將與PAM、非-PAM二者相對應的序列選殖到消化的pUC19並且將其與T4連接酶(Enzymatics公司)連接。用20ng PAM質粒轉化具有FnCpf1座位質粒或pACYC184對照質粒的感受態大腸桿菌,並且將其接種在補充有氨苄西林和氯黴素的LB瓊脂板上。在18小時計數菌落。
crRNA和gRNA的合成
使用HiScribeTM T7高產率RNA合成套組(NEB)合成體外使用的所有crRNA和gRNA。由IDT合成與靶RNA序列的反向互補序列相對應的ssDNA寡核苷酸並且退火到短T7引物序列上。進行4小時的T7轉錄並且然後使用MEGAclearTM轉錄純化套組(Ambion公司)純化RNA。
Cpf1蛋白質的純化
將FnCpf1蛋白質選殖到細菌表現載體(6-His-MBP-TEV-Cpf1,它係一種由道格.丹尼爾斯(Doug Daniels)惠贈給申請人的基於pET的載體)(“6-His”被揭露為SEQ ID NO:130)中。用10mL含有Cpf1表現構建體的過夜培養的Rosetta(DE3)pLyseS(EMD密理博公司)接種兩升具有100μg/mL氨苄西林的Terrific Broth生長培養基。生長培養基加上接種體在37℃下生長,直到細胞密度達到0.2 OD600為止,然後將溫度降低到21℃。繼續生長直到OD600達到0.6為止,之後添加終濃度500μM IPTG以誘導MBP-Cpf1表現。將培養物誘導14-18小時,之後收穫細胞並在-80℃下冷凍,直到進行純化。
將細胞糊狀物重新懸浮在200mL補充有蛋白酶抑制劑(羅氏cOmplete,無EDTA)和溶菌酶的裂解緩衝液(50mM Hepes pH 7、2M NaCl、5mM MgCl2、20mM咪唑)。一旦均質化,就藉由超音波處理(必能信(Branson)超音波儀450)來裂解細胞,然後在10,000g下離心1小時來清出裂解物。藉由0.22微米過濾器(密理博公司,Stericup)過濾裂解物,並且將其應用於鎳柱(HisTrap FF,5mL),用梯度的咪唑洗滌並且然後洗提。將含有預期大小的
蛋白質的級分合併,添加TEV蛋白酶(西格瑪公司),並且將樣品在TEV緩衝液(500mM NaCl、50mM Hepes pH 7、5mM MgCl、2mM DTT)中透析過夜。在透析之後,藉由SDS-PAGE證實TEV切割,並且將樣品濃縮至500μL,之後經由FPLC(AKTA Pure)裝載到凝膠過濾柱(HiLoad 16/600 Superdex 200)上。藉由SDS-PAGE分析來自凝膠過濾的級分;將含有Cpf1的級分合併並濃縮至200μL,並且將其直接用於生物化學測定或在-80℃下冷凍儲存。在以2M NaCl、Hepes pH 7.0平衡的相同柱上運行凝膠過濾標準,以計算FnCpf1的近似大小。
Cpf1蛋白裂解物的生成
用N-末端核定位標籤合成密碼子優化用於人類表現的Cpf1蛋白並且將其藉由Genscript選殖到pcDNA3.1表現質粒中。使用Lipofectamine 2000試劑(生命技術公司)將2000ng Cpf1表現質粒以90%融合度轉染到6孔板的HEK293FT細胞中。48小時後,藉由用DPBS(生命技術公司)洗滌一次並且在裂解緩衝液[20mM Hepes pH 7.5、100mM KCl、5mM MgCl2、1mM DTT、5%甘油、0.1% Triton X-100、1X cOmplete蛋白酶抑制劑混合片劑(羅氏公司)]中擦洗來收穫細胞。將裂解物在Biorupter超音波破碎器(Diagenode公司)中超音波處理10分鐘並且然後離心。將上清液冷凍以隨後用於體外切割測定。
體外切割測定
使用純化的蛋白質或具有蛋白質的哺乳動物裂解物在37℃下在切割緩衝液(NEBuffer 3,5mM DTT)中進行體外切
割,持續20分鐘。切割反應使用500ng合成的crRNA或sgRNA以及200ng靶DNA。靶DNA涉及選殖到pUC19的原型間隔區或來自從HEK293細胞分離的基因組DNA的基因區域的PCR擴增子。使用PCR純化柱(凱傑公司)純化反應物並且在2%瓊脂E-gel(生命技術公司)上運行。對於分析核酸酶突變體進行的切割的天然和變性凝膠,在TBE 6%聚丙烯醯胺或TBE-Urea 6%聚丙烯醯胺凝膠(生命技術公司)上運行純化反應。
體外Cpf1-家族蛋白PAM篩選
在2%瓊脂E-gel(生命技術公司)上運行使用Cpf1-家族蛋白的體外切割反應。QIAquick凝膠提取套組(凱傑公司)來凝膠提取與未切割靶標相對應的帶,並且以單端150個循環使用MiSeq(億明達公司)對靶PAM區域進行擴增和定序。將定序結果輸入到PAM發現流程中。
Cpf1切割在293FT細胞中的活性
用N-末端核定位標籤合成密碼子優化用於人類表現的Cpf1蛋白並且將其藉由Genscript選殖到pcDNA3.1 CMV表現質粒中。使用Herculase II(安捷倫技術公司)生成包含驅動crRNA序列表現的U6啟動子的PCR擴增子。使用Lipofectamine 2000試劑(生命技術公司)將400ng Cpf1表現質粒和100ng crRNA PCR產物以75%-90%融合度轉染到24孔板的HEK293FT細胞中。使用QuickExtractTM DNA提取溶液(Epicentre公司)收穫基因組DNA。
用於基因組修飾的SURVEYOR核酸酶測定
使用Lipofectamine 2000試劑(生命技術公司),用400ng Cpf1表現質粒和100ng U6::crRNA PCR片段轉染293FT細胞。轉染後72h在37℃下培養細胞,之後進行基因組DNA提取。根據製造商方案使用QuickExtract DNA提取溶液(Epicentre公司)提取基因組DNA。對側接每個基因的CRISPR靶位點的基因組區域進行PCR擴增,並且根據製造商方案使用QiaQuick自旋柱(凱傑公司)純化產物。將總計200-500ng純化的PCR產物與1μl 10×耐熱性DNA聚合酶PCR緩衝液(Enzymatics公司)和超純水混合至10μl的最終體積,並且經受重退火過程,以使得能夠形成異源雙股體:95℃持續10min,以-2℃/s從95℃降溫至85℃,以-0.25℃/s從85℃降溫至25℃,並且25℃維持1min。在重退火之後,根據製造商推薦的方案,用SURVEYOR核酸酶和SURVEYOR增強子S(綜合DNA技術公司(Integrated DNA Technologies))處理產物,並且在4%-20% Novex TBE聚丙烯醯胺凝膠(生命技術公司)上進行分析。將凝膠用SYBR Gold DNA著色劑(生命技術公司)染色10分鐘並且用Gel Doc凝膠成像系統(伯樂生命醫學產品公司(Bio-rad))進行成像。基於相對帶強度進行量化。藉由等式100×(1-(1-(b+c)/(a+b+c))1/2)確定Indel百分比,其中a係未消化的PCR產物的積分強度,並且b和c係每種切割產物的積分強度。
表徵293FT細胞中的Cpf1 indel模式的深度定序
如所述地轉染並收穫HEK293FT細胞,以用於評定Cpf1切割的活性。使用兩輪PCR區域來擴增側接DNMT1靶標的基因組區域,以將Illumina P5銜接子以及獨特樣品特異性條形編碼
添加到靶擴增子中。在2% E-gel(英傑公司)運行PCR產物並且按照製造商推薦的方案使用QiaQuick自旋柱(凱傑公司)進行凝膠提取。將樣品合併並且藉由Qubit 2.0螢光計(生命技術公司)進行量化。在MiSeq(億明達公司)上對製備的cDNA文庫進行定序。使用Geneious 6.0.3讀取測繪儀的Python實現方式繪製Indel。
Cpf1座位的計算分析
使用PSI-BLAST程式(安特斯庫爾,1997),使用幾種已知的Cpf1序列作為Cpf1的查詢來鑒定NCBI NR資料庫中的Cpf1同源物,其中具有0.01的截止E-值和低複雜度過濾以及基於組成的統計學關閉。使用具有0.01的截止E值和低複雜度過濾關閉參數的TBLASTN程序,使用Cpf1譜圖(瑪拉柯瓦(Marakova)等人,2015)作為查詢,搜索NCBI WGS資料庫。將所有搜索的結果組合。使用具有預設參數的HHpred程式,使用代表性Cpf1查詢的子集,鑒定遠距離序列相似性(塞汀等人,2006)。使用MUSCLE(愛德格,2004)構建多序列比對,其中基於使用PSI-BLAST和HHpred程序獲得的成對比對進行手動校正。使用具有WAG進化模式和離散性γ模式(具有20比率類別)的FastTree程式進行系統發育性分析(普裡斯等人,2010)。使用Jpred 4預測蛋白質二級結構(德羅茲德斯基,2015)。
使用PILER-CR(愛德格,2007)和CRISPRfinder(格麗莎(Grissa)等人,2007)鑒定CRISPR重複序列。使用具有預設參數(除字體大小設為20並且E截止值為0.0001之外)的MEGABLAST(莫耳古利斯(Morgulis)等人,2008)搜索NCBI核
苷酸NR資料庫中的間隔區序列。
實例8:土拉熱弗朗西絲菌新殺手亞種U112 Cpf1(FnCpf1)的選殖
申請人將土拉熱弗朗西絲菌新殺手亞種U112(圖95A)Cpf1(FnCpf1)座位選殖到低拷貝質粒(pFnCpf1)中,以允許在大腸桿菌中異源性重構。典型地,在目前表徵的CRISPR-Cas系統中,對於DNA干擾存在兩種要求:(i)靶序列必須與存在於對應CRISPR陣列中的間隔區匹配,並且(ii)與該間隔區(在下文中是原型間隔區)互補的靶序列必須側接適當的原型間隔區相鄰模體
(PAM)。考慮到FnCpf1 CRISPR座位的完全未表徵的功能,設計質粒缺失測定以確定Cpf1的活性並且鑒定PAM序列及其相對於原型間隔區(5’或3’)的位置(圖95B)。用隨機化的5’或3’ 7bp序列構建攜帶匹配FnCpf1 CRISPR陣列中的第一間隔區的原型間隔區的兩個質粒文庫。將每個質粒文庫轉化到異源表現FnCpf1座位的大腸桿菌或者攜帶空載體的對照大腸桿菌菌株中。使用此測定,藉由鑒定在異源表現FnCpf1座位的細胞中優先缺失的核苷酸模體來確定PAM序列和位置。發現FnCpf1的PAM位於原型間隔區的替換股5’端上游並且具有序列5’-TTN(圖95C-圖95D和圖102)。在I型CRISPR系統中也觀察到PAM的5’位置,但是在II型系統中未觀察到,其中Cas9採用位於原型間隔區3’端的PAM序列(莫西卡等人,2009;加爾諾(Garneau)等人,2010)。除PAM鑒定之外,缺失測定的結果明確指示異源表現的Cpf1座位能夠被質粒DNA有效干擾。
為了進一步表徵PAM,藉由用攜帶側接5’-TTN PAM的原型間隔區1的質粒轉化表現cpf1座位的細胞來分析質粒干擾活性。有效靶向所有5’-TTN PAM(圖1E)。此外,還有效靶向5’-CTA而不是5’-TCA(圖95E),這表明中間T對於PAM識別比第一個T更關鍵,並且與PAM發現測定(圖102D)中缺失的序列模體一致,該PAM可能比5’-TTN更鬆弛。
實例9:Cpf1 CRISPR陣列獨立於tracrRNA來加工
使用小RNAseq確定由基於cpf1的CRISPR座位產生的crRNA的完整性質。藉由對從土拉熱弗朗西絲菌新殺手亞種U112
培養物中提取的小RNA進行定序,發現CRISPR陣列被加工成長度為42-44nt的短成熟crRNA。每個成熟crRNA開始於同向重複序列的19nt,接著係間隔區序列的23-25nt(圖96A)。此crRNA安排與II型CRISPR-Cas系統中的安排相反,在該系統中成熟crRNA開始於間隔區序列的20-24nt,接著係同向重複序列的~22nt(德爾特切瓦等人,2011;吉林斯基等人,2013)。出乎意料地是,除crRNA之外,我們沒有在可以對應於tracrRNA的弗朗西絲菌cpf1座位附近觀察到任何強勁表現的小轉錄物,該等轉錄物與基於Cas9的系統相關聯。
為了證實crRNA成熟和DNA干擾不需要另外的RNA,使用合成的啟動子構建表現質粒以驅動弗朗西絲菌cpf1(FnCpf1)和CRISPR陣列(pFnCpf1_min)的表現。表現此質粒的大腸桿菌的小RNAseq仍顯示將CRISPR陣列強勁加工成成熟crRNA(圖96B),這指示FnCpf1及其CRISPR陣列足以實現crRNA加工。另外,表現pFnCpf1_min以及pFnCpf1_△Cas的大腸桿菌係所有cas基因都已去除但保留驅動FnCpf1和CRISPR陣列表現的天然啟動子的質粒,它也展示了強勁DNA干擾,這表明FnCpf1和crRNA足以用於介導DNA靶向(圖96C)。相反,Cas9需要crRNA和tracrRNA二者來介導靶向的DNA干擾(德爾特切瓦等人,2011;張等人,2013)。
實例10:Cpf1係單一的crRNA指導性內切核酸酶。
考慮到Cas9藉由crRNA與tracrRNA之間的雙股結構,FnCpf1可以與單獨的crRNA介導DNA干擾的發現結果係非常令人驚奇的(金科等人,2012;西松等人,2014),以及tracrRNA的3’
二級結構(徐等人,2013;西松等人,2014)來識別crRNA。為了確保crRNA確實足以與FnCpf1形成活性複合物並且介導RNA-指導的DNA切割,針對靶DNA的體外切割測試僅供應有crRNA的FnCpf1。針對其切割在細菌DNA干擾實驗(圖97A)中使用的含有相同原型間隔區1的質粒的能力測定純化的FnCpf1(圖103)。具有體外轉錄的成熟crRNA靶向原型間隔區1的FnCpf1能夠以Mg2+-和crRNA-依賴性方式有效切割靶質粒(圖97B)。此外,FnCpf1能夠切割超螺旋和線性靶DNA(圖97C)。該等結果明確證實FnCpf1和crRNA足以用於RNA指導的DNA切割。
還使用切割的DNA末端的桑格定序來繪製FnCpf1的切割位點。FnCpf1介導的切割形成5-nt 5’突出端(圖97A、圖97D和圖104),該突出端不同於由Cas9生成的鈍切割產物(加爾諾等人,2010;金科等人,2012;加西烏納斯等人,2012)。FnCpf1的交錯切割位點遠離PAM:在非靶向(+)股上的第18個鹼基之後和在靶向(-)股上的第23個鹼基之後發生切割(圖97A、圖97D和圖104)。使用具有不同PAM序列的雙股寡核苷酸底物,我們還發現當5’-TTN PAM處於雙股體形式(圖97E)時FnCpf1切割靶DNA,這與Cas9的PAM相反(斯騰伯格等人,2014)。
實例11:Cpf1的RuvC樣結構域介導了RNA指導的DNA切割
Cpf1的RuvC樣結構域保留內切核酸酶的此家族的所有催化殘基(圖98A和圖105)並且因此預測係活性核酸酶。生成三種突變體FnCpf1(D917A)、FnCpf1(E1006A)和FnCpf1(D1225A)(圖98A),以測試保守性催化殘基是否是FnCpf1的核酸酶活性所
必需的。D917A和E1006A突變完全滅活FnCpf1的DNA切割活性,並且D1255A顯著降低了溶核活性(圖98B)。該等結果與釀膿鏈球菌Cas9(SpCas9)的誘變結果相反,其中RuvC(D10A)和HNH(N863A)核酸酶結構域的突變將SpCas9轉化成DNA切口酶(即這兩種核酸酶結構域各自的滅活消除了一條DNA股的切割)(金科等人,2012;加西烏納斯等人,2012)(圖98B)。該等發現結果表明FnCpf1的RuvC樣結構域切割可能處於二聚體構型中的靶DNA的兩條股(圖103B)。
實例12:Cpf1 crRNA的序列和結構
與具有和Cas9相互作用的精細RNA二級結構特徵的Cas9的指導RNA相比(西松等人,2014),FnCpf1的指導RNA係顯著更簡單的並且僅包含同向重複序列中的單一莖環(圖97A)。
探尋了用於與FnCpf1一起介導DNA切割的crRNA的序列和結構要求。檢查指導序列的長度。觀察16nt指導序列以實現可檢測的DNA切割並且18nt的指導序列實現有效的體外DNA切割(圖99A)。該等長度類似於對於SpCas9證實的長度,其中16至17nt間隔區序列足以用於DNA切割(森席克(Cencic)等人,2014;付等人,2014)。FnCpf1指導RNA的種子區在間隔區序列的5’端上的前6或7nt內觀察到(圖99B)。
研究同向重複序列突變對於RNA指導的DNA切割活性的影響。成熟crRNA的同向重複序列部分係19nt長(圖96A)。同向重複序列的截短顯示16nt係足夠的,但最佳地超過17nt的同向重複序列有效用於切割。保存RNA雙股體的莖環中的突變並不
影響切割活性,而破壞莖環雙股體結構的突變消除了切割(圖99D)。最終,環區域中的鹼基取代並不影響核酸酶活性,而緊接著在間隔區序列的5’的U取代基本上降低了活性(圖5E)。總之,該等結果表明FnCpf1藉由莖環的序列特異性和結構特徵的組合來識別crRNA。
實例13:來自不同細菌的Cpf1家族蛋白共用了一般crRNA結構和PAM
為了研究Cpf1作為基因組編輯工具的用途,探索了在公共序列資料庫中可獲得的Cpf1家族蛋白的多樣性。在NCBI除的WGS資料庫的BLAST搜索揭示了46種非冗餘Cpf1家族蛋白(圖64)。基於系統發育重構(圖64)選擇16種作為Cpf1多樣性的代表(圖100A-圖100B和圖106)。該等Cpf1家族蛋白跨越~1200個與~1500個胺基酸之間的長度範圍。
該等Cpf1家族蛋白各自的同向重複序列顯示在該同向重複序列的3’處的19個核苷酸中的強保守性,這係重複序列包括在加工的crRNA中的部分(圖100C)。同向重複序列的5’序列係更加多樣的。選擇用於分析的16種Cpf1家族蛋白中的三種(2-毛螺菌科細菌MC2017,Lb3Cpf1;3-解朊丁酸弧菌,BpCpf1;以及6-密斯氏菌屬某種SC_K08D17,SsCpf1)與和FnCpf1同向重複序列顯著趨異的同向重複序列相關聯(圖100C)。值得注意地是,該等同向重複序列保留與FnCpf1同向重複序列相同或幾乎相同的莖環結構(圖100D)。
測試直源同向重複序列支援體外FnCpf1核酸酶活性
的能力。含有保守性莖序列的同向重複序列能夠與FnCpf1可互換地起作用。來自候選物3(BpCpf1)的同向重複序列支持低水平的FnCpf1核酸酶活性(圖100E),這可能是由於3’-大部分U的保守性。
使用體外PAM鑒定測定(圖107A)確定每種Cpf1家族蛋白的PAM序列。鑒定7種新Cpf1家族蛋白的PAM序列(圖100E和圖107B-圖107C),並且篩選證實FnCpf1的PAM為5’-TTN。Cpf1-家族蛋白的PAM序列主要係T富集的,主要造構成每種PAM的T數目方面改變(圖100F和圖107B-圖107C)。
實例14:Cpf1可以用於促進人類細胞中的基因組編輯
對Cpf1家族蛋白進行密碼子優化並且使其連接用於最佳表現的C-末端核定位信號(NLS)與人類細胞中的核靶向(圖101A)。為了測試每種Cpf1家族蛋白的活性,在DNMT1基因內選擇指導RNA靶位點(圖101B)。每種Cpf1家族蛋白連同其被設計成靶向DNMT1的對應crRNA能夠體外切割DNMT1基因組區域的PCR擴增子(圖101C)。當在人類胚腎293FT(HEK 293FT)細胞中測試中,2種Cpf1家族蛋白(7-AsCpf1和13-LbCpf1)在所採用的條件下展現出可檢測水平的核酸酶誘導的indel(圖101C和圖101D)。
測試具有另外基因組靶標的每種Cpf1-家族蛋白。AsCpf1和LbCpf1一致地介導HEK293FT細胞中強勁基因編輯(圖101E和圖108)。當與Cas9相比時,AsCpf1和LbCpf1介導了可比較水平的indel形成(圖101E)。另外,我們使用體外切割,隨後進行切割DNA端的桑格定序,並且發現7-AsCpf1和13-LbCpf1也生成
了交錯切割位點(圖101D和圖107E)。
以下是FnCpf1構建體和異種同源物的核苷酸和胺基酸序列。
FnCpf1座位序列
pFnCpf1
內源性新殺手弗朗西絲菌乙醯轉移酶的5’端(FnCpf1座位上游)
FnCpf1
Cas4
Cas1
Cas2
同向重複序列
間隔區
pFnCpf1_min
Lac啟動子
夏因-達爾加諾序列
FnCpf1
J23119啟動子
同向重複序列
間隔區
pFnCpf1_△Cas
內源性新殺手弗朗西絲菌乙醯轉移酶的5’端(FnCpf1座位上游)
FnCpf1
同向重複序列
間隔區
人類密碼子優化的Cpf1異種同源物的核苷酸序列
核定位信號(NLS)
甘胺酸-絲胺酸接頭
3×HA標籤
1-土拉熱弗朗西絲菌新殺手亞種U112(FnCpf1)
3-毛螺菌科細菌MC2017(Lb3Cpf1)
4-解朊丁酸弧菌(BpCpf1)
5-佩萊格裡尼菌科細菌GW2011_GWA_33_10(PeCpf1)
6-儉菌總門細菌GWC2011_GWC2_44_17(PbCpf1)
7-密斯氏菌屬某種SC_K08D17(SsCpf1)
8-胺基酸球菌屬某種BV3L6(AsCpf1)
9-毛螺菌科細菌MA2020(Lb2Cpf1)
10-候選白蟻甲烷枝原體(CMtCpf1)
11-挑剔真細菌(EeCpf1)
12-牛莫拉氏菌237(MbCpf1)
13-稻田鉤端螺旋體(LiCpf1)
14-毛螺菌科細菌ND2006(LbCpf1)
15-狗口腔卟啉單胞菌(PcCpf1)
16-解糖腖普雷沃菌(PdCpf1)
17-獼猴卟啉單胞菌(PmCpf1)
人類密碼子優化的Cpf1異種同源物的胺基酸序列
核定位信號(NLS)
甘胺酸-絲胺酸接頭
3×HA標籤
1-土拉熱弗朗西絲菌新殺手亞種U112(FnCpf1)
3-毛螺菌科細菌MC2017(Lb3Cpf1)
4-解朊丁酸弧菌(BpCpf1)
5-佩萊格裡尼菌科細菌GW2011_GWA_33_10(PeCpf1)
6-儉菌總門細菌GWC2011_GWC2_44_17(PbCpf1)
7-密斯氏菌屬某種SC_K08D17(SsCpf1)
8-胺基酸球菌屬某種BV3L6(AsCpf1)
9-毛螺菌科細菌MA2020(Lb2Cpf1)
10-候選白蟻甲烷枝原體(CMtCpf1)
11-挑剔真細菌(EeCpf1)
12-牛莫拉氏菌237(MbCpf1)
13-稻田鉤端螺旋體(LiCpf1)
14-毛螺菌科細菌ND2006(LbCpf1)
15-狗口腔卟啉單胞菌(PcCpf1)
16-解糖腖普雷沃菌(PdCpf1)
17-獼猴卟啉單胞菌(PmCpf1)
實例15:Cpf1結構的計算分析
Cpf1核酸酶初級結構的計算分析揭示了三個不同的區(圖109)。第一係C末端RuvC樣結構域,其係僅功能表征的結構域。第二係N末端α-螺旋區並且第三係位於RuvC樣結構域與α-螺旋區之間的混合的α區和β區。
預測非結構化區的若干小片段在Cpf1初始結構之內。對於小蛋白質序列的拆分和插入而言,不同的Cpf1異種同源物內的暴露於溶劑且不保守的非結構化區係較佳的側面。另外,該等側面可以用於在Cpf1異種同源物之間產生嵌合蛋白。
實例16:生成具有增強的特異性的Cpf1究變體
最近描述了用於生成具有增強的特異性的Cas9異種同源物的方法(斯萊馬克爾等人,2015)。此策略可以用於增強Cpf1異種同源物的特異性。
用於誘變的主要殘基係RuvC結構域內所有帶正電荷
殘基,因為這係在不存在晶體時僅已知的結構並且我們知道RuvC中的特異性突變體在Cas9中起作用(參見以下表:RuvC內的保守性賴胺酸和精胺酸殘基)。
在不希望受到理論約束的情況下,Cpf1的此區域的帶正電荷殘基可以用於藉由與DNA非靶股的帶負電荷磷酸二酯骨架相互作用來穩定酶與DNA之間的相互作用。藉由取代Cpf1的帶正電荷殘基,可以破壞與非靶股的相互作用。此相互作用的足夠破壞可以維持針對靶位點的適當活性,但是減小了針對非靶位點的酶活性(考慮到與靶序列相比的一個或多個錯配,這通常將預期與指導序列具有較弱的相互作用)。
其他結構域展示出類似的特徵。感興趣的區域係REC1結構域,包括但不限於與SpCas9的N497、R661、Q695、以及Q926類似的一個或多個胺基酸殘基的突變,並且包括但不限於在那些位置處對丙胺酸的突變。在此類殘基處的突變還破壞了酶-DNA磷酸酯骨架相互作用。此外,可以採用位於相同或不同結構域中的突變的組合。
表:RuvC內的保守性賴胺酸和精胺酸殘基。
另外的候選物係以下表中提供的在不同異種同源物之間保守的帶正電荷殘基。
表:保守性賴胺酸和精胺酸殘基。
以上表提供了在來自新殺手弗朗西絲菌U112(FnCpf1)、-胺基酸球菌屬某種BV3L6(AsCpf1)、毛螺菌科細菌ND2006(LbCpf1)以及牛莫拉氏菌237(MbCpf1)的Cpf1核酸酶比對中保守性賴胺酸和精胺酸殘基的位置。該等可以用於生成具有增強的特異性的Cpf1突變體。
實例17:提供Cpf1結合的特異性
在用於提高Cas9特異性的類似策略中,Cpf1的特異性可以藉由使穩定化非靶向DNA股的殘基發生突變來改進。這可以在無晶體結構的情況下藉由使用線性結構比對以預測1)哪個Cpf1結構域結合DNA的哪條股,以及2)該等結構域內的哪些殘基接觸DNA來完成。
然而,此方法可能由於Cpf1與已知蛋白質的不良保守性而受到限制。因此,希望的是以探針探測所有可能的DNA相互
作用胺基酸(賴胺酸、組胺酸以及精胺酸)的功能。
RuvC結構域內帶正電荷殘基在整個Cpf1中比在Rad50結構域中更保守,這指示RuvC殘基係具有較小進化彈性的。這表明在此結構域中需要核酸結合的嚴格控制(相對於Rad50結構域)。因此,可能此結構域由於需要RNA:DNA雙股體穩定而切割靶向的DNA股(Cas9中的前例)。此外,更多精胺酸存在於RuvC結構域中(5%的RuvC殘基904至1307對比提議的Rad50結構域中的3.8%),這表明RuvC靶向一條DNA股。精胺酸涉及結合核酸大溝和小溝(羅氏自然(Rohs Nature)2009:http://rohslab.cmb.usc.edu/Papers/Rohs_etal_Nature.pdf)。大溝/小溝可以僅存在於雙股體(諸如DNA:RNA靶向雙股體)中,這進一步表明RuvC可以涉及切割。
圖110、圖111和圖112提供了與Cpf1中發現的結構域類似的兩種結構域的晶體結構(RuvC霍利迪連結體解離酶和Rad50DNA修復蛋白)。基於該等結構,可以推斷Cpf1中哪些相關結構域看起來像並且推斷哪些區域和殘基可以接觸DNA。在每種結構中,突出了接觸DNA的殘基。在圖113的比對中,注解與該等DNA結合區域相對應的AsCpf1區域。以下表中的殘基清單係兩種結合結構域中可見的殘基。
表-可能的DNA相互作用殘基的列表
由關於AsCpf1的該等特定觀察,我們可以藉由序列比對鑒定來自其他種類的Cpf1中的類似殘基。比對圖114中給出的AsCpf1和FnCpf1的實例,鑒定了Rad50結合結構域和其中的精胺酸和賴胺酸。
實例18:使用串聯指導序列使用Cpf1進行多重作用
考慮使用Cpf1酶進行多重作用是否可能。出於此目的,開發指導RNA,由此在相同啟動子下串聯定位不同指導序列,並且確定該等指導序列指導基因組編輯到其對應靶標的能力。
在轉染前24h,每24孔接種150,000個HEK293T細胞。使用Lipofectamin2000,用400ng huAsCpf1質粒和100ng包含針對GRIN28的一個指導序列和以串聯方式置於U6啟動子(圖115A)後面的針對EMX1的指導序列的串聯指導質粒轉染細胞。轉染後72h收穫細胞並且使用SURVEYOR核酸酶測定來測定由串聯指導序列介導的AsCpf1活性。
該等結果在圖115B中證實,該圖證明了GRIN28和EMX1基因中的INDEL形成。
因此確定AsCpf1和類似的LbCpf1可以採用由相同U6啟動子表現的兩種指導序列而無活性喪失。串聯中的位置對indel形成沒有影響。這表明Cpf1可以用於使用兩種或更多種指導序列進行多重作用。
本發明進一步藉由如下編號段落進行描述。
1.一種工程化的、非天然存在的成簇規律間隔短迴文重複序列(CRISPR)-CRISPR相關(Cas)(CRISPR-Cas)系統,包含
a)一種或多種包含指導RNA的V型CRISPR-Cas多核苷酸序列,該指導RNA包含連接至同向重複序列的指導序列,其中該指導序列能夠與靶序列雜交,或者一種或多種編碼該一種或多種V型CRISPR-Cas多核苷酸序列的核苷酸序列,以及
b)Cpf1效應蛋白或者編碼該Cpf1效應蛋白的一種或多種核苷酸序列;
其中該一種或多種指導序列與所述靶序列雜交,所述靶序列
係原型間隔區相鄰模體(PAM)的3’,並且所述指導RNA與該Cpf1效應蛋白形成複合物。
2.一種包含一種或多種載體的工程化的、非天然存在的成簇規律間隔短迴文重複序列(CRISPR)-CRISPR相關(Cas)(CRISPR-Cas)載體系統,包含
c)可操作地連接至一種或多種核苷酸序列的第一調節元件,該一種或多種核苷酸序列編碼包含指導RNA的一種或多種V型CRISPR-Cas多核苷酸序列,該指導RNA包含連接至同向重複序列的指導序列,其中該指導序列能夠與靶序列雜交,
d)可操作地連接至編碼Cpf1效應蛋白的核苷酸序列的第二調節元件;
其中組分(a)和(b)位於該系統的相同或不同的載體上,
其中當轉錄時,該一種或多種指導序列與所述靶序列雜交,所述靶序列係原型間隔區相鄰模體(PAM)的3’,並且所述指導RNA與該Cpf1效應蛋白形成複合物。
3.如段落1或2所述之系統,其中該靶序列係在細胞內。
4.如段落3所述之系統,其中該細胞包括真核細胞。
5.如段落1-4中任一項所述之系統,其中當轉錄時,該一種或多種指導序列與該靶序列雜交並且該指導RNA與該Cpf1效應蛋白形成一種複合物,該複合物引起該靶序列遠端切割。
6.如段落5所述之系統,其中所述切割生成具有4或5-nt 5’突出端的交錯雙股斷裂。
7.如段落1-6中任一項所述之系統,其中該PAM包含5’ T-富集模體。
8.如段落1-7中任一項所述之系統,其中該效應蛋白係來源於圖64所列出的細菌種類的Cpf1效應蛋白。
9.如段落8所述之系統,其中該Cpf1效應蛋白係來源於選自下組的細菌種類,該組由以下各項組成:土拉熱弗朗西絲菌1、土拉熱弗朗西絲菌新殺手亞種、易北普雷沃菌、毛螺旋菌科細菌MC2017 1、解朊丁酸弧菌、佩萊格裡尼菌科細菌GW2011_GWA2_33_10、儉菌總門細菌GW2011_GWC2_44_17、密斯氏菌屬某種SCADC、胺基酸球菌屬某種BV3L6、毛螺旋菌科細菌MA2020、候選白蟻甲烷枝原體、挑剔真細菌、牛莫拉氏菌237、稻田鉤端螺旋體、毛螺旋菌科細菌ND2006、狗口腔卟啉單胞菌3、解糖腖普雷沃菌和獼猴卟啉單胞菌。
10.如段落9所述之系統,其中該PAM序列係TTN,其中N係A/C/G或T並且該效應蛋白係FnCpf1或者其中該PAM序列係TTTV,其中V係A/C或G並且該效應蛋白係PaCpf1p、LbCpf1或AsCpf1。
11.如段落1-10中任一項所述之系統,其中該Cpf1效應蛋白包含一個或多個核定位信號。
12.如段落1-11中任一項所述之系統,其中編碼該Cpf1效應蛋白的該等核酸序列被密碼子優化用於在真核細胞中表現。
13.如段落1-12中任一項所述之系統,其中組分(a)和(b)或該等核苷酸序列係在載體上。
14.一種修飾感興趣的靶座位之方法,該方法包括將如段落1-13中任一項所述之系統遞送到所述座位或含有該座位的細胞中。
15.一種修飾感興趣的靶座位之方法,該方法包括將包含Cpf1效應蛋白和一種或多種核酸組分的非天然存在或工程化的組成物遞送至所述座位,其中該Cpf1效應蛋白與該一種或多種核酸組分形成複合物並且在所述複合物與係原型間隔區相鄰模體(PAM)的3’的感興趣的靶座位結合後,該效應蛋白誘導對該感興趣的靶座位的修飾,其中該複合物包含Mg2+。
16.如段落14或15所述之方法,其中該感興趣的靶座位係在細胞內。
17.如段落16所述之方法,其中該細胞係真核細胞。
18.如段落16所述之方法,其中該細胞係動物細胞或人類細胞。
19.如段落16所述之方法,其中該細胞係植物細胞。
20.如段落14或15所述之方法,其中該感興趣的靶座位被包含體外DNA分子中。
21.如段落15-20中任一項所述之方法,其中包含Cpf1效應蛋白和一種或多種核酸組分的所述非天然存在或工程化的組成物作為一個或多個多核苷酸分子遞送到該細胞中。
22.如段落14-21中任一項所述之方法,其中該感興趣的靶座位包含DNA。
23.如段落22所述之方法,其中該DNA係鬆弛的或超螺旋的。
24.如段落14-23中任一項所述之方法,其中該組成物包含單一核酸組分。
25.如段落24所述之方法,其中該單一核酸組分包含連接至同向重複序列的指導序列。
26.如段落14-25中任一項所述之方法,其中該感興趣的靶座位的該修飾係股斷裂。
27.如段落26所述之方法,其中該股斷裂包括具有4或5-nt 5’突出端的交錯DNA雙股斷裂。
28.如段落26或27所述之方法,其中該感興趣的靶座位係藉由將DNA插入物整合到該交錯DNA雙股斷裂中來修飾的。
29.如段落14-28中任一項所述之方法,其中該Cpf1效應蛋白包含一個或多個核定位信號(一個或多個NLS)。
30.如段落21-29中任一項所述之方法,其中該一個或多個多核苷酸分子被包含在一種或多種載體中。
31.如段落21-30中任一項所述之方法,其中該一個或多個多核苷酸分子包含可操作地配置為表現該Cpf1效應蛋白和/或該一種或多種核酸組分的一種或多種調節元件,視情況其中該一種或
多種調節元件包括誘導型啟動子。
32.如段落21至31中任一項所述之方法,其中該一個或多個多核苷酸分子或該一種或多種載體被包含在一遞送系統中。
33.如段落14-30中任一項所述之方法,其中系統或該一個或多個多核苷酸分子係經由粒子、囊泡或一種或多種病毒載體來遞送的。
34.如段落33所述之方法,其中該等粒子包含脂質、糖、金屬或蛋白質。
35.如段落33所述之方法,其中該等囊泡包含外來體或脂質體。
36.如段落33所述之方法,其中該一種或多種病毒質粒包括一種或多種腺病毒、一種或多種慢病毒或一種或多種腺相關病毒。
37.如段落14-36中任一項所述之方法,該方法係一種藉由操縱感興趣的基因組座位處的一個或多個靶序列來修飾細胞、細胞系或生物體的方法。
38.一種來自如段落37所述的方法之細胞或其子代,其中該細胞包含在未經受該方法的細胞中不存在的修飾。
39.如段落38所述之細胞或其子代,其中未經受該方法的該細胞包含異常並且來自該方法的該細胞的該異常已得到解決或校正。
40.一種來自如段落38所述之細胞或其子代的細胞產物,其
中該產物係以相對於來自未經受該方法的細胞的細胞產物的性質或量來修飾的。
41.如段落40所述之細胞產物,其中未經受該方法的該細胞包含異常並且該細胞產物反映了該異常已藉由該方法解決或校正。
42.一種包含如段落1-13中任一項所述之系統之體外、離體或體內宿主細胞或細胞系或其子代。
43.如段落42所述之宿主細胞或細胞系或其子代,其中該細胞係真核細胞。
44.如段落43所述之宿主細胞或細胞系或其子代,其中該細胞係動物細胞。
45.如段落33所述之宿主細胞或細胞系或其子代,其中該細胞係人類細胞。
46.如段落31所述之宿主細胞或細胞系或其子代,包含幹細胞或幹細胞系。
47.如段落30所述之宿主細胞或細胞系或其子代,其中該細胞係植物細胞。
48.一種產生具有由感興趣的基因編碼的修飾的感興趣的性狀的植物之方法,所述方法包括將植物細胞與如段落1-13中任一項所述之系統接觸或者使該植物細胞經受如段落14-17或19至37所述之方法,由此修飾或引入所述感興趣的基因並且由所述植物細胞再生植物。
49.一種鑒定植物中感興趣的性狀之方法,所述感興趣的性狀由感興趣的基因編碼,所述方法包括將植物細胞與如段落1-13中任一項所述之系統接觸或者使該植物細胞經受如段落14-17或19至37所述之方法,由此鑒定所述感興趣的基因。
50.如段落49所述之方法,進一步包括將該鑒定的感興趣的基因引入到植物細胞或植物細胞系或植物種質中並且由其生成植物,由此該植物含有該感興趣的基因。
51.如段落50所述之方法,其中該植物展現出該感興趣的性狀。
52.一種包含如段落1-13中任一項所述之系統的粒子。
53.如段落52所述的粒子,其中該粒子含有與該指導RNA複合的該Cpf1效應蛋白。
54.如任何以上段落所述之系統或方法,其中該複合物、指導RNA或蛋白質被軛合至至少一種糖部分,視情況是N-乙醯半乳糖胺(GalNAc),具體地是三觸角GalNAc。
55.如任何以上段落所述的系統或方法,其中Mg2+的濃度係約1mM至約15mM。
56.一種分離的蛋白質,該分離的蛋白質與AsCpf1或LbCpf1具有至少60%序列一致性並且能夠藉由與包含同向重複序列和指導序列的指導RNA複合來結合靶DNA,而不需要存在tracrRNA。
57.一種編碼如段落56所述之蛋白質的分離的核酸。
58.如段落17所述之方法,該方法係一種治療由所述細胞中的遺傳缺陷引起的疾病之方法。
59.如段落58所述之方法,其中所述方法係在體內或離體細胞上進行的。
60.一種非天然存在或工程化的組成物,該組成物包含Cpf1效應蛋白以及含有同向重複序列和能夠與在感興趣的座位處的靶DNA雜交的指導序列的一種或多種RNA,其中該Cpf1效應蛋白與該一種或多種指導RNA形成複合物並且在所述複合物與係原型間隔區相鄰模體(PAM)的3’的感興趣的靶座位結合後,該效應蛋白誘導該感興趣的靶座位的修飾。
61.一種非天然存在或工程化的組成物,該組成物包含編碼Cpf1效應蛋白的多核苷酸序列以及含有同向重複序列和能夠與在感興趣的座位處的靶DNA雜交的指導序列的一種或多種RNA,其中該Cpf1效應蛋白在表現時與該一種或多種指導RNA形成複合物並且在所述複合物與係原型間隔區相鄰模體(PAM)的3’的感興趣的靶座位結合後,該效應蛋白誘導該感興趣的靶座位的修飾。
62.如段落60或61所述的組成物,該組成物係醫藥組成物。
63.如段落60或61所述的組成物,該組成物用作藥物。
64.如段落60或61所述的組成物,該組成物用於治療由該感興趣的靶座位處的遺傳缺陷引起的疾病或病症。
65.如段落58所述的方法或如陳述64所述地使用的組成物,其中該細胞係HSC細胞。
66.如段落58所述的方法或如陳述64所述地使用的組成物,其中該疾病或病症係血細胞病症。
* * *
儘管在此已經顯示並說明了本發明的較佳的實施方式,但是熟習該項技術者將清楚的是僅作為舉例而提供了此類實施方式。熟習該項技術者現在將會想到眾多變體、變化、以及替代,而不背離本發明。應該理解的是,在此說明的本發明的實施方式的不同替代方案可以用於實施本發明。預期的是以下申請專利範圍限定了本發明的範圍以及由此覆蓋在該等申請專利範圍和它們的等效物的範圍內的方法和結構。
本案的圖皆為實驗數據,並非本案的代表圖。故本案無指定代表圖。
Claims (60)
- 一種體外或離體修飾真核生物細胞的方法,包括遞送CRISPR-Cas系統至該真核生物細胞,該CRISPR-Cas系統係包含:V型Cas蛋白,包含RuvC結構域但不包含HNH結構域或編碼該V型Cas蛋白的核酸,以及工程化CRISPR-Cas指導多核苷酸,與該真核生物細胞中感興趣的基因組座位的靶序列或編碼該CRISPR-Cas指導多核苷酸的核酸雜交,其中,該CRISPR-Cas系統不包含tracrRNA,其中,該指導多核苷酸與該V型Cas蛋白形成CRISPR-Cas複合物,並引導該CRISPR-Cas複合物與該真核生物細胞中的該靶序列的序列特異性結合,其中,該感興趣的基因組座位經切割或編輯以產生經修飾之真核生物細胞。
- 如申請專利範圍第1項所述之方法,其中,該真核生物細胞為哺乳類動物細胞或人類細胞。
- 如申請專利範圍第1或2項所述之方法,其中,該方法包含遞送一種或多種病毒載體,其包含或編碼該指導多核苷酸及該V型Cas蛋白。
- 如申請專利範圍第3項所述之方法,其中,該一種或多種病毒載體為腺病毒載體、慢病毒載體或腺伴隨病毒載體。
- 如申請專利範圍第1或2項所述之方法,其中,該方法 包含遞送脂質粒子,其含有該指導多核苷酸及編碼該V型Cas蛋白的mRNA。
- 如申請專利範圍第5項所述之方法,其中,該脂質粒子為脂質奈米粒子、脂質體、外來體或微泡。
- 如申請專利範圍第1或2項所述之方法,其中,該方法包含遞送核糖核蛋白,其含有與該V型Cas蛋白複合之該指導多核苷酸。
- 如申請專利範圍第7項所述之方法,其中,該核糖核蛋白係經由電穿孔或微注射遞送至該真核生物細胞。
- 如申請專利範圍第1至8項中任一項所述之方法,其中,該V型Cas蛋白係與一個或多個異源核定位信號融合,視需要地,其中,該V型Cas蛋白係與兩個或多個異源核定位信號融合。
- 如申請專利範圍第1至9項中任一項所述之方法,其中,該V型Cas蛋白包含RuvC-I、RuvC-II及RuvC-III結構域。
- 如申請專利範圍第1至10項中任一項所述之方法,其中,該V型Cas蛋白在催化結構域內包含至少一個突變且具有降低的催化活性。
- 如申請專利範圍第1至11項中任一項所述之方法,其中,該V型Cas蛋白與一個或多個異源蛋白結構域融合。
- 如申請專利範圍第12項所述之方法,其中,該一個或多個異源蛋白結構域具有以下各項之一種或多種活性:修 飾烷酶活性、去甲酶活性、轉錄啟動活性、轉錄阻遏活性、轉錄釋放因子活性、組蛋白修飾活性、核酸酶活性、單股RNA切割活性、雙股RNA切割活性、單股DNA切割活性、雙股DNA切割活性和核酸結合活性。
- 如申請專利範圍第12項所述之方法,其中,該一個或多個異源蛋白結構域係選自由易位酶結構域、整合酶結構域、重組酶結構域、解離酶結構域、轉化酶結構域、蛋白酶結構域、DNA甲基轉移酶結構域、DNA羥甲基酶結構域、DNA脫甲基酶結構域、組蛋白乙醯化酶結構域、組蛋白脫乙醯化酶結構域、核酸酶結構域、轉錄阻遏物結構域、轉錄活化物結構域、脫胺酶結構域、轉錄調節蛋白質結構域、細胞攝取活動相關結構域、核酸結合結構域、抗體呈遞結構域、組蛋白修飾酶、組蛋白修飾酶的募集物以及組蛋白修飾酶、組蛋白甲基轉移酶、組蛋白去甲酶、組蛋白激酶、組蛋白磷酸酶、組蛋白核糖基酶、組蛋白脫核糖基酶、組蛋白泛素酶、組蛋白脫泛素酶、組蛋白生物素酶和組蛋白尾蛋白酶的抑制劑所組成之群組。
- 如申請專利範圍第1至14項中任一項所述之方法,其中,該V型Cas蛋白為V-A型Cas蛋白。
- 如申請專利範圍第15項所述之方法,其中,該V-A型Cas蛋白包含RuvC-I結構域中的VIGIDRG或IIGIDRG模體及/或RuvC-III結構域中的DANGAY模體。
- 如申請專利範圍第15或16項所述之方法,其中,該V-A型Cas蛋白係來源於弗朗西絲菌屬、普雷沃菌屬、胺基酸球菌屬、毛螺旋菌科、莫拉氏菌屬、真細菌屬、密斯氏菌屬、丁酸弧菌屬、佩萊格裡尼菌科、儉菌總門、候選菌屬、鉤端螺旋體或卟啉單胞菌。
- 如申請專利範圍第1至17項中任一項所述之方法,其中,該指導多核苷酸從5’到3’包含連接至指導序列的同向重複序列;其中,該同向重複序列從5’到3’包含緊接著該指導序列的5’的莖左區域、環區域、莖右區域及尿嘧啶。
- 如申請專利範圍第18項所述之方法,其中,該環區域包含UGUU、UAUU、UCUU、UUUU、UGCU、UUCG、UCUUU、UGUUU、UAAGU、UUU或UU的序列;其中,該莖左區域及該莖右區域分別包含UCUAC及GUAGA、CCUAC及GUAGG、UCCAC及GUGGA或UCUGC及GCAGA的序列。
- 如申請專利範圍第18或19項所述之方法,其中,該同向重複序列復包含緊接著該莖左區域的AAUU或AUU,視需要地,其中,該同向重複序列復包含在5’端的GG。
- 如申請專利範圍第18項所述之方法,其中,該同向重複序列係SEQ ID NOs:1434、1437-1438及1440-1449中任一者,或者該同向重複序列係經由SEQ ID NOs:195、198-199及201-210中任一者所編碼。
- 如申請專利範圍第1至21項中任一項所述之方法,其中,該指導多核苷酸包含至少一個化學修飾。
- 如申請專利範圍第22項所述之方法,其中,該化學修飾包含假-U、5-甲基-C、甲基化核苷酸或核苷酸類似物。
- 如申請專利範圍第22或23項所述之方法,其中,該化學修飾包含2’-O-甲基、2’-O-甲基3’硫代磷酸酯或2’-O-甲基3’硫代PACE。
- 如申請專利範圍第22至24項中任一項所述之方法,其中,該化學修飾包含硫代磷酸酯鍵或核糖環中2’碳與4’碳之間的亞甲基橋。
- 如申請專利範圍第1至25項中任一項所述之方法,其中,該靶序列係鄰近於真核生物細胞之基因組內的T富集之原型間隔區相鄰模體(PAM)。
- 如申請專利範圍第26項所述之方法,其中,該PAM包含5’-TTN或5’-TTTV。
- 如申請專利範圍第1至27項中任一項所述之方法,其中,該感興趣的基因組座位被切割以產生交錯雙股斷裂,視需要地,其中,該交錯雙股斷裂具有4-nt或5-nt 5’突出端。
- 如申請專利範圍第1至28項中任一項所述之方法,復包含將用於通過同源定向修復靶向整合轉基因的供體模板遞送至該真核生物細胞。
- 如申請專利範圍第1至29項中任一項所述之方法,其 中,該真核生物細胞為T細胞、NK細胞、細胞毒性T淋巴細胞、腫瘤浸潤淋巴細胞、調節T細胞或誘導的多能幹細胞。
- 一種包含CRISPR-Cas系統的組成物於製備用於治療有其需要之受試者的基因疾病或病症之藥物的用途,其中,該CRISPR-Cas系統包含:V型Cas蛋白,包含RuvC結構域但不包含HNH結構域、或編碼該V型Cas蛋白的核酸,以及工程化CRISPR-Cas指導多核苷酸,與該真核生物細胞中感興趣的基因組座位的靶序列或編碼該CRISPR-Cas指導多核苷酸的核酸雜交,其中,該感興趣的基因組座位與該基因疾病或病症有關,其中,該CRISPR-Cas系統不包含tracrRNA,其中,該指導多核苷酸能與該V型Cas蛋白形成CRISPR-Cas複合物,並引導該CRISPR-Cas複合物與該真核生物細胞中的該靶序列的序列特異性結合,從而切割或編輯該感興趣的基因組座位。
- 如申請專利範圍第31項所述之用途,其中,該組合物包含一種或多種病毒載體,其包含或編碼該指導多核苷酸及V型Cas蛋白。
- 如申請專利範圍第32項所述之用途,其中,該一種或多種病毒載體為該病毒載體包含腺病毒載體、慢病毒載體、或腺伴隨病毒載體。
- 如申請專利範圍第31項所述之用途,其中,該組合物包含脂質粒子,其含有該指導多核苷酸以及編碼該V型Cas蛋白的mRNA。
- 如申請專利範圍第34項所述之用途,其中,該脂質粒子為脂質奈米粒子、脂質體、外來體或微泡。
- 如申請專利範圍第31項所述之用途,其中,該組合物包含核糖核蛋白,其含有與該V型Cas蛋白複合之該指導多核苷酸。
- 如申請專利範圍第31至36項中任一項所述之用途,其中,該V型Cas蛋白係與一個或多個異源核定位信號融合,視需要地,其中,該V型Cas蛋白係與兩個或多個異源核定位信號融合。
- 如申請專利範圍第31至37項中任一項所述之用途,其中,該V型Cas蛋白包含RuvC-I、RuvC-II及RuvC-III結構域。
- 如申請專利範圍第31至38項中任一項所述之用途,其中,該V型Cas蛋白在催化結構域內包含至少一個突變且具有降低的催化活性。
- 如申請專利範圍第31至39項中任一項所述之用途,其中,該V型Cas蛋白與一個或多個異源蛋白結構域融合。
- 如申請專利範圍第40項所述之用途,其中,該一個或多個異源蛋白結構域具有以下各項之一種或多種活性:修飾烷酶活性、去甲酶活性、轉錄啟動活性、轉錄阻遏活 性、轉錄釋放因子活性、組蛋白修飾活性、核酸酶活性、單股RNA切割活性、雙股RNA切割活性、單股DNA切割活性、雙股DNA切割活性和核酸結合活性。
- 如申請專利範圍第40項所述之用途,其中,該一個或多個異源蛋白結構域係選自由易位酶結構域、整合酶結構域、重組酶結構域、解離酶結構域、轉化酶結構域、蛋白酶結構域、DNA甲基轉移酶結構域、DNA羥甲基酶結構域、DNA脫甲基酶結構域、組蛋白乙醯化酶結構域、組蛋白脫乙醯化酶結構域、核酸酶結構域、轉錄阻遏物結構域、轉錄活化物結構域、脫胺酶結構域、轉錄調節蛋白質結構域、細胞攝取活動相關結構域、核酸結合結構域、抗體呈遞結構域、組蛋白修飾酶、組蛋白修飾酶的募集物以及組蛋白修飾酶、組蛋白甲基轉移酶、組蛋白去甲酶、組蛋白激酶、組蛋白磷酸酶、組蛋白核糖基酶、組蛋白脫核糖基酶、組蛋白泛素酶、組蛋白脫泛素酶、組蛋白生物素酶和組蛋白尾蛋白酶的抑制劑所組成之群組。
- 如申請專利範圍第31至42項中任一項所述之用途,其中,其中,該V型Cas蛋白為V-A型Cas蛋白。
- 如申請專利範圍第43項所述之用途,其中,該V-A型Cas蛋白包含RuvC-I結構域中的VIGIDRG或IIGIDRG模體及/或RuvC-III結構域中的DANGAY模體。
- 如申請專利範圍第43或44項所述之用途,其中,該V- A型Cas蛋白係來源於弗朗西絲菌屬、普雷沃菌屬、胺基酸球菌屬、毛螺旋菌科、莫拉氏菌屬、真細菌屬、密斯氏菌屬、丁酸弧菌屬、佩萊格裡尼菌科、儉菌總門、候選菌屬、鉤端螺旋體或卟啉單胞菌。
- 如申請專利範圍第31至45項中任一項所述之用途,其中,該指導多核苷酸從5’到3’包含連接至指導序列的同向重複序列;其中,該同向重複序列從5’到3’包含緊接著該指導序列的5’的莖左區域、環區域、莖右區域及尿嘧啶。
- 如申請專利範圍第46項所述之用途,其中,該環區域包含UGUU、UAUU、UCUU、UUUU、UGCU、UUCG、UCUUU、UGUUU、UAAGU、UUU或UU的序列;其中,該莖左區域及該莖右區域分別包含UCUAC及GUAGA、CCUAC及GUAGG、UCCAC及GUGGA或UCUGC及GCAGA的序列。
- 如申請專利範圍第46或47項所述之用途,其中,該同向重複序列復包含緊接著該莖左區域的AAUU或AUU,視需要地,其中,該同向重複序列復包含在5’端的GG。
- 如申請專利範圍第46項所述之用途,其中,該同向重複序列係SEQ ID NOs:1434、1437-1438及1440-1449中任一者,或者該同向重複序列係經由SEQ ID NOs:195、198-199及201-210中任一者所編碼。
- 如申請專利範圍第31至49項中任一項所述之用途,其 中,該指導多核苷酸包含至少一個化學修飾。
- 如申請專利範圍第50項所述之用途,其中,該化學修飾包含假-U、5-甲基-C、甲基化核苷酸或核苷酸類似物。
- 如申請專利範圍第50或51項所述之用途,其中,該化學修飾包含2’-O-甲基、2’-O-甲基3’硫代磷酸酯或2’-O-甲基3’硫代PACE。
- 如申請專利範圍第50至52項中任一項所述之用途,其中,該化學修飾包含硫代磷酸酯鍵或核糖環中2’碳與4’碳之間的亞甲基橋。
- 如申請專利範圍第31至53項中任一項所述之用途,其中,該靶序列係鄰近於真核生物細胞之基因組內的T富集之原型間隔區相鄰模體(PAM)。
- 如申請專利範圍第54項所述之用途,其中,該PAM包含5’-TTN或5’-TTTV。
- 如申請專利範圍第31至55項中任一項所述之用途,其中,該感興趣的基因組座位被切割以產生交錯雙股斷裂,視需要地,其中,該交錯雙股斷裂具有4-nt或5-nt 5’突出端。
- 如申請專利範圍第31至56項中任一項所述之用途,其中,該組合物復包含藉由同源定向修復靶向整合轉基因的供體模板。
- 如申請專利範圍第31至57項中任一項所述之用途,其中,該基因疾病或病症是血液疾病或病症、眼疾病或病 症、肝臟疾病或病症、肌肉疾病或病症、或神經學疾病或病症。
- 如申請專利範圍第58項所述之用途,其中,該基因疾病或病症為鐮狀細胞疾病、β-地中海貧血、A型血友病、B型血友病、萊伯氏先天性黑矇、Usher症候群、色素性視網膜炎、眼底黃色斑點症、甲狀腺素運載蛋白澱粉樣變性、遺傳性高酪胺酸血症、α-1抗胰蛋白酶缺乏症、肝糖貯積症、血膽固醇過多、杜氏肌營養不良、強直性肌營養不良、囊性纖維化、白血病、淋巴瘤、或實性瘤。
- 如申請專利範圍第31至59項中任一項所述之用途,其中,該主體為哺乳類動物主體或人類主體。
Applications Claiming Priority (14)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201562181739P | 2015-06-18 | 2015-06-18 | |
| US62/181,739 | 2015-06-18 | ||
| US201562193507P | 2015-07-16 | 2015-07-16 | |
| US62/193,507 | 2015-07-16 | ||
| US201562201542P | 2015-08-05 | 2015-08-05 | |
| US62/201,542 | 2015-08-05 | ||
| US201562205733P | 2015-08-16 | 2015-08-16 | |
| US62/205,733 | 2015-08-16 | ||
| US201562232067P | 2015-09-24 | 2015-09-24 | |
| US62/232,067 | 2015-09-24 | ||
| US14/975,085 US9790490B2 (en) | 2015-06-18 | 2015-12-18 | CRISPR enzymes and systems |
| US14/975,085 | 2015-12-18 | ||
| EP16150428.7A EP3009511B2 (en) | 2015-06-18 | 2016-01-07 | Novel crispr enzymes and systems |
| EP16150428.7 | 2016-01-07 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| TW202426636A true TW202426636A (zh) | 2024-07-01 |
| TWI906782B TWI906782B (zh) | 2025-12-01 |
Family
ID=
Also Published As
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7731398B2 (ja) | 新規crispr酵素及び系 | |
| US20200318173A1 (en) | Novel crispr enzymes and systems | |
| KR102575342B1 (ko) | 표적외 효과를 감소시키는 crispr 효소 돌연변이 | |
| WO2017189308A1 (en) | Novel crispr enzymes and systems | |
| WO2017106657A1 (en) | Novel crispr enzymes and systems | |
| WO2016205749A9 (en) | Novel crispr enzymes and systems | |
| WO2017184786A1 (en) | Cpf1 complexes with reduced indel activity | |
| HK40011328A (zh) | 新型crispr酶以及系统 | |
| HK40011328B (zh) | 新型crispr酶以及系统 | |
| HK1253001B (zh) | 新型crispr酶以及系统 |