[go: up one dir, main page]

TW202449148A - Cas酶及其系統和應用 - Google Patents

Cas酶及其系統和應用 Download PDF

Info

Publication number
TW202449148A
TW202449148A TW113121355A TW113121355A TW202449148A TW 202449148 A TW202449148 A TW 202449148A TW 113121355 A TW113121355 A TW 113121355A TW 113121355 A TW113121355 A TW 113121355A TW 202449148 A TW202449148 A TW 202449148A
Authority
TW
Taiwan
Prior art keywords
sequence
cas enzyme
nucleic acid
cas
cell
Prior art date
Application number
TW113121355A
Other languages
English (en)
Inventor
馮爭艶
吳壘磊
毛少帥
楊長青
朱琦
管婧雯
臧贏
Original Assignee
大陸商益杰立科(上海)生物科技有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 大陸商益杰立科(上海)生物科技有限公司 filed Critical 大陸商益杰立科(上海)生物科技有限公司
Publication of TW202449148A publication Critical patent/TW202449148A/zh

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K19/00Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases [RNase]; Deoxyribonucleases [DNase]

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • Wood Science & Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本揭露涉及生物醫藥領域,具體地涉及一種新型Cas酶及其系統和應用。

Description

Cas酶及其系統和應用
本揭露涉及生物醫藥領域,具體地涉及一種Cas酶及其系統和應用。
基因組測序技術和分析方法的最新進展顯著加速了對不同領域的生物活動(從原核生物合成途徑到人類病理)的遺傳基礎的理解。為了充分理解和評估基因測序技術所產生的巨量信息,需要在基因組和表觀基因組操作技術的規模、效率和易用性等方面進行相應的提高。這些新的基因組和表觀基因組工程改造技術將加速許多領域的新應用的發展,包括生物技術、農業和人類治療學。
成簇規律間隔短回文重複序列(CRISPR)和CRISPR相關聯(Cas)基因,統稱為CRISPR-Cas或CRISPR/Cas系統,目前已被理解為對細菌和古細菌提供抗噬菌體感染的免疫。原核生物適應性免疫的CRISPR-Cas系統是一組極其多樣的蛋白質效應子、非編碼元件以及基因座結構,其中一些例子已經被工程改造並適應於產生重要的生物技術。參與宿主防禦的系統的組分包括一種或多種能夠修飾DNA或RNA的效應子蛋白和負 責將這些蛋白活性靶向噬菌體DNA或RNA上特定序列的RNA指導元件,這些指導元件可被重新編程以靶向可替代的DNA或RNA靶。
CRISPR-Cas系統大致可分為兩類:1類系統由多個效應子蛋白構成,2類系統由單個效應子蛋白構成,該單個效應子蛋白與RNA指導物複合以靶向DNA或RNA受質。2類系統的單亞基效應子組成為工程改造和應用轉換提供了更簡單的組件集,並且迄今為止一直是可編程效應子的重要來源。以CRISPR-Cas9為例的2類CRISPR-Cas系統的表徵和工程改造為基因組編輯和其他方面的多樣廣泛生物技術應用鋪平了道路。然而,除了當前的藉由其獨特的性質實現了新的應用的CRISPR-Cas系統之外,仍然需要開發強有力的基因組工程工具,即用於修飾核酸和多核苷酸(即DNA、RNA或其任何雜合體、衍生物或修飾物)的替代性的可編程效應子和系統。
一方面,本揭露提供一種分離的Cas酶,該Cas酶包含SEQ ID Nos:1-58中任一項所示的胺基酸序列或與該SEQ ID Nos:1-58中任一項所示的胺基酸序列具有至少約80%同一性的序列。例如,該Cas酶包含與該SEQ ID NOs:1-58中任一項所示的胺基酸序列具有約80%、約81%、約82%、約83%、約84%、約85%、約86%、約87%、約88%、約89%、約90%、約91%、約92%、約93%、約94%、約95%、約96%、約97%、約98%、約99%、或約100%同一性的序列。例如,本揭露提供了包含如下表所示的胺基酸序列的Cas酶:
Figure 113121355-A0101-12-0003-1
Figure 113121355-A0101-12-0004-2
Figure 113121355-A0101-12-0005-3
Figure 113121355-A0101-12-0006-4
Figure 113121355-A0101-12-0007-5
Figure 113121355-A0101-12-0008-6
Figure 113121355-A0101-12-0009-7
Figure 113121355-A0101-12-0010-8
Figure 113121355-A0101-12-0011-9
Figure 113121355-A0101-12-0012-10
Figure 113121355-A0101-12-0013-11
Figure 113121355-A0101-12-0014-12
Figure 113121355-A0101-12-0015-13
Figure 113121355-A0101-12-0016-14
Figure 113121355-A0101-12-0017-15
Figure 113121355-A0101-12-0018-16
Figure 113121355-A0101-12-0019-17
Figure 113121355-A0101-12-0020-18
Figure 113121355-A0101-12-0021-19
Figure 113121355-A0101-12-0022-20
Figure 113121355-A0101-12-0023-21
Figure 113121355-A0101-12-0024-22
Figure 113121355-A0101-12-0025-23
Figure 113121355-A0101-12-0026-24
Figure 113121355-A0101-12-0027-25
Figure 113121355-A0101-12-0028-26
Figure 113121355-A0101-12-0029-27
Figure 113121355-A0101-12-0030-28
Figure 113121355-A0101-12-0031-29
Figure 113121355-A0101-12-0032-30
Figure 113121355-A0101-12-0033-31
Figure 113121355-A0101-12-0034-32
Figure 113121355-A0101-12-0035-33
Figure 113121355-A0101-12-0036-34
Figure 113121355-A0101-12-0037-35
Figure 113121355-A0101-12-0038-36
Figure 113121355-A0101-12-0039-37
Figure 113121355-A0101-12-0040-38
Figure 113121355-A0101-12-0041-39
在某些實施方式中,該Cas酶具有能夠結合靶DNA鏈的催化活性結構域和/或切割該靶DNA鏈的催化活性結構域。
在某些實施方式中,該催化活性結構域包含一個或多個胺基酸的改變,從而使得該Cas酶僅具有結合靶DNA鏈的活性,或者具有結合靶DNA鏈的活性和切割該靶DNA單鏈的活性。
另一方面,本揭露提供一種融合分子,該融合分子包含本揭露所述的Cas酶和一個或多個異源功能結構域。
在某些實施方式中,該一個或多個異源功能結構域能夠調控一種或多種基因產物的表達。
在某些實施方式中,該一個或多個異源功能結構域直接或間接地融合在該Cas酶上。
在某些實施方式中,該一個或多個異源功能結構域選自自解旋酶、核酸酶、解旋酶-核酸酶、DNA甲基轉移酶、DNA羥甲基化酶、組蛋白甲基化酶、組蛋白去甲基化酶、組蛋白乙醯轉移酶、組蛋白去乙醯化酶、磷酸酶、激酶、轉錄(共)活化物、轉錄阻遏物、DNA結合蛋白、DNA結構蛋白、標誌物蛋白、報告物蛋白、螢光蛋白、配體結合蛋白、信號肽、亞細胞定位序列、抗體表位和親和純化標簽。
在某些實施方式中,該一個或多個異源功能結構域具有以下活性中的一種或多種:甲基酶活性、脫甲基酶活性、脫胺酶活性、轉錄激活活性、轉錄阻抑活性、轉錄釋放因子活性、逆轉錄酶活性、組蛋白修飾活性、RNA切割活性和核酸結合活性。
另一方面,本揭露提供一種工程化的、可編程的、非天然存在的CRISPR-Cas系統,該系統包含本揭露所述的Cas酶或本揭露所述的融合分子,和一種或多種指導RNA,該一種或多種指導RNA在細胞中靶向編碼一種或多種基因產物的核酸分子的基因座,從而指導該Cas酶或該融合分子結合和/或切割該編碼一種或多種基因產物的核酸分子的基因座;並且,該Cas酶或該融合分子與該指導RNA不共同天然存在。
另一方面,本揭露提供一種工程化的、非天然存在的載體系統,該載體系統包含一種或多種載體,該一種或多種載體包括:a)第一調節元件,該第一調節元件可操作地連接到一種或多種指導RNA上,該一種或多種指導RNA能夠與編碼一種或多種基因產物的核酸分子的基因座中的靶序列雜交,和b)第二調節元件,該第二調節元件可操作地連接到本揭露所述的Cas酶或本揭露所述的融合分子上,其中,該組分a)和該組分b)位 於該載體系統的相同或不同載體上,且該指導RNA在細胞中靶向該編碼一種或多種基因產物的核酸分子的基因座,從而指導該Cas酶或該融合分子結合和/或切割該編碼一種或多種基因產物的核酸分子的基因座;並且,該Cas酶或該融合分子與該指導RNA不共同天然存在。
在某些實施方式中,該一種或多種基因產物的表達被改變。
在某些實施方式中,該基因產物的表達被降低或者被增多。
在某些實施方式中,該基因產物是一種蛋白質。
在某些實施方式中,該細胞是真核細胞。
在某些實施方式中,該真核細胞是哺乳動物細胞。例如,該哺乳動物細胞包括但不限於鼠類、猴、人、農畜、體育用動物和寵物的細胞。
在某些實施方式中,該哺乳動物細胞是人類細胞。
在某些實施方式中,該Cas酶是經密碼子優化的,用以在真核細胞中進行表達。
在某些實施方式中,該指導RNA包含融合到tracr序列上的指導序列。
在某些實施方式中,該指導RNA包含直接重複(Direct repeat)序列和間隔(Spacer)序列,其中該間隔序列與該指導RNA靶向的核酸分子結合。
在某些實施方式中,該直接重複序列的長度為10個至70個核苷酸。
在某些實施方式中,該直接重複序列的長度為31個至36個核苷酸。
在某些實施方式中,該直接重複序列包含SEQ ID NO:63-88和90-99中任一項所示的核苷酸序列,或者包含與SEQ ID NO:63-88和90-99中任一項所示的核苷酸序列具有至少95%序列同一性的核苷酸序列。
在某些實施方式中,該間隔序列的長度為16個至24個核苷酸。
在某些實施方式中,該指導RNA靶向的核酸分子包含能夠與該間隔序列互補配對的核苷酸序列。
在某些實施方式中,該系統的該載體或該Cas酶還包含一個或多個核定位序列(NLS)。
在某些實施方式中,該系統藉由遞送系統被引入該細胞中,該遞送系統選自病毒粒子、脂質體、脂質奈米顆粒、電穿孔、顯微注射和綴合。
另一方面,本揭露提供改變一種或多種基因產物的表達的方法,該方法包括向包含和表達編碼該一種或多種基因產物的核酸分子的細胞中引入一種工程化的、非天然存在的CRISPR-Cas系統,該系統包含本揭露所述的Cas酶或本揭露所述的融合分子,和一種或多種指導RNA,該一種或多種指導RNA靶向該編碼一種或多種基因產物的核酸分子的基因座,從而指導該Cas酶或該融合分子結合和/或切割該基因座,由此改變該一種或多種基因產物的表達;並且,該Cas酶或該融合分子與該指導RNA不共同天然存在。
另一方面,本揭露提供改變一種或多種基因產物的表達的方法,該方法包括向包含和表達編碼該一種或多種基因產物的核酸分子的細胞中引入一種工程化的、非天然存在的載體系統,該載體系統包含一種或多種載體,該一種或多種載體包括:a)第一調節元件,該第一調節元件可操作地連接到一種或多種指導RNA上,該一種或多種指導一種或多種指導RNA能夠與該編碼一種或多種基因產物的核酸分子的基因座中的靶序列雜交,和b)第二調節元件,該第二調節元件可操作地連接到本揭露所述的Cas酶或本揭露所述的融合分子上,其中,該組分a)和該組分b)位於該載體系統的相同或不同載體上,且該指導RNA在該細胞中靶向該編碼一種或多種基因產物的核酸分子的基因座,從而指導該Cas酶或該融合分子結合和/或切割該基因座,由此改變該一種或多種基因產物的表達;並且,該Cas酶或該融合分子與該指導RNA不共同天然存在。
在某些實施方式中,該基因產物的表達被降低或者被增多。
在某些實施方式中,該基因產物是一種蛋白質。
在某些實施方式中,該細胞是真核細胞。
在某些實施方式中,該真核細胞是哺乳動物細胞。例如,該哺乳動物細胞包括但不限於鼠類、猴、人、農畜、體育用動物和寵物的細胞。
在某些實施方式中,該哺乳動物細胞是人類細胞。
在某些實施方式中,該Cas酶是經密碼子優化的,用以在真核細胞中進行表達。
在某些實施方式中,該指導RNA包含融合到tracr序列上的指導序列。
在某些實施方式中,該指導RNA包含直接重複(Direct repeat)序列和間隔(Spacer)序列,其中該間隔序列與該指導RNA靶向的核酸分子結合。
在某些實施方式中,該直接重複序列的長度為10個至70個核苷酸。
在某些實施方式中,該直接重複序列的長度為31個至36個核苷酸。
在某些實施方式中,該直接重複序列包含SEQ ID NO:63-88和90-99中任一項所示的核苷酸序列,或者包含與SEQ ID NO:63-88和90-99中任一項所示的核苷酸序列具有至少95%序列同一性的核苷酸序列。
在某些實施方式中,該間隔序列的長度為16個至24個核苷酸。
在某些實施方式中,該指導RNA靶向的核酸分子包含能夠與該間隔序列互補配對的核苷酸序列。
在某些實施方式中,該系統的該載體或該Cas酶還包含一個或多個核定位序列(NLS)。
在某些實施方式中,該方法包括藉由遞送系統將該CRISPR-Cas系統或該載體系統引入到該細胞中,該遞送系統選自病毒粒子、脂質體、脂質奈米顆粒、電穿孔、顯微注射和綴合。
另一方面,本揭露提供編碼本揭露所述的Cas酶、本揭露所述的融合分子或本揭露所述的CRISPR-Cas系統的核酸。
另一方面,本揭露提供一種細胞,該細胞包含本揭露所述的Cas酶、本揭露所述的融合分子、本揭露所述的CRISPR-Cas系統、本揭露所述的載體系統和/或本揭露所述的核酸。
另一方面,本揭露提供一種試劑盒,該試劑盒包含本揭露所述的Cas酶、本揭露所述的融合分子、本揭露所述的CRISPR-Cas系統、本揭露所述的載體系統、本揭露所述的核酸和/或本揭露所述的細胞。
在某些實施方式中,該試劑盒還包含用於放置該Cas酶、該融合分子、該CRISPR-Cas系統、該載體系統、該核酸和/或該細胞的容器,以及用法說明書。
本領域具有通常知識者能夠從下文的詳細描述中容易地洞察到本揭露的其它方面和優勢。下文的詳細描述中僅顯示和描述了本揭露的示例性實施方式。如本領域具有通常知識者將認識到的,本揭露的內容使得本領域具有通常知識者能夠對所揭露的具體實施方式進行改動而不脫離本揭露所涉及發明的精神和範圍。相應地,本揭露的圖式和說明書中的描述僅僅是示例性的,而非為限制性的。
本揭露所涉及的發明的具體特徵如所附申請專利範圍所顯示。藉由參考下文中詳細描述的示例性實施方式和圖式能夠更好地理解本揭露所涉及發明的特點和優勢。對圖式簡要說明如下:
圖1A及圖1B顯示的是本揭露所述Cas酶在真核細胞內的切割活性的測定流程示意圖和螢光結果以及Cas酶的gRNA結合所需要的PAM基序。
圖2A及圖2B顯示的是本揭露所述Cas酶在真核細胞內的切割活性的測定流程示意圖以及不同Cas酶的綠色螢光細胞對比結果。
圖3A及圖3B顯示的是本揭露所述Cas酶的體外切割活性及其PAM序列的測定流程示意圖以及測序結果。
圖4顯示的是在內源位點檢測本揭露所述Cas酶活性的位點信息以及擴增檢測結果。
圖5A至圖5C顯示的是本揭露所述Cas酶的不同變體在真核細胞內進行切割活性測定後的GFP螢光結果。
圖6A及圖6B顯示的是對本揭露所述Cas酶結合不同DR(Direct repeat)區域優化方案處理過的sgRNA在真核細胞內進行切割活性測定後的綠色螢光細胞比例結果。
圖7顯示的是本揭露所述Cas酶結合不同Spacer長度的sgRNA在真核細胞內進行切割活性測定後的綠色螢光細胞比例結果。
圖8A及圖8B顯示的是本揭露所述Cas酶的不同變體在真核細胞內進行切割活性測定後的綠色螢光細胞比例結果。圖8C顯示的是本揭露所述Cas酶的不同變體在不同PAM報告系統中的切割活性測定結果(綠色螢光細胞比例)。
圖9A至圖9C顯示的是包含本揭露所述Cas酶的胞嘧啶鹼基編輯器的結構示意圖,以及其在EMX1和VEGFA兩種內源位點上檢測鹼基編輯效率的結果。
圖10顯示的是包含本揭露所述Cas酶的基因激活表觀工具在CXCR4內源位點上檢測靶位點基因表達的激活效果。
以下由特定的具體實施例說明本揭露發明的實施方式,熟悉此技術的人士可由本說明書所揭露的內容容易地瞭解本揭露發明的其他優點及效果。
術語定義
在本揭露中,術語“同一性”可與“同源性”互換地使用,其通常是指兩個或多個多肽分子或者兩個或多個核酸分子序列之間的關係,該關係藉由比較它們的序列確定。在本領域中,“同一性”還指核酸分子或者多肽序列相關性的程度,這可以藉由兩個或多個核苷酸或兩個或多個胺基酸的序列之間的匹配來確定。在本揭露中,胺基酸序列的同一性百分比(%)被定義為在比對序列並在必要時引入缺口來達到最大百分比序列同一性,而不將任意保守取代視為序列同一性的部分之後,候選序列中與參考多肽序列中的胺基酸殘基相同的胺基酸殘基占殘基總數的百分比。可以以本領域技術之內的多種方式來達到以測定百分比胺基酸序列同一性為目的的比對,例如,使用公開可得的計算機軟件,如BLAST、BLAST-2、ALIGN或Megalign(DNASTAR)軟件。本領域具有通常知識者可以確定用於比對序 列的適當參數,包括在所比較的序列的全長內達到最大比對所需的任意算法。在某些實施方式中,多肽分子或核酸分子序列的同一性百分比(%)的計算還可以基於序列突變類型確定殘基總數。突變類型包括在序列任一端或兩端的插入(延伸)、在序列任一端或兩端的缺失(截短)、一個或多個胺基酸/核甘酸的置換/替代、在序列內部的插入、在序列內部的缺失。舉多肽的胺基酸序列為例(核苷酸序列同理),如果突變類型為以下中的一種或多種:一個或多個胺基酸/核苷酸的置換/替代、在序列內部的插入和在序列內部的缺失,則殘基總數以比較的分子中較大者來計算。如果突變類型還包括在序列任一端或兩端的插入(延伸)或在序列任一端或兩端的缺失(截短)或在序列內部的插入和在序列內部的缺失,則在任一端或兩端或內部插入或缺失的胺基酸的數量(例如,在兩端插入或缺失的數量小於20個)並不計入殘基總數中。在計算同一性百分比時,可將正在比較的序列以產生序列之間最大匹配的方式比對,並藉由特定算法解決比對中的空位(如果存在的話)。
在本揭露中,“催化活性結構域”是指Cas蛋白(酶)內展現顯著二級結構含量的可鑑別或可確定的保守結構實體且該保守結構為Cas蛋白(酶)實現例如結合和/或切割多核苷酸功能的區域。示例性的催化活性結構域可以是Cas9家族的蛋白酶,其具有兩個催化活性結構域,一個是類HNH的,它的作用是切斷與指導RNA配對的單鏈多核苷酸(目標鏈),另一個結構域是類RuvC的,它的作用是切斷目標鏈的互補鏈。
在本揭露中,術語“結合”(例如,關於多肽或蛋白酶的靶DNA結合(催化活性)結構域)通常是指大分子之間(例如,蛋白質與核酸之間)的 非共價相互作用。當在非共價相互作用的狀態下,大分子被稱作“締合”或“相互作用”或“結合”(例如,當分子X被稱作與分子Y相互作用時,意指分子X以非共價方式結合分子Y)。應瞭解,不是所有的結合相互作用組分都需要為序列特異性的(例如,與DNA骨架中的磷酸酯殘基接觸),但結合相互作用的一些部分可為序列特異性的。
在申請中,術語“融合分子”通常是指至少兩個部分組成的分子(bipartite molecule),其包含本揭露的酶(蛋白質或肽),該酶與至少一個其他部分偶聯,從而形成單個實體。該酶和該至少一個其他部分可以由接頭分開,或者可以直接偶聯。該至少一個其他部分可以在N端、C端或末端胺基酸外的任意胺基酸處與本揭露的酶融合。其他部分可以與已經包含在該融合分子中的部分融合。本領域的具有通常知識者充分瞭解用於確定本揭露的融合分子中的部分的測定最佳順序和/或組合。通常,當融合分子包含本揭露的酶和至少一種其他肽時,該術語不包括這樣的融合分子,在該融合分子中,融合產生天然存在的肽。
在本揭露中,術語“異源”通常是指分別不存在於天然核酸或蛋白質中的核苷酸或多肽序列。在本揭露的某些實施方式中,術語“異源功能結構域”可指除了本揭露所述的Cas酶之外的約或多於約1個、2個、3個、4個、5個、6個、7個、8個、9個、10個或更多個結構域或本揭露所述的融合分子的一部分。可以包含在本揭露所述的融合分子中或者可以與本揭露所述的Cas酶融合的異源功能結構域的實例包括但不限於,表位標簽、報告基因序列、以及具有下列活性的一個或多個的蛋白質結構域:甲基酶活性、脫甲基酶活性、轉錄激活活性、轉錄阻抑活性、轉錄釋放因 子活性、組蛋白修飾活性、RNA切割活性和核酸結合活性。表位標簽的非限制性實例包括組胺酸(His)標簽、V5標簽、FLAG標簽、流感病毒血凝素(HA)標簽、Myc標簽、VSV-G標簽、和硫氧還蛋白(Trx)標簽。報告基因的實例包括,但不限於,谷胱甘肽-S-轉移酶(GST)、辣根過氧化物酶(HRP)、氯黴素乙醯轉移酶(CAT)、β-半乳糖苷酶、β-葡糖醛酸糖苷酶、螢光素酶、綠色螢光蛋白(GFP)、HcRed、DsRed、青螢光蛋白(CFP)、黃色螢光蛋白(YFP)、以包括藍色螢光蛋白(BFP)的自發螢光蛋白。Cas酶可以融合到編碼一種蛋白質或蛋白質片段的基因序列上,該蛋白質或蛋白質片段結合DNA分子或結合其他細胞分子,其包括,但不限於,麥芽糖結合蛋白(MBP)、S-tag、Lex A DNA結合結構域(DBD)融合物、GAL4DNA結合結構域融合物、以及單純皰疹病毒(HSV)BP16蛋白融合物。可以形成包含Cas酶的融合分子的一部分的另外的結構域描述於US 20110059502中,藉由引用將其併入本文。
在本揭露中,術語“表達”通常是指以此從DNA模板轉錄成多核苷酸(如轉錄成mRNA或其他RNA轉錄物)的過程和/或轉錄的mRNA隨後以此轉譯成肽、多肽或蛋白質的過程。轉錄物和編碼的多肽可以總稱為“基因產物”。如果多核苷酸來源於基因組DNA,表達可以包括真核細胞中mRNA的剪接。
在本揭露中,術語“多核苷酸”、“核苷酸”、“核苷酸序列”、“核酸”和“寡核苷酸”可互換地使用。它們通常是指具有任何長度的核苷酸的聚合形式,是脫氧核糖核苷酸或核糖核苷酸、或其類似物。多核苷酸可具有任何三維結構,並且可以執行已知或未知的任何功能。以下是多核苷酸的 非限制性實例:基因或基因片段的編碼區或非編碼區、根據連接分析定義的多個座位(一個座位)、外顯子、內含子、信使RNA(mRNA)、轉運RNA、核糖體RNA、短髮夾RNA(shRNA)、micro-RNA(miRNA)、核酶、cDNA、重組多核苷酸、分支多核苷酸、質粒、載體、任何序列的分離的DNA、任何序列的分離的RNA、核酸探針、和引子。多核苷酸可以包含一個或多個經修飾的核苷酸,如甲基化的核苷酸和核苷酸類似物。如果存在,可以在聚合物組裝之前或之後進行核苷酸結構的修飾。核苷酸的序列可以被非核苷酸組分中斷。多核苷酸可以在聚合後,如藉由與標記的組分綴合來進一步修飾。
在本揭露中,術語“非天然存在的”和“工程化的”可互換地使用。當它們意指核酸分子、多肽、或其組合和其系統時,通常表示該核酸分子或多肽至少基本上從它們在自然界中或如發現於自然界中的與其結合的至少另一種組分游離出來。
在本揭露中,術語“載體”通常是指一種核酸分子,它能夠運送與其連接的另一種核酸分子。載體包括但不限於,單鏈、雙鏈、或部分雙鏈的核酸分子;包括一個或多個自由端、無自由端(例如環狀的)的核酸分子;包括DNA、RNA、或兩者的核酸分子;以及本領域已知的其他多種多樣的多核苷酸。一種類型的載體是“質粒”,其是指其中可以例如藉由標準分子選殖技術插入另外的DNA片段的環狀雙鏈DNA環。另一種類型的載體是病毒載體,其中病毒衍生的DNA或RNA序列存在於用於包裝病毒(例如,逆轉錄病毒、複製缺陷型逆轉錄病毒、腺病毒、複製缺陷型腺病毒、以及腺相關病毒)的載體中。病毒載體還包含由用於轉染到一種宿主細胞中 的病毒攜帶的多核苷酸。某些載體(例如,具有細菌複製起點的細菌載體和附加型哺乳動物載體)能夠在它們被導入的宿主細胞中自主複製。其他載體(例如,非附加型哺乳動物載體)在引入宿主細胞後整合到該宿主細胞的基因組中,並且由此與該宿主基因組一起複製。而且,某些載體能夠指導它們可操作連接的基因的表達。這樣的載體在此被稱為“表達載體”。在重組DNA技術中使用的普通表達栽體通常是質粒形式。重組的表達載體可包含處於適合於在宿主細胞中的核酸表達的形式的本揭露的核酸,這意味著這些重組表達載體包含基於待用於表達的宿主細胞而選擇的一種或多種調節元件,該調節元件可操作地連接至待表達的核酸序列。在重組表達載體內,“可操作地連接”旨在表示感興趣的核苷酸序列以一種允許該核苷酸序列的表達的方式被連接至該一種或多種調節元件(例如,處於一種體外轉錄/轉譯系統中或當該載體被引入到宿主細胞中時,處於該宿主細胞中)。
在本揭露中,術語“調節元件”通常旨在包括啟動子、增強子、內部核糖體進入位點(IRES)、和其他表達控制元件(例如轉錄終止信號,如多聚腺苷酸化信號和多聚U序列)。這樣的調節序列例如描述於戈德爾(Goeddel),《基因表達技術:酶學方法》(GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY)185,學術出版社(Academic Press),聖地亞哥,加利福尼亞州(1990)中。在某些實施方式中,調節元件可包括指導一個核苷酸序列在許多類型的宿主細胞中的組成型表達的那些序列以及指導該核苷酸序列只在某些宿主細胞中表達的那些序列(例如,組織特異型調節序列)。組織特異型啟動子可主要指導在感興趣的期望組織中的表達,該組織例如肌肉、神經元、骨、皮膚、血液、特定的器 官(例如肝臟、胰腺)、或特殊的細胞類型(例如淋巴細胞)。調節元件還可以時序依賴性方式(如以細胞週期依賴性或發育階段依賴性方式)指導表達,該方式可以是或者可以不是組織或細胞類型特異性的。在某些實施方式中,一個載體可包含一個或多個pol III啟動子(例如1、2、3、4、5、或更多個pol III啟動子)、一個或多個pol II啟動子(例如1、2、3、4、5、或更多個pol II啟動子)、一個或多個pol I啟動子(例如1、2、3、4、5、或更多個pol I啟動子)、或其組合。pol III啟動子的實例包括但不限於U6和H1啟動子。pol II啟動子的實例包括但不限於逆轉錄勞斯肉瘤病毒(RSV)LTR啟動子(視需要地具有RSV增強子)、巨細胞病毒(CMV)啟動子(視需要地具有CMV增強子)、SV40啟動子、二氫葉酸還原酶啟動子、β-肌動蛋白啟動子、磷酸甘油激酶(PGK)啟動子、和EF1α啟動子。術語“調節元件”還可以涵蓋的是增強子元件,如WPRE、CMV增強子、在HTLV-I的LTR中的R-U5’片段、SV40增強子;以及在兔β-珠蛋白的外顯子2與3之間的內含子序列(《美國國家科學院院刊》(Proc.Natl.Acad.Sci.USA.),第78(3)卷,第1527-31頁,1981)。
本領域具有通常知識者將理解,表達載體的設計可取決於諸如待轉化的宿主細胞的選擇、所希望的表達水平等因素。一種載體可以被引入到宿主細胞中而由此產生轉錄物、蛋白質、或肽,包括由如本揭露所述的核酸編碼的融合分子或酶(例如,規律間隔成簇短回文重複序列(CRISPR)轉錄物、蛋白質、酶、其突變體形式、其融合分子或融合蛋白等等)。有利的載體包括慢病毒以及腺相關病毒,並且也可選擇此類型的載體以靶向具體類型的細胞。
在本揭露中,術語“密碼子優化”通常是指藉由用在宿主細胞的基因中更頻繁地或者最頻繁地使用的密碼子代替天然序列的至少一個密碼子,例如約或多於約1、2、3、4、5、10、15、20、25、50個、或更多個密碼子同時維持該天然胺基酸序列而修飾一個核酸序列以便增強在感興趣宿主細胞中的表達的方法。不同的物種對於具有特定胺基酸的某些密碼子展示出特定的偏好。密碼子偏好性(在生物之間的密碼子使用的差異)經常與信使RNA(mRNA)的轉譯效率相關,而該轉譯效率則被認為依賴於(除其他之外)被轉譯的密碼子的性質和特定的轉運RNA(tRNA)分子的可用性。細胞內選定的tRNA的優勢一般反映了最頻繁用於肽合成的密碼子。因此,可以將基因定製為基於密碼子優化在給定生物中的最佳基因表達。密碼子利用率表可以容易地獲得,例如在密碼子使用數據庫(“Codon Usage Database”)中,並且這些表可以藉由不同的方式調整適用。例如,參見中村Y.(Nakamura Y.)等人,Codon usage tabulated from the international DNA sequence databases:status for the year 2000,《核酸研究》(Nucl.Acids Res.)28:292(2000年)。用於密碼子優化特定的序列以便在特定的宿主細胞中表達的計算機算法也是可獲得的,如Gene Forge(Aptagen公司,Jacobus,PA),也是可獲得的。在某些實施方式中,在編碼Cas酶的序列中的一個或多個密碼子(例如1、2、3、4、5、10、15、20、25、50個、或更多個、或所有密碼子)相對應於對於特定胺基酸最頻繁使用的密碼子。
在本揭露中,術語“指導RNA”與“guide RNA”、“gRNA”可互換地使用,其通常是指促進將RNA指導的核酸酶或其他效應分子(通常與gRNA分子複合)特異性指導到靶序列上的一組核酸分子。在自然界中, crRNA和tracrRNA通常作為兩個獨立的RNA分子存在,組成gRNA。術語“tracrRNA”通常是指可與Cas核酸酶結合的支架型RNA,術語“crRNA”也稱為CRISPR RNA,通常是指與所靶向的目標DNA互補的一段核苷酸序列。crRNA和tracRNA也可以融合成為單鏈,此時gRNA也可稱為單鏈指導RNA(sgRNA),sgRNA已成為本領域具有通常知識者在CRISPR技術中使用的gRNA的最常見的形式,因此術語“sgRNA”和“gRNA”在本文中可具有相同的含義。sgRNA可以人工合成,也可以在體外或體內由DNA模板製備。sgRNA可以結合Cas核酸酶,也可以靶向目標DNA,其可引導Cas核酸酶切割與gRNA互補的DNA位點。
如本揭露所使用的,crRNA通常包含介導靶識別的間隔(Spacer)序列和與CRISPR-Cas效應蛋白形成複合物的直接重複序列(本文中也稱為“Direct repeat”或“DR序列”)。在某些情況下,間隔序列(也稱導向序列)是與靶序列具有足夠互補性從而與該靶序列雜交並引導CRISPR-Cas系統複合物與該靶序列的特異性結合的任何多核苷酸序列。在某些實施方案中,當最佳比對時,間隔序列與其相應靶序列之間的互補程度為至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%。確定最佳比對在本領域的具有通常知識者的能力範圍內。例如,存在公開和可商購的比對算法和程序,例如但不限於ClustalW、Matlab中的Smith-Waterman算法、Bowtie、Geneious、Biopython以及SeqMan。
在某些實施方案中,該間隔序列在長度上為至少5個、至少10個、至少15個、至少16個、至少17個、至少18個、至少19個、至 少20個、至少21個、至少22個、至少23個、至少24個、至少25個、至少26個、至少27個、至少28個、至少29個、至少30個、至少35個、至少40個、至少45個或至少50個核苷酸。在某些實施方案中,該間隔序列在長度上為不超過50個、45個、40個、35個、30個、25個、24個、23個、22個、21個、20個、15個、10個或更少個核苷酸。在某些實施方案中,該間隔序列在長度上為10-30個、15-25個、15-22個、16-24個、19-25個、或19-22個核苷酸。在某些較佳的實施方案中,該間隔序列的長度為20個核苷酸。
在某些實施方案中,該直接重複序列在長度上為至少10個、至少15個、至少16個、至少17個、至少18個、至少19個、至少20個、至少21個、至少22個、至少23個、至少24個、至少25個、至少26個、至少27個、至少28個、至少29個、至少30個、至少31個、至少32個、至少33個、至少34個、至少35個、至少40個、至少45個、至少50個、至少55個、至少56個、至少57個、至少58個、至少59個、至少60個、至少61個、至少62個、至少63個、至少64個、至少65個或至少70個核苷酸。在某些實施方案中,該直接重複序列在長度上為不超過70個、65個、64個、63個、62個、61個、60個、59個、58個、57個、56個、55個、50個、45個、40個、35個、34個、33個、32個、31個、30個、29個、28個、27個、26個、25個、24個、23個、22個、21個、20個、15個、10個或更少個核苷酸。在某些實施方案中,該直接重複序列在長度上為55-70個核苷酸,例如55-65個核苷酸,例如60-65個核苷酸,例如62-65個核苷酸,例如63-64個核苷酸。在某些實施方案中,該直接重複 序列在長度上為15-40個核苷酸,例如15-25個核苷酸,例如20-30個核苷酸,例如22-36個核苷酸,例如31個核苷酸。
在本揭露中,術語“包含”和“包括”可互換地使用,其通常是指包括明確指定的特徵,但不排除其他要素。術語“至少”通常是指包含本數的情況。
在本揭露中,術語“約”或“大約”通常由本領域具有通常知識者確定的針對特定值的可接受誤差範圍內,其部分取決於怎樣測量或確定該值,即,測量系統的限制。例如,“約”或“大約”可意指按照本領域的實踐在1或超過1個標準偏差內。或者,“約”或“大約”可意指至多10%或20%的範圍(即,±10%或±20%)。
在本揭露中,術語“選自”通常是指包括選擇的對象以及其所有組合。例如“選自(:)A、B和C”意指包括A、B和C的所有組合,例如,A、B、C、A+B、A+C、B+C或A+B+C。
不欲被任何理論所限,下文中的實施例僅僅是為了闡釋本揭露的酶及其融合分子、方法和用途等,而不用於限制本揭露發明的範圍。
實施例
實施例1
測定本揭露的Cas酶在真核細胞內的切割活性
本實施例採用帶有藍-綠光報告系統的穩轉293T細胞測試本揭露提供的Cas酶的活性。如圖1所示,該報告系統帶有持續表達的CMV啟動子、編碼藍色螢光蛋白的序列、編碼綠色螢光蛋白的序列和插入在中 間的gRNA靶向序列;gRNA靶向序列的兩邊帶有隨機的N鹼基序列,可以用來篩選不同的原型間隔區相鄰基序(PAM)偏好的Cas酶。
本揭露的Cas酶切割活性將藉由報告系統顯現的螢光結果測定,未發生切割的報告系統將穩定地表達藍色螢光蛋白從而發出藍色螢光,而編碼綠色螢光蛋白的序列前由於存在終止密碼子而使得綠色螢光蛋白不能表達,報告系統因而不會發出綠色螢光。只有在gRNA靶向序列附近發生DNA切割後,細胞在修復切口過程中發生移碼突變,才能在藍色螢光蛋白穩定表達的同時表達出綠色螢光蛋白。圖1A的螢光結果表明,在轉染了本揭露提供的Cas酶(SEQ ID NO:2)後,具有切割活性的實驗組細胞會產生明顯的表達綠色螢光的細胞群。
將綠色螢光的細胞群用流式分選富集,提取基因組後擴增target區域,藉由高通量測序就能確定本揭露提供的Cas酶的gRNA結合所需要的PAM基序(如圖1B所示)。
在本實施例中,編碼報告系統的示例性核苷酸序列如下所示(粗體為藍色和綠色螢光蛋白序列,斜體為連接序列,下劃線為2A剪切肽序列,粗體下劃線為示例性的包含隨機N鹼基的gRNA靶向序列(SEQ ID NO:59)):
Figure 113121355-A0101-12-0060-40
Figure 113121355-A0101-12-0061-41
Figure 113121355-A0101-12-0062-42
Figure 113121355-A0101-12-0062-43
(SEQ ID NO:61)。
實施例2
測定本揭露的Cas酶在真核細胞內的切割活性強弱
將本揭露提供的Cas酶(SEQ ID NOs:2、47-51和54)、對應的gRNA和帶有gRNA靶向位點的報告質粒共轉染到HEK293T細胞中,藉由改造報告質粒上的靶向序列,可以快速構建不同Cas酶所需的報告系統。如圖2A所示,未發生切割的報告系統細胞只表達藍色螢光蛋白,綠色螢光蛋白因為被隔斷而無法正常表達,此時報告系統僅發出藍色螢光。在gRNA靶向位點發生切割後,細胞會藉由同源重組修復DNA,從而獲得完整的綠色螢光蛋白表達框,從而使報告系統發出綠色螢光。
具有更強切割活性的Cas酶會產生更高比例的DNA切割,從而得到更多拷貝的修復後的綠色螢光蛋白,細胞顯示出更強的綠色螢光,因此本實施例藉由比較綠色螢光細胞的比例和螢光強度,快速比較不同Cas酶的切割活性強弱,其比較結果如圖2B所示。
在本實施例中,編碼報告系統的示例性核苷酸序列如下所示(粗體為藍色和綠色螢光蛋白序列,斜體為連接序列,下劃線為2A剪切肽序列;粗體下劃線為示例性的gRNA靶向序列(SEQ ID NO:60),其中該序列兩端的TTTG和TGG將會根據不同Cas酶的PAM偏好設置成不同序列):
Figure 113121355-A0101-12-0063-44
Figure 113121355-A0101-12-0064-45
Figure 113121355-A0101-12-0065-46
Figure 113121355-A0101-12-0065-47
(SEQ ID NO:62)。
實施例3
測定本揭露的Cas酶的體外切割活性及其PAM序列
如圖3A所示的本實施例的實驗設計流程圖,將本揭露提供的Cas酶用大腸桿菌表達並純化,並與體外轉錄的gRNA(gRNA靶向序列為SEQ ID NO:59,且其兩邊帶有隨機的N鹼基序列用以測定PAM偏好)一起與包含PAM文庫的質粒文庫反應,有切割活性的Cas酶會將質粒文庫切斷,形成線性化DNA。藉由體外連接,將接頭片段連接到DNA線性化後的文庫片段上,然後藉由特異的PCR引子將載體和連接上接頭的文庫片段擴增,並進行高通量測序。
圖3B所示的分析測序結果顯示了有切割活性的Cas酶對於PAM基序的偏好性,藉由這些結果可表明,EpiCas037(SEQ ID NO:36)、EpiCas044(SEQ ID NO:43)、EpiCas040(SEQ ID NO:39)和EpiCas045四個蛋白(SEQ ID NO:44)都具有切割活性,而且都偏好富含T的PAM基序。
實施例4
在內源位點檢測本揭露的Cas酶活性
根據實施例3確定的不同Cas酶的PAM基序,在HEK293T的內源位點找到符合條件的位點,構建gRNA(gRNA靶向序列為SEQ ID NO:89)。將本揭露提供的Cas酶(SEQ ID NOs:44)和對應的gRNA共同轉染到HEK293T細胞,轉染3天後藉由流式分選富集轉染陽性的細胞,裂解細胞後擴增目的區域。將擴增後的PCR片段和T7內切酶反應,如果Cas酶切割了目的位點,將會形成各種不同的隨機修復的序列,這些序列會被T7酶切割產生目的條帶以外的條帶。因此,圖4所示的結果表明該Cas酶在內源位點具有切割活性。
實施例5
測定本揭露的Cas酶突變體在真核細胞內的切割活性強弱
藉由定點突變,將本揭露提供的Cas酶(SEQ ID NO:2)的不同位點突變成目標胺基酸(見下表),再進行如實施例2所述的檢測。其中,gRNA的DR(direct repeat)區域序列和Spacer序列分別如SEQ ID NO:64和60所示。圖5A所示的結果表明,m1、m2、m4、m5、m7、m11、m15突變體活性相較於野生型均有顯著提升。再將這些有效突變疊加後進行相同方法的活性檢測,圖5B所示的結果表明,包含由兩種選自下表的突變疊加形成的雙突變體能進一步提升活性,部分雙突變體的活性與AsCas12a相當;圖5C所示的結果表明,將有效的單突變和雙突變再進一步疊加所形成的三突變體和四突變體仍然保持原有的活性,且活性與 AsCas12a相當。用於對照的AsCas12a的胺基酸序列如SEQ ID NO:127所示。
Figure 113121355-A0101-12-0067-48
實施例6
CRISPR/Cas編輯系統的優化
本實施例將對包含本揭露提供的Cas酶(SEQ ID NO:57)以及gRNA的編輯系統進行優化。其中,對Cas酶活性的檢測採用如實施例2所述的報告系統和檢測方法。
gRNA優化
藉由分子選殖將gRNA的DR(direct repeat)區域改變成36nt(SEQ ID NO:87)、31nt(SEQ ID NO:91)、22nt(SEQ ID NO:90),圖6A所示的結果表明,31nt長度的DR即能維持100%的Cas酶活性。當藉由分子選殖改變DR區域的鹼基對以提高其穩定性時(DR為31.1至31.8時,其核苷酸序列如SEQ ID NO:92-99所示),圖6B所示的結果表明,大部分改動對活性影響不大,而31.8的改動能夠最佳地提升活性。本實施例還藉由分子選殖改變了gRNA用於靶向DNA的間隔區(Spacer)長度,用以提高其結合效率,從而增強Cas酶活性。如圖7所示,當Spacer長度從24nt變化至16nt(SEQ ID NO:100-103,60和104-107),本揭露所提供的Cas酶均能維持活性。
Cas酶突變體
藉由定點突變,將本揭露提供的Cas酶(SEQ ID NO:57)的不同位點突變成目標胺基酸(見下表),再進行如實施例2所述的檢測。其中,gRNA的DR(direct repeat)區域序列和Spacer序列分別如SEQ ID NO:91和60所示。圖8A及圖8B所示的結果表明,多數單一突變對Cas酶活性的影響不大,如果將其中對活性優化效果較好的單一突變進行疊加,可以發現所形成的雙突變體仍能保持較高的活性。
本實施例還在實施例2所述的報告系統基礎上,將TTTG分別突變成TTTH、TTVG、TVTG和VTTG(H代表A/C/T,V代表A/C/G,3個質粒等比例混合後轉染),構建出新的PAM報告系統,藉由圖8C所示的結果發現,部分突變體能夠拓寬PAM識別的範圍,尤其是在識別VTTG、TTVG的PAM的靶點上,相較於野生型,本揭露提供的Cas酶活性獲得了顯著提升。
Figure 113121355-A0101-12-0069-49
Figure 113121355-A0101-12-0070-50
Figure 113121355-A0101-12-0071-51
實施例7
在內源位點檢測失活Cas酶(dCas)效果
dCas-CBE的鹼基編輯效果
將本揭露提供的Cas酶(SEQ ID NO:57)進行失活處理,然後與rAPOBEC1、UGI融合(圖9A),從而獲得基於本揭露提供的Cas酶的胞嘧啶鹼基編輯器,並將其與對應的gRNA(DR序列如SEQ ID NO:91所示,靶向EMX1位點和VEGFA位點的Spacer序列分別如SEQ ID NO:108和109所示)共轉染到HEK293T細胞中,轉染48小時後分選轉染陽性的細胞,提取基因組,擴增目的位點,藉由Sanger測序確定鹼基編輯效率,結果如圖9B及圖9C所示。
其中,dEpiCas059m46-CBE編輯器的胺基酸序列如下所示(SEQ ID NO:116,斜體為NLS,斜粗體為rAPOBEC1,粗體為dEpiCas059,斜 體下劃線為UGI,下劃線為P2A剪切肽,以及<>內為mCherry標記物;其質粒序列為SEQ ID NO:117):
Figure 113121355-A0101-12-0072-52
Figure 113121355-A0101-12-0073-53
dAsCas12a-CBE編輯器的胺基酸序列如下所示(SEQ ID NO:118,斜體為NLS,斜粗體為rAPOBEC1,粗體為dAsCas12a,斜體下劃線為UGI,下劃線為P2A剪切肽,以及<>內為mCherry標記物;其質粒序列為SEQ ID NO:119):
Figure 113121355-A0101-12-0073-54
Figure 113121355-A0101-12-0074-55
Figure 113121355-A0101-12-0075-56
dCas-SPH的基因激活效果
將本揭露提供的Cas酶(SEQ ID NO:55)進行失活處理,然後與10×GCN4融合,用以招募scFV-P65-HSF1的融合肽,從而獲得基於本揭露提供的Cas酶的基因激活工具。該工具的原理基於GCN4能夠自發與scFV相互識別並結合,進而將具有轉錄激活功能的P65和HSF1效應物富集到Cas酶的靶位點附近,繼而激活靶位點的基因表達。
將轉錄激活工具和靶向CXCR4的gRNA(Spacer序列如SEQ ID NOs:120-123所示,該4條gRNA被等比例混合)共轉染到HEK293T細胞中,轉染48小時後,收集細胞,用PE anti-human CXCR4抗體染色(BioLegendg,306506),藉由流式細胞儀檢測PE通道螢光強度,用以反映CXCR4的表達強度。將轉染陽性群的PE平均螢光強度,除以轉染陰性群的PE平均螢光強度,得到激活效率(MFI fold change),用以代表不同激活工具的激活強度(圖10),進而代表不同工具的DNA結合效果。
其中,scFV-P65-HSF1融合肽的胺基酸序列如下所示(SEQ ID NO:124,斜體為NLS,斜粗體為P65和HSF1,粗體為scFV,斜體下劃線為HA標簽,下劃線為連接肽,以及< >內為Flag標記物):
Figure 113121355-A0101-12-0076-57
dEpiCas057-10×GCN4融合肽的胺基酸序列如下所示(SEQ ID NO:125,斜體為NLS,粗體為dEpiCas057,以及< >內為GCN4):
Figure 113121355-A0101-12-0076-58
Figure 113121355-A0101-12-0077-61
Figure 113121355-A0101-12-0078-60
融合肽scFV-P65-HSF1和dEpiCas057-10×GCN4可由SEQ ID NO:126所示的質粒序列一同表達。
以上實驗證明了藉由突變失去切割活性的本揭露提供的Cas酶適用於鹼基編輯以及表觀修飾編輯的應用場景,並且不限於其他基於DNA靶向的應用場景,如基因激活、基因沉默、染色體成像等等。
TW202449148A_113121355_SEQL.xml

Claims (47)

  1. 一種分離的Cas酶,該Cas酶包含SEQ ID NOs:1-58中任一項所示的胺基酸序列或與所述SEQ ID NOs:1-58中任一項所示的胺基酸序列具有至少約80%同一性的序列。
  2. 如請求項1所述的Cas酶,其中該Cas酶具有能夠結合靶DNA鏈的催化活性結構域和/或切割該靶DNA鏈的催化活性結構域。
  3. 如請求項1或2所述的Cas酶,其中該催化活性結構域包含一個或多個胺基酸的改變,從而使得該Cas酶僅具有結合靶DNA鏈的活性,或者具有結合靶DNA鏈的活性和切割該靶DNA單鏈的活性。
  4. 一種融合分子,該融合分子包含如請求項1至3中任一項所述的Cas酶和一個或多個異源功能結構域。
  5. 如請求項4所述的融合分子,其中該一個或多個異源功能結構域能夠調控一種或多種基因產物的表達。
  6. 如請求項4或5所述的融合分子,其中該一個或多個異源功能結構域直接或間接地融合在該Cas酶上。
  7. 如請求項4至6中任一項所述的融合分子,其中該一個或多個異源功能結構域選自自解旋酶、核酸酶、解旋酶-核酸酶、DNA甲基轉移酶、DNA羥甲基化酶、組蛋白甲基化酶、組蛋白去甲基化酶、組蛋白乙醯轉移酶、組蛋白去乙醯化酶、磷酸酶、激酶、轉錄(共)活化物、轉錄阻遏物、DNA結合蛋白、DNA結構蛋白、標誌物蛋白、報告物蛋白、螢光蛋白、配體結合蛋白、信號肽、亞細胞定位序列、抗體表位和親和純化標簽。
  8. 如請求項4至7中任一項所述的融合分子,其中該一個或多個異源功能結構域具有以下活性中的一種或多種:甲基酶活性、脫甲基酶活性、脫胺酶活性、轉錄激活活性、轉錄阻抑活性、轉錄釋放因子活性、逆轉錄酶活性、組蛋白修飾活性、RNA切割活性和核酸結合活性。
  9. 一種工程化的、可編程的、非天然存在的CRISPR-Cas系統,該系統包含如請求項1至3中任一項所述的Cas酶或如請求項4至8中任一項所述的融合分子,和一種或多種指導RNA,該一種或多種指導RNA在細胞中靶向編碼一種或多種基因產物的核酸分子的基因座,從而指導該Cas酶或該融合分子結合和/或切割該編碼一種或多種基因產物的核酸分子的基因座;並且,該Cas酶或該融合分子與該指導RNA不共同天然存在。
  10. 一種工程化的、非天然存在的載體系統,該載體系統包含一種或多種載體,該一種或多種載體包括:
    a)第一調節元件,該第一調節元件可操作地連接到一種或多種指導RNA上,該一種或多種指導RNA能夠與編碼一種或多種基因產物的核酸分子的基因座中的靶序列雜交,和
    b)第二調節元件,該第二調節元件可操作地連接到如請求項1至3中任一項所述的Cas酶或如請求項4至8中任一項所述的融合分子上,
    其中,該組分a)和該組分b)位於該載體系統的相同或不同載體上,且該指導RNA在細胞中靶向該編碼一種或多種基因產物的核酸分子的基因座,從而指導該Cas酶或該融合分子結合和/或切割該編碼一種或多種基因 產物的核酸分子的基因座;並且,該Cas酶或該融合分子與該指導RNA不共同天然存在。
  11. 如請求項9或10所述的系統,其中該一種或多種基因產物的表達被改變。
  12. 如請求項9至11中任一項所述的系統,其中該基因產物的表達被降低或者被增多。
  13. 如請求項9至12中任一項所述的系統,其中該基因產物是一種蛋白質。
  14. 如請求項9至13中任一項所述的系統,其中該細胞是真核細胞。
  15. 如請求項9至14中任一項所述的系統,其中該真核細胞是哺乳動物細胞。
  16. 如請求項9至15中任一項所述的系統,其中該哺乳動物細胞是人類細胞。
  17. 如請求項9至16中任一項所述的系統,其中該Cas酶是經密碼子優化的,用以在真核細胞中進行表達。
  18. 如請求項9至17中任一項所述的系統,其中該指導RNA包含融合到tracr序列上的指導序列。
  19. 如請求項9至18中任一項所述的系統,其中該指導RNA包含直接重複(Direct repeat)序列和間隔(Spacer)序列,其中該間隔序列與該指導RNA靶向的核酸分子結合。
  20. 如請求項19所述的系統,其中該直接重複序列的長度為10個至70個核苷酸。
  21. 如請求項19或20所述的系統,其中該直接重複序列的長度為31個至36個核苷酸。
  22. 如請求項19至21中任一項所述的系統,其中該直接重複序列包含SEQ ID NO:63-88和90-99中任一項所示的核苷酸序列,或者包含與SEQ ID NO:63-88和90-99中任一項所示的核苷酸序列具有至少95%序列同一性的核苷酸序列。
  23. 如請求項19所述的系統,其中該間隔序列的長度為16個至24個核苷酸。
  24. 如請求項19或23所述的系統,其中該指導RNA靶向的核酸分子包含能夠與該間隔序列互補配對的核苷酸序列。
  25. 如請求項9至24中任一項所述的系統,其中該系統的該載體或該Cas酶還包含一個或多個核定位序列(NLS)。
  26. 如請求項9至25中任一項所述的系統,其中該系統藉由遞送系統被引入該細胞中,該遞送系統選自病毒粒子、脂質體、脂質奈米顆粒、電穿孔、顯微注射和綴合。
  27. 一種改變一種或多種基因產物的表達的方法,該方法包括向包含和表達編碼該一種或多種基因產物的核酸分子的細胞中引入一種工程化的、非天然存在的CRISPR-Cas系統,該系統包含如請求項1至3中任一項所述的Cas酶或如請求項4至8中任一項所述的融合分子,和一種或多種指導RNA,該一種或多種指導RNA靶向該編碼一種或多種基因產 物的核酸分子的基因座,從而指導該Cas酶或該融合分子結合和/或切割該基因座,由此改變該一種或多種基因產物的表達;並且,該Cas酶或該融合分子與該指導RNA不共同天然存在。
  28. 一種改變一種或多種基因產物的表達的方法,該方法包括向包含和表達編碼該一種或多種基因產物的核酸分子的細胞中引入一種工程化的、非天然存在的載體系統,該載體系統包含一種或多種載體,該一種或多種載體包括:
    a)第一調節元件,該第一調節元件可操作地連接到一種或多種指導RNA上,該一種或多種指導一種或多種指導RNA能夠與該編碼一種或多種基因產物的核酸分子的基因座中的靶序列雜交,和
    b)第二調節元件,該第二調節元件可操作地連接到如請求項1至3中任一項所述的Cas酶或如請求項4至8中任一項所述的融合分子上,
    其中,該組分a)和該組分b)位於該載體系統的相同或不同載體上,且該指導RNA在該細胞中靶向該編碼一種或多種基因產物的核酸分子的基因座,從而指導該Cas酶或該融合分子結合和/或切割該基因座,由此改變該一種或多種基因產物的表達;並且,該Cas酶或該融合分子與該指導RNA不共同天然存在。
  29. 如請求項27或28所述的方法,其中該基因產物的表達被降低或者被增多。
  30. 如請求項27至29中任一項所述的方法,其中該基因產物是一種蛋白質。
  31. 如請求項27至30中任一項所述的方法,其中該細胞是真核細胞。
  32. 如請求項27至31中任一項所述的方法,其中該真核細胞是哺乳動物細胞。
  33. 如請求項27至32中任一項所述的方法,其中該哺乳動物細胞是人類細胞。
  34. 如請求項27至33中任一項所述的方法,其中該Cas酶是經密碼子優化的,用以在真核細胞中進行表達。
  35. 如請求項27至34中任一項所述的方法,其中該指導RNA包含融合到tracr序列上的指導序列。
  36. 如請求項27至35中任一項所述的方法,其中該指導RNA包含直接重複(Direct repeat)序列和間隔(Spacer)序列,其中該間隔序列與該指導RNA靶向的核酸分子結合。
  37. 如請求項36所述的方法,其中該直接重複序列的長度為10個至70個核苷酸。
  38. 如請求項36或37所述的方法,其中該直接重複序列的長度為31個至36個核苷酸。
  39. 如請求項36至38中任一項所述的方法,其中該直接重複序列包含SEQ ID NO:63-88和90-99中任一項所示的核苷酸序列,或者包含與SEQ ID NO:63-88和90-99中任一項所示的核苷酸序列具有至少95%序列同一性的核苷酸序列。
  40. 如請求項36所述的方法,其中該間隔序列的長度為16個至24個核苷酸。
  41. 如請求項36或40所述的方法,其中該指導RNA靶向的核酸分子包含能夠與該間隔序列互補配對的核苷酸序列。
  42. 如請求項27至41中任一項所述的方法,其中該系統的該載體或該Cas酶還包含一個或多個核定位序列(NLS)。
  43. 如請求項27至42中任一項所述的方法,其中該方法包括藉由遞送系統將該CRISPR-Cas系統或該載體系統引入到該細胞中,該遞送系統選自病毒粒子、脂質體、脂質奈米顆粒、電穿孔、顯微注射和綴合。
  44. 一種編碼如請求項1至3中任一項所述的Cas酶、如請求項4至8中任一項所述的融合分子或如請求項9和11至26中任一項所述的CRISPR-Cas系統的核酸。
  45. 一種細胞,該細胞包含如請求項1至3中任一項所述的Cas酶、如請求項4至8中任一項所述的融合分子、如請求項9和11至26中任一項所述的CRISPR-Cas系統、如請求項10至26中任一項所述的載體系統和/或如請求項44所述的核酸。
  46. 一種試劑盒,該試劑盒包含如請求項1至3中任一項所述的Cas酶、如請求項4至8中任一項所述的融合分子、如請求項9和11至26中任一項所述的CRISPR-Cas系統、如請求項10至26中任一項所述的載體系統、如請求項44所述的核酸和/或如請求項33所述的細胞。
  47. 如請求項46所述的試劑盒,該試劑盒還包含用於放置該Cas酶、該融合分子、該CRISPR-Cas系統、該載體系統、該核酸和/或該細胞的容器,以及用法說明書。
TW113121355A 2023-06-09 2024-06-07 Cas酶及其系統和應用 TW202449148A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2023106849020 2023-06-09
CN202310684902 2023-06-09

Publications (1)

Publication Number Publication Date
TW202449148A true TW202449148A (zh) 2024-12-16

Family

ID=93795045

Family Applications (1)

Application Number Title Priority Date Filing Date
TW113121355A TW202449148A (zh) 2023-06-09 2024-06-07 Cas酶及其系統和應用

Country Status (2)

Country Link
TW (1) TW202449148A (zh)
WO (1) WO2024251229A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN119193541B (zh) * 2023-09-04 2025-08-12 中国农业大学 CRISPR-Casσ酶和系统
CN119265164B (zh) * 2024-12-06 2025-03-11 南京师范大学 一种Cas蛋白及其在检测中的应用

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019178427A1 (en) * 2018-03-14 2019-09-19 Arbor Biotechnologies, Inc. Novel crispr dna targeting enzymes and systems
CA3109083A1 (en) * 2018-08-09 2020-02-13 G+Flas Life Sciences Compositions and methods for genome engineering with cas12a proteins
WO2020142754A2 (en) * 2019-01-04 2020-07-09 Mammoth Biosciences, Inc. Programmable nuclease improvements and compositions and methods for nucleic acid amplification and detection
CN113930413B (zh) * 2020-06-29 2024-12-27 中国农业大学 新型CRISPR-Cas12j.23酶和系统
WO2022166895A1 (zh) * 2021-02-05 2022-08-11 山东舜丰生物科技有限公司 Crispr酶和系统以及应用
CN116144631B (zh) * 2023-01-17 2023-09-15 华中农业大学 耐热型核酸内切酶及其介导的基因编辑系统

Also Published As

Publication number Publication date
WO2024251229A1 (zh) 2024-12-12
WO2024251229A9 (zh) 2025-02-20

Similar Documents

Publication Publication Date Title
US11952571B2 (en) Systems, methods, and compositions for site-specific genetic engineering using programmable addition via site-specific targeting elements (paste)
WO2022253185A1 (zh) Cas12蛋白、含有Cas12蛋白的基因编辑系统及应用
TW202449148A (zh) Cas酶及其系統和應用
GB2556648A (en) Methods
CN116656649A (zh) 一种is200/is60s转座子iscb突变蛋白及其应用
US20220228133A1 (en) Single base substitution protein, and composition comprising same
CN116144629A (zh) Cas9蛋白、含有Cas9蛋白的基因编辑系统及应用
WO2020087631A1 (zh) 基于C2c1核酸酶的基因组编辑系统和方法
CN117025570A (zh) Cas12a突变体蛋白、含有Cas12a突变体蛋白的基因编辑系统及应用
CN116751762A (zh) Cas12b蛋白、单链向导RNA、包含它们的基因编辑系统及相关应用
US12297450B2 (en) CRISPR-Cas13 system and use thereof
CN117230043B (zh) Cas13蛋白及其应用
US20230045095A1 (en) Compositions, Methods and Systems for the Delivery of Gene Editing Material to Cells
WO2024089629A1 (en) Cas12 protein, crispr-cas system and uses thereof
CN119998447A (zh) 新型腺嘌呤脱氨酶变体及使用其进行碱基编辑的方法
WO2023165613A1 (zh) 5&#39;→3&#39;核酸外切酶在基因编辑系统中的用途和基因编辑系统及其编辑方法
JP2025510574A (ja) 真核生物遺伝子編集のための組成物、システムおよび方法
AU2024239330A1 (en) Improved methods and compositions for crispr interference and activation
CN118599808A (zh) 新型Cas9蛋白CasC、其突变体及应用
CN118165956A (zh) 基于Tsp2Cas9蛋白的CRISPR/Cas9基因编辑系统及其相关应用
CN120173914A (zh) 基于IscB系统的紧凑型基因组编辑器和碱基编辑器及其应用
EP4662324A2 (en) Integrase variants for gene insertion in human cell
WO2023122663A2 (en) Effector proteins and methods of use
WO2023029492A1 (zh) 一种外源基因定点整合的系统及方法
TW202526012A (zh) 改良整合酶