定義
本明細書で互換的に使用する、「ポリヌクレオチド」及び「核酸」という用語は、リボヌクレオチド又はデオキシリボヌクレオチドのいずれかである、任意の長さのヌクレオチドのポリマー形態を指す。従って、本用語は、非限定的に、一本鎖、二本鎖、又は多重鎖DNAもしくはRNA、ゲノムDNA、cDNA、DNA-RNAハイブリッド、又はプリン及びピリミジン塩基又は他の天然の、化学的に又は生物学的に修飾された、人工の、又は誘導体化されたヌクレオチド塩基を含有するポリマーを含む。
「ハイブリダイズできる」又は「相補的な」又は「実質的に相補的な」という用語は、核酸(例えば、RNA、DNA)が、非共有結合、すなわち、ワトソン・クリック型塩基対及び/又はG/U塩基対を形成すること、配列特異、非平行、温度及び溶液のイオン強度が適切なインビトロ及び/又はインビボ条件下での方法(すなわち、相補的核酸に特異的に結合する核酸)における別の核酸への「アニール」又は「ハイブリダイゼーション」を可能にするヌクレオチドの配列を含むことを意味する。標準的ワトソン・クリック型塩基対には、チミジン(T)と対を成すアデニン(A)、ウラシル(U)と対を成すアデニン(A)、及びシトシン(C)と対を成すグアニン(G)[DNA、RNA]を含む。さらに、2つのRNA分子(例えば、dsRNA)間でのハイブリダイゼーション、及びDNA分子とRNA分子とのハイブリダイゼーション(例えば、DNA標的核酸がガイドRNAと塩基対を形成する場合など)に対しては、グアニン(G)は、ウラシル(U)とも塩基対を形成することができる。例えば、G/U塩基対は、mRNAにおけるコドンと塩基対を成すtRNAアンチコドンの脈絡において、その遺伝子コードの縮退(すなわち、冗長性)に対して部分的に対応している。従って、本開示の文脈において、(例えば、ガイドRNA分子のタンパク質結合セグメント(dsRNA二本鎖)の、ガイドRNAと塩基対を形成する標的核酸の、など)グアニン(G)は、ウラシル(U)及びアデニン(A)の両方と相補的であると考えられる。例えば、G/U塩基対が、ガイドRNA分子のタンパク質結合セグメント(dsRNA二重分子)の所与のヌクレオチドの位置で形成できる場合、その位置は、非相補的であるとみなされず、代わりに相補的であるとみなされる。
ハイブリダイゼーション及び洗浄条件は公知であり、Sambrook,J.,Fritsch,E.F.及びManiatis,T.Molecular Cloning:A Laboratory Manual,Second Edition,Cold Spring Harbor Laboratory Press,Cold Spring Harbor(1989)、それらの中の、特に11章及び表11.1、及びSambrook,J.及びRussell,W.,Molecular Cloning:A Laboratory Manual,Third Edition,Cold Spring Harbor Laboratory Press,Cold Spring Harbor(2001)に例示されている。温度及びイオン強度の条件が、ハイブリダイゼーションの「ストリンジェンシー」を決定する。
ハイブリダイゼーションには、2つの核酸が相補的配列を含むことが必要であるが、塩基間の不一致も可能である。2つの核酸間でのハイブリダイゼーションに適切な条件は、その核酸の長さ、相補性の度合い、当該技術分野で公知の変動要因に依存する。2つのヌクレオチド配列間の相補性度合いが大きいほど、それら配列を有する核酸ハイブリッドの溶解温度(Tm)の値は大きい。相補性の長さが短い(例えば、35以下の、30以下の、25以下の、22以下の、20以下の、18以下のヌクレオチドにわたる相補性)核酸間のハイブリダイゼーションに対しては、ミスマッチの位置が重要になり得る(Sambrook et al.,supra,11.7-11.8を参照されたい)。通常、ハイブリダイズ可能な核酸の長さは、8ヌクレオチド以上(例えば、10ヌクレオチド以上、12ヌクレオチド以上、15ヌクレオチド以上、20ヌクレオチド以上、22ヌクレオチド以上、25ヌクレオチド以上、又は30ヌクレオチド以上)である。温度、洗浄液の塩濃度、及び他の条件は、相補領域の長さ及び相補性の度合いなどの要因により必要に応じて調整されてよい。
ポリヌクレオチドの配列は、特異的にハイブリダイズ可能である又はハイブリダイズ可能であるために、標的核酸の配列に対して100%相補的である必要はないことが理解される。さらに、ポリヌクレオチドは、介在又は隣接セグメントがハイブリダイゼーション事象(例えば、バルジ、ループ構造、又はヘアピン構造など)に関与しないように、1つ以上のセグメントにわたってハイブリダイズし得る。ポリヌクレオチドは、それがハイブリダイズする標的核酸配列内の標的領域に対して60%以上、65%以上、70%以上、75%以上、80%以上、85%以上、90%以上、95%以上、98%以上、99%以上、99.5%以上、又は100%の配列相補性を含むことができる。例えば、アンチセンス化合物の20ヌクレオ塩基のうちの18が、標的領域と相補的であり、従って、特異的にハイブリダイズするであろうアンチセンス化合物は、90%の相補性を示すであろう。この例では、残りの非相補的ヌクレオチドは、相補的ヌクレオチドでクラスター化又は散在され得、相互又は相補的ヌクレオ塩基に隣接する必要はない。核酸内の核酸配列の特定のストレッチ間の相補性パーセンテージは、任意の好都合な方法を用いて判定することができる。方法の例としては、BLASTプログラム(基本的な局在配置探査ツール)及びパワーBLASTプログラム(Altschul et al.,J.Mol.Biol.,1990,215,403-410、Zhang及びMadden,Genome Res.,1997,7,649-656)、例えば、Smith及びWaterman(Adv.Appl.Math.,1981,2,482-489)のアルゴリズムを利用し、デフォルト設定を使用したGapプログラム(Wisconsin Sequence Analysis Package,Version 8 for Unix,Genetics Computer Group,University Research Park,Madison Wis.)などが挙げられる。
「ペプチド」、「ポリペプチド」、及び「タンパク質」という用語は、本明細書では互換的に使用し、及び任意の長さのアミノ酸のポリマー形態を示し、コードされた及び非コードのアミノ酸、化学的又は生化学的に修飾又は誘導されたアミノ酸、及び修飾されたペプチドのバックボーンを有するポリペプチドを含むことができる。
本明細書で使用する「結合している」(例えば、ポリペプチドのRNA結合ドメイン、標的核酸への結合などを指して)は、高分子間(例えば、タンパク質と核酸の間、Cas9タンパク質/ガイドRNA複合体と標的核酸の間など)の非共有性相互作用を指す。非共有性相互作用の状態にある間、それらの高分子は、「会合している」又は「相互作用している」又は「結合している」といわれる(例えば、分子Xが、分子Yと相互作用しているといわれる場合、非共有的な方法で、分子Xは、分子Yに結合する)。結合相互作用の全ての成分が、配列特異性である必要は無いが(例えば、DNAバックボーンのリン酸残基と接触する)、結合相互作用のある部分は、配列特異性であり得る。結合相互作用は、一般的に、10-6M未満、10-7M未満、10-8M未満、10-9M未満、10-10M未満、10-11M未満、10-12M未満、10-13M未満、10-14M未満、又は10-15M未満の解離定数(KD)により特徴付けられる。「親和性」は、結合の強さを指し、増加した結合親和性は、低いKDと相関する。
「結合ドメイン」は、別の分子に非共有結合的に結合することができるタンパク質ドメインを意味する。結合ドメインは、例えば、DNA分子(DNA結合ドメイン)、RNA分子(RNA結合ドメイン)及び/又はタンパク質分子(タンパク質結合ドメイン)に結合することができる。タンパク質結合ドメインを有するタンパク質の場合、ある場合には、それ自身(ホモダイマー、ホモトリマーなど)に結合することができ及び/又は異なるタンパク質又は複数タンパク質の1つ以上の領域に結合することができる。
「保存アミノ酸置換」という用語は、類似の側鎖を有するアミノ酸残基のタンパク質における互換性を指す。例えば、グリシン、アラニン、バリン、ロイシン、及びイソロイシンからなる脂肪族側鎖を有するアミノ酸の群、セリン及びスレオニンからなる脂肪族水酸基側鎖を有するアミノ酸の群、アスパラギン及びグルタミンからなるアミド含有側鎖を有するアミノ酸の群、フェニルアラニン、チロシン、及びトリプトファンからなる芳香族側鎖を有するアミノ酸の群、リジン、アルギニン、及びヒスチジンからなる塩基性側鎖を有するアミノ酸の群、グルタミン酸及びアスパラギン酸からなる酸性側鎖を有するアミノ酸の群、及びシステイン及びメチオニンからなる硫黄含有側鎖を有するアミノ酸の群である。例示的な保存アミノ酸置換基には、バリン-ロイシン-イソロイシン、フェニルアラニン-チロシン、リジン-アルギニン、アラニン-バリン-グリシン、及びアスパラギン-グルタミンがある。
ポリヌクレオチド又はポリペプチドは、別のポリヌクレオチド又はポリペプチドに対してある特定のパーセントの「配列同一性」を有し、それは、並べた際に、その2つの配列を比較すると、そのパーセンテージの塩基又はアミノ酸が同じであること、及び同じ相対位置にあることを意味する。配列同一性は、いくつかの異なる方法により判断することができる。配列同一性を判断するために、配列を種々の従来の方法及びコンピュータープログラム(例えば、BLAST、T-COFFEE、MUSCLE、MAFFTなど)で整列することができ、ncbi.nlm.nili.gov/BLAST、ebi.ac.uk/Tools/msa/tcoffee/、ebi.ac.uk/Tools/msa/muscle/、mafft.cbrc.jp/alignment/software/を含むサイトで、ワールドワイドウェブを通じて利用できる。例えば、Altschul et al.(1990),J.Mol.Bioi.215:403-10を参照されたい。
特定のRNAを「コード」するDNA配列は、RNAに転写されるDNA核酸配列である。DNAポリヌクレオチドは、タンパク質に翻訳されるRNA(mRNA)をコードしてよく(従って、DNA及びmRNAは両方ともタンパク質をコードする)、又はDNAポリヌクレオチドは、タンパク質に翻訳されないRNA(例えば、tRNA、rRNA、マイクロRNA(miRNA)、「非コード」RNA(ncRNA)、ガイドRNAなど)をコードしてもよい。
「タンパク質コード配列」又は特定のタンパク質又はポリペプチドをコードする配列とは、適切な調整配列の制御下に置かれた場合、インビトロ又はインビボでmRNAに転写され(DNAの場合)及びポリペプチドに翻訳される(mRNAの場合)、核酸配列である。そのコード配列の境界は、5’末端(N末端)での開始コドン及び3’末端(C末端)での転写停止のノンセンスコドンにより決定される。コード配列には、非限定的に、原核生物又は真核生物mRNA由来のcDNA、原核生物又は真核生物DNA由来のゲノムDNA配列、及び合成核酸を含むことができる。転写終了配列は、通常はそのコード配列の3’に位置しているであろう。
本明細書で互換的に使用する「DNA調節配列」、「制御エレメント」、及び「調節エレメント」という用語は、非コード配列(例えば、ガイドRNA)、又はコード配列(例えば、Cas9タンパク質などのクラス2 CRISPR/Casエンドヌクレアーゼ)の転写をもたらす及び/もしくは調節する、及び/又はコードされたポリペプチドの翻訳を調節する、プロモーター、エンハンサー、ポリアデニル化シグナル、ターミネーター、タンパク質分解シグナルなどの転写及び翻訳の制御配列を指す。
本明細書で使用する場合、「プロモーター配列」は、RNAポリメラーゼを結合し、下流(3’方向)コード又は非コード配列の転写を開始することができるDNA調節領域である。本開示の目的のために、プロモーター配列は、そのその3’末端で転写開始部位と境をなし、最低限の塩基又は背景より高く検出可能なレベルで転写開始するのに必要な最低限のエレメントを含むように、上流(5’方向)に伸長する。プロモーター配列内に、転写開始部位、並びにRNAポリメラーゼの結合に関与するタンパク質結合ドメインが見出されるであろう。真核生物プロモーターは多くの場合、常にではないが、「TATA」ボックス及び「CAT」ボックスを含む。誘導性プロモーターを含む種々のプロモーターが、本発明の種々のベクターを誘導するために使用されてよい。
核酸、ポリペプチド、細胞、又は生命体に適用される、本明細書で使用する「自然発生」又は「非修飾」又は「野生型」という用語は、自然界に見出される核酸、ポリペプチド、細胞、又は生命体を指す。例えば、自然の供給源から単離でき及び研究室でヒトにより意図的に修飾されていない生命体(ウイルスを含む)に存在するポリペプチド又はポリヌクレオチド配列は、野生型(及び自然発生)である。
核酸又はポリペプチドに適用される、本明細書で使用する「キメラ」という用語は、異なる供給源由来の構造により定義される2つの要素を指す。例えば、「キメラ」が、キメラポリペプチド(例えば、キメラCas9タンパク質)の文脈で使用される場合、そのキメラポリペプチドは、異なるポリペプチド由来のアミノ酸配列を含む。キメラポリペプチドは、修飾された又は自然発生のポリペプチド配列(例えば、修飾された又は非修飾のCas9タンパク質由来の第1のアミノ酸配列、及び第2のアミノ酸配列、例えば、Cas9の別の種由来の配列、Cas9タンパク質以外のタンパク質由来の配列など)のいずれかを含み得る。同様に、キメラポリペプチドをコードするポリヌクレオチドの文脈における「キメラ」は、異なるコード領域由来のヌクレオチド配列(例えば、修飾された又は非修飾のCas9タンパク質をコードする第1のヌクレオチド配列、及びCas9タンパク質以外のポリペプチドをコードする第2のヌクレオチド配列)を含む。
「キメラポリペプチド」という用語は、通常、ヒトの介入を通じてアミノ配列の2つの別々のセグメントの組み合わせ(すなわち、「融合」)により作られる、ポリペプチドを指す。キメラアミノ酸配列を含むポリペプチドは、キメラポリペプチドである。
本明細書で使用する「異種」は、天然の核酸又はタンパク質の各々には見出されないヌクレオチド又はポリペプチド配列を意味する。例えば、キメラCas9タンパク質において、自然発生の細菌Cas9ポリペプチド(又はそれらの変異体)のRNA結合ドメインは、異種ポリペプチド配列(すなわち、Cas9以外のタンパク質由来のポリペプチド配列又は別の生命体由来のポリペプチド配列)に融合されてよい。異種ポリペプチドは、活性(例えば、酵素活性)を示してもよく、キメラCas9タンパク質によっても示される(例えば、メチルトランスフェラーゼ活性、アセチルトランスフェラーゼ活性、キナーゼ活性、ユビキチン化活性など)。異種核酸配列は、キメラポリペプチドをコードするキメラポリヌクレオチド配列を生成するために、自然発生の核酸配列(又はそれらの変異体)に(例えば、遺伝子工学によって)連結されてよい。別の例として、融合変異体Cas9ポリペプチドにおいて、変異体Cas9ポリペプチドは、異種ポリペプチド(すなわち、Cas9以外のポリペプチド)に融合されてよく、その異種ポリペプチドは、融合変異体Cas9ポリペプチドによっても示される活性を示す。異種核酸配列を、融合タンパク質をコードするヌクレオチド配列を生成するために、変異体Cas9ポリペプチドに(例えば、遺伝子工学によって)連結されてよい。
本明細書で使用する「組換え」は、特定の核酸(DNAもしくはRNA)が、自然系に見出される内因性核酸と区別できる、構造的コード又は非コード配列を有するコンストラクトをもたらすクローニング、制限、ポリメラーゼ連鎖反応(PCR)、及び/又は、ライゲーションステップの種々の組み合わせの産物であることを意味する。ポリペプチドをコードするDNA配列は、細胞又は無細胞の転写及び翻訳系に含まれる、組換え転写ユニットから発現され得る合成核酸を与えるように、断片又は一連の合成オリゴヌクレオチドから組み立てることができる。該当する配列を含むゲノムDNAも、組換え遺伝子又は転写ユニットの形成に使用できる。非翻訳DNAの配列は、オープンリーディングフレームからの5’又は3’に存在し、そのような配列は、コード領域の操作又は発現と干渉せず、実際、種々のメカニズムにより所望の産物の生成を調整するように作用する。あるいは、翻訳されないRNA(例えば、ガイドRNA)をコードするDNA配列も、組換えであるとみなされ得る。従って、例えば、「組換え」核酸という用語は、自然には発生しないもの、例えば、人間が介在した2つの別の配列セグメントの人工的な組み合わせより作られたものを指す。この人工的組み合わせは、化学的な合成手段、又は核酸の単離セグメントの人工的な操作のいずれかにより、例えば、遺伝子組換え技術により、多くの場合行われる。通常、そのような方法は、コドンを同じアミノ酸、保存アミノ酸、又は非保存アミノ酸をコードするコドンと入れ替えて行われる。あるいは、所望の機能の組み合わせを生成するように、所望の機能の核酸セグメントを共につなげて実施される。この人工的組み合わせは、化学的な合成手段、又は核酸の単離セグメントの人工的な操作のいずれかにより、例えば、遺伝子組換え技術により、多くの場合行われる。組換えポリヌクレオチドがポリペプチドをコードする場合、コードされるポリペプチドの配列は、自然に発生するものであり得(「野生型」)、又は自然発生配列の変異体(例えば、突然変異体)であり得る。そのような場合の一例は、野生型タンパク質をコードするDNA(組換え)であり、そのDNA配列は、タンパク質が自然で見られない(例えば、真核細胞における、例えば、CRISPR/Casエンドヌクレアーゼの発現)細胞(例えば、真核細胞)におけるタンパク質の発現に最適化されたコドンである。従って、コドン最適化DNAは、組換えかつ自然には発生しないものであり得る一方、DNAによりコードされるタンパク質は、野生型アミノ酸配列を有してもよい。
従って、「組換え」ポリペプチドという用語は、その配列が自然には発生しないポリペプチドを指す必要はない。代わりに、「組換え」ポリペプチドは、組換えの自然には発生しないDNA配列によりコードされるが、ポリペプチドのアミノ酸配列は、自然に発生するもの(「野生型」)又は自然には発生しない(例えば、変異体、突然変異体など)ことができる。従って、「組換え」ポリペプチドは、ヒト介入の結果であるが、自然発生のアミノ酸配列を有してもよい。
「ベクター」又は「発現ベクター」は、別のDNAセグメント、すなわち「挿入物」を付加し、付加したしたセグメントの複製を細胞においてもたらすようにすることができる、プラスミド、ファージ、ウイルス、又はコスミドなどの、レプリコンである。
「発現カセット」は、プロモーターに作動可能に連結されたDNAコード配列を含む。「作動可能に連結された」は、記述される成分が、意図した方法で機能することを許容する関係にある場所において、並置であることを指す。例えば、プロモーターが、コード配列の転写又は発現に影響を与えるならば、プロモーターは、コード配列に作動可能に連結されている(又はコード配列は、プロモーターに作動可能に連結されていると言うこともできる)。
「組換え発現ベクター」、又は「DNAコンストラクト」という用語は、ベクター及び1つの挿入物を含むDNA分子を指すために本明細書では互換的に使用する。組換え発現ベクターは、挿入物の発現及び/又は伝播の目的で、又は他の組換えヌクレオチド配列の構築のために通常は作製される。挿入物(複数可)は、プロモーター配列に作動可能に連結されても、されなくてもよく、及びDNA調節配列に作動可能に連結されても、されなくてもよい。
細胞は、外因性のDNA、例えば、組換え発現ベクターにより、そのようなDNAが、細胞内へ導入された場合に、「遺伝子的に修飾され」又は「形質転換され」又は「遺伝子導入され」ている。外因性DNAの存在は、恒久的な又は一時的な遺伝子変化をもたらす。形質転換DNAは、細胞のゲノムと一体化されて(共有結合的に連結されて)いても又はいなくてもよい。例えば、原核生物、酵母、哺乳類細胞において、形質転換DNAは、プラスミドなどのエピソーム因子上に保持されてよい。真核細胞については、安定な形質転換細胞は、その中で、形質転換DNAが、染色体と一体化し、そのため染色体の複製を通して娘細胞により継承されるものである。この安定性は、形質転換DNAを含む娘細胞の集団を含む、細胞株又はクローンを確立する真核細胞の能力により示される。「クローン」は、単一細胞又は有糸分裂により共通の祖先から誘導された細胞の集団である。「細胞株」は、多世代にわたりインビトロで安定的に増殖することができる初期細胞のクローンである。
遺伝子修飾(「形質転換」とも呼ばれる)の適切な方法には、ウイルス又はバクテリオファージ感染、トランスフェクション、コンジュゲーション、プロトプラスト融合、リポフェクション、エレクトロポレーション、リン酸カルシウム沈殿、ポリエチレンイミン(PEI)介在トランスフェクション、DEAE-デキストラン介在トランスフェクション、リポソーム介在トランスフェクション、粒子ガン技術、リン酸カルシウム沈殿、ダイレクト・マイクロインジェクション、ナノ粒子介在核酸送達(例えば、Panyam et.,al Adv Drug Deliv Rev.2012 Sep 13.pii:S0169-409X(12)00283-9.doi:10.1016/j.addr.2012.09.023を参照されたい)などを含む。
遺伝子修飾方法の選択は、一般的に、形質転換する細胞の型及びその形質転換が行われる環境(例えば、インビトロ、エクスビボ、インビボ)に依存する。これら方法の一般的な考察は、Ausubel,et al.,Short Protocols in Molecular Biology,3rd ed.,Wiley & Sons,1995に見出すことができる。
本明細書で使用する「標的核酸」は、ゲノム編集エンドヌクレアーゼにより標的とされる部位(「標的部位」又は「標的配列」)を含むポリヌクレオチド(例えば、ゲノムDNAなどのDNA)である。ゲノム編集エンドヌクレアーゼがCRISPR/Casエンドヌクレアーゼである場合、標的配列は、主題のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)のガイド配列がハイブリダイズする配列である。例えば、標的核酸内の標的部位(又は標的配列)である5’-GAGCAUAUC-3’は、配列の5’-GAUAUGCUC-3’により標的とされる(又は結合される、又はハイブリダイゼーションされる、又は相補的である)。適切なハイブリダイゼーション条件には、通常、細胞に存在する生理学的な条件を含む。二本鎖標的核酸の場合、ガイドRNAと相補的な及びハイブリダイズする標的核酸鎖は、「相補鎖」又は「標的鎖」と呼ばれる一方、「相補鎖」に相補的な標的核酸の鎖(及びそれゆえに、ガイドRNAには相補的でない)は、「非標的鎖」又は「非相補鎖」と呼ばれる。
「切断」は、標的核酸分子(例えば、RNA、DNA)の共有バックボーンの切断を意味する。切断は、非限定的に、リン酸ジエステル結合の酵素による又は化学的な加水分解を含む、種々の方法により開始できる。一本鎖切断及び二本鎖切断の両方が可能であり、及び二本鎖切断は、2つの異なる一本鎖切断事象の結果から起こり得る。いくつかの実施形態では、CRISPR/Casタンパク質(例えば、Cas9タンパク質)及び対応するガイドRNAを含む複合体を、二本鎖DNA(dsDNA)の標的切断、例えば、二本鎖DNA破壊(DSB)の誘導に使用する。
「ヌクレアーゼ」及び「エンドヌクレアーゼ」は、核酸切断に対する触媒活性(例えば、リボヌクレアーゼ活性(リボ核酸切断)、デオキシリボヌクレアーゼ活性(デオキシリボ核酸切断)など)を保有する酵素の意味で、本明細書においては互換的に使用する。「ゲノム編集エンドヌクレアーゼ」は、(例えば、細胞のゲノムDNA内の標的位置で切断することで)細胞のゲノムの編集に使用することができるエンドヌクレアーゼである。ゲノム編集エンドヌクレアーゼの例としては、(a)II型のCRISPR/Casタンパク質、例えば、Cas9タンパク質、(b)V型のCRISPR/Casタンパク質、例えば、Cpf1タンパク質、C2c1タンパク質、C2c3タンパク質など、及び(c)VI型のCRISPR/Casタンパク質、例えば、C2c2タンパク質などのクラス2 CRISPR/Casエンドヌクレアーゼが挙げられるが、これらに限定されない。
ヌクレアーゼの「切断ドメイン」又は「活性ドメイン」又は「ヌクレアーゼドメイン」は、核酸切断に対する触媒活性を保有するヌクレアーゼ内のポリペプチド配列又はドメインを意味する。切断ドメインは、単鎖ポリペプチド鎖に含まれ得て、又は切断活性は、2つ(又はそれ以上)のポリペプチドの会合によってもたらすことができる。単一ヌクレアーゼドメインは、所与のポリペプチド内の、単離された1つ以上のアミノ酸のストレッチからなってよい。
本明細書で使用する「宿主細胞」又は「標的細胞」は、インビボ又はインビトロの真核細胞、原核細胞(例えば、細菌又は古細菌細胞)、又は単細胞実体として培養された、多細胞の有機体由来の細胞(例えば、細胞株)を指し、その真核又は原核細胞は、主題のゲノムターゲティング組成物に対する受容体として使用でき、又は使用されており、(例えば、細胞が核酸により形質転換されている場合、又は細胞ゲノムがゲノムターゲティング組成物により修飾されている場合)起源細胞の子孫を含む。単一細胞の子孫は、自然に、偶発的に、又は意図的な突然変異のために、その起源親と、形態において又は遺伝子的又は全DNA補体において、完全に同一である必要はないことが理解される。「組換え宿主細胞」(また「遺伝子的に修飾された宿主細胞」とも呼ばれる)は、例えば、核酸、例えば、発現ベクターを含むことができる主題のゲノムターゲティング組成物が導入されている宿主細胞である。例えば、主題の細菌宿主細胞は、外因性核酸(例えば、プラスミド又は組換え発現ベクター)が適切な細菌宿主細胞に導入されたために、遺伝子的に修飾された細菌宿主細胞であり得、主題の真核宿主細胞は、外因性核酸が適切な真核宿主細胞に導入されたために、遺伝子的に修飾された真核宿主細胞(例えば、哺乳類生殖細胞)であり得る。
「幹細胞」という用語は、本明細書では、自己再生し及び分化した細胞型を生成する両能力を有する細胞(例えば、植物幹細胞、脊椎動物幹細胞)を指すために使用する(Morrison et al.(1997)Cell 88:287-298を参照されたい)。細胞の個体発生の文脈においては、形容詞「分化した」、又は「分化している」は、相対的な用語である。「分化した細胞」は、それと比較される細胞に比べて、発達経路がさらに進化した細胞である。従って、多能性幹細胞(後述)は、血統制限前駆細胞(例えば、胚葉幹細胞)に分化でき、それは次いで、さらに制限された細胞(例えば、ニューロン前駆細胞)に分化でき、それは最終段階の細胞(すなわち、神経細胞、心筋細胞などの終末分化細胞)に分化でき、それは特定の組織型における特徴的な役割を果たし、及びさらに増殖する能力を保持していても、していなくてもよい。幹細胞は、特定マーカーの存在(例えば、タンパク質、RNAなど)及び特定マーカーの不在の両方により特徴づけられてよい。幹細胞はまた、インビトロ内及びインビボの両方の機能アッセイ、特に、複数の分化した子孫を増加させる幹細胞の能力に関連したアッセイにより特定され得る。
目的の幹細胞には、多能性幹細胞(PSC)を含む。「多能性幹細胞」又は「PSC」という用語は、本明細書では、生命体の全ての細胞型を産生することができる幹細胞を意味するために使用する。従って、PSCは、生命体の全ての胚層の細胞(例えば、脊椎動物の内胚葉、中胚葉、及び外胚葉)の増加をもたらすことができる。多能性細胞は、奇形種の形成及び生きている生命体の外胚葉、中胚葉、又は内胚葉への寄与が可能である。植物の多能性幹細胞は、その植物の全ての細胞型(例えば、根、幹、葉などの細胞)を生じさせることができる。
動物のPSCは、多数の異なる方法で誘導できる。例えば、胚性幹細胞(ESC)は、胚の内部細胞塊から派生し(Thomson et.al,Science.1998 Nov 6;282(5391):1145-7)、誘導多能性幹細胞(iPSC)は、体細胞から派生する(Takahashi et.al,Cell.2007 Nov 30;131(5):861-72、Takahashi et.al,Nat Protoc.2007;2(12):3081-9、Yu et.al,Science.2007 Dec 21;318(5858):1917-20.Epub 2007 Nov 20)。PSCという用語は、その由来に関係なく多能性幹細胞を指すので、PSCという用語は、ESC及びiPSCという用語、ならびに、PSCの別の例である、胚性生殖幹細胞(EGSC)という用語も包含する。PSCは、確立された細胞株の形態でよく、1次胚組織から直接取得してよく、又は体細胞から誘導してよい。PSCは、本明細書に記述する方法の標的細胞であり得る。
「胚性幹細胞」(ESC)は、胚から、通常は胚盤胞の内部細胞塊から単離されたPSCを意味する。ESC株は、アメリカ国立衛生研究所(NIH)のヒト胚性幹細胞レジストリにリストされており、例えば、hESBGN-01、hESBGN-02、hESBGN-03、hESBGN-04(BresaGen,Inc.)、HES-1、HES-2、HES-3、HES-4、HES-5、HES-6(ES Cell International)、Miz-hES1(MizMedi Hospital-Seoul National University)、HSF-1、HSF-6(University of California at San Francisco)、及び H1、H7、H9、H13、H14(Wisconsin Alumni Research Foundation(WiCell Research Institute))である。目的の幹細胞にはまた、アカゲザル(Rh)幹細胞及びマーモセット幹細胞などの、他の霊長類由来の胚性幹細胞を含む。幹細胞は、任意の哺乳類、例えば、ヒト、馬、牛、豚、犬、猫、齧歯動物、例えば、マウス、ラット、ハムスター、霊長類などから取得してよい(Thomson et al.(1998)Science 282:1145、Thomson et al.(1995)Proc.Natl.Acad.Sci USA 92:7844、Thomson et al.(1996)Biol.Reprod.55:254、Shamblott et al.,Proc.Natl.Acad.Sci.USA 95:13726,1998)。培養において、ESCは、大きな核-細胞質比を持つフラットコロニーとして成長し、境界及び突出した核小体として定義される。さらに、ESCは、SSEA-3、SSEA-4、TRA-1-60、TRA-1-81、及びアルカリホスファターゼを発現するが、SSEA-1は発現しない。ESCを生成し及び特徴づける方法の例は、例えば、米国特許第7,029,913号、米国特許第5,843,780号、及び米国特許第6,200,806号に見出され、その開示は、その全体が参照により本明細書に組み込まれる。未分化形態でのhESCを増殖する方法は、WO99/20741、WO01/51616、及びWO03/020920に記述されている。
「胚性生殖幹細胞」(EGSC)又は「胚性生殖細胞」又は「EG細胞」は、生殖細胞及び/又は生殖細胞前駆細胞、例えば、始原生殖細胞、すなわち、精子及び卵になる細胞から派生したPSCを意味する。胚性生殖細胞(EG細胞)は、上述の胚性幹細胞に似た性質を持つと考えられる。EGを生成し及び特徴づける方法の例示は、例えば、米国特許第7,153,684号、Matsui,Y.,et al.,(1992)Cell 70:841、Shamblott,M.,et al.(2001)Proc.Natl.Acad.Sci.USA 98:113、Shamblott,M.,et al.(1998)Proc.Natl.Acad.Sci.USA,95:13726、及びKoshimizu,U.,et al.(1996)Development,122:1235に見出され、その開示は、その全体が参照により本明細書に組み込まれる。
「誘導多能性幹細胞」又は「iPSC」は、PSCではない細胞から(すなわち、PSCに対して相対的に分化した細胞から)派生したPSCを意味する。iPSCは、終末分化細胞を含む、複数の異なる細胞型から誘導できる。iPSCは、ES様形態を有し、大きな核-細胞質比を持つフラットコロニーとして成長し、境界及び突出した核小体として定義される。さらに、iPSCは、非限定的に、アルカリホスファターゼ、SSEA3、SSEA4、Sox2、Oct3/4、Nanog、TRA160、TRA181、TDGF 1、Dnmt3b、FoxD3、GDF3、Cyp26al、TERT、及びzfp42を含む、当業者には公知の1つ以上の主要な多能性マーカーを発現する。iPSCを生成し及び特徴づける方法の例は、例えば、アメリカ公開特許番号US20090047263、US20090068742、US20090191159、US20090227032、US20090246875、及びUS20090304646に見出され、その開示は、その全体が参照により本明細書に組み込まれる。一般的に、iPSCを生成するためには、体細胞は、多能性幹細胞になる体細胞を再プログラム化するために、当該技術分野では公知の再プログラム化因子(例えば、Oct4、SOX2、KLF4、MYC、Nanog、Lin28など)と共に与えられる。
「体細胞」とは、実験操作の不在下で、通常は、生命体の全ての細胞型の増加をもたらさない生命体の任意の細胞を意味する。言い換えれば、体細胞は、身体の3つの全ての胚葉体、すなわち、外胚葉、中胚葉、内胚葉の細胞を、自然には生成しない十分に分化した細胞である。例えば、体細胞は、神経細胞及び神経前駆細胞の両方を含み、後者は、中枢神経系の全ての又はいくつかの細胞型を自然に増加させることができ得るが、胚葉及び内胚葉系統の細胞の増加をもたらすことができない。
「有糸分裂細胞」は、有糸分裂を起こしている細胞を意味する。有糸分裂は、真核細胞が、その核の中の染色体を、2つの別々の核の中の、2つの同じセットに分割することによるプロセスである。一般的には、細胞質分裂が即座に続き、核、細胞質、細胞小器官及び細胞膜を、これらの細胞成分のほぼ等しい振り分を含むように2つの細胞中に分割する。
「有糸分裂後細胞」とは、有糸分裂が終了した、すなわち、「静止した」、すわなち、もはや分裂していない細胞を意味する。この静止状態は、一時的で、すなわち、可逆的であってよく、又は恒久的であり得る。
「減数分裂細胞」とは、減数分裂を起こしている細胞を意味する。減数分裂は、細胞が、配偶子又は胞子を産生する目的で、その核物質を分割することによるプロセスである。有糸分裂とは異なり、減数分裂においては、染色体が、染色体間の遺伝物質をシャッフルで組換えるステップを取る。さらに、有糸分裂から生み出される2つの(遺伝的には同じ)二倍体細胞と比較して、減数分裂の結果、4つの(遺伝的には一意の)半数体細胞になる。
「治療」、「治療する」などの用語は、本明細書では、一般に、所望の薬理学的及び/又は生理学的効果を得ることを意味するために使用する。その効果は、疾患又はそれらの症状を完全に又は部分的に防ぐ観点からの予防のためであってよく、及び/又は疾患及び/又はその疾患に起因する悪影響を部分的に又は完全に治す観点からの治療のためであってよい。本明細書で使用する「治療」は、哺乳類における疾患又は症状の任意の治療を対象とし、(a)その疾患又は症状をもたらす傾向があるが、未だそれを引き起こしたとして診断されていない対象者に起こる疾患又は症状を予防すること、(b)その疾患又は症状を阻害すること、すなわち、その発症を抑止すること、又は(c)その疾患を緩和すること、すなわち、その疾患の退行を引き起こすことを含む。治療薬は、疾患又は傷害の発症前、その間又はその後に投与されてよい。治療が、患者の望ましくない臨床的症状を安定化させ又は軽減する場合の、進行中の疾患の治療が、特に興味深い治療である。そのような治療は、影響を受ける組織の機能が完全に失われる前に行われるのが望ましい。対象の治療は、その疾患の症候性段階の間に、及びある場合には、その疾患の症候性段階の後で投与されるのが望ましい。
「個人」「対象者」、「宿主」及び「患者」という用語は、本明細書では互換的に使用し、及び診断を受ける、治療を受ける、又は治療が望まれる任意の哺乳類の対象、例えば、ヒトを指す。
ある場合には、成分(例えば、核酸成分(例えば、CRISPR/CasガイドRNA)、タンパク質成分(例えば、ゲノム編集エンドヌクレアーゼ、例えば、Cas9タンパク質)など)は、標識部分を含む。本明細書で使用する「標識」、「検出可能な標識」、又は「標識部分」という用語は、シグナル検出を提供する任意の部分を指し、アッセイの特定の性質に応じて大きく変化し得る。目的の標識部分は、直接的に検出可能な標識(直接標識)(例えば、蛍光標識)、及び間接的に検出可能な標識(間接標識)(例えば、結合対メンバー)の両方を含む。蛍光標識は、任意の蛍光標識(例えば、蛍光色素(例えば、フルオレセイン、テキサスレッド、ローダミン、ALEXAFLUOR(登録商標)標識など)、蛍光タンパク質(例えば、緑色蛍光タンパク質(GFP)、強化GFP(EGFP)、黄色蛍光タンパク質(YFP)、赤色蛍光タンパク質(RFP)、シアン蛍光タンパク質(CFP)、チェリー、トマト、タンジェリン、及びそれらの任意の蛍光誘導体)など)であってもよい。方法で使用される適切な検出可能な(直接的又は間接的に)標識部分には、分光学、光化学、生化学、免疫化学、電気、光学、化学、又は他の手段により検出可能ないずれかの部分を含む。例えば、適切な間接標識には、ストレプトアビジン(それ自身を直接又は間接的に標識することができる)によって結合することができるビオチン(結合対メンバー)が含まれる。標識は、放射性標識(直接標識)(例えば、3H、125I、35S、14C、又は32P)、酵素(間接標識)(例えば、ペルオキシダーゼ、アルカリホスファターゼ、ガラクトシダーゼ、ルシフェラーゼ、グルコースオキシダーゼなど)、蛍光タンパク質(直接標識)(例えば、緑色蛍光タンパク質、赤色蛍光タンパク質、黄色蛍光タンパク質、及びそれらの任意の便利な誘導体)、金属標識(直接標識)、比色標識、結合対メンバーなども含み得る。「結合対のパートナー」又は「結合対メンバー」は、第1及び第2の部分の1つを意味し、第1及び第2の部分は、互いに対して特異的な結合親和性を有する。適当な結合対としては、抗原/抗体(例えば、ジゴキシゲニン/抗ジゴキシゲニン、ジニトロフェニル(DNP)/抗DNP、ダンシル-X-抗ダンシル、フルオレセイン/抗フルオレセイン、ルシファーイエロー/抗ルシファーイエロー、及びローダミン抗ローダミン)、ビオチン/アビジン(又はビオチン/ストレプトアビジン)、カルモジュリン結合性タンパク質(CBP)/カルモジュリンが挙げられるが、これらに限定されない。任意の結合対メンバーは、間接的に検出可能な標識部分として使用するのに適し得る。
任意の所与の成分もしくは成分の組み合わせは、非標識であってもよく、又は標識部分で検出可能に標識されてもよい。ある場合には、2つ以上の成分が標識されている場合、それらは、互いに区別可能な標識部分で標識することができる。
分子及び細胞生化学における一般的な方法は、Molecular Cloning:A LaboratoryManual,3rd Ed.(Sambrook et al.,HaRBor Laboratory Press 2001)、Short Protocols inMolecular Biology,4th Ed.(Ausubel et al.eds.,John Wiley & Sons 1999)、ProteinMethods(Bollag et al.,John Wiley & Sons 1996)、Nonviral Vectors for Gene Therapy(Wagner et al.eds.,Academic Press 1999)、Viral Vectors(Kaplift & Loewy eds.,Academic Press 1995)、ImmunologyMethodsManual(I.Lefkovits ed.,Academic Press 1997)、及びCell and Tissue Culture:Laboratory Procedures in Biotechnology(Doyle & Griffiths,John Wiley & Sons 1998)などの、標準的な教科書に見出され得、それらの開示は、その全体が参照により本明細書に組み込まれる。
本発明をさらに説明する前に、本発明は、記載される特定の実施形態に限定されず、従って、言うまでもなく、変動し得ることを理解されたい。本明細書で使用される専門用語は、特定の実施形態を説明することを単に目的とし、本発明の範囲は添付の特許請求の範囲によってのみ限定され得るため、限定を意図しないことも理解されたい。
値の範囲が提供される場合、文脈が別途明確に指示しない限り、下限値の単位の10分の1までの、その範囲の上限値から下限値の間の各介在値、並びにその指定範囲の任意の他の指定値又は介在値が、本発明に包含されることが理解される。これらのより小さい範囲の上限値及び下限値は、独立して、より小さい範囲に含まれてよく、指定範囲内の任意の具体的に除外された値に従って、これらも本発明に包含される。指定範囲がそれらの上限値及び下限値のうちの1つ又は両方を含む場合、それらの含まれる上限値及び下限値のいずれか又は両方を除外する範囲も本発明に包含される。
別途定義されない限り、本明細書で使用される全ての技術用語及び科学用語は、本発明が属する当業者が一般に理解する意味と同一の意味を有する。本明細書に記載の方法及び材料と同様もしくは同等の任意の方法及び材料も、本発明の実践又は試験において使用することができるが、好ましい方法及び材料が、これから説明される。本明細書で言及される全ての刊行物は、参照により本明細書に組み込まれて、その刊行物が引用されるものと関連する方法及び/又は材料を開示及び説明する。
本明細書で及び添付の特許請求の範囲で用いるとき、単数形「a」、「an」、及び「the」は、文脈が別途明確に指示しない限り、複数指示対象を含むことに留意されたい。従って、例えば、「リボ核タンパク質複合体」への言及は、複数のかかる複合体を含み、「変異ジストロフィン遺伝子」への言及は、1つ以上の変異ジストロフィン遺伝子及び当業者に公知のその等価物を含む等である。請求項は、いかなる任意の要素をも排除するように作成され得ることにさらに留意されたい。従って、この記述は、請求項要素の列挙に関連する、「単に」、「のみ」等のような排他的用語の使用、又は「否定的」限定の使用に対する、先行詞の役割を果たすことが意図される。
明確にするために、別個の実施形態の文脈において説明される本発明のある特定の特長は、単一の実施形態にて組み合わせで提供されてもよいことが理解される。逆に、簡潔にするために、単一の実施形態の文脈において説明される本発明の様々な特長は、別個に又は任意の好適な副組み合わせで提供されてよい。本発明に関連する実施形態の全ての組み合わせは、本発明によって具体的に包含され、それぞれ及び全ての組み合わせが個別にかつ明示的に開示されたかのように本明細書に開示される。加えて、様々な実施形態及びそれらの要素の全ての副組み合わせも本発明によって具体的に包含され、それぞれ及び全てのそのような副組み合わせが個別にかつ明確に本明細書に開示されたかのように本明細書に開示される。
本明細書で考察される刊行物は、本出願の出願日前のそれらの開示のためにのみ提供される。本明細書におけるいずれの内容も、本発明が先行発明によりそのような刊行物に先行する資格がないことを認めるものと解釈されるべきではない。さらに、提供される刊行物の日付は、実際の出版日とは異なる可能性があり、別々に確認する必要があり得る。
詳細な説明
本開示は、細胞のゲノムにおける変異ジストロフィン遺伝子の修飾方法を提供する。本開示は、細胞のゲノムにおける変異ジストロフィン遺伝子を修飾するための組成物及びキットをさらに提供する。
組成物、キット、及び方法
細胞(例えば、ヒト細胞)のゲノムにおける変異ジストロフィン遺伝子を修飾することを含む方法を提供する。ある場合には、方法は、(a)クラス2 CRISPR/Casエンドヌクレアーゼ(例えば、Cas9タンパク質)、又はクラス2 CRISPR/Casエンドヌクレアーゼをコードするヌクレオチド配列を含む核酸、及び(b)クラス2 CRISPR/Casエンドヌクレアーゼに対応する第1及び第2のCRISPR/CasガイドRNA、又は第1及び第2のCRISPR/CasガイドRNAをコードするヌクレオチド配列を含む1つ以上の核酸を細胞に導入することを含む。第1のCRISPR/CasガイドRNAは、変異ジストロフィン遺伝子のイントロン44内で標的配列にハイブリダイズするガイド配列を含み、及び第2のCRISPR/CasガイドRNAは、変異ジストロフィン遺伝子のイントロン55内で標的配列にハイブリダイズするガイド配列を含む。導入するステップは、エクソン45~55を含む変異ジストロフィン遺伝子の330キロベースを超える領域の欠失をもたらす(例えば、ある場合には、非相同末端結合(NHEJ)による)。
従って、ある場合には、主題の方法は、変異ジストロフィン遺伝子のイントロン44及び55における細胞のゲノムの切断、及びエクソン45~55を含む変異ジストロフィン遺伝子の330キロベースを超える領域の欠失をもたらす。従って、主題の方法は、変異ジストロフィン遺伝子の330キロベースを超える領域の欠失をもたらし、欠失領域は、エクソン45~55を含む(例えば、残りの配列が、エクソン45~55が欠けているジストロフィンmRNAをコードし、例えば、イントロン44の残りの配列及びイントロン55の残りの配列が、単一イントロンになり、エクソン44が、それによってエクソン56に直接スプライシングされるように)。従って、ある場合には、欠失領域は、イントロン配列を含み、及び残りの配列も、イントロン配列を含む。
ある場合には、主題の方法は、330キロベース(kb)を超えるゲノム欠失をもたらす。ある場合には、主題の方法は、400キロベース(kb)以上(例えば、450kb以上、500kb以上、550kb以上、600kb以上、650kb以上、700kb以上など)のゲノム欠失をもたらす。例えば、ある場合には、イントロン44内の標的配列とイントロン55内の標的配列は、互いに330キロベース(kb)を超えて離れている。ある場合には、イントロン44内の標的配列とイントロン55内の標的配列は、互いに400kb以上(例えば、450kb以上、500kb以上、550kb以上、600kb以上、650kb以上、700kb以上など)離れている。ある場合には、イントロン44内の標的配列とイントロン55内の標的配列は、互いに700kb以上離れている。
従って、ある場合には、第1のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)のガイド配列は、ヒトジストロフィン遺伝子のイントロン44に対応する標的配列(例えば、ヒトジストロフィン遺伝子のイントロン44内の標的配列、マウスジストロフィン遺伝子内の標的配列など)と20の連続したヌクレオチドにわたって100%の相補性を有し、第2のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)のガイド配列は、ヒトジストロフィン遺伝子のイントロン55に対応する標的配列(例えば、ヒトジストロフィン遺伝子のイントロン55内の標的配列、マウスジストロフィン遺伝子内の標的配列など)と20の連続したヌクレオチドにわたって100%の相補性を有する。いくつかのそのような場合には、イントロン44に対応する標的配列とイントロン55に対応する標的配列は、互いに330キロベース(kb)を超えて離れている。ある場合には、イントロン44に対応する標的配列とイントロン55に対応する標的配列は、互いに400キロベース(kb)以上(例えば、450kb以上、500kb以上、550kb以上、600kb以上、650kb以上、700kb以上など)離れている。ある場合には、イントロン44内の標的配列とイントロン55内の標的配列は、互いに700kb以上離れている。
ヒト細胞におけるそのようなゲノム欠失を達成するために使用することができるガイドRNA(例えば、ガイドRNAのガイド配列)及び標的配列の例を(図23に提供される)表2及び(図24に提供される)表9に提供する。
主題の組成物、キット、及び方法では、成分(例えば、(a)クラス2 CRISPR/Casエンドヌクレアーゼ、例えば、Cas9、Cpf1など、及び/又は(b)第1及び第2の対応するガイドRNA、例えば、Cas9ガイドRNA、Cpf1ガイドRNAなど)は、DNA、RNA、又はタンパク質として細胞に送達する(細胞に導入する)ことができる。例えば、主題の組成物、キット、及び/又は方法が、クラス2 CRISPR/Casエンドヌクレアーゼ(例えば、Cas9、Cpf1など)、及び対応するガイドRNA(例えば、Cas9ガイドRNA、Cpf1ガイドRNAなど)を含む場合、エンドヌクレアーゼ及びガイドRNAは、RNP複合体(すなわち、CRISPR/Casエンドヌクレアーゼ及び対応するCRISPR/CasガイドRNAの予め組み立てられた複合体)として送達する(細胞に導入する)ことができる。従って、クラス2 CRISPR/Casエンドヌクレアーゼ(例えば、Cas9)は、タンパク質として細胞に導入することができる。クラス2 CRISPR/Casエンドヌクレアーゼ(例えば、Cas9)は、エンドヌクレアーゼをコードする核酸(DNA、及び/又はRNA)として細胞に導入することもできる。CRISPR/CasガイドRNAは、RNAとして、又はガイドRNAをコードするDNAとして細胞に導入することができる。
ある場合には、クラス2 CRISPR/Casエンドヌクレアーゼ(例えば、Cas9タンパク質)は、異種ポリペプチド(「融合パートナー」とも称される)に融合される融合タンパク質である。ある場合には、クラス2 CRISPR/Casエンドヌクレアーゼは、細胞内局在化を与えるアミノ酸配列(融合パートナー)に融合され、すなわち、融合パートナーは、細胞内局在化配列(例えば、核に標的化するための1つ以上の核局在化シグナル(NLS)、2つ以上のNLS、3つ以上のNLSなど)である。いくつかの実施形態では、クラス2 CRISPR/Casエンドヌクレアーゼは、追跡及び/又は精製を容易にするためのタグ(すなわち、融合パートナーは、検出可能な標識である)を与えるアミノ酸配列(融合パートナー)に融合される(例えば、蛍光タンパク質、例えば、緑色蛍光タンパク質(GFP)、YFP、RFP、CFP、mCherry、tdTomatoなど、ヒスチジンタグ、例えば、6XHisタグ、赤血球凝集素(HA)タグ、FLAGタグ、Mycタグなど)。いくつかの実施形態では、融合パートナーは、安定性の増加又は低減を与え得る(すなわち、融合パートナーは、安定性制御ペプチド、例えば、ある場合には、制御可能なデグロン(例えば、温度感受性又は薬剤により制御可能なデグロン配列)であり得る)。
ある場合には、クラス2 CRISPR/Casエンドヌクレアーゼは、細胞による取り込みを促進するために(すなわち、融合パートナーは、細胞による取り込みを促進する)、ポリペプチド浸透性ドメインにコンジュゲートされる(例えば、融合される)。いくつかの浸透性ドメインが当該技術分野において公知であり、用いられてもよく、これには、ペプチド、ペプチド模倣薬、及び非ペプチド担体が含まれる。例えば、浸透性ペプチドは、アミノ酸配列RQIKIWFQNRRMKWKK(配列番号1080)を含む、ペネトラチンと称される、キイロショウジョウバエ(Drosophila melanogaster)転写因子アンテナペディア(Antennapaedia)の第三αヘリックスに由来し得る。別の例として、浸透性ペプチドは、例えば、自然発生のtatタンパク質のアミノ酸49~57を含み得る、HIV-1 tat基本領域アミノ酸配列を含むことができる。他の浸透性ドメインには、ポリ-アルギニンモチーフ、例えば、HIV-1 revタンパク質のアミノ酸34~56の領域、ノナ-アルギニン、オクタ-アルギニンなどが含まれる。(例えば、Futaki et al.(2003)Curr Protein Pept Sci.2003 Apr;4(2):87-9 and 446、及びWender et al.(2000)Proc.Natl.Acad.Sci.U.S.A 2000 Nov.21;97(24):13003-8、米国特許出願公開第20030220334号、同第20030083256号、同第20030032593号、及び同第20030022831号(これらは、移行ペプチド及び移行ペプトイドの教示のために参照によって本明細書に明確に組み込まれる)を参照されたい)。ノナ-アルギニン(R9)配列は、特徴付けされたより効率的なPTDの1つである(Wender et al.2000;Uemura et al.2002)。融合が起こる部位は、ポリペプチドの生物活性、分泌、又は結合の特徴を最適化するために、選択されてもよい。最適な部位は、通例の実験法により判断することができる。
ある場合には、クラス2 CRISPR/Casエンドヌクレアーゼは、「タンパク質形質導入ドメイン」又はPTD(CPP:細胞浸透性ペプチドとしても知られている)を含み、これは、脂質二重層、ミセル、細胞膜、細胞小器官膜、又はベシクル膜の横断を促進するポリペプチド、ポリヌクレオチド、炭水化物、又は有機もしくは無機化合物を指す。低分子極性分子から巨大な高分子及び/又はナノ粒子まで及び得る別の分子に結合したPTDは、その分子が膜を横切ること、例えば、細胞外間隙から細胞内空間、又は細胞基質から細胞小器官内への移行を促進する。いくつかの実施形態では、PTDは、アミノ末端ポリペプチド(例えば、クラス2 CRISPR/Casエンドヌクレアーゼ、例えば、Cas9タンパク質)のアミノ末端に共有結合的に連結される。いくつかの実施形態では、PTDは、ポリペプチド(例えば、クラス2 CRISPR/Casエンドヌクレアーゼ、例えば、Cas9タンパク質)のカルボキシル末端に共有結合的に連結される。ある場合には、PTDは、クラス2 CRISPR/Casエンドヌクレアーゼ(例えば、Cas9タンパク質)の内部に挿入される(すなわち、クラス2 CRISPR/CasエンドヌクレアーゼのN又はC末端ではない)。ある場合には、主題のクラス2 CRISPR/Casエンドヌクレアーゼ(例えば、Cas9タンパク質)は、1つ以上のPTD(例えば、2つ以上、3つ以上、4つ以上のPTD)を含む(にコンジュゲートされる、に融合される)。ある場合には、PTDは、核局在化シグナル(NLS)(例えば、ある場合には、2つ以上、3つ以上、4つ以上、又は5つ以上のNLS)を含む。
ある場合には、クラス2 CRISPR/Casエンドヌクレアーゼ(例えば、Cas9タンパク質)は、1つ以上のNLS(例えば、2つ以上、3つ以上、4つ以上、又は5つ以上のNLS)を含む。いくつかの実施形態では、PTDは、核酸(例えば、CRISPR/CasガイドRNA、CRISPR/CasガイドRNAをコードするポリヌクレオチド、Cas9タンパク質又はV型又はVI型のCRISPR/Casタンパク質などのクラス2 CRISPR/Casエンドヌクレアーゼをコードするポリヌクレオチドなど)に共有結合的に連結される。PTDの例としては、最小ウンデカペプチドタンパク質形質導入ドメイン(YGRKKRRQRRR、配列番号1076を含むHIV-1 TATの残基47~57に対応)、細胞への侵入を方向付けるのに充分な多くのアルギニン(例えば、3、4、5、6、7、8、9、10、又は10~50個のアルギニン)を含むポリアルギニン配列、VP22ドメイン(Zender et al.(2002)Cancer Gene Ther.9(6):489-96)、ドロソフィラ・アンテナペディア(Drosophila Antennapedia)タンパク質形質導入ドメイン(Noguchi et al.(2003)Diabetes 52(7):1732-1737)、切断型ヒトカルシトニンペプチド(Trehin et al.(2004)Pharm.Research 21:1248-1256);ポリリジン(Wender et al.(2000)Proc.Natl.Acad.Sci.USA 97:13003-13008);RRQRRTSKLMKR(配列番号1077)、トランスポータンGWTLNSAGYLLGKINLKALAALAKKIL(配列番号1078)、KALAWEAKLAKALAKALAKHLAKALAKALKCEA(配列番号1079)、及びRQIKIWFQNRRMKWKK(配列番号1080)が挙げられるが、これらに限定されない。例示的なPTDとしては、限定はされないが、YGRKKRRQRRR(配列番号1081)、RKKRRQRRR(配列番号1082)、3個のアルギニン残基~50個のアルギニン残基のアルギニンホモポリマーが挙げられ、例示的なPTDドメインアミノ酸配列としては、限定はされないが、以下:YGRKKRRQRRR(配列番号1083)、RKKRRQRR(配列番号1084)、YARAAARQARA(配列番号1085)、THRLPRRRRRR(配列番号1086)、及びGGRRARRRRRR(配列番号1087)のいずれかが挙げられる。いくつかの実施形態では、PTDは、活性化可能CPP(ACPP)である(Aguilera et al.(2009)Integr Biol(Camb)June;1(5-6):371-381)。ACPPは、切断可能なリンカーを介して適合するポリアニオン(例えば、Glu9又は「E9」)に連結されたポリカチオンCPP(例えば、Arg9又は「R9」)を含み、これは、実効電荷をほぼゼロに減少させることで、細胞への接着及び取り込みを阻害する。リンカーを切断すると、ポリアニオンが放出され、ポリアルギニン及びその固有の接着性が局所的に暴露され、それによってACPPの膜横断が「活性化」される。
クラス2 CRISPR/Casエンドヌクレアーゼ(例えば、Cas9タンパク質)は、上記の任意の組み合わせにおける複数の(1つ以上、2つ以上、3つ以上など)融合パートナーを有し得る。例示的な例として、クラス2 CRISPR/Casエンドヌクレアーゼ(例えば、Cas9タンパク質)は、タグ付けを与える融合パートナー(例えば、GFP)を有し得、及び細胞内局在化配列(例えば、1つ以上のNLS)も有し得る。ある場合には、そのような融合タンパク質は、追跡及び/又は精製を容易にするためのタグ(例えば、ヒスチジンタグ、例えば、6XHisタグ、赤血球凝集素(HA)タグ、FLAGタグ、Mycタグなど)も有し得る。別の例示的な例として、クラス2 CRISPR/Casエンドヌクレアーゼ(例えば、Cas9タンパク質)は、1つ以上のNLS(例えば、2つ以上、3つ以上、4つ以上、5つ以上、1つ、2つ、3つ、4つ、又は5つのNLS)を有し得る。ある場合には、融合パートナー(又は複数の融合パートナー、例えば、1つ、2つ、3つ、4つ、又は5つのNLS)(例えば、NLS、タグ、活性を与える融合パートナーなど)は、クラス2 CRISPR/Casエンドヌクレアーゼ(例えば、Cas9タンパク質)C末端に又はその近くに位置する。ある場合には、融合パートナー(又は複数の融合パートナー、例えば、1つ、2つ、3つ、4つ、又は5つのNLS)(例えば、NLS、タグ、活性を与える融合パートナーなど)は、クラス2 CRISPR/Casエンドヌクレアーゼ(例えば、Cas9タンパク質)のN末端に位置する。ある場合には、クラス2 CRISPR/Casエンドヌクレアーゼ(例えば、Cas9タンパク質)は、N末端及びC末端の両方に融合パートナー(又は複数の融合パートナー、例えば、1つ、2つ、3つ、4つ、又は5つのNLS)(例えば、NLS、タグ、活性を与える融合パートナーなど)を有する。
クラス2 CRISPR/Casエンドヌクレアーゼ
細菌及び古細菌におけるRNA媒介適応免疫系は、一緒に機能してウイルス及びプラスミドの侵入からの防御をもたらすクラスター化した規則的な間隔の短いパリンドローム反復(CRISPR)ゲノム遺伝子座、及びCRISPR関連(Cas)タンパク質に依存する。いくつかの実施形態では、主題の方法、組成物、及び/又はキットは、クラス2 CRISPR/Casエンドヌクレアーゼを含む。クラス2 CRISPR系では、エフェクター複合体(例えば、標的DNAの切断)の機能は、単一エンドヌクレアーゼによって実施される(例えば、Zetsche et al.,Cell.2015 Oct 22;163(3):759-71;Makarova et al.,Nat Rev Microbiol.2015 Nov;13(11):722-36;及びShmakov et al.,Mol Cell.2015 Nov 5;60(3):385-97を参照されたい)。従って、「クラス2 CRISPR/Casタンパク質」という用語は、クラス2 CRISPR系由来のエンドヌクレアーゼ(標的核酸を切断するタンパク質)を包含するように本明細書で使用される。従って、本明細書で使用する「クラス2 CRISPR/Casエンドヌクレアーゼ」という用語は、II型のCRISPR/Casタンパク質(例えば、Cas9)、V型のCRISPR/Casタンパク質(例えば、Cpf1、C2c1、C2C3)、及びVI型のCRISPR/Casタンパク質(例えば、C2c2)を包含する。現在まで、クラス2 CRISPR/Casタンパク質は、II型、V型、及びVI型のCRISPR/Casタンパク質を包含するが、この用語は、対応するガイドRNAに結合して、RNP複合体を形成する(例えば、標的DNAを切断する)のに適した任意のクラス2 CRISPR/Casタンパク質を包含することも意図する。
II型のCRISPR/Casエンドヌクレアーゼ(例えば、Cas9)
自然のII型のCRISPR/Cas系では、Cas9は、二本鎖DNA切断(DSB)を一緒に生成するか又は一本鎖DNA切断(SSB)を個別に生成することができるCas9における2つのヌクレアーゼ活性部位を伴うメカニズムによって、crRNAを有する二重ガイドRNA及びトランス活性化crRNA(tracrRNA)を使用して、標的認識及び切断するRNAガイドエンドヌクレアーゼとして機能する。II型のCRISPRエンドヌクレアーゼCas9、及び遺伝子操作された二重(dgRNA)又は単一ガイドRNA(sgRNA)は、所望のDNA配列に標的化することができるリボ核タンパク質(RNP)複合体を形成する。二重RNA複合体又はキメラ単一ガイドRNAによるガイドで、Cas9は、非相同末端結合(NHEJ)又は相同性指向的組換え(HDR)のいずれかによって回復される二本鎖DNA(dsDNA)標的核酸内で部位特異的DSB又はSSBを生成する。
ある場合には、主題の方法、組成物、及び/又はキットは、II型のCRISPR/Casエンドヌクレアーゼを含む。II型のCRISPR/Casエンドヌクレアーゼは、クラス2 CRISPR/Casエンドヌクレアーゼの一種である。ある場合には、II型のCRISPR/Casエンドヌクレアーゼは、Cas9タンパク質である。Cas9タンパク質は、Cas9ガイドRNAと複合体を形成する。ガイドRNAは、標的核酸(本明細書の他の箇所に記載される)の配列(標的部位)に相補的であるヌクレオチド配列(ガイド配列)を有することで、Cas9ガイドRNA複合体に対する標的特異性をもたらす。複合体のCas9タンパク質は、部位特異的活性をもたらす。言い換えれば、Cas9タンパク質は、それ自体がCas9ガイドRNAのタンパク質結合セグメントと会合することによって、標的核酸配列(例えば、ゲノムDNA)内で標的部位にガイドされる(例えば、標的部位で安定化される)。
ある場合には、CRIPR/Casエンドヌクレアーゼ(例えば、Cas9タンパク質)は、自然発生のタンパク質(例えば、細菌及び/又は古細菌細胞で自然発生する)である。他の場合では、CRIPR/Casエンドヌクレアーゼ(例えば、Cas9タンパク質)は、自然発生のポリペプチドではない(例えば、CRIPR/Casエンドヌクレアーゼは、変異体CRIPR/Casエンドヌクレアーゼ、キメラタンパク質などであり、例えば、ある場合には、CRIPR/Casエンドヌクレアーゼは、1つ以上のNLSを含む)。
適切なCas9タンパク質の例としては、配列番号5~816に記載されるものが挙げられるが、これらに限定されない。自然発生のCas9タンパク質は、Cas9ガイドRNAと結合するため、標的核酸(標的部位)内の特異的配列に指向され、標的核酸を切断する(例えば、dsDNAを切断して、二重鎖切断を生成する)。キメラCas9タンパク質は、異種タンパク質(融合パートナーと称される)に融合されるCas9ポリペプチドを含む融合タンパク質であり、異種タンパク質は、活性(例えば、Cas9タンパク質によって提供されないもの)をもたらす。融合パートナーは、活性、例えば、酵素活性(例えば、ヌクレアーゼ活性、DNA及び/又はRNAメチル化に対する活性、DNA及び/又はRNA切断に対する活性、ヒストンアセチル化に対する活性、ヒストンメチル化に対する活性、RNA修飾に対する活性、RNA結合に対する活性、RNAスプライシングに対する活性など)をもたらすことができる。ある場合には、Cas9タンパク質の部分(例えば、RuvCドメイン、及び/又はHNHドメイン)は、野生型Cas9タンパク質の対応する部分に対してヌクレアーゼ活性の低下を示す(例えば、ある場合には、Cas9タンパク質は、ニッカーゼである)。ある場合には、Cas9タンパク質は、野生型Cas9タンパク質に対して(例えば、ストレプトコッカス・ピオゲネスCas9に対して)酵素的に不活性であるか又は酵素活性が低下している。
所与のタンパク質がCas9ガイドRNAと相互作用するかどうかを判定するアッセイは、タンパク質と核酸の間の結合を試験する任意の便利な結合アッセイであってもよい。適当な結合アッセイ(例えば、ゲルシフトアッセイ)は、当業者に公知である(例えば、Cas9ガイドRNAとタンパク質を標的核酸に添加することを含むアッセイ)。
タンパク質が活性を有するかどうかを判定する(例えば、タンパク質が、標的核酸を切断するヌクレアーゼ活性、及び/又はいくつかの異種活性を有するかどうかを判定する)アッセイは、任意の便利なアッセイ(例えば、核酸切断を試験する任意の便利な核酸切断アッセイ)であってもよい。適当なアッセイ(例えば、切断アッセイ)は、当業者に公知であり、Cas9ガイドRNAとタンパク質を標的核酸に添加することを含むことができる。
ある場合には、キメラCas9タンパク質は、標的核酸を修飾する酵素活性を有する異種ポリペプチドを含む(例えば、ヌクレアーゼ活性、メチルトランスフェラーゼ活性、脱メチル化酵素活性、DNA回復活性、DNA損傷活性、脱アミノ化活性、ジスムターゼ活性、アルキル化活性、脱プリン活性、酸化活性、ピリミジンダイマー形成活性、インテグラーゼ活性、トランスポサーゼ活性、リコンビナーゼ活性、ポリメラーゼ活性、リガーゼ活性、ヘリカーゼ活性、光回復酵素活性、又はグリコシラーゼ活性)。
ある場合には、キメラCas9タンパク質は、標的核酸と関連するポリペプチド(例えば、ヒストン)を修飾する酵素活性を有する異種ポリペプチドを含む(例えば、メチルトランスフェラーゼ活性、脱メチル化酵素活性、アセチルトランスフェラーゼ活性、脱アセチル化酵素活性、キナーゼ活性、ホスファターゼ活性、ユビキチンリガーゼ活性、脱ユビキチン化活性、アデニル化活性、脱アデニル化活性、SUMO化活性、脱SUMO化活性、リボシル化活性、脱リボシル化活性、ミリストイル化活性、又は脱ミリストイル化活性)。
ある場合には、CRISPR/Casエンドヌクレアーゼ(例えば、Cas9タンパク質)は、細胞内で局在化をもたらす異種ポリペプチドを含む。例えば、ある場合には、主題のCRISPR/Casエンドヌクレアーゼ(例えば、Cas9タンパク質)は、1つ以上(例えば、2つ以上、3つ以上、4つ以上、5つ以上など)の核局在化配列(NLS)を含む。1つ以上(例えば、2つ以上、3つ以上、4つ以上、5つ以上など)のNLSは、CRISPR/Casエンドヌクレアーゼ(例えば、Cas9タンパク質)内の任意の便利な位置、例えば、N末端、C末端、内部などであってもよい。ある場合には、CRISPR/Casエンドヌクレアーゼ(例えば、Cas9タンパク質)は、N末端で1つ以上(例えば、2つ以上、3つ以上、4つ以上、5つ以上など)のNLS、及びC末端で1つ以上(例えば、2つ以上、3つ以上、4つ以上、5つ以上など)のNLSを含む。
種々様々な種に由来する多くのCas9オルソログが同定されており、ある場合には、タンパク質は、同一のアミノ酸をわずかしか共有していない。同定されたCas9オルソログは、中心のHNHエンドヌクレアーゼドメイン及び分割されたRuvC/RNaseHドメイン(例えば、RuvCI、RuvCII、及びRuvCIII)を有する類似のドメイン構造を有する(例えば、表1を参照されたい)。例えば、Cas9タンパク質は、3つの異なる領域(RuvC-I、RuvC-II、及びRucC-IIIと呼ばれることもある)を有し得、それらは、Cas9タンパク質の一次アミノ酸配列に対して連続していないが、タンパク質が一度産生されて折り畳まれると、一緒に折り畳まれて、RuvCドメインを形成する。従って、Cas9タンパク質は、少なくとも4つの重要なモチーフを、保存された構造と共有すると言うことができる。モチーフ1、2、及び4は、RuvC様モチーフであり、一方、モチーフ3は、HNHモチーフである。表1に記載されるモチーフは、当該技術分野で受け入れられているRuvC様及び/又はHNHドメイン全体を表していない場合があるが、表1は、所与のタンパク質がCas9タンパク質であるかどうかの判断を助けるために使用することができるモチーフを提示する。
表1.表1は、種々の種に由来するCas9配列に存在する4つのモチーフを列挙する。表1に列挙されるアミノ酸は、ストレプトコッカス・ピオゲネス由来のCas9(配列番号5)である。
ある場合には、適切なCas9タンパク質は、4つのモチーフを有するアミノ酸配列を含み、モチーフ1~4の各々は、配列番号1~4にそれぞれ記載されるモチーフ1~4(例えば、表1を参照されたい)、又は配列番号5~816に記載されるアミノ酸配列のいずれかに対応する部分に対して60%以上、70%以上、75%以上、80%以上、85%以上、90%以上、95%以上、99%以上、又は100%のアミノ酸配列同一性を有する。
言い換えれば、ある場合には、適切なCas9ポリペプチドは、4つのモチーフを有するアミノ酸配列を含み、モチーフ1~4の各々は、配列番号5に記載されるCas9アミノ酸配列のモチーフ1~4(例えば、配列番号1~4に記載の配列、例えば、表1を参照されたい)、又は配列番号6~816に記載されるアミノ酸配列のいずれかに対応する部分に対して60%以上、70%以上、75%以上、80%以上、85%以上、90%以上、95%以上、99%以上、又は100%のアミノ酸配列同一性を有する。
ある場合には、適切なCas9タンパク質は、4つのモチーフを有するアミノ酸配列を含み、モチーフ1~4の各々は、配列番号5に記載されるCas9アミノ酸配列のモチーフ1~4(モチーフは、表1であり、列番号1~4にそれぞれ記載される)、又は配列番号6~816に記載されるアミノ酸配列のいずれかに対応する部分に対して60%以上のアミノ酸配列同一性を有する。ある場合には、適切なCas9タンパク質は、4つのモチーフを有するアミノ酸配列を含み、モチーフ1~4の各々は、配列番号5に記載されるCas9アミノ酸配列のモチーフ1~4(モチーフは、表1であり、列番号1~4にそれぞれ記載される)、又は配列番号6~816に記載されるアミノ酸配列のいずれかに対応する部分に対して70%以上のアミノ酸配列同一性を有する。ある場合には、適切なCas9タンパク質は、4つのモチーフを有するアミノ酸配列を含み、モチーフ1~4の各々は、配列番号5に記載されるCas9アミノ酸配列のモチーフ1~4(モチーフは、表1であり、列番号1~4にそれぞれ記載される)、又は配列番号6~816に記載されるアミノ酸配列のいずれかに対応する部分に対して75%以上のアミノ酸配列同一性を有する。ある場合には、適切なCas9タンパク質は、4つのモチーフを有するアミノ酸配列を含み、モチーフ1~4の各々は、配列番号5に記載されるCas9アミノ酸配列のモチーフ1~4(モチーフは、表1であり、列番号1~4にそれぞれ記載される)、又は配列番号6~816に記載されるアミノ酸配列のいずれかに対応する部分に対して80%以上のアミノ酸配列同一性を有する。ある場合には、適切なCas9タンパク質は、4つのモチーフを有するアミノ酸配列を含み、モチーフ1~4の各々は、配列番号5に記載されるCas9アミノ酸配列のモチーフ1~4(モチーフは、表1であり、列番号1~4にそれぞれ記載される)、又は配列番号6~816に記載されるアミノ酸配列のいずれかに対応する部分に対して85%以上のアミノ酸配列同一性を有する。ある場合には、適切なCas9タンパク質は、4つのモチーフを有するアミノ酸配列を含み、モチーフ1~4の各々は、配列番号5に記載されるCas9アミノ酸配列のモチーフ1~4(モチーフは、表1であり、列番号1~4にそれぞれ記載される)、又は配列番号6~816に記載されるアミノ酸配列のいずれかに対応する部分に対して90%以上のアミノ酸配列同一性を有する。ある場合には、適切なCas9タンパク質は、4つのモチーフを有するアミノ酸配列を含み、モチーフ1~4の各々は、配列番号5に記載されるCas9アミノ酸配列のモチーフ1~4(モチーフは、表1であり、列番号1~4にそれぞれ記載される)、又は配列番号6~816に記載されるアミノ酸配列のいずれかに対応する部分に対して95%以上のアミノ酸配列同一性を有する。ある場合には、適切なCas9タンパク質は、4つのモチーフを有するアミノ酸配列を含み、モチーフ1~4の各々は、配列番号5に記載されるCas9アミノ酸配列のモチーフ1~4(モチーフは、表1であり、列番号1~4にそれぞれ記載される)、又は配列番号6~816に記載されるアミノ酸配列のいずれかに対応する部分に対して99%以上のアミノ酸配列同一性を有する。ある場合には、適切なCas9タンパク質は、4つのモチーフを有するアミノ酸配列を含み、モチーフ1~4の各々は、配列番号5に記載されるCas9アミノ酸配列のモチーフ1~4(モチーフは、表1であり、列番号1~4にそれぞれ記載される)、又は配列番号6~816に記載されるアミノ酸配列のいずれかに対応する部分に対して100%のアミノ酸配列同一性を有する。上で定義される任意のCas9タンパク質は、Cas9ポリペプチドとして、キメラCas9ポリペプチド(例えば、Cas9融合タンパク質)の一部として使用することができ、それらのいずれも、本開示のRNPにおいて使用することができる。
ある場合には、適切なCas9タンパク質は、配列番号5に記載されるCas9アミノ酸配列のアミノ酸7~166又は731~1003、又は配列番号6~816に記載されるアミノ酸配列のいずれかに対応する部分に対して60%以上、70%以上、75%以上、80%以上、85%以上、90%以上、95%以上、99%以上、又は100%のアミノ酸配列同一性を有するアミノ酸配列を含む。
ある場合には、適切なCas9タンパク質は、配列番号5に記載されるCas9アミノ酸配列のアミノ酸7~166又は731~1003、又は配列番号6~816に記載されるアミノ酸配列のいずれかに対応する部分に対して60%以上のアミノ酸配列同一性を有するアミノ酸配列を含む。ある場合には、適切なCas9タンパク質は、配列番号5に記載されるCas9アミノ酸配列のアミノ酸7~166又は731~1003、又は配列番号6~816に記載されるアミノ酸配列のいずれかに対応する部分に対して70%以上のアミノ酸配列同一性を有するアミノ酸配列を含む。ある場合には、適切なCas9タンパク質は、配列番号5に記載されるCas9アミノ酸配列のアミノ酸7~166又は731~1003、又は配列番号6~816に記載されるアミノ酸配列のいずれかに対応する部分に対して75%以上のアミノ酸配列同一性を有するアミノ酸配列を含む。ある場合には、適切なCas9タンパク質は、配列番号5に記載されるCas9アミノ酸配列のアミノ酸7~166又は731~1003、又は配列番号6~816に記載されるアミノ酸配列のいずれかに対応する部分に対して80%以上のアミノ酸配列同一性を有するアミノ酸配列を含む。ある場合には、適切なCas9タンパク質は、配列番号5に記載されるCas9アミノ酸配列のアミノ酸7~166又は731~1003、又は配列番号6~816に記載されるアミノ酸配列のいずれかに対応する部分に対して85%以上のアミノ酸配列同一性を有するアミノ酸配列を含む。ある場合には、適切なCas9タンパク質は、配列番号5に記載されるCas9アミノ酸配列のアミノ酸7~166又は731~1003、又は配列番号6~816に記載されるアミノ酸配列のいずれかに対応する部分に対して90%以上のアミノ酸配列同一性を有するアミノ酸配列を含む。ある場合には、適切なCas9タンパク質は、配列番号5に記載されるCas9アミノ酸配列のアミノ酸7~166又は731~1003、又は配列番号6~816に記載されるアミノ酸配列のいずれかに対応する部分に対して95%以上のアミノ酸配列同一性を有するアミノ酸配列を含む。ある場合には、適切なCas9タンパク質は、配列番号5に記載されるCas9アミノ酸配列のアミノ酸7~166又は731~1003、又は配列番号6~816に記載されるアミノ酸配列のいずれかに対応する部分に対して99%以上のアミノ酸配列同一性を有するアミノ酸配列を含む。ある場合には、適切なCas9タンパク質は、配列番号5に記載されるCas9アミノ酸配列のアミノ酸7~166又は731~1003、又は配列番号6~816に記載されるアミノ酸配列のいずれかに対応する部分に対して100%のアミノ酸配列同一性を有するアミノ酸配列を含む。上で定義される任意のCas9タンパク質は、Cas9ポリペプチドとして、キメラCas9ポリペプチド(例えば、Cas9融合タンパク質)の一部として使用することができ、それらのいずれも、本開示のRNPにおいて使用することができる。
ある場合には、適切なCas9タンパク質は、配列番号5に記載されるCas9アミノ酸配列、又は配列番号6~816に記載されるアミノ酸配列のいずれかに対して60%以上、70%以上、75%以上、80%以上、85%以上、90%以上、95%以上、99%以上、又は100%のアミノ酸配列同一性を有するアミノ酸配列を含む。
ある場合には、適切なCas9タンパク質は、配列番号5に記載されるCas9アミノ酸配列、又は配列番号6~816に記載されるアミノ酸配列のいずれかに対して60%以上のアミノ酸配列同一性を有するアミノ酸配列を含む。ある場合には、適切なCas9タンパク質は、配列番号5に記載されるCas9アミノ酸配列、又は配列番号6~816に記載されるアミノ酸配列のいずれかに対して70%以上のアミノ酸配列同一性を有するアミノ酸配列を含む。ある場合には、適切なCas9タンパク質は、配列番号5に記載されるCas9アミノ酸配列、又は配列番号6~816に記載されるアミノ酸配列のいずれかに対して75%以上のアミノ酸配列同一性を有するアミノ酸配列を含む。ある場合には、適切なCas9タンパク質は、配列番号5に記載されるCas9アミノ酸配列、又は配列番号6~816に記載されるアミノ酸配列のいずれかに対して80%以上のアミノ酸配列同一性を有するアミノ酸配列を含む。ある場合には、適切なCas9タンパク質は、配列番号5に記載されるCas9アミノ酸配列、又は配列番号6~816に記載されるアミノ酸配列のいずれかに対して85%以上のアミノ酸配列同一性を有するアミノ酸配列を含む。ある場合には、適切なCas9タンパク質は、配列番号5に記載されるCas9アミノ酸配列、又は配列番号6~816に記載されるアミノ酸配列のいずれかに対して90%以上のアミノ酸配列同一性を有するアミノ酸配列を含む。ある場合には、適切なCas9タンパク質は、配列番号5に記載されるCas9アミノ酸配列、又は配列番号6~816に記載されるアミノ酸配列のいずれかに対して95%以上のアミノ酸配列同一性を有するアミノ酸配列を含む。ある場合には、適切なCas9タンパク質は、配列番号5に記載されるCas9アミノ酸配列、又は配列番号6~816に記載されるアミノ酸配列のいずれかに対して99以上のアミノ酸配列同一性を有するアミノ酸配列を含む。ある場合には、適切なCas9タンパク質は、配列番号5に記載されるCas9アミノ酸配列、又は配列番号6~816に記載されるアミノ酸配列のいずれかに対して100%のアミノ酸配列同一性を有するアミノ酸配列を含む。上で定義される任意のCas9タンパク質は、Cas9ポリペプチドとして、キメラCas9ポリペプチド(例えば、Cas9融合タンパク質)の一部として使用することができ、それらのいずれも、本開示のRNPにおいて使用することができる。
ある場合には、Cas9タンパク質は、4つのモチーフ(表1に列挙される)を含み、少なくとも1つ(又は各々)は、表1に列挙される4つのモチーフの各々(配列番号1~4)、又は配列番号6~816に記載されるアミノ酸配列のいずれかに対応する部分に対して75%以上、80%以上、85%以上、90%以上、95%以上、99%以上、又は100%のアミノ酸配列同一性を有するアミノ酸配列を有する。
ある場合には、Cas9タンパク質は、高性能Cas9タンパク質である(例えば、Kleinstiver et al.,Nature.2016 Jan 28;529(7587):490-5を参照されたい)。
ある場合には、適切なCas9タンパク質は、Slaymaker et al.(2016)Science 351:84に記載されるCas9タンパク質である。例えば、適切なCas9タンパク質は、K810、K848、K855、K1003、及びR1060の1つ以上の置換を有するストレプトコッカス・ピオゲネスCas9を含む(アミノ酸ナンバリングは、配列番号5に記載されたナンバリングに基づいている)。例えば、適切なCas9タンパク質は、K810A、K1003A、及びR1060A置換を有するストレプトコッカス・ピオゲネスCas9を含む(アミノ酸ナンバリングは、配列番号5に記載されたナンバリングに基づいている)。別の例として、適切なCas9タンパク質は、K848A、K1003A、及びR1060A置換を有するストレプトコッカス・ピオゲネスCas9を含む(アミノ酸ナンバリングは、配列番号5に記載されたナンバリングに基づいている)。別の例として、適切なCas9タンパク質は、K855A置換を有するストレプトコッカス・ピオゲネスCas9を含む(アミノ酸ナンバリングは、配列番号5に記載されたナンバリングに基づいている)。
V型及びVI型のCRISPR/Casエンドヌクレアーゼ
ある場合には、主題の方法、組成物、及び/又はキットは、V型又はVI型のCRISPR/Casエンドヌクレアーゼ(例えば、Cpf1、C2c1、C2c2、C2c3)を含む。V型及びVI型のCRISPR/Casエンドヌクレアーゼは、クラス2 CRISPR/Casエンドヌクレアーゼの一種である。V型のCRISPR/Casエンドヌクレアーゼの例としては、Cpf1、C2c1、及びC2c3が挙げられるが、これらに限定されない。VI型のCRISPR/Casエンドヌクレアーゼの一例は、C2c2である。ある場合には、主題の方法、組成物、及び/又はキットは、V型のCRISPR/Casエンドヌクレアーゼ(例えば、Cpf1、C2c1、C2c3)を含む。ある場合には、V型のCRISPR/Casエンドヌクレアーゼは、Cpf1タンパク質である。ある場合には、主題の方法、組成物、及び/又はキットは、VI型のCRISPR/Casエンドヌクレアーゼ(例えば、C2c2)を含む。
II型のCRISPR/Casエンドヌクレアーゼと同様、V型及びVI型のCRISPR/Casエンドヌクレアーゼは、対応するガイドRNAと複合体を形成する。ガイドRNAは、標的核酸(本明細書の他の箇所に記載される)の配列(標的部位)に相補的であるヌクレオチド配列(ガイド配列)を有することで、エンドヌクレアーゼガイドRNA RNP複合体に対する標的特異性をもたらす。複合体のエンドヌクレアーゼは、部位特異的活性をもたらす。言い換えれば、エンドヌクレアーゼは、それ自体がガイドRNAのタンパク質結合セグメントと会合することによって、標的核酸配列(例えば、ゲノムDNA)内で標的部位にガイドされる(例えば、標的部位で安定化される)。
V型及びVI型のCRISPR/Casタンパク質(例えば、cpf1、C2c1、C2c2、及びC2c3ガイドRNA)に関する例及び手引きは、当該技術分野で見出すことができ、例えば、Zetsche et al,Cell.2015 Oct 22;163(3):759-71;Makarova et al,Nat Rev Microbiol.2015 Nov;13(11):722-36;及びShmakov et al.,Mol Cell.2015 Nov 5;60(3):385-97を参照されたい。
ある場合には、V型又はVI型のCRISPR/Casエンドヌクレアーゼ(例えば、Cpf1、C2c1、C2c2、C2c3)は、酵素的に活性であり、例えば、V型又はVI型のCRISPR/Casポリペプチドは、ガイドRNAに結合する際に、標的核酸を切断する。ある場合には、V型又はVI型のCRISPR/Casエンドヌクレアーゼ(例えば、Cpf1、C2c1、C2c2、C2c3)は、対応する野生型のV型又はVI型のCRISPR/Casエンドヌクレアーゼ(例えば、Cpf1、C2c1、C2c2、C2c3)に対して酵素活性の低下を示し、DNA結合活性を保持する(例えば、ある場合には、エンドヌクレアーゼは、ニッカーゼである)。
ある場合には、V型のCRISPR/Casエンドヌクレアーゼは、Cpf1タンパク質である。ある場合には、Cpf1タンパク質は、配列番号1088~1092のいずれかに記載されるCpf1アミノ酸配列に対して少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも90%、又は100%のアミノ酸配列同一性を有するアミノ酸配列を含む。ある場合には、Cpf1タンパク質は、配列番号1088~1092のいずれかに記載されるCpf1アミノ酸配列の100アミノ酸~200アミノ酸(aa)、200aa~400aa、400aa~600aa、600aa~800aa、800aa~1000aa、1000aa~1100aa、1100aa~1200aa、又は1200aa~1300aaの連続したストレッチに対して少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも90%、又は100%のアミノ酸配列同一性を有するアミノ酸配列を含む。
ある場合には、Cpf1タンパク質は、配列番号1088~1092のいずれかに記載されるCpf1アミノ酸配列のRuvCIドメインに対して少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも90%、又は100%のアミノ酸配列同一性を有するアミノ酸配列を含む。ある場合には、Cpf1タンパク質は、配列番号1088~1092のいずれかに記載されるCpf1アミノ酸配列のRuvCIIドメインに対して少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも90%、又は100%のアミノ酸配列同一性を有するアミノ酸配列を含む。ある場合には、Cpf1タンパク質は、配列番号1088~1092のいずれかに記載されるCpf1アミノ酸配列のRuvCIIIドメインに対して少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも90%、又は100%のアミノ酸配列同一性を有するアミノ酸配列を含む。ある場合には、Cpf1タンパク質は、配列番号1088~1092のいずれかに記載されるCpf1アミノ酸配列のRuvCI、RuvCII、及びRuvCIIIドメインに対して少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも90%、又は100%のアミノ酸配列同一性を有するアミノ酸配列を含む。
ある場合には、Cpf1タンパク質は、野生型Cpf1タンパク質に対して(例えば、配列番号1088~1092のいずれかに記載されるアミノ酸配列を含むCpf1タンパク質に対して)酵素活性の減少を示し、DNA結合活性を保持する。ある場合には、Cpf1タンパク質は、配列番号1088~1092のいずれかに記載されるCpf1アミノ酸配列に対して少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも90%、又は100%のアミノ酸配列同一性を有するアミノ酸配列を含み、配列番号1088に記載されるCpf1アミノ酸配列のアミノ酸917に対応するアミノ酸残基でアミノ酸置換(例えば、D→A置換)を含む。ある場合には、Cpf1タンパク質は、配列番号1088~1092のいずれかに記載されるCpf1アミノ酸配列に対して少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも90%、又は100%のアミノ酸配列同一性を有するアミノ酸配列を含み、配列番号1088に記載されるCpf1アミノ酸配列のアミノ酸1006に対応するアミノ酸残基でアミノ酸置換(例えば、E→A置換)を含む。ある場合には、Cpf1タンパク質は、配列番号1088~1092のいずれかに記載されるCpf1アミノ酸配列に対して少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも90%、又は100%のアミノ酸配列同一性を有するアミノ酸配列を含み、配列番号1088に記載されるCpf1アミノ酸配列のアミノ酸1255に対応するアミノ酸残基でアミノ酸置換(例えば、D→A置換)を含む。
ある場合には、適切なCpf1タンパク質は、配列番号1088~1092のいずれかに記載されるCpf1アミノ酸配列に対して少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも90%、又は100%のアミノ酸配列同一性を有するアミノ酸配列を含む。
ある場合には、V型のCRISPR/Casエンドヌクレアーゼは、C2c1タンパク質である(例としては、配列番号1112~1119に記載されるものが挙げられる)。ある場合には、C2c1タンパク質は、配列番号1112~1119のいずれかに記載されるC2c1アミノ酸配列に対して少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも90%、又は100%のアミノ酸配列同一性を有するアミノ酸配列を含む。ある場合には、C2c1タンパク質は、配列番号1112~1119のいずれかに記載されるC2c1アミノ酸配列の100アミノ酸~200アミノ酸(aa)、200aa~400aa、400aa~600aa、600aa~800aa、800aa~1000aa、1000aa~1100aa、1100aa~1200aa、又は1200aa~1300aaの連続したストレッチに対して少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも90%、又は100%のアミノ酸配列同一性を有するアミノ酸配列を含む。
ある場合には、C2c1タンパク質は、配列番号1112~1119のいずれかに記載されるC2c1アミノ酸配列のRuvCIドメインに対して少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも90%、又は100%のアミノ酸配列同一性を有するアミノ酸配列を含む。ある場合には、C2c1タンパク質は、配列番号1112~1119のいずれかに記載されるC2c1アミノ酸配列のRuvCIIドメインに対して少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも90%、又は100%のアミノ酸配列同一性を有するアミノ酸配列を含む。ある場合には、C2c1タンパク質は、配列番号1112~1119のいずれかに記載されるC2c1アミノ酸配列のRuvCIIIドメインに対して少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも90%、又は100%のアミノ酸配列同一性を有するアミノ酸配列を含む。ある場合には、C2c1タンパク質は、配列番号1112~1119のいずれかに記載されるC2c1アミノ酸配列のRuvCI、RuvCII、及びRuvCIIIドメインに対して少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも90%、又は100%のアミノ酸配列同一性を有するアミノ酸配列を含む。
ある場合には、C2c1タンパク質は、野生型C2c1タンパク質に対して(例えば、配列番号1112~1119のいずれかに記載されるアミノ酸配列を含むC2c1タンパク質に対して)酵素活性の減少を示し、DNA結合活性を保持する。ある場合には、適切なC2c1タンパク質は、配列番号1112~1119のいずれかに記載されるC2c1アミノ酸配列に対して少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも90%、又は100%のアミノ酸配列同一性を有するアミノ酸配列を含む。
ある場合には、V型のCRISPR/Casエンドヌクレアーゼは、C2c3タンパク質である(例としては、配列番号1120~1123に記載されるものが挙げられる)。ある場合には、C2c3タンパク質は、配列番号1120~1123のいずれかに記載されるC2c3アミノ酸配列に対して少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも90%、又は100%のアミノ酸配列同一性を有するアミノ酸配列を含む。ある場合には、C2c3タンパク質は、配列番号1120~1123のいずれかに記載されるC2c3アミノ酸配列の100アミノ酸~200アミノ酸(aa)、200aa~400aa、400aa~600aa、600aa~800aa、800aa~1000aa、1000aa~1100aa、1100aa~1200aa、又は1200aa~1300aaの連続したストレッチに対して少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも90%、又は100%のアミノ酸配列同一性を有するアミノ酸配列を含む。
ある場合には、C2c3タンパク質は、配列番号1120~1123のいずれかに記載されるC2c3アミノ酸配列のRuvCIドメインに対して少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも90%、又は100%のアミノ酸配列同一性を有するアミノ酸配列を含む。ある場合には、C2c3タンパク質は、配列番号1120~1123のいずれかに記載されるC2c3アミノ酸配列のRuvCIIドメインに対して少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも90%、又は100%のアミノ酸配列同一性を有するアミノ酸配列を含む。ある場合には、C2c3タンパク質は、配列番号1120~1123のいずれかに記載されるC2c3アミノ酸配列のRuvCIIIドメインに対して少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも90%、又は100%のアミノ酸配列同一性を有するアミノ酸配列を含む。ある場合には、C2c3タンパク質は、配列番号1120~1123のいずれかに記載されるC2c3アミノ酸配列のRuvCI、RuvCII、及びRuvCIIIドメインに対して少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも90%、又は100%のアミノ酸配列同一性を有するアミノ酸配列を含む。
ある場合には、C2c3タンパク質は、野生型C2c3タンパク質に対して(例えば、配列番号1120~1123のいずれかに記載されるアミノ酸配列を含むC2c3タンパク質に対して)酵素活性の減少を示し、DNA結合活性を保持する。ある場合には、適切なC2c3タンパク質は、配列番号1120~1123のいずれかに記載されるC2c3アミノ酸配列に対して少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも90%、又は100%のアミノ酸配列同一性を有するアミノ酸配列を含む。
ある場合には、VI型のCRISPR/Casエンドヌクレアーゼは、C2c2タンパク質である(例としては、配列番号1124~1135に記載されるものが挙げられる)。ある場合には、C2c2タンパク質は、配列番号1124~1135のいずれかに記載されるC2c2アミノ酸配列に対して少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも90%、又は100%のアミノ酸配列同一性を有するアミノ酸配列を含む。ある場合には、C2c2タンパク質は、配列番号1124~1135のいずれかに記載されるC2c2アミノ酸配列の100アミノ酸~200アミノ酸(aa)、200aa~400aa、400aa~600aa、600aa~800aa、800aa~1000aa、1000aa~1100aa、1100aa~1200aa、又は1200aa~1300aaの連続したストレッチに対して少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも90%、又は100%のアミノ酸配列同一性を有するアミノ酸配列を含む。
ある場合には、C2c2タンパク質は、配列番号1124~1135のいずれかに記載されるC2c2アミノ酸配列のRuvCIドメインに対して少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも90%、又は100%のアミノ酸配列同一性を有するアミノ酸配列を含む。ある場合には、C2c2タンパク質は、配列番号1124~1135のいずれかに記載されるC2c2アミノ酸配列のRuvCIIドメインに対して少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも90%、又は100%のアミノ酸配列同一性を有するアミノ酸配列を含む。ある場合には、C2c2タンパク質は、配列番号1124~1135のいずれかに記載されるC2c2アミノ酸配列のRuvCIIIドメインに対して少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも90%、又は100%のアミノ酸配列同一性を有するアミノ酸配列を含む。ある場合には、C2c2タンパク質は、配列番号1124~1135のいずれかに記載されるC2c2アミノ酸配列のRuvCI、RuvCII、及びRuvCIIIドメインに対して少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも90%、又は100%のアミノ酸配列同一性を有するアミノ酸配列を含む。
ある場合には、C2c2タンパク質は、野生型C2c2タンパク質に対して(例えば、配列番号1124~1135のいずれかに記載されるアミノ酸配列を含むC2c2タンパク質に対して)酵素活性の減少を示し、DNA結合活性を保持する。ある場合には、適切なC2c2タンパク質は、配列番号1124~1135のいずれかに記載されるC2c2アミノ酸配列に対して少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも90%、又は100%のアミノ酸配列同一性を有するアミノ酸配列を含む。
PAM配列
野生型クラス2 CRISPR/Casエンドヌクレアーゼ(例えば、Cas9タンパク質)は、通常、CRISPR/CasガイドRNAのガイド配列と標的核酸との間の相補性によって定義される標的部位で標的核酸(例えば、二本鎖DNA(dsDNA))を切断するヌクレアーゼ活性を有する。ある場合には、標的核酸の部位特異的切断は、(i)CRISPR/CasガイドRNA及び標的核酸間の塩基対形成相補性、並びに(ii)標的核酸におけるショートモチーフ(プロトスペーサー隣接モチーフ(PAM)と称される)の両方によって決定される位置で起こる。例えば、クラス2 CRISPR/Casエンドヌクレアーゼが野生型Cas9タンパク質である場合、Cas9タンパク質によって認識される(例えば、結合される)PAM配列は、標的DNAの非相補鎖(Cas9ガイドRNAのガイド配列とハイブリダイズしない鎖)上に存在し、標的部位に隣接している。
ある場合には、(例えば、クラス2 CRISPR/Casエンドヌクレアーゼが、S.ピオゲネス由来のCas9タンパク質である、いくつかの場合には)、非相補鎖のPAM配列は、5’-XGG-3’であり、ここで、Xは、任意のDNAヌクレオチドであり、Xは、標的DNAの非相補鎖の標的配列のすぐ3’側である。従って、PAM配列とハイブリダイズする相補鎖の配列は、5’-CCY-3’であり、ここで、Yは、任意のDNAヌクレオチドであり、Yは、標的DNAの相補鎖の標的配列のすぐ5’側である。いくつかのそのような実施形態では、X及びYは、相補的であり得、X-Y塩基対は、任意の塩基対でもあり得る(例えば、X=C及びY=G、X=G及びY=C、X=A及びY=T、ならびにX=T及びY=A)。
ある場合には、異なるクラス2 CRISPR/Casエンドヌクレアーゼ(例えば、種々の種に由来するCas9タンパク質、V型又はVI型のCRISPR/Casエンドヌクレアーゼなど)は、異なるエンドヌクレアーゼの種々の特徴(例えば、酵素的特徴)を十分に利用するために、主題の方法において使用するのに有利であり得る(例えば、異なるPAM配列優先度のため、酵素活性の増加又は減少のため、細胞毒性レベルの増加又は減少のため、NHEJ、相同組換え回復、一本鎖切断、二本鎖切断などの間のバランスを変化させるため)。
種々の種に由来するクラス2 CRISPR/Casエンドヌクレアーゼ(例えば、Cas9タンパク質)は、標的DNAにおいて異なるPAM配列を必要とし得、異なる種類のクラス2 CRISPR/Casエンドヌクレアーゼ(例えば、II型タンパク質、例えば、Cas9タンパク質、V型タンパク質、VI型タンパク質など)は、標的DNAの標的配列に対するPAM配列の位置に対して異なる要求(例えば、5’、3’、相補鎖、非相補鎖、標的配列からの距離など)を有し得る。従って、特定の最適なクラス2 CRISPR/Casエンドヌクレアーゼにおいて、PAM配列の要求は、S.ピオゲネス由来のCas9タンパク質に対して上に記載した5’-XGG-3’配列とは異なり得る。
いくつかの実施形態では(例えば、Cas9タンパク質がS.ピオゲネス由来である場合、又は密接に関連したCas9を使用する場合、例えば、Chylinski et al.,RNA Biol.2013 May;10(5):726-37;及びJinek et al.,Science.2012 Aug 17;337(6096):816-21を参照されたい。それらの両方は、それらの全体が参照により本明細書に組み込まれる)、PAM配列は、5’-NGG-3’であり得、ここで、Nは、任意のヌクレオチドである。いくつかの実施形態では(例えば、Cas9タンパク質が髄膜炎菌のCas9タンパク質由来である場合、又は密接に関連したCas9を使用する場合)、PAM配列は、5’-NNNNGANN-3’、5’-NNNNGTTN-3’、5’-NNNNGNNT-3’、5’-NNNNGTNN-3’、5’-NNNNGNTN-3’、又は5’-NNNNGATT-3’であり得、ここで、Nは、任意のヌクレオチドである。いくつかの実施形態では(例えば、Cas9タンパク質がストレプトコッカス‐サーモフィルス#1由来である場合、又は密接に関連したCas9を使用する場合)、PAM配列は、5’-NNAGAA-3’、5’-NNAGGA-3’、5’-NNGGAA-3’、5’-NNANAA-3’、又は5’-NNGGGA-3’であり得、ここで、Nは、任意のヌクレオチドである。いくつかの実施形態では(例えば、Cas9タンパク質がトレポネーマデンティコラ(TD)由来である場合、又は密接に関連したCas9を使用する場合)、PAM配列は、5’-NAAAAN-3’、5’-NAAAAC-3’、5’-NAAANC-3’、5’-NANAAC-3’、又は5’-NNAAAC-3’であり得、ここで、Nは、任意のヌクレオチドである。
任意の所与のクラス2 CRISPR/CasエンドヌクレアーゼのPAM要求は、標準方法、常法、従来の方法を用いて決定することができ、これには、実験的方法、及び/又は目的の種由来の天然に存在する配列のインシリコ解析を含むことができる。例えば、当業者によって知られているであろうように、他のクラス2 CRISPR/Casエンドヌクレアーゼ(例えば、異なる種のCas9タンパク質、IV型のCRISPR/Casエンドヌクレアーゼ、V型のCRISPR/Casエンドヌクレアーゼなど)のさらなるPAM配列を、生物情報解析(例えば、ゲノムシーケンシングデータの解析)を用いて容易に決定することができる。例えば、さらなる情報については、Mojica et al.,Microbiology.2009 Mar、155(Pt 3):733-40、及びEsvelt et al.,Nat Methods.2013 Nov、10(11):1116-21を参照されたい。
さらに、当該技術分野で周知のように、クラス2 CRISPR/Casエンドヌクレアーゼ(例えば、Cas9タンパク質)のPAM相互作用ドメインは、第1の種由来のエンドヌクレアーゼ(例えば、Cas9タンパク質)から誘導することができ、PAM配列は、そのドメインに対応することができる。従って、ある場合には、クラス2 CRISPR/Casエンドヌクレアーゼは、第1の種のクラス2 CRISPR/Casエンドヌクレアーゼ(例えば、Cas9タンパク質)から誘導される(例えば、由来である)PAM相互作用ドメインを有し、及びクラス2 CRISPR/Casエンドヌクレアーゼ(例えば、Cas9タンパク質)の他の部分は、第2の種から誘導され得る(例えば、由来であり得る)。
(CRISPR/Casエンドヌクレアーゼの)ガイドRNA
クラス2 CRISPR/Casエンドヌクレアーゼ(例えば、Cas9タンパク質、V型又はVI型のCRISPR/Casタンパク質、Cpf1タンパク質など)に結合し、複合体を標的核酸内の特定の位置に標的化する核酸分子は、「ガイドRNA」又は「CRISPR/Casガイド核酸」又は「CRISPR/CasガイドRNA」と本明細書で呼ばれる。
ガイドRNAは、標的核酸の配列に相補的であるヌクレオチド配列であるガイド配列(ターゲティング配列とも本明細書で呼ばれる)を含むターゲティングセグメントを含むことによって、複合体(RNP複合体)に標的特異性をもたらす。
ガイドRNAは、それが対応するタンパク質によって参照することができる。例えば、クラス2 CRISPR/CasエンドヌクレアーゼがCas9タンパク質である場合、対応するガイドRNAは、「Cas9ガイドRNA」と呼ぶことができる。同様に、別の例として、クラス2 CRISPR/CasエンドヌクレアーゼがCpf1タンパク質である場合、対応するガイドRNAは、「Cpf1ガイドRNA」と呼ぶことができる。
いくつかの実施形態では、ガイドRNAは、2つの別々の核酸分子、すなわち「アクチベーター」及び「ターゲッター」を含み、「二重ガイドRNA」、「二重分子型ガイドRNA」、「二分子型ガイドRNA」、又は「dgRNA」と本明細書で呼ばれる。いくつかの実施形態では、ガイドRNAは、一分子(例えば、いくつかのクラス2 CRISPR/Casタンパク質では、対応するガイドRNAは、単一分子であり、ある場合には、アクチベーター及びターゲッターは、例えば、介在ヌクレオチドを介して、互いに共有結合的に連結されている)であり、及びガイドRNAは、「単一ガイドRNA」、「単一分子型ガイドRNA」、「一分子型ガイドRNA」、又は単に「sgRNA」と称される。
いくつかの実施形態では、主題のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)は、表2(図23に提供される)に示す標的配列を標的にする(例えば、以下の例の表3も参照されたい)。いくつかの実施形態では、主題のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)は、表9(図24に提供される)に示す標的配列を標的にする。
表2(図23)。(i)標的DNAの標的配列(非相補鎖)、及び(ii)CRISPR/CasガイドRNA(例えば、非相補鎖においてNGGのPAM要求を有するS.ピオゲネス由来のCas9などのCRISPR/Casタンパク質)のガイド配列の例、ここで、第1の標的配列は、ヒトジストロフィン遺伝子のイントロン44内であり、第2の標的配列は、ヒトジストロフィン遺伝子のイントロン55内である。ヒトジストロフィン遺伝子のイントロン44内の標的配列に標的化されるガイド配列は、「44」シリーズガイド配列と称され、ヒトジストロフィン遺伝子のイントロン55内の標的配列に標的化されるガイド配列は、「55」シリーズガイド配列と称される。
例えば、ある場合には、第1のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)により標的とされる標的配列の非相補鎖は、配列番号1140~1144から選択される配列を含む(その配列は、20ヌクレオチド長であり、ヒトジストロフィン遺伝子のイントロン44内である)。ある場合には、第1のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)により標的とされる標的配列の非相補鎖は、配列番号1145~1149から選択される配列を含む(その配列は、17ヌクレオチド長であり、ヒトジストロフィン遺伝子のイントロン44内である)。ある場合には、第1のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)は、配列番号1150~1154から選択される配列を含むガイド配列を含む(その配列は、20ヌクレオチド長であり、ヒトジストロフィン遺伝子のイントロン44内の標的配列にハイブリダイズする)。ある場合には、第1のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)は、配列番号1155~1159から選択される配列を含むガイド配列を含む(その配列は、17ヌクレオチド長であり、ヒトジストロフィン遺伝子のイントロン44内の標的配列にハイブリダイズする)。ある場合には、第1のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)により標的とされる標的配列の非相補鎖は、配列番号1136~1139及び配列番号1180~1222から選択される配列を含む(その配列は、ヒトジストロフィン遺伝子のイントロン44内である)。ある場合には、第1のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)は、配列番号1223~1269から選択される配列を含むガイド配列を含む(その配列は、ヒトジストロフィン遺伝子のイントロン44内の標的配列にハイブリダイズする)。
いくつかの実施形態では、第2のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)により標的とされる標的配列の非相補鎖は、配列番号1160~1164から選択される配列を含む(その配列は、20ヌクレオチド長であり、ヒトジストロフィン遺伝子のイントロン55内である)。ある場合には、第2のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)により標的とされる標的配列の非相補鎖は、配列番号1165~1169から選択される配列を含む(その配列は、17ヌクレオチド長であり、ヒトジストロフィン遺伝子のイントロン55内である)。ある場合には、第2のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)は、配列番号1170~1174から選択される配列を含むガイド配列を含む(その配列は、20ヌクレオチド長であり、ヒトジストロフィン遺伝子のイントロン55内の標的配列にハイブリダイズする)。ある場合には、第2のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)は、配列番号1175~1179から選択される配列を含むガイド配列を含む(その配列は、17ヌクレオチド長であり、ヒトジストロフィン遺伝子のイントロン55内の標的配列にハイブリダイズする)。ある場合には、第2のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)により標的とされる標的配列の非相補鎖は、配列番号1270~1317から選択される配列を含む(その配列は、ヒトジストロフィン遺伝子のイントロン55内である)。ある場合には、第2のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)は、配列番号1318~1365から選択される配列を含むガイド配列を含む(その配列は、ヒトジストロフィン遺伝子のイントロン55内の標的配列にハイブリダイズする)。
ある場合には、第1のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)により標的とされる標的配列の非相補鎖は、配列番号1140~1144から選択される配列を含み(その配列は、20ヌクレオチド長であり、ヒトジストロフィン遺伝子のイントロン44内である)、第2のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)により標的とされる標的配列の非相補鎖は、配列番号1160~1164から選択される配列を含む(その配列は、20ヌクレオチド長であり、ヒトジストロフィン遺伝子のイントロン55内である)。
ある場合には、第1のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)により標的とされる標的配列の非相補鎖は、配列番号1136~1139及び配列番号1180~1222から選択される配列を含み(その配列は、ヒトジストロフィン遺伝子のイントロン44内である)、第2のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)により標的とされる標的配列の非相補鎖は、配列番号1270~1317から選択される配列を含む(その配列は、20ヌクレオチド長であり、ヒトジストロフィン遺伝子のイントロン55内である)。
ある場合には、第1のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)により標的とされる標的配列の非相補鎖は、配列番号1145~1149から選択される配列を含み(その配列は、17ヌクレオチド長であり、ヒトジストロフィン遺伝子のイントロン44内である)、第2のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)により標的とされる標的配列の非相補鎖は、配列番号1165~1169から選択される配列を含む(その配列は、17ヌクレオチド長であり、ヒトジストロフィン遺伝子のイントロン55内である)。
ある場合には、第1のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)は、配列番号1150~1154から選択される配列を含むガイド配列を含み(その配列は、20ヌクレオチド長であり、ヒトジストロフィン遺伝子のイントロン44内の標的配列にハイブリダイズする)、第2のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)は、配列番号1170~1174から選択される配列を含むガイド配列を含む(その配列は、20ヌクレオチド長であり、ヒトジストロフィン遺伝子のイントロン55内の標的配列にハイブリダイズする)。
ある場合には、第1のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)は、配列番号1150~1154から選択される配列を含むガイド配列を含み(その配列は、20ヌクレオチド長であり、ヒトジストロフィン遺伝子のイントロン44内の標的配列にハイブリダイズする)、第2のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)は、配列番号1170~1174から選択される配列を含むガイド配列を含む(その配列は、20ヌクレオチド長であり、ヒトジストロフィン遺伝子のイントロン55内の標的配列にハイブリダイズする)。
ある場合には、第1のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)は、配列番号1223~1269から選択される配列を含むガイド配列を含み(その配列は、ヒトジストロフィン遺伝子のイントロン44内の標的配列にハイブリダイズする)、第2のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)は、配列番号1318~1365から選択される配列を含むガイド配列を含む(その配列は、ヒトジストロフィン遺伝子のイントロン55内の標的配列にハイブリダイズする)。ある場合には、本明細書での使用に適したガイドRNAの二本鎖形成部分は、配列:gttttagagctaGAAAtagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcTTTTTT(配列番号1366)、又はguuuuagagcuaGAAAuagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcUUUUUU(配列番号1367)を含む。
ある場合には、第1のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)は、配列番号1223に記載されるヌクレオチド配列を含むガイド配列を含み、第2のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)は、配列番号1320に記載されるヌクレオチド配列を含むガイド配列を含む。ある場合には、本明細書での使用に適したガイドRNAの二本鎖形成部分は、配列:gttttagagctaGAAAtagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcTTTTTT(配列番号1366)、又はguuuuagagcuaGAAAuagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcUUUUUU(配列番号1367)を含む。
ある場合には、第1のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)は、配列番号1224に記載されるヌクレオチド配列を含むガイド配列を含み、第2のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)は、配列番号1320に記載されるヌクレオチド配列を含むガイド配列を含む。ある場合には、本明細書での使用に適したガイドRNAの二本鎖形成部分は、配列:gttttagagctaGAAAtagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcTTTTTT(配列番号1366)、又はguuuuagagcuaGAAAuagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcUUUUUU(配列番号1367)を含む。
ある場合には、第1のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)は、配列番号1225に記載されるヌクレオチド配列を含むガイド配列を含み、第2のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)は、配列番号1320に記載されるヌクレオチド配列を含むガイド配列を含む。ある場合には、本明細書での使用に適したガイドRNAの二本鎖形成部分は、配列:gttttagagctaGAAAtagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcTTTTTT(配列番号1366)、又はguuuuagagcuaGAAAuagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcUUUUUU(配列番号1367)を含む。
ある場合には、第1のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)は、配列番号1153に記載されるヌクレオチド配列を含むガイド配列を含み、第2のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)は、配列番号1172に記載されるヌクレオチド配列を含むガイド配列を含む。ある場合には、本明細書での使用に適したガイドRNAの二本鎖形成部分は、配列:gttttagagctaGAAAtagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcTTTTTT(配列番号1366)、又はguuuuagagcuaGAAAuagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcUUUUUU(配列番号1367)を含む。
ある場合には、第1のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)は、配列番号1153に記載されるヌクレオチド配列を含むガイド配列を含み、第2のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)は、配列番号1171に記載されるヌクレオチド配列を含むガイド配列を含む。ある場合には、本明細書での使用に適したガイドRNAの二本鎖形成部分は、配列:gttttagagctaGAAAtagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcTTTTTT(配列番号1366)、又はguuuuagagcuaGAAAuagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcUUUUUU(配列番号1367)を含む。
ある場合には、第1のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)は、配列番号1152に記載されるヌクレオチド配列を含むガイド配列を含み、第2のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)は、配列番号1172に記載されるヌクレオチド配列を含むガイド配列を含む。ある場合には、本明細書での使用に適したガイドRNAの二本鎖形成部分は、配列:gttttagagctaGAAAtagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcTTTTTT(配列番号1366)、又はguuuuagagcuaGAAAuagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcUUUUUU(配列番号1367)を含む。
ある場合には、第1のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)は、配列番号1152に記載されるヌクレオチド配列を含むガイド配列を含み、第2のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)は、配列番号1171に記載されるヌクレオチド配列を含むガイド配列を含む。ある場合には、本明細書での使用に適したガイドRNAの二本鎖形成部分は、配列:gttttagagctaGAAAtagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcTTTTTT(配列番号1366)、又はguuuuagagcuaGAAAuagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcUUUUUU(配列番号1367)を含む。
ある場合には、第1のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)は、配列番号1150に記載されるヌクレオチド配列を含むガイド配列を含み、第2のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)は、配列番号1172に記載されるヌクレオチド配列を含むガイド配列を含む。ある場合には、本明細書での使用に適したガイドRNAの二本鎖形成部分は、配列:gttttagagctaGAAAtagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcTTTTTT(配列番号1366)、又はguuuuagagcuaGAAAuagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcUUUUUU(配列番号1367)を含む。
ある場合には、第1のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)は、配列番号1150に記載されるヌクレオチド配列を含むガイド配列を含み、第2のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)は、配列番号1171に記載されるヌクレオチド配列を含むガイド配列を含む。ある場合には、本明細書での使用に適したガイドRNAの二本鎖形成部分は、配列:gttttagagctaGAAAtagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcTTTTTT(配列番号1366)、又はguuuuagagcuaGAAAuagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcUUUUUU(配列番号1367)を含む。
ある場合には、第1のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)は、配列番号1150に記載されるヌクレオチド配列を含むガイド配列を含み、第2のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)は、配列番号1174に記載されるヌクレオチド配列を含むガイド配列を含む。ある場合には、本明細書での使用に適したガイドRNAの二本鎖形成部分は、配列:gttttagagctaGAAAtagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcTTTTTT(配列番号1366)、又はguuuuagagcuaGAAAuagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcUUUUUU(配列番号1367)を含む。
ある場合には、第1のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)は、配列番号1152に記載されるヌクレオチド配列を含むガイド配列を含み、第2のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)は、配列番号1174に記載されるヌクレオチド配列を含むガイド配列を含む。ある場合には、本明細書での使用に適したガイドRNAの二本鎖形成部分は、配列:gttttagagctaGAAAtagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcTTTTTT(配列番号1366)、又はguuuuagagcuaGAAAuagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcUUUUUU(配列番号1367)を含む。
ある場合には、第1のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)は、配列番号1155~1159から選択される配列を含むガイド配列を含み(その配列は、17ヌクレオチド長であり、ヒトジストロフィン遺伝子のイントロン44内の標的配列にハイブリダイズする)、第2のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)は、配列番号1175~1179から選択される配列を含むガイド配列を含む(その配列は、17ヌクレオチド長であり、ヒトジストロフィン遺伝子のイントロン55内の標的配列にハイブリダイズする)。
ある場合には、第1のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)により標的とされる標的配列の非相補鎖は、配列番号1143(イントロン44内)に記載の配列を含み、及び第2のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)により標的とされる標的配列の非相補鎖は、配列番号1162(イントロン55内)に記載の配列を含む。ある場合には、第1のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)により標的とされる標的配列の非相補鎖は、配列番号1148(イントロン44内)に記載の配列を含み、及び第2のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)により標的とされる標的配列の非相補鎖は、配列番号1167(イントロン55内)に記載の配列を含む。
ある場合には、第1のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)は、配列番号1153に記載の配列を含む(イントロン44を標的にする)ガイド配列を含み、及び第2のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)は、配列番号1172に記載の配列を含む(イントロン55を標的にする)ガイド配列を含む。ある場合には、第1のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)は、配列番号1158に記載の配列を含む(イントロン44を標的にする)ガイド配列を含み、及び第2のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)は、配列番号1177に記載の配列を含む(イントロン55を標的にする)ガイド配列を含む。
Cas9ガイドRNA
Cas9タンパク質に結合し、複合体を標的核酸内の特定の位置で標的とする核酸分子は、「Cas9ガイドRNA」と本明細書で呼ばれる。
Cas9ガイドRNAは、2つのセグメント、すなわち第1のセグメント(「ターゲティングセグメント」と本明細書で呼ばれる)、及び第2のセグメント(「タンパク質結合セグメント」と本明細書で呼ばれる)を含むと言われることができる。「セグメント」は、分子のセグメント/セクション/領域(例えば、核酸分子における連続した一連のヌクレオチド)を意味する。セグメントは、セグメントが2つ以上の分子の領域を含み得るような、複合体の領域/セクションを意味する場合もある。
Cas9ガイドRNAの第1のセグメント(ターゲティングセグメント)は、標的核酸(例えば、標的ゲノムDNA)内の特異的配列(標的部位)に相補的である(従って、それとハイブリダイズする)ヌクレオチド配列(ガイド配列)を含む。タンパク質結合セグメント(又は「タンパク質結合配列」)は、Cas9ポリペプチドと相互作用する(に結合する)。主題のCas9ガイドRNAのタンパク質結合セグメントは、互いにハイブリダイズして二本鎖RNA二本鎖(dsRNA二本鎖)を形成する、2本の相補的な一連のヌクレオチドを含む。標的核酸(例えば、ゲノムDNA)の部位特異的結合、及び/又は切断は、Cas9ガイドRNA(Cas9ガイドRNAのガイド配列)と標的核酸の間の塩基対相補性によって決定される位置(例えば、標的遺伝子座の標的配列、例えば、ヒトジストロフィン遺伝子のイントロン44及び55)で起こり得る。
Cas9ガイドRNA及びCas9タンパク質は、複合体を形成する(例えば、非共有結合性相互作用を介して結合する)。Cas9ガイドRNAは、ガイド配列(標的核酸の配列に相補的であるヌクレオチド配列)を含むターゲティングセグメントを含むことによって、標的特異性を複合体にもたらす。複合体のCas9タンパク質は、部位特異的活性(例えば、切断活性)をもたらす。言い換えれば、Cas9タンパク質は、それ自体がCas9ガイドRNAと会合することによって、標的核酸配列(例えば、ゲノムDNA)にガイドされる。
Cas9ガイドRNAの「ターゲティング配列」とも称される「ガイド配列」は、Cas9ガイドRNAが、プロトスペーサー隣接モチーフ(PAM)配列を考慮に入れることができることを除いて、任意の所望の標的核酸の任意の所望の配列にCas9タンパク質を標的化することができるように修飾することができる。従って、例えば、Cas9ガイドRNAは、真核細胞中の核酸(例えば、ゲノムDNA)における配列と相補性を有する(例えば、それにハイブリダイズすることができる)配列(ガイド配列)を有するターゲティングセグメントを有し得る。
いくつかの実施形態では、Cas9ガイドRNAは、2つの別々の核酸分子、すなわち「アクチベーター」及び「ターゲッター」を含み、「二重Cas9ガイドRNA」、「二重分子型Cas9ガイドRNA」、又は「二分子型Cas9ガイドRNA」、「二重ガイドRNA」、又は「dgRNA」と本明細書で呼ばれる。いくつかの実施形態では、アクチベーター及びターゲッターは、(例えば、介在ヌクレオチドを介して)互いに共有結合的に連結されており、及びガイドRNAは、「単一ガイドRNA」、「Cas9単一ガイドRNA」、「単一分子型Cas9ガイドRNA」又は「一分子型Cas9ガイドRNA」、又は又は単に「sgRNA」と称される。
Cas9ガイドRNAは、crRNA様(「CRISPR RNA」/「ターゲッター」/「crRNA」/「crRNAリピート」)分子と、対応するtracrRNA様(「トランス作動性CRISPR RNA」/「アクチベーター」/「tracrRNA」)分子を含む。crRNA様分子(ターゲッター)は、Cas9ガイドRNAのターゲティングセグメント(一本鎖)と、Cas9ガイドRNAのタンパク質結合セグメントのdsRNA二重鎖の片方を形成する一連のヌクレオチド(「二重鎖形成セグメント」)の両方を含む。対応するtracrRNA様分子(アクチベーター/tracrRNA)は、ガイド核酸のタンパク質結合セグメントのdsRNA二重鎖のもう片方を形成する一連のヌクレオチド(二重鎖形成セグメント)を含む。言い換えれば、crRNA様分子の一連のヌクレオチドは、tracrRNA様分子の一連のヌクレオチドと相補的であり、tracrRNA様分子の一連のヌクレオチドとハイブリダイズして、Cas9ガイドRNAのタンパク質結合ドメインのdsRNA二重鎖を形成する。従って、各ターゲッター分子は、(ターゲッターとハイブリダイズする領域を有する)対応するアクチベーター分子を有するということができる。ターゲッター分子は、ターゲティングセグメントをさらに提供する。従って、ターゲッター及びアクチベーター分子は、(対応する対として)ハイブリダイズして、Cas9ガイドRNAを形成する。所与のcrRNA又はtracrRNA分子の正確な配列は、RNA分子が見られる種に特有のものである。主題の二重Cas9ガイドRNAは、任意の対応するアクチベーターとターゲッター対を含むことができる。
「アクチベーター」又は「アクチベーターRNA」という用語は、Cas9二重ガイドRNA(従って、「アクチベーター」及び「ターゲッター」が、例えば、介在ヌクレオチドによって一緒に連結した場合、Cas9単一ガイドRNA)のtracrRNA様分子(tracrRNA:「トランス作動性CRISPR RNA」)を意味するものとして本明細書で使用する。従って、例えば、Cas9ガイドRNA(dgRNA又はsgRNA)は、アクチベーター配列(例えば、tracrRNA配列)を含む。tracr分子(tracrRNA)は、CRISPR RNA分子(crRNA)とハイブリダイズして、Cas9二重ガイドRNAを形成する天然に存在する分子である。「アクチベーター」という用語は、天然に存在するtracrRNAを包含するが、修飾(例えば、切断、配列変異、塩基修飾、骨格修飾、結合修飾など)を有するtracrRNAも包含するように本明細書で使用され、ここで、アクチベーターは、tracrRNAの少なくとも1つ機能を保持する(例えば、Cas9タンパク質が結合するdsRNA二本鎖に寄与する)。ある場合には、アクチベーターは、Cas9タンパク質と相互作用し得る1つ以上のステムループを与える。アクチベーターは、tracr配列(tracrRNA配列)を有すると称することができ、ある場合には、tracrRNAであるが、「アクチベーター」という用語は、天然に存在するtracrRNAに限定されない。
「ターゲッター」又は「ターゲッターRNA」という用語は、Cas9二重ガイドRNA(従って、「アクチベーター」及び「ターゲッター」が、例えば、介在ヌクレオチドによって一緒に連結した場合、Cas9単一ガイドRNA)のcrRNA様分子(crRNA:「CRISPR RNA」)を称するものとして本明細書で使用する。従って、例えば、Cas9ガイドRNA(dgRNA又はsgRNA)は、(標的核酸とハイブリダイズする(に相補的である)ヌクレオチドを含む)ターゲティングセグメント、及び二本鎖形成セグメント(例えば、crRNAリピートとも称することができるcrRNAの二本鎖形成セグメント)を含む。ターゲッターのターゲティングセグメント(標的核酸の標的配列とハイブリダイズするセグメント)の配列は、所望の標的核酸とハイブリダイズするようにユーザーによって改変されるため、ターゲッターの配列は、自然には発生しない配列であることが多い。しかしながら、アクチベーターの二本鎖形成セグメントとハイブリダイズするターゲッターの二本鎖形成セグメント(以下により詳細に説明される)は、天然に存在する配列を含むことができる(例えば、天然に存在するcrRNAの二本鎖形成セグメントの配列を含むことができ、これは、crRNAリピートとも称することができる)。従って、「ターゲッター」という用語は、ターゲッターの一部(例えば、二本鎖形成セグメント)がcrRNA由来の自然発生の配列を含むことが多いという事実にもかかわらず、自然発生のcrRNAと区別するように本明細書で使用される。しかしながら、「ターゲッター」という用語は、自然発生のcrRNAを包含する。
Cas9ガイドRNAは、3つの部分、すなわち(i)ターゲティング配列(標的核酸の配列とハイブリダイズするヌクレオチド配列)、(ii)アクチベーター配列(上述のように)(ある場合には、tracr配列と称される)、及び(iii)アクチベーター配列の少なくとも一部にハイブリダイズして、二本鎖二重鎖を形成する配列を含むと言うこともできる。ターゲッターは、(i)及び(iii)を有する一方、アクチベーターは、(ii)を有する。
Cas9ガイドRNA(例えば、二重ガイドRNA又は単一ガイドRNA)は、任意の対応するアクチベーター及びターゲッター対からなり得る。ある場合には、二本鎖形成セグメントは、アクチベーターとターゲッターの間で交換することができる。言い換えれば、ある場合には、ターゲッターは、tracrRNAの二本鎖形成セグメント由来のヌクレオチドの配列(その配列は、通常、アクチベーターの一部である)を含む一方、アクチベーターは、crRNAの二本鎖形成セグメント由来のヌクレオチドの配列(その配列は、通常、ターゲッターの一部である)を含む。
上述のように、ターゲッターは、Cas9ガイドRNAのターゲティングセグメント(一本鎖)と、Cas9ガイドRNAのタンパク質結合セグメントのdsRNA二重鎖の片方を形成する一連のヌクレオチド(「二重鎖形成セグメント」)の両方を含む。対応するtracrRNA様分子(アクチベーター)は、Cas9ガイドRNAのタンパク質結合セグメントのdsRNA二重鎖のもう片方を形成する一連のヌクレオチド(二重鎖形成セグメント)を含む。言い換えれば、ターゲッターの一連のヌクレオチドは、アクチベーターの一連のヌクレオチドと相補的であり、アクチベーターの一連のヌクレオチドとハイブリダイズして、Cas9ガイドRNAのタンパク質結合ドメインのdsRNA二重鎖を形成する。従って、各ターゲッターは、(ターゲッターとハイブリダイズする領域を有する)対応するアクチベーターを有するということができる。ターゲッター分子は、ターゲティングセグメントをさらに提供する。従って、ターゲッター及びアクチベーター分子は、(対応する対として)ハイブリダイズして、Cas9ガイドRNAを形成する。所与の天然に存在するcrRNA又はtracrRNA分子の特定の配列は、RNA分子が見られる種に特有のものである。適切なアクチベーター及びターゲッターの例は、当該技術分野において周知である。
Cas9ガイドRNA(例えば、二重ガイドRNA又は単一ガイドRNA)は、任意の対応するアクチベーター及びターゲッター対からなり得る。Cas9ガイドRNA(dgRNA又はsgRNA)に含まれ得るヌクレオチド配列の非限定例としては、配列番号827~1075に記載される配列又はその補体が挙げられる。例えば、ある場合には、(tracrRNA由来である)配列番号827~957由来の配列又はその補体は、(crRNA由来である)配列番号964~1075由来の配列又はその補体と対合し、タンパク質結合セグメントのdsRNA二本鎖を形成することができる。ある場合には、本明細書での使用に適したガイドRNAの二本鎖形成部分は、配列:gttttagagctaGAAAtagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcTTTTTT(配列番号1366)、又はguuuuagagcuaGAAAuagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcUUUUUU(配列番号1367)を含む。
Cas9ガイドRNAのターゲティングセグメント
主題のガイドRNAは、ガイド配列(すなわち、ターゲティング配列)(標的核酸における配列(標的部位)に相補的であるヌクレオチド配列)を含む。言い換えれば、主題のガイド核酸のターゲティングセグメントは、ハイブリダイゼーション(すなわち、塩基対形成)を介した配列特異的な方法で標的核酸(例えば、二本鎖DNA(dsDNA))と相互作用することができる。従って、ターゲティングセグメントのヌクレオチド配列は、(標的に応じて)変化し得、Cas9ガイドRNAと標的核酸が相互作用する標的核酸内の位置を決定することができる。Cas9ガイドRNAのターゲティングセグメントは、標的核酸(例えば、ゲノムDNAなどの真核生物標的核酸)内で任意の所望の配列(標的部位)にハイブリダイズするように改変(例えば、遺伝子工学によって)/設計することができる。
ターゲティングセグメントは、7以上のヌクレオチド(nt)(例えば、8以上、9以上、10以上、12以上、15以上、20以上、25以上、30以上、又は40以上のヌクレオチド)の長さを有し得る。ある場合には、ターゲティングセグメントは、7~100ヌクレオチド(nt)(例えば、7~80nt、7~60nt、7~40nt、7~30nt、7~25nt、7~22nt、7~20nt、7~18nt、8~80nt、8~60nt、8~40nt、8~30nt、8~25nt、8~22nt、8~20nt、8~18nt、10~100nt、10~80nt、10~60nt、10~40nt、10~30nt、10~25nt、10~22nt、10~20nt、10~18nt、12~100nt、12~80nt、12~60nt、12~40nt、12~30nt、12~25nt、12~22nt、12~20nt、12~18nt、14~100nt、14~80nt、14~60nt、14~40nt、14~30nt、14~25nt、14~22nt、14~20nt、14~18nt、16~100nt、16~80nt、16~60nt、16~40nt、16~30nt、16~25nt、16~22nt、16~20nt、16~18nt、18~100nt、18~80nt、18~60nt、18~40nt、18~30nt、18~25nt、18~22nt、又は18~20nt)の長さを有し得る。
標的核酸のヌクレオチド配列(標的部位)に相補的であるターゲティングセグメントのヌクレオチド配列(ターゲティング配列、ガイド配列)は、10nt以上の長さを有し得る。例えば、標的核酸の標的部位に相補的であるターゲティングセグメントのターゲティング配列は、12nt以上、15nt以上、17nt以上、18nt以上、19nt以上、又は20nt以上の長さを有し得る。ある場合には、標的核酸のヌクレオチド配列(標的部位)に相補的であるターゲティングセグメントのヌクレオチド配列(ターゲティング配列)は、12nt以上の長さを有する。ある場合には、標的核酸のヌクレオチド配列(標的部位)に相補的であるターゲティングセグメントのヌクレオチド配列(ターゲティング配列)は、17nt以上の長さを有する。ある場合には、標的核酸のヌクレオチド配列(標的部位)に相補的であるターゲティングセグメントのヌクレオチド配列(ターゲティング配列)は、18nt以上の長さを有する。
例えば、標的核酸の標的配列に相補的であるターゲティングセグメントのターゲティング配列(ガイド配列)は、10~100ヌクレオチド(nt)(例えば、10~90nt、10~75nt、10~60nt、10~50nt、10~35nt、10~30nt、10~25nt、10~22nt、10~20nt、12~100nt、12~90nt、12~75nt、12~60nt、12~50nt、12~35nt、12~30nt、12~25nt、12~22nt、12~20nt、15~100nt、15~90nt、15~75nt、15~60nt、15~50nt、15~35nt、15~30nt、15~25nt、15~22nt、15~20nt、17~100nt、17~90nt、17~75nt、17~60nt、17~50nt、17~35nt、17~30nt、17~25nt、17~22nt、17~20nt、18~100nt、18~90nt、18~75nt、18~60nt、18~50nt、18~35nt、18~30nt、18~25nt、18~22nt、又は18~20nt)の長さを有し得る。ある場合には、標的核酸の標的配列に相補的であるターゲティングセグメントのターゲティング配列は、15nt~30ntの長さを有する。ある場合には、標的核酸の標的配列に相補的であるターゲティングセグメントのターゲティング配列は、15nt~25ntの長さを有する。ある場合には、標的核酸の標的配列に相補的であるターゲティングセグメントのターゲティング配列は、17nt~30ntの長さを有する。ある場合には、標的核酸の標的配列に相補的であるターゲティングセグメントのターゲティング配列は、17nt~25ntの長さを有する。ある場合には、標的核酸の標的配列に相補的であるターゲティングセグメントのターゲティング配列は、17nt~22ntの長さを有する。ある場合には、標的核酸の標的配列に相補的であるターゲティングセグメントのターゲティング配列は、18nt~30ntの長さを有する。ある場合には、標的核酸の標的配列に相補的であるターゲティングセグメントのターゲティング配列は、18nt~25ntの長さを有する。ある場合には、標的核酸の標的配列に相補的であるターゲティングセグメントのターゲティング配列は、18nt~22ntの長さを有する。ある場合には、標的核酸の標的部位に相補的であるターゲティングセグメントのターゲティング配列は、20ヌクレオチドの長さである。ある場合には、標的核酸の標的部位に相補的であるターゲティングセグメントのターゲティング配列は、19ヌクレオチドの長さである。ある場合には、標的核酸の標的部位に相補的であるターゲティングセグメントのターゲティング配列は、18ヌクレオチドの長さである。ある場合には、標的核酸の標的部位に相補的であるターゲティングセグメントのターゲティング配列は、17ヌクレオチドの長さである。
ターゲティングセグメントのターゲティング配列(ガイド配列)と標的核酸の標的部位との間のパーセント相補性は、60%以上(例えば、65%以上、70%以上、75%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、又は100%)であり得る。ある場合には、ターゲティングセグメントのターゲティング配列と標的核酸の標的部位との間のパーセント相補性は、標的核酸の標的部位の7の連続した5’末端のヌクレオチドにわたって100%である。ある場合には、ターゲティングセグメントのターゲティング配列と標的核酸の標的部位との間のパーセント相補性は、約20の連続したヌクレオチドにわたって60%以上である。ある場合には、ターゲティングセグメントのターゲティング配列と標的核酸の標的部位との間のパーセント相補性は、標的核酸の標的部位の14の連続した5’末端のヌクレオチドにわたって100%であり、残りにわたって0%以上と低い。そのような場合、ターゲティング配列は、14ヌクレオチドの長さであると考えられ得る。ある場合には、ターゲティングセグメントのターゲティング配列と標的核酸の標的部位との間のパーセント相補性は、標的核酸の標的部位の7の連続した5’末端のヌクレオチドにわたって100%であり、残りにわたって0%以上と低い。
ある場合には、ターゲティングセグメントのターゲティング配列と標的核酸の標的部位との間のパーセント相補性は、(Cas9ガイドRNAのターゲティング配列の3’末端のヌクレオチドに相補的であり得る)標的核酸の標的部位の7の連続した5’末端のヌクレオチドにわたって100%である。ある場合には、ターゲティングセグメントのターゲティング配列と標的核酸の標的部位との間のパーセント相補性は、(Cas9ガイドRNAのターゲティング配列の3’末端のヌクレオチドに相補的であり得る)標的核酸の標的部位の8の連続した5’末端のヌクレオチドにわたって100%である。ある場合には、ターゲティングセグメントのターゲティング配列と標的核酸の標的部位との間のパーセント相補性は、(Cas9ガイドRNAのターゲティング配列の3’末端のヌクレオチドに相補的であり得る)標的核酸の標的部位の9の連続した5’末端のヌクレオチドにわたって100%である。ある場合には、ターゲティングセグメントのターゲティング配列と標的核酸の標的部位との間のパーセント相補性は、(Cas9ガイドRNAのターゲティング配列の3’末端のヌクレオチドに相補的であり得る)標的核酸の標的部位の10の連続した5’末端のヌクレオチドにわたって100%である。ある場合には、ターゲティングセグメントのターゲティング配列と標的核酸の標的部位との間のパーセント相補性は、(Cas9ガイドRNAのターゲティング配列の3’末端のヌクレオチドに相補的であり得る)標的核酸の標的部位の17の連続した5’末端のヌクレオチドにわたって100%である。ある場合には、ターゲティングセグメントのターゲティング配列と標的核酸の標的部位との間のパーセント相補性は、(Cas9ガイドRNAのターゲティング配列の3’末端のヌクレオチドに相補的であり得る)標的核酸の標的部位の18の連続した5’末端のヌクレオチドにわたって100%である。ある場合には、ターゲティングセグメントのターゲティング配列と標的核酸の標的部位との間のパーセント相補性は、20の連続したヌクレオチドにわたって60%以上(例えば、例えば、65%以上、70%以上、75%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、又は100%)である。ある場合には、ターゲティングセグメントのターゲティング配列と標的核酸の標的部位との間のパーセント相補性は、17の連続したヌクレオチドにわたって60%以上(例えば、例えば、65%以上、70%以上、75%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、又は100%)である。
ある場合には、ターゲティングセグメントのターゲティング配列と標的核酸の標的部位との間のパーセント相補性は、標的核酸の標的部位の7の連続した5’末端のヌクレオチドにわたって100%であり、残りにわたって0%以上と低い。そのような場合、ターゲティング配列は、7ヌクレオチドの長さであると考えられ得る。ある場合には、ターゲティングセグメントのターゲティング配列と標的核酸の標的部位との間のパーセント相補性は、標的核酸の標的部位の8の連続した5’末端のヌクレオチドにわたって100%であり、残りにわたって0%以上と低い。そのような場合、ターゲティング配列は、8ヌクレオチドの長さであると考えられ得る。ある場合には、ターゲティングセグメントのターゲティング配列と標的核酸の標的部位との間のパーセント相補性は、標的核酸の標的部位の9の連続した5’末端のヌクレオチドにわたって100%であり、残りにわたって0%以上と低い。そのような場合、ターゲティング配列は、9ヌクレオチドの長さであると考えられ得る。ある場合には、ターゲティングセグメントのターゲティング配列と標的核酸の標的部位との間のパーセント相補性は、標的核酸の標的部位の10の連続した5’末端のヌクレオチドにわたって100%であり、残りにわたって0%以上と低い。そのような場合、ターゲティング配列は、10ヌクレオチドの長さであると考えられ得る。ある場合には、ターゲティングセグメントのターゲティング配列と標的核酸の標的部位との間のパーセント相補性は、標的核酸の標的部位の11の連続した5’末端のヌクレオチドにわたって100%であり、残りにわたって0%以上と低い。そのような場合、ターゲティング配列は、11ヌクレオチドの長さであると考えられ得る。ある場合には、ターゲティングセグメントのターゲティング配列と標的核酸の標的部位との間のパーセント相補性は、標的核酸の標的部位の12の連続した5’末端のヌクレオチドにわたって100%であり、残りにわたって0%以上と低い。そのような場合、ターゲティング配列は、12ヌクレオチドの長さであると考えられ得る。ある場合には、ターゲティングセグメントのターゲティング配列と標的核酸の標的部位との間のパーセント相補性は、標的核酸の標的部位の13の連続した5’末端のヌクレオチドにわたって100%であり、残りにわたって0%以上と低い。そのような場合、ターゲティング配列は、13ヌクレオチドの長さであると考えられ得る。ある場合には、ターゲティングセグメントのターゲティング配列と標的核酸の標的部位との間のパーセント相補性は、標的核酸の標的部位の14の連続した5’末端のヌクレオチドにわたって100%であり、残りにわたって0%以上と低い。そのような場合、ターゲティング配列は、14ヌクレオチドの長さであると考えられ得る。ある場合には、ターゲティングセグメントのターゲティング配列と標的核酸の標的部位との間のパーセント相補性は、標的核酸の標的部位の17の連続した5’末端のヌクレオチドにわたって100%であり、残りにわたって0%以上と低い。そのような場合、ターゲティング配列は、17ヌクレオチドの長さであると考えられ得る。ある場合には、ターゲティングセグメントのターゲティング配列と標的核酸の標的部位との間のパーセント相補性は、標的核酸の標的部位の18の連続した5’末端のヌクレオチドにわたって100%であり、残りにわたって0%以上と低い。そのような場合、ターゲティング配列は、18ヌクレオチドの長さであると考えられ得る。
種々のCas9タンパク質及びCas9ガイドRNAの例(並びに、標的核酸に存在するプロトスペーサー隣接モチーフ(PAM)配列に関連する要求に関する情報)は、当該技術分野で見出すことができる、例えば、Jinek et al.,Science。2012 Aug 17;337(6096):816-21、Chylinski et al.,RNA Biol.2013 May;10(5):726-37、Ma et al.,Biomed Res Int.2013;2013:270805、Hou et al.,Proc Natl Acad Sci USA.2013 Sep 24;110(39):15644-9、Jinek et al.,Elife.2013;2:e00471、Pattanayak et al.,Nat Biotechnol.2013 Sep;31(9):839-43、Qi et al,Cell.2013 Feb 28;152(5):1173-83、Wang et al.,Cell.2013 May 9;153(4):910-8、Auer et al.,Genome Res.2013 Oct 31、Chen et al.,Nucleic Acids Res.2013 Nov 1;41(20):e19、Cheng et al.,Cell Res.2013 Oct;23(10):1163-71、Cho et al.,Genetics.2013 Nov;195(3):1177-80、DiCarlo et al.,Nucleic Acids Res.2013 Apr;41(7):4336-43、Dickinson et al.,Nat Methods.2013 Oct;10(10):1028-34、Ebina et al.,Sci Rep.2013;3:2510、Fujii et.al,Nucleic Acids Res.2013 Nov 1;41(20):e187、Hu et al.,Cell Res.2013 Nov;23(11):1322-5、Jiang et al.,Nucleic Acids Res.2013 Nov 1;41(20):e188、Larson et al.,Nat Protoc.2013 Nov;8(11):2180-96、Mali et.at.,Nat Methods.2013 Oct;10(10):957-63、Nakayama et al.,Genesis.2013 Dec;51(12):835-43、Ran et al.,Nat Protoc.2013 Nov;8(11):2281-308、Ran et al.,Cell.2013 Sep 12;154(6):1380-9、Upadhyay et al.,G3(Bethesda).2013 Dec 9;3(12):2233-8、Walsh et al.,Proc Natl Acad Sci USA.2013 Sep 24;110(39):15514-5、Xie et al.,Mol Plant.2013 Oct 9、Yang et al.,Cell.2013 Sep 12;154(6):1370-9、Briner et al.,Mol Cell.2014 Oct 23;56(2):333-9、及び米国特許及び特許出願:8,906,616、8,895,308、8,889,418、8,889,356、8,871,445、8,865,406、8,795,965、8,771,945、8,697,359、20140068797、20140170753、20140179006、20140179770、20140186843、20140186919、20140186958、20140189896、20140227787、20140234972、20140242664、20140242699、20140242700、20140242702、20140248702、20140256046、20140273037、20140273226、20140273230、20140273231、20140273232、20140273233、20140273234、20140273235、20140287938、20140295556、20140295557、20140298547、20140304853、20140309487、20140310828、20140310830、20140315985、20140335063、20140335620、20140342456、20140342457、20140342458、20140349400、20140349405、20140356867、20140356956、20140356958、20140356959、20140357523、20140357530、20140364333、及び20140377868を参照されたい。それらの全ては、それら全体が参照により本明細書に組み込まれる。
V型及びVI型のCRISPR/Casエンドヌクレアーゼに対応するガイドRNA(例えば、Cpf1ガイドRNA)
V型又はVI型のCRISPR/Casタンパク質(例えば、Cpf1、C2c1、C2c2、C2c3)に結合し、複合体を標的核酸内の特定の位置で標的とするガイドRNAは、一般に、「V型又はVI型のCRISPR/CasガイドRNA」と本明細書で称される。より具体的な用語の一例は、「Cpf1ガイドRNA」である。
V型又はVI型のCRISPR/CasガイドRNA(例えば、cpf1ガイドRNA)は、30ヌクレオチド(nt)~200nt、例えば、30nt~180nt、30nt~160nt、30nt~150nt、30nt~125nt、30nt~100nt、30nt~90nt、30nt~80nt、30nt~70nt、30nt~60nt、30nt~50nt、50nt~200nt、50nt~180nt、50nt~160nt、50nt~150nt、50nt~125nt、50nt~100nt、50nt~90nt、50nt~80nt、50nt~70nt、50nt~60nt、70nt~200nt、70nt~180nt、70nt~160nt、70nt~150nt、70nt~125nt、70nt~100nt、70nt~90nt、又は70nt~80nt)の全長を有し得る。ある場合には、V型又はVI型のCRISPR/CasガイドRNA(例えば、cpf1ガイドRNA)は、少なくとも30nt(例えば、少なくとも40nt、少なくとも50nt、少なくとも60nt、少なくとも70nt、少なくとも80nt、少なくとも90nt、少なくとも100nt、又は少なくとも120nt)の全長を有する。
ある場合には、Cpf1ガイドRNAは、35nt、36nt、37nt、38nt、39nt、40nt、41nt、42nt、43nt、44nt、45nt、46nt、47nt、48nt、49nt、又は50ntの全長を有する。
Cas9ガイドRNAと同様、V型又はVI型のCRISPR/CasガイドRNA(例えば、cpf1ガイドRNA)は、標的核酸結合セグメント及び二本鎖形成領域(例えば、ある場合には、2つの二本鎖形成セグメント、すなわち、互いにハイブリダイズして、二本鎖を形成するヌクレオチドの2つのストレッチから形成される)を含むことができる。
V型又はVI型のCRISPR/CasガイドRNA(例えば、cpf1ガイドRNA)の標的核酸結合セグメントは、15nt~30nt、例えば、15nt、16nt、17nt、18nt、19nt、20nt、21nt、22nt、23nt、24nt、25nt、26nt、27nt、28nt、29nt、又は30ntの長さを有し得る。ある場合には、標的核酸結合セグメントは、23ntの長さを有する。ある場合には、標的核酸結合セグメントは、24ntの長さを有する。ある場合には、標的核酸結合セグメントは、25ntの長さを有する。
V型又はVI型のCRISPR/CasガイドRNA(例えば、cpf1ガイドRNA)のガイド配列は、15nt~30nt(例えば、15~25nt、15~24nt、15~23nt、15~22nt、15~21nt、15~20nt、15~19nt、15~18nt、17~30nt、17~25nt、17~24nt、17~23nt、17~22nt、17~21nt、17~20nt、17~19nt、17~18nt、18~30nt、18~25nt、18~24nt、18~23nt、18~22nt、18~21nt、18~20nt、18~19nt、19~30nt、19~25nt、19~24nt、19~23nt、19~22nt、19~21nt、19~20nt、20~30nt、20~25nt、20~24nt、20~23nt、20~22nt、20~21nt、15nt、16nt、17nt、18nt、19nt、20nt、21nt、22nt、23nt、24nt、25nt、26nt、27nt、28nt、29nt、又は30nt)の長さを有し得る。ある場合には、ガイド配列は、17ntの長さを有する。ある場合には、ガイド配列は、18ntの長さを有する。ある場合には、ガイド配列は、19ntの長さを有する。ある場合には、ガイド配列は、20ntの長さを有する。ある場合には、ガイド配列は、21ntの長さを有する。ある場合には、ガイド配列は、22ntの長さを有する。ある場合には、ガイド配列は、23ntの長さを有する。ある場合には、ガイド配列は、24ntの長さを有する。
V型又はVI型のCRISPR/CasガイドRNA(例えば、cpf1ガイドRNA)のガイド配列は、標的核酸配列の対応する長さと100%の相補性を有し得る。ガイド配列は、標的核酸配列の対応する長さと100%未満の相補性を有し得る。例えば、V型又はVI型のCRISPR/CasガイドRNA(例えば、cpf1ガイドRNA)のガイド配列は、標的核酸配列に相補的ではない1、2、3、4、又は5ヌクレオチドを有し得る。例えば、ある場合には、ガイド配列が、25ヌクレオチドの長さを有し、標的核酸配列が、25ヌクレオチドの長さを有する場合、ある場合には、標的核酸結合セグメントは、標的核酸配列に100%の相補性を有する。別の例として、ある場合には、ガイド配列が、25ヌクレオチドの長さを有し、標的核酸配列が、25ヌクレオチドの長さを有する場合、ある場合には、標的核酸結合セグメントは、標的核酸配列と1の非相補的ヌクレオチド及び24の相補的ヌクレオチドを有する。別の例として、ある場合には、ガイド配列が、25ヌクレオチドの長さを有し、標的核酸配列が、25ヌクレオチドの長さを有する場合、ある場合には、標的核酸結合セグメントは、標的核酸配列と2の非相補的ヌクレオチド及び23の相補的ヌクレオチドを有する。
(例えば、ターゲッターRNA又はアクチベーターRNAの)V型又はVI型のCRISPR/CasガイドRNA(例えば、cpf1ガイドRNA)の二本鎖形成セグメントは、ある場合には、15nt~25nt(例えば、15nt、16nt、17nt、18nt、19nt、20nt、21nt、22nt、23nt、24nt、又は25nt)の長さを有し得る。
ある場合には、V型又はVI型のCRISPR/CasガイドRNA(例えば、cpf1ガイドRNA)のRNA二本鎖は、5塩基対(bp)~40bp(例えば、5~35bp、5~30bp、5~25bp、5~20bp、5~15bp、5~12bp、5~10bp、5~8bp、6~40bp、6~35bp、6~30bp、6~25bp、6~20bp、6~15bp、6~12bp、6~10bp、6~8bp、7~40bp、7~35bp、7~30bp、7~25bp、7~20bp、7~15bp、7~12bp、7~10bp、8~40bp、8~35bp、8~30bp、8~25bp、8~20bp、8~15bp、8~12bp、8~10bp、9~40bp、9~35bp、9~30bp、9~25bp、9~20bp、9~15bp、9~12bp、9~10bp、10~40bp、10~35bp、10~30bp、10~25bp、10~20bp、10~15bp、又は10~12bp)の長さを有し得る。
一例として、Cpf1ガイドRNAの二本鎖形成セグメントは、(5’から3’で):AAUUUCUACUGUUGUAGAU(配列番号1093)、AAUUUCUGCUGUUGCAGAU(配列番号1094)、AAUUUCCACUGUUGUGGAU(配列番号1095)、AAUUCCUACUGUUGUAGGU(配列番号1096)、AAUUUCUACUAUUGUAGAU(配列番号1097)、AAUUUCUACUGCUGUAGAU(配列番号1098)、AAUUUCUACUUUGUAGAU(配列番号1099)、及びAAUUUCUACUUGUAGAU(配列番号1100)から選択されるヌクレオチド配列を含むことができる。ガイド配列は、(5’から3’で)二本鎖形成セグメントに従い得る。
C2c1ガイドRNA(二重ガイド又は単一ガイド)のアクチベーターRNA(例えば、tracrRNA)の非限定例は、ヌクレオチド配列GAAUUUUUCAACGGGUGUGCCAAUGGCCACUUUCCAGGUGGCAAAGCCCGUUGAGCUUCUCAAAAAG(配列番号1101)を含むRNAである。ある場合には、C2c1ガイドRNA(二重ガイド又は単一ガイド)は、ヌクレオチド配列を含むRNAである。ある場合には、C2c1ガイドRNA(二重ガイド又は単一ガイド)は、ヌクレオチド配列GUCUAGAGGACAGAAUUUUUCAACGGGUGUGCCAAUGGCCACUUUCCAGGUGGCAAAGCCCGUUGAGCUUCUCAAAAAG(配列番号1102)を含むRNAである。ある場合には、C2c1ガイドRNA(二重ガイド又は単一ガイド)は、ヌクレオチド配列UCUAGAGGACAGAAUUUUUCAACGGGUGUGCCAAUGGCCACUUUCCAGGUGGCAAAGCCCGUUGAGCUUCUCAAAAAG(配列番号1103)を含むRNAである。C2c1ガイドRNA(二重ガイド又は単一ガイド)のアクチベーターRNA(例えば、tracrRNA)の非限定例は、ヌクレオチド配列ACUUUCCAGGCAAAGCCCGUUGAGCUUCUCAAAAAG(配列番号1104)を含むRNAである。ある場合には、アクチベーターRNA(例えば、tracrRNA)のC2c1ガイドRNA(二重ガイド又は単一ガイド)の二本鎖形成セグメントは、ヌクレオチド配列AGCUUCUCA(配列番号1105)又はヌクレオチド配列GCUUCUCA(配列番号1106)(天然に存在するtracrRNA由来の二本鎖形成セグメント)を含む。
C2c1ガイドRNA(二重ガイド又は単一ガイド)のターゲッターRNA(例えば、crRNA)の非限定例は、ヌクレオチド配列CUGAGAAGUGGCACNNNNNNNNNNNNNNNNNNNN(配列番号1107)を有するRNAであり、Nは、ガイド配列を表し、標的配列に応じて変化するが、20個のNは、許容可能な異なる長さの範囲を示す。ある場合には、ターゲッターRNA(例えば、crRNA)のC2c1ガイドRNA(二重ガイド又は単一ガイド)の二本鎖形成セグメントは、ヌクレオチド配列CUGAGAAGUGGCAC(配列番号1108)を含み、又はヌクレオチド配列CUGAGAAGU(配列番号1109)を含み、又はヌクレオチド配列UGAGAAGUGGCAC(配列番号1110)を含み、又はヌクレオチド配列UGAGAAGU(配列番号1111)を含む。
V型又はVI型のCRISPR/Casエンドヌクレアーゼ及びガイドRNA(並びに、標的核酸に存在するプロトスペーサー隣接モチーフ(PAM)配列に関連する要求に関する情報)に関する例及び手引きは、当該技術分野で見出すことができ、例えば、Zetsche et al,Cell.2015 Oct 22;163(3):759-71、Makarova et al,Nat Rev Microbiol.2015 Nov;13(11):722-36、及びShmakov et al.,Mol Cell.2015 Nov 5;60(3):385-97を参照されたい。
標的細胞
標的核酸(例えば、標的ゲノムDNA)は、真核細胞内に、例えば、真核細胞の内部にインビトロ、真核細胞の内部にインビボ、真核細胞の内部にエクスビボで位置することができる。従って、ある場合には、主題の方法の標的細胞(例えば、ヒト細胞)(クラス2 CRISPR/Casエンドヌクレアーゼ、及び一対の対応するCRISPR/CasガイドRNAを導入することができる細胞)は、インビトロである。ある場合には、主題の方法の標的細胞(例えば、ヒト細胞)(クラス2 CRISPR/Casエンドヌクレアーゼ、及び一対の対応するCRISPR/CasガイドRNAを導入することができる細胞)は、エクスビボである。ある場合には、主題の方法の標的細胞(例えば、ヒト細胞)(クラス2 CRISPR/Casエンドヌクレアーゼ、及び一対の対応するCRISPR/CasガイドRNAを導入することができる細胞)は、インビボである。
主題のキット、組成物、及び方法は、研究及び治療用途に使用することができる。従って、ヒトジストロフィン遺伝子のイントロン44乃至イントロン55の領域に対応する領域を有する任意の真核細胞を使用することができる。
ある場合には、標的細胞(クラス2 CRISPR/Casエンドヌクレアーゼ、及び一対の対応するCRISPR/CasガイドRNAを導入することができる細胞)は、脊椎動物(例えば、魚類、両生類、爬虫類、鳥類、哺乳類)の細胞、哺乳動物の細胞(例えば、マウス又はラットなどのげっ歯類の細胞、非ヒト霊長類の細胞、ヒトの細胞など)などである。ある場合には、標的細胞(クラス2 CRISPR/Casエンドヌクレアーゼ、及び一対の対応するCRISPR/CasガイドRNAを導入することができる細胞)は、哺乳類細胞(例えば、ヒト細胞)である。
いかなる種類の細胞も対象になり得る(例えば、幹細胞、例えば、胚性幹(ES)細胞、人工多能性幹(iPS)細胞、生殖細胞(例えば、卵母細胞、精子、卵原細胞、精原細胞など)、体細胞、筋細胞、インビトロ又はインビボにおける、あらゆる段階の胚の胚細胞、例えば、1細胞、2細胞、4細胞、8細胞などの段階のゼブラフィッシュ胚など)。細胞は、樹立細胞株から得てもよいし、あるいは初代細胞であってもよく、ここで、「初代細胞」、「初代細胞株」、及び「初代培養物」は、本明細書で互換的に使用されて、対象から得られ、培養物の、限定された回数の継代(すなわち、分裂)だけインビトロにおいて増殖した、細胞及び細胞培養物を指す。例えば、初代培養物は、0回、1回、2回、4回、5回、10回、又は15回継代されている場合があるが、危機期を起こすには十分な回数継代されていない、培養物である。
細胞は、初代細胞(例えば、エクスビボ細胞)である場合、あらゆる好都合な方法によって個体から採取することができる。例えば、白血球は、アフェレーシス、白血球アフェレーシス、密度勾配分離などによって採取することが好都合であり得、一方、皮膚、筋肉、骨髄、脾臓、肝臓、膵臓、肺、腸、胃などの組織由来の細胞は、生検によって好都合に採取することができる。
ある場合には、細胞は、周皮細胞である。周皮細胞は、骨格筋の血管内に位置する多能性幹細胞である。周皮細胞は、全身に送達することができ、血管障壁を通過することができる。血管系を通過すると、周皮細胞は融合し、筋管を形成することができる。周皮細胞は、動脈に注入することができ、動脈壁を通過して筋肉に到達し、そこで、機能的な筋肉に分化することができる。
従って、ある場合には、標的細胞(クラス2 CRISPR/Casエンドヌクレアーゼ、及び一対の対応するCRISPR/CasガイドRNAを導入することができる細胞)は、周皮細胞である(例えば、Dellavalle et al.,Nat Cell Biol.2007 Mar;9(3):255-67を参照されたい)。ある場合には、細胞は、(例えば、筋管を形成することができ、ネスチンの陽性発現(PDGFRβ+CD146+NG2+)によって特徴付けることができる)2型の周皮細胞である。ある場合には、細胞は、筋幹細胞である。ある場合には、細胞は、筋原前駆細胞である。
発明者らの知見(例えば、以下の実施例を参照)は、DMDの幹細胞治療に使用することができる。例えば、周皮細胞由来細胞を抽出し、培養で増殖させることができ、その後、これらの細胞を血流に注入することができ、そこで、骨格筋の損傷領域に入り込むことができる。
ある場合には、主題の方法は、(クラス2 CRISPR/Casエンドヌクレアーゼ、及び対応する第1及び第2のCRISPR/CasガイドRNAを標的細胞に導入した後)、細胞を個体(例えば、DMDを有する個体)に移植するステップを含む。ある場合には、細胞は、個体に対して自己由来である(例えば、細胞は、DMDを有する個体から採取され、主題の成分を細胞に導入して、本明細書の他の箇所に記載されるゲノム欠失を生成し、「矯正された」細胞及び/又は「矯正された」細胞由来の細胞、例えば、子孫細胞を個体に導入する)。
核酸
上述のように、主題の成分(例えば、(a)クラス2 CRISPR/Casエンドヌクレアーゼ、例えば、Cas9、Cpf1など、及び/又は(b)第1及び第2の対応するガイドRNA、例えば、Cas9ガイドRNA、Cpf1ガイドRNAなど)は、DNA、RNA、又はタンパク質として細胞に送達する(細胞に導入する)ことができる。従って、ある場合には、主題の方法又は組成物又はキットは、(i)クラス2 CRISPR/Casエンドヌクレアーゼ(例えば、Cas9タンパク質)、(ii)第1のCRISPR/CasガイドRNA(例えば、本明細書の他の箇所に記載されるイントロン44にハイブリダイズする)、及び(iii)第2のCRISPR/CasガイドRNA(例えば、本明細書の他の箇所に記載されるイントロン55にハイブリダイズする)のうちの1つ以上をコードする1つ以上の核酸(RNA又はDNA)を含む。ある場合には、1つの核酸(例えば、発現ベクター)が、第1及び第2のCRISPR/CasガイドRNAをコードする。ある場合には、同じ核酸(例えば、発現ベクター)が、クラス2 CRISPR/Casエンドヌクレアーゼもコードする。
核酸を標的細胞に移すのに有用な多くのベクター、例えば、プラスミド、コスミド、ミニサークル、ファージ、ウイルスなどが利用可能である。核酸(複数可)を含むベクターは、例えば、プラスミド、ミニサークルDNA、ウイルス、例えば、サイトメガロウイルス、アデノウイルスなどとしてエピソームに保持されていてもよいし、あるいは、相同組換え又はランダムインテグレーション、例えば、MMLV、HIV-1、ALVなどのレトロウイルス由来ベクターによって、標的細胞ゲノム内に組み込まれてもよい。
ベクターは、主題の細胞に直接的に与えてもよい。言い換えれば、細胞は、ベクターが細胞に取り込まれるように、(i)第1のCRISPR/CasガイドRNA、(ii)第2のCRISPR/CasガイドRNA、及び(iii)クラス2 CRISPR/Casエンドヌクレアーゼのうちの1つ以上をコードする1つ以上の核酸(例えば、ベクター)と接触させることができる。
細胞をプラスミドである核酸ベクターと接触させるための方法、例えば、エレクトロポレーション、塩化カルシウムトランスフェクション、マイクロインジェクション、及びリポフェクションは、当該技術分野において周知である。ウイルスベクター送達において、細胞は、核酸を含むウイルス粒子と接触させる。レトロウイルス、例えば、レンチウイルスは、本発明の方法に特に適している。一般的に用いられるレトロウイルスベクターは、「欠陥」を有する、すなわち、増殖性感染に必要なウイルスタンパク質を産生することができない。むしろ、ベクターの複製は、パッケージング細胞株内での増殖を必要とする。目的の核酸を含むウイルス粒子を生成するために、核酸を含むレトロウイルス核酸は、パッケージング細胞株によってウイルスカプシド内にパッケージングされる。異なるパッケージング細胞株は、カプシド内に取り込まれる異なるエンベロープタンパク質(同種志向性、両種指向性、又は異種指向性)を与え、このエンベロープタンパク質が、細胞に対するウイルス粒子の特異性を決定する(マウス及びラットに対する同種志向性、ヒト、イヌ、及びマウスを含むほとんどの哺乳類細胞種に対する両種指向性、並びにマウス細胞以外のほとんどの哺乳類細胞種に対する異種指向性)。適切なパッケージング細胞株を用いることで、細胞がパッケージングされたウイルス粒子の標的となることを確実にすることができる。再プログラム因子をコードする核酸を含むレトロウイルスベクターをパッケージング細胞株に導入する方法、及びパッケージング系によって生成されたウイルス粒子を収集する方法は、当該技術分野において周知である。核酸は、直接的微量注入によって導入することもできる(例えば、RNAのゼブラフィッシュ胚への注入)。
第1及び第2のCRISPR/CasガイドRNA、及び/又はクラス2 CRISPR/Casエンドヌクレアーゼをコードする核酸を標的細胞に与えるために用いられるベクターは、目的の核酸の発現(すなわち、転写活性化)を駆動するのに適したプロモーターを含むことができる。言い換えれば、目的の核酸(第1のCRISPR/CasガイドRNAをコードするヌクレオチド配列、第2のCRISPR/CasガイドRNAをコードするヌクレオチド配列、クラス2 CRISPR/Casエンドヌクレアーゼをコードするヌクレオチド配列など)は、プロモーター(例えば、標的細胞において作動可能なプロモーター)に作動可能に連結することができる。これには、遍在的作用性プロモーター(例えば、CMV-β-アクチンプロモーター、EF-1αプロモーターなど)、又は誘導性プロモーター(例えば、特定の細胞集団において活性がある、又はテトラサイクリンなどの薬剤の存在に応答するプロモーター)が含まれ得る。転写活性化により、転写は少なくとも約10倍、少なくとも約100倍、より一般的には少なくとも約1000倍、標的細胞において基底レベルを超えて増加することが意図される。発現ベクターは、導入された核酸を取り込んだ細胞を特定するために、標的細胞内の選択マーカーをコードする核酸配列を含んでいてもよい。
上述のように、プロモーターは、恒常的活性型プロモーター(すなわち、恒常的に活性/「ON」状態であるプロモーター)であってもよく、誘導性プロモーター(すなわち、活性/「ON」又は不活性/「OFF」状態が、外部刺激、例えば、特定の温度、化合物、又はタンパク質の存在によって制御されるプロモーター)であってもよく、空間限定的プロモーター(すなわち、転写調節要素、エンハンサーなど)(例えば、組織特異的プロモーター、細胞型特異的プロモーターなど)であってもよく、及び時間限定的プロモーター(すなわち、プロモーターが、胚発生の特定の段階の間、又は生物学的プロセスの特定の段階、例えば、マウスにおける毛包周期の間に、「ON」状態又は「OFF」状態にある)であってもよい。
組織特異的プロモーターは、当該技術分野において周知である。組織特異的プロモーターの非限定例は、筋細胞特異的プロモーターである。適切な筋肉特異的プロモーターには、例えば、デスミンプロモーター、α-ミオシン重鎖プロモーター、ミオシン軽鎖-2プロモーター、心筋トロポニンCプロモーター、筋クレアチンキナーゼプロモーター、α-アクチニンプロモーター、心筋トロポニンIプロモーターなどが含まれる。例えば、Pacak et al.(2008)Genet.Vaccines Ther.6:13を参照されたい。
適切なプロモーターは、ウイルス由来であってもよく、従って、ウイルス性プロモーターと称されてもよく、あるいは、適切なプロモーターは、原核生物又は真核生物を含むあらゆる生物に由来していてもよい。適切なプロモーターを用いることで、任意のRNAポリメラーゼ(例えば、polI、polII、polIII)によって発現を駆動することができる。例示的なプロモーターとしては、SV40初期プロモーター、マウス乳癌ウイルス末端反復配列(LTR)プロモーター、アデノウイルス主要後期プロモーター(AdMLP)、単純疱疹ウイルス(HSV)プロモーター、サイトメガロウイルス(CMV)プロモーター、例えば、CMV最初期プロモーター領域(CMVIE)、ラウス肉腫ウイルス(RSV)プロモーター、ヒトU6核内低分子プロモーター(U6)(Miyagishi et al.,Nature Biotechnology 20,497-500(2002))、高感度U6プロモーター(例えば、Xia et al.,Nucleic Acids Res.2003 Sep 1;31(17))、ヒトH1プロモーター(H1)などが挙げられるが、これらに限定されない。
誘導性プロモーターの例としては、T7 RNAポリメラーゼプロモーター、T3 RNAポリメラーゼプロモーター、イソプロピル-β-D-チオガラクトピラノシド(IPTG)調節性プロモーター、ラクトース誘導性プロモーター、熱ショックプロモーター、テトラサイクリン調節性プロモーター、ステロイド調節性プロモーター、金属調節性プロモーター、エストロゲン受容体調節性プロモーターなどが挙げられるが、これらに限定されない。従って、誘導性プロモーターは、ドキシサイクリン、RNAポリメラーゼ、例えば、T7 RNAポリメラーゼ、エストロゲン受容体、エストロゲン受容体融合物などを含むがこれらに限定はされない分子によって調節され得る。
上述のように、クラス2 CRISPR/Casエンドヌクレアーゼ、及び/又はCRISPR/CasガイドRNAをRNAとして細胞に導入してもよい。細胞にRNAを導入する方法は、当該技術分野において公知であり、例えば、直接注入、トランスフェクション、又はDNAの導入に用いられる任意の他の方法が含まれ得る。
クラス2 CRISPR/Casエンドヌクレアーゼ(例えば、Cas9タンパク質)をポリペプチドとして細胞に導入してもよい(例えば、ある場合には、ガイドRNAと複合化することで、RNPを形成する)。そのようなポリペプチドを、必要に応じて、産物の溶解性を増加させるポリペプチドドメインに融合してもよい。ドメインは、TEVプロテアーゼによって切断される、規定のプロテアーゼ切断部位(例えば、TEV配列)を介してポリペプチドに連結されていてもよい。リンカーは、1つ以上の、より可撓性の性配列、例えば、1~10個のグリシン残基も含んでいてもよい。いくつかの実施形態では、融合タンパク質の切断は、産物の溶解性を維持する緩衝液中、例えば、0.5~2M尿素の存在下、溶解性を増加させるポリペプチド及び/又はポリヌクレオチドの存在下などで行われる。目的のドメインには、エンドソーム溶解性ドメイン、例えば、インフルエンザHAドメイン、及び生成を助ける他のポリペプチド、例えば、IF2ドメイン、GSTドメイン、GRPEドメインなどが含まれる。ポリペプチドは、安定性を向上させるために製剤化されてもよい。例えば、ペプチドは、PEG化されていてもよく、ポリエチレンオキシ基によって血流中の寿命が延長される。
さらに、又は、あるいは、Cas9タンパク質などのクラス2 CRISPR/Casエンドヌクレアーゼは、細胞による取り込みを促進するために、ポリペプチド浸透性ドメインに融合されていてもよい。多くの浸透性ドメインが当該技術分野において公知であり、本発明の非組込みポリペプチドに用いられてもよく、これには、ペプチド、ペプチド模倣薬、及び非ペプチド担体が含まれる。例えば、浸透性ペプチドは、アミノ酸配列RQIKIWFQNRRMKWKK(配列番号1080)を含む、ペネトラチンと称される、キイロショウジョウバエ(Drosophila melanogaster)転写因子アンテナペディア(Antennapaedia)の第三αヘリックスに由来し得る。別の例として、浸透性ペプチドは、例えば、自然発生のtatタンパク質のアミノ酸49~57を含み得る、HIV-1 tat基本領域アミノ酸配列を含む。他の浸透性ドメインには、ポリ-アルギニンモチーフ、例えば、HIV-1 revタンパク質のアミノ酸34~56の領域、ノナ-アルギニン、オクタ-アルギニンなどが含まれる。(例えば、Futaki et al.(2003)Curr Protein Pept Sci.2003 Apr;4(2):87-9 and 446、及びWender et al.(2000)Proc.Natl.Acad.Sci.U.S.A 2000 Nov.21;97(24):13003-8、米国特許出願公開第20030220334号、同第20030083256号、同第20030032593号、及び同第20030022831号(これらは、移行ペプチド及び移行ペプトイドの教示のために参照によって本明細書に明確に組み込まれる)を参照されたい)。ノナ-アルギニン(R9)配列は、特徴付けされているより効率的なPTDの1つである(Wender et al.2000、Uemura et al.2002)。融合が起こる部位は、ポリペプチドの生物活性、分泌、又は結合の特徴を最適化するために、選択されてもよい。最適な部位は、通例の実験法により決定される。
クラス2 CRISPR/Casエンドヌクレアーゼ(例えば、Cas9タンパク質)は、インビトロで、又は真核細胞によって、又は原核細胞によって生成され得、アンフォールディング、例えば、熱変性、DTT還元などによってさらに処理されてもよく、当該技術分野において公知の方法を用いてリフォールディングされてもよい。
一次配列を変化させない目的の修飾には、ポリペプチドの化学誘導体化、例えば、アシル化、アセチル化、カルボキシル化、アミド化などが含まれる。グリコシル化の修飾、例えば、ポリペプチドの合成中及びプロセシング中又はさらなるプロセシングステップ中に、例えば、ポリペプチドを哺乳類グリコシル化酵素又は脱グリコシル化酵素などのグリコシル化に影響を与える酵素に暴露することにより、ポリペプチドのグリコシル化パターンを修飾することにより成されるものも含まれる。リン酸化したアミノ酸残基、例えば、ホスホチロシン、ホスホセリン、又はホスホトレオニンを有する配列も含まれる。
クラス2 CRISPR/Casエンドヌクレアーゼ、例えば、Cas9タンパク質は、例えば、組換え合成の常法に従って、単離及び精製することができる。発現宿主の可溶化液を作製して、HPLC、排除クロマトグラフィ、ゲル電気泳動、アフィニティークロマトグラフィー、又は他の精製技術を用いて、その可溶化液を精製してもよい。ほとんどの場合、用いられる組成物は、産物の調製法及びその精製に関連した混入物との関連で、少なくとも20重量%の所望の産物、より一般的には少なくとも約75重量%、好ましくは少なくとも約95重量%の所望の産物を含み、治療目的には、例えば、少なくとも約99.5重量%の所望の産物を含むことができる。パーセンテージは、総タンパク質量に基づくことができる。
本明細書に記載される方法及び組成物(及びキット)の成分は、あらゆる好都合な方法を用いて細胞に導入することができる。例えば、ゲノムターゲティング組成物は、種々の形態で、例えば、(i)RNP(例えば、クラス2 CRISPR/Casエンドヌクレアーゼ、例えば、Cas9タンパク質、及び対応する第1及び第2のガイドRNA、例えば、Cas9ガイドRNAを含む)として、(ii)タンパク質(例えば、クラス2 CRISPR/Casエンドヌクレアーゼ)として、(iii)RNA(例えば、CRISPR/CasガイドRNA、クラス2 CRISPR/CasエンドヌクレアーゼをコードするRNAなど)として、(iv)DNA(例えば、ゲノム編集エンドヌクレアーゼをコードするDNA、CRISPR/CasガイドRNAをコードするDNAなど)として、及び(v)それらの任意の組み合わせで細胞に導入することができる。
上記の成分を導入する方法の例としては、ウイルス感染又はバクテリオファージ感染、トランスフェクション、コンジュゲーション、原形質融合、リポフェクション、エレクトロポレーション、リン酸カルシウム沈殿、ポリエチレンイミン(PEI)介在性トランスフェクション、DEAE-デキストラン介在性トランスフェクション、リポソーム介在性トランスフェクション、パーティクルガン法、リン酸カルシウム沈殿、直接微量注入、ナノ粒子介在性核酸送達(例えば、Panyam et.,al Adv Drug Deliv Rev.2012 Sep 13.pii:S0169-409X(12)00283-9.doi:10.1016/j.addr.2012.09.023を参照)が挙げられるが、これらに限定されない。
成分は、あらゆる好都合な方法(例えば、局所又は全身、注入、局所又は全身注入、経口、非経口、皮下、静脈内、頭蓋内、脊髄内、眼内、又は髄液内など)を用いて、インビボで細胞に導入する(例えば、個体に投与する)ことができる。ある場合には、導入は、ヌクレオフェクション、エレクトロポレーションなどを含むことができる。ある場合には、導入は、ヌクレオフェクション又はエレクトロポレーションを含まない。
キット
ある場合には、主題のキット、及び/又は主題の組成物は、第1のCRISPR/CasガイドRNA(例えば、ジストロフィン遺伝子のイントロン44内の第1の標的配列にハイブリダイズする、例えば、上記でより詳細に記載されるように)、及び(b)第2のCRISPR/CasガイドRNA(例えば、ジストロフィン遺伝子のイントロン55内の第2の標的配列にハイブリダイズする、例えば、上記でより詳細に記載されるように)を含み、及び第1及び第2の標的配列は、互いに330kbを超えて離れている。
ある場合には、第1のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)のガイド配列は、配列番号1155~1159のいずれかに記載される17ヌクレオチド配列を含む。ある場合には、第1のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)のガイド配列は、配列番号1150~1154のいずれかに記載される20ヌクレオチド配列を含む。ある場合には、第2のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)のガイド配列は、配列番号1175~1179のいずれかに記載される17ヌクレオチド配列を含む。ある場合には、第1のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)のガイド配列は、配列番号1223~1269のいずれかに記載されるヌクレオチド配列を含む。ある場合には、第2のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)のガイド配列は、配列配列番号1170~1174のいずれかに記載される20ヌクレオチドを含む。ある場合には、第2のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)のガイド配列は、配列番号1318~1365のいずれかに記載されるヌクレオチド配列を含む。
ある場合には、第1のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)のガイド配列は、配列番号1155~1159のいずれかに記載される17ヌクレオチド配列を含み、及び第2のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)のガイド配列は、配列番号1175~1179のいずれかに記載される17ヌクレオチド配列を含む。ある場合には、第1のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)のガイド配列は、配列番号1150~1154のいずれかに記載される20ヌクレオチド配列を含み、及び第2のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)のガイド配列は、配列番号1170~1174のいずれかに記載される20ヌクレオチド配列を含む。
ある場合には、第1のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)のガイド配列は、17ヌクレオチド配列GAAAUUAAACUACACAC(配列番号1158)を含み、及び第2のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)のガイド配列は、17ヌクレオチド配列AUGAUGCUAUAAUACCA(配列番号1177)を含む。ある場合には、第1のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)のガイド配列は、20ヌクレオチド配列GUUGAAAUUAAACUACACAC(配列番号1153)を含み、及び第2のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)のガイド配列は、20ヌクレオチド配列UGUAUGAUGCUAUAAUACCA(配列番号1172)を含む。
ある場合には、第1のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)のガイド配列は、ヒトジストロフィン遺伝子のイントロン44に対応する標的配列(例えば、ヒトジストロフィン遺伝子のイントロン44内の標的配列、マウスジストロフィン遺伝子内の標的配列など)と20の連続したヌクレオチドにわたって100%の相補性を有し、及び第2のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)のガイド配列は、ヒトジストロフィン遺伝子のイントロン55に対応する標的配列(例えば、ヒトジストロフィン遺伝子のイントロン55内の標的配列、マウスジストロフィン遺伝子内の標的配列など)と20の連続したヌクレオチドにわたって100%の相補性を有する。いくつかのそのような場合には、イントロン44に対応する標的配列とイントロン55に対応する標的配列は、互いに330キロベース(kb)を超えて離れている。ある場合には、イントロン44に対応する標的配列とイントロン55に対応する標的配列は、互いに400キロベース(kb)以上(例えば、450kb以上、500kb以上、550kb以上、600kb以上、650kb以上、700kb以上など)離れている。ある場合には、イントロン44内の標的配列とイントロン55内の標的配列は、互いに700kb以上離れている。
ある場合には、第1のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)のガイド配列は、ヒトジストロフィン遺伝子のイントロン44に対応する標的配列と17の連続したヌクレオチドにわたって100%の相補性を有し、及び第2のCRISPR/CasガイドRNA(例えば、Cas9ガイドRNA)のガイド配列は、ヒトジストロフィン遺伝子のイントロン55に対応する標的配列と17の連続したヌクレオチドにわたって100%の相補性を有する。いくつかのそのような場合には、イントロン44に対応する標的配列とイントロン55に対応する標的配列は、互いに330キロベース(kb)を超えて離れている。ある場合には、イントロン44に対応する標的配列とイントロン55に対応する標的配列は、互いに400キロベース(kb)以上(例えば、450kb以上、500kb以上、550kb以上、600kb以上、650kb以上、700kb以上など)離れている。ある場合には、イントロン44内の標的配列とイントロン55内の標的配列は、互いに700kb以上離れている。
ある場合には、主題のキットは、クラス2 CRISPR/Casエンドヌクレアーゼ(例えば、Cas9タンパク質)、又はエンドヌクレアーゼをコードする核酸をさらに含み得る。
主題のキットの構成要素(a)及び(b)は、同じ又は別々の容器中であってもよい。
組成物及び/又はキットは、例えば、希釈緩衝液、再構成溶液、洗浄緩衝液、対照試薬、対照発現ベクター又はRNAポリヌクレオチド、DNA又はRNAからクラス2 CRISPR/Casエンドヌクレアーゼをインビトロ生成するための試薬、DNAからCRISPR/CasガイドRNAをインビトロ生成するための試薬などから選択される1つ以上の追加の試薬をさらに含み得る。
上記構成要素に加えて、主題のキットは、キットの構成要素を用いて、主題の方法を実施するための説明書をさらに含み得る。主題の方法を実施するための説明書は、一般的には、適切な記録媒体上に記録される。例えば、説明書は、紙又はプラスチックなどの基体上に印刷されていてもよい。従って、説明書は、添付文書としてキット内に、キット又はその構成要素の容器の標識中(すなわち、パッケージ又はサブパッケージに付随して)など、存在していてもよい。他の実施形態では、説明書は、適切なコンピューター可読の記憶媒体、例えば、CD-ROM、ディスケット、フラッシュドライブなど上に存在する電子記憶データファイルとして存在する。さらに他の実施形態においては、実際の説明書がキット内に存在しないが、例えば、インターネットを介して、遠隔の供給源から説明書を得るための手段が提供される。この実施形態の一例は、説明書を閲覧することができる、及び/又は説明書をダウンロードすることができる、ウェブアドレスを含むキットである。説明書と同様、説明書を得るためのこの手段は、適切な基体上に記録される。
以下の実施例は、当業者に本発明の作成及び使用方法の完全な開示及び説明を提供するために記載され、発明者らが自身の発明と見なすものの範囲を限定する意図はなく、下記の実験が実行される全て又は唯一の実験であると示すようにも意図されていない。使用される数(例えば、量、温度など)に関して正確性を確実にするよう尽力したが、実験の誤差及び偏差は多少考慮されるべきである。別で指示されない限り、部は重量部であり、分子量は重量平均分子量であり、温度は摂氏の温度であり、圧力は大気圧又は大気圧付近である。標準的な省略が使用され得、例えば、bp:塩基対(複数可)、kb:キロベース(複数可)、pl:ピコリットル(複数可)、s又はsec:秒(複数可)、min:分(複数可)、h又はhr:時間(複数可)、aa:アミノ酸(複数可)、kb:キロベース(複数可)、bp:塩基対(複数可)、nt:ヌクレオチド(複数可)、i.m.:筋肉内(に)、i.p.、腹腔内(に)、s.c.:皮下(に)、などである。
材料及び方法
gRNAのクローニング
5つのガイドRNAは、Zhang lab CRISPR設計ツール(「crispr.mit」、その後、「.edu」)を用いて、DMDイントロン44及び55を標的とするように設計され、Ran et al.(Nature Protocols,2013.8:2281-2308)を改変して、Feng Zhangから得たspCas9プラスミドpX330又はpX459(それぞれ、Addgene #42230、#48139)にクローニングした。簡単に言えば、gRNA配列及びBbsI制限酵素部位を含有する、互いに相補的なオリゴを、Integrated DNA Technologiesから得て、アニールした。アニールしたオリゴ及びプラスミドをBbsI(New England Biotechnologies)で同時に消化し、T4 DNAリガーゼ(Life Technologies)でライゲーションした。
表3:クローニングに使用したgRNA配列及びオリゴ類
太文字及び下線付きの文字は、NGG PAM配列である。
マウス
全ての動物実験は、Office of Animal Research OversightにおけるUCLA動物研究委員会によって承認されたプロトコル下で実施された。生着実験に使用したマウスは、mdx scid(Jackson Laboratory)をNOD scid IL2Rγ(Jackson Laboratory)マウスと交配させることで生成した。簡潔に言えば、雌のB10ScSn.Cg-PrkdcscidDmdmdx/Jを雄のNOD.Cg-PrkdcscidIl2rgtm1Wjl/SzJと交配させた。その後、その交配からのF1雌を雄のmdx-scidと交配させた。F3雄をジストロフィン及びγ変異についてスクリーニングした後、突然変異体をmdx-scid雌と再び戻し交配させた。F4雌をF3変異体の雄と交配させて、ホモ接合NSG-mdxマウスを生成した。ジェノタイピングは、TransnetYXを通じて行った。
細胞培養
ヒト胎児由来腎臓(HEK)293FT細胞(Life Technologies)を、10%のウシ胎児血清(FBS、Life Technologies)、0.1mMの非必須アミノ酸(NEAA、Life Technologies)、6mMのL-グルタミン(Life Technologies)を有するDMEM(高グルコース)からなる成長培地で標準条件下にて増殖させた。
ヒト骨格筋芽細胞(HSMM、Lonza)を、SkGM-2培地(Lonza)で製造者の指示に従って維持した。最終分化のために、それらが少なくとも80%のコンフルエントになるまで、マトリゲル(Corning)上で培養した後、N2分化培地(1%のN2サプリメント(Life Technologies)及び1%のインスリン-トランスフェリン-セレン(ITS、Life Technologies)を有するDMEM/F12)に7日間切り替えた。
ヒト誘導多能性幹細胞(hiPSC)は、前述のように、STEMCCAカセットで皮膚線維芽細胞から再プログラムした(Karumbayaram et al.,Stem Cells Transl.Med.,2012.1:36-43)。それらをhESC最適化マトリゲル(Corning)上で増殖させ、mTeSR1培地(Stem Cell Technologies)を毎日供給し、0.5mMのEDTAで5~7日ごとに継代した。核型及びFISH解析を、Cell Line Geneticsによって行った。
テラトーマ注入
注入用のhiPSCを調製するため、1~2のコンフルエントウェルを、1mg/mlのコラゲナーゼIV型又は0.5mMのEDTAを用いて収集した。5mlピペットを用いてコロニーを解離し、1000rpmで遠心分離した。細胞ペレットを40μlのハンクス平衡塩類溶液(HBSS)中で再懸濁し、6~8週齢のSCID BEIGEマウス(Charles River)の精巣に前に記載されたように注入した(Alva et al.,Stem Cells,2011.29:1952-1962)。4~8週間後、テラトーマを単離し、4%のパラホルムアルデヒド(PFA)で24時間固定した後、70%のエタノールで固定した。固定したテラトーマを埋め込み、Tissue Procurement Core Laboratory,Department of Pathology and Laboratory Medicine,David Geffen School of Medicine at UCLAniによって処理した。テラトーマが大きい場合、4~6個の四半部を分離し、上述のようにPFAで固定した。腫瘍をヘマトキシリン及びエオシンで染色し、オリンパスBX51顕微鏡で画像化した。
gRNAのトランスフェクション及びヌクレオフェクション
3×105個のHEK293FT細胞を12ウェルごとに播種し、翌日、製造者の指示に従って、3μlのTransIT293(Mirus Bio)を用いて、1μgのDNAで重複してトランスフェクトした。
hiPSCのAmaxa 4D(Lonza)ヌクレオフェクションを、製造者の指示に従って行った。簡単に言えば、hiPSCを、10μMのROCK阻害剤Y-27632(ROCKi、Tocris Bioscience)で1時間前処理し、TryplE(Life Technologies)でトリプシン処理して、単一細胞懸濁液にした。8×105個のhiPSCを、溶液P3、2μg又は3.5μgの総DNA、及びプログラムCA~137(Lonza)を用いて、100μlキュベットごとにヌクレオフェクトした。pMAX GFP(Lonza)は、トランスフェクション対照として使用した。ヌクレオフェクション後、ROCKiでmTeSR1に細胞を直ちに載置した。選択では、mTeSR1中の0.35μg/mlのピューロマイシンを、ヌクレオフェクションの24時間後に細胞に添加した。
クローンhiPSC株の生成
クローン株の生成のために、gRNAのヌクレオフェクションの次の日、44C4及び55C3(pX459中)細胞を、mTeSR1中の0.35μg/mlのピューロマイシンで1日間選択した。細胞をmTeSR1中で7~9日間拡張した後、単一細胞を、FACSAriaソーター(BD)を用いてROCKiで、個別の96ウェルに選別した、又はmTeSR1+ROCKi中の10cm皿ごとに3×105個~5×105個の細胞の低密度で載置した。2週間後、個別のコロニーを対応する48ウェルに解体し、コロニーのサブセットを手で切断し、以下の欠失ジェノタイピングPCRを用いてスクリーニングした。
欠失ジェノタイピングPCR
エクソン45~55欠失が生じたかどうかを判定するため、個別のPCR反応、又は両方のプライマーセットを含むマルチプレックスPCRのいずれかをAccuPrime Taq High Fidelity(Life Technologies)で行った。1つのプライマー対は、欠失領域(del)に隣接し、一対は、欠失領域(undel)内であった。PCR産物を1.2%のアガロースゲル上でランさせ、臭化エチジウム染色で視覚化した。
表4:PCRのプライマー配列(ジェノタイピング)
エクソン45~55欠失後の再結合配列の解析を、製造者の指示、及びLaragen Incによるインサートのシーケンシングに従って、欠失PCR産物をZero Blunt TOPOバックボーン(Life Technologies)にブラントクローニングすることによって行った。
hiPSC由来の骨格筋の分化
hiPSCを、Abujarour et al.(Stem Cells Trans.Med.,2014.3:149-160)を改変して、MyoDの過剰発現によって骨格筋細胞に分化させた。細胞をTryplEでトリプシン処理し、3.5×105個の細胞/6ウェルで、SMC4(基礎培地:20%のノックアウト血清代替(KOSR、Life Technologies)、1%のNEAA、1%のGlutamax(Life Technologies)、100μMのβ-メルカプトエタノール、10ng/mLの塩基性線維芽細胞増殖因子(bFGF、Life Technologies)、SMC4:5μMのROCKiを毎日加えた基礎培地、0.4μMのPD0325901(Sigma-Aldrich)、2μMのSB431542(Tocris Bioscience)、1μMのCHIR99021(Tocris Bioscience)を有するDMEM/F-12)中のマトリゲル上に単一細胞として載置した。おおよそ60~80%のコンフルエントに到達すると、ウェル当たり4μg/mLの硫酸プロタミンとともに0.06μg/mLのタモキシフェン誘導性MyoD-ERTレンチウイルス(Kimura et al.,Hum.Mol.Genet.,2008.17:2507-2517から出典)で感染させて、1250rpmで90分間32℃にてスピン接種した。回復の1日後、SMC4中の2μg/mlのピューロマイシンで2日間選択した。その後、細胞を分割し、おおよそ1×105個の細胞/cm2で、bFGFを有さず、10μMのROCKiを有する基礎培地中でマトリゲル上に載置し、15%のFBS及び5μMのタモキシフェンを有するDMEM中で4日間誘導させた。誘導後、細胞を5%のウマ血清及び1μMのタモキシフェンを有する低グルコースDMEM中で5~7日間分化させた。培地は毎日変えた。
MyoD過剰発現の代替プロトコルを生着に使用した。細胞は、ROCKiを有するmTeSR1中でマトリゲル上に2.5×104個の細胞/cm2で単一細胞として載置した。翌日から開始して、1%のITSを有するDMEM/F12中の3μMのCHIR99021で2日間処理した。細胞は、10%のFBS及び1%のNEAAを有するDMEM中でおおよそ6×104個の細胞/cm2に分割され、上記のようにMyoD-ERTレンチウイルスで感染させた。回復の1日後、細胞を1μg/mlのピューロマイシンで4日間選択した後、15%のFBS、10%のウマ血清(HS)、1%のニワトリ胚抽出液、50μg/mlのアスコルビン酸、4.5mMのモノチオグリセロール、5μMのタモキシフェンを有する5ng/mlのbFGFを含有するIMDM中で2日間誘導させて、下に記載するように生着に使用した。
Shelton et al.(Stem Cell Reports,2014.3:516-529)を改変して、hiPSCの指向分化プロトコルも使用して、SMPCを得た。細胞は、3.75×105個の細胞/6ウェルで、10μMのROCKiを有するmTeSR1中で単一細胞として載置した。翌日、10μMのCHIR99021をEssential 6培地(E6、Stem Cell Technologies)に2日間添加し、E6で12日目まで細胞を分化させた。20ng/mlのbFGFを含有するStemPro(Gibco)を12~20日目の間に添加した。その後、最終分化させるために、細胞をN2培地に切り替えた35日目までE6を添加した。50日目に、細胞を蛍光活性化細胞選別し、神経堤細胞をHNK1-(1:300、Sigma-Aldrich)で除去し、SMPCをBV650-NCAM+(1:25、BD Bioscience)で増強した。SMPCを、N2培地に変えてコンフルエントになるまで拡張培地(20%のFBS、5%のHS、1%のニワトリ胚抽出液、0.5%のペニシリン/ストレプトマイシン)中で7日間培養し、最終分化を誘導させた。
hiPSC由来の心筋細胞の分化
コンフルエントhiPSCを酵素的に解離して、凝集体を形成し、心筋細胞系統に分化させた(例えば、Arshi et al.2013;Minami et al.2012を参照されたい)。培地を、15日目まで2日ごと、及び30日目まで5日ごとに変えた。30日目に、心筋細胞を解析用に採取するか、又は低浸透圧ストレスアッセイを施した。
サーベイヤーアッセイ
異なるgRNAの活性を試験するため、製造者の指示に従って、Quick gDNA mini prepキット(Zymo Research)、又はQuick Extract DNA Extraction Solution 1.0(Epicenter)を用いたトランスフェクション/ヌクレオフェクションの後、第3日又は4日にゲノムDNA(gDNA)を抽出した。サーベイヤーアッセイで使用するPCRは、標的領域に隣接するプライマーと共にAccuPrime Taq High Fidelityで行った
サーベイヤーアッセイ(Integrated DNA Technologies)は、製造者の指示に従って行った。簡単に言えば、最大20μlの1×AccuPrime緩衝液中のおおよそ300ngのPCR産物を変性させて、95℃で10分間加熱し、ゆっくりと段階的に4℃に冷却することによって再アニールした。その後、2μlのMgCl
2、1μlのサーベイヤーエンハンサー、及び1.2μlのサーベイヤー酵素を添加し、42℃で1時間インキュベートした。サーベイヤーキットで提供されるG/Cプラスミドを、ゲルごとに陽性対照として使用した。産物は、6%又は4~20%のTBEポリアクリルアミドゲル(Bio-Rad)上でランし、臭化エチジウム染色で視覚化した。切断のパーセントは、ImageJ(Rasband,ImageJ,U.S.Natl.Institutes Heal.,1997)を用いて決定した。
表5:PCRのプライマー配列(サーベイヤーアッセイ)
低浸透圧ストレスCK放出アッセイ
2連で載置した最終分化した骨格筋細胞及び心筋細胞に、66~240オスモルの範囲の低浸透圧溶液中のインキュベーションによってストレスをかけた。66~240オスモルの範囲の低浸透圧塩溶液を、様々な量のスクロース(約25~175mM)を、5mMのHEPES、5mMのKCl、1mMのMgCl2、5mMのNaCl、1.2mMのCaCl2、1mMのグルコースからなる塩基性塩溶液に添加することによって作製した。オスモル濃度は、Wescor Vapro 5520浸透圧計で測定した。
分化したMyoD OE骨格筋管及び心筋細胞を、試験した条件ごとに、384又は96ウェルプレートに2連で載置した。100μl(又は384ウェルプレートに対して30μl)の低浸透圧溶液を各ウェルに添加し、細胞を37℃で20分間インキュベートした。その後、溶液(上清)を除去し、CK解析まで-80℃で保存した。細胞をトリプシン処理し、凍結/解凍を3回繰り返すことによって100μlのdI水中に溶解した。溶解物をCK解析まで-80℃で保存した。CKは、製造者の指示に従って、クレアチンキナーゼ-SLキット(Sekisui Diagnostics)を用いて、2μl又は8μlの非希釈試料で3連で測定した。あらゆる負の読み取りは、0に強制し、異常値は、解析から無視した。上清へのCK放出のパーセントを決定し、標準誤差は、計算全体を通じて伝播させた。
RNA抽出、cDNA、及びPCR
RNAを、製造者の指示に従って、RNeasyマイクロキット(Qiagen)を用いて、分化心筋細胞から抽出した。cDNA合成は、RT-qPCR(Bio-Rad)のiScript Reverse Transfection Supermixを用いて、50~250ngのRNAで行った。2つのPCR反応を全ての試料で行い、1つは、欠失の内部にプライマーで、1つは、AccuPrime Taqを用いた40サイクルの欠失に隣接するプライマーで行った。PCR産物は、製造者の指示に従って、TOPO-TAクローニングキット(Life Technologies)を用いてクローンし、UCLA GenoSeq Coreで配列決定した。
表6:PCRのプライマー配列(RNA抽出)
miRNA抽出、cDNA、及びddPCR
miRNAを、製造者の指示に従って、マイクロRNA精製キット(Norgen Biotek Corp)を用いて、MyoD OEによって得られた融合した筋管から単離した。cDNA合成は、hsa-miR-31(アッセイID 002279)、及び特異的RTプライマーでU6 snRNA(アッセイID 001973)に対するTaqManマイクロRNAアッセイ(Applied Biosystems)を用いて、TaqManマイクロRNA逆転写キット(Applied Biosystems)によって5μlのmiRNA上で行った。PCR反応物は、試料ごとに重複して、プローブ(UTPを有さない)(Bio-Rad)、及び1.1μlの20×TaqManアッセイプローブに対するddPCRスーパーミックスにおいて、1.46μlのcDNA(U6に対して1:30に希釈、又はmiR31に対して非希釈のいずれか)と共に22μlのプレミックスで調製した。20μlのPCR反応プレミックスは、製造者のプロトコルに従って使用して、液滴を生成した。簡潔に言えば、PCRプレミックスを70μlの油と共に液滴発生器カートリッジに添加し、液滴をQX200液滴発生器(Bio-Rad)で生成した。40μlの反応混合物をPCRプレートに移し、95℃で10分間、95℃で15秒間を40サイクル、60℃で60秒間、その後、98℃で10分間をT100サーマルサイクラー(Bio-Rad)でランした。無テンプレート対照を、PCR反応ごとに含めた。FAM蛍光を、QX200液滴リーダー及びQuantaSoftソフトウェア(Bio-Rad)を用いて評価した。miR31の陽性液滴のパーセントを、U6の陽性液滴のパーセントに正規化した。標準偏差誤差は、計算全体を通じて伝播させた。全ての株をCDMD 1002野生型に正規化した。
免疫不全マウスへの生着
NOD scid IL2Rγ(NSG)免疫不全マウス(Jackson Laboratory)をmdx scidマウス(Jackson Laboratory)に交配させて、NSG-mdxマウスを生成した。上を参照されたい。生着の24時間前に、5~7週齢のNSG-mdxマウスの右の前脛骨筋(TA)を50μlの10μM心臓毒素(Sigma-Aldrich)で前処理した。MyoD OE細胞の場合、100μLの5mg/mlタモキシフェン(Sigma-Aldrich)も5日間IP注入し、生着の1日前にタモキシフェンで前処理した(Muir et al.,Mol.Ther.Methods Clin.Dev.,2014.1:14025)。誘導後にMyoD OEから得られた1×106個の細胞をペレット化し、5μLのHBSS中に再懸濁し、TAに筋肉内注射した。組織を30日後に採取し、後述のように解析した。生着は、ラミンA/C及びスペクトリンの両方が陽性であったヒト細胞が特定された場合に成功したと見なされた。生着の成功は、以下に見られた:CDMD1002 N=4/4生着に成功、CDMD1003 N=1/1生着に成功、及びCDMD1003-49 N=1/2生着に成功。
免疫染色
hiPSCを4%のPFAで20分間固定し、0.3%のTriton Xで10分間透過処理し、10%のヤギ血清で1時間遮断した。SOX2(1:200、細胞シグナル伝達)及びNANOG(1:800、細胞シグナル伝達)に対する一次抗体を1%のヤギ血清及び0.1%のTriton Xに一晩4℃で添加した後、二次抗体を翌日2時間添加した。
MyoD過剰発現から得られた分化骨格筋管を80%のアセトンで7分間-20℃にて固定し、10%のヤギ血清で1時間遮断し、上記のようにジストロフィン(1:300、Abcam)及びミオシン重鎖(1.9μg/ml、MF20、DHSB)で染色した。50日間の指向分化プロトコルから得られた分化した心筋細胞及び骨格筋管を4%PFAで20分間固定し、0.3%のTriton Xで10分間透過し、10%のヤギ血清で1時間遮断し、ジストロフィン(1:5、MANDYS106、MDA Monoclonal Antibody Resource、(Man and Morris,Am.J.Hum.Genet.,1993.52:1057-1066))、又はβ-ストログリカン(1:100、Leica Biosystems)、及びミオシン重鎖(1.9μg/ml、MF20、DHSB)で染色した。画像は、Axio Observer Z1顕微鏡(Zeiss)で得た。
採取したTA筋肉をイソペンタンで急速冷凍した。10μmの凍結切片を、筋肉全体を通じて一定間隔で得て、-20℃で保存した。染色の場合、0.25%のゼラチン、0.1%のTween、3%のウシ血清アルブミンで1時間遮断した。M.O.M.ブロッキングキット(Vector Laboratories)を、製造者の指示に従って適用した。ヒトラミンA/C(1:125、Vector Laboratories)、ヒトスペクトリン(1:75、Leica Biosystems)、ヒトジストロフィン(1:5、MANDYS106)、ラミニン(1:200、Sigma-Aldrich)、ジストロフィン(1:75、Abcam)、及びβ-ストログリカン(1:50、Leica Biosystems)からなる一次抗体を4℃で一晩適用した。翌日、二次抗体を1時間インキュベートし、スライドをDAPI(Vector Laboratories)を含有するVECTASHIELDに取り付けて、Axio Observer Z1顕微鏡で画像化した。
ウェスタンブロット解析
最終分化した骨格筋細胞及び心筋細胞をトリプシン処理し、ペレット化し、液体窒素で急速冷凍した。細胞ペレットを溶解するまで液体窒素で保存した。ウェスタンブロッティングでは、試料は、わずかに改変して、Woo et al.(Exp.Mol.Med.,2010.42:614-627)に記載されたように調製した。簡単に言えば、細胞を10cm培養皿ごとに500μlの溶解緩衝液(10mMのTris-HCl(pH 7.4)、1%のTriton X-100、10%のグリセロール、150mMのNaCl、5mMのEDTA、及びHALTプロテアーゼ及びホスファターゼ阻害剤カクテル(rmoScientific))で可溶化した後、穏やかに回転しながら4℃で30分間インキュベーションした。その後、溶解物を100μlの6×RSBと混合し、注射針を数回通過させて、粘度を低下させた。その後、試料を3分間沸騰させ、氷上で冷却し、注射針を再び通過させて、13,000gで5分間遠心分離した。清澄化した溶解液を新しいチューブに移し、小分けし、使用するまで-80℃で保存した。ジストロフィン及びMyHC含有量を評価するため、細胞溶解物に、6%のポリアクリルアミドゲル電気泳動(PAGE)を定電流(10mA/ゲル)で3時間施した後、ニトロセルロース膜に定電圧で(100V)2.5時間氷上でブロッティングした。0.1%のドデシル硫酸ナトリウム(SDS)及び10mMのジチオトレイトール(DTT)を転写緩衝液に添加し、高分子タンパク質をブロッティングしやすくした。イムノブロットアッセイを、マウス抗MyHC(1:1,000、MF20、DHSB)及びマウス抗ジストロフィン(1:500、Mandys8、Sigma-Aldrich)抗体で実施した。使用した二次抗体は、Sigma-Aldrichからの抗マウスペルオキシダーゼコンジュゲート(1:10,000)であった。ChemiGlow West化学発光検出キット(ProteinSimple)を用いてブロットを現像した。シグナルは、FluorChem FC2デジタルイメージングシステム(Alpha Innotech)によって登録した。
β-ジストログリカンについて、7.5%のPAGEゲルを100Vで1.5時間ランした。移入は、20%のMetOHと共にTris/グリシンで、100Vで1時間15分間行った。イムノブロッティングは、上記のように、マウス抗β-ジストログリカン(1:200、MANDAG2(7D11)、DHSB)及びMyHC抗体で行った。
オフターゲット解析
使用したgRNAごとの上位10個の固有のオフターゲット部位(44C4及び55C3)は、以下の基準を用いて、COSMID(Cradick et al.,Mol.Ther.Nucleic Acids,2014.3:e214)で決定した:NRG PAM、インデル無しで3つのミスマッチ、及び1つの塩基欠失又は挿入を有する2つのミスマッチ。潜在的なオフターゲット位置に対応するアクセスアレイプライマーはFluidigmが設計し、製造し、検証した。親及び欠失クローン株から抽出したgDNAをアクセスアレイ(Fluidigm)でランし、UCLA GenoSeq CoreにおけるMiSeqで配列決定した。読み取りをTrimmomaticでトリミングし、BWAを用いてゲノムに整列した。ベースクオリティスコアの再較正及びインデル再整列は、GATKを用いて行い、SNPコーリングは、20bpのgRNA相同領域上で2つの別々のプログラムであるGATK及びLoFreqを用いて行った。真の誘発突然変異は、所与の変異体による読み込みの割合がベースコーリングの誤差率よりも実質的に高い場合に可能であると見なした。
表7:COSMIDによって判断された上位の可能性のあるオフターゲット部位
統計解析
統計解析は、2群のデータに対して両側t検定を用いて行った。まず、F検定を用いて、分散が等しいか又は等しくないかを判定し、次いで対応するt検定を用いた。有意性は、0.05未満のp値によって判定した。
実施例1:大多数のDMD患者を標的にする単一CRISPR-Cas9欠失戦略は、hiPSC由来の筋細胞におけるジストロフィン機能を回復する
DMDの突然変異は、リーディングフレームを破壊し、ジストロフィン翻訳を妨げ、デュシェンヌ型筋ジストロフィー(DMD)を引き起こす。60%のDMD患者突然変異に適用可能なCRISPR/Cas9プラットフォームについて記載する。プラットフォームは、DMD由来のhiPSCに適用され、最大725kbの欠失及び非相同末端結合の成功が、DMD遺伝子を再構成した。hiPSCの使用により、疾患関連の細胞型におけるジストロフィンを評価することができた。フレーム再構成されたhiPSCクローン株由来の心筋細胞及び骨格筋筋管は、ジストロフィンタンパク質を回復した。内部欠失ジストロフィンは、ジストロフィン糖タンパク質複合体のインビトロ及びインビボでの膜完全性及び回復の改善によって実証されたように機能的であった。さらに、miR31は、フレーム再構成する際に減少し、これは、ベッカー型筋ジストロフィーにおける観察と類似であった。
DMD hiPSC株は、多能性であり、遺伝的に安定である
野生型及びDMD患者の線維芽細胞由来の、生体異物を含まないいくつかのhiPSC株を、医薬品適正製造基準プロトコルを用いて開発した。各DMD hiPSC株は、エクソン45~55のホットスポット領域内に固有のフレームシフトDMD突然変異を含む。全てのhiPSC株(Center for Duchenne Muscular Dystrophy(CDMD)1003、1006、及び1008)は、多能性マーカー(NANOG及びSOX2)を発現し、核型が正常である(図1A及び図1B)。CDMD hiPSCは、3つ全ての胚葉(図1C)を表すテラトーマをインビボで形成し、かつ、各々が固有の突然変異(図1D)を含むように、多能性を維持する。
図1:CDMD hiPSCは、多能性かつ遺伝的に安定である。図1A。CDMD hiPSCは、DMD線維芽細胞から生成された。明視野像は、hiPSCへの再プログラムの前後の線維芽細胞を示す。免疫細胞化学染色により、細胞が多能性マーカーNANOG(緑色)及びSOX2(赤色)を発現することが明らかになる。スケールバー:100μm。図1B。全ての株の核型分析を示す。図1C。CDMD hiPSCをマウスに注入して、インビボでのテラトーマ形成を試験した。3つの胚葉(内胚葉、中胚葉、及び外胚葉)の代表的なヘマトキシリン及びエオシン染色を示す。図1D。各CDMD hiPSC株の患者突然変異を示す。さらに、NHEJの成功に必要なエクソン数及び近似距離が、患者の原因となる突然変異サイズの比較ゲノムハイブリダイゼーションデータに基づいて示される。
DMD遺伝子におけるCRISPR/Cas9介在欠失及び最大725kbのNHEJ
DMDのエクソン45~55を欠失するために、gRNAを、イントロン44及び55を標的にするように設計した。gRNA部位は、隣接するエクソン(44及び56)のそれぞれに隣接する約500bpのイントロンのみを保持するように選択した。この設計の理論的根拠は、できる限り多くの患者突然変異に適用可能なgRNAを開発し、小さな機能的キメライントロンの生成を保証するためであった。NHEJ中に、イントロン44の3’末端とイントロン55の5’末端は結合して、約1kbのキメライントロン(図2A)を生成する。このようにして生成されたイントロンは、機能的であり、正しくスプライスされて、エクソン44がエクソン56と結合したインフレーム転写産物を作成することが予想される。
図2:エクソン45~55欠失を有する、安定した多能性のCDMD hiPSC株の生成。図2A。イントロン44及び55(稲妻)に特異的なgRNAを用いてCRISPR/Cas9介在欠失を標的としたDMDの領域のイラスト(正確な縮尺ではない)を示す。NHEJの成功により、エクソン45~55が欠失し、この領域内の突然変異に対するリーディングフレームが回復される。異なる欠失サイズが、患者の原因となる突然変異(黒色の矢頭)に応じて必要である。図2B。それぞれ親株CDMD1006及び1003由来の117及び109単一細胞クローンのPCRジェノタイピングを、gRNA 44C4及び55C3でヌクレオフェクトした細胞で実施した。CDMD 1006(CDMD1006-1)由来の1つのクローン、及びCDMD1003(CDMD1003-49、1003-57、1003-81)由来の3つのクローンは、安定した欠失として同定された。6つのhiPSCクローン株に対する欠失PCRジェノタイピング結果を示す。一対のプライマー(Aで赤色の矢印)は、欠失の内部に位置し、非欠失クローンCDMD1003-13及び1003-51において1201bpバンドのみを生成した。別のプライマーセット(Aで紫色の矢印)は、欠失領域に隣接し、再構成されたクローンCDMD1006-1、1003-49、1003-57、1003-81と同様に、欠失及びNHEJが正常に発生した場合にのみ、788bpバンドを生成した。図2C。各クローン株は、正常な形態(明視野)を維持し、免疫細胞化学によってNANOG(緑色)及びSOX2(赤色)を発現した。スケールバー:100μm。右に示すものは、イントロン44(I44)と55(I55)の間の再結合部位でのgDNAの配列である。配列決定により、CDMD1006-1における16bp欠失、CDMD1003-49における2bp挿入、CDMD1003-57及びCDMD1003-81における1bpの挿入が明らかになった。
hiPSCは遺伝的に操作するのが難しいので、ヒト胚腎臓(HEK)293FT細胞を使用して、各イントロン領域で5つのgRNAをスクリーニングした。全てのgRNAは、最大で34%のサーベイヤーアッセイでの個別の切断活性を示した(図3A及び図3B)。多重PCRを用いて、対でトランスフェクトしたgRNAは、エクソン45~55を包含する708kb領域全体を効率的に欠失することを示した(図3C及び図3D)。
図3:293FT細胞におけるgRNA活性及びエクソン45~55欠失。図3A~3B。イントロン44及び55にそれぞれ標的化される5つのgRNAは、HEK293FT細胞におけるサーベイヤーアッセイの活性を示す。赤色の矢印は、切断産物の期待バンドを示す(表8)。Aにおいて、青色の矢頭で強調されるバンドは、非特異的PCR産物の可能性があり、解析から無視したことに留意されたい。切断の推定パーセントを下の各レーンに示す。陽性対照(pos)は、サーベイヤーキットで提供される。100bpのラダーを使用した。図3C。CRISPR対に標的化されるDNAの領域を強調し、PCRに使用したプライマーを示す略図。CRISPR gRNA部位を稲妻で示す。イントロン44及び55に標的化されるgRNA対を共トランスフェクションする場合、エクソン45~55欠失(約708kb)が、NHEJ後に得られる。この欠失は、多重PCRを用いて測定され、ここで、赤色で示すプライマー対は、非欠失産物を増幅する一方、欠失領域に隣接する紫色のプライマー対は、再結合が成功した場合にのみ産物をもたらす。図3D。図3Cに示すプライマーを用いたマルチプレックスPCRの例であり、エクソン45~55の効果的な欠失は、293FT細胞で試験した全てのgRNA対で達成された。100bpのラダーを使用した。
表8:サーベイヤーアッセイからの切断産物の期待サイズ
異なる患者突然変異にわたるエクソン45~55欠失の実現可能性を評価するために、gRNAを3つのDMD hiPSC株に適用した。株(CDMD1003、1006、1008)は、DMDの欠失及びNHEJの成功のために、それぞれ、約530kb、670kb、又は725kbを必要とした。使用したgRNAは、3つ全ての株で活性であることを示し、エクソン45~55を効果的に欠失した(図4及び図5)。CRISPRプラスミドでヌクレオフェクトした細胞の一過性のピューロマイシン選択は、CDMD1003及び1006 hiPSCにおける欠失の効率を改善させた(図5D)。
図4:gRNAは、CDMD hiPSCにおけるサーベイヤーアッセイによる切断を示す。図4A。GFPでヌクレオフェクトしたCDMD1006 hiPSCは、未処理対照として機能し、約40%のトランスフェクション効率を示す。図4B~図4D。gRNAは、CDMD1003、1006、及び1008株のそれぞれにおけるサーベイヤーアッセイの活性を示す。*3×量の55C3 DNAをヌクレオフェクション中に添加した。赤色の矢印は、切断産物の期待バンドを示す(表8)。青色の矢頭で強調される図4Bのバンドは、非特異的PCR産物の可能性があり、解析から無視したことに留意されたい。切断の推定パーセントを下の各レーンに示す。100bpのラダーを使用した。
図5:対合gRNAのヌクレオフェクションは、CDMD hiPSCにおいてエクソン45~55欠失をもたらす。図5A。欠失領域に隣接するプライマーを用いるPCRは、hiPSC CDMD1006における種々のCRISPR対のヌクレオフェクション後の欠失及び再結合が成功したバンドを示す。100bpのラダーを使用した。図5B。シーケンシング後に特定された異なる再結合産物の種類の例。図5C。44C4+55C3*のシームレスな再結合の配列決定を示す。図5D。多重PCRは、44C4及び55C3 gRNAでヌクレオフェクトした全ての株におけるエクソン45~55欠失産物を示す。1日間の0.35μg/mlのピューロマイシンで選択後のCDMD1006及び1003における欠失効率の有意な増加を示す。*3×量の55C3 DNAをヌクレオフェクション中に添加した。100bpのラダーを使用した。
クローンのフレーム再構成されたDMD hiPSC株は、候補部位でオフターゲット活性を含まない
安定欠失DMD hiPSC株を、gRNA対44C4及び55C3でヌクレオフェクション後のクローン選択によってCDMD1003及び1006から生成され(図2B及び図2C)、多能性である(図2C及び図6B)。全てのフレーム再構成された株は、1つのクローン(CDMD1003-81)を除いて核型が正常であり、その1つのクローンは、FISH解析後に確認された1q32増幅を含むことが判明し(図6A)、それは、元の親株及びpost-hoc解析後の全ての娘クローンでも観察された。1q32増幅は、培養中の拡大増殖後のhPSCで一般的であるため(Dekel-Naftali et al.,Eur.J.Hum.Genet.,2012.20:1248-1255)、CRISPR介在のオフターゲット活性の結果ではなかった。gRNAのオフターゲット活性を判断するため、上位10個の相同部位/ガイドをCOSMIDによって決定し(Cradick et al.,Mol.Ther.Nucleic Acids,2014.3:e214)、全てのクローン及び親株で配列決定した。オフターゲット突然変異は、いかなる部位でも観察されなかった。染色体11におけるヘテロ接合SNP以外の、全ての変異体が、読み取りの1%未満で検出され、これは、シーケンシング法における誤差と一致している。
図6:再構成された株のさらなる特徴付け。図6A。全てのフレーム再構成された株は、FISH解析を介して1q32増幅を含むことが判明したCDMD1003-81を除いて核型が正常であると判断された。遡及的解析の際に、1q32増幅は、親株(22%でCDMD1003株)で存在していたと判定され、全ての娘株(82.5%でCDMD1003-57及び1003-49)で見られ、CRISPR活性の結果ではなかった。図6B。フレーム再構成された株CDMD1006-1、1003-49、1003-57、及び1003-81は、3つの胚葉からなるテラトーマをインビボで形成した。図6C。フレーム再構成された株由来のmRNAの解析。hiPSC由来の心筋細胞からのジストロフィンcDNAの欠失領域内のプライマー(赤色の矢印)又は欠失領域に隣接するプライマー(紫色の矢印)を用いたPCRは、CDMD1002と1006の両方における非欠失バンド、及びCDMD1006-1と1003-49の両方における欠失バンドを示す。100bpのラダーを使用した。図6D。配列決定により、フレーム再構成されたCDMD1006-1及び1003-49におけるエクソン44及び56の再結合が確認される。図6E。240オスモルを下回る低浸透圧条件に暴露されたhiPSC由来の心筋細胞のCK放出アッセイからのデータのグラフ。図4Aと同様の同じCDMD1002対照データを示す。データは、平均±標準誤差として示す。図6F。CK放出アッセイデータは、アウトオブフレーム細胞に正規化され、示された全ての実験(アウトオブフレーム及び再構成に対してn=6(再構成された135オスモルに対してn=5)、野生型に対してn=4)からプールした。データは、平均±標準誤差として示す。
ジストロフィン(DYSΔ45-55)発現は、フレーム再構成されたDMD hiPSC由来の心筋細胞及び骨格筋管において回復される
DMDのCRISPR/Cas9介在欠失により、エクソン45~55を欠いている内部欠失ジストロフィンタンパク質(DYSΔ45-55と以下で称される)が得られるはずである。hiPSCはジストロフィンを発現しないため、フレーム再構成されたDMD hiPSCクローン株を、MyoDの指向分化又は過剰発現を用いて、2つの疾患関連細胞型、心筋細胞と骨格筋筋管に分化させて、DYSΔ45-55の救済を評価した。フレーム再構成された心筋細胞クローンからのcDNAにおけるエクソン44/56境界のPCR及び配列決定により、ジストロフィン転写産物の正しいスプライシングが示された(図6C及び図6D)。さらに、フレーム再構成された心臓細胞株及び骨格筋細胞株の両方は、免疫細胞化学及びウェスタンブロットによって評価されたようにジストロフィン発現を回復させた(図7A~図7C)。野生型CDMD1002又はヒト骨格筋筋管(HSMM)と比較して、バンドは、予想された通り、約66kDaで切り捨てられた。
図7:フレーム再構成されたCDMD hiPSC由来の骨格筋及び心筋細胞は、ジストロフィン発現を回復する。図7A。指向分化によるhiPSC由来の野生型(CDMD1002)、フレーム外(CDMD1003、1006)、又はフレーム再構成(CDMD1003-49、1006-1)の心筋細胞のヒトミオシン重鎖(MyHC、赤色)及びジストロフィン(緑色)の免疫細胞化学染色。挿入図は、ホワイトボックスによって画定される領域の拡大図を示す。スケールバー:50μm。図7B。hiPSC由来の野生型(CDMD1002)、フレーム外(CDMD1006)、又はフレーム再構成(CDMD1006-1、1003-49)の骨格筋筋管のMyHC(赤色)及びジストロフィン(緑色)の免疫細胞化学染色。筋管は、MyoD過剰発現(OE)後に融合させた、又は適応指向分化50日プロトコル後の選別されたNCAM+細胞由来であった。挿入図は、白い枠によって画定される領域の拡大図を示す。スケールバー:100μm。図7C。抗ジストロフィンでプローブした細胞抽出物のウェスタンブロットを。抽出物は、CDMD hiPSCから誘導された、フレーム外及びフレーム再構成された心筋細胞(左)、及び骨格筋筋管(右)からであった。野生型(wt)のhiPSC(CDMD1002)又はヒト骨格筋筋管(HSMM)は、ジストロフィンの対照として使用した。エクソン45~55欠失(1779bp、約66kDa)によって引き起こされる分子量のシフトは、野生型ジストロフィン(矢印)に対してフレーム再構成ジストロフィンで明らかである。220kDaあたりの非特異的バンドが、いくつかの試料で見られた。試料は、ローティング対照として抗MyHCでもプローブした(下パネル)。
DYSΔ45-55タンパク質は、インビトロで、心筋細胞及び骨格筋管へ膜機能性を回復させる
ジストロフィンを欠いている心筋細胞又は骨格筋管は、ヒト患者で見られるように(Pearce et al.,J.Neurol.Neurosurg.Psychiatry、1964.27:181-185)、インビトロでの膜脆弱性を示し、CKのレベル上昇を放出することによって浸透圧ストレスに応答する(Guan et al.,Stem Cell Res.,2014.12:467-480、Menke and Jockusch,J.Cell Sci.,1995.108:727-733)。DYSΔ45-55がジストロフィー細胞膜への安定性を回復できたかどうかを判定するため、フレーム再構成及びフレーム外hiPSC由来の分化した心筋細胞及び骨格筋筋管を低浸透圧条件に供した。低浸透圧溶液(66~240オスモル)中でインキュベーションにより細胞にストレスを与え、上清へのCK放出を測定して、ジストロフィン回復後の機能的改善を示した。フレーム再構成されたCDMD1003-49の心筋細胞及び骨格筋細胞の両方は、野生型(CDMD1002)と同様に、フレーム外のCDMD1003細胞においてと比較して、CK放出の低下を示し、DYSΔ45-55が膜脆弱性を低下できることを示した(図8A)。同じ傾向は、CDMD1006/1006-1心筋細胞でも観察された(図6E)。全ての実験を正規化し、プールした後、大幅に少ないCKが、フレーム外と比較して、再構成及び野生型の細胞において、93、135、及び240オスモルで放出されることが観察された(図6F)。
図8:フレーム再構成されたhiPSC由来の心筋細胞及び骨格筋細胞は、インビトロ及びインビボでの回復された機能を示す。図8A。低浸透圧条件に暴露された細胞からのCK放出アッセイの代表的なグラフ。hiPSC由来の心筋細胞及び骨格筋筋管を240オスモルを下回る様々なオスモル濃度に供し、上清へのCK放出を、膜脆弱性の指標として測定した。データは、平均±標準誤差として示す。図8B。miR31の発現の倍数変化を、MyoD OEにより、フレーム外又はフレーム再構成されたhiPSCに由来する筋管におけるddPCRによって測定され、野生型(CDMD1002)に正規化した。データは、平均±標準誤差として示す。図8C。細胞抽出物のウェスタンブロットは、抗β-ジストログリカンでプローブした。抽出物は、MyoD OEによって得られたフレーム外及びフレーム再構成された骨格筋筋管からであった。HSMMを、陽性対照として使用した。試料は、ローティング対照として抗MyHCでもプローブした(下パネル)。図8D。野生型(CDMD1002)、フレーム外(CDMD1006)、又はフレーム再構成(CDMD1006-1)骨格筋筋管におけるMyHC(赤色)、及びβ-ジストログリカン(緑色)、DGC成分の免疫細胞化学染色。挿入図は、白い枠によって画定される領域の拡大図を示す。スケールバー:50μm。図8E。NSG-mdxマウスのTAに移植した野生型(CDMD1002)、フレーム外(CDMD1003)、及びフレーム再構成(CDMD1003-49)MyoD OE細胞におけるヒトジストロフィン回復の評価。移植したヒト細胞は、ヒトスペクトリン及びラミンA/C(赤色で示す)の同時免疫染色によって特定された。ヒトジストロフィンの陽性染色は、緑色で示し、全ての繊維は、ラミニン(灰色)を用いて示す。全ての切片をDAPI(青色)で染色し、核を特定した。スケールバー:100μm。図8F。NSG-mdxマウスのTAに移植した野生型(CDMD1002)、フレーム外(CDMD1003)、及びフレーム再構成(CDMD1003-49)MyoD OE細胞からのヒト繊維におけるβ-ジストログリカン回復の評価。移植したヒト細胞は、ヒトスペクトリン及びラミンA/C(赤色で示す)の同時免疫染色によって特定された。ジストロフィンの陽性染色は、灰色で示し、β-ジストログリカンは、緑色で示す。全ての切片をDAPI(青色)で染色し、核を特定した。細胞の順序は、図8Eに記載のものと同じである。スケールバー:20μm。
CRISPR/Cas9フレーム再構成は、インビトロでの骨格筋管におけるmiR31レベルと相関している
miR31のレベル上昇は、野生型又はBMDと比較して、DMD患者生検で観察されている(Cacchiarelli et al.,EMBO Rep.,2011。12:136-141)。miR31のレベルは、フレーム外及びフレーム再構成されたCDMD hiPSCの骨格筋管への分化後に、液滴デジタルPCR(ddPCR)を用いて測定した。DMDのフレーム再構成は、ヒトジストロフィン異常症で観察されるように、アウトオブフレームDMDと比較して、(野生型細胞と同様に)miR31のレベルを低下させた(図8B)。従って、DMD遺伝子のフレーム再構成は、BMDと同様にmiR31レベルを正常にし、ジストロフィー表現型のBMD表現型への機能的救済を示した。
DYSΔ45-55タンパク質は、DGCをインビトロ及びインビボで回復する
第3のDYSΔ45-55機能性アッセイとして、DGCをインビトロ及びインビボで回復するその能力について評価した。DGCメンバーであるβ-ジストログリカンは、免疫染色及びウェスタンブロットによる骨格筋へのインビトロ指向分化後に、フレーム再構成されたhiPSCの膜で回復、検出されたが、フレーム外hiPSCでは回復、検出されなかった(図8C及び図8D)。さらに、野生型(CDMD1002)、フレーム外(CDMD1003)、又はフレーム再構成(CDMD1003-49)hiPSC株由来の骨格筋細胞をNSG-mdxマウスの前脛骨筋に注入した。正しく局在化されたジストロフィン及びβ-ジストログリカンは、フレーム再構成株又は野生型株(図8E及び図8F)からの移植ヒト細胞(ヒトのラミンA/C及びスペクトリンによって分画)でのみ観察された。これらの試験は、低浸透圧ストレスアッセイと共に、DYSΔ45-55がDGCを機能的に組み立て直し、インビトロ及びインビボでの膜安定性を回復する能力を実証する。
実施例2:CRISPRプラットフォームのインビボエレクトロポレーションは、hDMDマウスにおけるエクソン45~55欠失をもたらす
hDMDマウスをCRISPRプラットフォームで電気穿孔し、エクソン45~55の欠失が得られた。
図9:図9A。1つのFDB筋肉にGFPプラスミドで電気穿孔したhDMDマウスは、通常光(上)又はUV(下)光での発現を示した。図9B。gRNA 44C4及び55C3を含有するCRISPRプラスミドで電気穿孔したhDMDマウスのFDB筋肉から採取されたゲノムDNAの多重PCRは、1頭のマウス(*)において欠失PCR産物を示した。図9C。再結合領域の配列決定により、効果的なエクソン45~55欠失が確認され、イントロン44(I44)及び55(I55)境界での1bp挿入が明らかになった。
インビボエレクトロポレーションは、以下のように実施した。8週齢のhDMDマウス(‘t Hoen et al.(2008)J.Biol.Chem.283:5899)に、対照として23μgのpmax GFPプラスミド、又は28μgのpx330プラスミドDNAで電気穿孔し、後者の半分は、ガイド配列44C4を含有し、半分は、ガイド配列55C3を含有した。まず、5μlのヒアルロニダーゼを短指屈筋(FDB)筋肉に注入した。ヒアルロニダーゼ処理の1時間後、プラスミドDNAをFDB筋肉に注入して、20ミリ秒間100Vで20回電気穿孔した。注入及びエレクトロポレーションの10日後、FDB筋肉を採取し、プロテイナーゼKで消化し、Quick gDNA Mini Prep Kit(Zymo)を用いて消化筋肉からゲノムDNAを単離した。
実施例3:種々のガイドRNA対が、ゲノム欠失の成功のために使用された
図10は、試験したガイドRNA(例えば、表2、図23を参照されたい)、及び期待欠失サイズ(「総欠失距離」)の概略図を示す。図11は、293T細胞において種々のガイドRNA対でのゲノム欠失の成功を示すゲルを示す。図12は、293T細胞において種々のガイドRNA対でのゲノム欠失の成功を示すゲルを示す。図13は、iPSC細胞において種々のガイドRNA対でのゲノム欠失の成功を示すゲルを示す。図14は、iPSC細胞において種々のガイドRNA対をでのゲノム欠失の成功を示すゲルを示す。図15は、iPSC細胞において種々のガイドRNA対でのゲノム欠失の成功を示すゲルを示す。図16は、iPSC細胞において種々のガイドRNA対でのゲノム欠失の成功を示すゲルを示す。図17は、ガイドRNA対でのゲノム欠失の成功を示すゲルを示す。図18は、ガイドRNA対でのゲノム欠失の成功を示すゲルを示す。
ガイドRNAのさらなるガイド配列(及び標的配列)を図24(表9)に提供する。図19は、HEK293FT細胞における単一ガイド切断活性の活性を提供する。図20は、「44」シリーズのガイドRNAに対するサーベーヤーデータを提供する。図21は、「55」シリーズのガイドRNAとの組み合わせた、「44」シリーズのガイドRNAに対するゲノム欠失データを提供する。図22Aは、「55」シリーズのガイドRNAに対するサーベーヤーデータを提供する。図22Bは、「55」ガイドRNAと「44」ガイドRNAの組み合わせ、具体的には:1)44C4+55C3、及び2)44C4+55C8dに対するゲノム欠失データを提供する。
本発明をその特定の実施形態を参照して説明したが、本発明の真の精神及び範囲から逸脱することなく、様々な変更がなされてよく、等価物が置換されてよいことは、当業者によって理解されるべきである。さらに、特定の状況、材料、物質の組成、プロセス、プロセスの1つ又は複数のステップを、本発明の目的、精神及び範囲に適合させるために、多くの修正を行ってよい。そのような修正は全て、本明細書に添付の特許請求の範囲に含まれることが意図される。