明 細 書
mRNA試料からの c DNAの合成方法
技術分野
本発明は、 mRNA試料からの c DN Aの合成方法及びそれに用いられる夕バ コ酸性ピロホスファターゼに関し、 特に、 mRNAの 5' _末端由来の塩基配列を 解析するために、 試料中の mRNAの 5'-末端部分を含む c DNAを迅速に合成 する方法に関するものである。
背景技術
細胞を作っているタンパク質は、 細胞の形作りに関連するタンパク質、 発生に 関連するタンパク質或いは代謝に関連するタンパク質など多数存在し、 その存在 のパターンによって、 細胞の性質が決定されると行っても過言ではない。 これら の存在様式、 機能等に関する基本的な情報は、 細胞中の遺伝子に刻まれており、 そのコピーである mRNAにより具現される。 mRNAは、 タンパク質へ翻訳さ れる铸型となり、 DN Aからタンパク質への情報の流れの橋渡し役として働き、 最終的に生物全ての 「表現型」 を反映する。 これらのタンパク質が生理活性物質 であれば、 医薬、 診断薬更にはバイオセンサー、 バイオリアクターへの応用が考 えられ、 産業上重要である。 従って、 mRNAの完全長を得ること、 更にその遺 伝子情報を読みとることは重要である。 近年の遺伝子組換え技術の進展、 最近の ゲノム解析プロジェク卜の推進は、 c DN Aクローニング及び解析技術を容易に ならしめつつある。
しかしながら、 mRNAの、 完全な 5'-末端配列を迅速に解析するニーズは、 最近増加しているものの、 これを容易且つ迅速に行う技術は未だ確立されていな レ 完全長 mRNAの 5' -末端配列には、 ゲノム上での遺伝子発現解析における 転写開始点が含まれることから、 5'-末端配列の迅速な解析は、 膨大なゲノム配 列決定と相まって、 転写遺伝子のマッピングを可能とする道を拓く。 更に、 mR N Aの正確な 5'-末端配列情報は、 上流に存在する遺伝子発現調節プロモ一夕配 列を同定することを可能にする。 これらプロモーターは、 遺伝子を、 いつ、 どこ で、 どのくらい発現させるかという調節を司るシス因子であり、 mRNAの 5'- 末端配列が検出されれば、 その上流のプロモーター配列が機能しているというこ
とを証明することになり、 疾患の原因究明、 或いは診断、 治療の新しい可能性を 拓くものである。
実際には、 疾患の原因究明、 或いは、 治療、 診断するときに、 遺伝子がいつ、 どこで、 どのくらい発現するかという情報は、 大変貴重な情報であり、 この情報 を得ることが、 現在、 国際的に推進しているヒトゲノムプロジェクトでも大きな 目的の 1つになっている。 このプロジェクトでは、 生物ゲノムの塩基配列を解読 するというのが最終目標であり、 すでに、 細菌ゲノムのいくつかと出芽酵母の全 ゲノム上の塩基配列の解読は報告されている。 しかし、 明らかにされたゲノム上 に、 多くの遺伝子が同定されているものの、 そのほとんどは、 機能不明のままで あり、 今後の大きな課題となりつつある。 その意味で、 細胞中での遺伝子発現動 態の反映である c DNA解析の重要性は、 ますます高くなつている。
ところで、 c DNAは、 相補 DNAとも呼ばれ、 mRNAを铸型にして、 逆転 写酵素を用いて合成される DNAのことである。 即ち、 タンパク質のアミノ酸配 列情報をコードしている mRN Aの情報を c D N Aとして合成し解析すれば、 夕 ンパク質の 1次構造は容易に決定されるし、 大量発現系の開発も容易となり、 産 業上、 非常に重要になっている。
そして、 この c DN Aクロ一ニング技術の最終的な理想的な到達点は、 発現さ れている mRNAの全てを、 完全な c DNAに置き換えることであり、 その情報 は、 大変貴重なものとなる。 即ち、 このような完全長 c DNAから得られる情報 は、 転写開始点の情報を始めとし、 発現されるタンパク質に関する情報の全てを 含むためゲノム上の情報を知るための出発点となる。 完全なコ一ディング配列か ら得られるタンパク質の 1次配列は、 機能解析の所要時間を飛躍的に短縮する。 しかしながら、 完全長 mRNAを含む c DNAを得ることは、 急激に進歩して きた DNA技術の中では、 「取り残された」 未だ未成熟な技術であるといえる。 例えば、 これまで広く用いられてきた c DN A合成方法の一つは、 Gubler- Hoffm an法(Gene, 25:236- 269 (1983))がある。 しかし、 この方法で合成した c D N Aは 、 多くは完全なものではなく、 末端が欠失した c DN Aでしかないことが多い。 一方、 Okayama- Berg法(Mol.Cell.Biol., 2:16卜 170 (1982))は、 完全長 c DNAが 得られやすいという特徴を持つ合成方法である。 しかし、 この方法でも、 c DN
Aの合成途中で逆転写反応が停止してしまう場合があり、 全ての c DNAが完全 長であるという保証はない。
そこで mRNAの完全な情報を得るため、 既存方法で得られた c DN Aの部分 配列をもとに、 足りない部分を補う方法として、 RACE法 (Rapid ampli ficat ion of c DN A Ends) (Proc. Natl. Aca. Sci. USA, 85:8998- 9002 (1988)〉が提案さ れた。 この方法は、 ターゲット c DNA配列をもとに逆転写反応を行い、 c DN Aの両末端に、 夕一ミナルトランスフェラ一ゼによりホモポリマーを付加し、 或 いは合成された DNAよりなるアダプタ一を T4 DNA リガ一ゼで結合させる ことにより、 これらの付加された配列と夕ーゲット c DN Aに特異的なプライマ 一とに基づくポリメラーゼ連鎖反応 (PCR) を行わせることにより、 mRNA 配列の末端部分のみを解析するものである。
この方法で、 特に mRNAの 5'-末端を目標とする場合 (5'- RACEと呼ばれ ている) は、 PCRを利用するため、 非常に簡単に解析が可能であり、 頻繁に用 いられている。 しかしながら、 この方法は c DNAの 5'-末端を解析することが できるものの、 当該 c DNAが作られた際の mRNAの 5'-末端配列を解析する ものではないことはその原理から明白である。 mRNAの 5'-末端を完全な形で 得ることは、 ポリ A配列が末端欠損の防護の役割を担っている 3'- RACEより 完全な 3'-末端を得ることに較べると非常に難しく、 前述したごとく、 現在にお いても 「未だ未完成の技術」 とされている。
完全な mRNAの 5'-末端は、 キャップ構造と呼ばれる特徴ある構造を有して いることは公知である(Nature, 253:374- 375 (1975))。 そして、 このキャップ構造 の近傍をターゲットとして c DNAを解析しょうとする試みも提案されている(整 開平 6— 1 539 53号公報、 更に、 文献(Gene, 138:17卜 174(1994))) 0 これらの方法は、 キャップ構造を特異的に開裂するタバコ酸性ピロホスファタ —ゼ (以下、 「TAP」 と記す) を用いた方法であり、 mRNAをアルカリホス ファタ一ゼで処理し、 キャップを持たない RN Aの 5'-末端からリン酸基を除去 し、 続いて TAP処理によってキャップの開裂、 オリゴヌクレオチド付加、 続い て逆転写反応を行い、 cDNA合成をしている。 このように酵素反応が多段階に わたり、 煩雑であるものの、 原理的には完全長 mRNAを特異的に解析できる数
少ない有効な方法である。 しかし、 先に述べた 5'-末端の配列決定の重要性から 、 そのニーズは高いものの、 この技術はそのいくつかの工程に改善されるべき問 題点があり、 必ずしも普及していないのが現状である。
本発明の目的は、 キャップ構造を有する完全長 mRN Aの 5' -末端配列を含む c DNAを選択的に合成し、 迅速に、 しかも大量の c DNAの完全な 5'-末端配 列を得ることを目的とした mRN Aからの c DNAの合成方法を提供することで ある。 また、 この合成方法で用いられるに好適なタバコ酸性ピロホスファターゼ を得ることも本発明の別の目的である。
発明の開示
本発明に係る DN Aの合成方法は、 キャップ構造を持つ完全長 mRN Aと、 キ ャップ構造を持たない不完全長 mRNAとが混在した mRNA試料から、 前記キ ャップ構造を持つ完全長 mRNAの 5'-末端配列を含む c DNAを合成する方法 であって、
前記 mRNA試料中の不完全長 mRNAの 5'-末端のリン酸基を除去する第 1 工程と、
前記 mRNA試料中の完全長 mRNAの 5'-末端のキヤップ構造を除去する第 2工程と、
第 1工程と第 2工程とを経て試料中に生成された mRNAの 5'_末端のリン酸 基に予め定められた配列のオリゴヌクレオチドを結合させる第 3工程と、
第 3工程で 5'-末端のリン酸基にオリゴヌクレオチドが結合された mRN Aを、 該 mRN Aの途中の配列にァニール可能な短鎖オリゴヌクレオチドをプライマ一 として、 逆転写酵素処理に付すことにより、 第 1鎖 cDNAを合成する第 4工程 とを備えたものである。
好ましい態様としては、 前記第 3工程は、 予め定められた配列のオリゴリボヌ クレオチドを前記リン酸基に結合させる工程を含む。
更に好ましい態様としては、 前記第 3工程は、 mRNA試料中の mRNAの配 列中に含まれない配列からなるオリゴリボヌクレオチドを前記リン酸基に結合さ せる工程を含む。
具体的には、 オリゴヌクレオチドとして、 mRN Aの配列中に含まれない配列
を有する 1 0塩基長以上のオリゴヌクレオチドを用いる。 更に具体的には、 予め 定められた塩基数の種々の相違する組合せからなるオリゴヌクレオチド配列を多 数作出し、 各オリゴヌクレオチド配列に関し、 予め定められた塩基配列デ一夕べ ース中でホモロジ一サーチを行い、 完全に一致するか又は 1塩基だけ配列の異な る配列の出現頻度を求め、 出現頻度が最小の配列を含む低出現頻度グループ内の 複数の配列を組み合わせて配列を決定したオリゴリボヌクレオチドを用いる。 本 発明の例としては、 オリゴリポヌクレオチドとして、 下記のオリゴリポヌクレオ チドの何れか 1つを用いる。
5'- GUUGCGUUAC-ACAGCGUAUG-AUGCGUAAGG -3'
5' - GUUGCGUUAC-ACAGCGUAUG-AUGCGUAA -3'
5' - GUUGCGUUAC - ACAGCGUAUG- AUGCGU -3'
5' - AAGGUACGCC-GUUGCGUUAC-ACAGCGUAUG-AUGCGU -3'
5' - AAGGUACGCC- GUUGCGUUAC- ACAGCGUAUG- AUGCGUAA - 3'
5' - GUUGCGUUAC-AAGGUACGCC- ACAGCGUAUG- AUGCGU - 3'
5'- GUUGCGUUAC-AAGGUACGCC-ACAGCGUAUG-AUGCGUAA -3'
また、 別の好ましい態様としては、 前記第 4工程で用いられるプライマーが、 6塩基長以上の短鎖オリゴヌクレオチドである。
更に、 別の好ましい態様としては、 前記 mRNA試料中の完全長 mRNAの 5 '-末端のキヤップ構造を、 高純度に精製されたタバコ酸性ピロホスファタ一ゼを 用いて除去する。
本発明の最も好ましい態様としては、 キャップ構造を持つ完全長 mRNAと、 キャップ構造を持たない不完全長 mRNAとが混在した mRNA試料から、 前記 キヤップ構造を持つ完全長 mRNAの 5'-末端配列を含む c DNAを合成する方 法であって、
前記 mRNA試料中の不完全長 mRNAの 5'-末端のリン酸基を除去する第 1 工程と、
前記 mRNA試料中の完全長 mRNAの 5'-末端のキヤップ構造をアル力リホ スファタ一ゼを用いて高純度に精製されたタバコ酸性ピロホスファタ一ゼを用い て除去する第 2工程と、
g 第 1工程と第 2工程とを経て試料中に生成された mRN Aの 5'-末端のリン酸 基に、 予め定められた配列からなるオリゴリボヌクレオチドを結合させる第 3ェ 程と、
第 3工程で 5' -末端のリン酸基にオリゴリボヌクレオチドが結合された mR N A を、 該 mRN Aの途中の配列にァニール可能な 6塩基長以上の短鎖オリ.ゴヌクレ ォチドをプライマ一として逆転写酵素処理に付すことにより、 第 1鎖 c DNAを 合成する第 4工程と、
得られた第 1鎖 c DN Aにより第 2鎖 c DNAを合成する第 5工程とを備え、 前記第 3工程は、 mRN A試料中の mRN Aの配列中に含まれない配列からな るオリゴリボヌクレオチドを前記リン酸基に結合させる工程を含む。
本発明の c DN Aの合成方法に用いられるタバコ酸性ピロホスファタ一ゼとし ては、 5'-末端のキャップ構造の除去を可能ならしめ、 且つ、 mRNAの他の部 分を切断する別の酵素を実質的に含まない程度に純化されたものを開示する。 本発明では、 キャップ構造を持つ完全長 mRN Aと、 キャップ構造を持たない 不完全長 mRNAとが混在した mRNA試料から、 完全長 mRNAのみの 5' -末 端配列を含む c DN Aが合成される。 このために、 まず、 被検試料中の不完全長 mRN Aに対しては、 5'-末端側のリン酸基を予め除去しておくことにより、 以 下に続く第 3工程のオリゴヌクレオチド(好ましくは、 オリゴリボヌクレオチド) 付加反応が行われないようにする。
mRNA試料中の完全長 mRNAに対しては、 第 2工程により 5'-末端のキヤ ップ構造を除去し、 これにより生成した mRN Aの新規 5'-末端のリン酸基に第 3工程でオリゴヌクレオチドを結合させる。 この反応の前に、 不完全長 mRNA については既に 5'-末端側のリン酸基が除去されているので、 不完全長 mRNA に対する以降の反応は進行することはない。
このオリゴヌクレオチドとしては、 例えば、 酵素として T 4 RN Aリガ一ゼを 用いる場合は、 RN Aを基質にしたときと DN Aを基質にしたときでは 2桁程度 効率が相違するため、 好ましくはオリゴリボヌクレオチドを用いる。
次に、 第 4工程としてこの 5'-末端のリン酸基にオリゴヌクレオチドが結合さ れた mRN Aを、 該 mRN Aの途中の配列にァニールする短鎖オリゴヌクレオチ
γ ドをプライマ一として、 逆転写酵素処理に付す。 これにより、 相補的な第 1鎖 c DNAが合成される。 このようにして、 mRNAの 5' -末端部分からの c D N A を迅速に合成する事が出来る。
また好ましくは、 得られた第 1鎖 c DNAより、 第 2鎖 c DNAを合成し、 1 本鎖 c DN Aから 2本鎖 c DN Aを合成する第 5工程を付加してもよい。
本発明の一つの特徴は、 第 1鎖 c DNAを合成する際のプライマ一として、 m RNAの途中の配列、 好ましくは 5'-末端の近傍部分の配列にァニールする短鎖 オリゴヌクレオチド(以下、 本発明では、 特に 6塩基よりなる 「ランダム .へキサ マー」 )を用いることにある。
この特徴を更に詳しく述べると、 本発明は、 mRNAの情報を c DNAに変換 する方法に関する。 一般的な方法としては、 逆転写酵素を用いて、 RNAを铸型 として、 相補的 DNAを合成する。 この時、 逆転写酵素の反応開始にプライマ一 が必要である。 プライマ一とは、 铸型依存性 DN Aポリメラ一ゼが、 铸型依存的 に、 新生鎖合成時に、 ヌクレオチドの 3'- OHが必要であり、 この 3'- OHを供 給するための DNA鎖又は RNA鎖のことを意味する。 現在では、 DNAを合成 する技術が進み、 15〜40塩基長のプライマー機能を持たせた短鎖オリゴヌク レオチドの合成は容易である。
一般的には、 c DNA合成の目的の為には、 プライマ一として、 mRNAの 3 '-末端に存在するポリ A鎖と呼ばれるアデニンが複数つらなった配列に相補的な オリゴ dT12-18プライマーが利用される。 しかし、 このプライマーを用いると、 効率よく合成がス夕一卜するものの、 先に述べた RN Aの不安定性及び長鎖であ ること、 更には 2次構造の問題で、 mRNAのキャップ構造を持つ 5'-末端まで 合成が達するのは極めてまれとなる。 従って、 mRNAの長さが長いほど、 その 傾向は強くなることは容易に予想される。 更に付言すると、 以上の理由が、 完全 長 c DN A合成を困難にしている理由であり、 完全長 c DN Aを試みている既存 の技術は、 何れもまだ、 この問題を解決しているとは言いがたい。
これに対して、 本発明は、 難しいとされていた mRNAの特に 5'-末端配列の 解析を迅速確実にするものであり、 その一つの特徴は、 プライマ一として、 mR N Aの途中の配列、 好ましくは 5'-末端の近傍部分の配列にァニールする短鎖ォ
リゴヌクレオチドを用いる点にある。 特に好ましくは、 6塩基長以上のランダム な配列よりなる短鎖オリゴヌクレオチドをプライマ一として用いる。
尚、 プライマーとして用いる短鎖オリゴヌクレオチドの塩基長は、 理論上は、 mRNAの配列よりも短く、 mRNAの様々な場所から、 逆転写反応がスタート する任意の長さであればよい。 但し、 現在報告されている配列特異的なプライマ 一活性に必要な最低の長さは 6塩基であるとされており、 従って本発明でも単鎖 オリゴヌクレオチドは、 6塩基長以上とする。
ここで最短の 6塩基よりなるランダム ·へキサマ一をプライマーに用いる場合 、 原理的には、 4096 (=46)通りの塩基配列の単鎖オリゴヌクレオチドが考え られる。 従って、 この多数の配列の中から、 mRNAの所望の場所で逆転写反応 がスター卜するものを選択すればよいことになる。 このようなランダム ·へキサ マーを選ぶことにより、 mRNAの 5'-末端を含む c DNAが合成される可能性 が高くなる。
尚、 このような任意塩基配列の短鎖ォリゴヌクレオチドを用いて逆転写反応を 行う方法は、 大きな mRNA由来の c DNAクロ一ニングを行う場合に、 5' -方 向にクローンのスクリーニングを行う方法としてしばしば利用される。 この手法 は例えば J. Virol., 28:743 (1978)に述べられている。
しかしながら、 この J. Virol.の手法と本発明の手法とは、 短鎖オリゴヌクレオ チドを用いて逆転写反応するという点ではどちらも同じであるが、 本発明の手法 は 5' c DNAのみを選択的に増幅させる点で J. Virol.の手法とは全く異なる。 J .、Virol.の方法は、 逆転写反応後、 第 2鎖合成を行った後、 ベクタ一に入れると いう工程を経るため、 逆転写反応が 5'末端まで到達しないクローンも生み出され 、 更に一般にベクターへの導入のためリンカ一 DNAの付加を行う。 このリンカ —DN Aを付加するとき、 二本鎖 c DN Aの末端にリンカ一 DN Aが結合される ため、 T 4 DN Aポリメラ一ゼを使って平滑化するが、 この時、 10〜50塩基 削られてしまい、 完全長 c DNAが得られないと言う結果に終わる。 即ち、 5'- 末端配列は得られない。 一方、 本発明の方法は、 完全長 mRNAのみにオリゴリ ボヌクレオチドを結合させ、 逆転写反応後、 すぐにこのオリゴリボヌクレオチド の配列に特異的なプライマーで PCRを行うことにより、 完全な 5'-末端配列を
含む c DN Aのみを選択的に増幅させる点で特異的である。
また、 本発明の別の特徴は、 TAPによる処理で、 5'-末端のキャップをはず し、 キャップ構造と置換するためのオリゴリボヌクレオチドの配列に関する。 こ のオリゴリボヌクレオチドは、 mRNAの 5'-末端に結合後、 逆転写反応によつ て c DN Aとして合成され、 このオリゴヌクレオチドに特異的なプライマーを用 いる場合の結合部位となる。 従って、 この配列が、 完全な 5'-末端を解析する場 合に、 極めて重要な目印になる。 特に、 前述のランダム ·へキサマ一を用いた逆 転写反応を行うと、 複数の mRNA由来の c DNA断片の集まりが得れら、 従つ て、 これら断片のキャップと置換したオリゴヌクレオチドの配列特異性が、 mR NAの 5'-末端由来の配列のみを特異的に解析可能とするかどうかの決め手にな る。 従って、 本発明において、 このオリゴリボヌクレオチドの設計法、 及び、 そ の配列の決定は重要な意味を持つ。
更に詳しく説明すると、 ゲノム上の塩基配列は、 ヒトゃマウスの場合、 約 3 X 109 塩基対よりなると言われている。 このゲノム上に、 遺伝子をコードする頜 域、 その遺伝子の発現調節する領域、 更に繰り返し配列、 イントロン等が配置さ れ、 発生過程で、 これらの構造が、 極めて精巧にプログラムされた状況下で、 働 いていると考えられている。 そして、 その配列は決してランダムではないと考え られている。
例えば 「C p Gアイランド」 と呼ばれる構造がある。 この構造は、 遺伝子の 5 '-頜域、 プロモーター頜域、 最初のェキソン部に存在することが知られている ( タンパク質 ·核酸 '酵素、 41 (15) :2288 (1996)) 。 また、 遺伝子の発現に係わる プロモーター、 或いは、 転写終結に係わる領域は ATが豊富であることも知られ ている。 この理由については、 推測の域をでないが、 遺伝子発現をコントロール するトランス因子としてのタンパク質が、 その結合部位をゲノム上の配列から探 すとき、 熱力学的に不安定な ATリッチな領域と、 安定な GCリッチな頜域とを 素早く見分けるランドマークとして働いていると考えると理解しやすい。
また、 全ての生物において、 これまでの解析から、 ジヌクレオチドの出現頻度 には偏りがあり、 特に、 CT、 TG過剰、 CG、 TA欠損という法則も知られて いる 〔Proc.Natl.Acad.Sci.USA.85: 9630-9634(1988)〕 。 よって、 生物のゲノム
配列は、 決してランダムな配列ではなく、 ある法則の下に進化した情報を持って いると考えられる。
従って、 本発明で用いるオリゴリボヌクレオチドに関して、 以上のゲノム上の 配列の偏りを考慮して導かれた配列を mRNAの 5'-末端解析に応用すれば、 極 めて複雑な 5'-c DNAの配列を含む集合体の中からある特定の遺伝子の 5'-末 端を解析する精度は上昇する。 '
また、 本発明に関連して、 TAPの品質は非常に重要な要素であることが予想 された。 即ち、 TAPを使用してキャップ構造を開裂することは知られており ( 文献 FEBS Lett., 65:254-257 (1976)) 、 この方法は原理的にキャップを保証する 唯一の知られた方法である。 TAPのこの作用により、 mRNAの 5'-末端にキ ヤップ構造(7mGppp)を持つ RNA、 つまり無傷の 5' -末端を持つ R N Aであるこ とが確実に保証される。
その一方で、 RNAの扱いは非常に難しいことも知られている。 それは、 ヌク レア一ゼの一種類である RNaseにより、 R N Aが常に分解の危険にさらされてい るためである。 従って、 RNA実験は、 この活性を必要最小限に抑える取り扱い 方が必須であり、 これに関する実験上の注意点は、 例えば文献( Blumberg, D.D. Method, in Enz. 152:20-24 (1987), Academic Press. )に詳しく示されている。 しかし、 このような注意を払っても、 RNAの分解を完全に抑えるのは難しい。 更に、 mRNAは、 ゲノム DNAと異なり、 2本鎖ではなく、 1本鎖である。 こ のため、 RNAを抽出し、 水系の溶媒中で RNAを扱うことになるが、 分子内 2 次構造として、 熱力学的にもっとも安定なステム構造を分子の各所に形成し、 こ の構造が、 例えば、 逆転写酵素の反応を阻害する原因ともなつている。 この 2点 は、 mRNAの配列を完全に c DNAに変換できない大きな原因となっている。 そこで、 本発明の別の特徴によれば、 第 2工程での mRNA試料中の不完全長 mRNAの 5' _末端のキャップ構造から、 リン酸基を除去するためにタバコ酸性 ピロホスファタ一ゼを用い、 特にこのタバコ酸性ピロホスファタ一ゼには、 5'- 末端のキャップ構造の除去を可能ならしめ、 且つ、 mRNAの他の部分を切断す る他の酵素を含まない程度に純化されたものを使用する。
即ち、 現在市販されている限りの TAPでは、 効率のよい mRNAの 5'-末端
の配列決定のためには使用に適さないことが確認された。 これは、 mRNA中の キャップ構造を選択的に開裂するには、 TAP中に、 RNAを構成するフォスフ オジェステル結合を切断するヌクレア一ゼゃキヤップ開裂後に新たに生じる 5'- リン酸基を除去するホスファタ一ゼのような酵素が微量混入されているため、 効 率のよい mRNAの 5'-末端の配列決定のためには使用できないためである。 従 つて、 本発明では、 5'-末端のキャップ構造の除去を可能ならしめ、 且つ、 mR N Aの他の部分を切断する他の酵素を含まない程度に純化された TAPを使用す る。
本発明は以上説明したとおり、 キャップ構造を有する完全長 mRNAの 5'-末 端配列を含む c DNAを選択的に合成し、 迅速に、 しかも多数の c DNA種の完 全な 5'-末端配列を解析することを目的とした mRNAの 5'-末端部分からの迅 速な c DN Aの合成方法を得ることが出来るという効果がある。 また、 この合成 方法で用いられるに好適なタバコ酸性ピロホスファタ一ゼを得ることが出来る。
図面の簡単な説明
図 1は本発明の c DNAの合成方法の一実施態様の各工程の概要を示す説明図 である。
図 2は高度精製 TAPによる RN A鎖を傷つけないキヤップ構造の除去の結果 を示す線図である。
図 3は 10 mer配列のホモログ ·スコアと CT/TGジヌクレオチドとの出現頻度を示 す説明図である。
図 4は 10 mer配列のホモログ ·スコアと CG/TAジヌクレオチドとの出現頻度を示 す説明図である。
図 5は選ばれたプライマの 10 mer配列のヒトゲノム DN Aを铸型としたときの RAP D解析結果とホモログ ·スコアとを示す説明図である。 a図はグループ 1 , b図はグループ 2を示す。
図 6はプライマーとなる 9種のオリゴリボヌクレオチドの配列である。
図 7はヒト胎盤性 5' c DNAから、 ヒト胎盤性ラクトゲン mRNAの 5'-末端 解析結果を示す説明図である。
図 8はオリゴリボヌクレオチド配列によるヒト胎盤性ラクトゲン mRNAの 5
j 2
'-末端 c DNAの P C Rによる電気泳動での評価を示す説明図である。
図 9はヒト胎盤性オリゴ ·キヤッビング c DN Aからのトランスフェリン受容 体 5' cDN Aの PC Rによる増幅結果を示す説明図であり、 a図は TFRA3又 は T F RA4の 2つのプライマ一を用いた場合の予想される P C R産物のサイズ の概要を示し、 b図は電気泳動の結果を模式的に示した説明図である。
発明を実施するための最良の形態
実施例 1. cDNAの合成方法の概要
図 1は本発明の c DN Aの合成方法の各工程の一実施態様の概要を示す説明図 である。 本発明の c DNAの合成方法は、 工程 aに示す通り、 キャップ構造(7mG PPP)を持つ完全長 mRNA(l) と、 キャップ構造を持たない不完全長 mRNA (2 ) とが混在した mRNA試料中に、 アルカリホスファタ一ゼ(3) を添加すること により、 工程 bに示す通り、 不完全長 mRNA (2) の 5' -末端のリン酸基(P) を アル力リホスファターゼで除去する第 1工程と、
工程 cに示す通り、 これにタバコ酸性ピロホスファタ一ゼ(4) を添加して、 こ の mRNA試料中の完全長 mRNAの 5'-末端のキヤップ構造(7mGppp)をタバコ 酸性ピロホスファタ一ゼで除去する第 2工程と、
工程 dに示す通り、 この生成した mRNAの 5'-末端のリン酸基にオリゴリボ ヌクレオチド(5) を T4 RNAリガーゼ(6) で結合させる第 3工程と、
工程 eに示す通り、 これに逆転写酵素(7) とランダム 'へキサマー(8) を添加 することにより、 5'-末端のリン酸基にオリゴリボヌクレオチドを結合させた mR NAを、 mRNAの途中の配列にァニールするランダム'へキサマーをプライマ一 として、 逆転写酵素により、 相補的な第 1鎖 cDNAを合成する第 4工程とを備 えている。
更に、 好ましくは得られた第 1鎖 cDNAにより、 工程 f に示す通り、 第 2鎖 cDNAを合成するか、 工程 gに示す通り、 PCRで増幅する第 5工程とを備え ている。
このように作製された c DNAをもとに、 例えば、 mRNAの 5'-末端配列を 含む DNAを入手できる。 このようにして得られた DNAは、 適当なベクターに クローニングし、 塩基配列を決定することで、 最終的に、 本発明の目的を達成す
る。 更に、 逆転写酵素の反応で第 1鎖 c DNA合成後、 オリゴリボヌクレオチド の配列に基づいて、 2本鎖 c DNAへの変換も可能である。 この 2本鎖 c DNA を、 例えば、 プラスミドベクタ一或いはファージベクタ一にクローニングするこ とで、 5'- c DNAライブラリーを作製することも可能である。
以上説明したように、 本発明は、 mRNAの完全な 5'-末端の配列決定を、 複 数の遺伝子を対象に可能とする。
実施例 2. タバコ酸性ピロホスファターゼ(TAP)の精製と評価
本発明においては、 完全な mRNAの 5'-末端解析を行うにあたり、 キャップ 構造を認識して開裂する酵素である TAPの精製度が非常に重要であることが見 出された。 即ち、 本邦においてもまた外国においても、 TAPは市販されている が、 我々が試したところ、 効率のよい mRNAの 5'-末端の配列決定のためには 使用できないことが判った。 これは次の理由による。 mRNA中のキャップ構造 を選択的に開裂するには、 TAP中に、 RNAを構成するホスフォジエステル結 合を切断するヌクレア一ゼゃキャップ開裂後に新たに生じる 5'-リン酸基を除去 するホスファターゼのような酵素の混在はたとえ微量であっても許されない。 巿 場より得られるこれらの TAPは一定の精製度はあるものの、 ヌクレア一ゼ及び ホスファタ一ゼが混入しているため、 効率のよい mRNAの 5'-末端の配列決定 のためには使用できない。
即ち、 市販されている TAPでは混在するヌクレア一ゼのために、 TAPがキ ヤップ構造を開裂する間に RNAを切断するため、 使用に耐えないことが、 我々 の開発した以下に述べる高感度検定法により初めて判った。 TAP酵素標品中に ヌクレア一ゼが混在しているか否かは、 高感度の評価法によって初めて判断でき るのであり、 通常のヌクレア一ゼ検定法によっては TAPの精製度が mRNA中 のキャップ近傍の 5'-末端塩基配列のために使用できる程度に高いか否か判定で きない。 即ち、 TAPからヌクレアーゼゃホスファタ一ゼを除くための高度精製 は本発明の根幹の一つを為すものである。
一方、 精製度を評価するための高感度検定法は TAPの高度精製を可能とする 秤量器であり、 精製された TAPが本発明に使用できるか否かを決定する。 この 高感度検定法については、 後述する。 この方法により、 本発明を可能とするため
に必要な高純度 T A P酵素を精製することが出来た。
TAPの精製は、 既に文献 (Biochemistry, 15(10) : 2185-2190 (1976)) に記載 されている。 しかし、 我々はカラムクロマトグラフィー各種を組み合わせ、 同種 のカラムクロマトグラフィーであっても、 高感度の活性検定が不満足な裁定を下 す限り、 これを繰り返すことにより混在するヌクレアーゼ等の除去を行った。 こ こで示す例に限定されるわけではないが、 本酵素は極めて不安定であり、 比活性 の高い酵素標品を得ることがその後の実験に非常に重要であることを申し添える 。 以下、 詳しく例示する。
タバコ細胞 BY 2は、 進土秀明博士(工業技術院生命工学、 工業技術研究所)か ら入手し、 上記文献に沿って培養した。 即ち、 培地は、 ムラシゲ ·スク一グ培地 を用い、 7日間、 光の当たらない条件で振盪しながら培養し、 遠心にて細胞を集 めた。 典型的な例では、 1.5リットルの培養液から 180gの細胞を得ることが出来 る。
この細胞は、 300mlの 200mM NaCl、 10mM -メルカプトエタノール (j3— ME) 、 ImM エチレンジァミン四酢酸ニナトリウム (EDTA) 、 lOOmM 酢酸ナトリウ ム、 PH5.0に懸濁、 ソニファイア一 450 (ブロンソン社製) にて、 温度が上昇しな いように注意しながら破碎した。 破碎物は遠心により、 細胞残查を除き、 上澄み 液を、 10mM jS—ME、 20%グリセリン、 0.01% トリ トン X- 100、 10mM Tris-HCl , pH6.9 (25で) に対して充分透析した。
この透析液は、 DE 52カラムクロマトグラフィー (ワットマン社製) を行い 、 素通り画分を S-セファロ一ス(フアルマシア社製) に吸着させた。 紫外線吸収物 質が溶出しなくなるまで充分にカラムを洗い、 0— 0.5M NaCl直線濃度勾配により 吸着物質を溶出した。 TAPの画分は、 5mM ニトロフエニル— p T (シグマ社製 ) を含む ImM EDTA、 0.1% β -ME, 0.01% トリ トン X-100、 50mM 酢酸ナト リウム、 pH 6.0に、 溶出画分を加え、 37で、 10分、 保温した。 このとき、 0.D.40 Onm の吸収を測定することにより検査した。 活性のある画分は合わせ、 脱塩後、 セフアクリル S- 200 (フアルマシア社製) のゲル濾過カラムクロマトグラフィを 行い、 先と同じく、 TAPの活性を検査した。
活性のある画分は合わせ、 脱塩後、 ハイ トラップ ·ブルー (フアルマシア社製
J 5
) カラムクロマトグラフィを行い、 0— 0.5M NaCl直線濃度勾配により吸着物質を 溶出した。 活性画分を検査し、 保存緩衝液 (50%グリセリン、 lOOmM NaCl、 0.1m M EDTA、 ImM ジチオスレィトール(DTT)、 0. ImM ベンズアミジン、 0.01% トリ 卜 ン X-100、 10mM Tris-HCl, pH 6.9) に対して充分、 透析し、 使用まで— 20°Cにて 保存する。 典型的な例では、 以上の操作で 0.5U/ 1 or mlの TAP標品を得るこ とが出来る。 尚、 超高感度純度検定法によりヌクレア一ゼの微量な混在が認めら れる場合には、 前記操作を繰り返すと共に、 脱塩後セフアクリル S-200 (フアルマ シァ社製)のゲル濾過カラムクロマトグラフィを重ねて行った。
この時の活性の定義は、 上記活性測定条件下で、 37で、 1分間反応させた時、 1 zmole p-Nitrophenolを遊離する酵素量を 1Uとした。 尚、 市販品である TAP (和光純薬) は、 50mM 酢酸ナトリウム pH5.5、 ImM EDTA、 10mM )3— MEの 反応条件下で、 37で、 30分間反応させた時、 ATPを基質として lnmolの無機リ ン酸を遊離する酵素量を 1Uとしている。 本実施例の TAP標品と市販品との相対 活性は、 p-Nitrophenolを用いた時の 1Uは、 AT Pを基質に使用したときの 367, 000 Uと同じとなる。 従って、 先の精製例で得られた TAP標品の 0.5Uを、 換算す ると、 185,500Uとなる。 以後、 TAPの活性は、 後者の活性定義に換算して表示 する。
この状態でヌクレア一ゼ混入度合いを、 大腸菌の r RNA (16Sと 23S) 8 /_igを 基質として検査した。 具体的には、 大腸菌 r RNAを ImM EDTA、 0.1% β— ME 、 0.01% トリ トン X- 100、 50 mM酢酸ナトリウム、 pH 6.0の緩衝液中で、 T AP 500U相当を加え、 37で、 2時間反応させた。 この RN Aをホルムアミドが存 在する変性条件下の 1.0%ァガロース電気泳動を行い、 共に添加した色素であるキ シレンシァノールがァガロースゲルの約 1/3に達したときに泳動を止め、 紫外線 ( 波長 254nm) を照射して、 写真撮影を行い、 RN Aの分解度合いを検査した。 ここ で例示した方法で精製された TAP標品は、 この条件で RN Aを分解する活性は ほとんど含まれていなかった。
実施例 3. TAPの超高感度純度検定法
精製した TAPが mRN Aキャップ構造の開裂を RN A鎖に損傷を与えること なく行えるか否かを評価するために以下に述べる超高感度純度検定法を確立した
\
。 即ち、 本発明において TAPによって処理される RNAが 5'-末端にキャップ 構造と 3'-末端にポリ A構造を有する mRNAであることから、 同様の両末端構 造を持つ mRN Aを 2種類の放射性元素でラベルされている形で調製した。 即ち 、 5'-末端部分のキヤップ構造はトリチウム(3H)メチル基(CH 3—)でラベルさ れ、 RN A鎖は放射性リン酸(32P)でラベルされた天然体と同様の mRN Aを調 製した。 本発明に使用される天然体 mRN Aは
(5') m7Gp( 1 )p( 4 )pNmpNpNp-polyA (3')
として表示することができる(mはメチル基、 pはリン酸基、 Nは 4種類のヌクレ オシド、 Gはグアノシンを示し、 下向き矢印は TAPが開裂反応を行う場所を示 す)。
以上の mRNAは、 極微量であってもメチル基は3 H、 リン酸基は32 Pのそれぞ れ高比活性の放射性元素でラベルされているため、 望まれるキャップ構造の開裂 、 即ち、 m7G(7-methyl guanos in)の mR N A本体からの脱離、 及び 「望ましく ないヌクレア一ゼ混在による RNAの分解」 に由来する32 Pヌクレオチドと、 「 望ましくないホスファターゼ混在による」 32 Pリン酸の mRN A本体からの脱離 を鋭敏に測定できる。
(3H-m7G) と (32P—ヌクレオチド + 32Pリン酸) との測定は、 TAPと 二重ラベルした mRN Aを反応させ、 冷 5 %トリクロル酢酸を加えた後、 遠心分 離(10,000XG, lOmin)を行い、 上清画分(3H— m7 G)と、 沈殿画分(主に32 P— RN Aと Nmに由来する3 H— methyl)に分別し、 液体シンチレ一ションカウンター (ベックマン社製)により、 3Hと32 Pとのカウントを別々に測定した。
この (3H— methyl— 32P—リン酸) ラベルした mRN Aを用いる検定法は、 ヌ クレア一ゼの混在をモニタ一する上で、 超高感度であると共に、 TAPが実際に キャップ構造を開裂しているか否かを同時に測定でき、 本発明のために精製中の TAPの純度の実情を知る上で重要な指針を与えるものであった。
本検定法による理想的な検定結果は、 「キャップ構造の開裂産物である3 H— m 7 Gのトリチゥム放射能が全体の 50 %が上清中に移行し、 R N A中の32 P放射能 が 100 %沈殿画分にとどまる」 ことである。 我々の初期の精製 TAP或いは巿 販品の TAPでは、 このような理想的な結果は得られなかったが、 前述の精製操
j飞 作の繰り返しを行った結果、 本発明に使用できるレベルの高純度 T A P標品を最 終的に得ることが出来た。 3H—methyl— 32 P—リン酸ラベルした二重放射ラベル (double-labeled) mRNAの調整方法及び検定法については、 次に述べる。
(3.1) 3 H -methyl - 32 P— p U二重放射ラベルポリ A mRNAの調製
ワクシニアウィルスはそのウィルス粒子中にキャップ構造とポリ Aを有するゥ ィルス mRNAを合成する諸酵素を含んでいる。 このウィルスは約 50種類の m RNAを合成するが、 これらの mRNAはヒトを含む高等動植物の mR N Aと構 造的によく似ているためモデル mRNAとして使うことができる(S. J.Higgins a nd B. D.Hames, RNA Processing, A Practical Approach volume Π , p35-65, (1994)) 。 ワクシニアウィルスを H e L a細胞に感染させ、 この感染細胞からグリセリン 密度勾配超遠心を用いる方法(Wei, C.M. and Moss,B. ,Proc.Natl.Acad, Sci. , 72, 3 18-322, (1975))によりウィルス粒子を精製した。
32Ρでラベルされた mRNAは、 精製ウィルス粒子(約 1 00 g)を lOOmM Tr is-HCl (pH8.0), 12raM MgCl2)4mM ATP, 2mM GTP, 2mM CTP.O. ImM UTP, 100/iCi (a -3 2P)UTP(specif ic activity 3000Ci/mmol) , ImM S-adenosylmethionine, 30mM β - mercaptoethanol, 280unit/ml RNas in, 0.5% NP-40を含む 0.5ml反応液中で 37^、 2 時間反応した。
3H—methylでラベルされた mRNAは、 同様に複製ウィルス(約 100 z g)を 12 OmM Tr is-HCl (pH8.0), 12mM MgCl2,4mM ATP, 2mM GTP, 2mM CTP, 2mM UTP, 50 xCi 3H-S-adenosylraethionime (speci f ic activity 78Ci/匪 ole) , 30mM β -mercaptoet hanol,280units/ml RNasin,0.5¾ NP-40を含む 0.5mlの反応液中 37で、 2時間反応 した。
反応後、 各々の反応液はフエノール抽出を行い、 合成された RNAはセフアデ ックス G- 100カラムクロマトグラフィーを行うことにより未反応基質から分離した 。 RN Aは更にオリゴテックス(dT) 30を用いるァフィ二ティクロマトグラフィー により、 ポリ Aを持つものを精製 ·分取した。 以上の 2種類の RNAは単独、 若 しくは混合した TAP酵素の純度検定に用いた。
(3.2) TAPの高感度純度検定法
精製途上の TAPの評価を以下の方法で行った。 即ち、 1 XTAP buffer,32
P -RNA (4000cpm,約 1 ng)或いは、 3H—methyl— R N A (2000cpm,約 1 ng)を含 む 20 i 1反応液へ 1 1の精製 TAP (300units)を加え、 37ででィンキュベ一ショ ンを行い、 一定時間内での32 P— RN Aの分解或いは3 H— methyl— RN Aのキヤ ップ開裂反応を測定した。 反応後 5 tgの t RNAを加え、 更に冷 5%トリクロル 酢酸溶液を加え、 遠心後上清画分及び沈殿画分中の放射能を測定した。
また、 微量の RN A鎖上に 1個のニックが入った場合をも検出(RN Aニック検 出法)できる方法として、 32P— mRNAを TAPと反応後、 3'-末端のポリ Aを オリゴテックス(dT) 30上の(dT) 30部分へのァフィ二ティ一を用いて反応 終了後の32 P_mRNAの変化を測定した。 以上に述べた 3種類の検定法は、 T AP酵素の精製度によって使い分けを行い、 最も精製が進み、 実際に本発明の第 2工程に使いうるか否かの最終判断の際には、 最も判定基準の高い3 H— methyl RNA/TCA法と32 P— mRNA/ニック検出法を組み合わせて行った。
この 2つの方法を用いた実施例デ一夕を図 2に示す。 図 2は高度精製 TAPに よる RN A鎖を傷つけないキャップ構造の除去の結果を示す線図であり、 縦軸は 検出された放射能の%であり、 横軸は時間(分)である。 用いた酵素は高度精製 T APであり、 基質はワクシニアウィルス(vaccinia virus)の mRNAであり、 白 丸は3 H_methyl— RNAによるキヤップ開裂反応を、 黒丸は32 P— mR N Aを用 いたニック活性を見たものである。 尚、 本発明の研究初期において、 精製 TAP 酵素が真に 「本発明に使いうる」 との結論を見定めた後には、 前述したより簡便 な大腸菌 r RNAを用いる方法を通常の純度検定に用いている。
実施例 4. オリゴリボヌクレオチド配列の設計
更に、 TAPで開裂された mRNAの完全な 5' -末端に結合させるオリゴリボ ヌクレオチドの配列を検討し、 本発明を完成した。
オリゴリボヌクレオチドの配列は、 なるべく c DN A中には存在しないで、 付 加したオリゴヌクレオチドの特異性の高いものを選ぶ必要がある。 そこで、 先ず 、 RAPD (Random amplified polymorphic DNA;Nuc. Acids Res. 18: 6531-6535 ( 1990))法に用いられる 10 merの配列を設計し、 設計した配列がデータベース中の 配列にどの程度の頻度で出現するかを計算し、 数値化し、 各配列の重みづけを行 つた。
10 merの配列は、 大腸菌の λファージの塩基配列、 48, 502塩基対を 10塩基毎に 区切り、 その配列の中に 6塩基認識の制限酵素の配列の存在するものを、 回文構 造を持つことから排除し、 更に GC含量 50%のもので、 3'-末端の G或いはじの ものを抽出した。 これにより、 少なくとも RAPDに使用する際の条件を満たす と思われる配列を持つ、 10塩基からなる配列を 450本、 抽出した。
この 450本の 10塩基配列を、 データベースソフトウェア GENETYX- MAC/CD Ver.22 .0.2に含まれる高速ホモロジ一検索機能を用いて、 EMBL-GDBリリース 34.0 (1993 ) 中に含まれる塩基配列の内、 真核生物由来のシーケンスである合計 69,936, 993 塩基対からなるデータベース中でホモロジ一サーチを行い、 完全に一致するか或 いは 1塩基だけ配列の異なる配列の出現頻度の合計をホモログ ·スコアと定義し た。 更に付言すると、 今回検索対象となった配列の生物は、 キャップ構造とポリ A配列を持っている生物である。
ホモログ 'スコアが、 例えば 1000とすると、 合計 69, 936, 993塩基対の配列中に 完全に一致するか、 或いは 1塩基だけ異なる配列の合計が 1000であると言うこと を示す。 尚、 このホモログ 'スコアの算出に使用したプログラムは、 Lipman- Pea rson法(Lipman,D. J. and Pearson, W. R. , Science 227:1435-1441.1985)に基づいて いる。
次の表 1〜表 5は、 450本のホモログ ·スコアをスコアの値順に並べたもので あり、 各々のスコア、 プライマ、 塩基配列を示す。 図 3は 10 mer配列のホモログ
•スコアと CT/TGジヌクレオチドとの出現頻度を示す説明図である。 図 4は 10 me r配列のホモログ ·スコアと CG/TAジヌクレオチドとの出現頻度を示す説明図であ る。 図 3, 図 4において、 横軸は、 表 1〜表 5に示した 450本の配列をスコア順 に並べた 4, 500塩基の配列として、 ジヌクレオチドの出現頻度を、 20塩基対を単 位としておから左方向に 1塩基づつずらしながら CT/TGの出現頻度(図 3)、 CG/TA の出現頻度(図 4)を%で表し、 縦軸にプロットした。
ホモログ ·スコアの高い配列と低い配列のジヌクレオチドの頻度を調べると、 CT, TG過剰、 CG, TA欠損という法則 〔Proc.Natl.Acad. Sci. USA.85: 963 0-9634(1988)) に当てはまることが確かめられた(図 3 , 図 4)。 即ち、 ホモログ
•スコアの高い配列には、 CT, TGジヌクレオチドが数多く出現し、 逆に少な
2Q い配列には、 CG, T Aジヌクレオチドの出現頻度が高いという相関が見られた
ム 9 0/86dfAL d \l
2 スコア プライマ 塩基配列 スコア プライマ 塩基配列
3, 638 E- -09 TC AC AC CAAC o Q, Η 11- 0 GGCTTC ATTC
3, 636 X- -29 C GT CTTTCTG 997 υ Π- -Π9 T C AAA C AGGG
3, 631 X- -32 CTGTC ATC AG , Α- AAAC A C C A C G
3, 611 H- -08 CTTTCACCAC u, 91 ι -07 GTTGTGTCTC
3, 607 B- -33 TGATGAC C AG o, ώ α υ~ υ ο AATCAGCCAC
3, 603 E- -25 GC AAATGGTG o , ώ R- -01 CTC AGC ATTG
3: 583 D- -47 GTGTTTTGGG ώ R- -1111 ACTGAACTCC
3, 570 E- -18 CTT CTGTC AC 1 ου Υ- 00 ACTGAGATC C
3, 567 D- -33 ATGGCTGAAC o , 11 *t 0 υ TCTTTGCTCG
3, 563 E- -47 AC AAGGTC AC o , 1 RQ 10 AGGGC AAAAC
3, 561 F- -24 GAGC AGATTG Q, 1 fi A- TGAACTGGTC
3, 552 F- -40 GTC ATC ACTG Q 181 Υ- uo CTTT CTAC C C
3, 542 B- -14 GATTC AGAGC t 1 d c 0c G - TAAG C C AT C C
3, 530 H- -42 TC AGAC C ATC 0, 14-4 Α- -1 CTGGTTTTCG
3: 525 F- -1 GATTC AGAGG υ J υ Π u- -O ufi u TTGC CACTTC
3, 518 A- -03 AATGCCAGAG , 08 - -Π υ7 ( TTG丁丁 GGGAG
3, 518 A- -02 GGAACTGAAG o , 077 -97 GTGAATGGTG
3: 508 c- -06 GAAACTGAGC 070 Υ- u TGGATTGGTC
3, 501 C- -32 TCTGGTTCTC ν AC AGAGGTTC
3: 491 B- -05 AAAAAGGGGC t 0 o C C AC AAATC C
3: 480 H- -20 AC C AGTTTC C Q υ uo Π υ- *r 0 AGTC CTGAAC
3, 477 E - -16 CATCAACCAG Π47 *t GGTGAGTTTG
3, 456 G- -19 GCTC AGTTTC 04.fi 0 ACTGAC AC AG
3, 448 D- -21 TGGATGAACG , 02 Α- GTGAGTTCAC
3, 438 C - -09 TTTCTCTCGG Q ) Ρ- TCTGGTTTCG
3: 43リ3リ H- -16 GCTCTGAATC > υοο η_ TTTGTGC C AC
3: 424 H- -32 ACTTTCTC CG η .900 GTGAACTC AC
3 4 i1l l H- -24 TT C AC C AGTG 0 Q > 1 ο -11 AACACATCCG
3, 388 G- -30 CTGCTC AAAC 0 } 10 .11 ¾ GTAC AAGTC C
3; 386 A- 2 ATTGCTC AGG 9 Q71R -11 Q 0 AGGTGGTTTC
3: 36リ0 G- -33 AGTTCTGCTC 9, Ρ- ¾ 1 AGC C ATTCTG
3: 342 H- -01 CGGAAAAGTC 9, υ ϋ R- GGATTTGTGG
3: 329 X- -04 TTTTGGCTCC 2, 965 Α- -35 TGAAC AC AC C
3, 317 H- -02 C AGTTT C AGG 2, 964 D- ■11 AAGAGTGGTG
3, 314 F- -49 GTCTTTGGTC 2, 960 X- -46 CATTCACCTC
3, 304 C- -36 J ί ί I \J ί J 丄 i^r Lr 1 957 Α- -17
3, 296 A- ■46 GGTGAAC AAC 2, 944 F- -50 C CACTCTTTC
3, 289 X- -18 GATCTC AGAC 2, 938 G- -48 TGAACTGTGC
3, 284 B- -18 CTAC AATGC C 2, 932 Α- -47 GCTTGATGAC
3, 284 A- -27 CGTGTTTGAG 2, 910 Α- -50 GTGGC ATTTG
3, 276 D- -28 CCTCTGAATC 2, 908 G- -20 TGCTCAGTTG
3, 269 G- -31 C AAACTC AC C 2, 906 X- -41 GGATTC ACTG
3, 268 B- -03 TC C CTGTTTG 2, 894 F- -38 TGAAATGCCC
3, 256 H- -44 AAC ATCTGGC 2, 883 D- -32 AAAC AGGTGC
3, 250 X- -50 CTTCAGTTCC 2, 878 G- -07 CGCTGAAATC
3 スコア プライマ 塩基配列 スコア プライマ 塩基配列
2, 874 F- -13 CTGATTCAGG 2, 494 G- -42 ATTT C AGC C G
2, 863 D- -40 TGGTTTTGCG 2, 485 H- -43 CTATC CAGTC
2, 857 B- -45 GTTTGAGC AG I, 480 F- -36 TGAGGTTTGC
2, 854 F- -22 AAAGTGC C AC 2, 478 A- -45 GATGAGTTC G
2, 846 D- -44 AC ATTGGC AG 2, 474 A- -15 CTTACCTGAC
2, 828 G- -43 CTTCTTTCGG 2, 451 H- -26 GTTGTTCACC
2, 827 E- -19 C AC C ATTTGC 2, 444 E- -34 ATACACCCAC
2, 825 X- -24 GATC ATGGTC 2, 442 B- -42 GTATC AGGAG
2, 808 G- -37 CTC CTGAT AC 2, 433 B- -21 C AGTGGTATG
2, 798 B- -28 C ACTTTTC C G 2, 425 D- -27 C CTGAATCAG
2, 795 D- -08 CATCCTTGTC 2, 410 c- -46 TGAC AGTCAC
2, 791 G- -05 C AC C ATTC AC 2, 409 A- -29 GACTGGATAG
2, 770 H- -22 GTAATGGTGG 2, 405 E- -36 TTTGTCACCG
2, 770 c- -39 AGC C AGTTTC 2, 384 E- -14 AATGGTCTGC
2, 762 c- -19 AC AGTGCTAC 2, 364 H- -49 AAAAGACCCG
2, 761 D- -15 C AATCTGCTC 2, 325 X- -08 TGGTAAAGGG
2, 742 A- -25 AATGAC AGCG 2, 323 A- -37 C ATTAC C AGC
2, 726 X- -30 TACTGTTGCC 2, 321 X- -17 GATCTGACAC
2, 721 c- -31 GGAACTAC AG 2, 321 F- -48 TTCATTCCCG
2, 718 B- -50 TGAAC AGGTG 2, 314 G- -09 C ATTACTGC G
2, 712 X- -42 ACTTTTGGCG 2, 312 A- -40 CTACAAGTCC
2, 699 H- -48 ATTTCTGCGG 2, 308 H- -07 C ATAC C ACTG
2, 684 E- -08 TC AAC ATC GC 2, 292 G- -12 TC AC C CTTTG
2, 661 E- -29 AGC AC AATGG 2, 283 c- -04 TTTGAGC AC G
2, 656 X- ■05 GGAAC C AATC 2, 276 F- -16 AAAC CTGTC G
2, 649 E- -24 TGC CTCATTG 2, 273 X- -15 GTAC C AGTAC
2, 649 B- ■04 TCTTGAGC AG 2, 253 G- -17 GAC AATCTGG
2, 648 E- -35 AAAGGC ATCG 253 -44 GCTGTATCAG
2, 644 c- -38 AGGC AAACTG
241 c- -29 CGTGAGTTTC
2, 628 H-46 CTC AAACACG 2, 235 c- -10 TGC C AGTATG
2, 628 H- ■13 AC CTTTC AC C 2, 232 H- -14 GGC ATTGTAG
2, 615 G- -03 GAAACTCACG 2, 231 X- -38 GTC AGGTAAG
2, 612 c- -25 GATTTC AGCG 2, 223 D- -13 GC AAGTGTAG
o
ί, ol A- -39 GTTGGC ATTC 2, 213 B- -34 GTC CTGATAC
2, 606 E- -50 TTTTCTGCGG 2, 210 H- -03 CATACCAGAC
2, 585 X- -23 1 し 丄 r し 2, 173 D- -14 T丄 T T丄 し A し Δ しし
2, 571 c- -23 TTGGCTGTAC 2, 170 X- -12 CTGCTTGATG
2, 571 A- -09 CCGTGAAAAG 2, 168 X- -39 GAC AATCTGC
2, 570 A- -13 GCAGATTGTC 2, 168 H- -27 CGAACTCATC
2, 559 D- -38 TTGC AGGTTG 2, 165 X- -01 TACAACGAGG
2, 551 c- -08 CCAGATTGTC 2, 152 G- -44 GTATC AGGAC
2, 548 E- -30 CTGGTTGATG 2, 143 F- -09 GCGTTTGATG
2, 530 B- -02 C C AC C ATTAC 2, 134 H- -35 GCTGGTAATG
2, 510 E- -20 AGTGAC ATCG 2, 130 c- -02 C AGTATCAGC
2, 506 G- -22 AATCTCACCC 2 127 H- -18 GAAAATC CGC
4 スコア プライマ 塩基配列 スコア プライマ 塩基配列
2, 109 A- -10 CAGTGAATCC 1, 692 E- -06 GT AAAC T C C G
2, 104 G- -21 TGAAAGTCCG 1, 689 A- ■20 GTGCCTTATC
2, 095 A- -11 AAATGGAC GC 1, 684 F- -28 ACCCTATCTC
2, 089 X- -37 AGCAGATACG 1, 622 G- -40 TGTAATCCGC
2, 084 D- -24 TTATCCCCTG 1, 615 E- -10 C ACTAAC AC C
2, 066 B- -15 C AGTATGGTG 1, 614 F- -45 C C ACTATCTG
2, 033 B- -31 TCAGATTGCG 1, 611 A- -23 GGAGTTT AC G
2, 031 F- -44 GCTTACTTCC 1, 609 F- -27 GTGCTTTACG
2, 017 D- -25 C ACTAAAGGG 1, 608 H- -15 C AC C ATACTG
2, 005 D - -46 GCTC AGTATC 1, 595 A- -30 GAAACGATGG
1, 990 c- -50 TATGTGAGCG 1, 594 E- -33 ATTTGGTCGG
1, 987 D- -26 TCGCATCAAC 1, 588 c- -41 C AGATAGTGG
1, 976 F- -02 GATACTGAGC 1, 574 B- ■24 AGTGCTTAC C
1, 965 F- -26 CTAC ACTTGC 1, 566 F- -20 C ACGGAAATG
1, 961 B- -26 GTCTGGTATG 1, 531 F- -23 TTCGGTGATG
1, 946 B- -12 GCGGATTTTC 1, 521 X- ■33 GATAAGGC AC
1, 935 F- -39 GTTTACCTCC 1, 517 G- -02 CTGTAGTTC C
1, 924 c- -15 AGGGGAATAC 1, 516 H- -04 C C AC GTTTTC
1, 914 E- -05 CTGATAC AGC 1, 500 c- -12 TGATTGGTCG
1, 913 D - -30 CATCAAACGC 1, 493 E- -39 GGTGTTAGTG
1, 913 c- -35 ATTCGTGGAG 1, 490 H- ■29 C ATC GTGTTG
1, 899 X- -43 CTTTTC AC GG 1, 486 X- -28 CGTAAACTCC
1, 897 D- -12 CGTAAAGC AC 1, 486 F- ■14 C C CTTTAGTG
1, 893 D- -01 GGAGGTAAAC 1, 480 c- -21 CGC AGTAATG
1, 889 E- -43 CGGAGTTTAC 1, 476 F- -18 GCAGATTACG
1, 835 H- -30 ACTTGTCACG 1, 472 X- -36 C C C GTTTTTG
1, 827 c- -05 AAC GAGAGAG 1, 455 B- -30 C AAAACGCTG
1, 825 X- -49 TGACTGTTCG 1, 447 D- -37 GCTC AATACG
1, 825 D- -16 CCCCTATTTG 1, 440 G- -16 TTCGCTGATG
1, 821 B- -16 ATGACTAC CG 1, 424 X- -48 TTAGCATCCG
1, 820 G- -39 ACTGTTTCGG 1, 419 H- -17 TATCGCTGTC
1, 816 F- -37 TGACGGCAAC 1, 418 H- -50 ACGGGTAAAG
1, 814 G- -14 AGGTAAAGCG 1, 418 D- -23 TAC AC CGAAC
1, oil D- -4b GGCTATTCTC 1, 406 G- -29 GAGAATAGC C
1, 792 B- -25 GAAAACGTGG 1, 403 A- -08 ACTAATGGGC
1, 772 A- -28 丄 上 丄 I UT LT LT ^Jし 1 390 G- -23 ϋ丄 しし 丄 しし
1, 760 F- -19 TAGTTGC CTG 1 374 F- -08 C CTAATC AGC
1, 746 F- -32 TCGGATTTGC 1 372 X- -27 GTGATAACCG
1, 743 D- -18 AGTGGGTTAC 1 371 X- -26 GATCTAAGGC
1, 737 G- -26 GCTGATACTG 1 357 B- -19 GAGTCCTATG
1 735 H- -09 TTTCAC CGTG 1 354 X- -06 AAACTCCGTC
1 725 H- -33 GGACTTGTAG 1 354 F- -06 CGTATTGAGC
1 711 D- -05 TCTGACGATG 1 352 H- -12 AGTC AACGTC
1 701 A- -18 CAAAAACGGG 1 340 D- -34 GCTGATTAGG
1 699 A- -36 AGTGTAAGGG 1 339 F- -21 CAAATAGGGG
5 スコア プライマ 塩基配列 スコア プライマ 塩基配列
1, 338 B- -01 AGC C GAAATG 1,023 X- -44 TGTTATCCCG
1, 337 C- -48 C GTTATGAGC 1,001 X- -13 GTTTTCGCAG
1, 327 X- -19 GATCATAGCC 987 E- -32 ATTCGCAGTG
1, 319 F- -46 TTTTTCCGCC 979 E- -37 GAAC GGATAC
1, 319 D- -22 CGTAATCTGC 979 A - -48 ACCGTGATTC
1, 312 A- -04 ACTGATACCG 973 D - -10 GCGGTAAATC
1, 305 A- -41 TTTCTGCGTC 956 A- -01 CTGTCGTTTC
1, 304 D- -17 CATTTCCGTG 955 A- -07 CCGACTATTC
1, 304 C- -20 CAGCGATTTC 952 X- -21 GATCTAACCG
1, 302 A- -24 CGGTTATCAC 951 B- -13 AATAC AC GGG
1, 292 G- -10 GAAATC GCTG 948 D- -09 CATC CGTTTG
1, 291 B- -08 TATTGAGCGG 930 D- -06 CACGAATGTC
1, 281 C - -43 ATGAAC GGTG 917 E- -03 ACCGTTGTTC
1, 251 B- -39 ATGAAGCGAC 883 A- -31 TGCGAC AATC
1, 249 X- -10 GGTACTAAGG 872 X- -09 TCGGTCATAG
1, 249 A- -38 AGTGCGAAAG 839 B- -06 AGCGTTCATC
1, 246 H- -11 C ATAGGACTC 822 B- -37 AGAGCGATAC
1, 238 G- -11 GTATGACGAC 821 E- -28 GTAACGCAAC
1, 236 G- -47 CAGCGTTTTG 805 G- -24 ATAAC C GC AC
1, 228 X- -07 TCGATACAGG 799 X- -31 AC C C GTTTAC
1' 228 F- -30 GATTTACCGC 791 X- -16 GATC ACGTAC
1, 205 C- -42 GGAAGTAAGC 784 H- -37 ACGGTCATAC
1, 193 G- -27 TTCGTTCTGC 765 D - -19 TATTGACGCC
1, 180 A-43 CAACACGATG 765 c- -18 GTCGTCATAC
1, 179 F- -31 CAAACGGATG 762 E- -38 C AATAGC GAC
1, 179 E- -15 TTAC GCTGTG 754 G- -18 AATAC GC C AC
1, 175 H- -45 TGCTCATACG 745 c- -47 GTTTACGGTG
1, 162 B- -32 GCGTATGTTG 744 D- -39 TCTACTCGTG
1, 158 X- ■20 GATC AATCGC 730 c- -30 TGAC CGTAAC
1, 143 D- -31 ACGGGTAATG 718 B- -43 GATTTACGCG
1, 128 B- -29 AAAGTC CGTG 713 E- -12 GTATCCGTTC
1, 124 D- -36 TGTTATGC CG 709 F- -15 AC ATACGAGC
1, 117 X- -47 ACGGATGTAG 696 F- -42 CACCGTAAAC
1, C- -17 AAACGCTCTG 694 - -41 GTTC GTAAGC
1, 097 H- -41 CCATCGTTTC 693 c- -03 TCCGTATGTC
1, 090 G- -49 i. j R ue onu G- -34 vji . 1
1, 083 G- -36 ATCGCCATAC 677 G- -32 CCCGTAAATC
1, 082 F- -43 TAAAACGCCC 673 E- -11 GTCGCTATTG
1, 078 F- -34 GAC ATTCGTG 640 E- -21 TGATTAGCGG
1, 076 F- -41 GCTCATAACG 634 c- -40 TGACGATAGC
1, 070 G- -45 CAACATACGC 616 B- -38 GCTTACGAAC
1, 066 X- -25 GATCATAGCG 609 X- -45 GAATAGTCGG
1 062 X- -22 GATCGC ATTG 581 E- -17 GTTGCGTTAC
1 059 D- -20 ACCAAACGAC 551 c- -26 AC AGCGTATG
1 048 X- -11 TACCTAAGCG 526 F- -25 ATGC GTAAGG
更に、 この解析結果を確認する目的で、 得られた 450本の配列を用いて、 ヒト ゲノム或いはマウスゲノム DN Aを用いて RAP D解析を行い、 P C R産物の増 幅度、 ラダ一(複雑度)の数によりソーティングを行い、 更にその中から、 ソート 結果に基づき、 増幅度とラダ一パターンの少ないもの (グループ 1) 、 及び増幅 度の多いもの (グループ 2) からいくつか選び、 PCRを行った。 図 5は選ばれ たプライマの 10 mer配列のヒトゲノム DN Aを铸型としたときの RAP D解析結 果とホモログ ·スコアとを示す説明図である。 即ち、 450本の 10 mer配列全てにつ いて、 RAPD解析を行い、 パターンの違いによる分類を行い、 RAPDパター ンの少ない 10 mer配列 (グループ 1) と多い 10 mer配列 (グループ 2) から、 レ、 くつか選び、 再び RAPDを行った。
その結果、 例外もあるもののほぼ、 予想通り、 ホモログ ·スコアの高いプライ マ一と、 低いプライマーのグループを用いた時、 増幅される P C R産物のパ夕一 ンに相関があることが判明した (図 5) 。 各グループのスコアの合計を示したが 、 その差は明らかである。
この結果は、 使用したデータベースに登録されている配列に、 大きな偏りがあ つたとしても、 このような解析には意味があり、 特にゲノム解析のような巨大な 遺伝子解析にとって、 有効な情報を提供するものと思われた。
以上のような結果を踏まえて、 以下の 2点を考慮に入れてオリゴリボヌクレオ チドを設計し、 合成した。
第 1に、 ホモログ ·スコアの低い配列ほど、 ゲノム上にその配列の出現頻度が 低いことが予想される為、 ホモログ ·スコアの低い配列を参考にする。
第 2に、 平滑末端を形成する制限酵素で処理された DNA断片のライゲーショ ン効率は、 低いことが知られている。 このことより、 オリゴリボヌクレオチドの 末端によって、 TAP処理した mRNAの 5' -末端へのライゲ一シヨン効率が異 なることが予想された。
この 2点を考慮に入れて設計し、 オリゴリポヌクレオチドを 7種類作成した。 図 6は作成した 7種のオリゴリボヌクレオチドの配列と比較とした Vectorette(N u Acids. Res., 18:2887- 2890(1990))の配列である。 図において、 各配列の下に示 した括弧内に、 10 mer配列の名称を示した。 また、 図 6に示した合計 8種のオリ
ゴリボヌクレオチドの配列は後述する配列表の配列番号 1〜 8に示した。 尚、 各 オリゴリボヌクレオチドは合成し、 HPLCを用いて精製した (二ツボンジーン カスタム合成サービス利用) 。
各オリゴヌクレオチドのうち最初の 7種類は、 表 5に示したホモログ ·スコア の低い配列に相当する配列の全部又は一部をつなぎ合わせた構成となっている。 例えば、 「GG」 なるオリゴリボヌクレオチドでは、 ホモログ *スコアの最低な 3つの 1 0塩基配列(E— 1 7、 C— 26、 F— 2 5 ; Tを Uに変更)同士をつな ぎ合わせた構成となっている。
実施例 5. ヒト胎盤性 5' c DNAの合成とヒト胎盤性ラクトゲン mRNAの 5' -末端の解析
ヒト胎盤性ラクトゲンを例に mRNAの 5'-末端配列の解析を行った。 ヒト胎 盤は、 出産直後の胎盤を出来るだけ素早く凍結したものを RN A抽出の出発材料 とした。 凍結した胎盤は液体窒素中に浸し、 融解しないように注意して、 細かく 砕き、 凍結したままグァニジンチオシァネート溶液に入れ、 ポリ トロン ·ホモジ ネー夕一にて、 可溶化し、 全 RNAを抽出した。 この全 RNAは、 更にオリゴ d Tセルロース (ギブコ BRL社) にて、 ポリ A + RN Aを分離した。
典型的な例として、 ヒト胎盤 10gの組織から、 全 RNAは、 2.5mg、 更に全 RN A 6mgから、 ポリ A + RNAは、 0.06mg抽出出来る。 更に付言するとこの R N Aの 分離法は、 もちろんここに挙げた方法に限定するものではなく、 例えば Method, in Enz. Vol. 152 (1987), Academic Pressに詳しく解説されている。
次に以下のようにヒ,ト胎盤性 5'-c DNAの合成を行った。
第 1工程:不完全 mRNAの 5'-末端の脱リン酸化反応
反応体積 100 1中にヒト胎盤性ポリ A + RNA、 5 g、 0.1M Tris - HCK lOmM DDT、 pH 7.6、 160U RNasin (プロメガ社) 、 10U アルカリホスファターゼ (C I AP, 二ツボンジーン) を含むように調製し、 37で、 30分間保温した。 反応後 、 溶液中のタンパク質を変性、 アルカリホスファターゼを不活化、 RNAを精製 する目的で、 フエノール処理を 1回、 クロ口ホルム処理 1回、 エタノール沈殿を 1回を行うことにより行い、 50 1のジェチルピロカーボネート処理した H2O ( 以下、 DEPC— H2Oと記す) に溶解した。
第 2工程: TAP処理
C I AP処理後の RNAを含む 1に、 10倍濃度の TAP buffer (500mM 酢 酸ナトリウム、 pH 5.5、 50mM EDTA、 lOOmM /3 -ME) 、 160U RNasin、 300U TAP を加え、 DE P C— H2〇で反応体積 100/ 1として、 37°Cで 1時間反応した。 フ エノ一ル処理を 1回、 クロ口ホルム処理 1回、 エタノール沈殿を 1回を行うこと により、 行い、 33.5/x lの DEPC_H20に溶解した。
第 3工程: T4 RN Aリガーゼによるオリゴリポヌクレオチドの付加
第 2工程で作製した C I APZTAP処理 RNA、 33.5/z lに、 10 /g オリゴリ ボヌクレオチド (ここでは実施例 2で示した AAを使用した。 A A : GUUGCGUUAC ACAGCGUAUGAUGCGUAA) 、 10xT4RNAリガ一ゼ緩衝液 (500mM Tris- HC1、 lOOmM MgCl 2、 lOmM i3— ME、 lOmM ATP) 、 0.5 z 1 lOOmM ATP、 160U RNasin, 250U T 4 RNA リガ一ゼ (New England Biolab. Inc) を最終反応体積 50 1として 、 よく混合し、 50 1の 50%ポリエチレングリコ一ル 6000 (PEG6000) を加え、 最終濃度 25% PEGとして、 20でで 16時間、 保温した。
反応終了後、 P EGによる粘性を下げるため、 200 1の DEPC— H2〇を加 えよく撹拌し、 粘性を下げてから、 フエノール処理を 1回、 クロ口ホルム処理 1 回行い、 1 lのエタチンメイト (二ツボンジーン) 、 30 1の 3 M酢酸ナトリウ ム溶液を加え、 混合後、 エタノール沈殿を行った。 沈殿は回収し、 乾燥後、 100 lの DEPC— H2〇に溶解、 50 1の酢酸アンモニゥムを加え、 エタノール沈殿 を行った。 このエタノール沈殿の操作は、 3回繰り返した。 最終的には、 ェタノ ール沈殿物を乾燥させ、 50 1の DE P C— H2〇に溶解し、 キャップ構造をオリ ゴリボヌクレオチドで置換された精製されたオリゴ ·キヤッビング RN Aとした 第 4工程:第 1鎖 cDNA合成
50μ 1のオリゴ ·キヤッビング RNAを铸型に、 の 20 Μ ランダム 'へキ サマーを加え、 合計 55 1を、 70で、 10分間保温、 氷上 2分で冷却し、 直ちに、 20 1の 5x First strand buffer (ギブコ BRL社製) 、 ΙΟμΙの 0.1M DTT、 20/ι M dNTP混合液、 5 1の RNasinを加えて 95μ 1とし、 37 :、 2分間保温後、 直ちに 5 z l(lOOOU)の Superscriptll (ギブコ BRL社製) を加え、 37で、 30分間、 反応した
。 反応後、 95°C、 10分間保温し、 酵素を失活させ、 400 1の DE P C— H2Oを加 えて、 500 1のヒ卜胎盤性オリゴ ·キヤッビング c DNAを作製した。
このように作製したヒト胎盤性オリゴ ·キヤッビング c DNAの評価を、 胎盤 性ラクトゲンの 5'-末端配列の解析を行うことにより評価した。
ヒト胎盤性ラクトゲンは、 成長ホルモン遺伝子フアミリーに含まれるぺプチド ホルモンで、 分子量 22kDaで、 ヒト第 17染色体上にクラス夕一を形成し、 その発現 様式等の研究が進んでいる (Genomics, 4(4) :479- 497 (1989))。 また、 ヒト胎盤性 ラクトゲンについては、 胎盤で転写開始点の異なる転写物が存在することが既に 報告されている (Biochem. Int., 16 (2) :287- 292 (1988))。
第 5工程:第 2鎖 cDNA合成
ここで、 胎盤性ラクトゲン遺伝子の配列より作製した遺伝子特異的プライマ一 ASP1 (5' -GTTGGAGGGTGTCGGAATAGAGTC-3' ) と、 A Aオリゴの一部の配列を持つ A Aオリゴ特異的プライマ一 RC5' (5' -GCGTTACACAGCGTATGATGCGT-3' ) とを用いて P CRを行った。 尚、 プライマー ASP1とプライマー RC5'との配列は後述の配列表の 配列番号 9, 1 0に示す。 更に詳しく記述すると、 ヒト胎盤性オリゴ ·キヤツビ ング c DNAを l i l、 5 1の lOxGeneTaq buffer (二ツボンジーン社製)、 5 1の 2.5mM dNTP混合液、 2 1の ASP1及び RC5' (各 25 M)、 2.5Uの GeneTaq (二ッポ ンジーン社製)で、 最終反応体積 50 1として、 95 、 5分の後、 (94°C/30秒、 5 5°C/30秒、 72°C/60秒) を 35サイクル行い、 最後に 72で /5分の反応で P C Rを行つ た。
この P CR産物のうち、 5 1を 1.2%ァガロース電気泳動を行い、 予想されるサ ィズに P CR産物を検出し、 ヒト胎盤性ラクトゲン mRNAの 5'-末端由来と考 えられた。 この P CR産物を T4 RNA ポリメラ一ゼを用いて平滑末端として 、 予め制限酵素 Smal消化、 脱リン酸化処理済みのプラスミド PUC19にサブクロー ニングし、 塩基配列の決定を行ったところ、 (Genomics, 4(4) :479- 497 (1989))及 び (Biochem. Int. , 16 (2) :287- 292 (1988))で報告されているのと一致するヒト胎 盤性ラクトゲン mRNAの 5'-末端の配列であることを確認した。
図 7はヒト胎盤性 5' c DNAから、 ヒト胎盤性ラクトゲン mRNAの 5'-末端 解析結果を示す説明図である。 図 7に示すとおり、 合計 25クローンの塩基配列の
決定を行い、 先の文献に報告されている完全長のクローン (配列 a + b) が 20ク ローンで、 実に 80%が完全長クローンであった。 残り 5クローンについては、 1 塩基短いクローン (配列 c) が 4個、 8塩基短いクロ一ン (配列 d) が 1個であ つた。 この確率は、 5' RAC Eでの解析では、 ほとんど全てのクローンにおいて 、 数十塩基の欠失が認められるのに較べると格段に高く、 mRNAの 5'-末端配 列を決定する非常に優れた方法であることを確認した。 また、 図の矢印 1に示す 報告されている転写開始点以外に別の異なる転写開始点 (矢印 2) が mRNAに あることが本発明の結果から確認できた。
実施例 6. オリゴリボヌクレオチドの評価
実施例 4で示した各オリゴリポヌクレオチドの評価を、 実施例 5の第 3工程で 示した反応系に各オリゴリボヌクレオチドを使用することで、 最終的な c DNA まで合成し、 ヒト胎盤性ラクトゲンの増幅度を較べることで行った。
反応は、 実施例 5と全く同じ条件で、 第 3工程のオリゴリボヌクレオチドのみ 変えて、 最終的なヒト胎盤性 5' c DNAを作製した。
各種オリゴリボヌクレオチド配列由来の配列をその 5'-末端にもつヒト胎盤性 5' c DNAを铸型に用いて、 胎盤性ラクトゲン 5' c DNAを増幅するプライマ -AS P 1を用いて、 各種オリゴリボヌクレオチド由来の配列にァニールするプ ライマ一を合成し、 ヒト胎盤性 5' c DNAを適宜、 希釈することで、 PCRを行 レ 各プライマーセットの増幅度を比較した。
PCRは以下のような条件で行った。 铸型であるヒト胎盤性 5' c DNAは 5倍 希釈系列で希釈した 1 し 2.5 Z 1の lOxGeneTaq buffer 、 2.5 lの 2.5mM dNTP 混合液、 0.5 zlの AS P 1及びオリゴリボヌクレオチド特異的プライマー (各 25 zM) 、 2.5Uの GeneTaqを、 最終反応量 25μ 1として、 95で、 5分の後、 (94°C/30 秒、 55で/30秒、 72で /60秒) を 35サイクル行い、 最後に 分の反応で P C R を行った。 この PCR産物の内、 5 1を 1.2%ァガロース電気泳動を行い、 その 増幅度を見積もった。 ここで使用したオリゴリボヌクレオチド特異的プライマー は以下の表 6の通りである。 尚、 表 6に示したプライマーの配列は、 後述する配 列表の配列番号 1 1〜 14に示す。
表 6
RNAォリゴ プライマー配列 (5'- 3'、 名称)
GG GT (RC5')
AA GCGTTACACAGCGTATGATGCGT (RC5")
GU (RC5')
RC+GU GTACGCCGTTGCGTTACACAGC (1RC5')
RC+AA GTACGCCGTTGCGTTACACAGC (lRC5i)
RC2+GU GCGTTACAAGGTACGCCACAGCGT (1RC2)
RC2+AA GCGTTACAAGGTACGCCACAGCGT (1RC2)
Vectoret te CGAATCGTAACCGTTCGTACGAG (vectorettel) ステップ 1 : RNAオリゴの GG、 AA及び GUの配列を比較した。 ァガ口一 スゲル電気泳動からの結果より、 ほぼ、 GG : AA : GU= 1 : 3 : 4の比で A Aが 1番、 効率が良いことが判明した。 この結果は、 GG、 AA及び GUの配列 は 3'-末端の配列のみの違いであることから、 T4 RN Aリガーゼの反応効率を 反映したものと予想され、 以後、 オリゴリボヌクレオチド配列の 3'-末端は AA 或いは GUの 3'-末端配列を参考にすることにした。
ステップ 2 :オリゴリボヌクレオチド配列を更に長くすることによって、 オリ ゴリポヌクレオチド由来の c DNA部分に、 数力所のプライマ一結合領域を設定 するため、 長めに設計した RC + GU、 RC + AA, AA及び GUと比較したと ころ、 RC + GUが最も敏感に P CR産物の増幅が認められた。
ステップ 3 :更に P CRプライマ一の効率の問題から、 ホモログ 'スコアの低 い別な配列での比較の為に、 RC 2 +GU、 RC 2 +AAと、 、 C pGアイラン ドが 5' -末端に位置するという事実から、 CGのジヌクレオチド配列が少なく、 かつホモログ ·スコアの低い別な配列を考慮して更に RO 1と R〇 2のオリゴリ ボヌクレオチドを合成し、 更に(Proc. Natl. Acad. Sci. USA, 91 (12) :5377— 5381 (199 4))に報告されている vectorette法に用いられた配列に基づいて設計した配列とを 合成し、 比較した。 尚、 RO 1と RO 2との 2種類のオリゴリボヌクレオチドは 、 CGのジヌクレオチド配列がない配列 (B— 1 9 (表 4) , H— 1 1 (表 5 ) , E— 05 (表 4) , B- 33 (表 2) , C— 1 0 (表 3 ) ) に示された 1 0塩 基配列(Tを Uに変更)の全部又は一部同士をつなぎ合わせた構成であり、 詳しい
配列は後述する配列表の配列番号 1 5 , 1 6に示した。
図 8は種々のオリゴリボヌクレオチド配列によって作られるヒト胎盤性ラク卜 ゲン mRN A由来の 5'-末端 c D N Aを P C Rと電気泳動によって評価する際の 説明図である。 図に示すとおり、 レーン 1 , 2, 3, 4で略 600bpのバンドが鮮明 に確認されたものの、 レーン 2の RC 2 + AAが最も効率よく、 胎盤性ラクトゲ ンの 5'-末端を増幅することが判った。
実施例 7. ヒト胎盤性オリゴ ·キヤッビング cDN Aからトランスフェリン受容 体 5' cDNAの解析
これまで解析してきたヒト胎盤性ラクトゲンの 5' c DNAの解析は、 ヒト胎盤 性ラクトゲン mRN Aの発現が全 mRN Aの約 3 %に及び極めて発現量が多い遺 伝子を対象にしてきた。 ここで、 発現量が中程度と言われているトランスフェリ ン受容体 mRNAの 5' c DNAについて解析を行った。
トランスフェリン受容体 5' c DN Aを増幅するプライマーとしては、 T FRA 3 (5' -GCTTCACATTCTTGCTTTCTGAGG-3' )又は T FRA4 (5' -GCTTGATGGTGCTGGTGAAG TCTG- 3')を用いた(McClelland, A.,et al.Cell 39:267-274 (1984))。 尚、 プライマ — TFRA 3及び T FRA4の配列は後述する配列表の配列番号 1 7, 1 8に示 す。 これらをヒト胎盤性オリゴ ·キヤッビング c DNAを 1 μ 1、 2.5 1の 10xG eneTaq buffer, 2.5 1の 2.5mM dNTP混合液、 0.5/ 1の T R F 4及び 1 R C 2 (各 25 M) 、 2.5Uの GeneTaqで、 最終反応体積 25 1として、 95で、 5分の後、 (94で /30秒、 55で/30秒、 72で /60秒) を 35サイクル行い、 最後に 72で/5分の反応で P C Rを行った。
図 9はヒト胎盤性オリゴ ·キヤッビング c DN Αからのトランスフェリン受容 体 5' c DN Aの P C Rによる増幅結果を示す説明図である。 図において、 a図は T F RA 3又は T F RA4の 2つのプライマーを用いた場合の予想される P C R 産物のサイズの概要を示し、 b図は電気泳動の結果を模式的に示した説明図であ る。 得られた P CR産物の内、 5 1を 1.2%ァガロース電気泳動を行った結果、 TR FA4の予想される 530bpに P CR産物を検出し、 このことがヒト胎盤性トラ ンスフェリン受容体 mRNAの 5'-末端由来と考えられた。 尚、 TRFA 3につ いては、 1200bpの予想されるサイズの箇所にはバンドが見えなかった。 これは、
TR FA 3のプライマーで得られる P CR産物の長さが大きすぎたためと考えら れた。 従って、 P C R産物を得るためには、 300〜500塩基程度の P C R産物にな るようにプライマ一を設計することが重要である。
この増幅産物は、 T4 RNA ポリメラ一ゼを用いて平滑末端として、 予め制 限酵素 Smal消化し、 脱リン酸化処理済みのプラスミド pUC19にサブクローニングし 、 塩基配列の決定を行ったところ、 (Cell, 39:267-274 (1984); ENBO. J. 6:1287 - 1293 (1987))に報告されている通りの 5' -末端配列であることがわかり、 本発明 によるヒト胎盤性ォリゴ ·キヤッビング c D N Aにより、 コピー数が少ない m R N Aであっても、 その遺伝子の完全な 5' c DNA配列の解析に有効であることが 確認された。 これらの結果は従来の 5'- RACEに較べて、 本発明に基づく方法 が、 極めて高い確率で 5' c DNA配列の解析を行い得ることを示している。 何故ならば、 5' RACEの場合、 逆転写反応の後にアダプターを付加して P C Rを行うので、 転写開始点まで逆転写が行かなかった産物までも P CRの対象に なる。 本発明では原理的に RN Aのキャップ構造を特異的に外す酵素を用いて、 オリゴリポヌクレオチドを付加し、 逆転写しているので、 PCRでは、 このオリ ゴリボヌクレオチドに相補的なプライマ一を使うことにより、 キャップ構造に隣 接する転写開始点を含む c DN Aのみが P C Rの対象になり、 そのため、 極めて 高い確率(殆ど 1 00 %)で、 5' c DNAを解析することができる。