明細書
結合分子予測方法およびその利用方法 技術分野
本発明は、 結合分子未知タンパク質の結合分子予測方法、 該予測方法を用いた 医薬の製造方法、 及び結合分子未知タンパク質の結合分子を予測するためのコン ピュータに関し、 より詳しくは、 結合分子既知タンパク質のアミノ酸配列 (又は シークェンスアラインメント) とその結合分子又は結合分子の種類とに関する情 報から結合分子未知タンパク質の結合分子又は結合分子の種類を予測する方法、 該方法を用いた医薬、 及ぴ当該方法に用いられるコンピュータに関する。 さらに 本発明は、 結合分子や結合分子の種類を予測することを通して結合分子が未知で あるタンパク質の機能を予測する方法等に関する。 背景技術
ヒ トゲノムの配列情報が公開され (N a t u r e 第 4 0 9巻、 第 6 8 2 2号 ( 2 0 0 1 ) ; S c i e n c e 第 2 9 1卷、 第 5 5 0 7号 (2 0 0 1 ) ) 、 既 知の遺伝子も含め 3— 4万の遺伝子の存在が報告された。 しかし、 遺伝子と細胞 内機能の関係が未知のものが数多く存在している。特に、疾病'疾患の原因となる 遺伝子に関する情報はその病態を明らかにする上で重要であるばかりでなく、 そ の診断 ·予防 '治療に用いる医薬を開発する場合にも必要不可欠なものである。 医薬開発の標的となりうる分子は、 その分子を含む医薬が体内に入ったとき直 接または間接的に他の分子と結合するような分子であり、 ほとんどの場合がタン パク質と考えられる。 このタンパク質としては低分子物質を結合するタンパク質 、 低分子または高分子の基質に対して触媒活性を有する酵素、 高分子物質を結合 するタンパク質などが挙げられる。 その中でも低分子物質を結合するタンパク質 を標的とする医薬品が非常に多く存在する。 標的分子として特に注目されるタン パク質として、 膜タンパク質としてシグナルの伝達に関与する Gタンパク質共役 型受容体タンパク質があげられる。
膜タンパク質の例では、 細胞外から細胞内へのシグナルの伝達は、 膜貫通ドメ
インを有する膜タンパク質がその膜貫通ドメインで構造変化を生ずることにより 進行する。 膜貫通ドメインを有する上記の Gタンパク質共役型受容体タンパク質
(G r o t e i n c o u p l e d r e c e p t o r p r o t e i n, 以下 GP CRと略すことがある) は 7回膜貫通ドメインをその分子内に有するシ グナル伝達に関与する膜タンパク質である。 GPCRは細胞外側に N末端を有し 、 7回膜貫通ドメインを経て細胞内に C末端を有するトポロジーを持ち、 リガン ドはその種類によって N末端領域や膜貫通領域に結合する。また、細胞内の C末端 部分と細胞内ループ 2に Gタンパク質が結合することが知られている。 現在まで に唯一 GP CRファミリーの一種である口ドプシンの結晶構造解析が行われてい る (P a l c z ews k iら S c i e n c e 第 289巻、 739— 745頁 (2000) ) が、 その他の GP CRの結晶構造解析に関する報告はない。 ま た各種生物学実験により、 以下のように G P C Rの活性化が起きることが明らか となってきた。 即ち、 ( i) 受容体にリガンドが結合し、 GPCRの構造の変化 する。 ( i i) 共役 Gタンパク質に GPCRの構造変化が伝達され、 Gタンパク 質の一部が遊離する。 ( i i i ) 情報 (シグナル) が細胞内へ伝達される。 受容体と特異的に結合する分子はリガンドと呼ばれる。 GPCRの場合、 既知 のリガンド分子としては、 ドーパミン、 セロトニン、 メラトニン、 ヒスタミンの ような生体ァミン、 プロスタグランジン、 ロイコトリェンなどの脂質誘導体、 核 酸、 グルタミンなどのアミノ酸、 アンギオテンシン、 セクレチン、 ソマトス夕チ ンのような生理活性ペプチド類などがあげられる。
Gタンパク質はシグナル伝達系においてトランスデューサ一として機能し、 ひ 、 β、 ァの 3種のサブユニットから構成される。 これらのうち αサブユニットは GTPへの結合および G Τ Ρを加水分解する活性を有し、 各々の Gタンパク質に 特有のサブユニットである。 即ち、 共役する Gaタンパク質の種類により、 GP CRの機能が決定されることになる。 現在までに、 Go;タンパク質としては Gs 、 Gい G。および Gtが単離精製され、 その性質が調べられている。
Gタンパク質共役型レセプ夕一タンパク質は生体の細胞や臓器の各機能細胞表 面に存在し、 それら細胞や臓器の機能を調節する分子、 例えば、 ホルモン、 神経 伝達物質および生理活性物質等の標的として生理的に重要な役割を担っている。
レセプタ一は生理活性物質との結合を介してシグナルを細胞内に伝達し、 このシ グナルにより細胞の賦活ゃ抑制といつた種々の反応が惹起される。
各種細胞や臓器における複雑な機能を調節する物質と、 その特異的レセプター タンパク質、 特には G夕ンパク質共役型レセプ夕一タンパク質との関係を明らか にすることは、 各種細胞や臓器における複雑な機能を解明し、 それら機能と密接 に関連した医薬品開発に非常に重要な手段を提供することとなる。
近年、 生体内で発現している遺伝子を解析する手段として、 c D N Aの配列を ランダムに解析する研究が活発に行なわれており、 その結果として得られた c D N Aの断片配列が Expressed Seauence Tag ( E S T ) としてデータベースに登録 され、 公開されている。 しかし、 多くの E S Tは配列情報だけを提供し、 配列が 有する機能を推定することは困難である。
Gタンパク質共役型レセプ夕一はその全てが見出されているわけではなく、 現 時点でもなお、 未知の Gタンパク質共役型レセプター、 また対応するリガンドが 同定されていない、 いわゆるォ一ファンレセプターが多数存在しており、 新たな Gタンパク質共役型レセプ夕一の探索および機能解明が切望されている。
ゲノムの配列情報が公開されたことにより、 既知の配列情報と比較することに よって何らかの機能を有すると推測できる遺伝子領域を調べることが可能となつ た。 遺伝子の塩基配列間もしくはそれが翻訳されたタンパク質のァミノ酸配列間 の類似性に基づき、 新規タンパク質の結合分子や機能の予測が実施されている。 上記のように、配列の類似性を計算し、配列間の適切な対応関係(シークェンスァ ラインメント)を表示するソフトとして C lus t al Wや BLASTなどが用いられている。 これらのソフトから得られたシークェンスアラインメントを用い、 類似性解析に よって、 新規タンパク質にはその類似タンパク質と類似の機能があるという概念 に基づき、 機能予測が実施されている。 このような類似性に基づく予測は、 基本 的な機能の予測には貢献するが、 基本的な機能が同じタンパク質グループに対す る結合分子の予測に関しては効果が乏しい。 例えば、 その新規タンパク質が G P C Rかどうかの分類化には役立つが、 類似度が極めて高いものでない限り、 その G P C Rに結合するリガンドゃ共役 Gタンパク質の種類の予測には不向きである 。実際に G P C Rに結合する未知のリガンド分子を検索'決定するためには、細胞
抽出物などを利用して多くの候補化合物の活性測定を行う必要があるが、 物性の 異なる結合分子の候補化合物は同時に評価することができないという問題が生じ る。 そこで、 複雑な活性測定などを行うことなく、 リガンド分子の種類を予測す ることができたとすれば、 効率的なリガンド分子の決定に結びつくこととなる。 したがって、 タンパク質の配列情報を類似性とは異なる概念で捉えることが必 要となる。 類似性によって分類されたタンパク質グループ(例えば GPCR)内の各メ ンバ一に対して、 各タンパク質に結合する分子を予測することができれば、 リガ ンドの同定やそのタンパク質とリガンドの機能解析に有用である。 そのために、 タンパク質の 1次元的な配列情報から立体構造を予測し、 計算機上での結合実験 によって結合分子を予測する検討も実施されている。 しかし、 現状ではタンパク 質の立体構造の予測および計算機上での結合実験の精度がないために、 実用的で ない。 これらの精度の低さと煩雑さを回避し、 配列情報から直接結合分子や機能 について検討できることは本発明の技術分野において有用なことである。
配列情報から、 結合分子や機能を予測する方法としては、 例えば、 限定された 既知の GPCRに対して、 共役する Gひタンパク質の種類の決定に関与すると思 われるアミノ酸の変異 (ならびにその変異位置) についての報告がなされた (Bu lseco and Sc imerlik, Molecular Pharmacology, 49: 132-141 (1996); Burste in, Spalding and Brann, Biochemistry, 37: 4052-4058 (1998); Kazmi et al. , Biochemistry, 39: 3734-3744 (2000)) が、 新規 G P C Rに対して共役する G αタンパク質の種類を予測するような報告は知られていない。
また、 やはり GPCRに関して、 GP CRとリガンド双方のアミノ酸の変異を 解析することにより、 リガンドとその G P C Rの結合に関与する部位を予測する 方法、 即ち correlated mutation analysis (CMA) 法が開発された (Singer e t al. , Receptors and channels, 3: 89-95 (1995)) が、 GPCRの配列を単独 で用いて未知の GPCRの結合分子(及び 又は結合分子の種類)を選択した報告 例はない。
以上のように、 例えば GPCRの場合、 GP CRの配列情報から直接的に GP CRに結合する (、 あるいは共役する) 分子又は分子の種類を予測し、 その機能 を予測することにつながる方法は知られていない。
また、 やはり G P C Rに関していえば、 新たな G P C Rを発見した場合、 その G P C Rを利用した医薬を製造するためには、 当該 G P C Rの機能を把握した上 で、 当該 G P C Rに結合する (、 あるいは共役する) 分子又は分子の種類を実験 等により把握しなければならず、 莫大な費用と手間がかかるという問題がある。 発明の開示
本発明は、 機能未知の配列情報に対し、 それに結合できる分子等を簡便かつ精 度よく予測する方法、 当該方法を用いた医薬の製造方法及び、 これらに用いられ るコンピュータに関する。
上記課題の少なくとも一つは、 以下の発明によって解決される。
( 1 ) 結合分子未知タンパク質に結合する結合分子を予測する結合分子未知タ ンパク質の結合分子予測方法であって、 アミノ酸配列と結合分子とが既知である 結合分子既知タンパク質について、 少なくとも 2以上の結合分子既知タンパク質 のシークェンスァラインメントと、 結合分子又は結合分子の種類とを対応付けた 結合分子既知タンパク質分類情報を得る工程と、 前記結合分子既知タンパク質分 類情報を用いて、 結合分子既知タンパク質のシークェンスァラインメン卜の位置 のうち結合分子を決定することに関与すると想定される位置である結合分子決定 残基位置を 1又は 2以上特定する工程と、 前記結合分子決定残基位置におけるァ ミノ酸残基 (結合分子決定残基) と、 結合分子又は結合分子の種類とを対応付け ることにより、 結合分子決定残基と結合分子又は結合分子の種類との相関関係を 表す結合分子決定残基一結合分子分類情報を得る工程と、 前記結合分子既知タン パク質と同じ種類の結合分子未知タンパク質について前記結合分子既知タンパク 質間のシークェンスアラインメントに対して結合分子未知タンパク質の配列を整 列させ、 結合分子未知タンパク質のシークェンスァラインメン卜を得る工程と、 前記結合分子未知タンパク質のシークェンスアラインメントのうち少なくとも結 合分子決定残基についての情報を、 結合分子決定残基一結合分子分類情報に当て はめ、 結合分子未知タンパク質の結合分子又は結合分子の種類を予測する工程と を含む結合分子未知タンパク質の結合分子予測方法。
( 2 ) 前記結合分子が、 リガンド、 調節因子、 エフェクター、 補酵素のいずれ
かである上記 (1) に記載の結合分子未知タンパク質の結合分子予測方法。
(3) 前記結合分子が、 2以上の種類に分類され、 当該分類された結合分子の 種類を予測する上記 (1) 又は (2) に記載の結合分子未知タンパク質の結合分 子予測方法。
(4) 結合分子未知タンパク質が、 Gタンパク質共役型受容体、 キナーゼ、 リ パーゼ、 卜ランスポーター、 プロテア一ゼ、 イオンチャンネルのいずれかである 上記 (1) から上記 (3) のいずれかに記載の結合分子未知タンパク質の結合分 子予測方法。
(5) 結合分子決定残基位置を 1又は 2以上特定する工程において、 シークェ ンスアラインメントを構成するアミノ酸残基と結合分子の種類とから結合分子決 定残基位置を 1又は 2以上特定する上記 (1) から (4) のいずれかに記載の結 合分子未知夕ンパク質の結合分子予測方法。
(6) 式 1、 又は式 2のいずれか又は両方を用いて結合分子決定残基位置を決 定する上記 (1) から (4) のいずれか 1項に記載の結合分子未知タンパク質の 結合分子予測方法。
(7) 式 3、 式 4、 式 5のいずれかひとつ以上を用いて結合分子決定残基位置 を決定する上記 (1) から (4) のいずれか 1項に記載の結合分子未知タンパク 質の結合分子予測方法。
(8) リガンド決定残基一リガンド分類情報を得る工程が、 リガンド既知タン パク質のアミノ酸残基のうち、関数 f 3 (n)の値が一番小さなリガンド決定残基位置 にあるものを抽出する工程と、 リガンド決定残基一リガンド分類情報にあげられ たリガンド既知タンパク質のうち、 抽出されたリガンド決定残基と一致するもの の数 (A) を求める工程と、 リガンド決定残基—リガンド分類情報にあげられた リガンド既知タンパク質のうち抽出されたリガンド決定残基と一致するもののう ちで、 リガンド又はリガンドの種類が当該リガンド既知タンパク質のものと一致 する数 (B) を求める工程と、 リガンド既知タンパク質のアミノ酸残基のうち関 数 f3 (n)の値が二番目に小さい又は X番目(ここで、 Xは 2より大きく 100より 小さな整数を表す。) に小さいリガンド決定残基位置にあるものを抽出する工程 と、 リガンド決定残基一リガンド分類情報にあげられたリガンド既知タンパク質
のうち、 抽出されたリガンド決定残基と一致するものの数 (C ) を求める工程と 、 リガンド決定残基一リガンド分類情報にあげられたリガンド既知タンパク質の うち抽出されたリガンド決定残基と一致するもののうちで、 リガンド又はリガン ドの種類が当該リガンド既知タンパク質のものと一致する数 (D ) を求める工程 と,、 (A) と (C ) との和 (E ) を求める工程と、 (B ) と (D ) との和 (F ) を求める工程とを含み、 (E ) と (F ) を更に表示するリガンド決定残基一リガ ンド分類情報を得る上記 (7 ) に記載の結合分子未知タンパク質の結合分子予測 方法。
( 9 ) アミノ酸配列と結合分子とが既知である少なくとも 2以上の結合分子既 知タンパク質について、 当該結合分子既知タンパク質のシークェンスァラインメ ントと、 結合分子又は結合分子の種類とを対応付けた結合分子既知タンパク質分 類情報を得る工程と、 当該結合分子既知タンパク質分類情報を用いて、 結合分子 既知タンパク質のシークェンスァラインメントのうち結合分子を決定することに 関与すると想定される位置である結合分子決定残基位置を 1又は 2以上特定する 工程と、 当該結合分子決定残基位置におけるアミノ酸残基 (結合分子決定残基) と、 結合分子、 又は結合分子の種類とを対応付けることにより、 結合分子決定残 基と結合分子との相関関係を表す結合分子決定残基一結合分子分類情報を得るェ 程とを含む結合分子未知タンパク質の結合分子予測方法。
( 1 0 ) 結合分子決定残基と結合分子との相関関係を表す結合分子決定残基一 結合分子分類情報に、 前記結合分子既知タンパク質と同じ種類の結合分子未知夕 ンパク質について前記結合分子既知タンパク質間のシークェンスアラインメント に対して結合分子未知タンパク質の配列を整列させて得られた結合分子未知タン パク質のシークェンスアラインメントのうち結合分子決定残基に関する情報を入 力し、 当該結合分子未知タンパク質に結合する結合分子、 又は結合分子の種類を 予測する結合分子未知タンパク質の結合分子予測方法。
この方法によれば、 結合分子が未知であるタンパク質のアミノ酸配列、 及び Z 又はアミノ酸配列を用いて得られるシークェンスアラインメントに関する情報を 得るだけで結合分子又は結合分子の種類を予測することが可能となる。 これによ り、 従来の 3次元構造まで予測するような分子モデリング法に比べ格段に迅速か
つ低コストに結合分子 (リガンド等) を予測することができる。 更に、 本発明に よれば様々な種類の結合分子が未知であるタンパク質に対してその結合分子又は 結合分子の種類を予測することができる。 また、 結合分子が未知であるタンパク 質に実際にあらゆる結合分子の候補が結合するかどうか実験するよりも容易かつ 迅速に結合分子又は結合分子の種類を予測することができる。 結合分子決定残基 一結合分子分類情報を得ることによって、 結合分子未知タンパク質のシークェン スアラインメントを得るのみで当該情報を当該表に当てはめ、 当該結合分子未知 タンパク質に結合する結合分子又は結合分子の種類を容易に予測することが可能 となる。
また、 上記課題のうち少なくとも一つは以下の発明によって解決される。 すな わち、
( 1 1 ) 上記 (1 ) 〜 (1 0 ) のいずれかに記載した結合分子未知タンパク質 の結合分子予測方法を用いて、 結合分子未知タンパク質に結合する結合分子、 又 は結合分子の種類を予測する工程を含む医薬の製造方法、
( 1 2 ) 医薬が、 中枢疾患、 炎症性疾患、 循環器疾患、 癌、 代謝性疾患、 免疫 系疾患または消化器系疾患の予防剤、 又は治療剤のいずれか又は両方である上記 ( 1 1 ) に記載の医薬の製造方法である。
また、 上記課題の少なくとも一つは以下の発明によって解決される。 すなわち ( 1 3 ) 式 6又は下記式 7のいずれか又は両方を用いた結合分子決定残基位置 を決定する方法。
( 1 4 ) 式 8を用いた結合分子決定残基位置を決定する方法、
( 1 5 ) 結合分子既知タンパク質のアミノ酸配列又はシークェンスァラインメ ントと、 結合分子又は結合分子の種類に関する情報とを用いて、 結合分子既知夕 ンパク質のシークェンスァラインメン卜の位置のうち結合分子を決定することに 関与すると想定される位置 (結合分子決定残基位置) におけるアミノ酸残基であ る結合分子決定残基と、 結合分子または結合分子の種類との相関関係を表す結合 分子決定残基一結合分子分類情報を得る、 結合分子未知タンパク質の結合分子を 予測するためのコンピュータであって、 当該コンピュータは、 結合分子既知タン
パク質のシークェンスァラインメントに関する情報を入力するシークェンスァラ インメント入力手段と、 前記シークェンスアラインメント入力手段により入力さ れた結合分子既知タンパク質のアミノ酸配列又はシークェンスァラインメントと 、 結合分子又は結合分子の種類に関する情報とを記憶するシークェンスァライン メント結合分子記憶手段と、 前記シークェンスアラインメント結合分子記憶手段 により記憶された結合分子既知タンパク質のアミノ酸配列又はシークェンスァラ インメントと、 結合分子又は結合分子の種類に関する情報を用いて前記結合分子 決定残基位置を決定する結合分子決定残基位置決定手段と、 前記結合分子決定残 基位置におけるアミノ酸残基 (結合分子決定残基) と、 結合分子又は結合分子の 種類とを対応付けることにより、 結合分子決定残基と結合分子または結合分子の 種類との相関関係を表す結合分子決定残基一結合分子分類情報を得る結合分子決 定残基一結合分子分類情報取得手段と、 前記結合分子既知タンパク質と同じ種類 の結合分子未知タンパク質について前記結合分子既知タンパク質間のシークェン スアラインメントに対して結合分子未知タンパク質の配列を整列させて得られた 結合分子未知タンパク質のシークェンスアラインメントに関する情報を入力する シークェンスァラインメント入力手段とを具備し、 結合分子決定残基一結合分子 分類情報に、 シークェンスアラインメント入力手段により入力された結合分子未 知タンパク質のシークェンスァラインメントに関する情報を用いて、 当該結合分 子未知タンパク質の結合分子、 又は結合分子の種類を予測する、 結合分子未知夕 ンパク質の結合分子を予測するためのコンピュータ、
( 1 6 ) 前記結合分子決定残基位置決定手段が、 少なくとも式 9又は式 1 0の いずれか又は両方の関数を用いる上記 (1 4 ) に記載の結合分子未知タンパク質 の結合分子を予測するためのコンピュータ、
( 1 7 ) 前記結合分子決定残基位置決定手段が、 式 9で表される関数を用いる 上記 (1 5 ) 又は上記 (1 6 ) に記載の結合分子未知タンパク質の結合分子を予 測するためのコンピュータ、
( 1 8 ) 結合分子未知タンパク質の結合分子を予測するためのコンピュータで あって、 当該結合分子未知タンパク質と同じ種類であり結合する結合分子が既知 である結合分子既知タンパク質のシ一クエンスアラインメントのうち当該結合分
子既知タンパク質に結合する分子を決定することに関与すると想定される位置で ある結合分子決定残基位置と、 当該結合分子決定残基位置における結合分子既知 タンパク質のァミノ酸残基である結合分子決定残基と、 当該結^分子決定残基に 対応した結合分子既知タンパク質の結合分子又は結合分子の種類とに関する情報 を記憶した記憶手段と、 前記結合分子既知タンパク質と同じ種類の結合分子未知 夕ンパク質について前記結合分子既知タンパク質間のシークェンスァラインメン 卜に対して結合分子未知タンパク質の配列を整列させて得られた結合分子未知夕 ンパク質のシークェンスアラインメントに関する情報を入力するシークェンスァ ラインメン卜入力手段と、 入力されたシークェンスアラインメントに関する情報 と記憶手段に記憶される情報とから当該結合分子未知タンパク質の結合分子又は 結合分子の種類を決定する結合分子決定手段と、 決定された結合分子未知タンパ ク質に結合する結合分子又は結合分子の種類を表示する表示手段とを具備し、 シ ークエンスァラインメント入力手段により入力された結合分子未知タンパク質の シークェンスアラインメントに関する情報と、 記憶手段に記憶された結合分子決 定残基と当該結合分子決定残基に対応した結合分子既知タンパク質の結合分子又 は結合分子の種類に関する情報とに基づいて結合分子決定手段により結合分子未 知タンパク質の結合分子又は結合分子の種類を予測し、 結合分子決定手段により 予測された当該結合分子未知タンパク質の結合分子又は結合分子の種類を表示手 段により表示する結合分子未知タンパク質の結合分子を予測するためのコンピュ —夕である。 このようなコンピュータによれば、 結合分子既知タンパク質のシ一 クエンスァラインメントに基づいて結合分子決定残基一結合分子分類情報を得る ことができ、 これにより結合分子未知タンパク質のシークェンスァラインメン卜 を得るのみでその結合分子又は結合分子の種類を容易に予測することができるこ ととなる。
さらに本発明は、
( 1 9 ) コンピュータを、 結合分子既知タンパク質のシークェンスァラインメ ントに関する情報を入力するシークェンスアラインメント入力手段と、 前記シー クエンスァラインメント入力手段により入力された結合分子既知タンパク質のァ ミノ酸配列又はシークェンスアラインメントと、 結合分子又は結合分子の種類に
関する情報とを記憶するシークェンスアラインメント結合分子記憶手段と、 前記 シークェンスアラインメント結合分子記憶手段により記憶された結合分子既知夕 ンパク質のアミノ酸配列又はシークェンスァラインメントと、 結合分子又は結合 分子の種類に関する情報を用いて前記結合分子決定残基位置を決定する結合分子 決定残基位置決定手段と、 前記結合分子決定残基位置におけるアミノ酸残基 (結 合分子決定残基) と、 結合分子又は結合分子の種類とを対応付けることにより、 結合分子決定残基と結合分子または結合分子の種類との相関関係を表す結合分子 決定残基一結合分子分類情報を得る結合分子決定残基一結合分子分類情報取得手 段と、 前記結合分子既知タンパク質と同じ種類の結合分子未知タンパク質につい て前記結合分子既知タンパク質間のシークェンスアラインメントに対して結合分 子未知タンパク質の配列を整列させて得られた結合分子未知タンパク質のシーク エンスァラインメントに関する情報を入力するシークェンスアラインメント入力 手段と、 して機能させるプログラム、
( 2 0 ) 前記結合分子決定残基位置決定手段が、 少なくとも式 1 2又は式 1 3 のいずれか又は両方の関数を用いる上記 (1 9 ) に記載のプログラム、
( 2 1 ) 前記結合分子決定残基位置決定手段が、 式 1 4で表される関数を用い る上記 (1 9 ) 又は (2 0 ) に記載のプログラム、
( 2 2 ) コンピュータを、 結合分子未知タンパク質と同じ種類であり結合する 結合分子が既知である結合分子既知タンパク質のシークェンスァラインメントの うち当該結合分子既知夕ンパク質に結合する分子を決定することに関与すると想 定される位置である結合分子決定残基位置と、 当該結合分子決定残基位置におけ る結合分子既知タンパク質のアミノ酸残基である結合分子決定残基と、 当該結合 分子決定残基に対応した結合分子既知タンパク質の結合分子又は結合分子の種類 とに関する情報を記憶した記憶手段と、 前記結合分子既知タンパク質と同じ種類 の結合分子未知タンパク質について前記結合分子既知タンパク質間のシークェン スアラインメントに対して結合分子未知タンパク質の配列を整列させて得られた 結合分子未知タンパク質のシークェンスアラインメントに関する情報を入力する シークェンスァラインメント入力手段と、 入力されたシークェンスァラインメン トに関する情報と記憶手段に記憶される情報とから当該結合分子未知タンパク質
の結合分子又は結合分子の種類を決定する結合分子決定手段と、 決定された結合 分子未知タンパク質に結合する結合分子又は結合分子の種類を表示する表示手段 として機能させるプログラム、 および、
(23) 上記 (1 9) 〜 (22) のいずれか 1項に記載のプログラムを記憶し た記録媒体、 等を提供する。 図面の簡単な説明
図 1は、 本発明のリガンド決定残基一リガンド分類情報作成までの工程表を表 す。
図 2は、 本発明のリガンド決定残基位置特定工程の一態様を示す工程表である 図 3は、 本発明のリガンド決定残基位置特定工程の別の一態様を示す工程表で あ
図 4は、 ゥシロドプシンと TGR 23— 1とのシークェンスアラインメントの 結果を表す。
図 5は、 FL I PRを用いて測定した種々の濃度のヒト TGR 23— 2リガン ド (1— 20) による TGR 23— 1発現 CHO細胞の細胞内 C aイオン濃度上 昇活性を示す。
図 6は、 FL I PRを用いて測定した種々の濃度のヒト TGR 23 - 2リガン ド (1一 20) による TGR 23— 2発現 CHO細胞の細胞内 C aイオン濃度上 昇活性を示す。 発明を実施するための最良の形態
本発明は、 アミノ酸配列と結合分子とが既知である結合分子既知タンパク質に ついて、 少なくとも 2以上の結合分子既知タンパク質のシークェンスァラインメ ントと、 結合分子又は結合分子の種類とを対応付けた結合分子既知タンパク質分 類情報を得る工程と、 前記結合分子既知タンパク質分類情報を用いて、 結合分子 既知タンパク質のシークェンスアラインメントの位置のうち結合分子を決定する ことに関与すると想定される位置である結合分子決定残基位置を 1又は 2以上特
定する工程と、 前記結合分子決定残基位置におけるアミノ酸残基 (結合分子決定 残基) と、 結合分子又は結合分子の種類とを対応付けることにより、 結合分子決 定残基と結合分子又は結合分子の種類との相関関係を表す結合分子決定残基一結 合分子分類情報を得る工程と、 前記結合分子既知タンパク質と同じ種類の結合分 子未知タンパク質について前記結合分子既知タンパク質間のシークェンスァライ ンメントに対して結合分子未知タンパク質の配列を整列させ、 結合分子未知タン パク質のシークェンスアラインメントを得る工程と、 前記結合分子未知タンパク 質のシークェンスァラインメントのうち結合分子決定残基についての情報を、 結 合分子決定残基一結合分子分類情報に当てはめ、 結合分子未知タンパク質の結合 分子又は結合分子の種類を予測する結合分子未知タンパク質の結合分子予測方法 に関する。
結合分子既知タンパク質とは、 タンパク質であってそれに結合する生体分子が 知られているものを意味する。 例えば、 リガンドが既知であるレセプターなど生 体分子が特異的に結合するタンパク質を意味する。
結合分子未知タンパク質とは、 結合分子既知タンパク質と同じ種類のタンパク 質であって、 結合分子が未知のものを意味する。 結合分子既知タンパク質と同じ 種類の結合分子未知タンパク質について前記結合分子既知タンパク質間のシーク エンスアラインメントに対して結合分子未知タンパク質の配列を整列させて得ら れた結合分子未知タンパク質のシークェンスァラインメン卜とは、 結合分子未知 タンパク質のァミノ酸配列と当該結合分子未知タンパク質と同種類の夕ンパグ質 のアミノ酸配列の類似性 (相同性) を調べるために置換、 挿入、 欠失を考慮した 上で、 挿入、 欠失に相当する箇所にギャップを入れ、 配列全体を並置したもので あ 。
結合分子未知タンパク質及び結合分子既知タンパク質としては、 Gタンパク質 共役型受容体 (G P C R ) 、 キナーゼ、 リパーゼ、 トランスポ一タ一、 プロテア ーゼ、 イオンチャンネルがあげられる。 これらのうちで、 Gタンパク質共役型受 容体 (G P C R ) 、 キナ一ゼについて本発明が好ましく適用できる。 結合分子未 知タンパク質及び結合分子既知タンパク質が Gタンパク質共役型受容体 (G P C R ) である場合、 結合分子未知タンパク質をォ一ファンレセプターとも呼ぶ。 な
お、 前述の通り、 結合分子未知タンパク質と結合分子既知タンパク質とは同じ種 類である。 例えば、 結合分子未知タンパク質が G P C Rであれば結合分子既知夕 ンパク質も G P C Rである。
[結合分子既知夕ンパク質分類情報]
結合分子既知タンパク質分類情報とは、 少なくとも 2以上の結合分子既知タンパ ク質のシークェンスアラインメントと結合分子 (及び Z又は、 結合分子の種類) とを対応付けた表を意味する。 この表は、 紙面のみならず、 電子的に保存され視 覚により表として認識することができるような態様のものであれば特に限定され るものではない。 また、 結合分子既知タンパク質のシークェンスアラインメント と結合分子又は結合分子の種類との対応が認識できるものであれば特に限定され るものではない。
[結合分子決定残基位置]
結合分子決定残基位置とは、 結合分子既知タンパク質のシークェンスァラインメ ントの位置であつて、 結合分子を決定することに関与すると想定される位置を意 味する。
リガンド決定残基位置の数としては、 1以上であれば特に限定されるものではな く、 1以上 10以下であれば好ましく、 2以上 6以下であればより好ましく、 2であれ ば特に好ましい。 生体を構成するアミノ酸残基の種類は 20種しか存在しない。 し たがって、 1つのリガンド決定残基のみで対応付けることのできるリガンドは 20 種類までである。 一方、 例えば、 G P C Rでは、 100種類以上のリガンドが知られ ているので、 リガンド決定残基位置が 1つであれば、全てのリガンドとリガンド決 定残基とを対応付けることができない。 したがって、 G P C Rのようにリガンド が 20種類以上ある系において、 結合分子未知タンパク質のリガンドを予測するに は、 リガンド決定残基位置が 2つ以上あることが望ましい。 また、 リガンド決定残 基位置の数が多いほど予測精度が高まる。 リガンドを数種類に分類し (Xl〜Xp : p は分類の数である。 ) 、 結合分子未知タンパク質のリガンドがいずれの分類に属 するかを決定する場合、 リガンドの数 (ρの値) が少なければ、 1つのリガンド決 定残基位置のアミノ酸残基のみでリガンドの種類を予測することが可能となる。 しかし、かかる場合であっても、一般に 2つ以上のリガンド決定残基位置のァミノ
酸残基を組合せてリガンドの種類を予測した方が予測精度は高くなる。
[結合分子決定残基]
結合分子決定残基とは、 前記結合分子決定残基位置におけるアミノ酸残基を意味 する。 また、 結合分子既知タンパク質について複数種類の結合分子の特定残基位 置 (1つ又は 2つ以上) と複数種類のアミノ酸残基とを組合せ、 結合分子決定残 基としても良い。 例えば、 シークェンスアラインメント第 2番目と第 8番目のァ ミノ酸残基位置を結合分子決定残基位置の一例とし、 シークェンスァラインメン ト第 9番目と第 1 1番目のアミノ酸残基を他の例とする場合である。 このように 異なった結合分子決定残基位置を組合せることにより、 結合分子又は結合分子の 種類の予測精度を向上させることが可能となるからである。 結合分子決定残基に 関する情報とは、 前記結合分子決定残基位置におけるアミノ酸残基に関する情報 を意味する。 例えば、 タンパク質のシークェンスアラインメントの第 2番目と第 8番目が結合分子決定残基位置であれば、 シークェンスアラインメントの第 2番 目と第 8番目が、 結合分子決定残基の位置に関する情報である。 そして、 シーク エンスアラインメントのうち、 第 2番目と第 8番目のアミノ酸残基の種類につい ての情報と当該結合分子決定残基の位置に関する情報とをあわせて結合分子決定 残基に関する情報となる。
[結合分子決定残基一結合分子分類情報]
結合分子決定残基一結合分子分類情報とは、 結合分子決定残基と結合分子または 結合分子の種類との相関関係を表す表である。 この表は、 紙面のみならず、 電子 的に保存され視覚により表として認識することができるような態様のものであれ ば特に限定されるものではない。 また、 結合分子決定残基と結合分子又は結合分 子の種類との対応が認識できるようなものであれば特に限定されるものではない [結合分子]
結合分子としては、 生体高分子である結合分子既知タンパク質及び結合分子未知 タンパク質に結合しうるものであれば特に限定されるものではないが、 例えば、 レセプ夕一タンパク質に結合するリガンドゃ、 G P C Rに結合する G αタンパク 質などがあげられる。
[結合分子の種類]
結合分子の種類とは、 同じ種類の結合分子既知タンパク質に複数の結合分子が存 在する場合にそれらをその機能や性質などに応じて分類したものである。 例えば 、 G P C Rのリガンドを、 モノアミン、 脂質、 ペプチドに分類する場合があげら れる。
[コンピュータ]
本発明のコンピュータは、 一定の計算等をすることができる電子的デバイスであ れば、 特に限定されるものではなく、 たとえば、 パーソナルコンピュータ一、 ス —パ一コンピュータ、 モバイル等公知のコンピュータであってもよい。 ブラウザ を搭載したコンピュータであれば、 インターネットに接続することができ、 公知 の W e b (ウェブ) サイトにアクセスすることができるので特に好ましい。 以下、 結合分子がリガンドである場合を例にしてリガンド決定残基一リガンド 分類情報作成までの工程を説明する。
[リガンド決定残基一リガンド分類情報作成までの工程]
図 1は、 リガンド決定残基一リガンド分類情報作成までの工程の一例を表し、 以 下の工程からなる。 すなわち、 アミノ酸配列とリガンド (及び 又はリガンドの 種類) とが既知である少なくとも 2以上の結合分子既知タンパク質についてのシ —クエンスアラインメントとリガンド (及び/又はリガンドの種類) に関する情 報を取得する工程 (S 101) 、 シークェンスアラインメントとリガンド (及び Z又 はリガンドの種類) を対応付け、 結合分子既知タンパク質分類情報を得るシーク エンスアラインメントリガンド分類情報取得工程 (S 102) 、 シークェンスァライ ンメントリガンド分類情報取得工程により得られる結合分子既知タンパク質分類 情報を用いて結合分子既知タンパク質のシークェンスアラインメントのうちリガ ンド (及び 又はリガンドの種類) を決定することに関与すると想定される位置 であるリガンド決定残基位置を 1又は 2以上特定するリガンド決定残基位置特定ェ 程 (S 103) 、 リガンド決定残基位置特定工程により特定されたリガンド決定残基 位置におけるアミノ酸残基 (リガンド決定残基) によって、 リガンド (及び 又 はリガンドの種類) を対応付けたリガンド決定残基とリガンド (及び Z又はリガ ンドの種類) との相関関係を表すリガンド決定残基一リガンド分類情報を得るリ
ガンド決定残基一リガンド分類工程 (S 104) である。 以下、 各工程について説明 する。 なお、 以降リガンドの種類を含めて単にリガンドという場合もある。
[ステップ 1 0 1 ]
まず、 リガンド決定残基一リガンド分類情報を作成するために、 アミノ酸配列 とリガンドとが既知である少なくとも 2以上の結合分子既知タンパク質について のシークェンスアラインメントとリガンド (及び Z又はリガンドの種類) に関す る情報を取得する (S 101) 。 この工程では、 複数の結合分子既知タンパク質につ いてアミノ酸配列とリガンド (及び/又はリガンドの種類) に関する情報を取得 するが、 アミノ酸配列からシークェンスアラインメントを求めても良いし、 複数 の結合分子既知タンパク質について既にシークェンスァラインメン卜が求められ ていれば、 そのシークェンスァラインメントに関する情報を直接取得しても良い 。 結合分子既知タンパク質についてのシークェンスアラインメントとリガンド ( 及び Z又はリガンドの種類) に関する情報を取得する方法は、 特に限定されるも のではなく、 データベースから当該情報を取得しても、 計算により当該情報を取 得しても良い。データベースとしては、少なくとも 100種類以上の結合分子既知夕 ンパク質についてのシークェンスアラインメントとリガンド (及び/又はリガン ドの種類)に関する情報を収録しているデータベースが好ましく、 500以上収録し ていればより好ましく、 1000以上収録していれば特に好ましい。 結合分子既知夕 ンパク質の数が多いほど、 リガンド決定残基一リガンド分類情報の精度が高まる からである。
公知のデータベースとしては、 結合分子既知タンパク質のシークェンスァライ ンメン卜とリガンド (及び Z又はリガンドの種類) を記述しているものであれば 特に限定されるものではなく、 例えば G P C R D B (ht tp ://www. G P C R . org/7 tm/)があげられる。 シークェンスアラインメントは、 公知の計算方法によって求 めることもできる。 シークェンスアラインメントに関して公知の計算法としては 、 例えば Clus t al Wや BLASTが挙げられるが、 手動で計算しても良い。 また、 リガ ンドに関する分類をあらかじめ作成しておき、 リガンドに関する情報が入力され れば、 リガンドの種類が自動的に求められるようにしてき、 リガンドの情報を入 手すれば、 リガンドの種類に関する情報も得られるようにしてもよい。
[ステップ 1 0 2 ]
次に、 ステップ 101で取得された 2以上の結合分子既知タンパク質についてのシ一 クエンスアラインメントとリガンド (及び Z又はリガンドの種類) に関する情報 について、 シークェンスアラインメントとリガンド (及び Z又はリガンドの種類 ) に関する情報を対応付け、 結合分子既知タンパク質分類情報を得る (シークェ ンスアラインメントリガンド分類情報取得工程: S102) 。 ステップ 101において、 1 以上の結合分子既知タンパク質についてのシークェンスァラインメントとリガン ド (及び/又はリガンドの種類) に関する情報をデータベース等から取得する際 に、 すでにシ一クエンスアラインメントとリガンド (及び 又はリガンドの種類 ) が対応付けられていれば、 シークェンスアラインメントとリガンド (及び Z又 はリガンドの種類) が対応付けられたままの情報を取得してもよい。
[ステップ 1 0 3 ]
次に、ステップ 102のシークェンスアラインメントリガンド分類情報取得工程によ り得られる結合分子既知タンパク質分類情報を用いて、 結合分子既知タンパク質 のシークェンスアラインメントのうちリガンド (及びノ又はリガンドの種類) を 決定することに関与すると想定される位置であるリガンド決定残基位置を 1又は 2 以上特定する (リガンド決定残基位置特定工程: S 103) 。
この工程においては、 対象とするタンパク質の種類や性質に合わせ好ましい関 数を組合せてリガンド決定残基位置を 1又は 2以上特定する。 この工程の好ましい 実施態様については、 後述する。
[ステップ 1 0 4 ]
次に、 リガンド決定残基位置特定工程により特定されたリガンド決定残基位置に おけるアミノ酸残基 (リガンド決定残基) によって、 リガンド (及び/又はリガ ンドの種類) を対応付けたリガンド決定残基とリガンドとの相関関係を表すリガ ンド決定残基一リガンド分類情報を得る (リガンド決定残基一リガンド分類工程 : S 104) 。
この工程では、 それぞれの G P C Rについてリガンド決定残基位置、 リガンド 決定残基、 及びリガンド (及び/又はリガンドの種類) に関する情報を、 シーク エンスアラインメントリガンド分類情報から取得し、 リガンド決定残基一リガン
ド分類情報を得る。
このようなリガンド決定残基一リガンド分類情報を用いれば、 リガンド未知の G P C Rについても、 そのシークェンスアラインメントを求めるだけで、 そのリ ガンド (及び Z又はリガンドの種類) を予測することが可能となる。
[ステップ 1 0 3の一実施態様]
図 2に従って、 リガンド決定残基位置特定工程 (S 103) の好ましい一態様を説明 する。 この工程は、 リガンド決定残基位置の数が 1つの場合である。 リガンドを!) 種類に分け、それぞれ XIから Xpに分類する。ステップ 102で得られた結合分子既知 タンパク質分類情報に存在する結合分子既知タンパク質の全てのシークェンスァ ラインメントとリガンド (及び/又はリガンドの種類) に関する情報を下記の式 1 5に入力し、関数 f l (n)の値が小さいものから、 リガンド決定残基位置の候補と する (リガンド決定残基位置候補選択工程: S201) 。 このとき、 得られたリガンド 決定残基位置の候補におけるシークェンスァラインメントについて、 シークェン スアラインメント不能(-で表される)が、全 G P C Rの 3 %以上存在すれば、 当該 リガンド決定残基位置をリガンド決定残基位置として採用しないことが好ましい
f l (n) =∑ (N (Res, XQ) XN (Res, Xr) ) 式 1 5
Res
[式 1 5中、 nは、 f l (n)が、 結合分子既知タンパク質のシークェンスァラインメ ントのうち第 n番目のアミノ酸残基についての評価関数であることを表し、 Res は、 アミノ酸残基の種類を表し、 XQ及び Xrは、 リガンドを表し、 Qは 1から p - 1まで の整数を表し、 rは Qより大きく p以下である整数を表し、 pはリガンドの数を表し 、 N (Res, XQ)は、 結合分子既知タンパク質分類情報に存在する結合分子既知タン パク質のうち、シークェンスァラインメン卜の n番目のアミノ酸残基が Resであり 、 かつリガンドが であるものの数を表し、 N (Res, Xr)は、 結合分子既知タンパ ク質分類情報に存在する結合分子既知タンパク質のうち、 シークェンスァライン メントの n番目のアミノ酸残基が Resであり、かつリガンドが Xrであるものの数を
表す。 ] リガンド決定残基位置候補選択工程においてあげられるリガンド決定残基位置 候補の数としては、 特に限定されるものではないが、 1以上 100以下が好ましく、 1 以上 10以下であればより好ましく、 1以上 5以下であれば特に好ましい。 リガンド 決定残基位置候補が多すぎると後のリガンド決定残基位置候補の信頼性確認工程 が困難になるからである。
ステップ 201のリガンド決定残基位置候補選択工程において選択されたリガン ド決定残基位置候補は、 そのままリガンド決定残基位置としてもよいが、 リガン ド決定残基位置の候補の信頼性を式 2を用いて検討することがより好ましい。 ( リガンド決定残基位置候補の信頼性検討工程: S202) 。 この場合、 下記式 1 6を 用いてリガンド決定残基位置候補の信頼性を検討する。得られた f 2 (n)の値が小さ いほどリガンド決定残基位置としてふさわしいこととなる。 f 2 (n) =∑ (N (Res, XI) xN (Res, X2) X N (Res, Xp) ) 式 1 6
Res
[式 1 6中、 nは、 f 2 (n)が、 結合分子既知タンパク質のシークェンスァラインメ ントのうち第 n番目のアミノ酸残基についての評価関数であることを表し、 Res は、 アミノ酸残基の種類を表し、 XIから ¾は、 リガンド又はリガンドの種類を表 し、 pは、 リガンド又はリガンドの種類の数を表し、 N (Res, X)は、 ステップ 102 で得られた結合分子既知タンパク質分類情報に存在する結合分子既知タンパク質 のうち、 シークェンスアラインメントの n番目のアミノ酸残基が Resであり、かつ リガンドが Xであるものの数を表す。 ] ステップ 201で得られた f l (n)の値及び Zまたはステップ 202で得られた f 2 (n)の 値を用いてリガンド決定残基位置を特定する (リガンド決定残基位置特定工程: S 203) 。 得られた f 2 (ii)の値が最も小さいものをリガンド決定残基位置としてもよ いし、 Π (n)と f 2 (n)の値の積が最'も小さなものをリガンド決定残基位置としても
よいし、 Π (n)と f 2 (n)の値の和が最も小さなものをリガンド決定残基位置として もよい。また、ステップ 102で得られた結合分子既知タンパク質分類情報に存在す る結合分子既知タンパク質のアミノ酸残基位置のうち、 f l (n)が低い方から順位付 けをし、更に f 2 (n)についても同様に順位付けをし、 両方の順位を掛け合わせ、 最 も低いものをリガンド決定残基位置としてもよい。 また、 得られたリガンド決定 残基位置におけるシークェンスァラインメントについてシークェンスァラインメ ント不能(-で表される)が、全 G P C Rの 3 %以上存在すれば、 当該リガンド決定 残基位置をリガンド決定残基位置として採用しないことが好ましい。
[ステップ 1 0 3の別の実施態様]
図 3に従って、 リガンド決定残基位置特定工程 (S 103) の好ましい別の実施態様 を説明する。 この工程は、 リガンド決定残基位置の数が 2つの場合である。 まず、 ステップ 102で得られた結合分子既知タンパク質分類情報に存在する結合分子既 知タンパク質の全てのシークェンスァラインメン卜と、 リガンド又はリガンドの 種類に関する情報を式 1に入力し、 リガンド決定残基位置の候補をあげる (リガ ンド決定残基位置候補選択工程: S301) 。
リガンド決定残基位置候補選択工程においてあげられるリガンド決定残基位置 候補の数としては、 特に限定されるものではないが、 1以上 100以下が好ましく、 1 以上 20以下であればより好ましく、 2以上 10以下であれば更に好ましく、 2以上 6 以下であれば特に好ましい。 リガンド決定残基位置候補が多いと後のリガンド決 定残基位置候補の信頼性確認工程が困難になり、候補が 1だと多様なリガンド種類 に対応できないからである。
ステップ 301のリガンド決定残基位置候補選択工程においてあげられたリガン ド決定残基位置候補について、 リガンド決定残基位置の候補の信頼性を式 2を用 いて検討することを含めることはより好ましい実施態様である (リガンド決定残 基位置候補の信頼性検討工程: S302) 。 なお、 ステップ 302であるリガンド決定残 基位置信頼性検討ェ程を経ない場合は、 ステップ 301の後ステップ 303へと進めば よい。 リガンド決定残基位置信頼性検討工程では、 少なくともリガンド決定残基 位置候補を含むアミノ酸残基位置に関して、式 2に結合分子既知タンパク質のシー クエンスァラインメントとリガンドに関する情報を入力する。関数 f2 (n)の値の小
さいものがリガンド決定位置残基位置としてふさわしい。
関数 f 2 (n)の値の小さいものからリガンド決定残基位置として選択してもよい し、 f 1 (n)と ί 2 (n)の値の積が最も小さなものをリガンド決定残基位置として選択 してもよいし、 f l (n)と f 2 (n)の値の和が最も小さなものをリガンド決定残基位置 として選択してもよい。 また、ステップ 102で得られた結合分子既知タンパク質分 類情報に存在する結合分子既知タンパク質のァミノ酸残基位置のうち、 f 1 (n)が低 い方から順位付けをし、更に f 2 (n)についても同様に順位付けをし、両方の順位を 掛け合わせ低いものからリガンド決定残基位置として選択してもよい。 また、 得 られたリガンド決定残基位置におけるシークェンスアラインメントについてシ一 クエンスアラインメント不能(-で表される)が、結合分子既知タンパク質分類情報 に記載された G P C Rの 3 %以上存在すれば、 当該リガンド決定残基位置をリガ ンド決定残基位置として採用しないことが好ましい。
次に、 ステップ 301又はステップ 302においてあげられた、 リガンド決定残基位 置の候補を 2つ組合せ、 リガンド決定残基位置のペア候補をあげる (リガンド決定 残基位置のペア選択工程: S303) 。 リガンド決定残基位置のペア候補としては、 全てのリガンド決定残基位置の候補からなる組合せをあげても良いし、 Π (n)の好 ましいリガンド決定残基位置とその他の残基位置との組合せでリガンド決定残基 位置のペア候補をあげても良い。
リガンド決定残基位置のペア候補についての情報を式 1 7に入力することによ りリガンド決定残基位置のペアを特定する (リガンド決定残基位置のペア特定ェ 程: S304) 。 f 3 (m, n) = { (アミノ酸残基ペア種類数)/ wX + w l x (2交差残基ペア種類数) + w2 X (3交差残基ペア種類数) 十… wp- 1 (p交差残基ペア種類数) + wA X (ァ ラインメント不能アミノ酸残基数) + wB X (アラインメント不能アミノ酸残基べ ァ数) } 式 1 7
[式 1 7中、 (m,n)は、 f 3 (m, n)が結合分子既知タンパク質のシ一:
インメントのうち第 m番目と第 n番目のアミノ酸残基についての評価関数である
ことを表し、 アミノ酸残基ペア種類数は、 結合分子既知タンパク質のシークェン スァラインメントのうち第 m番目と第 n番目のアミノ酸残基の組合せの種類の数 を表し、 2交差残基ペア種類数及び 3交差残基ペア種類数はそれぞれ、 結合分子既 知タンパク質のシークェンスアラインメントのうち第 m番目と第 n番目のアミノ 酸残基の組合せのうちリガンドが 2種類及び 3種類のものの数を意味し、 p交差残基 ペア種類数は、 結合分子既知タンパク質のシークェンスアラインメントのうち第 m番目と第 n番目のアミノ酸残基の組合せのうちリガンドが!)種類のものの数を 意味し、 シークェンスアラインメント不能アミノ酸残基数とは、 結合分子既知夕 ンパク質のシークェンスアラインメントのうち第 m番目と第 n番目のアミノ酸残 基のうち一方が、 好ましい相同性を得るためにシークェンスアラインメント不可 能とされた数を意味し、 シークェンスアラインメント不能アミノ酸残基ペア数と は、 結合分子既知タンパク質のシークェンスアラインメントのうち第 m番目と第 n番目のアミノ酸残基の両方が、 好ましい相同性を得るためにシークェンスァラ インメント不可能とされた数を意味し、 wXは正の定数、 またはアミノ酸ペア種類 数を変数とする分布関数であって、アミノ酸ペア種類数が 400以下の正の数である ときに最大値を与える分布関数を意味し、 w l "'wp_ l、 wA、 wBは、 ウェイトで あり、 正の数である。 ] wXは正の定数でもよく、 ガウス関数や分布関数でもよい。正の定数の場合、 特 に限定されるものではないが、 1が望ましい。 wXが、 分布関数の場合、 wXは正 の定数、 またはアミノ酸ペア種類数を変数とする分布関数であって、 アミノ酸べ ァ種類数が 4 0 0以下であるときに最大値を与える分布関数を意味し、 特に限定 されるものではない。 例えば、 アミノ酸ペア種類数を変数とするガウス関数、 口 一レンツ関数などでもよい。 その最大値は、 正の数であれば特に限定されるもの ではない。 この分布関数の最大値を与えるような変数の値としては、 400以下が好 ましく、 20〜200であればより好ましく、 40〜140であれば更に好ましい。 この値 は、 リガンド決定アミノ酸ペアの総数が 20 X 20 = 400であり、経験上 40〜140種の アミノ酸ペアによる予測が最も良好な結果を与えることから決定されたものであ る。 分布関数の半値全幅としては、 1 0以上 1 0 0以下が好ましく、 2 0以上 7
0以下であればより好ましく、 3 0以上 5 0以下であれば更に好ましい。 分布関 数の最大値としては、 他のウェイトとの関係にもよるが、 1が好ましい。 ウェイ ト (w l '"wp-l、 wA、 wB) の値は、 正の数であれば特に限定されるものではな レ^ しかし、 例えば、 3交差残基ペアが存在する場合、 2交差残基ペアよりもリガ ンドを予測する上で好ましくないため w2の値が wlの値よりも大きいことが好ま しい。 例えば、 リガンドの数が 3つの場合は、 3交差残基ペア以降は存在し得ない 。 この場合のウェイ卜の組合せとしては、 wlが 2で w2が 5で wAと wBが 1の組合せ があげられる。
リガンド決定残基位置のペア候補のうち小さな f3 (m, n)の値を与えるものが好 ましいリガンド決定残基位置のペアである。
なお、 特に明示しないが、 リガンド決定残基位置のペアを任意に組合せたリガ ンド決定残基一リガンド分類情報を得ることは、 本発明の好ましい別の実施態様 である。 組合せ方としては、 特に限定されるものではないが、 前述の関数 i3 (n) の値が一番小さなものと、二番目及び 又は X番目(ここで、 Xは 2より大きく 1 0 0より小さな整数を表す。 ) に小さなものを組合せる、 関数 i3 (m, η)の値が X 番目に小さなものと y番目(ここで、 yは、 Xとは異なり、 2より大きく 1 0 0よ り小さな整数を表す。 ) に小さなものを組合せる等があげられる。 例えば、 f3 ( π)関数の値が、 2 9番目までのリガンド決定残基を任意に組合せることができる 。 ここで、 X番目及び y番目の X及び yは、 コンピュータにあらかじめ入力され ていてもよいし、 ユーザからの入力情報をコンピュータが受け取り、 リガンド決 定残基の組合せを作成してもよい。 f 3 (m, n)関数の値が最小なものと 2番目に小さ なものを組合せたのみでは、 リガンド及び/又はリガンドの種類を予測すること のできるリガンド位置決定残基は限られたものとなる。 しかし、 このように、 複 数のリガンド位置決定残基を組合せることで、 多くの種類のリガンド未知タンパ ク質のリガンド及び/又はリガンドの種類を予測することが可能となり、 しかも 当該予測の精度も高まることとなりうる。 このような、 リガンド決定残基の組合 せは、 リガンド決定残基組合せ手段により自動的に組合せることが可能となって いることが、 本発明の好ましい実施の態様である。 かかる手段を用いれば、 リガ ンド決定残基位置から導かれる予測を補完することができる。 なお、 上記 Xと y
は、 それぞれ 2より大きく、 1 0 0より小さいことが好ましく、 5 0より小さけ ればより好ましく、 3 0より小さければ更に好ましく、 2 0より小さければ特に 好ましい。
この実施態様では、 例えば、 あるリガンド既知タンパク質のアミノ酸残基のう ち、 関数 ί 3 (ffl, n)の値が一番小さなリガンド決定残基位置にあるものを抽出する。 そして、 リガンド決定残基一リガンド分類情報にあげられたリガンド既知夕ンパ ク質のうち、 抽出されたリガンド決定残基と一致するものの数を求める。 さらに 、 これらのうちで、 リガンド又はリガンドの種類が、 当該あるリガンド既知タン パク質と一致するものの数を求める。 このような本明細書ではこのようにしてえ られた値を N : ( (リガンド決定残基—リガンド分類情報にあげられたリガンド 既知タンパク質のうち、 抽出されたリガンド決定残基と一致するものの数) / ( リガンド又はリガンドの種類が、 当該あるリガンド既知タンパク質と一致するも のの数) ) とする。そして、 関数 f 3 (m, ii)の値が二番目に小さなリガンド決定残基 位置についても同様に Nを求める。その後、 関数 i3 (m, n)の値第一番目及び第二番 目に小さなリガンド決定残基位置の Nの分母同士及び分子同士を足し合わせる。 このようにして、 リガンド決定残基位置のペアを任意に組合せたリガンド決定残 基一リガンド分類情報を得るのである。
以上説明した各工程は、 手動によって行われてもよいが所定の媒体又はプログ ラムをインストールしたコンピュータによって行われることが特に好ましい。 ま た、 このコンピュータは、 イン夕一ネットに接続されており、 外部のデ一夕べ一 スにアクセス可能となっていることが特に好ましい。
このようなコンピュータは、 少なくとも、 結合分子未知タンパク質のシ一クェ ンスアラインメントに関する情報を入力するシークェンスアラインメント入力手 段と、 前記シークェンスアラインメント入力手段により入力された結合分子既知 タンパク質のアミノ酸配列又はシークェンスアラインメントと結合分子又は結合 分子の種類に関する情報とを記憶するシークェンスアラインメント結合分子記憶 手段と、 前記.シークェンスアラインメント結合分子記憶手段により記憶された結 合分子既知タンパク質のアミノ酸配列又はシークェンスァラインメントと結合分 子又は結合分子の種類に関する情報を用いて前記結合分子決定残基位置を予測す
る結合分子決定残基位置決定手段と、 前記結合分子決定残基位置におけるァミノ 酸残基 (結合分子決定残基) と結合分子または結合分子の種類とを対応付けるこ とにより、 結合分子決定残基と結合分子または結合分子の種類との相関関係を表 す結合分子決定残基一結合分子分類情報を得る結合分子決定残基一結合分子分類 情報取得手段とを具備する。
結合分子決定残基位置決定手段においては、 結合分子既知タンパク質のシーク エンスアラインメントや結合分子又は結合分子の種類に関する情報を先述した Π (η)、 ί2 (η)、 f3 (m, n)関数のいずれか又はこれらを任意に組合せ結合分子決定残基 位置を決定する。
リガンド決定残基一リガンド分類情報は、 独自のデータべ一スを構成していて もよいし、ステップ 102で得られる結合分子既知タンパク質分類情報に基づくリレ —ショナルデータベースとして構成されていてもよい。 リガンド決定残基一リガ ンド分類情報が、 結合分子既知タンパク質分類情報に基づくリレ一ショナルデー 夕ベースとして構成されていれば、 結合分子未知タンパク質のシークェンスァラ インメントとそのリガンドが確認された場合、 それを結合分子既知タンパク質分 類情報に組込んで、 リガンド決定残基位置を容易に再評価することができるため 好ましい。
このようなコンピュータであれば、 結合分子決定残基一結合分子分類情報に結 合分子未知タンパク質のシークェンスアラインメントを入力することにより結合 分子又は結合分子の種類を容易に予測することが可能となる。
なお、 本発明のコンピュータは、 結合分子決定残基—結合分子分類情報をあら かじめィンストールしておき、 タンパク質のシークェンスァラインメン卜を入力 するシークェンスアラインメント入力手段によって、 結合分子未知タンパク質の シークェンスァラインメン卜を入力することにより、 結合分子及び/又は結合分 子の種類を予測するコンピュータであってもよい。 このようなコンピュータであ つても、 結合分子決定残基一結合分子分類情報に結合分子未知夕ンパク質のシ一 クエンスアラインメントを入力することにより結合分子又は結合分子の種類を容 易に予測することが可能となる。
[仮想的な結合分子既知タンパク質を用いた例]
以下、 仮想的な結合分子既知タンパク質を用いて、 本発明のリガンド決定残基 一リガンド分類情報作成までの工程及び結合分子未知タンパク質の結合分子種予 測工程を説明する。
表 1は、 仮想的な結合分子既知タンパク質分類情報の例である。 この系では、 リガンドが既知でありアミノ酸配列 (シークェンスアラインメント) が既知であ る 6つの結合分子既知タンパク質が集められている。 そして、 リガンドは、 P、 A 、 Nの 3つの分類に分けられている。 リガンドの種類に基づいてリガンド決定残基 位置を決定する場合は、 P、 A、 Nが、 それぞれ式 1、 式 2における XI、 X2、 X3に対応 する。 また、 リガンドに基づいてリガンド決定残基位置を決定する場合は、 〇X 、 X X、 △△が、 それぞれ式 1、 式 2における XI、 11、 X3に対応する。 〇 〇〇△ X X
表 1 仮想的な結合分子既知タンパク質分類表の Δ X X X X X例 番号 アラインメント リガンド リガンド
TLMRK P TMMQK A TCMTK N TLLRK P TMLQK A TLLRA P 表 1において、例えは 1番目の結合分子既知たんぱく質のシークェンスァライン メントが、 TLMRKであり、 その結合分子 (リガンド) は〇Χである。 そして、 リガ ンド〇Χのリガンドの種類は、 Ρである。
評価関数 Π (1)について説明する。 上記シークェンスアラインメントのうち 1番 目のアミノ酸残基は Τのみである。 したがって、 関数 f l (η)において、 Resは Τのみ である。
アミノ酸残基が Tであって、 リガンドが Pであるものは 3種類あるから、
N (Res, Xl) = N (T, X1) =3となる。 同様にして、
N (Res, X2) = N (T, X2) =2, N (Res, X3) = N (T, X3) = l となる。
これから、 Π (1)は以下の通りとなる。
il(l)=∑ (N (Res, XI) XN(Res, X2) + N(Res, XI) XN(Res, X3) IN (Res, X2) x N(
Res
Res, X3))=∑ (N (T, XI) XN(T, X2) + N (T, XI) XN(T, X3) +N (T, X2) X N (T, X3))=3X2+
3X1+2X1 = 11 次に f2(l)について説明する。 f2(l) =∑ (N (Res, XI) XN(Res, X2) XN(Res, X3))
Res
=∑ (N (T, XI) XN(T, X2) XN(T, X3)) = 3X2X1 = 6
となる。 fl (2)と f2(2)について説明する。上記シークェンスアラインメントのうち 2番目 のアミノ酸残基は L、 M、 Cの 3種類である。 したがって、 関数 Π(η)において、 Res はし M、 Cである。 2番目のアミノ酸残基が Lであって、 リガンドが Pであるものは 3 種類あるから、 N(L, X1)=N(L, P)=3となる。 2番目のアミノ酸残基が【であって、 リ ガンドが A、 Nのものは存在しないから、 N (L, X2) =N (L, A) =N (L, X3) =N (L, N) =0となる 。 2番目のアミノ酸残基が Mであって、 リガンドが Aであるものは 2種類あるから、 N (M, X2)=N(M, A)=2となる。 2番目のアミノ酸残基が Lであって、 リガンドが P、 Nのも のは存在しないから、 N(M,X1)=N (M, P) =N (M, X3) =N (M, N) =0となる。
2番目のアミノ酸残基が Cであって、 リガンドが Nであるものは 1種類あるから、 N( C,X3)=N(C,N)=1となる。 2番目のアミノ酸残基が Cであって、 リガンドが P、 Aのも のは存在しないから、 N(C,X1)=N(C,P)=N(C,X2)=N(C, A)=0となる。
これから、 Π (2)は以下の通りとなる。 fl(2)=∑ (N (Res, XI) xN(Res, X2) + N(Res, XI) XN(Res, X3) +N (Res, X2) x
Res
N (Res, X3))=∑ (N (L, XI) XN (L, X2) I N (L, XI) XN (L, X3) +N (L, X2) X N (L, X3) ) +∑ (N (M, XI) XN (M, X2) + N(M,X1) XN (M, X3) IN (M, X2) X N (M, X3) )
+∑ (N (C, XI) XN(C, X2)+ N(C,X1) XN(C, X3) +N (C, X2) X N(C, X3) ) =∑ (N (L, P) XN (L, A) + N (L, P) XN (L, N) +N (L, A) X N (L, N) ) +∑ (N (M, P) XN (M, A)+ N (M, P) XN (M, N) +N (M, A) X N (M, N) )
+∑ (N (C, P) XN (C, A)+ N (C, P) XN (C, N) +N (C, A) X N (C, N) ) =0 また f2 (2)は次の通りとなる。 f2(2) =∑ (N (Res, XI) XN(Res, X2) XN(Res, X3))
Res
=(N (L, P) XN (L, A) XN (L, N) ) + (N (M, P) XN (M, A) XN (M, N) ) + (N (C, P) XN (C, A) X N (C, N) ) =0 同様にして il(3)=5、 fl(4)=0、 Π(5)=8、 f2(3)=l、 f2(4)=0、 f2(5)=4となる,
Π (n)の値が小さなものから並べると、 nが 2、 4、 3、 5、 1の順番となる。 小さ な Π(η)の値を与えるアミノ酸残基位置が、 リガンド決定残基位置の候補である。 ここでは、 第 2、 4、 3番目のアミノ酸残基位置を、 リガンド決定残基位置の候補と する。 いくつのァミノ酸残基位置をリガンド決定残基位置の候補とするかはあら かじめ決めておいても良い。 これらのアミノ酸残基位置における f2(n)の値は、第 1、 5番目のアミノ酸残基位置における ί2(η)の値に比べ小さいことから、 第 2、 4 、 3番目のアミノ酸残基位置が、 リガンド決定残基位置の候補として望ましい候補 であることが確認できる。
[リガンド決定残基位置のペア決定過程]
リガンド決定残基位置のペアに対してリガンドが 2種類あるものを 2交差残基ペア 種とし、 リガンド決定残基位置のペアに対してリガンドが 3種類あるものを 3交差 残基ペア種とする。 第 2、 4、 3番目のアミノ酸残基位置をそれぞれ組合せ、 リガン ド決定残基位置のペア候補をあげる。 この例では、 (2, 3)、 (2,4)、 (3, 4)の 3種類
のペア候補があげられる。
まず、 リガンド決定残基位置のペア候補(2, 3)について検討する。シークェンス アラインメントの 2番目と 3番目にあるアミノ酸残基の組合せは、 (L, M)、 (M,M)、 ( C,M)、 (L,L)、 (M, L)の 5種類である。 したがって、 「属するァミノ残基ペア種類数 」 は 5である。 これら 5種類のアミノ酸残基の組合せについて対応するリガンドは それぞれ一義的に決まるので、 2交差残基ペア種と 3交差残基ペア種はない。 これ から f 3 (2, 3)の値は 5である。 同様にして、 f3 (2, 4)の値は、 4であり、 ί3 (3, 4)の 値は、 5である。 よって残基位置のペア(2, 4)が最も好ましく、 リガンド決定残基 位置のペアである。
なお、 好ましくないアミノ酸残基位置の組合せであれば、 f3の値が大きくなる ことを示すために、 アミノ酸残基位置 1と 5の組合せを用いて f3 (l, 5)を求める。シ ークエンスァラインメン卜の 1番目と 5番目にあるアミノ酸残基の組合せは、 (Τ, K )、 (T, A)の 2種類である。 したがって、 「属するァミノ残基ペア種類数」 は 2であ る。 (Τ,Κ)の組合せに対応するリガンドの種類は、 Ρ、 Α、 Νの 3種であるから、 (Τ, Κ)は、 3交差残基ペア種である。 よって、 f3 (1, 5)の値は、 7となる。 この値は、 f 3 (2, 4)の値よりも大きく、 関数 f3がリガンド決定残基位置のペア決定に適してい ることが理解できる。
[リガンド決定残基ーリガンド分類情報作成工程]
以上よりリガンド決定残基位置のペアがシークェンスアラインメントの(2, 4)番 目であることがわかった。 これらに対応するアミノ酸残基とそのリガンドを抽出 しリガンド決定残基一リガンド分類情報を作成する。 表 2 リガンド決定残基一リガンド分類表
(2, 4) リガンド リガンドの種類
L, R 〇 X P
M, Q X X A
C, Τ ΔΔ N 表 2から、 例えば、 2、 4番目のシ一:
Rであれば、 そのリガンドは〇Xであり、 リガンドの種類は Pであると予測され る。
[結合分子未知タンパク質の結合分子種予測工程]
以上のようなリガンド決定残基一リガンド分類情報を入手できれば、 結合分子未 知タンパク質 (リガンドが未知の結合分子既知タンパク質) のリガンド決定残基 位置におけるアミノ酸残基を求めリガンド決定残基一リガンド分類情報に当ては めることにより、 結合分子未知タンパク質のリガンドを予測することが可能とな る。 例えば、 ある結合分子未知タンパク質のシークェンスアラインメントを公知 の方法により求め、 当該シークェンスァラインメントのうち第 2番目と第 4番目の アミノ酸残基が、 それぞれ Mと Qであれば、 その結合分子未知タンパク質のリガン ドの種類は A、 でありリガンドは X X (表 2 ) と予想できる。 このように、 結合分 子未知タンパク質のリガンド (又はリガンドの種類) を予測することにより、 そ のタンパク質とリガンドのペアが決められ、 そのリガンドの物理的 ·化学的 ·生 物学的性質は容易に推定できることから、 そのタンパク質の機能を推定すること につながる。 したがって、 本発明の予測方法は新規な医薬を開発する上でも有益 である。
以上の説明では、 リガンドについて説明したが、 本発明は、 リガンドのみなら ず、 結合分子既知タンパク質に結合する分子を予測することができる。 例えば、 結合分子既知タンパク質が G P C Rである場合には当該 G P C Rに結合する、 G タンパク質を予測することもできる。
各種細胞や臓器における複雑な機能を調節する物質と、 その特異的レセプター タンパク質、 特には Gタンパク質共役型レセプ夕一タンパク質との関係を明らか にすることは、 各種細胞や臓器における複雑な機能を解明し、 それら機能と密接 に関連した医薬品開発に非常に重要な手段を提供することとなる。 本発明の結合 分子未知タンパク質の結合分子予測方法を用いれば、 例えば、 G P C Rのリガン ド及び Z又はリガンドの種類を予測することが可能となる。 G P C Rのリガンド 及び/又はリガンドの種類を予測することができれば、 当該 G P C Rの生体内で の機能を予測することにつながる。 そして、 例えば、 機能が予測され、 そのリガ ンド及び/又はリガンドの種類が予測された G P C Rに関する情報を用いれば、
容易に当該 G P C Rが関与する疾患等の予防薬、 治療薬を製造することが可能と なる。
GPCRの機能を考慮すると、 特に中枢疾患、 炎症性疾患、 循環器疾患、 癌、 代謝性疾患、 免疫系疾患または消化器系疾患の予防剤、 若しくは治療剤のいずれ か又は両方の製造方法に本発明は有効に利用されることとなる。 本明細書の配列表の配列番号は、 以下の配列を示す。
〔配列番号: 1〕
ラット TGR 23— 2リガンド (1— 18) のアミノ酸配列を示す。
〔配列番号: 2〕
ラット TGR23 - 2リガンド (1一 1 5) のアミノ酸配列を示す。
〔配列番号: 3〕
ラット TGR2 3— 2リガンド (1— 14) のアミノ酸配列を示す。
〔配列番号: 4〕
以下の参考例 6における P CR反応で使用したプライマーの塩基配列を示す。 〔配列番号: 5〕
以下の参考例 6における P C R反応で使用したプライマーの塩基配列を示す。 〔配列番号: 6〕
以下の参考例 6における P C R反応で使用したプライマーの塩基配列を示す。 〔配列番号: 7〕
ヒト TGR 23— 2リガンド前駆体をコードする c DN Aの塩基配列を示す。 〔配列番号: 8〕
ヒト TGR 23— 2リガンド前駆体のアミノ酸配列を示す。
〔配列番号: 9〕
ヒト TGR 23— 2リガンド (1— 1 8) のアミノ酸配列を示す。
〔配列番号: 10〕
ヒト TGR23— 2リガンド (1— 1 5) のアミノ酸配列を示す。
〔配列番号: 1 1〕
ヒト TGR 23— 2リガンド (1— 14) のアミノ酸配列を示す。
〔配列番号: 1 2〕
ヒト TGR 23— 2リガンド (1一 20) のアミノ酸配列を示す。
〔配列番号: 13〕
以下の参考例 7における P C R反応で使用したプライマーの塩基配列を示す。 〔配列番号: 14〕
以下の参考例 7における P CR反応で使用したプライマーの塩基配列を示す。 〔配列番号: 1 5〕
以下の参考例 7における P CR反応で使用したプライマーの塩基配列を示す。 〔配列番号: 16〕
マウス TGR 23 -2リガンド前駆体をコードする c DNAの塩基配列を示す 〔配列番号: 17〕
マウス TGR 23— 2リガンド前駆体のァミノ酸配列を示す。
〔配列番号: 1 8〕
マウス TGR 23— 2リガンド (1— 1 8) のアミノ酸配列を示す。
〔配列番号: 1 9〕
マウス TGR 23— 2リガンド (1— 1 5) のアミノ酸配列を示す。
〔配列番号: 20〕
マウス TGR 23— 2リガンド (1— 14) のアミノ酸配列を示す。
〔配列番号: 2 1〕
マウス TGR 23— 2リガンド (1— 20) のアミノ酸配列を示す。
〔配列番号: 22〕
以下の参考例 8における P CR反応で使用したプライマーの塩基配列を示す。 〔配列番号: 23〕
ラット TGR 23— 2リガンド前駆体の一部をコードする c DNAの塩基配列 を示す。
〔配列番号: 24〕
ラット TGR 23— 2リガンド前駆体の一部のアミノ酸配列を示す。
〔配列番号: 25〕
ラット TGR 23— 2リガンド (1— 20) のアミノ酸配列を示す。
〔配列番号: 26〕
ヒト TGR 23— 2リガンド (1— 16) のアミノ酸配列を示す。
〔配列番号: 27〕
以下の参考例 9における P CR反応で使用したプライマーの塩基配列を示す。 〔配列番号: 28〕
以下の参考例 9における P C R反応で使用したプライマ一の塩基配列を示す。 〔配列番号: 29〕
以下の参考例 9における P C R反応で使用したプライマーの塩基配列を示す。 〔配列番号: 30〕
ラッ卜 TGR 23— 2リガンド前駆体をコードする c DN Aの塩基配列を示す
〔配列番号: 31〕
ラット TGR 23 - 2リガンド前駆体のアミノ酸配列を示す。
〔配列番号: 32〕
以下の参考例 1 0における P CR反応で使用したプライマ一 1の塩基配列を示 す。
〔配列番号: 33〕
以下の参考例 1 0における P CR反応で使用したプライマー 2の塩基配列を示 す。
〔配列番号: 34〕
以下の参考例 1 1における TGR 23 - 1発現 CHO細胞の TGR 23— 1遺 伝子発現量を測定するのに使用したプライマーの塩基配列を示す。
〔配列番号: 35〕
以下の参考例 1 1における TGR 23— 1発現 CHO細胞の TGR 23— 1遺 伝子発現量を測定するのに使用したプライマーの塩基配列を示す。
〔配列番号: 36〕
以下の参考例 1 1における TGR 23 - 1発現 CHO細胞の TGR 23— 1遺 伝子発現量を測定するのに使用したプローブの塩基配列を示す。 5 ' 端は 6—力
ルポキシーフルォレセィン (F am) で、 3 , 端は 6—カルボキシーテトラメチ ルーローダミン (T amr a) で標識されている。
〔配列番号: 37〕
ヒ'ト由来 Gタンパク質共役型レセプタータンパク質 TGR 23 - 1 (ヒト TG R 23 - 1) のアミノ酸配列を示す。
〔配列番号: 38〕
ヒト由来 Gタンパク質共役型レセプタータンパク質 TGR 23— 1をコードす る c DN Aの塩基配列を示す。 =
〔配列番号: 3 9〕
ヒト由来 Gタンパク質共役型レセプ夕一タンパク質 TGR 23 -2 (ヒト TG R 23 - 2) のアミノ酸配列を示す。
〔配列番号: 40〕
ヒト由来 Gタンパク質共役型レセプタータンパク質 TGR 23 -2をコードす る c DNAの塩基配列を示す。 実施例
以下の実施例においては、 結合分子既知タンパク質および結合分子未知タンパ ク質として GP CRをあげるが、 本発明は、 その要旨を超えない限りこれらに限 定されるものではない。
[実施例 1 ]
( G P C Rのリガンドの種類の予測)
GP CRのシークェンスァラインメント及びリガンドが登録されている GP C RDB (データべ一ス) から、 1152種類の GP CRのシークェンスァラインメン トおよびリガンドに関する情報を取得し結合分子既知タンパク質分類情報 (表 3 ) を得た。 その後、 取得したリガンドを 3つの種類に分けた。 3つの種類は以下の 通りである。
P …… Peptides (ペプチド)、 C emokines (ケモカイン) 、 Glycoproteins (糖 タンパク質)
A ··· ··· Monoamines (モノァミン) 、 (アドレナリン、 アセチルコリン、 ドーパ ミン、 セレトニン、 ヒスタミン)
N …… Lipids (脂質)
1152種類の G P C Rのシークェンスアラインメントおよびリガンドに関する情 報をコンピュータに入力した。 入力された 1152種類の G P C Rのシークェンスァ ラインメントおよびリガンドに関する情報を Π (n)関数及び f 2 (n)関数を用いたリ ガンド決定残基位置候補選択手段により選択した 6種類のリガンド決定残基位置 候補を表 3に示す。
リガンド決定残基位置候補選択手段においては、 f l (n)関数の値と、 f2 (n)関数 の値の積が小さいものをリガンド残基位置候補として選ぶ。 それらのうち、 シー クエンスァラインメント不能(-)が、 全体の 3 %以上存在しているものがあれば、 リガンド決定残基位置候補から除いた。 このようにして、 リガンド残基位置候補 を 2 0個選択した。 表 3は、 それらのうちより好ましい 6個のリガンド残基位置 候補について、 関数 Π (η)、 関数 f2 (n)の評価値及び順位をそれぞれ表したもので める。 表 3 好ましい 6個のリガンド残基位置候補について、 関数 i l (n)、 関数 f 2 (n)の 評価値及び順位をそれぞれ表したもの f l (n) f2 (n)
残基位置 順位 評価値 順位 評価値
82 1 9222 10 51554
86 5 13317 3 22593
90 2 10112 1 21168
91 13 15016 12 62274
209 18 16389 21 81468
230 10 14618 25 93622 表 3によれば、 例えば、 シークェンスアラインメントが 8 6番の残基位置につ いての、 関数 Π (η)の順位が 5位で、 関数 f2 (n)の順位は 3位であることがわかる。 上記 6種類のリガンド決定残基位置候補を組合せ、 360個のリガンド決定残基位
置のペア候補をあげた。 360個のリガンド決定残基位置のペア候補に関する情報を 式 3に代入し、 リガンド決定残基位置のペアを決定した。 その結果、 f3 (n)の値が 最も小さく、 最も好ましいリガンド決定残基位置 (のペア) は、 (86, 90) 、 す なわち、 G P C Rのシークェンスァラインメントのうち第 86番目と第 90番目のァ ミノ酸残基位置であった。 また、 (86, 90) .から導き出される予測を補完できる かどうかを指標とし、 次に好ましいリガンド決定残基位置として、 (209, 211)、 と(86, 236)を選択した。
結合分子既知タンパク質分類情報から G P C Rのシークェンスアラインメント のうち第 86番目と第 90番目のアミノ酸残基の種類とリガンドの種類の数を抽出し 、 リガンド決定残基一リガンド分類情報を得た。 それを抜粋したものを表 4に示 す。 表 4から、 例えば 1152種類の G P C Rのうち、 アミノ酸残基位置 8 6番目及 び 9 0番目のアミノ酸がそれぞれ Aと Gであるものは、 8 6種類あり、 それらの リガンドは全て N (脂質) に分類されることがわかる。 このように、 殆どの G P C Rは、 アミノ酸残基位置 8 6番目及び 9 0番目のアミノ酸によって、 そのリガ ンドを予測することができることがわかる。 表 4 リガンド決定残基一リガンド分類表 (結合分子決定残基一結合分子分類表
)
アミノ酸残基 リガンドの種類 合計
86 90 A N P
A G 0 86 0 86
D C 114 0 0 114
D M 26 0 0 26
D Q 13 0 0 13
D S 68 0 0 68
D V 26 0 0 26
F L 0 20 6 26
F M 0 2 13 15
G G 0 58 0 58
I L 0 4 23 27
I M 0 0 32 32
I V 0 1 7 8
K F 0 0 11 11
K M 0 0 10 10
L M 0 0 9 9
M G 0 26 0 26
M V 11 0 13 24
P M 0 . 0 7 7
p V 0 0 8 8
Q I 0 0 15 15
Q M 0 0 25 25
Q V 0 0 48 48
T S 0 0 26 26
v F o 9 o 9
V G 0 30 0 30
V L 0 0 19 19
V T 17 0 0 17
Y F 0 0 42 42
Y L 0 0 28 28 表 4から、 例えば、 G P C Rのシークェンスアラインメントのうち第 86番目と 第 90番目のアミノ酸残基が、 それぞれ Aと Gである G P C Rは、 86種類あり、 それ らに対するリガンドは全て N (脂質) に分類されるリガンドであることがわかる。 次に、 最近リガンドが発見された G P C Rを無作為に選択し、 上記リガンド決 定残基一リガンド分類情報の精度 (すなわち、 今回のリガンド予測方法の精度) を分析した。 その結果を表 5に示す。 表 5
G P C R ァミノ酸残基 N ァミノ酸残基 N ァミノ酸残基 N
86 90 209 211 86 236
GPR2 I M 32/32 V F 4/26 I N 61/66
GPR5 A L 1/2 Q L 6/7 A H 0/0
GPR8 D I 1/1 A T 1/3 D N 40/234
GPR10 Q V 48/48 R L 3/20 Q S 34/34
GPR13 F F 4/4 E L 10/10 F H 5/9
GPR14 D M 26/26 A Y 0/0 D N 40/234
GP 16 C M 1/3 E S 0/0 C S 0/4
GPR24 D G 13/13 Q S 1/1 D N 40/234
GP 28 Y F 42/42 Q I 1/1 Y H 71/71
GPR29 Y L 28/28 S F 12/19 Y H 71/71
GPR54 Q V 48/48 Q L 5/6 Q N 52/52
GPR74 Q V 48/48 S Y 2/2 Q N 52/52
APJ I M 32/32 Y L 2/7 I N 61/66
請 Q V 48/48 I Y 0/0 Q H 3/3
表 5について説明する。 例えば、 GPR2のシークェンスアラインメントのうち、 第(86, 90)番目 (結合分子決定残基位置) のアミノ酸残基は、 それぞれ I、 Mとい う配列である。 結合分子決定残基一結合分子分類情報にある結合分子既知 G P C R1152種類のうち、 第(86, 90)番目のアミノ酸残基が、 それぞれ I、 Mとなるもの は 32種類あって、 それらのうちリガンドの種類がペプチドのものは 3 2種類全 てである。 この GPR 2は、 1 1 52種類の結合分子既知 GP CRに含まれてい ないが、 実際のリガンドの種類はペプチドであり、 予測されたリガンドの種類と 一致している。
また、 GPR2のシークェンスアラインメントのうち、 結合分子決定残基位置 (2 0 9, 2 1 1 ) 番目のアミノ酸残基は、 それぞれ V、 Fである。 そして、 上記 1 1 52種のうち、 2 0 9、 2 1 1番目のシークェンスアラインメントが、 V、 F であるものは、 2 6種類あり、 それらのうちリガンドの種類がペプチドのものは 4種類である。
表 5から結合分子決定残基位置(86, 90)が、 3種のうちで最も好ましい結合分子 決定残基位置であることがわかる。 更に、 表 5によれば、 高い精度をもってリガ ンドの種類を予測できることがわかる。
次に、 結合分子決定残基位置(86, 90)、 及び (209, 211) を組合せたリガンド決 定残基一リガンド分類情報の精度を分析した。
例えば、 表 5より、 GPR2の結合分子決定残基位置(86, 90)、 及び (209, 211) の N (1 1 52種の GPCRであって、 結合分子決定残基が、 GPR2と一致したもの と、 リガンドの種類も同一であったものの数) は、 それぞれ 3 2/3 2、 及び 4 /2 6である。 これらを足し合わせ、 3 6/58とする。
このようにして、 表 5に記載された全ての GP CRについて、 GPR2の結合分子 決定残基位置(86, 90)、 及び (209, 211) の Nを足し合わせた。 この結果、 評価対 象が増大し、 結合分子決定残基位置(86, 90)、 又は (209, 211) 単独でリガンドの 種類を予測した場合に比べ、 より精度高くリガンドの種類を予測できることが確 認された。
[実施例 2 ]
(GPCRに結合する結合 G a夕ンパク質の種類の予測方法)
まず、 GP CRの結合分子である結合 G αタンパク質を G i、 Gq, G sの 3種類 に分類した。 これは、 T I P S (Trends in pharmacological sciences) の 2000 Receptor&Ion channel Nomenclature Supplement ίこ従って結合 G α夕ンノ ク 質を 3つに分類したものである。 なお、 簡単の為に、 T I P Sの 2000 Receptor &Ion channel Nomenclature Supplement 中、 Gi/oを Gi、 GQ/11を GQとした。 また 、T I P Sの 2000 Receptor&Ion channel Nomenclature Supplementにあげられ る結合 Go;タンパク質のから、 2種類以上の Gひタンパク質に結合するもの、及び Gi/al, 3、 Gi/a2, 3を例外として除外した。 このようにして、 約 6 0 0種類の GP CR及びそのシークェンスアラインメント、 並びにそれに結合する結合 G αタン パク質、 及びその種類に関する情報を得た。
GP CRのシークェンスァラインメントと、 当該 Gタンパク質に結合する結合 Gaタンパク質の種類に関する情報を、 コンピュータに入力した。 入力された G PCRのシークェンスァラインメン卜および結合 G cuタンパク質の種類に関する 情報を f 1 (n)関数及び f2 (n)関数を用いた結合分子決定残基位置候補選択手段によ り選択した。 その結果、 2種類の結合分子決定残基位置のペア (1 7 7、 1 7 8) 、 及び (8 2、 2 30) が得られた。
結合分子決定残基位置候補選択手段においては、 Π (η)関数の値と、 ί2(η)関数 の値の積が小さいものを結合分子残基位置候補として選ぶ。 それらのうち、 シ一 クエンスアラインメント不能(-)が、 全体の 3 %以上存在しているものがあれば、 リガンド決定残基位置候補から除いた。 このようにして、 リガンド残基位置候補 を選択した。
次に、 2種類の結合分子決定残基位置のペア (1 7 7、 1 7 8) 、 及び (8 2、 23 0) の結合分子の種類を予測する精度を確認した。
複数の GP CRについて結合する Gaタンパク質の種類を文献から入手した。 そして、 結合 Go;タンパク質が、 どのような手法で得られたものであるかを、 Ca influxによる場合、 Arachidonic acid release:ァラキドン酸の放出による場合 、 PTX (pertussis toxin sensitive)による場合、 環状アデノシン一リン酸による 場合に分け、 それぞれ、 Ca、 AA、 PTX、 cAMPとした。 なお、 Caだけで GQの判定をし
ている場合は、 結合 Gaタンパク質が他のものである可能性があるので、 排除し た。 このようにして、 GPCRを選択した。
選択された GPCR及び、 文献から得られた結合 GPCRの種類、 当該種類が 得られた手法、 結合分子決定残基位置のペア (177、 1 78) 、 及び (82、 230) におけるシークェンスアラインメントと、 それぞれのペアから予測され る Go;タンパク質の種類を表 6に示す。 表 6
GPCR ァミノ酸残基 N アミノ酸残基 N 実験 予想
177 178 83 230
GPR5 R S 9/9 N R 0/0 Gi (PTX) Gi
GPR8 L G 4/4 L T 0/0 Gi (cAMP) GQ
GPR13 K N 3/3 T E 32/32 Gi (PTX) Gi
GPR14 A R 1/2 F T 1/1 Ga (AA) Ga
GPR16 F 3/3 H I 3/3 G (Ca) GQ
GPR24 I R 1/1 I I 9/9 Gi (cAMP) Gi
GPR39 S R 0/0 T E 32/32 GQ (AA) Gi
APJ G L 2/2 S T 0/0 Gi (cAMP) Gi 例えば、 表 6の GPR5について説明する。 GP R5の結合 G aタンパク質の種 類は Giであり、 その種類は、 PTXにより取得されたものである。 そして、 GPR5の第 177番目と第 178番目のシークェンスアラインメントは、 Rと Sである。 このような シークェンスァラインメントをもつ GPCRは 9個あり、それらの共役 Gcuタンパク質 の種類は、 いずれも Giであることがわかる。 上記 8種の GPCRのうち、 GPR5、 GPR13 、 GPR14、 GPR16、 GPR24、 AP; [の 6種について結合 G o;タンパク質の予想が的中して いる。 以上より本発明によれば、 高い精度をもって結合 Gaタンパク質を予測す ることが可能となることがわかる。
[実施例 3 ]
( T G R 23リガンドの予測)
2種の S D Mペアを組み合わせて評価することにより、 高い精度でリガンドの 種類を予測できることが明らかとなった。 そこで、 本発明の方法を用いて、 配列
番号: 37および配列番号: 39で表される Gタンパク質共役型レセプタータン パク質である TGR 23のアミノ酸配列情報のシークェンスァラインメントを行 レ 、 その結果から、 TGR 23リガンドの予測を行った。 ここでは、 TGR 23 一 1とゥシロドプシンのシークェンスアラインメントの結果を図 4に示す。
図 4に示したとおり、 TGR 23— 1における結合分子決定残基位置 (86、 90) 、 (209, 2 1 1 ) および (86、 236) のアミノ酸は、 それぞれ ( Q、 L) 、 (D、 F) および (Q、 N) であった。 これらの N (1 1 52種の G PCRであって、 結合分子決定残基が TGR 23と一致したものと、 リガンドの 種類も同一であったものの数) は、 それぞれ 0/0、 13/27および 52/5 2であり、 評価 G PC R数が広範な (86、 90) と (86、 236 ) の SDM ペアを組み合わせた評価では、 リガンド種類はペプチドであると推定された。 以下の参考例では、 実際に TGR23 (TGR 23 _ 1および TGR 23— 2 ) のリガンドがペプチドであることを示す。 [参考例 1] ·
(TGR 23一 2発現 CHO細胞に対して特異的に cAM P産生促進活性を示す 活性物質のラット全脳抽出物からの精製)
TGR 23 - 2に特異的なリガンド活性を示す物質を、 TGR 23— 2発現 C HO細胞に対する c AMP産生促進活性を指標として、 ラッ卜全脳から精製した 。
ラット全脳抽出物の高速液体クロマトグラフィー (HPLC) フラクションを 以下に述べる方法で調製した。 日本チャールズリバ一 (株) より購入したォス 8 週齢のウィスターラットの全脳 400 g (200頭分) を順次摘出直後、 25頭 ずつ沸騰した蒸留水 (300m l ) に投じて 10分間煮沸した。 煮沸後、 直ちに 氷冷し、 200頭分を合わせて (2. 4L) 酢酸 1 80m 1を加えて終濃度 1. 0Mとし、 低温下ポリ トロン (10, 000 r pm、 2分間) を用いて破砕した 。 破砕液を遠心 (8, 000 r pm、 30分) して上清を取り、 沈殿には 1. 0 M酢酸 2. 4Lを加えて再度ポリ トロンによって破砕し、 一晩攪拌した後、 遠心 (8, 000 r pm、 30分) して上清を得た。 各遠心で得られた上清は、 2倍
量 (4. 8 L) の冷アセトンを 4°Cでゆっくり滴下した後、 1回目の遠心により 得られた上清については一晩攪拌し、 2回目の遠心により得られた上清について は 4時間攪拌した。 アセトンを加えた抽出液は遠心 (8, 000 r pm、 30分 ) して沈殿を除き、 得られた上清については減圧下エバポレー夕一にてアセトン を留去した。 アセトンを留去した抽出液に等量のジェチルエーテルを加え、 分液 ロートを使って脂質を含むエーテル層を分離して水層を回収した。 エーテル脱脂 した抽出液はエバポレー夕一にて減圧下濃縮しエーテルを完全に除去した。 濃縮 液をガラス繊維濾紙 (アドバンテック、 DP 70 (9 Οπιιη ) ) で濾過し、 濾 液をガラス製カラム (30 X 240 mm) に充填した ODSカラム (ダイソ一 、 Daisogel IR-120-0DS-A 63/210 um) に付した。 カラムを 1. 0M酢酸 400 m 1で洗浄後、 0. 1 %トリフルォロ酢酸を含む 60 %ァセトニトリル 500m 1 で溶出した。 溶出液を減圧下濃縮して溶媒を留去した後、 濃縮液を凍結乾燥した 。 得られた白色粉末 1. 2 gを 30m lの 0. 1 %トリフルォロ酢酸を含む 10 %ァセトニトリルに溶解し、 12. 5m 1ずつを OD Sカラム (東ソ一、 TSKgel ODS-80TS (2 1. 5 φ X 300 mm) ) を用いた 10 %から 60 %の 0. 1 %ト リフルォロ酢酸を含むァセトニトリルの濃度勾配溶出法による分取 HP L Cに付 した。 HP LCは 2回に分けて行い、 溶出液は 2分毎に 60分画にし、 2回分の 溶出液をまとめた。 各分画を減圧下に濃縮 ·乾固し、 残渣に 0. 4m lのジメチ ルスルホキシド (DMSO) を添加後ポルテックスミキサー、 および超音波洗浄 機を用いて完全に溶解した。
上記によって得られた HPLCフラクションの DMSO溶液を参考例 3に示し た方法に従い TGR 23— 2発現 CHO細胞に投与し、 細胞内 c AMP産生量の 測定を行なった結果、 分画番号 1 8、 20および 22〜 23に顕著な c AMP産 生促進活性が認められた。 また同様の試料について公知の方法に従いァラキドン 酸代謝物遊離活性を調べた結果、 顕著な活性が確認された。
これらの活性は他のレセプ夕一発現細胞では認められなかったことより、 ラッ ト全脳抽出物に T GR 23- 2に特異的なリガンド活性物質が存在することが示 された。 得られた 3つの活性画分をそれぞれ以下の (a) 〜 (c) の方法により さらに精製した。 また、 いずれの活性分画についても、 以下に述べる最初の陽ィ
オン交換力ラムを用いた精製工程において得られた c AM P産生促進活性が認め られた分画には、 同時に FL I PR (モレキュラーデバイス社) によってレセプ ター特異的な細胞内カルシウム遊離活性が認められた。 そこで、 それ以降の精製 工程における活性の確認には、 FL I PRによる細胞内カルシウム遊離活性を指 標として用い、 活性を示した分画が c AMP産生促進活性を示すことについては 適宜確認した。
(a) 分画番号 1 8
分画番号 1 8については、 1 0 %ァセトニトリルを含む 1 OmMギ酸アンモニ ゥム 1 0m lに溶解し、 陽イオン交換カラム (東ソ一、 TSKgel SP-5PW ( 20 mm φ X 1 5 Omm) ) に付した後、 1 0 %ァセトニトリルを含む 1 0 mMから 1. 0Mのギ酸アンモニゥムの濃度勾配により溶出した。 活性はギ酸アンモニゥム 0 . 4M付近に回収された。 活性分画を凍結乾燥後、 0. 1 %トリフルォロ酢酸を 含む 1 0 %ァセトニトリル 0. 8m lに溶解し、 OD Sカラム (東ソ一、 TSKgel 0DS-80TS (4. 6 φ X 2 5 Omm) ) に付した後、 0. 1 %トリフルォロ酢酸を 含む 1 0 %から 2 5 %のァセトニトリルの濃度勾配により溶出した結果、 ァセト 二トリル 1 3 %付近に活性が認められた。 得られた活性分画を凍結乾燥後、 0. lm 1の DMSOで溶解し、 さらに 0. 7m lの 0. 1 %ヘプタフルォロ酪酸を 含む 1 0 %ァセトニトリルを加えて OD Sカラム (和光純薬、 Wakosii- II 3C18H G (2. Ο ΠΊΠΙ Φ X 1 5 Omm) ) に付した後、 0. 1 %ヘプタフルォロ酪酸を含 む 1 0 %から 3 7. 5 %のァセトニトリルの濃度勾配により溶出し、 ピーク毎に 手動で分取した。 活性はァセトニトリル 2 6 %付近に認められた。 活性画分には 、 さらに 0. 7m lの 0. 1 %を含むトリフルォロ酢酸 1 0 %ァセトニトリルを 加え、 QDSカラム (和光純薬、 Wakosi卜 II 3C18HG) に付した後、 0. 1 %トリ フルォロ酢酸を含む 1 0 %から 20 %のァセトニトリルの濃度勾配によって溶出 し、 溶出液はピーク毎に手動で分取した。 活性はァセトニトリル 1 1 %付近に単 一ピークとして得られた。 この分画に含まれる活性物質は、 以下の参考例 5に示 すようにして構造決定した。
(b) 分画番号 2 0
分画番号 20については、 1 0 %ァセトニトリルを含む 1 OmMギ酸アンモニ
ゥム 10mlに溶解し、 陽イオン交換カラム (東ソ一、 TSKgel SP-5PW ( 20 mm X 150mm) ) に付した後、 10 %ァセトニトリルを含む 1 OmMから 1. 0Mのギ酸アンモニゥムの濃度勾配により溶出した。 活性はギ酸アンモニゥム 0 . 6 M付近に回収された。 活性分画を凍結乾燥後、 0. 1%トリフルォロ酢酸を 含む 10 %ァセトニトリル 0. 8mlに溶解し、 CNカラム (野村化学、 Develo sil CN-UG-5 (4. 6 mm φ X 250 mm) ) に付した後、 0. 1 %トリフルォロ 酢酸を含む 10%から 25%のァセトニトリルの濃度勾配によって溶出した結果 、 ァセトニトリル 12%付近に活性が認められた。 得られた活性分画を凍結乾燥 後、 0. lm 1の DMS 0で溶解し、 さらに 0. 7mlの 0. 1 %トリフルォロ 酢酸を含む 10%ァセトニトリルを加えて ODSカラム(和光純薬、 Wakosil-II 3C18HG (2. ΟπΐΓηφ X 150mm) ) に付した後、 0. 1%トリフルォロ酢酸 を含む 10 %から 20 %のァセトニトリルの濃度勾配により溶出し、 溶出液はピ ーク毎に手動で分取した。 活性はァセトニトリル 15 %付近に単一ピークとして 得られた。 この分画に含まれる活性物質を以下の参考例^ =3に示すようにして構 造決定した。
( c ) 分画番号 22〜 23
分画番号 22〜 23については、 10 %ァセトニ卜リルを含む 1 OmMギ酸ァ ンモニゥム 10mlに溶解し、 陽イオン交換カラム (東ソ一、 TSKgel SP-5PW (2 Οπιηι X 150mm) ) に付した後、 10 %ァセトニトリルを含む 1 OmM力、 ら 1. 0Mのギ酸アンモニゥムの濃度勾配により溶出した。 活性はギ酸アンモニ ゥム 0. 4M付近に回収された。 活性分画を凍結乾燥後、 0. 1%トリフルォロ 酢酸を含む 10%ァセトニトリル 0. 8mlに溶解し、 CNカラム (野村化学、 D evelosil CN-UG-5 (4. βπιπι X 250 mm) ) に付した後、 0. 1%トリフ ルォロ酢酸を含む 10%から 25%のァセトニトリルの濃度勾配によって溶出し た結果、 ァセトニトリル 13%付近に活性が認められた。 得られた活性分画を凍 結乾燥後、 0. 1 m 1の DMS Oで溶解し、 さらに 0. 7mlの 0. 1%トリフ ルォロ酢酸を含む 10 %ァセトニトリルを加えて OD Sカラム (和光純薬、 Wako sil-II 3C18HG (2. 0 mm φ X 150 mm) ) に付した後、 0. 1 %トリフルォ 口酢酸を含む 10%から 20%のァセトニトリルの濃度勾配により溶出し、 ピー
ク毎に手動で分取した。 活性はァセトニトリル 16%付近に認められた。 活性分 画には、 さらに 0. 7m lの 0. 1 %ヘプ夕フルォロ酪酸を含む 10 %ァセトニ トリルを加え、 ODSカラム (和光純薬、 Wakosil- II 3C18HG) に付した後、 0. 1 %ヘプタフルォロ酪酸を含む 1 0 %から 37. 5 %のァセトニトリルの濃度勾 配によって溶出し、 溶出液はピーク毎に手動で分取した。 活性はァセトニトリル 28%付近に単一ピ一クとして得られた。 この分画に含まれる活性物質は、 以下 の参考例 4に示すようにして構造決定した。
[参考例 2 ]
(ラッ卜全脳抽出物中の TGR 23一 2発現 CHO細胞に対して特異的に細胞内 c AMP産生促進活性を示す活性物質のプロナ一ゼによる失活)
参考例 1で TGR 23— 2発現 CHO細胞に対して細胞内 cAM P産生促進活 性を示した H PLC分画 1 8、 20ぉょび22〜23を、 タンパク質分解酵素で あるプロナ一ゼ (Sigma, protease Type XIV (P5147)) で処理し、 活性物質が夕 ンパク性であるか否かを調べた。
上記ラット全脳抽出物 HP LC活性分画 (分画番号 1 8、 20および 22〜2 3) 各 4〃 1を 0. 2M酢酸アンモニゥム 1 00 1に加え、 これにプロナ一ゼ 3 i gを添加して 37°Cで 2時間インキュベートした後、 沸騰水中で 1 0分間加 熱して添加したプロナーゼを失活させた。 これに B SAO. 05mgおよび CH AP S 0. 05mgを含む蒸留水 lm 1を加え凍結乾燥した。 凍結乾燥した試料 を、 公知の方法に従い TGR 23— 2発現 CHO細胞に添加して細胞内 c AMP 産生促進活性を測定した。
その結果、 いずれの分画の活性もプロナーゼ処理によって完全に消失した。 従って、 ラット全脳抽出物中の TGR 23— 2発現 CHO細胞に対して細胞内 c AMP産生促進活性を示す活性物質は、 いずれもタンパク質またはペプチドで あることが明らかとなった。
[参考例 3 ]
(ラッ卜全脳抽出物の分画番号 20から得られた TGR 23一 2発現 CHO細胞
に対して特異的に c AMP産生促進活性を示す活性物質のアミノ酸配列の決定) 参考例 2に示したようにラット全脳抽出物の 3つの分画に含まれる TGR 2 3 一 2発現 CHO細胞に対して特異的に c AMP産生促進活性を示す活性物質は、 いずれもタンパク性であることが予想されたので、 以下のようにそれぞれについ てアミノ酸配列解析を行なった。
参考例 1に示すようにしてラット全脳抽出物の分画番号 2 0から得られた T G R 2 3 _ 2発現 CHO細胞に対して特異的に c AMP産生促進活性を示す活性物 質のアミノ酸配列解析および質量分析を行なった。 活性ピークを含む溶出液を用 いて Procise 491cLCプロテインシーケンサー (アプライドバイオシステム) によ るァミノ末端アミノ酸配列分析を行なったところ、 N末端から 1 8残基までに S FRNGVGS GVKKTS FRRA (配列番号: 1) のアミノ酸配列が得られ た。 同様の溶出液を用いてナノスプレーイオン源(プロ夕ナ) を装着した Thermo Fiimigan LCQイオントラップ質量分析計 (サーモクエスト) による質量分析を行 なった結果、 配列番号: 1のアミノ酸配列から計算される質量値が得られた (実 測値: 1 9 54. 9、 計算値: 1 9 54. 2 ) 。
これより、 ラット全脳抽出物の分画番号 2 0から得られた TGR2 3— 2発現 CHO細胞に対して特異的に c AMP産生促進活性を示す活性物質は、 配列番号 : 1に示すアミノ酸配列を有するものであると決定された。 [参考例 4]
(ラット全脳抽出物の分画番号 22〜23から得られた TGR 2 3— 2発現 CH 0細胞に対して特異的に c AMP産生促進活性を示す活性物質のアミノ酸配列の 決定)
参考例 1に示すようにしてラット全脳抽出物の分画番号 2 2〜23から得られ た TGR 23— 2発現 CHO細胞に対して特異的に c AMP産生促進活性を示す 活性物質のアミノ酸配列解析および質量分析を行なった。 活性ピークを含む溶出 液を用いて Procise 491cLCプロテインシーケンサー (アプライドバイオシステム ) によるァミノ末端アミノ酸配列分析を行なったところ、 N末端から 1 5残基ま でに S FRNGVGS GVKKTS F (配列番号: 2) のアミノ酸配列が得られ
た。 同様の溶出液を用いてナノスプレーイオン源(プロ夕ナ) を装着した Tiiermo Finnigan LCQイオントラップ質量分析計 (サーモクエスト) による質量分析を行 なった結果、 配列番号: 2のアミノ酸配列から計算される質量値が得られた (実 測値: 1570. 8、 計算値: 1570. 8 ) 。
これより、 ラット全脳抽出物の分画番号 22〜23から得られた TGR23— 2発現 CHO細胞に対して特異的に c AMP産生促進活性を示す活性物質は、 配 列番号: 2に示すアミノ酸配列を有するものであると決定された。
[参考例 5 ]
(ラッ卜全脳抽出物の分画番号 18から得られた TGR23— 2発現 CHO細胞 に対して特異的に c AMP産生促進活性を示す活性物質のアミノ酸配列の決定) 参考例 1に示すようにしてラット全脳抽出物の分画番号 18から得られた TG R23一 2発現 CHO細胞に対して特異的に c AMP産生促進活性を示す活性物 質のアミノ酸配列解析および質量分析を行なった。 活性ピークを含む溶出液を用 いて Procise 491cLCプロテインシーケンサー (アプライドバイオシステム) によ るァミノ末端アミノ酸配列分析を行なったところ、 N末端から 14残基までに S FRNGVGSGVKKTS (配列番号: 3) のアミノ酸配列が得られた。 同様 の溶出液を用いてナノスプレーイオン源 (プロタナ) を装着した Thermo Finniga n LCQイオントラップ質量分析計(サ一モクエスト) による質量分析を行なった結 果、 配列番号: 3のアミノ酸配列から計算される質量値が得られた (実測値: 1 424. 1、 計算値: 1423. 6) 。
これより、 ラッ卜全脳抽出物の分画番号 18から得られた TGR23— 2発現 CHO細胞に対して特異的に c AMP産生促進活性を示す活性物質は、 配列番号
: 3に示すアミノ酸配列を有するものであると決定された。
[参考例 6 ]
(ヒト TGR 23-2リガンド前駆体をコードする c DNAのクローニング) ラット全脳抽出物から得られた TGR 23一 2発現 CHO細胞に対して特異的 に c AMP産生促進活性を示す活性ペプチド (本明細書中、 ラット TGR23—
2リガンドと記載することがある) のヒトホモログ (本明細書中、 ヒト TGR 2 3 - 2リガンドと記載することがある) の前駆体をコードする c DNAをクロー ニングするため、 ヒト視床下部由来の c DNAを鍀型とした P CRを行なった。 以下の合成 DNAプライマーを用い、 ヒ卜視床下部由来の c DNAを錶型とし て P CR法による増幅を行なった。 反応液の組成は、 ヒト視床下部 Marathon- Rea dy cDNA (CLONTECH) 0. 8 \ , 配列番号: 4および配列番号: 5の合成 DNA プライマ一各 1. 0 M、 0. 2mM dNTP s、 E T a q (宝酒造) 0. 1 II 1および酵素に付属の E xT a qバッファ一で、 総反応量は 20 1 とした。 増幅のためのサイクルはサーマルサイクラ一 (PE Biosystems) を用い、 94°C · 3 0 0秒の加熱の後、 94°C · 1 0秒、 5 5°C · 30秒、 72 °C · 30秒のサイ クルを 3 5回繰り返し、 最後に 7 2 °Cで 5分間保温した。 次に、 DNa s e、 R N a s e F r e eの蒸留水で 50倍希釈した P C R反応液 2 n 1、配列番号: 4 および配列番号: 6の合成 DNAプライマー各 1. 0 M、 0. 2mM dNTP s、 ExT a qポリメラ一ゼ (宝酒造) 0. 1 1および酵素に付属の E x T a qバッファーで総反応量を 2 0 1とし、 サ一マルサイクラ一 (PE Biosystems ) を用い、 94 · 3 00秒の加熱の後、 94°C · 1 0秒、 5 5 °C · 3 0秒、 7 2°C · 3 0秒のサイクルを 3 5回繰り返し、 最後に 7 2°Cで 5分間保温した。 増 幅した DNAを 2. 0 %のァガロースゲル電気泳動により分離した後、 バンドの 部分を力ミソリで切り出し、 DNAを QIAduick Gel Extraction Kit (キアゲン) を用いて回収した。 この DNAを、 pGEM- T Easy Vector System (プロメガ) のプ ロトコールに従って pGEM-T Easyベクタ一へクローニングした。 これを大腸菌 (E scherichia coli) JM109 competent cell (宝酒造) に導入して形質転換した後、 c DN A揷入断片を持つクローンをアンピシリンおよび X— g a 1を含む L B寒 天培地で選択し、 白色を呈するクローンのみを滅菌したつま楊枝を用いて分離し 、 形質転換体を得た。 個々のクローンをアンピシリンを含む LB培地で一晩培養 し、 QIAwell 8 Plasmid Kit (キアゲン) を用いてプラスミド DNAを調製した。 塩基配列の決定のための反応は BigDye Terminator Cycle Seauencing Ready Rea ction Kit (PE Biosystems) を用いて行ない、 蛍光式自動シーケンサ一を用いて 解読し、 配列番号: 7に示す DNA配列を得た。
配列番号: 7で表される DNAの塩基配列には、 配列番号: 1、 配列番号: 2 および配列番号: 3で表されるラット全脳から得られたラット TGR 23— 2リ ガンドのアミノ酸配列に極めて類似したアミノ酸配列をコードするようなフレー ムが存在したことからヒト T G R 23— 2リガンドの前駆体あるいはその一部を コードする c DNAであると推定された。
ヒト TGR 23— 2リガンドと考えられるアミノ酸配列をコードするようなフ レームで配列番号: 7から翻訳されるアミノ酸配列の 5 ' 上流側にはタンパク質 翻訳の開始コドンであると予想される A T Gが 2ケ所存在するが、 疎水性プ口ッ トを行なったところ、 より 5 ' 上流側の ATGから翻訳した場合にのみシグナル 配列と推定される疎水性の高い領域が出現したのでこの AT Gが開始コドンであ ると推定した。 3 ' 側にはヒト TGR 23 - 2リガンドをコードすると考えられ る配列の下流に終止コドンが存在した。 以上により推定されたヒト TGR 23 - 2リガンド前駆体のアミノ酸配列を配列番号: 8に示す。 この配列において、 ヒ ト TGR 23— 2リガンドに相当すると考えられるアミノ酸配列の N末側には、 通常生理活性ペプチドがその前駆体タンパク質から切り出されるとされる Ly s 一 Ar gの配列 (Seidah, N. G. et al.、 Ann. N. Y. Acad. Sci.、 839巻、 9-24 頁、 1998年) が存在した。 一方、 C末側には終止コドンが存在したが、 配列番号 : 1で表されるアミノ酸配列を有するラッ卜 TGR 23 - 2リガンドに対応する 配列との間にさらに 2残基が存在した。
これより、 ヒト TGR 23— 2リガンドのアミノ酸配列は、 ラット全脳抽出物 より得られたラット TGR23 - 2リガンドのアミノ酸配列;配列番号: 1 〔ラ ット TGR 23— 2リガンド (1— 1 8) 〕 、 配列番号: 2 〔ラット TGR 23 — 2リガンド ( 1一 1 5 ) 〕 および配列番号: 3 〔ラット TGR 23— 2リガン ド (1一 14) 〕 にそれぞれ対応する、 配列番号: 9 〔ヒト TGR 23 _ 2リガ ンド ( 1一 1 8 ) 〕 、 配列番号: 1 0 〔ヒ卜 T GR 23— 2リガンド (1— 1 5 ) 〕 および配列番号: 1 1 〔ヒト TGR 23— 2リガンド (1一 14) 〕 で表さ れるアミノ酸配列、 およびさらに配列番号: 9の C末側に 2残基延長された配列 番号: 1 2で表されるアミノ酸配列 〔ヒ卜 TGR 23— 2リガンド (1一 20) 〕 であると推定された。 さらに、 ヒト TGR 23— 2リガンドの配列は、 マウス
TGR 23 - 2リガンドおよびラット TGR 23— 2リガンドの配列と異なり、 その配列中に A r g -A r g配列ではなく G 1 n-A r g配列を有することから 、 配列番号: 26に示された 16残基のアミノ酸配列 〔ヒト TGR 23 -2リガ ンド (1— 1 6) 〕 もまたリガンドの配列であると推定された。
[参考例 7 ]
(マウス TGR23 -2リガンド前駆体をコードする cDNAのクローニング) ラット全脳抽出物から得られたラッ卜 TGR 23— 2リガンドのマウスホモ口 グ (本明細書中、 マウス TGR 23— 2リガンドと記載することがある) の前駆 体をコードする c DNAをクロ一ニングするため、 マウス全脳由来の c DNAを 铸型とした P C Rを行なった。
以下の合成 DN Aプライマーを用い、 マウス全脳由来の c DNAを錶型として P C R法による増幅を行なった。 反応液の組成は、 マウス全脳 Marathon-Ready c DNA (CLONTECH) 0. 8 配列番号: 1 3および配列番号: 14の合成 DNA プライマー各 1. 0〃Μ、 0. 2mM dNTP s、 E x T a α (宝酒造) 0. 1 H 1および酵素に付属の E xT a Qバッファーで、 総反応量は 20 1とした。 増幅のためのサイクルはサーマルサイクラ一 (PE Biosystems) を用い、 94°C · 5分間の加熱の後、 94°C · 10秒、 65°C · 30秒、 72 · 30秒のサイク ルを 3 5回繰り返し、 最後に 72°Cで 5分間保温した。 次に、 DNa s e、 RN a s e F r e eの蒸留水で 100倍希釈した P C R反応液 2 1、配列番号: 1 3および配列番号: 1 5の合成 DNAプライマー各 1. 0 M、 0. 2 mM dN TP s , E xT a Qポリメラ一ゼ (宝酒造) 0. 1 1および酵素に付属の E X T a qバッファーで総反応量は 20 1とし、 サ一マルサイクラ一 (PE Biosyst ems) を用い、 94°C · 5分間の加熱の後、 94°C · 1 0秒、 60 · 30秒、 7 2 °C · 30秒のサイクルを 30回繰り返し、 最後に 72 °Cで 5分間保温した。 増 幅した DN Aを 2. 0 %のァガロースゲル電気泳動により分離した後、 約 440 塩基長の DNAを力ミソリで切り出し、 DNAを QIAQuick Gel Extraction Kit (キアゲン) を用いて回収した。 この DNAを、 pGEM-T Easy Vector System (プ 口メガ)のプロトコールに従って pGEM- T Easyベクタ一へクローニングした。 これ
を大腸菌 (Escherichia coli) JM109 competent cell (宝酒造) に導入して形質 転換した後、 cDNA挿入断片を持つクローンをアンピシリンおよび X_g a 1 を含む LB寒天培地で選択し、 白色を呈するクローンのみを滅菌したつま楊枝を 用いて分離し、 形質転換体を得た。 個々のクローンをアンピシリンを含む LB培地 でー晚培養し、 QIAwell 8 Plasmid Kit (キアゲン) を用いてプラスミド DNAを 調製した。塩基配列の決定のための反応は BigDye Terminator Cycle Sequencing Ready Reaction Kit (PE Biosystems) を用いて行ない、 蛍光式自動シーケンサー を用いて解読し、 配列番号: 16で表される DNA配列を得た。
配列番号: 16で表される DNAの塩基配列には、 配列番号: 1、 配列番号: 2および配列番号: 3で表されるラット全脳から得られたラット TGR 23 _ 2 リガンドのアミノ酸配列に極めて類似したアミノ酸配列をコードするようなフレ —ムが存在したことからマウス TGR 23-2リガンドの前駆体あるいはその一 部をコードする c DNAであると推定された。
マウス TGR23— 2リガンドと考えられるアミノ酸配列をコ一ドするような フレームで配列番号: 16から翻訳されるアミノ酸配列の 5 ' 上流側にはタンパ ク質翻訳の開始コドンであると予想される ATGが 2ケ所存在するが、 疎水性プ ロットを行なったところ、 より 5' 上流側の ATGから翻訳した場合にのみシグ ナル配列と推定される疎水性の高い領域が出現したのでこの A T Gが開始コドン であると推定した。 この AT Gコドンのさらに 5, 上流側には同じフレームで終 止コドンが出現した。 3, 側にはマウス TGR 23-2リガンドをコードすると 考えられる配列の下流に終止コドンが存在した。 以上により推定されたマウス T GR 23— 2リガンド前駆体のアミノ酸配列を配列番号: 17に示す。 この配列 において、 マウス TGR 23-2リガンドに相当すると考えられるアミノ酸配列 の N末側には、 通常生理活性ペプチドがその前駆体タンパク質から切り出される とされる Ly s— Ar gの配列 (Seidah, N. G. et al.、 Ann. N. Y. Acad. Sci .、 839巻、 9- 24頁、 1998年) が存在した。 一方、 C末側には終止コドンが存在し たが、 配列番号: 1のラット TGR 23 _ 2リガンドに対応する配列との間にさ らに 2残基が存在した。
これより、 マウス TGR23— 2リガンドのアミノ酸配列は、 ラット全脳抽出
物より得られたラット TGR23- 2リガンドのアミノ酸配列;配列番号: 1 〔 ラット TGR 23— 2リガンド (1— 18) 〕 、 配列番号: 2 〔ラット TGR 2 3— 2リガンド (1— 1 5) 〕 および配列番号: 3 〔ラット T G R 23— 2リガ ンド (1一 14) 〕 それぞれに対応する、 配列番号: 1 8 〔マウス TGR 23— 2リガンド (1— 1 8) 〕 、 配列番号: 1 9 〔マウス TGR 23— 2リガンド ( 1 - 15) 〕 および配列番号: 20 〔マウス TGR 23— 2リガンド (1— 14 ) 〕 で表されるアミノ酸配列、 およびさらに配列番号: 1 8の C末側に 2残基延 長された配列番号: 21で表されるアミノ酸配列 〔マウス TGR 23— 2リガン ド (1— 20) 〕 であると推定された。
[参考例 8 ]
(ラット TGR 23 - 2リガンド前駆体の一部をコードする cDNAのクロー二 ング)
ラット TGR 23 -2リガンドの前駆体をコードする c DNAをクローニング するためラット全脳由来の c DNAを铸型とした P CRを行なった。
以下の合成 DN Aプライマ一を用い、 ラット全脳由来の c DNAを铸型として P CR法による増幅を行なった。 反応液の組成は、 ラット全脳 Marathon- Ready c DNA (CLONTECH) 0. 8 1、 配列番号: 22および配列番号: 14の合成 DNA プライマ一各 1. 0 /iM、 0. 2mM dNTP s、 E xT a q (宝酒造) 0. 1 a 1および酵素に付属の E xT a Qバッファ一で、 総反応量は 20 n 1とした。 増幅のためのサイクルはサーマルサイクラ一 (PE Biosystems) を用い、 94°C · 5分間の加熱の後、 94°C · 10秒、 65°C · 30秒、 72 °C · 30秒のサイク ルを 35回繰り返し、 最後に 72 °Cで 5分間保温した。 次に、 DNa s e、 RN a s e F r e eの蒸留水で 1 00倍希釈した P C R反応液 2 n 1、配列番号: 2 2のプライマー 1. 0 M、 配列番号: 1 5の合成 DNAプライマ一 0. 2 xM 、 0. 2mM dNTP s、 E x T a Qポリメラーゼ (宝酒造) 0. 1 x 1および 酵素に付属の ExTa qバッファ一で総反応量は 20 1とし、 サ一マルサイク ラー (PE Biosystems) を用い、 94 ' 5分間の加熱の後、 94°C · 1 0秒、 6 0T · 30秒、 72°C · 30秒のサイクルを 30回繰り返し、 最後に 7 2°Cで 5
分間保温した。 増幅した DNAを 2. 0 %のァガロースゲル電気泳動により分離 した後、約 200塩基長の DNAを力ミソリで切り出し、 DNAを QIAQUick Gel Extraction Kit (キアゲン) を用いて回収した。 この DNAを、 pGEM- T Easy Ve ctor System (プロメガ) のプロトコールに従って pGEM- T Easyベクターへクロー ニングした。 これを大腸菌 (Escherichia coli) JM109 co即 etent cell (宝酒造 ) に導入して形質転換した後、 cDNA挿入断片を持つクローンをアンピシリン および X— g a 1を含む LB寒天培地で選択し、 白色を呈するクロ一ンのみを滅 菌したつま楊枝を用いて分離し、 形質転換体を得た。 個々のクローンをアンピシ リンを含む LB培地で一晩培養し、 QIAwell 8 Plasmid Kit (キアゲン) を用いて プラスミド DNAを調製した。 塩基配列の決定のための反応は BigDye Terminato r Cycle Seauencing Ready Reaction Kit (PE Biosystems) を用いて行ない、 蛍 光式自動シーケンサ一を用いて解読し、 配列番号: 23で表される DNA配列を 得た。
配列番号: 23で表される DNAの塩基配列には、 配列番号: 1、 配列番号: 2および配列番号: 3で表されるラット全脳から得られたラット TGR 23 _ 2 リガンドのアミノ酸配列をコードするフレームが存在した。 このフレームを読み 取り枠として DNA配列を翻訳したところ、 配列番号: 24で表されるアミノ酸 配列が得られた。 この配列を参考例 7で得られたマウス T G R 23— 2リガンド 前駆体のアミノ酸配列 (配列番号: 1 6) と比較することにより、 本配列がラッ ト TGR 23 - 2リガンド前駆体の一部である C末側の 54アミノ酸からなる配 列に相当することが推定された。 3 ' 側にはラッ卜 TGR 23— 2リガンドをコ ードする配列の下流に終止コドンが存在した。 この配列において、 ラット TGR 23— 2リガンドのアミノ酸配列の N末側には、 通常生理活性ペプチドがその前 駆体タンパク質から切り出されるとされる Ly s— Ar gの配列 (Seidah, N. G . et al.、 Ann. N. Y. Acad. Sci.、 839巻、 9- 24頁、 1998年) が存在した。 一方 、 C末側には終止コドンが存在したが、 配列番号: 1のラット TGR 23— 2リ ガンドの配列との間にさらに 2残基が存在した。
これより、 ラット TGR 23— 2リガンドのアミノ酸配列は、 ラット全脳抽出 物より得られた配列番号: 1 〔ラット TGR 23— 2リガンド (1— 18) 〕 、
配列番号: 2 〔ラット TGR 23— 2リガンド (1— 1 5) 〕 および配列番号: 3 〔ラット TGR 23— 2リガンド (1— 14) 〕 で表されるアミノ酸配列、 お よびさらに配列番号: 1の C末側に 2残基延長された配列番号: 25で表される アミノ酸配列 〔ラット TGR 23— 2リガンド (1— 20) 〕 であると推定され た。
[参考例 9 ]
(ラット TGR 23 - 2リガンド前駆体をコードする c DNAのクロ一ニング) ラット TGR 23 _ 2リガンドの前駆体をコ一ドする c DNAをクローニング するためラット全脳由来の c DNAを銬型とした P CRを行なった。
以下の合成 DNAプライマ一を用い、 ラット全脳由来の c DNAを錶型として P CR法による増幅を行なった。 反応液の組成は、 ラット全脳 Marathon-Ready c DNA (CLONTECH) 0. 8 / 1、 配列番号: 27および配列番号: 28の合成 DNA プライマ一各 1. 0 M、 0. 2mM dNTP s、 E xT a q (宝酒造) 0. 1 1および酵素に付属の ExT a qバッファ一で、 総反応量は 20 1とした。 増幅のためのサイクルはサ一マルサイクラ一 (PE Biosystems) を用い、 94°C · 5分間の加熱の後、 94°C · 10秒、 65°C · 30秒、 72 °C · 30秒のサイク ルを 3 5回繰り返し、 最後に 72 °Cで 5分間保温した。 次に、 DNa s e、 Rn a s e F r e eの蒸留水で 50倍希釈した P C R反応液 2 {i 1、配列番号: 29 のプライマ一 1. 0 M、 配列番号: 28の合成 DNAプライマ一 0. 2 M、 0. 2mM dNTP s、 E xT a Qポリメラ一ゼ (宝酒造) 0. 1 x 1および酵 素に付属の Ex T a qバッファーで総反応量は 20 n 1とし、 サ一マルサイクラ 一 (PE Biosystems) を用い、 94T · 5分間の加熱の後、 94°C · 1 0秒、 65 °C · 30秒、 72°C · 30秒のサイクルを 30回繰り返し、 最後に 72°Cで 5分 間保温した。 増幅した DNAを 2. 0 %のァガロースゲル電気泳動により分離し た後、 約 350塩基長の DNAを力ミソリで切り出し、 DNAを QIAauick Gel E xtraction Kit (キアゲン) を用いて回収した。 この DNAを、 pGEM- T Easy Vec tor System (プロメガ)のプロトコールに従って pGEM- T Easyベクターへクロ一二 これを大腸菌 (Escherichia. coli) JM109 competent cell (宝酒造)
に導入して形質転換した後、 c DNA挿入断片を持つクローンをアンピシリンぉ よび X— g a 1を含む L B寒天培地で選択し、 白色を呈するクローンのみを滅菌 したつま楊枝を用いて分離し、 形質転換体を得た。 個々のクローンをアンピシリ ンを含む LB培地で一晚培養し、 QIAwell 8 Plasmid Kit (キアゲン) を用いてプ ラスミド DNAを調製した。 塩基配列の決定のための反応は BigDye Terminator Cycle Sequencing Ready Reaction Kit (PE Biosystems) を用いて行ない、 蛍光 式自動シーケンサ一を用いて解読し、 配列番号: 30で表される DNA配列を得 た。
配列番号: 30で表される c DN Aの塩基配列は、 参考例 8で得たラット TG R 23— 2リガンド前駆体の一部をコードする DN A配列 (配列番号: 23) が さらに 5' 側に延長された配列であった。 本配列を、 配列番号: 1、 配列番号: 2または配列番号: 3で表されるラット全脳から得られたラット TGR 23-2 リガンドのアミノ酸配列に一致するアミノ酸配列をコードするようなフレームを 読み取り枠として翻訳したところ、 5, 上流側には、 ヒト TGR23— 2リガン ド前駆体およびマウス TGR 23-2リガンド前駆体をコードすると推定される cDNA (配列番号: 7および配列番号: 16) に存在するタンパク質翻訳の開 始コドンであると予想される AT Gに対応する位置に、 AT Gが 1ケ所存在した 。 また、 この AT Gコドンのさらに 5 ' 上流側には同じフレームで終止コドンが 出現した。 3' 側にはマウス TGR 23— 2リガンドをコードすると考えられる 配列の下流に終止コドンが存在した。 これより、 配列番号: 30で表される配列 は、 ラット TGR 23 _ 2リガンド前駆体をコードする c DNA配列であると推 定された。 配列番号: 30で表される cDNAの塩基配列から翻訳されるァミノ 酸配列を配列番号: 31に示す。 [参考例 1 0 ]
(TGR23— 1 (以下、 ヒト TGR23— 1を、 単に T G R 23 _ 1と称する こともある) 発現 CHO細胞の作成)
TGR 23— 1をコードする、 配列番号: 38で表される塩基配列を有する D N A断片を含有するプラスミド pTB2173を铸型とし、 S a 1 I認識配列を
付加したプライマー 1 (配列番号: 3 2) および S p e I認識配列を付加したプ ライマー 2 (配列番号: 33) を用いて P CR反応を行った。 該反応における反 応液の組成は上記プラスミド 1 0 n gを铸型として使用し、 Piu Turbo DNA Poly merase (ストラタジーン社) 2. 5U、 プライマー 1 (配列番号: 32) および プライマ一 2 (配列番号: 33) を各 1. 0 / M、 dNTP sを 200 M、 お よび反応液にに 2 X GC Buffer I (宝酒造) を 2 5 x 1加え、 50 1の液量とし た。 PCR反応は、 9 5°C · 6 0秒の後、 9 5°C · 6 0秒、 5 5 · 6 0秒、 7 2V, - 7 0秒のサイクルを 2 5回繰り返し、 最後に 7 2°C · 1 0分の伸長反応を 行った。該 P CR反応産物を Zero Blunt TOPO PCRクローニングキット (インビト ロジェン社) の処方に従いプラスミドベクター pCR- Bluntll- T0P0 (インビトロジ ェン社) へサブクローニングした。 これを E. coli TOP 10 (インビトロジェン社) に導入し、 p TB 2 1 7 3に含まれる TGR 2 3 - 1の c DNAを持つクロ一ン を、 カナマイシンを含む LB寒天培地中で選択した。 ここで得られた、 5 ' 側お よび 3 ' 側に S a 1 Iおよび S p e Iがそれぞれ認識する配列を付加した T G R 2 3 _ 1が導入されたプラスミドによって形質転換された E. coliのクローンよ り Plasinid Miniprep Kit (バイオラッド社) を用いてプラスミドを調製し、 制限 酵素 S a 1 Iおよび S p e Iで切断してインサート部分を切り出した。 インサー ト DNAは電気泳動後、 ァガロースゲルより切り出し、 次に Gel Extraction Kit (キアゲン社) を用いて回収した。 このインサート DNAを S a 1 Iおよび S p e Iで切断した動物細胞発現用べクタ一プラスミド p AKKO— 1 1 1 H (Hinu ma, S. et al. Biochim. Biophys. Acta, Vol. 1219, pp. 251-259 (1994) 記載 の pAKKO l . 1 1 Hと同一のベクタ一プラスミド) に加え、 DNA Ligation K it Ver.2 (宝酒造) を用いてライゲーシヨンを行ない、 タンパク質発現用プラス ミド pAKKO- TGR23-1を構築した。この pAKKO— TGR 2 3 - 1で形質転換した E. coli TOP10を培養後、 Plasmid Miniprep Kit (バイオラッド社) を用いて pAK KO- TGR23- 1のプラスミド DNAを調製した。
ハムスター CHOZd h f r_細胞を 1 0 %ゥシ胎児血清を含む a—MEM培 地 (with ribonucleosides and deoxyribo置 leosides、 GIBC0、 Cat. No. 12571 ) でファルコンディッシュ (径 3. 5 cm) に 1 X 1 05個播種し、 5 % C02
インキュベーターで 37 °C 晩培養した。 上記発現プラスミド pAKKO- TGR23- 1丽 A 2 X gを Transiection Reagent FuGENE 6 (Roche社) を用い、 添付説明書記載 の方法に従ってトランスフエクトし、 18時間培養後、 新鮮な増殖培地に交換し た。 さらに 10時間培養を続けたのち、 トランスフエク卜した細胞をトリプシン — EDTA処理により集め、 選択培地 (10 %透析牛胎児血清を含むひ一 MEM 培地 (without ribonucleosides and deoxyribonucleosides, GIBC0、 Cat. No. 12561) ) を用いて平底 96穴プレート 10枚に播種した。 3— 4日ごとに選択培 地を交換しながら培養を続け、 2— 3週間後にコロニー状に増殖してきた DHF R+細胞クローンを 81個取得した。
[参考例 11]
(T a qM a n ?〇1法を用ぃた丁0 23— 1発現 C HO細胞株の T G R 2 3一 1発現量の定量)
参考例 10で得た TGR 23一 1発現 CHO細胞株 81クローンを、 96穴プ レートに培養し、 RNeasy 96 Kit (キアゲン社) を用いて全 R N Aを調製した。 得 られた全 RNA 50〜200 n gを TadMan Gold RT-PCR Kit(PEバイオシステ ムズ社) を用いて、 逆転写反応を行なった。 得られた全 RNA 5〜20ng相当 の逆転写産物、 または後述のようにして作製した標準 c DNA、 lxUniversal PC R Master Mix (P Eバイオシステムズ社) 、 配列番号: 34で表されるプライマ —および配列番号: 35で表されるプライマ一各 500 nM、 および配列番号: 36で表される T a qMa nプローブ 100 nMを含む反応混合液 25 1につ いて ABI PRISM 7700 Seauence Detector (P Eバイオシステムズ社) を用いて P CRを行なった。 PCRは、 50°C ' 2分、 95°C · 10分で処理後、 95 °C . 15秒、 60°C · 60秒のサイクルを 40回繰り返すことにより行なった。
標準 cDNAは、 配列番号: 40で表される塩基配列を有する DNA断片を含 有するプラスミド PTB2174の 260 n mの吸光度を測定して濃度を算出し 、 正確なコピー数を算出した後、 ImM EDTAを含む 10 mM T r i s—H C I (pH8. 0) 溶液で希釈し、 2コピーから 2X 106コピーの標準 cDN A溶液を調製した。 また、 TaciMan P C R用プローブおよびプライマーは P
rimer Express (Versionl.0) (P Eバイオシステムズ社) により設計した。 発現量は ABI PRISM 7700 SDSソフトウェアによって算出した。 リポーターの蛍 光強度が設定された値に達した瞬間のサイクル数を縦軸にとり、 標準 c DNAの 初期濃度の対数値を横軸にとり、 標準曲線を作成した。 標準曲線より各逆転写産 物の初期濃度を算出し、 各クローンの全 RNA当たりの TGR 23— 1遺伝子発 現量を求めた。 その結果、 TGR 23— 1の発現が高かった CH〇細胞株 1 1個 を選択し 24穴プレ一卜に培養した。 これらの細胞について、 TGR 23— 1の 発現量を再検した。 RNeasy Mini Kits (キアゲン社) を用いて全 RNAを調製し た後、 RNase- free DNase Set (キアゲン社) を用いて DNa s e処理をした。 得 られた全 RNAから、上記と同様に逆転写反応し、 T a QMa n PCR法で各ク ローンの全 RNA当たりの TGR 23— 1遺伝子発現量を求めた。 その結果、 T GR 23— 1発現 CHO細胞株クロ一ン 49および 52が高い発現量を示すこと がわかった。
以後の参考例では、 これら 2つのクローンの発現細胞を用いた。
[参考例 1 2 ]
(ヒト TGR 23— 2リガンド (1— 20) : Ser-Phe-Arg-Asn-Gly-Val-Gly-Th r-Gly-Met-Lys-Lys-Thr-Ser-P e-Gln-Arg-Ala-Lys-Ser (配列番号: 1 2) の製造
)
市販の Boc- Ser (Bzl)- 0CH2-PAM樹脂を、ペプチド合成機 ACT 90の反応槽に入 れ、 DCMで膨潤後 TFAで B o cを除去し、 D I EAで中和した。 この樹脂を NMPに懸濁し、 HOBt-DIPCIで Boc-Lys (Cl-Z)を縮合した。反応後ニンヒドリンテ ストで遊離のァミノ基の有無を調べ、 ニンヒドリンテストがプラスの時には同じ アミノ酸を再度縮合した。 再縮合後においてもニンヒドリンテストがプラスの時 には無水酢酸でァセチル化した。 このサイクルを繰り返し Boc_Ala、 Boc-Arg(Tos )、 Boc-Gln, Boc-Phe, Boc - Ser (Bzl)、 Boc-Thr (Bzl) Boc-Lys (Cl-Z) , Boc-Lys ( CL-Z) , Boc- Met、 Boc- Gly、 Boc-Thr (Bzl) 、 Boc- Gly、 Boc-VaL Boc- GIy、 Boc - Asn、 Boc-Arg(Tos)、 Boc- Phe、 Boc- Ser (Bzl)を配列順に縮合し、 所望の保護ぺプ チド樹脂 0. 24 gを得た。 この樹脂を p—クレゾ一ル 1. 5m lとともにフッ
化水素約 1 5m l中、 0°Cで 60分攪拌した後フッ化水素を減圧留去し、 残留物 にジェチルエーテルを加えて濾過した。 濾過物に水と酢酸を加えペプチドを抽出 し、 樹脂と分離した。 抽出液を濃縮し 50 %酢酸で充填したセフアデックス (商 標) G— 25カラム (2. 0 X 80 cm) に付し、 同溶媒で展開、 主要画分を集 め凍結乾燥した。 その一部 (45mg) を LiChroprep (商標) RP- 18を充填した逆 相クロマトカラム (2. 6 X 60 c m) に付け、 0. 1 % TFA水 200m l で洗浄、 0. 1 % TFA水 300m 1 と 0. 1 % T F A含有 25 %ァセトニト リル水 300m lを用いた線型勾配溶出を行い、 主要画分を集め凍結乾燥し目的 とするペプチド 1 2. 7mgを得た。
E S I -MS :分子量 MW 21 88. 0 (理論値 2 1 87. 5) HPLC溶出 時間 10. 6分
カラム条件:カラム: Wakosil 5C18T 4. 6 X 100mm
溶離液: A液— 0. 1 % TFA水、 B液一 0. 1 % TF A含有ァセトニトリル を用い A/B : 95Z5〜45/55へ直線型濃度勾配溶出 ( 25分) 流速: 1. 0m 1 /分
[参考例 1 3 ]
(FL I PRを用いたヒト TGR 23— 2リガンド (1— 20) による TGR 2 3— 1発現 CHO細胞および TGR 23— 2発現 C H 0細胞の細胞内 C aイオン 濃度上昇活性の測定)
参考例 12で得られたヒト TGR 23— 2リガンド (1— 20) を種々の濃度 で、 公知の方法に従って、 TGR 23— 1発現 CHO細胞および TGR 23— 2 発現 CHO細胞に投与し、 細胞内 C aイオン濃度上昇活性を FL I PRを用いて 測定したところ、 ヒト TGR 23— 2リガンド (1— 20) は、 濃度依存的に T GR 23 - 1発現 CHO細胞および TGR 23 - 2発現 C H 0細胞の細胞内 C a イオン濃度上昇を促進した。 結果を図 5および図 6に示す。
これより、 配列番号: 1 2で表されるァミノ配列を有するポリペプチド 〔ヒト TGR 23— 2リガンド (1— 20) 〕 が、 TGR 23— 1および TGR 23— 2対する細胞内 C aイオン濃度上昇活性を有することが明らかである。
産業上の利用可能性
本発明によれば、 結合分子が未知であるタンパク質のアミノ酸配列 (及び/又 はアミノ酸配列を用いて得られるシークェンスァラインメント) に関する情報を 得るだけで結合分子又は結合分子の種類を予測することが可能となる。 これによ り、 従来の 3次元構造まで予測する分子モデリング法に比べ格段に迅速に結合分 子 (リガンド等) を予測することができる。
更に、 本発明によれば様々な種類の結合分子が未知であるタンパク質に対して その結合分子又は結合分子の種類を予測することができる。 また、 結合分子が未 知であるタンパク質に実際にあらゆる結合分子が結合するかどうか実験するより も容易かつ迅速に結合分子又は結合分子の種類を予測することができる。
公知の技術を用いることで、 相同性を有したタンパク質グループに共通の機能 は、 シークェンスァラインメントを計算することや立体構造モデルを作成するこ とで推定できる。 一方、 シークェンスアラインメントによる類似性評価や分子ド ッキング計算から、 リガンド(およびその種類)の特定は、 現在の技術では不可能 である。 しかし、 医薬品開発に有用な個々の GPCRが有している個別の機能を推定 するためには、 結合するリガンド ·共役 G夕ンパク質の予測が必要である。 この ような、 GPCR · リガンドのセットが推定 ·決定されて初めて、 共役 Gタンパク質 を通じた細胞内応答の調査、 生体内分布や発現量変化の測定、 遺伝子導入 ·欠損 動物の作成などの詳細な機能研究が進展することになる。 リガンド決定残基を用 いた予測方法およびそのためのコンピュータは、 このような医薬品開発に必須な 分子同定 ·機能解明に直接役に立つものである。
本発明によれば、 きわめて容易に結合分子未知タンパク質(ォーファン Gタンパ ク質共役レセプター等) の結合分子又は結合分子の種類を予測することができ、 かかる知見に基づけば、 実験を経なくとも当該結合分子未知タンパク質が関与す る疾患等の予防薬や治療薬を容易に製造することが可能となる。