JP2002526030A

JP2002526030A - 新規薬剤発見のためのｒｎａにおける分子相互作用部位の同定

Info

Publication number: JP2002526030A
Application number: JP2000548510A
Authority: JP
Inventors: エッカー，デービッド・ジェイ; サンパス，ランガ; グリフィー，リチャード; マクネイル，ジョン
Original assignee: Isis Pharmaceuticals Inc
Current assignee: Ionis Pharmaceuticals Inc
Priority date: 1998-05-12
Filing date: 1999-05-12
Publication date: 2002-08-20
Also published as: AU756906B2; AU3982399A; EP1082462A1; EP1082462A4; CA2331315A1

Abstract

(57)【要約】真核細胞および原核細胞核酸、特にRNA中の分子相互作用部位を同定するための方法を記載する。二次構造要素を、高度に保存された配列から同定する。このような分子相互作用部位に関連するデータベースを調製する方法も、データベース自体として、本明細書中で提供する。治療用途、農業用途、工業用途およびその他の用途が、これらの分子相互作用部位と“小”分子およびその他の分子との相互作用の結果として生じる。

Description

【発明の詳細な説明】

【０００１】関連する申請の相互参照本出願は1998年5月12日に出願されたU.S.シリアルNo. 09/076,440の続編の一
部であり、それは1998年5月12日に出願された仮出願U.S.シリアルNo. 60/085,09
2に対して優先権を主張し、それらの各々は全体として参考文献によりここで受
け入れられる。

【０００２】本発明の分野本発明は、分子相互作用部位として役立ちうる原核生物および真核生物の核酸
、特にRNAの領域を同定する方法を示す。本発明は治療学および構造的データベ
ースも含む。

【０００３】本発明の背景ゲノム、分子生物学、および構造生物学における最近の進歩により、RNA分子
がどのようにして細胞中のタンパク質発現に必要な多くの現象に参加するか、あ
るいは調節するかが脚光を浴びている。RNA分子は単純な媒介物としてより、DNA
からの自身の転写の制御、mRNA分子およびtRNA分子のスプライシングおよび編集
、リボゾームでのペプチド結合の合成、発生タンパク質の細胞膜への移動の触媒
、および情報の翻訳速度の十分な調節の提供を活動的に行う。RNA分子は様々な
独特な構造的モチーフをとることができ、それらの機能を行うのに必要な枠組み
を提供する。

【０００４】 “小”分子療法は構造RNA分子に特異的に結合するが、ポリマーではない有機
化学分子である。“小”分子治療は最も強力な自然発生抗体を含む。例えば、ア
ミノグリコシドおよびマクロライド抗体はリボゾームRNA（rRNA）構造体の特定
領域に結合する“小”分子であり、タンパク質合成に必要なRNAでの構造変化を
阻害することによって働くと信じられている。RNA分子の構造の変化はmRNA分子
の転写および翻訳の速度を制御することが示されている。

【０００５】薬剤発見のための標的RNAにおけるさらなる機会は、細胞が同じタンパク質へ
翻訳されうる異なる組織において頻繁に異なるmRNAをつくることである。代替ス
プライシングおよび代替ポリアデニル化などのプロセスは、特定組織において独
特なあるいは豊富な転写物をつくる。これにより、腫瘍を含む所望の細胞におい
て独特なRNA領域に結合し、他の細胞におけるタンパク質発現に影響を与えない
、あるいはより小さな範囲でタンパク質発現に影響する薬剤を設計する機会が与
えられ、タンパク質を標的とする治療では一般的には達成されないさらなるレベ
ルの薬剤特異性が提供される。

【０００６】出願者はRNA分子あるいは関連するRNA分子群は細胞がタンパク質合成を調節す
るために使用する制御領域を持っている、と信じている。細胞はmRNAとの直接的
、特異的な相互関係により合成されるタンパク質のタイミングと量の両方を調節
すると信じられている。この概念は、転写に強く焦点を当てる遺伝子制御に関す
る科学的な著述を読むことにより得られる印象と一致しない。RNAの変異、転移
、細胞内での配置、および翻訳のプロセスは、薬剤結合に良い機会を与えるRNA
認識部位において豊富である。申請者の発明は、ヒトのゲノムならびに他の動物
のゲノムおよび原核生物のゲノムにおいてRNA分子にとってのこれらの部位の発
見を示す。

【０００７】それゆえ、核酸、特にRNAにおける分子相互作用を同定することが本発明の主
な目的である。本発明のさらなる目的は、重要な療法、制御、あるいは“小”分
子などとの他の相互作用を強く起こさせるようなRNA中の二次構造要素を同定す
ることである。RNAにおいて組織に豊富な独特な構造（tissue-enriched unique
structures）の同定は本発明のもう一つの目的である。

【０００８】本発明の概要申請者の発明は、“分子相互作用部位”と呼ばれる真核生物および原核生物の
RNA分子中の二次構造を同定する方法を示す。分子相互作用部位は小さく、好ま
しくは50ヌクレオチド以下、あるいは30ヌクレオチド以下であり、独立的に折り
たたまれ、より大きなRNA分子内に含まれる機能的サブドメインである。申請者
の方法は、核酸、好ましくはRNA、の配列を解析し、それらの構造および機能を
推定する一連の（family）統合的なプロセスを好ましくは含む。申請者の方法は
好ましくは配列においてサブルーチンを実行するプロセスを含み、そこでは一つ
のプロセスの結果を使用することで特異的な行動の経路を誘発したり、あるいは
他の工程に対する数的なあるいは他のインプットを提供する。好ましくは、詳細
なリアルタイムでのヒトの介入が無く決定される巧妙なプロセスによって採択さ
れる進路が決められるプロセスには決定ポイントが存在する。RNA配列解析のオ
ートメーションは、RNA配列がゲノム配列データベースやその他から利用できる
割合で制御部位を同定する能力を提供する。例えば、本発明を使用することで、
中枢神経系（CNS）疾病、代謝疾病、苦痛、老化の退行性疾病、ガン、炎症性疾
病、心臓血管疾病および多くの他の状態と関連する分子間相互作用部位を同定で
きる。例えば、申請者の発明を使用することで、真核生物、特にヒトには欠けて
いるが、原核生物のRNAの付随的調整、増加あるいは減少、と結びつく“小”分
子のための部位として役立ちうる分子相互作用部位を決定することもできる。こ
のように、ヒトの毒性（human toxicity）はウイルス性、細菌性あるいは寄生虫
性の疾病の処置において回避することができる。

【０００９】本発明は好ましくは、標的核酸のヌクレオチド配列と異なる分類種由来の多数
の核酸のヌクレオチド配列との比較により標的核酸における分子相互作用部位を
同定し、多数の核酸および標的核酸において効果的に保存されている少なくとも
一つの配列領域を同定し、保存的領域が二次構造を持つかどうかを決定して、保
存的領域が二次構造を持つ場合はその二次構造を同定する。

【００１０】本発明はまた、真核生物および原核生物のRNAにおける分子相互作用部位に関
連するデータベースを示す。データベースは標的核酸のヌクレオチド配列と異な
る分類種由来の多数の核酸のヌクレオチド配列を比較することにより得られ、多
数の核酸および標的核酸において保存されている少なくとも一つの配列領域を同
定し、保存的領域が二次構造を持つかどうかを決定して、保存的領域が二次構造
を持つ場合はその二次構造を同定し、そしてそのような二次構造の群を編集する
。

【００１１】本発明はまた、選択した生物のRNAおよび少なくとも一つのさらなる生物のRNA
に存在する分子相互作用部位を含むオリゴヌクレオチドを示し、そこでは分子相
互作用部位は分子が分子相互作用部位に結合するとき、選択した生物においてRN
Aの発現を調節する少なくとも一つの分子の結合部位として役立つ。

【００１２】本発明はまた、原核生物のRNAおよび少なくとも一つのさらなる原核生物のRNA
に存在する分子相互作用部位を含むオリゴヌクレオチドを示し、そこでは分子相
互作用部位は分子が分子相互作用部位に結合するとき、原核生物のRNAの発現を
調節する少なくとも一つの分子の結合部位として役立つ。

【００１３】本発明はまた、原核生物のRNAおよび少なくとも一つのさらなる原核生物のRNA
に存在する分子相互作用部位をもつオリゴヌクレオチドを含む薬剤組成物に関し
、そこでは分子相互作用部位は少なくとも一つの“小”分子の結合部位として役
立つ。そのような分子は分子相互作用部位に結合すると、原核生物のRNAの発現
を調節する。好ましくは医薬用キャリアーも含む。

【００１４】本発明はまた、選択した生物のRNAおよび少なくとも一つのさらなる生物のRNA
に存在する分子相互作用部位を含むオリゴヌクレオチドを含む薬剤組成物を提供
する。分子相互作用部位は分子が分子相互作用部位に結合するとき、選択した生
物においてRNAの発現を調節する少なくとも一つの分子の結合部位、および医薬
用キャリアーとして役立つ。

【００１５】最後に、本発明の方法は、標的核酸に存在し、核酸が存在する生物にとってと
ても重要である物理的構造を同定する。そのような構造、いわゆる分子相互作用
部位、は分子種と相互作用することで核酸の性質および効果を変更できる。これ
は当業者に評価されるであろうように、治療的な開発がなされうる。そのような
構造はまた、農業、汚染調節、工業生物化学、およびその他においてとても重要
な生物の核酸中に見つけられるかもしれない。それゆえ、農薬、除草薬、殺菌剤
、酵母、最近、ウイルスなどのような工業生物、および生体触媒システムはこの
結果により有益でありうる。

【００１６】分子相互作用部位とリガンド、例えば有機複合体など、との間の結合を特徴付
ける多くの方法がある一方で、好ましい方法論は、例えば各々1998年5月12日に
出願され、各々本発明の指定代理人（assignee）を割り当てられているU.S.シリ
アルナンバー09/076,440、09/076,405、09/076,447、09/076,206、09/076,214、
および09/076,404に記載される。全ての前述の申請は全体としてここでの参考文
献により受け入れられる。

【００１７】本発明は、真核生物および原核生物の核酸、特にRNA分子における特定の構造
的要素を同定する方法を示し、それは他の分子と相互作用してRNA調節をもたら
すであろう。“調節”は増加あるいは減少するRNA活性あるいは発現に言及する
。本発明の好ましい態様は図1のフローチャートに略述する。真核生物および原
核生物における構造的要素は“分子相互作用部位”として言及される。これらの
要素は二次構造を含み、すなわち“小”分子およびその他との相互作用をうける
ことができる三次元型を持ち、治療および他の応用において“小”分子、オリゴ
ヌクレオチドのようなオリゴマー、および他の混合物と相互作用するための部位
として役立つことが期待される。

【００１８】図1に言及すると、標的核酸における分子相互作用部位を同定するための好ま
しい工程はフローダイアグラムに示す。標的核酸のヌクレオチド配列は異なる分
類種、10種由来の多数の核酸のヌクレオチド配列と比較される。標的核酸は真核
細胞あるいは原核細胞に存在するかもしれなく、標的核酸は細菌あるいはウイル
ス、ならびにヒトのような“より高等な”生物に属しているかもしれない。いか
なる型の核酸も標的核酸として役立ちうる。より好ましい標的核酸は、メッセン
ジャーRNA（mRNA）、プレメッセンジャーRNA（pre-mRNA）、トランスファーRNA
（tRNA）、リボゾームRNA（rRNA）、あるいは核内低分子RNA（snRNA）を含むが
、しかしこれらには限定されない。特定の標的核酸の初期選択はあらゆる機能的
基準に基づくことができる。例えば、炎症、心臓血管疾病、苦痛、ガン、関節炎
、外傷、肥満、ハンチントン病、神経障害、あるいは他の疾病あるいは障害にお
いて重要であると知られる核酸は典型的な標的核酸である。例えば、細菌、ウイ
ルスおよび酵母のゲノムのような病原性のゲノムに関係すると知られる核酸は典
型的な原核生物核酸の標的である。病原性の細菌、ウイルスおよび酵母は当業者
によく知られている。典型的な核酸標的を表1に示す。しかし、申請者の発明は
表1に示す標的には限定されず、本発明はかなり普遍的であると信じられている
ことを理解すべきである。

【００１９】

【表１】

【００２０】

【００２１】

【００２２】

【００２３】追加の核酸標的を独立に決定することができ、または公衆に利用可能で当業者
に既知の原核細胞および真核細胞遺伝子データベースから選択することができる
。好ましいデータベースには、例えば、ヒトにおけるオンラインメンデル遺伝（
Online Mendelian Inheritance in Man）（OMIM）、癌ゲノム解析プロジェクト
（the Cancer Genome Anatomy Project）（CGAP）、GenBank、EMBL、PIR、SWISS
-PROTなどが含まれる。OMIMは、疾患に関連する遺伝子変異のデータベースであ
るが、部分的に生物工学情報のための国立センター（the National Center for
Biotechnology Information）（NCBI）により開発された。OMIMは、インターネ
ットを介して例えばhttp://www.ncbi.nlm.nih.gov/Omim/にてアクセスすること
ができる。CGAPは、ガン細胞の分子解析を解読するために必要とされる情報およ
び技術的なツールを確立するための学際的プログラムである。CGAPはインターネ
ットを介して例えばhttp://www.ncbi.nlm.nih.gov/ncicgap/にてアクセスするこ
とができる。これらのデータベースの中には、完全または部分ヌクレオチド配列
を含む場合がある。さらに、私的遺伝子データベースから核酸標的を選択するこ
ともできる。あるいは、利用可能な刊行物から核酸標的を選択することができる
か、または本発明に関連して使用するために特に核酸標的を決定することもでき
る。

【００２４】核酸標的を選択しまたは提供した後、核酸標的のヌクレオチド配列を決定し、
そしてその後、様々な分類学的種由来の複数の核酸のヌクレオチド配列と比較す
る。本発明の一態様において、核酸標的のヌクレオチド配列を、少なくとも一つ
の遺伝子データベースをスキャンすることにより決定するか、または利用可能な
刊行物中で同定する。好ましい当業者に既知でかつ利用可能なデータベースには
、例えば、発現遺伝子解析データベース（the Expressed Gene Anatomy Databas
e）（EGAD）、ユニジーン-ホモサピエンスデータベース（Unigene-Homo Sapiens
database）（Unigene）、GenBankなどが含まれる。EGADは、ヒト転写（HT）配
列の非リダンダントなセットを包含し、そしてインターネットを介して、例えば
http://www.tigr.org/tdb/egad/egad.htmlにてアクセスすることができる。ユニ
ジーンは、GenBank配列を自動的に遺伝子適応クラスターの非リダンダントなセ
ットに分割するシステムである。それぞれのユニジーンクラスターは、単一遺伝
子だけでなく、その遺伝子が発現される組織型、および遺伝子地図位置などの関
連する情報も表示する配列を包含する。

【００２５】さらに、ユニジーンは、数万の新規な発現配列タグ（EST）配列を包含する。
ユニジーンは、インターネットを介して、例えばhttp://www.ncbi.nlm.nih.gov/
UniGene/にてアクセスすることができる。これらのデータベースは、例えば当業
者に既知で利用可能なEntrezなどの検索プログラムと結び付けて使用することが
できる。Entrezは、インターネットを介して、例えばhttp://www.ncbi.nlm.nih.
gov/Entrez/にてアクセスすることができる。好ましくは、様々なデータベース
から利用可能な最も完全な核酸配列表示を使用する。GenBankデータベースは、
当業者に既知で利用可能であるが、これを使用して最も完全なヌクレオチド配列
を得ることもできる。GenBankは、NIHの遺伝子配列データベースであり、そして
すべての公衆に利用可能なDNA配列の注釈付きのコレクションである。GenBankは
、例えば、本明細書中にその全体を参考文献として援用するNuc. Acids Res., 1
998, 26, 1-7中に記載され、そして当業者がインターネットを介して、例えば、
http://www.ncbi.nlm.nih.gov/Web/Genbank/index.htmlにてアクセスすることが
できる。あるいは、完全ヌクレオチド配列が利用可能でない場合には、核酸標的
の部分的ヌクレオチド配列を使用することができる。

【００２６】本発明の別の態様においては、複数の重複した発現配列タグ（EST）を組み立
てることにより、核酸標的のヌクレオチド配列を決定する。ESTデータベース（d
bEST）は、当業者に既知でありそして利用可能であるが、およそ約500〜1000ヌ
クレオチドを含む100万の異なるヒトmRNA配列、および多数の様々な生物由来の
様々な数のESTを含む。dbESTは、インターネットを介して、例えば、http://www
.ncbi.nlm.nih.gov/dbEST/index.htmlにてアクセスすることができる。これらの
配列は、ゲノム配列決定のためのcDNA発現クローンを使用するクローニング戦略
に由来する。ESTは、新規遺伝子の発見、ゲノムのマッピング、そしてゲノム配
列中のコード領域の同定における用途を有する。急速に利用可能になっているES
T配列情報の別の重要な特徴は、組織特異的遺伝子配列データである。治療的介
入のために選択した遺伝子（単一または複数）を標的化する際にこれは極めて有
用でありうる。EST配列は比較的短いため、完全配列を提供するためにはこれら
を組み立てなければならない。それぞれの利用可能なクローンは配列決定されて
いるため、結果としてデータベース中に報告されている多数の重複した領域とな
る。

【００２７】 5'および3'方向の両方に伸長する重複したESTを組み合わせることにより、結
果として完全長の“仮想転写物”を得る。結果として生じる仮想転写物は、すで
に特性決定した核酸を表示するかも知れないし、または未知の生物学的機能を有
する新規な核酸であるかも知れない。The Institute for Genomic Research（TI
GR）のヒトゲノムインデックス（HGI）データベースは、当業者に既知そして利
用可能であるが、ヒト転写物のリストを包含する。TIGRは、インターネットを介
して、例えばhttp://www.tigr.org/にて、アクセスすることができる。仮想転写
物を構築し、そして当業者に既知でそして利用可能である、TIGR-Assemblerを使
用するこの方法により、転写物を生成した。TIGR-Assemblerは、EST、BACまたは
小ゲノムなどの多くのセットの重複する配列データを組み立てるためのツールで
あり、そしてこれを使用して真核細胞配列または原核細胞配列を組み立てること
ができる。TIGR-Assemblerは、例えば本明細書中にその全体を参考文献として援
用するSuttonら（Genome Science & Tech., 1995, 1, 9-19）中に記載されてお
り、そしてそれは、インターネットを介して、例えばftp://ftp.tigr.org/pub/s
oftware/TIGR assemblerにて、アクセスすることができる。さらに、当業者に既
知でありそして利用可能であるGLAXO-MRCは、仮想転写物を構築するための別の
プロトコルである。さらに、UNIXプラットフォーム上で駆動する“Find Neighbo
rs and Assemble EST Blast”プロトコルが、仮想転写物を構築するために出願
人らにより開発された。Find Neighbors and Assemble EST Blastプロトコル中
の好ましい工程は、図2中に記載されたフローチャート中に記載する。PHRAPを、
Find Neighbors and Assemble EST Blast中の配列組立てのために使用する。PHR
APは、インターネットを介して、例えばhttp://chimera.biotech.washington.ed
u/uwgc/tools/phrap.htmにて、アクセスすることができる。当業者であれば、ソ
ースコードを構築して、図2中に記載された好ましい工程を実行することができ
る。

【００２８】核酸標的のヌクレオチド配列を、様々な分類学的（taxonomic）種由来の複数
の核酸のヌクレオチド配列と比較する。様々な分類学的種由来の複数の核酸、お
よびそのヌクレオチド配列は、遺伝子データベース中、利用可能な刊行物中に見
いだすことができ、または本発明に関連する使用のために特別に決定することが
できる。本発明の一態様においては、当業者に既知である配列同一性検索、オル
トログ（ortholog）検索、または両方を行うことにより、核酸標的を様々な分類
学的種由来の複数の核酸のヌクレオチド配列と比較する。

【００２９】配列同一性検索の結果は、少なくとも複数の核酸のヌクレオチド配列の一部を
有する複数の核酸であり、それは、ウィンドゥ領域として参考にされる、標的核
酸の少なくとも8〜20ヌクレオチド領域に対して相同である。好ましくは、複数
のヌクレオチド配列は、標的核酸のいずれかのウィンドゥ領域に対して少なくと
も60％の相同性を有する少なくとも一部を含む。より好ましくは、相同性は、少
なくとも70％である。より好ましくは、相同性は少なくとも80％である。もっと
も好ましくは、相同性は少なくとも90％である。例えば、複数の配列を比較する
標的ヌクレオチドの部分であるウィンドゥサイズは、約8〜約20の隣接するヌク
レオチドであってもよく、好ましくは10〜15、もっとも好ましくは約11〜12であ
る。ウィンドゥサイズは、このように調整することができる。その後、好ましく
は、様々な分類学的種由来の複数の核酸を、複数の配列のすべての部分を標的核
酸のウィンドゥと比較するまで、標的核酸中のそれぞれの適当なウィンドゥと比
較する。標的核酸のウィンドゥ配列のいずれかに対して、少なくとも60％、好ま
しくは少なくとも70％、より好ましくは少なくとも80％、またはもっとも好まし
くは少なくとも90％の相同性である部分を有する、様々な分類学的種由来の複数
の核酸の配列は、適当な相同配列として考えられている。

【００３０】配列同一性検索は、手動で、または当業者に既知のいくつかの利用可能なコン
ピュータプログラムを使用して行うことができる。好ましくは、当業者に利用可
能で既知であるBlastおよびSmith-Watermanアルゴリズムなどを使用することが
できる。Blastは、ヌクレオチド配列データベースおよびタンパク質配列データ
ベースの解析を支持するために設計されたNCBIの配列同一性検索ツールである。
Blastは、インターネットを介して、例えばhttp://www.ncbi.nlm.nih.gov/BLAST
/にて、アクセスすることができる。GCGパッケージは、公有データベースかまた
は局所的に利用可能な検索可能データベースのいずれかを用いて使用することが
できる、Blastの局所バージョンを提供する。GCGパッケージv9.0は、配列の編集
、マッピング、比較、および並置により配列の解析を可能とする、100以上の相
互関係のある（interrelated）ソフトウェアプログラムを含有する商業的に利用
可能なソフトウェアパッケージである。GCGパッケージ中に含まれるその他のプ
ログラムには、例えばRNA二次構造予測、核酸断片組立、および進化解析を容易
にするプログラムが含まれる。さらに、もっとも著名な遺伝子データベース（Ge
nBank、EMBL、PIR、およびSWISS-PROT）は、GCGパッケージとともに配布され、
そしてデータベース検索プログラムおよびデータベース操作プログラムに完全に
利用可能である。GCGは、インターネットを介して、例えばhttp://www.gcg.com/
にて、アクセスすることができる。Fetchは、受託番号に基づいて注釈をつけら
れたGenBank記録を得ることができる、GCGにおいて利用可能なツールであり、そ
してEntrezと同様である。別の配列同一性検索を、Pangeaに由来するGeneWorld
およびGeneThesaurusを用いて行うことができる。GeneWorld 2.5は、ポリヌクレ
オチド配列およびタンパク質配列の解析のための自動化され、フレキシブルな、
高スループットアプリケーションである。GeneWorldにより、自動化解析および
配列の注釈が可能になる。GCGと同様に、GeneWorldは配列検索、遺伝子発見、複
数配列並置、二次構造予測およびモチーフ同定のためのいくつかのツールを援用
する。GeneThesaurus 1.Otmは、複数供給源からの情報を提供し、公有データお
よび局所データのためのリレーショナルデータモデルを提供する、配列および注
釈データ申し込みサービスである。

【００３１】別の代替配列同一性検索を、例えばBlastParseにより行うことができる。Blas
tParseは、UNIXプラットフォーム上で駆動するPERLスクリプトであり、上述した
戦略を自動化する。BlastParseは、目的の標的受託番号のリストを取り込み、そ
して図3中に示したフローチャート中に記載される好ましい工程を介してそれぞ
れを取り込む。BlastParseは、“tab-設定”テキスト中ですべてのGenBank範囲
を解析し、その後柔軟性を提供する、より簡便な検索および解析のための“リレ
ーショナルデータベース”フォーマット中に“tab-設定”テキストを保存するこ
とができる。最終結果は、容易にソートすることができ、フィルターをかけるこ
とができ、そして疑問符を付けることができ、また注釈-リレーショナルデータ
ベースであってもよい、一連の完全に解析されたGenBank記録である。

【００３２】配列同一性検索およびデータ操作を行うことができる別のツールキットは、SE
ALSであり、これもNCBIに由来する。このツールセットは、perlおよびCで記載さ
れ、そしてこれらの言語をサポートするいずれかのコンピュータプラットフォー
ム上で駆動することができる。これは、例えば、以下のアドレス：http://www.n
cbi.nlm.nih.gov/Walker/SEALS/からダウンロードして利用可能である。このツ
ールキットは、Blast2またはギャップ化blastへのアクセスを提供する。それは
また、tax breakと呼ばれるツールと組み合わせて、Blast2の出力を解析するtax collectorと呼ばれるツールも包含し、そして存在するそれぞれの種に対する質
問配列に対して最も相同な配列の識別名を返答する。別の有用なツールは、feat
ure2fastaであり、これは注釈に基づいて入力配列から配列断片を抽出する。こ
のツールの典型的な用途は、cDNA配列の5'非翻訳領域を含有する配列ファイルを
作成することである。

【００３３】好ましくは、配列同一性検索において上述したように、標的核酸に対する相同
性を有する様々な分類学的種に由来する複数核酸を、その中の標的核酸のオルト
ログを発見するためにさらに詳細に描写する。オルトログは、幅広く分岐した生
物において、配列同一性を有しそして生物の文脈中で同様の機能を発揮する、2
遺伝子を参照するための遺伝子分類において定義された用語である。対照的に、
パラログは、遺伝子の複製のために生じる種の内部の遺伝子であり、しかし新規
な機能を進化させ、そしてイソ型としても言及される。場合により、パラログ検
索を行うこともできる。オルトログ検索を行うことにより、多様な生物由来の相
同性配列の網羅的なリストを得る。それに引き続き、これらの配列を解析して、
オルトログであることに関する分類に適合する最も代表的な配列を選択する。オ
ルトログ検索は、当業者が利用可能な、例えばCompareを含むプログラムにより
行うことができる。好ましくは、オルトログ検索は、配列のそれぞれについて完
全でそして解析されたGenBankの注釈にアクセスすることにより行う。現在のと
ころ、GenBankから入手される記録は、“フラット-ファイル”であり、自動化解
析について理想的には適合していない。好ましくは、オルトログ検索は、Q-Comp
areプログラムを使用して行う。Q-Compareプロトコルの好ましい工程は、図4中
に記載するフローチャート中に記載する。図3中に示したBlast結果-リレーショ
ンデータベースおよび図3中に示した注釈-リレーショナルデータベースをQ-Comp
areプロトコル中で使用し、その結果、以下に記載する種間配列比較プログラム
中で比較するためのオルトログ配列のリストを得る。

【００３４】上述した同一性検索により、e-スコアと呼ぶカットオフ値に基づく結果を得る
。e-スコアは、所定のヌクレオチドウィンドゥ内部でのランダムな配列適合の可
能性を示す。e-スコアがより低ければ、適合度がよりよい。当業者は、e-スコア
にはなじみがある。ユーザーは、上述したストリンジェンシーまたは所望の相同
性の程度に基づいて、e-値カットオフを定義する。原核細胞分子相互作用部位を
同定する本発明の態様においては、同定される相同ヌクレオチド配列のいずれも
が非ヒトのものであることが好ましい。

【００３５】本発明の別の態様においては、必要とされる配列をオルトログデータベースを
検索することにより得る。そのようなデータベースの一つはHovergenであり、脊
椎動物オルトログのキュレートされた（curated）データベースである。オルト
ログのセットは、このデータベースから出力し、そして上述したようなさらなる
配列同一性検索のための種子として使用する。例えば無脊椎動物オルトログを発
見するために、さらなる検索が望ましい場合がある。Hovergenは、例えば以下の
アドレス：ftp://pbil.univ-lyonl.fr/pub/hovergen/からダウンロードすること
ができる。原核細胞オルトログのデータベースであるCOGSは、インターネット上
で、例えば以下のアドレス：http://www.ncbi.nlm.nih.gov/COG/にて、利用可能
でありそして対話式に使用することができる。

【００３６】本発明の別の態様において、様々な分類学的種由来の複数核酸のヌクレオチド
配列を、dbESTなどを使用する配列同一性検索を行うことにより、そして仮想転
写物を構築することにより、標的核酸のヌクレオチド配列と比較する。EST情報
を使用することは、2つの別個の理由のために有用である。第一に、ヒト遺伝子
についてGenBankデータベース中の進化的に別個の生物においてヒト遺伝子に対
するオルトログを同定する能力には限界があるということである。これらの進化
的に別個の生物に由来するESTを同定することに対してより多くの努力が向けら
れているため、dbESTはオルトログ情報のよりよい供給源であるようである。

【００３７】第二に、ヒトゲノムを配列決定するための努力は、完全なものの10％未満であ
る。このように、ヒトdbESTはヒトゲノムの配列が完全に近づくにつれて、主要
な標的を同定するためのより多くの情報を提供するだろうと考えられる。EST配
列は短く、そして組み立てて使用する必要がある。好ましくは、上述したように
Smith-Watermanアルゴリズムを使用して、ヒト配列を除くdbESTに対する高スト
リンジェント条件下、配列同一性検索を行う。dbESTは、挿入および欠失を含む
配列決定エラーを包含するため、新規配列について正確に検索するためには、使
用する検索方法をこれらのギャップについても可能にするべきである。それぞれ
の利用可能なクローンが配列決定されているので、データベース中で報告されて
いる多数の重複した領域が結果として得られる。非ヒトRNAに対する完全長また
は部分“仮想転写物”を、“完全長”転写物が得られるまで、重複するEST配列
を5'および3'の両方向に伸長する方法により構築する。本発明の別の態様におい
ては、キメラ仮想転写物を構築する。

【００３８】結果物である仮想転写物は、すでに特性決定されたRNA分子を表示する場合が
あり、または未知の生物学的機能を有する新規なRNA分子である場合もある。上
述したように、TIGR HGIデータベースにより、TIGR-Assemblerと呼ばれる仮想転
写物を構築するためのエンジンが利用可能になる。Pangea由来のGLAXO-MRCおよ
びGeneWorldは、仮想転写物の構築も提供する。上述したように、Find Neighbor
s and Assemble EST Blastを使用して、仮想転写物を構築することもできる。

【００３９】図1を参照すると、上述したオルトログまたは仮想転写物を配列同一性検索ま
たはオルトログ検索のいずれかを介して得た後に、様々な分類学的種に由来する
複数核酸と標的核酸との間で保存されている少なくとも一つの配列領域を同定す
る、20。種間配列比較を、当業者に利用可能でありそして既知である、多数のコ
ンピュータプログラムを使用して行うことができる。好ましくは、当業者に利用
可能でありそして既知であるCompareを使用して、種間配列比較を行う。Compare
は、ウィンドゥ／ストリンジェンシー基準を使用する配列の対合比較（pair-wis
e comparisons）を可能とするGCGツールである。特定の品質の適合が見出される
天を含有する出力ファイルを、Compareは作成する。これらは別のGCGツールであ
るDotPlotによりプロットすることができる。

【００４０】あるいは、保存された配列領域の同定は、上述したようにCompareOverWinsと
組み合わせたQ-Compareから生成したオルトログ配列を使用して、種間配列比較
により行う。好ましくは、比較するための配列のリスト、たとえば図4中に記載
されるようにQ-Compareから生成されたオルトログ配列を、CompareOverWinsアル
ゴリズム中に入力する。CompareOverWins中の好ましい工程は、図5A、5B、およ
び5C中に記載する。好ましくは、質問配列がマスター標的配列上のウィンドゥ上
にスライドする、対合配列比較により、種間配列比較を行う。好ましくは、ウィ
ンドゥは、約9〜約99個の隣接するヌクレオチドである。

【００４１】標的核酸のウィンドゥ配列と上述のように得られる複数核酸配列のいずれかの
質問配列との間での配列相同性は、好ましくは少なくとも60％、より好ましくは
少なくとも70％、より好ましくは少なくとも80％、そして最も好ましくは少なく
とも90％である。閾値を選択する最も好ましい方法は、コンピュータに50％〜10
0％のすべての閾値を自動的に試みさせ、そしてユーザーにより提供された測定
規準に基づいて閾値を選択するというものである。このような測定規準の一つは
、正確にn回のヒットが返答されるように閾値を選択することであり、nは通常3
にセットする。上述した複数核酸のメンバーである質問核酸のすべての塩基を、
マスター標的配列のすべての塩基と比較するまで、この方法を繰り返す。得られ
たスコアマトリックスを拡散プロット（scatter plot）としてプロットすること
ができる。所定位置での適合密度に基づいて、ドットなし、分離されたドット、
または直線として見られるくらい近接するドットのセットでありうる。直線の存
在は、それが小さなものであるが、一次配列相同性を示す。このような種間配列
比較の代表的な拡散プロットを、図6中に示す。分岐した種における核酸分子内
の、特にRNAのUTR中の配列保存性は、二次構造を有するようでもある保存された
制御要素の指標であるようである。種間配列比較の結果を当業者に既知であるよ
うな完全に自動化された様式のMS ExcelおよびVisual basicツールを使用して解
析することができる。

【００４２】図1を参照すると、核酸標的のヌクレオチド配列および様々な分類学的種に由
来する複数核酸の間で保存される少なくとも一つの領域が、好ましくはオルトロ
グを経由して、同定された後は、保存された領域を解析して、二次構造を含有す
るかどうかについて決定する、30。同定され保存された領域が二次構造を含有す
るかどうかを決定することは、当業者に既知の多数の手順により行うことができ
る。二次構造の決定は、好ましくは、自己相補性比較、並置および共分散解析、
二次構造予測、もしくはこれらの組合せにより行う。

【００４３】本発明の一態様においては、二次構造解析を並置および共分散解析により行う
。並置および共分散解析についての多数のプロトコルは、当業者に既知である。
好ましくは、当業者に利用可能でありそして既知であるClustalWにより並置を行
う。ClustalWは、複数配列並置のためのツールであり、GCGの一部ではないが、
既存のGCGツールセットの拡張として追加することができ、そして局所配列につ
いて使用することができる。ClustalWは、インターネットを介して、例えば以下
のアドレス：http://dot.imgen.bcm.tmc.edu:9331/multialign/Options/clustal
w.htmlからアクセスすることができる。Clusta1Wはまた、Thompsonら（Nuc. Aci
ds Res., 1994, 22, 4673-4680）中にも記載され、この全体を参考文献として本
明細書中に援用する。これらの方法をスクリプトにして、より初期の工程におい
て同定される保存されたUTR領域を自動的に使用することができる。当業者に利
用可能でありそして既知であるUNIXコマンドラインインターフェースであるSeqe
dにより、選択された局所領域をより大きな配列から抽出することが可能になる
。多くの様々な種に由来する多数の配列をクラスター化し、そしてさらに解析す
るために並置することができる。

【００４４】本発明の好ましい態様において、すべての可能性のある対合CompareOverWindo
ws比較の出力を集め、AlignHitsと呼ばれるプログラムを使用して参照配列と並
置する。このプログラムの操作の図表は、図5Dに提供される。このプログラムは
、当業者によれば反復可能である。このプログラムの好ましい目的は、対合比較
において作成したすべてのヒットを、参照配列上の位置にマップし直すことであ
る。CompareOverWindowsおよびAlignHitsとを組み合わせるこの方法は、他のい
ずれかのアルゴリズムよりも多くの局所並置（20〜100塩基以上）を提供する。
この局所並置は、共変動またはRevCompなどの、後述する構造発見ルーチンに必
要なものである。このアルゴリズムは、並置された配列のfasta配列を記述する
。示されたように、アルゴリズムは、一塩基挿入または一塩基欠失を訂正しない
。ほかの場所で記載されるClustalWを介して出力を置くことにより、このことを
通常達成する。CompareOverWindowsおよびAlignHitsを伴わずにClustalWを単独
で使用することから、これを区別する（differentiate）ことは重要なことであ
る。

【００４５】共変動は、コンセンサス二次構造予測についての一次配列情報の系統発生論的
解析を使用する方法である。共変動は、以下の文献中に記載されており、それぞ
れの全体を本明細書中に援用する（Gutell, et al., "Comparative Sequence An
alysis Of Experiments Performed During Evolution" In Ribosomal RNA Group
I Introns, Green, Ed., Austin:Landes, 1996; Gautheret, et al., Nuc. Aci
ds Res., 1997, 25, 1559-1564; Gautheret, et al., RNA, 1995, 1, 807-814;
Lodmell, et al., Proc. Natl. Acad. Sci. USA, 1995,92,10555-10559; Gauthe
ret, et al., J Mol. Biol., 1995,248, 27-43; Gutell, Nuc. Acids Res., 199
4,22,3502-3517; Gutell, Nuc. Acids Res., 1993,21, 30553074; Gutell, Nuc.
Acids Res., 1993, 21, 3051-3054; Woese, Proc. Nad. Acad. Sci. USA, 1989
, 86, 3119-3122; and Woese, et al., Nuc. Acids Res., 1980, 8, 2275-2293
）。好ましくは、共分散ソフトウェアを共分散解析に使用する。好ましくは、共
変動、すなわち配列並置からのRNA構造の比較解析についてのプログラムのセッ
トを使用する。共変動は、コンセンサス二次構造予測についての一次配列情報の
系統発生論的解析を使用する。共変動は、インターネットを介して、例えばhttp
://www.mbio.ncsu.edu/RNaseP/info/programs/programs.htmlにて、得ることが
できる。プログラムのバージョンの完全な記載は、発行されている（Brown, J.
W. 1991 Phylogenetic analysis of RNA structure on the Macintosh computer
. CABIOS7:391-393）。現在のバージョンはv4.1であり、標準的共変動解析、代
償的な塩基変化の同定、そして相互情報解析を含むRNA配列並置に由来する様々
なタイプの共変動解析を行うことができる。プログラムはよく教育されており、
そして広範囲の例ファイルに附属する。それは独立型のプログラムとして編集さ
れている；それは、Hypercardを必要としない（かなり小さな‘スタック’バー
ジョンを含むが）。このプログラムは、MacOS v7.1またはそれ以上を駆動するMa
cintosh環境のいずれかにおいて駆動することができる。より早いプロセッサー
の機械（68040またはPowerPC）が、相互情報解析または大きな配列並置の解析に
ついて示唆される。

【００４６】本発明の別の態様において、二次構造解析を二次構造予測により行う。熱力学
的パラメータおよびエネルギー計算に基づいてRNA二次構造を予測する多数のア
ルゴリズムがある。好ましくは、二次構造予測をM-foldまたはRNA Structure 2.
52のいずれかを使用して行う。M-foldは、インターネットを介して、例えばhttp
://www.ibc.wustl.edu/zuker/ma/form2.cgiにて、アクセスすることができるか
、またはUNIXプラットフォーム上の局所利用のためにダウンロードすることがで
きる。M-foldは、GCGパッケージの一部としても利用可能である。RNA Structure
2.52は、M-foldアルゴリズムのWindowsへの適合物であり、そしてインターネッ
トを介して、例えばhttp://128.151.176.70/RNAstructure.htmlにてアクセスす
ることができる。

【００４７】本発明の別の態様においては、二次構造解析を自己相補性比較により行う。好
ましくは、自己相補性比較を上述したCompareを使用して行う。より好ましくは
、Compareを改変して、従来のワトソン-クリックG-C/C-GまたはA-U/U-A対合に加
えて、G-UまたはU-G塩基対を説明するための対合マトリックスを拡張することが
できる。このような改変したCompareプログラム（改変Compare）は、所定の配列
内部にあるすべての可能性のある塩基対合を予想することから始まる。上述した
ように、小さな、しかし保存された領域、好ましくはUTRを、一連のオルトログ
の一次配列比較に基づいて同定する。改変Compareにおいては、これらの配列の
それぞれをそれ自体の逆相補鎖と比較する。図7は、具体的な自己相補性解析を
示す。許容される対合には、ワトソン-クリックのA-U、G-C対合および非標準的
なG-U対合が含まれる。すべての利用可能なオルトログのこのような自己相補性
プロットのオーバーレイ、およびそれぞれにおけるほとんどの反復性パターンに
ついての選択の結果、最小数の可能性のある折り畳み構造が得られる。図8は具
体的なオーバーレイを示す。その後、このようなオーバーレイを、上述したエネ
ルギー考察により賦課されるものを含む追加の制約と共に使用して、もっとも可
能性のある二次構造を演繹することができる。

【００４８】本発明の別の好ましい態様においては、AlignHitsの出力を、RevCompと呼ばれ
るプログラムにより読む。このプログラムのブロックダイアグラムは、図14に示
す。このプログラムは、当業者であれば反復することができる。このプログラム
の好ましい目的は、塩基対合規則を使用することおよびRNA二次構造を予測する
ためのオルトログ進化を使用することである。RNA二次構造は、一本鎖領域、そ
して塩基対合領域、いわゆるステムからなる。進化により保存される構造を検索
するため、オルトログ配列の所定の並置についてのもっとも可能性のあるステム
は、ほとんどの配列により形成されうるものである。可能性のあるステム形成ま
たは塩基対合規則を、例えば他の技術、例えばNMRにより決定されたステムの塩
基対統計を解析することにより、決定する。RevCompの出力は、可能性のある構
造を形成しうるオルトログセットメンバーの配列の割合によりランク付けされた
、可能性のある構造のソートされたリストである。このアプローチは、パーセン
テージ閾値アプローチを使用するため、ノイズ配列に対して反応しない。ノイズ
配列は、検索される構造の例を示さないものの、高い配列相同性のために、真の
オルトログではないかまたはAlignHitsの出力中に作成される配列である。非常
に類似するアルゴリズムは、PC上で駆動するために、Visual basic for Applica
tions（VBA）そしてMicrosoft Excelを使用して実行され、所定のセットの配列
についての逆相補性マトリックス概観を生成する。

【００４９】並置により行われるか、および共分散、自己相補性解析、二次構造予測、例え
ばM-fold、またはその他のものにより行われるかに関わらず、上述した二次構造
解析の結果は、標的核酸と様々な分類学的種由来の複数核酸との間で保存された
領域中の二次構造を同定する、40。同定することができる典型的な二次構造には
、膨隆（bulge）、ループ、ステム、ヘアピン、ノット（knot）、三重相互作用
（triple interact）、クローバー葉、またはヘリックス、若しくはこれらの組
合せが含まれるが、これらには限定されない。あるいは、新規な二重構造を同定
してもよい。

【００５０】本発明の別の態様においては、いったん保存された領域の二次構造を上述した
ように同定したら、二次構造を有する保存された領域についての少なくとも一つ
の構造モチーフを同定する。これらの構造モチーフは、上述したような同定され
た二次構造に対応する。例えば、自己相補性による二次構造の解析は、二次構造
の一つの型を提供しうるが、一方M-foldによる解析は、別の二次構造を提供しう
る。したがって、上述した二次構造解析により同定されたすべての可能性のある
二次構造は、構造モチーフのファミリーにより表示される。

【００５１】標的核酸の（1または複数の）二次構造および様々な分類学的種に由来する核
酸の二次構造がいったん同定されたら、上述したように、一次ヌクレオチド配列
によるのではなくむしろ、構造に基づく検索により、さらなる核酸を同定するこ
とができる。上述したように見いだされ二次構造と類似するかまたは同一である
二次構造を有する追加の核酸を、上述した構造モチーフについての記述子要素の
ファミリーを構築することにより、そして記述子要素に対応する二次構造を有す
るその他の核酸を同定することにより、同定することができる。二次構造を有す
る核酸のいずれかまたはすべての組合せを、データベース中に集めることができ
る。全体の方法を、データベース中に集めることができる複数の別の二次構造グ
ループを生成するために、別の標的核酸について繰り返すことができる。したが
って、本明細書中に記載する発明により行うことにより、分子相互作用部位のデ
ータベースを集めることができる。

【００５２】仮定的な構造モチーフを上述した二次構造解析から決定した後、構造記述子要
素のファミリーを構築する。好ましくは、上述した構造モチーフを、記述子要素
のファミリーに変換する。典型的な記述子要素を図9中に示す。同業者には、記
述子の構築はよく知られている。構造記述子は、たとえば、その全体を参考文献
として本明細書中に援用する、Laferriereら（Comput. Appl. Biosci., 1994, 1
0, 211-212）中に記載されている。二次構造解析から同定した構造モチーフのそ
れぞれについて、別の構造記述子要素を構築する。簡単にいうと、二次構造を例
えば図9中に示すような一般的なテキストストリングに変換する。新規のモチー
フについては、構造予測を確認するために、化学的マッピングまたは変異生成な
どのさらなる生物化学的解析を必要とすることができる。記述子要素を、様々な
ストリンジェンシーを有するように定義することができる。

【００５３】例えば、図9を参照すると、ステムの第一の領域を含むH1と記載する領域を、N
NN：NNNとして記載することができ、これはG-C、C-G、A-U、およびU-Aを含む相
補性塩基対合のいずれかを企図している。H1領域はまた、C-GまたはA-Uなどの塩
基対合のみを含むように、示すこともできる。さらに、記述子要素を、動揺する
ことを可能にするように定義することができる。このように、記述子要素を、ユ
ーザーが希望するいずれかのレベルのストリンジェンシーを有するように定義す
ることができる。出願人の発明は、このように、様々な記述子要素を含むデータ
ベースに対するものでもある。

【００５４】構造記述子要素のファミリーを構築した後、構造記述子要素に対応する二次構
造を有する核酸を同定する。好ましくは、少なくとも一つのデータベースを検索
し、クラスター化および解析を行い、オルトログを同定し、またはこれらの組合
せをすることにより、構造記述子要素に対応する二次構造を有する核酸を同定す
る。このように、同定された核酸は、記述子要素により定義された二次構造の範
囲内に属する二次構造を有する。このように、同定された核酸は、記述子要素の
ストリンジェンシーに依存して、標的核酸と同一ないしほぼ同一な二次構造を有
する。

【００５５】本発明の一態様において、少なくとも一つのデータベースを検索することによ
り、構造記述子要素に対応する二次構造を有する核酸を同定する。いずれかの遺
伝子データベースを検索することができる。好ましくは、データベースは、メッ
センジャーRNA中の非翻訳領域を集めたUTRデータベースである。UTRデータベー
スは、インターネットを介して、例えばftp://area.ba.cnr.it/pub/embnet/data
base/utr/にて、アクセスすることができる。好ましくは、データベースは、例
えばDaniel Gautheret から入手可能なUNIX-ベースのモチーフ検索ツールである
Rnamotなどのコンピュータプログラムを使用して検索する。その後、公有のデー
タベースに対して同一のモチーフを有するそれぞれの“新規な”配列に疑問符を
つけ、追加の配列を同定する。上述したようなこれらの追加のオルトログ配列の
UTR中でのパターンの再発について、結果を解析し、そしてRNA二次構造のデータ
ベースを構築する。当業者には、Rnamotはよく知られている。簡単にいうと、Rn
amotは、図9中に示されるような記述子ストリングをとり、そして可能性のある
適合についてのFasta形式のデータベースのいずれかを検索する。記述子は、厳
密なヌクレオチドの適合に対して非常に特異的であってもよく、または内蔵され
た縮重を有していてもよい。ステムおよびループの長さは、特定されていてもよ
い。一本鎖ループ領域は、可変長を有していてもよい。G-U対合も許容され、そ
してぐらぐらする（wobble）パラメータとして特定することができる。許容でき
るミスマッチもまた、記述子の定義中に含めることができる。機能的な重要性は
、モチーフの生物学的役割が以前の解析に基づいて既知であるならば、モチーフ
に割り当てられる。例えば鉄反応性要素（Iron Response Element）などの既知
の制御領域は、この技術（以下の実施例1を参照）を使用して発見した。原核細
胞の分子相互作用部位を含有するデータベースを集める本発明の態様においては
、ヒト配列を検索し、あるいは、見いだされた場合にはヒト配列を廃棄すること
を抑制することが好ましい。

【００５６】本発明の別の態様においては、例えばUTRデータベースなどのデータベースをR
namotを使用して検索することにより同定された核酸を、ゲノム中のそれらの位
置を決定する様にクラスター化し、そして解析する。Rnamotにより提供される結
果から、二次構造を含有する配列が単に同定されるが、ゲノム中の配列の位置に
ついてはいずれの指示も与えない。クラスター化および解析は、好ましくは上述
したようなClustalWを用いて行う。

【００５７】本発明の別の態様においては、クラスター化および解析が上述したように行わ
れた後、オルトログが上述したように同定される。しかしながら、単にそれらの
一次ヌクレオチド配列に基づいて同定された上記で同定されたオルトログとは対
照的に、これらの新規なオルトログの配列は、Rnamotを使用して同定された核酸
を使用する構造に基づいて同定される。好ましくは上述したようにBlastParseま
たはQ-Compareによりオルトログの同定を行う。原核細胞分子相互作用部位を含
有するデータベースを集める本発明の態様においては、ヒトオルトログを発見し
、あるいは見いだした場合にはヒトオルトログを廃棄することを抑制することが
好ましい。

【００５８】構造記述子要素に対応する二次構造を有する核酸を同定した後、ヌクレオチド
配列のいずれかまたはすべてを、当業者に既知の標準的編集プロトコルによりデ
ータベース中に集めることができる。一つのデータベースは、真核細胞の分子相
互作用部位を含有することができ、そして別のデータベースは原核細胞分子相互
作用部位を含有することができる。

【００５９】本発明は、選択された生物のRNA中および少なくとも一つのむしろいくつかの
追加の生物のRNA中に存在する分子相互作用部位を含むオリゴヌクレオチドに対
するものでもある。オリゴヌクレオチドのヌクレオチド配列を選択して、上述し
た分子相互作用部位の二次構造を提供する。オリゴヌクレオチドのヌクレオチド
配列は、好ましくは、上述した標的核酸のヌクレオチド配列である。あるいは、
ヌクレオチド配列は、好ましくは、分子相互作用部位も含有する複数の様々な分
類学的種に由来する核酸のヌクレオチド配列である。分子相互作用部位は、分子
相互作用部位に結合した場合に選択された生物中のRNAの発現を調節する少なく
とも一つの分子についての結合部位として機能する。

【００６０】本発明はまた、原核細胞RNAおよび少なくとも一つの追加の原核細胞RNA中に存
在する分子相互作用部位を含むオリゴヌクレオチドにも対し、ここで分子相互作
用部位は、分子相互作用部位に結合した場合に、原核細胞RNAの発現を調節する
、少なくとも一つの分子に対する結合部位として機能する。すべての真核および
原核の生物および細胞から追加の生物を選択するが、選択された生物と同一の生
物ではない。オリゴヌクレオチドおよびその修飾物は、当該技術分野において周
知である。本発明のオリゴヌクレオチドは、例えば、分子相互作用部位に結合す
る天然の生じた分子を検出するための、例えば研究用試薬として、使用すること
ができる。本発明のオリゴヌクレオチドは、研究用途、診断用途および治療用途
について、細胞中の天然に生じた分子相互作用部位と競合するためのデコイとし
て使用することもできる。RNAの発現を増大するかまたは減少するかのいずれか
により、分子相互作用部位に結合する分子を修飾する。オリゴヌクレオチドは、
農業用途、工業用途およびその他の用途において使用することもできる。

【００６１】本発明は、上述したオリゴヌクレオチドを医薬的な担体と共に含む医薬組成物
にも対する。“医薬的な担体”とは、動物に対して1または複数の核酸を送達す
るための、医薬的に許容可能な溶媒、希釈剤、懸濁剤、またはその他の医薬的に
不活性なビヒクルのいずれかであり、そしてそれらは当業者に周知である。担体
は、液体でも固体でもよく、そして医薬組成物の他の構成要素と組み合わせた場
合に、所望のバルク、整合性などを提供するように、計画された投与様式を意向
として持ちつつ、担体を選択する。典型的な医薬的な担体には、結合剤（例えば
、あらかじめゼラチン化したトウモロコシでんぷん、ポリビニルピロリドン、ま
たはヒドロキシプロピルメチルセルロースなど）；充填剤（例えば、乳糖および
その他の糖、微晶質セルロース、ペクチン、ゼラチン、硫酸カルシウム、エチル
セルロース、ポリアクリル酸、またはリン酸水素カルシウムなど）；潤滑剤（例
えば、ステアリン酸マグネシウム、タルク、シリカ、コロイド状二酸化珪素、ス
テアリン酸、金属ステアレート、水素化植物油、コーンスターチ、ポリエチレン
グリコール、安息香酸ナトリウム、酢酸ナトリウムなど）；崩壊剤（例えば、ス
ターチ、スターチグルコネートナトリウムなど）；または湿潤剤（例えば、ラウ
リル硫酸ナトリウムなど）が含まれるが、これらには限定されない。

【００６２】以下の実施例は、本発明の好ましい態様の具体例を示すが、これらは限定的な
ものを意味していない。

【００６３】

【実施例】

実施例１：鉄反応性要素１. RNA標的の選択小分子相互作用部位を同定するための戦略を説明するために、ヒトのフェリチ
ン遺伝子によりコードされるmRNAのおける鉄反応性要素（IRE）を同定する。IRE
は鉄代謝に関連するmRNAの翻訳レベルを調節するために使用されるRNA構造要素
の典型的な例である。IREの構造は最近NMR分光器を使用して決定された。加えて
、IRE構造のNMR解析はGdaniecら（Biochem., 1998, 37, 1505-1512）およびAdde
ssら（J. Mol. Biol., 1997, 274, 72-83）に記述されている。IREはヘアピン構
造に折りたたまれ、特定のタンパク質に結合する約30ヌクレオチドのRNA要素で
ある。この構造は非常に良く研究されており、多くの種のmRNAのおいて明らかで
あることが知られているため、出願人の方法論がどのように作用するかのすばら
しい例として役立つ。

【００６４】２. RNA標的のヌクレオチド配列の決定フェリチンに関するヒトmRNA配列を目的の配列あるいはマスター配列の初期mR
NAとして使用する。フェリチンタンパク質配列も解析において、特に関連する配
列を見つけるために使用する初期工程において使用する。ヒトフェリチン遺伝子
の場合、最良の入力はUNIGENEから入手する完全長の注釈付きmRNAおよびタンパ
ク質配列である。しかし、目的とする多くの遺伝子にとって同レベルの詳細な情
報は入手できない。これらの場合、マスター配列情報の代わりの供給源を、例え
ばGenBank、TIGR、GenBankのdbEST部門などから、あるいは民間の研究室から得
る配列情報から得る。出願人の方法はあらゆるレベルの入力配列情報を使用して
働くが、高い質の注釈付き入力配列を用いるより少ない工程が必要である。

【００６５】３. 同様配列の同定処理の早期工程はマスター配列（ヌクレオチドあるいはタンパク質）を使用し
、データベース（オルトログ（orthologs）およびパラログ（paralogs））にお
いて関連する配列を見つけランクをつける。配列同一性検索アルゴリズムを本目
的に使用する。全ての配列同一性アルゴリズムは、マスター配列と比較した各々
の結果に関する同一性の量的な測定を計算する。量的な結果の例はブラスト（Bl
ast）アルゴリズムから得たE値（E-value）である。質問（query）配列としてフ
ェリチンmRNAを使用した非リダンダントGenBankデータベースのブラスト検索のE
値は、配列同一性検索の量的解析の使用を説明する。E値は質問配列とデータベ
ース配列の適合が無作為な機会のために起こるという確率である。それゆえ、E
値が低ければ低いほど、二つの配列の正確な関連がより確からしくなる。フェリ
チンの最も低いE値スコアのプロットは図10に示す。カットオフ基準に見合う配
列を以下に記述する一組の規則に従って、より詳細な比較のために選択する。配
列同一性検索の目的は距離的に関連するオルトログおよびパラログを見つけるこ
とであるため、カットオフ基準はあまりストリンジェントでない方が好ましく、
そうでなければ検索の標的は排除されるかもしれない。

【００６６】４. 保存的領域の同定保存的領域の同定はCompareOverWinsと共にQ-Compareを使用して対合（pairwi
se）配列比較により行う。異なる種由来で関連する機能を持つ遺伝子間の構造的
な保存は、良い薬剤結合部位を見つけるために使用できる主要な指標である。保
存的構造は距離的に関連する配列を使用し、潜在的な構造の解析と併せて残りの
保存的配列をつなぎ合わせることで同定できる。配列比較は、まさに非常に分岐
した生物由来の配列保存の跡（trace）を同定できるQ-compareを使用して、異な
る種由来のmRNAの組の間で行われる。Q-compareはCompareOverWinsと共に、一つ
の配列を他の配列の端から端まで滑り込ませ、特定サイズのウィンドウ（window
）の中で適合する数を測定することで、各々の配列の全ての領域を比較する。

【００６７】フェリチンに関するヒトmRNAとマウスmRNAはそれぞれ5'-UTRにおいてIREを含
んでおり、これらをこの様式で解析するとき、配列同一性の領域を示すプロット
が図19に示すように作成される。ヒトとマウスのフェリチンmRNA配列の対合解析
（pairwise analysis）は、この型の解析のいくつかの重要な観点を説明する。
アミノ酸配列をコードする各々のmRNAの領域は、同一性の程度が最も高く、一方
非翻訳領域はより低い同一性である。図19において、IREの位置を示す。ヒトと
マウスのフェリチンmRNAの両方において、IREは各々のmRNAの5'最末端に位置す
る。これは重要な点を説明する--IRE構造の領域における配列の保存は、ヒトと
マウスのフェリチン配列の間の配列同一性のバックグランドに対して顕著ではな
い。これに対して、ヒトとマス（図11）あるいはヒトとニワトリ（図12）のフェ
リチンmRNAの比較では、IREはすぐに同定できる。これはヒトとマスあるいはヒ
トとニワトリの間のUTRの配列が、ヒトとマウスよりもより大きな進化的な距離
であるために分離されているからであり、これは他の哺乳動物と比較して鳥類及
び魚類からヒトが離れた進化的距離を考えると理論的である。ヒトの配列と鳥類
および魚類の配列の比較により知識が与えられるが、それは進化による自然の流
れがUTRにおいて多くの配列を変化させているからである。しかし、IRE配列は重
要な構造を形作っているため、より抑制（constrained）されている。このよう
に、それらはよりよく突出しており、よりたやすく同定できる。

【００６８】同じ原則がマスとニワトリのフェリチン配列を互いに比較する場合に当てはま
る。両方とも進化の１億年程度ヒトと離れているが、それらも互いに十分に離れ
ている。これは本発明で使用するもう一つの重要な方策を説明する--二つの非ヒ
トRNA配列の比較を使用して、実際のヒトの配列を用いずに制御RNA構造を発見で
きる。非ヒト比較の研究は実際に当業者に、潜在的な薬剤標的としてのヒトでの
対照部位を発見するために調べるべき場所を指図する。

【００６９】進化的距離を使用してどの配列を比較せず、ならびにどの配列を比較するかを
決定できる。ヒトとマウスに対して、マスとサケの比較は、それらの種があまり
に近縁であり、UTRバックグランド上でIREが目立たないためより情報が少ない。
ヒトとキイロショウジョウバエのフェリチンmRNA配列の比較は、IREが存在して
いるにもかかわらず、どちらかの種でIREを見つけることができない。これは、
ヒトとキイロショウジョウバエの間のIREの配列は、構造が保存されているにも
かかわらず分岐しているからである。しかし、キイロショウジョウバエとカのフ
ェリチンmRNAを比較すると、IREは同定され、ヒトにおける薬剤発見に関連する
制御要素を同定するためにはヒト配列は必要ではないことを再び説明する。

【００７０】本発明において使用するソフトウェアは、種間の進化的距離に基づくルックア
ップ表を使用することで、配列対合を比較するかしないかを決定する。上述した
実施例を使用する小さなルックアップ表の例は図13に示す。本発明におけるルッ
クアップ表はGenBankに寄託される配列を持つ全ての種を含む。CompareOverWins
と共にQ-Compareはどの配列を対合比較するかを決定する。

【００７１】５. 二次構造の同定オルトログおよびパラログあるいは他の関連遺伝子において保存の証拠を示す
配列の組を、内部構造の形成能のために解析する。これは、例えば自己相補解析
などにおけるように、配列をX軸上にて5'から3'へプロットし、その逆相補（rev
erse complement）をY軸上にて5'から3'へプロットするマトリクスにおいて、各
々の配列を解析することで達成する。潜在的な分子内塩基対に一致する適合は、
表の値に従ってスコア化される。ヒトのフェリチンIRE配列をこの様式で解析す
るとき、対角線は潜在的な自己相補領域を示す。本実施例に記述するそれぞれの
13の IRE配列は同様な様式で解析された。各々の配列は様々な異なる構造を形作
ることができる一方で、最も起こりやすい構造は全ての配列に共通なものである
。全ての13の独立した配列のプロットの重ね合わせにより（図8参照）、全ての
配列に共通な潜在的な構造が導かれる。

【００７２】実施例２：鉄反応性要素（方法B）２. RNA標的のヌクレオチド配列の決定フェリチンに関するヒトmRNA配列を目的の配列あるいはマスター配列の初期mR
NAとして使用する。フェリチンタンパク質配列も解析において、特に関連する配
列を見つけるために使用する初期工程において使用する。ヒトフェリチン遺伝子
の場合、最良の入力はUNIGENEから入手する完全長の注釈付きmRNA（gi507251）
およびタンパク質配列である。しかし、目的の多くの遺伝子にとって同レベルの
詳細な情報は入手できない。これらの場合、マスター配列情報の代わりの供給源
を、例えばHovergenおよびGenBankなどから得る。本方法はあらゆるレベルの入
力配列情報を使用して働くが、高品質の注釈付き入力配列を用いるより少ない工
程が必要である。

【００７３】３. 同様配列の同定オルトログを発見するための代わりの、好ましいアプローチはDuretら（Nuc.
Acids Res., 1994, 22, 2360-2365）に記述されるHovergenデータベースおよび
質問ツールを使用することであり、それは全体として参考文献によりここで受け
入れられる。

【００７４】関連する配列を同定するためのHovergenの使用は図16（種レベルの系統樹分類
）および図17（目レベルの分類）に示す。これらのオルトログの各々に相当する
配列をGenBankフォーマットで保存し、単一データファイル内で一緒にグループ
化した。コード領域の5'および3'側面の両方における非翻訳領域を図18に示すよ
うに、SEALSおよびCOWXを使用して抽出した。

【００７５】４. 保存的領域の同定 IRE配列は重要な構造を形作っているため、より抑制されている。このように
、それらはより顕著であり、密接に関連する配列においてでさえより容易に同定
できる。しかし、これをあらゆる遺伝子のために働かせるために、比較アルゴリ
ズムを書き直す（図5A-C参照）。この新たなツール、CompareOverWinsはウィン
ドウのサイズの範囲、そのうえヒット閾値の両方の動的な選択を可能にする。こ
のアルゴリズムは入力として解析されおよび分離された5'および3' UTR配列が必
要である。我々は先に記述したSealsゲノム解析パッケージに有用なツールを使
用してこれを達成する。図18は含まれる工程を記述する。

【００７６】ここに記述する方法を使用して鉄反応性要素を同定するために、Compare Over
Winowsアルゴリズムを使用し、その結果をAlignHitsを使用して視覚化した（ア
ルゴリズムについては図5D）。代表的な結果は図23に示す。閾値の至適化に加え
て、CompareOverWinsはヒットに相当する配列も抽出する。ClustalW（バージョ
ン1.74）を抽出した配列に使用して、位置的なギャップ化並置を作成した（図24
参照）。このアプローチの代表的なフロースキームは図25に示す。

【００７７】５. 二次構造の同定オルトログおよびパラログあるいは他の関連遺伝子において保存の証拠を示す
配列の組を、内部構造の形成能について解析する。これは、例えば自己相補解析
などにおけるように、配列をX軸上にて5'から3'へプロットし、その相補物をY軸
上にて5'から3'へプロットするマトリクスにおいて、各々の配列を解析すること
で達成する。潜在的な分子内塩基対に対応する適合は、表の値に従ってスコア化
される。ヒトのフェリチンIRE配列をこの様式で解析するとき、対角線は潜在的
な自己相補領域を示す。本実施例に記述するそれぞれの13のIRE配列は同様な様
式で解析された。各々の配列は様々な異なる構造を形作ることができる一方で、
最も起こりやすい構造は全ての配列に共通なものである。全ての13の独立した配
列のプロットの重ね合わせにより（図26参照）、全ての配列に共通な潜在的な構
造が導かれる。

【００７８】上記スキームはRevComp（図14参照）と呼ばれるプログラム中でアルゴリズム
的（algorithmically）に実行される。RevCompは全ての構造のソートしたリスト
を作成する。代表的な結果は、“ドーム”出力（図27参照）あるいは多くのRNA
構造考察プログラム（RNA structure viewing programs）（RNAStructure、RNAV
izなど）の一つにおいて使用できる“connect”あるいは“ct”ファイルとして
のいずれかで見ることができる。そのような構造図の代表的な例は図28に示す。

【００７９】実施例３：ヒストンヒストン3' UTRは広範囲に研究されているもう一つの典型的なステム-ループ
構造を表す（EMBO, 1997, 16, 769）。後-転写レベル（post-transcriptional l
evel）では、ヒストンmRNAの3'非翻訳領域におけるステム-ループ構造は非常に
重要であることが示されている（Son, Saenghwahak Nyusu, 1993, 13, 64-70）
。以下に示す解析はこの既知の構造の使用を記述して、ここに記述される戦略お
よび方法を確認する。

【００８０】図29および30はHovergenデータベースの全てのヒストンオルトログに関する系
統樹の出力を表す。各々のこれらのオルトログをGenBankフォーマットで保存し
、単一データファイル内で一緒にグループ化した。コード領域の5'および3'側面
の両方における非翻訳領域を先に記述したように、SEALSおよびCOWXを使用して
抽出および比較した（図18および25参照）。

【００８１】 SEALSおよびCOWXによる抽出および比較に続いて、AlignHitsを使用して潜在的
な目的領域を決定した（図31参照）。一つのそのような領域を囲んで示す。目的
の領域に対応する配列をCLUSTAL W（1.74）を用いた並置のために全ての種から
抽出した。AlignHitsからの配列情報の抽出に続いて、CLUSTAL W（1.74）を使用
して、示される多重配列並置を提供した（図32参照）。各々の推定ヒット配列を
内部構造の形成能のために解析した。これは、配列をX軸上にて5'から3'へプロ
ットし、その相補をY軸上にて5'から3'へプロットするマトリクスにおいて、各
々の配列を解析することで達成した。対角線に沿った塩基対は、二次構造を形成
することができる潜在的な自己相補領域を示す。図33は代表的な逆相補マトリク
スを示す。図34は、塩基対の間の潜在的なステム構造を示すドームフォーマット
における代表的な配列を示す。ctファイルへのドームフォーマットファイルの変
換に続き、RNA Structure 3.21を使用して構造を明視化する（図35参照）。

【００８２】実施例４：ビメンチンビメンチンは中間フィラメントタンパク質であり、その3' UTRは種間で高く保
存されている。Zehnerら（Nuc. Acids Res., 1997, 25, 3362-3370）による以前
の研究により、この領域内に含まれる提案された複合ステム-ループ構造はmRNA
配置のようなビメンチンmRNA機能にとって重要でありうることが示されている。
同領域は本解析を使用して同定され、これにより本アプローチを確認した。加え
て、ここに記述する解析に基づいて、ビメンチン機能の制御の役割も持ちうる以
前に提案された構造の下流に起こる第二のステム-ループ構造が同定されている
（図36参照）。

【００８３】 Hovergenデータベースの全てのビメンチンオルトログに関する代表的な系統樹
の出力を図37に示す。各々のこれらのオルトログをGenBankフォーマットで保存
し、単一データファイル内で一緒にグループ化した。コード領域の5'および3'側
面の両方における非翻訳領域を先に記述したように、SEALSおよびCOWXを使用し
て抽出および比較した（図18および25参照）。

【００８４】 SEALSおよびCOWXによる抽出および比較に続いて、Align Hitsを使用して潜在
的な目的領域を決定した。二つのそのような領域が現れ、それらを続く解析のた
めに使用した（図38参照）。領域1に関する Align Hitsからの配列情報の抽出に
続いて、CLUSTAL Wを使用して、示される多重配列アライメントを提供した（図3
9参照）。ドームフォーマットにおける配列アライメント上に与えられる塩基対
間の潜在的ステム構造は図40に示す。 ctファイルへのドームフォーマットファ
イルの変換に続き、RNA Structure 3.21を使用して構造を明視化した（図41参照
）。この構造はZehnerらによって提案されたものと非常に似ている（図42参照）
。Zehnerらは、ビメンチンの3' UTRにおける最小の結合ドメインのために提案し
た構造の詳細な化学的解析を提示した。この解析は一本鎖特異的（ChSあるいはT
1）あるいは二本鎖特異的（V1）ヌクレアーゼを用いた開裂、ならびに暴露後の
酢酸塩誘導を含んでいた。

【００８５】領域2に関する Align Hitsからの配列情報の抽出に続いて、CLUSTAL Wを使用
して、図43に示される多重配列アライメントを提供した。領域2における塩基対
間の潜在的ステム構造は、ドームフォーマットにおける配列アライメント上に与
えられる（図44参照）。 ctファイルへのドームフォーマットファイルの変換に
続き、RNA Structure 3.21を使用して領域2に関する構造を明視化した（図36参
照）。

【００８６】実施例５：トランスフェリンレセプターフェリチンの制御（実施例１および２）と同様に、IREの機能が知られている
もう一つはトランスフェリンレセプターの制御内にある。5つのIREが既知の転移
レセプターmRNAの3' UTRにおいて同定されており（Kuhnら、EMBO J., 1987, 6,
1287-93およびCaseyら、Science, 1988, 240,924-928）、各々は全体として参考
文献によりここで受け入れられる。すべての5つのIREは鉄制御タンパク質（IRP
）と独立的に相互作用することが示されている。本技術をトランスフェリンレセ
プターにおけるこれらの保存的要素の同定に応用した。

【００８７】 Hovergenデータベースの全てのトランスフェリンレセプターオルトログに関す
る代表的な系統樹の出力を図45に示す。各々のこれらのオルトログをGenBankフ
ォーマットで保存し、単一データファイル内で一緒にグループ化した。コード領
域の5'および3'側面の両方における非翻訳領域を先に記述したように、SEALSお
よびCOWXを使用して抽出および比較した（図18および25参照）。

【００８８】 SEALSおよびCOWXによる抽出および比較に続いて、Align Hitsを使用して図46
に示すように潜在的な目的領域を決定した。これにより、垂直な線が一組の種か
らの配列情報を表す一連の水平な線を横切るところを見ることができる。トラン
スフェリンレセプターの3プライム（prime）UTRにおける920から990までの塩基
対の間のこの領域を、CLUSTAL W（1.74）を用いたアライメントのために全ての
種から抽出した。

【００８９】領域1に関する Align Hitsからの配列情報の抽出に続いて、CLUSTAL W（1.74
）を使用して、図47に示される多重配列アライメントを提供した。塩基対間の代
表的な潜在的ステム構造は、図48に示すようにドームフォーマットにおける配列
アライメント上に与えられる。ctファイルへのドームフォーマットファイルの変
換に続き、RNA Structure 3.21を使用して構造を明視化した（図49参照）。これ
により、垂直な線が一組の種からの配列情報を表す一連の水平な線を横切るとこ
ろを見ることができる。トランスフェリンレセプターの3プライムUTRにおける99
0から1050までの塩基対の間のこの領域を、CLUSTAL W（1.74）を用いたアライメ
ントのために全ての種から抽出した（図50参照）。

【００９０】領域2に関する Align Hitsからの配列情報の抽出に続いて、CLUSTAL W（1.74
）を使用して、図51に示される多重配列アライメントを提供した。塩基対間の潜
在的ステム構造は、図52に示すようにドームフォーマットにおける配列アライメ
ント上に与えられる。ctファイルへのドームフォーマットファイルの変換に続き
、RNA Structure 3.21を使用して図53に示すように構造を明視化した。SEALSお
よびCOWXによる抽出および比較に続いて、Align Hitsを使用して潜在的な目的領
域を決定した。これにより、垂直な線が一組の種からの配列情報を表す一連の水
平な線を横切るところを見ることができる。トランスフェリンレセプターの3プ
ライムUTRにおける1372から1423までの塩基対の間のこの領域を、CLUSTAL W（1.
74）を用いたアライメントのために全ての種から抽出した（図54参照）。

【００９１】領域3に関する Align Hitsからの配列情報の抽出に続いて、CLUSTAL W（1.Ex.
34）を使用して、図55に示される多重配列アライメントを提供した。塩基対間の
潜在的ステム構造は、図56に示すようにドームフォーマットにおける配列アライ
メント上に与えられる。ctファイルへのドームフォーマットファイルの変換に続
き、RNA Structure 3.21を使用して図57に示すように構造を明視化した。SEALS
およびCOWXによる抽出および比較に続いて、Align Hitsを使用して潜在的な目的
領域を決定した。これにより、垂直な線が一組の種からの配列情報を表す一連の
水平な線を横切るところを見ることができる。トランスフェリンレセプターの3
プライムUTRにおける1439から1479までの塩基対の間のこの領域を、CLUSTAL W（
1.74）を用いたアライメントのために全ての種から抽出した（図58参照）。

【００９２】領域4に関する Align Hitsからの配列情報の抽出に続いて、CLUSTAL W（1.Ex.
34）を使用して、図59に示される多重配列アライメントを提供した。塩基対間の
潜在的ステム構造は、図60に示すようにドームフォーマットにおける配列アライ
メント上に与えられる。ctファイルへのドームフォーマットファイルの変換に続
き、RNA Structure 3.21を使用して図61に示すように構造を明視化した。SEALS
およびCOWXによる抽出および比較に続いて、Align Hitsを使用して潜在的な目的
領域を決定した。これにより、垂直な線が一組の種からの配列情報を表す一連の
水平な線を横切るところを見ることができる。トランスフェリンレセプターの3
プライムUTRにおける1479から1542までの塩基対の間のこの領域を、CLUSTAL W（
1.74）を用いたアライメントのために全ての種から抽出した（図62参照）。

【００９３】領域5に関する Align Hitsからの配列情報の抽出に続いて、CLUSTAL W（1.Ex.
34）を使用して、図63に示される多重配列アライメントを提供した。塩基対間の
潜在的ステム構造は、図64に示すようにドームフォーマットにおける配列アライ
メント上に与えられる。ctファイルへのドームフォーマットファイルの変換に続
き、RNA Structure 3.21を使用して図65に示すように構造を明視化した。

【００９４】実施例６：オルニチンデカルボキシラーゼオルニチンデカルボキシラーゼ（ODC）はポリアミン生合成経路における最初
の酵素である。研究により、5'および3'非翻訳領域の両方において翻訳的な制御
要素（translational regulatory elements）の存在が示されている（Grensら、
J. Biol. Chem., 1990, 265, 11810）。二次構造がこれらの両領域に存在するこ
とが提案されているが、しかしその決定的な証拠はない。ここに記述する方法に
より、以下に示すように3' UTRにおける二つの構造が同定された。これらの構造
の存在（図66参照）は、質量分光測定法調査（probing）を使用して証明された
（Griffeyら、Proc. SPIE-Int. Soc. Opt. Eng., 2985（超高感度生化学診断II
（Ultrasensitive Biochemical Diagnostics II））: 82-86、それは全体として
参考文献によりここで受け入れられる）。長さにおいてわずかな変化を示す二つ
の代表的な配列（図67参照）はRNA内でつくられ、MS構造調査にかけられた。図6
6に示す結果によりステム-ループ構造の存在が確認される。それゆえ、新規二次
構造の同定はここに記述する方法から同定でき、またそのような存在は構造調査
により独立して証明されている。

【００９５】 Hovergenデータベースの全てのオルニチンデカルボキシラーゼオルトログに関
する系統樹の出力を図68および図69に示す。各々のこれらのオルトログをGenBan
kフォーマットで保存し、単一データファイル内で一緒にグループ化した。コー
ド領域の5'および3'側面の両方における非翻訳領域を先に記述したように、SEAL
SおよびCOWXを使用して抽出および比較した（図18および25参照）。

【００９６】 SEALSおよびCOWXによる抽出および比較に続いて、Align Hitsを使用して図70
に示すように潜在的な目的領域を決定した。二つのそのような領域が現れ、それ
らを続く解析のために使用した。領域1からの配列情報の抽出に続いて、CLUSTAL
W（1.74）を使用して、示される多重配列アライメントを提供した。各々の推定
的中配列を、図71に描かれる逆相補マトリクスに示されるような内部構造の形成
能のために解析した。これは、配列をX軸上にて5'から3'へプロットし、その相
補をY軸上にて5'から3'へプロットするマトリクスにおいて、各々の配列を解析
することで達成した。対角線に沿った塩基対は、二次構造を形成することができ
る潜在的な自己相補領域を示す。領域1における塩基対の間の潜在的なステム構
造のドーム状概要は、RevCompを使用して決定した配列アライメント上に与えら
れる（図72参照）。RNA Structure 3.21を使用して構造を明視化した（図73参照
）。

【００９７】質量分光測定解析技術を使用して構造の調査を行った。図67は多重アライメン
トにおけるギャップ／挿入の存在を示した。図67に示すアライメントからの二つ
の代表的なRNA（gi404561およびgi35135）を本実験に使用した。誘導された断片
化のパターン解析は、（図に挿入で示される）ステム-ループ構造の頭の半分（t
op half）に沿った塩基対に関する非常に強力な見込みを示した。これは404561
における塩基11-14および20-23、あるいは35135における塩基8-11および18-21に
相当する。湾曲部の塩基（404561におけるG9あるいは35135におけるU22）も特徴
的な断片化パターンを示した。構造の底の半分（bottom-half）はより安定が小
さいようであり、我々の解析で予想した塩基対でいくつかの断片化が見られた。
これは特に配列35135において真であった。しかし、この領域はより安定が小さ
い傾向のいくつかの隣接するA-UあるいはG-U塩基対を持ち、それゆえより高い断
片化の可能性を持つ。

【００９８】領域2に関する Align Hitsからの配列情報の抽出に続いて、CLUSTAL Wを使用
して、図74に示されるように多重配列アライメントを提供した。領域2における
塩基対間の潜在的ステム構造は、図75に示すようにドームフォーマットにおける
配列アライメント上に与えられる。ctファイルへのドームフォーマットファイル
の変換に続き、RNA Structure 3.21を使用して図76に示すように領域2に関する
構造を明視化した。

【００９９】実施例７：インターロイキン-2（IL-2） Hovergenデータベースの全てのIL-2 オルトログに関する代表的な系統樹の出
力を図77に示す。各々のこれらのオルトログをGenBankフォーマットで保存し、
単一データファイル内で一緒にグループ化した。コード領域の5'および3'側面の
両方における非翻訳領域を先に記述したように、SEALSおよびCOWXを使用して抽
出および比較した（図18および25参照）。

【０１００】 SEALSおよびCOWXによる抽出および比較に続いて、Align Hitsを使用して3' UT
R領域における潜在的な目的領域を決定した。二つのそのような領域が現れ、そ
れらを続く解析のために使用した（図78参照）。領域1のためのAlign Hitsから
の配列情報の抽出に続いて、CLUSTAL W（1.74）を使用して、図79に示される多
重配列アライメントを提供した。領域1における塩基対の間の潜在的なステム構
造のドーム状概要は、RevCompを使用して決定した配列アライメント上に与えら
れる（図80参照）。RNA Structure 3.2を使用して図81に描かれるように構造を
明視化した（図73参照）。領域2に関する Align Hitsからの配列情報の抽出に続
いて、CLUSTAL W（1.74）を使用して、図82に示される多重配列アライメントを
提供した。領域2における塩基対間の潜在的ステム構造は、図83に示すようにド
ームフォーマットにおける配列アライメント上に与えられる。ctファイルへのド
ームフォーマットファイルの変換に続き、RNA Structure 3.21を使用して図84に
示すように領域2に関する構造を明視化した。

【０１０１】上述の二つの領域に加え、領域2の下流で部分的にオーバーラップしている第
３の領域を、代わりの参照配列（3087784.fa）を使用して同定し、図85に示す。
この領域に関する Align Hitsからの配列情報の抽出に続いて、CLUSTAL W（1.74
）を使用して、図86に示される多重配列アライメントを提供した。領域3におけ
る塩基対間の潜在的ステム構造は、ドームフォーマットにおける配列アライメン
ト上で図87に示す。ctファイルへのドームフォーマットファイルの変換に続き、
RNA Structure 3.21を使用して領域3に関する構造を明視化した（図88参照）。

【０１０２】実施例８：インターロイキン-4（IL-4） Hovergenデータベースの全てのIL-4 オルトログに関する代表的な系統樹の出
力を図89に示す。各々のこれらのオルトログをGenBankフォーマットで保存し、
単一データファイル内で一緒にグループ化した。コード領域の5'および3'側面の
両方における非翻訳領域を先に記述したように、SEALSおよびCOWXを使用して抽
出および比較した（図18および25参照）。

【０１０３】 SEALSおよびCOWXによる抽出および比較に続いて、Align Hitsを使用して図90
に示されるように5' UTR領域における潜在的な目的領域を決定した。上記領域の
ためのAlign Hitsからの配列情報の抽出に続いて、CLUSTAL W（1.74）を使用し
て、図91に示される多重配列アライメントを提供した。領域における塩基対の間
の潜在的なステム構造のドーム状概要は、RevCompを使用して決定した配列アラ
イメント上に与えられる（図92参照）。RNA Structure 3.2を使用して図93に示
されるように構造を明視化した。

【０１０４】図94はIL-4の3' UTR領域における的中の代表的なAlign Hits viewを描く。3'
UTR領域に関する Align Hitsからの配列情報の抽出に続いて、CLUSTAL W（1.74
）を使用して、図95に示されるように多重配列アライメントを提供した。領域2
における塩基対間の潜在的ステム構造は、図96に示すようにドームフォーマット
における配列アライメント上に与えられる。ctファイルへのドームフォーマット
ファイルの変換に続き、RNA Structure 3.21を使用して領域2に関する構造を明
視化した（図97参照）。

【図面の簡単な説明】

【図１】図1は、真核生物および原核生物のRNAにおける分子相互作用部位を
同定するための方法の工程の一つの好ましい組を含むフローチャートを説明する
。

【図２】図2は、Find Neighbors And Assemble ESTBlastプロトコルにおけ
る手順の好ましい組を記述するフローチャートである。

【図３】図3は、BlastParseプロトコルにおける好ましい工程を記述するフ
ローチャートである。

【図４】図4は、Q-Cプロトコルにおける好ましい工程を記述するフローチャ
ートである。

【図５】図5A、5B、5Cおよび5Dは、CompareOverWinsプロトコルにおける好
ましい工程を記述するフローチャートを説明する。

【図６】図6は、フェリチンRNAに関するマウスとヒトの種間配列比較の代表
的な拡散プロット（scatter plot）である。

【図７】図7は、単一配列の自己相補解析（self complementation analysis
）の例を示す。

【図８】図8は、あるオルトログの自己相補性プロット（self-complementar
ity plots）のオーバーレイ（overlay）、およびそれぞれにおいて最も繰り返さ
れるパターンに関する選択を示し、ブロック（block）の対角ストリング（diago
nal strings）に描かれているような最小数の可能な折り畳み配置に帰着する。

【図９】図9は、典型的な記述子を示す。

【図１０】図10は、フェリチンに関する一組のe評価（e-volume）スコアを
示す。

【図１１】図11は、フェリチンRNAに関するヒトとマスの種間配列比較の代
表的な拡散プロットである。

【図１２】図12は、フェリチンRNAに関するヒトとニワトリの種間配列比較
の代表的な拡散プロットである。

【図１３】図13は、Q-比較あるいはCompareOverWinsにおいて使用される代
表的なルックアップ表である。

【図１４】図14は、RevCompと呼ばれるプログラムの代表的なブロックダイ
ヤグラムである。

【図１５】図15は、オルトログ発見のための好ましいデータベース検索戦略
の好ましい工程を示す代表的なフローチャートを示す。

【図１６】図16は、フェリチン種分類のための代表的なHovergen系統樹を示
す。

【図１７】図17は、フェリチン哺乳類序列分類のための代表的なHovergen系
統樹を示す。

【図１８】図18は、好ましいSEALS戦略のための好ましい工程を示す代表的
なフロースキームを示す。

【図１９】図19は、ヒトとマウスのフェリチン5' UTR間の相同的な配列の領
域を示す代表的なプロットを示す。

【図２０】図20は、マウスとヒトのフェリチンの5' UTRにおける保存的鉄反
応性要素を示す遺伝子地図を表す。

【図２１】図21は、ヒトとマスのフェリチン5' UTR間の相同的な配列の領域
を示す代表的なプロットを示す。

【図２２】図22は、ヒトとニワトリのフェリチン5' UTR間の相同的な配列の
領域を示す代表的なプロットを示す。

【図２３】図23は、フェリチン5' UTRの代表的なAlign Hits viewを示す。

【図２４】図24は、フェリチン5' UTRの代表的なClustal Alignmentを示す
。

【図２５】図25は、好ましい構造推定（Structure Predictor）戦略のため
の好ましい工程を示す代表的なフローチャートを示す。

【図２６】図26は、フェリチン5' UTRのための代表的な逆相補マトリクス（
reverse complement matrix）を示す。

【図２７】図27は、フェリチン5' UTR構造の代表的なドーム状構造概要を示
す。

【図２８】図28は、フェリチン5' UTRの代表的な構造図を示す。

【図２９】図29は、ヒストンに関する代表的なHovergen系統樹を示す。

【図３０】図30は、ヒストンに関する脊椎動物分類を示す代表的なHovergen
系統樹を示す。

【図３１】図31は、ヒストン3' UTRの代表的なAlign Hits viewを示す。

【図３２】図32は、ヒストン3' UTRに関する代表的なClustal Alignmentを
示す。

【図３３】図33は、ヒストン3' UTRに関する代表的な逆相補マトリクスを示
す。

【図３４】図34は、ヒストン3' UTRの代表的なドーム状構造概要構造を示す
。

【図３５】図35は、ヒストン3' UTRに関する代表的な構造図を示す。

【図３６】図36は、ビメンチン3' UTRの領域2の代表的な構造図を示す。

【図３７】図37は、ビメンチンに関する代表的なHovergen系統樹を示す。

【図３８】図38は、ビメンチン3' UTRの代表的なAlign Hits 概要を示す。

【図３９】図39は、ビメンチン3' UTRの領域1の代表的なClustal Alignment
を示す。

【図４０】図40は、ビメンチン3' UTRの領域1の代表的なドーム状構造概要
を示す。

【図４１】図41は、ビメンチン3' UTRの領域1の代表的な構造図を示す。

【図４２】図42は、ビメンチン3' UTRに関するZehnerらにより提案された構
造を示す。

【図４３】図43は、ビメンチン3' UTRの領域2の代表的なClustal Alignment
を示す。

【図４４】図44は、ビメンチン3' UTRの領域2の代表的なドーム状構造概要
を示す。

【図４５】図45は、トランスフェリンレセプターの代表的なHovergen系統樹
を示す。

【図４６】図46は、トランスフェリンレセプター3' UTRの領域1の代表的なA
lign Hits 概要を示す。

【図４７】図47は、トランスフェリンレセプター3' UTRの領域1の代表的なC
lustal Alignmentを示す。

【図４８】図48は、トランスフェリンレセプター3' UTRの領域1の代表的な
ドーム状構造概要を示す。

【図４９】図49は、トランスフェリンレセプター3' UTRの領域1の代表的な
構造図を示す。

【図５０】図50は、トランスフェリンレセプター3' UTRの領域2の代表的なA
lign Hits 概要を示す。

【図５１】図51は、トランスフェリンレセプター3' UTRの領域2の代表的なC
lustal Alignmentを示す。

【図５２】図52は、トランスフェリンレセプター3' UTRの領域2の代表的な
ドーム状構造概要を示す。

【図５３】図53は、トランスフェリンレセプター3' UTRの領域2の代表的な
構造図を示す。

【図５４】図54は、トランスフェリンレセプター3' UTRの領域3の代表的なA
lign Hits 概要を示す。

【図５５】図55は、トランスフェリンレセプター3' UTRの領域3の代表的なC
lustal Alignmentを示す。

【図５６】図56は、トランスフェリンレセプター3' UTRの領域3の代表的な
ドーム状構造概要を示す。

【図５７】図57は、トランスフェリンレセプター3' UTRの領域3の代表的な
構造図を示す。

【図５８】図58は、トランスフェリンレセプター3' UTRの領域4の代表的なA
lign Hits 概要を示す。

【図５９】図59は、トランスフェリンレセプター3' UTRの領域4の代表的なC
lustal Alignmentを示す。

【図６０】図60は、トランスフェリンレセプター3' UTRの領域4の代表的な
ドーム状構造概要を示す。

【図６１】図61は、トランスフェリンレセプター3' UTRの領域4の代表的な
構造図を示す。

【図６２】図62は、トランスフェリンレセプター3' UTRの領域5の代表的なA
lign Hits 概要を示す。

【図６３】図63は、トランスフェリンレセプター3' UTRの領域5の代表的なC
lustal Alignmentを示す。

【図６４】図64は、トランスフェリンレセプター3' UTRの領域5の代表的な
ドーム状構造概要を示す。

【図６５】図65は、トランスフェリンレセプター3' UTRの領域5の代表的な
構造図を示す。

【図６６】図66は、オルニチンデカルボキシラーゼ3' UTRの領域1の代表的
なmass-spec構造プローブ解析を示す。

【図６７】図67は、オルニチンデカルボキシラーゼ3' UTRの領域1の代表的
なClustal Alignmentを示す。

【図６８】図68は、オルニチンデカルボキシラーゼ3' UTRの代表的なHoverg
en系統樹を示す。

【図６９】図69は、脊椎動物のオルニチンデカルボキシラーゼ3' UTRの代表
的なHovergen系統樹を示す。

【図７０】図70は、オルニチンデカルボキシラーゼ3' UTRの代表的なAlign
Hits 概要を示す。

【図７１】図71は、オルニチンデカルボキシラーゼ3' UTRの領域1の代表的
な逆相補マトリクスを示す。

【図７２】図72は、オルニチンデカルボキシラーゼ3' UTRの領域1の代表的
なドーム状構造概要を示す。

【図７３】図73は、オルニチンデカルボキシラーゼ3' UTRの領域1の代表的
な構造図を示す。

【図７４】図74は、オルニチンデカルボキシラーゼ3' UTRの領域2の代表的
なClustal Alignmentを示す。

【図７５】図75は、オルニチンデカルボキシラーゼ3' UTRの領域2の代表的
なドーム状構造概要を示す。

【図７６】図76は、オルニチンデカルボキシラーゼ3' UTRの領域2の代表的
な構造図を示す。

【図７７】図77は、インターロイキン-2（IL-2）の代表的なHovergen系統樹
を示す。

【図７８】図78は、IL-2 3' UTRの代表的なAlign Hits 概要を示す。

【図７９】図79は、IL-2 3' UTRの領域1の代表的なClustal Alignmentを示
す。

【図８０】図80は、IL-2 3' UTRの領域1の代表的なドーム状構造概要を示す
。

【図８１】図81は、IL-2 3' UTRの領域1の代表的な構造図を示す。

【図８２】図82は、IL-2 3' UTRの領域2の代表的なClustal Alignmentを示
す。

【図８３】図83は、IL-2 3' UTRの領域2の代表的なドーム状構造概要を示す
。

【図８４】図84は、IL-2 3' UTRの領域2の代表的な構造図を示す。

【図８５】図85は、IL-2 3' UTRの代表的なAlign Hits 概要を示す。

【図８６】図86は、IL-2 3' UTRの領域3の代表的なClustal Alignmentを示
す。

【図８７】図87は、IL-2 3' UTRの領域3の代表的なドーム状構造概要を示す
。

【図８８】図88は、IL-2 3' UTRの領域3の代表的な構造図を示す。

【図８９】図89は、インターロイキン-4（IL-4）の代表的なHovergen系統樹
を示す。

【図９０】図90は、IL-4 5' UTRの代表的なAlign Hits 概要を示す。

【図９１】図91は、IL-4 5' UTRの代表的なClustal Alignmentを示す。

【図９２】図92は、IL-4 5' UTRの代表的なドーム状構造概要を示す。

【図９３】図93は、IL-4 5' UTRの代表的な構造図を示す。

【図９４】図94は、IL-4 3' UTRの代表的なAlign Hits 概要を示す。

【図９５】図95は、IL-4 3' UTRの代表的なClustal Alignmentを示す。

【図９６】図96は、IL-4 3' UTRの代表的なドーム状構造概要を示す。

【図９７】図97は、IL-4 3' UTRの代表的な構造図を示す。

───────────────────────────────────────────────────── フロントページの続き (81)指定国ＥＰ(ＡＴ，ＢＥ，ＣＨ，ＣＹ，ＤＥ，ＤＫ，ＥＳ，ＦＩ，ＦＲ，ＧＢ，ＧＲ，ＩＥ，ＩＴ，ＬＵ，ＭＣ，ＮＬ，ＰＴ，ＳＥ)，ＯＡ(ＢＦ，ＢＪ，ＣＦ，ＣＧ，ＣＩ，ＣＭ，ＧＡ，ＧＮ，ＧＷ，ＭＬ，ＭＲ，ＮＥ，ＳＮ，ＴＤ，ＴＧ)，ＡＰ(ＧＨ，ＧＭ，ＫＥ，ＬＳ，ＭＷ，ＳＤ，ＳＬ，ＳＺ，ＵＧ，ＺＷ)，ＥＡ(ＡＭ，ＡＺ，ＢＹ，ＫＧ，ＫＺ，ＭＤ，ＲＵ，ＴＪ，ＴＭ)，ＡＥ，ＡＬ，ＡＭ，ＡＴ，ＡＵ，ＡＺ，ＢＡ，ＢＢ，ＢＧ，ＢＲ，ＢＹ，ＣＡ，ＣＨ，ＣＮ，ＣＵ，ＣＺ，ＤＥ，ＤＫ，ＥＥ，ＥＳ，ＦＩ，ＧＢ，ＧＤ，ＧＥ，ＧＨ，ＧＭ，ＨＲ，ＨＵ，ＩＤ，ＩＬ，ＩＮ，ＩＳ，ＪＰ，ＫＥ，ＫＧ，ＫＰ，ＫＲ，ＫＺ，ＬＣ，ＬＫ，ＬＲ，ＬＳ，ＬＴ，ＬＵ，ＬＶ，ＭＤ，ＭＧ，ＭＫ，ＭＮ，ＭＷ，ＭＸ，ＮＯ，ＮＺ，ＰＬ，ＰＴ，ＲＯ，ＲＵ，ＳＤ，ＳＥ，ＳＧ，ＳＩ，ＳＫ，ＳＬ，ＴＪ，ＴＭ，ＴＲ，ＴＴ，ＵＡ，ＵＧ，ＵＳ，ＵＺ，ＶＮ，ＹＵ，ＺＡ，ＺＷ (72)発明者サンパス，ランガアメリカ合衆国カリフォルニア州92129，サンディエゴ，マニックス・ロード 12223 (72)発明者グリフィー，リチャードアメリカ合衆国カリフォルニア州92084，ビスタ，バースビー・ストリート 360 (72)発明者マクネイル，ジョンアメリカ合衆国カリフォルニア州92037，ラ・ホーラ，レタハイム・ウェイ 427 Ｆターム(参考） 4B024 AA01 AA03 AA07 AA11 AA12 CA01 CA11 CA12 DA05 DA11 DA12 HA11 4B063 QA13 QA18 QA19 QQ05 QQ06 QQ07 QQ10 QQ41 QQ42 QQ52 QQ53 QQ54 QR31 4C084 AA13 NA14 ZA011 ZA081 ZA361 ZB111 ZB212 ZB261 ZB332 ZB352 ZB372 ZC011 ZC412 ZC521 4C086 AA01 AA03 EA16 MA01 MA02 MA03 MA04 MA05 NA14 ZA01 ZA08 ZA36 ZB11 ZB21 ZB26 ZB33 ZB35 ZB37 ZC01 ZC41 ZC52

Claims

【特許請求の範囲】

【請求項１】標的核酸において分子相互作用部位を同定する方法であって
、以下の工程：前記標的核酸のヌクレオチド配列と様々な分類学的種由来の複数の核酸のヌク
レオチド配列とを比較すること；前記複数の核酸と前記標的核酸との間で保存されている少なくとも一つの配列
領域を同定すること；前記保存された領域が二次構造を有しているかどうか決定すること；そして二次構造を有する前記保存された領域について、前記二次構造を同定すること
；を含む、前記方法。
【請求項２】二次構造を有する前記保存された領域について、少なくとも
一つの構造モチーフを同定することをさらに含む、請求項１に記載の方法。
【請求項３】前記構造モチーフについて、1セットの記述子要素を構築す
ることをさらに含む、請求項２に記載の方法。
【請求項４】前記記述子要素に対応する二次構造を有する核酸をさらに同
定することをさらに含む、請求項３に記載の方法。
【請求項５】前記標的核酸が真核細胞中に存在する、請求項１に記載の方
法。
【請求項６】前記標的核酸が、mRNA、プレmRNA、tRNA、rRNAおよびsnRNA
からなる群から選択される、請求項５に記載の方法。
【請求項７】前記標的核酸が原核細胞中に存在する、請求項１に記載の方
法。
【請求項８】前記標的核酸がRNAである、請求項７に記載の方法。
【請求項９】前記標的核酸が細菌のものである、請求項７に記載の方法。
【請求項１０】前記標的核酸がウィルスのものである、請求項７に記載の
方法。
【請求項１１】前記標的核酸が寄生虫由来のものである、請求項７に記載
の方法。
【請求項１２】少なくともいくつかの核酸配列情報が、遺伝子データベー
スに由来する、請求項１に記載の方法。
【請求項１３】前記標的核酸の前記ヌクレオチド配列が複数の発現配列タ
グを組み立てることにより決定される、請求項１に記載の方法。
【請求項１４】前記標的核酸とパラログ核酸とを比較することをさらに含
む、請求項１に記載の方法。
【請求項１５】様々な分類学的種に由来する前記複数の核酸を、配列同一
性検索、オルトログ検索、もしくはこれらの組合せを行うことにより得る、請求
項１に記載の方法。
【請求項１６】様々な分類学的種に由来する前記複数の核酸を、配列同一
性検索を行い、そして仮想転写物を構築することにより得る、請求項１に記載の
方法。
【請求項１７】前記保存された領域が二次構造を有するかどうかの決定を
、自己相補性比較、並置、および共分散解析、二次構造予測、もしくはこれらの
組合せにより行う、請求項１に記載の方法。
【請求項１８】前記二次構造が、少なくとも一つの膨隆（bulge）、ルー
プ、ステム、ヘアピン、ノット（knot）、三重相互作用（triple interact）、
クローバー葉、またはヘリックスを含む、請求項１７に記載の方法。
【請求項１９】前記構造モチーフが、自己相補性比較、並置および共分散
解析、二次構造予測、もしくはこれらの組合せを行うことにより同定される、請
求項２に記載の方法。
【請求項２０】前記記述子要素のセットを記述子データベースを利用して
構築する、請求項３に記載の方法。
【請求項２１】前記記述子要素に対応する二次構造を有する前記その他の
核酸を、少なくとも一つのデータベースの検索、クラスター化および解析の実行
、オルトログについての検索、またはこれらの組合せにより同定する、請求項４
に記載の方法。
【請求項２２】請求項１に記載の方法により同定される分子相互作用部位
を含む、データベース。
【請求項２３】真核細胞分子相互作用部位を含有する、請求項２２のデー
タベース。
【請求項２４】ヒト分子相互作用部位を含有する、請求項２３に記載のデ
ータベース。
【請求項２５】原核細胞分子相互作用部位を含有する、請求項２２に記載
のデータベース。
【請求項２６】選択された生物のRNA中および少なくとも一つの追加の生
物のRNA中に存在する分子相互作用部位を含むオリゴヌクレオチドであって、前
記分子相互作用部位が、前記分子相互作用部位に結合する場合に前記選択された
生物中の前記RNAの発現を調節するような少なくとも一つの分子に対する結合部
位として機能する、前記オリゴヌクレオチド。
【請求項２７】原核細胞RNA中および少なくとも一つの追加の原核細胞RNA
中に存在する分子相互作用部位を含むオリゴヌクレオチドであって、前記分子相
互作用部位が、前記相互作用部位に結合する場合に前記原核細胞RNAの発現を調
節するような少なくとも一つの分子に対する結合部位として機能する、前記オリ
ゴヌクレオチド。
【請求項２８】前記分子相互作用部位が、真核細胞RNA中には存在しない
、請求項２７に記載のオリゴヌクレオチド。
【請求項２９】前記分子相互作用部位が、ヒトRNA中には存在しない、請
求項２７に記載のオリゴヌクレオチド。
【請求項３０】以下のもの：原核細胞RNA中および少なくとも一つの追加の原核細胞RNA中に存在する分子相
互作用部位を含むオリゴヌクレオチドであって、前記分子相互作用部位が、前記
分子相互作用部位と結合する場合に前記原核細胞RNAの発現を調節するような少
なくとも一つの分子に対する結合部位として機能する、前記オリゴヌクレオチド
；および医薬的な担体または希釈剤；を含む、医薬組成物。
【請求項３１】前記分子相互作用部位が真核細胞RNA中には存在しない、
請求項３０に記載の医薬組成物。
【請求項３２】前記分子相互作用部位がヒトRNA中には存在しない、請求
項３０に記載の医薬組成物。
【請求項３３】以下のもの：選択された生物のRNA中および少なくとも一つの追加の生物のRNA中に存在する
分子相互作用部位を含むオリゴヌクレオチドであって、前記分子相互作用部位が
、前記分子相互作用部位と結合する場合に前記選択された生物中の前記RNAの発
現を調節するような少なくとも一つの分子に対する結合部位として機能する、前
記オリゴヌクレオチド；および医薬的な担体または希釈剤；を含む、医薬組成物。
【請求項３４】以下のもの：原核細胞RNA中に存在するが、ほ乳類RNA中には存在しない分子相互作用部位を
含むオリゴヌクレオチド；および医薬的な担体または希釈剤；を含む、医薬組成物。