[go: up one dir, main page]

JP2006520463A - ポリマー集団を解析するための方法 - Google Patents

ポリマー集団を解析するための方法 Download PDF

Info

Publication number
JP2006520463A
JP2006520463A JP2006501112A JP2006501112A JP2006520463A JP 2006520463 A JP2006520463 A JP 2006520463A JP 2006501112 A JP2006501112 A JP 2006501112A JP 2006501112 A JP2006501112 A JP 2006501112A JP 2006520463 A JP2006520463 A JP 2006520463A
Authority
JP
Japan
Prior art keywords
profile
peak
polymer
mirror image
population
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006501112A
Other languages
English (en)
Other versions
JP2006520463A5 (ja
Inventor
ルドルフ ギルマンシン,
ケビン エー. フィリップス,
ジョナサン ラーソン,
Original Assignee
ユー.エス. ジェノミクス, インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ユー.エス. ジェノミクス, インコーポレイテッド filed Critical ユー.エス. ジェノミクス, インコーポレイテッド
Publication of JP2006520463A publication Critical patent/JP2006520463A/ja
Publication of JP2006520463A5 publication Critical patent/JP2006520463A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • G01N21/6428Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes"
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00277Apparatus
    • B01J2219/00497Features relating to the solid phase supports
    • B01J2219/005Beads
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00277Apparatus
    • B01J2219/00497Features relating to the solid phase supports
    • B01J2219/00527Sheets
    • B01J2219/00529DNA chips
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00277Apparatus
    • B01J2219/0054Means for coding or tagging the apparatus or the reagents
    • B01J2219/00572Chemical means
    • B01J2219/00574Chemical means radioactive
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00277Apparatus
    • B01J2219/0054Means for coding or tagging the apparatus or the reagents
    • B01J2219/00572Chemical means
    • B01J2219/00576Chemical means fluorophore
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00277Apparatus
    • B01J2219/0054Means for coding or tagging the apparatus or the reagents
    • B01J2219/00572Chemical means
    • B01J2219/00578Chemical means electrophoric
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00583Features relative to the processes being carried out
    • B01J2219/00603Making arrays on substantially continuous surfaces
    • B01J2219/00605Making arrays on substantially continuous surfaces the compounds being directly bound or immobilised to solid supports
    • B01J2219/00608DNA chips
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/0068Means for controlling the apparatus of the process
    • B01J2219/00702Processes involving means for analysing and characterising the products
    • B01J2219/00707Processes involving means for analysing and characterising the products separated from the reactor apparatus
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00718Type of compounds synthesised
    • B01J2219/0072Organic compounds
    • B01J2219/00722Nucleotides
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00718Type of compounds synthesised
    • B01J2219/0072Organic compounds
    • B01J2219/00725Peptides
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00718Type of compounds synthesised
    • B01J2219/0072Organic compounds
    • B01J2219/00731Saccharides
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/10Libraries containing peptides or polypeptides, or derivatives thereof

Landscapes

  • Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Optics & Photonics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Investigating Or Analysing Materials By The Use Of Chemical Reactions (AREA)

Abstract

本発明は、ポリマー解析データを処理するための方法およびアルゴリズムに関連する。より詳細には、そのデータは、集団データセットから個々のポリマーデータを整列、配向、識別するために解析される。本発明は、一般にポリマーの複雑な混合物を解析するための方法に関連する。これは、解析されるポリマー(例えば、核酸)の正確な配列マップの生成を特に容易にする。1つの局面において、本発明は、サンプルからポリマー強度データを解析するための方法を提供する。

Description

(発明の分野)
本発明は、一般にポリマーの複雑な混合物を解析するための方法に関連する。これは、解析されるポリマー(例えば、核酸)の正確な配列マップの生成を特に容易にする。
(発明の背景)
配列解析を含むポリマーの解析は、しばしばポリマー混合物の解析を包含する。これらの混合物は、同一のポリマーの複数のコピーを含有し得、またはそれらは異なるポリマー(サイズおよび/または配列の点で)の複数のコピーを含有し得る。前者の場合において、たとえサンプルがポリマーに関して均一であっても、ポリマーは通常、配向に反応しない方法において解析されるために、生成されるデータは、直接的に役に立たない。その結果として、各々のポリマーは、「前端から先に」または「後端から先に」のいずれかの配向において独立して解析される。ランダムに解析される個々のポリマーから生じるデータセットは、データの非配向性の性質に起因して重ね合わせられ得ない。
さらに、ポリマー解析は通常、同じポリマーの1つより多く(および多くの場合、数百または数千)のコピーの解析を必要とする。これは、単一のポリマーの非効率な標識化および最小限に標識されるプローブの非効率な検出に起因する。特に、標識計画が核酸プローブで核酸における標的の配列部位を標識することを含む場合、50%〜95%の標識化効率が一般的である。例えば、高い速度での単一の発蛍光団の検出は、平均して10〜90%の効率を有し、使用されるフルオロフォアの特性ならびに検出システムの励起スポットを通るプローブおよびポリマーの軌道に依存する。
したがって、ポリマーの複数のコピーの解析は、ポリマー中の全てのターゲットの配列部位についての情報を集計するために必要である。
したがって、サンプルが特定のポリマーの1つより多くのコピー(またはより複雑な状況においては、ポリマーの1つより多くのタイプ)を含有する場合、同一でありかつ均一に配向したポリマーから生成される強度プロファイルは、全ての他の強度プロファイルと見分けることが難しい。ランダムに配向される1つ以上のタイプのポリマーからの強度プロファイルの重ね合わせは、特に有用ではなく、あるものが個々のポリマーのみからのシグナルを解析させておくだけである。
したがって、不均一サンプルから個々のポリマーデータを識別する必要性がある。この例は、ポリマー配向を正確に評価して、ポリマーの配列マップを生成する必要性である。互いからポリマーを識別するための能力およびポリマーの配向を決定するための能力は、利用できる使用可能な配列データの量を増加させ、そして解析される必要があるポリマーの数を減少させる。これは、限られたポリマーの供給源(例えば、まれにしか転写しないmRNA種)のみが存在する場合、特に有用である。
(発明の要旨)
本発明は、ポリマーデータを処理するための方法およびアルゴリズムを提供する。その方法は、集団データセットからのポリマー特異的データおよび配向特異的データの同定を可能にする。
1つの局面において、本発明は、サンプルからポリマー強度データを解析するための方法を提供する。その方法は、サンプルに含まれる個々の標識されたポリマーから強度プロファイルを取得する工程、個々の標識されたポリマーから個々の強度プロファイルを、アラインメント基準点に関して整列させる工程、整列された個々の強度プロファイルを組み合わせて、サンプル集団プロファイルを生成する工程、サンプル集団プロファイルにおいてピークを選択して、ピークに寄与する個々の強度プロファイルを取得する工程、ピークに寄与する個々の強度プロファイルを組み合わせて、ピークプロファイルを生成する工程、およびサンプル集団プロファイルとピークプロファイルを比較する工程を、包含する。
1つの実施形態において、サンプルは、ポリマーの不均一混合物を含む。ポリマーの不均一混合物は、親ポリマーの異なるサイズのフラグメントを含み得る。ポリマーの不均一混合物は、異なる配列を有するポリマーを含み得る。
1つの実施形態において、プロファイルは、強度 対 長さプロファイルである。長さは、実施形態に依存して、外形の長さまたは実際の長さであり得る。
強度データは、蛍光強度データであり得、強度プロファイルは、蛍光強度プロファイルであり得るが、どちらもそのように限定されない。
1つの実施形態において、ポリマーは配列特異的プローブで標識される。さらに、ポリマーは、配列非特異的標識で標識され得る。1つの実施形態において、配列非特異的標識は、主鎖の標識である。
重要な実施形態において、その方法はコンピューター上で実行される。
1つの実施形態において、ポリマーは核酸(例えば、DNAまたはRNA)である。1つの実施形態において、DNAは、核ゲノムDNA、ミトコンドリアDNAまたはcDNAである。別の実施形態において、RNAはmRNAである。
1つの実施形態において、アラインメント基準点は、内部基準点である。別の実施形態において、アラインメント基準点は、分子基準点の中央である。さらに別の実施形態において、アラインメント基準点は、個々のポリマーに結合される配列特異的プローブである。さらに別の実施形態において、アラインメント基準点は、個々のポリマーに結合される配列非特異的プローブである。1つの実施形態において、アラインメント基準点は、分子基準点の中央である。別の実施形態において、分子基準点の中央は、個々のプロファイルの中心点である。
強度プロファイルは、流動中の個々のポリマー、または固体支持体に固定される個々のポリマーから取得され得る。代替として、強度プロファイルは、ゲルマトリックス中に埋め込まれた個々のポリマーから取得され得る。
1つの実施形態において、サンプル集団プロファイルは、累積集団プロファイルである。別の実施形態において、サンプル集団プロファイルは、平均集団プロファイルである。同様に、ピークプロファイルは、累積ピークプロファイルまたは平均ピークプロファイルであり得る。
1つの実施形態において、ピークはランダムに選択される。別の実施形態において、ピークは強度に基づいて選択される。さらに別の実施形態において、ピークは、集団プロファイルにおけるピークのミラーイメージピークの存在に基づいて選択される。
いくつかの実施形態において、サンプル中のポリマーは、個々の強度プロファイルを整列させるより前に、サイズによって分類される。
1つの実施形態において、サンプル集団プロファイルに似ているピークプロファイルは、非配向プロファイルを示す。
別の実施形態において、集団プロファイルからのピークのサブセットよりなるピークプロファイルは、推定配向性プロファイルを示す。1つの関連した実施形態において、その方法は、推定指向性プロファイルを反転させて、推定反転プロファイルを生成する工程、推定反転プロファイルと推定指向性プロファイルを組み合わせて、推定非指向性プロファイルを生成する工程、および集団プロファイルと推定非指向性プロファイルを比較する工程をさらに包含し、ここで、集団プロファイルと同一である推定非指向性プロファイルは、推定指向性プロファイルが、指向性プロファイルであり、推定反転プロファイルが反転プロファイルであり、かつ推定非指向性プロファイルが非指向性プロファイルであることを示す。
第2の関連する実施形態において、その方法は、アラインメント基準点が、分子基準点の中央である場合、ピークプロファイルにおける個々のピークが、集団プロファイルにおいて対応するミラーイメージピークを有するかどうかを決定する工程をさらに包含する。対応するミラーイメージの存在は、推定指向性プロファイルが指向性プロファイルであることを示し得る。
第3の関連する実施形態において、その方法は、アラインメント基準点が分子基準点の中央である場合、指向性ピークが、集団プロファイルにおいて対応するミラーイメージピークを有するかどうかを決定する工程をさらに包含する。この後者の方法は、ミラーイメージピークに寄与する個々の強度プロファイルを取得する工程、ミラーイメージピークに寄与する個々の強度プロファイルを組み合わせてミラーイメージピークプロファイルを生成する工程、必要に応じて集団プロファイルとミラーイメージピークプロファイルを比較する工程、必要に応じてミラーイメージピークがピークプロファイルのミラーイメージであるかどうかを決定する工程、およびミラーイメージピークプロファイルがピークプロファイルのミラーイメージである場合、必要に応じて、ミラーイメージピークプロファイルを反転させて、ピークプロファイルと組み合わせる工程をさらに包含し得る。
1つの実施形態において、ミラーイメージピークプロファイルは、累積ミラーイメージピークプロファイルである。別の実施形態において、ミラーイメージピークプロファイルは、平均ミラーイメージピークプロファイルである。
その方法は、指向性プロファイルを反転させる工程、反転プロファイルと指向性プロファイルを組み合わせて、非指向性プロファイルを生成する工程、およびサンプル集団プロファイルと非指向性プロファイルを比較する工程をさらに包含し得る。
その方法は、サンプル集団プロファイルからピークプロファイルを引く工程、サンプル集団プロファイルからミラーイメージピークプロファイルを引く工程、またはサンプル集団プロファイルからピークプロファイルおよびミラーイメージピークプロファイルを引く工程をさらに包含し得る。
その方法は、さらなるピークが、ピークプロファイルおよびミラーイメージピークプロファイルを引いた後に、サンプル集団プロファイルにおいて残るかどうかを決定する工程をさらに包含し得る。関連した実施形態において、さらなるピークの存在は、サンプルが異なるポリマーを含むことを示す。
1つの実施形態において、ピークは強度 対 長さプロファイルにおいて認識できる。別の実施形態において、ピークはビンカウント(bin counts)に対応する。
1つの実施形態において、ポリマーは完全に引き伸ばされるか、あるいは別の実施形態において、部分的に引き伸ばされる。さらに別の実施形態において、ポリマーは均一に引き伸ばされる。
本発明の各々の限定は、本発明の種々の実施形態を包含し得る。したがって、任意の1つの要素または要素の組み合わせを含む本発明の各々の限定が、本発明の各々の局面に含まれ得ることは、予測される。本発明は、以下の説明に記載され、または図面に示す成分の構成および配置の細部にその適用が制限されない。本発明は、他の実施形態が可能であり、そして種々の方法において実施または実行され得る。また、本明細書中で使用される専門語および用語法は、説明の目的のためであり、限定されるとみなすべきではない。本明細書中の「含む」、「包含する」、「有する」、「含有する」または「関連する」という用語の使用およびそのバリエーションは、その後に記載される項目およびその均等物、ならびにさらなる項目を包含することを意味する。
(発明の詳細な説明)
特に、本発明は、ポリマーの配列データを評価および操作するための方法を提供する。これらの方法は、サンプル中の個々のポリマーから引き出されるシグナルプロファイルを整列させ、配向させ、それによってシグナルプロファイルを識別するために使用される。
ポリマープロファイルを識別するための必要性は、一般に100%の効率でポリマー内の全ての所望のターゲット配列部位を標識および検出することは不可能である(すなわち、全てのターゲット部位が、全てのポリマーにおいて標識されるわけではない)という事実から部分的に派生する。これを補うために、同一のポリマーの複数のコピーが、通常、解析されて、その結果として生じるシグナルは、ポリマーに沿った全ての配列特異的部位を観測し、それによって全ての配列特異的部位を検出するために組み合わされる。
本明細書中で使用される場合、ポリマーを解析するということは、ポリマーの構造(例えば、ポリマーのサイズ、ポリマーの配列部位の順序、他のポリマーとの関連性、ポリマーの配列部位の同一性、またはサンプル中のポリマーの存在もしくは非存在)についての情報を取得することを意味する。これらのパラメーターは、一般に生物学的ポリマーにおいて相互関連するので、ポリマーの構造は、ポリマーの機能についての重要な情報を明らかにし得る。
いくつかの例において、サンプルは同じポリマーの複数のコピーを含有し得る。そのようなサンプルは、均一であると考えられる。均一サンプル中のポリマーは、長さおよび配列において同一である。しかし、たとえ、均一サンプルであろうと、2つのタイプのプロファイル:「直接」プロファイルおよび「反転」プロファイルを生じる。これは、全てではない場合は、ほとんどのポリマー解析システムは、配向に反応しないことに起因する。その結果として、各々のポリマーは、「前端が最初」の指向性(「直接」プロファイルを生じる)または「後端が最初」の指向性(「反転」プロファイルを生じる)において解析される同等の確率を有する。各々のポリマーからのプロファイルが組み合わされる場合、その結果として生じるプロファイル(本明細書中で、「個々のポリマープロファイル」と区別するために「集団プロファイル」と称される)は、直接プロファイルおよび反転プロファイルからのシグナル(またはピーク)を含有する。本発明より前に、反転プロファイルのシグナルと直接プロファイルのシグナルを見分けることは難しかった。
他の例において、サンプルは多数のポリマーの複数のコピーを含有し得、その多数のポリマーの各々は異なる。本明細書中に使用される場合、異なるポリマーは、長さおよび/または配列の点で異なるポリマーである。例としては、より大きなポリマーのフラグメント(例えば、親ポリマーの制限フラグメントまたは剪断されたゲノムDNA、および細胞または組織中に発現されるmRNA転写体)が挙げられる。しかしながら、「異なるポリマー」は、それらが配列に関して100%同一ではない場合、いくらかの配列同一性を共有し得る。不均一サンプルの場合において、組み合わされた集団プロファイルは、1つより多くのポリマータイプからの直接プロファイルおよび反転プロファイルを含有するので、より複雑である。
本発明は、均一サンプルおよび不均一サンプルからのシグナルおよびプロファイルを操作ならびに処理するための方法を提供する。その最も簡単な形態において、それは均一サンプル中の直接プロファイルと反転プロファイルを見分けるための方法を提供する。それはまた、不均一サンプル中の所定のポリマーについて、このことを達成し得る。より複雑な形態において、互いから異なるポリマーを識別し、ならびに各々のポリマータイプについての直接プロファイルおよび反転プロファイルを見分ける。
解析されているポリマー(時々、本明細書中で「ターゲット」ポリマーと称されている)は、自由に流動し得るか、固体支持体に固定され得る。固定された形態において、ポリマーは、1つまたは複数の付着点で固体支持体に付着される。固体支持体の性質は、本発明を限定しない。固体支持体は、任意の表面であり得、この表面に、ポリマーはその完全性を損なわずに付着され得る。種々のタイプの固体支持体が、利用可能であり(マイクロチップ、ビーズなどを含む)、その分野は馴染み深い。固体支持体にポリマーを固定させた場合、ポリマーは静止する。この後者の実施形態において、ポリマー解析システムの呼びかけステーションおよび/または検出ステーションは、ポリマーに対して移動し得る。流動形態において、ポリマーは、好ましくはポリマー解析システム内の呼びかけステーションを通して、移動し得る。ポリマーはまた、それ自体が移動可能である支持体(例えば、自由流動ビーズ)に付着され得る。
別の固定化アプローチは、ゲルマトリックス中に閉じ込められるポリマーの使用を含む。ポリマーの引き伸ばしは、例えば、電界の使用によって達成される。
ポリマーの指向性標識(例えば、末端特異的標識)の非存在下において、ポリマー解析システムは、指向性に反応しないので、ポリマーが解析される方向を決定することは難しい。その結果として、それらが自由流体において提供されるか固定形態において提供されるかにかかわらず、ポリマーはランダムに指向し、およそ同数で前端が最初および後端が最初に解析されると予想される。
本明細書中に提供される方法は、一般的にいくつかのデータ処理工程を包含する。これらは、個々のポリマープロファイルの整列、集団プロファイルを形成するための個々のプロファイルのコンパイル、集団プロファイルからの個々のシグナル(またはピーク)の選択、選択されたシグナル(またはピーク)に寄与する個々のプロファイルの抽出、「ピークプロファイル」を得るためのこれらの後者の個々のプロファイルのコンパイル、および集団プロファイルとピークプロファイルの比較を包含する。この後者の比較は、ポリマーのサブセットの指向性の性質に関する情報を与え、集団プロファイルにおけるピークを生じる。例えば、このポリマーのサブセットは、それ自体が直接および反転ポリマープロファイルを含み得る。さらに好ましくは、このポリマーのサブセットは、1つの方向(例えば、全てが前端が最初または全てが後端が最初)に配向したポリマーを含む。これらの工程の各々は、より詳細に以下に議論される。
解析されるポリマーは、配列特異的方法において標識されなければならない。本発明の方法によって後で評価されるシグナル(またはピーク)を生じるものは、この標識である。ポリマーは一般に、ポリマー解析システムで解析するより前に標識される。ポリマー標識は以下に、より詳細に議論される。配列特異的標識は、当該分野における多くの公知の方法において達成され得る。重要な実施形態において、ポリマーは、配列特異的方法においてポリマーに結合する結合パートナーを使用して標識される。核酸ポリマーにとっての配列特異的結合パートナーの最も一般的な例は、核酸プローブである。本明細書中に使用される場合、核酸プローブは、その独自の配列に相補的である部位で解析されるポリマー(すなわち、ターゲットポリマー)にハイブリダイズする核酸である。「プローブ」および「タグ」および「単位特異的マーカー」という用語は、本明細書中で、交換可能に使用される。核酸プローブの性質は、本明細書中に、より詳細に記載される。簡潔に言うと、それは任意の長さおよび任意の配列のものであり得る。長さがより短いほど、より大きな解像度が達成され得る。普通、核酸プローブは、真の相補体の間でのハイブリダイゼーションを促進する条件下でターゲットポリマーに接触されるべきである(すなわち、プローブの各々の塩基は、連続および隣接する方法においてターゲットポリマー上のその相補的な塩基に結合される)。これらの条件は、本明細書中にストリンジェントな条件と言及されている。当該分野は、そのような条件に馴染み深い。(例えば、Maniatisら、Molecular Cloning:A Laboratory Manual、Cold Spring Harbor(1982)を参照のこと。)しかしながら、本方法は、ストリンジェントな条件下でのハイブリダイゼーションに限定されず、プローブ塩基の100%未満がターゲットポリマー塩基に結合される条件下で行われ得る。
ポリマーはさらに、以下にまたより詳細に議論されるように、配列非特異的方法において標識され得る。いくつかの例において、非特異的標識は、ポリマーの長さに沿って均一に、分配される。非特異的標識の例は、ターゲット核酸ポリマーの骨格に結合する染色である。好ましくは、配列非特異的標識は、その長さに沿ってポリマーを均一に標識し、それによって、いかなる強度「ピーク」も引き起こさない。強度ピークは、本明細書中に記載されている配列特異的標識から単独で引き出すべきである。
標識されるポリマーは、ポリマー解析システムを使用して解析される。これらのシステムは、ポリマー(またはそれに結合するプローブ)からのシグナルを刺激するため、およびその結果として生じるシグナルを検出するためにそれぞれに役立つ呼びかけステーションおよび検出ステーションを含む。好ましくは、ポリマー解析システムは、単一のポリマーを解析し得る。なおより好ましくは、それらは直線的にポリマーを解析し、その結果、直線単一ポリマー解析システムと言及される。そのようなシステムは、以下に、より詳細に議論されている。典型的なポリマー解析システムは、2002年3月12日に発行された米国特許第6,355,420B1号に記載されているGeneEngineであり、その全内容は、本明細書中に参考として援用される。
ポリマー解析システムは、ポリマーの一端から出発し、そして反対端の方へポリマーの長さに沿って移動して、個々のポリマーを解析する。そのプロセスにおいて、シグナルは、ポリマー上でのそれらの位置または配置の関数として記録される。与えられたポリマーについてのシグナルの合計は、次いでポリマー上での位置の関数としてプロットされる。このプロットは、本明細書中にプロファイルと言及されている。プロファイルが、ポリマーの単一のコピーの解析から引き出される場合、本明細書中に「個々のプロファイル」と言及される。代わりに、プロファイルが多数の個々のプロファイルの組み合わせ(または寄せ集め)に由来する場合、それは「集団プロファイル」と称される。以下に議論されるように、集団プロファイルは、配向されても非配向であってもよい。本明細書中で使用される場合、プロファイルはまた、ポリマーの長さに沿って標識強度を反映するので、「強度プロファイル」と称されている。標識は、以下に、より詳細に議論されている。
いったん、取得すると、個々のポリマープロファイルは、それらの重ね合わせを容易にするために、互いに関連して整列される。整列は、アラインメント基準点を使用して行われる。アラインメント基準点は、与えられたタイプの各々の解析されたポリマーに存在する同一の部位である。アラインメント基準点は、ポリマーの内部であり得(すなわち、内部アラインメント基準点)、またはそれはポリマーの末端であり得る(すなわち、末端アラインメント基準点)。それは、ポリマー次第で、配列に依存しても、配列に依存しなくてもよい。さらにそれは、内因的に検出可能であり得るか、またはそれは、例えば、外部のプローブの使用によって検出され得る。したがって、基準点は、個々のポリマーへの配列特異的プローブまたは配列非特異的プローブの結合によって可視化され得る。
以下に、より詳細に議論されるように、本方法は2つの基準点を使用する。1つの基準点は、集団プロファイルを生成するために、個々のプロファイルを整列させるために使用され(すなわち、アラインメント基準点)、もう一方の基準点は、個々のプロファイルの配向を決定するために使用される(すなわち、配向基準点)。配向基準点は、好ましくは内部基準点である。さらに、好ましくは、それは分子の中央(ポリマーの中央)である。分子の中央は、例えば、長さに比例した染料または染色液でポリマーの長さに沿ってポリマーを均一に標識し、強度プロファイルの長さに基づいてポリマーの長さを見積もり、それによって、分子の中心点または中央を決定することによって決定され得る。分子の中央は、標的ポリマーの引き伸ばしている特性にかかわらず、適切な基準点である(すなわち、分子の中央は、たとえ標的ポリマーが均一におよび完全に引き延ばされないとしても、なお決定され得る)。例えば、ポリマーの1つまたは両方の末端は、これらの領域において直線的なポリマー解析を妨げる程度に小型化されることが可能である。それにもかかわらず、ポリマーが長さに比例した標識で標識される場合、これらの小型化された範囲は、分子の中央を決定するのに、なお有用である。(すなわち、これらの小型化された範囲からのシグナルは、さらにその中のポリマーの長さを示し、ポリマーの中心点を決定するために、ポリマーのより直線的な部分と共に使用され得る)。
基準点はまた、複製基点、転写プロモーター、セントロメア、高度な反復配列などであり得る。
本方法は、好ましくは、達成され得る配列情報の量を最大化するために引き伸ばされた直線的なポリマーを使用する。標的ポリマーの非直線的および/またはコイル状の領域は、配列を決定するのにそれほど有用ではない。ポリマーはその長さに沿って均一に引き伸ばされ得るか、またはそれはその長さに沿った他の領域より、より多くまたは少なく引き伸ばされた領域を含有し得る。いずれの場合においても、ポリマーおよび/またはポリマー内の領域は、最大限に引き伸ばされ得る。ポリマーはまた、最大限に引き伸ばされるより、小さくなり得る。このように、最大限の引き伸ばしが100%引き伸ばされると称される場合(最大限の引き伸ばしの定義については以下参照のこと)、ポリマーはまた、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%、または少なくとも99%引き伸ばされ得る。重要な実施形態において、ポリマーは均一であるが、最大限に引き伸ばされない。実施例に記載されているように、引き伸ばされて小型化された領域を有するポリマーは、さらに有用である。
本明細書はポリマーの長さ(例えば、図1および2のx軸上)について言及しているが、本発明は、同様にポリマーの外形の長さLcに関係している。強度 対 長さプロット(およびそのようなプロファイル)に示されるようなポリマーの長さは、流動の方向または他の引き伸ばしている力におけるポリマーの投影を表す。実際のポリマーの長さは、ポリマーの骨格の長さまたは外形の長さ(Lc)である(すなわち、ヌクレオチドごとの長さ×ヌクレオチドの数であり、ポリマーのコンホメーションに依存しない)。B−形態のDNAについて、ヌクレオチドごとの長さは、0.34nmである。ポリマーが最大限に引き伸ばされた(すなわち、100%引き伸ばされた)場合、測定された長さおよび外形の長さは、等しい。このように、外形の長さに対する測定された長さの割合は、ポリマーの引き伸ばしの程度を示す。
配列非特異的標識(例えば、挿入)は、DNAを広げることによって外形の長さを変える。しかしながら、Lcはこのような「増大した」DNAに対してさえ規定され得、さらに引き伸ばしの程度を決定するために使用され得る。伸び過ぎたDNAは、本質的に変性するので、回避するべきである。
いったん、整列されると、個々のプロファイルは、集団プロファイルを生成するために組み合わされ得る。本明細書中で使用される場合、個々のプロファイルを「組み合わせる」とは、整列され、おそらく重ね合わされたプロファイルが一緒に加えられる(すなわち、1つのプロファイルからの与えられた位置での強度値は、別のプロファイルにおける同じ位置での対応する強度値に加えられる)ことを意味する。集団プロファイルは、累積プロファイルであり得、ポリマーに沿った位置の関数として全ての強度値の合計を表すことを意味する。代替として、それは平均または標準化されたプロファイルであり得、ポリマーに沿った位置の関数として平均または標準化された強度値を表すことを意味する。平均または標準化プロファイルは、累積プロファイル上での強度値を寄与するプロファイルの数で割ることによって取得される。重要なことに、集団プロファイルは、同一および/または異なるポリマーからの個々のプロファイルから引き出し得、その両方は直接および反転プロファイルに寄与する。本明細書中で使用される場合、サンプル集団プロファイルは、サンプルから取得された全ての個々のプロファイルを組み合わせるプロファイルであり、従って、サンプル中の全ての標識されたポリマーからのシグナルを含有するはずである。
そのような解析からのデータは、単一のポリマーを解析することによって可能になるより、高いシグナル対ノイズ比を達成するために一般的に組み合わされる。さらに、個々のプロファイルを組み合わせることによって、ポリマー上での完全なパターンの配列特異的標的部位を生成する。個々のプロファイルは、標的部位のサブセットについてのシグナルを提供するのみであり得る。さらに、それらはまた、不正確な部位で結合するプローブ(すなわち、ミスマッチプローブ)を含む。これは核酸ポリマーへの核酸プローブの結合が、一般的に100%未満の効率および特異的であることに起因する(例えば、ハイブリダイゼーション効率は、50%〜95%の範囲であり得、ハイブリダイゼーション特異性は、2〜20の範囲であり得る)。ハイブリダイゼーション特異性は、不正確に標識された部位の割合に対する正確に標識された標的部位の割合の比である。さらに、全てのプローブが検出されるわけではない。例えば、それらの上に1つまたは少数の検出可能な標識を有するプローブは、ほとんど検出されない。高い割合での単一の発蛍光団の検出は、平均効率10〜90%を有し、使用される発蛍光団の特性ならびにポリマー解析システムの励起スポットを通るプローブおよびポリマーの軌道次第である。
集団プロファイルは一般に、標的ポリマー上の実際の配列特異的部位の数の2倍のシグナル(またはピーク)を含有する。これは、最小限での集団プロファイルは直接および反転の個々のプロファイルで作成されるためである。配列情報が所望(例えば、配列マップを生成するため)の場合、直接プロファイルと反転プロファイルとを互いから分けることが望ましい。集団プロファイルはまた、特定のポリマーにとっての識別子として使用され得、ポリマーのバーコードまたはフィンガープリントと称されている。好ましい実施形態において、バーコードまたはフィンガープリントは、指向性集団プロファイルである(すなわち、全ての寄与する個々のプロファイルが、前端が最初または後端が最初のいずれかで同じ方向に配向される集団プロファイル)。しかしながら、いくつかの場合において、たとえ非配向の形態であっても、集団プロファイルはまた、識別子として役立ち得る。
いったん、集団プロファイルが形成されると、プロファイルにおける個々のピークは、さらに解析される。配向された個々のプロファイルのサブセットから形成される個々のピークを選択することが望ましい。そのようなピークは、ランダムに選択され得るか、または特定のパラメーター(例えば、強度レベル)に基づいて選択され得る。例えば、いくつかの場合において、より低い(しかしそれでもバックグラウンドの上)強度ピークは、配向された個々のプロファイルのサブセットを表しやすい。いったん、そのようなピークが同定されると、ピークに寄与する個々のプロファイルは、データセットから抽出される。抽出された個々のプロファイルは、全て集団プロファイルから選択されたピークに同一であるピークを含むはずである。
従って、いくつかの例において、例えば(a)ピークプロファイルが、非対称で、サンプル集団プロファイルに比べてより少ない位置でのピークを有し、(b)直接および反転ピークプロファイルの組み合わせは、対称集団プロファイルに同一である場合に、指向性プロファイルに対応するピーク自体が同定され得る。これらの基準は、2つの配向における1つのポリマーを含む均一サンプルにとって有効である。
異なるポリマーの混合物の場合において、第1の基準は、同じままであるが(この場合においてプロファイルは非対称である必要がないが)、第2は、必ずしも満たされる必要はない。いったん、混合物が異なるポリマーのプロファイルに分けられると、これらのプロファイルの各々は、指向性プロファイルを抽出するために上記のように解析され得る。しかしながら、いくつかの場合において、異なるポリマーのプロファイルは、配向された形態においてすでに抽出され得る。これは、サンプルおよびプロファイルの複雑性に依存し、ならびに異なるポリマーの個々のピークの位置および障害に依存する。
本明細書中で使用さる場合、「同一のピーク」は、ポリマーの長さに沿って(および対応して、プロファイルの長さに沿って)同じように位置される2以上のピークを意味することは理解される。しかしながら、同一のピークは、プロファイルが個々のプロファイルであるか集団プロファイルであるかに依存して、それらの強度において変化し得る。さらに、個々のプロファイルの間での同一のピークの強度におけるバリエーションがある。
抽出された個々のプロファイルは、次いで、ピークプロファイルを生成するために組み合わされる(本明細書中に記載されたように)。したがって、複数の個々のプロファイルで作成されるので、このピークプロファイルは、集団プロファイルである。しかしながら、ピークプロファイルは、サンプルから取得される全てのプロファイルを表すサンプル集団プロファイルと比べて、個々のプロファイルのサブセットのみに由来する。ピークプロファイルは、次いで、サンプル集団プロファイルと比較される。サンプルの性質および解析の所望の度合いに依存して、ピークプロファイルとサンプル集団プロファイルの比較は、種々の形態および反復を取り得る。本明細書中に提供した説明は、サンプル集団プロファイルとシングルピークプロファイルの比較を記載しているが、複数のピークプロファイルおよび可能性のある全てのピークプロファイルとの比較はまた、方法の連続または同時の反復によって実行され得ることが理解されるべきである。当業者に明らかなように、そのようなデータ操作は、コンピューターを使用して行われ得る。
ピークプロファイルが、サンプル集団プロファイルに似ている場合、これは、ピークプロファイルが両方の配向において個々のプロファイルから引き出され得ることを示す(すなわち、それは非指向性プロファイルである)。本明細書中で使用される場合、集団プロファイルに「似ている」ピークプロファイルは、集団プロファイルに存在するピークからなる。上記で述べたように、それらの強度にかかわらず、同一のピークはポリマーに沿った同じ位置で存在するピークである。
しかしながら、ピークプロファイルが、サンプル集団プロファイルに存在するピークのサブセットのみからなる場合、このことは、ピークプロファイルが配向された個々のプロファイルから引き出し得ることを示唆する。必要な場合、これは多くの方法において組み合わせられ得る。重要な実施形態において、これは、ピークプロファイルを反転させ、非指向性ピークプロファイルを生成するために直接および反転ピークプロファイルを組み合わせて、サンプル集団プロファイルと非指向性ピークプロファイルを比較することによって確認される。サンプル集団プロファイルに全て存在するピークからなる非指向性ピークプロファイルは、最初に選択されたピークプロファイルおよび個々のプロファイルの配向の性質、ならびにそれに対して生じるポリマーを確認する。非指向性集団プロファイルが、サンプル集団プロファイルに同一である場合、これはさらに、サンプルが均一であることを示し得る。非指向性ピークプロファイルが、集団プロファイルに同一である場合、これらの2つのプロファイルは、同様に置かれたピークからなる。
本発明によるポリマーを配向させることは、上記のように1段階または2段階のプロセスを使用して行われ得る。2段階のプロセスが使用される場合、配向されることが明らかであるピークプロファイルは、それらの配向の性質が、このプロセスにおける第2段階によって確認されるままであるので、「推定」指向性ピークプロファイルと称されている。
推定指向性ピークプロファイルの配向の性質を確認するための別の方法は、ピークプロファイルに存在する個々のピークが、アラインメント基準点が分子基準点の中央である場合、集団プロファイルにおいて対応するミラーイメージを有するかどうかを決定することである。本明細書中で使用される場合、ミラーイメージピークとは、分子基準点の中央に対して遠位に存在し、分子基準点の中央からの距離が、この分子の中央と問題のピークのとの間の距離に同一であるピークである。例えば、分子基準点の中央の左に20ミクロンのところにあるピークを考える。そのミラーイメージは、分子基準点の中央の右に20ミクロンのところにある。
推定指向性ピークプロファイルの配向の性質を確認するためのさらに別の方法は、アラインメント基準点が分子基準点の中央である場合、推定指向性ピークが、サンプル集団プロファイルにおいて対応するミラーイメージピークを有するかどうかを決定することを包含する。ミラーイメージピークは、元の選択されたピークと同様に処理され得る。例えば、ミラーイメージピークに寄与する個々のプロファイルは、集団データセットから抽出され得、その後、本明細書中に記載されているように組み合わされ、ミラーイメージピークプロファイルを生成する。ミラーイメージピークプロファイルは次いで、プロファイルが互いに似ているか同一であるかを決定するために集団プロファイルと比較され得る。ミラーイメージピークプロファイルはまた、反転ピークプロファイルと比較され得る。これらの後者のプロファイルが同一である場合、ピークプロファイルが配向される。
本明細書中で記載されるように、本方法は強度 対 ポリマー長さプロットに存在するピークを選択する。これは、特に実施例および対応する図がそのようなピークを示すので、解析を実例することに意図される。しかしながら、特に、数百または数千、または数百万のポリマーのサンプルが、解析される場合、個々のピークは実験的に明白であり得ない。したがって、本方法は、観測可能および識別可能なピークの使用に必ずしも限定されない。むしろ、ビンカウントを使用して行われ得る。本明細書中で使用される場合、ビンカウントは検出システムが解析されるポリマーからのシグナルを得る時間の周期である。一例として、ビンカウントは、1マイクロ秒の持続時間であり得、1000個の連続したビンカウントは、1つの個々のポリマーからの隣接する強度データを含有し得る。従って、その各々の連続したビンカウントは、ポリマーの長さに沿った位置に対応する。このように、観測可能なピークを使用するよりむしろ、本方法は、1つ以上のビンカウントのために、ビンカウント(すなわち、シグナルの数(例えば、光量子数))を使用して行われ得る。したがって、本明細書で使用される場合、「ピーク」という用語は、強度 対 長さプロットならびに1つ以上のビンカウントにおけるビンカウント上での強度における観測可能および識別可能な増加を包含することを意味する。いくつかの例において、1つまたは2つ、3つ、4つ、5つまたはそれ以上の連続したビンカウントに分かれるピークはシグナル(すなわち、ビンカウント)によって規定され得る。
本明細書中で提供された方法は、サイズによってポリマーを区別するために使用され得ることは理解される。しかしながら、いくつかの実施形態において、整列されるより前にサイズに基づいてポリマーを区別することが好まれ得る。これは、強度 対 長さ特性によって、ポリマー(および/またはそれらの対応するデータセット)を分類することによって行われ得る。
本発明は、さらなるデータ処理を提供する。1つの実施形態において、異なるポリマーからのシグナルを区別するために、サンプル集団プロファイルからの同一および配向ポリマーに由来するシグナルを除去することが所望され得る。この方法において、サンプル集団プロファイルの複雑性は、除々に減少され得、および/またはサンプルの複雑性が決定され得る。本明細書中で使用される場合、サンプルの複雑性とは、サンプルに含まれる異なるポリマーのタイプの数をいう。したがって、各々のポリマーのいかに多くのコピーがサンプルに存在するかにかかわらず、100種の異なるポリマータイプを含むサンプルは、2種の異なるポリマーを含むサンプルより複雑である。
個々のプロファイルまたは個々のプロファイルのサブセット(例えば、指向性ピークプロファイル)は、サンプル集団プロファイルから引かれ得る。同様に、反転ピークプロファイルはまた、与えられたポリマーから全てのシグナルを効率的に取り除くために、サンプル集団プロファイルから引かれ得る。この方法において、与えられたポリマーからのシグナルは、集団プロファイルから取り除かれ、それによって複雑性をより少なく、そしてより低い強度のピークおよび/またはプロファイルを観測することを可能にする可能性がある。当業者にとって明らかであるように、集団プロファイルからの指向性および反転ピークプロファイルの除去が、ピークを欠く集団プロファイルを生じる場合、これは、集団が1つの特定のポリマーに関して均一であったことを示す。他方では、引いた後にさらなるピークが残る場合、これは、サンプル中に存在するポリマーが1つより多いことを示す。
互いからのプロファイルの除去は、プロファイルが同じ形態である場合(すなわち、両方のプロファイルが累積プロファイルである場合、または両方のプロファイルが標準化もしくは平均プロファイルである場合)のみ、達成され得ることは理解される。
本明細書中で使用される「ポリマー」は個々の単位の直線的な骨格を有する化合物であり、それはリンケージによって一緒に連結される。いくつかの場合において、ポリマーの骨格は、分岐され得る。好ましくは、骨格は分岐せず、直線状である。「骨格」という用語は、ポリマー化学の分野におけるその通常の意味を与えられる。ポリマーは、骨格の組成が不均一であり得、それによって、ポリマー単位の任意の可能な組み合わせが一緒に連結される(例えば、ペプチド核酸(核酸に連結されたアミノ酸を有し、向上された安定性を有する))。1つの実施形態において、ポリマーは、例えば、核酸、ポリペプチド、多糖類または炭水化物である。最も好ましい実施形態において、ポリマーは核酸またはポリペプチドである。本明細書中で使用されるポリペプチドは、連結されたアミノ酸からなる生体高分子である。
ポリマーは、複数の個々の単位から構成される。本明細書中で使用される「個々の単位」は、ポリマーを形成するように他の構築ブロックまたはモノマーに直接または間接的に連結され得る構築ブロックまたはモノマーである。ポリマーは好ましくは、少なくとも2つの異なる連結された単位のポリマーである。少なくとも2つの異なる連結された単位は、異なるシグナルを生成するために生成し得、または標識され得る。
ポリマーならびにポリマーに結合するプローブは、核酸であり得る。「核酸」という用語は、複数のヌクレオチド(すなわち、交換可能な有機塩基に連結される糖を含む分子(例えば、リボースまたはデオキシリボース)で、それは置換されたピリミジン(例えば、シトシン(C)、チミジン(T)もしくはウラシル(U))または置換されたプリン(例えば、アデニン(A)またはグアニン(G)のいずれかである))を意味するために本明細書中で使用される。本明細書中で使用される場合、その用語は、オリゴリボヌクレオチドならびにオリゴデオキシリボヌクレオチドと称される。
核酸は、存在する核酸源(例えば、ゲノムまたはcDNA)から、または合成方法によって(例えば、核酸合成によって生産される)取得され得る。核酸は、限定されないが、DNAおよびRNAであり得る。重要な実施形態において、解析されているポリマーはDNAまたはRNAである。DNAは、ゲノムDNA(例えば、核DNAまたはミトコンドリアDNA)であり得る。DNAはまた、cDNAであり得る。RNAは、mRNAまたはrRNAであり得るが、そのように限定されない。解析される核酸ポリマーは、いくつかの実施形態において解析するより前にインビトロで増幅され得るが、他の核酸はインビトロで増幅されない。
核酸の種々の改変は、本発明によって包含される。限定されないが、これらは通常、核酸ポリマーを配列決定するために使用される核酸プローブに適用される。これらの改変は、以下に記載されている。
核酸はまた、ポリヌクレオシド(すなわち、リン酸を引いたポリヌクレオチド)および任意の他の有機塩基を含有するポリマーを含む。核酸は、他の天然ではなく生じる置換型プリンおよびピリミジン(例えば、C−5プロピン改変塩基(Wagnerら、Nature Biotechnology 14:840−844、1996))を含み得る。プリンならびにピリミジンは、アデニン、シトシン、グアニン、チミジン、5−メチルシトシン、2−アミノプリン、2−アミノ−6−クロロプリン、2,6−ジアミノプリン、ヒポキサンチン、2−チオウラシル、偽イソシトシン、および他の天然ならびに天然ではなく生じる核酸塩基、ならびに置換型および非置換型の芳香族部分に限定されないが、これらを含む。他のそのような改変は、当業者に公知である。
核酸はまた、置換または改変(例えば、塩基および/または糖部分における)を包含し得る。例えば、それらは骨格の糖を有する核酸を含み、これらの糖は、3’位でのヒドロキシル基以外および5’位でのリン酸基以外の低分子有機基に共有結合される。このように、改変された核酸は、2’−O−アルキル化リボース基を含有し得る。さらに、改変された核酸は、糖(例えば、リボースの代わりにアラビノース)を含有し得る。
核酸は、骨格組成物が不均一であり得、それによって、一緒に連結されるポリマー単位の任意の可能な組み合わせを含有する(例えば、ペプチド核酸(核酸塩基を有するアミノ酸骨格を有し、それは本明細書中により詳細に議論される))。いくつかの実施形態において、核酸は骨格組成物が均一である。
ポリマーの連結される単位に関して、本明細書中で使用される場合、「連結」または「リンケージ」は、2つの実体が、物理化学的手法によって互いに結合されることを意味する。当業者に公知である任意のリンケージは、共有結合性または非共有結合性を包含する。特定のポリマーの個々の単位に結合する通常に天然に見出される天然のリンケージが、最も一般的である。天然のリンケージとしては、例えば、アミド、エステルおよびチオエステルリンケージが挙げられる。しかしながら、ポリマーおよび/またはプローブの個々の単位は、合成もしくは改変されたリンケージによって連結され得る。共有結合によって単位が連結されるポリマーは、最も一般的であるが、また、水素結合単位なども含み得る。
強度データは、プローブが結合しているポリマーを解析することによって取得され得る。これらのプローブは、好ましくは、配列特異的である。核酸との関連で使用される場合、「配列特異的」は、プローブが、ヌクレオチドまたはその誘導体の特定の直線的な整列を認識することを意味する。類似の定義が、核酸でないポリマーに適用される。好ましい実施形態において、直線的な整列は、標的核酸上での対応する隣接する相補的なヌクレオチドに各々が結合する隣接するヌクレオチドまたはその誘導体を含む。しかしながら、いくつかの実施形態において、標的中に対応する相補的な残基を有さない1つ、2つ、またはそれより多くのヌクレオチドがあり得るので、配列は隣接しないかもしれない。
構造特異性または配列特異性を有する核酸を認識し得る任意の核酸アナログが、ポリマー上の配列部位を標識するため、または基準点を同定するためにプローブとして使用され得ることは理解される。核酸ポリマーを含むほとんどの例において、プローブは少なくともポリマーとWatson−Crick結合を形成する。他の例において、プローブは核酸ポリマーとHoogsteen結合を形成し得、それによって、標的核酸ポリマーと三重鎖を形成する。Hoogsteen結合によって結合する核酸配列は、その標的の主要な溝に入り、そこに位置する塩基とハイブリダイズする。これらのHoogsteen結合プローブの例としては、主要でないならびに主要な核酸の溝を認識して結合する分子(例えば、抗生物質のいくつかの形態)が挙げられる。プローブは、ポリマーとWatson−Crick結合およびHoogsteen結合の両方を形成し得る。例えば、ビスPNAプローブは、Watson−Crick結合およびHoogsteen結合の両方で、核酸ポリマーに結合し得る。ポリマー配列を同定するために使用される場合、プローブが強い配列特異性を有することが好まれる。
プローブは、本明細書中で記載されているように、ペプチド核酸(PNA)およびその種々の形態、ロックされた核酸(LNA)、DNA、RNAまたは上記のもののコポリマー(例えば、DNA−LNAコポリマー)であり得る。
PNAは、グリシンアミノ窒素およびメチレンカルボニルリンカーによってヌクレオチド塩基に連結される2−アミノエチルグリシン残基でリン酸骨格が置き換えられているDNAアナログである。PNAは、Watson−Crick塩基対合によってDNA標的およびRNA標的の両方に結合し得、そうすることで、DNAに基づくプローブまたはRNAに基づくプローブを用いて可能であるよりも強いハイブリッドを形成する。
ペプチド核酸は、ペプチド結合によって結合されるモノマーから合成される(Nielsen,P.Eら、Peptide Nucleic Acids,Protocols and Applications,Norfolk:Horizon Scientific Press,p.1−19(1999))。それらは、標準的な固相ペプチド合成技術を用いて構築され得る。
PNA化学および合成は、PNA設計におけるアミノ酸およびポリペプチド配列の包含を可能にする。例えば、リジン残基は、PNA骨格中に正電荷を導入するために使用され得る。アミノ酸側鎖の改変に利用可能である全ての化学的アプローチは、直接的にPNAに適用可能である。
PNAは電荷が中性の骨格を有し、この特性は、DNAへのPNAの速いハイブリダイゼーション速度を導く(Nielsen,P.Eら、Peptide Nucleic Acids,Protocols and Applications,Norfolk:Horizon Scientific Press,p.1−19(1999))。ハイブリダイゼーション速度は、PNA構造(例えば、PNA骨格中)に正電荷を導入することによって、または正に荷電された側鎖を有するアミノ酸(例えば、リジン)の付加によって、さらに増加され得る。PNAは、DNA分子と安定したハイブリッドを形成し得る。そのようなハイブリッドの安定性は、本質的にその環境のイオン強度に依存しない(Orum,H.ら、BioTechniques 19(3):472−480(1995))、最も好ましくはPNAの、電荷されていない性質に起因する。これは、インビボまたはインビトロで使用される汎用性をPNAに提供する。しかしながら、正電荷を含むPNAのハイブリダイゼーションの速度は、イオン強度に依存し、それによって、塩の存在がより少なくなる。
いくつかのPNA設計のタイプが存在し、これらは一本鎖PNA(ssPNA),ビスPNA、偽相補的なPNA(pcPNA)を含む。
PNA/DNA複合体の構造は、特定のPNAおよびその配列に依存する。一本鎖PNA(ssPNA)は、好ましくは、反平行の配向において(すなわち、ssPNAのN末端がssDNAの3’末端と整列して)およびWatson−Crick対合でssDNAに結合する。PNAはまた、Hoogsteen塩基対合でDNAに結合し得、それによってdsDNAと三重鎖を形成する(Wittung,P.ら、Biochemistry 36:7973(1997))。
一本鎖PNAは、最も簡単なPNA分子である。このPNA形態は、核酸と相互作用して、Watson−Crick塩基対合によってハイブリッド二重鎖を形成する。この二重鎖は、dsDNAとは異なる空間構造およびdsDNAより高い安定性を有する(Nielsen,P.E.ら、Peptide Nucleic Acids,Protocols and Applications,Norfolk:Horizon Scientific Press,p.1−19(1999))。しかしながら、異なる濃度が使用される場合、および/または相補的DNA鎖の存在下において、PNA/DNA/PNAまたはPNA/DNA/DNA3重鎖もまた、形成され得る(Wittung,Pら、Biochemistry 36:7973(1997))。さらに、二重鎖または三重鎖の構造は、PNAの配列に依存する。チミンの豊富なホモピリミジンssPNAは、dsDNA標的とPNA/DNA/PNA三重鎖を形成し、ここで、1つのPNA鎖はWatson−Crick反平行対合に含まれ、もう一方は平行Hoogsteen対合に含まれる。シトシンの豊富なホモピリミジンssPNAは、好ましくは、PNA/DNA/DNA三重鎖を形成するdsDNAに、Hoogsteen対合によって結合する。ssPNA配列が混合される場合、それはdsDNA標的を侵害し、DNA鎖を置換し、Watson−Crick二重鎖を形成する。ポリプリンssPNAはまた、反対にされたHoogsteen対合によって、三重鎖PNA/DNA/PNAを形成する。
ビスPNAは、可撓性のリンカーで結合された2つの鎖を含む。1つの鎖は、古典的なWatson−Crick対合によってDNAとハイブリダイズするために設計され、2番目はHoogsteen対合でとハイブリダイズするために設計される。標的配列は、短くなり得る(例えば、8bp)が、全体で2倍(例えば、16bp)の塩基対合でハイブリッドを形成するので、ビスPNA/DNA複合体は、なお安定である。ビスPNA構造はさらに、それらの結合の特異性を増加させる。一例として、単一の塩基ミスマッチを有するプローブを用いた8bp部位への結合は、16bpよりむしろ全部で14bpを生じる。
いずれの特定の理論によっても束縛されることを意図しないが、ビスPNA分子は、そのHoogsteen鎖によって最初にその標的部位へ結合し、続いて、Watson−Crick鎖の侵害により、もとのDNA鎖の1つが置換された三重鎖を形成すると考えられる。第2工程を容易にするため、ハイブリダイゼーション反応が、DNAヘリックスを開く回数を増加させるために上昇させた温度(すなわち、局在化された溶解)で行われる。そのメカニズムは、DNAを開く瞬間に、ビスPNAのWatson−Crick鎖がヘリックスを侵害するために配置されるので、全体のハイブリダイゼーション速度を劇的に増加させる。
好ましくは、ビスPNAは、ホモピリミジン配列を有し、さらに好ましくは、シトシンは、グアノシンにHoogsteen対を形成するためにプロトン化される。したがって、チミンおよびシトシンを有するビスPNAは、6.5より低いpHだけでDNAに効率的にハイブリダイゼーションし得る。最初の制限(ホモピリミジン配列のみ)は、ビスPNA結合の様式に固有である。偽イソシトシン(J)は、幅広いpHの範囲にわたる、そのハイブリダイゼーションを可能にするためにシトシンの代わりにHoogsteen鎖において使用され得る(Kuhn,H.、J.Mol.Biol.286:1337−1345 (1999))。
ビスPNAは、核酸に結合する複数の型を有する(Hansen,G.I.ら、J.Mol.Biol.307(1):67−74(2001))。1つの異性体は、1つではなく2つのビスPNA分子を含む。それは、より高いビスPNA濃度で形成され、単一のビスPNA分子との複合体に再配列する傾向を有する。他の異性体は、標的DNA鎖の周りのリンカーの位置が異なる。全ての同定された異性体は、同じ結合部位/標的にさらに結合する。
偽相補的PNA(pcPNA)(Izvolsky,K.I.ら、Biochemistry 39:10908−10913(2000))は、dsDNAに付加された2つの一本鎖PNAを含む。1つのpcPNA鎖は、標的配列に相補的であるが、もう一方は、置換されたDNA鎖に相補的である。PNA/DNA二重鎖はより安定するので、置換されたDNAは、一般にdsDNA構造を復元しない。PNA/PNA二重鎖は、DNA/PNA二重鎖より安定であり、それらは相補的DNA配列に対して設計されるので、PNA成分は自己相補的である。従って、添加されたPNAは、むしろ互いにハイブリダイズする。pcPNA単位の自己ハイブリダイゼーションを防ぐために、改変された塩基が、アデニンの代わりに2,6−ジアミノプリン(D)およびチミンの代わりに2−チオウラシル(U)を含むそれらの合成に使用される。DならびにUは、さらにTおよびAのそれぞれとハイブリダイゼーションし得るが、それらの自己ハイブリダイゼーションは、立体的に予防される。
このPNA構築物はまた、標的配列の全てのヌクレオチドにつき2つの塩基対を送達する。従って、それはビスPNA標的であるものと同様の短い配列に結合し得る。pcPNA鎖は、ヒンジによって結合されず、それらは異なる配列を有する。
pcPNAのハイブリダイゼーションは、複合体を形成するために3つの分子を必要とするので、ビスPNAのものよりもより低い効率であり得る。しかしながら、偽相補的鎖は、十分な長さおよび可撓性のヒンジによって結合され得る。
別のビスPNAに基づいたアプローチは、置換されたDNA鎖の使用を含む(Demidov,V.V.ら、Methods:A Companion to Methods in Enzymology 23(2):123−131(2001))。第2のビスPNAが、第1のものと十分に近くでハイブリダイズされる場合、DNAの一続き(25bpまで)は置換されて、伸長されたP−ループを形成する。この一続きは、タグ化されるのに十分な長さである。この組み合わせは、PD−ループと称される(Demidov,V.V.ら、Methods:A Companion to Methods in Enzymology 23(2):123−131(2001))。開くための他の適用がまた設計され、形態的な標識または「イヤリング」を含む。PD−ループに基づいたタグ化は、増加した特異性を含めて、重要な利点を有する。
いくつかの実施形態において、プローブとポリマーとの間の相互作用を改良するために、正電荷がプローブ(例えば、PNAに基づいたプローブ)の中に組み込まれる。そのような改変は、核酸ポリマーの正電荷プローブおよび負に荷電された骨格の静電気引力に起因するハイブリダイゼーション速度を増加させる。
固定された核酸(LNA)分子は、DNAとハイブリッドを形成し、それは少なくともPNA/DNAハイブリッドと同じくらい安定である(Braasch,D.A.ら、Chem&Biol.8(1):1−7(2001))。従って、LNAは、PNA分子と同じように使用され得る。LNA結合効率は、正電荷をそれに添加することによって、いくつかの実施形態において増加され得る。LNAは、本質的に増加された結合親和性を有すると報告されている。
商業的な核酸合成および標準ホスホラミダイト化学は、LNAオリゴマーを作製するために使用される。従って、混合されたLNA/DNA配列の生産は、混合されたPNA/ペプチド配列のものと同じくらい簡単である。LNAモノマーの安定化効果は、相加効果ではない。モノマーは、隣接するデオキシヌクレオチドの糖の環のコンホメーションに影響し、それらをより安定な配置に移動させる。(Nielsen,P.Eら、Peptide Nucleic Acids,Protocols and Applications,Norfolk:Horizon Scientific Press,p.1−19(1999))。また、配列におけるLNA残基のより少ない数は、合成の正確さを劇的に改良する。当然に、核酸結合についてのほとんどの生化学アプローチは、LNA/DNA構成物に適用可能である。
プローブはまた、他の骨格の改変の使用によって部分的に安定化され得る。本発明、ペプチドおよび本明細書中で議論される固定された核酸に加えて、他の骨格の改変の使用(例えば、ホスホロチオエートリンケージ、ホスホロジエステル改変核酸、ホスホジエステルとホスホロチオエート核酸との組み合わせ、メチルホスホネート、アルキルホスホネート、リン酸エステル、アルキルホスホノチオエート、ホスホラミデート、カルバメート、カルボネート、リン酸トリエステル、アセトアミデート、カルボキシメチルエステル、メチルホスホロチオエート、ホスホロジチオエート、p−エトキシ、およびその組み合わせであるが、これらに限定されない)を包含することを意図する。
他の骨格の改変、特にPNAに関連するものとしては、ペプチドならびにアミノ酸のバリエーションおよび改変が挙げられる。従って、PNAの骨格構成物質は、ペプチドリンケージであり得るか、または代替として、それらは非ペプチドリンケージであり得る。例としては、アセチルキャップ、アミノスペーサー(例えば、O−リンカー、アミノ酸(例えば、リジン(正電荷がPNAに所望される場合、特に有用である。)))などが挙げられる。種々のPNAの改変は公知であり、そのような改変を組み込むプローブは、供給源(例えば、Boston Probes,Inc)から市販されている。
核酸ハイブリッドの安定性の1つの限定はプローブの長さであり、より長いプローブは、より短いプローブより大きな安定性をもたらす。この条件にもかかわらず、プローブは、少なくとも4ヌクレオチドの長さから100ヌクレオチドを超える長さまでの範囲に及ぶ任意の長さであり得る。好ましい実施形態において、プローブは6〜100ヌクレオチド長であり、さらに好ましくは、5〜25の間のヌクレオチド長であり、ましてさらに好ましくは、5〜12ヌクレオチド長である。プローブの長さは、各々および全ての長さが、本明細書中で明らかに列挙されているかのように、本明細書中に記載されている範囲の間でこれらの範囲を含む、任意のヌクレオチドの長さであり得る。プローブの全ての残基が、標的核酸分子の相補的残基にハイブリダイズする必要がないことは理解されるべきである。例えば、プローブは長さにおいて50残基であり得、さらにそれらの残基の25のみが核酸ポリマーにハイブリダイズする。好ましくは、ハイブリダイズする残基は、互いに隣接する。
プローブは標的ポリマー内の配列を認識および結合する。ポリマーそれ自体が、核酸分子である場合、プローブは好ましくは標的ポリマー内の相補的配列にハイブリダイゼーションすることによって、認識および結合する。結合の特異性は、ハイブリダイゼーション条件に基づいて操作され得る。例えば、塩濃度および温度は、プローブによって認識された配列の範囲を変えるために調節され得る。
プローブは好ましくは一本鎖であるが、それらはそれに限定されない。例えば、プローブがビスPNAである場合、それは三重鎖ヘリックスコンホメーションを生じる核酸ポリマーを有する二次構造をとり得、標的ポリマーの骨格とHoogsteen結合を形成するビスPNAクランプの1つの領域および標的ポリマーの核酸塩基とWatson−Crick結合を形成するビスPNAクランプの別の領域を有する。
本発明に従うポリマー解析は、ポリマーに結合する外部のプローブからのポリマーまたはシグナルに内在的に存在するシグナルを検出する工程を包含する。シグナルは順に標識または検出可能な部分に由来する。「標識」または「検出可能な部分」は、本発明はこの点に限定しないが、例えば、発光、エネルギー受容、蛍光、放射性、消光などであり得る。多くの天然に生じるポリマーの単位は、発光化合物または消光剤であり、それによって内在的に標識される。標識の両方のタイプは、本発明の方法によって有用である。適切な標識を選択するための指針、およびポリマーに外部の標識を付加するための方法は、米国特許第6,355,420号により詳細に提供されている。
標識または検出可能な部分は、直接的または間接的に検出され得る。直接的に検出可能な部分は、特定の波長の光を出すおよび/または吸収するその能力によって直接的に検出され得る部分である。間接的に検出可能な部分は、結合、補強および、いくつかの場合において、特定の波長の光を出すまたは吸収し得る別の部分自体を開裂するその能力によって間接的に検出され得る部分である。間接的な検出の例は、直接的に検出可能な生成物に基質を開裂する最初の酵素標識の使用である。標識は、本質的に有機物または無機物であり得る。例えば、それはそのように限定されないが、本質的に化学物質、ペプチドまたは核酸であり得る。標識は、チオール基、アミノ基またはカルボキシル基を使用して、ポリマーまたはプローブに結合され得る。
本明細書中で記載されている標識は、それらが検出されるシステムにしたがって称される。一例として、発蛍光団分子は、蛍光に依存する検出のシステムを使用して検出され得る分子である。
一般に、標識は、電子スピン共鳴分子(例えば、ニトロキシルラジカル)、蛍光分子(すなわち、発蛍光団)、化学発光分子(例えば、化学発光基質)、放射性同位体、光学または電子密度マーカー、酵素、酵素基質、ビオチン分子、ストレプトアビジン分子、電荷移動分子(すなわち、電荷形質導入分子)、色素基質、半導体ナノ結晶、半導体ナノ粒子、コロイド金ナノ結晶、リガンド、マイクロビーズ、磁性ビーズ、常磁性粒子、量子ドット、色素生産性基質、親和性分子、タンパク質、ペプチド、核酸、炭水化物、抗原、ハプテン、抗体、抗体フラグメント、および脂質からなる群から選択され得る。しかしながら、それらはそのように限定されない。
標識の例としては、発蛍光団(例えば、フルオレセイン(例えば、フルオレセインスクシンイミジルエステル)、TRITC、ローダミン、テトラメチルローダミン、R−フィコエリトリン、Cy−3、Cy−5、Cy−7、Texas Red、Phar−Red、アロフィコシアニン(APC));放射性同位体(例えば、P32またはH);エピトープまたは親和性分子(例えば、FLAGおよびHAエピトープ);および酵素(例えば、アルカリホスファターゼ、ホースラディッシュペルオキシダーゼおよびβ−ガラクトシダーゼ)が挙げられる。また、標識として、米国特許第6,207,392号に記載されている半導体ナノ結晶(例えば、量子ドット)の使用が予測される。量子ドットは、Quantum Dot Corporationから市販されている。標識はDNA塩基に直接的に連結され得るか、または改変されたDNA塩基に連結される第2もしくは第3の単位であり得る。
抗体は、本発明のプローブならびに標識として使用され得る。従って、ポリマーは、抗体または抗体フラグメントおよび必要に応じて、それらの対応する抗原、ハプテンまたはエピトープを使用して標識され得る。後者の実施形態において、抗原、ハプテン、またはエピトープは、それ自体が標識され得る。結合された抗体の検出は、当業者に公知の技術によって達成される。ポリマーに結合される抗体は、抗体に標識を連結し、次いで、標識の部位を観測することによって検出され得る。抗体の結合が配列情報を示す場合、抗体は、配列特異的方法においてポリマーに結合する。抗体の結合が、単にポリマーの存在を示すだけの場合(例えば、以下に議論されるようにポリマーの骨格を表す)、抗体は、配列特異的方法においてポリマーに結合することを必要としない。抗原、ハプテン、およびエピトープの使用に加えて、抗体がまた、一次抗体に特異的である二次抗体またはそのフラグメントを使用して可視化され得る。ポリクローナルおよびモノクローナル抗体が使用され得る。抗体フラグメントは、Fab,F(ab),FdおよびCDR3領域を含む抗体フラグメントを含む。
いくつかの実施形態において、ポリマーおよび/またはプローブは、検出システムの1つのタイプによって全て検出され得る区別可能なシグナルを出す検出可能な部分で標識される。例えば、検出可能な部分は、全て蛍光標識であり得るか、またはそれらは全て放射活性標識であり得る。他の実施形態において、ポリマーおよび/またはプローブは、異なる検出システムを使用して検出される部分で標識される。例えば、1つのポリマーまたは単位は、発蛍光団で標識され得るが、別のものは放射性同位体で標識され得る。
いくつかの例において、標準マーカーでポリマーをさらに標識することが所望され得る。標準マーカーは、ポリマーを同定する(規定することを含む)ために使用され得るが、その末端の間を区別しない。例えば、標準マーカーは、骨格の標識になり得る。核酸についての骨格標識の1つのサブセットは、配列に依存しない方法において核酸を結合する核酸染料である。例としては、挿入する染色(例えば、フェナントリジンおよびアクリジン(例えば、エチジウムブロマイド、ヨウ化プロピジウム、ヨウ化ヘキシジウム、ジヒドロエチジウム、エチジウムホモダイマー−1およびエチジウムホモダイマー−2、エチジウムモノアジド、ならびにACMA));小さいグローブ結合剤(例えば、インドールおよびイミダゾール(例えば、Hoechst33258、Hoechst33342、Hoechst34580およびDAPI));およびその他の核酸染色(例えば、アクリジンオレンジ(また、挿入し得る)、7−AAD、アクチノマイシンD、LDS751、およびヒドロキシスチルバミジン)が挙げられる。前述の核酸染料の全ては、業者(例えば、Molecular Probes,Inc.)から市販されている。
さらに他の核酸染料の例としては、Molecular Probesからの以下の色素:シアニン染色(例えば、SYTOX Blue、SYTOX Green、SYTOX Orange、POPO−1、POPO−3、YOYO−1、YOYO−3、TOTO−1、TOTO−3、JOJO−1、LOLO−1、BOBO−1、BOBO−3、PO−PRO−1、PO−PRO−3、BO−PRO−1、BO−PRO−3、TO−PRO−1、TO−PRO−3、TO−PRO−5、JO−PRO−1、LO−PRO−1、YO−PRO−1、YO−PRO−3、PicoGreen、OliGreen、RiboGreen、SYBR Gold、SYBR Green I、SYBR Green II、SYBR DX、SYTO−40、−41、−42、−43、−44、−45(青)、SYTO−13、−16、−24、−21、−23、−12、−11、−20、−22、−15、−14、−25(緑)、SYTO−81、−80、−82、−83、−84、−85(オレンジ)、SYTO−64、−17、−59、−61、−62、−60、−63(赤))が挙げられる。
いくつかの実施形態において、検出可能な標識は、近い位置の供与体および受容体分子に依存する蛍光シグナルを有するFRETシステムの部分である。好ましくは、蛍光は、供与体および受容体分子が互いに近くに位置された場合、生じる。
長さに比例したDNA標識はまた、Mirus(Madison,WI)から市販されているLabel IT(登録商標)キットを使用して行われ得る。そのキットは、共有結合的に異なる発蛍光団をDNAに付着する。発蛍光団は、ローダミン、フルオレセイン、Cy3TM、およびCY5TMである。
ポリマーは、ポリマー解析システムを使用して解析される。ポリマーが解析される際に、それに付着する検出可能な標識は、連続または同時の方法のいずれかにおいて検出される。直線的なポリマー解析システムは、連続または直線的な方法においてポリマーを解析するシステムである(すなわち、ポリマー上での1つの位置で開始し、次いで、そこからいずれかの方向において直線的に進行する)。同時に検出される場合、シグナルは通常、ポリマーのイメージを形成し、そこから、標識との間の距離が決定され得る。連続して検出される場合、シグナルは、ヒストグラム(シグナル強度 対 時間)において見られ、次いで、ポリマーの速度の見識を用いて、プロファイル(例えば、本明細書中で議論されるもの)に変換され得る。いくつかの実施形態において、ポリマーは固体支持体に付着されるが、他の実施形態においては、自由流動であることは理解される。いずれの場合においても、例えば、相互作用ステーションおよび/または検出ステーションを通り過ぎるポリマーの速度は、互いにおよびポリマーに存在し得る他の検出可能なマーカーに対する標識の位置を決定することにおいて、助けになる。
従って、好ましいポリマー解析システムは、ポリマー上の標識の全量だけでなく、おそらくより重要なことに、そのような標識の位置を推論することが可能である。例えば、解析されるゲノムの領域を配向および/または同定するために、検出する能力、位置および指向性プロファイルは、これらのプロファイルを他の遺伝子マップに重ね合わせることを可能にする。好ましい実施形態において、直線的なポリマー解析システムは、個々に核酸分子を解析し得る(すなわち、それらは単一の分子検出システムである)。
適切なポリマー解析システムの例は、1998年8月13日、および2000年2月24日にそれぞれ発行されたPCT特許出願番号WO98/35012およびWO00/09757ならびに2002年3月12日に発行された米国特許第6,355,420号に記載されているGene EngineTMシステムである。それらの出願および特許の内容ならびに他の出願および特許、ならびに本明細書中に引用された参考文献の内容は、その全体が参考として援用される。このシステムは、単一の核酸分子が、直線的な方法において相互作用ステーションを通り過ぎることを可能にし、ここで、核酸ポリマーおよび/または核酸プローブのヌクレオチドは、それに結合される検出可能な標識があるかどうかを決定するために個々に信号を送られる。呼びかけ信号は、核酸をエネルギー源(例えば、一定の波長の光学的放射)に曝露することを含む。エネルギー源曝露に応答して、ヌクレオチド(1つが存在する場合)上の検出可能な標識は、検出可能なシグナルを出す。シグナル発光および検出のためのメカニズムは、検出されることが求められる標識のタイプに依存する。
DNA分子の伸長を含む他の単一分子核酸分析の方法はまた、本発明の方法において使用され得る。これらは、光学マッピング(Schwartz,D.C.ら、Science 262(5130):110−114(1993);Meng,X.ら、Nature Genet.9:432−438(1995);Jing,J.ら、Proc.Natl.Acad.Sci.USA 95(14):8046−8051(1998);およびAston,C.ら、Trends Biotechnol.17(7):297−302(1999))およびファイバー蛍光原位置ハイブリッド形成(ファイバー−FISH)(Bensimon,A.ら、Science 265(5181):2096−2098(1997))を含む。光学マッピングにおいて、核酸は、流体サンプル中で伸長され、そしてゲルまたは表面上に、伸長されたコンホメーションにおいて固定される。制限消化が次いで、伸長および固定された核酸に対して行われる。指令される制限マップは、次いで、制限フラグメントのサイズを決定することによって生成される。ファイバー−FISHにおいて、核酸はまた、分子コーミングによって伸長および表面上に固定される。蛍光性に標識されたプローブ配列を用いるハイブリダイゼーションは、核酸上の配列目印の決定を可能にする。両方の方法は、伸長された核酸の固定化を必要とするので、分子の長さおよび/またはマーカー間の距離は、測定され得る。パルスフィールドゲル電気泳動はまた、標識された核酸を解析するために使用され得る。パルスフィールドゲル電気泳動は、Schwartz,D.C.ら、Cell 37(1):67−75(1984)によって、記載されている。他の核酸解析システムは、Otobe,K.ら、Nucleic Acids Res.29(22):E109(2001)、Bensimon,A.ら、2001年6月19日に発行された米国特許第6,248,537号、Herrick,J.ら、Chromosome Res.7(6):409:423(1999)、Schwartz、2000年11月21日に発行された米国特許第6,150,089号および2001年9月25日に発行された米国特許第6,294,136号で記載されている。他の直線的なポリマー解析システムはまた、使用され得、本発明は、本明細書中に記載されたものの単独に限定されることは意図されない。
そのような検出システムの性質は、ポリマーに付着される検出可能な部分の性質に依存する。検出システムは、当該分野に公知である多数の検出システムから選択され得る。これらは、電子スピン共鳴(ESR)検出システム、電荷結合デバイス(CCD)検出システム、アバランシェフォトダイオード(APD)検出システム、光電子増倍管(PMT)検出システム、蛍光検出システム、電気検出システム、フォトグラフィックフィルム検出システム、化学発光検出システム、酵素検出システム、原子力顕微鏡(AFM)検出システム、走査トンネル顕微鏡(STM)検出システム、光学検出システム、核磁気共鳴(NMR)検出システム、近距離検出システム、および全反射(TIR)検出システムを含み、これらの多くは、電磁気検出システムである。
本発明の方法に関連する他の相互作用は、核放射線シグナルを生成する。ポリマー上の放射標識が、検出の規定された領域を通過する際に、核放射線が出され、そのいくらかは、規定された放射線検出の領域を通過する。核放射線の検出器は、出された放射線シグナルを捕らえるために、放射線検出の規定された領域の近接に配置される。核放射線を測定する多くの方法が、当該分野において公知であり、2〜3例を挙げると、霧および泡チェンバーデバイス、定電流イオンチェンバー、パルスカウンター、ガスカウンター(すなわち、Geiger−Muellerカウンター)、固体検出器(表面バリア検出器、リチウムドリフト検出器、内因性のゲルマニウム検出器)、シンチレーションカウンター、Cerenkov検出器を含む。
生成されるシグナルの他のタイプは、当該分野において周知であり、当業者に公知である多くの検出方法を有する。これらのいくつかは、対向電極、磁気共鳴、および圧電走査チップを含む。対向ナノ電極は、電気容量変化の測定によって機能し得る。2つの対向する電極は、2つの電極との間に効率的に位置づけられ、エネルギー貯蔵の領域を作製する。異なる物質が電極と間に置かれる場合、そのようなデバイスの電気容量は変化することが公知である。この誘電率は、特定の物質が貯蔵し得るエネルギーの量(すなわち、電気容量)に関連する値である。誘電率における変化は、2つの電極にまたがる電圧の変化として測定され得る。現在の例において、異なるヌクレオチド塩基またはポリマーの単位特異的マーカーは、異なる誘電率を生じ得る。電気容量は、式:C=KCに従って、ポリマーの単位特異的マーカーの誘電率とともに変化し、ここで、Kは誘電率であり、Cはあらゆる塩基の非存在下での電気容量である。ナノ電極の電圧の偏向は、次いで、測定デバイスに出力され、時間とともにシグナルの変化を記録する。
検出可能なシグナルは生成、検出されて、データベースに蓄えられる。シグナルは、ポリマーについての構造情報を決定するために解析され得る。シグナルは、ポリマーの構造情報を決定するために、シグナルの強度を評価することによって解析され得る。コンピューターがデータベースを蓄えるために使用され得、および/または本明細書中に記載されたアルゴリズムを行うために使用され得る。コンピューターは、ポリマーについてのデータを回収するために使用される同じコンピューターであり得るか、またはデータ解析用のために使用される別のコンピューターであり得る。本発明の実施形態を実行するための適切なコンピューターシステムは、代表的に、使用者に情報を表示する出力デバイス、出力デバイスに接続される主要なユニット、使用者から入力を受ける入力デバイスを含む。主要なユニットは、一般的に、相互接続メカニズムによってメモリーシステムに接続される処理装置を含む。入力デバイスおよび出力デバイスはまた、相互接続メカニズムによって、処理装置およびメモリーシステムに接続される。検出されたシグナルのデータ解析のためのコンピュータープログラムは、CCD(電荷結合素子)製造業者から容易に入手可能である。
本発明はさらに、以下の実施例によって示され、これらの実施例は、いかなる様式においても、さらなる限定として解釈されるべきではない。本出願の全体にわたって引用された参考文献(参考文献、発行された特許、公開された特許出願、および同時係属中の特許出願を含む)の全ての全内容は、本明細書中で明らかに参考として援用される。
(実施例1:12M9BACのマッピング)
細菌性の人工的な染色体、12M9BACを、ビスPNA#Kタグ:TMR−OO−Lys−Lys−TTC TTC TC−OOO−JTJ−TTJ−TT−Lys−Lysを使用してマッピングした。BACは、0.7kb、10.2kb、73.5kb、152.4kb、154.5kb、および181.4kbで標的部位を有する(図1、上のパネル)。このDNA上の末端(SEMM)で単一のミスマッチを有する82部位がある。それらは100%相補的でない場合でさえも、SEMMは、配列特異的プローブが結合し得る部位である。これらは、既知の核酸配列から推定され得る。マップを取得するために、全てのポリマートレースは、分子基準点の中央(CM)を使用して整列され、平均化される(図2、上のパネル)。このイメージは、かぶせられるが、非配向のDNAポリマー上の各々の結合プローブからの平均シグナルを表す。他の内部基準点が使用され得るが、ポリマーが不完全に引き伸ばされる場合、CMは基準点として特に有用である。これらのポリマーは、均一に引き伸ばされず、むしろステムおよびフラワー構造をとり得る(Mannevilleら、Europhys.Lett.36:413−418,1996)。このコンホメーションにおいて、ほとんどのゆらぎは、末端領域に集中される(すなわち、フラワー領域)が、DNAポリマーの中央は、より大きく引き伸ばされたままである(すなわち、ステム領域)。したがって、たとえ不完全に引き伸ばされたポリマーにおいてでも、中央部分は解析に有用である。測定された非配向のマップ(実線)を、図2、上のパネルにおいて、公開された12M9配列(破線)からの予測された(すなわち、理論上の)ものと重ね合わされた。後者を、0.34μm/kbスケールで配列を表し、5kbの幅のGaussian曲線として標的シグナルを含め(図1、中央のパネル)、そのミラーイメージとマップを重ね合わせる(図1、下のパネル)ことによって取得した。12M9BACについて予測した全てのピーク(A,BおよびCで示される)は、実験的なマップ上に存在する。
1つの余分なピーク(Dで示される)もまた、存在した。このピークは、配列エラーに起因してBACおよびヒト配列ゲノムにおいて失われている、少なくとも1つの余分な標的部位を表すと仮定した。これを証明するために、BACのこの領域を、再び配列決定した。64,388bpの位置で開始して、3つのSEMM部位が、単一の塩基対によって分けられて近接に位置することを見出した。そのような近接は、第2のDNA鎖の置換のエネルギーコストを軽減し、ミスマッチ部分での安定した複合体の形成を可能にする(いわゆるP−ループ構造)。この複合体は、非常に共同性であり、2または3個のSEMM部位が同時にハイブリダイズされる場合のみ存在し得るので、ピークDは、単一の標的によって形成されるピークAより高くなる。
シャープピークの対称性のパターンは、約4〜5の強度で特徴のない台座の上にはっきりと目に見える(図2、上のパネル)。比較のために、標識されていないBAC上で測定されたDNA結合不純物によって引き出されたシグナルを、同じ画像上に提供する(一点鎖線の曲線)。測定されたマップ台座の大部分(全てではない場合)は、これらの不純物からのシグナルに起因する。S/N比は、マッピング手順そのものについて非常に高い。
1つの方向において配向されたDNA分子のみを含むマッププロファイルを取得するために、本発明者らは、ピークA’およびBに入力されたプロファイルを抽出した(図2、上のパネル)。これらのピークは、73.5kbおよび152.0/154.5kbのそれぞれの位置でハイブリダイズされたタグ、および同じ方向に配向された分子のみによって形成された。これらの選択されたプロファイルの全てのシグナルが、合計および平均された。その結果生じた指向性プロファイルは、図2、下のパネルに示され、理論的に予測されたプロファイル(破線)と比較される。
(実施例2:アルゴリズム)
一般的な場合において、非配向マップの全てのピークが試験されて、それに寄与する分子トレースを選択し得る。ピークが両方のポリマー配向からのタグシグナルを含む場合、選択されたマップは、全ての非配向マップに似ている。ピークが、1つの配向のDNAポリマーからのシグナルのみによって形成される場合、選択されたマップは、全非配向マップの全てのピークを含むわけではない。さらに、それは全非配向マップを生成するために反転およびそれ自体と組み合わせられ得る。
同様のアプローチが、長さは同一ではないが、同様のポリマーの結合を区別するために適用され得る。この場合において、ピークは、全非配向マップにおいて調査され、1つのポリマーのみからの標識の入力によって形成される。ピーク選択の基準は、全非配向ピークに存在する全てのピークを有さないピークにおいて入力するポリマーによって形成されたマップである。いったん、単一のポリマーマップが取得されると、その配向マップは、本明細書中で記載されるように、さらに決定され得る。2つより多くの重なっているポリマーの場合において、同じアプローチが、全非配向マップをより簡単な組み合わせに壊すために使用され得る。それは、直接的に可能であり得るか(全てのポリマーが、全非配向マップにおける代表的なピークを有する場合)、または次々に、全マップから単一のポリマーマップを引くことによって、およびそのプロセスを反復することによって、各々の反復を有するマップを単純化する。
このアプローチの力は、平均化パターンに基づき、それによって、引き伸ばすことおよび特定の検出されたポリマープロファイルの欠損をタグ化することに感受性ではないことである。最も重要なことは、マッピング解像度および全てのフラグメントの標識の度合いである。より良い解像度は、1つのポリマーのみからの入力でピークを単離する可能性を増加させる。標識のより高い度合いは、ポリマーに属する全ての他のピークの検出を改良する。ある程度まで、不完全な標識は、平均する際により多くのポリマートレースを含むことによって埋め合わせられ得る。
選択性は、異なるスペクトル領域で出る異なる標識についてのいくつかのタグを同時に使用することによって、さらに改良され得る。この場合において、タグは独立して検出される。混合物からのいくつかのDNAポリマーが、タグの1つで取得されるマップを使用して同定され得る場合、この同定は、全ての他の標識で取得されるマップに適用され得る。同様に、タグ化パターンが1つの標識について非対称である場合、それは、全ての他のタグで取得されるこのフラグメントのマップを配向するために使用され得る。異なるタグの適用は、選択性を改良するだけではなく、解析のための特別な戦略を提供する。例えば、タグの1つは、まれに結合する成分上で選択され得、フラグメントの認識およびそれらの検出されたトレースの配向のために使用され得る。相補的な方法において、より高い解像度マッピングを提供するために、DNAポリマー上の標識部位の高い密度を有する別のタグが選択され得る。
そのようなデータ処理段階を含むアルゴリズムは、ソフトウェアパッケージにおいて提供され得る。ソフトウェアパッケージは、自動的に選択、配向および平均化を行うために、異なるカラーチャネルからのデータを解析し得る。データを生成するために使用される検出システムは、第3のカラー励起および検出チャネルを取り付けられ得る。
(実施例3:ゲノム配列決定および病原体解析)
この実施例は、2つの異なるタイプの解析を記載している。第1の場合において、解析されたDNAサンプルについての前の知識が利用される。1つの例は、ゲノム解析について生成されたBACライブラリーのマッピングである。既知のゲノムについて、まれに切断する制限エンドヌクレアーゼが、異なるサイズのフラグメントを生成するために使用され得る。さらに、BACまたはスモールサイズのゲノムが、単一の分子として解析され得る。第2の例は、同じ微生物の異なる株のマッピングである。後者の適用において、公知または未知の微生物の以前に配列決定されていないゲノムが、解析され得る。以前の場合との主要な違いは、制限酵素処理が未知のサイズの分布を生じることである。しかしながら、まれなカッターの使用さえも、システム(例えば、GeneEngine)を使用する直線的なポリマー解析にとって適切なフラグメントサイズの分布を必ずしも保証するとは限らない。この解析を容易にするために、何回かの消化が必要とされ得る。
未知のゲノムをマッピングするGeneEngineの1つの適用は、制限マッピングである。電気泳動に基づいた標準アプローチ(例えば、Brown,「Genomes.」New York:John Wiley&Sons Inc.(1999)472pを参照のこと)との主要な違いは、そのサイズに加えて、全てのフラグメントが、結合タグのパターンによって特徴づけられ得ることである。これは、例えば、株を認識するために使用され得る種特異性「バーコード」の生成を可能にする。これは、例えば、ヒトおよび農業問題、細菌戦争などにおける感染発生の分野において有用である。
(均等物)
前述の明細書は、当業者が本発明を行うために十分であるとみなされる。実施例は、本発明の1つの局面の単一の例示として意図され、他の機能的な同等の実施形態が本発明の範囲内にあるので、本発明は提供された実施例の範囲に限定されない。本明細書中に示されて記載されたものに加えて、本発明の種々の改変は、前述の記載から、当業者に明らかであり、そして添付された特許請求の範囲の範囲内である。本発明の利点および目的は、必ずしも、本発明の各々の実施例によって包含されない。
図面は例示のみであり、本明細書中に開示されている本発明が実施可能であるために必要としない。
図1は、ポリマー上の特定の配列部位の配置(「標的配列部位」)(上のパネル)、これらの配列部位に基づいたポリマーの理論的な直接シグナルプロファイル(中央のパネル)、ならびに分子の中央のいずれかの側の複製シグナルを示す直接シグナルプロファイルおよびミラーイメージシグナルプロファイルの理論的な組み合わせ(下のパネル)を示す。この後者のプロットは、図2において使用される。中央のパネルは、理論的な「個々の強度プロファイル」および/または指向性プロファイルに似ており、理論的な「個々の強度プロファイル」および/または指向性プロファイルを表し得る。下のパネルは集団プロファイルおよび/または非指向性プロファイルに似ており、集団プロファイルおよび/または非指向性プロファイルを表し得る。中央および下のパネルの矢印は、対応するピークに寄与するポリマーの配向を示す。プロファイルは、長さの関数(すなわち、ポリマー上での位置)として強度(光子数)としてプロットされる。 図2は、配向前の単一のポリマータイプについての分子の中央に関連するポリマー位置の関数としてシグナル強度を示す(上のパネル)。観測された配向配列情報および理論的な配向配列情報がまた、示される(下のパネル)。観測されたシグナルは、実線によって示され、理論的なシグナルは破線によって示される。下のパネルに示される観測された配向プロファイルは、本明細書中で使用された方法を使用して引き出された。

Claims (53)

  1. サンプルからポリマー強度データを解析するための方法であって、
    該サンプルに含まれる個々の標識されたポリマーから強度プロファイルを取得する工程、
    個々の標識されたポリマーから個々の強度プロファイルを、アラインメント基準点に関して整列させる工程、
    整列された個々の強度プロファイルを組み合わせて、集団プロファイルを生成する工程、
    該集団プロファイルにおいてピークを選択して、ピークに寄与する個々の強度プロファイルを取得する工程、
    該ピークに寄与する個々の強度プロファイルを組み合わせて、ピークプロファイルを生成する工程、および
    該集団プロファイルと該ピークプロファイルを比較する工程、
    を包含する、方法。
  2. 請求項1に記載の方法であって、前記サンプルが、ポリマーの不均一混合物を含む、方法。
  3. 請求項2に記載の方法であって、前記ポリマーの不均一混合物が、親ポリマーの異なるサイズのフラグメントを含む、方法。
  4. 請求項2に記載の方法であって、前記ポリマーの不均一混合物が、異なる配列を有するポリマーを含む、方法。
  5. 請求項1に記載の方法であって、前記プロファイルが、強度 対 長さプロファイルである、方法。
  6. 請求項1に記載の方法であって、前記強度データが、蛍光強度データであり、強度プロファイルが、蛍光強度プロファイルである、方法。
  7. 請求項1に記載の方法であって、前記ポリマーが、配列特異的プローブで標識される、方法。
  8. 請求項1に記載の方法であって、前記ポリマーが、配列非特異的標識で標識される、方法。
  9. 請求項1に記載の方法であって、該方法が、コンピューター上で実行される、方法。
  10. 請求項1に記載の方法であって、前記ポリマーが、核酸である、方法。
  11. 請求項10に記載の方法であって、前記核酸が、DNAまたはRNAである、方法。
  12. 請求項11に記載の方法であって、前記DNAが、核ゲノムDNA、ミトコンドリアDNAまたはcDNAである、方法。
  13. 請求項11に記載の方法であって、前記RNAが、mRNAである、方法。
  14. 請求項1に記載の方法であって、前記アラインメント基準点が、内部基準点である、方法。
  15. 請求項14に記載の方法であって、前記アラインメント基準点が、分子基準点の中央である、方法。
  16. 請求項14に記載の方法であって、前記アラインメント基準点が、個々のポリマーに結合される配列特異的プローブである、方法。
  17. 請求項14に記載の方法であって、前記アラインメント基準点が、個々のポリマーに結合される配列非特異的プローブである、方法。
  18. 請求項1に記載の方法であって、前記強度プロファイルが、流動中の個々のポリマーから取得される、方法。
  19. 請求項1に記載の方法であって、前記強度プロファイルが、固体支持体に固定される個々のポリマーから取得される、方法。
  20. 請求項1に記載の方法であって、前記集団プロファイルが、累積集団プロファイルである、方法。
  21. 請求項1に記載の方法であって、前記集団プロファイルが、平均集団プロファイルである、方法。
  22. 請求項1に記載の方法であって、前記ピークプロファイルが、累積ピークプロファイルである、方法。
  23. 請求項1に記載の方法であって、前記ピークプロファイルが、平均ピークプロファイルである、方法。
  24. 請求項1に記載の方法であって、前記ピークが、強度に基づいて選択される、方法。
  25. 請求項1に記載の方法であって、前記ピークが、前記集団プロファイルにおける該ピークのミラーイメージピークの存在に基づいて選択される、方法。
  26. 請求項1に記載の方法であって、前記サンプル中のポリマーが、個々の強度プロファイルを整列させるより前に、サイズによって分類される、方法。
  27. 請求項1に記載の方法であって、前記集団プロファイルに似ているピークプロファイルが、非指向性プロファイルを示す、方法。
  28. 請求項1に記載の方法であって、前記集団プロファイルからのピークのサブセットよりなるピークプロファイルが、推定指向性プロファイルを示す、方法。
  29. 請求項28に記載の方法であって、前記推定指向性プロファイルを反転させて、推定反転プロファイルを生成する工程、該推定反転プロファイルと該推定指向性プロファイルを組み合わせて、推定非指向性プロファイルを生成する工程、および前記集団プロファイルと該推定非指向性プロファイルを比較する工程をさらに包含し、ここで、該集団プロファイルと同一である推定非指向性プロファイルは、該推定指向性プロファイルが指向性プロファイルであり、該推定反転プロファイルが反転プロファイルであり、かつ該推定非指向性プロファイルが非指向性プロファイルであることを示す、方法。
  30. 請求項28に記載の方法であって、前記アラインメント基準点が、分子基準点の中央である場合、前記ピークプロファイルにおける個々のピークが、前記集団プロファイルにおいて対応するミラーイメージピークを有するか否かを決定する工程をさらに包含する、方法。
  31. 請求項30に記載の方法であって、前記対応するミラーイメージの存在が、前記推定指向性プロファイルが指向性プロファイルであることを示す、方法。
  32. 請求項28に記載の方法であって、前記アラインメント基準点が、分子基準点の中央である場合、前記指向性ピークが、前記集団プロファイルにおいて対応するミラーイメージピークを有するか否かを決定する工程をさらに包含する、方法。
  33. 請求項32に記載の方法であって、前記ミラーイメージピークに寄与する個々の強度プロファイルを取得する工程、および該ミラーイメージピークに寄与する個々の強度プロファイルを組み合わせて、ミラーイメージピークプロファイルを生成する工程をさらに包含する、方法。
  34. 請求項33に記載の方法であって、前記集団プロファイルと前記ミラーイメージピークプロファイルを比較する工程をさらに包含する、方法。
  35. 請求項34に記載の方法であって、前記ミラーイメージピークプロファイルが、前記ピークプロファイルのミラーイメージであるか否かを決定する工程をさらに包含する、方法。
  36. 請求項35に記載の方法であって、前記ミラーイメージピークプロファイルを反転させ、そして、該ミラーイメージピークプロファイルを前記ピークプロファイルと組み合わせる工程をさらに包含する方法であり、
    但し、該ミラーイメージピークプロファイルは、該ピークプロファイルのミラーイメージである方法。
  37. 請求項33に記載の方法であって、前記ミラーイメージピークプロファイルが、累積ミラーイメージピークプロファイルである、方法。
  38. 請求項33に記載の方法であって、前記ミラーイメージピークプロファイルが、平均ミラーイメージピークプロファイルである、方法。
  39. 請求項28または31に記載の方法であって、前記集団プロファイルから前記ピークプロファイルを差し引く工程をさらに包含する、方法。
  40. 請求項35に記載の方法であって、前記集団プロファイルから前記ミラーイメージピークプロファイルを差し引く工程をさらに包含する、方法。
  41. 請求項35に記載の方法であって、前記集団プロファイルから前記ピークプロファイルおよび前記ミラーイメージピークプロファイルを差し引く工程をさらに包含する、方法。
  42. 請求項41に記載の方法であって、別のピークが、前記ピークプロファイルおよび前記ミラーイメージピークプロファイルを差し引いた後に、前記集団プロファイルにおいて残るかどうかを決定する工程をさらに包含する、方法。
  43. 請求項42に記載の方法であって、前記別のピークの存在が、前記サンプルが異なるポリマーを含むことを示す、方法。
  44. 請求項1に記載の方法であって、前記ポリマーが、完全に引き伸ばされる、方法。
  45. 請求項1に記載の方法であって、前記ポリマーが、部分的に引き伸ばされる、方法。
  46. 請求項31に記載の方法であって、前記指向性プロファイルを反転させる工程、前記反転プロファイルと該指向性プロファイルを組み合わせて、非指向性プロファイルを生成する工程、および前記集団プロファイルと該非指向性プロファイルを比較する工程をさらに包含する、方法。
  47. 請求項8に記載の方法であって、前記配列非特異的標識が、主鎖の標識である、方法。
  48. 請求項47に記載の方法であって、前記アラインメント基準点が、分子基準点の中央である、方法。
  49. 請求項48に記載の方法であって、前記分子基準点の中央が、個々のプロファイルの中心点である、方法。
  50. 請求項1に記載の方法であって、前記ピークが、強度 対 長さプロファイルにおいて認識できる、方法。
  51. 請求項1に記載の方法であって、前記ピークが、ビンカウント(bin counts)に対応する、方法。
  52. 請求項1に記載の方法であって、前記ポリマーが、均一に引き伸ばされる方法。
  53. 請求項1に記載の方法であって、前記サンプルが、ゲルマトリックス中に包埋ポリマーを含む、方法。
JP2006501112A 2003-01-23 2004-01-23 ポリマー集団を解析するための方法 Pending JP2006520463A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US44217503P 2003-01-23 2003-01-23
PCT/US2004/001823 WO2004066185A1 (en) 2003-01-23 2004-01-23 Methods for analyzing polymer populations

Publications (2)

Publication Number Publication Date
JP2006520463A true JP2006520463A (ja) 2006-09-07
JP2006520463A5 JP2006520463A5 (ja) 2007-03-08

Family

ID=32772031

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006501112A Pending JP2006520463A (ja) 2003-01-23 2004-01-23 ポリマー集団を解析するための方法

Country Status (5)

Country Link
US (1) US20040214211A1 (ja)
EP (1) EP1586068B1 (ja)
JP (1) JP2006520463A (ja)
DE (1) DE602004015408D1 (ja)
WO (1) WO2004066185A1 (ja)

Families Citing this family (70)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1009802B1 (en) 1997-02-12 2004-08-11 Eugene Y. Chan Methods for analyzimg polymers
US6696022B1 (en) 1999-08-13 2004-02-24 U.S. Genomics, Inc. Methods and apparatuses for stretching polymers
US6927065B2 (en) 1999-08-13 2005-08-09 U.S. Genomics, Inc. Methods and apparatus for characterization of single polymers
WO2002044425A2 (en) 2000-12-01 2002-06-06 Visigen Biotechnologies, Inc. Enzymatic nucleic acid synthesis: compositions and methods for altering monomer incorporation fidelity
AU2003228649A1 (en) * 2002-04-23 2003-11-10 U.S.Genomics, Inc. Compositions and methods related to two-arm nucleic acid probes
EP1540017A4 (en) * 2002-05-09 2006-05-24 Us Genomics Inc METHOD FOR THE ANALYSIS OF A NUCLEIC ACID
US7282330B2 (en) 2002-05-28 2007-10-16 U.S. Genomics, Inc. Methods and apparati using single polymer analysis
US7371520B2 (en) * 2002-05-28 2008-05-13 U.S. Genomics, Inc. Methods and apparati using single polymer analysis
US20040053399A1 (en) * 2002-07-17 2004-03-18 Rudolf Gilmanshin Methods and compositions for analyzing polymers using chimeric tags
US20050123944A1 (en) * 2003-08-01 2005-06-09 U.S. Genomics, Inc. Methods and compositions related to the use of sequence-specific endonucleases for analyzing nucleic acids under non-cleaving conditions
WO2005017205A2 (en) * 2003-08-04 2005-02-24 U. S. Genomics, Inc. Nucleic acid mapping using linear analysis
WO2005022162A1 (en) * 2003-08-21 2005-03-10 U.S. Genomics, Inc. Quantum dots and methods of use thereof
WO2005047470A2 (en) * 2003-11-07 2005-05-26 U.S. Genomics, Inc. Intercalator fret donors or acceptors
US7595160B2 (en) 2004-01-13 2009-09-29 U.S. Genomics, Inc. Analyte detection using barcoded polymers
EP1704256A4 (en) 2004-01-13 2008-01-16 Us Genomics Inc DETECTION AND QUANTIFICATION OF ANALYTES IN SOLUTION USING POLYMERS
US20080003689A1 (en) * 2004-07-13 2008-01-03 U.S. Genomics, Inc. Systems and methods for sample modification using fluidic chambers
WO2006036388A2 (en) * 2004-08-23 2006-04-06 U.S. Genomics, Inc. Systems and methods for detecting and analyzing polymers
US8685711B2 (en) 2004-09-28 2014-04-01 Singulex, Inc. Methods and compositions for highly sensitive detection of molecules
US7572640B2 (en) * 2004-09-28 2009-08-11 Singulex, Inc. Method for highly sensitive detection of single protein molecules labeled with fluorescent moieties
AU2005290314A1 (en) * 2004-09-28 2006-04-06 Singulex, Inc. System and method for spectroscopic analysis of single particles
US9040305B2 (en) * 2004-09-28 2015-05-26 Singulex, Inc. Method of analysis for determining a specific protein in blood samples using fluorescence spectrometry
WO2006098772A2 (en) * 2004-10-13 2006-09-21 U.S. Genomics, Inc. Systems and methods for measurement optimization
US7888011B2 (en) * 2004-10-18 2011-02-15 U.S. Genomics, Inc. Methods for isolation of nucleic acids from prokaryotic spores
US20070128083A1 (en) * 2005-07-18 2007-06-07 U.S. Genomics, Inc. Microfluidic methods and apparatuses for sample preparation and analysis
US20100035247A1 (en) * 2005-11-04 2010-02-11 U.S. Genomics, Inc. Heterogeneous Assay of Analytes in Solution Using Polymers
US7838250B1 (en) 2006-04-04 2010-11-23 Singulex, Inc. Highly sensitive system and methods for analysis of troponin
EP2386858B1 (en) 2006-04-04 2015-07-15 Singulex, Inc. Highly sensitive system and methods for analysis of troponin
US8999636B2 (en) 2007-01-08 2015-04-07 Toxic Report Llc Reaction chamber
CN103543094B (zh) 2007-12-19 2017-06-09 神谷来克斯公司 单分子检测用扫描分析器和使用方法
US8361716B2 (en) 2008-10-03 2013-01-29 Pathogenetix, Inc. Focusing chamber
US8450069B2 (en) 2009-06-08 2013-05-28 Singulex, Inc. Highly sensitive biomarker panels
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
CA2798149A1 (en) 2010-05-06 2011-11-10 Singulex, Inc Methods for diagnosing, staging, predicting risk for developing and identifying treatment responders for rheumatoid arthritis
CN104364392B (zh) 2012-02-27 2018-05-25 赛卢拉研究公司 用于分子计数的组合物和试剂盒
US8956815B2 (en) 2012-04-18 2015-02-17 Toxic Report Llc Intercalation methods and devices
US8685708B2 (en) 2012-04-18 2014-04-01 Pathogenetix, Inc. Device for preparing a sample
US9028776B2 (en) 2012-04-18 2015-05-12 Toxic Report Llc Device for stretching a polymer in a fluid sample
GB2525104B (en) 2013-08-28 2016-09-28 Cellular Res Inc Massively Parallel Single Cell Nucleic Acid Analysis
EP3262192B1 (en) 2015-02-27 2020-09-16 Becton, Dickinson and Company Spatially addressable molecular barcoding
JP7508191B2 (ja) 2015-03-30 2024-07-01 ベクトン・ディキンソン・アンド・カンパニー コンビナトリアルバーコーディングのための方法および組成物
CN107580632B (zh) 2015-04-23 2021-12-28 贝克顿迪金森公司 用于全转录组扩增的方法和组合物
KR102395450B1 (ko) 2015-09-11 2022-05-09 셀룰러 리서치, 인크. 핵산 라이브러리 정규화를 위한 방법 및 조성물
US10301677B2 (en) 2016-05-25 2019-05-28 Cellular Research, Inc. Normalization of nucleic acid libraries
US10202641B2 (en) 2016-05-31 2019-02-12 Cellular Research, Inc. Error correction in amplification of samples
US10640763B2 (en) 2016-05-31 2020-05-05 Cellular Research, Inc. Molecular indexing of internal sequences
AU2017331459B2 (en) 2016-09-26 2023-04-13 Becton, Dickinson And Company Measurement of protein expression using reagents with barcoded oligonucleotide sequences
CN110382708A (zh) 2017-02-01 2019-10-25 赛卢拉研究公司 使用阻断性寡核苷酸进行选择性扩增
US10676779B2 (en) 2017-06-05 2020-06-09 Becton, Dickinson And Company Sample indexing for single cells
CN111699266A (zh) * 2017-12-04 2020-09-22 威斯康星校友研究基金会 用于由单个核酸分子测量中鉴定序列信息的系统和方法
EP4234717A3 (en) 2018-05-03 2023-11-01 Becton, Dickinson and Company High throughput multiomics sample analysis
ES3014208T3 (en) 2018-05-03 2025-04-21 Becton Dickinson Co Molecular barcoding on opposite transcript ends
ES2992135T3 (es) 2018-10-01 2024-12-09 Becton Dickinson Co Determinar secuencias de transcripción 5’
JP7618548B2 (ja) 2018-11-08 2025-01-21 ベクトン・ディキンソン・アンド・カンパニー ランダムプライミングを使用した単一細胞の全トランスクリプトーム解析
EP3894552A1 (en) 2018-12-13 2021-10-20 Becton, Dickinson and Company Selective extension in single cell whole transcriptome analysis
CN113474651B (zh) 2019-01-08 2024-05-17 麻省理工学院 单分子蛋白质和肽测序
WO2020154247A1 (en) 2019-01-23 2020-07-30 Cellular Research, Inc. Oligonucleotides associated with antibodies
CN113454234B (zh) 2019-02-14 2025-03-18 贝克顿迪金森公司 杂合体靶向和全转录物组扩增
WO2020172247A1 (en) 2019-02-22 2020-08-27 Massachusetts Institute Of Technology Iterative direct expansion microscopy
WO2021016239A1 (en) 2019-07-22 2021-01-28 Becton, Dickinson And Company Single cell chromatin immunoprecipitation sequencing assay
CN114729350A (zh) 2019-11-08 2022-07-08 贝克顿迪金森公司 使用随机引发获得用于免疫组库测序的全长v(d)j信息
US11649497B2 (en) 2020-01-13 2023-05-16 Becton, Dickinson And Company Methods and compositions for quantitation of proteins and RNA
EP4097228B1 (en) 2020-01-29 2024-08-14 Becton, Dickinson and Company Barcoded wells for spatial mapping of single cells through sequencing
US12153043B2 (en) 2020-02-25 2024-11-26 Becton, Dickinson And Company Bi-specific probes to enable the use of single-cell samples as single color compensation control
WO2021231779A1 (en) 2020-05-14 2021-11-18 Becton, Dickinson And Company Primers for immune repertoire profiling
ES2987035T3 (es) 2020-06-02 2024-11-13 Becton Dickinson Co Oligonucleótidos y perlas para el ensayo de expresión génica principal 5
US11932901B2 (en) 2020-07-13 2024-03-19 Becton, Dickinson And Company Target enrichment using nucleic acid probes for scRNAseq
US12391940B2 (en) 2020-07-31 2025-08-19 Becton, Dickinson And Company Single cell assay for transposase-accessible chromatin
US20220112553A1 (en) * 2020-10-13 2022-04-14 Massachusetts Institute Of Technology Methods for single-molecule analysis of linearized polynucleotides
WO2022109343A1 (en) 2020-11-20 2022-05-27 Becton, Dickinson And Company Profiling of highly expressed and lowly expressed proteins
US12392771B2 (en) 2020-12-15 2025-08-19 Becton, Dickinson And Company Single cell secretome analysis

Family Cites Families (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5202231A (en) * 1987-04-01 1993-04-13 Drmanac Radoje T Method of sequencing of genomes by hybridization of oligonucleotide probes
US6150089A (en) * 1988-09-15 2000-11-21 New York University Method and characterizing polymer molecules or the like
JP3123249B2 (ja) * 1991-09-10 2001-01-09 株式会社日立製作所 Dna分子の長さ計測方法および計測装置
WO1994016104A1 (en) * 1993-01-08 1994-07-21 Ctrc Research Foundation Color imaging system for use in molecular biology
US5789167A (en) * 1993-09-10 1998-08-04 Genevue, Inc. Optical detection of position of oligonucleotides on large DNA molecules
AU3829197A (en) * 1996-09-03 1998-03-26 Pioneer Hi-Bred International, Inc. Method and apparatus for single molecule two color fluorescent detection and molecular weight and concentration determination
US6403311B1 (en) * 1997-02-12 2002-06-11 Us Genomics Methods of analyzing polymers using ordered label strategies
EP1009802B1 (en) * 1997-02-12 2004-08-11 Eugene Y. Chan Methods for analyzimg polymers
US6263286B1 (en) * 1998-08-13 2001-07-17 U.S. Genomics, Inc. Methods of analyzing polymers using a spatial network of fluorophores and fluorescence resonance energy transfer
US6210896B1 (en) * 1998-08-13 2001-04-03 Us Genomics Molecular motors
AU5560699A (en) * 1998-08-13 2000-03-06 U.S. Genomics, Inc. Optically characterizing polymers
US6790671B1 (en) * 1998-08-13 2004-09-14 Princeton University Optically characterizing polymers
US6441741B1 (en) * 1999-05-17 2002-08-27 Avid Identification Systems, Inc. Overmolded transponder
US6927065B2 (en) * 1999-08-13 2005-08-09 U.S. Genomics, Inc. Methods and apparatus for characterization of single polymers
US6696022B1 (en) * 1999-08-13 2004-02-24 U.S. Genomics, Inc. Methods and apparatuses for stretching polymers
US6762059B2 (en) * 1999-08-13 2004-07-13 U.S. Genomics, Inc. Methods and apparatuses for characterization of single polymers
WO2001079562A1 (en) * 2000-04-18 2001-10-25 Gilead Sciences, Inc. Aptamer based two-site binding assay
WO2001095233A2 (en) * 2000-06-02 2001-12-13 Transgenomic, Inc. Analysis of data from liquid chromatographic separation of dna
US7572642B2 (en) * 2001-04-18 2009-08-11 Ambrigen, Llc Assay based on particles, which specifically bind with targets in spatially distributed characteristic patterns
WO2002101353A2 (en) * 2001-06-08 2002-12-19 U.S. Genomics, Inc. Methods and products for analyzing nucleic acids based on methylation status
US20020187508A1 (en) * 2001-06-08 2002-12-12 Wong Gordon G. Methods and products for analyzing nucleic acids using nick translation
US8423294B2 (en) * 2001-09-18 2013-04-16 Pathogenetix, Inc. High resolution linear analysis of polymers
US20030059822A1 (en) * 2001-09-18 2003-03-27 U.S. Genomics, Inc. Differential tagging of polymers for high resolution linear analysis
TWI231757B (en) * 2001-09-21 2005-05-01 Solvay Pharm Bv 1H-Imidazole derivatives having CB1 agonistic, CB1 partial agonistic or CB1-antagonistic activity
AU2003228649A1 (en) * 2002-04-23 2003-11-10 U.S.Genomics, Inc. Compositions and methods related to two-arm nucleic acid probes
US7371520B2 (en) * 2002-05-28 2008-05-13 U.S. Genomics, Inc. Methods and apparati using single polymer analysis
US7282330B2 (en) * 2002-05-28 2007-10-16 U.S. Genomics, Inc. Methods and apparati using single polymer analysis
US20040053399A1 (en) * 2002-07-17 2004-03-18 Rudolf Gilmanshin Methods and compositions for analyzing polymers using chimeric tags
JP2006522940A (ja) * 2003-04-10 2006-10-05 ユー.エス. ジェノミクス, インコーポレイテッド マイクロチャネルにおけるポリマーの操作
US20050123944A1 (en) * 2003-08-01 2005-06-09 U.S. Genomics, Inc. Methods and compositions related to the use of sequence-specific endonucleases for analyzing nucleic acids under non-cleaving conditions
WO2005022162A1 (en) * 2003-08-21 2005-03-10 U.S. Genomics, Inc. Quantum dots and methods of use thereof
WO2005047471A2 (en) * 2003-11-07 2005-05-26 U.S. Genomics, Inc. Improved fret efficiency methods
WO2005047470A2 (en) * 2003-11-07 2005-05-26 U.S. Genomics, Inc. Intercalator fret donors or acceptors
WO2005050171A2 (en) * 2003-11-17 2005-06-02 U.S. Genomics, Inc. Methods and compositions relating to single reactive center reagents
EP1704256A4 (en) * 2004-01-13 2008-01-16 Us Genomics Inc DETECTION AND QUANTIFICATION OF ANALYTES IN SOLUTION USING POLYMERS
US20050196790A1 (en) * 2004-02-05 2005-09-08 U.S. Genomics, Inc. Methods for detection and quantitation of minimum length polymers
JP2007529758A (ja) * 2004-03-19 2007-10-25 ユー.エス. ジェノミクス, インコーポレイテッド 単一分子の検出のための組成物および方法
WO2006036388A2 (en) * 2004-08-23 2006-04-06 U.S. Genomics, Inc. Systems and methods for detecting and analyzing polymers
WO2006098772A2 (en) * 2004-10-13 2006-09-21 U.S. Genomics, Inc. Systems and methods for measurement optimization
US7888011B2 (en) * 2004-10-18 2011-02-15 U.S. Genomics, Inc. Methods for isolation of nucleic acids from prokaryotic spores
US20060160231A1 (en) * 2004-11-24 2006-07-20 U.S. Genomics, Inc. Linear analysis of polymers
US20060134679A1 (en) * 2004-12-17 2006-06-22 U.S. Genomics, Inc. Methods and compositions for acquiring information from unstretched polymer conformations
US20060292616A1 (en) * 2005-06-23 2006-12-28 U.S. Genomics, Inc. Single molecule miRNA-based disease diagnostic methods
US20060292617A1 (en) * 2005-06-23 2006-12-28 U.S. Genomics, Inc. Methods and compositions for analysis of microRNA
US20070042406A1 (en) * 2005-07-18 2007-02-22 U.S. Genomics, Inc. Diffusion mediated clean-up of a target carrier fluid
US20070128083A1 (en) * 2005-07-18 2007-06-07 U.S. Genomics, Inc. Microfluidic methods and apparatuses for sample preparation and analysis

Also Published As

Publication number Publication date
EP1586068B1 (en) 2008-07-30
WO2004066185A1 (en) 2004-08-05
DE602004015408D1 (de) 2008-09-11
US20040214211A1 (en) 2004-10-28
EP1586068A1 (en) 2005-10-19

Similar Documents

Publication Publication Date Title
EP1586068B1 (en) Methods for analyzing polymer populations
US7371520B2 (en) Methods and apparati using single polymer analysis
US7282330B2 (en) Methods and apparati using single polymer analysis
US9988667B2 (en) Device and methods for epigenetic analysis
US7402422B2 (en) Systems and methods for detecting and analyzing polymers
EP2318547B1 (en) Methods for single-molecule whole genome analysis
JP2021503969A (ja) 出現(emergence)による核酸のシーケンシング
US20050112620A1 (en) Nucleic acid mapping using linear analysis
US20030235854A1 (en) Methods for analyzing a nucleic acid
US20030215864A1 (en) Compositions and methods related to two-arm nucleic acid probes
US20050196790A1 (en) Methods for detection and quantitation of minimum length polymers
US20060134679A1 (en) Methods and compositions for acquiring information from unstretched polymer conformations
US10851411B2 (en) Molecular identification with subnanometer localization accuracy
US20040185467A1 (en) Genotyping

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070117

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070117

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091207

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100305

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100312

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100727