[go: up one dir, main page]

JP6799175B2 - 癌の検出用のプローブの組合せ - Google Patents

癌の検出用のプローブの組合せ Download PDF

Info

Publication number
JP6799175B2
JP6799175B2 JP2019556419A JP2019556419A JP6799175B2 JP 6799175 B2 JP6799175 B2 JP 6799175B2 JP 2019556419 A JP2019556419 A JP 2019556419A JP 2019556419 A JP2019556419 A JP 2019556419A JP 6799175 B2 JP6799175 B2 JP 6799175B2
Authority
JP
Japan
Prior art keywords
gene
entrez gene
probes
hbv
genotype
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019556419A
Other languages
English (en)
Other versions
JP2020503067A (ja
Inventor
リン,ユウ−ユ
ワン,ヤ−チュン
ツェン,シェン−タイ
Original Assignee
ティーシーエム バイオテック インターナショナル コーポレーション
ティーシーエム バイオテック インターナショナル コーポレーション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ティーシーエム バイオテック インターナショナル コーポレーション, ティーシーエム バイオテック インターナショナル コーポレーション filed Critical ティーシーエム バイオテック インターナショナル コーポレーション
Publication of JP2020503067A publication Critical patent/JP2020503067A/ja
Application granted granted Critical
Publication of JP6799175B2 publication Critical patent/JP6799175B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/70Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
    • C12Q1/701Specific hybridization probes
    • C12Q1/706Specific hybridization probes for hepatitis

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Pathology (AREA)
  • Communicable Diseases (AREA)
  • Virology (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Description

関連出願の相互参照
本開示は2017年2月7日に出願された米国仮特許出願第62/456087号の優先権を主張し、その全体は、参照により本明細書に組み込まれる。
本開示はプローブの組合せに関し、より詳細には、癌の検出用の配列特異的プローブの組合せに関する。
ヘパドナウイルス科は、肝炎、肝細胞癌(HCC)および肝硬変の病因と関連することが報告されているウイルスのファミリーである。B型肝炎ウイルス(HBV)はヘパドナウイルスファミリーのもっとも一般的なウイルスであり、遺伝子型A〜Jに分類され得る小型DNAウイルスである。HBVに感染したほとんどの成人は回復することができるが、HBVに感染した患者の約5〜10%はウイルスを除去することができず、慢性的に感染する。慢性HBV感染の患者は、HBVが宿主ゲノムに組み込まれ、肝細胞に遺伝的改変およびエピジェネティック改変を引き起こし得るため、HCCを発症するリスクが高い。
HBVの組込みを検出する方法が少数報告されている。例えば、Jiangによる「The effects of hepatitis B virus integration into the genomes of hepatocellular carcinoma patients」(Genome Res. (2012) 22, 593-601)およびSungによる「Genome-wide survey of recurrent HBV integration in hepatocellular carcinoma」(Nature Genetics (2012) 44, 765-769)は、肝細胞癌試料におけるHBV組込みを検出するために全ゲノムシークエンシングを利用することを開示した。しかし、これらのダイレクトシークエンシング法の有効性は低かった。Jiangによって報告されているように、2500〜3500万個もの、平均して75bpのリードが各データセットについて生成され、JiangのデータセットについてのHBVおよび接合部リードの典型的な数は、それぞれ600万およびわずか400のリードであった。さらに、血中循環腫瘍DNA(ctDNA)試料からHBV組込みを検出し得る、ダイレクトシークエンシングに基づく研究がまだ存在する。
その後、Liによる「HIVID: An efficient method to detect HBV integration using low coverage sequencing」(Genomics (2013) 102:4, 338-344)およびZhaoによる「Genomic and oncogenic preference of HBV integration in hepatocellular carcinoma」(Nature Communications (2016) 7:12992)は、HBV組込み検出用である、HBVゲノム配列に従って設計された配列キャプチャプローブの使用を開示した。しかし、LiもZhaoも、そのプローブの設計理論的根拠に関する明確なアイデアが提供されていなかった。さらに、LiおよびZhaoによって報告されたプローブの有効性は低かった。LiおよびZhaoの両方において、平均ヒト比率は83.7%と高く、平均HBVアライメント比および平均組込み率はそれぞれ0.08%および0.01%と低かった。このことは、プローブがHBV組込みを検出するのに依然として非効率的かつ効率的でないことを示唆している。
本発明は、ウイルスDNAおよびウイルス−宿主接合部(viral-host junction)を捕捉する際に高感度かつ高効率であるプローブの組合せのパネル、およびそれと共に使用される分析方法を提供する。
本発明の実施形態は、癌検出用のプローブの組合せを提供する。プローブの組合せは、B型肝炎ウイルス(HBV)の一部を標的とするプローブのセットを1つ以上含む。HBVの一部を標的とするプローブのセットそれぞれの配列をアライメントしたとき、HBVの一部を標的とするプローブのアライメントしたセットの配列全体が、HBV遺伝子型のゲノムにおける直接反復配列(DR)領域の参照配列と一致する。HBVの一部を標的とするプローブのアライメントしたセットにおいて、HBVの一部を標的とするプローブはそれぞれ、HBVの一部を標的とするプローブの長さの一部分だけ、1つまたは2つの隣接するHBVの一部を標的とするプローブと重複する。
好ましい実施形態において、HBV遺伝子型は、遺伝子型A、遺伝子型B、遺伝子型C、遺伝子型D、遺伝子型E、遺伝子型F、遺伝子型G、遺伝子型H、遺伝子型Iおよび遺伝子型Jを含む。
好ましい実施形態において、DR領域の参照配列は配列番号3〜32を含む。
好ましい実施形態において、プローブの組合せは、HBVの全長を標的とするプローブのセットを1つ以上含む、または、さらに含む。HBVの全長を標的とするプローブのセットそれぞれの配列をアライメントしたとき、HBVの全長を標的とするプローブのアライメントしたセットの配列全体が、HBV遺伝子型のゲノムの参照配列と一致する。HBVの全長を標的とするプローブのアライメントしたセットにおいて、HBVの全長を標的とするプローブはそれぞれ、HBVの全長を標的とするプローブの長さの一部分だけ、1つまたは2つの隣接するHBVの全長を標的とするプローブと重複する。
好ましい実施形態において、プローブの組合せは、ホットスポット遺伝子標的プローブのセットを1つ以上さらに含む。ホットスポット遺伝子標的プローブのセットそれぞれの配列をアライメントしたとき、ホットスポット遺伝子標的プローブのアライメントしたセットの配列全体が、癌ホットスポット遺伝子の参照配列と一致する。ホットスポット遺伝子標的プローブのアライメントしたセットにおいて、ホットスポット遺伝子標的プローブはそれぞれ、ホットスポット遺伝子標的プローブの長さの一部分だけ、1つまたは2つの隣接するホットスポット遺伝子標的プローブと重複する。
好ましい実施形態において、癌ホットスポット遺伝子は、CTNNB1、TERT、およびTP53遺伝子を含む。
好ましい実施形態において、癌ホットスポット遺伝子の参照配列は配列番号33〜41を含む。
好ましい実施形態において、プローブの組合せは、外来遺伝子標的プローブのセットを1つ以上さらに含む。外来遺伝子標的プローブのセットそれぞれの配列をアライメントしたとき、外来遺伝子標的プローブのアライメントしたセットの配列全体が、外来遺伝子の参照配列と一致する。外来遺伝子標的プローブのアライメントしたセットにおいて、外来遺伝子標的プローブはそれぞれ、外来遺伝子標的プローブの長さの一部分だけ、1つまたは2つの隣接する外来遺伝子標的プローブと重複する。
好ましい実施形態において、外来遺伝子はλファージ由来である。
好ましい実施形態において、外来遺伝子の参照配列は配列番号42〜54を含む。
好ましい実施形態において、プローブの組合せは、内在遺伝子標的プローブのセットを1つ以上さらに含む。内在遺伝子標的プローブのセットそれぞれの配列をアライメントしたとき、内在遺伝子標的プローブのアライメントしたセットの配列全体が、内在遺伝子の参照配列と一致する。内在遺伝子標的プローブのアライメントしたセットにおいて、内在遺伝子標的プローブはそれぞれ、内在遺伝子標的プローブの長さの一部分だけ、1つまたは2つの隣接する内在遺伝子標的プローブと重複する。
好ましい実施形態において、内在遺伝子は、GAPDHおよびGdX遺伝子を含む。
好ましい実施形態において、内在遺伝子の参照配列は、配列番号55および配列番号56を含む。
好ましくは、種々の実施形態のプローブの組合せによって検出される癌は、肝細胞癌を含む。
好ましくは、種々の実施形態のプローブの組合せは、HBVに感染した対象の試料として得られたDNAから、ウイルス−宿主接合部を有する標的ヌクレオチド断片を捕捉するために使用される。
好ましくは、試料から得られるDNAは、対象のゲノムDNAおよび血中循環腫瘍DNA(ctDNA)を含む。
好ましくは、試料は体液および肝臓組織を含む。
要するに、前述の実施形態に係る本発明は、ウイルス感染およびウイルス感染誘発癌の検出用の強力かつ汎用性のあるツールを提供する。本発明の実施形態は、様々な種類のDNAウイルスの存在およびウイルス組込みを検出するために適用され得る。本実施形態によって設計されたプローブの組合せは、最適なウイルス/宿主配列カバレッジを確実にし、遺伝的安定性を考慮し、したがって、高感度、高効率、および高信頼性であることが証明される。
添付の図面は1つ以上の本発明の実施形態を示し、本明細書とともに、本発明の原理を説明する。できる限り、実施形態の同じまたは同様の要素を示すために、図面全体にわたって同じ符号が使用される。
本発明の実施形態における、参照配列を取得する工程を示すフローチャートである。 本発明の実施形態における、プローブの設計コンセプトを示す模式図である。 本発明の実施形態における、プローブの設計コンセプトを示す模式図である。 本発明の実施形態において設計されたプローブの選択的ハイブリダイゼーションを示す実験結果である。 本発明の実施形態において設計されたプローブの特異性を示す実験結果である。 本発明の実施形態において設計されたプローブの特異性を示す実験結果である。 本発明の実施形態における、プローブの組合せを用いた、ペア腫瘍ゲノムDNA(gDNA)試料における様々な遺伝子領域での次世代シークエンシング(NGS)結果を示す、ヒートマップ変換棒グラフである。 本発明の実施形態における、プローブの組合せを用いた、ペア血漿循環腫瘍DNA(ctDNA)試料における様々な遺伝子領域でのNGSの結果を示す、ヒートマップ変換棒グラフである。 本発明の実施形態における、プローブの組合せを用いた、腫瘍gDNA試料における様々な遺伝子領域でのNGSの結果を示す、ヒートマップ変換棒グラフである。 本発明の実施形態のプローブの組合せによってハイブリダイズされたDNA試料のNGS統計を示す、実験結果である。
一般的な慣行に従い、様々な説明した特徴は、一定の縮尺で描かれておらず、本開示に関連する特徴を強調するために描いている。同様の参照符号は、図面および本文全体を通して同様の要素を示す。
以下、本発明の様々な例示的な実施形態を示す添付の図面を参照しながら、本発明をより完全に説明する。しかしながら、本発明は多くの様々な形態で実施することができ、本明細書に記載の実施形態に限定されると解釈されるべきではない。むしろ、これらの実施形態は本開示が徹底的かつ完全であり、本開示の範囲を当業者に完全に伝えるように提供される。全体を通して、同様の参照番号は同様の要素を示す。
本明細書で使用する用語は特定の実施形態のみを説明するためのものであり、本発明を限定することを意図するものではない。本明細書で使用するように、単数形「a」、「an」および「the」は文脈が明確にそわないことを示さない限り、複数形も含むことが意図される。用語「含む(comprises)」および/もしくは「含む(comprising)」、または「含む(includes)」および/もしくは「含む(including)」、または「有する(has)」および/もしくは「有する(having)」を本明細書で使用する場合、説明した特徴、領域、整数、工程、動作、要素、および/または構成要素の存在を特定するが、1つ以上の他の特徴、領域、整数、工程、動作、要素、構成要素、および/またはその群の存在または追加を排除しないことがさらに理解されるのであろう。
用語「および/または」および「少なくとも1つ」は、関連する列挙された項目のうちの1つ以上の任意の組合せおよびすべての組合せを含むことが理解されるのであろう。第1、第2、第3などの用語は様々な要素、構成要素、領域、部品および/または部分を説明するために本明細書で使用され得るが、これらの要素、構成要素、領域、部品および/または部分はこれらの用語によって限定されるべきではないことも理解されるのであろう。これらの用語は、1つの要素、構成要素、領域、部品または部分を、別の要素、構成要素、領域、層または部分と区別するためにのみ使用される。したがって、以下で説明する第1の要素、構成要素、領域、部品または部分は、本開示の教示から逸脱することなく、第2の要素、構成要素、領域、層、または部分と呼ぶことができる。
他に定義されない限り、本明細書で使用するすべての用語(技術用語および科学用語を含む)は、本開示が属する技術分野の当業者によって一般に理解されるものと同じ意味を有する。さらに、一般に使用される辞書で定義される用語などの用語は、関連技術および本開示の文脈におけるそれらの意味と一致する意味を有するものとして解釈されるべきであり、本明細書で明示的に定義されない限り、理想的な意味または過度に正式的な意味で解釈されないことが理解されるのであろう。
本発明の一態様は、配列標的プローブのセットを1つ以上含むプローブの組合せを提供する。一本鎖デオキシリボ核酸(ssDNA)、リボ核酸(RNA)および人工ヌクレオチド等の一本鎖オリゴヌクレオチドおよびポリヌクレオチドを含み得る。プローブの組合せは、ウイルス感染またはウイルス感染誘発癌、特にDNAウイルスによって引き起こされるかまたはそれに関連する癌の検出に使用してもよい。いくつかの実施形態において、プローブの組合せは、B型肝炎ウイルス(HBV)、ヒトパピローマウイルス(HPV)、エプスタインバーウイルス(EBV)、ヘルペスウイルス8(HHV−8)、ヒトTリンパ球向性ウイルス(HTLV)、メルケル細胞ポリオーマウイルス(MCV)、または他のDNAウイルスによる感染を検出するために使用され得る。他の実施形態において、プローブの組合せは、肝細胞癌、肝臓癌、子宮頸癌、陰茎癌、肛門癌、膣癌、外陰癌、口腔癌、口腔咽頭癌、鼻咽頭癌、頭頸部癌、リンパ腫、原発性滲出液リンパ腫、胃癌、カポジ肉腫、メルケル細胞癌、またはDNAウイルスによる感染に関連する他の癌の検出のために使用され得る。
本発明の実施形態によれば、プローブの組合せは、ウイルス配列の全長を標的とするプローブのセットを1つ以上含む。ウイルス配列の全長を標的とするプローブのセットそれぞれの配列をアライメントしたとき、ウイルス配列の全長を標的とするプローブのアライメントしたセットの配列全体が、標的ウイルスの遺伝子型のゲノムの参照配列と一致する。標的ウイルスは、上述の様々なDNAウイルスの遺伝子型を含んでいてもよい。例えば、HBVが標的ウイルスの場合、その遺伝子型には、遺伝子型A、遺伝子型B、遺伝子型C、遺伝子型D、遺伝子型E、遺伝子型F、遺伝子型G、遺伝子型H、遺伝子型Iおよび遺伝子型Jが含まれていてもよい。ウイルスゲノムの参照配列は、NCBI GenBankから検索してもよいし、臨床試料から得られた配列から算出してもよい。例えば、HBV遺伝子型Aの参照配列は、NCBI GenBank(https://www.ncbi.nlm.nih.gov/GenBank/)アクセッション番号AP007263、HE974383またはHE974381から検索してもよい。HBV遺伝子型Bの参照配列は、GenBankアクセッション番号AB981581、AB602818またはAB554017から検索してもよい。HBV遺伝子型Cの参照配列は、GenBankアクセッション番号LC360507、AB644287またはAB113879から検索してもよい。HBV遺伝子型Dの参照配列は、GenBankアクセッション番号HE815465、HE974382またはAB554024から検索してもよい。HBV遺伝子型Eの参照配列は、GenBankアクセッション番号HE974380、HE974384、AP007262から検索してもよい。HBV遺伝子型Fの参照配列は、GenBankアクセッション番号DQ823095、AB036909またはAB036920から検索してもよい。HBV遺伝子型Gの参照配列は、GenBankアクセッション番号AB625342、HE981176またはGU563559から検索してもよい。HBV遺伝子型Hの参照配列は、GenBankアクセッション番号AB298362、AB846650、AB516395から検索してもよい。HBV遺伝子型Iの参照配列は、GenBankアクセッション番号EU833891、KF214680またはKU950741から検索してもよい。HBV遺伝子型Jの参照配列は、GenBankアクセッション番号AB486012から検索してもよい。
例示的な実施形態において、プローブの組合せは、HBVの全長を標的とするプローブのセットを2つ含む。HBVの全長を標的とするプローブの一方のセットの配列をアライメントしたとき、アライメントしたHBVの全長を標的とするプローブの配列全体が、HBV遺伝子型Bのゲノムの参照配列(配列番号1)と一致する。同様に、HBVの全長を標的とするプローブの他方のセットの配列をアライメントしたとき、HBVの全長を標的とするプローブのアライメントしたセットの配列全体が、HBV遺伝子型Cのゲノムの参照配列(配列番号2)と一致する。例示的な実施形態において、HBVゲノムの参照配列は、図1に示されるようにして得られる。工程S1のように、DNAは慢性HBV患者の体液(例えば、血液、リンパ液、尿、汗、唾液、涙、または腸液)および組織(例えば、肝臓組織)等の試料から抽出した。抽出したDNAには、患者のゲノムDNA(gDNA)および/または血中循環腫瘍DNA(ctDNA、circulating tumor DNA)が含まれる。工程S2のように、抽出したDNAは、NCBI GenBankから検索された種々のHBV遺伝子型の既知の配列によって配列決定および分類される。例示的な実施形態において、HBV遺伝子型BおよびHBV遺伝子型Cは台湾における肝細胞癌(HCC)患者の有病率で選択された;しかし、本発明の実施形態は、HBVの遺伝子型BおよびCのみに限定されず、持続感染を引き起こし得るすべてのDNAウイルスの種々の遺伝子型を包含する。工程S3のように、選択した各遺伝子型の配列をアライメントし、Clustalアルゴリズムによって計算し、配列の各位置における主要対立遺伝子(すなわち、もっとも共通であるヌクレオチド)によって、ウイルス遺伝子型のコンセンサス配列を得た。最後に、コンセンサス配列をウイルス遺伝子型の参照配列として使用する。例示的な実施形態では、HBVゲノムの参照配列にはHBV遺伝子型Bおよび遺伝子型Cのコンセンサス配列を含み、それぞれはHBV遺伝子型BまたはCゲノムの3191塩基対(bp)のすべてをカバーする。
本実施形態において、ウイルス配列標的プローブは、ウイルス配列の全長を標的とするプローブの配列をアライメントしたとき、ウイルス配列の全長を標的とするプローブはそれぞれ、ウイルス配列の全長を標的とするプローブの長さの一部分だけ、すぐ隣接するHBVの全長を標的とするプローブと重複するように設計される。図2Aに例示されるような例示的な実施形態において、HBVの全長を標的とするプローブはそれぞれ、HBVの全長を標的とするプローブの長さの一部分だけ、1つまたは2つのすぐ隣接するHBVの全長を標的とするプローブと重複する。図2Bに示すように、重複する配列の部分は変化してもよく、好ましくは50%(2×タイリング密度と示す)または75%(4×タイリング密度と示す。)であり、プローブそれぞれはすぐ隣接するプローブと60bp重複してもよい。2×タイリング密度で長さ120bpに伸長するようにプローブが設計されている例示的な実施形態において、プローブそれぞれはすぐ隣接するプローブと60bp重複してもよい。同様に、プローブの長さが120bpであり、4×タイリング密度を有する場合、プローブそれぞれはすぐ隣接するプローブと90bp重複してもよい。
さらに、ウイルスゲノムの構造もまた、プローブを設計する際に考慮され得る。例示的な実施形態において、HBVゲノムが実際は環状であることを考慮すると、HBVゲノムの参照配列の末端の3191番目を超えて伸長するHBVの全長を標的とするプローブの最後のプローブは、参照配列の開始(すなわち、1番目)に続くように設計される。例えば、120bpの長さを有し、HBVゲノムの参照配列の3121番目で開始するプローブは、3121〜3191番目に対応する71bpの領域から成り、続いて1〜49番目に対応する49bpの領域からなる。
本発明の実施形態はプローブの長さを限定するものではない。プローブの長さは、費用、キャプチャ効率、感度、特異性、または他の特定の事柄に従って設計され得ることが理解されるのであろう。いくつかの実施形態では、任意の所定の参照配列のプローブの考えられる数または量Nが式(1)によって計算され得る。
Figure 0006799175
式1において、Lは参照配列の長さを表し、Pはプローブの長さを表し、最小長(minと示す)から最大長(maxで示す)までの範囲であり得る。例えば、HBVの遺伝子型BまたはCのゲノムの3191bp長の参照配列に対して、50bp〜120bpの範囲である総数が220,597であるプローブを設計し得る。
本発明の実施形態によれば、プローブの組合せは、ウイルスの一部を標的とするプローブのセットを1つ以上含む。ウイルスの一部を標的とするプローブの配列をアライメントしたとき、ウイルスの一部を標的とするプローブの前記アライメントしたセットの配列全体が、標的ウイルスのゲノムにおける特徴的な領域の参照配列と一致する。ウイルスの一部を標的とするプローブのアライメントしたセットにおいて、ウイルスの一部を標的とするプローブはそれぞれ、ウイルスの一部を標的とするプローブの長さの一部分だけ、すぐ隣接するウイルスの一部を標的とするプローブと重複する。いくつかの実施形態において、上記特徴的な領域は、HBVゲノムの直接反復配列1(DR1)と直接反復配列2(DR2)との間の領域を含み得る。他の実施形態では、特徴的な領域がDR1とDR2との間の領域に、領域の2つの末端から伸長して所定の長さに達する2つの伸長領域を加えたものであってもよい。例えば、直接反復配列(DR)領域の960bp長の参照配列を規定する際に、DR1およびDR2がウイルスゲノムの360〜370番目および594〜604番目に位置すると仮定すると、DR領域の参照配列は、DR1とDR2との間の領域の2つの末端から360bpのさらなる伸長を有するDR1とDR2との間の領域として規定され得る。結果として、HBV遺伝子型AゲノムのDR領域の参照配列は、配列番号3〜5であり得る。HBV遺伝子型BゲノムのDR領域の参照配列は、配列番号6〜9であり得る。HBV遺伝子型CゲノムのDR領域の参照配列は、配列番号10〜13であり得る。HBV遺伝子型DゲノムのDR領域の参照配列は、配列番号14〜16であり得る。HBV遺伝子型EゲノムのDR領域の参照配列は、配列番号17〜19であり得る。HBV遺伝子型FゲノムのDR領域の参照配列は、配列番号20〜22であり得る。HBV遺伝子型GゲノムのDR領域の参照配列は、配列番号23〜25であり得る。HBV遺伝子型HゲノムのDR領域の参照配列は、配列番号26〜28であり得る。HBV遺伝子型IゲノムのDR領域の参照配列は、配列番号29〜31であり得る。HBV遺伝子型JゲノムのDR領域の参照配列は、配列番号32であり得る。
例示的な実施形態では、プローブの組合せは、HBVの一部を標的とするプローブのセットを2つ含む。HBVの一部を標的とするプローブの一方のセットの配列をアライメントしたとき、アライメントしたHBVの一部を標的とするプローブの配列全体が、HBV遺伝子型Bのゲノムの直接反復配列(DR)領域の参照配列(配列番号9)またはHBV遺伝子型CのゲノムのDR領域の参照配列と一致する(配列番号13)。DR領域は、HBVゲノムにおける1190〜2234番目、1231〜2190番目、または他の特徴的な領域として定義され得る。上記と同様に、HBVの一部を標的とするプローブはそれぞれ、HBVの一部を標的とするプローブの長さの一部分だけ、1つまたは2つのすぐ隣接するHBVの一部を標的とするプローブと重複する。重複する配列の部分は50%(すなわち、2×タイリング密度)または75%(すなわち、4×タイリング密度)であってもよいが、これらに限定されない。
DR領域の参照配列(配列番号9、13)に対する、HBVを一部標的とするプローブの考えられる数は、前述の式(1)に従って計算してもよい。例えば、50bp〜120bpの範囲である総数が62,196のプローブを、HBVゲノムDR領域の960bp長の参照配列に対して設計し得る。
本発明の一実施形態によれば、プローブの組合せは、ウイルス全長配列のプローブのセットと、ウイルス部分配列のプローブのセットとを含む。ウイルス全長配列のプローブおよびウイルス部分配列を組み合わせて、ウイルスゲノムの参照配列にわたる配列カバレッジを高める。例示的な実施形態において、HBVの一部を標的とするプローブが、DR領域においてHBVの全長を標的とするプローブ間をカバーするように設計される。例えば、HBVの全長を標的とするプローブの長さが120bpであり、1、61、および121番目(2×タイリング密度)で開始すると仮定すると、2×タイリングを有するHBVの一部を標的とするプローブは、31、91、および151番目で開始する。換言すれば、DR領域は4×タイリング密度(すなわち、それぞれの鎖はそのすぐ隣の鎖の75%と重複する)を有する2組のプローブ(すなわち、HBVの全長を標的とするプローブおよびHBVの一部を標的とするプローブ)によってカバーされる。
本発明の一実施形態によれば、プローブの組合せは、ホットスポット遺伝子標的プローブのセットを1つ以上さらに含む。ホットスポット遺伝子標的プローブのセットそれぞれの配列をアライメントしたとき、ホットスポット遺伝子標的プローブをアライメントしたセットの配列全体が、癌ホットスポット遺伝子の参照配列と一致する。ホットスポット遺伝子標的プローブをアライメントしたセットにおいて、ホットスポット遺伝子標的プローブのそれぞれは、ホットスポット遺伝子標的プローブの長さの一部分だけ、すぐ隣接するホットスポット遺伝子標的プローブと重複する。配列重複の部分は50%(すなわち、2×タイリング密度)または75%(すなわち、4×タイリング密度)であり得るが、これらに限定されない。
癌ホットスポット遺伝子の参照配列は、NCBI遺伝子データベースから検索可能である。癌ホットスポット遺伝子は、NCBI遺伝子データベース(www.ncbi.nlm.nih.gov/Entrez/query.fcgIDb=Gene)のEntrez Gene IDによって識別される、以下の遺伝子のうちの少なくとも1つを含み得るが、これらに限定されない:ABL1 (Entrez Gene ID: 25), ABL2 (Entrez Gene ID: 27), ACSL3 (Entrez Gene ID: 2181), AF15Q14 (Entrez Gene ID: 57082), AF1Q (Entrez Gene ID: 10962), AF3p21 (Entrez Gene ID: 51517), AF5q31 (Entrez Gene ID: 27125), AKAP9 (Entrez Gene ID: 10142), AKT1 (Entrez Gene ID: 207), AKT2 (Entrez Gene ID: 208), ALDH2 (Entrez Gene ID: 217), ALK (Entrez Gene ID: 238), ALO17 (Entrez Gene ID: 57674), APC (Entrez Gene ID: 11789), ARHGEF12 (Entrez Gene ID: 23365), ARHH (Entrez Gene ID: 399), ARID1A (Entrez Gene ID: 8289), ARID2 (Entrez Gene ID: 196528), ARNT (Entrez Gene ID: 405), ASPSCR1 (Entrez Gene ID: 79058), ASXL1 (Entrez Gene ID: 171023), ATF1 (Entrez Gene ID: 466), ATIC (Entrez Gene ID: 471), ATM (Entrez Gene ID: 472), ATRX (Entrez Gene ID: 546), BAP1 (Entrez Gene ID: 8314), BCL10 (Entrez Gene ID: 8915), BCL11A (Entrez Gene ID: 53335), BCL11B (Entrez Gene ID: 64919), BCL2 (Entrez Gene ID: 596), BCL3 (Entrez Gene ID: 602), BCL5 (Entrez Gene ID: 603), BCL6 (Entrez Gene ID: 604), BCL7A (Entrez Gene ID: 605), BCL9 (Entrez Gene ID: 607), BCOR (Entrez Gene ID: 54880), BCR (Entrez Gene ID: 613), BHD (Entrez Gene ID: 50947), BIRC3 (Entrez Gene ID: 330), BLM (Entrez Gene ID: 641), BMPRIA (Entrez Gene ID: 12166), BRAF (Entrez Gene ID: 673), BRCA1 (Entrez Gene ID: 672), BRCA2 (Entrez Gene ID: 675), BRD3 (Entrez Gene ID: 8019), BRD4 (Entrez Gene ID: 23476), BRIP1 (Entrez Gene ID: 83990), BTG1 (Entrez Gene ID: 694), BUB1B (Entrez Gene ID: 701), C15orf55 (Entrez Gene ID: 144535), C16orf75 (Entrez Gene ID: 387882), CANT1 (Entrez Gene ID: 124583), CARD11 (Entrez Gene ID: 84433), CARs (Entrez Gene ID: 833), CBFB (Entrez Gene ID: 865), CBL (Entrez Gene ID: 867), CBLB (Entrez Gene ID: 868), CBLC (Entrez Gene ID: 23624), CCNB1IP1 (Entrez Gene ID: 57820), CCND1 (Entrez Gene ID: 595), CCND2 (Entrez Gene ID: 894), CCND3 (Entrez Gene ID: 896), CCNE1 (Entrez Gene ID: 898), CD273 (Entrez Gene ID: 80380), CD274 (Entrez Gene ID: 29126), CD74 (Entrez Gene ID: 972), CD79A (Entrez Gene ID: 973), CD79B (Entrez Gene ID: 974), CDH1 (Entrez Gene ID: 999), CDH11 (Entrez Gene ID: 1009), CDK12 (Entrez Gene ID: 51755), CDK4 (Entrez Gene ID: 1019), CDK6 (Entrez Gene ID: 1021), CDKN2A (Entrez Gene ID: 1029), CDKN2C (Entrez Gene ID: 1031), CDX2 (Entrez Gene ID: 1045), CEBPA (Entrez Gene ID: 1050), CEP1 (Entrez Gene ID: 11064), CHCHD7 (Entrez Gene ID: 79145), CHEK2 (Entrez Gene ID: 11200), CHIC2 (Entrez Gene ID: 26511), CHN1 (Entrez Gene ID: 1123), CIC (Entrez Gene ID: 23152), CIITA (Entrez Gene ID: 4261), CLTC (Entrez Gene ID: 1213), CLTCL1 (Entrez Gene ID: 8218), CMKOR1 (Entrez Gene ID: 57007), CoL1A1 (Entrez Gene ID: 1277), CPBP (Entrez Gene ID: 1316), COX6C (Entrez Gene ID: 1345), CREB1 (Entrez Gene ID: 1385), CREB3L1 (Entrez Gene ID: 90993), CREB3L2 (Entrez Gene ID: 64764), CREBBP (Entrez Gene ID: 1387), CRLF2 (Entrez Gene ID: 64109), CRTC3 (Entrez Gene ID: 64784), CTNNB1 (catenin beta 1; Entrez Gene ID: 1499), CYLD (Entrez Gene ID: 1540), D10S170 (Entrez Gene ID: 8030), DAXX (Entrez Gene ID: 1616), DDB2 (Entrez Gene ID: 1643), DDX10 (Entrez Gene ID: 1662), DDX5 (Entrez Gene ID: 1655), DDX6 (Entrez Gene ID: 1656), DEK (Entrez Gene ID: 7913), DICER1 (Entrez Gene ID: 23405), DNMT3A (Entrez Gene ID: 1788), DUX4 (Entrez Gene ID: 100288687), EBF1 (Entrez Gene ID: 1879), EGFR (Entrez Gene ID: 1956), EIF4A2 (Entrez Gene ID: 1974), ELF4 (Entrez Gene ID: 2000), ELK4 (Entrez Gene ID: 2005), ELKS (Entrez Gene ID: 23085), ELL (Entrez Gene ID: 8178), ELN (Entrez Gene ID: 2006), EML4 (Entrez Gene ID: 27436), EP300 (Entrez Gene ID: 2033), EPS15 (Entrez Gene ID: 2060), ERBB2 (Entrez Gene ID: 2064), ERCC2 (Entrez Gene ID: 2068), ERCC3 (Entrez Gene ID: 2071), ERCC4 (Entrez Gene ID: 2072), ERCC5 (Entrez Gene ID: 2073), ERG (Entrez Gene ID: 2078), ETV1 (Entrez Gene ID: 2115), ETV4 (Entrez Gene ID: 2118), ETV5 (Entrez Gene ID: 2119), ETV6 (Entrez Gene ID: 2120), EVI1 (Entrez Gene ID: 2122), EWsR1 (Entrez Gene ID: 2130), EXT1 (Entrez Gene ID: 2131), EXT2 (Entrez Gene ID: 2132), EZH2 (Entrez Gene ID: 2146), FACL6 (Entrez Gene ID: 23305), FAM22A (Entrez Gene ID: 728118), FAM22B (Entrez Gene ID: 729262), FAM46C (Entrez Gene ID: 54855), FANCA (Entrez Gene ID: 2175), FANCC (Entrez Gene ID: 2176), FANCD2 (Entrez Gene ID: 2177), FANCE (Entrez Gene ID: 2178), FANCF (Entrez Gene ID: 2188), FANCG (Entrez Gene ID: 2189), FBXO11 (Entrez Gene ID: 80204), FBXW7 (Entrez Gene ID: 55294), FCGR2B (Entrez Gene ID: 2213), FEV (Entrez Gene ID: 54738), FGFR1 (Entrez Gene ID: 2260), FGFR1OP (Entrez Gene ID: 11116), FGFR2 (Entrez Gene ID: 2263), FGFR3 (Entrez Gene ID: 2261), FH (Entrez Gene ID: 2271), FHIT (Entrez Gene ID: 2272), FIP1L1 (Entrez Gene ID: 81608), FLI1 (Entrez Gene ID: 2313), FLT3 (Entrez Gene ID: 2322), FNBP1 (Entrez Gene ID: 23048), FOXL2 (Entrez Gene ID: 668), FOXO1 (Entrez Gene ID: 2308), FOXO3A (Entrez Gene ID: 2309), FOXP1 (Entrez Gene ID: 27086), FSTL3 (Entrez Gene ID: 10272), FUBP1 (Entrez Gene ID: 8880), FUS (Entrez Gene ID: 2521), FVT1 (Entrez Gene ID: 2531), GAS7 (Entrez Gene ID: 8522), GATA1 (Entrez Gene ID: 2623), GATA2 (Entrez Gene ID: 2624), GATA3 (Entrez Gene ID: 2625), GMPS (Entrez Gene ID: 8833), GNA11 (Entrez Gene ID: 2767), GNAQ (Entrez Gene ID: 2776), GNAS (Entrez Gene ID: 2778), GOLGA5 (Entrez Gene ID: 9950), GOPC (Entrez Gene ID: 57120), GPC3 (Entrez Gene ID: 2719), GPHN (Entrez Gene ID: 10243), GRAF (Entrez Gene ID: 23092), HCMOGT-1 (Entrez Gene ID: 92521), HEAB (Entrez Gene ID: 10978), HERPUD1 (Entrez Gene ID: 9709), HEY1 (Entrez Gene ID: 23462), HIP1 (Entrez Gene ID: 3092), HIST1H4I (Entrez Gene ID: 8294), HLF (Entrez Gene ID: 3131), HLXB9 (Entrez Gene ID: 3110), HMGA1 (Entrez Gene ID: 3159), HMGA2 (Entrez Gene ID: 8091), HNRNPA2B1 (Entrez Gene ID: 3181), HOOK3 (Entrez Gene ID: 84376), HOXA11 (Entrez Gene ID: 3207), HOXA13 (Entrez Gene ID: 3209), HOXA9 (Entrez Gene ID: 3205), HOXC11 (Entrez Gene ID: 3227), HOXC13 (Entrez Gene ID: 3229), HOXD11 (Entrez Gene ID: 3237), HOXD13 (Entrez Gene ID: 3239), HRAS (Entrez Gene ID: 3265), HRPT2 (Entrez Gene ID: 79577), HSPCA (Entrez Gene ID: 3320), HSPCB (Entrez Gene ID: 3326), IDH1 (Entrez Gene ID: 3417), IDH2 (Entrez Gene ID: 3418), IGH@ (Entrez Gene ID: 3492), IGK@ (Entrez Gene ID: 50802), IGL@ (Entrez Gene ID: 3535), IKZF1 (Entrez Gene ID: 10320), IL2 (Entrez Gene ID: 3558), IL21R (Entrez Gene ID: 50615), IL6ST (Entrez Gene ID: 3572), IL7R (Entrez Gene ID: 3575), IRF4 (Entrez Gene ID: 3662), IRTA1 (Entrez Gene ID: 83417), ITK (Entrez Gene ID: 3702), JAK1 (Entrez Gene ID: 3716), JAK2 (Entrez Gene ID: 3717), JAK3 (Entrez Gene ID: 3718), JAZF1 (Entrez Gene ID: 221895), JUN (Entrez Gene ID: 3725), KDR (Entrez Gene ID: 3791), KIAA1549 (Entrez Gene ID: 57670), KIT (Entrez Gene ID: 3815), KLK2 (Entrez Gene ID: 3817), KRAS (Entrez Gene ID: 3845), KTN1 (Entrez Gene ID: 3895), LAF4 (Entrez Gene ID: 3899), LASP1 (Entrez Gene ID: 3927), LCK (Entrez Gene ID: 3932), LCP1 (Entrez Gene ID: 3936), LCX (Entrez Gene ID: 80312), LHFP (Entrez Gene ID: 10186), LIFR (Entrez Gene ID: 3977), LMO1 (Entrez Gene ID: 4004), LMO2 (Entrez Gene ID: 4005), LPP (Entrez Gene ID: 4026), LYL1 (Entrez Gene ID: 4066), MADH4 (Entrez Gene ID: 4089), MAF (Entrez Gene ID: 4094), MAFB (Entrez Gene ID: 9935), MALT1 (Entrez Gene ID: 10892), MAML2 (Entrez Gene ID: 84441), MAP2K4 (Entrez Gene ID: 6416), MDM2 (Entrez Gene ID: 4193), MDM4 (Entrez Gene ID: 4194), MDS1 (Entrez Gene ID: 2122), MDS2 (Entrez Gene ID: 259283), MECT1 (Entrez Gene ID: 23373), MED12 (Entrez Gene ID: 9968), MEN1 (Entrez Gene ID: 4221), MET (Entrez Gene ID: 4233), MITF (Entrez Gene ID: 4286), MKL1 (Entrez Gene ID: 57591), MLF1 (Entrez Gene ID: 4291), MLH1 (Entrez Gene ID: 4292), MLL (Entrez Gene ID: 4297), MLL2 (Entrez Gene ID: 8085), MLL3 (Entrez Gene ID: 58508), MLLT1 (Entrez Gene ID: 4298), MLLT10 (Entrez Gene ID: 8028), MLLT2 (Entrez Gene ID: 4299), MLLT3 (Entrez Gene ID: 4300), MLLT4 (Entrez Gene ID: 4301), MLLT6 (Entrez Gene ID: 4302), MLLT7 (Entrez Gene ID: 4303), MN1 (Entrez Gene ID: 4330), MPL (Entrez Gene ID: 4352), MSF (Entrez Gene ID: 10801), MSH2 (Entrez Gene ID: 4436), MSH6 (Entrez Gene ID: 2956), MsI2 (Entrez Gene ID: 124540), MSN (Entrez Gene ID: 4478), MTCP1 (Entrez Gene ID: 4515), MUC1 (Entrez Gene ID: 4582), MUTYH (Entrez Gene ID: 4595), MYB (Entrez Gene ID: 4602), MYC (Entrez Gene ID: 4609), MYCL1 (Entrez Gene ID: 4610), MYCN (Entrez Gene ID: 4613), MYD88 (Entrez Gene ID: 4615), MYH11 (Entrez Gene ID: 4629), MYH9 (Entrez Gene ID: 4627), MYST4 (Entrez Gene ID: 23522), NACA (Entrez Gene ID: 4666), NBS1 (Entrez Gene ID: 4683), NCOA1 (Entrez Gene ID: 8648), NCOA2 (Entrez Gene ID: 10499), NCOA4 (Entrez Gene ID: 8031), NDRG1 (Entrez Gene ID: 10397), NF1 (Entrez Gene ID: 4763), NF2 (Entrez Gene ID: 4771), NFE2L2 (Entrez Gene ID: 4780), NFIB (Entrez Gene ID: 4781), NFKB2 (Entrez Gene ID: 4791), NIN (Entrez Gene ID: 51199), NKX2-1 (Entrez Gene ID: 7080), NONO (Entrez Gene ID: 4841), NOTCH1 (Entrez Gene ID: 4851), NOTCH2 (Entrez Gene ID: 4853), NPM1 (Entrez Gene ID: 4869), NR4A3 (Entrez Gene ID: 8013), NRAS (Entrez Gene ID: 4893), NSD1 (Entrez Gene ID: 64324), NTRK1 (Entrez Gene ID: 4914), NTRK3 (Entrez Gene ID: 4916), NUMA1 (Entrez Gene ID: 4926), NUP214 (Entrez Gene ID: 8021), NUP98 (Entrez Gene ID: 4928), OLIG2 (Entrez Gene ID: 10215), OMD (Entrez Gene ID: 4958), PAFAHIB2 (Entrez Gene ID: 5049), PALB2 (Entrez Gene ID: 79728), PAX3 (Entrez Gene ID: 5077), PAX5 (Entrez Gene ID: 5079), PAX7 (Entrez Gene ID: 5081), PAX8 (Entrez Gene ID: 7849), PBRM1 (Entrez Gene ID: 55193), PBX1 (Entrez Gene ID: 5087), PCM1 (Entrez Gene ID: 5108), PCSK7 (Entrez Gene ID: 9159), PDE4DIP (Entrez Gene ID: 9659), PDGFB (Entrez Gene ID: 5155), PDGFRA (Entrez Gene ID: 5156), PDGFRB (Entrez Gene ID: 5159), PER1 (Entrez Gene ID: 5187), PHOX2B (Entrez Gene ID: 8929), PICALM (Entrez Gene ID: 8301), PIK3CA (Entrez Gene ID: 5290), PIK3R1 (Entrez Gene ID: 5295), PIM1 (Entrez Gene ID: 5292), PLAG1 (Entrez Gene ID: 5324), PML (Entrez Gene ID: 5371), PMS1 (Entrez Gene ID: 537
8), PMS2 (Entrez Gene ID: 5395), PMX1 (Entrez Gene ID: 5396), PNUTL1 (Entrez Gene ID: 5413), POU2AFI (Entrez Gene ID: 5450), POU5F1 (Entrez Gene ID: 5460), PPARG (Entrez Gene ID: 5468), PPP2R1A (Entrez Gene ID: 5518), PRCC (Entrez Gene ID: 5546), PRDM1 (Entrez Gene ID: 639), PRDM16 (Entrez Gene ID: 63976), PRF1 (Entrez Gene ID: 5551), PRKAR1A (Entrez Gene ID: 5573), PRO1073 (Entrez Gene ID: 57018), PSIP2 (Entrez Gene ID: 11168), PTCH (Entrez Gene ID: 5727), PTEN (Entrez Gene ID: 5728), PTPN11 (Entrez Gene ID: 5781), RAB5EP (Entrez Gene ID: 9135), RAD51L1 (Entrez Gene ID: 5890), RAF1 (Entrez Gene ID: 5894), RALGDS (Entrez Gene ID: 5900), RANBP17 (Entrez Gene ID: 64901), RAP1GDS1 (Entrez Gene ID: 5910), RARA (Entrez Gene ID: 5914), RB1 (Entrez Gene ID: 5925), RBM15 (Entrez Gene ID: 64783), RECQL4 (Entrez Gene ID: 9401), REL (Entrez Gene ID: 5966), RET (Entrez Gene ID: 5979), ROS1 (Entrez Gene ID: 6098), RPL22 (Entrez Gene ID: 6146), RPN1 (Entrez Gene ID: 6184), RuNDC2A (Entrez Gene ID: 92017), RUNX1 (Entrez Gene ID: 861), RUNXBP2 (Entrez Gene ID: 7994), SBDS (Entrez Gene ID: 51119), SDH5 (Entrez Gene ID: 54949), SDHB (Entrez Gene ID: 6390), SDHC (Entrez Gene ID: 6391), SDHD (Entrez Gene ID: 6392), SEPT6 (Entrez Gene ID: 23157), SET (Entrez Gene ID: 6418), SETD2 (Entrez Gene ID: 29072), SF3B1 (Entrez Gene ID: 23451), SFPQ (Entrez Gene ID: 6421), SFRS3 (Entrez Gene ID: 6428), SH3GL1 (Entrez Gene ID: 6455), SIL (Entrez Gene ID: 6491), SLC45A3 (Entrez Gene ID: 85414), SMARCA4 (Entrez Gene ID: 6597), SMARCB1 (Entrez Gene ID: 6598), SMO (Entrez Gene ID: 6608), SOCS1 (Entrez Gene ID: 8651), SOX2 (Entrez Gene ID: 6657), SRGAP3 (Entrez Gene ID: 9901), SRSF2 (Entrez Gene ID: 6427), SS18L1 (Entrez Gene ID: 26039), SSH3BP1 (Entrez Gene ID: 10006), SSX1 (Entrez Gene ID: 6756), SSX2 (Entrez Gene ID: 6757), SSX4 (Entrez Gene ID: 6759), STK11 (Entrez Gene ID: 6794), STL (Entrez Gene ID: 7955), SUFU (Entrez Gene ID: 51684), SUZ12 (Entrez Gene ID: 23512), SYK (Entrez Gene ID: 6850), TAF15 (Entrez Gene ID: 8148), TAL1 (Entrez Gene ID: 6886), TAL2 (Entrez Gene ID: 6887), TCEA1 (Entrez Gene ID: 6917), TCF1 (Entrez Gene ID: 6927), TCF12 (Entrez Gene ID: 6938), TCF3 (Entrez Gene ID: 6929), TCF7L2 (Entrez Gene ID: 6934), TCL1A (Entrez Gene ID: 8115), TCL6 (Entrez Gene ID: 27004), TET2 (Entrez Gene ID: 54790), TERT (telomerase reverse transcriptase; Entrez Gene ID: 7015), TFE3 (Entrez Gene ID: 7030), TFEB (Entrez Gene ID: 7942), TFG (Entrez Gene ID: 10342), TFPT (Entrez Gene ID: 29844), TFRC (Entrez Gene ID: 7037), THRAP3 (Entrez Gene ID: 9967), TIF1 (Entrez Gene ID: 8805), TLX1 (Entrez Gene ID: 3195), TLX3 (Entrez Gene ID: 30012), TMPRSS2 (Entrez Gene ID: 7113), TNFAIP3 (Entrez Gene ID: 7128), TNFRSF14 (Entrez Gene ID: 8764), TNFRSF17 (Entrez Gene ID: 608), TNFRSF6 (Entrez Gene ID: 355), TOP1 (Entrez Gene ID: 7150), TP53 (tumor protein p53; Entrez Gene ID: 7157), TPM3 (Entrez Gene ID: 7170), TPM4 (Entrez Gene ID: 7171), TPR (Entrez Gene ID: 7175), TRA@ (Entrez Gene ID: 6955), TRB@ (Entrez Gene ID: 6957), TRD@ (Entrez Gene ID: 6964), TRIM27 (Entrez Gene ID: 5987), TRIM33 (Entrez Gene ID: 51592), TRIP11 (Entrez Gene ID: 9321), TSC1 (Entrez Gene ID: 7248), TSC2 (Entrez Gene ID: 7249), TSHR (Entrez Gene ID: 7253), TTL (Entrez Gene ID: 150465), U2AF1 (Entrez Gene ID: 7307), USP6 (Entrez Gene ID: 9098), VHL (Entrez Gene ID: 7428), WAS (Entrez Gene ID: 7454), WHSC1 (Entrez Gene ID: 7468), WHSC1L1 (Entrez Gene ID: 54904), WIF1 (Entrez Gene ID: 11197), WRN (Entrez Gene ID: 7486), WT1 (Entrez Gene ID: 7490), WTX (Entrez Gene ID: 139285), XPA (Entrez Gene ID: 7507), XPC (Entrez Gene ID: 7508), XPO1 (Entrez Gene ID: 7514), YWHAE (Entrez Gene ID: 7531), ZNF145 (Entrez Gene ID: 7704), ZNF198 (Entrez Gene ID: 7750), ZNF278 (Entrez Gene ID: 23598), ZNF331 (Entrez Gene ID: 55422), ZNF384 (Entrez Gene ID: 171017), ZNF521 (Entrez Gene ID: 25925), ZNF9 (Entrez Gene ID: 7555), and ZRSR2 (Entrez Gene ID: 8233)。
実施形態において、選択した癌ホットスポット遺伝子の参照配列の末端領域(例えば、最初の60bpおよび最後の60bp)は単一のプローブによってのみカバーされ、2×タイリングの場合において2つのプローブによってカバーされる非末端領域と比較して低キャプチャ効率を生じ得ることを考慮すると、癌ホットスポット遺伝子の参照配列は配列の両末端を越えて伸長され得る。例えば、CTNNB1遺伝子のエクソン3は228bpの長さであり、配列の両末端での75bpの伸長は、CTNNB1のエクソン3の378bp長の参照配列(配列番号33)を生じる。癌ホットスポット遺伝子の他の参照配列もまた、同様の様式で設計され得る。さらに、エクソンの伸長領域が隣接するエクソンまたはその伸長領域と重複する場合、2つの伸長参照配列は、エクソンとすべての伸長領域との両方をカバーする単一の参照配列に組み込まれ得る。
癌ホットスポット遺伝子に対するホットスポット遺伝子標的プローブの可能な数は、前述の式(1)に従って計算してもよい。例えば、50bp〜120bpの範囲である総数が20,874のプローブを、CTNNB1エクソン3の378bp長の参照配列(配列番号33)に対して設計し得る。同様に、50bp〜120bpの範囲である総数が41,819のプローブを、TERTプロモーターの673bp長の参照配列(配列番号34)に対して設計し得る。50bp〜120bpの範囲である総数が49,345のプローブを、TP53エクソン2/3/4の779bp長の参照配列(配列番号35)に対して設計し得る。50bp〜120bpの範囲である総数が31,524のプローブを、TP53エクソン5/6の528bp長の参照配列(配列番号36)に対して設計し得る。50bp〜120bpの範囲である総数が12,496のプローブを、TP53エクソン7の260bp長の参照配列(配列番号37)に対して設計し得る。50bp〜120bpの範囲である総数が26,199のプローブを、TP53エクソン8/9の453bp長の参照配列(配列番号39)に対して設計し得る。50bp〜120bpの範囲である総数が12,283のプローブを、TP53エクソン10の257bp長の参照配列(配列番号40)に対して設計し得る。50bp〜120bpの範囲である総数が10,508のプローブを、TP53エクソン11の232bp長の参照配列(配列番号41)に対して設計し得る。
本発明の一実施形態によれば、プローブの組合せは、陰性対照および定量用の外来遺伝子標的プローブのセットを1つ以上さらに含む。外来遺伝子標的プローブのセットの1つの配列をアライメントしたとき、アライメントしたセットの外来遺伝子標的プローブの配列全体が、外来遺伝子の参照配列と一致する。外来遺伝子標的プローブのアライメントしたセットにおいて、外来遺伝子標的プローブのそれぞれは、外来遺伝子標的プローブの長さの一部分だけ、すぐ隣接する外来遺伝子標的プローブと重複する。配列重複の部分は50%(すなわち、2×タイリング密度)または75%(すなわち、4×タイリング密度)であり得るが、これらに限定されない。
外来遺伝子の参照配列は、NCBI遺伝子データベースから検索可能である。外来遺伝子は、λファージ、大腸菌、酵母、φX174、または他の一般的な微生物に由来してもよい。外来遺伝子に対する外来遺伝子標的プローブの考えられる数は、前述の式(1)によって計算してもよい。例えば、50bp〜120bpの範囲である総数が478,682のプローブを、λファージゲノムの48502bp長の参照配列に対して設計し得る(GenBankアクセッション番号NC_001416)。
本実施形態では、外来遺伝子標的プローブの配列に対応するヌクレオチド断片(例えば、スパイクインDNA)の外部供給源が必要である。換言すれば、ヒトゲノムはそのB型肝炎またはHCC状態にかかわらず、外来遺伝子標的プローブの配列に類似したゲノム領域を含まないので、外来遺伝子標的プローブの配列に対応するヌクレオチド断片が検出処理の間に外部から加えられない場合、外来遺伝子標的プローブは理論的にはヒト試料のゲノム(gDNA)または血中循環腫瘍DNA(ctDNA)からのヌクレオチド断片を捕捉しない。外来遺伝子標的プローブによって捕捉されたすべてのヌクレオチド断片は理論的には外的に添加されたヌクレオチド断片であるので、外的に添加されたヌクレオチド断片の量および質を操作することができ、したがって絶対定量用の信頼できる手段を提供する。
例示的な実施形態において、λファージゲノムにおける4つの120bpの領域(配列番号42〜45)を、λファージ標的プローブを設計するために以下の選択基準に従って選択した:a)ヒトまたはHBVゲノムと相同性がない;b)λファージゲノムにおいてユニークである;c)所定の範囲内のGC含有量;d)長いモノマー配列(例えば、AAAAA)がない;および/またはe)primer3、netprimer、および他のプライマー設計アルゴリズムによって予測されるような重要な二次構造がない。表1に示すように、HBVの全長を標的とするプローブ、HBVの一部を標的とするプローブ、ホットスポット遺伝子標的プローブ、および外来遺伝子標的プローブは、ウイルス−宿主接合部を有するかまたは有さないHBV DNAを含む標的ヌクレオチド断片を捕捉するために、組み合わせて使用してもよい。
Figure 0006799175
表2に示す別の例示的な実施形態では、さらなるλファージ標的プローブを、4つの120bp領域(配列番号46〜49)のうちの1つの下流の伸長領域を2×または4×タイリング密度でカバーするように設計してもよい。λファージ標的プローブのさらなるセット(またはコピー)を使用して、HBV標的プローブの2つのコピー(2N)(一方は遺伝子型B、他方は遺伝子型C)およびホットスポット遺伝子標的プローブの1つのコピー(1N)をシミュレートしてもよい。その結果、λファージゲノム上の伸長領域に対応する、2×/1N、2×/2N、4×/1N、および4×/2Nλファージ標的プローブの組合せが生じる。
Figure 0006799175
さらに、GC含有量はシークエンシングカバレッジに影響を及ぼすことが報告されており、低いGC比率(GC=0.3、カバレッジ=0.6×)、最適GC比率(GC=0.48、カバレッジ=1.3×)、および高いGC比率(0.7、カバレッジ=0.4×)の試料において約3倍異なる。したがって、表2に示すように、λファージ標的プローブのさらなるセットはまた、プローブのGC含有量を内部制御するように設計してもよい。λファージゲノムにおける5つの120bpの領域(配列番号50〜54)を、以下の選択基準に従って選択した:a)ヒトまたはHBVゲノムと相同性がない;b)λファージゲノムにおいてユニークである;c)所定の範囲内のGC含有量;d)長いモノマー配列(例えば、AAAAA)がない;およびe)primer3、netprimer、および他のプライマー設計アルゴリズムによって予測されるような重要な二次構造がない。その結果、0.3、0.4、0.5、0.6、および0.68のGC含有量を有する5つの120bp長領域が、λファージ標的プローブの5つのさらなるセット(1×/1N)を設計するために選択される。
本発明の一実施形態によれば、プローブの組合せは、陽性内部制御および相対定量用の内在遺伝子標的プローブのセットを1つ以上さらに含む。内在遺伝子標的プローブのセットの1つの配列をアライメントしたとき、アライメントしたセットの内在遺伝子標的プローブの配列全体が、内在遺伝子の参照配列と一致する。内在遺伝子標的プローブのアライメントしたセットにおいて、内在遺伝子標的プローブのそれぞれは、内在遺伝子標的プローブの長さの一部分だけ、すぐ隣接する内在遺伝子標的プローブと重複する。配列重複の部分は50%(すなわち、2×タイリング密度)または75%(すなわち、4×タイリング密度)であり得るが、これらに限定されない。
内在遺伝子の参照配列は、NCBI遺伝子データベースから検索可能である。実施形態において、内在遺伝子はヒトゲノムに固有であり、NCBI遺伝子データベース(www.ncbi.nlm.nih.gov/Entrez/query.fcgIDb=Gene)のEntrez Gene IDによって識別される、以下の遺伝子のうちの少なくとも1つを含み得るが、これらに限定されない:GAPDH(グリセルアルデヒド−3−リン酸デヒドロゲナーゼ; Entrez gene ID: 2597), UBL4A(ユビキチン様4A; GdX;Entrez gene ID: 8266), HPRT1 (Entrez Gene ID: 3251), TBP (Entrez Gene ID: 6908), B2M (Entrez Gene ID: 567), RPL13A (Entrez Gene ID: 23521), RN18S1 (Entrez Gene ID: 100008588), C1orf43 (Entrez Gene ID: 25912), CHMP2A (Entrez Gene ID: 27243), EMC7 (Entrez Gene ID: 56851), GPI (Entrez Gene ID: 2821), PSMB2 (Entrez Gene ID: 5690), PSMB4 (Entrez Gene ID: 5692), RAB7A (Entrez Gene ID: 7879), REEP5 (Entrez Gene ID: 7905), SNRPD3 (Entrez Gene ID: 6634), VCP (Entrez Gene ID: 7415), VPS29 (Entrez Gene ID: 51699), ACTB (Entrez Gene ID: 60), PPIA (Entrez Gene ID: 5478), GUSB (Entrez Gene ID: 2990), HSP90AB1 (Entrez Gene ID: 3326), RPLP0 (Entrez Gene ID: 6175), TFRC (Entrez Gene ID: 7037), UBC (Entrez Gene ID: 7316)。
内在遺伝子に対する内在遺伝子標的プローブの考えられる数は、前述の式(1)に従って計算してもよい。例えば、GAPDH遺伝子の1682bp長の参照配列に対して、50bp〜120bpの範囲である総数が113,458のプローブを設計することができる。同様に、GdX遺伝子の3583bp長の参照配列に対して、50bp〜120bpの範囲である総数が248,429のプローブを設計することができる。
本実施形態において、内在遺伝子は配列検出の信頼性を高めるように選択される。すなわち、内在遺伝子は、安定して発現し、腫瘍において変異することが見出されていない一般的なハウスキーピング遺伝子に採用される。CTNNB1、TP53、TERT、および上記に列挙した他の癌関連遺伝子等の癌ホットスポット遺伝子の構造的変異が腫瘍サンプルにおいて報告されており、それらのコピー数が、欠失、重複、または他の構造的変異に起因して腫瘍形成の間に変化し得るので、癌ホットスポット遺伝子のみの検出による定量化は信頼できない可能性があることが理解され得る。したがって、表2に示す例示的な実施形態では、2×タイリング濃度におけるGAPDH遺伝子の240bpの領域(配列番号55)を標的とするプローブ、および2×タイリングにおけるGdX遺伝子の240領域(配列番号56)を標的とするプローブが内部対照としてプローブの組合せに含まれる。GAPDHおよびGdX遺伝子の240bpの領域は、HBVゲノム、長いモノマー、重要な二次構造、または所定の領域外のGC含有量に対して相同性を有さない。GdX遺伝子を採用することのさらなる利点は、GdXがまた、試験対象の性別を同定するために使用され得ることである。
本発明のいくつかの実施形態において、プローブはそれぞれマーカー分子で標識され、検出および定量が容易になる。マーカー分子にはビオチン、蛍光タンパク質、発光タンパク質、抗体、放射性化合物、またはそれらの任意の組合せを含み得るが、これらに限定されない。
本発明の別の態様は、DNAウイルス(例えば、HBV、HPV、EBV、HHV−8、HTLV、MCV、もしくは他のDNAウイルス)による感染またはウイルス感染関連癌(例えば、肝細胞癌、子宮頸癌、上咽頭癌、リンパ腫、メルケル細胞癌、もしくはDNAウイルスによる感染に関連する他の癌)を検出する方法を提供する。一実施形態において、本方法は、対象の試料から核酸を抽出する工程;核酸を増幅する工程;核酸を上記の種々の実施形態のプローブの組合せとハイブリダイズさせることによって標的ヌクレオチド断片を捕捉する工程;標的ヌクレオチド断片をシークエンシングする工程;および、標的ヌクレオチド断片を分析する工程を含む。
本実施形態において、核酸は、ウイルス核酸、宿主ゲノム核酸、およびウイルス−宿主接合部を有する核酸を含み得、そしてDNA、RNA、またはポリヌクレオチドであり得る。核酸の抽出は、沈殿、クロマトグラフィーおよび/または磁気ビーズキャプチャによって行ってもよい。核酸が抽出される試料は、体液(例えば、血液、汗、唾液、涙、尿、リンパ液、もしくは間質液)または組織(例えば、肝臓組織)であり得る。抽出した核酸の増幅は、DNAクローニング、ポリメラーゼ連鎖反応(PCR)、逆転写PCR(RT−PCR)、ネステッドPCR、定量PCR(qPCR)および/またはデジタルPCRによって行ってもよい。標的ヌクレオチド断片はハイブリダイゼーション(例えば、サザンブロットハイブリダイゼーション、in situハイブリダイゼーション、もしくはノーザンブロットハイブリダイゼーション)および/またはロックダウン(例えば、ビーズベースの方法またはチップベースの方法)によって、プローブの組合せによって捕捉してもよい。捕捉した標的核酸は、NGS(例えば、大規模並列シークエンシング、一分子シークエンシング、またはNanoString)、Maxam-Gilbertシークエンシング、Sangerシークエンシング、パイロシークエンシング、および/またはDNAマイクロアレイによってシークエンシングしてもよい。
別の実施形態では、増幅工程およびハイブリダイゼーション工程を逆にしてもよい。言い換えれば、本発明の別の実施形態による方法は、対象の試料から核酸を抽出する工程;核酸を本発明の種々の実施形態のプローブの組合せとハイブリダイズさせることによって標的ヌクレオチド断片を捕捉する工程;捕捉した標的ヌクレオチド断片を増幅する工程;標的ヌクレオチド断片をシークエンシングする工程;および、標的ヌクレオチド断片を分析する工程を含む。
プローブの組合せによって捕捉された標的核酸の分析および定量は、以下のように行ってもよい。生データのリード(RR、raw read)は、NGSシークエンシング機器から直接生成する。生データのリード中の低クオリティリードを除外し、高クオリティリード(HQR)を得る。HQRはユニークなリード(UR)に圧縮される。すなわち、完全に同一の配列を有するHQRは、単一のユニークなリードに折り畳まれ、そのコピー数(重複)に関する情報が保持される。最後に、低重複であるURを除外し、高重複であるユニークなリード(HRUR)がもたらされる。また、高重複であるユニークなリードに含まれるリード(RiHRUR)の総数は、圧縮処理中に保持された重複情報によって算出してもよい。
一実施形態において、NGSデータセットを分析する際に採用するバイオインフォマティクス分析方法を表3に要約する。
Figure 0006799175
表3はまた、本実施形態の方法と、Zhaoによって報告された方法とを比較する。表3に示すように、2つの方法において大きな違いがいくつかある。Zhaoの方法はすぐ隣接する接合部をマージする。一方、本実施形態の方法は配列類似性に基づいて接合部をマージする。また、Zhaoの方法は、ユニークな接合部のみを考慮して、重複したリードを除去する。一方、本実施形態の方法は、重複が5未満であるリードを除外し、重複情報を保持し、単一のユニークな接合部に対するリードの総数に基づいて接合部を定量する。
プローブ特異性の検証
本発明の実施形態に従って設計されたTP53エクソン2〜11(配列番号35〜38、40〜41)を標的とするプローブを、HCC患者のHCC腫瘍ゲノムDNA(gDNA)、非腫瘍gDNA、およびctDNAとハイブリダイズさせ、qPCRによって定量した。脊椎動物で保存され、肝臓で高発現するマイクロRNAであるmiR−122もまた陰性対照として定量した。
Figure 0006799175
表4に実証されるように、3つの試料タイプのすべてにおいて、miR−122よりも有意に高いTP53のハイブリダイゼーション後の保持率は、TP53断片がTP53標的プローブによってうまくハイブリダイズ、捕捉および回収されたことを示した。対照的に、TP53標的プローブがmiR−122に対して特異性を有さないので、miR−122断片は、手順中に洗い流された。表4はまた、TP53標的プローブによって捕捉されたゲノムDNAからのTP53断片の量が、miR−122断片の量よりも250倍を超えて高く、ctDNAから捕捉されたTP53断片がmiR−122断片よりも10倍を超えて濃縮されたことを示す。この結果は、TP53標的プローブが配列特異的であり、DNA試料からTP53遺伝子断片を選択的に捕捉し得ることを実証した。
一方、表5に示すように、合計26個のHCC腫瘍gDNA試料が、上記の表1に列挙したプローブの組合せによって濃縮し、HBVゲノム、HBV−ヒト接合部(「接合部」と表示)および癌ホットスポット遺伝子(CTNNB1、TERT、およびTP53を含む)の存在の分析のために、次世代配列決定(NGS)によってシークエンシングする。HBV−ヒト接合部は、ヒトゲノムへのHBV組込みを示す。表5の宿主ゲノム率は、ヒトゲノムに対する捕捉された配列の計算した長さ比である。表5に示すように、計算した宿主ゲノム比と観察されたNGSリード比との間の有意差は、プローブの組合せによるHBVゲノム、癌ホットスポット遺伝子およびHBV−ヒト接合部が濃縮していることを示した。
Figure 0006799175
宿主ゲノムにおける推定3kbの接合部の長さは、単一の接合部が150bpの検出範囲を有すると推定することによって計算されたことが理解されるのであろう。したがって、2つの接合部をもたらす、単一の組込み事象は、300bpの接合部領域によって表される。したがって、患者当たり10個の検出可能な接合部のおおよその推定値を使用することにより、個々の患者の推定接合部の長さを3kb(すなわち、300bp×10)に設定した。次いで、組込みHBV(遊離型非組込みHBVを除く)の長さを32.15kb(すなわち、3.215kb×10)と推定した。本明細書中に示すヒトゲノムにおける接合部およびHBV率の推定はとても粗く、そしておそらく過大推定であり、これは、接合部およびHBVの濃縮効率の過小評価が生じる。
ここで図3を参照する。本発明の実施形態によって設計された接合部標的プローブが、特異的なウイルス−宿主接合部を有するDNA断片を選択的に捕捉することが実証されている。HCC腫瘍gDNA試料を、3人のHCC患者(pt3、pt11、およびpt15と示す)の腫瘍組織(Tと示す)および非腫瘍組織(Nと示す)から収集し、pt3およびpt11それぞれにおけるHBV−ヒト接合部の配列に従って設計されたプローブ1(pt3接合部と示す)およびプローブ2(pt11接合部と示す)とハイブリダイズさせた。図3に示すウェスタンブロット解析によって、プローブ1が患者pt3の腫瘍gDNAと選択的にハイブリダイズし、プローブ2が患者pt11の腫瘍gDNAと選択的にハイブリダイズすることを示された。NTCは「テンプレート対照なし」を示し、実験の陰性対照として使用した;一方、PBGD(すなわち、ポルホビリノーゲンデアミナーゼ遺伝子)およびmiR−122を陽性対照として使用した。
ここで図4Aおよび4Bを参照する。次いで、プローブ1(pt3接合部と示す)を用いて、患者pt3のゲノムDNAおよび血清DNAにおけるHBV−ヒト接合部の存在を検出した。図4Aに示すように、患者pt3の腫瘍gDNAと、手術前(pre−OP)および手術後(post−OP)血清DNAとにおいて、pt3特異的HBV−ヒト接合部が観察された。このような接合部は、患者pt11または非HCC HBV陽性患者(「正常」と示す)では観察されなかった。同様に、図4Bに示すように、プローブ2(pt11接合部と示す)を用いて、患者pt11のゲノムDNAおよび血清DNAにおけるHBV−ヒト接合部の存在を検出した場合、pt11特異的HBV−ヒト接合部は、患者pt11の腫瘍gDNAと、手術前(pre−OP)血清DNAにおいて観察された。このような接合部は、患者pt15または非HCC HBV陽性患者(「正常」と表示される)では観察されなかった。
キャプチャ効率の検証
上記の表2に列挙したプローブの組合せを用いて、腫瘍gDNAおよび血漿ctDNAペア試料(すなわち、1人のHCC患者由来のDNA試料)中のDNA断片を分析し、様々な試料の種類におけるプローブの組合せのキャプチャ効率を決定した。表6のNGS統計に示すように、HBVの全長、HBVの一部、およびHBV−ヒト接合部リードにおいて、腫瘍gDNAは血漿ctDNAよりも10〜18倍高く、腫瘍gDNA試料におけるプローブの組合せの高キャプチャ効率を実証した。さらに、腫瘍gDNA試料中で同定した10の接合部の種類のうち8つは、有意なリード数(>947)を有し、75%の接合部の回収率を示した。
Figure 0006799175
図5Aおよび図5Bは、各プローブによって捕捉される、配列決定されたNGSリードの予測比を示す、ヒートマップ変換棒グラフである。一方、図6は、同じプローブの組合せを用いた別のHCC患者の腫瘍gDNA試料のNGS結果を示す(表2)。
ここで図7を参照する。HBV DNAの検出およびヒトゲノムへのHBV組込みに加え、本発明の実施形態のプローブの組合せはまた、癌関連遺伝子変異を検出し得る。図8に示すように、遺伝子型BのHBV感染を有する男女のHCC患者のDNA試料のNGS分析により、患者間において、検出されたユニークなHBV−ヒト接合部(「接合部の種類」と示す)、TERTまたはMLL4領域で検出されたユニークな接合部(「TERT/MLL4組込み」と示す)、およびTERTプロモーターまたはCTNNB1エクソン3領域における既知の癌ホットスポット変異(「TERT/CTNNB1変異」と示す)の数が異なることを示した。
利点および長所
本発明の実施形態であるプローブの組合せおよび分析方法は、従来技術よりも有意に優れた感度および効率を示す。表7に示すように、Liによって報告された結果と比較して、本発明の好ましい実施形態(表1)のプローブの組合せによって捕捉された標的ヌクレオチド断片は、HBV比が有意に高く、接合部リードが高く、そしてヒト比率が低い。
Figure 0006799175
さらに、本発明の実施形態である、ウイルス−宿主接合部を同定するバイオインフォマティクス分析法を用いて、Zhaoによって報告されたNGSデータセットの分析によって、Zhaoのリードの97.5%がヒトであり、HBV、HBVの一部、および接合部はそれぞれわずか、1.49%、1.43%、および1%であり、HBV断片およびHBV−ヒト接合部の濃縮において存在するHBVキャプチャプローブの効率の低さを再確認した。さらに、Zhaoは157個の接合部を同定することのみ報告しているが、本発明の実施形態の分析方法によるZhaoのNGSデータセットの分析によって、469個の接合部を明らかにし、Zhaoの接合部のほぼ80%を回収する。これらの結果は、本発明の実施形態の分析方法がウイルス組込みの検出において高感度であり、既存の技術よりも有意に多くのウイルス−宿主接合部を同定できることを実証する。
さらに、JiangおよびSungのダイレクトシークエンシングアプローチと比較して、本発明の実施形態であるプローブの組合せおよび分析方法は、典型的なNGSデータセットにおいて約500万の150bpのリード(すなわち、Jiangよりも、リード数の80%減少または全ヌクレオチドの60%減少)を生み出すに過ぎないが、500万のリードから307,101ものHBVリードおよび69,198もの接合部リードを同定することができる。これらの結果はまた、本発明の実施形態が、ウイルス組込みの同定において感度が高いだけでなく、高効率であることを実証する。
要するに、上記の本発明の実施形態は、ウイルス感染およびウイルス感染誘発癌の検出に対して、有効かつ汎用性のツールを提供する。本発明の実施形態は、さまざまな種類のDNAウイルスの存在およびウイルス組込みの検出に適用され得る。本実施形態によって設計されたプローブの組合せは、最適なウイルス/宿主配列カバレッジを確実にし、遺伝的安定性を考慮し、したがって、高感度、高効率、および高信頼性であることが実証される。
以上の説明は、本開示の実施形態に過ぎず、本開示の範囲を限定することを意図するものではない。本開示の特許請求の範囲および明細書による多くの変形および改変は依然として、請求される開示の範囲内にある。また、実施形態および特許請求の範囲のそれぞれは、開示されたすべての利点または特徴を達成する必要はない。さらに、要約および発明の名称は、特許文献の検索を容易にするためにのみ役立ち、請求される開示の範囲を限定することを決して意図しない。

Claims (16)

  1. 癌検出用のプローブの組合せであって、
    B型肝炎ウイルス(HBV)の一部を標的とするプローブのセットを1つ以上含み、
    HBVの一部を標的とするプローブの前記セットそれぞれの配列をアライメントしたとき、HBVの一部を標的とするプローブの前記アライメントしたセットの配列全体が、HBV遺伝子型のゲノムにおける直接反復配列(DR)領域の参照配列と一致し、
    HBVの一部を標的とするプローブの前記アライメントしたセットにおいて、前記HBVの一部を標的とするプローブはそれぞれ、前記HBVの一部を標的とするプローブの長さの一部分だけ、1つまたは2つの隣接するHBVの一部を標的とするプローブと重複し、
    前記DR領域の参照配列は配列番号3〜32のいずれかに示される配列である、プローブの組合せ。
  2. 前記HBV遺伝子型が、遺伝子型A、遺伝子型B、遺伝子型C、遺伝子型D、遺伝子型E、遺伝子型F、遺伝子型G、遺伝子型H、遺伝子型Iまたは遺伝子型Jである、請求項1に記載のプローブの組合せ。
  3. HBVの全長を標的とするプローブのセットを1つ以上さらに含み、
    HBVの全長を標的とするプローブの前記セットそれぞれの配列をアライメントしたとき、HBVの全長を標的とするプローブの前記アライメントしたセットの配列全体が、HBV遺伝子型のゲノムの参照配列と一致し、
    HBVの全長を標的とするプローブの前記アライメントしたセットにおいて、前記HBVの全長を標的とするプローブはそれぞれ、前記HBVの全長を標的とするプローブの長さの一部分だけ、1つまたは2つの隣接するHBVの全長を標的とするプローブと重複し、
    前記HBV遺伝子型のゲノムの参照配列は、遺伝子型A、遺伝子型B、遺伝子型C、遺伝子型D、遺伝子型E、遺伝子型F、遺伝子型G、遺伝子型H、遺伝子型Iまたは遺伝子型Jから選択される遺伝子型の配列の全長である、請求項1に記載のプローブの組合せ。
  4. ホットスポット遺伝子標的プローブのセットを1つ以上さらに含み、
    ホットスポット遺伝子標的プローブの前記セットそれぞれの配列をアライメントしたとき、ホットスポット遺伝子標的プローブの前記アライメントしたセットの配列全体が、癌ホットスポット遺伝子の参照配列と一致し、
    ホットスポット遺伝子標的プローブの前記アライメントしたセットにおいて、前記ホットスポット遺伝子標的プローブはそれぞれ、前記ホットスポット遺伝子標的プローブの長さの一部分だけ、1つまたは2つの隣接するホットスポット遺伝子標的プローブと重複し、
    前記癌ホットスポット遺伝子の参照配列は、前記癌ホットスポット遺伝子のエクソンまたはプロモーターである
    請求項に記載のプローブの組合せ。
  5. 前記癌ホットスポット遺伝子が、CTNNB1遺伝子、TERT遺伝子、またはTP53遺伝子である、請求項に記載のプローブの組合せ。
  6. 前記癌ホットスポット遺伝子の参照配列が配列番号33〜41のいずれかに示される配列である、請求項に記載のプローブの組合せ。
  7. 外来遺伝子標的プローブのセットを1つ以上さらに含み、
    外来遺伝子標的プローブの前記セットそれぞれの配列をアライメントしたとき、外来遺伝子標的プローブの前記アライメントしたセットの配列全体が、外来遺伝子の参照配列と一致し、
    外来遺伝子標的プローブの前記アライメントしたセットにおいて、前記外来遺伝子標的プローブはそれぞれ、前記外来遺伝子標的プローブの長さの一部分だけ、1つまたは2つの隣接する外来遺伝子標的プローブと重複し、
    前記外来遺伝子の参照配列は、以下のa)〜e)の要件を満たす、請求項に記載のプローブの組合せ:
    a)ヒトまたはHBVゲノムと相同性がない;
    b)前記外来遺伝子のゲノムにおいてユニークである;
    c)配列内のGC含有量が0.3〜0.7である;
    d)同じ塩基が5つ以上並んだ配列がない;
    e)プライマー設計アルゴリズムによって予測される二次構造がない。
  8. 前記外来遺伝子がλファージ由来である、請求項に記載のプローブの組合せ。
  9. 前記外来遺伝子の参照配列が配列番号42〜54のいずれかに示される配列である、請求項に記載のプローブの組合せ。
  10. 内在遺伝子標的プローブのセットを1つ以上さらに含み、
    内在遺伝子標的プローブの前記セットそれぞれの配列をアライメントしたとき、内在遺伝子標的プローブの前記アライメントしたセットの配列全体が、内在遺伝子の参照配列と一致し、
    内在遺伝子標的プローブの前記アライメントしたセットにおいて、前記内在遺伝子標的プローブはそれぞれ、前記内在遺伝子標的プローブの長さの一部分だけ、1つまたは2つの隣接する内在遺伝子標的プローブと重複し、
    前記内在遺伝子の参照配列は、以下のf)〜h)の要件を満たす、請求項に記載のプローブの組合せ:
    f)HBVゲノムと相同性がない;
    g)同じ塩基が5つ以上並んだ配列がない;
    h)プライマー設計アルゴリズムによって予測される二次構造がない。
  11. 前記内在遺伝子が、GAPDH遺伝子またはGdX遺伝子である、請求項10に記載のプローブの組合せ。
  12. 前記内在遺伝子の参照配列が、配列番号55または配列番号56に示される配列である、請求項10に記載のプローブの組合せ。
  13. 前記癌が肝細胞癌である、請求項1に記載のプローブの組合せ。
  14. HBVに感染した対象の試料として得られたDNAから、ウイルス−宿主接合部を有する標的ヌクレオチド断片を捕捉するために使用される、請求項1に記載のプローブの組合せ。
  15. 前記DNAが、前記対象のゲノムDNAまたは血中循環腫瘍DNAである、請求項14に記載のプローブの組合せ。
  16. 前記試料が、体液または肝臓組織である、請求項14に記載のプローブの組合せ。
JP2019556419A 2017-02-07 2018-02-06 癌の検出用のプローブの組合せ Active JP6799175B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762456087P 2017-02-07 2017-02-07
US62/456,087 2017-02-07
PCT/CN2018/075474 WO2018145627A1 (en) 2017-02-07 2018-02-06 Probe combination for detection of cancer

Publications (2)

Publication Number Publication Date
JP2020503067A JP2020503067A (ja) 2020-01-30
JP6799175B2 true JP6799175B2 (ja) 2020-12-09

Family

ID=63038710

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019556419A Active JP6799175B2 (ja) 2017-02-07 2018-02-06 癌の検出用のプローブの組合せ

Country Status (9)

Country Link
US (1) US11319602B2 (ja)
EP (1) EP3580353B1 (ja)
JP (1) JP6799175B2 (ja)
KR (1) KR102327119B1 (ja)
CN (1) CN110573628B (ja)
ES (1) ES2961464T3 (ja)
SG (1) SG11201907220UA (ja)
TW (1) TWI726191B (ja)
WO (1) WO2018145627A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111465707A (zh) * 2017-11-17 2020-07-28 简·探针公司 用于检测C1orf43核酸的组合物和方法
US20210207229A1 (en) * 2018-07-27 2021-07-08 Seekln, Inc. Hepatocellular carcinoma screening
KR20200054430A (ko) * 2018-11-09 2020-05-20 주식회사 셀레믹스 폐암 조직 내 세포 유래 돌연변이를 검출하기 위한 프로브 제조 및 검출 방법
WO2021046655A1 (en) * 2019-09-13 2021-03-18 University Health Network Detection of circulating tumor dna using double stranded hybrid capture
KR102446184B1 (ko) * 2019-11-04 2022-09-22 가톨릭대학교 산학협력단 B형 간염 바이러스 검출용 프로브 및 이의 용도

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100647277B1 (ko) * 2003-08-14 2006-11-17 삼성전자주식회사 B형 간염 검사용 pcr 프라이머 세트 및 이를 포함하는 b형 간염 검사 키트
US20060057670A1 (en) * 2004-09-10 2006-03-16 The Chinese University Of Hong Kong Genomic markers of hepatitis B virus associated with hepatocellular carcinomas
US20070042388A1 (en) 2005-08-12 2007-02-22 Wong Christopher W Method of probe design and/or of nucleic acids detection
EP2205617A4 (en) * 2007-11-06 2013-10-16 Siemens Healthcare Diagnostics HEPATITIS B-VIRUS-SPECIFIC OLIGONUCLEOTIDE SEQUENCES
KR101162088B1 (ko) 2008-09-30 2012-07-04 재단법인서울대학교산학협력재단 실시간 pcr을 이용하여 b형 간염유래 간질환을 진단하기 위한 키트
CN102277448B (zh) 2011-05-30 2013-09-04 厦门艾德生物医药科技有限公司 用于预测乙肝病毒引起的肝癌的引物、探针及试剂盒
CN103797130B (zh) 2011-06-24 2016-07-27 深圳华大基因科技有限公司 用于确定人体具有异常状态的系统和方法
CN103975075A (zh) 2011-11-24 2014-08-06 深圳华大基因科技有限公司 一种检测病毒在待测样本中整合方式的探针及其制备方法和应用
KR20130121283A (ko) * 2012-04-27 2013-11-06 (주)바이오니아 B형 간염 바이러스를 검출하기 위한 중합효소연쇄반응의 프라이머, 프로브, 및 이를 이용한 검출키트 및 방법
CN103725773B (zh) * 2012-10-10 2015-11-25 杭州普望生物技术有限公司 鉴定宿主基因组中hbv基因整合位点和重复靶基因
US9840742B2 (en) 2014-06-16 2017-12-12 JBS Science Inc. Detection of hepatitis B virus (HBV) DNA and methylated HBV DNA in urine of patients with HBV-associated hepatocellular carcinoma
CN105506065A (zh) * 2014-09-25 2016-04-20 上海人类基因组研究中心 肝癌基因检测方法、检测试剂盒及其应用
CN106319065B (zh) * 2016-09-14 2020-03-10 上海思路迪医学检验所有限公司 基于高通量测序检测人brca1/2基因的捕获探针及试剂盒
EP3535415A4 (en) * 2016-10-24 2020-07-01 The Chinese University of Hong Kong TUMOR DETECTION METHODS AND SYSTEMS

Also Published As

Publication number Publication date
CN110573628B (zh) 2023-12-22
US11319602B2 (en) 2022-05-03
KR20190114989A (ko) 2019-10-10
JP2020503067A (ja) 2020-01-30
TWI726191B (zh) 2021-05-01
TW201833332A (zh) 2018-09-16
EP3580353A1 (en) 2019-12-18
EP3580353B1 (en) 2023-09-13
US20180223380A1 (en) 2018-08-09
KR102327119B1 (ko) 2021-11-16
EP3580353A4 (en) 2020-03-04
WO2018145627A1 (en) 2018-08-16
ES2961464T3 (es) 2024-03-12
CN110573628A (zh) 2019-12-13
SG11201907220UA (en) 2019-09-27

Similar Documents

Publication Publication Date Title
CN103667254B (zh) 目标基因片段的富集和检测方法
JP6799175B2 (ja) 癌の検出用のプローブの組合せ
US20230287485A1 (en) Methods and compositions for enrichment of amplification products
KR102358206B1 (ko) 종양 돌연변이 부담을 평가하기 위한 방법 및 시스템
JP2021166532A5 (ja)
US20250207200A1 (en) Multiplex cellular reference materials
EP3752604B1 (en) Methods for personalized detection of the recurrence of cancer or metastasis and/or evaluation of treatment response
CN110387419B (zh) 实体瘤多基因检测基因芯片及其制备方法和检测装置
US20220356533A1 (en) Biomarker composition for diagnosing or predicting prognosis of thyroid cancer, comprising preparation capable of detecting mutation in plekhs1 gene, and use thereof
US20230091151A1 (en) Compositions and Methods for Targeted NGS Sequencing of cfRNA and cfTNA
CN107002123A (zh) 多重转录组分析
KR20240049800A (ko) 비정상적으로 메틸화된 단편을 갖는 체세포 변이 동시 발생
Tsui et al. Integrative molecular characterization of head and neck cancer cell model genomes
Shin et al. Actionable fusions detected by RNA-seq co-occur with PD-L1 expression and driver mutations in solid tumors patients
Kassab et al. Science Repository
Mumtaj et al. Integration of cancer associated genes from human genome by manual curation of biological databases

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190628

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200707

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200903

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201104

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201119

R150 Certificate of patent or registration of utility model

Ref document number: 6799175

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250