[go: up one dir, main page]

KR20180068118A - 차세대 핵산 서열 분석을 위한 라이브러리의 복잡성을 측정하는 방법 - Google Patents

차세대 핵산 서열 분석을 위한 라이브러리의 복잡성을 측정하는 방법 Download PDF

Info

Publication number
KR20180068118A
KR20180068118A KR1020160169752A KR20160169752A KR20180068118A KR 20180068118 A KR20180068118 A KR 20180068118A KR 1020160169752 A KR1020160169752 A KR 1020160169752A KR 20160169752 A KR20160169752 A KR 20160169752A KR 20180068118 A KR20180068118 A KR 20180068118A
Authority
KR
South Korea
Prior art keywords
nucleic acid
library
polynucleotide
acid sequence
complexity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
KR1020160169752A
Other languages
English (en)
Other versions
KR102417999B1 (ko
Inventor
정종석
손대순
박웅양
Original Assignee
삼성전자주식회사
사회복지법인 삼성생명공익재단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사, 사회복지법인 삼성생명공익재단 filed Critical 삼성전자주식회사
Priority to KR1020160169752A priority Critical patent/KR102417999B1/ko
Priority to PCT/KR2017/014549 priority patent/WO2018110940A1/ko
Publication of KR20180068118A publication Critical patent/KR20180068118A/ko
Application granted granted Critical
Publication of KR102417999B1 publication Critical patent/KR102417999B1/ko
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G06F19/24
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6851Quantitative amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • G06F19/18
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/191Modifications characterised by incorporating an adaptor

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Bioethics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

라이브러리의 복잡성을 측정하는 방법을 제공한다. 이에 따르면, 핵산 서열 분석용 라이브러리의 제조 과정 중에 실시간으로, 라이브러리 제조 후 핵산 서열 분석 과정 중, 또는 핵산 서열 분석 완료 후에 간단하고 정확한 방법으로 라이브러리의 복잡성을 측정할 수 있다.

Description

차세대 핵산 서열 분석을 위한 라이브러리의 복잡성을 측정하는 방법{Method for measuring library complexity for next generation sequencing}
차세대 핵산 서열 분석을 위한 라이브러리의 복잡성을 측정하는 방법 및 이를 이용한 장치에 관한 것이다.
차세대 핵산 서열 분석(next generation sequencing: NGS)은 연구 및 진단의 목적으로 널리 활용되고 있다. NGS는 장비의 종류에 따라 다르지만, 크게 보면 시료의 채취, 라이브러리의 제조, 및 핵산 서열 분석의 수행의 총 3단계로 구분할 수 있다. 라이브러리의 제조 후에는 핵산 서열 분석에 들어가기에 앞서 품질 관리(quality control: QC)를 진행하고, 제조된 라이브러리로 핵산 서열 분석을 진행할지 여부를 결정한다. 핵산 서열 분석을 진행하는 중에도 실시간으로 핵산 서열 분석이 원활히 진행되는지 여부를 확인하기 위해, 라이브러리의 제조사에서 제공하는 방법으로 QC를 진행한다. 핵산 서열 분석 후에는 생성된 핵산 서열 데이터(즉, 리드(read))를 분석하여, 실질적으로 돌연변이, 유전자 변이, 유전자 발현 등의 분석 전 데이터 생성 품질을 측정한다. 이와 같이, 각 차세대 핵산 서열 분석의 단계 별로 품질을 측정하고, 품질을 결정하는 요인 중 하나는 라이브러리의 복잡성(complexity)이다. 라이브러리를 제조한 후, 핵산 서열 분석을 수행하는 도중, 또는 핵산 서열 분석을 완료한 후에 라이브러리의 복잡성을 측정하여, 핵산 서열 분석의 수행, 중단, 및 생성된 핵산 서열 데이터의 활용 등을 판단할 수 있다.
대량 핵산 서열 분석을 수행하기 전에 2회의 최소 범위 핵산 서열 분석을 수행하고 이로부터 얻은 데이터를 이용하여 라이브러리의 복잡성을 통계적 방법으로 예측하는 방법이 알려져 있다(미국 공개 번호 US20140324359 A1). 그러나, 이러한 방법은 라이브러리의 복잡성을 측정하기 위해, 우선 라이브러리에 대해 핵산 서열 분석을 2회 진행하여야 하고, 라이브러리의 복잡성을 직접적이고 실시간으로 측정할 수 없다.
따라서, 간단하고 정확한 방법으로 핵산 서열 분석 진행 중에 실시간으로 또는 핵산 서열 분석 후에 라이브러리의 복잡성을 측정할 수 있는 방법이 요구된다.
핵산 서열 분석용 라이브러리의 복잡성을 측정하는 방법을 제공한다.
일 양상에 따르면, 표적 시료로부터 추출된 핵산을 단편화하는 단계;
단편화된 핵산의 하나 이상의 말단에 제1 폴리뉴클레오티드를 라이게이션하여 핵산 서열 분석용 제1 라이브러리를 제조하는 단계;
상기 제1 라이브러리에 제2 폴리뉴클레오티드를 첨가(spiking)하여 제2 라이브러리를 준비하는 단계;
상기 제2 라이브러리 및 상기 제1 폴리뉴클레오티드에 상보적인 제1 프라이머 세트를 사용한 제1 폴리머라제 연쇄 반응(polymerase chain reaction: PCR)을 수행하여 제1 Ct(threshold cycle) 값을 산출하는 단계;
상기 제2 라이브러리 및 상기 제2 폴리뉴클레오티드에 상보적인 제2 프라이머 세트를 사용한 제2 PCR을 수행하여 제2 Ct 값을 산출하는 단계; 및
상기 제1 Ct 값에 대한 제2 Ct 값의 비율을 산출하여 상기 제1 라이브러리의 복잡성을 측정하는 단계를 포함하는, 핵산 서열 분석용 라이브러리의 복잡성을 측정하는 방법을 제공한다.
상기 "핵산 서열 분석용 라이브러리"의 핵산 서열 분석은 차세대 핵산 서열 분석(next generation sequencing: NGS)일 수 있다. 용어 "차세대 핵산 서열 분석(next generation sequencing: NGS)"는 용어 "대규모 병렬 시퀀싱(massive parallel sequencing)" 또는 용어 "2세대 시퀀싱(second-generation sequencing)"과 상호 교환적으로 사용될 수 있다. NGS는 칩(chip) 기반 그리고 PCR 기반 쌍 말단(paired end) 형식으로 전장 유전체를 조각내고, 상기 조각을 혼성화 반응(hybridization)에 기초하여 초고속으로 핵산 서열 분석을 수행하는 기술을 의미한다. NGS는 대량의 단편의 핵산을 동시다발적으로 핵산 서열 분석하는 기법으로서, NGS 기반의 표적 핵산 서열 분석(targeted sequencing) 또는 패널 핵산 서열 분석(panel sequencing)을 수행할 수 있다. NGS는 예를 들어, 454 플랫폼(Roche), GS FLX 티타늄, Illumina MiSeq, Illumina HiSeq, Illumina Genome Analyzer, Solexa platform, SOLiD System(Applied Biosystems), Ion Proton(Life Technologies), Complete Genomics, Helicos Biosciences Heliscope, Pacific Biosciences의 단일 분자 실시간(SMRT™) 기술, 또는 이들의 조합에 의해 수행될 수 있다.
용어 "라이브러리(library)"는 핵산 단편의 집합을 말한다. 상기 라이브러리는 예를 들어 유전체 라이브러리(genomic library), 상보적 DNA 라이브러리(complementary DNA library), 또는 무작위적 돌연변이 라이브러리(randomized mutant library)이다.
용어 "라이브러리의 복잡성(library complexity)"은 해당 라이브러리에 존재하는 고유한(unique) 단편의 수를 말한다. 복잡성은 출발 물질인 핵산의 양, 라이브러리 제조 과정 중 소실되는 핵산의 양, PCR을 통해 증폭되는 핵산의 양 등에 영향을 받을 수 있다. 상기 라이브러리의 복잡성은 상대적인 수준으로 나타낼 수 있다.
상기 방법은 표적 시료로부터 추출된 핵산을 단편화하는 단계를 포함한다.
상기 표적 시료는 개체 또는 세포로부터 유래할 수 있다. 상기 개체는 인간, 소, 말, 돼지, 양, 염소, 개, 고양이, 및 설치류를 포함한 포유류일 수 있다. 상기 세포는 개체로부터 유래된 세포 또는 세포주일 수 있다. 상기 표적 시료는 생물학적 시료일 수 있다. 상기 생물학적 시료는 예를 들어, 혈액, 혈장, 혈청, 소변, 타액, 점막 분비물, 객담, 대변, 눈물, 또는 이들의 조합으로부터 획득된 것일 수 있다. 상기 생물학적 시료는 다양한 종으로부터 유래하는 진핵세포, 원핵세포, 바이러스, 박테리오 파지 등의 시료일 수 있다.
상기 핵산은 유전체(genome) 또는 그의 단편일 수 있다. 용어 "유전체(genome)"는 염색체, 염색질, 또는 유전자의 전체를 총칭하는 용어이다. 상기 유전체 또는 그의 단편은 분리된 DNA, 예를 들어 세포를 포함하지 않는 핵산(cell-free DNA: cf DNA)일 수 있다. 표적 시료로부터 핵산을 추출 또는 분리하는 방법은 통상의 기술자에게 공지된 방법으로 수행될 수 있다.
상기 표적 시료로부터 핵산을 추출하는 방법은 통상의 기술자에게 알려진 방법으로 수행될 수 있다.
상기 단편화(fragmentation)는 유전체를 물리적, 화학적 또는 효소적으로 절단하는 것일 수 있다. 예를 들어, 상기 단편화는 유전체를 제한효소로 절단하는 것이다.
상기 방법은 단편화된 핵산의 크기를 선별하는 단계를 더 포함할 수 있다. 크기를 선별하는 단계는 전기영동, 원심분리, 크로마토그래피, 또는 이들의 조합으로 수행될 수 있다. 상기 단편화된 핵산의 길이는 약 10 bp(염기쌍) 내지 약 2000 bp, 약 20 bp 내지 약 1500 bp, 약 50 bp 내지 약 1000 bp, 약 100 bp 내지 약 800 bp, 약 150 bp 내지 약 600 bp, 또는 약 300 bp 내지 약 600 bp일 수 있다.
상기 방법은 단편화된 핵산의 하나 이상의 말단에 제1 폴리뉴클레오티드를 라이게이션하여 핵산 서열 분석용 제1 라이브러리를 제조하는 단계를 포함한다.
상기 제1 라이브러리를 제조하는 단계는 단편화된 핵산의 말단-수선(end-repair) 및 3'-아데노신 꼬리달기(3'-A tailing)를 더 포함할 수 있다.
상기 제1 폴리뉴클레오티드는 어댑터일 수 있다. 상기 어댑터(adaptor)는 NGS에서 표적 핵산을 농축(enrichment)하기 위한 프라이머 서열을 포함하는 폴리뉴클레오티드일 수 있다. 상기 어댑터는 통상의 기술자에게 알려진 폴리뉴클레오티드일 수 있다. 상기 어댑터는 핵산 서열 분석용 유니버셜 서열을 포함할 수 있다. 예를 들어, 핵산 서열 분석용 라이브러리 제조 키트에 포함된 어댑터이다.
라이게이션은 핵산 단편들 간의 말단을 결합시키는 것을 말한다. 상기 라이게이션은 DNA 리가제(ligase)를 사용하여 수행할 수 있다.
상기 제1 라이브러리는 핵산 서열 분석을 위해 제조된 라이브러리일 수 있다.
상기 방법은 제1 라이브러리에 제2 폴리뉴클레오티드를 첨가(spiking)하여 제2 라이브러리를 준비하는 단계를 포함한다.
상기 첨가(spiking)는 제1 라이브러리와 소량의 제2 폴리뉴클레오티드를 혼합하는 것일 수 있다.
상기 제2 폴리뉴클레오티드는 2 이상 연속 뉴클레오티드가 표적 핵산 서열과 동일한 핵산 서열을 포함하는 제1 영역, 및 상기 제1 영역의 하나 이상의 말단에 위치하고, 표적 핵산 서열의 하나 이상의 말단으로부터 2 이상 연속 뉴클레오티드와 상이한 핵산 서열을 포함하는 제2 영역을 포함할 수 있다.
상기 표적 핵산 서열은 동반 진단(companion diagnostics: CDx)에 이용되는 유전적 변이를 포함할 수 있다.
상기 제2 폴리뉴클레오티드의 길이는 약 20 뉴클레오티드(이하, 'nt'라고 함) 내지 약 500 nt, 약 30 nt 내지 약 450 nt, 약 40 nt 내지 약 400 nt, 약 50 nt 내지 약 350 nt, 약 60 nt 내지 약 300 nt, 약 70 nt 내지 약 250 nt, 약 80 nt 내지 약 200 nt, 약 90 nt 내지 약 190 nt, 약 100 nt 내지 약 180 nt, 약 110 nt 내지 약 170 nt, 약 120 nt 내지 약 160 nt, 약 130 nt 내지 약 150 nt, 또는 약 150 nt일 수 있다.
상기 제1 영역은 2 이상 연속 뉴클레오티드가 표적 핵산 서열과 동일한 핵산 서열을 포함할 수 있다. 상기 제1 영역은 약 10 뉴클레오티드(이하, 'nt'라고 함) 내지 약 490 nt, 약 20 nt 내지 약 440 nt, 약 30 nt 내지 약 390 nt, 약 40 nt 내지 약 340 nt, 약 50 nt 내지 약 290 nt, 약 60 nt 내지 약 240 nt, 약 70 nt 내지 약 150 nt, 약 80 nt 내지 약 180 nt, 약 90 nt 내지 약 170 nt, 약 100 nt 내지 약 160 nt, 약 110 nt 내지 약 150 nt, 약 120 nt 내지 약 150 nt, 약 130 nt 내지 약 150 nt, 약 140 nt 내지 약 150 nt, 또는 약 142 nt일 수 있다.
상기 제2 영역은 제1 영역의 양 말단에 위치하고, 각각의 제2 영역은 표적 핵산 서열의 5' 말단으로부터 2 이상 연속 뉴클레오티드와 상이한 서열 및 3' 말단으로부터 2 이상 연속 뉴클레오티드와 상이한 서열을 포함할 수 있다. 상기 제2 영역의 길이는 약 2 nt 내지 약 15 nt, 약 2 nt 내지 약 13 nt, 약 2 nt 내지 약 10 nt, 약 2 nt 내지 약 8 nt, 약 2 nt 내지 약 6 nt, 약 2 nt 내지 약 4 nt, 약 3 nt, 또는 약 4 nt일 수 있다.
상기 제2 폴리뉴클레오티드는 예를 들어 그의 5'-말단으로부터 3' 방향으로 제2 영역, 제1 영역, 및 제2 영역을 포함할 수 있다.
상기 제2 폴리뉴클레오티드는 그의 하나 이상의 말단에 상기 제1 폴리뉴클레오티드와 동일한 2 이상 연속 뉴클레오티드를 더 포함할 수 있다. 상기 제2 폴리뉴클레오티드는 예를 들어 그의 5'-말단으로부터 3' 방향으로 제1 폴리뉴클레오티드와 동일한 2 이상 연속 뉴클레오티드, 제2 영역, 제1 영역, 제2 영역, 및 제1 폴리뉴클레오티드와 동일한 2 이상 연속 뉴클레오티드를 포함할 수 있다.
상기 방법은 제2 라이브러리 및 제1 폴리뉴클레오티드에 상보적인 제1 프라이머 세트를 사용한 제1 폴리머라제 연쇄 반응(polymerase chain reaction: PCR)을 수행하여 제1 Ct(threshold cycle) 값을 산출하는 단계를 포함한다.
상기 PCR은 예를 들어, 정량적 PCR(quantitative PCR: qPCR), 디지탈 PCR(digital PCR: dPCR), 핫 스타트(hot start) PCR, 터치다운(touchdown) PCR, 네스티드(nested) PCR, 부스터(booster) PCR, 멀티플렉스(multiplex) PCR, 실시간(real-time) PCR, 분별 디스플레이 PCR(differential display PCR, D-PCR), cDNA 말단의 신속 증폭(rapid amplification of cDNA ends, RACE), 인버스 PCR (inverse polymerase chain reaction: IPCR), 벡토레트(vectorette) PCR, 및 TAIL-PCR(thermal asymmetric interlaced PCR)이다.
상기 제1 프라이머 세트는 제1 폴리뉴클레오티드에 상보적인 폴리뉴클레오티드일 수 있다. 상기 제1 프라이머 세트는 유니버셜 프라이머 세트일 수 있다.
상기 제2 프라이머 세트는 제2 폴리뉴클레오티드에 상보적인 폴리뉴클레오티드일 수 있다. 상기 제2 프라이머 세트는 제2 폴리뉴클레오티드에는 상보적이지만 상기 제1 폴리뉴클레오티드에는 상보적이지 않은 폴리뉴클레오티드일 수 있다.
상기 PCR 반응에서, 증폭된 핵산의 검출을 위해 표적 핵산에 상보적인 프로브를 더 사용할 수 있다. 상기 프로브는 그의 하나 이상의 말단이 형광 물질, 양자점, FRET 등으로 표지된 것일 수 있다.
Ct(threshold cycle) 값은 PCR에서 배경 신호를 초과하여 최초로 증폭 신호를 나타내는 사이클의 수를 말한다. 정량적 PCR의 경우, 형광 신호의 역치(threshold)를 나타내는 사이클의 수를 말한다. Ct 값은 증폭 반응에서 출발 물질로서 최초 핵산의 카피 수와 역의 상관관계가 있기 때문에, Ct 값은 표적 시료 중 핵산의 카피 수를 산출하는데 이용될 수 있다.
상기 제1 Ct 값은 제2 라이브러리의 총 리드(read)를 나타낼 수 있다. 용어 "리드(read)"는 핵산 서열 분석으로 수득된 핵산 단편의 핵산 서열 정보를 말한다.
상기 방법은 제2 라이브러리 및 제2 폴리뉴클레오티드에 상보적인 제2 프라이머 세트를 사용한 제2 PCR을 수행하여 제2 Ct 값을 산출하는 단계를 포함한다.
상기 제2 Ct 값은 제2 라이브러리 중 제2 폴리뉴클레오티드의 리드를 나타낼 수 있다.
상기 제1 PCR, 제2 PCR, 또는 이들의 조합은 정량적 PCR(quantitative PCR: qPCR) 또는 디지탈 PCR(digital PCR: dPCR)로 수행될 수 있다.
상기 제1 PCR 및 제2 PCR은 동시 또는 순차로 수행될 수 있다.
상기 방법은 제1 Ct 값에 대한 제2 Ct 값의 비율을 산출하여 상기 제1 라이브러리의 복잡성을 측정하는 단계를 포함한다.
상기 제1 Ct 값에 대한 제2 Ct 값의 비율이 낮을수록 상기 제1 라이브러리의 복잡성이 높을 수 있다. 상기 제1 Ct 값에 대한 제2 Ct 값의 비율이 높을수록 상기 제1 라이브러리의 복잡성이 낮을 수 있다.
다른 양상은 표적 시료로부터 추출된 핵산을 단편화하는 단계;
단편화된 핵산의 하나 이상의 말단에 제1 폴리뉴클레오티드를 라이게이션하여 핵산 서열 분석용 제1 라이브러리를 제조하는 단계;
상기 제1 라이브러리에 제2 폴리뉴클레오티드를 첨가하여 제2 라이브러리를 준비하는 단계로서,
상기 제2 폴리뉴클레오티드는 2 이상 연속 뉴클레오티드가 표적 핵산 서열과 동일한 핵산 서열을 포함하는 제1 영역, 및 상기 제1 영역의 하나 이상의 말단에 위치하고, 표적 핵산 서열의 하나 이상의 말단으로부터 2 이상 연속 뉴클레오티드와 상이한 핵산 서열을 포함하는 제2 영역을 포함하는 것인 단계;
상기 제2 라이브러리 및 상기 제1 폴리뉴클레오티드에 상보적인 제1 프라이머를 사용한 핵산 서열 분석(sequencing)을 수행하여 제2 라이브러리의 총 리드(read)를 수득하는 단계;
수득된 총 리드로부터 상기 제2 폴리뉴클레오티드의 리드를 선별하여 제2 폴리뉴클레오티드의 리드를 수득하는 단계; 및
총 리드의 수에 대한 제2 폴리뉴클레오티드의 리드의 수의 비율을 산출하여 상기 제1 라이브러리의 복잡성을 측정하는 단계를 포함하는,
핵산 서열 분석용 라이브러리의 복잡성을 측정하는 방법을 제공한다.
상기 표적 시료, 핵산, 핵산 서열 분석, 단편화, 제1 폴리뉴클레오티드, 라이게이션, 첨가, 제2 폴리뉴클레오티드, PCR, Ct 값, 라이브러리, 및 라이브러리의 복잡성은 전술된 바와 같다.
상기 방법은 표적 시료로부터 추출된 핵산을 단편화하는 단계를 포함한다.
상기 방법은 단편화된 핵산의 하나 이상의 말단에 제1 폴리뉴클레오티드를 라이게이션하여 핵산 서열 분석용 제1 라이브러리를 제조하는 단계를 포함한다.
상기 방법은 제1 라이브러리에 제2 폴리뉴클레오티드를 첨가하여 제2 라이브러리를 준비하는 단계를 포함한다.
상기 방법은 제2 라이브러리 및 제1 폴리뉴클레오티드에 상보적인 제1 프라이머를 사용한 핵산 서열 분석을 수행하여 제2 라이브러리의 총 리드를 수득하는 단계를 포함한다.
제1 프라이머는 하나의 프라이머 또는 프라이머 세트일 수 있다.
상기 방법은 수득된 총 리드로부터 제2 폴리뉴클레오티드의 리드를 선별하여 제2 폴리뉴클레오티드의 리드를 수득하는 단계를 포함한다.
상기 방법은 총 리드의 수에 대한 제2 폴리뉴클레오티드의 리드의 수의 비율을 산출하여 제1 라이브러리의 복잡성을 측정하는 단계를 포함한다.
상기 총 리드의 수에 대한 제2 폴리뉴클레오티드의 리드의 수의 비율이 낮을수록 상기 제1 라이브러리의 복잡성이 높을 수 있다. 상기 총 리드의 수에 대한 제2 폴리뉴클레오티드의 리드의 수의 비율이 높을수록 상기 제1 라이브러리의 복잡성이 낮을 수 있다.
상기 방법은 핵산 서열 분석 중 실시간으로 또는 핵산 서열 분석 후 제1 라이브러리의 복잡성을 모니터링할 수 있다.
일 양상 또는 다른 양상에 따른 라이브러리의 복잡성을 측정하는 방법에 따르면, 핵산 서열 분석용 라이브러리의 제조 과정 중에 실시간으로, 라이브러리 제조 후 핵산 서열 분석 과정 중, 또는 핵산 서열 분석 완료 후에 간단하고 정확한 방법으로 라이브러리의 복잡성을 측정할 수 있다.
도 1a는 일 양상에 따른 NGS를 위한 라이브러리의 복잡성을 측정하는 방법의 원리를 나타내는 모식도이고, 도 1b는 라이브러리의 복잡성이 높거나 낮은 경우 전체 리드 중 인위적 서열 리드의 비율을 나타내는 모식도이다 (리드 중 ■: 어댑터, 리드 중 □: 인위적 서열).
도 2는 라이브러리 복잡도에 따른 정량적 PCR에서 Ct 값을 나타내는 그래프이다.
도 3은 라이브러리 복잡도에 따른 총 리드 중 인위적 서열 리드의 비율을 나타내는 그래프이다.
이하 본 발명을 실시예를 통하여 보다 상세하게 설명한다. 그러나, 이들 실시예는 본 발명을 예시적으로 설명하기 위한 것으로 본 발명의 범위가 이들 실시예에 한정되는 것은 아니다.
실시예 1. 차세대 핼산 서열 분석을 위한 라이브러리의 복잡성의 측정
1. 인위적 서열을 함유하는 핵산 단편의 준비
차세대 핵산 서열 분석(next generation sequencing: NGS)을 위해, 표적 서열로서 동반 진단(companion diagnostics: CDx)에 활용되는 것으로 알려진 변이를 포함하는 유전자 KRAS, IDH1, BRAC1, ALK, 및 ERBB2 및 이들 유전자의 영역을 선정하였다. 선정된 위치를 기준으로 약 150 bp의 참조 서열을 선별하였다.
선별된 참조 서열과 핵산 서열은 동일하지만, 그의 5' 말단으로부터 4 bp 및 3' 말단으로부터 4 bp를 인위적인 서열(artificial sequence)로 치환하고, 양 말단에 라이브러리의 어댑터 핵산 서열을 포함한 핵산 단편 (이하, "인위적 서열 함유 핵산 단편"이라고 함)을 유전자 합성 방법으로 제조하였다.
선별된 유전자, 참조 서열, 및 인위적 서열 함유 핵산 단편의 핵산 서열에서 어댑터 핵산 서열을 제외한 나머지 핵산 서열을 하기 표 1에 나타내었다.
번호 참조 유전체의 위치 참조 서열 인위적 서열 함유 핵산 단편
1 KRAS : 염색체 번호 12 :
엑손 번호: 3 :
염색체 12:25380168-25380346
5'-AGGAATCCTGAGAAGGGAGAAACACAGTCTGGATTATTACAGTGCACCTTTTACTTCAAAAAAGGTGTTATATACAACTCAACAACAAAAAATTCAATTTAAAAATGGGCAAAGGACTTGAAAAGACATTGTTCCTGCTCCAAAGATGAC-3' (서열번호 1) 5'- CTTC ATCCTGAGAAGGGAGAAACACAGTCTGGATTATTACAGTGCACCTTTTACTTCAAAAAAGGTGTTATATACAACTCAACAACAAAAAATTCAATTTAAAAATGGGCAAAGGACTTGAAAAGACATTGTTCCTGCTCCAAAGA GAAG -3' (서열번호 2)
2 IDH1 : 염색체 번호12
엑손 번호: 4 :
염색체 2:209113048-209113359
5'-AGATAATGGCTTCTCTGAAGACCGTGCCACCCAGAATATTTCGTATGGTGCCATTTGGTGATTTCCACATTTGTTTCAACTTGAACTCCTCAACCCTCTTCTCATCAGGAGTGATAGTGGCACATTTGACGCCAACATTATGCTTCTTTA-3' (서열번호 3) 5'- CTTC AATGGCTTCTCTGAAGACCGTGCCACCCAGAATATTTCGTATGGTGCCATTTGGTGATTTCCACATTTGTTTCAACTTGAACTCCTCAACCCTCTTCTCATCAGGAGTGATAGTGGCACATTTGACGCCAACATTATGCTTC GAAG -3' (서열번호 4)
3 BRAC1 : 염색체 번호 17
엑손 번호: 15 :
염색체 17:41222945-41223255
5'-TCAATTCTGGCTTCTCCCTGCTCACACTTTCTTCCATTGCATTATACCCAGCAGTATCAGTAGTATGAGCAGCAGCTGGACTCTGGGCAGATTCTGCAACTTTCAACTTTCAATTGGGGAACTTTCAATGCAGAGGTTGAAGATGGTATG-3' (서열번호 5) 5'- CTTC TTCTGGCTTCTCCCTGCTCACACTTTCTTCCATTGCATTATACCCAGCAGTATCAGTAGTATGAGCAGCAGCTGGACTCTGGGCAGATTCTGCAACTTTCAACTTTCAATTGGGGAACTTTCAATGCAGAGGTTGAAGATGG GAAG -3' (서열번호 6)
4 ALK : 염색체 번호 2
엑손 번호: 20:
염색체 2:29446208-29446394
5'-GGTCACTGATGGAGGAGGTCTTGCCAGCAAAGCAGTAGTTGGGGTTGTAGTCGGTCATGATGGTCGAGGTGCGGAGCTTGCTCAGCTTGTACTCAGGGCTCTGCAGCTCCATCTGCATGGCTTGCAGCTCCTGGTGCTTCCGGCGGTACA-3' (서열번호 7) 5'- CTTC ACTGATGGAGGAGGTCTTGCCAGCAAAGCAGTAGTTGGGGTTGTAGTCGGTCATGATGGTCGAGGTGCGGAGCTTGCTCAGCTTGTACTCAGGGCTCTGCAGCTCCATCTGCATGGCTTGCAGCTCCTGGTGCTTCCGGCGG GAAG -3' (서열번호 8)
5 ERBB2 : 염색체 번호 17
엑손 번호: 6:
염색체 17:37864574-37864787
5'-CAGGGCTACGTGCTCATCGCTCACAACCAAGTGAGGCAGGTCCCACTGCAGAGGCTGCGGATTGTGCGAGGCACCCAGCTCTTTGAGGACAACTATGCCCTGGCCGTGCTAGACAATGGAGACCCGCTGAACAATACCACCCCTGTCACA-3' (서열번호 9) 5'- CTTC GCTACGTGCTCATCGCTCACAACCAAGTGAGGCAGGTCCCACTGCAGAGGCTGCGGATTGTGCGAGGCACCCAGCTCTTTGAGGACAACTATGCCCTGGCCGTGCTAGACAATGGAGACCCGCTGAACAATACCACCCCTGT GAAG -3' (서열번호 10)
표 1에서, 인위적 서열 함유 핵산 단편의 인위적 서열을 진한 글자 및 밑줄로 표시하였다.
2. NGS 를 위한 라이브러리의 준비 및 인위적 서열 함유 핵산 단편의 첨가
NGS를 위한 라이브러리를 제조하기 위해, 인간 유전체 시료 HapMap NA07014, NA10840, NA18595, NA18957, NA18488, NA18511, NA18867, NA18924, NA19108, 및 NA19114의 총 10 종의 시료를 동일한 몰 농도 비율로 혼합한 HapMap 혼합 시료 50 ng 또는 200 ng을 준비하였다. 준비된 혼합 시료를 Kapa hyper prep kits for illumine (Kapa Biosystems)을 사용하여, 제조자가 제공한 방법에 따라, 인간 유전체의 단편화, 말단-수선, 3'-아데노신 꼬리달기, 및 어댑터 라이게이션을 순차로 수행하였다.
실시예 1.1에서 준비된 인위적 서열 함유 핵산 단편 각각 50 atmole을 어댑터가 라이게이션된 라이브러리에 첨가(spiking)하였다. 인위적 서열 함유 핵산 단편이 첨가된 라이브러리를 캡쳐-전(pre-capture) 폴리머라제 연쇄 반응(polymerase chain reaction: PCR)을 수행한 후, 표적 농축(target enrichment)를 수행하였다. 그 후, 표적 농축된 라이브러리를 캡쳐-후(post-capture) PCR을 수행하였다.
KAPA Illumina 라이브러리 농도 측정용 정량적 PCR(quantitative PCR: qPCR) 키트를 사용하여 실시간 PCR을 수행하고, 실시간 qPCR 결과로부터 Ct(cycle threshold) 값을 산출하였다. 여기서, 산출된 Ct 값은 총 리드의 수를 나타낸다.
한편, 라이브러리에 포함된 인위적 서열 함유 핵산 단편의 리드 수를 측정하기 위해, 하기 표 2의 프라이머 세트 및 프로브를 사용하여 실시간 qPCR을 수행하였다. 여기서, 산출된 Ct 값은 인위적 서열 함유 핵산 단편으로부터 유래한 리드의 수를 나타낸다.
프라이머 핵산 서열
IDH1_인위적_정방향 5'-CCACCGAGATCTACACTCTTTC-3' (서열번호 11)
IDH1_인위적_프로브 5'-ACGCTCTTCCGATCTCTTCAATGGC-3' (서열번호 12)
IDH1_인위적_역방향 5'-AAATCACCAAATGGCACCATAC-3' (서열번호 13)
BRCA1_인위적_정방향 5'-GCGACCACCGAGATCTACA-3' (서열번호 14)
BRCA1_인위적_프로브 5'-ACGACGCTCTTCCGATCTCTTCTTCT-3' (서열번호 15)
BRCA1_인위적_역방향 5'-GAAAGTGTGAGCAGGGAGAAG-3' (서열번호 16)
ERBB2_인위적_정방향 5'-CCACCGAGATCTACACTCTTTC-3' (서열번호 17)
ERBB2_인위적_프로브 5'-ATCTCTTCGCTACGTGCTCATCGC-3' (서열번호 18)
ERBB2_인위적_역방향 5'-CCTGCCTCACTTGGTTGT-3'(서열번호 19)
또한, 라이브러리의 복잡성에 따라 전체 리드 중 인위적 서열 리드의 비율이 변화하는지 여부를 확인하기 위해, 라이브러리 제조 과정에서 라이브러리 복잡성을 변화시킨 라이브러리를 제조하였다. Kapa hyper prep kits for illumine (Kapa Biosystems)의 제조자가 제공한 라이브러리의 제조 방법을 이용하여, 어댑터 라이게이션 단계에서 라이게이션된 산물을 1회 정제하고, 30 μM의 어댑터를 사용하고, 이 방법에 따라 제조된 라이브러리를 음성 대조군으로 사용하였다. 제조된 라이브러리의 복잡성을 인위적으로 감소시키기 위해, 라이게이션 단계에서 라이게이션된 산물의 2회 정제, 3 μM의 어댑터(즉, 1/10 희석)를 사용하거나, 또는 이들의 조합을 사용하여 복잡성이 감소된 라이브러리를 제조하였다.
음성 대조군의 라이브러리와 인위적으로 복잡성을 감소시킨 라이브러리를 상기와 같은 방법으로 실시간 qPCR을 수행하고 Ct 값을 산출하였다. 라이브러리의 복잡성에 따른 산출된 Ct 값을 도 2에 나타내었다. 도 2에 나타난 바와 같이, 라이브러리의 복잡성이 감소함에 따라, 인위적 서열 함유 핵산 단편의 Ct 값이 감소하였다. 이에 반해, 총 리드의 Ct 값은 라이브러리의 복잡성의 변화에도 불구하고, 유의한 변화가 없었다.
제조된 라이브러리의 핵산 서열을 분석하고, 분석된 미가공된 리드 데이터를 이용하여 전체 리드의 수 및 전체 리드 중 인위적 서열 리드의 비율을 산출하였다. 복잡성의 변화에 따라, 산출된 전체 리드의 수 및 전체 리드 중 인위적 서열 리드의 비율을 도 3에 나타내었다. 도 3에서, "50 ng"은 라이브러리 제조시 인간 게놈 DNA HapMap 혼합 시료의 양이 50 ng임을 의미한다. 도 3에 나타낸 바와 같이, 전체 리드의 수 및 인위적 서열 리드의 수는 라이브러리 복잡성과 상관 관계가 없지만, 전체 리드 중 인위적 서열 리드의 비율은 라이브러리 복잡성과 역으로 상관관계가 있음을 확인하였다.
<110> SAMSUNG ELECTRONICS CO., LTD Samsung Life Public Welfare Foundation <120> Method for measuring library complexity for next generation sequencing <130> PN115614-KR <160> 19 <170> KopatentIn 2.0 <210> 1 <211> 150 <212> DNA <213> Artificial Sequence <220> <223> KRAS reference sequence <400> 1 aggaatcctg agaagggaga aacacagtct ggattattac agtgcacctt ttacttcaaa 60 aaaggtgtta tatacaactc aacaacaaaa aattcaattt aaaaatgggc aaaggacttg 120 aaaagacatt gttcctgctc caaagatgac 150 <210> 2 <211> 150 <212> DNA <213> Artificial Sequence <220> <223> Nucleic acid fragment containing artificial sequence <400> 2 cttcatcctg agaagggaga aacacagtct ggattattac agtgcacctt ttacttcaaa 60 aaaggtgtta tatacaactc aacaacaaaa aattcaattt aaaaatgggc aaaggacttg 120 aaaagacatt gttcctgctc caaagagaag 150 <210> 3 <211> 150 <212> DNA <213> Artificial Sequence <220> <223> IDH1 reference sequence <400> 3 agataatggc ttctctgaag accgtgccac ccagaatatt tcgtatggtg ccatttggtg 60 atttccacat ttgtttcaac ttgaactcct caaccctctt ctcatcagga gtgatagtgg 120 cacatttgac gccaacatta tgcttcttta 150 <210> 4 <211> 150 <212> DNA <213> Artificial Sequence <220> <223> Nucleic acid fragment containing artificial sequence <400> 4 cttcaatggc ttctctgaag accgtgccac ccagaatatt tcgtatggtg ccatttggtg 60 atttccacat ttgtttcaac ttgaactcct caaccctctt ctcatcagga gtgatagtgg 120 cacatttgac gccaacatta tgcttcgaag 150 <210> 5 <211> 150 <212> DNA <213> Artificial Sequence <220> <223> BRAC1 reference sequence <400> 5 tcaattctgg cttctccctg ctcacacttt cttccattgc attataccca gcagtatcag 60 tagtatgagc agcagctgga ctctgggcag attctgcaac tttcaacttt caattgggga 120 actttcaatg cagaggttga agatggtatg 150 <210> 6 <211> 150 <212> DNA <213> Artificial Sequence <220> <223> Nucleic acid fragment containing artificial sequence <400> 6 cttcttctgg cttctccctg ctcacacttt cttccattgc attataccca gcagtatcag 60 tagtatgagc agcagctgga ctctgggcag attctgcaac tttcaacttt caattgggga 120 actttcaatg cagaggttga agatgggaag 150 <210> 7 <211> 150 <212> DNA <213> Artificial Sequence <220> <223> ALK reference sequence <400> 7 ggtcactgat ggaggaggtc ttgccagcaa agcagtagtt ggggttgtag tcggtcatga 60 tggtcgaggt gcggagcttg ctcagcttgt actcagggct ctgcagctcc atctgcatgg 120 cttgcagctc ctggtgcttc cggcggtaca 150 <210> 8 <211> 150 <212> DNA <213> Artificial Sequence <220> <223> Nucleic acid fragment containing artificial sequence <400> 8 cttcactgat ggaggaggtc ttgccagcaa agcagtagtt ggggttgtag tcggtcatga 60 tggtcgaggt gcggagcttg ctcagcttgt actcagggct ctgcagctcc atctgcatgg 120 cttgcagctc ctggtgcttc cggcgggaag 150 <210> 9 <211> 150 <212> DNA <213> Artificial Sequence <220> <223> ERBB2 reference sequence <400> 9 cagggctacg tgctcatcgc tcacaaccaa gtgaggcagg tcccactgca gaggctgcgg 60 attgtgcgag gcacccagct ctttgaggac aactatgccc tggccgtgct agacaatgga 120 gacccgctga acaataccac ccctgtcaca 150 <210> 10 <211> 150 <212> DNA <213> Artificial Sequence <220> <223> Nucleic acid fragment containing artificial sequence <400> 10 cttcgctacg tgctcatcgc tcacaaccaa gtgaggcagg tcccactgca gaggctgcgg 60 attgtgcgag gcacccagct ctttgaggac aactatgccc tggccgtgct agacaatgga 120 gacccgctga acaataccac ccctgtgaag 150 <210> 11 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> IDH1_art_Forward primer <400> 11 ccaccgagat ctacactctt tc 22 <210> 12 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> IDH1_art_Probe <400> 12 acgctcttcc gatctcttca atggc 25 <210> 13 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> IDH1_art_Reverse primer <400> 13 aaatcaccaa atggcaccat ac 22 <210> 14 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> BRCA1_art_Forward primer <400> 14 gcgaccaccg agatctaca 19 <210> 15 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> BRCA1_art_Probe <400> 15 acgacgctct tccgatctct tcttct 26 <210> 16 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> BRCA1_art_Reverse primer <400> 16 gaaagtgtga gcagggagaa g 21 <210> 17 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> ERBB2_art_Forward primer <400> 17 ccaccgagat ctacactctt tc 22 <210> 18 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> ERBB2_art_Probe <400> 18 atctcttcgc tacgtgctca tcgc 24 <210> 19 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> ERBB2_art_Reverse primer <400> 19 cctgcctcac ttggttgt 18

Claims (19)

  1. 표적 시료로부터 추출된 핵산을 단편화하는 단계;
    단편화된 핵산의 하나 이상의 말단에 제1 폴리뉴클레오티드를 라이게이션하여 핵산 서열 분석용 제1 라이브러리를 제조하는 단계;
    상기 제1 라이브러리에 제2 폴리뉴클레오티드를 첨가(spiking)하여 제2 라이브러리를 준비하는 단계로서,
    상기 제2 폴리뉴클레오티드는 2 이상 연속 뉴클레오티드가 표적 핵산 서열과 동일한 핵산 서열을 포함하는 제1 영역, 및 상기 제1 영역의 하나 이상의 말단에 위치하고, 표적 핵산 서열의 하나 이상의 말단으로부터 2 이상 연속 뉴클레오티드와 상이한 핵산 서열을 포함하는 제2 영역을 포함하는 것인 단계;
    상기 제2 라이브러리 및 상기 제1 폴리뉴클레오티드에 상보적인 제1 프라이머 세트를 사용한 제1 폴리머라제 연쇄 반응(polymerase chain reaction: PCR)을 수행하여 제1 Ct(threshold cycle) 값을 산출하는 단계;
    상기 제2 라이브러리 및 상기 제2 폴리뉴클레오티드에 상보적인 제2 프라이머 세트를 사용한 제2 PCR을 수행하여 제2 Ct 값을 산출하는 단계; 및
    상기 제1 Ct 값에 대한 제2 Ct 값의 비율을 산출하여 상기 제1 라이브러리의 복잡성을 측정하는 단계를 포함하는,
    핵산 서열 분석용 라이브러리의 복잡성을 측정하는 방법.
  2. 청구항 1에 있어서, 상기 핵산 서열 분석은 차세대 핵산 서열 분석(next generation sequencing: NGS)인 것인 방법.
  3. 청구항 1에 있어서, 상기 표적 시료는 개체 또는 세포로부터 유래된 것인 방법.
  4. 청구항 1에 있어서, 상기 핵산은 유전체(genome) 또는 그의 단편인 것인 방법.
  5. 청구항 1에 있어서, 상기 제1 폴리뉴클레오티드는 어댑터인 것인 방법.
  6. 청구항 1에 있어서, 상기 표적 핵산 서열은 동반 진단(companion diagnostics: CDx)에 이용되는 유전적 변이를 포함하는 것인 방법.
  7. 청구항 1에 있어서, 상기 제2 폴리뉴클레오티드의 길이는 20 뉴클레오티드 내지 500 뉴클레오티드인 것인 방법.
  8. 청구항 1에 있어서, 상기 제2 영역은 제1 영역의 양 말단에 위치하고, 각각의 제2 영역은 표적 핵산 서열의 5' 말단으로부터 2 이상 연속 뉴클레오티드와 상이한 서열 및 3' 말단으로부터 2 이상 연속 뉴클레오티드와 상이한 서열을 포함하는 것인 방법.
  9. 청구항 1에 있어서, 상기 제2 영역의 길이는 2 뉴클레오티드 내지 15 뉴클레오티드인 것인 방법.
  10. 청구항 1에 있어서, 상기 제2 폴리뉴클레오티드는 그의 하나 이상의 말단에 상기 제1 폴리뉴클레오티드와 동일한 2 이상 연속 뉴클레오티드를 더 포함하는 것인 방법.
  11. 청구항 1에 있어서, 상기 제1 PCR, 제2 PCR, 또는 이들의 조합은 정량적 PCR(quantitative PCR: qPCR) 또는 디지탈 PCR(digital PCR: dPCR)로 수행되는 것인 방법.
  12. 청구항 1에 있어서, 상기 제1 PCR 및 제2 PCR은 동시 또는 순차로 수행되는 것인 방법.
  13. 청구항 1에 있어서, 상기 제1 Ct 값은 제2 라이브러리의 총 리드(read)를 나타내는 것인 방법.
  14. 청구항 1에 있어서, 상기 제2 Ct 값은 제2 라이브러리 중 제2 폴리뉴클레오티드의 리드를 나타내는 것인 방법.
  15. 청구항 1에 있어서, 상기 제1 Ct 값에 대한 제2 Ct 값의 비율이 낮을수록 상기 제1 라이브러리의 복잡성이 높고, 상기 제1 Ct 값에 대한 제2 Ct 값의 비율이 높을수록 상기 제1 라이브러리의 복잡성이 낮은 것인 방법.
  16. 표적 시료로부터 추출된 핵산을 단편화하는 단계;
    단편화된 핵산의 하나 이상의 말단에 제1 폴리뉴클레오티드를 라이게이션하여 핵산 서열 분석용 제1 라이브러리를 제조하는 단계;
    상기 제1 라이브러리에 제2 폴리뉴클레오티드를 첨가하여 제2 라이브러리를 준비하는 단계로서,
    상기 제2 폴리뉴클레오티드는 2 이상 연속 뉴클레오티드가 표적 핵산 서열과 동일한 핵산 서열을 포함하는 제1 영역, 및 상기 제1 영역의 하나 이상의 말단에 위치하고, 표적 핵산 서열의 하나 이상의 말단으로부터 2 이상 연속 뉴클레오티드와 상이한 핵산 서열을 포함하는 제2 영역을 포함하는 것인 단계;
    상기 제2 라이브러리 및 상기 제1 폴리뉴클레오티드에 상보적인 제1 프라이머를 사용한 핵산 서열 분석(sequencing)을 수행하여 제2 라이브러리의 총 리드(read)를 수득하는 단계;
    수득된 총 리드로부터 상기 제2 폴리뉴클레오티드의 리드를 선별하여 제2 폴리뉴클레오티드의 리드를 수득하는 단계; 및
    총 리드의 수에 대한 제2 폴리뉴클레오티드의 리드의 수의 비율을 산출하여 상기 제1 라이브러리의 복잡성을 측정하는 단계를 포함하는,
    핵산 서열 분석용 라이브러리의 복잡성을 측정하는 방법.
  17. 청구항 16에 있어서, 상기 핵산 서열 분석은 차세대 핵산 서열 분석(NGS)인 것인 방법.
  18. 청구항 16에 있어서, 상기 총 리드의 수에 대한 제2 폴리뉴클레오티드의 리드의 수의 비율이 낮을수록 상기 제1 라이브러리의 복잡성이 높고, 상기 총 리드의 수에 대한 제2 폴리뉴클레오티드의 리드의 수의 비율이 높을수록 상기 제1 라이브러리의 복잡성이 낮은 것인 방법.
  19. 청구항 16에 있어서, 상기 방법은 핵산 서열 분석 중 실시간으로 또는 핵산 서열 분석 후 제1 라이브러리의 복잡성을 모니터링하는 것인 방법.
KR1020160169752A 2016-12-13 2016-12-13 차세대 핵산 서열 분석을 위한 라이브러리의 복잡성을 측정하는 방법 Active KR102417999B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020160169752A KR102417999B1 (ko) 2016-12-13 2016-12-13 차세대 핵산 서열 분석을 위한 라이브러리의 복잡성을 측정하는 방법
PCT/KR2017/014549 WO2018110940A1 (ko) 2016-12-13 2017-12-12 차세대 핵산 서열 분석을 위한 라이브러리의 복잡성을 측정하는 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160169752A KR102417999B1 (ko) 2016-12-13 2016-12-13 차세대 핵산 서열 분석을 위한 라이브러리의 복잡성을 측정하는 방법

Publications (2)

Publication Number Publication Date
KR20180068118A true KR20180068118A (ko) 2018-06-21
KR102417999B1 KR102417999B1 (ko) 2022-07-06

Family

ID=62559454

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160169752A Active KR102417999B1 (ko) 2016-12-13 2016-12-13 차세대 핵산 서열 분석을 위한 라이브러리의 복잡성을 측정하는 방법

Country Status (2)

Country Link
KR (1) KR102417999B1 (ko)
WO (1) WO2018110940A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112867801A (zh) * 2018-11-30 2021-05-28 Illumina公司 使用单一测定分析多种分析物

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220017956A1 (en) * 2020-07-14 2022-01-20 Accugenomics, Inc. Endogenous complexity calibration ladder target

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8663920B2 (en) * 2011-07-29 2014-03-04 Bio-Rad Laboratories, Inc. Library characterization by digital assay
US10385475B2 (en) * 2011-09-12 2019-08-20 Adaptive Biotechnologies Corp. Random array sequencing of low-complexity libraries
US20140324359A1 (en) * 2013-04-25 2014-10-30 University Of Southern California Predicting the molecular complexity of sequencing libraries
US10787661B2 (en) * 2014-10-30 2020-09-29 The Board Of Trustees Of The Leland Stanford Junior University Scalable method for isolation and sequence-verification of oligonucleotides from complex libraries

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
S. Y. Anvar 외, Genome Biology (2014) 15:555. *
T. Daley 외, Nature Methods 10(4), 2013.04, pp.325-327. *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112867801A (zh) * 2018-11-30 2021-05-28 Illumina公司 使用单一测定分析多种分析物

Also Published As

Publication number Publication date
KR102417999B1 (ko) 2022-07-06
WO2018110940A1 (ko) 2018-06-21

Similar Documents

Publication Publication Date Title
McElhoe et al. Development and assessment of an optimized next-generation DNA sequencing approach for the mtgenome using the Illumina MiSeq
EP2725125B1 (en) High throughput methylation detection method
EP3191630B1 (en) Method for constructing sequencing library based on blood sample and usage thereof in determining fetal genetic abnormality
EP2971082B1 (en) Non-invasive prenatal screening
CN110628880B (zh) 一种同步使用信使rna与基因组dna模板检测基因变异的方法
KR20180033587A (ko) 제자리 증폭에 의한 세포-유리 핵산 분자의 제조 방법
EP3608452A1 (en) Method for constructing amplicon library through one-step process
CN108463559A (zh) 肿瘤的深度测序概况分析
CN105331606A (zh) 应用于高通量测序的核酸分子定量方法
Malekshoar et al. CRISPR-Cas9 targeted enrichment and next-generation sequencing for mutation detection
WO2018186930A1 (en) Method and kit for constructing nucleic acid library
EP4332238A1 (en) Methods for accurate parallel detection and quantification of nucleic acids
JP2020512000A5 (ko)
CN108070658B (zh) 检测msi的非诊断方法
EP3643789A1 (en) Pcr primer pair and application thereof
US11339427B2 (en) Method for target specific RNA transcription of DNA sequences
KR102417999B1 (ko) 차세대 핵산 서열 분석을 위한 라이브러리의 복잡성을 측정하는 방법
KR20220122095A (ko) 분자 바코딩 효율을 향상시키기 위한 조성물 및 이의 용도
EP3474168B1 (en) Method for measuring mutation rate
KR101967879B1 (ko) 핵산 서열분석에서 uid 핵산 서열의 순결도를 측정하는 방법
US11447819B2 (en) Methods for 3′ overhang repair
US20250163407A1 (en) Methods selectively depleting nucleic acid using rnase h
CN111074354A (zh) 一种低丰度dna突变测序文库的构建方法
EP4332235A1 (en) Highly sensitive methods for accurate parallel quantification of variant nucleic acids
EP3371325B1 (en) Method and kit for identifying gene mutations

Legal Events

Date Code Title Description
PA0109 Patent application

Patent event code: PA01091R01D

Comment text: Patent Application

Patent event date: 20161213

PG1501 Laying open of application
A201 Request for examination
PA0201 Request for examination

Patent event code: PA02012R01D

Patent event date: 20190828

Comment text: Request for Examination of Application

Patent event code: PA02011R01I

Patent event date: 20161213

Comment text: Patent Application

E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

Comment text: Notification of reason for refusal

Patent event date: 20211118

Patent event code: PE09021S01D

E701 Decision to grant or registration of patent right
PE0701 Decision of registration

Patent event code: PE07011S01D

Comment text: Decision to Grant Registration

Patent event date: 20220405

PR0701 Registration of establishment

Comment text: Registration of Establishment

Patent event date: 20220701

Patent event code: PR07011E01D

PR1002 Payment of registration fee

Payment date: 20220704

End annual number: 3

Start annual number: 1

PG1601 Publication of registration