[go: up one dir, main page]

RS61631B1 - Kompozicije i postupci za preciznu identifikaciju mutacija - Google Patents

Kompozicije i postupci za preciznu identifikaciju mutacija

Info

Publication number
RS61631B1
RS61631B1 RS20210380A RSP20210380A RS61631B1 RS 61631 B1 RS61631 B1 RS 61631B1 RS 20210380 A RS20210380 A RS 20210380A RS P20210380 A RSP20210380 A RS P20210380A RS 61631 B1 RS61631 B1 RS 61631B1
Authority
RS
Serbia
Prior art keywords
nucleic acid
sequence
code
nucleotides
target nucleic
Prior art date
Application number
RS20210380A
Other languages
English (en)
Inventor
Jason H Bielas
Original Assignee
Hutchinson Fred Cancer Res
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=47750867&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=RS61631(B1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Hutchinson Fred Cancer Res filed Critical Hutchinson Fred Cancer Res
Publication of RS61631B1 publication Critical patent/RS61631B1/sr

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • C40B40/08Libraries containing RNA or DNA which encodes proteins, e.g. gene libraries
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/06Biochemical methods, e.g. using enzymes or whole viable microorganisms
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Plant Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Mycology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Description

Opis
IZJAVA U VEZI SA LISTINGOM SEKVENCI
[0001] Listing sekvenci povezan sa ovom patentnom prijavom obezbeđen je u formatu teksta umesto kao papirna kopija, tako da je uključen u specifikaciju u vidu reference. Ime tekstualnog dokumenta koji sadrži Listing sekvenci je 360056_409WO_SEQUENCE_LISTING_.txt. Veličina ovog tekstualnog dokumenta je 4 KB, kreiran je 4. februara 2013. i podnet je elektronskim putem preko EFS-Web sajta.
OSNOV PRONALASKA
1. Oblast tehnike
[0002] Predmetni prikaz se odnosi na kompozicije i postupke za precizno detektovanje mutacija upotrebom sekvenciranja, i, konkretnije, za jedinstveno obeležavanje dvolančanih molekula nukleinske kiseline, tako da se podaci o sekvenci dobijeni za sens lanac mogu povezati sa podacima o sekvenci dobijenim od anti-sens lanca, ukoliko su dobijeni putem postupaka masivnog paralelnog sekvenciranja.
2. Opis relevantnog stanja tehnike
[0003] Detekcija spontanih mutacija (npr., supstitucija, insercija, delecija, duplikacija), ili čak i indukovanih mutacija, koje se javljaju nasumično u celom genomu može da predstavlja izazov jer su ovi mutacioni događaji retki i mogu da postoje u samo jednoj ili nekoliko kopija DNK. Najdirektniji način za detekciju mutacija je sekcenciranje, ali postojeće metode sekvenciranja nisu dovoljno senzitivne da detektuju retke mutacije. Na primer, mutacije koje nastaju de novo u mitohondrijalnoj DNK (mtDNK) u principu će biti prisutne samo u jednoj kopiji mtDNK, što znači da ove mutacije nije lako pronaći pošto mutacija mora da bude prisutna u 10-25% neke populacije molekula da bi bila detektovana sekvenciranjem (Jones et al., Proc. Nat’l. Acad. Sci. U.S.A. 105:4283-88, 2008). Kao drugi primer, procenjuje se da učestalost spontanih somatskih mutacija u genomskoj DNK iznosi samo 1 x 10-8, odnosno 2.1 x 10-6 u normalnim ljudskim tkivima, odnosno tkivima kancera (Bielas et al., Proc. Nat’l Acad. Sci. U.S.A. 103:18238-42, 2008).
[0004] Jedno poboljšanje sekvenciranja je da se krene od individualnih molekula DNK i da se broj svakog molekula amplifikuje, na primer, lančanom reakcijom polimeraze (PCR) i digitalnom PCR. Recimo, masivno paralno sekvenciranje predstavlja posebno moćan oblik digitalne PCR jer omogućava da se višestruki milioni molekula DNK matrice analiziraju jedan po jedan. Međutim, amplifikacija pojedinačnih molekula DNK pre ili tokom sekvenciranja, putem PCR i/ili premošćujuće amplifikacije problem predstavlja inherentna stopa greške polimeraza koje se koriste za amplifikaciju, a artefaktne mutacije koje se generišu tokom amplifikacije mogu pogrešno da se identifikuju kao spontane mutacije u odnosu na originalnu (endogenu neamplifikovanu) nukelinsku kiselinu. Slično tome, DNK matrice koje se oštete tokom pripreme (ex vivo) mogu da se amplifikuju i da se netačno računaju kao mutacije u tehnikama masivnog paralnog sekvenciranja. I u ovom slučaju, kada se koristi mtDNK kao primer, eksperimentalno utvrđene učestalosti mutacija veoma zavise od preciznosti konkretnog testa koji se koristi (Kraytsberg et al., Methods 46:269-73, 2008) – ova neslaganja pokazuju da je učestalost spontanih mutacija mtDNK ili ispod, ili veoma blizu granice detekcije ovih tehnologija. Masivno paralelno sekvenciranje u principu ne može da se koristi za detekciju retkih varijanti, zbog visoke stope grešaka koja je u vezi sa postupkom sekvenciranja – pokazano je da jedan postupak u kome se koristi premošćujuća amplifikacija i sekvenciranje putem sinteze ima stopu greške koja varira od oko 0.06% do 1%, što zavisi od različitih faktora, uključujući dužinu očitavanja, algoritme za pozivanje baza, i vrste detektovanih varijanti (videti Kinde et al., Proc. Nat’l. Acad. Sci. U.S.A. 108:9530-5, 2011).
KRATAK OPIS PRONALASKA
[0005] Obim pronalaska je definisan priloženim patentnim zahtevima. Aspekti opisani u daljem tekstu predstavljaju aspekte ovog prikaza. U jednom aspektu, predmetni prikaz obezbeđuje biblioteku dvolančanih molekula nukleinske kiseline, koja uključuje brojne ciljne molekule nukleinske kiseline i više nasumičnih kodova, pri čemu biblioteka nukleinskih kiselina sadrži molekule koji imaju formulu Xa-Xb-Y, Xb-Xa-Y, Y-Xa-Xb, Y-Xb-Xa, Xa-Y-Xb, ili Xb-Y-Xa (u 5’ka 3’ smeru), pri čemu (a) X<a>sadrži prvi nasumični kod, (b) Y sadrži ciljni molekul nukleinske kiseline, i (c) Xb sadrži drugi nasumični kod. Osim toga, svaki od velikog broja nasumičnih kodova uključuje dužinu koja se kreće u opsegu od oko 5 nukleotida do oko 50 nukleotidi (ili oko 5 nukleotida do oko 10 nukleotida, ili dužinu od oko 6, oko 7, oko 8, oko 9, oko 10, oko 11, oko 12, oko 13, oko 14, oko 15, oko 16, oko 17, oko 18, oko 19, ili oko 20 nukleotida).
[0006] U nekim primerima izvođenja, dvolančane sekvence X<a>i X<b>koda su iste (npr., X<a>= X<b>) za jedan ili više ciljnih molekula nukleinske kiseline, pod uslovom da svaki takav ciljni molekul nukleinske kiseline nema istu sekvencu dvolančanog koda kao bilo koji drugi ciljni molekul nukleinske kiseline. U nekim drugim primerima izvođenja, dvolančana sekvenca X<a>koda za svaki ciljni molekul nukleinske kiseline, različita je od dvolančane sekvenca X<b>koda. U dodatnim primerima izvođenja, biblioteka dvolančanih nukleinskih kiselina sadržana je u samoreplikujućem vektoru, kao što je plazmid, kozmid, YAC, ili virusni vektor.
[0007] U dodatnom aspektu, predmetni prikaz obezbeđuje postupak za dobijanje sekvence nukleinske kiseline ili za precizno detektovanje prave mutacije u molekulu nukleinske kiseline putem amplifikacije svakog lanca prethodno pomenute biblioteke dvolančanih nukleinskih kiselina pri čemu se amplifikuje veliki broj ciljnih molekula nukleinske kiseline i veliki broj nasumičnih kodova, i za sekvenciranje svakog lanca od velikog broja ciljnih molekula nukleinske kiseline i velikog broja nasumičnih kodova. U nekim primerima izvođenja, sekvenciranje se izvodi upotrebom postupaka masivnog paralelnog sekvenciranja. U nekim primerima izvođenja, sekvenca jednog lanca ciljnog molekula nukleinske kiseline povezana sa prvim nasumičnim kodom, kada se poravna sa sekvencom komplementarnog lanca povezanog sa drugim nasumičnim kodom, daje merljivu stopu greške sekvenciranja, koja se kreće u opsegu od oko 10-6 do oko 10-8.
KRATAK OPIS CRTEŽA
[0008]
Slika 1 je crtana ilustracija tipičnog vektora prema predmetnom prikazu koji je od koristi pri generisanju biblioteke dvolančanih nukleinskih kiselina.
Slika 2 je crtana ilustracija tipičnog vektora prema predmetnom prikazu, pri čemu su adaptorske sekvence uključene u, i korisne za, na primer, postupke premošćujuće amplifikacije pre sekvenciranja.
Slike 3A i 3B prikazuju karakteristike biblioteke kodova i detekciju pravih mutacija. (A) Podaci generisani u samo jednoj rundi sekvenciranja naredne generacije na sistemu MiSeq® pokazuju široku pokrivenost i diverzitet u uzvodnom kodu od sedam baznih parova u vektorskoj biblioteci, pri čemu je vektor koji je korišćen ilustovan na Slici 2. (B) Cypher Seq eliminiše greške koje su uvedene tokom pripreme i sekvenciranja biblioteke. Ciljni molekuli nukleinske kiseline su ligacijom uvedeni u vektorsku biblioteku kodova koja sadrži prethodno popisane, dualne, dvolančane kodove. Ciljne sekvence su amplifikovane i sekvencirane. Sva očitavanje sekvence koja imaju identične parove kodova, zajedno sa svojim reverznim komplementima, grupisani su u familije. Poređenje familija sekvenci omogućilo je generisanje konsenzusne sekvence iz koje su ’mutacije’ (greške) koje nastaju tokom pripreme biblioteke (prazni krugovi) i tokom sekvenciranja (sivi krugovi i trouglovi) were computationally eliminated. U principu, mutacije koje su prisutne u svim ili u osnovi u svim (crni romb) from the same cypher and its reverse complement are counted as true mutacije.
Slike 4A i 4B prikazuju da sistem sa kodovima može da razlikuje prave mutacije od artefaktnih mutacija. (A) Egzon 4 TP53 divljeg tipa ligacijom je ubačen u biblioteku library of Cypher Seq vektora i sekvenciran na Illumina MiSeq® instrumentu do dubine od preko milion. Sekvence su zatim upoređene sa sa sekvencom divljeg tipa TP53. Detektovane supstitucije su prikazane pre (A) i posle korekcije (B) pomoću Cypher Seq.
DETALJAN OPIS PRONALASKA
[0009] U jednom aspektu, predmetni pronalazak obezbeđuje biblioteku dvolančanih nukleinskih kiselina u kojoj ciljni molekuli nukleinskih kiselina uključuju dualne kodove (tj., barkodove ili oznake za identifikaciju porekla), po jedan na svakom kraju (iste ili različite), tako da sekvenciranje svakog komplementarnog lanca može da se poveže ili uveže sa originalnim molekulom. Jednistveni kod na svakom lancu povezuje svaki lanac sa njegovim originalnim komplementarnim lancem (npr., pre bilo kakve amplifikacije), tako da svaka uparen sekvenca služi kao svoja sopstvena unutrašnja interna kontrola. Drugim rečima, jedinstvenim obeležavanjem dvolančanih molekula nukleinske kiseline, podaci o sekvenci dobijeni sa jednog lanca pojedinačnog molekula nukleinske kiseline mogu specifično da se povežu sa podacima o sekvenci dobijenim sa komplementarnog lanca istog tog dvolančanog molekula nukleinske kiseline. Osim toga, podaci o sekvenci dobijeni sa jednog kraja dvolančanog ciljnog molekula nukleinske kiseline, mogu specifično da se povežu sa podacima o sekvenci koji su dobijeni sa suprotnog kraja tog istog dvolančanog ciljnog molekula nukleinske kiseline (ukoliko, na primer, nije moguće dobiti podatke o sekvenci za ceo fragment ciljnog molekula nukleinske kiseline iz biblioteke).
[0010] Kompozicije i postupci prema ovom prikazu omogućavaju prosečnom stručnjaku u oblasti da preciznije razlikuje prave mutacije (tj., in vivo mutacije koje nastaju prirodnim putem) molekula nukleinskih kiselina od artefaktnih "mutacija" (tj., ex vivo mutacija ili grešaka) molekula nukleinskih kiselina, koje mogu da nastanu iz različitih razloga, kao što je greška u nizvodnoj amplifikaciji, greška u sekvenciranju, fizičko ili hemijsko oštećenje. Na primer, ako je mutacija već postojala u originalnom dvolančanom molekulu nukleinske kiseline pre izolovanja, amplifikacije ili sekvenciranja, tada će tranziciona mutacija adenina (A) u guanin (G) identifikovana na jednom lancu biti komplementarna sa prelaskom timina (T) u cistein (C) na drugom lancu. Za razliku od toga, izuzetno je malo verovatno da će artefaktne "mutacije" koje nastaju kasnije na idividualnom (odvojenom) DNK lancu usled grešaka polimeraze tokom izolovanja, amplifikacije ili sekvenciranja imati promenu svoje naspramne baze u komplementarnom lancu. Pristup prema ovom prikazu obezbeđuje kompozicije i postupke za razlikovanje sistematskih grešaka (npr., greške usled propusta u vernosti polimeraze) i bioloških grešaka (npr., hemijskih ili drugih oštećenja) od stvarnih poznatih ili novoidentifikovanih pravih mutacija ili polimorfizama jednog nukleotida (SNP).
[0011] U nekim primerima izvođenja, dva koda koji se nalaze na svakom ciljnom molekulu imaju sekvence koje su međusobno različite, i stoga obrazuju jedinstveni par identifikatora gde jedan kod identifikuje (ili je u vezi sa) prvi kraj ciljnog molekula nukleinske kiseline, a drugi kod identifikuje (ili je u vezi sa) drugim krajem ciljnog molekula nukleinske kiseline. U nekim drugim primerima izvođenja, dva koda koji se nalaze na svakom ciljnom molekulu imaju istu sekvencu, i stoga jedinstveni identifikator sredstvo za identifikaciju za svaki lanac ciljnog molekula nukleinske kiseline. Svaki lanac u biblioteci dvolančanih nukleinskih kiselina (npr., genomska DNK, cDNK) može da se amplifikuje i sekvencira upotrebom, na primer, tehnologija sekvenciranja naredne generacije (kao što je, emulziona PCR ili premošćujuća amplifikacija kombinovana sa pirosekvenciranjem ili sekvenciranjem putem sinteze, ili slično). Informacija o sekvenci svakog komplementarnog lanca prvog dvolančanog molekula nukleinske kiseline može da se poveže i uporedi (npr., kompjuterskom dekonvolucijom) zahvaljujući jedinstvenim kodovima koji su povezani sa svakim krajem ili lancem tog konkretnog molekula dvolančane nukleinske kiseline. Drugim rečima, svaki originalni fragment dvolančanog molekula nukleinske kiseline koji se nalazi u biblioteci molekula, može individualno da se rekonstruiše zahvaljujući prisustvu povezanog jedinstvene sekvence bar koda ili para bar kodova (identifikatorska oznaka) na svakom ciljnom fragmentu ili lancu.
[0012] Kao osnovni nivo, bilo koja spontana ili indukovana mutacija biće prisutna u oba lanca nativnog dvolančanog DNK molekula. Zbog toga će takva mutantna DNK matrica amplifikovana putem PCR reakcije dati PCR proizvod u kome 100% molekula dobijenih putem PCR reakcije uključuje mutacije. Za razliku od originalne spontane mutacije, promena usled grešk polimeraze pojaviće se samo u jednom lancu molekula inicijalne DNK matrice (dok drugi lanac neće imati tu artefaktnu mutaciju). Ukoliko se svi lanci DNK tokom PCR reakcije kopiraju sa istom efikasnošću, tada će bilo koja greška polimeraze koja nastaje u prvom ciklusu PCR reakcije, vrlo verovatno moći da se nađe u 25% ukupnog broja PCR proizvoda. Ali molekuli ili lanci DNK ne kopiraju se sa istom efikasnošću, tako da DNK sekvence koje su amplifikovane polazeći od lanca u koji je ugrađena pogrešna nukleotidna baza tokom inicijalne amplifikacije može da predstavlja više ili manje od 25% populacije amplifikovanih DNK sekvenci, u zavisnosti od efikasnosti amplifikacije, ali i dalje znatno manje od 100%. Slično tome, bilo koja greška polimeraze koja se javlja u kasnijim ciklusima PCR reakcije, predstavljaće, u principu, još manji udeo PCR proizvoda (tj., 12.5% za drugi ciklus, 6.25% za treći, itd.) koji sadrže "mutaciju". PCR-indukovane mutacije mogu da nastanu usled grešaka polimeraze ili usled toga što polimeraza preskače oštećene nukleotide, dovodeći tako do greške (videti, npr., Bielas and Loeb, Nat. Methods 2:285-90, 2005). Na primer, česta promena DNK je deaminacija citozina, što Taq polimeraza prepoznaje kao uracil i dovodi do tranzicione mutacije citozina u timin (Zheng et al., Mutat. Res. 599:11-20, 2006) – to jest, izmena originalne sekvence DNK može da se detektuje kada se oštećena DNK sekvencira, ali može i ne mora da se prepozna da li je takva promena greška reakcije sekvenciranja ili je nastala usled oštećenja ex vivo (npr., tokom ili nakon izolovanja nukleinske).
[0013] Zbog potencijalnih artefakata i izmena molekula nukleinske kiseline koje nastaju tokom izolovanja, amplifikacije i sekvenciranja, precizna identifikacija pravih somatskih DNK mutacija prilikom sekvenciranja amplifikovanih molekula nukleinske kiseline je teška. Usled toga, procenjivanje da li su izvesne mutacije u vezi sa, ili predstavljaju biomarker za različita stanja bolesti (npr., kancer) ili starenje, postaje problematično.
[0014] Sekvenciranje naredne generacije otvorilo je vrata za sekvenciranje višestrukih kopija aplifikovanog pojedinačnog molekula nukleinske kiseline – koje se označava kao duboko sekvenciranje. Ideja u osnovi dubokog sekvenciranja je ta da, ukoliko se konkretan nukleotid molekula nukleinske kiseline sekvencira više puta, onda se lakše mogu identifikovati retke varijante sekvence ili retke mutacije. Međutim postupak amplifikacije i sekvenciranja zapravo ima inherentnu stopu greške (koja može da varira u zavisnosti od kvaliteta, čistoće, koncentracije DNK (npr., gustine klastera), ili drugih stanja), tako da. bez obzira na to koliko se malo ili mnogo puta molekul nukleinske kiseline sekvencira, stručnjak u oblasti ipak ne može da razlikuje artefakt nastao usled grešaka polimeraze od prave mutacije (naročito od retkih mutacija).
[0015] I dok sekvenciranje velikog broja različitih DNK molekula, zbirno gledano, predstavlja prednost u smislu troškova i vremena, cena ove efikasnosti i pogodnosti je to što različite greške u PCR komplikuju analizu mutacija sve dotle dok je njihova učestalost uporediva sa učestalošću mutacija koje nastaju in vivo – drugim rečima, prave in vivo mutacije u osnovi neće moći da se razlikuju od promena koje predstavljaju artefakte grešaka prilikom PCR reakcije ili sekvenciranja.
[0016] Dakle, predmetni prikaz, u dodatnom aspektu, obezbeđuje postupke za identifikaciju mutacija koje su prisutne pre amplifikacija ili sekvenciranja biblioteke dvolančanih nukleinskih kiselina pri čemu ciljni molekuli uključuju jedinstven dvolančani kod ili dualni kod (tj., barkodove ili identifikacione oznake), po jedan na svakom kraju, tako da sekvenciranje svakog komplementarnog lanca može da se poveže sa originalnim molekulom. U nekim primerima izvođenja, ovaj postupak pojačava senzitivnost postupka sekvenciranja tako da stopa greške iznosi 5 x 10-6, 10-6, 5 x 10-7, 10-7, 5 x 10-8, 10-8 ili manje, kada se sekvenciraju mnogobrojni različiti ciljni molekuli nukleinske kiseline istovremeno ili tako da stopa greške iznosi 5 x 10<-7>, 10-7, 5 x 10-8, 10-8 ili manje, kada se detaljno sekvencira pojedinačni ciljni molekul nukleinske kiseline.
[0017] Pre detaljnijeg izlaganja ovog prikaza, za njegovo razumevanje bi moglo da bude od pomoći da se obezbede definicije nekih izraza koji se u ovom dokumentu koriste. Kroz ceo ovaj prikaz su izložene i dodatne definicije.
[0018] U predmetnom opisu je potrebno smatrati da svaki opseg koncentracija, opseg procenata, opseg odnosa ili opseg celih brojeva, uključuje vrednost bilo kog celog broja u okviru navedenog opsega i, kada je to potrebno, njegove delove (kao što su jedna desetina i jedna stotina celog broja), osim ako je drugačije naznačeno. Takođe, za bilo koji opseg brojeva koji se ovde navodi u vezi sa bilo kojim fizičkim svojstvom, kao što su broj polimernih jedinica, veličina ili debljina, treba da se podrazumeva da uključuje bilo koji ceo broj u okvirima navedenog opsega, osim ako nije drugačije naznačeno. Kako se koriste u ovom dokumentu, izrazi „oko“ i „koji se u osnovi sastoji od“ označavaju ± 20% navedenog opsega, vrednosti ili strukture, osim ako nije drugačije naznačeno. Potrebno je podrazumevati da se izrazi u jednini, kako se ovde koriste, odnose na „jednu ili više“ pobrojanih komponenti. Ako se koristi alternativa (npr., „ili“), potrebno je smatrati da ona označava bilo samo jednu, obe ili bilo koju kombinaciju tih alternativa. Kako se ovde koriste, izrazi „uključuju, „imaju“ i „sadrže“ koriste se kao sinonimi, i njihovi izvedeni izrazi i varijante su predviđeni da se shvataju kao neograničavajući.
[0019] Kako se ovde koristi, termin "nasumični kod" ili "kod" ili "bar kod" ili "identifikaciona oznaka" i njihove varijante koriste se naizmenično i odnose se na molekul nukleinske kiseline u dužini od oko 5 do oko 50 nukleotida. U nekim primerima izvođenja, svi nukleotidi koda nisu identični (tj. sadrže najmanje dva različita nukleotida) i opciono ne sadrže tri susedna nukleotida koja su identična. U daljim primerima izvođenja, kod se sastoji od oko 5 do oko 15 nukleotida, oko 6 do oko 10 nukleotida, i poželjno oko 7 do oko 12 nukleotida. Kodovi će se generalno nalaziti na jednom ili na oba kraja ciljnog molekula, koji može da bude ugrađen direktno u ciljne molekule od interesa ili u vektor u koji će ciljni molekuli biti kasnije dodati.
[0020] Kako se ovde koristi, „ciljni molekuli nukleinske kiseline“ i njihove varijante odnose se na veliki broj dvolančanih molekula nukleinske kiseline koji mogu biti fragmenti ili kraći molekuli generisani iz dužih molekula nukleinske kiseline, uključujući prirodne uzorke (npr. Genom), ili ciljni molekuli nukleinske kiseline mogu biti sintetički (npr. cDNK), rekombinantni ili njihova kombinacija. Ciljni fragmenti nukleinske kiseline iz dužih molekula mogu se generisati upotrebom različitih tehnika poznatih u tehnici, poput mehaničkog smicanja ili specifičnog cepanja sa restrikcionim endonukleazama.
[0021] Kako se ovde koristi, „biblioteka molekula nukleinske kiseline“ i njihove varijante odnose se na kolekciju molekula ili fragmenata nukleinske kiseline. U nekim primerima izvođenja, kolekcija molekula ili fragmenata nukleinske kiseline ugrađena je u vektor, koji se može transformisati ili transfektovati u odgovarajuću ćeliju domaćina. Ciljni molekuli nukleinske kiseline iz ovog otkrića mogu se uvesti u niz različitih vektorskih kičmi (kao što su plazmidi, kosmidi, virusni vektori ili slično), tako da se rekombinantna proizvodnja biblioteke molekula nukleinske kiseline može održavati u ćeliji domaćinu izbor (kao što su bakterije, kvasac, ćelije sisara ili slično).
[0022] Na primer, kolekcija molekula nukleinske kiseline koja predstavlja ceo genom naziva se genomska biblioteka, a kolekcija DNK kopija glasničke RNK naziva se biblioteka komplementarne DNK (cDNK). Postupci za uvođenje biblioteka molekula nukleinske kiseline u vektore dobro su poznati u tehnici (videti, npr., Current Protocols in Molecular Biology, Ausubel et al., Eds., Greene Publishing and Wiley-Interscience, New York, 1995; Sambrook et al., Molecular Cloning: A Laboratory Manual, 2nd Ed., Cold Spring Harbor Laboratory Vols. 1-3, 1989; Methods in Enzymology, Vol. 152, Guide to Molecular Cloning Techniques, Berger and Kimmel, Eds., San Diego: Academic Press, Inc., 1987).
[0023] U zavisnosti od vrste biblioteke koja treba da se generiše, krajevi ciljnih fragmenata nukleinske kiseline mogu da imaju nesparene krajeve ili mogu da budu „uglačani“ (tj. tupi). Zajedno, ciljni fragmenti molekula nukleinske kiseline mogu, na primer, da se kloniraju direktno u vektor za kod da bi se generisala biblioteka vektora ili da se ligiraju sa adapterima da bi se generisali, na primer, polonije. Ciljni molekuli nukleinske kiseline, koji su molekuli nukleinske kiseline od interesa za amplifikaciju i sekvenciranje, mogu se kretati u veličini od nekoliko nukleotida (npr. 50) do mnogo hiljada (npr. 10 000). Poželjno, ciljni fragmenti u biblioteci se kreću u veličini od oko 100 nukleotida do oko 750 nukleotida ili oko 1 000 nukleotida, ili od oko 150 nukleotida do oko 250 nukleotida ili oko 500 nukleotida.
[0024] Kako se ovde koristi, "mesto za prajming molekula nukleinske kiseline" ili "PS" i njihove varijante su kratke, poznate sekvence nukleinske kiseline sadržane u vektoru. PS sekvenca može da varira po dužini od 5 nukleotida do oko 50 nukleotida, oko 10 nukleotida do oko 30 nukleotida, a poželjno je da imaju oko 15 nukleotida do oko 20 nukleotida. U nekim primerima izvođenja, PS sekvenca može da bude uključena na jednom ili na oba kraja ili može da bude sastavni deo nasumičnog koda molekuli nukleinske kiseline, ili može da bude uključena na jednom ili oba kraja ili može da bude sastavni deo adapterske sekvence, ili može da bude uključena kao deo vektora. Prajmer molekula nukleinske kiseline koji je komplementaran sa PS uključenim u biblioteku prema predmetnom prikazu može da se koristi za inicijaciju reakcije sekvenciranja.
[0025] Na primer, ako nasumični kod ima PS samo uzvodno (5') od koda, tada se prajmer komplementaran PS može koristiti za prajming reakcije sekvenciranja radi dobijanja sekvence nasumičnog koda i neke sekvence ciljnog molekula nukleinske kiseline koja je klonirana nizvodno od koda. U drugom primeru, ako nasumični kod ima prvi PS uzvodno (5') i drugi PS nizvodno (3') od koda, tada se prajmer komplementaran prvom PS može koristiti za prajming reakcije sekvenciranja da bi se dobio niz nasumičnog koda, drugi PS i neka sekvenca ciljnog molekula nukleinske kiseline klonirane nizvodno od druge PS. Suprotno tome, prajmer komplementaran drugom PS može da se koristi za prajming reakcije sekvenciranja da bi se direktno dobila sekvenca ciljnog molekula nukleinske kiseline klonirane nizvodno od druge PS. U ovom poslednjem slučaju dobiće se više informacija o sekvenci ciljnog molekula, jer se reakcija sekvenciranja koja počinje od drugog PS može dalje proširiti u ciljni molekul, nego što reakcija mora da se proteže i kroz kod i kroz ciljni molekul.
[0026] Kako se ovde koristi, “sekvenciranje naredne generacije” odnosi se na postupke sekvenciranja velikog kapaciteta koji omogućavaju paralelno sekvenciranje hiljada i miliona molekula. Primeri postupaka za sekvenciranje naredne generacije uključuju sekvenciranje sintezom, sekvenciranje ligacijom, sekvenciranje hibridizacijom, sekvenciranje polonija i pirosekvenciranje. Povezivanjem prajmera na čvrsti supstrat i komplementarne sekvence na molekul nukleinske kiseline, molekul nukleinske kiseline može da se hibridizuje sa čvrstim supstratom preko prajmera, a zatim mogu da se generišu višestruke kopije u diskretnom području na čvrstom supstratu upotrebom polimeraze za amplifikaciju (ove grupacije se ponekad nazivaju polimerazne kolonije ili polonije). Shodno tome, tokom procesa sekvenciranja, nukleotid na određenom položaju može se sekvencirati više puta (npr. više stotina ili hiljada) - ova dubina pokrivenosti se naziva „duboko sekvenciranje“.
[0027] Kako se ovde koristi, „pozivanje baza“ odnosi se na računarsku konverziju sirovih ili obrađenih podataka iz instrumenta za sekvenciranje u ocene kvaliteta, a zatim stvarne sekvence. Na primer, mnoge platforme za sekvenciranje koriste kamere sa optičkim uređajima za detekciju i naelektrisanje (CCD) da bi generisale slike informacija o intenzitetu (tj. informacije o intenzitetu pokazuju koji je nukleotid u kojem položaju molekula nukleinske kiseline), pa se pozivanje baze obično odnosi na računsku analizu slike koja podatke o intenzitetu pretvara u sekvence i ocene kvaliteta. Sledeći primer je tehnologija sekvenciranja jonskih bujica, koja koristi registrovanu tehnologiju osetljivosti poluprovodničkih jona za otkrivanje oslobađanja vodonikovih jona tokom ugradnje nukleotidnih baza u reakcijama sekvenciranja koje se odvijaju u nizu mikro-mašinski obrađenih bunara. Postoje i drugi primeri postupaka poznatih u struci koji se mogu koristiti za istovremeno sekvenciranje velikog broja molekula nukleotida. Različite metode osnovnog pozivanja opisane su u, na primer, Niedringhaus et al. (Anal. Chem.83:4327, 2011)
[0028] U sledećem opisu su dati određeni specifični detalji kako bi se obezbedilo temeljno razumevanje različitih primera izvođenja ovog pronalaska. Međutim, nakon pregledanja ovog pronalaska, stručnjak će razumeti da se pronalazak može primeniti bez mnogih ovih detalja. U
1
drugim slučajevima, novonastale tehnologije sekvenciranja naredne generacije, kao i dobro poznate ili široko dostupne metode sekvenciranja naredne generacije (npr. sekvenciranje prekida lanca, sekvenciranje terminatora boje, reverzibilno sekvenciranje terminatora boje, sekvenciranje sintezom, sekvenciranje ligacijom, sekvenciranje hibridizacijom, sekvenciranje polonija, pirosekvenciranje, sekvenciranje jonskih poluprovodnika, sekvenciranje nanobola, sekvenciranje nanopora, sekvenciranje jednog molekula, FRET sekvenciranje, sekvenciranje teških baza i mikrofluidno sekvenciranje), nisu sve detaljno opisane kako bi se izbeglo nepotrebno komplikovanje opisa za primere izvođenja ovog pronalaska. Opisi nekih od ovih metoda mogu se naći, na primer, u PCT objavama br. WO 98/44151, WO 00/18957, i WO 2006/08413; i SAD patentima br. 6,143,496, 6833246, i 7,754,429; i objavama prijave SAD patenata br. U.S.
2010/0227329 iU.S.2009/0099041.
[0029] Različiti primeri izvođenja ovog pronlaska opisani su u svrhu ilustracije, u kontekstu upotrebe sa vektorima koji sadrže biblioteku fragmenata nukleinske kiseline (npr., genomsku ili cDNK biblioteku). Međutim, kako će stručnjaci u ovoj oblasti razumeti nakon pregleda ovog otkrića, upotreba sa drugim bibliotekama nukleinske kiseline ili postupci za pravljenje biblioteke fragmenata nukleinske kiseline takođe mogu da budu prikladni.
[0030] U nekim primerima izvođenja, dvolančana biblioteka nukleinske kiseline sadrži veliki broj ciljnih molekula nukleinske kiseline i veliki broj slučajnih kodi, pri čemu biblioteka nukleinske kiseline sadrži molekule koji imaju formulu X<a>-Y-X<b>(po redosledu od 5 do 3 ' ), pri čemu (a) X<a>sadrži prvi nasumični kod, (b) I sadrži molekul ciljne nukleinske kiseline, a (c) X<b>sadrži drugi nasumični kod; pri čemu svaka od velikog broja slučajnih kodova ima dužinu od oko 5 do oko 50 nukleotida. U nekim primerima izvođenja, dvolančana sekvenca X<a>kodove za svaki ciljni molekul nukleinske kiseline razlikuje se od dvolančane sekvence X<b>kodove. U nekim drugim primerima izvođenja, dvolančana X<a>kodova je identična X<b>kodi za jedan ili više ciljnih molekula nukleinske kiseline, pod uslovom da je dvolančana kodova za svaki molekul ciljne nukleinske kiseline različita.
[0031] U daljim primerima izvođenja, veliki broj ili skup slučajnih kodova korišćenih u dvolančanoj biblioteci molekula nukleinske kiseline ili u biblioteci vektora sadrži od oko 5 nukleotida do oko 40 nukleotida, oko 5 nukleotida do oko 30 nukleotida, oko 6 nukleotida do oko 30 nukleotida, oko 6 nukleotida do oko 20 nukleotida, oko 6 nukleotida do oko 10 nukleotida, oko 6 nukleotida do oko 8 nukleotida, oko 7 nukleotida do oko 9 ili oko 10 nukleotida, ili oko 6, oko 7 ili oko 8 nukleotida. U nekim primerima izvođenja, kod poželjno ima dužinu od oko 6, oko 7, oko 8, oko 9, oko 10, oko 11, oko 12, oko 13, oko 14, oko 15, oko 16, oko 17, oko 18, oko 19, ili oko 20 nukleotida. U nekim primerima izvođenja, par slučajnih kodova povezanih sa sekvencama ili vektorima nukleinske kiseline imaće različite dužine ili istu dužinu. Na primer, ciljni molekul nukleinske kiseline ili vektor mogu imati gornju (5 ') prvi nasumični kod dužine oko 6 nukleotida i drugi nasumični kod dužine (3') dužine oko 9 nukleotida, ili ciljni molekul nukleinske kiseline ili vektor može imati gornju (5 ') prvi nasumični kod dužine oko 7 nukleotida i nizvodnu (3') drugi nasumični kod dužine oko 7 nukleotida.
[0032] U nekim primerima izvođenja, i X<a>i X<b>kod sadrže po 6 nukleotida, 7 nukleotida, 8 nukleotida, 9 nukleotida, 10 nukleotida, 11 nukleotida, 12 nukleotida, 13 nukleotida, 14 nukleotida, 15 nukleotida, 16 nukleotida, 17 nukleotida, 18 nukleotida, 19 nukleotida ili 20 nukleotida. U nekim drugim primerima izvođenja, X<a>kod sadrži 6 nukleotida, a X<b>kod sadrži 7 nukleotida ili 8 nukleotida; ili Xa kod sadrži 7 nukleotida, a X<b>kod sadrži 6 nukleotida ili 8 nukleotida; ili Xa kod sadrži 8 nukleotida, a X<b>kod sadrži 6 nukleotida ili 7 nukleotida; ili X<a>kod sadrži 10 nukleotida, a X<b>kod sadrži 11 nukleotida ili 12 nukleotida.
[0033] Broj nukleotida sadržanih u svakoj od slučajnih šifri ili bar kodova upravljaće ukupnim brojem mogućih bar kodova dostupnih za upotrebu u biblioteci. Kraći barkodovi omogućavaju manji broj jedinstvenih kodova, što može da bude korisno kada se izvodi duboko sekvenciraje jedne ili nekoliko nukleotidnih sekvenci, dok duži bar kodovi mogu da budu poželjni pri ispitivanju populacije molekula nukleinske kiseline, kao što su cDNK ili genomski fragmenti. U nekim primerima izvođenja, multipleks sekvenciranje može da bude poželjno kada se ciljaju specifični molekuli nukleinske kiseline, specifični genomski regioni, manji genomi ili podskup transkripata cDNK. Multipleksno sekvenciranje uključuje amplifikaciju dva ili više uzoraka koji su udruženi u, na primer, jednu traku protočne ćelije u cilju premošćujuće amplifikacije kako bi se eksponencijalno povećao broj analiziranih molekula u jednom ciklusu bez kompromisa kada su u pitanju vreme ili troškovi. U povezanim primerima izvođenja, jedinstvena indeksna sekvenca (koja se sastoji od dužine u rasponu od oko 4 nukleotida do oko 25 nukleotida) specifična za određeni uzorak je uključena u svaku vektorsku biblioteku dualnih kodova. Na primer, ako se deset različitih uzoraka udružuje u pripremi za multipleksno sekvenciranje, tada će se koristiti deset različitih indeksnih sekvenci tako da se koristi deset vektorskih biblioteka dualnih kodova u kojima svaka biblioteka ima jedan, jedinstveni identifikator indeksne sekvence (ali svaka biblioteka ima veliki broj slučajnih kodova).
[0034] Na primer, bar kod od 7 nukleotida imao bi formulu 5’-NNNNNNN-3 ’(SEQ ID NO.: 1), gde N može biti bilo koji nukleotid koji se prirodno javlja. Četiri nukleotida koji se javljaju u prirodi su A, T, C i G, tako da je ukupan broj mogućih slučajnih kodova 47 ili 16.384 mogućih nasumičnih rasporeda (tj. 16.384 različitih ili jedinstvenih kodova). Za 6 i 8 nukleotidnih barkodova, broj slučajnih kodova bio bi 4.096, odnosno 65.536. U nekim primerima izvođenja 6, 7 ili 8 slučajnih nukleotidnih kodova, može biti manje od skupa od 4.094, 16.384 ili 65.536 jedinstvenih kodova, dostupnih za upotrebu kada se izuzmu, na primer, sekvence u kojima su sve nukleotide identične (npr. svi A ili svi T ili svi C ili svi G) ili kada se izuzimaju sekvence u kojima su tri susedna nukleotida identična ili kada se isključuju obe ove vrste molekula. Pored toga, prvih oko 5 nukleotida do oko 20 nukleotida ciljne sekvence molekula nukleinske kiseline mogu se koristiti kao sledeća identifikaciona oznaka zajedno sa sekvencom pridružene nasumičnog koda.
[0035] U drugim dodatnim primerima izvođenja, dvolančana biblioteka nukleinske kiseline sadrži veliki broj ciljnih molekula nukleinske kiseline i veliki broj slučajnih kodova, pri čemu biblioteka nukleinske kiseline sadrži molekule koji imaju formulu X<a>-Y-X<b>(u 5 'do 3' smeru), pri čemu (a) X<a>sadrži prvi nasumični kod, (b) Y sadrži ciljni molekul nukleinske kiseline, a (c) X<b>sadrži drugi nasumični kod; pri čemu svaki od velikog broja slučajnih kodova ima dužinu od oko 5 do oko 50 nukleotida i pri čemu (i) su najmanje dva od tih nukleotida različita u svakoj kodi (ii) svaka kod ne sadrži tri susedna nukleotida koja su identična. U nekim primerima izvođenja gde svaka kod ne sadrži tri susedna nukleotida koja su identična, dvolančana X<a>kodova je identična X<b>kodi za jedan ili više ciljnih molekula nukleinske kiseline, pod uslovom da dvolančana kod za svaki ciljni molekul nukleinske kiseline je drugačiji.
[0036] U dodatnim primerima izvođenja, dvolančana biblioteka nukleinske kiseline sadrži veliki broj ciljnih molekula nukleinske kiseline i veliki broj slučajnih kodova, pri čemu biblioteka nukleinske kiseline sadrži molekule koji imaju formulu X<a>-X<b>-Y, X<b>-X<a>-Y, Y-X<a>-X<b>, Y-X<b>-X<a>, Xa-Y, Xb-Y, Y-Xa ili Y-Xb (u redosledu od 5 'do 3'), pri čemu (a) X<a>sadrži prvu slučajnu šifru, ( b) Y sadrži ciljni molekul nukleinske kiseline, a (c) X<b>sadrži drugi nasumični kod; pri čemu svaka od velikog broja slučajnih kodova ima dužinu od oko 5 do oko 50 nukleotida.
[0037] U bilo kojoj realizaciji koja je ovde opisana, Xa kod dalje sadrži oko 5 nukleotida do oko 20 nukleotidnih sekvenci ciljnog molekula nukleinske kiseline koji je nizvodno od Xa kod, ili Xb kod dalje sadrži oko 5 nukleotida do oko 20 nukleotidnih sekvenci ciljnog molekula nukleinske kiseline koje se nalaze uzvodno od Xb kodove, ili Xa kod i Xb kod dalje sadrže oko 5 nukleotida do oko 20 nukleotidnih sekvenci ciljnog molekula nukleinske kiseline, odnosno nizvodno ili uzvodno, svake šifre.
[0038] U dodatnim primerima izvođenja, prvi ciljni molekul je povezan i raspoređen između prvog nasumičnog koda X<a>i drugog nasumičnog koda X<b>, drugi ciljni molekul je povezan i raspoređen između treće slučajne kod X<a>i četvrte slučajne kod X<b>, i tako dalje, pri čemu ciljni molekuli biblioteke ili vektorske biblioteke imaju jedinstvenu Xa kod (tj. nijedna od Xa kod-a nema istu sekvencu) i svaka ima jedinstvenu Xb kod-u (tj. nijedna od Xb-kod-a nema isti niz), i pri čemu nijedna ili samo manjina X<a>i X<b>kod-a nema istu sekvencu.
[0039] Na primer, ako dužina nasumičnog koda iznosi 7 nukleotida, tada će biti dostupno ukupno 16.384 različitih barkodova kao prvi nasumični kod X<a>i druga nasumični kod X<b>. U
1
ovom slučaju, ako je prvi ciljni molekul nukleinske kiseline povezan i raspoređen između nasumičnog koda X<a>broj 1 i nasumičnog koda X<b>broj 2, a drugi ciljni molekul nukleinske kiseline je povezan i raspoložen između nasumičnog koda X<a>broj 16,383 i nasumičnog koda X<b>brojem 16,384, tada se treći ciljni molekul nukleinske kiseline može povezati i rasporediti između bilo kog para slučajnih cifarskih brojeva odabranih od brojeva 3 do 16,382, i tako dalje za svaki ciljni molekul nukleinske kiseline u biblioteci sve dok svaka od različitih slučajnih kodova su korišćeni (što može i ne mora biti svih 16.382). U ovom ostvarenju, svaki ciljni molekul nukleinske kiseline u biblioteci imaće jedinstveni par kodova koji se razlikuju od svakog drugog para pronađenih kodova povezanih jedni sa drugima molekula molekula nukleinske kiseline u biblioteci.
[0040] U bilo kom ovde opisanom primeru izvođenja, nasumične sekvence cifera iz određenog skupa kodova (npr. skupovi od 4.094, 16.384 ili 65.536 jedinstvenih kodova) mogu se koristiti više puta. U daljim primerima izvođenja, svaki ciljni molekul nukleinske kiseline ili podskup ciljnih molekula ima različit (jedinstveni) par kodova. Na primer, ako je prvi ciljni molekul povezan i raspoređen između nasumičnog koda broj 1 i nasumičnog koda broj 100, tada će uz drugu ciljnu molekulu morati biti postavljen drugačiji dvostruki par kodova - kao što su nasumični kod broj 1 i nasumični kod broj 65, ili nasumični kod broj 486 i nasumični kod broj 100 - što može biti bilo koja kombinacija osim 1 i 100. U nekim drugim primerima izvođenja, svaki ciljni molekul nukleinske kiseline ili podskup ciljnih molekula ima identične kodove na svakom kraju jednog ili više ciljni molekul nukleinske kiseline, pod uslovom da je dvostrana kod za svaku ciljni molekul nukleinske kiseline različita. Na primer, ako je prvi ciljni molekul okružen kodom broj 10, onda će drugi ciljni molekul koji ima identične kodove na svakom kraju morati da ima drugačiju kod - poput nasumičnog koda broj 555 ili slično - što može biti bilo koja druga kod osim 10. U još daljim primerima izvođenja, ciljni molekul nukleinske kiseline iz biblioteke molekula nukleinske kiseline imaće dvostruke jedinstvene kodove X<a>i X<b>, pri čemu nijedna od Xa kodova nema istu sekvencu kao bilo koja druga Xa kodova, nijedna od Xb kodova imaju isti redosled kao bilo koji drugi Xb kod, i nijedan od Xa kod-a nema isti niz kao bilo koji X<b>kod. U još daljim primerima izvođenja, ciljni molekul nukleinske kiseline iz biblioteke molekula nukleinske kiseline će imati jedinstveni par X<a>-X<b>kodova, pri čemu nijedna od X<a>ili Xb kodova nema istu sekvencu. Smeša bilo koje od gore pomenutih realizacija može činiti biblioteku molekula nukleinske kiseline u ovom prikazu.
[0041] U bilo kom ovde opisanom primeru izvođenja, veliki broj ciljnih molekula nukleinske kiseline koji se zajedno koriste za stvaranje biblioteke molekula nukleinske kiseline (ili se koriste za umetanje u vektor za generisanje vektorske biblioteke koja sadrži veliki broj ciljnih molekula nukleinske kiseline) imaju dužinu koja se kreće od oko 10 nukleotida do oko 10000 nukleotida, od oko 50 nukleotida do oko 5 000 nukleotida, od oko 100 nukleotida do oko 1000 nukleotida, ili od oko 150 nukleotida do oko 750 nukleotida, ili od oko 250 nukleotida do oko 500 nukleotide.
[0042] U bilo kom ovde opisanom primeru izvođenja, veliki broj slučajnih kodova može dalje biti povezano sa prvim mestom za prajming molekula nukleinske kiseline (PS1), povezanim sa drugim mestom za prajming molekula nukleinske kiseline (PS2) ili sa prvim i sa drugo mesto za prajming molekula nukleinske kiseline. U nekim primerima izvođenja, veliki broj slučajnih kodova može biti povezano i raspoređeno između prvog mesta za prajming molekula nukleinske kiseline (PS1) i drugog mesta za prajming molekula nukleinske kiseline (PS2), pri čemu se dvolančana sekvenca PS1 razlikuje od dvolančana sekvenca PS2. U nekim primerima izvođenja, svaki par Xa-Xb kodova može biti povezan i raspoređen između početnog mesta molekula nukleinske kiseline (PS1) uzvodno i niže (vidi, npr., Sliku 2).
[0043] U bilo kom ovde opisanom primeru izvođenja, prvo mesto za prajming molekula nukleinske kiseline PS1 nalaziće se uzvodno (5') od prve nasumičnog koda X<a>, a prvo početno mesto za molekule nukleinske kiseline PS1 takođe će se nalaziti nizvodno (3') od druga nasumični kod X<b>. U nekim primerima izvođenja, oligonukleotidni prajmer komplementaran sens lancu PS1 može da se koristi za prajming reakcije sekvenciranja da bi se dobila sekvenca sens lanca prvog nasumičnog koda X<a>ili za prajming reakcije sekvenciranja da bi se dobila sekvenca antisens lanca drugog slučajnog koda X<b>, dok se oligonukleotidni prajmer komplementaran antisens lancu PS1 može koristiti za prajming reakcije sekvenciranja radi dobijanja sekvence antisens lanca prvog nasumičnog koda X<a>ili za prajming reakcije sekvenciranja radi dobijanja sekvence sens lanca drugog nasumičnog koda X<b>.
[0044] U bilo kom ovde opisanom primeru izvođenja, drugo mesto za prajming molekula nukleinske kiseline PS2 nalaziće se nizvodno (3') od prvog nasumičnog koda X<a>, a drugo mesto za prajming molekule nukleinske kiseline PS2 takođe će se nalaziti uzvodno (5') od drugog nasumičnog koda X<b>. U nekim primerima izvođenja, oligonukleotidni prajmer komplementaran sens lancu PS2 može da se koristi za prajming reakcije sekvenciranja da bi se dobila sekvenca sens lanca sa 5'-kraja povezanog dvolančanog ciljnog molekula nukleinske kiseline ili za prajming reakcija sekvenciranja radi dobijanja sekvence anti-sens lanca sa 3'-kraja povezanog dvolančanog ciljnog molekula nukleinske kiseline, dok oligonukleotidni prajmer komplementaran anti-sens lancu PS2 može da se koristi za prajming reakcije sekvenciranja kako bi se dobila sekvenca anti-sens lanca sa 5'-kraja povezanog dvolančanog ciljnog molekula nukleinske kiseline ili da se primeni reakcija sekvenciranja kako bi se dobila sekvenca osećajnog lanca sa 3'-kraja povezanog dvolančanog ciljnog molekula nukleinske kiseline.
1
[0045] U zavisnosti od dužine ciljnog molekula nukleinske kiseline, potpuna sekvenca ciljnog molekula nukleinske kiseline može da se dobije, ukoliko je dovoljno kratka, ili može da se dobije samo deo potpune sekvence ciljnog molekula nukleinske kiseline ukoliko je duža od oko 100 nukleotida do oko 250 nukleotida. Prednost kompozicija i postupaka prema ovom prikazu je to što čak i ako je ciljni molekul nukleinske kiseline previše dugačak da bi se dobili podaci o sekvenci za celokupan molekul ili fragment, podaci o sekvenci dobijeni sa jednog kraja dvolančanog ciljnog molekula mogu specifično da se povežu sa podacima o sekvenci dobijenim sa suprotnog kraja ili sa drugog lanca tog istog dvolančanog ciljnog molekula, pošto će svaki ciljni molekul u biblioteci prema ovom prikazu imati dvolančane kodove, ili jedinstven par kodova Xa-Xb. Povezivanje podataka o sekvenci za dva lanca omogućava senzitivnu identifikaciju „pravih“ mutacija, pri čemu dublje sekvenciranje zapravo povećava senzitivnost detekcije, pa ovi postupci mogu da obezbede dovoljno podataka koji će omogućiti da se odredi broj artefaktnih mutacija.
[0046] U bilo kom od ovde opisanih primera izvođenja, veliki broj nasumičnih kodova može dalje da sadrži prvu sekvencu prepoznavanja restrikcione endonukleaze (RE1) i drugu sekvencu prepoznavanja restrikcione endonukleaze (RE2), pri čemu se prva sekcija prepoznavanja restrikcione endonukleaze RE1 nalazi uzvodno (5') prvog nasumičnog koda X<a>i druga sekvenca prepoznavanja restrikcione endonukleaze RE2 nalazi se nizvodno (3 ') od drugog nasumičnog koda X<b>. U određenim realizacijama, prva sekvenca prepoznavanja restrikcione endonukleaze RE1 i druga sekvenca prepoznavanja restrikcione endonukleaze RE2 su iste ili različite. U nekim primerima izvođenja, RE1, RE2, ili i RE1 i RE2 su restrikcione endonukleaze koji imaju „sekvencu za prepoznavanje“ koja se retko javlja u genomu ili u ciljnoj sekvenci molekula nukleinske kiseline ili su „tupi rezači“ koji generišu nukleinske molekuli kiseline sa tupim krajevima nakon digestije (npr. SmaI). Takvi retki rezni enzimi uglavnom imaju duža mesta prepoznavanja sa sedam ili osam nukleotida ili dužim sekvencama prepoznavanja, kao recimo, AarI, AbeI, AscI, AsiSI, BbvCI, BstRZ2461, BstSWI, CciNI, CsiBI, CspBI, FseI, NotI, MchAI, MspSWI, MssI, PacI, PmeI, SbfI, SdaI, SgfI, SmiI, SrfI, Sse232I, Sse8387I, SwaI, TaqII, VpaK32I, ili slično.
[0047] U nekim primerima izvođenja, biblioteka molekula nukleinske kiseline sadrži molekule nukleinske kiseline koji imaju formulu 5'-RE1-PS1-Xa-PS2-Y-PS2-Xb-PS1-RE2-3 ', gde je RE1 prva restrikciona sekvenca prepoznavanja endonukleaze. , PS1 je prvo mesto prajmiranja molekula nukleinske kiseline, PS2 je drugo mesto prajmiranja molekula nukleinske kiseline, RE2 je druga sekvenca prepoznavanja restrikcione endonukleaze, I sadrži ciljni molekul nukleinske kiseline, a Xa i Xb su ciferi dužine od oko 5 nukleotida do oko 50 nukleotida ili oko 6 nukleotida do oko 15 nukleotida ili oko 7 nukleotida do oko 9 nukleotida. U dodatnim primerima
1
izvođenja, RE1 i RE2 su sekvence prepoznate od iste restrikcione endonukleaze ili njenog izošizomera ili neošizomera, ili RE1 i RE2 imaju različite sekvence prepoznate od različitih restrikcionih endonukleaza. U dodatnim primerima izvođenja, PS1 i PS2 imaju različite sekvence. U dodatnim primerima izvođenja, ciljni molekul nukleinske kiseline iz biblioteke molekula nukleinske kiseline će imati po dvojicu jedinstvenih koda X<a>i X<b>, pri čemu nijedna od Xa koda nema istu sekvencu kao bilo koja druga Xa kod, nijedna od Xb koda nema istu sekvencu kao bilo koji drugi Xb kod, i nijedan od Xa kod nema isti redosled kao bilo koji Xb kod. U dodatnim primerima izvođenja, ciljni molekul nukleinske kiseline iz biblioteke molekula nukleinske kiseline će imati jedinstvenu kodu ili par X<a>-X<b>koda, pri čemu nijedna od X<a>ili X<b>koda nema istu sekvencu.
[0048] U ovom pronalasku je takođe razmatrana upotreba biblioteke ciljnih molekula nukleinske kiseline obeleženih barkodovima na oba lanca ili dualnim barkodovima na oba lanca, u cilju reakcija amplifikacije i sekvenciranja kako bi se detektovale prave mutacije. Da bi se olakšale određene metode amplifikacije ili sekvenciranja, druge karakteristike mogu biti uključene u sastave ovog otkrića. Na primer, premošćujuća amplifikacija može uključivati povezivanje sekvenci adaptera za svaki kraj populacije ciljni molekul nukleinskih kiselina. Jednolančani oligonukleotidni prajmeri komplementarni adapterima imobilišu se na čvrstom supstratu, ciljni molekuli koji sadrže adaptacione sekvence se denaturišu u jednostruke lance i hibridizuju do komplementarnih prajmera na čvrstom supstratu. Reakcija produženja se koristi za kopiranje hibridizovanog ciljnog molekula i dvolančani proizvod se ponovo denaturiše u jednolančane. Kopirane pojedinačne niti se zatim premotavaju (čine „most“) i hibridizuju sa komplementarnim prajmerom na čvrstoj podlozi, nakon čega se ponovo pokreće reakcija produženja. Na taj način, mnogi ciljni molekuli mogu da se pojačaju istovremeno i rezultujući proizvod podleže masivnom paralelnom sekvenciranju.
[0049] U nekim primerima izvođenja, biblioteka molekula nukleinske kiseline sadrži molekule nukleinske kiseline koji imaju formulu 5'-RE1-AS-PS1-Xa-PS2-Y-PS2-Xb-PS1-AS-RE2-3', gde su RE1 i RE2 prva i druga sekvencija prepoznavanja restrikcionih endonukleaza, PS1 i PS2 su prvo i drugo mesto prajmiranja molekula nukleinske kiseline, AS je adaptivna sekvenca koja se sastoji od dužine u rasponu od oko 20 nukleotida do oko 100 nukleotida, I sadrži ciljni molekul nukleinske kiseline i Xa i Xb su kodovi dužine u rasponu od oko 5 nukleotida do oko 50 nukleotida ili oko 6 nukleotida do oko 15 nukleotida ili oko 7 nukleotida do oko 9 nukleotida.
[0050] U dodatnim primerima izvođenja, biblioteka molekula nukleinske kiseline sadrži molekule nukleinske kiseline koji imaju formulu 5'-RE1-AS-PS1-Xa-Y-Xb-PS1-AS-RE2-3', gde su RE1 i RE2 prvo i drugo ograničenje sekvenca za prepoznavanje endonukleaze, PS1 je prvo mesto prajmiranja molekula nukleinske kiseline, AS je adaptivna sekvenca koja se sastoji od
1
dužine u rasponu od oko 20 nukleotida do oko 100 nukleotida, Y sadrži ciljni molekul nukleinskih kiselina, a Xa i Xb su kodovi čija dužina varira od oko 5 nukleotida do oko 50 nukleotida ili oko 6 nukleotida do oko 15 nukleotida ili oko 7 nukleotida do oko 9 nukleotida. U povezanim realizacijama, AS adapter sekvenca gore pomenutog vektora može dalje sadržati PS2 koji je drugo mesto za prajmiranje molekula nukleinske kiseline ili PS2 može biti deo originalne AS sekvence. U dodatnim primerima izvođenja, biblioteka molekula nukleinske kiseline može dalje sadržati indeksnu sekvencu (koja se sastoji od dužine u rasponu od oko 4 nukleotida do oko 25 nukleotida) smeštenih između svakog od prvog i drugog AS i PS1 tako da biblioteka može da se udruži sa ostalim bibliotekama koje imaju drugačiju sekvencu indeksa da bi se olakšalo multipleksiranje sekvenciranja (koje se takođe naziva multipleksiranje) bilo pre ili posle pojačanja.
[0051] Svaka od gore pomenutih dvostrukih kodiranih ciljni molekul nukleinskih kiselina može se sastaviti u biblioteku nosača u obliku, na primer, samo-replicirajućeg vektora, kao što je plazmid, kosmid, IAC, virusni vektor ili drugi vektori poznati u tehnici. U određenim realizacijama, bilo koji od gore pomenutih dvolančanih molekula nukleinske kiseline koji sadrži mnoštvo ciljni molekul nukleinskih kiselina i mnoštvo slučajnih kodi, sadržan je u vektoru. U dodatnim primerima izvođenja, takva vektorska biblioteka se nosi u ćeliji domaćinu, kao što su ćelije bakterija, kvasca ili sisara.
[0052] Ovo otkriće takođe pruža vektore korisne za stvaranje biblioteke dvostrukih barkodiranih ciljni molekul nukleinskih kiselina prema ovom otkriću. Primeri vektora koji sadrže kodove i druge elemente ovog otkrića prikazani su na slikama 1 i 2.
[0053] U nekim primerima izvođenja, obezbeđeno je mnoštvo vektora nukleinske kiseline, koje sadrže mnoštvo slučajnih kodi, pri čemu svaki vektor sadrži region koji ima formulu 5'-RE1-PS1-Xa-PS2-RE3-PS2-Xb-PS1- RE2-3', pri čemu (a) RE1 je prva sekvenca prepoznavanja restrikcione endonukleaze, (b) PS1 je prvo mesto primena molekula nukleinske kiseline, (c) Xa sadrži prvu slučajnu kodu, (d) RE3 je treća restrikciona endonukleaza sekvenca prepoznavanja, pri čemu je RE3 mesto u koje se može umetnuti ciljni molekul nukleinske kiseline, (e) X<b>sadrži drugu slučajnu kodu, (f) PS2 je drugo mesto prajmiranja molekula nukleinske kiseline, a (g) RE2 je drugo mesto sekvenca prepoznavanja restrikcionih endonukleaza; i pri čemu svaka od mnoštva slučajnih koda sadrži dužinu u rasponu od oko 5 nukleotida do oko 50 nukleotida, poželjno od oko 7 nukleotida do oko 9 nukleotida; i pri čemu je mnoštvo vektora nukleinske kiseline korisno za pripremu dvolančane biblioteke molekula nukleinske kiseline u kojoj svaki vektor ima drugačiji ciljni molekul nukleinske kiseline. U nekim primerima izvođenja, sekvenca Xa kodove se razlikuje od sekvence Xb kodove u svakom vektoru (to jest, svaki vektor ima jedinstveni par). U dodatnim primerima izvođenja, mnoštvo vektora nukleinske kiseline može
1
dalje sadržati najmanje jednu adaptersku sekvencu (AS) između RE1 i PS1 i najmanje jednu AS između PS1 i RE2, ili sadržati najmanje jednu AS između RE1 i X<a>kod i najmanje jednu AS između X<b>kod i RE2, pri čemu AS opciono ima mesto za prajmiranje.
[0054] U daljim vektorskim rešenjima, mnoštvo nasumičnih koda može imati isti ili različiti broj nukleotida i sastoji se od oko 6 nukleotida do oko 8 nukleotida do oko 10 nukleotida do oko 12 nukleotida do oko 15 nukleotida. U još nekim realizacijama, mnoštvo ciljni molekul nukleinskih kiselina koje se sastoje od oko 10 nukleotida do oko 10 000 nukleotida ili sadrže od oko 100 nukleotida do oko 750 nukleotida ili do oko 1 000 nukleotida, može se umetnuti u vektor na RE3. U određenim realizacijama, RE3 će cepati DNK na tupe krajeve, a mnoštvo ciljni molekul nukleinskih kiselina podvezanih na ovu lokaciju takođe će biti tupo završene.
[0055] U nekim primerima izvođenja, mnoštvo vektora nukleinske kiseline u kojima svaki vektor sadrži region koji ima formulu 5'-RE1-PS1-X<a>-PS2-RE3-PS2-X<b>-PS1-RE2-3 'na X<a>kodima i Xb kodima na svaki vektor se sekvencira pre nego što se ciljni molekul nukleinske kiseline ubaci u svaki vektor. U dodatnim primerima izvođenja, mnoštvo vektora nukleinske kiseline u kojima svaki vektor sadrži region koji ima formulu 5'-RE1-PS1-X<a>-PS2-RE3-PS2 X<b>-PS1-RE2-3 'Xa kodi i Xb kodi na svakoj vektor se sekvencira nakon što se ciljni molekul nukleinske kiseline ubaci u svaki vektor ili se sekvencira istovremeno, insert ciljnog molekula nukleinske kiseline se sekvencira.
[0056] Dvostruki ciljni molekul nukleinskih kiselina sa barkodom i vektori koji sadrže takve molekule iz ovog otkrića mogu se dalje koristiti u reakcijama sekvenciranja da bi se odredila sekvenca i frekvencija mutacije molekula u biblioteci. U određenim realizacijama, ovo otkriće pruža postupak za dobijanje sekvence nukleinske kiseline pripremom dvolančane biblioteke dvostrukih barkodiranih nukleinskih kiselina kako je ovde opisano, a zatim sekvenciranjem svakog lanca mnoštva ciljni molekul nukleinskih kiselina i mnoštva slučajnih koda. U određenim realizacijama, ciljni molekul nukleinske kiseline i i pridružene kodove se izrezuju za sekvenciranje direktno iz vektora korišćenjem restrikcionih enzima endonukleaze pre pojačanja. U određenim realizacijama, metode sekvenciranja naredne generacije se koriste za određivanje sekvence molekula biblioteke, kao što su sekvenciranje sintezom, pirosekvenciranje, reverzibilno sekvenciranje boje-terminatora ili sekvenciranje polonija.
[0057] U dodatnim primerima izvođenja, obezbeđene su metode za određivanje stope greške usled pojačavanja i sekvenciranja određivanjem sekvence jednog lanca ciljnog molekula nukleinskih kiselina povezanog sa prvom slučajnom šifrom i poravnavanjem sa nizom komplementarnog lanca povezanog sa druga slučajna šifra koja pravi razliku između već postojeće mutacije i mutacije pojačanja ili artefakta sekvenciranja, pri čemu će se izmerena stopa greške sekvenciranja kretati od oko 10<-6>do oko 5 x 10<-6>do oko 10<-7>do oko 5 x 10<-7>do oko 10<-8>
1
do oko 10<-9>. Drugim rečima, koristeći metode ovog otkrića, osoba koja je prosečno vešta u stanju tehnike može da poveže svaku očitanu sekvencu DNK sa originalnom DNK šablona. S obzirom na to da su obe niti originalne dvolančane DNK barkodirane povezanim barkodovima, ovo povećava osetljivost poziva baze sekvenciranja jednostavnijim identifikovanjem promena sekvence artefakta „mutacije“ uvedenih tokom procesa sekvenciranja.
[0058] U određenim rešenjima, kompozicije i postupci ovog trenutnog otkrića biće korisni u otkrivanju retkih mutanata u odnosu na veliki pozadinski signal, kao na primer kod nadgledanja tumorskih ćelija u cirkulaciji; otkrivanje cirkulišuće mutirane DNK u krvi, praćenje ili otkrivanje bolesti i retkih mutacija direktnim sekvenciranjem, praćenje ili otkrivanje mutacija povezanih sa bolestima ili lekovima. Dodatna ostvarenja se mogu koristiti za kvantifikovanje oštećenja DNK, kvantifikovanje ili otkrivanje mutacija u virusnim genomima (npr. HIV i druge virusne infekcije) ili drugih infektivnih agenasa koji mogu ukazivati na odgovor na terapiju ili mogu biti korisni u praćenju napredovanja ili recidiva bolesti. U još nekim realizacijama, ovi sastavi i postupci mogu biti korisni u otkrivanju oštećenja DNK hemoterapijom ili u otkrivanju i kvantifikovanju specifične metilacije sekvence DNK.
PRIMERI
PRIMER 1
SEKVENCIRANJE TUMORSKE GENOMSKE BIBLIOTEKE POMOĆU DUALNOG KODA
[0059] Ćelije raka sadrže brojne klonske mutacije, tj. mutacije koje su prisutne u većini ili svim malignim ćelijama tumora i koje su verovatno odabrane jer pružaju proliferativnu prednost. Važno pitanje je da li ćelije raka sadrže i veliki broj slučajnih mutacija, tj. Nasumično raspoređenih neizabranih mutacija koje se javljaju u samo jednoj ili nekoliko ćelija tumora. Takve slučajne mutacije mogu doprineti morfološkoj i funkcionalnoj heterogenosti karcinoma i uključuju mutacije koje pružaju rezistenciju na terapiju. Trenutno otkriće pruža kompozicije i metode za razlikovanje mutacija klona od slučajnih mutacija.
[0060] Da bi se ispitalo da li maligne ćelije pokazuju mutatorski fenotip što rezultira generisanjem slučajnih mutacija u celom genomu, izvršiće se dvostruko sekvenciranje cifera iz ovog otkrića na normalnim i tumorskim genomskim bibliotekama. Ukratko, genomska DNK iz normalnog i tumorskog tkiva koje se podudara sa pacijentom priprema se pomoću Kiagen® kompleta (Valencia, CA) i kvantifikuje optičkom apsorbancijom i kvantitativnom PCR (qPCR). Izolovana genomska DNK je fragmentirana do veličine od oko 150-250 baznih parova (biblioteka sa kratkim insertom) ili do veličine od oko 300-700 baznih parova (biblioteka sa dugim insertom) smicanjem. Fragmenti DNK sa nadvišenim krajevima se popravljaju (tj. otupe)
2
pomoću T4 DNK polimeraze (koja ima i 3 'do 5' aktivnost egzonukleaze i 5 'do 3' polimeraze), a tupi 5'-krajevi DNK se fosforilišu sa T4 polinukleotid kinazom (Quick Blunting Kit I, New England Biolabs), a zatim prečišćena. Završeni popravljeni fragmenti DNK su povezani na SmaI lokaciju biblioteke dvostrukih kod vektora prikazanih na slici 2 da bi se generisala ciljna genomska biblioteka.
[0061] Povezana biblioteka vektorskih kod se prečišćava i ciljni fragmenti genomske biblioteke se pojačavaju korišćenjem, na primer, sledećeg PCR protokola: 30 sekundi na 98 ° C; pet do trideset ciklusa od 10 sekundi na 98 °C, 30 sekundi na 65 °C, 30 sekundi na 72 ° C; 5 minuta na 72 ° C; a zatim čuvati na 4 °C. Amplifikacija se izvodi pomoću prajmera sa sens lancem i antisens koji se žare na sekvencu koja se nalazi unutar adapterskog regiona (u određenim realizacijama prajmer će se žariti na sekvencu uzvodno od AS) i nalazi se uzvodno od jedinstvene kodove i ciljni genomski insert (i, ako je prisutan, uzvodno od indeksne sekvence ako je poželjno multipleksno sekvenciranje; videti, na primer, Sliku 2) za premošćujuće sekvenciranje Illumina. Sekvenciranje gore opisane biblioteke izvršiće se, na primer, instrumentom za sekvenciranje Illumina® Genome Analyzer II kako je odredio proizvođač.
[0062] Jedinstvene kod oznake koriste se za računarsku dekonvoluciju podataka sekvenciranja i mapiranje svih očitanih sekvenci u pojedinačne molekule (tj. za razlikovanje PCR i grešaka sekvenciranja od stvarnih mutacija). Pozivanje baza i poravnanje redosleda izvršiće se, na primer, sistemom Eland (Illumina, San Diego, CA). Dobijeni podaci će omogućiti identifikaciju heterogenosti tumora na nivou jednog nukleotida i otkriti tumore koji imaju mutatorski fenotip.
PRIMER 2
SEKVENCIRANJE MTDNK BIBLIOTEKE POMOĆU DUALNIH KODOVA
[0063] Mutacije mitohondrijalne DNK (mtDNK) dovode do različitih skupova bolesti koje je teško dijagnostifikovati i lečiti. Svaka ljudska ćelija ima stotine do hiljade mitohondrijalnih genoma, a mutacije mtDNK povezane sa bolestima su homoplazmatske prirode, tj. identična mutacija je prisutna u preovlađujućem broju mitohondrija unutar tkiva (Taylor i Turnbull, Nat. Rev. Genet. 6:389, 2005; Chatterjee et al., Oncogene 25:4663, 2006). Iako se precizni mehanizmi nagomilavanja mutacija mtDNK prilikom patogeneze bolesti teško otkrivaju, višestruke homoplazmatske mutacije su dokumentovane kod karcinoma debelog creva, dojke, grlića materice, jajnika, prostate, jetre i pluća (Copeland et al., Cancer Invest. 20:557, 2002; Brandon et al., Oncogene 25:4647, 2006). Otuda, mitohondrijalni genom pruža odličan potencijal kao specifičan biomarker bolesti, što može da omogući poboljšane ishode lečenja i povećano ukupno preživljavanje.
[0064] Sekvenciranje pomoću dualnih kodova prema predmetnom prikazu može da se iskoristi za kvantifikaciju cirkulišućih tumorskih ćelija (CTC ćelija), a cirkulišuća tumorska mtDNK (ctmtDNK) može da se koristi za dijagnostifikovanje i određivanje stadijuma kancera, procenu odgovora na terapiju i procenu progresije i recidiva nakon operacije. Prvo će mtDNK izolovana iz kancera prostate i ćelije periferne krvi od istog pacijenta biti sekvencirana kako bi se identifikovale somatske homoplazmatske mutacije mtDNK. Potencijalni fundamentalni i klinički značaja ovih mtDNK biomarkera će biti statistički procenjen uzimajući u obzir Gleason-ov skor, kliničku fazu, recidive, terapijski odgovor i progresiju.
[0065] Nakon što se identifikuju specifične homoplazmatske mutacije iz pojedinih tumora, uzorci krvi od istih pacijentima će biti ispitani na prisustvo identičnih mutacija u plazmi i frakciji sa belim krvnim zrncima i pločicama, kako bi se utvrdile frekvencije ctmtDNK i CTC ćelija, redom. Ovo će se postići upotrebom tehnologije sekvenciranja pomoću dualnog koda pream ovom prikazu, i kao što je opisano u Primeru 1, kako bi se istovremeno pažljivo pratile višestruke mutacije mtDNK. Utvrdiće se raspodela CTC ćelija u perifernoj krvi kod pacijenata sa različitim nivoima PSA u serumu i različitim Gleason-ovim skorom.
PRIMER 3
DETEKCIJA TP53 MUTACIJA SA VISOKOM REZOLUCIJOM
[0066] Skorašnja studija iz oblasti genomike utvrdila je da je TP53 mutiran u 96% seroznih karcinoma jajnika visokog stepena (HGSC), koji je uzrok smrti u dve trećine svih slučajeva kancera jajnika (Cancer Genome Atlas Research Network, Nature 474:609, 2011), a trenutno prihvaćeni modeli ukazuju da je gubitak TP53 rani događaj u patogenezi HGSC (Bowtell, Nat. Rev. Cancer 10:803, 2010). Dakle, to što je skoro univerzalan i što se u HGSC mutacije TP53 javljaju rano, čine TP53 perspektivnim kandidatom za biomarker za rano otkrivanje i praćenje HGSC. Sekvenciranje pomoću dualnih kodova prema ovom prikazu korišćeno je za otkrivanje somatskih mutacija TP53 koje su nastale tokom replikacije u E. coli.
Konstrukcija vektora za dualni kod
[0067] Napravljen je oligonukleotid koji sadrži EcoRI i BamHI restrikciona mesta, adapterske sekvence, indekse, i nasumične bar kodove od 7 nukleotida koji okružuju SmaI restrikciono mesto (Integrated DNA Technologies), sa sledećom sekvencom: GATACAGGATCCAATGATACGGCGACCACCGAGATCTACACTAGATCGCGCCTCCT CGCGCCATCAGAGATGTGTATAAGAGACAGNNNNNNNCCCGGGNNNNNNNCTGTCT CTTATACACATCTCTGAGCGGGCTGGCAAGGCAGACCGTAAGGCGAATCTCGTATG CCGTCTTCTGCTTGGAATTCGATACA (SEQ ID NO.:2). To amplify and create a doublestranded product from Kako bi se ovaj jednolančani DNK oligonukleotid amplifikovao i kako bi se od njega dobio dvolančani proizvod, izvedeno je 30 ciklusa PCR koristeći polimerazu PfuUltra High-Fidelity DNA Polymerase (Agilent Technologies) prema uputstvima proizvođača (sekvenca uzvodnog prajmera: GATACAGGATCCAATGATACGG, SEQ ID NO.:3; sekvenca reverznog prajmera: TGTATCGAATTCCAAGCAGAAG, SEQ ID NO.:4). Korišćeni su sledeći uslovi za ciklus: 95 °C tokom 2 minuta, a zatim 30 ciklusa od 95 °C tokom 1 minuta i 64 °C tokom 1 minuta. Dvolančana priroda proizvoda je verifikovana pomoću SmaI (New England BioLabs) restrikcionu digestiju. Zatim je proizvod prečišćen (Zymo Research DNA Clean & Concentrator-5) i podvrgnut restrikcionoj digestiji pomoću EcoRI/BamHI upotrebom BamHI-HF (New England BioLabs) i EcoRI-HF (New England BioLabs) da bi se pripremio konstrukt za ligaciju u UC19 kičmu digeriranu pomoću EcoRI/BamHI. Digerirani vektor i konstrukt su razdvojeni na 1,5% UltraPure Agarose (Invitrogen) gelu za elektroforezu sa niskom tačkom topljenja sa IX SybrSafe (Invitrogen) i izrezane su odgovarajuće trake. DNK u fragmentima gela je prečišćena pomoću Zymo-Clean gela za oporavak DNK gela (Zymo Research) i kvantifikovana pomoću spektrofotometra (Nanophotometer, Implen). Izvedene su reakcije ligacije upotrebom T4 DNK ligaze HC (Invitrogen) i vektora 1: 3 za ubacivanje molarnog odnosa na sobnoj temperaturi tokom 2 sata, zatim je talog etanola taložen i resuspendovan u vodi. Prečišćena DNK (2 μl) je elektroporisana u ćelije ElectroMAX DH10B T1 Phage Resistant Cells (Invitrogen). Transformisane ćelije su postavljene u razblaženju 1: 100 na LB agar medijumu koji sadrži 100 μg/mL karbenicilina i inkubirane preko noći na 37°C da bi se odredio broj kolonija, a ostatak transformacije je dodavan u kulture LB za rast preko noći na 37 °C. DNK iz prekonoćnih kultura je prečišćena pomoću kita QIAquick Spin Miniprep Kit (Qiagen).
[0068] Samo jedna runda sekvenciranja naredne generacije MiSeq® pokazala je optimalnu pokrivenost i diverzifikaciju uzvodnog koda od sedam baznih parova u vektorskoj biblioteci. Slika 3A pokazuje da je svaki nukleotid detektovan sa približno istom stopom na svakoj nasumičnoj poziciji u kodu (ovde su sekvencirani 5’ kodovi).
Konstrukcija biblioteke egzona 4 TP53
[0069] Ukratko, SKOV-3 (humana ćelijska linija karcinoma jajnika) ćelije su gajene u medijumu McCoy’s 5a Medium suplementiranom sa 10% goveđeg fetalnog seruma, 1.5 mM/L-glutamina, 2200 mg/L natrijum bikarbonata i sa penicilin/streptomicinom. SKOV- 3 ćelije su sakupljene i DNK je ekstrahovana koristeći kit DNeasy Blood and Tissue Kit (Qiagen). PCR prajmeri su dizajnirani tako da amplifikuju egzon 4 humanog TP53; sekvenca uzvodnog prajmera: TCTGTCTCCTTCCTCTTCCTACA (SEQ ID NO.:5) i sekvenca reverznog prajmera:
2
AACCAGCCCTGTCGTCTCT (SEQ ID NO.:6). Trideset PCR ciklusa je izvedeno na SKOV-3 DNK koristeći 0.5 μM prajmera i master smešu GoTaq Hot Start Colorless Master Mix (Promega) pod sledećim uslovima ciklusa: 95°C tokom 2 minuta; 30 ciklusa na 95°C po 30 sekundi, na 63°C po 30 sekundi, 72°C tokom 1 minuta; i nakon toga 72°C tokom 5 minuta. Svaki PCR proizvod je ukloniran u TOPO vektore (Invitrogen), transformisan u ćelije One Shot TOP10 h E. coli cells (Invitrogen) koje su zasejane na LB agar medijumu sa 100 μg/mL carbenicilina i inkubirane preko noći na 37°C.
[0070] Deset kolonija je odabrano i gajeno preko noći. DNK iz LB kultura preko noći je prečišćena pomoću kita QIAquick Spin Miniprep Kit (Qiagen). Sekvenciranje TOPO klonova izvedeno je korišćenjem sekvence zasnovane na kapilarnoj elektroforezi na primenjenom DNK analizatoru Applied Biosistems 3730k1. Izabran je jedan TOPO klon koji sadrži odgovarajuću sekvencu egzon 4 divljeg tipa TP53. DNK je podvrgnuta EcoRI digestiji da bi se izrezao TP53 egzon 4 insert i pokrenula 1,5% UltraPure Agarozni gel sa niskom tačkom topljenja. DNK traka TP53 egzon 4 je zatim ručno izrezana i prečišćena pomoću Zymo-Clean gela za oporavak DNK gela praćeno fenol/hloroform/izoamil alkohol ekstrakcijom i taloženjem etanola. Zatim je digerirana DNK otupljena i fosforilisana upotrebom Kuick Blunting Kit (New England BioLabs) i prečišćena fenol/hloroform/izoamil alkohol ekstrakcijom i taloženjem etanola.
[0071] Biblioteka Cipher Sek se digerira sa SmaI, tretira Antartic Phosphatase (New England BioLabs) i radi na 1,5% UltraPure agaroznom gelu sa niskom tačkom topljenja. Odgovarajuća traka je izrezana i prečišćena pomoću Zymo-Clean gela za oporavak DNK gela, praćeno ekstrakcijom fenola/hloroforma/izoamil alkohola i taloženjem etanola. Zatim su izvršene tuplje ligacije vektora i TP53 egzon 4 DNK u reakcijama od 20 ml primenom reagensa T4 DNA Ligase HC (Invitrogen) i vektora 1:10 za ubacivanje molarnog odnosa. Ligacije su inkubirane na 16 °C preko noći, talog je etanol i transformisan u ćelije otporne na ElectroMAX DH1Ob T1-fage. Bakterije su uzgajane preko noći na 37 ° C u LB koja sadrži 100 mg / ml karbenicilina i DNK je prečišćena pomoću kita QIAquick Spin Miniprep Kit. Prisustvo odgovarajućeg inserta je verifikovano dijagnostičkom restrikcionim digestijom i gel-elektroforezom.
[0072] Konstrukt za sekvenciranje sa Illumina adapterima, bar kodovima i TP53 DNK potom je amplifikovan koristeći 10 ciklusa PCR i prajmere dizajnirane prema krajevima adaptera (uzvodni prajmer: AATGATACGGCGACCACCGA, SEQ ID NO.:7; i reverzni prajmer: CAAGCAGAAGACGGCATACGA, SEQ ID NO.:8). Uslovi PCR ciklusa bili su sledeći: 95 °C tokom 2 minuta; 10 ciklusa od 95 °C tokom 30 sekundi, 63 °C tokom 30 sekundi, 72 ° C tokom 1 minuta; praćeno sa 72 °C tokom 5 minuta. Konstrukt za sekvenciranje je prečišćena gelom (Zymo Clean gel komplet za obnavljanje DNK), ekstrahovan fenol/hloroform/izoamil alkoholom i taložen etanolom. Biblioteka je kvantifikovana pomoću Quant-iT PicoGreen testa (Invitrogen) pre punjenja u protočnu ćeliju Illumina MiSek®. Konačno, biblioteka je sekvencirana. Sekvenciranje je izvedeno prema uputstvima proizvođača prema protokolu MiSek® na nivou kvaliteta K30 (Illumina). K ocena se definiše kao svojstvo koje je logaritamski povezano sa osnovnom verovatnoćom greške poziva (K = -10 log10P). U slučaju dodeljene K ocene 30 (K30) bazi, to znači da je verovatnoća netačnog osnovnog poziva 1 na 1.000 puta - to jest tačnost osnovnog poziva (tj. verovatnoća ispravnog osnovnog poziva) je 99,9% - smatra se zlatnim standardom za sekvenciranje naredne generacije. Bar kodovi su korišćeni za dekonvoluciju podataka o sekvenciranju.
Rezultati
[0073] DNK egzona 4, TP53, iz vektorske biblioteke dulanih kodova koja je proizvedena u E. coli sekvencirana je do dubine od preko milion, i sva očitavanja sekvence sa identičnim parovima kodova i njihovim reverznim komplementom, grupisana su u familije kako bi se kreirala konsenzusna sekvenca. Kao što je ilustrovano na Slici 3B, greške koje su uvedene tokom pripreme biblioteke (prazan krug) i tokom sekvenciranja (sivi krug i trougao) eliminisane su iz konsenzusne sekvence izračunavanjem i samo mutacije prisutne u svim očitavanjima (crni rombovi, Slika 3B) familije kodova su se računale kao prave mutacije (videti na dnu Slike 3B).
[0074] Sekvenca egzona 4 divljeg tipa TP53 poređena je sa stvarnim rezultatima sekvenciranja i supstitucije su nanete na grafik pre (Slika 4A) i posle korekcije pomoću Cypher Seq (Slika 4B). Pre korekcije, detektovana učestalost greški je bila 3.9 x 10<-4>/bp (Slika 4A). Ukratko, inicijalna učestalost greški odslikava greške koje su u vezi sa testom (npr., PCR, sekvenciranje, i druge greške uvedene nakon obeležavanja bar kodom). Ovo znači da je detektovanje retke mutacije teško usled toga što je šum veoma visok. Međutim, posle korekcije pomoću Cypher Seq, učestalost greški je opala na 8.8 x 10<-7>/bp (Slika 4B). Drugim rečima, preostale supstitucije su najverovatnije biološke po svojoj prirodi i najverovatnije odražavaju greške uvedene tokom replikacije u E. coli pre ligacije u vektore sa bar kodovima. Dakle, prave mutacije (tj., one koje prirodno nastaju u ćeliji tokom replikacije) lako se mogu detektovati upotrebom sistema kodova prema ovom prikazu.
[0075] Različiti, prethodno opisani primeri izvođenja mogu da se kombinuju kako bi obezbedili dodatne primere izvođenja.
2
2
2
2

Claims (11)

Patentni zahtevi
1. Postupak za precizno detektovanje pravih mutacija na oba lanca nativnog genomskog dvolančanog DNK molekula, koji sadrži:
amplifikaciju biblioteke dvolančanih nukleinskih kiselina, pri čemu biblioteka dvolančanih nukleinskih kiselina sadrži veliki broj ciljnih molekula nukleinske kiseline i veliki broj dvolančanih kodova, pri čemu biblioteka nukleinskih kiselina sadrži molekule koji imaju formulu Xa-Y-Xb (u 5’ ka 3’smeru), gde:
(a) Xa sadrži prvi kod,
(b) Y sadrži ciljni molekul nukleinske kiseline koji sadrži dvolančani fragment genomske DNK, i
(c) Xb sadrži drugi kod koji je različit od prvog koda,
pri čemu svaki od velikog broja kodova sadrži dužinu koja se nalazi u opsegu od oko 5 nukleotida do oko 50 nukleotida, gde prvi kod i drugi kod jedinstveno obeležavaju povezanu ciljnu nukleinsku kiselinu, pri čemu se veliki broj ciljnih molekula nukleinske kiseline i veliki broj dvolančanih kodova amplifikuje;
sekvenciranje amplifikovanog velikog broja ciljnih molekula nukleinske kiseline i velikog broja kodova, da bi se dobili podaci o sekvenci koji sadrže očitavanja sekvence za oba lanca velikog broja ciljnih molekula nukleinske kiseline i velikog broja kodova;
povezivanje podataka o sekvenci za oba lanca svakog od velikog broja ciljnih molekula nukleinske kiseline na osnovu odgovarajućeg prvog i drugog koda; i
detektovanja prave mutacije, pri čemu je prava mutacija ona mutacija koja je prisutna u suštinski svim očitavanjima sekvence povezanih podataka o sekvenci za ciljnu nukleinsku kiselinu sa pravom mutacijom.
2. Postupak prema patentnom zahtevu 1, naznačen time što povezivanje sadrži grupisanje očitavanja sekvence na osnovu identičnosti sekvence sa: prvim ili drugim kodom, i najmanje delom ciljnog molekula nukleinske kiseline koji je susedan prvom ili drugom kodu.
3. Postupak prema patentnom zahtevu 1, naznačen time što se prava mutacija identifikuje onda kada je mutacija prisutna u svim očitavanjima sekvence povezanih podataka o sekvenci za ciljnu nukleinsku kiselinu sa pravom mutacijom.
2
4. Postupak prema patentnom zahtevu 1, naznačen time što svaki od velikog broja kodova ima isti broj nukleotida i sadrži dužinu od oko 5, 6, 7, 8, 9, 10, 15 ili 20 nukleotida.
5. Postupak prema patentnom zahtevu 1, koji sadrži generisanje konsenzusne sekvence iz povezanih podataka o sekvenci.
6. Postupak prema patentnom zahtevu 5, naznačen time što generisanje konsenzusne sekvence sadrži eliminisanje izračunavanjem, mutacija koje nastaju tokom pripreme biblioteke ili tokom sekvenciranja.
7. Postupak prema patentnom zahtevu 1, koji sadrži poravnavanje očitavanja sekvence komplementarnih lanaca istog ciljnog molekula nukleinske kiseline, kako bi se detektovale mutacije koje nastaju tokom pripreme biblioteke ili tokom sekvenciranja.
8. Postupak prema patentnom zahtevu 1, naznačen time što detektovanje prave mutacije sadrži: sekvenciranje velikog broja ciljnih molekula nukleinske kiseline sa stopom greške u opsegu od oko 10-6 do oko 10-8.
9. Postupak prema patentnom zahtevu 1, naznačen time što očitavanja sekvence ne pokrivaju celu sekvencu jednog ili više ciljnih molekula nukleinske kiseline.
10. Postupak prema patentnom zahtevu 1 ili 9, naznačen time što nijedna od dvolančanih sekvenci Xa koda nije ista kao dvolančana sekvenca bilo kog drugog X<a>koda, pri čemu nijedna od dvolančanih sekvenci X<b>koda nije ista kao dvolančana sekvenca bilo kog drugog X<b>koda, i pri čemu nijedna od dvolančanih sekvenci X<a>koda i X<b>koda nisu iste.
11. Postupak prema patentnom zahtevu 9, koji sadrži povezivanje očitavanja sekvence koja su dobijena sa jednog kraja dvolančanog ciljnog molekula sa očitavanjima sekvence koja su dobijena sa suprotnog kraja ili sa drugog lanca istog dvolančanog ciljnog molekula.
RS20210380A 2012-02-17 2013-02-15 Kompozicije i postupci za preciznu identifikaciju mutacija RS61631B1 (sr)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201261600535P 2012-02-17 2012-02-17
EP18150361.6A EP3363901B1 (en) 2012-02-17 2013-02-15 Compositions and methods for accurately identifying mutations

Publications (1)

Publication Number Publication Date
RS61631B1 true RS61631B1 (sr) 2021-04-29

Family

ID=47750867

Family Applications (1)

Application Number Title Priority Date Filing Date
RS20210380A RS61631B1 (sr) 2012-02-17 2013-02-15 Kompozicije i postupci za preciznu identifikaciju mutacija

Country Status (15)

Country Link
US (25) US10011871B2 (sr)
EP (3) EP3363901B1 (sr)
CY (1) CY1123973T1 (sr)
DK (2) DK2814959T3 (sr)
ES (2) ES2665071T3 (sr)
HR (1) HRP20210504T1 (sr)
HU (1) HUE053360T2 (sr)
LT (1) LT3363901T (sr)
NO (1) NO2864470T3 (sr)
PL (2) PL2814959T3 (sr)
PT (2) PT2814959T (sr)
RS (1) RS61631B1 (sr)
SI (1) SI3363901T1 (sr)
SM (1) SMT202100154T1 (sr)
WO (1) WO2013123442A1 (sr)

Families Citing this family (142)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PL2387627T3 (pl) 2009-01-15 2016-10-31 Profilowanie odporności adaptacyjnej i wytwarzanie przeciwciał monoklonalnych
WO2010127186A1 (en) 2009-04-30 2010-11-04 Prognosys Biosciences, Inc. Nucleic acid constructs and methods of use
US10787701B2 (en) 2010-04-05 2020-09-29 Prognosys Biosciences, Inc. Spatially encoded biological assays
US9371598B2 (en) 2010-04-05 2016-06-21 Prognosys Biosciences, Inc. Spatially encoded biological assays
US20190300945A1 (en) 2010-04-05 2019-10-03 Prognosys Biosciences, Inc. Spatially Encoded Biological Assays
WO2012129363A2 (en) 2011-03-24 2012-09-27 President And Fellows Of Harvard College Single cell nucleic acid detection and analysis
GB201106254D0 (en) 2011-04-13 2011-05-25 Frisen Jonas Method and product
PL2814959T3 (pl) 2012-02-17 2018-07-31 Fred Hutchinson Cancer Research Center Kompozycje i sposoby do dokładnej identyfikacji mutacji
ES2662128T3 (es) 2012-03-05 2018-04-05 Adaptive Biotechnologies Corporation Determinación de cadenas de receptor inmunitario emparejadas a partir de la frecuencia de subunidades coincidentes
PT2828218T (pt) 2012-03-20 2020-11-11 Univ Washington Through Its Center For Commercialization Métodos para baixar a taxa de erro da sequenciação paralela massiva de adn utilizando sequenciação duplex de consensus
JP5756247B1 (ja) 2012-05-08 2015-07-29 アダプティブ バイオテクノロジーズ コーポレイション マルチプレックスpcr反応における増幅バイアスを測定し校正する組成物及び方法
CA2872141C (en) * 2012-05-31 2016-01-19 Board Of Regents, The University Of Texas System Method for accurate sequencing of dna
US10400280B2 (en) 2012-08-14 2019-09-03 10X Genomics, Inc. Methods and systems for processing polynucleotides
EP2885418A4 (en) 2012-08-14 2016-03-02 10X Genomics Inc MICROCAPSE COMPOSITIONS AND METHOD THEREFOR
US10323279B2 (en) 2012-08-14 2019-06-18 10X Genomics, Inc. Methods and systems for processing polynucleotides
US9701998B2 (en) 2012-12-14 2017-07-11 10X Genomics, Inc. Methods and systems for processing polynucleotides
US11591637B2 (en) 2012-08-14 2023-02-28 10X Genomics, Inc. Compositions and methods for sample processing
EP4424826A3 (en) 2012-09-04 2024-11-27 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
US20160040229A1 (en) 2013-08-16 2016-02-11 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
US10876152B2 (en) 2012-09-04 2020-12-29 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
US11913065B2 (en) 2012-09-04 2024-02-27 Guardent Health, Inc. Systems and methods to detect rare mutations and copy number variation
EP3511423B2 (en) 2012-10-17 2024-05-29 Spatial Transcriptomics AB Methods and product for optimising localised or spatial detection of gene expression in a tissue sample
WO2015160439A2 (en) 2014-04-17 2015-10-22 Adaptive Biotechnologies Corporation Quantification of adaptive immune cell genomes in a complex mixture of cells
US9410173B2 (en) 2012-10-24 2016-08-09 Clontech Laboratories, Inc. Template switch-based methods for producing a product nucleic acid
US10533221B2 (en) * 2012-12-14 2020-01-14 10X Genomics, Inc. Methods and systems for processing polynucleotides
KR20230003659A (ko) 2013-02-08 2023-01-06 10엑스 제노믹스, 인크. 폴리뉴클레오티드 바코드 생성
HK1222684A1 (zh) 2013-03-15 2017-07-07 夸登特健康公司 检测稀有突变和拷贝数变异的系统和方法
LT3013983T (lt) 2013-06-25 2023-05-10 Prognosys Biosciences, Inc. Erdviniai koduoti biologiniai tyrimai, naudojant mikrofluidinį įrenginį
US9708657B2 (en) * 2013-07-01 2017-07-18 Adaptive Biotechnologies Corp. Method for generating clonotype profiles using sequence tags
EP3058104B1 (en) 2013-10-17 2020-08-19 Takara Bio USA, Inc. Methods for adding adapters to nucleic acids and compositions for practicing the same
WO2015083004A1 (en) * 2013-12-02 2015-06-11 Population Genetics Technologies Ltd. Method for evaluating minority variants in a sample
US9719136B2 (en) 2013-12-17 2017-08-01 Takara Bio Usa, Inc. Methods for adding adapters to nucleic acids and compositions for practicing the same
SG11201604923XA (en) 2013-12-28 2016-07-28 Guardant Health Inc Methods and systems for detecting genetic variants
EP3099820A4 (en) 2014-01-27 2018-01-03 The General Hospital Corporation Methods of preparing nucleic acids for sequencing
US10066265B2 (en) 2014-04-01 2018-09-04 Adaptive Biotechnologies Corp. Determining antigen-specific t-cells
US10988795B2 (en) 2014-05-14 2021-04-27 Ruprecht-Karls-Universitat Heidelberg Synthesis of double-stranded nucleic acids
US12312640B2 (en) 2014-06-26 2025-05-27 10X Genomics, Inc. Analysis of nucleic acid sequences
MX2016016902A (es) 2014-06-26 2017-03-27 10X Genomics Inc Metodos para analizar acidos nucleicos de celulas individuales o poblaciones de celulas.
GB201411603D0 (en) * 2014-06-30 2014-08-13 Vela Operations Pte Ltd Compositions for quantitative and/or semiquantitative mutation detection methods
WO2016010856A1 (en) 2014-07-15 2016-01-21 Qiagen Sciences, Llc Semi-random barcodes for nucleic acid analysis
AU2015339191A1 (en) 2014-10-29 2017-05-18 Adaptive Biotechnologies Corp. Highly-multiplexed simultaneous detection of nucleic acids encoding paired adaptive immune receptor heterodimers from many samples
US10000799B2 (en) 2014-11-04 2018-06-19 Boreal Genomics, Inc. Methods of sequencing with linked fragments
US10246701B2 (en) 2014-11-14 2019-04-02 Adaptive Biotechnologies Corp. Multiplexed digital quantitation of rearranged lymphoid receptors in a complex mixture
WO2016138122A1 (en) 2015-02-24 2016-09-01 Adaptive Biotechnologies Corp. Methods for diagnosing infectious disease and determining hla status using immune repertoire sequencing
US20180119214A1 (en) * 2015-03-31 2018-05-03 Fred Hutchinson Cancer Research Center Compositions and methods for target nucleic acid molecule enrichment
EP3277294B1 (en) 2015-04-01 2024-05-15 Adaptive Biotechnologies Corp. Method of identifying human compatible t cell receptors specific for an antigenic target
SG11201707515SA (en) 2015-04-10 2017-10-30 Spatial Transcriptomics Ab Spatially distinguished, multiplex nucleic acid analysis of biological specimens
GB201515557D0 (en) * 2015-09-02 2015-10-14 14M Genomics Ltd Method of sequencing
WO2017100441A1 (en) 2015-12-08 2017-06-15 Twinstrand Biosciences, Inc. Improved adapters, methods, and compositions for duplex sequencing
JP2019507585A (ja) 2015-12-17 2019-03-22 ガーダント ヘルス, インコーポレイテッド 無細胞dnaの分析による腫瘍遺伝子コピー数を決定するための方法
KR102326769B1 (ko) * 2016-03-25 2021-11-17 카리우스, 인코포레이티드 합성 핵산 스파이크-인
ES2952832T3 (es) 2016-03-28 2023-11-06 Ncan Genomics Inc Captura de dianas dúplex enlazadas
US10961573B2 (en) 2016-03-28 2021-03-30 Boreal Genomics, Inc. Linked duplex target capture
JP7143221B2 (ja) 2016-04-07 2022-09-28 ザ ボード オブ トラスティーズ オブ ザ レランド スタンフォード ジュニア ユニバーシティー 5-ヒドロキシメチル化無細胞系dnaをシーケンシングすることによる非侵襲性診断
ES3002715T3 (en) 2016-04-14 2025-03-07 Guardant Health Inc Methods for early detection of cancer
US11384382B2 (en) 2016-04-14 2022-07-12 Guardant Health, Inc. Methods of attaching adapters to sample nucleic acids
MX2018013341A (es) 2016-05-02 2019-09-18 Encodia Inc Analisis de macromoleculas que emplea la codificacion de acido nucleico.
WO2017217694A2 (ko) * 2016-06-16 2017-12-21 한국한의학연구원 돌연변이 발생률의 측정 방법
KR101915701B1 (ko) 2016-06-16 2018-11-07 한국한의학연구원 돌연변이 발생률의 측정 방법
EP3485033B1 (en) 2016-07-12 2022-09-28 Qiagen Sciences, LLC Single end duplex dna sequencing
US10428325B1 (en) 2016-09-21 2019-10-01 Adaptive Biotechnologies Corporation Identification of antigen-specific B cell receptors
KR20240155386A (ko) 2016-09-30 2024-10-28 가던트 헬쓰, 인크. 무세포 핵산의 다중-해상도 분석 방법
US20190256928A1 (en) * 2016-10-20 2019-08-22 Fred Hutchinson Cancer Research Center Systems and methods for detecting disseminated or circulating cells or dna
CN110114473A (zh) * 2016-11-23 2019-08-09 斯特拉斯堡大学 靶分子的串联条形码添加以便以单实体分辨率对靶分子进行绝对定量
GB201620450D0 (en) 2016-12-01 2017-01-18 Oxford Nanopore Tech Ltd Method
WO2018104908A2 (en) 2016-12-09 2018-06-14 Boreal Genomics, Inc. Linked ligation
US11584958B2 (en) 2017-03-31 2023-02-21 Grail, Llc Library preparation and use thereof for sequencing based error correction and/or variant identification
GB201707140D0 (en) 2017-05-04 2017-06-21 Oxford Nanopore Tech Ltd Method
EP3704249B1 (en) 2017-10-31 2025-05-21 Encodia, Inc. Kits for analysis using nucleic acid encoding and/or label
ES2977793T3 (es) 2017-11-08 2024-08-30 Twinstrand Biosciences Inc Reactivos y adaptadores para la secuenciación de ácidos nucleicos y métodos para fabricar dichos reactivos y adaptadores
US11254980B1 (en) 2017-11-29 2022-02-22 Adaptive Biotechnologies Corporation Methods of profiling targeted polynucleotides while mitigating sequencing depth requirements
US20190237161A1 (en) 2017-12-22 2019-08-01 Grail, Inc. Error removal using improved library preparation methods
GB201809323D0 (en) 2018-06-06 2018-07-25 Oxford Nanopore Tech Ltd Method
EP4647512A2 (en) 2018-06-22 2025-11-12 ClearNote Health, Inc. Hydroxymethylation analysis of cell-free nucleic acid samples for assigning tissue of origin, and related methods of use
CA3105659A1 (en) 2018-07-12 2020-01-16 Twinstrand Biosciences, Inc. Methods and reagents for characterizing genomic editing, clonal expansion, and associated applications
US12098419B2 (en) 2018-08-23 2024-09-24 Ncan Genomics, Inc. Linked target capture and ligation
US11519033B2 (en) 2018-08-28 2022-12-06 10X Genomics, Inc. Method for transposase-mediated spatial tagging and analyzing genomic DNA in a biological sample
JP2022501033A (ja) 2018-09-19 2022-01-06 ブルースター ジェノミクス, インコーポレイテッド 膵臓病変の評価における無細胞dnaヒドロキシメチル化プロファイル
US10696994B2 (en) 2018-09-28 2020-06-30 Bioo Scientific Corporation Size selection of RNA using poly(A) polymerase
US11104941B2 (en) 2018-09-28 2021-08-31 Bioo Scientific Corporation 5′ adapter comprising an internal 5′-5′ linkage
CA3118990A1 (en) 2018-11-21 2020-05-28 Karius, Inc. Direct-to-library methods, systems, and compositions
WO2020123316A2 (en) 2018-12-10 2020-06-18 10X Genomics, Inc. Methods for determining a location of a biological analyte in a biological sample
DK3884071T3 (da) 2019-01-03 2025-06-10 Ncan Genomics Inc Sammenkædet måloptagelse
US11926867B2 (en) 2019-01-06 2024-03-12 10X Genomics, Inc. Generating capture probes for spatial analysis
US11649485B2 (en) 2019-01-06 2023-05-16 10X Genomics, Inc. Generating capture probes for spatial analysis
WO2020185967A1 (en) * 2019-03-11 2020-09-17 Red Genomics, Inc. Methods and reagents for enhanced next generation sequencing library conversion and insertion of barcodes into nucleic acids.
CN114072499B (zh) 2019-04-30 2024-08-06 Encodia公司 用于制备分析物的方法和相关试剂盒
WO2020243579A1 (en) 2019-05-30 2020-12-03 10X Genomics, Inc. Methods of detecting spatial heterogeneity of a biological sample
EP4007818A4 (en) * 2019-08-01 2023-09-20 Twinstrand Biosciences, Inc. METHODS AND REAGENTS FOR NUCLEIC ACID SEQUENCING AND RELATED APPLICATIONS
GB2627085B (en) 2019-11-06 2024-11-13 Univ Leland Stanford Junior Methods and systems for analysing nucleic acid molecules
WO2021091611A1 (en) 2019-11-08 2021-05-14 10X Genomics, Inc. Spatially-tagged analyte capture agents for analyte multiplexing
CN121022991A (zh) 2019-12-23 2025-11-28 10X基因组学有限公司 使用rna模板化连接进行空间分析的方法
CN115038794A (zh) 2019-12-23 2022-09-09 10X基因组学有限公司 在基于分区的测定中使用固定生物样品的组合物和方法
US12365942B2 (en) 2020-01-13 2025-07-22 10X Genomics, Inc. Methods of decreasing background on a spatial array
US12405264B2 (en) 2020-01-17 2025-09-02 10X Genomics, Inc. Electrophoretic system and method for analyte capture
US11702693B2 (en) 2020-01-21 2023-07-18 10X Genomics, Inc. Methods for printing cells and generating arrays of barcoded cells
US11732299B2 (en) 2020-01-21 2023-08-22 10X Genomics, Inc. Spatial assays with perturbed cells
US20210230681A1 (en) 2020-01-24 2021-07-29 10X Genomics, Inc. Methods for spatial analysis using proximity ligation
US11821035B1 (en) 2020-01-29 2023-11-21 10X Genomics, Inc. Compositions and methods of making gene expression libraries
US12076701B2 (en) 2020-01-31 2024-09-03 10X Genomics, Inc. Capturing oligonucleotides in spatial transcriptomics
US11898205B2 (en) 2020-02-03 2024-02-13 10X Genomics, Inc. Increasing capture efficiency of spatial assays
US12110541B2 (en) 2020-02-03 2024-10-08 10X Genomics, Inc. Methods for preparing high-resolution spatial arrays
US11732300B2 (en) 2020-02-05 2023-08-22 10X Genomics, Inc. Increasing efficiency of spatial analysis in a biological sample
WO2021158925A1 (en) 2020-02-07 2021-08-12 10X Genomics, Inc. Quantitative and automated permeabilization performance evaluation for spatial transcriptomics
US11835462B2 (en) 2020-02-11 2023-12-05 10X Genomics, Inc. Methods and compositions for partitioning a biological sample
US12281357B1 (en) 2020-02-14 2025-04-22 10X Genomics, Inc. In situ spatial barcoding
US12399123B1 (en) 2020-02-14 2025-08-26 10X Genomics, Inc. Spatial targeting of analytes
US11891654B2 (en) 2020-02-24 2024-02-06 10X Genomics, Inc. Methods of making gene expression libraries
US11926863B1 (en) 2020-02-27 2024-03-12 10X Genomics, Inc. Solid state single cell method for analyzing fixed biological cells
US11768175B1 (en) 2020-03-04 2023-09-26 10X Genomics, Inc. Electrophoretic methods for spatial analysis
ES2965354T3 (es) 2020-04-22 2024-04-12 10X Genomics Inc Métodos para análisis espacial que usan eliminación de ARN elegido como diana
EP4153984A1 (en) 2020-05-19 2023-03-29 10X Genomics, Inc. Electrophoresis cassettes and instrumentation
ES2989052T3 (es) 2020-05-22 2024-11-25 10X Genomics Inc Medición espacio-temporal simultánea de la expresión génica y la actividad celular
WO2021237087A1 (en) 2020-05-22 2021-11-25 10X Genomics, Inc. Spatial analysis to detect sequence variants
WO2021242834A1 (en) 2020-05-26 2021-12-02 10X Genomics, Inc. Method for resetting an array
WO2021247543A2 (en) 2020-06-02 2021-12-09 10X Genomics, Inc. Nucleic acid library methods
EP4158054B1 (en) 2020-06-02 2025-04-16 10X Genomics, Inc. Spatial transcriptomics for antigen-receptors
US12265079B1 (en) 2020-06-02 2025-04-01 10X Genomics, Inc. Systems and methods for detecting analytes from captured single biological particles
US12031177B1 (en) 2020-06-04 2024-07-09 10X Genomics, Inc. Methods of enhancing spatial resolution of transcripts
ES2981265T3 (es) 2020-06-08 2024-10-08 10X Genomics Inc Métodos para determinar un margen quirúrgico y métodos de uso del mismo
US12435363B1 (en) 2020-06-10 2025-10-07 10X Genomics, Inc. Materials and methods for spatial transcriptomics
WO2021252591A1 (en) 2020-06-10 2021-12-16 10X Genomics, Inc. Methods for determining a location of an analyte in a biological sample
EP4172362B1 (en) 2020-06-25 2024-09-18 10X Genomics, Inc. Spatial analysis of dna methylation
US11761038B1 (en) 2020-07-06 2023-09-19 10X Genomics, Inc. Methods for identifying a location of an RNA in a biological sample
US12209280B1 (en) 2020-07-06 2025-01-28 10X Genomics, Inc. Methods of identifying abundance and location of an analyte in a biological sample using second strand synthesis
US11981960B1 (en) 2020-07-06 2024-05-14 10X Genomics, Inc. Spatial analysis utilizing degradable hydrogels
US11981958B1 (en) 2020-08-20 2024-05-14 10X Genomics, Inc. Methods for spatial analysis using DNA capture
ES2993269T3 (en) 2020-09-18 2024-12-26 10X Genomics Inc Sample handling apparatus and image registration methods
US11926822B1 (en) 2020-09-23 2024-03-12 10X Genomics, Inc. Three-dimensional spatial analysis
US11827935B1 (en) 2020-11-19 2023-11-28 10X Genomics, Inc. Methods for spatial analysis using rolling circle amplification and detection probes
EP4121555A1 (en) 2020-12-21 2023-01-25 10X Genomics, Inc. Methods, compositions, and systems for capturing probes and/or barcodes
EP4421491A3 (en) 2021-02-19 2024-11-27 10X Genomics, Inc. Method of using a modular assay support device
ES3008686T3 (en) 2021-03-18 2025-03-24 10X Genomics Inc Multiplex capture of gene and protein expression from a biological sample
EP4428246B1 (en) 2021-04-14 2025-12-24 10X Genomics, Inc. Methods of measuring mislocalization of an analyte
US11783912B2 (en) 2021-05-05 2023-10-10 The Board Of Trustees Of The Leland Stanford Junior University Methods and systems for analyzing nucleic acid molecules
WO2022236054A1 (en) 2021-05-06 2022-11-10 10X Genomics, Inc. Methods for increasing resolution of spatial analysis
EP4582555A3 (en) 2021-06-03 2025-10-22 10X Genomics, Inc. Methods, compositions, kits, and systems for enhancing analyte capture for spatial analysis
ES3011462T3 (en) 2021-09-01 2025-04-07 10X Genomics Inc Methods for blocking a capture probe on a spatial array
WO2023086474A1 (en) * 2021-11-10 2023-05-19 Albert Einstein College Of Medicine Method for measuring somatic dna mutation and dna damage profiles and a diagnostic kit suitable therefore
EP4419707A1 (en) 2021-11-10 2024-08-28 10X Genomics, Inc. Methods, compositions, and kits for determining the location of an analyte in a biological sample
EP4305195A2 (en) 2021-12-01 2024-01-17 10X Genomics, Inc. Methods, compositions, and systems for improved in situ detection of analytes and spatial analysis
WO2023122033A1 (en) 2021-12-20 2023-06-29 10X Genomics, Inc. Self-test for pathology/histology slide imaging device

Family Cites Families (88)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
AU672760B2 (en) * 1991-09-24 1996-10-17 Keygene N.V. Selective restriction fragment amplification: a general method for DNA fingerprinting
US5308751A (en) 1992-03-23 1994-05-03 General Atomics Method for sequencing double-stranded DNA
US5695934A (en) 1994-10-13 1997-12-09 Lynx Therapeutics, Inc. Massively parallel sequencing of sorted polynucleotides
US6013445A (en) 1996-06-06 2000-01-11 Lynx Therapeutics, Inc. Massively parallel signature sequencing by ligation of encoded adaptors
DE69837913T2 (de) 1997-04-01 2008-02-07 Solexa Ltd., Saffron Walden Verfahren zur vervielfältigung von nukleinsäure
US6143496A (en) 1997-04-17 2000-11-07 Cytonix Corporation Method of sampling, amplifying and quantifying segment of nucleic acid, polymerase chain reaction assembly having nanoliter-sized sample chambers, and method of filling assembly
CA2321821A1 (en) 1998-06-26 2000-01-06 Visible Genetics Inc. Method for sequencing nucleic acids with reduced errors
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
CA2367400A1 (en) 1999-04-06 2000-10-12 Yale University Fixed address analysis of sequence tags
US6818395B1 (en) 1999-06-28 2004-11-16 California Institute Of Technology Methods and apparatus for analyzing polynucleotide sequences
US7244559B2 (en) 1999-09-16 2007-07-17 454 Life Sciences Corporation Method of sequencing a nucleic acid
AU7537200A (en) 1999-09-29 2001-04-30 Solexa Ltd. Polynucleotide sequencing
JP2004523243A (ja) 2001-03-12 2004-08-05 カリフォルニア インスティチュート オブ テクノロジー 非同期性塩基伸長によってポリヌクレオチド配列を分析するための方法および装置
US20050019776A1 (en) 2002-06-28 2005-01-27 Callow Matthew James Universal selective genome amplification and universal genotyping system
DE60335116D1 (de) 2002-06-28 2011-01-05 Primeradx Inc Verfahren zum nachweis von sequenzunterschieden
WO2004065582A2 (en) 2003-01-15 2004-08-05 Dana-Farber Cancer Institute, Inc. Amplification of dna in a hairpin structure, and applications
WO2004065562A2 (en) 2003-01-22 2004-08-05 Beth Israel Deaconess Medical Center Endocan compositions and methods for the treatment of neoplasms
US20040209299A1 (en) * 2003-03-07 2004-10-21 Rubicon Genomics, Inc. In vitro DNA immortalization and whole genome amplification using libraries generated from randomly fragmented DNA
SG149007A1 (en) * 2003-09-10 2009-01-29 Althea Technologies Inc Expression profiling using microarrays
US7169560B2 (en) 2003-11-12 2007-01-30 Helicos Biosciences Corporation Short cycle methods for sequencing polynucleotides
JP4747245B2 (ja) 2003-12-31 2011-08-17 謙造 廣瀬 RNAiライブラリーの酵素的構築方法
GB0400584D0 (en) 2004-01-12 2004-02-11 Solexa Ltd Nucleic acid chacterisation
EP1709203A2 (en) 2004-01-23 2006-10-11 Lingvitae AS Improving polynucleotide ligation reactions
FR2872953B1 (fr) 2004-07-09 2006-09-15 Peugeot Citroen Automobiles Sa Dispositif d'affichage pour vehicule automobile
US20070207555A1 (en) 2005-02-03 2007-09-06 Cesar Guerra Ultra-sensitive detection systems using multidimension signals
US7393665B2 (en) 2005-02-10 2008-07-01 Population Genetics Technologies Ltd Methods and compositions for tagging and identifying polynucleotides
ATE406463T1 (de) 2005-04-06 2008-09-15 Maurice Stroun Methode zur krebsdiagnose mittels nachweis von dna und rna im kreislauf
EP2302070B1 (en) 2005-06-23 2012-08-22 Keygene N.V. Strategies for high throughput identification and detection of polymorphisms
US7666593B2 (en) 2005-08-26 2010-02-23 Helicos Biosciences Corporation Single molecule sequencing of captured nucleic acids
DE602006011486D1 (de) 2005-09-29 2010-02-11 Keygene Nv Screening mutagenisierter populationen mit hohem durchsatz
EP3045544A1 (en) 2005-12-22 2016-07-20 Keygene N.V. Method for high-throughput aflp-based polymorphism detection
WO2007073171A2 (en) 2005-12-22 2007-06-28 Keygene N.V. Improved strategies for transcript profiling using high throughput sequencing technologies
US7537897B2 (en) 2006-01-23 2009-05-26 Population Genetics Technologies, Ltd. Molecular counting
WO2007092538A2 (en) 2006-02-07 2007-08-16 President And Fellows Of Harvard College Methods for making nucleotide probes for sequencing and synthesis
WO2007100243A1 (en) * 2006-03-01 2007-09-07 Keygene N.V. High throughput sequence-based detection of snps using ligation assays
JP2009529876A (ja) 2006-03-14 2009-08-27 ゲニゾン バイオサイエンシス インコーポレイテッド 核酸を配列決定するための方法および手段
ES2545264T3 (es) 2006-04-04 2015-09-09 Keygene N.V. Detección de alto rendimiento de marcadores moleculares basada en fragmentos de restricción
US7282337B1 (en) 2006-04-14 2007-10-16 Helicos Biosciences Corporation Methods for increasing accuracy of nucleic acid sequencing
US7754429B2 (en) 2006-10-06 2010-07-13 Illumina Cambridge Limited Method for pair-wise sequencing a plurity of target polynucleotides
WO2008076406A2 (en) 2006-12-14 2008-06-26 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes using large scale fet arrays
US8349167B2 (en) 2006-12-14 2013-01-08 Life Technologies Corporation Methods and apparatus for detecting molecular interactions using FET arrays
US8262900B2 (en) 2006-12-14 2012-09-11 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
WO2008093098A2 (en) 2007-02-02 2008-08-07 Illumina Cambridge Limited Methods for indexing samples and sequencing multiple nucleotide templates
EP2201143B2 (en) 2007-09-21 2016-08-24 Katholieke Universiteit Leuven Tools and methods for genetic tests using next generation sequencing
US20090156412A1 (en) 2007-12-17 2009-06-18 Helicos Biosciences Corporation Surface-capture of target nucleic acids
DE102008025656B4 (de) * 2008-05-28 2016-07-28 Genxpro Gmbh Verfahren zur quantitativen Analyse von Nukleinsäuren, Marker dafür und deren Verwendung
US20100041048A1 (en) * 2008-07-31 2010-02-18 The Johns Hopkins University Circulating Mutant DNA to Assess Tumor Dynamics
US20100035252A1 (en) 2008-08-08 2010-02-11 Ion Torrent Systems Incorporated Methods for sequencing individual nucleic acids under tension
US8586310B2 (en) 2008-09-05 2013-11-19 Washington University Method for multiplexed nucleic acid patch polymerase chain reaction
US8383345B2 (en) 2008-09-12 2013-02-26 University Of Washington Sequence tag directed subassembly of short sequencing reads into long sequencing reads
US8546128B2 (en) 2008-10-22 2013-10-01 Life Technologies Corporation Fluidics system for sequential delivery of reagents
US20100137143A1 (en) 2008-10-22 2010-06-03 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
US20100301398A1 (en) 2009-05-29 2010-12-02 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
WO2010086622A1 (en) 2009-01-30 2010-08-05 Oxford Nanopore Technologies Limited Adaptors for nucleic acid constructs in transmembrane sequencing
JP5985390B2 (ja) 2009-04-02 2016-09-06 フリューダイム・コーポレイション 標的核酸にバーコードを付加するためのマルチプライマー増幅方法
CN104404134B (zh) 2009-04-03 2017-05-10 莱弗斯基因股份有限公司 多重核酸检测方法和系统
WO2010126614A2 (en) * 2009-04-30 2010-11-04 Good Start Genetics, Inc. Methods and compositions for evaluating genetic markers
WO2010127186A1 (en) 2009-04-30 2010-11-04 Prognosys Biosciences, Inc. Nucleic acid constructs and methods of use
US8673627B2 (en) 2009-05-29 2014-03-18 Life Technologies Corporation Apparatus and methods for performing electrochemical reactions
US8574835B2 (en) 2009-05-29 2013-11-05 Life Technologies Corporation Scaffolded nucleic acid polymer particles and methods of making and using
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
ES2960184T3 (es) 2010-06-09 2024-03-01 Keygene Nv Códigos de barras de secuencias combinatorias para el cribado de alto rendimiento
ES2690753T3 (es) 2010-09-21 2018-11-22 Agilent Technologies, Inc. Aumento de la confianza en las identificaciones de alelos con el recuento molecular
US9404156B2 (en) 2010-10-22 2016-08-02 Cold Spring Harbor Laboratory Varietal counting of nucleic acids for obtaining genomic copy number information
EP2670894B1 (en) * 2011-02-02 2017-11-29 University Of Washington Through Its Center For Commercialization Massively parallel continguity mapping
WO2012129363A2 (en) * 2011-03-24 2012-09-27 President And Fellows Of Harvard College Single cell nucleic acid detection and analysis
CN103748236B (zh) 2011-04-15 2018-12-25 约翰·霍普金斯大学 安全测序系统
US9809904B2 (en) 2011-04-21 2017-11-07 University Of Washington Through Its Center For Commercialization Methods for retrieval of sequence-verified DNA constructs
EP2710172B1 (en) * 2011-05-20 2017-03-29 Fluidigm Corporation Nucleic acid encoding reactions
PL2814959T3 (pl) 2012-02-17 2018-07-31 Fred Hutchinson Cancer Research Center Kompozycje i sposoby do dokładnej identyfikacji mutacji
US9862995B2 (en) 2012-03-13 2018-01-09 Abhijit Ajit Patel Measurement of nucleic acid variants using highly-multiplexed error-suppressed deep sequencing
PT2828218T (pt) 2012-03-20 2020-11-11 Univ Washington Through Its Center For Commercialization Métodos para baixar a taxa de erro da sequenciação paralela massiva de adn utilizando sequenciação duplex de consensus
CA2872141C (en) 2012-05-31 2016-01-19 Board Of Regents, The University Of Texas System Method for accurate sequencing of dna
US20160040229A1 (en) 2013-08-16 2016-02-11 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
EP4424826A3 (en) 2012-09-04 2024-11-27 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
US9719136B2 (en) 2013-12-17 2017-08-01 Takara Bio Usa, Inc. Methods for adding adapters to nucleic acids and compositions for practicing the same
SG11201604923XA (en) 2013-12-28 2016-07-28 Guardant Health Inc Methods and systems for detecting genetic variants
BR112016016546B1 (pt) 2014-01-16 2022-09-06 Illumina, Inc Método de preparação de amplicon e métodos para determinação da presença de um gene associado a câncer e de uma variante de sequência de ácidos nucleicos verdadeira
US10017759B2 (en) 2014-06-26 2018-07-10 Illumina, Inc. Library preparation of tagged nucleic acid
US10385387B2 (en) 2015-04-20 2019-08-20 Pacific Biosciences Of California, Inc. Methods for selectively amplifying and tagging nucleic acids
US10844428B2 (en) 2015-04-28 2020-11-24 Illumina, Inc. Error suppression in sequenced DNA fragments using redundant reads with unique molecular indices (UMIS)
ES2988429T3 (es) 2015-08-28 2024-11-20 Illumina Inc Análisis de secuencia de ácidos nucleicos de células individuales
WO2017087702A1 (en) 2015-11-18 2017-05-26 Pacific Biosciences Of California, Inc. Loading nucleic acids onto substrates
WO2017100441A1 (en) 2015-12-08 2017-06-15 Twinstrand Biosciences, Inc. Improved adapters, methods, and compositions for duplex sequencing
US11624064B2 (en) 2016-06-13 2023-04-11 Grail, Llc Enrichment of mutated cell free nucleic acids for cancer detection
EP3497220A4 (en) 2016-08-10 2020-04-01 Grail, Inc. METHODS OF PREPARING DOUBLE-INDEXING DNA LIBRARIES FOR BISULPHITE CONVERSION SEQUENCING
WO2018031929A1 (en) 2016-08-12 2018-02-15 Grail, Inc. Method for accurate quantification of genomic copies in cell-free dna

Also Published As

Publication number Publication date
US20210317526A1 (en) 2021-10-14
US20210340619A1 (en) 2021-11-04
NO2864470T3 (sr) 2018-03-03
US20210317525A1 (en) 2021-10-14
PT3363901T (pt) 2021-01-22
US20210395818A1 (en) 2021-12-23
US20210238676A1 (en) 2021-08-05
PL3363901T3 (pl) 2021-07-05
US11441180B2 (en) 2022-09-13
EP2814959A1 (en) 2014-12-24
ES2665071T3 (es) 2018-04-24
US20220349004A1 (en) 2022-11-03
US20230193381A1 (en) 2023-06-22
EP2814959B1 (en) 2018-01-17
HRP20210504T1 (hr) 2021-05-14
EP3854873A1 (en) 2021-07-28
US20240417790A1 (en) 2024-12-19
SMT202100154T1 (it) 2021-05-07
WO2013123442A1 (en) 2013-08-22
US20210222243A1 (en) 2021-07-22
LT3363901T (lt) 2021-04-12
US20210246504A1 (en) 2021-08-12
HUE053360T2 (hu) 2021-06-28
EP3363901B1 (en) 2020-12-30
US20200048706A1 (en) 2020-02-13
US20200048707A1 (en) 2020-02-13
US20200385804A1 (en) 2020-12-10
US20200299767A1 (en) 2020-09-24
US10011871B2 (en) 2018-07-03
CY1123973T1 (el) 2022-05-27
US20200299766A1 (en) 2020-09-24
US20210054455A1 (en) 2021-02-25
PL2814959T3 (pl) 2018-07-31
ES2855130T3 (es) 2021-09-23
US20240409996A1 (en) 2024-12-12
DK2814959T3 (en) 2018-04-23
PT2814959T (pt) 2018-04-12
US20240401128A1 (en) 2024-12-05
US20210238678A1 (en) 2021-08-05
DK3363901T3 (da) 2021-02-22
US20160326578A1 (en) 2016-11-10
US10450606B2 (en) 2019-10-22
US20210388435A1 (en) 2021-12-16
US20150024950A1 (en) 2015-01-22
US20180363048A1 (en) 2018-12-20
SI3363901T1 (sl) 2021-04-30
EP3363901A1 (en) 2018-08-22
US20180363049A1 (en) 2018-12-20
US20240200131A1 (en) 2024-06-20

Similar Documents

Publication Publication Date Title
US20240417790A1 (en) Compositions and methods for accurately identifying mutations
CA2875666A1 (en) Compositions and methods for sensitive mutation detection in nucleic acid molecules
US10954542B2 (en) Size selection of RNA using poly(A) polymerase
HK40058587A (en) Compositions and methods for accurately identifying mutations
HK1259880A1 (en) Compositions and methods for accurately identifying mutations
HK1259880B (en) Compositions and methods for accurately identifying mutations