ES2846730T3 - Concatemerización en superficie de moldes - Google Patents
Concatemerización en superficie de moldes Download PDFInfo
- Publication number
- ES2846730T3 ES2846730T3 ES16715859T ES16715859T ES2846730T3 ES 2846730 T3 ES2846730 T3 ES 2846730T3 ES 16715859 T ES16715859 T ES 16715859T ES 16715859 T ES16715859 T ES 16715859T ES 2846730 T3 ES2846730 T3 ES 2846730T3
- Authority
- ES
- Spain
- Prior art keywords
- region
- immobilized
- known sequence
- nucleic acid
- template
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003199 nucleic acid amplification method Methods 0.000 claims abstract description 122
- 230000003321 amplification Effects 0.000 claims abstract description 120
- 238000000034 method Methods 0.000 claims abstract description 111
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 111
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 105
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 105
- 239000002773 nucleotide Substances 0.000 claims abstract description 82
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 82
- 238000012163 sequencing technique Methods 0.000 claims abstract description 59
- 230000002441 reversible effect Effects 0.000 claims abstract description 45
- 230000000295 complement effect Effects 0.000 claims abstract description 43
- 239000007787 solid Substances 0.000 claims abstract description 38
- 108091028732 Concatemer Proteins 0.000 claims abstract description 33
- 238000006243 chemical reaction Methods 0.000 claims abstract description 12
- 238000009396 hybridization Methods 0.000 claims abstract description 10
- 125000005647 linker group Chemical group 0.000 claims description 13
- 239000000126 substance Substances 0.000 claims description 13
- 239000011324 bead Substances 0.000 claims description 11
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 claims description 4
- 229960002685 biotin Drugs 0.000 claims description 4
- 239000011616 biotin Substances 0.000 claims description 4
- 235000020958 biotin Nutrition 0.000 claims description 2
- 150000002009 diols Chemical class 0.000 claims description 2
- 238000000137 annealing Methods 0.000 abstract description 2
- 108020004414 DNA Proteins 0.000 description 28
- 210000004027 cell Anatomy 0.000 description 23
- 238000001514 detection method Methods 0.000 description 19
- 238000010348 incorporation Methods 0.000 description 16
- 239000003550 marker Substances 0.000 description 16
- 239000012634 fragment Substances 0.000 description 14
- 238000003752 polymerase chain reaction Methods 0.000 description 13
- 239000011159 matrix material Substances 0.000 description 12
- 108091034117 Oligonucleotide Proteins 0.000 description 10
- 230000003993 interaction Effects 0.000 description 10
- 239000000203 mixture Substances 0.000 description 10
- 239000000047 product Substances 0.000 description 10
- 239000000758 substrate Substances 0.000 description 10
- 239000003153 chemical reaction reagent Substances 0.000 description 9
- 239000000178 monomer Substances 0.000 description 9
- 230000008901 benefit Effects 0.000 description 8
- 238000006073 displacement reaction Methods 0.000 description 8
- 239000007790 solid phase Substances 0.000 description 8
- 239000011521 glass Substances 0.000 description 7
- 239000000463 material Substances 0.000 description 7
- 108091033319 polynucleotide Proteins 0.000 description 7
- 102000040430 polynucleotide Human genes 0.000 description 7
- 239000002157 polynucleotide Substances 0.000 description 7
- 241000894007 species Species 0.000 description 7
- 238000013459 approach Methods 0.000 description 6
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 5
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 5
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 5
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 239000000975 dye Substances 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 239000004005 microsphere Substances 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000012175 pyrosequencing Methods 0.000 description 5
- 108091093088 Amplicon Proteins 0.000 description 4
- 108091028043 Nucleic acid sequence Proteins 0.000 description 4
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 4
- 238000003491 array Methods 0.000 description 4
- 238000003776 cleavage reaction Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 4
- 235000011180 diphosphates Nutrition 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 239000002245 particle Substances 0.000 description 4
- 239000000523 sample Substances 0.000 description 4
- 230000007017 scission Effects 0.000 description 4
- ZKHQWZAMYRWXGA-KQYNXXCUSA-J ATP(4-) Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)[C@H]1O ZKHQWZAMYRWXGA-KQYNXXCUSA-J 0.000 description 3
- ZKHQWZAMYRWXGA-UHFFFAOYSA-N Adenosine triphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)C(O)C1O ZKHQWZAMYRWXGA-UHFFFAOYSA-N 0.000 description 3
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 3
- 238000001712 DNA sequencing Methods 0.000 description 3
- 238000003556 assay Methods 0.000 description 3
- 230000005284 excitation Effects 0.000 description 3
- 238000002073 fluorescence micrograph Methods 0.000 description 3
- 235000019000 fluorine Nutrition 0.000 description 3
- 239000000017 hydrogel Substances 0.000 description 3
- 108020004999 messenger RNA Proteins 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 239000004033 plastic Substances 0.000 description 3
- 229920003023 plastic Polymers 0.000 description 3
- -1 polypropylene Polymers 0.000 description 3
- 238000005096 rolling process Methods 0.000 description 3
- YCKRFDGAMUMZLT-UHFFFAOYSA-N Fluorine atom Chemical compound [F] YCKRFDGAMUMZLT-UHFFFAOYSA-N 0.000 description 2
- 108700011259 MicroRNAs Proteins 0.000 description 2
- 239000004677 Nylon Substances 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- KDLHZDBZIXYQEI-UHFFFAOYSA-N Palladium Chemical compound [Pd] KDLHZDBZIXYQEI-UHFFFAOYSA-N 0.000 description 2
- 239000004698 Polyethylene Substances 0.000 description 2
- 239000004793 Polystyrene Substances 0.000 description 2
- PPBRXRYQALVLMV-UHFFFAOYSA-N Styrene Chemical compound C=CC1=CC=CC=C1 PPBRXRYQALVLMV-UHFFFAOYSA-N 0.000 description 2
- 239000004809 Teflon Substances 0.000 description 2
- 229920006362 Teflon® Polymers 0.000 description 2
- GWEVSGVZZGPLCZ-UHFFFAOYSA-N Titan oxide Chemical compound O=[Ti]=O GWEVSGVZZGPLCZ-UHFFFAOYSA-N 0.000 description 2
- 108020004566 Transfer RNA Proteins 0.000 description 2
- 108091023045 Untranslated Region Proteins 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 239000000919 ceramic Substances 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 238000011509 clonal analysis Methods 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 239000000839 emulsion Substances 0.000 description 2
- 238000002866 fluorescence resonance energy transfer Methods 0.000 description 2
- 229910052731 fluorine Inorganic materials 0.000 description 2
- 239000011737 fluorine Substances 0.000 description 2
- 238000007672 fourth generation sequencing Methods 0.000 description 2
- 238000011331 genomic analysis Methods 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 238000011901 isothermal amplification Methods 0.000 description 2
- 239000003446 ligand Substances 0.000 description 2
- 239000002679 microRNA Substances 0.000 description 2
- 238000002663 nebulization Methods 0.000 description 2
- 229920001778 nylon Polymers 0.000 description 2
- XEBWQGVWTUSTLN-UHFFFAOYSA-M phenylmercury acetate Chemical compound CC(=O)O[Hg]C1=CC=CC=C1 XEBWQGVWTUSTLN-UHFFFAOYSA-M 0.000 description 2
- 239000010452 phosphate Substances 0.000 description 2
- 229920002401 polyacrylamide Polymers 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 229920002223 polystyrene Polymers 0.000 description 2
- 239000011148 porous material Substances 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 108020004418 ribosomal RNA Proteins 0.000 description 2
- 239000000377 silicon dioxide Substances 0.000 description 2
- 125000003903 2-propenyl group Chemical group [H]C([*])([H])C([H])=C([H])[H] 0.000 description 1
- JLBJTVDPSNHSKJ-UHFFFAOYSA-N 4-Methylstyrene Chemical compound CC1=CC=C(C=C)C=C1 JLBJTVDPSNHSKJ-UHFFFAOYSA-N 0.000 description 1
- 101710092462 Alpha-hemolysin Proteins 0.000 description 1
- 108020004998 Chloroplast DNA Proteins 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 230000010777 Disulfide Reduction Effects 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 108010052285 Membrane Proteins Proteins 0.000 description 1
- 102000018697 Membrane Proteins Human genes 0.000 description 1
- 108020005196 Mitochondrial DNA Proteins 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 239000004743 Polypropylene Substances 0.000 description 1
- 229920001213 Polysorbate 20 Polymers 0.000 description 1
- 229920002684 Sepharose Polymers 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 102000004523 Sulfate Adenylyltransferase Human genes 0.000 description 1
- 108010022348 Sulfate adenylyltransferase Proteins 0.000 description 1
- 108020005202 Viral DNA Proteins 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 229920006397 acrylic thermoplastic Polymers 0.000 description 1
- 229910052782 aluminium Inorganic materials 0.000 description 1
- XAGFODPZIPBFFR-UHFFFAOYSA-N aluminium Chemical compound [Al] XAGFODPZIPBFFR-UHFFFAOYSA-N 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 239000003054 catalyst Substances 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000001311 chemical methods and process Methods 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 229920001577 copolymer Polymers 0.000 description 1
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 1
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 1
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 description 1
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 1
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 239000005546 dideoxynucleotide Substances 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000022602 disease susceptibility Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000004049 embossing Methods 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000006862 enzymatic digestion Effects 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 125000001153 fluoro group Chemical group F* 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 230000007614 genetic variation Effects 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 239000010439 graphite Substances 0.000 description 1
- 229910002804 graphite Inorganic materials 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 239000004816 latex Substances 0.000 description 1
- 229920000126 latex Polymers 0.000 description 1
- 238000007403 mPCR Methods 0.000 description 1
- 230000005291 magnetic effect Effects 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 150000002739 metals Chemical class 0.000 description 1
- 239000000693 micelle Substances 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 239000003068 molecular probe Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000000465 moulding Methods 0.000 description 1
- 239000002086 nanomaterial Substances 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 230000005257 nucleotidylation Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 229910052763 palladium Inorganic materials 0.000 description 1
- 239000002907 paramagnetic material Substances 0.000 description 1
- 238000002161 passivation Methods 0.000 description 1
- 239000011049 pearl Substances 0.000 description 1
- 239000012071 phase Substances 0.000 description 1
- 238000000206 photolithography Methods 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 229920003229 poly(methyl methacrylate) Polymers 0.000 description 1
- 229920000058 polyacrylate Polymers 0.000 description 1
- 229920001748 polybutylene Polymers 0.000 description 1
- 229920000573 polyethylene Polymers 0.000 description 1
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 1
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 1
- 229920001155 polypropylene Polymers 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 229920002635 polyurethane Polymers 0.000 description 1
- 239000004814 polyurethane Substances 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 238000007841 sequencing by ligation Methods 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 150000003376 silicon Chemical class 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- ISXSCDLOGDJUNJ-UHFFFAOYSA-N tert-butyl prop-2-enoate Chemical compound CC(C)(C)OC(=O)C=C ISXSCDLOGDJUNJ-UHFFFAOYSA-N 0.000 description 1
- ZCUFMDLYAMJYST-UHFFFAOYSA-N thorium dioxide Chemical compound O=[Th]=O ZCUFMDLYAMJYST-UHFFFAOYSA-N 0.000 description 1
- 239000004408 titanium dioxide Substances 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
- C12Q1/6874—Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/64—General methods for preparing the vector, for introducing it into the cell or for selecting the vector-containing host
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6853—Nucleic acid amplification reactions using modified primers or templates
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Analytical Chemistry (AREA)
- Biomedical Technology (AREA)
- Immunology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Plant Pathology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Cell Biology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
Un método para preparar moldes inmovilizados para una reacción de secuenciación de ácidos nucleicos que comprende: (a) proporcionar un soporte sólido que tiene un cebador de amplificación directo e inverso inmovilizado sobre el mismo; (b) proporcionar un ácido nucleico diana, en donde el ácido nucleico diana comprende: (i) una primera región de secuencia conocida complementaria del cebador de amplificación directo; (ii) una primera región molde; (iii) una segunda región de secuencia conocida sustancialmente idéntica al cebador de amplificación inverso, en donde la primera región molde está entre la primera región de secuencia conocida y la segunda región de secuencia conocida; y (iv) una tercera región de secuencia conocida complementaria del cebador de amplificación directo, en donde la primera región molde y la segunda región de secuencia conocida están entre la primera región de secuencia conocida y la tercera región de secuencia conocida; (c) aplicar el ácido nucleico diana al soporte sólido en condiciones adecuadas para la hibridación de modo que la primera región de secuencia conocida se hibrida con el cebador de amplificación directo; (d) extender el cebador de amplificación directo hibridado para generar un primer molde inmovilizado que comprende una copia complementaria del ácido nucleico diana; (e) desnaturalizar el ácido nucleico diana del primer molde inmovilizado; (f) hibridar el primer molde inmovilizado con el cebador de amplificación inverso, de modo que una copia complementaria de la segunda región de secuencia conocida se hibrida con el cebador de amplificación inverso; y (g) extender el cebador de amplificación inverso hibridado para generar una segunda cadena inmovilizada que comprende la primera región molde colocada entre la primera región de secuencia conocida y la segunda región de secuencia conocida; (h) desnaturalizar la segunda cadena inmovilizada del primer molde inmovilizado; (i) hibridar la segunda cadena inmovilizada con el primer molde inmovilizado, de modo que la primera región de secuencia conocida de la segunda cadena inmovilizada se hibrida con una copia complementaria de la tercera región de secuencia conocida en el molde inmovilizado; (j) extender un 3' OH de la primera región de secuencia conocida para generar un concatémero de la segunda cadena inmovilizada; y (k) extender un 3' OH de la copia complementaria de la tercera región de secuencia conocida para generar un concatémero del primer molde inmovilizado; en donde el método comprende además secuenciar el ácido nucleico diana y la secuenciación comprende: hibridar uno o más cebadores de secuenciación con el primer molde inmovilizado o la segunda cadena inmovilizada; extender los cebadores de secuenciación incorporando uno o más nucleótidos marcados en la cadena naciente; y detectar los nucleótidos marcados, obteniendo así información de secuencia sobre el ácido nucleico diana.
Description
DESCRIPCIÓN
Concatemerización en superficie de moldes
Antecedentes
La tarea de catalogar la variación genética humana y correlacionar esta variación con la susceptibilidad a enfermedades es abrumadora y costosa. Es indispensable una reducción drástica de este coste para avanzar en la comprensión de la salud y la enfermedad. Una reducción en los costes de secuenciación requerirá una serie de avances técnicos en el campo. Los avances técnicos que podrían reducir el coste del análisis genómico incluyen: (1) generación de bibliotecas; (2) análisis y amplificación clonal altamente paralelos; (3) desarrollo de una bioquímica robusta de secuenciación de ciclos; (4) desarrollo de tecnología de imágenes ultrarrápida; y (5) desarrollo de algoritmos para el ensamblaje de secuencias a partir de lecturas cortas.
La creación de amplificaciones clonales de una manera altamente paralela es importante para una secuenciación rentable. La secuenciación se realiza generalmente en poblaciones clonales de moléculas de ADN preparadas de manera tradicional a partir de plásmidos cultivados a partir de la recolección de colonias bacterianas individuales. En el proyecto del genoma humano, cada clon se seleccionaba individualmente, se cultivaba y el ADN se extraía o amplificaba fuera del clon. En los últimos años, ha habido una serie de innovaciones para permitir el análisis altamente en paralelo de clones de ADN, particularmente utilizando enfoques basados en matrices. En el enfoque más simple, la biblioteca puede analizarse a nivel de molécula individual que, por su propia naturaleza, es clonal. La principal ventaja de la secuenciación de una sola molécula es que la secuenciación cíclica puede ocurrir de forma asincrónica, ya que cada molécula se lee individualmente. Por el contrario, el análisis de las amplificaciones clonales requiere una finalización casi cuantitativa de cada ciclo de secuenciación; de lo contrario, el ruido de fondo crece progresivamente con cada ciclo subsiguiente, lo que limita gravemente la longitud de lectura. Como tal, el análisis clonal impone una carga mayor a la solidez de la bioquímica de secuenciación y puede potencialmente limitar las longitudes de lectura.
Las publicaciones internacionales WO98/44151 y WO2010/038042 describen la amplificación por PCR en puente en una superficie para su posterior secuenciación. El documento US5928905 describe la amplificación por círculo rodante para generar concatémeros de ácidos nucleicos.
Por tanto, existe la necesidad de desarrollar métodos para mejorar el análisis genómico y proporcionar métodos más rentables para el análisis de secuencias. La presente invención satisface esta necesidad y también proporciona ventajas relacionadas.
Breve resumen
Los métodos y composiciones proporcionados en el presente documento permiten la amplificación de superficie con densidades mejoradas. En el presente documento se describen métodos para concatenar cadenas de molde durante el proceso de amplificación en puente, de modo que cada cebador de la superficie de la celda de flujo puede terminar con múltiples copias de la cadena molde extendidas sobre el mismo. Los métodos y composiciones proporcionados en el presente documento permiten la creación de clústeres que son más brillantes, pero con las mismas densidades que se logran actualmente usando amplificación de clúster estándar. Los clústeres más brillantes pueden tener una serie de ventajas, por ejemplo, mejor calidad de lecturas, soporte para longitudes de lectura más largas, tiempos de barrido más rápidos para la secuenciación y mayor robustez del sistema.
En el presente documento se presenta un método para preparar moldes inmovilizados para una reacción de secuenciación de ácidos nucleicos que comprende: (a) proporcionar un soporte sólido que tiene un cebador de amplificación directo e inverso inmovilizado sobre el mismo; (b) proporcionar un ácido nucleico diana, en donde el ácido nucleico diana comprende: (i) una primera región de secuencia conocida complementaria al cebador de amplificación directo; (ii) una primera región molde; (iii) una segunda región de secuencia conocida sustancialmente idéntica al cebador de amplificación inverso, en donde la primera región molde está entre la primera región de secuencia conocida y la segunda región de secuencia conocida; y (iv) una tercera región de secuencia conocida complementaria al cebador de amplificación directo, en donde la primera región de molde y la segunda región de secuencia conocida están entre la primera región de secuencia conocida y la tercera región de secuencia conocida; (c) aplicar el ácido nucleico diana al soporte sólido en condiciones adecuadas para la hibridación de modo que la primera región de secuencia conocida se hibride con el cebador de amplificación directo; y (d) extender el cebador de amplificación directo hibridado para generar un molde inmovilizado que comprende una copia complementaria del ácido nucleico diana.
En algunas realizaciones, el método puede comprender además: (e) desnaturalizar el ácido nucleico diana del molde inmovilizado; (f) hibridar el molde inmovilizado con el cebador de amplificación inverso, de modo que una copia complementaria de la segunda secuencia flanqueadora se hibrida con el cebador de amplificación inverso; y (g) extender el cebador de amplificación inverso hibridado para generar una segunda cadena inmovilizada que comprende la primera región molde situada entre la primera región de secuencia conocida y la segunda región de secuencia conocida.
En algunas realizaciones, el método puede comprender además: (h) desnaturalizar la segunda cadena inmovilizada del primer molde inmovilizado; (i) hibridar la segunda cadena inmovilizada con el primer molde inmovilizado, de modo
que la primera región de secuencia conocida de la segunda cadena inmovilizada se híbrida con una copia complementaria de la primera región de secuencia conocida en el molde inmovilizado; (j) extender un 3' OH de la primera región de secuencia conocida para generar un concatémero de la segunda cadena inmovilizada; y (k) extender un 3' OH de la copia complementaria de la primera región de secuencia conocida para generar un concatémero del primer molde inmovilizado.
En algunas realizaciones, el método puede comprender, además: (1) desnaturalizar los concatémeros y repetir las etapas (i), (j) y (k) para generar más concatémeros de cada cadena.
En algunos aspectos de las realizaciones anteriores, el cebador de amplificación directo puede comprender una región de complementariedad directa, teniendo dicha región de complementariedad directa complementariedad con una región de complementariedad inversa del cebador de amplificación inverso.
En algunos aspectos, la primera región de complementariedad está situada directamente en 5' de una región que tiene complementariedad con la primera región de secuencia conocida del ácido nucleico diana.
En algunos aspectos, la región de complementariedad inversa está situada directamente en 5' de una región que tiene una secuencia sustancialmente idéntica a la segunda región de la secuencia conocida del ácido nucleico diana.
En algunos aspectos, la región de complementariedad directa y la segunda región de complementariedad están configuradas de modo que los ciclos repetidos de hibridación y extensión producen un concatémero de la primera cadena inmovilizada, cada copia en el concatémero separada de la siguiente por la secuencia de la región de complementariedad directa.
En algunos aspectos, la región de complementariedad directa y la segunda región de complementariedad están configuradas de manera que ciclos repetidos de hibridación y extensión produzcan un concatémero de la segunda cadena inmovilizada, cada copia en el concatémero separada de la siguiente por la secuencia de la región de complementariedad inversa.
En algunos aspectos, los concatémeros comprenden múltiples copias de dicha molécula de ácido nucleico diana de al menos 10, 20, 50, 100, 200, 500, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000 o al menos 10.000 copias.
En algunos aspectos, el soporte sólido es plano. En algunos aspectos, el soporte sólido comprende micropocillos.
En algunos aspectos, el ácido nucleico diana tiene una longitud de al menos 10, 20, 50, 100, 200 o al menos 500 nucleótidos.
En algunos aspectos, el ácido nucleico diana comprende además una cuarta región de secuencia conocida sustancialmente idéntica al cebador de amplificación inverso, en donde la primera región de secuencia conocida, la primera región molde y la segunda región de secuencia conocida están entre la tercera región de secuencia conocida y la cuarta región de secuencia conocida.
En algunos aspectos, el cebador de amplificación directo comprende un resto conector químico no nucleotídico situado para evitar la copia de cualquier nucleótido que esté en 5' del resto conector químico no nucleotídico. En algunos aspectos, el cebador de amplificación inverso comprende un resto conector químico no nucleotídico situado para evitar la copia de cualquier nucleótido que se encuentre en 5' del resto conector químico no nucleotídico. En aspectos de cualquiera de las realizaciones descritas anteriormente, el resto conector químico no nucleotídico puede comprender un resto diol. En algunos aspectos, el resto conector químico no nucleotídico comprende un conector no nucleotídico que une el cebador al soporte sólido.
En algunas realizaciones, el método puede comprender además secuenciar el ácido nucleico diana. Por ejemplo, en algunos aspectos, secuenciar el ácido nucleico diana comprende: hibridar uno o más cebadores de secuenciación con el primer molde inmovilizado o la segunda cadena inmovilizada; extender los cebadores de secuenciación incorporando uno o más nucleótidos marcados en la cadena naciente; y detectar los nucleótidos marcados, obteniendo así información de secuencia sobre el ácido nucleico diana.
En algunas realizaciones, el ácido nucleico diana se prepara amplificando con un par de cebadores configurados con un resto de unión de modo que una cadena de un producto de amplificación generado usando el par de cebadores puede separarse de la cadena opuesta. En algunos aspectos, el resto de unión comprende biotina y puede separarse uniéndose a un soporte sólido que comprende estreptavidina.
Los detalles de una o más realizaciones se establecen en los dibujos adjuntos y la descripción a continuación. Otras características, objetos y ventajas resultarán evidentes a partir de la descripción y los dibujos, y de las reivindicaciones.
Breve descripción de los dibujos
La fig. 1 es un esquema que muestra la amplificación en fase sólida según una realización.
La fig. 2 es un esquema que muestra construcciones de bibliotecas alternativas para usar en amplificación en fase sólida.
La fig. 3 es un esquema que muestra la amplificación en fase sólida según una realización.
La fig. 4A es una imagen de microscopio de fluorescencia de clústeres de amplificación de acuerdo con protocolos convencionales en comparación con una realización presentada en el presente documento.
La fig. 4B es un gráfico del número de clústeres frente a la intensidad de la señal SYBR de las celdas de flujo descritas en la figura 4A.
La fig. 5 es un conjunto de imágenes de fluorescencia de nucleótidos fluorescentes C, T y G incorporados en clústeres amplificados de acuerdo con protocolos convencionales o de acuerdo una realización presentada en el presente documento.
La fig. 6 muestra imágenes de fluorescencia (arriba) e histogramas (abajo) de clústeres amplificados de acuerdo con protocolos convencionales o de acuerdo con una realización presentada en el presente documento.
La fig. 7 muestra una comparación de la intensidad y el tamaño del clúster para varios protocolos de amplificación.
La figura 8 muestra una comparación de la intensidad de la señal a lo largo de 100 ciclos en clústeres que contienen concatémeros en la superficie frente a clústeres estándar.
Descripción detallada
La tecnología convencional para la amplificación en superficie de moldes de ácido nucleico ("formación de clústeres") ha permitido densidades muy altas (500-600 k/mm2) en una celda de flujo típica. Sin embargo, siguen siendo necesarias metodologías mejoradas para la amplificación en superficie de moldes de ácidos nucleicos. Los métodos y composiciones proporcionados en el presente documento permiten la amplificación en superficie con mejores densidades. En el presente documento se describen métodos para concatenar cadenas de molde durante el proceso de amplificación en puente, de modo que cada cebador de la superficie de la celda de flujo puede terminar con múltiples copias de la cadena molde extendidas sobre el mismo. Los métodos y composiciones proporcionados en el presente documento permiten la creación de clústeres que son más brillantes, pero con las mismas densidades que se logran actualmente usando amplificación de clúster estándar. Los clústeres más brillantes pueden tener una serie de ventajas, por ejemplo, mejor calidad de lecturas, soporte para longitudes de lectura más largas, tiempos de barrido más rápidos para la secuenciación y mayor robustez del sistema.
En la figura 1 se ilustra una realización, que expone un método para formar concatémeros de un ácido nucleico diana. Como se muestra en la parte recuadrada de la Fig. 1, se proporciona un soporte sólido que tiene inmovilizados sobre el mismo una pluralidad de cebadores de amplificación directos e inversos, designados P5 y P7 en la figura. También se proporciona un ácido nucleico diana, que tiene una primera región de secuencia conocida (P5'), complementaria del cebador P5, una segunda región de secuencia conocida sustancialmente idéntica al cebador de amplificación inverso (P7) y una tercera región de secuencia conocida (P5'), complementaria del cebador P5. Se coloca una primera región molde entre la primera (P5') y la segunda (P7) regiones de secuencia conocida. El ácido nucleico diana se aplica al soporte sólido en condiciones adecuadas para la hibridación de modo que la secuencia P5' se hibrida con la secuencia P5 del cebador inmovilizado. El cebador se extiende en condiciones favorables para la extensión, por ejemplo, en presencia de una ADN polimerasa y dNTP. El producto de extensión resultante es un molde inmovilizado que comprende una copia complementaria del ácido nucleico diana, como se ilustra en la Fig.1 después de la 1a extensión.
Otras rondas de amplificación en puente pueden incluir desnaturalizar el ácido nucleico diana del molde inmovilizado y permitir que el molde inmovilizado se hibride con el cebador de amplificación inverso. En el ejemplo mostrado en la Fig. 1, la copia complementaria de la segunda secuencia conocida (P7') se hibrida con el cebador inverso (P7) y se extiende en las condiciones de extensión descritas anteriormente. El producto de extensión resultante es una segunda cadena inmovilizada que comprende la primera región molde colocada entre la primera región de secuencia conocida y la segunda región de secuencia conocida, como se ilustra en la Fig.1 después de la 2a extensión. Los ciclos posteriores de desnaturalización, hibridación y extensión permiten que el proceso continúe de manera que la segunda cadena inmovilizada pueda hibridar con el primer molde inmovilizado y uno o ambos 3' OH de la segunda cadena inmovilizada y/o el primer molde inmovilizado se extiendan para generar más productos de extensión. Los productos de extensión adicionales que resultan de estos ciclos adicionales son concatémeros de una o ambas de la segunda cadena inmovilizada y/o el primer molde inmovilizado, como se ilustra en la Fig. 1 después de los siguientes ciclos. Los concatémeros pueden incluir 2 o más copias de la región molde (o complemento de la misma) colocadas entre las secuencias conocidas. En algunas realizaciones, los concatémeros pueden incluir 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50, 100, 200, 500, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000 o más de 10.000 copias de la región molde (o complemento de la misma) colocadas entre las secuencias conocidas. Después de rondas de amplificación, un cebador de secuenciación en solución se puede hibridar con una región de secuencia conocida y extender. El cebador de secuenciación se hibridará con múltiples ubicaciones en la misma cadena inmovilizada y/o molde inmovilizado. Por lo tanto, pueden tener lugar múltiples reacciones de secuenciación en la misma cadena, lo que da como resultado una señal que está muy amplificada con respecto a los métodos anteriores, donde solo se genera una señal por cadena.
Como se usa en el presente documento, el término "concatémero" se refiere a una molécula de ácido nucleico continua
larga que contiene múltiples copias de las mismas secuencias unidas en serie. Las copias múltiples pueden estar separadas por otra secuencia, por ejemplo, por una secuencia conocida que flanquea la secuencia concatemerizada en el extremo 3' y/o 5'. Se puede intercalar cualquier número de copias de la secuencia flanqueadora intercalada en la secuencia concatemerizada. En algunas realizaciones, los concatémeros pueden incluir 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50, 100, 200, 500, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000 o más de 10.000 copias de una región molde (o su complemento) en un solo concatémero. En algunas realizaciones, los concatémeros pueden comprender 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50, 100, 200, 500, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000 o más de 10.000 copias de secuencia conocida, situadas de una manera repetida entre copias de las secuencias conocidas. En el ejemplo 1 a continuación se expone una mayor ilustración de esta realización.
La Fig. 2 ilustra una realización alternativa, donde se proporciona una cadena complementaria del ácido nucleico diana. Esto naturalmente puede dar como resultado realizaciones donde el ácido nucleico diana se proporciona en forma bicatenaria. Como se muestra en la Fig. 2, la cadena opuesta se hibrida con el cebador de amplificación inverso y se extiende. Sin embargo, a diferencia de la realización ilustrada en la Fig. 1, se genera una única copia del ácido nucleico diana. Los ciclos posteriores de amplificación no generarán concatémeros, como se muestra en la Fig. 2. Para evitar este resultado, se pueden generar construcciones de bibliotecas alternativas que comprendan tanto la primera como la segunda regiones conocidas tanto en el extremo 3' como el extremo 5' de la construcción bicatenaria, como se ilustra en la Fig. 2. La amplificación de la cadena superior o la cadena inferior generará concatémeros, de una manera similar a la que se muestra en la Fig. 1.
La Fig. 3 ilustra otra realización, en donde los cebadores de amplificación directos e inversos comprenden una secuencia adicional situada en 5' de la secuencia que se hibrida con la secuencia conocida. En algunas realizaciones, la secuencia adicional del cebador directo es complementaria a la secuencia adicional del cebador inverso. Por ejemplo, como se ilustra en la Fig. 3, los cebadores de la superficie comprenden una secuencia de oligo-dA y oligodT situadas en 5' de las secuencias P5 y P7 (denominadas 20T-P7 y 20A-P5). Así, después de un 1er ciclo de extensión, el molde inmovilizado comprende la secuencia de complementariedad (20-mero de A) inmovilizada en el extremo 5' del molde, como se muestra en la Fig.1 después de la 1a extensión. Después de una extensión posterior, la copia resultante comprende el complemento de la secuencia de complementariedad (20-mero de T) inmovilizada en el extremo 5' de la cadena copiada y nuevamente en el extremo 3' del producto de extensión. A medida que tienen lugar más rondas de amplificación, las secuencias de complementariedad se incorporan en tándem, flanqueando las secuencias conocidas, por ejemplo P5 y P7, como se ilustra en la Fig. 3. En el Ejemplo 2 a continuación se expone una ilustración adicional de esta realización.
Amplificación de clústeres
En el presente documento se describen métodos para concatenar cadenas de molde durante el procedimiento de amplificación en puente. La amplificación en puente también se denomina en el presente documento "amplificación de clúster". En algunas realizaciones, los fragmentos de ADN inmovilizados se amplifican usando metodologías de amplificación de clústeres como se ilustra en las descripciones de las patentes de EE.UU. n° 7.985.565 y 7.115.400. Estos documentos describen métodos de amplificación de ácidos nucleicos en fase sólida que permiten inmovilizar productos de amplificación sobre un soporte sólido con el fin de formar matrices compuestas por clústeres o "colonias" de moléculas de ácido nucleico inmovilizadas. Cada clúster o colonia en dicha matriz se forma a partir de una pluralidad de cadenas polinucleotídicas inmovilizadas idénticas y una pluralidad de cadenas polinucleotídicas complementarias inmovilizadas idénticas. Las matrices así formadas se denominan generalmente en el presente documento "matrices de clústeres". Los productos de reacciones de amplificación en fase sólida tales como los descritos en las patentes de EE.UU. n° 7.985.565 y 7.115.400 son las denominadas estructuras "puenteadas" formadas por reasociación de parejas de cadenas polinucleotídicas inmovilizadas y cadenas complementarias inmovilizadas, estando ambas cadenas inmovilizadas sobre el soporte sólido en el extremo 5', preferiblemente mediante una unión covalente. Las metodologías de amplificación de clústeres son ejemplos de métodos en los que se usa un molde de ácido nucleico inmovilizado para producir amplicones inmovilizados. También pueden usarse otras metodologías adecuadas para producir amplicones inmovilizados a partir de fragmentos de ADN inmovilizados producidos de acuerdo con los métodos proporcionados en el presente documento. Por ejemplo, se pueden formar uno o más clústeres o colonias mediante PCR en fase sólida, ya sea que uno o ambos cebadores de cada par de cebadores de amplificación estén inmovilizados.
En otras realizaciones, los fragmentos de ADN inmovilizados se amplifican en solución. Por ejemplo, en algunas realizaciones, los fragmentos de ADN inmovilizados se escinden o se liberan de otro modo del soporte sólido y después los cebadores de amplificación se hibridan en solución con las moléculas liberadas. En otras realizaciones, los cebadores de amplificación se hibridan con los fragmentos de ADN inmovilizados durante una o más etapas de amplificación iniciales, seguidas de las etapas de amplificación posteriores en solución. Por tanto, en algunas realizaciones se puede usar un molde de ácido nucleico inmovilizado para producir amplicones en fase de solución.
Se apreciará que se puede usar cualquiera de las metodologías de amplificación descritas en el presente documento o generalmente conocidas en la técnica con cebadores universales o específicos de la diana para amplificar fragmentos de ADN inmovilizados. Los métodos adecuados para la amplificación incluyen, pero no se limitan a la reacción en cadena de la polimerasa (PCR), amplificación por desplazamiento de cadena (SDA), amplificación mediada por transcripción (TMA) y amplificación basada en secuencias de ácidos nucleicos (NASBA), como se describe en la patente de EE.UU. n° 8.003.354. Los métodos de amplificación anteriores se pueden emplear para
amplificar uno o más ácidos nucleicos de interés. Por ejemplo, la PCR, incluida la PCR multiplex, SDA, TMA, NASBA y similares, se puede utilizar para amplificar fragmentos de ADN inmovilizados. En algunas realizaciones, se incluyen cebadores dirigidos específicamente al ácido nucleico de interés en la reacción de amplificación.
Otros métodos adecuados para la amplificación de ácidos nucleicos pueden incluir tecnologías de extensión y ligadura de oligonucleótidos, amplificación por círculo rodante (RCA) (Lizardi et al., Nat. Genet. 19: 225-232 (1998)) y ensayo de ligación de oligonucleótidos (OLA) (véase en general las patentes de Ee .UU. n° 7.582.420, 5.185.243, 5.679.524 y 5.573.907; EP 0320308 B1; EP 0336 731 B1; EP 0439 182 B1; WO 90/01069; WO 89/12696; y WO 89/09835). Se apreciará que estas metodologías de amplificación pueden diseñarse para amplificar fragmentos de ADN inmovilizados. Por ejemplo, en algunas realizaciones, el método de amplificación puede incluir reacciones de amplificación con sonda de ligación o ensayo de ligación de oligonucleótidos (OLA) que contienen cebadores dirigidos específicamente al ácido nucleico de interés. En algunas realizaciones, el método de amplificación puede incluir una reacción de extensión de cebador-ligación que contiene cebadores dirigidos específicamente al ácido nucleico de interés. Como un ejemplo no limitante de extensión de cebadores y ligación de cebadores que puedeY diseñarse específicamente para amplificar un ácido nucleico de interés, la amplificación puede incluir cebadores usados para el ensayo GoldenGate (Illumina, Inc., San Diego, CA) como se ilustra en las patentes de EE.UU. n° 7.582.420 y 7.611.869.
Los métodos de amplificación isotérmica de ejemplo que se pueden usar en un método de la presente descripción incluyen, pero no se limitan a, amplificación de desplazamiento múltiple (MDA) como ilustran, por ejemplo, Dean et al., Proc. Natl. Acad. Sci. USA 99: 5261-66 (2002) o amplificación de ácido nucleico por desplazamiento de cadena isotérmica ilustrada por, por ejemplo en la patente de EE.UU. n° 6.214.587. Otros métodos no basados en PCR que se pueden utilizar en la presente descripción incluyen, por ejemplo, amplificación por desplazamiento de cadena (SDA) que se describe, por ejemplo, en Walker et al., Molecular Methods for Virus Detection, Academic Press, Inc., 1995; patentes de EE.UU. n25.455.166 y 5.130.238 y Walker et al., Nucí. Acids Res. 20: 1691 - 96 (1992) o amplificación por desplazamiento de cadena hiperramificada que se describe, por ejemplo, en Lage et al., Genome Research 13: 294-307 (2003).
Los métodos de amplificación isotérmica se pueden utilizar con la polimerasa Phi29 de desplazamiento de cadena o el fragmento grande de la ADN polimerasa Bst, 5'-> 3' exo- para la amplificación de cebadores aleatorios de ADN genómico. El uso de estas polimerasas aprovecha su alta procesividad y actividad de desplazamiento de cadena. La alta procesividad permite que las polimerasas produzcan fragmentos de 10-20 kb de longitud. Como se ha expuesto anteriormente, se pueden producir fragmentos más pequeños en condiciones isotérmicas usando polimerasas que tienen baja procesividad y actividad de desplazamiento de cadena tales como la polimerasa Klenow. La descripción adicional de las reacciones de amplificación, las condiciones y los componentes se establecen en detalle en la descripción de la patente de EE.UU. n° 7.670.810.
Otro método de amplificación de ácidos nucleicos que es útil en la presente descripción es la PCR marcada que usa una población de cebadores de dos dominios que tienen una región 5' constante seguida de una región 3' aleatoria como se describe, por ejemplo, en Grothues et al. Nucleic Acids Res. 21 (5): 1321-2 (1993).
Las primeras rondas de amplificación se llevan a cabo para permitir una multitud de iniciaciones en ADN desnaturalizado por calor basadas en la hibridación individual de la región 3' sintetizada aleatoriamente. Debido a la naturaleza de la región 3', se contempla que los sitios de iniciación sean aleatorios en todo el genoma. Después, los cebadores no unidos pueden eliminarse y puede tener lugar una replicación adicional utilizando cebadores complementarios de la región 5' constante.
Métodos de secuenciación
Los métodos descritos en el presente documento pueden usarse junto con una variedad de técnicas de secuenciación de ácidos nucleicos. Las técnicas particularmente aplicables son aquellas en donde los ácidos nucleicos se unen en ubicaciones fijas en una matriz de modo que sus posiciones relativas no cambian y en donde se generan imágenes de la matriz repetidamente. Son particularmente aplicables las realizaciones en las que las imágenes se obtienen en diferentes canales de color, por ejemplo, coincidiendo con diferentes marcadores utilizados para distinguir un tipo de base de nucleótidos de otro. En algunas realizaciones, el procedimiento para determinar la secuencia de nucleótidos de un ácido nucleico diana puede ser un proceso automatizado. Las realizaciones preferidas incluyen técnicas de secuenciación por síntesis ("SBS").
Las técnicas de SBS generalmente implican la extensión enzimática de una cadena de ácido nucleico naciente mediante la adición iterativa de nucleótidos frente a una cadena molde. En los métodos tradicionales de SBS, se puede proporcionar un monómero de un solo nucleótido a un nucleótido diana en presencia de una polimerasa en cada suministro. Sin embargo, en los métodos descritos en el presente documento, se puede proporcionar más de un tipo de monómero de nucleótido a un ácido nucleico diana en presencia de una polimerasa en un suministro.
La SBS puede utilizar monómeros de nucleótidos que tienen un resto terminador o aquellos que carecen de restos terminadores. Los métodos que utilizan monómeros de nucleótidos que carecen de terminadores incluyen, por ejemplo, pirosecuenciación y secuenciación utilizando nucleótidos marcados con Y-fosfato, como se expone con más detalle a continuación. En los métodos que utilizan monómeros de nucleótidos que carecen de terminadores, el número
de nucleótidos añadidos en cada ciclo es generalmente variable y depende de la secuencia del molde y del modo de suministro de nucleótidos. Para las técnicas de SBS que utilizan monómeros de nucleótidos que tienen un resto terminador, el terminador puede ser efectivamente irreversible en las condiciones de secuenciación utilizadas como es el caso de la secuenciación tradicional de Sanger que utiliza didesoxinucleótidos, o el terminador puede ser reversible como es el caso de los métodos de secuenciación desarrollados por Solexa (ahora Illumina, Inc.).
Las técnicas de SBS pueden utilizar monómeros de nucleótidos que tienen un resto marcador o aquellos que carecen de un resto marcador. Por consiguiente, los sucesos de incorporación pueden detectarse basándose en una característica del marcador, tal como la fluorescencia del marcador; una característica del monómero nucleotídico, tal como el peso molecular o la carga; un subproducto de la incorporación del nucleótido, tal como la liberación de pirofosfato; o similar. En realizaciones, donde están presentes dos o más nucleótidos diferentes en un reactivo de secuenciación, los diferentes nucleótidos pueden distinguirse entre sí, o alternativamente, los dos o más marcadores diferentes pueden ser indistinguibles según las técnicas de detección que se utilizan. Por ejemplo, los diferentes nucleótidos presentes en un reactivo de secuenciación pueden tener diferentes marcadores y pueden distinguirse usando ópticas apropiadas como se ilustra por los métodos de secuenciación desarrollados por Solexa (ahora Illumina, Inc.).
Las realizaciones preferidas incluyen técnicas de pirosecuenciación. La pirosecuenciación detecta la liberación de pirofosfato inorgánico (PPi) a medida que se incorporan nucleótidos particulares en la cadena naciente (Ronaghi, M., Karamohamed, S., Pettersson, B., Uhlen, M. y Nyren, P. (1996) "Real-time DNA sequencing using detection of pyrophosphate release." Analytical Biochemistry 242 (1), 84-9; Ronaghi, M. (2001) "Pyrosequencing sheds light on DNA sequencing". Genome Res. 11 (1), 3-11; Ronaghi, M., Uhlen, M. y Nyren, P. (1998) "A sequencing method based on real-time pyrophosphate." Science 281 (5375), 363; patente de e E.UU. n° 6.210.891; patente de EE.UU. n° 6.258.568 y patente de EE.UU. n° 6.274.320). En la pirosecuenciación, el PPi liberado se puede detectar convirtiéndolo inmediatamente en trifosfato de adenosina (ATP) por la ATP sulfurilasa, y el nivel de ATP generado se detecta mediante fotones producidos por luciferasa. Los ácidos nucleicos que se van a secuenciar se pueden unir a sitios característicos en una matriz y se pueden generar imágenes de la matriz para capturar las señales quimioluminiscentes que se producen debido a la incorporación de nucleótidos en los sitios característicos de la matriz. Se puede obtener una imagen después de que la matriz se trate con un tipo de nucleótido particular (p. ej., A, T, C o G). Las imágenes obtenidas después de la adición de cada tipo de nucleótido diferirán con respecto a los sitios característicos de la matriz que se detecten. Estas diferencias en la imagen reflejan el contenido de secuencia diferente de los sitios característicos en la matriz. Sin embargo, las ubicaciones relativas de cada sitio característico permanecerán sin cambios en las imágenes. Las imágenes se pueden almacenar, procesar y analizar utilizando los métodos expuestos en el presente documento. Por ejemplo, las imágenes obtenidas después del tratamiento de la matriz con cada tipo de nucleótido diferente se pueden manejar de la misma manera que se ilustra en el presente documento para imágenes obtenidas de diferentes canales de detección para métodos de secuenciación basados en terminadores reversibles.
En otro tipo de ejemplo de SBS, la secuenciación en ciclo se logra mediante la adición escalonada de nucleótidos terminadores reversibles que contienen, por ejemplo, un marcador de colorante escindible o fotoblanqueable como se describe, por ejemplo, en la publicación internacional WO 04/018497 y patente de EE.UU. n° 7.057.026. Este enfoque está siendo comercializado por Solexa (ahora Illumina Inc.), y también se describe en las publicaciones internacionales WO 91/06678 y WO 07/123.744. La disponibilidad de terminadores marcados con fluorescencia en los que se puede tanto invertir la terminación como escindir el colorante fluorescente, facilita la secuenciación por terminación reversible cíclica (CRT) eficiente. Las polimerasas también se pueden diseñar conjuntamente para la incorporación y extensión de manera eficiente de estos nucleótidos modificados.
Preferiblemente, en realizaciones de secuenciación basadas en terminadores reversibles, los marcadores no inhiben sustancialmente la extensión en condiciones de reacción de SBS. Sin embargo, los marcadores de detección pueden ser eliminables, por ejemplo, por escisión o degradación. Se pueden capturar imágenes tras la incorporación de marcadores en sitios característicos de ácidos nucleicos en matriz. En realizaciones particulares, cada ciclo implica el suministro simultáneo de cuatro tipos de nucleótidos diferentes a la matriz y cada tipo de nucleótido tiene un marcador espectralmente distinto. A continuación, se pueden obtener cuatro imágenes, cada una de las cuales utiliza un canal de detección que es selectivo para uno de los cuatro marcadores diferentes. Alternativamente, se pueden añadir diferentes tipos de nucleótidos secuencialmente y se puede obtener una imagen de la matriz entre cada etapa de adición. En tales realizaciones, cada imagen mostrará sitios característicos de ácidos nucleicos que han incorporado nucleótidos de un tipo particular. Diferentes sitios característicos estarán presentes o ausentes en las diferentes imágenes debido al contenido de secuencia diferente de cada sitio característico. Sin embargo, la posición relativa de los sitios característicos permanecerá sin cambios en las imágenes. Las imágenes obtenidas de dichos métodos de SBS-terminador reversible pueden almacenarse, procesarse y analizarse como se expone en el presente documento. Después de la etapa de captura de la imagen, se pueden eliminar los marcadores y se pueden eliminar los motivos de terminador reversible para los ciclos posteriores de adición y detección de nucleótidos. La eliminación de los marcadores después de que se hayan detectado en un ciclo particular y antes de un ciclo posterior puede proporcionar la ventaja de reducir la señal de fondo y la interferencia entre ciclos. A continuación, se exponen ejemplos de marcadores útiles y métodos de eliminación.
En realizaciones particulares, algunos o todos los monómeros de nucleótidos pueden incluir terminadores reversibles. En tales realizaciones, los terminadores reversibles/flúores escindibles pueden incluir flúor unido al resto de ribosa a
través de un enlace éster 3' (Metzker, Genome Res. 15: 1767-1776. Otros enfoques han separado la química del terminador de la escisión del marcador de fluorescencia (Ruparel et al., Proc Natl Acad Sci USA 102: 5932-7 (2005)). Ruparel et al. describieron el desarrollo de terminadores reversibles que usaban un pequeño grupo alilo en 3' para bloquear la extensión, pero que podían desbloquearse fácilmente por un tratamiento corto con un catalizador de paladio. El fluoróforo se unía a la base mediante un conector fotoescindible que se podía escindir fácilmente por una exposición de 30 segundos a luz UV de longitud de onda larga. Por tanto, se puede utilizar la reducción con disulfuro o la fotoescisión como un conector escindible. Otro enfoque para la terminación reversible es el uso de terminación natural que se produce después de la colocación de un colorante voluminoso en un dNTP. La presencia de un colorante voluminoso cargado en el dNTP puede actuar como un terminador eficaz a través de impedimento estérico y/o electrostático. La presencia de un suceso de incorporación evita otras incorporaciones a menos que se elimine el colorante. La escisión del colorante elimina el flúor e invierte eficazmente la terminación. También se describen ejemplos de nucleótidos modificados en la patente de EE.UU. n° 7.427.673 y patente de EE.UU. n° 7.057.026.
Los sistemas y métodos de SBS de ejemplo adicionales que se pueden utilizar con los métodos y sistemas descritos en el presente documento se describen en la publicación de solicitud de patente de EE.UU. n° 2007/0166705, U.S. publicación de solicitud de patente de EE.UU. n° 2006/0188901, patente de EE.UU. n° 7.057.026, publicación de solicitud de patente de EE.Uu . n° 2006/0240439, publicación de solicitud de patente de EE.UU. n° 2006/0281109, publicación PCT n° WO 05/065814, publicación de solicitud de patente de EE.UU. n° 2005/0100900, publicación PCT n° WO 06/064199, publicación PCT n° WO 07/010,251, publicación de solicitud de patente de EE.UU. n° 2012/0270305 y publicación de solicitud de patente de EE.UU. n° 2013/0260372,
Algunas realizaciones pueden utilizar la detección de cuatro nucleótidos diferentes usando menos de cuatro marcadores diferentes. Por ejemplo, la SBS se puede realizar utilizando métodos y sistemas descritos en la publicación de solicitud de patente de EE.UU. n° 2013/0079232. Como primer ejemplo, se puede detectar un par de tipos de nucleótidos a la misma longitud de onda, pero distinguirse en función de la diferencia de intensidad para un miembro del par en comparación con el otro, o en función de un cambio en un miembro del par (p. ej. por modificación química, modificación fotoquímica o modificación física) que hace que la señal aparente aparezca o desaparezca en comparación con la señal detectada para el otro miembro del par. Como segundo ejemplo, se pueden detectar tres de cuatro tipos de nucleótidos diferentes en condiciones particulares, mientras que un cuarto tipo de nucleótido carece de un marcador que sea detectable en esas condiciones, o se detecta mínimamente en esas condiciones (p. ej., detección mínima debido a la fluorescencia de fondo, etc.). La incorporación de los tres primeros tipos de nucleótidos en un ácido nucleico se puede determinar basándose en la presencia de sus respectivas señales y la incorporación del cuarto tipo de nucleótido en el ácido nucleico se puede determinar basándose en la ausencia o la detección mínima de cualquier señal. Como tercer ejemplo, un tipo de nucleótido puede incluir marcador(es) que se detectan en dos canales diferentes, mientras que otros tipos de nucleótidos se detectan en no más de uno de los canales. Las tres configuraciones de ejemplo antes mencionadas no se consideran mutuamente excluyentes y pueden usarse en varias combinaciones. Una realización de ejemplo que combina los tres ejemplos es un método de SBS basado en fluorescencia que usa un primer tipo de nucleótido que se detecta en un primer canal (p. ej., dATP que tiene un marcador que se detecta en el primer canal cuando se excita con una primera longitud de onda de excitación), un segundo tipo de nucleótido que se detecta en un segundo canal (p. ej., dCTP que tiene un marcador que se detecta en el segundo canal cuando se excita con una segunda longitud de onda de excitación), un tercer tipo de nucleótido que se detecta tanto en el primer como en el segundo canal (p. ej., dTTP que tiene al menos un marcador que se detecta en ambos canales cuando se excita por la primera y/o segunda longitud de onda de excitación) y un cuarto tipo de nucleótido que carece de un marcador que no se detecta, o mínimamente, en ninguno de los canales (p. ej., dGTP que no tiene marcador).
Además, como se describe en la publicación de solicitud de patente de EE.UU. n° 2013/0079232, se pueden obtener datos de secuenciación utilizando un solo canal. En los llamados enfoques de secuenciación de un colorante, el primer tipo de nucleótido está marcado pero el marcador se elimina después de que se genera la primera imagen, y el segundo tipo de nucleótido se marca solo después de que se genera una primera imagen. El tercer tipo de nucleótido conserva su marcador tanto en la primera como en la segunda imagen, y el cuarto tipo de nucleótido permanece sin marcar en ambas imágenes.
Algunas realizaciones pueden utilizar secuenciación por técnicas de ligación. Dichas técnicas utilizan ADN ligasa para incorporar oligonucleótidos e identificar la incorporación de dichos oligonucleótidos. Los oligonucleótidos típicamente tienen diferentes marcadores que se correlacionan con la identidad de un nucleótido particular en una secuencia con la que se hibridan los oligonucleótidos. Al igual que con otros métodos de SBS, se pueden obtener imágenes tras el tratamiento de una matriz de sitios característicos de ácidos nucleicos con los reactivos de secuenciación marcados. Cada imagen mostrará sitios característicos de ácidos nucleicos que han incorporado marcadores de un tipo particular. Diferentes sitios característicos estarán presentes o ausentes en las diferentes imágenes debido al contenido de secuencia diferente de cada sitio característico, pero la posición relativa de los sitios característicos permanecerá sin cambios en las imágenes. Las imágenes obtenidas a partir de métodos de secuenciación basados en ligación se pueden almacenar, procesar y analizar como se expone en el presente documento. Los sistemas y métodos de SBS de ejemplo que se pueden utilizar con los métodos y sistemas descritos en el presente documento se describen en la patente de EE.UU. n° 6.969.488, patente de EE.UU. n° 6.172.218 y patente de EE.UU. n° 6.306.597.
Algunas realizaciones pueden utilizar secuenciación por nanoporos (Deamer, D. W. y Akeson, M. "Nanopores and nucleic
acids: prospects for ultrarapid sequencing." Trends Biotechnol. 18, 147-151 (2000); Deamer, D. y D. Branton, "Characterization of nucleic acids by nanopore analysis". Acc. Chem. Res. 35: 817-825 (2002)); Li, J., M. Gershow, D. Stein, E. Brandin y J. A. Golovchenko, "DNA molecules and configurations in a solid-state nanopore microscope" Nat. Mater. 2: 611-615 (2003)). En tales realizaciones, el ácido nucleico diana pasa a través de un nanoporo. El nanoporo puede ser un poro sintético o una proteína de membrana biológica, tal como la a-hemolisina. A medida que el ácido nucleico diana pasa a través del nanoporo, se puede identificar cada par de bases midiendo las fluctuaciones en la conductancia eléctrica del poro. (patente de EE.UU. n° 7.001.792; Soni, G. V. y Meller, "A. Progress toward ultrafast DNA sequencing using solid-state nanopores." Clin. Chem. 53, 1996-2001 (2007); Healy, K. "Análisis de ADN de molécula única basado en nanoporos". Nanomed. 2, 459 a 481 (2007); Cockroft, S. L., Chu, J., Amorin, M. y Ghadiri, M. R. "A single-molecule nanopore device detects DNA polymerase activity with single-nucleotide resolution." J. Am. Chem. Soc.
130, 818-820 (2008)). Los datos obtenidos de la secuenciación de nanoporos se pueden almacenar, procesar y analizar como se expone en el presente documento. En particular, los datos pueden tratarse como una imagen de acuerdo con el tratamiento de ejemplo de imágenes ópticas y otras imágenes que se expone en el presente documento.
Algunas realizaciones pueden utilizar métodos que implican el seguimiento en tiempo real de la actividad de la ADN polimerasa. Las incorporaciones de nucleótidos se pueden detectar a través de interacciones de transferencia de energía por resonancia de fluorescencia (FRET) entre una polimerasa que lleva fluoróforo y nucleótidos marcados con Y-fosfato como se describe, por ejemplo, en la patente de EE.UU. n° 7.329.492 y patente de EE.UU. n° 7.211.414, o las incorporaciones de nucleótidos se pueden detectar con guías de onda de modo cero como se describe, por ejemplo, en la patente de EE.UU. n° 7.315.019 y usando análogos de nucleótidos fluorescentes y polimerasas diseñadas como se describe, por ejemplo, en la patente de EE.UU. n° 7.405.281 y publicación de solicitud de patente de EE.UU. n° 2008/0108082. La iluminación se puede restringir a un volumen de escala de zeptolitros alrededor de una polimerasa unida a la superficie de modo que se pueda observar la incorporación de nucleótidos marcados con fluorescencia con un fondo bajo (Levene, M. J. et al. "Zero-mode waveguides for single-molecule analysis at high concentrations." Science 299, 682-686 (2003); Lundquist, P. M. et al. "Parallel confocal detection of single molecules in real time". Opt. Lett. 33, 1026-1028 (2008); Korlach, J. et al. "Selective aluminum passivation for targeted immobilization of single DNA polymerase molecules in zero-mode waveguide nano structures." Proc. Natl. Acad. Sci. USA 105, 1176-1181 (2008)). Las imágenes obtenidas de tales métodos se pueden almacenar, procesar y analizar como se expone en el presente documento.
Algunas realizaciones de SBS incluyen la detección de un protón liberado tras la incorporación de un nucleótido en un producto de extensión. Por ejemplo, la secuenciación basada en la detección de protones liberados puede utilizar un detector eléctrico y técnicas asociadas que están disponibles comercialmente en Ion Torrent (Guilford, CT, una subsidiaria de Life Technologies) o métodos y sistemas de secuenciación descritos en los documentos US 2009/0026082 A1; US 2009/0127589 A1; US 2010/0137143 A1; o US 2010/0282617 A1. Los métodos expuestos en el presente documento para amplificar ácidos nucleicos diana usando exclusión cinética pueden aplicarse fácilmente a sustratos usados para detectar protones. Más específicamente, los métodos expuestos en el presente documento pueden usarse para producir poblaciones clonales de amplicones que se usan para detectar protones.
Los métodos de SBS anteriores se pueden llevar a cabo ventajosamente en formatos de multiplex de modo que se manipulen simultáneamente múltiples ácidos nucleicos diana diferentes. En realizaciones particulares, se pueden tratar diferentes ácidos nucleicos diana en un recipiente de reacción común o en una superficie de un sustrato particular. Esto permite el suministro conveniente de reactivos de secuenciación, la eliminación de reactivos que no han reaccionado y la detección de sucesos de incorporación de una manera multiplexada. En realizaciones que usan ácidos nucleicos diana unidos a la superficie, los ácidos nucleicos diana pueden estar en un formato de matriz. En un formato de matriz, los ácidos nucleicos diana se pueden unir típicamente a una superficie de una manera espacialmente distinguible. Los ácidos nucleicos diana pueden unirse por unión covalente directa, unión a una perla u otra partícula o unión a una polimerasa u otra molécula que esté unida a la superficie. La matriz puede incluir una única copia de un ácido nucleico diana en cada sitio (también denominado sitio característico) o pueden estar presentes múltiples copias que tienen la misma secuencia en cada sitio o sitio característico. Pueden producirse múltiples copias por métodos de amplificación tales como amplificación en puente o PCR en emulsión como se describe con más detalle a continuación.
Los métodos expuestos en el presente documento pueden usar matrices que tienen sitios característicos en cualquiera de una variedad de densidades que incluyen, por ejemplo, al menos aproximadamente 10 sitios característicos/cm2, 100 sitios característicos/cm2, 500 sitios característicos/cm2, 1.000 sitios característicos/cm2, 5.000 sitios característicos/cm2, 10.000 sitios característicos/cm2, 50.000 sitios característicos/cm2, 100.000 sitios característicos/cm2, 1.000.000 sitios característicos/cm2, 5.000.000 sitios característicos/cm2, o mayores.
Una ventaja de los métodos expuestos en el presente documento es que proporcionan una detección rápida y eficaz de una pluralidad de ácidos nucleicos diana en paralelo. Por consiguiente, la presente descripción proporciona sistemas integrados capaces de preparar y detectar ácidos nucleicos usando técnicas conocidas en la técnica tales como las ilustradas anteriormente. Por tanto, un sistema integrado de la presente descripción puede incluir componentes fluídicos capaces de suministrar reactivos de amplificación y/o reactivos de secuenciación a uno o más fragmentos de ADN inmovilizados, comprendiendo el sistema componentes tales como bombas, válvulas, depósitos, conductos fluídicos y similares. Una celda de flujo se puede configurar y/o usar en un sistema integrado para la detección de ácidos nucleicos diana. Se describen celdas de flujo de ejemplo, por ejemplo, en los documento US
2010/0111768 A1 y US 2012/0270305 A1. Como se ilustra para las celdas de flujo, uno o más de los componentes fluídicos de un sistema integrado se pueden usar para un método de amplificación y para un método de detección. Considerando una realización de secuenciación de ácidos nucleicos como ejemplo, se pueden usar uno o más de los componentes fluídicos de un sistema integrado para un método de amplificación expuesto en el presente documento y para el suministro de reactivos de secuenciación en un método de secuenciación tal como los ilustrados anteriormente. Alternativamente, un sistema integrado puede incluir sistemas fluídicos separados para llevar a cabo métodos de amplificación y para llevar a cabo métodos de detección. Ejemplos de sistemas de secuenciación integrados que son capaces de crear ácidos nucleicos amplificados y también determinar la secuencia de los ácidos nucleicos incluyen, sin limitación, la plataforma MiSeq™ (Illumina, Inc., San Diego, CA) y los dispositivos descritos en el documento US 2012/0270305 A1.
En los métodos y composiciones presentados en el presente documento, los polinucleótidos se inmovilizan en el soporte sólido. En algunas realizaciones, los polinucleótidos se inmovilizan covalentemente en el soporte. Cuando se hace referencia a la inmovilización de moléculas (p. ej., ácidos nucleicos) en un soporte sólido, los términos "inmovilizado" y "unido" se usan indistintamente en el presente documento y ambos términos pretenden abarcar la unión directa o indirecta, covalente o no covalente, a menos que se indique lo contrario, ya sea explícitamente o por el contexto. En ciertas realizaciones de la invención, se puede preferir la unión covalente, pero generalmente todo lo que se requiere es que las moléculas (p. ej. ácidos nucleicos) permanezcan inmovilizadas o unidas al soporte en las condiciones en las que se pretende usar el soporte, por ejemplo en aplicaciones que requieren amplificación y/o secuenciación de ácidos nucleicos.
Ciertas realizaciones de la invención pueden hacer uso de soportes sólidos compuestos de un sustrato o matriz inerte (p. ej., portaobjetos de vidrio, perlas de polímero, etc.) que se ha funcionalizado, por ejemplo, por aplicación de una capa o revestimiento de un material intermedio que comprende grupos reactivos que permiten la unión covalente a biomoléculas, tales como polinucleótidos. Los ejemplos de dichos soportes incluyen, pero no se limitan a, hidrogeles de poliacrilamida soportados sobre un sustrato inerte tal como vidrio, particularmente hidrogeles de poliacrilamida como se describe en los documentos WO 2005/065814 y US 2008/0280773. En tales realizaciones, las biomoléculas (p. ej., polinucleótidos) pueden estar unidas covalentemente directamente al material intermedio (p. ej., el hidrogel) pero el propio material intermedio puede estar unido de forma no covalente al sustrato o matriz (p. ej., el sustrato de vidrio). La expresión "unión covalente a un soporte sólido" debe interpretarse en consecuencia como que abarca este tipo de disposición.
Los enlaces covalentes de ejemplo incluyen, por ejemplo, los que resultan del uso de técnicas de química de click. Los enlaces no covalentes de ejemplo incluyen, pero no se limitan a interacciones no específicas (p. ej., enlaces de hidrógeno, enlaces iónicos, interacciones de van der Waals, etc.) o interacciones específicas (p. ej., interacciones de afinidad, interacciones de receptor-ligando, interacciones de anticuerpo-epítopo, interacciones de avidina-biotina, interacciones de estreptavidina-biotina, interacciones de lectina-carbohidrato, etc.). Los enlaces de ejemplo se exponen en las patentes de EE.UU. n° 6.737.236; 7.259.258; 7.375.234 y 7.427.678; y publicación de patente de EE.UU. n22011/0059865 A1.
Las expresiones "ácido nucleico diana", "molécula de ácido nucleico diana", "especie de ácido nucleico diana" y cualquier equivalente gramatical de las mismas, se refieren a moléculas de ácido nucleico que se desean detectar, secuenciar o analizar de otro modo. Puede utilizarse cualquiera de una variedad de moléculas de ácido nucleico diana deseadas, incluyendo, pero no limitadas a exones, o moléculas de ácido nucleico complementarias a las mismas; moléculas de ADNc, o moléculas de ácido nucleico complementarias a las mismas; regiones no traducidas (UTR) o ácidos nucleicos complementarios a las mismas; regiones promotoras y/o potenciadoras, o moléculas de ácido nucleico complementarias a las mismas; regiones conservadas evolutivamente (ECR), o moléculas de ácido nucleico complementarias a las mismas; regiones genómicas transcritas, o moléculas de ácido nucleico complementarias a las mismas. Puede usarse cualquiera de una variedad de métodos para obtener moléculas de ácido nucleico dirigidas, como se describe en el presente documento. Dichos métodos incluyen, pero no se limitan a, obtener una molécula de ácido nucleico diana usando enriquecimiento por captura por hibridación-extensión; usando sitios de restricción dirigidos, por ejemplo, usando un oligonucleótido diseñado con una horquilla que tiene un sitio de enzima de restricción de Tipo IIS tal como un sitio de enzima de restricción Fokl y una región específica de locus; usando amplificación por círculo rodante hiperramificado específico de locus; usando amplificación de cebadores específicos de locus aleatorios; usando PCR en emulsión multiplex; usando PCR en puente multiplex; usando amplificación de sonda de candado; y usando minibibliotecas de bibliotecas dirigidas, como se describe en el presente documento.
Como se usa en el presente documento, las expresiones "secuencia de ácido nucleico diana", "secuencia de ácido nucleico de muestra" y expresiones similares se refieren a secuencias de ácido nucleico obtenidas de muestras que se desean analizar.
Una muestra de ácido nucleico que se amplifica, secuencia o manipula de otro modo en un método descrito en el presente documento puede ser, por ejemplo, ADN o ARN. Las especies de ADN de ejemplo incluyen, pero no se limitan a ADN genómico (ADNg), ADN mitocondrial, ADN de cloroplasto, ADN episomal, ADN viral y ADN copia (ADNc). Un ejemplo no limitante de un subconjunto de ADN genómico es un cromosoma particular o una región de un cromosoma particular. Las especies de ARN de ejemplo incluyen, sin limitación, ARN codificante, tal como ARN mensajero (ARNm), y ARN no codificante (ARNnc), tal como ARN de transferencia (ARNt), microARN (miARN), ARN
nuclear pequeño (ARNnp) y ARN ribosómico (ARNr). Otras especies de ADN o ARN incluyen fragmentos o porciones de las especies citadas anteriormente o productos amplificados derivados de estas especies, fragmentos de las mismas o porciones de las mismas. Los métodos descritos en el presente documento son aplicables a las especies anteriores que abarcan todo o parte del complemento presente en una célula. Por ejemplo, utilizando los métodos descritos en el presente documento, se puede determinar la secuencia de un genoma sustancialmente completo o se puede determinar la secuencia de secuencias de ácido nucleico diana sustancialmente completas tales como ARNm o ADNc complemento de una célula.
Pueden prepararse moléculas de ADN diana de secuencia diferente mezclando un número mayor de uno de moléculas de ADN individuales. En el procedimiento preferido, el ADN genómico se fragmenta en moléculas pequeñas, preferiblemente de menos de 1000 pares de bases de longitud. La fragmentación del ADN se puede lograr por una serie de métodos que incluyen: digestión enzimática, escisión química, sonicación, nebulización o hidrocizalla, preferiblemente nebulización.
Pueden añadirse secuencias conocidas a los extremos 3' y 5' de las secuencias de ácido nucleico diana usando cualquiera de las diversas metodologías conocidas en la técnica, como se ilustra, por ejemplo, por las expuestas en las patentes de EE.UU. n° 7.741.463, 7.985.565 y 7.115.400, Por ejemplo, en algunas realizaciones, se añaden secuencias conocidas ligando adaptadores a fragmentos de ácido nucleico. En algunas realizaciones, las secuencias conocidas se añaden por amplificación utilizando cebadores que tienen una secuencia conocida adicional en sus extremos 5'. En algunas realizaciones, las secuencias conocidas pueden comprender secuencias que son idénticas o complementarias a los cebadores de amplificación inmovilizados sobre un soporte sólido. Por ejemplo, en determinadas realizaciones, la secuencia conocida puede incluir una de dos regiones de captura universales, tales como las regiones P5 o P7. Una región P5 incluye la secuencia de nucleótidos 5'-AATGATACGGCGACCACCGA-3'. Una región P7 incluye la secuencia de nucleótidos 5'-CAAGCAGAAGACGGCATACGA-3'. En ciertas realizaciones, la secuencia conocida es el complemento inverso de la secuencia de la región P5 ("anti-P5": 5'-TCGGTGGTCGCCGTATCATT-3') o la secuencia de la región P7 ("anti-P7": 5'-TCGTATGCCGTCTTCTGCTTG-3') del cebador de amplificación. En determinadas realizaciones, el oligonucleótido se puede hibridar con los cebadores de amplificación p5 de Illumina® (extremo emparejado) (5'-AATGATACGCGACCACCGAGAUCTACAC-3') o P7 (extremo emparejado) (5'-CAAGCAGAAGACGGCATACGA(8-oxo-G)AT-3'). En determinadas realizaciones, el oligonucleótido se puede hibridar con el complemento inverso del cebador de captura P5 de Illumina® (extremo emparejado) ("anti-P5 (extremo emparejado)": 5'-GTGTAGATCTCGGTGGTCGCCGTATCATT-3') o P7 (extremo emparejado) ("anti-P7 (extremo emparejado) ": 5'-ATCTCGTATGCCGTCTTCTGCTTG-3').
Las expresiones "superficie sólida", "soporte sólido" y otros equivalentes gramaticales en el presente documento se refieren a cualquier material que sea apropiado o pueda modificarse para que sea apropiado para la unión de los complejos de transposomas. Como apreciarán los expertos en la técnica, el número de posibles sustratos es muy grande. Los posibles sustratos incluyen, pero no se limitan a vidrio y vidrio modificado o funcionalizado, plásticos (incluidos acrílicos, poliestireno y copolímeros de estireno y otros materiales, polipropileno, polietileno, polibutileno, poliuretanos, Teflon™, etc.), polisacáridos, nailon o nitrocelulosa, materiales cerámicos, resinas, sílice o materiales basados en sílice que incluyen silicio y silicio modificado, carbono, metales, vidrios inorgánicos, plásticos, haces de fibras ópticas y una variedad de otros polímeros. Los soportes sólidos y las superficies sólidas particularmente útiles para algunas realizaciones se encuentran dentro de un aparato de celda de flujo. Las celdas de flujo de ejemplo se exponen con más detalle a continuación.
En algunas realizaciones, el soporte sólido comprende una superficie con patrón adecuada para la inmovilización de complejos de transposomas en un patrón ordenado. Una "superficie con patrón" se refiere a una disposición de diferentes regiones en o sobre una capa expuesta de un soporte sólido. Por ejemplo, una o más de las regiones pueden ser sitios característicos donde están presentes uno o más complejos de transposomas. Los sitios característicos pueden estar separados por regiones intersticiales donde no están presentes complejos de transposomas. En algunas realizaciones, el patrón puede ser un formato x-y de sitios característicos que están en filas y columnas. En algunas realizaciones, el patrón puede ser una disposición que se repite de sitios característicos y/o regiones intersticiales. En algunas realizaciones, el patrón puede ser una disposición aleatoria de sitios característicos y/o regiones intersticiales. En algunas realizaciones, los complejos de transposomas se distribuyen aleatoriamente sobre el soporte sólido. En algunas realizaciones, los complejos de transposomas se distribuyen sobre una superficie con patrón. Superficies con patrón de ejemplo que se pueden usar en los métodos y composiciones expuestos en el presente documento se describen en los documentos US 2013/0116153 A1 o publicación de solicitud de patente de EE.UU. 2012/0316086 A1.
En algunas realizaciones, el soporte sólido comprende una matriz de pocillos o depresiones en una superficie. Esto se puede fabricar como se conoce generalmente en la técnica usando una variedad de técnicas, que incluyen, pero no se limitan a, fotolitografía, técnicas de estampación, técnicas de moldeo y técnicas de micrograbado. Como apreciarán los expertos en la técnica, la técnica utilizada dependerá de la composición y forma del sustrato de la matriz.
La composición y geometría del soporte sólido puede variar con su uso. En algunas realizaciones, el soporte sólido es una estructura plana, tal como un portaobjetos, chip, microchip y/o matriz. Así pues, la superficie de un sustrato puede tener la forma de una capa plana. En algunas realizaciones, el soporte sólido comprende una o más superficies de una celda de flujo. La expresión "celda de flujo", como se usa en el presente documento, se refiere a una cámara que
comprende una superficie sólida a través de la cual pueden fluir uno o más reactivos fluidos. Ejemplos de celdas de flujo y sistemas fluídicos relacionados y plataformas de detección que se pueden usar fácilmente en los métodos de la presente descripción se describen, por ejemplo, en Bentley et al., Nature 456:53-59 (2008), documentos WO 04/018497; US 7.057.026; WO 91/06678; WO 07/123744; US 7.329.492; US 7.211.414; US 7.315.019; US 7.405.281 y US 2008/0108082.
En algunas realizaciones, el soporte sólido o su superficie no es plana, tal como la superficie interior o exterior de un tubo o recipiente. En algunas realizaciones, el soporte sólido comprende microesferas o perlas. Por "microesferas" o "perlas" o "partículas" o equivalentes gramaticales en el presente documento se entiende pequeñas partículas discretas. Las composiciones de perlas adecuadas incluyen, pero no se limitan a plásticos, materiales cerámicos, vidrio, poliestireno, metilestireno, polímeros acrílicos, materiales paramagnéticos, sol Thoria, grafito de carbono, dióxido de titanio, látex o dextranos reticulados tales como sefarosa, celulosa, nailon, micelas reticuladas y teflón, así como se puede usar cualquier otro material descrito en el presente documento para soportes sólidos. La "Microsphere Detection Guide" de Bangs Laboratories, Fishers Ind. Es una guía útil. En determinadas realizaciones, las microesferas son microesferas o perlas magnéticas.
No es necesario que las perlas sean esféricas; se pueden utilizar partículas irregulares. Alternativa o adicionalmente, las perlas pueden ser porosas. Los tamaños de las perlas varían desde nanómetros, es decir, 100 nm, hasta milímetros, es decir, 1 mm, prefiriéndose perlas de aproximadamente 0,2 micrómetros a aproximadamente 200 micrómetros, y siendo particularmente preferidos de aproximadamente 0,5 a aproximadamente 5 micrómetros, aunque en algunas realizaciones se pueden utilizar perlas más pequeñas o más grandes.
Ejemplo 1
Este ejemplo describe la amplificación en fase sólida según una realización, como se ilustra en la Fig. 1. Se usó una biblioteca estándar universal PhiX o CT418 que contiene las regiones P5 y P7' para unir el P5' adicional en el extremo 5' de la biblioteca ya preparada. Esto se logró realizando 18 ciclos de PCR adicionales. Las bibliotecas se diluyeron hasta 200 pM final y se amplificaron usando cebador estándar o cebador P7-P5'. Cada reacción de PCR de 50 pl contenía 22 pl de H2O, 25 pl de 2X Phusion Mastermix (NEB), 1 pl de cada uno del cebador y ADN adecuados. Después de la PCR, las concentraciones de la biblioteca resultante se determinaron mediante Nanodrop (Thermo Scientific) y se diluyeron a 10 nM en tampón EB (QIAGEN) Tween20 al 0,05%. Se preparó una celda de flujo injertando cebadores HEG (carriles 1 - 4) o cebadores PE estándar (carriles 5 - 8) utilizando el protocolo descrito en las patentes de EE.UU. n° 8.536.477, 8.715.966 y publicación de solicitud de patente de EE.UU. 2008/0280773. Las bibliotecas generadas anteriormente se utilizaron para generar clústeres en la celda de flujo injertada.
Los clústeres se amplificaron utilizando el kit de generación de clúster TruSeq para Genome Analyzer (Illumina) según el protocolo recomendado por el fabricante durante 35 ciclos. La celda de flujo se tiñó con verde SYBR (Molecular Probes) y se generaron imágenes en un microscopio de fluorescencia. Como se muestra en el panel superior de la Fig. 4A, los clústeres generados con cebadores estándar dieron como resultado clústeres normales, mientras que se mostró que lo mismo con cebadores modificados con P5 adicional daba como resultado una mezcla de clústeres grandes y normales (panel inferior de la Fig. 4A). Los gráficos del número de clústeres frente a la intensidad de la señal SYBR de las celdas de flujo descritas en la Fig. 4A se muestran en la Fig. 4B. Los clústeres de cebadores estándar dieron como resultado una baja intensidad de SYBR (gráfico superior) mientras que los del cebador modificado con P5 añadido dieron como resultado una intensidad 10 veces mayor (gráfico inferior).
A continuación, se preparó la celda de flujo para realizar un primer ciclo de incorporación de secuenciación, utilizando un conjunto de fluoróforo de luz blanca. Las imágenes del primer ciclo de C, T y G con la escala de grises de la imagen ajustada al brillo de la imagen de T en el carril de cebador modificado mostraron que los clústeres que usan los cebadores modificados son más brillantes que los clústeres hechos con cebadores estándar. (Fig. 5)
Ejemplo 2
Este ejemplo describe la amplificación en fase sólida de acuerdo con una realización, como se ilustra en la Fig. 3. Los experimentos descritos en la Figura 6 muestran los resultados de la concatemerización de conectores 20T / A en los cebadores de injerto P5/P7 (referidos como 20T-P7/20A-P5) en lugar de unir los cebadores que facilitan el concatémero en la biblioteca durante el proceso de PCR. En este experimento, la celda de flujo se injertó con cebadores P5 / P7 de extremos emparejados con 20A/T junto con cebadores estándar. Se siguió el protocolo de injerto estándar como se describe en las patentes de EE.UU. n° 8.536.477, 8.715.966 y publicación de solicitud de patente 2008/0280773 y esta celda de flujo injertada se usó para la amplificación de clústeres en un sistema de amplificación clonal cBOT (Illumina n° de cat. SY-301-2002) usando el kit de generación de clúster TruSeq para Genome Analyzer (Illumina) según el protocolo recomendado por el fabricante. Se utilizaron bibliotecas CT418 como molde; se amplificaron 105 ciclos a 60°C. La celda de flujo se tiñó con verde SYBR y se obtuvieron imágenes como se describe en la Fig. 4. Las gráficas del número de clústeres frente a la intensidad de la señal SYBR mostraba que usando los cebadores de superficie 20T-P7/20A-P5 (6A) el brillo del clúster aumentaba en comparación con los cebadores de superficie estándar (6B). Sin embargo, se observaron menos clústeres con mayor intensidad en comparación con el ejemplo dado en las Figs. 4 y 5.
Efecto de la temperatura en la intensidad del clúster: Se probaron intervalos de temperatura de 50° a 60°C y ciclos de amplificación que variaban de 25 a 45 para la generación de clústeres. El injerto de la celda de flujo y el procedimiento del experimento eran como se ha descrito anteriormente para la Fig. 6, excepto que se probaron temperaturas de 50 y 55°C para la amplificación de clústeres durante 35 o 45 ciclos. Como se muestra en la Fig. 7, los cebadores de superficie 20T / 20A amplificados a 50°C y teñidos con verde SYBR mostraron que los clústeres de 20T/20A son 3-5 veces más brillantes que aquellos con cebadores de superficie estándar (7A). El diámetro del clúster siguió siendo el mismo para los cebadores de superficie 20T/20A y los cebadores estándar (7B). Las bibliotecas utilizadas fueron PhiX 1,9 y 18 pM y CT418 1 pM. Los autores de la invención encontraron que a temperaturas iguales o inferiores a 55°C y amplificación de 45 ciclos daban como resultado clústeres más brillantes utilizando cebadores 20T/20A en comparación con los cebadores estándar. El aumento de la concentración de polimerasa Bst junto con el aumento de los tiempos de extensión a 72 s desde el estándar de 36 s utilizado durante la amplificación en puente, también daba como resultado clústeres más brillantes cuando se usaban los cebadores 20T/20A en comparación con los clústeres estándar (datos no mostrados).
La Figura 8 es una comparación en paralelo de la intensidad del clúster frente al número de ciclos durante una secuenciación estándar de 100 ciclos realizada en un GA, que muestra que la intensidad de los clústeres de cebadores 20T-P7/20A-P5 al final de un experimento de 100 ciclos es similar a la intensidad de los clústeres con cebadores estándar al comienzo del experimento.
A lo largo de esta solicitud se ha hecho referencia a diversas publicaciones, patentes y/o solicitudes de patente.
En el presente documento, se pretende que el término comprender sea abierto, incluyendo no solo los elementos citados, sino que además abarca cualquier elemento adicional.
Se han descrito varias realizaciones. No obstante, se entenderá que pueden realizarse varias modificaciones. Por consiguiente, otras realizaciones están dentro del alcance de las siguientes reivindicaciones.
Claims (13)
1. Un método para preparar moldes inmovilizados para una reacción de secuenciación de ácidos nucleicos que comprende:
(a) proporcionar un soporte sólido que tiene un cebador de amplificación directo e inverso inmovilizado sobre el mismo; (b) proporcionar un ácido nucleico diana, en donde el ácido nucleico diana comprende:
(i) una primera región de secuencia conocida complementaria del cebador de amplificación directo;
(ii) una primera región molde;
(iii) una segunda región de secuencia conocida sustancialmente idéntica al cebador de amplificación inverso, en donde la primera región molde está entre la primera región de secuencia conocida y la segunda región de secuencia conocida; y
(iv) una tercera región de secuencia conocida complementaria del cebador de amplificación directo, en donde la primera región molde y la segunda región de secuencia conocida están entre la primera región de secuencia conocida y la tercera región de secuencia conocida;
(c) aplicar el ácido nucleico diana al soporte sólido en condiciones adecuadas para la hibridación de modo que la primera región de secuencia conocida se hibrida con el cebador de amplificación directo;
(d) extender el cebador de amplificación directo hibridado para generar un primer molde inmovilizado que comprende una copia complementaria del ácido nucleico diana;
(e) desnaturalizar el ácido nucleico diana del primer molde inmovilizado;
(f) hibridar el primer molde inmovilizado con el cebador de amplificación inverso, de modo que una copia complementaria de la segunda región de secuencia conocida se hibrida con el cebador de amplificación inverso; y (g) extender el cebador de amplificación inverso hibridado para generar una segunda cadena inmovilizada que comprende la primera región molde colocada entre la primera región de secuencia conocida y la segunda región de secuencia conocida;
(h) desnaturalizar la segunda cadena inmovilizada del primer molde inmovilizado;
(i) hibridar la segunda cadena inmovilizada con el primer molde inmovilizado, de modo que la primera región de secuencia conocida de la segunda cadena inmovilizada se hibrida con una copia complementaria de la tercera región de secuencia conocida en el molde inmovilizado;
(j) extender un 3' OH de la primera región de secuencia conocida para generar un concatémero de la segunda cadena inmovilizada; y
(k) extender un 3' OH de la copia complementaria de la tercera región de secuencia conocida para generar un concatémero del primer molde inmovilizado;
en donde el método comprende además secuenciar el ácido nucleico diana y la secuenciación comprende: hibridar uno o más cebadores de secuenciación con el primer molde inmovilizado o la segunda cadena inmovilizada; extender los cebadores de secuenciación incorporando uno o más nucleótidos marcados en la cadena naciente; y detectar los nucleótidos marcados, obteniendo así información de secuencia sobre el ácido nucleico diana.
2. El método de la reivindicación 1, que además comprende:
( l) desnaturalizar los concatémeros y repetir las etapas (i), (j) y (k) para generar concatémeros adicionales de cada cadena.
3. El método de cualquiera de las reivindicaciones 1-2, en donde el cebador de amplificación directo comprende una región de complementariedad directa, teniendo dicha región de complementariedad directa complementariedad con una región de complementariedad inversa del cebador de amplificación inverso.
4. El método de la reivindicación 3, en donde la región de complementariedad directa está situada directamente en 5' de una región que tiene complementariedad con la primera región de secuencia conocida del ácido nucleico diana; y/o en donde la región de complementariedad inversa está situada directamente en 5' de una región que tiene secuencia sustancialmente idéntica a la segunda región de secuencia conocida del ácido nucleico diana; y/o
en donde la región de complementariedad directa y la región de complementariedad inversa están configuradas de modo que ciclos repetidos de hibridación y extensión producen un concatémero de la primera cadena inmovilizada, cada copia en el concatémero separada de la siguiente por la secuencia de la región de complementariedad directa y/o en donde la región de complementariedad directa y la región de complementariedad inversa están configuradas de manera que ciclos repetidos de hibridación y extensión producen un concatémero de la segunda cadena inmovilizada, cada copia en el concatémero separada de la siguiente por la secuencia de la región de complementariedad inversa.
5. El método de cualquiera de las reivindicaciones 1-2, en donde dichos concatémeros comprenden múltiples copias de dicha molécula de ácido nucleico diana de al menos 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50, 100, 200, 500, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000 o al menos 10.000 copias.
6. El método de cualquiera de las reivindicaciones 1-5, en donde dicho soporte sólido es plano; o en donde dicho soporte sólido comprende micropocillos o perlas.
7. El método de cualquiera de las reivindicaciones 1-6, en donde dicho ácido nucleico diana tiene una longitud de al menos 10, 20, 50, 100, 200 o al menos 500 nucleótidos.
8. El método de la reivindicación 1, en donde dicho ácido nucleico diana comprende además una cuarta región de secuencia conocida sustancialmente idéntica al cebador de amplificación inverso, en donde la primera región de secuencia conocida, la primera región molde y la segunda región de secuencia conocida están entre la tercera región de secuencia conocida y la cuarta región de secuencia conocida.
9. El método de cualquiera de las reivindicaciones 1-8, en donde el cebador de amplificación directo comprende un resto conector químico no nucleotídico situado para evitar la copia de cualquier nucleótido que esté en 5' del resto conector químico no nucleotídico.
10. El método de cualquiera de las reivindicaciones 1-9, en donde el cebador de amplificación inverso comprende un resto conector químico no nucleotídico situado para evitar la copia de cualquier nucleótido que esté en 5' del resto conector químico no nucleotídico.
11. El método de cualquiera de las reivindicaciones 9-10, en donde el resto conector químico no nucleotídico comprende un diol o, en donde el resto conector químico no nucleotídico comprende un conector no nucleotídico que une el cebador al soporte sólido.
12. El método de cualquiera de las reivindicaciones 1-11, en donde el ácido nucleico diana se prepara amplificando con un par de cebadores configurados con un resto de unión de modo que una cadena de un producto de amplificación generado usando el par de cebadores puede separarse de la cadena opuesta.
13. El método de la reivindicación 12, en donde el resto de unión comprende biotina.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201562141165P | 2015-03-31 | 2015-03-31 | |
| PCT/GB2016/050898 WO2016156845A1 (en) | 2015-03-31 | 2016-03-30 | Surface concatamerization of templates |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| ES2846730T3 true ES2846730T3 (es) | 2021-07-29 |
Family
ID=55745782
Family Applications (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES16715859T Active ES2846730T3 (es) | 2015-03-31 | 2016-03-30 | Concatemerización en superficie de moldes |
| ES20200077T Active ES2984193T3 (es) | 2015-03-31 | 2016-03-30 | Concatemerización de moldes en la superficie |
Family Applications After (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES20200077T Active ES2984193T3 (es) | 2015-03-31 | 2016-03-30 | Concatemerización de moldes en la superficie |
Country Status (5)
| Country | Link |
|---|---|
| US (2) | US20180100192A1 (es) |
| EP (2) | EP3277839B1 (es) |
| CN (1) | CN107532205B (es) |
| ES (2) | ES2846730T3 (es) |
| WO (1) | WO2016156845A1 (es) |
Families Citing this family (15)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US10829816B2 (en) | 2012-11-19 | 2020-11-10 | Apton Biosystems, Inc. | Methods of analyte detection |
| HUE058723T2 (hu) | 2012-11-19 | 2022-09-28 | Apton Biosystems Inc | Molekuláris analitok digitális elemzése egyetlen molekula kimutatásával |
| EP4306650A3 (en) | 2013-08-22 | 2024-03-27 | Pacific Biosciences of California, Inc. | Digital analysis of molecular analytes using electrical methods |
| CA3056765C (en) | 2017-03-17 | 2024-04-02 | Apton Biosystems, Inc. | Sequencing and high resolution imaging |
| JP2022501026A (ja) | 2018-09-19 | 2022-01-06 | アプトン バイオシステムズ インコーポレイテッド | 高密度に詰め込まれた分析物の層および検出方法 |
| EP3891305A1 (en) * | 2018-12-05 | 2021-10-13 | Illumina Cambridge Limited | Methods and compositions for cluster generation by bridge amplification |
| WO2020243073A1 (en) * | 2019-05-31 | 2020-12-03 | Illumina, Inc. | Systems and methods for information storage and retrieval using flow cells |
| US12448648B2 (en) * | 2019-12-23 | 2025-10-21 | Mgi Tech Co., Ltd. | Controlled strand-displacement for paired end sequencing |
| WO2021163621A2 (en) * | 2020-02-14 | 2021-08-19 | Genapsys, Inc. | Methods and systems for nucleic acid amplification and sequencing |
| WO2021178467A1 (en) * | 2020-03-03 | 2021-09-10 | Omniome, Inc. | Methods and compositions for sequencing double stranded nucleic acids |
| EP4150126A4 (en) * | 2020-05-12 | 2024-06-19 | Singular Genomics Systems, Inc. | NUCLEIC ACID AMPLIFICATION PROCESSES |
| WO2022015600A2 (en) * | 2020-07-13 | 2022-01-20 | Singular Genomics Systems, Inc. | Methods of sequencing complementary polynucleotides |
| AU2022245985A1 (en) * | 2021-03-22 | 2023-09-21 | Illumina Cambridge Limited | Methods for improving nucleic acid cluster clonality |
| US20220356519A1 (en) * | 2021-05-10 | 2022-11-10 | Pacific Biosciences Of California, Inc. | Single-molecule seeding and amplification on a surface |
| WO2024119413A1 (zh) * | 2022-12-07 | 2024-06-13 | 深圳华大智造科技股份有限公司 | 基于一步法的双核酸纳米球制备方法 |
Family Cites Families (58)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| AU622426B2 (en) | 1987-12-11 | 1992-04-09 | Abbott Laboratories | Assay using template-dependent nucleic acid probe reorganization |
| CA1341584C (en) | 1988-04-06 | 2008-11-18 | Bruce Wallace | Method of amplifying and detecting nucleic acid sequences |
| WO1989009835A1 (en) | 1988-04-08 | 1989-10-19 | The Salk Institute For Biological Studies | Ligase-based amplification method |
| EP0379559B1 (en) | 1988-06-24 | 1996-10-23 | Amgen Inc. | Method and reagents for detecting nucleic acid sequences |
| US5130238A (en) | 1988-06-24 | 1992-07-14 | Cangene Corporation | Enhanced nucleic acid amplification process |
| JP2955759B2 (ja) | 1988-07-20 | 1999-10-04 | セゲブ・ダイアグノスティックス・インコーポレイテッド | 核酸配列を増幅及び検出する方法 |
| US5185243A (en) | 1988-08-25 | 1993-02-09 | Syntex (U.S.A.) Inc. | Method for detection of specific nucleic acid sequences |
| EP0450060A1 (en) | 1989-10-26 | 1991-10-09 | Sri International | Dna sequencing |
| EP0439182B1 (en) | 1990-01-26 | 1996-04-24 | Abbott Laboratories | Improved method of amplifying target nucleic acids applicable to both polymerase and ligase chain reactions |
| US5573907A (en) | 1990-01-26 | 1996-11-12 | Abbott Laboratories | Detecting and amplifying target nucleic acids using exonucleolytic activity |
| US5455166A (en) | 1991-01-31 | 1995-10-03 | Becton, Dickinson And Company | Strand displacement amplification |
| EP0754240B1 (en) | 1994-02-07 | 2003-08-20 | Beckman Coulter, Inc. | Ligase/polymerase-mediated genetic bit analysis of single nucleotide polymorphisms and its use in genetic analysis |
| US5928905A (en) * | 1995-04-18 | 1999-07-27 | Glaxo Group Limited | End-complementary polymerase reaction |
| AU687535B2 (en) | 1994-03-16 | 1998-02-26 | Gen-Probe Incorporated | Isothermal strand displacement nucleic acid amplification |
| US5846719A (en) | 1994-10-13 | 1998-12-08 | Lynx Therapeutics, Inc. | Oligonucleotide tags for sorting and identification |
| US5750341A (en) | 1995-04-17 | 1998-05-12 | Lynx Therapeutics, Inc. | DNA sequencing by parallel oligonucleotide extensions |
| GB9620209D0 (en) | 1996-09-27 | 1996-11-13 | Cemu Bioteknik Ab | Method of sequencing DNA |
| GB9626815D0 (en) | 1996-12-23 | 1997-02-12 | Cemu Bioteknik Ab | Method of sequencing DNA |
| AU747242B2 (en) | 1997-01-08 | 2002-05-09 | Proligo Llc | Bioconjugation of macromolecules |
| JP2002503954A (ja) * | 1997-04-01 | 2002-02-05 | グラクソ、グループ、リミテッド | 核酸増幅法 |
| US6969488B2 (en) | 1998-05-22 | 2005-11-29 | Solexa, Inc. | System and apparatus for sequential processing of analytes |
| US7427678B2 (en) | 1998-01-08 | 2008-09-23 | Sigma-Aldrich Co. | Method for immobilizing oligonucleotides employing the cycloaddition bioconjugation method |
| AR021833A1 (es) | 1998-09-30 | 2002-08-07 | Applied Research Systems | Metodos de amplificacion y secuenciacion de acido nucleico |
| US6274320B1 (en) | 1999-09-16 | 2001-08-14 | Curagen Corporation | Method of sequencing a nucleic acid |
| US7611869B2 (en) | 2000-02-07 | 2009-11-03 | Illumina, Inc. | Multiplexed methylation detection methods |
| US7955794B2 (en) | 2000-09-21 | 2011-06-07 | Illumina, Inc. | Multiplex nucleic acid reactions |
| US7582420B2 (en) | 2001-07-12 | 2009-09-01 | Illumina, Inc. | Multiplex nucleic acid reactions |
| US7001792B2 (en) | 2000-04-24 | 2006-02-21 | Eagle Research & Development, Llc | Ultra-fast nucleic acid sequencing device and a method for making and using the same |
| CN101525660A (zh) | 2000-07-07 | 2009-09-09 | 维西根生物技术公司 | 实时序列测定 |
| EP1354064A2 (en) | 2000-12-01 | 2003-10-22 | Visigen Biotechnologies, Inc. | Enzymatic nucleic acid synthesis: compositions and methods for altering monomer incorporation fidelity |
| US7057026B2 (en) | 2001-12-04 | 2006-06-06 | Solexa Limited | Labelled nucleotides |
| WO2003101972A1 (en) | 2002-05-30 | 2003-12-11 | The Scripps Research Institute | Copper-catalysed ligation of azides and acetylenes |
| EP3795577A1 (en) | 2002-08-23 | 2021-03-24 | Illumina Cambridge Limited | Modified nucleotides |
| US20050053980A1 (en) | 2003-06-20 | 2005-03-10 | Illumina, Inc. | Methods and compositions for whole genome amplification and genotyping |
| GB0321306D0 (en) | 2003-09-11 | 2003-10-15 | Solexa Ltd | Modified polymerases for improved incorporation of nucleotide analogues |
| US7259258B2 (en) | 2003-12-17 | 2007-08-21 | Illumina, Inc. | Methods of attaching biological compounds to solid supports using triazine |
| EP3175914A1 (en) | 2004-01-07 | 2017-06-07 | Illumina Cambridge Limited | Improvements in or relating to molecular arrays |
| US7315019B2 (en) | 2004-09-17 | 2008-01-01 | Pacific Biosciences Of California, Inc. | Arrays of optical confinements and uses thereof |
| GB0427236D0 (en) | 2004-12-13 | 2005-01-12 | Solexa Ltd | Improved method of nucleotide detection |
| EP1828412B2 (en) | 2004-12-13 | 2019-01-09 | Illumina Cambridge Limited | Improved method of nucleotide detection |
| US8623628B2 (en) | 2005-05-10 | 2014-01-07 | Illumina, Inc. | Polymerases |
| GB0514936D0 (en) | 2005-07-20 | 2005-08-24 | Solexa Ltd | Preparation of templates for nucleic acid sequencing |
| US7405281B2 (en) | 2005-09-29 | 2008-07-29 | Pacific Biosciences Of California, Inc. | Fluorescent nucleotide analogs and uses therefor |
| GB0522310D0 (en) | 2005-11-01 | 2005-12-07 | Solexa Ltd | Methods of preparing libraries of template polynucleotides |
| EP3722409A1 (en) | 2006-03-31 | 2020-10-14 | Illumina, Inc. | Systems and devices for sequence by synthesis analysis |
| WO2008051530A2 (en) | 2006-10-23 | 2008-05-02 | Pacific Biosciences Of California, Inc. | Polymerase enzymes and reagents for enhanced nucleic acid sequencing |
| US8262900B2 (en) | 2006-12-14 | 2012-09-11 | Life Technologies Corporation | Methods and apparatus for measuring analytes using large scale FET arrays |
| EP4134667B1 (en) | 2006-12-14 | 2025-11-12 | Life Technologies Corporation | Apparatus for measuring analytes using fet arrays |
| US8349167B2 (en) | 2006-12-14 | 2013-01-08 | Life Technologies Corporation | Methods and apparatus for detecting molecular interactions using FET arrays |
| WO2010038042A1 (en) * | 2008-10-02 | 2010-04-08 | Illumina Cambridge Ltd. | Nucleic acid sample enrichment for sequencing applications |
| US20100137143A1 (en) | 2008-10-22 | 2010-06-03 | Ion Torrent Systems Incorporated | Methods and apparatus for measuring analytes |
| US9029103B2 (en) * | 2010-08-27 | 2015-05-12 | Illumina Cambridge Limited | Methods for sequencing polynucleotides |
| US8951781B2 (en) | 2011-01-10 | 2015-02-10 | Illumina, Inc. | Systems, methods, and apparatuses to image a sample for biological or chemical analysis |
| CN102609077A (zh) | 2011-01-20 | 2012-07-25 | 深圳富泰宏精密工业有限公司 | 锁屏装置 |
| US8778848B2 (en) | 2011-06-09 | 2014-07-15 | Illumina, Inc. | Patterned flow-cells useful for nucleic acid analysis |
| CA2859660C (en) | 2011-09-23 | 2021-02-09 | Illumina, Inc. | Methods and compositions for nucleic acid sequencing |
| CA3003082C (en) | 2011-10-28 | 2020-12-15 | Illumina, Inc. | Microarray fabrication system and method |
| JP6159391B2 (ja) | 2012-04-03 | 2017-07-05 | イラミーナ インコーポレーテッド | 核酸シークエンシングに有用な統合化した読取りヘッド及び流体カートリッジ |
-
2016
- 2016-03-30 ES ES16715859T patent/ES2846730T3/es active Active
- 2016-03-30 ES ES20200077T patent/ES2984193T3/es active Active
- 2016-03-30 CN CN201680017668.4A patent/CN107532205B/zh active Active
- 2016-03-30 WO PCT/GB2016/050898 patent/WO2016156845A1/en not_active Ceased
- 2016-03-30 EP EP16715859.1A patent/EP3277839B1/en active Active
- 2016-03-30 US US15/560,147 patent/US20180100192A1/en not_active Abandoned
- 2016-03-30 EP EP20200077.4A patent/EP3783109B1/en active Active
-
2021
- 2021-01-20 US US17/153,725 patent/US12123056B2/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| EP3277839B1 (en) | 2020-12-02 |
| CN107532205A (zh) | 2018-01-02 |
| CN107532205B (zh) | 2021-06-08 |
| US20210155985A1 (en) | 2021-05-27 |
| EP3783109A1 (en) | 2021-02-24 |
| EP3277839A1 (en) | 2018-02-07 |
| EP3783109B1 (en) | 2024-05-29 |
| US20180100192A1 (en) | 2018-04-12 |
| US12123056B2 (en) | 2024-10-22 |
| WO2016156845A1 (en) | 2016-10-06 |
| HK1244846A1 (en) | 2018-08-17 |
| ES2984193T3 (es) | 2024-10-29 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| ES2846730T3 (es) | Concatemerización en superficie de moldes | |
| ES2802405T3 (es) | Métodos y matrices para producir y secuenciar agrupaciones monoclonales de ácido nucleico | |
| ES2699262T3 (es) | Métodos y soportes sólidos para la preparación de muestras utilizando transposomas | |
| ES2898250T3 (es) | Bibliotecas de genoma completo de células individuales para secuenciación de la metilación | |
| ES2789349T3 (es) | Utilización mejorada de cebadores de superficie en grupos | |
| ES2889875T3 (es) | Secuenciación a partir de cebadores múltiples para incrementar la velocidad y la densidad de los datos | |
| ES2877205T3 (es) | Preparación de muestras para la amplificación de ácido nucleico | |
| HK40046037B (en) | Surface concatamerization of templates | |
| HK40046037A (en) | Surface concatamerization of templates | |
| HK1244846B (en) | Surface concatamerization of templates | |
| HK1246366B (en) | Enhanced utilization of surface primers in clusters | |
| HK1216776B (en) | Methods and solid supports for sample preparation using transposomes |