ES2994071T3 - Pyrophosphorolytic sequencing using nanopores - Google Patents
Pyrophosphorolytic sequencing using nanopores Download PDFInfo
- Publication number
- ES2994071T3 ES2994071T3 ES20183774T ES20183774T ES2994071T3 ES 2994071 T3 ES2994071 T3 ES 2994071T3 ES 20183774 T ES20183774 T ES 20183774T ES 20183774 T ES20183774 T ES 20183774T ES 2994071 T3 ES2994071 T3 ES 2994071T3
- Authority
- ES
- Spain
- Prior art keywords
- nucleic acid
- polymerase
- nanopore
- pyrophosphate
- target nucleic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000001841 pyrophosphorolytic effect Effects 0.000 title claims description 19
- 238000012163 sequencing technique Methods 0.000 title description 42
- 239000002773 nucleotide Substances 0.000 claims abstract description 115
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 112
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 107
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 107
- 239000001226 triphosphate Substances 0.000 claims abstract description 103
- 235000011178 triphosphate Nutrition 0.000 claims abstract description 103
- 238000000034 method Methods 0.000 claims abstract description 89
- -1 nucleotide triphosphates Chemical class 0.000 claims abstract description 71
- 235000011180 diphosphates Nutrition 0.000 claims description 59
- 125000003729 nucleotide group Chemical group 0.000 claims description 52
- 108020004414 DNA Proteins 0.000 claims description 34
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 claims description 21
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 claims description 15
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 claims description 13
- 102000053602 DNA Human genes 0.000 claims description 11
- 239000012528 membrane Substances 0.000 claims description 9
- 229930024421 Adenine Natural products 0.000 claims description 8
- 229960000643 adenine Drugs 0.000 claims description 8
- 229940104302 cytosine Drugs 0.000 claims description 8
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 claims description 7
- 102000004169 proteins and genes Human genes 0.000 claims description 7
- 108090000623 proteins and genes Proteins 0.000 claims description 7
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 claims description 7
- 238000004519 manufacturing process Methods 0.000 claims description 6
- 239000011148 porous material Substances 0.000 claims description 6
- RYVNIFSIEDRLSJ-UHFFFAOYSA-N 5-(hydroxymethyl)cytosine Chemical compound NC=1NC(=O)N=CC=1CO RYVNIFSIEDRLSJ-UHFFFAOYSA-N 0.000 claims description 4
- 239000007787 solid Substances 0.000 claims description 4
- 229940113082 thymine Drugs 0.000 claims description 4
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 claims description 2
- 108091027305 Heteroduplex Proteins 0.000 claims description 2
- XPPKVPWEQAFLFU-UHFFFAOYSA-N diphosphoric acid Chemical compound OP(O)(=O)OP(O)(O)=O XPPKVPWEQAFLFU-UHFFFAOYSA-N 0.000 description 54
- 239000012530 fluid Substances 0.000 description 48
- 238000006243 chemical reaction Methods 0.000 description 45
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 39
- 230000004888 barrier function Effects 0.000 description 35
- 230000000694 effects Effects 0.000 description 21
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 17
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 17
- 108060002716 Exonuclease Proteins 0.000 description 16
- 102000013165 exonuclease Human genes 0.000 description 16
- 238000001514 detection method Methods 0.000 description 15
- 241000894007 species Species 0.000 description 13
- 108091028664 Ribonucleotide Proteins 0.000 description 9
- 230000008901 benefit Effects 0.000 description 9
- 230000003197 catalytic effect Effects 0.000 description 9
- 239000002336 ribonucleotide Substances 0.000 description 9
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 8
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 8
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 8
- 239000000232 Lipid Bilayer Substances 0.000 description 8
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 8
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 7
- 238000006116 polymerization reaction Methods 0.000 description 7
- 239000011541 reaction mixture Substances 0.000 description 6
- 239000000126 substance Substances 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 241000282414 Homo sapiens Species 0.000 description 5
- 238000007792 addition Methods 0.000 description 5
- 230000003321 amplification Effects 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 5
- RGWHQCVHVJXOKC-SHYZEUOFSA-N dCTP Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](CO[P@](O)(=O)O[P@](O)(=O)OP(O)(O)=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-N 0.000 description 5
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 5
- 239000001177 diphosphate Substances 0.000 description 5
- 239000012634 fragment Substances 0.000 description 5
- 239000000178 monomer Substances 0.000 description 5
- 238000003199 nucleic acid amplification method Methods 0.000 description 5
- 238000003752 polymerase chain reaction Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 125000002652 ribonucleotide group Chemical group 0.000 description 5
- 229940035893 uracil Drugs 0.000 description 5
- 108010017826 DNA Polymerase I Proteins 0.000 description 4
- 102000004594 DNA Polymerase I Human genes 0.000 description 4
- 241000588724 Escherichia coli Species 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 230000015556 catabolic process Effects 0.000 description 4
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 4
- 238000006731 degradation reaction Methods 0.000 description 4
- 230000004927 fusion Effects 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 101710092462 Alpha-hemolysin Proteins 0.000 description 3
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 102100034343 Integrase Human genes 0.000 description 3
- 108010010677 Phosphodiesterase I Proteins 0.000 description 3
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 3
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 3
- 229960005305 adenosine Drugs 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 239000011324 bead Substances 0.000 description 3
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 3
- 238000009792 diffusion process Methods 0.000 description 3
- 230000002779 inactivation Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 150000002632 lipids Chemical class 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000001915 proofreading effect Effects 0.000 description 3
- 239000002342 ribonucleoside Substances 0.000 description 3
- 238000005464 sample preparation method Methods 0.000 description 3
- 108010068698 spleen exonuclease Proteins 0.000 description 3
- 239000000758 substrate Substances 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical group N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- FZWGECJQACGGTI-UHFFFAOYSA-N 2-amino-7-methyl-1,7-dihydro-6H-purin-6-one Chemical compound NC1=NC(O)=C2N(C)C=NC2=N1 FZWGECJQACGGTI-UHFFFAOYSA-N 0.000 description 2
- OVONXEQGWXGFJD-UHFFFAOYSA-N 4-sulfanylidene-1h-pyrimidin-2-one Chemical compound SC=1C=CNC(=O)N=1 OVONXEQGWXGFJD-UHFFFAOYSA-N 0.000 description 2
- PEHVGBZKEYRQSX-UHFFFAOYSA-N 7-deaza-adenine Chemical compound NC1=NC=NC2=C1C=CN2 PEHVGBZKEYRQSX-UHFFFAOYSA-N 0.000 description 2
- HCGHYQLFMPXSDU-UHFFFAOYSA-N 7-methyladenine Chemical compound C1=NC(N)=C2N(C)C=NC2=N1 HCGHYQLFMPXSDU-UHFFFAOYSA-N 0.000 description 2
- LRFVTYWOQMYALW-UHFFFAOYSA-N 9H-xanthine Chemical compound O=C1NC(=O)NC2=C1NC=N2 LRFVTYWOQMYALW-UHFFFAOYSA-N 0.000 description 2
- 241000203069 Archaea Species 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 241000252212 Danio rerio Species 0.000 description 2
- 241000255925 Diptera Species 0.000 description 2
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 2
- 241000187480 Mycobacterium smegmatis Species 0.000 description 2
- 240000007594 Oryza sativa Species 0.000 description 2
- 235000007164 Oryza sativa Nutrition 0.000 description 2
- 108010013381 Porins Proteins 0.000 description 2
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 2
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 2
- 229930182558 Sterol Natural products 0.000 description 2
- 241000255588 Tephritidae Species 0.000 description 2
- 240000008042 Zea mays Species 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 235000012000 cholesterol Nutrition 0.000 description 2
- 230000000875 corresponding effect Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000005684 electric field Effects 0.000 description 2
- 125000001475 halogen functional group Chemical group 0.000 description 2
- 230000007062 hydrolysis Effects 0.000 description 2
- 238000006460 hydrolysis reaction Methods 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- DRAVOWXCEBXPTN-UHFFFAOYSA-N isoguanine Chemical compound NC1=NC(=O)NC2=C1NC=N2 DRAVOWXCEBXPTN-UHFFFAOYSA-N 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 150000004712 monophosphates Chemical class 0.000 description 2
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 229920001184 polypeptide Polymers 0.000 description 2
- 102000007739 porin activity proteins Human genes 0.000 description 2
- 108090000765 processed proteins & peptides Proteins 0.000 description 2
- 102000004196 processed proteins & peptides Human genes 0.000 description 2
- 239000003352 sequestering agent Substances 0.000 description 2
- 230000009919 sequestration Effects 0.000 description 2
- 239000011343 solid material Substances 0.000 description 2
- 239000007790 solid phase Substances 0.000 description 2
- 125000002328 sterol group Chemical group 0.000 description 2
- 150000003432 sterols Chemical group 0.000 description 2
- 235000003702 sterols Nutrition 0.000 description 2
- UHUHBFMZVCOEOV-UHFFFAOYSA-N 1h-imidazo[4,5-c]pyridin-4-amine Chemical compound NC1=NC=CC2=C1N=CN2 UHUHBFMZVCOEOV-UHFFFAOYSA-N 0.000 description 1
- HTOVHZGIBCAAJU-UHFFFAOYSA-N 2-amino-2-propyl-1h-purin-6-one Chemical compound CCCC1(N)NC(=O)C2=NC=NC2=N1 HTOVHZGIBCAAJU-UHFFFAOYSA-N 0.000 description 1
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 1
- USCCECGPGBGFOM-UHFFFAOYSA-N 2-propyl-7h-purin-6-amine Chemical compound CCCC1=NC(N)=C2NC=NC2=N1 USCCECGPGBGFOM-UHFFFAOYSA-N 0.000 description 1
- ZLAQATDNGLKIEV-UHFFFAOYSA-N 5-methyl-2-sulfanylidene-1h-pyrimidin-4-one Chemical compound CC1=CNC(=S)NC1=O ZLAQATDNGLKIEV-UHFFFAOYSA-N 0.000 description 1
- UJBCLAXPPIDQEE-UHFFFAOYSA-N 5-prop-1-ynyl-1h-pyrimidine-2,4-dione Chemical compound CC#CC1=CNC(=O)NC1=O UJBCLAXPPIDQEE-UHFFFAOYSA-N 0.000 description 1
- KXBCLNRMQPRVTP-UHFFFAOYSA-N 6-amino-1,5-dihydroimidazo[4,5-c]pyridin-4-one Chemical compound O=C1NC(N)=CC2=C1N=CN2 KXBCLNRMQPRVTP-UHFFFAOYSA-N 0.000 description 1
- DCPSTSVLRXOYGS-UHFFFAOYSA-N 6-amino-1h-pyrimidine-2-thione Chemical compound NC1=CC=NC(S)=N1 DCPSTSVLRXOYGS-UHFFFAOYSA-N 0.000 description 1
- QNNARSZPGNJZIX-UHFFFAOYSA-N 6-amino-5-prop-1-ynyl-1h-pyrimidin-2-one Chemical compound CC#CC1=CNC(=O)N=C1N QNNARSZPGNJZIX-UHFFFAOYSA-N 0.000 description 1
- CKOMXBHMKXXTNW-UHFFFAOYSA-N 6-methyladenine Chemical compound CNC1=NC=NC2=C1N=CN2 CKOMXBHMKXXTNW-UHFFFAOYSA-N 0.000 description 1
- LOSIULRWFAEMFL-UHFFFAOYSA-N 7-deazaguanine Chemical compound O=C1NC(N)=NC2=C1CC=N2 LOSIULRWFAEMFL-UHFFFAOYSA-N 0.000 description 1
- PFUVOLUPRFCPMN-UHFFFAOYSA-N 7h-purine-6,8-diamine Chemical compound C1=NC(N)=C2NC(N)=NC2=N1 PFUVOLUPRFCPMN-UHFFFAOYSA-N 0.000 description 1
- HRYKDUPGBWLLHO-UHFFFAOYSA-N 8-azaadenine Chemical compound NC1=NC=NC2=NNN=C12 HRYKDUPGBWLLHO-UHFFFAOYSA-N 0.000 description 1
- LPXQRXLUHJKZIE-UHFFFAOYSA-N 8-azaguanine Chemical compound NC1=NC(O)=C2NN=NC2=N1 LPXQRXLUHJKZIE-UHFFFAOYSA-N 0.000 description 1
- 229960005508 8-azaguanine Drugs 0.000 description 1
- RGKBRPAAQSHTED-UHFFFAOYSA-N 8-oxoadenine Chemical compound NC1=NC=NC2=C1NC(=O)N2 RGKBRPAAQSHTED-UHFFFAOYSA-N 0.000 description 1
- MSSXOMSJDRHRMC-UHFFFAOYSA-N 9H-purine-2,6-diamine Chemical compound NC1=NC(N)=C2NC=NC2=N1 MSSXOMSJDRHRMC-UHFFFAOYSA-N 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 241000256844 Apis mellifera Species 0.000 description 1
- 241000219195 Arabidopsis thaliana Species 0.000 description 1
- 241000239290 Araneae Species 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 240000002791 Brassica napus Species 0.000 description 1
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 1
- 241000244203 Caenorhabditis elegans Species 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 241000700199 Cavia porcellus Species 0.000 description 1
- 108091006146 Channels Proteins 0.000 description 1
- 241000195597 Chlamydomonas reinhardtii Species 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- 229920000858 Cyclodextrin Polymers 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 108010014080 DNA Polymerase gamma Proteins 0.000 description 1
- 102000016903 DNA Polymerase gamma Human genes 0.000 description 1
- 108010025600 DNA polymerase iota Proteins 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 102100029764 DNA-directed DNA/RNA polymerase mu Human genes 0.000 description 1
- 241000168726 Dictyostelium discoideum Species 0.000 description 1
- 241000255601 Drosophila melanogaster Species 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 241000724228 Enterobacteria phage RB69 Species 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 241000283073 Equus caballus Species 0.000 description 1
- 101001053577 Escherichia phage RB69 DNA-directed DNA polymerase Proteins 0.000 description 1
- 241001137858 Euryarchaeota Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- 229930186217 Glycolipid Natural products 0.000 description 1
- 241000711549 Hepacivirus C Species 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 241000725303 Human immunodeficiency virus Species 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 241000270322 Lepidosauria Species 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 108010052285 Membrane Proteins Proteins 0.000 description 1
- 102000018697 Membrane Proteins Human genes 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 101100172630 Mus musculus Eri1 gene Proteins 0.000 description 1
- 241000202934 Mycoplasma pneumoniae Species 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 241000009328 Perro Species 0.000 description 1
- 108010002747 Pfu DNA polymerase Proteins 0.000 description 1
- 241000223960 Plasmodium falciparum Species 0.000 description 1
- 241000233870 Pneumocystis Species 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 102000009609 Pyrophosphatases Human genes 0.000 description 1
- 108010009413 Pyrophosphatases Proteins 0.000 description 1
- 102000017143 RNA Polymerase I Human genes 0.000 description 1
- 108010013845 RNA Polymerase I Proteins 0.000 description 1
- 102000009572 RNA Polymerase II Human genes 0.000 description 1
- 108010009460 RNA Polymerase II Proteins 0.000 description 1
- 102000014450 RNA Polymerase III Human genes 0.000 description 1
- 108010078067 RNA Polymerase III Proteins 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 240000006394 Sorghum bicolor Species 0.000 description 1
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 1
- 241000191940 Staphylococcus Species 0.000 description 1
- 241000282898 Sus scrofa Species 0.000 description 1
- 101710137500 T7 RNA polymerase Proteins 0.000 description 1
- RZCIEJXAILMSQK-JXOAFFINSA-N TTP Chemical compound O=C1NC(=O)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 RZCIEJXAILMSQK-JXOAFFINSA-N 0.000 description 1
- 241001441723 Takifugu Species 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- 108010017842 Telomerase Proteins 0.000 description 1
- 241001441724 Tetraodontidae Species 0.000 description 1
- 241000589500 Thermus aquaticus Species 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- 238000005411 Van der Waals force Methods 0.000 description 1
- 108700002693 Viral Replicase Complex Proteins Proteins 0.000 description 1
- 241000726445 Viroids Species 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 241000269368 Xenopus laevis Species 0.000 description 1
- 235000007244 Zea mays Nutrition 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- 108010013829 alpha subunit DNA polymerase III Proteins 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- 150000001413 amino acids Chemical class 0.000 description 1
- 241000617156 archaeon Species 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007515 enzymatic degradation Effects 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 230000001973 epigenetic effect Effects 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 238000007672 fourth generation sequencing Methods 0.000 description 1
- 238000013412 genome amplification Methods 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 125000004029 hydroxymethyl group Chemical group [H]OC([H])([H])* 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000002218 isotachophoresis Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 229910021645 metal ion Inorganic materials 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000001668 nucleic acid synthesis Methods 0.000 description 1
- 125000003835 nucleoside group Chemical group 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 150000003904 phospholipids Chemical class 0.000 description 1
- 201000000317 pneumocystosis Diseases 0.000 description 1
- 230000037048 polymerization activity Effects 0.000 description 1
- 230000012743 protein tagging Effects 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 238000004153 renaturation Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000004448 titration Methods 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 229940075420 xanthine Drugs 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Health & Medical Sciences (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Genetics & Genomics (AREA)
- Immunology (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Analytical Chemistry (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
- Chemical Kinetics & Catalysis (AREA)
Abstract
Un método para determinar la secuencia de un ácido nucleico objetivo, que incluye los pasos de poner en contacto un ácido nucleico objetivo con una polimerasa que está asociada con un nanoporo para eliminar secuencialmente los trifosfatos de nucleótidos del ácido nucleico objetivo mediante pirofosforólisis; y distinguir las diferentes fracciones de base para los trifosfatos de nucleótidos que se eliminan, en donde las fracciones de base se distinguen por un cambio en la corriente en el nanoporo. (Traducción automática con Google Translate, sin valor legal)
Description
DESCRIPCIÓN
Secuenciación pirofosforolítica usando nanoporos
Antecedentes
Esta descripción se refiere generalmente al análisis de ácidos nucleicos, y más específicamente a la síntesis de ácidos nucleicos usando nanoporos.
Las plataformas disponibles comerciales actualmente para la secuenciación del ADN son relativamente costosas. Estas plataformas utilizan un enfoque de “secuenciación por síntesis” , llamado así porque los polímeros de ADN se sintetizan al detectar la adición de cada monómero (es decir, nucleótido) a la estructura del polímero en crecimiento. Debido a que una cadena de ADN molde dirige estrictamente la síntesis de un nuevo polímero de ADN, se puede inferir la secuencia del ADN molde a partir de la serie de monómeros de nucleótidos que se añadieron a la cadena en crecimiento durante la síntesis. La capacidad de detectar adiciones de monómeros se ve facilitada por variantes especialmente diseñadas de los componentes bioquímicos que normalmente llevan a cabo la síntesis de ADN en los sistemas biológicos. Estos componentes diseñados son caros de fabricar y se consumen en cantidades relativamente grandes durante la secuenciación por síntesis. Además, la monitorización de la reacción utiliza equipos relativamente caros, tales como láseres, ópticas de detección y sistemas complejos de suministro de fluidos. Las plataformas comerciales más exitosas hasta la fecha también requieren reactivos y equipos costosos para amplificar los moldes de ADN antes de que la secuenciación por síntesis pueda siquiera comenzar.
Se han considerado otros métodos de secuenciación para reducir el coste, aumentar la productividad y/o simplificar el proceso. Uno de estos enfoques se basa en hacer pasar una sola cadena de ADN a través de un nanoporo e identificar su secuencia a partir de la variación en la corriente iónica que fluye a través del poro a medida que pasa la cadena. Una alternativa a este enfoque de secuenciación “ nanoporo-cadena” es la secuenciación “ nanoporo-exonucleasa” , que implica la retirada catalizada por exonucleasas de monofosfatos de nucleótidos, de uno en uno, de una cadena de ADN y el paso secuencial de los monofosfatos de nucleótidos liberados a través de un nanoporo. Sin embargo, las variaciones resultantes en la corriente iónica que fluye a través de los nanoporos son bastante pequeñas y es difícil distinguir un nucleótido de otro. Se han realizado intentos para modificar el ADN antes de la digestión o para modificar los monofosfatos de nucleótidos una vez que se han liberado. Sin embargo, a pesar de estos esfuerzos, la secuenciación nanoporo-exonucleasa aún no se ha demostrado a un nivel comercialmente viable hasta la fecha.
Por lo tanto, existe la necesidad de plataformas más rentables, rápidas y prácticas que proporcionen una alternativa a las disponibles actualmente para la secuenciación de ácidos nucleicos. La presente descripción aborda esta necesidad y también proporciona otras ventajas.
Breve resumen
La presente invención es un método para determinar la secuencia de un ácido nucleico diana que comprende (a) proporcionar un ácido nucleico diana que tiene dos cadenas; (b) poner en contacto el ácido nucleico diana con una polimerasa unida a un nanoporo en condiciones para eliminar secuencialmente nucleótidos de la primera de las dos cadenas mediante pirofosforólisis y de esta manera producir secuencialmente trifosfatos de nucleótidos; y (c) distinguir los trifosfatos de nucleótidos producidos secuencialmente mediante la detección de cambios en la corriente que fluye a través del nanoporo.
La presente descripción también proporciona realizaciones no cubiertas por la invención, tales como un aparato que incluye (a) una barrera impermeable a los fluidos que separa un primer depósito de fluido de un segundo depósito de fluido; (b) un nanoporo colocado en la barrera impermeable a los fluidos para formar un paso a través del cual un trifosfato de nucleótido puede pasar del primer depósito de fluido al segundo depósito de fluido; y (c) una mezcla de reacción en el primer depósito de fluido, estando comprendida en la mezcla de reacción una polimerasa, un ácido nucleico diana que tiene dos cadenas, y una concentración pirofosforolítica de pirofosfato.
Breve descripción de los dibujos
La FIGURA 1 muestra un diagrama de una reacción de secuenciación pirofosforolítica que utiliza una polimerasa unida a un nanoporo.
La FIGURA 2 muestra un diagrama de una reacción de secuenciación pirofosforolítica que utiliza una polimerasa unida a un nanoporo y un ácido nucleico molde unido a una barrera impermeable a los fluidos.
La FIGURA 3 que muestra la secuenciación pirofosforolítica con siembra en membrana de múltiples moldes de ácido nucleico.
Descripción detallada
La presente descripción proporciona un método para secuenciar ácidos nucleicos en modo inverso en comparación con las técnicas estándar de secuenciación por síntesis (SBS). El método de la presente descripción aprovecha una función catalítica de la polimerasa conocida como pirofosforólisis que típicamente se considera culpable de artefactos no deseados en las técnicas de SBS. La pirofosforólisis da como resultado la retirada de los trifosfatos de nucleótidos de una cadena de ácido nucleico por una polimerasa, y como tal es lo inverso de la reacción de polimerización empleadas en las técnicas estándar de SBS.
La pirofosforólisis se puede distinguir de la actividad de la exonucleasa (que está presente en algunas polimerasas), por ejemplo, según el diferente mecanismo catalítico de las dos reacciones, los diferentes sitios activos en la estructura de la polimerasa donde se producen las dos reacciones, y los diferentes productos de las reacciones. Respecto al mecanismo catalítico y las diferencias en el sitio activo, se tiene conocimiento de que la actividad de la exonucleasa se puede eliminar de muchas especies de polimerasas mediante la deleción de ciertos dominios, mientras que se cree que la actividad de la pirofosforólisis está catalizada por el mismo dominio que cataliza la polimerización. Además, el ciclo de reacción catalizado por la exonucleasa es la conversión de ADN<n>(ADN de longitud n) en ADN<n-1>(ADN que es un nucleótido más corto que el ADN de longitud n) y un monofosfato de nucleótido. Por el contrario, un ciclo de pirofosforólisis produce ADN<n-1>y un trifosfato de nucleótido a partir de ADN<n>y pirofosfato. Notablemente, el pirofosfato se consume en una reacción de pirofosforólisis, pero no se consume en una reacción de exonucleasa.
Las realizaciones particulares de los métodos de secuenciación pirofosforolítica utilizan la detección de nanoporos. Los nanoporos se pueden utilizar para detectar secuencialmente los trifosfatos de nucleótidos que se liberan de un ácido nucleico para determinar la secuencia del ácido nucleico. Dichas realizaciones proporcionan una combinación de ventajas que típicamente solo se satisfacen parcialmente mediante la secuenciación de nanoporo-exonucleasa o la secuenciación nanoporo-cadena. Específicamente, los métodos de secuenciación pirofosforolítica de la presente descripción abordan algunos de los desafíos incurridos en la secuenciación nanoporo-exonucleasa, especialmente bajas probabilidades de captura y detección, al tiempo que conservan su principal ventaja sobre la secuenciación de cadenas, especialmente la resolución de una sola base. Esta ventaja se deriva del hecho de que la afinidad de los nanoporos por los monofosfatos de nucleótidos es bastante débil (del orden de afinidad micromolar), incluso en presencia de un adaptador de am6-ciclodextrina que se ha utilizado para mejorar la señal en algunos sistemas de nanoporos. Véase Clarke et al., Nat. Nanotechnol. abril;4(4):265-70 (2009). Para una distinción acertada de diferentes tipos de nucleótidos en un contexto de secuenciación, se desea una afinidad de rango nanomolar. El ATP tiene una afinidad que se encuentra en un buen rango, incluso sin la utilización de un adaptador en el poro. Véase Cheley et al., Chem. Biol. 9829-838 (2002). Sin pretender imponer ninguna teoría, se postula que la mejora de la afinidad del ATP sobre el monofosfato de nucleótido se debe a la triple carga negativa que transporta el ATP, lo que puede provocar que se una más fuertemente dentro del nanoporo. Además, la triple carga negativa puede ayudar a capturar la molécula en presencia de un campo eléctrico, especialmente cuando el campo es muy débil, como es el caso en el exterior del nanoporo, donde se liberan realmente los nucleótidos.
Además de la captura y detección mejoradas de los trifosfatos de nucleótidos, hay otras numerosas ventajas que pueden proporcionar las realizaciones expuestas en la presente memoria, tal como la utilización de una polimerasa en lugar de una exonucleasa. Se ha demostrado que las polimerasas forman un buen “ ajuste” con los nanoporos con el fin de la secuenciación nanoporo-cadena (Cherf et al., Nat. Biotech. 30:344-348 (2012); Manrao et al., Nat. Biotech. 30:349-353 (2012). Aún no se ha demostrado un ajuste similarmente bueno con exonucleasas. Además, el sustrato de las polimerasas es ADN bicatenario que generalmente no entra en el nanoporo. Por el contrario, el ADN monocatenario, el sustrato de la mayoría de exonucleasas, puede plantear el problema de entrar y bloquear el nanoporo. Finalmente, a diferencia de la secuenciación basada en exonucleasa o la secuenciación de cadenas basada en polimerasa, la velocidad de una reacción de secuenciación pirofosforolítica se puede controlar ajustando la concentración de pirofosfato.
Debe entenderse que los términos utilizados en la presente memoria adoptarán su significado habitual a menos que se especifique lo contrario. A continuación, se exponen ejemplos de varios términos utilizados en la presente memoria y sus definiciones.
Como se usa en la presente descripción, el término “ unido/a” pretende significar conectado por fuerzas que impiden la separación por difusión. El término puede incluir conexiones que son de naturaleza covalente o no covalente. Por ejemplo, dos proteínas pueden unirse covalentemente a través de su secuencia primaria (p. ej., un enlace peptídico o una fusión de proteínas) o entre sus secuencias primarias (p. ej., un enlace disulfuro o un enlace cruzado químico a través de grupos R de aminoácidos). Dos proteínas pueden unirse no covalentemente, por ejemplo, mediante uno o más enlaces de hidrógeno, enlaces iónicos, fuerzas de Van der Waals, enlaces hidrófobos o similares.
Como se utiliza en la presente memoria, el término “ cada uno” , cuando se utiliza en referencia a una colección de artículos, pretende identificar un artículo individual en la colección, pero no se refiere necesariamente a cada artículo de la colección. Puede haber excepciones si la descripción explícita o el contexto inequívocamente dictan lo contrario.
Como se utiliza en la presente memoria, el término “ actividad de la exonucleasa” pretende significar la hidrólisis del enlace fosfodiéster que une un nucleótido al extremo de un ácido nucleico de longitud n para producir un monofosfato de nucleótido y un ácido nucleico de longitud n-1. La hidrólisis puede producirse en el enlace que une el nucleótido 5' al ácido nucleico (es decir, la actividad de la exonucleasa 5' a 3') o en el enlace que une el nucleótido 3' al ácido nucleico (es decir, la actividad de la exonucleasa 3' a 5').
Como se utiliza en la presente memoria, el término “ barrera impermeable a los fluidos” pretende significar cualquier elemento que impida el paso de un fluido. Por ejemplo, una barrera impermeable a los fluidos puede estar presente entre dos depósitos de manera que un fluido contenido en el primer depósito esté separado del fluido contenido en el segundo depósito, y los fluidos no se mezclen. Una barrera impermeable a los fluidos puede incluir un poro o abertura que permita el paso de un fluido que de cualquier otra manera estaría obstruido por el resto de la barrera. En realizaciones particulares, el fluido puede ser un fluido acuoso y la barrera puede ser impermeable a los fluidos acuosos.
Como se utiliza en la presente memoria, el término “carece de actividad de exonucleasa” pretende significar que no tiene actividad medible de exonucleasa. Por ejemplo, una polimerasa u otro agente que carece de actividad de exonucleasa 3' a 5' no tendrá actividad medible de exonucleasa 3' a 5'. Similarmente, una polimerasa u otro agente que carece de actividad de exonucleasa 5' a 3' no tendrá actividad medible de exonucleasa 5' a 3'. Las polimerasas conocidas en la técnica como “exo menos” (o “ exo-” ), ya sean naturales o diseñadas, son ejemplos no limitativos de polimerasas que carecen de actividad de exonucleasa. Las variantes conocidas incluyen aquellas que son 5' a 3' exo menos y/o 3' a 5' exo menos.
Como se utiliza en la presente memoria, el término “ nanoporo” pretende significar un pequeño orificio que permite el paso de los trifosfatos de nucleótidos a través de una barrera que de cualquier otra manera sería impermeable. La barrera es típicamente una capa eléctricamente aislante y el nanoporo típicamente permite que los iones fluyan de un lado de la barrera al otro, impulsados por un potencial aplicado. El nanoporo permite preferentemente que los nucleótidos fluyan a través de la luz del nanoporo a lo largo del potencial aplicado. El nanoporo también puede permitir que un ácido nucleico, tal como el ADN o el a Rn , sea empujado o arrastrado a través de la luz del nanoporo. Sin embargo, en realizaciones particulares, el nanoporo no necesita permitir el paso de un ácido nucleico bicatenario o monocatenario. Un nanoporo utilizado en una realización particular puede tener un diámetro de luz mínimo de no más de 10 nm, 5 nm, 4 nm, 3 nm, 2 nm, 1 nm, 0,5 nm o menos. Un tipo de nanoporo es un “ nanoporo de proteína” , que es un polipéptido o una colección de polipéptidos que forma el pequeño orificio que permite el paso de los trifosfatos de nucleótidos a través de una barrera tal como una bicapa lipídica. Entre los ejemplos de nanoporos de proteína se incluyen los nanoporos de alfa hemolisina, porina A deMycobactenum smegmatis(MspA) y variantes de los mismos. Otro tipo de nanoporo es un “ nanoporo en estado sólido” , que es un pequeño orificio fabricado a través de un material sólido. El material sólido puede ser, por ejemplo, grafeno o silicio.
Como se utiliza en la presente memoria, el término “ nucleótido” pretende incluir los ribonucleótidos, desoxinucleótidos o análogos de los mismos. Por ejemplo, el término se usa en la presente memoria para referirse generalmente a un resto de nucleósido (ya sea ribosa, desoxirribosa o un análogo de las mismas) que incluye un resto de base y opcionalmente unido a uno o más restos de fosfato. Los nucleótidos ilustrativos incluyen, aunque no de forma limitativa, monofosfato de ribonucleótido (a veces denominado monofosfato de ribonucleósido), difosfato de ribonucleótido (a veces denominado difosfato de ribonucleósido), trifosfato de ribonucleótido (a veces denominado trifosfato de ribonucleósido), monofosfato de desoxinucleótido (a veces denominado monofosfato de desoxinucleósido), difosfato de desoxinucleótido (a veces denominado difosfato de desoxinucleósido) y trifosfato de desoxinucleótido (a veces denominado trifosfato de desoxinucleósido). Para mayor claridad a la hora de distinguir los componentes de ARN de los componentes de ADN, el término “ ribonucleótido” puede utilizarse para especificar nucleótidos de ARN, tales como trifosfato de ribouridina, trifosfato de riboguanidina, trifosfato de ribocitidina o trifosfato de riboadenosina; y el término “ desoxinucleótido” puede utilizarse para especificar nucleótidos de ADN, tales como trifosfato de desoxitimidina, trifosfato de desoxiguanidina, trifosfato de desoxicitidina y trifosfato de desoxiadenosina. En realizaciones particulares, los nucleótidos son “ extensibles” , por ejemplo, carecen de un resto que bloquee la extensión en el hidroxilo 3' o en cualquier otra posición del nucleótido.
Como se utiliza en la presente memoria, el término “ pirofosforólisis” pretende significar la reacción entre el pirofosfato y la unidad 3'-nucleotido de un ácido nucleico para liberar el nucleótido en forma del trifosfato de nucleótido correspondiente. Otro producto de la reacción es el ácido nucleico que carece del nucleótido correspondiente (es decir, la reacción convierte un ácido nucleico de longitud n en un ácido nucleico de longitud n-1). La reacción típicamente está catalizada por una polimerasa y es la inversa de la reacción de polimerización llevada a cabo por la polimerasa en condiciones biológicas estándar.
Como se utiliza en la presente memoria, el término “ concentración pirofosforolítica” , cuando se usa en referencia al pirofosfato, pretende significar una concentración de pirofosfato que provoca que se produzca una reacción de pirofosforólisis a un nivel sustancial. Por ejemplo, una concentración pirofosforolítica de pirofosfato puede dar como resultado que una polimerasa muestre una mayor velocidad de pirofosforólisis que de polimerización. Por lo tanto, una concentración pirofosforílica de pirofosfato puede dar como resultado una inversión sustancial de la actividad de polimerización que de cualquier otra manera sería catalizada por una polimerasa.
Como se utiliza en la presente memoria, el término “ depósito” pretende significar un receptáculo o cámara para contener o restringir el flujo de fluido. Un depósito puede estar totalmente cerrado, al menos temporalmente. Alternativamente, un depósito puede estar parcialmente cerrado, por ejemplo, que tenga una o más aberturas (p. ej., una o más entradas o salidas). Un fluido puede fluir a través de un depósito, por ejemplo, en realizaciones en los que el depósito está en una célula de flujo.
Como se utiliza en la presente memoria, el término “ especie” se usa para identificar moléculas que comparten la misma estructura química. Por ejemplo, una mezcla de nucleótidos puede incluir varias moléculas de dCTP. Se entenderá que las moléculas de dCTP son de la misma especie entre sí. Similarmente, las moléculas de ADN individuales que tienen la misma secuencia de nucleótidos son de la misma especie.
Las realizaciones expuestas a continuación y mencionadas en las reivindicaciones pueden entenderse en vista de las definiciones anteriores.
La presente descripción proporciona un método para determinar la secuencia de un ácido nucleico diana tal como se define en las reivindicaciones.
Se muestra una realización ilustrativa en laFIGURA 1.Como se muestra, una polimerasa se une a una molécula de ADN bicatenario y, en presencia de pirofosfato en exceso, cataliza una reacción de pirofosforólisis para liberar trifosfatos de nucleótidos del extremo 3' de una de las cadenas. En este ejemplo, se ha producido trifosfato de desoxiguanidina seguido de trifosfato de desoxitimidina. La polimerasa está acoplada a un nanoporo y el trifosfato de desoxiguanidina está en la luz del nanoporo, mientras que el trifosfato de desoxitimidina está en proceso de ser liberado en la luz del nanoporo. Por tanto, los trifosfatos de desoxinucleótidos entran en el nanoporo secuencialmente, en el mismo orden en que fueron liberados de la cadena de ADN por la acción pirofosforolítica de la polimerasa. Los trifosfatos de desoxinucleótidos tienen una carga neta negativa debido a los trifosfatos y son conducidos a través del nanoporo por un potencial a través de la membrana (como indican el signo positivo en el lado de la membrana donde se produce la pirofosforólisis y un signo negativo en el lado opuesto de la membrana). De forma típica, los trifosfatos de nucleótidos reactivos no están presentes en una reacción de pirofosforólisis. En algunos casos, pueden estar presentes trazas de trifosfatos de nucleótidos, pero en cantidades que no catalizan sustancialmente una reacción de extensión del cebador directo por la polimerasa. Por lo tanto, en la mayoría de las realizaciones, los únicos trifosfatos de nucleótidos que están sustancialmente presentes en una reacción de pirofosforólisis son los producidos por la acción catalítica de la polimerasa en el ácido nucleico.
Una reacción similar se ilustra en laFIGURA 2salvo que la cadena molde (es decir, la cadena que no se está escindiendo por pirofosforólisis) está unida a la membrana. En este caso, la cadena molde tiene un resto de esterol unido covalentemente (p. ej., colesterol) que se une al interior hidrófobo de la bicapa lipídica de la membrana.
Un método de la presente descripción se puede utilizar con cualquiera de una variedad de ácidos nucleicos diana. El ácido nucleico diana puede tener una estructura natural como la que se encuentra, por ejemplo, en el ADN o el ARN. El ADN contiene naturalmente monómeros que tienen bases de timina, guanina, citosina o adenina. Una cadena de ADN que se somete a pirofosforólisis puede producir trifosfato de desoxitimidina, trifosfato de desoxiguanidina, trifosfato de desoxicitidina y trifosfato de desoxiadenosina, respectivamente. El ADN también puede contener algunas variantes de las cuatro bases nucleotídicas tales como 5-metilcitosina, 5-hidroximetilcitosina y otras bases metiladas. Los trifosfatos de desoxinucleótidos que tienen estas bases variantes pueden producirse y/o detectarse con un método o aparato expuesto en la presente memoria. Por ejemplo, la presencia o ausencia de metilación en la citosina se puede distinguir para facilitar los análisis epigenéticos. El ARN contiene naturalmente monómeros que tienen bases de uracilo, guanina, citosina o adenina. Una cadena de ARN que se somete a pirofosforólisis puede producir trifosfato de ribouridina, trifosfato de riboguanidina, trifosfato de ribocitidina o trifosfato de riboadenosina, respectivamente.
Un ácido nucleico puede incluir modificaciones no naturales, tales como bases no nativas, modificaciones en los restos de fosfato o modificaciones en los restos de azúcares. Las bases no nativas ilustrativas que pueden incluirse en un ácido nucleico, tanto si tiene una cadena principal natural como una estructura análoga, incluyen, aunque no de forma limitativa, inosina, xantina, hipoxantina, isocitocina, isoguanina, 2-aminoadenina, 6-metil adenina, 6-metil guanina, 2-propil guanina, 2-propil adenina, 2-tiouracilo, 2-tiotimina, 2-tiocitosina, 15-halouracilo, 15-halocitosina, 5-propinil uracilo, 5-propinil citosina, 6-azo uracilo, 6-azo citosina, 6-azo timina, 5-uracilo, 4-tiouracilo, 8-halo adenina o guanina, 8-amino adenina o guanina, 8-tiol adenina o guanina, 8-tioalquil adenina o guanina, 8-hidroxil adenina o guanina, uracilo o citosina sustituido con 5-halo, 7-metilguanina, 7-metiladenina, 8-azaguanina, 8-azaadenina, 7-deazaguanina, 7-deazaadenina, 3-deazaguanina, 3-deazaadenina o similares.
Las bases no nativas se pueden seleccionar, por ejemplo, para transmitir un tamaño mayor o menor, o para transmitir una carga aumentada o disminuida, a fin de influir en la capacidad de los análogos de trifosfato de nucleótido resultantes para ser distinguidos por un nanoporo u otro componente de detección. Similarmente, tales bases pueden ser beneficiosas si se seleccionan para transmitir una velocidad deseada de pirofosforólisis. Las bases no nativas se pueden incorporar a un ácido nucleico mediante métodos conocidos tales como la amplificación o replicación de un ácido nucleico molde en presencia de los análogos de nucleótidos. Una o más de las copias de ácido nucleico resultantes se pueden utilizar a continuación como ácido(s) nucleico(s) diana en el aparato o método de secuenciación expuesto en la presente memoria.
En realizaciones particulares, un ácido nucleico que se utiliza en un método o aparato expuesto en la presente memoria carecerá de una o más de las bases no nativas u otros restos no nativos expuestos en la presente memoria. Por ejemplo, en realizaciones particulares, los métodos no se utilizan para eliminar un nucleótido terminador del extremo 3' de una cadena de ácido nucleico. En consecuencia, en algunas realizaciones, un aparato o método puede no incluir ningún ácido nucleico que tenga un nucleótido terminador en su extremo 3'. Alternativamente o de forma adicional, en algunas realizaciones, un aparato o método puede no incluir ningún nucleótido terminador.
Como se ilustra en laFIGURA 1y en cualquier otro sitio de la presente memoria, un ácido nucleico diana puede ser ADN bicatenario, por ejemplo, cuando se usa ADN-polimerasa para la pirofosforólisis. También se puede utilizar un heterodúplex, formado entre una cadena de ADN y una cadena de ARN. Por ejemplo, se puede utilizar ARN-polimerasa para catalizar la pirofosforólisis en el extremo 3' de una cadena de ARN que se hibrida con una cadena molde de<a>D<n>, produciendo de esta manera trifosfatos de ribonucleótidos.
Un ácido nucleico que se usa en un método o aparato en la presente memoria puede aislarse de una fuente biológica y utilizarse directamente o procesarse para producir un producto amplificado o modificado. Alternativamente, se puede usar un ácido nucleico sintético, de nuevo, directamente o después del procesamiento. El procesamiento puede incluir, por ejemplo, uno o más aislamientos a partir de componentes naturales, escisión para formar fragmentos, amplificación (p. ej., mediante PCR, círculo rodante u otras técnicas conocidas), ligadura de secuencias adaptadoras o secuencias de etiquetas, tagmentación mediante un transposón o métodos de “ preparación de muestras” utilizados antes de las técnicas de secuenciación de ácidos nucleicos. En la técnica, se conocen técnicas de procesamiento útiles tal como se expone, por ejemplo, en Sambrook et al., Molecular Cloning: A Laboratory Manual, 3.a edición, Cold Spring Harbor Laboratory, Nueva York (2001) o en Ausubel et al., Current Protocols in Molecular Biology, John Wiley and Sons, Baltimore, Md. (1998).
Entre los ejemplos de métodos de preparación de muestras que se pueden utilizar para procesar ácidos nucleicos antes de la secuenciación basada en pirofosforólisis, se incluyen métodos que se han desarrollado para la amplificación del genoma completo o la amplificación del exoma completo junto con técnicas de secuenciación paralela masiva. Por ejemplo, se pueden usar técnicas de preparación de muestras disponibles comercialmente de Illumina, Inc. (San Diego, CA), Life Technologies (Carlsbad, CA), 454 Life Sciences (una filial de Roche, Basilea, Suiza) o New England Biolabs (Ipswich, MA). Otros métodos útiles de preparación de muestras que se pueden utilizar se describen, por ejemplo, en las patentes de E<e>. UU. núm.6.107.023 o 7.74l .463; o la publicación de solicitud de patente de EE. UU. núm.2010/0120098 A1. También se pueden usar métodos de preparación de muestras dirigidos para aislar un subconjunto del contenido de secuencia de una muestra compleja para su posterior secuenciación. Los ejemplos de métodos comerciales que pueden utilizarse para la captura dirigida de un subconjunto de fragmentos de ácido nucleico incluyen, aunque no de forma limitativa, los kits SureSelect™ (Agilent, Santa Clara, CA), los kits de enriquecimiento TruSeq® (Illumina, Inc., San Diego, CA) o los kits de enriquecimiento Nextera® (Illumina, Inc., San Diego, CA).
Los ácidos nucleicos pueden aislarse de cualquiera de una variedad de fuentes que incluyen, aunque no de forma limitativa, un mamífero tal como un roedor, ratón, rata, conejo, cobaya, ungulado, caballo, oveja, cerdo, cabra, vaca, gato, perro, primate, humano o primate no humano; una planta, tal comoArabidopsis thaliana,maíz(Zea mays),sorgo, avena(Oryza sativa),trigo, arroz, colza o soja; un alga tal comoChlamydomonas reinhardtii;un nematodo tal comoCaenorhabditis elegans;un insecto, tal comoDrosophila melanogaster,mosquito, mosca de la fruta, abeja melífera o araña; un pez, tales como el pez cebra(Danio reno);un reptil; un anfibio tal como una rana oXenopus laevis;unDictyostelium discoideum;un hongo tal comoPneumocystis cannii, Takifugu rubnpes,levadura,Saccharamoyces cerevisiaeoSchizosaccharomyces pombe;o unPlasmodium falciparum.Los ácidos nucleicos también pueden obtenerse de genomas más pequeños tal como los de un organismo procariota tal como una bacteria,Eschenchia coli, staphylococcioMycoplasma pneumoniae;una arquea; un virus tal como el virus de la hepatitis C o el virus de la inmunodeficiencia humana; o un viroide.
Cualquiera de una variedad de polimerasas se puede utilizar en un método o aparato expuesto en la presente memoria; incluyen, por ejemplo, enzimas basadas en proteínas aisladas de sistemas biológicos y variantes funcionales de las mismas. Se entenderá que la referencia a una polimerasa particular, tales como las que se ilustran a continuación, incluye variantes funcionales de la misma, salvo que se indique lo contrario. Los ejemplos de polimerasas útiles incluyen las ADN-polimerasas y las ARN-polimerasas. Las ADN-polimerasas ilustrativas incluyen aquellas que se han clasificado por homología estructural en familias identificadas como A, B, C, D, X, Y y<r>T. Las ADN-polimerasas de la familia A incluyen, por ejemplo, ADN-polimerasa T7, ADN-polimerasa<y>mitocondrial eucariótica, ADN Pol I deE. coli, Thermus aquaticusPol I, yBacillus stearothermophilusPol I. Las ADN-polimerasas de la familia B incluyen, por ejemplo, ADN-polimerasas eucarióticas a, 8, y £; ADN-polimerasa Z; ADN-polimerasa T4, ADN-polimerasaPhi29,y ADN-polimerasa de bacteriófago RB69. La familia C incluye, por ejemplo, la subunidad ADN-polimerasa III alfa de E.coli.La familia D incluye, por ejemplo, polimerasas derivadas del subdominio Euryarchaeota de Archaea. Las ADN-polimerasas de la familia X incluyen, por ejemplo, las polimerasas eucarióticas Pol p, pol a, Pol A y Pol |j, y Pol4 de S.cerevisiae.Las ADN-polimerasas de la familia Y incluyen, por ejemplo, Pol n, Pol iota, Pol kappa, Pol IV deE. coli(DINB) y Pol V de E.coli(UmuD'2C). La familia RT (transcriptasa inversa) de ADN-polimerasas incluye, por ejemplo, transcriptasas inversas de retrovirus y telomerasas eucarióticas. Las ARN-polimerasas ilustrativas incluyen, aunque no de forma limitativa, ARN-polimerasas víricas tales como ARN-polimerasa T7; ARN-polimerasas eucarióticas tales como ARN-polimerasa I, ARN-polimerasa II, ARN-polimerasa III, ARN-polimerasa IV y ARN-polimerasa V; y ARN-polimerasa de Archaea.
Las clasificaciones anteriores se proporcionan con fines ilustrativos. Se entenderá que las variaciones en el sistema de clasificación son posibles. Por ejemplo, en al menos un sistema de clasificación, las polimerasas de la familia C se han categorizado como una subcategoría de la familia X. Además, las polimerasas se pueden clasificar de acuerdo con otras características, ya sean funcionales o estructurales, que se pueden solapar o no con las características estructurales ilustradas anteriormente. A continuación, se exponen algunas características ilustrativas con mayor detalle.
Muchas polimerasas tienen una actividad de exonucleasa de corrección 3' a 5' intrínseca que puede ser útil en algunas realizaciones. En algunas realizaciones, se prefieren las polimerasas que carecen sustancialmente de actividad de la exonucleasa de corrección 3' a 5', por ejemplo, en la mayoría de realizaciones de secuenciación. La ausencia de actividad de la exonucleasa puede ser una característica de tipo natural o una característica transmitida por una variante o polimerasa diseñada. Por ejemplo, el fragmento de Klenow exo menos es una versión mutada del fragmento de Klenow que carece de actividad de exonucleasa de corrección 3' a 5'. El fragmento de Klenow y su variante exo menos pueden ser útiles en un método o aparato expuesto en la presente memoria. Las polimerasas que catalizan la pirofosforólisis, la inversión directa de la polimerización en el mismo sitio activo, son particularmente útiles.
Dependiendo de la realización que se vaya a usar, una polimerasa puede ser termófila o inactivable por calor. Las polimerasas termófilas son típicamente útiles para condiciones de alta temperatura o en condiciones de termociclado tales como las empleadas para las técnicas de reacción en cadena de la polimerasa (PCR). Los ejemplos de polimerasas termófilas incluyen, aunque no de forma limitativa, ADN-polimerasa 9°N, ADN-polimerasa Taq, ADN-polimerasa Phusion®, ADN-polimerasa Pfu, ADN-polimerasa RB69, ADN-polimerasa KOD y ADN-polimerasa VentR®. La mayoría de polimerasas aisladas de organismos no termófilos son inactivables por calor. La inactivación por calor puede ser útil para detener una reacción de secuenciación expuesta en la presente memoria. La reacción puede reiniciarse opcionalmente añadiendo un nuevo suministro de polimerasa a la reacción a la temperatura permisiva apropiada. Los ejemplos de polimerasas inactivables por calor son las de los fagos. Se entenderá que las polimerasas de cualquiera de una variedad de fuentes se pueden modificar para aumentar o disminuir su tolerancia a condiciones de alta temperatura.
Se puede usar una variante diseñada de una polimerasa que tenga una actividad de pirofosforólisis aumentada. Las variantes ilustrativas son aquellas que se han creado para su uso en técnicas de PCR, incluidas, aunque no de forma limitativa, las variantes descritas en la patente de EE. UU. núm. 8.071.536.
Se puede inducir una polimerasa para eliminar secuencialmente los nucleótidos de una de las dos cadenas de ácido nucleico mediante pirofosforólisis en un método expuesto en la presente memoria. La polimerasa se puede colocar en condiciones para que se produzca la pirofosforólisis. Por ejemplo, la polimerasa puede ponerse en contacto con un ácido nucleico bicatenario y una concentración pirofosforolítica de pirofosfato. Se puede utilizar una concentración de pirofosfato que provoque que se produzca una reacción de pirofosforólisis a un nivel sustancial, incluido, aunque no de forma limitativa, al menos aproximadamente 100 pM de pirofosfato. Se pueden emplear concentraciones más altas de pirofosfato, por ejemplo, para impulsar la pirofosforólisis a una velocidad mayor. En consecuencia, se puede usar una concentración de al menos aproximadamente 250 pM de pirofosfato, al menos aproximadamente 500 pM de pirofosfato, al menos aproximadamente 750 pM de pirofosfato, al menos aproximadamente 1 mM de pirofosfato, al menos aproximadamente 2 mM de pirofosfato, al menos aproximadamente 5 mM de pirofosfato, al menos aproximadamente 10 mM de pirofosfato, al menos aproximadamente 20 mM de pirofosfato o superior.
La capacidad de alterar la velocidad de la pirofosforólisis es una ventaja para ajustar la velocidad de la reacción de secuenciación, por ejemplo, para acomodar una velocidad óptima o deseada de detección de trifosfato de nucleótidos para un dispositivo de detección dado. Por ejemplo, la velocidad de pirofosforólisis se puede disminuir mediante una concentración menor de pirofosfato que las expuestas anteriormente. Por lo tanto, como alternativa o adición a las concentraciones umbral expuestas anteriormente, una concentración máxima de pirofosfato presente en un aparato o método expuesto en la presente memoria puede ser como máximo aproximadamente 20 mM de pirofosfato, como máximo aproximadamente 10 mM de pirofosfato, como máximo aproximadamente 5 mM de pirofosfato, como máximo aproximadamente 2 mM de pirofosfato, como máximo aproximadamente 1 mM de pirofosfato, como máximo aproximadamente 750 pM de pirofosfato, como máximo aproximadamente 500 pM de pirofosfato, como máximo aproximadamente 250 pM de pirofosfato, como máximo aproximadamente 100 pM de pirofosfato, o menos.
Los trifosfatos de nucleótidos reactivos típicamente están ausentes en condiciones de pirofosforólisis. Por lo tanto, en la mayoría de las realizaciones, los únicos trifosfatos de nucleótidos que están sustancialmente presentes en una reacción de pirofosforólisis son los producidos por la acción catalítica de la polimerasa en el ácido nucleico. Si los trifosfatos de nucleótidos están presentes en condiciones de pirofosforólisis, los trifosfatos de nucleótidos estarán presentes en lo que se puede considerar una concentración no catalítica. Una concentración no catalítica de trifosfato de nucleótido es una concentración que es insuficiente para permitir que se produzca una actividad de extensión de la polimerasa sustancial o detectable. Por ejemplo, una concentración no catalítica de trifosfato de nucleótido es una concentración que está sustancialmente por debajo de la constante de unión de asociación para la unión de los trifosfatos de nucleótidos a la polimerasa. En consecuencia, la pirofosforólisis se puede llevar a cabo poniendo en contacto una polimerasa con un ácido nucleico bicatenario en presencia de una concentración pirofosforolítica de pirofosfato y no más de una concentración no catalítica de trifosfato de nucleótido.
Las condiciones ilustrativas para inducir la pirofosforólisis que se pueden utilizar en la presente memoria se exponen en Patel et al. Biochem. 30:511-525 (1991), o la patente de EE. UU. núm. 7.090.975; 7.914.995 o 8.071.536. En varios casos, estas referencias describen reacciones que también incluyen componentes utilizados para la extensión de un ácido nucleico. Se entenderá que la extensión no se utiliza en realizaciones particulares de la presente descripción. Uno o más de los componentes que se describen en Patel et al. Biochem. 30:511-525 (1991) o la patente de<e E .>UU. núm. 7.090.975; 7.914.995 o 8.071.536, incluidos, por ejemplo, los componentes utilizados para la reacción de extensión de la polimerasa, pueden excluirse de un método o aparato expuesto en la presente memoria.
Los tampones, sales, iones de metal, glicerol, DMSO y otros componentes típicamente incluidos en las mezclas de reacción o almacenamiento de la polimerasa se pueden incluir en un aparato o método de la presente descripción, según se desee. Las cantidades y proporciones de componentes que se van a incluir resultarán evidentes para los expertos en la técnica o se podrán determinar, por ejemplo, mediante técnicas de valoración volumétrica habituales.
Un aspecto beneficioso de algunas realizaciones es la capacidad de detener o pausar el método de secuenciación alterando las condiciones de reacción para inhibir la pirofosforólisis. El método de secuenciación puede reiniciarse después opcionalmente, alterando las condiciones de reacción para permitir que se reanude la pirofosforólisis. Cualquiera de una variedad de condiciones de reacción expuestas en la presente memoria, o en las referencias citadas en la presente memoria, puede alterarse entre la pirofosforólisis pausada y la pirofosforólisis reanudada, permitiéndose de esta manera un cambio efectivo entre la secuenciación pausada y la activa, respectivamente.
En realizaciones particulares, un método de la presente descripción puede incluir una etapa para pausar la producción secuencial de trifosfatos de nucleótidos al hacer que el pirofosfato deje de estar en contacto con una polimerasa que está catalizando la pirofosforólisis, seguida de una etapa para reanudar la producción secuencial de los trifosfatos de nucleótidos poniendo en contacto la polimerasa con pirofosfato. El pirofosfato se puede suministrar a una reacción mediante técnicas apropiadas para el sistema de fluido que se utiliza, incluido, por ejemplo, pipetear alícuotas de fluido, mover bolos de fluido bajo presión positiva o negativa (p. ej., mediante bombas o gravedad), electroforesis, isotacoforesis, manipulación de gotículas (p. ej., electrohumectación) o similares. Se pueden usar técnicas fluídicas similares para eliminar el pirofosfato, por ejemplo, mediante desplazamiento y/o reemplazo con una solución de lavado. Por supuesto, tales técnicas fluídicas se pueden utilizar para añadir o eliminar otros componentes utilizados en los métodos y aparatos expuestos en la presente memoria.
Alternativamente o de forma adicional a los métodos fluídicos expuestos anteriormente, el pirofosfato se puede eliminar de la reacción mediante secuestro, degradación o inactivación. Por ejemplo, se pueden usar manipulaciones físicas tales como la adsorción a un agente secuestrante o la degradación por calor, luz o electricidad. Se pueden utilizar métodos químicos para modificar la estructura o actividad del pirofosfato o para degradar la molécula. También se pueden utilizar métodos enzimáticos, tales como la degradación por pirofosfatasa, como se muestra para las reacciones de PCR en EE. UU. 4.800.159 y EE. UU. 5.498.523 y para las reacciones de secuenciación basadas en gel en EE. UU. 4.962.020.
Alternativamente o de forma adicional a las técnicas expuestas anteriormente, la pirofosforólisis se puede detener o pausar al eliminar otros componentes de la reacción. Por ejemplo, la polimerasa puede eliminarse de una reacción y opcionalmente reemplazarse o devolverse a un estado activo. Por ejemplo, la polimerasa se puede eliminar mediante métodos fluídicos, secuestro, degradación o inactivación, tales como los ilustrados anteriormente para el pirofosfato. En realizaciones particulares, puede utilizarse una polimerasa sensible al calor (no termófila) en una reacción de pirofosforólisis y, después, inactivarse por calor. Similarmente, una polimerasa se puede degradar mediante modificación química o degradación enzimática (p. ej., mediante una proteasa). Ya sea degradada mediante técnicas físicas, químicas o enzimáticas, la polimerasa agotada se puede eliminar por lavado y, a continuación, se puede reanudar la pirofosforólisis mediante la adición de polimerasa nueva al ácido nucleico que se está secuenciando. La actividad de la polimerasa también se puede alternar mediante la adición y retirada de inhibidores, alternando entre temperaturas permisivas y no permisivas para las polimerasas termoestables, o mediante la presencia y ausencia de un agente secuestrante o sustrato competitivo. La pirofosforólisis también se puede detener e iniciar mediante la desnaturalización y la renaturalización, respectivamente, del ácido nucleico que se está secuenciando.
Aunque en la presente memoria se han ilustrado métodos y aparatos para realizaciones que utilizan pirofosfato para impulsar la pirofosforólisis, se entenderá que se pueden utilizar análogos del pirofosfato en su lugar. Un análogo ilustrativo es el pirovanadato, que puede utilizarse, por ejemplo, como se describe en Akabayov et al. J. Biol. Chem.
286:29146-29157 (2011). Como ejemplos adicionales, se pueden usar análogos de pirofosfato que tengan restos adicionales. Generalmente, se seleccionan análogos de pirofosfato que no inhiban completamente la pirofosforólisis o el paso de los trifosfatos de nucleótidos resultantes, o análogos de los mismos, a través de un nanoporo. Sin embargo, los análogos de pirofosfato pueden alterar las características de la pirofosforólisis y/o la detección de nanoporos. Por ejemplo, puede ser beneficioso utilizar un análogo de pirofosfato para ralentizar o acelerar la pirofosforólisis para proporcionar una velocidad de detección deseada u óptima. Similarmente, los análogos de los trifosfatos de nucleótidos que se producen cuando se utiliza un análogo de pirofosfato en una reacción de pirofosforólisis también pueden transmitir las características deseadas para la detección de nanoporos. Por ejemplo, los restos que alteran la carga o el tamaño, en comparación con el difosfato por sí solo, pueden aumentar o disminuir la velocidad de paso de los análogos de trifosfato de nucleótido a través de un nanoporo, o alterar de cualquier otra manera las interacciones de los análogos de trifosfato de nucleótido con el nanoporo, para proporcionar mejores resultados de secuenciación.
Sin embargo, en algunas realizaciones, un método o aparato de la presente descripción excluirá el pirofosfato que tenga cualquier resto añadido. Por ejemplo, se puede utilizar pirofosfato que carezca de un resto ópticamente detectable, tal como un resto fluorescente.
En realizaciones particulares, los trifosfatos de nucleótidos se detectan mediante nanoporos. Por ejemplo, los trifosfatos de nucleótidos que se eliminan secuencialmente de un ácido nucleico mediante pirofosforólisis pueden hacerse pasar a través de un nanoporo para su detección. Mediante el uso de un nanoporo apropiado, se pueden distinguir diferentes restos de bases de trifosfatos de nucleótidos para permitir la detección de secuencias. Generalmente se puede utilizar un aparato que incluye un primer y un segundo compartimento separados por una barrera física, donde la barrera tiene uno o más nanoporos. El primer compartimento puede incluir componentes utilizados para una reacción de pirofosforólisis. El aparato se puede configurar para aplicar un campo eléctrico a través de la barrera, de modo que los trifosfatos de nucleótidos sean conducidos desde el primer compartimento a través del poro hasta el segundo compartimento. El aparato puede configurarse para medir la firma electrónica de un trifosfato de nucleótido que pasa a través del nanoporo. En consecuencia, un aparato útil puede incluir un circuito eléctrico capaz de aplicar un potencial y medir una señal eléctrica a través de una barrera y un nanoporo. Los métodos pueden llevarse a cabo mediante fijación en parche de membrana o fijación de voltaje.
Un método de la presente descripción puede llevarse a cabo mediante cualquier sistema adecuado en el que un poro penetre a través de una barrera. La barrera en muchas realizaciones es preferiblemente una bicapa lipídica. Las bicapas lipídicas se pueden fabricar con métodos conocidos en la técnica, por ejemplo, como se describe en Montal y Mueller Proc. Natl. Acad. Sci. USA 69:3561-3566 (1972) o WO 2008/102120. Las bicapas lipídicas se pueden formar a partir de cualquiera de una variedad de lípidos, incluidos, aunque no de forma limitativa, fosfolípidos, glicolípidos, colesterol y mezclas de estos.
Los nanoporos ilustrativos que se pueden utilizar incluyen, por ejemplo, nanoporos basados en proteínas tales como el nanoporo de alfa hemolisina, porina A deMycobacterium smegmatis(MspA) y variantes de los mismos. El nanoporo de alfa hemolisina y las variantes del nanoporo natural que son particularmente útiles se describen, por ejemplo, en la publicación de solicitud de patente de EE. UU. núm. 2011/0229877 A1, o las patentes de EE.<U u .>núm. US 6.916.665; 7.867.716; 7.947.454; o 8.105.846. MspA y las variantes del nanoporo natural que son particularmente útiles se describen, por ejemplo, en la publicación de solicitud de patente de EE. UU. núm.
2012/0055792 A1. Los nanoporos en estado sólido también pueden ser útiles, incluidos, por ejemplo, los descritos en las patentes de EE. UU. núm. 6.413.792; 7.444.053; o 7.582.490.
La detección de trifosfatos de nucleótidos puede aprovechar la interacción con un nanoporo que resulta en cambios en la corriente que fluye a través del nanoporo de una manera específica para cada especie de trifosfato de nucleótido. Por ejemplo, una primera especie de trifosfato de nucleótido puede reducir la corriente que fluye a través del nanoporo durante un período de tiempo medio particular o en un grado particular. Una segunda especie de trifosfato de nucleótido se puede distinguir en virtud de un período de tiempo medio diferente o de un grado diferente de alteración de la corriente al pasar a través del nanoporo. Por lo tanto, se pueden distinguir diferentes especies de trifosfato de nucleótido en función de las alteraciones distintivas de la corriente que fluye a través de un nanoporo.
La detección de nanoporos se puede llevar a cabo mediante cualquiera de una variedad de aparatos conocidos en la técnica, incluidos, por ejemplo, los descritos en las publicaciones de solicitud de patente de EE. UU. núm.
2011/0229877 A1; o 2012/0055792 A1; o las patentes de EE. UU. núm. US 6,413,792; 6.916.665; 7.867.716; 7.444.053; 7.582.490; 7.947.454; o 8.105.846.
Una polimerasa que se usa en un aparato o método expuesto en la presente memoria puede estar presente en solución de manera que sea relativamente libre de difundirse, al menos dentro de una cámara de reacción, o puede estar relativamente limitada en su capacidad de difundirse por estar unida a un soporte en fase sólida, nanoporo, barrera u otro componente de un método o aparato expuesto en la presente memoria. Limitar la difusión por unión puede proporcionar una ventaja de acoplar estrechamente el punto de producción de trifosfato de nucleótido (p. ej., una polimerasa que cataliza la pirofosforólisis) con el punto de detección de trifosfato de nucleótido (p. ej., un nanoporo a través del cual pasan los trifosfatos de nucleótidos). Una polimerasa se puede unir a un nanoporo, por ejemplo, mediante una fusión de proteínas recombinantes con una subunidad de un nanoporo, enlaces cruzados químicos o resto adaptador. Se exponen métodos útiles para unir polimerasas a nanoporos y componentes de polimerasa-nanoporo, por ejemplo, en la publicación de solicitud de patente de EE. UU. núm.2011/0229877 A1; o 2012/0055792 A1; o la patente de EE. UU. núm. 7.947.454.
Una polimerasa se puede unir a una perla u otro soporte sólido que reside en una cámara donde se produce la pirofosforólisis. Las porciones químicas que son útiles para unir polimerasas a perlas o soportes sólidos incluyen aquellas que están disponibles comercialmente, por ejemplo, de Thermo Fisher (Rockford, IL) o Sigma Aldrich (St. Louis, MO) o conocidas de otro modo en la técnica.
Una polimerasa se puede unir a una barrera usada en un aparato de secuenciación de nanoporos. Por ejemplo, en las realizaciones que usan una bicapa lipídica como barrera, se puede unir un resto lipófilo a la polimerasa para localizar la polimerasa en la proximidad de la bicapa debido a las interacciones entre la bicapa y el resto lipófilo. Los restos lipófilos ilustrativos incluyen, aunque no de forma limitativa, esteroles o lípidos. Un ejemplo adicional de un resto lipófilo es una proteína de membrana (o una porción de la misma) que se puede unir a una polimerasa, por ejemplo, mediante la fusión de proteínas recombinantes. Se pueden usar enlaces tales como los expuestos anteriormente para perlas y otros soportes sólidos para unir una polimerasa a una barrera utilizada en sistemas de nanoporos en estado sólido.
Un ácido nucleico que se secuencia en un método expuesto en la presente memoria o presente en un aparato de la presente descripción puede estar en solución de manera que sea relativamente libre de difundirse o puede estar relativamente limitado en su capacidad de difundirse por estar unido a un soporte en fase sólida, nanoporo, barrera u otro componente de un método o aparato expuesto en la presente memoria. Se pueden utilizar uniones similares a las expuestas anteriormente para las polimerasas para los ácidos nucleicos. Por ejemplo, un esterol, lípido u otro resto lipófilo puede unirse a un ácido nucleico para localizarlo en una bicapa lipídica. Se muestra un ejemplo en laFIGURA 2,donde el ácido nucleico se localiza en la membrana a través de un resto de esterol unido a la cadena molde. Como se ilustra en la figura, el ácido nucleico se puede unir a través de la cadena molde, por ejemplo, en el extremo 5' de la cadena molde. La unión también se puede realizar en un punto del molde que esté entre la ubicación donde la polimerasa está unida al molde y el extremo 5' del molde.
Un resto lipófilo se puede unir a un ácido nucleico mediante métodos conocidos en la técnica para unir otros restos tales como biotina o fluoróforos. Por ejemplo, un cebador que tiene el resto lipófilo se puede usar en una reacción de amplificación, extensión del cebador o ligadura. Alternativamente o de forma adicional, los nucleótidos que tienen el resto se pueden utilizar en una reacción de extensión o amplificación. Si se desea, se puede introducir un resto lipófilo antes de la secuenciación y durante una etapa de preparación de la muestra, tal como las expuestas anteriormente en la presente memoria. Por ejemplo, se puede emplear una técnica de secuenciación dirigida donde un subconjunto de ácidos nucleicos diana que tienen las secuencias deseadas se debe seleccionar de entre un fondo de secuencia más complejo. En este ejemplo, se puede introducir selectivamente un resto lipófilo en el subconjunto de ácidos nucleicos diana mediante la técnica de localización específica, lo que puede permitir que las dianas se capturen selectivamente por una bicapa lipídica, mientras que otras secuencias no diana se eliminan por lavado debido a que no se han modificado para incluir el resto lipófilo.
Puede ser beneficioso en algunas realizaciones limitar la difusión tanto de la polimerasa como del ácido nucleico con respecto a un nanoporo, por ejemplo, mediante uno o más de los medios de unión expuestos anteriormente.
Como se expuso anteriormente en la presente memoria, un método de la presente descripción puede incluir una etapa para poner en contacto un ácido nucleico diana con una polimerasa en condiciones para eliminar secuencialmente los nucleótidos, produciendo de esta manera secuencialmente trifosfatos de nucleótidos que tienen una variedad de diferentes restos de bases. La variedad de diferentes restos de bases producidas dependerá del contenido del ácido nucleico diana que se pone en contacto con la polimerasa. Por ejemplo, el ADN típicamente incluye las cuatro bases comunes guanina, citosina, adenina y timina, de manera que la pirofosforólisis producirá trifosfato de desoxiguanidina, trifosfato de desoxicitidina, trifosfato de desoxiadenosina y trifosfato de desoxitimidina. En algunos casos, el ácido nucleico diana puede no incluir todos estos cuatro tipos de bases, de modo que no se producirán más de 3, 2 o incluso 1 tipo de trifosfato de desoxinucleótido mediante pirofosforólisis. En algunos casos, pueden estar presentes variantes de uno o más de estos cuatro tipos de bases en el ADN diana y en consecuencia la pirofosforólisis puede producir variantes de trifosfatos de desoxinucleótidos que tienen, por ejemplo, metilo, hidroximetilo u otros restos añadidos. Otras bases variantes conocidas en la técnica tales como las expuestas en la presente memoria también pueden estar presentes en los trifosfatos de desoxinucleótidos producidos por pirofosforólisis.
Otro ejemplo es el ARN, que típicamente incluye las cuatro bases comunes guanina, citosina, adenina y uracilo de manera que la pirofosforólisis producirá trifosfato de riboguanidina, trifosfato de ribocitidina, trifosfato de riboadenosina y trifosfato de ribotimidina. En algunos casos, el ácido nucleico diana puede no incluir todos estos cuatro tipos de bases, de modo que no se producirán más de 3, 2 o incluso 1 tipo de trifosfato de ribonucleótido mediante pirofosforólisis. Las bases variantes, tales como las ilustradas en la presente memoria, por ejemplo, con respecto a los trifosfatos de desoxinucleótidos, o conocidas de cualquier otra manera en la técnica, pueden estar presentes en los trifosfatos de ribonucleótidos. Generalmente, los trifosfatos de nucleótidos producidos por pirofosforólisis (ya sean trifosfatos de desoxinucleótidos o trifosfatos de ribonucleótidos) incluirán uno, al menos dos, al menos tres, al menos cuatro o más tipos de bases diferentes.
Un método de la presente descripción puede llevarse a cabo en condiciones que eliminen secuencialmente un número de nucleótidos de un ácido nucleico diana, produciendo de esta manera secuencialmente ese mismo número de trifosfatos de nucleótidos. Además, se puede distinguir al menos ese mismo número de trifosfatos de nucleótidos, por ejemplo, mediante el paso a través de un nanoporo, para permitir la determinación de una secuencia que tiene una longitud que es al menos equivalente al número de nucleótidos eliminados del ácido nucleico diana. En realizaciones particulares, el número es de al menos 1, 2, 3, 4, 5, 10, 25, 50, 100, 200, 500, 1000, 10.000 o más hasta e incluida la longitud del ácido nucleico diana. Alternativamente o de forma adicional, el número puede ser no más de 1,2, 3, 4, 5, 10, 25, 50, 100, 200, 500, 1000 o 10.000. El número puede estar, pero no tiene por qué estar, entre dos de estos valores. Como se expuso anteriormente en la presente memoria, se pueden usar una variedad de técnicas para pausar la pirofosforólisis. Esto puede proporcionar el control de la longitud de la secuencia determinada mediante las realizaciones de los presentes métodos.
El número de trifosfatos de nucleótidos liberados por pirofosforólisis y/o detectados en un método expuesto en la presente memoria puede ser mayor que el número de diferentes tipos de trifosfatos de nucleótidos detectados. Sin embargo, el orden y el número de los diferentes trifosfatos de nucleótidos detectados pueden correlacionarse con la secuencia del ácido nucleico.
En algunas realizaciones, puede ser beneficioso secuenciar repetidamente un ácido nucleico diana particular. La repetición se puede lograr, por ejemplo, procesando repetidamente una molécula de ácido nucleico diana en un método expuesto en la presente memoria. Por ejemplo, un método puede incluir las etapas de (a) poner en contacto un ácido nucleico diana con una polimerasa para eliminar secuencialmente los trifosfatos de nucleótidos del ácido nucleico diana, donde los trifosfatos de nucleótidos que se eliminan tienen una variedad de diferentes restos de bases; (b) distinguir los diferentes restos de bases de los trifosfatos de nucleótidos que se eliminan, determinándose de esta manera la secuencia del ácido nucleico diana; (c) regenerar al menos una porción del ácido nucleico diana; y repetir las etapas (a) y (b) con el ácido nucleico diana regenerado. El ácido nucleico diana se puede regenerar, por ejemplo, añadiendo trifosfatos de nucleótidos en condiciones para que la polimerasa (o una polimerasa recién añadida) lleve a cabo una reacción de polimerización para regenerar al menos una porción de una cadena del ácido nucleico diana que se eliminó previamente mediante pirofosforólisis. Típicamente, el pirofosfato estará sustancialmente ausente durante la reacción de polimerización.
Alternativamente o de forma adicional a la realización de procesamiento repetido anterior, un ácido nucleico diana se puede amplificar o copiar para crear múltiples copias que se procesan con un método de la presente descripción. Se muestra un ejemplo diagramático en laFIGURA 3.Múltiples copias de un ácido nucleico molde bicatenario se localizan en una barrera en una cámara que tiene una fusión nanoporo-polimerasa (etapa 1), una de las cadenas es capturada por la polimerasa (etapa 2), se produce la secuenciación basada en pirofosforólisis (etapa 3), la cadena molde, que es monocatenaria, puede arrastrarse después a través del nanoporo mediante fuerza eléctrica (etapa 4) hasta que salga de la cámara donde permanecen las otras copias del ácido nucleico (nota: las otras copias permanecen debido a que son bicatenarias y por lo tanto resistentes al paso a través del nanoporo) (etapa 5) y, después, se captura otra copia del ácido nucleico molde bicatenario para iniciar la repetición de las etapas 2 y siguientes. Se puede utilizar cualquiera de una variedad de métodos conocidos en la técnica para amplificar ácidos nucleicos, tales como los expuestos anteriormente en la presente memoria, para crear las múltiples copias del ácido nucleico diana.
Aunque el sistema de laFIGURA 3se ilustra para copias de un único molde, se entenderá que las especies de ácido nucleico que tienen diferentes secuencias se pueden usar similarmente. Por lo tanto, una variedad de diferentes especies de ácidos nucleicos bicatenarios se pueden localizar en una barrera en una cámara que tiene una fusión nanoporo-polimerasa (etapa 1), la polimerasa puede capturar una cadena de una primera especie (etapa 2), se puede producir una secuenciación basada en pirofosforólisis (etapa 3), la cadena molde de la primera cadena puede arrastrarse después a través del nanoporo mediante fuerza eléctrica (etapa 4) hasta que salga de la cámara donde permanecen las otras especies de ácido nucleico (etapa 5) y, después, se puede capturar otra especie de ácido nucleico bicatenario para iniciar repetición de las etapas 2 y siguientes.
La presente descripción también proporciona un aparato que incluye (a) una barrera impermeable a los fluidos que separa un primer depósito de fluido de un segundo depósito de fluido; (b) un nanoporo colocado en la barrera impermeable a los fluidos para formar un paso a través del cual un trifosfato de nucleótido puede pasar del primer depósito de fluido al segundo depósito de fluido; y (c) una mezcla de reacción en el primer depósito de fluido, la mezcla de reacción incluye una polimerasa, un ácido nucleico diana que tiene dos cadenas, y una concentración pirofosforolítica de pirofosfato. Los componentes utilizados en el aparato pueden ser uno o más de los ilustrados anteriormente en el contexto de varios métodos. Los componentes y configuraciones adicionales se ilustran a continuación a título ilustrativo.
Se puede configurar una barrera impermeable a los fluidos para separar dos depósitos y tener un nanoporo colocado en la barrera para proporcionar una conexión fluida entre los depósitos. Se han expuesto anteriormente nanoporos y barreras ilustrativos y en varias referencias expuestas anteriormente. Generalmente, los dos depósitos estarán en comunicación fluida a través de un único nanoporo. Por lo tanto, los trifosfatos de nucleótidos producidos en uno de los depósitos tendrán una y solo una trayectoria de fluido hacia el segundo depósito. El uso de un único nanoporo de esta manera permite una medición práctica de cada trifosfato de nucleótido que pasa de un depósito al otro debido a cambios en las propiedades eléctricas en el nanoporo, barrera y/o depósitos. Sin embargo, en algunas realizaciones, también es posible incluir más de un nanoporo en la barrera que separa dos depósitos. Cuando varios nanoporos conectan de manera fluida dos depósitos, el paso de trifosfatos de nucleótidos se puede medir en el nanoporo individual con, por ejemplo, mediciones ópticas o eléctricas que resuelven cada nanoporo.
Un depósito puede crear una cámara donde el fluido permanece contenido durante al menos parte del tiempo. Por ejemplo, se puede configurar una cámara para formar una depresión, cavidad, compartimento, etc. que restringe el flujo de fluido. Alternativamente, se puede configurar un depósito para el flujo de fluido. Por ejemplo, el depósito se puede configurar como un tubo, canal o célula de flujo y permitir de esta manera el flujo de fluidos para el suministro y la retirada prácticos de los componentes utilizados en un método de secuenciación. En realizaciones particulares, un primer depósito que contiene ácido nucleico molde, polimerasa y pirofosfato se configurará para el flujo de fluido, mientras que el segundo depósito, que está conectado a la primera cámara a través de un nanoporo, se puede configurar como una cámara. No es necesario configurar el segundo depósito para el flujo de fluido, pero se puede hacer opcionalmente.
La presente descripción proporciona realizaciones multiplex. Por ejemplo, las secuencias para una pluralidad de ácidos nucleicos diana se pueden determinar en paralelo. Un método multiplex puede incluir las etapas de (a) proporcionar una pluralidad de ácidos nucleicos diana; (b) poner en contacto cada uno de los ácidos nucleicos diana con una polimerasa para eliminar secuencialmente los trifosfatos de nucleótidos de cada ácido nucleico diana, donde los trifosfatos de nucleótidos que se eliminan tienen una variedad de diferentes restos de bases; y (c) distinguir los diferentes restos de bases para los trifosfatos de nucleótidos que se eliminan de cada ácido nucleico, determinándose de esta manera las secuencias de los ácidos nucleicos diana.
Un ejemplo adicional de un método multiplex es uno que incluye las etapas de (a) proporcionar una pluralidad de ácidos nucleicos diana, cada uno con dos cadenas; (b) poner en contacto cada uno de los ácidos nucleicos diana con una polimerasa en condiciones para eliminar secuencialmente nucleótidos de la primera de cada una de las dos cadenas mediante pirofosforólisis, produciendo de esta manera secuencialmente trifosfatos de nucleótidos que tienen una variedad de diferentes restos de bases; y (c) distinguir los diferentes restos de bases para los trifosfatos de nucleótidos producidos secuencialmente, determinándose de esta manera la secuencia de los ácidos nucleicos diana.
Un aparato multiplex puede incluir (a) una pluralidad de barreras impermeables a los fluidos, cada una de las cuales separa un primer depósito de fluido de un segundo depósito de fluido; (b) un nanoporo colocado en cada una de las barreras impermeables a los fluidos para formar un paso a través del cual un trifosfato de nucleótido puede pasar del primer depósito de fluido al segundo depósito de fluido; y (c) una mezcla de reacción en cada uno de los primeros depósitos de fluido, en la cual cada una de las mezclas de reacción incluye una polimerasa, ácido nucleico diana que tiene dos cadenas, y una concentración pirofosforolítica de pirofosfato.
La plexidad (es decir, nivel multiplex) de un método o aparato se puede seleccionar para satisfacer un uso particular. Por ejemplo, el número de ácidos nucleicos diana que se procesan o están presentes juntos se puede determinar a partir de la complejidad de la muestra a evaluar. Las estimaciones de complejidad ilustrativas para algunos de los genomas que pueden evaluarse con métodos o aparatos de la presente descripción son aproximadamente 3,1 Gbp (humano), 2,7 Gbp (ratón), 2,8 Gbp (rata), 1,7 Gbp (pez cebra), 165 Mbp (mosca de la fruta), 13,5 Mbp (S.cerevisiae),390 Mbp (pez globo), 278 Mbp (mosquito) o 103 Mbp (C.elegans).Los expertos en la técnica reconocerán que los genomas que tienen tamaños distintos de los ilustrados anteriormente incluidos, por ejemplo, genomas más pequeños o más grandes, se pueden utilizar en un método de la invención. Típicamente, una muestra de ácido nucleico se fragmenta antes de su uso. El número de fragmentos que se manejarán en paralelo dependerá de la complejidad del genoma, del tamaño medio de los fragmentos y de la cobertura deseada. Por ejemplo, se puede lograr una cobertura de 1x un genoma humano (3,1 Gbp) que está fragmentado hasta un tamaño medio de 1000 nucleótidos mediante una plexidad de 3 millones de fragmentos (es decir, ((3100 millones / 1000) x 1) = 1 millón). Con cálculos similares, se puede determinar que una plexidad de 30 millones de fragmentos (de 1000 nucleótidos cada uno) es suficiente para proporcionar una cobertura de 30x de un genoma humano.
Los métodos y aparatos expuestos en la presente memoria se pueden configurar a un nivel de plexidad suficiente para proporcionar al menos una cobertura de 1x, 2x, 5x, 10x, 20x, 30x, 50x o más de cualquiera de una variedad de genomas incluidos, aunque no de forma limitativa, los ilustrados en la presente memoria. La plexidad puede ser una función del número de varios componentes expuestos en la presente memoria tal como el número de fragmentos de ácido nucleico diana como se ilustró anteriormente. Otros componentes que se pueden multiplexar incluyen, por ejemplo, el número de nanoporos utilizados, el número de polimerasas, el número de cámaras que tienen una barrera y un nanoporo, etc. El nivel multiplex de estos u otros componentes puede ser, por ejemplo, al menos 2, 5, 10, 100, 1 x 103, 1 x 104, 1 x 105, 1 x 106, 1 x 109 o superior. Alternativamente o de forma adicional, el nivel multiplex se puede seleccionar para ser no más de 2, 5, 10, 100, 1 x 103, 1 x 104, 1 x 105, 1 x 106, o 1 x 109
El término “ que comprende” se entiende en el presente documento como abierto, incluyendo no sólo los elementos citados, sino abarcando además cualquier elemento adicional.
Aunque la invención se ha descrito haciendo referencia a los ejemplos proporcionados anteriormente, la invención está limitada solo por las reivindicaciones.
Claims (15)
- REIVINDICACIONESi.Un método para determinar la secuencia de un ácido nucleico diana, que comprende(a) proporcionar un ácido nucleico diana que tiene dos cadenas;(b) poner en contacto el ácido nucleico diana con una polimerasa unida a un nanoporo en condiciones para eliminar secuencialmente nucleótidos de una primera cadena de las dos cadenas mediante pirofosforólisis y de esta manera producir secuencialmente trifosfatos de nucleótido individuales; y(c) distinguir los trifosfatos de nucleótido producidos secuencialmente mediante la detección de cambios en la corriente que fluye a través del nanoporo.
- 2. El método de la reivindicación 1, en donde el nanoporo comprende un nanoporo de proteína que está incrustado en una membrana.
- 3. El método de la reivindicación 1, en donde una segunda cadena de las dos cadenas del ácido nucleico diana está unida a la membrana.
- 4. El método de la reivindicación 1, en donde el nanoporo es un poro en estado sólido.
- 5. El método de la reivindicación 1, en donde las condiciones para eliminar secuencialmente trifosfatos de nucleótidos comprenden poner en contacto la polimerasa con una concentración pirofosforolítica de pirofosfato
- 6. El método de la reivindicación 5, en donde la concentración pirofosforolítica de pirofosfato comprende una concentración de al menos 100 pM.
- 7. El método de la reivindicación 5, en donde el método comprende además una etapa para pausar la producción secuencial de los trifosfatos de nucleótido al hacer que el pirofosfato deje de estar en contacto con la polimerasa y, a continuación, reanudar la producción secuencial de los trifosfatos de nucleótidos poniendo en contacto la polimerasa con el pirofosfato.
- 8. El método de la reivindicación 1, en donde los trifosfatos de nucleótido comprenden adenina, guanina, citosina o timina naturales.
- 9. El método de la reivindicación 1, en donde el ácido nucleico diana es el ADN.
- 10. El método de la reivindicación 1, en donde el ácido nucleico diana incluye al menos un resto base que no es natural en el ADN o el ARN.
- 11. El método de la reivindicación 10, en donde al menos uno de los restos base comprende 5-metilcitosina o 5-hidroximetilcitosina.
- 12. El método de la reivindicación 1, en donde el ácido nucleico diana es un heterodúplex formado por una cadena de ADN y una cadena de ARN.
- 13. El método de la reivindicación 1, en donde las condiciones para eliminar secuencialmente trifosfatos de nucleótido de la primera cadena comprenden poner en contacto la polimerasa con una concentración pirofosforolítica de un análogo de pirofosfato.
- 14. El método de la reivindicación 13, en donde el análogo de pirofosfato comprende un pirofosfato que tiene un resto adicional.
- 15. El método de la reivindicación 13, en donde el análogo de pirofosfato comprende pirovanadato.
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201361827175P | 2013-05-24 | 2013-05-24 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| ES2994071T3 true ES2994071T3 (en) | 2025-01-16 |
Family
ID=50771301
Family Applications (3)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES14725498.1T Active ES2660671T3 (es) | 2013-05-24 | 2014-05-22 | Secuenciado pirofosforolítico usando nanoporos |
| ES20183774T Active ES2994071T3 (en) | 2013-05-24 | 2014-05-22 | Pyrophosphorolytic sequencing using nanopores |
| ES17207528T Active ES2817425T3 (es) | 2013-05-24 | 2014-05-22 | Secuenciado pirofosforolítico usando nanoporos |
Family Applications Before (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES14725498.1T Active ES2660671T3 (es) | 2013-05-24 | 2014-05-22 | Secuenciado pirofosforolítico usando nanoporos |
Family Applications After (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES17207528T Active ES2817425T3 (es) | 2013-05-24 | 2014-05-22 | Secuenciado pirofosforolítico usando nanoporos |
Country Status (10)
| Country | Link |
|---|---|
| US (4) | US20140349300A1 (es) |
| EP (3) | EP3004378B1 (es) |
| JP (1) | JP6329624B2 (es) |
| CN (1) | CN105264093B (es) |
| AU (1) | AU2014270410B2 (es) |
| CA (1) | CA2907423A1 (es) |
| DK (2) | DK3351645T3 (es) |
| ES (3) | ES2660671T3 (es) |
| PT (1) | PT3004378T (es) |
| WO (1) | WO2014187924A1 (es) |
Families Citing this family (36)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| GB0905140D0 (en) | 2009-03-25 | 2009-05-06 | Isis Innovation | Method |
| US9777049B2 (en) | 2012-04-10 | 2017-10-03 | Oxford Nanopore Technologies Ltd. | Mutant lysenin pores |
| WO2014135838A1 (en) | 2013-03-08 | 2014-09-12 | Oxford Nanopore Technologies Limited | Enzyme stalling method |
| GB201313477D0 (en) | 2013-07-29 | 2013-09-11 | Univ Leuven Kath | Nanopore biosensors for detection of proteins and nucleic acids |
| ES2660671T3 (es) * | 2013-05-24 | 2018-03-23 | Illumina Cambridge Limited | Secuenciado pirofosforolítico usando nanoporos |
| AU2015208919B9 (en) | 2014-01-22 | 2021-04-01 | Oxford Nanopore Technologies Limited | Method for attaching one or more polynucleotide binding proteins to a target polynucleotide |
| EP3137627B1 (en) | 2014-05-02 | 2025-07-30 | Oxford Nanopore Technologies plc | Method of improving the movement of a target polynucleotide with respect to a transmembrane pore |
| KR20250130441A (ko) | 2014-09-01 | 2025-09-01 | 브이아이비 브이지더블유 | 돌연변이체 csgg 포어 |
| US11186868B2 (en) | 2016-03-02 | 2021-11-30 | Oxford Nanopore Technologies Plc | Mutant pore |
| CN118326018B (zh) | 2016-04-06 | 2025-11-07 | 牛津纳米孔科技公开有限公司 | 突变体孔 |
| WO2018195222A1 (en) | 2017-04-19 | 2018-10-25 | Electronic Biosciences, Inc. | Nanopore/nanowell electrode enabled exonuclease sequencing |
| GB201707122D0 (en) | 2017-05-04 | 2017-06-21 | Oxford Nanopore Tech Ltd | Pore |
| CN117106037B (zh) | 2017-06-30 | 2025-07-25 | 弗拉芒区生物技术研究所 | 新颖蛋白孔 |
| GB201818216D0 (en) | 2018-11-08 | 2018-12-26 | Oxford Nanopore Tech Ltd | Pore |
| CN113195736A (zh) | 2018-11-08 | 2021-07-30 | 牛津纳米孔科技公司 | 孔 |
| JP2022529623A (ja) | 2019-04-09 | 2022-06-23 | オックスフォード ナノポール テクノロジーズ ピーエルシー | 細孔 |
| GB201907244D0 (en) | 2019-05-22 | 2019-07-03 | Oxford Nanopore Tech Ltd | Method |
| GB201907246D0 (en) | 2019-05-22 | 2019-07-03 | Oxford Nanopore Tech Ltd | Method |
| GB201917060D0 (en) | 2019-11-22 | 2020-01-08 | Oxford Nanopore Tech Ltd | Method |
| AU2020411035A1 (en) * | 2019-12-23 | 2022-07-07 | Biofidelity Ltd | Kits and devices |
| GB202004944D0 (en) | 2020-04-03 | 2020-05-20 | King S College London | Method |
| EP4168582B1 (en) | 2020-06-18 | 2025-11-19 | Oxford Nanopore Technologies plc | A method of selectively characterising a polynucleotide using a detector |
| GB202107354D0 (en) | 2021-05-24 | 2021-07-07 | Oxford Nanopore Tech Ltd | Method |
| GB202118939D0 (en) | 2021-12-23 | 2022-02-09 | Oxford Nanopore Tech Plc | Pore |
| GB202205617D0 (en) | 2022-04-14 | 2022-06-01 | Oxford Nanopore Tech Plc | Novel modified protein pores and enzymes |
| EP4569331A1 (en) | 2022-08-09 | 2025-06-18 | Oxford Nanopore Technologies PLC | De novo pores |
| GB202211607D0 (en) | 2022-08-09 | 2022-09-21 | Oxford Nanopore Tech Plc | Novel pore monomers and pores |
| KR20250044691A (ko) | 2022-08-09 | 2025-04-01 | 옥스포드 나노포어 테크놀로지즈 피엘씨 | 신규 포어 단량체 및 포어 |
| GB202211602D0 (en) | 2022-08-09 | 2022-09-21 | Oxford Nanopore Tech Plc | Novel pore monomers and pores |
| KR20250096716A (ko) | 2022-10-28 | 2025-06-27 | 옥스포드 나노포어 테크놀로지즈 피엘씨 | 포어 단량체 및 포어 |
| GB202216905D0 (en) | 2022-11-11 | 2022-12-28 | Oxford Nanopore Tech Plc | Novel pore monomers and pores |
| GB202305524D0 (en) | 2023-04-14 | 2023-05-31 | Oxford Nanopore Tech Plc | Novel pore monomers and pores |
| GB202307141D0 (en) | 2023-05-12 | 2023-06-28 | Oxford Nanopore Tech Plc | Modified helicases |
| US20250002985A1 (en) * | 2023-06-30 | 2025-01-02 | Illumina, Inc. | Using apertures to capture polynucleotides on particles |
| GB202315935D0 (en) | 2023-10-18 | 2023-11-29 | Oxford Nanopore Tech Ltd | Novel enzymes |
| GB202405960D0 (en) | 2024-04-29 | 2024-06-12 | Oxford Nanopore Tech Plc | Photo-active conjugates and their uses |
Family Cites Families (35)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4800159A (en) | 1986-02-07 | 1989-01-24 | Cetus Corporation | Process for amplifying, detecting, and/or cloning nucleic acid sequences |
| US6107023A (en) | 1988-06-17 | 2000-08-22 | Genelabs Technologies, Inc. | DNA amplification and subtraction techniques |
| US5498523A (en) | 1988-07-12 | 1996-03-12 | President And Fellows Of Harvard College | DNA sequencing with pyrophosphatase |
| US4962020A (en) | 1988-07-12 | 1990-10-09 | President And Fellows Of Harvard College | DNA sequencing |
| HUT61054A (en) * | 1989-04-12 | 1992-11-30 | Harvard College | Improved process and test kit for primary extension reactions |
| US6159693A (en) * | 1998-03-13 | 2000-12-12 | Promega Corporation | Nucleic acid detection |
| US7090975B2 (en) | 1998-03-13 | 2006-08-15 | Promega Corporation | Pyrophosphorolysis and incorporation of nucleotide method for nucleic acid detection |
| US6268146B1 (en) * | 1998-03-13 | 2001-07-31 | Promega Corporation | Analytical methods and materials for nucleic acid detection |
| US6267872B1 (en) | 1998-11-06 | 2001-07-31 | The Regents Of The University Of California | Miniature support for thin films containing single channels or nanopores and methods for using same |
| EP1192103A1 (en) | 1999-06-22 | 2002-04-03 | President And Fellows of Harvard College | Control of solid state dimensional features |
| US7582490B2 (en) | 1999-06-22 | 2009-09-01 | President And Fellows Of Harvard College | Controlled fabrication of gaps in electrically conducting structures |
| EP2261240B1 (en) | 2000-02-11 | 2015-09-02 | The Texas A & M University System | Biosensor compositions and methods of use |
| US7033763B2 (en) | 2000-02-23 | 2006-04-25 | City Of Hope | Pyrophosphorolysis activated polymerization (PAP) |
| US6413792B1 (en) | 2000-04-24 | 2002-07-02 | Eagle Research Development, Llc | Ultra-fast nucleic acid sequencing device and a method for making and using the same |
| WO2003080861A1 (en) * | 2002-03-22 | 2003-10-02 | MAX-PLANCK-Gesellschaft zur Förderung der Wissenschaften e.V. | Single molecule sequencing using phosphate labeled nucleotides |
| US7444053B2 (en) | 2003-06-16 | 2008-10-28 | The Regents Of The University Of California | Integrated electrical and optical sensor for biomolecule analysis with single molecule sensitivity |
| NZ549643A (en) * | 2004-02-26 | 2009-07-31 | Layerlab Aktiebolag | Methods of forming lipid membrane attached linkers comprising contacting membrane with an oligonucleotide having two or more hydrophobic anchoring moieties |
| US7238485B2 (en) | 2004-03-23 | 2007-07-03 | President And Fellows Of Harvard College | Methods and apparatus for characterizing polynucleotides |
| WO2007084103A2 (en) | 2004-12-21 | 2007-07-26 | The Texas A & M University System | High temperature ion channels and pores |
| GB0522310D0 (en) | 2005-11-01 | 2005-12-07 | Solexa Ltd | Methods of preparing libraries of template polynucleotides |
| GB0523282D0 (en) | 2005-11-15 | 2005-12-21 | Isis Innovation | Methods using pores |
| KR20080096567A (ko) * | 2006-02-03 | 2008-10-30 | 마이크로칩 바이오테크놀로지스, 인크. | 마이크로유체 장치 |
| AU2008217578A1 (en) | 2007-02-20 | 2008-08-28 | Oxford Nanopore Technologies Limited | Lipid bilayer sensor system |
| GB0717150D0 (en) | 2007-09-04 | 2007-10-17 | Univ Warwick | Apparatus and method |
| US8071536B2 (en) | 2007-11-28 | 2011-12-06 | Roche Molecular System, Inc. | Mutant DNA polymerases with improved pyrophosphorolysis activated polymerization (PAP) ability |
| CN103695530B (zh) | 2008-07-07 | 2016-05-25 | 牛津纳米孔技术有限公司 | 酶-孔构建体 |
| EP3029467B1 (en) | 2008-09-22 | 2020-01-08 | University of Washington | Msp nanopores and related methods |
| US9080211B2 (en) | 2008-10-24 | 2015-07-14 | Epicentre Technologies Corporation | Transposon end compositions and methods for modifying nucleic acids |
| WO2011159942A1 (en) | 2010-06-18 | 2011-12-22 | Illumina, Inc. | Conformational probes and methods for sequencing nucleic acids |
| US20120208193A1 (en) * | 2011-02-15 | 2012-08-16 | Bio-Rad Laboratories, Inc. | Detecting methylation in a subpopulation of genomic dna |
| JP6480183B2 (ja) * | 2011-05-27 | 2019-03-06 | オックスフォード ナノポール テクノロジーズ リミテッド | 結合方法 |
| EP3385992B1 (en) * | 2011-07-27 | 2024-09-04 | The Board of Trustees of the University of Illinois | Nanopore sensors for biomolecular characterization |
| US9279154B2 (en) * | 2011-12-21 | 2016-03-08 | Illumina, Inc. | Apparatus and methods for kinetic analysis and determination of nucleic acid sequences |
| GB201300957D0 (en) | 2013-01-18 | 2013-03-06 | Base4 Innovation Ltd | Sequencing method |
| ES2660671T3 (es) * | 2013-05-24 | 2018-03-23 | Illumina Cambridge Limited | Secuenciado pirofosforolítico usando nanoporos |
-
2014
- 2014-05-22 ES ES14725498.1T patent/ES2660671T3/es active Active
- 2014-05-22 WO PCT/EP2014/060588 patent/WO2014187924A1/en not_active Ceased
- 2014-05-22 DK DK17207528.5T patent/DK3351645T3/da active
- 2014-05-22 EP EP14725498.1A patent/EP3004378B1/en active Active
- 2014-05-22 ES ES20183774T patent/ES2994071T3/es active Active
- 2014-05-22 CN CN201480029966.6A patent/CN105264093B/zh active Active
- 2014-05-22 ES ES17207528T patent/ES2817425T3/es active Active
- 2014-05-22 JP JP2016514422A patent/JP6329624B2/ja active Active
- 2014-05-22 CA CA2907423A patent/CA2907423A1/en active Pending
- 2014-05-22 EP EP17207528.5A patent/EP3351645B1/en active Active
- 2014-05-22 PT PT147254981T patent/PT3004378T/pt unknown
- 2014-05-22 AU AU2014270410A patent/AU2014270410B2/en active Active
- 2014-05-22 DK DK14725498.1T patent/DK3004378T3/en active
- 2014-05-22 EP EP20183774.7A patent/EP3825415B1/en active Active
- 2014-05-23 US US14/286,447 patent/US20140349300A1/en not_active Abandoned
-
2017
- 2017-12-19 US US15/847,362 patent/US10450605B2/en active Active
-
2019
- 2019-10-18 US US16/657,931 patent/US11286521B2/en active Active
-
2022
- 2022-02-22 US US17/677,844 patent/US20220177960A1/en active Pending
Also Published As
| Publication number | Publication date |
|---|---|
| US20140349300A1 (en) | 2014-11-27 |
| CA2907423A1 (en) | 2014-11-27 |
| EP3825415B1 (en) | 2024-08-28 |
| AU2014270410A1 (en) | 2015-10-08 |
| HK1261919A1 (en) | 2020-01-10 |
| US11286521B2 (en) | 2022-03-29 |
| US20200157619A1 (en) | 2020-05-21 |
| PT3004378T (pt) | 2018-03-06 |
| DK3351645T3 (da) | 2020-09-21 |
| EP3351645A1 (en) | 2018-07-25 |
| EP3825415A1 (en) | 2021-05-26 |
| US20220177960A1 (en) | 2022-06-09 |
| EP3351645B1 (en) | 2020-07-15 |
| JP2016526876A (ja) | 2016-09-08 |
| ES2660671T3 (es) | 2018-03-23 |
| US10450605B2 (en) | 2019-10-22 |
| EP3004378B1 (en) | 2017-12-20 |
| JP6329624B2 (ja) | 2018-05-23 |
| AU2014270410B2 (en) | 2020-07-16 |
| CN105264093B (zh) | 2018-04-10 |
| EP3004378A1 (en) | 2016-04-13 |
| DK3004378T3 (en) | 2018-03-26 |
| CN105264093A (zh) | 2016-01-20 |
| US20180105874A1 (en) | 2018-04-19 |
| ES2817425T3 (es) | 2021-04-07 |
| WO2014187924A1 (en) | 2014-11-27 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| ES2994071T3 (en) | Pyrophosphorolytic sequencing using nanopores | |
| ES2958715T3 (es) | Composiciones y métodos para la secuenciación de polinucleótidos | |
| US11390904B2 (en) | Nanopore-based method and double stranded nucleic acid construct therefor | |
| EP3097204B1 (en) | Method for controlling the movement of a polynucleotide through a transmembrane pore | |
| US10590479B2 (en) | Polymerase idling method for single molecule DNA sequencing | |
| WO2013057495A2 (en) | Enzyme method | |
| Dahl et al. | Direct observation of translocation in individual DNA polymerase complexes | |
| HK40047390B (en) | Pyrophosphorolytic sequencing using nanopores | |
| HK40047390A (en) | Pyrophosphorolytic sequencing using nanopores | |
| HK1261919B (en) | Pyrophosphorolytic sequencing using nanopores | |
| CN119137284A (zh) | 用于核酸扩增的嗜热组合物 |