ES2394633T3 - Estrategias mejoradas para elaboración de perfiles de transcritos usando tecnologías de secuenciación de alto rendimiento - Google Patents
Estrategias mejoradas para elaboración de perfiles de transcritos usando tecnologías de secuenciación de alto rendimiento Download PDFInfo
- Publication number
- ES2394633T3 ES2394633T3 ES06835676T ES06835676T ES2394633T3 ES 2394633 T3 ES2394633 T3 ES 2394633T3 ES 06835676 T ES06835676 T ES 06835676T ES 06835676 T ES06835676 T ES 06835676T ES 2394633 T3 ES2394633 T3 ES 2394633T3
- Authority
- ES
- Spain
- Prior art keywords
- sample
- cdna
- sequence
- collection
- adapter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012163 sequencing technique Methods 0.000 title claims abstract description 78
- 238000005516 engineering process Methods 0.000 title description 32
- 239000012634 fragment Substances 0.000 claims abstract description 110
- 238000000034 method Methods 0.000 claims abstract description 109
- 239000002773 nucleotide Substances 0.000 claims abstract description 80
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 80
- 239000013615 primer Substances 0.000 claims abstract description 57
- 238000009396 hybridization Methods 0.000 claims abstract description 51
- 108020004414 DNA Proteins 0.000 claims abstract description 45
- 108091008146 restriction endonucleases Proteins 0.000 claims abstract description 40
- 230000009467 reduction Effects 0.000 claims abstract description 32
- 108091028043 Nucleic acid sequence Proteins 0.000 claims abstract description 24
- 238000013518 transcription Methods 0.000 claims abstract description 24
- 230000035897 transcription Effects 0.000 claims abstract description 24
- 239000002299 complementary DNA Substances 0.000 claims abstract description 21
- 239000003155 DNA primer Substances 0.000 claims abstract description 16
- 108091034117 Oligonucleotide Proteins 0.000 claims abstract description 16
- 239000011324 bead Substances 0.000 claims description 36
- 230000000295 complement effect Effects 0.000 claims description 17
- 230000015572 biosynthetic process Effects 0.000 claims description 7
- 238000003786 synthesis reaction Methods 0.000 claims description 7
- 239000007787 solid Substances 0.000 claims description 6
- 239000000839 emulsion Substances 0.000 claims description 5
- 238000012175 pyrosequencing Methods 0.000 claims description 5
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical group [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 claims description 4
- 235000011180 diphosphates Nutrition 0.000 claims description 4
- 230000001804 emulsifying effect Effects 0.000 claims description 2
- 239000000523 sample Substances 0.000 description 157
- 108090000623 proteins and genes Proteins 0.000 description 53
- 208000005652 acute fatty liver of pregnancy Diseases 0.000 description 49
- 150000007523 nucleic acids Chemical class 0.000 description 35
- 102000039446 nucleic acids Human genes 0.000 description 33
- 108020004707 nucleic acids Proteins 0.000 description 33
- 238000003752 polymerase chain reaction Methods 0.000 description 26
- 230000003321 amplification Effects 0.000 description 19
- 230000014509 gene expression Effects 0.000 description 19
- 238000003199 nucleic acid amplification method Methods 0.000 description 19
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 18
- 239000000047 product Substances 0.000 description 18
- 238000010606 normalization Methods 0.000 description 14
- 238000011160 research Methods 0.000 description 14
- 102000053602 DNA Human genes 0.000 description 13
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 12
- 235000002566 Capsicum Nutrition 0.000 description 11
- 239000006002 Pepper Substances 0.000 description 11
- 241000722363 Piper Species 0.000 description 11
- 235000016761 Piper aduncum Nutrition 0.000 description 11
- 235000017804 Piper guineense Nutrition 0.000 description 11
- 235000008184 Piper nigrum Nutrition 0.000 description 11
- 238000012423 maintenance Methods 0.000 description 11
- 108020004999 messenger RNA Proteins 0.000 description 11
- 239000000872 buffer Substances 0.000 description 9
- 238000011161 development Methods 0.000 description 9
- 230000018109 developmental process Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 238000000018 DNA microarray Methods 0.000 description 8
- 241000196324 Embryophyta Species 0.000 description 8
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 8
- 235000002020 sage Nutrition 0.000 description 8
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 8
- 101000798222 Homo sapiens Antizyme inhibitor 2 Proteins 0.000 description 7
- 239000000203 mixture Substances 0.000 description 7
- 238000005406 washing Methods 0.000 description 7
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 6
- 238000003556 assay Methods 0.000 description 6
- 101150044508 key gene Proteins 0.000 description 6
- 238000002360 preparation method Methods 0.000 description 6
- 240000003768 Solanum lycopersicum Species 0.000 description 5
- YRKCREAYFQTBPV-UHFFFAOYSA-N acetylacetone Chemical compound CC(=O)CC(C)=O YRKCREAYFQTBPV-UHFFFAOYSA-N 0.000 description 5
- 239000000499 gel Substances 0.000 description 5
- 239000003550 marker Substances 0.000 description 5
- 239000000243 solution Substances 0.000 description 5
- 102100032252 Antizyme inhibitor 2 Human genes 0.000 description 4
- 102000004190 Enzymes Human genes 0.000 description 4
- 108090000790 Enzymes Proteins 0.000 description 4
- 102100034343 Integrase Human genes 0.000 description 4
- 108091034057 RNA (poly(A)) Proteins 0.000 description 4
- 108020004682 Single-Stranded DNA Proteins 0.000 description 4
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 4
- 230000033228 biological regulation Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 238000001502 gel electrophoresis Methods 0.000 description 4
- 229910052737 gold Inorganic materials 0.000 description 4
- 239000010931 gold Substances 0.000 description 4
- 238000002844 melting Methods 0.000 description 4
- 230000008018 melting Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000001105 regulatory effect Effects 0.000 description 4
- 239000011780 sodium chloride Substances 0.000 description 4
- 108020004635 Complementary DNA Proteins 0.000 description 3
- 102100031780 Endonuclease Human genes 0.000 description 3
- 108010042407 Endonucleases Proteins 0.000 description 3
- 101100369993 Mus musculus Tnfsf10 gene Proteins 0.000 description 3
- 238000012408 PCR amplification Methods 0.000 description 3
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 3
- 102000006382 Ribonucleases Human genes 0.000 description 3
- 108010083644 Ribonucleases Proteins 0.000 description 3
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 3
- 239000002253 acid Substances 0.000 description 3
- 150000007513 acids Chemical class 0.000 description 3
- 239000011543 agarose gel Substances 0.000 description 3
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 3
- 239000005547 deoxyribonucleotide Substances 0.000 description 3
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 3
- 230000029087 digestion Effects 0.000 description 3
- 238000010348 incorporation Methods 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 238000002493 microarray Methods 0.000 description 3
- 239000011049 pearl Substances 0.000 description 3
- 238000007480 sanger sequencing Methods 0.000 description 3
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- 206010006187 Breast cancer Diseases 0.000 description 2
- 208000026310 Breast neoplasm Diseases 0.000 description 2
- 102000012410 DNA Ligases Human genes 0.000 description 2
- 108010061982 DNA Ligases Proteins 0.000 description 2
- 230000004544 DNA amplification Effects 0.000 description 2
- 101710099953 DNA mismatch repair protein msh3 Proteins 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 2
- 101000836075 Homo sapiens Serpin B9 Proteins 0.000 description 2
- 101000661807 Homo sapiens Suppressor of tumorigenicity 14 protein Proteins 0.000 description 2
- 101710163270 Nuclease Proteins 0.000 description 2
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 2
- 102100025517 Serpin B9 Human genes 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 239000012472 biological sample Substances 0.000 description 2
- 238000010804 cDNA synthesis Methods 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000010828 elution Methods 0.000 description 2
- 238000005194 fractionation Methods 0.000 description 2
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000002853 nucleic acid probe Substances 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000003196 serial analysis of gene expression Methods 0.000 description 2
- 229910001415 sodium ion Inorganic materials 0.000 description 2
- 238000010186 staining Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 208000002109 Argyria Diseases 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 1
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 1
- 230000007023 DNA restriction-modification system Effects 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108700039964 Duplicate Genes Proteins 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 108091027305 Heteroduplex Proteins 0.000 description 1
- 101000582320 Homo sapiens Neurogenic differentiation factor 6 Proteins 0.000 description 1
- 101710203526 Integrase Proteins 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 241000227653 Lycopersicon Species 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 241000916865 Microsage Species 0.000 description 1
- 108091092878 Microsatellite Proteins 0.000 description 1
- 102100030589 Neurogenic differentiation factor 6 Human genes 0.000 description 1
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 1
- 239000012807 PCR reagent Substances 0.000 description 1
- 108091093037 Peptide nucleic acid Proteins 0.000 description 1
- 108010010677 Phosphodiesterase I Proteins 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 238000002123 RNA extraction Methods 0.000 description 1
- 239000013614 RNA sample Substances 0.000 description 1
- 238000011530 RNeasy Mini Kit Methods 0.000 description 1
- 208000006265 Renal cell carcinoma Diseases 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- 241000473945 Theria <moth genus> Species 0.000 description 1
- 101150003160 X gene Proteins 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 238000005904 alkaline hydrolysis reaction Methods 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 238000002869 basic local alignment search tool Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008238 biochemical pathway Effects 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 238000010805 cDNA synthesis kit Methods 0.000 description 1
- 238000005251 capillar electrophoresis Methods 0.000 description 1
- 238000001818 capillary gel electrophoresis Methods 0.000 description 1
- 150000001768 cations Chemical class 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 239000005549 deoxyribonucleoside Substances 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000368 destabilizing effect Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000010252 digital analysis Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- -1 e.g. eg Proteins 0.000 description 1
- 239000012149 elution buffer Substances 0.000 description 1
- 230000009144 enzymatic modification Effects 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- ZMMJGEGLRURXTF-UHFFFAOYSA-N ethidium bromide Chemical compound [Br-].C12=CC(N)=CC=C2C2=CC=C(N)C=C2[N+](CC)=C1C1=CC=CC=C1 ZMMJGEGLRURXTF-UHFFFAOYSA-N 0.000 description 1
- 229960005542 ethidium bromide Drugs 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000855 fermentation Methods 0.000 description 1
- 230000004151 fermentation Effects 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- 231100000206 health hazard Toxicity 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000011005 laboratory method Methods 0.000 description 1
- 230000013011 mating Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 1
- 238000001531 micro-dissection Methods 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000007838 multiplex ligation-dependent probe amplification Methods 0.000 description 1
- 238000007899 nucleic acid hybridization Methods 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 201000010279 papillary renal cell carcinoma Diseases 0.000 description 1
- 239000012071 phase Substances 0.000 description 1
- 230000008121 plant development Effects 0.000 description 1
- 230000037452 priming Effects 0.000 description 1
- 238000004393 prognosis Methods 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 238000000163 radioactive labelling Methods 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 230000014493 regulation of gene expression Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 230000003248 secreting effect Effects 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 239000004332 silver Substances 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 238000010972 statistical evaluation Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 1
- HRXKRNGNAMMEHJ-UHFFFAOYSA-K trisodium citrate Chemical compound [Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O HRXKRNGNAMMEHJ-UHFFFAOYSA-K 0.000 description 1
- 229940038773 trisodium citrate Drugs 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
- C12Q1/6874—Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Immunology (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Analytical Chemistry (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
Procedimiento para determinar niveles de transcripción relativos de una secuencia de nucleótidos en muestrasde ADNc que comprende las etapas de:(a) Proporcionar una primera muestra de ADNc;(b) Realizar una reducción de la complejidad reproducible de la primera muestra de ADNc 5 para obtener unaprimera colección que comprende las etapas de:- digerir el ADNc con al menos una endonucleasa de restricción para fragmentarlo en fragmentos derestricción;- ligar los fragmentos de restricción con al menos un adaptador oligonucleotídico sintético bicatenario quetenga un extremo compatible con uno o ambos extremos de los fragmentos de restricción para producirfragmentos de restricción ligados a adaptador;- poner en contacto dichos fragmentos de restricción ligados a adaptador con uno o más cebadoresoligonucleotídicos bajo condiciones de hibridación, teniendo dichos uno o más cebadores oligonucleotídicosuna secuencia de cebador que incluye una sección de secuencia de nucleótidos complementaria a parte delal menos un adaptador y a parte de la parte restante de la secuencia de reconocimiento de la endonucleasade restricción; y- amplificar dichos fragmentos de restricción ligados a adaptador por elongación del uno o más cebadoresoligonucleotídicos hibridados;(c) Marcar la primera colección para obtener una primera colección marcada mediante el uso de al menos unadaptador marcado en la etapa (b);(d) Realizar, de forma consecutiva o simultáneamente, las etapas (a) y (b) con una segunda muestra y/o unamuestra posterior de ADNc, usando una marca diferente para cada muestra de ADNc, para obtener unasegunda colección marcada y/o una colección marcada posterior;(e) Combinar la primera colección marcada y la segunda colección marcada y/o una colección marcadaposterior para obtener una colección combinada;(f) Determinar al menos parte de las secuencias de nucleótidos de la colección marcada mediantesecuenciación de alto rendimiento;(g) Determinar la frecuencia de la secuencia de nucleótidos en la primera muestra de ADNc y la segundamuestra y/o una muestra posterior de ADN; y(h) Comparar la frecuencia de la secuencia de nucleótidos en la primera muestra de ADNc con la frecuencia dela secuencia de nucleótidos en la segunda muestra y/o una muestra posterior de ADNc para obtener niveles detranscripción relativos de la secuencia de nucleótidos en las muestras de ADNc.
Description
Estrategias mejoradas para elaboración de perfiles de transcritos usando tecnologías de secuenciación de alto rendimiento
Campo técnico
La presente invención se refiere a los campos de la biología molecular y la genética. La invención se refiere a estrategias mejoradas para determinar la secuencia de transcritos basadas en el uso de tecnologías de secuenciación de alto rendimiento. La invención se refiere además a estrategias mejoradas para la elaboración no sesgada de perfiles de transcritos.
Antecedentes de la invención
La elaboración de perfiles de transcritos es una de las tecnologías fundamentales usadas en la investigación actual en biotecnología. El principal dominio de aplicación de la elaboración de perfiles de transcritos es el descubrimiento de genes implicados en rasgos complejos. Esto incluye una amplia variedad de fenómenos biológicos tales como el descubrimiento de genes implicados en enfermedades (humanas) con el fin de identificar objetivos para el desarrollo de medicación (descubrimiento de objetivos), descifrar rutas bioquímicas que controlan la síntesis de biomoléculas (industria de la fermentación), analizar rasgos complejos para la cría de plantas y animales (descubrimiento de genes) y muchos otros.
Un segundo dominio de aplicación sigue la ruta inversa, es decir, usar la elaboración de perfiles de transcritos para la determinación diagnóstica rutinaria de perfiles de transcritos de (un subconjunto seleccionado de) genes con el fin de predecir un fenotipo complejo. Ejemplos de esta categoría son la clasificación molecular, el diagnóstico y la predicción de pronósticos clínicos de cáncer de mama humano (Van de Vijver et al., 2002; N. Engl. J. Med., vol. 347)25:1999-2009; van't Veer et al., 2002, Breast Cancer Res., vol. 5 (1): 57-8; www.agendia.com) y de carcinoma papilar de células renales (Yang et al., 2005). Se describen enfoques para la identificación de genes pertinentes basada en datos de elaboración de perfiles de transcritos recogidos en poblaciones secretoras por Schadt y sus colaboradores (2005, Sci. STKE, vol. 296:pre40). En resumen, la elaboración de perfiles de transcritos es de vital importancia en la investigación en ciencias biológicas.
Las tecnologías para la elaboración de perfiles de transcritos han evolucionado rápidamente durante los últimos 10 años. Hasta principios de los noventa (poco después de la disponibilidad generalizada de la PCR), la elaboración de perfiles de transcritos se realizaba mediante análisis de bandas northern o ensayos de protección de RNasa. Aunque estas técnicas son bastante específicas y sensibles (especialmente los ensayos de protección de RNasa), las limitaciones de estas tecnologías son que sólo se pueden analizar uno o unos pocos genes a la vez (rendimiento bajo), al mismo tiempo que los procedimientos son tediosos y requieren mucho tiempo. Además, ambos procedimientos requieren el uso de técnicas de marcaje radiactivo, lo que supone un peligro para la salud.
Con la aparición de la técnica de presentación diferencial (PD) en 1992 (Liang y Pardee, 1992, Science, vol. 257 (5072): 967-71) y muchas modificaciones y mejoras de la PD (p. ej., Ordered Differential Display, Matz et al., 1997, Nucl. Acids, Res., vol. 25(12):2541-2), se dio un paso hacia la elaboración de perfiles de transcritos multiplexados. Las características de la PD son que subconjuntos de genes aleatorios son el objetivo mediante la hibridación poco rigurosa de un cebador de PCR diseñado aleatoriamente con la muestra de ADNc que se va a analizar, dando como resultado la amplificación preferente de transcritos expresados que contienen secuencias con alta homología con el cebador de PCR usado. Posteriormente, los productos de amplificación se resuelven en geles de secuencia, dando como resultado un patrón identificador que representa los subconjuntos de genes transcritos. Aunque los procedimientos de PD tienen un rendimiento superior en comparación con las bandas northern y los ensayos de protección de RNasa, sus limitaciones son la reproducibilidad/solidez bastante baja de estas técnicas. Esto se debe, en parte, a la hibridación inespecífica del cebador de PCR aleatorio usado. En consecuencia, los patrones identificadores generados usando diferentes cebadores aleatorios no se dirigen sistemáticamente a subconjuntos diferentes (complementarios) de transcritos. Una desventaja adicional es que los procedimientos de PD requieren la preparación de geles planos o la detección por electroforesis en gel por capilaridad. Otra limitación más es que no se conoce el origen génico de las bandas observadas en las identificaciones, lo que requiere la escisión de la banda, la elución, la reamplificación y la secuenciación del ADN que se quiere revelar; esta última limitación la comparten otros procedimientos de elaboración de perfiles de transcritos a base de identificaciones. Finalmente, con la detección de 50-100 fragmentos por carril en un gel/rastro de capilaridad, la tecnología es moderadamente multiplexada.
El procedimiento de ADNc-AFLP (Bachem et al., 1996, Plant J., vol. 9 (5): 745-53) aborda dos de las principales limitaciones de la tecnología de PD, a saber, la reproducibilidad/solidez y la complementariedad de la información obtenida en los identificadores generados con diferentes cebadores de PCR. La solidez y la reproducibilidad del procedimiento de ADNc-AFLP es muy alta debido a que la amplificación de fragmentos de restricción ligados a adaptador usando selectivos AFLP® (Keygene N.V., Países Bajos; véanse, p. ej., el documento EP 0 534 858 y Vos P., et al. (1995). AFLP: a new technique for DNA fingerprinting. Nucleic Acids Research, vol. 23, No. 21, p. 44074414) cebadores se produce bajo condiciones altamente rigurosas, dando como resultado patrones identificadores altamente reproducibles. Además, el uso de cebadores de AFLP selectivos con diferentes nucleótidos selectivos
garantiza la obtención de identificadores que contienen información complementaria. Por consiguiente, la tecnología de ADNc-AFLP permite la toma de muestras reproducible de subconjuntos del transcriptoma. Otra ventaja del (ADNc-)AFLP (y la PD) es que no se necesita información de secuencia previa y, por lo tanto, la tecnología se puede aplicar a una amplia variedad de organismos. Las limitaciones del ADNc-AFLP son sus niveles moderados de multiplexación por carril/rastro y el hecho de que no se conoce de forma directa el origen génico de las bandas (véase también la PD).
Las limitaciones en los niveles de multiplexación de los procedimientos de elaboración de perfiles de transcritos anteriormente descritos se han abordado tanto por SAGE (análisis en serie de la expresión génica; Velculescu et al., 1995, Science, vol. 270 (5235): 484-7) como por secuenciación masiva de firmas en paralelo (MPSS: Brenner et al., 2000, Nature Biotechnology, vol. 18(6):630-4; Meyers et al., 2004, Nature Biotechnology, vol. 22(8):1006-11). Al igual que el ADNc-AFLP, ambos procedimientos usan enzimas de restricción de tipo IIS para cortar el ADNc de muestra, seguido por la ligación del adaptador.
En el SAGE, los fragmentos ligados a adaptador se concatenan posteriormente y se secuencian mediante secuenciación de Sanger. A partir del rastro de secuencia de Sanger se extraen marcas de secuencia corta de 14-20 pb, proporcionado información cuantitativa sobre los genes transcritos ("northern digital"). Comparando la frecuencia de las marcas entre muestras, se obtiene información sobre los niveles de expresión relativos entre muestras estudiadas, sin la necesidad de información de secuencia previa. Aunque esto da como resultado la determinación (precisa) de la abundancia relativa del transcrito en diferentes muestras, dadas las marcas de secuencia corta obtenidas es difícil evaluar de qué genes derivan las marcas, a menos que estén disponibles las colecciones de EST grandes o la secuencia completa del genoma del organismo estudiado y puedan someterse las secuencias de marcas a búsquedas de homología tales como el análisis BLAST (Basic Local Alignment Search Tool). Por consiguiente, aunque el SAGE es altamente multiplexado, reproducible y sólido, su valor se limita a organismos con genomas secuenciados. Otra limitación es que el procedimiento no es muy adecuado para procesar muestras grandes (rendimiento bajo) debido a los costes de la secuenciación de Sanger a gran escala.
Al contrario que el SAGE, la MPSS se basa en reacciones de secuenciación en fase sólida. Sin embargo, la MPSS presenta esencialmente las mismas limitaciones que el SAGE, es decir, que se obtienen marcas de secuencia muy cortas (aproximadamente 20 pb), lo que limita en gran medida el seguimiento posterior (identificación génica / conversión del ensayo) de marcas de secuencia interesantes en organismos para los que está disponible una secuencia (del genoma) limitada. En resumen, aunque el SAGE y la MPSS son tecnologías de elaboración de perfiles de transcritos sólidas y altamente multiplexadas que no requieren información de secuencia previa para su aplicación, su valor en la práctica se limita a organismos para los que se ha determinado la secuencia completa del genoma o están disponibles colecciones de EST grandes con el fin de conectar marcas de secuencia a genes. Ambos procedimientos son de bajo rendimiento y técnicamente complejos.
Los puntos fuertes conceptuales son que ambos procedimientos se basan en el muestreo estadístico de colecciones de transcritos (dando lugar a "northern digitales") en combinación con determinación de secuencias precisa, lo que permite estimaciones no sesgadas de niveles de transcripción (relativos) de muchos genes simultáneamente y el hecho de que la elaboración de perfiles de transcritos no presenta hibridación cruzada con sondas sobre soportes sólidos.
En 1995, se introdujeron las micromatrices de expresión génica (Schena et al., 1995, Science, vol. 270 (5235): 46770), lo que supuso un cambio paradigmático en el campo de la elaboración de perfiles de transcritos. Aunque inicialmente se usaban como sondas las llamadas micromatrices "moteadas" que contenían productos de PCR derivados de EST, en los años posteriores se ha centrado la atención en los chips de ADN de oligonucleótidos (Pease et al., 1994, Proc. Nat. Ac. Sci. USA, vol. 91(11):5022-6), debido a su mayor solidez y flexibilidad de escala. Actualmente, el mercado de la elaboración de perfiles de transcritos está dominado por chips de ADN de oligonucleótidos de diversos proveedores (p. ej., Affymetrix, Nimblegen, Agilent, etc.). La potencia de los chips de ADN reside en el gran número de secuencias de ADN que se pueden unir / sintetizar sobre su superficie, lo que permite la elaboración de perfiles de transcritos paralela masiva, permitiendo, p. ej., la elaboración de perfiles de transcritos para todos los genes humanos conocidos (= nivel de multiplexación de genes alto). Además, el procedimiento de fabricación de los chips y la hibridación se pueden automatizar y controlar, lo que permite un alto rendimiento y solidez, respectivamente. En consecuencia, los chips de ADN son el estado de la técnica para la elaboración de perfiles de transcritos en el año 2005. Sin embargo, aunque la capacidad de multiplexación, el rendimiento y la solidez son puntos fuertes muy importantes de los chips de ADN, dos importantes limitaciones de la elaboración de perfiles de transcritos basada en chips son que se necesita la información de secuencia para poder construir el chip y que la hibridación cruzada entre secuencias altamente homólogas tales como las derivadas de miembros de familias de genes duplicados puede afectar a la precisión de los resultados. Esta última es muy difícil de controlar/excluir, debido a que es una característica intrínseca de la detección basada en la hibridación. Debido a estos hechos, es difícil realizar la comparación de los resultados obtenidos usando chips de ADN de diferentes proveedores (que reflejan diferentes tecnologías de producción subyacentes y protocolos de aplicación) (Yauk et al., 2005, Nucleic Acids Research, vol. 32(15):e124). Dentro de una plataforma, es necesaria la validación de los resultados mediante un procedimiento independiente tal como ensayos de PCR en tiempo real (p. ej., TaqMan, Invader). Por tanto, los chips de ADN no proporcionan datos que se ajusten al concepto de un northern digital, pero son útiles para la determinación de los niveles de expresión relativos si se usa la misma plataforma para todas las
muestras.
Idealmente, una tecnología de elaboración de perfiles de transcritos es altamente multiplexada, es decir, se pueden estudiar muchos genes simultáneamente, de alto rendimiento, muy sólida y reproducible, altamente precisa (no presenta hibridación cruzada) y aplicable sin la necesidad de información de secuencia previa. La invención descrita a continuación proporciona procedimientos que cumplen tales criterios.
Sumario de la invención
Los presentes inventores han descubierto ahora que este problema se puede resolver con una estrategia diferente y que las tecnologías de secuenciación de alto rendimiento se pueden usar de forma eficaz en la elaboración de perfiles de transcritos.
La invención comprende emplear una tecnología que, preferentemente, divide el transcriptoma en subconjuntos reproducibles. Los subconjuntos se secuencian y se ensamblan en cóntigos que corresponden a transcritos individuales. Mediante la repetición de esta etapa de manera que se proporcione un subconjunto reproducible diferente, se obtienen diferentes conjuntos de cóntigos. Estos cóntigos diferentes se usan para ensamblar las secuencias proyecto de los transcritos. La invención no requiere conocimiento alguno de la secuencia y se puede aplicar a transcritos de cualquier complejidad. La invención también se puede aplicar a una combinación de transcritos, p. ej., derivados de diferentes tejidos del mismo organismo u organismos diferentes. La presente invención proporciona un acceso más ágil, fiable y rápido a cualquier transcrito de interés y, de este modo, permite acelerar el análisis de los transcritos.
La invención también se refiere a la determinación (no sesgada) de niveles relativos de transcritos de genes sin que sea necesaria información de secuencia de estos genes. Con este fin, se determina la frecuencia de una secuencia dentro de una muestra de ADNc mediante secuenciación de colecciones de complejidad reducida de dicha muestra de ADNc y hibridación de la secuencia para determinar el número de veces que se identifica la secuencia en las colecciones. Esto puede repetirse para una segunda muestra de ADNc y se pueden normalizar las frecuencias de las dos muestras de ADNc, en caso necesario, y compararse para determinar los niveles de transcripción relativos.
Definiciones
En la siguiente descripción y ejemplos se usan una serie de términos. Las definiciones siguientes se proporcionan con el fin de proporcionar una comprensión clara y consistente de la memoria descriptiva y las reivindicaciones, incluido el alcance que se da a tales términos. A menos que se definan de otro modo en el presente documento, todos los términos técnicos y científicos usados tienen el mismo significado que entiende comúnmente un experto en la técnica a la que pertenece la presente invención. Las divulgaciones de todas las publicaciones, solicitudes de patente, patentes y otras referencias se incorporan en el presente documento en su totalidad por referencia.
Ácido nucleico: un ácido nucleico de acuerdo con la presente invención puede incluir cualquier polímero u oligómero de bases de pirimidina y purina, preferentemente citosina, timina y uracilo, y adenina y guanina, respectivamente (véase Albert L. Lehninger, Principles of Biochemistry, en 793-800 (Worth Pub. 1982) que se incorpora en el presente documento por referencia en su totalidad para todos los fines). La presente invención contempla cualquier desoxirribonucleótido, ribonucleótido o componente de ácido nucleico peptídico, y cualquiera de sus variantes químicas, tales como formas metiladas, hidroximetiladas o glucosiladas de estas bases, y similares. Los polímeros u oligómeros pueden ser heterogéneos u homogéneos en su composición y pueden aislarse a partir de fuentes naturales o pueden producirse artificialmente o sintéticamente. Además, los ácidos nucleicos pueden ser ADN o ARN, o una mezcla de ellos, y pueden existir de forma permanente o transitoria, en forma monocatenaria o bicatenaria, incluidos estados homodúplex, heterodúplex e híbridos.
Reducción de la complejidad: el término reducción de la complejidad se usa para designar un procedimiento en el que se reduce la complejidad de una muestra de ácido nucleico, tal como ADN genómico, mediante la generación de un subconjunto de la muestra. Este subconjunto puede ser representativo de la muestra completa (es decir, complejo) y, preferentemente, es un subconjunto reproducible. En este contexto, reproducible significa que cuando se reduce la complejidad de la misma muestra usando el mismo procedimiento, se obtiene el mismo subconjunto, o al menos uno comparable. El procedimiento usado para la reducción de la complejidad puede ser cualquier procedimiento de reducción de la complejidad conocido en la técnica. Los ejemplos no limitantes de procedimientos de reducción de la complejidad incluyen AFLP® (Keygene N.V., Países Bajos; véase, p. ej., el documento EP 0 534 858), los procedimientos descritos por Dong (véanse, p. ej., los documentos WO 03/012118 y WO 00/24939), enlace indexado (Unrau, et al., 1994, Gene, 145:163-169), los descritos en los documentos US 2005/260628, WO 03/010328 y US 2004/10153, fraccionamiento del genoma (véase, p. ej., el documento WO 2004/022758), análisis en serie de la expresión génica (SAGE; véanse, p. ej. Velculescu et al., 1995, véase anteriormente, y Matsumura et al., 1999, The Plant Journal, vol. 20(6):719-726) y modificaciones del SAGE (véanse, p. ej., Powell, 1998, Nucleic Acids Research, vol. 26(14):3445-3446; y Kenzelmann y Mühlemann, 1999, Nucleic Acids Research, vol. 27(3):917918), microSAGE (véase, p. ej., Datson et al., 1999, Nucleic Acids Research, vol. 27(5).:1300-1307), secuenciación masiva de firmas en paralelo (MPSS; véanse, p. ej., Brenner et al., 2000, Nature Biotechnology, vol. 18:630-634 y Brenner et al., 2000, PNAS, vol. 97(4):1665-1670), colecciones de ADNc autosustraídas (Laveder et al., 2002,
Nucleic Acids Research, vol. 30(9):e38); amplificación múltiple de sondas dependiente de ligación en tiempo real (RT-MLPA; véase, p. ej., Eldering et al., 2003, vol. 31(23):e153), elaboración de perfiles de expresión de alta cobertura (HiCEP; véase, p. ej., Fukumura et al., 2003, Nucleic Acids Research, vol. 31(16):e94), un sistema de micromatrices universal como se divulga en Roth et al., 2004, Nature Biotechnology, vol. 22(4): 418-426, un procedimiento de sustracción de transcriptoma (véase p. ej. Li et al., Nucleic Acids Research, vol. 33(16):e136) y presentación de fragmentos (véase p. ej. Metsis et al., 2004, Nucleic Acids Research, vol. 32(16):e127). Los procedimientos de reducción de la complejidad usados en la presente invención tienen en común que son reproducibles. Reproducibles en el sentido de que cuando se reduce la complejidad de la misma muestra de la misma manera, se obtiene el mismo subconjunto de la muestra, en contraposición con una reducción de la complejidad más aleatoria tal como la microdisección o el uso de ARNm (ADNc) que representa una parte del genoma transcrito en un tejido seleccionado y cuya reproducibilidad depende de la selección del tejido, el tiempo de aislamiento y similares.
Marcaje: el término marcaje se refiere a la adición de una marca a una muestra de ácido nucleico con el fin de poder distinguirla de una segunda muestra o una muestra posterior de ácido nucleico. El marcaje se puede realizar, p. ej., mediante la adición de un identificador de secuencia durante la reducción de la complejidad o mediante cualquier otro procedimiento conocido en la técnica. Tal identificador de secuencia puede ser, p. ej., una secuencia de bases única de longitud variable pero definida que se usa exclusivamente para identificar una muestra de ácido nucleico específica. Ejemplos típicos de éstos son, por ejemplo, las secuencias ZIP. Con el uso de una marca de este tipo, se puede determinar el origen de una muestra tras su procesamiento adicional. En caso de combinar productos procesados que se originan a partir de muestras de ácido nucleico diferentes, se deberían identificar las diferentes muestras de ácido nucleico usando diferentes marcas.
Colección marcada: el término colección marcada se refiere a una colección de ácido nucleico marcado.
Secuenciación: el término secuenciación se refiere a la determinación del orden de los nucleótidos (secuencias de bases) en una muestra de ácido nucleico, p. ej., ADN o ARN.
Alinear y hibridación: el término "alinear" y "hibridación" quiere decir la comparación de dos o más secuencias de nucleótidos basada en la presencia de tramos cortos o largos de nucleótidos idénticos o similares. En la técnica se conocen varios procedimientos para la hibridación de secuencias de nucleótidos, como se explicará en detalle más adelante. En ocasiones, se usan los términos 'ensamblaje' o 'agrupación' como sinónimos, aunque estos términos no son técnicamente idénticos. La hibridación se produce basándose en la comparación de la máxima homología, mientras que el ensamblaje significa preparar un cóntigo basado en un solapamiento.
Rastreo de alto rendimiento: el rastreo de alto rendimiento, abreviado frecuentemente como HTS, es un procedimiento para experimentación científica especialmente pertinente a los ámbitos de la biología y la química. A través de una combinación de robots modernos y otros equipos de laboratorio especializados, permite a un investigador rastrear grandes cantidades de muestras de forma simultánea.
Secuenciación de alto rendimiento: determinación de la secuencia de una secuencia de nucleótidos usando técnicas de alto rendimiento.
Endonucleasa de restricción: una endonucleasa de restricción o enzima de restricción es una enzima que reconoce una secuencia de nucleótidos específica (sitio objetivo) en una molécula de ADN bicatenario y escindirá ambas hebras de la molécula de ADN en cada sitio objetivo.
Fragmentos de restricción: las moléculas de ADN producidas por digestión con endonucleasa de restricción se denominan fragmentos de restricción. Cualquier genoma dado (o ácido nucleico, independientemente de su origen) será digerido por una endonucleasa de restricción concreta en un conjunto discreto de fragmentos de restricción. Los fragmentos de ADN que resultan de la escisión con endonucleasas de restricción se pueden usar adicionalmente en una variedad de técnicas y se pueden detectar, por ejemplo, por electroforesis en gel.
Electroforesis en gel: con el fin de detectar fragmentos de restricción, puede ser necesario un procedimiento analítico para fraccionar moléculas de ADN bicatenario basándose en su tamaño. La técnica usada más comúnmente para lograr dicho fraccionamiento es la electroforesis en gel (por capilaridad). La velocidad a la que se mueven los fragmentos de ADN en geles de este tipo depende de su peso molecular; así, las distancias recorridas disminuyen a medida que aumenta la longitud del fragmento. Los fragmentos de ADN fraccionados por electroforesis en gel se pueden visualizar directamente mediante un procedimiento de tinción, p. ej., tinción con plata o tinción usando bromuro de etidio, si el número de fragmentos incluidos en el patrón es lo suficientemente pequeño. De forma alternativa, el tratamiento adicional de los fragmentos de ADN puede incorporar marcadores detectables en los fragmentos, tales como fluoróforos o marcadores radioactivos.
Ligación: la reacción enzimática catalizada por una enzima ligasa en la que se unen covalentemente dos moléculas de ADN bicatenario se denomina ligación. En general, ambas hebras de ADN se unen covalentemente, pero también se puede impedir la ligación de una de las dos hebras a través de la modificación química o enzimática de uno de los extremos de las hebras. En ese caso, la unión covalente se producirá sólo en una de las dos hebras de ADN.
Oligonucleótido sintético: las moléculas de ADN monocatenario que tienen preferentemente de aproximadamente 10 a aproximadamente 50 bases, que se pueden sintetizar químicamente, se denominan oligonucleótidos sintéticos. En general, estas moléculas de ADN sintéticas se diseñan para que tengan una secuencia de nucleótidos única o deseada, aunque se pueden sintetizar familias de moléculas que tiene secuencias relacionadas y que tienen composiciones de nucleótidos diferentes en posiciones específicas dentro de la secuencia de nucleótidos. El término oligonucleótido sintético se usará para hacer referencia a moléculas de ADN que tienen una secuencia de nucleótidos diseñada o deseada.
Adaptadores: moléculas de ADN bicatenario cortas con un número limitado de pares de bases, p. ej., de aproximadamente 10 a aproximadamente 30 pares de bases de longitud, que se diseñan de forma que se pueden ligar a los extremos de fragmentos de restricción. En general, los adaptadores se componen de dos oligonucleótidos sintéticos, que tienen secuencias de nucleótidos que son parcialmente complementarias entre sí. Al mezclar los dos oligonucleótidos sintéticos en solución bajo condiciones apropiadas, se hibridizarán entre sí formando una estructura bicatenaria. Después de la hibridación, un extremo de la molécula adaptadora está diseñado de forma que es compatible con el extremo de un fragmento de restricción y se puede ligar a él; el otro extremo del adaptador se puede diseñar para que no se pueda ligar, pero no es necesariamente el caso (adaptadores doblemente ligados).
Fragmentos de restricción ligados a adaptador: fragmentos de restricción que se han rematado mediante adaptadores como consecuencia de la ligación.
Cebadores: en general, el término cebadores se refiere a una hebra de ADN que puede cebar la síntesis de ADN. La polimerasa de ADN no puede sintetizar ADN de novo sin cebadores: sólo puede extender una hebra de ADN existente en una reacción en la que se usa la hebra complementaria como molde para dirigir el orden de los nucleótidos que se van a ensamblar. Se hará referencia a las moléculas de oligonucleótido sintéticas que se usan en una reacción en cadena de la polimerasa (PCR) como cebadores.
Amplificación de ADN: el término amplificación de ADN se usará normalmente para designar la síntesis in vitro de moléculas de ADN bicatenario usando PCR. Cabe destacar que existen otros procedimientos de amplificación y se puede usar en la presente invención sin apartarse de su esencia.
En Volkmuth et al, OMICS, Journal of Integrative biology vol 7, P143-159, 2003 se divulga un procedimiento para el análisis de la expresión cuantitativa en A. thaliana basado en ADNc-AFLP como tecnología de reducción de la complejidad seguida de secuenciación de Sanger.
Descripción detallada de la invención
La presente invención proporciona un procedimiento para determinar una secuencia de nucleótidos de ADNc que comprende las etapas de:
- (a)
- Proporcionar una primera muestra de ADNc;
- (b)
- Realizar una reducción de la complejidad reproducible de la primera muestra de ADNc para obtener una primera colección que comprende las etapas de:
-digerir el ADNc con al menos una endonucleasa de restricción para fragmentarlo en fragmentos de restricción;
-ligar los fragmentos de restricción con al menos un adaptador oligonucleotídico sintético bicatenario que tenga un extremo compatible con uno o ambos extremos de los fragmentos de restricción para producir fragmentos de restricción ligados a adaptador;
-poner en contacto dichos fragmentos de restricción ligados a adaptador con uno o más cebadores oligonucleotídicos bajo condiciones de hibridación, teniendo dichos uno o más cebadores oligonucleotídicos una secuencia de cebador que incluye una sección de secuencia de nucleótidos complementaria a parte del al menos un adaptador y a parte de la parte restante de la secuencia de reconocimiento de la endonucleasa de restricción; y
-amplificar dichos fragmentos de restricción ligados a adaptador por elongación del uno o más cebadores oligonucleotídicos hibridados;
- (c)
- Marcar la primera colección para obtener una primera colección marcada mediante el uso de al menos un adaptador marcado en la etapa (b);
- (d)
- Realizar, de forma consecutiva o simultáneamente, las etapas (a) y (b) con una segunda muestra y/o una muestra posterior de ADNc, usando una marca diferente para cada muestra de ADNc, para obtener una segunda colección marcada y/o una colección marcada adicional;
- (e)
- Combinar la primera colección marcada y la segunda colección marcada y/o una colección marcada adicional para obtener una colección combinada;
- (f)
- Determinar al menos parte de las secuencias de nucleótidos de la colección marcada mediante secuenciación de alto rendimiento;
- (g)
- Determinar la frecuencia de la secuencia de nucleótidos en la primera muestra de ADNc y la segunda muestra y/o una muestra adicional de ADN; y
- (h)
- Comparar la frecuencia de la secuencia de nucleótidos en la primera muestra de ADNc con la frecuencia de la secuencia de nucleótidos en la segunda muestra y/o una muestra posterior de ADNc para obtener niveles de transcripción relativos de la secuencia de nucleótidos en las muestras de ADNc. Hasta el momento, en la técnica de la tecnología de secuenciación, no se ha divulgado o sugerido el uso de esta reducción de la complejidad en combinación con la determinación de secuencia de ADNc de alto rendimiento para representar transcritos.
En la etapa (a) del procedimiento, se proporciona ADNc. En la técnica se conoce bien cómo preparar ADNc. Más adelante se expone un procedimiento para la preparación. Sin embargo, se puede usar cualquier procedimiento para la preparación de ADNc.
Habitualmente, el ADNc (ADN complementario) se prepara a partir de ARNm usando la transcriptasa inversa. En ese caso, la transcriptasa inversa sintetiza una hebra de ADN complementaria a un molde de ARN si está provista de un cebador que forma pares de bases con el ARN y contiene un grupo 3'-OH libre. Un cebador de este tipo puede ser,
p. ej., un cebador de oligo-dT que se aparea con la secuencia de poli-A del extremo 3' de la mayoría de las moléculas de ARNm eucariotas. El resto de la hebra de ADNc se puede sintetizar después en presencia de los cuatro desoxirribonucleósidos trifosfato. Posteriormente, se hidroliza la hebra de ARN del híbrido de ARN-ADN resultante, p. ej., elevando el pH. A diferencia del ARN, el ADN es resistente a la hidrólisis alcalina, de modo que la hebra de ADN permanece intacta. Un cebador alternativo puede ser un cebador aleatorio. El cebado aleatorio de ADNc puede ser beneficioso cuando la transcriptasa inversa no es capaz de transcribir totalmente un molde de ARNm o si existen estructuras secundarias. Otro cebador alternativo puede ser un cebador específico de secuencia.
En la técnica de la biología molecular se conocen bien procedimientos para el aislamiento de ARN a partir de células de un tejido de un organismo o un organismo mismo. Además, muchos kits para síntesis de ADNc comercialmente disponibles se pueden comprar, tal como, p. ej., de ABgene, Ambion, Applied Biosystems, BioChain, Bio-Rad, Clontech, GE Healthcare, GeneChoice, Invitrogen, Novagen, Qiagen, Roche Applied Science, Stratagene y similares. Procedimientos de este tipo se describen, p. ej., en Sambrook et al. (Sambrook, J., Fritsch, E.F., y Maniatis, T., en Molecular Cloning: A Laboratory Manual. Cold Spring Harbor Laboratory Press, NY, Vol. 1, 2, 3 (1989)). El ARN se puede aislar a partir de varias fuentes tales como un cultivo celular, un tejido, etc.
En la etapa (b) del procedimiento de acuerdo con la presente invención, se realiza una reducción de la complejidad sobre al menos una porción del ADNc para obtener una primera colección del ADNc que comprende fragmentos de ADNc. En la técnica se conocen muchos procedimientos para reducir la complejidad, como se indica en la sección de definiciones.
En una realización de la invención, la etapa de reducción de la complejidad de la muestra de ácido nucleico comprende cortar enzimáticamente la muestra de ácido nucleico en fragmentos de restricción, separar los fragmentos de restricción y seleccionar un grupo de fragmentos de restricción en particular. Opcionalmente, los fragmentos seleccionados se ligan después a secuencias adaptadoras que contienen moldes de cebadores de PCR/secuencias de unión.
En una realización de reducción de la complejidad, se usa una endonucleasa de tipo IIs para digerir la muestra de ácido nucleico y los fragmentos de restricción se ligan selectivamente a secuencias adaptadoras. Las secuencias adaptadoras pueden contener diversos nucleótidos en el saliente que se va a ligar y sólo se liga al fragmento y se amplifica posteriormente el adaptador con el conjunto de nucleótidos compatibles en el saliente. Esta tecnología se representa en la técnica como 'enlazadores de indexación'. Se pueden encontrar ejemplos de este principio, entre otros, en Unrau y Deugau (1994) Gene 145:163-169.
En una realización, el procedimiento de reducción de la complejidad utiliza dos endonucleasas de restricción que tienen diferentes sitios objetivo y frecuencias y dos secuencias adaptadoras diferentes para proporcionar fragmentos de restricción ligados a adaptador, tal como en el AFLP.
En una realización de la invención, la etapa de reducción de la complejidad comprende realizar una PCR cebada arbitrariamente sobre la muestra.
En una realización de la invención, la etapa de reducción de la complejidad comprende eliminar secuencias repetidas desnaturalizando y realineando el ADN y eliminando después los dúplex bicatenarios.
En determinadas realizaciones de la invención, la etapa de reducción de la complejidad comprende hibridar la muestra de ácido nucleico a una perla magnética que está unida a una sonda de oligonucleótidos que contiene una secuencia deseada. Esta realización puede comprender además la exposición de la muestra hibridada a una nucleasa de ADN monocatenario para eliminar el ADN monocatenario, activando una secuencia adaptadora que contiene una enzima de restricción de clase IIs para liberar la perla magnética. Esta realización puede comprender o
no la amplificación de la secuencia de ADN aislada. Además, la secuencia adaptadora puede usarse o no como molde para el cebador oligonucleotídico de la PCR. En esta realización, la secuencia adaptadora puede contener o no una marca o un identificador de secuencia.
En determinadas realizaciones de la invención, la reducción de la complejidad utiliza tecnología de presentación diferencial o tecnología READS (Gene Logic).
En determinadas realizaciones de la invención, el procedimiento de reducción de la complejidad comprende exponer la muestra de ADN a una proteína de unión de apareamiento erróneo y digerir la muestra con una exonucleasa de 3' a 5' y después una nucleasa monocatenaria. Esta realización puede incluir o no el uso de una perla magnética unida a la proteína de unión de apareamiento erróneo.
En una realización de la presente invención, la reducción de la complejidad comprende el procedimiento CHIP como se describe en otros puntos del presente documento o el diseño de cebadores de PCR dirigidos contra motivos conservados tales como SSR, regiones NBS (regiones de unión a nucleótidos), secuencias promotoras/potenciadoras, secuencias consenso teloméricas, genes de caja MADS, familias de genes de ATP-asa y otras familias de genes.
En la etapa (c) se determinan al menos parte de las secuencias de nucleótidos de los fragmentos de ADNc de la primera colección por secuenciación de alto rendimiento. Ejemplos no limitantes de procedimientos de secuenciación de alto rendimiento son los procedimientos divulgados en los documentos WO 03/004690, WO 03/054142, WO 2004/069849, WO 2004/070005, WO 2004/070007 y WO 2005/003375 (todos a nombre de 454 Corporation), por Seo et al. (2004) Proc. Natl. Acad. Sci. USA 101:5488-93, y tecnologías de Helios, Solexa, US Genomics, etcétera. Lo más preferido es que la secuenciación se realice usando el aparato y/o el procedimiento divulgado en los documentos WO 03/004690, WO 03/054142, WO 2004/069849, WO 2004/070005, WO 2004/070007 y WO 2005/003375 (todos a nombre de 454 Corporation). La tecnología descrita permite la secuenciación de 40 millones de bases en un solo ciclo y es 100 veces más rápida y más barata que la tecnología competidora basada en la secuenciación de Sanger y los instrumentos de electroforesis por capilaridad disponibles actualmente tales como MegaBACE (GE Healthcare) o ABI3700 (xI) (Applied Biosystems). La tecnología de secuenciación consiste, a grandes rasgos, en 4 etapas: 1) fragmentar el DNA y ligar adaptadores específicos a una colección de ADN monocatenario (ADNss); 2) alinear el ADNss con perlas y emulsionar las perlas en microrreactores de agua en aceite; 3) depositar las perlas portadoras de DNA en una placa PicoTiter®; y 4) secuenciación simultánea en varios pocillos mediante la generación de una señal lumínica de pirofosfato. El procedimiento se explicará con más detalle a continuación.
En la etapa (d) se alinean las secuencias de nucleótidos de los fragmentos de ADNc de la primera colección de la etapa (d) para generar cóntigos de la primera colección.
Mediante la construcción de cóntigos a partir de secuencias, el procedimiento de ensamblaje será computacionalmente menos complejo y, por lo tanto, más rápido de realizar. Alineando las secuencias de la colección, se pueden construir cóntigos para cada fragmento de restricción del conjunto de fragmentos de restricción para cada combinación de cebador. Esto da lugar a un conjunto de cóntigos, cada uno correspondiente a un fragmento de restricción en particular. Como consecuencia, cada fragmento obtenido a partir de la restricción del ADNc con la al menos una endonucleasa de restricción tiene ahora una secuencia determinada (cóntigo).
En la técnica se conocen bien procedimientos de hibridación de secuencias con fines de comparación. Diversos programas y algoritmos de hibridación no limitantes se describen en Smith y Waterman (1981) Adv. Appl. Math. 2:482; Needleman y Wunsch (1970) J. Mol. Biol. 48:443; Pearson y Lipman (1988) Proc. Natl. Acad. Sci. EE.UU. 85:2444; Higgins y Sharp (1988) Gene 73:237-244; Higgins y Sharp (1989) CABIOS 5:151-153; Corpet et al. (1988) Nucl. Acids Res. 16:10881-90; Huang et al. (1992) Computer Appl. in the Biosci. 8:155-65; y Pearson et al. (1994) Meth. Mol. Biol. 24: 307-31. Altschul et al. (1994) Nature Genet. 6:119-29 (incorporado en el presente documento por referencia) presenta una consideración detallada de los procedimientos de hibridación de secuencias y cálculos de homología.
La herramienta de búsqueda de hibridación local básica del NCBI (BLAST) (Altschul et al., 1990) está disponible de varias fuentes, incluido el National Center for Biological Information (NCBI, Bethesda, Md.) y en Internet, para su uso en relación con los programas de análisis de secuencia blastp, blastn, blastx, tblastn y tblastx. Se puede acceder a ella en <http://www.nc-bi.nlm.nih.gov/BLAST/>. Una descripción de cómo determinar la identidad de secuencias usando este programa está disponible en <http: //www.ncbi.nlm.nih.gov/BLAST/blast_help.html>. Una aplicación adicional puede ser en detección de microsatélites (véase Varshney et al. (2005) Trends in Biotechn. 23(1):48-55.
En una realización, la hibridación se realiza sobre datos de secuencia que se han recortado para los adaptadores/el cebador y/o los identificadores, pero con secuencias de reconocimiento de enzimas de restricción reconstruidas, es decir, usando sólo los datos de secuencia de los fragmentos que derivan del ADNc. Normalmente, los datos de secuencia obtenidos se usan para identificar el origen del fragmento (es decir, de qué muestra), las secuencias derivadas de la secuencia adaptadora y/o identificadora se eliminan de los datos y se realiza la hibridación en este conjunto recortado.
En la etapa (e), se determina la secuencia de nucleótidos del ADNc, p. ej., ensamblando las secuencias.
Dicho procedimiento es útil, p. ej, para determinar el número de secuencias diferentes presentes en un ADNc o una fracción de complejidad reducida de dicho ADNc, o para descubrir la expresión de determinados genes.
En una realización, la etapa (a) comprende las etapas de: i) proporcionar una muestra biológica; ii) aislar el ARNm o el RNA total a partir de la muestra biológica; iii) sintetizar ADNc a partir del ARNm o el RNA total.
En una realización, la secuenciación de alto rendimiento se realiza sobre un soporte sólido tal como un perla (véanse, p. ej., los documentos WO 03/004690, WO 03/054142, WO 2004/069849, WO 2004/070005, WO 2004/070007 y WO 2005/003375 (todos a nombre de 454 Corporation)). Un procedimiento de secuenciación de este tipo es particularmente adecuado para la secuenciación barata y eficaz de muchas muestras simultáneamente.
En una realización adicional, la secuenciación de alto rendimiento se basa en la secuenciación por síntesis, preferentemente en la pirosecuenciación. La pirosecuenciación se conoce en la técnica y se describe, entre otros, en www.biotagebio.com; www.pyrosequencing.com, sección technology. Además, la tecnología se aplica, p. ej., en los documentos WO 03/004690, WO 03/054142, WO 2004/069849, WO 2004/070005, WO 2004/070007 y WO 2005/003375 (todos a nombre de 454 Life Sciences). Es una técnica rápida y altamente reproducible, particularmente adecuada para la secuenciación de alto rendimiento.
En una realización preferida, la secuenciación de alto rendimiento comprende las etapas de:
(c1) ligar adaptadores de secuenciación a los fragmentos;
(c2) alinear fragmentos ligados a adaptadores de secuenciación con perlas, alineándose cada perla con un solo fragmento;
(c3) emulsionar las perlas en microrreactores de agua en aceite, comprendiendo cada microrreactor de agua en aceite una sola perla;
(c4) realizar una PCR de la emulsión para amplificar fragmentos ligados a adaptadores de secuencia sobre la superficie de las perlas;
(c5) seleccionar / enriquecer perlas que contienen fragmentos ligados a adaptadores de secuenciación amplificados;
(c6) cargar las perlas en pocillos, comprendiendo cada pocillo una sola perla; y
(c7) generar una señal de pirofosfato.
En la etapa c1), se ligan adaptadores de secuenciación a los fragmentos de la colección. Dicho adaptador de secuenciación incluye al menos una región "clave" para su hibridación con una perla, una región de cebador de secuenciación y una región de cebador de PCR. Por tanto, se obtienen fragmentos adaptados.
En la etapa (c2), se alinean fragmentos ligados a adaptadores de secuenciación con perlas, alineándose cada perla con un solo fragmento. A los fragmentos ligados a adaptador de secuenciación agrupados se les añaden perlas en exceso con el fin de garantizar la hibridación de un sólo fragmento adaptado por perla para la mayoría de las perlas (distribución de Poisson).
En la etapa (c3), se emulsionan las perlas en microrreactores de agua en aceite, comprendiendo cada microrreactor de agua en aceite una sola perla.
En la etapa c4), se realiza una PCR de la emulsión para amplificar los fragmentos ligados a adaptadores de secuenciación sobre la superficie de las perlas. Los reactivos de PCR están presentes en los microrreactores de agua en aceite, lo que permite que se produzca una reacción de PCR dentro de los microrreactores.
En la etapa c5) se seleccionan/enriquecen las perlas que contienen fragmentos ligados a adaptadores de secuenciación amplificados.
En la etapa c6), se cargan las perlas en pocillos, comprendiendo cada pocillo una sola perla. Preferentemente, los pocillos forman parte de una placa PicoTiter™, lo que permite la secuenciación simultánea de una gran cantidad de fragmentos. Después de la adición de perlas portadoras de enzima, se determina la secuencia de los fragmentos usando pirosecuenciación.
En la etapa c7), se genera una señal de pirofosfato. En etapas sucesivas, la placa PicoTiter™ y las perlas, así como las perlas de enzima, se someten a diferentes desoxirribonucleótidos en presencia de reactivos de secuenciación convencionales y, tras la incorporación de un desoxirribonucleótido, se genera una señal lumínica que se registra. La incorporación del nucleótido correcto generará una señal de pirosecuenciación que se puede detectar por medios conocidos en la técnica.
En una realización preferida del procedimiento de acuerdo con la presente invención, se realiza la reducción de la complejidad mediante un procedimiento que comprende las etapas de:
i). Digerir el ADNc con al menos una endonucleasa de restricción para fragmentarlo en fragmentos de restricción;
ii). Ligar los fragmentos de restricción con al menos un adaptador oligonucleotídico sintético bicatenario que tenga un extremo compatible con uno o ambos extremos de los fragmentos de restricción para producir fragmentos de restricción ligados a adaptador;
iii). Poner en contacto dichos fragmentos de restricción ligados a adaptador con uno o más cebadores oligonucleotídicos bajo condiciones de hibridación, teniendo dichos uno o más cebadores oligonucleotídicos una secuencia de cebador que incluye una sección de secuencia de nucleótidos complementaria a parte del al menos un adaptador y a parte de la parte restante de la secuencia de reconocimiento de la endonucleasa de restricción; y
iv). Amplificar dichos fragmentos de restricción ligados a adaptador por elongación del uno o más cebadores oligonucleotídicos hibridados.
El procedimiento anterior de reducción de la complejidad también se denomina AFLP® (Keygene N.V., Países Bajos; véanse, p. ej., el documento EP 0 534 858 y Vos et al. (1995). AFLP: a new technique for DNA fingerprinting, Nucleic Acids Research, vol. 23; n.º 21, 4407-4414. El AFLP es un procedimiento altamente reproducible para reducir la complejidad y, por lo tanto, es particularmente adecuado para el procedimiento de acuerdo con la presente invención. El AFLP es un procedimiento para la amplificación selectiva de fragmentos de restricción. El AFLP no requiere ninguna información de secuencia previa y se puede realizar sobre cualquier ADNc de partida.
Por tanto, el AFLP proporciona un subconjunto reproducible de fragmentos ligados a adaptador. Una variante útil de la tecnología de AFLP no usa nucleótidos selectivos (es decir, cebadores +0/+0) y en ocasiones se denomina PCR de enlazador. Esto también permite una reducción de la complejidad muy adecuada, en particular para transcritos y ADNc obtenido a partir de ellos.
En la etapa i), se digiere el ADNc con al menos una endonucleasa de restricción para fragmentarlo en fragmentos de restricción. En determinadas realizaciones, se usan al menos dos endonucleasas de restricción. En otras realizaciones, se pueden usar tres o más endonucleasas de restricción. Las endonucleasas de restricción pueden ser cortadoras frecuentes (es decir, normalmente cortadoras de 4 y 5, es decir, endonucleasas de restricción que tienen una secuencia de reconocimiento de 4 o 5 nucleótidos, respectivamente) o pueden ser cortadoras poco frecuentes (es decir, que normalmente tienen un sitio de reconocimiento de 6 o más nucleótidos, respectivamente), o sus combinaciones. En determinadas realizaciones, se puede usar una combinación de una cortadora poco frecuente y una frecuente. Las endonucleasas de restricción pueden ser de cualquier tipo, incluidos los tipos IIs y IIsa, que cortan el ADNc fuera de su secuencia de reconocimiento, en uno o en ambos lados de la secuencia de reconocimiento.
En la etapa ii), se ligan los fragmentos de restricción con al menos un adaptador oligonucleotídico sintético bicatenario que tiene un extremo compatible con uno o ambos extremos de los fragmentos de restricción para producir fragmentos de restricción ligados a adaptador. Preferentemente, los adaptadores son tales que el sitio de reconocimiento de la endonucleasa no se restablece tras la ligación del adaptador. También es posible emplear dos
o más adaptadores diferentes, por ejemplo, en el caso de que se usen dos o más endonucleasas de restricción en la etapa i). Esta etapa de ligación proporciona fragmentos de restricción ligados a adaptador. Los adaptadores pueden ser de extremos romos o pueden contener un saliente, en función de la(s) endonucleasa(s) de restricción que se use(n) en la etapa i).
En determinadas realizaciones, el adaptador puede ser un conjunto de adaptadores conocidos como enlazadores de indexación (Unrau, et al., 1994, Gene, 145:163-169).
En la etapa iii), dichos fragmentos ligados a adaptador se ponen en contacto con uno o más cebadores oligonucleotídicos bajo condiciones de hibridación. El uno o más cebadores oligonucleotídicos tienen una secuencia de cebador que incluye una sección de secuencia de nucleótidos complementaria a parte del al menos un adaptador y a parte de la parte restante de la secuencia de reconocimiento de la endonucleasa de restricción.
Las condiciones de hibridación estándar son condiciones para hibridación selectiva. Hibridación selectiva se refiere a hibridación, bajo condiciones de hibridación rigurosas, de una secuencia de ácido nucleico con una secuencia objetivo de ácido nucleico específica hasta un grado detectable mayor (p. ej., al menos 2 veces más que el nivel de base) que su hibridación con secuencias de ácido nucleico que no son objetivo y a la exclusión sustancial de ácidos nucleicos que no son objetivo. Los términos "condiciones rigurosas" o "condiciones de hibridación rigurosas" incluyen referencias a las condiciones bajo las cuales una sonda hibridará con su secuencia objetivo, en un grado detectable mayor que con otras secuencias (p. ej., al menos 2 veces más que el nivel de base). Las condiciones rigurosas dependen de la secuencia y serán diferentes en circunstancias diferentes. Controlando la rigurosidad de las condiciones de hibridación y/o de lavado, se pueden identificar secuencias objetivo que son complementarias al 100 % con la sonda (sondeo homólogo). De forma alternativa, se pueden ajustar las condiciones de rigurosidad para
permitir algunos apareamientos erróneos en secuencias, de forma que se detecten grados de similitud inferiores (sondeo heterólogo). En general, una sonda tiene menos de aproximadamente 100 nucleótidos de longitud, opcionalmente, no más de 50 o 25 nucleótidos de longitud. Normalmente, condiciones rigurosas serán aquellas en las que la concentración de sal es de menos de aproximadamente 1,5 M de iones Na, normalmente una concentración de aproximadamente 0,01 a 1,0 M de iones Na (u otras sales) a pH de 7,0 a 8,3 y la temperatura es de al menos aproximadamente 30 ºC para sondas cortas (p. ej., de 10 a 50 nucleótidos) y de al menos aproximadamente 60 ºC para sondas largas (p. ej., mayores de 50 nucleótidos). Las condiciones rigurosas también se pueden lograr con la adición de agentes desestabilizantes tales como formamida. Las condiciones poco rigurosas ejemplares incluyen hibridación con una solución tamponadora de formamida del 30 al 35 %, NaCl 1 M, SDS al 1 % (dodecilsulfato de sodio) a 37 °C y un lavado en SSC de 1x a 2x (20xSSC = NaCl 3,0 M/citrato trisódico 0,3 M) a de 50 a 55 °C. Las condiciones moderadamente rigurosas ejemplares incluyen hibridación en formamida del 40 al 45 %, NaCl 1 M, SDS al 1 % a 37 °C y un lavado en SSC de 0,5x a 1x a de 55 a 60 °C. Las condiciones muy rigurosa s ejemplares incluyen hibridación en formamida al 50 %, NaCl 1 M, SDS al 1 % a 37 °C y un lavado en SSC 0,1x a de 60 a 65 °C. Normalmente, la especificidad es la fun ción de los lavados post hibridación, siendo los factores críticos la fuerza iónica y la temperatura de la solución de lavado final. Para híbridos de ADN-ADN, se puede aproximar la Tm a partir de la ecuación de Meinkoth y Wahl, Anal. Biochem., 138:267-284 (1984): Tm = 81,5 °C + 16,6 (log M) + 0,41 (% de GC) - 0,61 (% de form) - 500 / L; donde M es la molaridad de cationes monovalentes, % de GC es el porcentaje de nucleótidos de guanosina y citosina en el ADN, % de form es el porcentaje de formamida en la solución de hibridación y L es la longitud del híbrido en pares de bases. La Tm es la temperatura (a fuerza iónica y pH definidos) a la que el 50 % de una secuencia objetivo complementaria hibrida con una sonda perfectamente apareada. La Tm se reduce en aproximadamente un 1 ºC por cada 1 % de apareamiento erróneo; por tanto, la Tm y las condiciones de hibridación y/o de lavado se pueden ajustar para hibridar secuencias de la identidad deseada. Por ejemplo, si se buscan secuencias con >90 % de identidad, se puede reducir la Tm aproximadamente 10 ºC. En general, se seleccionan condiciones rigurosas aproximadamente 5 ºC más bajas que el punto de fusión térmico (Tm) para la secuencia específica y su complemento a una fuerza iónica y pH definidos. Sin embargo, las condiciones altamente rigurosas pueden utilizar una hibridación y/o un lavado a 1, 2, 3 o 4 ºC menos que el punto de fusión térmica (Tm); las condiciones moderadamente rigurosas pueden utilizar una hibridación y/o un lavado a 6, 7, 8, 9 o 10 ºC menos que el punto de fusión térmica (Tm); las condiciones poco rigurosas pueden utilizar una hibridación o un lavado a 11, 12, 13, 14, 15 o 20 ºC menos que el punto de fusión térmica (Tm). Usando la ecuación, las composiciones de hibridación y de lavado y la Tm deseada, los expertos en la técnica entenderán que las variaciones de la rigurosidad de las soluciones de hibridación y/o de lavado se describen de manera inherente. Si el grado deseado de apareamiento erróneo da lugar a una Tm de menos de 45 ºC (solución acuosa) o 32 ºC (solución de formamida), se prefiere aumentar la concentración de SSC de forma que se pueda usar una temperatura más alta. Una guía extensa para para la hibridación de ácidos nucleicos se encuentra en Tijssen, Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes, parte 1, capítulo 2 "Overview of principles of hybridization and the strategy of nucleic acid probe assays", Elsevier, N.Y. (1993); y en Current Protocols in Molecular Biology, capítulo 2, Ausubel, et al., Ed., Greene Publishing y Wiley-Interscience, Nueva York (1995).
Cuando se emplean dos o más endonucleasas de restricción, es probable que se usen dos o más cebadores oligonucleotídicos en la etapa iii), dependiendo del sitio de reconocimiento de la endonucleasa. El/los cebador(es) oligonucleotídico(s) tiene/tienen una secuencia de cebador que incluye una secuencia de nucleótidos complementaria con el al menos un adaptador y con parte de la parte restante de la secuencia de reconocimiento de la endonucleasa de restricción más, opcionalmente, la parte restante de la secuencia de reconocimiento de la endonucleasa de restricción, como se explica con más detalle en el documento EP 0 534 858 y en Vos et al. ((1995). AFLP: a new technique for DNA fingerprinting, Nucleic Acids Research, vol. 23, n.º 21, 4407-4414). Normalmente, la parte de la secuencia de reconocimiento es la parte que queda después de la restricción de la secuencia con la endonucleasa de restricción. En resumen, por lo tanto, el/los cebador(es) es/son complementario(s) al menos a la parte conocida de los fragmentos de restricción ligados a adaptador.
En la etapa iv), se amplifican dichos fragmentos de restricción ligados a adaptador por elongación del uno o más cebadores oligonucleotídicos hibridados. Preferentemente, la amplificación se lleva a cabo usando PCR, que es una técnica bien conocida en la técnica.
En una realización preferida de la invención, el cebador comprende además una secuencia seleccionada en el extremo 3' de la secuencia del cebador, comprendiendo dicha secuencia seleccionada 1-10 nucleótidos selectivos que son complementarios a una sección situada inmediatamente adyacente a la parte restante de la secuencia de reconocimiento de la endonucleasa de restricción. Normalmente, la parte de la secuencia de reconocimiento es la parte que queda después de la restricción de la secuencia con la endonucleasa de restricción. Preferentemente, en su extremo 3', el/los cebador(es) contiene(n) una secuencia seleccionada. La secuencia seleccionada comprende un conjunto de 1-10 nucleótidos seleccionados anteriormente, preferentemente 1-8 nucleótidos seleccionados, preferentemente 1-5, más preferentemente 1-3. Un cebador ejemplar puede tener la siguiente estructura ilustrativa (para 2 nucleótidos selectivos (AC)) "5'-región adaptadora específica-región específica de secuencia de restricciónAC-3'". Por tanto, este cebador ejemplar contiene 2 nucleótidos selectivos AC que sólo amplificarán fragmentos ligados a adaptador que contienen los TG complementarios como los dos primeros nucleótidos que siguen a la parte conocida de los fragmentos de restricción ligados a adaptador, es decir, que siguen a los restos del sitio de
reconocimiento de la endonucleasa de restricción.
Para una descripción adicional del AFLP, sus ventajas, sus realizaciones, así como las técnicas, enzimas, adaptadores, cebadores y compuestos y herramientas adicionales usados en él, se hace referencia a los documentos US 6.045.994, EP-B-0 534 858, EP 976835 y EP 974672, WO01/88189 y Vos et al. Nucleic Acids Research, 1995, 23, 4407-4414.
En una realización, dicho adaptador comprende además una secuencia identificadora. Una secuencia identificadora de este tipo puede ser, p. ej., una secuencia de bases única de longitud variable usada para indicar el origen de la colección obtenida mediante reducción de la complejidad.
La presente invención también se refiere a un procedimiento para determinar la frecuencia de una secuencia de nucleótidos que comprende las etapas de:
a) Proporcionar ADNc;
b) Realizar una reducción de la complejidad sobre al menos una porción del ADNc para obtener una primera colección del ADNc que comprende fragmentos de ADNc;
c) Determinar al menos parte de las secuencias de nucleótidos de los fragmentos de ADNc de la primera colección por secuenciación; y
d) Determinar la frecuencia de una secuencia de nucleótidos.
En la etapa (a) del procedimiento, se proporciona ADNc. En la técnica se conoce bien cómo preparar ADNc y anteriormente se proporciona un procedimiento adecuado. El ADNc puede derivarse de cualquier fuente, como también se expone anteriormente.
En la etapa (b) del procedimiento, se realiza una reducción de la complejidad sobre al menos una porción del ADNc para obtener una primera colección del ADNc que comprende fragmentos de ADNc. La reducción de la complejidad se puede realizar mediante cualquier procedimiento conocido en la técnica, como se expone anteriormente.
En la etapa (c) del procedimiento de acuerdo con la invención, se determinan al menos parte de las secuencias de nucleótidos de los fragmentos de ADNc de la primera colección por secuenciación. La secuenciación se puede realizar mediante cualquier procedimiento conocido en la técnica, incluido el conocido procedimiento de Sanger (didesoxi). En una realización preferida, se realiza la secuenciación usando secuenciación de alto rendimiento, lo que permite la secuenciación simultánea de varias muestras. Los procedimientos preferidos para la secuenciación de alto rendimiento se exponen anteriormente.
En la etapa (d) del procedimiento de acuerdo con la invención, se determina la frecuencia de una secuencia de nucleótidos. La frecuencia de una secuencia de nucleótidos se puede determinar, p. ej., mediante el procedimiento siguiente. Se puede usar la hibridación de las secuencias de nucleótidos de fragmentos de ADNc para recoger secuencias de nucleótidos derivadas del mismo gen transcrito y para contar estas secuencias de nucleótidos. Queda pendiente establecer si las secuencias de nucleótidos derivan del mismo gen transcrito mediante homología entre las secuencias. Para los propósitos de la presente invención, se supone que las secuencias de nucleótidos derivan del mismo gen transcrito cuando son al menos el 95, 96, 97, 98, 99, 100 % homólogas en una longitud de al menos 10, preferentemente al menos 15, más preferentemente al menos 20, aún más preferentemente al menos 25, 30, 40, 50, 100, 150, 200 nucleótidos. El procedimiento puede apoyarse en interpretaciones estadísticas tales como una prueba de la T para demostrar estadísticamente diferentes frecuencias. También es posible elaborar una simple clasificación basada en el número de secuencias identificadas. Supóngase que en la muestra 1 una secuencia de nucleótidos del gen (desconocido) "X" se mide 10 veces (siendo 10 el número de secuencias de nucleótidos que tienen, p. ej., una homología de secuencia del 98 %) y en la muestra 2 la misma secuencia se mide 20 veces. En este caso, es probable que el nivel de transcripción del gen X en la muestra 2 sea el doble que en la muestra 1, con la condición de que el número total de secuencias determinadas para las muestras 1 y 2 sea el mismo; por lo tanto, la elaboración precisa de perfiles de transcritos, puede requerir normalización entre muestras y/o comparar las frecuencias de secuencias derivadas del gen "X" con las de los llamados genes de mantenimiento, cuyos niveles de transcripción relativos se suponen constantes a través de varias muestras. La clasificación de perfiles de transcripción relativa entre muestras en relación con las características fenotípicas de las muestras proporciona información sobre qué genes influyen en la aparición de diferentes fenotipos. El término fenotipos incluye todo tipo de características de un organismo, p. ej., estado de enfermedad, etcétera.
Para la evaluación estadística del número de secuencias de nucleótidos por gen (es decir, un northern digital) es importante garantizar la secuenciación redundante de los fragmentos de ADNc. Como tal, puede ser útil establecer una complejidad de colección de secuencias antes de realizar el experimento y ajustar según el número de lecturas de secuencia necesario para obtener suficientes secuencias. Por ejemplo, una muestra de ADNc típica comprende 8.000-16.000 transcritos diferentes. En el caso de que se use ADNc-AFLP +0/+1, suponiendo que se usan dos endonucleasas de restricción que reconocen una secuencia de 4 nucleótidos, que se dirigen aproximadamente al 80 % del número total de transcritos, la mezcla de complejidad reducida comprenderá aproximadamente 1.600-3.200
transcritos. Con una secuenciación 20 veces redundante, esto equivale a de 32.000 a 64.000 lecturas necesarias por muestra. Esto es suficiente para poder determinar también los niveles de transcritos de genes que se expresan a niveles relativamente bajos.
Un procedimiento muy adecuado para determinar la complejidad de la colección de secuencias se describe en el documento WO 03/010328.
La invención también se refiere a un procedimiento para determinar los niveles de transcripción relativos de una secuencia de nucleótidos en muestras de ADNc que comprende las etapas de:
a) Determinar la frecuencia de una secuencia de nucleótidos en una primera muestra de ADNc realizando un procedimiento como se define en la reivindicación 2 sobre dicha primera muestra de ADNc;
b) Determinar la frecuencia de la misma secuencia de nucleótidos en una segunda muestra y/o en una muestra posterior de ADNc realizando un procedimiento como se define en la reivindicación 2 sobre dicha segunda muestra y/o una muestra posterior de ADNc; y
c) Comparar la frecuencia de la secuencia de nucleótidos en dicha primera muestra de ADNc con la frecuencia de la misma secuencia de nucleótidos en dicha segunda muestra y/o una muestra posterior de ADNc para obtener niveles de transcripción relativos de la secuencia de nucleótidos.
En la etapa (a) del procedimiento, se determina la frecuencia de una secuencia de nucleótidos en una primera muestra de ADNc realizando un procedimiento como se define en la reivindicación 2 sobre dicha primera muestra de ADNc.
En la etapa (b) del procedimiento, se determina la frecuencia de la misma secuencia de nucleótidos en una segunda muestra y/o una muestra posterior de ADNc realizando un procedimiento como se definen en la reivindicación 2 sobre dicha segunda muestra y/o una muestra posterior de ADNc.
En la etapa (c), se compara la frecuencia de la secuencia de nucleótidos en dicha primera muestra de ADNc con la frecuencia de la misma secuencia de nucleótidos en dicha segunda muestra y/o una muestra posterior de ADNc para obtener niveles de transcripción relativos de la secuencia de nucleótidos.
Conocer dichos niveles de transcripción relativos puede ser importante para establecer los transcritos importantes para determinados fenotipos, como se analiza anteriormente.
La invención también se refiere a un procedimiento para determinar niveles de transcripción relativos de una secuencia de nucleótidos en muestras de ADNc que comprende las etapas de:
a) Proporcionar una primera muestra de ADNc;
b) Realizar una reducción de la complejidad sobre la primera muestra de ADNc para obtener una primera colección;
c) Marcar la primera colección para obtener una primera colección marcada;
d) Realizar, de forma consecutiva o simultáneamente, las etapas (a) y (b) con una segunda muestra y/o una muestra posterior de ADNc, preferentemente usando una marca diferente para cada muestra de ADNc, para obtener una segunda colección marcada y/o una colección marcada posterior;
e) Combinar la primera colección marcada y la segunda colección marcada y/o una colección marcada posterior para obtener una colección combinada;
f) Determinar al menos parte de las secuencias de nucleótidos de la colección marcada mediante secuenciación;
g) Determinar la frecuencia de la secuencia de nucleótidos en la primera muestra de ADNc y la segunda muestra y/o una muestra posterior de ADN; y
h) Comparar la frecuencia de la secuencia de nucleótidos en la primera muestra de ADNc con la frecuencia de la secuencia de nucleótidos en la segunda muestra y/o una muestra posterior de ADNc para obtener niveles de transcripción relativos de la secuencia de nucleótidos en las muestras de ADNc.
En la etapa (a), se proporciona una primera muestra de ADNc. Un muestra de ADNc se puede obtener como se analiza anteriormente.
En la etapa (b), se realiza una reducción de la complejidad sobre la primera muestra de ADNc para obtener una primera colección. La reducción de la complejidad se puede realizar mediante cualquier técnica, pero preferentemente se realiza por medio de la técnica AFLP© de Keygene.
En la etapa (c), se marca la primera colección para obtener una primera colección marcada. El marcaje puede
producirse simultáneamente con la etapa (b) de reducción de la complejidad. Este marcaje simultáneo se puede lograr, p. ej., por AFLP, usando adaptadores que comprenden un único identificador (nucleótido) para cada muestra.
El marcaje está destinado a distinguir entre muestras de origen diferente, p. ej., obtenidas a partir de diferentes líneas de plantas, cuando se combinan dos o más colecciones de complejidad reducida de dos o más muestras de ADNc para obtener una colección combinada. Por tanto, se usan preferentemente diferentes marcas para preparar las colecciones marcadas de la primera muestra de ADNc y la segunda muestra o una muestra posterior de ADNc. Cuando se usan, por ejemplo, cinco muestras de ácido nucleico, se pretende obtener cinco colecciones marcadas diferentes, denotando las cinco marcas diferentes las correspondientes muestras originales.
La marca puede ser cualquier marca conocida en la técnica para distinguir muestras de ácido nucleico, pero preferentemente es una secuencia identificadora corta. Una secuencia identificadora de este tipo puede ser, p. ej., una secuencia de bases única de longitud variable usada para indicar el origen de la colección obtenida mediante reducción de la complejidad. La incorporación de una marca de oligonucleótido en un adaptador o cebador es muy conveniente, ya que no se necesitan etapas adicionales para marcar una colección. Una secuencia identificadora de este tipo puede ser de longitud variable, en función del número de muestras de ácido nucleico que se van a comparar. Una longitud de aproximadamente 4 bases (44 = 256 secuencias marcadoras diferentes posibles) es suficiente para distinguir entre el origen de un número limitado de muestras (hasta 256), aunque se prefiere que las secuencias marcadoras difieran en más de una base entre las muestras que se van a distinguir. En caso necesario, se puede ajustar la longitud de las secuencias marcadoras en consecuencia.
En la etapa (d), se realizan, de forma consecutiva o simultáneamente, las etapas (a) y (b) con una segunda muestras
o una muestra posterior de ADNc, preferentemente usando una marca diferente para cada muestra de ADNc, para obtener una segunda colección marcada o una colección marcada posterior. Las muestras de ADNc pueden ser, p. ej., de origen diferente, p. ej., diferentes líneas de plantas, de forma que se pueden comparar tales perfiles de transcritos de tales líneas de plantas. De forma alternativa, se pueden derivar muestras de ADNc, p. ej., de una sola línea de plantas en distintas etapas del desarrollo con el fin de comparar perfiles de transcritos durante el desarrollo de plantas. También es posible realizar el procedimiento de acuerdo con la presente invención sobre muestras de ADNc completamente independientes simplemente por su eficacia.
En la etapa (e), se combinan la primera colección marcada y la segunda colección marcada y/o una colección marcada posterior para obtener una colección combinada. Esta colección combinada se puede someter a secuenciación simultánea para proporcionar un procedimiento altamente eficaz.
En la etapa (f), se determinan al menos parte de las secuencias de nucleótidos de la colección combinada por secuenciación, preferentemente, secuenciación de alto rendimiento, preferentemente como se describe anteriormente.
En la etapa (g), se determina la frecuencia de la secuencia de nucleótidos en la primera muestra de ADNc y la segunda muestra y/o una muestra posterior de ADN. Las secuencias de nucleótidos de la primera colección se pueden distinguir de las secuencias de nucleótidos de la segunda colección y/o una colección posterior por medio de la marca. En este caso, la hibridación se puede realizar sobre datos de secuencia que se han recortado para los adaptadores/el cebador y/o los identificadores, pero con secuencias de reconocimiento de enzimas de restricción reconstruidas, es decir, usando sólo los datos de secuencia de los fragmentos que derivan del ADNc. Normalmente, los datos de secuencia obtenidos se usan para identificar el origen del fragmento (es decir, de qué muestra), las secuencias derivadas de la secuencia adaptadora y/o identificadora se eliminan de los datos y se realiza la hibridación en este conjunto recortado.
En la etapa (h), se compara la frecuencia de la secuencia de nucleótidos en la primera muestra de ADNc con la frecuencia de la misma secuencia de nucleótidos en la segunda muestra y/o una muestra posterior de ADNc para obtener niveles de transcripción relativos de la secuencia de nucleótidos en las muestras de ADNc.
Debido a la estrategia de marcaje, se puede realizar simultáneamente la determinación de los niveles de transcripción de una secuencia de nucleótidos para diferentes muestras de ADNc, lo que es muy ventajoso. El procedimiento es muy adecuado para la identificación rápida de transcritos implicados en un rasgo fenotípico determinado, como se analiza anteriormente.
En una realización preferida, el marcaje de la primera colección y de la segunda colección o una colección posterior se realiza usando diferentes marcas. Como se analiza anteriormente, se prefiere que cada colección de una muestra de ADNc se identifique mediante su propia marca.
Breve descripción de los dibujos
Figura 1: Productos de ADNc-AFLP marcados (A/C) de las líneas de pimiento PSP11 y PI 201234. Se cargan dos muestras de ambas líneas por duplicado en un gel de agarosa al 1 %.
M: marcador de 100 pb
1: muestra 1 de ADNc-AFLP de PSP11
2: muestra 1 de ADNc-AFLP de PSP11
3: muestra 2 de ADNc-AFLP de PSP11
4: muestra 2 de ADNc-AFLP de PSP11
5: ADNc-AFLP de PI 201234 - muestra 1
6: ADNc-AFLP de PI 201234 - muestra 1
7: ADNc-AFLP de PI 201234 - muestra 2
8: ADNc-AFLP de PI 201234 - muestra 2
Figura 2: Representación esquemática de productos de amplificación de AFLP +1/+1 de pimiento después de la
amplificación con cebadores de AFLP que contienen secuencias marcadoras de 4 pb en 5 prima.
Figura 3: Flujo de trabajo de la preparación de la colección de secuencias.
Figura 4: Ejemplo de resultado de 13 lecturas de secuencia.
Figura 5: Resultados de Blast
Figura 6: Presentación de datos no procesados de una regulación por incremento.
Figura 7: Presentación de datos no procesados de una regulación por incremento.
Ejemplos
Se han acumulado un gran número de ejemplos de regulación temporal y espacial de expresiones génicas en plantas superiores usando enfoque tales como la hibridación de bandas northern o aplicaciones de expresión de micromatrices de ADN. La última tecnología permite el control de la expresión de miles de genes simultáneamente. A diferencia de estos procedimientos de análisis, el análisis digital de los perfiles de expresión génica se puede lograr secuenciando directamente transcritos marcados usando tecnologías de secuencia de alto rendimiento. El número de secuencias obtenidas a partir de un transcrito específico en una muestra refleja el nivel de transcripción de esta secuencia en particular. La comparación de estos números entre varias muestras, aunque supone profundizar en la secuenciación, permite la medida precisa de los niveles de transcripción entre estas muestras. Esta tecnología parece ser una potente herramienta para descubrir nuevos marcadores de calidad desconocidos que están relacionados con determinados perfiles de expresión.
Aquí se describe la secuenciación de alto rendimiento de ADNc, cuya complejidad se ha reducido usando la tecnología de AFLP, derivado de la fracción de ARNm de dos líneas de pimiento. Mediante secuenciación directa de fragmentos de ADNc marcados, se pudieron generar perfiles de expresión.
Procedimientos
Aislamiento de ARNtot/Poli(A)+ de ARN
Se aisló ARN total de las líneas de pimiento PSP11 y PI 201234 a partir de material de hoja usando el minikit RNeasy del Rneasy Plant Mini Protocol de QIAGEN (n.º de cat: 74104'). Como entrada se han usado aprox. 100 mg de material de hoja por muestra.
Siguiendo este protocolo se obtuvieron rendimientos de 2,5-3 µg de RNA total por muestra. Posteriormente, se aisló la fracción de ARN poli(A)+ a partir de 1 µg de las muestras de ARN total usando el minikit de ARNm Oligotex de QIAGEN (n.º de cat: 70022). Se obtuvieron rendimientos de 150-200 ng de ARN poli(A)+. Las concentraciones de estas muestras fueron de 5 - 10 ng/ul. Tanto el ARN total como el ARN tpoli(A)+ se analizaron en un gel de agarosa para comprobar la calidad del ARN.
Sintesis de ADNc
Se generó ADNc de acuerdo con el protocolo siguiente:
Síntesis de la primera hebra del ADNc
Añadir conjuntamente:
10 µl de ARN poli(A)+ (50 - 100 ng)
5 µl de oligo-dT25 (70 ng/ul)
Posteriormente, añadir:
5 ul de tampón de primera hebra 5x (suministrado con Superscript II RT)
2,5 µl de DTT 0,1 M
1 ul de dNTP 10 mM
0,5 ul de Superscript II (200 U/ul)
1 ul de agua MQ hasta un volumen final de 25 ul
Incubar 2 horas a 42 °C Síntesis de la segunda hebra del ADNc Añadir conjuntamente:
25 ul de mezcla de reacción de primera hebra
8 ul de tampón de segunda hebra 10 x
1,5 ul de dNTP 10 mM
7,5 unidades de ligasa de ADN de E. coli
25 unidades de polimerasa de E. coli
0,8 unidades de RNasa-H (1 U/ul) Añadir agua MQ hasta un volumen final de 80 ul
Incubar 1 hora a 12 °C
Incubar 1 hora a 22 °C Posteriormente, se purificaron las muestras de ADNc usando el kit de purificación de membrana de PCR Qiaquick de QIAGEN (n.º de cat: 28104). La elución se llevó a cabo usando 30 µl de tampón de elución (Tris-HCl 5 mM, pH 8,5).
Preparación de moldes de ADNc - AFLP usando cebadores de AFLP marcados
Se prepararon moldes de AFLP de los ADNc generados de las líneas progenitoras de pimiento PSP11 y PI-201234 usando la combinación de endonucleasas de restricción TaqI / Mse I como se describe por Zabeau & Vos, 1993: Selective restriction fragment amplification; a general method for DNA fingerprinting. documento EP 0534858-A1, B1; patente de EE. UU. 6045994) y Vos et al (Vos, P., Hogers, R., Bleeker, M., Reijans, M., van de Lee, T., Hornes, M., Frijters, A., Pot, J., Peleman, J., Kuiper, M. et al. (1995) AFLP: a new technique for DNA fingerprinting. Nucl. Acids Res., 21, 4407-4414).
Procedimiento de restricción y ligación de ADNc
La digestión se realizó en dos etapas; primero con la TaqI (mayor temperatura de incubación), después con MseI (temperatura de incubación más baja)
La restricción de ADNc con TaqI y MseI se llevó a cabo como sigue:
Restricción del ADN
Añadir conjuntamente:
250 ng de ADNc
10 unidades de TaqI
8 µl de tampón RL 5x. El tampón RL 5x es Tris-HAc 50 mM, MgAc 50 mM, KAc 250 mM, DTT 25 mM, 250 ng/µl
de BSA; pH 7,5).
Añadir agua MQ hasta un volumen final de 40 µl
Incubar 2 horas a 65 °C Después de la restricción con TaqI,
Añadir: 10 unidades de MseI 2 µl de tampón RL 5x Añadir agua MQ hasta un volumen final de 50 µl Incubar 2 horas a 37 °C
Ligación de adaptadores
A la mezcla de digestión se le añadieron los componentes siguientes: 1 µl de ATP 10mM 1 µl de ligasa de ADN T4 1 µl de adaptador de TaqI (50 pmol/µl) CTCGTAGACTGCGTAC/CGGTACGCAGTCT 1 µl de adaptador de MseI (50 pmol/µl) GACGATGAGTCCTGAG/TACTCAGGAACTCAT 2 µl de tampón RL 5x. Añadir agua MQ hasta un volumen final de 60 µl Incubar 3 horas a 37 °C
Amplificación de ADNc - AFLP
Después de la restricción-ligación, se usó este producto de restricción/ligación como molde en una etapa de amplificación no selectiva. Estos productos de AFLP no selectivos se usaron posteriormente como molde para amplificación selectiva (+1/+1). Se realizó un control de calidad sobre este producto +1/+1 realizando una amplificación selectiva +2/+3. Los productos de la última amplificación se comprobaron en un gel de secuencia al 4,5 %.
La amplificación no selectiva de ADNc-AFLP se realizó como sigue:
5 µl de mezcla de restricción-ligación no diluida
1,5 µl de cebador de Taq I (50ng/µl) (CTCGTAGACTGCGTACCGA)
1,5 µl de cebador de Mse I (50ng/µl) (GATGAGTCCTGAGTAA)
2 µl de dNTP 5 mM
1 unidad de polimerasa Taq
5 µl de tampón de PCR 10x
Añadir agua MQ hasta un volumen final de 50 µl
Las amplificaciones de PCR se realizaron usando un PE9700 con un bloque de oro o plata usando las condiciones siguientes: 30 ciclos (30" a 94 °C, 60" a 56 °C y 1 20"a 72 °C).
La amplificación selectiva de ADNc-AFLP usando secuencias marcadas se realizó como sigue:
Para producto de ADNc-AFLP no selectivo derivado para la línea de pimiento PSP11 5 ul de producto no selectivo diluido 600 x 1,5 ul de cebador ACAC Tr01 (+A)* (50 ng/µg) (ACACGTAGACTGCGTACCGAA) 1,5 ul de cebador ACAC M02 (+C)* (50 ng/µg) (ACACGATGAGTCCTGAGTAAC) 2 ul de dNTP 5 mM 1,5 unidades de polimerasa AmpliTaq-Gold
5 ul de tampón de PCR 10x
Añadir agua MQ hasta un volumen final de 50 µl
Para producto de ADNc-AFLP no selectivo 0/0 derivado para la línea de pimiento PI 201234.
5 ul de producto no selectivo diluido 600 x
1,5 ul de cebador AGCT Tr01 (+A)* (50 ng/µg) (AGCTGTAGACTGCGTACCGAA)
1,5 ul de cebador AGCT M02 (+C)* (50 ng/µg) (AGCTGATGAGTCCTGAGTAAC)
2 ul de dNTP 5 mM
1,5 unidades de polimerasa AmpliTaq-Gold
5 ul de tampón de PCR 10x
Añadir agua MQ hasta un volumen final de 50 ul
Las amplificaciones de PCR se realizaron usando un PE9700 con un bloque de oro usando las condiciones siguientes: 1 ciclo de 12' a 94 °C (comienzo en cal iente), 30'' a 94 °C, 30" a 65 °C, 60" a 72 °C; 2 3 ciclos disminución de la temperatura de hibridación 0,7 °C en cada ciclo durante 12 ciclos - fase de temperatura decreciente de 13 ciclos - 30" a 94 °C, 30" a 56 ° C, 60'' a 72 °C. La calidad de los productos +1/+1 generados se controló en un gel de agarosa al 1 % usando una escalera de 100 pares de bases para comprobar la distribución de longitud de los fragmentos (véase la figura 1).
Los cebadores selectivos contienen marcas de 4 pb (subrayadas anteriormente) en sus extremos 5 prima para distinguir los productos de amplificación que se originan a partir de las correspondientes líneas de pimiento al final del procedimiento de secuenciación. El principio de generar productos de PCR de ADNc - AFLP marcados de acuerdo con este procedimiento se muestra en la figura 2
Preparación de colecciones de secuencias y secuenciación de alto rendimiento
Los productos de ADNc AFLP marcados de ambas líneas de pimiento se sometieron a secuenciación de alto rendimiento usando tecnología de secuenciación de 454 Life Sciences / Roche GS20 como se describe por Margulies et al., (Margulies et al., Nature 437, pág. 376-380 y suplementos en línea). En primer lugar, se purificaron los productos de PCR de ADNc - AFLP marcados y se ligaron a un adaptador modificado (CCATCTCATCCCTGCG TGTCCCATCTGTTCCCTCCCTGTCTCAGT/CTGAGACAGGGAG-GGAACAGATGG y BIO-TEG-CCTATCCCCTGTGTGCCTTGCCTATCCCCTGTTGCGTGTCTCAGT/P-CTGA-GACACG CAACAGGGGATAGGCAAGGCACACAGGGGATAGG) para facilitar la amplificación por PCR de la emulsión y la posterior secuenciación de fragmentos como se describe por Margulies y sus colaboradores. Los cebadores de PCR de emulsión, los cebadores de secuencia y las condiciones de desarrollo de la secuencia fueron como se describe por Margulies y sus colaboradores. El procedimiento de preparación de la colección de secuencias se muestra en la figura 3. Se realizó un desarrollo de secuencias de alto rendimiento GS20 en los laboratorios de Keygene NV, Wageningen, Países Bajos.
Procesamiento de datos de desarrollo de secuencias GS20.
Los datos de secuencias resultantes de la mitad del desarrollo de secuencias GS20 (es decir, 1 canal de los 2 canales disponibles en la placa PicoTiter GS20) se procesaron usando una fuente de información bioinformática (Keygene N.V.). Específicamente, se convirtieron lecturas de secuencias automáticas no procesadas en formato FASTA y se inspeccionaron para detectar la presencia de secuencias adaptadoras de AFLP usando un algoritmo BLAST. Tras los apareamientos altamente fiables con las secuencias de cebador de AFLP marcado conocido, se recortaron las secuencias, se restablecieron los sitios de endonucleasa de restricción y se asignaron las marcas apropiadas. Posteriormente, todas las secuencias recortadas mayores de 33 bases se agruparon usando un procedimiento de megaBLAST basado en homologías de secuencia globales. A continuación, se ensamblaron las agrupaciones en uno o más cóntigos por agrupación, usando un algoritmo de hibridación múltiple CAP3.
Ejemplo de resultado de 13 lecturas de secuencia:
Agrupación 387
Las ID de marcas de la muestra 2 (AGTC) se representan en NEGRITA. Las ID de marcas de la muestra 1 (ACAC) están subrayadas. Véase la fig. 4.
En la tabla 1 se muestran estadísticas globales de los desarrollos de las secuencias:
Tabla 1: Estadísticas globales del desarrollo de ADNc-AFLP.
- Fragmentos de secuencia con muestra identificada
- 174421
- Lecturas de la muestra 1 (PSP11)
- 50599
- Lecturas de la muestra 2 (PI 201234)
- 123822
- proporción de muestras (muestra 2/muestra 1)
- 2,45
- agrupaciones
- 6712
- Agrupaciones presentes tanto en la muestra 1 como en la muestra 2
- 1433
Interpretación:
Etapa 1) El "factor de normalización de la profundidad de la secuenciación de la muestra" es 2,45 y se define como el total de lecturas obtenidas a partir de la muestra 2 dividido entre el número total de lecturas derivadas de la muestra 1 (123822 / 50599 = 2,45). El número de lecturas derivadas de la muestra 2 por cóntigo se dividió entre 2,45 con el fin de comparar los niveles de transcripción con los de la muestra 1.
Etapa 2) Se realizó una segunda etapa de "normalización de genes de mantenimiento" mediante la determinación de la "expresión" de un gen "de mantenimiento" que funciona como estándar interno. Para esto, se seleccionó el gen de la arginina descarboxilasa de Lycopersicon esculentum. La secuencia de la arginina descarboxilasa de Lycopersiconesculentum se "BLASTEÓ" contra las secuencias de los cóntigos obtenidos usando la hibridación múltiple CAP3 para determinar con qué frecuencia se observaban los transcritos del gen de la arginina descarboxilasa del pimiento en las muestras 1 y 2. Posteriormente, se calculó la proporción en la que se observaban estos transcritos en las muestras 1 y 2, después de aplicar en primer lugar el "factor de normalización de la profundidad de la secuenciación de la muestra" (etapa 1). En este ejemplo, esta proporción (= factor de normalización del gen de mantenimiento) fue de 17/14 = 1,2 para muestra 1 / muestra 2 (tabla 1).
Ejemplo de búsqueda BLAST de un gen de mantenimiento (arginina descarboxilasa de Lycopersicon esculentum) contra el grupo de cóntigos.
Referencia: Altschul, Stephen F., Thomas L. Madden, Alejandro A. Schaffer, Jinghui Zhang, Zheng Zhang, Webb Miller y David J. Lipman (1997), "Gapped BLAST and PSI-BLAST: a new generation of protein database search programs", Nucleic Acids Res. 25:3389-3402.
Consulta = gi|295349|gb|L16582.1|TOMARGDECA ARNm de arginina descarboxilasa de Lycopersicon esculentum, cds completo (2060 letras)
Base de datos: taggedReads.fna
174.421 secuencias; 15.408.192 letras en total. Los resultados están en la fig. 5.
Tabla 2. Cálculo del factor de normalización 1,2 de un gen de mantenimiento (muestra 1 / muestra 2) basado en la abundancia del homólogo de pimiento del gen de la arginina descarboxilasa de tomate.
- Gen de mantenimiento estándar
- Lecturas en el cóntigo de la muestra 1 Lecturas en el cóntigo de la muestra 2 Antes/después de la normalización de la profundidad de la secuenciación de la muestra Proporción Muestra 1 / Muestra 2 (facto de normalización del gen de mantenimiento)
- gi|295349|gb|L16 582.1|TOMARGDECA ARNm de arginina descarboxilasa de Lycopersicon esculentum
- 17 35/14 1.2 (17/14)
Etapa 3) Para la elaboración de perfiles de expresión reales sólo se tuvieron en cuenta cóntigos que contienen más de 10 lecturas. El nivel mínimo de 10 lecturas por cóntigo se escogió con el fin de evitar resultados de elaboración de perfiles de transcritos poco precisos debido a una profundidad de secuenciación insuficiente. La tabla 2 muestra los niveles de expresión relativos de ARNm de dos transcritos que se expresan de forma diferencial en PSP11 (muestra 1) frente a PI 201234 (muestra 2), siguiendo el procedimiento en tres etapas explicado anteriormente. Específicamente, la agrupación 2215 representa un transcrito regulado por incremento en la muestra 1 y el agrupamiento 847 representa un transcrito regulado por disminución en la muestra 1; en la tabla 3 se muestran cálculos de los niveles de transcripción relativos de estos transcritos. Finalmente, la tabla 4 contiene un resumen del número de genes transcritos de forma diferencial en la totalidad del conjunto de datos basado en los principios descritos anteriormente.
Ejemplo de regulación por incremento de la muestra 1 - datos no procesados. Agrupación 2215. Las ID de marcas 5 de la muestra 2 (AGTC) se representan en NEGRITA. Las ID de marcas de la muestra 1 (ACAC) están subrayadas en la fig. 6.
Ejemplo de regulación por disminución de la muestra 1 - datos no procesados. Agrupación 847. Las ID de marcas de la muestra 2 (AGTC) se representan en NEGRITA. Las ID de marcas de la muestra 1 (ACAC) están subrayadas en la fig. 7.
10 Tabla 3. Cálculo de niveles de expresión relativos de transcritos representados por las agrupaciones 2215 y 847, siguiendo la normalización de la profundidad de la secuenciación de la muestra (etapa 1) y la normalización del gen de mantenimiento (etapa).
- N.º de agrupación:
- 2215 847
- Lecturas de la muestra 1 - datos no procesados
- 44 11
- Lecturas de la muestra 2 - datos no procesados
- 26 101
- Lecturas de la muestra 1 - normalización de la profundidad de la secuenciación de la muestra
- 44 11
- Lecturas de la muestra 2 - normalización de la profundidad de la secuenciación de la muestra
- 10,6 (26/2,45) 41,2 (101/2,45)
- Lecturas de la muestra 1 - normalización del gen de mantenimiento
- 37 (44/1,2) 9 (11/1,2)
- Lecturas de la muestra 2 - normalización del gen de mantenimiento
- 10,6 41,2
- Proporción de expresión de la muestra 1 frente a la muestra 2
- 3,5 (37/10,6) 0,2 (9/41,2)
Tabla 4: Resumen de los niveles de transcripción relativos de transcritos secuenciados a partir de PSP11 y/o PI 15 201234 y presentes en cóntigos que contienen 10 o más secuencias.
- N.º mínimo de lecturas de ambas muestras
- lecturas> 10
- Número total de cóntigos que contienen lecturas de la muestra 1 y/o la muestra 2
- 113
- Genes regulados por disminución (proporción del nivel de expresión <0,5)
- 20
- Genes regulados por incremento (proporción del nivel de expresión >2)
- 17
- Genes expresados por igual (proporción de nivel de expresión > 0,5 y < 2)
- 76
Claims (5)
- REIVINDICACIONES1. Procedimiento para determinar niveles de transcripción relativos de una secuencia de nucleótidos en muestras de ADNc que comprende las etapas de:(a) Proporcionar una primera muestra de ADNc;5 (b) Realizar una reducción de la complejidad reproducible de la primera muestra de ADNc para obtener una primera colección que comprende las etapas de:
- -
- digerir el ADNc con al menos una endonucleasa de restricción para fragmentarlo en fragmentos de restricción;
- -
- ligar los fragmentos de restricción con al menos un adaptador oligonucleotídico sintético bicatenario que
10 tenga un extremo compatible con uno o ambos extremos de los fragmentos de restricción para producir fragmentos de restricción ligados a adaptador;- -
- poner en contacto dichos fragmentos de restricción ligados a adaptador con uno o más cebadores oligonucleotídicos bajo condiciones de hibridación, teniendo dichos uno o más cebadores oligonucleotídicos una secuencia de cebador que incluye una sección de secuencia de nucleótidos complementaria a parte del
15 al menos un adaptador y a parte de la parte restante de la secuencia de reconocimiento de la endonucleasa de restricción; y- -
- amplificar dichos fragmentos de restricción ligados a adaptador por elongación del uno o más cebadores oligonucleotídicos hibridados;
- (c)
- Marcar la primera colección para obtener una primera colección marcada mediante el uso de al menos un 20 adaptador marcado en la etapa (b);
(d) Realizar, de forma consecutiva o simultáneamente, las etapas (a) y (b) con una segunda muestra y/o una muestra posterior de ADNc, usando una marca diferente para cada muestra de ADNc, para obtener una segunda colección marcada y/o una colección marcada posterior;- (e)
- Combinar la primera colección marcada y la segunda colección marcada y/o una colección marcada 25 posterior para obtener una colección combinada;
- (f)
- Determinar al menos parte de las secuencias de nucleótidos de la colección marcada mediante secuenciación de alto rendimiento;
- (g)
- Determinar la frecuencia de la secuencia de nucleótidos en la primera muestra de ADNc y la segunda muestra y/o una muestra posterior de ADN; y
30 (h) Comparar la frecuencia de la secuencia de nucleótidos en la primera muestra de ADNc con la frecuencia de la secuencia de nucleótidos en la segunda muestra y/o una muestra posterior de ADNc para obtener niveles de transcripción relativos de la secuencia de nucleótidos en las muestras de ADNc. - 2. Procedimiento de acuerdo con cualquiera de las reivindicaciones anteriores, en el que la secuenciación de alto rendimiento se realiza sobre un soporte sólido tal como una perla.35 3. Procedimiento de acuerdo con cualquiera de las reivindicaciones 1 o 2, en el que la secuenciación de alto rendimiento se basa en la secuenciación por síntesis, preferentemente en la pirosecuenciación.
- 4. Procedimiento de acuerdo con cualquiera de las reivindicaciones 1 o 2, en el que la secuenciación de alto rendimiento comprende las etapas de:(c1) ligar adaptadores de secuenciación a los fragmentos;40 (c2) hibridar fragmentos ligados a adaptadores de secuenciación con perlas, alineándose cada perla con un solo fragmento;(c3) emulsionar las perlas en microrreactores de agua en aceite, comprendiendo cada microrreactor de agua en aceite una sola perla;(c4) realizar una PCR de la emulsión para amplificar fragmentos ligados a adaptadores de secuencia sobre la 45 superficie de las perlas;(c5) seleccionar / enriquecer perlas que contienen fragmentos ligados a adaptadores de secuenciación amplificados;(c6) cargar las perlas en pocillos, comprendiendo cada pocillo una sola perla; y (c7) generar una señal de pirofosfato.
-
- 5.
- Procedimiento de acuerdo con la reivindicación 1, en el que el cebador comprende además una secuencia seleccionada en el extremo 3' de la secuencia del cebador, comprendiendo dicha secuencia seleccionada 1-10 nucleótidos selectivos que son complementarios a una sección situada inmediatamente adyacente a la parte restante de la secuencia de reconocimiento de la endonucleasa de restricción.
-
- 6.
- Procedimiento de acuerdo con cualquiera de las reivindicaciones 1 o 5, en el que la secuencia seleccionada del extremo 3' de la secuencia del cebador comprende 1-8 nucleótidos selectivos, preferentemente 1-5, más preferentemente 1-3.
Fig 3
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US75259105P | 2005-12-22 | 2005-12-22 | |
| US752591P | 2005-12-22 | ||
| PCT/NL2006/000654 WO2007073171A2 (en) | 2005-12-22 | 2006-12-21 | Improved strategies for transcript profiling using high throughput sequencing technologies |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| ES2394633T3 true ES2394633T3 (es) | 2013-02-04 |
Family
ID=38134816
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES06835676T Active ES2394633T3 (es) | 2005-12-22 | 2006-12-21 | Estrategias mejoradas para elaboración de perfiles de transcritos usando tecnologías de secuenciación de alto rendimiento |
Country Status (7)
| Country | Link |
|---|---|
| US (1) | US20090247415A1 (es) |
| EP (1) | EP1966394B1 (es) |
| JP (1) | JP5198284B2 (es) |
| CN (1) | CN101365803B (es) |
| DK (1) | DK1966394T3 (es) |
| ES (1) | ES2394633T3 (es) |
| WO (1) | WO2007073171A2 (es) |
Families Citing this family (146)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US11111544B2 (en) | 2005-07-29 | 2021-09-07 | Natera, Inc. | System and method for cleaning noisy genetic data and determining chromosome copy number |
| US11111543B2 (en) | 2005-07-29 | 2021-09-07 | Natera, Inc. | System and method for cleaning noisy genetic data and determining chromosome copy number |
| US9424392B2 (en) | 2005-11-26 | 2016-08-23 | Natera, Inc. | System and method for cleaning noisy genetic data from target individuals using genetic data from genetically related individuals |
| EP3216874A1 (en) | 2008-09-05 | 2017-09-13 | TOMA Biosciences, Inc. | Methods for stratifying and annotating cancer drug treatment options |
| WO2010127186A1 (en) | 2009-04-30 | 2010-11-04 | Prognosys Biosciences, Inc. | Nucleic acid constructs and methods of use |
| EP2333104A1 (en) * | 2009-12-11 | 2011-06-15 | Lexogen GmbH | RNA analytics method |
| EP2354243A1 (en) * | 2010-02-03 | 2011-08-10 | Lexogen GmbH | Complexity reduction method |
| US20190300945A1 (en) | 2010-04-05 | 2019-10-03 | Prognosys Biosciences, Inc. | Spatially Encoded Biological Assays |
| US10787701B2 (en) | 2010-04-05 | 2020-09-29 | Prognosys Biosciences, Inc. | Spatially encoded biological assays |
| US9371598B2 (en) | 2010-04-05 | 2016-06-21 | Prognosys Biosciences, Inc. | Spatially encoded biological assays |
| CN103168118A (zh) * | 2010-04-06 | 2013-06-19 | 麻省理工学院 | 用减少数量的转录物测量进行的基因表达概况分析 |
| US10619195B2 (en) * | 2010-04-06 | 2020-04-14 | Massachusetts Institute Of Technology | Gene-expression profiling with reduced numbers of transcript measurements |
| US11408031B2 (en) | 2010-05-18 | 2022-08-09 | Natera, Inc. | Methods for non-invasive prenatal paternity testing |
| US11339429B2 (en) | 2010-05-18 | 2022-05-24 | Natera, Inc. | Methods for non-invasive prenatal ploidy calling |
| US12221653B2 (en) | 2010-05-18 | 2025-02-11 | Natera, Inc. | Methods for simultaneous amplification of target loci |
| US11332785B2 (en) | 2010-05-18 | 2022-05-17 | Natera, Inc. | Methods for non-invasive prenatal ploidy calling |
| US10316362B2 (en) | 2010-05-18 | 2019-06-11 | Natera, Inc. | Methods for simultaneous amplification of target loci |
| US9677118B2 (en) | 2014-04-21 | 2017-06-13 | Natera, Inc. | Methods for simultaneous amplification of target loci |
| US11322224B2 (en) | 2010-05-18 | 2022-05-03 | Natera, Inc. | Methods for non-invasive prenatal ploidy calling |
| US12152275B2 (en) | 2010-05-18 | 2024-11-26 | Natera, Inc. | Methods for non-invasive prenatal ploidy calling |
| US11939634B2 (en) | 2010-05-18 | 2024-03-26 | Natera, Inc. | Methods for simultaneous amplification of target loci |
| US20190010543A1 (en) | 2010-05-18 | 2019-01-10 | Natera, Inc. | Methods for simultaneous amplification of target loci |
| AU2011255641A1 (en) | 2010-05-18 | 2012-12-06 | Natera, Inc. | Methods for non-invasive prenatal ploidy calling |
| US11326208B2 (en) | 2010-05-18 | 2022-05-10 | Natera, Inc. | Methods for nested PCR amplification of cell-free DNA |
| US11332793B2 (en) | 2010-05-18 | 2022-05-17 | Natera, Inc. | Methods for simultaneous amplification of target loci |
| ES2960184T3 (es) * | 2010-06-09 | 2024-03-01 | Keygene Nv | Códigos de barras de secuencias combinatorias para el cribado de alto rendimiento |
| EP3572528A1 (en) | 2010-09-24 | 2019-11-27 | The Board of Trustees of the Leland Stanford Junior University | Direct capture, amplification and sequencing of target dna using immobilized primers |
| EP3187597B1 (en) * | 2011-02-09 | 2020-06-03 | Natera, Inc. | Methods for non-invasive prenatal ploidy calling |
| JP6153874B2 (ja) | 2011-02-09 | 2017-06-28 | ナテラ, インコーポレイテッド | 非侵襲的出生前倍数性呼び出しのための方法 |
| EP3150750B1 (en) | 2011-04-08 | 2018-12-26 | Prognosys Biosciences, Inc. | Peptide constructs and assay systems |
| GB201106254D0 (en) | 2011-04-13 | 2011-05-25 | Frisen Jonas | Method and product |
| US9725765B2 (en) | 2011-09-09 | 2017-08-08 | The Board Of Trustees Of The Leland Stanford Junior University | Methods for obtaining a sequence |
| WO2013038010A2 (en) | 2011-09-16 | 2013-03-21 | Lexogen Gmbh | Nucleic acid transcription method |
| CN103103624B (zh) * | 2011-11-15 | 2014-12-31 | 深圳华大基因科技服务有限公司 | 高通量测序文库的构建方法及其应用 |
| PL2814959T3 (pl) | 2012-02-17 | 2018-07-31 | Fred Hutchinson Cancer Research Center | Kompozycje i sposoby do dokładnej identyfikacji mutacji |
| CN109082462B (zh) | 2012-05-21 | 2022-10-28 | 斯克利普斯研究所 | 样品制备方法 |
| US20140045702A1 (en) * | 2012-08-13 | 2014-02-13 | Synapdx Corporation | Systems and methods for distinguishing between autism spectrum disorders (asd) and non-asd development delay |
| US20140100126A1 (en) | 2012-08-17 | 2014-04-10 | Natera, Inc. | Method for Non-Invasive Prenatal Testing Using Parental Mosaicism Data |
| EP3511423B2 (en) | 2012-10-17 | 2024-05-29 | Spatial Transcriptomics AB | Methods and product for optimising localised or spatial detection of gene expression in a tissue sample |
| CN103806111A (zh) * | 2012-11-15 | 2014-05-21 | 深圳华大基因科技有限公司 | 高通量测序文库的构建方法及其应用 |
| US11231419B2 (en) | 2013-03-15 | 2022-01-25 | Prognosys Biosciences, Inc. | Methods for detecting peptide/MHC/TCR binding |
| LT3013983T (lt) | 2013-06-25 | 2023-05-10 | Prognosys Biosciences, Inc. | Erdviniai koduoti biologiniai tyrimai, naudojant mikrofluidinį įrenginį |
| JP6423426B2 (ja) * | 2013-07-09 | 2018-11-14 | レクソゲン ゲーエムベーハー | 転写産物判定方法 |
| EP3030682B1 (en) | 2013-08-05 | 2020-06-03 | Twist Bioscience Corporation | De novo synthesized gene libraries |
| CN103540672B (zh) * | 2013-10-29 | 2015-04-08 | 中国科学技术大学 | 一种亲和核酸分子的快速鉴定和分离方法 |
| WO2015070037A2 (en) | 2013-11-08 | 2015-05-14 | Prognosys Biosciences, Inc. | Polynucleotide conjugates and methods for analyte detection |
| CN104630202A (zh) * | 2013-11-13 | 2015-05-20 | 北京大学 | 一种能够减小微量核酸物质整体扩增时产生偏倚的扩增方法 |
| ES2730962T3 (es) * | 2014-02-05 | 2019-11-13 | Fraunhofer Ges Forschung | Secuenciación libre de errores de ADN |
| US12492429B2 (en) | 2014-04-21 | 2025-12-09 | Natera, Inc. | Detecting mutations and ploidy in chromosomal segments |
| JP6659575B2 (ja) | 2014-04-21 | 2020-03-04 | ナテラ, インコーポレイテッド | 変異の検出および染色体分節の倍数性 |
| US20180173846A1 (en) | 2014-06-05 | 2018-06-21 | Natera, Inc. | Systems and Methods for Detection of Aneuploidy |
| CA2960821A1 (en) * | 2014-09-09 | 2016-03-17 | Igenomx International Genomics Corporation | Methods and compositions for rapid nucleic acid library preparation |
| CA2975852A1 (en) | 2015-02-04 | 2016-08-11 | Twist Bioscience Corporation | Methods and devices for de novo oligonucleic acid assembly |
| CN106033502B (zh) * | 2015-03-20 | 2018-03-30 | 深圳华大基因股份有限公司 | 鉴定病毒的方法和装置 |
| SG11201707515SA (en) | 2015-04-10 | 2017-10-30 | Spatial Transcriptomics Ab | Spatially distinguished, multiplex nucleic acid analysis of biological specimens |
| US9981239B2 (en) | 2015-04-21 | 2018-05-29 | Twist Bioscience Corporation | Devices and methods for oligonucleic acid library synthesis |
| DK3294906T3 (en) | 2015-05-11 | 2024-08-05 | Natera Inc | Methods for determining ploidy |
| JP6982362B2 (ja) | 2015-09-18 | 2021-12-17 | ツイスト バイオサイエンス コーポレーション | オリゴ核酸変異体ライブラリーとその合成 |
| KR20250053972A (ko) | 2015-09-22 | 2025-04-22 | 트위스트 바이오사이언스 코포레이션 | 핵산 합성을 위한 가요성 기판 |
| CN109477138A (zh) | 2016-04-15 | 2019-03-15 | 纳特拉公司 | 肺癌检测方法 |
| WO2018057526A2 (en) | 2016-09-21 | 2018-03-29 | Twist Bioscience Corporation | Nucleic acid based data storage |
| WO2018067517A1 (en) | 2016-10-04 | 2018-04-12 | Natera, Inc. | Methods for characterizing copy number variation using proximity-litigation sequencing |
| GB201618485D0 (en) | 2016-11-02 | 2016-12-14 | Ucl Business Plc | Method of detecting tumour recurrence |
| US10011870B2 (en) | 2016-12-07 | 2018-07-03 | Natera, Inc. | Compositions and methods for identifying nucleic acid molecules |
| WO2018156792A1 (en) | 2017-02-22 | 2018-08-30 | Twist Bioscience Corporation | Nucleic acid based data storage |
| US11584958B2 (en) | 2017-03-31 | 2023-02-21 | Grail, Llc | Library preparation and use thereof for sequencing based error correction and/or variant identification |
| SG11201912057RA (en) | 2017-06-12 | 2020-01-30 | Twist Bioscience Corp | Methods for seamless nucleic acid assembly |
| WO2018231864A1 (en) | 2017-06-12 | 2018-12-20 | Twist Bioscience Corporation | Methods for seamless nucleic acid assembly |
| JP2020536504A (ja) | 2017-09-11 | 2020-12-17 | ツイスト バイオサイエンス コーポレーション | Gpcr結合タンパク質およびその合成 |
| GB2583590A (en) | 2017-10-20 | 2020-11-04 | Twist Bioscience Corp | Heated nanowells for polynucleotide synthesis |
| US12084720B2 (en) | 2017-12-14 | 2024-09-10 | Natera, Inc. | Assessing graft suitability for transplantation |
| CN112236535A (zh) | 2018-04-14 | 2021-01-15 | 纳特拉公司 | 用于借助于循环肿瘤dna的个人化检测的癌症检测和监测的方法 |
| CN118957038A (zh) | 2018-05-18 | 2024-11-15 | 特韦斯特生物科学公司 | 用于核酸杂交的多核苷酸、试剂和方法 |
| US12234509B2 (en) | 2018-07-03 | 2025-02-25 | Natera, Inc. | Methods for detection of donor-derived cell-free DNA |
| US11519033B2 (en) | 2018-08-28 | 2022-12-06 | 10X Genomics, Inc. | Method for transposase-mediated spatial tagging and analyzing genomic DNA in a biological sample |
| JP7530355B2 (ja) | 2018-11-28 | 2024-08-07 | キージーン ナムローゼ フェンノートシャップ | エンドヌクレアーゼ保護による標的化濃縮 |
| WO2020123316A2 (en) | 2018-12-10 | 2020-06-18 | 10X Genomics, Inc. | Methods for determining a location of a biological analyte in a biological sample |
| CN113692409B (zh) | 2018-12-26 | 2025-01-10 | 特韦斯特生物科学公司 | 高度准确的从头多核苷酸合成 |
| US11926867B2 (en) | 2019-01-06 | 2024-03-12 | 10X Genomics, Inc. | Generating capture probes for spatial analysis |
| US11649485B2 (en) | 2019-01-06 | 2023-05-16 | 10X Genomics, Inc. | Generating capture probes for spatial analysis |
| CN113474466A (zh) | 2019-02-21 | 2021-10-01 | 主基因有限公司 | 多倍体基因分型 |
| AU2020229349A1 (en) | 2019-02-26 | 2021-10-14 | Twist Bioscience Corporation | Variant nucleic acid libraries for GLP1 receptor |
| JP2022522668A (ja) | 2019-02-26 | 2022-04-20 | ツイスト バイオサイエンス コーポレーション | 抗体を最適化するための変異体核酸ライブラリ |
| WO2020243579A1 (en) | 2019-05-30 | 2020-12-03 | 10X Genomics, Inc. | Methods of detecting spatial heterogeneity of a biological sample |
| EP3980559A1 (en) | 2019-06-06 | 2022-04-13 | Natera, Inc. | Methods for detecting immune cell dna and monitoring immune system |
| EP3987019A4 (en) | 2019-06-21 | 2023-04-19 | Twist Bioscience Corporation | Barcode-based nucleic acid sequence assembly |
| CN115023440B (zh) | 2019-09-23 | 2025-09-12 | 特韦斯特生物科学公司 | 结合CD3ε的抗体 |
| EP4034566A4 (en) | 2019-09-23 | 2024-01-24 | Twist Bioscience Corporation | VARIANT NUCLEIC ACID BANKS FOR CRTH2 |
| WO2021092433A2 (en) | 2019-11-08 | 2021-05-14 | 10X Genomics, Inc. | Enhancing specificity of analyte binding |
| WO2021091611A1 (en) | 2019-11-08 | 2021-05-14 | 10X Genomics, Inc. | Spatially-tagged analyte capture agents for analyte multiplexing |
| JP2023505712A (ja) | 2019-12-12 | 2023-02-10 | キージーン ナムローゼ フェンノートシャップ | 半固体状態での核酸操作 |
| AU2020407850A1 (en) | 2019-12-20 | 2022-06-30 | Keygene N.V. | NGS library preparation using covalently closed nucleic acid molecule ends |
| CN121022991A (zh) | 2019-12-23 | 2025-11-28 | 10X基因组学有限公司 | 使用rna模板化连接进行空间分析的方法 |
| CN115038794A (zh) | 2019-12-23 | 2022-09-09 | 10X基因组学有限公司 | 在基于分区的测定中使用固定生物样品的组合物和方法 |
| US12365942B2 (en) | 2020-01-13 | 2025-07-22 | 10X Genomics, Inc. | Methods of decreasing background on a spatial array |
| US12405264B2 (en) | 2020-01-17 | 2025-09-02 | 10X Genomics, Inc. | Electrophoretic system and method for analyte capture |
| US11702693B2 (en) | 2020-01-21 | 2023-07-18 | 10X Genomics, Inc. | Methods for printing cells and generating arrays of barcoded cells |
| US11732299B2 (en) | 2020-01-21 | 2023-08-22 | 10X Genomics, Inc. | Spatial assays with perturbed cells |
| US20210230681A1 (en) | 2020-01-24 | 2021-07-29 | 10X Genomics, Inc. | Methods for spatial analysis using proximity ligation |
| US11821035B1 (en) | 2020-01-29 | 2023-11-21 | 10X Genomics, Inc. | Compositions and methods of making gene expression libraries |
| US12076701B2 (en) | 2020-01-31 | 2024-09-03 | 10X Genomics, Inc. | Capturing oligonucleotides in spatial transcriptomics |
| US12110541B2 (en) | 2020-02-03 | 2024-10-08 | 10X Genomics, Inc. | Methods for preparing high-resolution spatial arrays |
| US11898205B2 (en) | 2020-02-03 | 2024-02-13 | 10X Genomics, Inc. | Increasing capture efficiency of spatial assays |
| US11732300B2 (en) | 2020-02-05 | 2023-08-22 | 10X Genomics, Inc. | Increasing efficiency of spatial analysis in a biological sample |
| WO2021158925A1 (en) | 2020-02-07 | 2021-08-12 | 10X Genomics, Inc. | Quantitative and automated permeabilization performance evaluation for spatial transcriptomics |
| US11835462B2 (en) | 2020-02-11 | 2023-12-05 | 10X Genomics, Inc. | Methods and compositions for partitioning a biological sample |
| US12281357B1 (en) | 2020-02-14 | 2025-04-22 | 10X Genomics, Inc. | In situ spatial barcoding |
| US12399123B1 (en) | 2020-02-14 | 2025-08-26 | 10X Genomics, Inc. | Spatial targeting of analytes |
| US11891654B2 (en) | 2020-02-24 | 2024-02-06 | 10X Genomics, Inc. | Methods of making gene expression libraries |
| US11926863B1 (en) | 2020-02-27 | 2024-03-12 | 10X Genomics, Inc. | Solid state single cell method for analyzing fixed biological cells |
| US11768175B1 (en) | 2020-03-04 | 2023-09-26 | 10X Genomics, Inc. | Electrophoretic methods for spatial analysis |
| ES2965354T3 (es) | 2020-04-22 | 2024-04-12 | 10X Genomics Inc | Métodos para análisis espacial que usan eliminación de ARN elegido como diana |
| EP4153984A1 (en) | 2020-05-19 | 2023-03-29 | 10X Genomics, Inc. | Electrophoresis cassettes and instrumentation |
| WO2021237087A1 (en) | 2020-05-22 | 2021-11-25 | 10X Genomics, Inc. | Spatial analysis to detect sequence variants |
| ES2989052T3 (es) | 2020-05-22 | 2024-11-25 | 10X Genomics Inc | Medición espacio-temporal simultánea de la expresión génica y la actividad celular |
| WO2021242834A1 (en) | 2020-05-26 | 2021-12-02 | 10X Genomics, Inc. | Method for resetting an array |
| WO2021247543A2 (en) | 2020-06-02 | 2021-12-09 | 10X Genomics, Inc. | Nucleic acid library methods |
| US12265079B1 (en) | 2020-06-02 | 2025-04-01 | 10X Genomics, Inc. | Systems and methods for detecting analytes from captured single biological particles |
| EP4158054B1 (en) | 2020-06-02 | 2025-04-16 | 10X Genomics, Inc. | Spatial transcriptomics for antigen-receptors |
| US12031177B1 (en) | 2020-06-04 | 2024-07-09 | 10X Genomics, Inc. | Methods of enhancing spatial resolution of transcripts |
| ES2981265T3 (es) | 2020-06-08 | 2024-10-08 | 10X Genomics Inc | Métodos para determinar un margen quirúrgico y métodos de uso del mismo |
| WO2021252591A1 (en) | 2020-06-10 | 2021-12-16 | 10X Genomics, Inc. | Methods for determining a location of an analyte in a biological sample |
| US12435363B1 (en) | 2020-06-10 | 2025-10-07 | 10X Genomics, Inc. | Materials and methods for spatial transcriptomics |
| EP4172362B1 (en) | 2020-06-25 | 2024-09-18 | 10X Genomics, Inc. | Spatial analysis of dna methylation |
| US11981960B1 (en) | 2020-07-06 | 2024-05-14 | 10X Genomics, Inc. | Spatial analysis utilizing degradable hydrogels |
| US11761038B1 (en) | 2020-07-06 | 2023-09-19 | 10X Genomics, Inc. | Methods for identifying a location of an RNA in a biological sample |
| US12209280B1 (en) | 2020-07-06 | 2025-01-28 | 10X Genomics, Inc. | Methods of identifying abundance and location of an analyte in a biological sample using second strand synthesis |
| US11981958B1 (en) | 2020-08-20 | 2024-05-14 | 10X Genomics, Inc. | Methods for spatial analysis using DNA capture |
| ES2993269T3 (en) | 2020-09-18 | 2024-12-26 | 10X Genomics Inc | Sample handling apparatus and image registration methods |
| US11926822B1 (en) | 2020-09-23 | 2024-03-12 | 10X Genomics, Inc. | Three-dimensional spatial analysis |
| JP2023543602A (ja) | 2020-10-06 | 2023-10-17 | キージーン ナムローゼ フェンノートシャップ | 標的化された配列付加 |
| US11827935B1 (en) | 2020-11-19 | 2023-11-28 | 10X Genomics, Inc. | Methods for spatial analysis using rolling circle amplification and detection probes |
| WO2022112316A1 (en) | 2020-11-24 | 2022-06-02 | Keygene N.V. | Targeted enrichment using nanopore selective sequencing |
| WO2022112394A1 (en) | 2020-11-25 | 2022-06-02 | Koninklijke Nederlandse Akademie Van Wetenschappen | Ribosomal profiling in single cells |
| EP4121555A1 (en) | 2020-12-21 | 2023-01-25 | 10X Genomics, Inc. | Methods, compositions, and systems for capturing probes and/or barcodes |
| EP4421491A3 (en) | 2021-02-19 | 2024-11-27 | 10X Genomics, Inc. | Method of using a modular assay support device |
| ES3008686T3 (en) | 2021-03-18 | 2025-03-24 | 10X Genomics Inc | Multiplex capture of gene and protein expression from a biological sample |
| EP4428246B1 (en) | 2021-04-14 | 2025-12-24 | 10X Genomics, Inc. | Methods of measuring mislocalization of an analyte |
| WO2022236054A1 (en) | 2021-05-06 | 2022-11-10 | 10X Genomics, Inc. | Methods for increasing resolution of spatial analysis |
| EP4582555A3 (en) | 2021-06-03 | 2025-10-22 | 10X Genomics, Inc. | Methods, compositions, kits, and systems for enhancing analyte capture for spatial analysis |
| ES3011462T3 (en) | 2021-09-01 | 2025-04-07 | 10X Genomics Inc | Methods for blocking a capture probe on a spatial array |
| EP4419707A1 (en) | 2021-11-10 | 2024-08-28 | 10X Genomics, Inc. | Methods, compositions, and kits for determining the location of an analyte in a biological sample |
| EP4305195A2 (en) | 2021-12-01 | 2024-01-17 | 10X Genomics, Inc. | Methods, compositions, and systems for improved in situ detection of analytes and spatial analysis |
| WO2023122033A1 (en) | 2021-12-20 | 2023-06-29 | 10X Genomics, Inc. | Self-test for pathology/histology slide imaging device |
| WO2024121354A1 (en) | 2022-12-08 | 2024-06-13 | Keygene N.V. | Duplex sequencing with covalently closed dna ends |
| WO2024209000A1 (en) | 2023-04-04 | 2024-10-10 | Keygene N.V. | Linkers for duplex sequencing |
Family Cites Families (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20100267023A1 (en) * | 1992-09-24 | 2010-10-21 | Keygene N.V. | Selective restriction fragment amplification: fingerprinting |
| AU2004209426B2 (en) * | 2003-01-29 | 2008-04-17 | 454 Life Sciences Corporation | Method for preparing single-stranded DNA libraries |
| EP2302070B1 (en) * | 2005-06-23 | 2012-08-22 | Keygene N.V. | Strategies for high throughput identification and detection of polymorphisms |
| ES2357549T3 (es) * | 2005-06-23 | 2011-04-27 | Keygene N.V. | Estrategias para la identificación y detección de alto rendimiento de polimorfismos. |
-
2006
- 2006-12-21 WO PCT/NL2006/000654 patent/WO2007073171A2/en not_active Ceased
- 2006-12-21 US US12/158,039 patent/US20090247415A1/en not_active Abandoned
- 2006-12-21 EP EP06835676A patent/EP1966394B1/en not_active Not-in-force
- 2006-12-21 ES ES06835676T patent/ES2394633T3/es active Active
- 2006-12-21 DK DK06835676.5T patent/DK1966394T3/da active
- 2006-12-21 CN CN200680048630XA patent/CN101365803B/zh not_active Expired - Fee Related
- 2006-12-21 JP JP2008547131A patent/JP5198284B2/ja not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| WO2007073171A3 (en) | 2007-08-30 |
| JP2009520500A (ja) | 2009-05-28 |
| CN101365803A (zh) | 2009-02-11 |
| JP5198284B2 (ja) | 2013-05-15 |
| EP1966394B1 (en) | 2012-07-25 |
| US20090247415A1 (en) | 2009-10-01 |
| EP1966394A2 (en) | 2008-09-10 |
| WO2007073171A2 (en) | 2007-06-28 |
| CN101365803B (zh) | 2013-03-20 |
| DK1966394T3 (da) | 2012-10-29 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| ES2394633T3 (es) | Estrategias mejoradas para elaboración de perfiles de transcritos usando tecnologías de secuenciación de alto rendimiento | |
| ES2882401T3 (es) | Método de detección de polimorfismos basado en AFLP de alto rendimiento | |
| JP6685324B2 (ja) | 特異的分子インデックス(umi)を有する冗長リードを用いたシーケンシングdna断片におけるエラーの抑制 | |
| ES2387878T3 (es) | Estrategias para la identificación de alto rendimiento y la detección de polimorfismos | |
| ES2338459T3 (es) | Exploracion de alto redimiento de poblaciones mutagenizadas. | |
| JP2021520809A (ja) | がんまたは新生物評価のための組成物および方法 | |
| JP7051677B2 (ja) | 次世代シークエンシングのための高分子量dnaサンプル追跡タグ | |
| JP7539770B2 (ja) | ゲノム再編成検出のための配列決定方法 | |
| JP2013544498A (ja) | 固定化プライマーを使用した標的dnaの直接的な捕捉、増幅、および配列決定 | |
| CN101310024B (zh) | 高通量筛选转座子标记群体和大量平行的插入位点的序列鉴定方法 |