ES2393318T3 - Estrategias para la identificación y detección de alto rendimiento de polimorfismos - Google Patents
Estrategias para la identificación y detección de alto rendimiento de polimorfismos Download PDFInfo
- Publication number
- ES2393318T3 ES2393318T3 ES10075564T ES10075564T ES2393318T3 ES 2393318 T3 ES2393318 T3 ES 2393318T3 ES 10075564 T ES10075564 T ES 10075564T ES 10075564 T ES10075564 T ES 10075564T ES 2393318 T3 ES2393318 T3 ES 2393318T3
- Authority
- ES
- Spain
- Prior art keywords
- dna
- fragments
- sample
- sequence
- aflp
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 102000054765 polymorphisms of proteins Human genes 0.000 title abstract description 55
- 238000001514 detection method Methods 0.000 title abstract description 25
- 238000000034 method Methods 0.000 claims abstract description 89
- 230000009467 reduction Effects 0.000 claims abstract description 45
- 108020004414 DNA Proteins 0.000 claims description 156
- 239000012634 fragment Substances 0.000 claims description 145
- 230000003321 amplification Effects 0.000 claims description 44
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 44
- 230000015572 biosynthetic process Effects 0.000 claims description 18
- 238000002372 labelling Methods 0.000 claims description 13
- 238000005498 polishing Methods 0.000 claims description 5
- 239000007787 solid Substances 0.000 claims description 2
- 108091093088 Amplicon Proteins 0.000 claims 5
- 230000002265 prevention Effects 0.000 claims 1
- 239000000523 sample Substances 0.000 abstract description 155
- 238000012163 sequencing technique Methods 0.000 abstract description 59
- 239000002773 nucleotide Substances 0.000 abstract description 55
- 125000003729 nucleotide group Chemical group 0.000 abstract description 55
- 238000012360 testing method Methods 0.000 abstract description 26
- 210000002865 immune cell Anatomy 0.000 abstract 2
- 239000003795 chemical substances by application Substances 0.000 abstract 1
- 230000000139 costimulatory effect Effects 0.000 abstract 1
- 230000005931 immune cell recruitment Effects 0.000 abstract 1
- 230000028993 immune response Effects 0.000 abstract 1
- 230000002401 inhibitory effect Effects 0.000 abstract 1
- 108091008042 inhibitory receptors Proteins 0.000 abstract 1
- 230000003993 interaction Effects 0.000 abstract 1
- 108020003175 receptors Proteins 0.000 abstract 1
- 239000013615 primer Substances 0.000 description 112
- 208000005652 acute fatty liver of pregnancy Diseases 0.000 description 90
- 102000039446 nucleic acids Human genes 0.000 description 78
- 108020004707 nucleic acids Proteins 0.000 description 78
- 150000007523 nucleic acids Chemical class 0.000 description 78
- 238000003752 polymerase chain reaction Methods 0.000 description 55
- 239000000047 product Substances 0.000 description 40
- 238000006243 chemical reaction Methods 0.000 description 29
- 239000000203 mixture Substances 0.000 description 27
- 108091008146 restriction endonucleases Proteins 0.000 description 27
- 241000722363 Piper Species 0.000 description 26
- 239000011324 bead Substances 0.000 description 26
- 235000002566 Capsicum Nutrition 0.000 description 21
- 108091034117 Oligonucleotide Proteins 0.000 description 21
- 239000006002 Pepper Substances 0.000 description 21
- 235000016761 Piper aduncum Nutrition 0.000 description 21
- 235000017804 Piper guineense Nutrition 0.000 description 21
- 235000008184 Piper nigrum Nutrition 0.000 description 21
- 238000009396 hybridization Methods 0.000 description 19
- 108700028369 Alleles Proteins 0.000 description 18
- 239000011049 pearl Substances 0.000 description 17
- 238000005516 engineering process Methods 0.000 description 13
- 238000002360 preparation method Methods 0.000 description 13
- 101150044508 key gene Proteins 0.000 description 11
- 238000012216 screening Methods 0.000 description 11
- 102000053602 DNA Human genes 0.000 description 10
- 108090000623 proteins and genes Proteins 0.000 description 10
- 241000196324 Embryophyta Species 0.000 description 8
- 102000004190 Enzymes Human genes 0.000 description 8
- 108090000790 Enzymes Proteins 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 238000000746 purification Methods 0.000 description 8
- 238000011160 research Methods 0.000 description 8
- 239000000243 solution Substances 0.000 description 8
- 238000011330 nucleic acid test Methods 0.000 description 7
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 6
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 6
- 101710163270 Nuclease Proteins 0.000 description 6
- 108091028043 Nucleic acid sequence Proteins 0.000 description 6
- 240000008042 Zea mays Species 0.000 description 6
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 6
- 238000002869 basic local alignment search tool Methods 0.000 description 6
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 6
- 229920001519 homopolymer Polymers 0.000 description 6
- 238000002955 isolation Methods 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 6
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 6
- 108091092878 Microsatellite Proteins 0.000 description 5
- 238000012408 PCR amplification Methods 0.000 description 5
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 5
- 239000011543 agarose gel Substances 0.000 description 5
- 238000004925 denaturation Methods 0.000 description 5
- 230000036425 denaturation Effects 0.000 description 5
- 238000013461 design Methods 0.000 description 5
- 230000029087 digestion Effects 0.000 description 5
- 230000002068 genetic effect Effects 0.000 description 5
- 238000003205 genotyping method Methods 0.000 description 5
- 238000011534 incubation Methods 0.000 description 5
- 238000003780 insertion Methods 0.000 description 5
- 230000037431 insertion Effects 0.000 description 5
- 239000013612 plasmid Substances 0.000 description 5
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 5
- 108091035707 Consensus sequence Proteins 0.000 description 4
- 239000003155 DNA primer Substances 0.000 description 4
- 108091027305 Heteroduplex Proteins 0.000 description 4
- 108091093105 Nuclear DNA Proteins 0.000 description 4
- 208000020584 Polyploidy Diseases 0.000 description 4
- 238000012300 Sequence Analysis Methods 0.000 description 4
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 4
- 238000003556 assay Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 230000000295 complement effect Effects 0.000 description 4
- 150000001875 compounds Chemical class 0.000 description 4
- 235000005822 corn Nutrition 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 201000010099 disease Diseases 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 239000000839 emulsion Substances 0.000 description 4
- 238000001502 gel electrophoresis Methods 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 4
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 4
- 238000010348 incorporation Methods 0.000 description 4
- 102000004169 proteins and genes Human genes 0.000 description 4
- 238000010200 validation analysis Methods 0.000 description 4
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 3
- GNFTZDOKVXKIBK-UHFFFAOYSA-N 3-(2-methoxyethoxy)benzohydrazide Chemical compound COCCOC1=CC=CC(C(=O)NN)=C1 GNFTZDOKVXKIBK-UHFFFAOYSA-N 0.000 description 3
- FGUUSXIOTUKUDN-IBGZPJMESA-N C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 Chemical compound C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 FGUUSXIOTUKUDN-IBGZPJMESA-N 0.000 description 3
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 3
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 3
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 description 3
- 108020004682 Single-Stranded DNA Proteins 0.000 description 3
- 238000002487 chromatin immunoprecipitation Methods 0.000 description 3
- 238000010367 cloning Methods 0.000 description 3
- 229940104302 cytosine Drugs 0.000 description 3
- 239000005547 deoxyribonucleotide Substances 0.000 description 3
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 3
- 238000013537 high throughput screening Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000013011 mating Effects 0.000 description 3
- 238000012175 pyrosequencing Methods 0.000 description 3
- 238000001303 quality assessment method Methods 0.000 description 3
- 229910052709 silver Inorganic materials 0.000 description 3
- 239000004332 silver Substances 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 238000010186 staining Methods 0.000 description 3
- 239000007858 starting material Substances 0.000 description 3
- 229940113082 thymine Drugs 0.000 description 3
- 210000001519 tissue Anatomy 0.000 description 3
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- LZZYPRNAOMGNLH-UHFFFAOYSA-M Cetrimonium bromide Chemical class [Br-].CCCCCCCCCCCCCCCC[N+](C)(C)C LZZYPRNAOMGNLH-UHFFFAOYSA-M 0.000 description 2
- 102000012410 DNA Ligases Human genes 0.000 description 2
- 108010061982 DNA Ligases Proteins 0.000 description 2
- 230000004544 DNA amplification Effects 0.000 description 2
- 238000007399 DNA isolation Methods 0.000 description 2
- 238000000018 DNA microarray Methods 0.000 description 2
- 108010042407 Endonucleases Proteins 0.000 description 2
- 102000004533 Endonucleases Human genes 0.000 description 2
- 108060002716 Exonuclease Proteins 0.000 description 2
- 101000836075 Homo sapiens Serpin B9 Proteins 0.000 description 2
- 101000661807 Homo sapiens Suppressor of tumorigenicity 14 protein Proteins 0.000 description 2
- 241000238124 Paralithodes camtschaticus Species 0.000 description 2
- 229920002684 Sepharose Polymers 0.000 description 2
- 102100025517 Serpin B9 Human genes 0.000 description 2
- 240000003768 Solanum lycopersicum Species 0.000 description 2
- 108010006785 Taq Polymerase Proteins 0.000 description 2
- 108091023040 Transcription factor Proteins 0.000 description 2
- 102000040945 Transcription factor Human genes 0.000 description 2
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 2
- YTAHJIFKAKIKAV-XNMGPUDCSA-N [(1R)-3-morpholin-4-yl-1-phenylpropyl] N-[(3S)-2-oxo-5-phenyl-1,3-dihydro-1,4-benzodiazepin-3-yl]carbamate Chemical compound O=C1[C@H](N=C(C2=C(N1)C=CC=C2)C1=CC=CC=C1)NC(O[C@H](CCN1CCOCC1)C1=CC=CC=C1)=O YTAHJIFKAKIKAV-XNMGPUDCSA-N 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 102000023732 binding proteins Human genes 0.000 description 2
- 108091008324 binding proteins Proteins 0.000 description 2
- 210000003763 chloroplast Anatomy 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 2
- 235000011180 diphosphates Nutrition 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000007720 emulsion polymerization reaction Methods 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 102000013165 exonuclease Human genes 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 2
- 229910052737 gold Inorganic materials 0.000 description 2
- 239000010931 gold Substances 0.000 description 2
- 230000002779 inactivation Effects 0.000 description 2
- 238000005304 joining Methods 0.000 description 2
- 235000009973 maize Nutrition 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000026731 phosphorylation Effects 0.000 description 2
- 238000006366 phosphorylation reaction Methods 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 239000002987 primer (paints) Substances 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 239000011550 stock solution Substances 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- 108091006112 ATPases Proteins 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 208000024827 Alzheimer disease Diseases 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 108020004998 Chloroplast DNA Proteins 0.000 description 1
- 241000207199 Citrus Species 0.000 description 1
- 230000007023 DNA restriction-modification system Effects 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 206010071602 Genetic polymorphism Diseases 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000582320 Homo sapiens Neurogenic differentiation factor 6 Proteins 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 241000227653 Lycopersicon Species 0.000 description 1
- 108700011259 MicroRNAs Proteins 0.000 description 1
- 108020005196 Mitochondrial DNA Proteins 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 102100030589 Neurogenic differentiation factor 6 Human genes 0.000 description 1
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 1
- 238000002944 PCR assay Methods 0.000 description 1
- 239000012807 PCR reagent Substances 0.000 description 1
- 108091093037 Peptide nucleic acid Proteins 0.000 description 1
- 108010010677 Phosphodiesterase I Proteins 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 238000003975 animal breeding Methods 0.000 description 1
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 235000020971 citrus fruits Nutrition 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000008021 deposition Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 238000006471 dimerization reaction Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000004945 emulsification Methods 0.000 description 1
- 230000009144 enzymatic modification Effects 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- ZMMJGEGLRURXTF-UHFFFAOYSA-N ethidium bromide Chemical compound [Br-].C12=CC(N)=CC=C2C2=CC=C(N)C=C2[N+](CC)=C1C1=CC=CC=C1 ZMMJGEGLRURXTF-UHFFFAOYSA-N 0.000 description 1
- 229960005542 ethidium bromide Drugs 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 238000005194 fractionation Methods 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 230000007614 genetic variation Effects 0.000 description 1
- 238000012268 genome sequencing Methods 0.000 description 1
- -1 genomic DNA Chemical class 0.000 description 1
- 210000000514 hepatopancreas Anatomy 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000000543 intermediate Substances 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 239000006249 magnetic particle Substances 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 238000001531 micro-dissection Methods 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 230000035764 nutrition Effects 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 239000000825 pharmaceutical preparation Substances 0.000 description 1
- 229940127557 pharmaceutical product Drugs 0.000 description 1
- 230000000865 phosphorylative effect Effects 0.000 description 1
- 238000003976 plant breeding Methods 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 150000008442 polyphenolic compounds Chemical class 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 239000012264 purified product Substances 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 239000006152 selective media Substances 0.000 description 1
- 238000002798 spectrophotometry method Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 108091035539 telomere Proteins 0.000 description 1
- 210000003411 telomere Anatomy 0.000 description 1
- 102000055501 telomere Human genes 0.000 description 1
- 238000009966 trimming Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1065—Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6809—Methods for determination or identification of nucleic acids involving differential detection
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6827—Hybridisation assays for detection of mutation or polymorphism
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6858—Allele-specific amplification
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
- C12Q1/6874—Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B30/00—Methods of screening libraries
- C40B30/04—Methods of screening libraries by measuring the ability to specifically bind a target molecule, e.g. antibody-antigen binding, receptor-ligand binding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B30/00—Methods of screening libraries
- C40B30/10—Methods of screening libraries by measuring physical properties, e.g. mass
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Physics & Mathematics (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Analytical Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Immunology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Biomedical Technology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Crystallography & Structural Chemistry (AREA)
- Plant Pathology (AREA)
- General Chemical & Material Sciences (AREA)
- Medicinal Chemistry (AREA)
- Pathology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
Utilización en un método de reducción de la complejidad, de un adaptador que porta un extremoprotuberante 3' de T en la reducción del etiquetado mixto de una muestra de ADN amplificado y/o en lareducción o prevención de la formación de concatámeros de fragmentos de ADN de una muestra de ADNque comprende fragmentos de restricción amplificados que portan un extremo protuberante 3' de Aobtenido de una reducción de complejidad.
Description
Estrategias para la identificación y detección de alto rendimiento de polimorfismos.
La presente invención se refiere a los campos de la biología molecular y de la genética. La invención se refiere a la rápida identificación de múltiples polimorfismos en una muestra de ácidos nucleicos. Los polimorfismos identificados pueden utilizarse para el desarrollo de sistemas de cribado de alto rendimiento para polimorfismos en muestras de ensayo.
La exploración del ADN genómico ha sido el deseo de la comunidad científica, en particular de la comunidad médica, desde hace mucho tiempo. El ADN genómico es la clave para la identificación, diagnóstico y tratamiento de enfermedades tales como el cáncer y la enfermedad de Alzheimer. Además de la identificación y tratamiento de enfermedades, la exploración del ADN genómico podría proporcionar ventajas significativas en esfuerzos de cría vegetal y animal, proporcionando respuestas a problemas de alimentación y nutrición en todo el mundo.
Es conocido que muchas enfermedades se asocian a componentes genéticos específicos, en particular a polimorfismos en genes específicos. La identificación de polimorfismos en muestras grandes, tales como genomas, en la actualidad es una tarea laboriosa y que requiere mucho tiempo. Sin embargo, esta identificación resulta de gran valor para áreas tales como la investigación biomédica, el desarrollo de productos farmacéuticos, el tipado de tejidos, el genotipado y los estudios poblacionales.
La presente invención proporciona un método para identificar eficientemente y para detectar fiablemente polimorfismos en una muestra compleja, por ejemplo de gran tamaño, de ácidos nucleicos (por ejemplo ADN o ARN) de un modo rápido y económico utilizando una combinación de métodos de alto rendimiento.
Dicha integración de métodos de alto rendimiento conjuntamente proporcionan una plataforma que resulta particularmente adecuada para la identificación y detección rápidas y fiables de polimorfismos en muestras de ácidos nucleicos altamente complejas, en las que la identificación y mapeado convencionales de polimorfismos resultaría laboriosa y requeriría mucho tiempo.
Una de la cosas que han encontrado los presentes inventores es una solución para identificar polimorfismos, preferiblemente polimorfismos de un solo nucleótido, aunque de manera similar (micro)satélites y/o indels, en particular en genomas grandes. El método es único en su aplicabilidad a genomas tanto grandes como pequeños, aunque proporciona ventajas particulares en genomas grandes, en particular en especies poliploides.
Para identificar los SNP (y posteriormente detectar los SNP identificados) se dispone de varias posibilidades en la técnica. En una primera opción, puede secuenciarse el genoma completo, y ello puede llevarse a cabo en varios individuos. Es un ejercicio en gran parte teórico, al ser engorroso y caro y, a pesar del rápido desarrollo de la tecnología, simplemente no resulta factible su aplicación a cada organismo, especialmente a los que presentan genomas más grandes. La segunda opción es utilizar la información de secuencia disponible (fragmentada), tal como las bibliotecas EST. Esto permite la generación de cebadores de PCR, la resecuenciación y la comparación entre individuos. Nuevamente lo anterior requiere información inicial de secuencia que no se encuentra disponible o que se encuentra disponible sólo en una cantidad limitada. Además, deben desarrollarse ensayos de PCR separados para cada región, lo que supone una adición enorme a los costes y tiempo de desarrollo.
La tercera opción es limitarse a parte del genoma de cada individuo. La dificultad reside en que la parte proporcionada del genoma debe ser igual en diferentes individuos con el fin de proporcionar un resultado comparable para la identificación con éxito de los SNP. Los presentes inventores ahora han resuelto este dilema mediante la integración de métodos altamente reproducibles para seleccionar parte del genoma mediante secuenciación de alto rendimiento para la identificación de los polimorfismos integrada con la preparación de muestras y plataformas de identificación de alto rendimiento. La presente invención acelera el procedimiento de identificación de polimorfismos y utiliza los mismos elementos en el procedimiento posterior para explotar los polimorfismos descubiertos, permitiendo un genotipado de alto rendimiento efectivo y fiable.
Entre las aplicaciones adicionalmente contempladas en la presente invención se incluyen las bibliotecas de microsatélites enriquecidas mediante cribado, la realización de AFLP-ADNc de perfilado de transcritos (northern digital), la secuenciación de genomas complejos, la secuenciación de bibliotecas de EST (en ADNc completo o en AFLP-ADNc), la exploración de microARN (secuenciación de bibliotecas de inserciones de pequeño tamaño), la secuenciación de cromosoma artificial bacteriano (BAC) (contig), AFLP/AFLP-ADNc en un enfoque de análisis de segregantes agrupados, la detección rutinaria de fragmentos de la AFLP, por ejemplo para retrocruzamientos asistidos por un marcador (MABC), etc.
En la descripción y ejemplos posteriormente se utiliza una serie de expresiones. Con el fin de proporcionar una comprensión clara y consistente de la memoria y reivindicaciones, incluyendo el alcance que debe proporcionarse a dichas expresiones, se proporcionan las definiciones siguientes. A menos que se defina de otra manera en la presente memoria, todas las expresiones técnicas y científicas utilizadas presentan los mismos significados comúnmente entendidos por el experto ordinario en la materia a la que pertenece la presente invención.
Polimorfismo: los polimorfismos se refieren a la presencia de dos o más variantes de una secuencia de nucleótidos en una población. Un polimorfismo puede comprender uno o más cambios de bases, una inserción, una repetición, o una deleción. Un polimorfismo incluye, por ejemplo una repetición de secuencia simple (SSR) y un polimorfismo de un único nucleótidos (SNP), que es una variación que se produce en el caso de que se altere un único nucleótido: adenina (A), timina (T), citosina (C) o guanina (G). Debe producirse generalmente una variación en por lo menos 1% de la población para que se considere un SNP. Los SNP constituyen 90% de todas las variaciones genéticas humanas y se producen cada 100 a 300 bases a lo largo del genoma humano. Dos de cada tres SNP sustituyen la citosina (C) por la timina (T). Las variaciones en las secuencias de ADN de, por ejemplo, seres humanos o plantas, pueden afectar a cómo se enfrentan a enfermedades, bacterias, virus, compuestos químicos, fármacos, etc.
Ácido nucleico: un ácido nucleico según la presente invención puede incluir cualquier polímero u oligómero de base pirimidina o purina, preferiblemente citosina, timina y guanina, respectivamente (ver Albert L. Lehninger, Principles of Biochemistry, páginas 793 a 800, Worth Publ. 1982). La presente invención contempla cualquier componente desoxirribonucleótido, ribonucleótido o péptido-ácido nucleico, y cualesquiera variantes químicas de los mismos, tales como formas metiladas, hidroximetiladas o glucosiladas de dichas bases, y similares. Los polímeros u oligómeros pueden ser de composición heterogénea u homogénea, y pueden aislarse a partir de fuentes naturales o producirse artificial o sintéticamente. Además, los ácidos nucleicos pueden ser de ADN o ARN, o una mezcla de los mismos, y pueden existir permanente o transitoriamente en forma de una cadena o de doble cadena, incluyendo estados de homodúplex, heterodúplex e híbridos.
Reducción de complejidad: la expresión "reducción de la complejidad" se utiliza para referirse a un método en el que la complejidad de una muestra de ácidos nucleicos, tal como ADN genómico, se reduce mediante la generación de un subconjunto de la muestra. Este subconjunto puede ser representativo de la muestra completa (es decir de la muestra compleja) y preferentemente es un subconjunto reproducible. El término "reproducible" se refiere en el presente contexto a que, al reducir la complejidad de la misma muestra utilizando el mismo método, se obtiene el mismo subconjunto o por lo menos uno comparable. El método utilizado para la reducción de la complejidad puede ser cualquier método de reducción de la complejidad conocido de la técnica. Entre los ejemplos de métodos de reducción de la complejidad se incluyen, por ejemplo, AFLP® (Keygene N.V., Países Bajos; ver, por ejemplo, la patente EP nº 0 534 858), los métodos descritos por Dong (ver, por ejemplo, las patentes WO nº 03/012118 y nº 00/24939), la unión indexada (Unrau et al., ver posteriormente), etc. Los métodos de reducción de la complejidad utilizados en la presente invención presentan en común que son reproducibles. Se utiliza el término reproducible en el sentido de que se reduce la complejidad de la misma muestra del mismo modo, se obtiene el mismo subconjunto de la muestra, y no en el sentido de una reducción más aleatoria de la complejidad, tal como la microdisección o la utilización de ARNm (ADNc), el cual representa una parte del genoma transcrito en un tejido seleccionado y su reproducibilidad depende de la selección del tejido, del momento del aislamiento, etc.
Etiquetado: el término "etiquetado" se refiere a la adición de una etiqueta a una muestra de ácidos nucleicos con el fin de distinguirla de una segunda o posteriores muestras de ácidos nucleicos. El etiquetado puede llevarse a cabo, por ejemplo, mediante la adición de un identificador de secuencia durante la reducción de complejidad o mediante cualquier otro medio conocido de la técnica.Dicho identificador de secuencia puede ser, por ejemplo, una única secuencia de bases de longitud variable aunque definida, utilizada únicamente para identificar una muestra específica de ácidos nucleicos. Son ejemplos típicos de la misma, por ejemplo, las secuencias ZIP. Mediante la utilización de dicha etiqueta, puede determinarse el origen de una muestra tras el procesamiento adicional. En el caso de que se combinen productos procesados que se originan de diferentes muestras de ácidos nucleicos, deben identificarse las muestras de ácidos nucleicos diferentes utilizando etiquetas diferentes.
Biblioteca etiquetada: el término "etiquetada" se refiere a una biblioteca de ácidos nucleicos etiquetados.
Secuenciación: el término "secuenciación" se refiere a determinar el orden de los nucleótidos (secuencias de bases) en una muestra de ácidos nucleicos, por ejemplo ADN o ARN.
Alinear y alineación: el término "alinear" y "alineación" se refiere a la comparación entre dos o más secuencias de nucleótidos basada en la presencia de segmentos cortos o largos de nucleótidos idénticos o similares. Son conocidos de la técnica varios métodos para alinear secuencias de nucleótidos, tal como se explica adicionalmente después.
Sondas de detección: la expresión "sondas de detección" se utiliza para referirse a sondas diseñadas para detectar una secuencia específica de nucleótidos, en particular secuencias que contienen uno o más polimorfismos.
Cribado de alto rendimiento: el cribado de alto rendimiento, con frecuencia abreviado HTS, es un método para la experimentación científica especialmente relevante para los campos de la biología y la química. Mediante una combinación de robótica moderna y otros equipos de laboratorio especializados, permite al investigador cribar eficazmente grandes cantidades de muestras simultáneamente.
Ácidos nucleicos de muestra de ensayo: la expresión "ácidos nucleicos de muestra de ensayo" se utiliza para indicar una muestra de ácidos nucleicos que se investiga para polimorfismos utilizando el método de la presente invención.
Endonucleasa de restricción: una endonucleasa de restricción o enzima de restricción es un enzima que reconoce una secuencia específica de nucleótidos (sitio diana) en una molécula de ADN de doble cadena, y corta ambas cadenas de la molécula de ADN en todos los sitios diana.
Fragmentos de restricción: las moléculas de ADN producidas mediante digestión con una endonucleasa de restricción se denominan fragmentos de restricción. Se digiere cualquier genoma dado (o ácido nucleico, con independencia de su origen) mediante una endonucleasa de restricción particular en un conjunto discreto de fragmentos de restricción. Los fragmentos de DAN que resultan del corte con endonucleasa de restricción pueden utilizarse adicionalmente en una diversidad de técnicas y pueden detectarse mediante, por ejemplo, electroforesis en gel.
Electroforesis en gel: con el fin de detectar fragmentos de restricción, puede resultar necesario un método analítico para fraccionar moléculas de ADN de doble cadena basándose en el tamaño. La técnica utilizada más comúnmente para conseguir dicho fraccionamiento es la electroforesis (capilar) en gel. La tasa a la que se desplazan los fragmentos de ADN en dichos geles depende de su peso molecular; de esta manera, se reducen las distancias recorridas a medida que se incrementa la longitud del fragmento. Los fragmentos de ADN fraccionados mediante electroforesis en gel pueden visualizarse directamente mediante un procedimiento de tinción, por ejemplo tinción con plata o tinción utilizando bromuro de etidio, en el caso de que el número de fragmentos incluido en el patrón sea suficientemente reducido. Alternativamente, el tratamiento adicional de los fragmentos de ADN puede incorporar marcajes detectables en los fragmentos, tales como fluoróforos o marcajes radioactivos.
Ligación: la reacción enzimática catalizada por un enzima ligasa en el que se unen covalentemente entre sí dos moléculas de ADN de doble cadena se denomina ligación. En general, ambas cadenas de ADN se unen covalentemente entre sí, aunque también resulta posible evitar la ligación de una de las dos cadenas mediante modificación química o enzimática de uno de los extremos de las cadenas. En este caso, se producirá la unión covalente en únicamente una de las dos cadenas de ADN.
Oligonucleótido sintético: las moléculas de ADN de una cadena que presentan preferentemente entre aproximadamente 10 y aproximadamente 50 bases, que pueden sintetizarse químicamente se denominan oligonucleótidos sintéticos. En general, estas moléculas de ADN sintético se diseñan para que presenten una secuencia de nucleótidos única o deseada, aunque resulta posible sintetizar familias de moléculas que presenten secuencias relacionadas y que presenten composiciones de nucleótidos diferentes en posiciones específicas dentro de la secuencia de nucleótidos. La expresión oligonucleótido sintético se utiliza para referirse a moléculas de ADN que presentan una secuencia de nucleótidos diseñada o deseada.
Adaptadores: moléculas cortas de ADN de doble cadena con un número limitado de pares de bases, por ejemplo una longitud de entre aproximadamente 10 y aproximadamente 30 pares de bases, que se diseñan de manera que puedan ligarse a los extremos de fragmentos de restricción. Los adaptadores están compuestos generalmente de dos oligonucleótidos sintéticos que presentan secuencias de nucleótidos que son parcialmente complementarias entre sí. Al mezclar los dos oligonucleótidos sintéticos en solución bajo condiciones apropiadas, se aparean entre sí formando una estructura de doble cadena. Tras la hibridación, un extremo de la molécula adaptadora se diseña de manera que sea compatible con el extremo de un fragmento de restricción y pueda ligarse al mismo; el otro extremo del adaptador puede diseñarse de manera que no pueda ligarse, aunque éste no es necesariamente el caso (adaptadores doblemente ligados).
Fragmentos de restricción ligados a adaptador: fragmentos de restricción a los que se han añadido caperuzas de adaptadores.
Cebadores: en general, el término cebadores se refiere a una cadena de ADN que puede cebar la síntesis del ADN. La ADN polimerasa no puede sintetizar ADN de novo sin cebadores: únicamente puede extender una cadena de ADN existente en una reacción en la que la cadena complementaria se utiliza como molde para dirigir el orden de nucleótidos que deben ensamblarse. Se hace referencia a las moléculas oligonucleótidas sintéticas que se utilizan en una reacción en cadena de la polimerasa (PCR) como cebadores.
Amplificación de ADN: la expresión "amplificación de ADN" típicamente se utiliza para referirse a la síntesis in vitro de moléculas de ADN de doble cadena utilizando la PCR. Se indica que existen otros métodos de amplificación y que pueden utilizarse en la presente invención sin apartarse de la esencia de la misma.
La presente invención proporciona un método para identificar uno o más polimorfismos, comprendiendo dicho
método las etapas de:
a) proporcionar una primera muestra de ácidos nucleicos de interés,
b) llevar a cabo una reducción de complejidad de la primera muestra de ácidos nucleicos de interés,
proporcionando una primera biblioteca de la primera muestra de ácidos nucleicos,
c) llevar a cabo consecutiva o simultáneamente las etapas a) y b) con una segunda o posterior muestra de
ácidos nucleicos de interés, obteniendo una segunda o posterior biblioteca de la segunda o posterior muestra de
ácidos nucleicos de interés,
d) secuenciar por lo menos una parte de la primera bibilioteca y de la segunda o posteriores bibliotecas,
e) alinear las secuencias obtenidas en la etapa d),
f) determinar uno o más polimorfismos entre la primera muestra de ácidos nucleicos y la segunda o posterior
muestra de ácidos nucleicos en la alineación de la etapa e),
g) utilizar el polimorfismo o polimorfismos determinados en la etapa f) para diseñar una o más sondas de
detección,
h) proporcionar una muestra de ensayo de ácidos nucleicos de interés,
i) llevar a cabo la reducción de complejidad de la etapa b) en la muestra de ensayo de ácidos nucleicos de
interés, proporcionando una biblioteca de ensayo de la muestra de ensayo de ácidos nucleicos,
j) someter la biblioteca de ensayo a cribado de alto rendimiento para identificar la presencia, ausencia o cantidad
de polimorfismos determinada en la etapa f) utilizando las sondas de detección diseñadas en la etapa g).
En la etapa a), se proporciona una primera muestra de ácidos nucleicos de interés. Dicha primera muestra de ácidos nucleicos de interés preferentemente es una muestra compleja de ácidos nucleicos, tal como ADN genómico total o una biblioteca de ADNc. Resulta preferente que la muestra compleja de ácidos nucleicos sea ADN genómico total.
En la etapa b), se lleva a cabo una reducción de la complejidad de la primera muestra de ácidos nucleicos de interés, proporcionando una primera biblioteca de la primera muestra de ácidos nucleicos.
En una realización de la invención, la etapa de reducción de la complejidad de la muestra de ácidos nucleicos comprende cortar enzimáticamente la muestra de ácidos nucleicos en fragmentos de restricción, separar los fragmentos de restricción y seleccionar un grupo particular de fragmentos de restricción. Opcionalmente, los fragmentos seleccionados seguidamente se ligan a secuencias adaptadores que contienen moldes/secuencias ligantes de cebador de PCR.
En una realización de reducción de complejidad, se utiliza una endonucleasa de tipo II para digerir la muestra de ácidos nucleicos y los fragmentos de restricción se ligan selectivamente a secuencias adaptadoras. Las secuencias adaptadoras pueden contener diversos nucleótidos en el extremo protuberante que debe ligarse y únicamente el adaptador con el conjunto correspondiente de nucleótidos en el extremo protuberante se liga con el fragmento y se amplifica posteriormente. Esta tecnología se describe en la técnica como "conectores de indexación". Pueden encontrarse ejemplos de este principio en, entre otros, Unrau P. y Deugau K.V., Gene 145:163-169, 1994.
En otra realización, el método de reducción de la complejidad utiliza dos endonucleasas de restricción que presentan diferentes sitios diana y frecuencias y dos secuencias adaptadoras diferentes.
En otra realización de la invención, la etapa de reducción de la complejidad comprende llevar a cabo una PCR arbitrariamente cebada en la muestra.
En todavía otra realización de la invención, la etapa de reducción de la complejidad comprende eliminar secuencias repetidas mediante desnaturalización y rehibridación del ADN y posterior eliminación de los dúplex de doble cadena.
En otra realización de la invención, la etapa de reducción de la complejidad comprende hibridar la muestra de ácidos nucleicos con una perla magnética que se une a una sonda oligonucleótida que contiene una secuencia deseada. Esta realización puede comprender además exponer la muestra hibridada a una ADN nucleasa de cadena sencilla para eliminar el ADN de cadena sencilla y ligar una secuencia adaptadora que contiene un enzima de restricción de clase II para liberar la perla magnética. Esta realización puede comprender o no la amplificación de la secuencia de ADN aislada. Además, la secuencia adaptadora puede utilizarse o no como molde para el cebador oligonucleótido de PCR. En esta realización, la secuencia adaptadora puede contener o no un identificador o etiqueta de secuencia.
En otra realización, el método de reducción de la complejidad comprende exponer la muestra de ADN a una proteína de unión con error de apareamiento y digerir la muestra con una exonucleasa 3' a 5' y después con una nucleasa de cadenas individuales. Esta realización puede incluir o no la utilización de una perla magnética unida a la proteína ligante con error de apareamiento. En otra realización de la presente invención, la reducción de la complejidad comprende el método CHIP tal como se describe posteriormente en la presente memoria, o el diseño de cebadores de PCR dirigidos contra motivos conservados, tales como SSRs, regiones NBS (regiones ligantes de nucleótidos), secuencias de promotores/intensificadores, secuencias de consenso de telómeros, genes de caja MADS, familias génicas de ATPasa y otras familias génicas.
En la etapa c), se llevan a cabo las etapas a) y b) consecutiva o simultáneamente con un segunda o posterior muestra de ácidos nucleicos de interés, obteniendo una segunda o posterior biblioteca de la segunda o posterior muestra de ácidos nucleicos de interés. Dicha segunda o posterior muestra de ácidos nucleicos de interés preferentemente también es una muestra compleja de ácidos nucleicos, tal como ADN genómico total. Resulta preferente que la muestra compleja de ácidos nucleicos sea ADN genómico total. También resulta preferente que dicha segunda o posterior muestra de ácidos nucleicos esté relacionada con la primera muestra de ácidos nucleicos. La primera muestra de ácidos nucleicos y el segundo o posterior ácido nucleico pueden ser, por ejemplo, diferentes líneas de una planta, tal como diferentes líneas de la planta del pimiento, o diferentes variedades. Las etapas a) y b) pueden llevarse a cabo para meramente una segunda muestra de ácidos nucleicos de interés, aunque también pueden llevarse a cabo adicionalmente para una tercera, cuarta, quinta, etc., muestra de ácidos nucleicos de interés.
Debe indicarse que el método según la presente invención resultará más útil al llevar a cabo reducción de la complejidad utilizando el mismo método y bajo condiciones sustancialmente iguales, preferentemente idénticas, para la primera muestra de ácidos nucleicos y la segunda o posterior muestras de ácidos nucleicos. Bajo dichas condiciones, se obtienen fracciones similares (comparables) de las muestras (complejas) de ácidos nucleicos.
En la etapa d), se secuencia por lo menos una parte de la primer biblioteca y de la segunda o posterior bibliotecas. Resulta preferente que la cantidad de solapamiento de los fragmentos secuenciados de la primera biblioteca y segunda o posterior bibliotecas sea de por lo menos 50%, más preferentemente de por lo menos 60%, todavía más preferentemente de por lo menos 70%, todavía más preferentemente de por lo menos 80%, todavía más preferentemente de por lo menos 90% y todavía más preferentemente de por lo menos 95%.
La secuenciación puede llevarse a cabo, en principio, por cualquier medio conocido de la técnica, tal como el método de terminación de cadena dideoxi. Sin embargo, resulta preferente que la secuenciación se lleve a cabo utilizando métodos de secuenciación de alto rendimiento, tales como los métodos dados a conocer en las patentes WO nº 03/004690, nº 03/054142, nº 2004/069849, nº 2004/070005, nº 2004/070007 y nº 2005/003375 (todas a nombre de 454 Corporation), en Seo et al., Proc. Natl. Acad. Sci. USA 101:5488-93, 2004, y las técnicas de Helios, Solexa, US Genomics, etc. Resulta más preferente que la secuenciación se lleve a cabo utilizando el aparato y/o método dado a conocer en las patentes WO nº 03/004690, nº 03/054142, nº 2004/069849, nº 2004/070005, nº 2004/070007 y nº 2005/003375 (todas a nombre de 454 Corporation). La tecnología descrita permite la secuenciación de 40 millones de bases en una única operación y es 100 veces más rápida y económica que la tecnología competidora. La tecnología de secuenciación consiste en términos generales de 4 etapas: 1) fragmentación del ADN y ligación de adaptadores específicos a una biblioteca de ADN de una cadena (ADNmc), 2) hibridación de ADNmc a perlas y emulsionación de las perlas en microrreactores de agua en aceite, 3) deposición de las perlas que portan ADN en una placa PicoTiterPlate®, y 4) secuenciación simultánea en 100.000 pocillos mediante generación de una señal lumínica del pirofosfato. El método se explica en mayor detalle posteriormente.
En la etapa e), las secuencias obtenidas en la etapa d) se alinean proporcionando una alineación. Los métodos de alineación de secuencias con fines de comparación son bien conocidos de la técnica. Se describen diversos programas y algoritmos de alineación en: Smith and Waterman (1981) Adv. Appl. Math. 2:482; Needleman y Wunsch, J. Mol. Biol. 48:443, 1970; Pearson y Lipman, Proc. Natl. Acad. Sci. USA 85:2444, 1988; Higgins y Sharp, Gene 73:237-244, 1988; Higgins y Sharp, CABIOS 5:151-153, 1989; Corpet et al., Nucl. Acids Res. 16:10881-90, 1988; Huang et al., Computer Appl. in the Biosci. 8:155-65, 1992; y Pearson et al., Meth. Mol. Biol. 24:307-31, 1994. Altschul et al., Nature Genet. 6:119-29, 1994, presentan una consideración detallada de los métodos de alineación de secuencias y los cálculos de homologías.
La herramienta Basic Local Alignment Search Tool (BLAST) del NCBI (Altschul et al., 1990) se encuentra disponible de varias fuentes, incluyendo del National Center for Biological Information (NCBI, Bethesda, Md.) y en internet, para la utilización con los programas de análisis de secuencias blastp, blastn, blastx, tblastn y tblastx. Se puede obtener acceso a los mismos en <http://www.ncbi.nlm.nih.gov/BLAST/>. Una descripcion de como determinar la identidad de secuencia utilizando dicho programa se encuentra disponible en <http: //www.ncbi.nlm.nih.gov/BLAST/blast_help.html>. Una aplicación adicional podría ser la exploración de microsatélites (ver Varshney et al., Trends in Biotechn. 23(1):48-55, 2005).
Típicamente la alineación se lleva a cabo en datos de secuencias que han sido recortados para los adaptadores/cebadores y/o identificadores, es decir, utilizando únicamente los datos de secuencia de los fragmentos que se originan de la muestra de ácidos nucleicos.
Típicamente, los datos de secuencia obtenidos se utilizan para identificar el origen del fragmento (es decir, la muestra de procedencia), se eliminan de los datos las secuencias derivadas de adaptador y/o identificador y se lleva a cabo la alineación en este conjunto recortado.
En la etapa f), se determina uno o más polimorfismos entre la primera muestra de ácidos nucleicos y la segunda o posterior muestra de ácidos nucleicos en la alineación. La alineación puede realizarse de manera que las secuencias derivadas de la primera muestra de ácidos nucleicos y la segunda o posterior muestras de ácidos nucleicos puedan compararse. A continuación, pueden identificarse las diferencias que reflejen polimorfismos.
En la etapa g), el polimorfismo o polimorfismos determinados en la etapa g) se utilizan para diseñar sondas de detección, por ejemplo para la detección mediante hibridación en chips de ADN o en una plataforma de detección basada en perlas. Las sondas de detección se diseñan de manera que se refleje un polimorfismo en las mismas. En el caso de los polimorfismos de un solo nucleótido (SNPs), las sondas de detección típicamente contienen los alelos variantes de SNPs en la posición central de manera que se maximice la discriminación de alelos. Dichas sondas pueden utilizarse ventajosamente para cribar muestras de ensayo que presentan un determinado polimorfismo. Las sondas pueden sintetizarse utilizando cualquier método conocido de la técnica. Las sondas típicamente se diseñan de manera que resulten adecuadas para métodos de cribado de alto rendimiento.
En la etapa h), se proporciona una muestra de ensayo de ácidos nucleicos de interés. La muestra de ensayo de ácidos nucleicos puede ser cualquier muestra, aunque preferentemente es otra línea o variedad que debe mapearse para identificar polimorfismos. Comúnmente se utiliza una colección de muestras de ensayo que representa el plasma germinal de los organismos estudiados con el fin de validar experimentalmente que el polimorfismo (SN) es genuino y detectable, y para calcular las frecuencias alélicas de los alelos observados. Opcionalmente se incluyen muestras de una población de mapeado genético en la etapa de validación con el fin de determinar también la posición en el mapa genético del polimorfismo.
En la etapa i), se lleva a cabo la reducción de complejidad de la etapa b) en la muestra de ensayo de ácidos nucleicos de interés, proporcionando una biblioteca de ensayo de la muestra de ensayo de ácidos nucleicos. Resulta altamente preferente que durante todo el método según la presente invención, se utilice el mismo método para la reducción de complejidad, utilizando condiciones sustancialmente iguales, preferentemente idénticas, cubriendo de esta manera una fracción similar de la muestra. Sin embargo, no resulta necesario obtener una biblioteca de ensayo etiquetada, aunque puede encontrarse presente una etiqueta en los fragmentos en la biblioteca de ensayo.
En la etapa j), la biblioteca de ensayo se somete a cribado de alto rendimiento para identificar la presencia, ausencia
o cantidad de los polimorfismos determinados en la etapa f) utilizando las sondas de detección diseñadas en la etapa g). El experto en la materia conoce varios métodos para el cribado de alto rendimiento utilizando sondas. Resulta preferente que una o más sondas diseñadas utilizando la información obtenida en la etapa g) se inmovilicen en una matriz, tal como un chip de ADN, y que dicha matriz posteriormente se ponga en contacto con la biblioteca de ensayo bajo condiciones de hibridación. Los fragmentos de ADN en la biblioteca de ensayo que sean complementarios a una o más sondas en la matriz se hibridarán bajo dichas condiciones con dichas sondas, y podrán detectarse de esta manera. También se encuentran contemplados otros métodos de cribado de alto rendimiento dentro del alcance de la presente invención, tales como la inmovilización de la biblioteca de ensayo obtenida en la etapa j) y la puesta en contacto de dicha biblioteca de ensayo inmovilizada con las sondas diseñadas en la etapa h) bajo condiciones de hibridación.
Affymetrix, entre otros, proporciona otra técnica de cribado mediante secuenciación de alto rendimiento que utiliza la detección basada en un chip de los SNP y en la tecnología de perlas proporcionada por Illumina.
En una realización ventajosa, la etapa b) en el método según la presente invención comprende además la etapa de etiquetar la biblioteca para obtener una biblioteca etiquetada, y dicho método comprende además la etapa c1) de combinar la primera biblioteca etiquetada y una segunda o posteriores bibliotecas etiquetadas para obtener una biblioteca combinada.
Resulta preferido que el etiquetado se lleve a cabo durante la etapa de reducción de la complejidad para reducir el número de etapas requerido para obtener la primera biblioteca etiquetada de la primera muestra de ácidos nucleicos. Dicho etiquetado simultáneo puede conseguirse mediante, por ejemplo, AFLP, utilizando adaptadores que comprenden un identificador (nucleótido) único para cada muestra.
El etiquetado pretende distinguir entre muestras de origen diferente, por ejemplo obtenidas de diferentes líneas vegetales, en el caso de que se combinen bibliotecas de dos o más muestras de ácidos nucleicos para obtener una biblioteca de combinación. De esta manera, preferentemente se utilizan etiquetas diferentes para preparar las bibliotecas etiquetadas de la primera muestra de ácidos nucleicos y la segunda o posteriores muestras de ácidos nucleicos. En el caso de que se utilicen, por ejemplo, cinco muestras de ácidos nucleicos, se pretenden obtener cinco bibliotecas etiquetadas diferentemente, indicando las cinco etiquetas diferentes las muestras originales respectivas.
La etiqueta puede ser cualquier etiqueta conocida de la técnica para distinguir muestras de ácidos nucleicos, aunque preferentemente es una secuencia identificadora corta. Dicha secuencia identificadora puede ser, por ejemplo, una secuencia de bases única de longitud variable utilizada para indicar el origen de la biblioteca obtenida mediante reducción de complejidad.
En una realización preferente, el etiquetado de la primera biblioteca y de la segunda o posteriores bibliotecas se lleva a cabo utilizando etiquetas diferentes. Tal como se ha comentado anteriormente, resulta preferente que cada biblioteca de una muestra de ácidos nucleicos se identifique con su propia etiqueta. La muestra de ensayo de ácidos nucleicos no requiere ser etiquetada.
En una realización preferente de la invención, se lleva a cabo la reducción de la complejidad por medio de AFLP® (Keygene N.V., Países Bajos, ver, por ejemplo, la patente EP nº 0 534 858 y Vos et al., (1995). AFLP: a new technique for DNA fingerprinting, Nucleic Acids Research 23(21):4407-4414, 1995).
La AFLP es un método para la amplificación selectiva de fragmentos de restricción. La AFLP no requiere información de secuencia previa y puede llevarse a cabo en cualquier ADN de partida. En general, la AFLP comprende las etapas de:
- (a)
- digestión de un ácido nucleico, en particular un ADN o ADNc, con una o más endonucleasas de restricción específicas, para fragmentar el ADN en una serie correspondiente de fragmentos de restricción,
- (b)
- ligación de los fragmentos de restricción obtenidos de esta manera con un adaptador oligonucleótido sintético de doble cadena, un extremo del cual es compatible con uno o ambos extremos de los fragmentos de restricción, produciendo de esta manera fragmentos de restricción ligados con adaptadores, preferentemente etiquetados, del ADN de partida,
- (c)
- puesta en contacto de los fragmentos de restricción ligados con adapta dor, preferentemente etiquetados, bajo condiciones de hibridación con por lo menos un cebador oligonucleótido que contenga por lo menos un nucleótido selectivo en su extremo 3',
- (d)
- amplificación de los fragmentos de restricción ligados con adaptadores, preferentemente etiquetados, hibridados con los cebadores mediante PCR o una técnica similar de manera que se provoca el alargamiento adicional de los cebadores hibridados a lo largo de los fragmentos de restricción del ADN de partida con el que se hibridaron los cebadores, y (e) detectar, identificar o recuperar el fragmento de ADN amplificado o alargado obtenido de esta manera.
La AFLP proporciona de esta manera un subconjunto reproducible de fragmentos ligados con adaptadores. Otros métodos adecuados para la reducción de la complejidad son la inmunoprecipitación de la cromatina (ChiP). Lo anterior se refiere al aislamiento del ADN nuclear, mientras que las proteínas tales como factores de transcripción se unen al ADN. Con ChiP en primer lugar se utiliza un anticuerpo contra la proteína, resultando en un complejo de proteína Ab-ADN. Mediante la purificación de este complejo y su precipitación, se selecciona el ADN al que se une dicha proteína. A continuación, el ADN puede utilizarse para la construcción de bibliotecas y la secuenciación. Es decir, es un método para llevar a cabo una reducción de la complejidad de una manera no aleatoria dirigida a áreas funcionales; en el presente ejemplo, factores de transcripción específicos.
Una variante útil de la tecnología AFLP utiliza nucleótidos no selectivos (es decir, cebadores +0/+0) y en ocasiones se denomina PCR de conectores. También proporciona una reducción de complejidad muy adecuada.
Para una descripción adicional de la AFLP, sus ventajas, realizaciones, así como las técnicas, enzimas, adaptadores, cebadores y compuestos adicionales y herramientas utilizados en las mismas, se hace referencia a las patentes US nº 6.045.994, EP nº B-0 534 858, EP nº 976835 y EP nº 974672, WO nº 01/88189, y Vos et al., Nucleic Acids Research 23:4407-4414, 1995.
De esta manera, en una realización preferente del método de la presente invención, se lleva a cabo la reducción de la complejidad mediante:
- -
- digestión de la muestra de ácidos nucleicos con por lo menos una endonucleasa de restricción para fragmentarla
en fragmentos de restricción, -ligación de los fragmentos de restricción obtenidos con por lo menos un adaptador oligonucleótido sintético de
doble cadena que presenta un extremo compatible con uno o ambos extremos de los fragmentos de restricción
para producir fragmentos de restricción ligados con adaptadores, -poner en contacto dichos fragmentos de restricción ligados a adaptadores con uno o más cebadores
oligonucleótidos bajo condiciones de hibridación, y -amplificación de dichos fragmentos de restricción ligados con adaptadores mediante alargamiento de uno o más
de los cebadores oligonucleótidos, en la que por lo menos uno de entre el cebador o cebadores oligonucleótidos incluye una secuencia de nucleótidos que presenta la misma secuencia de nucleótidos que las partes terminales de las cadenas en los extremos de dichos fragmentos de restricción ligados con adaptadores, incluyendo los nucleótidos implicados en la formación de la secuencia diana para dicha endonucleasa de restricción, e incluyendo por lo menos parte de los nucleótidos presentes en los adaptadores, en el que, opcionalmente, por lo menos uno de dichos cebadores incluye en su extremo 3' una secuencia seleccionada que comprende por lo menos un nucleótido situado inmediatamente contiguo a los nucleótidos implicados en la formación de la secuencia diana para dicha endonucleasa de restricción.
La AFLP es un método altamente reproducible para la reducción de la complejidad y por lo tanto resulta particularmente adecuado para el método según la presente invención.
En una realización preferente del método según la presente invención, el adaptador o el cebador comprende unaetiqueta. Éste es particularmente el caso para la identificación de los polimorfismos, en donde resulta importante distinguir entre secuencias derivadas de bibliotecas separadas. La incorporación de una etiqueta oligonucleótida en un adaptador o cebador resulta muy conveniente debido a que no resultan necesarias etapas adicionales para etiquetar una biblioteca.
En otra realización, la etiqueta es una secuencia identificadora. Tal como se ha comentado anteriormente, dicha secuencia identificadora puede ser de longitud variable dependiendo del número de muestras de ácidos nucleicos que debe compararse. Resulta suficiente una longitud de aproximadamente 4 bases (44=256 secuencias de etiqueta diferentes posibles) para distinguir entre el origen de un número limitado de muestras (como máximo 256), aunque resulta preferente que las secuencias de etiqueta difieran en no más de una base entre las muestras que deben distinguirse. Según resulte necesario, puede ajustarse la longitud de las secuencias de etiqueta.
En una realización, la secuenciación se lleva a cabo en un soporte sólido, tal como una perla (ver, por ejemplo, las patentes WO nº 03/004690, nº 03/054142, nº 2004/069849, nº 2004/070005, nº 2004/070007 y nº 2005/003375 (todas a nombre de 454 Corporation). Dicho método de secuenciación resulta particularmente adecuado para la secuenciación económica y eficiente de muchas muestras simultáneamente.
En una realización preferente, la secuenciación comprende las etapas de:
- -
- unir con perlas fragmentos ligados con adaptadores, estando unida cada perla a un único fragmento ligado con
adaptador, -emulsionar las perlas en microrreactores de agua en aceite, comprendiendo cada microrreactor de agua en
aceite una única perla, -cargar las perlas en pocillos, comprendiendo cada pocillo una única perla, y -generar una señal pirofosfato.
En la primera etapa, se ligan adaptadores de secuenciación a fragmentos dentro de la biblioteca de combinación. Dicho adaptador de secuenciación incluye por lo menos una región "clave" para la unión a una perla, una región cebadora de secuenciación y una región cebadora de PCR. De eta manera se obtienen fragmentos ligados a adaptadores.
En una etapa adicional, se unen fragmentos ligados con adaptadores a perlas, uniéndose cada perla a un único fragmento ligado a adaptador. Al grupo de fragmentos ligados con adaptadores se añaden perlas en exceso para garantizar la unión de un solo fragmento ligado a adaptador por perla para la mayoría de las perlas (distribución de Poisson).
En la etapa siguiente, se emulsionan las perlas en microrreactores de agua en aceite, comprendiendo cada microrreactor de agua en aceite una única perla. Los reactivos de PCR presentes en los microrreactores de agua en aceite permiten que tenga lugar una reacción de PCR en los microrreactores. A continuación, se rompen los microrreactores y se enriquece para las perlas que comprenden ADN (perlas positivas para ADN).
En una etapa posterior, se cargan las perlas en pocillos, comprendiendo cada pocillo una única perla. Los pocillos preferentemente son parte de una placa PicoTiterTM que permite la secuenciación simultánea de una gran cantidad de fragmentos.
Tras la adición de perlas que portan enzima, se determina la secuencia de los fragmentos mediante pirosecuenciación. En etapas sucesivas, la placa picotiter y las perlas, así como las perlas con enzima en la misma se someten a diferentes desoxirribonucleótidos en presencia de reactivos de secuenciación convencionales, y tras la incorporación de un desoxirribonucleótido, se genera una señal lumínica que se registra. La incorporación del nucleótido correcto genera una señal de pirosecuenciación que puede detectarse.
La pirosecuenciación misma es conocida de la técnica y se describe, en otros, en www.biotagebio.com,
www.pyrosequencing.com/tab technology. La tecnología se aplica además en, por ejemplo, las patentes WO nº 03/004690, nº 03/054142, nº 2004/069849, nº 2004/070005, nº 2004/070007 y nº 2005/003375 (todas a nombre de 454 Corporation).
El cribado de alto rendimiento de la etapa k) preferentemente se lleva a cabo mediante inmovilización de las sondas diseñadas en la etapa h) en una matriz, seguido de la puesta en contacto de la matriz que comprende las sondas con una biblioteca de ensayo bajo condiciones de hibridación. Preferentemente, la etapa de puesta en contacto se lleva a cabo bajo condiciones de hibridación astringentes (ver Kennedy et al., Nat. Biotech., publicado en internet el 7 de septiembre de 2003, páginas 1 a 5). El experto en la materia es consciente de la existencia de métodos adecuados para la inmovilización de sondas en una matriz y de métodos de puesta en contacto bajo condiciones de hibridación. La tecnología típica que resulta adecuada para este fin se revisa en Kennedy et al., Nat. Biotech., publicado en internet el 7 de septiembre de 2003, páginas 1 a 5). 1-5.
Una aplicación ventajosa particular es el cultivo de especies poliploides. Mediante la secuenciación de cultivos poliploides con una elevada cobertura, la identificación de SNPs y los diversos alelos, y el desarrollo de sondas para la amplificación específica de alelo, pueden realizarse avances significativos en el cultivo de especies poliploides.
Como parte de la invención, se ha encontrado que la combinación de generar subconjuntos seleccionados aleatoriamente mediante amplificación selectiva para una pluralidad de muestras y la tecnología de secuenciación de alto rendimiento presenta ciertos problemas complejos que debían resolverse para mejorar adicionalmente el método descrito en la presente memoria para la identificación eficiente y de alto rendimiento de los polimorfismos. Más en detalle, se ha encontrado que al combinar múltiples muestras (es decir la primera y la segunda o posteriores) en un grupo tras realizar una reducción de complejidad, se produce el problema de que muchos fragmentos aparentemente proceden de dos muestras o, en otras palabras, se identificaron muchos fragmentos que no podían asignarse únicamente a una muestra y que de esta manera no pudieron utilizarse en el procedimiento de identificación de polimorfismos. Ello condujo a una reducción de la fiabilidad del método y a polimorfismos (SNPs, indels, SSRs) que no pudieron identificarse adecuadamente.
Tras el análisis cuidadoso y detallado de la secuencia de nucleótidos completa de los fragmentos que no pudieron localizarse, se encontró que aquellos fragmentos contenían dos adaptadores diferentes que comprendían etiquetas y que probablemente se formaban entre la generación de las muestras de complejidad reducida y la ligación de los adaptadores de secuenciación. El fenómeno se describe como "etiquetado mixto". El fenómeno descrito como "etiquetado mixto", tal como se utiliza en la presente memoria, se refiere de esta manera a fragmentos que contienen una etiqueta que relaciona el fragmento con una muestra por un lado, mientras que el lado opuesto del fragmento contiene una etiqueta que relaciona el fragmento con otra muestra. De esta manera, un fragmento aparentemente se deriva de dos muestras (quod non). Esto conduce a una identificación errónea de polimorfismos y por lo tanto no resulta deseable.
Se ha teorizado con que la formación de fragmentos heterodúplex entre dos muestras se encuentra en la raíz de dicha anomalía.
Se ha encontrado la solución a dicho problema en un rediseño de la estrategia para la conversión de muestras de las que se ha reducido la complejidad en fragmentos unidos a perlas que pueden amplificarse antes de la secuenciación de alto rendimiento. En la presente realización, cada muestra se somete a reducción de complejidad y purificación opcional. A continuación, se generan extremos romos en cada muestra (pulido de extremos) seguido de ligación del adaptador de secuenciación que es capaz de unirse a la perla. Los fragmentos ligados a adaptadores de secuenciación de las muestras seguidamente se combinan y se ligan a las perlas para la polimerización en emulsión y la posterior secuenciación de alto rendimiento.
A modo de parte adicional de la presente invención, se ha encontrado que la formación de concatámeros dificulta la identificación correcta de polimorfismos. Se han identificado concatámeros como fragmentos que se forman tras "formar extremos romos" o "pulir" los productos de reducción de complejidad, por ejemplo con la ADN polimerasa de T4, y en lugar de ligarlos a los adaptadores que permiten la unión a las perlas, se ligan entre sí, creando de esta manera concatámeros, es decir, un concatámero es el resultado de la dimerización de fragmentos de extremos romos.
La solución a este problema se encontró en la utilización de determinados adaptadores modificados específicamente. Los fragmentos amplificados obtenidos de la reducción de complejidad típicamente contienen un extremo protuberante 3'-A debido a las características de determinadas polimerasas preferentes, que no presentan actividad correctora de errores de exonucleasas 3'-5'. La presencia de dicho extremo protuberante 3'-A también es el motivo de que se formen extremos romos en los fragmentos antes de la ligación de adaptadores. Al proporcionar un adaptador que podía unirse a una perla en el que el adaptador contiene un extremo protuberante 3'-T, se encontró que podía resolverse en una etapa tanto el problema de las "etiquetas mixtas" como el de los concatámeros. Una ventaja adicional de utilizar dichos adaptadores modificados es que la etapa convencional de "formación de extremos romos" y la etapa de fosforilación posteriores podían omitirse.
De esta manera, en una realización preferente adicional, tras la etapa de reducción de complejidad de cada muestra, se lleva a cabo una etapa en los fragmentos de restricción amplificados ligados con adaptadores que se han obtenido de la etapa de reducción de complejidad, de manera que a estos fragmentos se ligan adaptadores de secuenciación, los cuales contienen un extremo protuberante 3'-T y son capaces de unirse a las perlas.
Se ha encontrado además que, al fosforilar los cebadores utilizados en la etapa de reducción de complejidad, la etapa de pulido de extremos (formación de extremos romos) y la fosforilación de intermediarios previa a la ligación pueden evitarse.
De esta manera, en una realización altamente preferente de la invención, la invención se refiere a un método para identificar uno o más polimorfismos, comprendiendo dicho método las etapas de:
a) proporcionar una pluralidad de muestras de ácidos nucleicos de interés,
b) llevar a cabo una reducción de complejidad de cada una de las muestras, proporcionando una pluralidad de
bibliotecas de las muestras de ácidos nucleicos, en la que la reducción de complejidad se lleva a cabo mediante:
-digestión de cada muestra de ácidos nucleicos con por lo menos una endonucleasa de restricción para
fragmentarla en fragmentos de restricción,
- -
- ligación de los fragmentos de restricción obtenidos con por lo menos un adaptador oligonucleótido sintético de doble cadena que presenta un extremo compatible con uno o ambos extremos de los fragmentos de restricción para producir fragmentos de restricción ligados con adaptadores,
- -
- puesta en contacto de dichos fragmentos de restricción ligados con adaptadores, con uno o más cebadores oligonucleótidos fosforilados bajo condiciones de hibridación, y
- -
- amplificación de dichos fragmentos de restricción ligados con adaptadores mediante alargamiento de uno o más cebadores oligonucleótidos, en la que por lo menos uno de entre uno o más cebadores oligonucleótidos incluye una secuencia de nucleótidos que presenta la misma secuencia de nucleótidos que las partes terminales de las cadenas en los extremos de dichos fragmentos de restricción ligados con adaptadores, incluyendo los nucleótidos implicados en la formación de la secuencia diana de dicha endonucleasa de restricción, e incluyendo por lo menos parte de los nucleótidos presentes en los adaptadores, en la que, opcionalmente, por lo menos uno de dichos cebadores incluye en su extremo 3' una secuencia seleccionada que comprende por lo menos un nucleótido situado inmediatamente contiguo a los nucleótidos implicados en la formación de la secuencia diana de dicha endonucleasa de restricción y en la que el adaptador y/o el cebador contienen una etiqueta,
c) combinación de dichas bibliotecas para formar una biblioteca combinada,
d) ligar los adaptadores de secuenciación capaces de unirse a perlas, con los fragmentos con caperuza
adaptadora amplificados en la biblioteca combinada, utilizando un adaptador de secuenciación que porta un
extremo protuberante 3'-T, y someter los fragmentos unidos a perla a polimerización en emulsión, e) secuenciar
por lo menos una parte de la biblioteca combinada,
f) alinear las secuencias de cada muestra obtenida en la etapa e),
g) determinar uno o más polimorfismos entre la pluralidad de muestras de ácidos nucleicos en la alineación de la
etapa f),
h) utilizar el polimorfismo o polimorfismos determinados en la etapa g) para diseñar sondas de detección,
i) proporcionar un ácido nucleico de muestra de ensayo de interés,
j) llevar a cabo la reducción de complejidad de la etapa b) en el ácido nucleico de la muestra de ensayo de
interés para proporcionar una biblioteca de ensayo del ácido nucleico de la muestra de ensayo,
k) someter la biblioteca de ensayo a cribado de alto rendimiento para identificar la presencia, ausencia o cantidad
de polimorfismos determinados en la etapa g) utilizando las sondas de detección diseñadas en la etapa h).
La figura 1A muestra un fragmento según la presente invención unido a una perla ("perla de 454") y la secuencia del cebador utilizado para la preamplificación de las dos líneas de planta del pimiento. La expresión "fragmento de ADN" se refiere al fragmento obtenido tras la digestión con una endonucleasa de restricción, "adaptador Keygene" se refiere a un adaptador que proporciona un sitio de unión para los cebadores oligonucleótidos (fosforilados) utilizados para generar una biblioteca, "KRS" se refiere a una secuencia identificadora (etiqueta), "adaptador SEC. de 454" se refiere a un adaptador de secuenciación, y "adaptador de PCR de 454" se refiere a un adaptador que permite la amplificación en emulsión del fragmento de ADN. El adaptador de PCR permite la unión a la perla y la amplificación, y puede contener un extremo protuberante 3'-T.
La figura 1B muestra un cebador esquemático utilizado en la etapa de reducción de la complejidad. Dicho cebador generalmente comprende una región de sitio de reconocimiento indicado como (2), una región constante que puede incluir una sección de etiqueta indicada como (1) y uno o más nucleótidos selectivos en una región selectiva indicada como (3) en el extremo 3' de los mismos).
La figura 2 muestra la estimación de concentración de ADN utilizando electroforesis en gel de agarosa al 2%. S1 se refiere a PSP11; S2 se refiere a PI201234. 50, 100, 250 y 500 ng se refieren, respectivamente, a 50 ng, 100 ng, 250 ng y 500 ng para estimar las cantidades de ADN de S1 y de S2. Las figs. 2C y 2D muestran la determinación de la concentración de ADN utilizando espectrofotometría NanoDrop.
La figura 3 muestra los resultados de las evaluaciones de calidad de intermediarios del Ejemplo 3.
La figura 4 muestra gráficos de flujo del procesamiento de datos de secuencia, es decir, las etapas entre la generación de los datos de secuenciación y la identificación de los SNPs, SSRs e indels putativos, mediante etapas de eliminación de información de secuencia conocida en recorte y etiquetado, resultando en datos de secuencia ajustados que se agrupan y se ensamblan para proporcionar contigs y singletons (fragmentos que no pueden ensamblarse para formar un contig), después de lo cual pueden identificarse y evaluarse polimorfismos putativos. La figura 4B proporciona detalles adicionales del procedimiento de exploración de polimorfismos.
La figura 5 se refiere al problema de las etiquetas mixtas y proporciona en el panel 1 un ejemplo de una etiqueta mixta que incluye etiquetas asociadas a la muestra 1 (MS1) y a la muestra 2 (MS2). El panel 2 proporciona una explicación esquemática del fenómeno. Los fragmentos de restricción de la AFLP derivados de la muestra 1 (S1) y de la muestra 2 (S2) se ligan utilizando adaptadores ("adaptador de Keygene") en ambos extremos que portan eti quetas específicas de las muestras S1 y S2. Tras la amplificación y secuenciación, los fragmentos esperados presentan las etiquetas S1-S2 y las etiquetas S2-S2. Además, inesperadamente se observaron fragmentos que portaban etiquetas S1-S2 ó S2-S1. El panel 3 explica la causa hipotética de que se generasen etiquetas mixtas, por la que se forman productos heterodúplex a partir de fragmentos de las muestras 1 y 2. Los heterodúplex posteriormente se liberan, debido a la actividad exonucleasa 3'-5' de la ADN polimerasa de T4 o Klenow, respecto de los extremos 3'-protuberantes. Durante la polimerización, se rellenan los huecos con nucleótidos y se introduce la eti queta incorrecta. Esto funciona para heterodúplex de aproximadamente la misma longitud (panel superior), aunque también para heterodúplex de longitud más variable. El panel 4 proporciona en la parte derecha el protocolo convencional que conduce a la formación de etiquetas mixtas y, en la parte derecha, el protocolo modificado.
La figura 6 se refiere al problema de la formación de concatámeros, en la que en el panel 1 se proporciona un ejemplo típico de concatámero, en el que las diversas secciones de adaptador y de etiqueta se encuentran subrayadas y con su origen (es decir, MS1, MS2, ES1 y ES2, correspondiendo respetivamente a un adaptador-sitio de restricción MseI de la muestra 1, adaptador-sitio de restricción MseI de la muestra 2, adaptador-sitio de restricción EcoRI de la muestra 1, adaptador-sitio de restricción EcoRI de la muestra 2). El panel 2 muestra los fragmentos esperados que portan las etiquetas S1-S1 y S2-S2 y el observado aunque inesperado S1-S1-S2-S2, que es un concatámero de fragmentos de las muestras 1 y 2. El panel 3 proporciona la solución para evitar la generación de concatámeros, así como de etiquetas mixtas, mediante la introducción de un extremo protuberante en los adaptadores de AFLP, adaptadores de secuenciación modificados y la omisión de la etapa de pulido de extremos al ligar los adaptadores de secuenciación. No se observó formación de concatámeros debido a que los fragmentos de ALP no pueden ligarse entre sí y no se producen fragmentos mixtos debido a que se omite la etapa de pulido de extremos. El panel 4 proporciona el protocolo modificado, que utiliza adaptadores modificados para evitar la formación de concatámeros, así como de etiquetas mixtas.
Figura 7. Alineación múltiple "10037_CL989contig2" de secuencias de fragmentos de la AFLP de la planta del pimiento, que contiene un polimorfismo de un solo nucleótido (SNP) putativo. Observar que el SNP (indicado por una flecha negra) se encuentra definido por un alelo A presente en ambas lecturas de la muestra 1 (PSP11), indicadas por la presencia de la etiqueta MS1 en el nombre de las dos lecturas superiores y un alelo G presente en la muestra 2 (PI201234), indicado por la presencia de la etiqueta MS2 en el nombre de las dos lecturas de la parte inferior. Los nombres de lectura se muestran en la parte izquierda. La secuencia de consenso de esta alineación múltiple es (5'3'):
Figura 8A. Representación esquemática de la estrategia de enriquecimiento de repeticiones de secuencia simple de
direccionamiento (SSR) en combinación con la secuenciación de alto rendimiento para la identificación de novo de
las SSR.
Figura 8B: Validación de un SNP G/A en la planta del pimiento utilizando la detección SNPWave. P1=PSP11,
P2=PI201234. Se indican los ocho descendientes RIL con los números 1 a 8.
Ejemplos
Se generó una mezcla de ligación de restricción EcoRI/MseI (1) a partir de ADN genómico de las líneas de la planta del pimiento PSP-11 y PI20234. La mezcla de ligación de restricción se diluyó 10 veces y se preamplificaron 5
microlitros de cada muestra (2) con cebadores EcoRI +1(A) y MseI +1(C) (conjunto I). Tras la amplificación, se comprobó la calidad del producto de preamplificación de las dos muestras de pimiento en un gel de agarosa al 1%. Los productos de preamplificación se diluyeron 20 veces, seguido de una preamplificación mediante AFLP con KRSEcoRI +1(A) y KRSMseI +2(CA). Los segmentos (identificadores) KRS se encuentran subrayados y los 5 nucleótidos selectivos se encuentran en negrita, en el extremo 3' de las secuencias de cebadores SEC ID 1 a 4, posteriormente. Tras la amplificación, se comprobó la calidad del producto de preamplificación de las dos muestras de pimiento en un gel de agarosa al 1% y mediante la técnica de la huella genética utilizando AFLP (4) con EcoRI +3(A) y MseI + 3(C) (3). Los productos de preamplificación de las dos líneas del pimiento se purificaron separadamente en una columna de PCR de Qiagen (5). Se midió la concentración de las muestras en el NanoDrop.
10 Se mezcló y se secuenció un total de 5.006,4 ng de PSP-11 y 5.006,4 ng de PI20234.
Conjunto I de cebadores utilizado para la preamplificación de PSP-11:
E01LKRS1 5’-CGTCAGACTGCGTACCAATTCA-3’ [SEC ID 1]
M15KKRS1 5’-TGGTGATGAGTCCTGAGTAACA-3’ [SEC ID 2]
15 Conjunto II de cebadores utilizado para la preamplificación de PI20234: E01LKRS2 5’-CAAGAGACTGCGTACCAATTCA-3’ [SEC ID 3] M15KKRS2 5’-AGCCGATGAGTCCTGAGTAACA-3’ [SEC ID 4]
Mezcla de restricción (40 µl/muestra) ADN 6 µl (±300 ng) ECoRI (5U) 0,1 11 MseI(2U) 0,05 11 5xRL 8 11 MQ 25,85 11 Total 40 11 Incubación durante 1 h a 37°C Adición de: Mezcla de ligación (10 µl/muestra): ATP 10 mM 1 µl ADN ligasa de T4 1 µl Mezcla de ligación (10 µl/muestra) Adaptador EcoRI (5 pmoles/µl) 1 µl Adaptador MseI (50 pmol/µl) 1 µl 5xRL 2 µl MQ 4 µl Total 10 µl Incubación durante 3 horas a 37ºC Adaptador EcoRI 91M35/91M36: *-CTCGTAGACTGCGTACC :91M35 [SEC ID 5] ± bio CATCTGACGCATGGTTAA :91M36 [SEC ID 6] Adaptador MseI 92A18/92A19: 5-GACGATGAGTCCTGAG-3 :92A18 [SEC ID 7]
3-TACTCAGGACTCAT-5 :92A19 [SEC ID 8]
Preamplificación (A/C): mezcla RL (10x) 5 µl EcoRI-pr E01L(50 ng/µl) 0,6 µl MseI-pr M02K(50ng/ul) 0,6 µl dNTP (25mM) 0,16 µl pol. Taq. (5U) 0,08 µl 10X PCR 2,0 µl MQ 11,56 µl Total 20 µl/reacción Perfil térmico de preamplificación
Se realizó la preamplificación selectiva en un volumen de reacción de 50 µl. Se llevó a cabo la PCR en un sistema GeneAmp 9700 de PE y un perfil de 20 ciclos que se inició con una etapa de desnaturalización a 94ºC durante 30 30 segundos, seguido de una etapa de hibridación a 56ºC durante 60 segundos y una etapa de extensión a 72ºC durante 60 segundos.
EcoRI +1(A)1
E01 L 92R11: 5-AGACTGCGTACCAATTCA-3 [SEC ID 9]
MseI +1(C)1
5 M02k 93E42: 5-GATGAGTCCTGAGTAAC-3 [SEC ID 10]
Preamplificación A/CA: Mezcla PA+1/+1 (20x) :5 µl EcoRI-pr. :1,5 µl MseI-pr. :1,5 µl dNTP (25 mM) :0,4 µl Pol. Taq. (5 U) :0,2 µl 10X PCR :5 µl MQ :36,3 µl Total :50 µl
Se realizó una preamplificación selectiva en un volumen de reacción de 50 µl. Se llevó a cabo la PCR en un sistema GeneAmp 9700 de PE y un perfil de 30 ciclos que se inició con una etapa de desnaturalización a 94ºC durante 30
10 segundos, seguido de una etapa de hibridación a 56ºC durante 60 segundos y una etapa de extensión a 72ºC durante 60 segundos.
05F212 E01LKRS1 CGTCAGACTGCGTACCAATTCA -3’ [SEC ID 11]
05F213 E01LKRS2 CAAGAGACTGCGTACCAATTCA -3’ [SEC ID 12] 05F214 M15KKRS1 TGGTGATGAGTCCTGAGTAACA -3’ [SEC ID 13] 05F215 M15KKRS2 AGCCGATGAGTCCTGAGTAACA -3’ [SEC ID 14]
15 nucleótidos selectivos en negrita y etiquetas (KRS) subrayadas Muestra PSP11 : E01LKRS1/M15KKRS1 Muestra PI120234 : E01LKRS2/M15KKRS2
20 Se realizó una amplificación selectiva en un volumen de reacción de 20 µl. Se llevó a cabo una PCR en un sistema de PCR GeneAmp 9700 de PE. Se inició un perfil de 13 ciclos con una etapa de desnaturalización de 94ºC durante 30 segundos, seguido de una etapa de hibridación a 65ºC durante 30 segundos, con una etapa de reducción en la que se redujo la temperatura de hibridación en 0,7ºC en cada ciclo, y una etapa de extensión a 72ºC durante 60
25 segundos. A este perfil siguió un perfil de 23 ciclos con una etapa de desnaturalización de 94ºC durante 30 segundos, seguido de una etapa de hibridación a 56ºC durante 30 segundos y una etapa de extensión a 72ºC durante 60 segundos.
EcoRI +3(AAC) y MseI +3(CAG)
30 E32 92S02: 5-GACTGCGTACCAATTCAAC-3 [SEC ID 15] M49 92G23: 5-GATGAGTCCTGAGTAACAG-3 [SEC ID 16]
35 Se llevó a cabo una purificación Qiagen siguiendo las instrucciones del fabricante: Manual QIAquick® Spin (http://wwwl.qiagen.com/literature/handbooks/PDF/DNACleanupAndConcentration/QQ Spin/1021422 HBQQSpin 072002WW.pdf)
Ejemplo 2: pimiento
40 El ADN de las líneas de pimiento PSP-11 y PI20234 se utilizó para generar el producto AFLP mediante la utilización de cebadores específicos de sitio de reconocimiento de AFLP de Keygene. (Estos cebadores de AFLP son esencialmente iguales a los cebadores de AFLP convencionales, por ejemplo los descritos en la patente EP nº 0 534 858, y generalmente contienen una región de sitio de reconocimiento, una región constante y uno o más nucleótidos
45 selectivos en una región selectiva). Procedentes de las líneas del pimiento PSP-11 ó PI20234 se digirieron 150 ng de ADN con las endonucleasas de restricción EcoRI (5 U/reacción) y MseI (2 U/reacción) durante 1 hora a 37ºC, seguido de la inactivación durante 10 minutos a 80ºC. Los fragmentos de restricción obtenidos se ligaron con adaptador oligonucleótido sintético de doble cadena, un extremo del cual era compatible con uno o ambos extremos de los fragmentos de restricción EcoRI y/o MseI. Se llevaron a cabo reacciones de preamplificación de AFLP (20
50 µl/reacción) con los cebadores de AFLP +1/+1 en mezcla de restricción-dilución diluida 10 veces. Perfil de PCR: 20*(30 segundos a 94ºC + 60 segundos a 56ºC + 120 segundos a 72ºC). Se llevaron a cabo reacciones de AFLP adicionales (50 µl/reacción) con diferentes cebadores de sitio de reconocimiento de Keygene +1 EcoRI y +2 MseI (ver Tabla, posteriormente; las etiquetas se muestran en negrita, los nucleótidos selectivos se han subrayado) en producto de preamplificación de AFLP EcoRI/MseI +1/+1 diluido 20 veces. Perfil de PCR: Perfil de PCR: 30*(30 segundos a 94ºC + 60 segundos a 56ºC + 120 segundos a 72ºC). El producto AFLP se purificó mediante la
5 utilización del kit de purificación por PCR QIAquick (QIAGEN) según el manual QIAquick® Spin 07/2002, página 18, y se midió la concentración con un espectrofotómetro ND-1000 NanoDrop®. Se reunió un total de 5 µg de producto AFLP PSP-11 +1/+2 y 5 µg de producto AFLP PI20234 +1/+2 y se resolvió en 23,3 µl de TE. Finalmente, se obtuvo una mezcla con una concentración de 430 ng/µl de producto de AFLP +1/+2.
10 Tabla
- SEC ID
- Cebador de PCR Cebador -3' Pimiento Reacción de AFLP
- [SEC ID 17]
- 05F21 CGTCAGACTGCGTACCAATTCA PSP 1
- [SEC ID 18]
- 05F21 TGGTGATGAGTCCTGAGTAACA PSP 1
- [SEC ID 19]
- 05F21 CAAGAGACTGCGTACCAATTCA PI2023 2
- [SEC ID 20]
- 05F21 AGCCGATGAGTCCTGAGTAACA PI2023 2
Ejemplo 3: maíz
El ADN de las líneas de maíz B73 y M017 se utilizó para generar el producto AFLP mediante la utilización de
15 cebadores específicos de sitio de reconocimiento de AFLP de Keygene. (Estos cebadores de AFLP son esencialmente iguales a los cebadores de AFLP convencionales, por ejemplo los descritos en la patente EP nº 0 534 858, y generalmente contienen una región de sitio de reconocimiento, una región constante y uno o más nucleótidos selectivos en el extremo 3' de la misma). Se digirió ADN de las líneas de pimiento B73 o M017 con las endonucleasas de restricción TaqI (5 U/reacción) durante 1 hora a 65ºC y MseI (2 U/reacción) durante 1 hora a
20 37ºC, seguido de la inactivación durante 10 minutos a 80ºC. Los fragmentos de restricción obtenidos se ligaron con adaptador oligonucleótido sintético de doble cadena, un extremo del cual es compatible con uno o ambos extremos de los fragmentos de restricción TaqI y/o MseI. Se llevaron a cabo reacciones de preamplificación de AFLP (20 µl/reacción) con los cebadores de AFLP +1/+1 en mezcla de restricción-ligación diluida 10 veces. Perfil de PCR: 20*(30 segundos a 94ºC + 60 segundos a 56ºC + 120 segundos a 72ºC). Se llevaron a cabo reacciones de AFLP
25 adicionales (50 µl/reacción) con diferentes cebadores de sitio de reconocimiento de Keygene para FLP TaqI y MseI +2 (Tabla posteriormente; las etiquetas se muestran en negrita, los nucleótidos selectivos se han subrayado) en producto de preamplificación de AFLP TaqI/MseI +1/+1 diluido 20 veces. Perfil de PCR: Perfil de PCR: 30*(30 segundos a 94ºC + 60 segundos a 56ºC + 120 segundos a 72ºC). El producto AFLP se purificó mediante la utilización del kit de purificación por PCR QIAquick (QIAGEN) según el manual QIAquick® Spin 07/2002, página 18, y
30 se midió la concentración con un espectrofotómetro ND-1000 NanoDrop®. Se reunió un total de 1,25 µg de cada producto AFLP +2/+2 B73 diferente y 1,25 µg de cada producto AFLP +2/+2 M017 diferente y se resolvió en 30 µl de TE. Finalmente, se obtuvo una mezcla con una concentración de 333 ng/µl de producto AFLP +2/+2.
Tabla
- SEC ID
- Cebador de PCR Secuencia de cebador Maíz Reacción de AFLP
- [SEC ID 21]
- 05G360 ACGTGTAGACTGCGTACCGAAA B73 1
- [SEC ID 22]
- 05G368 ACGTGATGAGTCCTGAGTAACA B73 1
- [SEC ID 23]
- 05G362 CGTAGTAGACTGCGTACCGAAC B73 2
- [SEC ID 24]
- 05G370 CGTAGATGAGTCCTGAGTAACA B73 2
- [SEC ID 25]
- 05G364 GTACGTAGACTGCGTACCGAAG B73 3
- [SEC ID 26]
- 05G372 GTACGATGAGTCCTGAGTAACA B73 3
- [SEC ID 27]
- 05G366 TACGGTAGACTGCGTACCGAAT B73 4
- [SEC ID 28]
- 05G374 TACGGATGAGTCCTGAGTAACA B73 4
- [SEC ID 29]
- 05G361 AGTCGTAGACTGCGTACCGAAA M017 5
- [SEC ID 30]
- 05G369 AGTCGATGAGTCCTGAGTAACA M017 5
- [SEC ID 31]
- 05G363 CATGGTAGACTGCGTACCGAAC M017 6
- [SEC ID 32]
- 05G371 CATGGATGAGTCCTGAGTAACA M017 6
- [SEC ID 33]
- 05G365 GAGCGTAGACTGCGTACCGAAG M017 7
- [SEC ID 34]
- 05G373 GAGCGATGAGTCCTGAGTAACA M017 7
- [SEC ID 35]
- 05G367 TGATGTAGACTGCGTACCGAAT M017 8
- [SEC ID 36]
- 05G375 TGATGATGAGTCCTGAGTAACA M017 8
Finalmente, se agruparon y se concentraron las 4 muestras P1 y las 4 muestras P2. Se obtuvo una cantidad total de 25 µl de producto de ADN y una concentración final de 400 ng/µl (total de 10 µg). Se proporcionan las evaluaciones de calidad de intermediarios en la figura 3.
Unas muestras de fragmento de AFLP de pimiento y de maíz tal como se ha descrito anteriormente en la presente memoria fueron procesadas por 454 Life Sciences tal como se encuentra descrito (Margulies et al., Genome sequencing in microfabricated high-density picolitre reactors, Nature 435(7057):376-80, publicado electrónicamente
10 el 31 de julio de 2005).
PROCESAMIENTO DE LOS DATOS
Se recibieron los datos crudos de secuencias para cada análisis:
-200,000 a 400,000 resultados de secuencias
20 -puntuaciones de calidad de la lectura automática de nucleótidos
Estos datos de secuencias se analizaron para la presencia de sitios de reconocimiento de Keygene (KRS) al inicio y
25 final de la lectura. Estas secuencias KRS consisten de secuencias de adaptador de AFLP y de marcaje de muestra y son específicas de una determinada combinación de cebadores de AFLP en una muestra determinada. Las secuencias de KRS fueron identificadas por BLAST y recortadas, y se restituyeron los sitios de restricción. Las lecturas se marcaron con una etiqueta para la identificación del origen de KRS. Las secuencias recortadas se seleccionaron a partir de la longitud (mínimo de 33 nt) para participar en el procesamiento posterior.
Se llevó a cabo un análisis MegaBlast de todas las lecturas recortadas y seleccionadas según tamaño para obtener agrupaciones de secuencias homólogas. Consecutivamente se ensamblaron todos los grupos con CAP3, resultando
35 en contigs ensamblados. Tras ambas etapas se habían identificado lecturas de secuencia única que no se correspondían con ninguna otra lectura. Estas lecturas se señalan como singletons. La línea de procesamiento seguida para llevar a cabo las etapas descritas en la presente memoria se muestra en la figura 4A.
40 Los contigs resultantes del análisis de ensamblaje forman la base para la detección de polimorfismos. Cada "apareamiento incorrecto" en la alineación de cada agrupación es un polimorfismo potencial. Se definieron criterios de selección para obtener una puntuación de calidad:
-número de lecturas en cada contig
-frecuencia de "alelos" en cada muestra
-aparición de secuencia de homopolímero
-aparición de polimorfismos contiguos
45 Los SNP e indels con una puntuación de calidad superior al umbral se identifican como polimorfismos putativos. Para la exploración de las SSR se utilizó la herramienta MISA (identificación de microsatélites) (http://pgrc.ipkgatersleben.de/misa). Esta herramienta identifica los motivos dinucleótido, trinucleótido, tetranucleótido y motivos SSR del compuesto aplicando criterios predefinidos y resumen las apariciones de estos SSR. El procedimiento de
50 exploración de polimorfismos y asignación de calidad se muestra en la figura 4B.
La Tabla a continuación resume los resultados del análisis combinado de secuencias obtenido a partir de 2 análisis de secuenciación de 454 para las muestras combinadas de pimiento y 2 análisis para las muestras combinadas de maíz.
- Pimiento
- Maíz
- Número total de resultados de secuencias
- 457178 492145
- Número de secuencias recortadas Número de singletones
- 399623 105253 411008 313280
- Número de contigs
- 31863 14588
- Número de secuencias en contigs Número total de secuencias que contienen SSR
- 294370 611 97728 202
- Número de secuencias diferentes que contienen SSR
- 104 65
- Número de diferentes motivos SSR (di, tri, tetra y compuesto)
- 49 40
- Número de SNP con puntuación Q �0,3 *
- 1636 782
- Número de indels *
- 4090 943
- * tanto con selección frente a SNP vecinos, secuencia flanqueante de por lo menos 12 pb y no presentes en secuencias de homopolímero mayores de 3 nucleótidos.
Ejemplo 4. Identificación de polimorfismos de un nucleótido (SNP) en el pimiento
Aislamiento del ADN
10 Se aisló el ADN genómico de las dos líneas parentales de una población recombinante consaguínea (RIL) de pimiento y 10 descendientes de RIL. Las líneas parentales eran PSP11 y PI201234. Se aisló ADN genómico a partir de material foliar de plántulas individuales utilizando un procedimiento CTAB modificado descrito por Stuart y Via (Stuart C.N. Jr. y Via L.E., A rapid CTAB DNA isolation technique useful for RAPD fingerprinting and other PCR
15 applications, Biotechniques, 14, 748-750, 1993). Se diluyeron las muestras de ADN hasta una concentración de 100 ng/µl en TE (Tris-HCl 10 mM, pH 8,0, EDTA 1 mM) y se almacenaron a -20ºC.
Preparación de molde para AFLP utilizando cebadores de AFLP etiquetados
20 Se prepararon moldes de AFLP de las líneas parentales de pimiento PSP11 y PI201234 utilizando la combinación de endonucleasas de restricción EcoRI/MseI tal como se describe en Zabeau y Vos, Selective restriction fragment amplification; a general method for DNA fingerprinting, patente EP nº 0534858-A1, B1, 1993; patente US nº
6.045.994 y en Vos et al. (Vos P., Hogers R., Bleeker M., Reijans M., van de Lee T., Hornes M., Frijters A., Pot J.,
Peleman J., Kuiper M. et al., AFLP: a new technique for DNA fingerprinting, Nucleic Acids Research 23(21):440725 4414, 1995).
Específicamente, se llevó a cabo la restricción del ADN genómico con EcoRI y MseI de la manera siguiente:
Restricción del ADN
30 ADN 100 a 500 ng EcoRI 5 unidades MseI 2 unidades 5x tampon RL 8 µl Agua MilliQ hasta 40 µl
La incubación se realizó durante 1 hora a 37ºC. Tras la restricción enzimática, los enzimas se inactivaron mediante incubación durante 10 minutos a 80ºC.
35 Ligación de adaptadores
ATP 10 mM 1 µl ADN ligasa de T4 1 µl Adaptador EcoRI (50 pmoles/µl) 1 µl Adaptador MseI (5 pmoles/µl) 1 µl 5x tampón RL. 2 µl Agua MilliQ hasta 40 µl La incubación se realizó durante 3 horas a 37ºC.
Amplificación selectiva de AFLP
5 Tras la restricción-ligación, la reacción de restricción/ligación se diluyó 10 veces con T10E0,1 y se utilizaron 5 µl de mezcla diluida como molde en una etapa de amplificación selectiva. Observar que debido a que se pretendía una amplificación selectiva +1/+2, en primer lugar se llevó a cabo una etapa de preamplificación selectiva +1/+1 (con cebadores de AFLP estándares). Las condiciones de reacción de la amplificación +1/+1 (+A/+C) fueron las siguientes.
10 Mezcla de restricción-ligación (diluida 10 veces) 5 µl Cebador EcoRI +1 (50 ng/µl) 0,6 µl Cebador MseI +1 (50 ng/µl) 0,6 µl dNTP (20 mM) 0,2 µl Polimerasa Taq (5 U/µl Amplitaq, PE) 0,08 µl 10x tampón de PCR 2,0 µl Agua MilliQ hasta 20 µl
Las secuencias de los cebadores eran:
EcoRI+1: 5’-AGACTGCGTACCAATTCA -3’ [SEC ID 9] y 15 MseI+1: 5’-GATGAGTCCTGAGTAAC -3’ [SEC ID 10]
Las amplificaciones mediante PCR se llevaron a cabo utilizando un PE9700 con un bloque de oro o plata utilizando las condiciones siguientes: 20 veces (30 segundos a 94ºC + 60 segundos a 56ºC + 120 segundos a 72ºC).
20 Se comprobó la calidad de los productos de preamplificación +1/+1 generados en un gel de agarosa al 1% utilizando una escalera de 100 pares de bases y una escalera de 1 Kb para comprobar la distribución de las longitudes de los fragmentos. Tras la amplificación selectiva +1/+1, la reacción se diluyó 20 veces con T10E0,1 y se utilizaron 5 µl de mezcla diluida como molde en la etapa de amplificación selectiva +1/+2 utilizando cebadores de AFLP etiquetados.
25 Finalmente, se llevaron a cabo amplificaciones selectivas mediante AFLP +1/+2 (A/+CA): producto de amplificación selectiva +1/+1 (diluido 20 veces): 5,0 µl.
KRS EcoRI-cebador +A (50 ng/µl) 1,5 µl KRS MseI-cebador + CA (50 ng/µl) 1,5 µl dNTP (20 mM) 0,5 µl polimerasa Taq (5 U/µl Amplitaq, Perkin Elmer) 0,2 µl 10X tampón de PCR 5,0 µl MQ hasta 50 µl
Las secuencias de los cebadores de AFLP etiquetados eran:
30 PSP11: 05F212: EcoRI+1: 5’-CGTCAGACTGCGTACCAATTCA-3’ [SEC ID 1] y 05F214: MseI+2: 5’-TGGTGATGAGTCCTGAGTAACA-3’ [SEC ID 2]
PI201234: 35 05F213: EcoRI+1: 5’-CAAGAGACTGCGTACCAATTCA-3’ [SEC ID 3] y 05F215: MseI+1: 5’-AGCCGATGAGTCCTGAGTAACA-3’[SEC ID 4]
Observar que dichos cebadores contienen etiquetas de 4 pb (subrayadas anteriormente) en sus extremos 5 prima para distinguir los productos de amplificación originados de las líneas de pimiento respectivas al final del
40 procedimiento de secuenciación. Representación esquemática de los productos de amplificación del pimiento de
Se llevaron a cabo amplificaciones de PCR (24 por muestra) utilizando un PE7900 con un bloque de oro o de plata bajo las condiciones siguientes: 30 veces (30 segundos a 94ºC + 60 segundos a 56ºC + 120 segundos a 72ºC).
Se comprobó la calidad de los productos de amplificación generados en un gel de agarosa al 1% utilizando una escalera de 100 pares de bases y una escalera de 1 Kb para comprobar la distribución de las longitudes de los fragmentos.
Purificación y cuantificación de la reacción de AFLP
Tras agrupar dos reacciones de AFLP selectiva +1/+2 de 50 microlitros por cada muestra de pimiento, los 12 productos resultantes de 100 µl de reacción de AFLP se purificaron utilizando el kit de purificación por PCR QIAquick (QIAGEN) siguiendo el manual de QIAquick® Spin (página 18). En cada columna se cargó un máximo de 100 µl de producto. Los productos amplificados se eluyeron en T10E0,1. Se comprobó la calidad de los productos purificados en un gel de agarosa al 1% y se midieron las concentraciones en el NanoDrop (figura 2).
Se utilizaron las mediciones de concentración en NanoDrop para ajustar la concentración final de cada producto de PCR purificado a 300 nanogramos por microlitro. Se mezclaron cinco microgramos de producto amplificado purificado de PSP11 y 5 microgramos de PI201234 para generar 10 microgramos de material de molde para la preparación de la biblioteca de secuenciación de 454.
Preparación de biblioteca de secuencias y secuenciación de alto rendimiento
Los productos de amplificación mixtos procedentes de ambas líneas de pimiento se sometieron a secuenciación de alto rendimiento utilizando la tecnología de secuenciación de 454 Life Sciences, tal como se describe en Margulies et al. (Margulies et al., Nature 437:376-380 y Online Supplements). Específicamente, en primer lugar se pulieron los extremos de los productos de PCR AFLP y después se ligaron con adaptadores para facilitar la amplificación por PCR en emulsión y posterior secuenciación de los fragmentos tal como describen Margulies y colaboradores.
Las secuencias de adaptadores de 454, los cebadores de PCR en emulsión, los cebadores de secuencia y las condiciones operativas de la secuenciación fueron todas las indicadas por Margulies y colaboradores. El orden lineal de elementos funcionales en un fragmento de PCR en emulsión amplificado sobre perlas de sefarosa en el procedimiento de secuenciación de 454 fue el siguiente, tal como se ejemplifica en la figura 1A:
Adaptador de PCR de 454 -adaptador de secuencia de 454 -etiqueta 1 de 4 pb de cebador de AFLP -secuencia
1 de cebador de AFLP que incluye el nucleótido o nucleótidos selectivos -secuencia interna de fragmento de
AFLP -secuencia 2 de cebador de AFLP que incluye uno o más nucleótidos selectivos, etiqueta 2 de 4 pb de
cebadores de AFLP -adaptador de secuencia de 454 -adaptador de PCR de 454 -perla de sefarosa.
Se llevaron a cabo dos análisis de secuenciación de 454 de alto rendimiento por parte de 454 Life Sciences
(Branford, CT; Estados Unidos).
Procesamiento de datos de operación de secuenciación de 454
Los datos de secuencia resultantes de 2 análisis de secuenciación de 454 se procesaron utilizando un procedimiento bioinformático (Keygene N.V.). Específicamente, se convirtieron en formato FASTA lecturas de secuencia no procesadas con asignación de bases obtenidas de 454 y se inspeccionaron para la presencia de secuencias adaptadoras de AFLP etiquetadas utilizando un algoritmo de BLAST. Tras las correspondencias de alta confianza con las secuencias de cebador de AFLP etiquetadas conocidas, las secuencias se recortaron, se restituyeron los sitios de endonucleasa de restricción y se asignaron las etiquetas apropiadas (muestra 1 EcoRI (ES1), muestra 1 MseI (MS1), muestra 2 EcoRI (ES2) o muestra 2 MseI (MS2), respectivamente). A continuación, todas las secuencias recortadas mayores de 33 bases se agruparon utilizando un procedimiento megaBLAST basado en homologías globales de secuencia. A continuación, se ensamblaron las agrupaciones en uno o más contigs y/o singletons por agrupación utilizando un algoritmo CAP3 de alineación múltiple. Los contigs que contenían más de una secuencia se inspeccionaron para apareamientos incorrectos de secuencias, representativos de polimorfismos putativos. Se asignaron puntuaciones de calidad a los apareamientos incorrectos de secuencia basándose en los criterios siguientes:
- *
- número de lecturas en un contig
- *
- la distribución observada de alelos
Los dos criterios anteriormente indicados forman la base para la denominada puntuación Q asignada a cada SNP/indel putativo. Las puntuaciones Q se encuentran comprendidas entre 0 y 1; una puntuación Q de 0,3 sólo puede alcanzarse en el caso de ambos alelos se observen por lo menos dos veces.
- *
- localización en homopolímeros de una determinada longitud (ajustable; valor por defecto para evitar polimorfismos localizados en homopolímeros de 3 bases o más largos).
- *
- número de contigs en una agrupación.
- *
- distancia hasta los desapareamientos de secuencia vecina más próximos (ajustable; importante para determinados tipos de ensayos de genotipado que sondean secuencias flanqueantes)* nivel de asociación de los alelos observados con la muestra 1 ó con la muestra 2; en el caso de una asociación perfecta consistente entre los alelos de un polimorfismo putativo y las muestras 1 y 2, el polimorfismo (SNP) se indica en forma de putativo
polimorfismo (SNP) "de elite". Se considera que un polimorfismo de élite presenta una elevada probabilidad de encontrarse localizado en una secuencia genómica única o de bajo número de copia, en el caso de que se hayan utilizado dos líneas homocigóticas en el procedimiento de exploración. A la inversa, una asociación débil de un polimorfismo con el origen de la muestra presenta un riesgo elevado de que se hayan descubierto polimorfismos
5 falsos surgidos de la alineación de secuencias no alélicas en un contig.
Las secuencias que contenían motivos de SSR se identificaron utilizando la herramienta de búsqueda MISA (herramienta de identificación de microsatélites; disponible en http://pgrc.ipk-gatersleben.de/misa/).
10 Se muestran las estadísticas globales de la operación en la Tabla a continuación.
Tabla. Estadísticas globales de un análisis de secuenciación de 454 para la identificación de los SNP en el pimiento.
- Combinación enzimática
- Análisis
- Recorte
- Todas las secuencias
- 254.308
- Erróneas
- 5.293 (2 %)
- Correctas
- 249.015 (98%)
- Concatámeros
- 2.156 (8,5 %)
- Etiquetas mixtas
- 1.120 (0,4 %)
- Secuencias correctas Un extremo recortado
- 240.817 (97%)
- Ambos extremos recortados
- 8.198 (3 %)
- Número de secuencias muestra 1
- 136.990 (55%)
- Número de secuencias muestra 2
- 112.025 (45 %)
- Agrupado
- Número de contigs
- 21.918
- Secuencias en contigs
- 190.861
- Número medio de secuencias en cada contig
- 8,7
- Exploración de SNP
- SNP con puntuación Q �0,3 *
- 1.483
- Indel con puntuación Q �0,3 *
- 3.300
- Exploración de SNP
- Exploración de SSR
- Número total de motivos SSR identificados
- 359
- Número de secuencias que contienen uno o más motivos SSR
- 353
- Número de motivos SSR con tamaño unitario 1
- 0
- (homopolímero) Número de motivos SSR con tamaño unitario 2
- 102
- Número de motivos SSR con tamaño unitario 3 Número de motivos SSR con tamaño unitario 4
- 240 17
- * Los criterios de exploración de SNP / indel fueron los siguientes:
15 No se encontraron polimorfismos contiguos con una puntuación Q superior a 0,1 a menos de 12 bases en cada lado, no presentes en homopolímeros de 3 ó más bases. Los criterios de exploración no consideraron la asociación consistente con las muestras 1 y 2, es decir, los SNP e indels no son necesariamente SNP/indels putativos de élite.
En la figura 7 se muestra un ejemplo de una alineación múltiple que contiene un polimorfismo putativo de único 20 nucleótido de élite.
Ejemplo 5. Validación de SNP mediante amplificación por PCR y secuenciación de Sanger
Con el fin de validar el SNP A/G putativo que se identifica en el Ejemplo 1, se diseñó un ensayo de sitio de 25 secuencia etiquetada (STS) para este SNP utilizando cebadores de PCR flanqueantes. Las secuencias de los cebadores de PCR eran las siguientes:
Cebador_1.2f: 5’-AAACCCAAACTCCCCCAATC-3’, [SEC ID 37] y cebador_1.2r: 5’-AGCGGATAACAATTTCACACAGGACATCAGTAGTCACACTGGTA CAAAAATAGAG30 CAAAACAGTAGTG -3’ [SEQ ID 38]
Observar que el cebador 1.2r contenía un sitio de unión de cebador de secuencia de M13 y un fragmento de relleno en su extremo 5 prima. Se llevó a cabo la amplificación por PCR utilizando los productos de amplificación por AFLP +A/+CA de PSP11 y PI210234 preparados tal como se describe en el Ejemplo 4 a modo de molde. Las condiciones
de PCR fueron las siguientes: para 1 reacción de PCR se mezclaron los componentes siguientes:
5 µl mezcla de AFLP diluida 1/10 (aprox. 10 ng/µl)
5 µl 1 pmol/µl de cebador 1.2f (diluido directamente a partir de solución madre 500 µM)
5 µl 1 pmol/µl cebador 1.2r (diluido directamente a partir de una solución madre 500 µM)
5 µl de mezcla de PCR -2 µl 10x tampón de PCR -1 µl 5 mM dNTP -1,5 µl Mgcl2 25 mM -0,5 µl de H2O
10 5 µl de mezcla enzimática -0,5 µl 10x tampón de PCR (Applied Biosystems) -0,1 µl 5 U/µl ADN polimerasa AmpliTaq (Applied Biosystems) -4,4 µl de H2O
15 Se utilizó el perfil de PCR siguiente:
Ciclo 1 2’: 94°C
Ciclo 2-34 20": 94° C
30": 56°C 2’30": 72°C
Ciclo 35 7’: 72°C
0: 4°C
Los productos de PCR se clonaron en el vector pCR2.1 (kit de clonación TA, Invitrogen) utilizando el método de clonación TA y se transformaron en células E. coli competentes INVaF'. Los transformantes sesometieron a cribado azul/blanco. Se seleccionaron tres transformantes blancos independientes de cada uno de PSP11 y PI-201234 y se
20 cultivaron O/N en medio selectivo líquido para el aislamiento de plásmidos.
Los plásmidos se aislaron utilizando el kit miniprep QIAprep Spin (QIAGEN). A continuación, se secuenciaron las inserciones de estos plásmidos siguiendo el protocolo indicado posteriormente y se resolvieron en el MegaBACE 1000 (Amersham). Las secuencias obtenidas se inspeccionaron en presencia del alelo SNP. Dos plásmidos
25 independientes que contenían la inserción PI-201234 y 1 plásmido que contenía la inserción PSP11 contenían la secuencia de consenso esperada flanqueantes del SNP. La secuencia derivada del fragmento de PSP11 contenía el alelo A esperado (subrayado) y la secuencia derivada del fragmento PI-201234 contenía el alelo G esperado (doble subrayado):
Este resultado indica que el putativo SNP A/G del pimiento representa un polimorfismo genético verdadero detectable utilizando el ensayo STS diseñado.
Ejemplo 6: validación de SNPs mediante detección con SNPWave
40 Con el fin de validar el putativo SNP A/G identificado en el Ejemplo 1, se definieron conjuntos de sondas de ligación SNPWave para ambos alelos de dicho SNP utilizando la secuencia de consenso. Las secuencias de las sondas de ligación eran las siguientes:
45 Secuencias de sonda SNPWave (5'-3'):
06A162 GATGAGTCCTGAGTAACCCAATCGATTTCAAACCTAGAACAA (42 bases) [SEC ID 42] 06A163 GATGAGTCCTGAGTAACCACCAATCGATTTCAAACCTAGAACAG (44 bases) [SEC ID 43] 06A164 Fosfato-TGTTGGTTTTGGTGCTAACTTCAACCAACATCTGGAATTGGTACGCAGTC (52 bases) [SEC ID 44]
Observar que las sondas específicas de alelo 06A162 y 06A163 para los alelos A y G, respectivamente, difieren en tamaño en 2 bases, de manera que, tras la ligación a la sonda común específica de locus 06A164, resultan tamaños de producto de ligación de 94 (42+54) y 96 (44+52) bases.
Las reacciones de ligación SNPWave y de PCR se llevaron a cabo tal como describen Van Eijk y colaboradores
(M.J.T van Eijk, J.L.N. Broekhof, H.J.A. van der Poel, R.C.J. Hogers, H. Schneiders, J. Kamerbeek, E. Verstege, J.W. van Aart, H. Geerlings, J.B. Buntjer, A.J. van Oeveren y P. Vos, SNPWaveTM: SNPWave™: una tecnología de genotipado de SNP multiplex flexible. Nucleic Acids Research 32: e47) utilizando 100 ng de ADN genómico de las líneas del pimiento PSP11 y PI201234 y 8 descendientes de RIL como material de partida. Las secuencias de los cebadores de PCR eran:
93L01FAM (EOOk): 5-GACTGCGTACCAATTC-3’ [SEC ID 45]
93E40 (MOOk): 5-GATGAGTCCTGAGTAA-3’ [SEC ID 46]
Tras la amplificación por PCR, la purificación y detección del producto de PCR en el MegaBACE1000 fue tal como ha sido descrita por van Eijk y colaboradores (ver anteriormente). En la figura 8B se muestra una pseudoimagen en gel de los productos de amplificación obtenidos de PSP11, PI201234 y de 8 descendientes RIL.
Los resultados del SNPWave demuestran claramente que el SNP A/G se detecta mediante el ensayo SNPWave, resultando en productos de 92 pb (=genotipo homocigótico AA) para P1 (PSP11) y los descendientes RIL 1, 2, 3, 4, 6 y 7) y en productos de 94 pb (genotipo homocigótico GG) para P2 (PI201233) y los descendientes RIL 5 y 8.
Ejemplo 7: estrategias para el enriquecimiento de bibliotecas de fragmentos de AFLP en secuencias de bajo número de copia.
El presente ejemplo describe varios métodos de enriquecimiento centrados en secuencias genómicas únicas o de bajo número de copia con el fin de incrementar el rendimiento de polimorfismos de elite tal como se describe en el Ejemplo 4. Los métodos pueden clasificarse en cuatro categorías:
1) Métodos destinados a preparar ADN genómico de alta calidad, excluyendo secuencias de cloroplastos.
Se propone preparar ADN nuclear en lugar de ADN genómico total tal como se describe en el Ejemplo 4, para excluir el coaislamiento de abundante ADN de cloroplastos, lo que podría resultar en un número reducido de secuencias de ADN genómico de la planta, dependiendo de las endonucleasas de restricción y los cebadores de AFLP selectivos utilizados durante el procedimiento de preparación de la biblioteca de fragmentos. Un protocolo para el aislamiento de ADN nuclear del tomate altamente puro ha sido descrito por Peterson D.G., Boehm K.S. y Stack S.M., Isolation of Milligram Quantities of Nuclear DNA From Tomato (Lycopersicon esculentum), A Plant Containing High Levels of Polyphenolic Compounds. Plant Molecular Biology Reporter 15 (2):148-153, 1997.
2) Métodos destinados a utilizar endonucleasas de restricción durante el procedimiento de preparación de moldes para AFLP que se espera que rindan niveles elevados de secuencias de bajo número de copia.
Se propone utilizar determinadas endonucleasas de restricción durante el procedimiento de preparación de moldes para AFLP, que se espera que presenten diana en secuencias genómicas de bajo número de copia o únicas, resultando en bibliotecas de fragmentos enriquecidas en polimorfismos con una capacidad incrementada de ser convertibles en ensayos de genotipado. Un ejemplo de una endonucleasa de restricción con diana en una secuencia de bajo número de copia en genomas vegetales es PstI. Otras endonucleasas de restricción sensibles a la metilación también pueden presentar diana preferentemente en secuencias genómicas de bajo número de copia o únicas.
3) Métodos destinados a eliminar selectivamente secuencias altamente duplicadas basándose en cinética de reapareamiento de secuencias repetidas frente a secuencias de bajo número de copia.
Se propone eliminar selectivamente secuencias altamente duplicadas (repetidas) de la muestra de ADN genómico total o del material de molde de AFLP (ADNc) antes de la amplificación selectiva.
3a) La preparación de ADN de alta C0t es una técnica comúnmente utilizada para el enriquecimiento en secuencias de bajo número de copia de apareamiento lento procedentes de una mezcla compleja de ADN genómico vegetal (Yuan et al., High-Cot sequence analysis of the maize genome. Plant J. 34: 249-255, 2003). Se sugiere utilizar ADN de C0t elevado en lugar de ADN genómico total para el enriquecimiento en polimorfismos situados en secuencias de bajo número de copia. 3b) A modo de alternativa a la laboriosa preparación de alta C0t puede incubarse ADNdc desnaturalizado y en reapareamiento con una nueva nucleasa de cangrejo de Kamchatka, que corta dúplex de ADN cortos perfectamente correspondientes a una tasa más alta que los dúplex de ADN no perfectamente correspondientes, tal como describen Zhulidov y colaboradores (Simple cDNA normalization using Kamchatka crab duplex-specific nuclease. Nucleic Acids Research 32:e37, 2004) y Shagin y colaboradores (A novel method for SNP detection using a new duplex-specific nuclease from crab hepatopancreas, Genome Research 12: 1935-1942, 2004). Específicamente, se propone incubar las mezclas de restricción/ligación de AFLP con dicha endonucleasa para
5 empobrecer la mezcla en secuencias altamente duplicadas, seguido de la amplificación mediante AFLP selectiva de las secuencias genómicas remanentes de bajo número de copia o únicas. 3c) La filtración de metilos es un método para enriquecer en fragmentos de ADN genómico hipometilado utilizando la endonucleasa de restricción McrBC, que corta el ADN metilado en la secuencia [A/G]C, en la que C se encuentra metilado (ver Pablo D. Rabinowicz, Robert Citek, Muhammad A. Budiman, Andrew Nunberg,
10 Joseph A. Bedell, Nathan Lakey, Andrew L. O'Shaughnessy, Lidia U. Nascimento, W. Richard McCombie y Robert A. Martienssen, Differential methylation of genes and repeats in land plants, Genome Research 15:14311440, 2005). Puede utilizarse la McrBC para enriquecer en la fracción de secuencias de bajo número de copia de un genoma, que se utilizará como material de partida para la exploración para polimorfismos.
15 4) Utilización de ADNc y no ADN genómico para el reconocimiento de secuencias génicas.
Finalmente, se propone utilizar ADNc cebado con oligo-dT y no ADN genómico como material de partida para la exploración de polimorfismos, opcionalmente en combinación con la utilización de nucleasa específica de dúplex de cangrejo indicada en 3b, anteriormente, para la normalización. Observar que la utilización de ADNc cebado con
20 oligo-dT también excluye las secuencias de cloroplastos. Alternativamente, se utilizan moldes de ADNc-AFLP en lugar de ADNc cebado con oligo-dT para facilitar la amplificación de las secuencias remanentes de bajo número de copia análogamente a AFLP (ver también 3b, anteriormente).
Ejemplo 8: Estrategia para el enriquecimiento en repeticiones de secuencias simples.
25 El presente ejemplo describe la estrategia propuesta de descubrimiento de secuencias repetidas de secuencias simples análogamente a la identificación de SNP descrita en el Ejemplo 4.
Específicamente, se lleva a cabo la restricción-ligación de ADN genómico de dos o más muestras, por ejemplo
30 utilizando las endonucleasas de restricción PstI/MseI. La amplificación mediante AFLP selectiva se lleva a cabo tal como se describe en el Ejemplo 4. A continuación, se enriquece en fragmentos que contienen los motivos SSR seleccionados mediante uno de los dos métodos siguientes:
1) hibridación de transferencia southern sobre filtros que contienen oligonucleótidos correspondientes a los motivos
35 SSR deseados (por ejemplo (CA)15 en el caso del enriquecimiento para repeticiones CA/GT), seguido de la amplificación de los fragmentos unidos de un modo similar al descrito por Armour y colaboradores (Armour J., Sismani C., Patsalis P. y Cross G., Measurement of locus copy number by hybridization with amplifiable probes. Nucleic Acids Research 28(2): 605-609) o mediante 2) el enriquecimiento utilizando sondas de hibridación de oligonucleótidos de captura biotinilados para capturar fragmentos (de AFLP) en solución tal como describen Kijas y
40 colaboradores (Kijas J.M., Fowler J.C., Garbett C.A. y Thomas, M.R., Enrichment of microsatellites from the citrus genome using biotinylated oligonucleotide sequences bound to streptavidin-coated magnetic particles. Biotechniques, 16: 656-662, 1994).
A continuación, los fragmentos de AFLP enriquecidos en motivo SSR se amplifican utilizando los mismos cebadores
45 de AFLP utilizados en la etapa de preamplificación, con el fin de generar una biblioteca de secuencias. Una alícuota de los fragmentos amplificados se clonan T/A y 96 clones se secuencian para estimar la fracción de clones positivos (clones que contienen el motivo SSR deseado, por ejemplo motivos CA/GT de más de 5 unidades repetidas. Se detecta otra alícuota de la mezcla enriquecida en fragmentos de AFLP mediante electroforesis en gel de poliacrilamida (PAGE), opcionalmente tras la amplificación selectiva adicional para obtener una huella genética
50 legible, con el fin de inspeccionar visualmente si se ha realizado el enriquecimiento en fragmentos que contienen SSR. Tras completar con éxito dichas etapas de control, las bibliotecas de secuencias se someten a secuenciación de alto rendimiento de 454.
La estrategia anteriormente indicada para la identificación de novo de las SSR se ilustra esquemáticamente en la
55 figura 8A, y puede adaptarse para otros motivos de secuencia mediante la sustitución correspondiente de las secuencias oligonucleótidas de captura.
Ejemplo 9. Estrategia para evitar las etiquetas mixtas.
Las etiquetas mixtas se refieren a la observación de que, aparte de la combinación de cebadores de AFLP etiquetados esperada en cada muestra, se observa una fracción reducida de secuencias que contiene una etiqueta de la muestra 1 en un extremo y una etiqueta de la muestra 2 en el otro extremo (ver también la Tabla 1 en el Ejemplo 4). Esquemáticamente se ilustra la configuración de las secuencias que contienen etiquetas mixtas a continuación.
Representación esquemática de las combinaciones esperadas de etiquetas de muestra.
Representación esquemática de las etiquetas mixtas.
La observación de etiquetas mixtas impide la asignación correcta de las secuencias a PSP11 ó PI-201234.
5 Se muestra en la figura 5A un ejemplo de una secuencia de etiqueta mixta observada en el análisis de la secuencia del pimiento descrito en el Ejemplo 4. En el panel 2 de la figura 5A se muestra una vista general de la configuración de los fragmentos observados que contienen etiquetas esperadas y etiquetas mixtas.
10 La explicación molecular propuesta para las etiquetas mixtas es que durante la etapa de preparación de la biblioteca de secuencias, la ADN polimerasa de T4 o el enzima Klenow generan extremos romos en los fragmentos de ADN al eliminar los extremos protuberantes 3 prima antes de la ligación de adaptadores (Margulies et al., 2005). Aunque lo anterior puede funcionar bien en el caso de que se procese una única muestra de ADN, al procesar una mezcla de dos o más muestras de ADN etiquetadas diferentemente, el rellenado por parte de la polimerasa resulta en la
15 incorporación de una secuencia de etiqueta incorrecta en el caso de que se haya formado un heterodúplex entre las cadenas complementarias derivadas de muestras diferentes (figura 5B, panel 3, etiquetas mixtas). La solución encontrada es agrupar las muestras tras la etapa de purificación posterior a la ligación de adaptadores durante la etapa de construcción de la biblioteca de fragmentos de 454, tal como se muestra en la figura 5C, panel 4.
20 Ejemplo 10. Estrategia para evitar etiquetas mixtas y concatámeros utilizando un diseño mejorado de preparación de biblioteca de secuencias de 454.
Aparte de la observación de frecuencias bajas de resultados de secuencias que contienen etiquetas mixtas tal como se describe en el Ejemplo 9, se ha observado una frecuencia baja de resultados de secuencias de fragmentos de
25 AFLP concatenados.
Un ejemplo de un resultado de secuencia derivada de un concatámero se muestra en la figura 6A, panel 1. Esquemáticamente, se muestra en la figura 6A, panel 2, la configuración de secuencias que contienen etiquetas esperadas y concatámeros.
30 La explicación molecular propuesta para la presencia de fragmentos de AFLP concatenados es que, durante la etapa de preparación de la biblioteca de secuencias de 454, se generan extremos romos en los fragmentos de ADN al eliminar la ADN polimerasa de T4 o el enzima Klenow los extremos protuberantes 3 prima antes de la ligación de adaptadores (Margulies et al., 2005). En consecuencia, los fragmentos de ADN de extremos romos de la muestra
35 compiten con los adaptadores durante la etapa de ligación y podrían ligarse entre sí antes de ligarse a los adaptadores. Este fenómeno de hecho es independiente de si se incluye una única muestra de ADN o una mezcla de múltiples muestras (etiquetadas) en la etapa de preparación de la biblioteca, y por lo tanto también podría producirse durante la secuenciación convencional tal como describen Margulies y colaboradores. En el caso de que se utilicen muestras con múltiples etiquetas, tal como se describe en el Ejemplo 4, los concatámeros complican la
40 asignación correcta de lecturas de secuencia a las muestras basada en la información de etiquetas y por lo tanto deben evitarse.
La solución propuesta a la formación de concatámeros (y etiquetas mixtas) es sustituir la ligación de adaptadores de extremos romos por la ligación de adaptadores que contienen un extremo protuberante 3 prima de T, análogamente a la clonación T/A de productos de PCR, tal como se muestra en la figura 6B, panel 3. Convenientemente, se propone que estos adaptadores modificados que contienen una T en el extremo protuberante 3' contengan una C en el extremo protuberante 3' opuesto (que no se ligará al fragmento de ADN de muestra, para evitar la formación de concatámeros entre extremos romos de secuencias adaptadoras (ver la figura 6B, panel 3)). El flujo de operaciones adaptado que resulta para el procedimiento de construcción de una biblioteca de secuencias al utilizar el enfoque de adaptadores modificados se muestra esquemáticamente en la figura 6C, panel 4.
LISTADO DE SECUENCIAS
<110> Keygene NV
<120> Estrategias para la identificación y detección de alto rendimiento de polimorfismos
<130> P27819EP01
<160> 46
<170> PatentIn versión 3.3
<210> 1
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 1
<210> 2
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 2
<210> 3
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 3
<210> 4
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 4
<210> 5
<211> 17
<212> ADN
<213> Artificial
<220>
<223> adaptador
<400> 5
<210> 6
<211> 18
<212> ADN
<213> Artificial
<220>
<223> adaptador
<400> 6
<210> 7
<211> 16
<212> ADN
<213> Artificial
<220>
<223> adaptador
<400> 7
<210> 8
<211> 14
<212> ADN
<213> Artificial
<220>
<223> adaptador
<400> 8
<210> 9
<211> 18
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 9
<210> 10
<211> 17
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 10 <210> 11
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 11
<210> 12
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 12
<210> 13
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 13
<210> 14
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 14
<210> 15
<211> 19
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 15
<210> 16 <211> 19
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 16
<210> 17
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 17
<210> 18
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 18
<210> 19
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 19
<210> 20
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 20
<210> 21
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 21
<210> 22
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 22
<210> 23
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 23
<210> 24
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 24
<210> 25
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 25
<210> 26
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 26
<210> 27
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 27
<210> 28
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 28
<210> 29
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 29
<210> 30
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 30
<210> 31
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 31
<210> 32
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 32
<210> 33
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 33
<210> 34
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 34
<210> 35
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 35
<210> 36
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 36
<210> 37
<211> 20
<212> ADN
<213> artificial
<220>
<223> Cebador
<400> 37
<210> 38
<211> 68
<212> ADN
<213> artificial
<220>
<223> Cebador
<400> 38
<210> 39
<211> 91
<212> ADN
<213> artificial
<220>
<223> sonda
<400> 39
<210> 40
<211> 90
<212> ADN
<213> artificial
<220>
<223> secuencia que contiene el SNP PI-201234
<400> 40 <210> 41
<211> 90
<212> ADN
5 <213> artificial
<220>
<223> SNP PI-201234
10 <400> 41
<210> 42
<211> 42
<212> ADN
<213> artificial
<220>
<223> Sonda SNPWave
<400> 42
<210> 43
<211> 44
<212> ADN
<213> artificial
<220>
<223> Sonda SNPWave
<400> 43
<210> 44
<211> 50
<212> ADN 20 <213> artificial
<220>
<223> sonda snpwave
25 <400> 44
<210> 45 30 <211> 16
<212> ADN
<213> artificial
<220>
<223> Cebador
<400> 45
- 10
- <210> 46
- <211> 16
- <212> ADN
- <213> artificial
- 15
- <220> 5
- <223> Cebador
- <400> 46
- 20
Claims (6)
- REIVINDICACIONES
- 1.
- Utilización en un método de reducción de la complejidad, de un adaptador que porta un extremo protuberante 3' de T en la reducción del etiquetado mixto de una muestra de ADN amplificado y/o en la reducción o prevención de la formación de concatámeros de fragmentos de ADN de una muestra de ADN que comprende fragmentos de restricción amplificados que portan un extremo protuberante 3' de A obtenido de una reducción de complejidad.
-
- 2.
- Utilización según la reivindicación 1, en la que el método para la reducción del etiquetado mixto del ADN
amplificado comprende las etapas de: -proporcionar una muestra de ADN, -amplificar la muestra de ADN con cebadores de amplificación etiquetados con el fin de generar amplicones etiquetados, -opcionalmente proporcionar extremo protuberantes 3' de A en los extremos de los amplicones etiquetados, -ligar adaptadores que portan un extremo protuberante 3' de T a los amplicones etiquetados. -
- 3.
- Utilización según la reivindicación 1, en la que el método para la reducción o prevención de la formación de
concatámeros de los fragmentos de ADN de una muestra de ADN comprende las etapas de: -proporcionar fragmentos de ADN a partir de una muestra de ADN, -opcionalmente, pulir los fragmentos de ADN para proporcionar fragmentos de ADN de extremos romos, -opcionalmente, proporcionar extremos protuberantes 3' de A a los extremos de los fragmentos de ADN de extremos romos, -ligar adaptadores a los fragmentos de ADN en los que el adaptador contiene un extremo protuberante 3' de T en el extremo que se liga al fragmento. -
- 4.
- Utilización según la reivindicación 2 ó 3, en la que la muestra de ADN es una muestra de ADN de complejidad reducida y/o los fragmentos de ADN son fragmentos de ADN de complejidad reducida.
-
- 5.
- Utilización según la reivindicación 3 ó 4, en la que los fragmentos se amplifican con cebadores de amplificación (etiquetados) para generar amplicones.
-
- 6.
- Utilización según las reivindicaciones 2 a 5, en la que los fragmentos o amplicones ligados con adaptador se someten a secuenciación sobre un soporte sólido.
Applications Claiming Priority (6)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US69305305P | 2005-06-23 | 2005-06-23 | |
| US693053P | 2005-06-23 | ||
| EP06075104 | 2006-01-16 | ||
| EP06075104 | 2006-01-16 | ||
| US75903406P | 2006-01-17 | 2006-01-17 | |
| US759034P | 2006-01-17 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| ES2393318T3 true ES2393318T3 (es) | 2012-12-20 |
Family
ID=36940150
Family Applications (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES10075564T Active ES2393318T3 (es) | 2005-06-23 | 2006-06-23 | Estrategias para la identificación y detección de alto rendimiento de polimorfismos |
| ES10184351T Active ES2387878T3 (es) | 2005-06-23 | 2006-06-23 | Estrategias para la identificación de alto rendimiento y la detección de polimorfismos |
Family Applications After (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES10184351T Active ES2387878T3 (es) | 2005-06-23 | 2006-06-23 | Estrategias para la identificación de alto rendimiento y la detección de polimorfismos |
Country Status (9)
| Country | Link |
|---|---|
| US (15) | US8785353B2 (es) |
| EP (3) | EP2302070B1 (es) |
| JP (2) | JP5220597B2 (es) |
| CN (3) | CN105039313B (es) |
| AT (2) | ATE557105T1 (es) |
| DE (1) | DE602006018744D1 (es) |
| DK (2) | DK2302070T3 (es) |
| ES (2) | ES2393318T3 (es) |
| WO (1) | WO2006137733A1 (es) |
Families Citing this family (150)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US9365893B2 (en) | 2005-05-10 | 2016-06-14 | State Of Oregon Acting By And Through The State Board Of Higher Education On Behalf Of The University Of Oregon | Methods of mapping polymorphisms and polymorphism microarrays |
| WO2006137733A1 (en) | 2005-06-23 | 2006-12-28 | Keygene N.V. | Strategies for high throughput identification and detection of polymorphisms |
| AU2006295556B2 (en) | 2005-09-29 | 2012-07-05 | Keygene N.V. | High throughput screening of mutagenized populations |
| US10316364B2 (en) | 2005-09-29 | 2019-06-11 | Keygene N.V. | Method for identifying the source of an amplicon |
| DK3404114T3 (da) * | 2005-12-22 | 2021-06-28 | Keygene Nv | Fremgangsmåde til detektering af AFLP-baseret polymorfisme med højt gennemløb |
| CN101365803B (zh) * | 2005-12-22 | 2013-03-20 | 关键基因股份有限公司 | 采用高通量测序技术的改进的转录谱描述策略 |
| US7932029B1 (en) * | 2006-01-04 | 2011-04-26 | Si Lok | Methods for nucleic acid mapping and identification of fine-structural-variations in nucleic acids and utilities |
| WO2007114693A2 (en) * | 2006-04-04 | 2007-10-11 | Keygene N.V. | High throughput detection of molecular markers based on aflp and high throughput sequencing |
| WO2008027558A2 (en) | 2006-08-31 | 2008-03-06 | Codon Devices, Inc. | Iterative nucleic acid assembly using activation of vector-encoded traits |
| AR066922A1 (es) | 2007-06-08 | 2009-09-23 | Monsanto Technology Llc | Metodos de mejoramiento molecular del germoplasma de una planta por secuenciamiento dirigido |
| US8124336B2 (en) | 2007-09-26 | 2012-02-28 | Population Genetics Technologies Ltd | Methods and compositions for reducing the complexity of a nucleic acid sample |
| EP2367937B1 (en) * | 2008-12-04 | 2013-04-17 | Keygene N.V. | Method for the reduction of repetitive sequences in adapter-ligated restriction fragments |
| US9085798B2 (en) | 2009-04-30 | 2015-07-21 | Prognosys Biosciences, Inc. | Nucleic acid constructs and methods of use |
| JP5799484B2 (ja) | 2009-12-14 | 2015-10-28 | トヨタ自動車株式会社 | Dnaマイクロアレイにおけるプローブ設計方法、当該方法により設計されたプローブを有するdnaマイクロアレイ |
| US20190300945A1 (en) | 2010-04-05 | 2019-10-03 | Prognosys Biosciences, Inc. | Spatially Encoded Biological Assays |
| US10787701B2 (en) | 2010-04-05 | 2020-09-29 | Prognosys Biosciences, Inc. | Spatially encoded biological assays |
| PT2556171E (pt) | 2010-04-05 | 2015-12-21 | Prognosys Biosciences Inc | Ensaios biológicos codificados espacialmente |
| FI3425062T3 (fi) | 2010-06-09 | 2023-09-01 | Keygene Nv | Kombinatorisia sekvenssiviivakoodeja suuren suorituskyvyn seulontaa varten |
| CA2804450C (en) * | 2010-07-09 | 2022-10-11 | Max Jan van Min | 3-d genomic region of interest sequencing strategies |
| CN102409048B (zh) * | 2010-09-21 | 2013-10-23 | 深圳华大基因科技服务有限公司 | 一种基于高通量测序的dna标签文库构建方法 |
| CN102409046B (zh) * | 2010-09-21 | 2013-09-18 | 深圳华大基因科技服务有限公司 | 小分子rna标签 |
| GB201016484D0 (en) | 2010-09-30 | 2010-11-17 | Geneseque As | Method |
| EP2637780B1 (en) | 2010-11-12 | 2022-02-09 | Gen9, Inc. | Protein arrays and methods of using and making the same |
| AU2011338841B2 (en) | 2010-11-12 | 2017-02-16 | Gen9, Inc. | Methods and devices for nucleic acids synthesis |
| EP2663655B1 (en) * | 2011-01-14 | 2015-09-02 | Keygene N.V. | Paired end random sequence based genotyping |
| GB201106254D0 (en) | 2011-04-13 | 2011-05-25 | Frisen Jonas | Method and product |
| EP2723906A4 (en) | 2011-06-27 | 2015-02-25 | Univ Florida | METHOD FOR REDUCING THE COMPLEXITY OF A GENOM AND FOR DETECTING POLYMORPHISMS |
| AU2012300401B2 (en) | 2011-08-26 | 2018-02-08 | Ginkgo Bioworks, Inc. | Compositions and methods for high fidelity assembly of nucleic acids |
| CN102567652A (zh) * | 2011-12-13 | 2012-07-11 | 上海大学 | 一种面向snp数据的筛选方法 |
| WO2013106737A1 (en) | 2012-01-13 | 2013-07-18 | Data2Bio | Genotyping by next-generation sequencing |
| EP2814959B1 (en) | 2012-02-17 | 2018-01-17 | Fred Hutchinson Cancer Research Center | Compositions and methods for accurately identifying mutations |
| EP4234713A3 (en) | 2012-03-20 | 2024-02-14 | University Of Washington Through Its Center For Commercialization | Methods of lowering the error rate of massively parallel dna sequencing using duplex consensus sequencing |
| US9150853B2 (en) | 2012-03-21 | 2015-10-06 | Gen9, Inc. | Methods for screening proteins using DNA encoded chemical libraries as templates for enzyme catalysis |
| US8209130B1 (en) | 2012-04-04 | 2012-06-26 | Good Start Genetics, Inc. | Sequence assembly |
| US20130281308A1 (en) * | 2012-04-24 | 2013-10-24 | Gen9, Inc. | Methods for sorting nucleic acids and preparative in vitro cloning |
| EP2841601B1 (en) | 2012-04-24 | 2019-03-06 | Gen9, Inc. | Methods for sorting nucleic acids and multiplexed preparative in vitro cloning |
| KR101890140B1 (ko) | 2012-05-07 | 2018-09-28 | 삼성전자주식회사 | 카메라 장치를 이용하여 디스플레이 장치를 제어하는 방법 및 이를 적용한 모바일 장치, 디스플레이 장치, 그리고 시스템 |
| WO2013177220A1 (en) | 2012-05-21 | 2013-11-28 | The Scripps Research Institute | Methods of sample preparation |
| US20150191719A1 (en) | 2012-06-25 | 2015-07-09 | Gen9, Inc. | Methods for Nucleic Acid Assembly and High Throughput Sequencing |
| US20150011396A1 (en) | 2012-07-09 | 2015-01-08 | Benjamin G. Schroeder | Methods for creating directional bisulfite-converted nucleic acid libraries for next generation sequencing |
| US20160040229A1 (en) | 2013-08-16 | 2016-02-11 | Guardant Health, Inc. | Systems and methods to detect rare mutations and copy number variation |
| GB201217888D0 (en) | 2012-10-05 | 2012-11-21 | Univ Leuven Kath | High-throughput genotyping by sequencing of single cell |
| DK3511423T4 (da) | 2012-10-17 | 2024-07-29 | Spatial Transcriptomics Ab | Fremgangsmåder og produkt til optimering af lokaliseret eller rumlig detektion af genekspression i en vævsprøve |
| EP2946345B1 (en) | 2013-01-17 | 2024-04-03 | Personalis, Inc. | Methods and systems for genetic analysis |
| WO2014144092A1 (en) | 2013-03-15 | 2014-09-18 | Nugen Technologies, Inc. | Sequential sequencing |
| EP4234716A3 (en) | 2013-06-25 | 2023-12-06 | Prognosys Biosciences, Inc. | Methods for determining spatial patterns of biological targets in a sample |
| EP4567682A3 (en) | 2013-08-30 | 2025-09-03 | Personalis, Inc. | Methods for genomic analysis |
| JP6422193B2 (ja) * | 2013-09-30 | 2018-11-14 | キアゲン ゲーエムベーハー | Dnaライブラリーの調製のためのdnaアダプター分子およびその生成法および使用 |
| GB2535066A (en) | 2013-10-03 | 2016-08-10 | Personalis Inc | Methods for analyzing genotypes |
| GB201319779D0 (en) * | 2013-11-08 | 2013-12-25 | Cartagenia N V | Genetic analysis method |
| WO2015073711A1 (en) | 2013-11-13 | 2015-05-21 | Nugen Technologies, Inc. | Compositions and methods for identification of a duplicate sequencing read |
| GB201413929D0 (en) | 2014-08-06 | 2014-09-17 | Geneseque As | Method |
| EP3913066A1 (en) * | 2014-09-09 | 2021-11-24 | Igenomx International Genomics Corporation | Compositions for rapid nucleic acid library preparation |
| EP4026913A1 (en) | 2014-10-30 | 2022-07-13 | Personalis, Inc. | Methods for using mosaicism in nucleic acids sampled distal to their origin |
| CN104450697B (zh) * | 2014-12-02 | 2017-01-11 | 中国科学院海洋研究所 | 一种与牡蛎抗病毒特性相关的snp标记及其应用 |
| EP4119677B1 (en) | 2015-04-10 | 2023-06-28 | Spatial Transcriptomics AB | Spatially distinguished, multiplex nucleic acid analysis of biological specimens |
| US10344336B2 (en) | 2015-06-09 | 2019-07-09 | Life Technologies Corporation | Methods, systems, compositions, kits, apparatus and computer-readable media for molecular tagging |
| WO2017100441A1 (en) | 2015-12-08 | 2017-06-15 | Twinstrand Biosciences, Inc. | Improved adapters, methods, and compositions for duplex sequencing |
| CN105420363A (zh) * | 2015-12-15 | 2016-03-23 | 江苏省中国科学院植物研究所 | 一种适用于狗牙根基因差异表达研究的cDNA-AFLP方法 |
| ES2914396T3 (es) | 2016-03-22 | 2022-06-10 | Vib Vzw | Medios y métodos de amplificación de secuencias de nucleótidos |
| EP4488686A3 (en) | 2016-04-14 | 2025-04-30 | Guardant Health, Inc. | Methods for early detection of cancer |
| US11384382B2 (en) | 2016-04-14 | 2022-07-12 | Guardant Health, Inc. | Methods of attaching adapters to sample nucleic acids |
| US11299783B2 (en) | 2016-05-27 | 2022-04-12 | Personalis, Inc. | Methods and systems for genetic analysis |
| CN106480191A (zh) * | 2016-10-20 | 2017-03-08 | 南昌大学 | 一种河蛏蚌f型线粒体基因组全序列扩增的方法 |
| CN110167951A (zh) * | 2016-11-15 | 2019-08-23 | 奎斯特诊断投资有限责任公司 | 使用mitra尖端提取检测dna突变的方法 |
| JP2020501601A (ja) * | 2016-11-15 | 2020-01-23 | クエスト ダイアグノスティックス インヴェストメンツ エルエルシー | Mitraチップ抽出を使用して嚢胞性線維症の変異を検出するための方法 |
| WO2018183942A1 (en) | 2017-03-31 | 2018-10-04 | Grail, Inc. | Improved library preparation and use thereof for sequencing-based error correction and/or variant identification |
| US12492430B2 (en) | 2017-04-11 | 2025-12-09 | Tecan Genomics, Inc. | Library quantitation and qualification |
| US10995369B2 (en) * | 2017-04-23 | 2021-05-04 | Illumina, Inc. | Compositions and methods for improving sample identification in indexed nucleic acid libraries |
| JP7056012B2 (ja) * | 2017-05-19 | 2022-04-19 | トヨタ自動車株式会社 | ランダムプライマーセット、及びこれを用いたdnaライブラリーの作製方法 |
| WO2019060716A1 (en) | 2017-09-25 | 2019-03-28 | Freenome Holdings, Inc. | SAMPLE EXTRACTION METHODS AND SYSTEMS |
| US11099202B2 (en) | 2017-10-20 | 2021-08-24 | Tecan Genomics, Inc. | Reagent delivery system |
| CN107589193B (zh) * | 2017-10-25 | 2020-05-05 | 南京工业大学 | 一种利用微反应装置筛选蛋白抑制剂的方法 |
| SG11202003885UA (en) | 2017-11-08 | 2020-05-28 | Twinstrand Biosciences Inc | Reagents and adapters for nucleic acid sequencing and methods for making such reagents and adapters |
| WO2019121603A1 (en) | 2017-12-18 | 2019-06-27 | Keygene N.V. | Chemical mutagenesis of cassava |
| JP7047373B2 (ja) | 2017-12-25 | 2022-04-05 | トヨタ自動車株式会社 | 次世代シーケンサー用プライマー並びにその製造方法、次世代シーケンサー用プライマーを用いたdnaライブラリー並びにその製造方法、及びdnaライブラリーを用いたゲノムdna解析方法 |
| WO2019164885A1 (en) * | 2018-02-20 | 2019-08-29 | William Marsh Rice University | Systems and methods for allele enrichment using multiplexed blocker displacement amplification |
| US10801064B2 (en) | 2018-05-31 | 2020-10-13 | Personalis, Inc. | Compositions, methods and systems for processing or analyzing multi-species nucleic acid samples |
| US11814750B2 (en) | 2018-05-31 | 2023-11-14 | Personalis, Inc. | Compositions, methods and systems for processing or analyzing multi-species nucleic acid samples |
| SG11202100141SA (en) | 2018-07-12 | 2021-02-25 | Twinstrand Biosciences Inc | Methods and reagents for characterizing genomic editing, clonal expansion, and associated applications |
| JP7418402B2 (ja) | 2018-07-26 | 2024-01-19 | レクセント バイオ, インコーポレイテッド | 単一のフローセルを使用した多重シークエンシング |
| US11519033B2 (en) | 2018-08-28 | 2022-12-06 | 10X Genomics, Inc. | Method for transposase-mediated spatial tagging and analyzing genomic DNA in a biological sample |
| US20220033879A1 (en) | 2018-11-28 | 2022-02-03 | Keygene N.V. | Targeted enrichment by endonuclease protection |
| US12385083B2 (en) | 2018-12-10 | 2025-08-12 | 10X Genomics, Inc. | Methods of using master / copy arrays for spatial detection |
| EP3899028A1 (en) * | 2018-12-17 | 2021-10-27 | Illumina, Inc. | Methods and means for preparing a library for sequencing |
| CN111378557B (zh) | 2018-12-26 | 2023-06-06 | 财团法人工业技术研究院 | 用于产生液珠的管状结构及液珠产生方法 |
| US11926867B2 (en) | 2019-01-06 | 2024-03-12 | 10X Genomics, Inc. | Generating capture probes for spatial analysis |
| US11649485B2 (en) | 2019-01-06 | 2023-05-16 | 10X Genomics, Inc. | Generating capture probes for spatial analysis |
| WO2020169830A1 (en) | 2019-02-21 | 2020-08-27 | Keygene N.V. | Genotyping of polyploids |
| EP3976820A1 (en) | 2019-05-30 | 2022-04-06 | 10X Genomics, Inc. | Methods of detecting spatial heterogeneity of a biological sample |
| NZ773619A (en) | 2019-05-31 | 2025-07-25 | Freenome Holdings Inc | Methods and systems for high-depth sequencing of methylated nucleic acid |
| US10927409B1 (en) | 2019-10-14 | 2021-02-23 | Pioneer Hi-Bred International, Inc. | Detection of sequences uniquely associated with a dna target region |
| EP4055610A4 (en) | 2019-11-05 | 2023-11-29 | Personalis, Inc. | ESTIMATION OF TUMOR PURITY FROM SINGLE SAMPLES |
| EP4025711A2 (en) | 2019-11-08 | 2022-07-13 | 10X Genomics, Inc. | Enhancing specificity of analyte binding |
| JP2023505712A (ja) | 2019-12-12 | 2023-02-10 | キージーン ナムローゼ フェンノートシャップ | 半固体状態での核酸操作 |
| WO2021123062A1 (en) | 2019-12-20 | 2021-06-24 | Keygene N.V. | Ngs library preparation using covalently closed nucleic acid molecule ends |
| WO2021133849A1 (en) | 2019-12-23 | 2021-07-01 | 10X Genomics, Inc. | Methods for spatial analysis using rna-templated ligation |
| WO2021133842A1 (en) | 2019-12-23 | 2021-07-01 | 10X Genomics, Inc. | Compositions and methods for using fixed biological samples in partition-based assays |
| US12365942B2 (en) | 2020-01-13 | 2025-07-22 | 10X Genomics, Inc. | Methods of decreasing background on a spatial array |
| US12405264B2 (en) | 2020-01-17 | 2025-09-02 | 10X Genomics, Inc. | Electrophoretic system and method for analyte capture |
| US11732299B2 (en) | 2020-01-21 | 2023-08-22 | 10X Genomics, Inc. | Spatial assays with perturbed cells |
| US11702693B2 (en) | 2020-01-21 | 2023-07-18 | 10X Genomics, Inc. | Methods for printing cells and generating arrays of barcoded cells |
| US20210230681A1 (en) | 2020-01-24 | 2021-07-29 | 10X Genomics, Inc. | Methods for spatial analysis using proximity ligation |
| US11821035B1 (en) | 2020-01-29 | 2023-11-21 | 10X Genomics, Inc. | Compositions and methods of making gene expression libraries |
| US12076701B2 (en) | 2020-01-31 | 2024-09-03 | 10X Genomics, Inc. | Capturing oligonucleotides in spatial transcriptomics |
| US12110541B2 (en) | 2020-02-03 | 2024-10-08 | 10X Genomics, Inc. | Methods for preparing high-resolution spatial arrays |
| CN113275053A (zh) | 2020-02-03 | 2021-08-20 | 帝肯基因组学公司 | 试剂存储系统 |
| US11898205B2 (en) | 2020-02-03 | 2024-02-13 | 10X Genomics, Inc. | Increasing capture efficiency of spatial assays |
| US11732300B2 (en) | 2020-02-05 | 2023-08-22 | 10X Genomics, Inc. | Increasing efficiency of spatial analysis in a biological sample |
| US12129516B2 (en) | 2020-02-07 | 2024-10-29 | 10X Genomics, Inc. | Quantitative and automated permeabilization performance evaluation for spatial transcriptomics |
| US12281357B1 (en) | 2020-02-14 | 2025-04-22 | 10X Genomics, Inc. | In situ spatial barcoding |
| US11475981B2 (en) | 2020-02-18 | 2022-10-18 | Tempus Labs, Inc. | Methods and systems for dynamic variant thresholding in a liquid biopsy assay |
| US11211147B2 (en) | 2020-02-18 | 2021-12-28 | Tempus Labs, Inc. | Estimation of circulating tumor fraction using off-target reads of targeted-panel sequencing |
| US11211144B2 (en) | 2020-02-18 | 2021-12-28 | Tempus Labs, Inc. | Methods and systems for refining copy number variation in a liquid biopsy assay |
| US11891654B2 (en) | 2020-02-24 | 2024-02-06 | 10X Genomics, Inc. | Methods of making gene expression libraries |
| CA3178302A1 (en) | 2020-03-31 | 2021-10-07 | Freenome Holdings, Inc. | Methods and systems for detecting colorectal cancer via nucleic acid methylation analysis |
| EP4549582A3 (en) | 2020-04-22 | 2025-06-18 | 10x Genomics, Inc. | Methods for spatial analysis using targeted rna depletion |
| EP4553168A3 (en) | 2020-05-22 | 2025-08-27 | 10x Genomics, Inc. | Spatial analysis to detect sequence variants |
| WO2021236929A1 (en) | 2020-05-22 | 2021-11-25 | 10X Genomics, Inc. | Simultaneous spatio-temporal measurement of gene expression and cellular activity |
| WO2021242834A1 (en) | 2020-05-26 | 2021-12-02 | 10X Genomics, Inc. | Method for resetting an array |
| EP4025692A2 (en) | 2020-06-02 | 2022-07-13 | 10X Genomics, Inc. | Nucleic acid library methods |
| WO2021247568A1 (en) | 2020-06-02 | 2021-12-09 | 10X Genomics, Inc. | Spatial trancriptomics for antigen-receptors |
| US12031177B1 (en) | 2020-06-04 | 2024-07-09 | 10X Genomics, Inc. | Methods of enhancing spatial resolution of transcripts |
| ES2981265T3 (es) | 2020-06-08 | 2024-10-08 | 10X Genomics Inc | Métodos para determinar un margen quirúrgico y métodos de uso del mismo |
| WO2021252591A1 (en) | 2020-06-10 | 2021-12-16 | 10X Genomics, Inc. | Methods for determining a location of an analyte in a biological sample |
| EP4450639B1 (en) | 2020-06-25 | 2025-10-15 | 10X Genomics, Inc. | Spatial analysis of dna methylation |
| US12209280B1 (en) | 2020-07-06 | 2025-01-28 | 10X Genomics, Inc. | Methods of identifying abundance and location of an analyte in a biological sample using second strand synthesis |
| US11761038B1 (en) | 2020-07-06 | 2023-09-19 | 10X Genomics, Inc. | Methods for identifying a location of an RNA in a biological sample |
| US11981960B1 (en) | 2020-07-06 | 2024-05-14 | 10X Genomics, Inc. | Spatial analysis utilizing degradable hydrogels |
| US20220017956A1 (en) * | 2020-07-14 | 2022-01-20 | Accugenomics, Inc. | Endogenous complexity calibration ladder target |
| US11981958B1 (en) | 2020-08-20 | 2024-05-14 | 10X Genomics, Inc. | Methods for spatial analysis using DNA capture |
| US11926822B1 (en) | 2020-09-23 | 2024-03-12 | 10X Genomics, Inc. | Three-dimensional spatial analysis |
| WO2022076237A1 (en) | 2020-10-05 | 2022-04-14 | Freenome Holdings, Inc. | Markers for the early detection of colon cell proliferative disorders |
| JP2023543602A (ja) | 2020-10-06 | 2023-10-17 | キージーン ナムローゼ フェンノートシャップ | 標的化された配列付加 |
| US11827935B1 (en) | 2020-11-19 | 2023-11-28 | 10X Genomics, Inc. | Methods for spatial analysis using rolling circle amplification and detection probes |
| WO2022112316A1 (en) | 2020-11-24 | 2022-06-02 | Keygene N.V. | Targeted enrichment using nanopore selective sequencing |
| EP4251750A1 (en) | 2020-11-25 | 2023-10-04 | Koninklijke Nederlandse Akademie van Wetenschappen | Ribosomal profiling in single cells |
| CA3202255A1 (en) | 2020-12-21 | 2022-06-30 | Hayley WARSINSKE | Markers for the early detection of colon cell proliferative disorders |
| EP4121555A1 (en) | 2020-12-21 | 2023-01-25 | 10X Genomics, Inc. | Methods, compositions, and systems for capturing probes and/or barcodes |
| CN112695125B (zh) * | 2021-01-29 | 2021-08-27 | 广东省农业科学院环境园艺研究所 | 一种卡特兰属ssr分子标记引物组合物及其应用 |
| WO2022221425A1 (en) | 2021-04-14 | 2022-10-20 | 10X Genomics, Inc. | Methods of measuring mislocalization of an analyte |
| WO2022236054A1 (en) | 2021-05-06 | 2022-11-10 | 10X Genomics, Inc. | Methods for increasing resolution of spatial analysis |
| EP4582555A3 (en) | 2021-06-03 | 2025-10-22 | 10X Genomics, Inc. | Methods, compositions, kits, and systems for enhancing analyte capture for spatial analysis |
| EP4196605B1 (en) | 2021-09-01 | 2024-12-04 | 10X Genomics, Inc. | Methods for blocking a capture probe on a spatial array |
| CN113832250B (zh) * | 2021-09-29 | 2024-06-07 | 石家庄博瑞迪生物技术有限公司 | 一种基于mSNP技术检测玉米种子纯度的混样检测方法 |
| EP4413580A4 (en) | 2021-10-05 | 2025-08-13 | Personalis Inc | PERSONALIZED TESTS FOR PERSONALIZED CANCER MONITORING |
| EP4419707A1 (en) | 2021-11-10 | 2024-08-28 | 10X Genomics, Inc. | Methods, compositions, and kits for determining the location of an analyte in a biological sample |
| WO2023102118A2 (en) | 2021-12-01 | 2023-06-08 | 10X Genomics, Inc. | Methods, compositions, and systems for improved in situ detection of analytes and spatial analysis |
| WO2024121354A1 (en) | 2022-12-08 | 2024-06-13 | Keygene N.V. | Duplex sequencing with covalently closed dna ends |
| WO2024209000A1 (en) | 2023-04-04 | 2024-10-10 | Keygene N.V. | Linkers for duplex sequencing |
Family Cites Families (98)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US24939A (en) | 1859-08-02 | Improvement in sewing-machines | ||
| EP0124990B1 (en) | 1983-04-28 | 1987-08-19 | Flexible Steel Lacing Company | Method and apparatus for riveting fasteners to a belt |
| WO1990008821A1 (en) | 1989-01-31 | 1990-08-09 | University Of Miami | Microdissection and amplification of chromosomal dna |
| HU223760B1 (hu) | 1991-09-24 | 2005-01-28 | Keygene N.V. | Szelektív restrikciós fragmentumsokszorosítás, általános módszer DNS-fingerprint analízisére |
| US20100267023A1 (en) | 1992-09-24 | 2010-10-21 | Keygene N.V. | Selective restriction fragment amplification: fingerprinting |
| WO1995019697A1 (en) | 1994-01-21 | 1995-07-27 | North Carolina State University | Methods for within family selection in woody perennials using genetic markers |
| EG23907A (en) * | 1994-08-01 | 2007-12-30 | Delta & Pine Land Co | Control of plant gene expression |
| US6013445A (en) | 1996-06-06 | 2000-01-11 | Lynx Therapeutics, Inc. | Massively parallel signature sequencing by ligation of encoded adaptors |
| EP0804618B1 (en) | 1994-11-28 | 1999-01-27 | E.I. Du Pont De Nemours And Company | Compound microsatellite primers for the detection of genetic polymorphisms |
| US5565340A (en) | 1995-01-27 | 1996-10-15 | Clontech Laboratories, Inc. | Method for suppressing DNA fragment amplification during PCR |
| CA2286864A1 (en) | 1997-01-10 | 1998-07-16 | Pioneer Hi-Bred International, Inc. | Hybridization-based genetic amplification and analysis |
| US6090556A (en) | 1997-04-07 | 2000-07-18 | Japan Science & Technology Corporation | Method for quantitatively determining the expression of a gene |
| JP2001515362A (ja) | 1997-05-13 | 2001-09-18 | ディスプレイ・システムズ・バイオテック・アクティーゼルスカブ | mRNAをクローニングする方法および差次的に発現された転写物のディスプレイ(DODET) |
| ES2290979T3 (es) | 1997-12-15 | 2008-02-16 | Csl Behring Gmbh | Cebador marcado para uso en la deteccion de acidos nucleicos diana. |
| CA2273616A1 (en) * | 1998-06-08 | 1999-12-08 | The Board Of Trustees Of The Leland Stanford Junior University | Method for parallel screening of allelic variation |
| US6124201A (en) | 1998-06-12 | 2000-09-26 | Advanced Micro Devices, Inc. | Method for manufacturing semiconductors with self-aligning vias |
| ATE236997T1 (de) | 1998-07-21 | 2003-04-15 | Keygene Nv | Verbesserte primer zur aflp amplifizierung |
| DE69816286T2 (de) * | 1998-07-29 | 2004-05-27 | Keygene N.V. | Verfahren zur Erkennung von Nukleinsäuremethylierungen durch AFLP |
| US6232067B1 (en) * | 1998-08-17 | 2001-05-15 | The Perkin-Elmer Corporation | Adapter directed expression analysis |
| US6703228B1 (en) | 1998-09-25 | 2004-03-09 | Massachusetts Institute Of Technology | Methods and products related to genotyping and DNA analysis |
| EP1001037A3 (en) | 1998-09-28 | 2003-10-01 | Whitehead Institute For Biomedical Research | Pre-selection and isolation of single nucleotide polymorphisms |
| WO2000024939A1 (en) | 1998-10-27 | 2000-05-04 | Affymetrix, Inc. | Complexity management and analysis of genomic dna |
| US6480791B1 (en) | 1998-10-28 | 2002-11-12 | Michael P. Strathmann | Parallel methods for genomic analysis |
| WO2000040755A2 (en) | 1999-01-06 | 2000-07-13 | Cornell Research Foundation, Inc. | Method for accelerating identification of single nucleotide polymorphisms and alignment of clones in genomic sequencing |
| US20040029155A1 (en) | 1999-01-08 | 2004-02-12 | Curagen Corporation | Method for identifying a biomolecule |
| ATE247465T1 (de) | 1999-01-12 | 2003-09-15 | Quanam Medical Corp | Arzneimittel und verfahren zur verabreichung von wasserunlöslichen paclitaxelderivaten |
| DE19911130A1 (de) | 1999-03-12 | 2000-09-21 | Hager Joerg | Verfahren zur Identifikation chromosomaler Regionen und Gene |
| AU778438B2 (en) | 1999-04-06 | 2004-12-02 | Yale University | Fixed address analysis of sequence tags |
| CA2366365A1 (en) | 1999-04-09 | 2000-10-19 | Keygene N.V. | Method for the analysis of aflp reaction mixtures using primer exte nsion techniques |
| US20040031072A1 (en) | 1999-05-06 | 2004-02-12 | La Rosa Thomas J. | Soy nucleic acid molecules and other molecules associated with transcription plants and uses thereof for plant improvement |
| US20020119448A1 (en) * | 1999-06-23 | 2002-08-29 | Joseph A. Sorge | Methods of enriching for and identifying polymorphisms |
| US20030204075A9 (en) | 1999-08-09 | 2003-10-30 | The Snp Consortium | Identification and mapping of single nucleotide polymorphisms in the human genome |
| AU7712400A (en) | 1999-09-23 | 2001-04-24 | Gene Logic, Inc. | Indexing populations |
| US6287778B1 (en) | 1999-10-19 | 2001-09-11 | Affymetrix, Inc. | Allele detection using primer extension with sequence-coded identity tags |
| US6958225B2 (en) | 1999-10-27 | 2005-10-25 | Affymetrix, Inc. | Complexity management of genomic DNA |
| WO2001038572A1 (fr) | 1999-11-19 | 2001-05-31 | Takara Bio Inc. | Methode d'amplification d'acides nucleiques |
| AU2001253063A1 (en) | 2000-03-31 | 2001-10-15 | Fred Hutchinson Cancer Research Center | Reverse genetic strategy for identifying functional mutations in genes of known sequence |
| US20110131679A2 (en) | 2000-04-19 | 2011-06-02 | Thomas La Rosa | Rice Nucleic Acid Molecules and Other Molecules Associated with Plants and Uses Thereof for Plant Improvement |
| WO2001088189A2 (en) | 2000-05-15 | 2001-11-22 | Keygene N.V. | Microsatellite-aflp® |
| US7300751B2 (en) | 2000-06-30 | 2007-11-27 | Syngenta Participations Ag | Method for identification of genetic markers |
| GB0016742D0 (en) | 2000-07-10 | 2000-08-30 | Simeg Limited | Diagnostic method |
| US6858412B2 (en) | 2000-10-24 | 2005-02-22 | The Board Of Trustees Of The Leland Stanford Junior University | Direct multiplex characterization of genomic DNA |
| CN100351393C (zh) * | 2001-02-15 | 2007-11-28 | 宝生物工程株式会社 | 核苷酸多态性的检测方法 |
| US7141364B1 (en) | 2001-03-29 | 2006-11-28 | Council Of Scientific And Industrial Research | Universal primers for wildlife identification |
| US20040053236A1 (en) | 2001-03-30 | 2004-03-18 | Mccallum Claire M. | Reverse genetic strategy for identifying functional mutations in genes of known sequences |
| WO2002083911A1 (en) | 2001-04-12 | 2002-10-24 | MAX-PLANCK-Gesellschaft zur Förderung der Wissenschaften e.V. | Production of plants with increased tolerance to drought stress or with increased transpiration |
| EP1386005A1 (en) | 2001-04-20 | 2004-02-04 | Karolinska Innovations AB | Methods for high throughput genome analysis using restriction site tagged microarrays |
| JP2005520484A (ja) | 2001-07-06 | 2005-07-14 | 454 コーポレイション | 多孔性フィルターを使用し、独立した並行する化学的微量反応を隔離するための方法 |
| AU2002323509A1 (en) | 2001-08-30 | 2003-03-18 | Purdue Research Foundation | Methods to produce transgenic plants resistant to osmotic stress |
| EP1288301A1 (en) | 2001-08-31 | 2003-03-05 | Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. Berlin | Plant-derived resistance gene |
| US6902921B2 (en) | 2001-10-30 | 2005-06-07 | 454 Corporation | Sulfurylase-luciferase fusion proteins and thermostable sulfurylase |
| US7504222B2 (en) * | 2001-10-31 | 2009-03-17 | Millennium Pharmaceuticals, Inc. | Compositions, kits, and methods for identification, assessment, prevention, and therapy of breast cancer |
| CA2498668C (en) | 2002-03-27 | 2012-05-08 | Agrinomics Llc | Generation of plants with improved drought tolerance |
| US6815167B2 (en) | 2002-04-25 | 2004-11-09 | Geneohm Sciences | Amplification of DNA to produce single-stranded product of defined sequence and length |
| US20070065816A1 (en) | 2002-05-17 | 2007-03-22 | Affymetrix, Inc. | Methods for genotyping |
| US7108976B2 (en) | 2002-06-17 | 2006-09-19 | Affymetrix, Inc. | Complexity management of genomic DNA by locus specific amplification |
| AU2003243720A1 (en) | 2002-06-21 | 2004-01-06 | Bayer Bioscience N.V. | Method for detecting foreign dna in a host genome |
| AU2003260790A1 (en) * | 2002-09-05 | 2004-03-29 | Plant Bioscience Limited | Genome partitioning |
| US20040157238A1 (en) | 2002-09-20 | 2004-08-12 | Quinn John J. | Method for detection of multiple nucleic acid sequence variations |
| AU2003297541A1 (en) | 2002-12-18 | 2004-07-14 | Third Wave Technologies, Inc. | Detection of small nucleic acids |
| JP2004208586A (ja) | 2002-12-27 | 2004-07-29 | Wakunaga Pharmaceut Co Ltd | Hlaの検出 |
| WO2004063323A2 (en) | 2003-01-10 | 2004-07-29 | Keygene N.V. | Aflp-based method for integrating physical and genetic maps |
| US7575865B2 (en) * | 2003-01-29 | 2009-08-18 | 454 Life Sciences Corporation | Methods of amplifying and sequencing nucleic acids |
| CA2513535C (en) | 2003-01-29 | 2012-06-12 | 454 Corporation | Bead emulsion nucleic acid amplification |
| JP4691014B2 (ja) | 2003-02-26 | 2011-06-01 | カリダ ゲノミクス,インコーポレーテッド | ハイブリダイゼーションによるランダムアレイdna分析 |
| JP4888876B2 (ja) | 2003-06-13 | 2012-02-29 | 田平 武 | アルツハイマー病の治療のための組換えアデノ随伴ウィルスベクター |
| DE602004032374D1 (de) | 2003-06-24 | 2011-06-01 | Agrigenetics Inc | Erzeugung von pflanzen mit verbesserter toleranz gegenüber trockenheit |
| US7754945B2 (en) | 2003-06-24 | 2010-07-13 | Agrigenetics Inc. | Generation of plants with improved drought tolerance |
| US7051935B2 (en) | 2003-07-28 | 2006-05-30 | Imageid Ltd. | Color calibration for color bar codes |
| WO2005026686A2 (en) | 2003-09-09 | 2005-03-24 | Compass Genetics, Llc | Multiplexed analytical platform |
| EP2302062A1 (en) | 2003-10-20 | 2011-03-30 | CropDesign N.V. | Identification of E2F target genes and uses thereof |
| CA2543786A1 (en) | 2003-10-24 | 2005-05-06 | Mmi Genomics, Inc. | Methods and systems for inferring traits to manage non-beef livestock |
| JP2007525571A (ja) | 2004-01-07 | 2007-09-06 | ソレクサ リミテッド | 修飾分子アレイ |
| US20050233354A1 (en) | 2004-01-22 | 2005-10-20 | Affymetrix, Inc. | Genotyping degraded or mitochandrial DNA samples |
| EP1713936B1 (en) | 2004-02-12 | 2009-12-09 | Population Genetics Technologies Ltd Corporation of Great Britain | Genetic analysis by sequence-specific sorting |
| EP1721014B1 (en) | 2004-02-18 | 2013-07-17 | Trustees Of Boston University | Method for detecting and quantifying rare mutations/polymorphisms |
| EP1574585A1 (en) * | 2004-03-12 | 2005-09-14 | Plant Research International B.V. | Method for selective amplification of DNA fragments for genetic fingerprinting |
| US20090042183A1 (en) * | 2004-07-28 | 2009-02-12 | Hirsch Ann M | Use of pcr-based techniques to analyze compositions of botanicals |
| JP4809594B2 (ja) | 2004-08-02 | 2011-11-09 | 東京エレクトロン株式会社 | 検査装置 |
| FR2876479B1 (fr) | 2004-10-11 | 2006-12-15 | Parkeon | Machine a pieces a receptacle de pieces de monnaie amovible |
| US7220549B2 (en) | 2004-12-30 | 2007-05-22 | Helicos Biosciences Corporation | Stabilizing a nucleic acid for nucleic acid sequencing |
| US7393665B2 (en) | 2005-02-10 | 2008-07-01 | Population Genetics Technologies Ltd | Methods and compositions for tagging and identifying polynucleotides |
| US7407757B2 (en) | 2005-02-10 | 2008-08-05 | Population Genetics Technologies | Genetic analysis by sequence-specific sorting |
| US9365893B2 (en) | 2005-05-10 | 2016-06-14 | State Of Oregon Acting By And Through The State Board Of Higher Education On Behalf Of The University Of Oregon | Methods of mapping polymorphisms and polymorphism microarrays |
| EP1907571B1 (en) | 2005-06-15 | 2017-04-26 | Complete Genomics Inc. | Nucleic acid analysis by random mixtures of non-overlapping fragments |
| WO2006137733A1 (en) | 2005-06-23 | 2006-12-28 | Keygene N.V. | Strategies for high throughput identification and detection of polymorphisms |
| CA2613248A1 (en) | 2005-06-23 | 2006-12-28 | Keygene N.V. | Improved strategies for sequencing complex genomes using high throughput sequencing technologies |
| US20070020640A1 (en) | 2005-07-21 | 2007-01-25 | Mccloskey Megan L | Molecular encoding of nucleic acid templates for PCR and other forms of sequence analysis |
| AU2006295556B2 (en) | 2005-09-29 | 2012-07-05 | Keygene N.V. | High throughput screening of mutagenized populations |
| US10316364B2 (en) | 2005-09-29 | 2019-06-11 | Keygene N.V. | Method for identifying the source of an amplicon |
| US8071310B2 (en) | 2005-11-14 | 2011-12-06 | Keygene Nv | Method for the high throughput screening of transposon tagging populations and massive parallel sequence identification of insertion sites |
| DK3404114T3 (da) * | 2005-12-22 | 2021-06-28 | Keygene Nv | Fremgangsmåde til detektering af AFLP-baseret polymorfisme med højt gennemløb |
| US7537897B2 (en) | 2006-01-23 | 2009-05-26 | Population Genetics Technologies, Ltd. | Molecular counting |
| WO2007114693A2 (en) | 2006-04-04 | 2007-10-11 | Keygene N.V. | High throughput detection of molecular markers based on aflp and high throughput sequencing |
| US8362325B2 (en) | 2007-10-03 | 2013-01-29 | Ceres, Inc. | Nucleotide sequences and corresponding polypeptides conferring modulated plant characteristics |
| US20090124758A1 (en) | 2007-11-09 | 2009-05-14 | Bridgestone Sports Co., Ltd. | Golf ball |
| US20140051585A1 (en) * | 2012-08-15 | 2014-02-20 | Natera, Inc. | Methods and compositions for reducing genetic library contamination |
| WO2014196863A1 (en) | 2013-06-07 | 2014-12-11 | Keygene N.V. | Method for targeted sequencing |
-
2006
- 2006-06-23 WO PCT/NL2006/000311 patent/WO2006137733A1/en not_active Ceased
- 2006-06-23 CN CN201510522246.XA patent/CN105039313B/zh active Active
- 2006-06-23 DE DE602006018744T patent/DE602006018744D1/de active Active
- 2006-06-23 CN CN200680025630.8A patent/CN101641449B/zh active Active
- 2006-06-23 JP JP2008518056A patent/JP5220597B2/ja active Active
- 2006-06-23 CN CN201210390998.1A patent/CN102925561B/zh active Active
- 2006-06-23 EP EP20100075564 patent/EP2302070B1/en active Active
- 2006-06-23 AT AT10184351T patent/ATE557105T1/de active
- 2006-06-23 DK DK10075564T patent/DK2302070T3/da active
- 2006-06-23 ES ES10075564T patent/ES2393318T3/es active Active
- 2006-06-23 ES ES10184351T patent/ES2387878T3/es active Active
- 2006-06-23 EP EP06757808A patent/EP1910562B1/en active Active
- 2006-06-23 AT AT06757808T patent/ATE491045T1/de not_active IP Right Cessation
- 2006-06-23 DK DK10184351T patent/DK2292788T3/da active
- 2006-06-23 US US11/993,945 patent/US8785353B2/en active Active
- 2006-06-23 EP EP20100184351 patent/EP2292788B1/en active Active
-
2012
- 2012-04-18 US US13/449,611 patent/US8685889B2/en active Active
-
2013
- 2013-01-17 JP JP2013006095A patent/JP5823994B2/ja active Active
-
2014
- 2014-01-28 US US14/166,218 patent/US9447459B2/en active Active
- 2014-04-15 US US14/253,806 patent/US9023768B2/en active Active
-
2015
- 2015-02-19 US US14/626,822 patent/US9493820B2/en active Active
- 2015-10-16 US US14/885,063 patent/US9376716B2/en active Active
-
2016
- 2016-01-28 US US15/009,304 patent/US9453256B2/en active Active
- 2016-11-14 US US15/350,441 patent/US9896721B2/en active Active
-
2017
- 2017-03-23 US US15/467,241 patent/US9898576B2/en active Active
- 2017-10-10 US US15/729,328 patent/US9898577B2/en active Active
-
2018
- 2018-01-05 US US15/862,956 patent/US10095832B2/en active Active
- 2018-04-24 US US15/961,512 patent/US10235494B2/en active Active
- 2018-11-01 US US16/178,344 patent/US20190147977A1/en not_active Abandoned
-
2019
- 2019-07-19 US US16/517,411 patent/US10978175B2/en active Active
-
2021
- 2021-03-11 US US17/199,164 patent/US20210202035A1/en not_active Abandoned
Also Published As
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| ES2393318T3 (es) | Estrategias para la identificación y detección de alto rendimiento de polimorfismos | |
| ES2357549T3 (es) | Estrategias para la identificación y detección de alto rendimiento de polimorfismos. | |
| ES2882401T3 (es) | Método de detección de polimorfismos basado en AFLP de alto rendimiento | |
| HK1200497B (en) | Method for high-throughput aflp-based polymorphism detection |