ES2292467T3 - Procedimiento para identificar cambios significativos desde el punto de vista evolutivo en secuencias de polinucleotidos y de polipeptidos en plantas y animales domesticados. - Google Patents
Procedimiento para identificar cambios significativos desde el punto de vista evolutivo en secuencias de polinucleotidos y de polipeptidos en plantas y animales domesticados. Download PDFInfo
- Publication number
- ES2292467T3 ES2292467T3 ES00960208T ES00960208T ES2292467T3 ES 2292467 T3 ES2292467 T3 ES 2292467T3 ES 00960208 T ES00960208 T ES 00960208T ES 00960208 T ES00960208 T ES 00960208T ES 2292467 T3 ES2292467 T3 ES 2292467T3
- Authority
- ES
- Spain
- Prior art keywords
- domesticated
- sequence
- sequences
- organism
- polynucleotide
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims abstract description 123
- 108090000765 processed proteins & peptides Proteins 0.000 title claims abstract description 77
- 102000004196 processed proteins & peptides Human genes 0.000 title claims abstract description 73
- 229920001184 polypeptide Polymers 0.000 title claims abstract description 72
- 241001465754 Metazoa Species 0.000 title claims abstract description 42
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 195
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 80
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 80
- 239000002157 polynucleotide Substances 0.000 claims abstract description 80
- 239000003795 chemical substances by application Substances 0.000 claims description 79
- 102000004169 proteins and genes Human genes 0.000 claims description 73
- 230000006870 function Effects 0.000 claims description 55
- 230000008859 change Effects 0.000 claims description 54
- 241000196324 Embryophyta Species 0.000 claims description 52
- 239000002299 complementary DNA Substances 0.000 claims description 48
- 239000002773 nucleotide Substances 0.000 claims description 42
- 125000003729 nucleotide group Chemical group 0.000 claims description 42
- 240000008042 Zea mays Species 0.000 claims description 40
- 235000002017 Zea mays subsp mays Nutrition 0.000 claims description 38
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 claims description 32
- 235000005822 corn Nutrition 0.000 claims description 32
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 claims description 25
- 230000000694 effects Effects 0.000 claims description 23
- 235000007241 Zea diploperennis Nutrition 0.000 claims description 19
- 235000017556 Zea mays subsp parviglumis Nutrition 0.000 claims description 19
- 241000172407 Zea mays subsp. huehuetenangensis Species 0.000 claims description 19
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 16
- 230000002068 genetic effect Effects 0.000 claims description 14
- 230000009261 transgenic effect Effects 0.000 claims description 12
- 238000011161 development Methods 0.000 claims description 9
- 230000018109 developmental process Effects 0.000 claims description 9
- 235000007164 Oryza sativa Nutrition 0.000 claims description 7
- 235000009566 rice Nutrition 0.000 claims description 7
- 201000010099 disease Diseases 0.000 claims description 6
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 6
- 230000017260 vegetative to reproductive phase transition of meristem Effects 0.000 claims description 6
- 241000283690 Bos taurus Species 0.000 claims description 5
- 208000035240 Disease Resistance Diseases 0.000 claims description 5
- 235000007688 Lycopersicon esculentum Nutrition 0.000 claims description 5
- 240000003768 Solanum lycopersicum Species 0.000 claims description 5
- 244000061456 Solanum tuberosum Species 0.000 claims description 5
- 235000002595 Solanum tuberosum Nutrition 0.000 claims description 5
- 230000036961 partial effect Effects 0.000 claims description 5
- 241000282326 Felis catus Species 0.000 claims description 4
- 230000008827 biological function Effects 0.000 claims description 4
- 241000283073 Equus caballus Species 0.000 claims description 3
- 230000035558 fertility Effects 0.000 claims description 3
- 238000004519 manufacturing process Methods 0.000 claims description 3
- 239000008267 milk Substances 0.000 claims description 3
- 210000004080 milk Anatomy 0.000 claims description 3
- 235000013336 milk Nutrition 0.000 claims description 3
- 240000007594 Oryza sativa Species 0.000 claims 1
- 241000009328 Perro Species 0.000 claims 1
- 239000000796 flavoring agent Substances 0.000 claims 1
- 235000019634 flavors Nutrition 0.000 claims 1
- 230000002708 enhancing effect Effects 0.000 abstract 1
- 210000004027 cell Anatomy 0.000 description 42
- 230000014509 gene expression Effects 0.000 description 36
- 241000894007 species Species 0.000 description 35
- 238000006467 substitution reaction Methods 0.000 description 35
- 238000004458 analytical method Methods 0.000 description 31
- 230000003044 adaptive effect Effects 0.000 description 20
- 108020004999 messenger RNA Proteins 0.000 description 19
- 238000012360 testing method Methods 0.000 description 19
- 230000027455 binding Effects 0.000 description 18
- 238000012163 sequencing technique Methods 0.000 description 18
- 239000003446 ligand Substances 0.000 description 17
- 210000001519 tissue Anatomy 0.000 description 17
- 150000001875 compounds Chemical class 0.000 description 16
- 238000013519 translation Methods 0.000 description 16
- 230000014616 translation Effects 0.000 description 16
- 238000013518 transcription Methods 0.000 description 14
- 230000035897 transcription Effects 0.000 description 14
- 238000003556 assay Methods 0.000 description 11
- 150000001413 amino acids Chemical class 0.000 description 10
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 9
- 108091026890 Coding region Proteins 0.000 description 9
- 230000003993 interaction Effects 0.000 description 9
- 239000000047 product Substances 0.000 description 9
- 238000012512 characterization method Methods 0.000 description 8
- 238000000338 in vitro Methods 0.000 description 8
- 241000209094 Oryza Species 0.000 description 7
- 244000038559 crop plants Species 0.000 description 7
- 238000012423 maintenance Methods 0.000 description 6
- 235000009973 maize Nutrition 0.000 description 6
- 238000010187 selection method Methods 0.000 description 6
- 230000035945 sensitivity Effects 0.000 description 6
- 108020004635 Complementary DNA Proteins 0.000 description 5
- 108020004414 DNA Proteins 0.000 description 5
- 241000282412 Homo Species 0.000 description 5
- 241000209140 Triticum Species 0.000 description 5
- 235000021307 Triticum Nutrition 0.000 description 5
- 238000010276 construction Methods 0.000 description 5
- 230000007935 neutral effect Effects 0.000 description 5
- 238000002360 preparation method Methods 0.000 description 5
- 239000000523 sample Substances 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- 241000283086 Equidae Species 0.000 description 4
- 108091092195 Intron Proteins 0.000 description 4
- 108091034117 Oligonucleotide Proteins 0.000 description 4
- 240000006394 Sorghum bicolor Species 0.000 description 4
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 4
- 125000003275 alpha amino acid group Chemical group 0.000 description 4
- 238000009396 hybridization Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000010839 reverse transcription Methods 0.000 description 4
- 238000012109 statistical procedure Methods 0.000 description 4
- 108700028369 Alleles Proteins 0.000 description 3
- 241000282472 Canis lupus familiaris Species 0.000 description 3
- 241000209504 Poaceae Species 0.000 description 3
- 244000062793 Sorghum vulgare Species 0.000 description 3
- 241000282887 Suidae Species 0.000 description 3
- 108091023040 Transcription factor Proteins 0.000 description 3
- 102000040945 Transcription factor Human genes 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000000052 comparative effect Effects 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 229940079593 drug Drugs 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 238000009510 drug design Methods 0.000 description 3
- 210000003527 eukaryotic cell Anatomy 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000001727 in vivo Methods 0.000 description 3
- 238000005462 in vivo assay Methods 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 235000019713 millet Nutrition 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 238000010369 molecular cloning Methods 0.000 description 3
- 230000035772 mutation Effects 0.000 description 3
- 210000000056 organ Anatomy 0.000 description 3
- 235000012015 potatoes Nutrition 0.000 description 3
- 230000004853 protein function Effects 0.000 description 3
- 230000001105 regulatory effect Effects 0.000 description 3
- 238000012353 t test Methods 0.000 description 3
- 241000837181 Andina Species 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- 241001057636 Dracaena deremensis Species 0.000 description 2
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 2
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 2
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- 108010038807 Oligopeptides Proteins 0.000 description 2
- 102000015636 Oligopeptides Human genes 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- 101710096328 Phospholipase A2 Proteins 0.000 description 2
- 241000288906 Primates Species 0.000 description 2
- 241000283984 Rodentia Species 0.000 description 2
- 238000000692 Student's t-test Methods 0.000 description 2
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000001311 chemical methods and process Methods 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 239000013599 cloning vector Substances 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 108020001507 fusion proteins Proteins 0.000 description 2
- 102000037865 fusion proteins Human genes 0.000 description 2
- 239000005090 green fluorescent protein Substances 0.000 description 2
- 238000001114 immunoprecipitation Methods 0.000 description 2
- 238000000099 in vitro assay Methods 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 238000004806 packaging method and process Methods 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000007894 restriction fragment length polymorphism technique Methods 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 238000009394 selective breeding Methods 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 210000002027 skeletal muscle Anatomy 0.000 description 2
- 235000013599 spices Nutrition 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 238000001890 transfection Methods 0.000 description 2
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- 241000209148 Aegilops speltoides Species 0.000 description 1
- 241001522110 Aegilops tauschii Species 0.000 description 1
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 1
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 1
- 241000270728 Alligator Species 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 108010059892 Cellulase Proteins 0.000 description 1
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 1
- 241000257465 Echinoidea Species 0.000 description 1
- 244000148064 Enicostema verticillatum Species 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 108091060211 Expressed sequence tag Proteins 0.000 description 1
- 108010044091 Globulins Proteins 0.000 description 1
- 102000006395 Globulins Human genes 0.000 description 1
- 108060003951 Immunoglobulin Proteins 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 108700005089 MHC Class I Genes Proteins 0.000 description 1
- 102000016943 Muramidase Human genes 0.000 description 1
- 108010014251 Muramidase Proteins 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 1
- 244000118056 Oryza rufipogon Species 0.000 description 1
- 238000010222 PCR analysis Methods 0.000 description 1
- 108700001094 Plant Genes Proteins 0.000 description 1
- 208000020584 Polyploidy Diseases 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 101150059736 SRY gene Proteins 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 241000555745 Sciuridae Species 0.000 description 1
- 241000270295 Serpentes Species 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 240000000581 Triticum monococcum Species 0.000 description 1
- 235000007251 Triticum monococcum Nutrition 0.000 description 1
- 241000209149 Zea Species 0.000 description 1
- 235000007244 Zea mays Nutrition 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- 230000003466 anti-cipated effect Effects 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- 102000005936 beta-Galactosidase Human genes 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 230000003915 cell function Effects 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008614 cellular interaction Effects 0.000 description 1
- 229940106157 cellulase Drugs 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 108091036078 conserved sequence Proteins 0.000 description 1
- 239000013068 control sample Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000003431 cross linking reagent Substances 0.000 description 1
- 231100000135 cytotoxicity Toxicity 0.000 description 1
- 230000003013 cytotoxicity Effects 0.000 description 1
- 231100000263 cytotoxicity test Toxicity 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 238000006471 dimerization reaction Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 229940088598 enzyme Drugs 0.000 description 1
- 238000001952 enzyme assay Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 238000000198 fluorescence anisotropy Methods 0.000 description 1
- 238000011990 functional testing Methods 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 230000004545 gene duplication Effects 0.000 description 1
- 230000008570 general process Effects 0.000 description 1
- 230000008303 genetic mechanism Effects 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 238000010562 histological examination Methods 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 102000018358 immunoglobulin Human genes 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 229960000274 lysozyme Drugs 0.000 description 1
- 235000010335 lysozyme Nutrition 0.000 description 1
- 239000004325 lysozyme Substances 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 230000009456 molecular mechanism Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 230000009871 nonspecific binding Effects 0.000 description 1
- 150000007523 nucleic acids Chemical group 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 238000002515 oligonucleotide synthesis Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 238000013081 phylogenetic analysis Methods 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 230000001766 physiological effect Effects 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 244000062645 predators Species 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000002818 protein evolution Methods 0.000 description 1
- 238000000734 protein sequencing Methods 0.000 description 1
- 230000004850 protein–protein interaction Effects 0.000 description 1
- 238000002708 random mutagenesis Methods 0.000 description 1
- 230000001850 reproductive effect Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 230000019491 signal transduction Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000000528 statistical test Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B40/00—Libraries per se, e.g. arrays, mixtures
- C40B40/02—Libraries contained in or displayed by microorganisms, e.g. bacteria or animal cells; Libraries contained in or displayed by vectors, e.g. plasmids; Libraries containing only microorganisms or vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1037—Screening libraries presented on the surface of microorganisms, e.g. phage display, E. coli display
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B10/00—ICT specially adapted for evolutionary bioinformatics, e.g. phylogenetic tree construction or analysis
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Biophysics (AREA)
- Zoology (AREA)
- General Health & Medical Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Microbiology (AREA)
- Analytical Chemistry (AREA)
- Bioinformatics & Computational Biology (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Medical Informatics (AREA)
- Evolutionary Biology (AREA)
- Plant Pathology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Immunology (AREA)
- Virology (AREA)
- General Chemical & Material Sciences (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Medicinal Chemistry (AREA)
- Peptides Or Proteins (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
Abstract
Procedimiento para identificar una secuencia de polinucleótido que codifica para un polipéptido de un organismo domesticado, en el que dicho polipéptido puede estar asociado con un rasgo estética o comercialmente relevante que es único, está potenciado o alterado en el organismo domesticado en comparación con un ancestro de tipo natural de dicho organismo domesticado, que comprende: (a) comparar secuencias de nucleótidos que codifican para proteínas de dicho organismo domesticado con secuencias de nucleótidos que codifican para proteínas de dicho ancestro de tipo natural; y (b) seleccionar una secuencia de polinucleótido que codifica para proteínas en el organismo domesticado que contiene un cambio de nucleótido que es significativo desde el punto de vista evolutivo en comparación con una secuencia correspondiente en el ancestro de tipo natural, tal como se define mediante una razón (Ka/Ks) de la tasa de sustitución no sinónima (Ka) con respecto a la tasa de sustitución sinónima (Ks), en la secuencia de polinucleótido que codifica para proteínas parcial o completa, de >= 0, 75.
Description
Procedimientos para identificar cambios
significativos desde el punto de vista evolutivo en secuencias de
polinucleótidos y de polipéptidos en plantas y animales
domesticados.
La presente invención se refiere a utilizar
técnicas moleculares y evolutivas para identificar secuencias de
polinucleótidos y de polipéptidos que corresponden a rasgos estética
o comercialmente relevantes en plantas y animales domesticados.
Los seres humanos han cultivado plantas y han
criado animales durante miles de años, seleccionando ciertos rasgos
comercialmente valiosos y/o estéticos. Las plantas domesticadas
difieren de sus ancestros de tipo natural en rasgos tales como el
rendimiento, floración de día de duración corta, contenido en
proteínas y/o en aceite, facilidad de recolección, sabor,
resistencia a la enfermedad y resistencia a la sequía. Los animales
domesticados difieren de sus ancestros de tipo natural en rasgos
tales como el contenido en grasas y/o en proteínas, producción de
leche, docilidad, fecundidad y tiempo hasta el pleno desarrollo. En
la actualidad, la mayoría de los genes subyacentes a las
diferencias anteriores no se conocen, ni tan poco lo son, con la
misma importancia, los cambios específicos que han evolucionado en
estos genes para proporcionar estas capacidades. El entendimiento
de la base de estas diferencias entre plantas y animales
domesticados y sus ancestros de tipo natural proporcionará
información útil para mantener y potenciar estos rasgos. En el caso
de las plantas de cultivo, la identificación de los genes
específicos que controlan los rasgos deseados permitirá una mejora
rápida y directa de una manera no posible anteriormente.
Aunque la comparación de proteínas o genes
homólogos entre especies domesticadas y sus ancestros de tipo
natural puede proporcionar información útil con respecto a las
secuencias moleculares conservadas y las rasgos distintivos
funcionales, este enfoque es de uso limitado para identificar genes
cuyas secuencias han cambiado debido a presiones selectivas
impuestas por el ser humano. Con la llegada de procedimientos
analíticos y algoritmos sofisticados, puede sacarse mucha más
información de los cambios en la secuencia de ADN en lo que respecta
a qué genes se han seleccionado positivamente. El más potente de
estos procedimientos, "K_{A}/K_{S}," implica comparaciones
por parejas entre secuencias de nucleótidos alineadas que codifican
para proteínas de las razones de
\frac{\text{sustituciones de
nucleótido no sinónimas por sitio no sinónimo} \
(K_{A})}{\text{sustituciones sinónimas por sitio sinónimo} \
(K_{S})}
(en las que no sinónimas significa
sustituciones que cambian el aminoácido codificado y sinónimas
significa sustituciones que no cambian el aminoácido codificado).
Los "procedimientos de tipo K_{A}/K_{S}" incluyen éste y
procedimientos
similares.
Estos procedimientos ya se han usado para
demostrar la aparición de una selección darwiniana (es decir,
natural) positiva a nivel molecular, que da como resultado
diferencias de aminoácido en proteínas homólogas. Varios grupos han
usado tales procedimientos para documentar que una proteína
particular ha evolucionado más rápidamente que la tasa de
sustitución neutra, y por tanto apoya la existencia de una selección
darwiniana positiva a nivel molecular. Por ejemplo, McDonald y
Kreitman (1991) Nature 351:652-654, proponen
una prueba estadística de hipótesis de evolución proteica neutra
basada en la comparación del número de sustituciones con reemplazo
de aminoácido con respecto a sustituciones sinónimas en la región
codificante de un locus. Cuando aplican esta prueba al locus
Adh de tres especies de Drosophila, concluyen que
entonces se muestra que el locus ha experimentado una fijación
adaptativa de mutaciones selectivamente ventajosas y que la fijación
selectiva de mutaciones adaptativas puede ser una alternativa
viable a la acumulación con precisión de reloj de mutaciones
neutras como una explicación para la evolución de la mayoría de las
proteínas. Jenkins et al. (1995) Proc. R. Soc. Lond.
B 261:203-207 usan la prueba de McDonald y
Kreitman para investigar si se produce una evolución adaptativa en
secuencias que controlan la transcripción (secuencias no
codificantes).
Nakashima et al. (1995) Proc. Natl.
Acad. Sci USA 92:5606-5609, usan el
procedimiento de Miyata y Yasunaga para llevar a cabo comparaciones
por parejas de las secuencias de nucleótidos de diez genes de
isozima de PLA2 de dos especies de serpiente; este procedimiento
implica comparar el número de sustituciones de nucleótido por sitio
para las regiones no codificantes incluyendo los intrones (K_{N})
y las K_{A} y K_{S}. Concluyen que las regiones que codifican
para proteínas han evolucionado a tasas mucho mayores que las
regiones no codificantes incluyendo los intrones. La tasa de
sustitución sumamente acelerada es responsable de la evolución
darwiniana a nivel molecular de los genes de isozima de PLA2 para
producir nuevas actividades fisiológicas que deben haber
proporcionado una fuerte ventaja selectiva para cazar presas o para
la defensa frente a depredadores. Endo et al. (1996) Mol.
Biol. Evol. 13(5):685-690 usan el
procedimiento de Nei y Gojobori, en el que d_{N} es el número de
sustituciones no sinónimas y d_{S} es el número de sustituciones
sinónimas, para el fin de identificar genes candidatos en los que
funciona la selección positiva natural. Metz y Palumbi (1996)
Mol. Biol. Evol. 13(2):397-406 usan la
prueba de McDonald y Kreitman (citada anteriormente) así como un
procedimiento atribuido a Nei y Gojobori, Nei y Jin, y Kumar,
Tamura, y Nei; que examina las proporciones promedio de P_{n},
las sustituciones con reemplazo por sitio de reemplazo, y P_{s},
las sustituciones silenciosas por sitio silencioso, para buscar
pruebas de la selección positiva en genes de unión en erizos
marinos para investigar si han evolucionado rápidamente como un
preludio de la formación de especie. Goodwin et al. (1996)
Mol. Biol. Evol. 13(2):346-358 usan
procedimientos similares para examinar la evolución de una familia
de genes murinos particular y concluyen que los procedimientos
proporcionan una comprensión fundamental importante sobre cómo la
selección dirige la divergencia genética en un sistema
experimentalmente manipulable. Edwards et al. (1995) usan
cebadores degenerados para extraer locus del MHC de varias
especies de pájaros y un especie de caimán, que entonces se analizan
mediante los procedimientos de Nei y Gojobori (razones
d_{N}:d_{S}) para extender los estudios de MHC a
vertebrados no mamíferos. Whitfield et al. (1993)
Nature 364:713-715 usan el análisis de
K_{A}/K_{S} para buscar la selección direccional en las
regiones que flanquean una región conservada en el gen SRY
(que determina el sexo masculino). Sugieren que la rápida evolución
de SRY podría ser una causa significativa del aislamiento
reproductor, conduciendo a nuevas especies. Wettsetin et al.
(1996) Mol. Biol. Evol. 13(1):56-66
aplican el programa MEGA de Kumar, Tamura y Nei y el análisis
filogenético para investigar la diversificación de genes de
MHC de clase I en ardillas y roedores relacionados. Parham y
Ohta (1996) Science 272:67-74 establecen que se
requiere un enfoque de la biología poblacional, que incluye pruebas
para la selección así como para la conversión génica y la deriva
neutra para analizar la generación y el mantenimiento del
polimorfismo de MHC de clase I humano. Hughes (1997) Mol.
Biol. Evol. 14(1):1-5 comparó más de cien
dominios C2 de inmunoglobulina ortólogos entre seres humanos y
roedores, usando el procedimiento de Nei y Gojobori (razones
d_{N}:d_{S}) para someter a prueba la hipótesis de que las
proteínas expresadas en células del sistema inmunológico de
vertebrados evolucionan de una manera inusualmente rápida. Swanson
y Vacquier (1998) Science 281:710-712 usan
razones d_{N}:d_{S} para demostrar la evolución coordinada
entre la lisina y el receptor para la lisina del huevo y tratan el
papel de tal evolución coordinada en la formación de nuevas especias
(especiación). Messier y Stewart (1997) Nature
385:151-154, usaron K_{A}/K_{S} para demostrar
la selección positiva en lisozimas
de primates.
de primates.
Los cambios genéticos asociados con la
domesticación se han investigado de la manera más extensa en el maíz
(Dorweiler (1993) Science 262:232-235). Para
el maíz, (Zea ssp. mays mays), aparentemente un número menor
de cambios de un único gen explica todas las diferencias entre
nuestra planta de maíz domesticada presente y su ancestro de tipo
natural, teosinte (Zea mays ssp paruiglumis) (Dorweiler,
1993). El análisis QTL (locus de rasgo cuantitativo) ha demostrado
(Doebley (1990) PNAS USA 87:9888-9892) que no
más de quince genes controlan los rasgos de interés en el maíz y
explican la enorme diferencia en la morfología entre el maíz y el
teosinte (Wang (1999) Nature
398:236-239).
De manera importante, un número similarmente
menor de genes puede controlar los rasgos de interés en otras
plantas de cultivo derivadas de las gramíneas, incluyendo el arroz,
trigo, mijo y sorgo (Paterson (1995) Science
269:1714-1718). En efecto, para la mayoría de estos
genes relevantes en el maíz, el gen homólogo puede controlar rasgos
similares en otras plantas de cultivo derivadas de las gramíneas
(Paterson, 1995). Por tanto, la identificación de estos genes en el
maíz facilitaría la identificación de genes homólogos en el arroz,
trigo, mijo y sorgo.
Tal como puede observarse de los artículos
citados anteriormente, pueden aplicarse procedimientos analíticos
de evolución molecular para identificar genes que evolucionan
rápidamente (procedimientos de tipo K_{A}/K_{S}) para conseguir
muchos fines diferentes, lo más común para confirmar la existencia
de una selección darwiniana positiva a nivel molecular, pero
también para evaluar la frecuencia de la selección darwiniana
positiva a nivel molecular, para entender las relaciones
filogenéticas, para aclarar mecanismos mediante los cuales se
forman nuevas especias o para establecer un único origen o múltiples
orígenes para polimorfismos génicos específicos. Lo que está claro
de los artículos citados anteriormente y otros en la bibliografía es
que ninguno de los autores aplicó procedimientos del tipo
K_{A}/K_{S} para identificar cambios evolutivos en plantas y
animales domesticados provocados por presiones selectivas
artificiales. Aunque Turcich et al. (1996) Sexual Plant
Reproduction 9:65-74, describe el uso del
análisis de K_{S} en genes de plantas, se cree que nadie ha usado
el análisis de tipo K_{A}/K_{S} como una herramienta sistemática
para identificar en plantas y animales domesticados aquellos genes
que contienen cambios de secuencia significativos desde el punto de
vista evolutivo que pueden aprovecharse para el desarrollo, el
mantenimiento o la potenciación de rasgos comerciales o estéticos
deseables.
La identificación en especies domesticadas de
genes que han evolucionado para conferir funciones únicas,
potenciadas o alteradas en comparación con genes ancestrales
homólogos pudo usarse para desarrollar agentes para modular estas
funciones. La identificación de los genes subyacentes de especies
domesticadas y los cambios de nucleótido específicos que han
evolucionado, y la caracterización adicional de los cambios físicos
y bioquímicos en las proteínas codificadas por estos genes
evolucionados, pudo proporcionar información valiosa sobre los
mecanismos subyacentes al rasgo deseado. Esta información valiosa
pudo aplicarse para desarrollar agentes que potencian
adicionalmente la función de las proteínas diana. Alternativamente,
una modificación adicional de los genes responsables pudo modificar
o aumentar el rasgo deseado. Adicionalmente, pudo encontrarse que
los genes identificados desempeñan un papel en el control de los
rasgos de interés en otras plantas domesticadas. Un proceso similar
puede identificar genes para los rasgos de interés en animales
domésticos.
Doebley, Trends in Genetics, volumen 8,
nº 9, septiembre de 1992, páginas 302-307 describe
la aplicación de análisis genéticos usando marcadores moleculares
para el mapeado de genes que controlan los rasgos morfológicos en
el maíz y su progenitor de tipo natural el teosinte. Mediante el
desarrollo de mapas de unión saturada usando polimorfismos de la
longitud de los fragmentos de restricción (RFLP) y nuevos
procedimientos estadísticos para mapear y caracterizar locus de
rasgos cuantitativos (QTL) se identificaron cinco regiones del
genoma que se dice que controlan la mayoría de las diferencias
entre el maíz y el teosinte.
El documento EP 0 120 658 A2 da a conocer un
procedimiento de caracterización de una especie de organismo
desconocido que comprende determinar la posición de secuencias
conservadas desde el punto de vista evolutivo en el material
genético del organismo con respecto a una posición conocida de
sitios de escisión de endonucleasa de restricción en dicho material
genético con el fin de obtener una caracterización genética de
identificación de dicho organismo desconocido, y comparar dicha
caracterización con información de por lo menos dos conjuntos de
caracterizaciones genéticas de identificación derivadas de las
mismas secuencias conservadas, definiendo cada uno de dichos
conjuntos una especie de organismo conocido.
La presente invención proporciona procedimientos
para identificar secuencias de polinucleótido y polipéptido que
presentan cambios significativos desde el punto de vista evolutivo,
que están asociadas con rasgos comerciales o estéticos en
organismos domesticados incluyendo plantas y animales. La invención
usa genómica comparativa para identificar cambios de gen específico
que pueden estar asociados con, y por tanto ser responsables de,
condiciones estructurales, bioquímicas o fisiológicas, tales como
rasgos estética o comercialmente relevantes, y usar la información
obtenida a partir de estos rasgos para desarrollar organismos
domesticados con rasgos de interés potenciados.
En una forma de realización preferida, un
polinucleótido o polipéptido de una planta o animal domesticado ha
experimentado una selección artificial que dio como resultado un
cambio significativo desde el punto de vista evolutivo presente en
la especie domesticada que no está presente en el ancestro de tipo
natural. Un ejemplo de esta forma de realización es que el
polinucleótido o polipéptido puede estar asociado con un rendimiento
de cultivo potenciado en comparación con el ancestro. Otros
ejemplos incluyen la floración de día de duración corta (es decir,
floración sólo si el periodo diario de luz es más corto que cierta
duración crítica), contenido en proteínas, contenido en aceite,
facilidad de recolección, sabor, resistencia a la sequía y
resistencia a la enfermedad. Por tanto la presente invención puede
ser útil para llegar a comprender los mecanismos moleculares que
subyacen a las funciones o los rasgos en organismos domesticados.
Esta información puede ser útil para diseñar el polinucleótido de
modo que se potencia adicionalmente la función o el rasgo. Por
ejemplo, un polinucleótido que se ha determinado que es responsable
del rendimiento de cultivo mejorado puede someterse a mutagénesis
al azar o dirigida, seguida por pruebas de los genes mutantes para
identificar aquellos que potencian adicionalmente el rasgo.
Por consiguiente, en un aspecto, se proporcionan
procedimientos para identificar una secuencia de polinucleótido que
codifica para un polipéptido de un organismo domesticado (por
ejemplo, una planta o un animal), en los que el polipéptido puede
estar asociado con un rasgo estética o comercialmente relevante que
es único, está potenciado o alterado en el organismo domesticado en
comparación con el ancestro de tipo natural del organismo
domesticado, comprendiendo las etapas siguientes: a) comparar
secuencias de nucleótidos que codifican para proteínas de dicho
organismo domesticado con secuencias de nucleótidos que codifican
para proteínas de dicho ancestro de tipo natural; y b) seleccionar
una secuencia de polinucleótido en el organismo domesticado que
contiene un cambio de nucleótido en comparación con una secuencia
correspondiente en el ancestro de tipo natural, en el que dicho
cambio es significativo desde el punto de vista evolutivo.
En otro aspecto de la invención, se proporcionan
procedimientos para identificar un cambio significativo desde el
punto de vista evolutivo en una secuencia de nucleótidos que
codifica para proteínas de un organismo domesticado (por ejemplo,
una planta o un animal), comprendiendo las etapas siguientes: a)
comparar secuencias de nucleótidos que codifican para proteínas de
organismo domesticado con secuencias correspondientes de un ancestro
de tipo natural del organismo domesticado; y b) seleccionar una
secuencia de polinucleótido en dicho organismo domesticado que
contiene un cambio de nucleótido en comparación con la secuencia
correspondiente de ancestro de tipo natural, en el que el cambio es
significativo desde el punto de vista evolutivo.
En algunas formas de realización, el cambio de
nucleótido identificado por cualquiera de los procedimientos
descritos en la presente memoria es una sustitución no sinónima. En
algunas realizaciones, la significación evolutiva del cambio de
nucleótido se determina según la tasa de sustitución no sinónima
(K_{A}) de la secuencia de nucleótidos. En algunas realizaciones,
los cambios significativos desde el punto de vista evolutivo se
evalúan mediante la determinación de la razón K_{A}/K_{S} entre
el polinucleótido del organismo domesticado y el polinucleótido
ancestral correspondiente. Preferentemente la razón es de por lo
menos aproximadamente 0,75, o con preferencia creciente, la razón
es de por lo menos aproximadamente 1,25, 1,50 y 2,00.
En otro aspecto, la invención proporciona un
procedimiento de identificación de un agente que puede modular el
rasgo relevante en el organismo domesticado, comprendiendo dicho
procedimiento poner en contacto por lo menos un agente candidato
con una célula, sistema modelo o animal no humano o planta
transgénica que expresa la secuencia de polinucleótido que presenta
el cambio significativo desde el punto de vista evolutivo, en el
que el agente se identifica por su capacidad para modular la función
del polipéptido.
También se proporciona un procedimiento para la
comparación de secuencias a gran escala entre secuencias de
nucleótidos que codifican para proteínas de un organismo domesticado
y secuencias que codifican para proteínas de un ancestro de tipo
natural, comprendiendo dicho procedimiento: a) alinear las
secuencias de organismo domesticado con secuencias correspondientes
de ancestro de tipo natural según la homología de las secuencias; y
b) identificar cualquier cambio de nucleótido dentro de las
secuencias de organismo domesticado en comparación con las
secuencias homólogas de primate ancestral de tipo natural.
En otro aspecto, la invención objeto proporciona
un procedimiento para correlacionar un cambio de nucleótido
significativo desde el punto de vista evolutivo con un rasgo
estética o comercialmente relevante que es único, está potenciado o
alterado en un organismo domesticado, que comprende: a) identificar
una secuencia de nucleótidos que presenta un cambio significativo
desde el punto de vista evolutivo según los procedimientos descritos
en la presente memoria; y b) analizar el efecto funcional de la
presencia o ausencia de la secuencia identificada en el organismo
domesticado o en un sistema modelo.
Las plantas domesticadas usadas en los
procedimientos objeto pueden ser maíz, arroz, tomates, patatas o
cualquier planta domesticada para la que existe y se conoce el
ancestro de tipo natural. Por ejemplo, el ancestro del maíz es
teosinte; los ancestros del trigo son Triticum monococcum,
T. speltoides y Aegilops tauschii; y los ancestros
del arroz son Oryza nivora y O. rufipogon. El rasgo
relevante puede ser cualquier rasgo estética o comercialmente
relevante tal como rendimiento, floración de día de duración corta,
contenido en proteínas, contenido en aceite, resistencia a la
sequía, sabor, facilidad de recolección o resistencia a la
enfermedad.
Los animales domesticados usados en los
procedimientos objeto pueden ser cualquier animal domesticado para
el que está disponible un ancestro incluyendo cerdos, ganado,
caballos, perros y gatos. Por ejemplo, un ancestro del caballo es
el caballo de Pryzewalskii; y los ancestros de ganado incluyen
algunas razas indias. El rasgo relevante podría ser, por ejemplo,
el contenido en grasas, contenido en proteínas, la producción de
leche, tiempo hasta el pleno desarrollo, fecundidad, docilidad o
resistencia a la enfermedad y sensibilidad frente a la
enfermedad.
La presente invención utiliza la genómica
comparativa para identificar cambios génicos específicos que están
asociados con, y por tanto pueden contribuir a o ser responsable de,
rasgos estética o comercialmente relevantes en organismos
domesticados (por ejemplo, plantas y animales).
En una forma de realización preferida, los
procedimientos descritos en la presente memoria pueden aplicarse
para identificar los genes que controlan rasgos de interés en
plantas domesticadas importantes en la agricultura. Los seres
humanos han cultivado plantas domesticadas durante varios miles de
años sin conocimiento de los genes que controlan estos rasgos. El
conocimiento de los mecanismos genéticos específicos implicados
permitiría una intervención mucho más rápida y directa a nivel
molecular para crear plantas con rasgos deseables o potenciados.
Los seres humanos, mediante la selección
artificial, han proporcionado presiones de selección intensas sobre
las plantas de cultivo. Esta presión se refleja en cambios
significativos desde el punto de vista evolutivo entre genes
homólogos de organismos domesticados y sus ancestros de tipo
natural. Se ha encontrado que sólo unos pocos genes, por ejemplo,
10-15 por especie, controlan los rasgos de interés
comercial en plantas de cultivo domesticadas. Estos pocos genes han
sido extremadamente difíciles de identificar mediante procedimientos
convencionales de biología molecular vegetal. Los análisis de
K_{A}/K_{S} y relacionados descritos en la presente memoria
pueden identificar los genes que controlan los rasgos de interés si
esos genes han experimentado cambios en la región que codifica para
proteínas.
Para cualquier planta de cultivo de interés,
pueden construirse bibliotecas de ADNc a partir de las especies o
subespecies domesticadas y su ancestro de tipo natural. Tal como se
describe en el documento USSN 09/240.915, presentado el 29 de enero
de 1999, la bibliotecas de ADNc de cada una se "comparan con
BLAST" entre sí para identificar polinucleótidos homólogos.
Alternativamente, el experto en la materia puede acceder a bases de
datos de ADNc o genómicas comercial y/o públicamente disponibles
tales como las que se encuentran en:
- www.central.edu/homepages/liedlb/geneticas/gene-site.html;
- www.ornl.gov/Techresources/Human-Genome/geneticas.html; y
- www.mcb.harvard.edu/Biolinks/Sequences.htm
- www.ncbi.nlm.gov/Web/Genbank/index.html
en vez de construir bibliotecas de ADNc. A
continuación, se lleva a cabo un análisis de K_{A}/K_{S} o
relacionado para identificar genes seleccionados que han
evolucionado rápidamente bajo presión selectiva. Entonces se
evalúan estos genes usando procedimientos de plantas transgénicas y
moleculares convencionales para determinar si desempeñan un papel
en los rasgos de interés comercial o estético. Entonces se manipulan
los genes de interés mediante, por ejemplo, mutagénesis al azar o
dirigida al sitio, para desarrollar nuevas variedades, subespecies,
cepas o cultivos mejorados.
De manera similar, los procedimientos descritos
en la presente memoria pueden aplicarse a animales domesticados
incluyendo cerdos, ganado, caballos, perros, gatos y otros animales
domesticados para los que está disponible un ancestro de tipo
natural. El ganado y los caballos, especialmente, representan
intereses comerciales importantes. Al igual que con las plantas,
los seres humanos han criado animales durante miles de años, y esas
presiones de selección intensas se reflejarán en tasas de
K_{A}/K_{S} elevadas para genes de interés que han evolucionado
rápidamente. De nuevo, para identificar polinucleótidos homólogos,
pueden compararse con BLAST bibliotecas de ADNc de animales
domesticados y sus ancestros de tipo natural entre sí, y/o puede
accederse a bases de datos de ADNc o genómicas públicas o privadas
disponibles. Para las secuencias homólogas, puede llevarse a cabo
análisis de K_{A}/K_{S} o relacionados, que identificarán los
polinucleótidos que han evolucionado rápidamente bajo la presión
selectiva artificial. Estos genes se evalúan entonces usando
procedimientos de animales transgénicos no humanos y moleculares
convencionales determinar si desempeñan un papel en los rasgos de
interés comercial o estético. Entonces pueden manipularse esos genes
para desarrollar nuevas variedades o subespecies de animales
mejoradas.
La puesta en práctica de la presente invención
emplea, a menos que se indique lo contrario, técnicas convencionales
de biología molecular, genética y evolución molecular, que están
dentro de la habilidad de la materia. Tales técnicas se explican
con detalle en la bibliografía, tal como: "Molecular Cloning: A
Laboratory Manual", segunda edición (Sambrook et al.,
1989); "Oligonucleotide Synthesis" (M. J. Gait, ed., 1984);
"Current Protocols-in Molecular Biology" (F.
M. Ausubel et al., eds., 1987); "PCR: The Polymerase Chain
Reaction", (Mullis et al., eds., 1994); "Molecular
Evolution", (Li, 1997).
\vskip1.000000\baselineskip
Tal como se usa en la presente memoria, un
"polinucleótido" se refiere a una forma polimérica de
nucleótidos de cualquier longitud, ya sean ribonucleótidos o
desoxirribonucleótidos, o análogos de los mismos. Este término se
refiere a la estructura primaria de la molécula, y por tanto incluye
ADN de cadena doble y sencilla, así como ARN de cadena doble y
sencilla. También incluye polinucleótidos modificados tales como
polinucleótidos metilados y/o de extremos ocupados. Los términos
"polinucleótido" y "secuencia de nucleótidos" se usan de
manera intercambiable.
Tal como se usa en la presente memoria, un
"gen" se refiere a un polinucleótido o una parte de un
polinucleótido que comprende una secuencia que codifica para una
proteína. Es bien conocido en la técnica que un gen también
comprende secuencias no codificantes, tales como secuencias
flanqueantes 5' y 3' (tales como promotores, potenciadores,
represores y otras secuencias reguladoras) así como intrones.
Los términos "polipéptido", "péptido"
y "proteína" se usan de manera intercambiable en la presente
memoria para hacer referencia a polímeros de aminoácidos de
cualquier longitud. Estos términos incluyen también proteínas que
se modifican tras la traducción mediante reacciones que incluyen la
glucosilación, acetilación y fosforilación.
La expresión "organismo domesticado" se
refiere a un organismo vivo individual o población del mismo, una
especie, subespecie, variedad, cultivo o cepa, que se ha sometido a
presión de selección artificial y ha desarrollado un rasgo estética
o comercialmente relevante. En algunas realizaciones preferidas, el
organismo domesticado es una planta seleccionada del grupo que está
constituido por maíz, trigo, arroz, sorgo, tomate o patata, o
cualquier otra planta domesticada de interés comercial, de la que se
conoce un ancestro. En otras realizaciones preferidas, el organismo
domesticado es un animal seleccionado del grupo que está constituido
por ganado, caballos, cerdos, gatos y perros. Un organismo
domesticado y su ancestro pueden estar relacionados como diferentes
especies, subespecies, variedades, cultivos o cepas o cualquier
combinación de los mismos.
La expresión "ancestro de tipo natural" o
el término "ancestro" significa un organismo, especie,
subespecie, variedad, cultivo o cepa precursor o predecesor a
partir del que ha evolucionado un organismo domesticado, especie,
subespecie, variedad, cultivo o cepa. Un organismo domesticado puede
tener uno o más de un ancestro. Normalmente, las plantas
domesticadas pueden tener uno o una pluralidad de ancestros,
mientras que los animales domesticados normalmente tienen sólo un
único ancestro.
La expresión "rasgo estética o comercialmente
relevante" se usa en la presente memoria para hacer referencia a
rasgos que existen en organismos domesticados tales como plantas o
animales cuyo análisis podría proporcionar información (por
ejemplo, datos físicos o bioquímicos) relevantes para el desarrollo
de agentes que pueden modular el polipéptido responsable del rasgo.
El rasgo estética o comercialmente relevante puede ser único, estar
potenciado o alterado en relación al ancestro. Por "alterado,"
se quiere decir que el rasgo relevante difiere cualitativa o
cuantitativamente de los rasgos observados en el ancestro.
La expresión "procedimientos de tipo
K_{A}/K_{S}" significa procedimientos que evalúan las
diferencias, con frecuencia (pero no siempre) mostradas como una
razón, entre el número de sustituciones no sinónimas y
sustituciones sinónimas en genes homólogos (incluyendo los
procedimientos más rigurosos que determinan los sitios no sinónimos
y sinónimos). Estos procedimientos se designan usando varios
sistemas de nomenclatura, incluyendo pero sin limitarse a
K_{A}/K_{S}, d_{N}/d_{S}, D_{N}/D_{S}.
Las expresiones "cambio significativo desde el
punto de vista evolutivo" y "cambio evolutivo adaptativo" se
refieren a uno o más cambios de secuencia de nucleótidos o péptidos
entre dos organismos, especies, subespecies, variedades, cultivos
y/o cepas que pueden atribuirse a una presión selectiva positiva. Un
procedimiento para determinar la presencia de un cambio
significativo desde el punto de vista evolutivo es aplicar un
procedimiento analítico de tipo K_{A}/K_{S}, tal como medir una
razón K_{A}/K_{S}. Normalmente, una razón K_{A}/K_{S} de
por lo menos aproximadamente 0,75, más preferentemente de por lo
menos aproximadamente 1,0, más preferentemente de por lo menos
aproximadamente 1,25, más preferentemente de por lo menos
aproximadamente 1,5 y lo más preferentemente de por lo menos
aproximadamente 2,0 indica la acción de selección positiva y se
considera que es un cambio significativo desde el punto de vista
evolutivo.
La expresión "cambio significativo desde el
punto de vista evolutivo positivo" significa un cambio
significativo desde el punto de vista evolutivo en un organismo,
especie, subespecie, variedad, cultivo o cepa particular que da
como resultado un cambio adaptativo que es positivo en comparación
con otros organismos relacionados. Un ejemplo de un cambio
significativo desde el punto de vista evolutivo positivo es un
cambio que ha dado como resultado un rendimiento potenciado en
plantas de cultivo.
El término "resistente" significa que un
organismo presenta una capacidad para evitar, o disminuir la
magnitud de un estado de enfermedad y/o desarrollo de la
enfermedad, preferentemente en comparación con organismos no
resistentes.
El término "sensibilidad" significa que un
organismo no puede evitar, o disminuir la magnitud de un estado de
enfermedad y/o desarrollo del estado de enfermedad, preferentemente
en comparación con un organismo que se conoce que es
resistente.
Se entiende que la resistencia y la sensibilidad
varían de entre individuos, y que, para los fines de esta
invención, estos términos se aplican también a un grupo de
individuos dentro de una especie, y las comparaciones de
resistencia y sensibilidad se refieren generalmente a diferencias
promedio globales entre especies, aunque puede usarse comparaciones
intraespecíficas.
El término "homólogo" o "un/el
homólogo" o "un/el ortólogo" se conoce y se entiende bien en
la técnica y se refiere a secuencias relacionadas que comparten un
ancestro común y se determina basándose en el grado de identidad de
las secuencias. Estos términos describen la relación entre un gen
encontrado en una especie, subespecie, variedad, cultivo o cepa y
el gen equivalente o correspondiente en otra especie, subespecie,
variedad, cultivo o cepa. Para los fines de esta invención se
comparan secuencias homólogas. Se piensa, se cree o se sabe que las
"secuencias homólogas" o los "homólogos" u
"ortólogos" están relacionados funcionalmente. Una relación
funcional puede estar indicada de cualquiera de varias maneras,
incluyendo, pero sin limitarse a, (a) el grado de identidad de las
secuencias; (b) función biológica idéntica o similar.
Preferentemente, se indican tanto (a) y (b). El grado de identidad
de las secuencias puede variar, pero es preferentemente de por lo
menos el 50% (cuando se usan programas de alineación de secuencias
convencionales conocidos en la técnica), más preferentemente de por
lo menos el 60%, más preferentemente de por lo menos aproximadamente
el 75%, más preferentemente de por lo menos aproximadamente el 85%.
La homología puede determinarse usando programas de software
fácilmente disponibles en la técnica, tales como aquellos tratados
en Current Protocols in Molecular Biology (F. M. Ausubel
et al., eds., 1987) suplemento 30, sección 7.718, tabla 7.71.
Programas de alineación preferidos son MacVector (Oxford Molecular
Ltd, Oxford, R.U.) y ALIGN Plus (Scientific and Educational
Software, Pensilvania). Otro programa de alineación preferido es
Sequencher (Gen Codes, Ann Arbor, Michigan), usando los parámetros
por defecto.
La expresión "cambio de nucleótido" se
refiere a una sustitución, deleción y/o inserción de nucleótido, tal
como es bien conocido en la técnica.
"Genes de mantenimiento" es una expresión
bien conocida en la técnica y se refiere a aquellos genes asociados
con una función celular general, incluyendo pero sin limitarse al
crecimiento, la división, la estasis, el metabolismo y/o la muerte.
Los genes "de mantenimiento" generalmente realizan una función
que se encuentra en más de un tipo de célula. Por el contrario, los
genes específicos de célula realizan generalmente funciones en una
clase y/o tipo de célula particular.
El término "agente", tal como se usa en la
presente memoria, significa a compuesto biológico o químico tal
como una molécula orgánica o inorgánica simple o compleja, un
péptido, una proteína o un oligonucleótido que modula la función de
un polinucleótido o polipéptido. Puede sintetizarse una amplia serie
de compuestos, por ejemplo oligómeros, tales como oligopéptidos y
oligonucleótidos, y compuestos sintéticos orgánicos e inorgánicos
basados en diversas estructuras centrales, y éstos se incluyen
también en el término "agente". Además, diversas fuentes
naturales pueden proporcionar compuestos para la selección, tales
como extractos vegetales o animales y similares. Los compuestos
pueden someterse a prueba individualmente o en combinación entre
sí.
La expresión "para modular la función" de
un polinucleótido o un polipéptido significa que se altera la
función del polinucleótido o polipéptido en comparación con no
añadir un agente. La modulación puede producirse a cualquier nivel
que afecte a la función. Una función de polinucleótido o polipéptido
puede ser directa o indirecta, y medirse directa o
indirectamente.
Una "función de un polinucleótido" incluye,
pero no se limita a, patrón/patrones de replicación; traducción;
expresión. Una función de polinucleótido también incluye funciones
asociadas con un polipéptido codificado dentro del polinucleótido.
Por ejemplo, se considera que un agente que actúa sobre un
polinucleótido y afecta a la expresión, conformación, plegado (u
otras características físicas), unión a otros restos (tales como
ligandos), actividad (u otras características funcionales),
regulación de proteínas y/u otros aspectos de la estructura o
función de la proteína ha modulado la función del
polinucleótido.
Una "función de un polipéptido" incluye,
pero no se limita a, conformación, plegado (u otras características
físicas), unión a otros restos (tales como ligandos), actividad (u
otras características funcionales) y/u otros aspectos de la
estructura o funciones de la proteína. Por ejemplo, se considera que
un agente que actúa sobre un polipéptido y afecta a su
conformación, plegado (u otras características físicas), unión a
otros restos (tales como ligandos), actividad (u otras
características funcionales) y/u otros aspectos de la estructura o
funciones de la proteína ha modulado la función del polipéptido. Las
maneras en las que puede actuar un agente eficaz para modular la
función de un polipéptido incluyen, pero no se limitan a 1) cambiar
la conformación, plegado u otras características físicas; 2)
cambiar la fuerza de unión a su ligando natural o cambiar la
especificidad de unión a ligandos; y 3) alterar la actividad del
polipéptido.
La expresión "sitio diana" significa una
ubicación en un polipéptido que puede ser un único aminoácido y/o
es una parte de un motivo estructural y/o funcional, por ejemplo, un
sitio de unión, un dominio de dimerización o un sitio activo
catalítico. Los sitios diana pueden ser útiles para la interacción
directa o indirecta con un agente, tal como un agente
terapéutico.
La expresión "diferencia molecular" incluye
cualquier diferencia estructural y/o funcional. En la presente
memoria se describen procedimientos para detectar tales diferencias,
así como ejemplos de tales diferencias.
Un "efecto funcional" es una expresión bien
conocida en la técnica, y significa cualquier efecto que se muestra
en cualquier nivel de actividad, ya sea directo o indirecto.
La expresión "facilidad de recolección" se
refiere rasgos distintivos o características de plantas que
facilitan la recolección manual o automática de estructuras o
partes (por ejemplo, frutas, hojas, raíces) para el consumo u otro
tratamiento comercial.
Para los fines de esta invención, la fuente del
polinucleótido de la planta o animal domesticado o su ancestro
puede ser cualquier fuente adecuada, por ejemplo, secuencias
genómicas o secuencias de ADNc. Preferentemente, se comparan
secuencias de ADNc. Pueden obtenerse secuencias que codifican para
proteínas de bases de datos privadas, públicas y/o comerciales
disponibles tales como las descritas en la presente memoria. Estas
bases de datos sirven como depósitos de los datos de secuencia
molecular generados por los esfuerzos de investigación en curso.
Alternativamente, pueden obtenerse secuencias que codifican para
proteínas de, por ejemplo, la secuenciación de ADNc sometido a
transcripción inversa a partir de ARNm expresado en células, o tras
amplificación mediante PCR, según procedimientos bien conocidos en
la técnica. Alternativamente, pueden usarse secuencias genómicas
para la comparación de secuencias. Pueden obtenerse secuencias
genómicas de bases de datos públicas, privadas y/o comerciales
disponibles o de una secuenciación de bibliotecas de ADN genómico
disponibles comercialmente o de ADN genómico, tras PCR.
En algunas formas de realización, el ADNc se
prepara a partir de ARNm obtenido a partir de un tejido en una fase
de desarrollo determinada, o un tejido obtenido tras someter el
organismo a ciertas condiciones ambientales. Las bibliotecas de
ADNc usadas para la comparación de secuencias de la presente
invención pueden construirse usando técnicas de construcción de
bibliotecas de ADNc convencionales que se explican completamente en
la bibliografía de la materia. Se usan ARNm totales como moldes
para someter ADNc a transcripción inversa. Los ADNc transcritos se
subclonan en vectores apropiados para establecer una biblioteca de
ADNc. La biblioteca de ADNc establecida puede maximizarse para el
contenido de ADNc de longitud completa, aunque pueden usarse ADNc
de longitud menor a la completa. Además, la frecuencia de la
secuencia puede normalizarse según, por ejemplo, Bonaldo et
al. (1996) Genome Research 6:791-806. Los
clones de ADNc seleccionados al azar de la biblioteca de ADNc
construida pueden secuenciarse usando técnicas de secuenciación
automáticas convencionales. Preferentemente, se usan clones de ADNc
de longitud completa para la secuenciación. Pueden secuenciarse o
bien todos o bien una gran parte de los clones de ADNc de una
biblioteca de ADNc, aunque también es posible poner en práctica
algunas realizaciones de la invención secuenciando tan solo un único
ADNc, o varios clones de ADNc.
En una forma de realización preferida de la
presente invención, los clones de ADNc que van a secuenciarse
pueden preseleccionarse según su especificidad de expresión. Con el
fin de seleccionar ADNc correspondientes a genes activos que se
expresan específicamente, los ADNc pueden someterse a hibridación
sustractiva usando ARNm obtenidos de otros órganos, tejidos o
células del mismo animal. En ciertas condiciones de hibridación con
concentración y rigurosidad apropiada, aquellos ADNc que hibridan
con ARNm no específicos de tejido y por tanto probablemente
representan genes "de mantenimiento" se excluirán de la reserva
de ADNc. Por consiguiente, es más probable que los ADNc restantes
que van a secuenciarse estén asociados con funciones específicas de
tejido. Para el fin de la hibridación sustractiva, pueden obtenerse
ARNm no específicos de tejido de un órgano, o preferentemente de
una combinación de diferentes órganos y células. La cantidad de ARNm
no específicos de tejido se maximiza para saturar los ADNc
específicos de tejido.
Alternativamente, puede usarse información de
bases de datos en línea para seleccionar o dar prioridad a ADNc que
es más probable que estén asociados con funciones específicas. Por
ejemplo, pueden seleccionarse los candidatos de ADNc de organismo
ancestral para la secuenciación mediante PCR usando cebadores
diseñados a partir de secuencias de ADNc de un organismo
domesticado candidato. Las secuencias de ADNc de organismo
domesticado candidato, por ejemplo, aquellas que sólo se encuentran
en un tejido específico, tal como músculo esquelético, o que
corresponden a genes que es probable que sean importante en la
función específica. Tales secuencias de ADNc específicas de tejido
pueden obtenerse buscando en bases de datos de secuencias en línea
en las que puede especificarse información con respecto al perfil
de expresión y/o la actividad biológica para secuencias de
ADNc.
Pueden obtenerse secuencias de
homólogo(s) de organismo ancestral con respecto a un gen de
organismo domesticado conocido usando procedimientos convencionales
en la técnica, tales como procedimientos de PCR (usando, por
ejemplo, termocicladores GeneAmp PCR System 9700 (Applied
Biosystems, Inc.)). Por ejemplo, pueden seleccionarse candidatos de
ADNc de organismo ancestral para la secuenciación mediante PCR
usando cebadores diseñados a partir de secuencias de ADNc de
organismo domesticado candidato. Para la PCR, pueden prepararse
cebadores a partir de las secuencias de organismo domesticado
usando procedimientos convencionales en al materia, incluyendo
programas de diseño de cebadores públicamente disponibles tales como
PRIMER® (Whitehead Institute). La secuencia de organismo ancestral
amplificada puede secuenciarse entonces usando procedimientos y
equipos convencionales en la técnica, tales como secuenciadores
automáticos (Applied Biosystems, Inc.).
\vskip1.000000\baselineskip
El procedimiento general de la invención es tal
como sigue. Brevemente, se obtienen secuencias de nucleótidos a
partir de un organismo domesticado y un ancestro de tipo natural.
Las secuencias de nucleótidos del organismo domesticado y del
ancestro se comparan entre sí para identificar secuencias que son
homólogas. Se analizan las secuencias homólogas para identificar
aquellas que presentan diferencias de secuencia de ácidos nucleicos
entre el organismo domesticado y el ancestro. Entonces se lleva a
cabo un análisis de evolución molecular para evaluar cuantitativa y
cualitativamente la significación evolutiva de las diferencias. Para
los genes que se han seleccionado positivamente, pueden realizarse
análisis de grupo externo para identificar aquellos genes que se
han seleccionado positivamente en el organismo domesticado (a
diferencia del ancestro). A continuación, se caracteriza la
secuencia en cuanto a la identidad molecular/genética y la función
biológica. Finalmente, puede usarse la información para identificar
agentes que pueden modular la función biológica del polipéptido
codificado por el gen.
Los procedimientos generales de la invención
conllevan comparar secuencias de nucleótidos que codifican para
proteínas de organismos domesticados y ancestrales. Se aplica la
bioinformática a la comparación y se seleccionan las secuencias que
contienen un cambio o cambios de nucleótido que es/son un(os)
cambio(s) significativo(s) desde el punto de vista
evolutivo. La invención posibilita la identificación de genes que
han evolucionado para conferir alguna ventaja evolutiva y la
identificación de los cambios evolucionados específicos.
Se comparan secuencias que codifican para
proteínas de un organismo domesticado y su ancestro para identificar
secuencias homólogas. Esta invención contempla cualquier mecanismo
apropiado para completar esta comparación. La alineación puede
llevarse a cabo manualmente o mediante un software (ejemplos de
programas de alineación adecuados son conocidos en la técnica).
Preferentemente, se comparan secuencias que codifican para proteínas
de un ancestro con las secuencias de especies domesticadas por
medio de búsquedas en bases de datos, búsquedas en BLAST. Las
"correspondencias" de alta puntuación, es decir, secuencias que
muestran una similitud significativa tras análisis BLAST, se
recuperarán y se analizarán. Las secuencias que muestran una
similitud significativa pueden ser aquellas que presentan por lo
menos aproximadamente el 60%, por lo menos aproximadamente el 75%,
por lo menos aproximadamente el 80%, por lo menos aproximadamente el
85%, o por lo menos aproximadamente el 90% de identidad de
secuencia. Preferentemente, las secuencias que muestran más de
aproximadamente el 80% de identidad se analizan adicionalmente. Las
secuencias homólogas identificadas por medio de la búsqueda en
bases de datos pueden alinearse en su totalidad usando programas y
procedimientos de alineación de secuencias que se conocen y están
disponibles en la técnica, tales como el sencillo programa de
alineación usado comúnmente CLUSTAL V de Higgins et al.
(1992) CABIOS 8:189-191.
Alternativamente, la secuenciación y la
comparación de homología de secuencias que codifican para proteínas
entre el organismo domesticado y su ancestro pueden llevarse a cabo
simultáneamente usando la tecnología de chip de secuenciación
desarrollada recientemente. Véase, por ejemplo, Rava et al.
patente US nº 5.545.531.
Las secuencias alineadas que codifican para
proteínas de organismo domesticado y ancestro se analizan para
identificar diferencias de secuencia de nucleótidos en sitios
particulares. De nuevo, esta invención contempla cualquier
procedimiento adecuado para conseguir este análisis. Si no hay
diferencias de secuencia de nucleótidos, normalmente no se analiza
adicionalmente la secuencia que codifica para proteínas de ancestro.
Los cambios de secuencia detectados se comprueban inicialmente de
manera general, y preferible, para determinar su precisión.
Preferentemente, la comprobación inicial comprende llevar a cabo una
o más de las siguientes etapas, todas y cada una de las cuales se
conocen en la técnica: (a) hallar los puntos en los que hay cambios
entre las secuencias de ancestro y de organismo domesticado; (b)
comprobar el fluorograma (cromatograma) de secuencia para
determinar si las bases que parecen ser únicas para el ancestro u
organismo domesticado corresponden a señales claras, fuertes,
específicas para la base en cuestión; (c) comprobar las
correspondencias del organismo domesticado para observar si hay más
de una secuencia de organismo domesticado que corresponde a un
cambio de secuencia. Múltiples entradas de secuencia de organismo
domesticado para el mismo gen que presentan el mismo nucleótido en
una posición en la que hay un nucleótido diferente en una secuencia
de ancestro proporcionan un apoyo independiente de que la secuencia
de organismo domesticado es precisa, y que el cambio es
significativo. Tales cambios se examinan usando información de
bases de datos y el código genético para determinar si estos
cambios de secuencia de nucleótidos dan como resultado un cambio en
la secuencia de aminoácidos de la proteína codificada. Tal como
aclara la definición de "cambio de nucleótido", la presente
invención abarca el cambio de por lo menos un nucleótido, ya sea
una sustitución, una deleción o una inserción, en una secuencia de
polinucleótido que codifica para proteínas de un organismo
domesticado en comparación con una secuencia correspondiente del
ancestro. Preferentemente, el cambio es una sustitución de
nucleótido. Más preferentemente, hay más de una sustitución
presentes en la secuencia identificada y se someten a análisis de
evolución molecular.
Puede emplearse cualquiera de los diversos
análisis de evolución molecular diferentes o procedimientos de tipo
K_{A}/K_{S} para evaluar cuantitativa y cualitativamente la
significación evolutiva de los cambios de nucleótido identificados
entre secuencias de genes de especies domesticadas y aquellas de
ancestros correspondientes. Kreitman y Akashi (1995) Annu. Rev.
Ecol. Syst. 26: 403-422; Li, Molecular
Evolution, Sinauer Associates, Sunderland, MA, 1997. Por
ejemplo, la selección positiva en proteínas (es decir, evolución
adaptativa a nivel molecular) puede detectarse en genes que
codifican para proteínas mediante comparaciones por parejas de las
razones de sustituciones de nucleótido no sinónimas por sitio no
sinónimo (K_{A}) con respecto a sustituciones sinónimas por sitio
sinónimo (K_{S}) (Li et al., 1985; Li, 1993). Puede usarse
cualquier comparación de K_{A} y K_{S}, aunque es
particularmente conveniente y lo más eficaz comparar estas dos
variables como una razón. Se identifican secuencias mostrando una
diferencia estadísticamente significativa entre K_{A} y K_{S}
usando procedimientos estadísticos convencionales.
Preferentemente, se usa el análisis de
K_{A}/K_{S} de Li et al. para llevar a cabo la presente
invención, aunque también pueden usarse otros programas de análisis
que pueden detectar genes seleccionados positivamente entre
especies. Li et al. (1985) Mol. Biol. Evol.
2:150-174; Li (1993); véase también J. Mol.
Evol. 36:96-99; Messier y Stewart (1997)
Nature 385:151-154; Nei (1987) Molecular
Evolutionary Genetics (Nueva York, Columbia University Press).
El procedimiento de K_{A}/K_{S}, que comprende una comparación
de la tasas de sustituciones no sinónimas por sitio no sinónimo con
la tasa de sustituciones sinónimas por sitio sinónimo entre la
región que codifica para proteínas homóloga de genes en cuanto a una
razón, se usa para identificar sustituciones de secuencia que
pueden provocarse por selecciones adaptativas a diferencia de
selecciones neutras durante la evolución. Una sustitución sinónima
("silenciosa") es una que, debido la degeneración del código
genético, no realiza ningún cambio en la secuencia de aminoácidos
codificada; una sustitución no sinónima da como resultado un
reemplazo de aminoácido. La magnitud de cada tipo de cambio puede
estimarse como K_{A} y K_{S}, respectivamente, los números de
sustituciones sinónimas por sitio sinónimo y las sustituciones no
sinónimas por sitio no sinónimo. Los cálculos de K_{A}/K_{S}
pueden llevarse a cabo manualmente o usando un software. Un ejemplo
de un programa adecuado es MEGA (Molecular Genetics Institute,
Pennsylvania State University).
Para el fin de estimar K_{A} y K_{S}, se
usan secuencias o bien completas o bien parciales que codifican
para proteínas para calcular los números totales de sustituciones
sinónimas y no sinónimas, así como sitios no sinónimos y sinónimos.
La longitud de la secuencia de polinucleótido analizada puede ser
cualquier longitud apropiada. Preferentemente, se compara toda la
secuencia codificante, con el fin de determinar todos y cada uno de
los cambios significativos. Pueden usarse programas informáticos
disponibles públicamente, tales como Li93 (Li (1993) J. Mol.
Evol. 36:96-99) o INA, para calcular los valores
de K_{A} y K_{S} para todas las comparaciones por parejas. Este
análisis puede adaptarse además para examinar secuencias en un modo
de "ventana deslizante" de tal manera que números pequeños de
cambios importantes no resulten enmascarados por la secuencia
completa. "Ventana deslizante" se refiere a una exploración de
subsecciones consecutivas, solapantes, del gen (las subsecciones
pueden ser de cualquier longitud).
La comparación de las tasas de sustitución no
sinónima y sinónima se representa mediante la razón K_{A}/K_{S}.
Se ha demostrado que K_{A}/K_{S} es un reflejo del grado en el
que se ha producido la evolución adaptativa en la secuencia en
estudio. Pueden usarse segmentos de longitud completa o parcial de
una secuencia codificante para el análisis de K_{A}/K_{S}.
Cuanto mayor sea la razón K_{A}/K_{S}, más probable será que una
secuencia haya experimentado una evolución adaptativa y que las
sustituciones no sinónimas sean significativas desde el punto de
vista evolutivo. Véase, por ejemplo, Messier y Stewart (1997).
Preferentemente, la razón K_{A}/K_{S} es de por lo menos
aproximadamente 0,75, más preferentemente de por lo menos
aproximadamente 1,0, más preferentemente de por lo menos
aproximadamente 1,25, más preferentemente de por lo menos
aproximadamente 1,50, o más preferentemente de por lo menos
aproximadamente 2,00. Preferentemente, se lleva a cabo un análisis
estadístico en todas las razones K_{A}/K_{S} elevadas,
incluyendo, pero sin limitarse a, procedimientos convencionales
tales como la prueba de la t de Student y pruebas de razón de
probabilidad descritos por Yang (1998) Mol. Biol Evol.
37:441-456.
Para una comparación por parejas de secuencias
homólogas, las razones K_{A}/K_{S} significativamente mayores
que la unidad sugieren fuertemente que la selección positiva ha
fijado un mayor número de reemplazos de aminoácido de lo que puede
esperarse como resultado del azar solo, y está en contraste con el
patrón observado comúnmente en el que la razón es menor o igual a
uno. Nei (1987); Hughes y Hei (1988) Nature
335:167-170; Messier y Stewart (1994) Current
Biol. 4:911-913; Kreitman y Akashi (1995)
Ann. Rev. Ecol. Syst. 26:403-422; Messier y
Stewart (1997). Las razones inferiores a uno significan generalmente
el papel de una selección negativa, o purificante: hay una fuerte
presión sobre la estructura primaria de proteínas funcionales,
eficaces para seguir inalteradas.
Todos los procedimientos para calcular la
razones K_{A}/K_{S} se basan en una comparación por parejas del
número de sustituciones no sinónimas por sitio no sinónimo con
respecto al número de sustituciones sinónimas por sitio sinónimo
para las regiones que codifican para proteínas de genes homólogos
del ancestro y de organismos domesticados. Cada procedimiento pone
en práctica diferentes correcciones para estimar "correspondencias
múltiples" (es decir, sustitución de más de un nucleótido en el
mismo sitio). Cada procedimiento también usa diferentes modelos
para cómo cambian las secuencias de ADN durante el tiempo de
evolución. Por tanto, preferentemente, se usa una combinación de
resultados de diferentes algoritmos para aumentar el nivel de
sensibilidad para la detección de genes seleccionados positivamente
y la confianza en el resultado.
Preferentemente, las razones K_{A}/K_{S}
deben calcularse para pares de genes ortólogos, a diferencia de
pares de genes parálogos (es decir, un gen que resulta de la
especiación, a diferencia de un gen que es el resultado de
duplicación génica) Messier y Stewart (1997). Esta distinción puede
realizarse llevando a cabo comparaciones adicionales con otros
ancestros, lo que permite la construcción de un árbol filogenético.
Los genes ortólogos cuando se usan en la construcción de árbol darán
el "árbol de la especie" conocido, es decir, producirán un
árbol que cumple con el árbol biológico conocido. Por el contrario,
los genes parálogos darán árboles que no cumplen con el árbol
biológico conocido.
Se entiende que los procedimientos descritos en
la presente memoria pueden conducir a la identificación de
secuencias de polinucleótido de organismo domesticado o ancestro que
están funcionalmente relacionadas con las secuencias que codifican
para proteínas. Tales secuencias pueden incluir, pero no se limitan
a, secuencias no codificantes o secuencias codificantes que no
codifican para proteínas. Estas secuencias relacionadas pueden ser,
por ejemplo, físicamente adyacentes a las secuencias que codifican
para proteínas en el genoma, tales como intrones o secuencias
flanqueantes en 5' y 3' (incluyendo elementos de control tales como
promotores y potenciadores). Estas secuencias relacionadas pueden
obtenerse realizando búsquedas en bases de datos de genoma
públicas, privadas y/o comerciales disponibles o, alternativamente,
realizando selecciones y secuenciaciones de la biblioteca genómica
del organismo con una secuencia que codifica para proteínas como
sonda. Un experto en la materia conoce bien procedimientos y
técnicas para obtener secuencias no codificantes usando una
secuencia codificante relacionada.
Los cambios de nucleótido significativos desde
el punto de vista evolutivo, que se detectan mediante análisis de
evolución molecular tal como el análisis de K_{A}/K_{S}, pueden
evaluarse adicionalmente para determinar su aparición única en el
organismo domesticado o la magnitud en la que estos cambios son
únicos en el organismo domesticado. Por ejemplo, pueden someterse a
prueba los cambios identificados en el gen de organismo domesticado
para determinar la presencia/ausencia en otras secuencias de
especies, subespecies u otros organismos relacionados que presentan
un ancestro común con el organismo domesticado. Esta comparación
("análisis de grupo externo") permite la determinación de si
el gen positivamente seleccionado se selecciona positivamente para
el organismo domesticado en cuestión (a diferencia del
ancestro).
Las secuencias con por lo menos un cambio
significativo desde el punto de vista evolutivo entre un organismo
domesticado y su ancestro pueden usarse como cebadores para análisis
mediante PCR de otras secuencias que codifican para proteínas de
ancestro, y los polinucleótidos resultantes se secuencian para ver
si el mismo cambio está presente en otros ancestros. Estas
comparaciones permiten una discriminación adicional en cuanto a si
los cambios evolutivos adaptativos son únicos para el linaje
domesticado en comparación con otros ancestros o si el cambio
adaptativo es único para el ancestro en comparación con la especie
domesticada y otros ancestros. Un cambio de nucleótido que se
detecta en un organismo domesticado pero no en otros ancestros
representa más probablemente un cambio evolutivo adaptativo en el
organismo domesticado. Alternativamente, un cambio de nucleótido
que se detecta en un ancestro que no se detecta en el organismo
domesticado u otros ancestros representa probablemente un cambio
evolutivo adaptativo del ancestro. Otros ancestros usados para la
comparación pueden seleccionarse basándose en sus relaciones
filogenéticas con el organismo domesticado. Puede determinarse la
significación estadística de tales comparaciones usando programas
disponibles establecidos, por ejemplo, la prueba de la t tal como
se usa por Messier y Stewart (1997) Nature
385:151-154. Es muy probable que aquellos genes que
muestran razones K_{A}/K_{S} estadísticamente elevadas hayan
experimentado evolución adaptativa.
Pueden usarse secuencias con cambios
significativos como sondas en genomas a partir de diferentes
poblaciones domesticadas para ver si los cambios de secuencia se
comparten por más de una población domesticada. Las secuencias de
genes de diferentes poblaciones domesticadas pueden obtenerse a
partir de bases de datos o, alternativamente, a partir de la
secuenciación directa de ADN amplificado mediante PCR de varias
poblaciones domesticadas diversas, no relacionadas. La presencia de
los cambios identificados en diferentes poblaciones domesticadas
indicará adicionalmente la significación evolutiva de los
cambios.
Pueden caracterizarse adicionalmente secuencias
con cambios significativos entre especies en cuanto a sus
identidades moleculares/genéticas y las funciones biológicas, usando
procedimientos y técnicas conocidos por los expertos ordinarios en
la materia. Por ejemplo, pueden localizarse las secuencias genética
y físicamente dentro del genoma del organismo usando programas
bioinformáticos públicamente disponibles. Los cambios significativos
recientemente identificados dentro de la secuencia de nucleótidos
pueden sugerir un posible papel del gen en la evolución del
organismo y una posible asociación con capacidades funcionales
únicas, potenciadas o alteradas. El supuesto gen con las secuencias
identificadas puede caracterizarse adicionalmente, por ejemplo,
mediante búsqueda de homólogos. La homología compartida del
supuesto gen con un gen conocido puede indicar una función o papel
biológico similar. Otro procedimiento a modo de ejemplo de
caracterización de una supuesta secuencia de gen es basándose en
motivos de secuencia conocidos. Se sabe que ciertos patrones de
secuencia codifican para regiones de proteínas que presentan
características biológicas específicas tales como secuencias señal,
dominios de unión a ADN o dominios transmembrana.
Las secuencias identificadas con cambios
significativos también pueden evaluarse adicionalmente observando
dónde se expresa el gen en cuanto a la especificidad de tejido o
tipo de célula. Por ejemplo, pueden usarse las secuencias
codificantes identificadas como sondas para llevar a cabo la
hibridación de ARNm in situ que revelará los patrones de
expresión de las secuencias. Los genes que se expresan en ciertos
tejidos pueden ser mejores candidatos para estar asociados con
funciones importantes asociadas con ese tejido, por ejemplo, tejido
del músculo esquelético. También puede determinarse el momento de la
expresión del gen durante cada fase de desarrollo de un miembro de
la especie.
Como otro procedimiento a modo de ejemplo de
caracterización de secuencias, pueden evaluarse los papeles
funcionales de secuencias de nucleótidos identificadas con cambios
significativos realizando ensayos funcionales para diferentes
alelos de un gen identificado en el organismo domesticado
transfectado, por ejemplo, en la planta o animal transgénico.
Como otro procedimiento a modo de ejemplo de
caracterización de secuencias, el uso de programas informáticos
permite la modelización y visualización de la estructura
tridimensional de las proteínas homólogas de un organismo
domesticado o ancestro. El conocimiento específico y exacto de qué
aminoácidos se han reemplazado en la(s) proteí-
na(s) del ancestro permite la detección de cambios estructurales que pueden asociarse con diferencias funcionales. Por tanto, el uso de técnicas de modelización está estrechamente asociado con la identificación de papeles funcionales tratada en el párrafo anterior. El uso de técnicas individuales o combinaciones de estas técnicas constituye parte de la presente invención.
na(s) del ancestro permite la detección de cambios estructurales que pueden asociarse con diferencias funcionales. Por tanto, el uso de técnicas de modelización está estrechamente asociado con la identificación de papeles funcionales tratada en el párrafo anterior. El uso de técnicas individuales o combinaciones de estas técnicas constituye parte de la presente invención.
Un gen de organismo domesticado identificado
mediante el procedimiento objeto puede usarse para identificar
genes homólogos en otras especies que comparten un ancestro común.
Por ejemplo, maíz, arroz, trigo, mijo y sorgo comparten un ancestro
común, y genes identificados en el maíz pueden conducir directamente
a genes homólogos en estas otras gramíneas. Igualmente, los tomates
y las patatas comparten un ancestro común, y se espera que los
genes identificados en los tomates mediante el procedimiento objeto
presenten homólogos en las patatas.
Estas secuencias identificadas mediante los
procedimientos descritos en la presente memoria pueden usarse para
identificar agentes que son útiles en la modulación de capacidades
funcionales alteradas, potenciadas o únicas en un organismo
domesticado y/o la corrección de defectos en estas capacidades
usando estas secuencias. Estos procedimientos emplean, por ejemplo,
técnicas de selección conocidas en la técnica, tales como sistemas
in vitro, sistemas de expresión basados en células y plantas
y animales transgénicos no humanos. El enfoque proporcionado por la
presente invención no sólo identifica genes que han evolucionado
rápidamente, sino que indica modulaciones que pueden realizarse a
la proteína que pueden no ser demasiado tóxicas porque existen en
otras especies.
La presente invención también proporciona
procedimientos de selección que usan los polinucleótidos y
polipéptidos identificados y caracterizados usando los
procedimientos descritos anteriormente. Estos procedimientos de
selección son útiles para identificar agentes que pueden modular
la(s) función/funciones de los polinucleótidos o
polipéptidos de una manera que sería útil para potenciar o reducir
una característica en un organismo domesticado. Generalmente, los
procedimientos conllevan poner en contacto por lo menos un agente
que va a someterse a prueba con o bien un organismo transgénico o
bien una célula que se ha transfectado con una secuencia de
polinucleótido identificada mediante los procedimientos descritos
anteriormente, o una preparación del polipéptido codificado por tal
secuencia de polinucleótido, en el que un agente se identifica por
su capacidad para modular la función o bien de la secuencia de
polinucleótido o bien del polipéptido. Por ejemplo, un agente puede
ser un compuesto que se aplica o se pone en contacto con una planta
o animal domesticado para inducir la expresión del gen identificado
en un momento deseado. Específicamente con respecto a plantas, puede
usarse un agente para inducir la floración en un momento
apropiado.
Tal como se usa en la presente memoria, el
término "agente" significa un compuesto biológico o químico tal
como una molécula orgánica o inorgánica sencilla o compleja, un
péptido, una proteína o un oligonucleótido. Puede sintetizarse una
amplia serie de compuestos, por ejemplo oligómeros, tales como
oligopéptidos y oligonucleótidos, y compuestos sintéticos orgánicos
e inorgánicos basados en diversas estructuras centrales, y éstos se
incluyen también en el término "agente". Además, diversas
fuentes naturales pueden proporcionar compuestos para la selección,
tales como extractos vegetales o animales, y similares. Los
compuestos pueden someterse a prueba individualmente o en
combinación entre sí.
"Modular la función" de un polinucleótido o
un polipéptido significa que se altera la función del polinucleótido
o polipéptido en comparación con no añadir un agente. La modulación
puede producirse a cualquier nivel que afecte a la función. La
función de un polinucleótido o polipéptido puede ser directa o
indirecta, y medirse directa o indirectamente. Una "función"
de un polinucleótido incluye, pero no se limita a, patrón/patrones
de replicación, traducción y expresión. Una función de un
polinucleótido también incluye funciones asociadas con un
polipéptido codificado dentro del polinucleótido. Por ejemplo, se
considera que un agente que actúa sobre un polinucleótido y afecta
a la expresión, conformación, plegado (u otras características
físicas), unión a otros restos (tales como ligandos), actividad (u
otras características funcionales), regulación de proteínas y/u
otros aspectos de la estructura o función de la proteína ha modulado
una función de polinucleótido. Las formas en las que un agente
eficaz puede actuar para modular la expresión de un polinucleótido
incluyen, pero no se limitan a, 1) modificar la unión de un factor
de transcripción a un elemento sensible al factor de transcripción
en el polinucleótido; 2) modificar la interacción entre dos factores
de transcripción necesarios para la expresión del polinucleótido;
3) alterar la capacidad de un factor de transcripción necesario para
que la expresión del polinucleótido entre en el núcleo; 4) inhibir
la activación de un factor de transcripción implicado en la
transcripción del polinucleótido; 5) modificar un receptor de
superficie celular que interacciona normalmente con un ligando y
cuya unión del ligando da como resultado la expresión del
polinucleótido; 6) inhibir la inactivación de un componente de la
cascada de transducción de señales que conduce a la expresión del
polinucleótido; y 7) potenciar la activación de un factor de
transcripción implicado en la transcripción del polinucleótido.
Una "función" de un polipéptido incluye,
pero no se limita a, conformación, plegado (u otras características
físicas), unión a otros restos (tales como ligandos), actividad (u
otras características funcionales) y/u otros aspectos de las
funciones o estructura de la proteína. Por ejemplo, se considera que
un agente que actúa sobre un polipéptido y afecta a su
conformación, plegado (u otras características físicas), unión a
otros restos (tales como ligandos), actividad (u otras
características funcionales) y/u otros aspectos de las funciones o
estructura de la proteína ha modulado una función de polipéptido.
Las formas en las que un agente eficaz puede actuar para modular la
función de un polipéptido incluyen, pero no se limitan a, 1) cambiar
la conformación, plegado u otras características físicas; 2)
cambiar la fuerza de unión a su ligando natural o cambiar la
especificidad de unión a ligandos; y 3) alterar la actividad del
poli-
péptido.
péptido.
Generalmente, la elección de agentes que van a
seleccionarse está gobernada por diversos parámetros, tales como la
diana de polinucleótido o polipéptido particular, su función
percibida, su estructura tridimensional (si se conoce o se supone),
y otros aspectos del diseño racional de fármacos. También pueden
usarse técnicas de química combinatoria para generar numerosas
permutaciones de candidatos. Los expertos en la materia pueden
idear y/u obtener agentes adecuados para las pruebas.
Los ensayos de selección in vivo
descritos en la presente memoria pueden presentar diversas ventajas
con respecto a los ensayos de selección de fármacos convencionales:
1) si un agente debe entrar en una célula para lograr un efecto
terapéutico deseado, un ensayo in vivo puede dar una
indicación sobre si el agente puede entrar en una célula; 2) un
ensayo de selección in vivo puede identificar agentes que, en
el estado en el que se añaden al sistema de ensayo, son ineficaces
para provocar por lo menos una característica que está asociada con
la modulación de la función de polinucleótido o polipéptido, pero
que se modifican por los componentes celulares una vez dentro de
una célula de tal manera que se vuelven agentes eficaces; 3) de la
manera más importante, un sistema de ensayo in vivo permite
la identificación de agentes que afectan a cualquier componente de
una ruta que finalmente da como resultado características que están
asociadas con la función de polinucleótido o polipéptido.
En general, la selección puede llevarse a cabo
añadiendo un agente a una muestra de células apropiadas que se han
transfectado con un polinucleótido identificado usando los
procedimientos de la presente invención, y monitorizando el efecto,
es decir, la modulación de una función del polinucleótido o del
polipéptido codificado dentro del polinucleótido. El experimento
incluye preferentemente una muestra control que no recibe agente
candidato. Entonces se comparan las células tratadas y sin tratar
mediante cualquier criterio fenotípico adecuado, incluyendo, pero
sin limitarse a, análisis con microscopio, pruebas de viabilidad,
capacidad para replicarse, examen histológico, el nivel de un
polipéptido o ARN particular asociado con las células, el nivel de
actividad enzimática expresado por las células o lisados celulares,
las interacciones de las células cuando se exponen a agentes
infecciosos, y la capacidad de las células para interaccionar con
otras células o compuestos. Las diferencias entre células tratadas
y sin tratar indican efectos atribuibles al agente candidato. De
manera óptima, el agente presenta un efecto mayor sobre las células
experimentales que sobre las células control. Las células huésped
apropiadas incluye, pero no se limitan a, células eucariotas,
preferentemente células de mamíferos. La elección de la célula
dependerá por lo menos parcialmente de la naturaleza del ensayo
contemplado.
Para realizar pruebas para detectar agentes que
regulan por incremento la expresión de un polinucleótido, se pone
en contacto una célula huésped adecuada transfectada con un
polinucleótido de interés, de tal manera que se expresa el
polinucleótido (tal como se usa en la presente memoria, la expresión
incluye transcripción y/o traducción), con un agente que va a
someterse a prueba. Se someterá a prueba un agente para determinar
su capacidad para dar como resultado un aumento de la expresión de
ARNm y/o polipéptido. En la técnica, son bien conocidos
procedimientos para preparar vectores y realizar la transfección.
"Transfección" abarca cualquier procedimiento de introducción
de la secuencia exógena, incluyendo, por ejemplo, lipofección,
transducción, infección o electroporación. El polinucleótido
exógeno puede mantenerse en un vector no integrado (tal como un
plásmido) o puede integrarse dentro del genoma del huésped.
Para identificar agentes que activan
específicamente la transcripción, pueden unirse regiones reguladoras
de la transcripción a un gen indicador y añadirse el constructo a
una célula huésped apropiada. Tal como se usa en la presente
memoria, el término "gen indicador" significa un gen que
codifica para un producto génico que puede identificarse (es decir,
una proteína indicadora). Genes indicadores incluyen, pero no se
limitan a, fosfatasa alcalina, cloramfenicol acetiltransferasa,
\beta-galactosidasa, luciferasa y proteína
fluorescente verde (GFP). Procedimientos de identificación para los
productos de genes indicadores incluyen, pero no se limitan a,
ensayos enzimáticos y ensayos fluorimétricos. En la técnica, son
bien conocidos genes indicadores y ensayos para detectar sus
productos y se describen, por ejemplo, en Ausubel et al.
(1987) y actualizaciones periódicas. También hay genes indicadores,
ensayos de genes indicadores y kits de reactivos fácilmente
disponibles a partir de fuentes comerciales. Ejemplos de células
apropiadas incluyen, pero no se limitan a, células fúngicas, de
levadura, de mamífero y otras células eucariotas. Un experto
ordinario en la materia estará al corriente de las técnicas para
transfectar células eucariotas, incluyendo la preparación de un
vector adecuado, tal como un vector viral; transportar el vector al
interior de la célula, tal como mediante electroporación; y
seleccionar células que se han transformado, tal como usando un
elemento indicador o de sensibilidad a fármaco. El efecto de un
agente sobre la transcripción de la región reguladora en estos
constructos se evaluará mediante la actividad del producto de gen
indicador.
Además del aumento en la expresión en
condiciones mencionadas anteriormente en las que normalmente está
reprimida, puede reducirse la expresión cuando normalmente se
expresaría. Un agente puede lograr esto mediante una reducción de
la tasa de transcripción y el sistema de gen indicador descrito
anteriormente sería un medio para someter esto a ensayo. Sería
necesario para someter a ensayo tales agentes que las células
huésped sean permisivas para la expresión.
Pueden usarse células que transcriben ARNm (del
polinucleótido de interés) para identificar agentes que modulan
específicamente la semivida de ARNm y/o la traducción de ARNm. Tales
células también se usarán para someter a ensayo el efecto de un
agente sobre el tratamiento y/o modificación tras la traducción del
polipéptido. Un agente puede modular la cantidad de polipéptido en
una célula modificando la renovación (es decir, aumento o reducción
de la semivida) del polipéptido. La especificidad del agente en lo
que respecta al ARNm y polipéptido se determinará examinando los
productos en ausencia del agente y examinando los productos de ARNm
y polipéptidos no relacionados. Los expertos en la materia conocen
bien procedimientos para examinar la semivida de ARNm, tratamiento
de proteínas y renovación de proteínas.
Los procedimientos de selección in vivo
también pueden ser útiles en la identificación de agentes que
modulan la función de polipéptido directamente mediante la
interacción con el polipéptido. Tales agentes pueden bloquear las
interacciones normales polipéptido-ligando, si las
hay, o pueden potenciar o estabilizar tales interacciones. Tales
agentes también pueden alterar una conformación del polipéptido. El
efecto del agente puede determinarse usando reacciones de
inmunoprecipitación. Se usarán anticuerpos apropiados para
precipitar el polipéptido y cualquier proteína estrechamente
asociada con el mismo. Comparando los polipéptidos
inmunoprecipitados de células tratadas y de células sin tratar,
puede identificarse un agente que aumenta o inhibe las interacciones
polipéptido-ligando, si las hay. También pueden
evaluarse las interacciones polipéptido-ligando
usando reactivos de reticulación que convierten una interacción
estrecha, pero no covalente, entre polipéptidos en una interacción
covalente. Los expertos en la materia conocen bien técnicas para
examinar las interacciones proteína-proteína. Los
expertos en la materia también conocen bien técnicas para evaluar la
conformación de la proteína.
También se entiende que los procedimientos de
selección pueden implicar procedimientos in vitro, tales
como sistemas de transcripción o traducción libres de células. En
esos sistemas, se deja que se produzca la transcripción o
traducción, y se somete a prueba un agente para determinar su
capacidad para modular la función. Para cualquier ensayo que
determine si un agente modula la traducción de ARNm o un
polinucleótido, puede usarse un sistema de transcripción/traducción
in vitro. Estos sistemas están comercialmente disponibles y
proporcionan medios in vitro para producir ARNm
correspondiente a una secuencia de polinucleótido de interés. Tras
preparar el ARNm, puede traducirse in vitro y compararse los
productos de traducción. La comparación de los productos de
traducción entre un sistema de expresión in vitro que no
contiene ningún agente (control negativo) con un sistema de
expresión in vitro que contiene un agente indica si el agente
está afectando a la traducción. La comparación de los productos de
traducción entre polinucleótidos control y de prueba indica si el
agente, si actúa a este nivel, está afectando de manera selectiva a
la traducción (a diferencia de afectar a la traducción de un modo
general, no selectivo y no específico). La modulación de la función
del polipéptido puede lograrse de muchas maneras incluyendo, pero
sin limitarse a, los ensayos in vivo e in vitro
enumerados anteriormente así como en ensayos in vitro que
usan preparaciones de proteínas. Pueden extraerse y/o purificarse
polipéptidos a partir de fuentes naturales o recombinantes para
crear preparaciones de proteínas. Puede añadirse un agente a una
muestra de una preparación de proteínas y monitorizarse el efecto;
es decir si el agente actúa sobre un polipéptido y afecta, y cómo
lo hace, a su conformación, plegado (u otras características
físicas), unión a otros restos (tales como ligandos), actividad (u
otras características funcionales) y/u otros aspectos de las
funciones o estructura de la proteína, se considera que ha modulado
la función del polipéptido.
En un ejemplo para un ensayo para detectar un
agente que se une a un polipéptido codificado por un polinucleótido
identificado mediante los procedimientos descritos en la presente
memoria, en primer lugar se expresa de manera recombinante un
polipéptido en un sistema de expresión procariota o eucariota como
una proteína nativa o de fusión en la que se conjuga un polipéptido
(codificado por un polinucleótido identificado tal como se describió
anteriormente) con una proteína o epítopo bien caracterizado.
Entonces se purifica el polipéptido recombinante, por ejemplo,
mediante inmunoprecipitación usando anticuerpos apropiados o
anticuerpos anti-epítopo o mediante unión a ligando
inmovilizado del conjugado. Entonces se usa una columna de afinidad
preparada con polipéptido o proteína de fusión para examinar una
mezcla de compuestos que se han marcado apropiadamente con
etiquetas. Etiquetas adecuadas incluyen, pero no se limitan a,
fluorocromos, radioisótopos, enzimas y compuestos
quimioluminiscentes. Pueden separarse los compuestos unidos y no
unidos mediante lavados usando diversas condiciones (por ejemplo
alto contenido en sal, detergente) que se emplean de manera
rutinaria por los expertos en la materia. Puede minimizarse la
unión no específica a la columna de afinidad mediante un
aclaramiento previo de la mezcla de compuestos usando una columna
de afinidad que contiene simplemente el conjugado o el epítopo.
Pueden usarse procedimientos similares para seleccionar
un(os) agente(s) que compiten para la unión a
polipéptidos. Además de la cromatografía por afinidad, hay otras
técnicas tales como medir el cambio de la temperatura de fusión o
la anisotropía de fluorescencia de una proteína que cambiará al
unirse a otra molécula. Por ejemplo, puede llevarse a cabo un
ensayo BIAcore usando un chip detector (suministrado por Pharmacia
Biosensor, Stitt et al. (1995) Cell 80:
661-670) que está covalentemente acoplado al
polipéptido para determinar la actividad de unión de diferentes
agentes.
También se entiende que los procedimientos de
selección in vitro de esta invención incluyen el diseño de
fármacos estructural o racional en el que la secuencia de
aminoácidos, estructura atómica tridimensional u otra propiedad (o
propiedades) de un polipéptido proporcionan una base para diseñar un
agente que se espera que se una a un polipéptido. Generalmente, el
diseño y/o elección de agentes en este contexto está gobernado por
varios parámetros, tales como comparación en paralelo de las
estructuras de los polipéptidos ancestrales homólogos y los de un
organismo domesticado, la función percibida de la diana de
polipéptido, su estructura tridimensional (si se conoce o se
supone), y otros aspectos del diseño de fármacos racional. También
pueden usarse técnicas de química combinatoria para generar
numerosas permutaciones de agentes candidatos.
\global\parskip0.900000\baselineskip
También se contempla en los procedimientos de
selección de la invención los sistemas de plantas y animales
transgénicos no humanos, que se conocen en la técnica.
Los procedimientos de selección descritos
anteriormente representan selecciones primarias, diseñadas para
detectar cualquier agente que puede mostrar actividad que modula la
función de un polinucleótido o polipéptido. El experto en la
materia reconocerá que probablemente serán necesarias pruebas
secundarias con el fin de evaluar adicionalmente un agente. Por
ejemplo, una selección secundaria puede comprender someter a prueba
el/los agente(s) en un ensayo de infectividad usando ratones
y otros modelos animales (tales como rata), que se conocen en la
técnica o la propia planta o animal domesticado. Además, se
realizará un ensayo de citotoxicidad como corroboración adicional
de que un agente que dio positivo en la prueba en una selección
primaria será adecuado para su utilización en organismos vivos.
Cualquier ensayo para determinar la citotoxicidad será adecuado para
este fin, incluyendo, por ejemplo el ensayo MTT (Promega).
La invención también incluye agentes
identificados mediante los procedimientos de selección descritos en
la presente memoria.
Se proporcionan los siguientes ejemplos para
ayudar adicionalmente a los expertos ordinarios en la materia. Se
pretende que tales ejemplos sean ilustrativos y por tanto no deben
considerarse como limitativos de la invención. Se describen varias
modificaciones y variaciones a modo de ejemplo en esta solicitud y
otras resultarán evidentes para los expertos en la materia. Se
considera que tales variaciones entran dentro del alcance de la
invención tal como se describe y reivindica en la presente
memoria.
Se construye una biblioteca de ADNc de planta o
animal domesticado usando un tejido apropiado a partir de la planta
o animal. Un experto ordinario en la materia conocerá el tejido
apropiado para analizar según el rasgo de interés.
Alternativamente, puede usarse el organismo entero. Por ejemplo, se
sabe que las plantas de semillero de 1 día de edad expresan la
mayor parte de los genes de la planta.
Se extrae ARN total del tejido (kit RNeasy,
Quiagen; kit de ARN total rápido libre de ARNasa, 5
Prime - -3 Prime, Inc.) y se determinan la integridad y
pureza del ARN según procedimientos de clonación molecular
convencionales. Se aísla ARN poli A+ (Mini-columnas
de centrifugación de oligo(dT)celulasa, 5
Prime - -3 Prime, Inc.) y se usa como molde para la
transcripción inversa de ADNc con oligo(dT) como cebador. Se
trata el ADNc sintetizado y se modifica para la clonación usando
kits comercialmente disponibles. Entonces se empaquetan los
recombinantes y se propagan en una línea de célula huésped. Se
amplifican las partes de las mezclas de empaquetamiento y se
conserva el resto antes de la amplificación. Puede normalizarse la
biblioteca y se determinan los números de recombinantes
independientes en la biblioteca.
Se preparan cebadores adecuados basados en un
gen de organismo domesticado candidato y se usan para la
amplificación mediante PCR de ADNc de ancestro o bien de una
biblioteca de ADNc o bien de ADNc preparado a partir de ARNm. Se
secuencian los clones de ADNc de ancestro seleccionados de la
biblioteca de ADNc usando un secuenciador automático, tal como un
instrumento ABI 377. Se usan cebadores usados comúnmente en el
vector de clonación tales como los cenadores M13 universal e
inverso para llevar a cabo la secuenciación. Para los insertos que
no están completamente secuenciados mediante secuenciación final,
pueden usarse cebadores a medida o terminadores marcados con
etiqueta de colorante para completar los huecos restantes.
Inicialmente se comprueban las diferencias de
secuencia detectadas para determinar la precisión, por ejemplo,
hallando los puntos en los que hay diferencias entre las secuencias
de organismo domesticado y ancestro; comprobando el fluorograma
(cromatograma) de la secuencia para determinar si las bases que
parecen únicas para el organismo domesticado corresponden a señales
fuertes, claras específicas para la base en cuestión; comprobando
las correspondencias del organismo domesticado para ver si hay más
de una secuencia que corresponde a un cambio de secuencia; y otros
procedimientos conocidos en la técnica, según se necesite. Múltiples
entradas de secuencia de organismo domesticado para el mismo gen
que presentan el mismo nucleótido en una posición en la que hay un
nucleótido de ancestro diferente proporcionan apoyo independiente
de que la secuencia de organismo domesticado sea precisa, y de que
la diferencia domesticado/ancestro es real. Tales cambios se
examinan usando información de bases de datos públicas o
comerciales y el código genético para determinar si estos cambios de
secuencia de ADN dan como resultado un cambio en la secuencia de
aminoácidos de la proteína codificada. Las secuencias también
pueden examinarse mediante secuenciación directa de la proteína
codificada.
\global\parskip1.000000\baselineskip
Se someten las secuencias de planta o animal
domesticado y ancestro de tipo natural en comparación a un análisis
de K_{A}/K_{S}. En este análisis, se usan programas informáticos
pública o comercialmente disponibles, tales como Li 93 e INA, para
determinar el número de cambios no sinónimos por sitio (K_{A})
dividido por el número de cambios sinónimos por sitio (K_{S})
para cada secuencia en estudio tal como se describió anteriormente.
Pueden usarse regiones codificantes de longitud completa o segmentos
parciales de una región codificante. Cuanto mayor sea la razón
K_{A}/K_{S}, más probable es que una secuencia haya
experimentado una evolución adaptativa. La significación
estadística de los valores de K_{A}/K_{S} se determina usando
procedimientos estadísticos establecidos y programas disponibles
tales como la prueba de la t.
Para proporcionar adicionalmente apoyo a la
significación de una razón K_{A}/K_{S} elevada, la secuencia de
organismo domesticado en estudio puede compararse con otra especie
próxima desde un punto de vista evolutivo. Estas comparaciones
permiten una discriminación adicional en cuanto a si los cambios
evolutivos adaptativos son únicos para el linaje de la planta o
animal domesticado en comparación con otras especies estrechamente
relacionadas. También pueden examinarse las secuencias mediante
secuenciación directa del gen de interés a partir de representantes
de diversas poblaciones domesticadas para evaluar hasta qué grado se
conserva la secuencia en la planta o animal domesticado.
\vskip1.000000\baselineskip
Se construye una biblioteca de ADNc de teosinte
usando plantas de semillero de 1 día de edad de teosinte enteras, u
otros tejidos apropiados de la planta. Se extrae ARN total del
tejido de las plantas de semillero y se determinan la integridad y
pureza del ARN según procedimientos de clonación molecular
convencionales. Se selecciona ARN poli A+ y se usa como molde para
la transcripción inversa de ADNc con oligo(dT) como cebador.
Se trata el ADNc sintetizado y se modifica para su clonación usando
kits comercialmente disponibles. Entonces se empaquetan los
recombinantes y se propagan en una línea de célula huésped. Se
amplifican las partes de las mezclas de empaquetamiento y se
conserva el resto antes de la amplificación. Se usa el ADN
recombinante para transfectar células huésped de E. coli,
usando procedimientos establecidos. Puede normalizarse la biblioteca
y se determinan los números de recombinantes independientes en la
biblioteca.
\vskip1.000000\baselineskip
Se secuencian clones de ADNc de plantas de
semillero de teosinte seleccionadas aleatoriamente a partir de la
biblioteca de ADNc usando un secuenciador automático, tal como el
instrumento ABI 377. Se usan cebadores comúnmente utilizados en el
vector de clonación tales como los cebadores M13 universal e inverso
para llevar a cabo la secuenciación. Para los insertos que no están
completamente secuenciados mediante secuenciación final, se usan
terminadores marcados con etiqueta de colorante para completar los
huecos restantes.
Se comparan las secuencias de teosinte
resultantes con secuencias de maíz domesticado mediante búsquedas en
bases de datos. Hay bases de datos de genomas pública o
comercialmente disponibles para varias especies, incluyendo el
maíz. Un ejemplo de una base de datos del maíz puede encontrarse en
www.central.edu/homepages/liedlb/-genetics/gene-site.hml.
Otras bases de datos apropiadas de EST (etiqueta de secuencia
expresada) del maíz son de mantenimiento y dominio privado. Se
recuperan y analizan las "correspondencias" con alta
puntuación, es decir, secuencias que muestran una similitud
significativa (por ejemplo, >80%) tras el análisis de homología.
Entonces se alinean las dos secuencias homólogas usando el programa
de alineación CLUSTAL V desarrollado por Higgins et al.
Mediante la alineación puede detectarse y registrarse cualquier
divergencia de secuencia, incluyendo sustitución, inserción y
deleción de nucleótidos.
Inicialmente se comprueban las diferencias de
secuencia detectadas para determinar la precisión hallando los
puntos en los que hay diferencias entre las secuencias de teosinte y
maíz; comprobando el fluorograma (cromatograma) de la secuencia
para determinar si las bases que parecen únicas para el maíz
corresponden a señales fuertes, claras específicas para la base en
cuestión; comprobando las correspondencias del maíz para observar si
hay más de una secuencia de maíz que corresponde a un cambio de
secuencia; y otros procedimientos conocidos en la técnica, según se
necesite. Múltiples entradas de secuencia de maíz para el mismo gen
que presentan el mismo nucleótido en una posición en la que hay un
nucleótido de teosinte diferente proporcionan apoyo independiente
de que la secuencia de maíz es precisa, y de que la diferencia
maíz/teosinte es real. Tales cambios se examinan usando información
de bases de datos públicas/comerciales y el código genético para
determinar si estos cambios de secuencia de ADN dan como resultado
un cambio en la secuencia de aminoácidos de la proteína codificada.
Las secuencias también pueden examinarse mediante secuenciación
directa de la proteína codificada.
Se someten las secuencias de teosinte y maíz en
comparación a un análisis de K_{A}/K_{S}. En este análisis, se
usan programas informáticos pública o comercialmente disponibles,
tales como Li 93 e INA, para determinar el número de cambios no
sinónimos por sitio (K_{A}) dividido por el número de cambios
sinónimos por sitio (K_{S}) para cada secuencia en estudio tal
como se describió anteriormente. Se ha demostrado que esta razón,
K_{A}/K_{S}, es un reflejo del grado en el que se ha producido
evolución adaptativa, es decir selección positiva, en la secuencia
en estudio. Normalmente se han usado regiones codificantes de
longitud completa en estos análisis comparativos. Sin embargo,
también pueden usarse eficazmente segmentos parciales de una región
codificante. Cuanto mayor sea la razón K_{A}/K_{S}, más probable
es que una secuencia haya experimentado una evolución adaptativa.
La significación estadística de los valores de K_{A}/K_{S} se
determina usando procedimientos estadísticos establecidos y
programas disponibles tales como la prueba de la t. Es muy probable
que aquellos genes que muestran razones K_{A}/K_{S}
estadísticamente elevadas entre genes de teosinte y maíz hayan
experimentado evolución adaptativa.
Para proporcionar adicionalmente apoyo a la
significación de una razón K_{A}/K_{S} elevada, la secuencia en
estudio puede compararse en otra especie de maíz ancestral. Estas
comparaciones permiten una discriminación adicional en cuanto a si
los cambios evolutivos adaptativos son únicos para el linaje de maíz
domesticado en comparación con otros ancestros. También pueden
examinarse las secuencias mediante secuenciación directa del gen de
interés a partir de repre-
sentantes de diversas poblaciones de maíz para evaluar hasta qué grado se conserva la secuencia en la especie de maíz.
sentantes de diversas poblaciones de maíz para evaluar hasta qué grado se conserva la secuencia en la especie de maíz.
La comparación de secuencias de teosinte y maíz
domesticado y disponibles en Genbank (www.ncbi.nlm.gov/Web/
Genbank/index.html) reveló por lo menos cuatro genes homólogos: ceroso, A1*, A1 y globulina. Se compararon todas las secuencias disponibles para estos genes tanto de maíz como de teosinte. Se determinaron las razones K_{A}/K_{S} usando Li93 y/o INA:
Genbank/index.html) reveló por lo menos cuatro genes homólogos: ceroso, A1*, A1 y globulina. Se compararon todas las secuencias disponibles para estos genes tanto de maíz como de teosinte. Se determinaron las razones K_{A}/K_{S} usando Li93 y/o INA:
Aunque se anticipó que el polimorfismo
(múltiples copias alélicas) y/o poliploidía (más de 2 conjuntos de
cromosomas por célula) observados en el maíz podrían hacer complejo
o difícil el análisis de K_{A}/K_{S}, se encontró que no era el
caso.
Aunque los valores anteriores de K_{A}/K_{S}
indican que estos genes no se seleccionan positivamente este
ejemplo ilustra que el procedimiento de K_{A}/K_{S} puede
aplicarse a secuencias de maíz y teosinte obtenidas de una base de
datos.
Pueden evaluarse los papeles funcionales de un
gen de maíz positivamente seleccionado obtenido según los
procedimientos de los ejemplos 4-7 realizando
evaluaciones de cada alelo del gen en una planta de maíz
transgénico. Puede crearse una planta transgénica usando una
adaptación del procedimiento descrito en Peng et al. (1999)
Nature 400:256-261. La exploración
fisiológica, morfológica y/o bioquímica de la planta transgénica o
extractos de proteína de la misma permitirá la asociación de cada
alelo con un fenotipo particular.
El análisis de QTL (locus de rasgo cuantitativo)
ha definido regiones cromosómicas que contienen los genes que
controlan varios rasgos fenotípicos de interés en el maíz,
incluyendo la altura de la planta y el contenido en aceite.
Mapeando cada gen positivamente seleccionado mediante este
procedimiento en uno de los QTL conocidos, puede identificarse de
manera rápida y conclusiva el rasgo específico controlado por cada
gen positivamente seleccionado.
Aunque la invención anterior se ha descrito en
cierto detalle a título ilustrativo y ejemplificativo para mejorar
la claridad y la comprensión, resultará evidente para los expertos
ordinarios en la materia que pueden ponerse en práctica ciertos
cambios y modificaciones. Por tanto, la descripción y los ejemplos
no deben interpretarse como limitativos del alcance de la
invención, que se describe mediante las reivindicaciones
adjuntas.
Claims (12)
1. Procedimiento para identificar una secuencia
de polinucleótido que codifica para un polipéptido de un organismo
domesticado, en el que dicho polipéptido puede estar asociado con un
rasgo estética o comercialmente relevante que es único, está
potenciado o alterado en el organismo domesticado en comparación con
un ancestro de tipo natural de dicho organismo domesticado, que
comprende:
- (a)
- comparar secuencias de nucleótidos que codifican para proteínas de dicho organismo domesticado con secuencias de nucleótidos que codifican para proteínas de dicho ancestro de tipo natural; y
- (b)
- seleccionar una secuencia de polinucleótido que codifica para proteínas en el organismo domesticado que contiene un cambio de nucleótido que es significativo desde el punto de vista evolutivo en comparación con una secuencia correspondiente en el ancestro de tipo natural, tal como se define mediante una razón (Ka/Ks) de la tasa de sustitución no sinónima (Ka) con respecto a la tasa de sustitución sinónima (Ks), en la secuencia de polinucleótido que codifica para proteínas parcial o completa, de \geq 0,75.
2. Procedimiento según la reivindicación 1, que
comprende asimismo caracterizar la secuencia seleccionada en cuanto
a las identidades moleculares/genéticas y la función biológica.
3. Procedimiento según la reivindicación 1 ó 2,
en el que el organismo domesticado es una planta domesticada cuyo
ancestro de tipo natural es conocido.
4. Procedimiento según la reivindicación 3, en
el que el rasgo es rendimiento, floración de día de duración corta,
contenido en proteína o en aceite, sabor, facilidad de recolección o
resistencia a la enfermedad o a la sequía.
5. Procedimiento según la reivindicación 3 ó 4,
en el que la planta domesticada es maíz, arroz, tomate o patata.
6. Procedimiento según la reivindicación 5, en
el que la planta domesticada es maíz y el ancestro de tipo natural
es teosinte.
7. Procedimiento según la reivindicación 1 ó 2,
en el que el organismo domesticado es un animal domesticado cuyo
ancestro de tipo natural es conocido.
8. Procedimiento según la reivindicación 7, en
el que el rasgo es el contenido en grasa o en proteína, la
producción de leche, tiempo hasta el pleno desarrollo, docilidad,
fecundidad o resistencia a la enfermedad.
9. Procedimiento según la reivindicación 7 u 8,
en el que el animal domesticado es un cerdo, animal de ganado,
caballo, perro o gato.
10. Procedimiento según cualquiera de las
reivindicaciones anteriores, en el que las secuencias comparadas son
de ADNc.
11. Procedimiento de identificación de un agente
que puede modular el rasgo según la reivindicación 1, comprendiendo
dicho procedimiento poner en contacto por lo menos un agente
candidato con una célula o un organismo transgénico no humano que
expresa la secuencia de polinucleótido identificada en la
reivindicación 1, en el que el agente se identifica por su
capacidad para modular la función del polipéptido codificado por el
polinucleótido identificado en la reivindicación 1.
12. Procedimiento para correlacionar un cambio
de nucleótido significativo desde el punto de vista evolutivo con el
rasgo según la reivindicación 1, que comprende:
- (a)
- identificar una secuencia de nucleótidos según la reivindicación 1; y
- (b)
- analizar el efecto funcional de la presencia o ausencia de la secuencia identificada en el organismo domesticado.
Applications Claiming Priority (8)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US09/368,810 US6274319B1 (en) | 1999-01-29 | 1999-08-05 | Methods to identify evolutionarily significant changes in polynucleotide and polypeptide sequences in domesticated plants and animals |
| US368810 | 1999-08-05 | ||
| PCT/US1999/020209 WO2000012764A1 (en) | 1998-09-02 | 1999-09-01 | Methods to identify polynucleotide and polypeptide sequences which may be associated with physiological and medical conditions |
| WOPCT/US99/20209 | 1999-09-01 | ||
| US15282599P | 1999-09-07 | 1999-09-07 | |
| US591435 | 2000-06-09 | ||
| US09/591,435 US6280953B1 (en) | 1998-01-30 | 2000-06-09 | Methods to identify polynucleotide and polypeptide sequences which may be associated with physiological and medical conditions |
| PCT/US2000/040517 WO2001011088A2 (en) | 1999-08-05 | 2000-08-01 | Methods to identify evolutionarily significant changes in polynucleotide and polypeptide sequences in domesticated plants and animals |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| ES2292467T3 true ES2292467T3 (es) | 2008-03-16 |
Family
ID=27387327
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES00960208T Expired - Lifetime ES2292467T3 (es) | 1999-08-05 | 2000-08-01 | Procedimiento para identificar cambios significativos desde el punto de vista evolutivo en secuencias de polinucleotidos y de polipeptidos en plantas y animales domesticados. |
Country Status (9)
| Country | Link |
|---|---|
| EP (1) | EP1250449B1 (es) |
| JP (1) | JP2004500036A (es) |
| AT (1) | ATE374834T1 (es) |
| AU (1) | AU784869B2 (es) |
| CA (1) | CA2390094A1 (es) |
| DE (1) | DE60036645T2 (es) |
| DK (1) | DK1250449T3 (es) |
| ES (1) | ES2292467T3 (es) |
| WO (1) | WO2001011088A2 (es) |
Families Citing this family (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| AU2003217221B2 (en) * | 2002-01-16 | 2008-11-27 | Evolutionary Genomics, Inc. | Methods to identify evolutionarily significant changes in polynucleotide and polypeptide sequences in domesticated plants and animals |
| JP2009297039A (ja) * | 2002-01-16 | 2009-12-24 | Evolutionary Genomics Inc | 栽培用植物および家畜化動物中のポリヌクレオチドおよびポリペプチド配列における進化的に有意の変化を同定するための方法 |
| CA2512110A1 (en) | 2002-12-31 | 2004-07-22 | Mmi Genomics, Inc. | Compositions, methods, and systems for inferring bovine breed |
| KR20080063296A (ko) * | 2005-09-02 | 2008-07-03 | 에보류셔너리 제노믹스 인크 | Eg8798과 eg9703 폴리뉴클레오티드 및 그것의 용도 |
| CN114300050A (zh) * | 2021-12-29 | 2022-04-08 | 南京农业大学 | 一种鉴定谱系特异性扩增基因家族的方法 |
Family Cites Families (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO1984003716A1 (en) * | 1983-03-21 | 1984-09-27 | John A Webster Jr | Method for identifying and characterizing organisms |
-
2000
- 2000-08-01 JP JP2001515335A patent/JP2004500036A/ja active Pending
- 2000-08-01 WO PCT/US2000/040517 patent/WO2001011088A2/en not_active Ceased
- 2000-08-01 CA CA002390094A patent/CA2390094A1/en not_active Abandoned
- 2000-08-01 AT AT00960208T patent/ATE374834T1/de not_active IP Right Cessation
- 2000-08-01 AU AU71399/00A patent/AU784869B2/en not_active Ceased
- 2000-08-01 EP EP00960208A patent/EP1250449B1/en not_active Expired - Lifetime
- 2000-08-01 ES ES00960208T patent/ES2292467T3/es not_active Expired - Lifetime
- 2000-08-01 DK DK00960208T patent/DK1250449T3/da active
- 2000-08-01 DE DE60036645T patent/DE60036645T2/de not_active Expired - Lifetime
Also Published As
| Publication number | Publication date |
|---|---|
| CA2390094A1 (en) | 2001-02-15 |
| EP1250449A2 (en) | 2002-10-23 |
| WO2001011088A3 (en) | 2001-12-13 |
| JP2004500036A (ja) | 2004-01-08 |
| DK1250449T3 (da) | 2007-11-05 |
| EP1250449B1 (en) | 2007-10-03 |
| DE60036645T2 (de) | 2008-07-17 |
| DE60036645D1 (de) | 2007-11-15 |
| ATE374834T1 (de) | 2007-10-15 |
| AU7139900A (en) | 2001-03-05 |
| WO2001011088A2 (en) | 2001-02-15 |
| AU784869B2 (en) | 2006-07-13 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Morgil et al. | Single Nucleotide Polymorphisms (SNPs) in Plant Genetics and | |
| Lind et al. | Genome of the Komodo dragon reveals adaptations in the cardiovascular and chemosensory systems of monitor lizards | |
| Singh et al. | Marker-assisted plant breeding: principles and practices | |
| Yang et al. | Review on the development of genotyping methods for assessing farm animal diversity | |
| Emmrich et al. | A draft genome of grass pea (Lathyrus sativus), a resilient diploid legume | |
| Naqvi | Application of molecular genetic technologies in livestock production: potentials for developing countries | |
| US10337072B2 (en) | Copy number detection and methods | |
| Blitz et al. | A catalog of Xenopus tropicalis transcription factors and their regional expression in the early gastrula stage embryo | |
| US6274319B1 (en) | Methods to identify evolutionarily significant changes in polynucleotide and polypeptide sequences in domesticated plants and animals | |
| Poczai et al. | Genomics meets biodiversity: advances in molecular marker development and their applications in plant genetic diversity assessment | |
| AU769931B2 (en) | Methods to identify polynucleotide and polypeptide sequences which may be associated with physiological and medical conditions | |
| Miller et al. | The gene pool concept applied to crop wild relatives: An evolutionary perspective | |
| ES2292467T3 (es) | Procedimiento para identificar cambios significativos desde el punto de vista evolutivo en secuencias de polinucleotidos y de polipeptidos en plantas y animales domesticados. | |
| Gajewska et al. | Forward genetics approach reveals a mutation in bHLH transcription factor-encoding gene as the best candidate for the root hairless phenotype in barley | |
| US20240294968A1 (en) | Systems and methods for verifying biological samples with whole genome sequencing | |
| Dida | Molecular markers in breeding of crops: recent progress and advancements | |
| Geigl | Palaeogenetics of cattle domestication: Methodological challenges for the study of fossil bones preserved in the domestication centre in Southwest Asia | |
| TW201606084A (zh) | 預測或判定作物表現型之方法 | |
| Deng | Functional genomics of blood pressure determination: Dissecting and assembling a polygenic trait by experimental genetics | |
| Borlay et al. | Molecular characterization of doum palm (Hyphaene compressa) from selected regions of Kenya using chloroplast simple sequence repeats (cpSSR) markers | |
| BRPI0614050A2 (pt) | métodos para peneiramento de polimorfismos de hibridização especìficos de gene (gshps) e seus usos no mapeamento genético e desenvolvimento de marcador | |
| Ahmed et al. | An introduction to DNA technologies and their role in livestock production: a review. | |
| US20250040501A1 (en) | Methods and assays for identifying, creating, and cultivating disease-resistant peanut lines | |
| US20050234654A1 (en) | Detection of evolutionary bottlenecking by dna sequencing as a method to discover genes of value | |
| Nuraga et al. | The genotypic and genetic diversity of enset (Ensete ventricosum) landraces used in traditional medicine is similar to the diversity found in starchy landraces |