RU2799785C2 - Modulation of the content of amino acids in the plant - Google Patents
Modulation of the content of amino acids in the plant Download PDFInfo
- Publication number
- RU2799785C2 RU2799785C2 RU2020135059A RU2020135059A RU2799785C2 RU 2799785 C2 RU2799785 C2 RU 2799785C2 RU 2020135059 A RU2020135059 A RU 2020135059A RU 2020135059 A RU2020135059 A RU 2020135059A RU 2799785 C2 RU2799785 C2 RU 2799785C2
- Authority
- RU
- Russia
- Prior art keywords
- plant
- seq
- polynucleotide
- dried
- sequence
- Prior art date
Links
- 150000001413 amino acids Chemical class 0.000 title claims description 121
- 241000196324 Embryophyta Species 0.000 claims abstract description 693
- 235000002637 Nicotiana tabacum Nutrition 0.000 claims abstract description 158
- 244000061176 Nicotiana tabacum Species 0.000 claims abstract description 153
- 238000000034 method Methods 0.000 claims abstract description 145
- 239000000463 material Substances 0.000 claims abstract description 106
- 230000000694 effects Effects 0.000 claims abstract description 71
- 235000019505 tobacco product Nutrition 0.000 claims abstract description 16
- 239000000126 substance Substances 0.000 claims abstract description 15
- 102000040430 polynucleotide Human genes 0.000 claims description 393
- 108091033319 polynucleotide Proteins 0.000 claims description 393
- 239000002157 polynucleotide Substances 0.000 claims description 393
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 226
- 229920001184 polypeptide Polymers 0.000 claims description 216
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 216
- 230000014509 gene expression Effects 0.000 claims description 153
- 125000003729 nucleotide group Chemical group 0.000 claims description 126
- 239000002773 nucleotide Substances 0.000 claims description 125
- 230000035772 mutation Effects 0.000 claims description 124
- 229940024606 amino acid Drugs 0.000 claims description 120
- 238000001035 drying Methods 0.000 claims description 96
- 230000009261 transgenic effect Effects 0.000 claims description 78
- 230000004048 modification Effects 0.000 claims description 65
- 238000012986 modification Methods 0.000 claims description 65
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 claims description 42
- 230000000295 complement effect Effects 0.000 claims description 40
- 231100000350 mutagenesis Toxicity 0.000 claims description 37
- 238000002703 mutagenesis Methods 0.000 claims description 36
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 claims description 34
- 229940009098 aspartate Drugs 0.000 claims description 32
- 239000013598 vector Substances 0.000 claims description 32
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 29
- 239000013604 expression vector Substances 0.000 claims description 28
- 229910021529 ammonia Inorganic materials 0.000 claims description 21
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 20
- 230000002829 reductive effect Effects 0.000 claims description 18
- 238000005516 engineering process Methods 0.000 claims description 16
- HRPVXLWXLXDGHG-UHFFFAOYSA-N Acrylamide Chemical compound NC(=O)C=C HRPVXLWXLXDGHG-UHFFFAOYSA-N 0.000 claims description 15
- 238000010362 genome editing Methods 0.000 claims description 15
- SNICXCGAKADSCV-JTQLQIEISA-N (-)-Nicotine Chemical compound CN1CCC[C@H]1C1=CC=CN=C1 SNICXCGAKADSCV-JTQLQIEISA-N 0.000 claims description 14
- 229960002715 nicotine Drugs 0.000 claims description 14
- SNICXCGAKADSCV-UHFFFAOYSA-N nicotine Natural products CN1CCCC1C1=CC=CN=C1 SNICXCGAKADSCV-UHFFFAOYSA-N 0.000 claims description 14
- 230000007423 decrease Effects 0.000 claims description 13
- 230000001404 mediated effect Effects 0.000 claims description 13
- 108010017070 Zinc Finger Nucleases Proteins 0.000 claims description 10
- -1 or a construct Substances 0.000 claims description 10
- 239000002207 metabolite Substances 0.000 claims description 9
- 238000010453 CRISPR/Cas method Methods 0.000 claims description 8
- 230000005855 radiation Effects 0.000 claims description 7
- 238000007605 air drying Methods 0.000 claims description 6
- 238000002741 site-directed mutagenesis Methods 0.000 claims description 5
- 238000002744 homologous recombination Methods 0.000 claims description 4
- 230000006801 homologous recombination Effects 0.000 claims description 4
- 239000002028 Biomass Substances 0.000 claims description 3
- 230000001172 regenerating effect Effects 0.000 claims description 2
- 108090000623 proteins and genes Proteins 0.000 description 190
- 210000004027 cell Anatomy 0.000 description 181
- 235000001014 amino acid Nutrition 0.000 description 126
- 230000006870 function Effects 0.000 description 88
- 102000053602 DNA Human genes 0.000 description 85
- 108020004414 DNA Proteins 0.000 description 85
- 229920002477 rna polymer Polymers 0.000 description 79
- 239000012634 fragment Substances 0.000 description 58
- 239000000523 sample Substances 0.000 description 45
- 210000001519 tissue Anatomy 0.000 description 40
- 108020004999 messenger RNA Proteins 0.000 description 32
- 230000001105 regulatory effect Effects 0.000 description 31
- 238000009396 hybridization Methods 0.000 description 29
- 230000002452 interceptive effect Effects 0.000 description 29
- 239000013615 primer Substances 0.000 description 29
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 26
- 230000002068 genetic effect Effects 0.000 description 25
- 239000000203 mixture Substances 0.000 description 25
- 108010003415 Aspartate Aminotransferases Proteins 0.000 description 24
- 239000004055 small Interfering RNA Substances 0.000 description 24
- 102000004625 Aspartate Aminotransferases Human genes 0.000 description 23
- 241001144493 Nicotiana obtusifolia Species 0.000 description 23
- 108020004459 Small interfering RNA Proteins 0.000 description 22
- 239000000443 aerosol Substances 0.000 description 22
- 230000015572 biosynthetic process Effects 0.000 description 22
- 108091028043 Nucleic acid sequence Proteins 0.000 description 20
- 238000004519 manufacturing process Methods 0.000 description 20
- 239000000047 product Substances 0.000 description 19
- 230000009466 transformation Effects 0.000 description 19
- 101710163270 Nuclease Proteins 0.000 description 18
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 18
- 230000000692 anti-sense effect Effects 0.000 description 18
- 229910052725 zinc Inorganic materials 0.000 description 18
- 239000011701 zinc Substances 0.000 description 18
- 238000006467 substitution reaction Methods 0.000 description 17
- 108091026890 Coding region Proteins 0.000 description 15
- 238000003780 insertion Methods 0.000 description 15
- 230000037431 insertion Effects 0.000 description 15
- 230000004568 DNA-binding Effects 0.000 description 14
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 14
- 230000008859 change Effects 0.000 description 14
- 238000012216 screening Methods 0.000 description 14
- 238000003786 synthesis reaction Methods 0.000 description 14
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 13
- 108091033409 CRISPR Proteins 0.000 description 13
- 108090000994 Catalytic RNA Proteins 0.000 description 13
- 102000053642 Catalytic RNA Human genes 0.000 description 13
- 241000700605 Viruses Species 0.000 description 13
- 230000003321 amplification Effects 0.000 description 13
- 235000009582 asparagine Nutrition 0.000 description 13
- 229960001230 asparagine Drugs 0.000 description 13
- 238000012217 deletion Methods 0.000 description 13
- 230000037430 deletion Effects 0.000 description 13
- 238000003199 nucleic acid amplification method Methods 0.000 description 13
- 108091092562 ribozyme Proteins 0.000 description 13
- 239000013612 plasmid Substances 0.000 description 12
- 239000002987 primer (paints) Substances 0.000 description 12
- 102000004169 proteins and genes Human genes 0.000 description 12
- 238000013518 transcription Methods 0.000 description 12
- 230000035897 transcription Effects 0.000 description 12
- 108091034117 Oligonucleotide Proteins 0.000 description 11
- 125000003275 alpha amino acid group Chemical group 0.000 description 11
- 230000027455 binding Effects 0.000 description 11
- 230000008439 repair process Effects 0.000 description 11
- 238000011144 upstream manufacturing Methods 0.000 description 11
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 10
- 230000006780 non-homologous end joining Effects 0.000 description 10
- 239000000779 smoke Substances 0.000 description 10
- 230000000391 smoking effect Effects 0.000 description 10
- 108020004635 Complementary DNA Proteins 0.000 description 9
- 102000004190 Enzymes Human genes 0.000 description 9
- 108090000790 Enzymes Proteins 0.000 description 9
- 238000010804 cDNA synthesis Methods 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 9
- 239000002299 complementary DNA Substances 0.000 description 9
- 230000005782 double-strand break Effects 0.000 description 9
- 230000030279 gene silencing Effects 0.000 description 9
- 230000009467 reduction Effects 0.000 description 9
- 125000006850 spacer group Chemical group 0.000 description 9
- 241000894007 species Species 0.000 description 9
- 238000012546 transfer Methods 0.000 description 9
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 8
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 8
- 108700019146 Transgenes Proteins 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 8
- 238000003776 cleavage reaction Methods 0.000 description 8
- 230000009368 gene silencing by RNA Effects 0.000 description 8
- 238000003976 plant breeding Methods 0.000 description 8
- 235000018102 proteins Nutrition 0.000 description 8
- 230000002103 transcriptional effect Effects 0.000 description 8
- 108700028369 Alleles Proteins 0.000 description 7
- 241000701489 Cauliflower mosaic virus Species 0.000 description 7
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 7
- 108010079364 N-glycylalanine Proteins 0.000 description 7
- 108020004511 Recombinant DNA Proteins 0.000 description 7
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 7
- 239000004473 Threonine Substances 0.000 description 7
- 240000008042 Zea mays Species 0.000 description 7
- 238000013459 approach Methods 0.000 description 7
- 230000001488 breeding effect Effects 0.000 description 7
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 7
- 238000002844 melting Methods 0.000 description 7
- 230000008018 melting Effects 0.000 description 7
- 235000019645 odor Nutrition 0.000 description 7
- 238000003752 polymerase chain reaction Methods 0.000 description 7
- 230000007017 scission Effects 0.000 description 7
- 229960002898 threonine Drugs 0.000 description 7
- 235000008521 threonine Nutrition 0.000 description 7
- 238000013519 translation Methods 0.000 description 7
- 108020005544 Antisense RNA Proteins 0.000 description 6
- 238000010354 CRISPR gene editing Methods 0.000 description 6
- PLUBXMRUUVWRLT-UHFFFAOYSA-N Ethyl methanesulfonate Chemical compound CCOS(C)(=O)=O PLUBXMRUUVWRLT-UHFFFAOYSA-N 0.000 description 6
- 206010021929 Infertility male Diseases 0.000 description 6
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 6
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 6
- 208000007466 Male Infertility Diseases 0.000 description 6
- 108091027967 Small hairpin RNA Proteins 0.000 description 6
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 6
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 6
- 230000001580 bacterial effect Effects 0.000 description 6
- 230000001413 cellular effect Effects 0.000 description 6
- 239000003153 chemical reaction reagent Substances 0.000 description 6
- 239000003184 complementary RNA Substances 0.000 description 6
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 6
- 235000018417 cysteine Nutrition 0.000 description 6
- 229960002433 cysteine Drugs 0.000 description 6
- 230000003247 decreasing effect Effects 0.000 description 6
- 238000001514 detection method Methods 0.000 description 6
- 230000001939 inductive effect Effects 0.000 description 6
- 239000003550 marker Substances 0.000 description 6
- 229930182817 methionine Natural products 0.000 description 6
- 229960004452 methionine Drugs 0.000 description 6
- 235000006109 methionine Nutrition 0.000 description 6
- 230000032965 negative regulation of cell volume Effects 0.000 description 6
- 230000037361 pathway Effects 0.000 description 6
- 230000008488 polyadenylation Effects 0.000 description 6
- 229920000642 polymer Polymers 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000002441 reversible effect Effects 0.000 description 6
- 238000012384 transportation and delivery Methods 0.000 description 6
- 241000589158 Agrobacterium Species 0.000 description 5
- 108091079001 CRISPR RNA Proteins 0.000 description 5
- 206010020649 Hyperkeratosis Diseases 0.000 description 5
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 5
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 5
- 240000003768 Solanum lycopersicum Species 0.000 description 5
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 5
- 238000000137 annealing Methods 0.000 description 5
- 238000003556 assay Methods 0.000 description 5
- 230000008827 biological function Effects 0.000 description 5
- 238000009395 breeding Methods 0.000 description 5
- 230000002759 chromosomal effect Effects 0.000 description 5
- 239000000306 component Substances 0.000 description 5
- 238000011161 development Methods 0.000 description 5
- 230000018109 developmental process Effects 0.000 description 5
- 230000004927 fusion Effects 0.000 description 5
- 238000003205 genotyping method Methods 0.000 description 5
- 108010050848 glycylleucine Proteins 0.000 description 5
- 238000010438 heat treatment Methods 0.000 description 5
- 229910001385 heavy metal Inorganic materials 0.000 description 5
- 230000001976 improved effect Effects 0.000 description 5
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 5
- 235000009973 maize Nutrition 0.000 description 5
- 238000010369 molecular cloning Methods 0.000 description 5
- 239000003471 mutagenic agent Substances 0.000 description 5
- 210000000056 organ Anatomy 0.000 description 5
- 244000052769 pathogen Species 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 230000010076 replication Effects 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 230000001568 sexual effect Effects 0.000 description 5
- 239000001509 sodium citrate Substances 0.000 description 5
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 5
- 229910052717 sulfur Inorganic materials 0.000 description 5
- 239000011593 sulfur Substances 0.000 description 5
- MYKUKUCHPMASKF-VIFPVBQESA-N (S)-nornicotine Chemical compound C1CCN[C@@H]1C1=CC=CN=C1 MYKUKUCHPMASKF-VIFPVBQESA-N 0.000 description 4
- VYZBPPBKFCHCIS-WPRPVWTQSA-N Arg-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N VYZBPPBKFCHCIS-WPRPVWTQSA-N 0.000 description 4
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 4
- 241000894006 Bacteria Species 0.000 description 4
- 239000004258 Ethoxyquin Substances 0.000 description 4
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 4
- 108020005004 Guide RNA Proteins 0.000 description 4
- 244000020551 Helianthus annuus Species 0.000 description 4
- 235000003222 Helianthus annuus Nutrition 0.000 description 4
- FZWVCYCYWCLQDH-NHCYSSNCSA-N Ile-Leu-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N FZWVCYCYWCLQDH-NHCYSSNCSA-N 0.000 description 4
- 108091092195 Intron Proteins 0.000 description 4
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 4
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 4
- 241000219823 Medicago Species 0.000 description 4
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 4
- 108091030071 RNAI Proteins 0.000 description 4
- 108010003581 Ribulose-bisphosphate carboxylase Proteins 0.000 description 4
- 244000062793 Sorghum vulgare Species 0.000 description 4
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 4
- 108091028113 Trans-activating crRNA Proteins 0.000 description 4
- 108091023040 Transcription factor Proteins 0.000 description 4
- 102000040945 Transcription factor Human genes 0.000 description 4
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 4
- 229920002494 Zein Polymers 0.000 description 4
- 230000032683 aging Effects 0.000 description 4
- 229930013930 alkaloid Natural products 0.000 description 4
- 108010093581 aspartyl-proline Proteins 0.000 description 4
- 239000006227 byproduct Substances 0.000 description 4
- 229930002875 chlorophyll Natural products 0.000 description 4
- 235000019804 chlorophyll Nutrition 0.000 description 4
- ATNHDLDRLWWWCB-AENOIHSZSA-M chlorophyll a Chemical compound C1([C@@H](C(=O)OC)C(=O)C2=C3C)=C2N2C3=CC(C(CC)=C3C)=[N+]4C3=CC3=C(C=C)C(C)=C5N3[Mg-2]42[N+]2=C1[C@@H](CCC(=O)OC\C=C(/C)CCC[C@H](C)CCC[C@H](C)CCCC(C)C)[C@H](C)C2=C5 ATNHDLDRLWWWCB-AENOIHSZSA-M 0.000 description 4
- 210000000349 chromosome Anatomy 0.000 description 4
- 235000019504 cigarettes Nutrition 0.000 description 4
- 150000001875 compounds Chemical class 0.000 description 4
- 230000010154 cross-pollination Effects 0.000 description 4
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 4
- 230000006378 damage Effects 0.000 description 4
- 238000004520 electroporation Methods 0.000 description 4
- 239000003623 enhancer Substances 0.000 description 4
- 238000012239 gene modification Methods 0.000 description 4
- 238000010353 genetic engineering Methods 0.000 description 4
- 230000005017 genetic modification Effects 0.000 description 4
- 235000013617 genetically modified food Nutrition 0.000 description 4
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 4
- 238000003306 harvesting Methods 0.000 description 4
- 230000006698 induction Effects 0.000 description 4
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 4
- 229960000310 isoleucine Drugs 0.000 description 4
- 235000014705 isoleucine Nutrition 0.000 description 4
- 108010034529 leucyl-lysine Proteins 0.000 description 4
- 239000003446 ligand Substances 0.000 description 4
- 108010017391 lysylvaline Proteins 0.000 description 4
- 231100000707 mutagenic chemical Toxicity 0.000 description 4
- 102000039446 nucleic acids Human genes 0.000 description 4
- 108020004707 nucleic acids Proteins 0.000 description 4
- 150000007523 nucleic acids Chemical class 0.000 description 4
- 239000000843 powder Substances 0.000 description 4
- 210000001938 protoplast Anatomy 0.000 description 4
- 150000003839 salts Chemical class 0.000 description 4
- 239000011780 sodium chloride Substances 0.000 description 4
- 229910001415 sodium ion Inorganic materials 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 4
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 4
- 241001515965 unidentified phage Species 0.000 description 4
- 229940093612 zein Drugs 0.000 description 4
- 239000005019 zein Substances 0.000 description 4
- 241000208140 Acer Species 0.000 description 3
- 241000743339 Agrostis Species 0.000 description 3
- PBAMJJXWDQXOJA-FXQIFTODSA-N Ala-Asp-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PBAMJJXWDQXOJA-FXQIFTODSA-N 0.000 description 3
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 3
- MTDDMSUUXNQMKK-BPNCWPANSA-N Ala-Tyr-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N MTDDMSUUXNQMKK-BPNCWPANSA-N 0.000 description 3
- 244000099147 Ananas comosus Species 0.000 description 3
- RVMXMLSYBTXCAV-VEVYYDQMSA-N Asp-Pro-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMXMLSYBTXCAV-VEVYYDQMSA-N 0.000 description 3
- 241000972773 Aulopiformes Species 0.000 description 3
- 235000011299 Brassica oleracea var botrytis Nutrition 0.000 description 3
- 240000003259 Brassica oleracea var. botrytis Species 0.000 description 3
- 108020004705 Codon Proteins 0.000 description 3
- 241000723377 Coffea Species 0.000 description 3
- 240000001980 Cucurbita pepo Species 0.000 description 3
- 235000009852 Cucurbita pepo Nutrition 0.000 description 3
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 3
- 108010042407 Endonucleases Proteins 0.000 description 3
- 102000004533 Endonucleases Human genes 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- 240000002395 Euphorbia pulcherrima Species 0.000 description 3
- 108700024394 Exon Proteins 0.000 description 3
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 3
- 241000233866 Fungi Species 0.000 description 3
- CKOFNWCLWRYUHK-XHNCKOQMSA-N Glu-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O CKOFNWCLWRYUHK-XHNCKOQMSA-N 0.000 description 3
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 3
- 239000005562 Glyphosate Substances 0.000 description 3
- 241000238631 Hexapoda Species 0.000 description 3
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 3
- 241000880493 Leptailurus serval Species 0.000 description 3
- MVHXGBZUJLWZOH-BJDJZHNGSA-N Leu-Ser-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVHXGBZUJLWZOH-BJDJZHNGSA-N 0.000 description 3
- ODUQLUADRKMHOZ-JYJNAYRXSA-N Lys-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N)O ODUQLUADRKMHOZ-JYJNAYRXSA-N 0.000 description 3
- 240000003183 Manihot esculenta Species 0.000 description 3
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 description 3
- 241001457070 Mirabilis mosaic virus Species 0.000 description 3
- 240000003433 Miscanthus floridulus Species 0.000 description 3
- 241000208125 Nicotiana Species 0.000 description 3
- MYKUKUCHPMASKF-UHFFFAOYSA-N Nornicotine Natural products C1CCNC1C1=CC=CN=C1 MYKUKUCHPMASKF-UHFFFAOYSA-N 0.000 description 3
- 240000007377 Petunia x hybrida Species 0.000 description 3
- 241000219000 Populus Species 0.000 description 3
- 238000012228 RNA interference-mediated gene silencing Methods 0.000 description 3
- 241000124033 Salix Species 0.000 description 3
- OJPHFSOMBZKQKQ-GUBZILKMSA-N Ser-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO OJPHFSOMBZKQKQ-GUBZILKMSA-N 0.000 description 3
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 3
- 238000002105 Southern blotting Methods 0.000 description 3
- 244000299461 Theobroma cacao Species 0.000 description 3
- 235000009470 Theobroma cacao Nutrition 0.000 description 3
- UDQBCBUXAQIZAK-GLLZPBPUSA-N Thr-Glu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDQBCBUXAQIZAK-GLLZPBPUSA-N 0.000 description 3
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 3
- 108700009124 Transcription Initiation Site Proteins 0.000 description 3
- OHOVFPKXPZODHS-SJWGOKEGSA-N Tyr-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OHOVFPKXPZODHS-SJWGOKEGSA-N 0.000 description 3
- CELJCNRXKZPTCX-XPUUQOCRSA-N Val-Gly-Ala Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O CELJCNRXKZPTCX-XPUUQOCRSA-N 0.000 description 3
- FEXILLGKGGTLRI-NHCYSSNCSA-N Val-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N FEXILLGKGGTLRI-NHCYSSNCSA-N 0.000 description 3
- 230000004913 activation Effects 0.000 description 3
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 3
- 108010047495 alanylglycine Proteins 0.000 description 3
- 108010013835 arginine glutamate Proteins 0.000 description 3
- 108010077245 asparaginyl-proline Proteins 0.000 description 3
- 230000004071 biological effect Effects 0.000 description 3
- 230000032823 cell division Effects 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- 230000004186 co-expression Effects 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 235000013399 edible fruits Nutrition 0.000 description 3
- 239000012636 effector Substances 0.000 description 3
- 230000002255 enzymatic effect Effects 0.000 description 3
- 230000002349 favourable effect Effects 0.000 description 3
- 108010078144 glutaminyl-glycine Proteins 0.000 description 3
- 108010013768 glutamyl-aspartyl-proline Proteins 0.000 description 3
- 108010089804 glycyl-threonine Proteins 0.000 description 3
- 229940097068 glyphosate Drugs 0.000 description 3
- XDDAORKBJWWYJS-UHFFFAOYSA-N glyphosate Chemical compound OC(=O)CNCP(O)(O)=O XDDAORKBJWWYJS-UHFFFAOYSA-N 0.000 description 3
- 239000004009 herbicide Substances 0.000 description 3
- 108010085325 histidylproline Proteins 0.000 description 3
- 238000007901 in situ hybridization Methods 0.000 description 3
- 238000000338 in vitro Methods 0.000 description 3
- 238000001727 in vivo Methods 0.000 description 3
- 230000005865 ionizing radiation Effects 0.000 description 3
- 108010078274 isoleucylvaline Proteins 0.000 description 3
- 230000000670 limiting effect Effects 0.000 description 3
- 230000004807 localization Effects 0.000 description 3
- 108010003700 lysyl aspartic acid Proteins 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000003505 mutagenic effect Effects 0.000 description 3
- 239000005022 packaging material Substances 0.000 description 3
- 239000012071 phase Substances 0.000 description 3
- 150000004713 phosphodiesters Chemical class 0.000 description 3
- PTMHPRAIXMAOOB-UHFFFAOYSA-L phosphoramidate Chemical compound NP([O-])([O-])=O PTMHPRAIXMAOOB-UHFFFAOYSA-L 0.000 description 3
- 102000054765 polymorphisms of proteins Human genes 0.000 description 3
- 239000002243 precursor Substances 0.000 description 3
- 108010015796 prolylisoleucine Proteins 0.000 description 3
- 230000008263 repair mechanism Effects 0.000 description 3
- 230000001850 reproductive effect Effects 0.000 description 3
- 235000019515 salmon Nutrition 0.000 description 3
- 108010026333 seryl-proline Proteins 0.000 description 3
- 230000002269 spontaneous effect Effects 0.000 description 3
- 108010061238 threonyl-glycine Proteins 0.000 description 3
- 230000005030 transcription termination Effects 0.000 description 3
- 230000001052 transient effect Effects 0.000 description 3
- 239000013603 viral vector Substances 0.000 description 3
- 241000228158 x Triticosecale Species 0.000 description 3
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 2
- LRFVTYWOQMYALW-UHFFFAOYSA-N 9H-xanthine Chemical compound O=C1NC(=O)NC2=C1NC=N2 LRFVTYWOQMYALW-UHFFFAOYSA-N 0.000 description 2
- 240000004507 Abelmoschus esculentus Species 0.000 description 2
- 241000218642 Abies Species 0.000 description 2
- 108010000700 Acetolactate synthase Proteins 0.000 description 2
- KVWLTGNCJYDJET-LSJOCFKGSA-N Ala-Arg-His Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KVWLTGNCJYDJET-LSJOCFKGSA-N 0.000 description 2
- MKZCBYZBCINNJN-DLOVCJGASA-N Ala-Asp-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MKZCBYZBCINNJN-DLOVCJGASA-N 0.000 description 2
- MVBWLRJESQOQTM-ACZMJKKPSA-N Ala-Gln-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O MVBWLRJESQOQTM-ACZMJKKPSA-N 0.000 description 2
- FBHOPGDGELNWRH-DRZSPHRISA-N Ala-Glu-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FBHOPGDGELNWRH-DRZSPHRISA-N 0.000 description 2
- IVKWMMGFLAMMKJ-XVYDVKMFSA-N Ala-His-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N IVKWMMGFLAMMKJ-XVYDVKMFSA-N 0.000 description 2
- HJGZVLLLBJLXFC-LSJOCFKGSA-N Ala-His-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(O)=O HJGZVLLLBJLXFC-LSJOCFKGSA-N 0.000 description 2
- GSHKMNKPMLXSQW-KBIXCLLPSA-N Ala-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C)N GSHKMNKPMLXSQW-KBIXCLLPSA-N 0.000 description 2
- VNYMOTCMNHJGTG-JBDRJPRFSA-N Ala-Ile-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O VNYMOTCMNHJGTG-JBDRJPRFSA-N 0.000 description 2
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 2
- OPZJWMJPCNNZNT-DCAQKATOSA-N Ala-Leu-Met Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N OPZJWMJPCNNZNT-DCAQKATOSA-N 0.000 description 2
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 2
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 2
- AOAKQKVICDWCLB-UWJYBYFXSA-N Ala-Tyr-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N AOAKQKVICDWCLB-UWJYBYFXSA-N 0.000 description 2
- BHFOJPDOQPWJRN-XDTLVQLUSA-N Ala-Tyr-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CCC(N)=O)C(O)=O BHFOJPDOQPWJRN-XDTLVQLUSA-N 0.000 description 2
- PGNNQOJOEGFAOR-KWQFWETISA-N Ala-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 PGNNQOJOEGFAOR-KWQFWETISA-N 0.000 description 2
- XCIGOVDXZULBBV-DCAQKATOSA-N Ala-Val-Lys Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCCCN)C(O)=O XCIGOVDXZULBBV-DCAQKATOSA-N 0.000 description 2
- 244000291564 Allium cepa Species 0.000 description 2
- 235000007119 Ananas comosus Nutrition 0.000 description 2
- 241000219194 Arabidopsis Species 0.000 description 2
- DBKNLHKEVPZVQC-LPEHRKFASA-N Arg-Ala-Pro Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O DBKNLHKEVPZVQC-LPEHRKFASA-N 0.000 description 2
- UBCPNBUIQNMDNH-NAKRPEOUSA-N Arg-Ile-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O UBCPNBUIQNMDNH-NAKRPEOUSA-N 0.000 description 2
- FFEUXEAKYRCACT-PEDHHIEDSA-N Arg-Ile-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)CC)C(O)=O FFEUXEAKYRCACT-PEDHHIEDSA-N 0.000 description 2
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 2
- 241001494510 Arundo Species 0.000 description 2
- MYVBTYXSWILFCG-BQBZGAKWSA-N Asn-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N MYVBTYXSWILFCG-BQBZGAKWSA-N 0.000 description 2
- ZAESWDKAMDVHLL-RCOVLWMOSA-N Asn-Val-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O ZAESWDKAMDVHLL-RCOVLWMOSA-N 0.000 description 2
- TVVYVAUGRHNTGT-UGYAYLCHSA-N Asp-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O TVVYVAUGRHNTGT-UGYAYLCHSA-N 0.000 description 2
- JRBVWZLHBGYZNY-QEJZJMRPSA-N Asp-Gln-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JRBVWZLHBGYZNY-QEJZJMRPSA-N 0.000 description 2
- KHBLRHKVXICFMY-GUBZILKMSA-N Asp-Glu-Lys Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O KHBLRHKVXICFMY-GUBZILKMSA-N 0.000 description 2
- IDDMGSKZQDEDGA-SRVKXCTJSA-N Asp-Phe-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 IDDMGSKZQDEDGA-SRVKXCTJSA-N 0.000 description 2
- 235000021533 Beta vulgaris Nutrition 0.000 description 2
- 241000335053 Beta vulgaris Species 0.000 description 2
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 description 2
- 235000017647 Brassica oleracea var italica Nutrition 0.000 description 2
- 240000004160 Capsicum annuum Species 0.000 description 2
- 240000008574 Capsicum frutescens Species 0.000 description 2
- 235000003255 Carthamus tinctorius Nutrition 0.000 description 2
- 244000020518 Carthamus tinctorius Species 0.000 description 2
- 108010022172 Chitinases Proteins 0.000 description 2
- 108091028075 Circular RNA Proteins 0.000 description 2
- 244000241235 Citrullus lanatus Species 0.000 description 2
- 108091004554 Copper Transport Proteins Proteins 0.000 description 2
- 108091006566 Copper transporters Proteins 0.000 description 2
- 102000037773 Copper transporters Human genes 0.000 description 2
- 241000219112 Cucumis Species 0.000 description 2
- 240000008067 Cucumis sativus Species 0.000 description 2
- XEEIQMGZRFFSRD-XVYDVKMFSA-N Cys-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CS)N XEEIQMGZRFFSRD-XVYDVKMFSA-N 0.000 description 2
- 238000001712 DNA sequencing Methods 0.000 description 2
- 101100268840 Danio rerio chrna1 gene Proteins 0.000 description 2
- 235000009355 Dianthus caryophyllus Nutrition 0.000 description 2
- 240000006497 Dianthus caryophyllus Species 0.000 description 2
- 235000001950 Elaeis guineensis Nutrition 0.000 description 2
- 244000166124 Eucalyptus globulus Species 0.000 description 2
- 241000234642 Festuca Species 0.000 description 2
- 240000009088 Fragaria x ananassa Species 0.000 description 2
- 235000011363 Fragaria x ananassa Nutrition 0.000 description 2
- 108010092526 GKPV peptide Proteins 0.000 description 2
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 2
- YRWWJCDWLVXTHN-LAEOZQHASA-N Gln-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N YRWWJCDWLVXTHN-LAEOZQHASA-N 0.000 description 2
- RDDSZZJOKDVPAE-ACZMJKKPSA-N Glu-Asn-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDDSZZJOKDVPAE-ACZMJKKPSA-N 0.000 description 2
- HTTSBEBKVNEDFE-AUTRQRHGSA-N Glu-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N HTTSBEBKVNEDFE-AUTRQRHGSA-N 0.000 description 2
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 2
- QGDOOCIPHSSADO-STQMWFEESA-N Gly-Met-Phe Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QGDOOCIPHSSADO-STQMWFEESA-N 0.000 description 2
- JSLVAHYTAJJEQH-QWRGUYRKSA-N Gly-Ser-Phe Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JSLVAHYTAJJEQH-QWRGUYRKSA-N 0.000 description 2
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- 235000010469 Glycine max Nutrition 0.000 description 2
- 244000068988 Glycine max Species 0.000 description 2
- YXBRCTXAEYSCHS-XVYDVKMFSA-N His-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N YXBRCTXAEYSCHS-XVYDVKMFSA-N 0.000 description 2
- YADRBUZBKHHDAO-XPUUQOCRSA-N His-Gly-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](C)C(O)=O YADRBUZBKHHDAO-XPUUQOCRSA-N 0.000 description 2
- PGXZHYYGOPKYKM-IHRRRGAJSA-N His-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CN=CN2)N)C(=O)N[C@@H](CCCCN)C(=O)O PGXZHYYGOPKYKM-IHRRRGAJSA-N 0.000 description 2
- QTMKFZAYZKBFRC-BZSNNMDCSA-N His-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC3=CN=CN3)N)O QTMKFZAYZKBFRC-BZSNNMDCSA-N 0.000 description 2
- 101000655467 Homo sapiens Multidrug and toxin extrusion protein 1 Proteins 0.000 description 2
- 240000005979 Hordeum vulgare Species 0.000 description 2
- 235000007340 Hordeum vulgare Nutrition 0.000 description 2
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 2
- DMHGKBGOUAJRHU-UHFFFAOYSA-N Ile-Arg-Pro Natural products CCC(C)C(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O DMHGKBGOUAJRHU-UHFFFAOYSA-N 0.000 description 2
- QQVXERGIFIRCGW-NAKRPEOUSA-N Ile-Ser-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)O)N QQVXERGIFIRCGW-NAKRPEOUSA-N 0.000 description 2
- REXAUQBGSGDEJY-IGISWZIWSA-N Ile-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N REXAUQBGSGDEJY-IGISWZIWSA-N 0.000 description 2
- YJRSIJZUIUANHO-NAKRPEOUSA-N Ile-Val-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(=O)O)N YJRSIJZUIUANHO-NAKRPEOUSA-N 0.000 description 2
- 229930010555 Inosine Natural products 0.000 description 2
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 2
- 241000221089 Jatropha Species 0.000 description 2
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 2
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 2
- 235000003228 Lactuca sativa Nutrition 0.000 description 2
- 240000008415 Lactuca sativa Species 0.000 description 2
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 2
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 2
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 2
- HFBCHNRFRYLZNV-GUBZILKMSA-N Leu-Glu-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HFBCHNRFRYLZNV-GUBZILKMSA-N 0.000 description 2
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 2
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 2
- KYIIALJHAOIAHF-KKUMJFAQSA-N Leu-Leu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 KYIIALJHAOIAHF-KKUMJFAQSA-N 0.000 description 2
- PKKMDPNFGULLNQ-AVGNSLFASA-N Leu-Met-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O PKKMDPNFGULLNQ-AVGNSLFASA-N 0.000 description 2
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 2
- SVBJIZVVYJYGLA-DCAQKATOSA-N Leu-Ser-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O SVBJIZVVYJYGLA-DCAQKATOSA-N 0.000 description 2
- WFCKERTZVCQXKH-KBPBESRZSA-N Leu-Tyr-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O WFCKERTZVCQXKH-KBPBESRZSA-N 0.000 description 2
- 235000004431 Linum usitatissimum Nutrition 0.000 description 2
- 240000006240 Linum usitatissimum Species 0.000 description 2
- 241000209082 Lolium Species 0.000 description 2
- 241000219745 Lupinus Species 0.000 description 2
- WRODMZBHNNPRLN-SRVKXCTJSA-N Lys-Leu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O WRODMZBHNNPRLN-SRVKXCTJSA-N 0.000 description 2
- HYSVGEAWTGPMOA-IHRRRGAJSA-N Lys-Pro-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O HYSVGEAWTGPMOA-IHRRRGAJSA-N 0.000 description 2
- 240000004658 Medicago sativa Species 0.000 description 2
- 235000010624 Medicago sativa Nutrition 0.000 description 2
- VHGIWFGJIHTASW-FXQIFTODSA-N Met-Ala-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O VHGIWFGJIHTASW-FXQIFTODSA-N 0.000 description 2
- QGQGAIBGTUJRBR-NAKRPEOUSA-N Met-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCSC QGQGAIBGTUJRBR-NAKRPEOUSA-N 0.000 description 2
- DBOMZJOESVYERT-GUBZILKMSA-N Met-Asn-Met Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N DBOMZJOESVYERT-GUBZILKMSA-N 0.000 description 2
- PNHRPOWKRRJATF-IHRRRGAJSA-N Met-Tyr-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 PNHRPOWKRRJATF-IHRRRGAJSA-N 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 108091092878 Microsatellite Proteins 0.000 description 2
- YNAVUWVOSKDBBP-UHFFFAOYSA-N Morpholine Chemical compound C1COCCN1 YNAVUWVOSKDBBP-UHFFFAOYSA-N 0.000 description 2
- 102100032877 Multidrug and toxin extrusion protein 1 Human genes 0.000 description 2
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 2
- 108010047562 NGR peptide Proteins 0.000 description 2
- 229910002651 NO3 Inorganic materials 0.000 description 2
- 101150102029 NUP1 gene Proteins 0.000 description 2
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 2
- 241001230286 Narenga Species 0.000 description 2
- PWHVEHULNLETOV-UHFFFAOYSA-N Nic-1 Natural products C12OC2C2(O)CC=CC(=O)C2(C)C(CCC2=C3)C1C2=CC=C3C(C)C1OC(O)C2(C)OC2(C)C1 PWHVEHULNLETOV-UHFFFAOYSA-N 0.000 description 2
- 241000207746 Nicotiana benthamiana Species 0.000 description 2
- 241000493375 Nicotiana quadrivalvis Species 0.000 description 2
- 241001144498 Nicotiana rosulata subsp. ingulba Species 0.000 description 2
- 238000000636 Northern blotting Methods 0.000 description 2
- 108010061618 O-succinylhomoserine (thiol)-lyase Proteins 0.000 description 2
- 240000007594 Oryza sativa Species 0.000 description 2
- 235000007164 Oryza sativa Nutrition 0.000 description 2
- 241000209117 Panicum Species 0.000 description 2
- 235000006443 Panicum miliaceum subsp. miliaceum Nutrition 0.000 description 2
- 235000009037 Panicum miliaceum subsp. ruderale Nutrition 0.000 description 2
- 235000007195 Pennisetum typhoides Nutrition 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- UHRNIXJAGGLKHP-DLOVCJGASA-N Phe-Ala-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O UHRNIXJAGGLKHP-DLOVCJGASA-N 0.000 description 2
- KLYYKKGCPOGDPE-OEAJRASXSA-N Phe-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O KLYYKKGCPOGDPE-OEAJRASXSA-N 0.000 description 2
- 235000011613 Pinus brutia Nutrition 0.000 description 2
- DCHQYSOGURGJST-FJXKBIBVSA-N Pro-Thr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O DCHQYSOGURGJST-FJXKBIBVSA-N 0.000 description 2
- 101150111829 RBCS2 gene Proteins 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- 240000000528 Ricinus communis Species 0.000 description 2
- 235000004443 Ricinus communis Nutrition 0.000 description 2
- 235000011449 Rosa Nutrition 0.000 description 2
- MEFKEPWMEQBLKI-AIRLBKTGSA-N S-adenosyl-L-methioninate Chemical compound O[C@@H]1[C@H](O)[C@@H](C[S+](CC[C@H](N)C([O-])=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 MEFKEPWMEQBLKI-AIRLBKTGSA-N 0.000 description 2
- 101100081323 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) NUP2 gene Proteins 0.000 description 2
- 241000209051 Saccharum Species 0.000 description 2
- 108020005543 Satellite RNA Proteins 0.000 description 2
- 235000007238 Secale cereale Nutrition 0.000 description 2
- 244000082988 Secale cereale Species 0.000 description 2
- HQTKVSCNCDLXSX-BQBZGAKWSA-N Ser-Arg-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O HQTKVSCNCDLXSX-BQBZGAKWSA-N 0.000 description 2
- HBOABDXGTMMDSE-GUBZILKMSA-N Ser-Arg-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O HBOABDXGTMMDSE-GUBZILKMSA-N 0.000 description 2
- IXUGADGDCQDLSA-FXQIFTODSA-N Ser-Gln-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N IXUGADGDCQDLSA-FXQIFTODSA-N 0.000 description 2
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 2
- UGGWCAFQPKANMW-FXQIFTODSA-N Ser-Met-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O UGGWCAFQPKANMW-FXQIFTODSA-N 0.000 description 2
- AZWNCEBQZXELEZ-FXQIFTODSA-N Ser-Pro-Ser Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O AZWNCEBQZXELEZ-FXQIFTODSA-N 0.000 description 2
- PIQRHJQWEPWFJG-UWJYBYFXSA-N Ser-Tyr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PIQRHJQWEPWFJG-UWJYBYFXSA-N 0.000 description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 description 2
- 235000002597 Solanum melongena Nutrition 0.000 description 2
- 244000061458 Solanum melongena Species 0.000 description 2
- 235000002595 Solanum tuberosum Nutrition 0.000 description 2
- 244000061456 Solanum tuberosum Species 0.000 description 2
- 241000746413 Spartina Species 0.000 description 2
- 241000251131 Sphyrna Species 0.000 description 2
- 235000009337 Spinacia oleracea Nutrition 0.000 description 2
- 244000300264 Spinacia oleracea Species 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- 235000021536 Sugar beet Nutrition 0.000 description 2
- 244000269722 Thea sinensis Species 0.000 description 2
- JKGGPMOUIAAJAA-YEPSODPASA-N Thr-Gly-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O JKGGPMOUIAAJAA-YEPSODPASA-N 0.000 description 2
- ADPHPKGWVDHWML-PPCPHDFISA-N Thr-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N ADPHPKGWVDHWML-PPCPHDFISA-N 0.000 description 2
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 2
- LECUEEHKUFYOOV-ZJDVBMNYSA-N Thr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)[C@@H](C)O LECUEEHKUFYOOV-ZJDVBMNYSA-N 0.000 description 2
- 241000723573 Tobacco rattle virus Species 0.000 description 2
- 108010073062 Transcription Activator-Like Effectors Proteins 0.000 description 2
- 108020004566 Transfer RNA Proteins 0.000 description 2
- 235000021307 Triticum Nutrition 0.000 description 2
- 244000098338 Triticum aestivum Species 0.000 description 2
- FNOQJVHFVLVMOS-AAEUAGOBSA-N Trp-Gly-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N FNOQJVHFVLVMOS-AAEUAGOBSA-N 0.000 description 2
- ZWZOCUWOXSDYFZ-CQDKDKBSSA-N Tyr-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ZWZOCUWOXSDYFZ-CQDKDKBSSA-N 0.000 description 2
- WPXKRJVHBXYLDT-JUKXBJQTSA-N Tyr-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CC=C(C=C2)O)N WPXKRJVHBXYLDT-JUKXBJQTSA-N 0.000 description 2
- OJCISMMNNUNNJA-BZSNNMDCSA-N Tyr-Tyr-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=C(O)C=C1 OJCISMMNNUNNJA-BZSNNMDCSA-N 0.000 description 2
- DDNIHOWRDOXXPF-NGZCFLSTSA-N Val-Asp-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N DDNIHOWRDOXXPF-NGZCFLSTSA-N 0.000 description 2
- LMSBRIVOCYOKMU-NRPADANISA-N Val-Gln-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N LMSBRIVOCYOKMU-NRPADANISA-N 0.000 description 2
- DIOSYUIWOQCXNR-ONGXEEELSA-N Val-Lys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O DIOSYUIWOQCXNR-ONGXEEELSA-N 0.000 description 2
- RTJPAGFXOWEBAI-SRVKXCTJSA-N Val-Val-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RTJPAGFXOWEBAI-SRVKXCTJSA-N 0.000 description 2
- 241000726445 Viroids Species 0.000 description 2
- 240000006365 Vitis vinifera Species 0.000 description 2
- 235000014787 Vitis vinifera Nutrition 0.000 description 2
- 101001036768 Zea mays Glucose-1-phosphate adenylyltransferase large subunit 1, chloroplastic/amyloplastic Proteins 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 2
- 239000012190 activator Substances 0.000 description 2
- 101150063416 add gene Proteins 0.000 description 2
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 2
- 108010041407 alanylaspartic acid Proteins 0.000 description 2
- 108010011559 alanylphenylalanine Proteins 0.000 description 2
- 150000003797 alkaloid derivatives Chemical class 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 108010068380 arginylarginine Proteins 0.000 description 2
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 2
- 210000004507 artificial chromosome Anatomy 0.000 description 2
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 2
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000003197 catalytic effect Effects 0.000 description 2
- 150000001768 cations Chemical class 0.000 description 2
- 238000007385 chemical modification Methods 0.000 description 2
- 230000001055 chewing effect Effects 0.000 description 2
- 235000019506 cigar Nutrition 0.000 description 2
- 230000021615 conjugation Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- NAGJZTKCGNOGPW-UHFFFAOYSA-K dioxido-sulfanylidene-sulfido-$l^{5}-phosphane Chemical compound [O-]P([O-])([S-])=S NAGJZTKCGNOGPW-UHFFFAOYSA-K 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 210000002257 embryonic structure Anatomy 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 230000009088 enzymatic function Effects 0.000 description 2
- 238000006911 enzymatic reaction Methods 0.000 description 2
- 210000003527 eukaryotic cell Anatomy 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000004345 fruit ripening Effects 0.000 description 2
- ZZUFCTLCJUWOSV-UHFFFAOYSA-N furosemide Chemical compound C1=C(Cl)C(S(=O)(=O)N)=CC(C(O)=O)=C1NCC1=CC=CO1 ZZUFCTLCJUWOSV-UHFFFAOYSA-N 0.000 description 2
- 229930195712 glutamate Natural products 0.000 description 2
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 2
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 2
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 2
- 108010049041 glutamylalanine Proteins 0.000 description 2
- 230000013595 glycosylation Effects 0.000 description 2
- 238000006206 glycosylation reaction Methods 0.000 description 2
- HPAIKDPJURGQLN-UHFFFAOYSA-N glycyl-L-histidyl-L-phenylalanine Natural products C=1C=CC=CC=1CC(C(O)=O)NC(=O)C(NC(=O)CN)CC1=CN=CN1 HPAIKDPJURGQLN-UHFFFAOYSA-N 0.000 description 2
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 2
- 108010074027 glycyl-seryl-phenylalanine Proteins 0.000 description 2
- 235000021384 green leafy vegetables Nutrition 0.000 description 2
- 230000012010 growth Effects 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 230000002363 herbicidal effect Effects 0.000 description 2
- 108010040030 histidinoalanine Proteins 0.000 description 2
- 108010036413 histidylglycine Proteins 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 230000000415 inactivating effect Effects 0.000 description 2
- 230000002779 inactivation Effects 0.000 description 2
- 239000000411 inducer Substances 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 239000004615 ingredient Substances 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 229960003786 inosine Drugs 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 239000000543 intermediate Substances 0.000 description 2
- DRAVOWXCEBXPTN-UHFFFAOYSA-N isoguanine Chemical compound NC1=NC(=O)NC2=C1NC=N2 DRAVOWXCEBXPTN-UHFFFAOYSA-N 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 108010000761 leucylarginine Proteins 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000004060 metabolic process Effects 0.000 description 2
- 108010005942 methionylglycine Proteins 0.000 description 2
- 238000000520 microinjection Methods 0.000 description 2
- 239000011859 microparticle Substances 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 231100000219 mutagenic Toxicity 0.000 description 2
- UMFJAHHVKNCGLG-UHFFFAOYSA-N n-Nitrosodimethylamine Chemical compound CN(C)N=O UMFJAHHVKNCGLG-UHFFFAOYSA-N 0.000 description 2
- GWWNCLHJCFNTJA-UHFFFAOYSA-N nicandrenone-2 Natural products C12OC2C2(O)CC=CC(=O)C2(C)C(CCC23C)C1C3CCC2(O)C(C)C1OC(O)C2(C)OC2(C)C1 GWWNCLHJCFNTJA-UHFFFAOYSA-N 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- 108010058731 nopaline synthase Proteins 0.000 description 2
- 230000002018 overexpression Effects 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 238000010647 peptide synthesis reaction Methods 0.000 description 2
- 230000008635 plant growth Effects 0.000 description 2
- 230000010152 pollination Effects 0.000 description 2
- 210000004896 polypeptide structure Anatomy 0.000 description 2
- 229920000036 polyvinylpyrrolidone Polymers 0.000 description 2
- 235000013855 polyvinylpyrrolidone Nutrition 0.000 description 2
- 108010053725 prolylvaline Proteins 0.000 description 2
- 230000000384 rearing effect Effects 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000002336 ribonucleotide Substances 0.000 description 2
- 125000002652 ribonucleotide group Chemical group 0.000 description 2
- 150000003290 ribose derivatives Chemical group 0.000 description 2
- YGSDEFSMJLZEOE-UHFFFAOYSA-N salicylic acid Chemical compound OC(=O)C1=CC=CC=C1O YGSDEFSMJLZEOE-UHFFFAOYSA-N 0.000 description 2
- 238000010187 selection method Methods 0.000 description 2
- 230000010153 self-pollination Effects 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 108010048818 seryl-histidine Proteins 0.000 description 2
- 239000003826 tablet Substances 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 2
- 229940113082 thymine Drugs 0.000 description 2
- 238000010361 transduction Methods 0.000 description 2
- 230000026683 transduction Effects 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 230000017105 transposition Effects 0.000 description 2
- 229940035893 uracil Drugs 0.000 description 2
- 108010073969 valyllysine Proteins 0.000 description 2
- 239000003981 vehicle Substances 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- 238000001262 western blot Methods 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 1
- KPDTZVSUQCBOAE-HTFCKZLJSA-N (2s)-2-[[(2s)-1-[(2s)-2-[[(2s)-2-[[(2s)-2-aminopropanoyl]amino]propanoyl]amino]propanoyl]pyrrolidine-2-carbonyl]amino]propanoic acid Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O KPDTZVSUQCBOAE-HTFCKZLJSA-N 0.000 description 1
- HNSDLXPSAYFUHK-UHFFFAOYSA-N 1,4-bis(2-ethylhexyl) sulfosuccinate Chemical compound CCCCC(CC)COC(=O)CC(S(O)(=O)=O)C(=O)OCC(CC)CCCC HNSDLXPSAYFUHK-UHFFFAOYSA-N 0.000 description 1
- KHWCHTKSEGGWEX-RRKCRQDMSA-N 2'-deoxyadenosine 5'-monophosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(O)=O)O1 KHWCHTKSEGGWEX-RRKCRQDMSA-N 0.000 description 1
- NCMVOABPESMRCP-SHYZEUOFSA-N 2'-deoxycytosine 5'-monophosphate Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)C1 NCMVOABPESMRCP-SHYZEUOFSA-N 0.000 description 1
- LTFMZDNNPPEQNG-KVQBGUIXSA-N 2'-deoxyguanosine 5'-monophosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@H]1C[C@H](O)[C@@H](COP(O)(O)=O)O1 LTFMZDNNPPEQNG-KVQBGUIXSA-N 0.000 description 1
- UZDMJOILBYFRMP-UHFFFAOYSA-N 2-[2-[2-[(2-amino-3-methylpentanoyl)amino]propanoylamino]propanoylamino]-3-methylpentanoic acid Chemical compound CCC(C)C(N)C(=O)NC(C)C(=O)NC(C)C(=O)NC(C(O)=O)C(C)CC UZDMJOILBYFRMP-UHFFFAOYSA-N 0.000 description 1
- XQCZBXHVTFVIFE-UHFFFAOYSA-N 2-amino-4-hydroxypyrimidine Chemical compound NC1=NC=CC(O)=N1 XQCZBXHVTFVIFE-UHFFFAOYSA-N 0.000 description 1
- MWBWWFOAEOYUST-UHFFFAOYSA-N 2-aminopurine Chemical compound NC1=NC=C2N=CNC2=N1 MWBWWFOAEOYUST-UHFFFAOYSA-N 0.000 description 1
- LNCCBHFAHILMCT-UHFFFAOYSA-N 2-n,4-n,6-n-triethyl-1,3,5-triazine-2,4,6-triamine Chemical compound CCNC1=NC(NCC)=NC(NCC)=N1 LNCCBHFAHILMCT-UHFFFAOYSA-N 0.000 description 1
- UPMXNNIRAGDFEH-UHFFFAOYSA-N 3,5-dibromo-4-hydroxybenzonitrile Chemical compound OC1=C(Br)C=C(C#N)C=C1Br UPMXNNIRAGDFEH-UHFFFAOYSA-N 0.000 description 1
- HEGWNIMGIDYRAU-UHFFFAOYSA-N 3-hexyl-2,4-dioxabicyclo[1.1.0]butane Chemical compound O1C2OC21CCCCCC HEGWNIMGIDYRAU-UHFFFAOYSA-N 0.000 description 1
- CLUWOWRTHNNBBU-UHFFFAOYSA-N 3-methylthiopropanal Chemical compound CSCCC=O CLUWOWRTHNNBBU-UHFFFAOYSA-N 0.000 description 1
- AJBZENLMTKDAEK-UHFFFAOYSA-N 3a,5a,5b,8,8,11a-hexamethyl-1-prop-1-en-2-yl-1,2,3,4,5,6,7,7a,9,10,11,11b,12,13,13a,13b-hexadecahydrocyclopenta[a]chrysene-4,9-diol Chemical compound CC12CCC(O)C(C)(C)C1CCC(C1(C)CC3O)(C)C2CCC1C1C3(C)CCC1C(=C)C AJBZENLMTKDAEK-UHFFFAOYSA-N 0.000 description 1
- ARSRBNBHOADGJU-UHFFFAOYSA-N 7,12-dimethyltetraphene Chemical compound C1=CC2=CC=CC=C2C2=C1C(C)=C(C=CC=C1)C1=C2C ARSRBNBHOADGJU-UHFFFAOYSA-N 0.000 description 1
- PGYAYSRVSAJXTE-FTLOKQSXSA-N 9'-cis-neoxanthin Chemical compound C(\[C@]12[C@@](O1)(C)C[C@@H](O)CC2(C)C)=C/C(/C)=C\C=C\C(\C)=C\C=C\C=C(/C)\C=C\C=C(/C)C=C=C1C(C)(C)C[C@H](O)C[C@@]1(C)O PGYAYSRVSAJXTE-FTLOKQSXSA-N 0.000 description 1
- 108010080953 9-cis-epoxycarotenoid dioxygenase Proteins 0.000 description 1
- 230000005730 ADP ribosylation Effects 0.000 description 1
- 108091006112 ATPases Proteins 0.000 description 1
- 241001075517 Abelmoschus Species 0.000 description 1
- 235000003934 Abelmoschus esculentus Nutrition 0.000 description 1
- 241000207965 Acanthaceae Species 0.000 description 1
- 206010069754 Acquired gene mutation Diseases 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 102000057290 Adenosine Triphosphatases Human genes 0.000 description 1
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 1
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 1
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 1
- UCIYCBSJBQGDGM-LPEHRKFASA-N Ala-Arg-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N UCIYCBSJBQGDGM-LPEHRKFASA-N 0.000 description 1
- TTXMOJWKNRJWQJ-FXQIFTODSA-N Ala-Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N TTXMOJWKNRJWQJ-FXQIFTODSA-N 0.000 description 1
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 1
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 1
- DECCMEWNXSNSDO-ZLUOBGJFSA-N Ala-Cys-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O DECCMEWNXSNSDO-ZLUOBGJFSA-N 0.000 description 1
- NWVVKQZOVSTDBQ-CIUDSAMLSA-N Ala-Glu-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NWVVKQZOVSTDBQ-CIUDSAMLSA-N 0.000 description 1
- OBVSBEYOMDWLRJ-BFHQHQDPSA-N Ala-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N OBVSBEYOMDWLRJ-BFHQHQDPSA-N 0.000 description 1
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 1
- NMXKFWOEASXOGB-QSFUFRPTSA-N Ala-Ile-His Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 NMXKFWOEASXOGB-QSFUFRPTSA-N 0.000 description 1
- QUIGLPSHIFPEOV-CIUDSAMLSA-N Ala-Lys-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O QUIGLPSHIFPEOV-CIUDSAMLSA-N 0.000 description 1
- PMQXMXAASGFUDX-SRVKXCTJSA-N Ala-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCCN PMQXMXAASGFUDX-SRVKXCTJSA-N 0.000 description 1
- ZBLQIYPCUWZSRZ-QEJZJMRPSA-N Ala-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 ZBLQIYPCUWZSRZ-QEJZJMRPSA-N 0.000 description 1
- RNHKOQHGYMTHFR-UBHSHLNASA-N Ala-Phe-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 RNHKOQHGYMTHFR-UBHSHLNASA-N 0.000 description 1
- OSRZOHXQCUFIQG-FPMFFAJLSA-N Ala-Phe-Pro Chemical compound C([C@H](NC(=O)[C@@H]([NH3+])C)C(=O)N1[C@H](CCC1)C([O-])=O)C1=CC=CC=C1 OSRZOHXQCUFIQG-FPMFFAJLSA-N 0.000 description 1
- VQAVBBCZFQAAED-FXQIFTODSA-N Ala-Pro-Asn Chemical compound C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)N)C(=O)O)N VQAVBBCZFQAAED-FXQIFTODSA-N 0.000 description 1
- BTRULDJUUVGRNE-DCAQKATOSA-N Ala-Pro-Lys Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O BTRULDJUUVGRNE-DCAQKATOSA-N 0.000 description 1
- XWFWAXPOLRTDFZ-FXQIFTODSA-N Ala-Pro-Ser Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O XWFWAXPOLRTDFZ-FXQIFTODSA-N 0.000 description 1
- FFZJHQODAYHGPO-KZVJFYERSA-N Ala-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N FFZJHQODAYHGPO-KZVJFYERSA-N 0.000 description 1
- VNFSAYFQLXPHPY-CIQUZCHMSA-N Ala-Thr-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNFSAYFQLXPHPY-CIQUZCHMSA-N 0.000 description 1
- SAHQGRZIQVEJPF-JXUBOQSCSA-N Ala-Thr-Lys Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN SAHQGRZIQVEJPF-JXUBOQSCSA-N 0.000 description 1
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 1
- 241001136782 Alca Species 0.000 description 1
- 241000123646 Allioideae Species 0.000 description 1
- 241000234282 Allium Species 0.000 description 1
- 235000005255 Allium cepa Nutrition 0.000 description 1
- 235000002732 Allium cepa var. cepa Nutrition 0.000 description 1
- 241000556588 Alstroemeria Species 0.000 description 1
- 241000556591 Alstroemeriaceae Species 0.000 description 1
- 240000008025 Alternanthera ficoidea Species 0.000 description 1
- 244000300297 Amaranthus hybridus Species 0.000 description 1
- 241000234270 Amaryllidaceae Species 0.000 description 1
- 241000746375 Andrographis Species 0.000 description 1
- 241000744007 Andropogon Species 0.000 description 1
- 241001327399 Andropogon gerardii Species 0.000 description 1
- 241000208327 Apocynaceae Species 0.000 description 1
- 241000219195 Arabidopsis thaliana Species 0.000 description 1
- 101100347707 Arabidopsis thaliana QPT gene Proteins 0.000 description 1
- 101100148680 Arabidopsis thaliana SAG12 gene Proteins 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- 241000233788 Arecaceae Species 0.000 description 1
- SGYSTDWPNPKJPP-GUBZILKMSA-N Arg-Ala-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SGYSTDWPNPKJPP-GUBZILKMSA-N 0.000 description 1
- VKKYFICVTYKFIO-CIUDSAMLSA-N Arg-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N VKKYFICVTYKFIO-CIUDSAMLSA-N 0.000 description 1
- DCGLNNVKIZXQOJ-FXQIFTODSA-N Arg-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N DCGLNNVKIZXQOJ-FXQIFTODSA-N 0.000 description 1
- NONSEUUPKITYQT-BQBZGAKWSA-N Arg-Asn-Gly Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N)CN=C(N)N NONSEUUPKITYQT-BQBZGAKWSA-N 0.000 description 1
- DPNHSNLIULPOBH-GUBZILKMSA-N Arg-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N DPNHSNLIULPOBH-GUBZILKMSA-N 0.000 description 1
- KBBKCNHWCDJPGN-GUBZILKMSA-N Arg-Gln-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KBBKCNHWCDJPGN-GUBZILKMSA-N 0.000 description 1
- OHYQKYUTLIPFOX-ZPFDUUQYSA-N Arg-Glu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OHYQKYUTLIPFOX-ZPFDUUQYSA-N 0.000 description 1
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 1
- OFIYLHVAAJYRBC-HJWJTTGWSA-N Arg-Ile-Phe Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O OFIYLHVAAJYRBC-HJWJTTGWSA-N 0.000 description 1
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 1
- JEOCWTUOMKEEMF-RHYQMDGZSA-N Arg-Leu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEOCWTUOMKEEMF-RHYQMDGZSA-N 0.000 description 1
- DTBPLQNKYCYUOM-JYJNAYRXSA-N Arg-Met-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DTBPLQNKYCYUOM-JYJNAYRXSA-N 0.000 description 1
- BSGSDLYGGHGMND-IHRRRGAJSA-N Arg-Phe-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N BSGSDLYGGHGMND-IHRRRGAJSA-N 0.000 description 1
- JJIBHAOBNIFUEL-SRVKXCTJSA-N Arg-Pro-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCCN=C(N)N)N JJIBHAOBNIFUEL-SRVKXCTJSA-N 0.000 description 1
- VENMDXUVHSKEIN-GUBZILKMSA-N Arg-Ser-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VENMDXUVHSKEIN-GUBZILKMSA-N 0.000 description 1
- YNSUUAOAFCVINY-OSUNSFLBSA-N Arg-Thr-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YNSUUAOAFCVINY-OSUNSFLBSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 241001167018 Aroa Species 0.000 description 1
- 235000003826 Artemisia Nutrition 0.000 description 1
- 235000003261 Artemisia vulgaris Nutrition 0.000 description 1
- 241001494508 Arundo donax Species 0.000 description 1
- RZVVKNIACROXRM-ZLUOBGJFSA-N Asn-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N RZVVKNIACROXRM-ZLUOBGJFSA-N 0.000 description 1
- HZPSDHRYYIORKR-WHFBIAKZSA-N Asn-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O HZPSDHRYYIORKR-WHFBIAKZSA-N 0.000 description 1
- NUHQMYUWLUSRJX-BIIVOSGPSA-N Asn-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N NUHQMYUWLUSRJX-BIIVOSGPSA-N 0.000 description 1
- XQQVCUIBGYFKDC-OLHMAJIHSA-N Asn-Asp-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XQQVCUIBGYFKDC-OLHMAJIHSA-N 0.000 description 1
- UPALZCBCKAMGIY-PEFMBERDSA-N Asn-Gln-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UPALZCBCKAMGIY-PEFMBERDSA-N 0.000 description 1
- DDPXDCKYWDGZAL-BQBZGAKWSA-N Asn-Gly-Arg Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N DDPXDCKYWDGZAL-BQBZGAKWSA-N 0.000 description 1
- OLVIPTLKNSAYRJ-YUMQZZPRSA-N Asn-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N OLVIPTLKNSAYRJ-YUMQZZPRSA-N 0.000 description 1
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 1
- ZTRJUKDEALVRMW-SRVKXCTJSA-N Asn-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)N)N ZTRJUKDEALVRMW-SRVKXCTJSA-N 0.000 description 1
- HDHZCEDPLTVHFZ-GUBZILKMSA-N Asn-Leu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O HDHZCEDPLTVHFZ-GUBZILKMSA-N 0.000 description 1
- BZWRLDPIWKOVKB-ZPFDUUQYSA-N Asn-Leu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BZWRLDPIWKOVKB-ZPFDUUQYSA-N 0.000 description 1
- YVXRYLVELQYAEQ-SRVKXCTJSA-N Asn-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N YVXRYLVELQYAEQ-SRVKXCTJSA-N 0.000 description 1
- ORJQQZIXTOYGGH-SRVKXCTJSA-N Asn-Lys-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ORJQQZIXTOYGGH-SRVKXCTJSA-N 0.000 description 1
- HMUKKNAMNSXDBB-CIUDSAMLSA-N Asn-Met-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HMUKKNAMNSXDBB-CIUDSAMLSA-N 0.000 description 1
- KSGAFDTYQPKUAP-GMOBBJLQSA-N Asn-Met-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KSGAFDTYQPKUAP-GMOBBJLQSA-N 0.000 description 1
- ZVUMKOMKQCANOM-AVGNSLFASA-N Asn-Phe-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZVUMKOMKQCANOM-AVGNSLFASA-N 0.000 description 1
- VCJCPARXDBEGNE-GUBZILKMSA-N Asn-Pro-Pro Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 VCJCPARXDBEGNE-GUBZILKMSA-N 0.000 description 1
- IDUUACUJKUXKKD-VEVYYDQMSA-N Asn-Pro-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O IDUUACUJKUXKKD-VEVYYDQMSA-N 0.000 description 1
- VHQSGALUSWIYOD-QXEWZRGKSA-N Asn-Pro-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O VHQSGALUSWIYOD-QXEWZRGKSA-N 0.000 description 1
- GZXOUBTUAUAVHD-ACZMJKKPSA-N Asn-Ser-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GZXOUBTUAUAVHD-ACZMJKKPSA-N 0.000 description 1
- NCXTYSVDWLAQGZ-ZKWXMUAHSA-N Asn-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O NCXTYSVDWLAQGZ-ZKWXMUAHSA-N 0.000 description 1
- MYRLSKYSMXNLLA-LAEOZQHASA-N Asn-Val-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MYRLSKYSMXNLLA-LAEOZQHASA-N 0.000 description 1
- SLHOOKXYTYAJGQ-XVYDVKMFSA-N Asp-Ala-His Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 SLHOOKXYTYAJGQ-XVYDVKMFSA-N 0.000 description 1
- PBVLJOIPOGUQQP-CIUDSAMLSA-N Asp-Ala-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O PBVLJOIPOGUQQP-CIUDSAMLSA-N 0.000 description 1
- GVPSCJQLUGIKAM-GUBZILKMSA-N Asp-Arg-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GVPSCJQLUGIKAM-GUBZILKMSA-N 0.000 description 1
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 1
- GWTLRDMPMJCNMH-WHFBIAKZSA-N Asp-Asn-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GWTLRDMPMJCNMH-WHFBIAKZSA-N 0.000 description 1
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 1
- YNCHFVRXEQFPBY-BQBZGAKWSA-N Asp-Gly-Arg Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N YNCHFVRXEQFPBY-BQBZGAKWSA-N 0.000 description 1
- ZSVJVIOVABDTTL-YUMQZZPRSA-N Asp-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)O)N ZSVJVIOVABDTTL-YUMQZZPRSA-N 0.000 description 1
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 1
- RQHLMGCXCZUOGT-ZPFDUUQYSA-N Asp-Leu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RQHLMGCXCZUOGT-ZPFDUUQYSA-N 0.000 description 1
- UZFHNLYQWMGUHU-DCAQKATOSA-N Asp-Lys-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UZFHNLYQWMGUHU-DCAQKATOSA-N 0.000 description 1
- USNJAPJZSGTTPX-XVSYOHENSA-N Asp-Phe-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O USNJAPJZSGTTPX-XVSYOHENSA-N 0.000 description 1
- MVRGBQGZSDJBSM-GMOBBJLQSA-N Asp-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)O)N MVRGBQGZSDJBSM-GMOBBJLQSA-N 0.000 description 1
- WMLFFCRUSPNENW-ZLUOBGJFSA-N Asp-Ser-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O WMLFFCRUSPNENW-ZLUOBGJFSA-N 0.000 description 1
- ZVGRHIRJLWBWGJ-ACZMJKKPSA-N Asp-Ser-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZVGRHIRJLWBWGJ-ACZMJKKPSA-N 0.000 description 1
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 1
- BOXNGMVEVOGXOJ-UBHSHLNASA-N Asp-Trp-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N BOXNGMVEVOGXOJ-UBHSHLNASA-N 0.000 description 1
- XWKBWZXGNXTDKY-ZKWXMUAHSA-N Asp-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O XWKBWZXGNXTDKY-ZKWXMUAHSA-N 0.000 description 1
- 102100023927 Asparagine synthetase [glutamine-hydrolyzing] Human genes 0.000 description 1
- 108010070255 Aspartate-ammonia ligase Proteins 0.000 description 1
- 241000208838 Asteraceae Species 0.000 description 1
- 241001106067 Atropa Species 0.000 description 1
- 244000075850 Avena orientalis Species 0.000 description 1
- 235000007319 Avena orientalis Nutrition 0.000 description 1
- 235000017166 Bambusa arundinacea Nutrition 0.000 description 1
- 235000017491 Bambusa tulda Nutrition 0.000 description 1
- 241000133570 Berberidaceae Species 0.000 description 1
- 240000000724 Berberis vulgaris Species 0.000 description 1
- 235000006011 Bixa Nutrition 0.000 description 1
- 241000934840 Bixa Species 0.000 description 1
- 241000934828 Bixaceae Species 0.000 description 1
- 108010006654 Bleomycin Proteins 0.000 description 1
- 241000222455 Boletus Species 0.000 description 1
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 1
- 241000339490 Brachyachne Species 0.000 description 1
- 235000011331 Brassica Nutrition 0.000 description 1
- 241000219198 Brassica Species 0.000 description 1
- 235000011303 Brassica alboglabra Nutrition 0.000 description 1
- 244000178993 Brassica juncea Species 0.000 description 1
- 235000011332 Brassica juncea Nutrition 0.000 description 1
- 235000014698 Brassica juncea var multisecta Nutrition 0.000 description 1
- 235000014700 Brassica juncea var napiformis Nutrition 0.000 description 1
- 240000002791 Brassica napus Species 0.000 description 1
- 235000011293 Brassica napus Nutrition 0.000 description 1
- 235000006008 Brassica napus var napus Nutrition 0.000 description 1
- 240000000385 Brassica napus var. napus Species 0.000 description 1
- 240000007124 Brassica oleracea Species 0.000 description 1
- 235000011302 Brassica oleracea Nutrition 0.000 description 1
- 235000004221 Brassica oleracea var gemmifera Nutrition 0.000 description 1
- 244000308368 Brassica oleracea var. gemmifera Species 0.000 description 1
- 235000006618 Brassica rapa subsp oleifera Nutrition 0.000 description 1
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 1
- 241000219193 Brassicaceae Species 0.000 description 1
- 241000234670 Bromeliaceae Species 0.000 description 1
- 239000005489 Bromoxynil Substances 0.000 description 1
- 101100394003 Butyrivibrio fibrisolvens end1 gene Proteins 0.000 description 1
- 101100342815 Caenorhabditis elegans lec-1 gene Proteins 0.000 description 1
- 235000003880 Calendula Nutrition 0.000 description 1
- 240000001432 Calendula officinalis Species 0.000 description 1
- 241000209507 Camellia Species 0.000 description 1
- 241000759909 Camptotheca Species 0.000 description 1
- 101100244387 Candida albicans (strain SC5314 / ATCC MYA-2876) PMT6 gene Proteins 0.000 description 1
- 241000218235 Cannabaceae Species 0.000 description 1
- 241000218236 Cannabis Species 0.000 description 1
- 235000002566 Capsicum Nutrition 0.000 description 1
- 235000008534 Capsicum annuum var annuum Nutrition 0.000 description 1
- 235000002568 Capsicum frutescens Nutrition 0.000 description 1
- 108010078791 Carrier Proteins Proteins 0.000 description 1
- WLYGSPLCNKYESI-RSUQVHIMSA-N Carthamin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1[C@@]1(O)C(O)=C(C(=O)\C=C\C=2C=CC(O)=CC=2)C(=O)C(\C=C\2C([C@](O)([C@H]3[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O3)O)C(O)=C(C(=O)\C=C\C=3C=CC(O)=CC=3)C/2=O)=O)=C1O WLYGSPLCNKYESI-RSUQVHIMSA-N 0.000 description 1
- 241000208809 Carthamus Species 0.000 description 1
- 241000219321 Caryophyllaceae Species 0.000 description 1
- 241000208328 Catharanthus Species 0.000 description 1
- 241000488900 Cephalotaxaceae Species 0.000 description 1
- 241000488899 Cephalotaxus Species 0.000 description 1
- 241000871189 Chenopodiaceae Species 0.000 description 1
- 102000012286 Chitinases Human genes 0.000 description 1
- 108010062745 Chloride Channels Proteins 0.000 description 1
- 102000011045 Chloride Channels Human genes 0.000 description 1
- VEXZGXHMUGYJMC-UHFFFAOYSA-M Chloride anion Chemical compound [Cl-] VEXZGXHMUGYJMC-UHFFFAOYSA-M 0.000 description 1
- 239000005496 Chlorsulfuron Substances 0.000 description 1
- 108010077544 Chromatin Proteins 0.000 description 1
- 235000007516 Chrysanthemum Nutrition 0.000 description 1
- 240000005250 Chrysanthemum indicum Species 0.000 description 1
- 241000034870 Chrysoteuchia culmella Species 0.000 description 1
- 235000021513 Cinchona Nutrition 0.000 description 1
- 241000157855 Cinchona Species 0.000 description 1
- 102100034229 Citramalyl-CoA lyase, mitochondrial Human genes 0.000 description 1
- 241000219109 Citrullus Species 0.000 description 1
- 235000009831 Citrullus lanatus Nutrition 0.000 description 1
- 235000012828 Citrullus lanatus var citroides Nutrition 0.000 description 1
- 108091064523 Clc family Proteins 0.000 description 1
- 241000131506 Colchicaceae Species 0.000 description 1
- 241000723375 Colchicum Species 0.000 description 1
- 235000021508 Coleus Nutrition 0.000 description 1
- 244000061182 Coleus blumei Species 0.000 description 1
- 108020004394 Complementary RNA Proteins 0.000 description 1
- 101710190853 Cruciferin Proteins 0.000 description 1
- 244000241257 Cucumis melo Species 0.000 description 1
- 235000009842 Cucumis melo Nutrition 0.000 description 1
- 235000015510 Cucumis melo subsp melo Nutrition 0.000 description 1
- 235000010071 Cucumis prophetarum Nutrition 0.000 description 1
- 235000009849 Cucumis sativus Nutrition 0.000 description 1
- 235000010799 Cucumis sativus var sativus Nutrition 0.000 description 1
- 241000219122 Cucurbita Species 0.000 description 1
- 235000009854 Cucurbita moschata Nutrition 0.000 description 1
- 240000004244 Cucurbita moschata Species 0.000 description 1
- 241000219104 Cucurbitaceae Species 0.000 description 1
- CMSMOCZEIVJLDB-UHFFFAOYSA-N Cyclophosphamide Chemical compound ClCCN(CCCl)P1(=O)NCCCO1 CMSMOCZEIVJLDB-UHFFFAOYSA-N 0.000 description 1
- 244000052363 Cynodon dactylon Species 0.000 description 1
- XMTDCXXLDZKAGI-ACZMJKKPSA-N Cys-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CS)N XMTDCXXLDZKAGI-ACZMJKKPSA-N 0.000 description 1
- LHLSSZYQFUNWRZ-NAKRPEOUSA-N Cys-Arg-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LHLSSZYQFUNWRZ-NAKRPEOUSA-N 0.000 description 1
- VFGADOJXRLWTBU-JBDRJPRFSA-N Cys-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N VFGADOJXRLWTBU-JBDRJPRFSA-N 0.000 description 1
- SRIRHERUAMYIOQ-CIUDSAMLSA-N Cys-Leu-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SRIRHERUAMYIOQ-CIUDSAMLSA-N 0.000 description 1
- DQGIAOGALAQBGK-BWBBJGPYSA-N Cys-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N)O DQGIAOGALAQBGK-BWBBJGPYSA-N 0.000 description 1
- VRJZMZGGAKVSIQ-SRVKXCTJSA-N Cys-Tyr-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VRJZMZGGAKVSIQ-SRVKXCTJSA-N 0.000 description 1
- MHYHLWUGWUBUHF-GUBZILKMSA-N Cys-Val-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CS)N MHYHLWUGWUBUHF-GUBZILKMSA-N 0.000 description 1
- 102000005927 Cysteine Proteases Human genes 0.000 description 1
- 108010005843 Cysteine Proteases Proteins 0.000 description 1
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 1
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 1
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 description 1
- 108010066133 D-octopine dehydrogenase Proteins 0.000 description 1
- 230000005778 DNA damage Effects 0.000 description 1
- 231100000277 DNA damage Toxicity 0.000 description 1
- 238000000018 DNA microarray Methods 0.000 description 1
- 239000003155 DNA primer Substances 0.000 description 1
- 230000007018 DNA scission Effects 0.000 description 1
- 241000208296 Datura Species 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 240000003421 Dianthus chinensis Species 0.000 description 1
- ZFIVKAOQEXOYFY-UHFFFAOYSA-N Diepoxybutane Chemical compound C1OC1C1OC1 ZFIVKAOQEXOYFY-UHFFFAOYSA-N 0.000 description 1
- 240000001879 Digitalis lutea Species 0.000 description 1
- 235000005903 Dioscorea Nutrition 0.000 description 1
- 244000281702 Dioscorea villosa Species 0.000 description 1
- 235000000504 Dioscorea villosa Nutrition 0.000 description 1
- 241000234272 Dioscoreaceae Species 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 241000512897 Elaeis Species 0.000 description 1
- 235000001942 Elaeis Nutrition 0.000 description 1
- 240000003133 Elaeis guineensis Species 0.000 description 1
- 244000127993 Elaeis melanococca Species 0.000 description 1
- 101100491986 Emericella nidulans (strain FGSC A4 / ATCC 38163 / CBS 112.46 / NRRL 194 / M139) aromA gene Proteins 0.000 description 1
- 241000218671 Ephedra Species 0.000 description 1
- 241000218670 Ephedraceae Species 0.000 description 1
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 1
- 241001081474 Erythroxylaceae Species 0.000 description 1
- 241000735552 Erythroxylum Species 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- IAYPIBMASNFSPL-UHFFFAOYSA-N Ethylene oxide Chemical compound C1CO1 IAYPIBMASNFSPL-UHFFFAOYSA-N 0.000 description 1
- 244000004281 Eucalyptus maculata Species 0.000 description 1
- 241000221017 Euphorbiaceae Species 0.000 description 1
- 241000220485 Fabaceae Species 0.000 description 1
- 241000234643 Festuca arundinacea Species 0.000 description 1
- 229920001917 Ficoll Polymers 0.000 description 1
- 241000220223 Fragaria Species 0.000 description 1
- 235000016623 Fragaria vesca Nutrition 0.000 description 1
- 230000010337 G2 phase Effects 0.000 description 1
- 241000234271 Galanthus Species 0.000 description 1
- 108700023863 Gene Components Proteins 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 1
- RZSLYUUFFVHFRQ-FXQIFTODSA-N Gln-Ala-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O RZSLYUUFFVHFRQ-FXQIFTODSA-N 0.000 description 1
- KVYVOGYEMPEXBT-GUBZILKMSA-N Gln-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O KVYVOGYEMPEXBT-GUBZILKMSA-N 0.000 description 1
- JSYULGSPLTZDHM-NRPADANISA-N Gln-Ala-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O JSYULGSPLTZDHM-NRPADANISA-N 0.000 description 1
- KWUSGAIFNHQCBY-DCAQKATOSA-N Gln-Arg-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O KWUSGAIFNHQCBY-DCAQKATOSA-N 0.000 description 1
- DTMLKCYOQKZXKZ-HJGDQZAQSA-N Gln-Arg-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DTMLKCYOQKZXKZ-HJGDQZAQSA-N 0.000 description 1
- LJEPDHWNQXPXMM-NHCYSSNCSA-N Gln-Arg-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O LJEPDHWNQXPXMM-NHCYSSNCSA-N 0.000 description 1
- UVAOVENCIONMJP-GUBZILKMSA-N Gln-Cys-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O UVAOVENCIONMJP-GUBZILKMSA-N 0.000 description 1
- FGYPOQPQTUNESW-IUCAKERBSA-N Gln-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N FGYPOQPQTUNESW-IUCAKERBSA-N 0.000 description 1
- XFAUJGNLHIGXET-AVGNSLFASA-N Gln-Leu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XFAUJGNLHIGXET-AVGNSLFASA-N 0.000 description 1
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 1
- SHAUZYVSXAMYAZ-JYJNAYRXSA-N Gln-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N SHAUZYVSXAMYAZ-JYJNAYRXSA-N 0.000 description 1
- HSHCEAUPUPJPTE-JYJNAYRXSA-N Gln-Leu-Tyr Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HSHCEAUPUPJPTE-JYJNAYRXSA-N 0.000 description 1
- FALJZCPMTGJOHX-SRVKXCTJSA-N Gln-Met-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O FALJZCPMTGJOHX-SRVKXCTJSA-N 0.000 description 1
- UWMDGPFFTKDUIY-HJGDQZAQSA-N Gln-Pro-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O UWMDGPFFTKDUIY-HJGDQZAQSA-N 0.000 description 1
- OTQSTOXRUBVWAP-NRPADANISA-N Gln-Ser-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OTQSTOXRUBVWAP-NRPADANISA-N 0.000 description 1
- NSEKYCAADBNQFE-XIRDDKMYSA-N Gln-Trp-Arg Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(N)=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 NSEKYCAADBNQFE-XIRDDKMYSA-N 0.000 description 1
- ZZLDMBMFKZFQMU-NRPADANISA-N Gln-Val-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O ZZLDMBMFKZFQMU-NRPADANISA-N 0.000 description 1
- 101710186901 Globulin 1 Proteins 0.000 description 1
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 1
- DYFJZDDQPNIPAB-NHCYSSNCSA-N Glu-Arg-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O DYFJZDDQPNIPAB-NHCYSSNCSA-N 0.000 description 1
- FLLRAEJOLZPSMN-CIUDSAMLSA-N Glu-Asn-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FLLRAEJOLZPSMN-CIUDSAMLSA-N 0.000 description 1
- ZOXBSICWUDAOHX-GUBZILKMSA-N Glu-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O ZOXBSICWUDAOHX-GUBZILKMSA-N 0.000 description 1
- XXCDTYBVGMPIOA-FXQIFTODSA-N Glu-Asp-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XXCDTYBVGMPIOA-FXQIFTODSA-N 0.000 description 1
- UMIRPYLZFKOEOH-YVNDNENWSA-N Glu-Gln-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UMIRPYLZFKOEOH-YVNDNENWSA-N 0.000 description 1
- IFZWDJWERARYFC-WNHJNPCNSA-N Glu-Glu-Gln-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)N)C(O)=O)=CNC2=C1 IFZWDJWERARYFC-WNHJNPCNSA-N 0.000 description 1
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 1
- IQACOVZVOMVILH-FXQIFTODSA-N Glu-Glu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O IQACOVZVOMVILH-FXQIFTODSA-N 0.000 description 1
- NJPQBTJSYCKCNS-HVTMNAMFSA-N Glu-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N NJPQBTJSYCKCNS-HVTMNAMFSA-N 0.000 description 1
- ZHNHJYYFCGUZNQ-KBIXCLLPSA-N Glu-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O ZHNHJYYFCGUZNQ-KBIXCLLPSA-N 0.000 description 1
- CUPSDFQZTVVTSK-GUBZILKMSA-N Glu-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O CUPSDFQZTVVTSK-GUBZILKMSA-N 0.000 description 1
- HRBYTAIBKPNZKQ-AVGNSLFASA-N Glu-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O HRBYTAIBKPNZKQ-AVGNSLFASA-N 0.000 description 1
- QNJNPKSWAHPYGI-JYJNAYRXSA-N Glu-Phe-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=CC=C1 QNJNPKSWAHPYGI-JYJNAYRXSA-N 0.000 description 1
- DTLLNDVORUEOTM-WDCWCFNPSA-N Glu-Thr-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DTLLNDVORUEOTM-WDCWCFNPSA-N 0.000 description 1
- SFKMXFWWDUGXRT-NWLDYVSISA-N Glu-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCC(=O)O)N)O SFKMXFWWDUGXRT-NWLDYVSISA-N 0.000 description 1
- UUTGYDAKPISJAO-JYJNAYRXSA-N Glu-Tyr-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 UUTGYDAKPISJAO-JYJNAYRXSA-N 0.000 description 1
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 1
- 102000053187 Glucuronidase Human genes 0.000 description 1
- 108010060309 Glucuronidase Proteins 0.000 description 1
- 108010070675 Glutathione transferase Proteins 0.000 description 1
- 102000005720 Glutathione transferase Human genes 0.000 description 1
- PUUYVMYCMIWHFE-BQBZGAKWSA-N Gly-Ala-Arg Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PUUYVMYCMIWHFE-BQBZGAKWSA-N 0.000 description 1
- GQGAFTPXAPKSCF-WHFBIAKZSA-N Gly-Ala-Cys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(=O)O GQGAFTPXAPKSCF-WHFBIAKZSA-N 0.000 description 1
- YMUFWNJHVPQNQD-ZKWXMUAHSA-N Gly-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN YMUFWNJHVPQNQD-ZKWXMUAHSA-N 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- QXPRJQPCFXMCIY-NKWVEPMBSA-N Gly-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN QXPRJQPCFXMCIY-NKWVEPMBSA-N 0.000 description 1
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 1
- JRDYDYXZKFNNRQ-XPUUQOCRSA-N Gly-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN JRDYDYXZKFNNRQ-XPUUQOCRSA-N 0.000 description 1
- OCQUNKSFDYDXBG-QXEWZRGKSA-N Gly-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OCQUNKSFDYDXBG-QXEWZRGKSA-N 0.000 description 1
- VXKCPBPQEKKERH-IUCAKERBSA-N Gly-Arg-Pro Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N1CCC[C@H]1C(O)=O VXKCPBPQEKKERH-IUCAKERBSA-N 0.000 description 1
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 1
- GWCRIHNSVMOBEQ-BQBZGAKWSA-N Gly-Arg-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O GWCRIHNSVMOBEQ-BQBZGAKWSA-N 0.000 description 1
- DUYYPIRFTLOAJQ-YUMQZZPRSA-N Gly-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN DUYYPIRFTLOAJQ-YUMQZZPRSA-N 0.000 description 1
- XRTDOIOIBMAXCT-NKWVEPMBSA-N Gly-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)CN)C(=O)O XRTDOIOIBMAXCT-NKWVEPMBSA-N 0.000 description 1
- LXXLEUBUOMCAMR-NKWVEPMBSA-N Gly-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)CN)C(=O)O LXXLEUBUOMCAMR-NKWVEPMBSA-N 0.000 description 1
- IXKRSKPKSLXIHN-YUMQZZPRSA-N Gly-Cys-Leu Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O IXKRSKPKSLXIHN-YUMQZZPRSA-N 0.000 description 1
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 1
- JSNNHGHYGYMVCK-XVKPBYJWSA-N Gly-Glu-Val Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O JSNNHGHYGYMVCK-XVKPBYJWSA-N 0.000 description 1
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 1
- YFGONBOFGGWKKY-VHSXEESVSA-N Gly-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)CN)C(=O)O YFGONBOFGGWKKY-VHSXEESVSA-N 0.000 description 1
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 1
- IUZGUFAJDBHQQV-YUMQZZPRSA-N Gly-Leu-Asn Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IUZGUFAJDBHQQV-YUMQZZPRSA-N 0.000 description 1
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 1
- AFWYPMDMDYCKMD-KBPBESRZSA-N Gly-Leu-Tyr Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFWYPMDMDYCKMD-KBPBESRZSA-N 0.000 description 1
- WDEHMRNSGHVNOH-VHSXEESVSA-N Gly-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)CN)C(=O)O WDEHMRNSGHVNOH-VHSXEESVSA-N 0.000 description 1
- BBTCXWTXOXUNFX-IUCAKERBSA-N Gly-Met-Arg Chemical compound CSCC[C@H](NC(=O)CN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O BBTCXWTXOXUNFX-IUCAKERBSA-N 0.000 description 1
- UWQDKRIZSROAKS-FJXKBIBVSA-N Gly-Met-Thr Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UWQDKRIZSROAKS-FJXKBIBVSA-N 0.000 description 1
- WMGHDYWNHNLGBV-ONGXEEELSA-N Gly-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 WMGHDYWNHNLGBV-ONGXEEELSA-N 0.000 description 1
- ABPRMMYHROQBLY-NKWVEPMBSA-N Gly-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)CN)C(=O)O ABPRMMYHROQBLY-NKWVEPMBSA-N 0.000 description 1
- MYXNLWDWWOTERK-BHNWBGBOSA-N Gly-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN)O MYXNLWDWWOTERK-BHNWBGBOSA-N 0.000 description 1
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 1
- AFMOTCMSEBITOE-YEPSODPASA-N Gly-Val-Thr Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AFMOTCMSEBITOE-YEPSODPASA-N 0.000 description 1
- 108700037728 Glycine max beta-conglycinin Proteins 0.000 description 1
- 108700023372 Glycosyltransferases Proteins 0.000 description 1
- 241000219146 Gossypium Species 0.000 description 1
- 235000009438 Gossypium Nutrition 0.000 description 1
- 235000004341 Gossypium herbaceum Nutrition 0.000 description 1
- 240000002024 Gossypium herbaceum Species 0.000 description 1
- 244000299507 Gossypium hirsutum Species 0.000 description 1
- 235000009432 Gossypium hirsutum Nutrition 0.000 description 1
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 1
- 241001466533 Gypaetus barbatus Species 0.000 description 1
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 1
- 108090001102 Hammerhead ribozyme Proteins 0.000 description 1
- 241000208818 Helianthus Species 0.000 description 1
- 101710154606 Hemagglutinin Proteins 0.000 description 1
- 244000043261 Hevea brasiliensis Species 0.000 description 1
- OBTMRGFRLJBSFI-GARJFASQSA-N His-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O OBTMRGFRLJBSFI-GARJFASQSA-N 0.000 description 1
- DGYNAJNQMBFYIF-SZMVWBNQSA-N His-Glu-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CN=CN1 DGYNAJNQMBFYIF-SZMVWBNQSA-N 0.000 description 1
- CTJHHEQNUNIYNN-SRVKXCTJSA-N His-His-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O CTJHHEQNUNIYNN-SRVKXCTJSA-N 0.000 description 1
- MLZVJIREOKTDAR-SIGLWIIPSA-N His-Ile-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MLZVJIREOKTDAR-SIGLWIIPSA-N 0.000 description 1
- ZRSJXIKQXUGKRB-TUBUOCAGSA-N His-Ile-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZRSJXIKQXUGKRB-TUBUOCAGSA-N 0.000 description 1
- WTJBVCUCLWFGAH-JUKXBJQTSA-N His-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N WTJBVCUCLWFGAH-JUKXBJQTSA-N 0.000 description 1
- IWXMHXYOACDSIA-PYJNHQTQSA-N His-Ile-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O IWXMHXYOACDSIA-PYJNHQTQSA-N 0.000 description 1
- OQDLKDUVMTUPPG-AVGNSLFASA-N His-Leu-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OQDLKDUVMTUPPG-AVGNSLFASA-N 0.000 description 1
- TVMNTHXFRSXZGR-IHRRRGAJSA-N His-Lys-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O TVMNTHXFRSXZGR-IHRRRGAJSA-N 0.000 description 1
- SAPLASXFNUYUFE-CQDKDKBSSA-N His-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CC2=CN=CN2)N SAPLASXFNUYUFE-CQDKDKBSSA-N 0.000 description 1
- ZFDKSLBEWYCOCS-BZSNNMDCSA-N His-Phe-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1NC=NC=1)C1=CC=CC=C1 ZFDKSLBEWYCOCS-BZSNNMDCSA-N 0.000 description 1
- ZUELLZFHJUPFEC-PMVMPFDFSA-N His-Phe-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CN=CN1 ZUELLZFHJUPFEC-PMVMPFDFSA-N 0.000 description 1
- XVZJRZQIHJMUBG-TUBUOCAGSA-N His-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CC1=CN=CN1)N XVZJRZQIHJMUBG-TUBUOCAGSA-N 0.000 description 1
- HIJIJPFILYPTFR-ACRUOGEOSA-N His-Tyr-Tyr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O HIJIJPFILYPTFR-ACRUOGEOSA-N 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 description 1
- 101000655429 Homo sapiens Multidrug and toxin extrusion protein 2 Proteins 0.000 description 1
- 241000209219 Hordeum Species 0.000 description 1
- 241000208278 Hyoscyamus Species 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- AQCUAZTZSPQJFF-ZKWXMUAHSA-N Ile-Ala-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O AQCUAZTZSPQJFF-ZKWXMUAHSA-N 0.000 description 1
- HLYBGMZJVDHJEO-CYDGBPFRSA-N Ile-Arg-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HLYBGMZJVDHJEO-CYDGBPFRSA-N 0.000 description 1
- ATXGFMOBVKSOMK-PEDHHIEDSA-N Ile-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N ATXGFMOBVKSOMK-PEDHHIEDSA-N 0.000 description 1
- UNDGQKWQNSTPPW-CYDGBPFRSA-N Ile-Arg-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCSC)C(=O)O)N UNDGQKWQNSTPPW-CYDGBPFRSA-N 0.000 description 1
- DMHGKBGOUAJRHU-RVMXOQNASA-N Ile-Arg-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N DMHGKBGOUAJRHU-RVMXOQNASA-N 0.000 description 1
- PHIXPNQDGGILMP-YVNDNENWSA-N Ile-Glu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PHIXPNQDGGILMP-YVNDNENWSA-N 0.000 description 1
- OEQKGSPBDVKYOC-ZKWXMUAHSA-N Ile-Gly-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N OEQKGSPBDVKYOC-ZKWXMUAHSA-N 0.000 description 1
- YKLOMBNBQUTJDT-HVTMNAMFSA-N Ile-His-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YKLOMBNBQUTJDT-HVTMNAMFSA-N 0.000 description 1
- YNMQUIVKEFRCPH-QSFUFRPTSA-N Ile-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O)N YNMQUIVKEFRCPH-QSFUFRPTSA-N 0.000 description 1
- CSQNHSGHAPRGPQ-YTFOTSKYSA-N Ile-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)O)N CSQNHSGHAPRGPQ-YTFOTSKYSA-N 0.000 description 1
- DSDPLOODKXISDT-XUXIUFHCSA-N Ile-Leu-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O DSDPLOODKXISDT-XUXIUFHCSA-N 0.000 description 1
- UAELWXJFLZBKQS-WHOFXGATSA-N Ile-Phe-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O UAELWXJFLZBKQS-WHOFXGATSA-N 0.000 description 1
- QHUREMVLLMNUAX-OSUNSFLBSA-N Ile-Thr-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)O)N QHUREMVLLMNUAX-OSUNSFLBSA-N 0.000 description 1
- BLFXHAFTNYZEQE-VKOGCVSHSA-N Ile-Trp-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N BLFXHAFTNYZEQE-VKOGCVSHSA-N 0.000 description 1
- HODVZHLJUUWPKY-STECZYCISA-N Ile-Tyr-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CC=C(O)C=C1 HODVZHLJUUWPKY-STECZYCISA-N 0.000 description 1
- NUEHSWNAFIEBCQ-NAKRPEOUSA-N Ile-Val-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)O)N NUEHSWNAFIEBCQ-NAKRPEOUSA-N 0.000 description 1
- UYODHPPSCXBNCS-XUXIUFHCSA-N Ile-Val-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C UYODHPPSCXBNCS-XUXIUFHCSA-N 0.000 description 1
- 102000012330 Integrases Human genes 0.000 description 1
- 108010061833 Integrases Proteins 0.000 description 1
- 240000005385 Jasminum sambac Species 0.000 description 1
- 241001048891 Jatropha curcas Species 0.000 description 1
- 241000588747 Klebsiella pneumoniae Species 0.000 description 1
- 108010009384 L-Iditol 2-Dehydrogenase Proteins 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- TYYLDKGBCJGJGW-UHFFFAOYSA-N L-tryptophan-L-tyrosine Natural products C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 TYYLDKGBCJGJGW-UHFFFAOYSA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 241000207923 Lamiaceae Species 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 1
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 1
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 1
- OGCQGUIWMSBHRZ-CIUDSAMLSA-N Leu-Asn-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OGCQGUIWMSBHRZ-CIUDSAMLSA-N 0.000 description 1
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 1
- WMTOVWLLDGQGCV-GUBZILKMSA-N Leu-Glu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N WMTOVWLLDGQGCV-GUBZILKMSA-N 0.000 description 1
- LAPSXOAUPNOINL-YUMQZZPRSA-N Leu-Gly-Asp Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O LAPSXOAUPNOINL-YUMQZZPRSA-N 0.000 description 1
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 1
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 1
- PBGDOSARRIJMEV-DLOVCJGASA-N Leu-His-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O PBGDOSARRIJMEV-DLOVCJGASA-N 0.000 description 1
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 1
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 1
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 1
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 1
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 1
- REPBGZHJKYWFMJ-KKUMJFAQSA-N Leu-Lys-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N REPBGZHJKYWFMJ-KKUMJFAQSA-N 0.000 description 1
- BGZCJDGBBUUBHA-KKUMJFAQSA-N Leu-Lys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O BGZCJDGBBUUBHA-KKUMJFAQSA-N 0.000 description 1
- QNTJIDXQHWUBKC-BZSNNMDCSA-N Leu-Lys-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNTJIDXQHWUBKC-BZSNNMDCSA-N 0.000 description 1
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 1
- QONKWXNJRRNTBV-AVGNSLFASA-N Leu-Pro-Met Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)O)N QONKWXNJRRNTBV-AVGNSLFASA-N 0.000 description 1
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 1
- HWMQRQIFVGEAPH-XIRDDKMYSA-N Leu-Ser-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 HWMQRQIFVGEAPH-XIRDDKMYSA-N 0.000 description 1
- IDGRADDMTTWOQC-WDSOQIARSA-N Leu-Trp-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IDGRADDMTTWOQC-WDSOQIARSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 241000209510 Liliopsida Species 0.000 description 1
- 241000208202 Linaceae Species 0.000 description 1
- 241000208204 Linum Species 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 235000010649 Lupinus albus Nutrition 0.000 description 1
- 240000000894 Lupinus albus Species 0.000 description 1
- 241000227653 Lycopersicon Species 0.000 description 1
- 235000002262 Lycopersicon Nutrition 0.000 description 1
- 241000195948 Lycopodiaceae Species 0.000 description 1
- 241000195947 Lycopodium Species 0.000 description 1
- WQWZXKWOEVSGQM-DCAQKATOSA-N Lys-Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN WQWZXKWOEVSGQM-DCAQKATOSA-N 0.000 description 1
- HGZHSNBZDOLMLH-DCAQKATOSA-N Lys-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N HGZHSNBZDOLMLH-DCAQKATOSA-N 0.000 description 1
- FLCMXEFCTLXBTL-DCAQKATOSA-N Lys-Asp-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N FLCMXEFCTLXBTL-DCAQKATOSA-N 0.000 description 1
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 1
- YEIYAQQKADPIBJ-GARJFASQSA-N Lys-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N)C(=O)O YEIYAQQKADPIBJ-GARJFASQSA-N 0.000 description 1
- NRQRKMYZONPCTM-CIUDSAMLSA-N Lys-Asp-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O NRQRKMYZONPCTM-CIUDSAMLSA-N 0.000 description 1
- KWUKZRFFKPLUPE-HJGDQZAQSA-N Lys-Asp-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWUKZRFFKPLUPE-HJGDQZAQSA-N 0.000 description 1
- DFXQCCBKGUNYGG-GUBZILKMSA-N Lys-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCCN DFXQCCBKGUNYGG-GUBZILKMSA-N 0.000 description 1
- YVMQJGWLHRWMDF-MNXVOIDGSA-N Lys-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N YVMQJGWLHRWMDF-MNXVOIDGSA-N 0.000 description 1
- UETQMSASAVBGJY-QWRGUYRKSA-N Lys-Gly-His Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CNC=N1 UETQMSASAVBGJY-QWRGUYRKSA-N 0.000 description 1
- GQFDWEDHOQRNLC-QWRGUYRKSA-N Lys-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN GQFDWEDHOQRNLC-QWRGUYRKSA-N 0.000 description 1
- JZMGVXLDOQOKAH-UWVGGRQHSA-N Lys-Gly-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O JZMGVXLDOQOKAH-UWVGGRQHSA-N 0.000 description 1
- PGLGNCVOWIORQE-SRVKXCTJSA-N Lys-His-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O PGLGNCVOWIORQE-SRVKXCTJSA-N 0.000 description 1
- NJNRBRKHOWSGMN-SRVKXCTJSA-N Lys-Leu-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O NJNRBRKHOWSGMN-SRVKXCTJSA-N 0.000 description 1
- VMTYLUGCXIEDMV-QWRGUYRKSA-N Lys-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN VMTYLUGCXIEDMV-QWRGUYRKSA-N 0.000 description 1
- PFZWARWVRNTPBR-IHPCNDPISA-N Lys-Leu-Trp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCCN)N PFZWARWVRNTPBR-IHPCNDPISA-N 0.000 description 1
- LJADEBULDNKJNK-IHRRRGAJSA-N Lys-Leu-Val Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LJADEBULDNKJNK-IHRRRGAJSA-N 0.000 description 1
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 1
- HKXSZKJMDBHOTG-CIUDSAMLSA-N Lys-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN HKXSZKJMDBHOTG-CIUDSAMLSA-N 0.000 description 1
- YFQSSOAGMZGXFT-MEYUZBJRSA-N Lys-Thr-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YFQSSOAGMZGXFT-MEYUZBJRSA-N 0.000 description 1
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 101150083961 MPO1 gene Proteins 0.000 description 1
- 229910016094 MPO2 Inorganic materials 0.000 description 1
- 108020004687 Malate Synthase Proteins 0.000 description 1
- 241000219071 Malvaceae Species 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 235000004456 Manihot esculenta Nutrition 0.000 description 1
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 description 1
- 101000763602 Manilkara zapota Thaumatin-like protein 1 Proteins 0.000 description 1
- 101000763586 Manilkara zapota Thaumatin-like protein 1a Proteins 0.000 description 1
- 229930195725 Mannitol Natural products 0.000 description 1
- 108020000290 Mannitol dehydrogenase Proteins 0.000 description 1
- 108091027974 Mature messenger RNA Proteins 0.000 description 1
- 241000489991 Melanthiaceae Species 0.000 description 1
- 235000014435 Mentha Nutrition 0.000 description 1
- 241001072983 Mentha Species 0.000 description 1
- LMKSBGIUPVRHEH-FXQIFTODSA-N Met-Ala-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(N)=O LMKSBGIUPVRHEH-FXQIFTODSA-N 0.000 description 1
- BVXXDMUMHMXFER-BPNCWPANSA-N Met-Ala-Tyr Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BVXXDMUMHMXFER-BPNCWPANSA-N 0.000 description 1
- IIPHCNKHEZYSNE-DCAQKATOSA-N Met-Arg-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O IIPHCNKHEZYSNE-DCAQKATOSA-N 0.000 description 1
- NKDSBBBPGIVWEI-RCWTZXSCSA-N Met-Arg-Thr Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NKDSBBBPGIVWEI-RCWTZXSCSA-N 0.000 description 1
- ACYHZNZHIZWLQF-BQBZGAKWSA-N Met-Asn-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ACYHZNZHIZWLQF-BQBZGAKWSA-N 0.000 description 1
- IHITVQKJXQQGLJ-LPEHRKFASA-N Met-Asn-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N IHITVQKJXQQGLJ-LPEHRKFASA-N 0.000 description 1
- STTRPDDKDVKIDF-KKUMJFAQSA-N Met-Glu-Tyr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 STTRPDDKDVKIDF-KKUMJFAQSA-N 0.000 description 1
- UZWMJZSOXGOVIN-LURJTMIESA-N Met-Gly-Gly Chemical compound CSCC[C@H](N)C(=O)NCC(=O)NCC(O)=O UZWMJZSOXGOVIN-LURJTMIESA-N 0.000 description 1
- MYAPQOBHGWJZOM-UWVGGRQHSA-N Met-Gly-Leu Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C MYAPQOBHGWJZOM-UWVGGRQHSA-N 0.000 description 1
- GFDBWMDLBKCLQH-IHRRRGAJSA-N Met-Phe-Cys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)O)N GFDBWMDLBKCLQH-IHRRRGAJSA-N 0.000 description 1
- LQTGGXSOMDSWTQ-UNQGMJICSA-N Met-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCSC)N)O LQTGGXSOMDSWTQ-UNQGMJICSA-N 0.000 description 1
- KSIPKXNIQOWMIC-RCWTZXSCSA-N Met-Thr-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KSIPKXNIQOWMIC-RCWTZXSCSA-N 0.000 description 1
- NDJSSFWDYDUQID-YTWAJWBKSA-N Met-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N)O NDJSSFWDYDUQID-YTWAJWBKSA-N 0.000 description 1
- GWADARYJIJDYRC-XGEHTFHBSA-N Met-Thr-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GWADARYJIJDYRC-XGEHTFHBSA-N 0.000 description 1
- VOAKKHOIAFKOQZ-JYJNAYRXSA-N Met-Tyr-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CCSC)CC1=CC=C(O)C=C1 VOAKKHOIAFKOQZ-JYJNAYRXSA-N 0.000 description 1
- TWEWRDAAIYBJTO-ULQDDVLXSA-N Met-Tyr-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N TWEWRDAAIYBJTO-ULQDDVLXSA-N 0.000 description 1
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 description 1
- 241001074116 Miscanthus x giganteus Species 0.000 description 1
- 108020005196 Mitochondrial DNA Proteins 0.000 description 1
- 102100032858 Multidrug and toxin extrusion protein 2 Human genes 0.000 description 1
- 108091007573 Multidrug and toxin extrusion transporters Proteins 0.000 description 1
- 241000234295 Musa Species 0.000 description 1
- 101000966653 Musa acuminata Glucan endo-1,3-beta-glucosidase Proteins 0.000 description 1
- 240000005561 Musa balbisiana Species 0.000 description 1
- 235000018290 Musa x paradisiaca Nutrition 0.000 description 1
- 241000234615 Musaceae Species 0.000 description 1
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 1
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 1
- 102000018463 Myo-Inositol-1-Phosphate Synthase Human genes 0.000 description 1
- 108091000020 Myo-Inositol-1-Phosphate Synthase Proteins 0.000 description 1
- 235000009421 Myristica fragrans Nutrition 0.000 description 1
- 244000270834 Myristica fragrans Species 0.000 description 1
- 241000219926 Myrtaceae Species 0.000 description 1
- 102000006374 N-Demethylating Oxidoreductases Human genes 0.000 description 1
- 108010058669 N-Demethylating Oxidoreductases Proteins 0.000 description 1
- FUSGACRLAFQQRL-UHFFFAOYSA-N N-Ethyl-N-nitrosourea Chemical compound CCN(N=O)C(N)=O FUSGACRLAFQQRL-UHFFFAOYSA-N 0.000 description 1
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 1
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 1
- ZRKWMRDKSOPRRS-UHFFFAOYSA-N N-Methyl-N-nitrosourea Chemical compound O=NN(C)C(N)=O ZRKWMRDKSOPRRS-UHFFFAOYSA-N 0.000 description 1
- 102100023315 N-acetyllactosaminide beta-1,6-N-acetylglucosaminyl-transferase Human genes 0.000 description 1
- 108010056664 N-acetyllactosaminide beta-1,6-N-acetylglucosaminyltransferase Proteins 0.000 description 1
- VZUNGTLZRAYYDE-UHFFFAOYSA-N N-methyl-N'-nitro-N-nitrosoguanidine Chemical compound O=NN(C)C(=N)N[N+]([O-])=O VZUNGTLZRAYYDE-UHFFFAOYSA-N 0.000 description 1
- 101710202365 Napin Proteins 0.000 description 1
- 102100034559 Natural resistance-associated macrophage protein 1 Human genes 0.000 description 1
- 241000250374 Nicotiana acaulis Species 0.000 description 1
- 241000208126 Nicotiana acuminata Species 0.000 description 1
- 241001144497 Nicotiana africana Species 0.000 description 1
- 244000061322 Nicotiana alata Species 0.000 description 1
- 241000250377 Nicotiana amplexicaulis Species 0.000 description 1
- 241001144490 Nicotiana arentsii Species 0.000 description 1
- 241000228653 Nicotiana attenuata Species 0.000 description 1
- 241000250375 Nicotiana benavidesii Species 0.000 description 1
- 241000250376 Nicotiana bonariensis Species 0.000 description 1
- 241000250373 Nicotiana cavicola Species 0.000 description 1
- 241001609967 Nicotiana clevelandii Species 0.000 description 1
- 241001244271 Nicotiana cordifolia Species 0.000 description 1
- 241001144496 Nicotiana corymbosa Species 0.000 description 1
- 241000208113 Nicotiana debneyi Species 0.000 description 1
- 241000862464 Nicotiana excelsior Species 0.000 description 1
- 244000006449 Nicotiana forgetiana Species 0.000 description 1
- 241000208128 Nicotiana glauca Species 0.000 description 1
- 241001495644 Nicotiana glutinosa Species 0.000 description 1
- 241001144503 Nicotiana goodspeedii Species 0.000 description 1
- 241000250366 Nicotiana gossei Species 0.000 description 1
- 241000579278 Nicotiana kawakamii Species 0.000 description 1
- 241000250368 Nicotiana knightiana Species 0.000 description 1
- 241000250019 Nicotiana langsdorffii Species 0.000 description 1
- 241000250027 Nicotiana linearis Species 0.000 description 1
- 241000250024 Nicotiana longiflora Species 0.000 description 1
- 241001144499 Nicotiana maritima Species 0.000 description 1
- 241000250031 Nicotiana megalosiphon Species 0.000 description 1
- 241000250030 Nicotiana miersii Species 0.000 description 1
- 241000250041 Nicotiana noctiflora Species 0.000 description 1
- 241000228665 Nicotiana nudicaulis Species 0.000 description 1
- 241001144504 Nicotiana occidentalis subsp. hesperis Species 0.000 description 1
- 241000208132 Nicotiana otophora Species 0.000 description 1
- 241000876839 Nicotiana paniculata Species 0.000 description 1
- 241001144492 Nicotiana pauciflora Species 0.000 description 1
- 241000250042 Nicotiana petunioides Species 0.000 description 1
- 241000208133 Nicotiana plumbaginifolia Species 0.000 description 1
- 241001144487 Nicotiana raimondii Species 0.000 description 1
- 241001290303 Nicotiana repanda Species 0.000 description 1
- 241001144500 Nicotiana rosulata Species 0.000 description 1
- 241001144486 Nicotiana rotundifolia Species 0.000 description 1
- 241000208134 Nicotiana rustica Species 0.000 description 1
- 241001144491 Nicotiana setchellii Species 0.000 description 1
- 241000250044 Nicotiana simulans Species 0.000 description 1
- 241000249970 Nicotiana solanifolia Species 0.000 description 1
- 241001144495 Nicotiana spegazzinii Species 0.000 description 1
- 241000249966 Nicotiana stocktonii Species 0.000 description 1
- 241001144480 Nicotiana suaveolens Species 0.000 description 1
- 241000208136 Nicotiana sylvestris Species 0.000 description 1
- 101100179449 Nicotiana tabacum A622 gene Proteins 0.000 description 1
- 241001144489 Nicotiana thyrsiflora Species 0.000 description 1
- 241000579280 Nicotiana tomentosa Species 0.000 description 1
- 241000208138 Nicotiana tomentosiformis Species 0.000 description 1
- 241000249968 Nicotiana umbratica Species 0.000 description 1
- 241000228669 Nicotiana velutina Species 0.000 description 1
- 241001144494 Nicotiana wigandioides Species 0.000 description 1
- NHNBFGGVMKEFGY-UHFFFAOYSA-N Nitrate Chemical compound [O-][N+]([O-])=O NHNBFGGVMKEFGY-UHFFFAOYSA-N 0.000 description 1
- 108090000913 Nitrate Reductases Proteins 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 108020004485 Nonsense Codon Proteins 0.000 description 1
- 240000002061 Nothoscordum fragrans Species 0.000 description 1
- 102000008297 Nuclear Matrix-Associated Proteins Human genes 0.000 description 1
- 108010035916 Nuclear Matrix-Associated Proteins Proteins 0.000 description 1
- 241000209018 Nyssaceae Species 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 241000209094 Oryza Species 0.000 description 1
- 101710093908 Outer capsid protein VP4 Proteins 0.000 description 1
- 101710135467 Outer capsid protein sigma-1 Proteins 0.000 description 1
- 101150030997 PCNA2 gene Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 238000010222 PCR analysis Methods 0.000 description 1
- 239000012807 PCR reagent Substances 0.000 description 1
- 101150036326 PMT2 gene Proteins 0.000 description 1
- 101150024216 PMT3 gene Proteins 0.000 description 1
- 101150086142 PMT4 gene Proteins 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 241001520808 Panicum virgatum Species 0.000 description 1
- 235000011096 Papaver Nutrition 0.000 description 1
- 240000001090 Papaver somniferum Species 0.000 description 1
- 241000218180 Papaveraceae Species 0.000 description 1
- 241001495454 Parthenium Species 0.000 description 1
- AVFIYMSJDDGDBQ-UHFFFAOYSA-N Parthenium Chemical compound C1C=C(CCC(C)=O)C(C)CC2OC(=O)C(=C)C21 AVFIYMSJDDGDBQ-UHFFFAOYSA-N 0.000 description 1
- 241000209046 Pennisetum Species 0.000 description 1
- 244000130556 Pennisetum purpureum Species 0.000 description 1
- 244000038248 Pennisetum spicatum Species 0.000 description 1
- 244000115721 Pennisetum typhoides Species 0.000 description 1
- 244000025272 Persea americana Species 0.000 description 1
- 235000008673 Persea americana Nutrition 0.000 description 1
- 241000745991 Phalaris Species 0.000 description 1
- 244000081757 Phalaris arundinacea Species 0.000 description 1
- 101710163504 Phaseolin Proteins 0.000 description 1
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 1
- 244000046052 Phaseolus vulgaris Species 0.000 description 1
- 108700011203 Phaseolus vulgaris phaseolin Proteins 0.000 description 1
- LSXGADJXBDFXQU-DLOVCJGASA-N Phe-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 LSXGADJXBDFXQU-DLOVCJGASA-N 0.000 description 1
- LBSARGIQACMGDF-WBAXXEDZSA-N Phe-Ala-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 LBSARGIQACMGDF-WBAXXEDZSA-N 0.000 description 1
- IQXOZIDWLZYYAW-IHRRRGAJSA-N Phe-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N IQXOZIDWLZYYAW-IHRRRGAJSA-N 0.000 description 1
- OJUMUUXGSXUZJZ-SRVKXCTJSA-N Phe-Asp-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OJUMUUXGSXUZJZ-SRVKXCTJSA-N 0.000 description 1
- VJEZWOSKRCLHRP-MELADBBJSA-N Phe-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O VJEZWOSKRCLHRP-MELADBBJSA-N 0.000 description 1
- KOUUGTKGEQZRHV-KKUMJFAQSA-N Phe-Gln-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O KOUUGTKGEQZRHV-KKUMJFAQSA-N 0.000 description 1
- LLGTYVHITPVGKR-RYUDHWBXSA-N Phe-Gln-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O LLGTYVHITPVGKR-RYUDHWBXSA-N 0.000 description 1
- MMYUOSCXBJFUNV-QWRGUYRKSA-N Phe-Gly-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N MMYUOSCXBJFUNV-QWRGUYRKSA-N 0.000 description 1
- KXUZHWXENMYOHC-QEJZJMRPSA-N Phe-Leu-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O KXUZHWXENMYOHC-QEJZJMRPSA-N 0.000 description 1
- KDYPMIZMXDECSU-JYJNAYRXSA-N Phe-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 KDYPMIZMXDECSU-JYJNAYRXSA-N 0.000 description 1
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 1
- GPSMLZQVIIYLDK-ULQDDVLXSA-N Phe-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O GPSMLZQVIIYLDK-ULQDDVLXSA-N 0.000 description 1
- WURZLPSMYZLEGH-UNQGMJICSA-N Phe-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=CC=C1)N)O WURZLPSMYZLEGH-UNQGMJICSA-N 0.000 description 1
- KAJLHCWRWDSROH-BZSNNMDCSA-N Phe-Phe-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=CC=C1 KAJLHCWRWDSROH-BZSNNMDCSA-N 0.000 description 1
- AXIOGMQCDYVTNY-ACRUOGEOSA-N Phe-Phe-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 AXIOGMQCDYVTNY-ACRUOGEOSA-N 0.000 description 1
- 241000746981 Phleum Species 0.000 description 1
- 241000746983 Phleum pratense Species 0.000 description 1
- 108030002254 Phosphate acyltransferases Proteins 0.000 description 1
- IAJOBQBIJHVGMQ-UHFFFAOYSA-N Phosphinothricin Natural products CP(O)(=O)CCC(N)C(O)=O IAJOBQBIJHVGMQ-UHFFFAOYSA-N 0.000 description 1
- 108010060806 Photosystem II Protein Complex Proteins 0.000 description 1
- 244000082204 Phyllostachys viridis Species 0.000 description 1
- 235000015334 Phyllostachys viridis Nutrition 0.000 description 1
- 241000218641 Pinaceae Species 0.000 description 1
- 235000005205 Pinus Nutrition 0.000 description 1
- 241000218602 Pinus <genus> Species 0.000 description 1
- 235000008331 Pinus X rigitaeda Nutrition 0.000 description 1
- 241000018646 Pinus brutia Species 0.000 description 1
- 241000013557 Plantaginaceae Species 0.000 description 1
- 241000500437 Plutella xylostella Species 0.000 description 1
- 241000209048 Poa Species 0.000 description 1
- 241000209049 Poa pratensis Species 0.000 description 1
- 241000209504 Poaceae Species 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- 241000161288 Populus candicans Species 0.000 description 1
- 241000183024 Populus tremula Species 0.000 description 1
- 235000011263 Populus tremuloides Nutrition 0.000 description 1
- 240000004923 Populus tremuloides Species 0.000 description 1
- 235000015696 Portulacaria afra Nutrition 0.000 description 1
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 1
- HFZNNDWPHBRNPV-KZVJFYERSA-N Pro-Ala-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HFZNNDWPHBRNPV-KZVJFYERSA-N 0.000 description 1
- AMBLXEMWFARNNQ-DCAQKATOSA-N Pro-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@@H]1CCCN1 AMBLXEMWFARNNQ-DCAQKATOSA-N 0.000 description 1
- LANQLYHLMYDWJP-SRVKXCTJSA-N Pro-Gln-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O LANQLYHLMYDWJP-SRVKXCTJSA-N 0.000 description 1
- SKICPQLTOXGWGO-GARJFASQSA-N Pro-Gln-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N2CCC[C@@H]2C(=O)O SKICPQLTOXGWGO-GARJFASQSA-N 0.000 description 1
- VDGTVWFMRXVQCT-GUBZILKMSA-N Pro-Glu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 VDGTVWFMRXVQCT-GUBZILKMSA-N 0.000 description 1
- UEHYFUCOGHWASA-HJGDQZAQSA-N Pro-Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 UEHYFUCOGHWASA-HJGDQZAQSA-N 0.000 description 1
- ULIWFCCJIOEHMU-BQBZGAKWSA-N Pro-Gly-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 ULIWFCCJIOEHMU-BQBZGAKWSA-N 0.000 description 1
- BAKAHWWRCCUDAF-IHRRRGAJSA-N Pro-His-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@H]1NCCC1)C1=CN=CN1 BAKAHWWRCCUDAF-IHRRRGAJSA-N 0.000 description 1
- XYHMFGGWNOFUOU-QXEWZRGKSA-N Pro-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 XYHMFGGWNOFUOU-QXEWZRGKSA-N 0.000 description 1
- FJLODLCIOJUDRG-PYJNHQTQSA-N Pro-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 FJLODLCIOJUDRG-PYJNHQTQSA-N 0.000 description 1
- WOIFYRZPIORBRY-AVGNSLFASA-N Pro-Lys-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O WOIFYRZPIORBRY-AVGNSLFASA-N 0.000 description 1
- QCMYJBKTMIWZAP-AVGNSLFASA-N Pro-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 QCMYJBKTMIWZAP-AVGNSLFASA-N 0.000 description 1
- JFBJPBZSTMXGKL-JYJNAYRXSA-N Pro-Met-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JFBJPBZSTMXGKL-JYJNAYRXSA-N 0.000 description 1
- BUEIYHBJHCDAMI-UFYCRDLUSA-N Pro-Phe-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BUEIYHBJHCDAMI-UFYCRDLUSA-N 0.000 description 1
- POQFNPILEQEODH-FXQIFTODSA-N Pro-Ser-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O POQFNPILEQEODH-FXQIFTODSA-N 0.000 description 1
- MKGIILKDUGDRRO-FXQIFTODSA-N Pro-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 MKGIILKDUGDRRO-FXQIFTODSA-N 0.000 description 1
- WVXQQUWOKUZIEG-VEVYYDQMSA-N Pro-Thr-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O WVXQQUWOKUZIEG-VEVYYDQMSA-N 0.000 description 1
- AIOWVDNPESPXRB-YTWAJWBKSA-N Pro-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2)O AIOWVDNPESPXRB-YTWAJWBKSA-N 0.000 description 1
- CNUIHOAISPKQPY-HSHDSVGOSA-N Pro-Thr-Trp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O CNUIHOAISPKQPY-HSHDSVGOSA-N 0.000 description 1
- DGDCSVGVWWAJRS-AVGNSLFASA-N Pro-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 DGDCSVGVWWAJRS-AVGNSLFASA-N 0.000 description 1
- IIRBTQHFVNGPMQ-AVGNSLFASA-N Pro-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 IIRBTQHFVNGPMQ-AVGNSLFASA-N 0.000 description 1
- ZMLRZBWCXPQADC-TUAOUCFPSA-N Pro-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 ZMLRZBWCXPQADC-TUAOUCFPSA-N 0.000 description 1
- FHJQROWZEJFZPO-SRVKXCTJSA-N Pro-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FHJQROWZEJFZPO-SRVKXCTJSA-N 0.000 description 1
- 240000007909 Prosopis juliflora Species 0.000 description 1
- 101710176177 Protein A56 Proteins 0.000 description 1
- 108700040121 Protein Methyltransferases Proteins 0.000 description 1
- 102000055027 Protein Methyltransferases Human genes 0.000 description 1
- 108010026552 Proteome Proteins 0.000 description 1
- 101150041925 RBCS gene Proteins 0.000 description 1
- 101150051143 RBCS1 gene Proteins 0.000 description 1
- 108091034057 RNA (poly(A)) Proteins 0.000 description 1
- 101150084101 RNA2 gene Proteins 0.000 description 1
- 238000011529 RT qPCR Methods 0.000 description 1
- 244000061121 Rauvolfia serpentina Species 0.000 description 1
- 102000018120 Recombinases Human genes 0.000 description 1
- 108010091086 Recombinases Proteins 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 241001361634 Rhizoctonia Species 0.000 description 1
- 102000003661 Ribonuclease III Human genes 0.000 description 1
- 108010057163 Ribonuclease III Proteins 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 235000003846 Ricinus Nutrition 0.000 description 1
- 241000322381 Ricinus <louse> Species 0.000 description 1
- 241000220317 Rosa Species 0.000 description 1
- 235000004789 Rosa xanthina Nutrition 0.000 description 1
- 241000220222 Rosaceae Species 0.000 description 1
- 241001107098 Rubiaceae Species 0.000 description 1
- 230000018199 S phase Effects 0.000 description 1
- 108091006619 SLC11A1 Proteins 0.000 description 1
- 101100241858 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) OAC1 gene Proteins 0.000 description 1
- 101100353432 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) PRP2 gene Proteins 0.000 description 1
- 240000000111 Saccharum officinarum Species 0.000 description 1
- 235000007201 Saccharum officinarum Nutrition 0.000 description 1
- 241000746444 Saccharum sp. Species 0.000 description 1
- 241000218998 Salicaceae Species 0.000 description 1
- 241000293869 Salmonella enterica subsp. enterica serovar Typhimurium Species 0.000 description 1
- 241001093760 Sapindaceae Species 0.000 description 1
- 101100043108 Schizosaccharomyces pombe (strain 972 / ATCC 24843) spb1 gene Proteins 0.000 description 1
- 241000242873 Scopolia Species 0.000 description 1
- 241000209056 Secale Species 0.000 description 1
- 108010016634 Seed Storage Proteins Proteins 0.000 description 1
- 108091081021 Sense strand Proteins 0.000 description 1
- WTUJZHKANPDPIN-CIUDSAMLSA-N Ser-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N WTUJZHKANPDPIN-CIUDSAMLSA-N 0.000 description 1
- BRKHVZNDAOMAHX-BIIVOSGPSA-N Ser-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N BRKHVZNDAOMAHX-BIIVOSGPSA-N 0.000 description 1
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 1
- DKKGAAJTDKHWOD-BIIVOSGPSA-N Ser-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)C(=O)O DKKGAAJTDKHWOD-BIIVOSGPSA-N 0.000 description 1
- YPUSXTWURJANKF-KBIXCLLPSA-N Ser-Gln-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YPUSXTWURJANKF-KBIXCLLPSA-N 0.000 description 1
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 1
- BPMRXBZYPGYPJN-WHFBIAKZSA-N Ser-Gly-Asn Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BPMRXBZYPGYPJN-WHFBIAKZSA-N 0.000 description 1
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 1
- ZFVFHHZBCVNLGD-GUBZILKMSA-N Ser-His-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZFVFHHZBCVNLGD-GUBZILKMSA-N 0.000 description 1
- UGHCUDLCCVVIJR-VGDYDELISA-N Ser-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CO)N UGHCUDLCCVVIJR-VGDYDELISA-N 0.000 description 1
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 1
- DOSZISJPMCYEHT-NAKRPEOUSA-N Ser-Ile-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O DOSZISJPMCYEHT-NAKRPEOUSA-N 0.000 description 1
- UBRMZSHOOIVJPW-SRVKXCTJSA-N Ser-Leu-Lys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O UBRMZSHOOIVJPW-SRVKXCTJSA-N 0.000 description 1
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 1
- GDUZTEQRAOXYJS-SRVKXCTJSA-N Ser-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GDUZTEQRAOXYJS-SRVKXCTJSA-N 0.000 description 1
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 1
- OVQZAFXWIWNYKA-GUBZILKMSA-N Ser-Pro-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CO)N OVQZAFXWIWNYKA-GUBZILKMSA-N 0.000 description 1
- KQNDIKOYWZTZIX-FXQIFTODSA-N Ser-Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQNDIKOYWZTZIX-FXQIFTODSA-N 0.000 description 1
- WLJPJRGQRNCIQS-ZLUOBGJFSA-N Ser-Ser-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O WLJPJRGQRNCIQS-ZLUOBGJFSA-N 0.000 description 1
- JCLAFVNDBJMLBC-JBDRJPRFSA-N Ser-Ser-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JCLAFVNDBJMLBC-JBDRJPRFSA-N 0.000 description 1
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 1
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 1
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 1
- FLMYSKVSDVHLEW-SVSWQMSJSA-N Ser-Thr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLMYSKVSDVHLEW-SVSWQMSJSA-N 0.000 description 1
- SDFUZKIAHWRUCS-QEJZJMRPSA-N Ser-Trp-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CO)N SDFUZKIAHWRUCS-QEJZJMRPSA-N 0.000 description 1
- FGBLCMLXHRPVOF-IHRRRGAJSA-N Ser-Tyr-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FGBLCMLXHRPVOF-IHRRRGAJSA-N 0.000 description 1
- JZRYFUGREMECBH-XPUUQOCRSA-N Ser-Val-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O JZRYFUGREMECBH-XPUUQOCRSA-N 0.000 description 1
- YEDSOSIKVUMIJE-DCAQKATOSA-N Ser-Val-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O YEDSOSIKVUMIJE-DCAQKATOSA-N 0.000 description 1
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 1
- HNDMFDBQXYZSRM-IHRRRGAJSA-N Ser-Val-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HNDMFDBQXYZSRM-IHRRRGAJSA-N 0.000 description 1
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 235000008515 Setaria glauca Nutrition 0.000 description 1
- 241000208292 Solanaceae Species 0.000 description 1
- 235000002634 Solanum Nutrition 0.000 description 1
- 241000207763 Solanum Species 0.000 description 1
- 244000214911 Solanum americanum Species 0.000 description 1
- 235000019048 Solanum nodiflorum Nutrition 0.000 description 1
- 206010064127 Solar lentigo Diseases 0.000 description 1
- 102100026974 Sorbitol dehydrogenase Human genes 0.000 description 1
- 235000015503 Sorghum bicolor subsp. drummondii Nutrition 0.000 description 1
- 241000219315 Spinacia Species 0.000 description 1
- 241000923571 Sporobolus michauxianus Species 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- 244000170625 Sudangrass Species 0.000 description 1
- 229940100389 Sulfonylurea Drugs 0.000 description 1
- 241000404542 Tanacetum Species 0.000 description 1
- 241001116495 Taxaceae Species 0.000 description 1
- 241001116500 Taxus Species 0.000 description 1
- 235000006468 Thea sinensis Nutrition 0.000 description 1
- 241001122767 Theaceae Species 0.000 description 1
- 244000152045 Themeda triandra Species 0.000 description 1
- 241000219161 Theobroma Species 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 1
- 108010006368 Thioredoxin h Proteins 0.000 description 1
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 1
- OJRNZRROAIAHDL-LKXGYXEUSA-N Thr-Asn-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OJRNZRROAIAHDL-LKXGYXEUSA-N 0.000 description 1
- LMMDEZPNUTZJAY-GCJQMDKQSA-N Thr-Asp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O LMMDEZPNUTZJAY-GCJQMDKQSA-N 0.000 description 1
- VGYBYGQXZJDZJU-XQXXSGGOSA-N Thr-Glu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VGYBYGQXZJDZJU-XQXXSGGOSA-N 0.000 description 1
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 1
- XFTYVCHLARBHBQ-FOHZUACHSA-N Thr-Gly-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XFTYVCHLARBHBQ-FOHZUACHSA-N 0.000 description 1
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 1
- XOWKUMFHEZLKLT-CIQUZCHMSA-N Thr-Ile-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O XOWKUMFHEZLKLT-CIQUZCHMSA-N 0.000 description 1
- CRZNCABIJLRFKZ-IUKAMOBKSA-N Thr-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N CRZNCABIJLRFKZ-IUKAMOBKSA-N 0.000 description 1
- VTVVYQOXJCZVEB-WDCWCFNPSA-N Thr-Leu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VTVVYQOXJCZVEB-WDCWCFNPSA-N 0.000 description 1
- MXNAOGFNFNKUPD-JHYOHUSXSA-N Thr-Phe-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MXNAOGFNFNKUPD-JHYOHUSXSA-N 0.000 description 1
- IVDFVBVIVLJJHR-LKXGYXEUSA-N Thr-Ser-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IVDFVBVIVLJJHR-LKXGYXEUSA-N 0.000 description 1
- SGAOHNPSEPVAFP-ZDLURKLDSA-N Thr-Ser-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SGAOHNPSEPVAFP-ZDLURKLDSA-N 0.000 description 1
- UQCNIMDPYICBTR-KYNKHSRBSA-N Thr-Thr-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UQCNIMDPYICBTR-KYNKHSRBSA-N 0.000 description 1
- IJKNKFJZOJCKRR-GBALPHGKSA-N Thr-Trp-Ser Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 IJKNKFJZOJCKRR-GBALPHGKSA-N 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 108010022394 Threonine synthase Proteins 0.000 description 1
- 102000006843 Threonine synthase Human genes 0.000 description 1
- 241000723873 Tobacco mosaic virus Species 0.000 description 1
- 241000723677 Tobacco ringspot virus Species 0.000 description 1
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 1
- 241000219870 Trifolium subterraneum Species 0.000 description 1
- 235000019714 Triticale Nutrition 0.000 description 1
- 241000209140 Triticum Species 0.000 description 1
- PNKDNKGMEHJTJQ-BPUTZDHNSA-N Trp-Arg-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N PNKDNKGMEHJTJQ-BPUTZDHNSA-N 0.000 description 1
- TZNNEYFZZAHLBL-BPUTZDHNSA-N Trp-Arg-Asp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O TZNNEYFZZAHLBL-BPUTZDHNSA-N 0.000 description 1
- PHNBFZBKLWEBJN-BPUTZDHNSA-N Trp-Glu-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PHNBFZBKLWEBJN-BPUTZDHNSA-N 0.000 description 1
- UJRIVCPPPMYCNA-HOCLYGCPSA-N Trp-Leu-Gly Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N UJRIVCPPPMYCNA-HOCLYGCPSA-N 0.000 description 1
- KBKTUNYBNJWFRL-UBHSHLNASA-N Trp-Ser-Asn Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O)=CNC2=C1 KBKTUNYBNJWFRL-UBHSHLNASA-N 0.000 description 1
- VDCGPCSLAJAKBB-XIRDDKMYSA-N Trp-Ser-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N VDCGPCSLAJAKBB-XIRDDKMYSA-N 0.000 description 1
- 235000018747 Typha elephantina Nutrition 0.000 description 1
- 244000177175 Typha elephantina Species 0.000 description 1
- MICSYKFECRFCTJ-IHRRRGAJSA-N Tyr-Arg-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O MICSYKFECRFCTJ-IHRRRGAJSA-N 0.000 description 1
- SGFIXFAHVWJKTD-KJEVXHAQSA-N Tyr-Arg-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SGFIXFAHVWJKTD-KJEVXHAQSA-N 0.000 description 1
- DYEGCOJHFNJBKB-UFYCRDLUSA-N Tyr-Arg-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 DYEGCOJHFNJBKB-UFYCRDLUSA-N 0.000 description 1
- AYPAIRCDLARHLM-KKUMJFAQSA-N Tyr-Asn-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O AYPAIRCDLARHLM-KKUMJFAQSA-N 0.000 description 1
- NRFTYDWKWGJLAR-MELADBBJSA-N Tyr-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O NRFTYDWKWGJLAR-MELADBBJSA-N 0.000 description 1
- RYSNTWVRSLCAJZ-RYUDHWBXSA-N Tyr-Gln-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 RYSNTWVRSLCAJZ-RYUDHWBXSA-N 0.000 description 1
- JWGXUKHIKXZWNG-RYUDHWBXSA-N Tyr-Gly-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O JWGXUKHIKXZWNG-RYUDHWBXSA-N 0.000 description 1
- YYZPVPJCOGGQPC-JYJNAYRXSA-N Tyr-His-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYZPVPJCOGGQPC-JYJNAYRXSA-N 0.000 description 1
- GULIUBBXCYPDJU-CQDKDKBSSA-N Tyr-Leu-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 GULIUBBXCYPDJU-CQDKDKBSSA-N 0.000 description 1
- ARJASMXQBRNAGI-YESZJQIVSA-N Tyr-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N ARJASMXQBRNAGI-YESZJQIVSA-N 0.000 description 1
- AVFGBGGRZOKSFS-KJEVXHAQSA-N Tyr-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O AVFGBGGRZOKSFS-KJEVXHAQSA-N 0.000 description 1
- SOAUMCDLIUGXJJ-SRVKXCTJSA-N Tyr-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O SOAUMCDLIUGXJJ-SRVKXCTJSA-N 0.000 description 1
- ZPFLBLFITJCBTP-QWRGUYRKSA-N Tyr-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O ZPFLBLFITJCBTP-QWRGUYRKSA-N 0.000 description 1
- GPLTZEMVOCZVAV-UFYCRDLUSA-N Tyr-Tyr-Arg Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CC=C(O)C=C1 GPLTZEMVOCZVAV-UFYCRDLUSA-N 0.000 description 1
- AFWXOGHZEKARFH-ACRUOGEOSA-N Tyr-Tyr-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=C(O)C=C1 AFWXOGHZEKARFH-ACRUOGEOSA-N 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 241000145124 Uniola Species 0.000 description 1
- 235000013419 Uniola paniculata Nutrition 0.000 description 1
- 240000007492 Uniola paniculata Species 0.000 description 1
- 229910052770 Uranium Inorganic materials 0.000 description 1
- IZFVRRYRMQFVGX-NRPADANISA-N Val-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N IZFVRRYRMQFVGX-NRPADANISA-N 0.000 description 1
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 1
- VDPRBUOZLIFUIM-GUBZILKMSA-N Val-Arg-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](C(C)C)N VDPRBUOZLIFUIM-GUBZILKMSA-N 0.000 description 1
- KKHRWGYHBZORMQ-NHCYSSNCSA-N Val-Arg-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKHRWGYHBZORMQ-NHCYSSNCSA-N 0.000 description 1
- AUMNPAUHKUNHHN-BYULHYEWSA-N Val-Asn-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N AUMNPAUHKUNHHN-BYULHYEWSA-N 0.000 description 1
- NWDOPHYLSORNEX-QXEWZRGKSA-N Val-Asn-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N NWDOPHYLSORNEX-QXEWZRGKSA-N 0.000 description 1
- DBOXBUDEAJVKRE-LSJOCFKGSA-N Val-Asn-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DBOXBUDEAJVKRE-LSJOCFKGSA-N 0.000 description 1
- FRUYSSRPJXNRRB-GUBZILKMSA-N Val-Cys-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N FRUYSSRPJXNRRB-GUBZILKMSA-N 0.000 description 1
- OQWNEUXPKHIEJO-NRPADANISA-N Val-Glu-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N OQWNEUXPKHIEJO-NRPADANISA-N 0.000 description 1
- XWYUBUYQMOUFRQ-IFFSRLJSSA-N Val-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N)O XWYUBUYQMOUFRQ-IFFSRLJSSA-N 0.000 description 1
- URIRWLJVWHYLET-ONGXEEELSA-N Val-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C URIRWLJVWHYLET-ONGXEEELSA-N 0.000 description 1
- BVWPHWLFGRCECJ-JSGCOSHPSA-N Val-Gly-Tyr Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N BVWPHWLFGRCECJ-JSGCOSHPSA-N 0.000 description 1
- KDKLLPMFFGYQJD-CYDGBPFRSA-N Val-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N KDKLLPMFFGYQJD-CYDGBPFRSA-N 0.000 description 1
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 1
- IJGPOONOTBNTFS-GVXVVHGQSA-N Val-Lys-Glu Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O IJGPOONOTBNTFS-GVXVVHGQSA-N 0.000 description 1
- JAKHAONCJJZVHT-DCAQKATOSA-N Val-Lys-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N JAKHAONCJJZVHT-DCAQKATOSA-N 0.000 description 1
- KISFXYYRKKNLOP-IHRRRGAJSA-N Val-Phe-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N KISFXYYRKKNLOP-IHRRRGAJSA-N 0.000 description 1
- YKNOJPJWNVHORX-UNQGMJICSA-N Val-Phe-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YKNOJPJWNVHORX-UNQGMJICSA-N 0.000 description 1
- GQMNEJMFMCJJTD-NHCYSSNCSA-N Val-Pro-Gln Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O GQMNEJMFMCJJTD-NHCYSSNCSA-N 0.000 description 1
- MIKHIIQMRFYVOR-RCWTZXSCSA-N Val-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C(C)C)N)O MIKHIIQMRFYVOR-RCWTZXSCSA-N 0.000 description 1
- UVHFONIHVHLDDQ-IFFSRLJSSA-N Val-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O UVHFONIHVHLDDQ-IFFSRLJSSA-N 0.000 description 1
- WUFHZIRMAZZWRS-OSUNSFLBSA-N Val-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C(C)C)N WUFHZIRMAZZWRS-OSUNSFLBSA-N 0.000 description 1
- JAIZPWVHPQRYOU-ZJDVBMNYSA-N Val-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O JAIZPWVHPQRYOU-ZJDVBMNYSA-N 0.000 description 1
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 1
- ZHWZDZFWBXWPDW-GUBZILKMSA-N Val-Val-Cys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(O)=O ZHWZDZFWBXWPDW-GUBZILKMSA-N 0.000 description 1
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 241000489523 Veratrum Species 0.000 description 1
- 241000863480 Vinca Species 0.000 description 1
- 241000219094 Vitaceae Species 0.000 description 1
- 241000219095 Vitis Species 0.000 description 1
- 235000009392 Vitis Nutrition 0.000 description 1
- 235000009754 Vitis X bourquina Nutrition 0.000 description 1
- 235000012333 Vitis X labruscana Nutrition 0.000 description 1
- 206010052428 Wound Diseases 0.000 description 1
- 208000027418 Wounds and injury Diseases 0.000 description 1
- 241000607479 Yersinia pestis Species 0.000 description 1
- 241000209149 Zea Species 0.000 description 1
- 235000007244 Zea mays Nutrition 0.000 description 1
- 101001040871 Zea mays Glutelin-2 Proteins 0.000 description 1
- 101000662549 Zea mays Sucrose synthase 1 Proteins 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 108010055615 Zein Proteins 0.000 description 1
- FJJCIZWZNKZHII-UHFFFAOYSA-N [4,6-bis(cyanoamino)-1,3,5-triazin-2-yl]cyanamide Chemical compound N#CNC1=NC(NC#N)=NC(NC#N)=N1 FJJCIZWZNKZHII-UHFFFAOYSA-N 0.000 description 1
- 230000036579 abiotic stress Effects 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000004480 active ingredient Substances 0.000 description 1
- 210000005006 adaptive immune system Anatomy 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- UDMBCSSLTHHNCD-KQYNXXCUSA-N adenosine 5'-monophosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O UDMBCSSLTHHNCD-KQYNXXCUSA-N 0.000 description 1
- 230000009418 agronomic effect Effects 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- 108010070944 alanylhistidine Proteins 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- PPQRONHOSHZGFQ-LMVFSUKVSA-N aldehydo-D-ribose 5-phosphate Chemical group OP(=O)(O)OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PPQRONHOSHZGFQ-LMVFSUKVSA-N 0.000 description 1
- 230000037354 amino acid metabolism Effects 0.000 description 1
- 238000002668 animal-assisted therapy Methods 0.000 description 1
- 239000000729 antidote Substances 0.000 description 1
- 229940075522 antidotes Drugs 0.000 description 1
- 239000000074 antisense oligonucleotide Substances 0.000 description 1
- 238000012230 antisense oligonucleotides Methods 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 101150037081 aroA gene Proteins 0.000 description 1
- 244000030166 artemisia Species 0.000 description 1
- 235000009052 artemisia Nutrition 0.000 description 1
- 230000011681 asexual reproduction Effects 0.000 description 1
- 238000013465 asexual reproduction Methods 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 108010047857 aspartylglycine Proteins 0.000 description 1
- MXWJVTOOROXGIU-UHFFFAOYSA-N atrazine Chemical compound CCNC1=NC(Cl)=NC(NC(C)C)=N1 MXWJVTOOROXGIU-UHFFFAOYSA-N 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 239000011425 bamboo Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- POIARNZEYGURDG-FNORWQNLSA-N beta-damascenone Chemical compound C\C=C\C(=O)C1=C(C)C=CCC1(C)C POIARNZEYGURDG-FNORWQNLSA-N 0.000 description 1
- POIARNZEYGURDG-UHFFFAOYSA-N beta-damascenone Natural products CC=CC(=O)C1=C(C)C=CCC1(C)C POIARNZEYGURDG-UHFFFAOYSA-N 0.000 description 1
- 238000002306 biochemical method Methods 0.000 description 1
- 239000003139 biocide Substances 0.000 description 1
- 229960001561 bleomycin Drugs 0.000 description 1
- OYVAGSVQBOHSSS-UAPAGMARSA-O bleomycin A2 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC=C(N=1)C=1SC=C(N=1)C(=O)NCCC[S+](C)C)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C OYVAGSVQBOHSSS-UAPAGMARSA-O 0.000 description 1
- 229940098773 bovine serum albumin Drugs 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 101150081794 bxn gene Proteins 0.000 description 1
- 229910052793 cadmium Inorganic materials 0.000 description 1
- BDOSMKKIYDKNTQ-UHFFFAOYSA-N cadmium atom Chemical compound [Cd] BDOSMKKIYDKNTQ-UHFFFAOYSA-N 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000000711 cancerogenic effect Effects 0.000 description 1
- 239000001390 capsicum minimum Substances 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 231100000315 carcinogenic Toxicity 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 108020001778 catalytic domains Proteins 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 230000004700 cellular uptake Effects 0.000 description 1
- 108010040093 cellulose synthase Proteins 0.000 description 1
- 235000013339 cereals Nutrition 0.000 description 1
- 238000009614 chemical analysis method Methods 0.000 description 1
- 238000012412 chemical coupling Methods 0.000 description 1
- 239000002962 chemical mutagen Substances 0.000 description 1
- 235000015218 chewing gum Nutrition 0.000 description 1
- 229940112822 chewing gum Drugs 0.000 description 1
- JCKYGMPEJWAADB-UHFFFAOYSA-N chlorambucil Chemical compound OC(=O)CCCC1=CC=C(N(CCCl)CCCl)C=C1 JCKYGMPEJWAADB-UHFFFAOYSA-N 0.000 description 1
- 229960004630 chlorambucil Drugs 0.000 description 1
- VJYIFXVZLXQVHO-UHFFFAOYSA-N chlorsulfuron Chemical compound COC1=NC(C)=NC(NC(=O)NS(=O)(=O)C=2C(=CC=CC=2)Cl)=N1 VJYIFXVZLXQVHO-UHFFFAOYSA-N 0.000 description 1
- 210000003483 chromatin Anatomy 0.000 description 1
- 230000008711 chromosomal rearrangement Effects 0.000 description 1
- 229920003211 cis-1,4-polyisoprene Polymers 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000002485 combustion reaction Methods 0.000 description 1
- 235000018597 common camellia Nutrition 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000008358 core component Substances 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 239000002537 cosmetic Substances 0.000 description 1
- 229960004397 cyclophosphamide Drugs 0.000 description 1
- 108010004073 cysteinylcysteine Proteins 0.000 description 1
- 108010060199 cysteinylproline Proteins 0.000 description 1
- 108010069495 cysteinyltyrosine Proteins 0.000 description 1
- IERHLVCPSMICTF-XVFCMESISA-N cytidine 5'-monophosphate Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(O)=O)O1 IERHLVCPSMICTF-XVFCMESISA-N 0.000 description 1
- 230000002559 cytogenic effect Effects 0.000 description 1
- UQHKFADEQIVWID-UHFFFAOYSA-N cytokinin Natural products C1=NC=2C(NCC=C(CO)C)=NC=NC=2N1C1CC(O)C(CO)O1 UQHKFADEQIVWID-UHFFFAOYSA-N 0.000 description 1
- 239000004062 cytokinin Substances 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- GYOZYWVXFNDGLU-XLPZGREQSA-N dTMP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)C1 GYOZYWVXFNDGLU-XLPZGREQSA-N 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 229960002086 dextran Drugs 0.000 description 1
- 229960000633 dextran sulfate Drugs 0.000 description 1
- DENRZWYUOJLTMF-UHFFFAOYSA-N diethyl sulfate Chemical compound CCOS(=O)(=O)OCC DENRZWYUOJLTMF-UHFFFAOYSA-N 0.000 description 1
- 229940008406 diethyl sulfate Drugs 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 235000004879 dioscorea Nutrition 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000002222 downregulating effect Effects 0.000 description 1
- 230000024346 drought recovery Effects 0.000 description 1
- 241001493065 dsRNA viruses Species 0.000 description 1
- 108010050663 endodeoxyribonuclease CreI Proteins 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000007515 enzymatic degradation Effects 0.000 description 1
- 238000001952 enzyme assay Methods 0.000 description 1
- 241001233957 eudicotyledons Species 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 230000035558 fertility Effects 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 239000010408 film Substances 0.000 description 1
- 235000004426 flaxseed Nutrition 0.000 description 1
- 230000008124 floral development Effects 0.000 description 1
- 238000011010 flushing procedure Methods 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 239000006260 foam Substances 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 230000006251 gamma-carboxylation Effects 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 238000012226 gene silencing method Methods 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- IAJOBQBIJHVGMQ-BYPYZUCNSA-N glufosinate-P Chemical compound CP(O)(=O)CC[C@H](N)C(O)=O IAJOBQBIJHVGMQ-BYPYZUCNSA-N 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- 125000000291 glutamic acid group Chemical group N[C@@H](CCC(O)=O)C(=O)* 0.000 description 1
- 102000045442 glycosyltransferase activity proteins Human genes 0.000 description 1
- 108700014210 glycosyltransferase activity proteins Proteins 0.000 description 1
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 1
- 108010090037 glycyl-alanyl-isoleucine Proteins 0.000 description 1
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 1
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 1
- 108010010147 glycylglutamine Proteins 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- 108010037850 glycylvaline Proteins 0.000 description 1
- 239000008187 granular material Substances 0.000 description 1
- 235000002532 grape seed extract Nutrition 0.000 description 1
- RQFCJASXJCIDSX-UUOKFMHZSA-N guanosine 5'-monophosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O RQFCJASXJCIDSX-UUOKFMHZSA-N 0.000 description 1
- 239000000185 hemagglutinin Substances 0.000 description 1
- GNOIPBMMFNIUFM-UHFFFAOYSA-N hexamethylphosphoric triamide Chemical compound CN(C)P(=O)(N(C)C)N(C)C GNOIPBMMFNIUFM-UHFFFAOYSA-N 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 238000013537 high throughput screening Methods 0.000 description 1
- 108010025306 histidylleucine Proteins 0.000 description 1
- 230000003054 hormonal effect Effects 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 230000033444 hydroxylation Effects 0.000 description 1
- 238000005805 hydroxylation reaction Methods 0.000 description 1
- 238000003018 immunoassay Methods 0.000 description 1
- 238000001114 immunoprecipitation Methods 0.000 description 1
- 238000012744 immunostaining Methods 0.000 description 1
- 208000000509 infertility Diseases 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000009403 interspecific hybridization Methods 0.000 description 1
- 238000001990 intravenous administration Methods 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000006317 isomerization reaction Methods 0.000 description 1
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 1
- ZNJFBWYDHIGLCU-HWKXXFMVSA-N jasmonic acid Chemical compound CC\C=C/C[C@@H]1[C@@H](CC(O)=O)CCC1=O ZNJFBWYDHIGLCU-HWKXXFMVSA-N 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 230000028514 leaf abscission Effects 0.000 description 1
- 235000021374 legumes Nutrition 0.000 description 1
- 231100000225 lethality Toxicity 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 239000007937 lozenge Substances 0.000 description 1
- 108060004506 lycopene beta-cyclase Proteins 0.000 description 1
- 108010064235 lysylglycine Proteins 0.000 description 1
- 210000002540 macrophage Anatomy 0.000 description 1
- 210000001161 mammalian embryo Anatomy 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 235000005739 manihot Nutrition 0.000 description 1
- 239000000594 mannitol Substances 0.000 description 1
- 235000010355 mannitol Nutrition 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- HAWPXGHAZFHHAD-UHFFFAOYSA-N mechlorethamine Chemical class ClCCN(C)CCCl HAWPXGHAZFHHAD-UHFFFAOYSA-N 0.000 description 1
- 229960004961 mechlorethamine Drugs 0.000 description 1
- SGDBTWWWUNNDEQ-LBPRGKRZSA-N melphalan Chemical compound OC(=O)[C@@H](N)CC1=CC=C(N(CCCl)CCCl)C=C1 SGDBTWWWUNNDEQ-LBPRGKRZSA-N 0.000 description 1
- 229960001924 melphalan Drugs 0.000 description 1
- 230000000442 meristematic effect Effects 0.000 description 1
- 230000004066 metabolic change Effects 0.000 description 1
- 230000007102 metabolic function Effects 0.000 description 1
- 230000037353 metabolic pathway Effects 0.000 description 1
- 229910021645 metal ion Inorganic materials 0.000 description 1
- MBABOKRGFJTBAE-UHFFFAOYSA-N methyl methanesulfonate Chemical compound COS(C)(=O)=O MBABOKRGFJTBAE-UHFFFAOYSA-N 0.000 description 1
- YKNYRRVISWJDSR-UHFFFAOYSA-N methyl oxirane-2-carboxylate Chemical compound COC(=O)C1CO1 YKNYRRVISWJDSR-UHFFFAOYSA-N 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 230000023409 microsporogenesis Effects 0.000 description 1
- 235000019713 millet Nutrition 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 239000003147 molecular marker Substances 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000036457 multidrug resistance Effects 0.000 description 1
- APVPOHHVBBYQAV-UHFFFAOYSA-N n-(4-aminophenyl)sulfonyloctadecanamide Chemical compound CCCCCCCCCCCCCCCCCC(=O)NS(=O)(=O)C1=CC=C(N)C=C1 APVPOHHVBBYQAV-UHFFFAOYSA-N 0.000 description 1
- 230000017074 necrotic cell death Effects 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 125000000449 nitro group Chemical group [O-][N+](*)=O 0.000 description 1
- XKLJHFLUAHKGGU-UHFFFAOYSA-N nitrous amide Chemical compound ON=N XKLJHFLUAHKGGU-UHFFFAOYSA-N 0.000 description 1
- 101150015886 nuc-1 gene Proteins 0.000 description 1
- 238000001821 nucleic acid purification Methods 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 239000001702 nutmeg Substances 0.000 description 1
- 239000003921 oil Substances 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 238000010397 one-hybrid screening Methods 0.000 description 1
- 150000002894 organic compounds Chemical class 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- FJKROLUGYXJWQN-UHFFFAOYSA-N papa-hydroxy-benzoic acid Natural products OC(=O)C1=CC=C(O)C=C1 FJKROLUGYXJWQN-UHFFFAOYSA-N 0.000 description 1
- 230000008506 pathogenesis Effects 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 230000035515 penetration Effects 0.000 description 1
- 238000002823 phage display Methods 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 108010073101 phenylalanylleucine Proteins 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 125000005642 phosphothioate group Chemical group 0.000 description 1
- 230000000243 photosynthetic effect Effects 0.000 description 1
- 238000000053 physical method Methods 0.000 description 1
- 230000009894 physiological stress Effects 0.000 description 1
- 229930195732 phytohormone Natural products 0.000 description 1
- 239000001739 pinus spp. Substances 0.000 description 1
- 238000013439 planning Methods 0.000 description 1
- 210000000745 plant chromosome Anatomy 0.000 description 1
- 230000008121 plant development Effects 0.000 description 1
- 210000002706 plastid Anatomy 0.000 description 1
- 101150092906 pmt1 gene Proteins 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 229920002704 polyhistidine Polymers 0.000 description 1
- 239000001267 polyvinylpyrrolidone Substances 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 231100000683 possible toxicity Toxicity 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- CPTBDICYNRMXFX-UHFFFAOYSA-N procarbazine Chemical compound CNNCC1=CC=C(C(=O)NC(C)C)C=C1 CPTBDICYNRMXFX-UHFFFAOYSA-N 0.000 description 1
- 229960000624 procarbazine Drugs 0.000 description 1
- 108010031719 prolyl-serine Proteins 0.000 description 1
- 108010070643 prolylglutamic acid Proteins 0.000 description 1
- 108010029020 prolylglycine Proteins 0.000 description 1
- 108010090894 prolylleucine Proteins 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 150000003212 purines Chemical class 0.000 description 1
- 150000003230 pyrimidines Chemical class 0.000 description 1
- JETDZFFCRPFPDH-UHFFFAOYSA-N quinacrine mustard dihydrochloride Chemical compound [H+].[H+].[Cl-].[Cl-].C1=C(Cl)C=CC2=C(NC(C)CCCN(CCCl)CCCl)C3=CC(OC)=CC=C3N=C21 JETDZFFCRPFPDH-UHFFFAOYSA-N 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 230000005849 recognition of pollen Effects 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 238000003757 reverse transcription PCR Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 229960004889 salicylic acid Drugs 0.000 description 1
- 235000012420 sanguinaria Nutrition 0.000 description 1
- 230000008117 seed development Effects 0.000 description 1
- 230000007226 seed germination Effects 0.000 description 1
- 238000005204 segregation Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- FQENQNTWSFEDLI-UHFFFAOYSA-J sodium diphosphate Chemical compound [Na+].[Na+].[Na+].[Na+].[O-]P([O-])(=O)OP([O-])([O-])=O FQENQNTWSFEDLI-UHFFFAOYSA-J 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- 229910000162 sodium phosphate Inorganic materials 0.000 description 1
- 239000012064 sodium phosphate buffer Substances 0.000 description 1
- 229940048086 sodium pyrophosphate Drugs 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 230000000392 somatic effect Effects 0.000 description 1
- 230000037439 somatic mutation Effects 0.000 description 1
- 239000000600 sorbitol Substances 0.000 description 1
- 108010048090 soybean lectin Proteins 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 230000035882 stress Effects 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 230000019635 sulfation Effects 0.000 description 1
- 238000005670 sulfation reaction Methods 0.000 description 1
- YROXIXLRRCOBKF-UHFFFAOYSA-N sulfonylurea Chemical class OC(=N)N=S(=O)=O YROXIXLRRCOBKF-UHFFFAOYSA-N 0.000 description 1
- 150000003463 sulfur Chemical class 0.000 description 1
- 238000000672 surface-enhanced laser desorption--ionisation Methods 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 238000004114 suspension culture Methods 0.000 description 1
- 231100000378 teratogenic Toxicity 0.000 description 1
- 230000003390 teratogenic effect Effects 0.000 description 1
- 235000019818 tetrasodium diphosphate Nutrition 0.000 description 1
- 239000001577 tetrasodium phosphonato phosphate Substances 0.000 description 1
- 238000009210 therapy by ultrasound Methods 0.000 description 1
- 239000003053 toxin Substances 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 1
- 108010080629 tryptophan-leucine Proteins 0.000 description 1
- 108010038745 tryptophylglycine Proteins 0.000 description 1
- 108010044292 tryptophyltyrosine Proteins 0.000 description 1
- 238000010396 two-hybrid screening Methods 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 108010051110 tyrosyl-lysine Proteins 0.000 description 1
- 108010003137 tyrosyltyrosine Proteins 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- DJJCXFVJDGTHFX-XVFCMESISA-N uridine 5'-monophosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 DJJCXFVJDGTHFX-XVFCMESISA-N 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 229940057613 veratrum Drugs 0.000 description 1
- OGWKCGZFUXNPDA-XQKSVPLYSA-N vincristine Chemical compound C([N@]1C[C@@H](C[C@]2(C(=O)OC)C=3C(=CC4=C([C@]56[C@H]([C@@]([C@H](OC(C)=O)[C@]7(CC)C=CCN([C@H]67)CC5)(O)C(=O)OC)N4C=O)C=3)OC)C[C@@](C1)(O)CC)CC1=C2NC2=CC=CC=C12 OGWKCGZFUXNPDA-XQKSVPLYSA-N 0.000 description 1
- 229960004528 vincristine Drugs 0.000 description 1
- OGWKCGZFUXNPDA-UHFFFAOYSA-N vincristine Natural products C1C(CC)(O)CC(CC2(C(=O)OC)C=3C(=CC4=C(C56C(C(C(OC(C)=O)C7(CC)C=CCN(C67)CC5)(O)C(=O)OC)N4C=O)C=3)OC)CN1CCC1=C2NC2=CC=CC=C12 OGWKCGZFUXNPDA-UHFFFAOYSA-N 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 229940075420 xanthine Drugs 0.000 description 1
- 238000004383 yellowing Methods 0.000 description 1
- 229930007850 β-damascenone Natural products 0.000 description 1
Abstract
Description
ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕFIELD OF TECHNOLOGY TO WHICH THE INVENTION RELATES
В настоящем изобретении раскрыты полинуклеотидные последовательности генов, кодирующие аспартатаминотрансферазу (AAT) из Nicotiana tabacum и их варианты, гомологи и фрагменты. Также раскрыты кодируемые ими полипептидные последовательности и их варианты, гомологи и фрагменты. Также раскрыта модуляция экспрессии одного или более генов NtAAT или функции или активности кодируемого(кодируемых) ими полипептида(полипептидов) NtAAT, для модулирования уровней одной или более свободных аминокислот, таких как аспартат, и метаболитов или побочных продуктов, полученных из них, таких как аммиак, в растении или его части.The present invention discloses polynucleotide sequences of genes encoding aspartate aminotransferase (AAT) from Nicotiana tabacum and their variants, homologues and fragments. Also disclosed are the polypeptide sequences encoded by them and their variants, homologues and fragments. Also disclosed is the modulation of the expression of one or more NtAAT genes, or the function or activity of the NtAAT polypeptide(s) they encode, to modulate the levels of one or more free amino acids, such as aspartate, and metabolites or by-products derived therefrom, such as ammonia, in a plant or part thereof.
УРОВЕНЬ ТЕХНИКИBACKGROUND OF THE INVENTION
Акриламид представляет собой химическое соединение формулы C3H5NO (название согласно ИЮПАК - проп-2-енамид), и были высказаны опасения относительно его потенциальной токсичности. Источником акриламида в аэрозоле курительных изделий, содержащих табак, могут являться, по меньшей мере частично, аминокислоты, которые присутствуют в табачном материале, используемом для производства курительных изделий. В культивируемых типах табака наблюдается повышение общего количества свободных аминокислот во время сушки, в частности в типах табака воздушной сушки и типах табака солнечной сушки. Изменение содержания аминокислот в табачном материале, подвергнутом сушке, зависит от времени сушки при температуре окружающей среды (воздушная сушка), которая в отличие от дымовой сушки (которая является быстрым процессом высушивания) позволяет ферментативным реакциям оставаться активными в течение 10-15 дней после сбора. Дополнительно табачный материал воздушной сушки характеризуется более высоким содержанием воды, чем табак, подвергнутый другим видам сушки, что замедляет процесс высушивания при температуре окружающей среды, поэтому считается вторым фактором, позволяющим некоторым ферментативным реакциям оставаться активными на более поздней стадии фазы сушки. Необходимо снизить уровни аминокислот и метаболитов и побочных продуктов, получаемых из них в растениях, в частности, в растительном материале, подвергнутом сушке, и дыме и аэрозоле, полученном из них. Поскольку аммиак, вероятно, будет являться побочным продуктом аминокислот, вырабатываемым во время сушки, уровень аммиака в листьях, подвергнутых сушке, дыме и аэрозоле также может быть пониженным. Также необходимо снизить уровень образования нежелательных запахов в аэрозоле или дыме при нагревании или горении табака.Acrylamide is a chemical compound of the formula C 3 H 5 NO (IUPAC name prop-2-enamide) and concerns have been raised about its potential toxicity. The source of acrylamide in the aerosol of smoking articles containing tobacco may be, at least in part, amino acids that are present in the tobacco material used to manufacture smoking articles. In cultivated types of tobacco, an increase in total free amino acids during drying is observed, in particular in air-cured types of tobacco and sun-cured types of tobacco. The change in amino acid content of dried tobacco material depends on the drying time at ambient temperature (air drying), which unlike flue drying (which is a fast drying process) allows the enzymatic reactions to remain active for 10-15 days after harvest. Additionally, air-cured tobacco material has a higher water content than other types of dried tobacco, which slows down the drying process at ambient temperature, and is therefore considered a second factor allowing some enzymatic reactions to remain active later in the drying phase. It is necessary to reduce the levels of amino acids and metabolites and by-products derived from them in plants, in particular in dried plant material and the smoke and aerosol obtained from them. Because ammonia is likely to be an amino acid by-product produced during drying, ammonia levels in dried, smoked, and aerosolized leaves may also be reduced. It is also necessary to reduce the level of formation of undesirable odors in the aerosol or smoke when tobacco is heated or burned.
Настоящее изобретение направлено на удовлетворение этой потребности в данной области техники.The present invention addresses this need in the art.
КРАТКОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯBRIEF DESCRIPTION OF THE INVENTION
В данном документе описан ряд полинуклеотидных последовательностей, кодирующих AAT из Nicotiana tabacum, которые вовлечены в биосинтез аминокислот во время ранней сушки. Изменения в генах NtATT, которые не характеризуются сверхэкспрессией во время сушки, не будут способствовать модулированию уровней аминокислот и получаемых из них метаболитов. Однако данные гены, вероятно, будут участвовать в других метаболических путях, и изменения их экспрессии могут в результате привести к формированию фенотипа, который является неблагоприятным с агрономической точки зрения (например, медленный рост). Знание того, какие гены NtAAT сверхэкспрессируются во время сушки, преимущественно позволяет отобрать растения с изменениями только в соответствующих генах и уменьшает потенциальные негативные эффекты в отношении других метаболических процессов.This document describes a number of polynucleotide sequences encoding AAT from Nicotiana tabacum that are involved in amino acid biosynthesis during early drying. Changes in NtATT genes that are not overexpressed during drying will not modulate the levels of amino acids and their derived metabolites. However, these genes are likely to be involved in other metabolic pathways and changes in their expression may result in a phenotype that is agronomically unfavorable (eg slow growth). Knowing which NtAAT genes are overexpressed during drying advantageously allows selection of plants with changes in the relevant genes only and reduces potential negative effects on other metabolic processes.
AAT катализирует обратимый перенос α-аминогруппы между аспартатом и глутаматом, являясь, следовательно, ключевым ферментом в метаболизме аминокислот за счет образования потока азота из глутамата и аспартата. Синтез аспартата является важным для синтеза других аминокислот, таких как аспарагин, треонин, изолейцин, цистеин и метионин. Во время процесса сушки аспартат преобразуется в аспарагин посредством аспарагинсинтетазы. Аспарагин и глутамин являются ключевыми соединениями для ремобилизации N в стареющих листьях, аспарагин представляет собой основную аминокислоту, образующуюся в листьях Берлей, подвергнутых сушке. Известно, что при нагревании табачного листа аспарагин в результате приводит к образованию акриламида. Аспартат также играет ключевую роль в биосинтезе других аминокислот, таких как треонин, метионин и цистеин, наличие некоторых из которых при нагревании в результате приводит к появлению запаха серы. Путем модулирования экспрессии и/или активности раскрытой AAT теперь можно корректировать химический состав частей растения, таких как листья, и дыма или аэрозолей, получаемых из них. Интересно, что некоторые гены AAT табака могут все еще экспрессироваться по меньшей мере в течение 8 дней с начала процесса воздушной сушки, как описано в данном документе. Например, количество одной или более аминокислот, таких как аспартат, и метаболитов, таких как аммиак, получаемых из них во время и после сушки, можно модулировать и, следовательно, образование акриламида, образующегося в ходе нагревания табака, можно модулировать, предпочтительно уменьшать. В качестве дополнительного примера образование других аминокислот, которые могут в результате приводить к появлению запаха серы при нагревании табака, также можно модулировать, предпочтительно уменьшать. В данном документе описано несколько геномных полинуклеотидных последовательностей AAT из Nicotiana tabacum, включая NtAAT1-S (SEQ ID NO: 5), NtAAT1-T (SEQ ID NO: 7), NtAAT2-S (SEQ ID NO: 1), NtAAT2-T (SEQ ID NO: 3), NtAAT3-S (SEQ ID NO: 9), NtAAT3-T (SEQ ID NO: 11), NtAAT4-S (SEQ ID NO: 13) и NtAAT4-T (SEQ ID NO: 15). Также приведены соответствующие предсказанные полипептидные последовательности для NtAAT1-S (SEQ ID NO: 6), NtAAT1-T (SEQ ID NO: 8), NtAAT2-S (SEQ ID NO: 2), NtAAT2-T (SEQ ID NO: 4), NtAAT3-S (SEQ ID NO: 10), NtAAT3-T (SEQ ID NO: 12), NtAAT4-S (SEQ ID NO: 14) и NtAAT4-T (SEQ ID NO: 16). Показано, что NtAAT2-S и NtAAT2-T, и в меньшей степени NtAAT1-S, NtAAT1-T, играют особую роль в биосинтезе аспартата во время сушки. Напротив, уровни транскриптов NtAAT4-S и NtAAT4-T понижаются в основном в течение первых двух дней сушки листьев, хотя NtAAT4-T остается экспрессируемым после восьми дней воздушной сушки, поэтому участие белка NtAAT4-T при сушке не может быть исключено. Экспрессия NtAAT3-S остается низкой во время сушки листьев и не модулируется во время фазы пожелтения. NtAAT3-T иногда является слегка индуцированным во время сушки, однако уровень экспрессии остается сравнительно низким.AAT catalyzes the reversible transfer of the α-amino group between aspartate and glutamate, and is therefore a key enzyme in amino acid metabolism through the generation of nitrogen flux from glutamate and aspartate. The synthesis of aspartate is important for the synthesis of other amino acids such as asparagine, threonine, isoleucine, cysteine, and methionine. During the drying process, aspartate is converted to asparagine by asparagine synthetase. Asparagine and glutamine are key compounds for N remobilization in aging leaves, asparagine is the main amino acid produced in dried Burley leaves. Asparagine is known to result in the formation of acrylamide when tobacco leaf is heated. Aspartate also plays a key role in the biosynthesis of other amino acids such as threonine, methionine, and cysteine, some of which, when heated, result in a sulfur odor. By modulating the expression and/or activity of the disclosed AAT, it is now possible to adjust the chemistry of plant parts such as leaves and the smoke or aerosols produced therefrom. Interestingly, some tobacco AAT genes can still be expressed for at least 8 days from the start of the air drying process, as described herein. For example, the amount of one or more amino acids such as aspartate and metabolites such as ammonia produced therefrom during and after drying can be modulated and hence the formation of acrylamide formed during heating of tobacco can be modulated, preferably reduced. As a further example, the formation of other amino acids that can result in a sulfur odor when tobacco is heated can also be modulated, preferably reduced. This document describes several AAT genomic polynucleotide sequences from Nicotiana tabacum , including NtAAT1-S (SEQ ID NO: 5), NtAAT1-T (SEQ ID NO: 7), NtAAT2-S (SEQ ID NO: 1), NtAAT2-T (SEQ ID NO: 3), NtAAT3-S (SEQ ID NO: 9), NtAAT3-T ( SEQ ID NO: 11 ), NtAAT4-S (SEQ ID NO: 13) and NtAAT4-T (SEQ ID NO: 15). Also shown are the respective predicted polypeptide sequences for NtAAT1-S (SEQ ID NO: 6), NtAAT1-T (SEQ ID NO: 8), NtAAT2-S (SEQ ID NO: 2), NtAAT2-T (SEQ ID NO: 4), NtAAT3-S (SEQ ID NO: 10), NtAAT3-T (SEQ ID NO: 12), NtAAT4-S (SEQ ID NO: 14) and NtAAT4-T (SEQ ID NO: 16). It has been shown that NtAAT2-S and NtAAT2-T, and to a lesser extent NtAAT1-S, NtAAT1-T, play a special role in aspartate biosynthesis during drying. On the contrary, the levels of NtAAT4-S and NtAAT4- T transcripts decrease mainly during the first two days of leaf drying, although NtAAT4-T remains expressed after eight days of air drying, so the participation of the NtAAT4-T protein during drying cannot be excluded. NtAAT3-S expression remains low during leaf drying and is not modulated during the yellowing phase. NtAAT3-T is sometimes slightly induced during drying, but the level of expression remains relatively low.
НЕКОТОРЫЕ ПРЕИМУЩЕСТВАSOME BENEFITS
Преимущественно полинуклеотидные последовательности NtAAT могут характеризоваться высоким уровнем экспрессии во время сушки, в частности с начала сушки. Модулирование экспрессии одной или более полинуклеотидных последовательностей NtAAT может в результате приводить к модулированным уровням акриламида в аэрозоле, поскольку уровень аспартата может модулироваться на протяжении всего процесса сушки. В частности, понижение экспрессии одной или более полинуклеотидных последовательностей NtAAT может в результате приводить к понижению уровней акриламида в аэрозоле.Advantageously, NtAAT polynucleotide sequences can be characterized by a high level of expression during drying, in particular from the beginning of drying. Modulating the expression of one or more NtAAT polynucleotide sequences can result in modulated levels of acrylamide in the aerosol because the level of aspartate can be modulated throughout the drying process. In particular, a decrease in expression of one or more NtAAT polynucleotide sequences may result in a decrease in the levels of acrylamide in the aerosol.
Поскольку аспартат является ключевым в биосинтезе других аминокислот, таких как треонин, метионин и цистеин, наличие некоторых из которых в результате приводит к появлению запаха серы при нагревании, модулирование экспрессии полинуклеотидных последовательностей NtAAT может обеспечить модулирование этого нежелательного запаха. Дополнительно, зная, что аммиак, вероятно, является побочным продуктом аминокислот, образующимся во время сушки, понижение экспрессии полинуклеотидных последовательностей NtAAT и/или активности кодируемого ими белка может обеспечить понижение уровня аммиака в растительном материале, подвергнутом сушке, и дыме и аэрозоле, получаемых из него. Повышение содержания аминокислот происходит в табаке воздушной сушки и табаке солнечной сушки, так как эти способы сушки приводят к повышенному содержанию аминокислот в табачном материале, подвергнутом сушке, по сравнению с табачным материалом трубоогневой сушки. Таким образом, настоящее изобретение особенно применимо к табачному материалу воздушной сушки и трубоогневой сушки.Because aspartate is key in the biosynthesis of other amino acids such as threonine, methionine, and cysteine, some of which result in a sulfur odor upon heating, modulation of the expression of NtAAT polynucleotide sequences can modulate this undesirable odor. Additionally, knowing that ammonia is likely to be a by-product of amino acids formed during drying, a reduction in the expression of NtAAT polynucleotide sequences and/or the activity of the protein they encode may provide a reduction in the level of ammonia in the dried plant material and the smoke and aerosol obtained from it. An increase in amino acid content occurs in air-cured tobacco and sun-cured tobacco because these drying processes result in an increased amino acid content in the dried tobacco material compared to tube-cured tobacco material. Thus, the present invention is particularly applicable to air-dried and fire-cured tobacco material.
Преимущественно имеется ограниченное влияние на уровни никотина в модифицированных растениях, описанных в данном документе, что является необходимым, если предполагается, что модифицированные растения будут применять для получения растений табака и потребляемых табачных продуктов.Advantageously, there is a limited effect on nicotine levels in the modified plants described herein, which is necessary if the modified plants are to be used to produce tobacco plants and consumable tobacco products.
Преимущественно могут быть созданы генетически не модифицированные растения, которые могут быть более приемлемыми для потребителей.Advantageously, non-genetically modified plants can be created that may be more acceptable to consumers.
Преимущественно настоящее изобретение не ограничено применением растений, полученных с помощью EMS-мутагенеза. Растение, полученное с помощью EMS-мутагенеза, может характеризоваться меньшим потенциалом передачи улучшенных свойств сельскохозяйственной культуре после селекции. После начала селекции необходимая характеристика(характеристики) растения, полученного с помощью EMS-мутагенеза, по разным причинам может быть утрачена. Например, может потребоваться несколько мутаций, мутация может являться доминантной или рецессивной, и идентификация точечной мутации в гене-мишени может являться труднодостижимой. Напротив, в настоящем изобретении вводится применение полинуклеотидов NtAAT, которыми можно в частности манипулировать для получения растений с необходимым фенотипом. Настоящее изобретение можно применять к различным разновидностям растений или сельскохозяйственных культур.Advantageously, the present invention is not limited to the use of plants obtained by EMS mutagenesis. A plant produced by EMS mutagenesis may have less potential to transfer improved traits to the crop after selection. Once breeding has begun, the desired characteristic(s) of the plant obtained by EMS mutagenesis may be lost for various reasons. For example, multiple mutations may be required, a mutation may be dominant or recessive, and identification of a point mutation in a target gene may be difficult to achieve. On the contrary, the present invention introduces the use of NtAAT polynucleotides, which can in particular be manipulated to obtain plants with the desired phenotype. The present invention can be applied to various varieties of plants or crops.
В одном аспекте описана клетка растения, содержащая: (i) полинуклеотид, содержащий, состоящий или по существу состоящий из последовательности, которая характеризуется по меньшей мере 80% идентичностью последовательности с SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13 или SEQ ID NO: 15; (ii) полипептид, кодируемый полинуклеотидом, указанным в (i); (iii) полипептид, содержащий, состоящий или по существу состоящий из последовательности, характеризующейся по меньшей мере 95% идентичностью последовательности с SEQ ID NO: 6 или SEQ ID No: 8, по меньшей мере 93% идентичностью последовательности с SEQ ID NO: 2, или SEQ ID No: 4, или SEQ ID NO: 10, или SEQ ID No: 12, или по меньшей мере 94% идентичностью последовательности с SEQ ID NO: 14 или SEQ ID NO: 16; или (iv) конструкцию, вектор или вектор экспрессии, содержащие выделенный полинуклеотид, указанный в (i), где указанная клетка растения содержит по меньшей мере одну модификацию, которая обеспечивает модулирование экспрессии или активности полинуклеотида или полипептида по сравнению с таковыми в клетке контрольного растения, в которой экспрессия или активность полинуклеотида или полипептида не была модифицирована.In one aspect, a plant cell is described comprising: (i) a polynucleotide comprising, consisting of, or essentially consisting of a sequence that has at least 80% sequence identity with SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, or SEQ ID NO: 15; (ii) a polypeptide encoded by the polynucleotide specified in (i); (iii) a polypeptide comprising, consisting of, or essentially consisting of a sequence having at least 95% sequence identity with SEQ ID NO: 6 or SEQ ID No: 8, at least 93% sequence identity with SEQ ID NO: 2, or SEQ ID No: 4, or SEQ ID NO: 10, or SEQ ID No: 12, or at least 94% sequence identity with SEQ ID NO: 14 or SE Q ID NO: 16; or (iv) a construct, vector or expression vector comprising the isolated polynucleotide referred to in (i), wherein said plant cell contains at least one modification that modulates the expression or activity of the polynucleotide or polypeptide compared to that in a control plant cell in which the expression or activity of the polynucleotide or polypeptide has not been modified.
В другом аспекте раскрыта клетка растения, содержащая: (i) полинуклеотид, содержащий, состоящий или по существу состоящий из последовательности, характеризующейся по меньшей мере 80% идентичностью последовательности с SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13 или SEQ ID NO: 15; (ii) полипептид, кодируемый полинуклеотидом, указанным в (i); (iii) полипептид, содержащий, состоящий или по существу состоящий из последовательности, характеризующейся по меньшей мере 95% идентичностью последовательности с SEQ ID NO: 6 или SEQ ID No: 8, по меньшей мере 93% идентичностью последовательности с SEQ ID NO: 2, или SEQ ID NO: 10, или SEQ ID No: 12, или по меньшей мере 94% идентичностью последовательности с SEQ ID NO: 4, или SEQ ID NO: 14, или SEQ ID NO: 16; или (iv) конструкцию, вектор или вектор экспрессии, содержащие выделенный полинуклеотид, указанный в (i), где указанная клетка растения содержит по меньшей мере одну модификацию, которая обеспечивает модулирование экспрессии или активности полинуклеотида или полипептида по сравнению с таковыми в клетке контрольного растения, в которой экспрессия или активность полинуклеотида или полипептида не была модифицирована. Предпочтительно указанная клетка растения содержит полинуклеотид, содержащий, состоящий или по существу состоящий из последовательности, характеризующейся по меньшей мере 80% идентичностью последовательности с SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 1 или SEQ ID NO: 3, предпочтительно, где клетка растения содержит полинуклеотид, содержащий, состоящий или по существу состоящий из последовательности, характеризующейся по меньшей мере 80% идентичностью последовательности с SEQ ID NO: 1 или SEQ ID NO: 3.In another aspect, a plant cell is disclosed comprising: (i) a polynucleotide comprising, consisting of, or essentially consisting of a sequence having at least 80% sequence identity with SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, or SEQ ID NO: 15; (ii) a polypeptide encoded by the polynucleotide specified in (i); (iii) a polypeptide comprising, consisting of, or essentially consisting of a sequence having at least 95% sequence identity with SEQ ID NO: 6 or SEQ ID No: 8, at least 93% sequence identity with SEQ ID NO: 2, or SEQ ID NO: 10, or SEQ ID No: 12, or at least 94% sequence identity with SEQ ID NO: 4, or SEQ ID NO: 14, or SEQ ID NO: 16; or (iv) a construct, vector or expression vector comprising the isolated polynucleotide referred to in (i), wherein said plant cell contains at least one modification that modulates the expression or activity of the polynucleotide or polypeptide compared to that in a control plant cell in which the expression or activity of the polynucleotide or polypeptide has not been modified. Preferably said plant cell contains a polynucleotide comprising, consisting of or essentially consisting of a sequence characterized by at least 80% sequence identity with SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 1 or SEQ ID NO: 3, preferably, where the plant cell contains a polynucleotide containing, consisting of or essentially consisting of a sequence characterized by at least 80% sequence identity with SEQ ID NO: 1 or SEQ ID NO: 3.
Предпочтительно указанная клетка растения содержит полинуклеотид, содержащий, состоящий или по существу состоящий из последовательности, характеризующейся по меньшей мере 95% идентичностью последовательности c SEQ ID NO: 6 или SEQ ID No: 8 или по меньшей мере 93% идентичностью последовательности с SEQ ID NO: 2 или SEQ ID No: 4 предпочтительно, где клетка растения содержит полинуклеотид, содержащий, состоящий или по существу состоящий из последовательности, характеризующейся по меньшей мере 93% идентичностью последовательности с SEQ ID NO: 2 или SEQ ID No: 4.Preferably, said plant cell comprises a polynucleotide comprising, consisting of, or essentially consisting of a sequence having at least 95% sequence identity with SEQ ID NO: 6 or SEQ ID No: 8, or at least 93% sequence identity with SEQ ID NO: 2 or SEQ ID No: 4, preferably wherein the plant cell comprises a polynucleotide containing, consisting of, or essentially consisting of a sequence having at least 93% sequence identity with SEQ ID NO: 2 or SEQ ID No: 4.
Предпочтительно, указанная клетка растения содержит полинуклеотид, содержащий, состоящий или по существу состоящий из последовательности, характеризующейся по меньшей мере 95% идентичностью последовательности c SEQ ID NO: 6 или SEQ ID No: 8, или по меньшей мере 93% идентичностью последовательности с SEQ ID NO: 2, или по меньшей мере 94% идентичностью последовательности с SEQ ID No: 4 предпочтительно, где клетка растения содержит полинуклеотид, содержащий, состоящий или по существу состоящий из последовательности, характеризующейся по меньшей мере 93% идентичностью последовательности с SEQ ID NO: 2 или по меньшей мере 94% идентичностью последовательности с SEQ ID No: 4. Предпочтительно, экспрессия и/или активность одной или более из NtAAT1-S (SEQ ID NO: 5 или SEQ ID NO: 6), NtAAT1-T (SEQ ID NO: 7 или SEQ ID NO: 8), NtAAT2-S (SEQ ID NO: 1 или SEQ ID NO: 2) и NtAAT2-T (SEQ ID NO: 3 или SEQ ID NO: 4) модулируется, тогда как экспрессия и/или активность одной или более из NtAAT3-S (SEQ ID NO: 9 или SEQ ID NO: 10), NtAAT3-T (SEQ ID NO: 11 или SEQ ID NO: 12), NtAAT4-S (SEQ ID NO: 13 или SEQ ID NO: 14) и NtAAT4-T (SEQ ID NO: 15 или SEQ ID NO: 16) не модулируется.Preferably, said plant cell contains a polynucleotide comprising, consisting of or essentially consisting of a sequence characterized by at least 95% sequence identity with SEQ ID NO: 6 or SEQ ID No: 8, or at least 93% sequence identity with SEQ ID NO: 2, or at least 94% sequence identity with SEQ ID No: 4, preferably, where the plant cell contains a polynucleotide containing, consisting of, or essentially consisting of a sequence characterized by at least 93% sequence identity to SEQ ID NO: 2 or at least 94% sequence identity to SEQ ID NO: 4. Preferably, expression and/or activity of one or more of NtAAT1-S (SEQ ID NO: 5 or SEQ ID NO: 6), NtAAT1-T (SEQ ID NO: 7 or SEQ ID NO: 8), NtAAT2-S (SEQ ID NO: 1 or SEQ ID NO: 2) and NtAAT2-T (SEQ ID NO: 3 or SEQ ID NO: 4) is modulated, while the expression and/or activity of one or more of NtAAT3-S (SEQ ID NO: 9 or SEQ ID NO: 10), NtAAT3-T (SEQ ID NO: 11 or SEQ ID NO: 12), NtAAT4-S (SEQ ID NO: 13 or SEQ ID NO: 14) and NtAAT 4-T (SEQ ID NO: 15 or SEQ ID NO: 16) is not modulated.
Предпочтительно, по меньшей мере одна модификация представляет собой модификацию генома клетки растения, или модификацию конструкции, вектора или вектора экспрессии, или трансгенную модификацию.Preferably, at least one modification is a modification of the genome of a plant cell, or a modification of a construct, vector or expression vector, or a transgenic modification.
Предпочтительно, модификация генома клетки растения или модификация конструкции, вектора или вектора экспрессии представляет собой мутацию или редактирование.Preferably, the modification of the genome of the plant cell or the modification of the construct, vector or expression vector is a mutation or editing.
Предпочтительно, такая модификация обеспечивает понижение экспрессии или активности полинуклеотида или полипептида по сравнению с таковыми в клетке контрольного растения.Preferably, such a modification provides a reduction in the expression or activity of the polynucleotide or polypeptide compared to those in the cell of the control plant.
Предпочтительно, клетка растения содержит полинуклеотид для обеспечения интерференции, содержащий последовательность, которая на по меньшей мере 80% комплементарна по меньшей мере 19 нуклеотидам РНК, транскрибируемой с полинуклеотида в соответствии с пунктом формулы изобретения 1(i).Preferably, the plant cell contains an interference polynucleotide containing a sequence that is at least 80% complementary to at least 19 nucleotides of the RNA transcribed from the polynucleotide according to claim 1(i).
Предпочтительно, модулированная экспрессия или активность полинуклеотида или полипептида обеспечивают модулирование уровня аминокислот в листе, подвергнутом сушке, или высушенном листе, полученных из клетки растения, по сравнению с уровнем аминокислот в листе, подвергнутом сушке, или высушенном листе, полученных из контрольного растения, предпочтительно, где аминокислота представляет собой аспартат или метаболит, полученный из него.Preferably, the modulated expression or activity of the polynucleotide or polypeptide modulates the amino acid level in the dried or dried leaf derived from the plant cell compared to the amino acid level in the dried or dried leaf derived from the control plant, preferably where the amino acid is aspartate or a metabolite derived from it.
Предпочтительно, уровень никотина в листе, подвергнутом сушке, или высушенном листе, полученных из клетки растения, является практически таким же, как и уровень никотина в листе, подвергнутом сушке, или высушенном листе, полученных из клетки контрольного растения; и/или где уровень акриламида в листе, подвергнутом сушке, или высушенном листе, полученных из клетки растения, является пониженным по сравнению с уровнем акриламида в листе, подвергнутом сушке, или высушенном листе, полученных из контрольного растения, и/или при этом уровень аммиака в листе, подвергнутом сушке, или высушенном листе, полученных из клетки растения, является пониженным по сравнению с уровнем аминокислот в листе, подвергнутом сушке, или высушенном листе, полученных из контрольного растения.Preferably, the level of nicotine in the dried leaf or dried leaf obtained from the plant cell is substantially the same as the level of nicotine in the dried leaf or dried leaf obtained from the control plant cell; and/or where the level of acrylamide in the dried leaf or dried leaf obtained from the plant cell is reduced compared to the level of acrylamide in the dried leaf or dried leaf obtained from the control plant, and/or where the level of ammonia in the dried leaf or dried leaf obtained from the plant cell is reduced compared to the level of amino acids in the dried leaf or dried leaf obtained from from the control plant.
В дополнительном аспекте описано растение или его часть, содержащая клетку растения, описанную в данном документе. В дополнительном аспекте описано растение или его часть, описанные в данном документе, где количество аспартата или метаболита, получаемого из него, является модифицированным в по меньшей мере части растения по сравнению с таковыми в контрольном растении или его части.In an additional aspect, a plant or part thereof is described that contains a plant cell as described herein. In a further aspect, a plant or part of the plant described herein is described, wherein the amount of aspartate or metabolite derived therefrom is modified in at least part of the plant compared to that of a control plant or part thereof.
В дополнительном аспекте описан растительный материал, растительный материал, подвергнутый сушке, или гомогенизированный растительный материал, полученные из растения или его части, как описано в данном документе, предпочтительно, где растительный материал, подвергнутый сушке, представляет собой растительный материал воздушной сушки, растительный материал солнечной сушки или растительный материал трубоогневой сушки.In a further aspect, a plant material, a dried plant material, or a homogenized plant material obtained from a plant or part thereof as described herein is described, preferably wherein the dried plant material is an air-dried plant material, a sun-dried plant material, or a fire-dried plant material.
В дополнительном аспекте описан растительный материал, описанный в данном документе, включающий биомассу, семя, стебель, цветы или листья растения или его части, как описано в данном документе.In an additional aspect, the plant material described herein is described, including the biomass, seed, stem, flowers or leaves of a plant or parts thereof, as described herein.
В дополнительном аспекте описано табачный продукт, содержащий клетку растения, описанную в данном документе, часть растения, описанную в данном документе, или растительный материал, описанный в данном документе.In a further aspect, a tobacco product is described comprising a plant cell as described herein, a plant part as described herein, or plant material as described herein.
В дополнительном аспекте описан способ получения растения, описанного в данном документе, включающий следующие стадии: (a) получение клетки растения, содержащей полинуклеотид, содержащий, состоящий или по существу состоящий из полинуклеотида, содержащего, состоящего или по существу состоящего из последовательности, характеризующейся по меньшей мере 80% идентичностью последовательности с SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13 или SEQ ID NO: 15; (b) модификация клетки растения для обеспечения модулирования экспрессии указанного полинуклеотида по сравнению с таковой в клетке контрольного растения; и (c) размножение клетки растения с получением растения.In an additional aspect, a method for producing a plant described herein is described, comprising the following steps: (a) obtaining a plant cell containing a polynucleotide containing, consisting of, or essentially consisting of a polynucleotide containing, consisting of, or essentially consisting of a sequence characterized by at least 80% sequence identity with SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SE Q ID NO: 13 or SEQ ID NO: 15; (b) modifying a plant cell to modulate the expression of said polynucleotide as compared to that in a control plant cell; and (c) propagating the plant cell to obtain a plant.
Предпочтительно, стадия (c) включает культивирование растения из побега или саженца, содержащих клетку растения.Preferably, step (c) comprises cultivating a plant from a shoot or seedling containing a plant cell.
Предпочтительно, стадия модификации клетки растения включает модификацию генома клетки с помощью методов редактирования генома или геномной инженерии.Preferably, the step of modifying a plant cell includes modifying the genome of the cell using genome editing or genomic engineering techniques.
Предпочтительно, методы редактирования генома или геномной инженерии выбраны из технологии CRISPR/Cas, мутагенеза, опосредованного нуклеазой с «цинковыми пальцами», химического или радиационного мутагенеза, гомологичной рекомбинации, олигонуклеотид-направленного мутагенеза и мутагенеза, опосредованного мегануклеазой.Preferably, genome editing or genomic engineering techniques are selected from CRISPR/Cas technology, zinc finger nuclease mediated mutagenesis, chemical or radiation mutagenesis, homologous recombination, oligonucleotide directed mutagenesis, and meganuclease mediated mutagenesis.
Предпочтительно, стадия модификации клетки растения включает трансфекцию клетки конструкцией, содержащей полинуклеотид, содержащий, состоящий или по существу состоящий из последовательности, характеризующейся по меньшей мере 80% идентичностью последовательности с SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13 или SEQ ID NO: 15, функционально связанной с конститутивным промотором.Preferably, the step of modifying a plant cell comprises transfecting the cell with a construct comprising a polynucleotide comprising, consisting of, or essentially consisting of a sequence having at least 80% sequence identity with SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, or SEQ ID NO: 15 operably linked to the constitutive pro motor.
Предпочтительно, стадия модификации клетки растения включает введение в клетку полинуклеотида для обеспечения интерференции, содержащего последовательность, которая на по меньшей мере 80% комплементарна РНК, транскрибируемой с полинуклеотида в соответствии с пунктом формулы изобретения 1(i).Preferably, the step of modifying the plant cell comprises introducing into the cell an interference polynucleotide containing a sequence that is at least 80% complementary to the RNA transcribed from the polynucleotide according to claim 1(i).
Предпочтительно, клетку растения трансфицируют конструкцией, экспрессирующей полинуклеотид для обеспечения интерференции, содержащий последовательность, которая на по меньшей мере 80% комплементарна по меньшей мере 19 нуклеотидам РНК, транскрибируемым с полинуклеотида в соответствии с пунктом формулы изобретения 1(i).Preferably, the plant cell is transfected with a construct expressing an interference polynucleotide containing a sequence that is at least 80% complementary to at least 19 RNA nucleotides transcribed from the polynucleotide according to claim 1(i).
В дополнительном аспекте описан способ получения растительного материала, подвергнутого сушке, со скорректированным количеством аспартата или метаболита, получаемого из него, по сравнению с таковыми в контрольном растительном материале, включающий следующие стадии: (a) получение растения или его части или растительного материала, описанных в данном документе; (b) необязательно сбор растительного материала с таковых; и (c) сушка растительного материала.In an additional aspect, a method is described for obtaining a dried plant material with an adjusted amount of aspartate or a metabolite derived from it, compared to those in a control plant material, comprising the following steps: (a) obtaining a plant or part thereof or plant material described herein; (b) optionally collecting plant material from those; and (c) drying the plant material.
Предпочтительно, растительный материал включает подвергнутые сушке листья, подвергнутые сушке стебли или подвергнутые сушке цветки или их смесь.Preferably, the plant material comprises dried leaves, dried stems or dried flowers, or a mixture thereof.
Предпочтительно, способ сушки выбран из группы, состоящей из воздушной сушки, огневой сушки, дымовой сушки и трубоогневой сушки.Preferably, the drying method is selected from the group consisting of air drying, flame drying, flue drying and flue drying.
КРАТКОЕ ОПИСАНИЕ ГРАФИЧЕСКИХ МАТЕРИАЛОВBRIEF DESCRIPTION OF GRAPHICS
Фигура 1 представляет собой график, на котором показано содержание общих свободных аминокислот после сбора (в зрелом состоянии), через два дня после сушки (48 ч.) и в конце сушки в культивируемом табаке Вирджиния, Берлей и восточного типа. Figure 1 is a graph showing the content of total free amino acids after harvest (mature), two days after drying (48 hours) and at the end of drying in cultivated Virginia, Burley and Oriental tobacco.
Фигура 2 представляет собой график, на котором показаны количества аспартата (asp) и аспарагина (asn) после сбора в образцах листа швейцарского табака Берлей, выращенного в поле (три повторности листа навалом). Содержание свободных аминокислот измеряли в образцах листа (расположенных в средней области стебля), которые собирали через определенные промежутки времени в амбаре для воздушной обработки до завершения 50 дней сушки. Figure 2 is a graph showing the amounts of aspartate (asp) and asparagine (asn) after harvest in Swiss Burley tobacco leaf samples grown in the field (three replications of the leaf in bulk). The content of free amino acids was measured in leaf samples (located in the middle region of the stem), which were collected at regular intervals in the barn for air processing before completion of 50 days of drying.
Фигура 3 представляет собой график, на котором показано содержание никотина в листьях, расположенных в средней области стебля, растений NtAAT2-S/T RNAi T0 (E324) и соответствующих контрольных растений (CTE324). Figure 3 is a graph showing the content of nicotine in the leaves located in the middle region of the stem, plants NtAAT2-S/T RNAi T0 (E324) and the corresponding control plants (CTE324).
Фигура 4 представляет собой график, на котором показано содержание аспарагина в листьях, расположенных в средней области стебля, растений NtAAT2-S/T RNAi T0 (E324) и соответствующих контрольных растений (CTE324). Figure 4 is a graph showing the content of asparagine in the leaves located in the middle region of the stem, plants NtAAT2-S/T RNAi T0 (E324) and the corresponding control plants (CTE324).
ПОДРОБНОЕ ОПИСАНИЕDETAILED DESCRIPTION
Заголовки разделов, используемые в настоящем раскрытии, служат для организационных целей и не предусматриваются как ограничивающие.The section headings used in this disclosure are for organizational purposes and are not intended to be limiting.
Если не определено иное, то все технические и научные термины, используемые в данном документе, имеют такое же значение, какое обычно понимает специалист средней квалификации в данной области техники. В случае противоречий данный документ, включая определения, будет иметь преимущественную силу. Предпочтительные способы и материалы описаны ниже, хотя способы и материалы, сходные или эквивалентные описанным в данном документе, могут быть применены при осуществлении настоящего изобретения на практике или его тестировании. Материалы, способы и примеры, раскрытые в данном документе, являются лишь иллюстративными и не предусматриваются как ограничивающие.Unless otherwise defined, all technical and scientific terms used in this document have the same meaning as usually understood by a person of ordinary skill in the art. In the event of conflict, this document, including the definitions, shall prevail. Preferred methods and materials are described below, although methods and materials similar or equivalent to those described herein may be used in practicing or testing the present invention. The materials, methods, and examples disclosed herein are illustrative only and are not intended to be limiting.
Подразумевается, что термины «включают(включает)», «включают(включает) в себя», «характеризуются», «имеет», «может», «содержат(содержит)» и их варианты, используемые в данном документе, являются открытыми переходными фразами, терминами или словами, которые не исключают возможность наличия дополнительных действий или структур.The terms "include(includes)", "include(includes)," "characterized", "has", "may", "comprise(contains)", and variations thereof, as used herein, are intended to be open transitional phrases, terms, or words that do not exclude the possibility of additional acts or structures.
Формы единственного числа включают ссылки на множественное число, если из контекста явно не следует иное.The singular forms include references to the plural unless the context clearly dictates otherwise.
Термин «и/или» означает (а) или (b) или как (а), так и (b).The term "and/or" means (a) or (b) or both (a) and (b).
Настоящим изобретением предусмотрены другие варианты осуществления, «содержащие», «состоящие из» и «по существу состоящие из» вариантов осуществления или элементов, представленных в данном документе, независимо от того, указано это явно или нет.The present invention contemplates other embodiments "comprising", "consisting of" and "essentially consisting of" the embodiments or elements set forth herein, whether explicitly stated or not.
В случае изложения в данном документе числовых диапазонов, каждое промежуточное число в них предусматривается в явной форме с той же степенью точности. Например, в случае диапазона 6-9 в дополнение к 6 и 9 предусматриваются числа 7 и 8, а в случае диапазона 6,0-7,0 в явной форме предусматриваются числа 6,0, 6,1, 6,2, 6,3, 6,4, 6,5, 6,6, 6,7, 6,8, 6,9 и 7,0.When numeric ranges are set forth in this document, each intermediate number is provided explicitly with the same degree of precision. For example, in the case of the range 6-9, the numbers 7 and 8 are provided in addition to 6 and 9, and in the case of the range 6.0-7.0, the numbers 6.0, 6.1, 6.2, 6.3, 6.4, 6.5, 6.6, 6.7, 6.8, 6.9 and 7.0 are explicitly provided.
Следующие термины, используемые во всем данном описании и формуле изобретения, имеют следующие значения.The following terms, as used throughout this specification and claims, have the following meanings.
Термины «кодирующая последовательность» или «полинуклеотид, кодирующий» означают нуклеотиды (молекулы РНК или ДНК), которые составляют полинуклеотид, который кодирует полипептид. Кодирующая последовательность может дополнительно содержать сигналы инициации и терминации, функционально связанные с регуляторными элементами, в том числе c промотором и сигналом полиаденилирования, способными управлять экспрессией в клетках индивидуума или млекопитающего, которому вводят полинуклеотид. Кодирующая последовательность может быть кодон-оптимизированной.The terms "coding sequence" or "polynucleotide encoding" means the nucleotides (RNA or DNA molecules) that make up a polynucleotide that encodes a polypeptide. The coding sequence may further comprise initiation and termination signals operably linked to regulatory elements, including a promoter and a polyadenylation signal, capable of directing expression in cells of the individual or mammal receiving the polynucleotide. The coding sequence may be codon-optimized.
Выражения «комплементарная последовательность» или «комплементарный» могут означать спаривание оснований по Уотсону-Крику (например, A-T/U и C-G) или Хугстину между нуклеотидами или аналогами нуклеотидов. «Комплементарность» относится к свойству, присущему совместно двум полинуклеотидам, заключающемуся в том, что при их антипараллельном выравнивании друг относительно друга нуклеотидные основания в каждом положении комплементарны друг другу.The terms "complementary sequence" or "complementary" may refer to Watson-Crick base pairing (e.g., A-T/U and C-G) or Hoogsteen between nucleotides or nucleotide analogs. "Complementarity" refers to the property shared by two polynucleotides that when they are anti-parallel aligned with each other, the nucleotide bases at each position are complementary to each other.
Термин «конструкция» относится к двунитевому фрагменту рекомбинантного полинуклеотида, предусматривающему один или более полинуклеотидов. Конструкция содержит «матричную нить», основания которой спарены с комплементарной «смысловой или кодирующей нитью». Указанная конструкция может быть вставлена в вектор в двух возможных ориентациях: либо в той же (или смысловой) ориентации, либо в противоположной (или антисмысловой) ориентации по отношению к ориентации промотора, расположенного в векторе, таком как вектор экспрессии.The term "construct" refers to a double-stranded fragment of a recombinant polynucleotide containing one or more polynucleotides. The construction contains a "matrix thread", the bases of which are paired with a complementary "semantic or coding thread". The construct may be inserted into the vector in two possible orientations: either in the same (or sense) orientation or in the opposite (or antisense) orientation of the promoter located in the vector, such as an expression vector.
Термин «контроль» в контексте контрольного растения или контрольных клеток растения означает растение или клетки растения, в которых экспрессия, функция или активность одного или более генов или полипептидов не была модифицирована (например, повышена или понижена), и поэтому они могут обеспечивать возможность сравнения с растением, в котором экспрессия, функция или активность одного или более таких же генов или полипептидов была модифицирована. Используемое в данном документе выражение «контрольное растение» означает растение, которое является практически эквивалентным тестируемому растению или модифицированному растению по всем параметрам, за исключением тестируемых параметров. Например, если речь идет о растении, в которое был введен полинуклеотид, контрольным растением является эквивалентное растение, в которое такой полинуклеотид не был введен. Контрольным растением может являться эквивалентное растение, в которое был введен контрольный полинуклеотид. В таких случаях контрольный полинуклеотид представляет собой полинуклеотид, для которого обуславливаемый им фенотипический эффект в отношении растения, как предполагается, является незначительным или отсутствует. Контрольное растение может содержать пустой вектор. Контрольное растение может соответствовать растению дикого типа. Контрольное растение может быть ноль-сегрегантом, при этом сегрегант T1 больше не содержит трансгена.The term "control" in the context of a control plant or control plant cells means a plant or plant cells in which the expression, function, or activity of one or more of the same genes or polypeptides has not been modified (e.g., increased or decreased), and therefore may allow comparison with a plant in which the expression, function, or activity of one or more of the same genes or polypeptides has been modified. Used in this document, the expression "control plant" means a plant that is practically equivalent to the test plant or modified plant in all respects, with the exception of the tested parameters. For example, if we are talking about a plant in which the polynucleotide has been introduced, the control plant is an equivalent plant in which such a polynucleotide has not been introduced. The control plant may be an equivalent plant into which the control polynucleotide has been introduced. In such cases, a control polynucleotide is a polynucleotide for which its phenotypic effect on the plant is expected to be negligible or absent. The control plant may contain an empty vector. The control plant may correspond to the wild type plant. The control plant may be a null segregant, with the T1 segregant no longer containing the transgene.
Термины «донорная ДНК» или «донорная матрица» относятся к фрагменту или молекуле двунитевой ДНК, которые содержат по меньшей мере часть гена, представляющего интерес. Донорная ДНК может кодировать полностью функциональный полипептид или частично функциональный полипептид.The terms "donor DNA" or "donor template" refer to a double stranded DNA fragment or molecule that contains at least a portion of a gene of interest. The donor DNA may encode a fully functional polypeptide or a partially functional polypeptide.
Термин «эндогенный ген или полипептид» относится к гену или полипептиду, которые происходят из генома организма и не претерпели изменения, такого как потеря, приобретение или замена генетического материала. Эндогенный ген подвергается нормальному переносу гена и экспрессии гена. Эндогенный полипептид подвергается нормальной экспрессии.The term "endogenous gene or polypeptide" refers to a gene or polypeptide that is derived from the genome of an organism and has not undergone a change, such as loss, gain or replacement of genetic material. An endogenous gene undergoes normal gene transfer and gene expression. The endogenous polypeptide undergoes normal expression.
Термин «энхансерные последовательности» относится к последовательностям, которые могут обеспечивать повышение экспрессии гена. Эти последовательности могут быть расположены выше, в пределах интронов или ниже транскрибируемого участка. Транскрибируемый участок состоит из экзонов и расположенных между ними интронов, от промотора до участка терминации транскрипции. Усиление экспрессии гена может происходить посредством различных механизмов, включая повышение эффективности транскрипции, стабилизацию зрелой мРНК и усиление трансляции.The term "enhancer sequences" refers to sequences that can increase gene expression. These sequences may be located upstream, within the introns, or downstream of the transcribed region. The transcribed region consists of exons and introns located between them, from the promoter to the transcription termination site. The increase in gene expression can occur through various mechanisms, including increased transcriptional efficiency, stabilization of mature mRNA, and increased translation.
Термин «экспрессия» относится к выработке функционального продукта. Например, экспрессия фрагмента полинуклеотида может относиться к транскрипции фрагмента полинуклеотида (например, транскрипции, приводящей к получению мРНК или функциональной РНК) и/или трансляции мРНК с получением полипептида-предшественника или зрелого полипептида. «Сверхэкспрессия» относится к выработке продукта гена в трансгенных организмах на уровнях, которые превышают уровни выработки в ноль-сегрегантном (или нетрансгенном) организме из того же эксперимента.The term "expression" refers to the production of a functional product. For example, expression of a polynucleotide fragment may refer to the transcription of a polynucleotide fragment (eg, transcription resulting in mRNA or functional RNA) and/or translation of the mRNA to produce a precursor or mature polypeptide. "Overexpression" refers to the production of a gene product in transgenic organisms at levels that exceed those in a null-segregant (or non-transgenic) organism from the same experiment.
Термины «функциональный» и «полностью функциональный» описывают полипептид, который обладает биологической функцией или активностью. Термин «функциональный ген» относится к гену, транскрибируемому с образованием мРНК, которая транслируется с образованием функционального или активного полипептида.The terms "functional" and "fully functional" describe a polypeptide that has a biological function or activity. The term "functional gene" refers to a gene that is transcribed to form an mRNA that is translated to form a functional or active polypeptide.
Термин «генетическая конструкция» относится к молекулам ДНК или РНК, которые содержат полинуклеотид, который кодирует полипептид. Кодирующая последовательность может содержать сигналы инициации и терминации, функционально связанные с регуляторными элементами, в том числе c промотором и сигналом полиаденилирования, способными управлять экспрессией.The term "genetic construct" refers to DNA or RNA molecules that contain a polynucleotide that encodes a polypeptide. The coding sequence may contain initiation and termination signals operably linked to regulatory elements, including a promoter and a polyadenylation signal, capable of driving expression.
Термин «редактирование генома» относится к такому изменению эндогенного гена, который кодирует эндогенный полипептид, при котором достигают экспрессии полипептида, представляющего собой усеченный эндогенный полипептид или эндогенный полипептид, имеющий аминокислотную замену. Редактирование генома может включать замещение участка эндогенного гена, подлежащего нацеливанию, или замещение всего эндогенного гена копией гена, которая характеризуется наличием усечения или аминокислотной замены, с помощью механизма репарации, такого как HDR. Редактирование генома также может включать создание аминокислотной замены в эндогенном гене посредством создания двунитевого разрыва в эндогенном гене, который затем репарируют с применением NHEJ. С помощью NHEJ можно осуществлять добавление или делецию по меньшей мере одной пары оснований в ходе репарации, вследствие чего можно получить аминокислотную замену. Редактирование генома также может включать удаление сегмента гена с помощью одновременного действия двух нуклеаз на одну и ту же нить ДНК для осуществления усечения между двумя сайтами-мишенями нуклеаз, и репарацию разрыва ДНК с помощью NHEJ.The term "genome editing" refers to such a change in an endogenous gene that encodes an endogenous polypeptide, which achieves the expression of a polypeptide that is a truncated endogenous polypeptide or an endogenous polypeptide having an amino acid substitution. Genome editing may include replacing the portion of an endogenous gene to be targeted, or replacing the entire endogenous gene with a copy of the gene that is characterized by the presence of a truncation or amino acid substitution, using a repair mechanism such as HDR. Genome editing may also include creating an amino acid substitution in an endogenous gene by creating a double strand break in the endogenous gene, which is then repaired using NHEJ. NHEJ can be used to add or delete at least one base pair during repair, whereby an amino acid substitution can be obtained. Genome editing may also include deletion of a gene segment by simultaneous action of two nucleases on the same strand of DNA to effect truncation between two nuclease target sites, and repair of the DNA break by NHEJ.
Термин «гетерологичный» в отношении последовательности означает последовательность, которая происходит из чужеродного вида или, в случае, если она происходит из того же вида, является существенно модифицированной по сравнению со своей нативной формой по составу и/или геномному локусу вследствие преднамеренного вмешательства человека.The term "heterologous" in relation to a sequence means a sequence that is derived from a foreign species or, if derived from the same species, is substantially modified from its native form in composition and/or genomic locus due to intentional human interference.
Термины «репарация путем гомологичной рекомбинации» или «HDR» относятся к механизму репарации двунитевых повреждений ДНК в клетках, если гомологичный фрагмент ДНК присутствует в ядре, главным образом в G2- и S-фазе клеточного цикла. В ходе HDR применяют донорную ДНК или донорную матрицу для направления репарации, и ее можно применять для создания конкретных изменений последовательностей в геноме, в том числе для нацеленного добавления целых генов. Если донорная матрица предоставляется вместе с сайт-специфичной нуклеазой, то клеточный аппарат будет репарировать разрыв с помощью гомологичной рекомбинации, которая усиливается по величине на несколько порядков при наличии расщепления ДНК. Если гомологичный фрагмент ДНК отсутствует, то вместо этого может происходить NHEJ.The terms "repair by homologous recombination" or "HDR" refers to the mechanism of repair of double-stranded DNA damage in cells when a homologous DNA fragment is present in the nucleus, mainly in the G2 and S phases of the cell cycle. HDR uses donor DNA or a donor template to guide repair and can be used to create specific sequence changes in the genome, including targeted addition of entire genes. If the donor template is provided together with a site-specific nuclease, then the cellular apparatus will repair the break with homologous recombination, which is magnified by several orders of magnitude in the presence of DNA cleavage. If a homologous DNA fragment is not present, then NHEJ may occur instead.
Термины «гомология» или «сходство» относятся к степени сходства последовательностей двух полипептидов или двух молекул полинуклеотида, сравниваемых путем выравнивания последовательностей. Степень гомологии между двумя отдельными сравниваемым полинуклеотидами является функцией числа идентичных или совпадающих нуклеотидов в сопоставляемых положениях.The terms "homology" or "similarity" refers to the degree of sequence similarity between two polypeptides or two polynucleotide molecules compared by sequence alignment. The degree of homology between two individual compared polynucleotides is a function of the number of identical or matching nucleotides at the compared positions.
Термины «идентичный» или «идентичность» в контексте двух или более полинуклеотидов или полипептидов означают, что последовательности характеризуются наличием определенной процентной доли остатков, которые являются одинаковыми в пределах определенного участка. Процентную долю можно рассчитать путем оптимального выравнивания двух последовательностей, сравнения двух последовательностей в пределах определенного участка, определения числа положений, в которых в обеих последовательностях находятся идентичные остатки, с получением числа совпадающих положений, деления числа совпадающих положений на общее число положений в определенном участке и умножения результата на 100 с получением процентной доли идентичности последовательностей. В тех случаях, когда эти две последовательности имеют разную длину или при выравнивании создается один или более несимметрично расположенных концов, и определенный участок сравнения включает только одну последовательность, то при расчете остатки одиночной последовательности включаются в знаменатель, а не в числитель. При сравнении ДНК и РНК тимин (Т) и урацил (U) можно считать эквивалентными. Идентичность можно определять самостоятельно или с помощью компьютерного алгоритма для работы с последовательностями, такого как ClustalW, ClustalX, BLAST, FASTA или алгоритм Смита-Уотермана. Популярная программа множественного выравнивания ClustalW (Nucleic Acids Research (1994) 22, 4673-4680; Nucleic Acids Research (1997), 24, 4876-4882) представляет собой подходящий способ получения множественных выравниваний полипептидов или полинуклеотидов. Подходящие параметры для ClustalW могут являться следующими. Для выравниваний полинуклеотидов: штраф за открытие гэпа=15,0, штраф за продолжение гэпа=6,66 и матрица=идентичность. Для выравниваний полипептидов: штраф за открытие гэпа=10,0, штраф за продолжение гэпа=0,2 и матрица=Gonnet. Для выравниваний ДНК и белка: ENDGAP = -1 и GAPDIST=4. Специалистам в данной области будет понятно, что может быть необходимым изменять эти и другие параметры для оптимального выравнивания последовательностей. Предпочтительно, затем проводят расчет процентной доли идентичностей на основании такого выравнивания в виде (N/T), где N представляет собой число положений, в которых в последовательностях присутствует идентичный остаток, и T представляет собой общее число сравниваемых положений, включая гэпы, но за исключением выступов.The terms "identical" or "identity" in the context of two or more polynucleotides or polypeptides means that the sequences are characterized by the presence of a certain percentage of residues that are the same within a certain area. The percentage can be calculated by optimally aligning two sequences, comparing the two sequences within a given region, determining the number of positions where both sequences have identical residues to get the number of matching positions, dividing the number of matching positions by the total number of positions in the defined region, and multiplying the result by 100 to get the percent sequence identity. In cases where the two sequences are of different lengths, or the alignment creates one or more non-symmetrically spaced ends, and a certain comparison region includes only one sequence, then the residuals of the single sequence are included in the denominator and not in the numerator in the calculation. When comparing DNA and RNA, thymine (T) and uracil (U) can be considered equivalent. The identity can be determined by yourself or by using a computer sequence algorithm such as ClustalW, ClustalX, BLAST, FASTA, or the Smith-Waterman algorithm. The popular ClustalW multiple alignment program ( Nucleic Acids Research (1994) 22, 4673-4680; Nucleic Acids Research (1997), 24, 4876-4882) is a suitable method for generating multiple polypeptide or polynucleotide alignments. Suitable parameters for ClustalW may be as follows. For polynucleotide alignments: gap opening penalty=15.0, gap extension penalty=6.66 and template=identity. For polypeptide alignments: gap opening penalty=10.0, gap extension penalty=0.2 and matrix=Gonnet. For DNA and protein alignments: ENDGAP=-1 and GAPDIST=4. Those skilled in the art will appreciate that it may be necessary to vary these and other parameters for optimal sequence alignment. Preferably, the percentage of identities is then calculated based on this alignment in the form (N/T), where N is the number of positions at which an identical residue is present in the sequences, and T is the total number of positions compared, including gaps but excluding overhangs.
Термины «повышение» или «повышенный» относятся к повышению, составляющему от приблизительно 10% до приблизительно 99%, или повышению, составляющему по меньшей мере 10%, по меньшей мере 20%, по меньшей мере 25%, по меньшей мере 30%, по меньшей мере 40%, по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 98%, по меньшей мере 99%, по меньшей мере 100%, по меньшей мере 150%, или по меньшей мере 200%, или больше, количества, или функции, или активности, такой как без ограничения функция или активность полипептида, транскрипционная функция или активность и/или экспрессия белка. Термин «повышенный» или фраза «повышенное количество» может относиться к количеству, или функции, или активности модифицированного растения или продукта, полученного из модифицированного растения, которое является большим, чем можно обнаружить в растении или продукте из той же разновидности растения, обработанного таким же образом, которое не было модифицировано. Таким образом, в некоторых случаях растение дикого типа той же разновидности, которое было переработано таким же образом, используется в качестве контроля, с помощью которого измеряют, достигнуто ли повышение количества.The terms "increase" or "increased" refer to an increase of from about 10% to about 99%, or an increase of at least 10%, at least 20%, at least 25%, at least 30%, at least 40%, at least 50%, at least 60%, at least 70%, at least 75%, at least 80%, at least 90%, at least 95%, at least 98%, at least 99%, at least 100%, at least 150%, or at least 200%, or more, of an amount or function or activity, such as, without limitation, polypeptide function or activity, transcriptional function or activity, and/or protein expression. The term "increased" or the phrase "increased amount" may refer to an amount or function or activity of a modified plant or a product derived from a modified plant that is greater than would be found in a plant or product from the same plant variety treated in the same manner that has not been modified. Thus, in some cases, a wild-type plant of the same variety that has been processed in the same way is used as a control by which it is measured whether an increase in quantity has been achieved.
Термин «понижение» или «пониженный», используемый в данном документе, относится к уменьшению, составляющему от приблизительно 10% до приблизительно 99%, или уменьшению, составляющему по меньшей мере 10%, по меньшей мере 20%, по меньшей мере 25%, по меньшей мере 30%, по меньшей мере 40%, по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 98%, по меньшей мере 99%, или по меньшей мере 100%, или по меньшей мере 150%, или по меньшей мере 200%, или больше, количества или функции, такой как функция полипептида, транскрипционная функция или экспрессия полипептида. Термин «повышенный» или фраза «повышенное количество» может относиться к количеству или функции в модифицированном растении или продукте, полученном из модифицированного растения, которое является меньшим, чем можно обнаружить в растении или продукте из той же разновидности растения, обработанного таким же образом, которое не было модифицировано. Таким образом, в некоторых случаях растение дикого типа той же разновидности, которое было переработано таким же образом, используется в качестве контроля, с помощью которого измеряют, достигнуто ли уменьшение количества.The term "reduction" or "reduced" as used herein refers to a reduction of from about 10% to about 99%, or a reduction of at least 10%, at least 20%, at least 25%, at least 30%, at least 40%, at least 50%, at least 60%, at least 70%, at least 75%, at least 80%, at least 90%, at least 95%, at least 98%, at least 99%, or at least 100%, or at least 150%, or at least 200%, or more, of an amount or function, such as polypeptide function, transcriptional function, or polypeptide expression. The term "increased" or the phrase "increased amount" may refer to an amount or function in a modified plant or product derived from a modified plant that is less than would be found in a plant or product from the same plant variety treated in the same manner that has not been modified. Thus, in some cases, a wild-type plant of the same variety that has been processed in the same way is used as a control to measure whether a reduction has been achieved.
Термин «ингибировать» или «ингибированный» относится к уменьшению, составляющему от приблизительно 98% до приблизительно 100%, или уменьшению, составляющему по меньшей мере 98%, по меньшей мере 99% и, в частности, 100%, количества, или функции, или активности, как, например, без ограничения, функции или активности полипептида, транскрипционной функции или активности и/или экспрессии полипептида.The term "inhibit" or "inhibited" refers to a decrease of from about 98% to about 100%, or a decrease of at least 98%, at least 99%, and in particular 100%, of the amount or function or activity, such as, without limitation, the function or activity of a polypeptide, the transcriptional function or activity and/or expression of a polypeptide.
Термин «введенный» означает доставку полинуклеотида (например, конструкции) или полипептида в клетку. Выражение «введенный» включает ссылку на встраивание полинуклеотида в эукариотическую клетку, где полинуклеотид может быть встроен в геном клетки, а также включает ссылку на транзиентное внедрение полинуклеотида или полипептида в клетку. Выражение «введенный» включает ссылки на способы стабильной или транзиентной трансформации, а также на скрещивание половым путем. Таким образом, выражение «введенный» применительно к вставке полинуклеотида (например, рекомбинантной конструкции/экспрессионной конструкции) в клетку означает «трансфекцию», или «трансформацию», или «трансдукцию» и включает ссылку на встраивание полинуклеотида в эукариотическую клетку, где полинуклеотид может быть встроен в геном клетки (например, хромосомную, плазмидную, пластидную или митохондриальную ДНК), преобразован в автономный репликон или экспрессироваться транзиентно (например, трансфицированная мРНК).The term "introduced" means the delivery of a polynucleotide (eg, construct) or polypeptide into a cell. The expression "introduced" includes reference to the insertion of a polynucleotide into a eukaryotic cell, where the polynucleotide may be inserted into the cell's genome, and also includes a reference to the transient introduction of the polynucleotide or polypeptide into the cell. The expression "introduced" includes references to methods of stable or transient transformation, as well as to sexual interbreeding. Thus, the expression "introduced" in relation to the insertion of a polynucleotide (e.g., recombinant construct/expression construct) into a cell means "transfection" or "transformation" or "transduction" and includes reference to the insertion of the polynucleotide into a eukaryotic cell, where the polynucleotide can be inserted into the genome of the cell (e.g., chromosomal, plasmid, plastid, or mitochondrial DNA), converted into an autonomous replicon, or expressed transient but (for example, transfected mRNA).
Термины «выделенный» или «очищенный» относятся к материалу, который практически или по существу не содержит компоненты, которые обычно сопутствуют ему, как встречается в его нативном состоянии. Как правило, чистоту и однородность определяют с помощью методик аналитической химии, таких как электрофорез в полиакриламидном геле или высокоэффективная жидкостная хроматография. Полипептид, который является преобладающей молекулой, присутствующей в препарате, является практически очищенным. В частности, выделенный полинуклеотид отделяют от открытых рамок считывания, которые фланкируют требуемый ген и кодируют полипептиды, отличные от необходимого полипептида. Термин «очищенный», применяемый в данном документе, обозначает, что полинуклеотид или полипептид дают по существу одну полосу в электрофорезном геле. В частности, это означает, что полинуклеотид или полипептид являются на по меньшей мере 85% чистыми, более предпочтительно на по меньшей мере 95% чистыми и наиболее предпочтительно на по меньшей мере 99% чистыми. Выделенные полинуклеотиды могут быть очищены из клетки-хозяина, в которой они встречаются в природе. Для получения выделенных полинуклеотидов можно применять общепринятые способы очистки нуклеиновых кислот, известные специалистам в данной области техники. Данный термин также охватывает рекомбинантные полинуклеотиды и химически синтезируемые полинуклеотиды.The terms "isolated" or "purified" refer to material that is substantially or essentially free of the components that normally accompany it, as found in its native state. Typically, purity and homogeneity are determined using analytical chemistry techniques such as polyacrylamide gel electrophoresis or high performance liquid chromatography. The polypeptide, which is the predominant molecule present in the formulation, is substantially purified. In particular, the isolated polynucleotide is separated from the open reading frames that flank the desired gene and encode polypeptides other than the desired polypeptide. The term "purified" as used herein means that the polynucleotide or polypeptide yields substantially one band on an electrophoretic gel. In particular, this means that the polynucleotide or polypeptide is at least 85% pure, more preferably at least 95% pure, and most preferably at least 99% pure. Isolated polynucleotides can be purified from the host cell in which they naturally occur. Conventional nucleic acid purification methods known to those skilled in the art can be used to obtain isolated polynucleotides. The term also encompasses recombinant polynucleotides and chemically synthesized polynucleotides.
Термины «модулировать» или «модулирование» относятся к обеспечению или облегчению качественного или количественного изменения, корректировки или модификации способа, пути, функции или активности, представляющих интерес. Без ограничения такое изменение, корректировка или модификация может представлять собой повышение или понижение уровня соответствующего процесса, пути, функции или активности, представляющих интерес. Например, можно модулировать экспрессию гена или экспрессию полипептида или функцию или активность полипептида. Как правило, относительное изменение, корректировку или модификацию определяют посредством сравнения с контролем.The terms "modulate" or "modulating" refer to providing or facilitating a qualitative or quantitative change, adjustment or modification of a method, pathway, function or activity of interest. Without limitation, such a change, adjustment or modification may be an increase or decrease in the level of the corresponding process, pathway, function or activity of interest. For example, gene expression or polypeptide expression or the function or activity of a polypeptide can be modulated. Typically, relative change, adjustment or modification is determined by comparison with a control.
Термин «путь негомологичного соединения концов (NHEJ)», используемый в данном документе, относится к пути, посредством которого происходит репарация двунитевых разрывов в ДНК путем прямого лигирования концов разрывов без необходимости в гомологичной матрице. Независимое от матрицы повторное лигирование концов ДНК посредством NHEJ является стохастическим, подверженным ошибкам процессом репарации, в ходе которого в точку разрыва ДНК вводятся случайные микровставки и микроделеции (вставки/делеции). Данный способ можно применять для преднамеренного разрушения, делеции или корректировки рамки считывания в последовательностях генов-мишеней. Как правило, в ходе NHEJ используются короткие гомологичные ДНК-последовательности, называемые микрогомологами, для направления репарации. Эти микрогомологи часто присутствуют в однонитевых выступах на концах двунитевых разрывов. Если выступы полностью совместимы, то в ходе NHEJ обычно происходит точная репарация разрыва, хотя может иметь место также неточная репарация, приводящая к потере нуклеотидов, однако гораздо более распространены случаи, когда выступы несовместимы.The term "non-homologous end-joining (NHEJ) pathway" as used herein refers to a pathway by which DNA double-strand breaks are repaired by direct ligation of the break ends without the need for a homologous template. Template-independent religation of DNA ends by NHEJ is a stochastic, error-prone repair process in which random microinsertions and microdeletions (inserts/deletions) are introduced at the DNA break point. This method can be used to deliberately destroy, delete or correct the reading frame in the sequences of target genes. Typically, NHEJ uses short homologous DNA sequences called microhomologues to guide repair. These microhomologues are often present in single strand protrusions at the ends of double strand breaks. If the overhangs are perfectly compatible, NHEJ will usually repair the gap accurately, although there may also be inaccurate repair resulting in loss of nucleotides, but it is much more common for the overhangs to be mismatched.
Термин «не встречающийся в природе» описывает объект, такой как полинуклеотид, генетическую мутацию, полипептид, растение, клетку растения и растительный материал, который не образован естественным путем или не существует в природе. Такие не встречающиеся в природе объекты или искусственные объекты можно создать, синтезировать, осуществить их инициацию, модифицировать, подвергнуть вмешательству или манипуляции способами, описанными в данном документе, или которые известны в данной области техники. Такие не встречающиеся в природе объекты или искусственные объекты могут быть созданы, синтезированы, инициированы, модифицированы, подвергнуты вмешательству или манипуляции человеком. Таким образом, в качестве примера, не встречающееся в природе растение, не встречающуюся в природе клетку растения или не встречающийся в природе растительный материал можно создать с применением традиционных методик селекции растений, таких как обратное скрещивание, или с помощью технологий манипуляции с генами, например, с применением антисмысловой РНК, интерферирующей РНК, мегануклеазы и т. п. В качестве дополнительного примера, не встречающееся в природе растение, не встречающуюся в природе клетку растения или не встречающийся в природе растительный материал можно создать посредством интрогрессии или путем переноса одной или более генетических мутаций (например, одного или более полиморфизмов) от первого растения или клетки растения ко второму растению или клетке растения (которые сами по себе могут быть встречающимися в природе), таким образом, что полученное растение, клетка растения или растительный материал или их потомство содержит генетическую структуру (например, геном, хромосому или ее сегмент), которая не образуется естественным путем, или которая не существует в природе. Полученное растение, клетка растения или растительный материал, таким образом, являются искусственными или не встречающимися в природе. Соответственно, искусственные или не встречающиеся в природе растение или клетку растения можно создать путем модификации генетической последовательности в первом встречающемся в природе растении или клетке растения, даже если полученная генетическая последовательность встречается в природе во втором растении или клетке растения, которые содержат генетический фон, отличный от такового у первого растения или клетки растения. В определенных вариантах осуществления мутация не является встречающейся в природе мутацией, которая существует в природе в полинуклеотиде или полипептиде, таких как ген или полипептид. Различия в генетическом фоне можно выявить по фенотипическим различиям или с помощью методик молекулярной биологии, известных из уровня техники, таких как секвенирование полинуклеотида, определение наличия или отсутствия генетических маркеров (например, маркеров, представляющих собой микросателлитные РНК).The term "non-naturally occurring" describes an entity such as a polynucleotide, genetic mutation, polypeptide, plant, plant cell, and plant material that is not naturally occurring or does not exist in nature. Such non-naturally occurring objects or artificial objects can be created, synthesized, initiated, modified, tampered with or manipulated in the ways described herein or as known in the art. Such non-naturally occurring objects or man-made objects can be created, synthesized, initiated, modified, tampered with or manipulated by humans. Thus, by way of example, a non-naturally occurring plant, non-naturally occurring plant cell, or non-naturally occurring plant material can be generated using conventional plant breeding techniques such as backcrossing, or gene manipulation techniques such as antisense RNA, interfering RNA, meganuclease, etc. As a further example, a non-naturally occurring plant, non-naturally occurring plant cell, or non-naturally occurring plant material can be generated by and or by transferring one or more genetic mutations (e.g., one or more polymorphisms) from a first plant or plant cell to a second plant or plant cell (which may themselves be naturally occurring), such that the resulting plant, plant cell, or plant material, or progeny thereof, contains a genetic structure (e.g., genome, chromosome, or segment thereof) that does not occur naturally, or that does not exist in nature. The resulting plant, plant cell or plant material is thus artificial or not naturally occurring. Accordingly, an artificial or non-naturally occurring plant or plant cell can be created by modifying a genetic sequence in a first naturally occurring plant or plant cell, even if the resulting genetic sequence occurs naturally in a second plant or plant cell that contains a different genetic background from that of the first plant or plant cell. In certain embodiments, the mutation is not a naturally occurring mutation that occurs naturally in a polynucleotide or polypeptide, such as a gene or polypeptide. Differences in genetic background can be detected by phenotypic differences or by molecular biology techniques known in the art, such as polynucleotide sequencing, determining the presence or absence of genetic markers (eg microsatellite RNA markers).
Термины «олигонуклеотид» или «полинуклеотид» означают по меньшей мере два нуклеотида, ковалентно связанных вместе. Описание отдельной нити также определяет последовательность комплементарной нити. Таким образом, полинуклеотид также охватывает нить, комплементарную описанной отдельной нити. Многие варианты полинуклеотида могут использоваться для той же цели, что и указанный полинуклеотид. Таким образом, полинуклеотид также охватывает практически идентичные полинуклеотиды и комплементарные им последовательности. Отдельная нить представляет собой зонд, который может гибридизироваться с данной последовательностью в жестких условиях гибридизации. Таким образом, полинуклеотид также охватывает зонд, который гибридизируется в жестких условиях гибридизации. Полинуклеотиды могут быть однонитевыми или двунитевыми или могут содержать части как двунитевой, так и однонитевой последовательности. Полинуклеотид может представлять собой ДНК, как геномную, так и кДНК, РНК или гибридную молекулу, где полинуклеотид может содержать комбинации дезоксирибо- и рибонуклеотидов, а также комбинации оснований, в том числе урацила, аденина, тимина, цитозина, гуанина, инозина, ксантина, гипоксантина, изоцитозина и изогуанина. Полинуклеотиды можно получать с помощью способов химического синтеза или с помощью рекомбинантных способов. The terms "oligonucleotide" or "polynucleotide" means at least two nucleotides covalently linked together. The description of an individual strand also defines the sequence of the complementary strand. Thus, the polynucleotide also spans a strand complementary to the single strand described. Many variants of the polynucleotide can be used for the same purpose as the specified polynucleotide. Thus, a polynucleotide also encompasses substantially identical polynucleotides and their complementary sequences. A single strand is a probe that can hybridize to a given sequence under stringent hybridization conditions. Thus, the polynucleotide also encompasses a probe that hybridizes under stringent hybridization conditions. Polynucleotides may be single or double stranded, or may contain portions of both double and single stranded sequences. The polynucleotide may be DNA, either genomic or cDNA, RNA, or a hybrid molecule, where the polynucleotide may contain combinations of deoxyribo- and ribonucleotides, as well as combinations of bases, including uracil, adenine, thymine, cytosine, guanine, inosine, xanthine, hypoxanthine, isocytosine, and isoguanine. Polynucleotides can be produced by chemical synthesis methods or by recombinant methods.
Специфичность однонитевой ДНК в отношении гибридизации с комплементарными фрагментами определяется «жесткостью» условий реакции (Sambrook et al., Molecular Cloning and Laboratory Manual, Second Ed., Cold Spring Harbor (1989)). Жесткость гибридизации повышается по мере понижения склонности к образованию ДНК-дуплексов. При реакциях гибридизации полинуклеотидов жесткость можно выбирать таким образом, чтобы содействовать реакциям гибридизации, характеризующимся специфичностью (высокая жесткость), которые можно применять для идентификации, например, клонов полной длины из библиотеки. Реакции гибридизации, характеризующиеся меньшей специфичностью (низкая жесткость), можно применять для идентификации родственных, но не точно соответствующих (гомологичных, но не идентичных) молекул или сегментов ДНК. ДНК-дуплексы стабилизируют посредством (1) определенного числа комплементарных пар оснований; (2) определенного типа пар оснований; (3) концентрации солей (ионной силы) в реакционной смеси; (4) температуры реакции и (5) присутствия определенных органических растворителей, таких как формамид, которые понижают стабильность ДНК-дуплекса. Обычно чем длиннее зонд, тем выше температура, необходимая для надлежащего отжига. Общепринятый подход заключается в изменении температуры; более высокие относительные температуры приводят к более жестким условиям реакции. Для гибридизации в «жестких условиях» описаны протоколы гибридизации, в которых полинуклеотиды, на по меньшей мере 60% гомологичные друг другу, остаются гибридизированными. Обычно жесткие условия выбирают таким образом, чтобы температура была приблизительно на 5°C ниже, чем температура точки плавления (Tm) для конкретной последовательности при определенных значениях ионной силы и рН. Tm представляет собой температуру (при определенных значениях ионной силы, рН и концентрации полинуклеотида), при которой 50% зондов комплементарно данной последовательности, гибридизируются с данной последовательностью в равновесном состоянии. Поскольку данные последовательности обычно присутствуют в избытке, то при Tm 50% зондов заняты в равновесном состоянии.The specificity of single-stranded DNA for hybridization with complementary fragments is determined by the "stringency" of the reaction conditions (Sambrook et al ., Molecular Cloning and Laboratory Manual, Second Ed., Cold Spring Harbor (1989)). The rigidity of hybridization increases as the propensity to form DNA duplexes decreases. In polynucleotide hybridization reactions, stringency can be chosen to promote specificity (high stringency) hybridization reactions that can be used to identify, for example, full length clones from a library. Hybridization reactions with less specificity (low stringency) can be used to identify related but not exactly matching (homologous but not identical) DNA molecules or segments. DNA duplexes are stabilized by (1) a certain number of complementary base pairs; (2) a certain type of base pairs; (3) concentration of salts (ionic strength) in the reaction mixture; (4) the reaction temperature; and (5) the presence of certain organic solvents, such as formamide, which reduce the stability of the DNA duplex. Generally, the longer the probe, the higher the temperature required for proper annealing. The generally accepted approach is to change the temperature; higher relative temperatures lead to more severe reaction conditions. For "stringent conditions" hybridization, hybridization protocols have been described in which polynucleotides with at least 60% homology to one another remain hybridized. Generally, stringent conditions are chosen such that the temperature is approximately 5° C. lower than the melting point (Tm) temperature for a particular sequence at certain ionic strengths and pH. Tm is the temperature (at certain values of ionic strength, pH, and polynucleotide concentration) at which 50% of probes complementary to a given sequence hybridize to that sequence at equilibrium. Since these sequences are usually present in excess, at Tm 50% of the probes are occupied in the equilibrium state.
«Жесткие условия гибридизации» представляют собой условия, которые позволяют зонду, праймеру или олигонуклеотиду гибридизироваться только со своей конкретной последовательностью. Жесткие условия зависят от последовательности и будут различаться. Жесткие условия как правило включают: (1) низкую ионную силу и промывки при высокой температуре, например 15 мМ хлорида натрия, 1,5 мМ цитрата натрия, 0,1% додецилсульфата натрия при 50°C; (2) присутствие денатурирующего средства во время гибридизации, например 50% (об./об.) формамида, 0,1% бычьего сывороточного альбумина, 0,1% фиколла, 0,1% поливинилпирролидона, 50 мМ натрий-фосфатного буфера (750 мМ хлорида натрия, 75 мМ цитрата натрия; pH 6,5) при 42°C или (3) присутствие 50% формамида. Как правило, промывки также предусматривают 5 x SSC (0,75 M NaCl, 75 мМ цитрата натрия), 50 мМ фосфат натрия (pH 6,8), 0,1% пирофосфат натрия, 5 x раствор Денхардта, ДНК из молок лососевых рыб, подвергнутую ультразвуковой обработке (50 мкг/мл), 0,1% SDS и 10% сульфат декстрана при 42°C с промывкой при 42°C в 0,2 x SSC (хлорид натрия/цитрат натрия) и 50% формамиде при 55°C и последующей промывкой в условиях высокой жесткости, предусматривающей 0,1 x SSC, содержащий EDTA, при 55°C. Предпочтительно, условия являются такими, что последовательности, гомологичные друг другу на по меньшей мере приблизительно 65%, 70%, 75%, 85%, 90%, 95%, 98% или 99%, обычно остаются гибридизированными друг с другом."Stringent hybridization conditions" are conditions that allow a probe, primer, or oligonucleotide to hybridize only to its particular sequence. Stringent conditions are sequence dependent and will vary. Stringent conditions typically include: (1) low ionic strength and high temperature washes, eg 15 mM sodium chloride, 1.5 mM sodium citrate, 0.1% sodium dodecyl sulfate at 50°C; (2) the presence of a denaturing agent during hybridization, e.g. 50% (v/v) formamide, 0.1% bovine serum albumin, 0.1% ficoll, 0.1% polyvinylpyrrolidone, 50 mM sodium phosphate buffer (750 mM sodium chloride, 75 mM sodium citrate; pH 6.5) at 42°C, or (3) the presence of 50% formamide. Typically, washes also include 5 x SSC (0.75 M NaCl, 75 mM sodium citrate), 50 mM sodium phosphate (pH 6.8), 0.1% sodium pyrophosphate, 5 x Denhardt's solution, sonicated salmon milt DNA (50 µg/mL), 0.1% SDS, and 10% dextran sulfate at 42° C. washing at 42° C. in 0.2 x SSC (sodium chloride/sodium citrate) and 50% formamide at 55° C. followed by a high stringency wash with 0.1 x SSC containing EDTA at 55° C. Preferably, conditions are such that sequences that are at least about 65%, 70%, 75%, 85%, 90%, 95%, 98%, or 99% homologous to each other typically remain hybridized to each other.
При «условиях умеренной жесткости» используют растворы для промывки и условия гибридизации, которые являются менее жесткими, такими, что полинуклеотид гибридизируется со всем рассматриваемым полинуклеотидом, его фрагментами, производными или аналогами. Один пример предусматривает гибридизацию в 6 x SSC, 5 x растворе Денхардта, 0,5% SDS и 100 мкг/мл денатурированной ДНК из молок лососевых рыб при 55°C с последующими одной или более промывками в 1 × SSC, 0,1% SDS при 37°C. Температуру, ионную силу и т. д. можно регулировать для обеспечения соответствия экспериментальным факторам, таким как длина зонда. Были описаны другие условия умеренной жесткости (см. Ausubel et al., Current Protocols in Molecular Biology, Volumes 1-3, John Wiley & Sons, Inc., Hoboken, N.J. (1993); Kriegler, Gene Transfer and Expression: A Laboratory Manual, Stockton Press, New York, N.Y. (1990); Perbal, A Practical Guide to Molecular Cloning, 2nd edition, John Wiley & Sons, New York, N.Y. (1988)).Under "moderate stringency conditions", wash solutions and hybridization conditions are used that are less stringent, such that the polynucleotide hybridizes to all of the polynucleotide in question, its fragments, derivatives, or analogs. One example involves hybridization in 6x SSC, 5x Denhardt's solution, 0.5% SDS and 100 μg/ml denatured DNA from salmon milt at 55°C followed by one or more washes in 1x SSC, 0.1% SDS at 37°C. Temperature, ionic strength, etc. can be adjusted to match experimental factors such as probe length. Other conditions of moderate stringency have been described (see Ausubel et al., Current Protocols in Molecular Biology, Volumes 1-3, John Wiley & Sons, Inc., Hoboken, N.J. (1993); Kriegler, Gene Transfer and Expression: A Laboratory Manual, Stockton Press, New York, N.Y. (1990); Perbal, A Practical Guide to Molecular Cloning, 2nd edition, John Wiley & Sons, New York, N. Y. (1988)).
При «условиях низкой жесткости» используют растворы для промывки и условия гибридизации, которые являются менее жесткими, чем таковые в случае умеренной жесткости, такие, что полинуклеотид гибридизируется со всем рассматриваемым полинуклеотидом, его фрагментами, производными или аналогами. Неограничивающий пример условий гибридизации низкой жесткости предусматривает гибридизацию в 35% формамиде, 5 x SSC, 50 мМ Tris-HCl (pH 7,5), 5 мМ EDTA, 0,02% PVP, 0,02% фиколле, 0,2% BSA, 100 мкг/мл денатурированной ДНК из молок лососевых рыб, 10% (вес/об.) сульфате декстрана при 40°C с последующими одной или более промывками в 2 x SSC, 25 мМ Tris-HCl (pH 7,4), 5 мМ EDTA и 0,1% SDS при 50°C. Хорошо описаны другие условия низкой жесткости, такие как условия для вариантов межвидовой гибридизации (см. Ausubel et al., 1993; Kriegler, 1990)."Low stringency conditions" use wash solutions and hybridization conditions that are less stringent than those for moderate stringency, such that the polynucleotide hybridizes to all of the polynucleotide in question, its fragments, derivatives, or analogs. A non-limiting example of low stringency hybridization conditions is hybridization in 35% formamide, 5 x SSC, 50 mM Tris-HCl (pH 7.5), 5 mM EDTA, 0.02% PVP, 0.02% ficolle, 0.2% BSA, 100 μg/ml denatured DNA from salmon milt, 10% (w/v) sulf those of dextran at 40°C followed by one or more washes in 2 x SSC, 25 mm Tris-HCl (pH 7.4), 5 mm EDTA and 0.1% SDS at 50°C. Other conditions of low stringency are well described, such as conditions for interspecific hybridization variants (see Ausubel et al., 1993; Kriegler, 1990).
Термин «функционально связанный» означает, что экспрессия гена находится под контролем промотора, с которым он пространственно соединен. Промотор может быть расположен в 5'-направлении (выше) или 3'-направлении (ниже) от гена, который находится под его контролем. Расстояние между промотором и геном может быть примерно таким же, как расстояние между этим промотором и геном, который он контролирует, в гене, из которого получен промотор. Как известно из уровня техники, изменение этого расстояния можно согласованно осуществлять без потери функции промотора. Термин «функционально связанный» относится к ассоциации фрагментов полинуклеотида в одном фрагменте таким образом, что функция одного регулируется другим. Например, промотор функционально связан с фрагментом полинуклеотида, если он способен регулировать транскрипцию данного фрагмента полинуклеотида.The term "operably linked" means that the expression of a gene is under the control of the promoter to which it is spatially linked. A promoter may be located 5' (above) or 3' (below) from a gene that is under its control. The distance between a promoter and a gene may be about the same as the distance between that promoter and the gene it controls in the gene from which the promoter is derived. As is known in the art, changing this distance can be done in concert without loss of promoter function. The term "operably linked" refers to the association of polynucleotide fragments in one fragment in such a way that the function of one is regulated by the other. For example, a promoter is operably linked to a polynucleotide fragment if it is capable of regulating transcription of that polynucleotide fragment.
Термин «растение» относится к любому растению на любой стадии его жизненного цикла или развития и его потомкам. В одном варианте осуществления растение представляет собой растение табака, которое относится к растению, принадлежащему к роду Nicotiana. Термин включает ссылку на целые растения, органы растения, ткани растения, ростки растения, семена растения и клетки растения и их потомство. Клетки растения включают без ограничения клетки из семян, суспензионных культур, зародышей, меристематических участков, каллюсной ткани, листьев, корней, побегов, гаметофитов, спорофитов, пыльцы и микроспор. Подходящие виды, сорта, гибриды и разновидности растений табака описаны в данном документе.The term "plant" refers to any plant at any stage of its life cycle or development and its descendants. In one embodiment, the plant is a tobacco plant that belongs to a plant belonging to the genus Nicotiana. The term includes reference to whole plants, plant organs, plant tissues, plant shoots, plant seeds, and plant cells and their progeny. Plant cells include, without limitation, cells from seeds, suspension cultures, embryos, meristematic sites, callus tissue, leaves, roots, shoots, gametophytes, sporophytes, pollen, and microspores. Suitable species, cultivars, hybrids and varieties of tobacco plants are described herein.
Термины «полинуклеотид», «полинуклеотидная последовательность» или «полинуклеотидный фрагмент» используются в данном документе взаимозаменяемо и относятся к полимеру из РНК или ДНК, который является одно- или двунитевым и необязательно содержит синтетические, неприродные или скорректированные нуклеотидные основания. Нуклеотиды (обычно находящиеся в форме их 5'-монофосфата) обозначают с помощью их однобуквенных обозначений следующим образом: «А» для аденилата или дезоксиаденилата (соответственно для РНК или ДНК), «C» для цитидилата или дезоксицитидилата, «G» для гуанилата или дезоксигуанилата, «U» для уридилата, «T» для дезокситимидилата, «R» для пуринов (A или G), «Y» для пиримидинов (C или T), «K» для G или T, «H» для A, или С, или Т, «I» для инозина и «N» для любого нуклеотида. Полинуклеотид может представлять собой без ограничения геномную ДНК, комплементарную ДНК (кДНК), мРНК или антисмысловую РНК или их фрагмент(фрагменты). Кроме того, полинуклеотид может быть однонитевым или двунитевым, смесью однонитевых и двунитевых участков, гибридной молекулой, содержащей ДНК и РНК, или гибридной молекулой со смесью однонитевых и двунитевых участков или их фрагмента(фрагментов). Дополнительно полинуклеотид может быть составлен из трехнитевых участков, содержащих ДНК, РНК или обе, или их фрагмент(фрагменты). Полинуклеотид может содержать одно или более модифицированных оснований, таких как фосфотиоаты, и может представлять собой пептидную нуклеиновую кислоту (PNA). Как правило, полинуклеотиды могут быть собраны из выделенных или клонированных фрагментов кДНК, геномной ДНК, олигонуклеотидов или отдельных нуклеотидов или комбинации вышеперечисленного. Хотя полинуклеотиды, описанные в данном документе, представлены в виде ДНК-последовательностей, полинуклеотиды включают их соответствующие РНК-последовательности и их комплементарные (например, полностью комплементарные) ДНК- или РНК-последовательности, в том числе цепи, обратно комплементарные им. Полинуклеотиды по настоящему изобретению представлены в прилагаемом перечне последовательностей.The terms "polynucleotide", "polynucleotide sequence" or "polynucleotide fragment" are used interchangeably herein and refer to an RNA or DNA polymer that is single or double stranded and optionally contains synthetic, non-natural or adjusted nucleotide bases. Nucleotides (usually in the form of their 5'-monophosphate) are designated by their one-letter designations as follows: "A" for adenylate or deoxyadenylate (respectively for RNA or DNA), "C" for cytidylate or deoxycytidylate, "G" for guanylate or deoxyguanylate, "U" for uridylate, "T" for deoxythymidylate, "R" for pur ines (A or G), "Y" for pyrimidines (C or T), "K" for G or T, "H" for A or C or T, "I" for inosine, and "N" for any nucleotide. The polynucleotide can be, without limitation, genomic DNA, complementary DNA (cDNA), mRNA, or antisense RNA, or fragment(s) thereof. In addition, the polynucleotide may be single or double stranded, a mixture of single and double stranded regions, a hybrid molecule containing DNA and RNA, or a hybrid molecule with a mixture of single and double stranded regions or fragment(s) thereof. Additionally, the polynucleotide may be composed of three-stranded sections containing DNA, RNA, or both, or fragment(s). The polynucleotide may contain one or more modified bases such as phosphothioates and may be a peptide nucleic acid (PNA). Typically, polynucleotides can be assembled from isolated or cloned cDNA fragments, genomic DNA, oligonucleotides, or single nucleotides, or a combination of the above. Although the polynucleotides described herein are presented as DNA sequences, the polynucleotides include their respective RNA sequences and their complementary (eg, fully complementary) DNA or RNA sequences, including their reverse complementary strands. The polynucleotides of the present invention are shown in the accompanying sequence listing.
Термины «полипептид» или «полипептидная последовательность» относятся к полимеру из аминокислот, в котором один или более аминокислотных остатков представляют собой искусственный химический аналог соответствующей встречающейся в природе аминокислоты, а также к встречающимся в природе полимерам из аминокислот. Термины также подразумевают модификации, в том числе без ограничения гликозилирование, присоединение липидов, сульфатирование, гамма-карбоксилирование остатков глутаминовой кислоты, гидроксилирование и ADP-рибозилирование. Полипептиды по настоящему изобретению представлены в прилагаемом перечне последовательностей.The terms "polypeptide" or "polypeptide sequence" refer to a polymer of amino acids in which one or more amino acid residues are an artificial chemical analogue of a corresponding naturally occurring amino acid, as well as to naturally occurring polymers of amino acids. The terms also include modifications including, but not limited to, glycosylation, lipid addition, sulfation, gamma-carboxylation of glutamic acid residues, hydroxylation, and ADP-ribosylation. The polypeptides of the present invention are presented in the attached sequence listing.
Термин «промотор» означает синтетическую или полученную природным способом молекулу, которая способна обеспечивать, активировать или усиливать экспрессию полинуклеотида в клетке. Термин относится к элементу/последовательности полинуклеотида, расположенным, как правило, выше по последовательности и функционально связанным с фрагментом двунитевого полинуклеотида. Промоторы могут быть получены целиком из участков вблизи нативного гена, представляющего интерес, или могут состоять из разных элементов, полученных из разных нативных промоторов или сегментов синтетического полинуклеотида. Промотор может содержать одну или более специфических последовательностей, регулирующих транскрипцию, для дополнительного усиления экспрессии и/или корректировки экспрессии пространственно и/или по времени. Промотор может также содержать дистальные энхансерные или репрессорные элементы, которые могут быть расположены на расстоянии до несколько тысяч пар оснований от сайта начала транскрипции. Промотор может быть получен из источников, включающих вирусы, бактерии, грибы, растения, насекомых и животных. Промотор может регулировать экспрессию компонента гена конститутивно или дифференциально по отношению к клетке, ткани или органу, в которых происходит экспрессия, или по отношению к стадии развития, на которой происходит экспрессия, или в ответ на внешние стимулы, такие как физиологические нагрузки, патогены, ионы металлов или индуцирующие средства.The term "promoter" means a synthetic or naturally derived molecule that is capable of providing, activating or enhancing the expression of a polynucleotide in a cell. The term refers to an element/sequence of a polynucleotide located, as a rule, higher in sequence and functionally linked to a fragment of a double-stranded polynucleotide. Promoters may be derived entirely from regions near the native gene of interest, or may be composed of different elements derived from different native promoters or synthetic polynucleotide segments. The promoter may contain one or more specific transcription control sequences to further enhance expression and/or adjust expression spatially and/or temporally. The promoter may also contain distal enhancer or repressor elements, which may be located up to several thousand base pairs from the transcription start site. The promoter can be obtained from sources including viruses, bacteria, fungi, plants, insects and animals. A promoter may regulate the expression of a gene component constitutively or differentially with respect to the cell, tissue, or organ in which expression occurs, or with respect to the developmental stage at which expression occurs, or in response to external stimuli such as physiological stresses, pathogens, metal ions, or inducing agents.
Выражения «тканеспецифичный промотор» и «промотор, предпочтительный для определенной ткани», используемые в данном документе взаимозаменяемо, относятся к промотору, который экспрессируется преимущественно, но не обязательно исключительно, в одном органе или ткани, но может экспрессироваться также в одной конкретной клетке. Выражение «промотор, регулируемый в процессе развития» относится к промотору, функция которого определяется событиями, связанными с развитием. Выражение «конститутивный промотор» относится к промотору, который вызывает экспрессию гена в большинстве типов клеток в большинстве случаев. «Индуцируемый промотор» обеспечивает избирательную экспрессию функционально связанной ДНК-последовательности в ответ на присутствие эндогенных или экзогенных стимулов, например, с помощью химических соединений (химических индукторов) или в ответ на сигналы окружающей среды, гормональные, химические сигналы и/или сигналы, связанные с развитием. Примеры индуцируемых или регулируемых промоторов включают промоторы, регулируемые светом, теплом, стрессом, наводнением или засухой, патогенами, фитогормонами, ранениями или химическими веществами, такими как этанол, жасмонат, салициловая кислота или антидоты.The terms "tissue-specific promoter" and "tissue-preferred promoter", used interchangeably herein, refer to a promoter that is predominantly, but not necessarily exclusively, expressed in one organ or tissue, but may also be expressed in one particular cell. The term "developmentally regulated promoter" refers to a promoter whose function is determined by developmental events. The expression "constitutive promoter" refers to a promoter that causes the expression of a gene in most cell types in most cases. An "inducible promoter" provides for selective expression of an operably linked DNA sequence in response to the presence of endogenous or exogenous stimuli, for example, via chemical compounds (chemical inducers) or in response to environmental, hormonal, chemical and/or developmental cues. Examples of inducible or regulated promoters include promoters regulated by light, heat, stress, flood or drought, pathogens, phytohormones, wounds, or chemicals such as ethanol, jasmonate, salicylic acid, or antidotes.
Термин «рекомбинантный», используемый в данном документе, относится к искусственной комбинации из двух в иных обстоятельствах разделенных сегментов последовательности, полученной, например, посредством химического синтеза или посредством манипуляции с выделенными сегментами полинуклеотидов с помощью методик генной инженерии. Термин также включает ссылку на клетку или вектор, которые были модифицированы путем введения гетерологичного полинуклеотида, или клетку, полученную из модифицированной таким образом клетки, но не охватывает корректировку клетки или вектора в результате встречающихся в природе событий (например, в результате спонтанной мутации, естественной трансформации, или трансдукции, или транспозиции), таких как те, которые происходят без преднамеренного вмешательства человека.The term "recombinant" as used herein refers to an artificial combination of two otherwise separated sequence segments, obtained, for example, by chemical synthesis or by manipulation of isolated polynucleotide segments using genetic engineering techniques. The term also includes reference to a cell or vector that has been modified by introducing a heterologous polynucleotide, or a cell derived from a cell so modified, but does not encompass modification of the cell or vector as a result of naturally occurring events (e.g., spontaneous mutation, natural transformation, or transduction, or transposition), such as those that occur without intentional human intervention.
Выражение «рекомбинантная конструкция» относится к комбинации полинуклеотидов, которые обычно не встречаются в природе вместе. Соответственно, рекомбинантная конструкция может содержать регуляторные последовательности и кодирующие последовательности, полученные из разных источников, или регуляторные последовательности и кодирующие последовательности, полученные из одного и того же источника, но расположенные иначе, чем это обычно встречается в природе. Рекомбинантная конструкция может представлять собой рекомбинантную ДНК-конструкцию.The term "recombinant construct" refers to a combination of polynucleotides that do not normally occur together in nature. Accordingly, a recombinant construct may contain regulatory sequences and coding sequences obtained from different sources, or regulatory sequences and coding sequences obtained from the same source but arranged differently than would normally occur in nature. The recombinant construct may be a recombinant DNA construct.
Выражения «регуляторные последовательности» и «регуляторные элементы», используемые в данном документе взаимозаменяемо, относятся к полинуклеотидным последовательностям, расположенным выше (5'-некодирующие последовательности), в пределах или ниже (3'-некодирующие последовательности) кодирующей последовательности, которые влияют на транскрипцию, процессинг или стабильность РНК или на трансляцию связанной кодирующей последовательности. Регуляторные последовательности включают промоторы, лидерные последовательности, регулирующие трансляцию, интроны и распознаваемые последовательности полиаденилирования. Термины «регуляторная последовательность» и «регуляторный элемент» используются в данном документе взаимозаменяемо.The expressions "regulatory sequences" and "regulatory elements", used interchangeably herein, refer to polynucleotide sequences located upstream (5' non-coding sequences), within or downstream (3' non-coding sequences) of a coding sequence that affect the transcription, processing, or stability of an RNA, or the translation of an associated coding sequence. Regulatory sequences include promoters, translational leader sequences, introns, and polyadenylation recognition sequences. The terms "regulatory sequence" and "regulatory element" are used interchangeably herein.
Выражение «сайт-специфичная нуклеаза» относится к ферменту, способному к специфичному распознаванию и расщеплению ДНК-последовательностей. Сайт-специфичная нуклеаза может быть сконструированной. Примеры сконструированных сайт-специфичных нуклеаз включают нуклеазы с «цинковыми пальцами» (ZFN), TAL-эффекторные нуклеазы (TALEN), системы на основе CRISPR/Cas9 и мегануклеазы.The expression "site-specific nuclease" refers to an enzyme capable of specifically recognizing and cleaving DNA sequences. The site-specific nuclease may be engineered. Examples of engineered site-specific nucleases include zinc finger nucleases (ZFNs), TAL effector nucleases (TALENs), CRISPR/Cas9 based systems, and meganucleases.
Термин «табак» используют в собирательном смысле для обозначения табачных культур (например, множества растений табака, выращиваемых в поле, и табака, выращиваемого не методом гидропоники), растений табака и их частей, в том числе без ограничения корней, стеблей, листьев, цветов и семян, подготовленных и/или полученных, как описано в данном документе. Понятно, что термин «табак» относится к растениям Nicotiana tabacum и продуктам из них.The term "tobacco" is used collectively to refer to tobacco crops (e.g., a variety of field-grown and non-hydroponic tobacco plants), tobacco plants, and parts thereof, including but not limited to roots, stems, leaves, flowers, and seeds prepared and/or obtained as described herein. It is understood that the term "tobacco" refers to Nicotiana tabacum plants and products thereof.
Термин «табачные продукты» относится к потребительским табачным продуктам, в том числе, без ограничения, к курительным материалам (например, сигаретам, сигарам и трубочному табаку), нюхательному табаку, жевательному табаку, жевательной резинке и леденцам, а также компонентам, материалам и ингредиентам для производства потребительских табачных продуктов. Предпочтительно, данные табачные продукты производят из листьев и стеблей табака, собранных с табака и нарезанных, высушенных, подвергнутых сушке и/или ферментированных в соответствии с общепринятыми методиками получения табака.The term "tobacco products" refers to consumer tobacco products, including, without limitation, smoking materials (e.g., cigarettes, cigars, and pipe tobacco), snuff, chewing tobacco, chewing gum, and lozenges, and components, materials, and ingredients for the manufacture of consumer tobacco products. Preferably, these tobacco products are made from tobacco leaves and stems harvested from tobacco and cut, dried, dried and/or fermented in accordance with conventional tobacco production techniques.
Выражения «терминатор транскрипции», «последовательности терминации» или «терминатор» относятся к ДНК-последовательностям, расположенным ниже кодирующей последовательности, включающим распознаваемые последовательности полиаденилирования и другие последовательности, кодирующие регуляторные сигналы, способные воздействовать на процессинг мРНК или экспрессию гена. Сигнал полиаденилирования обычно характеризуется осуществлением добавления трактов полиадениловой кислоты на 3'-конец предшественника мРНК.The terms "transcriptional terminator", "termination sequences", or "terminator" refer to DNA sequences downstream of a coding sequence, including recognizable polyadenylation sequences and other sequences encoding regulatory signals capable of affecting mRNA processing or gene expression. The polyadenylation signal is typically characterized by the addition of polyadenylic acid tracts to the 3' end of the mRNA precursor.
Термин «трансгенный» относится к любой клетке, линии клеток, каллюсу, ткани, части растения или растению, геном которых был скорректирован в результате присутствия гетерологичного полинуклеотида, такого как рекомбинантная конструкция, в том числе к исходным трансгенным объектам, а также полученным с помощью процедур полового скрещивания или бесполого размножения из исходного трансгенного объекта. Термин не охватывает корректировку генома (хромосомную или внехромосомную) с помощью общепринятых способов селекции растений или в результате встречающихся в природе событий, таких как случайное перекрестное опыление, инфекция, вызванная нерекомбинантным вирусом, трансформация нерекомбинантными бактериями, нерекомбинантная транспозиция или спонтанная мутация.The term "transgenic" refers to any cell, cell line, callus, tissue, plant part, or plant whose genome has been altered by the presence of a heterologous polynucleotide, such as a recombinant construct, including parental transgenic events, as well as those obtained by sexual crossing or asexual reproduction procedures from the original transgenic event. The term does not cover the adjustment of the genome (chromosomal or extrachromosomal) by conventional plant breeding techniques or by naturally occurring events such as accidental cross-pollination, infection by a non-recombinant virus, transformation by non-recombinant bacteria, non-recombinant transposition, or spontaneous mutation.
Выражение «трансгенное растение» относится к растению, которое содержит в своем геноме один или более гетерологичных полинуклеотидов, т. е. растение, которое содержит рекомбинантный генетический материал, обычно не обнаруживаемый в нем, и который был введен в рассматриваемое растение (или в предков растения) посредством манипуляции, осуществляемой человеком. Например, гетерологичный полинуклеотид может быть стабильно интегрирован в геном таким образом, что полинуклеотид передается последующим поколениям. Гетерологичный полинуклеотид может быть интегрирован в геном отдельно или в виде части рекомбинантной конструкции. Коммерческая разработка генетически улучшенной идиоплазмы также продвинулась к стадии введения в культурные растения нескольких признаков, что часто называют подходом на основе пирамидирования генов. В этом подходе в растение можно ввести несколько генов, придающих разные характеристики, представляющие интерес. Пирамидирование генов можно осуществлять многими способами, в том числе без ограничения путем котрансформации, повторной трансформации и скрещивания линий с разными трансгенами. Таким образом, растение, выращиваемое из клетки растения, в которую рекомбинантную ДНК вводят с помощью трансформации, является трансгенным растением, равно как и все потомство данного растения, которое содержит введенный трансген (полученное как половым, так и бесполым путем). Понятно, что термин «трансгенное растение» охватывает все растение или дерево и части растения или дерева, например зерна, семена, цветы, листья, корни, плоды, пыльцу, стебли и т. п. Каждый гетерологичный полинуклеотид может придавать трансгенному растению отдельный признак.The expression "transgenic plant" refers to a plant which contains in its genome one or more heterologous polynucleotides, i.e. a plant which contains recombinant genetic material not normally found in it, and which has been introduced into the plant in question (or into the plant's ancestors) through human manipulation. For example, a heterologous polynucleotide may be stably integrated into the genome such that the polynucleotide is passed on to subsequent generations. The heterologous polynucleotide may be integrated into the genome alone or as part of a recombinant construct. The commercial development of genetically improved germplasm has also progressed to the stage of introducing several traits into cultivated plants, which is often referred to as the gene pyramiding approach. In this approach, several genes can be introduced into a plant, conferring different characteristics of interest. Gene pyramiding can be accomplished in many ways, including, but not limited to, co-transformation, re-transformation, and crossing lines with different transgenes. Thus, a plant grown from a cell of a plant into which recombinant DNA is introduced by transformation is a transgenic plant, as is all progeny of that plant that contains the introduced transgene (either sexually or asexually). The term "transgenic plant" is understood to encompass the entire plant or tree and parts of the plant or tree, such as grains, seeds, flowers, leaves, roots, fruits, pollen, stems, and the like. Each heterologous polynucleotide can confer a distinct trait on the transgenic plant.
Термин «эффектор, подобный активаторам транскрипции» или «TALE» относится к полипептидной структуре, которая распознает определенную ДНК-последовательность и связывается с ней. Выражение «ДНК-связывающий домен TALE» относится к ДНК-связывающему домену, который содержит массив тандемных повторов из 33-35 аминокислот, также известных как RVD-модули, каждый из которых специфично распознает одну пару оснований ДНК. RVD-модули могут располагаться в любом порядке, собираясь в массив, который распознает определенную последовательность. Специфичность связывания ДНК-связывающего домена TALE определяется массивом RVD, за которым расположен один усеченный повтор из 20 аминокислот. ДНК-связывающий домен TALE может иметь от 12 до 27 RVD-модулей, каждый из которых содержит RVD и распознает одну пару оснований ДНК. Были идентифицированы специфичные RVD, которые распознают каждый из четырех возможных нуклеотидов ДНК (А, Т, С и G). Поскольку ДНК-связывающие домены TALE являются модульными, то повторы, которые распознают четыре разных нуклеотида ДНК, можно соединить друг с другом для распознавания любой конкретной ДНК-последовательности. Эти нацеленные ДНК-связывающие домены можно впоследствии объединить с каталитическими доменами для создания функциональных ферментов, в том числе искусственных факторов транскрипции, метилтрансфераз, интеграз, нуклеаз и рекомбиназ.The term "transcriptional activator-like effector" or "TALE" refers to a polypeptide structure that recognizes and binds to a specific DNA sequence. The term "TALE DNA binding domain" refers to a DNA binding domain that contains an array of 33-35 amino acid tandem repeats, also known as RVD modules, each of which specifically recognizes one DNA base pair. RVD modules can be arranged in any order, gathering in an array that recognizes a certain sequence. The binding specificity of the TALE DNA binding domain is determined by the RVD array followed by a single truncated repeat of 20 amino acids. The DNA binding domain of TALE can have 12 to 27 RVD modules, each containing an RVD and recognizing one DNA base pair. Specific RVDs have been identified that recognize each of the four possible DNA nucleotides (A, T, C and G). Since the DNA binding domains of TALE are modular, the repeats that recognize four different DNA nucleotides can be joined together to recognize any particular DNA sequence. These targeted DNA binding domains can then be combined with catalytic domains to create functional enzymes, including artificial transcription factors, methyltransferases, integrases, nucleases, and recombinases.
Термины «эффекторные нуклеазы, подобные активаторам транскрипции» или «TALEN», используемые в данном документе взаимозаменяемо, относятся к сконструированным слитым полипептидам на основе каталитического домена нуклеазы, такой как эндонуклеаза FokI, и разработанного ДНК-связывающего домена TALE, который может быть нацелен на специально синтезированную ДНК-последовательность.The terms "effector nucleases like transcription activators" or "TALEN", used interchangeably herein, refer to engineered fusion polypeptides based on the catalytic domain of a nuclease, such as Fok I endonuclease, and a designed TALE DNA-binding domain that can be targeted to a specifically synthesized DNA sequence.
Выражение «мономер TALEN» относится к сконструированному слитому полипептиду с каталитическим доменом нуклеазы и разработанным ДНК-связывающим доменом TALE. Два мономера TALEN могут быть разработаны таким образом, чтобы они нацеливались на участок, являющийся мишенью для TALEN, и расщепляли его.The expression "TALEN monomer" refers to an engineered fusion polypeptide with a nuclease catalytic domain and a designed TALE DNA-binding domain. The two TALEN monomers can be designed to target and cleave the TALEN target site.
Термин «трансген» относится к гену или генетическому материалу, содержащему последовательность гена, которые были выделены из одного организма и введены в другой организм. Этот ненативный сегмент ДНК может сохранять способность к обеспечению выработки РНК или полипептида в трансгенном организме или он может обеспечивать корректировку нормальной функции генетического кода трансгенного организма. Введение трансгена имеет потенциал к изменению фенотипа организма.The term "transgene" refers to a gene or genetic material containing a gene sequence that has been isolated from one organism and introduced into another organism. This non-native DNA segment may retain the ability to produce an RNA or polypeptide in the transgenic organism, or it may provide an adjustment to the normal function of the genetic code of the transgenic organism. The introduction of a transgene has the potential to change the phenotype of the organism.
Термин «вариант» по отношению к полинуклеотиду означает: (i) часть или фрагмент полинуклеотида; (ii) последовательность, комплементарную полинуклеотиду или его части; (iii) полинуклеотид, практически идентичный упоминаемому полинуклеотиду или комплементарной ему последовательности; или (iv) полинуклеотид, который гибридизируется в жестких условиях с упоминаемым полинуклеотидом, комплементарной ему последовательностью или практически идентичным ей полинуклеотидом.The term "variant" in relation to a polynucleotide means: (i) a portion or fragment of a polynucleotide; (ii) a sequence complementary to the polynucleotide or a portion thereof; (iii) a polynucleotide substantially identical to said polynucleotide or its complementary sequence; or (iv) a polynucleotide that hybridizes under stringent conditions to said polynucleotide, its complementary sequence, or its substantially identical polynucleotide.
Термин «вариант» по отношению к пептиду или полипептиду означает пептид или полипептид, которые отличаются по последовательности за счет вставки, делеции или консервативной замены аминокислот, но сохраняют по меньшей мере одну биологическую функцию или активность. Вариант также может означать полипептид, который сохраняет по меньшей мере одну биологическую функцию или активность. Консервативную замену аминокислоты, т. е. замещение аминокислоты другой аминокислотой со сходными свойствами (например, степенью гидрофильности и распределением заряженных участков), понимают в данной области техники как обычно включающую незначительное изменение.The term "variant" in relation to a peptide or polypeptide means a peptide or polypeptide that differs in sequence by insertion, deletion or conservative substitution of amino acids, but retains at least one biological function or activity. A variant may also mean a polypeptide that retains at least one biological function or activity. Conservative amino acid substitution, i.e. substitution of an amino acid with another amino acid with similar properties (for example, degree of hydrophilicity and the distribution of charged sites) is understood in the art as generally including little change.
Термин «разновидность» относится к популяции растений, которые обладают постоянными характеристиками, отделяющими их от других растений того же вида. Хотя разновидность обладает одним или более отличительными признаками, она дополнительно характеризуется очень небольшим общим варьированием между особями в пределах этой разновидности. Разновидность часто продается на коммерческой основе.The term "variety" refers to a population of plants that have permanent characteristics that separate them from other plants of the same species. Although a variety has one or more distinguishing characteristics, it is additionally characterized by very little overall variation between individuals within that variety. The variety is often sold commercially.
Термин «вектор» относится к полинуклеотидному средству доставки, которое содержит комбинацию компонентов полинуклеотида для обеспечения транспорта полинуклеотидов, полинуклеотидных конструкций и полинуклеотидных конъюгатов и т. п. Вектор может представлять собой вирусный вектор, бактериофаг, искусственную хромосому бактерий или искусственную хромосому дрожжей. Вектор может представлять собой ДНК- или РНК-вектор. Подходящие векторы включают эписомы, способные к внехромосомной репликации, такие как кольцевые плазмиды из двунитевой нуклеотидной последовательности; линеаризованные плазмиды из двунитевой нуклеотидной последовательности и другие векторы любого происхождения. «Вектор экспрессии», как используется в данном документе, представляет собой полинуклеотидное средство доставки, которое содержит комбинацию компонентов полинуклеотида для обеспечения экспрессии полинуклеотида(полинуклеотидов), полинуклеотидных конструкций и полинуклеотидных конъюгатов и т.п. Подходящие векторы экспрессии включают эписомы, способные к внехромосомной репликации, такие как кольцевые плазмиды из двунитевой нуклеотидной последовательности; линеаризованные плазмиды из двунитевой нуклеотидной последовательности и другие функционально эквивалентные векторы экспрессии любого происхождения. Вектор экспрессии содержит по меньшей мере промотор, расположенный выше по последовательности и функционально связанный с полинуклеотидом, полинуклеотидными конструкциями или полинуклеотидным конъюгатом, как определено ниже.The term "vector" refers to a polynucleotide delivery vehicle that contains a combination of polynucleotide components to transport polynucleotides, polynucleotide constructs and polynucleotide conjugates, etc. The vector can be a viral vector, bacteriophage, bacterial artificial chromosome, or yeast artificial chromosome. The vector may be a DNA or RNA vector. Suitable vectors include episomes capable of extrachromosomal replication, such as double-stranded circular plasmids; linearized plasmids from a double-stranded nucleotide sequence; and other vectors of any origin. An "expression vector" as used herein is a polynucleotide delivery vehicle that contains a combination of polynucleotide components to allow expression of polynucleotide(s), polynucleotide constructs and polynucleotide conjugates, and the like. Suitable expression vectors include episomes capable of extrachromosomal replication, such as double-stranded circular plasmids; linearized plasmids from a double-stranded nucleotide sequence; and other functionally equivalent expression vectors of any origin. The expression vector contains at least a promoter upstream and operably linked to a polynucleotide, polynucleotide constructs, or polynucleotide conjugate, as defined below.
Термин «цинковый палец» относится к структуре полипептида, которая распознает ДНК-последовательности и связывается с ними. Домен с «цинковыми пальцами» является наиболее распространенным ДНК-связывающим мотивом в протеоме человека. Один домен с «цинковыми пальцами» содержит примерно 30 аминокислот и обычно функционирует путем связывания с 3 последовательными парами оснований ДНК посредством взаимодействий боковой цепи одной аминокислоты с каждой парой оснований.The term "zinc finger" refers to a polypeptide structure that recognizes and binds to DNA sequences. The zinc finger domain is the most common DNA-binding motif in the human proteome. One zinc finger domain contains approximately 30 amino acids and typically functions by binding to 3 consecutive base pairs of DNA through single amino acid side chain interactions with each base pair.
Термин «нуклеаза с «цинковыми пальцами»» или «ZFN» относится к химерной молекуле полипептида, содержащей по меньшей мере один ДНК-связывающий домен с «цинковыми пальцами», эффективно связанный с по меньшей мере одной нуклеазой или частью нуклеазы, способной в полностью собранном виде расщеплять ДНК.The term "zinc finger nuclease" or "ZFN" refers to a chimeric polypeptide molecule containing at least one zinc finger DNA-binding domain effectively associated with at least one nuclease or portion of a nuclease capable of cleaving DNA when fully assembled.
Если в данном документе не определено иное, то научные и технические термины, используемые в связи с настоящим раскрытием, будут иметь значения, которые обычно понятны специалистам средней квалификации в данной области техники. Например, любые системы номенклатуры и методики, используемые в связи с культурами клеток или тканей, молекулярной биологией, иммунологией, микробиологией, генетикой и химией полипептида и полинуклеотида, а также гибридизацией, которые описаны в данном документе, хорошо известны и широко применяются в данной области техники. Значение и объем терминов должны быть ясны, однако в случае какой-либо скрытой двусмысленности определения, приведенные в данном документе, имеют преимущественную силу по сравнению с любым словарным или не относящимся к данному документу определением. Кроме того, если иное не требуется по контексту, термины в единственном числе будут включать множественное число, и термины во множественном числе будут включать единственное число.Unless otherwise defined herein, scientific and technical terms used in connection with this disclosure will have the meanings that are commonly understood by those of ordinary skill in the art. For example, any nomenclature systems and techniques used in connection with cell or tissue culture, molecular biology, immunology, microbiology, polypeptide and polynucleotide genetics and chemistry, and hybridization as described herein are well known and widely used in the art. The meaning and scope of the terms should be clear, but in the event of any implicit ambiguity, the definitions given in this document take precedence over any dictionary or non-document definition. In addition, unless otherwise required by context, terms in the singular will include the plural, and terms in the plural will include the singular.
ПолинуклеотидыPolynucleotides
В одном варианте осуществления представлен выделенный полинуклеотид, содержащий, состоящий или по существу состоящий из последовательности, характеризующейся по меньшей мере 60% идентичностью последовательности с любой из последовательностей, описанных в данном документе, включая любой из полинуклеотидов, показанных в перечне последовательностей. Предпочтительно, выделенный полинуклеотид содержит, состоит или по существу состоит из последовательности, характеризующейся по меньшей мере 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 75%, 80%, 85%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95% 96%, 97%, 98%, 99% или 100% идентичностью последовательности с ними. Предпочтительно, полинуклеотид(полинуклеотиды), описанный(описанные) в данном документе, кодирует(кодируют) активный полипептид AAT, который характеризуется уровнем функции или активности, составляющим по меньшей мере приблизительно 50%, 60%, 70%, 80%, 90% 95%, 96%, 97%, 98%, 99%, 100% или больше от таковых полипептида(полипептидов), показанного(показанных) в перечне последовательностей.In one embodiment, an isolated polynucleotide is provided comprising, consisting of, or essentially consisting of a sequence having at least 60% sequence identity with any of the sequences described herein, including any of the polynucleotides shown in the sequence listing. Preferably, the isolated polynucleotide contains, consists of, or essentially consists of a sequence characterized by at least 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 75%, 80%, 85%, 87%, 88%, 89%, 90%, 91%, 92% , 93%, 94%, 95% 96%, 97%, 98%, 99% or 100% sequence identity with them. Preferably, the polynucleotide(s) described herein encode(s) an active AAT polypeptide that has a level of function or activity of at least about 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99%, 100% or more of those of the polypeptide(s) shown(s). ) in the sequence listing.
В другом варианте осуществления представлен выделенный полинуклеотид, содержащий, состоящий или по существу состоящий из полинуклеотида, характеризующегося по меньшей мере 80% идентичностью последовательности с SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13 или SEQ ID NO: 15.In another embodiment, an isolated polynucleotide is provided comprising, consisting of, or essentially consisting of a polynucleotide having at least 80% sequence identity with SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, or SEQ ID NO: 15.
В другом варианте осуществления представлен выделенный полинуклеотид, содержащий, состоящий или по существу состоящий из последовательности, характеризующейся по меньшей мере 80% идентичностью последовательности с SEQ ID NO: 5 или SEQ ID NO: 7.In another embodiment, an isolated polynucleotide is provided comprising, consisting of, or essentially consisting of a sequence having at least 80% sequence identity to SEQ ID NO: 5 or SEQ ID NO: 7.
В определенных вариантах осуществления представлен выделенный полинуклеотид, содержащий, состоящий или по существу состоящий из последовательности, характеризующейся по меньшей мере 80% идентичностью последовательности с SEQ ID NO: 1 или SEQ ID NO: 3.In certain embodiments, an isolated polynucleotide is provided comprising, consisting of, or essentially consisting of a sequence having at least 80% sequence identity with SEQ ID NO: 1 or SEQ ID NO: 3.
Предпочтительно, выделенный полинуклеотид(полинуклеотиды) содержит, состоит или по существу состоит из последовательности, характеризующейся по меньшей мере приблизительно 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95% 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9% или 100% идентичностью последовательности с SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13 или SEQ ID NO: 15.Preferably, the isolated polynucleotide(s) comprises, consists of, or essentially consists of a sequence characterized by at least about 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95% 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.3 %, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% or 100% sequence identity with SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, or SEQ ID NO: 15.
Предпочтительно, выделенный полинуклеотид(полинуклеотиды) содержит, состоит из или по существу состоит из последовательности, характеризующейся по меньшей мере приблизительно 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95% 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9% или 100% идентичностью последовательности с SEQ ID NO: 5 или SEQ ID NO: 7.Preferably, the isolated polynucleotide(s) comprises, consists of, or essentially consists of a sequence characterized by at least about 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95% 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99, 3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% or 100% sequence identity with SEQ ID NO: 5 or SEQ ID NO: 7.
Предпочтительно, выделенный полинуклеотид(полинуклеотиды) содержит, состоит из или по существу состоит из последовательности, характеризующейся по меньшей мере приблизительно 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95% 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9% или 100% идентичностью последовательности с SEQ ID NO: 1 или SEQ ID NO: 3.Preferably, the isolated polynucleotide(s) comprises, consists of, or essentially consists of a sequence characterized by at least about 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95% 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99, 3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% or 100% sequence identity with SEQ ID NO: 1 or SEQ ID NO: 3.
В другом варианте осуществления представлены полинуклеотиды, содержащие, состоящие или по существу состоящие из полинуклеотидов с существенной степенью гомологии (т. е. сходством последовательности) или существенной степенью идентичности с SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13 или SEQ ID NO: 15.In another embodiment, polynucleotides are provided comprising, consisting of, or essentially consisting of polynucleotides with a significant degree of homology (i.e., sequence similarity) or a significant degree of identity with SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, or SEQ ID NO: 15.
В другом варианте осуществления представлены полинуклеотиды, содержащие, состоящие или по существу состоящие из полинуклеотидов с существенной степенью гомологии (т. е. сходством последовательности) или существенной степенью идентичности с SEQ ID NO: 5 или SEQ ID NO: 7.In another embodiment, polynucleotides are provided that contain, consist of, or essentially consist of polynucleotides with a significant degree of homology (i.e., sequence similarity) or a significant degree of identity with SEQ ID NO: 5 or SEQ ID NO: 7.
В другом варианте осуществления представлены полинуклеотиды, содержащие, состоящие или по существу состоящие из полинуклеотидов с существенной степенью гомологии (т.е. сходством последовательности) или существенной степенью идентичности с SEQ ID NO: 1 или SEQ ID NO: 3.In another embodiment, polynucleotides are provided that contain, consist of, or essentially consist of polynucleotides with a significant degree of homology (i.e., sequence similarity) or a significant degree of identity with SEQ ID NO: 1 or SEQ ID NO: 3.
В другом варианте осуществления предусмотрены фрагменты SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13 или SEQ ID NO: 15 с существенной степенью гомологии (т.е. сходством последовательности) или существенной степенью идентичности с ними, характеризующиеся по меньшей мере приблизительно 80%, 85%, 86% 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95% 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9% или 100% идентичностью последовательности с соответствующими фрагментами SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13 или SEQ ID NO: 15.In another embodiment, fragments of SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, or SEQ ID NO: 15 are provided with a significant degree of homology (i.e., sequence similarity) or a significant degree of identity with them, characterized by at least about 80%, 85%, 86% 87% 88% 89% 90% 91% 92% 93% 94% 95% 96% 97% 98% 99% 99.1% 99.2% 99.3% 99.4% 99.5% 99.6% 99.7% 99.8% 99 9% or 100% sequence identity with the corresponding fragments of SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13 or SEQ ID NO: 15.
В другом варианте осуществления представлены фрагменты SEQ ID NO: 5 или SEQ ID NO: 7 с существенной степенью гомологии (т. е. сходством последовательности) или существенной степенью идентичности с ними, характеризующиеся по меньшей мере приблизительно 80%, 85%, 86% 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95% 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9% или 100% идентичностью последовательности с соответствующими фрагментами SEQ ID NO: 5 или SEQ ID NO: 7.In another embodiment, fragments of SEQ ID NO: 5 or SEQ ID NO: 7 are provided with a significant degree of homology (i.e., sequence similarity) or a significant degree of identity with them, characterized by at least about 80%, 85%, 86% 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95% 96%, 97 %, 98%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% or 100% sequence identity with the corresponding fragments of SEQ ID NO: 5 or SEQ ID NO: 7.
В другом варианте осуществления представлены фрагменты SEQ ID NO: 1 или SEQ ID NO: 3 с существенной степенью гомологии (т.е. сходством последовательности) или существенной степенью идентичности с ними, характеризующиеся по меньшей мере приблизительно 80%, 85%, 86% 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95% 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9% или 100% идентичностью последовательности с соответствующими фрагментами SEQ ID NO: 1 или SEQ ID NO: 3.In another embodiment, fragments of SEQ ID NO: 1 or SEQ ID NO: 3 are provided with a significant degree of homology (i.e., sequence similarity) or a significant degree of identity with them, characterized by at least about 80%, 85%, 86% 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95% 96%, 97% , 98%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% or 100% sequence identity with the corresponding fragments of SEQ ID NO: 1 or SEQ ID NO: 3.
В другом варианте осуществления представлены полинуклеотиды, предусматривающие достаточную или существенную степень идентичности или сходства с SEQ ID NO: 5 или SEQ ID NO: 7, которые кодируют полипептид, который выполняет функцию AAT.In another embodiment, polynucleotides are provided that have a sufficient or substantial degree of identity or similarity to SEQ ID NO: 5 or SEQ ID NO: 7 that encode a polypeptide that functions as an AAT.
В другом варианте осуществления представлены полинуклеотиды, предусматривающие достаточную или существенную степень идентичности или сходства с SEQ ID NO: 1 или SEQ ID NO: 3, которые кодируют полипептид, который выполняет функцию AAT.In another embodiment, polynucleotides are provided that have a sufficient or substantial degree of identity or similarity to SEQ ID NO: 1 or SEQ ID NO: 3 that encode a polypeptide that performs the function of an AAT.
В другом варианте осуществления представлены полинуклеотиды, предусматривающие достаточную или существенную степень идентичности или сходства с SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13 или SEQ ID NO: 15, которые кодируют полипептид, который функционирует как AAT.In another embodiment, polynucleotides are provided that provide a sufficient or substantial degree of identity or similarity to SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, or SEQ ID NO: 15 that encode a polypeptide that functions as an AAT.
В другом варианте осуществления представлены полинуклеотиды, предусматривающие достаточную или существенную степень идентичности или сходства с SEQ ID NO: 5 или SEQ ID NO: 7, которые кодируют полипептид, который выполняет функцию AAT.In another embodiment, polynucleotides are provided that have a sufficient or substantial degree of identity or similarity to SEQ ID NO: 5 or SEQ ID NO: 7 that encode a polypeptide that functions as an AAT.
В другом варианте осуществления представлены полинуклеотиды, предусматривающие достаточную или существенную степень идентичности или сходства с SEQ ID NO: 1 или SEQ ID NO: 3, которые кодируют полипептид, который выполняет функцию AAT.In another embodiment, polynucleotides are provided that have a sufficient or substantial degree of identity or similarity to SEQ ID NO: 1 or SEQ ID NO: 3 that encode a polypeptide that performs the function of an AAT.
В другом варианте осуществления представлен полимер, представляющий собой полинуклеотид, который содержит, состоит или по существу состоит из полинуклеотида, обозначенного в данном документе как SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13 или SEQ ID NO: 15.In another embodiment, a polymer is provided that is a polynucleotide that comprises, consists of, or essentially consists of, the polynucleotide referred to herein as SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, or SEQ ID NO: 15.
В другом варианте осуществления представлен полимер, представляющий собой полинуклеотид, который содержит, состоит или по существу состоит из полинуклеотида, обозначенного в данном документе как SEQ ID NO: 5 или SEQ ID NO: 7.In another embodiment, a polymer is provided that is a polynucleotide that contains, consists of, or essentially consists of, a polynucleotide referred to herein as SEQ ID NO: 5 or SEQ ID NO: 7.
В другом варианте осуществления представлен полимер, представляющий собой полинуклеотид, который содержит, состоит или по существу состоит из полинуклеотида, обозначенного в данном документе как SEQ ID NO: 1 или SEQ ID NO: 3. In another embodiment, a polymer is provided that is a polynucleotide that contains, consists of, or essentially consists of, a polynucleotide referred to herein as SEQ ID NO: 1 or SEQ ID NO: 3.
Предпочтительно, полинуклеотиды, описанные в данном документе, кодируют полипептид AAT.Preferably, the polynucleotides described herein encode an AAT polypeptide.
Как описано в данном документе, NtAAT2-S (SEQ ID NO: 1) и NtAAT2-T (SEQ ID NO: 3) являются генами, экспрессируемыми на наиболее высоком уровне, после 48 часов сушки по сравнению с зелеными табачными листьями. Уровень экспрессии может быть в 2, 3, 4, 5, 6, 7, 8, 9, 10 или 11 раз большим, чем у зеленых табачных листьев. Применение NtAAT2-S (SEQ ID NO: 1) и NtAAT2-T (SEQ ID NO: 3) является предпочтительным в определенных вариантах осуществления настоящего изобретения. Полинуклеотид может включать полимер из нуклеотидов, который может представлять собой немодифицированную или модифицированную дезоксирибонуклеиновую кислоту (ДНК) или рибонуклеиновую кислоту (РНК). Соответственно, полинуклеотид может представлять собой без ограничения геномную ДНК, комплементарную ДНК (кДНК), мРНК, или антисмысловую РНК, или их фрагмент(фрагменты). Кроме того, полинуклеотид может представлять собой однонитевую или двунитевую ДНК, ДНК, которая является смесью однонитевых и двунитевых участков, гибридную молекулу, содержащую ДНК и РНК, или гибридную молекулу со смесью однонитевых и двунитевых участков или их фрагмента(фрагментов). Дополнительно полинуклеотид может быть составлен из трехнитевых участков, содержащих ДНК, РНК или обе, или их фрагмент(фрагменты). Полинуклеотид может содержать одно или более модифицированных оснований, таких как фосфоротиоаты, и может представлять собой пептидную нуклеиновую кислоту. Как правило, полинуклеотиды могут быть собраны из выделенных или клонированных фрагментов кДНК, геномной ДНК, олигонуклеотидов или отдельных нуклеотидов или комбинации вышеперечисленного. Хотя полинуклеотиды, описанные в данном документе, представлены в виде ДНК-последовательностей, они включают их соответствующие РНК-последовательности и их комплементарные (например, полностью комплементарные) ДНК- или РНК-последовательности, в том числе обратно комплементарные им последовательности.As described herein, NtAAT2-S (SEQ ID NO: 1) and NtAAT2-T (SEQ ID NO: 3) are the genes expressed at the highest level after 48 hours of drying compared to green tobacco leaves. The expression level can be 2, 3, 4, 5, 6, 7, 8, 9, 10 or 11 times that of green tobacco leaves. The use of NtAAT2-S (SEQ ID NO: 1) and NtAAT2-T (SEQ ID NO: 3) is preferred in certain embodiments of the present invention. The polynucleotide may include a polymer of nucleotides, which may be unmodified or modified deoxyribonucleic acid (DNA) or ribonucleic acid (RNA). Accordingly, a polynucleotide may be, without limitation, genomic DNA, complementary DNA (cDNA), mRNA, or antisense RNA, or fragment(s) thereof. In addition, the polynucleotide can be single or double stranded DNA, DNA that is a mixture of single and double stranded regions, a hybrid molecule containing DNA and RNA, or a hybrid molecule with a mixture of single and double stranded regions or fragment(s) thereof. Additionally, the polynucleotide may be composed of three-stranded sections containing DNA, RNA, or both, or fragment(s). The polynucleotide may contain one or more modified bases such as phosphorothioates and may be a peptidic nucleic acid. Typically, polynucleotides can be assembled from isolated or cloned cDNA fragments, genomic DNA, oligonucleotides, or single nucleotides, or a combination of the above. Although the polynucleotides described herein are presented as DNA sequences, they include their respective RNA sequences and their complementary (eg, fully complementary) DNA or RNA sequences, including their reverse complementary sequences.
Полинуклеотид обычно содержит фосфодиэфирные связи, хотя в некоторых случаях включены полинуклеотидные аналоги, которые могут иметь альтернативные остовы, содержащие, например, фосфороамидатные, фосфоротиоатные, фосфородитиоатные или О-метилфосфороамидитные связи; и пептидные остовы полинуклеотидов и связи. Другие аналоги полинуклеотидов включают полинуклеотиды с положительно заряженными остовами, неионогенными остовами и безрибозными остовами. Модификации рибозофосфатного остова можно осуществлять по целому ряду причин, например, для повышения стабильности и периода полужизни таких молекул в физиологических средах или в качестве зондов на биочипе. Можно получать смеси встречающихся в природе полинуклеотидов и аналогов; в качестве альтернативы, можно получать смеси разных аналогов полинуклеотидов и смеси природных полинуклеотидов и аналогов.The polynucleotide typically contains phosphodiester linkages, although in some cases polynucleotide analogs are included which may have alternative backbones containing, for example, phosphoramidate, phosphorothioate, phosphorodithioate, or O-methylphosphoroamidite linkages; and peptide backbones of polynucleotides and bonds. Other polynucleotide analogs include those with positively charged backbones, non-ionic backbones, and non-ribose backbones. Modifications of the ribose phosphate backbone can be carried out for a variety of reasons, for example, to increase the stability and half-life of such molecules in physiological media or as probes on a biochip. You can get mixtures of naturally occurring polynucleotides and analogues; alternatively, mixtures of different polynucleotide analogues and mixtures of naturally occurring polynucleotides and analogues can be prepared.
Известно множество аналогов полинуклеотидов, в том числе, например, таковые с фосфороамидатными, фосфоротиоатными, фосфородитиоатными или О-метилфосфороамидитными связями и пептидными остовами полинуклеотидов и связями. Другие аналоги полинуклеотидов включают таковые с положительно заряженными остовами, неионогенными остовами и безрибозными остовами. Полинуклеотиды, содержащие один или более карбоциклических сахаров, также включены.Many polynucleotide analogs are known, including, for example, those with phosphoramidate, phosphorothioate, phosphorodithioate, or O-methylphosphoroamidite linkages and polynucleotide peptide backbones and linkages. Other polynucleotide analogs include those with positively charged backbones, nonionic backbones, and non-ribose backbones. Polynucleotides containing one or more carbocyclic sugars are also included.
Другие аналоги включают пептидные полинуклеотиды, которые представляют собой таковые на основе пептидных аналогов полинуклеотидов. Эти остовы являются практически неионогенными в нейтральных условиях в отличие от высокозаряженного фосфодиэфирного остова встречающихся в природе полинуклеотидов. Это может давать преимущества. Во-первых, пептидный остов полинуклеотида может характеризоваться улучшенной кинетикой гибридизации. Пептидные полинуклеотиды характеризуются более значительными изменениями температуры плавления в случае наличия несовпадающих пар оснований по сравнению с идеально совпадающими парами оснований. ДНК и РНК, как правило, характеризуются понижением температуры плавления на 2-4 C при наличии внутреннего несовпадения. В случае неионогенного пептидного остова полинуклеотида падение находится ближе к 7-9C. Сходным образом, из-за их неионогенной природы, гибридизация оснований, присоединенных к этим остовам, является относительно нечувствительной к концентрации солей. Дополнительно пептидные полинуклеотиды могут не разрушаться или разрушаться в меньшей степени клеточными ферментами, и, таким образом, могут быть более стабильными.Other analogs include peptide polynucleotides, which are those based on peptide analogs of polynucleotides. These backbones are substantially non-ionic under neutral conditions, in contrast to the highly charged phosphodiester backbone of naturally occurring polynucleotides. This may provide benefits. First, the peptide backbone of a polynucleotide may have improved hybridization kinetics. Peptide polynucleotides are characterized by greater changes in melting point in the presence of mismatched base pairs compared to perfectly matched base pairs. DNA and RNA, as a rule, are characterized by a decrease in the melting point by 2-4 C in the presence of an internal mismatch. In the case of a non-ionic peptide backbone of a polynucleotide, the drop is closer to 7-9C. Similarly, due to their non-ionic nature, the hybridization of bases attached to these backbones is relatively insensitive to salt concentration. Additionally, peptide polynucleotides may not be degraded or degraded to a lesser extent by cellular enzymes, and thus may be more stable.
В числе применений раскрытых полинуклеотидов и их фрагментов находится применение фрагментов в качестве зондов в анализах на основе гибридизации или в качестве праймеров для применения в анализах на основе амплификации. Такие фрагменты обычно содержат по меньшей мере приблизительно 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 или 20 или больше смежных нуклеотидов из ДНК-последовательности. В других вариантах осуществления фрагмент ДНК содержит по меньшей мере приблизительно 10, 15, 20, 30, 40, 50 или 60 или больше смежных нуклеотидов из ДНК-последовательности. Таким образом, согласно одному аспекту также предусмотрен способ выявления полинуклеотида, включающий применение зондов или праймеров, или того и другого. Иллюстративные праймеры описаны в данном документе.Among the uses of the disclosed polynucleotides and fragments thereof is the use of the fragments as probes in hybridization based assays or as primers for use in amplification based assays. Such fragments typically contain at least about 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, or 20 or more contiguous nucleotides from the DNA sequence. In other embodiments, the DNA fragment contains at least about 10, 15, 20, 30, 40, 50, or 60 or more contiguous nucleotides from the DNA sequence. Thus, according to one aspect, a method for detecting a polynucleotide is also provided, comprising the use of probes or primers, or both. Illustrative primers are described in this document.
Основные параметры, влияющие на выбор условий гибридизации, и руководство для разработки подходящих условий описаны в Sambrook, J., E. F. Fritsch, and T. Maniatis (1989, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.). Используя данные о генетическом коде в комбинации с полипептидными последовательностями, описанными в данном документе, можно получить наборы вырожденных олигонуклеотидов. Такие олигонуклеотиды применимы в качестве праймеров, например, в полимеразных цепных реакциях (ПЦР), с помощью которых выделяют и амплифицируют фрагменты ДНК. В определенных вариантах осуществления вырожденные праймеры можно применять в качестве зондов для генетических библиотек. Такие библиотеки включают библиотеки кДНК, геномные библиотеки и даже электронные библиотеки меток экспрессируемых последовательностей или ДНК. Гомологичные последовательности, идентифицированные этим способом, будут затем использованы в качестве зондов для идентификации гомологов последовательностей, указанных в данном документе.The main parameters influencing the choice of hybridization conditions and guidance for developing suitable conditions are described in Sambrook, J., E. F. Fritsch, and T. Maniatis (1989, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.). Using the genetic code data in combination with the polypeptide sequences described herein, sets of degenerate oligonucleotides can be obtained. Such oligonucleotides are useful as primers, for example, in polymerase chain reactions (PCR) by which DNA fragments are isolated and amplified. In certain embodiments, degenerate primers can be used as probes for genetic libraries. Such libraries include cDNA libraries, genomic libraries, and even electronic label libraries for expressed sequences or DNA. Homologous sequences identified by this method will then be used as probes to identify homologues of the sequences specified herein.
Также, потенциально применимыми являются полинуклеотиды и олигонуклеотиды (например, праймеры или зонды), которые гибридизируются в условиях пониженной жесткости, как правило, в условиях средней жесткости и, обычно, в условиях высокой жесткости с полинуклеотидом(полинуклеотидами), описанным(описанными) в данном документе. Основные параметры, влияющие на выбор условий гибридизации, и руководство для разработки подходящих условий изложены в Sambrook J., E. F. Fritsch and T. Maniatis (1989, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.) и могут быть легко определены специалистами средней квалификации в данной области техники на основе, например, длины или композиции оснований полинуклеотида.Also potentially useful are polynucleotides and oligonucleotides (e.g., primers or probes) that hybridize under conditions of reduced stringency, typically medium stringency, and typically high stringency, to the polynucleotide(s) described herein. The main parameters influencing the selection of hybridization conditions and guidance for developing suitable conditions are set forth in Sambrook J., E. F. Fritsch and T. Maniatis (1989, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.) and can be readily determined by those of ordinary skill in the art based on, for example, the length or base composition of the polynucleotide.
В данном документе определен один способ достижения условий умеренной и высокой жесткости. Следует понимать, что температуру промывки и концентрацию солей при промывке при потребности можно регулировать для достижения необходимой степени жесткости посредством применения основных принципов, которые управляют реакциями гибридизации и стабильностью дуплексов, как это известно специалистам в данной области техники и дополнительно описано ниже (см., например, Sambrook, J., E. F. Fritsch, and T. Maniatis (1989, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y). При гибридизации полинуклеотида с полинуклеотидом с неизвестной последовательностью предполагается, что длина гибрида будет такой как у гибридизирующегося полинуклеотида. Когда гибридизируют полинуклеотиды с известными последовательностями, длина гибрида может быть определена путем выравнивания последовательностей полинуклеотидов и идентификации участка или участков с оптимальной комплементарностью последовательности. Температура гибридизации для гибридов, длина которых предположительно составят менее 50 пар оснований, должна быть на 5-10 C меньше, чем температура плавления гибрида, где температуру плавления определяют в соответствии со следующими уравнениями. Для гибридов, длина которых составляет менее 18 пар оснований, температура плавления (°С) = 2(число оснований А+Т)+4(число оснований G+C). Для гибридов, длина которых составляет более 18 пар оснований, температура плавления (°C) = 81,5+16,6(log10 [Na+])+0,41(% G+C)-(600/N), где N представляет собой число оснований в гибриде, и [Na+] представляет собой концентрацию ионов натрия в буфере для гибридизации ([Na+] для 1x стандартного цитрата натрия=0,165 M). Как правило, каждый такой гибридизирующийся полинуклеотид имеет длину, которая составляет по меньшей мере 25% (обычно по меньшей мере 50%, 60% или 70% и наиболее часто по меньшей мере 80%) от длины полинуклеотида, с которым он гибридизируется, и характеризуется по меньшей мере 60% идентичностью последовательности (например, по меньшей мере 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% или 100%) с полинуклеотидом, с которым он гибридизируется.This document defines one way to achieve conditions of moderate and high stringency. It should be understood that the temperature of flushing and the concentration of salts during washing with need can be adjusted to achieve the necessary degree of stiffness by applying the basic principles that control the hybridization reactions and stability of the duplex, as specialists know in this field of technology and are additionally described below (see, for example, Sambrook, J., E. F. Fritsch, and T. Maniatis (1989, Maniatis (1989, Maniatis Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y). When hybridization of polynucleotide with polynucleotide with an unknown sequence, it is assumed that the length of the hybrid will be the same as a hybridized polynucleotide. hybridized polynucleotides with known sequences, the length of the hybrid can be determined by aligning the sequences of polynucleotides and identifying the site or sites with optimal complementarity of the sequence. The temperature of hybridization for hybrids, the length of which is allegedly less than 50 pairs of base, should be less than the melting temperature of the hybrid, where the melting temperature is determined in accordance with the following. equations. For hybrids less than 18 bp in length, melting point (°C) = 2(number of bases A+T)+4(number of bases G+C). For hybrids longer than 18 bp, melting point (°C) = 81.5+16.6(log10 [Na+])+0.41(% G+C)-(600/N) where N is the number of bases in the hybrid and [Na+] is the concentration of sodium ions in the hybridization buffer ([Na+] for 1x standard sodium citrate=0.165 M). Typically, each such hybridizing polynucleotide has a length that is at least 25% (typically at least 50%, 60%, or 70%, and most often at least 80%) of the length of the polynucleotide to which it hybridizes, and has at least 60% sequence identity (e.g., at least 70%, 75%, 80%, 85%, 90%, 95%, 96%, 9 7%, 98%, 99% or 100%) with the polynucleotide with which it hybridizes.
Как будет понятно специалисту в данной области техники, линейная ДНК имеет две возможные ориентации: направление 5'-3' и направление 3'-5'. Например, если первая последовательность расположена в направлении 5'-3', и если вторая последовательность расположена в направлении 5'-3' в одной и той же полинуклеотидной молекуле/нити, то первая последовательность и вторая последовательность ориентированы в одном направлении или имеют одинаковую ориентацию. Как правило, последовательность промотора и представляющий интерес ген, находящийся под контролем данного промотора, расположены в одинаковой ориентации. Однако если по отношению к первой последовательности, расположенной в направлении 5'-3', вторая последовательность расположена в направлении 3'-5' в одной и той же полинуклеотидной молекуле/нити, тогда первая последовательность и вторая последовательность ориентированы в антисмысловом направлении или имеют антисмысловую ориентацию. Две последовательности, имеющие антисмысловые ориентации по отношению друг к другу, могут быть альтернативно описаны как имеющие одинаковую ориентацию, если первая последовательность (направление 5'-3') и последовательность, обратно комплементарная первой последовательности (первой последовательности, расположенной в 5'-3'), расположены в пределах одной полинуклеотидной молекулы/нити. Последовательности, изложенные в данном документе, показаны в направлении 5'-3'.As will be appreciated by one of skill in the art, linear DNA has two possible orientations: the 5'-3' direction and the 3'-5' direction. For example, if the first sequence is located in the 5'-3' direction, and if the second sequence is located in the 5'-3' direction in the same polynucleotide molecule/strand, then the first sequence and the second sequence are oriented in the same direction or have the same orientation. Typically, the promoter sequence and the gene of interest under the control of that promoter are in the same orientation. However, if with respect to the first sequence located in the 5'-3' direction, the second sequence is located in the 3'-5' direction in the same polynucleotide molecule/strand, then the first sequence and the second sequence are oriented in the antisense direction or have an antisense orientation. Two sequences having antisense orientations with respect to each other can alternatively be described as having the same orientation if the first sequence (the 5'-3' direction) and the sequence inversely complementary to the first sequence (the first sequence located 5'-3') are located within the same polynucleotide molecule/strand. The sequences set forth herein are shown in the 5'-3' direction.
По меньшей мере одна модификация (например, мутация) может быть включена в один или более из NtAAT1-S (SEQ ID NO: 5), NtAAT1-T (SEQ ID NO: 7), NtAAT2-S (SEQ ID NO: 1), NtAAT2-T (SEQ ID NO: 3), NtAAT3-S (SEQ ID NO: 9), NtAAT3-T (SEQ ID NO: 11), NtAAT4-S (SEQ ID NO: 13) и NtAAT4-T (SEQ ID NO: 15). At least one modification (eg, mutation) may be included in one or more of NtAAT1-S (SEQ ID NO: 5), NtAAT1-T (SEQ ID NO: 7), NtAAT2-S (SEQ ID NO: 1), NtAAT2-T (SEQ ID NO: 3), NtAAT3-S (SEQ ID NO: 9), NtAAT3-T ( SEQ ID NO: 11), NtA AT4-S (SEQ ID NO: 13) and NtAAT4-T (SEQ ID NO: 15).
В определенных вариантах осуществления по меньшей мере одна модификация (например, мутация) может быть включена в один или более из NtAAT1-S (SEQ ID NO: 5) и NtAAT1-T (SEQ ID NO: 7).In certain embodiments, at least one modification (eg, mutation) may be included in one or more of NtAAT1-S (SEQ ID NO: 5) and NtAAT1-T (SEQ ID NO: 7).
В определенных вариантах осуществления по меньшей мере одна модификация (например, мутация) может быть включена в один или более из NtAAT2-S (SEQ ID NO: 1) и NtAAT2-T (SEQ ID NO: 3).In certain embodiments, at least one modification (eg, mutation) may be included in one or more of NtAAT2-S (SEQ ID NO: 1) and NtAAT2-T (SEQ ID NO: 3).
В определенных вариантах осуществления по меньшей мере одна модификация (например, мутация) может быть включена в один или более из NtAAT1-S (SEQ ID NO: 5), NtAAT1-T (SEQ ID NO: 7), NtAAT2-S (SEQ ID NO: 1) и NtAAT2-T (SEQ ID NO: 3).In certain embodiments, at least one modification (e.g., a mutation) may be included in one or more of NtAAT1-S (SEQ ID NO: 5), NtAAT1-T (SEQ ID NO: 7), NtAAT2-S (SEQ ID NO: 1), and NtAAT2-T (SEQ ID NO: 3).
В определенных вариантах осуществления по меньшей мере одна модификация (например, мутация) может быть включена в один или более из NtAAT1-S (SEQ ID NO: 5), NtAAT1-T (SEQ ID NO: 7), NtAAT2-S (SEQ ID NO: 1) и NtAAT2-T (SEQ ID NO: 3), при этом один или более из NtAAT3-S (SEQ ID NO: 9), NtAAT3-T (SEQ ID NO: 11), NtAAT4-S (SEQ ID NO: 13) и NtAAT4-T (SEQ ID NO: 15) не включают модификацию(модификации) (например, мутацию(мутации)).In certain embodiments, at least one modification (e.g., a mutation) may be included in one or more of NtAAT1-S (SEQ ID NO: 5), NtAAT1-T (SEQ ID NO: 7), NtAAT2-S (SEQ ID NO: 1), and NtAAT2-T (SEQ ID NO: 3), wherein one or more of NtAAT3-S (SEQ ID NO: 9), NtAAT3 -T (SE Q ID NO: 11), NtAAT4-S (SEQ ID NO: 13), and NtAAT4-T (SEQ ID NO: 15) do not include modification(s) (eg, mutation(s)).
В определенных вариантах осуществления по меньшей мере одна модификация (например, мутация) может быть включена в один или более из NtAAT1-S (SEQ ID NO: 5), NtAAT1-T (SEQ ID NO: 7), NtAAT2-S (SEQ ID NO: 1) и NtAAT2-T (SEQ ID NO: 3), при этом NtAAT3-S (SEQ ID NO: 9), NtAAT3-T (SEQ ID NO: 11), NtAAT4-S (SEQ ID NO: 13) и NtAAT4-T (SEQ ID NO: 15) ) не включают модификацию(модификации) (например, мутацию(мутации)).In certain embodiments, at least one modification (e.g., a mutation) may be included in one or more of NtAAT1-S (SEQ ID NO: 5), NtAAT1-T (SEQ ID NO: 7), NtAAT2-S (SEQ ID NO: 1) and NtAAT2-T (SEQ ID NO: 3), while NtAAT3-S (SEQ ID NO: 9), NtAAT3 -T (SEQ ID NO: 11), NtAAT4-S (SEQ ID NO: 13) and NtAAT4-T (SEQ ID NO: 15) do not include modification(s) (eg, mutation(s)).
ПолипептидыPolypeptides
В другом аспекте представлен выделенный полипептид, содержащий, состоящий или по существу состоящий из полипептида, характеризующегося по меньшей мере 60% идентичностью последовательности с любым из полипептидов, описанных в данном документе, включая любой из полипептидов, показанных в перечне последовательностей. Предпочтительно выделенный полипептид содержит, состоит или по существу состоит из последовательности, характеризующейся по меньшей мере 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 75%, 80%, 85%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95% 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9% или 100% идентичностью последовательности с ними.In another aspect, an isolated polypeptide is provided comprising, consisting of, or essentially consisting of, a polypeptide having at least 60% sequence identity with any of the polypeptides described herein, including any of the polypeptides shown in the sequence listing. Preferably, the isolated polypeptide contains, consists of, or essentially consists of a sequence characterized by at least 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 75%, 80%, 85%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95% 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% or 100% sequence identity with them.
В одном варианте осуществления представлен полипептид, кодируемый любым из полинуклеотидов, описанных в данном документе, включая полинуклеотид, характеризующийся по меньшей мере 80% идентичностью последовательности с SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13 или SEQ ID NO: 15.In one embodiment, a polypeptide is encoded by any of the polynucleotides described herein, including a polynucleotide having at least 80% sequence identity with SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, or SEQ ID NO: 15.
В другом варианте осуществления представлен выделенный полипептид, содержащий, состоящий или по существу состоящий из последовательности, характеризующейся по меньшей мере 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 75%, 80%, 85%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95% 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9% или 100% идентичностью последовательности с SEQ ID NO: 6, SEQ ID No: 8, SEQ ID NO: 2, SEQ ID No: 4, SEQ ID NO: 10 или SEQ ID No: 12.In another embodiment, an isolated polypeptide is provided comprising, consisting of, or essentially consisting of a sequence characterized by at least 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 75%, 80%, 85%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95% 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% or 100% sequence identity with SEQ ID NO: 6, SEQ ID No: 8, SEQ ID NO: 2, SEQ ID No: 4, SEQ ID NO: 10 or SEQ ID No: 12.
В другом варианте осуществления представлен выделенный полипептид, содержащий, состоящий или по существу состоящий из последовательности, характеризующейся по меньшей мере 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 75%, 80%, 85%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95% 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9% или 100% идентичностью последовательности с SEQ ID NO: 2 или SEQ ID No: 4.In another embodiment, an isolated polypeptide is provided comprising, consisting of, or essentially consisting of a sequence characterized by at least 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 75%, 80%, 85%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95% 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% or 100% sequence identity with SEQ ID NO: 2 or SEQ ID No: 4.
В другом варианте осуществления представлен выделенный полипептид, содержащий, состоящий или по существу состоящий из последовательности, характеризующейся по меньшей мере 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 75%, 80%, 85%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95% 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9% или 100% идентичностью последовательности с SEQ ID NO: 6 или SEQ ID No: 8.In another embodiment, an isolated polypeptide is provided comprising, consisting of, or essentially consisting of a sequence characterized by at least 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 75%, 80%, 85%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95% 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% or 100% sequence identity with SEQ ID NO: 6 or SEQ ID No: 8.
В другом варианте осуществления представлен выделенный полипептид, содержащий, состоящий или по существу состоящий из последовательности, характеризующейся по меньшей мере 95% 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9% или 100% идентичностью последовательности с SEQ ID NO: 6 или SEQ ID No: 8; по меньшей мере 93%, 94%, 95% 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9% или 100% идентичностью последовательности с SEQ ID NO: 2 или SEQ ID No: 4; или по меньшей мере 94%, 95% 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9% или 100% идентичностью последовательности с SEQ ID NO: 14 или SEQ ID NO: 16.In another embodiment, an isolated polypeptide is provided comprising, consisting of, or essentially consisting of a sequence characterized by at least 95% 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9%, or 100% identity to sequences with SEQ ID NO: 6 or SEQ ID No: 8; at least 93%, 94%, 95% 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% or 100% sequence identity with SEQ ID NO: 2 or SEQ ID No: 4; or at least 94%, 95% 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% or 100% sequence identity with SEQ ID NO: 14 or SEQ ID NO: 16.
Полипептид может содержать последовательности, имеющие достаточную или значительную степень идентичности или сходства с SEQ ID NO: SEQ ID NO: 6, SEQ ID No: 8, SEQ ID NO: 2, SEQ ID No: 4, SEQ ID NO: 10 или SEQ ID No: 12, функционирующие в качестве AAT. Полипептид может содержать последовательности, имеющие достаточную или значительную степень идентичности или сходства с SEQ ID NO: 6 или SEQ ID No: 8, функционирующие в качестве AAT. Полипептид может содержать последовательности, имеющие достаточную или значительную степень идентичности или сходства с SEQ ID NO: 2 или SEQ ID No: 4, функционирующие в качестве AAT. Фрагменты полипептида(полипептидов) как правило сохраняют некоторые или все функции AAT или активность полноразмерной последовательности.The polypeptide may contain sequences that have a sufficient or significant degree of identity or similarity with SEQ ID NO: SEQ ID NO: 6, SEQ ID No: 8, SEQ ID NO: 2, SEQ ID No: 4, SEQ ID NO: 10 or SEQ ID No: 12, functioning as an AAT. The polypeptide may contain sequences that have a sufficient or significant degree of identity or similarity with SEQ ID NO: 6 or SEQ ID No: 8, functioning as an AAT. The polypeptide may contain sequences that have a sufficient or significant degree of identity or similarity with SEQ ID NO: 2 or SEQ ID No: 4, functioning as an AAT. Fragments of the polypeptide(s) typically retain some or all of the functions of the AAT or the activity of the full length sequence.
Как описано в данном документе, NtAAT2-S (SEQ ID NO: 1) и NtAAT2-T (SEQ ID NO: 3) являются генами, экспрессируемыми на наиболее высоком уровне, после 48 часов сушки по сравнению с зелеными табачными листьями. Уровень экспрессии может быть в 2, 3, 4, 5, 6, 7, 8, 9, 10 или 11 раз большим, чем у зеленых табачных листьев. Применение NtAAT2-S (SEQ ID NO: 1) и NtAAT2-T (SEQ ID NO: 3) является предпочтительным в определенных вариантах осуществления настоящего изобретения. Как обсуждалось в данном документе, полипептиды также включают мутантные варианты, полученных путем введения любого типа корректировок (например, вставки, делеции или замены аминокислот; изменения состояния гликозилирования; изменения, которые влияют на рефолдинг или изомеризацию, трехмерные структуры или состояния самоассоциации), которые могут быть намеренно сконструированы или выделены естественным образом при условии, что они по прежнему сохраняют некоторую или всю свою функциональность или активность. Предпочтительно, данную функцию или активность модулируют.As described herein, NtAAT2-S (SEQ ID NO: 1) and NtAAT2-T (SEQ ID NO: 3) are the genes expressed at the highest level after 48 hours of drying compared to green tobacco leaves. The expression level can be 2, 3, 4, 5, 6, 7, 8, 9, 10 or 11 times that of green tobacco leaves. The use of NtAAT2-S (SEQ ID NO: 1) and NtAAT2-T (SEQ ID NO: 3) is preferred in certain embodiments of the present invention. As discussed herein, polypeptides also include mutant variants obtained by introducing any type of adjustment (e.g., insertion, deletion, or substitution of amino acids; changes in glycosylation state; changes that affect refolding or isomerization, three-dimensional structures, or self-association states) that can be intentionally engineered or naturally isolated, provided that they still retain some or all of their functionality or activity. Preferably, the function or activity is modulated.
Делеция относится к удалению одной или более аминокислот из полипептида. Вставка относится к одному или более аминокислотным остаткам, вводимым в заранее определенное место в полипептиде. Вставки могут предусматривать вставки внутрь последовательности одной или нескольких аминокислот. Замена относится к замещению аминокислот полипептида другими аминокислотами, имеющими сходные свойства (такие как сходная гидрофобность, гидрофильность, антигенность, склонность к образованию или разрыву α-спиральных структур или β-складчатых структур). Аминокислотные замены, как правило, предусматривают один остаток, но могут быть сгруппированы в зависимости от функциональных ограничений, накладываемых на полипептид, и могут предусматривать диапазон от приблизительно 1 до приблизительно 10 аминокислот. Аминокислотные замены являются предпочтительно консервативными аминокислотными заменами, как описано ниже. Аминокислотные замены, делеции и/или вставки можно выполнить с применением методик пептидного синтеза, таких как твердофазный пептидный синтез, или с помощью манипулирования с рекомбинантной ДНК. Способы манипулирования ДНК-последовательностями с получением вариантов полипептида с заменой, вставкой или делецией хорошо известны в данной области техники. Вариант может характеризоваться наличием корректировок, которые вызывают возникновение «молчащего» изменения и в результате приводят к образованию функционально эквивалентного полипептида. Преднамеренные аминокислотные замены можно осуществлять исходя из сходства остатков в отношении полярности, заряда, растворимости, гидрофобности, гидрофильности и амфипатической природы, при условии, что сохраняется связывание, обуславливающее вторичную структуру вещества. Например, отрицательно заряженные аминокислоты включают аспарагиновую кислоту и глутаминовую кислоту, положительно заряженные аминокислоты включают лизин и аргинин, и аминокислоты с незаряженными полярными концевыми группами, характеризующиеся сходными значениями гидрофильности, включают лейцин, изолейцин, валин, глицин, аланин, аспарагин, глутамин, серин, треонин, фенилаланин и тирозин. Консервативные замены можно осуществлять, например, в соответствии с приведенной ниже таблицей. Аминокислоты в одном и том же блоке во втором столбце и предпочтительно в одной и той же строке в третьем столбце можно заменять одна на другую:A deletion refers to the removal of one or more amino acids from a polypeptide. An insert refers to one or more amino acid residues introduced at a predetermined location in a polypeptide. Insertions may include insertions into the sequence of one or more amino acids. Substitution refers to the substitution of amino acids in a polypeptide with other amino acids having similar properties (such as similar hydrophobicity, hydrophilicity, antigenicity, propensity to form or break α-helical structures or β-sheet structures). Amino acid substitutions typically include a single residue, but may be grouped depending on the functional limitations imposed on the polypeptide, and may range from about 1 to about 10 amino acids. Amino acid substitutions are preferably conservative amino acid substitutions, as described below. Amino acid substitutions, deletions and/or insertions can be performed using peptide synthesis techniques, such as solid phase peptide synthesis, or by manipulating recombinant DNA. Methods for manipulating DNA sequences to produce substitution, insertion, or deletion variants of a polypeptide are well known in the art. A variant may be characterized by the presence of adjustments that cause a "silent" change to occur and result in a functionally equivalent polypeptide. Intentional amino acid substitutions can be made based on the similarity of residues in terms of polarity, charge, solubility, hydrophobicity, hydrophilicity and amphipathic nature, provided that the binding that causes the secondary structure of the substance is maintained. For example, negatively charged amino acids include aspartic acid and glutamic acid, positively charged amino acids include lysine and arginine, and polar uncharged amino acids having similar hydrophilicity values include leucine, isoleucine, valine, glycine, alanine, asparagine, glutamine, serine, threonine, phenylalanine, and tyrosine. Conservative substitutions can be made, for example, in accordance with the table below. Amino acids in the same block in the second column, and preferably in the same row in the third column, can be substituted for one another:
Полипептид может представлять собой зрелый полипептид, или незрелый полипептид, или полипептид, полученный из незрелого полипептида. Полипептиды могут находиться в линейной форме или являться циклизированными с применением известных способов. Полипептиды, как правило, содержат по меньшей мере 10, по меньшей мере 20, по меньшей мере 30, или по меньшей мере 40 смежных аминокислот.The polypeptide may be a mature polypeptide, or an immature polypeptide, or a polypeptide derived from an immature polypeptide. The polypeptides may be in linear form or be cyclized using known methods. Polypeptides typically contain at least 10, at least 20, at least 30, or at least 40 contiguous amino acids.
По меньшей мере одна модификация (например, мутация) может быть включена в один или более из NtAAT1-S (SEQ ID NO: 6), NtAAT1-T (SEQ ID NO: 8), NtAAT2-S (SEQ ID NO: 2), NtAAT2-T (SEQ ID NO: 4), NtAAT3-S (SEQ ID NO: 10), NtAAT3-T (SEQ ID NO: 12), NtAAT4-S (SEQ ID NO: 14) и NtAAT4-T (SEQ ID NO: 16). At least one modification (eg, mutation) may be included in one or more of NtAAT1-S (SEQ ID NO: 6), NtAAT1-T (SEQ ID NO: 8), NtAAT2-S (SEQ ID NO: 2), NtAAT2-T (SEQ ID NO: 4), NtAAT3-S (SEQ ID NO: 10), NtAAT3-T (SEQ ID NO: 12), Nt AAT4-S (SEQ ID NO: 14) and NtAAT4-T (SEQ ID NO: 16).
В определенных вариантах осуществления по меньшей мере одна модификация (например, мутация) может быть включена в один или более из NtAAT1-S (SEQ ID NO: 6), NtAAT1-T (SEQ ID NO: 8), NtAAT2-S (SEQ ID NO: 2) и NtAAT2-T (SEQ ID NO: 4).In certain embodiments, at least one modification (e.g., mutation) may be included in one or more of NtAAT1-S (SEQ ID NO: 6), NtAAT1-T (SEQ ID NO: 8), NtAAT2-S (SEQ ID NO: 2), and NtAAT2-T (SEQ ID NO: 4).
В определенных вариантах осуществления по меньшей мере одна модификация (например, мутация) может быть включена в один или более из NtAAT1-S (SEQ ID NO: 6) и NtAAT1-T T (SEQ ID NO: 8).In certain embodiments, at least one modification (eg, mutation) may be included in one or more of NtAAT1-S (SEQ ID NO: 6) and NtAAT1-T T (SEQ ID NO: 8).
В определенных вариантах осуществления по меньшей мере одна модификация (например, мутация) может быть включена в один или более из NtAAT2-S (SEQ ID NO: 2) и NtAAT2-T (SEQ ID NO: 4).In certain embodiments, at least one modification (eg, mutation) may be included in one or more of NtAAT2-S (SEQ ID NO: 2) and NtAAT2-T (SEQ ID NO: 4).
В определенных вариантах осуществления по меньшей мере одна модификация (например, мутация) может быть включена в один или более из NtAAT1-S (SEQ ID NO: 6), NtAAT1-T (SEQ ID NO: 8), NtAAT2-S (SEQ ID NO: 2) и NtAAT2-T (SEQ ID NO: 4), при этом один или более из NtAAT3-S (SEQ ID NO: 10), NtAAT3-T (SEQ ID NO: 12), NtAAT4-S (SEQ ID NO: 14) и NtAAT4-T (SEQ ID NO: 16) не включают модификации (например, мутацию(мутации)). In certain embodiments, at least one modification (e.g., mutation) may be included in one or more of NtAAT1-S (SEQ ID NO: 6), NtAAT1-T (SEQ ID NO: 8), NtAAT2-S (SEQ ID NO: 2), and NtAAT2-T (SEQ ID NO: 4), wherein one or more of NtAAT3-S (SEQ ID NO: 10), NtAAT3-T ( SEQ ID NO: 12), NtAAT4-S (SEQ ID NO: 14) and NtAAT4-T (SEQ ID NO: 16) do not include modifications (eg, mutation(s)).
В определенных вариантах осуществления по меньшей мере одна модификация (например, мутация) может быть включена в один или более из NtAAT1-S (SEQ ID NO: 6), NtAAT1-T (SEQ ID NO: 8), NtAAT2-S (SEQ ID NO: 2) и NtAAT2-T (SEQ ID NO: 4), при этом NtAAT3-S (SEQ ID NO: 10), NtAAT3-T (SEQ ID NO: 12), NtAAT4-S (SEQ ID NO: 14) и NtAAT4-T (SEQ ID NO: 16) не включают модификаций (например, мутацию(мутации)).In certain embodiments, at least one modification (e.g., a mutation) may be included in one or more of NtAAT1-S (SEQ ID NO: 6), NtAAT1-T (SEQ ID NO: 8), NtAAT2-S (SEQ ID NO: 2), and NtAAT2-T (SEQ ID NO: 4), wherein NtAAT3-S (SEQ ID NO: 10), NtAAT3-T (SEQ ID NO: 10), : 12), NtAAT4-S (SEQ ID NO: 14) and NtAAT4-T (SEQ ID NO: 16) do not include modifications (eg mutation(s)).
Модификация растенийPlant modification
ТрансформацияTransformation
Рекомбинантные конструкции можно применять для трансформации растений или клеток растения для того, чтобы модулировать экспрессию, функцию или активность полипептида. Рекомбинантная полинуклеотидная конструкция может содержать полинуклеотид, кодирующий один или более полинуклеотидов, описанных в данном документе, функционально связанных с регуляторным участком, подходящим для экспрессии полипептида. Таким образом, полинуклеотид может содержать кодирующую последовательность, которая кодирует полипептид, описанный в данном документе. Растения или клетки растений, в которых модулируют экспрессию, функцию или активность полипептида, могут включать мутантные, не встречающиеся в природе, трансгенные, созданные человеком или полученные с помощью методик генной инженерии растения или клетки растения. Предпочтительно, трансгенное растение или клетка растения содержит геном, который был скорректирован путем стабильной интеграции рекомбинантной ДНК. Рекомбинантная ДНК содержит ДНК, полученную с помощью методик генной инженерии и сконструированную вне клетки, и содержит ДНК, содержащую встречающуюся в природе ДНК, или кДНК, или синтетическую ДНК. Трансгенное растение может включать растение, регенерированное из первоначально трансформированной клетки растения, и трансгенные растения, являющиеся потомством более поздних поколений или гибридов трансформированного растения. Предпочтительно, трансгенная модификация обеспечивает корректировку экспрессии, или функции, или активности полинуклеотида или полипептида, описанных в данном документе, по сравнению с таковыми в контрольном растении.Recombinant constructs can be used to transform plants or plant cells in order to modulate the expression, function, or activity of a polypeptide. The recombinant polynucleotide construct may comprise a polynucleotide encoding one or more of the polynucleotides described herein operably linked to a regulatory region suitable for expression of the polypeptide. Thus, a polynucleotide may contain a coding sequence that encodes for a polypeptide as described herein. Plants or plant cells in which the expression, function, or activity of a polypeptide is modulated may include mutant, non-naturally occurring, transgenic, human-created, or genetically engineered plants or plant cells. Preferably, the transgenic plant or plant cell contains a genome that has been corrected by stable integration of recombinant DNA. Recombinant DNA contains DNA that is genetically engineered and engineered outside of a cell, and contains DNA containing naturally occurring DNA, or cDNA, or synthetic DNA. A transgenic plant may include a plant regenerated from an originally transformed plant cell and transgenic plants that are the offspring of later generations or hybrids of the transformed plant. Preferably, the transgenic modification provides for an adjustment in the expression or function or activity of a polynucleotide or polypeptide described herein compared to that in a control plant.
Полипептид, кодируемый рекомбинантным полинуклеотидом, может являться нативным полипептидом или может являться гетерологичным по отношению к клетке. В некоторых случаях рекомбинантная конструкция содержит полинуклеотид, который обеспечивает модулирование экспрессии, функционально связанный с регуляторным участком. Примеры подходящих регуляторных участков описаны в данном документе. The polypeptide encoded by the recombinant polynucleotide may be a native polypeptide or may be heterologous to the cell. In some cases, the recombinant construct contains a polynucleotide that modulates expression operably linked to a regulatory region. Examples of suitable regulatory regions are described herein.
Также представлены векторы, содержащие рекомбинантные полинуклеотидные конструкции, такие как описанные в данном документе. Подходящие основы для векторов включают, например, те, которые обычно используют в данной области техники, такие как плазмиды, вирусы, искусственные хромосомы, искусственные хромосомы бактерий, искусственные хромосомы дрожжей или искусственные хромосомы бактериофагов. Подходящие векторы экспрессии включают без ограничения плазмиды и вирусные векторы, полученные из, например, бактериофага, бакуловирусов и ретровирусов. Многочисленные векторы и системы экспрессии являются коммерчески доступными.Also provided are vectors containing recombinant polynucleotide constructs such as those described herein. Suitable vector backbones include, for example, those commonly used in the art, such as plasmids, viruses, artificial chromosomes, bacterial artificial chromosomes, yeast artificial chromosomes, or bacteriophage artificial chromosomes. Suitable expression vectors include, but are not limited to, plasmids and viral vectors derived from, for example, bacteriophage, baculoviruses, and retroviruses. Numerous vectors and expression systems are commercially available.
Векторы могут содержать, например, точки начала репликации, участки связывания с ядерным матриксом или маркеры. Маркерный ген может придавать клетке растения селектируемый фенотип. Например, маркер может придавать устойчивость к биоцидным средствам, такую как устойчивость к антибиотику (например, к канамицину, G418, блеомицину или гигромицину) или к гербициду (например, к глифосату, хлорсульфурону или фосфинотрицину). Дополнительно вектор экспрессии может содержать последовательность метки, предназначенной для облегчения манипуляций или выявления (например, очистки или локализации) экспрессируемого полипептида. Последовательности меток, такие как последовательности люциферазы, бета-глюкуронидазы, зеленого флуоресцентного полипептида, глутатион-S-трансферазы, полигистидина, c-myc или гемагглютинина, как правило, экспрессируются в виде фрагмента, слитого с кодируемым полипептидом. Такие метки могут быть вставлены в любом месте в пределах полипептида, в том числе на карбоксильном или амино-конце.The vectors may contain, for example, origins of replication, nuclear matrix binding sites, or markers. The marker gene may confer a selectable phenotype to a plant cell. For example, the marker can confer resistance to biocidal agents, such as resistance to an antibiotic (eg, kanamycin, G418, bleomycin, or hygromycin) or herbicide (eg, glyphosate, chlorsulfuron, or phosphinothricin). Additionally, the expression vector may contain a tag sequence designed to facilitate manipulation or detection (eg, purification or localization) of the expressed polypeptide. Label sequences such as luciferase, beta-glucuronidase, green fluorescent polypeptide, glutathione-S-transferase, polyhistidine, c-myc, or hemagglutinin sequences are typically expressed as a fusion fragment with the encoded polypeptide. Such labels can be inserted anywhere within the polypeptide, including at the carboxyl or amino terminus.
Растение или клетку растения можно трансформировать путем интегрирования рекомбинантного полинуклеотида в их геном с обеспечением их стабильной трансформации. Растение или клетка растения, описанные в данном документе, могут являться стабильно трансформированными. Стабильно трансформированные клетки, как правило, сохраняют введенный полинуклеотид с каждым клеточным делением. Растение или клетка растения также могут являться транзиентно трансформированными, так что рекомбинантный полинуклеотид не интегрируется в их геном. Транзиентно трансформированные клетки, как правило, теряют весь введенный рекомбинантный полинуклеотид или некоторую его часть с каждым клеточным делением, так что введенный рекомбинантный полинуклеотид нельзя выявить в дочерних клетках после достаточного числа клеточных делений.A plant or plant cell can be transformed by integrating the recombinant polynucleotide into its genome to ensure its stable transformation. The plant or plant cell described herein may be stably transformed. Stably transformed cells typically retain the introduced polynucleotide with each cell division. The plant or plant cell may also be transiently transformed such that the recombinant polynucleotide does not integrate into its genome. Transiently transformed cells typically lose all or some of the introduced recombinant polynucleotide with each cell division such that the introduced recombinant polynucleotide cannot be detected in daughter cells after a sufficient number of cell divisions.
Из уровня техники доступен ряд способов для трансформации клетки растения, включающий биолистику; методики с применением генной пушки; трансформацию, опосредованную Agrobacterium; трансформацию, опосредованную вирусным вектором; способ на основе замораживания-оттаивания; бомбардировку микрочастицами; прямое поглощение ДНК; ультразвуковую обработку; микроинъекцию; перенос, опосредованный вирусом растения; и электропорацию. Система на основе Agrobacterium для интеграции чужеродной ДНК в хромосомы растений в широких масштабах изучалась, модифицировалась и использовалась для генной инженерии растений. Молекулы депротеинизированной рекомбинантной ДНК, содержащие ДНК-последовательности, соответствующие исследуемому очищенному полипептиду, функционально связанные в смысловой или антисмысловой ориентации с регуляторными последовательностями, соединяют с соответствующими последовательностями Т-ДНК с помощью общепринятых способов. Их вводят в протопласты с помощью методики с применением полиэтиленгликоля или методики с применением электропорации, обе из которых являются стандартными. В качестве альтернативы, такие векторы, содержащие молекулы рекомбинантной ДНК, кодирующие исследуемый очищенный полипептид, вводят в живые клетки Agrobacterium, которые затем переносят ДНК в клетки растения. Трансформацию с помощью депротеинизированной ДНК без сопутствующих последовательностей вектора на основе Т-ДНК можно выполнять посредством слияния протопластов с ДНК-содержащими липосомами или посредством электропорации. Депротеинизированную ДНК без сопутствующих последовательностей вектора на основе Т-ДНК также можно применять для трансформации клеток с помощью инертных, высокоскоростных микрочастиц.A number of methods are available in the art for transforming a plant cell, including biolistics; gene gun techniques; transformation mediated by Agrobacterium; transformation mediated by a viral vector; freeze-thaw method; microparticle bombardment; direct DNA uptake; ultrasonic treatment; microinjection; plant virus-mediated transfer; and electroporation. An Agrobacterium-based system for integrating foreign DNA into plant chromosomes has been extensively studied, modified and used for plant genetic engineering. Deproteinized recombinant DNA molecules containing DNA sequences corresponding to the purified polypeptide of interest, operably linked in sense or antisense orientation to regulatory sequences, are coupled to the corresponding T-DNA sequences using conventional methods. They are introduced into protoplasts using a polyethylene glycol technique or an electroporation technique, both of which are standard. Alternatively, such vectors containing recombinant DNA molecules encoding the purified polypeptide of interest are introduced into living Agrobacterium cells, which then transfer the DNA into plant cells. Transformation with deproteinized DNA without accompanying T-DNA vector sequences can be performed by protoplast fusion with DNA-containing liposomes or by electroporation. Deproteinized DNA without accompanying T-DNA vector sequences can also be used to transform cells with inert, high speed microparticles.
Если клетку или культивируемую ткань применяют в качестве реципиентной ткани для трансформации, при необходимости растения можно регенерировать из трансформированных культур с помощью методов, известных специалистам в данной области техники.If a cell or cultured tissue is used as a recipient tissue for transformation, if necessary, plants can be regenerated from the transformed cultures using methods known to those skilled in the art.
Выбор регуляторных участков, подлежащих включению в рекомбинантную конструкцию, зависит от нескольких факторов, в том числе без ограничения от эффективности, селектируемости, индуцируемости, необходимого уровня экспрессии и предпочтительной экспрессии в определенных клетках или тканях. Обычной задачей для специалиста в данной области техники является модулирование экспрессии кодирующей последовательности посредством правильного выбора регуляторных участков и их размещения по отношению к кодирующей последовательности. Транскрипцию полинуклеотида можно модулировать сходным образом. Некоторые подходящие регуляторные участки инициируют транскрипцию исключительно или преимущественно в определенных типах клеток. Способы идентификации и установления характеристик регуляторных участков в геномной ДНК растений хорошо известны в данной области техники.The choice of regulatory regions to be included in a recombinant construct depends on several factors, including, without limitation, potency, selectivity, inducibility, desired level of expression, and preferential expression in certain cells or tissues. It is a common task for a person skilled in the art to modulate the expression of a coding sequence through the correct selection of regulatory regions and their placement in relation to the coding sequence. Transcription of a polynucleotide can be modulated in a similar manner. Some suitable regulatory sites initiate transcription exclusively or predominantly in certain cell types. Methods for identifying and characterizing regulatory regions in plant genomic DNA are well known in the art.
Подходящие промоторы включают тканеспецифичные промоторы, распознаваемые тканеспецифичными факторами, присутствующими в разных тканях или типах клеток (например, специфичные для корня промоторы, специфичные для побега промоторы, специфичные для ксилемы промоторы), или присутствующими на различных стадиях развития, или присутствующими в ответ на разные условия окружающей среды. Подходящие промоторы включают конститутивные промоторы, которые могут быть активированы в большинстве типов клеток, не требуя специфических индукторов. Примеры подходящих промоторов для управления выработкой RNAi-полинуклеотида включают промотор 35S вируса мозаики цветной капусты (CaMV/35S), SSU, OCS, lib4, usp, STLS1, B33, nos или промоторы гена убиквитина или гена фазеолина. Специалисты в данной области техники могут создавать множество вариантов рекомбинантных промоторов.Suitable promoters include tissue-specific promoters recognized by tissue-specific factors present in different tissues or cell types (e.g., root-specific promoters, shoot-specific promoters, xylem-specific promoters), or present at different developmental stages, or present in response to different environmental conditions. Suitable promoters include constitutive promoters that can be activated in most cell types without the need for specific inducers. Examples of suitable promoters for directing RNAi polynucleotide production include the cauliflower mosaic virus (CaMV/35S) 35S promoter, SSU, OCS, lib4, usp, STLS1, B33, nos, or ubiquitin gene or phaseolin gene promoters. Many variants of recombinant promoters can be created by those skilled in the art.
Тканеспецифичные промоторы представляют собой элементы управления транскрипцией, которые активны только в определенных клетках или тканях в определенные моменты времени в ходе развития растений, например в вегетативных тканях или репродуктивных тканях. Тканеспецифичная экспрессия может быть преимущественной, например, если предпочтительной является экспрессия полинуклеотидов в определенных тканях. Примеры тканеспецифичных промоторов, находящихся под контролем в ходе развития, включают промоторы, которые могут инициировать транскрипцию только (или в основном только) в определенных тканях, таких как вегетативные ткани, например корни или листья, или репродуктивные ткани, такие как плоды, семяпочки, семена, пыльца, тычинки, цветки или любая эмбриональная ткань. Промоторы, специфичные для репродуктивных тканей, могут являться, например, специфичными для пыльника, специфичными для семяпочки, специфичными для зародыша, специфичными для эндосперма, специфичными для интегумента, специфичными для семени и кожуры семени, специфичными для пыльцы, специфичными для лепестка, специфичными для чашелистика или для комбинаций таковых.Tissue-specific promoters are transcriptional controls that are active only in certain cells or tissues at certain points in time during plant development, such as in vegetative tissues or reproductive tissues. Tissue-specific expression may be preferential, for example, if expression of polynucleotides in certain tissues is preferred. Examples of tissue-specific promoters under developmental control include promoters that can initiate transcription only (or mostly only) in certain tissues, such as vegetative tissues, e.g. roots or leaves, or reproductive tissues such as fruits, ovules, seeds, pollen, stamens, flowers or any embryonic tissue. Promoters specific for reproductive tissues can be, for example, anther specific, ovule specific, embryo specific, endosperm specific, integument specific, seed and seed coat specific, pollen specific, petal specific, sepal specific, or combinations thereof.
Подходящие специфичные для листа промоторы включают промотор гена пируватортофосфатдикиназы (PPDK) из C4-растения (кукурузы), промотор cab-m1Ca+2 из кукурузы, промотор родственных myb генов из Arabidopsis thaliana (Atmyb5), промоторы рибулозобифосфаткарбоксилазы (RBCS) (например, генов томата RBCS 1, RBCS2 и RBCS3A, экспрессируемых в листьях и выращенных на свету саженцах, RBCS1 и RBCS2, экспрессируемых в развивающихся плодах томата, или промотор гена рибулозобифосфаткарбоксилазы, экспрессируемый на высоких уровнях почти исключительно в мезофильных клетках листовых пластинок и листовых пазух).Suitable leaf-specific promoters include the pyruvatortophosphate dikinase (PPDK) gene promoter from a C4 plant (maize), the cab-m1Ca+2 promoter from maize, the myb-related genes promoter from Arabidopsis thaliana (Atmyb5), ribulose bisphosphate carboxylase (RBCS) promoters (e.g., tomato leaf-expressed genes RBCS 1, RBCS2, and RBCS3A). and light-grown seedlings, RBCS1 and RBCS2 expressed in developing tomato fruits, or the promoter of the ribulose bisphosphate carboxylase gene, expressed at high levels almost exclusively in mesophilic cells of leaf blades and leaf axils).
Подходящие специфичные для стареющих тканей промоторы включают промотор из томата, активный во время созревания плодов, старения и опадения листьев, промотор гена, кодирующего цистеиновую протеазу маиса, промотор 82E4 и промотор генов SAG. Можно применять подходящие специфичные для пыльника промоторы. Можно выбрать подходящие предпочтительные для корней промоторы, известные специалистам в данной области техники. Подходящие промоторы для экспрессии предпочтительно в семенах включают как специфичные для семян промоторы (промоторы, активные в процессе развития семян, такие как промоторы запасных полипептидов семян), так и промоторы прорастающих семян (промоторы, активные во время прорастания семян). Такие предпочтительные для семян промоторы включают Cim1 (цитокинин-индуцированный сигнал); cZ19B1 (19 кДa зеин кукурузы); milps (миоинозитол-1-фосфатсинтаза); mZE40-2, также известный как Zm-40; nuclc; и celA (целлюлозосинтаза). Промотор гена гамма-зеина представляет собой специфичный для эндосперма промотор. Промотор гена Glob-1 представляет собой специфичный для зародыша промотор. Для двудольных растений специфичные для семян промоторы включают промотор гена бета-фазеолина фасоли, гена напина, генаβ-конглицинина, гена лектина сои, гена круциферина и т. п. Для однодольных растений специфичные для семян промоторы включают промотор гена зеина кукурузы с молекулярной массой 15 кДа, промотор гена зеина с молекулярной массой 22 кДа, промотор гена зеина с молекулярной массой 27 кДа, промотор гена g-зеина, промотор гена гамма-зеина с молекулярной массой 27 кДа (такой как промотор gzw64A, см. номер доступа S78780 в Genbank), промотор гена waxy, промотор гена shrunken 1, промотор гена shrunken 2, промотор гена глобулина 1 (см. номер доступа L22344 в Genbank), промотор гена Itp2, промотор гена cim1, промоторы генов end1 и end2 кукурузы, промотор гена nuc1, промотор гена Zm40, промотор гена eep1 и eep2; промотор гена lec1, промотор гена тиоредоксина H; промотор гена mlip15, промотор гена PCNA2 и промотор гена shrunken-2.Suitable aging tissue-specific promoters include the promoter from tomato, active during fruit ripening, senescence and leaf abscission, the promoter of the gene encoding maize cysteine protease, the 82E4 promoter, and the promoter of the SAG genes. Suitable anther-specific promoters can be used. Suitable root-preferred promoters known to those skilled in the art can be selected. Suitable promoters for expression preferably in seeds include both seed-specific promoters (promoters active during seed development, such as seed storage polypeptide promoters) and germinating seed promoters (promoters active during seed germination). Such seed-preferred promoters include Cim1 (cytokinin-induced signal); cZ19B1 (19 kDa maize zein); milps (myoinositol-1-phosphate synthase); mZE40-2, also known as Zm-40; nuclc; and celA (cellulose synthase). The gamma-zein gene promoter is an endosperm-specific promoter. The Glob-1 gene promoter is a germ-specific promoter. For dicotyledonous plants, seed-specific promoters include the promoter of the bean bean phaseolin gene, the napin gene, the β-conglycinin gene, the soybean lectin gene, the cruciferin gene, and the like. 27 kDa zein gene promoter, g-zein gene promoter, 27 kD gamma-zein gene promoter (such as the gzw64A promoter, see Genbank accession number S78780), waxy gene promoter, shrunken 1 gene promoter, shrunken 2 gene promoter, globulin 1 gene promoter (see accession number L223 44 in Genbank), Itp2 gene promoter, cim1 gene promoter, maize end1 and end2 gene promoters, nuc1 gene promoter, Zm40 gene promoter, eep1 and eep2 gene promoter; lec1 gene promoter, thioredoxin H gene promoter; mlip15 gene promoter, PCNA2 gene promoter, and shrunken-2 gene promoter.
Примеры индуцируемых промоторов включают промоторы, реагирующие на воздействие патогенов, анаэробные условия, повышенную температуру, свет, засуху, низкую температуру или высокую концентрацию солей. Патоген-индуцируемые промоторы включают промоторы связанных с патогенезом полипептидов (PR-полипептидов), индуцирование которых происходит после инфицирования патогеном (например, PR-полипептиды, SAR-полипептиды, бета-1,3-глюканаза, хитиназа).Examples of inducible promoters include those responsive to pathogens, anaerobic conditions, heat, light, drought, low temperature, or high salt concentration. Pathogen-inducible promoters include promoters of pathogenesis-associated polypeptides (PR polypeptides) that are inducible after infection with a pathogen (eg, PR polypeptides, SAR polypeptides, beta-1,3-glucanase, chitinase).
Дополнительно к промоторам растений другие подходящие промоторы могут иметь бактериальное происхождение, например промотор гена октопинсинтазы, промотор гена нопалинсинтазы и другие промоторы, полученные из Ti-плазмид, или они могут быть получены из вирусных промоторов (например, промоторов 35S и 19S РНК вируса мозаики цветной капусты (CaMV), конститутивных промоторов вируса табачной мозаики, промоторов 19S и 35S вируса мозаики цветной капусты (CaMV) или промотора 35S вируса мозаики норичника).In addition to plant promoters, other suitable promoters may be of bacterial origin, such as the octopine synthase gene promoter , the nopaline synthase gene promoter, and other promoters derived from Ti plasmids, or they may be derived from viral promoters (e.g., cauliflower mosaic virus (CaMV) 35S and 19S RNA promoters, constitutive tobacco mosaic virus promoters, 19S and 35S virus promoters). cauliflower mosaic virus (CaMV) or the 35S promoter of the boletus mosaic virus).
Подходящие способы введения полинуклеотидов в клетки растения и последующей вставки в геном растения включают микроинъекцию (Crossway et al., Biotechniques 4:320-334 (1986)), электропорацию (Riggs et al., Proc. Natl. Acad. Sci. USA 83:5602-5606 (1986)), трансформацию, опосредованную Agrobacterium (патент США №№ 5981840 и 5563055), прямой перенос генов (Paszkowski et al., EMBO J. 3:2717-2722 (1984)) и баллистическое ускорение частиц (см., например, патенты США №№ 4945050; 5879918; 5886244; 5932782; Tomes et al., в Plant Cell, Tissue, and Organ Culture: Fundamental Methods, ed. Gamborg and Phillips (Springer-Verlag, Berlin) (1995), а также McCabe et al., Biotechnology 6:923-926 (1988)).Suitable methods for introducing polynucleotides into plant cells and subsequent insertion into the plant genome include microinjection (Crossway et al., Biotechniques 4:320-334 (1986)), electroporation (Riggs et al., Proc. Natl. Acad. Sci. USA 83:5602-5606 (1986)), Agrobacterium-mediated transformation (U.S. Patent No. 5,981,840 and 5,563,055), direct gene transfer (Paszkowski et al., EMBO J. 3:2717-2722 (1984)) and ballistic particle acceleration (see, for example, US Pat. Nos. 4,945,050; 5,879,918; 5,886,244; Tissue, and Organ Culture: Fundamental Methods, ed Gamborg and Phillips (Springer-Verlag, Berlin) (1995) and McCabe et al., Biotechnology 6:923-926 (1988)).
МутацияMutation
Раскрыты растение или клетка растения, содержащие мутацию в одном или более полинуклеотидах или полипептидах, описанных в данном документе, где указанная мутация в результате приводит к модуляции функции или активности AAT. Помимо описанных мутаций, мутантное растение или клетки растения могут характеризоваться наличием одной или более дополнительных мутаций либо в тех же полинуклеотидах или полипептидах, которые описаны в данном документе, либо в одном или более других полинуклеотидах или полипептидах в геноме.Disclosed is a plant or plant cell containing a mutation in one or more of the polynucleotides or polypeptides described herein, where said mutation results in modulation of AAT function or activity. In addition to the mutations described, the mutant plant or plant cells may be characterized by the presence of one or more additional mutations either in the same polynucleotides or polypeptides as described herein or in one or more other polynucleotides or polypeptides in the genome.
Также предусмотрен способ модулирования уровня полипептида AAT, описанного в данном документе, в (подвергнутом сушке) растении или в (подвергнутом сушке) растительном материале, при этом указанный способ включает введение в геном указанного растения одной или более мутаций, которые модулируют экспрессию по меньшей мере одного гена, где указанный по меньшей мере один ген выбран из последовательностей в соответствии с настоящим изобретением.Also provided is a method for modulating the level of an AAT polypeptide described herein in a (dried) plant or in a (dried) plant material, said method comprising introducing into the genome of said plant one or more mutations that modulate the expression of at least one gene, wherein said at least one gene is selected from sequences according to the present invention.
Также предусмотрен способ идентификации растения с модулированными уровнями AAT, при этом указанный способ включает скрининг образца полинуклеотида из представляющего интерес растения в отношении наличия одной или более мутаций в последовательностях в соответствии с настоящим изобретением, и необязательно соотнесение идентифицированной мутации(мутаций) с мутацией(мутациями), которая(которые), как известно, модулирует уровни одного или AAT.Also provided is a method for identifying a plant with modulated AAT levels, said method comprising screening a polynucleotide sample from a plant of interest for the presence of one or more mutations in sequences in accordance with the present invention, and optionally correlating the identified mutation(s) with mutation(s) known to modulate levels of one or AAT.
Также раскрыты растение или клетка, которые являются гетерозиготными или гомозиготными в отношении одной или более мутаций в гене в соответствии с настоящим изобретением, при этом указанная мутация в результате приводит к модулированной экспрессии гена или функции или активности полипептида, кодируемого таковым.Also disclosed is a plant or cell that is heterozygous or homozygous for one or more mutations in a gene of the present invention, said mutation resulting in modulated expression of the gene or the function or activity of the polypeptide encoded by it.
Для комбинирования мутаций в одном растении можно применять целый ряд подходов, в том числе половое скрещивание. Растение, характеризующееся наличием одной или более благоприятных мутаций в гетерозиготном или гомозиготном состоянии в гене в соответствии с настоящим изобретением, которые модулируют экспрессию гена или функцию или активность полипептида, кодируемого таковым, можно скрещивать с растением, характеризующимся наличием одной или более благоприятных мутаций в гетерозиготном или гомозиготном состоянии в одном или более генах, которые модулируют их экспрессию или функцию или активность полипептида, кодируемого таковыми. В одном варианте осуществления скрещивания проводят для введения одной или более благоприятных мутаций в гетерозиготном или гомозиготном состоянии в ген в соответствии с настоящим изобретением в одном и том же растении.A number of approaches can be used to combine mutations in a single plant, including sexual crossing. A plant characterized by the presence of one or more favorable heterozygous or homozygous mutations in a gene according to the present invention that modulate the expression of a gene or the function or activity of the polypeptide encoded by such can be crossed with a plant characterized by the presence of one or more favorable heterozygous or homozygous mutations in one or more genes that modulate their expression or function or activity of the polypeptide that encodes oh those. In one embodiment, crosses are carried out to introduce one or more favorable mutations in a heterozygous or homozygous state in a gene in accordance with the present invention in the same plant.
Функция или активность одного или более полипептидов по настоящему изобретению в растении являются повышенными или пониженными, если функция или активность являются более низкими или более высокими, чем функция или активность того же полипептида(полипептидов) в растении, которое не было модифицировано для подавления функции или активности этого полипептида, и которое культивировали, собирали и подвергали сушке с применением тех же протоколов.The function or activity of one or more polypeptides of the present invention in a plant is increased or decreased if the function or activity is lower or higher than the function or activity of the same polypeptide(s) in a plant that has not been modified to suppress the function or activity of that polypeptide and that has been cultured, harvested and dried using the same protocols.
В некоторых вариантах осуществления мутацию(мутации) вводят в растение или клетку растения с применением подхода с обеспечением мутагенеза, и введенную мутацию идентифицируют или подвергают отбору с применением способов, известных специалистам в данной области техники, таких как анализ методом Саузерн-блоттинга, секвенирование ДНК, ПЦР-анализ или фенотипический анализ. Мутации, которые влияют на экспрессию гена или которые нарушают функцию кодируемого полипептида, можно определять с применением способов, хорошо известных из уровня техники. Инсерционные мутации в экзонах гена, как правило, в результате приводят к образованию нефункциональных мутантных вариантов. Мутации по консервативным остаткам могут быть особенно эффективными для подавления метаболической функции кодируемого полипептида. Например, понятно, что мутация в одном или более высококонсервативных участках будет, очевидно, обеспечивать корректировку функции полипептида, в то время как мутация вне этих высококонсервативных участков будет, очевидно, оказывать незначительное влияния на функцию полипептида или не будет влиять на него. Дополнительно мутация в одном нуклеотиде может приводить к возникновению стоп-кодона, наличие которого в результате приведет к получению усеченного полипептида и, в зависимости от степени усечения, потере функции.In some embodiments, the mutation(s) are introduced into a plant or plant cell using a mutagenesis enabling approach, and the introduced mutation is identified or selected using methods known to those skilled in the art, such as Southern blot analysis, DNA sequencing, PCR analysis, or phenotypic analysis. Mutations that affect gene expression or that disrupt the function of the encoded polypeptide can be determined using methods well known in the art. Insertional mutations in exons of a gene, as a rule, result in the formation of non-functional mutant variants. Mutations at conserved residues may be particularly effective in suppressing the metabolic function of the encoded polypeptide. For example, it is understood that a mutation in one or more of the highly conserved regions will likely provide an adjustment to the function of the polypeptide, while a mutation outside of these highly conserved regions will likely have little or no effect on the function of the polypeptide. Additionally, a single nucleotide mutation can result in a stop codon, the presence of which will result in a truncated polypeptide and, depending on the degree of truncation, loss of function.
Также раскрыты способы получения мутантных полинуклеотидов и полипептидов. Любое представляющее интерес растение, в том числе клетку растения или растительный материал, можно генетически модифицировать различными способами, с помощью которых, как известно, индуцируют мутагенез, в том числе сайт-направленный мутагенез, олигонуклеотид-направленный мутагенез, индуцируемый химическими соединениями мутагенез, индуцируемый ионизирующим излучением мутагенез, мутагенез с применением модифицированных оснований, мутагенез с применением ДНК-дуплекса с гэпом, мутагенез с двунитевыми разрывами, мутагенез с применением линий-хозяев с нарушенной репарацией, мутагенез посредством синтеза полного гена, перетасовка ДНК и другие эквивалентные способы.Methods for producing mutant polynucleotides and polypeptides are also disclosed. Any plant of interest, including a plant cell or plant material, can be genetically modified in a variety of ways known to induce mutagenesis, including site-directed mutagenesis, oligonucleotide-directed mutagenesis, chemical compound-induced mutagenesis, ionizing radiation-induced mutagenesis, modified base mutagenesis, DNA duplex mutagenesis gap mutagenesis, double-strand break mutagenesis, mutagenesis using repair-defective host lines, mutagenesis by whole gene synthesis, DNA shuffling, and other equivalent methods.
Также раскрыты фрагменты полинуклеотидов и полипептидов. Фрагменты полинуклеотида могут кодировать фрагменты полипептида, которые сохраняют биологическую функцию нативного полипептида и, следовательно, задействованы в сети транспортировки метаболитов в растении. В качестве альтернативы, фрагменты полинуклеотида, которые являются применимыми в качестве зондов для гибридизации или ПЦР-праймеров, как правило, не кодируют фрагментов полипептида, сохраняющих биологическую функцию. Кроме того, фрагменты раскрытых полинуклеотидов включают такие фрагменты, которые могут быть собраны в рекомбинантные конструкции, как обсуждалось в данном документе. Фрагменты полинуклеотида могут находиться в диапазоне от по меньшей мере приблизительно 25 нуклеотидов, приблизительно 50 нуклеотидов, приблизительно 75 нуклеотидов, приблизительно 100 нуклеотидов, приблизительно 150 нуклеотидов, приблизительно 200 нуклеотидов, приблизительно 250 нуклеотидов, приблизительно 300 нуклеотидов, приблизительно 400 нуклеотидов, приблизительно 500 нуклеотидов, приблизительно 600 нуклеотидов, приблизительно 700 нуклеотидов, приблизительно 800 нуклеотидов, приблизительно 900 нуклеотидов, приблизительно 1000 нуклеотидов, приблизительно 1100 нуклеотидов, приблизительно 1200 нуклеотидов, приблизительно 1300 нуклеотидов или приблизительно 1400 нуклеотидов и до полноразмерного полинуклеотида, кодирующего полипептиды, описанные в данном документе. Фрагменты полипептида могут находиться в диапазоне от по меньшей мере приблизительно 25 аминокислот, приблизительно 50 аминокислот, приблизительно 75 аминокислот, приблизительно 100 аминокислот, приблизительно 150 аминокислот, приблизительно 200 аминокислот, приблизительно 250 аминокислот, приблизительно 300 аминокислот, приблизительно 400 аминокислот, приблизительно 500 аминокислот и до полноразмерного полипептида, описанного в данном документе. Мутантные варианты полипептида можно применять для создания мутантных, не встречающихся в природе или трансгенных растений (например, мутантных, не встречающихся в природе, трансгенных, созданных человеком или полученных с помощью методик генной инженерии растений) или клеток растения, содержащих один или более мутантных вариантов полипептида. Предпочтительно, мутантные варианты полипептида сохраняют функцию полипептида, не подвергнутого мутированию. Функция мутантного варианта полипептида может быть выше, ниже или приблизительно такой же, как у полипептида, не подвергнутого мутированию.Also disclosed are fragments of polynucleotides and polypeptides. Polynucleotide fragments may encode polypeptide fragments that retain the biological function of the native polypeptide and are therefore involved in the plant's metabolite transport network. Alternatively, polynucleotide fragments that are useful as hybridization probes or PCR primers generally do not encode polypeptide fragments that retain biological function. In addition, fragments of the disclosed polynucleotides include those fragments that can be assembled into recombinant constructs, as discussed herein. Polynucleotide fragments can range from at least about 25 nucleotides, about 50 nucleotides, about 75 nucleotides, about 100 nucleotides, about 150 nucleotides, about 200 nucleotides, about 250 nucleotides, about 300 nucleotides, about 400 nucleotides, about 500 nucleotides, about 600 nucleotides, about 700 nucleotides, about 800 nucleotides, about 900 nucleotides, about 1000 nucleotides, about 1100 nucleotides, about 1200 nucleotides, about 1300 nucleotides, or about 1400 nucleotides, up to a full length polynucleotide encoding the polypeptides described herein. Polypeptide fragments can range from at least about 25 amino acids, about 50 amino acids, about 75 amino acids, about 100 amino acids, about 150 amino acids, about 200 amino acids, about 250 amino acids, about 300 amino acids, about 400 amino acids, about 500 amino acids, and up to the full length polypeptide described herein. Mutant variants of a polypeptide can be used to create mutant, non-naturally occurring or transgenic plants (e.g., mutant, non-naturally occurring, transgenic, human-generated, or genetically engineered plants) or plant cells containing one or more mutant polypeptide variants. Preferably, mutant variants of the polypeptide retain the function of the unmutated polypeptide. The function of a mutant polypeptide variant may be higher, lower, or approximately the same as that of an unmutated polypeptide.
Мутации в полинуклеотидах и полипептидах, описанных в данном документе, могут включать внесенные человеком мутации, или искусственные мутации, или мутации, созданные с помощью генной инженерии. Мутации в полинуклеотидах и полипептидах, описанных в данном документе, могут представлять собой мутации, которые получены или которые можно получить посредством способа, который включает стадию манипуляции in vitro или in vivo. Мутации в полинуклеотидах и полипептидах, описанных в данном документе, могут представлять собой мутации, которые получены или которые можно получить посредством способа, который предусматривает вмешательство человека.Mutations in the polynucleotides and polypeptides described herein may include human-made mutations, or artificial mutations, or genetically engineered mutations. Mutations in the polynucleotides and polypeptides described herein may be mutations that are made or can be made by a method that includes an in vitro or in vivo manipulation step. Mutations in the polynucleotides and polypeptides described herein may be mutations that are made or that can be made by a method that involves human intervention.
Способы, с помощью которых вводят мутацию случайным образом в полинуклеотид, могут включать химический мутагенез и радиационный мутагенез. Химический мутагенез предусматривает применение экзогенно добавляемых химических веществ, таких как мутагенные, тератогенные или канцерогенные органические соединения, для индуцирования мутаций. Для создания мутаций можно применять мутагены, которые создают главным образом точечные мутации и короткие делеции, вставки, миссенс-мутации, простые повторяющиеся последовательности, трансверсии и/или транзиции, в том числе химические мутагены и излучение. Мутагены включают этилметансульфонат, метилметансульфонат, N-этил-N-нитрозомочевину, триэтилмеламин, N-метил-N-нитрозомочевину, прокарбазин, хлорамбуцил, циклофосфамид, диэтилсульфат, акриламидный мономер, мельфалан, азотистый иприт, винкристин, диметилнитрозамин, N-метил-N'-нитро-нитрозогуанидин, нитрозогуанидин, 2-аминопурин, 7,12-диметил-бенз(a)антрацен, этиленоксид, гексаметилфосфорамид, бисульфан, диэпоксиалканы (диэпоксиоктан, диэпоксибутан и т. п.), 2-метокси-6-хлор-9[3-(этил-2-хлорэтил)аминопропиламино]акридина дигидрохлорид и формальдегид.Methods by which a mutation is randomly introduced into a polynucleotide may include chemical mutagenesis and radiation mutagenesis. Chemical mutagenesis involves the use of exogenously added chemicals such as mutagenic, teratogenic, or carcinogenic organic compounds to induce mutations. To create mutations, mutagens can be used that create primarily point mutations and short deletions, insertions, missense mutations, simple repeat sequences, transversions and/or transitions, including chemical mutagens and radiation. Mutagens include ethyl methanesulfonate, methyl methanesulfonate, N-ethyl-N-nitrosourea, triethylmelamine, N-methyl-N-nitrosourea, procarbazine, chlorambucil, cyclophosphamide, diethyl sulfate, acrylamide monomer, melphalan, nitrogen mustard, vincristine, dimethylnitrosamine, N-methyl-N'-nitro-nitrosoguanidine, nitro zoguanidine, 2-aminopurine, 7,12-dimethyl-benz(a)anthracene, ethylene oxide, hexamethylphosphoramide, bisulfan, diepoxyalkanes (diepoxyoctane, diepoxybutane, etc.), 2-methoxy-6-chloro-9[3-(ethyl-2-chloroethyl)aminopropylamino]acridine dihydrochloride and formaldehyde.
Также предусмотрены спонтанные мутации в локусе, которые могут не быть непосредственно вызванными мутагеном, при условии, что они приводят к возникновению необходимого фенотипа. Подходящие мутагенные средства могут также включать, например, ионизирующее излучение, такое как рентгеновское излучение, гамма-излучение, излучение быстрых нейтронов и ультрафиолетовое излучение. Дозу мутагенного химического вещества или излучения определяют экспериментально для каждого типа ткани растения таким образом, чтобы получить частоту мутаций, которая ниже порогового уровня, характеризующегося летальностью или репродуктивной стерильностью. Любой способ получения полинуклеотида растения, известный специалистам в данной области техники, можно применять для получения полинуклеотида растения для скрининга в отношении мутаций.Also contemplated are spontaneous mutations at the locus, which may not be directly caused by the mutagen, provided that they result in the desired phenotype. Suitable mutagenic agents may also include, for example, ionizing radiation such as x-rays, gamma rays, fast neutron radiation and ultraviolet radiation. The dose of the mutagenic chemical or radiation is determined experimentally for each type of plant tissue so as to obtain a mutation rate that is below a threshold level characterized by lethality or reproductive sterility. Any method for obtaining a plant polynucleotide known to those skilled in the art can be used to obtain a plant polynucleotide for mutation screening.
Способ мутации может включать одну или более стадий скрещивания растений.The mutation method may include one or more plant crossing steps.
После внесения мутации можно провести скрининг для идентификации мутаций, которые обеспечивают возникновение генов с преждевременными стоп-кодонами или иным образом нефункциональных генов. После внесения мутации можно провести скрининг для идентификации мутаций, которые обеспечивают возникновение функциональных генов, которые способны экспрессироваться на повышенных или пониженных уровнях. Скрининг в отношении мутантных вариантов можно выполнять с помощью секвенирования, или путем применения одного или более зондов или праймеров, специфичных для данного гена или полипептида. В полинуклеотидах можно также обеспечивать возникновение конкретных мутаций, которые могут в результате приводить к модулированию экспрессии гена, модулированию стабильности мРНК или модулированию стабильности полипептида. В данном документе такие растения называются «не встречающимися в природе» или «мутантными» растениями. Как правило, мутантные или не встречающиеся в природе растения содержат по меньшей мере часть чужеродного, или синтетического, или созданного человеком нуклеотида (например, ДНК или РНК), которая не присутствовала в растении до проведения с ним манипуляций. Чужеродный нуклеотид может представлять собой один нуклеотид, два или более нуклеотидов, два или более смежных нуклеотидов или два или более несмежных нуклеотидов, как, например, по меньшей мере 10, 20, 30, 40, 50,100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400 или 1500 или больше смежных или несмежных нуклеотидов.Once a mutation has been introduced, screening can be performed to identify mutations that give rise to genes with premature stop codons or otherwise non-functional genes. Once a mutation has been introduced, screening can be performed to identify mutations that give rise to functional genes that are capable of being expressed at increased or decreased levels. Screening for mutant variants can be performed by sequencing, or by using one or more probes or primers specific for a given gene or polypeptide. Polynucleotides can also be engineered to generate specific mutations that can result in modulation of gene expression, modulation of mRNA stability, or modulation of polypeptide stability. In this document, such plants are referred to as "non-naturally occurring" or "mutant" plants. Typically, mutant or non-naturally occurring plants contain at least a portion of the foreign or synthetic or human-made nucleotide (eg, DNA or RNA) that was not present in the plant prior to being manipulated. The foreign nucleotide may be one nucleotide, two or more nucleotides, two or more contiguous nucleotides, or two or more non-contiguous nucleotides such as at least 10, 20, 30, 40, 50,100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100 , 1200, 1300, 1400 or 1500 or more contiguous or non-contiguous nucleotides.
Трансгеника и редактированиеTransgenics and editing
Помимо мутагенеза, композиции, которые могут модулировать экспрессию, или функцию, или активность одного или более полинуклеотидов или полипептидов, описанных в данном документе, включают специфичные в отношении последовательности полинуклеотиды, которые могут нарушать транскрипцию одного или более эндогенных генов; специфичные в отношении последовательности полинуклеотиды, которые могут нарушать трансляцию РНК-транскриптов (например, двунитевые РНК, siRNA, рибозимы); специфичные в отношении последовательности полинуклеотиды, которые могут нарушать стабильность одного или более полипептидов; специфичные в отношении последовательности полинуклеотиды, которые могут нарушать ферментативную функцию одного или более полипептидов или функцию связывания одного или более полипептидов в отношении субстратов или регуляторных полипептидов; антитела, которые проявляют специфичность в отношении одного или более полипептидов; низкомолекулярные соединения, которые могут нарушать стабильность одного или более полипептидов, или ферментативную функцию одного или более полипептидов, или функцию связывания одного или более полипептидов; полипептиды с «цинковыми пальцами», которые связывают один или более полинуклеотидов; и мегануклеазы, которые обладают функцией в отношении одного или более полинуклеотидов. Технологии редактирования гена, генетические технологии редактирования и технологии редактирование генома хорошо известны в данной области техники.In addition to mutagenesis, compositions that can modulate the expression or function or activity of one or more of the polynucleotides or polypeptides described herein include sequence-specific polynucleotides that can disrupt the transcription of one or more endogenous genes; sequence-specific polynucleotides that can disrupt translation of RNA transcripts (eg, double-stranded RNA, siRNA, ribozymes); sequence-specific polynucleotides that can disrupt the stability of one or more polypeptides; sequence-specific polynucleotides that can interfere with the enzymatic function of one or more polypeptides or the binding function of one or more polypeptides with respect to substrates or regulatory polypeptides; antibodies that show specificity for one or more polypeptides; small molecule compounds that can interfere with the stability of one or more polypeptides, or the enzymatic function of one or more polypeptides, or the binding function of one or more polypeptides; zinc finger polypeptides that bind one or more polynucleotides; and meganucleases that have a function on one or more polynucleotides. Gene editing technologies, genetic editing technologies and genome editing technologies are well known in the art.
Нуклеазы с «цинковыми пальцами»Zinc finger nucleases
Полипептиды с «цинковыми пальцами» можно применять для модулирования экспрессии, или функции, или активности одного или более полинуклеотидов, описанных в данном документе. В различных вариантах осуществления последовательность геномной ДНК, содержащую часть или всю кодирующую последовательность полинуклеотида, модифицируют путем мутагенеза, опосредованного нуклеазой с «цинковыми пальцами». В последовательности геномной ДНК осуществляют поиск уникального сайта для связывания полипептида с «цинковыми пальцами». В качестве альтернативы, в последовательности геномной ДНК осуществляют поиск двух уникальных сайтов для связывания полипептида с «цинковыми пальцами», при этом оба сайта находятся на противоположных нитях и близко друг к другу, например на расстоянии 1, 2, 3, 4, 5, 6 или более пар оснований друг от друга. Соответственно, предусмотрены полипептиды с «цинковыми пальцами», которые связываются с полинуклеотидами.Zinc finger polypeptides can be used to modulate the expression or function or activity of one or more of the polynucleotides described herein. In various embodiments, a genomic DNA sequence containing part or all of the coding sequence of a polynucleotide is modified by zinc finger nuclease-mediated mutagenesis. In the genomic DNA sequence, a search is made for a unique site for binding the polypeptide to zinc fingers. Alternatively, the genomic DNA sequence is searched for two unique zinc finger binding sites for the polypeptide, with both sites on opposite strands and close to each other, e.g. 1, 2, 3, 4, 5, 6 or more base pairs apart. Accordingly, zinc finger polypeptides that bind to polynucleotides are provided.
Полипептид с «цинковыми пальцами» можно сконструировать для распознавания выбранного сайта-мишени в гене. Полипептид с «цинковыми пальцами» может содержать любую комбинацию мотивов, полученных из природных ДНК-связывающих доменов с «цинковыми пальцами» и неприродных ДНК-связывающих доменов с «цинковыми пальцами» посредством усечения, или удлинения, или способа сайт-направленного мутагенеза в сочетании со способом отбора, таким как без ограничения отбор с помощью фагового дисплея, отбор с помощью бактериальной двугибридной системы или отбор с помощью бактериальной одногибридной системы. Термин «неприродный ДНК-связывающий домен с «цинковыми пальцами»» относится к ДНК-связывающему домену с «цинковыми пальцами», который связывает последовательность из трех пар оснований в полинуклеотиде-мишени и который не встречается в клетке или организме, содержащих полинуклеотид, который подлежит модификации. Способы разработки полипептида с «цинковыми пальцами», который связывает специфические полинуклеотиды, которые являются уникальными для целевого гена, известны из уровня техники.A zinc finger polypeptide can be designed to recognize a selected target site in a gene. The zinc finger polypeptide may comprise any combination of motifs derived from natural zinc finger DNA binding domains and non-natural zinc finger DNA binding domains by truncation or extension, or by a site-directed mutagenesis method in combination with a selection method such as, but not limited to, phage display selection, bacterial two-hybrid system selection, or bacterial one-hybrid system selection. The term "non-natural zinc finger DNA binding domain" refers to a zinc finger DNA binding domain that binds a sequence of three base pairs in a target polynucleotide and that does not occur in a cell or organism containing the polynucleotide to be modified. Methods for designing a zinc finger polypeptide that binds specific polynucleotides that are unique to a target gene are known in the art.
В других вариантах осуществления может быть выбран полипептид с «цинковыми пальцами» для связывания с регуляторной последовательностью полинуклеотида. Более конкретно, регуляторная последовательность может содержать сайт инициации транскрипции, стартовый кодон, участок экзона, границу раздела экзон-интрон, терминатор или стоп-кодон. Соответственно, настоящее изобретение предусматривает мутантные, не встречающиеся в природе или трансгенные растение или клетки растения, полученные с помощью мутагенеза, опосредованного нуклеазой с «цинковыми пальцами», осуществленного вблизи или в пределах одного или более полинуклеотидов, описанных в данном документе, и способы получения таких растения или клетки растения с помощью мутагенеза, опосредованного нуклеазой с «цинковыми пальцами». Способы доставки полипептида с «цинковыми пальцами» и нуклеазы с «цинковыми пальцами» в растение подобны способам, описанным ниже для доставки мегануклеазы.In other embodiments, a zinc finger polypeptide can be selected for binding to a regulatory sequence of a polynucleotide. More specifically, the regulatory sequence may contain a transcription initiation site, a start codon, an exon region, an exon-intron interface, a terminator, or a stop codon. Accordingly, the present invention provides mutant, non-naturally occurring or transgenic plant or plant cells produced by zinc finger nuclease mediated mutagenesis near or within one or more of the polynucleotides described herein, and methods for producing such plant or plant cells by zinc finger nuclease mediated mutagenesis. The methods for delivering the zinc finger polypeptide and the zinc finger nuclease to the plant are similar to those described below for delivery of the meganuclease.
МегануклеазыMeganucleases
В другом аспекте описаны способы получения мутантных, не встречающихся в природе, или трансгенных, или иным образом генетически модифицированных растений с применением мегануклеаз, таких как I-CreI. Встречающиеся в природе мегануклеазы, а также рекомбинантные мегануклеазы можно применять, в частности, для осуществления двунитевого разрыва в одном сайте или в относительно небольшом количестве сайтов в геномной ДНК растения с обеспечением разрушения одного или более полинуклеотидов, описанных в данном документе. Мегануклеаза может представлять собой сконструированную мегануклеазу со скорректированными свойствами распознавания ДНК. Полипептиды мегануклеаз можно доставлять в клетки растения с помощью ряда разных механизмов, известных из уровня техники.In another aspect, methods are described for producing mutant, non-naturally occurring, or transgenic, or otherwise genetically modified plants using meganucleases such as I-CreI. Naturally occurring meganucleases, as well as recombinant meganucleases, can be used, in particular, to effect a double-strand break at one site, or at a relatively small number of sites, in plant genomic DNA to degrade one or more of the polynucleotides described herein. The meganuclease may be an engineered meganuclease with adjusted DNA recognition properties. Meganuclease polypeptides can be delivered to plant cells by a number of different mechanisms known in the art.
Настоящее изобретение охватывает применение мегануклеаз для инактивации полинуклеотида(полинуклеотидов), описанного(описанных) в данном документе (или любой их комбинации, описанной в данном документе), в клетке растения или растении. В частности, настоящее изобретение предусматривает способ инактивации полинуклеотида в растении с применением мегануклеазы, включающий: (a) получение клетки растения, содержащей полинуклеотид, описанный в данном документе; (b) введение мегануклеазы или конструкции, кодирующей мегануклеазу, в указанную клетку растения и (c) обеспечение существенной степени инактивации полинуклеотида(полинуклеотидов) мегануклеазой.The present invention encompasses the use of meganucleases to inactivate the polynucleotide(s) described herein (or any combination thereof described herein) in a plant cell or plant. In particular, the present invention provides a method for inactivating a polynucleotide in a plant using a meganuclease, comprising: (a) obtaining a plant cell containing a polynucleotide described herein; (b) introducing a meganuclease or a meganuclease-encoding construct into said plant cell; and (c) causing the polynucleotide(s) to be substantially inactivated by the meganuclease.
Мегануклеазы можно применять для расщепления по сайтам распознавания мегануклеазами в пределах кодирующих участков полинуклеотида. Такое расщепление часто приводит в результате к делеции ДНК в сайте распознавания мегануклеазой с последующей репарацией мутагенной ДНК путем соединения негомологичных концов. Такие мутации в кодирующей последовательности гена являются, как правило, достаточными для инактивации гена. Этот способ модификации клетки растения включает, во-первых, доставку кассеты экспрессии мегануклеазы в клетку растения с применением подходящего способа трансформации. Для достижения максимальной эффективности необходимо связать кассету экспрессии мегануклеазы с селектируемым маркером и отобрать успешно трансформированные клетки в присутствии селективного средства. Этот подход в результате приведет к интеграции кассеты экспрессии мегануклеазы в геном, что, однако, может быть нежелательным, если для растения возможно будет требоваться официальное разрешение. В таких случаях кассету экспрессии мегануклеазы (и связанный селектируемый маркерный ген) можно сегрегировать в последующих поколениях растения с применением общепринятых методик селекции.Meganucleases can be used to cleave at meganuclease recognition sites within the coding regions of a polynucleotide. Such cleavage often results in deletion of the DNA at the meganuclease recognition site, followed by repair of the mutagenic DNA by joining the non-homologous ends. Such mutations in the coding sequence of a gene are usually sufficient to inactivate the gene. This method for modifying a plant cell comprises, firstly, delivering a meganuclease expression cassette into the plant cell using a suitable transformation method. To achieve maximum efficiency, it is necessary to link the meganuclease expression cassette to a selectable marker and select successfully transformed cells in the presence of a selective agent. This approach will result in the integration of the meganuclease expression cassette into the genome, which, however, may be undesirable if the plant may require authorization. In such cases, the meganuclease expression cassette (and associated selectable marker gene) can be segregated in subsequent generations of the plant using conventional breeding techniques.
После доставки кассеты экспрессии мегануклеазы клетки растения выращивают, изначально, в условиях, которые являются типичными для конкретной процедуры трансформации, которую применяли. Это может означать выращивание трансформированных клеток на среде при температуре ниже 26°C, зачастую в темноте. Такие стандартные условия можно применять в течение некоторого периода времени, предпочтительно 1-4 дней, для обеспечения восстановления клетки растения после процесса трансформации. В любой момент после этого начального периода восстановления температуру роста можно повысить, чтобы стимулировать функцию сконструированной мегануклеазы с осуществлением расщепления и мутирования по сайту распознавания мегануклеазой.Following delivery of the meganuclease expression cassette, the plant cells are grown initially under conditions that are typical of the particular transformation procedure that was used. This may mean growing the transformed cells in a medium below 26°C, often in the dark. Such standard conditions can be applied over a period of time, preferably 1-4 days, to ensure the recovery of the plant cell after the transformation process. At any time after this initial recovery period, the growth temperature can be increased to stimulate the function of the engineered meganuclease to cleave and mutate at the meganuclease recognition site.
TALENTALEN
Один способ редактирования гена включает применение эффекторных нуклеаз, подобных активатору транскрипции (TALEN), которые индуцируют образование двунитевых разрывов, на которые клетка может отвечать посредством механизмов репарации. NHEJ возобновляет связь ДНК с обеих сторон двунитевого разрыва, где участок перекрывания последовательностей является очень маленьким или вовсе отсутствует, для обеспечения отжига. Этот механизм репарации индуцирует ошибки в геноме посредством вставки, или делеции, или хромосомной перестройки. Любые такие ошибки могут сделать продукты гена, закодированные в этом месте, не функциональными. Для определенных видов применения может быть необходимым точное удаление полинуклеотида из генома растения. Такие применения возможны с применением пары сконструированных мегануклеаз, каждая из которых расщепляет сайт распознавания мегануклеазой по обе стороны от предполагаемой делеции. Также можно применять TALEN, которые способны распознавать ген и связываться с ним и вносить двунитевой разрыв в геном. Таким образом, в другом аспекте предусмотрены способы получения мутантных, не встречающихся в природе, или трансгенных, или иным образом генетически модифицированных растений, описанных в данном документе, с применением эффекторных нуклеаз TAL.One method of gene editing involves the use of effector nucleases like transcription activator (TALEN) that induce the formation of double-strand breaks to which the cell can respond through repair mechanisms. NHEJ reconnects DNA on both sides of the double strand break where there is very little or no sequence overlap to allow for annealing. This repair mechanism induces errors in the genome through insertion or deletion or chromosomal rearrangement. Any such errors may render the gene products encoded at that location non-functional. For certain applications, precise removal of the polynucleotide may be necessary. from the plant genome. Such applications are possible using a pair of engineered meganucleases, each of which cleaves a meganuclease recognition site on either side of the intended deletion. It is also possible to use TALENs, which are able to recognize and bind to a gene and introduce a double-strand break into the genome. Thus, in another aspect, methods are provided for producing mutant, non-naturally occurring, or transgenic, or otherwise genetically modified plants described herein using TAL effector nucleases.
CRISPR/CasCRISPR/Cas
Другой способ редактирования гена включает применение бактериальной системы CRISPR/Cas. Бактерии и архебактерии характеризуются наличием хромосомных элементов, называемых короткими палиндромными повторами, регулярно расположенными группами (CRISPR), которые являются частью адаптивной иммунной системы, защищающей от проникновения вирусной и плазмидной ДНК. В случае систем CRISPR типа II, CRISPR-РНК (crRNA) функционируют с трансактивирующей crRNA (tracrRNA) и CRISPR-ассоциированными (Cas) полипептидами с обеспечением внесения двунитевых разрывов в ДНК-мишень. Расщепление мишени с помощью Cas9 требует спаривания оснований crRNA и tracrRNA, а также спаривания оснований crRNA и ДНК-мишени. Распознавание мишени облегчается при наличии короткого мотива, называемого прилегающим к протоспейсеру мотивом (PAM), который соответствует последовательности NGG. Данную систему можно применять для редактирования генома. Cas9 обычно программируется двойной РНК, состоящей из crRNA и tracrRNA. Тем не менее, коровые компоненты этих РНК могут быть объединены в единую гибридную «направляющую РНК» для нацеливания Cas9. Использование некодирующей направляющей РНК для нацеливания на ДНК с целью сайт-специфического расщепления обещает быть значительно более простым, чем существующие технологии, такие как TALEN. При применении стратегии CRISPR/Cas перенацеливание нуклеазного комплекса требует только введения новой последовательности РНК, и нет необходимости в реконструировании специфичности факторов транскрипции на основе полипептида. Технологию CRISPR/Cas осуществили в растениях в способе по международной заявке на патент WO 2015/189693, в которой раскрыта платформа для опосредованного вирусом редактирования генома, которая является широко применимой для видов растений. Геном RNA2 вируса погремковости табака (TRV) был сконструирован для переноса и доставки направляющей РНК в растения Nicotiana benthamiana со сверхэкспрессией эндонуклеазы Cas9. В контексте настоящего изобретения направляющая РНК может быть получена из любой из последовательностей, раскрытых в данном документе, и идей из WO 2015/189693, применяемых для редактирования генома клетки растения и получения необходимого мутантного растения. Высокий темп развития технологии обеспечил появление большого разнообразия протоколов с широкими возможностями применения в растениях, которые были хорошо классифицированы в ряде недавних научных обзоров (например, Plant Methods (2016) 12:8; и Front Plant Sci. (2016) 7:506). Обзор систем CRISPR/Cas с особым акцентом на их применении описан в Biotechnology Advances (2015) 33, 1, 41-52). Более недавние разработки в отношении применения CRISPR/Cas для манипулирования геномами растений описаны в Acta Pharmaceutica Sinica B (2017) 7, 3, 292-302 и Curr. Op. in Plant Biol. (2017) 36, 1-8. Плазмиды на основе CRISPR/Cas9 для применения в растениях перечислены в «addgene», некоммерческом хранилище плазмид (addgene.org), и плазмиды на основе CRISPR/Cas являются коммерчески доступными.Another method of gene editing involves the use of the bacterial CRISPR/Cas system. Bacteria and archaebacteria are characterized by the presence of chromosomal elements called regularly spaced short palindromic repeats (CRISPR), which are part of the adaptive immune system that protects against viral and plasmid DNA entry. In the case of type II CRISPR systems, CRISPR RNAs (crRNA) function with transactivating crRNA (tracrRNA) and CRISPR-associated (Cas) polypeptides to introduce double-strand breaks into the target DNA. Cleavage of the target by Cas9 requires crRNA and tracrRNA base pairing as well as crRNA and target DNA base pairing. Target recognition is facilitated by the presence of a short motif, called the protospacer-adjacent motif (PAM), which corresponds to the NGG sequence. This system can be used for genome editing. Cas9 is usually programmed with a double RNA consisting of crRNA and tracrRNA. However, the core components of these RNAs can be combined into a single hybrid "guide RNA" to target Cas9. The use of non-coding guide RNA to target DNA for site-specific cleavage promises to be significantly simpler than existing technologies such as TALEN. With the CRISPR/Cas strategy, retargeting of the nuclease complex only requires the introduction of a new RNA sequence, and there is no need to reverse engineer the specificity of the transcription factors based on the polypeptide. CRISPR/Cas technology has been implemented in plants in the method of international patent application WO 2015/189693, which discloses a virus-mediated genome editing platform that is widely applicable to plant species. Tobacco rattle virus (TRV) RNA2 genome was designed to carry and deliver guide RNA to Nicotiana benthamiana plants overexpressing Cas9 endonuclease. In the context of the present invention, a guide RNA can be obtained from any of the sequences disclosed herein and the ideas from WO 2015/189693 used to edit the genome of a plant cell and obtain the desired mutant plant. The rapid pace of technology development has resulted in a wide variety of protocols with broad applications in plants that have been well categorized in a number of recent scientific reviews (e.g., Plant Methods (2016) 12:8; and Front Plant Sci. (2016) 7:506). An overview of CRISPR/Cas systems with particular emphasis on their application is described in Biotechnology Advances (2015) 33, 1, 41-52). More recent developments regarding the use of CRISPR/Cas to manipulate plant genomes are described in Acta Pharmaceutica Sinica B (2017) 7, 3, 292-302 and Curr. Op. in Plant Biol. (2017) 36, 1-8. CRISPR/Cas9 based plasmids for use in plants are listed at "addgene", a non-commercial plasmid repository (addgene.org), and CRISPR/Cas9 based plasmids are commercially available.
Антисмысловая модификацияAntisense modification
Технология применения антисмысловых олигонуклеотидов представляет собой другой хорошо известный способ, который можно применять для модулирования экспрессии полипептида. Полинуклеотид гена, подлежащего репрессии, клонируют и функционально связывают с регуляторным участком и последовательностью терминации транскрипции, так что транскрибируется антисмысловая нить РНК. Затем рекомбинантной конструкцией трансформируют клетку растения и получают антисмысловую нить РНК. Полинуклеотид не обязательно является полной последовательностью гена, подлежащего репрессии, но, как правило, является практически комплементарным по меньшей мере части смысловой нити гена, подлежащего репрессии.Antisense oligonucleotide technology is another well known technique that can be used to modulate polypeptide expression. The polynucleotide of the gene to be repressed is cloned and operably linked to a regulatory region and a transcription termination sequence such that an antisense RNA strand is transcribed. Then, a plant cell is transformed with a recombinant construct and an antisense RNA strand is obtained. The polynucleotide is not necessarily the complete sequence of the gene to be repressed, but is generally substantially complementary to at least a portion of the sense strand of the gene to be repressed.
Полинуклеотид может быть транскрибирован в рибозим или каталитическую РНК, которая влияет на экспрессию мРНК. Рибозимы можно разрабатывать таким образом, чтобы они специфически спаривались практически с любой целевой РНК и расщепляли фосфодиэфирный остов в определенном месте, тем самым функционально инактивируя целевую РНК. Гетерологичные полинуклеотиды могут кодировать рибозимы, разработанные таким образом, чтобы они расщепляли конкретные транскрипты мРНК, предотвращая таким образом экспрессию полипептида. Рибозимы типа hammerhead являются применимыми для разрушения конкретных мРНК, хотя можно применять различные рибозимы, которые расщепляют мРНК в последовательностях сайт-специфического распознавания. Рибозимы типа hammerhead расщепляют мРНК в местах, определяемых фланкирующими участками, которые образуют комплементарные пары оснований с мРНК-мишени. Единственным требованием является то, что РНК-мишень должна содержать полинуклеотид 5'-UG-3'. Конструирование и получение рибозимов типа hammerhead известно в данной области техники. Последовательности рибозимов типа hammerhead можно встраивать в стабильную РНК, такую как транспортная РНК (tRNA) для повышения эффективности расщепления in vivo.The polynucleotide can be transcribed into a ribozyme or catalytic RNA that affects the expression of the mRNA. Ribozymes can be designed to specifically pair with virtually any target RNA and cleave the phosphodiester backbone at a specific location, thereby functionally inactivating the target RNA. Heterologous polynucleotides may encode ribozymes designed to cleave specific mRNA transcripts, thus preventing expression of the polypeptide. Hammerhead-type ribozymes are useful for degrading specific mRNAs, although various ribozymes that cleave mRNAs at site-specific recognition sequences can be used. Hammerhead ribozymes cleave the mRNA at sites defined by flanking regions that form complementary base pairs with the target mRNA. The only requirement is that the target RNA must contain a 5'-UG-3' polynucleotide. The construction and production of hammerhead ribozymes is known in the art. Hammerhead ribozyme sequences can be inserted into stable RNA such as transfer RNA (tRNA) to increase the efficiency of in vivo cleavage.
В одном варианте осуществления специфичный в отношении последовательности полинуклеотид, который может нарушать трансляцию транскрипта(транскриптов) РНК, представляет собой интерферирующую РНК. РНК-интерференция или РНК-сайленсинг представляют собой эволюционно консервативный процесс, с помощью которого конкретные мРНК могут быть нацелены для ферментативного разрушения. Двунитевую РНК (двунитевую РНК) вводят в клетку или получают в клетке (например, вирус с двунитевой РНК или полинуклеотиды, представляющие собой интерферирующую РНК) для инициации пути интерферирующей РНК. Двунитевую РНК можно преобразовывать в несколько дуплексов малых интерферирующих РНК (siRNA) длиной 21-24 п. о. с помощью РНКаз III, которые представляют собой эндонуклеазы, специфичные к двунитевой РНК. В последствии, siRNA могут распознаваться индуцируемыми РНК комплексами сайленсинга, которые способствуют раскручиванию siRNA с помощью АТФ-зависимого процесса. Раскрученная антисмысловая нить siRNA направляет активированные РНК-индуцированные комплексы сайленсинга к мРНК, в отношении которой осуществлено нацеливание, которая содержит последовательность, комплементарную антисмысловой нити siRNA. мРНК, в отношении которой осуществлено нацеливание, и антисмысловая нить могут образовывать А-форму спирали, и большая бороздка А-формы спирали может распознаться активированными РНК-индуцированными комплексами сайленсинга. мРНК-мишень может расщепляться с помощью активированных РНК-индуцированных комплексов сайленсинга в одном сайте, определенном сайтом связывания 5'-конца нити siRNA. Активированные РНК-индуцированные комплексы сайленсинга могут повторно использоваться для катализа еще одного события расщепления.In one embodiment, the sequence-specific polynucleotide that can disrupt translation of the RNA transcript(s) is an interfering RNA. RNA interference or RNA silencing is an evolutionarily conserved process by which specific mRNAs can be targeted for enzymatic degradation. Double-stranded RNA (double-stranded RNA) is introduced into the cell or produced in the cell (for example, double-stranded RNA virus or interfering RNA polynucleotides) to initiate the interfering RNA pathway. Double-stranded RNA can be converted into several 21-24 bp small interfering RNA (siRNA) duplexes. using RNase III, which are endonucleases specific for double-stranded RNA. Subsequently, siRNAs can be recognized by RNA-induced silencing complexes that promote siRNA unwinding in an ATP-dependent process. The untwisted siRNA antisense strand directs activated RNA-induced silencing complexes to a targeted mRNA that contains a sequence complementary to the siRNA antisense strand. The targeted mRNA and the antisense strand can form an A-coil, and the major groove of the A-coil can be recognized by activated RNA-induced silencing complexes. The target mRNA can be cleaved by activated RNA-induced silencing complexes at a single site defined by the binding site of the 5'end of the siRNA strand. Activated RNA-induced silencing complexes can be reused to catalyze another cleavage event.
Векторы экспрессии на основе интерферирующей РНК могут содержать конструкции интерферирующей РНК, кодирующие полинуклеотиды интерферирующей РНК, которые осуществляют РНК-интерференцию путем понижения уровня экспрессии мРНК, пре-мРНК или родственных вариантов РНК. Векторы экспрессии могут содержать промотор, расположенный выше по последовательности и функционально связанный с конструкцией интерферирующей РНК, как дополнительно описано в данном документе. Векторы экспрессии на основе интерферирующей РНК могут содержать подходящий минимальный коровый промотор, представляющую интерес конструкцию интерферирующей РНК, расположенный выше по последовательности (5') регуляторный участок, расположенный ниже по последовательности (3') регуляторный участок, в том числе сигналы терминации транскрипции и полиаденилирования, и другие последовательности, известные специалистам в данной области техники, такие как различные селективные маркеры.Interfering RNA expression vectors may contain interfering RNA constructs encoding interfering RNA polynucleotides that mediate RNA interference by downregulating mRNA, pre-mRNA, or related RNA variants. Expression vectors may contain an upstream promoter operably linked to an interfering RNA construct, as further described herein. Interfering RNA expression vectors may contain a suitable minimal core promoter, an interfering RNA construct of interest, an upstream (5') regulatory region, a downstream (3') regulatory region, including transcription termination and polyadenylation signals, and other sequences known to those skilled in the art, such as various selectable markers.
Молекулы двунитевой РНК могут включать молекулы siRNA, собранные из отдельного олигонуклеотида в структуре стебель-петля, где самокомплементарные смысловую и антисмысловую участки молекулы siRNA соединены с помощью основанного на полинуклеотидах или не основанного на полинуклеотидах линкера(линкеров), а также кольцевую однонитевую РНК с двумя или более петлевыми структурами и стеблем, содержащую самокомплементарные смысловую и антисмысловую нити, где кольцевую РНК можно процессировать либо in vivo, либо in vitro с образованием активной молекулы siRNA, способной опосредовать интерферирующую РНК.Double-stranded RNA molecules can include siRNA molecules assembled from a single oligonucleotide in a stem-loop structure, where the self-complementary sense and antisense portions of the siRNA molecule are connected by polynucleotide-based or non-polynucleotide-based linker(s), as well as circular single-stranded RNA with two or more loop structures and a stem, containing self-complementary sense and antisense strands, where the circular RNA can be processed either in vivo or in vitro to form an active siRNA molecule capable of mediating the interfering RNA.
Также предусмотрено использование молекул малой шпилечной РНК. Они содержат специфичную антисмысловую последовательность в дополнение к обратно комплементарной (смысловой) последовательности, как правило, отделенной спейсером или последовательностью петли. Расщепление спейсера или петли обеспечивает образование молекулы однонитевой РНК и ее обратно комплементарной нити, так что их можно отжечь с образованием двунитевой молекулы РНК (необязательно с дополнительными стадиями обработки, которые могут в результате привести в результате к добавлению или удалению одного, двух, трех или более нуклеотидов с 3'-конца или 5'-конца одной или обеих нитей). Спейсер может иметь достаточную длину для обеспечения отжига антисмысловой и смысловой последовательностей и образования двунитевой структуры (или стебля) до расщепления спейсера (и необязательно последующих стадий обработки, которые могут в результате привести в результате к добавлению или удалению одного, двух, трех, четырех или более нуклеотидов с 3'-конца или с 5'-конца одной или обеих нитей). Спейсерная последовательность как правило представляет собой неродственный полинуклеотид, который находится между двумя комплементарными участками полинуклеотидов, которые после отжига с получением двунитевого полинуклеотида образуют малую шпилечную РНК. Спейсерная последовательность обычно содержит от приблизительно 3 до приблизительно 100 нуклеотидов.The use of small hairpin RNA molecules is also contemplated. They contain a specific antisense sequence in addition to a reverse complementary (sense) sequence, usually separated by a spacer or loop sequence. Cleavage of the spacer or loop provides a single-stranded RNA molecule and its reverse complementary strand so that they can be annealed to form a double-stranded RNA molecule (optionally with additional processing steps that may result in the addition or deletion of one, two, three or more nucleotides from the 3' or 5' end of one or both strands). The spacer may be of sufficient length to allow the antisense and sense sequences to anneal and form a double strand structure (or stem) prior to cleavage of the spacer (and optionally subsequent processing steps that may result in the addition or deletion of one, two, three, four or more nucleotides from the 3' end or from the 5' end of one or both strands). The spacer sequence is typically an unrelated polynucleotide that resides between two complementary stretches of polynucleotides that, after annealing to a double-stranded polynucleotide, form a small hairpin RNA. The spacer sequence typically contains from about 3 to about 100 nucleotides.
Любой представляющий интерес РНК-полинуклеотид можно получить путем подбора подходящей композиции последовательности, размера петли и длины стебля для получения шпилечного дуплекса. При осуществлении разработки подходящий диапазон длины стебля шпилечного дуплекса включает длины стебля, составляющие по меньшей мере приблизительно 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 или 20 нуклеотидов, как, например, приблизительно 14-30 нуклеотидов, приблизительно 30-50 нуклеотидов, приблизительно 50-100 нуклеотидов, приблизительно 100-150 нуклеотидов, приблизительно 150-200 нуклеотидов, приблизительно 200-300 нуклеотидов, приблизительно 300-400 нуклеотидов, приблизительно 400-500 нуклеотидов, приблизительно 500-600 нуклеотидов и приблизительно 600-700 нуклеотидов. При осуществлении разработки подходящий диапазон длин петли шпилечного дуплекса включает длину петли, составляющую приблизительно 4-25 нуклеотидов, приблизительно 25-50 нуклеотидов или больше, если длина стебля шпилечного дуплекса является значительной. В определенных вариантах осуществления длина молекулы двунитевой РНК или ssRNA составляет от приблизительно 15 до приблизительно 40 нуклеотидов. В другом варианте осуществления молекула siRNA представляет собой молекулу двунитевой РНК или ssRNA длиной от приблизительно 15 до приблизительно 35 нуклеотидов. В другом варианте осуществления молекула siRNA представляет собой молекулу двунитевой РНК или ssRNA длиной от приблизительно 17 до приблизительно 30 нуклеотидов. В другом варианте осуществления молекула siRNA представляет собой молекулу двунитевой РНК или ssRNA длиной от приблизительно 19 до приблизительно 25 нуклеотидов. В другом варианте осуществления молекула siRNA представляет собой молекулу двунитевой РНК или ssRNA длиной от приблизительно 21 до приблизительно 23 нуклеотидов. В определенных вариантах осуществления шпилечные структуры с участками в виде дуплекса длиннее 21 нуклеотида могут способствовать эффективному сайленсингу, управляемому siRNA, вне зависимости от последовательности и длины петли. Иллюстративные последовательности для осуществления РНК-интерференции описаны в данном документе.Any RNA polynucleotide of interest can be obtained by selecting an appropriate sequence composition, loop size and stem length to produce a hairpin duplex. When designing, a suitable stem length range for a hairpin duplex includes stem lengths of at least about 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, or 20 nucleotides, such as about 14-30 nucleotides, about 30-50 nucleotides, about 50-100 nucleotides, about 100-150 nucleotides, about 150-200 nucleotides, about 200-300 nucleotides, about 300-400 nucleotides, about 400-500 nucleotides, about 500-600 nucleotides, and about 600-700 nucleotides. When designing, a suitable range of loop lengths for the hairpin duplex includes a loop length of about 4-25 nucleotides, about 25-50 nucleotides, or more if the stem length of the hairpin duplex is significant. In certain embodiments, the double-stranded RNA or ssRNA molecule is about 15 to about 40 nucleotides in length. In another embodiment, the siRNA molecule is a double-stranded RNA or ssRNA molecule from about 15 to about 35 nucleotides in length. In another embodiment, the siRNA molecule is a double-stranded RNA or ssRNA molecule from about 17 to about 30 nucleotides in length. In another embodiment, the siRNA molecule is a double-stranded RNA or ssRNA molecule from about 19 to about 25 nucleotides in length. In another embodiment, the siRNA molecule is a double-stranded RNA or ssRNA molecule from about 21 to about 23 nucleotides in length. In certain embodiments, hairpin structures with duplex regions longer than 21 nucleotides can facilitate efficient siRNA-driven silencing regardless of loop sequence and length. Exemplary sequences for performing RNAi are described herein.
Длина последовательности мРНК-мишени составляет, как правило, от приблизительно 14 до приблизительно 50 нуклеотидов. Следовательно, мРНК-мишень можно проверить на наличие участков длиной от приблизительно 14 до приблизительно 50 нуклеотидов, которые предпочтительно соответствуют одному или более из следующих критериев: соотношение A+T/G+С составляет от приблизительно 2:1 до приблизительно 1:2; наличие динуклеотида AA или динуклеотида СA на 5'-конце; наличие последовательности из по меньшей мере 10 последовательных нуклеотидов, являющихся уникальными для мРНК-мишени (то есть, последовательность не присутствует в других последовательностях мРНК из этого же растения); и отсутствие «рядов» из более чем трех последовательных нуклеотидов, представляющих собой гуанин (G), или более чем трех последовательных нуклеотидов, представляющих собой цитозин (C). Оценку в отношении данных критериев можно осуществлять с помощью различных методик, известных в данной области техники, например, компьютерные программы, такие как BLAST, можно применять для поиска по общедоступным базам данных, чтобы определить, является ли выбранная последовательность уникальной для мРНК-мишени. В качестве альтернативы, последовательность можно отобрать (и разработать последовательность siRNA) с помощью коммерчески доступного компьютерного программного обеспечения (например, OligoEngine, Target Finder и Design Tool для siRNA, которые являются коммерчески доступными).The target mRNA sequence is typically about 14 to about 50 nucleotides in length. Therefore, the target mRNA can be screened for regions of about 14 to about 50 nucleotides in length that preferably meet one or more of the following criteria: an A+T/G+C ratio of about 2:1 to about 1:2; the presence of an AA dinucleotide or a CA dinucleotide at the 5' end; the presence of a sequence of at least 10 consecutive nucleotides that is unique to the target mRNA (ie, the sequence is not present in other mRNA sequences from the same plant); and the absence of "strings" of more than three consecutive nucleotides representing guanine (G) or more than three consecutive nucleotides representing cytosine (C). Evaluation against these criteria can be performed using various techniques known in the art, for example, computer programs such as BLAST can be used to search public databases to determine if a selected sequence is unique to a target mRNA. Alternatively, the sequence can be selected (and the siRNA sequence designed) using commercially available computer software (eg, OligoEngine, Target Finder and Design Tool for siRNA, which are commercially available).
В одном варианте осуществления отбирают последовательности мРНК-мишени, длина которых составляет от приблизительно 14 до приблизительно 30 нуклеотидов, которые соответствуют одному или более критериям, указанным выше. В другом варианте осуществления отбирают последовательности, длина которых составляет от приблизительно 16 до приблизительно 30 нуклеотидов, которые соответствуют одному или более критериям, указанным выше. В дополнительном варианте осуществления отбирают последовательности, длина которых составляет от приблизительно 19 до приблизительно 30 нуклеотидов, которые соответствуют одному или более критериям, указанным выше. В другом варианте осуществления отбирают последовательности, длина которых составляет от приблизительно 19 до приблизительно 25 нуклеотидов, которые соответствуют одному или более критериям, указанным выше.In one embodiment, target mRNA sequences are selected that are from about 14 to about 30 nucleotides in length and that meet one or more of the criteria above. In another embodiment, sequences are selected that are from about 16 to about 30 nucleotides in length that meet one or more of the criteria above. In a further embodiment, sequences are selected that are from about 19 to about 30 nucleotides in length that meet one or more of the criteria above. In another embodiment, sequences are selected that are from about 19 to about 25 nucleotides in length that meet one or more of the criteria above.
В иллюстративном варианте осуществления молекулы siRNA содержат специфическую антисмысловую последовательность, которая комплементарна по меньшей мере 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30 или более смежным нуклеотидам из любого из полинуклеотидов, описанных в данном документе.In an exemplary embodiment, the siRNA molecules contain a specific antisense sequence that is complementary to at least 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30 or more contiguous nucleotides from any of the polynucleotides. described in this document.
Специфическая антисмысловая последовательность, содержащаяся в молекуле siRNA, может быть идентичной или практически идентичной комплементарной последовательности. В одном варианте осуществления специфическая антисмысловая последовательность, содержащаяся в молекуле siRNA, является на по меньшей мере приблизительно 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% или 100% идентичной последовательности, комплементарной последовательности мРНК-мишени. Способы определения идентичности последовательности известны в данной области техники, и ее можно определить, например, с помощью программы BLASTN из программного обеспечения Computer Group (GCG) Университета штата Висконсин, или предоставленной на веб-сайте NCBI.The specific antisense sequence contained in the siRNA molecule may be identical or substantially identical to the complementary sequence. In one embodiment, the specific antisense sequence contained in the siRNA molecule is at least about 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, or 100% identical to a sequence complementary to a target mRNA sequence. Methods for determining sequence identity are known in the art and can be determined, for example, using the BLASTN program from the University of Wisconsin Computer Group (GCG) software, or provided on the NCBI website.
Один способ индукции сайленсинга двунитевой РНК у растений представляет собой трансформацию с помощью генной конструкции, продуцирующей шпилечную РНК (см. Nature (2000) 407, 319-320). Такие конструкции содержат инвертированные участки последовательности целевого гена, отделенные соответствующим спейсером. Вставка функционального интронного участка растения в качестве спейсерного фрагмента дополнительно повышает эффективность индукции сайленсинга гена благодаря выработке шпилечной РНК на основе сплайсинга интрона (Plant J. (2001), 27, 581-590). Предпочтительно длина стебля составляет от приблизительно 50 нуклеотидов до приблизительно 1 тысячи нуклеотидов в длину. Способы получения шпилечной РНК на основе сплайсинга интрона хорошо описаны в данной области техники (см., например, Bioscience, Biotechnology, and Biochemistry (2008) 72, 2, 615-617).One method for inducing double-stranded RNA silencing in plants is transformation with a gene construct producing hairpin RNA (see Nature (2000) 407, 319-320). Such constructs contain inverted portions of the target gene sequence separated by an appropriate spacer. Insertion of a functional plant intron region as a spacer fragment further enhances the efficiency of gene silencing induction by generating hairpin RNA based on intron splicing ( Plant J. (2001), 27, 581-590). Preferably, the length of the stem is from about 50 nucleotides to about 1 thousand nucleotides in length. Methods for producing hairpin RNA based on intron splicing are well described in the art (see, for example, Bioscience, Biotechnology, and Biochemistry (2008) 72, 2, 615-617).
Молекулы интерферирующей РНК, имеющие структуру в виде дуплекса или двунитевую структуру, например двунитевая РНК или малая шпилечная РНК, могут иметь тупые концы, или могут иметь 3'- или 5'-выступы. Используемый в данном документе термин «выступ» относится к неспаренному нуклеотиду или нуклеотидам, которые выступают из структуры в виде дуплекса, если 3'-конец одной нити РНК выходит за пределы 5'-конца другой нити (3'-выступ), или наоборот (5'-выступ). Нуклеотиды, составляющие выступы, могут быть рибонуклеотидами, дезоксирибонуклеотидами или их модифицированными версиями. В одном варианте осуществления по меньшей мере одна нить молекулы интерферирующей РНК имеет 3'-выступ длиной от приблизительно 1 до приблизительно 6 нуклеотидов. В других вариантах осуществления длина 3'-выступа составляет от приблизительно 1 до приблизительно 5 нуклеотидов, от приблизительно 1 до приблизительно 3 нуклеотидов и от приблизительно 2 до приблизительно 4 нуклеотидов.Interfering RNA molecules having a duplex or double-stranded structure, such as double-stranded RNA or small hairpin RNA, may be blunt-ended, or may have 3' or 5' protrusions. As used herein, the term "overhang" refers to an unpaired nucleotide or nucleotides that protrude from the structure as a duplex if the 3' end of one strand of RNA extends beyond the 5' end of the other strand (3' overhang), or vice versa (5' overhang). Nucleotides constituting the protrusions may be ribonucleotides, deoxyribonucleotides, or modified versions thereof. In one embodiment, at least one strand of the interfering RNA molecule has a 3' overhang of about 1 to about 6 nucleotides in length. In other embodiments, the 3' overhang is about 1 to about 5 nucleotides long, about 1 to about 3 nucleotides long, and about 2 to about 4 nucleotides long.
Если молекула интерферирующей РНК содержит 3'-выступ на одном конце молекулы, другой конец может быть с тупым концом, или также иметь выступ (5' или 3'). Если молекула интерферирующей РНК содержит выступ с обоих концов молекулы, длина выступов может быть одинаковой или разной. В одном варианте осуществления молекула интерферирующей РНК содержит 3'-выступы, состоящие из от приблизительно 1 до приблизительно 3 нуклеотидов, на обоих концах молекулы. В дополнительном варианте осуществления молекула интерферирующей РНК представляет собой двунитевую РНК, имеющую 3'-выступ из 2 нуклеотидов с обоих концов молекулы. В еще одном варианте осуществления нуклеотиды, составляющие выступ интерферирующей РНК, являются динуклеотидами TT или динуклеотидами UU.If the interfering RNA molecule contains a 3'-protrusion at one end of the molecule, the other end may be blunt-ended, or also have a protrusion (5' or 3'). If the interfering RNA molecule contains a protrusion at both ends of the molecule, the length of the protrusions may be the same or different. In one embodiment, the interfering RNA molecule contains 3' overhangs of about 1 to about 3 nucleotides at both ends of the molecule. In a further embodiment, the interfering RNA molecule is a double stranded RNA having a 2 nucleotide 3' overhang at either end of the molecule. In yet another embodiment, the nucleotides constituting the interfering RNA overhang are TT dinucleotides or UU dinucleotides.
Молекулы интерферирующей РНК могут содержать одну или более 5'- или 3'-кэп-структур. Термин «кэп-структура» относится к химической модификации, включенной с любого конца олигонуклеотида, которая защищает молекулу от разрушения эндонуклеазами и может также облегчать доставку или локализацию внутри клетки.Interfering RNA molecules may contain one or more 5' or 3' cap structures. The term "cap structure" refers to a chemical modification included at either end of an oligonucleotide that protects the molecule from degradation by endonucleases and may also facilitate delivery or localization within a cell.
Другой модификацией, применяемой к молекулам интерферирующей РНК, является химическое связывание с молекулой интерферирующей РНК одного или более фрагментов или конъюгатов, которые усиливают функцию, клеточное распределение, клеточный захват, биодоступность или стабильность молекулы интерферирующей РНК. Полинуклеотиды можно синтезировать или модифицировать с помощью способов, общепринятых в данной области техники. Химические модификации включают 2'-модификации, введение неприродных оснований, ковалентное присоединение лиганда и замещение фосфатных связей тиофосфатными связями. В данном варианте осуществления прочность структуры в виде дуплекса укрепляют с помощью по меньшей мере одной и, как правило, двух химических связей.Another modification applied to interfering RNA molecules is the chemical coupling to the interfering RNA molecule of one or more fragments or conjugates that enhance the function, cellular distribution, cellular uptake, bioavailability, or stability of the interfering RNA molecule. Polynucleotides can be synthesized or modified using methods conventional in the art. Chemical modifications include 2' modifications, introduction of non-natural bases, covalent attachment of a ligand, and replacement of phosphate bonds with thiophosphate bonds. In this embodiment, the strength of the duplex structure is strengthened by at least one and typically two chemical bonds.
Нуклеотиды одной или обеих из двух одинарных нитей можно модифицировать для модулирования активации клеточных ферментов, таких как, например, без ограничения определенные нуклеазы. Методики для понижения уровня или ингибирования активации клеточных ферментов известны в данной области техники и включают без ограничения 2'-аминомодификации, 2'-фтормодификации, 2'-алкилмодификации, модификации незаряженного каркаса, морфолиновые модификации, 2'-О-метилмодификации и фосфорамидат. The nucleotides of one or both of the two single strands can be modified to modulate the activation of cellular enzymes such as, for example, but not limited to, certain nucleases. Techniques for reducing or inhibiting cellular enzyme activation are known in the art and include, without limitation, 2'-amino modifications, 2'-fluoro modifications, 2'-alkyl modifications, uncharged backbone modifications, morpholine modifications, 2'-O-methyl modifications, and phosphoramidate.
Молекулу интерферирующей РНК можно конъюгировать с лигандами, например, для усиления ее абсорбции клеткой. В определенных вариантах осуществления гидрофобный лиганд конъюгируют с молекулой для облегчения прямого проникновения через клеточную мембрану. В определенных случаях конъюгация катионного лиганда с олигонуклеотидами часто в результате приводит к улучшению устойчивости к нуклеазам.The interfering RNA molecule can be conjugated to ligands, for example, to enhance its absorption into the cell. In certain embodiments, the hydrophobic ligand is conjugated to a molecule to facilitate direct penetration across the cell membrane. In certain instances, conjugation of the cationic ligand to oligonucleotides often results in improved nuclease resistance.
«Нацеленные индуцированные локальные повреждения в геноме» (TILLING) представляет собой еще одну технологию мутагенеза, которую можно применять для создания и/или идентификации полинуклеотидов, кодирующих полипептиды с модифицированной экспрессией, функцией и/или активностью. TILLING также обеспечивает возможность отбора растений, несущих такие мутантные варианты. В TILLING комбинируют мутагенез высокой плотности со способами высокопроизводительного скрининга. Способы осуществления TILLING хорошо известны из уровня техники (см. McCallum et al., (2000) Nat Biotechnol 18: 455-457 и Stemple (2004) Nat Rev Genet 5(2): 145-50)."Targeted induced local damage in the genome" (TILLING) is another mutagenesis technology that can be used to create and/or identify polynucleotides encoding polypeptides with modified expression, function and/or activity. TILLING also enables the selection of plants carrying such mutant variants. TILLING combines high density mutagenesis with high throughput screening methods. TILLING methods are well known in the art (see McCallum et al ., (2000) Nat Biotechnol 18: 455-457 and Stemple (2004) Nat Rev Genet 5(2): 145-50).
Различные варианты осуществления направлены на векторы экспрессии, содержащие один или более полинуклеотидов или одну или более конструкций интерферирующей РНК, которые содержат один или более полинуклеотидов, описанных в данном документе.Various embodiments are directed to expression vectors containing one or more polynucleotides or one or more interfering RNA constructs that contain one or more of the polynucleotides described herein.
Различные варианты осуществления направлены на векторы экспрессии, содержащие один или более полинуклеотидов или одну или более конструкций интерферирующей РНК, описанных в данном документе.Various embodiments are directed to expression vectors containing one or more polynucleotides or one or more interfering RNA constructs described herein.
Различные варианты осуществления направлены на векторы экспрессии, содержащие один или более полинуклеотидов или одну или более конструкций интерферирующей РНК, кодирующих один или более полинуклеотидов интерферирующей РНК, описанных в данном документе, которые способны к самоотжигу с образованием шпилечной структуры, где конструкция содержит: (a) один или более полинуклеотидов, описанных в данном документе; (b) вторую последовательность, кодирующую спейсерный элемент, который образует петлю шпилечной структуры; и (c) третью последовательность, содержащую последовательность, обратно комплементарную первой последовательности, расположенную в той же ориентации, что и первая последовательность, где вторая последовательность расположена между первой последовательностью и третьей последовательностью, и третья последовательность функционально связана с первой последовательностью и третьей последовательностью.Various embodiments are directed to expression vectors containing one or more polynucleotides or one or more interfering RNA constructs encoding one or more interfering RNA polynucleotides described herein that are capable of self-annealing to form a hairpin structure, wherein the construct contains: (a) one or more of the polynucleotides described herein; (b) a second sequence encoding a spacer element that forms a loop of the hairpin structure; and (c) a third sequence containing a sequence inversely complementary to the first sequence located in the same orientation as the first sequence, where the second sequence is located between the first sequence and the third sequence, and the third sequence is operably linked to the first sequence and the third sequence.
Раскрытые последовательности можно применять для конструирования различных полинуклеотидов, которые не образуют шпилечных структур. Например, двунитевая РНК может быть образована посредством (1) транскрибирования первой цепи ДНК путем функционального связывания с первым промотором и (2) транскрибирования последовательности, обратно комплементарной фрагменту ДНК первой цепи путем функционального связывания со вторым промотором. Каждую цепь полинуклеотида можно транскрибировать из одного вектора экспрессии, или из разных векторов экспрессии. РНК-дуплекс, обладающий свойствами РНК-интерференции, можно ферментативно преобразовать в siRNA для модулирования уровней РНК.The disclosed sequences can be used to construct various polynucleotides that do not form hairpin structures. For example, a double-stranded RNA can be formed by (1) transcribing a first strand of DNA by operably linking to a first promoter and (2) transcribing a sequence reversely complementary to a DNA fragment of the first strand by operably linking to a second promoter. Each polynucleotide strand can be transcribed from a single expression vector, or from different expression vectors. An RNA duplex having RNA interference properties can be enzymatically converted to siRNA to modulate RNA levels.
Таким образом, различные варианты осуществления направлены на векторы экспрессии, содержащие один или более полинуклеотидов или конструкций интерферирующей РНК, описанных в данном документе, кодирующих полинуклеотиды интерферирующей РНК, способные к самоотжигу, в которых конструкция содержит: (a) один или более полинуклеотидов, описанных в данном документе; и (b) вторую последовательность, содержащую последовательность, комплементарную (например, обратно комплементарную) первой последовательности, расположенную в той же ориентации, что и первая последовательность.Thus, various embodiments are directed to expression vectors comprising one or more of the interfering RNA polynucleotides or constructs described herein encoding interfering RNA polynucleotides capable of self-annealing, wherein the construct comprises: (a) one or more of the polynucleotides described herein; and (b) a second sequence containing a sequence that is complementary (eg, inversely complementary) to the first sequence in the same orientation as the first sequence.
Предусмотрены различные композиции и способы для модулирования уровней эндогенной экспрессии одного или более полипептидов, описанных в данном документе (или любой их комбинации, описанной в данном документе) путем стимулирования косупрессии экспрессии генов.Various compositions and methods are provided for modulating endogenous expression levels of one or more of the polypeptides described herein (or any combination thereof described herein) by promoting co-suppression of gene expression.
Различные композиции и способы предусмотрены для модулирования уровня экспрессии эндогенного гена путем модулирования трансляции мРНК. Клетку растения-хозяина (табака) можно трансформировать вектором экспрессии, содержащим промотор, функционально связанный с полинуклеотидом, расположенным в антисмысловой ориентации по отношению к промотору, для обеспечения экспрессии РНК-полинуклеотидов, имеющих последовательность, комплементарную части мРНК.Various compositions and methods are provided for modulating the expression level of an endogenous gene by modulating mRNA translation. A host plant (tobacco) cell can be transformed with an expression vector containing a promoter operably linked to a polynucleotide located in an antisense orientation with respect to the promoter to allow expression of RNA polynucleotides having a sequence complementary to the mRNA portion.
Различные векторы экспрессии для модулирования трансляции мРНК могут содержать промотор, функционально связанный с полинуклеотидом, где последовательность расположена в антисмысловой ориентации по отношению к промотору. Длина полинуклеотидов антисмысловой РНК может варьировать и может составлять приблизительно 15-20 нуклеотидов, приблизительно 20-30 нуклеотидов, приблизительно 30-50 нуклеотидов, приблизительно 50-75 нуклеотидов, приблизительно 75-100 нуклеотидов, приблизительно 100-150 нуклеотидов, приблизительно 150-200 нуклеотидов и приблизительно 200-300 нуклеотидов.Various expression vectors for modulating translation of an mRNA may contain a promoter operably linked to a polynucleotide wherein the sequence is located in an antisense orientation with respect to the promoter. The length of antisense RNA polynucleotides can vary and can be about 15-20 nucleotides, about 20-30 nucleotides, about 30-50 nucleotides, about 50-75 nucleotides, about 75-100 nucleotides, about 100-150 nucleotides, about 150-200 nucleotides, and about 200-300 nucleotides.
Мобильные генетические элементыMobile genetic elements
В качестве альтернативы, нацеливание для инактивации в отношении генов можно осуществлять путем введения транспозонов (например, IS-элементов) в геномы представляющих интерес растений. Данные мобильные генетические элементы можно ввести с помощью полового перекрестного опыления и мутантов со вставками можно подвергнуть скринингу в отношении потери функции полипептида. Разрушенный ген родительского растения можно ввести в другие растения путем скрещивания родительского растения с растением, не подвергнутым индуцированному транспозоном мутагенезу, например, путем полового перекрестного опыления. Можно применять любые стандартные методики селекции, известные специалистам в данной области техники. В одном варианте осуществления один или более генов можно инактивировать путем вставки одного или более транспозонов. Мутации могут привести к гомозиготному разрушению одного или более генов, к гетерозиготному разрушению одного или более генов, или к комбинации гомозиготных и гетерозиготных разрушений, если разрушен более чем один ген. Подходящие мобильные элементы включают ретротранспозоны, ретропозоны и SINE-подобные элементы. Такие способы известны специалистам в данной области техники.Alternatively, targeting for gene inactivation can be accomplished by introducing transposons (eg, IS elements) into the genomes of plants of interest. These transposable genetic elements can be introduced by sexual cross-pollination and insertion mutants can be screened for loss of polypeptide function. The disrupted gene of the parent plant can be introduced into other plants by crossing the parent plant with a plant that has not undergone transposon-induced mutagenesis, such as by sexual cross-pollination. Any standard selection techniques known to those skilled in the art can be used. In one embodiment, one or more genes can be inactivated by insertion of one or more transposons. Mutations can lead to homozygous destruction of one or more genes, to heterozygous destruction of one or more genes, or to a combination of homozygous and heterozygous destruction if more than one gene is destroyed. Suitable transposable elements include retrotransposons, retroposons, and SINE-like elements. Such methods are known to those skilled in the art.
РибозимыRibozymes
В качестве альтернативы, нацеливание для инактивации в отношении генов можно осуществлять путем введения рибозимов, полученных из ряда малых кольцевых РНК, которые способны к саморасщеплению и репликации в растениях. Данные РНК могут реплицироваться либо самостоятельно (РНК вироида), либо с участием вируса-помощника (сателлитные РНК). Примеры подходящих РНК включают полученные из вироида солнечной пятнистости авокадо и сателлитные РНК, полученные из вируса кольцевой пятнистости табака, вируса временной полосатости люцерны, вируса бархатной пятнистости табака, вируса пятнистости Solanum nodiflorum и вируса пятнистости клевера подземного. Различные специфичные к целевой РНК рибозимы известны специалистам в данной области техники.Alternatively, gene inactivation targeting can be accomplished by introducing ribozymes derived from a range of small circular RNAs that are capable of self-cleavage and replication in plants. These RNAs can replicate either on their own (viroid RNA) or with the help of a helper virus (satellite RNA). Examples of suitable RNAs include avocado sunspot viroid-derived and satellite RNAs derived from tobacco ring spot virus, alfalfa temporary banding virus, tobacco velvet spot virus, Solanum nodiflorum spot virus, and subterranean clover spot virus. Various target RNA-specific ribozymes are known to those skilled in the art.
Мутантные или не встречающиеся в природе растения или клетки растения могут иметь любую комбинацию одной или более мутаций в одном или более генах, которая приводит в результате к модулированию экспрессии, или функции, или активности этих генов или их продуктов. Например, мутантные или не встречающиеся в природе растения или клетки растения могут иметь одну мутацию в одном гене; несколько мутаций в одном гене; одну мутацию в двух или более, или трех или более, или четырех или более генах; или несколько мутаций в двух или более, или трех или более, или четырех или более генах. Примеры таких мутаций описаны в данном документе. В качестве дополнительного примера, мутантные или не встречающиеся в природе растения или клетки растения могут иметь одну или более мутаций в конкретной части гена(генов), например, в участке гена, который кодирует активный сайт полипептида или его часть. В качестве дополнительного примера, мутантные или не встречающиеся в природе растения или клетки растения могут иметь одну или более мутаций в участке вне одного или более гена(генов), как, например, участок выше или ниже по последовательности от гена, который он регулирует, при условии, что они модулируют функцию или экспрессию гена(генов). Элементы, расположенные выше по последовательности, могут включать промоторы, энхансеры или факторы транскрипции. Некоторые элементы, такие как энхансеры, могут располагаться выше по последовательности или ниже по последовательности от гена, который они регулируют. Элемент(элементы) не обязательно расположен рядом с геном, который он регулирует, так как было обнаружено, что некоторые элементы расположены на расстоянии в несколько тысяч пар оснований выше по последовательности или ниже по последовательности от гена, который они регулируют. Мутантные или не встречающиеся в природе растения или клетки растения могут иметь одну или более мутаций, расположенных в первых 100 нуклеотидах от гена(генов), в первых 200 нуклеотидах от гена(генов), в первых 300 нуклеотидах от гена(генов), в первых 400 нуклеотидах от гена(генов), в первых 500 нуклеотидах от гена(генов), в первых 600 нуклеотидах от гена(генов), в первых 700 нуклеотидах от гена(генов), в первых 800 нуклеотидах от гена(генов), в первых 900 нуклеотидах от гена(генов), в первой 1000 нуклеотидов от гена(генов), в первых 1100 нуклеотидах от гена(генов), в первых 1200 нуклеотидах от гена(генов), в первых 1300 нуклеотидах от гена(генов), в первых 1400 нуклеотидах от гена(генов) или в первых 1500 нуклеотидах от гена(генов). Мутантные или не встречающиеся в природе растения или клетки растения могут иметь одну или более мутаций, расположенных в первом, втором, третьем, четвертом, пятом, шестом, седьмом, восьмом, девятом, десятом, одиннадцатом, двенадцатом, тринадцатом, четырнадцатом или пятнадцатом наборе из 100 нуклеотидов гена(генов) или их комбинации. Раскрыты мутантные или не встречающиеся в природе растения или клетки растения (например, мутантные, не встречающиеся в природе или трансгенные растения или клетки растения и т. п., как описано в данном документе), содержащие варианты мутантного полипептида.Mutant or non-naturally occurring plants or plant cells may have any combination of one or more mutations in one or more genes that results in modulation of the expression or function or activity of those genes or their products. For example, mutant or non-naturally occurring plants or plant cells may have one mutation in one gene; multiple mutations in the same gene; one mutation in two or more, or three or more, or four or more genes; or multiple mutations in two or more, or three or more, or four or more genes. Examples of such mutations are described in this document. As a further example, mutant or non-naturally occurring plants or plant cells may have one or more mutations in a particular portion of the gene(s), for example, in the region of a gene that encodes the active site of a polypeptide or a portion thereof. As a further example, mutant or non-naturally occurring plants or plant cells may have one or more mutations in a region outside one or more of the gene(s), such as a region upstream or downstream of the gene it regulates, provided that they modulate the function or expression of the gene(s). Upstream elements may include promoters, enhancers, or transcription factors. Some elements, such as enhancers, may be upstream or downstream of the gene they regulate. The element(s) are not necessarily located adjacent to the gene it regulates, as some elements have been found to be several thousand base pairs upstream or downstream from the gene they regulate. Mutant or non-naturally occurring plants or plant cells may have one or more mutations located in the first 100 nucleotides of the gene(s), in the first 200 nucleotides of the gene(s), in the first 300 nucleotides of the gene(s), in the first 400 nucleotides of the gene(s), in the first 500 nucleotides of the gene(s), in the first 600 nucleotides of the gene (genes), in the first 700 nucleotides from the gene(s), in the first 800 nucleotides from the gene(s), in the first 900 nucleotides from the gene(s), in the first 1000 nucleotides from the gene(s), in the first 1100 nucleotides from the gene(s), in the first 1200 nucleotides from the gene(s), in the first 1300 nucleotides from the gene (genes), in the first 1400 nucleotides from the gene(s) or in the first 1500 nucleotides from the gene(s). Mutant or non-naturally occurring plants or plant cells may have one or more mutations located in the first, second, third, fourth, fifth, sixth, seventh, eighth, ninth, tenth, eleventh, twelfth, thirteenth, fourteenth, or fifteenth set of 100 nucleotides of the gene(s), or a combination thereof. Disclosed are mutant or non-naturally occurring plants or plant cells (eg, mutant, non-naturally occurring or transgenic plants or plant cells, etc., as described herein) containing variants of the mutant polypeptide.
В одном варианте осуществления семена растений подвергают мутагенезу и затем выращивают из них мутантные растения первого поколения. Затем растениям первого поколения дают самоопылиться и из семян от растений первого поколения выращивают растения второго поколения, которые затем проверяют на наличие мутаций в их локусах. Не смотря на то, что подвергнутый мутации растительный материал можно подвергнуть скринингу на наличие мутаций, преимуществом скрининга растений второго поколения является то, что все соматические мутации соответствуют мутациям в зародышевых линиях. Специалисту в данной области техники будет понятно, что различный растительный материал, в том числе без ограничения семена, пыльцу, ткань растения или клетки растения, можно подвергнуть мутагенезу для создания мутантных растений. Однако тип растительного материала, подвергнутого мутагенезу, может иметь значение, когда полинуклеотид растения подвергают скринингу на наличие мутаций. Например, если пыльцу подвергают мутагенезу до опыления не подвергнутого мутагенезу растения, из семян, полученных при этом опылении, выращивают растения первого поколения. Каждая клетка растений первого поколения будет содержать мутации, возникшие в пыльце; таким образом, эти растения первого поколения можно затем подвергнуть скринингу на наличие мутаций вместо того, чтобы ждать появления второго поколения.In one embodiment, plant seeds are subjected to mutagenesis and then grown into first generation mutant plants. The first generation plants are then allowed to self-pollinate and the seeds from the first generation plants are grown into second generation plants which are then tested for mutations at their loci. Although mutated plant material can be screened for mutations, the advantage of screening second generation plants is that all somatic mutations correspond to mutations in the germline. One of skill in the art will appreciate that various plant material, including, without limitation, seeds, pollen, plant tissue, or plant cells, can be mutated to create mutant plants. However, the type of plant material subjected to mutagenesis may be of importance when a plant polynucleotide is screened for mutations. For example, if pollen is subjected to mutagenesis prior to pollination of an unmutated plant, first generation plants are grown from the seeds obtained from this pollination. Each cell of the first generation plants will contain mutations that originated in the pollen; thus, these first generation plants can then be screened for mutations instead of waiting for the second generation to appear.
Получение модифицированных растений, скрининг и скрещиваниеObtaining modified plants, screening and crossing
Полинуклеотид, полученный из отдельных растений, клеток растения или растительного материала, можно необязательно объединить, чтобы ускорить скрининг в отношении мутаций в популяции растений, происходящих из подвергнутых мутагенезу ткани, клеток растения или растительного материала. Можно проверить одно или более следующих поколений растений, клеток растения или растительного материала. Размер необязательно объединенной группы зависит от чувствительности применяемого способа скрининга.A polynucleotide derived from individual plants, plant cells, or plant material can optionally be combined to expedite screening for mutations in a plant population derived from mutated tissue, plant cells, or plant material. One or more next generations of plants, plant cells, or plant material can be tested. The size of the optionally pooled group depends on the sensitivity of the screening method used.
После необязательного объединения образцов, их можно подвергнуть анализу с помощью методик полинуклеотид-специфичной амплификации, таких как ПЦР. Любой один или более праймеров или зондов, специфичных в отношении гена или последовательностей, непосредственно примыкающих к гену, можно применять для амплификации последовательностей в пределах необязательно объединенного образца. Предпочтительно для амплификации участков локуса, в которых с наибольшей вероятностью возникают полезные мутации, разрабатывают один или более праймеров или зондов. Наиболее предпочтительно праймер разрабатывают для выявления мутаций в участках полинуклеотида. Дополнительно, предпочтительным для праймера(праймеров) и зонда(зондов) было бы обеспечить избегание известных полиморфных сайтов для облегчения скрининга точечных мутаций. Для облегчения выявления продуктов амплификации один или более праймеров или зондов можно метить с применением любого общепринятого способа введения метки. Праймер(праймеры) или зонд(зонды) можно разрабатывать на основе последовательностей, описанных в данном документе, с помощью способов, которые хорошо известны в данной области техники.After optionally pooling the samples, they can be analyzed using polynucleotide-specific amplification techniques such as PCR. Any one or more primers or probes specific for a gene or sequences immediately adjacent to a gene can be used to amplify sequences within an optionally pooled sample. Preferably, one or more primers or probes are designed to amplify regions of the locus where beneficial mutations are most likely to occur. Most preferably, the primer is designed to detect mutations in regions of the polynucleotide. Additionally, it would be preferred for the primer(s) and probe(s) to avoid known polymorphic sites to facilitate screening for point mutations. To facilitate identification of amplification products, one or more primers or probes can be labeled using any conventional labeling method. Primer(s) or probe(s) can be designed based on the sequences described herein using methods that are well known in the art.
Для облегчения выявления продуктов амплификации праймер(праймеры) или зонд(зонды) можно метить с применением любого общепринятого способа внесения метки. Их можно разрабатывать на основе последовательностей, описанных в данном документе, с помощью способов, которые хорошо известны в данной области техники.To facilitate identification of amplification products, the primer(s) or probe(s) may be labeled using any conventional labeling method. They can be designed based on the sequences described herein using methods that are well known in the art.
Полиморфизмы можно идентифицировать с помощью средств, известных в данной области техники, и некоторых из описанных в литературе.Polymorphisms can be identified by means known in the art and some of those described in the literature.
В некоторых вариантах осуществления растение можно регенерировать или вырастить из растения, ткани растения или клетки растения. Можно применять любые подходящие способы регенерации или выращивания растения из клетки растения или ткани растения, такие как без ограничения культивирование тканей или регенерация из протопластов. Предпочтительно растения можно регенерировать путем выращивания трансформированных клеток растения на среде для индукции образования каллюса, среде для индукции образования побегов и/или среде для индукции образования корней. См., например, Plant Cell Reports (1986) 5:81-84. Затем данные растения можно выращивать и либо опылять их с помощью той же трансформированной линии, либо других линий и идентифицировать получаемый в результате гибрид, характеризующийся экспрессией требуемой фенотипической характеристики. Можно выращивать два или более поколений, чтобы убедиться, что экспрессия требуемой фенотипической характеристики стабильно поддерживается и наследуется, и затем собирать семена, чтобы убедиться, что экспрессия требуемой фенотипической характеристики была достигнута. Таким образом, выражение «трансформированные семена», используемое в данном документе, относится к семенам, которые содержат нуклеотидную конструкцию, стабильно интегрированную в геном растения.In some embodiments, a plant can be regenerated or grown from a plant, plant tissue, or plant cell. Any suitable methods for regenerating or growing a plant from a plant cell or plant tissue can be used, such as, without limitation, tissue culture or regeneration from protoplasts. Preferably, plants can be regenerated by growing the transformed plant cells on callus induction medium, shoot induction medium and/or root induction medium. See, for example, Plant Cell Reports (1986) 5:81-84. These plants can then be grown and either pollinated with the same transformed line or other lines and the resulting hybrid identified as expressing the desired phenotypic characteristic. You can grow two or more generations to ensure that the expression of the desired phenotypic characteristic is stably maintained and inherited, and then collect seeds to ensure that the expression of the desired phenotypic characteristic has been achieved. Thus, the expression "transformed seeds" as used herein refers to seeds that contain a nucleotide construct stably integrated into the plant genome.
Соответственно, в дополнительном аспекте предусмотрен способ получения мутантного растения. Способ включает получение по меньшей мере одной клетки растения, содержащей ген, кодирующий функциональный полинуклеотид, описанный в данном документе (или любую их комбинацию, описанную в данном документе). Далее эту по меньшей мере одну клетку растения обрабатывают в условиях, эффективных для модулирования функции полинуклеотида(полинуклеотидов), описанного в данном документе. По меньшей мере одну мутантную клетку растения затем подвергают размножению с получением мутантного растение, где мутантное растение характеризуется модулированным уровнем описанного полипептида(полипептидов) (или любой их комбинации, описанной в данном документе) по сравнению с уровнем у контрольного растения. В одном варианте осуществления данного способа получения мутантного растения стадия обработки включает воздействие на по меньшей мере одну клетку химическим мутагенным средством, описанным выше, и в условиях, эффективных для получения по меньшей мере одной мутантной клетки растения. В другом варианте осуществления данного способа стадия обработки включает подвергание по меньшей мере одной клетки воздействию источника ионизирующего излучения в условиях, эффективных для получения по меньшей мере одной мутантной клетки растения. Термин «мутантное растение» включает мутантные растения, у которых генотип является модифицированным по сравнению с генотипом у контрольного растения, предпочтительно с помощью способов, отличных от способов генной инженерии и генетической модификации.Accordingly, in a further aspect, a method for producing a mutant plant is provided. The method includes obtaining at least one plant cell containing a gene encoding a functional polynucleotide described in this document (or any combination thereof, described in this document). This at least one plant cell is then treated under conditions effective to modulate the function of the polynucleotide(s) described herein. At least one mutant plant cell is then propagated to produce a mutant plant, wherein the mutant plant has a modulated level of the described polypeptide(s) (or any combination thereof described herein) compared to that of a control plant. In one embodiment of this method for producing a mutant plant, the step of treating includes exposing at least one cell to a chemical mutagenic agent as described above and under conditions effective to produce at least one mutant plant cell. In another embodiment of this method, the treatment step comprises exposing at least one cell to a source of ionizing radiation under conditions effective to produce at least one mutant plant cell. The term "mutant plant" includes mutant plants in which the genotype is modified from that of the control plant, preferably by methods other than genetic engineering and genetic modification.
В определенных вариантах осуществления мутантное растение, клетка мутантного растения или мутантный растительный материал может содержать одну или более мутаций, которые встречаются в природе в другом растении, клетке растения или растительном материале и обеспечивают требуемый признак. Эту мутацию можно встроить (например, путем интрогрессии) в другое растение, клетку растения или растительный материал (например, растение, клетку растения или растительный материал с генетическим фоном, отличающимся от такового у растения, из которого происходит мутация) для обеспечения у них данного признака. Таким образом, в качестве примера, мутацию, которая встречается в природе в первом растении, можно ввести во второе растение, такое как второе растение с генетическим фоном, отличающимся от такового у первого растения. Таким образом, специалист в данной области техники может осуществлять поиск и идентифицировать растение, несущее в естественных условиях в своем геноме один или более мутантных аллелей генов, описанных в данном документе, которые обеспечивают желаемый признак. Мутантный аллель(аллели), который встречается в природе, можно перенести во второе растение различными способами, включая селекцию, обратное скрещивание и интрогрессию с получением линий, разновидностей или гибридов, которые имеют одну или более мутаций в генах, описанных в данном документе. Та же методика также может быть применена для интрогрессии одной или более не встречающихся в природе мутации(мутаций) из первого растения во второе растение. Растения, демонстрирующие желаемый признак, можно отобрать из пула мутантных растений. Предпочтительно, отбор осуществляют с применением данных о полинуклеотиде, описанном в данном документе. Следовательно, можно осуществлять отбор по генетическому признаку по сравнению с контролем. Такой скрининговый подход может включать применение общепринятых методик амплификации и/или гибридизации, как обсуждалось в данном документе. Таким образом, дополнительный аспект настоящего изобретения относится к способу идентификации мутантного растения, включающему следующие стадии: (a) получение образца, содержащего полинуклеотид, из растения; и (b) определение последовательности полинуклеотида, где отличие в последовательности полинуклеотида по сравнению с полинуклеотидом контрольного растения указывает на то, что указанное растение представляет собой мутантное растение. В другом аспекте предусмотрен способ идентификации мутантного растения, которое накапливает одну или более аминокислот на повышенном или пониженном уровне по сравнению с контрольным растением, включающий следующие стадии: (a) получение образца из растения, подлежащего скринингу; (b) определение того, содержит ли указанный образец одну или более мутаций в одном или более полинуклеотидах, описанных в данном документе; и (c) определение уровня по меньшей мере одной аминокислоты в указанном растении. В другом аспекте предусмотрен способ получения мутантного растения, которое характеризуется повышенными или пониженными уровнями по меньшей мере одной аминокислоты по сравнению с контрольным растением, включающий следующие стадии: (a) получение образца из первого растения; (b) определение того, содержит ли указанный образец одну или более мутаций в одном или более из полинуклеотидов, описанных в данном документе, которые в результате приводят к модулированию уровней по меньшей мере одной аминокислоты, и (c) перенос одной или более мутаций во второе растение. Мутацию(мутации) можно перенести во второе растение с помощью различных способов, которые известны в данной области техники, например с помощью генной инженерии, манипуляции с генами, интрогрессии, селекции растений, обратного скрещивания и т. п. В одном варианте осуществления первое растение является встречающимся в природе растением. В одном варианте осуществления второе растение характеризуется генетическим фоном, отличающимся от такового у первого растения. В другом аспекте предусмотрен способ получения мутантного растения, которое характеризуется повышенными или пониженными уровнями по меньшей мере одной аминокислоты по сравнению с контрольным растением, включающий следующие стадии: (a) получение образца из первого растения; (b) определение того, содержит ли указанный образец одну или более мутаций в одном или более из полинуклеотидов, описанных в данном документе, которые в результате приводят к модулированию уровней по меньшей мере одной аминокислоты; и (c) интрогрессия одной или более мутаций из первого растения во второе растение. В одном варианте осуществления стадия интрогрессии включает селекцию растений, необязательно включая обратное скрещивание и т. п. В одном варианте осуществления первое растение является встречающимся в природе растением. В одном варианте осуществления второе растение характеризуется генетическим фоном, отличающимся от такового у первого растения. В одном варианте осуществления первое растение не является сортом или элитным сортом. В одном варианте осуществления второе растение представляет собой сорт или элитный сорт. Дополнительный аспект относится к мутантному растению (включая мутантное растение, являющееся сортом или элитным сортом), полученному или получаемому с помощью способов, описанных в данном документе. В определенных вариантах осуществления «мутантные растения» могут иметь одну или более мутаций, локализованных только в конкретном участке растения, например, в последовательности одного или более полинуклеотида(полинуклеотидов), описанного(описанных) в данном документе. Согласно данному варианту осуществления остальная геномная последовательность мутантного растения будет такой же или практически такой же, как у растения до мутагенеза.In certain embodiments, the mutant plant, mutant plant cell, or mutant plant material may contain one or more mutations that occur naturally in another plant, plant cell, or plant material and provide the desired trait. The mutation can be inserted (eg, by introgression) into another plant, plant cell, or plant material (eg, a plant, plant cell, or plant material with a different genetic background than the plant from which the mutation originates) to provide the trait. Thus, as an example, a mutation that occurs naturally in the first plant, can be introduced into a second plant, such as a second plant with a different genetic background from that of the first plant. Thus, a person skilled in the art can search for and identify a plant that naturally carries in its genome one or more mutant alleles of the genes described herein that provide the desired trait. The naturally occurring mutant allele(s) can be transferred to a second plant in a variety of ways, including selection, backcrossing, and introgression to produce lines, varieties, or hybrids that have one or more of the mutations in the genes described herein. The same technique can also be applied to introgression of one or more unnatural mutation(s) from a first plant into a second plant. Plants displaying the desired trait can be selected from a pool of mutant plants. Preferably, selection is made using the polynucleotide data described herein. Therefore, it is possible to carry out selection on a genetic basis in comparison with the control. Such a screening approach may include the use of conventional amplification and/or hybridization techniques as discussed herein. Thus, a further aspect of the present invention relates to a method for identifying a mutant plant comprising the steps of: (a) obtaining a sample containing a polynucleotide from a plant; and (b) determining the sequence of a polynucleotide, wherein a difference in the sequence of the polynucleotide compared to that of a control plant indicates that said plant is a mutant plant. In another aspect, a method is provided for identifying a mutant plant that accumulates one or more amino acids at an increased or decreased level compared to a control plant, comprising the steps of: (a) obtaining a sample from the plant to be screened; (b) determining whether said sample contains one or more mutations in one or more of the polynucleotides described herein; and (c) determining the level of at least one amino acid in said plant. In another aspect, a method is provided for producing a mutant plant that is characterized by increased or decreased levels of at least one amino acid compared to a control plant, comprising the steps of: (a) obtaining a sample from a first plant; (b) determining if said sample contains one or more mutations in one or more of the polynucleotides described herein that result in modulation of at least one amino acid levels, and (c) transferring the one or more mutations to a second plant. The mutation(s) can be transferred to the second plant using various methods that are known in the art, such as genetic engineering, gene manipulation, introgression, plant breeding, backcrossing, and the like. In one embodiment, the first plant is a naturally occurring plant. In one embodiment, the second plant has a different genetic background than the first plant. In another aspect, a method is provided for producing a mutant plant that is characterized by increased or decreased levels of at least one amino acid compared to a control plant, comprising the steps of: (a) obtaining a sample from a first plant; (b) determining whether said sample contains one or more mutations in one or more of the polynucleotides described herein that result in modulation of at least one amino acid levels; and (c) introgression of one or more mutations from the first plant into the second plant. In one embodiment, the introgression step includes plant breeding, optionally including backcrossing, etc. In one embodiment, the first plant is a naturally occurring plant. In one embodiment, the second plant has a different genetic background than the first plant. In one embodiment, the first plant is not a cultivar or elite cultivar. In one embodiment, the second plant is a cultivar or elite cultivar. An additional aspect relates to a mutant plant (including a mutant plant that is a cultivar or elite cultivar) obtained or obtained using the methods described herein. In certain embodiments, "mutant plants" may have one or more mutations located only in a particular region of the plant, for example, in the sequence of one or more of the polynucleotide(s) described herein. In this embodiment, the rest of the genomic sequence of the mutant plant will be the same or substantially the same as the plant prior to mutagenesis.
В некоторых вариантах осуществления мутантные растения могут иметь одну или более мутаций, локализованных в более чем одном участке генома растения, таком как в последовательности одного или более полинуклеотидов, описанных в данном документе, и в одном или более дополнительных участках генома. Согласно данному варианту осуществления остальная геномная последовательность мутантного растения не будет такой же или не будет практически такой же, как у растения до мутагенеза. В определенных вариантах осуществления мутантные растения могут не иметь одну или более мутаций в одном или более, двух или более, трех или более, четырех или более или пяти или более экзонах полинуклеотида(полинуклеотидов), описанного(описанных) в данном документе; или могут не иметь одну или более мутаций в одном или более, двух или более, трех или более, четырех или более или пяти или более интронах полинуклеотида(полинуклеотидов), описанного(описанных) в данном документе; или могут не иметь одну или более мутаций в промоторе полинуклеотида(полинуклеотидов), описанного(описанных) в данном документе; или могут не иметь одну или более мутаций в 3'-нетранслируемом участке полинуклеотида(полинуклеотидов), описанного(описанных) в данном документе; или могут не иметь одну или более мутаций в 5'-нетранслируемом участке полинуклеотида(полинуклеотидов), описанного(описанных) в данном документе; или могут не иметь одну или более мутаций в кодирующем участке полинуклеотида(полинуклеотидов), описанного(описанных) в данном документе; или могут не иметь одну или более мутаций в некодирующем участке полинуклеотида(полинуклеотидов), описанного(описанного) в данном документе; или любую комбинацию двух или более, трех или более, четырех или более, пяти или более, или шести или более из их частей.In some embodiments, mutant plants may have one or more mutations located in more than one region of the plant genome, such as in the sequence of one or more of the polynucleotides described herein and in one or more additional regions of the genome. In this embodiment, the rest of the genomic sequence of the mutant plant will not be the same or substantially the same as the plant prior to mutagenesis. In certain embodiments, mutant plants may lack one or more mutations in one or more, two or more, three or more, four or more, or five or more exons of the polynucleotide(s) described herein; or may not have one or more mutations in one or more, two or more, three or more, four or more, or five or more introns of the polynucleotide(s) described herein; or may not have one or more mutations in the promoter of the polynucleotide(s) described herein; or may lack one or more mutations in the 3'-untranslated region of the polynucleotide(s) described herein; or may lack one or more mutations in the 5'-untranslated region of the polynucleotide(s) described herein; or may not have one or more mutations in the coding region of the polynucleotide(s) described herein; or may not have one or more mutations in the non-coding region of the polynucleotide(s) described herein; or any combination of two or more, three or more, four or more, five or more, or six or more of their parts.
В дополнительном аспекте предусмотрен способ идентификации растения, клетки растения или растительного материала, содержащих мутацию в гене, кодирующем полинуклеотид, описанный в данном документе, включающий: (a) осуществление мутагенеза в отношении растения, клетки растения или растительного материала; (b) получение образца из указанного растения, клетки растения или растительного материала или их потомков; и (c) определение полинуклеотидной последовательности гена, или его варианта, или фрагмента, где отличие в указанной последовательности свидетельствует о наличии одной или более мутаций в ней. Этот способ также обеспечивает отбор растений, имеющих мутацию(мутации), которая(которые) встречается(встречаются) в участках генома, которые влияют на экспрессию гена в клетке растения, таких как сайт инициации транскрипции, стартовый кодон, участок интрона, граница раздела экзон-интрон, терминатор или стоп-кодон.In a further aspect, a method is provided for identifying a plant, plant cell, or plant material containing a mutation in a gene encoding a polynucleotide described herein, comprising: (a) performing mutagenesis on the plant, plant cell, or plant material; (b) obtaining a sample from said plant, plant cell or plant material or their descendants; and (c) determining the polynucleotide sequence of a gene, or variant, or fragment, where a difference in said sequence indicates the presence of one or more mutations therein. The method also selects for plants having a mutation(s) that occurs at regions of the genome that affect gene expression in a plant cell, such as a transcription initiation site, start codon, intron region, exon-intron interface, terminator, or stop codon.
Семейства растений, виды, разновидности, семена и культура тканейPlant families, species, varieties, seeds and tissue culture
Растения, подходящие для применения в их отношении генетической модификации, включают однодольные и двудольные растения и системы клеток растений, в том числе виды из одного из следующих семейств: Acanthaceae, Alliaceae, Alstroemeriaceae, Amaryllidaceae, Apocynaceae, Arecaceae, Asteraceae, Berberidaceae, Bixaceae, Brassicaceae, Bromeliaceae, Cannabaceae, Caryophyllaceae, Cephalotaxaceae, Chenopodiaceae, Colchicaceae, Cucurbitaceae, Dioscoreaceae, Ephedraceae, Erythroxylaceae, Euphorbiaceae, Fabaceae, Lamiaceae, Linaceae, Lycopodiaceae, Malvaceae, Melanthiaceae, Musaceae, Myrtaceae, Nyssaceae, Papaveraceae, Pinaceae, Plantaginaceae, Poaceae, Rosaceae, Rubiaceae, Salicaceae, Sapindaceae, Solanaceae, Taxaceae, Theaceae или Vitaceae.Plants suitable for genetic modification to be applied to them include monocot and dicot plants and plant cell systems, including species from one of the following families: Acanthaceae, Alliaceae, Alstroemeriaceae, Amaryllidaceae, Apocynaceae, Arecaceae, Asteraceae, Berberidaceae, Bixaceae, Brassicaceae, Bromeliaceae, Cannabaceae, Caryophyllaceae, Cephalotaxaceae, Chenopodiaceae, Colchicaceae, Cucur bitaceae, Dioscoreaceae, Ephedraceae, Erythroxylaceae, Euphorbiaceae, Fabaceae, Lamiaceae, Linaceae, Lycopodiaceae, Malvaceae, Melanthiaceae, Musaceae, Myrtaceae, Nyssaceae, Papaveraceae, Pinaceae, Plantaginaceae, Poaceae, Rosaceae, Rubiaceae, Salicaceae, Sapindaceae, Solanaceae, Taxaceae, Theaceae or Vitaceae.
Подходящие виды могут включать представителей рода Abelmoschus, Abies, Acer, Agrostis, Allium, Alstroemeria, Ananas, Andrographis, Andropogon, Artemisia, Arundo, Atropa, Berberis, Beta, Bixa, Brassica, Calendula, Camellia, Camptotheca, Cannabis, Capsicum, Carthamus, Catharanthus, Cephalotaxus, Chrysanthemum, Cinchona, Citrullus, Coffea, Colchicum, Coleus, Cucumis, Cucurbita, Cynodon, Datura, Dianthus, Digitalis, Dioscorea, Elaeis, Ephedra, Erianthus, Erythroxylum, Eucalyptus, Festuca, Fragaria, Galanthus, Glycine, Gossypium, Helianthus, Hevea, Hordeum, Hyoscyamus, Jatropha, Lactuca, Linum, Lolium, Lupinus, Lycopersicon, Lycopodium, Manihot, Medicago, Mentha, Miscanthus, Musa, Nicotiana, Oryza, Panicum, Papaver, Parthenium, Pennisetum, Petunia, Phalaris, Phleum, Pinus, Poa, Poinsettia, Populus, Rauwolfia, Ricinus, Rosa, Saccharum, Salix, Sanguinaria, Scopolia, Secale, Solanum, Sorghum, Spartina, Spinacea, Tanacetum, Taxus, Theobroma, Triticosecale, Triticum, Uniola, Veratrum, Vinca, Vitis и Zea.Suitable species may include members of the genus Abelmoschus, Abies, Acer, Agrostis, Allium, Alstroemeria, Ananas, Andrographis, Andropogon, Artemisia, Arundo, Atropa, Berberis, Beta, Bixa, Brassica, Calendula, Camellia, Camptotheca, Cannabis, Capsicum, Carthamus, Catharanthus, Cephalotaxus, Chrysanthemum, Cinchona, Citrullus, Coffea, Colchicum, Coleus, Cucumis, Cucurbita, Cynodon, Datura, Dianthus, Digitalis, Dioscorea, Elaeis, Ephedra, Erianthus, Erythroxylum, Eucalyptus, Festuca, Fragaria, Galanthus, Glycine, Gossypium, Helianthus, Hevea, Hordeum, Hyoscyamus, Jatropha, L actuca, Linum, Lolium, Lupinus, Lycopersicon, Lycopodium, Manihot, Medicago, Mentha, Miscanthus, Musa, Nicotiana, Oryza, Panicum, Papaver, Parthenium, Pennisetum, Petunia, Phalaris, Phleum, Pinus, Poa, Poinsettia, Populus, Rauwolfia, Ricinus, Rosa, Saccharum, Salix, Sanguinaria , Scopolia, Secale, Solanum, Sorghum, Spartina, Spinacea, Tanacetum, Taxus, Theobroma, Triticosecale, Triticum, Uniola, Veratrum, Vinca, Vitis and Zea.
Подходящие виды могут включать Panicum spp., Sorghum spp., Miscanthus spp., Saccharum spp., Erianthus spp., Populus spp., Andropogon gerardii (бородач Жерара), Pennisetum purpureum (слоновая трава), Phalaris arundinacea (двукисточник тростниковидны), Cynodon dactylon (свинорой пальчатый), Festuca arundinacea (овсяница тростниковая), Spartina pectinata (спартина гребешковая), Medicago sativa (люцерна), Arundo donax (арундо тростниковый), Secale cereale (рожь), Salix spp. (ива), Eucalyptus spp. (эвкалипт), Triticosecale (тритикале), бамбук, Helianthus annuus (подсолнечник), Carthamus tinctorius (сафлор красильный), Jatropha curcas (ятрофа), Ricinus communis (клещевина), Elaeis guineensis (масличная пальма), Linum usitatissimum (лен), Brassica juncea, Beta vulgaris (сахарная свекла), Manihot esculenta (маниок), Lycopersicon esculentum (томат), Lactuca sativa (латук), Musyclise alca (банан), Solanum tuberosum (картофель), Brassica oleracea (брокколи, цветная капуста, брюссельская капуста), Camellia sinensis (чай), Fragaria ananassa (земляника), Theobroma cacao (какао), Coffeycliseca (кофе), Vitis vinifera (виноград), Ananas comosus (ананас), Capsicum annum (острый и сладкий перец), Allium cepa (лук), Cucumis melo (дыня), Cucumis sativus (огурец), Cucurbita maxima (тыква гигантская), Cucurbita moschata (тыква мускатная), Spinacea oleracea (шпинат), Citrullus lanatus (арбуз), Abelmoschus esculentus (бамия), Solanum melongena (баклажан), Rosa spp. (роза), Dianthus caryophyllus (гвоздика), Petunia spp. (петуния), Poinsettia pulcherrima (пуансеттия), Lupinus albus (люпин), Uniola paniculata (овес), полевица (Agrostis spp.), Populus tremuloides (тополь осинообразный), Pinus spp. (сосна), Abies spp. (пихта), Acer spp. (клен), Hordeum vulgare (ячмень), Poa pratensis (мятлик), Lolium spp. (плевел) и Phleum pratense (тимофеевка), Panicum virgatum (просо), Sorghuycliseor (сорго, суданская трава), Miscanthus giganteus (мискантус), Saccharum sp. (сахарный тростник), Populus balsamifera (тополь), Zea mays (кукуруза), Glycine max (соя), Brassica napus (канола), Triticum aestivum (пшеница), Gossypium hirsutum (хлопчатник), Oryza sativa (рис), Helianthus annuus (подсолнечник), Medicago sativa (люцерна), Beta vulgaris (сахарная свекла) или Pennisetum glaucum (просо жемчужное).Suitable species may include Panicum spp., Sorghum spp., Miscanthus spp., Saccharum spp., Erianthus spp., Populus spp., Andropogon gerardii (Gerard's bearded vulture), Pennisetum purpureum (elephantgrass), Phalaris arundinacea (reedweed), Cynodon dactylon (pig finger), Festuca arundinacea (cane fescue), Spartina pectinata (comb spartina), Medicago sativa (alfalfa), Arundo donax (cane arundo), Secale cereale (rye), Salix spp. (willow), Eucalyptus spp. (eucalyptus), Triticosecale (triticale), bamboo, Helianthus annuus (sunflower), Carthamus tinctorius (safflower), Jatropha curcas (jatropha), Ricinus communis (castor bean), Elaeis guineensis (oil palm), Linum usitatissimum (flax), Brassica juncea, Beta vulgaris (sugar beet), Manihot escul enta (cassava), Lycopersicon esculentum (tomato), Lactuca sativa (lettuce), Musyclise alca (banana), Solanum tuberosum (potato), Brassica oleracea (broccoli, cauliflower, Brussels sprouts), Camellia sinensis (tea), Fragaria ananassa (strawberry), Theobroma cacao (cocoa), Coffeycliseca (cocoa) fe), Vitis vinifera (grape), Ananas comosus (pineapple), Capsicum annum (hot and sweet pepper), Allium cepa (onion), Cucumis melo (melon), Cucumis sativus (cucumber), Cucurbita maxima (giant gourd), Cucurbita moschata (nutmeg gourd), Spinacea oleracea (spinach), Citrullus lanatus (watermelon), Abelmo schus esculentus (okra), Solanum melongena (eggplant), Rosa spp. (rose), Dianthus caryophyllus (carnation), Petunia spp. (petunia), Poinsettia pulcherrima (poinsettia), Lupinus albus (lupine), Uniola paniculata (oats), bent grass (Agrostis spp.), Populus tremuloides (aspen poplar), Pinus spp. (pine), Abies spp. (fir), Acer spp. (maple), Hordeum vulgare (barley), Poa pratensis (bluegrass), Lolium spp. (chaff) and Phleum pratense (timothy), Panicum virgatum (millet), Sorghuycliseor (sorghum, Sudan grass), Miscanthus giganteus (miscanthus), Saccharum sp. (sugarcane), Populus balsamifera (poplar), Zea mays (corn), Glycine max (soybean), Brassica napus (canola), Triticum aestivum (wheat), Gossypium hirsutum (cotton plant), Oryza sativa (rice), Helianthus annuus (sunflower), Medicago sativa (alfalfa), Beta vulgaris (sugar beet) or Pennisetum glaucum (pearl millet).
Различные варианты осуществления направлены на мутантный табак, не встречающийся в природе табак или трансгенные растения или клетки растения табака, модифицированные для модулирования уровней экспрессии гена, в результате чего получают растения или клетки растения, например растение или клетку растения табака, в которых уровень экспрессии полипептида модулирован в тканях, представляющих интерес, по сравнению с контролем. Раскрытые композиции и способы можно применять в отношении любого вида рода Nicotiana, включая N. rustica и N. tabacum (например, LA B21, LN KY171, TI 1406, Basma, Galpao, Perique, Beinhart 1000-1 и Petico). Другие виды включают N. acaulis, N. acuminata, N. africana, N. alata, N. ameghinoi, N. amplexicaulis, N. arentsii, N. attenuata, N. azambujae, N. benavidesii, N. benthamiana, N. bigelovii, N. bonariensis, N. cavicola, N. clevelandii, N. cordifolia, N. corymbosa, N. debneyi, N. excelsior, N. forgetiana, N. fragrans, N. glauca, N. glutinosa, N. goodspeedii, N. gossei, N. hybrid, N. ingulba, N. kawakamii, N. knightiana, N. langsdorffii, N. linearis, N. longiflora, N. maritima, N. megalosiphon, N. miersii, N. noctiflora, N. nudicaulis, N. obtusifolia, N. occidentalis, N. occidentalis subsp. hesperis, N. otophora, N. paniculata, N. pauciflora, N. petunioides, N. plumbaginifolia, N. quadrivalvis, N. raimondii, N. repanda, N. rosulata, N. rosulata subsp. ingulba, N. rotundifolia, N. setchellii, N. simulans, N. solanifolia, N. spegazzinii, N. stocktonii, N. suaveolens, N. sylvestris, N. thyrsiflora, N. tomentosa, N. tomentosiformis, N. trigonophylla, N. umbratica, N. undulata, N. velutina, N. wigandioides и N. x sanderae.Предпочтительно, растение табака представляет собой N. tabacum. Various embodiments are directed to mutant tobacco, non-naturally occurring tobacco, or transgenic tobacco plants or plant cells modified to modulate gene expression levels, resulting in plants or plant cells, such as a tobacco plant or plant cell, in which the expression level of the polypeptide is modulated in the tissues of interest compared to a control. The disclosed compositions and methods can be applied to any species of the genus Nicotiana , including N. rustica and N. tabacum (eg, LA B21, LN KY171, TI 1406, Basma, Galpao, Perique, Beinhart 1000-1 and Petico). Другие виды включают N. acaulis, N. acuminata, N. africana, N. alata, N. ameghinoi, N. amplexicaulis, N. arentsii, N. attenuata, N. azambujae, N. benavidesii, N. benthamiana, N. bigelovii, N. bonariensis, N. cavicola, N. clevelandii, N. cordifolia, N. corymbosa, N. debneyi, N. excelsior, N. forgetiana, N. fragrans, N. glauca, N. glutinosa, N. goodspeedii, N. gossei, N. hybrid, N. ingulba, N. kawakamii, N. knightiana, N. langsdorffii, N. linearis, N. longiflora, N. maritima, N. megalosiphon, N. miersii, N. noctiflora, N. nudicaulis, N. obtusifolia, N. occidentalis, N. occidentalis subsp. hesperis, N. otophora, N. paniculata, N. pauciflora, N. petunioides, N. plumbaginifolia, N. quadrivalvis, N. raimondii, N. repanda, N. rosulata, N. rosulata subsp. ingulba, N. rotundifolia, N. setchellii, N. simulans, N. solanifolia, N. spegazzinii, N. stocktonii, N. suaveolens, N. sylvestris, N. thyrsiflora, N. tomentosa, N. tomentosiformis, N. trigonophylla, N. umbratica, N. undulata, N. velutina, N. wigandioides and N. x sanderae. Preferably, the tobacco plant is N. tabacum.
Применение сортов табака и элитных сортов табака также предусмотрено в данном документе. Трансгенное, не встречающееся в природе или мутантное растение, следовательно, может представлять собой разновидность табака или элитный сорт табака, которые содержат один или более трансгенов или одну или более генетических мутаций или их комбинацию. Генетическая мутация(мутации) (например, один или более полиморфизмов) могут представлять собой мутации, которые не существуют в природе в отдельной разновидности табака или сорте табака (например, элитном сорте табака), или может представлять собой генетическую мутацию(мутации), которая(которые) существует(существуют) в природе при условии, что мутация не существует в природе в отдельной разновидности табака или сорте табака (например, в элитном сорте табака).The use of tobacco varieties and elite varieties of tobacco is also contemplated in this document. A transgenic, non-naturally occurring or mutant plant, therefore, may be a variety of tobacco or an elite variety of tobacco that contains one or more transgenes or one or more genetic mutations, or a combination thereof. The genetic mutation(s) (e.g., one or more polymorphisms) may be mutations that do not naturally occur in a particular tobacco variety or tobacco variety (e.g., elite tobacco variety), or may be a genetic mutation(s) that(s) exist(s) in nature, provided that the mutation does not naturally occur in a particular tobacco variety or tobacco variety (e.g., elite tobacco variety).
Особенно применимые разновидности Nicotiana tabacum включают табак типа Берлей, табак темного типа, табак трубоогневой сушки и табак восточного типа. Неограничивающими примерами разновидностей или сортов являются: BD 64, CC 101, CC 200, CC 27, CC 301, CC 400, CC 500, CC 600, CC 700, CC 800, CC 900, Coker 176, Coker 319, Coker 371 Gold, Coker 48, CD 263, DF911, DT 538 LC табак Galpao, GL 26H, GL 350, GL 600, GL 737, GL 939, GL 973, HB 04P, HB 04P LC, HB3307PLC, гибрид 403LC, гибрид 404LC, гибрид 501 LC, K 149, K 326, K 346, K 358, K394, K 399, K 730, KDH 959, KT 200, KT204LC, KY10, KY14, KY 160, KY 17, KY 171, KY 907, KY907LC, KY14xL8 LC, Little Crittenden, McNair 373, McNair 944, msKY 14xL8, Narrow Leaf Madole, Narrow Leaf Madole LC, NBH 98, N-126, N-777LC, N-7371LC, NC 100, NC 102, NC 2000, NC 291, NC 297, NC 299, NC 3, NC 4, NC 5, NC 6, NC7, NC 606, NC 71, NC 72, NC 810, NC BH 129, NC 2002, Neal Smith Madole, OXFORD 207, PD 7302 LC, PD 7309 LC, PD 7312 LC, табак «Перик», PVH03, PVH09, PVH19, PVH50, PVH51, R 610, R 630, R 7-11, R 7-12, RG 17, RG 81, RG H51, RGH 4, RGH 51, RS 1410, Speight 168, Speight 172, Speight 179, Speight 210, Speight 220, Speight 225, Speight 227, Speight 234, Speight G-28, Speight G-70, Speight H-6, Speight H20, Speight NF3, TI 1406, TI 1269, TN 86, TN86LC, TN 90, TN 97, TN97LC, TN D94, TN D950, TR (Tom Rosson) Madole, VA 309, VA359, AA 37-1, B13P, Xanthi (Mitchell-Mor), Bel-W3, 79-615, Samsun Holmes NN, KTRDC номер 2 гибрид 49, Burley 21, KY8959, KY9, MD 609, PG01, PG04, PO1, PO2, PO3, RG11, RG 8, VA509, AS44, Banket A1, Basma Drama B84/31, Basma I Zichna ZP4/B, Basma Xanthi BX 2A, Batek, Besuki Jember, C104, Coker 347, Criollo Misionero, Delcrest, Djebel 81, DVH 405, Comum, HB04P, Hicks Broadleaf, Kabakulak Elassona, Kutsage E1, LA BU 21, NC 2326, NC 297, PVH 2110, Red Russian, Samsun, Saplak, Simmaba, Talgar 28, Wislica, Yayaldag, Prilep HC-72, Prilep P23, Prilep PB 156/1, Prilep P12-2/1, Yaka JK-48, Yaka JB 125/3, TI-1068, KDH-960, TI-1070, TW136, Basma, TKF 4028, L8, TKF 2002, GR141, Basma xanthi, GR149, GR153, Petit Havana. Также предусмотрены подразновидности вышеуказанного с низким уровнем превращения никотина в норникотин, даже если они специально не указаны в данном документе.Particularly useful varieties of Nicotiana tabacum include Burley-type tobacco, dark-type tobacco, fire-cured tobacco, and oriental-type tobacco. Non-limiting examples of varieties or varieties are: BD 64, CC 101, CC 200, CC 27, CC 301, CC 400, CC 500, CC 600, CC 700, CC 800, CC 900, Coker 176, Coker 319, Coker 371 Gold, Coker 48, CD 26 3, DF911, DT 538 LC tobacco Galpao, GL 26H, GL 350, GL 600, GL 737, GL 939, GL 973, HB 04P, HB 04P LC, HB3307PLC, hybrid 403LC, hybrid 404LC, hybrid 501 LC, K 149, K 326, K 346, K 358, K394, K 399, K 730, KDH 959, KT 200, KT204LC, KY10, KY14, KY 160, KY 17, KY 171, KY 907, KY907LC, KY14xL8 LC, Little Crittenden, McNair 373, McNair 94 4, msKY 14xL8 Narrow Leaf Madole Narrow Leaf Madole LC NBH 98 N-126 N-777LC N-7371LC 606, NC 71, NC 72, NC 810, NC BH 129, NC 2002, Neal Smith Madole, OXFORD 207, PD 7302 LC, PD 7309 LC, PD 7312 LC, Perique Tobacco, PVH03, PVH09, PVH19, PVH50, PVH51, R 610, R 630, R 7-11, R 7-12, RG 17, RG 81, RG H51, RGH 4, RGH 51, RS 1410, Speight 168, Speight 172, Speight 179, Speight 210, Speight 220, Speight 225, Speight 227, Speight 234 , Speight G-28, Speight G-70, Speight H-6, Speight H20, Speight NF3, TI 1406, TI 1269, TN 86, TN86LC, TN 90, TN 97, TN97LC, TN D94, TN D950, TR (Tom Rosson) Madole, VA 309, VA359, AA 37-1, B13P, Xanthi (Mitchell-Mor), Bel-W3, 79-615, Samsun Holmes NN, KTRDC number 2 hybrid 49, Burley 21, KY8959, KY9, MD 609, PG01, PG04, PO1, PO2, PO3, RG11, RG 8, VA509, AS44, Banket A1 , Basma Drama B84/31, Basma I Zichna ZP4/B, Basma Xanthi BX 2A, Batek, Besuki Jember, C104, Coker 347, Criollo Misionero, Delcrest, Djebel 81, DVH 405, Comum HB04P Hicks Broadleaf Kabakulak Elassona Kutsage E1 LA BU 21 NC 2326 NC 297 PVH 2110 Red Russian Samsun Saplak Simmaba Talgar 28 Wislica Yayaldag Prilep HC-72 ilep P12-2/1, Yaka JK-48, Yaka JB 125/3, TI-1068, KDH-960, TI-1070, TW136, Basma, TKF 4028, L8, TKF 2002, GR141, Basma xanthi, GR149, GR153, Petit Havana. Sub-varieties of the above with a low level of conversion of nicotine to nornicotine are also contemplated, even though they are not specifically mentioned herein.
Варианты осуществления также направлены на композиции и способы для получения мутантных растений, не встречающихся в природе растений, гибридных растений и трансгенных растений, которые были модифицированы для модулирования экспрессии или функции полинуклеотида(полинуклеотидов), описанного в данном документе (или любой их комбинации, как описано в данном документе). Преимущественно, полученные мутантные растения, не встречающиеся в природе растения, гибридные растения или трансгенные растения могут быть сходными по общему внешнему виду с контрольными растениями или практически такими же. Различные фенотипические характеристики, такие как степень зрелости, количество листьев на растении, высоту стебля, угол врастания листьев, размер листа (ширина и длина), расстояние междоузлия и соотношение листовая пластина-главная жилка можно оценить путем полевых наблюдений.Embodiments are also directed to compositions and methods for producing plant mutants, non-naturally occurring plants, hybrid plants, and transgenic plants that have been modified to modulate the expression or function of the polynucleotide(s) described herein (or any combination thereof, as described herein). Advantageously, the resulting mutant plants, non-naturally occurring plants, hybrid plants or transgenic plants may be similar in general appearance to control plants or substantially the same. Various phenotypic characteristics such as degree of maturity, number of leaves per plant, stem height, leaf ingrowth angle, leaf size (width and length), internode distance, and lamina-to-vein ratio can be assessed by field observations.
Один аспект относится к семени мутантного растения, не встречающегося в природе растения, гибридного растения или трансгенного растения, описанного в данном документе. Предпочтительно, семя представляют собой семя табака. Дополнительный аспект относится к пыльце или семяпочке мутантного растения, не встречающегося в природе растения, гибридного растения или трансгенного растения, описанного в данном документе. Кроме того, предусмотрено мутантное растение, не встречающееся в природе растение, гибридное растение или трансгенное растение, описанное в данном документе, которое дополнительно содержит полинуклеотид, обеспечивающий развитие мужской стерильности.One aspect relates to the seed of a mutant plant, a non-naturally occurring plant, a hybrid plant, or a transgenic plant described herein. Preferably, the seed is tobacco seed. An additional aspect relates to the pollen or ovule of a mutant plant, non-naturally occurring plant, hybrid plant or transgenic plant described herein. Furthermore, a mutant plant, a non-naturally occurring plant, a hybrid plant, or a transgenic plant as described herein is provided, which further comprises a male sterility polynucleotide.
Также представлена культура тканей из регенерируемых клеток мутантного растения, не встречающегося в природе растения, гибридного растения или трансгенного растения или его части, как описано в данном документе, при этом из культуры регенерируют растения, способные экспрессировать все морфологические и физиологические характеристики родителя. Регенерируемые клетки включают клетки из листьев, пыльцы, зародышей, семядолей, гипокотилей, корней, кончиков корней, пыльников, цветков и их части, семяпочек, побегов, стеблей, черешков, сердцевины и семенных коробочек, или каллюса, или протопластов, полученных из них. Растительный материал, описанный в данном документе, может представлять собой табачный материал, подвергнутый сушке, такой как табачный материал воздушной сушки или солнечной сушки. Примерами разновидностей табака воздушной и солнечной сушки являются таковые типа Берлей и темного типа. Растительный материал, описанный в данном документе, может представлять собой табачный материал трубоогневой сушки, как, например, таковой типа Вирджиния.Also provided is tissue culture from regenerated cells of a mutant plant, non-naturally occurring plant, hybrid plant, or transgenic plant or part thereof, as described herein, wherein plants are regenerated from the culture capable of expressing all of the morphological and physiological characteristics of the parent. Regenerated cells include cells from leaves, pollen, embryos, cotyledons, hypocotyls, roots, root tips, anthers, flowers and parts thereof, ovules, shoots, stems, petioles, pith and bolls, or callus, or protoplasts derived therefrom. The plant material described herein may be dried tobacco material, such as air-dried or sun-dried tobacco material. Examples of air-cured and sun-cured tobacco varieties are those of the Burley type and the dark type. The plant material described herein may be flue-cured tobacco material such as that of the Virginia type.
Рекомендация CORESTA в отношении сушки табака описана в справочнике CORESTA №17, апрель 2016 г., Sustainability in Leaf Tobacco Production (Принципы устойчивого развития в производстве листового табака).The CORESTA recommendation for tobacco drying is described in CORESTA Handbook #17, April 2016, Sustainability in Leaf Tobacco Production.
Одним объектом является получение мутантных, трансгенных или не встречающихся в природе растений или их частей, которые проявляют модулированные уровни NtAAT, что в результате приводит к модулированию уровней по меньшей мере одной аминокислоты, такой как аспартат, в растительном материале, например в листьях, подвергнутых сушке. Поскольку известно, что при нагревании табачного листа аспартат в результате приводит к получению акриламида, модулирование уровней аспартата также может в результате приводить к модуляции уровней акриламида. Синтез аспартата также является важным для синтеза других аминокислот, таких как аспарагин, треонин, изолейцин, цистеин и метионин. Соответственно, уровни одной или более из данных других аминокислот могут модулироваться, если модулируются уровни аспартата. Наличие некоторых аминокислот, таких как треонин, метионин и цистеин, может в результате привести к появлению запаха серы в дыме или аэрозолях, которые получают при нагревании. Следовательно, модулирование уровней данных аминокислот также обеспечивает модуляцию данного запаха серы.One object is to provide mutant, transgenic or non-naturally occurring plants or parts thereof that exhibit modulated levels of NtAAT, resulting in modulated levels of at least one amino acid, such as aspartate, in plant material, such as dried leaves. Since aspartate is known to result in acrylamide when tobacco leaf is heated, modulating aspartate levels can also result in modulating acrylamide levels. The synthesis of aspartate is also important for the synthesis of other amino acids such as asparagine, threonine, isoleucine, cysteine, and methionine. Accordingly, the levels of one or more of these other amino acids may be modulated if the levels of aspartate are modulated. The presence of certain amino acids, such as threonine, methionine, and cysteine, can result in a sulfur odor in smoke or aerosols that are produced by heating. Therefore, modulating the levels of these amino acids also modulates this sulfur odor.
В некоторых вариантах осуществления активность и/или экспрессия одного или более из NtAAT1-S, NtAAT1-T, NtAAT2-S, NtAAT2-T, NtAAT3-S, NtAAT3-T, NtAAT4-S и NtAAT4-T являются модулированными. In some embodiments, the activity and/or expression of one or more of NtAAT1-S, NtAAT1-T, NtAAT2-S, NtAAT2-T, NtAAT3-S, NtAAT3-T, NtAAT4-S, and NtAAT4-T are modulated.
В некоторых вариантах осуществления активность и/или экспрессия одного или более из NtAAT1-S и NtAAT1-T являются модулированными.In some embodiments, the activity and/or expression of one or more of NtAAT1-S and NtAAT1-T are modulated.
В некоторых вариантах осуществления активность и/или экспрессия одного или более из NtAAT2-S и NtAAT2-T являются модулированными.In some embodiments, the activity and/or expression of one or more of NtAAT2-S and NtAAT2-T are modulated.
В некоторых вариантах осуществления активность и/или экспрессия одного или более из NtAAT1-S, NtAAT1-T, NtAAT2-S и NtAAT2-T являются модулированными.In some embodiments, the activity and/or expression of one or more of NtAAT1-S, NtAAT1-T, NtAAT2-S, and NtAAT2-T are modulated.
В некоторых вариантах осуществления экспрессия и/или активность одного или более из NtAAT1-S, NtAAT1-T, NtAAT2-S и NtAAT2-T являются модулированными, при этом экспрессия и/или активность одного или более из NtAAT3-S, NtAAT3-T, NtAAT4-S и NtAAT4-T не являются модулированными.In some embodiments, the expression and/or activity of one or more of NtAAT1-S, NtAAT1-T, NtAAT2-S, and NtAAT2-T are modulated, while the expression and/or activity of one or more of NtAAT3-S, NtAAT3-T, NtAAT4-S, and NtAAT4-T are not modulated.
В некоторых вариантах осуществления экспрессия и/или активность одного или более из NtAAT1-S, NtAAT1-T, NtAAT2-S и NtAAT2-T являются модулированными, при этом экспрессия и/или активность NtAAT3-S NtAAT3-T, NtAAT4-S и NtAAT4-T не являются модулированными.In some embodiments, the expression and/or activity of one or more of NtAAT1-S, NtAAT1-T, NtAAT2-S, and NtAAT2-T are modulated, while the expression and/or activity of NtAAT3-S NtAAT3-T, NtAAT4-S, and NtAAT4-T are not modulated.
Предпочтительно, мутантные, трансгенные или не встречающиеся в природе растения или их части имеют по существу тот же внешний вид, что и контрольное растение.Preferably, the mutant, transgenic, or non-naturally occurring plants, or parts thereof, have substantially the same appearance as the control plant.
Соответственно, в данном документе описаны мутантные, трансгенные или не встречающиеся в природе растения или их части или клетки растения, которые характеризуются модулированными уровнями по меньшей мере одной аминокислоты по сравнению с таковыми в контрольных клетках или контрольных растениях. Мутантные, трансгенные или не встречающиеся в природе растения или клетки растения были модифицированы для модулирования синтеза или функции одного или более полипептидов, описанных в данном документе, путем модулирования экспрессии одного или более соответствующих полинуклеотидов, описанных в данном документе. Предпочтительно, модулированные уровни по меньшей мере одной аминокислоты наблюдаются по меньшей мере в зеленых листьях, предпочтительно в листьях, подвергнутых сушке.Accordingly, this document describes mutant, transgenic or non-naturally occurring plants or plant parts or cells that are characterized by modulated levels of at least one amino acid compared to those in control cells or control plants. Mutant, transgenic or non-naturally occurring plants or plant cells have been modified to modulate the synthesis or function of one or more of the polypeptides described herein by modulating the expression of one or more of the corresponding polynucleotides described herein. Preferably, modulated levels of at least one amino acid are observed in at least green leaves, preferably dried leaves.
Дополнительный аспект относится к мутантному, не встречающемуся в природе или трансгенному растению или клетке, где экспрессия или функция одного или более полипептидов AAT, описанных в данном документе, являются модулированными (например, пониженными), и часть растения (например, зеленые листья, предпочтительно листья, подвергнутые сушке, или табак, подвергнутый сушке) характеризуется модулированными (например, пониженными) уровнями по меньшей мере одной аминокислоты, на по меньшей мере 5% по сравнению с контрольным растением, в котором экспрессия или функция указанного полипептида(полипептидов) не была модулирована (например, понижена). В некоторых вариантах осуществления уровень по меньшей мере одной аминокислоты в растении, например в зеленых листьях, предпочтительно в листьях, подвергнутых сушке, или табаке, подвергнутом сушке, может быть модулирован (например, понижен), например повышен, на по меньшей мере 5%, по меньшей мере 10%, по меньшей мере 20%, по меньшей мере 25%, по меньшей мере 30%, по меньшей мере 40%, по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 98%, по меньшей мере 99%, или по меньшей мере 100%, или по меньшей мере 150%, или по меньшей мере 200%, по количеству или функции. Уровень по меньшей мере одной аминокислоты может быть понижен до невыявляемых количеств.A further aspect relates to a mutant, non-naturally occurring, or transgenic plant or cell, wherein the expression or function of one or more of the AAT polypeptides described herein is modulated (e.g., reduced) and the plant part (e.g., green leaves, preferably dried leaves, or dried tobacco) has modulated (e.g., reduced) levels of at least one amino acid, by at least 5% compared to a control plant in which the expression or the function of said polypeptide(s) has not been modulated (eg reduced). In some embodiments, the level of at least one amino acid in a plant, such as green leaves, preferably dried leaves or dried tobacco, can be modulated (e.g., reduced), such as increased by at least 5%, at least 10%, at least 20%, at least 25%, at least 30%, at least 40%, at least 50%, at least 60%, at least 70%, at least 75%, at least 80%, at least 90%, at least 95%, at least 98%, at least 99%, or at least 100%, or at least 150%, or at least 200%, in amount or function. The level of at least one amino acid may be reduced to undetectable amounts.
Еще один дополнительный аспект относится к растительному материалу, подвергнутому сушке, такому как лист, подвергнутый сушке, или табак, подвергнутый сушке, полученному или получаемому из мутантного, не встречающегося в природе или трансгенного растения или клетки, где экспрессия одного или более полинуклеотидов, описанных в данном документе, или функция полипептида, кодируемого ими, является модулированной (например, пониженной), и где уровень по меньшей мере одной аминокислоты является модулированным (например, пониженным) на по меньшей мере 5%, по меньшей мере 10%, по меньшей мере 20%, по меньшей мере 25%, по меньшей мере 30%, по меньшей мере 40%, по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 98%, по меньшей мере 99%, или по меньшей мере 100%, или по меньшей мере 150%, или по меньшей мере 200% по сравнению с контрольным растением.Another additional aspect relates to a dried plant material, such as a dried leaf or dried tobacco, obtained or derived from a mutant, non-naturally occurring or transgenic plant or cell, wherein the expression of one or more of the polynucleotides described herein, or the function of the polypeptide encoded by them, is modulated (e.g., reduced), and where the level of at least one amino acid is modulated (e.g., reduced) by at least 5%, at at least 10%, at least 20%, at least 25%, at least 30%, at least 40%, at least 50%, at least 60%, at least 70%, at least 75%, at least 80%, at least 90%, at least 95%, at least 98%, at least 99%, or at least 100%, or at least 150%, or at least 200% compared to the control plant.
Предпочтительно, внешний вид указанного растения или его части (например, листа) является практически таким же, как у контрольного растения. Предпочтительно, растение представляет собой растение табака или кофейное растение.Preferably, the appearance of said plant or part (eg, leaf) is substantially the same as that of a control plant. Preferably, the plant is a tobacco plant or a coffee plant.
Варианты осуществления также направлены на композиции и способы для получения мутантных, не встречающихся в природе или трансгенных растений или клеток растения, которые были модифицированы для модулирования экспрессии или функции одного или более полинуклеотидов или полипептидов, описанных в данном документе, которая может в результате приводить к получению растений, или компонентов растения (например, листьев, таких как зеленые листья или сушеные листья, или табака), или клеток растения с модулированным содержанием по меньшей мере одной аминокислоты.Embodiments are also directed to compositions and methods for producing mutant, non-naturally occurring, or transgenic plants or plant cells that have been modified to modulate the expression or function of one or more of the polynucleotides or polypeptides described herein, which may result in plants, or plant components (e.g., leaves, such as green leaves or dried leaves, or tobacco), or plant cells with a modulated content of at least one amino acid.
Мутантные, не встречающиеся в природе или трансгенные растения по внешнему виду могут быть сходными с контрольными растениями или по существу такими же. В одном варианте осуществления вес листьев у мутантного, не встречающегося в природе или трансгенного растения является практически таким же, как у контрольного растения. В одном варианте осуществления количество листьев у мутантного, не встречающегося в природе или трансгенного растения является практически таким же, как у контрольного растения. В одном варианте осуществления вес листьев и количество листьев у мутантного, не встречающегося в природе или трансгенного растения является практически таким же, как у контрольного растения. В одном варианте осуществления высота стебля у мутантных, не встречающихся в природе или трансгенных растений является практически такой же, как у контрольных растений, через, например, один, два или три или более месяцев после пересадки в поле или через 10, 20, 30 или 36 или более дней после обрезания верхушек. Например, высота стебля у мутантных, не встречающихся в природе или трансгенных растений не меньше, чем высота стебля у контрольных растений. В другом варианте осуществления содержание хлорофилла у мутантных, не встречающихся в природе или трансгенных растений является практически таким же, как у контрольных растений. В другом варианте осуществления высота стебля у мутантных, не встречающихся в природе или трансгенных растений является практически такой же, как у контрольных растений, и содержание хлорофилла у мутантных, не встречающихся в природе или трансгенных растений является практически таким же, как у контрольных растений. В других вариантах осуществления размер или форма или количество или окраска листьев у мутантных, не встречающихся в природе или трансгенных растений являются практически такими же, как у контрольных растений. Предпочтительно, растение представляет собой растение табака или кофейное растение.Mutant, non-naturally occurring or transgenic plants may be similar in appearance to control plants or substantially the same. In one embodiment, the leaf weight of the mutant, non-naturally occurring, or transgenic plant is substantially the same as that of the control plant. In one embodiment, the number of leaves in the mutant, non-naturally occurring, or transgenic plant is substantially the same as the control plant. In one embodiment, the leaf weight and number of leaves of the mutant, non-naturally occurring, or transgenic plant is substantially the same as the control plant. In one embodiment, the stem height of the mutant, non-naturally occurring, or transgenic plants is substantially the same as the control plants at, for example, one, two, or three or more months after transplanting into the field, or 10, 20, 30, or 36 or more days after topping. For example, the stem height of the mutant, non-naturally occurring or transgenic plants is no less than the stem height of the control plants. In another embodiment, the chlorophyll content of the mutant, non-naturally occurring, or transgenic plants is substantially the same as that of control plants. In another embodiment, the stem height of the mutant, non-naturally occurring or transgenic plants is substantially the same as the control plants, and the chlorophyll content of the mutant, non-naturally occurring or transgenic plants is substantially the same as the control plants. In other embodiments, the size or shape or number or color of the leaves of the mutant, non-naturally occurring, or transgenic plants are substantially the same as control plants. Preferably, the plant is a tobacco plant or a coffee plant.
В другом аспекте предусмотрен способ модулирования количества по меньшей мере одной аминокислоты в по меньшей мере части растения (например, в листьях, таких как листья, подвергнутые сушке, или в табаке), включающий следующие стадии: (i) модулирование экспрессии или функции одного или более полипептидов, описанных в данном документе (или любой их комбинации, как описано в данном документе), предпочтительно, где полипептид(полипептиды) кодируются соответствующими полинуклеотидами, описанными в данном документе; (ii) измерение уровня по меньшей мере одной аминокислоты в по меньшей мере части (например, в листьях, таких как листья, подвергнутые сушке, или в табаке, или в дыме) мутантного, не встречающегося в природе или трансгенного растения, полученного на стадии (i); и (iii) идентификация мутантного, не встречающегося в природе или трансгенного растения, в котором уровень по меньшей мере одной аминокислоты был модулирован по сравнению с контрольным растением. Предпочтительно внешний вид указанного мутантного, не встречающегося в природе или трансгенного растения является практически таким же, как у контрольного растения. Предпочтительно растение представляет собой растение табака.In another aspect, a method is provided for modulating the amount of at least one amino acid in at least part of a plant (e.g., in leaves, such as dried leaves or in tobacco), comprising the steps of: (i) modulating the expression or function of one or more of the polypeptides described herein (or any combination thereof, as described herein), preferably, wherein the polypeptide(s) are encoded by the corresponding polynucleotides described herein; (ii) measuring the level of at least one amino acid in at least a portion (eg, in leaves, such as dried leaves, or in tobacco, or in smoke) of the mutant, non-naturally occurring, or transgenic plant obtained in step (i); and (iii) identifying a mutant, non-naturally occurring or transgenic plant in which the level of at least one amino acid has been modulated compared to a control plant. Preferably, the appearance of said mutant, non-naturally occurring or transgenic plant is substantially the same as that of the control plant. Preferably the plant is a tobacco plant.
В другом аспекте предусмотрен способ модулирования количества по меньшей мере одной аминокислоты по меньшей мере в части растительного материала, подвергнутого сушке, такого как, листья, подвергнутые сушке, включающий следующие стадии: (i) модулирование экспрессии или функции одного или более полипептидов (или любой их комбинации, как описано в данном документе), предпочтительно, где полипептид(полипептиды) кодируются соответствующими полинуклеотидами, описанными в данном документе; (ii) сбор растительного материала, такого как один или более листьев, и сушки в течение определенного периода времени; (iii) измерение уровня по меньшей мере одной аминокислоты по меньшей мере в части растительного материала, подвергнутого сушке, полученного на стадии (ii) или во время стадии (ii); и (iv) идентификация растительного материала, подвергнутого сушке, в котором уровень по меньшей мере одной аминокислоты был модулирован по сравнению с контрольным растением.In another aspect, a method is provided for modulating the amount of at least one amino acid in at least a portion of dried plant material, such as dried leaves, comprising the steps of: (i) modulating the expression or function of one or more polypeptides (or any combination thereof, as described herein), preferably, wherein the polypeptide(s) are encoded by the corresponding polynucleotides described herein; (ii) collecting plant material, such as one or more leaves, and drying for a specified period of time; (iii) measuring the level of at least one amino acid in at least a portion of the dried plant material obtained in step (ii) or during step (ii); and (iv) identifying the dried plant material in which the level of at least one amino acid has been modulated compared to a control plant.
Повышение уровня экспрессии по сравнению с контролем может составлять от приблизительно 5% до приблизительно 100%, или повышение составляет по меньшей мере 10%, по меньшей мере 20%, по меньшей мере 25%, по меньшей мере 30%, по меньшей мере 40%, по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 98% или 100% или более, как например, 200%, 300%, 500%, 1000% или более, что включает повышение транскрипционной функции, или уровня экспрессии полинуклеотида, или уровня экспрессии полипептида, или их комбинации.The increase in expression level compared to the control can be from about 5% to about 100%, or the increase is at least 10%, at least 20%, at least 25%, at least 30%, at least 40%, at least 50%, at least 60%, at least 70%, at least 75%, at least 80%, at least 90%, at least 95% , at least 98% or 100% or more, such as 200%, 300%, 500%, 1000% or more, which includes an increase in transcriptional function, or polynucleotide expression level, or polypeptide expression level, or combinations thereof.
Повышение функции или активности по сравнению с контролем может составлять от приблизительно 5% до приблизительно 100%, или повышение составляет по меньшей мере 10%, по меньшей мере 20%, по меньшей мере 25%, по меньшей мере 30%, по меньшей мере 40%, по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 98% или 100% или более, как, например, 200%, 300%, 500%, 1000% или более.The increase in function or activity compared to control can be from about 5% to about 100%, or the increase is at least 10%, at least 20%, at least 25%, at least 30%, at least 40%, at least 50%, at least 60%, at least 70%, at least 75%, at least 80%, at least 90%, at least 95% , at least 98% or 100% or more, such as 200%, 300%, 500%, 1000% or more.
Понижение уровня экспрессии по сравнению с контролем может составлять от приблизительно 5% до приблизительно 100%, или понижение составляет по меньшей мере 10%, по меньшей мере 20%, по меньшей мере 25%, по меньшей мере 30%, по меньшей мере 40%, по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 98% или 100%, что включает понижение транскрипционной функции, или уровня экспрессии полинуклеотида, или уровня экспрессии полипептида, или их комбинации. Предпочтительно, экспрессия является пониженной.The decrease in expression level compared to the control can be from about 5% to about 100%, or the decrease is at least 10%, at least 20%, at least 25%, at least 30%, at least 40%, at least 50%, at least 60%, at least 70%, at least 75%, at least 80%, at least 90%, at least 9 5%, at least 98%, or 100%, which includes a reduction in transcriptional function, or polynucleotide expression level, or polypeptide expression level, or combinations thereof. Preferably, the expression is reduced.
Понижение функции или активности по сравнению с контролем может составлять от приблизительно 5% до приблизительно 100%, или понижение составляет по меньшей мере 10%, по меньшей мере 20%, по меньшей мере 25%, по меньшей мере 30%, по меньшей мере 40%, по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 98% или 100%. Предпочтительно, функция или активность являются пониженными.The decrease in function or activity compared to control can be from about 5% to about 100%, or the decrease is at least 10%, at least 20%, at least 25%, at least 30%, at least 40%, at least 50%, at least 60%, at least 70%, at least 75%, at least 80%, at least 90%, at least 9 5%, at least 98% or 100%. Preferably, the function or activity is reduced.
Полинуклеотиды и рекомбинантные конструкции, описанные в данном документе, можно применять для модулирования экспрессии, или функции, или активности полинуклеотидов или полипептидов, описанных в данном документе, в представляющем интерес виде растений, предпочтительно в табаке.The polynucleotides and recombinant constructs described herein can be used to modulate the expression or function or activity of the polynucleotides or polypeptides described herein in a plant species of interest, preferably in tobacco.
Целый ряд способов на основе полинуклеотидов можно применять для повышения уровня экспрессии генов в растениях и клетках растений. В качестве примера, можно получать конструкцию, вектор или вектор экспрессии, совместимые с подлежащим трансформации растением, которые содержат представляющий интерес ген вместе с расположенным выше по последовательности промотором, способным к обеспечению сверхэкспрессии гена в растении или клетке растения. Иллюстративные промоторы описаны в данном документе. После трансформации и при выращивании в подходящих условиях промотор может запускать экспрессию для модулирования уровней данного фермента в растении или в его конкретной ткани. В одном иллюстративном варианте осуществления создают вектор, несущий один или более полинуклеотидов, описанных в данном документе (или любую их комбинацию, как описано в данном документе), для обеспечения сверхэкспрессии гена в растении или клетке растения. Вектор несет подходящий промотор, такой как промотор 35S вируса мозаики цветной капусты CaMV, расположенный выше по последовательности от трансгена, который запускает его конститутивную экспрессию во всех тканях растения. Вектор также несет ген устойчивости к антибиотику с целью обеспечения возможности отбора трансформированных каллюсов и линий клеток.A variety of polynucleotide-based methods can be used to increase the level of gene expression in plants and plant cells. By way of example, a construct, vector or expression vector compatible with the plant to be transformed can be prepared that contains the gene of interest together with an upstream promoter capable of causing the gene to be overexpressed in the plant or plant cell. Exemplary promoters are described herein. After transformation and when grown under suitable conditions, a promoter can drive expression to modulate the levels of a given enzyme in a plant or in a particular tissue thereof. In one exemplary embodiment, a vector is created carrying one or more of the polynucleotides described herein (or any combination thereof, as described herein) to allow overexpression of the gene in a plant or plant cell. The vector carries a suitable promoter, such as the cauliflower mosaic virus CaMV 35S promoter upstream of the transgene, which triggers its constitutive expression in all plant tissues. The vector also carries an antibiotic resistance gene to allow selection of transformed calluses and cell lines.
Экспрессию последовательностей с промоторов можно усилить посредством включения последовательностей, обеспечивающих контроль экспрессии, в том числе энхансеров, активирующих хроматин элементов, элементов, чувствительных к факторам транскрипции и т. п. Такие последовательности, обеспечивающие контроль, могут быть конститутивными и повышать уровень транскрипции универсальным образом; или они могут быть факультативными и повышать уровень транскрипции в ответ на конкретные сигналы. Отдельно следует указать сигналы, связанные со старением, и сигналы, которые активны во время процедуры сушки.Expression of sequences from promoters can be enhanced by including expression control sequences, including enhancers, chromatin activating elements, transcription factor responsive elements, and the like. Such control sequences can be constitutive and increase transcription in a versatile manner; or they may be facultative and increase the level of transcription in response to specific signals. Separately, the signals associated with aging and the signals that are active during the drying procedure should be specified.
Различные варианты осуществления, таким образом, направлены на способы модулирования уровня экспрессии одного или более полинуклеотидов, описанных в данном документе (или любой их комбинации, как описано в данном документе), путем интеграции нескольких копий полинуклеотида в геном растения, при этом данные способы включают трансформацию клетки растения-хозяина вектором экспрессии, который содержит промотор, функционально связанный с одним или более полинуклеотидами, описанными в данном документе. Полипептид, кодируемый рекомбинантным полинуклеотидом, может являться нативным полипептидом или может являться гетерологичным по отношению к клетке.Various embodiments are thus directed to methods of modulating the level of expression of one or more of the polynucleotides described herein (or any combination thereof, as described herein) by integrating multiple copies of the polynucleotide into the plant genome, which methods comprise transforming a host plant cell with an expression vector that contains a promoter operably linked to one or more of the polynucleotides described herein. The polypeptide encoded by the recombinant polynucleotide may be a native polypeptide or may be heterologous to the cell.
В одном варианте осуществления растение, используемое в настоящем изобретении, представляет собой растение, подвергнутое воздушной сушке, поскольку такие растения характеризуются высоким содержанием аминокислот (при выращивании в поле содержание свободных аминокислот составляет более чем приблизительно 27,4 мг/г в пересчете на сухой вес) и высоким содержанием аммиака (при выращивании в поле, более чем приблизительно 0,18% в пересчете на сухой вес) в конце сушки. Мутантные, трансгенные или не встречающиеся в природе растения или их части, подвергнутые воздушной сушке, могут характеризоваться содержанием аминокислот, которое соответствует содержанию свободных аминокислот при выращивании в поле, составляющему менее чем приблизительно 27,4 мг/г в пересчете на сухой вес в конце сушки, например содержанию свободных аминокислот при выращивании в поле, составляющему менее чем приблизительно 20 мг/г в пересчете на сухой вес в конце сушки, или содержанию свободных аминокислот при выращивании в поле, составляющему менее чем приблизительно 15 мг/г в пересчете на сухой вес в конце сушки, или содержанию свободных аминокислот при выращивании в поле, составляющему менее чем приблизительно 10 мг/г в пересчете на сухой вес в конце сушки, или содержанию свободных аминокислот при выращивании в поле, составляющему менее чем приблизительно 5 мг/г в пересчете на сухой вес в конце сушки. Мутантные, трансгенные или не встречающиеся в природе растения или их части, высушенные на воздухе, могут характеризоваться содержанием аммиака, которое при выращивании в поле составляет приблизительно 0,18% в пересчете на сухой вес в конце сушки, или менее чем приблизительно 0,15% в пересчете на сухой вес при выращивании в поле в конце сушки, или менее чем приблизительно 0,10% в пересчете на сухой вес при выращивании в поле в конце сушки, или менее чем приблизительно 0,05% в пересчете на сухой вес при выращивании в поле в конце сушки.In one embodiment, the plant used in the present invention is an air-dried plant because such plants are high in amino acids (more than about 27.4 mg/g free amino acids dry weight when grown in the field) and high in ammonia (greater than about 0.18% dry weight when grown in the field) at the end of drying. Air-dried mutant, transgenic, or non-naturally occurring plants or parts thereof may have an amino acid content that corresponds to a field grown free amino acid content of less than about 27.4 mg/g dry weight at the end of drying, such as a field grown free amino acid content of less than about 20 mg/g dry weight at the end of drying, or a field grown free amino acid content of less than about 1 5 mg/g based on dry weight at the end of drying, or free amino acids when grown in the field less than about 10 mg/g based on dry weight at the end of drying, or free amino acids when grown in the field less than about 5 mg/g based on dry weight at the end of drying. Air-dried mutant, transgenic, or non-naturally occurring plants or parts thereof may have an ammonia content that, when grown in the field, is about 0.18% dry weight at the end of drying, or less than about 0.15% dry weight when grown in the field at the end of drying, or less than about 0.10% dry weight when grown in the field at the end of drying, or less than about 0.05% based on dry weight when grown in the field at the end of drying.
В другом варианте осуществления растение, используемое в настоящем изобретении, представляет собой растение, подвергнутое солнечной сушке, поскольку такие растения характеризуются высоким содержанием аминокислот (при выращивании в поле содержание свободных аминокислот составляет более чем приблизительно 26,5 мг/г в пересчете на сухой вес в конце сушки) и высоким содержанием аммиака (при выращивании в поле, более чем приблизительно 0,14% в пересчете на сухой вес в конце сушки). Мутантные, трансгенные или не встречающиеся в природе растения или их части, подвергнутые солнечной сушке, могут характеризоваться содержанием аминокислот, которое соответствует содержанию свободных аминокислот при выращивании в поле, составляющему менее чем приблизительно 26,5 мг/г в пересчете на сухой вес в конце сушки, например содержанию свободных аминокислот при выращивании в поле, составляющему приблизительно 20 мг/г в пересчете на сухой вес в конце сушки, или содержанию свободных аминокислот при выращивании в поле, составляющему менее чем приблизительно 20 мг/г в пересчете на сухой вес в конце сушки, или содержанию свободных аминокислот при выращивании в поле, составляющему менее чем приблизительно 15 мг/г в пересчете на сухой вес в конце сушки, или содержанию свободных аминокислот при выращивании в поле, составляющему менее чем приблизительно 10 мг/г в пересчете на сухой вес в конце сушки, или содержанию свободных аминокислот при выращивании в поле, составляющему менее чем приблизительно 5 мг/г в пересчете на сухой вес в конце сушки. Мутантные, трансгенные или не встречающиеся в природе растения или их части, подвергнутые солнечной сушке, могут характеризоваться содержанием аммиака, которое при выращивании в поле составляет менее чем приблизительно 0,14% в пересчете на сухой вес в конце сушки, или при выращивании в поле составляет менее чем приблизительно 0,10% в пересчете на сухой вес в конце сушки, или при выращивании в поле составляет менее чем приблизительно 0,05% в пересчете на сухой вес в конце сушки.In another embodiment, the plant used in the present invention is a sun-dried plant because such plants are high in amino acids (when grown in the field, free amino acids are greater than about 26.5 mg/g dry weight at the end of drying) and high in ammonia (when grown in the field, more than about 0.14% dry weight at the end of drying). Mutant, transgenic, or non-naturally occurring, sun-dried plants or parts thereof may have an amino acid content that corresponds to a field grown free amino acid content of less than about 26.5 mg/g dry weight at the end of drying, such as a field grown free amino acid content of about 20 mg/g dry weight at the end of drying, or a field grown free amino acid content of less than about 20 mg/g. g based on dry weight at the end of drying, or a free amino acid content when grown in the field of less than about 15 mg/g based on dry weight at the end of drying, or a content of free amino acids when grown in the field is less than about 10 mg/g based on dry weight at the end of drying, or a content of free amino acids when grown in the field is less than about 5 mg/g based on dry weight at the end of drying. Mutant, transgenic, or non-naturally occurring, sun-dried plants or parts thereof may have an ammonia content that when grown in the field is less than about 0.14% dry weight at the end of drying, or when grown in the field is less than about 0.10% dry weight at the end of drying, or when grown in the field is less than about 0.05% dry weight at the end of drying.
В другом варианте осуществления растение, используемое в настоящем изобретении, представляет собой растение, которое подвергнуто трубоогневой сушке. Такие растения характеризуются содержанием аминокислот, которое соответствует содержанию свободных аминокислот при выращивании в поле, составляющему более чем приблизительно 3 мг/г в пересчете на сухой вес в конце сушки, и содержанием аммиака, которое при выращивании в поле составляет более чем приблизительно 0,02% в пересчете на сухой вес в конце сушки. Мутантные, трансгенные или не встречающиеся в природе растения или их части, подвергнутые трубоогневой сушке, могут характеризоваться содержанием аминокислот, которое соответствует содержанию свободных аминокислот при выращивании в поле, составляющему менее чем приблизительно 3 мг/г в пересчете на сухой вес в конце сушки, например содержанию свободных аминокислот при выращивании в поле, составляющему приблизительно 2,5 мг/г в пересчете на сухой вес в конце сушки, или содержанию свободных аминокислот при выращивании в поле, составляющему менее чем приблизительно 2,0 мг/г в пересчете на сухой вес в конце сушки, или содержанию свободных аминокислот при выращивании в поле, составляющему менее чем приблизительно 1,5 мг/г в пересчете на сухой вес в конце сушки, или содержанию свободных аминокислот при выращивании в поле, составляющему менее чем приблизительно 1,0 мг/г в пересчете на сухой вес в конце сушки, или содержанию свободных аминокислот при выращивании в поле, составляющему менее чем приблизительно 0,5 мг/г в пересчете на сухой вес в конце сушки. Мутантные, трансгенные или не встречающиеся в природе растения или их части, подвергнутые солнечной сушке, могут характеризоваться содержанием аммиака, которое при выращивании в поле составляет менее чем приблизительно 0,02% в пересчете на сухой вес в конце сушки, или при выращивании в поле составляет менее чем приблизительно 0,10% в пересчете на сухой вес в конце сушки, или при выращивании в поле составляет менее чем приблизительно 0,05% в пересчете на сухой вес в конце сушки.In another embodiment, the plant used in the present invention is a plant that has been fire-dried. Such plants are characterized by an amino acid content that corresponds to a field-grown free amino acid content of greater than about 3 mg/g dry weight at the end of drying, and an ammonia content that, when field grown, is greater than about 0.02% dry weight at the end of drying. Flame-dried mutant, transgenic, or non-naturally occurring plants or parts thereof can have an amino acid content that corresponds to a field-grown free amino acid content of less than about 3 mg/g dry weight at the end of drying, such as a field-grown free amino acid content of about 2.5 mg/g dry weight at the end of drying, or a field-grown free amino acid content of less than about 2, 0 mg/g dry weight at the end of drying, or free amino acids when grown in the field less than about 1.5 mg/g dry weight at the end of drying, or free amino acids when grown in the field less than about 1.0 mg/g based on dry weight at the end of drying, or free amino acids when grown in the field less than about 0.5 mg/g based on dry weight at the end of drying. Mutant, transgenic, or non-naturally occurring, sun-dried plants or parts thereof may have an ammonia content that when grown in the field is less than about 0.02% dry weight at the end of drying, or when grown in the field is less than about 0.10% dry weight at the end of drying, or when grown in the field is less than about 0.05% dry weight at the end of drying.
В некоторых вариантах осуществления применение растений, которые подверглись воздушной сушке или солнечной сушке, является предпочтительным.In some embodiments, air-dried or sun-dried plants are preferred.
Содержание аминокислот можно измерять с помощью различных способов, известных из уровня техники. Одним из таких способов является способ MP 1471 rev 5 2011, Resana, Italy: Chelab Silliker S.r.l, NutriSciences Company. Для выявления аминокислот в листьях растения, подвергнутых сушке, после удаления средней жилки пластинки, подвергнутые сушке, при необходимости сушат при 40°C в течение 2-3 дней. Затем табачный материал измельчают в тонкодисперсный порошок (~100 мкM) перед анализом на содержание аминокислот. Другой способ измерения содержания аминокислот в растительном материале описан в UNI EN ISO 13903:2005. В одном варианте осуществления способ, применяемый для измерения содержания аминокислот в растительном материале описано в UNI EN ISO 13903:2005.The content of amino acids can be measured using various methods known in the art. One such method is MP 1471 rev 5 2011, Resana, Italy: Chelab Silliker Srl, NutriSciences Company. In order to detect amino acids in the dried leaves of the plant, after removal of the midrib, the dried lamellae are, if necessary, dried at 40° C. for 2-3 days. The tobacco material is then ground into a fine powder (~100 μM) prior to analysis for amino acid content. Another method for measuring the amino acid content of plant material is described in UNI EN ISO 13903:2005. In one embodiment, a method used to measure the amino acid content of plant material is described in UNI EN ISO 13903:2005.
Содержание аммиака может быть определено по Skalar: MT24- Nitrate, Total Alkaloids, Ammonia, Chloride, TKN. Для выявления аммиака в листьях растения, подвергнутых сушке, после удаления средней жилки пластинки, подвергнутые сушке, при необходимости сушат при 40°C в течение 2-3 дней. Затем табачный материал измельчают в тонкодисперсный порошок (~100 мкM) перед анализом на содержание аммиака. Другие способы измерения содержания аммиака известны в данной области техники и включают способы, описанные в Health Canada (1999) Determination of ammonia in whole tobacco. Tobacco Control Programme. Health Canada Official Способ T-302; и Tobacco Manufacturers Organization (2002) UK smoke constituent study. Annex A Part 5 Method: determination of ammonia yields in mainstream cigarette smoke using the Dionex DX-500 ion chromatograph, Report Nr GC15/M24/02. Ammonia content can be determined by Skalar: MT24-Nitrate, Total Alkaloids, Ammonia, Chloride, TKN. To detect ammonia in the dried leaves of the plant, after removal of the midrib, the dried plates are dried, if necessary, at 40° C. for 2-3 days. The tobacco material is then ground into a fine powder (~100 μM) prior to analysis for ammonia content. Other methods for measuring ammonia are known in the art and include those described in Health Canada (1999) Determination of ammonia in whole tobacco. Tobacco Control Program. Health Canada Official Method T-302; and Tobacco Manufacturers Organization (2002) UK smoke constituent study. Annex A Part 5 Method: determination of ammonia yields in mainstream cigarette smoke using the Dionex DX-500 ion chromatograph, Report Nr GC15/M24/02.
Растение, несущее мутантный аллель одного или более полинуклеотидов, описанных в данном документе (или любой их комбинации, как описано в данном документе), можно применять в программе селекции растений для создания применимых линий, разновидностей и гибридов. В частности, мутантный аллель интрогрессируют в коммерчески важные разновидности, описанные выше. Таким образом, предложены способы селекции растений, которые предусматривают скрещивание мутантного растения, не встречающегося в природе растения или трансгенного растения, как описано в данном документе, с растением, характеризующимся иными генетическими особенностями. Способ может дополнительно включать скрещивание растения-потомка с другим растением и необязательно повторение скрещивания до тех пор, пока не будет получено потомка с необходимыми генетическими признаками или генетическим фоном. Одной из целей, для которой подходят такие способы селекции, является введение желаемого генетического признака в другие разновидности, селекционные линии, гибриды или сорта, особенно те, которые представляют коммерческий интерес. Другой целью является облегчение накопления генетических модификаций различных генов в отдельных разновидностях, линиях, гибридах или сортах растений. Предусмотрены внутривидовые, а также межвидовые скрещивания. Растения-потомки, которые возникают в результате таких скрещиваний, также называемые селекционными линиями, являются примерами не встречающихся в природе растений по настоящему изобретению.A plant carrying a mutant allele of one or more of the polynucleotides described herein (or any combination thereof as described herein) can be used in a plant breeding program to create usable lines, varieties and hybrids. In particular, the mutant allele is introgressed into the commercially important varieties described above. Thus, plant breeding methods are provided which involve crossing a mutant plant, a non-naturally occurring plant, or a transgenic plant, as described herein, with a plant having different genetic characteristics. The method may further comprise crossing the progeny plant with another plant, and optionally repeating the crossing until a progeny with the desired genetic traits or genetic background is obtained. One purpose for which such breeding methods are suitable is to introduce the desired genetic trait into other varieties, breeding lines, hybrids or varieties, especially those of commercial interest. Another purpose is to facilitate the accumulation of genetic modifications of various genes in individual varieties, lines, hybrids or plant varieties. Intraspecific as well as interspecific crosses are provided. The progeny plants that result from such crosses, also referred to as breeding lines, are examples of non-naturally occurring plants of the present invention.
В одном варианте осуществления предусмотрен способ получения не встречающегося в природе растения, включающий: (a) скрещивание мутантного или трансгенного растения со вторым растением с получением семени растения табака-потомка; (b) выращивание семени растения табака-потомка в пригодных для роста растений условиях с получением не встречающегося в природе растения. Способ может дополнительно включать: (c) скрещивание предыдущего поколения не встречающегося в природе растения с самим собою или с другим растением с получением семени растения табака-потомка; (d) выращивание семени растения табака-потомка из стадии (c) в пригодных для роста растений условиях с получением дополнительных не встречающихся в природе растений; и (e) повторение стадий скрещивания и выращивания (c) и (d) несколько раз с получением следующих поколений не встречающихся в природе растений. Способ может необязательно предусматривать перед стадией (a) стадию получения родительского растения, которое содержит охарактеризованные генетические особенности и которое не идентично мутантному или трансгенному растению. В некоторых вариантах осуществления в зависимости от программы селекции стадии скрещивания и выращивания повторяют от 0 до 2 раз, от 0 до 3 раз, от 0 до 4 раз, от 0 до 5 раз, от 0 до 6 раз, от 0 до 7 раз, от 0 до 8 раз, от 0 до 9 раз или от 0 до 10 раз для получения поколений не встречающихся в природе растений. Обратное скрещивание является примером такого способа, в котором потомка скрещивают с одним из его родителей или с другим растением, генетически сходным с его родителем, для получения растения-потомка в следующем поколении, которое имеет генетические особенности, более близкие к одному из родителей. Методики селекции растений, в частности селекции растений, хорошо известны и могут применяться в способах по настоящему изобретению. В настоящем изобретении дополнительно предложены не встречающиеся в природе растения, полученные с помощью данных способов. Определенные варианты осуществления исключают стадию отбора растения.In one embodiment, a method for producing a non-naturally occurring plant is provided, comprising: (a) crossing a mutant or transgenic plant with a second plant to produce seed from a progeny tobacco plant; (b) growing the seed of the progeny tobacco plant under conditions suitable for plant growth to produce a non-naturally occurring plant. The method may further comprise: (c) crossing a previous generation of a non-naturally occurring plant with itself or with another plant to produce seed of a progeny tobacco plant; (d) growing the seed of the progeny tobacco plant of step (c) under conditions suitable for plant growth to produce additional non-naturally occurring plants; and (e) repeating the crossing and rearing steps (c) and (d) several times to produce further generations of non-naturally occurring plants. The method may optionally include before step (a) the step of obtaining a parent plant that contains the characterized genetic features and is not identical to the mutant or transgenic plant. In some embodiments, depending on the breeding program, the crossing and rearing steps are repeated 0 to 2 times, 0 to 3 times, 0 to 4 times, 0 to 5 times, 0 to 6 times, 0 to 7 times, 0 to 8 times, 0 to 9 times, or 0 to 10 times to produce generations of non-naturally occurring plants. Backcrossing is an example of such a method in which a progeny is crossed with one of its parents or with another plant genetically similar to its parent to produce a progeny plant in the next generation that has genetic characteristics more closely related to one of the parents. Plant breeding techniques, in particular plant breeding, are well known and can be used in the methods of the present invention. The present invention further provides non-naturally occurring plants obtained using these methods. Certain embodiments omit the plant selection step.
В некоторых вариантах осуществления способов, описанных в данном документе, линии, полученные в результате селекции и скрининга на наличие вариантных генов, оценивают в поле с применением стандартных полевых процедур. Предусмотрены контрольные генотипы, в том числе генотип исходного не подвергнутого мутагенезу родителя, и места посадки растений расположены в поле согласно рандомизированному полноблочному плану или согласно другому соответствующему планированию поля. Для табака используют стандартные агрономические методики, например, табак собирают, взвешивают и отбирают образцы для химического и другого общепринятого тестирования до и во время сушки. Статистический анализ данных выполняют для подтверждения сходства отобранных линий с родительской линией. Цитогенетические анализы отобранных растений необязательно выполняют для подтверждения взаимосвязей набора хромосом и конъюгации хромосом.In some embodiments of the methods described herein, lines resulting from selection and screening for the presence of variant genes are evaluated in the field using standard field procedures. Control genotypes are provided, including the genotype of the original non-mutated parent, and planting sites are located in the field according to a randomized block plan or other appropriate field planning. For tobacco, standard agronomic practices are used, for example, tobacco is harvested, weighed and sampled for chemical and other conventional testing before and during drying. Statistical data analysis is performed to confirm the similarity of the selected lines with the parent line. Cytogenetic analyzes of selected plants are optionally performed to confirm the relationships of chromosome set and chromosome conjugation.
ДНК-фингерпринтинг, однонуклеотидный полиморфизм, микросателлитные маркеры или подобные технологии можно применять в программе селекции с отбором с помощью маркера (MAS) для переноса или разведения мутантных аллелей гена в других растениях табака, как описано в данном документе. Например, селекционер может создать расщепляющиеся популяции при гибридизации генотипа, содержащего мутантный аллель, с необходимым с агрономической точки зрения генотипом. Растения из F2 или поколений, полученных в результате обратного скрещивания, можно подвергнуть скринингу с применением маркера, полученного из геномной последовательности или ее фрагмента, с применением одной из методик, перечисленных в данном документе. Растения, идентифицированные как обладающие мутантным аллелем, можно подвергнуть обратному скрещиванию или самоопылению для создания второй популяции, подлежащей скринингу. В зависимости от предполагаемого способа наследования или применяемой технологии MAS для отобранных растений может быть необходимым самоопыление перед каждым циклом обратного скрещивания для облегчения обнаружения необходимых отдельных растений. Обратное скрещивание или другую процедуру селекции можно повторять до тех пор, пока необходимый фенотип рекуррентного родителя не восстановится.DNA fingerprinting, single nucleotide polymorphism, microsatellite markers, or similar technologies can be used in a marker-assisted selection (MAS) breeding program to transfer or breed mutant gene alleles in other tobacco plants, as described herein. For example, a breeder can create segregated populations by hybridizing a genotype containing a mutant allele with an agronomically desired genotype. Plants from F2 or backcross generations can be screened with a marker derived from the genomic sequence or fragment thereof using one of the techniques listed herein. Plants identified as having the mutant allele can be backcrossed or selfed to create a second population to be screened. Depending on the intended mode of inheritance or the applied MAS technology, it may be necessary for the selected plants to self-pollinate before each backcrossing cycle to facilitate the discovery of the individual plants needed. Backcrossing or other selection procedure can be repeated until the desired phenotype of the recurrent parent is restored.
Согласно настоящему изобретению в программе селекции успешные скрещивания дают растения F1, которые являются фертильными. Отобранные растения F1 можно скрещивать с одним из родителей, и для растений первого поколения, полученного в результате обратного скрещивания, можно обеспечивать самоопыление с получением популяции, которую снова подвергают скринингу в отношении экспрессии вариантного гена (например, нулевой версии гена). Процесс обратного скрещивания, самоопыления и скрининга повторяют, например, по меньшей мере 4 раза до тех пор, пока при окончательном скрининге не получат растение, которое является фертильным и в достаточной степени подобным рекуррентному родителю. Это растение, при необходимости, самоопыляют и затем потомство снова подвергают скринингу, чтобы подтвердить, что растение демонстрирует экспрессию вариантного гена. В некоторых вариантах осуществления популяцию растений в поколении F2 подвергают скринингу на наличие экспрессии вариантного гена, например растение, которое не экспрессирует полипептид из-за отсутствия гена, идентифицируют согласно стандартным способам, например с помощью методики ПЦР с применением праймеров, созданных на основе информации о последовательности полинуклеотидов для полинуклеотида(полинуклеотидов), описанного в данном документе (или любой их комбинации, описанной в данном документе).According to the present invention, in a breeding program, successful crosses produce F1 plants that are fertile. Selected F1 plants can be crossed with one of the parents, and the first generation plants resulting from backcrossing can be self-pollinated to produce a population that is again screened for expression of a variant gene (eg, a null version of the gene). The process of backcrossing, selfing and screening is repeated, for example, at least 4 times until the final screening produces a plant that is fertile and sufficiently similar to the recurrent parent. This plant is self-pollinated, if necessary, and then the progeny are screened again to confirm that the plant is expressing the variant gene. In some embodiments, a population of F2 generation plants is screened for variant gene expression, e.g., a plant that does not express a polypeptide due to the absence of a gene is identified according to standard methods, e.g., using a PCR technique using primers designed based on the polynucleotide sequence information for the polynucleotide(s) described herein (or any combination thereof described herein).
Разновидности гибридного табака можно получить путем предотвращения самоопыления женских родительских растений (то есть родительских форм) первой разновидности, позволяя пыльце с мужских родительских растений второй разновидности оплодотворить женские родительские растения и обеспечивая образование гибридных семян F1 на женских растениях. Самоопыление женских растений можно предотвратить путем кастрации цветков на ранней стадии развития цветка. В качестве альтернативы, образование пыльцы на женских родительских растениях можно предотвратить, используя какую-либо форму мужской стерильности. Например, мужскую стерильность можно обеспечить посредством цитоплазматической мужской стерильности (CMS) или трансгенной мужской стерильности, где трансген подавляет микроспорогенез и/или образование пыльцы или вызывает самонесовместимость. Женские родительские растения, содержащие CMS, являются особенно применимы. В вариантах осуществления, в которых женские родительские растения характеризуются CMS, пыльцу собирают с мужских фертильных растений и наносят вручную на рыльца женских родительских растений с CMS и собирают полученные семена F1.Hybrid tobacco varieties can be produced by preventing the female parent plants (i.e. parent forms) of the first variety from self-pollinating, allowing pollen from the male parent plant of the second variety to fertilize the female parent plant, and producing F1 hybrid seeds on the female plant. Self-pollination of female plants can be prevented by castrating the flowers early in flower development. Alternatively, pollen production on the female parent plants can be prevented using some form of male sterility. For example, male sterility can be achieved through cytoplasmic male sterility (CMS) or transgenic male sterility, where the transgene suppresses microsporogenesis and/or pollen production or causes self-incompatibility. Female parent plants containing CMS are particularly useful. In embodiments in which the female parent plants are characterized by CMS, pollen is harvested from the male fertile plants and applied by hand to the stigmas of the CMS female parent plants and the resulting F1 seeds are harvested.
Разновидности и линии, описанные в данном документе, можно применять для образования простых гибридов F1 табака. В таких вариантах осуществления растения родительских разновидностей можно выращивать в виде практически однородных смежных популяций для облегчения естественного перекрестного опыления женских родительских растений мужскими родительскими растениями. Семена F1, образовавшиеся на женских родительских растениях, выборочно собирают с помощью обычных средств. Можно также вырастить две разновидности родительского растения в массе и собрать смесь гибридных F1 семян, образовавшихся на женской особи, и семян, образовавшихся на мужской особи в результате самоопыления. В качестве альтернативы, можно осуществить трехлинейное скрещивание, где простой гибрид F1 используют в качестве женской особи и скрещивают с другой мужской особью. В качестве другой альтернативы, можно создать гибриды двойного скрещивания, где потомство F1 двух разных простых гибридов скрещивают само с собой.The varieties and lines described herein can be used to form F1 tobacco simple hybrids. In such embodiments, plants of parental varieties can be grown in substantially uniform contiguous populations to facilitate natural cross-pollination of female parent plants by male parent plants. F1 seeds produced on female parent plants are selectively harvested by conventional means. It is also possible to grow two varieties of the parent plant en masse and collect a mixture of F1 hybrid seeds produced on the female and seeds produced on the male by self-pollination. Alternatively, a trilinear cross can be made where a single F1 hybrid is used as the female and crossed with another male. As another alternative, double cross hybrids can be created, where the F1 offspring of two different simple hybrids are crossed with themselves.
Популяцию мутантных, не встречающихся в природе или трансгенных растений можно подвергнуть скринингу или отбору в отношении тех представителей популяции, которые имеют необходимый признак или фенотип. Например, популяцию из потомства линии с одной трансформацией можно подвергнуть скринингу в отношении тех растений, которые имеют необходимый уровень экспрессии или функции полипептида(полипептидов), кодируемого с ее помощью. Физические и биохимические способы можно применять для выявления уровней экспрессии или активности. Они включают анализ по Саузерну или ПЦР-амплификацию для выявления полинуклеотида; нозерн-блоттинг, анализ с защитой от РНКазы S1, анализ методом удлинения праймера или RT-PCR-амплификацию для выявления РНК-транскриптов; ферментные анализы для выявления ферментативной или рибозимной функции полипептидов и полинуклеотидов; и гель-электрофорез полипептида, вестерн-блоттинг, иммунопреципитацию и иммуноферментные анализы для выявления полипептидов. Другие методики, такие как гибридизация in situ, ферментативное окрашивание и иммуноокрашивание, и ферментативный анализ также можно применять для выявления присутствия, или экспрессии, или функции, или активности полипептидов или полинуклеотидов.A population of mutant, non-naturally occurring, or transgenic plants can be screened or selected for those members of the population that have the desired trait or phenotype. For example, a population from the progeny of a single transformation line may be screened for those plants that have the desired level of expression or function of the polypeptide(s) encoded therewith. Physical and biochemical methods can be used to detect levels of expression or activity. These include Southern analysis or PCR amplification to detect the polynucleotide; Northern blot, RNase S1 protection assay, primer extension assay, or RT-PCR amplification to detect RNA transcripts; enzyme assays to detect the enzymatic or ribozyme function of polypeptides and polynucleotides; and polypeptide gel electrophoresis, Western blotting, immunoprecipitation, and enzyme immunoassays to detect polypeptides. Other techniques such as in situ hybridization, enzymatic staining and immunostaining, and enzymatic analysis can also be used to detect the presence or expression or function or activity of polypeptides or polynucleotides.
В данном документе описаны мутантные, не встречающиеся в природе или трансгенные клетки растения и растения, содержащие один или более рекомбинантных полинуклеотидов, одну или более полинуклеотидных конструкций, одну или более двунитевых РНК, один или более конъюгатов или один или более векторов/векторов экспрессии.This document describes mutant, non-naturally occurring or transgenic plant and plant cells containing one or more recombinant polynucleotides, one or more polynucleotide constructs, one or more double-stranded RNAs, one or more conjugates, or one or more vectors/expression vectors.
Без ограничения растения и их части, описанные в данном документе, можно модифицировать либо до, либо после модулирования экспрессии, функции или активности одного или более полинуклеотидов и/или полипептидов в соответствии с настоящим изобретением.Without limitation, the plants and parts thereof described herein can be modified either before or after modulating the expression, function, or activity of one or more polynucleotides and/or polypeptides in accordance with the present invention.
Одна или более следующих дополнительных генетических модификаций могут присутствовать в мутантных, не встречающихся в природе или трансгенных растениях или их частях.One or more of the following additional genetic modifications may be present in mutant, non-naturally occurring or transgenic plants or parts thereof.
Один или более генов, которые вовлечены в превращение промежуточных продуктов азотного обмена могут быть модифицированы, что в результате приводит к более низким уровням по меньшей мере одного специфичного для табака нитрозамина (TSNA). Неограничивающие примеры таких генов включают гены, кодирующие никотин-деметилазу, такие как CYP82E4, CYP82E5 и CYP82E10, описанные в WO2006/091194, WO2008/070274, WO2009/064771 и WO2011/088180, и нитратредуктазу, как описано в WO2016046288.One or more genes that are involved in the conversion of nitrogen metabolism intermediates can be modified, resulting in lower levels of at least one tobacco-specific nitrosamine (TSNA). Non-limiting examples of such genes include genes encoding nicotine demethylase such as CYP82E4, CYP82E5 and CYP82E10 described in WO2006/091194, WO2008/070274, WO2009/064771 and WO2011/088180 and nitrate reductase as described in WO2016046288.
Один или более генов, которые принимают участие в поглощении тяжелых металлов или транспорте тяжелых металлов, могут быть модифицированы, что в результате приводит к более низкому содержанию тяжелых металлов. Неограничивающие примеры включают семейства полипептидов, ассоциированных с множественной лекарственной устойчивостью, семейства посредников диффузии катионов (CDF), семейство Zrt-, Irt-подобных полипептидов (ZIP), семейство катионообменников (CAX), семейство транспортеров меди (COPT), семейство АТФаз тяжелых металлов (например, HMA, как описано в WO2009/074325 и WO2017/129739), семейство гомологов полипептидов макрофагов, ассоциированных с естественной устойчивостью (NRAMP), и другие члены семейства транспортеров с АТФ-связывающей кассетой (ABC) (например, MRP), как описано в WO2012/028309, которые участвуют в транспорте тяжелых металлов, таких как кадмий.One or more genes that are involved in heavy metal uptake or heavy metal transport may be modified, resulting in lower levels of heavy metals. Non-limiting examples include polypeptide families associated with multidrug resistance, cation diffusion mediator (CDF) families, Zrt-, Irt-like polypeptide (ZIP) family, cation exchanger (CAX) family, copper transporter (COPT) family, heavy metal ATPase family (e.g. HMA as described in WO2009/074325 and WO2017/129739), a family of macrophage polypeptide homologues associated with natural resistance (NRAMP) and other members of the ATP-binding cassette (ABC) transporter family (e.g. MRP) as described in WO2012/028309 that are involved in the transport of heavy metals such as cadmium.
Другие иллюстративные модификации могут приводить к получению растений с модулированной экспрессией или функцией изопропилмалатсинтазы, что в результате приводит к изменению композиции сложного эфира сахарозы, которая может использоваться для изменения ароматического профиля (см. WO2013/029799).Other illustrative modifications can result in plants with modulated isopropyl malate synthase expression or function, resulting in a change in sucrose ester composition that can be used to change the aroma profile (see WO2013/029799).
Другие иллюстративные модификации могут приводить к получению растений с модулированной экспрессией или функцией треонинсинтазы, при этом можно модулировать уровни метионала (см. WO2013/029800).Other exemplary modifications can result in plants with modulated threonine synthase expression or function, where methional levels can be modulated (see WO2013/029800).
Другие иллюстративные модификации могут в результате приводить к получению растений с модулированной экспрессией или функцией одной или более из неоксантинсинтазы, ликопен-бета-циклазы и 9-цис-эпоксикаротиноиддиоксигеназы для модулирования содержания бета-дамасценона для изменения ароматического профиля (см. WO2013/064499).Other exemplary modifications may result in plants with modulated expression or function of one or more of neoxanthine synthase, lycopene beta cyclase, and 9-cis-epoxycarotenoid dioxygenase to modulate beta-damascenone content to alter the aroma profile (see WO2013/064499).
Другие иллюстративные модификации могут приводить к получению растений с модулированными экспрессией или функцией членов семейства CLC хлоридных каналов для модулирования в них уровней нитратов (см. WO2014/096283 и WO2015/197727).Other exemplary modifications may result in plants with modulated expression or function of chloride channel members of the CLC family to modulate their nitrate levels (see WO2014/096283 and WO2015/197727).
Другие иллюстративные модификации могут приводить к получению растений с модулированными экспрессией или функцией одного или более AAT для модулирования уровней одной или более аминокислот, таких как аспартат, в листе и модулирования уровней акриламида в аэрозоле, получаемом при нагревании или горении листа (см. WO2017042162).Other illustrative modifications can result in plants with modulated expression or function of one or more AATs to modulate the levels of one or more amino acids such as aspartate in the leaf and modulate the levels of acrylamide in the aerosol produced by heating or burning the leaf (see WO2017042162).
Примеры других модификаций включают модуляцию переносимости гербицида, например, глифосат является активным ингредиентом множества гербицидов широкого спектра действия. Устойчивые к глифосату трансгенные растения были разработаны путем переноса гена aroA (глифосат-EPSP-синтетаза из Salmonella typhimurium и E.coli). Устойчивые к сульфонилмочевине растения были получены путем трансформации мутантного гена ALS (ацетолактатсинтетаза) из Arabidopsis. Полипептид OB фотосистемы II из мутантного Amaranthus hybridus был перенесен в растения с получением атразин-устойчивых трансгенных растений; и бромоксинил-устойчивые трансгенные растения были получены путем встраивания гена bxn из бактерии Klebsiella pneumoniae. Examples of other modifications include modulating herbicide tolerance, for example, glyphosate is an active ingredient in many broad spectrum herbicides. Glyphosate-resistant transgenic plants have been developed by gene transfer of aroA (glyphosate-EPSP synthetase from Salmonella typhimurium and E. coli ). Sulfonylurea-resistant plants were obtained by transformation of the mutant ALS (acetolactate synthetase) gene from Arabidopsis. The photosystem II OB polypeptide from the mutant Amaranthus hybridus was transferred into plants to produce atrazine-resistant transgenic plants; and bromoxynil-resistant transgenic plants were obtained by inserting the bxn gene from the bacterium Klebsiella pneumoniae.
Другие примеры модификаций приводят в результате к получению растений, которые устойчивы к насекомым. Токсины Bacillus thuringiensis(Bt) могут обеспечить эффективный путь отсрочки появления Bt-устойчивых вредителей, как недавно показано на брокколи, где гены Bt cry1Ac и cry1C в составе «пирамиды» обеспечивали контроль капустной моли, устойчивой к любому отдельному полипептиду, и существенно задерживали эволюционное развитие устойчивых насекомых.Other examples of modifications result in plants that are resistant to insects. toxinsBacillus thuringiensis(Bt) can provide an efficient path delaying the emergence of Bt-resistant pests, as recently shown on broccoli, where the Bt genescry1AcAnd cry1C as part of the "pyramid" provided control of the cabbage moth, resistant to any individual polypeptide, and significantly delayed evolutionary development of resistant insects.
Другая иллюстративная модификация в результате приводит к получению растений, которые устойчивы к заболеваниям, вызванным патогенами (например, вирусами, бактериями, грибами). Были разработаны растения, экспрессирующие ген Xa21 (устойчивость к бактериальному некрозу), с растениями, экспрессирующими как ген слияния Bt, так и ген хитиназы (устойчивость к желтой огневке-травянке и выносливость в отношении ризоктониоза).Another exemplary modification results in plants that are resistant to diseases caused by pathogens (eg, viruses, bacteria, fungi). Plants expressing the Xa21 gene (bacterial necrosis resistance) have been developed, with plants expressing both the Bt fusion gene and the chitinase gene (yellow grass moth resistance and rhizoctonia tolerance).
Другая иллюстративная модификация в результате приводит к корректированию репродуктивной способности, например к мужской стерильности.Another exemplary modification results in a fertility adjustment, such as male sterility.
Другая иллюстративная модификация приводит в результате к получению растений, которые выносливы в отношении абиотического стресса (например, засухе, изменению температуры, засоленности), и выносливые трансгенные растения были получены путем переноса фермента ацилглицерол-фосфат-ацилтрансферазы из Arabidopsis; гены, кодирующие маннитол-дегидрогеназу и сорбитолдегидрогеназу, которые принимают участие в синтезе маннита и сорбита, улучшают устойчивость к засухе.Another exemplary modification results in plants that are tolerant of abiotic stress (eg, drought, temperature change, salinity), and tolerant transgenic plants were obtained by transferring the enzyme acylglycerol phosphate acyltransferase from Arabidopsis; genes encoding mannitol dehydrogenase and sorbitol dehydrogenase, which are involved in the synthesis of mannitol and sorbitol, improve drought tolerance.
Другая иллюстративная модификация в результате приводит к получению растений, в которых активность одной или более эндогенных гликозилтрансфераз, таких как N-ацетилглюкозаминилтрансфераза, β(1,2)-ксилозилтрансфераза и a(1,3)-фукозилтрансфераза, является модулированной (см. WO/2011/117249).Another exemplary modification results in plants in which the activity of one or more endogenous glycosyltransferases such as N-acetylglucosaminyltransferase, β(1,2)-xylosyltransferase and a(1,3)-fucosyltransferase is modulated (see WO/2011/117249).
Другая иллюстративная модификация в результате приводит к получению растений, в которых активность одной или более никотин-N-деметилаз модулируют таким образом, что могут модулироваться уровни норникотина и метаболитов норникотина, которые образуются во время сушки (см. WO2015169927).Another exemplary modification results in plants in which the activity of one or more nicotine N-demethylases is modulated such that the levels of nornicotine and nornicotine metabolites that form during drying can be modulated (see WO2015169927).
Другие иллюстративные модификации могут приводить к получению растений с улучшенными запасными полипептидами и маслами, растений с повышенной эффективностью фотосинтеза, растений с длительным сроком хранения, растений с повышенным содержанием углеводов и растений, устойчивых к грибам. Так же предусмотрены трансгенные растения, в которых была модулирована экспрессия S-аденозил-L-метионина (SAM) и/или цистатионин-гамма-синтазы (CGS).Other illustrative modifications can result in plants with improved storage polypeptides and oils, plants with increased photosynthetic efficiency, plants with a long shelf life, plants with increased carbohydrate content, and plants resistant to fungi. Also contemplated are transgenic plants in which the expression of S-adenosyl-L-methionine (SAM) and/or cystathionine gamma synthase (CGS) has been modulated.
Один или более генов, которые вовлечены в путь синтеза никотина, можно модифицировать с получением растений или частей растений, которые при сушке вырабатывают модулированные уровни никотина. Гены синтеза никотина могут быть выбраны из группы, состоящей из: A622, BBLa, BBLb, JRE5L1, JRE5L2, MATE1, MATE 2, MPO1, MPO2, MYC2a, MYC2b, NBB1, nic1, nic2, NUP1, NUP2, PMT1, PMT2, PMT3, PMT4 и QPT или комбинации одного или более из них.One or more genes that are involved in the nicotine synthesis pathway can be modified to produce plants or plant parts that produce modulated levels of nicotine when dried. The nicotine synthesis genes may be selected from the group consisting of: A622, BBLa, BBLb, JRE5L1, JRE5L2, MATE1, MATE 2, MPO1, MPO2, MYC2a, MYC2b , NBB1, nic1, nic2, NUP1, NUP2, PMT1, PMT2, PMT3, PMT4, and QPT, or a combination of one or more of them.
Один или более генов, которые вовлечены в регулирование количества одного или более алкалоидов, можно модифицировать с получением растений или частей растений, которые при сушке вырабатывают модулированные уровни алкалоида. Гены, обеспечивающие контроль уровня алкалоидов, могут быть выбраны из группы, состоящей из BBLa, BBLb, JRE5L1, JRE5L2, MATE1, MATE 2, MYC2a, MYC2b, nic1, nic2, NUP1 и NUP2 или комбинации двух или более из них.One or more genes that are involved in regulating the amount of one or more alkaloids can be modified to produce plants or plant parts that produce modulated alkaloid levels when dried. Alkaloid control genes may be selected from the group consisting of BBLa , BBLb, JRE5L1, JRE5L2, MATE1, MATE2, MYC2a, MYC2b, nic1, nic2, NUP1, and NUP2 , or a combination of two or more of these.
Один или более таких признаков можно интрогрессировать в мутантные, не встречающиеся в природе или трансгенные растения другого сорта или можно непосредственно трансформировать в них.One or more of these traits can be introgressed into, or directly transformed into, mutant, non-naturally occurring, or transgenic plants of another variety.
В различных вариантах осуществления предусмотрены мутантные растения, не встречающиеся в природе растения или трансгенные растения, а также биомасса, в которых уровень экспрессии одного или более полинуклеотидов в соответствии с настоящим изобретением являются модулированными для модулирования таким образом уровня полипептида(полипептидов), кодируемого ими.In various embodiments, mutant plants, non-naturally occurring plants or transgenic plants, as well as biomass, are provided in which the expression level of one or more polynucleotides of the present invention is modulated to thereby modulate the level of the polypeptide(s) encoded by them.
Части растений, описанных в данном документе, в частности листовую пластинку и среднюю жилку данных растений, можно включить в изготовление или применять в изготовлении различных продуктов потребления, включая без ограничения материалы, образующие аэрозоль, устройства, образующие аэрозоль, курительные изделия, изделия для курения, бездымные продукты, медицинские или косметические продукты, препараты для внутривенного введения, таблетки, порошки и табачные продукты. Примеры материалов, образующих аэрозоль, включают табачные композиции, виды табака, табачный экстракт, резаный табак, резаный наполнитель, сушеный табак, взорванный табак, гомогенизированный табак, восстановленный табак и виды трубочного табака. Курительные изделия и изделия для курения являются, как правило, устройствами, образующими аэрозоль. Примеры курительных изделий или изделий для курения включают сигареты, сигариллы и сигары. Примеры бездымных продуктов включают жевательный табак и нюхательный табак. В определенных устройствах, образующих аэрозоль, вместо сгорания, табачная композиция или другой материал, образующий аэрозоль, нагревают с помощью одного или более электрических нагревательных элементов с получением аэрозоля. В другом типе нагреваемого устройства, образующего аэрозоль, аэрозоль получают путем перемещения тепла от горючего топливного элемента или источника тепла к физически отделенному материалу, образующему аэрозоль, который может быть расположен внутри, вокруг или ниже по потоку относительно источника тепла. Бездымные табачные продукты и различные табак-содержащие материалы, образующие аэрозоль, могут содержать табак в любом виде, в том числе в виде высушенных частиц, кусков, гранул, порошков или суспензии, нанесенной на, смешанной с, окруженной или иным образом комбинированной с другими ингредиентами в любом формате, таком как хлопья, пленки, таблетки, пены или шарики. Используемый в данном документе термин «дым» используют для описания типа аэрозоля, который получен с помощью курительных изделий, таких как сигареты, или при сжигании материала, образующего аэрозоль.Parts of the plants described herein, in particular the lamina and midrib of these plants, can be incorporated into or used in the manufacture of a variety of consumer products, including, without limitation, aerosol generating materials, aerosol generating devices, smoking articles, smoking articles, smokeless products, medical or cosmetic products, intravenous preparations, tablets, powders, and tobacco products. Examples of aerosol forming materials include tobacco compositions, tobacco species, tobacco extract, cut tobacco, cut filler, dried tobacco, exploded tobacco, homogenized tobacco, reconstituted tobacco, and pipe tobacco species. Smoking articles and smoking articles are generally aerosol generating devices. Examples of smoking or smoking articles include cigarettes, cigarillos and cigars. Examples of smokeless products include chewing tobacco and snuff. In certain aerosol generating devices, instead of combustion, the tobacco composition or other aerosol generating material is heated by one or more electrical heating elements to produce an aerosol. In another type of heated aerosol generating device, the aerosol is produced by transferring heat from a combustible fuel cell or heat source to a physically separated aerosol generating material that may be located in, around, or downstream of the heat source. Smokeless tobacco products and various tobacco-containing aerosol forming materials may contain tobacco in any form, including dried particles, lumps, granules, powders, or suspension coated on, mixed with, surrounded by, or otherwise combined with other ingredients in any format, such as flakes, films, tablets, foams, or pellets. As used herein, the term "smoke" is used to describe the type of aerosol that is produced by smoking articles such as cigarettes or by burning an aerosol-forming material.
В одном варианте осуществления также предусмотрен растительный материал, подвергнутый сушке, из мутантных, трансгенных и не встречающихся в природе растений, описанных в данном документе. Способы сушки зеленых табачных листьев известны специалистам в данной области и включают без ограничения воздушную сушку, огневую сушку, трубоогневую сушку и солнечную сушку, как описано в данном документе.In one embodiment, dried plant material is also provided from the mutant, transgenic, and non-naturally occurring plants described herein. Methods for drying green tobacco leaves are known to those skilled in the art and include, without limitation, air drying, fire drying, fire tube drying, and sun drying, as described herein.
В другом варианте осуществления описаны табачные продукты, в том числе табаксодержащие материалы, образующие аэрозоль, содержащие растительный материал, такой как листья, предпочтительно листья, подвергнутые сушке, из мутантных растений табака, трансгенных растений табака или не встречающихся в природе растений табака, описанных в данном документе. Табачные продукты, описанные в данном документе, могут быть смешанными табачными изделиями, которые могут дополнительно содержать немодифицированный табак.In another embodiment, tobacco products are described, including aerosolized tobacco-containing materials containing plant material such as leaves, preferably dried leaves, from the mutant tobacco plants, transgenic tobacco plants, or non-naturally occurring tobacco plants described herein. The tobacco products described herein may be blended tobacco products, which may additionally contain unmodified tobacco.
Продукты и способы для управления сельскохозяйственными культурами и для сельского хозяйства.Products and methods for crop management and agriculture.
Для мутантных, не встречающихся в природе или трансгенных растений могут существовать другие варианты применения в, например, сельском хозяйстве. Например, мутантные, не встречающиеся в природе или трансгенные растения, описанные в данном документе, можно применять для изготовления корма для животных и продуктов питания для человека.For mutant, non-natural or transgenic plants, there may be other uses in, for example, agriculture. For example, the mutant, non-naturally occurring, or transgenic plants described herein can be used to make animal feed and human food.
В настоящем изобретении также предусмотрены способы получения семян, включающие культивирование мутантного растения, не встречающегося в природе растения или трансгенного растения, описанных в данном документе, и сбор семян культивируемых растений. Семена растений, описанных в данном документе, можно кондиционировать и упаковать в упаковочный материал с помощью средств, известных в данной области техники, с получением промышленного изделия. Упаковочный материал, такой как бумага или ткань, хорошо известен в данной области техники. Упаковка семян может иметь этикетку, например маркировку или этикетку, прикрепленную к упаковочному материалу, этикетку, напечатанную на упаковке, которая описывает происхождение содержащихся в ней семян.The present invention also provides methods for producing seeds, comprising cultivating a mutant plant, a non-naturally occurring plant, or a transgenic plant as described herein, and collecting the seeds of the cultivated plants. The seeds of the plants described herein can be conditioned and packaged in a packaging material using means known in the art to form an article of manufacture. Packaging material such as paper or cloth is well known in the art. The seed package may have a label, such as a label or label attached to the packaging material, a label printed on the package, which describes the origin of the seeds it contains.
Композиции, способы и наборы для генотипирования растений для идентификации, отбора или селекции могут включать средства для обнаружения присутствия полинуклеотида (или любой их комбинации, как описано в данном документе) в образце полинуклеотида. Соответственно, описана композиция, содержащая один или более праймеров для специфической амплификации по меньшей мере части одного или более полинуклеотидов, и необязательно один или более зондов, и необязательно один или более реагентов для проведения амплификации или выявления.Compositions, methods, and kits for plant genotyping for identification, selection, or selection may include means for detecting the presence of a polynucleotide (or any combination thereof, as described herein) in a polynucleotide sample. Accordingly, a composition is described comprising one or more primers for specifically amplifying at least a portion of one or more polynucleotides, and optionally one or more probes, and optionally one or more amplification or detection reagents.
Соответственно, раскрыты специфичные в отношении гена олигонуклеотидные праймеры или зонды, содержащие приблизительно 10 или более смежных полинуклеотидов, соответствующих полинуклеотиду(полинуклеотидам), описанному в данном документе. Указанные праймеры или зонды могут содержать или состоять из приблизительно 15, 20, 25, 30, 40, 45 или 50 или более смежных нуклеотидов, которые гибридизируются (например, специфически гибридизируются) с полинуклеотидом(полинуклеотидами), описанным в данном документе. В некоторых вариантах осуществления праймеры или зонды могут содержать или состоять из приблизительно 10-50 смежных нуклеотидов, приблизительно 10-40 смежных нуклеотидов, приблизительно 10-30 смежных нуклеотидов или приблизительно 15-30 смежных нуклеотидов, которые можно применять в зависимых от последовательности способах идентификации гена (например, Саузерн-гибридизация) или выделения (например, гибридизация in situ бактериальных колоний или бляшек бактериофага) или обнаружения гена (например, в виде одного или более праймеров амплификации при амплификации и обнаружении нуклеиновой кислоты). Один или более специфических праймеров или зондов можно разработать и применять для амплификации и обнаружения части или всего полинуклеотида(полинуклеотидов). В качестве конкретного примера, два праймера можно применять в протоколе ПЦР для амплификации полинуклеотидного фрагмента. ПЦР можно также проводить с применением одного праймера, который получен из последовательности полинуклеотида, и второго праймера, который гибридизируется с последовательностью выше или ниже последовательности полинуклеотида, такой как последовательность промотора, 3'-конец мРНК-предшественника или последовательность, полученная из вектора. Примеры термических и изотермических методик, применимых для амплификации полинуклеотидов in vitro, хорошо известны из уровня техники. Образец может происходить или его можно получить из растения, клетки растения, или растительного материала, или табачного продукта, изготовленных из растения, клетки растения или растительного материала, как описано в данном документе.Accordingly, gene-specific oligonucleotide primers or probes containing about 10 or more contiguous polynucleotides corresponding to the polynucleotide(s) described herein are disclosed. Said primers or probes may contain or consist of about 15, 20, 25, 30, 40, 45, or 50 or more contiguous nucleotides that hybridize (eg, specifically hybridize) to the polynucleotide(s) described herein. In some embodiments, primers or probes may comprise or consist of about 10-50 contiguous nucleotides, about 10-40 contiguous nucleotides, about 10-30 contiguous nucleotides, or about 15-30 contiguous nucleotides, which can be used in sequence-dependent methods for gene identification (e.g., Southern hybridization) or isolation (e.g., in situ hybridization of bacterial colonies or plaques of bacterio phage) or gene detection (eg, as one or more amplification primers in nucleic acid amplification and detection). One or more specific primers or probes can be designed and used to amplify and detect part or all of a polynucleotide(s). As a specific example, two primers can be used in a PCR protocol to amplify a polynucleotide fragment. PCR can also be performed using one primer that is derived from a polynucleotide sequence and a second primer that hybridizes to a sequence above or below the polynucleotide sequence, such as a promoter sequence, the 3' end of a precursor mRNA, or a sequence derived from a vector. Examples of thermal and isothermal techniques applicable to in vitro amplification of polynucleotides are well known in the art. The sample may originate from or be obtained from a plant, plant cell, or plant material, or a tobacco product made from a plant, plant cell, or plant material, as described herein.
В дополнительном аспекте также предусмотрен способ выявления полинуклеотида(полинуклеотидов), описанного в данном документе (или любой их комбинации, описанной в данном документе) в образце, включающий следующие стадии: (a) получение образца, содержащего или предположительно содержащего полинуклеотид; (b) приведение указанного образца в контакт с одним или более праймерами или одним или более зондами для специфического выявления по меньшей мере части полинуклеотида(полинуклеотидов); и (c) выявление присутствия продукта амплификации, где присутствие продукта амплификации свидетельствует о присутствии полинуклеотида(полинуклеотидов) в образце. В дополнительном аспекте также предусмотрено применение одного или более праймеров или зондов для специфического выявления по меньшей мере части полинуклеотида(полинуклеотидов). Также предусмотрены наборы для выявления по меньшей мере части полинуклеотида(полинуклеотидов), которые содержат один или более праймеров или зондов для специфического выявления по меньшей мере части полинуклеотида(полинуклеотидов). Набор может содержать реагенты для амплификации полинуклеотида, например реагенты для ПЦР, или реагенты для технологии обнаружения с применением гибридизационного зонда, такой как Саузерн-блоттинг, нозерн-блоттинг, гибридизация in situ или микрочип. Набор может содержать реагенты для технологии обнаружения связывания антител, такой как вестерн-блоттинг, ELISA, SELDI-масс-спектрометрия или тест-полоски. Набор может содержать реагенты для секвенирования ДНК. Набор может содержать реагенты и инструкции по применению набора.In a further aspect, a method is also provided for detecting a polynucleotide(s) described herein (or any combination thereof described herein) in a sample, comprising the steps of: (a) obtaining a sample containing or suspected to contain a polynucleotide; (b) bringing said sample into contact with one or more primers or one or more probes to specifically detect at least a portion of the polynucleotide(s); and (c) detecting the presence of an amplification product, wherein the presence of an amplification product is indicative of the presence of a polynucleotide(s) in the sample. In a further aspect, the use of one or more primers or probes to specifically detect at least a portion of a polynucleotide(s) is also contemplated. Also provided are kits for detecting at least a portion of a polynucleotide(s) that contain one or more primers or probes for specifically detecting at least a portion of a polynucleotide(s). The kit may contain polynucleotide amplification reagents, such as PCR reagents, or reagents for probe hybridization detection technology, such as Southern blot, Northern blot, in situ hybridization, or microarray. The kit may contain reagents for antibody binding detection technology such as Western blotting, ELISA, SELDI mass spectrometry, or test strips. The kit may contain reagents for DNA sequencing. The kit may contain reagents and instructions for using the kit.
В некоторых вариантах осуществления набор может содержать инструкции для одного или более описанных способов. Описанные наборы могут быть применимы для определения генетической идентичности, филогенетических исследований, генотипирования, гаплотипирования, анализа родословной или селекции растений, в частности, с количественной оценкой кодоминантных признаков.In some embodiments, the kit may contain instructions for one or more of the methods described. The disclosed kits may be useful for genetic identity determination, phylogenetic studies, genotyping, haplotyping, pedigree analysis or plant breeding, in particular for quantifying codominant traits.
В настоящем изобретении также предусмотрен способ генотипирования растения, клетки растения или растительного материала, содержащих полинуклеотид, описанный в данном документе. Генотипирование обеспечивает средства различения гомологов пары хромосом и может быть использовано для различения сегрегантов в популяции растений. Способы на основе применения молекулярных маркеров можно применять для филогенетических исследований, характеризующих генетические связи между разновидностями сельскохозяйственных культур, выявления гибридов или соматических гибридов, локализации хромосомных сегментов, влияющих на моногенные признаки, клонирования на основе генетических карт и изучения количественного наследования. В определенном способе генотипирования может использоваться любое количество аналитических методик с молекулярным маркером, включая такие на основе полиморфизма длин амплифицированных фрагментов (AFLP). AFLP является результатом аллельных различий между амплифицированными фрагментами, вызванных изменчивостью полинуклеотида. Таким образом, в настоящем изобретении дополнительно предложены способы отслеживания сегрегации одного или более генов или полинуклеотидов, а также хромосомных последовательностей, генетически связанных с этими генами или полинуклеотидами, с применением таких методик, как анализ AFLP.The present invention also provides a method for genotyping a plant, plant cell or plant material containing the polynucleotide described herein. Genotyping provides a means of distinguishing chromosome pair homologues and can be used to distinguish between segregants in a plant population. Methods based on the use of molecular markers can be used for phylogenetic studies characterizing genetic relationships between crop varieties, identifying hybrids or somatic hybrids, localizing chromosomal segments that affect monogenic traits, cloning based on genetic maps, and studying quantitative inheritance. Any number of molecular marker assays may be used in a particular genotyping method, including those based on amplified fragment length polymorphism (AFLP). AFLP is the result of allelic differences between amplified fragments caused by polynucleotide variability. Thus, the present invention further provides methods for tracking the segregation of one or more genes or polynucleotides, as well as chromosomal sequences genetically linked to those genes or polynucleotides, using techniques such as AFLP analysis.
Настоящее изобретение дополнительно описано в примерах ниже, которые представлены для более подробного описания настоящего изобретения. Эти примеры, в которых изложен предпочтительный режим, предусмотренный в настоящее время для осуществления настоящего изобретения, предназначены для иллюстрации, а не для ограничения настоящего изобретения.The present invention is further described in the examples below, which are provided to describe the present invention in more detail. These examples, which set out the preferred mode currently provided for the implementation of the present invention, are intended to illustrate and not to limit the present invention.
ПРИМЕРЫEXAMPLES
Пример 1. Идентификация основных генов, активация которых коррелирует с уровнем аминокислот после сушки, в табачном листе Берлей, Вирджиния и восточного типаExample 1 Identification of Major Genes whose Activation Correlates with Amino Acid Levels after Drying in Burley, Virginia and Oriental Tobacco Leaf
Для выявления ключевых функций, вносящих вклад в изменения уровня свободных аминокислот в течение начального времени сушки табачного листа Берлей, Вирджиния и восточного типа, проводили анализ преобладания функций генов, активируемых в листьях, подвергнутых сушке, после сушки в течение 48 ч, по сравнению со зрелыми листьями при сборе урожая (изменение кратное log2>2, скорректированное p-значение <0,05) в табаке Берлей, Вирджиния и восточного типа. Идентифицировали гены, участвующие в выработке свободных аминокислот, которые являются активными после 48 ч. сушки независимо от типов сушки и разновидностей табака. Исследовали гены табака, влияющие на выработку аспартата в течение ранней сушки и принадлежащие к семейству AAT.To identify key functions contributing to changes in free amino acid levels during the initial drying time of Burley, Virginia and Oriental tobacco leaf, an analysis was made of the dominance of functions of genes activated in dried leaves after 48 hours of drying compared to mature leaves at harvest (log2>2-fold change, adjusted p-value <0.05) in Burley, Virginia and Oriental tobacco. Identified genes involved in the production of free amino acids, which are active after 48 hours of drying, regardless of the types of drying and varieties of tobacco. We studied tobacco genes that affect the production of aspartate during early drying and belong to the AAT family.
В геноме табака идентифицировали полный набор полинуклеотидов NtAAT, которые представляют собой NtAAT1-S (SEQ ID NO: 5), NtAAT1-T (SEQ ID NO: 7), NtAAT2-S (SEQ ID NO: 1), NtAAT2-T (SEQ ID NO: 3), NtAAT3-S (SEQ ID NO: 9), NtAAT3-T (SEQ ID NO: 11), NtAAT4-S (SEQ ID NO: 13) и NtAAT4-T (SEQ ID NO: 15), и предсказанные полипептидные последовательности которых представляют собой NtAAT1-S (SEQ ID NO: 6), NtAAT1-T (SEQ ID NO: 8), NtAAT2-S (SEQ ID NO: 2), NtAAT2-T (SEQ ID NO: 4, NtAAT3-S (SEQ ID NO: 10), NtAAT3-T (SEQ ID NO: 12), NtAAT4-S (SEQ ID NO: 14) и NtAAT4-T (SEQ ID NO: 16).Complete set of polynucleotides identified in tobacco genomeNtAAT, which representNtAAT1-S (SEQ ID NO: 5),NtAAT1-T (SEQ ID NO: 7),NtAAT2-S (SEQ ID NO: 1),NtAAT2-T (SEQ ID NO: 3),NtAAT3-S (SEQ ID NO: 9),NtAAT3-T (SEQ ID NO: 11),NtAAT4-S (SEQ ID NO: 13) andNtAAT4-T (SEQ ID NO: 15), and whose predicted polypeptide sequences are NtAAT1-S (SEQ ID NO: 6), NtAAT1-T (SEQ ID NO: 8), NtAAT2-S (SEQ ID NO: 2), NtAAT2-T (SEQ ID NO: 4, NtAAT3-S (SEQ ID NO: 10), NtAAT3-T (SEQ ID NO: 12), NtA AT4-S (SEQ ID NO: 14) and NtAAT4-T (SEQ ID NO: 16).
Анализы экспрессии гена показали, что NtAAT2-S (SEQ ID NO: 1) и NtAAT2-T (SEQ ID NO: 3) являются генами, экспрессируемыми на наиболее высоком уровне (>11x) после 48 ч. сушки, в табаке Берлей, Вирджиния и восточного типа по сравнению с зелеными табачными листьями (см. таблицу 1). Интересно, что NtAAT1-T (SEQ ID NO: 7) также был активирован после 48 ч. сушки, но в меньшей степени (>2,5). В зрелых листьях изначально активированы только NtAAT2-S и NtAAT2-T, что свидетельствует о том, что эти гены являются основными пусковыми элементами, обеспечивающими выработку аспартата для синтеза аспарагина.Gene expression analyzes showed that NtAAT2-S (SEQ ID NO: 1) and NtAAT2-T (SEQ ID NO: 3) are the genes expressed at the highest level (>11x) after 48 hours of drying in Burley, Virginia and Oriental type tobacco compared to green tobacco leaves (see Table 1). Interestingly, NtAAT1-T (SEQ ID NO: 7) was also activated after 48 hours of drying, but to a lesser extent (>2.5). In mature leaves, only NtAAT2-S and NtAAT2-T are initially activated, indicating that these genes are the main triggers for aspartate production for asparagine synthesis.
Гены NtAAT2-S и NtAAT2-T характеризуются высоким уровнем экспрессии не только во время ранней сушки листьев, когда происходит разрушение хлорофилла, но также в лепестках (см. таблицу 2). Их экспрессия является очень низкой в корнях и листьях (см. таблицу 2) и других тканях, что свидетельствует о том, что функция NtAAT2-S и NtAAT2-T связана с локализацией в надземных органах, не содержащих хлорофилла. То же наблюдение, по-видимому, справедливо и для NtAAT1-S и NtAAT1-T, но в меньшей степени. Следовательно, авторы настоящего изобретения не могут исключить, что NtAAT1-S и NtAAT1-T также способствуют синтезу аспартата в листьях, подвергнутых сушке. Напротив, NtAAT3-S/NtAAT3-T и NtAAT4-S/NtAAT4-T, по-видимому, более конститутивно экспрессируются во всех тканях растений (см. таблицу 2). The NtAAT2-S and NtAAT2-T genes are characterized by a high level of expression not only during early leaf drying, when chlorophyll is destroyed, but also in the petals (see Table 2). Their expression is very low in roots and leaves (see Table 2) and other tissues, indicating that the function of NtAAT2-S and NtAAT2-T is associated with localization in aerial organs that do not contain chlorophyll. The same observation seems to be true for NtAAT1-S and NtAAT1-T , but to a lesser extent. Therefore, the present inventors cannot rule out that NtAAT1-S and NtAAT1-T also promote aspartate synthesis in dried leaves. In contrast, NtAAT3-S / NtAAT3-T and NtAAT4-S / NtAAT4-T appear to be more constitutively expressed in all plant tissues (see Table 2).
Анализ коэкспрессии подтвердил, что NtAAT2-S, NtAAT2-T, NtASN1-S и NtASN1-T совместно регулируются во время фазы ранней сушки. Для этого использовалась база данных транскриптомов, полученных при сушке табака Берлей, состоящая из транскриптомов 34 не подвергнутых сушке и подвергнутых ранней сушке образцов табака Берлей. Обнаружено, что 168 генов коэкспрессируются с NtASN1-S и NtASN1-T и 12 генов с NtAAT2-S и NtAAT2-T (пороговое значение >0,9). Из этого набора транскриптомов все транскрипты NtAAT2-S, и NtAAT2-T, и NtASN1-S, и NtASN1-T присутствовали в двух наборах последовательностей РНК (9 общих последовательностей), связанных с 5 другими транскриптами. Такая коэкспрессия, ассоциированная с экспериментом по определению зависимости от времени во время сушки (см. фигуру 2), и коэкспрессия в лепестках и листьях, подвергнутых ранней сушке (см. таблицу 2 и WO2017/042162), свидетельствует о том, что все, NtAAT2-S, и NtAAT2-T, и NtASN1-S, и NtASN1-T, согласованно способствуют ассимиляции нитратов в аминокислоты и аспарагин.Co-expression analysis confirmed that NtAAT2-S , NtAAT2-T , NtASN1-S and NtASN1-T are co-regulated during the early drying phase. To do this, we used a database of transcriptomes obtained by drying Burley tobacco, consisting of transcriptomes from 34 non-dried and early-dried samples of Burley tobacco. 168 genes were found to be co-expressed with NtASN1-S and NtASN1-T and 12 genes with NtAAT2-S and NtAAT2-T (cut-off >0.9). From this set of transcriptomes, all NtAAT2-S and NtAAT2-T and NtASN1-S and NtASN1-T transcriptomes were present in two sets of RNA sequences (9 total sequences) associated with 5 other transcripts. This co-expression, associated with the time-dependence experiment during drying (see Figure 2), and co-expression in petals and leaves subjected to early drying (see Table 2 and WO2017/042162), indicates that all, NtAAT2-S , and NtAAT2-T , and NtASN1-S , and NtASN1-T , in concert contribute to the assimilation of neither spending in amino acids and asparagine.
Сайленсинг NtAAT2-S и NtAAT2-T в растениях табака Берлей исследовали для определения того, способствуют ли оба гена понижению уровня аспартата в листьях табака Берлей, подвергнутых сушке. Специфический фрагмент ДНК (SEQ ID NO: 17) в пределах кодирующей последовательности как NtAAT2-S, так и NtAAT2-T клонировали с помощью сильного промотора вируса мозаики мирабилис (MMV) в векторе GATEWAY. Указанный фрагмент гена NtAAT2-S и NtAAT2-T фланкировали между MMV и последовательностью 3'-nos-терминатора гена нопалинсинтазы из Agrobacterium tumefaciens. Линию табака Берлей TN90e4e5e10 (Zyvert) трансформировали с применением стандартных протоколов трансформации, опосредованной Agrobacterium. TN90e4e5e10 (Zyvert) представляет выборку из популяции Берлей, подвергнутой мутагенезу посредством этилметансульфоната (EMS), которая содержит нокаут-мутации в CYP82E4, CYP82E5v2 и CYP82E10 (см. Phytochemistry (2010) 71: 17-18) для предотвращения выработки норникотина. Применение такой исходной линии может позволить избежать возможных трудностей при интерпретации данных по TSNA, которые будут получены в будущем.The silencing of NtAAT2-S and NtAAT2-T in Burley tobacco plants was investigated to determine whether both genes contribute to the reduction of aspartate levels in dried Burley tobacco leaves. A specific DNA fragment (SEQ ID NO: 17) within the coding sequence for both NtAAT2-S and NtAAT2-T was cloned with the mirabilis mosaic virus (MMV) strong promoter in the GATEWAY vector. This NtAAT2-S and NtAAT2-T gene fragment was flanked between MMV and the 3'-nos terminator sequence of the nopaline synthase gene from Agrobacterium tumefaciens . Burley tobacco line TN90e4e5e10 (Zyvert) was transformed using standard Agrobacterium mediated transformation protocols. TN90e4e5e10 (Zyvert) is a selection from an ethyl methanesulfonate (EMS) mutagenesis Burley population that contains knockout mutations in CYP82E4, CYP82E5v2 and CYP82E10 (see Phytochemistry (2010) 71: 17-18) to prevent nornicotine production. The use of such a baseline may avoid possible difficulties in interpreting future TSNA data.
Для обеспечения отбора растений с низким уровнем аспартата, листья 16 отдельных растений T0 (E324) и 4 соответствующие контрольные линии (CTE324) анализировали после 60 ч. сушки для определения влияния на никотин, в качестве контроля (см. фигуру 3) и аспартата (см. фигуру 4). Значительного различия в содержании никотина между листьями растений T0 (E324) и контрольными линиями (CTE324) не наблюдали. Наилучшими линиями T0, демонстрирующими наиболее низкий уровень аспартата, являлись линии 3, 8, 13, 16, 17 и 20, в которых количество аспартата либо обнаружили при очень низких уровнях (75 мкг/г), либо при не подлежащих выявлению. Семена собирали из этих наилучших линий T0, демонстрирующих наиболее низкий уровень аспартата. Потомство T1 анализировали методом qPCR для определения эффективности событий сайленсинга NtAAT2-S и NtAAT2-T в отношении содержания как аспартата, так и аспарагина. To ensure selection of plants with low levels of aspartate, leaves of 16 individual T0 plants (E324) and 4 corresponding control lines (CTE324) were analyzed after 60 hours of drying to determine the effect on nicotine, as a control (see figure 3) and aspartate (see figure 4). No significant difference in nicotine content between leaves of T0 plants (E324) and control lines (CTE324) was observed. The best T0 lines showing the lowest levels of aspartate were lines 3, 8, 13, 16, 17 and 20, in which the amount of aspartate was either found at very low levels (75 μg/g) or at undetectable levels. Seeds were harvested from these top T0 lines showing the lowest levels of aspartate. T1 progeny were analyzed by qPCR to determine the potency of NtAAT2-S and NtAAT2-T silencing events for both aspartate and asparagine content.
Поскольку аспартат играет ключевую роль в синтезе других аминокислот, таких как аспарагин, треонин, изолейцин, цистеин и метионин, манипулирование генами NtAAT (например, с помощью конститутивного промотора или промотора , специфичного для старения, такого как SAG12 или E4) может изменить химический состав листьев табака, подвергнутых сушке. Сходным образом нокаут генов NtAAT с применением стратегии редактирования гена, такой как CRISPR-Cas, или отбор мутантов, может обеспечить изменение химического аминокислотного состава листьев, а также химического состава дыма и аэрозолей основных разновидностей коммерческого табака.Because aspartate plays a key role in the synthesis of other amino acids such as asparagine, threonine, isoleucine, cysteine, and methionine, manipulation of the NtAAT genes (for example, via a constitutive promoter or an aging-specific promoter such as SAG12 or E4) can alter the chemical composition of dried tobacco leaves. Similarly, knocking out the NtAAT genes using a gene editing strategy such as CRISPR-Cas or mutant selection can alter the amino acid chemistry of the leaves as well as the smoke and aerosol chemistry of major commercial tobacco varieties.
Любая публикация, цитируемая или описанная в данном документе, предоставляет соответствующую информацию, раскрытую до даты подачи настоящей заявки. Заявления, сделанные в данном документе, не должны истолковываться как признание того, что авторы настоящего изобретения не имеют оснований для его противопоставления как более ранним таким раскрытиям. Все публикации, упомянутые в вышеприведенном описании, включены в данный документ с помощью ссылки. Различные модификации и варианты настоящего изобретения будут очевидны специалистам в данной области без отступления от объема и сути настоящего изобретения. Несмотря на то, что настоящее изобретение было описано в связи с конкретными предпочтительными вариантами осуществления, следует понимать, что настоящее изобретение, как заявлено, не должно быть неправомерно ограничено такими конкретными вариантами осуществления. В действительности различные модификации описанных способов осуществления изобретения, которые очевидны специалистам в клеточной, молекулярной биологии и биологии растений или в смежных областях, предназначены находиться в пределах объема прилагаемой формулы изобретения.Any publication cited or described in this document provides relevant information disclosed prior to the filing date of this application. The statements made in this document should not be construed as an admission that the authors of the present invention have no reason to contrast it with earlier such disclosures. All publications mentioned in the above description are incorporated into this document by reference. Various modifications and variations of the present invention will be apparent to those skilled in the art without departing from the scope and spirit of the present invention. Although the present invention has been described in connection with specific preferred embodiments, it should be understood that the present invention, as stated, should not be unduly limited to such specific embodiments. Indeed, various modifications of the described methods of carrying out the invention, which are obvious to those skilled in cellular, molecular and plant biology or related fields, are intended to be within the scope of the appended claims.
ТАБЛИЦА 1TABLE 1
Экспрессия NtAAT (FPKM) во время ранней сушки в табаке Берлей (BU), Вирджиния (FC) и табаке восточного типа (OR)Expression of NtAAT (FPKM) during early drying in Burley (BU), Virginia (FC) and Oriental (OR) tobacco
ТАБЛИЦА 2TABLE 2
Экспрессия генов NtAAT в листьях, лепестках и корнях растений табака Берлей (BU) и Вирджиния (FC), выращенных в поле Expression of NtAAT genes in leaves, petals, and roots of Burley (BU) and Virginia (FC) tobacco plants grown in the field
--->--->
ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙSEQUENCE LIST
<110> Филип Моррис Продактс С.А.<110> Philip Morris Products S.A.
<120> МОДУЛИРОВАНИЕ СОДЕРЖАНИЯ АМИНОКИСЛОТ В РАСТЕНИИ<120> MODULATION OF PLANT AMINO ACID CONTENT
<130> P10499EP<130> P10499EP
<140> EP18164766.0<140>EP18164766.0
<141> 2018-03-28<141> 2018-03-28
<160> 17 <160> 17
<170> PatentIn версия 3.5<170> PatentIn version 3.5
<210> 1<210> 1
<211> 6933<211> 6933
<212> ДНКДНК<212> DNADNA
<213> Nicotiana tabacum<213> Nicotiana tabacum
<400> 1<400> 1
atgaacatgt cacaacaatc accgtcaccg tccgctgacc ggaggttgag tgttctggcg 60atgaacatgt cacaacaatc accgtcaccg tccgctgacc ggaggttgag tgttctggcg 60
agacaccttg aactgtcgtc ctccgccacc gtcgaatcct ctatcgtcgc tgctcctacc 120agacaccttg aactgtcgtc ctccgccacc gtcgaatcct ctatcgtcgc tgctcctacc 120
tctggaaatg ctggaaccaa ctctgtcttc tctcacatcg ttcgcgctcc cgaagatcct 180tctggaaatg ctggaaccaa ctctgtcttc tctcacatcg ttcgcgctcc cgaagatcct 180
attctcggcg taactctctc tctctctctc tctctctctc ttcatccaca cacacacgca 240attctcggcg taactctctc tctctctctc tctctctctc ttcatccaca cacacacgca 240
ctcactcaca taacatatta agtatatgcg tgctcaaatg ttctgtatgt attcatttgt 300ctcactcaca taacatatta agtatatgcg tgctcaaatg ttctgtatgt attcatttgt 300
tccgtatcaa atgttctctt gttataagct gaattttaga ggaattgtag tgctatttgc 360tccgtatcaa atgttctctt gttataagct gaattttaga ggaattgtag tgctatttgc 360
taatcgaaag agcttgatac tcattctctt cctattgaat taaatattcc ttttttctta 420taatcgaaag agcttgatac tcattctctt cctattgaat taaatattcc ttttttctta 420
tggatgatga atttaagact tttttttagt ccgatcacta cgaaatttcg atttcaagtt 480tggatgatga atttaagact tttttttagt ccgatcacta cgaaatttcg atttcaagtt 480
gatagaagtg aaaaatgatg gggttaacat atcaattgag cgaataaaaa gagaaattcg 540gatagaagtg aaaaatgatg gggttaacat atcaattgag cgaataaaaa gagaaattcg 540
tgtgttgata tcttcaaaag tgtatttaaa tgtagagata tattgtgatt tagtttctgt 600600
tattatcttt gtcttttttc tattgaaatt tgaatattat ttgttgaagt cttcgtgaca 660660
tatcttggtg ttatgttttg gttattaggt cactattgct tacaataaag atagtagccc 720tatcttggtg ttatgttttg gttattaggt cactattgct tacaataaag atagtagccc 720
catgaagttg aatttgggag ttggtgcata tcgcacagag gtgatcatcc tttttggatt 780catgaagttg aatttgggag ttggtgcata tcgcacagag gtgatcatcc tttttggatt 780
ttgtatttgc gctattatgg tcaatggagc actattatca gttgctggat aatcatcctt 840ttgtatttgc gctattatgg tcaatggagc actattatca gttgctggat aatcatcctt 840
tttgatattt ccttgattga aatctaaaaa cacgaataaa aagatattta ctgatggatc 900tttgatattt ccttgattga aatctaaaaa cacgaataaa aagatattta ctgatggatc 900
tgtgttttgg tttcttcaga ttgacgcatt tctgttaatt gaaaagaatt gtgattgttt 960tgtgttttgg tttcttcaga ttgacgcatt tctgttaatt gaaaagaatt gtgattgttt 960
tggtgattgt ggtgttattt tagcttcata cagttaatcc gacgccgtag tgtactagtg 1020tggtgattgt ggtgttattt tagcttcata cagttaatcc gacgccgtag tgtactagtg 1020
tttggctgat gtgctgccaa gagataatgt ttaagattat ggtttgccat aattgataaa 1080tttggctgat gtgctgccaa gagataatgt ttaagattat ggtttgccat aattgataaa 1080
atttaatatt aaaagtactt ggctggatgt tctgcgtttg cataacttgt aatgcatatg 1140atttaatatt aaaagtactt ggctggatgt tctgcgtttg cataacttgt aatgcatatg 1140
aaaaagttac ctttgatttt cataattagt gagaaaactc aagtagcttc cgcattcctg 1200aaaaagttac ctttgatttt cataattagt gagaaaactc aagtagcttc cgcattcctg 1200
tcattgcact atcaaacaca ttaaacggtt tccgacatat ctacctagtt tggaacttca 1260tcattgcact atcaaacaca ttaaacggtt tccgacatat ctacctagtt tggaacttca 1260
tgatttctat ttttcacacc ttgtaataaa tgataattct tggatctgtg gtgtctttgt 13201320
tcaaaagatc acagagaaga ttgcatttat tttttgtagt ctagttggct cagagtctgt 1380tcaaaagatc acagagaaga ttgcatttat tttttgtagt ctagttggct cagagtctgt 1380
caaacacaac ttgttacatc gcattttacc tgttagttaa gaaacttggg tcatcaacaa 1440caaacacaac ttgttacatc gcattttacc tgttagttaa gaaacttggg tcatcaacaa 1440
atttgtcatg aggtggttat ttcttggggc tttgtgaatt gctctcagca atctgctagc 1500atttgtcatg aggtggttat ttcttggggc tttgtgaatt gctctcagca atctgctagc 1500
tttcttatgt ggactcaaaa caatgaagct cttgagttga tgtgttgatt tttcaatcag 1560tttcttatgt ggactcaaaa caatgaagct cttgagttga tgtgttgatt tttcaatcag 1560
agtaaaacaa gttctatatt tggctgtgag agtaaagtgg gagctattaa aattcctagc 1620agtaaaacaa gttctatatt tggctgtgag agtaaagtgg gagctattaa aattcctagc 1620
tgaatttatg tttcttaata tcttaaatcc ttaaaggtag agggagagga aggaggttta 16801680
ttgatgaagg gctagtagtt gtgtatactt agttcttttt caaatttcat aagtatctct 1740ttgatgaagg gctagtagtt gtgtatactt agttcttttt caaatttcat aagtatctct 1740
tgatggtttt tctcgctgac tgttgaatat ggggctccac agtttgtgtt gctatattga 1800tgatggtttt tctcgctgac tgttgaatat ggggctccac agtttgtgtt gctatattga 1800
aatgtttcag ctaataaaac taacgtgttt ctttttcttt ctcccttttt tggggttatc 1860aatgtttcag ctaataaaac taacgtgttt ctttttcttt ctcccttttt tggggttatc 1860
aggaaggaaa acctcttgtt ttgaatgttg taagacaagc agagcagcta ctagtaaatg 1920aggaaggaaa acctcttgtt ttgaatgttg taagacaagc agagcagcta ctagtaaatg 1920
acaggtactt gcattgccat ttcatggagt atgaataaaa tgtttcctta attctatgtg 1980acaggtactt gcattgccat ttcatggagt atgaataaaa tgtttcctta attctatgtg 1980
attaaacttc aagatttctg caggtctcgc gttaaagagt acctatctat tacgggactg 2040attaaacttc aagatttctg caggtctcgc gttaaagagt acctatctat tacgggactg 2040
gcagacttca ataaattgag tgctaagctg atacttggcg ccgacaggta taaaagttcc 2100gcagacttca ataaattgag tgctaagctg atacttggcg ccgacaggta taaaagttcc 2100
tgttctctgt atagtgttgc cgataagata tgcagggaga taaagcatgt attttcctgt 21602160
tgcataggat gatatcttca gataataagg ctccattcca agtgtttgat ggcttggtag 2220tgcataggat gatatcttca gataataagg ctccattcca agtgtttgat ggcttggtag 2220
atctttgtga agcatctatt aacatttggt cacatttttt taaaaccaac ttcccatccc 2280atctttgtga agcatctatt aacatttggt cacatttttt taaaaccaac ttcccatccc 2280
atccatgcca ttccacgtgt cagttattca tgaaaatgct gttcacttgc atacatgtta 2340atccatgcca ttccacgtgt cagttattca tgaaaatgct gttcacttgc atacatgtta 2340
ctgccgttgt gttgatttcc tcaactctac tcataatttc tctgtgtggt cgcattctgg 2400ctgccgttgt gttgatttcc tcaactctac tcataatttc tctgtgtggt cgcattctgg 2400
tgatctgatt tatctgataa tatctgtaca tgttttgaaa tttgggtagt gtctctttga 24602460
ttagcgtgta aagcaagcaa ctcttgatgc gtgtgatcaa gtgtattgct gtctagagct 2520ttagcgtgta aagcaagcaa ctcttgatgc gtgtgatcaa gtgtattgct gtctagagct 2520
gacagatgtt aaatttatct tatgcgtttc caagatcttc cagatgttct atgtaatctt 2580gacagatgtt aaatttatct tatgcgtttc caagatcttc cagatgttct atgtaatctt 2580
tttaggccag cttaaacttt gacttgcttc atatacattt atgttaaagg agagttgtta 2640tttaggccag cttaaacttt gacttgcttc atatacattt atgttaaagg agagttgtta 2640
atatacttca atttttcaca tttttaattc ctctttttac ctgtggtcct cacgagctct 2700atatacttca atttttcaca tttttaattc ctctttttac ctgtggtcct cacgagctct 2700
tactttcttt gcttggtaca gccccgctat tcaagagaac agagtaacaa ctgtgcagtg 2760tactttcttt gcttggtaca gccccgctat tcaagagaac agagtaacaa ctgtgcagtg 2760
cttgtctggc acaggctcat tgagggttgg agctgaattt ttggctcgac attatcatca 2820cttgtctggc acaggctcat tgaggggttgg agctgaattt ttggctcgac attatcatca 2820
agtaaactgc tacatcttcc taacctacct ttcattttcc ttcgttttct tagccttcgt 2880agtaaactgc tacatcttcc taacctacct ttcattttcc ttcgttttct tagccttcgt 2880
gggtaaacaa tcttcaaagt tgaattaacc ttgatgtaac cattcctgca gcgcacaatt 2940gggtaaacaa tcttcaaagt tgaattaacc ttgatgtaac cattcctgca gcgcacaatt 2940
tatattcccc aaccaacatg gggaaaccac ccaaaagttt tcactttagc tggattatcg 3000tatattcccc aaccaacatg gggaaaccac ccaaaagttt tcactttagc tggattatcg 3000
gtaaagagtt accgctacta tgatccagca actcgtggac tcaattttca aggtatgaaa 3060gtaaagagtt accgctacta tgatccagca actcgtggac tcaattttca aggtatgaaa 3060
cacttcccta caatataatg atgtaacagg atattgtccc attagatatc tatggctatg 3120cacttcccta caatataatg atgtaacagg atattgtccc
ctgtttacta ttactctctt ccaggatgat ggatgttctt ttagtcttat tctggtattt 31803180 ctgtttacta ttactctctt ccaggatgat ggatgttctt
gattacaaat tatcacaagt ctgaatcaag ttgtggatgg atggtttcac ttgtttgatt 3240gattacaaat tatcacaagt ctgaatcaag ttgtggatgg atggtttcac ttgtttgatt 3240
gcattgtaat ccagcaaact tgtaaagtca tcgtcatcta tgctttttct ttataccttt 33003300
ttctgcgagg aaataagcga agagagatgg agatataact tgataataat ggaatgcaac 3360ttctgcgagg aaataagcga agagagatgg agatataact tgataataat ggaatgcaac 3360
aaacgcctaa tttaacatat tagggaccaa ctaacgtcta catttgacat tagctcttaa 3420aaacgcctaa tttaacatat tagggaccaa ctaacgtcta catttgacat tagctcttaa 3420
cattttgact ttttaatacc ttaccaaaaa taaaaaagat tgacattcta atgtcgcacg 3480cattttgact ttttaatacc ttaccaaaaa taaaaaagat tgacattcta atgtcgcacg 3480
gaaccaaagg tgggaatagc tgataacata gaaaagtaac caaacaagtc ctggaatctt 35403540
gtcaaaaaag aaattcagtt gtcgaaatgt tcttgaaaaa agttactgca accgcaatgg 3600gtcaaaaaag aaattcagtt gtcgaaatgt tcttgaaaaa agttactgca accgcaatgg 3600
tcggaagaat aggaggaaga aattcaataa tgcgggtcaa atagaggagg tgccactaaa 36603660
aggccattgg agaggggccg ggaaacacca tctgaaagag gtacagtggt accagaagga 3720aggccattgg agaggggccg ggaaacacca tctgaaagag gtacagtggt accagaagga 3720
ttatcgaatg ctgatgcata gaaacgagtc agagattgaa acagtcactg gaaagaggtt 37803780
tgatgttgtg acagcagtca caataaagaa aagtggtgca atcagaatga tcactggaaa 3840tgatgttgtg acagcagtca caataaagaa aagtggtgca atcagaatga tcactggaaa 3840
ggctagaatt gtagaactat cataagaaag tgaattgtgg agggaaatct ctgtgaaaag 3900ggctagaatt gtagaactat cataagaaag tgaattgtgg agggaaatct ctgtgaaaag 3900
acaaaatcta tttaggtcca caagatcata gaggctctaa tgccatgtga gaaactgaga 3960acaaaatcta tttaggtcca caagatcata gaggctctaa tgccatgtga gaaactgaga 3960
gagtggacgg aaataaatag attacttgat aaaatacaat ccatacgttt aaatccgaat 4020gagtggacgg aaataaatag attacttgat aaaatacaat ccatacgttt aaatccgaat 4020
gactaacttt aattttaaca caacttttac atctaaaagt atgacacgtg acattctaac 4080gactaacttt aattttaaca caacttttac atctaaaagt atgacacgtg acattctaac 4080
ctttcgtgct tgtgttcaca actttgcata tcgccgactt gtttacaaga actttctttt 4140ctttcgtgct tgtgttcaca actttgcata tcgccgactt gtttacaaga actttctttt 4140
tcgtacatga caggtttgtt ggaagacctt ggatctgctc catcgggagc ggtagtgcta 4200tcgtacatga caggtttgtt ggaagacctt ggatctgctc catcgggagc ggtagtgcta 4200
cttcacgctt gtgcccataa ccccactggt gttgatccaa ccattgatca gtgggagcaa 4260cttcacgctt gtgcccataa ccccactggt gttgatccaa ccattgatca gtgggagcaa 4260
attaggagat tgatgagatc aagaggattg ttgcccttct ttgatagtgc atatcaggta 4320attaggagat tgatgagatc aagaggattg ttgcccttct ttgatagtgc atatcaggta 4320
agagatcatc aacagatgtg cagagcactt tggctgttgg agttgttgct gtgtgagcat 4380agagatcatc aacagatgtg cagagcactt tggctgttgg agttgttgct gtgtgagcat 4380
ttaaaagtga tgtggtttgt tcagtatatg tcaattaacc ttgatattca aactttgata 4440ttaaaagtga tgtggtttgt tcagtatatg tcaattaacc ttgatattca aactttgata 4440
ttctagggct ttgccagtgg aagcctagat acagatgcac agtctgttcg catgtttgtg 4500ttctagggct ttgccagtgg aagcctagat acagatgcac agtctgttcg catgtttgtg 4500
gcagatggag gtgaagtact tgttgctcaa agttatgcaa agaatatggg gctttatggt 4560gcagatggag gtgaagtact tgttgctcaa agttatgcaa agaatatggg gctttatggt 4560
gaacgtgttg gagctctaag cattgtacgt cttaaaggac aatggacaac tgtgccttat 4620gaacgtgttg gagctctaag cattgtacgt cttaaaggac aatggacaac tgtgccttat 4620
ttctgaaaat ttatatctcc agttggtcat ttgttgcatt acctttattt ttctcagatt 4680ttctgaaaat ttatatctcc agttggtcat ttgttgcatt acctttattt ttctcagatt 4680
gattctcatg atgcataaac tgtcttactg ttttcatagt ggccttcttt tgtgatgtta 4740gattctcatg atgcataaac tgtcttactg ttttcatagt ggccttcttt tgtgatgtta 4740
aaatttggta gttatgaact gtttaaagct tatatagctt acttccaaat aaataactgt 4800aaatttggta gttatgaact gtttaaagct tatatagctt acttccaaat aaataactgt 4800
gagccttgga catcacatat aaattatttt atatcacgga ttcgagccgt ggaaacaacc 4860gagccttgga catcacatat aaattatttt atatcacgga ttcgagccgt ggaaacaacc 4860
tcttgcagaa atgtagggta aggttgcgta taatagaccc ttgtcatccg gcccttcccc 4920tcttgcagaa atgtagggta aggttgcgta taatagaccc ttgtcatccg gcccttcccc 4920
ggacccctgc gcatagcggg agcttagtgc aacgggttgc ctttttttca tcctgaggca 4980ggacccctgc gcatagcggg agcttagtgc aacgggttgc ctttttttca tcctgaggca 4980
taaaaagttt gtaatttctc aagaatgaat aaagagcctg ttataacagg caatttgcat 5040taaaaagttt gtaatttctc aagaatgaat aaagagcctg ttataacagg caatttgcat 5040
atcatatggt gttgtttgtc gcacagtgat gacatattta tcacacaaat gaaagaaaaa 5100atcatatggt gttgtttgtc gcacagtgat gacatattta tcacacaaat gaaagaaaaa 5100
tgaaggatat agttctgaac cctcagttaa actctgctga cagttataat tcttcaaatt 5160tgaaggatat agttctgaac cctcagttaa actctgctga cagttataat tcttcaaatt 5160
ttctcaaatc tgtaggtctg caggaatgct gatgtggcga gcagagttga gagccagctg 5220ttctcaaatc tgtaggtctg caggaatgct gatgtggcga gcagagttga gagccagctg 5220
aagttggtga ttaggccaat gtattccaat ccgcccatcc atggtgcgtc aatagttgcc 5280aagttggtga ttaggccaat gtattccaat ccgcccatcc atggtgcgtc aatagttgcc 5280
acaatcctta aagacaggta atatatcaac catcaggaaa ttgcttcttg ggaccctaaa 5340acaatcctta aagacaggta atatatcaac catcaggaaa ttgcttcttg ggaccctaaa 5340
aagccatttc ctttctttct atatgataga atccagtgta tgttcaaaaa ttatgtttag 5400aagccatttc ctttctttct atatgataga atccagtgta tgttcaaaaa ttatgtttag 5400
tcattgttct gcaaaataaa tcactaattt tctgcagaaa catgtaccgt gaatggaccc 5460tcattgttct gcaaaataaa tcactaattt tctgcagaaa catgtaccgt gaatggaccc 5460
ttgagctgaa agcaatggct gatagaatca tcagaatgcg tcagcaatta tttgatgctt 5520ttgagctgaa agcaatggct gatagaatca tcagaatgcg tcagcaatta tttgatgctt 5520
tacgtgctag aggtaaattt gctgcattat tttcacgtat gtgtgctctt attacatgtt 5580tacgtgctag aggtaaattt gctgcattat tttcacgtat gtgtgctctt attacatgtt 5580
tcttgttgca tcgacttcgg atatttttct catttttgat aatttcggtt caagtgtcat 5640tcttgttgca tcgacttcgg atatttttct catttttgat aatttcggtt caagtgtcat 5640
tataaatgct acatgttcgt ggcatatact tctacccata aaatatgctg caacttgttc 5700tataaatgct acatgttcgt ggcatatact tctacccata aaatatgctg caacttgttc 5700
cagctcattt gtctagataa tttatcaaaa ggaccaatct tcaccagctg actctcctga 5760cagctcattt gtctagataa tttatcaaaa ggaccaatct tcaccagctg actctcctga 5760
atgaaagctt aatttaggaa aaagattaag caaacaaaac atggaattcg acaaattcaa 5820atgaaagctt aatttaggaa aaagattaag caaacaaaac atggaattcg acaaattcaa 5820
acatttctcc aaatcttaat agatctcgat cctccttagt gctttcatca acttcttagg 5880acatttctcc aaatcttaat agatctcgat cctccttagt gctttcatca acttcttagg 5880
taattcacct cttaactttg gctctgactg ggttctctac ctttggaaaa ccatccccaa 5940taattcacct cttaactttg gctctgactg ggttctctac ctttggaaaa ccatccccaa 5940
agatgtccct tgcacgatcc ttttggggac atgaactgtt ggatcaggca agaaactatc 6000agatgtccct tgcacgatcc ttttggggac atgaactgtt ggatcaggca agaaactatc 6000
ccccaataaa gaaaaattgt tggatcagat tttttcctga taggttgcat tctttcagca 6060ccccaataaa gaaaaattgt tggatcagat ttttttcctga taggttgcat tctttcagca 6060
ttccccttaa agtttgtgat ttggacgttg tcctcatttt ggtataaaaa atgtcattgg 6120ttccccttaa agtttgtgat ttggacgttg tcctcatttt ggtataaaaa atgtcattgg 6120
aaactttcca ttttggcaca tcaggtgtta gaatcatcat gtcttcataa attggctata 6180aaactttcca ttttggcaca tcaggtgtta gaatcatcat gtcttcataa attggctata 6180
gacaaagtct catgtcgtca gctcctttct tcagtatcag gcattcttta atcaatgtaa 6240gacaaagtct catgtcgtca gctcctttct tcagtatcag gcattcttta atcaatgtaa 6240
gtgtcgagca ttgcatgagt aggatactta tttctattta catgaattga tgggcaagtc 6300gtgtcgagca ttgcatgagt aggatactta tttctattta catgaattga tgggcaagtc 6300
gggcattttt tagtcgactt aaaggtcaag cattgcatgt ataagatatc tatttctgtt 63606360
gaattcaatt gattggcagg tacacctggt gactggagtc acattatcaa gcagattgga 6420gaattcaatt gattggcagg tacacctggt gactggagtc acattatcaa gcagattgga 6420
atgtttactt tcacgggact taactcagag caagttgcct tcatgaccaa agagtaccac 64806480
atctacatga catcagatgg gtaatatgtc atttctcagc aaaaagtact gtatatcata 6540atctacatga catcagatgg gtaatatgtc atttctcagc aaaaagtact gtatatcata 6540
tcagactacc atgtctcctc cacatctgat atgtgatttt attacctcgt aagaatttct 6600tcagactacc atgtctcctc cacatctgat atgtgatttt attacctcgt aagaatttct 6600
accctcggat ggtaaaacag aaagagggaa gggagttaaa atcttttcag ccatcagtta 6660accctcggat ggtaaaacag aaagagggaa gggagttaaa atcttttcag ccatcagtta 6660
gttcttttct tgcagtattc ttgctacctt agctttgatg aacgctaaga gaaatgtggc 6720gttcttttct tgcagtattc ttgctacctt agctttgatg aacgctaaga gaaatgtggc 6720
tgtattaatg aacatttcta gagcatggtt ctttctaagt ttgtatttaa ttgtggcaac 67806780
ttcaattaag cttgggatat cagataatcc caaagccttt gacatacatc acatatttca 68406840
ttttgcagac gcatcagtat ggcaggtctg agctccagga cagttccaca tctagcagat 6900ttttgcagac gcatcagtat ggcaggtctg agctccagga cagttccaca tctagcagat 6900
gccatacatg ctgctgtcgc tcgggctcgt tga 6933gccatacatg ctgctgtcgc tcgggctcgt tga 6933
<210> 2<210> 2
<211> 450<211> 450
<212> БЕЛОК<212> PROTEIN
<213> Nicotiana tabacum<213> Nicotiana tabacum
<400> 2<400> 2
Met Asn Met Ser Gln Gln Ser Pro Ser Pro Ser Ala Asp Arg Arg Leu Met Asn Met Ser Gln Gln Ser Pro Ser Pro Ser Ala Asp Arg Arg Leu
1 5 10 15 1 5 10 15
Ser Val Leu Ala Arg His Leu Glu Leu Ser Ser Ser Ala Thr Val Glu Ser Val Leu Ala Arg His Leu Glu Leu Ser Ser Ser Ala Thr Val Glu
20 25 30 20 25 30
Ser Ser Ile Val Ala Ala Pro Thr Ser Gly Asn Ala Gly Thr Asn Ser Ser Ser Ile Val Ala Ala Pro Thr Ser Gly Asn Ala Gly Thr Asn Ser
35 40 45 35 40 45
Val Phe Ser His Ile Val Arg Ala Pro Glu Asp Pro Ile Leu Gly Val Val Phe Ser His Ile Val Arg Ala Pro Glu Asp Pro Ile Leu Gly Val
50 55 60 50 55 60
Thr Ile Ala Tyr Asn Lys Asp Ser Ser Pro Met Lys Leu Asn Leu Gly Thr Ile Ala Tyr Asn Lys Asp Ser Ser Pro Met Lys Leu Asn Leu Gly
65 70 75 80 65 70 75 80
Val Gly Ala Tyr Arg Thr Glu Glu Gly Lys Pro Leu Val Leu Asn Val Val Gly Ala Tyr Arg Thr Glu Glu Gly Lys Pro Leu Val Leu Asn Val
85 90 95 85 90 95
Val Arg Gln Ala Glu Gln Leu Leu Val Asn Asp Arg Ser Arg Val Lys Val Arg Gln Ala Glu Gln Leu Leu Val Asn Asp Arg Ser Arg Val Lys
100 105 110 100 105 110
Glu Tyr Leu Ser Ile Thr Gly Leu Ala Asp Phe Asn Lys Leu Ser Ala Glu Tyr Leu Ser Ile Thr Gly Leu Ala Asp Phe Asn Lys Leu Ser Ala
115 120 125 115 120 125
Lys Leu Ile Leu Gly Ala Asp Ser Pro Ala Ile Gln Glu Asn Arg Val Lys Leu Ile Leu Gly Ala Asp Ser Pro Ala Ile Gln Glu Asn Arg Val
130 135 140 130 135 140
Thr Thr Val Gln Cys Leu Ser Gly Thr Gly Ser Leu Arg Val Gly Ala Thr Thr Val Gln Cys Leu Ser Gly Thr Gly Ser Leu Arg Val Gly Ala
145 150 155 160 145 150 155 160
Glu Phe Leu Ala Arg His Tyr His Gln Arg Thr Ile Tyr Ile Pro Gln Glu Phe Leu Ala Arg His Tyr His Gln Arg Thr Ile Tyr Ile Pro Gln
165 170 175 165 170 175
Pro Thr Trp Gly Asn His Pro Lys Val Phe Thr Leu Ala Gly Leu Ser Pro Thr Trp Gly Asn His Pro Lys Val Phe Thr Leu Ala Gly Leu Ser
180 185 190 180 185 190
Val Lys Ser Tyr Arg Tyr Tyr Asp Pro Ala Thr Arg Gly Leu Asn Phe Val Lys Ser Tyr Arg Tyr Tyr Asp Pro Ala Thr Arg Gly Leu Asn Phe
195 200 205 195 200 205
Gln Gly Leu Leu Glu Asp Leu Gly Ser Ala Pro Ser Gly Ala Val Val Gln Gly Leu Leu Glu Asp Leu Gly Ser Ala Pro Ser Gly Ala Val Val
210 215 220 210 215 220
Leu Leu His Ala Cys Ala His Asn Pro Thr Gly Val Asp Pro Thr Ile Leu Leu His Ala Cys Ala His Asn Pro Thr Gly Val Asp Pro Thr Ile
225 230 235 240 225 230 235 240
Asp Gln Trp Glu Gln Ile Arg Arg Leu Met Arg Ser Arg Gly Leu Leu Asp Gln Trp Glu Gln Ile Arg Arg Leu Met Arg Ser Arg Gly Leu Leu
245 250 255 245 250 255
Pro Phe Phe Asp Ser Ala Tyr Gln Gly Phe Ala Ser Gly Ser Leu Asp Pro Phe Phe Asp Ser Ala Tyr Gln Gly Phe Ala Ser Gly Ser Leu Asp
260 265 270 260 265 270
Thr Asp Ala Gln Ser Val Arg Met Phe Val Ala Asp Gly Gly Glu Val Thr Asp Ala Gln Ser Val Arg Met Phe Val Ala Asp Gly Gly Glu Val
275 280 285 275 280 285
Leu Val Ala Gln Ser Tyr Ala Lys Asn Met Gly Leu Tyr Gly Glu Arg Leu Val Ala Gln Ser Tyr Ala Lys Asn Met Gly Leu Tyr Gly Glu Arg
290 295 300 290 295 300
Val Gly Ala Leu Ser Ile Val Cys Arg Asn Ala Asp Val Ala Ser Arg Val Gly Ala Leu Ser Ile Val Cys Arg Asn Ala Asp Val Ala Ser Arg
305 310 315 320 305 310 315 320
Val Glu Ser Gln Leu Lys Leu Val Ile Arg Pro Met Tyr Ser Asn Pro Val Glu Ser Gln Leu Lys Leu Val Ile Arg Pro Met Tyr Ser Asn Pro
325 330 335 325 330 335
Pro Ile His Gly Ala Ser Ile Val Ala Thr Ile Leu Lys Asp Arg Asn Pro Ile His Gly Ala Ser Ile Val Ala Thr Ile Leu Lys Asp Arg Asn
340 345 350 340 345 350
Met Tyr Arg Glu Trp Thr Leu Glu Leu Lys Ala Met Ala Asp Arg Ile Met Tyr Arg Glu Trp Thr Leu Glu Leu Lys Ala Met Ala Asp Arg Ile
355 360 365 355 360 365
Ile Arg Met Arg Gln Gln Leu Phe Asp Ala Leu Arg Ala Arg Gly Thr Ile Arg Met Arg Gln Gln Leu Phe Asp Ala Leu Arg Ala Arg Gly Thr
370 375 380 370 375 380
Pro Gly Asp Trp Ser His Ile Ile Lys Gln Ile Gly Met Phe Thr Phe Pro Gly Asp Trp Ser His Ile Ile Lys Gln Ile Gly Met Phe Thr Phe
385 390 395 400 385 390 395 400
Thr Gly Leu Asn Ser Glu Gln Val Ala Phe Met Thr Lys Glu Tyr His Thr Gly Leu Asn Ser Glu Gln Val Ala Phe Met Thr Lys Glu Tyr His
405 410 415 405 410 415
Ile Tyr Met Thr Ser Asp Gly Arg Ile Ser Met Ala Gly Leu Ser Ser Ile Tyr Met Thr Ser Asp Gly Arg Ile Ser Met Ala Gly Leu Ser Ser
420 425 430 420 425 430
Arg Thr Val Pro His Leu Ala Asp Ala Ile His Ala Ala Val Ala Arg Arg Thr Val Pro His Leu Ala Asp Ala Ile His Ala Ala Val Ala Arg
435 440 445 435 440 445
Ala Arg Ala Arg
450 450
<210> 3<210> 3
<211> 6935<211> 6935
<212> ДНК<212> DNA
<213> Nicotiana tabacum<213> Nicotiana tabacum
<400> 3<400> 3
atgaacatgt cacaacaatc accgtccgct gaccggaggt tgagtgtttt ggcgaggcac 60atgaacatgt cacaacaatc accgtccgct gaccggaggt tgagtgtttt ggcgaggcac 60
cttgaaccgt cgtcctccgc caccgtcgaa acctccatcg tcgctgctcc tacctctgga 120cttgaaccgt cgtcctccgc caccgtcgaa acctccatcg tcgctgctcc tacctctgga 120
aatgctggaa ccaactctgt cttctctcac atcgttcgtg ctcccgaaga tcctattctc 180aatgctggaa ccaactctgt cttctctcac atcgttcgtg ctcccgaaga tcctattctc 180
ggggtaactt tctctctctc tctctctctc tctcttcatc cacacgcact cactcacata 240ggggtaactt tctctctctc tctctctctc tctcttcatc cacacgcact cactcacata 240
acatatgtat aagtatttaa gtatatgcgt gctcaaatgt tctgtatata ttcatttgtt 300acatatgtat aagtatttaa gtatatgcgt gctcaaatgt tctgtatata ttcatttgtt 300
ccgtatcaaa tgttctcttg ttataagctg aattttagag gaattgtagt gttatttgct 360ccgtatcaaa tgttctcttg ttataagctg aattttagag gaattgtagt gttatttgct 360
aatcgcaaga gcttgcatac tcattctctt cgtattgaat taaatattcc ttttttctta 420aatcgcaaga gcttgcatac tcattctctt cgtattgaat taaatattcc ttttttctta 420
tggatgacga atttaagcag ttttttgagt ccgatcacta cgaaatttcg atttcaagtt 480tggatgacga atttaagcag ttttttgagt ccgatcacta cgaaatttcg atttcaagtt 480
gatagaagtg aaaaatgatg gtgtttacat attaattgag cgaataaaaa gagaaattcg 540gatagaagtg aaaaatgatg gtgtttacat attaattgag cgaataaaaa gagaaattcg 540
agtgttgata tcttcaaaaa tgttgttaaa tgtagagata tactgtgatt tagtttctgt 600agtgttgata tcttcaaaaa tgttgttaaa tgtagagata tactgtgatt tagtttctgt 600
tataatcttt gccttttttc ttttgaaatt tgaatattgt ttgttgaagt cttcgtgaca 660tataatcttt gccttttttc ttttgaaatt tgaatattgt ttgttgaagt cttcgtgaca 660
tattggtgtt atgttttggt tattaggtta ctattgcata caataaagat agcagcccca 720tattggtgtt atgttttggt tattaggtta ctattgcata caataaagat agcagcccca 720
tgaagttgaa tttgggagtt ggtgcatatc gcacagaggt gatcatcctt tttggctttt 780tgaagttgaa tttgggagtt ggtgcatatc gcacagaggt gatcatcctt tttggctttt 780
gtatttgcgc tattatcgtc gatggagcac tattatcagt agctggataa tcatcctttt 840gtatttgcgc tattatcgtc gatggagcac tattatcagt agctggataa tcatcctttt 840
tgatatttcc ttgattgaaa tccaaaaaca cgaataaaaa gaaatttact gatggatctg 900tgatatttcc ttgattgaaa tccaaaaaca cgaataaaaa gaaatttact gatggatctg 900
tgttttggtt tcttcagatt tacgcatttc tgttaattga aaaaatatta tgattgtctt 960tgttttggtt tcttcagatt tacgcatttc tgttaattga aaaaatatta tgattgtctt 960
ggtgattgtg gtgttgtttt ggcttcatat agttaatccg acgccgtagt gtactaatgt 1020ggtgattgtg gtgttgtttt ggcttcatat agttaatccg acgccgtagt gtactaatgt 1020
ttggctgatg tgctgccaag agaaatgttt aagattatgg tctgccataa ctgataaaat 1080ttggctgatg tgctgccaag agaaatgttt aagattatgg tctgccataa ctgataaaat 1080
ttaatattaa aagtacttgg ctggatgttc tgcgtttgca taacttgtaa cgcatatgaa 1140ttaatattaa aagtacttgg ctggatgttc tgcgtttgca taacttgtaa cgcatatgaa 1140
aaaattacct ttgattttca taattagtga gaaaattaag tagcttccgc attcctgtca 1200aaaattacct ttgattttca taattagtga gaaaattaag tagcttccgc attcctgtca 1200
ttgcactatc aaacacatac ggtttatgat atatctacct agtttggaac tttgtgattt 1260ttgcactatc aaacacatac ggtttatgat atatctacct agtttggaac tttgtgattt 1260
ctatttttca caccttgtaa taaatgataa ttcttggatc tgtggtgtct ttgttcaaaa 1320ctatttttca caccttgtaa taaatgataa ttcttggatc tgtggtgtct ttgttcaaaa 1320
gatcacagag aagattgcac ttatgttttg tagtctagtt ggctcagact ctgtcaaaca 1380gatcacagag aagattgcac ttatgttttg tagtctagtt ggctcagact ctgtcaaaca 1380
caacttgtta catcgcattt tacctgttag ttaagaaact tgggtcatca acaaatttgt 1440catcgcattt tacctgttag ttaagaaact tgggtcatca acaaatttgt 1440
catgaggtgg ttatttcttg gggttttgtg aattgctctc agcaatctgc tagctttctt 1500catgaggtgg ttatttcttg gggttttgtg aattgctctc agcaatctgc tagctttctt 1500
atgtggactc aaaacaatga atctcttgag ttgatgtgtt gatttttcaa tcgagtaaaa 15601560
caagttctat atttggctgt gagagtaaag tgggagctat taaaattcct agctgaattt 1620caagttctat atttggctgt gagagtaaag tgggagctat taaaattcct agctgaattt 1620
atgtttctta atatcttaaa tccttaaagg tagagggaga ggaaggaggc ttattgatga 1680atgtttctta atatcttaaa tccttaaagg tagagggaga ggaaggaggc ttattgatga 1680
aggactagta gttgtgtata cttagttctt tctcaaattt cataagaatc tcttgagggt 1740aggactagta gttgtgtata cttagttctt tctcaaattt cataagaatc tcttgagggt 1740
ttttctcgct gactgttgaa tatggggctc cacagtttgt gttgctatat tgaaatgttt 1800ttttctcgct gactgttgaa tatggggctc cacagtttgt gttgctatat tgaaatgttt 1800
cagctaataa tactaacgtg tttctttttc tttctccctt ttgtggggtt atcaggaagg 1860cagctaataa tactaacgtg tttctttttc tttctccctt ttgtggggtt atcaggaagg 1860
aaaaccgctt gttttgaatg ttgtaagaca agcagagcag ctactagtaa atgacaggta 1920aaaaccgctt gttttgaatg ttgtaagaca agcagagcag ctactagtaa atgacaggta 1920
cttgtgttgc catttcatgg agtatgaata aaatgtttcc ttaattctat gtgattaaac 1980cttgtgttgc catttcatgg agtatgaata aaatgtttcc ttaattctat gtgattaaac 1980
ttcaagattt ctgcaggtct cgcgttaaag agtacctatc tattactgga ctggcagact 2040ttcaagattt ctgcaggtct cgcgttaaag agtacctatc tattactgga ctggcagact 2040
tcaataaatt gagtgctaag ctgatacttg gtgccgacag gtatacaagt tcctgttctc 2100tcaataaatt gagtgctaag ctgatacttg gtgccgacag gtatacaagt tcctgttctc 2100
tgtatagtgt tgctgataag atatgcaggg agataaagca tgtattttcc tgttgcatag 2160tgtatagtgt tgctgataag atatgcaggg agataaagca tgtattttcc tgttgcatag 2160
gatgatatct tccgataata aggctccgtt ccaagtgttt gatggcttgg tagatctttg 2220gatgatatct tccgataata aggctccgtt ccaagtgttt gatggcttgg tagatctttg 2220
tgaagcatct attaacattt gctcacgttt ttttaaaacc aacttcccat cccatccatg 2280tgaagcatct attaacattt gctcacgttt ttttaaaacc aacttcccat cccatccatg 2280
ccattccacg tgtcagttat tcatgaaaat gctgttcact tgcatacatg ttactgccgt 2340ccattccacg tgtcagttat tcatgaaaat gctgttcact tgcatacatg ttactgccgt 2340
agtgttggtt tctctcaact ctactcataa tttctgtgtg gtcgcattct ggtgatctga 2400agtgttggtt tctctcaact ctactcataa tttctgtgtg gtcgcattct ggtgatctga 2400
tttatgtgat aatatctgta catgttgttt tgaaatttgg gtagtgtctc tttgattagc 2460tttatgtgat aatatctgta catgttgttt tgaaatttgg gtagtgtctc tttgattagc 2460
gtgtaaagca ggcaactctt gatgcatgtg gtgaagtgta tgattgctgt ctagagctgt 2520gtgtaaagca ggcaactctt gatgcatgtg gtgaagtgta tgattgctgt ctagagctgt 2520
cagatgttaa atttatctta tgcgtttgca agatcttcca gatgttctat gtaatctttt 25802580
taggccagct taaactttga cttgcttcat atacatttat gttaaaggag agttgttaat 2640taggccagct taaactttga cttgcttcat atacatttat gttaaaggag agttgttaat 2640
atacttcaat tttcacattt ttaattcctc ttttacctgt ggtccttacg agctcttact 2700atacttcaat tttcacattt ttaattcctc ttttacctgt ggtccttacg agctcttact 2700
ttctttgctt ggtacagccc tgctattcaa gagaacagag taacaactgt gcagtgcttg 2760ttctttgctt ggtacagccc tgctattcaa gagaacagag taacaactgt gcagtgcttg 2760
tctggcacag gctcattgag ggttggagct gaatttttgg ctcgacatta tcatcaagta 2820tctggcacag gctcattgag ggttggagct gaatttttgg ctcgacatta tcatcaagta 2820
aactgctacg tcttcttaac ctacctttca ctctccttcg ttttcttagc cttcgtgggt 2880aactgctacg tcttcttaac ctacctttca ctctccttcg ttttcttagc cttcgtggggt 2880
aaacaatctt caaagttgaa ttgaccttga tgtaaccatt cctgcagcgc actatttata 2940aaacaatctt caaagttgaa ttgaccttga tgtaaccatt cctgcagcgc actatttata 2940
ttccccaacc aacatgggga aaccacccaa aagttttcac tttagctggg ttatcagtaa 3000ttccccaacc aacatgggga aaccacccaa aagttttcac tttagctggg ttatcagtaa 3000
agagttaccg ctactatgat ccagcaactc gtggactcaa ttttcaaggt atgaaacact 3060agagttaccg ctactatgat ccagcaactc gtggactcaa ttttcaaggt atgaaacact 3060
tcccttcaat ataatgatgt aacgggatat tgtcccatta gatatctatg gccatgctgt 3120tcccttcaat ataatgatgt aacgggatat tgtcccatta gatatctatg gccatgctgt 3120
ttcctattac tctcttccag gatgatggat gttcttttag tcttattctg gtatttgatt 3180ttcctattac tctcttccag gatgatggat gttcttttag tcttattctg gtatttgatt 3180
acaaattatc acaagtctga atcaagttgt ggatagatgg tttcacttga ttgattgcat 3240acaaattatc acaagtctga atcaagttgt ggatagatgg tttcacttga ttgattgcat 3240
tgtaatccag caaacttgta aatccgtcat catctatgct ttttctttat accttttttc 3300tgtaatccag caaacttgta aatccgtcat catctatgct ttttctttat accttttttc 3300
tgcgaggaaa taagagcaga gagatggaga tataacttga taataatgga atgcaacaaa 33603360
cgcctaattt aacatattag ggaccaacta acatcagcat ttgacattag ctcttaacat 3420cgcctaattt aacatattag ggaccaacta acatcagcat ttgacattag ctcttaacat 3420
tttgactttt taacacctta tcaaaaaaaa gaaggaaaaa gattgacatt ctaatgtcgc 3480tttgactttt taacacctta tcaaaaaaaa gaaggaaaaa gattgacatt ctaatgtcgc 3480
acggaaccaa aggtgggaat agctgataac atagaaaagt aaccaaacaa gtcctggaat 3540acggaaccaa aggtgggaat agctgataac atagaaaagt aaccaaacaa gtcctggaat 3540
cttgtcaaaa aaaaattcag ttgccaaaat gttcttggaa aaaattactg caaccacaat 3600cttgtcaaaa aaaaattcag ttgccaaaat gttcttggaa aaaattactg caaccacaat 3600
ggtcggaaga ataggaggaa gaaattcaat aatgcgggtc aaatagagga ggtgccacta 3660ggtcggaaga ataggaggaa gaaattcaat aatgcgggtc aaatagaggga ggtgccacta 3660
aaaggccatt ggagaggggc cgggaaacac catctgaaag aggcacagtg gtaccagaag 3720aaaggccatt ggagaggggc cgggaaacac catctgaaag aggcacagtg gtaccagaag 3720
gattatcgaa tgctgatgca tagaaacgag tcagagattg aaacagtcac tggaaagaag 3780gattatcgaa tgctgatgca tagaaacgag tcagagattg aaacagtcac tggaaagaag 3780
gcttgatgtt gtgacagcag tcagtcagaa taaagagaag tggtgccatc agaatggtca 38403840
ctggaaaggc tcgaattgta gaactatcat aagaaagtga attgtggctg ggagactctt 3900ctggaaaggc tcgaattgta gaactatcat aagaaagtga attgtggctg ggagactctt 3900
tgaaagacaa aatctattta ggtctccaca agatcatgga tgctctaatg ctatgtgaga 3960tgaaagacaa aatctattta ggtctccaca agatcatgga tgctctaatg ctatgtgaga 3960
aactaagaga gtggacgaaa ataaatggat tacttgataa aatacaatcc atacgtttaa 4020aactaagaga gtggacgaaa ataaatggat tacttgataa aatacaatcc atacgtttaa 4020
atccgaatga ctaactttaa ttttaacaca acttttacat ctaaaagtat gacacgtgac 4080atccgaatga ctaactttaa ttttaacaca acttttacat ctaaaagtat gacacgtgac 4080
acttaacctt tcatgcttgt gttcacaact tcgcatgtcg ccgacttgtt tacaagaact 4140acttaacctt tcatgcttgt gttcacaact tcgcatgtcg ccgacttgtt tacaagaact 4140
ttatttttca tacatgacag gtttgttgga agaccttgga tctgctccat cgggagcgat 4200ttatttttca tacatgacag gtttgttgga agaccttgga tctgctccat cgggagcgat 4200
agtgctactt catgcttgtg cccataaccc cactggtgtt gatccaacca ttgatcagtg 4260agtgctactt catgcttgtg cccataaccc cactggtgtt gatccaacca ttgatcagtg 4260
ggagcaaatt aggagattga tgagatcaag aggattgttg cccttctttg atagtgcata 4320ggagcaaatt aggagattga tgagatcaag aggattgttg cccttctttg atagtgcata 4320
tcaggtaaga aatcatcaac agatgttcag agcactttgg ctgttggagt tgttgctgta 4380tcaggtaaga aatcatcaac agatgttcag agcactttgg ctgttggagt tgttgctgta 4380
tgagcattta aaagtgaggc ggtttattca gtatatgtca attaaccttg atattcaaac 4440tgagcattta aaagtgaggc ggtttattca gtatatgtca attaaccttg atattcaaac 4440
tttgatattc tagggctttg ccagtggaag cctagataca gatgcacagt ctgttcgcat 4500tttgatattc tagggctttg ccagtggaag cctagataca gatgcacagt ctgttcgcat 4500
gtttgtcgca gatggaggtg aagtacttgt tgctcaaagt tatgcaaaga atatggggct 4560gtttgtcgca gatggaggtg aagtacttgt tgctcaaagt tatgcaaaga atatggggct 4560
ttatggtgaa cgtgtcggag ctctaagcat cgtatgtctc aaaggacaaa ggacaactgt 4620ttatggtgaa cgtgtcggag ctctaagcat cgtatgtctc aaaggacaaa ggacaactgt 4620
gccttgtttc tgaaaattta tatctccagt tgttcatttg ttgcattacc tttatttttc 46804680
tcagattgat tctcatgatg catgaactgt cttactgttt tcatagtgtt cttttgtgat 4740tcagattgat tctcatgatg catgaactgt cttactgttt tcatagtgtt cttttgtgat 4740
cttaaaattt ggtagttatg aactgttaaa gcttatatag cttacttcca aatatataac 4800cttaaaattt ggtagttatg aactgttaaa gcttatatag cttacttcca aatatataac 4800
tgtgagcctt ggacatcaca tataaattat tttatatcac ggggtcgaga tgtggaaaca 4860tgtgagcctt ggacatcaca tataaattat tttatatcac ggggtcgaga tgtggaaaca 4860
acctcttgca gaaatgtagg gtaaggttgc gtacaataga cccttgtggt ccggcccttc 4920acctcttgca gaaatgtagg gtaaggttgc gtacaataga cccttgtggt ccggcccttc 4920
ctcggacccc tgcacatagc gggagcttag tgcactgggt tgcccttgtt ttcatcctga 4980ctcggacccc tgcacatagc gggagcttag tgcactgggt tgcccttgtt ttcatcctga 4980
ggcataaaaa gtttttaatt tctcaagaat gaataaagag cctgttataa caggcacttt 5040ggcataaaaa gtttttaatt tctcaagaat gaataaagag cctgttataa caggcacttt 5040
gcatgtcata tggtgttgtt tgtcacacag ttatgcatat agtgtagttt atcacacaaa 5100gcatgtcata tggtgttgtt tgtcacacag ttatgcatat agtgtagttt atcacacaaa 5100
tgaaaaaaat tgaaggatat agttctgaac cctcagttaa actctgctga cagatataat 5160tgaaaaaaat tgaaggatat agttctgaac cctcagttaa actctgctga cagatataat 5160
tcttcaaaat tttctcgaat ctgtaggtct gcagaaatgc tgatgtggcg agcagagttg 5220tcttcaaaat tttctcgaat ctgtaggtct gcagaaatgc tgatgtggcg agcagagttg 5220
agagccagct gaagttggtg attaggccaa tgtattccaa tccgcccatc catggtgcgt 5280agagccagct gaagttggtg attaggccaa tgtattccaa tccgcccatc catggtgcgt 5280
caatagttgc cacaatcctt aaagacaggt aatatatcaa ccatcaggaa attgcttctt 5340caatagttgc cacaatcctt aaagacaggt aatatatcaa ccatcaggaa attgcttctt 5340
gggaccccaa aaaagccatt tcctttcttt ctatatgata gaatccagtg tatgatcaaa 5400gggaccccaa aaaagccatt tccttttcttt ctatatgata gaatccagtg tatgatcaaa 5400
aattatgttt agtcattgtt ctgcaaaata aatcactaaa tttctgcaga aacatgtacc 5460aattatgttt agtcattgtt ctgcaaaata aatcactaaa tttctgcaga aacatgtacc 5460
atgaatggac ccttgagctg aaagcaatgg ctgatagaat catcagaatg cgtcagcaat 5520atgaatggac ccttgagctg aaagcaatgg ctgatagaat catcagaatg cgtcagcaat 5520
tatttgatgc tttacgtgct agaggtaaat ttgctgcatt attttcacgt atgcgtgctc 5580tatttgatgc tttacgtgct agaggtaaat ttgctgcatt attttcacgt atgcgtgctc 5580
ttattacatg tttcttgctg catcgacttc ggatattttt ctcatttttg ataatttcgg 5640ttattacatg tttcttgctg catcgacttc ggatattttt ctcatttttg ataatttcgg 5640
ttcaagtgtc attataaatg ctacatgttc gtggcgtata cttctacata taaaatatgc 5700ttcaagtgtc attataaatg ctacatgttc gtggcgtata cttctacata taaaatatgc 5700
tgcaactcgt tccagctcat ttgtctagat aattgatgaa aaggaccaat cttcacagct 5760tgcaactcgt tccagctcat ttgtctagat aattgatgaa aaggaccaat cttcacagct 5760
gactctcctg aatgaaagct taacgaagga aaaagattaa gcaaacaaaa catggaattc 5820gactctcctg aatgaaagct taacgaagga aaaagattaa gcaaacaaaa catggaattc 5820
gacaaattca aacatttctc caaatcttaa tacatctcga tccttcttag tgctttcatc 5880gacaaattca aacatttctc caaatcttaa tacatctcga tccttcttag tgctttcatc 5880
aacttcttag gtaattcacc tcttaacttt ggctctgact ggattctcta cctttggaaa 5940aacttcttag gtaattcacc tcttaacttt ggctctgact ggattctcta cctttggaaa 5940
accatcccca aagatgtccc ttgcacgatc cttttgggga catgaactgt tggatcaggc 6000accatcccca aagatgtccc ttgcacgatc cttttgggga catgaactgt tggatcaggc 6000
aagaaactat cccccaataa agaaaaattg ttggatcaga ttttttcctg ataggttgca 6060aagaaactat cccccaataa agaaaaattg ttggatcaga ttttttcctg ataggttgca 6060
ttctttcagc attcccctta aagtttgtga tttggacgtt gtcctcattg tgttacaaaa 61206120
aaatgtcatt ggaaacttcc attttggcac atcaggtgtt agaatcatca tgtcttcata 6180aaatgtcatt ggaaacttcc attttggcac atcaggtgtt agaatcatca tgtcttcata 6180
aattggcaat agacaaagtc tcatgtcgtc aactcctttc ttcagtgtca ggcattcttt 6240aattggcaat agacaaagtc tcatgtcgtc aactcctttc ttcagtgtca ggcattcttt 6240
aatcaatgca agtgtcgagc attgcatgaa taggatacct attactattt acatgaattg 6300aatcaatgca agtgtcgagc attgcatgaa taggatacct attactattt acatgaattg 6300
atgggcaagt cgggcatttt ttagtcggct taaaggtcaa gcattgcatg aacaagatat 6360atgggcaagt cgggcatttt ttagtcggct taaaggtcaa gcattgcatg aacaagatat 6360
ctatttctat tgacttcaat tgattggcag gtacacctgg tgactggagt cacattatca 6420ctatttctat tgacttcaat tgattggcag gtacacctgg tgactggagt cacattatca 6420
agcagattgg aatgtttact ttcacgggac ttaactcaga gcaagttgcc ttcatgacca 6480agcagattgg aatgtttact ttcacgggac ttaactcaga gcaagttgcc ttcatgacca 6480
aagagtacca catctacatg acatcagatg ggtaatgtgt catttcttag cacaaagttc 6540aagagtacca catctacatg acatcagatg ggtaatgtgt catttcttag cacaaagttc 6540
tgtatatgtc atatcagact accatgtccc ccctacatct gatatgtgat tttattacct 6600tgtatatgtc atatcagact accatgtccc ccctacatct gatatgtgat tttattacct 6600
cgtaagctcg gatggtaaaa cagaaagagg gaagggattt aaaatcttat cagccgtcag 66606660
tttgttcttt tcttgtagta ttcttgctac cttagctttg atgttcgcta agagaaatgt 6720tttgttcttt tcttgtagta ttcttgctac cttagctttg atgttcgcta agagaaatgt 6720
ggcggtacta atgaacattt ctagagcatg gttctttcta agtttgtatt taattgtggc 6780ggcggtacta atgaacattt ctagagcatg gttctttcta agtttgtatt taattgtggc 6780
aacttcaatt aagcttagga tatcagataa tccaaagcct ttgacataca tcacatattt 6840aacttcaatt 6840
cattttgcag acgcatcagt atggcaggtc tgagctccag gacagttcca catctagcag 6900cattttgcag acgcatcagt atggcaggtc tgagctccag gacagttcca catctagcag 6900
atgccataca tgctgctgtt gctcgagctc gttga 6935atgccataca tgctgctgtt gctcgagctc gttga 6935
<210> 4<210> 4
<211> 448<211> 448
<212> БЕЛОКБЕЛОК<212> PROTEIN
<213> Nicotiana tabacum<213> Nicotiana tabacum
<400> 4<400> 4
Met Asn Met Ser Gln Gln Ser Pro Ser Ala Asp Arg Arg Leu Ser Val Met Asn Met Ser Gln Gln Ser Pro Ser Ala Asp Arg Arg Leu Ser Val
1 5 10 15 1 5 10 15
Leu Ala Arg His Leu Glu Pro Ser Ser Ser Ala Thr Val Glu Thr Ser Leu Ala Arg His Leu Glu Pro Ser Ser Ser Ala Thr Val Glu Thr Ser
20 25 30 20 25 30
Ile Val Ala Ala Pro Thr Ser Gly Asn Ala Gly Thr Asn Ser Val Phe Ile Val Ala Ala Pro Thr Ser Gly Asn Ala Gly Thr Asn Ser Val Phe
35 40 45 35 40 45
Ser His Ile Val Arg Ala Pro Glu Asp Pro Ile Leu Gly Val Thr Ile Ser His Ile Val Arg Ala Pro Glu Asp Pro Ile Leu Gly Val Thr Ile
50 55 60 50 55 60
Ala Tyr Asn Lys Asp Ser Ser Pro Met Lys Leu Asn Leu Gly Val Gly Ala Tyr Asn Lys Asp Ser Ser Pro Met Lys Leu Asn Leu Gly Val Gly
65 70 75 80 65 70 75 80
Ala Tyr Arg Thr Glu Glu Gly Lys Pro Leu Val Leu Asn Val Val Arg Ala Tyr Arg Thr Glu Glu Gly Lys Pro Leu Val Leu Asn Val Val Arg
85 90 95 85 90 95
Gln Ala Glu Gln Leu Leu Val Asn Asp Arg Ser Arg Val Lys Glu Tyr Gln Ala Glu Gln Leu Leu Val Asn Asp Arg Ser Arg Val Lys Glu Tyr
100 105 110 100 105 110
Leu Ser Ile Thr Gly Leu Ala Asp Phe Asn Lys Leu Ser Ala Lys Leu Leu Ser Ile Thr Gly Leu Ala Asp Phe Asn Lys Leu Ser Ala Lys Leu
115 120 125 115 120 125
Ile Leu Gly Ala Asp Ser Pro Ala Ile Gln Glu Asn Arg Val Thr Thr Ile Leu Gly Ala Asp Ser Pro Ala Ile Gln Glu Asn Arg Val Thr Thr
130 135 140 130 135 140
Val Gln Cys Leu Ser Gly Thr Gly Ser Leu Arg Val Gly Ala Glu Phe Val Gln Cys Leu Ser Gly Thr Gly Ser Leu Arg Val Gly Ala Glu Phe
145 150 155 160 145 150 155 160
Leu Ala Arg His Tyr His Gln Arg Thr Ile Tyr Ile Pro Gln Pro Thr Leu Ala Arg His Tyr His Gln Arg Thr Ile Tyr Ile Pro Gln Pro Thr
165 170 175 165 170 175
Trp Gly Asn His Pro Lys Val Phe Thr Leu Ala Gly Leu Ser Val Lys Trp Gly Asn His Pro Lys Val Phe Thr Leu Ala Gly Leu Ser Val Lys
180 185 190 180 185 190
Ser Tyr Arg Tyr Tyr Asp Pro Ala Thr Arg Gly Leu Asn Phe Gln Gly Ser Tyr Arg Tyr Tyr Asp Pro Ala Thr Arg Gly Leu Asn Phe Gln Gly
195 200 205 195 200 205
Leu Leu Glu Asp Leu Gly Ser Ala Pro Ser Gly Ala Ile Val Leu Leu Leu Leu Glu Asp Leu Gly Ser Ala Pro Ser Gly Ala Ile Val Leu Leu
210 215 220 210 215 220
His Ala Cys Ala His Asn Pro Thr Gly Val Asp Pro Thr Ile Asp Gln His Ala Cys Ala His Asn Pro Thr Gly Val Asp Pro Thr Ile Asp Gln
225 230 235 240 225 230 235 240
Trp Glu Gln Ile Arg Arg Leu Met Arg Ser Arg Gly Leu Leu Pro Phe Trp Glu Gln Ile Arg Arg Leu Met Arg Ser Arg Gly Leu Leu Pro Phe
245 250 255 245 250 255
Phe Asp Ser Ala Tyr Gln Gly Phe Ala Ser Gly Ser Leu Asp Thr Asp Phe Asp Ser Ala Tyr Gln Gly Phe Ala Ser Gly Ser Leu Asp Thr Asp
260 265 270 260 265 270
Ala Gln Ser Val Arg Met Phe Val Ala Asp Gly Gly Glu Val Leu Val Ala Gln Ser Val Arg Met Phe Val Ala Asp Gly Gly Glu Val Leu Val
275 280 285 275 280 285
Ala Gln Ser Tyr Ala Lys Asn Met Gly Leu Tyr Gly Glu Arg Val Gly Ala Gln Ser Tyr Ala Lys Asn Met Gly Leu Tyr Gly Glu Arg Val Gly
290 295 300 290 295 300
Ala Leu Ser Ile Val Cys Arg Asn Ala Asp Val Ala Ser Arg Val Glu Ala Leu Ser Ile Val Cys Arg Asn Ala Asp Val Ala Ser Arg Val Glu
305 310 315 320 305 310 315 320
Ser Gln Leu Lys Leu Val Ile Arg Pro Met Tyr Ser Asn Pro Pro Ile Ser Gln Leu Lys Leu Val Ile Arg Pro Met Tyr Ser Asn Pro Pro Ile
325 330 335 325 330 335
His Gly Ala Ser Ile Val Ala Thr Ile Leu Lys Asp Arg Asn Met Tyr His Gly Ala Ser Ile Val Ala Thr Ile Leu Lys Asp Arg Asn Met Tyr
340 345 350 340 345 350
His Glu Trp Thr Leu Glu Leu Lys Ala Met Ala Asp Arg Ile Ile Arg His Glu Trp Thr Leu Glu Leu Lys Ala Met Ala Asp Arg Ile Ile Arg
355 360 365 355 360 365
Met Arg Gln Gln Leu Phe Asp Ala Leu Arg Ala Arg Gly Thr Pro Gly Met Arg Gln Gln Leu Phe Asp Ala Leu Arg Ala Arg Gly Thr Pro Gly
370 375 380 370 375 380
Asp Trp Ser His Ile Ile Lys Gln Ile Gly Met Phe Thr Phe Thr Gly Asp Trp Ser His Ile Ile Lys Gln Ile Gly Met Phe Thr Phe Thr Gly
385 390 395 400 385 390 395 400
Leu Asn Ser Glu Gln Val Ala Phe Met Thr Lys Glu Tyr His Ile Tyr Leu Asn Ser Glu Gln Val Ala Phe Met Thr Lys Glu Tyr His Ile Tyr
405 410 415 405 410 415
Met Thr Ser Asp Gly Arg Ile Ser Met Ala Gly Leu Ser Ser Arg Thr Met Thr Ser Asp Gly Arg Ile Ser Met Ala Gly Leu Ser Ser Arg Thr
420 425 430 420 425 430
Val Pro His Leu Ala Asp Ala Ile His Ala Ala Val Ala Arg Ala Arg Val Pro His Leu Ala Asp Ala Ile His Ala Ala Val Ala Arg Ala Arg
435 440 445 435 440 445
<210> 5<210> 5
<211> 6388<211> 6388
<212> ДНК<212> DNA
<213> Nicotiana tabacum<213> Nicotiana tabacum
<400> 5<400> 5
atggcgatcc gagccgcgat ttccggtcgt cccctcaagt ttagctcgtc ggtcggagcg 60atggcgatcc gagccgcgat ttccggtcgt cccctcaagt ttagctcgtc ggtcggagcg 60
cgatctttgt cgtcgttgtg gcgaaacgtc gagccggctc ctaaagatcc tatcctcggc 120cgatctttgt cgtcgttgtg gcgaaacgtc gagccggctc ctaaagatcc tatcctcggc 120
gttaccgaag ctttcctcgc cgatcctact cctcataaag tcaatgttgg tgttgtaagt 180gttaccgaag ctttcctcgc cgatcctact cctcataaag tcaatgttgg tgttgtaagt 180
ttttttttct ctttgctttg tttgattttc cacttcattt cgtgtaagct aggatttagc 240ttttttttct ctttgctttg tttgattttc cacttcattt cgtgtaagct aggatttagc 240
ttacttgacc atttcgctat tcttcatagg ccatagctgt aaaaatggtt ttactgtgac 300ttacttgacc atttcgctat tcttcatagg ccatagctgt aaaaatggtt ttactgtgac 300
gaatcttcga cgatctcaat cgctttggga ttgggagaga gtttattgat ttaatttttg 360360
tatgcattcc acttttttca acttgatcta tttaagaaaa aaattgaaaa agatttgacc 420tatgcattcc acttttttca acttgatcta tttaagaaaa aaattgaaaa agatttgacc 420
ttttttctta aattatttct tttaaatttt ttatttttgt gattattata tagggagctt 480ttttttctta aattatttct tttaaatttt ttatttttgt gattatattata tagggagctt 480
acagagacaa caatggaaaa cccgtggtac tggagtgtgt tagagaagca gagcggagga 540acagagacaa caatggaaaa cccgtggtac tggagtgtgt tagagaagca gagcggagga 540
tcgctggcag tttcaacatg tgagtgctct cctgatttat tcaagttttt ctgttatttt 600600
atttgtaatt aattacgatt acgttaactt tgatctatta gaaaatagaa acttcagcca 660atttgtaatt aattacgatt acgttaactt tgatctatta gaaaatagaa acttcagcca 660
gtaagattac tttttttctt cgaggagtgt gagatgtaaa cccaggtcgg atgcactgga 720gtaagattac tttttttctt cgaggagtgt gagatgtaaa cccaggtcgg atgcactgga 720
attcttcact agtttgtgca aatatattct taatattttt caaaaacttc ctgtgtacac 780attcttcact agtttgtgca aatatattct taatattttt caaaaacttc ctgtgtacac 780
acacacatac atgtaattaa ttaagtaatt acctactgat ctaggatttt taggtagttc 840acacacatac atgtaattaa ttaagtaatt acctactgat ctaggatttt taggtagttc 840
ggaaaaatat attttcaata tcgtttaaga attttctggg tatgcgtagt ttgagtatga 900ggaaaaatat attttcaata tcgtttaaga attttctggg tatgcgtagt ttgagtatga 900
taaaatgggt gcatgtgcac cactgcttac gctagggaac agcctctaat tagctgttgg 960taaaatgggt gcatgtgcac cactgcttac gctagggaac agcctctaat tagctgttgg 960
tgagtctggt gagtggtgac tgttctttat tttcagttac ttcgcacatt gttggttttt 10201020
gattaagtat aaataaacga atgttttagt gagtgcttat ttctatgaag catctttttt 10801080
aggtctacag aaatgggtgg tacgatattt tccagccgtc agctccacta accagtttga 1140aggtctacag aaatgggtgg tacgatattt tccagccgtc agctcacta accagtttga 1140
ttctttggga ctttttcttt gtattctcac gtttacttct agtggatggt gcagatggat 1200ttctttggga ctttttcttt gtattctcac gtttacttct agtggatggt gcagatggat 1200
ttctttacta attctttctt ctgcgtttgc agagctttct cccaagataa attattaata 1260ttctttacta attctttctt ctgcgtttgc agagctttct cccaagataa attattaata 1260
tcaaattgac ctttcgatag ttcaatggtg tttaactttt tcaaatattg cccattttat 13201320
attatgaagt ttgaaagttt aactagacat gttgtaataa attttatttg acttgtgtat 13801380
tttattcatt gtggttggag aaagtattaa aataacaagt gaaaagtctg ttttacgtca 1440tttattcatt gtggttggag aaagtattaa aataacaagt gaaaagtctg ttttacgtca 1440
agtttgaatt tgaatttttg aattgatttg cttctttaag tttatgaaac catctatgag 1500agtttgaatt tgaatttttg aattgatttg cttctttaag tttatgaaac catctatgag 1500
aatattattg gcactccatt gtctcatttt atgtgaaggc atttgacgtt gcacaaaatt 1560aatattattg gcactccatt gtctcatttt atgtgaaggc atttgacgtt gcacaaaatt 1560
taaaaatata aagaaactta tgacgtgtaa gttagatata tgcagagtac catagttatc 1620taaaaatata aagaaactta tgacgtgtaa gttagatata tgcagagtac catagttatc 1620
cttttaagta agtgatagtg agagtttcac atttcttttt gttctctctt cttataaaag 1680cttttaagta agtgatagtg agagtttcac atttcttttt gttctctctt cttataaaag 1680
aatgaatttt tgtatcccaa caagtcatat cattaatgtt aacacgggga tactaagatt 1740aatgaatttt tgtatcccaa caagtcatat cattaatgtt aacacgggga tactaagatt 1740
aactaatgtc taaaaagaga aagatttcat tcttcttgga cgggctaaaa aggaaagtat 1800aactaatgtc taaaaagaga aagatttcat tcttcttgga cgggctaaaa aggaaagtat 1800
gtcacataaa atgagacaga gatatgttag gatttgtcct gaatttctaa tcaattagga 1860gtcacataaa atgagacaga gatatgttag gatttgtcct gaatttctaa tcaattagga 1860
ctctctttct tgaaggaatg gaaaaagact cctaaaagga ttaaatctcc ttaatatgtc 1920ctctctttct tgaaggaatg gaaaaagact cctaaaagga ttaaatctcc ttaatatgtc 1920
ttatcctttt cttggaagac aagttttgca catctataaa ttaaggatct ctgcttttca 1980ttatcctttt cttggaagac aagttttgca catctataaa ttaagggatct ctgcttttca 1980
caagaacaca aaaaaaaaat atccacaatg tagttattaa agagtttgtt tagggggaga 20402040
tttttctctc gatagttttt cttcttttat attagtttta tcatatgtag atcaattgac 2100tttttctctc gatagttttt cttcttttat attagtttta tcatatgtag atcaattgac 2100
caaatcatta taaactatta tgcttagttt aatatatttt tcttttgttg tctgatttat 21602160
cgtccatcaa gttttgtatt gttagttttc gcatgcacca tgttatttcg aacccaacaa 2220cgtccatcaa gttttgtatt gttagttttc gcatgcacca tgttatttcg aacccaacaa 2220
gtggtatcag agccaatggt tcagagtcaa cggttgaacg aggttgaaga aagattcaat 2280gtggtatcag agccaatggt tcagagtcaa cggttgaacg aggttgaaga aagattcaat 2280
gcgtgtttag atcaagacga taatgaagat ttattcaaca tgctacatgt ggagataaat 2340gcgtgtttag atcaagacga taatgaagat ttattcaaca tgctacatgt ggagataaat 2340
ttacaattac aattgtattc aacacgcctg ctgttgcatc tttattggaa taaaaactct 2400ttacaattac aattgtattc aacacgcctg ctgttgcatc tttattggaa taaaaactct 2400
ttctaaccca tattttggcc actttaaacc aatgccaatt ttaagtcatg cctacttgca 2460ttctaaccca tattttggcc actttaaacc aatgccaatt ttaagtcatg cctacttgca 2460
acacatgagt tccagtgcca gttttaactc acgcttcttt ttaatgcatg agcttctttt 2520acacatgagt tccagtgcca gttttaactc acgcttcttt ttaatgcatg agcttctttt 2520
atcccatgtt tattcttaac acgcgggctc cttttaaccc atacttggtt tttttttaac 2580atcccatgtt tattcttaac acgcgggctc cttttaaccc atacttggtt tttttttaac 2580
caataccaag attttcaatt tttaatcatg gcaagcagca gtgatgaaga ttatgtgaag 2640caataccaag attttcaatt tttaatcatg gcaagcagca gtgatgaaga ttatgtgaag 2640
aaggtgaatc aactttgtca agaaaattca ggccaagggg agattgttag gatttgtcct 2700aaggtgaatc aactttgtca agaaaattca ggccaagggg agattgttag gatttgtcct 2700
gaatttctaa tcaattagga ctctctttct tgaaggaatg gaaaaagact cctaaaagga 2760gaatttctaa tcaattagga ctctctttct tgaaggaatg gaaaaagact cctaaaagga 2760
ttaaatctct ttactatgtc ttatcatttt cttggaagac aagttttgca catctataaa 2820ttaaatctct ttactatgtc ttatcatttt cttggaagac aagttttgca catctataaa 2820
ttaaggatct ctgcttctca caagagcaca aaaaaaaaaa tatccacaat gtagttatta 2880ttaaggatct ctgcttctca caagagcaca aaaaaaaaaa tatccacaat gtagttatta 2880
aagagttttg tttaggggga gatttttctt tcaatagttt ttcttctttt atattagttt 2940aagagttttg tttagggggga gatttttctt tcaatagttt ttcttctttt atattagttt 2940
tatcatatgc agatcaattg accaaactat tatgcttagt ttaatatttt ttttttttgt 30003000
cgtctgattt atcgtccacc aagttttgta ttgttagttt ccgcatgcac catgttattt 30603060
cgaaccctcg tataagtttg tcaaacattt tgtgacttcc taaactagaa agtgtcttgg 31203120
gatgggggag aactacgcta tctgatctca aaaaaagtgt gcatcatgtg atactatgtg 3180gatgggggag aactacgcta tctgatctca aaaaaagtgt gcatcatgtg atactatgtg 3180
gatagtttag ttcacatgtt gacaattcat catttatcag ggaatatctt cctatgggag 32403240
gtagtgtcaa catgatcgag gagtcactga agttagccta tggggagaac tcagacttga 3300gtagtgtcaa catgatcgag gagtcactga agttagccta tggggagaac tcagacttga 3300
taaaagataa gcgcattgca gcaattcaag ctttatccgg gactggagca tgccgaattt 3360taaaagataa gcgcattgca gcaattcaag ctttatccgg gactggagca tgccgaattt 3360
ttgcagactt ccaaaggcgc ttttgtcctg attcacagat ttatattcct gttcctacat 3420ttgcagactt ccaaaggcgc ttttgtcctg attcacagat ttatattcct gttcctacat 3420
ggtctaagta agtgtattct tctgcttctc ggcatctcta cagcatccta attgatcttc 3480ggtctaagta agtgtattct tctgcttctc ggcatctcta cagcatccta attgatcttc 3480
ctcaattggt ttttgcactt taaaacatga gtatgcaaat accttcaaaa ttttctaatt 3540ctcaattggt ttttgcactt taaaacatga gtatgcaaat accttcaaaa ttttctaatt 3540
tcctgtcatt actaatataa agttcttggc agtcatcata acatttggag agatgctcat 3600tcctgtcatt actaatataa agttcttggc agtcatcata acatttggag agatgctcat 3600
gtccctcaga aaatgtatca ttattatcat cctgaaacaa aggggttgga cttcgctgca 3660gtccctcaga aaatgtatca ttattatcat cctgaaacaa aggggttgga cttcgctgca 3660
ctgatggatg atataaaggt aagaaaacat atatttgagg ttgtttgcca tgatggttgg 3720ctgatggatg atataaaggt aagaaaacat atatttgagg ttgtttgcca tgatggttgg 3720
ttctcctgtt tgatgatata gtgtccctcc tcaagtggca attatgtgtt ctatcctgac 3780ttctcctgtt tgatgatata gtgtccctcc tcaagtggca attatgtgtt ctatcctgac 3780
gtatttcaat tttcattgac atagaatgcc ccaaatggat cattctttct gcttcatgct 3840gtatttcaat ttttcattgac atagaatgcc ccaaatggat cattctttct gcttcatgct 3840
tgcgctcaca atcctactgg ggtggatcct acagaggaac aatggaggga gatctcacac 3900tgcgctcaca atcctactgg ggtggatcct acagaggaac aatggaggga gatctcacac 3900
cagttcaagg taatgatttg tatgttttgt ctctcccttt tcttgtcata agtcatatta 39603960
aatttattac actggttcca ggtgaaggga cattttgctt tctttgacat ggcctatcaa 4020aatttattac actggttcca ggtgaaggga cattttgctt tctttgacat ggcctatcaa 4020
ggatttgcta gtgggaatcc agagaaggat gctaaggcta tcaggatatt tcttgaagat 4080ggatttgcta gtgggaatcc agagaaggat gctaaggcta tcaggatatt tcttgaagat 4080
ggtcatccga taggatgtgc ccaatcatat gcaaaaaata tgggactata tggccagaga 4140ggtcatccga taggatgtgc ccaatcatat gcaaaaaata tgggactata tggccagaga 4140
gttggttgcc taaggtaaac tactactccc accatcatat cttatttgcc ctagttacaa 4200gttggttgcc taaggtaaac tactactccc accatcatat cttatttgcc ctagttacaa 4200
tctggagagt caaacaaact ttttattaga ccatagttgg tctatttttc aaatgatcta 4260tctggagagt caaacaaact ttttattaga ccatagttgg tctatttttc aaatgatcta 4260
attccaaaag cagttactac tatttcatgc aaattctaga ttaattaacc ttttgctata 4320attccaaaag cagttactac tatttcatgc aaattctaga ttaattaacc ttttgctata 4320
cctcattatc ttcatttagt aggcagtagc taattttacc atatatcata tttttcatat 4380cctcattatc ttcatttagt aggcagtagc taattttacc atatatcata tttttcatat 4380
aatcaatatg tagagttatt tatttattta tatattttaa atttatttag gataaatttt 44404440
gttctttccg gtaatttcag ttcatttcca cctaaaagtc caactcgaag agaaaaacag 4500gttctttccg gtaatttcag ttcatttcca cctaaaagtc caactcgaag agaaaaacag 4500
aattttgcta gtcaaaactt agatccaatg aaaagcacca aaattttggt tttaaattat 4560aattttgcta gtcaaaactt agatccaatg aaaagcacca aaattttggt tttaaattat 4560
aaaacatgtc tactctaggt ttttttccta ggcaagcgat gtgattttac aatcttacaa 4620aaaacatgtc tactctaggt ttttttccta ggcaagcgat gtgattttac aatcttacaa 4620
taaggcatca atcaatccca aactagtttg gttcaacaat ataaatcttt gttcctattt 4680taaggcatca atcaatccca aactagtttg gttcaacaat ataaatcttt gttcctattt 4680
catggcattg ggcccattgc attccaataa tggtaaataa gacaaattag aggttatcta 4740catggcattg ggcccattgc attccaataa tggtaaataa gacaaattag aggttatcta 4740
agattagaga ttccttatta aaatctcata cttatatcta cattgtcacg caagtctctg 4800agattagaga ttccttatta aaatctcata cttatatcta cattgtcacg caagtctctg 4800
accttaaaag aagacttcta gcagacacca gacttaacgt aagtgtaaca acaacaacta 4860accttaaaag aagacttcta gcagacacca gacttaacgt aagtgtaaca acaacaacta 4860
agttttaatc caaactagtt agtatcgctt atatgaatcc cttgcttcca ttgtgtagca 4920agttttaatc caaactagtt agtatcgctt atatgaatcc cttgcttcca ttgtgtagca 4920
ctaaacaaca acaacaacat accgagtata atctcacata gtggggtctg gggagggtag 4980ctaaacaaca acaacaacat accgagtata atctcacata gtggggtctg gggagggtag 4980
tgtgtacgca gactttaccc ctgccttgtg gagaaagaga ggctatttcc aatagaccct 5040tgtgtacgca gactttaccc ctgccttgtg gagaaagaga ggctatttcc aatagaccct 5040
cggctcaaaa ccattgtgta gcaatggagg catgaaatag aaaacttgtc ttctgattaa 5100cggctcaaaa ccattgtgta gcaatgggagg catgaaatag aaaacttgtc ttctgattaa 5100
aatctgttat taaattaatg aggagaaaaa attggattac ttgttggtaa atcttatttg 5160aatctgttat taaattaatg aggagaaaaa attggattac ttgttggtaa atcttatttg 5160
ttgttttaaa cacacacaaa gccgaaagac ctctgatact tttcctgaga tgcttccgca 5220ttgttttaaa cacacacaaa gccgaaagac ctctgatact ttttcctgaga tgcttccgca 5220
attcactgca gtgtggtttg tgaggatgaa aaacaagcag tggcagtgaa aagtcagttg 5280attcactgca gtgtggtttg tgaggatgaa aaacaagcag tggcagtgaa aagtcagttg 5280
cagcagcttg ctaggcccat gtatagtaat ccacctgttc atggcgcgct cgttgtttct 5340cagcagcttg ctaggcccat gtatagtaat ccacctgttc atggcgcgct cgttgtttct 5340
accatccttg gagatccaaa cttgaaaaag ctatggcttg gggaagtgaa ggtaatatgg 5400accatccttg gagatccaaa cttgaaaaag ctatggcttg gggaagtgaa ggtaatatgg 5400
ttagaacaag aaaagattta tgattatata actatcattg gtattttgac aaaaggtagg 5460ttagaacaag aaaagattta tgattatata actatcattg gtattttgac aaaaggtagg 5460
aactaggaac cttgctatta aagatatttt cttcccttta ttttggaaaa aaaggtattt 5520aactaggaac cttgctatta aagatatttt cttcccttta ttttggaaaa aaaggtattt 5520
tcttgctttc ttcaaatgtt tgagatttgg atagagccgt tacatggaaa tgctgtgcaa 5580tcttgctttc ttcaaatgtt tgagatttgg atagagccgt tacatggaaa tgctgtgcaa 5580
ttttctgcta ctcacatgga aaagatcttt ttcttttgct gatctgttta agcacctatt 5640ttttctgcta ctcacatgga aaagatcttt ttcttttgct gatctgttta agcacctatt 5640
tgctaaagcc tactatgtca gtatgttgtt caatcttttc agccacagaa acaggtctaa 5700tgctaaagcc tactatgtca gtatgttgtt caatcttttc agccacagaa acaggtctaa 5700
accagttcca aactttaaat aatcttacca tggtagtttc agcaaagata aattggtccg 5760accagttcca aactttaaat aatcttacca tggtagtttc agcaaagata aattggtccg 5760
tgcagccatt aactgttttc tttgtcgggc ttcttaaact tgttttctcc aaggtctagt 5820tgcagccatt aactgttttc tttgtcgggc ttcttaaact tgttttctcc aaggtctagt 5820
tgttggtgct gtggctgctt tttagctttg tgctcattat cagagcatca tatgtttaag 5880tgttggtgct gtggctgctt tttagctttg tgctcattat cagagcatca tatgtttaag 5880
tgtaaaggtt caatgactaa gttctttttc cagggcatgg ctgatcgcat tatcgggatg 5940tgtaaaggtt caatgactaa gttctttttc cagggcatgg ctgatcgcat tatcgggatg 5940
agaactgctt taagagaaaa ccttgagaag ttggggtcac ctctatcctg ggagcacata 6000agaactgctt taagagaaaa ccttgagaag ttggggtcac ctctatcctg ggagcacata 6000
accaatcagg tattgaaatc aacaacttct gttgttttct atgctactag tatataacta 6060accaatcagg tattgaaatc aacaacttct gttgttttct atgctactag tatataacta 6060
ttaagaaaat tactgtggtt cacctactgc gccattaata ctcgatacca ccaacagatt 6120ttaagaaaat tactgtggtt cacctactgc gccattaata ctcgatacca ccaacagatt 6120
ggcatgttct gttatagtgg gatgacaccc gaacaagtcg accgtttgac aaaagagtat 6180ggcatgttct gttatagtgg gatgacaccc gaacaagtcg accgtttgac aaaagagtat 6180
cacatctaca tgactcgtaa tggtcgtatc aggtataatc attaggtcac caatttctgc 6240cacatctaca tgactcgtaa tggtcgtatc aggtataatc attaggtcac caatttctgc 6240
ttaatgctcc ggtgttcttg tacagagtta tatctcatta ttttttccac tatgttgtgt 63006300
gttttgtacg tgcagtatgg caggagttac tactggaaat gttggttact tggcaaatgc 63606360
tattcatgag gccaccaaat cagcttaa 6388tattcatgag gccaccaaat cagcttaa 6388
<210> 6<210> 6
<211> 424<211> 424
<212> БЕЛОК<212> PROTEIN
<213> Nicotiana tabacum<213> Nicotiana tabacum
<400> 6<400> 6
Met Ala Ile Arg Ala Ala Ile Ser Gly Arg Pro Leu Lys Phe Ser Ser Met Ala Ile Arg Ala Ala Ile Ser Gly Arg Pro Leu Lys Phe Ser Ser
1 5 10 15 1 5 10 15
Ser Val Gly Ala Arg Ser Leu Ser Ser Leu Trp Arg Asn Val Glu Pro Ser Val Gly Ala Arg Ser Leu Ser Ser Leu Trp Arg Asn Val Glu Pro
20 25 30 20 25 30
Ala Pro Lys Asp Pro Ile Leu Gly Val Thr Glu Ala Phe Leu Ala Asp Ala Pro Lys Asp Pro Ile Leu Gly Val Thr Glu Ala Phe Leu Ala Asp
35 40 45 35 40 45
Pro Thr Pro His Lys Val Asn Val Gly Val Gly Ala Tyr Arg Asp Asn Pro Thr Pro His Lys Val Asn Val Gly Val Gly Ala Tyr Arg Asp Asn
50 55 60 50 55 60
Asn Gly Lys Pro Val Val Leu Glu Cys Val Arg Glu Ala Glu Arg Arg Asn Gly Lys Pro Val Val Leu Glu Cys Val Arg Glu Ala Glu Arg Arg
65 70 75 80 65 70 75 80
Ile Ala Gly Ser Phe Asn Met Glu Tyr Leu Pro Met Gly Gly Ser Val Ile Ala Gly Ser Phe Asn Met Glu Tyr Leu Pro Met Gly Gly Ser Val
85 90 95 85 90 95
Asn Met Ile Glu Glu Ser Leu Lys Leu Ala Tyr Gly Glu Asn Ser Asp Asn Met Ile Glu Glu Ser Leu Lys Leu Ala Tyr Gly Glu Asn Ser Asp
100 105 110 100 105 110
Leu Ile Lys Asp Lys Arg Ile Ala Ala Ile Gln Ala Leu Ser Gly Thr Leu Ile Lys Asp Lys Arg Ile Ala Ala Ile Gln Ala Leu Ser Gly Thr
115 120 125 115 120 125
Gly Ala Cys Arg Ile Phe Ala Asp Phe Gln Arg Arg Phe Cys Pro Asp Gly Ala Cys Arg Ile Phe Ala Asp Phe Gln Arg Arg Phe Cys Pro Asp
130 135 140 130 135 140
Ser Gln Ile Tyr Ile Pro Val Pro Thr Trp Ser Asn His His Asn Ile Ser Gln Ile Tyr Ile Pro Val Pro Thr Trp Ser Asn His His Asn Ile
145 150 155 160 145 150 155 160
Trp Arg Asp Ala His Val Pro Gln Lys Met Tyr His Tyr Tyr His Pro Trp Arg Asp Ala His Val Pro Gln Lys Met Tyr His Tyr Tyr His Pro
165 170 175 165 170 175
Glu Thr Lys Gly Leu Asp Phe Ala Ala Leu Met Asp Asp Ile Lys Asn Glu Thr Lys Gly Leu Asp Phe Ala Ala Leu Met Asp Asp Ile Lys Asn
180 185 190 180 185 190
Ala Pro Asn Gly Ser Phe Phe Leu Leu His Ala Cys Ala His Asn Pro Ala Pro Asn Gly Ser Phe Phe Leu Leu His Ala Cys Ala His Asn Pro
195 200 205 195 200 205
Thr Gly Val Asp Pro Thr Glu Glu Gln Trp Arg Glu Ile Ser His Gln Thr Gly Val Asp Pro Thr Glu Glu Gln Trp Arg Glu Ile Ser His Gln
210 215 220 210 215 220
Phe Lys Val Lys Gly His Phe Ala Phe Phe Asp Met Ala Tyr Gln Gly Phe Lys Val Lys Gly His Phe Ala Phe Phe Asp Met Ala Tyr Gln Gly
225 230 235 240 225 230 235 240
Phe Ala Ser Gly Asn Pro Glu Lys Asp Ala Lys Ala Ile Arg Ile Phe Phe Ala Ser Gly Asn Pro Glu Lys Asp Ala Lys Ala Ile Arg Ile Phe
245 250 255 245 250 255
Leu Glu Asp Gly His Pro Ile Gly Cys Ala Gln Ser Tyr Ala Lys Asn Leu Glu Asp Gly His Pro Ile Gly Cys Ala Gln Ser Tyr Ala Lys Asn
260 265 270 260 265 270
Met Gly Leu Tyr Gly Gln Arg Val Gly Cys Leu Ser Val Val Cys Glu Met Gly Leu Tyr Gly Gln Arg Val Gly Cys Leu Ser Val Val Cys Glu
275 280 285 275 280 285
Asp Glu Lys Gln Ala Val Ala Val Lys Ser Gln Leu Gln Gln Leu Ala Asp Glu Lys Gln Ala Val Ala Val Lys Ser Gln Leu Gln Gln Leu Ala
290 295 300 290 295 300
Arg Pro Met Tyr Ser Asn Pro Pro Val His Gly Ala Leu Val Val Ser Arg Pro Met Tyr Ser Asn Pro Val His Gly Ala Leu Val Val Ser
305 310 315 320 305 310 315 320
Thr Ile Leu Gly Asp Pro Asn Leu Lys Lys Leu Trp Leu Gly Glu Val Thr Ile Leu Gly Asp Pro Asn Leu Lys Lys Leu Trp Leu Gly Glu Val
325 330 335 325 330 335
Lys Gly Met Ala Asp Arg Ile Ile Gly Met Arg Thr Ala Leu Arg Glu Lys Gly Met Ala Asp Arg Ile Ile Gly Met Arg Thr Ala Leu Arg Glu
340 345 350 340 345 350
Asn Leu Glu Lys Leu Gly Ser Pro Leu Ser Trp Glu His Ile Thr Asn Asn Leu Glu Lys Leu Gly Ser Pro Leu Ser Trp Glu His Ile Thr Asn
355 360 365 355 360 365
Gln Ile Gly Met Phe Cys Tyr Ser Gly Met Thr Pro Glu Gln Val Asp Gln Ile Gly Met Phe Cys Tyr Ser Gly Met Thr Pro Glu Gln Val Asp
370 375 380 370 375 380
Arg Leu Thr Lys Glu Tyr His Ile Tyr Met Thr Arg Asn Gly Arg Ile Arg Leu Thr Lys Glu Tyr His Ile Tyr Met Thr Arg Asn Gly Arg Ile
385 390 395 400 385 390 395 400
Ser Met Ala Gly Val Thr Thr Gly Asn Val Gly Tyr Leu Ala Asn Ala Ser Met Ala Gly Val Thr Thr Gly Asn Val Gly Tyr Leu Ala Asn Ala
405 410 415 405 410 415
Ile His Glu Ala Thr Lys Ser Ala Ile His Glu Ala Thr Lys Ser Ala
420 420
<210> 7<210> 7
<211> 4789<211> 4789
<212> ДНК<212> DNA
<213> Nicotiana tabacum<213> Nicotiana tabacum
<400> 7<400> 7
atggcgattc gagccgcgat ttccggtcgt tccctcaagc atattagctc gtcggtcgga 60atggcgattc gagccgcgat ttccggtcgt tccctcaagc atattagctc gtcggtcgga 60
gcgcgatctt tgtcgtcgtt gtggcgaaac gtcgagccgg ctcctaaaga tcctatcctt 120gcgcgatctt tgtcgtcgtt gtggcgaaac gtcgagccgg ctcctaaaga tcctatcctt 120
ggcgttaccg aagctttcct cgccgatcct actccccata aagtcaatgt tggcgttgtg 180ggcgttaccg aagctttcct cgccgatcct actccccata aagtcaatgt tggcgttgtg 180
agtttttttt tcctctttgt tttgcttcat tttccacctc atttcgtgta tgcaaggatt 240agtttttttt tcctctttgt tttgcttcat tttccacctc atttcgtgta tgcaaggatt 240
tagcttactt gaccatttcg ctatacttcc cttggtaggc catagctgta aaaaatagtt 300tagcttactt gaccattttcg ctatacttcc cttggtaggc catagctgta aaaaatagtt 300
ttactgtgac gaatcatcga catatggata cagagtattc taatggagta gtcaacaaca 360ttactgtgac gaatcatcga catatggata cagagtattc taatggagta gtcaacaaca 360
taagtcgatc tcaatcgctt tgggattgag aaagagttta ttgatttaat ttttgtatgc 420taagtcgatc tcaatcgctt tgggattgag aaagagttta ttgatttaat ttttgtatgc 420
gttccacttt tttcaacttg atctatttaa gaaaaaaatt gaaaaagatt tgaccttttt 480gttccacttt tttcaacttg atctatttaa gaaaaaaatt gaaaaagatt tgaccttttt 480
tcttaaatta tttcttttat aaaatttgct tttgtgatta ttatacaggg agcttacagg 540tcttaaatta tttcttttat aaaatttgct tttgtgatta ttatacaggg agcttacagg 540
gacgacaacg gaaaacccgt ggtactggag tgtgtcagag aagcagagcg gaggatcgct 600gacgacaacg gaaaacccgt ggtactggag tgtgtcagag aagcagagcg gaggatcgct 600
ggcagtttca acatgtgagt gcttctcctg atttattcat ttttttctgt tatttatttg 660ggcagtttca acatgtgagt gcttctcctg atttattcat ttttttctgt tatttatttg 660
taattaatta cgattacgtt aaatttgatc tattagaaaa tataaacttc agccagtaag 720taattaatta cgattacgtt aaatttgatc tattagaaaa tataaacttc agccagtaag 720
attacttttt ttcttcgagg agtttgagat gtaaaaccca ggtcggatgc actgggattc 780attacttttt ttcttcgagg agtttgagat gtaaaaccca ggtcggatgc actgggattc 780
ttaagtagtt tgtacaaata tattcttaat agttttgtaa aatttgctgt atacacacac 840ttaagtagtt tgtacaaata tattcttaat agttttgtaa aatttgctgt atacacacac 840
atgtaattaa ttacctactg atctaggatt tataggtagt tcggaaaaat atattttcaa 900atgtaattaa ttacctactg atctaggatt tataggtagt tcggaaaaat atattttcaa 900
tatcgtttaa gaatttcctg ggtgtgtata gtttgagtat gagaaaatgg gtgcatgtgc 960tatcgtttaa gaatttcctg ggtgtgtata gtttgagtat gagaaaatgg gtgcatgtgc 960
accactgctt acgctaggga tcagcttcta aatagctggt ggtgagtctg gtgagtggtg 1020accactgctt acgctagggga tcagcttcta aatagctggt ggtgagtctg gtgagtggtg 1020
actgttcttt attttcagtt actgtagcca caaattgttg gttattgatt aagtataaat 1080actgttcttt attttcagtt actgtagcca caaattgttg gttattgatt aagtataaat 1080
aaacgaatgt attagtgagt gcttatttgt atgaagcatc ttttttaagt ctacagaaat 11401140
gggtggtccg atattttcca cccgtcagtt cctctaacta gtttgattct ttgggacttt 1200gggtggtccg atattttcca cccgtcagtt cctctaacta gtttgattct ttgggacttt 1200
ttctttgtat tctcacgttt acgcctagtg gatggtgcag atggatttct ttactaattc 1260ttctttgtat tctcacgttt acgcctagtg gatggtgcag atggatttct ttactaattc 1260
tttcttctgc gcttgcagag ctttctccca agataaatta ttaatatcaa attgaccttt 1320tttcttctgc gcttgcagag ctttctccca agataaatta ttaatatcaa attgaccttt 1320
cgatagttca atggtgttta actttttcaa atattgcccc acatcccatt ttatattatg 1380cgatagttca atggtgttta actttttcaa atattgcccc acatcccatt ttatattatg 1380
aagtttgaaa agtttaacta gacatgttgt aataaatttt tatttgagtt gtgtatttta 14401440
ttcattgtgg taggagaaac tagaaagtat taaaataaca agtgaaaagt ctgttttatg 1500ttcattgtgg taggagaaac tagaaagtat taaaataaca agtgaaaagt ctgttttatg 1500
gataaagaat attacgtcaa gtttgaattt gaaattttga attgatttgc ttctttaaat 15601560
ttatgaaacc atctatgaga atattattag cactccattt gtctcatttt atgtgaaggc 1620ttatgaaacc atctatgaga atattattag cactccattt gtctcatttt atgtgaaggc 1620
atctgacttt gcacaaagtt aaaaaatata aagatactta cgacgtgaaa gtttgatata 1680atctgacttt gcacaaagtt aaaaaatata aagatactta cgacgtgaaa gtttgatata 1680
tgccaagtac cataattatc cttttaagca agtgatagtg agagtttaac atttcttttt 1740tgccaagtac cataattatc cttttaagca agtgatagtg agagtttaac atttcttttt 1740
gttctctctt cttataaaag aatgaatttt gtatcaagtg ggtcccaaca agtcattcat 1800gttctctctt cttataaaag aatgaatttt gtatcaagtg ggtcccaaca agtcattcat 1800
taagggtaaa acggggatgc taagattaac taatttccaa aaagagaaag atttaattct 1860taagggtaaa acggggatgc taagattaac taatttccaa aaagagaaag atttaattct 1860
tctaggacag gctaaaaatg gaaagtgttt cacataaaat gagacataga caatataagt 1920tctaggacag gctaaaaatg gaaagtgttt cacataaaat gagacataga caatataagt 1920
ttgtcaaaca ttttgtgacg tcctaaaata gaaagtgtcc tgagatggag gagaactacg 1980ttgtcaaaca ttttgtgacg tcctaaaata gaaagtgtcc tgagatggag gagaactacg 1980
ttatctgttc tcaaaaaagt gtgtatcatg tgatactatg tggatagttt agttcacatg 2040ttatctgttc tcaaaaaagt gtgtatcatg tgatactatg tggatagttt agttcacatg 2040
ttaacaattc atcatttatc agggaatatc ttcctatggg aggtagtgtc aacatgatcg 2100ttaacaattc atcatttatc agggaatatc ttcctatggg aggtagtgtc aacatgatcg 2100
aggagtcact gaagttagcc tatggggaga actcagactt gataaaagat aagcgcattg 2160aggagtcact gaagttagcc tatggggaga actcagactt gataaaagat aagcgcattg 2160
cagcaattca agctttatct gggactggag catgccgaat ttttgcagac ttccaaaggc 2220cagcaattca agctttatct gggactggag catgccgaat ttttgcagac ttccaaaggc 2220
gcttttgtcc tgattcacag atttatattc ctgttcctac atggtctaag taagtgtatt 22802280
cttctgcttc tcggcatctc tacagcatcc taattgatct tcctcaattg gtttttgcac 2340cttctgcttc tcggcatctc tacagcatcc taattgatct tcctcaattg gtttttgcac 2340
attaaaacat gagtatgcaa ataccttcaa aattttctaa tttcctgtca ttactaatat 2400attaaaacat gagtatgcaa ataccttcaa aatttttctaa tttcctgtca ttactaatat 2400
aaaattcttg gcagtcatca taacatttgg agagatgctc atgtccctca gaaaacgtat 2460aaaattcttg gcagtcatca taacatttgg agagatgctc atgtccctca gaaaacgtat 2460
cattattatc atcctgaaac aaaggggttg gacttcactg cactgatgga tgatataaag 2520cattattatc atcctgaaac aaaggggttg gacttcactg cactgatgga tgatataaag 2520
gtaagaaaac atatatttga ggttgttttc catgatggtt tgttctcctg tttgatgata 2580gtaagaaaac atatatttga ggttgttttc catgatggtt tgttctcctg tttgatgata 2580
tagcgtccct cctcaagtgg caattatgtg ttctatcctg acgtatttca attttcattg 2640tagcgtccct cctcaagtgg caattatgtg ttctatcctg acgtatttca attttcattg 2640
acatagaatg ccccaaatgg atcattcttt ctgcttcatg cttgtgctca caatcctact 2700acatagaatg ccccaaatgg atcattcttt ctgcttcatg cttgtgctca caatcctact 2700
ggggtggatc ctacagagga acaatggagg gagatctcgc accacttcaa ggtaatgatt 2760ggggtggatc ctacagagga acaatggagg gagatctcgc accacttcaa ggtaatgatt 2760
ttgtatattt tgtctctcct ttttcttgta ccaagtcata ctaaatttat tacactggtt 2820ttgtatattt tgtctctcct ttttcttgta ccaagtcata ctaaatttat tacactggtt 2820
ccaggtgaag ggacattttg ctttctttga catggcctat caaggatttg ctagtgggaa 2880ccaggtgaag ggacattttg ctttctttga catggcctat caaggatttg ctagtgggaa 2880
tccagagaag gatgctaagg caatcaggat atttcttgaa gatggtcatc cgataggatg 2940tccagagaag gatgctaagg caatcaggat atttcttgaa gatggtcatc cgataggatg 2940
tgcccaatca tatgcaaaaa atatgggact atatggccag agagttggtt gcctaaggta 3000tgcccaatca tatgcaaaaa atatgggact atatggccag agagttggtt gcctaaggta 3000
aactactact cccaccatca tatcttattt gccctagtta caatctggag agtcaaacta 30603060
actttttgtt agaccttagt cggtctattt ttcaaatgtt ctaattccaa aagcagttac 3120actttttgtt agaccttagt cggtctattt ttcaaatgtt ctaattccaa aagcagttac 3120
tactatttcc tgtaaattct agattaatta actttttatt atacctcatt atcttcattt 3180tactatttcc tgtaaattct agattaatta actttttatt atacctcatt atcttcattt 3180
agtagctaat tttaccatat atcatatttt tcatattatc aatatgtaga gagaattatt 32403240
tatttaaata ttttaagttt atttataaaa aattgagttc tttccgataa cttcagttca 33003300
tttccacctc aaagtccaac tcgacgtgaa aagcagaatt ttgctagtca aaacttggat 3360tttccacctc aaagtccaac tcgacgtgaa aagcagaatt ttgctagtca aaacttggat 3360
ccaacaatta tttagaataa attgagttct ttccgataac ttcagttcat ttccacctca 3420ccaacaatta tttagaataa attgagttct ttccgataac ttcagttcat ttccacctca 3420
aagtccaact cgacgagaaa aacagaattt tgctagtcaa aacttggatc caatgaaaag 3480aagtccaact cgacgagaaa aacagaattt tgctagtcaa aacttggatc caatgaaaag 3480
caccaaaatt ttggttttaa attacaaaat aatgtatact ctaggttttt gtcctatgca 3540caccaaaatt ttggttttaa attacaaaat aatgtatact ctaggttttt gtcctatgca 3540
agtgatttta cggtcttaaa ataaagcatc aatcaatccc ttaaacacac acaaagccct 3600agtgatttta cggtcttaaa ataaagcatc aatcaatccc ttaaacacac acaaagccct 3600
ctaatacatt tgctgagatg cttccgcaat tcactgcagt gtggtttgtg aggatgaaaa 3660ctaatacatt tgctgagatg cttccgcaat tcactgcagt gtggtttgtg aggatgaaaa 3660
gcaagcagtg gcagtgaaaa gtcagttgca gcaacttgct aggcccatgt acagtaatcc 3720gcaagcagtg gcagtgaaaa gtcagttgca gcaacttgct aggcccatgt acagtaatcc 3720
acctgttcat ggtgcgctcg ttgtttctac catccttgga gatccaaact tgaaaaagct 3780acctgttcat ggtgcgctcg ttgtttctac catccttgga gatccaaact tgaaaaagct 3780
atggcttggg gaagtgaagg taatgtgatt agaacgagat aaagatttat gattgtataa 38403840
ctatcattgg tattttgacg acagatagga actaggaacc ttgctattaa agatattttc 3900ctatcattgg tattttgacg acagatagga actaggaacc ttgctattaa agatattttc 3900
ttgccttaat tttgaaaaaa gggaattttc tcgctttttt ggaatgtatg agatttggat 39603960
agaactatca catggaaatg ctgtaccatt ttctgctact cacatggaaa agatcctttt 4020agaactatca catggaaatg ctgtaccatt ttctgctact cacatggaaa agatcctttt 4020
cttttgctga tctgtttaag caccaatttg ccatagcttt gttgtcctat attttcagcc 4080cttttgctga tctgtttaag caccaatttg ccatagcttt gttgtcctat attttcagcc 4080
acagaaataa gtctaaacca gtcccaagct ttaataagct ttcattgcgt ggtagtgtca 4140acagaaataa gtctaaacca gtcccaagct ttaataagct ttcattgcgt ggtagtgtca 4140
gccgcataaa ttggtcagtg cagccattaa ctgttttctt catggggcct gttaaccttg 4200gccgcataaa ttggtcagtg cagccattaa ctgttttctt catggggcct gttaaccttg 4200
tatttctcca aggtcaagtt gttggtgttg tggctgcttt ttagctttgt actcattatc 4260tatttctcca aggtcaagtt gttggtgttg tggctgcttt ttagctttgt actcattatc 4260
agagcatcat atgttaaacg taaaggttca atgactaaga gttttttttc cagggcatgg 4320agagcatcat atgttaaacg taaaggttca atgactaaga gttttttttc cagggcatgg 4320
ctgatcgcat catcgggatg agaactgctt taagagaaaa ccttgagaag aagggctcac 4380ctgatcgcat catcgggatg agaactgctt taagagaaaa ccttgagaag aagggctcac 4380
ctctatcgtg ggagcacata accaatcagg tattgaaatc aatgacttct gttgcgttct 4440ctctatcgtg ggagcacata accaatcagg tattgaaatc aatgacttct gttgcgttct 4440
atactagtat ataactatta gaacactatg gctcacctat tgccccatta atactcgata 4500atactagtat ataactatta gaacactatg gctcacctat tgccccatta atactcgata 4500
ctgcctacag attggcatgt tctgctatag tgggatgaca cccgaacaag ttgaccgttt 4560ctgcctacag attggcatgt tctgctatag tgggatgaca cccgaacaag ttgaccgttt 4560
gacaaaagag tatcacatct acatgactcg taatggtcgt atcaggtata atcactcatt 4620gacaaaagag tatcacatct acatgactcg taatggtcgt atcaggtata atcactcatt 4620
cacgaatttc tgcttaatgc tccggtgttc ttgtacgagt taatatctca ttaatttttc 4680cacgaatttc tgcttaatgc tccggtgttc ttgtacgagt taatatctca ttaatttttc 4680
cactatgtta tactgtgtgt tttgtatgtt gtgcagtatg gcaggagtta ctactggaaa 4740cactatgtta tactgtgtgt tttgtatgtt gtgcagtatg gcaggagtta ctactggaaa 4740
tgttggttac ttggcaaacg ctattcatga ggttaccaaa tcagcttaa 4789tgttggttac ttggcaaacg ctattcatga ggttaccaaa tcagcttaa 4789
<210> 8<210> 8
<211> 425<211> 425
<212> БЕЛОК<212> PROTEIN
<213> Nicotiana tabacum<213> Nicotiana tabacum
<400> 8<400> 8
Met Ala Ile Arg Ala Ala Ile Ser Gly Arg Ser Leu Lys His Ile Ser Met Ala Ile Arg Ala Ala Ile Ser Gly Arg Ser Leu Lys His Ile Ser
1 5 10 15 1 5 10 15
Ser Ser Val Gly Ala Arg Ser Leu Ser Ser Leu Trp Arg Asn Val Glu Ser Ser Val Gly Ala Arg Ser Leu Ser Ser Ser Leu Trp Arg Asn Val Glu
20 25 30 20 25 30
Pro Ala Pro Lys Asp Pro Ile Leu Gly Val Thr Glu Ala Phe Leu Ala Pro Ala Pro Lys Asp Pro Ile Leu Gly Val Thr Glu Ala Phe Leu Ala
35 40 45 35 40 45
Asp Pro Thr Pro His Lys Val Asn Val Gly Val Gly Ala Tyr Arg Asp Asp Pro Thr Pro His Lys Val Asn Val Gly Val Gly Ala Tyr Arg Asp
50 55 60 50 55 60
Asp Asn Gly Lys Pro Val Val Leu Glu Cys Val Arg Glu Ala Glu Arg Asp Asn Gly Lys Pro Val Val Leu Glu Cys Val Arg Glu Ala Glu Arg
65 70 75 80 65 70 75 80
Arg Ile Ala Gly Ser Phe Asn Met Glu Tyr Leu Pro Met Gly Gly Ser Arg Ile Ala Gly Ser Phe Asn Met Glu Tyr Leu Pro Met Gly Gly Ser
85 90 95 85 90 95
Val Asn Met Ile Glu Glu Ser Leu Lys Leu Ala Tyr Gly Glu Asn Ser Val Asn Met Ile Glu Glu Ser Leu Lys Leu Ala Tyr Gly Glu Asn Ser
100 105 110 100 105 110
Asp Leu Ile Lys Asp Lys Arg Ile Ala Ala Ile Gln Ala Leu Ser Gly Asp Leu Ile Lys Asp Lys Arg Ile Ala Ala Ile Gln Ala Leu Ser Gly
115 120 125 115 120 125
Thr Gly Ala Cys Arg Ile Phe Ala Asp Phe Gln Arg Arg Phe Cys Pro Thr Gly Ala Cys Arg Ile Phe Ala Asp Phe Gln Arg Arg Phe Cys Pro
130 135 140 130 135 140
Asp Ser Gln Ile Tyr Ile Pro Val Pro Thr Trp Ser Asn His His Asn Asp Ser Gln Ile Tyr Ile Pro Val Pro Thr Trp Ser Asn His His Asn
145 150 155 160 145 150 155 160
Ile Trp Arg Asp Ala His Val Pro Gln Lys Thr Tyr His Tyr Tyr His Ile Trp Arg Asp Ala His Val Pro Gln Lys Thr Tyr His Tyr Tyr His
165 170 175 165 170 175
Pro Glu Thr Lys Gly Leu Asp Phe Thr Ala Leu Met Asp Asp Ile Lys Pro Glu Thr Lys Gly Leu Asp Phe Thr Ala Leu Met Asp Asp Ile Lys
180 185 190 180 185 190
Asn Ala Pro Asn Gly Ser Phe Phe Leu Leu His Ala Cys Ala His Asn Asn Ala Pro Asn Gly Ser Phe Phe Leu Leu His Ala Cys Ala His Asn
195 200 205 195 200 205
Pro Thr Gly Val Asp Pro Thr Glu Glu Gln Trp Arg Glu Ile Ser His Pro Thr Gly Val Asp Pro Thr Glu Glu Gln Trp Arg Glu Ile Ser His
210 215 220 210 215 220
His Phe Lys Val Lys Gly His Phe Ala Phe Phe Asp Met Ala Tyr Gln His Phe Lys Val Lys Gly His Phe Ala Phe Phe Asp Met Ala Tyr Gln
225 230 235 240 225 230 235 240
Gly Phe Ala Ser Gly Asn Pro Glu Lys Asp Ala Lys Ala Ile Arg Ile Gly Phe Ala Ser Gly Asn Pro Glu Lys Asp Ala Lys Ala Ile Arg Ile
245 250 255 245 250 255
Phe Leu Glu Asp Gly His Pro Ile Gly Cys Ala Gln Ser Tyr Ala Lys Phe Leu Glu Asp Gly His Pro Ile Gly Cys Ala Gln Ser Tyr Ala Lys
260 265 270 260 265 270
Asn Met Gly Leu Tyr Gly Gln Arg Val Gly Cys Leu Ser Val Val Cys Asn Met Gly Leu Tyr Gly Gln Arg Val Gly Cys Leu Ser Val Val Cys
275 280 285 275 280 285
Glu Asp Glu Lys Gln Ala Val Ala Val Lys Ser Gln Leu Gln Gln Leu Glu Asp Glu Lys Gln Ala Val Ala Val Lys Ser Gln Leu Gln Gln Leu
290 295 300 290 295 300
Ala Arg Pro Met Tyr Ser Asn Pro Pro Val His Gly Ala Leu Val Val Ala Arg Pro Met Tyr Ser Asn Pro Val His Gly Ala Leu Val Val
305 310 315 320 305 310 315 320
Ser Thr Ile Leu Gly Asp Pro Asn Leu Lys Lys Leu Trp Leu Gly Glu Ser Thr Ile Leu Gly Asp Pro Asn Leu Lys Lys Leu Trp Leu Gly Glu
325 330 335 325 330 335
Val Lys Gly Met Ala Asp Arg Ile Ile Gly Met Arg Thr Ala Leu Arg Val Lys Gly Met Ala Asp Arg Ile Ile Gly Met Arg Thr Ala Leu Arg
340 345 350 340 345 350
Glu Asn Leu Glu Lys Lys Gly Ser Pro Leu Ser Trp Glu His Ile Thr Glu Asn Leu Glu Lys Lys Gly Ser Pro Leu Ser Trp Glu His Ile Thr
355 360 365 355 360 365
Asn Gln Ile Gly Met Phe Cys Tyr Ser Gly Met Thr Pro Glu Gln Val Asn Gln Ile Gly Met Phe Cys Tyr Ser Gly Met Thr Pro Glu Gln Val
370 375 380 370 375 380
Asp Arg Leu Thr Lys Glu Tyr His Ile Tyr Met Thr Arg Asn Gly Arg Asp Arg Leu Thr Lys Glu Tyr His Ile Tyr Met Thr Arg Asn Gly Arg
385 390 395 400 385 390 395 400
Ile Ser Met Ala Gly Val Thr Thr Gly Asn Val Gly Tyr Leu Ala Asn Ile Ser Met Ala Gly Val Thr Thr Gly Asn Val Gly Tyr Leu Ala Asn
405 410 415 405 410 415
Ala Ile His Glu Val Thr Lys Ser Ala Ala Ile His Glu Val Thr Lys Ser Ala
420 425 420 425
<210> 9<210> 9
<211> 4551<211> 4551
<212> ДНК<212> DNA
<213> Nicotiana tabacum<213> Nicotiana tabacum
<400> 9<400> 9
atggcaaatt cctccaattc tgtttttgcg catgttgttc gtgctcctga agatcccatc 60atggcaaatt cctccaattc tgtttttgcg catgttgttc gtgctcctga agatcccatc 60
ttaggagtac gtccctttcc actctttcta ttttacattt ccactgaata tgtttcttct 120ttaggagtac gtccctttcc actctttcta ttttacattt ccactgaata tgtttcttct 120
gtggctcctt taataatctt ccgtaaatat actattagtg gatttgataa gctacttctc 180gtggctcctt taataatctt ccgtaaatat actattagtg gatttgataa gctacttctc 180
tctccctctc tcttttattt tcttattttg ggttagatta aaatgaacat taattaatga 240tctccctctc tctttttttt tcttattttg ggttagatta aaatgaacat taattaatga 240
tcagatgatt tggttaaaga tgatatctag gagatcggca taaataagtt gattggaatg 300tcagatgatt tggttaaaga tgatatctag gagatcggca taaataagtt gattggaatg 300
atcgctatag ggtttcctat tgtatgcatt ggatcatgga tgtgtgcgct aattatttaa 360360
tagtacttct ttctttttac tgtgatctgg caattcctta ttttattcct ggtgtagttg 420tagtacttct ttctttttac tgtgatctgg caattcctta tttttattcct ggtgtagttg 420
atgaaaggtg tagatttgat tctttaactt gctctattga gaaggtaatt tgtgcttctc 480atgaaaggtg tagatttgat tctttaactt gctctattga gaaggtaatt tgtgcttctc 480
aagtgtttat taatgttgtt ttcttctgtt gtgttacttc attaaaacag gtcacagttg 540aagtgtttat taatgttgtt ttcttctgtt gtgttacttc attaaaacag gtcacagttg 540
cttataacaa agataccagc ccagtgaagt tgaatttggg tgttggcgca tatcgcactg 600cttataacaa agataccagc ccagtgaagt tgaatttggg tgttggcgca tatcgcactg 600
aggtctgcca cttctacttt gtctcgttgt tctttattat tattattttt ttattatagc 660aggtctgcca cttctacttt gtctcgttgt tctttattat tattattttt ttattatagc 660
caaaaaaagt tgccccttga atggatttgg tcctgctatg tgttgaatcc ttggttaagt 720caaaaaaagt tgccccttga atggatttgg tcctgctatg tgttgaatcc ttggttaagt 720
ttttctttaa taggctcctt cacaaggata gaaaattgta gacactgatg cttacacatt 780ttttctttaa taggctcctt cacaaggata gaaaattgta gacactgatg cttacacatt 780
agtaatattt tttcccctga tgcataatga agtgaaacca cttgtgcttc taaaaaatca 840agtaatattt tttcccctga tgcataatga agtgaaacca cttgtgcttc taaaaaatca 840
tactttgggg caaggtgaag tacacatttt tataagtggt tgtttttttc ttcaatcttg 900tactttgggg caaggtgaag tacacatttt tataagtggt tgtttttttc ttcaatcttg 900
agttgaatgt tagtgttaag taggagccgc aaacgggcgg gtcgggtcgg atttggttca 960agttgaatgt tagtgttaag taggagccgc aaacgggcgg gtcgggtcgg atttggttca 960
gatcgaaaat gggtaatgaa aaaacaggta aattatctga ctcgacccat atttaatacg 1020gatcgaaaat gggtaatgaa aaaacaggta aattatctga ctcgacccat atttaatacg 1020
gataaaaaca ggttaaccgg cggataatat gggtaaccat attattcatg tcttcttgca 1080gtaaaaaca ggttaaccgg cggataatat gggtaaccat attattcatg tcttcttgca 1080
tatgatcaat tatgggagaa ttcttagcct caaatgggaa cccccaattt gaggctttac 1140tatgatcaat tatgggagaa ttcttagcct caaatgggaa cccccaattt gaggctttac 1140
aaatttaaaa gttagaccca ttggttaacc attttctaaa tggataatat ggttcttatc 1200aaatttaaaa gttagaccca ttggttaacc attttctaaa tggataatat ggttcttatc 1200
catatttgac ccatttttaa aaagttcatt atccaaccca ttttttagtg gataatatgg 1260catatttgac ccatttttaa aaagttcatt atccaaccca ttttttagtg gataatatgg 1260
gtgtttaact gatttctttt aaccattttg acacccctag tgttaagctt gaaaacgact 1320gtgtttaact gatttctttt aaccattttg acacccctag tgttaagctt gaaaacgact 1320
aatgcatagt ctgatgacaa cttgcaggaa ggaaagcccc ttgttcttaa tgtggtgaga 1380aatgcatagt ctgatgacaa cttgcaggaa ggaaagcccc ttgttcttaa tgtggtgaga 1380
cgggctgaac aaatgctcgt caatgacacg taacttgcca aattagaaac tagcttacag 1440cgggctgaac aaatgctcgt caatgacacg taacttgcca aattagaaac tagcttacag 1440
attttctttt gagatatgat cacctgatac caagattgga atctaaggct gctatgatgc 1500attttctttt gagatatgat cacctgatac caagattgga atctaaggct gctatgatgc 1500
aggtctcggg tgaaggagta tctctcaatt actggactag cggattttaa caaactgagt 1560aggtctcggg tgaaggagta tctctcaatt actggactag cggattttaa caaactgagt 1560
gcaaagctta tatttggtgc tgacaggttt ggagattttt tggtgcagtt gctcttgata 16201620
aatgcttgag tcaatttttt ttaaaaaaaa tgctcactat ccatgtcgct ctatttaaac 1680aatgcttgag tcaatttttt ttaaaaaaaa tgctcactat ccatgtcgct ctatttaaac 1680
ctatcttgcc aaaccacttg tataaatgaa aatgagccgt cgatattctt ccttccatct 1740ctatcttgcc aaaccacttg tataaatgaa aatgagccgt cgatattctt ccttccatct 1740
agtttgatat ttgaattaga gattgttgct aaaagggaat gctttatctc tacagcgtag 1800agtttgatat ttgaattaga gattgttgct aaaagggaat gctttatctc tacagcgtag 1800
agtaactgaa tacctgttaa acatgttcct ccgtatttca tcttattatg atgccttgca 1860agtaactgaa tacctgttaa acatgttcct ccgtatttca tcttattatg atgccttgca 1860
tctgaagaaa attgttctag agttaacttt ctctcctctt tgttgtactg attatctgtg 1920tctgaagaaa attgttctag agttaacttt ctctcctctt tgttgtactg attatctgtg 1920
tgtggtgaac gcgatatcag gaaatatgtg tcttctgtca ctattactcc ttgttaagtc 1980tgtggtgaac gcgatatcag gaaatatgtg tcttctgtca ctattactcc ttgttaagtc 1980
atatgtaatt gacttgttat gatatcaaca gatttactta tgtttagatg tagtttaaat 2040atatgtaatt gacttgttat gatatcaaca gatttactta tgtttagatg tagtttaaat 2040
gctttttgtg ctgttttgtt gcttatacag ccctgccatt caagagaaca gggtgactac 2100gctttttgtg ctgttttgtt gcttatacag ccctgccatt caagagaaca gggtgactac 2100
tgttcagtgc ttgtcgggca caggttcttt gagggttggg gctgaatttc tggctaagca 2160tgttcagtgc ttgtcgggca caggttcttt gagggttggg gctgaatttc tggctaagca 2160
ttatcatgaa gttagtattc cttgctctct ttccctttat atgtctaaat caaatggaca 2220ttatcatgaa gttagtattc cttgctctct ttccctttat atgtctaaat caaatggaca 2220
cttgtataag cttctactgt ttgttttgtt gccagcatac catatatata ccacagccaa 2280cttgtataag cttctactgt ttgttttgtt gccagcatac catatatata ccacagccaa 2280
catggggaaa ccatccgaag gttttcactt tagccgggct ttcagtaaaa tattaccgtt 2340catggggaaa ccatccgaag gttttcactt tagccgggct ttcagtaaaa tattaccgtt 2340
actacgaccc agcaacacga ggcctggatt tccaaggtac tactgtaatc actgttctta 2400actacgaccc agcaacacga ggcctggatt tccaaggtac tactgtaatc actgttctta 2400
aagttctaca gttgtaagta agagccgatt tctctttttt atggacaagt gaactttctc 2460aagttctaca gttgtaagta agagccgatt tctctttttt atggacaagt gaactttctc 2460
ctggtcgtgt ctagaaagat ctatatttta tgtgtagcta gcacaggatc tttatttatt 2520ctggtcgtgt ctagaaagat ctatatttta tgtgtagcta gcacaggatc tttatttatt 2520
taattttgta ttctcttggt aaagatataa gcatagttta tctgtggctt ttcctgtatt 2580taattttgta ttctcttggt aaagatataa gcatagttta tctgtggctt ttcctgtatt 2580
tgggtgttgc atatcaaatt taatcatgaa ccctgtagga cttttggatg atcttgctgc 2640tgggtgttgc atatcaaatt taatcatgaa ccctgtagga cttttggatg atcttgctgc 2640
tgcacccgct ggagcaatag ttcttctcca tgcatgtgct cataacccaa ctggcgttga 2700tgcacccgct ggagcaatag ttcttctcca tgcatgtgct cataacccaa ctggcgttga 2700
tccaacaaat gaccagtggg agaaaatcag gcagttgatg aggtccaagg gcctgttgcc 2760tccaacaaat gaccagtgg agaaaatcag gcagttgatg aggtccaagg gcctgttgcc 2760
tttctttgac agtgcttacc aggtaaagct tatgatggga ttttgaattc aagtgatact 2820tttctttgac agtgcttacc aggtaaagct tatgatggga ttttgaattc aagtgatact 2820
tcgttaagaa tgattaccaa ataatttgaa gcgccaaact atgtattaat gggctgccca 2880tcgttaagaa tgattaccaa ataatttgaa gcgccaaact atgtattaat gggctgccca 2880
acggaccctt actataatga atatttttga tattgcaggg ttttgccagt ggcaacctag 2940acggaccctt actataatga atatttttga tattgcaggg ttttgccagt ggcaacctag 2940
atgcagatgc acaatctgtt cgcatgtttg tggctgatgg tggtgaatgt cttgcagctc 3000atgcagatgc acaatctgtt cgcatgtttg tggctgatgg tggtgaatgt cttgcagctc 3000
agagttatgc caaaaacatg ggactgtatg gggagcgtgt tggtgccctt agcattgtaa 3060agagttatgc caaaaacatg ggactgtatg gggagcgtgt tggtgccctt agcattgtaa 3060
gtccttttgt cggttgtaat tgctttccct ttttagtaag cgataaaatt ggtggctgaa 3120gtccttttgt cggttgtaat tgctttccct ttttagtaag cgataaaatt ggtggctgaa 3120
gaactatcca tggctatatc atgctatcta tgtctaaaga tgattttcct tgaaagcata 3180gaactatcca tggctatatc atgctatcta tgtctaaaga tgattttcct tgaaagcata 3180
attcaggtta tattccctag aaggctaaaa agaagttgtt ctgatggtac aatgaacaca 3240attcaggtta tattccctag aaggctaaaa agaagttgtt ctgatggtac aatgaacaca 3240
gtctctagag atattgaaag ccaaattttt gaatatggct tcccctttga ttgtaattgg 3300gtctctagag atattgaaag ccaaattttt gaatatggct tcccctttga ttgtaattgg 3300
aaaacaaaga gaaggacaga gtggaattag taccggattg tatgtttagg aaaaagtgtc 33603360
attttgtttg agttttatca gacagacact aaaagctgac taacagtaca ataaaatttt 34203420
gtgttgtgtt ataggtttgc aaagacgcag atgttgcaag cagagtcgaa agccagctaa 3480gtgttgtgtt ataggtttgc aaagacgcag atgttgcaag cagagtcgaa agccagctaa 3480
agctggttat caggccaatg tactctaatc caccaattca tggtgcgtct attgttgcta 3540agctggttat caggccaatg tactctaatc caccaattca tggtgcgtct attgttgcta 3540
ctatactcaa ggacaggttt gtgcaactat ttacaagatt ctgttttgct gttagtagat 3600ctatactcaa ggacaggttt gtgcaactat ttacaagatt ctgttttgct gttagtagat 3600
gctatacctt ctacattttg atgtggtttc tcatctaatg gtgatagaca aatgtacgat 3660gctatacctt ctacattttg atgtggtttc tcatctaatg gtgatagaca aatgtacgat 3660
gaatggacaa ttgagctgaa agcaatggcc gacaggatta ttagcatgcg ccaacaactc 3720gaatggacaa ttgagctgaa agcaatggcc gacaggatta ttagcatgcg ccaacaactc 3720
tttgatgcct tgcaagctcg aggtatttga tcttcatatt tgttctttct ggggaagcat 3780tttgatgcct tgcaagctcg aggtatttga tcttcatatt tgttctttct ggggaagcat 3780
actgtattct gtatgatggg tttgactgct actgcaatag gagctttttc ctgaaaagta 3840actgtattct gtatgatggg tttgactgct actgcaatag gagctttttc ctgaaaagta 3840
ccatggtgaa acaaccacgg caactaaatc ttttgacttc attgttcagt ttagtgctaa 3900ccatggtgaa acaaccacgg caactaaatc ttttgacttc attgttcagt ttagtgctaa 3900
tgtaagtttt attctgttat gcaggtacga caggtgattg gagtcatatc atcaagcaaa 3960tgtaagtttt attctgttat gcaggtacga caggtgattg gagtcatatc atcaagcaaa 3960
ttggaatgtt tactttcaca ggattaaata ctgagcaagt ttcattcatg actagagagc 4020ttggaatgtt tactttcaca ggattaaata ctgagcaagt ttcattcatg actagagagc 4020
atcacattta catgacatct gatgggtaag gacatctgac tattgatatt ttttttattt 40804080
gtttagtttg ttactttggg ttgctttttt ctcagtagaa acttaaataa ttggaactta 4140gtttagtttg ttactttgggg ttgctttttt ctcagtagaa acttaaataa ttggaactta 4140
gaagtccttc gttgattatt tcggcttgaa ttctttaata aggagaattt cagatttata 4200gaagtccttc gttgattatt tcggcttgaa ttctttaata aggagaattt cagatttata 4200
gcttcagttt ggagaggaag cataaacaag tctgtcatcc atacttaaaa tttacagaaa 42604260
aaagtgcagt tctgttttcc cccctcccag attagactaa ttcccaaaag aacttacctt 4320aaagtgcagt tctgttttcc cccctcccag attagactaa ttcccaaaag aacttacctt 4320
caatctatgg aacatttagt attctggtat cagttgaaac atctctttgt tgaagttaag 4380caatctatgg aacatttagt attctggtat cagttgaaac atctctttgt tgaagttaag 4380
attttggtta aaaagatctt catctctagt aacattttct acattccatt tttagaagga 4440attttggtta aaaagatctt catctctagt aacattttct acattccatt tttgaagga 4440
atgattttct cctttctcat ttgcaggaga attagcatgg caggccttag ttctcgcaca 4500atgattttct cctttctcat ttgcaggaga attagcatgg caggccttag ttctcgcaca 4500
attcctcatc ttgccgatgc catacatgct gctgttacca aagcggccta a 4551attcctcatc ttgccgatgc catacatgct gctgttacca aagcggccta a 4551
<210> 10<210> 10
<211> 446<211> 446
<212> БЕЛОК<212> PROTEIN
<213> Nicotiana tabacum<213> Nicotiana tabacum
<400> 10<400> 10
Met Ala Asn Ser Ser Asn Ser Val Phe Ala His Val Val Arg Ala Pro Met Ala Asn Ser Ser Asn Ser Val Phe Ala His Val Val Arg Ala Pro
1 5 10 15 1 5 10 15
Glu Asp Pro Ile Leu Gly Val Thr Val Ala Tyr Asn Lys Asp Thr Ser Glu Asp Pro Ile Leu Gly Val Thr Val Ala Tyr Asn Lys Asp Thr Ser
20 25 30 20 25 30
Pro Val Lys Leu Asn Leu Gly Val Gly Ala Tyr Arg Thr Glu Glu Gly Pro Val Lys Leu Asn Leu Gly Val Gly Ala Tyr Arg Thr Glu Glu Gly
35 40 45 35 40 45
Lys Pro Leu Val Leu Asn Val Val Arg Arg Ala Glu Gln Met Leu Val Lys Pro Leu Val Leu Asn Val Val Arg Arg Ala Glu Gln Met Leu Val
50 55 60 50 55 60
Asn Asp Thr Ser Arg Val Lys Glu Tyr Leu Ser Ile Thr Gly Leu Ala Asn Asp Thr Ser Arg Val Lys Glu Tyr Leu Ser Ile Thr Gly Leu Ala
65 70 75 80 65 70 75 80
Asp Phe Asn Lys Leu Ser Ala Lys Leu Ile Phe Gly Ala Asp Ser Pro Asp Phe Asn Lys Leu Ser Ala Lys Leu Ile Phe Gly Ala Asp Ser Pro
85 90 95 85 90 95
Ala Ile Gln Glu Asn Arg Val Thr Thr Val Gln Cys Leu Ser Gly Thr Ala Ile Gln Glu Asn Arg Val Thr Thr Val Gln Cys Leu Ser Gly Thr
100 105 110 100 105 110
Gly Ser Leu Arg Val Gly Ala Glu Phe Leu Ala Lys His Tyr His Glu Gly Ser Leu Arg Val Gly Ala Glu Phe Leu Ala Lys His Tyr His Glu
115 120 125 115 120 125
His Thr Ile Tyr Ile Pro Gln Pro Thr Trp Gly Asn His Pro Lys Val His Thr Ile Tyr Ile Pro Gln Pro Thr Trp Gly Asn His Pro Lys Val
130 135 140 130 135 140
Phe Thr Leu Ala Gly Leu Ser Val Lys Tyr Tyr Arg Tyr Tyr Asp Pro Phe Thr Leu Ala Gly Leu Ser Val Lys Tyr Tyr Arg Tyr Tyr Asp Pro
145 150 155 160 145 150 155 160
Ala Thr Arg Gly Leu Asp Phe Gln Gly Thr Thr Val Ile Thr Val Leu Ala Thr Arg Gly Leu Asp Phe Gln Gly Thr Thr Val Ile Thr Val Leu
165 170 175 165 170 175
Lys Val Leu Gln Leu Tyr Lys His Ser Leu Ser Val Ala Phe Pro Val Lys Val Leu Gln Leu Tyr Lys His Ser Leu Ser Val Ala Phe Pro Val
180 185 190 180 185 190
Phe Gly Cys Cys Ile Ser Asn Leu Ile Met Asn Pro Val Gly Leu Leu Phe Gly Cys Cys Ile Ser Asn Leu Ile Met Asn Pro Val Gly Leu Leu
195 200 205 195 200 205
Asp Asp Leu Ala Ala Ala Pro Ala Gly Ala Ile Val Leu Leu His Ala Asp Asp Leu Ala Ala Ala Pro Ala Gly Ala Ile Val Leu Leu His Ala
210 215 220 210 215 220
Cys Ala His Asn Pro Thr Gly Val Asp Pro Thr Asn Asp Gln Trp Glu Cys Ala His Asn Pro Thr Gly Val Asp Pro Thr Asn Asp Gln Trp Glu
225 230 235 240 225 230 235 240
Lys Ile Arg Gln Leu Met Arg Ser Lys Gly Leu Leu Pro Phe Phe Asp Lys Ile Arg Gln Leu Met Arg Ser Lys Gly Leu Leu Pro Phe Phe Asp
245 250 255 245 250 255
Ser Ala Tyr Gln Gly Phe Ala Ser Gly Asn Leu Asp Ala Asp Ala Gln Ser Ala Tyr Gln Gly Phe Ala Ser Gly Asn Leu Asp Ala Asp Ala Gln
260 265 270 260 265 270
Ser Val Arg Met Phe Val Ala Asp Gly Gly Glu Cys Leu Ala Ala Gln Ser Val Arg Met Phe Val Ala Asp Gly Gly Glu Cys Leu Ala Ala Gln
275 280 285 275 280 285
Ser Tyr Ala Lys Asn Met Gly Leu Tyr Gly Glu Arg Val Gly Ala Leu Ser Tyr Ala Lys Asn Met Gly Leu Tyr Gly Glu Arg Val Gly Ala Leu
290 295 300 290 295 300
Ser Ile Val Cys Lys Asp Ala Asp Val Ala Ser Arg Val Glu Ser Gln Ser Ile Val Cys Lys Asp Ala Asp Val Ala Ser Arg Val Glu Ser Gln
305 310 315 320 305 310 315 320
Leu Lys Leu Val Ile Arg Pro Met Tyr Ser Asn Pro Pro Ile His Gly Leu Lys Leu Val Ile Arg Pro Met Tyr Ser Asn Pro Pro Ile His Gly
325 330 335 325 330 335
Ala Ser Ile Val Ala Thr Ile Leu Lys Asp Arg Gln Met Tyr Asp Glu Ala Ser Ile Val Ala Thr Ile Leu Lys Asp Arg Gln Met Tyr Asp Glu
340 345 350 340 345 350
Trp Thr Ile Glu Leu Lys Ala Met Ala Asp Arg Ile Ile Ser Met Arg Trp Thr Ile Glu Leu Lys Ala Met Ala Asp Arg Ile Ile Ser Met Arg
355 360 365 355 360 365
Gln Gln Leu Phe Asp Ala Leu Gln Ala Arg Gly Thr Thr Gly Asp Trp Gln Gln Leu Phe Asp Ala Leu Gln Ala Arg Gly Thr Thr Gly Asp Trp
370 375 380 370 375 380
Ser His Ile Ile Lys Gln Ile Gly Met Phe Thr Phe Thr Gly Leu Asn Ser His Ile Ile Lys Gln Ile Gly Met Phe Thr Phe Thr Gly Leu Asn
385 390 395 400 385 390 395 400
Thr Glu Gln Val Ser Phe Met Thr Arg Glu His His Ile Tyr Met Thr Thr Glu Gln Val Ser Phe Met Thr Arg Glu His His Ile Tyr Met Thr
405 410 415 405 410 415
Ser Asp Gly Arg Ile Ser Met Ala Gly Leu Ser Ser Arg Thr Ile Pro Ser Asp Gly Arg Ile Ser Met Ala Gly Leu Ser Ser Ser Arg Thr Ile Pro
420 425 430 420 425 430
His Leu Ala Asp Ala Ile His Ala Ala Val Thr Lys Ala Ala His Leu Ala Asp Ala Ile His Ala Ala Val Thr Lys Ala Ala
435 440 445 435 440 445
<210> 11<210> 11
<211> 4176<211> 4176
<212> ДНК<212> DNA
<213> Nicotiana tabacum<213> Nicotiana tabacum
<400> 11<400> 11
atggcaaatt cctccaattc tgtttttgcc catgttgttc gtgctcctga agatcccatc 60atggcaaatt cctccaattc tgtttttgcc catgttgttc gtgctcctga agatcccatc 60
ttaggagtac ctccctttcc actctttcta ttttacattt ccactgaata tgtttcttct 120ttaggagtac ctccctttcc actctttcta ttttacattt ccactgaata tgtttcttct 120
gtggctcctt taataatctt ccgtaaatat attattagtg gatttgataa gctacttctc 180gtggctcctt taataatctt ccgtaaatat attattagtg gatttgataa gctacttctc 180
tctctctctc tctctctctc tctctctctc tctctctctc tctctctctt ttattttctt 240tctctctctc tctctctctc tctctctctc tctctctctc tctctctctt ttatttttctt 240
attttgggtt agattagaat gaacattaat taatgatcag atgattaggt taaaaatgat 300300
atcttggaga tcggcataaa taagttgatt ggaatgatcg ctatagggtt acctattgta 360atcttggaga tcggcataaa taagttgatt ggaatgatcg ctatagggtt acctattgta 360
tgcattggat catggatgtg tttactaatt atttaatacc tctttctttt tactgtgatc 420tgcattggat catggatgtg tttactaatt atttaatacc tctttctttt tactgtgatc 420
tggcaattcc ttattttatt cctggtgtgg ttgatggaag ggtgtagatt tgattcttta 480tggcaattcc ttattttatt cctggtgtgg ttgatggaag ggtgtagatt tgattcttta 480
acttgctcta ttgagaagat aatttgttct tctcaagtgt ttagtaatgg tttttttcct 540acttgctcta ttgagaagat aatttgttct tctcaagtgt ttagtaatgg tttttttcct 540
gttgtgctac ttcattaaaa caggtcacag ttgcttataa caaagatacc agcccggtga 600gttgtgctac ttcattaaaa caggtcacag ttgcttataa caaagatacc agcccggtga 600
agttgaattt gggtgttggc gcatatcgca ctgaggtctg ccacttctac tttgtctcgt 660agttgaattt gggtgttggc gcatatcgca ctgaggtctg ccacttctac tttgtctcgt 660
tattctttat tttttatttt ttattataac caaaataagt tgccccttga atggatttgg 720tattctttat tttttatttt ttattataac caaaataagt tgccccttga atggatttgg 720
tcctgctatg ttttgttgaa tccttggtta agtttttctt taataggctc cttcacaagg 780tcctgctatg ttttgttgaa tccttggtta agttttttctt taataggctc cttcacaagg 780
atacaaaatt gtagacactg atgcatacac attaatattt tttttccctg atgcataatg 840atacaaaatt gtagacactg atgcatacac attaatattt ttttttccctg atgcataatg 840
aagtgaaacc acttgatttt ataagtggtt gtttttttct tcaatcttga gttggatgtt 900aagtgaaacc acttgatttt ataagtggtt gttttttttct tcaatcttga gttggatgtt 900
agtgttaagc ttgaaaatta tgttctacta atgcatagtc cgatgacaac ttgcaggaag 960agtgttaagc ttgaaaatta tgttctacta atgcatagtc cgatgacaac ttgcaggaag 960
gaaagcccct tgttcttaat gtggtgagac gagctgaaca aatgctcgtc aatgacacgt 1020gaaagcccct tgttcttaat gtggtgagac gagctgaaca aatgctcgtc aatgacacgt 1020
aacttgccaa attagaaact agcttacaga ttttcttttg agatatgatc acctgatgcc 1080aacttgccaa attagaaact agcttacaga ttttcttttg agatatgatc acctgatgcc 1080
atgattggaa tctaaggctg atatgatgca ggtctcgggt gaaggagtat ctctcaatta 11401140
ctggactagc ggattttaac aaactgagtg caaagcttat atttggatct gacaggtttg 1200ctggactagc ggattttaac aaactgagtg caaagcttat atttggatct gacaggtttg 1200
gagaattttt ggtgcagttg ctcttgataa atgcttgaat caaaaatata aaaaaatgct 1260gagaattttt ggtgcagttg ctcttgataa atgcttgaat caaaaatata aaaaaatgct 1260
cactatccat gtcgctccag ttaaacctat cttgccaaac cacttgtata aaagaaaatg 1320cactatccat gtcgctccag ttaaacctat cttgccaaac cacttgtata aaagaaaatg 1320
agccttcaat attcttcctt ccatctagtt tgatatttga atgagagatt gttgctaaaa 13801380
gggaatgctt tatctctaca aagtagagta actgaatacc tgttaaaaca tattcctccg 1440gggaatgctt tatctctaca aagtagagta actgaatacc tgttaaaaca tattcctccg 1440
tatttcatct tattatgatg ccttgcatca gaagaaaatt gttctagagt taactttctc 1500tatttcatct tattatgatg ccttgcatca gaagaaaatt gttctagagt taactttctc 1500
tcctctttgt tgtactgact ttctgtgtaa ggtgaacgtg atatcaggaa atatgtgtct 1560tcctctttgt tgtactgact ttctgtgtaa ggtgaacgtg atatcaggaa atatgtgtct 1560
tctatcacta ttactccttg ttaagtcata tgtaagatat cagcagattt acttatcttt 16201620
agatgtagtt taaatgcttt ttgtgctgtt ttgttgctga tacagccctg ccattcaaga 1680agatgtagtt taaatgcttt ttgtgctgtt ttgttgctga tacagccctg ccattcaaga 1680
gaacagggtg actactgttc agtgcttgtc gggcacaggt tctttgaggg ttggggctga 1740gaacagggtg actactgttc agtgcttgtc gggcacaggt tctttgaggg ttggggctga 1740
gtttctggct aagcattatc atgaagttag tattccttgc tctctttccc tttatatgtc 1800gtttctggct aagcattatc atgaagttag tattccttgc tctctttccc tttatatgtc 1800
taaatcaaat ggacacttct ataagcttct actgtttgtt ttgttgccag catactatat 1860taaatcaaat ggacacttct ataagcttct actgtttgtt ttgttgccag catactatat 1860
atataccaca gccaacatgg ggaaaccatc cgaaggtttt cactttagct gggctttcag 1920atataccaca gccaacatgg ggaaaccatc cgaaggtttt cactttagct gggctttcag 1920
taaaatatta tcgttactac gacccagcaa cacgaggcct ggatttccaa ggtactactg 1980taaaatatta tcgttactac gacccagcaa cacgaggcct ggatttccaa ggtactactg 1980
taatcaatgt tcttaaagtt ctacagttgt aagtaagaac cgatttctct ttttcatgga 2040taatcaatgt tcttaaagtt ctacagttgt aagtaagaac cgatttctct ttttcatgga 2040
caagtgaact tgctcctggt cgtgtctaga aagatctata tattatgtgt agctagcaca 2100caagtgaact tgctcctggt cgtgtctaga aagatctata tattatgtgt agctagcaca 2100
ggatctttat ttatttaatt ttgtattctg ttggtaaaga tataagcata gtttatctgt 21602160
ggcttctcct gtatttgggt gttgcgtatc aaatttaatc atgaaccctg taggactttt 2220ggcttctcct gtatttggggt gttgcgtatc aaatttaatc atgaaccctg taggactttt 2220
ggatgatctt gctgctgcac ccgctggagt aatagttctt ctccatgcat gtgctcataa 2280ggatgatctt gctgctgcac ccgctggagt aatagttctt ctccatgcat gtgctcataa 2280
cccaactggc gttgatccaa caaatgacca gtgggagaaa atcaggcagt tgatgaggtc 2340cccaactggc gttgatccaa caaatgacca gtgggagaaa atcaggcagt tgatgaggtc 2340
caaggggctg ttacctttct ttgacagtgc ttaccaggta aagcttatga tgggattttg 2400caaggggctg ttacctttct ttgacagtgc ttaccaggta aagcttatga tgggattttg 2400
aattcaagtg atacttcgtt aagaatgatt accaaataat ttgaagcccc aaactatgta 2460aattcaagtg atacttcgtt aagaatgatt accaaataat ttgaagcccc aaactatgta 2460
ttaatgggct gctcaatgga cccctactat aatgaatatt tttgatattg cagggttttg 25202520
ccactggcaa cctagatgca gatgcacaat ctgttcgcat gtttgtggct gatggtggtg 2580ccactggcaa cctagatgca gatgcacaat ctgttcgcat gtttgtggct gatggtggtg 2580
aatgtcttgc agctcagagt tatgccaaaa acatgggact gtatggggag cgtgttggtg 2640aatgtcttgc agctcagagt tatgccaaaa acatgggact gtatggggag cgtgttggtg 2640
cccttagcat tgtaagtcct tttgtcggtt gtaattgctt tcccttttta ataagcaata 2700cccttagcat tgtaagtcct tttgtcggtt gtaattgctt tcccttttta ataagcaata 2700
aaattgcttt ccctttttaa taagcaatat agcatgatat ccatggctat atcatgctat 2760aaattgcttt ccctttttaa taagcaatat agcatgatat ccatggctat atcatgctat 2760
ttatgtctaa agatgatttt ttctttggaa gcataattca ggttatattc cctaaaaggc 2820ttatgtctaa agatgatttt ttctttggaa gcataattca ggttatattc cctaaaaggc 2820
taaaaagagg ttgttctgtt ggtacaatga acacagtctc tagagatatt gaaagccaat 2880taaaaagagg ttgttctgtt ggtacaatga acacagtctc tagagatatt gaaagccaat 2880
tttttgaaga tggcttccac ttagattgta attggaaaag aaagagaagg acaaagtgga 2940tttttgaaga tggcttccac ttagattgta attggaaaag aaagagaagg acaaagtgga 2940
attagtaccg gattgtatgt ttaggaaaaa gtgtcgtttt ttttgagttt tatcagacag 3000attagtaccg gattgtatgt ttaggaaaaa gtgtcgtttt ttttgagttt tatcagacag 3000
gtactaaaag ctgactaaca ctacaataaa attttgtgtt gtgttatagg tttgcaaaga 30603060
tgcagatgtt gcaagcagag tcgaaagcca gctaaagctg gttatcaggc caatgtactc 3120tgcagatgtt gcaagcagag tcgaaagcca gctaaagctg gttatcaggc caatgtactc 3120
taatccacca attcatggtg cgtctattgt tgctactata ctcaaggaca ggtttgtaca 3180taatccacca attcatggtg cgtctattgt tgctactata ctcaaggaca ggtttgtaca 3180
actatataca agattctgtt ttgttgttag tagatgctat accttctaca ttttgatgtg 3240actatataca agattctgtt ttgttgttag tagatgctat accttctaca ttttgatgtg 3240
gttgctcatc taatggtgat agacaaatgt acgatgaatg gacaattgag ctgaaagcaa 3300gttgctcatc taatggtgat agacaaatgt acgatgaatg gacaattgag ctgaaagcaa 3300
tggccgacag gattattagc atgcgccaac aactctttga tgccttgcaa gctcgaggta 3360tggccgacag gattattagc atgcgccaac aactctttga tgccttgcaa gctcgaggta 3360
tctgatcttc atatttgttc tttctaggga agcatactgt attctgtatg atgggtttga 34203420
ctgctactgc aataggaact ttttctggaa aagtgccagg gtgaaagaac cacggcaact 3480ctgctactgc aataggaact ttttctggaa aagtgccagg gtgaaagaac cacggcaact 3480
aaatcttctg acttcattgt tcagtttagt gctaatgtaa gttttattct gttatgcagg 3540aaatcttctg acttcattgt tcagtttagt gctaatgtaa gttttattct gttatgcagg 3540
tacagcaggt gattggagtc atatcatcaa acaaattggc atgtttactt tcacaggatt 3600tacagcaggt gattggagtc atatcatcaa acaaattggc atgtttactt tcacaggatt 3600
gaatactgag caagtttcat tcatgactag agagcatcac atttacatga catctgatgg 36603660
gtaaggacat ctgactgttg atattttttt ttatttgttt agtttgttac tttgggttgc 3720gtaaggacat ctgactgttg atattttttt ttatttgttt agtttgttac tttgggttgc 3720
ttttttctca gtagaaactt aaataattgg aacttagaag cccttatcat tgattatttc 3780ttttttctca gtagaaactt aaataattgg aacttagaag cccttatcat tgattatttc 3780
ggcttgaatt ctttaataag gagaatttca gacttatagc ttcagttttg agaggaagca 3840ggcttgaatt ctttaataag gagaatttca gacttatagc ttcagttttg agaggaagca 3840
taaacaagtc cagctctgtc attcatactt aaaatttaca gaagaaagtg cagttctgtt 3900taaacaagtc cagctctgtc attcatactt aaaatttaca gaagaaagtg cagttctgtt 3900
tttcccccct cccaaattat attgattctc aaaagaactt accttcaatc tatggcacat 3960tttcccccct cccaaattat attgattctc aaaagaactt accttcaatc tatggcacat 3960
ttagtaatct ggtatcagtt gaaacatctc tttgttgaag ttaagatttt ggttaaaaag 40204020
atcatcatct ctagtgacat tttctacttt ccatttttag aaggaatgat tttctccttt 4080atcatcatct ctagtgacat tttctacttt ccatttttag aaggaatgat tttctccttt 4080
ctcatttgca ggagaattag catggcaggc cttagttctc gcacaattcc tcatcttgcc 4140ctcatttgca ggagaattag catggcaggc cttagttctc gcacaattcc tcatcttgcc 4140
gatgccatac atgctgctgt taccaaagcg gcctaa 4176gatgccatac atgctgctgt taccaaagcg gcctaa 4176
<210> 12<210> 12
<211> 446<211> 446
<212> БЕЛОК<212> PROTEIN
<213> Nicotiana tabacum<213> Nicotiana tabacum
<400> 12<400> 12
Met Ala Asn Ser Ser Asn Ser Val Phe Ala His Val Val Arg Ala Pro Met Ala Asn Ser Ser Asn Ser Val Phe Ala His Val Val Arg Ala Pro
1 5 10 15 1 5 10 15
Glu Asp Pro Ile Leu Gly Val Thr Val Ala Tyr Asn Lys Asp Thr Ser Glu Asp Pro Ile Leu Gly Val Thr Val Ala Tyr Asn Lys Asp Thr Ser
20 25 30 20 25 30
Pro Val Lys Leu Asn Leu Gly Val Gly Ala Tyr Arg Thr Glu Glu Gly Pro Val Lys Leu Asn Leu Gly Val Gly Ala Tyr Arg Thr Glu Glu Gly
35 40 45 35 40 45
Lys Pro Leu Val Leu Asn Val Val Arg Arg Ala Glu Gln Met Leu Val Lys Pro Leu Val Leu Asn Val Val Arg Arg Ala Glu Gln Met Leu Val
50 55 60 50 55 60
Asn Asp Thr Ser Arg Val Lys Glu Tyr Leu Ser Ile Thr Gly Leu Ala Asn Asp Thr Ser Arg Val Lys Glu Tyr Leu Ser Ile Thr Gly Leu Ala
65 70 75 80 65 70 75 80
Asp Phe Asn Lys Leu Ser Ala Lys Leu Ile Phe Gly Ser Asp Ser Pro Asp Phe Asn Lys Leu Ser Ala Lys Leu Ile Phe Gly Ser Asp Ser Pro
85 90 95 85 90 95
Ala Ile Gln Glu Asn Arg Val Thr Thr Val Gln Cys Leu Ser Gly Thr Ala Ile Gln Glu Asn Arg Val Thr Thr Val Gln Cys Leu Ser Gly Thr
100 105 110 100 105 110
Gly Ser Leu Arg Val Gly Ala Glu Phe Leu Ala Lys His Tyr His Glu Gly Ser Leu Arg Val Gly Ala Glu Phe Leu Ala Lys His Tyr His Glu
115 120 125 115 120 125
His Thr Ile Tyr Ile Pro Gln Pro Thr Trp Gly Asn His Pro Lys Val His Thr Ile Tyr Ile Pro Gln Pro Thr Trp Gly Asn His Pro Lys Val
130 135 140 130 135 140
Phe Thr Leu Ala Gly Leu Ser Val Lys Tyr Tyr Arg Tyr Tyr Asp Pro Phe Thr Leu Ala Gly Leu Ser Val Lys Tyr Tyr Arg Tyr Tyr Asp Pro
145 150 155 160 145 150 155 160
Ala Thr Arg Gly Leu Asp Phe Gln Gly Thr Thr Val Ile Asn Val Leu Ala Thr Arg Gly Leu Asp Phe Gln Gly Thr Thr Val Ile Asn Val Leu
165 170 175 165 170 175
Lys Val Leu Gln Leu Tyr Lys His Ser Leu Ser Val Ala Ser Pro Val Lys Val Leu Gln Leu Tyr Lys His Ser Leu Ser Val Ala Ser Pro Val
180 185 190 180 185 190
Phe Gly Cys Cys Val Ser Asn Leu Ile Met Asn Pro Val Gly Leu Leu Phe Gly Cys Cys Val Ser Asn Leu Ile Met Asn Pro Val Gly Leu Leu
195 200 205 195 200 205
Asp Asp Leu Ala Ala Ala Pro Ala Gly Val Ile Val Leu Leu His Ala Asp Asp Leu Ala Ala Ala Pro Ala Gly Val Ile Val Leu Leu His Ala
210 215 220 210 215 220
Cys Ala His Asn Pro Thr Gly Val Asp Pro Thr Asn Asp Gln Trp Glu Cys Ala His Asn Pro Thr Gly Val Asp Pro Thr Asn Asp Gln Trp Glu
225 230 235 240 225 230 235 240
Lys Ile Arg Gln Leu Met Arg Ser Lys Gly Leu Leu Pro Phe Phe Asp Lys Ile Arg Gln Leu Met Arg Ser Lys Gly Leu Leu Pro Phe Phe Asp
245 250 255 245 250 255
Ser Ala Tyr Gln Gly Phe Ala Thr Gly Asn Leu Asp Ala Asp Ala Gln Ser Ala Tyr Gln Gly Phe Ala Thr Gly Asn Leu Asp Ala Asp Ala Gln
260 265 270 260 265 270
Ser Val Arg Met Phe Val Ala Asp Gly Gly Glu Cys Leu Ala Ala Gln Ser Val Arg Met Phe Val Ala Asp Gly Gly Glu Cys Leu Ala Ala Gln
275 280 285 275 280 285
Ser Tyr Ala Lys Asn Met Gly Leu Tyr Gly Glu Arg Val Gly Ala Leu Ser Tyr Ala Lys Asn Met Gly Leu Tyr Gly Glu Arg Val Gly Ala Leu
290 295 300 290 295 300
Ser Ile Val Cys Lys Asp Ala Asp Val Ala Ser Arg Val Glu Ser Gln Ser Ile Val Cys Lys Asp Ala Asp Val Ala Ser Arg Val Glu Ser Gln
305 310 315 320 305 310 315 320
Leu Lys Leu Val Ile Arg Pro Met Tyr Ser Asn Pro Pro Ile His Gly Leu Lys Leu Val Ile Arg Pro Met Tyr Ser Asn Pro Pro Ile His Gly
325 330 335 325 330 335
Ala Ser Ile Val Ala Thr Ile Leu Lys Asp Arg Gln Met Tyr Asp Glu Ala Ser Ile Val Ala Thr Ile Leu Lys Asp Arg Gln Met Tyr Asp Glu
340 345 350 340 345 350
Trp Thr Ile Glu Leu Lys Ala Met Ala Asp Arg Ile Ile Ser Met Arg Trp Thr Ile Glu Leu Lys Ala Met Ala Asp Arg Ile Ile Ser Met Arg
355 360 365 355 360 365
Gln Gln Leu Phe Asp Ala Leu Gln Ala Arg Gly Thr Ala Gly Asp Trp Gln Gln Leu Phe Asp Ala Leu Gln Ala Arg Gly Thr Ala Gly Asp Trp
370 375 380 370 375 380
Ser His Ile Ile Lys Gln Ile Gly Met Phe Thr Phe Thr Gly Leu Asn Ser His Ile Ile Lys Gln Ile Gly Met Phe Thr Phe Thr Gly Leu Asn
385 390 395 400 385 390 395 400
Thr Glu Gln Val Ser Phe Met Thr Arg Glu His His Ile Tyr Met Thr Thr Glu Gln Val Ser Phe Met Thr Arg Glu His His Ile Tyr Met Thr
405 410 415 405 410 415
Ser Asp Gly Arg Ile Ser Met Ala Gly Leu Ser Ser Arg Thr Ile Pro Ser Asp Gly Arg Ile Ser Met Ala Gly Leu Ser Ser Ser Arg Thr Ile Pro
420 425 430 420 425 430
His Leu Ala Asp Ala Ile His Ala Ala Val Thr Lys Ala Ala His Leu Ala Asp Ala Ile His Ala Ala Val Thr Lys Ala Ala
435 440 445 435 440 445
<210> 13<210> 13
<211> 4857<211> 4857
<212> ДНК<212> DNA
<213> Nicotiana tabacum<213> Nicotiana tabacum
<400> 13<400> 13
atggtttcca caatgttctc tctagcttct gccactccgt cagcttcatt ttccttgcaa 60atggtttcca caatgttctc tctagcttct gccactccgt cagcttcatt ttccttgcaa 60
gataatctca aggtaatttc atcgtcaatt acattatttg gaaatttgcc ttatcttaga 120gataatctca aggtaatttc atcgtcaatt acattatttg gaaatttgcc ttatcttaga 120
ctattcctaa tgaggtggat tcatgctgtt gtttgtgttt gaacagtcaa agctaaagct 180ctattcctaa tgaggtggat tcatgctgtt gtttgtgttt gaacagtcaa agctaaagct 180
ggggactact agccaaagtg cctttttcgg gaaagacttc gtgaaggcaa aggtaggatt 240ggggactact agccaaagtg cctttttcgg gaaagacttc gtgaaggcaa aggtaggatt 240
tttgtgttgt ttgtgtacat ttggtgagag gtaatagctc tactgctata gagaaactcc 300tttgtgttgt ttgtgtacat ttggtgagag gtaatagctc tactgctata gagaaactcc 300
ctgtaggttc tgtcctttag agtatagaag agaaggaaag agtttaattg ggaataatgg 360ctgtaggttc tgtcctttag agtatagaag agaaggaaag agtttaattg ggaataatgg 360
tggggatggg atgatttgca tacaattgaa catgtgtttc ttgctttggt atattatgat 420tggggatggg atgatttgca tacaattgaa catgtgtttc ttgctttggt atattatgat 420
ataggatgat ccaatcatgc tccgtaaatc aactccagaa cttattattc tttcggcact 480ataggatgat ccaatcatgc tccgtaaatc aactccagaa cttattattc tttcggcact 480
tactaattat aaaaatcggg ttggagtcct gaaaataagt gattgcctaa ccaacttaca 540tactaattat aaaaatcggg ttggagtcct gaaaataagt gattgcctaa ccaacttaca 540
gaactaattt tattatccgt atactcaaat caaaacgaca ttatgccagt actggtttct 600gaactaattt tattatccgt atactcaaat caaaacgaca ttatgccagt actggtttct 600
tgagagggat gatattagtg tagaattatt tataaagttg cagtttaacg tagggtgttt 660tgagagggat gatattagtg tagaattatt tataaagttg cagtttaacg tagggtgttt 660
tactaaccag aaaggtgtag atgattccat tcagtttatt agatgctaag aagtataaca 720tactaaccag aaaggtgtag atgattccat tcagtttatt agatgctaag aagtataaca 720
gtgaggcctg tgaaacttct ggtagtacca acgattgggg ttttatggcg tttaggaatt 780gtgaggcctg tgaaacttct ggtagtacca acgattgggg ttttatggcg tttaggaatt 780
tagacattaa ttggcacatt ttagaacgaa aaatatgaca tttaacttac aacagttctt 840tagacattaa ttggcacatt ttagaacgaa aaatatgaca tttaacttac aacagttctt 840
ttctgaataa aatattacta gtaactaatt tgtttgaact ttgccattgc taaaatgtgg 900ttctgaataa aatattacta gtaactaatt tgtttgaact ttgccattgc taaaatgtgg 900
ctcaagatct tcttggtact tctatttgta atatcagagt tataggggtc taattctagc 960ctcaagatct tcttggtact tctatttgta atatcagagt tataggggtc taattctagc 960
tcttgagtcg aaattgttat tagtaaagat aattctttct tgtccccctt cagtgctaac 1020tcttgagtcg aaattgttat tagtaaagat aattctttct tgtccccctt cagtgctaac 1020
attctcatct tcacttatgg tattggttta taaaaaattg tgattcagat tataaagtaa 1080tcacttatgg tattggttta taaaaaattg tgattcagat tataaagtaa 1080
aaaattatgc ctcagtttgt acagcatttt gggttatctg acgttcaatt caacagggtt 1140aaaattatgc ctcagtttgt acagcatttt gggttatctg acgttcaatt caacagggtt 1140
ctttaatatc tatttttcta tcttttgtaa tcattgcaac accgagctgt ttaatgtgct 1200ctttaatatc tatttttcta tcttttgtaa tcattgcaac accgagctgt ttaatgtgct 1200
caaaggctat tattagtcct cccactcacc agatccttag aaaaaagccc agaagagaaa 1260caaaggctat tattagtcct cccactcacc agatccttag aaaaaagccc agaagagaaa 1260
ggcaaagaat acaagcccag accgattgct cgttttataa attttgggaa ttgggatctc 1320ggcaaagaat acaagcccag accgattgct cgttttataa attttgggaa ttgggatctc 1320
ttttctcata ttcttacttt tttctctttc tttttttcca gtcaaatggc cgtactacta 1380ttttctcata ttcttacttt ttttctctttc ttttttttcca gtcaaatggc cgtactacta 1380
tgactgttgc tgtgaacgtc tctcgatttg agggaataac tatggctcct cctgacccca 1440tgactgttgc tgtgaacgtc tctcgatttg agggaataac tatggctcct cctgacccca 1440
ttcttggagt ttctgaagca ttcaaggctg atacaaatga actgaagctt aaccttggtg 1500ttcttggagt ttctgaagca ttcaaggctg atacaaatga actgaagctt aaccttggtg 1500
ttggagctta ccgcacggag gagcttcaac catatgtcct caatgttgtt aagaaagtaa 1560ttggagctta ccgcacggag gagcttcaac catatgtcct caatgttgtt aagaaagtaa 1560
gttcttggtc tcttgtttat gctcaagtag tttgtaaact tttagtcact tggccttgtt 16201620
cccatgggtg gatacccttg tccaagggga gtcaatttat tacactctgt aaataggtta 1680cccatgggtg gatacccttg tccaagggga gtcaatttat tacactctgt aaataggtta 1680
attctttttt aaaatgtatg tatgtatgta tgtatgtatg tatgtataca cacacactat 17401740
gttgaatcgc ccctggcttc ttctgtttac ttctatatat tttgtatcca atgggtgaaa 1800gttgaatcgc ccctggcttc ttctgtttac ttctatatat tttgtatcca atgggtgaaa 1800
attctggagt gactgcttgt tcctaagcgt tcatcattca ttaactgttt taataacctt 1860tcctaagcgt tcatcattca ttaactgttt taataacctt 1860
ctataatttt gcatctgaat gatgaggaaa ttgcttttct gtaggcagaa aaccttatgc 1920ctataatttt gcatctgaat gatgaggaaa ttgcttttct gtaggcagaa aaccttatgc 1920
tagaaagagg agataacaaa gaggtacttg atttactaaa ttcatctttt ggccttgact 1980tagaaagagg agataacaaa gaggtacttg atttactaaa ttcatctttt ggccttgact 1980
agtgtcactt ggtgccaatt cttacttatt ttttaatcta tggatatata gtatcttcca 2040agtgtcactt ggtgccaatt cttacttatt ttttaatcta tggatatata gtatcttcca 2040
atagaaggtt tggctgcatt caacaaagtc acagcagagt tattgtttgg agcagataac 2100atagaaggtt tggctgcatt caacaaagtc acagcagagt tattgtttgg agcagataac 2100
ccagtgattc agcaacaaag ggtaagtatt tttgttttta actcttagga aaatatatcc 2160ccagtgattc agcaacaaag ggtaagtatt tttgttttta actcttagga aaatatatcc 2160
tggaacaaac atgtaaattt ggtctctatg gcctttgttg tgaacgacgt tgtacctttc 22202220
gtgatcaggt ggctactatt caaggtctgt caggaactgg gtcattgcgt attgctgcag 2280gtgatcaggt ggctactatt caaggtctgt caggaactgg gtcattgcgt attgctgcag 2280
cactgataga gcgttacttc cctggctcta aggttttaat atcatctcca acctggggta 2340cactgataga gcgttacttc cctggctcta aggttttaat atcatctcca acctggggta 2340
cgtagatagt gcttttggat taatttggtt gaatctcatg atactgattt ttacagttat 24002400
gttttgcagg aaatcataag aacattttca atgatgccag ggtgccttgg tctgaatatc 2460gttttgcagg aaatcataag aacattttca atgatgccag ggtgccttgg tctgaatatc 2460
gatattatga tcccaaaaca gttggcctgg attttgctgg gatgatagaa gatattaagg 2520gatattatga tcccaaaaca gttggcctgg attttgctgg gatgatagaa gatattaagg 2520
ttattatcgt cctcgcattt gtaatctttg tggttgaaat tgtaaagcag cagtgagcac 2580ttattatcgt cctcgcattt gtaatctttg tggttgaaat tgtaaagcag cagtgagcac 2580
tgtctttttc ctttctccac aagtcaattg atggtgcctt tgtttgtggc acgtgttttg 26402640
actttcagta attgaaggag agatgcgttg ttcattctag aatagcactg tatctcccaa 2700actttcagta attgaaggag agatgcgttg ttcattctag aatagcactg tatctcccaa 2700
ttgcattttc tgtttcctgt tcttcctccc tatgtttgca ttgatccatg tctctgctaa 2760ttgcattttc tgtttcctgt tcttcctccc tatgtttgca ttgatccatg tctctgctaa 2760
acatggacaa tttgcgccct tggcaatgac atgtgtgttg cttgcttttc ttctctttct 2820acatggacaa tttgcgccct tggcaatgac atgtgtgttg cttgcttttc ttctctttct 2820
atttcttggt aggagtgact tggttctttc aatgtgagca gtcatatttc tgaaaatgaa 2880atttcttggt aggagtgact tggttctttc aatgtgagca gtcatatttc tgaaaatgaa 2880
aatcagagga acttgggatg tggaagggat tggcagaaca agtttgataa tgtaattttt 29402940
cttgtgagga tggaatatgc aaaaataggc tgcacgcttg ccttttagat ctttggttcc 3000cttgtgagga tggaatatgc aaaaataggc tgcacgcttg cctttttagat ctttggttcc 3000
tatgtcggtt gtgaatgtag atttctattt ttcaacattg tctcgcaagg aaaataggat 3060tatgtcggtt gtgaatgtag atttctattt ttcaacattg tctcgcaagg aaaataggat 3060
tatccagtat tggatgtctt tcctatgttt gatatgtgta tgtgcagtct tgtttgaccg 3120tatccagtat tggatgtctt tcctatgttt
tcttgctctc ttcccacgtc taaaaagaga gtctgatggg aaagtttttt tccttccagt 31803180
tcttgtgcaa gtcattgaca tagtttatgg cattacttgt ttataggctg ctcctgaagg 3240tcttgtgcaa gtcattgaca tagttatgg cattacttgt ttataggctg ctcctgaagg 3240
atcatttatc ttgctccatg gctgtgcgca caacccaact ggtattgatc ccacaattga 3300atcatttatc ttgctccatg gctgtgcgca caacccaact ggtattgatc ccacaattga 3300
acaatgggaa aagattgctg atgtaattca ggagaagaac cacattccat tttttgatgt 33603360
cgcctaccag gtaatctgtg ctaaacccaa ttatttcatt tggtgaagct gtaaaatttc 3420cgcctaccag gtaatctgtg ctaaacccaa ttatttcatt tggtgaagct gtaaaatttc 3420
aagtttctta gaagttttga tggttgtgtg tgcgtgtgaa gagaatgaat gatataggaa 34803480
ttggttttga aatagtgaaa gatctctcgt atttcatttg ttcttttggt gtgaggagag 3540ttggttttga aatagtgaaa gatctctcgt atttcatttg ttcttttggt gtgaggagag 3540
tatacattgt tgttttgata gatgggcaaa ttcgatagat gaaggtggtt aagccacgtg 36003600
ttactttgta attttttttt gacaccgtca tggtgtttat caataaaatt tactgatttt 36603660
tcagtaaagt tattagaaca agataatctg aagtcatttc tattcagaga attgcattga 3720tcagtaaagt tattagaaca agataatctg aagtcatttc tattcagaga attgcattga 3720
atagctgtat actataataa tcgagatgcc tcatctgtct acacgctgcc ctacagggat 3780atagctgtat actataataa tcgagatgcc tcatctgtct acacgctgcc ctacagggat 3780
ttgcaagcgg cagccttgac gaagatgcct catctgtgag attgtttgct gcacgtggca 3840ttgcaagcgg cagccttgac gaagatgcct catctgtgag attgtttgct gcacgtggca 3840
tggagctttt ggttgctcaa tcatatagta aaaatctggg tctgtatgga gaaaggattg 39003900
gagctattaa tgttctttgc tcatccgctg atgcagcgac aaggtacagt cacccgcact 3960gagctattaa tgttctttgc tcatccgctg atgcagcgac aaggtacagt cacccgcact 3960
agcaactaca taattgtcct ctgtatagga aaaatgatgc actggaaaac aatggttcca 4020agcaactaca taattgtcct ctgtatagga aaaatgatgc actggaaaac aatggttcca 4020
tatgaaatgc caattacgag atgctgtccc tttgctttga tattgtttac tacaattggt 40804080
atctcccatc acctgagcct atggcttgat tggattttat gtgggcgaac caatagaatt 4140atctcccatc acctgagcct atggcttgat tggattttat gtgggcgaac caatagaatt 4140
atttgcttaa ttttctcaac taatggatgc atctctgcta actcacaggg tgaaaagcca 4200atttgcttaa ttttctcaac taatggatgc atctctgcta actcacaggg tgaaaagcca 4200
gctaaaaagg cttgctcgac caatgtactc aaatccccca attcacggtg ctagaattgt 4260gctaaaaagg cttgctcgac caatgtactc aaatccccca attcacggtg ctagaattgt 4260
tgccaatgtc gttggaattc ctgagttctt tgatgaatgg aaacaagaga tggaaatgat 4320tgccaatgtc gttggaattc ctgagttctt tgatgaatgg aaacaagaga tggaaatgat 4320
ggcaggaagg ataaagagtg tgagacagaa gctatacgat agcctctcca ccaaggataa 4380ggcaggaagg ataaagagtg tgagacagaa gctatacgat agcctctcca ccaaggataa 4380
gagtggaaag gactggtcat acattttgaa gcagattgga atgttctcct tcacaggcct 4440gagtggaaag gactggtcat acattttgaa gcagattgga atgttctcct tcacaggcct 4440
caacaaagct caggtaaatc cccgtgattt aagctattgc ttcatcacaa tatgcttaaa 4500caacaaagct caggtaaatc cccgtgattt aagctattgc ttcatcacaa tatgcttaaa 4500
ttcaatttga tcattcatcg caaagcacat tctgaactca gcacatattt tcattaacac 4560ttcaatttga tcattcatcg caaagcacat tctgaactca gcacatattt tcattaacac 4560
attctttccg tcctttctga tcaattccat aagtccgata tgcaaaagat agtgcagtga 46204620
gagtctctta ctggagtata actagattat cgacaatgca tacatttctt tccctgtacc 4680gagtctctta ctggagtata actagattat cgacaatgca tacatttctt tccctgtacc 4680
tgcacttctg gtgctcatat ttgatctctc ttcttggcca cgcagagcga gaacatgacc 4740tgcacttctg gtgctcatat ttgatctctc ttcttggcca cgcagagcga gaacatgacc 4740
aacaagtggc atgtgtacat gacaaaagac gggaggatat cgttggctgg attatcagct 4800aacaagtggc atgtgtacat gacaaaagac gggaggatat cgttggctgg attatcagct 4800
gctaaatgcg aatatcttgc agatgccata attgactcgt actacaatgt cagctaa 4857gctaaatgcg aatatcttgc agatgccata attgactcgt actacaatgt cagctaa 4857
<210> 14<210> 14
<211> 462<211> 462
<212> БЕЛОК<212> PROTEIN
<213> Nicotiana tabacum<213> Nicotiana tabacum
<400> 14<400> 14
Met Val Ser Thr Met Phe Ser Leu Ala Ser Ala Thr Pro Ser Ala Ser Met Val Ser Thr Met Phe Ser Leu Ala Ser Ala Thr Pro Ser Ala Ser
1 5 10 15 1 5 10 15
Phe Ser Leu Gln Asp Asn Leu Lys Ser Lys Leu Lys Leu Gly Thr Thr Phe Ser Leu Gln Asp Asn Leu Lys Ser Lys Leu Lys Leu Gly Thr Thr
20 25 30 20 25 30
Ser Gln Ser Ala Phe Phe Gly Lys Asp Phe Val Lys Ala Lys Ser Asn Ser Gln Ser Ala Phe Phe Gly Lys Asp Phe Val Lys Ala Lys Ser Asn
35 40 45 35 40 45
Gly Arg Thr Thr Met Thr Val Ala Val Asn Val Ser Arg Phe Glu Gly Gly Arg Thr Thr Met Thr Val Ala Val Asn Val Ser Arg Phe Glu Gly
50 55 60 50 55 60
Ile Thr Met Ala Pro Pro Asp Pro Ile Leu Gly Val Ser Glu Ala Phe Ile Thr Met Ala Pro Pro Asp Pro Ile Leu Gly Val Ser Glu Ala Phe
65 70 75 80 65 70 75 80
Lys Ala Asp Thr Asn Glu Leu Lys Leu Asn Leu Gly Val Gly Ala Tyr Lys Ala Asp Thr Asn Glu Leu Lys Leu Asn Leu Gly Val Gly Ala Tyr
85 90 95 85 90 95
Arg Thr Glu Glu Leu Gln Pro Tyr Val Leu Asn Val Val Lys Lys Ala Arg Thr Glu Glu Leu Gln Pro Tyr Val Leu Asn Val Val Lys Lys Ala
100 105 110 100 105 110
Glu Asn Leu Met Leu Glu Arg Gly Asp Asn Lys Glu Tyr Leu Pro Ile Glu Asn Leu Met Leu Glu Arg Gly Asp Asn Lys Glu Tyr Leu Pro Ile
115 120 125 115 120 125
Glu Gly Leu Ala Ala Phe Asn Lys Val Thr Ala Glu Leu Leu Phe Gly Glu Gly Leu Ala Ala Phe Asn Lys Val Thr Ala Glu Leu Leu Phe Gly
130 135 140 130 135 140
Ala Asp Asn Pro Val Ile Gln Gln Gln Arg Val Ala Thr Ile Gln Gly Ala Asp Asn Pro Val Ile Gln Gln Gln Arg Val Ala Thr Ile Gln Gly
145 150 155 160 145 150 155 160
Leu Ser Gly Thr Gly Ser Leu Arg Ile Ala Ala Ala Leu Ile Glu Arg Leu Ser Gly Thr Gly Ser Leu Arg Ile Ala Ala Ala Leu Ile Glu Arg
165 170 175 165 170 175
Tyr Phe Pro Gly Ser Lys Val Leu Ile Ser Ser Pro Thr Trp Gly Asn Tyr Phe Pro Gly Ser Lys Val Leu Ile Ser Ser Pro Thr Trp Gly Asn
180 185 190 180 185 190
His Lys Asn Ile Phe Asn Asp Ala Arg Val Pro Trp Ser Glu Tyr Arg His Lys Asn Ile Phe Asn Asp Ala Arg Val Pro Trp Ser Glu Tyr Arg
195 200 205 195 200 205
Tyr Tyr Asp Pro Lys Thr Val Gly Leu Asp Phe Ala Gly Met Ile Glu Tyr Tyr Asp Pro Lys Thr Val Gly Leu Asp Phe Ala Gly Met Ile Glu
210 215 220 210 215 220
Asp Ile Lys Ala Ala Pro Glu Gly Ser Phe Ile Leu Leu His Gly Cys Asp Ile Lys Ala Ala Pro Glu Gly Ser Phe Ile Leu Leu His Gly Cys
225 230 235 240 225 230 235 240
Ala His Asn Pro Thr Gly Ile Asp Pro Thr Ile Glu Gln Trp Glu Lys Ala His Asn Pro Thr Gly Ile Asp Pro Thr Ile Glu Gln Trp Glu Lys
245 250 255 245 250 255
Ile Ala Asp Val Ile Gln Glu Lys Asn His Ile Pro Phe Phe Asp Val Ile Ala Asp Val Ile Gln Glu Lys Asn His Ile Pro Phe Phe Asp Val
260 265 270 260 265 270
Ala Tyr Gln Gly Phe Ala Ser Gly Ser Leu Asp Glu Asp Ala Ser Ser Ala Tyr Gln Gly Phe Ala Ser Gly Ser Leu Asp Glu Asp Ala Ser Ser
275 280 285 275 280 285
Val Arg Leu Phe Ala Ala Arg Gly Met Glu Leu Leu Val Ala Gln Ser Val Arg Leu Phe Ala Ala Arg Gly Met Glu Leu Leu Val Ala Gln Ser
290 295 300 290 295 300
Tyr Ser Lys Asn Leu Gly Leu Tyr Gly Glu Arg Ile Gly Ala Ile Asn Tyr Ser Lys Asn Leu Gly Leu Tyr Gly Glu Arg Ile Gly Ala Ile Asn
305 310 315 320 305 310 315 320
Val Leu Cys Ser Ser Ala Asp Ala Ala Thr Arg Val Lys Ser Gln Leu Val Leu Cys Ser Ser Ala Asp Ala Ala Thr Arg Val Lys Ser Gln Leu
325 330 335 325 330 335
Lys Arg Leu Ala Arg Pro Met Tyr Ser Asn Pro Pro Ile His Gly Ala Lys Arg Leu Ala Arg Pro Met Tyr Ser Asn Pro Pro Ile His Gly Ala
340 345 350 340 345 350
Arg Ile Val Ala Asn Val Val Gly Ile Pro Glu Phe Phe Asp Glu Trp Arg Ile Val Ala Asn Val Val Gly Ile Pro Glu Phe Phe Asp Glu Trp
355 360 365 355 360 365
Lys Gln Glu Met Glu Met Met Ala Gly Arg Ile Lys Ser Val Arg Gln Lys Gln Glu Met Glu Met Met Ala Gly Arg Ile Lys Ser Val Arg Gln
370 375 380 370 375 380
Lys Leu Tyr Asp Ser Leu Ser Thr Lys Asp Lys Ser Gly Lys Asp Trp Lys Leu Tyr Asp Ser Leu Ser Thr Lys Asp Lys Ser Gly Lys Asp Trp
385 390 395 400 385 390 395 400
Ser Tyr Ile Leu Lys Gln Ile Gly Met Phe Ser Phe Thr Gly Leu Asn Ser Tyr Ile Leu Lys Gln Ile Gly Met Phe Ser Phe Thr Gly Leu Asn
405 410 415 405 410 415
Lys Ala Gln Ser Glu Asn Met Thr Asn Lys Trp His Val Tyr Met Thr Lys Ala Gln Ser Glu Asn Met Thr Asn Lys Trp His Val Tyr Met Thr
420 425 430 420 425 430
Lys Asp Gly Arg Ile Ser Leu Ala Gly Leu Ser Ala Ala Lys Cys Glu Lys Asp Gly Arg Ile Ser Leu Ala Gly Leu Ser Ala Ala Lys Cys Glu
435 440 445 435 440 445
Tyr Leu Ala Asp Ala Ile Ile Asp Ser Tyr Tyr Asn Val Ser Tyr Leu Ala Asp Ala Ile Ile Asp Ser Tyr Tyr Asn Val Ser
450 455 460 450 455 460
<210> 15<210> 15
<211> 5206<211> 5206
<212> ДНК<212> DNA
<213> Nicotiana tabacum<213> Nicotiana tabacum
<220><220>
<221> Другой признак<221> Other sign
<222> (4436)..(4436)<222> (4436)..(4436)
<223> n представляет собой a, c, g или t<223> n is a, c, g or t
<400> 15<400> 15
atggcttcca caatgttctc tctagcttct gccgctccat cagcttcatt ttccttgcaa 60atggcttcca caatgttctc tctagcttct gccgctccat cagcttcatt ttccttgcaa 60
gataatctca aggtaatttc attgtgaatt acattatttg gaaatttgcc ctatcttaga 120gataatctca aggtaatttc attgtgaatt acattatttg gaaatttgcc ctatcttaga 120
ctgttcctaa tgaggtggat tcatgctgtt gtttgtgttt gaacagtcaa agctaaagct 180ctgttcctaa tgaggtggat tcatgctgtt gtttgtgttt gaacagtcaa agctaaagct 180
ggggactact agccaaagtg cctttttcgg gaaagacttc gcgaaggcaa aggtaggatt 240ggggactact agccaaagtg cctttttcgg gaaagacttc gcgaaggcaa aggtaggatt 240
tttgtgttgt ttgtgtacat ttggtgagag gtaatagctc tactgatata gagcaactcc 300tttgtgttgt ttgtgtacat ttggtgagag gtaatagctc tactgatata gagcaactcc 300
ctgtaggttc tgtcctttag agtatagaag agaagagaag agtttaattg ggaataatgg 360ctgtaggttc tgtcctttag agtatagaag agaagagaag agtttaattg ggaataatgg 360
tggggatgga atgatttgca tacaaatgaa catgtgtttc ttgcttttgg tgtatgatat 420tggggatgga atgatttgca tacaaatgaa catgtgtttc ttgcttttgg tgtatgatat 420
aggatgatcc aatcatgctc cgtaaatcaa ctccagaact tattattctt tcggcacttc 480aggatgatcc aatcatgctc cgtaaatcaa ctccagaact tattattctt tcggcacttc 480
taattataaa aatctggttg gagtaatgaa tataagtgat tacctaacca acttacagaa 540taattataaa aatctggttg gagtaatgaa tataagtgat tacctaacca acttacagaa 540
ttgattttat tatccatata ctgaaattca aaaacggcgt tttgccagta ctggtttctt 600ttgattttat tatccatata ctgaaattca aaaacggcgt tttgccagta ctggtttctt 600
gagagggatg atattaatat agaattattt tataaagttg cagtttaacg tagggtattt 660gagagggatg atattaatat agaattattt tataaagttg cagtttaacg tagggtattt 660
tactaactag aaaggtgata gatggttccg ttcagtttat tagaagtata acagtgaggc 720tactaactag aaaggtgata gatggttccg ttcagtttat tagaagtata acagtgaggc 720
ctgttaaact tttgctagta tcaatgattg gggttttatg gcgtttagga atttagacat 780ctgttaaact tttgctagta tcaatgattg gggttttatg gcgtttagga atttagacat 780
caattggcac attttagaac gaaaaacatg acatttaagt tacatcagtt cttttctgaa 840caattggcac attttagaac gaaaaacatg acatttaagt tacatcagtt cttttctgaa 840
taaaatagta ctagtaaata acttgtttga actttgccat ttgctaaaat gtggctcaag 900taaaatagta ctagtaaata acttgtttga actttgccat ttgctaaaat gtggctcaag 900
atcttcttgg tacttctatt tgtaatatca gagttatagg ggtctaattc taccactgtt 960atcttcttgg tacttctatt tgtaatatca gagttatagg ggtctaattc taccactgtt 960
ttgagtcaaa atgttattag taaagataat tctttcttgt cccccttcag tgctaacatt 1020ttgagtcaaa atgttattag taaagataat tctttcttgt cccccttcag tgctaacatt 1020
ctcatcttca attatggtat tggtttataa aaaaattgtg cttcagatca ctttataaag 1080aaaaattgtg cttcagatca ctttataaag 1080
caaaaattat gcctcagttt gtacagcatt ttgggtttta taacattcaa ttcaacaggg 11401140
ctctttaata tctatgtttc tactttttgt aatctacatc gagctgttta atgtgctcaa 1200ctctttaata tctatgtttc tactttttgt aatctacatc gagctgttta atgtgctcaa 1200
aggctttaat tagtcctcct actcaccaga tccttagaaa aaagcccaga agagaaaggc 1260aggctttaat tagtcctcct actcaccaga tccttagaaa aaagcccaga agagaaaggc 1260
aaagacaacg agctcggaca gattgctcaa tttatattgc aaaaagatcc aaaccctcgg 13201320
ggagggagga gcatgaacca aagatgatac attgatatta ttttctaaat ttgggaattg 1380ggagggagga gcatgaacca aagatgatac attgatatta ttttctaaat ttgggaattg 1380
tgatcttatc ttaaattttt acttttttct ctttttcttt ttttatagtc aaatggtcgg 1440tgatcttatc ttaaattttt acttttttct ctttttcttt ttttatagtc aaatggtcgg 1440
actactatgg ctgtttctgt gaacgtctct cgatttgagg gaataacaat ggctcctcct 1500actactatgg ctgtttctgt gaacgtctct cgatttgagg gaataacaat ggctcctcct 1500
gaccccattc ttggagtttc tgaagcattc aaggctgata caaatgaact gaagcttaac 1560gaccccattc ttggagtttc tgaagcattc aaggctgata caaatgaact gaagcttaac 1560
cttggagttg gagcttaccg cacagaagat cttcaaccct atgtcctcaa tgttgttaaa 1620cttggagttg gagcttaccg cacagaagat cttcaaccct atgtcctcaa tgttgttaaa 1620
aaagtaagtc ctcggtctct tgtttatgct caacgtagtt tgtaaactaa gagtcactta 16801680
accttgttcc catgtgttcg tcattaaaca tagtaataac tttctatagt tttgcatctg 1740accttgttcc catgtgttcg tcattaaaca tagtaataac tttctatagt tttgcatctg 1740
aatgatgagg aaattacttt tctgtaggca gaaaacctta tgctagagag aggtgacaac 1800aatgatgagg aaattacttt tctgtaggca gaaaacctta tgctagagag aggtgacaac 1800
aaagaggtac ttgatatact aaattcatct tttggcctat tagtgtctct tggtgccatt 1860aaagaggtac ttgatatact aaattcatct tttggcctat tagtgtctct tggtgccatt 1860
tcttacttat tttttgtcca tgaatatata gtatcttcca atagaaggtt tggctgcatt 1920tcttacttat tttttgtcca tgaatatata gtatcttcca atagaaggtt tggctgcatt 1920
caacaaagtc acagcagagt tattgtttgg agcagataat ccagtgattc agcaacaaag 1980caacaaagtc acagcagagt tattgtttgg agcagataat ccagtgattc agcaacaaag 1980
ggtaagtatt ttggttttta actcttagca aaaaagtatc ctggaacaaa cttgtagatt 2040ggtaagtatt ttggttttta actcttagca aaaaagtatc ctggaacaaa cttgtagatt 2040
cagtttccac ggattgaatg gcattgtatg tttcttgatc aggtggctac tattcaaggt 2100cagtttccac ggattgaatg gcattgtatg tttcttgatc aggtggctac tattcaaggt 2100
ctatcaggaa ctgggtcatt gcgtattgct gcagcactga tagagcgtta cttccctggc 2160ctatcaggaa ctgggtcatt gcgtattgct gcagcactga tagagcgtta cttccctggc 2160
tctaaggttt tgatatcatc tccaacctgg ggtacgtata tagtgctttg gattaatttg 2220tctaaggttt tgatatcatc tccaacctgg ggtacgtata tagtgctttg gattaatttg 2220
gttgaatctc ataatactga tttttgcagt tatgttttgc aggaaatcat aagaacattt 2280gttgaatctc ataatactga tttttgcagt tatgttttgc aggaaatcat aagaacattt 2280
tcaatgatgc cagggtgcct tggtctgaat atcgatatta tgatcccaaa acagttggtc 2340tcaatgatgc cagggtgcct tggtctgaat atcgatatta tgatcccaaa acagttggtc 2340
tagattttgc tgggatgata gaagatataa aggttattat cttcctcact tttgtaatct 2400tagattttgc tgggatgata gaagatataa aggttattat cttcctcact tttgtaatct 2400
ttgtggttga aattgtaaag cagcagtgag cagtgtcttt ttcctttctc cacaagtcca 2460ttgtggttga aattgtaaag cagcagtgag cagtgtcttt ttcctttctc cacaagtcca 2460
ttgatggtgc ctttgcatgt gggacatgct ttgactttca gtcgttgaag gagagatgcg 2520ttgatggtgc ctttgcatgt gggacatgct ttgactttca gtcgttgaag gagagatgcg 2520
ttattcattc taggatagca ttgtatctcc caaatgcttt ttctgtttcc tgctcttcct 2580ttattcattc taggatagca ttgtatctcc caaatgcttt ttctgtttcc tgctcttcct 2580
tcccattttt gcatcgatcc tgtctctgct aaacatggac aatttgcgcc cttggcaaat 2640tcccattttt gcatcgatcc tgtctctgct aaacatggac aatttgcgcc cttggcaaat 2640
ggcaatgact tgtgtgttgc ttttcttctc tttctatttt ttggtaggag tgacttggtt 2700ggcaatgact tgtgtgttgc ttttcttctc tttctatttt ttggtaggag tgacttggtt 2700
ctttcagtgt gagcagtcat atttctgaaa atgaaaatca gaggaacttg gtgctcacac 2760ctttcagtgt gagcagtcat atttctgaaa atgaaaatca gaggaacttg gtgctcacac 2760
ttagagaaag tttgttatgt tttgggatgt gaaaggaatt gacagaacaa gtttgataat 2820ttagagaaag tttgttatgt tttgggatgt gaaaggaatt gacagaacaa gtttgataat 2820
atattttttc ttgtgaggat ggaatatgct aaaaataggc tgcactcttt ccttttagat 2880atattttttc ttgtgaggat ggaatatgct aaaaataggc tgcactcttt ccttttagat 2880
ctttagttcc tatgtcggtt gtgaatgtcg atttctattt tcaacatttt ctcacgaaga 2940ctttagttcc tatgtcggtt gtgaatgtcg atttctattt tcaacatttt ctcacgaaga 2940
aaataggatt atccagtact ggatgtctct cctatgtctg atatatgtgt atgtgcagtc 3000aaataggatt atccagtact ggatgtctct cctatgtctg atatatgtgt atgtgcagtc 3000
ttgtttgccc gccttgctct ctccccacgt ctaaaaacag agtctgatgg aaaaggcttt 30603060
ttccttccag cttttgtgta agtcattgac atagtttaat gaaactactt gtttataggc 3120ttccttccag cttttgtgta agtcattgac atagtttaat gaaactactt gtttataggc 3120
tgctcctgaa ggatcattca tcttgctcca tggctgtgca cacaacccaa ctggtattga 3180tgctcctgaa ggatcattca tcttgctcca tggctgtgca cacaacccaa ctggtattga 3180
tcccacaatt gaacaatggg aaaagattgc tgatgtaatt caggagaaga accacattcc 3240tcccacaatt gaacaatggg aaaagattgc tgatgtaatt caggagaaga accacattcc 3240
attttttgat gttgcctacc aggtaatctg tgctaaaccc aattattttc atttggtgaa 3300attttttgat gttgcctacc aggtaatctg tgctaaaccc aattattttc atttggtgaa 3300
gttgtagaat tccaagtttc ttagaagttt tgatggctgt gtgtgcgtgt gtgaaaagaa 33603360
tgaaagatat aggagatggt ttcaaaatag tgaaagatct ctcgtatttc atttgtcttt 34203420
tggtgtgtgg agactataca ttgttgtatt gatagatgag cgaatttgat tgatgttggt 3480tggtgtgtgg agactataca ttgttgtatt gatagatgag cgaatttgat tgatgttggt 3480
ggttaagcca catgtgttac tttgtccata tttttttaca ccgtcttggt ttttatcaat 3540ggttaagcca catgtgttac tttgtccata tttttttaca ccgtcttggt ttttatcaat 3540
gaaatttact gatttttcag tgaaattatt agaacaagat catctgaagt catttctgtt 3600gaaatttact gatttttcag tgaaattatt agaacaagat catctgaagt catttctgtt 3600
cagagaattg gattgaatag ctgtatacta taataatcga gatgcctcat ctgtctacac 3660cagagaattg gattgaatag ctgtatacta taataatcga gatgcctcat ctgtctacac 3660
gctgcactgc agggattcgc aagcggcagc cttgatgaag atgcctcatc tgtgagattg 3720gctgcactgc agggattcgc aagcggcagc cttgatgaag atgcctcatc tgtgagattg 3720
tttgctgcac gtggcatgga gcttttggtt gctcaatcat atagtaaaaa tctgggtctg 3780tttgctgcac gtggcatgga gcttttggtt gctcaatcat atagtaaaaa tctgggtctg 3780
tatggagaaa ggattggagc tattaatgtt ctttgctcat ctgctgatgc agcgacaagg 3840tatggagaaa ggattggagc tattaatgtt ctttgctcat ctgctgatgc agcgacaagg 3840
tacaacggcc agcactaata atctacatat ttctcctctg tattggtaaa atgatgttgc 3900tacaacggcc agcactaata atctacatat ttctcctctg tattggtaaa atgatgttgc 3900
actgaagatt ttggttaatg tatgatgcca tttatttatg ttatgcatgt gcagttcttt 39603960
ccgtgtatga tttgttatac aatatagcaa gatgagatgc tttaatctcc tttggatttt 40204020
atgtggttga accaatataa cttttcttct gttaatggat gcatatctac taacttacag 4080atgtggttga accaatataa cttttcttct gttaatggat gcatatctac taacttacag 4080
ggtgaaaagc cagctaaaaa ggcttgctcg accaatgtac tcaaatcccc ccattcacgg 4140ggtgaaaagc cagctaaaaa ggcttgctcg accaatgtac tcaaatcccc ccattcacgg 4140
tgctagaatt gttgccaatg tcgttggaat tcctgagttc tttgatgaat ggaaacaaga 4200tgctagaatt gttgccaatg tcgttggaat tcctgagttc tttgatgaat ggaaacaaga 4200
gatggaaatg atggcaggaa ggataaagag tgtgagacag aagctatatg atagcctctc 4260gatggaaatg atggcaggaa ggataaagag tgtgagacag aagctatatg atagcctctc 4260
cgccaaggat aaaagtggaa aggactggtc atacattctg aagcagattg gaatgttctc 4320cgccaaggat aaaagtggaa aggactggtc atacattctg aagcagattg gaatgttctc 4320
cttcacaggc ctcaacaaag ctcaggtaaa accccgtgaa ttaagttatt gctgttgcgg 4380cttcacaggc ctcaacaaag ctcaggtaaa accccgtgaa ttaagttatt gctgttgcgg 4380
aagccaaata tatagagagt gattaaatca caactactat atctaaaggt agctangtaa 4440aagccaaata tatagagagt gattaaatca caactactat atctaaaggt agctangtaa 4440
atgagacaat aataaaatga acaccagaaa ttaatgaggt tcggcaaaat ttgatttttt 4500atgagacaat aataaaatga acaccagaaa ttaatgaggt tcggcaaaat ttgatttttt 4500
gcctagttct cggacacaat caactcaaat ttatttcact ccaaaaatac aaatgaaata 4560gcctagttct cggacacaat caactcaaat ttatttcact ccaaaaatac aaatgaaata 4560
ctacaagaga gaaagaagat tcaaatgcct taggaaataa gaaggcaagt gagagatgtt 4620ctacaagaga gaaagaagat tcaaatgcct taggaaataa gaaggcaagt gagagatgtt 4620
tacaaatgaa caaaatcctt gctatttata gaagagaaat ggccttaata atgtcatgca 4680tacaaatgaa caaaatcctt gctatttata gaagagaaat ggccttaata atgtcatgca 4680
tgacatcata ttaagtgtga acatgtaatg taaatgcacg aaaaatgcat ctaccaattt 4740tgacatcata ttaagtgtga acatgtaatg taaatgcacg aaaaatgcat ctaccaattt 4740
cttaaggctt caaatgttca cactagttca cattaatctt gtcaaaattc aacaattgct 4800cttaaggctt caaatgttca cactagttca cattaatctt gtcaaaattc aacaattgct 4800
gcatcacaat atgcttaaat tcaatttgat ttggttgaca actttctagc tttgatcatt 4860gcatcacaat atgcttaaat tcaatttgat ttggttgaca actttctagc tttgatcatt 4860
catcacaaag cgcattcttc actcagcacg tatttttatt aagacattct ttccttccat 4920catcacaaag cgcattcttc actcagcacg tatttttatt aagacattct ttccttccat 4920
tctgaccgat ttcataagtt aaatatgcaa aagatagtgc agtgagagtc tccttactgg 4980tctgaccgat ttcataagtt aaatatgcaa aagatagtgc agtgagagtc tccttactgg 4980
attataacta tggactaaag ttaaatgcat acatttcttt ccctgtactt gcacttctcg 5040attataacta tggactaaag ttaaatgcat acatttcttt ccctgtactt gcacttctcg 5040
tgctcatatt tgatatctct tcttggctac acagagcgag aacatgacca acaagtggca 5100tgctcatatt tgatatctct tcttggctac acagagcgag aacatgacca acaagtggca 5100
tgtgtacatg acaaaagacg ggaggatatc gttggctgga ttatctgctg ccaaatgtga 5160tgtgtacatg acaaaagacg ggaggatatc gttggctgga ttatctgctg ccaaatgtga 5160
atatcttgca gatgccataa ttgactcata ctacaatgtc agctaa 5206atatcttgca gatgccataa ttgactcata ctacaatgtc agctaa 5206
<210> 16<210> 16
<211> 462<211> 462
<212> БЕЛОК<212> PROTEIN
<213> Nicotiana tabacum<213> Nicotiana tabacum
<400> 16<400> 16
Met Ala Ser Thr Met Phe Ser Leu Ala Ser Ala Ala Pro Ser Ala Ser Met Ala Ser Thr Met Phe Ser Leu Ala Ser Ala Ala Pro Ser Ala Ser
1 5 10 15 1 5 10 15
Phe Ser Leu Gln Asp Asn Leu Lys Ser Lys Leu Lys Leu Gly Thr Thr Phe Ser Leu Gln Asp Asn Leu Lys Ser Lys Leu Lys Leu Gly Thr Thr
20 25 30 20 25 30
Ser Gln Ser Ala Phe Phe Gly Lys Asp Phe Ala Lys Ala Lys Ser Asn Ser Gln Ser Ala Phe Phe Gly Lys Asp Phe Ala Lys Ala Lys Ser Asn
35 40 45 35 40 45
Gly Arg Thr Thr Met Ala Val Ser Val Asn Val Ser Arg Phe Glu Gly Gly Arg Thr Thr Met Ala Val Ser Val Asn Val Ser Arg Phe Glu Gly
50 55 60 50 55 60
Ile Thr Met Ala Pro Pro Asp Pro Ile Leu Gly Val Ser Glu Ala Phe Ile Thr Met Ala Pro Pro Asp Pro Ile Leu Gly Val Ser Glu Ala Phe
65 70 75 80 65 70 75 80
Lys Ala Asp Thr Asn Glu Leu Lys Leu Asn Leu Gly Val Gly Ala Tyr Lys Ala Asp Thr Asn Glu Leu Lys Leu Asn Leu Gly Val Gly Ala Tyr
85 90 95 85 90 95
Arg Thr Glu Asp Leu Gln Pro Tyr Val Leu Asn Val Val Lys Lys Ala Arg Thr Glu Asp Leu Gln Pro Tyr Val Leu Asn Val Val Lys Lys Ala
100 105 110 100 105 110
Glu Asn Leu Met Leu Glu Arg Gly Asp Asn Lys Glu Tyr Leu Pro Ile Glu Asn Leu Met Leu Glu Arg Gly Asp Asn Lys Glu Tyr Leu Pro Ile
115 120 125 115 120 125
Glu Gly Leu Ala Ala Phe Asn Lys Val Thr Ala Glu Leu Leu Phe Gly Glu Gly Leu Ala Ala Phe Asn Lys Val Thr Ala Glu Leu Leu Phe Gly
130 135 140 130 135 140
Ala Asp Asn Pro Val Ile Gln Gln Gln Arg Val Ala Thr Ile Gln Gly Ala Asp Asn Pro Val Ile Gln Gln Gln Arg Val Ala Thr Ile Gln Gly
145 150 155 160 145 150 155 160
Leu Ser Gly Thr Gly Ser Leu Arg Ile Ala Ala Ala Leu Ile Glu Arg Leu Ser Gly Thr Gly Ser Leu Arg Ile Ala Ala Ala Leu Ile Glu Arg
165 170 175 165 170 175
Tyr Phe Pro Gly Ser Lys Val Leu Ile Ser Ser Pro Thr Trp Gly Asn Tyr Phe Pro Gly Ser Lys Val Leu Ile Ser Ser Pro Thr Trp Gly Asn
180 185 190 180 185 190
His Lys Asn Ile Phe Asn Asp Ala Arg Val Pro Trp Ser Glu Tyr Arg His Lys Asn Ile Phe Asn Asp Ala Arg Val Pro Trp Ser Glu Tyr Arg
195 200 205 195 200 205
Tyr Tyr Asp Pro Lys Thr Val Gly Leu Asp Phe Ala Gly Met Ile Glu Tyr Tyr Asp Pro Lys Thr Val Gly Leu Asp Phe Ala Gly Met Ile Glu
210 215 220 210 215 220
Asp Ile Lys Ala Ala Pro Glu Gly Ser Phe Ile Leu Leu His Gly Cys Asp Ile Lys Ala Ala Pro Glu Gly Ser Phe Ile Leu Leu His Gly Cys
225 230 235 240 225 230 235 240
Ala His Asn Pro Thr Gly Ile Asp Pro Thr Ile Glu Gln Trp Glu Lys Ala His Asn Pro Thr Gly Ile Asp Pro Thr Ile Glu Gln Trp Glu Lys
245 250 255 245 250 255
Ile Ala Asp Val Ile Gln Glu Lys Asn His Ile Pro Phe Phe Asp Val Ile Ala Asp Val Ile Gln Glu Lys Asn His Ile Pro Phe Phe Asp Val
260 265 270 260 265 270
Ala Tyr Gln Gly Phe Ala Ser Gly Ser Leu Asp Glu Asp Ala Ser Ser Ala Tyr Gln Gly Phe Ala Ser Gly Ser Leu Asp Glu Asp Ala Ser Ser
275 280 285 275 280 285
Val Arg Leu Phe Ala Ala Arg Gly Met Glu Leu Leu Val Ala Gln Ser Val Arg Leu Phe Ala Ala Arg Gly Met Glu Leu Leu Val Ala Gln Ser
290 295 300 290 295 300
Tyr Ser Lys Asn Leu Gly Leu Tyr Gly Glu Arg Ile Gly Ala Ile Asn Tyr Ser Lys Asn Leu Gly Leu Tyr Gly Glu Arg Ile Gly Ala Ile Asn
305 310 315 320 305 310 315 320
Val Leu Cys Ser Ser Ala Asp Ala Ala Thr Arg Val Lys Ser Gln Leu Val Leu Cys Ser Ser Ala Asp Ala Ala Thr Arg Val Lys Ser Gln Leu
325 330 335 325 330 335
Lys Arg Leu Ala Arg Pro Met Tyr Ser Asn Pro Pro Ile His Gly Ala Lys Arg Leu Ala Arg Pro Met Tyr Ser Asn Pro Pro Ile His Gly Ala
340 345 350 340 345 350
Arg Ile Val Ala Asn Val Val Gly Ile Pro Glu Phe Phe Asp Glu Trp Arg Ile Val Ala Asn Val Val Gly Ile Pro Glu Phe Phe Asp Glu Trp
355 360 365 355 360 365
Lys Gln Glu Met Glu Met Met Ala Gly Arg Ile Lys Ser Val Arg Gln Lys Gln Glu Met Glu Met Met Ala Gly Arg Ile Lys Ser Val Arg Gln
370 375 380 370 375 380
Lys Leu Tyr Asp Ser Leu Ser Ala Lys Asp Lys Ser Gly Lys Asp Trp Lys Leu Tyr Asp Ser Leu Ser Ala Lys Asp Lys Ser Gly Lys Asp Trp
385 390 395 400 385 390 395 400
Ser Tyr Ile Leu Lys Gln Ile Gly Met Phe Ser Phe Thr Gly Leu Asn Ser Tyr Ile Leu Lys Gln Ile Gly Met Phe Ser Phe Thr Gly Leu Asn
405 410 415 405 410 415
Lys Ala Gln Ser Glu Asn Met Thr Asn Lys Trp His Val Tyr Met Thr Lys Ala Gln Ser Glu Asn Met Thr Asn Lys Trp His Val Tyr Met Thr
420 425 430 420 425 430
Lys Asp Gly Arg Ile Ser Leu Ala Gly Leu Ser Ala Ala Lys Cys Glu Lys Asp Gly Arg Ile Ser Leu Ala Gly Leu Ser Ala Ala Lys Cys Glu
435 440 445 435 440 445
Tyr Leu Ala Asp Ala Ile Ile Asp Ser Tyr Tyr Asn Val Ser Tyr Leu Ala Asp Ala Ile Ile Asp Ser Tyr Tyr Asn Val Ser
450 455 460 450 455 460
<210> 17<210> 17
<211> 101<211> 101
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Нуклеотидная последовательность, используемая для генерирования растений с AAT2S/T RNAi<223> Nucleotide sequence used to generate plants with AAT2S/T RNAi
<400> 17<400> 17
gctattcaag agaacagagt aacaactgtg cagtgcttgt ctggcacagg ctcattgagg 60gctattcaag agaacagagt aacaactgtg cagtgcttgt ctggcacagg ctcattgagg 60
gttggagctg aatttttggc tcgacattat catcaacgca c 101gttggagctg aatttttggc tcgacattat catcaacgca c 101
<---<---
Claims (32)
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EP18164766.0 | 2018-03-28 | ||
| EP18164766 | 2018-03-28 | ||
| PCT/EP2019/057707 WO2019185703A1 (en) | 2018-03-28 | 2019-03-27 | Modulating amino acid content in a plant |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| RU2020135059A RU2020135059A (en) | 2022-04-28 |
| RU2799785C2 true RU2799785C2 (en) | 2023-07-11 |
Family
ID=
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2010034681A1 (en) * | 2008-09-24 | 2010-04-01 | Basf Plant Science Gmbh | Plants having enhanced yield-related traits and a method for making the same |
| US20160068860A1 (en) * | 2013-05-13 | 2016-03-10 | Consejo Superior De Investigaciones Cientificas (Csic) | Transgenic plants |
| RU2627595C2 (en) * | 2011-12-30 | 2017-08-09 | ДАУ АГРОСАЙЕНСИЗ ЭлЭлСи | Method and structure for synthetic two-directional vegetable promoter scbv |
| WO2017156535A1 (en) * | 2016-03-11 | 2017-09-14 | Altria Client Services Llc | Compositions and methods for producing tobacco plants and products having reduced or eliminated suckers |
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2010034681A1 (en) * | 2008-09-24 | 2010-04-01 | Basf Plant Science Gmbh | Plants having enhanced yield-related traits and a method for making the same |
| RU2627595C2 (en) * | 2011-12-30 | 2017-08-09 | ДАУ АГРОСАЙЕНСИЗ ЭлЭлСи | Method and structure for synthetic two-directional vegetable promoter scbv |
| US20160068860A1 (en) * | 2013-05-13 | 2016-03-10 | Consejo Superior De Investigaciones Cientificas (Csic) | Transgenic plants |
| WO2017156535A1 (en) * | 2016-03-11 | 2017-09-14 | Altria Client Services Llc | Compositions and methods for producing tobacco plants and products having reduced or eliminated suckers |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN105247053B (en) | Tobacco specific nitrosamine reduction in plants | |
| JP6871158B2 (en) | Reduced conversion of nicotine to nornicotine in plants | |
| JP6225108B2 (en) | Threonine synthase from Nicotiana tabacum and methods and uses thereof | |
| US11685929B2 (en) | Plants with shortened time to flowering | |
| JP6810134B2 (en) | Plants with reduced asparagine content | |
| CN104080802B (en) | β damascenones are adjusted in plant | |
| JP7463284B2 (en) | Regulation of amino acid content in plants | |
| CN107074919A (en) | The biomass in plant is adjusted by the ectopic expression of chloride channel | |
| EP3480314A1 (en) | Regulation of alkaloid content | |
| US12419264B2 (en) | Modulating sugar and amino acid content in a plant (SULTR3) | |
| US11591609B2 (en) | Modulating reducing sugar content in a plant | |
| WO2024079137A1 (en) | Increasing leaf biomass and nitrogen use efficiency by regulating ntp2 | |
| US20250084427A1 (en) | Modulation of nicotine production by alteration of nicotinamidase expression or function in plants | |
| RU2799785C2 (en) | Modulation of the content of amino acids in the plant | |
| RU2801948C2 (en) | Modulation of the content of reducing sugars in the plant | |
| US20250043298A1 (en) | Increasing anatabine in tobacco leaf by regulating methyl putrescine oxidase | |
| RU2792235C2 (en) | Plants with a shorter flowering time | |
| KR20250139371A (en) | Regulation of sugar transporters | |
| WO2025003105A1 (en) | Modulation of genes coding for glutamate dehydrogenase | |
| KR20250139370A (en) | Regulation of the gene encoding lysine ketoglutarate reductase |