RU2801948C2 - Modulation of the content of reducing sugars in the plant - Google Patents
Modulation of the content of reducing sugars in the plant Download PDFInfo
- Publication number
- RU2801948C2 RU2801948C2 RU2020135056A RU2020135056A RU2801948C2 RU 2801948 C2 RU2801948 C2 RU 2801948C2 RU 2020135056 A RU2020135056 A RU 2020135056A RU 2020135056 A RU2020135056 A RU 2020135056A RU 2801948 C2 RU2801948 C2 RU 2801948C2
- Authority
- RU
- Russia
- Prior art keywords
- plant
- seq
- polynucleotide
- sequence
- polypeptide
- Prior art date
Links
- 235000000346 sugar Nutrition 0.000 title claims abstract description 84
- 150000008163 sugars Chemical class 0.000 title claims abstract description 48
- 241000196324 Embryophyta Species 0.000 claims abstract description 670
- 239000002157 polynucleotide Substances 0.000 claims abstract description 380
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 374
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 374
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 242
- 229920001184 polypeptide Polymers 0.000 claims abstract description 232
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 232
- 230000014509 gene expression Effects 0.000 claims abstract description 144
- 235000002637 Nicotiana tabacum Nutrition 0.000 claims abstract description 140
- 238000000034 method Methods 0.000 claims abstract description 138
- 244000061176 Nicotiana tabacum Species 0.000 claims abstract description 128
- 239000000463 material Substances 0.000 claims abstract description 95
- 230000000694 effects Effects 0.000 claims abstract description 66
- 239000000126 substance Substances 0.000 claims abstract description 15
- 235000019505 tobacco product Nutrition 0.000 claims abstract description 14
- 125000003729 nucleotide group Chemical group 0.000 claims description 125
- 239000002773 nucleotide Substances 0.000 claims description 124
- 230000035772 mutation Effects 0.000 claims description 123
- 230000009261 transgenic effect Effects 0.000 claims description 76
- 238000001035 drying Methods 0.000 claims description 74
- 230000004048 modification Effects 0.000 claims description 71
- 238000012986 modification Methods 0.000 claims description 71
- 230000000295 complement effect Effects 0.000 claims description 39
- 231100000350 mutagenesis Toxicity 0.000 claims description 36
- 238000002703 mutagenesis Methods 0.000 claims description 35
- 239000013598 vector Substances 0.000 claims description 31
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 28
- 239000013604 expression vector Substances 0.000 claims description 27
- 239000000203 mixture Substances 0.000 claims description 26
- 238000005516 engineering process Methods 0.000 claims description 16
- 238000010362 genome editing Methods 0.000 claims description 16
- 230000007423 decrease Effects 0.000 claims description 12
- 230000001404 mediated effect Effects 0.000 claims description 12
- 108010017070 Zinc Finger Nucleases Proteins 0.000 claims description 11
- 238000010453 CRISPR/Cas method Methods 0.000 claims description 9
- 230000005855 radiation Effects 0.000 claims description 8
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 claims description 7
- 239000008103 glucose Substances 0.000 claims description 7
- 229930091371 Fructose Natural products 0.000 claims description 6
- 239000005715 Fructose Substances 0.000 claims description 6
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 claims description 6
- 238000002744 homologous recombination Methods 0.000 claims description 4
- 230000006801 homologous recombination Effects 0.000 claims description 4
- 238000002741 site-directed mutagenesis Methods 0.000 claims description 4
- 239000002028 Biomass Substances 0.000 claims description 3
- 238000007605 air drying Methods 0.000 claims description 3
- 125000002791 glucosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 claims description 2
- 238000002360 preparation method Methods 0.000 claims description 2
- 230000001172 regenerating effect Effects 0.000 claims description 2
- 238000000265 homogenisation Methods 0.000 claims 1
- 108090000623 proteins and genes Proteins 0.000 description 188
- 210000004027 cell Anatomy 0.000 description 171
- 102000053602 DNA Human genes 0.000 description 85
- 108020004414 DNA Proteins 0.000 description 85
- 230000006870 function Effects 0.000 description 82
- 229920002477 rna polymer Polymers 0.000 description 78
- 239000012634 fragment Substances 0.000 description 56
- 235000001014 amino acid Nutrition 0.000 description 51
- 239000000523 sample Substances 0.000 description 45
- 229940024606 amino acid Drugs 0.000 description 40
- 150000001413 amino acids Chemical class 0.000 description 40
- 210000001519 tissue Anatomy 0.000 description 40
- 108020004999 messenger RNA Proteins 0.000 description 32
- 230000001105 regulatory effect Effects 0.000 description 30
- 238000009396 hybridization Methods 0.000 description 29
- 230000002452 interceptive effect Effects 0.000 description 29
- 239000013615 primer Substances 0.000 description 29
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 26
- 230000002068 genetic effect Effects 0.000 description 25
- 239000004055 small Interfering RNA Substances 0.000 description 24
- 108020004459 Small interfering RNA Proteins 0.000 description 22
- 241001144493 Nicotiana obtusifolia Species 0.000 description 20
- 108091028043 Nucleic acid sequence Proteins 0.000 description 20
- 238000004519 manufacturing process Methods 0.000 description 20
- 101710163270 Nuclease Proteins 0.000 description 18
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 18
- 230000000692 anti-sense effect Effects 0.000 description 18
- 230000001965 increasing effect Effects 0.000 description 18
- 230000009466 transformation Effects 0.000 description 18
- 229910052725 zinc Inorganic materials 0.000 description 18
- 239000011701 zinc Substances 0.000 description 18
- 238000006467 substitution reaction Methods 0.000 description 17
- 239000000443 aerosol Substances 0.000 description 16
- 108091026890 Coding region Proteins 0.000 description 15
- 230000004568 DNA-binding Effects 0.000 description 14
- 108010043934 Sucrose synthase Proteins 0.000 description 14
- 230000008859 change Effects 0.000 description 14
- 238000003780 insertion Methods 0.000 description 14
- 230000037431 insertion Effects 0.000 description 14
- 238000012216 screening Methods 0.000 description 14
- 108091033409 CRISPR Proteins 0.000 description 13
- 108090000994 Catalytic RNA Proteins 0.000 description 13
- 102000053642 Catalytic RNA Human genes 0.000 description 13
- 241000700605 Viruses Species 0.000 description 13
- 108091092562 ribozyme Proteins 0.000 description 13
- 102000004190 Enzymes Human genes 0.000 description 12
- 108090000790 Enzymes Proteins 0.000 description 12
- 125000003275 alpha amino acid group Chemical group 0.000 description 12
- 230000003321 amplification Effects 0.000 description 12
- 238000006243 chemical reaction Methods 0.000 description 12
- 238000012217 deletion Methods 0.000 description 12
- 230000037430 deletion Effects 0.000 description 12
- 238000003199 nucleic acid amplification method Methods 0.000 description 12
- 239000013612 plasmid Substances 0.000 description 12
- 239000002987 primer (paints) Substances 0.000 description 12
- 238000013518 transcription Methods 0.000 description 12
- 230000035897 transcription Effects 0.000 description 12
- 108091034117 Oligonucleotide Proteins 0.000 description 11
- 230000027455 binding Effects 0.000 description 11
- 230000015572 biosynthetic process Effects 0.000 description 11
- 230000008439 repair process Effects 0.000 description 11
- 238000011144 upstream manufacturing Methods 0.000 description 11
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 10
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 10
- 230000030279 gene silencing Effects 0.000 description 10
- 230000006780 non-homologous end joining Effects 0.000 description 10
- 102000004169 proteins and genes Human genes 0.000 description 10
- 241000894007 species Species 0.000 description 10
- 238000003786 synthesis reaction Methods 0.000 description 10
- 108020004635 Complementary DNA Proteins 0.000 description 9
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 9
- 238000010804 cDNA synthesis Methods 0.000 description 9
- 239000002299 complementary DNA Substances 0.000 description 9
- 230000005782 double-strand break Effects 0.000 description 9
- 230000000391 smoking effect Effects 0.000 description 9
- 125000006850 spacer group Chemical group 0.000 description 9
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 8
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 8
- 108700019146 Transgenes Proteins 0.000 description 8
- 240000008042 Zea mays Species 0.000 description 8
- 108010005233 alanylglutamic acid Proteins 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 8
- 238000003776 cleavage reaction Methods 0.000 description 8
- 108010049041 glutamylalanine Proteins 0.000 description 8
- 230000004060 metabolic process Effects 0.000 description 8
- 238000003976 plant breeding Methods 0.000 description 8
- 230000009467 reduction Effects 0.000 description 8
- 239000000779 smoke Substances 0.000 description 8
- 230000002103 transcriptional effect Effects 0.000 description 8
- 238000012546 transfer Methods 0.000 description 8
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 7
- 108700028369 Alleles Proteins 0.000 description 7
- 241000701489 Cauliflower mosaic virus Species 0.000 description 7
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 7
- 108020004511 Recombinant DNA Proteins 0.000 description 7
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 7
- 238000013459 approach Methods 0.000 description 7
- 230000001488 breeding effect Effects 0.000 description 7
- 239000000306 component Substances 0.000 description 7
- 150000001875 compounds Chemical class 0.000 description 7
- 238000011161 development Methods 0.000 description 7
- 230000018109 developmental process Effects 0.000 description 7
- -1 genetic mutation Proteins 0.000 description 7
- 108010034529 leucyl-lysine Proteins 0.000 description 7
- 108010054155 lysyllysine Proteins 0.000 description 7
- 238000002844 melting Methods 0.000 description 7
- 230000008018 melting Effects 0.000 description 7
- 238000003752 polymerase chain reaction Methods 0.000 description 7
- 235000018102 proteins Nutrition 0.000 description 7
- 230000007017 scission Effects 0.000 description 7
- 238000013519 translation Methods 0.000 description 7
- SNICXCGAKADSCV-JTQLQIEISA-N (-)-Nicotine Chemical compound CN1CCC[C@H]1C1=CC=CN=C1 SNICXCGAKADSCV-JTQLQIEISA-N 0.000 description 6
- 108020005544 Antisense RNA Proteins 0.000 description 6
- 238000010354 CRISPR gene editing Methods 0.000 description 6
- 206010021929 Infertility male Diseases 0.000 description 6
- 208000007466 Male Infertility Diseases 0.000 description 6
- 108091027967 Small hairpin RNA Proteins 0.000 description 6
- 229930006000 Sucrose Natural products 0.000 description 6
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 6
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 6
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 6
- 230000001580 bacterial effect Effects 0.000 description 6
- 230000001413 cellular effect Effects 0.000 description 6
- 239000003153 chemical reaction reagent Substances 0.000 description 6
- 239000003184 complementary RNA Substances 0.000 description 6
- 238000001514 detection method Methods 0.000 description 6
- 230000004927 fusion Effects 0.000 description 6
- 230000009368 gene silencing by RNA Effects 0.000 description 6
- 238000010438 heat treatment Methods 0.000 description 6
- 235000009973 maize Nutrition 0.000 description 6
- 239000003550 marker Substances 0.000 description 6
- 230000032965 negative regulation of cell volume Effects 0.000 description 6
- 229960002715 nicotine Drugs 0.000 description 6
- SNICXCGAKADSCV-UHFFFAOYSA-N nicotine Natural products CN1CCCC1C1=CC=CN=C1 SNICXCGAKADSCV-UHFFFAOYSA-N 0.000 description 6
- 230000037361 pathway Effects 0.000 description 6
- 230000008488 polyadenylation Effects 0.000 description 6
- 230000004044 response Effects 0.000 description 6
- 239000005720 sucrose Substances 0.000 description 6
- HRPVXLWXLXDGHG-UHFFFAOYSA-N Acrylamide Chemical compound NC(=O)C=C HRPVXLWXLXDGHG-UHFFFAOYSA-N 0.000 description 5
- 108091079001 CRISPR RNA Proteins 0.000 description 5
- 206010020649 Hyperkeratosis Diseases 0.000 description 5
- UCRJTSIIAYHOHE-ULQDDVLXSA-N Leu-Tyr-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UCRJTSIIAYHOHE-ULQDDVLXSA-N 0.000 description 5
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 5
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 5
- 240000003768 Solanum lycopersicum Species 0.000 description 5
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 5
- SAKLWFSRZTZQAJ-GQGQLFGLSA-N Trp-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N SAKLWFSRZTZQAJ-GQGQLFGLSA-N 0.000 description 5
- 238000003556 assay Methods 0.000 description 5
- 230000008827 biological function Effects 0.000 description 5
- 238000009395 breeding Methods 0.000 description 5
- 230000002759 chromosomal effect Effects 0.000 description 5
- 230000003247 decreasing effect Effects 0.000 description 5
- 239000000796 flavoring agent Substances 0.000 description 5
- 235000019634 flavors Nutrition 0.000 description 5
- 238000003205 genotyping method Methods 0.000 description 5
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 5
- 108010079547 glutamylmethionine Proteins 0.000 description 5
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 5
- 229910001385 heavy metal Inorganic materials 0.000 description 5
- 230000001976 improved effect Effects 0.000 description 5
- 230000001939 inductive effect Effects 0.000 description 5
- 238000010369 molecular cloning Methods 0.000 description 5
- 239000003471 mutagenic agent Substances 0.000 description 5
- 210000000056 organ Anatomy 0.000 description 5
- 244000052769 pathogen Species 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 108010079317 prolyl-tyrosine Proteins 0.000 description 5
- 230000002441 reversible effect Effects 0.000 description 5
- 230000001568 sexual effect Effects 0.000 description 5
- 239000001509 sodium citrate Substances 0.000 description 5
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 5
- 241000589158 Agrobacterium Species 0.000 description 4
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 4
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 4
- QNNBHTFDFFFHGC-KKUMJFAQSA-N Asn-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QNNBHTFDFFFHGC-KKUMJFAQSA-N 0.000 description 4
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 4
- 241000894006 Bacteria Species 0.000 description 4
- 241000723377 Coffea Species 0.000 description 4
- PLUBXMRUUVWRLT-UHFFFAOYSA-N Ethyl methanesulfonate Chemical compound CCOS(C)(=O)=O PLUBXMRUUVWRLT-UHFFFAOYSA-N 0.000 description 4
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 4
- OCJRHJZKGGSPRW-IUCAKERBSA-N Glu-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O OCJRHJZKGGSPRW-IUCAKERBSA-N 0.000 description 4
- GUOWMVFLAJNPDY-CIUDSAMLSA-N Glu-Ser-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O GUOWMVFLAJNPDY-CIUDSAMLSA-N 0.000 description 4
- UMZHHILWZBFPGL-LOKLDPHHSA-N Glu-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O UMZHHILWZBFPGL-LOKLDPHHSA-N 0.000 description 4
- QPDUVFSVVAOUHE-XVKPBYJWSA-N Gly-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)CN)C(O)=O QPDUVFSVVAOUHE-XVKPBYJWSA-N 0.000 description 4
- COZMNNJEGNPDED-HOCLYGCPSA-N Gly-Val-Trp Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O COZMNNJEGNPDED-HOCLYGCPSA-N 0.000 description 4
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 4
- 108020005004 Guide RNA Proteins 0.000 description 4
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 4
- 244000020551 Helianthus annuus Species 0.000 description 4
- 235000003222 Helianthus annuus Nutrition 0.000 description 4
- YAALVYQFVJNXIV-KKUMJFAQSA-N His-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 YAALVYQFVJNXIV-KKUMJFAQSA-N 0.000 description 4
- 108091092195 Intron Proteins 0.000 description 4
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 4
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 4
- JQSXWJXBASFONF-KKUMJFAQSA-N Leu-Asp-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JQSXWJXBASFONF-KKUMJFAQSA-N 0.000 description 4
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 4
- 241000219823 Medicago Species 0.000 description 4
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 4
- 108010079364 N-glycylalanine Proteins 0.000 description 4
- AGTHXWTYCLLYMC-FHWLQOOXSA-N Phe-Tyr-Glu Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=CC=C1 AGTHXWTYCLLYMC-FHWLQOOXSA-N 0.000 description 4
- 244000062793 Sorghum vulgare Species 0.000 description 4
- 108091028113 Trans-activating crRNA Proteins 0.000 description 4
- 108091023040 Transcription factor Proteins 0.000 description 4
- 102000040945 Transcription factor Human genes 0.000 description 4
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 4
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 4
- 229920002494 Zein Polymers 0.000 description 4
- 108010055615 Zein Proteins 0.000 description 4
- 238000009825 accumulation Methods 0.000 description 4
- 229960001230 asparagine Drugs 0.000 description 4
- 235000009582 asparagine Nutrition 0.000 description 4
- 239000003795 chemical substances by application Substances 0.000 description 4
- 210000000349 chromosome Anatomy 0.000 description 4
- 235000019504 cigarettes Nutrition 0.000 description 4
- 230000010154 cross-pollination Effects 0.000 description 4
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 4
- 238000004520 electroporation Methods 0.000 description 4
- 239000003623 enhancer Substances 0.000 description 4
- 238000012239 gene modification Methods 0.000 description 4
- 238000010353 genetic engineering Methods 0.000 description 4
- 230000005017 genetic modification Effects 0.000 description 4
- 235000013617 genetically modified food Nutrition 0.000 description 4
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 4
- 108010075431 glycyl-alanyl-phenylalanine Proteins 0.000 description 4
- 108010050848 glycylleucine Proteins 0.000 description 4
- 108010015792 glycyllysine Proteins 0.000 description 4
- 108010081551 glycylphenylalanine Proteins 0.000 description 4
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 4
- 230000006698 induction Effects 0.000 description 4
- 239000003446 ligand Substances 0.000 description 4
- 230000000670 limiting effect Effects 0.000 description 4
- 108010009298 lysylglutamic acid Proteins 0.000 description 4
- 108010038320 lysylphenylalanine Proteins 0.000 description 4
- 108010017391 lysylvaline Proteins 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 231100000707 mutagenic chemical Toxicity 0.000 description 4
- 108010012581 phenylalanylglutamate Proteins 0.000 description 4
- 229920000642 polymer Polymers 0.000 description 4
- 239000000843 powder Substances 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 210000001938 protoplast Anatomy 0.000 description 4
- 230000010076 replication Effects 0.000 description 4
- 150000003839 salts Chemical class 0.000 description 4
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 4
- 239000011780 sodium chloride Substances 0.000 description 4
- 229910001415 sodium ion Inorganic materials 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 4
- 108010020532 tyrosyl-proline Proteins 0.000 description 4
- 241001515965 unidentified phage Species 0.000 description 4
- 229940093612 zein Drugs 0.000 description 4
- 239000005019 zein Substances 0.000 description 4
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 3
- MYKUKUCHPMASKF-VIFPVBQESA-N (S)-nornicotine Chemical compound C1CCN[C@@H]1C1=CC=CN=C1 MYKUKUCHPMASKF-VIFPVBQESA-N 0.000 description 3
- 241000208140 Acer Species 0.000 description 3
- CSCPPACGZOOCGX-UHFFFAOYSA-N Acetone Chemical compound CC(C)=O CSCPPACGZOOCGX-UHFFFAOYSA-N 0.000 description 3
- 241000743339 Agrostis Species 0.000 description 3
- WKOBSJOZRJJVRZ-FXQIFTODSA-N Ala-Glu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WKOBSJOZRJJVRZ-FXQIFTODSA-N 0.000 description 3
- JDIQCVUDDFENPU-ZKWXMUAHSA-N Ala-His-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CNC=N1 JDIQCVUDDFENPU-ZKWXMUAHSA-N 0.000 description 3
- IHMCQESUJVZTKW-UBHSHLNASA-N Ala-Phe-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 IHMCQESUJVZTKW-UBHSHLNASA-N 0.000 description 3
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 3
- 244000099147 Ananas comosus Species 0.000 description 3
- AGVNTAUPLWIQEN-ZPFDUUQYSA-N Arg-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AGVNTAUPLWIQEN-ZPFDUUQYSA-N 0.000 description 3
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 3
- ISVACHFCVRKIDG-SRVKXCTJSA-N Arg-Val-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O ISVACHFCVRKIDG-SRVKXCTJSA-N 0.000 description 3
- OOWSBIOUKIUWLO-RCOVLWMOSA-N Asn-Gly-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O OOWSBIOUKIUWLO-RCOVLWMOSA-N 0.000 description 3
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 3
- JJQGZGOEDSSHTE-FOHZUACHSA-N Asp-Thr-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JJQGZGOEDSSHTE-FOHZUACHSA-N 0.000 description 3
- XWKBWZXGNXTDKY-ZKWXMUAHSA-N Asp-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O XWKBWZXGNXTDKY-ZKWXMUAHSA-N 0.000 description 3
- 241000972773 Aulopiformes Species 0.000 description 3
- 235000011299 Brassica oleracea var botrytis Nutrition 0.000 description 3
- 240000003259 Brassica oleracea var. botrytis Species 0.000 description 3
- 108020004705 Codon Proteins 0.000 description 3
- 235000009854 Cucurbita moschata Nutrition 0.000 description 3
- 240000001980 Cucurbita pepo Species 0.000 description 3
- 235000009852 Cucurbita pepo Nutrition 0.000 description 3
- JAHCWGSVNZXHRR-SVSWQMSJSA-N Cys-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CS)N JAHCWGSVNZXHRR-SVSWQMSJSA-N 0.000 description 3
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 3
- 108010042407 Endonucleases Proteins 0.000 description 3
- 102000004533 Endonucleases Human genes 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- 240000002395 Euphorbia pulcherrima Species 0.000 description 3
- 108700024394 Exon Proteins 0.000 description 3
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 3
- 241000233866 Fungi Species 0.000 description 3
- IOFDDSNZJDIGPB-GVXVVHGQSA-N Gln-Leu-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IOFDDSNZJDIGPB-GVXVVHGQSA-N 0.000 description 3
- MSHXWFKYXJTLEZ-CIUDSAMLSA-N Gln-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MSHXWFKYXJTLEZ-CIUDSAMLSA-N 0.000 description 3
- CGYDXNKRIMJMLV-GUBZILKMSA-N Glu-Arg-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O CGYDXNKRIMJMLV-GUBZILKMSA-N 0.000 description 3
- WVTIBGWZUMJBFY-GUBZILKMSA-N Glu-His-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O WVTIBGWZUMJBFY-GUBZILKMSA-N 0.000 description 3
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 3
- AQNYKMCFCCZEEL-JYJNAYRXSA-N Glu-Lys-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AQNYKMCFCCZEEL-JYJNAYRXSA-N 0.000 description 3
- LPHGXOWFAXFCPX-KKUMJFAQSA-N Glu-Pro-Phe Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O LPHGXOWFAXFCPX-KKUMJFAQSA-N 0.000 description 3
- ZAPFAWQHBOHWLL-GUBZILKMSA-N Glu-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N ZAPFAWQHBOHWLL-GUBZILKMSA-N 0.000 description 3
- UUTGYDAKPISJAO-JYJNAYRXSA-N Glu-Tyr-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 UUTGYDAKPISJAO-JYJNAYRXSA-N 0.000 description 3
- GGEJHJIXRBTJPD-BYPYZUCNSA-N Gly-Asn-Gly Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GGEJHJIXRBTJPD-BYPYZUCNSA-N 0.000 description 3
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 3
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 3
- POJJAZJHBGXEGM-YUMQZZPRSA-N Gly-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN POJJAZJHBGXEGM-YUMQZZPRSA-N 0.000 description 3
- LYZYGGWCBLBDMC-QWHCGFSZSA-N Gly-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)CN)C(=O)O LYZYGGWCBLBDMC-QWHCGFSZSA-N 0.000 description 3
- 239000005562 Glyphosate Substances 0.000 description 3
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 3
- 241000238631 Hexapoda Species 0.000 description 3
- NPROWIBAWYMPAZ-GUDRVLHUSA-N Ile-Asp-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N NPROWIBAWYMPAZ-GUDRVLHUSA-N 0.000 description 3
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 3
- YNMQUIVKEFRCPH-QSFUFRPTSA-N Ile-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O)N YNMQUIVKEFRCPH-QSFUFRPTSA-N 0.000 description 3
- DSDPLOODKXISDT-XUXIUFHCSA-N Ile-Leu-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O DSDPLOODKXISDT-XUXIUFHCSA-N 0.000 description 3
- JZBVBOKASHNXAD-NAKRPEOUSA-N Ile-Val-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N JZBVBOKASHNXAD-NAKRPEOUSA-N 0.000 description 3
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 3
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 3
- IGUOAYLTQJLPPD-DCAQKATOSA-N Leu-Asn-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IGUOAYLTQJLPPD-DCAQKATOSA-N 0.000 description 3
- PJYSOYLLTJKZHC-GUBZILKMSA-N Leu-Asp-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O PJYSOYLLTJKZHC-GUBZILKMSA-N 0.000 description 3
- LAGPXKYZCCTSGQ-JYJNAYRXSA-N Leu-Glu-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LAGPXKYZCCTSGQ-JYJNAYRXSA-N 0.000 description 3
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 3
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 3
- IMAKMJCBYCSMHM-AVGNSLFASA-N Lys-Glu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN IMAKMJCBYCSMHM-AVGNSLFASA-N 0.000 description 3
- DTUZCYRNEJDKSR-NHCYSSNCSA-N Lys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN DTUZCYRNEJDKSR-NHCYSSNCSA-N 0.000 description 3
- ODTZHNZPINULEU-KKUMJFAQSA-N Lys-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N ODTZHNZPINULEU-KKUMJFAQSA-N 0.000 description 3
- SBQDRNOLGSYHQA-YUMQZZPRSA-N Lys-Ser-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SBQDRNOLGSYHQA-YUMQZZPRSA-N 0.000 description 3
- 240000003183 Manihot esculenta Species 0.000 description 3
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 description 3
- BQVJARUIXRXDKN-DCAQKATOSA-N Met-Asn-His Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 BQVJARUIXRXDKN-DCAQKATOSA-N 0.000 description 3
- VSJAPSMRFYUOKS-IUCAKERBSA-N Met-Pro-Gly Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O VSJAPSMRFYUOKS-IUCAKERBSA-N 0.000 description 3
- 240000003433 Miscanthus floridulus Species 0.000 description 3
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 3
- 241000208125 Nicotiana Species 0.000 description 3
- 240000007377 Petunia x hybrida Species 0.000 description 3
- KYYMILWEGJYPQZ-IHRRRGAJSA-N Phe-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KYYMILWEGJYPQZ-IHRRRGAJSA-N 0.000 description 3
- SMFGCTXUBWEPKM-KBPBESRZSA-N Phe-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 SMFGCTXUBWEPKM-KBPBESRZSA-N 0.000 description 3
- XNQMZHLAYFWSGJ-HTUGSXCWSA-N Phe-Thr-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XNQMZHLAYFWSGJ-HTUGSXCWSA-N 0.000 description 3
- 241000219000 Populus Species 0.000 description 3
- KPDRZQUWJKTMBP-DCAQKATOSA-N Pro-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 KPDRZQUWJKTMBP-DCAQKATOSA-N 0.000 description 3
- 238000012228 RNA interference-mediated gene silencing Methods 0.000 description 3
- 108010003581 Ribulose-bisphosphate carboxylase Proteins 0.000 description 3
- 241000124033 Salix Species 0.000 description 3
- PPNPDKGQRFSCAC-CIUDSAMLSA-N Ser-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPNPDKGQRFSCAC-CIUDSAMLSA-N 0.000 description 3
- FZXOPYUEQGDGMS-ACZMJKKPSA-N Ser-Ser-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZXOPYUEQGDGMS-ACZMJKKPSA-N 0.000 description 3
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 3
- 238000002105 Southern blotting Methods 0.000 description 3
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 3
- TWLMXDWFVNEFFK-FJXKBIBVSA-N Thr-Arg-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O TWLMXDWFVNEFFK-FJXKBIBVSA-N 0.000 description 3
- KRPKYGOFYUNIGM-XVSYOHENSA-N Thr-Asp-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O KRPKYGOFYUNIGM-XVSYOHENSA-N 0.000 description 3
- FQPDRTDDEZXCEC-SVSWQMSJSA-N Thr-Ile-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O FQPDRTDDEZXCEC-SVSWQMSJSA-N 0.000 description 3
- KKPOGALELPLJTL-MEYUZBJRSA-N Thr-Lys-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KKPOGALELPLJTL-MEYUZBJRSA-N 0.000 description 3
- TZQWJCGVCIJDMU-HEIBUPTGSA-N Thr-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)O)N)O TZQWJCGVCIJDMU-HEIBUPTGSA-N 0.000 description 3
- VYVBSMCZNHOZGD-RCWTZXSCSA-N Thr-Val-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O VYVBSMCZNHOZGD-RCWTZXSCSA-N 0.000 description 3
- ARSHSYUZHSIYKR-ACRUOGEOSA-N Tyr-His-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ARSHSYUZHSIYKR-ACRUOGEOSA-N 0.000 description 3
- QFXVAFIHVWXXBJ-AVGNSLFASA-N Tyr-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O QFXVAFIHVWXXBJ-AVGNSLFASA-N 0.000 description 3
- CVUDMNSZAIZFAE-UHFFFAOYSA-N Val-Arg-Pro Natural products NC(N)=NCCCC(NC(=O)C(N)C(C)C)C(=O)N1CCCC1C(O)=O CVUDMNSZAIZFAE-UHFFFAOYSA-N 0.000 description 3
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 3
- NZGOVKLVQNOEKP-YDHLFZDLSA-N Val-Phe-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NZGOVKLVQNOEKP-YDHLFZDLSA-N 0.000 description 3
- GUIYPEKUEMQBIK-JSGCOSHPSA-N Val-Tyr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)NCC(O)=O GUIYPEKUEMQBIK-JSGCOSHPSA-N 0.000 description 3
- GTACFKZDQFTVAI-STECZYCISA-N Val-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=C(O)C=C1 GTACFKZDQFTVAI-STECZYCISA-N 0.000 description 3
- NLNCNKIVJPEFBC-DLOVCJGASA-N Val-Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O NLNCNKIVJPEFBC-DLOVCJGASA-N 0.000 description 3
- 230000032683 aging Effects 0.000 description 3
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 3
- 108010041407 alanylaspartic acid Proteins 0.000 description 3
- 229930013930 alkaloid Natural products 0.000 description 3
- 238000000137 annealing Methods 0.000 description 3
- 108010038633 aspartylglutamate Proteins 0.000 description 3
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 3
- 230000004071 biological effect Effects 0.000 description 3
- 230000032823 cell division Effects 0.000 description 3
- 238000007385 chemical modification Methods 0.000 description 3
- 108010016616 cysteinylglycine Proteins 0.000 description 3
- 230000006378 damage Effects 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 235000013399 edible fruits Nutrition 0.000 description 3
- 239000012636 effector Substances 0.000 description 3
- 230000002349 favourable effect Effects 0.000 description 3
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 3
- 108010089804 glycyl-threonine Proteins 0.000 description 3
- 108010010147 glycylglutamine Proteins 0.000 description 3
- 229940097068 glyphosate Drugs 0.000 description 3
- XDDAORKBJWWYJS-UHFFFAOYSA-M glyphosate(1-) Chemical compound OP(O)(=O)CNCC([O-])=O XDDAORKBJWWYJS-UHFFFAOYSA-M 0.000 description 3
- 238000003306 harvesting Methods 0.000 description 3
- 239000004009 herbicide Substances 0.000 description 3
- 108010036413 histidylglycine Proteins 0.000 description 3
- 108010025306 histidylleucine Proteins 0.000 description 3
- 238000007901 in situ hybridization Methods 0.000 description 3
- 238000000338 in vitro Methods 0.000 description 3
- 238000001727 in vivo Methods 0.000 description 3
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 108010056582 methionylglutamic acid Proteins 0.000 description 3
- 230000003505 mutagenic effect Effects 0.000 description 3
- 102000039446 nucleic acids Human genes 0.000 description 3
- 108020004707 nucleic acids Proteins 0.000 description 3
- 150000007523 nucleic acids Chemical class 0.000 description 3
- 239000005022 packaging material Substances 0.000 description 3
- 150000004713 phosphodiesters Chemical class 0.000 description 3
- PTMHPRAIXMAOOB-UHFFFAOYSA-L phosphoramidate Chemical compound NP([O-])([O-])=O PTMHPRAIXMAOOB-UHFFFAOYSA-L 0.000 description 3
- 102000054765 polymorphisms of proteins Human genes 0.000 description 3
- 239000002243 precursor Substances 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 230000008263 repair mechanism Effects 0.000 description 3
- 230000001850 reproductive effect Effects 0.000 description 3
- 235000019515 salmon Nutrition 0.000 description 3
- 230000002269 spontaneous effect Effects 0.000 description 3
- 230000005030 transcription termination Effects 0.000 description 3
- 239000013603 viral vector Substances 0.000 description 3
- 241000228158 x Triticosecale Species 0.000 description 3
- AXFMEGAFCUULFV-BLFANLJRSA-N (2s)-2-[[(2s)-1-[(2s,3r)-2-amino-3-methylpentanoyl]pyrrolidine-2-carbonyl]amino]pentanedioic acid Chemical compound CC[C@@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AXFMEGAFCUULFV-BLFANLJRSA-N 0.000 description 2
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 2
- LRFVTYWOQMYALW-UHFFFAOYSA-N 9H-xanthine Chemical compound O=C1NC(=O)NC2=C1NC=N2 LRFVTYWOQMYALW-UHFFFAOYSA-N 0.000 description 2
- 240000004507 Abelmoschus esculentus Species 0.000 description 2
- 241000218642 Abies Species 0.000 description 2
- 108010000700 Acetolactate synthase Proteins 0.000 description 2
- HGINCPLSRVDWNT-UHFFFAOYSA-N Acrolein Chemical compound C=CC=O HGINCPLSRVDWNT-UHFFFAOYSA-N 0.000 description 2
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 2
- FOWHQTWRLFTELJ-FXQIFTODSA-N Ala-Asp-Met Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N FOWHQTWRLFTELJ-FXQIFTODSA-N 0.000 description 2
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 2
- DHBKYZYFEXXUAK-ONGXEEELSA-N Ala-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 DHBKYZYFEXXUAK-ONGXEEELSA-N 0.000 description 2
- FQNILRVJOJBFFC-FXQIFTODSA-N Ala-Pro-Asp Chemical compound C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N FQNILRVJOJBFFC-FXQIFTODSA-N 0.000 description 2
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 2
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 2
- HCBKAOZYACJUEF-XQXXSGGOSA-N Ala-Thr-Gln Chemical compound N[C@@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(N)=O)C(=O)O HCBKAOZYACJUEF-XQXXSGGOSA-N 0.000 description 2
- IYKVSFNGSWTTNZ-GUBZILKMSA-N Ala-Val-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IYKVSFNGSWTTNZ-GUBZILKMSA-N 0.000 description 2
- LYILPUNCKACNGF-NAKRPEOUSA-N Ala-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)N LYILPUNCKACNGF-NAKRPEOUSA-N 0.000 description 2
- 244000291564 Allium cepa Species 0.000 description 2
- 235000007119 Ananas comosus Nutrition 0.000 description 2
- 241000219194 Arabidopsis Species 0.000 description 2
- 101100148680 Arabidopsis thaliana SAG12 gene Proteins 0.000 description 2
- NUBPTCMEOCKWDO-DCAQKATOSA-N Arg-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N NUBPTCMEOCKWDO-DCAQKATOSA-N 0.000 description 2
- GNYUVVJYGJFKHN-RVMXOQNASA-N Arg-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N GNYUVVJYGJFKHN-RVMXOQNASA-N 0.000 description 2
- JEOCWTUOMKEEMF-RHYQMDGZSA-N Arg-Leu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEOCWTUOMKEEMF-RHYQMDGZSA-N 0.000 description 2
- MTYLORHAQXVQOW-AVGNSLFASA-N Arg-Lys-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O MTYLORHAQXVQOW-AVGNSLFASA-N 0.000 description 2
- NYDIVDKTULRINZ-AVGNSLFASA-N Arg-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NYDIVDKTULRINZ-AVGNSLFASA-N 0.000 description 2
- DPLFNLDACGGBAK-KKUMJFAQSA-N Arg-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N DPLFNLDACGGBAK-KKUMJFAQSA-N 0.000 description 2
- PSUXEQYPYZLNER-QXEWZRGKSA-N Arg-Val-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PSUXEQYPYZLNER-QXEWZRGKSA-N 0.000 description 2
- XEOXPCNONWHHSW-AVGNSLFASA-N Arg-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N XEOXPCNONWHHSW-AVGNSLFASA-N 0.000 description 2
- SUMJNGAMIQSNGX-TUAOUCFPSA-N Arg-Val-Pro Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N1CCC[C@@H]1C(O)=O SUMJNGAMIQSNGX-TUAOUCFPSA-N 0.000 description 2
- 241001494510 Arundo Species 0.000 description 2
- VJTWLBMESLDOMK-WDSKDSINSA-N Asn-Gln-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VJTWLBMESLDOMK-WDSKDSINSA-N 0.000 description 2
- KLKHFFMNGWULBN-VKHMYHEASA-N Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)NCC(O)=O KLKHFFMNGWULBN-VKHMYHEASA-N 0.000 description 2
- WONGRTVAMHFGBE-WDSKDSINSA-N Asn-Gly-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N WONGRTVAMHFGBE-WDSKDSINSA-N 0.000 description 2
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 2
- IKLAUGBIDCDFOY-SRVKXCTJSA-N Asn-His-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O IKLAUGBIDCDFOY-SRVKXCTJSA-N 0.000 description 2
- GQRDIVQPSMPQME-ZPFDUUQYSA-N Asn-Ile-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O GQRDIVQPSMPQME-ZPFDUUQYSA-N 0.000 description 2
- GIQCDTKOIPUDSG-GARJFASQSA-N Asn-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N)C(=O)O GIQCDTKOIPUDSG-GARJFASQSA-N 0.000 description 2
- BKZFBJYIVSBXCO-KKUMJFAQSA-N Asn-Phe-His Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O BKZFBJYIVSBXCO-KKUMJFAQSA-N 0.000 description 2
- BCADFFUQHIMQAA-KKHAAJSZSA-N Asn-Thr-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BCADFFUQHIMQAA-KKHAAJSZSA-N 0.000 description 2
- DPWDPEVGACCWTC-SRVKXCTJSA-N Asn-Tyr-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O DPWDPEVGACCWTC-SRVKXCTJSA-N 0.000 description 2
- TVVYVAUGRHNTGT-UGYAYLCHSA-N Asp-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O TVVYVAUGRHNTGT-UGYAYLCHSA-N 0.000 description 2
- KHBLRHKVXICFMY-GUBZILKMSA-N Asp-Glu-Lys Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O KHBLRHKVXICFMY-GUBZILKMSA-N 0.000 description 2
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 2
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 2
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 2
- HKEZZWQWXWGASX-KKUMJFAQSA-N Asp-Leu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 HKEZZWQWXWGASX-KKUMJFAQSA-N 0.000 description 2
- LIVXPXUVXFRWNY-CIUDSAMLSA-N Asp-Lys-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O LIVXPXUVXFRWNY-CIUDSAMLSA-N 0.000 description 2
- MYLZFUMPZCPJCJ-NHCYSSNCSA-N Asp-Lys-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MYLZFUMPZCPJCJ-NHCYSSNCSA-N 0.000 description 2
- IOXWDLNHXZOXQP-FXQIFTODSA-N Asp-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N IOXWDLNHXZOXQP-FXQIFTODSA-N 0.000 description 2
- FAUPLTGRUBTXNU-FXQIFTODSA-N Asp-Pro-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O FAUPLTGRUBTXNU-FXQIFTODSA-N 0.000 description 2
- CUQDCPXNZPDYFQ-ZLUOBGJFSA-N Asp-Ser-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O CUQDCPXNZPDYFQ-ZLUOBGJFSA-N 0.000 description 2
- DRCOAZZDQRCGGP-GHCJXIJMSA-N Asp-Ser-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DRCOAZZDQRCGGP-GHCJXIJMSA-N 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 235000021533 Beta vulgaris Nutrition 0.000 description 2
- 241000335053 Beta vulgaris Species 0.000 description 2
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 description 2
- 235000017647 Brassica oleracea var italica Nutrition 0.000 description 2
- 240000004160 Capsicum annuum Species 0.000 description 2
- 240000008574 Capsicum frutescens Species 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- 235000003255 Carthamus tinctorius Nutrition 0.000 description 2
- 244000020518 Carthamus tinctorius Species 0.000 description 2
- 108010022172 Chitinases Proteins 0.000 description 2
- 108091028075 Circular RNA Proteins 0.000 description 2
- 244000241235 Citrullus lanatus Species 0.000 description 2
- 108091004554 Copper Transport Proteins Proteins 0.000 description 2
- 108091006566 Copper transporters Proteins 0.000 description 2
- 102000037773 Copper transporters Human genes 0.000 description 2
- 241000219112 Cucumis Species 0.000 description 2
- 240000008067 Cucumis sativus Species 0.000 description 2
- LBOLGUYQEPZSKM-YUMQZZPRSA-N Cys-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CS)N LBOLGUYQEPZSKM-YUMQZZPRSA-N 0.000 description 2
- 238000001712 DNA sequencing Methods 0.000 description 2
- 101100268840 Danio rerio chrna1 gene Proteins 0.000 description 2
- 235000009355 Dianthus caryophyllus Nutrition 0.000 description 2
- 240000006497 Dianthus caryophyllus Species 0.000 description 2
- 235000001950 Elaeis guineensis Nutrition 0.000 description 2
- 244000166124 Eucalyptus globulus Species 0.000 description 2
- 241000234642 Festuca Species 0.000 description 2
- 229920001917 Ficoll Polymers 0.000 description 2
- 240000009088 Fragaria x ananassa Species 0.000 description 2
- 235000011363 Fragaria x ananassa Nutrition 0.000 description 2
- YJIUYQKQBBQYHZ-ACZMJKKPSA-N Gln-Ala-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YJIUYQKQBBQYHZ-ACZMJKKPSA-N 0.000 description 2
- MWLYSLMKFXWZPW-ZPFDUUQYSA-N Gln-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCC(N)=O MWLYSLMKFXWZPW-ZPFDUUQYSA-N 0.000 description 2
- LMPBBFWHCRURJD-LAEOZQHASA-N Gln-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N LMPBBFWHCRURJD-LAEOZQHASA-N 0.000 description 2
- KDXKFBSNIJYNNR-YVNDNENWSA-N Gln-Glu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDXKFBSNIJYNNR-YVNDNENWSA-N 0.000 description 2
- JKGHMESJHRTHIC-SIUGBPQLSA-N Gln-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JKGHMESJHRTHIC-SIUGBPQLSA-N 0.000 description 2
- QKWBEMCLYTYBNI-GVXVVHGQSA-N Gln-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(N)=O QKWBEMCLYTYBNI-GVXVVHGQSA-N 0.000 description 2
- SFAFZYYMAWOCIC-KKUMJFAQSA-N Gln-Phe-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N SFAFZYYMAWOCIC-KKUMJFAQSA-N 0.000 description 2
- FNAJNWPDTIXYJN-CIUDSAMLSA-N Gln-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O FNAJNWPDTIXYJN-CIUDSAMLSA-N 0.000 description 2
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 2
- WIMVKDYAKRAUCG-IHRRRGAJSA-N Gln-Tyr-Glu Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O WIMVKDYAKRAUCG-IHRRRGAJSA-N 0.000 description 2
- IRDASPPCLZIERZ-XHNCKOQMSA-N Glu-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N IRDASPPCLZIERZ-XHNCKOQMSA-N 0.000 description 2
- NLKVNZUFDPWPNL-YUMQZZPRSA-N Glu-Arg-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O NLKVNZUFDPWPNL-YUMQZZPRSA-N 0.000 description 2
- OXEMJGCAJFFREE-FXQIFTODSA-N Glu-Gln-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O OXEMJGCAJFFREE-FXQIFTODSA-N 0.000 description 2
- IQACOVZVOMVILH-FXQIFTODSA-N Glu-Glu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O IQACOVZVOMVILH-FXQIFTODSA-N 0.000 description 2
- UHVIQGKBMXEVGN-WDSKDSINSA-N Glu-Gly-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O UHVIQGKBMXEVGN-WDSKDSINSA-N 0.000 description 2
- KRGZZKWSBGPLKL-IUCAKERBSA-N Glu-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N KRGZZKWSBGPLKL-IUCAKERBSA-N 0.000 description 2
- ZCOJVESMNGBGLF-GRLWGSQLSA-N Glu-Ile-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZCOJVESMNGBGLF-GRLWGSQLSA-N 0.000 description 2
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 2
- FBEJIDRSQCGFJI-GUBZILKMSA-N Glu-Leu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FBEJIDRSQCGFJI-GUBZILKMSA-N 0.000 description 2
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 2
- SOEPMWQCTJITPZ-SRVKXCTJSA-N Glu-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N SOEPMWQCTJITPZ-SRVKXCTJSA-N 0.000 description 2
- RFTVTKBHDXCEEX-WDSKDSINSA-N Glu-Ser-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RFTVTKBHDXCEEX-WDSKDSINSA-N 0.000 description 2
- QOXDAWODGSIDDI-GUBZILKMSA-N Glu-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N QOXDAWODGSIDDI-GUBZILKMSA-N 0.000 description 2
- BXSZPACYCMNKLS-AVGNSLFASA-N Glu-Ser-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BXSZPACYCMNKLS-AVGNSLFASA-N 0.000 description 2
- RLFSBAPJTYKSLG-WHFBIAKZSA-N Gly-Ala-Asp Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O RLFSBAPJTYKSLG-WHFBIAKZSA-N 0.000 description 2
- JLJLBWDKDRYOPA-RYUDHWBXSA-N Gly-Gln-Tyr Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JLJLBWDKDRYOPA-RYUDHWBXSA-N 0.000 description 2
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 2
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 2
- IXHQLZIWBCQBLQ-STQMWFEESA-N Gly-Pro-Phe Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IXHQLZIWBCQBLQ-STQMWFEESA-N 0.000 description 2
- MUGLKCQHTUFLGF-WPRPVWTQSA-N Gly-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)CN MUGLKCQHTUFLGF-WPRPVWTQSA-N 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- 235000010469 Glycine max Nutrition 0.000 description 2
- 244000068988 Glycine max Species 0.000 description 2
- 244000299507 Gossypium hirsutum Species 0.000 description 2
- BDHUXUFYNUOUIT-SRVKXCTJSA-N His-Asp-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BDHUXUFYNUOUIT-SRVKXCTJSA-N 0.000 description 2
- VHHYJBSXXMPQGZ-AVGNSLFASA-N His-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N VHHYJBSXXMPQGZ-AVGNSLFASA-N 0.000 description 2
- FZKFYOXDVWDELO-KBPBESRZSA-N His-Gly-Tyr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O FZKFYOXDVWDELO-KBPBESRZSA-N 0.000 description 2
- FSOXZQBMPBQKGJ-QSFUFRPTSA-N His-Ile-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]([NH3+])CC1=CN=CN1 FSOXZQBMPBQKGJ-QSFUFRPTSA-N 0.000 description 2
- MLZVJIREOKTDAR-SIGLWIIPSA-N His-Ile-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MLZVJIREOKTDAR-SIGLWIIPSA-N 0.000 description 2
- XGBVLRJLHUVCNK-DCAQKATOSA-N His-Val-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O XGBVLRJLHUVCNK-DCAQKATOSA-N 0.000 description 2
- 101000655467 Homo sapiens Multidrug and toxin extrusion protein 1 Proteins 0.000 description 2
- 240000005979 Hordeum vulgare Species 0.000 description 2
- 235000007340 Hordeum vulgare Nutrition 0.000 description 2
- IDAHFEPYTJJZFD-PEFMBERDSA-N Ile-Asp-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N IDAHFEPYTJJZFD-PEFMBERDSA-N 0.000 description 2
- SLQVFYWBGNNOTK-BYULHYEWSA-N Ile-Gly-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N SLQVFYWBGNNOTK-BYULHYEWSA-N 0.000 description 2
- AXNGDPAKKCEKGY-QPHKQPEJSA-N Ile-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N AXNGDPAKKCEKGY-QPHKQPEJSA-N 0.000 description 2
- KLBVGHCGHUNHEA-BJDJZHNGSA-N Ile-Leu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)O)N KLBVGHCGHUNHEA-BJDJZHNGSA-N 0.000 description 2
- SVZFKLBRCYCIIY-CYDGBPFRSA-N Ile-Pro-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SVZFKLBRCYCIIY-CYDGBPFRSA-N 0.000 description 2
- KBDIBHQICWDGDL-PPCPHDFISA-N Ile-Thr-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N KBDIBHQICWDGDL-PPCPHDFISA-N 0.000 description 2
- WCNWGAUZWWSYDG-SVSWQMSJSA-N Ile-Thr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)O)N WCNWGAUZWWSYDG-SVSWQMSJSA-N 0.000 description 2
- DZMWFIRHFFVBHS-ZEWNOJEFSA-N Ile-Tyr-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N DZMWFIRHFFVBHS-ZEWNOJEFSA-N 0.000 description 2
- ZYVTXBXHIKGZMD-QSFUFRPTSA-N Ile-Val-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ZYVTXBXHIKGZMD-QSFUFRPTSA-N 0.000 description 2
- 229930010555 Inosine Natural products 0.000 description 2
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 2
- 108010065920 Insulin Lispro Proteins 0.000 description 2
- 241000221089 Jatropha Species 0.000 description 2
- TYYLDKGBCJGJGW-UHFFFAOYSA-N L-tryptophan-L-tyrosine Natural products C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 TYYLDKGBCJGJGW-UHFFFAOYSA-N 0.000 description 2
- 235000003228 Lactuca sativa Nutrition 0.000 description 2
- 240000008415 Lactuca sativa Species 0.000 description 2
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 2
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 2
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 2
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 2
- WGNOPSQMIQERPK-GARJFASQSA-N Leu-Asn-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N WGNOPSQMIQERPK-GARJFASQSA-N 0.000 description 2
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 2
- WCTCIIAGNMFYAO-DCAQKATOSA-N Leu-Cys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O WCTCIIAGNMFYAO-DCAQKATOSA-N 0.000 description 2
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 2
- DPWGZWUMUUJQDT-IUCAKERBSA-N Leu-Gln-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O DPWGZWUMUUJQDT-IUCAKERBSA-N 0.000 description 2
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 2
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 2
- PRZVBIAOPFGAQF-SRVKXCTJSA-N Leu-Glu-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O PRZVBIAOPFGAQF-SRVKXCTJSA-N 0.000 description 2
- HGFGEMSVBMCFKK-MNXVOIDGSA-N Leu-Ile-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HGFGEMSVBMCFKK-MNXVOIDGSA-N 0.000 description 2
- JKSIBWITFMQTOA-XUXIUFHCSA-N Leu-Ile-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O JKSIBWITFMQTOA-XUXIUFHCSA-N 0.000 description 2
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 2
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 2
- ONPJGOIVICHWBW-BZSNNMDCSA-N Leu-Lys-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 ONPJGOIVICHWBW-BZSNNMDCSA-N 0.000 description 2
- NJMXCOOEFLMZSR-AVGNSLFASA-N Leu-Met-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O NJMXCOOEFLMZSR-AVGNSLFASA-N 0.000 description 2
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 2
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 2
- KIZIOFNVSOSKJI-CIUDSAMLSA-N Leu-Ser-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N KIZIOFNVSOSKJI-CIUDSAMLSA-N 0.000 description 2
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 2
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 2
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 2
- 241000209510 Liliopsida Species 0.000 description 2
- 235000004431 Linum usitatissimum Nutrition 0.000 description 2
- 240000006240 Linum usitatissimum Species 0.000 description 2
- 241000209082 Lolium Species 0.000 description 2
- 241000219745 Lupinus Species 0.000 description 2
- DGAAQRAUOFHBFJ-CIUDSAMLSA-N Lys-Asn-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O DGAAQRAUOFHBFJ-CIUDSAMLSA-N 0.000 description 2
- 108010062166 Lys-Asn-Asp Proteins 0.000 description 2
- IBQMEXQYZMVIFU-SRVKXCTJSA-N Lys-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N IBQMEXQYZMVIFU-SRVKXCTJSA-N 0.000 description 2
- MWVUEPNEPWMFBD-SRVKXCTJSA-N Lys-Cys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCCCN MWVUEPNEPWMFBD-SRVKXCTJSA-N 0.000 description 2
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 2
- VEGLGAOVLFODGC-GUBZILKMSA-N Lys-Glu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VEGLGAOVLFODGC-GUBZILKMSA-N 0.000 description 2
- NJNRBRKHOWSGMN-SRVKXCTJSA-N Lys-Leu-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O NJNRBRKHOWSGMN-SRVKXCTJSA-N 0.000 description 2
- MUXNCRWTWBMNHX-SRVKXCTJSA-N Lys-Leu-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O MUXNCRWTWBMNHX-SRVKXCTJSA-N 0.000 description 2
- VMTYLUGCXIEDMV-QWRGUYRKSA-N Lys-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN VMTYLUGCXIEDMV-QWRGUYRKSA-N 0.000 description 2
- ZJWIXBZTAAJERF-IHRRRGAJSA-N Lys-Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZJWIXBZTAAJERF-IHRRRGAJSA-N 0.000 description 2
- YDDDRTIPNTWGIG-SRVKXCTJSA-N Lys-Lys-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O YDDDRTIPNTWGIG-SRVKXCTJSA-N 0.000 description 2
- SKUOQDYMJFUMOE-ULQDDVLXSA-N Lys-Met-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N SKUOQDYMJFUMOE-ULQDDVLXSA-N 0.000 description 2
- MTBBHUKKPWKXBT-ULQDDVLXSA-N Lys-Met-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MTBBHUKKPWKXBT-ULQDDVLXSA-N 0.000 description 2
- MSSJJDVQTFTLIF-KBPBESRZSA-N Lys-Phe-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O MSSJJDVQTFTLIF-KBPBESRZSA-N 0.000 description 2
- RPWTZTBIFGENIA-VOAKCMCISA-N Lys-Thr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RPWTZTBIFGENIA-VOAKCMCISA-N 0.000 description 2
- YKBSXQFZWFXFIB-VOAKCMCISA-N Lys-Thr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O YKBSXQFZWFXFIB-VOAKCMCISA-N 0.000 description 2
- VWPJQIHBBOJWDN-DCAQKATOSA-N Lys-Val-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O VWPJQIHBBOJWDN-DCAQKATOSA-N 0.000 description 2
- 240000004658 Medicago sativa Species 0.000 description 2
- 235000010624 Medicago sativa Nutrition 0.000 description 2
- VZBXCMCHIHEPBL-SRVKXCTJSA-N Met-Glu-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN VZBXCMCHIHEPBL-SRVKXCTJSA-N 0.000 description 2
- ZEVPMOHYCQFWSE-NAKRPEOUSA-N Met-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCSC)N ZEVPMOHYCQFWSE-NAKRPEOUSA-N 0.000 description 2
- JYPITOUIQVSCKM-IHRRRGAJSA-N Met-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCSC)N JYPITOUIQVSCKM-IHRRRGAJSA-N 0.000 description 2
- KMSMNUFBNCHMII-IHRRRGAJSA-N Met-Leu-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN KMSMNUFBNCHMII-IHRRRGAJSA-N 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 108091092878 Microsatellite Proteins 0.000 description 2
- YNAVUWVOSKDBBP-UHFFFAOYSA-N Morpholine Chemical compound C1COCCN1 YNAVUWVOSKDBBP-UHFFFAOYSA-N 0.000 description 2
- 102100032877 Multidrug and toxin extrusion protein 1 Human genes 0.000 description 2
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 2
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 2
- VZUNGTLZRAYYDE-UHFFFAOYSA-N N-methyl-N'-nitro-N-nitrosoguanidine Chemical compound O=NN(C)C(=N)N[N+]([O-])=O VZUNGTLZRAYYDE-UHFFFAOYSA-N 0.000 description 2
- 108010066427 N-valyltryptophan Proteins 0.000 description 2
- 101150102029 NUP1 gene Proteins 0.000 description 2
- 241001230286 Narenga Species 0.000 description 2
- PWHVEHULNLETOV-UHFFFAOYSA-N Nic-1 Natural products C12OC2C2(O)CC=CC(=O)C2(C)C(CCC2=C3)C1C2=CC=C3C(C)C1OC(O)C2(C)OC2(C)C1 PWHVEHULNLETOV-UHFFFAOYSA-N 0.000 description 2
- 241000207746 Nicotiana benthamiana Species 0.000 description 2
- 241000493375 Nicotiana quadrivalvis Species 0.000 description 2
- 241001144498 Nicotiana rosulata subsp. ingulba Species 0.000 description 2
- MYKUKUCHPMASKF-UHFFFAOYSA-N Nornicotine Natural products C1CCNC1C1=CC=CN=C1 MYKUKUCHPMASKF-UHFFFAOYSA-N 0.000 description 2
- 238000000636 Northern blotting Methods 0.000 description 2
- 108010061618 O-succinylhomoserine (thiol)-lyase Proteins 0.000 description 2
- 240000007594 Oryza sativa Species 0.000 description 2
- 235000007164 Oryza sativa Nutrition 0.000 description 2
- 241000209117 Panicum Species 0.000 description 2
- 235000006443 Panicum miliaceum subsp. miliaceum Nutrition 0.000 description 2
- 235000009037 Panicum miliaceum subsp. ruderale Nutrition 0.000 description 2
- 235000007195 Pennisetum typhoides Nutrition 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- 244000081757 Phalaris arundinacea Species 0.000 description 2
- BKWJQWJPZMUWEG-LFSVMHDDSA-N Phe-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 BKWJQWJPZMUWEG-LFSVMHDDSA-N 0.000 description 2
- ZWJKVFAYPLPCQB-UNQGMJICSA-N Phe-Arg-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O ZWJKVFAYPLPCQB-UNQGMJICSA-N 0.000 description 2
- UNLYPPYNDXHGDG-IHRRRGAJSA-N Phe-Gln-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UNLYPPYNDXHGDG-IHRRRGAJSA-N 0.000 description 2
- PSKRILMFHNIUAO-JYJNAYRXSA-N Phe-Glu-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N PSKRILMFHNIUAO-JYJNAYRXSA-N 0.000 description 2
- JWQWPTLEOFNCGX-AVGNSLFASA-N Phe-Glu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 JWQWPTLEOFNCGX-AVGNSLFASA-N 0.000 description 2
- LWPMGKSZPKFKJD-DZKIICNBSA-N Phe-Glu-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O LWPMGKSZPKFKJD-DZKIICNBSA-N 0.000 description 2
- RYQWALWYQWBUKN-FHWLQOOXSA-N Phe-Phe-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RYQWALWYQWBUKN-FHWLQOOXSA-N 0.000 description 2
- GMWNQSGWWGKTSF-LFSVMHDDSA-N Phe-Thr-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O GMWNQSGWWGKTSF-LFSVMHDDSA-N 0.000 description 2
- YRHRGNUAXGUPTO-PMVMPFDFSA-N Phe-Trp-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CCCCN)C(=O)O)N YRHRGNUAXGUPTO-PMVMPFDFSA-N 0.000 description 2
- QTDBZORPVYTRJU-KKXDTOCCSA-N Phe-Tyr-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O QTDBZORPVYTRJU-KKXDTOCCSA-N 0.000 description 2
- 235000011613 Pinus brutia Nutrition 0.000 description 2
- DRVIASBABBMZTF-GUBZILKMSA-N Pro-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@@H]1CCCN1 DRVIASBABBMZTF-GUBZILKMSA-N 0.000 description 2
- CQZNGNCAIXMAIQ-UBHSHLNASA-N Pro-Ala-Phe Chemical compound C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O CQZNGNCAIXMAIQ-UBHSHLNASA-N 0.000 description 2
- ICTZKEXYDDZZFP-SRVKXCTJSA-N Pro-Arg-Pro Chemical compound N([C@@H](CCCN=C(N)N)C(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 ICTZKEXYDDZZFP-SRVKXCTJSA-N 0.000 description 2
- FUVBEZJCRMHWEM-FXQIFTODSA-N Pro-Asn-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FUVBEZJCRMHWEM-FXQIFTODSA-N 0.000 description 2
- VJLJGKQAOQJXJG-CIUDSAMLSA-N Pro-Asp-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJLJGKQAOQJXJG-CIUDSAMLSA-N 0.000 description 2
- WVOXLKUUVCCCSU-ZPFDUUQYSA-N Pro-Glu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVOXLKUUVCCCSU-ZPFDUUQYSA-N 0.000 description 2
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 2
- POQFNPILEQEODH-FXQIFTODSA-N Pro-Ser-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O POQFNPILEQEODH-FXQIFTODSA-N 0.000 description 2
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 2
- 101150041925 RBCS gene Proteins 0.000 description 2
- 101150051143 RBCS1 gene Proteins 0.000 description 2
- 101150111829 RBCS2 gene Proteins 0.000 description 2
- 108091030071 RNAI Proteins 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- 240000000528 Ricinus communis Species 0.000 description 2
- 235000004443 Ricinus communis Nutrition 0.000 description 2
- 235000011449 Rosa Nutrition 0.000 description 2
- MEFKEPWMEQBLKI-AIRLBKTGSA-N S-adenosyl-L-methioninate Chemical compound O[C@@H]1[C@H](O)[C@@H](C[S+](CC[C@H](N)C([O-])=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 MEFKEPWMEQBLKI-AIRLBKTGSA-N 0.000 description 2
- 101100081323 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) NUP2 gene Proteins 0.000 description 2
- 241000209051 Saccharum Species 0.000 description 2
- 108020005543 Satellite RNA Proteins 0.000 description 2
- 235000007238 Secale cereale Nutrition 0.000 description 2
- 244000082988 Secale cereale Species 0.000 description 2
- MPPHJZYXDVDGOF-BWBBJGPYSA-N Ser-Cys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CO MPPHJZYXDVDGOF-BWBBJGPYSA-N 0.000 description 2
- ZOHGLPQGEHSLPD-FXQIFTODSA-N Ser-Gln-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZOHGLPQGEHSLPD-FXQIFTODSA-N 0.000 description 2
- GWMXFEMMBHOKDX-AVGNSLFASA-N Ser-Gln-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 GWMXFEMMBHOKDX-AVGNSLFASA-N 0.000 description 2
- IOVHBRCQOGWAQH-ZKWXMUAHSA-N Ser-Gly-Ile Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOVHBRCQOGWAQH-ZKWXMUAHSA-N 0.000 description 2
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 2
- JIPVNVNKXJLFJF-BJDJZHNGSA-N Ser-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N JIPVNVNKXJLFJF-BJDJZHNGSA-N 0.000 description 2
- GVMUJUPXFQFBBZ-GUBZILKMSA-N Ser-Lys-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GVMUJUPXFQFBBZ-GUBZILKMSA-N 0.000 description 2
- LRZLZIUXQBIWTB-KATARQTJSA-N Ser-Lys-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRZLZIUXQBIWTB-KATARQTJSA-N 0.000 description 2
- UGTZYIPOBYXWRW-SRVKXCTJSA-N Ser-Phe-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O UGTZYIPOBYXWRW-SRVKXCTJSA-N 0.000 description 2
- DYEGLQRVMBWQLD-IXOXFDKPSA-N Ser-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CO)N)O DYEGLQRVMBWQLD-IXOXFDKPSA-N 0.000 description 2
- SIEBDTCABMZCLF-XGEHTFHBSA-N Ser-Val-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SIEBDTCABMZCLF-XGEHTFHBSA-N 0.000 description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 description 2
- 235000002597 Solanum melongena Nutrition 0.000 description 2
- 244000061458 Solanum melongena Species 0.000 description 2
- 235000002595 Solanum tuberosum Nutrition 0.000 description 2
- 244000061456 Solanum tuberosum Species 0.000 description 2
- 206010064127 Solar lentigo Diseases 0.000 description 2
- 241000746413 Spartina Species 0.000 description 2
- 241000251131 Sphyrna Species 0.000 description 2
- 235000009337 Spinacia oleracea Nutrition 0.000 description 2
- 244000300264 Spinacia oleracea Species 0.000 description 2
- 229920002472 Starch Polymers 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- 235000021536 Sugar beet Nutrition 0.000 description 2
- 244000269722 Thea sinensis Species 0.000 description 2
- 244000299461 Theobroma cacao Species 0.000 description 2
- 235000009470 Theobroma cacao Nutrition 0.000 description 2
- KEGBFULVYKYJRD-LFSVMHDDSA-N Thr-Ala-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KEGBFULVYKYJRD-LFSVMHDDSA-N 0.000 description 2
- DWYAUVCQDTZIJI-VZFHVOOUSA-N Thr-Ala-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DWYAUVCQDTZIJI-VZFHVOOUSA-N 0.000 description 2
- LYGKYFKSZTUXGZ-ZDLURKLDSA-N Thr-Cys-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)NCC(O)=O LYGKYFKSZTUXGZ-ZDLURKLDSA-N 0.000 description 2
- BDGBHYCAZJPLHX-HJGDQZAQSA-N Thr-Lys-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O BDGBHYCAZJPLHX-HJGDQZAQSA-N 0.000 description 2
- LECUEEHKUFYOOV-ZJDVBMNYSA-N Thr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)[C@@H](C)O LECUEEHKUFYOOV-ZJDVBMNYSA-N 0.000 description 2
- NJGMALCNYAMYCB-JRQIVUDYSA-N Thr-Tyr-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O NJGMALCNYAMYCB-JRQIVUDYSA-N 0.000 description 2
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 2
- 241000723573 Tobacco rattle virus Species 0.000 description 2
- 108010073062 Transcription Activator-Like Effectors Proteins 0.000 description 2
- 108700009124 Transcription Initiation Site Proteins 0.000 description 2
- 108020004566 Transfer RNA Proteins 0.000 description 2
- 235000021307 Triticum Nutrition 0.000 description 2
- 244000098338 Triticum aestivum Species 0.000 description 2
- FNOQJVHFVLVMOS-AAEUAGOBSA-N Trp-Gly-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N FNOQJVHFVLVMOS-AAEUAGOBSA-N 0.000 description 2
- UUIYFDAWNBSWPG-IHPCNDPISA-N Trp-Lys-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N UUIYFDAWNBSWPG-IHPCNDPISA-N 0.000 description 2
- KWTRGSQOQHZKIA-PMVMPFDFSA-N Trp-Lys-Tyr Chemical compound C([C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)CCCCN)C(O)=O)C1=CC=C(O)C=C1 KWTRGSQOQHZKIA-PMVMPFDFSA-N 0.000 description 2
- RQKMZXSRILVOQZ-GMVOTWDCSA-N Trp-Tyr-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N RQKMZXSRILVOQZ-GMVOTWDCSA-N 0.000 description 2
- NOOMDULIORCDNF-IRXDYDNUSA-N Tyr-Gly-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NOOMDULIORCDNF-IRXDYDNUSA-N 0.000 description 2
- USYGMBIIUDLYHJ-GVARAGBVSA-N Tyr-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 USYGMBIIUDLYHJ-GVARAGBVSA-N 0.000 description 2
- KSCVLGXNQXKUAR-JYJNAYRXSA-N Tyr-Leu-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KSCVLGXNQXKUAR-JYJNAYRXSA-N 0.000 description 2
- XDGPTBVOSHKDFT-KKUMJFAQSA-N Tyr-Met-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O XDGPTBVOSHKDFT-KKUMJFAQSA-N 0.000 description 2
- SYFHQHYTNCQCCN-MELADBBJSA-N Tyr-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O SYFHQHYTNCQCCN-MELADBBJSA-N 0.000 description 2
- LVFZXRQQQDTBQH-IRIUXVKKSA-N Tyr-Thr-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LVFZXRQQQDTBQH-IRIUXVKKSA-N 0.000 description 2
- AKKYBQGHUAWPJR-MNSWYVGCSA-N Tyr-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)O AKKYBQGHUAWPJR-MNSWYVGCSA-N 0.000 description 2
- NAHUCETZGZZSEX-IHPCNDPISA-N Tyr-Trp-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N NAHUCETZGZZSEX-IHPCNDPISA-N 0.000 description 2
- UDNYEPLJTRDMEJ-RCOVLWMOSA-N Val-Asn-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N UDNYEPLJTRDMEJ-RCOVLWMOSA-N 0.000 description 2
- QHDXUYOYTPWCSK-RCOVLWMOSA-N Val-Asp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N QHDXUYOYTPWCSK-RCOVLWMOSA-N 0.000 description 2
- YCMXFKWYJFZFKS-LAEOZQHASA-N Val-Gln-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCMXFKWYJFZFKS-LAEOZQHASA-N 0.000 description 2
- CVIXTAITYJQMPE-LAEOZQHASA-N Val-Glu-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CVIXTAITYJQMPE-LAEOZQHASA-N 0.000 description 2
- FOADDSDHGRFUOC-DZKIICNBSA-N Val-Glu-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N FOADDSDHGRFUOC-DZKIICNBSA-N 0.000 description 2
- UEHRGZCNLSWGHK-DLOVCJGASA-N Val-Glu-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UEHRGZCNLSWGHK-DLOVCJGASA-N 0.000 description 2
- PTFPUAXGIKTVNN-ONGXEEELSA-N Val-His-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)NCC(=O)O)N PTFPUAXGIKTVNN-ONGXEEELSA-N 0.000 description 2
- XXWBHOWRARMUOC-NHCYSSNCSA-N Val-Lys-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N XXWBHOWRARMUOC-NHCYSSNCSA-N 0.000 description 2
- IJGPOONOTBNTFS-GVXVVHGQSA-N Val-Lys-Glu Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O IJGPOONOTBNTFS-GVXVVHGQSA-N 0.000 description 2
- NHXZRXLFOBFMDM-AVGNSLFASA-N Val-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C NHXZRXLFOBFMDM-AVGNSLFASA-N 0.000 description 2
- QIVPZSWBBHRNBA-JYJNAYRXSA-N Val-Pro-Phe Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O QIVPZSWBBHRNBA-JYJNAYRXSA-N 0.000 description 2
- DOFAQXCYFQKSHT-SRVKXCTJSA-N Val-Pro-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DOFAQXCYFQKSHT-SRVKXCTJSA-N 0.000 description 2
- MNSSBIHFEUUXNW-RCWTZXSCSA-N Val-Thr-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N MNSSBIHFEUUXNW-RCWTZXSCSA-N 0.000 description 2
- UQMPYVLTQCGRSK-IFFSRLJSSA-N Val-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N)O UQMPYVLTQCGRSK-IFFSRLJSSA-N 0.000 description 2
- AYHNXCJKBLYVOA-KSZLIROESA-N Val-Trp-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N3CCC[C@@H]3C(=O)O)N AYHNXCJKBLYVOA-KSZLIROESA-N 0.000 description 2
- SSKKGOWRPNIVDW-AVGNSLFASA-N Val-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N SSKKGOWRPNIVDW-AVGNSLFASA-N 0.000 description 2
- 241000726445 Viroids Species 0.000 description 2
- 240000006365 Vitis vinifera Species 0.000 description 2
- 235000014787 Vitis vinifera Nutrition 0.000 description 2
- 101001036768 Zea mays Glucose-1-phosphate adenylyltransferase large subunit 1, chloroplastic/amyloplastic Proteins 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 239000012190 activator Substances 0.000 description 2
- 101150063416 add gene Proteins 0.000 description 2
- 108010070944 alanylhistidine Proteins 0.000 description 2
- 108010011559 alanylphenylalanine Proteins 0.000 description 2
- 150000003797 alkaloid derivatives Chemical class 0.000 description 2
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 2
- 210000004507 artificial chromosome Anatomy 0.000 description 2
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 2
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 2
- 108010093581 aspartyl-proline Proteins 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000000711 cancerogenic effect Effects 0.000 description 2
- 150000001720 carbohydrates Chemical class 0.000 description 2
- 235000014633 carbohydrates Nutrition 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 231100000315 carcinogenic Toxicity 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 230000003197 catalytic effect Effects 0.000 description 2
- 150000001768 cations Chemical class 0.000 description 2
- 230000001055 chewing effect Effects 0.000 description 2
- 229930002875 chlorophyll Natural products 0.000 description 2
- 235000019804 chlorophyll Nutrition 0.000 description 2
- ATNHDLDRLWWWCB-AENOIHSZSA-M chlorophyll a Chemical compound C1([C@@H](C(=O)OC)C(=O)C2=C3C)=C2N2C3=CC(C(CC)=C3C)=[N+]4C3=CC3=C(C=C)C(C)=C5N3[Mg-2]42[N+]2=C1[C@@H](CCC(=O)OC\C=C(/C)CCC[C@H](C)CCC[C@H](C)CCCC(C)C)[C@H](C)C2=C5 ATNHDLDRLWWWCB-AENOIHSZSA-M 0.000 description 2
- 235000019506 cigar Nutrition 0.000 description 2
- 230000021615 conjugation Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 229960000633 dextran sulfate Drugs 0.000 description 2
- NAGJZTKCGNOGPW-UHFFFAOYSA-K dioxido-sulfanylidene-sulfido-$l^{5}-phosphane Chemical compound [O-]P([O-])([S-])=S NAGJZTKCGNOGPW-UHFFFAOYSA-K 0.000 description 2
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 210000002257 embryonic structure Anatomy 0.000 description 2
- 230000009088 enzymatic function Effects 0.000 description 2
- 238000001952 enzyme assay Methods 0.000 description 2
- 210000003527 eukaryotic cell Anatomy 0.000 description 2
- 230000004345 fruit ripening Effects 0.000 description 2
- ZZUFCTLCJUWOSV-UHFFFAOYSA-N furosemide Chemical compound C1=C(Cl)C(S(=O)(=O)N)=CC(C(O)=O)=C1NCC1=CC=CO1 ZZUFCTLCJUWOSV-UHFFFAOYSA-N 0.000 description 2
- 229960002449 glycine Drugs 0.000 description 2
- 230000013595 glycosylation Effects 0.000 description 2
- 238000006206 glycosylation reaction Methods 0.000 description 2
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 2
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 2
- 108010077515 glycylproline Proteins 0.000 description 2
- 108010084389 glycyltryptophan Proteins 0.000 description 2
- 235000021384 green leafy vegetables Nutrition 0.000 description 2
- 230000012010 growth Effects 0.000 description 2
- 230000002363 herbicidal effect Effects 0.000 description 2
- 108010045383 histidyl-glycyl-glutamic acid Proteins 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 230000000415 inactivating effect Effects 0.000 description 2
- 230000002779 inactivation Effects 0.000 description 2
- 239000000411 inducer Substances 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 239000004615 ingredient Substances 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 229960003786 inosine Drugs 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000005865 ionizing radiation Effects 0.000 description 2
- DRAVOWXCEBXPTN-UHFFFAOYSA-N isoguanine Chemical compound NC1=NC(=O)NC2=C1NC=N2 DRAVOWXCEBXPTN-UHFFFAOYSA-N 0.000 description 2
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 2
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 2
- 108010057821 leucylproline Proteins 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 108010022588 methionyl-lysyl-proline Proteins 0.000 description 2
- 238000000520 microinjection Methods 0.000 description 2
- 239000011859 microparticle Substances 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 231100000219 mutagenic Toxicity 0.000 description 2
- UMFJAHHVKNCGLG-UHFFFAOYSA-N n-Nitrosodimethylamine Chemical compound CN(C)N=O UMFJAHHVKNCGLG-UHFFFAOYSA-N 0.000 description 2
- GWWNCLHJCFNTJA-UHFFFAOYSA-N nicandrenone-2 Natural products C12OC2C2(O)CC=CC(=O)C2(C)C(CCC23C)C1C3CCC2(O)C(C)C1OC(O)C2(C)OC2(C)C1 GWWNCLHJCFNTJA-UHFFFAOYSA-N 0.000 description 2
- 108010058731 nopaline synthase Proteins 0.000 description 2
- 230000002018 overexpression Effects 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 238000010647 peptide synthesis reaction Methods 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 230000008635 plant growth Effects 0.000 description 2
- 230000010152 pollination Effects 0.000 description 2
- 210000004896 polypeptide structure Anatomy 0.000 description 2
- 229920000036 polyvinylpyrrolidone Polymers 0.000 description 2
- 235000013855 polyvinylpyrrolidone Nutrition 0.000 description 2
- 108010090894 prolylleucine Proteins 0.000 description 2
- 230000000384 rearing effect Effects 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 239000002336 ribonucleotide Substances 0.000 description 2
- 125000002652 ribonucleotide group Chemical group 0.000 description 2
- 150000003290 ribose derivatives Chemical group 0.000 description 2
- YGSDEFSMJLZEOE-UHFFFAOYSA-N salicylic acid Chemical compound OC(=O)C1=CC=CC=C1O YGSDEFSMJLZEOE-UHFFFAOYSA-N 0.000 description 2
- 238000010187 selection method Methods 0.000 description 2
- 230000010153 self-pollination Effects 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 108010048818 seryl-histidine Proteins 0.000 description 2
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 2
- 235000020354 squash Nutrition 0.000 description 2
- 239000008107 starch Substances 0.000 description 2
- 235000019698 starch Nutrition 0.000 description 2
- 239000003826 tablet Substances 0.000 description 2
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 2
- 108010061238 threonyl-glycine Proteins 0.000 description 2
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 2
- 229940113082 thymine Drugs 0.000 description 2
- 238000010361 transduction Methods 0.000 description 2
- 230000026683 transduction Effects 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 230000017105 transposition Effects 0.000 description 2
- 229940035893 uracil Drugs 0.000 description 2
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 2
- 108010073969 valyllysine Proteins 0.000 description 2
- 239000003981 vehicle Substances 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- 238000001262 western blot Methods 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- PJVXUVWGSCCGHT-ZPYZYFCMSA-N (2r,3s,4r,5r)-2,3,4,5,6-pentahydroxyhexanal;(3s,4r,5r)-1,3,4,5,6-pentahydroxyhexan-2-one Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C=O.OC[C@@H](O)[C@@H](O)[C@H](O)C(=O)CO PJVXUVWGSCCGHT-ZPYZYFCMSA-N 0.000 description 1
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 1
- KHWCHTKSEGGWEX-RRKCRQDMSA-N 2'-deoxyadenosine 5'-monophosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(O)=O)O1 KHWCHTKSEGGWEX-RRKCRQDMSA-N 0.000 description 1
- NCMVOABPESMRCP-SHYZEUOFSA-N 2'-deoxycytosine 5'-monophosphate Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)C1 NCMVOABPESMRCP-SHYZEUOFSA-N 0.000 description 1
- LTFMZDNNPPEQNG-KVQBGUIXSA-N 2'-deoxyguanosine 5'-monophosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@H]1C[C@H](O)[C@@H](COP(O)(O)=O)O1 LTFMZDNNPPEQNG-KVQBGUIXSA-N 0.000 description 1
- DQBQWWSFRPLIAX-UHFFFAOYSA-N 2-acetyl-1-pyrroline Chemical compound CC(=O)C1=NCCC1 DQBQWWSFRPLIAX-UHFFFAOYSA-N 0.000 description 1
- XQCZBXHVTFVIFE-UHFFFAOYSA-N 2-amino-4-hydroxypyrimidine Chemical compound NC1=NC=CC(O)=N1 XQCZBXHVTFVIFE-UHFFFAOYSA-N 0.000 description 1
- MWBWWFOAEOYUST-UHFFFAOYSA-N 2-aminopurine Chemical compound NC1=NC=C2N=CNC2=N1 MWBWWFOAEOYUST-UHFFFAOYSA-N 0.000 description 1
- LNCCBHFAHILMCT-UHFFFAOYSA-N 2-n,4-n,6-n-triethyl-1,3,5-triazine-2,4,6-triamine Chemical compound CCNC1=NC(NCC)=NC(NCC)=N1 LNCCBHFAHILMCT-UHFFFAOYSA-N 0.000 description 1
- UPMXNNIRAGDFEH-UHFFFAOYSA-N 3,5-dibromo-4-hydroxybenzonitrile Chemical compound OC1=C(Br)C=C(C#N)C=C1Br UPMXNNIRAGDFEH-UHFFFAOYSA-N 0.000 description 1
- HEGWNIMGIDYRAU-UHFFFAOYSA-N 3-hexyl-2,4-dioxabicyclo[1.1.0]butane Chemical compound O1C2OC21CCCCCC HEGWNIMGIDYRAU-UHFFFAOYSA-N 0.000 description 1
- CLUWOWRTHNNBBU-UHFFFAOYSA-N 3-methylthiopropanal Chemical compound CSCCC=O CLUWOWRTHNNBBU-UHFFFAOYSA-N 0.000 description 1
- AJBZENLMTKDAEK-UHFFFAOYSA-N 3a,5a,5b,8,8,11a-hexamethyl-1-prop-1-en-2-yl-1,2,3,4,5,6,7,7a,9,10,11,11b,12,13,13a,13b-hexadecahydrocyclopenta[a]chrysene-4,9-diol Chemical compound CC12CCC(O)C(C)(C)C1CCC(C1(C)CC3O)(C)C2CCC1C1C3(C)CCC1C(=C)C AJBZENLMTKDAEK-UHFFFAOYSA-N 0.000 description 1
- ARSRBNBHOADGJU-UHFFFAOYSA-N 7,12-dimethyltetraphene Chemical compound C1=CC2=CC=CC=C2C2=C1C(C)=C(C=CC=C1)C1=C2C ARSRBNBHOADGJU-UHFFFAOYSA-N 0.000 description 1
- PGYAYSRVSAJXTE-FTLOKQSXSA-N 9'-cis-neoxanthin Chemical compound C(\[C@]12[C@@](O1)(C)C[C@@H](O)CC2(C)C)=C/C(/C)=C\C=C\C(\C)=C\C=C\C=C(/C)\C=C\C=C(/C)C=C=C1C(C)(C)C[C@H](O)C[C@@]1(C)O PGYAYSRVSAJXTE-FTLOKQSXSA-N 0.000 description 1
- 230000005730 ADP ribosylation Effects 0.000 description 1
- 108091006112 ATPases Proteins 0.000 description 1
- 241001075517 Abelmoschus Species 0.000 description 1
- 235000003934 Abelmoschus esculentus Nutrition 0.000 description 1
- 241000207965 Acanthaceae Species 0.000 description 1
- 206010069754 Acquired gene mutation Diseases 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 102000057290 Adenosine Triphosphatases Human genes 0.000 description 1
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 1
- ZIWWTZWAKYBUOB-CIUDSAMLSA-N Ala-Asp-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O ZIWWTZWAKYBUOB-CIUDSAMLSA-N 0.000 description 1
- BTYTYHBSJKQBQA-GCJQMDKQSA-N Ala-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N)O BTYTYHBSJKQBQA-GCJQMDKQSA-N 0.000 description 1
- ZODMADSIQZZBSQ-FXQIFTODSA-N Ala-Gln-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZODMADSIQZZBSQ-FXQIFTODSA-N 0.000 description 1
- IFTVANMRTIHKML-WDSKDSINSA-N Ala-Gln-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O IFTVANMRTIHKML-WDSKDSINSA-N 0.000 description 1
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 1
- NWVVKQZOVSTDBQ-CIUDSAMLSA-N Ala-Glu-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NWVVKQZOVSTDBQ-CIUDSAMLSA-N 0.000 description 1
- GGNHBHYDMUDXQB-KBIXCLLPSA-N Ala-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)N GGNHBHYDMUDXQB-KBIXCLLPSA-N 0.000 description 1
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 1
- FBHOPGDGELNWRH-DRZSPHRISA-N Ala-Glu-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FBHOPGDGELNWRH-DRZSPHRISA-N 0.000 description 1
- ZPXCNXMJEZKRLU-LSJOCFKGSA-N Ala-His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 ZPXCNXMJEZKRLU-LSJOCFKGSA-N 0.000 description 1
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 1
- NYDBKUNVSALYPX-NAKRPEOUSA-N Ala-Ile-Arg Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NYDBKUNVSALYPX-NAKRPEOUSA-N 0.000 description 1
- VNYMOTCMNHJGTG-JBDRJPRFSA-N Ala-Ile-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O VNYMOTCMNHJGTG-JBDRJPRFSA-N 0.000 description 1
- LNNSWWRRYJLGNI-NAKRPEOUSA-N Ala-Ile-Val Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O LNNSWWRRYJLGNI-NAKRPEOUSA-N 0.000 description 1
- ZKEHTYWGPMMGBC-XUXIUFHCSA-N Ala-Leu-Leu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O ZKEHTYWGPMMGBC-XUXIUFHCSA-N 0.000 description 1
- FUKFQILQFQKHLE-DCAQKATOSA-N Ala-Lys-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O FUKFQILQFQKHLE-DCAQKATOSA-N 0.000 description 1
- CHFFHQUVXHEGBY-GARJFASQSA-N Ala-Lys-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N CHFFHQUVXHEGBY-GARJFASQSA-N 0.000 description 1
- XUCHENWTTBFODJ-FXQIFTODSA-N Ala-Met-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O XUCHENWTTBFODJ-FXQIFTODSA-N 0.000 description 1
- GFEDXKNBZMPEDM-KZVJFYERSA-N Ala-Met-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GFEDXKNBZMPEDM-KZVJFYERSA-N 0.000 description 1
- CYBJZLQSUJEMAS-LFSVMHDDSA-N Ala-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C)N)O CYBJZLQSUJEMAS-LFSVMHDDSA-N 0.000 description 1
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 1
- XQNRANMFRPCFFW-GCJQMDKQSA-N Ala-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C)N)O XQNRANMFRPCFFW-GCJQMDKQSA-N 0.000 description 1
- 241001136782 Alca Species 0.000 description 1
- 241000123646 Allioideae Species 0.000 description 1
- 241000234282 Allium Species 0.000 description 1
- 235000005255 Allium cepa Nutrition 0.000 description 1
- 235000002732 Allium cepa var. cepa Nutrition 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- 241000556588 Alstroemeria Species 0.000 description 1
- 241000556591 Alstroemeriaceae Species 0.000 description 1
- 240000008025 Alternanthera ficoidea Species 0.000 description 1
- 244000300297 Amaranthus hybridus Species 0.000 description 1
- 241000234270 Amaryllidaceae Species 0.000 description 1
- 241000746375 Andrographis Species 0.000 description 1
- 241000744007 Andropogon Species 0.000 description 1
- 241001327399 Andropogon gerardii Species 0.000 description 1
- 241000208327 Apocynaceae Species 0.000 description 1
- 241000219195 Arabidopsis thaliana Species 0.000 description 1
- 101100347707 Arabidopsis thaliana QPT gene Proteins 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- 241000233788 Arecaceae Species 0.000 description 1
- YUIGJDNAGKJLDO-JYJNAYRXSA-N Arg-Arg-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YUIGJDNAGKJLDO-JYJNAYRXSA-N 0.000 description 1
- IGULQRCJLQQPSM-DCAQKATOSA-N Arg-Cys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O IGULQRCJLQQPSM-DCAQKATOSA-N 0.000 description 1
- PTVGLOCPAVYPFG-CIUDSAMLSA-N Arg-Gln-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O PTVGLOCPAVYPFG-CIUDSAMLSA-N 0.000 description 1
- QAODJPUKWNNNRP-DCAQKATOSA-N Arg-Glu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QAODJPUKWNNNRP-DCAQKATOSA-N 0.000 description 1
- AQPVUEJJARLJHB-BQBZGAKWSA-N Arg-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N AQPVUEJJARLJHB-BQBZGAKWSA-N 0.000 description 1
- NVCIXQYNWYTLDO-IHRRRGAJSA-N Arg-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCN=C(N)N)N NVCIXQYNWYTLDO-IHRRRGAJSA-N 0.000 description 1
- YQGZIRIYGHNSQO-ZPFDUUQYSA-N Arg-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YQGZIRIYGHNSQO-ZPFDUUQYSA-N 0.000 description 1
- UZGFHWIJWPUPOH-IHRRRGAJSA-N Arg-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UZGFHWIJWPUPOH-IHRRRGAJSA-N 0.000 description 1
- YVTHEZNOKSAWRW-DCAQKATOSA-N Arg-Lys-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O YVTHEZNOKSAWRW-DCAQKATOSA-N 0.000 description 1
- CVXXSWQORBZAAA-SRVKXCTJSA-N Arg-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N CVXXSWQORBZAAA-SRVKXCTJSA-N 0.000 description 1
- XKDYWGLNSCNRGW-WDSOQIARSA-N Arg-Lys-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCN=C(N)N)CCCCN)C(O)=O)=CNC2=C1 XKDYWGLNSCNRGW-WDSOQIARSA-N 0.000 description 1
- HGKHPCFTRQDHCU-IUCAKERBSA-N Arg-Pro-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HGKHPCFTRQDHCU-IUCAKERBSA-N 0.000 description 1
- ATABBWFGOHKROJ-GUBZILKMSA-N Arg-Pro-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O ATABBWFGOHKROJ-GUBZILKMSA-N 0.000 description 1
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 1
- AUZAXCPWMDBWEE-HJGDQZAQSA-N Arg-Thr-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O AUZAXCPWMDBWEE-HJGDQZAQSA-N 0.000 description 1
- POZKLUIXMHIULG-FDARSICLSA-N Arg-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCCN=C(N)N)N POZKLUIXMHIULG-FDARSICLSA-N 0.000 description 1
- QJWLLRZTJFPCHA-STECZYCISA-N Arg-Tyr-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O QJWLLRZTJFPCHA-STECZYCISA-N 0.000 description 1
- XMZZGVGKGXRIGJ-JYJNAYRXSA-N Arg-Tyr-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O XMZZGVGKGXRIGJ-JYJNAYRXSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 241001167018 Aroa Species 0.000 description 1
- 235000003826 Artemisia Nutrition 0.000 description 1
- 235000003261 Artemisia vulgaris Nutrition 0.000 description 1
- 241001494508 Arundo donax Species 0.000 description 1
- PFOYSEIHFVKHNF-FXQIFTODSA-N Asn-Ala-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PFOYSEIHFVKHNF-FXQIFTODSA-N 0.000 description 1
- XYOVHPDDWCEUDY-CIUDSAMLSA-N Asn-Ala-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O XYOVHPDDWCEUDY-CIUDSAMLSA-N 0.000 description 1
- LXTGAOAXPSJWOU-DCAQKATOSA-N Asn-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N LXTGAOAXPSJWOU-DCAQKATOSA-N 0.000 description 1
- ZZXMOQIUIJJOKZ-ZLUOBGJFSA-N Asn-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O ZZXMOQIUIJJOKZ-ZLUOBGJFSA-N 0.000 description 1
- WVCJSDCHTUTONA-FXQIFTODSA-N Asn-Asp-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WVCJSDCHTUTONA-FXQIFTODSA-N 0.000 description 1
- BZMWJLLUAKSIMH-FXQIFTODSA-N Asn-Glu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BZMWJLLUAKSIMH-FXQIFTODSA-N 0.000 description 1
- MSBDSTRUMZFSEU-PEFMBERDSA-N Asn-Glu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MSBDSTRUMZFSEU-PEFMBERDSA-N 0.000 description 1
- DXVMJJNAOVECBA-WHFBIAKZSA-N Asn-Gly-Asn Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O DXVMJJNAOVECBA-WHFBIAKZSA-N 0.000 description 1
- SUEIIIFUBHDCCS-PBCZWWQYSA-N Asn-His-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SUEIIIFUBHDCCS-PBCZWWQYSA-N 0.000 description 1
- SPCONPVIDFMDJI-QSFUFRPTSA-N Asn-Ile-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O SPCONPVIDFMDJI-QSFUFRPTSA-N 0.000 description 1
- TZFQICWZWFNIKU-KKUMJFAQSA-N Asn-Leu-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 TZFQICWZWFNIKU-KKUMJFAQSA-N 0.000 description 1
- NCFJQJRLQJEECD-NHCYSSNCSA-N Asn-Leu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O NCFJQJRLQJEECD-NHCYSSNCSA-N 0.000 description 1
- CBHVAFXKOYAHOY-NHCYSSNCSA-N Asn-Val-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O CBHVAFXKOYAHOY-NHCYSSNCSA-N 0.000 description 1
- WQAOZCVOOYUWKG-LSJOCFKGSA-N Asn-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CC(=O)N)N WQAOZCVOOYUWKG-LSJOCFKGSA-N 0.000 description 1
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 1
- RGKKALNPOYURGE-ZKWXMUAHSA-N Asp-Ala-Val Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O RGKKALNPOYURGE-ZKWXMUAHSA-N 0.000 description 1
- QHAJMRDEWNAIBQ-FXQIFTODSA-N Asp-Arg-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O QHAJMRDEWNAIBQ-FXQIFTODSA-N 0.000 description 1
- HMQDRBKQMLRCCG-GMOBBJLQSA-N Asp-Arg-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HMQDRBKQMLRCCG-GMOBBJLQSA-N 0.000 description 1
- ZSJFGGSPCCHMNE-LAEOZQHASA-N Asp-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N ZSJFGGSPCCHMNE-LAEOZQHASA-N 0.000 description 1
- OVPHVTCDVYYTHN-AVGNSLFASA-N Asp-Glu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OVPHVTCDVYYTHN-AVGNSLFASA-N 0.000 description 1
- LDGUZSIPGSPBJP-XVYDVKMFSA-N Asp-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)O)N LDGUZSIPGSPBJP-XVYDVKMFSA-N 0.000 description 1
- SPWXXPFDTMYTRI-IUKAMOBKSA-N Asp-Ile-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SPWXXPFDTMYTRI-IUKAMOBKSA-N 0.000 description 1
- RQHLMGCXCZUOGT-ZPFDUUQYSA-N Asp-Leu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RQHLMGCXCZUOGT-ZPFDUUQYSA-N 0.000 description 1
- NVFSJIXJZCDICF-SRVKXCTJSA-N Asp-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N NVFSJIXJZCDICF-SRVKXCTJSA-N 0.000 description 1
- GWIJZUVQVDJHDI-AVGNSLFASA-N Asp-Phe-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GWIJZUVQVDJHDI-AVGNSLFASA-N 0.000 description 1
- PCJOFZYFFMBZKC-PCBIJLKTSA-N Asp-Phe-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PCJOFZYFFMBZKC-PCBIJLKTSA-N 0.000 description 1
- UAXIKORUDGGIGA-DCAQKATOSA-N Asp-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O UAXIKORUDGGIGA-DCAQKATOSA-N 0.000 description 1
- GGRSYTUJHAZTFN-IHRRRGAJSA-N Asp-Pro-Tyr Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O GGRSYTUJHAZTFN-IHRRRGAJSA-N 0.000 description 1
- MNQMTYSEKZHIDF-GCJQMDKQSA-N Asp-Thr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O MNQMTYSEKZHIDF-GCJQMDKQSA-N 0.000 description 1
- ITGFVUYOLWBPQW-KKHAAJSZSA-N Asp-Thr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O ITGFVUYOLWBPQW-KKHAAJSZSA-N 0.000 description 1
- XMKXONRMGJXCJV-LAEOZQHASA-N Asp-Val-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XMKXONRMGJXCJV-LAEOZQHASA-N 0.000 description 1
- SFJUYBCDQBAYAJ-YDHLFZDLSA-N Asp-Val-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SFJUYBCDQBAYAJ-YDHLFZDLSA-N 0.000 description 1
- 102100023927 Asparagine synthetase [glutamine-hydrolyzing] Human genes 0.000 description 1
- 108010070255 Aspartate-ammonia ligase Proteins 0.000 description 1
- 241000208838 Asteraceae Species 0.000 description 1
- 241001106067 Atropa Species 0.000 description 1
- 244000075850 Avena orientalis Species 0.000 description 1
- 235000007319 Avena orientalis Nutrition 0.000 description 1
- 235000017166 Bambusa arundinacea Nutrition 0.000 description 1
- 235000017491 Bambusa tulda Nutrition 0.000 description 1
- 241000133570 Berberidaceae Species 0.000 description 1
- 240000000724 Berberis vulgaris Species 0.000 description 1
- 235000006011 Bixa Nutrition 0.000 description 1
- 241000934840 Bixa Species 0.000 description 1
- 241000934828 Bixaceae Species 0.000 description 1
- 108010006654 Bleomycin Proteins 0.000 description 1
- 241000222455 Boletus Species 0.000 description 1
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 1
- 241000339490 Brachyachne Species 0.000 description 1
- 235000011331 Brassica Nutrition 0.000 description 1
- 241000219198 Brassica Species 0.000 description 1
- 235000011303 Brassica alboglabra Nutrition 0.000 description 1
- 244000178993 Brassica juncea Species 0.000 description 1
- 235000011332 Brassica juncea Nutrition 0.000 description 1
- 235000014698 Brassica juncea var multisecta Nutrition 0.000 description 1
- 235000014700 Brassica juncea var napiformis Nutrition 0.000 description 1
- 240000002791 Brassica napus Species 0.000 description 1
- 235000011293 Brassica napus Nutrition 0.000 description 1
- 235000006008 Brassica napus var napus Nutrition 0.000 description 1
- 240000000385 Brassica napus var. napus Species 0.000 description 1
- 240000007124 Brassica oleracea Species 0.000 description 1
- 235000011302 Brassica oleracea Nutrition 0.000 description 1
- 235000004221 Brassica oleracea var gemmifera Nutrition 0.000 description 1
- 244000308368 Brassica oleracea var. gemmifera Species 0.000 description 1
- 235000006618 Brassica rapa subsp oleifera Nutrition 0.000 description 1
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 1
- 241000219193 Brassicaceae Species 0.000 description 1
- 241000234670 Bromeliaceae Species 0.000 description 1
- 239000005489 Bromoxynil Substances 0.000 description 1
- 101100394003 Butyrivibrio fibrisolvens end1 gene Proteins 0.000 description 1
- 101100342815 Caenorhabditis elegans lec-1 gene Proteins 0.000 description 1
- 235000003880 Calendula Nutrition 0.000 description 1
- 240000001432 Calendula officinalis Species 0.000 description 1
- 241000209507 Camellia Species 0.000 description 1
- 241000759909 Camptotheca Species 0.000 description 1
- 101100244387 Candida albicans (strain SC5314 / ATCC MYA-2876) PMT6 gene Proteins 0.000 description 1
- 241000218235 Cannabaceae Species 0.000 description 1
- 241000218236 Cannabis Species 0.000 description 1
- 235000002566 Capsicum Nutrition 0.000 description 1
- 235000008534 Capsicum annuum var annuum Nutrition 0.000 description 1
- 235000002568 Capsicum frutescens Nutrition 0.000 description 1
- 108010078791 Carrier Proteins Proteins 0.000 description 1
- WLYGSPLCNKYESI-RSUQVHIMSA-N Carthamin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1[C@@]1(O)C(O)=C(C(=O)\C=C\C=2C=CC(O)=CC=2)C(=O)C(\C=C\2C([C@](O)([C@H]3[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O3)O)C(O)=C(C(=O)\C=C\C=3C=CC(O)=CC=3)C/2=O)=O)=C1O WLYGSPLCNKYESI-RSUQVHIMSA-N 0.000 description 1
- 241000208809 Carthamus Species 0.000 description 1
- 241000219321 Caryophyllaceae Species 0.000 description 1
- 241000208328 Catharanthus Species 0.000 description 1
- 241000488900 Cephalotaxaceae Species 0.000 description 1
- 241000488899 Cephalotaxus Species 0.000 description 1
- 241000871189 Chenopodiaceae Species 0.000 description 1
- 102000012286 Chitinases Human genes 0.000 description 1
- 108010062745 Chloride Channels Proteins 0.000 description 1
- 102000011045 Chloride Channels Human genes 0.000 description 1
- 239000005496 Chlorsulfuron Substances 0.000 description 1
- 108010077544 Chromatin Proteins 0.000 description 1
- 235000007516 Chrysanthemum Nutrition 0.000 description 1
- 240000005250 Chrysanthemum indicum Species 0.000 description 1
- 241000034870 Chrysoteuchia culmella Species 0.000 description 1
- 235000021513 Cinchona Nutrition 0.000 description 1
- 241000157855 Cinchona Species 0.000 description 1
- 102100034229 Citramalyl-CoA lyase, mitochondrial Human genes 0.000 description 1
- 241000219109 Citrullus Species 0.000 description 1
- 235000009831 Citrullus lanatus Nutrition 0.000 description 1
- 235000012828 Citrullus lanatus var citroides Nutrition 0.000 description 1
- 108091064523 Clc family Proteins 0.000 description 1
- 241000131506 Colchicaceae Species 0.000 description 1
- 241000723375 Colchicum Species 0.000 description 1
- 235000021508 Coleus Nutrition 0.000 description 1
- 244000061182 Coleus blumei Species 0.000 description 1
- 108020004394 Complementary RNA Proteins 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- 101710190853 Cruciferin Proteins 0.000 description 1
- 244000241257 Cucumis melo Species 0.000 description 1
- 235000009842 Cucumis melo Nutrition 0.000 description 1
- 235000015510 Cucumis melo subsp melo Nutrition 0.000 description 1
- 235000010071 Cucumis prophetarum Nutrition 0.000 description 1
- 235000009849 Cucumis sativus Nutrition 0.000 description 1
- 235000010799 Cucumis sativus var sativus Nutrition 0.000 description 1
- 241000219122 Cucurbita Species 0.000 description 1
- 240000004244 Cucurbita moschata Species 0.000 description 1
- 241000219104 Cucurbitaceae Species 0.000 description 1
- CMSMOCZEIVJLDB-UHFFFAOYSA-N Cyclophosphamide Chemical compound ClCCN(CCCl)P1(=O)NCCCO1 CMSMOCZEIVJLDB-UHFFFAOYSA-N 0.000 description 1
- 244000052363 Cynodon dactylon Species 0.000 description 1
- MUZAUPFGPMMZSS-GUBZILKMSA-N Cys-Glu-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CS)N MUZAUPFGPMMZSS-GUBZILKMSA-N 0.000 description 1
- VCIIDXDOPGHMDQ-WDSKDSINSA-N Cys-Gly-Gln Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O VCIIDXDOPGHMDQ-WDSKDSINSA-N 0.000 description 1
- DQGIAOGALAQBGK-BWBBJGPYSA-N Cys-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N)O DQGIAOGALAQBGK-BWBBJGPYSA-N 0.000 description 1
- KZZYVYWSXMFYEC-DCAQKATOSA-N Cys-Val-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KZZYVYWSXMFYEC-DCAQKATOSA-N 0.000 description 1
- 102000005927 Cysteine Proteases Human genes 0.000 description 1
- 108010005843 Cysteine Proteases Proteins 0.000 description 1
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 1
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 1
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 description 1
- 108010066133 D-octopine dehydrogenase Proteins 0.000 description 1
- 230000005778 DNA damage Effects 0.000 description 1
- 231100000277 DNA damage Toxicity 0.000 description 1
- 238000000018 DNA microarray Methods 0.000 description 1
- 239000003155 DNA primer Substances 0.000 description 1
- 230000007018 DNA scission Effects 0.000 description 1
- 241000208296 Datura Species 0.000 description 1
- 240000003421 Dianthus chinensis Species 0.000 description 1
- ZFIVKAOQEXOYFY-UHFFFAOYSA-N Diepoxybutane Chemical compound C1OC1C1OC1 ZFIVKAOQEXOYFY-UHFFFAOYSA-N 0.000 description 1
- 240000001879 Digitalis lutea Species 0.000 description 1
- 235000005903 Dioscorea Nutrition 0.000 description 1
- 244000281702 Dioscorea villosa Species 0.000 description 1
- 235000000504 Dioscorea villosa Nutrition 0.000 description 1
- 241000234272 Dioscoreaceae Species 0.000 description 1
- 102000016680 Dioxygenases Human genes 0.000 description 1
- 108010028143 Dioxygenases Proteins 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 241000512897 Elaeis Species 0.000 description 1
- 235000001942 Elaeis Nutrition 0.000 description 1
- 240000003133 Elaeis guineensis Species 0.000 description 1
- 244000127993 Elaeis melanococca Species 0.000 description 1
- 101100491986 Emericella nidulans (strain FGSC A4 / ATCC 38163 / CBS 112.46 / NRRL 194 / M139) aromA gene Proteins 0.000 description 1
- 241000218671 Ephedra Species 0.000 description 1
- 241000218670 Ephedraceae Species 0.000 description 1
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 1
- 241001081474 Erythroxylaceae Species 0.000 description 1
- 241000735552 Erythroxylum Species 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- IAYPIBMASNFSPL-UHFFFAOYSA-N Ethylene oxide Chemical compound C1CO1 IAYPIBMASNFSPL-UHFFFAOYSA-N 0.000 description 1
- 244000004281 Eucalyptus maculata Species 0.000 description 1
- 241000221017 Euphorbiaceae Species 0.000 description 1
- 241000220485 Fabaceae Species 0.000 description 1
- 241000234643 Festuca arundinacea Species 0.000 description 1
- 241000220223 Fragaria Species 0.000 description 1
- 235000016623 Fragaria vesca Nutrition 0.000 description 1
- 230000010337 G2 phase Effects 0.000 description 1
- 241000234271 Galanthus Species 0.000 description 1
- 108700023863 Gene Components Proteins 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- RZSLYUUFFVHFRQ-FXQIFTODSA-N Gln-Ala-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O RZSLYUUFFVHFRQ-FXQIFTODSA-N 0.000 description 1
- MLZRSFQRBDNJON-GUBZILKMSA-N Gln-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MLZRSFQRBDNJON-GUBZILKMSA-N 0.000 description 1
- PRBLYKYHAJEABA-SRVKXCTJSA-N Gln-Arg-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O PRBLYKYHAJEABA-SRVKXCTJSA-N 0.000 description 1
- AAOBFSKXAVIORT-GUBZILKMSA-N Gln-Asn-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O AAOBFSKXAVIORT-GUBZILKMSA-N 0.000 description 1
- MCAVASRGVBVPMX-FXQIFTODSA-N Gln-Glu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MCAVASRGVBVPMX-FXQIFTODSA-N 0.000 description 1
- FGYPOQPQTUNESW-IUCAKERBSA-N Gln-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N FGYPOQPQTUNESW-IUCAKERBSA-N 0.000 description 1
- DUGYCMAIAKAQPB-GLLZPBPUSA-N Gln-Thr-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DUGYCMAIAKAQPB-GLLZPBPUSA-N 0.000 description 1
- 101710186901 Globulin 1 Proteins 0.000 description 1
- HUWSBFYAGXCXKC-CIUDSAMLSA-N Glu-Ala-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O HUWSBFYAGXCXKC-CIUDSAMLSA-N 0.000 description 1
- ATRHMOJQJWPVBQ-DRZSPHRISA-N Glu-Ala-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ATRHMOJQJWPVBQ-DRZSPHRISA-N 0.000 description 1
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 1
- DYFJZDDQPNIPAB-NHCYSSNCSA-N Glu-Arg-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O DYFJZDDQPNIPAB-NHCYSSNCSA-N 0.000 description 1
- YYOBUPFZLKQUAX-FXQIFTODSA-N Glu-Asn-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YYOBUPFZLKQUAX-FXQIFTODSA-N 0.000 description 1
- PCBBLFVHTYNQGG-LAEOZQHASA-N Glu-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N PCBBLFVHTYNQGG-LAEOZQHASA-N 0.000 description 1
- SBCYJMOOHUDWDA-NUMRIWBASA-N Glu-Asp-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SBCYJMOOHUDWDA-NUMRIWBASA-N 0.000 description 1
- PXHABOCPJVTGEK-BQBZGAKWSA-N Glu-Gln-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O PXHABOCPJVTGEK-BQBZGAKWSA-N 0.000 description 1
- PVBBEKPHARMPHX-DCAQKATOSA-N Glu-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O PVBBEKPHARMPHX-DCAQKATOSA-N 0.000 description 1
- BUAKRRKDHSSIKK-IHRRRGAJSA-N Glu-Glu-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BUAKRRKDHSSIKK-IHRRRGAJSA-N 0.000 description 1
- DVLZZEPUNFEUBW-AVGNSLFASA-N Glu-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N DVLZZEPUNFEUBW-AVGNSLFASA-N 0.000 description 1
- QLPYYTDOUQNJGQ-AVGNSLFASA-N Glu-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N QLPYYTDOUQNJGQ-AVGNSLFASA-N 0.000 description 1
- ZWABFSSWTSAMQN-KBIXCLLPSA-N Glu-Ile-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O ZWABFSSWTSAMQN-KBIXCLLPSA-N 0.000 description 1
- VGUYMZGLJUJRBV-YVNDNENWSA-N Glu-Ile-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VGUYMZGLJUJRBV-YVNDNENWSA-N 0.000 description 1
- ITBHUUMCJJQUSC-LAEOZQHASA-N Glu-Ile-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O ITBHUUMCJJQUSC-LAEOZQHASA-N 0.000 description 1
- ZHNHJYYFCGUZNQ-KBIXCLLPSA-N Glu-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O ZHNHJYYFCGUZNQ-KBIXCLLPSA-N 0.000 description 1
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 1
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 1
- GJBUAAAIZSRCDC-GVXVVHGQSA-N Glu-Leu-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O GJBUAAAIZSRCDC-GVXVVHGQSA-N 0.000 description 1
- SJJHXJDSNQJMMW-SRVKXCTJSA-N Glu-Lys-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SJJHXJDSNQJMMW-SRVKXCTJSA-N 0.000 description 1
- QDMVXRNLOPTPIE-WDCWCFNPSA-N Glu-Lys-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QDMVXRNLOPTPIE-WDCWCFNPSA-N 0.000 description 1
- SUIAHERNFYRBDZ-GVXVVHGQSA-N Glu-Lys-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O SUIAHERNFYRBDZ-GVXVVHGQSA-N 0.000 description 1
- QNJNPKSWAHPYGI-JYJNAYRXSA-N Glu-Phe-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=CC=C1 QNJNPKSWAHPYGI-JYJNAYRXSA-N 0.000 description 1
- IDEODOAVGCMUQV-GUBZILKMSA-N Glu-Ser-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IDEODOAVGCMUQV-GUBZILKMSA-N 0.000 description 1
- JWNZHMSRZXXGTM-XKBZYTNZSA-N Glu-Ser-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWNZHMSRZXXGTM-XKBZYTNZSA-N 0.000 description 1
- RGJKYNUINKGPJN-RWRJDSDZSA-N Glu-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(=O)O)N RGJKYNUINKGPJN-RWRJDSDZSA-N 0.000 description 1
- CQGBSALYGOXQPE-HTUGSXCWSA-N Glu-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O CQGBSALYGOXQPE-HTUGSXCWSA-N 0.000 description 1
- HBMRTXJZQDVRFT-DZKIICNBSA-N Glu-Tyr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O HBMRTXJZQDVRFT-DZKIICNBSA-N 0.000 description 1
- VIPDPMHGICREIS-GVXVVHGQSA-N Glu-Val-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VIPDPMHGICREIS-GVXVVHGQSA-N 0.000 description 1
- 108010060309 Glucuronidase Proteins 0.000 description 1
- 102000053187 Glucuronidase Human genes 0.000 description 1
- 108010070675 Glutathione transferase Proteins 0.000 description 1
- 102000005720 Glutathione transferase Human genes 0.000 description 1
- MFVQGXGQRIXBPK-WDSKDSINSA-N Gly-Ala-Glu Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFVQGXGQRIXBPK-WDSKDSINSA-N 0.000 description 1
- QXPRJQPCFXMCIY-NKWVEPMBSA-N Gly-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN QXPRJQPCFXMCIY-NKWVEPMBSA-N 0.000 description 1
- CIMULJZTTOBOPN-WHFBIAKZSA-N Gly-Asn-Asn Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CIMULJZTTOBOPN-WHFBIAKZSA-N 0.000 description 1
- JVWPPCWUDRJGAE-YUMQZZPRSA-N Gly-Asn-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JVWPPCWUDRJGAE-YUMQZZPRSA-N 0.000 description 1
- JVACNFOPSUPDTK-QWRGUYRKSA-N Gly-Asn-Phe Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JVACNFOPSUPDTK-QWRGUYRKSA-N 0.000 description 1
- IWAXHBCACVWNHT-BQBZGAKWSA-N Gly-Asp-Arg Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IWAXHBCACVWNHT-BQBZGAKWSA-N 0.000 description 1
- PMNHJLASAAWELO-FOHZUACHSA-N Gly-Asp-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PMNHJLASAAWELO-FOHZUACHSA-N 0.000 description 1
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 1
- JNGJGFMFXREJNF-KBPBESRZSA-N Gly-Glu-Trp Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JNGJGFMFXREJNF-KBPBESRZSA-N 0.000 description 1
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 1
- DGKBSGNCMCLDSL-BYULHYEWSA-N Gly-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN DGKBSGNCMCLDSL-BYULHYEWSA-N 0.000 description 1
- UTYGDAHJBBDPBA-BYULHYEWSA-N Gly-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN UTYGDAHJBBDPBA-BYULHYEWSA-N 0.000 description 1
- COVXELOAORHTND-LSJOCFKGSA-N Gly-Ile-Val Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O COVXELOAORHTND-LSJOCFKGSA-N 0.000 description 1
- LLZXNUUIBOALNY-QWRGUYRKSA-N Gly-Leu-Lys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN LLZXNUUIBOALNY-QWRGUYRKSA-N 0.000 description 1
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 1
- PDUHNKAFQXQNLH-ZETCQYMHSA-N Gly-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)NCC(O)=O PDUHNKAFQXQNLH-ZETCQYMHSA-N 0.000 description 1
- DHNXGWVNLFPOMQ-KBPBESRZSA-N Gly-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)CN DHNXGWVNLFPOMQ-KBPBESRZSA-N 0.000 description 1
- FFALDIDGPLUDKV-ZDLURKLDSA-N Gly-Thr-Ser Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O FFALDIDGPLUDKV-ZDLURKLDSA-N 0.000 description 1
- TVTZEOHWHUVYCG-KYNKHSRBSA-N Gly-Thr-Thr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O TVTZEOHWHUVYCG-KYNKHSRBSA-N 0.000 description 1
- 108700037728 Glycine max beta-conglycinin Proteins 0.000 description 1
- 108700023372 Glycosyltransferases Proteins 0.000 description 1
- 241000219146 Gossypium Species 0.000 description 1
- 235000009438 Gossypium Nutrition 0.000 description 1
- 235000009432 Gossypium hirsutum Nutrition 0.000 description 1
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 1
- 241001466533 Gypaetus barbatus Species 0.000 description 1
- 108090001102 Hammerhead ribozyme Proteins 0.000 description 1
- 241000208818 Helianthus Species 0.000 description 1
- 101710154606 Hemagglutinin Proteins 0.000 description 1
- 244000043261 Hevea brasiliensis Species 0.000 description 1
- VSLXGYMEHVAJBH-DLOVCJGASA-N His-Ala-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O VSLXGYMEHVAJBH-DLOVCJGASA-N 0.000 description 1
- FLUVGKKRRMLNPU-CQDKDKBSSA-N His-Ala-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FLUVGKKRRMLNPU-CQDKDKBSSA-N 0.000 description 1
- CIWILNZNBPIHEU-DCAQKATOSA-N His-Arg-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O CIWILNZNBPIHEU-DCAQKATOSA-N 0.000 description 1
- JWTKVPMQCCRPQY-SRVKXCTJSA-N His-Asn-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JWTKVPMQCCRPQY-SRVKXCTJSA-N 0.000 description 1
- UPGJWSUYENXOPV-HGNGGELXSA-N His-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N UPGJWSUYENXOPV-HGNGGELXSA-N 0.000 description 1
- HAPWZEVRQYGLSG-IUCAKERBSA-N His-Gly-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O HAPWZEVRQYGLSG-IUCAKERBSA-N 0.000 description 1
- FDQYIRHBVVUTJF-ZETCQYMHSA-N His-Gly-Gly Chemical compound [O-]C(=O)CNC(=O)CNC(=O)[C@@H]([NH3+])CC1=CN=CN1 FDQYIRHBVVUTJF-ZETCQYMHSA-N 0.000 description 1
- PMWSGVRIMIFXQH-KKUMJFAQSA-N His-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1NC=NC=1)C1=CN=CN1 PMWSGVRIMIFXQH-KKUMJFAQSA-N 0.000 description 1
- MPXGJGBXCRQQJE-MXAVVETBSA-N His-Ile-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O MPXGJGBXCRQQJE-MXAVVETBSA-N 0.000 description 1
- LJUIEESLIAZSFR-SRVKXCTJSA-N His-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N LJUIEESLIAZSFR-SRVKXCTJSA-N 0.000 description 1
- LVXFNTIIGOQBMD-SRVKXCTJSA-N His-Leu-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O LVXFNTIIGOQBMD-SRVKXCTJSA-N 0.000 description 1
- ZFDKSLBEWYCOCS-BZSNNMDCSA-N His-Phe-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1NC=NC=1)C1=CC=CC=C1 ZFDKSLBEWYCOCS-BZSNNMDCSA-N 0.000 description 1
- HYWZHNUGAYVEEW-KKUMJFAQSA-N His-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N HYWZHNUGAYVEEW-KKUMJFAQSA-N 0.000 description 1
- ZUELLZFHJUPFEC-PMVMPFDFSA-N His-Phe-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CN=CN1 ZUELLZFHJUPFEC-PMVMPFDFSA-N 0.000 description 1
- VDHOMPFVSABJKU-ULQDDVLXSA-N His-Phe-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CC2=CN=CN2)N VDHOMPFVSABJKU-ULQDDVLXSA-N 0.000 description 1
- PYNPBMCLAKTHJL-SRVKXCTJSA-N His-Pro-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O PYNPBMCLAKTHJL-SRVKXCTJSA-N 0.000 description 1
- DGLAHESNTJWGDO-SRVKXCTJSA-N His-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N DGLAHESNTJWGDO-SRVKXCTJSA-N 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 description 1
- 101000655429 Homo sapiens Multidrug and toxin extrusion protein 2 Proteins 0.000 description 1
- 241000209219 Hordeum Species 0.000 description 1
- 241000208278 Hyoscyamus Species 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- VSZALHITQINTGC-GHCJXIJMSA-N Ile-Ala-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VSZALHITQINTGC-GHCJXIJMSA-N 0.000 description 1
- AQCUAZTZSPQJFF-ZKWXMUAHSA-N Ile-Ala-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O AQCUAZTZSPQJFF-ZKWXMUAHSA-N 0.000 description 1
- WUEIUSDAECDLQO-NAKRPEOUSA-N Ile-Ala-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)O)N WUEIUSDAECDLQO-NAKRPEOUSA-N 0.000 description 1
- HLYBGMZJVDHJEO-CYDGBPFRSA-N Ile-Arg-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HLYBGMZJVDHJEO-CYDGBPFRSA-N 0.000 description 1
- ASCFJMSGKUIRDU-ZPFDUUQYSA-N Ile-Arg-Gln Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O ASCFJMSGKUIRDU-ZPFDUUQYSA-N 0.000 description 1
- XENGULNPUDGALZ-ZPFDUUQYSA-N Ile-Asn-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N XENGULNPUDGALZ-ZPFDUUQYSA-N 0.000 description 1
- LLZLRXBTOOFODM-QSFUFRPTSA-N Ile-Asp-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N LLZLRXBTOOFODM-QSFUFRPTSA-N 0.000 description 1
- KMBPQYKVZBMRMH-PEFMBERDSA-N Ile-Gln-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O KMBPQYKVZBMRMH-PEFMBERDSA-N 0.000 description 1
- PHIXPNQDGGILMP-YVNDNENWSA-N Ile-Glu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PHIXPNQDGGILMP-YVNDNENWSA-N 0.000 description 1
- PKGGWLOLRLOPGK-XUXIUFHCSA-N Ile-Leu-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PKGGWLOLRLOPGK-XUXIUFHCSA-N 0.000 description 1
- TVYWVSJGSHQWMT-AJNGGQMLSA-N Ile-Leu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N TVYWVSJGSHQWMT-AJNGGQMLSA-N 0.000 description 1
- IOVUXUSIGXCREV-DKIMLUQUSA-N Ile-Leu-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IOVUXUSIGXCREV-DKIMLUQUSA-N 0.000 description 1
- CKRFDMPBSWYOBT-PPCPHDFISA-N Ile-Lys-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CKRFDMPBSWYOBT-PPCPHDFISA-N 0.000 description 1
- CZWANIQKACCEKW-CYDGBPFRSA-N Ile-Pro-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)O)N CZWANIQKACCEKW-CYDGBPFRSA-N 0.000 description 1
- JHNJNTMTZHEDLJ-NAKRPEOUSA-N Ile-Ser-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JHNJNTMTZHEDLJ-NAKRPEOUSA-N 0.000 description 1
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 1
- RQJUKVXWAKJDBW-SVSWQMSJSA-N Ile-Ser-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N RQJUKVXWAKJDBW-SVSWQMSJSA-N 0.000 description 1
- ZGKVPOSSTGHJAF-HJPIBITLSA-N Ile-Tyr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CO)C(=O)O)N ZGKVPOSSTGHJAF-HJPIBITLSA-N 0.000 description 1
- JERJIYYCOGBAIJ-OBAATPRFSA-N Ile-Tyr-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N JERJIYYCOGBAIJ-OBAATPRFSA-N 0.000 description 1
- 102000012330 Integrases Human genes 0.000 description 1
- 108010061833 Integrases Proteins 0.000 description 1
- 240000005385 Jasminum sambac Species 0.000 description 1
- 241001048891 Jatropha curcas Species 0.000 description 1
- 241000588747 Klebsiella pneumoniae Species 0.000 description 1
- 108010009384 L-Iditol 2-Dehydrogenase Proteins 0.000 description 1
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 1
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- 241000208822 Lactuca Species 0.000 description 1
- 241000207923 Lamiaceae Species 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- 241001071864 Lethrinus laticaudis Species 0.000 description 1
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 1
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 1
- IBMVEYRWAWIOTN-RWMBFGLXSA-N Leu-Arg-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(O)=O IBMVEYRWAWIOTN-RWMBFGLXSA-N 0.000 description 1
- BPANDPNDMJHFEV-CIUDSAMLSA-N Leu-Asp-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O BPANDPNDMJHFEV-CIUDSAMLSA-N 0.000 description 1
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 1
- KTFHTMHHKXUYPW-ZPFDUUQYSA-N Leu-Asp-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KTFHTMHHKXUYPW-ZPFDUUQYSA-N 0.000 description 1
- FOEHRHOBWFQSNW-KATARQTJSA-N Leu-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(C)C)N)O FOEHRHOBWFQSNW-KATARQTJSA-N 0.000 description 1
- CQGSYZCULZMEDE-SRVKXCTJSA-N Leu-Gln-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CQGSYZCULZMEDE-SRVKXCTJSA-N 0.000 description 1
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 1
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 1
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 1
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 1
- KEVYYIMVELOXCT-KBPBESRZSA-N Leu-Gly-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KEVYYIMVELOXCT-KBPBESRZSA-N 0.000 description 1
- UCDHVOALNXENLC-KBPBESRZSA-N Leu-Gly-Tyr Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UCDHVOALNXENLC-KBPBESRZSA-N 0.000 description 1
- XBCWOTOCBXXJDG-BZSNNMDCSA-N Leu-His-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 XBCWOTOCBXXJDG-BZSNNMDCSA-N 0.000 description 1
- WRLPVDVHNWSSCL-MELADBBJSA-N Leu-His-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N WRLPVDVHNWSSCL-MELADBBJSA-N 0.000 description 1
- OHZIZVWQXJPBJS-IXOXFDKPSA-N Leu-His-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OHZIZVWQXJPBJS-IXOXFDKPSA-N 0.000 description 1
- DBSLVQBXKVKDKJ-BJDJZHNGSA-N Leu-Ile-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O DBSLVQBXKVKDKJ-BJDJZHNGSA-N 0.000 description 1
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 1
- ZALAVHVPPOHAOL-XUXIUFHCSA-N Leu-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(C)C)N ZALAVHVPPOHAOL-XUXIUFHCSA-N 0.000 description 1
- PDQDCFBVYXEFSD-SRVKXCTJSA-N Leu-Leu-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PDQDCFBVYXEFSD-SRVKXCTJSA-N 0.000 description 1
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 1
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 1
- RTIRBWJPYJYTLO-MELADBBJSA-N Leu-Lys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N RTIRBWJPYJYTLO-MELADBBJSA-N 0.000 description 1
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 1
- YWKNKRAKOCLOLH-OEAJRASXSA-N Leu-Phe-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YWKNKRAKOCLOLH-OEAJRASXSA-N 0.000 description 1
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 1
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 1
- SBANPBVRHYIMRR-GARJFASQSA-N Leu-Ser-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N SBANPBVRHYIMRR-GARJFASQSA-N 0.000 description 1
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 1
- SVBJIZVVYJYGLA-DCAQKATOSA-N Leu-Ser-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O SVBJIZVVYJYGLA-DCAQKATOSA-N 0.000 description 1
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 1
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 1
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 1
- VUBIPAHVHMZHCM-KKUMJFAQSA-N Leu-Tyr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 VUBIPAHVHMZHCM-KKUMJFAQSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 241000208202 Linaceae Species 0.000 description 1
- 241000208204 Linum Species 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 235000010649 Lupinus albus Nutrition 0.000 description 1
- 240000000894 Lupinus albus Species 0.000 description 1
- 241000227653 Lycopersicon Species 0.000 description 1
- 235000002262 Lycopersicon Nutrition 0.000 description 1
- 241000195948 Lycopodiaceae Species 0.000 description 1
- 241000195947 Lycopodium Species 0.000 description 1
- KNKHAVVBVXKOGX-JXUBOQSCSA-N Lys-Ala-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KNKHAVVBVXKOGX-JXUBOQSCSA-N 0.000 description 1
- VHNOAIFVYUQOOY-XUXIUFHCSA-N Lys-Arg-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VHNOAIFVYUQOOY-XUXIUFHCSA-N 0.000 description 1
- FLCMXEFCTLXBTL-DCAQKATOSA-N Lys-Asp-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N FLCMXEFCTLXBTL-DCAQKATOSA-N 0.000 description 1
- HIIZIQUUHIXUJY-GUBZILKMSA-N Lys-Asp-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HIIZIQUUHIXUJY-GUBZILKMSA-N 0.000 description 1
- AAORVPFVUIHEAB-YUMQZZPRSA-N Lys-Asp-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O AAORVPFVUIHEAB-YUMQZZPRSA-N 0.000 description 1
- RZHLIPMZXOEJTL-AVGNSLFASA-N Lys-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N RZHLIPMZXOEJTL-AVGNSLFASA-N 0.000 description 1
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 1
- KJIXWRWPOCKYLD-IHRRRGAJSA-N Lys-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N KJIXWRWPOCKYLD-IHRRRGAJSA-N 0.000 description 1
- ATNKHRAIZCMCCN-BZSNNMDCSA-N Lys-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N ATNKHRAIZCMCCN-BZSNNMDCSA-N 0.000 description 1
- TWPCWKVOZDUYAA-KKUMJFAQSA-N Lys-Phe-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O TWPCWKVOZDUYAA-KKUMJFAQSA-N 0.000 description 1
- PIXVFCBYEGPZPA-JYJNAYRXSA-N Lys-Phe-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N PIXVFCBYEGPZPA-JYJNAYRXSA-N 0.000 description 1
- QBHGXFQJFPWJIH-XUXIUFHCSA-N Lys-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN QBHGXFQJFPWJIH-XUXIUFHCSA-N 0.000 description 1
- HYSVGEAWTGPMOA-IHRRRGAJSA-N Lys-Pro-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O HYSVGEAWTGPMOA-IHRRRGAJSA-N 0.000 description 1
- YSPZCHGIWAQVKQ-AVGNSLFASA-N Lys-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN YSPZCHGIWAQVKQ-AVGNSLFASA-N 0.000 description 1
- JOSAKOKSPXROGQ-BJDJZHNGSA-N Lys-Ser-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JOSAKOKSPXROGQ-BJDJZHNGSA-N 0.000 description 1
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 1
- IEIHKHYMBIYQTH-YESZJQIVSA-N Lys-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCCN)N)C(=O)O IEIHKHYMBIYQTH-YESZJQIVSA-N 0.000 description 1
- HMZPYMSEAALNAE-ULQDDVLXSA-N Lys-Val-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O HMZPYMSEAALNAE-ULQDDVLXSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 101150083961 MPO1 gene Proteins 0.000 description 1
- 229910016094 MPO2 Inorganic materials 0.000 description 1
- 108020004687 Malate Synthase Proteins 0.000 description 1
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 1
- 241000219071 Malvaceae Species 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 235000004456 Manihot esculenta Nutrition 0.000 description 1
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 description 1
- 101000763602 Manilkara zapota Thaumatin-like protein 1 Proteins 0.000 description 1
- 101000763586 Manilkara zapota Thaumatin-like protein 1a Proteins 0.000 description 1
- 229930195725 Mannitol Natural products 0.000 description 1
- 108020000290 Mannitol dehydrogenase Proteins 0.000 description 1
- 108091027974 Mature messenger RNA Proteins 0.000 description 1
- 241000489991 Melanthiaceae Species 0.000 description 1
- 235000014435 Mentha Nutrition 0.000 description 1
- 241001072983 Mentha Species 0.000 description 1
- YRAWWKUTNBILNT-FXQIFTODSA-N Met-Ala-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YRAWWKUTNBILNT-FXQIFTODSA-N 0.000 description 1
- GAELMDJMQDUDLJ-BQBZGAKWSA-N Met-Ala-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O GAELMDJMQDUDLJ-BQBZGAKWSA-N 0.000 description 1
- SBSIKVMCCJUCBZ-GUBZILKMSA-N Met-Asn-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N SBSIKVMCCJUCBZ-GUBZILKMSA-N 0.000 description 1
- ACYHZNZHIZWLQF-BQBZGAKWSA-N Met-Asn-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ACYHZNZHIZWLQF-BQBZGAKWSA-N 0.000 description 1
- JPCHYAUKOUGOIB-HJGDQZAQSA-N Met-Glu-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPCHYAUKOUGOIB-HJGDQZAQSA-N 0.000 description 1
- MYAPQOBHGWJZOM-UWVGGRQHSA-N Met-Gly-Leu Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C MYAPQOBHGWJZOM-UWVGGRQHSA-N 0.000 description 1
- QZPXMHVKPHJNTR-DCAQKATOSA-N Met-Leu-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O QZPXMHVKPHJNTR-DCAQKATOSA-N 0.000 description 1
- SODXFJOPSCXOHE-IHRRRGAJSA-N Met-Leu-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O SODXFJOPSCXOHE-IHRRRGAJSA-N 0.000 description 1
- CHDYFPCQVUOJEB-ULQDDVLXSA-N Met-Leu-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 CHDYFPCQVUOJEB-ULQDDVLXSA-N 0.000 description 1
- AWGBEIYZPAXXSX-RWMBFGLXSA-N Met-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N AWGBEIYZPAXXSX-RWMBFGLXSA-N 0.000 description 1
- HAQLBBVZAGMESV-IHRRRGAJSA-N Met-Lys-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O HAQLBBVZAGMESV-IHRRRGAJSA-N 0.000 description 1
- WUYLWZRHRLLEGB-AVGNSLFASA-N Met-Met-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O WUYLWZRHRLLEGB-AVGNSLFASA-N 0.000 description 1
- LNXGEYIEEUZGGH-JYJNAYRXSA-N Met-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CCSC)CC1=CC=CC=C1 LNXGEYIEEUZGGH-JYJNAYRXSA-N 0.000 description 1
- XTSBLBXAUIBMLW-KKUMJFAQSA-N Met-Tyr-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N XTSBLBXAUIBMLW-KKUMJFAQSA-N 0.000 description 1
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 description 1
- 241001074116 Miscanthus x giganteus Species 0.000 description 1
- 108020005196 Mitochondrial DNA Proteins 0.000 description 1
- 102100032858 Multidrug and toxin extrusion protein 2 Human genes 0.000 description 1
- 108091007573 Multidrug and toxin extrusion transporters Proteins 0.000 description 1
- 241000234295 Musa Species 0.000 description 1
- 101000966653 Musa acuminata Glucan endo-1,3-beta-glucosidase Proteins 0.000 description 1
- 240000005561 Musa balbisiana Species 0.000 description 1
- 235000018290 Musa x paradisiaca Nutrition 0.000 description 1
- 241000234615 Musaceae Species 0.000 description 1
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 1
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 1
- 102000018463 Myo-Inositol-1-Phosphate Synthase Human genes 0.000 description 1
- 108091000020 Myo-Inositol-1-Phosphate Synthase Proteins 0.000 description 1
- 235000009421 Myristica fragrans Nutrition 0.000 description 1
- 244000270834 Myristica fragrans Species 0.000 description 1
- 241000219926 Myrtaceae Species 0.000 description 1
- 102000006374 N-Demethylating Oxidoreductases Human genes 0.000 description 1
- 108010058669 N-Demethylating Oxidoreductases Proteins 0.000 description 1
- FUSGACRLAFQQRL-UHFFFAOYSA-N N-Ethyl-N-nitrosourea Chemical compound CCN(N=O)C(N)=O FUSGACRLAFQQRL-UHFFFAOYSA-N 0.000 description 1
- WYBVBIHNJWOLCJ-UHFFFAOYSA-N N-L-arginyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCCN=C(N)N WYBVBIHNJWOLCJ-UHFFFAOYSA-N 0.000 description 1
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 1
- ZRKWMRDKSOPRRS-UHFFFAOYSA-N N-Methyl-N-nitrosourea Chemical compound O=NN(C)C(N)=O ZRKWMRDKSOPRRS-UHFFFAOYSA-N 0.000 description 1
- 102100023315 N-acetyllactosaminide beta-1,6-N-acetylglucosaminyl-transferase Human genes 0.000 description 1
- 108010056664 N-acetyllactosaminide beta-1,6-N-acetylglucosaminyltransferase Proteins 0.000 description 1
- 229910002651 NO3 Inorganic materials 0.000 description 1
- 101710202365 Napin Proteins 0.000 description 1
- 102100034559 Natural resistance-associated macrophage protein 1 Human genes 0.000 description 1
- 241000250374 Nicotiana acaulis Species 0.000 description 1
- 241000208126 Nicotiana acuminata Species 0.000 description 1
- 241001144497 Nicotiana africana Species 0.000 description 1
- 244000061322 Nicotiana alata Species 0.000 description 1
- 241000250377 Nicotiana amplexicaulis Species 0.000 description 1
- 241001144490 Nicotiana arentsii Species 0.000 description 1
- 241000228653 Nicotiana attenuata Species 0.000 description 1
- 241000250375 Nicotiana benavidesii Species 0.000 description 1
- 241000250376 Nicotiana bonariensis Species 0.000 description 1
- 241000250373 Nicotiana cavicola Species 0.000 description 1
- 241001609967 Nicotiana clevelandii Species 0.000 description 1
- 241001244271 Nicotiana cordifolia Species 0.000 description 1
- 241001144496 Nicotiana corymbosa Species 0.000 description 1
- 241000208113 Nicotiana debneyi Species 0.000 description 1
- 241000862464 Nicotiana excelsior Species 0.000 description 1
- 244000006449 Nicotiana forgetiana Species 0.000 description 1
- 241000208128 Nicotiana glauca Species 0.000 description 1
- 241001495644 Nicotiana glutinosa Species 0.000 description 1
- 241001144503 Nicotiana goodspeedii Species 0.000 description 1
- 241000579278 Nicotiana kawakamii Species 0.000 description 1
- 241000250368 Nicotiana knightiana Species 0.000 description 1
- 241000250019 Nicotiana langsdorffii Species 0.000 description 1
- 241000250027 Nicotiana linearis Species 0.000 description 1
- 241000250024 Nicotiana longiflora Species 0.000 description 1
- 241001144499 Nicotiana maritima Species 0.000 description 1
- 241000250031 Nicotiana megalosiphon Species 0.000 description 1
- 241000250030 Nicotiana miersii Species 0.000 description 1
- 241000250041 Nicotiana noctiflora Species 0.000 description 1
- 241000228665 Nicotiana nudicaulis Species 0.000 description 1
- 241001144504 Nicotiana occidentalis subsp. hesperis Species 0.000 description 1
- 241000208132 Nicotiana otophora Species 0.000 description 1
- 241000876839 Nicotiana paniculata Species 0.000 description 1
- 241001144492 Nicotiana pauciflora Species 0.000 description 1
- 241000250042 Nicotiana petunioides Species 0.000 description 1
- 241000208133 Nicotiana plumbaginifolia Species 0.000 description 1
- 241001144487 Nicotiana raimondii Species 0.000 description 1
- 241001290303 Nicotiana repanda Species 0.000 description 1
- 241001144500 Nicotiana rosulata Species 0.000 description 1
- 241001144486 Nicotiana rotundifolia Species 0.000 description 1
- 241000208134 Nicotiana rustica Species 0.000 description 1
- 241001144491 Nicotiana setchellii Species 0.000 description 1
- 241000250044 Nicotiana simulans Species 0.000 description 1
- 241000249970 Nicotiana solanifolia Species 0.000 description 1
- 241001144495 Nicotiana spegazzinii Species 0.000 description 1
- 241000249966 Nicotiana stocktonii Species 0.000 description 1
- 241001144480 Nicotiana suaveolens Species 0.000 description 1
- 241000208136 Nicotiana sylvestris Species 0.000 description 1
- 101100179449 Nicotiana tabacum A622 gene Proteins 0.000 description 1
- 241001144489 Nicotiana thyrsiflora Species 0.000 description 1
- 241000579280 Nicotiana tomentosa Species 0.000 description 1
- 241000208138 Nicotiana tomentosiformis Species 0.000 description 1
- 241000249968 Nicotiana umbratica Species 0.000 description 1
- 241000228669 Nicotiana velutina Species 0.000 description 1
- 241001144494 Nicotiana wigandioides Species 0.000 description 1
- NHNBFGGVMKEFGY-UHFFFAOYSA-N Nitrate Chemical compound [O-][N+]([O-])=O NHNBFGGVMKEFGY-UHFFFAOYSA-N 0.000 description 1
- 108090000913 Nitrate Reductases Proteins 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 108020004485 Nonsense Codon Proteins 0.000 description 1
- 240000002061 Nothoscordum fragrans Species 0.000 description 1
- 102000008297 Nuclear Matrix-Associated Proteins Human genes 0.000 description 1
- 108010035916 Nuclear Matrix-Associated Proteins Proteins 0.000 description 1
- 241000209018 Nyssaceae Species 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 241000209094 Oryza Species 0.000 description 1
- 101710093908 Outer capsid protein VP4 Proteins 0.000 description 1
- 101710135467 Outer capsid protein sigma-1 Proteins 0.000 description 1
- 101150030997 PCNA2 gene Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 238000010222 PCR analysis Methods 0.000 description 1
- 239000012807 PCR reagent Substances 0.000 description 1
- 101150036326 PMT2 gene Proteins 0.000 description 1
- 101150024216 PMT3 gene Proteins 0.000 description 1
- 101150086142 PMT4 gene Proteins 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 241001520808 Panicum virgatum Species 0.000 description 1
- 235000011096 Papaver Nutrition 0.000 description 1
- 240000001090 Papaver somniferum Species 0.000 description 1
- 241000218180 Papaveraceae Species 0.000 description 1
- 241001495454 Parthenium Species 0.000 description 1
- AVFIYMSJDDGDBQ-UHFFFAOYSA-N Parthenium Chemical compound C1C=C(CCC(C)=O)C(C)CC2OC(=O)C(=C)C21 AVFIYMSJDDGDBQ-UHFFFAOYSA-N 0.000 description 1
- 241000209046 Pennisetum Species 0.000 description 1
- 244000130556 Pennisetum purpureum Species 0.000 description 1
- 244000038248 Pennisetum spicatum Species 0.000 description 1
- 244000115721 Pennisetum typhoides Species 0.000 description 1
- 244000025272 Persea americana Species 0.000 description 1
- 235000008673 Persea americana Nutrition 0.000 description 1
- 241000745991 Phalaris Species 0.000 description 1
- 101710163504 Phaseolin Proteins 0.000 description 1
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 1
- 244000046052 Phaseolus vulgaris Species 0.000 description 1
- 108700011203 Phaseolus vulgaris phaseolin Proteins 0.000 description 1
- AJOKKVTWEMXZHC-DRZSPHRISA-N Phe-Ala-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 AJOKKVTWEMXZHC-DRZSPHRISA-N 0.000 description 1
- YQNBKXUTWBRQCS-BVSLBCMMSA-N Phe-Arg-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 YQNBKXUTWBRQCS-BVSLBCMMSA-N 0.000 description 1
- KIEPQOIQHFKQLK-PCBIJLKTSA-N Phe-Asn-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KIEPQOIQHFKQLK-PCBIJLKTSA-N 0.000 description 1
- LDSOBEJVGGVWGD-DLOVCJGASA-N Phe-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 LDSOBEJVGGVWGD-DLOVCJGASA-N 0.000 description 1
- MQVFHOPCKNTHGT-MELADBBJSA-N Phe-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O MQVFHOPCKNTHGT-MELADBBJSA-N 0.000 description 1
- AKJAKCBHLJGRBU-JYJNAYRXSA-N Phe-Glu-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N AKJAKCBHLJGRBU-JYJNAYRXSA-N 0.000 description 1
- CSDMCMITJLKBAH-SOUVJXGZSA-N Phe-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O CSDMCMITJLKBAH-SOUVJXGZSA-N 0.000 description 1
- APJPXSFJBMMOLW-KBPBESRZSA-N Phe-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 APJPXSFJBMMOLW-KBPBESRZSA-N 0.000 description 1
- NHCKESBLOMHIIE-IRXDYDNUSA-N Phe-Gly-Phe Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 NHCKESBLOMHIIE-IRXDYDNUSA-N 0.000 description 1
- FXYXBEZMRACDDR-KKUMJFAQSA-N Phe-His-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O FXYXBEZMRACDDR-KKUMJFAQSA-N 0.000 description 1
- ZKSLXIGKRJMALF-MGHWNKPDSA-N Phe-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CC=CC=C2)N ZKSLXIGKRJMALF-MGHWNKPDSA-N 0.000 description 1
- KBVJZCVLQWCJQN-KKUMJFAQSA-N Phe-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KBVJZCVLQWCJQN-KKUMJFAQSA-N 0.000 description 1
- WLYPRKLMRIYGPP-JYJNAYRXSA-N Phe-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 WLYPRKLMRIYGPP-JYJNAYRXSA-N 0.000 description 1
- ZVRJWDUPIDMHDN-ULQDDVLXSA-N Phe-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 ZVRJWDUPIDMHDN-ULQDDVLXSA-N 0.000 description 1
- ODGNUUUDJONJSC-UFYCRDLUSA-N Phe-Pro-Tyr Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O ODGNUUUDJONJSC-UFYCRDLUSA-N 0.000 description 1
- BONHGTUEEPIMPM-AVGNSLFASA-N Phe-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O BONHGTUEEPIMPM-AVGNSLFASA-N 0.000 description 1
- QSWKNJAPHQDAAS-MELADBBJSA-N Phe-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O QSWKNJAPHQDAAS-MELADBBJSA-N 0.000 description 1
- OLZVAVSJEUAOHI-UNQGMJICSA-N Phe-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O OLZVAVSJEUAOHI-UNQGMJICSA-N 0.000 description 1
- KUSYCSMTTHSZOA-DZKIICNBSA-N Phe-Val-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N KUSYCSMTTHSZOA-DZKIICNBSA-N 0.000 description 1
- JTKGCYOOJLUETJ-ULQDDVLXSA-N Phe-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JTKGCYOOJLUETJ-ULQDDVLXSA-N 0.000 description 1
- 241000746981 Phleum Species 0.000 description 1
- 241000746983 Phleum pratense Species 0.000 description 1
- 108030002254 Phosphate acyltransferases Proteins 0.000 description 1
- IAJOBQBIJHVGMQ-UHFFFAOYSA-N Phosphinothricin Natural products CP(O)(=O)CCC(N)C(O)=O IAJOBQBIJHVGMQ-UHFFFAOYSA-N 0.000 description 1
- 108010060806 Photosystem II Protein Complex Proteins 0.000 description 1
- 235000014676 Phragmites communis Nutrition 0.000 description 1
- 244000082204 Phyllostachys viridis Species 0.000 description 1
- 235000015334 Phyllostachys viridis Nutrition 0.000 description 1
- 241000218641 Pinaceae Species 0.000 description 1
- 235000005205 Pinus Nutrition 0.000 description 1
- 241000218602 Pinus <genus> Species 0.000 description 1
- 235000008331 Pinus X rigitaeda Nutrition 0.000 description 1
- 241000018646 Pinus brutia Species 0.000 description 1
- 241000013557 Plantaginaceae Species 0.000 description 1
- 241000500437 Plutella xylostella Species 0.000 description 1
- 241000209048 Poa Species 0.000 description 1
- 241000209049 Poa pratensis Species 0.000 description 1
- 241000209504 Poaceae Species 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- 241000161288 Populus candicans Species 0.000 description 1
- 241000183024 Populus tremula Species 0.000 description 1
- 235000011263 Populus tremuloides Nutrition 0.000 description 1
- 240000004923 Populus tremuloides Species 0.000 description 1
- 235000015696 Portulacaria afra Nutrition 0.000 description 1
- IWNOFCGBMSFTBC-CIUDSAMLSA-N Pro-Ala-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IWNOFCGBMSFTBC-CIUDSAMLSA-N 0.000 description 1
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 1
- GRIRJQGZZJVANI-CYDGBPFRSA-N Pro-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H]1CCCN1 GRIRJQGZZJVANI-CYDGBPFRSA-N 0.000 description 1
- SFECXGVELZFBFJ-VEVYYDQMSA-N Pro-Asp-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SFECXGVELZFBFJ-VEVYYDQMSA-N 0.000 description 1
- QGOZJLYCGRYYRW-KKUMJFAQSA-N Pro-Glu-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QGOZJLYCGRYYRW-KKUMJFAQSA-N 0.000 description 1
- FKLSMYYLJHYPHH-UWVGGRQHSA-N Pro-Gly-Leu Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O FKLSMYYLJHYPHH-UWVGGRQHSA-N 0.000 description 1
- XYSXOCIWCPFOCG-IHRRRGAJSA-N Pro-Leu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XYSXOCIWCPFOCG-IHRRRGAJSA-N 0.000 description 1
- ULWBBFKQBDNGOY-RWMBFGLXSA-N Pro-Lys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N2CCC[C@@H]2C(=O)O ULWBBFKQBDNGOY-RWMBFGLXSA-N 0.000 description 1
- VGVCNKSUVSZEIE-IHRRRGAJSA-N Pro-Phe-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O VGVCNKSUVSZEIE-IHRRRGAJSA-N 0.000 description 1
- GFHXZNVJIKMAGO-IHRRRGAJSA-N Pro-Phe-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O GFHXZNVJIKMAGO-IHRRRGAJSA-N 0.000 description 1
- XYAFCOJKICBRDU-JYJNAYRXSA-N Pro-Phe-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O XYAFCOJKICBRDU-JYJNAYRXSA-N 0.000 description 1
- RTQKBZIRDWZLDF-BZSNNMDCSA-N Pro-Pro-Trp Chemical compound C([C@H]1C(=O)N[C@@H](CC=2C3=CC=CC=C3NC=2)C(=O)O)CCN1C(=O)[C@@H]1CCCN1 RTQKBZIRDWZLDF-BZSNNMDCSA-N 0.000 description 1
- RNEFESSBTOQSAC-DCAQKATOSA-N Pro-Ser-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O RNEFESSBTOQSAC-DCAQKATOSA-N 0.000 description 1
- FDMCIBSQRKFSTJ-RHYQMDGZSA-N Pro-Thr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O FDMCIBSQRKFSTJ-RHYQMDGZSA-N 0.000 description 1
- JDJMFMVVJHLWDP-UNQGMJICSA-N Pro-Thr-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JDJMFMVVJHLWDP-UNQGMJICSA-N 0.000 description 1
- OABLKWMLPUGEQK-JYJNAYRXSA-N Pro-Tyr-Met Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCSC)C(O)=O OABLKWMLPUGEQK-JYJNAYRXSA-N 0.000 description 1
- 240000007909 Prosopis juliflora Species 0.000 description 1
- 101710176177 Protein A56 Proteins 0.000 description 1
- 108700040121 Protein Methyltransferases Proteins 0.000 description 1
- 102000055027 Protein Methyltransferases Human genes 0.000 description 1
- 108010026552 Proteome Proteins 0.000 description 1
- 108091034057 RNA (poly(A)) Proteins 0.000 description 1
- 101150084101 RNA2 gene Proteins 0.000 description 1
- 238000011529 RT qPCR Methods 0.000 description 1
- 244000061121 Rauvolfia serpentina Species 0.000 description 1
- 102000018120 Recombinases Human genes 0.000 description 1
- 108010091086 Recombinases Proteins 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 241001361634 Rhizoctonia Species 0.000 description 1
- 102000003661 Ribonuclease III Human genes 0.000 description 1
- 108010057163 Ribonuclease III Proteins 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 235000003846 Ricinus Nutrition 0.000 description 1
- 241000322381 Ricinus <louse> Species 0.000 description 1
- 241000220317 Rosa Species 0.000 description 1
- 235000004789 Rosa xanthina Nutrition 0.000 description 1
- 241000220222 Rosaceae Species 0.000 description 1
- 241001107098 Rubiaceae Species 0.000 description 1
- 230000018199 S phase Effects 0.000 description 1
- 108091006619 SLC11A1 Proteins 0.000 description 1
- 101100241858 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) OAC1 gene Proteins 0.000 description 1
- 101100353432 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) PRP2 gene Proteins 0.000 description 1
- 240000000111 Saccharum officinarum Species 0.000 description 1
- 235000007201 Saccharum officinarum Nutrition 0.000 description 1
- 241000746444 Saccharum sp. Species 0.000 description 1
- 241000218998 Salicaceae Species 0.000 description 1
- 241000293869 Salmonella enterica subsp. enterica serovar Typhimurium Species 0.000 description 1
- 241001093760 Sapindaceae Species 0.000 description 1
- 101100043108 Schizosaccharomyces pombe (strain 972 / ATCC 24843) spb1 gene Proteins 0.000 description 1
- 241000242873 Scopolia Species 0.000 description 1
- 241000209056 Secale Species 0.000 description 1
- 108010016634 Seed Storage Proteins Proteins 0.000 description 1
- 108091081021 Sense strand Proteins 0.000 description 1
- KYKKKSWGEPFUMR-NAKRPEOUSA-N Ser-Arg-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KYKKKSWGEPFUMR-NAKRPEOUSA-N 0.000 description 1
- HJEBZBMOTCQYDN-ACZMJKKPSA-N Ser-Glu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HJEBZBMOTCQYDN-ACZMJKKPSA-N 0.000 description 1
- QKQDTEYDEIJPNK-GUBZILKMSA-N Ser-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CO QKQDTEYDEIJPNK-GUBZILKMSA-N 0.000 description 1
- DSGYZICNAMEJOC-AVGNSLFASA-N Ser-Glu-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DSGYZICNAMEJOC-AVGNSLFASA-N 0.000 description 1
- ZFVFHHZBCVNLGD-GUBZILKMSA-N Ser-His-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZFVFHHZBCVNLGD-GUBZILKMSA-N 0.000 description 1
- QGAHMVHBORDHDC-YUMQZZPRSA-N Ser-His-Gly Chemical compound OC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CN=CN1 QGAHMVHBORDHDC-YUMQZZPRSA-N 0.000 description 1
- NBUKGEFVZJMSIS-XIRDDKMYSA-N Ser-His-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC3=CN=CN3)NC(=O)[C@H](CO)N NBUKGEFVZJMSIS-XIRDDKMYSA-N 0.000 description 1
- IFPBAGJBHSNYPR-ZKWXMUAHSA-N Ser-Ile-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O IFPBAGJBHSNYPR-ZKWXMUAHSA-N 0.000 description 1
- JCLAFVNDBJMLBC-JBDRJPRFSA-N Ser-Ser-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JCLAFVNDBJMLBC-JBDRJPRFSA-N 0.000 description 1
- SZRNDHWMVSFPSP-XKBZYTNZSA-N Ser-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N)O SZRNDHWMVSFPSP-XKBZYTNZSA-N 0.000 description 1
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 1
- ANOQEBQWIAYIMV-AEJSXWLSSA-N Ser-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ANOQEBQWIAYIMV-AEJSXWLSSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 235000008515 Setaria glauca Nutrition 0.000 description 1
- 241000208292 Solanaceae Species 0.000 description 1
- 235000002634 Solanum Nutrition 0.000 description 1
- 241000207763 Solanum Species 0.000 description 1
- 244000214911 Solanum americanum Species 0.000 description 1
- 235000019048 Solanum nodiflorum Nutrition 0.000 description 1
- 102100026974 Sorbitol dehydrogenase Human genes 0.000 description 1
- 235000015503 Sorghum bicolor subsp. drummondii Nutrition 0.000 description 1
- 241000219315 Spinacia Species 0.000 description 1
- 241000923571 Sporobolus michauxianus Species 0.000 description 1
- 244000170625 Sudangrass Species 0.000 description 1
- 229940100389 Sulfonylurea Drugs 0.000 description 1
- 241000404542 Tanacetum Species 0.000 description 1
- 241001116495 Taxaceae Species 0.000 description 1
- 241001116500 Taxus Species 0.000 description 1
- 235000006468 Thea sinensis Nutrition 0.000 description 1
- 241001122767 Theaceae Species 0.000 description 1
- 244000152045 Themeda triandra Species 0.000 description 1
- 241000219161 Theobroma Species 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 1
- 108010006368 Thioredoxin h Proteins 0.000 description 1
- NJEMRSFGDNECGF-GCJQMDKQSA-N Thr-Ala-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O NJEMRSFGDNECGF-GCJQMDKQSA-N 0.000 description 1
- VFEHSAJCWWHDBH-RHYQMDGZSA-N Thr-Arg-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VFEHSAJCWWHDBH-RHYQMDGZSA-N 0.000 description 1
- PAOYNIKMYOGBMR-PBCZWWQYSA-N Thr-Asn-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O PAOYNIKMYOGBMR-PBCZWWQYSA-N 0.000 description 1
- VUVCRYXYUUPGSB-GLLZPBPUSA-N Thr-Gln-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O VUVCRYXYUUPGSB-GLLZPBPUSA-N 0.000 description 1
- LGNBRHZANHMZHK-NUMRIWBASA-N Thr-Glu-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O LGNBRHZANHMZHK-NUMRIWBASA-N 0.000 description 1
- HJOSVGCWOTYJFG-WDCWCFNPSA-N Thr-Glu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O HJOSVGCWOTYJFG-WDCWCFNPSA-N 0.000 description 1
- KBLYJPQSNGTDIU-LOKLDPHHSA-N Thr-Glu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O KBLYJPQSNGTDIU-LOKLDPHHSA-N 0.000 description 1
- VUSAEKOXGNEYNE-PBCZWWQYSA-N Thr-His-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O VUSAEKOXGNEYNE-PBCZWWQYSA-N 0.000 description 1
- XOWKUMFHEZLKLT-CIQUZCHMSA-N Thr-Ile-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O XOWKUMFHEZLKLT-CIQUZCHMSA-N 0.000 description 1
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 1
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 1
- XSEPSRUDSPHMPX-KATARQTJSA-N Thr-Lys-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O XSEPSRUDSPHMPX-KATARQTJSA-N 0.000 description 1
- UJQVSMNQMQHVRY-KZVJFYERSA-N Thr-Met-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O UJQVSMNQMQHVRY-KZVJFYERSA-N 0.000 description 1
- WVVOFCVMHAXGLE-LFSVMHDDSA-N Thr-Phe-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O WVVOFCVMHAXGLE-LFSVMHDDSA-N 0.000 description 1
- PZSDPRBZINDEJV-HTUGSXCWSA-N Thr-Phe-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O PZSDPRBZINDEJV-HTUGSXCWSA-N 0.000 description 1
- MUAFDCVOHYAFNG-RCWTZXSCSA-N Thr-Pro-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MUAFDCVOHYAFNG-RCWTZXSCSA-N 0.000 description 1
- DEGCBBCMYWNJNA-RHYQMDGZSA-N Thr-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O DEGCBBCMYWNJNA-RHYQMDGZSA-N 0.000 description 1
- MROIJTGJGIDEEJ-RCWTZXSCSA-N Thr-Pro-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 MROIJTGJGIDEEJ-RCWTZXSCSA-N 0.000 description 1
- STUAPCLEDMKXKL-LKXGYXEUSA-N Thr-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O STUAPCLEDMKXKL-LKXGYXEUSA-N 0.000 description 1
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 1
- ZESGVALRVJIVLZ-VFCFLDTKSA-N Thr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O ZESGVALRVJIVLZ-VFCFLDTKSA-N 0.000 description 1
- SOUPNXUJAJENFU-SWRJLBSHSA-N Thr-Trp-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O SOUPNXUJAJENFU-SWRJLBSHSA-N 0.000 description 1
- AKHDFZHUPGVFEJ-YEPSODPASA-N Thr-Val-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AKHDFZHUPGVFEJ-YEPSODPASA-N 0.000 description 1
- QNXZCKMXHPULME-ZNSHCXBVSA-N Thr-Val-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O QNXZCKMXHPULME-ZNSHCXBVSA-N 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 108010022394 Threonine synthase Proteins 0.000 description 1
- 102000006843 Threonine synthase Human genes 0.000 description 1
- 241000723873 Tobacco mosaic virus Species 0.000 description 1
- 241000723677 Tobacco ringspot virus Species 0.000 description 1
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 1
- 241000219870 Trifolium subterraneum Species 0.000 description 1
- 235000019714 Triticale Nutrition 0.000 description 1
- 241000209140 Triticum Species 0.000 description 1
- SNJAPSVIPKUMCK-NWLDYVSISA-N Trp-Glu-Thr Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SNJAPSVIPKUMCK-NWLDYVSISA-N 0.000 description 1
- HXNVJPQADLRHGR-JBACZVJFSA-N Trp-Glu-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)N HXNVJPQADLRHGR-JBACZVJFSA-N 0.000 description 1
- BEWOXKJJMBKRQL-AAEUAGOBSA-N Trp-Gly-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N BEWOXKJJMBKRQL-AAEUAGOBSA-N 0.000 description 1
- LORJKYIPJIRIRT-BVSLBCMMSA-N Trp-Pro-Tyr Chemical compound C([C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=C(O)C=C1 LORJKYIPJIRIRT-BVSLBCMMSA-N 0.000 description 1
- 235000018747 Typha elephantina Nutrition 0.000 description 1
- 244000177175 Typha elephantina Species 0.000 description 1
- ZWZOCUWOXSDYFZ-CQDKDKBSSA-N Tyr-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ZWZOCUWOXSDYFZ-CQDKDKBSSA-N 0.000 description 1
- DYEGCOJHFNJBKB-UFYCRDLUSA-N Tyr-Arg-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 DYEGCOJHFNJBKB-UFYCRDLUSA-N 0.000 description 1
- QYSBJAUCUKHSLU-JYJNAYRXSA-N Tyr-Arg-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O QYSBJAUCUKHSLU-JYJNAYRXSA-N 0.000 description 1
- NQJDICVXXIMMMB-XDTLVQLUSA-N Tyr-Glu-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O NQJDICVXXIMMMB-XDTLVQLUSA-N 0.000 description 1
- NZFCWALTLNFHHC-JYJNAYRXSA-N Tyr-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NZFCWALTLNFHHC-JYJNAYRXSA-N 0.000 description 1
- CNLKDWSAORJEMW-KWQFWETISA-N Tyr-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O CNLKDWSAORJEMW-KWQFWETISA-N 0.000 description 1
- MVYRJYISVJWKSX-KBPBESRZSA-N Tyr-His-Gly Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)NCC(=O)O)N)O MVYRJYISVJWKSX-KBPBESRZSA-N 0.000 description 1
- HVPPEXXUDXAPOM-MGHWNKPDSA-N Tyr-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HVPPEXXUDXAPOM-MGHWNKPDSA-N 0.000 description 1
- YKCXQOBTISTQJD-BZSNNMDCSA-N Tyr-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N YKCXQOBTISTQJD-BZSNNMDCSA-N 0.000 description 1
- QHLIUFUEUDFAOT-MGHWNKPDSA-N Tyr-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QHLIUFUEUDFAOT-MGHWNKPDSA-N 0.000 description 1
- WURLIFOWSMBUAR-SLFFLAALSA-N Tyr-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O WURLIFOWSMBUAR-SLFFLAALSA-N 0.000 description 1
- SOAUMCDLIUGXJJ-SRVKXCTJSA-N Tyr-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O SOAUMCDLIUGXJJ-SRVKXCTJSA-N 0.000 description 1
- GQVZBMROTPEPIF-SRVKXCTJSA-N Tyr-Ser-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GQVZBMROTPEPIF-SRVKXCTJSA-N 0.000 description 1
- NHOVZGFNTGMYMI-KKUMJFAQSA-N Tyr-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NHOVZGFNTGMYMI-KKUMJFAQSA-N 0.000 description 1
- LVILBTSHPTWDGE-PMVMPFDFSA-N Tyr-Trp-Lys Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(O)=O)C1=CC=C(O)C=C1 LVILBTSHPTWDGE-PMVMPFDFSA-N 0.000 description 1
- MJUTYRIMFIICKL-JYJNAYRXSA-N Tyr-Val-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MJUTYRIMFIICKL-JYJNAYRXSA-N 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- 241000145124 Uniola Species 0.000 description 1
- 235000013419 Uniola paniculata Nutrition 0.000 description 1
- 240000007492 Uniola paniculata Species 0.000 description 1
- 229910052770 Uranium Inorganic materials 0.000 description 1
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 1
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 1
- UUYCNAXCCDNULB-QXEWZRGKSA-N Val-Arg-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O UUYCNAXCCDNULB-QXEWZRGKSA-N 0.000 description 1
- PAPWZOJOLKZEFR-AVGNSLFASA-N Val-Arg-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N PAPWZOJOLKZEFR-AVGNSLFASA-N 0.000 description 1
- CVUDMNSZAIZFAE-TUAOUCFPSA-N Val-Arg-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N CVUDMNSZAIZFAE-TUAOUCFPSA-N 0.000 description 1
- QPZMOUMNTGTEFR-ZKWXMUAHSA-N Val-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N QPZMOUMNTGTEFR-ZKWXMUAHSA-N 0.000 description 1
- DBOXBUDEAJVKRE-LSJOCFKGSA-N Val-Asn-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DBOXBUDEAJVKRE-LSJOCFKGSA-N 0.000 description 1
- BWVHQINTNLVWGZ-ZKWXMUAHSA-N Val-Cys-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N BWVHQINTNLVWGZ-ZKWXMUAHSA-N 0.000 description 1
- RKIGNDAHUOOIMJ-BQFCYCMXSA-N Val-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 RKIGNDAHUOOIMJ-BQFCYCMXSA-N 0.000 description 1
- HQYVQDRYODWONX-DCAQKATOSA-N Val-His-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CO)C(=O)O)N HQYVQDRYODWONX-DCAQKATOSA-N 0.000 description 1
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 1
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 1
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 1
- RYQUMYBMOJYYDK-NHCYSSNCSA-N Val-Pro-Glu Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RYQUMYBMOJYYDK-NHCYSSNCSA-N 0.000 description 1
- GBIUHAYJGWVNLN-AEJSXWLSSA-N Val-Ser-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N GBIUHAYJGWVNLN-AEJSXWLSSA-N 0.000 description 1
- VTIAEOKFUJJBTC-YDHLFZDLSA-N Val-Tyr-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VTIAEOKFUJJBTC-YDHLFZDLSA-N 0.000 description 1
- WBPFYNYTYASCQP-CYDGBPFRSA-N Val-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N WBPFYNYTYASCQP-CYDGBPFRSA-N 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 241000489523 Veratrum Species 0.000 description 1
- 241000863480 Vinca Species 0.000 description 1
- 241000219094 Vitaceae Species 0.000 description 1
- 241000219095 Vitis Species 0.000 description 1
- 235000009392 Vitis Nutrition 0.000 description 1
- 235000009754 Vitis X bourquina Nutrition 0.000 description 1
- 235000012333 Vitis X labruscana Nutrition 0.000 description 1
- 206010052428 Wound Diseases 0.000 description 1
- 208000027418 Wounds and injury Diseases 0.000 description 1
- 241000607479 Yersinia pestis Species 0.000 description 1
- 241000209149 Zea Species 0.000 description 1
- 235000007244 Zea mays Nutrition 0.000 description 1
- 101000662549 Zea mays Sucrose synthase 1 Proteins 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- FJJCIZWZNKZHII-UHFFFAOYSA-N [4,6-bis(cyanoamino)-1,3,5-triazin-2-yl]cyanamide Chemical compound N#CNC1=NC(NC#N)=NC(NC#N)=N1 FJJCIZWZNKZHII-UHFFFAOYSA-N 0.000 description 1
- 230000036579 abiotic stress Effects 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- IKHGUXGNUITLKF-XPULMUKRSA-N acetaldehyde Chemical compound [14CH]([14CH3])=O IKHGUXGNUITLKF-XPULMUKRSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000004480 active ingredient Substances 0.000 description 1
- 210000005006 adaptive immune system Anatomy 0.000 description 1
- 230000002730 additional effect Effects 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- UDMBCSSLTHHNCD-KQYNXXCUSA-N adenosine 5'-monophosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O UDMBCSSLTHHNCD-KQYNXXCUSA-N 0.000 description 1
- 230000009418 agronomic effect Effects 0.000 description 1
- 229960003767 alanine Drugs 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 1
- PPQRONHOSHZGFQ-LMVFSUKVSA-N aldehydo-D-ribose 5-phosphate Chemical group OP(=O)(O)OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PPQRONHOSHZGFQ-LMVFSUKVSA-N 0.000 description 1
- 239000000729 antidote Substances 0.000 description 1
- 229940075522 antidotes Drugs 0.000 description 1
- 239000000074 antisense oligonucleotide Substances 0.000 description 1
- 238000012230 antisense oligonucleotides Methods 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 108010013835 arginine glutamate Proteins 0.000 description 1
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 1
- 101150037081 aroA gene Proteins 0.000 description 1
- 244000030166 artemisia Species 0.000 description 1
- 235000009052 artemisia Nutrition 0.000 description 1
- 230000011681 asexual reproduction Effects 0.000 description 1
- 238000013465 asexual reproduction Methods 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 1
- 108010092854 aspartyllysine Proteins 0.000 description 1
- MXWJVTOOROXGIU-UHFFFAOYSA-N atrazine Chemical compound CCNC1=NC(Cl)=NC(NC(C)C)=N1 MXWJVTOOROXGIU-UHFFFAOYSA-N 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 239000011425 bamboo Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 108010051210 beta-Fructofuranosidase Proteins 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- POIARNZEYGURDG-FNORWQNLSA-N beta-damascenone Chemical compound C\C=C\C(=O)C1=C(C)C=CCC1(C)C POIARNZEYGURDG-FNORWQNLSA-N 0.000 description 1
- POIARNZEYGURDG-UHFFFAOYSA-N beta-damascenone Natural products CC=CC(=O)C1=C(C)C=CCC1(C)C POIARNZEYGURDG-UHFFFAOYSA-N 0.000 description 1
- GUBGYTABKSRVRQ-QUYVBRFLSA-N beta-maltose Chemical compound OC[C@H]1O[C@H](O[C@H]2[C@H](O)[C@@H](O)[C@H](O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@@H]1O GUBGYTABKSRVRQ-QUYVBRFLSA-N 0.000 description 1
- 238000002306 biochemical method Methods 0.000 description 1
- 239000003139 biocide Substances 0.000 description 1
- 229960001561 bleomycin Drugs 0.000 description 1
- OYVAGSVQBOHSSS-UAPAGMARSA-O bleomycin A2 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC=C(N=1)C=1SC=C(N=1)C(=O)NCCC[S+](C)C)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C OYVAGSVQBOHSSS-UAPAGMARSA-O 0.000 description 1
- 229940098773 bovine serum albumin Drugs 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 101150081794 bxn gene Proteins 0.000 description 1
- 229910052793 cadmium Inorganic materials 0.000 description 1
- BDOSMKKIYDKNTQ-UHFFFAOYSA-N cadmium atom Chemical compound [Cd] BDOSMKKIYDKNTQ-UHFFFAOYSA-N 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000001390 capsicum minimum Substances 0.000 description 1
- 150000001728 carbonyl compounds Chemical class 0.000 description 1
- 125000002915 carbonyl group Chemical group [*:2]C([*:1])=O 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 108020001778 catalytic domains Proteins 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 230000004700 cellular uptake Effects 0.000 description 1
- 108010040093 cellulose synthase Proteins 0.000 description 1
- 235000013339 cereals Nutrition 0.000 description 1
- 238000009614 chemical analysis method Methods 0.000 description 1
- 238000012412 chemical coupling Methods 0.000 description 1
- 239000002962 chemical mutagen Substances 0.000 description 1
- 235000015218 chewing gum Nutrition 0.000 description 1
- 229940112822 chewing gum Drugs 0.000 description 1
- JCKYGMPEJWAADB-UHFFFAOYSA-N chlorambucil Chemical compound OC(=O)CCCC1=CC=C(N(CCCl)CCCl)C=C1 JCKYGMPEJWAADB-UHFFFAOYSA-N 0.000 description 1
- 229960004630 chlorambucil Drugs 0.000 description 1
- VJYIFXVZLXQVHO-UHFFFAOYSA-N chlorsulfuron Chemical compound COC1=NC(C)=NC(NC(=O)NS(=O)(=O)C=2C(=CC=CC=2)Cl)=N1 VJYIFXVZLXQVHO-UHFFFAOYSA-N 0.000 description 1
- 210000003483 chromatin Anatomy 0.000 description 1
- 230000008711 chromosomal rearrangement Effects 0.000 description 1
- 229920003211 cis-1,4-polyisoprene Polymers 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000004737 colorimetric analysis Methods 0.000 description 1
- 238000002485 combustion reaction Methods 0.000 description 1
- 235000018597 common camellia Nutrition 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000008358 core component Substances 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 239000002537 cosmetic Substances 0.000 description 1
- 229960004397 cyclophosphamide Drugs 0.000 description 1
- IERHLVCPSMICTF-XVFCMESISA-N cytidine 5'-monophosphate Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(O)=O)O1 IERHLVCPSMICTF-XVFCMESISA-N 0.000 description 1
- 230000002559 cytogenic effect Effects 0.000 description 1
- UQHKFADEQIVWID-UHFFFAOYSA-N cytokinin Natural products C1=NC=2C(NCC=C(CO)C)=NC=NC=2N1C1CC(O)C(CO)O1 UQHKFADEQIVWID-UHFFFAOYSA-N 0.000 description 1
- 239000004062 cytokinin Substances 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- GYOZYWVXFNDGLU-XLPZGREQSA-N dTMP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)C1 GYOZYWVXFNDGLU-XLPZGREQSA-N 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- DENRZWYUOJLTMF-UHFFFAOYSA-N diethyl sulfate Chemical compound CCOS(=O)(=O)OCC DENRZWYUOJLTMF-UHFFFAOYSA-N 0.000 description 1
- 229940008406 diethyl sulfate Drugs 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 235000004879 dioscorea Nutrition 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000002222 downregulating effect Effects 0.000 description 1
- 230000024346 drought recovery Effects 0.000 description 1
- 241001493065 dsRNA viruses Species 0.000 description 1
- 108010050663 endodeoxyribonuclease CreI Proteins 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000007515 enzymatic degradation Effects 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 241001233957 eudicotyledons Species 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 230000035558 fertility Effects 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 239000010408 film Substances 0.000 description 1
- 235000004426 flaxseed Nutrition 0.000 description 1
- 230000008124 floral development Effects 0.000 description 1
- 239000006260 foam Substances 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- HYBBIBNJHNGZAN-UHFFFAOYSA-N furfural Chemical compound O=CC1=CC=CO1 HYBBIBNJHNGZAN-UHFFFAOYSA-N 0.000 description 1
- 230000006251 gamma-carboxylation Effects 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 238000012226 gene silencing method Methods 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- IAJOBQBIJHVGMQ-BYPYZUCNSA-N glufosinate-P Chemical compound CP(O)(=O)CC[C@H](N)C(O)=O IAJOBQBIJHVGMQ-BYPYZUCNSA-N 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- 125000000291 glutamic acid group Chemical group N[C@@H](CCC(O)=O)C(=O)* 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 235000004554 glutamine Nutrition 0.000 description 1
- 229960002743 glutamine Drugs 0.000 description 1
- 102000045442 glycosyltransferase activity proteins Human genes 0.000 description 1
- 108700014210 glycosyltransferase activity proteins Proteins 0.000 description 1
- 108010037850 glycylvaline Proteins 0.000 description 1
- 239000008187 granular material Substances 0.000 description 1
- 235000002532 grape seed extract Nutrition 0.000 description 1
- RQFCJASXJCIDSX-UUOKFMHZSA-N guanosine 5'-monophosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O RQFCJASXJCIDSX-UUOKFMHZSA-N 0.000 description 1
- 239000000185 hemagglutinin Substances 0.000 description 1
- GNOIPBMMFNIUFM-UHFFFAOYSA-N hexamethylphosphoric triamide Chemical compound CN(C)P(=O)(N(C)C)N(C)C GNOIPBMMFNIUFM-UHFFFAOYSA-N 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 238000013537 high throughput screening Methods 0.000 description 1
- 108010092114 histidylphenylalanine Proteins 0.000 description 1
- 230000003054 hormonal effect Effects 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 230000033444 hydroxylation Effects 0.000 description 1
- 238000005805 hydroxylation reaction Methods 0.000 description 1
- 238000003018 immunoassay Methods 0.000 description 1
- 238000001114 immunoprecipitation Methods 0.000 description 1
- 238000012744 immunostaining Methods 0.000 description 1
- 208000000509 infertility Diseases 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000000543 intermediate Substances 0.000 description 1
- 238000009403 interspecific hybridization Methods 0.000 description 1
- 238000001990 intravenous administration Methods 0.000 description 1
- 235000011073 invertase Nutrition 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 238000006317 isomerization reaction Methods 0.000 description 1
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 1
- ZNJFBWYDHIGLCU-HWKXXFMVSA-N jasmonic acid Chemical compound CC\C=C/C[C@@H]1[C@@H](CC(O)=O)CCC1=O ZNJFBWYDHIGLCU-HWKXXFMVSA-N 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 230000028514 leaf abscission Effects 0.000 description 1
- 235000021374 legumes Nutrition 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 231100000225 lethality Toxicity 0.000 description 1
- 229960003136 leucine Drugs 0.000 description 1
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 1
- 108010012058 leucyltyrosine Proteins 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 239000007937 lozenge Substances 0.000 description 1
- 108060004506 lycopene beta-cyclase Proteins 0.000 description 1
- 108010003700 lysyl aspartic acid Proteins 0.000 description 1
- 108010064235 lysylglycine Proteins 0.000 description 1
- 210000002540 macrophage Anatomy 0.000 description 1
- 210000001161 mammalian embryo Anatomy 0.000 description 1
- 235000005739 manihot Nutrition 0.000 description 1
- 239000000594 mannitol Substances 0.000 description 1
- 235000010355 mannitol Nutrition 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- HAWPXGHAZFHHAD-UHFFFAOYSA-N mechlorethamine Chemical class ClCCN(C)CCCl HAWPXGHAZFHHAD-UHFFFAOYSA-N 0.000 description 1
- 229960004961 mechlorethamine Drugs 0.000 description 1
- SGDBTWWWUNNDEQ-LBPRGKRZSA-N melphalan Chemical compound OC(=O)[C@@H](N)CC1=CC=C(N(CCCl)CCCl)C=C1 SGDBTWWWUNNDEQ-LBPRGKRZSA-N 0.000 description 1
- 229960001924 melphalan Drugs 0.000 description 1
- 230000000442 meristematic effect Effects 0.000 description 1
- 230000004066 metabolic change Effects 0.000 description 1
- 230000007102 metabolic function Effects 0.000 description 1
- 230000037353 metabolic pathway Effects 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 150000002739 metals Chemical class 0.000 description 1
- WSFSSNUMVMOOMR-NJFSPNSNSA-N methanone Chemical compound O=[14CH2] WSFSSNUMVMOOMR-NJFSPNSNSA-N 0.000 description 1
- 108700023046 methionyl-leucyl-phenylalanine Proteins 0.000 description 1
- 108010068488 methionylphenylalanine Proteins 0.000 description 1
- MBABOKRGFJTBAE-UHFFFAOYSA-N methyl methanesulfonate Chemical compound COS(C)(=O)=O MBABOKRGFJTBAE-UHFFFAOYSA-N 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 230000023409 microsporogenesis Effects 0.000 description 1
- 235000019713 millet Nutrition 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 239000003147 molecular marker Substances 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000036457 multidrug resistance Effects 0.000 description 1
- 230000017074 necrotic cell death Effects 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- XKLJHFLUAHKGGU-UHFFFAOYSA-N nitrous amide Chemical compound ON=N XKLJHFLUAHKGGU-UHFFFAOYSA-N 0.000 description 1
- 230000000422 nocturnal effect Effects 0.000 description 1
- 101150015886 nuc-1 gene Proteins 0.000 description 1
- 238000001821 nucleic acid purification Methods 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 239000001702 nutmeg Substances 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 150000002894 organic compounds Chemical class 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- FJKROLUGYXJWQN-UHFFFAOYSA-N papa-hydroxy-benzoic acid Natural products OC(=O)C1=CC=C(O)C=C1 FJKROLUGYXJWQN-UHFFFAOYSA-N 0.000 description 1
- 230000008506 pathogenesis Effects 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 230000035515 penetration Effects 0.000 description 1
- 238000002823 phage display Methods 0.000 description 1
- 239000012071 phase Substances 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 235000008729 phenylalanine Nutrition 0.000 description 1
- 229960005190 phenylalanine Drugs 0.000 description 1
- 108010084572 phenylalanyl-valine Proteins 0.000 description 1
- 108010073101 phenylalanylleucine Proteins 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 125000005642 phosphothioate group Chemical group 0.000 description 1
- 230000000243 photosynthetic effect Effects 0.000 description 1
- 238000000053 physical method Methods 0.000 description 1
- 230000009894 physiological stress Effects 0.000 description 1
- 229930195732 phytohormone Natural products 0.000 description 1
- 239000001739 pinus spp. Substances 0.000 description 1
- 210000000745 plant chromosome Anatomy 0.000 description 1
- 230000008121 plant development Effects 0.000 description 1
- 210000002706 plastid Anatomy 0.000 description 1
- 101150092906 pmt1 gene Proteins 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 229920002704 polyhistidine Polymers 0.000 description 1
- 239000001267 polyvinylpyrrolidone Substances 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- CPTBDICYNRMXFX-UHFFFAOYSA-N procarbazine Chemical compound CNNCC1=CC=C(C(=O)NC(C)C)C=C1 CPTBDICYNRMXFX-UHFFFAOYSA-N 0.000 description 1
- 229960000624 procarbazine Drugs 0.000 description 1
- 108010031719 prolyl-serine Proteins 0.000 description 1
- 108010004914 prolylarginine Proteins 0.000 description 1
- 108010070643 prolylglutamic acid Proteins 0.000 description 1
- 108010029020 prolylglycine Proteins 0.000 description 1
- 108010015796 prolylisoleucine Proteins 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 150000003212 purines Chemical class 0.000 description 1
- 150000003230 pyrimidines Chemical class 0.000 description 1
- JETDZFFCRPFPDH-UHFFFAOYSA-N quinacrine mustard dihydrochloride Chemical compound [H+].[H+].[Cl-].[Cl-].C1=C(Cl)C=CC2=C(NC(C)CCCN(CCCl)CCCl)C3=CC(OC)=CC=C3N=C21 JETDZFFCRPFPDH-UHFFFAOYSA-N 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 230000005849 recognition of pollen Effects 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 238000003757 reverse transcription PCR Methods 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 229960004889 salicylic acid Drugs 0.000 description 1
- 235000012420 sanguinaria Nutrition 0.000 description 1
- 230000008117 seed development Effects 0.000 description 1
- 230000007226 seed germination Effects 0.000 description 1
- 238000005204 segregation Methods 0.000 description 1
- 230000009758 senescence Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 229960001153 serine Drugs 0.000 description 1
- 235000004400 serine Nutrition 0.000 description 1
- 238000012868 site-directed mutagenesis technique Methods 0.000 description 1
- FQENQNTWSFEDLI-UHFFFAOYSA-J sodium diphosphate Chemical compound [Na+].[Na+].[Na+].[Na+].[O-]P([O-])(=O)OP([O-])([O-])=O FQENQNTWSFEDLI-UHFFFAOYSA-J 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- 229910000162 sodium phosphate Inorganic materials 0.000 description 1
- 239000012064 sodium phosphate buffer Substances 0.000 description 1
- 229940048086 sodium pyrophosphate Drugs 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 230000000392 somatic effect Effects 0.000 description 1
- 230000037439 somatic mutation Effects 0.000 description 1
- 239000000600 sorbitol Substances 0.000 description 1
- 108010048090 soybean lectin Proteins 0.000 description 1
- 108010005652 splenotritin Proteins 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 230000035882 stress Effects 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000019635 sulfation Effects 0.000 description 1
- 238000005670 sulfation reaction Methods 0.000 description 1
- YROXIXLRRCOBKF-UHFFFAOYSA-N sulfonylurea Chemical class OC(=N)N=S(=O)=O YROXIXLRRCOBKF-UHFFFAOYSA-N 0.000 description 1
- 238000000672 surface-enhanced laser desorption--ionisation Methods 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 238000004114 suspension culture Methods 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 231100000378 teratogenic Toxicity 0.000 description 1
- 230000003390 teratogenic effect Effects 0.000 description 1
- 235000019818 tetrasodium diphosphate Nutrition 0.000 description 1
- 239000001577 tetrasodium phosphonato phosphate Substances 0.000 description 1
- 238000009210 therapy by ultrasound Methods 0.000 description 1
- 235000008521 threonine Nutrition 0.000 description 1
- 229960002898 threonine Drugs 0.000 description 1
- 239000003053 toxin Substances 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 1
- 108010044292 tryptophyltyrosine Proteins 0.000 description 1
- 238000010396 two-hybrid screening Methods 0.000 description 1
- 229960004441 tyrosine Drugs 0.000 description 1
- 235000002374 tyrosine Nutrition 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- DJJCXFVJDGTHFX-XVFCMESISA-N uridine 5'-monophosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 DJJCXFVJDGTHFX-XVFCMESISA-N 0.000 description 1
- 229960004295 valine Drugs 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 229940057613 veratrum Drugs 0.000 description 1
- OGWKCGZFUXNPDA-XQKSVPLYSA-N vincristine Chemical compound C([N@]1C[C@@H](C[C@]2(C(=O)OC)C=3C(=CC4=C([C@]56[C@H]([C@@]([C@H](OC(C)=O)[C@]7(CC)C=CCN([C@H]67)CC5)(O)C(=O)OC)N4C=O)C=3)OC)C[C@@](C1)(O)CC)CC1=C2NC2=CC=CC=C12 OGWKCGZFUXNPDA-XQKSVPLYSA-N 0.000 description 1
- 229960004528 vincristine Drugs 0.000 description 1
- OGWKCGZFUXNPDA-UHFFFAOYSA-N vincristine Natural products C1C(CC)(O)CC(CC2(C(=O)OC)C=3C(=CC4=C(C56C(C(C(OC(C)=O)C7(CC)C=CCN(C67)CC5)(O)C(=O)OC)N4C=O)C=3)OC)CN1CCC1=C2NC2=CC=CC=C12 OGWKCGZFUXNPDA-UHFFFAOYSA-N 0.000 description 1
- 229940075420 xanthine Drugs 0.000 description 1
- 229930007850 β-damascenone Natural products 0.000 description 1
Abstract
Description
ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕFIELD OF TECHNOLOGY TO WHICH THE INVENTION RELATES
В настоящем изобретении раскрыты полинуклеотидные последовательности генов, кодирующих сахарозосинтазу (SUS) из Nicotiana tabacum, и их варианты, гомологи и фрагменты. Также раскрыты кодируемые ими полипептидные последовательности и их варианты, гомологи и фрагменты. Также раскрыта модуляция экспрессии одного или более генов NtSUS или функции или активности полипептида(полипептидов) NtSUS, кодируемого(кодируемых) ими, для модулирования уровня редуцирующих сахаров в растении или его части.The present invention discloses polynucleotide sequences of genes encoding sucrose synthase (SUS) from Nicotiana tabacum , and their variants, homologues and fragments. Also disclosed are the polypeptide sequences encoded by them and their variants, homologues and fragments. Also disclosed is the modulation of the expression of one or more NtSUS genes or the function or activity of the NtSUS polypeptide(s) encoded by them to modulate the level of reducing sugars in a plant or part thereof.
ПРЕДПОСЫЛКИ ИЗОБРЕТЕНИЯBACKGROUND OF THE INVENTION
В данной области техники существует постоянная потребность в получении табачного материала, в котором изменено высвобождение вкусоароматических соединений в аэрозоль и дым. В данной области техники также существует постоянная потребность в получении табачного материала, в котором изменено высвобождение акриламида в аэрозоль и дым.There is a continuing need in the art to provide a tobacco material in which the release of flavoring compounds into aerosol and smoke is modified. There is also a continuing need in the art to provide a tobacco material that alters the release of acrylamide into aerosol and smoke.
Настоящее изобретение направлено на удовлетворение данных и других потребностей.The present invention is directed to meeting these and other needs.
КРАТКОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯBRIEF DESCRIPTION OF THE INVENTION
Сахарозосинтаза (SUS) представляет собой ключевой фермент, задействованный в синтезе сахарозы, и ключевой фермент, запускающий накопление редуцирующих сахаров, таких как глюкоза, фруктоза, лактоза и мальтоза, в подвергнутых сушке листьях табака. Путем модулирования экспрессии SUS можно модулировать пул редуцирующих сахаров во время и после сушки листа табака. Измененное содержание редуцирующего сахара в подвергнутом сушке табаке может приводить к различному восприятию табачного вкуса и аромата, получаемых при нагревании. Как описано в данном документе, определенные гены NtSUS сверхэкспрессируются во время сушки, тогда как другие не экспрессируются и не будут вносить вклад в модулирование уровней редуцирующих сахаров. Однако данные гены, вероятно, будут участвовать в других метаболических путях, и изменения их экспрессии могут в результате привести к формированию фенотипа, который является неблагоприятным с агрономической точки зрения (например, медленный рост). Знание того, какие гены NtSUS сверхэкспрессируются во время сушки, преимущественно позволяет отобрать растения с изменениями только в соответствующих генах и уменьшает потенциальные негативные эффекты в отношении других метаболических процессов.Sucrose synthase (SUS) is a key enzyme involved in the synthesis of sucrose and a key enzyme that triggers the accumulation of reducing sugars such as glucose, fructose, lactose and maltose in dried tobacco leaves. By modulating SUS expression, the pool of reducing sugars can be modulated during and after drying of the tobacco leaf. Altered reducing sugar content in dried tobacco can lead to different perceptions of tobacco flavor and aroma produced by heating. As described herein, certain NtSUS genes are overexpressed during drying, while others are not expressed and will not contribute to modulating reducing sugar levels. However, these genes are likely to be involved in other metabolic pathways and changes in their expression may result in a phenotype that is agronomically unfavorable (eg slow growth). Knowing which NtSUS genes are overexpressed during drying advantageously allows selection of plants with changes in the relevant genes only and reduces potential negative effects on other metabolic processes.
В данном документе описаны несколько геномных полинуклеотидных последовательностей SUS из Nicotiana tabacum, в том числе NtSUS1-S (SEQ ID NO: 1), NtSUS1-T (SEQ ID NO: 3), NtSUS2-S (SEQ ID NO: 5), NtSUS2-T (SEQ ID NO: 7), NtSUS3-S (SEQ ID NO: 9), NtSUS3-T (SEQ ID NO: 11), NtSUS4-S (SEQ ID NO: 13), NtSUS4-T (SEQ ID NO: 15), NtSUS5-S (SEQ ID NO: 17), NtSUS5-T (SEQ ID NO: 19), NtSUS6-S (SEQ ID NO: 21) и NtSUS6-T (SEQ ID NO: 23). Также раскрыты соответствующие предсказанные полипептидные последовательности для NtSUS1-S (SEQ ID NO: 2), NtSUS1-T (SEQ ID NO: 4), NtSUS2-S (SEQ ID NO: 6), NtSUS2-T (SEQ ID NO: 8), NtSUS3-S (SEQ ID NO: 10), NtSUS3-T (SEQ ID NO: 12), NtSUS4-S (SEQ ID NO: 14), NtSUS4-T (SEQ ID NO: 16), NtSUS5-S (SEQ ID NO: 18), NtSUS5-T (SEQ ID NO: 20), NtSUS6-S (SEQ ID NO: 22) и NtSUS6-T (SEQ ID NO: 24). NtSUS2-S, NtSUS2-T, NtSUS3-S, NtSUS3-T, NtSUS4-S и NtSUS4-T могут играть роль в метаболизме сахаров во время сушки. В частности, показано, что NtSUS2-S, NtSUS3-S, NtSUS3-T и NtSUS4-S играют роль в метаболизме сахаров во время сушки. Во время сушки табака табак трубоогневой сушки обычно содержит в по меньшей мере восемь раз больше редуцирующих сахаров, чем табак воздушной сушки, что обусловлено, главным образом, высоким уровнем накопления крахмала в табаке Вирджиния. Однако после сбора растений и во время процесса старения большая часть крахмала сначала превращается в сахарозу, а затем в редуцирующие сахара, по-видимому, с участием SUS, а также инвертаз, в качестве ключевого фермента для метаболизма сахарозы. Следовательно, настоящее изобретение особенно применимо в модулировании содержания редуцирующих сахаров в подвергнутом сушке растительном материале.This document describes several SUS genomic polynucleotide sequences fromNicotiana tabacum, includingNtSUS1-S(SEQ ID NO: 1), NtSUS1-T(SEQ ID NO: 3), NtSUS2-S(SEQ ID NO: 5),NtSUS2-T(SEQ ID NO: 7), NtSUS3-S(SEQ ID NO: 9), NtSUS3-T(SEQ ID NO: 11), NtSUS4-S(SEQ ID NO: 13), NtSUS4-T(SEQ ID NO: 15), NtSUS5-S(SEQ ID NO: 17), NtSUS5-T(SEQ ID NO: 19), NtSUS6-S(SEQ ID NO: 21) AndNtSUS6-T(SEQ ID NO: 23). Also disclosed are corresponding predicted polypeptide sequences for NtSUS1-S (SEQ ID NO: 2), NtSUS1-T (SEQ ID NO: 4), NtSUS2-S (SEQ ID NO: 6), NtSUS2-T (SEQ ID NO: 8) , NtSUS3-S (SEQ ID NO: 10), NtSUS3-T (SEQ ID NO: 12), NtSUS4-S (SEQ ID NO: 14), NtSUS4-T (SEQ ID NO: 16), NtSUS5-S (SEQ ID NO: 18), NtSUS5-T (SEQ ID NO: 20), NtSUS6-S (SEQ ID NO: 22) and NtSUS6-T (SEQ ID NO: 24).NtSUS2-S,NtSUS2-T, NtSUS3-S,NtSUS3-T,NtSUS4-S AndNtSUS4-T may play a role in the metabolism of sugars during drying. In particular, it is shown thatNtSUS2-S,NtSUS3-S,NtSUS3-T AndNtSUS4-S play a role in the metabolism of sugars during drying. During the drying of tobacco, fire-cured tobacco typically contains at least eight times more reducing sugars than air-cured tobacco, due primarily to the high level of starch accumulation in Virginia tobacco. However, after harvesting plants and during the aging process, most starch is first converted to sucrose and then to reducing sugars, apparently involving SUS as well as invertases as a key enzyme for sucrose metabolism. Therefore, the present invention is particularly useful in modulating the content of reducing sugars in dried plant material.
В одном аспекте описана клетка растения, содержащая: (i) полинуклеотид, содержащий, состоящий или по существу состоящий из последовательности, характеризующейся по меньшей мере 95% идентичностью последовательности с SEQ ID NO: 1, или SEQ ID NO: 3, или SEQ ID NO: 9, или SEQ ID NO: 11, или SEQ ID NO: 17, или SEQ ID NO: 19, или SEQ ID NO: 21, или SEQ ID NO: 23; или полинуклеотид, содержащий, состоящий или по существу состоящий из последовательности, характеризующейся по меньшей мере 80% идентичностью последовательности с SEQ ID NO: 5, или SEQ ID NO: 7, или SEQ ID NO: 13, или SEQ ID NO: 15; (ii) полипептид, кодируемый полинуклеотидом, представленным в (i); (iii) полипептид, содержащий, состоящий или по существу состоящий из последовательности, характеризующейся по меньшей мере 94% идентичностью последовательности с SEQ ID NO: 2; или по меньшей мере 93% идентичностью последовательности с SEQ ID NO: 4; или по меньшей мере 95% идентичностью последовательности с SEQ ID NO: 6; или по меньшей мере 96% идентичностью последовательности с SEQ ID NO: 8; или по меньшей мере 93% идентичностью последовательности с SEQ ID NO: 10 или SEQ ID NO: 12; или по меньшей мере 95% идентичностью последовательности с SEQ ID NO: 14; или по меньшей мере 96% идентичностью последовательности с SEQ ID NO: 16; или по меньшей мере 89% идентичностью последовательности с SEQ ID NO: 18; или по меньшей мере 92% идентичностью последовательности с SEQ ID NO: 20; или по меньшей мере 93% идентичностью последовательности с SEQ ID NO: 22; или по меньшей мере 94% идентичностью последовательности с SEQ ID NO: 24; или (iv) конструкцию, вектор или вектор экспрессии, содержащие выделенный полинуклеотид, представленный в (i), где указанная клетка растения содержит по меньшей мере одну модификацию, которая модулирует экспрессию или активность полинуклеотида или полипептида по сравнению с клеткой контрольного растения, в котором экспрессия или активность полинуклеотида или полипептида не были модифицированы.In one aspect, a plant cell is described comprising: (i) a polynucleotide comprising, consisting of, or essentially consisting of a sequence having at least 95% sequence identity with SEQ ID NO: 1, or SEQ ID NO: 3, or SEQ ID NO : 9 or SEQ ID NO: 11 or SEQ ID NO: 17 or SEQ ID NO: 19 or SEQ ID NO: 21 or SEQ ID NO: 23; or a polynucleotide comprising, consisting of, or essentially consisting of a sequence having at least 80% sequence identity with SEQ ID NO: 5, or SEQ ID NO: 7, or SEQ ID NO: 13, or SEQ ID NO: 15; (ii) a polypeptide encoded by the polynucleotide shown in (i); (iii) a polypeptide comprising, consisting of, or essentially consisting of a sequence having at least 94% sequence identity with SEQ ID NO: 2; or at least 93% sequence identity with SEQ ID NO: 4; or at least 95% sequence identity with SEQ ID NO: 6; or at least 96% sequence identity with SEQ ID NO: 8; or at least 93% sequence identity with SEQ ID NO: 10 or SEQ ID NO: 12; or at least 95% sequence identity with SEQ ID NO: 14; or at least 96% sequence identity with SEQ ID NO: 16; or at least 89% sequence identity with SEQ ID NO: 18; or at least 92% sequence identity with SEQ ID NO: 20; or at least 93% sequence identity with SEQ ID NO: 22; or at least 94% sequence identity with SEQ ID NO: 24; or (iv) a construct, vector or expression vector comprising the isolated polynucleotide shown in (i), wherein said plant cell contains at least one modification that modulates the expression or activity of the polynucleotide or polypeptide compared to a control plant cell in which the expression or the activity of the polynucleotide or polypeptide has not been modified.
Также описан полипептид, содержащий, состоящий или по существу состоящий из последовательности, характеризующейся по меньшей мере 69% идентичностью последовательности с SEQ ID NO: 2 или SEQ ID NO: 4; или по меньшей мере 80% идентичностью последовательности с SEQ ID NO: 6 или SEQ ID NO: 8; или по меньшей мере 74% идентичностью последовательности с SEQ ID NO: 10 или SEQ ID NO: 12; или по меньшей мере 76% идентичностью последовательности с SEQ ID NO: 14 или SEQ ID NO: 16; или по меньшей мере 68% идентичностью последовательности с SEQ ID NO: 18 или SEQ ID NO: 20; или по меньшей мере 69% идентичностью последовательности с SEQ ID NO: 22 или SEQ ID NO: 24.Also described is a polypeptide containing, consisting or essentially consisting of a sequence characterized by at least 69% sequence identity with SEQ ID NO: 2 or SEQ ID NO: 4; or at least 80% sequence identity with SEQ ID NO: 6 or SEQ ID NO: 8; or at least 74% sequence identity with SEQ ID NO: 10 or SEQ ID NO: 12; or at least 76% sequence identity with SEQ ID NO: 14 or SEQ ID NO: 16; or at least 68% sequence identity with SEQ ID NO: 18 or SEQ ID NO: 20; or at least 69% sequence identity with SEQ ID NO: 22 or SEQ ID NO: 24.
Предпочтительно указанная клетка растения содержит полинуклеотид, содержащий, состоящий или по существу состоящий из последовательности, характеризующейся по меньшей мере 80% идентичностью последовательности с SEQ ID NO: 5 или SEQ ID NO: 13 или по меньшей мере 95% идентичностью последовательности с SEQ ID NO: 9 или SEQ ID NO: 11.Preferably, said plant cell contains a polynucleotide comprising, consisting of, or essentially consisting of a sequence having at least 80% sequence identity with SEQ ID NO: 5 or SEQ ID NO: 13, or at least 95% sequence identity with SEQ ID NO: 9 or SEQ ID NO: 11.
Предпочтительно указанная клетка растения содержит полипептид, содержащий, состоящий или по существу состоящий из последовательности, характеризующейся по меньшей мере 81% идентичностью последовательности с SEQ ID NO: 6, или по меньшей мере 72% идентичностью последовательности с SEQ ID NO: 10 или SEQ ID NO: 12, или по меньшей мере 80% идентичностью последовательности с SEQ ID NO: 14. Preferably, said plant cell comprises a polypeptide comprising, consisting of, or essentially consisting of a sequence having at least 81% sequence identity with SEQ ID NO: 6, or at least 72% sequence identity with SEQ ID NO: 10 or SEQ ID NO : 12, or at least 80% sequence identity with SEQ ID NO: 14.
Предпочтительно указанная клетка растения содержит полипептид, содержащий, состоящий или по существу состоящий из последовательности, характеризующейся по меньшей мере 80% идентичностью последовательности с SEQ ID NO: 6, или по меньшей мере 74% идентичностью последовательности с SEQ ID NO: 10 или SEQ ID NO: 12, или по меньшей мере 76% идентичностью последовательности с SEQ ID NO: 14. Preferably, said plant cell comprises a polypeptide comprising, consisting of, or essentially consisting of a sequence having at least 80% sequence identity with SEQ ID NO: 6, or at least 74% sequence identity with SEQ ID NO: 10 or SEQ ID NO : 12, or at least 76% sequence identity with SEQ ID NO: 14.
Предпочтительно, по меньшей мере одна модификация представляет собой модификацию генома клетки растения, или модификацию конструкции, вектора или вектора экспрессии, или трансгенную модификацию.Preferably, at least one modification is a modification of the genome of a plant cell, or a modification of a construct, vector or expression vector, or a transgenic modification.
Предпочтительно, модификация генома клетки растения или модификация конструкции, вектора или вектора экспрессии представляет собой мутацию или редактирование.Preferably, the modification of the genome of the plant cell or the modification of the construct, vector or expression vector is a mutation or editing.
Предпочтительно модификация увеличивает или уменьшает экспрессию или активность полинуклеотида или полипептида по сравнению с клеткой контрольного растения.Preferably, the modification increases or decreases the expression or activity of the polynucleotide or polypeptide compared to a control plant cell.
Предпочтительно, клетка растения содержит полинуклеотид для обеспечения интерференции, содержащий последовательность, которая на по меньшей мере 80% комплементарна по меньшей мере 19 нуклеотидам РНК, транскрибируемой с полинуклеотида в соответствии с пунктом формулы изобретения 1(i).Preferably, the plant cell contains an interference polynucleotide containing a sequence that is at least 80% complementary to at least 19 nucleotides of the RNA transcribed from the polynucleotide according to claim 1(i).
Предпочтительно модулированная экспрессия или активность полинуклеотида или полипептида модулируют уровень редуцирующих сахаров в листе, полученном из клетки растения, по сравнению с уровнем редуцирующего сахара в листе, полученном из контрольного растения, соответственно, где редуцирующий сахар представляет собой глюкозу или фруктозу, или, соответственно, где лист представляет собой лист, подвергнутый ранним стадиям сушки, или подвергнутый сушке лист.Preferably, the modulated expression or activity of the polynucleotide or polypeptide modulates the level of reducing sugars in a leaf derived from a plant cell as compared to the level of reducing sugar in a leaf derived from a control plant, respectively, where the reducing sugar is glucose or fructose, or, respectively, where the sheet is a sheet subjected to the early stages of drying or a dried sheet.
В другом аспекте описано растение или его часть, содержащие клетку растения, описанную в данном документе.In another aspect, a plant or part thereof is described that contains the plant cell described herein.
В другом аспекте описан растительный материал, подвергнутый сушке растительный материал или гомогенизированный растительный материал, полученные из растения или его части, описанных в данном документе.In another aspect, a plant material, a dried plant material, or a homogenized plant material obtained from the plant or part thereof described herein is described.
Предпочтительно растительный материал предусматривает биомассу, семя, стебель, цветки или листья растения или его части, описанных в данном документе.Preferably, the plant material comprises the biomass, seed, stem, flowers or leaves of the plant or part thereof described herein.
Предпочтительно подвергнутый сушке растительный материал представляет собой растительный материал, подвергнутый трубоогневой сушке, солнечной сушке или воздушной сушке. Preferably, the dried plant material is fire-dried, sun-dried or air-dried plant material.
В другом аспекте описан табачный продукт, содержащий клетку растения, описанную в данном документе, часть растения, описанную в данном документе, или растительный материал, описанный в данном документе. In another aspect, a tobacco product is described comprising a plant cell as described herein, a plant part as described herein, or plant material as described herein.
В другом аспекте описан способ получения растения, описанного в данном документе, включающий следующие стадии: (a) обеспечение клетки растения, содержащей полинуклеотид, содержащий, состоящий или по существу состоящий из последовательности, характеризующейся по меньшей мере 95% идентичностью последовательности с SEQ ID NO: 1, или SEQ ID NO: 3, или SEQ ID NO: 9, или SEQ ID NO: 11, или SEQ ID NO: 17, или SEQ ID NO: 19, или SEQ ID NO: 21, или SEQ ID NO: 23; или характеризующейся по меньшей мере 80% идентичностью последовательности с SEQ ID NO: 5, или SEQ ID NO: 7, или SEQ ID NO: 13, или SEQ ID NO: 15; (b) модификацию клетки растения для модулирования экспрессии указанного полинуклеотида по сравнению с клеткой контрольного растения; и (c) размножение клетки растения с получением растения.In another aspect, a method for obtaining a plant described herein is described, comprising the following steps: (a) providing a plant cell containing a polynucleotide containing, consisting of, or essentially consisting of a sequence characterized by at least 95% sequence identity with SEQ ID NO: 1 or SEQ ID NO: 3 or SEQ ID NO: 9 or SEQ ID NO: 11 or SEQ ID NO: 17 or SEQ ID NO: 19 or SEQ ID NO: 21 or SEQ ID NO: 23 ; or characterized by at least 80% sequence identity with SEQ ID NO: 5, or SEQ ID NO: 7, or SEQ ID NO: 13, or SEQ ID NO: 15; (b) modifying a plant cell to modulate the expression of said polynucleotide as compared to a control plant cell; and (c) propagating the plant cell to produce a plant.
Предпочтительно, стадия (c) включает культивирование растения из побега или саженца, содержащих клетку растения.Preferably, step (c) comprises cultivating a plant from a shoot or seedling containing a plant cell.
Предпочтительно, стадия модификации клетки растения включает модификацию генома клетки с помощью методов редактирования генома или геномной инженерии.Preferably, the step of modifying the plant cell includes modifying the genome of the cell using genome editing or genomic engineering techniques.
Предпочтительно, методы редактирования генома или геномной инженерии выбраны из технологии CRISPR/Cas, мутагенеза, опосредованного нуклеазой с «цинковыми пальцами», химического или радиационного мутагенеза, гомологичной рекомбинации, олигонуклеотид-направленного мутагенеза и мутагенеза, опосредованного мегануклеазой.Preferably, genome editing or genomic engineering techniques are selected from CRISPR/Cas technology, zinc finger nuclease mediated mutagenesis, chemical or radiation mutagenesis, homologous recombination, oligonucleotide directed mutagenesis, and meganuclease mediated mutagenesis.
Предпочтительно стадия модификации клетки растения включает трансфекцию клетки конструкцией, содержащей полинуклеотид, содержащий, состоящий или по существу состоящий из последовательности, характеризующейся по меньшей мере 95% идентичностью последовательности с SEQ ID NO: 1, или SEQ ID NO: 3, или SEQ ID NO: 9, или SEQ ID NO: 11, или SEQ ID NO: 17, или SEQ ID NO: 19, или SEQ ID NO: 21, или SEQ ID NO: 23; или характеризующейся по меньшей мере 80% идентичностью последовательности с SEQ ID NO: 5, или SEQ ID NO: 7, или SEQ ID NO: 13, или SEQ ID NO: 15, функционально связанной с конститутивным промотором.Preferably, the step of modifying a plant cell comprises transfecting the cell with a construct comprising a polynucleotide comprising, consisting of, or essentially consisting of a sequence having at least 95% sequence identity with SEQ ID NO: 1, or SEQ ID NO: 3, or SEQ ID NO: 9 or SEQ ID NO: 11 or SEQ ID NO: 17 or SEQ ID NO: 19 or SEQ ID NO: 21 or SEQ ID NO: 23; or having at least 80% sequence identity with SEQ ID NO: 5 or SEQ ID NO: 7 or SEQ ID NO: 13 or SEQ ID NO: 15 operably linked to a constitutive promoter.
Предпочтительно, стадия модификации клетки растения включает введение в клетку полинуклеотида для обеспечения интерференции, содержащего последовательность, которая на по меньшей мере 80% комплементарна РНК, транскрибируемой с полинуклеотида в соответствии с пунктом формулы изобретения 1(i).Preferably, the step of modifying the plant cell comprises introducing into the cell an interference polynucleotide containing a sequence that is at least 80% complementary to the RNA transcribed from the polynucleotide according to claim 1(i).
Предпочтительно клетку растения трансфицируют конструкцией, экспрессирующей полинуклеотид для обеспечения интерференции, содержащий последовательность, которая на по меньшей мере 80% комплементарна по меньшей мере 19 нуклеотидам РНК, транскрибируемой с полинуклеотида, описанного в данном документе.Preferably, a plant cell is transfected with a construct expressing an interference polynucleotide containing a sequence that is at least 80% complementary to at least 19 nucleotides of the RNA transcribed from the polynucleotide described herein.
В другом аспекте, описан способ получения подвергнутого сушке растительного материала с измененным количеством редуцирующих сахаров по сравнению с контрольным растительным материалом, включающий следующие стадии: (a) обеспечение растения или его части или растительного материала, описанных в данном документе; (b) сбор из них растительного материала; и (c) сушку растительного материала.In another aspect, a method is described for obtaining a dried plant material with a modified amount of reducing sugars compared to a control plant material, comprising the steps of: (a) providing the plant or part thereof or plant material described herein; (b) collection of plant material from them; and (c) drying the plant material.
Предпочтительно, растительный материал включает подвергнутые сушке листья, подвергнутые сушке стебли или подвергнутые сушке цветки или их смесь.Preferably, the plant material comprises dried leaves, dried stems or dried flowers, or a mixture thereof.
Предпочтительно, способ сушки выбран из группы, состоящей из воздушной сушки, огневой сушки, дымовой сушки и трубоогневой сушки.Preferably, the drying method is selected from the group consisting of air drying, flame drying, flue drying and flue drying.
НЕКОТОРЫЕ ПРЕИМУЩЕСТВАSOME BENEFITS
Преимущественно полинуклеотидные последовательности NtSUS, описанные в данном документе, экспрессируются во время сушки, в частности, с начала сушки. Модулирование экспрессии одной или более полинуклеотидных последовательностей NtSUS может приводить к модулированным уровням редуцирующих сахаров, таких как глюкоза и фруктоза, в подвергнутых сушке листьях табака. В частности, увеличение или уменьшение экспрессии одного или более полинуклеотидов NtSUS может приводить к увеличению или уменьшению уровней редуцирующих сахаров и различному восприятию табака, полученного из них, при нагревании.Advantageously, the NtSUSα polynucleotide sequences described herein are expressed during drying, in particular from the start of drying. Modulating the expression of one or more NtSUS polynucleotide sequences can result in modulated levels of reducing sugars such as glucose and fructose in dried tobacco leaves. In particular, an increase or decrease in the expression of one or more NtSUS polynucleotides can lead to an increase or decrease in the levels of reducing sugars and a different perception of tobacco derived from them when heated.
В сигаретном дыме редуцирующие сахара оказывают влияние на высвобождение карбонильных компонентов, таких как формальдегид, ацетальдегид, ацетон, 2-фурфурал и акролеин (см. The Chemical Components of Tobacco and Tobacco Smoke, 2nd Edition, Rodgman and Perfetti, 2016). Следовательно, изменение содержания редуцирующих сахаров может менять высвобождение таких карбонильных соединений. Что касается высвобождения аромата в аэрозоле и дыме, глюкоза и в меньшей степени фруктоза могут образовывать соединения Амадори посредством реакции Майяра при взаимодействии с аминокислотами при нагревании. Хотя свободные аминокислоты рассматриваются как ограничивающие факторы в данной химической реакции, присутствие редуцирующих сахаров является необходимым для обеспечения образования соединений Амадори. Хлебный, ореховый или похожий на попкорн вкус и аромат получаются в результате нагревания пролина и глюкозы, таким образом, образуются продукты, подобные 2-ацетил-1-пирролину. Поскольку пролин и редуцирующие сахара являются особенно распространенными в табаке трубоогневой сушки, ореховые нотки получают при нагревании или курении табака Вирджиния. В случае смеси, как правило, акриламид (канцерогенное соединение, получаемое в результате взаимодействия глюкозы (фруктозы) с аспарагином при нагревании) может получаться в результате комбинации табака Берлей (с высоким содержанием аспарагина) с табаком Вирджиния (с высоким содержанием редуцирующих сахаров). Следовательно, модификация баланса редуцирующего сахара и аминокислоты может оказывать влиять на высвобождение как вкусоароматических соединений, так и акриламида в аэрозоле и дыме. In cigarette smoke, reducing sugars influence the release of carbonyl components such as formaldehyde, acetaldehyde, acetone, 2-furfural and acrolein (see The Chemical Components of Tobacco and Tobacco Smoke, 2nd Edition, Rodgman and Perfetti, 2016). Therefore, changing the content of reducing sugars can change the release of such carbonyl compounds. With respect to flavor release in aerosol and smoke, glucose and to a lesser extent fructose can form Amadori compounds via the Maillard reaction when reacted with amino acids upon heating. Although free amino acids are considered to be the limiting factors in this chemical reaction, the presence of reducing sugars is necessary to ensure the formation of Amadori compounds. Bready, nutty, or popcorn-like flavor and aroma are produced by heating proline and glucose, thus forming products like 2-acetyl-1-pyrroline. Since proline and reducing sugars are especially common in fire-cured tobacco, the nutty notes are produced by heating or smoking Virginia tobacco. In the case of a mixture, typically acrylamide (a carcinogenic compound resulting from the reaction of glucose (fructose) with asparagine when heated) can be obtained by combining Burley tobacco (high in asparagine) with Virginia tobacco (high in reducing sugars). Therefore, modification of the balance of reducing sugar and amino acid can affect the release of both flavor compounds and acrylamide in aerosol and smoke.
Преимущественно для надлежащего изготовления формованного листа из рекомбинированного табачного материала для нагреваемого табака зачастую требуются редуцирующие сахара. Модулирование экспрессии генов SUS во время сушки листа может оказывать влияние на содержание и баланс редуцирующих сахаров, тем самым воздействуя на изготовление формованного листа. Преимущественно могут быть созданы генетически не модифицированные растения, которые могут быть более приемлемыми для потребителей.Advantageously, reducing sugars are often required to properly manufacture a molded sheet of recombinant tobacco material for heated tobacco. Modulating the expression of SUS genes during leaf drying can affect the content and balance of reducing sugars, thereby affecting the production of the molded sheet. Advantageously, non-genetically modified plants can be created that may be more acceptable to consumers.
Преимущественно настоящее изобретение не ограничено применением растений, полученных с помощью EMS-мутагенеза. Растение, полученное с помощью EMS-мутагенеза, может характеризоваться меньшим потенциалом передачи улучшенных свойств сельскохозяйственной культуре после селекции. После начала селекции необходимая характеристика (характеристики) растения, полученного с помощью EMS-мутагенеза, по разным причинам может быть утрачена. Например, может потребоваться несколько мутаций, мутация может являться доминантной или рецессивной, и идентификация точечной мутации в гене-мишени может являться труднодостижимой. Напротив, в настоящем изобретении вводится применение полинуклеотидов NtAAT, которыми можно в частности манипулировать для получения растений с необходимым фенотипом. Настоящее изобретение можно применять к различным разновидностям растений или сельскохозяйственных культур. Advantageously, the present invention is not limited to the use of plants obtained by EMS mutagenesis. A plant produced by EMS mutagenesis may have less potential to transfer improved traits to the crop after selection. After the start of breeding, the necessary characteristic (characteristics) of the plant obtained by EMS mutagenesis may be lost for various reasons. For example, multiple mutations may be required, a mutation may be dominant or recessive, and identification of a point mutation in a target gene may be difficult to achieve. On the contrary, the present invention introduces the use of NtAAT polynucleotides, which can in particular be manipulated to obtain plants with the desired phenotype. The present invention can be applied to various varieties of plants or crops.
КРАТКОЕ ОПИСАНИЕ ГРАФИЧЕСКИХ МАТЕРИАЛОВBRIEF DESCRIPTION OF GRAPHICS
Фигура 1 представляет собой столбчатую диаграмму, на которой показано содержание редуцирующих сахаров после сбора (зрелые листья), после двух дней сушки (48 часов сушки) и в конце сушки для каждого сорта. Figure 1 is a bar graph showing the content of reducing sugars after harvest (mature leaves), after two days of drying (48 hours of drying) and at the end of drying for each variety.
ПОДРОБНОЕ ОПИСАНИЕDETAILED DESCRIPTION
Заголовки разделов, используемые в настоящем раскрытии, служат для организационных целей и не предусматриваются как ограничивающие. The section headings used in this disclosure are for organizational purposes and are not intended to be limiting.
1. Определения1. Definitions
Если не определено иное, то все технические и научные термины, используемые в данном документе, имеют такое же значение, какое обычно понимает специалист средней квалификации в данной области техники. В случае противоречий данный документ, включая определения, будет иметь преимущественную силу. Предпочтительные способы и материалы описаны ниже, хотя способы и материалы, сходные или эквивалентные описанным в данном документе, могут быть применены при осуществлении настоящего изобретения на практике или его тестировании. Материалы, способы и примеры, раскрытые в данном документе, являются лишь иллюстративными и не предусматриваются как ограничивающие.Unless otherwise defined, all technical and scientific terms used in this document have the same meaning as usually understood by a person of ordinary skill in the art. In the event of conflict, this document, including the definitions, shall prevail. Preferred methods and materials are described below, although methods and materials similar or equivalent to those described herein may be used in practicing or testing the present invention. The materials, methods, and examples disclosed herein are illustrative only and are not intended to be limiting.
Подразумевается, что термины «включают(включает)», «включают(включает) в себя», «характеризуются», «имеет», «может», «содержат(содержит)» и их варианты, используемые в данном документе, являются открытыми переходными фразами, терминами или словами, которые не исключают возможность наличия дополнительных действий или структур. The terms "include(includes)", "include(includes)", "characterized", "has", "may", "comprise(contains)" and their variants used in this document are intended to be open transitions. phrases, terms or words that do not exclude the possibility of additional actions or structures.
Формы единственного числа включают ссылки на множественное число, если из контекста явно не следует иное. The singular forms include references to the plural unless the context clearly indicates otherwise.
Термин «и/или» означает (а) или (b) или как (а), так и (b).The term "and/or" means (a) or (b) or both (a) and (b).
Настоящим изобретением предусмотрены другие варианты осуществления, «содержащие», «состоящие из» и «по существу состоящие из» вариантов осуществления или элементов, представленных в данном документе, независимо от того, указано это явно или нет. The present invention contemplates other embodiments "comprising", "consisting of" and "essentially consisting of" the embodiments or elements presented herein, whether explicitly stated or not.
В случае изложения в данном документе числовых диапазонов каждое промежуточное число в них предусматривается в явной форме с той же степенью точности. Например, в случае диапазона 6-9 в дополнение к 6 и 9 предусматриваются числа 7 и 8, а в случае диапазона 6,0-7,0 в явной форме предусматриваются числа 6,0, 6,1, 6,2, 6,3, 6,4, 6,5, 6,6, 6,7, 6,8, 6,9 и 7,0. When numerical ranges are set forth in this document, each number in between is explicitly provided for with the same degree of precision. For example, in the case of the range 6-9, in addition to 6 and 9, the numbers 7 and 8 are provided, and in the case of the range 6.0-7.0, the numbers 6.0, 6.1, 6.2, 6 are explicitly provided, 3, 6.4, 6.5, 6.6, 6.7, 6.8, 6.9 and 7.0.
Следующие термины, используемые во всем данном описании и формуле изобретения, имеют следующие значения. The following terms, as used throughout this specification and claims, have the following meanings.
Термины «кодирующая последовательность» или «полинуклеотид, кодирующий» означают нуклеотиды (молекулы РНК или ДНК), которые составляют полинуклеотид, который кодирует полипептид. Кодирующая последовательность может дополнительно содержать сигналы инициации и терминации, функционально связанные с регуляторными элементами, в том числе c промотором и сигналом полиаденилирования, способными управлять экспрессией в клетках индивидуума или млекопитающего, которому вводят полинуклеотид. Кодирующая последовательность может быть кодон-оптимизированной. The terms "coding sequence" or "polynucleotide encoding" means the nucleotides (RNA or DNA molecules) that make up a polynucleotide that encodes a polypeptide. The coding sequence may further comprise initiation and termination signals operably linked to regulatory elements, including a promoter and a polyadenylation signal, capable of directing expression in cells of the individual or mammal receiving the polynucleotide. The coding sequence may be codon-optimized.
Выражения «комплементарная последовательность» или «комплементарный» могут означать спаривание оснований по Уотсону-Крику (например, A-T/U и C-G) или Хугстину между нуклеотидами или аналогами нуклеотидов. «Комплементарность» относится к свойству, присущему совместно двум полинуклеотидам, заключающемуся в том, что при их антипараллельном выравнивании друг относительно друга нуклеотидные основания в каждом положении комплементарны друг другу.The terms "complementary sequence" or "complementary" may refer to Watson-Crick base pairing (e.g., A-T/U and C-G) or Hoogsteen between nucleotides or nucleotide analogs. "Complementarity" refers to the property shared by two polynucleotides that when they are anti-parallel aligned with each other, the nucleotide bases at each position are complementary to each other.
Термин «конструкция» относится к двунитевому фрагменту рекомбинантного полинуклеотида, предусматривающему один или более полинуклеотидов. Конструкция содержит «матричную нить», основания которой спарены с комплементарной «смысловой или кодирующей нитью». Указанная конструкция может быть вставлена в вектор в двух возможных ориентациях: либо в той же (или смысловой) ориентации, либо в противоположной (или антисмысловой) ориентации по отношению к ориентации промотора, расположенного в векторе, таком как вектор экспрессии.The term "construct" refers to a double-stranded fragment of a recombinant polynucleotide containing one or more polynucleotides. The construction contains a "matrix thread", the bases of which are paired with a complementary "semantic or coding thread". The construct can be inserted into the vector in two possible orientations: either in the same (or sense) orientation, or in the opposite (or antisense) orientation to the orientation of the promoter located in the vector, such as an expression vector.
Термин «контроль» в контексте контрольного растения или контрольных клеток растения означает растение или клетки растения, в которых экспрессия, функция или активность одного или более генов или полипептидов не была модифицирована (например, повышена или понижена), и поэтому они могут обеспечивать возможность сравнения с растением, в котором экспрессия, функция или активность одного или более таких же генов или полипептидов была модифицирована. Используемое в данном документе выражение «контрольное растение» означает растение, которое является практически эквивалентным тестируемому растению или модифицированному растению по всем параметрам, за исключением тестируемых параметров. Например, если речь идет о растении, в которое был введен полинуклеотид, контрольным растением является эквивалентное растение, в которое такой полинуклеотид не был введен. Контрольным растением может являться эквивалентное растение, в которое был введен контрольный полинуклеотид. В таких случаях контрольный полинуклеотид представляет собой полинуклеотид, для которого обуславливаемый им фенотипический эффект в отношении растения, как предполагается, является незначительным или отсутствует. Контрольное растение может содержать пустой вектор. Контрольное растение может соответствовать растению дикого типа. Контрольное растение может быть ноль-сегрегантом, при этом сегрегант T1 больше не содержит трансгена.The term "control" in the context of a control plant or control plant cells means a plant or plant cells in which the expression, function, or activity of one or more genes or polypeptides has not been modified (e.g., increased or decreased), and therefore may provide a comparison with a plant in which the expression, function or activity of one or more of the same genes or polypeptides has been modified. Used in this document, the expression "control plant" means a plant that is practically equivalent to the test plant or modified plant in all respects, with the exception of the tested parameters. For example, if we are talking about a plant in which the polynucleotide has been introduced, the control plant is an equivalent plant in which such a polynucleotide has not been introduced. The control plant may be an equivalent plant into which the control polynucleotide has been introduced. In such cases, a control polynucleotide is a polynucleotide for which its phenotypic effect on the plant is expected to be negligible or absent. The control plant may contain an empty vector. The control plant may correspond to the wild type plant. The control plant may be a null segregant, with the T1 segregant no longer containing the transgene.
Термины «донорная ДНК» или «донорная матрица» относятся к фрагменту или молекуле двунитевой ДНК, которые содержат по меньшей мере часть гена, представляющего интерес. Донорная ДНК может кодировать полностью функциональный полипептид или частично функциональный полипептид.The terms "donor DNA" or "donor template" refer to a double stranded DNA fragment or molecule that contains at least a portion of a gene of interest. The donor DNA may encode a fully functional polypeptide or a partially functional polypeptide.
Термин «эндогенный ген или полипептид» относится к гену или полипептиду, которые происходят из генома организма и не претерпели изменения, такого как потеря, приобретение или замена генетического материала. Эндогенный ген подвергается нормальному переносу гена и экспрессии гена. Эндогенный полипептид подвергается нормальной экспрессии. The term "endogenous gene or polypeptide" refers to a gene or polypeptide that originates from the genome of an organism and has not undergone a change, such as loss, gain or replacement of genetic material. An endogenous gene undergoes normal gene transfer and gene expression. The endogenous polypeptide undergoes normal expression.
Термин «энхансерные последовательности» относится к последовательностям, которые могут обеспечивать повышение экспрессии гена. Эти последовательности могут быть расположены выше, в пределах интронов или ниже транскрибируемого участка. Транскрибируемый участок состоит из экзонов и расположенных между ними интронов, от промотора до участка терминации транскрипции. Усиление экспрессии гена может происходить посредством различных механизмов, включая повышение эффективности транскрипции, стабилизацию зрелой мРНК и усиление трансляции.The term "enhancer sequences" refers to sequences that can increase gene expression. These sequences may be located upstream, within the introns, or downstream of the transcribed region. The transcribed region consists of exons and introns located between them, from the promoter to the transcription termination site. The increase in gene expression can occur through a variety of mechanisms, including increased transcriptional efficiency, stabilization of mature mRNA, and increased translation.
Термин «экспрессия» относится к выработке функционального продукта. Например, экспрессия фрагмента полинуклеотида может относиться к транскрипции фрагмента полинуклеотида (например, транскрипции, приводящей к получению мРНК или функциональной РНК) и/или трансляции мРНК с получением полипептида-предшественника или зрелого полипептида. «Сверхэкспрессия» относится к выработке продукта гена в трансгенных организмах на уровнях, которые превышают уровни выработки в ноль-сегрегантном (или нетрансгенном) организме из того же эксперимента.The term "expression" refers to the production of a functional product. For example, expression of a polynucleotide fragment may refer to the transcription of a polynucleotide fragment (eg, transcription resulting in mRNA or functional RNA) and/or translation of the mRNA to produce a precursor or mature polypeptide. "Overexpression" refers to the production of a gene product in transgenic organisms at levels that exceed those in a null-segregant (or non-transgenic) organism from the same experiment.
Термины «функциональный» и «полностью функциональный» описывают полипептид, который обладает биологической функцией или активностью. Термин «функциональный ген» относится к гену, транскрибируемому с образованием мРНК, которая транслируется с образованием функционального или активного полипептида. The terms "functional" and "fully functional" describe a polypeptide that has a biological function or activity. The term "functional gene" refers to a gene that is transcribed to form an mRNA that is translated to form a functional or active polypeptide.
Термин «генетическая конструкция» относится к молекулам ДНК или РНК, которые содержат полинуклеотид, который кодирует полипептид. Кодирующая последовательность может содержать сигналы инициации и терминации, функционально связанные с регуляторными элементами, в том числе c промотором и сигналом полиаденилирования, способными управлять экспрессией. The term "genetic construct" refers to DNA or RNA molecules that contain a polynucleotide that encodes a polypeptide. The coding sequence may contain initiation and termination signals operably linked to regulatory elements, including a promoter and a polyadenylation signal, capable of driving expression.
Термин «редактирование генома» относится к такому изменению эндогенного гена, который кодирует эндогенный полипептид, при котором достигают экспрессии полипептида, представляющего собой усеченный эндогенный полипептид или эндогенный полипептид, имеющий аминокислотную замену. Редактирование генома может включать замещение участка эндогенного гена, подлежащего нацеливанию, или замещение всего эндогенного гена копией гена, которая характеризуется наличием усечения или аминокислотной замены, с помощью механизма репарации, такого как HDR. Редактирование генома также может включать создание аминокислотной замены в эндогенном гене посредством создания двунитевого разрыва в эндогенном гене, который затем репарируют с применением NHEJ. С помощью NHEJ можно осуществлять добавление или делецию по меньшей мере одной пары оснований в ходе репарации, вследствие чего можно получить аминокислотную замену. Редактирование генома также может включать удаление сегмента гена с помощью одновременного действия двух нуклеаз на одну и ту же нить ДНК для осуществления усечения между двумя сайтами-мишенями нуклеаз, и репарацию разрыва ДНК с помощью NHEJ.The term "genome editing" refers to such a change in an endogenous gene that encodes an endogenous polypeptide, which achieves the expression of a polypeptide that is a truncated endogenous polypeptide or an endogenous polypeptide having an amino acid substitution. Genome editing may include replacing the portion of an endogenous gene to be targeted, or replacing the entire endogenous gene with a copy of the gene that is characterized by the presence of a truncation or amino acid substitution, using a repair mechanism such as HDR. Genome editing may also include creating an amino acid substitution in an endogenous gene by creating a double strand break in the endogenous gene, which is then repaired using NHEJ. NHEJ can be used to add or delete at least one base pair during repair, whereby an amino acid substitution can be obtained. Genome editing may also include deletion of a gene segment by simultaneous action of two nucleases on the same strand of DNA to effect truncation between two nuclease target sites, and repair of the DNA break by NHEJ.
Термин «гетерологичный» в отношении последовательности означает последовательность, которая происходит из чужеродного вида или, в случае, если она происходит из того же вида, является существенно модифицированной по сравнению со своей нативной формой по составу и/или геномному локусу вследствие преднамеренного вмешательства человека.The term "heterologous" in relation to a sequence means a sequence that is derived from a foreign species or, if derived from the same species, is substantially modified from its native form in composition and/or genomic locus due to intentional human interference.
Термины «репарация путем гомологичной рекомбинации» или «HDR» относятся к механизму репарации двунитевых повреждений ДНК в клетках, если гомологичный фрагмент ДНК присутствует в ядре, главным образом в G2- и S-фазе клеточного цикла. В ходе HDR применяют донорную ДНК или донорную матрицу для направления репарации, и ее можно применять для создания конкретных изменений последовательностей в геноме, в том числе для нацеленного добавления целых генов. Если донорная матрица предоставляется вместе с сайт-специфичной нуклеазой, то клеточный аппарат будет репарировать разрыв с помощью гомологичной рекомбинации, которая усиливается по величине на несколько порядков при наличии расщепления ДНК. Если гомологичный фрагмент ДНК отсутствует, то вместо этого может происходить NHEJ.The terms "repair by homologous recombination" or "HDR" refers to the mechanism of repair of double-stranded DNA damage in cells when a homologous DNA fragment is present in the nucleus, mainly in the G2 and S phases of the cell cycle. HDR uses donor DNA or a donor template to guide repair and can be used to create specific sequence changes in the genome, including targeted addition of entire genes. If the donor template is provided together with a site-specific nuclease, then the cellular apparatus will repair the break by homologous recombination, which is magnified by several orders of magnitude in the presence of DNA cleavage. If a homologous DNA fragment is not present, then NHEJ may occur instead.
Термины «гомология» или «сходство» относятся к степени сходства последовательностей двух полипептидов или двух молекул полинуклеотида, сравниваемых путем выравнивания последовательностей. Степень гомологии между двумя отдельными сравниваемым полинуклеотидами является функцией числа идентичных или совпадающих нуклеотидов в сопоставляемых положениях.The terms "homology" or "similarity" refers to the degree of sequence similarity between two polypeptides or two polynucleotide molecules compared by sequence alignment. The degree of homology between two individual compared polynucleotides is a function of the number of identical or matching nucleotides at the compared positions.
Термины «идентичный» или «идентичность» в контексте двух или более полинуклеотидов или полипептидов означают, что последовательности характеризуются наличием определенной процентной доли остатков, которые являются одинаковыми в пределах определенного участка. Процентную долю можно рассчитать путем оптимального выравнивания двух последовательностей, сравнения двух последовательностей в пределах определенного участка, определения числа положений, в которых в обеих последовательностях находятся идентичные остатки, с получением числа совпадающих положений, деления числа совпадающих положений на общее число положений в определенном участке и умножения результата на 100 с получением процентной доли идентичности последовательностей. В тех случаях, когда эти две последовательности имеют разную длину или при выравнивании создается один или более несимметрично расположенных концов, и определенный участок сравнения включает только одну последовательность, то при расчете остатки одиночной последовательности включаются в знаменатель, а не в числитель. При сравнении ДНК и РНК тимин (Т) и урацил (U) можно считать эквивалентными. Идентичность можно определять самостоятельно или с помощью компьютерного алгоритма для работы с последовательностями, такого как ClustalW, ClustalX, BLAST, FASTA или алгоритм Смита-Уотермана. Популярная программа множественного выравнивания ClustalW (Nucleic Acids Research (1994) 22, 4673-4680; Nucleic Acids Research (1997), 24, 4876-4882) представляет собой подходящий способ получения множественных выравниваний полипептидов или полинуклеотидов. Подходящие параметры для ClustalW могут являться следующими. Для выравниваний полинуклеотидов: штраф за открытие гэпа=15,0, штраф за продолжение гэпа=6,66 и матрица=идентичность. Для выравниваний полипептидов: штраф за открытие гэпа=10,0, штраф за продолжение гэпа=0,2 и матрица=Gonnet. Для выравниваний ДНК и белка: ENDGAP = -1 и GAPDIST=4. Специалистам в данной области будет понятно, что может быть необходимым изменять эти и другие параметры для оптимального выравнивания последовательностей. Предпочтительно, затем проводят расчет процентной доли идентичностей на основании такого выравнивания в виде (N/T), где N представляет собой число положений, в которых в последовательностях присутствует идентичный остаток, и T представляет собой общее число сравниваемых положений, включая гэпы, но за исключением выступов. The terms "identical" or "identity" in the context of two or more polynucleotides or polypeptides means that the sequences are characterized by the presence of a certain percentage of residues that are the same within a certain area. The percentage can be calculated by optimally aligning two sequences, comparing the two sequences within a given region, determining the number of positions where both sequences have identical residues to get the number of matching positions, dividing the number of matching positions by the total number of positions in the defined region, and multiplying result by 100 to obtain a percentage of sequence identity. In cases where the two sequences are of different lengths, or the alignment creates one or more non-symmetrically spaced ends, and a certain comparison region includes only one sequence, then the residuals of the single sequence are included in the denominator and not in the numerator in the calculation. When comparing DNA and RNA, thymine (T) and uracil (U) can be considered equivalent. The identity can be determined by yourself or by using a computer sequence algorithm such as ClustalW, ClustalX, BLAST, FASTA, or the Smith-Waterman algorithm. The popular ClustalW multiple alignment program ( Nucleic Acids Research (1994) 22, 4673-4680; Nucleic Acids Research (1997), 24, 4876-4882) is a suitable method for generating multiple polypeptide or polynucleotide alignments. Suitable parameters for ClustalW may be as follows. For polynucleotide alignments: gap opening penalty=15.0, gap extension penalty=6.66 and template=identity. For polypeptide alignments: gap opening penalty=10.0, gap extension penalty=0.2 and matrix=Gonnet. For DNA and protein alignments: ENDGAP=-1 and GAPDIST=4. Those skilled in the art will appreciate that it may be necessary to vary these and other parameters for optimal sequence alignment. Preferably, the percentage of identities is then calculated based on this alignment in the form (N/T), where N is the number of positions at which an identical residue is present in the sequences, and T is the total number of positions compared, including gaps but excluding ledges.
Термины «повышение» или «повышенный» относятся к повышению, составляющему от приблизительно 10% до приблизительно 99%, или повышению, составляющему по меньшей мере 10%, по меньшей мере 20%, по меньшей мере 25%, по меньшей мере 30%, по меньшей мере 40%, по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 98%, по меньшей мере 99%, по меньшей мере 100%, по меньшей мере 150%, или по меньшей мере 200%, или больше, количества, или функции, или активности, такой как без ограничения функция или активность полипептида, транскрипционная функция или активность и/или экспрессия белка. Термин «повышенный» или фраза «повышенное количество» может относиться к количеству, или функции, или активности модифицированного растения или продукта, полученного из модифицированного растения, которое является большим, чем можно обнаружить в растении или продукте из той же разновидности растения, обработанного таким же образом, которое не было модифицировано. Таким образом, в некоторых случаях растение дикого типа той же разновидности, которое было переработано таким же образом, используется в качестве контроля, с помощью которого измеряют, достигнуто ли повышение количества.The terms "increase" or "increased" refer to an increase of from about 10% to about 99%, or an increase of at least 10%, at least 20%, at least 25%, at least 30%, at least 40%, at least 50%, at least 60%, at least 70%, at least 75%, at least 80%, at least 90%, at least 95%, at least at least 98%, at least 99%, at least 100%, at least 150%, or at least 200%, or more, of an amount or function or activity, such as, without limitation, the function or activity of a polypeptide, transcriptional function or activity and/or expression of the protein. The term "increased" or the phrase "increased amount" may refer to an amount or function or activity of a modified plant or product derived from a modified plant that is greater than would be found in a plant or product from the same plant variety treated with the same in a manner that has not been modified. Thus, in some cases, a wild-type plant of the same variety that has been processed in the same way is used as a control by which it is measured whether an increase in quantity has been achieved.
Термин «увеличение» или «увеличенный», используемый в данном документе, относится к снижению, составляющему от приблизительно 10% до приблизительно 99%, или снижению на по меньшей мере 10%, по меньшей мере 20%, по меньшей мере 25%, по меньшей мере 30%, по меньшей мере 40%, по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 98%, по меньшей мере 99% или по меньшей мере 100%, или по меньшей мере 150%, или по меньшей мере 200% и более от количества или функции, такой как функция полипептида, транскрипционная функция или экспрессия полипептида. Термин «повышенный» или фраза «повышенное количество» может относиться к количеству или функции в модифицированном растении или продукте, полученном из модифицированного растения, которое является меньшим, чем можно обнаружить в растении или продукте из той же разновидности растения, обработанного таким же образом, которое не было модифицировано. Таким образом, в некоторых случаях растение дикого типа той же разновидности, которое было переработано таким же образом, используется в качестве контроля, с помощью которого измеряют, достигнуто ли уменьшение количества.The term "increase" or "increased" as used herein refers to a decrease of from about 10% to about 99%, or a decrease of at least 10%, at least 20%, at least 25%, at least 30%, at least 40%, at least 50%, at least 60%, at least 70%, at least 75%, at least 80%, at least 90%, at least 95%, at least 98%, at least 99%, or at least 100%, or at least 150%, or at least 200% or more of an amount or function, such as polypeptide function, transcriptional function, or expression polypeptide. The term "increased" or the phrase "increased amount" may refer to an amount or function in a modified plant or product derived from a modified plant that is less than would be found in a plant or product from the same plant variety treated in the same manner that has not been modified. Thus, in some cases, a wild-type plant of the same variety that has been processed in the same way is used as a control to measure whether a reduction has been achieved.
Термин «ингибировать» или «ингибированный» относится к уменьшению, составляющему от приблизительно 98% до приблизительно 100%, или уменьшению, составляющему по меньшей мере 98%, по меньшей мере 99% и, в частности, 100%, количества, или функции, или активности, как, например, без ограничения, функции или активности полипептида, транскрипционной функции или активности и/или экспрессии полипептида.The term "inhibit" or "inhibited" refers to a reduction of from about 98% to about 100%, or a reduction of at least 98%, at least 99%, and in particular 100%, of the amount, or function, or activity, such as, without limitation, function or activity of the polypeptide, transcriptional function or activity, and/or expression of the polypeptide.
Термин «введенный» означает доставку полинуклеотида (например, конструкции) или полипептида в клетку. Выражение «введенный» включает ссылку на встраивание полинуклеотида в эукариотическую клетку, где полинуклеотид может быть встроен в геном клетки, а также включает ссылку на транзиентное внедрение полинуклеотида или полипептида в клетку. Выражение «введенный» включает ссылки на способы стабильной или транзиентной трансформации, а также на скрещивание половым путем. Таким образом, выражение «введенный» применительно к вставке полинуклеотида (например, рекомбинантной конструкции/экспрессионной конструкции) в клетку означает «трансфекцию», или «трансформацию», или «трансдукцию» и включает ссылку на встраивание полинуклеотида в эукариотическую клетку, где полинуклеотид может быть встроен в геном клетки (например, хромосомную, плазмидную, пластидную или митохондриальную ДНК), преобразован в автономный репликон или экспрессироваться транзиентно (например, трансфицированная мРНК).The term "introduced" means the delivery of a polynucleotide (eg, construct) or polypeptide into a cell. The expression "introduced" includes reference to the insertion of a polynucleotide into a eukaryotic cell, where the polynucleotide may be inserted into the cell's genome, and also includes a reference to the transient introduction of the polynucleotide or polypeptide into the cell. The expression "introduced" includes references to methods of stable or transient transformation, as well as to sexual interbreeding. Thus, the expression "introduced" in relation to the insertion of a polynucleotide (e.g., recombinant construct/expression construct) into a cell means "transfection" or "transformation" or "transduction" and includes reference to the insertion of the polynucleotide into a eukaryotic cell, where the polynucleotide may be integrated into the cell genome (eg, chromosomal, plasmid, plastid, or mitochondrial DNA), converted to an autonomous replicon, or transiently expressed (eg, transfected mRNA).
Термины «выделенный» или «очищенный» относятся к материалу, который практически или по существу не содержит компоненты, которые обычно сопутствуют ему, как встречается в его нативном состоянии. Как правило, чистоту и однородность определяют с помощью методик аналитической химии, таких как электрофорез в полиакриламидном геле или высокоэффективная жидкостная хроматография. Полипептид, который является преобладающей молекулой, присутствующей в препарате, является практически очищенным. В частности, выделенный полинуклеотид отделяют от открытых рамок считывания, которые фланкируют требуемый ген и кодируют полипептиды, отличные от необходимого полипептида. Термин «очищенный», применяемый в данном документе, обозначает, что полинуклеотид или полипептид дают по существу одну полосу в электрофорезном геле. В частности, это означает, что полинуклеотид или полипептид являются на по меньшей мере 85% чистыми, более предпочтительно на по меньшей мере 95% чистыми и наиболее предпочтительно на по меньшей мере 99% чистыми. Выделенные полинуклеотиды могут быть очищены из клетки-хозяина, в которой они встречаются в природе. Для получения выделенных полинуклеотидов можно применять общепринятые способы очистки нуклеиновых кислот, известные специалистам в данной области техники. Данный термин также охватывает рекомбинантные полинуклеотиды и химически синтезируемые полинуклеотиды.The terms "isolated" or "purified" refer to material that is substantially or essentially free of the components that normally accompany it, as found in its native state. Typically, purity and homogeneity are determined using analytical chemistry techniques such as polyacrylamide gel electrophoresis or high performance liquid chromatography. The polypeptide, which is the predominant molecule present in the formulation, is substantially purified. In particular, the isolated polynucleotide is separated from the open reading frames that flank the desired gene and encode polypeptides other than the desired polypeptide. The term "purified" as used herein means that the polynucleotide or polypeptide yields substantially one band on an electrophoretic gel. In particular, this means that the polynucleotide or polypeptide is at least 85% pure, more preferably at least 95% pure, and most preferably at least 99% pure. Isolated polynucleotides can be purified from the host cell in which they naturally occur. Conventional nucleic acid purification methods known to those skilled in the art can be used to obtain isolated polynucleotides. The term also encompasses recombinant polynucleotides and chemically synthesized polynucleotides.
Термины «модулировать» или «модулирование» относятся к обеспечению или облегчению качественного или количественного изменения, корректировки или модификации способа, пути, функции или активности, представляющих интерес. Без ограничения такое изменение, корректировка или модификация может представлять собой повышение или понижение уровня соответствующего процесса, пути, функции или активности, представляющих интерес. Например, можно модулировать экспрессию гена или экспрессию полипептида или функцию или активность полипептида. Как правило, относительное изменение, корректировку или модификацию определяют посредством сравнения с контролем.The terms "modulate" or "modulating" refer to providing or facilitating a qualitative or quantitative change, adjustment or modification of a method, pathway, function or activity of interest. Without limitation, such a change, adjustment or modification may be an increase or decrease in the level of the corresponding process, pathway, function or activity of interest. For example, gene expression or polypeptide expression or the function or activity of a polypeptide can be modulated. Typically, relative change, adjustment, or modification is determined by comparison with a control.
Термин «путь негомологичного соединения концов (NHEJ)», используемый в данном документе, относится к пути, посредством которого происходит репарация двунитевых разрывов в ДНК путем прямого лигирования концов разрывов без необходимости в гомологичной матрице. Независимое от матрицы повторное лигирование концов ДНК посредством NHEJ является стохастическим, подверженным ошибкам процессом репарации, в ходе которого в точку разрыва ДНК вводятся случайные микровставки и микроделеции (вставки/делеции). Данный способ можно применять для преднамеренного разрушения, делеции или корректировки рамки считывания в последовательностях генов-мишеней. Как правило, в ходе NHEJ используются короткие гомологичные ДНК-последовательности, называемые микрогомологами, для направления репарации. Эти микрогомологи часто присутствуют в однонитевых выступах на концах двунитевых разрывов. Если выступы полностью совместимы, то в ходе NHEJ обычно происходит точная репарация разрыва, хотя может иметь место также неточная репарация, приводящая к потере нуклеотидов, однако гораздо более распространены случаи, когда выступы несовместимы. The term "non-homologous end-joining (NHEJ) pathway" as used herein refers to a pathway by which DNA double-strand breaks are repaired by direct ligation of the break ends without the need for a homologous template. Template-independent religation of DNA ends by NHEJ is a stochastic, error-prone repair process in which random microinsertions and microdeletions (inserts/deletions) are introduced at the DNA break point. This method can be used to deliberately destroy, delete or correct the reading frame in the sequences of target genes. Typically, NHEJ uses short homologous DNA sequences called microhomologues to guide repair. These microhomologues are often present in single strand protrusions at the ends of double strand breaks. If the overhangs are perfectly compatible, NHEJ will usually repair the gap accurately, although there may also be inaccurate repair resulting in loss of nucleotides, but it is much more common for the overhangs to be mismatched.
Термин «не встречающийся в природе» описывает объект, такой как полинуклеотид, генетическую мутацию, полипептид, растение, клетку растения и растительный материал, который не образован естественным путем или не существует в природе. Такие не встречающиеся в природе объекты или искусственные объекты можно создать, синтезировать, осуществить их инициацию, модифицировать, подвергнуть вмешательству или манипуляции способами, описанными в данном документе, или которые известны в данной области техники. Такие не встречающиеся в природе объекты или искусственные объекты могут быть созданы, синтезированы, инициированы, модифицированы, подвергнуты вмешательству или манипуляции человеком. Таким образом, в качестве примера, не встречающееся в природе растение, не встречающуюся в природе клетку растения или не встречающийся в природе растительный материал можно создать с применением традиционных методик селекции растений, таких как обратное скрещивание, или с помощью технологий манипуляции с генами, например, с применением антисмысловой РНК, интерферирующей РНК, мегануклеазы и т.п. В качестве дополнительного примера, не встречающееся в природе растение, не встречающуюся в природе клетку растения или не встречающийся в природе растительный материал можно создать посредством интрогрессии или путем переноса одной или более генетических мутаций (например, одного или более полиморфизмов) от первого растения или клетки растения ко второму растению или клетке растения (которые сами по себе могут быть встречающимися в природе), таким образом, что полученное растение, клетка растения или растительный материал или их потомство содержит генетическую структуру (например, геном, хромосому или ее сегмент), которая не образуется естественным путем, или которая не существует в природе. Полученное растение, клетка растения или растительный материал, таким образом, являются искусственными или не встречающимися в природе. Соответственно, искусственные или не встречающиеся в природе растение или клетку растения можно создать путем модификации генетической последовательности в первом встречающемся в природе растении или клетке растения, даже если полученная генетическая последовательность встречается в природе во втором растении или клетке растения, которые содержат генетический фон, отличный от такового у первого растения или клетки растения. В определенных вариантах осуществления мутация не является встречающейся в природе мутацией, которая существует в природе в полинуклеотиде или полипептиде, таких как ген или полипептид. Различия в генетическом фоне можно выявить по фенотипическим различиям или с помощью методик молекулярной биологии, известных из уровня техники, таких как секвенирование полинуклеотида, определение наличия или отсутствия генетических маркеров (например, маркеров, представляющих собой микросателлитные РНК).The term "non-naturally occurring" describes an entity such as a polynucleotide, genetic mutation, polypeptide, plant, plant cell, and plant material that is not naturally occurring or does not exist in nature. Such non-naturally occurring objects or artificial objects can be created, synthesized, initiated, modified, tampered with or manipulated in the ways described herein or as known in the art. Such non-naturally occurring objects or man-made objects can be created, synthesized, initiated, modified, tampered with or manipulated by humans. Thus, by way of example, a non-naturally occurring plant, a non-naturally occurring plant cell, or a non-naturally occurring plant material can be created using conventional plant breeding techniques such as backcrossing or gene manipulation techniques such as using antisense RNA, interfering RNA, meganuclease, and the like. As a further example, a non-naturally occurring plant, non-naturally occurring plant cell, or non-naturally occurring plant material can be created by introgression or by transferring one or more genetic mutations (e.g., one or more polymorphisms) from the first plant or plant cell. to a second plant or plant cell (which may themselves be naturally occurring), such that the resulting plant, plant cell, or plant material, or progeny thereof, contains a genetic structure (e.g., genome, chromosome, or segment thereof) that is not produced naturally, or which does not exist in nature. The resulting plant, plant cell or plant material is thus artificial or not naturally occurring. Accordingly, an artificial or non-naturally occurring plant or plant cell can be generated by modifying a genetic sequence in a first naturally occurring plant or plant cell, even if the resulting genetic sequence occurs naturally in a second plant or plant cell that contains a different genetic background than that of the first plant or plant cell. In certain embodiments, the mutation is not a naturally occurring mutation that occurs naturally in a polynucleotide or polypeptide, such as a gene or polypeptide. Differences in genetic background can be detected by phenotypic differences or by molecular biology techniques known in the art, such as polynucleotide sequencing, determining the presence or absence of genetic markers (eg microsatellite RNA markers).
Термины «олигонуклеотид» или «полинуклеотид» означают по меньшей мере два нуклеотида, ковалентно связанных вместе. Описание отдельной нити также определяет последовательность комплементарной нити. Таким образом, полинуклеотид также охватывает нить, комплементарную описанной отдельной нити. Многие варианты полинуклеотида могут использоваться для той же цели, что и указанный полинуклеотид. Таким образом, полинуклеотид также охватывает практически идентичные полинуклеотиды и комплементарные им последовательности. Отдельная нить представляет собой зонд, который может гибридизироваться с данной последовательностью в жестких условиях гибридизации. Таким образом, полинуклеотид также охватывает зонд, который гибридизируется в жестких условиях гибридизации. Полинуклеотиды могут быть однонитевыми или двунитевыми или могут содержать части как двунитевой, так и однонитевой последовательности. Полинуклеотид может представлять собой ДНК, как геномную, так и кДНК, РНК или гибридную молекулу, где полинуклеотид может содержать комбинации дезоксирибо- и рибонуклеотидов, а также комбинации оснований, в том числе урацила, аденина, тимина, цитозина, гуанина, инозина, ксантина, гипоксантина, изоцитозина и изогуанина. Полинуклеотиды можно получать с помощью способов химического синтеза или с помощью рекомбинантных способов. The terms "oligonucleotide" or "polynucleotide" means at least two nucleotides covalently linked together. The description of an individual strand also defines the sequence of the complementary strand. Thus, the polynucleotide also spans a strand complementary to the single strand described. Many variants of the polynucleotide can be used for the same purpose as the specified polynucleotide. Thus, a polynucleotide also encompasses substantially identical polynucleotides and their complementary sequences. A single strand is a probe that can hybridize to a given sequence under stringent hybridization conditions. Thus, the polynucleotide also encompasses a probe that hybridizes under stringent hybridization conditions. Polynucleotides may be single or double stranded, or may contain portions of both double and single stranded sequences. The polynucleotide may be DNA, either genomic or cDNA, RNA, or a hybrid molecule, where the polynucleotide may contain combinations of deoxyribo- and ribonucleotides, as well as combinations of bases, including uracil, adenine, thymine, cytosine, guanine, inosine, xanthine, hypoxanthine, isocytosine and isoguanine. Polynucleotides can be produced by chemical synthesis methods or by recombinant methods.
Специфичность однонитевой ДНК в отношении гибридизации с комплементарными фрагментами определяется «жесткостью» условий реакции (Sambrook et al., Molecular Cloning and Laboratory Manual, Second Ed., Cold Spring Harbor (1989)). Жесткость гибридизации повышается по мере понижения склонности к образованию ДНК-дуплексов. При реакциях гибридизации полинуклеотидов жесткость можно выбирать таким образом, чтобы содействовать реакциям гибридизации, характеризующимся специфичностью (высокая жесткость), которые можно применять для идентификации, например, клонов полной длины из библиотеки. Реакции гибридизации, характеризующиеся меньшей специфичностью (низкая жесткость), можно применять для идентификации родственных, но не точно соответствующих (гомологичных, но не идентичных) молекул или сегментов ДНК. ДНК-дуплексы стабилизируют посредством (1) определенного числа комплементарных пар оснований; (2) определенного типа пар оснований; (3) концентрации солей (ионной силы) в реакционной смеси; (4) температуры реакции и (5) присутствия определенных органических растворителей, таких как формамид, которые понижают стабильность ДНК-дуплекса. Обычно чем длиннее зонд, тем выше температура, необходимая для надлежащего отжига. Общепринятый подход заключается в изменении температуры; более высокие относительные температуры приводят к более жестким условиям реакции. Для гибридизации в «жестких условиях» описаны протоколы гибридизации, в которых полинуклеотиды, на по меньшей мере 60% гомологичные друг другу, остаются гибридизированными. Обычно жесткие условия выбирают таким образом, чтобы температура была приблизительно на 5°C ниже, чем температура точки плавления (Tm) для конкретной последовательности при определенных значениях ионной силы и рН. Tm представляет собой температуру (при определенных значениях ионной силы, рН и концентрации полинуклеотида), при которой 50% зондов комплементарно данной последовательности, гибридизируются с данной последовательностью в равновесном состоянии. Поскольку данные последовательности обычно присутствуют в избытке, то при Tm 50% зондов заняты в равновесном состоянии. The specificity of single-stranded DNA for hybridization with complementary fragments is determined by the "stringency" of the reaction conditions (Sambrook et al ., Molecular Cloning and Laboratory Manual, Second Ed., Cold Spring Harbor (1989)). The rigidity of hybridization increases as the propensity to form DNA duplexes decreases. In polynucleotide hybridization reactions, stringency can be chosen to promote specificity (high stringency) hybridization reactions that can be used to identify, for example, full length clones from a library. Hybridization reactions with less specificity (low stringency) can be used to identify related but not exactly matching (homologous but not identical) DNA molecules or segments. DNA duplexes are stabilized by (1) a certain number of complementary base pairs; (2) a certain type of base pairs; (3) concentration of salts (ionic strength) in the reaction mixture; (4) the reaction temperature; and (5) the presence of certain organic solvents, such as formamide, which reduce the stability of the DNA duplex. Generally, the longer the probe, the higher the temperature required for proper annealing. The generally accepted approach is to change the temperature; higher relative temperatures lead to more severe reaction conditions. For "stringent conditions" hybridization, hybridization protocols have been described in which polynucleotides with at least 60% homology to one another remain hybridized. Generally, stringent conditions are chosen such that the temperature is approximately 5° C. lower than the melting point (Tm) temperature for a particular sequence at certain ionic strengths and pH. Tm is the temperature (at certain values of ionic strength, pH, and polynucleotide concentration) at which 50% of probes complementary to a given sequence hybridize to that sequence at equilibrium. Since these sequences are usually present in excess, at Tm 50% of the probes are occupied in the equilibrium state.
«Жесткие условия гибридизации» представляют собой условия, которые позволяют зонду, праймеру или олигонуклеотиду гибридизироваться только со своей конкретной последовательностью. Жесткие условия зависят от последовательности и будут различаться. Жесткие условия как правило включают: (1) низкую ионную силу и промывки при высокой температуре, например 15 мМ хлорида натрия, 1,5 мМ цитрата натрия, 0,1% додецилсульфата натрия при 50°C; (2) присутствие денатурирующего средства во время гибридизации, например 50% (об./об.) формамида, 0,1% бычьего сывороточного альбумина, 0,1% фиколла, 0,1% поливинилпирролидона, 50 мМ натрий-фосфатного буфера (750 мМ хлорида натрия, 75 мМ цитрата натрия; pH 6,5) при 42°C или (3) присутствие 50% формамида. Как правило, промывки также предусматривают 5 x SSC (0,75 M NaCl, 75 мМ цитрата натрия), 50 мМ фосфат натрия (pH 6,8), 0,1% пирофосфат натрия, 5x раствор Денхардта, ДНК из молок лососевых рыб, подвергнутую ультразвуковой обработке (50 мкг/мл), 0,1% SDS и 10% сульфат декстрана при 42°C с промывкой при 42°C в 0,2 x SSC (хлорид натрия/цитрат натрия) и 50% формамиде при 55°C и последующей промывкой в условиях высокой жесткости, предусматривающей 0,1 x SSC, содержащий EDTA, при 55°C. Предпочтительно, условия являются такими, что последовательности, гомологичные друг другу на по меньшей мере приблизительно 65%, 70%, 75%, 85%, 90%, 95%, 98% или 99%, обычно остаются гибридизированными друг с другом. "Stringent hybridization conditions" are conditions that allow a probe, primer, or oligonucleotide to hybridize only to its particular sequence. Stringent conditions are sequence dependent and will vary. Stringent conditions typically include: (1) low ionic strength and high temperature washes, eg 15 mM sodium chloride, 1.5 mM sodium citrate, 0.1% sodium dodecyl sulfate at 50°C; (2) the presence of a denaturing agent during hybridization, e.g. 50% (v/v) formamide, 0.1% bovine serum albumin, 0.1% ficoll, 0.1% polyvinylpyrrolidone, 50 mM sodium phosphate buffer (750 mM sodium chloride, 75 mM sodium citrate; pH 6 ,5) at 42°C or (3) the presence of 50% formamide. Typically, washes also include 5x SSC (0.75 M NaCl, 75 mM sodium citrate), 50 mM sodium phosphate (pH 6.8), 0.1% sodium pyrophosphate, 5x Denhardt's solution, salmon milt DNA, sonicated (50 µg/mL), 0.1% SDS and 10% dextran sulfate at 42°C with a wash at 42°C in 0.2 x SSC (sodium chloride/sodium citrate) and 50% formamide at 55° C followed by a high stringency wash with 0.1 x SSC containing EDTA at 55°C. Preferably, conditions are such that sequences that are at least about 65%, 70%, 75%, 85%, 90%, 95%, 98%, or 99% homologous to each other typically remain hybridized to each other.
При «условиях умеренной жесткости» используют растворы для промывки и условия гибридизации, которые являются менее жесткими, такими, что полинуклеотид гибридизируется со всем рассматриваемым полинуклеотидом, его фрагментами, производными или аналогами. Один пример предусматривает гибридизацию в 6x SSC, 5x растворе Денхардта, 0,5% SDS и 100 мкг/мл денатурированной ДНК из молок лососевых рыб при 55°C с последующими одной или более промывками в 1 × SSC, 0,1% SDS при 37°C. Температуру, ионную силу и т. д. можно регулировать для обеспечения соответствия экспериментальным факторам, таким как длина зонда. Были описаны другие условия умеренной жесткости (см. Ausubel et al., Current Protocols in Molecular Biology, Volumes 1-3, John Wiley & Sons, Inc., Hoboken, N.J. (1993); Kriegler, Gene Transfer and Expression: A Laboratory Manual, Stockton Press, New York, N.Y. (1990); Perbal, A Practical Guide to Molecular Cloning, 2nd edition, John Wiley & Sons, New York, N.Y. (1988)).Under "moderate stringency conditions", wash solutions and hybridization conditions are used that are less stringent, such that the polynucleotide hybridizes to all of the polynucleotide in question, its fragments, derivatives, or analogs. One example involves hybridization in 6x SSC, 5x Denhardt's solution, 0.5% SDS, and 100 µg/ml denatured DNA from salmon milt at 55°C followed by one or more washes in 1x SSC, 0.1% SDS at 37 °C. Temperature, ionic strength, etc. can be adjusted to match experimental factors such as probe length. Other conditions of moderate stringency have been described (see Ausubel et al., Current Protocols in Molecular Biology, Volumes 1-3, John Wiley & Sons, Inc., Hoboken, NJ (1993); Kriegler, Gene Transfer and Expression: A Laboratory Manual , Stockton Press, New York, NY (1990); Perbal, A Practical Guide to Molecular Cloning, 2nd edition, John Wiley & Sons, New York, NY (1988)).
При «условиях низкой жесткости» используют растворы для промывки и условия гибридизации, которые являются менее жесткими, чем таковые в случае умеренной жесткости, такие, что полинуклеотид гибридизируется со всем рассматриваемым полинуклеотидом, его фрагментами, производными или аналогами. Неограничивающий пример условий гибридизации низкой жесткости предусматривает гибридизацию в 35% формамиде, 5x SSC, 50 мМ Tris-HCl (pH 7,5), 5 мМ EDTA, 0,02% PVP, 0,02% фиколле, 0,2% BSA, 100 мкг/мл денатурированной ДНК из молок лососевых рыб, 10% (вес./об.) сульфате декстрана при 40°C с последующими одной или более промывками в 2x SSC, 25 мМ Tris-HCl (pH 7,4), 5 мМ EDTA и 0,1% SDS при 50°C. Хорошо описаны другие условия низкой жесткости, такие как условия для вариантов межвидовой гибридизации (см. Ausubel et al., 1993; Kriegler, 1990)."Low stringency conditions" use wash solutions and hybridization conditions that are less stringent than those for moderate stringency, such that the polynucleotide hybridizes to all of the polynucleotide in question, its fragments, derivatives, or analogs. A non-limiting example of low stringency hybridization conditions include hybridization in 35% formamide, 5x SSC, 50 mM Tris-HCl (pH 7.5), 5 mM EDTA, 0.02% PVP, 0.02% Ficoll, 0.2% BSA, 100 μg/ml denatured salmon milt DNA, 10% (w/v) dextran sulfate at 40°C followed by one or more washes in 2x SSC, 25 mM Tris-HCl (pH 7.4), 5 mM EDTA and 0.1% SDS at 50°C. Other conditions of low stringency are well described, such as conditions for interspecific hybridization variants (see Ausubel et al., 1993; Kriegler, 1990).
Термин «функционально связанный» означает, что экспрессия гена находится под контролем промотора, с которым он пространственно соединен. Промотор может быть расположен в 5'-направлении (выше) или 3'-направлении (ниже) от гена, который находится под его контролем. Расстояние между промотором и геном может быть примерно таким же, как расстояние между этим промотором и геном, который он контролирует, в гене, из которого получен промотор. Как известно из уровня техники, изменение этого расстояния можно согласованно осуществлять без потери функции промотора. Термин «функционально связанный» относится к ассоциации фрагментов полинуклеотида в одном фрагменте таким образом, что функция одного регулируется другим. Например, промотор функционально связан с фрагментом полинуклеотида, если он способен регулировать транскрипцию данного фрагмента полинуклеотида.The term "operably linked" means that the expression of a gene is under the control of the promoter to which it is spatially linked. A promoter may be located 5' (above) or 3' (below) from a gene that is under its control. The distance between a promoter and a gene may be about the same as the distance between that promoter and the gene it controls in the gene from which the promoter is derived. As is known in the art, changing this distance can be done in concert without loss of promoter function. The term "operably linked" refers to the association of polynucleotide fragments in one fragment in such a way that the function of one is regulated by the other. For example, a promoter is operably linked to a polynucleotide fragment if it is capable of regulating transcription of that polynucleotide fragment.
Термин «растение» относится к любому растению на любой стадии его жизненного цикла или развития и его потомкам. В одном варианте осуществления растение представляет собой растение табака, которое относится к растению, принадлежащему к роду Nicotiana. Термин включает ссылку на целые растения, органы растения, ткани растения, ростки растения, семена растения и клетки растения и их потомство. Клетки растения включают без ограничения клетки из семян, суспензионных культур, зародышей, меристематических участков, каллюсной ткани, листьев, корней, побегов, гаметофитов, спорофитов, пыльцы и микроспор. Подходящие виды, сорта, гибриды и разновидности растений табака описаны в данном документе.The term "plant" refers to any plant at any stage of its life cycle or development and its descendants. In one embodiment, the plant is a tobacco plant that belongs to a plant belonging to the genus Nicotiana. The term includes reference to whole plants, plant organs, plant tissues, plant shoots, plant seeds, and plant cells and their progeny. Plant cells include, without limitation, cells from seeds, suspension cultures, embryos, meristematic sites, callus tissue, leaves, roots, shoots, gametophytes, sporophytes, pollen, and microspores. Suitable species, cultivars, hybrids and varieties of tobacco plants are described herein.
Термины «полинуклеотид», «полинуклеотидная последовательность» или «полинуклеотидный фрагмент» используются в данном документе взаимозаменяемо и относятся к полимеру из РНК или ДНК, который является одно- или двунитевым и необязательно содержит синтетические, неприродные или скорректированные нуклеотидные основания. Нуклеотиды (обычно находящиеся в форме их 5'-монофосфата) обозначают с помощью их однобуквенных обозначений следующим образом: «А» для аденилата или дезоксиаденилата (соответственно для РНК или ДНК), «C» для цитидилата или дезоксицитидилата, «G» для гуанилата или дезоксигуанилата, «U» для уридилата, «T» для дезокситимидилата, «R» для пуринов (A или G), «Y» для пиримидинов (C или T), «K» для G или T, «H» для A, или С, или Т, «I» для инозина и «N» для любого нуклеотида. Полинуклеотид может представлять собой без ограничения геномную ДНК, комплементарную ДНК (кДНК), мРНК или антисмысловую РНК или их фрагмент(фрагменты). Кроме того, полинуклеотид может быть однонитевым или двунитевым, смесью однонитевых и двунитевых участков, гибридной молекулой, содержащей ДНК и РНК, или гибридной молекулой со смесью однонитевых и двунитевых участков или их фрагмента(фрагментов). Дополнительно полинуклеотид может быть составлен из трехнитевых участков, содержащих ДНК, РНК или обе, или их фрагмент(фрагменты). Полинуклеотид может содержать одно или более модифицированных оснований, таких как фосфотиоаты, и может представлять собой пептидную нуклеиновую кислоту (PNA). Как правило, полинуклеотиды могут быть собраны из выделенных или клонированных фрагментов кДНК, геномной ДНК, олигонуклеотидов или отдельных нуклеотидов или комбинации вышеперечисленного. Хотя полинуклеотиды, описанные в данном документе, представлены в виде ДНК-последовательностей, полинуклеотиды включают их соответствующие РНК-последовательности и их комплементарные (например, полностью комплементарные) ДНК- или РНК-последовательности, в том числе цепи, обратно комплементарные им. Полинуклеотиды по настоящему изобретению представлены в прилагаемом перечне последовательностей.The terms "polynucleotide", "polynucleotide sequence" or "polynucleotide fragment" are used interchangeably herein and refer to an RNA or DNA polymer that is single or double stranded and optionally contains synthetic, non-natural or adjusted nucleotide bases. Nucleotides (usually in the form of their 5'-monophosphate) are designated using their one-letter designations as follows: "A" for adenylate or deoxyadenylate (respectively for RNA or DNA), "C" for cytidylate or deoxycytidylate, "G" for guanylate or deoxyguanylate, "U" for uridylate, "T" for deoxythymidylate, "R" for purines (A or G), "Y" for pyrimidines (C or T), "K" for G or T, "H" for A, or C or T, "I" for inosine and "N" for any nucleotide. The polynucleotide can be, without limitation, genomic DNA, complementary DNA (cDNA), mRNA, or antisense RNA, or fragment(s) thereof. In addition, the polynucleotide may be single or double stranded, a mixture of single and double stranded regions, a hybrid molecule containing DNA and RNA, or a hybrid molecule with a mixture of single and double stranded regions or fragment(s) thereof. Additionally, the polynucleotide may be composed of three-stranded sections containing DNA, RNA, or both, or fragment(s). The polynucleotide may contain one or more modified bases such as phosphothioates and may be a peptide nucleic acid (PNA). Typically, polynucleotides can be assembled from isolated or cloned cDNA fragments, genomic DNA, oligonucleotides, or single nucleotides, or a combination of the above. Although the polynucleotides described herein are presented as DNA sequences, the polynucleotides include their respective RNA sequences and their complementary (eg, fully complementary) DNA or RNA sequences, including their reverse complementary strands. The polynucleotides of the present invention are shown in the accompanying sequence listing.
Термины «полипептид» или «полипептидная последовательность» относятся к полимеру из аминокислот, в котором один или более аминокислотных остатков представляют собой искусственный химический аналог соответствующей встречающейся в природе аминокислоты, а также к встречающимся в природе полимерам из аминокислот. Термины также подразумевают модификации, в том числе без ограничения гликозилирование, присоединение липидов, сульфатирование, гамма-карбоксилирование остатков глутаминовой кислоты, гидроксилирование и ADP-рибозилирование. Полипептиды по настоящему изобретению представлены в прилагаемом перечне последовательностей.The terms "polypeptide" or "polypeptide sequence" refer to a polymer of amino acids in which one or more amino acid residues are an artificial chemical analogue of a corresponding naturally occurring amino acid, as well as to naturally occurring polymers of amino acids. The terms also include modifications including, but not limited to, glycosylation, lipid addition, sulfation, gamma-carboxylation of glutamic acid residues, hydroxylation, and ADP-ribosylation. The polypeptides of the present invention are presented in the attached sequence listing.
Термин «промотор» означает синтетическую или полученную природным способом молекулу, которая способна обеспечивать, активировать или усиливать экспрессию полинуклеотида в клетке. Термин относится к элементу/последовательности полинуклеотида, расположенным, как правило, выше по последовательности и функционально связанным с фрагментом двунитевого полинуклеотида. Промоторы могут быть получены целиком из участков вблизи нативного гена, представляющего интерес, или могут состоять из разных элементов, полученных из разных нативных промоторов или сегментов синтетического полинуклеотида. Промотор может содержать одну или более специфических последовательностей, регулирующих транскрипцию, для дополнительного усиления экспрессии и/или корректировки экспрессии пространственно и/или по времени. Промотор может также содержать дистальные энхансерные или репрессорные элементы, которые могут быть расположены на расстоянии до несколько тысяч пар оснований от сайта начала транскрипции. Промотор может быть получен из источников, включающих вирусы, бактерии, грибы, растения, насекомых и животных. Промотор может регулировать экспрессию компонента гена конститутивно или дифференциально по отношению к клетке, ткани или органу, в которых происходит экспрессия, или по отношению к стадии развития, на которой происходит экспрессия, или в ответ на внешние стимулы, такие как физиологические нагрузки, патогены, ионы металлов или индуцирующие средства.The term "promoter" means a synthetic or naturally derived molecule that is capable of providing, activating or enhancing the expression of a polynucleotide in a cell. The term refers to an element/sequence of a polynucleotide located, as a rule, higher in sequence and functionally linked to a fragment of a double-stranded polynucleotide. Promoters may be derived entirely from regions near the native gene of interest, or may be composed of different elements derived from different native promoters or synthetic polynucleotide segments. The promoter may contain one or more specific transcription control sequences to further enhance expression and/or adjust expression spatially and/or temporally. The promoter may also contain distal enhancer or repressor elements, which may be located up to several thousand base pairs from the transcription start site. The promoter can be obtained from sources including viruses, bacteria, fungi, plants, insects and animals. A promoter may regulate the expression of a gene component constitutively or differentially with respect to the cell, tissue, or organ in which expression occurs, or with respect to the developmental stage at which expression occurs, or in response to external stimuli such as physiological stress, pathogens, ions. metals or inducing agents.
Выражения «тканеспецифичный промотор» и «промотор, предпочтительный для определенной ткани», используемые в данном документе взаимозаменяемо, относятся к промотору, который экспрессируется преимущественно, но не обязательно исключительно, в одном органе или ткани, но может экспрессироваться также в одной конкретной клетке. Выражение «промотор, регулируемый в процессе развития» относится к промотору, функция которого определяется событиями, связанными с развитием. Выражение «конститутивный промотор» относится к промотору, который вызывает экспрессию гена в большинстве типов клеток в большинстве случаев. «Индуцируемый промотор» обеспечивает избирательную экспрессию функционально связанной ДНК-последовательности в ответ на присутствие эндогенных или экзогенных стимулов, например, с помощью химических соединений (химических индукторов) или в ответ на сигналы окружающей среды, гормональные, химические сигналы и/или сигналы, связанные с развитием. Примеры индуцируемых или регулируемых промоторов включают промоторы, регулируемые светом, теплом, стрессом, наводнением или засухой, патогенами, фитогормонами, ранениями или химическими веществами, такими как этанол, жасмонат, салициловая кислота или антидоты.The terms "tissue-specific promoter" and "tissue-preferred promoter", used interchangeably herein, refer to a promoter that is predominantly, but not necessarily exclusively, expressed in one organ or tissue, but may also be expressed in one particular cell. The phrase "developmentally regulated promoter" refers to a promoter whose function is determined by developmental events. The expression "constitutive promoter" refers to a promoter that causes the expression of a gene in most cell types in most cases. An "inducible promoter" provides for the selective expression of an operably linked DNA sequence in response to the presence of endogenous or exogenous stimuli, e.g. via chemical compounds (chemical inducers) or in response to environmental, hormonal, chemical and/or related signals. development. Examples of inducible or regulated promoters include promoters regulated by light, heat, stress, flood or drought, pathogens, phytohormones, wounds, or chemicals such as ethanol, jasmonate, salicylic acid, or antidotes.
Термин «рекомбинантный», используемый в данном документе, относится к искусственной комбинации из двух в иных обстоятельствах разделенных сегментов последовательности, полученной, например, посредством химического синтеза или посредством манипуляции с выделенными сегментами полинуклеотидов с помощью методик генной инженерии. Термин также включает ссылку на клетку или вектор, которые были модифицированы путем введения гетерологичного полинуклеотида, или клетку, полученную из модифицированной таким образом клетки, но не охватывает корректировку клетки или вектора в результате встречающихся в природе событий (например, в результате спонтанной мутации, естественной трансформации, или трансдукции, или транспозиции), таких как те, которые происходят без преднамеренного вмешательства человека.The term "recombinant" as used herein refers to an artificial combination of two otherwise separated sequence segments, obtained, for example, by chemical synthesis or by manipulation of isolated polynucleotide segments using genetic engineering techniques. The term also includes reference to a cell or vector that has been modified by introducing a heterologous polynucleotide, or a cell derived from a cell so modified, but does not encompass modification of the cell or vector as a result of naturally occurring events (e.g., spontaneous mutation, natural transformation). , or transductions, or transpositions), such as those that occur without intentional human intervention.
Выражение «рекомбинантная конструкция» относится к комбинации полинуклеотидов, которые обычно не встречаются в природе вместе. Соответственно, рекомбинантная конструкция может содержать регуляторные последовательности и кодирующие последовательности, полученные из разных источников, или регуляторные последовательности и кодирующие последовательности, полученные из одного и того же источника, но расположенные иначе, чем это обычно встречается в природе. Рекомбинантная конструкция может представлять собой рекомбинантную ДНК-конструкцию.The term "recombinant construct" refers to a combination of polynucleotides that do not normally occur together in nature. Accordingly, a recombinant construct may contain regulatory sequences and coding sequences obtained from different sources, or regulatory sequences and coding sequences obtained from the same source but arranged differently than would normally occur in nature. The recombinant construct may be a recombinant DNA construct.
Выражения «регуляторные последовательности» и «регуляторные элементы», используемые в данном документе взаимозаменяемо, относятся к полинуклеотидным последовательностям, расположенным выше (5'-некодирующие последовательности), в пределах или ниже (3'-некодирующие последовательности) кодирующей последовательности, которые влияют на транскрипцию, процессинг или стабильность РНК или на трансляцию связанной кодирующей последовательности. Регуляторные последовательности включают промоторы, лидерные последовательности, регулирующие трансляцию, интроны и распознаваемые последовательности полиаденилирования. Термины «регуляторная последовательность» и «регуляторный элемент» используются в данном документе взаимозаменяемо.The terms "regulatory sequences" and "regulatory elements", used interchangeably herein, refer to polynucleotide sequences located upstream (5' non-coding sequences), within or downstream (3' non-coding sequences) of a coding sequence that affect transcription. , processing or stability of the RNA or translation of the associated coding sequence. Regulatory sequences include promoters, translational leader sequences, introns, and polyadenylation recognition sequences. The terms "regulatory sequence" and "regulatory element" are used interchangeably herein.
Выражение «сайт-специфичная нуклеаза» относится к ферменту, способному к специфичному распознаванию и расщеплению ДНК-последовательностей. Сайт-специфичная нуклеаза может быть сконструированной. Примеры сконструированных сайт-специфичных нуклеаз включают нуклеазы с «цинковыми пальцами» (ZFN), TAL-эффекторные нуклеазы (TALEN), системы на основе CRISPR/Cas9 и мегануклеазы.The expression "site-specific nuclease" refers to an enzyme capable of specifically recognizing and cleaving DNA sequences. The site-specific nuclease may be engineered. Examples of engineered site-specific nucleases include zinc finger nucleases (ZFNs), TAL effector nucleases (TALENs), CRISPR/Cas9 based systems, and meganucleases.
Термин «табак» используют в собирательном смысле для обозначения табачных культур (например, множества растений табака, выращиваемых в поле, и табака, выращиваемого не методом гидропоники), растений табака и их частей, в том числе без ограничения корней, стеблей, листьев, цветов и семян, подготовленных и/или полученных, как описано в данном документе. Понятно, что «табак» включает растения Nicotiana tabacum и продукты из них.The term "tobacco" is used collectively to refer to tobacco crops (e.g., a variety of field-grown and non-hydroponic tobacco plants), tobacco plants, and parts thereof, including but not limited to roots, stems, leaves, flowers. and seeds prepared and/or obtained as described herein. It is understood that "tobacco" includes Nicotiana tabacum plants and products thereof.
Термин «табачные продукты» относится к потребительским табачным продуктам, в том числе, без ограничения, к курительным материалам (например, сигаретам, сигарам и трубочному табаку), нюхательному табаку, жевательному табаку, жевательной резинке и леденцам, а также компонентам, материалам и ингредиентам для производства потребительских табачных продуктов. Предпочтительно, данные табачные продукты производят из листьев и стеблей табака, собранных с табака и нарезанных, высушенных, подвергнутых сушке и/или ферментированных в соответствии с общепринятыми методиками получения табака.The term "tobacco products" refers to consumer tobacco products, including, without limitation, smoking materials (e.g., cigarettes, cigars, and pipe tobacco), snuff, chewing tobacco, chewing gum, and lozenges, and components, materials, and ingredients. for the production of consumer tobacco products. Preferably, these tobacco products are made from tobacco leaves and stems harvested from tobacco and cut, dried, dried and/or fermented in accordance with conventional tobacco production techniques.
Выражения «терминатор транскрипции», «последовательности терминации» или «терминатор» относятся к ДНК-последовательностям, расположенным ниже кодирующей последовательности, включающим распознаваемые последовательности полиаденилирования и другие последовательности, кодирующие регуляторные сигналы, способные воздействовать на процессинг мРНК или экспрессию гена. Сигнал полиаденилирования обычно характеризуется осуществлением добавления трактов полиадениловой кислоты на 3'-конец предшественника мРНК.The terms "transcriptional terminator", "termination sequences", or "terminator" refer to DNA sequences downstream of a coding sequence, including recognizable polyadenylation sequences and other sequences encoding regulatory signals capable of affecting mRNA processing or gene expression. The polyadenylation signal is typically characterized by the addition of polyadenylic acid tracts to the 3' end of the mRNA precursor.
Термин «трансгенный» относится к любой клетке, линии клеток, каллюсу, ткани, части растения или растению, геном которых был скорректирован в результате присутствия гетерологичного полинуклеотида, такого как рекомбинантная конструкция, в том числе к исходным трансгенным объектам, а также полученным с помощью процедур полового скрещивания или бесполого размножения из исходного трансгенного объекта. Термин не охватывает корректировку генома (хромосомную или внехромосомную) с помощью общепринятых способов селекции растений или в результате встречающихся в природе событий, таких как случайное перекрестное опыление, инфекция, вызванная нерекомбинантным вирусом, трансформация нерекомбинантными бактериями, нерекомбинантная транспозиция или спонтанная мутация.The term "transgenic" refers to any cell, cell line, callus, tissue, plant part, or plant whose genome has been altered as a result of the presence of a heterologous polynucleotide, such as a recombinant construct, including the original transgenic events, as well as those obtained by procedures sexual interbreeding or asexual reproduction from the original transgenic object. The term does not cover the adjustment of the genome (chromosomal or extrachromosomal) by conventional plant breeding techniques or by naturally occurring events such as accidental cross-pollination, infection by a non-recombinant virus, transformation by non-recombinant bacteria, non-recombinant transposition, or spontaneous mutation.
Выражение «трансгенное растение» относится к растению, которое содержит в своем геноме один или более гетерологичных полинуклеотидов, т.е. растение, которое содержит рекомбинантный генетический материал, обычно не обнаруживаемый в нем, и который был введен в рассматриваемое растение (или в предков растения) посредством манипуляции, осуществляемой человеком. Например, гетерологичный полинуклеотид может быть стабильно интегрирован в геном таким образом, что полинуклеотид передается последующим поколениям. Гетерологичный полинуклеотид может быть интегрирован в геном отдельно или в виде части рекомбинантной конструкции. Коммерческая разработка генетически улучшенной идиоплазмы также продвинулась к стадии введения в культурные растения нескольких признаков, что часто называют подходом на основе пирамидирования генов. В этом подходе в растение можно ввести несколько генов, придающих разные характеристики, представляющие интерес. Пирамидирование генов можно осуществлять многими способами, в том числе без ограничения путем котрансформации, повторной трансформации и скрещивания линий с разными трансгенами. Таким образом, растение, выращиваемое из клетки растения, в которую рекомбинантную ДНК вводят с помощью трансформации, является трансгенным растением, равно как и все потомство данного растения, которое содержит введенный трансген (полученное как половым, так и бесполым путем). Понятно, что термин «трансгенное растение» охватывает все растение или дерево и части растения или дерева, например зерна, семена, цветки, листья, корни, плоды, пыльцу, стебли и т.п. Каждый гетерологичный полинуклеотид может придавать трансгенному растению отдельный признак. The expression "transgenic plant" refers to a plant that contains in its genome one or more heterologous polynucleotides, i.e. a plant that contains recombinant genetic material not normally found in it, and which has been introduced into the plant in question (or into the plant's ancestors) through human manipulation. For example, a heterologous polynucleotide may be stably integrated into the genome such that the polynucleotide is passed on to subsequent generations. The heterologous polynucleotide may be integrated into the genome alone or as part of a recombinant construct. The commercial development of genetically improved germplasm has also progressed to the stage of introducing several traits into cultivated plants, often referred to as the gene pyramiding approach. In this approach, several genes can be introduced into a plant, conferring different characteristics of interest. Gene pyramiding can be accomplished in many ways, including, but not limited to, co-transformation, re-transformation, and crossing lines with different transgenes. Thus, a plant grown from a cell of a plant into which recombinant DNA is introduced by transformation is a transgenic plant, as is all progeny of that plant that contains the introduced transgene (either sexually or asexually). It is understood that the term "transgenic plant" encompasses the entire plant or tree and parts of the plant or tree, such as grains, seeds, flowers, leaves, roots, fruits, pollen, stems, and the like. Each heterologous polynucleotide can confer a distinct trait on the transgenic plant.
Термин «эффектор, подобный активаторам транскрипции» или «TALE» относится к полипептидной структуре, которая распознает определенную ДНК-последовательность и связывается с ней. Выражение «ДНК-связывающий домен TALE» относится к ДНК-связывающему домену, который содержит массив тандемных повторов из 33-35 аминокислот, также известных как RVD-модули, каждый из которых специфично распознает одну пару оснований ДНК. RVD-модули могут располагаться в любом порядке, собираясь в массив, который распознает определенную последовательность. Специфичность связывания ДНК-связывающего домена TALE определяется массивом RVD, за которым расположен один усеченный повтор из 20 аминокислот. ДНК-связывающий домен TALE может иметь от 12 до 27 RVD-модулей, каждый из которых содержит RVD и распознает одну пару оснований ДНК. Были идентифицированы специфичные RVD, которые распознают каждый из четырех возможных нуклеотидов ДНК (А, Т, С и G). Поскольку ДНК-связывающие домены TALE являются модульными, то повторы, которые распознают четыре разных нуклеотида ДНК, можно соединить друг с другом для распознавания любой конкретной ДНК-последовательности. Эти нацеленные ДНК-связывающие домены можно впоследствии объединить с каталитическими доменами для создания функциональных ферментов, в том числе искусственных факторов транскрипции, метилтрансфераз, интеграз, нуклеаз и рекомбиназ.The term "transcriptional activator-like effector" or "TALE" refers to a polypeptide structure that recognizes and binds to a specific DNA sequence. The expression "TALE DNA binding domain" refers to a DNA binding domain that contains an array of 33-35 amino acid tandem repeats, also known as RVD modules, each of which specifically recognizes one DNA base pair. RVD modules can be arranged in any order, gathering in an array that recognizes a certain sequence. The binding specificity of the TALE DNA-binding domain is determined by the RVD array followed by a single truncated repeat of 20 amino acids. The DNA binding domain of TALE can have 12 to 27 RVD modules, each containing an RVD and recognizing one DNA base pair. Specific RVDs have been identified that recognize each of the four possible DNA nucleotides (A, T, C and G). Because the DNA-binding domains of TALE are modular, the repeats that recognize four different DNA nucleotides can be joined together to recognize any particular DNA sequence. These targeted DNA binding domains can then be combined with catalytic domains to create functional enzymes, including artificial transcription factors, methyltransferases, integrases, nucleases, and recombinases.
Термины «эффекторные нуклеазы, подобные активаторам транскрипции» или «TALEN», используемые в данном документе взаимозаменяемо, относятся к сконструированным слитым полипептидам на основе каталитического домена нуклеазы, такой как эндонуклеаза FokI, и разработанного ДНК-связывающего домена TALE, который может быть нацелен на специально синтезированную ДНК-последовательность. The terms "effector nucleases like transcription activators" or "TALEN", used interchangeably herein, refer to engineered fusion polypeptides based on the catalytic domain of a nuclease, such as Fok I endonuclease, and the designed TALE DNA-binding domain, which can be targeted to specially synthesized DNA sequence.
Выражение «мономер TALEN» относится к сконструированному слитому полипептиду с каталитическим доменом нуклеазы и разработанным ДНК-связывающим доменом TALE. Два мономера TALEN могут быть разработаны таким образом, чтобы они нацеливались на участок, являющийся мишенью для TALEN, и расщепляли его.The expression "TALEN monomer" refers to an engineered fusion polypeptide with a nuclease catalytic domain and a designed TALE DNA-binding domain. The two TALEN monomers can be designed to target and cleave the TALEN target site.
Термин «трансген» относится к гену или генетическому материалу, содержащему последовательность гена, которые были выделены из одного организма и введены в другой организм. Этот ненативный сегмент ДНК может сохранять способность к обеспечению выработки РНК или полипептида в трансгенном организме или он может обеспечивать корректировку нормальной функции генетического кода трансгенного организма. Введение трансгена имеет потенциал к изменению фенотипа организма.The term "transgene" refers to a gene or genetic material containing a gene sequence that has been isolated from one organism and introduced into another organism. This non-native DNA segment may retain the ability to produce an RNA or polypeptide in the transgenic organism, or it may provide an adjustment to the normal function of the genetic code of the transgenic organism. The introduction of a transgene has the potential to change the phenotype of the organism.
Термин «вариант» по отношению к полинуклеотиду означает: (i) часть или фрагмент полинуклеотида; (ii) последовательность, комплементарную полинуклеотиду или его части; (iii) полинуклеотид, практически идентичный упоминаемому полинуклеотиду или комплементарной ему последовательности; или (iv) полинуклеотид, который гибридизируется в жестких условиях с упоминаемым полинуклеотидом, комплементарной ему последовательностью или практически идентичным ей полинуклеотидом.The term "variant" in relation to a polynucleotide means: (i) a portion or fragment of a polynucleotide; (ii) a sequence complementary to the polynucleotide or a portion thereof; (iii) a polynucleotide substantially identical to the referenced polynucleotide or its complementary sequence; or (iv) a polynucleotide that hybridizes under stringent conditions to said polynucleotide, its complementary sequence, or its substantially identical polynucleotide.
Термин «вариант» по отношению к пептиду или полипептиду означает пептид или полипептид, которые отличаются по последовательности за счет вставки, делеции или консервативной замены аминокислот, но сохраняют по меньшей мере одну биологическую функцию или активность. Вариант также может означать полипептид, который сохраняет по меньшей мере одну биологическую функцию или активность. Консервативную замену аминокислоты, т.е. замещение аминокислоты другой аминокислотой со сходными свойствами (например, степенью гидрофильности и распределением заряженных участков), понимают в данной области техники как обычно включающую незначительное изменение. The term "variant" in relation to a peptide or polypeptide means a peptide or polypeptide that differs in sequence by insertion, deletion or conservative amino acid substitution, but retains at least one biological function or activity. A variant may also mean a polypeptide that retains at least one biological function or activity. A conservative amino acid substitution, i.e. substitution of an amino acid for another amino acid with similar properties (for example, the degree of hydrophilicity and the distribution of charged sites) is understood in the art as usually including a slight change.
Термин «разновидность» относится к популяции растений, которые обладают постоянными характеристиками, отделяющими их от других растений того же вида. Хотя разновидность обладает одним или более отличительными признаками, она дополнительно характеризуется очень небольшим общим варьированием между особями в пределах этой разновидности. Разновидность часто продается на коммерческой основе.The term "variety" refers to a population of plants that have permanent characteristics that separate them from other plants of the same species. Although a variety has one or more distinguishing characteristics, it is additionally characterized by very little overall variation between individuals within that variety. The variety is often sold commercially.
Термин «вектор» относится к полинуклеотидному средству доставки, которое содержит комбинацию компонентов полинуклеотида для обеспечения транспорта полинуклеотидов, полинуклеотидных конструкций и полинуклеотидных конъюгатов и т.п. Вектор может представлять собой вирусный вектор, бактериофаг, искусственную хромосому бактерий или искусственную хромосому дрожжей. Вектор может представлять собой ДНК- или РНК-вектор. Подходящие векторы включают эписомы, способные к внехромосомной репликации, такие как кольцевые плазмиды из двунитевой нуклеотидной последовательности; линеаризованные плазмиды из двунитевой нуклеотидной последовательности и другие векторы любого происхождения. «Вектор экспрессии», как используется в данном документе, представляет собой полинуклеотидное средство доставки, которое содержит комбинацию компонентов полинуклеотида для обеспечения экспрессии полинуклеотида(полинуклеотидов), полинуклеотидных конструкций и полинуклеотидных конъюгатов и т.п. Подходящие векторы экспрессии включают эписомы, способные к внехромосомной репликации, такие как кольцевые плазмиды из двунитевой нуклеотидной последовательности; линеаризованные плазмиды из двунитевой нуклеотидной последовательности и другие функционально эквивалентные векторы экспрессии любого происхождения. Вектор экспрессии содержит по меньшей мере промотор, расположенный выше по последовательности и функционально связанный с полинуклеотидом, полинуклеотидными конструкциями или полинуклеотидным конъюгатом, как определено ниже.The term "vector" refers to a polynucleotide delivery vehicle that contains a combination of polynucleotide components to allow transport of polynucleotides, polynucleotide constructs and polynucleotide conjugates, and the like. The vector may be a viral vector, a bacteriophage, a bacterial artificial chromosome, or a yeast artificial chromosome. The vector may be a DNA or RNA vector. Suitable vectors include episomes capable of extrachromosomal replication, such as double-stranded circular plasmids; linearized plasmids from a double-stranded nucleotide sequence; and other vectors of any origin. An "expression vector" as used herein is a polynucleotide delivery vehicle that contains a combination of polynucleotide components to allow expression of polynucleotide(s), polynucleotide constructs and polynucleotide conjugates, and the like. Suitable expression vectors include episomes capable of extrachromosomal replication, such as double-stranded circular plasmids; linearized plasmids from a double-stranded nucleotide sequence; and other functionally equivalent expression vectors of any origin. The expression vector contains at least a promoter upstream and operably linked to a polynucleotide, polynucleotide constructs, or polynucleotide conjugate, as defined below.
Термин «цинковый палец» относится к структуре полипептида, которая распознает ДНК-последовательности и связывается с ними. Домен с «цинковыми пальцами» является наиболее распространенным ДНК-связывающим мотивом в протеоме человека. Один домен с «цинковыми пальцами» содержит примерно 30 аминокислот и обычно функционирует путем связывания с 3 последовательными парами оснований ДНК посредством взаимодействий боковой цепи одной аминокислоты с каждой парой оснований. The term "zinc finger" refers to a polypeptide structure that recognizes and binds to DNA sequences. The zinc finger domain is the most common DNA-binding motif in the human proteome. One zinc finger domain contains approximately 30 amino acids and typically functions by binding to 3 consecutive base pairs of DNA through single amino acid side chain interactions with each base pair.
Термин «нуклеаза с «цинковыми пальцами»» или «ZFN» относится к химерной молекуле полипептида, содержащей по меньшей мере один ДНК-связывающий домен с «цинковыми пальцами», эффективно связанный с по меньшей мере одной нуклеазой или частью нуклеазы, способной в полностью собранном виде расщеплять ДНК.The term "zinc finger nuclease" or "ZFN" refers to a chimeric polypeptide molecule containing at least one zinc finger DNA-binding domain efficiently associated with at least one nuclease or a portion of a nuclease capable of being fully assembled to cleave DNA.
Если в данном документе не определено иное, то научные и технические термины, используемые в связи с настоящим раскрытием, будут иметь значения, которые обычно понятны специалистам средней квалификации в данной области техники. Например, любые системы номенклатуры и методики, используемые в связи с культурами клеток или тканей, молекулярной биологией, иммунологией, микробиологией, генетикой и химией полипептида и полинуклеотида, а также гибридизацией, которые описаны в данном документе, хорошо известны и широко применяются в данной области техники. Значение и объем терминов должны быть ясны, однако в случае какой-либо скрытой двусмысленности определения, приведенные в данном документе, имеют преимущественную силу по сравнению с любым словарным или не относящимся к данному документу определением. Кроме того, если иное не требуется по контексту, термины в единственном числе будут включать множественное число, и термины во множественном числе будут включать единственное число.Unless otherwise defined herein, scientific and technical terms used in connection with this disclosure will have the meanings that are commonly understood by those of ordinary skill in the art. For example, any nomenclature systems and techniques used in connection with cell or tissue culture, molecular biology, immunology, microbiology, polypeptide and polynucleotide genetics and chemistry, and hybridization as described herein are well known and widely used in the art. . The meaning and scope of the terms should be clear, but in the event of any implicit ambiguity, the definitions given in this document take precedence over any dictionary or non-document definition. In addition, unless otherwise required by context, singular terms will include the plural, and plural terms will include the singular.
2. Полинуклеотиды2. Polynucleotides
В одном варианте осуществления представлен выделенный полинуклеотид, содержащий, состоящий или по существу состоящий из последовательности, характеризующейся по меньшей мере 60% идентичностью последовательности с любой из последовательностей, описанных в данном документе, включая любой из полинуклеотидов, показанных в перечне последовательностей. Предпочтительно, выделенный полинуклеотид содержит, состоит или по существу состоит из последовательности, характеризующейся по меньшей мере 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 75%, 80%, 85%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95% 96%, 97%, 98%, 99% или 100% идентичностью последовательности с ними.In one embodiment, an isolated polynucleotide is provided comprising, consisting of, or essentially consisting of a sequence having at least 60% sequence identity with any of the sequences described herein, including any of the polynucleotides shown in the sequence listing. Preferably, the isolated polynucleotide contains, consists of, or essentially consists of a sequence characterized by at least 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70% , 75%, 80%, 85%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95% 96%, 97%, 98%, 99% or 100% sequence identity with them.
Предпочтительно полинуклеотид(полинуклеотиды), описанный(описанные) в данном документе, кодирует(кодируют) активный полипептид, который характеризуется по меньшей мере приблизительно 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99%, 100% или большей функцией или активностью полипептида(полипептидов), показанного(показанных) в перечне последовательностей.Preferably, the polynucleotide(s) described herein encode(s) an active polypeptide that is characterized by at least about 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97% , 98%, 99%, 100% or more of the function or activity of the polypeptide(s) shown in the sequence listing.
В другом варианте осуществления представлен выделенный полинуклеотид, содержащий, состоящий или по существу состоящий из полинуклеотида, характеризующегося по меньшей мере 60% идентичностью последовательности с SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21 или SEQ ID NO: 23, или c SEQ ID NO:5, SEQ ID NO: 9, SEQ ID NO: 11 или SEQ ID NO: 13.In another embodiment, an isolated polynucleotide is provided comprising, consisting of, or essentially consisting of, a polynucleotide having at least 60% sequence identity with SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7 , SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21 or SEQ ID NO: 23, or c SEQ ID NO: 5, SEQ ID NO: 9, SEQ ID NO: 11 or SEQ ID NO: 13.
Предпочтительно выделенный полинуклеотид содержит, состоит или по существу состоит из последовательности, характеризующейся по меньшей мере приблизительно 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 75%, 80%, 85%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9% или 100% идентичностью последовательности с SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21 или SEQ ID NO: 23, или с SEQ ID NO: 5, SEQ ID NO: 9, SEQ ID NO: 11 или SEQ ID NO: 13. Preferably, the isolated polynucleotide contains, consists of, or essentially consists of a sequence characterized by at least about 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70% , 75%, 80%, 85%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99 .1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% or 100% sequence identity with SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO : 17, SEQ ID NO: 19, SEQ ID NO: 21 or SEQ ID NO: 23, or with SEQ ID NO: 5, SEQ ID NO: 9, SEQ ID NO: 11 or SEQ ID NO: 13.
Предпочтительно выделенный полинуклеотид содержит, состоит или по существу состоит из последовательности, характеризующейся меньшей мере, приблизительно 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9% или 100% идентичностью последовательности с SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21 или SEQ ID NO: 23, или с SEQ ID NO:5, SEQ ID NO: 9, SEQ ID NO: 11 или SEQ ID NO: 13.Preferably, the isolated polynucleotide contains, consists of, or essentially consists of a sequence characterized by at least about 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90% , 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99, 5%, 99.6%, 99.7%, 99.8%, 99.9% or 100% sequence identity with SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21 or SEQ ID NO: 23, or with SEQ ID NO: 5, SEQ ID NO: 9, SEQ ID NO: 11 or SEQ ID NO: 13.
Предпочтительно выделенный полинуклеотид содержит, состоит или по существу состоит из последовательности, характеризующейся меньшей мере, приблизительно 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9% или 100% идентичностью последовательности с SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 13 или SEQ ID NO: 15.Preferably, the isolated polynucleotide contains, consists of, or essentially consists of a sequence characterized by at least about 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90% , 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99, 5%, 99.6%, 99.7%, 99.8%, 99.9% or 100% sequence identity with SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 13, or SEQ ID NO: 15.
Предпочтительно выделенный полинуклеотид содержит, состоит или по существу состоит из последовательности, характеризующейся меньшей мере, приблизительно 95%, 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9% или 100% идентичностью последовательности с SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21 или SEQ ID NO: 23.Preferably, the isolated polynucleotide contains, consists of, or essentially consists of a sequence characterized by at least about 95%, 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.3%, 99. 4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% or 100% sequence identity with SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 9 , SEQ ID NO: 11, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21 or SEQ ID NO: 23.
В другом варианте осуществления представлены полинуклеотиды, содержащие, состоящие или по существу состоящие из полинуклеотидов с существенной степенью гомологии (т. е. сходством последовательности) или существенной степенью идентичности с SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21 или SEQ ID NO: 23, или с SEQ ID NO:5, SEQ ID NO: 9, SEQ ID NO: 11 или SEQ ID NO: 13. In another embodiment, polynucleotides are provided comprising, consisting of, or essentially consisting of polynucleotides with a significant degree of homology (i.e., sequence similarity) or a significant degree of identity with SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5 , SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21 or SEQ ID NO: 23, or with SEQ ID NO: 5, SEQ ID NO: 9, SEQ ID NO: 11, or SEQ ID NO: 13.
В другом варианте осуществления предусмотрены фрагменты SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21 или SEQ ID NO: 23 с существенной степенью гомологии (то есть сходством последовательности) или с существенной степенью идентичности с ними, которые характеризуются по меньшей мере, приблизительно 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 75%, 80%, 85%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9% или 100% идентичностью последовательности с соответствующими фрагментами из SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21 или SEQ ID NO: 23. In another embodiment, fragments of SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21 or SEQ ID NO: 23 with a significant degree of homology (i.e. sequence similarity) or with a significant degree of identity with them, which are characterized by at least , approximately 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 75%, 80%, 85%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.3%, 99, 4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% or 100% sequence identity with the corresponding fragments from SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21 or SEQ ID NO: 23.
В другом варианте осуществления представлены фрагменты из SEQ ID NO:5, SEQ ID NO: 9, SEQ ID NO: 11 или SEQ ID NO: 13 с существенной степенью гомологии (то есть сходством последовательности) или существенной степенью идентичности с ними, которые характеризуются по меньшей мере, приблизительно 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 75%, 80%, 85%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95% 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9% или 100% идентичностью последовательности с соответствующими фрагментами из SEQ ID NO:5, SEQ ID NO: 9, SEQ ID NO: 11 или SEQ ID NO: 13. In another embodiment, fragments from SEQ ID NO: 5, SEQ ID NO: 9, SEQ ID NO: 11, or SEQ ID NO: 13 are presented with a significant degree of homology (i.e. sequence similarity) or a significant degree of identity with them, which are characterized by at least about 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 75%, 80%, 85%, 87%, 88 %, 89%, 90%, 91%, 92%, 93%, 94%, 95% 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.3%, 99 .4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% or 100% sequence identity with the corresponding fragments from SEQ ID NO:5, SEQ ID NO: 9, SEQ ID NO: 11 or SEQ ID NO: 13.
В другом варианте осуществления представлены полинуклеотиды, предусматривающие достаточную или существенную степень идентичности или сходства с SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21 или SEQ ID NO: 23, или с SEQ ID NO:5, SEQ ID NO: 9, SEQ ID NO: 11 или SEQ ID NO: 13, которые кодируют полипептид, который выполняет функцию SUS.In another embodiment, polynucleotides are provided that provide a sufficient or substantial degree of identity or similarity to SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21 or SEQ ID NO: 23, or with SEQ ID NO: 5, SEQ ID NO: 9, SEQ ID NO: 11 or SEQ ID NO: 13, which encode a polypeptide that performs the SUS function.
В другом варианте осуществления представлен полимер, представляющий собой полинуклеотид, который содержит, состоит или по существу состоит из полинуклеотида, обозначенного в данном документе как SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21 или SEQ ID NO: 23, или как SEQ ID NO:5, SEQ ID NO: 9, SEQ ID NO: 11 или SEQ ID NO: 13.In another embodiment, a polymer is provided that is a polynucleotide that contains, consists of, or essentially consists of, a polynucleotide referred to herein as SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7 , SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21 or SEQ ID NO: 23, or as SEQ ID NO: 5, SEQ ID NO: 9, SEQ ID NO: 11 or SEQ ID NO: 13.
Предпочтительно полинуклеотиды, описанные в данном документе, кодируют представителей семейства SUS.Preferably, the polynucleotides described herein encode members of the SUS family.
Полинуклеотид, описанный в данном документе, может включать полимер из нуклеотидов, который может представлять собой немодифицированную или модифицированную дезоксирибонуклеиновую кислоту (ДНК) или рибонуклеиновую кислоту (РНК). Соответственно, полинуклеотид может представлять собой без ограничения геномную ДНК, комплементарную ДНК (кДНК), мРНК, или антисмысловую РНК, или их фрагмент(фрагменты). Кроме того, полинуклеотид может представлять собой однонитевую или двунитевую ДНК, ДНК, которая является смесью однонитевых и двунитевых участков, гибридную молекулу, содержащую ДНК и РНК, или гибридную молекулу со смесью однонитевых и двунитевых участков или их фрагмента (фрагментов). Дополнительно полинуклеотид может быть составлен из трехнитевых участков, содержащих ДНК, РНК или обе, или их фрагмент (фрагменты). Полинуклеотид может содержать одно или более модифицированных оснований, таких как фосфоротиоаты, и может представлять собой пептидную нуклеиновую кислоту. Как правило, полинуклеотиды могут быть собраны из выделенных или клонированных фрагментов кДНК, геномной ДНК, олигонуклеотидов или отдельных нуклеотидов или комбинации вышеперечисленного. Хотя полинуклеотиды, описанные в данном документе, представлены в виде ДНК-последовательностей, они включают их соответствующие РНК-последовательности и их комплементарные (например, полностью комплементарные) ДНК- или РНК-последовательности, в том числе обратно комплементарные им последовательности.The polynucleotide described herein may include a polymer of nucleotides, which may be unmodified or modified deoxyribonucleic acid (DNA) or ribonucleic acid (RNA). Accordingly, a polynucleotide may be, without limitation, genomic DNA, complementary DNA (cDNA), mRNA, or antisense RNA, or fragment(s) thereof. In addition, the polynucleotide may be single or double stranded DNA, DNA that is a mixture of single and double stranded regions, a hybrid molecule containing DNA and RNA, or a hybrid molecule with a mixture of single and double stranded regions or fragment(s) thereof. Additionally, the polynucleotide may be composed of three-strand sections containing DNA, RNA, or both, or a fragment (s). The polynucleotide may contain one or more modified bases such as phosphorothioates and may be a peptidic nucleic acid. Typically, polynucleotides can be assembled from isolated or cloned cDNA fragments, genomic DNA, oligonucleotides, or single nucleotides, or a combination of the above. Although the polynucleotides described herein are presented as DNA sequences, they include their respective RNA sequences and their complementary (eg, fully complementary) DNA or RNA sequences, including their reverse complementary sequences.
Полинуклеотид, описанный в данном документе, обычно будет содержать фосфодиэфирные связи, хотя в некоторых случаях включены полинуклеотидные аналоги, которые могут иметь альтернативные остовы, содержащие, например, фосфороамидатные, фосфоротиоатные, фосфородитиоатные или О-метилфосфороамидитные связи; и пептидные полинуклеотидные остовы и связи. Другие аналоги полинуклеотидов включают полинуклеотиды с положительно заряженными остовами, неионогенными остовами и безрибозными остовами. Модификации рибозофосфатного остова можно осуществлять по целому ряду причин, например, для повышения стабильности и периода полужизни таких молекул в физиологических средах или в качестве зондов на биочипе. Можно получать смеси встречающихся в природе полинуклеотидов и аналогов; в качестве альтернативы, можно получать смеси разных аналогов полинуклеотидов и смеси природных полинуклеотидов и аналогов.A polynucleotide described herein will typically contain phosphodiester linkages, although in some cases polynucleotide analogs are included that may have alternative backbones containing, for example, phosphoramidate, phosphorothioate, phosphorodithioate, or O-methylphosphoroamidite linkages; and peptide polynucleotide backbones and bonds. Other polynucleotide analogs include polynucleotides with positively charged backbones, nonionic backbones, and non-ribose backbones. Modifications of the ribose phosphate backbone can be carried out for a variety of reasons, for example, to increase the stability and half-life of such molecules in physiological media or as probes on a biochip. You can get mixtures of naturally occurring polynucleotides and analogues; alternatively, mixtures of different polynucleotide analogues and mixtures of naturally occurring polynucleotides and analogues can be prepared.
Известно множество аналогов полинуклеотидов, в том числе, например, таковые с фосфороамидатными, фосфоротиоатными, фосфородитиоатными или О-метилфосфороамидитными связями и пептидными остовами полинуклеотидов и связями. Другие аналоги полинуклеотидов включают таковые с положительно заряженными остовами, неионогенными остовами и безрибозными остовами. Полинуклеотиды, содержащие один или более карбоциклических сахаров, также включены.Many analogs of polynucleotides are known, including, for example, those with phosphoramidate, phosphorothioate, phosphorodithioate, or O-methylphosphoroamidite linkages and polynucleotide peptide backbones and linkages. Other polynucleotide analogs include those with positively charged backbones, nonionic backbones, and non-ribose backbones. Polynucleotides containing one or more carbocyclic sugars are also included.
Другие аналоги включают пептидные полинуклеотиды, которые представляют собой таковые на основе пептидных аналогов полинуклеотидов. Эти остовы являются практически неионогенными в нейтральных условиях в отличие от высокозаряженного фосфодиэфирного остова встречающихся в природе полинуклеотидов. Это может давать преимущества. Во-первых, пептидный остов полинуклеотида может характеризоваться улучшенной кинетикой гибридизации. Пептидные полинуклеотиды характеризуются более значительными изменениями температуры плавления в случае наличия несовпадающих пар оснований по сравнению с идеально совпадающими парами оснований. ДНК и РНК, как правило, характеризуются понижением температуры плавления на 2-4 C при наличии внутреннего несовпадения. В случае неионогенного пептидного остова полинуклеотида падение находится ближе к 7-9°C. Сходным образом, из-за их неионогенной природы, гибридизация оснований, присоединенных к этим остовам, является относительно нечувствительной к концентрации солей. Дополнительно пептидные полинуклеотиды могут не разрушаться или разрушаться в меньшей степени клеточными ферментами, и, таким образом, могут быть более стабильными. Other analogs include peptide polynucleotides, which are those based on peptide analogs of polynucleotides. These backbones are substantially non-ionic under neutral conditions, in contrast to the highly charged phosphodiester backbone of naturally occurring polynucleotides. This may provide benefits. First, the peptide backbone of a polynucleotide may have improved hybridization kinetics. Peptide polynucleotides are characterized by greater changes in melting point in the presence of mismatched base pairs compared to perfectly matched base pairs. DNA and RNA, as a rule, are characterized by a decrease in the melting point by 2-4 C in the presence of an internal mismatch. In the case of a non-ionic peptide backbone of a polynucleotide, the drop is closer to 7-9°C. Similarly, due to their non-ionic nature, the hybridization of bases attached to these backbones is relatively insensitive to salt concentration. Additionally, peptide polynucleotides may not be degraded or degraded to a lesser extent by cellular enzymes, and thus may be more stable.
В числе применений раскрытых полинуклеотидов и их фрагментов находится применение фрагментов в качестве зондов в анализах на основе гибридизации или в качестве праймеров для применения в анализах на основе амплификации. Такие фрагменты обычно содержат по меньшей мере приблизительно 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 или 20 или больше смежных нуклеотидов из ДНК-последовательности. В других вариантах осуществления фрагмент ДНК содержит по меньшей мере приблизительно 10, 15, 20, 30, 40, 50 или 60 или больше смежных нуклеотидов из ДНК-последовательности. Таким образом, согласно одному аспекту также предусмотрен способ выявления полинуклеотида, включающий применение зондов или праймеров, или того и другого. Иллюстративные праймеры описаны в данном документе.Among the uses of the disclosed polynucleotides and fragments thereof is the use of the fragments as probes in hybridization based assays or as primers for use in amplification based assays. Such fragments typically contain at least about 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, or 20 or more contiguous nucleotides from the DNA sequence. In other embodiments, the DNA fragment contains at least about 10, 15, 20, 30, 40, 50, or 60 or more contiguous nucleotides from the DNA sequence. Thus, according to one aspect, a method for detecting a polynucleotide is also provided, comprising the use of probes or primers, or both. Illustrative primers are described in this document.
Основные параметры, влияющие на выбор условий гибридизации, и руководство для разработки подходящих условий описаны в Sambrook, J., E. F. Fritsch, and T. Maniatis (1989, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.). Используя данные о генетическом коде в комбинации с полипептидными последовательностями, описанными в данном документе, можно получить наборы вырожденных олигонуклеотидов. Такие олигонуклеотиды применимы в качестве праймеров, например, в полимеразных цепных реакциях (ПЦР), с помощью которых выделяют и амплифицируют фрагменты ДНК. В определенных вариантах осуществления вырожденные праймеры можно применять в качестве зондов для генетических библиотек. Такие библиотеки включают библиотеки кДНК, геномные библиотеки и даже электронные библиотеки меток экспрессируемых последовательностей или ДНК. Гомологичные последовательности, идентифицированные этим способом, будут затем использованы в качестве зондов для идентификации гомологов последовательностей, указанных в данном документе.The main parameters influencing the choice of hybridization conditions and guidance for developing suitable conditions are described in Sambrook, J., E. F. Fritsch, and T. Maniatis (1989, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. ). Using the genetic code data in combination with the polypeptide sequences described herein, sets of degenerate oligonucleotides can be obtained. Such oligonucleotides are useful as primers, for example, in polymerase chain reactions (PCR) by which DNA fragments are isolated and amplified. In certain embodiments, degenerate primers can be used as probes for genetic libraries. Such libraries include cDNA libraries, genomic libraries, and even electronic label libraries for expressed sequences or DNA. Homologous sequences identified by this method will then be used as probes to identify homologues of the sequences specified herein.
Также, потенциально применимыми являются полинуклеотиды и олигонуклеотиды (например, праймеры или зонды), которые гибридизируются в условиях пониженной жесткости, как правило, в условиях средней жесткости и, обычно, в условиях высокой жесткости с полинуклеотидом(полинуклеотидами), описанным(описанными) в данном документе. Основные параметры, влияющие на выбор условий гибридизации, и руководство для разработки подходящих условий изложены в Sambrook J., E. F. Fritsch and T. Maniatis (1989, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.) и могут быть легко определены специалистами средней квалификации в данной области техники на основе, например, длины или композиции оснований полинуклеотида.Also potentially useful are polynucleotides and oligonucleotides (e.g., primers or probes) that hybridize under conditions of reduced stringency, typically medium stringency, and typically high stringency, to the polynucleotide(s) described herein. document. The main parameters influencing the choice of hybridization conditions and guidance for developing suitable conditions are set forth in Sambrook J., E. F. Fritsch and T. Maniatis (1989, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.) and can be easily determined by those of ordinary skill in the art based on, for example, the length or base composition of the polynucleotide.
В данном документе определен один способ достижения условий умеренной и высокой жесткости. Следует понимать, что температуру промывки и концентрацию солей при промывке при потребности можно регулировать для достижения необходимой степени жесткости посредством применения основных принципов, которые управляют реакциями гибридизации и стабильностью дуплексов, как это известно специалистам в данной области техники и дополнительно описано ниже (см., например, Sambrook, J., E. F. Fritsch, and T. Maniatis (1989, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y). При гибридизации полинуклеотида с полинуклеотидом с неизвестной последовательностью предполагается, что длина гибрида будет такой как у гибридизирующегося полинуклеотида. Когда гибридизируют полинуклеотиды с известными последовательностями, длина гибрида может быть определена путем выравнивания последовательностей полинуклеотидов и идентификации участка или участков с оптимальной комплементарностью последовательности. Температура гибридизации для гибридов, длина которых предположительно составят менее 50 пар оснований, должна быть на 5-10 C меньше, чем температура плавления гибрида, где температуру плавления определяют в соответствии со следующими уравнениями. Для гибридов, длина которых составляет менее 18 пар оснований, температура плавления (°С) = 2(число оснований А+Т)+4(число оснований G+C). Для гибридов, длина которых составляет более 18 пар оснований, температура плавления (°C) = 81,5+16,6(log10 [Na+])+0,41(% G+C)-(600/N), где N представляет собой число оснований в гибриде, и [Na+] представляет собой концентрацию ионов натрия в буфере для гибридизации ([Na+] для 1x стандартного цитрата натрия=0,165 M). Как правило, каждый такой гибридизирующийся полинуклеотид имеет длину, которая составляет по меньшей мере 25% (обычно по меньшей мере 50%, 60% или 70% и наиболее часто по меньшей мере 80%) от длины полинуклеотида, с которым он гибридизируется, и характеризуется по меньшей мере 60% идентичностью последовательности (например, по меньшей мере 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% или 100%) с полинуклеотидом, с которым он гибридизируется. This document defines one way to achieve conditions of moderate and high stringency. It should be understood that the wash temperature and salt concentration in the wash as needed can be adjusted to achieve the desired degree of stringency by applying the fundamental principles that govern hybridization reactions and duplex stability, as is known to those skilled in the art and further described below (see e.g. , Sambrook, J., E. F. Fritsch, and T. Maniatis (1989, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.) When a polynucleotide is hybridized to a polynucleotide of unknown sequence, the length of the hybrid is assumed to be such as a hybridizing polynucleotide.When polynucleotides are hybridized to known sequences, the length of the fusion can be determined by aligning the sequences of the polynucleotides and identifying the site or sites with optimal sequence complementarity.The hybridization temperature for hybrids expected to be less than 50 base pairs in length should be 5 -10 C less than the melting point of the hybrid, where the melting point is determined in accordance with the following equations. For hybrids less than 18 bp in length, melting point (°C) = 2(number of bases A+T)+4(number of bases G+C). For hybrids longer than 18 bp, melting point (°C) = 81.5+16.6(log10 [Na+])+0.41(% G+C)-(600/N) where N is the number of bases in the hybrid, and [Na+] is the concentration of sodium ions in the hybridization buffer ([Na+] for 1x standard sodium citrate=0.165 M). Typically, each such hybridizing polynucleotide has a length that is at least 25% (typically at least 50%, 60%, or 70%, and most often at least 80%) of the length of the polynucleotide to which it hybridizes and is characterized at least 60% sequence identity (e.g., at least 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% or 100%) with a polynucleotide, with with which it hybridizes.
Как будет понятно специалисту в данной области техники, линейная ДНК имеет две возможные ориентации: направление 5'-3' и направление 3'-5'. Например, если первая последовательность расположена в направлении 5'-3', и если вторая последовательность расположена в направлении 5'-3' в одной и той же полинуклеотидной молекуле/нити, то первая последовательность и вторая последовательность ориентированы в одном направлении или имеют одинаковую ориентацию. Как правило, последовательность промотора и представляющий интерес ген, находящийся под контролем данного промотора, расположены в одинаковой ориентации. Однако если по отношению к первой последовательности, расположенной в направлении 5'-3', вторая последовательность расположена в направлении 3'-5' в одной и той же полинуклеотидной молекуле/нити, тогда первая последовательность и вторая последовательность ориентированы в антисмысловом направлении или имеют антисмысловую ориентацию. Две последовательности, имеющие антисмысловые ориентации по отношению друг к другу, могут быть альтернативно описаны как имеющие одинаковую ориентацию, если первая последовательность (направление 5'-3') и последовательность, обратно комплементарная первой последовательности (первой последовательности, расположенной в 5'-3'), расположены в пределах одной полинуклеотидной молекулы/нити. Последовательности, изложенные в данном документе, показаны в направлении 5'-3'. As will be appreciated by one of skill in the art, linear DNA has two possible orientations: the 5'-3' direction and the 3'-5' direction. For example, if the first sequence is located in the 5'-3' direction, and if the second sequence is located in the 5'-3' direction in the same polynucleotide molecule/strand, then the first sequence and the second sequence are oriented in the same direction or have the same orientation. . Typically, the promoter sequence and the gene of interest under the control of that promoter are in the same orientation. However, if with respect to the first sequence located in the 5'-3' direction, the second sequence is located in the 3'-5' direction in the same polynucleotide molecule/strand, then the first sequence and the second sequence are oriented in the antisense direction or have an antisense orientation. Two sequences having antisense orientations with respect to each other can alternatively be described as having the same orientation if the first sequence (the 5'-3' direction) and a sequence inversely complementary to the first sequence (the first sequence located 5'-3' ) are located within a single polynucleotide molecule/strand. The sequences set forth herein are shown in the 5'-3' direction.
По меньшей мере одна модификация (например, мутация) может быть включена в одну или более из NtSUS1-S, NtSUS1-T, NtSUS2-S, NtSUS2-T, NtSUS3-S, NtSUS3-T, NtSUS4-S, NtSUS4-T, NtSUS5-S, NtSUS5-T, NtSUS6-S и NtSUS6-T. По меньшей мере одна модификация (например, мутация) может быть включена в одну или более из NtSUS2-S, NtSUS2-T, NtSUS3-S, NtSUS3-T, NtSUS4-S и NtSUS4-T. At least one modification (eg, mutation) may be included in one or more of NtSUS1-S, NtSUS1-T, NtSUS2-S, NtSUS2-T, NtSUS3-S, NtSUS3-T, NtSUS4-S, NtSUS4-T, NtSUS5-S, NtSUS5-T, NtSUS6-S and NtSUS6-T. At least one modification (eg, mutation) may be included in one or more of NtSUS2-S, NtSUS2-T, NtSUS3-S, NtSUS3-T, NtSUS4-S, and NtSUS4-T .
По меньшей мере одна модификация (например, мутация) может быть включена в одну или более из NtSUS2-S, NtSUS2-T, NtSUS3-S, NtSUS3-T, NtSUS4-S и NtSUS4-T, при этом модификация(модификации) (например, мутация(мутации)) не включена(включены) в одну или более из NtSUS1-S, NtSUS1-T, NtSUS5-S, NtSUS5-T, NtSUS6-S и NtSUS6-T. At least one modification (e.g., a mutation) may be included in one or more of NtSUS2-S, NtSUS2-T, NtSUS3-S, NtSUS3-T, NtSUS4-S, and NtSUS4-T , with the modification(s) (e.g. , the mutation(s)) is not included in one or more of NtSUS1-S, NtSUS1-T, NtSUS5-S, NtSUS5-T, NtSUS6-S and NtSUS6-T .
По меньшей мере одна модификация (например, мутация) может быть включена в одну или более из NtSUS2-S, NtSUS2-T, NtSUS3-S, NtSUS3-T, NtSUS4-S и NtSUS4-T, при этом модификация(модификации) (например, мутация(мутации)) не включена(включены) в одну или более из NtSUS1-S, NtSUS1-T, NtSUS5-S, NtSUS5-T, NtSUS6-S и NtSUS6-T. At least one modification (e.g., a mutation) may be included in one or more of NtSUS2-S, NtSUS2-T, NtSUS3-S, NtSUS3-T, NtSUS4-S, and NtSUS4-T , wherein the modification(s) (e.g. , the mutation(s)) is not included in one or more of NtSUS1-S, NtSUS1-T, NtSUS5-S, NtSUS5-T, NtSUS6-S and NtSUS6-T .
По меньшей мере одна модификация (например, мутация) может быть включена в одну или более из NtSUS2-S, NtSUS3-S, NtSUS3-T и NtSUS4-S, при этом модификация(модификации) (например, мутация(мутации)) не включена(включены) в одну или более из NtSUS1-S, NtSUS1-T, NtSUS2-T, NtSUS4-T, NtSUS5-S, NtSUS5-T, NtSUS6-S и NtSUS6-T и они не модулируются.At least one modification (e.g., mutation) may be included in one or more of NtSUS2-S, NtSUS3-S, NtSUS3-T, and NtSUS4-S with no modification(s) (e.g., mutation(s)) included. (included) in one or more of NtSUS1-S, NtSUS1-T, NtSUS2-T, NtSUS4-T, NtSUS5-S, NtSUS5-T, NtSUS6-S, and NtSUS6-T and they are not modulated.
По меньшей мере одна модификация (например, мутация) может быть включена в одну или более из NtSUS2-S, NtSUS3-S, NtSUS3-T и NtSUS4-S, при этом модификация(модификации) (например, мутация(мутации)) не включена(включены) в одну или более из NtSUS1-S, NtSUS1-T, NtSUS2-T, NtSUS4-T, NtSUS5-S, NtSUS5-T, NtSUS6-S и NtSUS6-T и они не модулируются.At least one modification (e.g., mutation) may be included in one or more of NtSUS2-S, NtSUS3-S, NtSUS3-T, and NtSUS4-S with no modification(s) (e.g., mutation(s)) included. (included) in one or more of NtSUS1-S, NtSUS1-T, NtSUS2-T, NtSUS4-T, NtSUS5-S, NtSUS5-T, NtSUS6-S, and NtSUS6-T, and they are not modulated.
3. Полипептид3. Polypeptide
В другом аспекте представлен выделенный полипептид, содержащий, состоящий или по существу состоящий из полипептида, характеризующегося по меньшей мере 60% идентичности последовательности с любым из полипептидов, описанных в данном документе, включая любой из полипептидов, приведенных в перечне последовательностей. Предпочтительно выделенный полипептид содержит, состоит или по существу состоит из последовательности, характеризующейся по меньшей мере 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 75%, 80%, 85%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95% 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9% или 100% идентичностью последовательности с ними.In another aspect, an isolated polypeptide is provided, comprising, consisting of, or essentially consisting of, a polypeptide having at least 60% sequence identity with any of the polypeptides described herein, including any of the polypeptides listed in the sequences. Preferably, the isolated polypeptide contains, consists of, or essentially consists of a sequence characterized by at least 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 75%, 80%, 85%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95% 96%, 97%, 98%, 99%, 99.1 %, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% or 100% sequence identity with them.
В одном варианте осуществления представлен полипептид, содержащий, состоящий или по существу состоящий из последовательности, характеризующейся по меньшей мере 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9% или 100% идентичностью последовательности с SEQ ID NO: 2 или SEQ ID NO: 4.In one embodiment, a polypeptide is provided comprising, consisting of, or essentially consisting of a sequence characterized by at least 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78% , 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95 %, 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99 .8%, 99.9% or 100% sequence identity with SEQ ID NO: 2 or SEQ ID NO: 4.
В другом варианте осуществления представлен полипептид, содержащий, состоящий или по существу состоящий из последовательности, характеризующейся по меньшей мере 94%, 95%, 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9% или 100% идентичностью последовательности с SEQ ID NO: 2.In another embodiment, a polypeptide is provided comprising, consisting of, or essentially consisting of a sequence characterized by at least 94%, 95%, 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99 .3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% or 100% sequence identity with SEQ ID NO: 2.
В другом варианте осуществления представлен полипептид, содержащий, состоящий или по существу состоящий из последовательности, характеризующейся по меньшей мере 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9% или 100% идентичностью последовательности с SEQ ID NO: 4.In another embodiment, a polypeptide is provided comprising, consisting of, or essentially consisting of a sequence characterized by at least 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.1%, 99.2 %, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% or 100% sequence identity with SEQ ID NO: 4.
В одном варианте осуществления представлен полипептид, содержащий, состоящий или по существу состоящий из последовательности, характеризующейся по меньшей мере 80%, 81%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9% или 100% идентичностью последовательности с SEQ ID NO: 6 или SEQ ID NO: 8.In one embodiment, a polypeptide is provided comprising, consisting of, or essentially consisting of a sequence characterized by at least 80%, 81%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88% , 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.3%, 99 .4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% or 100% sequence identity with SEQ ID NO: 6 or SEQ ID NO: 8.
В другом варианте осуществления представлен полипептид, содержащий, состоящий или по существу состоящий из последовательности, характеризующейся по меньшей мере 95%, 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9% или 100% идентичностью последовательности с SEQ ID NO: 6.In another embodiment, a polypeptide is provided comprising, consisting of, or essentially consisting of a sequence characterized by at least 95%, 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.3% , 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% or 100% sequence identity with SEQ ID NO: 6.
В другом варианте осуществления представлен полипептид, содержащий, состоящий или по существу состоящий из последовательности, характеризующейся по меньшей мере 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9% или 100% идентичностью последовательности с SEQ ID NO: 8.In another embodiment, a polypeptide is provided comprising, consisting of, or essentially consisting of a sequence characterized by at least 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.3%, 99, 4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% or 100% sequence identity with SEQ ID NO: 8.
В одном варианте осуществления представлен полипептид, содержащий, состоящий или по существу состоящий из последовательности, характеризующейся по меньшей мере 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9% или 100% идентичностью последовательности с SEQ ID NO: 10 или SEQ ID NO: 12.In one embodiment, a polypeptide is provided comprising, consisting of, or essentially consisting of a sequence characterized by at least 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83% , 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99 .1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% or 100% sequence identity with SEQ ID NO: 10 or SEQ ID NO: 12.
В другом варианте осуществления представлен полипептид, содержащий, состоящий или по существу состоящий из последовательности, характеризующейся по меньшей мере 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9% или 100% идентичностью последовательности с SEQ ID NO: 10 или SEQ ID NO: 12.In another embodiment, a polypeptide is provided comprising, consisting of, or essentially consisting of a sequence characterized by at least 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.1%, 99.2 %, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% or 100% sequence identity with SEQ ID NO: 10 or SEQ ID NO: 12.
В одном варианте осуществления представлен полипептид, содержащий, состоящий или по существу состоящий из последовательности, характеризующейся по меньшей мере 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9% или 100% идентичностью последовательности с SEQ ID NO: 14 или SEQ ID NO: 16.In one embodiment, a polypeptide is provided comprising, consisting of, or essentially consisting of a sequence characterized by at least 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85% , 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.1%, 99, 2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% or 100% sequence identity with SEQ ID NO: 14 or SEQ ID NO: 16.
В другом варианте осуществления представлен полипептид, содержащий, состоящий или по существу состоящий из последовательности, характеризующейся по меньшей мере 95%, 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9% или 100% идентичностью последовательности с SEQ ID NO: 14.In another embodiment, a polypeptide is provided comprising, consisting of, or essentially consisting of a sequence characterized by at least 95%, 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.3% , 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% or 100% sequence identity with SEQ ID NO: 14.
В другом варианте осуществления представлен полипептид, содержащий, состоящий или по существу состоящий из последовательности, характеризующейся по меньшей мере 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9% или 100% идентичностью последовательности с SEQ ID NO: 16.In another embodiment, a polypeptide is provided comprising, consisting of, or essentially consisting of a sequence characterized by at least 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.3%, 99, 4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% or 100% sequence identity with SEQ ID NO: 16.
В одном варианте осуществления представлен полипептид, содержащий, состоящий или по существу состоящий из последовательности, характеризующейся по меньшей мере 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9% или 100% идентичностью последовательности с SEQ ID NO: 18 или SEQ ID NO: 20.In one embodiment, a polypeptide is provided comprising, consisting of, or essentially consisting of a sequence characterized by at least 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77% , 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94 %, 95%, 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7 %, 99.8%, 99.9% or 100% sequence identity with SEQ ID NO: 18 or SEQ ID NO: 20.
В другом варианте осуществления представлен полипептид, содержащий, состоящий или по существу состоящий из последовательности, характеризующейся по меньшей мере 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9% или 100% идентичностью последовательности с SEQ ID NO: 18.In another embodiment, a polypeptide is provided comprising, consisting of, or essentially consisting of a sequence characterized by at least 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% , 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% or 100 % sequence identity to SEQ ID NO: 18.
В другом варианте осуществления представлен полипептид, содержащий, состоящий или по существу состоящий из последовательности, характеризующейся по меньшей мере 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9% или 100% идентичностью последовательности с SEQ ID NO: 20.In another embodiment, a polypeptide is provided comprising, consisting of, or essentially consisting of a sequence characterized by at least 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% or 100% sequence identity with SEQ ID NO: 20 .
В одном варианте осуществления представлен полипептид, содержащий, состоящий или по существу состоящий из последовательности, характеризующейся по меньшей мере 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9% или 100% идентичностью последовательности с SEQ ID NO: 22 или SEQ ID NO: 24. In one embodiment, a polypeptide is provided comprising, consisting of, or essentially consisting of a sequence characterized by at least 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78% , 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95 %, 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99 .8%, 99.9% or 100% sequence identity with SEQ ID NO: 22 or SEQ ID NO: 24.
В другом варианте осуществления представлен полипептид, содержащий, состоящий или по существу состоящий из последовательности, характеризующейся по меньшей мере 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9% или 100% идентичностью последовательности с SEQ ID NO: 22. In another embodiment, a polypeptide is provided comprising, consisting of, or essentially consisting of a sequence characterized by at least 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.1%, 99.2 %, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% or 100% sequence identity with SEQ ID NO: 22.
В другом варианте осуществления представлен полипептид, содержащий, состоящий или по существу состоящий из последовательности, характеризующейся по меньшей мере 94%, 95%, 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9% или 100% идентичностью последовательности с SEQ ID NO: 24. In another embodiment, a polypeptide is provided comprising, consisting of, or essentially consisting of a sequence characterized by at least 94%, 95%, 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99 .3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% or 100% sequence identity with SEQ ID NO: 24.
В одном варианте осуществления представлен полипептид, кодируемый SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21 или SEQ ID NO: 23; или SEQ ID NO:5, SEQ ID NO: 9, SEQ ID NO: 11 или SEQ ID NO: 13. In one embodiment, a polypeptide encoded by SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21 or SEQ ID NO: 23; or SEQ ID NO: 5, SEQ ID NO: 9, SEQ ID NO: 11, or SEQ ID NO: 13.
Полипептид может содержать последовательности, имеющие достаточную или значительную степень идентичности или сходства с SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22 или SEQ ID NO: 24; или SEQ ID NO: 6, SEQ ID NO: 10, SEQ ID NO: 12 или SEQ ID NO: 14 для выполнения функции SUS. The polypeptide may contain sequences having a sufficient or significant degree of identity or similarity with SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, or SEQ ID NO: 24; or SEQ ID NO: 6, SEQ ID NO: 10, SEQ ID NO: 12, or SEQ ID NO: 14 to perform the SUS function.
Как правило, фрагменты полипептида (полипептидов) сохраняют некоторые или все функции или активность полноразмерной последовательности. Typically, fragments of the polypeptide(s) retain some or all of the functions or activities of the full-length sequence.
Как обсуждалось в данном документе, полипептиды также включают мутантные варианты, полученных путем введения любого типа корректировок (например, вставки, делеции или замены аминокислот; изменения состояния гликозилирования; изменения, которые влияют на рефолдинг или изомеризацию, трехмерные структуры или состояния самоассоциации), которые могут быть намеренно сконструированы или выделены естественным образом при условии, что они по-прежнему сохраняют некоторую или всю свою функциональность или активность. Предпочтительно, данную функцию или активность модулируют. As discussed herein, polypeptides also include mutant variants obtained by introducing any type of adjustment (e.g., insertion, deletion, or substitution of amino acids; changes in glycosylation state; changes that affect refolding or isomerization, three-dimensional structures, or self-association states) that may be deliberately constructed or naturally derived, provided that they still retain some or all of their functionality or activity. Preferably, the function or activity is modulated.
Делеция относится к удалению одной или более аминокислот из полипептида. Вставка относится к одному или более аминокислотным остаткам, вводимым в заранее определенное место в полипептиде. Вставки могут предусматривать вставки внутрь последовательности одной или нескольких аминокислот. Замена относится к замещению аминокислот полипептида другими аминокислотами, имеющими сходные свойства (такие как сходная гидрофобность, гидрофильность, антигенность, склонность к образованию или разрыву α-спиральных структур или β-складчатых структур). Аминокислотные замены, как правило, предусматривают один остаток, но могут быть сгруппированы в зависимости от функциональных ограничений, накладываемых на полипептид, и могут предусматривать диапазон от приблизительно 1 до приблизительно 10 аминокислот. Аминокислотные замены являются предпочтительно консервативными аминокислотными заменами, как описано ниже. Аминокислотные замены, делеции и/или вставки можно выполнить с применением методик пептидного синтеза, таких как твердофазный пептидный синтез, или с помощью манипулирования с рекомбинантной ДНК. Способы манипулирования ДНК-последовательностями с получением вариантов полипептида с заменой, вставкой или делецией хорошо известны в данной области техники. Вариант может характеризоваться наличием корректировок, которые вызывают возникновение «молчащего» изменения и в результате приводят к образованию функционально эквивалентного полипептида. Преднамеренные аминокислотные замены можно осуществлять исходя из сходства остатков в отношении полярности, заряда, растворимости, гидрофобности, гидрофильности и амфипатической природы, при условии, что сохраняется связывание, обуславливающее вторичную структуру вещества. Например, отрицательно заряженные аминокислоты включают аспарагиновую кислоту и глутаминовую кислоту, положительно заряженные аминокислоты включают лизин и аргинин, и аминокислоты с незаряженными полярными концевыми группами, характеризующиеся сходными значениями гидрофильности, включают лейцин, изолейцин, валин, глицин, аланин, аспарагин, глутамин, серин, треонин, фенилаланин и тирозин. Консервативные замены можно осуществлять, например, в соответствии с приведенной ниже таблицей. Аминокислоты в одном и том же блоке во втором столбце и предпочтительно в одной и той же строке в третьем столбце можно заменять одна на другую:A deletion refers to the removal of one or more amino acids from a polypeptide. An insert refers to one or more amino acid residues introduced at a predetermined location in a polypeptide. Insertions may include insertions into the sequence of one or more amino acids. Substitution refers to the substitution of amino acids in a polypeptide with other amino acids having similar properties (such as similar hydrophobicity, hydrophilicity, antigenicity, propensity to form or break α-helical structures or β-sheet structures). Amino acid substitutions typically include a single residue, but may be grouped depending on the functional limitations imposed on the polypeptide, and may range from about 1 to about 10 amino acids. Amino acid substitutions are preferably conservative amino acid substitutions, as described below. Amino acid substitutions, deletions and/or insertions can be performed using peptide synthesis techniques, such as solid phase peptide synthesis, or by manipulating recombinant DNA. Methods for manipulating DNA sequences to produce substitution, insertion, or deletion variants of a polypeptide are well known in the art. A variant may be characterized by the presence of adjustments that cause a "silent" change to occur and result in a functionally equivalent polypeptide. Intentional amino acid substitutions can be made based on the similarity of residues in terms of polarity, charge, solubility, hydrophobicity, hydrophilicity and amphipathic nature, provided that the binding that causes the secondary structure of the substance is maintained. For example, negatively charged amino acids include aspartic acid and glutamic acid, positively charged amino acids include lysine and arginine, and amino acids with uncharged polar end groups having similar hydrophilicity values include leucine, isoleucine, valine, glycine, alanine, asparagine, glutamine, serine, threonine, phenylalanine and tyrosine. Conservative substitutions can be made, for example, in accordance with the table below. Amino acids in the same block in the second column, and preferably in the same row in the third column, can be substituted for one another:
Полипептид может представлять собой зрелый полипептид, или незрелый полипептид, или полипептид, полученный из незрелого полипептида. Полипептиды могут находиться в линейной форме или являться циклизированными с применением известных способов. Полипептиды, как правило, содержат по меньшей мере 10, по меньшей мере 20, по меньшей мере 30, или по меньшей мере 40 смежных аминокислот.The polypeptide may be a mature polypeptide, or an immature polypeptide, or a polypeptide derived from an immature polypeptide. The polypeptides may be in linear form or be cyclized using known methods. Polypeptides typically contain at least 10, at least 20, at least 30, or at least 40 contiguous amino acids.
По меньшей мере одна модификация (например, мутация) может быть включена в одну или более из NtSUS1-S, NtSUS1-T, NtSUS2-S, NtSUS2-T, NtSUS3-S, NtSUS3-T, NtSUS4-S, NtSUS4-T, NtSUS5-S, NtSUS5-T, NtSUS6-S и NtSUS6-T. At least one modification (eg, mutation) may be included in one or more of NtSUS1-S, NtSUS1-T, NtSUS2-S, NtSUS2-T, NtSUS3-S, NtSUS3-T, NtSUS4-S, NtSUS4-T, NtSUS5-S, NtSUS5-T, NtSUS6-S and NtSUS6-T.
По меньшей мере одна модификация (например, мутация) может быть включена в одну или более из NtSUS2-S, NtSUS2-T, NtSUS3-S, NtSUS3-T, NtSUS4-S и NtSUS4-T, при этом модификация(модификации) (например, мутация(мутации)) не включена(включены) в одну или более из NtSUS1-S, NtSUS1-T, NtSUS5-S, NtSUS5-T, NtSUS6-S и NtSUS6-T. At least one modification (e.g., mutation) may be included in one or more of NtSUS2-S, NtSUS2-T, NtSUS3-S, NtSUS3-T, NtSUS4-S, and NtSUS4-T, wherein the modification(s) (e.g. , the mutation(s)) is not included in one or more of NtSUS1-S, NtSUS1-T, NtSUS5-S, NtSUS5-T, NtSUS6-S, and NtSUS6-T.
По меньшей мере одна модификация (например, мутация) может быть включена в одну или более из NtSUS2-S, NtSUS2-T, NtSUS3-S, NtSUS3-T, NtSUS4-S и NtSUS4-T, при этом модификация(модификации) (например, мутация(мутации)) не включена(включены) в одну или более из NtSUS1-S, NtSUS1-T, NtSUS5-S, NtSUS5-T, NtSUS6-S и NtSUS6-T. At least one modification (e.g., mutation) may be included in one or more of NtSUS2-S, NtSUS2-T, NtSUS3-S, NtSUS3-T, NtSUS4-S, and NtSUS4-T, wherein the modification(s) (e.g. , the mutation(s)) is not included in one or more of NtSUS1-S, NtSUS1-T, NtSUS5-S, NtSUS5-T, NtSUS6-S, and NtSUS6-T.
По меньшей мере одна модификация (например, мутация) может быть включена в одну или более из NtSUS2-S, NtSUS3-S, NtSUS3-T и NtSUS4-S, при этом модификация(модификации) (например, мутация(мутации)) не включена(включены) в одну или более из NtSUS1-S, NtSUS1-T, NtSUS2-T, NtSUS4-T, NtSUS5-S, NtSUS5-T, NtSUS6-S и NtSUS6-T и они не модулируются.At least one modification (eg, mutation) may be included in one or more of NtSUS2-S, NtSUS3-S, NtSUS3-T, and NtSUS4-S, with no modification(s) (eg, mutation(s)) included. (included) in one or more of NtSUS1-S, NtSUS1-T, NtSUS2-T, NtSUS4-T, NtSUS5-S, NtSUS5-T, NtSUS6-S, and NtSUS6-T, and they are not modulated.
По меньшей мере одна модификация (например, мутация) может быть включена в одну или более из NtSUS2-S, NtSUS3-S, NtSUS3-T и NtSUS4-S, при этом модификация(модификации) (например, мутация(мутации)) не включена(включены) в одну или более из NtSUS1-S, NtSUS1-T, NtSUS2-T, NtSUS4-T, NtSUS5-S, NtSUS5-T, NtSUS6-S и NtSUS6-T и они не модулируются.At least one modification (eg, mutation) may be included in one or more of NtSUS2-S, NtSUS3-S, NtSUS3-T, and NtSUS4-S, with no modification(s) (eg, mutation(s)) included. (included) in one or more of NtSUS1-S, NtSUS1-T, NtSUS2-T, NtSUS4-T, NtSUS5-S, NtSUS5-T, NtSUS6-S, and NtSUS6-T, and they are not modulated.
Модификация растенийPlant modification
ТрансформацияTransformation
Рекомбинантные конструкции можно применять для трансформации растений или клеток растения для того, чтобы модулировать экспрессию, функцию или активность полипептида. Рекомбинантная полинуклеотидная конструкция может содержать полинуклеотид, кодирующий один или более полинуклеотидов, описанных в данном документе, функционально связанных с регуляторным участком, подходящим для экспрессии полипептида. Таким образом, полинуклеотид может содержать кодирующую последовательность, которая кодирует полипептид, описанный в данном документе. Растения или клетки растений, в которых модулируют экспрессию, функцию или активность полипептида, могут включать мутантные, не встречающиеся в природе, трансгенные, созданные человеком или полученные с помощью методик генной инженерии растения или клетки растения. Предпочтительно, трансгенное растение или клетка растения содержит геном, который был скорректирован путем стабильной интеграции рекомбинантной ДНК. Рекомбинантная ДНК содержит ДНК, полученную с помощью методик генной инженерии и сконструированную вне клетки, и содержит ДНК, содержащую встречающуюся в природе ДНК, или кДНК, или синтетическую ДНК. Трансгенное растение может включать растение, регенерированное из первоначально трансформированной клетки растения, и трансгенные растения, являющиеся потомством более поздних поколений или гибридов трансформированного растения. Предпочтительно, трансгенная модификация обеспечивает корректировку экспрессии, или функции, или активности полинуклеотида или полипептида, описанных в данном документе, по сравнению с таковыми в контрольном растении. Recombinant constructs can be used to transform plants or plant cells in order to modulate the expression, function, or activity of a polypeptide. The recombinant polynucleotide construct may comprise a polynucleotide encoding one or more of the polynucleotides described herein operably linked to a regulatory region suitable for expression of the polypeptide. Thus, a polynucleotide may contain a coding sequence that encodes for a polypeptide as described herein. Plants or plant cells in which the expression, function, or activity of a polypeptide is modulated may include mutant, non-naturally occurring, transgenic, human-created, or genetically engineered plants or plant cells. Preferably, the transgenic plant or plant cell contains a genome that has been corrected by stable integration of recombinant DNA. Recombinant DNA contains DNA that is genetically engineered and engineered outside of a cell, and contains DNA containing naturally occurring DNA, or cDNA, or synthetic DNA. A transgenic plant may include a plant regenerated from an originally transformed plant cell and transgenic plants that are the offspring of later generations or hybrids of the transformed plant. Preferably, the transgenic modification provides for the adjustment of the expression, or function, or activity of a polynucleotide or polypeptide described herein, compared to those in a control plant.
Полипептид, кодируемый рекомбинантным полинуклеотидом, может являться нативным полипептидом или может являться гетерологичным по отношению к клетке. В некоторых случаях рекомбинантная конструкция содержит полинуклеотид, который обеспечивает модулирование экспрессии, функционально связанный с регуляторным участком. Примеры подходящих регуляторных участков описаны в данном документе. The polypeptide encoded by the recombinant polynucleotide may be a native polypeptide or may be heterologous to the cell. In some cases, the recombinant construct contains a polynucleotide that modulates expression operably linked to a regulatory region. Examples of suitable regulatory regions are described herein.
Также представлены векторы, содержащие рекомбинантные полинуклеотидные конструкции, такие как описанные в данном документе. Подходящие основы для векторов включают, например, те, которые обычно используют в данной области техники, такие как плазмиды, вирусы, искусственные хромосомы, искусственные хромосомы бактерий, искусственные хромосомы дрожжей или искусственные хромосомы бактериофагов. Подходящие векторы экспрессии включают без ограничения плазмиды и вирусные векторы, полученные из, например, бактериофага, бакуловирусов и ретровирусов. Многочисленные векторы и системы экспрессии являются коммерчески доступными. Also provided are vectors containing recombinant polynucleotide constructs such as those described herein. Suitable vector backbones include, for example, those commonly used in the art, such as plasmids, viruses, artificial chromosomes, bacterial artificial chromosomes, yeast artificial chromosomes, or bacteriophage artificial chromosomes. Suitable expression vectors include, but are not limited to, plasmids and viral vectors derived from, for example, bacteriophage, baculoviruses, and retroviruses. Numerous vectors and expression systems are commercially available.
Векторы могут содержать, например, точки начала репликации, участки связывания с ядерным матриксом или маркеры. Маркерный ген может придавать клетке растения селектируемый фенотип. Например, маркер может придавать устойчивость к биоцидным средствам, такую как устойчивость к антибиотику (например, к канамицину, G418, блеомицину или гигромицину) или к гербициду (например, к глифосату, хлорсульфурону или фосфинотрицину). Дополнительно вектор экспрессии может содержать последовательность метки, предназначенной для облегчения манипуляций или выявления (например, очистки или локализации) экспрессируемого полипептида. Последовательности меток, такие как последовательности люциферазы, бета-глюкуронидазы, зеленого флуоресцентного полипептида, глутатион-S-трансферазы, полигистидина, c-myc или гемагглютинина, как правило, экспрессируются в виде фрагмента, слитого с кодируемым полипептидом. Такие метки могут быть вставлены в любом месте в пределах полипептида, в том числе на карбоксильном или амино-конце. The vectors may contain, for example, origins of replication, nuclear matrix binding sites, or markers. The marker gene may confer a selectable phenotype to a plant cell. For example, the marker can confer resistance to biocidal agents, such as resistance to an antibiotic (eg, kanamycin, G418, bleomycin, or hygromycin) or herbicide (eg, glyphosate, chlorsulfuron, or phosphinothricin). Additionally, the expression vector may contain a tag sequence designed to facilitate manipulation or detection (eg, purification or localization) of the expressed polypeptide. Label sequences such as luciferase, beta-glucuronidase, green fluorescent polypeptide, glutathione-S-transferase, polyhistidine, c-myc, or hemagglutinin sequences are typically expressed as a fusion fragment with the encoded polypeptide. Such labels can be inserted anywhere within the polypeptide, including at the carboxyl or amino terminus.
Растение или клетку растения можно трансформировать путем интегрирования рекомбинантного полинуклеотида в их геном с обеспечением их стабильной трансформации. Растение или клетка растения, описанные в данном документе, могут являться стабильно трансформированными. Стабильно трансформированные клетки, как правило, сохраняют введенный полинуклеотид с каждым клеточным делением. Растение или клетка растения также могут являться транзиентно трансформированными, так что рекомбинантный полинуклеотид не интегрируется в их геном. Транзиентно трансформированные клетки, как правило, теряют весь введенный рекомбинантный полинуклеотид или некоторую его часть с каждым клеточным делением, так что введенный рекомбинантный полинуклеотид нельзя выявить в дочерних клетках после достаточного числа клеточных делений.A plant or plant cell can be transformed by integrating the recombinant polynucleotide into its genome to ensure its stable transformation. The plant or plant cell described herein may be stably transformed. Stably transformed cells typically retain the introduced polynucleotide with each cell division. The plant or plant cell may also be transiently transformed such that the recombinant polynucleotide does not integrate into its genome. Transiently transformed cells typically lose all or some of the introduced recombinant polynucleotide with each cell division such that the introduced recombinant polynucleotide cannot be detected in daughter cells after a sufficient number of cell divisions.
Из уровня техники доступен ряд способов для трансформации клетки растения, включающий биолистику; методики с применением генной пушки; трансформацию, опосредованную Agrobacterium; трансформацию, опосредованную вирусным вектором; способ на основе замораживания-оттаивания; бомбардировку микрочастицами; прямое поглощение ДНК; ультразвуковую обработку; микроинъекцию; перенос, опосредованный вирусом растения; и электропорацию. Система на основе Agrobacterium для интеграции чужеродной ДНК в хромосомы растений в широких масштабах изучалась, модифицировалась и использовалась для генной инженерии растений. Молекулы депротеинизированной рекомбинантной ДНК, содержащие ДНК-последовательности, соответствующие исследуемому очищенному полипептиду, функционально связанные в смысловой или антисмысловой ориентации с регуляторными последовательностями, соединяют с соответствующими последовательностями Т-ДНК с помощью общепринятых способов. Их вводят в протопласты с помощью методики с применением полиэтиленгликоля или методики с применением электропорации, обе из которых являются стандартными. В качестве альтернативы, такие векторы, содержащие молекулы рекомбинантной ДНК, кодирующие исследуемый очищенный полипептид, вводят в живые клетки Agrobacterium, которые затем переносят ДНК в клетки растения. Трансформацию с помощью депротеинизированной ДНК без сопутствующих последовательностей вектора на основе Т-ДНК можно выполнять посредством слияния протопластов с ДНК-содержащими липосомами или посредством электропорации. Депротеинизированную ДНК без сопутствующих последовательностей вектора на основе Т-ДНК также можно применять для трансформации клеток с помощью инертных, высокоскоростных микрочастиц.A number of methods are available in the art for transforming a plant cell, including biolistics; gene gun techniques; transformation mediated by Agrobacterium; transformation mediated by a viral vector; freeze-thaw method; microparticle bombardment; direct DNA uptake; ultrasonic treatment; microinjection; plant virus-mediated transfer; and electroporation. An Agrobacterium-based system for integrating foreign DNA into plant chromosomes has been extensively studied, modified and used for plant genetic engineering. Deproteinized recombinant DNA molecules containing DNA sequences corresponding to the purified polypeptide of interest, operably linked in sense or antisense orientation to regulatory sequences, are coupled to the corresponding T-DNA sequences using conventional methods. They are introduced into protoplasts using a polyethylene glycol technique or an electroporation technique, both of which are standard. Alternatively, such vectors containing recombinant DNA molecules encoding the purified polypeptide of interest are introduced into living Agrobacterium cells, which then transfer the DNA into plant cells. Transformation with deproteinized DNA without accompanying T-DNA vector sequences can be performed by protoplast fusion with DNA-containing liposomes or by electroporation. Deproteinized DNA without accompanying T-DNA vector sequences can also be used to transform cells with inert, high speed microparticles.
Если клетку или культивируемую ткань применяют в качестве реципиентной ткани для трансформации, при необходимости растения можно регенерировать из трансформированных культур с помощью методов, известных специалистам в данной области техники.If a cell or cultured tissue is used as a recipient tissue for transformation, if necessary, plants can be regenerated from the transformed cultures using methods known to those skilled in the art.
Выбор регуляторных участков, подлежащих включению в рекомбинантную конструкцию, зависит от нескольких факторов, в том числе без ограничения от эффективности, селектируемости, индуцируемости, необходимого уровня экспрессии и предпочтительной экспрессии в определенных клетках или тканях. Обычной задачей для специалиста в данной области техники является модулирование экспрессии кодирующей последовательности посредством правильного выбора регуляторных участков и их размещения по отношению к кодирующей последовательности. Транскрипцию полинуклеотида можно модулировать сходным образом. Некоторые подходящие регуляторные участки инициируют транскрипцию исключительно или преимущественно в определенных типах клеток. Способы идентификации и установления характеристик регуляторных участков в геномной ДНК растений хорошо известны в данной области техники.The choice of regulatory regions to be included in a recombinant construct depends on several factors, including, without limitation, potency, selectivity, inducibility, desired level of expression, and preferential expression in certain cells or tissues. It is a common task for a person skilled in the art to modulate the expression of a coding sequence through the correct selection of regulatory regions and their placement in relation to the coding sequence. Transcription of a polynucleotide can be modulated in a similar manner. Some suitable regulatory sites initiate transcription exclusively or predominantly in certain cell types. Methods for identifying and characterizing regulatory regions in plant genomic DNA are well known in the art.
Подходящие промоторы включают тканеспецифичные промоторы, распознаваемые тканеспецифичными факторами, присутствующими в разных тканях или типах клеток (например, специфичные для корня промоторы, специфичные для побега промоторы, специфичные для ксилемы промоторы), или присутствующими на различных стадиях развития, или присутствующими в ответ на разные условия окружающей среды. Подходящие промоторы включают конститутивные промоторы, которые могут быть активированы в большинстве типов клеток, не требуя специфических индукторов. Примеры подходящих промоторов для управления выработкой RNAi-полинуклеотида включают промотор 35S вируса мозаики цветной капусты (CaMV/35S), SSU, OCS, lib4, usp, STLS1, B33, nos или промоторы гена убиквитина или гена фазеолина. Специалисты в данной области техники могут создавать множество вариантов рекомбинантных промоторов. Suitable promoters include tissue-specific promoters recognized by tissue-specific factors present in different tissues or cell types (eg, root-specific promoters, shoot-specific promoters, xylem-specific promoters), or present at different stages of development, or present in response to different conditions. environment. Suitable promoters include constitutive promoters that can be activated in most cell types without the need for specific inducers. Examples of suitable promoters for directing RNAi polynucleotide production include the cauliflower mosaic virus (CaMV/35S) 35S promoter, SSU, OCS, lib4, usp, STLS1, B33, nos, or ubiquitin or phaseolin gene promoters. Those skilled in the art can create many variants of recombinant promoters.
Тканеспецифичные промоторы представляют собой элементы управления транскрипцией, которые активны только в определенных клетках или тканях в определенные моменты времени в ходе развития растений, например в вегетативных тканях или репродуктивных тканях. Тканеспецифичная экспрессия может быть преимущественной, например, если предпочтительной является экспрессия полинуклеотидов в определенных тканях. Примеры тканеспецифичных промоторов, находящихся под контролем в ходе развития, включают промоторы, которые могут инициировать транскрипцию только (или в основном только) в определенных тканях, таких как вегетативные ткани, например корни или листья, или репродуктивные ткани, такие как плоды, семяпочки, семена, пыльца, тычинки, цветки или любая эмбриональная ткань. Промоторы, специфичные для репродуктивных тканей, могут являться, например, специфичными для пыльника, специфичными для семяпочки, специфичными для зародыша, специфичными для эндосперма, специфичными для интегумента, специфичными для семени и кожуры семени, специфичными для пыльцы, специфичными для лепестка, специфичными для чашелистика или для комбинаций таковых. Tissue-specific promoters are transcriptional controls that are active only in certain cells or tissues at certain points in time during plant development, such as in vegetative tissues or reproductive tissues. Tissue-specific expression may be preferential, for example, if expression of polynucleotides in certain tissues is preferred. Examples of tissue-specific promoters under developmental control include promoters that can initiate transcription only (or mostly only) in certain tissues, such as vegetative tissues, e.g. roots or leaves, or reproductive tissues such as fruits, ovules, seeds, pollen, stamens, flowers or any embryonic tissue. Promoters specific for reproductive tissues can be, for example, anther specific, ovule specific, embryo specific, endosperm specific, integument specific, seed and seed coat specific, pollen specific, petal specific, sepal specific. or for combinations thereof.
Подходящие специфичные для листа промоторы включают промотор гена пируватортофосфатдикиназы (PPDK) из C4-растения (кукурузы), промотор cab-m1Ca+2 из кукурузы, промотор родственных myb генов из Arabidopsis thaliana (Atmyb5), промоторы рибулозобифосфаткарбоксилазы (RBCS) (например, генов томата RBCS 1, RBCS2 и RBCS3A, экспрессируемых в листьях и выращенных на свету саженцах, RBCS1 и RBCS2, экспрессируемых в развивающихся плодах томата, или промотор гена рибулозобифосфаткарбоксилазы, экспрессируемый на высоких уровнях почти исключительно в мезофильных клетках листовых пластинок и листовых пазух). Suitable leaf-specific promoters include the pyruvatortophosphate dikinase (PPDK) gene promoter from a C4 plant (maize), the cab-m1Ca+2 promoter from maize, the myb-related genes promoter from Arabidopsis thaliana (Atmyb5), ribulose biphosphate carboxylase (RBCS) promoters (e.g., tomato genes). RBCS1, RBCS2 and RBCS3A expressed in leaves and light-grown seedlings, RBCS1 and RBCS2 expressed in developing tomato fruits, or the ribulose bisphosphate carboxylase gene promoter expressed at high levels almost exclusively in mesophilic cells of leaf blades and leaf axils).
Подходящие специфичные для стареющих тканей промоторы включают промотор из томата, активный во время созревания плодов, старения и опадения листьев, промотор гена, кодирующего цистеиновую протеазу маиса, промотор 82E4 и промотор генов SAG. Можно применять подходящие специфичные для пыльника промоторы. Можно выбрать подходящие предпочтительные для корней промоторы, известные специалистам в данной области техники. Подходящие промоторы для экспрессии предпочтительно в семенах включают как специфичные для семян промоторы (промоторы, активные в процессе развития семян, такие как промоторы запасных полипептидов семян), так и промоторы прорастающих семян (промоторы, активные во время прорастания семян). Такие предпочтительные для семян промоторы включают Cim1 (цитокинин-индуцированный сигнал); cZ19B1 (19 кДa зеин кукурузы); milps (миоинозитол-1-фосфатсинтаза); mZE40-2, также известный как Zm-40; nuclc; и celA (целлюлозосинтаза). Промотор гена гамма-зеина представляет собой специфичный для эндосперма промотор. Промотор гена Glob-1 представляет собой специфичный для зародыша промотор. Для двудольных растений специфичные для семян промоторы включают промотор гена бета-фазеолина фасоли, гена напина, генаβ-конглицинина, гена лектина сои, гена круциферина и т.п. Для однодольных растений специфичные для семян промоторы включают промотор гена зеина кукурузы с молекулярной массой 15 кДа, промотор гена зеина с молекулярной массой 22 кДа, промотор гена зеина с молекулярной массой 27 кДа, промотор гена g-зеина, промотор гена гамма-зеина с молекулярной массой 27 кДа (такой как промотор gzw64A, см. номер доступа S78780 в Genbank), промотор гена waxy, промотор гена shrunken 1, промотор гена shrunken 2, промотор гена глобулина 1 (см. номер доступа L22344 в Genbank), промотор гена Itp2, промотор гена cim1, промоторы генов end1 и end2 кукурузы, промотор гена nuc1, промотор гена Zm40, промотор гена eep1 и eep2; промотор гена lec1, промотор гена тиоредоксина H; промотор гена mlip15, промотор гена PCNA2 и промотор гена shrunken-2.Suitable aging tissue-specific promoters include the promoter from tomato, active during fruit ripening, senescence and leaf abscission, the promoter of the gene encoding maize cysteine protease, the 82E4 promoter, and the promoter of the SAG genes. Suitable anther-specific promoters can be used. Suitable root-preferred promoters known to those skilled in the art can be selected. Suitable promoters for expression preferably in seeds include both seed-specific promoters (promoters active during seed development, such as seed storage polypeptide promoters) and germinating seed promoters (promoters active during seed germination). Such seed-preferred promoters include Cim1 (cytokinin-induced signal); cZ19B1 (19 kDa maize zein); milps (myoinositol-1-phosphate synthase); mZE40-2, also known as Zm-40; nuclc; and celA (cellulose synthase). The gamma-zein gene promoter is an endosperm-specific promoter. The Glob-1 gene promoter is a germ-specific promoter. For dicotyledonous plants, seed-specific promoters include the promoter of the bean bean phaseolin gene, the napin gene, the β-conglycinin gene, the soybean lectin gene, the cruciferin gene, and the like. For monocots, seed-specific promoters include the 15 kD maize zein gene promoter, the 22 kD zein gene promoter, the 27 kD zein gene promoter, the g-zein gene promoter, the molecular weight gamma-zein gene promoter 27 kDa (such as gzw64A promoter, see Genbank accession number S78780), waxy gene promoter, shrunken 1 gene promoter, shrunken 2 gene promoter, globulin 1 gene promoter (see Genbank accession number L22344), Itp2 gene promoter, promoter cim1 gene, maize end1 and end2 gene promoters, nuc1 gene promoter, Zm40 gene promoter, eep1 and eep2 gene promoter; lec1 gene promoter, thioredoxin H gene promoter; mlip15 gene promoter, PCNA2 gene promoter, and shrunken-2 gene promoter.
Примеры индуцируемых промоторов включают промоторы, реагирующие на воздействие патогенов, анаэробные условия, повышенную температуру, свет, засуху, низкую температуру или высокую концентрацию солей. Патоген-индуцируемые промоторы включают промоторы связанных с патогенезом полипептидов (PR-полипептидов), индуцирование которых происходит после инфицирования патогеном (например, PR-полипептиды, SAR-полипептиды, бета-1,3-глюканаза, хитиназа). Examples of inducible promoters include those responsive to pathogens, anaerobic conditions, heat, light, drought, low temperature, or high salt concentration. Pathogen-inducible promoters include promoters of pathogenesis-associated polypeptides (PR polypeptides) that are induced after infection with a pathogen (eg, PR polypeptides, SAR polypeptides, beta-1,3-glucanase, chitinase).
Дополнительно к промоторам растений другие подходящие промоторы могут иметь бактериальное происхождение, например промотор гена октопинсинтазы, промотор гена нопалинсинтазы и другие промоторы, полученные из Ti-плазмид, или они могут быть получены из вирусных промоторов (например, промоторов 35S и 19S РНК вируса мозаики цветной капусты (CaMV), конститутивных промоторов вируса табачной мозаики, промоторов 19S и 35S вируса мозаики цветной капусты (CaMV) или промотора 35S вируса мозаики норичника). In addition to plant promoters, other suitable promoters may be of bacterial origin, such as the octopine synthase gene promoter , the nopaline synthase gene promoter, and other Ti plasmid-derived promoters, or they may be derived from viral promoters (e.g., the cauliflower mosaic virus 35S and 19S RNA promoters). (CaMV), constitutive promoters of tobacco mosaic virus, 19S and 35S promoters of cauliflower mosaic virus (CaMV), or 35S promoter of boletus mosaic virus).
Подходящие способы введения полинуклеотидов в клетки растений и последующего встраивания в геном растения включают микроинъекцию (Biotechniques (1986) 4:320-334), электропорацию (Proc. Natl. Acad. Sci. USA (1986) 83:5602-5606), трансформацию, опосредованную Agrobacterium (US5981840 и US5563055), прямой перенос генов (EMBO J. (1984) 3:2717-2722) и баллистическое ускорение частиц (US4945050, US5879918, US5886244, US5932782; Plant Cell, Tissue, and Organ Culture: Fundamental Methods, ed. Gamborg and Phillips (Springer-Verlag, Berlin) (1995); и Biotechnology (1988) 6:923-926).Suitable methods for introducing polynucleotides into plant cells and then inserting them into the plant genome include microinjection ( Biotechniques (1986) 4:320-334), electroporation ( Proc. Natl. Acad. Sci. USA (1986) 83:5602-5606), transformation, Agrobacterium mediated (US5981840 and US5563055), direct gene transfer ( EMBO J. (1984) 3:2717-2722) and ballistic particle acceleration (US4945050, US5879918, US5886244, US5932782; Plant Cell, Tissue, and Organ Culture: Fundamental Methods, ed Gamborg and Phillips (Springer-Verlag, Berlin) (1995) and Biotechnology (1988) 6:923-926).
МутацияMutation
Раскрыты растение или клетка растения, содержащие мутацию в одном или более полинуклеотидах или полипептидах, описанных в данном документе, где указанная мутация приводит к модуляции функции или активности NtSUS или полипептида (полипептидов), кодируемого(кодируемых) ими. Disclosed is a plant or plant cell containing a mutation in one or more of the polynucleotides or polypeptides described herein, wherein said mutation results in modulation of the function or activity of NtSUS or the polypeptide(s) encoded by them.
Представлен способ модулирования уровня полипептида NtSUS в (подвергнутом сушке) растении или в (подвергнутом сушке) растительном материале, при этом указанный способ включает введение в геном указанного растения одной или более мутаций, которые модулируют экспрессию по меньшей мере одного гена NtSUS, где указанный по меньшей мере один ген выбран из последовательностей в соответствии с настоящим изобретением. A method is provided for modulating the level of an NtSUS polypeptide in a (dried) plant or in a (dried) plant material, said method comprising introducing into the genome of said plant one or more mutations that modulate the expression of at least one NtSUS gene, wherein said at least at least one gene is selected from sequences in accordance with the present invention.
Также представлен способ идентификации растения с модулированными уровнями редуцирующих сахаров, при этом указанный способ включает скрининг образца полинуклеотида из представляющего интерес растения в отношении наличия одной или более мутаций в последовательностях в соответствии с настоящим изобретением, и необязательно сопоставление идентифицированной мутации (мутаций) с мутацией (мутациями), которая(которые), как известно, модулирует(модулируют) уровни редуцирующих сахаров. Also provided is a method for identifying a plant with modulated levels of reducing sugars, said method comprising screening a polynucleotide sample from a plant of interest for the presence of one or more mutations in sequences in accordance with the present invention, and optionally matching the identified mutation(s) to the mutation(s). ), which(are) known to modulate(modulate) levels of reducing sugars.
Также раскрыты растение или клетка растения, которые являются гетерозиготными или гомозиготными по одной или более мутациям в гене NtSUS в соответствии с настоящим изобретением, при этом указанная мутация приводит к модулированной экспрессии гена, или функции, или активности полипептида NtSUS, кодируемого им.Also disclosed is a plant or plant cell that is heterozygous or homozygous for one or more mutations in the NtSUS gene according to the present invention, said mutation resulting in modulated gene expression or function or activity of the NtSUS polypeptide encoded by it.
Для комбинирования мутаций в одном растении можно применять целый ряд подходов, в том числе половое скрещивание. Растение, характеризующееся наличием одной или более благоприятных мутаций в гетерозиготном или гомозиготном состоянии в гене в соответствии с настоящим изобретением, которые модулируют экспрессию гена или функцию или активность полипептида, кодируемого таковым, можно скрещивать с растением, характеризующимся наличием одной или более благоприятных мутаций в гетерозиготном или гомозиготном состоянии в одном или более генах, которые модулируют их экспрессию или функцию или активность полипептида, кодируемого таковыми. В одном варианте осуществления скрещивания проводят для введения одной или более благоприятных мутаций в гетерозиготном или гомозиготном состоянии в ген в соответствии с настоящим изобретением в одном и том же растении. A number of approaches can be used to combine mutations in a single plant, including sexual crossing. A plant characterized by the presence of one or more favorable mutations in the heterozygous or homozygous state in a gene according to the present invention that modulate the expression of the gene or the function or activity of the polypeptide encoded by such can be crossed with a plant characterized by the presence of one or more favorable mutations in the heterozygous or homozygous state in one or more genes that modulate their expression or the function or activity of the polypeptide encoded by them. In one embodiment, crosses are carried out to introduce one or more favorable mutations in a heterozygous or homozygous state in a gene in accordance with the present invention in the same plant.
Функция или активность одного или более полипептидов по настоящему изобретению в растении являются повышенными или пониженными, если функция или активность являются более низкими или более высокими, чем функция или активность того же полипептида(полипептидов) в растении, которое не было модифицировано для подавления функции или активности этого полипептида, и которое культивировали, собирали и подвергали сушке с применением тех же протоколов. The function or activity of one or more polypeptides of the present invention in a plant is increased or decreased if the function or activity is lower or higher than the function or activity of the same polypeptide(s) in a plant that has not been modified to suppress the function or activity of this polypeptide, and which was cultured, harvested and dried using the same protocols.
В некоторых вариантах осуществления мутацию(мутации) вводят в растение или клетку растения с применением подхода с обеспечением мутагенеза, и введенную мутацию идентифицируют или подвергают отбору с применением способов, известных специалистам в данной области техники, таких как анализ методом Саузерн-блоттинга, секвенирование ДНК, ПЦР-анализ или фенотипический анализ. Мутации, которые влияют на экспрессию гена или которые нарушают функцию кодируемого полипептида, можно определять с применением способов, хорошо известных из уровня техники. Инсерционные мутации в экзонах гена, как правило, в результате приводят к образованию нефункциональных мутантных вариантов. Мутации по консервативным остаткам могут быть особенно эффективными для подавления метаболической функции кодируемого полипептида. Например, понятно, что мутация в одном или более высококонсервативных участках будет, очевидно, обеспечивать корректировку функции полипептида, в то время как мутация вне этих высококонсервативных участков будет, очевидно, оказывать незначительное влияния на функцию полипептида или не будет влиять на него. Дополнительно мутация в одном нуклеотиде может приводить к возникновению стоп-кодона, наличие которого в результате приведет к получению усеченного полипептида и, в зависимости от степени усечения, потере функции.In some embodiments, the mutation(s) are introduced into a plant or plant cell using a mutagenesis enabling approach, and the introduced mutation is identified or selected using methods known to those skilled in the art, such as Southern blot analysis, DNA sequencing, PCR analysis or phenotypic analysis. Mutations that affect gene expression or that disrupt the function of the encoded polypeptide can be determined using methods well known in the art. Insertional mutations in exons of a gene, as a rule, result in the formation of non-functional mutant variants. Mutations at conserved residues may be particularly effective in suppressing the metabolic function of the encoded polypeptide. For example, it is understood that a mutation in one or more of the highly conserved regions will likely provide an adjustment to the function of the polypeptide, while a mutation outside of these highly conserved regions will likely have little or no effect on the function of the polypeptide. Additionally, a single nucleotide mutation can result in a stop codon, the presence of which will result in a truncated polypeptide and, depending on the degree of truncation, loss of function.
Также раскрыты способы получения мутантных полинуклеотидов и полипептидов. Любое представляющее интерес растение, в том числе клетку растения или растительный материал, можно генетически модифицировать различными способами, с помощью которых, как известно, индуцируют мутагенез, в том числе сайт-направленный мутагенез, олигонуклеотид-направленный мутагенез, индуцируемый химическими соединениями мутагенез, индуцируемый ионизирующим излучением мутагенез, мутагенез с применением модифицированных оснований, мутагенез с применением ДНК-дуплекса с гэпом, мутагенез с двунитевыми разрывами, мутагенез с применением линий-хозяев с нарушенной репарацией, мутагенез посредством синтеза полного гена, перетасовка ДНК и другие эквивалентные способы.Methods for producing mutant polynucleotides and polypeptides are also disclosed. Any plant of interest, including a plant cell or plant material, can be genetically modified in a variety of ways known to induce mutagenesis, including site-directed mutagenesis, oligonucleotide-directed mutagenesis, chemical compound-induced mutagenesis, ionizing agent-induced mutagenesis. radiation mutagenesis, mutagenesis using modified bases, mutagenesis using DNA gap duplex, double-strand break mutagenesis, mutagenesis using repair-disrupted host lines, mutagenesis by whole gene synthesis, DNA shuffling, and other equivalent methods.
Также раскрыты фрагменты полинуклеотидов и полипептидов. Фрагменты полинуклеотида могут кодировать фрагменты полипептида, которые сохраняют биологическую функцию нативного полипептида и, следовательно, задействованы в сети транспортировки метаболитов в растении. В качестве альтернативы, фрагменты полинуклеотида, которые являются применимыми в качестве зондов для гибридизации или ПЦР-праймеров, как правило, не кодируют фрагментов полипептида, сохраняющих биологическую функцию. Кроме того, фрагменты раскрытых полинуклеотидов включают такие фрагменты, которые могут быть собраны в рекомбинантные конструкции, как обсуждалось в данном документе. Фрагменты полинуклеотида могут находиться в диапазоне от по меньшей мере приблизительно 25 нуклеотидов, приблизительно 50 нуклеотидов, приблизительно 75 нуклеотидов, приблизительно 100 нуклеотидов, приблизительно 150 нуклеотидов, приблизительно 200 нуклеотидов, приблизительно 250 нуклеотидов, приблизительно 300 нуклеотидов, приблизительно 400 нуклеотидов, приблизительно 500 нуклеотидов, приблизительно 600 нуклеотидов, приблизительно 700 нуклеотидов, приблизительно 800 нуклеотидов, приблизительно 900 нуклеотидов, приблизительно 1000 нуклеотидов, приблизительно 1100 нуклеотидов, приблизительно 1200 нуклеотидов, приблизительно 1300 нуклеотидов или приблизительно 1400 нуклеотидов и до полноразмерного полинуклеотида, кодирующего полипептиды, описанные в данном документе. Фрагменты полипептида могут находиться в диапазоне от по меньшей мере приблизительно 25 аминокислот, приблизительно 50 аминокислот, приблизительно 75 аминокислот, приблизительно 100 аминокислот, приблизительно 150 аминокислот, приблизительно 200 аминокислот, приблизительно 250 аминокислот, приблизительно 300 аминокислот, приблизительно 400 аминокислот, приблизительно 500 аминокислот и до полноразмерного полипептида, описанного в данном документе. Мутантные варианты полипептида можно применять для создания мутантных, не встречающихся в природе или трансгенных растений (например, мутантных, не встречающихся в природе, трансгенных, созданных человеком или полученных с помощью методик генной инженерии растений) или клеток растения, содержащих один или более мутантных вариантов полипептида. Предпочтительно, мутантные варианты полипептида сохраняют функцию полипептида, не подвергнутого мутированию. Функция мутантного варианта полипептида может быть выше, ниже или приблизительно такой же, как у полипептида, не подвергнутого мутированию. Also disclosed are fragments of polynucleotides and polypeptides. Polynucleotide fragments may encode polypeptide fragments that retain the biological function of the native polypeptide and are therefore involved in the plant's metabolite transport network. Alternatively, polynucleotide fragments that are useful as hybridization probes or PCR primers generally do not encode polypeptide fragments that retain biological function. In addition, fragments of the disclosed polynucleotides include those fragments that can be assembled into recombinant constructs, as discussed herein. Polynucleotide fragments can range from at least about 25 nucleotides, about 50 nucleotides, about 75 nucleotides, about 100 nucleotides, about 150 nucleotides, about 200 nucleotides, about 250 nucleotides, about 300 nucleotides, about 400 nucleotides, about 500 nucleotides, about 600 nucleotides, about 700 nucleotides, about 800 nucleotides, about 900 nucleotides, about 1000 nucleotides, about 1100 nucleotides, about 1200 nucleotides, about 1300 nucleotides, or about 1400 nucleotides, and up to a full-length polynucleotide encoding the polypeptides described herein. Polypeptide fragments can range from at least about 25 amino acids, about 50 amino acids, about 75 amino acids, about 100 amino acids, about 150 amino acids, about 200 amino acids, about 250 amino acids, about 300 amino acids, about 400 amino acids, about 500 amino acids, and to the full length polypeptide described herein. Mutant variants of a polypeptide can be used to generate mutant, non-naturally occurring or transgenic plants (e.g., mutant, non-naturally occurring, transgenic, human-generated, or genetically engineered plants) or plant cells containing one or more mutant polypeptide variants. . Preferably, mutant variants of the polypeptide retain the function of the unmutated polypeptide. The function of a mutant polypeptide variant may be higher, lower, or approximately the same as that of an unmutated polypeptide.
Мутации в полинуклеотидах и полипептидах, описанных в данном документе, могут включать внесенные человеком мутации, или искусственные мутации, или мутации, созданные с помощью генной инженерии. Мутации в полинуклеотидах и полипептидах, описанных в данном документе, могут представлять собой мутации, которые получены или которые можно получить посредством способа, который включает стадию манипуляции in vitro или in vivo. Мутации в полинуклеотидах и полипептидах, описанных в данном документе, могут представлять собой мутации, которые получены или которые можно получить посредством способа, который предусматривает вмешательство человека. Mutations in the polynucleotides and polypeptides described herein may include human-made mutations, or artificial mutations, or genetically engineered mutations. Mutations in the polynucleotides and polypeptides described herein may be mutations that are made or can be made by a method that includes an in vitro or in vivo manipulation step. Mutations in the polynucleotides and polypeptides described herein may be mutations that are made or that can be made by a method that involves human intervention.
Способы, с помощью которых вводят мутацию случайным образом в полинуклеотид, могут включать химический мутагенез и радиационный мутагенез. Химический мутагенез предусматривает применение экзогенно добавляемых химических веществ, таких как мутагенные, тератогенные или канцерогенные органические соединения, для индуцирования мутаций. Для создания мутаций можно применять мутагены, которые создают главным образом точечные мутации и короткие делеции, вставки, миссенс-мутации, простые повторяющиеся последовательности, трансверсии и/или транзиции, в том числе химические мутагены и излучение. Мутагены включают этилметансульфонат, метилметансульфонат, N-этил-N-нитрозомочевину, триэтилмеламин, N-метил-N-нитрозомочевину, прокарбазин, хлорамбуцил, циклофосфамид, диэтилсульфат, акриламидный мономер, мельфалан, азотистый иприт, винкристин, диметилнитрозамин, N-метил-N'-нитро-нитрозогуанидин, нитрозогуанидин, 2-аминопурин, 7,12-диметил-бенз(a)антрацен, этиленоксид, гексаметилфосфорамид, бисульфан, диэпоксиалканы (диэпоксиоктан, диэпоксибутан и т.п.), 2-метокси-6-хлор-9[3-(этил-2-хлорэтил)аминопропиламино]акридина дигидрохлорид и формальдегид. Methods by which a mutation is randomly introduced into a polynucleotide may include chemical mutagenesis and radiation mutagenesis. Chemical mutagenesis involves the use of exogenously added chemicals such as mutagenic, teratogenic, or carcinogenic organic compounds to induce mutations. To create mutations, mutagens can be used that create primarily point mutations and short deletions, insertions, missense mutations, simple repeat sequences, transversions and/or transitions, including chemical mutagens and radiation. Mutagens include ethyl methanesulfonate, methyl methanesulfonate, N-ethyl-N-nitrosourea, triethylmelamine, N-methyl-N-nitrosourea, procarbazine, chlorambucil, cyclophosphamide, diethyl sulfate, acrylamide monomer, melphalan, nitrogen mustard, vincristine, dimethylnitrosamine, N-methyl-N' -nitro-nitrosoguanidine, nitrosoguanidine, 2-aminopurine, 7,12-dimethyl-benz(a)anthracene, ethylene oxide, hexamethylphosphoramide, bisulfan, diepoxyalkanes (diepoxyoctane, diepoxybutane, etc.), 2-methoxy-6-chloro-9 [3-(ethyl-2-chloroethyl)aminopropylamino]acridine dihydrochloride and formaldehyde.
Также предусмотрены спонтанные мутации в локусе, которые могут не быть непосредственно вызванными мутагеном, при условии, что они приводят к возникновению необходимого фенотипа. Подходящие мутагенные средства могут также включать, например, ионизирующее излучение, такое как рентгеновское излучение, гамма-излучение, излучение быстрых нейтронов и ультрафиолетовое излучение. Дозу мутагенного химического вещества или излучения определяют экспериментально для каждого типа ткани растения таким образом, чтобы получить частоту мутаций, которая ниже порогового уровня, характеризующегося летальностью или репродуктивной стерильностью. Любой способ получения полинуклеотида растения, известный специалистам в данной области техники, можно применять для получения полинуклеотида растения для скрининга в отношении мутаций. Also contemplated are spontaneous mutations at the locus, which may not be directly caused by the mutagen, provided that they result in the desired phenotype. Suitable mutagenic agents may also include, for example, ionizing radiation such as x-rays, gamma rays, fast neutron radiation and ultraviolet radiation. The dose of the mutagenic chemical or radiation is determined experimentally for each type of plant tissue so as to obtain a mutation rate that is below a threshold level characterized by lethality or reproductive sterility. Any method for obtaining a plant polynucleotide known to those skilled in the art can be used to obtain a plant polynucleotide for mutation screening.
Способ мутации может включать одну или более стадий скрещивания растений. The mutation method may include one or more plant crossing steps.
После внесения мутации можно провести скрининг для идентификации мутаций, которые обеспечивают возникновение генов с преждевременными стоп-кодонами или иным образом нефункциональных генов. После внесения мутации можно провести скрининг для идентификации мутаций, которые обеспечивают возникновение функциональных генов, которые способны экспрессироваться на повышенных или пониженных уровнях. Скрининг в отношении мутантных вариантов можно выполнять с помощью секвенирования, или путем применения одного или более зондов или праймеров, специфичных для данного гена или полипептида. В полинуклеотидах можно также обеспечивать возникновение конкретных мутаций, которые могут в результате приводить к модулированию экспрессии гена, модулированию стабильности мРНК или модулированию стабильности полипептида. В данном документе такие растения называются «не встречающимися в природе» или «мутантными» растениями. Как правило, мутантные или не встречающиеся в природе растения содержат по меньшей мере часть чужеродного, или синтетического, или созданного человеком нуклеотида (например, ДНК или РНК), которая не присутствовала в растении до проведения с ним манипуляций. Чужеродный нуклеотид может представлять собой один нуклеотид, два или более нуклеотидов, два или более смежных нуклеотидов или два или более несмежных нуклеотидов, как, например, по меньшей мере 10, 20, 30, 40, 50,100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400 или 1500 или больше смежных или несмежных нуклеотидов.Once a mutation has been introduced, screening can be performed to identify mutations that give rise to genes with premature stop codons or otherwise non-functional genes. Once a mutation has been introduced, screening can be performed to identify mutations that give rise to functional genes that are capable of being expressed at increased or decreased levels. Screening for mutant variants can be performed by sequencing, or by using one or more probes or primers specific for a given gene or polypeptide. Polynucleotides can also be engineered to generate specific mutations that can result in modulation of gene expression, modulation of mRNA stability, or modulation of polypeptide stability. In this document, such plants are referred to as "non-naturally occurring" or "mutant" plants. Typically, mutant or non-naturally occurring plants contain at least a portion of the foreign or synthetic or human-made nucleotide (eg, DNA or RNA) that was not present in the plant prior to being manipulated. The foreign nucleotide may be one nucleotide, two or more nucleotides, two or more contiguous nucleotides, or two or more non-contiguous nucleotides such as at least 10, 20, 30, 40, 50,100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400 or 1500 or more contiguous or non-contiguous nucleotides.
Трансгеника и редактирование генаTransgenics and gene editing
Помимо осуществления мутагенеза композиции, которые могут модулировать экспрессию, или функцию, или активность одного или более из полинуклеотидов NtSUS или полипептидов, кодируемых ими, включают специфичные в отношении последовательности полинуклеотиды, которые могут нарушать транскрипцию одного или более эндогенного(эндогенных) гена(генов); специфичные в отношении последовательности полинуклеотиды, которые могут нарушать трансляцию РНК-транскриптов (например, двухнитевые РНК, siRNA, рибозимы); специфичные в отношении последовательности полинуклеотиды, которые могут нарушать стабильность одного или более полипептидов; специфичные в отношении последовательности полинуклеотиды, которые могут нарушать ферментативную функцию одного или более полипептидов или функцию связывания одного или более полипептидов с субстратами или регуляторными полипептидами; антитела, которые проявляют специфичность в отношении одного или более полипептидов; низкомолекулярные соединения, которые могут нарушать стабильность одного или более полипептидов, или ферментативную функцию одного или более полипептидов, или функцию связывания одного или более полипептидов; полипептиды с «цинковыми пальцами», которые связывают один или более полинуклеотидов; и мегануклеазы, которые оказывают воздействие на один или более полинуклеотидов. Технологии редактирования гена, генетические технологии редактирования и технологии редактирование генома хорошо известны в данной области техники.In addition to effecting mutagenesis, compositions that can modulate the expression or function or activity of one or more of the NtSUS polynucleotides or polypeptides encoded by them include sequence-specific polynucleotides that can disrupt the transcription of one or more endogenous gene(s); sequence-specific polynucleotides that can disrupt the translation of RNA transcripts (eg, double-stranded RNA, siRNA, ribozymes); sequence-specific polynucleotides that can disrupt the stability of one or more polypeptides; sequence-specific polynucleotides that can interfere with the enzymatic function of one or more polypeptides or the function of binding one or more polypeptides to substrates or regulatory polypeptides; antibodies that show specificity for one or more polypeptides; small molecule compounds that can interfere with the stability of one or more polypeptides, or the enzymatic function of one or more polypeptides, or the binding function of one or more polypeptides; zinc finger polypeptides that bind one or more polynucleotides; and meganucleases that act on one or more polynucleotides. Gene editing technologies, genetic editing technologies and genome editing technologies are well known in the art.
Нуклеазы с «цинковыми пальцами»Zinc finger nucleases
Полипептиды с «цинковыми пальцами» можно применять для модулирования экспрессии, или функции, или активности одного или более из полинуклеотидов NtSUS, описанных в данном документе. В различных вариантах осуществления последовательность геномной ДНК, содержащую часть или всю кодирующую последовательность полинуклеотида, модифицируют путем мутагенеза, опосредованного нуклеазой с «цинковыми пальцами». В последовательности геномной ДНК осуществляют поиск уникального сайта для связывания полипептида с «цинковыми пальцами». В качестве альтернативы, в последовательности геномной ДНК осуществляют поиск двух уникальных сайтов для связывания полипептида с «цинковыми пальцами», при этом оба сайта находятся на противоположных нитях и близко друг к другу, например на расстоянии 1, 2, 3, 4, 5, 6 или более пар оснований друг от друга. Соответственно, предусмотрены полипептиды с «цинковыми пальцами», которые связываются с полинуклеотидами. Zinc finger polypeptides can be used to modulate the expression or function or activity of one or more of the NtSUSα polynucleotides described herein. In various embodiments, a genomic DNA sequence containing part or all of the coding sequence of a polynucleotide is modified by zinc finger nuclease-mediated mutagenesis. In the genomic DNA sequence, a search is made for a unique site for binding the polypeptide to zinc fingers. Alternatively, the genomic DNA sequence is searched for two unique zinc finger binding sites for the polypeptide, with both sites on opposite strands and close to each other, e.g. 1, 2, 3, 4, 5, 6 apart. or more base pairs apart. Accordingly, zinc finger polypeptides are provided that bind to polynucleotides.
Полипептид с «цинковыми пальцами» можно сконструировать для распознавания выбранного сайта-мишени в гене. Полипептид с «цинковыми пальцами» может содержать любую комбинацию мотивов, полученных из природных ДНК-связывающих доменов с «цинковыми пальцами» и неприродных ДНК-связывающих доменов с «цинковыми пальцами» посредством усечения, или удлинения, или способа сайт-направленного мутагенеза в сочетании со способом отбора, таким как без ограничения отбор с помощью фагового дисплея, отбор с помощью бактериальной двугибридной системы или отбор с помощью бактериальной одногибридной системы. Термин «неприродный ДНК-связывающий домен с «цинковыми пальцами»» относится к ДНК-связывающему домену с «цинковыми пальцами», который связывает последовательность из трех пар оснований в полинуклеотиде-мишени и который не встречается в клетке или организме, содержащих полинуклеотид, который подлежит модификации. Способы разработки полипептида с «цинковыми пальцами», который связывает специфические полинуклеотиды, которые являются уникальными для целевого гена, известны из уровня техники. A zinc finger polypeptide can be designed to recognize a selected target site in a gene. A zinc finger polypeptide may comprise any combination of motifs derived from natural zinc finger DNA binding domains and non-natural zinc finger DNA binding domains by truncation or extension or a site-directed mutagenesis technique in combination with by a selection method such as, but not limited to, phage display selection, bacterial two-hybrid system selection, or bacterial single-hybrid system selection. The term "non-natural zinc finger DNA binding domain" refers to a zinc finger DNA binding domain that binds a three base pair sequence in a target polynucleotide and that does not occur in a cell or organism containing the polynucleotide to be modifications. Methods for designing a zinc finger polypeptide that binds specific polynucleotides that are unique to a target gene are known in the art.
В других вариантах осуществления может быть выбран полипептид с «цинковыми пальцами» для связывания с регуляторной последовательностью полинуклеотида. Более конкретно, регуляторная последовательность может содержать сайт инициации транскрипции, стартовый кодон, участок экзона, границу раздела экзон-интрон, терминатор или стоп-кодон. Соответственно, настоящее изобретение предусматривает мутантные, не встречающиеся в природе или трансгенные растение или клетки растения, полученные с помощью мутагенеза, опосредованного нуклеазой с «цинковыми пальцами», осуществленного вблизи или в пределах одного или более полинуклеотидов, описанных в данном документе, и способы получения таких растения или клетки растения с помощью мутагенеза, опосредованного нуклеазой с «цинковыми пальцами». Способы доставки полипептида с «цинковыми пальцами» и нуклеазы с «цинковыми пальцами» в растение подобны способам, описанным ниже для доставки мегануклеазы.In other embodiments, a zinc finger polypeptide can be selected for binding to a regulatory sequence of a polynucleotide. More specifically, the regulatory sequence may contain a transcription initiation site, a start codon, an exon region, an exon-intron interface, a terminator, or a stop codon. Accordingly, the present invention provides mutant, non-naturally occurring, or transgenic plant or plant cells obtained by zinc finger nuclease-mediated mutagenesis near or within one or more of the polynucleotides described herein, and methods for producing such plant or plant cells by zinc finger nuclease mediated mutagenesis. The methods for delivering the zinc finger polypeptide and the zinc finger nuclease to the plant are similar to those described below for delivery of the meganuclease.
МегануклеазыMeganucleases
В другом аспекте описаны способы получения мутантных, не встречающихся в природе, или трансгенных, или иным образом генетически модифицированных растений с применением мегануклеаз, таких как I-CreI. Встречающиеся в природе мегануклеазы, а также рекомбинантные мегануклеазы можно использовать для того, чтобы специфическим образом выполнять двухнитевой разрыв в одном сайте или в относительно небольшом числе сайтов в геномной ДНК растения для обеспечения разрушения одного или более полинуклеотидов NtSUS, описанных в данном документе. Мегануклеаза может представлять собой сконструированную мегануклеазу со скорректированными свойствами распознавания ДНК. Полипептиды мегануклеаз можно доставлять в клетки растения с помощью ряда разных механизмов, известных из уровня техники.In another aspect, methods are described for producing mutant, non-naturally occurring, or transgenic, or otherwise genetically modified plants using meganucleases such as I-CreI. Naturally occurring meganucleases, as well as recombinant meganucleases, can be used to specifically double-strand break at a single site, or at a relatively small number of sites, in a plant's genomic DNA to effect degradation of one or more of the NtSUSα polynucleotides described herein. The meganuclease may be an engineered meganuclease with adjusted DNA recognition properties. Meganuclease polypeptides can be delivered to plant cells by a number of different mechanisms known in the art.
Настоящее изобретение охватывает применение мегануклеаз для инактивации полинуклеотида(полинуклеотидов) NtSUS, описанного(описанных) в данном документе (или любой их комбинации, описанной в данном документе), в клетке растения или растении. В частности, в настоящем изобретении представлен способ инактивации полинуклеотида NtSUS в растении с применением мегануклеазы, включающий: (a) обеспечение клетки растения, содержащей полинуклеотид NtSUS, описанный в данном документе; (b) введение мегануклеазы или конструкции, кодирующей мегануклеазу, в указанную клетку растения и (c) обеспечение для мегануклеазы возможности в существенной степени инактивировать полинуклеотид(полинуклеотиды) NtSUS.The present invention encompasses the use of meganucleases to inactivate the NtSUSα polynucleotide(s) described herein (or any combination thereof described herein) in a plant cell or plant. In particular, the present invention provides a method for inactivating an NtSUS polynucleotide in a plant using a meganuclease, comprising: (a) providing a plant cell containing an NtSUS polynucleotide described herein; (b) introducing the meganuclease or construct encoding the meganuclease into said plant cell; and (c) allowing the meganuclease to substantially inactivate the NtSUS polynucleotide(s).
Мегануклеазы можно применять для расщепления по сайтам распознавания мегануклеазами в пределах кодирующих участков полинуклеотида. Такое расщепление часто приводит в результате к делеции ДНК в сайте распознавания мегануклеазой с последующей репарацией мутагенной ДНК путем соединения негомологичных концов. Такие мутации в кодирующей последовательности гена являются, как правило, достаточными для инактивации гена. Этот способ модификации клетки растения включает, во-первых, доставку кассеты экспрессии мегануклеазы в клетку растения с применением подходящего способа трансформации. Для достижения максимальной эффективности необходимо связать кассету экспрессии мегануклеазы с селектируемым маркером и отобрать успешно трансформированные клетки в присутствии селективного средства. Этот подход в результате приведет к интеграции кассеты экспрессии мегануклеазы в геном, что, однако, может быть нежелательным, если для растения возможно будет требоваться официальное разрешение. В таких случаях кассету экспрессии мегануклеазы (и связанный селектируемый маркерный ген) можно сегрегировать в последующих поколениях растения с применением общепринятых методик селекции. Meganucleases can be used to cleave at meganuclease recognition sites within the coding regions of a polynucleotide. Such cleavage often results in deletion of the DNA at the meganuclease recognition site, followed by repair of the mutagenic DNA by joining the non-homologous ends. Such mutations in the coding sequence of a gene are usually sufficient to inactivate the gene. This method for modifying a plant cell comprises, firstly, delivering a meganuclease expression cassette into the plant cell using a suitable transformation method. To achieve maximum efficiency, it is necessary to link the meganuclease expression cassette to a selectable marker and select successfully transformed cells in the presence of a selective agent. This approach will result in the integration of the meganuclease expression cassette into the genome, which, however, may be undesirable if the plant may require authorization. In such cases, the meganuclease expression cassette (and associated selectable marker gene) can be segregated in subsequent generations of the plant using conventional breeding techniques.
После доставки кассеты экспрессии мегануклеазы клетки растения выращивают, изначально, в условиях, которые являются типичными для конкретной процедуры трансформации, которую применяли. Это может означать выращивание трансформированных клеток на среде при температуре ниже 26°C, зачастую в темноте. Такие стандартные условия можно применять в течение некоторого периода времени, предпочтительно 1-4 дней, для обеспечения восстановления клетки растения после процесса трансформации. В любой момент после этого начального периода восстановления температуру роста можно повысить, чтобы стимулировать функцию сконструированной мегануклеазы с осуществлением расщепления и мутирования по сайту распознавания мегануклеазой. Following delivery of the meganuclease expression cassette, the plant cells are grown, initially, under conditions that are typical of the particular transformation procedure used. This may mean growing the transformed cells in a medium below 26°C, often in the dark. Such standard conditions can be applied over a period of time, preferably 1-4 days, to ensure the recovery of the plant cell after the transformation process. At any time after this initial recovery period, the growth temperature can be increased to stimulate the function of the engineered meganuclease to cleave and mutate at the meganuclease recognition site.
TALENTALEN
Один способ редактирования гена включает применение эффекторных нуклеаз, подобных активатору транскрипции (TALEN), которые индуцируют образование двунитевых разрывов, на которые клетка может отвечать посредством механизмов репарации. NHEJ возобновляет связь ДНК с обеих сторон двунитевого разрыва, где участок перекрывания последовательностей является очень маленьким или вовсе отсутствует, для обеспечения отжига. Этот механизм репарации индуцирует ошибки в геноме посредством вставки, или делеции, или хромосомной перестройки. Любые такие ошибки могут сделать продукты гена, закодированные в этом месте, не функциональными. Для определенных видов применения может потребоваться точное удаление полинуклеотида NtSUS из генома растения. Такие применения возможны с применением пары сконструированных мегануклеаз, каждая из которых расщепляет сайт распознавания мегануклеазой по обе стороны от предполагаемой делеции. Также можно применять TALEN, которые способны распознавать ген и связываться с ним и вводить двухнитевой разрыв в геном. Таким образом, в другом аспекте представлены способы получения мутантных, не встречающихся в природе или трансгенных, или иным образом генетически модифицированных растений, описанных в данном документе, с применением эффекторных нуклеаз TAL.One way to edit a gene involves the use of effector nucleases like transcription activator (TALEN), which induce the formation of double-strand breaks, to which the cell can respond through repair mechanisms. NHEJ reconnects DNA on both sides of the double strand break where there is very little or no sequence overlap to allow for annealing. This repair mechanism induces errors in the genome through insertion or deletion or chromosomal rearrangement. Any such errors may render the gene products encoded at that location non-functional. Certain applications may require precise removal of the NtSUS polynucleotide from the plant genome. Such applications are possible using a pair of engineered meganucleases, each of which cleaves a meganuclease recognition site on either side of the intended deletion. It is also possible to use TALENs, which are able to recognize and bind to a gene and introduce a double-strand break into the genome. Thus, in another aspect, methods are provided for producing mutant, non-naturally occurring or transgenic or otherwise genetically modified plants described herein using TAL effector nucleases.
CRISPR/CasCRISPR/Cas
Другой способ редактирования гена включает применение бактериальной системы CRISPR/Cas. Бактерии и архебактерии характеризуются наличием хромосомных элементов, называемых короткими палиндромными повторами, регулярно расположенными группами (CRISPR), которые являются частью адаптивной иммунной системы, защищающей от проникновения вирусной и плазмидной ДНК. В случае систем CRISPR типа II, CRISPR-РНК (crRNA) функционируют с трансактивирующей crRNA (tracrRNA) и CRISPR-ассоциированными (Cas) полипептидами с обеспечением внесения двунитевых разрывов в ДНК-мишень. Расщепление мишени с помощью Cas9 требует спаривания оснований crRNA и tracrRNA, а также спаривания оснований crRNA и ДНК-мишени. Распознавание мишени облегчается при наличии короткого мотива, называемого прилегающим к протоспейсеру мотивом (PAM), который соответствует последовательности NGG. Данную систему можно применять для редактирования генома. Cas9 обычно программируется двойной РНК, состоящей из crRNA и tracrRNA. Тем не менее, коровые компоненты этих РНК могут быть объединены в единую гибридную «направляющую РНК» для нацеливания Cas9. Использование некодирующей направляющей РНК для нацеливания на ДНК с целью сайт-специфического расщепления обещает быть значительно более простым, чем существующие технологии, такие как TALEN. При применении стратегии CRISPR/Cas перенацеливание нуклеазного комплекса требует только введения новой последовательности РНК, и нет необходимости в реконструировании специфичности факторов транскрипции на основе полипептида. Технология CRISPR/Cas была реализована у растений в соответствии со способом из международной заявки WO 2015/189693 A1, в которой раскрыта опосредованная вирусом платформа редактирования генома, которая является широко применимой для разных видов растений. Геном RNA2 вируса погремковости табака (TRV) был сконструирован для переноса и доставки направляющей РНК в растения Nicotiana benthamiana со сверхэкспрессией эндонуклеазы Cas9. В контексте настоящего изобретения направляющую РНК можно получать из любой из полинуклеотидных последовательностей NtSUS, раскрытых в данном документе, а также идеи из WO 2015/189693 A1 применяют для редактирования генома клетки растения и получения требуемого мутантного растения. Высокий темп развития технологии породил огромное разнообразие протоколов с широкой применяемостью на представителях царства растения, при этом эти протоколы были хорошо каталогизированы в целом ряде недавних научных обзорных статей (например, Plant Methods (2016) 12:8; и Front Plant Sci. (2016) 7: 506). Обзор систем CRISPR/Cas с особым упором на их применение у растений находится в Biotechnology Advances (2015) 33, 1, p41-52. Bortesi и Fischer также проводят сравнение между технологией CRISPR/Cas, нуклеазами с "цинковыми пальцами" и TALEN. Последние разработки для применения CRISPR/Cas в манипулировании геномами растений описаны в Acta Pharmaceutica Sinica B (2017) 7, 3, p292-302) и Curr. Op. in Plant Biol. (2017) 36, 1-8. Плазмиды на основе CRISPR/Cas9 для применения в растениях перечислены в «addgene», некоммерческом хранилище плазмид (addgene.org), и плазмиды на основе CRISPR/Cas являются коммерчески доступными. Another method of gene editing involves the use of the bacterial CRISPR/Cas system. Bacteria and archaebacteria are characterized by the presence of chromosomal elements called regularly spaced short palindromic repeats (CRISPR), which are part of the adaptive immune system that protects against viral and plasmid DNA entry. In the case of type II CRISPR systems, CRISPR RNAs (crRNA) function with transactivating crRNA (tracrRNA) and CRISPR-associated (Cas) polypeptides to introduce double-strand breaks into the target DNA. Cleavage of the target by Cas9 requires crRNA and tracrRNA base pairing as well as crRNA and target DNA base pairing. Target recognition is facilitated by the presence of a short motif, called the protospacer-adjacent motif (PAM), which corresponds to the NGG sequence. This system can be used for genome editing. Cas9 is usually programmed with a double RNA consisting of crRNA and tracrRNA. However, the core components of these RNAs can be combined into a single hybrid "guide RNA" to target Cas9. The use of non-coding guide RNA to target DNA for site-specific cleavage promises to be significantly simpler than existing technologies such as TALEN. With the CRISPR/Cas strategy, retargeting of the nuclease complex only requires the introduction of a new RNA sequence, and there is no need to reverse engineer the specificity of the transcription factors based on the polypeptide. CRISPR/Cas technology has been implemented in plants according to the method of WO 2015/189693 A1, which discloses a virus-mediated genome editing platform that is widely applicable to various plant species. Tobacco rattle virus (TRV) RNA2 genome was designed to carry and deliver guide RNA to Nicotiana benthamiana plants overexpressing Cas9 endonuclease. In the context of the present invention, a guide RNA can be derived from any of the NtSUSβ polynucleotide sequences disclosed herein, and the ideas from WO 2015/189693 A1 are used to edit the genome of a plant cell and obtain the desired plant mutant. The rapid pace of technology development has given rise to a huge variety of protocols with wide applicability across the plant kingdom, and these protocols have been well cataloged in a number of recent scientific review articles (e.g., Plant Methods (2016) 12:8; and Front Plant Sci. (2016) 7:506). A review of CRISPR/Cas systems with particular reference to their application in plants is found in Biotechnology Advances (2015) 33, 1, p41-52. Bortesi and Fischer are also making comparisons between CRISPR/Cas technology, zinc finger nucleases and TALEN. Recent developments for the application of CRISPR/Cas in the manipulation of plant genomes are described in Acta Pharmaceutica Sinica B (2017) 7, 3, p292-302) and Curr. Op. in Plant Biol. (2017) 36, 1-8. CRISPR/Cas9 based plasmids for use in plants are listed at "addgene", a non-commercial plasmid repository (addgene.org), and CRISPR/Cas9 based plasmids are commercially available.
Антисмысловая модификацияAntisense modification
Технология применения антисмысловых олигонуклеотидов представляет собой другой хорошо известный способ, который можно использовать для модулирования экспрессии полипептида NtSUS. Полинуклеотид гена NtSUS, который подлежит репрессии, клонируют и функционально связывают с регуляторным участком и последовательностью терминации транскрипции так, чтобы антисмысловая нить РНК транскрибировалась. Затем рекомбинантной конструкцией трансформируют клетку растения и получают антисмысловую нить РНК. Полинуклеотид не обязательно является полной последовательностью гена, подлежащего репрессии, но, как правило, является практически комплементарным по меньшей мере части смысловой нити гена, подлежащего репрессии. Antisense oligonucleotide technology is another well known method that can be used to modulate the expression of an NtSUS polypeptide. The NtSUS.beta . gene polynucleotide to be repressed is cloned and operably linked to a regulatory region and a transcription termination sequence so that the antisense RNA strand is transcribed. Then, a plant cell is transformed with a recombinant construct and an antisense RNA strand is obtained. The polynucleotide is not necessarily the complete sequence of the gene to be repressed, but is generally substantially complementary to at least a portion of the sense strand of the gene to be repressed.
Полинуклеотид может быть транскрибирован в рибозим или каталитическую РНК, которая влияет на экспрессию мРНК. Рибозимы можно разрабатывать таким образом, чтобы они специфически спаривались практически с любой целевой РНК и расщепляли фосфодиэфирный остов в определенном месте, тем самым функционально инактивируя целевую РНК. Гетерологичные полинуклеотиды могут кодировать рибозимы, разработанные таким образом, чтобы они расщепляли конкретные транскрипты мРНК, предотвращая таким образом экспрессию полипептида. Рибозимы типа hammerhead являются применимыми для разрушения конкретных мРНК, хотя можно применять различные рибозимы, которые расщепляют мРНК в последовательностях сайт-специфического распознавания. Рибозимы типа hammerhead расщепляют мРНК в местах, определяемых фланкирующими участками, которые образуют комплементарные пары оснований с мРНК-мишени. Единственным требованием является то, что РНК-мишень должна содержать полинуклеотид 5'-UG-3'. Конструирование и получение рибозимов типа hammerhead известно в данной области техники. Последовательности рибозимов типа hammerhead можно встраивать в стабильную РНК, такую как транспортная РНК (tRNA) для повышения эффективности расщепления in vivo.The polynucleotide can be transcribed into a ribozyme or catalytic RNA that affects the expression of the mRNA. Ribozymes can be designed to specifically pair with virtually any target RNA and cleave the phosphodiester backbone at a specific location, thereby functionally inactivating the target RNA. Heterologous polynucleotides may encode ribozymes designed to cleave specific mRNA transcripts, thus preventing expression of the polypeptide. Hammerhead-type ribozymes are useful for degrading specific mRNAs, although various ribozymes that cleave mRNAs at site-specific recognition sequences can be used. Hammerhead ribozymes cleave the mRNA at sites defined by flanking regions that form complementary base pairs with the target mRNA. The only requirement is that the target RNA must contain a 5'-UG-3' polynucleotide. The construction and production of hammerhead ribozymes is known in the art. Hammerhead ribozyme sequences can be inserted into stable RNA such as transfer RNA (tRNA) to increase the efficiency of in vivo cleavage.
В одном варианте осуществления специфичный в отношении последовательности полинуклеотид, который может нарушать трансляцию транскрипта(транскриптов) РНК, представляет собой интерферирующую РНК. РНК-интерференция или РНК-сайленсинг представляют собой эволюционно консервативный процесс, с помощью которого конкретные мРНК могут быть нацелены для ферментативного разрушения. Двунитевую РНК (двунитевую РНК) вводят в клетку или получают в клетке (например, вирус с двунитевой РНК или полинуклеотиды, представляющие собой интерферирующую РНК) для инициации пути интерферирующей РНК. Двунитевую РНК можно преобразовывать в несколько дуплексов малых интерферирующих РНК (siRNA) длиной 21-24 п.о. с помощью РНКаз III, которые представляют собой эндонуклеазы, специфичные к двунитевой РНК. Впоследствии, siRNA могут распознаваться индуцируемыми РНК комплексами сайленсинга, которые способствуют раскручиванию siRNA с помощью АТФ-зависимого процесса. Раскрученная антисмысловая нить siRNA направляет активированные РНК-индуцированные комплексы сайленсинга к мРНК, в отношении которой осуществлено нацеливание, которая содержит последовательность, комплементарную антисмысловой нити siRNA. мРНК, в отношении которой осуществлено нацеливание, и антисмысловая нить могут образовывать А-форму спирали, и большая бороздка А-формы спирали может распознаться активированными РНК-индуцированными комплексами сайленсинга. мРНК-мишень может расщепляться с помощью активированных РНК-индуцированных комплексов сайленсинга в одном сайте, определенном сайтом связывания 5'-конца нити siRNA. Активированные РНК-индуцированные комплексы сайленсинга могут повторно использоваться для катализа еще одного события расщепления. In one embodiment, the sequence-specific polynucleotide that can disrupt translation of the RNA transcript(s) is an interfering RNA. RNA interference or RNA silencing is an evolutionarily conserved process by which specific mRNAs can be targeted for enzymatic degradation. Double-stranded RNA (double-stranded RNA) is introduced into the cell or produced in the cell (for example, double-stranded RNA virus or interfering RNA polynucleotides) to initiate the interfering RNA pathway. Double-stranded RNA can be converted into multiple 21-24 bp small interfering RNA (siRNA) duplexes. using RNase III, which are endonucleases specific for double-stranded RNA. Subsequently, siRNAs can be recognized by RNA-induced silencing complexes that promote siRNA unwinding in an ATP-dependent process. The untwisted siRNA antisense strand directs activated RNA-induced silencing complexes to a targeted mRNA that contains a sequence complementary to the siRNA antisense strand. The targeted mRNA and the antisense strand can form an A-coil, and the major groove of the A-coil can be recognized by activated RNA-induced silencing complexes. The target mRNA can be cleaved by activated RNA-induced silencing complexes at a single site defined by the binding site of the 5'end of the siRNA strand. Activated RNA-induced silencing complexes can be reused to catalyze another cleavage event.
Векторы экспрессии на основе интерферирующей РНК могут содержать конструкции интерферирующей РНК, кодирующие полинуклеотиды интерферирующей РНК, которые осуществляют РНК-интерференцию путем понижения уровня экспрессии мРНК, пре-мРНК или родственных вариантов РНК. Векторы экспрессии могут содержать промотор, расположенный выше по последовательности и функционально связанный с конструкцией интерферирующей РНК, как дополнительно описано в данном документе. Векторы экспрессии на основе интерферирующей РНК могут содержать подходящий минимальный коровый промотор, представляющую интерес конструкцию интерферирующей РНК, расположенный выше по последовательности (5') регуляторный участок, расположенный ниже по последовательности (3') регуляторный участок, в том числе сигналы терминации транскрипции и полиаденилирования, и другие последовательности, известные специалистам в данной области техники, такие как различные селективные маркеры.Interfering RNA expression vectors may contain interfering RNA constructs encoding interfering RNA polynucleotides that mediate RNA interference by downregulating mRNA, pre-mRNA, or related RNA variants. Expression vectors may contain an upstream promoter operably linked to an interfering RNA construct, as further described herein. Interfering RNA expression vectors may contain a suitable minimal core promoter, an interfering RNA construct of interest, an upstream (5') regulatory region, a downstream (3') regulatory region, including transcription termination and polyadenylation signals, and other sequences known to those skilled in the art, such as various selectable markers.
Молекулы двунитевой РНК могут включать молекулы siRNA, собранные из отдельного олигонуклеотида в структуре стебель-петля, где самокомплементарные смысловую и антисмысловую участки молекулы siRNA соединены с помощью основанного на полинуклеотидах или не основанного на полинуклеотидах линкера (линкеров), а также кольцевую однонитевую РНК с двумя или более петлевыми структурами и стеблем, содержащую самокомплементарные смысловую и антисмысловую нити, где кольцевую РНК можно процессировать либо in vivo, либо in vitro с образованием активной молекулы siRNA, способной опосредовать интерферирующую РНК.Double-stranded RNA molecules may include siRNA molecules assembled from a single oligonucleotide in a stem-loop structure, where the self-complementary sense and antisense portions of the siRNA molecule are connected by polynucleotide-based or non-polynucleotide-based linker(s), as well as circular single-stranded RNA with two or more looped structures and a stem containing self-complementary sense and antisense strands, where the circular RNA can be processed either in vivo or in vitro to form an active siRNA molecule capable of mediating interfering RNA.
Также предусмотрено использование молекул малой шпилечной РНК. Они содержат специфичную антисмысловую последовательность в дополнение к обратно комплементарной (смысловой) последовательности, как правило, отделенной спейсером или последовательностью петли. Расщепление спейсера или петли обеспечивает образование молекулы однонитевой РНК и ее обратно комплементарной нити, так что их можно отжечь с образованием двунитевой молекулы РНК (необязательно с дополнительными стадиями обработки, которые могут в результате привести в результате к добавлению или удалению одного, двух, трех или более нуклеотидов с 3'-конца или 5'-конца одной или обеих нитей). Спейсер может иметь достаточную длину для обеспечения отжига антисмысловой и смысловой последовательностей и образования двунитевой структуры (или стебля) до расщепления спейсера (и необязательно последующих стадий обработки, которые могут в результате привести в результате к добавлению или удалению одного, двух, трех, четырех или более нуклеотидов с 3'-конца или с 5'-конца одной или обеих нитей). Спейсерная последовательность как правило представляет собой неродственный полинуклеотид, который находится между двумя комплементарными участками полинуклеотидов, которые после отжига с получением двунитевого полинуклеотида образуют малую шпилечную РНК. Спейсерная последовательность обычно содержит от приблизительно 3 до приблизительно 100 нуклеотидов.The use of small hairpin RNA molecules is also contemplated. They contain a specific antisense sequence in addition to a reverse complementary (sense) sequence, usually separated by a spacer or loop sequence. Cleavage of the spacer or loop provides a single-stranded RNA molecule and its reverse complementary strand so that they can be annealed to form a double-stranded RNA molecule (optionally with additional processing steps that may result in the addition or removal of one, two, three or more nucleotides from the 3' or 5' end of one or both strands). The spacer may be of sufficient length to allow the antisense and sense sequences to anneal and form a double strand structure (or stem) prior to cleavage of the spacer (and optionally subsequent processing steps that may result in the addition or deletion of one, two, three, four or more nucleotides from the 3' end or from the 5' end of one or both strands). The spacer sequence is typically an unrelated polynucleotide that resides between two complementary regions of polynucleotides that, after annealing to a double-stranded polynucleotide, form a small hairpin RNA. The spacer sequence typically contains from about 3 to about 100 nucleotides.
Любой представляющий интерес РНК-полинуклеотид можно получить путем подбора подходящей композиции последовательности, размера петли и длины стебля для получения шпилечного дуплекса. При осуществлении разработки подходящий диапазон длины стебля шпилечного дуплекса включает длины стебля, составляющие по меньшей мере приблизительно 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 или 20 нуклеотидов, как, например, приблизительно 14-30 нуклеотидов, приблизительно 30-50 нуклеотидов, приблизительно 50-100 нуклеотидов, приблизительно 100-150 нуклеотидов, приблизительно 150-200 нуклеотидов, приблизительно 200-300 нуклеотидов, приблизительно 300-400 нуклеотидов, приблизительно 400-500 нуклеотидов, приблизительно 500-600 нуклеотидов и приблизительно 600-700 нуклеотидов. При осуществлении разработки подходящий диапазон длин петли шпилечного дуплекса включает длину петли, составляющую приблизительно 4-25 нуклеотидов, приблизительно 25-50 нуклеотидов или больше, если длина стебля шпилечного дуплекса является значительной. В определенных вариантах осуществления длина молекулы двунитевой РНК или ssRNA составляет от приблизительно 15 до приблизительно 40 нуклеотидов. В другом варианте осуществления молекула siRNA представляет собой молекулу двунитевой РНК или ssRNA длиной от приблизительно 15 до приблизительно 35 нуклеотидов. В другом варианте осуществления молекула siRNA представляет собой молекулу двунитевой РНК или ssRNA длиной от приблизительно 17 до приблизительно 30 нуклеотидов. В другом варианте осуществления молекула siRNA представляет собой молекулу двунитевой РНК или ssRNA длиной от приблизительно 19 до приблизительно 25 нуклеотидов. В другом варианте осуществления молекула siRNA представляет собой молекулу двунитевой РНК или ssRNA длиной от приблизительно 21 до приблизительно 23 нуклеотидов. В определенных вариантах осуществления шпилечные структуры с участками в виде дуплекса длиннее 21 нуклеотида могут способствовать эффективному сайленсингу, управляемому siRNA, вне зависимости от последовательности и длины петли. Иллюстративные последовательности для осуществления РНК-интерференции описаны в данном документе. Any RNA polynucleotide of interest can be obtained by selecting an appropriate sequence composition, loop size and stem length to produce a hairpin duplex. When designing, a suitable stem length range for a hairpin duplex includes stem lengths of at least about 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, or 20 nucleotides, such as about 14-30 nucleotides. , approximately 30-50 nucleotides, approximately 50-100 nucleotides, approximately 100-150 nucleotides, approximately 150-200 nucleotides, approximately 200-300 nucleotides, approximately 300-400 nucleotides, approximately 400-500 nucleotides, approximately 500-600 nucleotides, and approximately 600-700 nucleotides. When designing, a suitable range of loop lengths for the hairpin duplex includes a loop length of about 4-25 nucleotides, about 25-50 nucleotides, or more if the stem length of the hairpin duplex is significant. In certain embodiments, the double-stranded RNA or ssRNA molecule is about 15 to about 40 nucleotides in length. In another embodiment, the siRNA molecule is a double-stranded RNA or ssRNA molecule from about 15 to about 35 nucleotides in length. In another embodiment, the siRNA molecule is a double-stranded RNA or ssRNA molecule from about 17 to about 30 nucleotides in length. In another embodiment, the siRNA molecule is a double-stranded RNA or ssRNA molecule from about 19 to about 25 nucleotides in length. In another embodiment, the siRNA molecule is a double-stranded RNA or ssRNA molecule from about 21 to about 23 nucleotides in length. In certain embodiments, hairpin structures with duplex regions longer than 21 nucleotides can facilitate efficient siRNA-driven silencing regardless of loop sequence and length. Exemplary sequences for performing RNAi are described herein.
Длина последовательности мРНК-мишени составляет, как правило, от приблизительно 14 до приблизительно 50 нуклеотидов. Следовательно, мРНК-мишень можно проверить на наличие участков длиной от приблизительно 14 до приблизительно 50 нуклеотидов, которые предпочтительно соответствуют одному или более из следующих критериев: соотношение A+T/G+С составляет от приблизительно 2:1 до приблизительно 1:2; наличие динуклеотида AA или динуклеотида СA на 5'-конце; наличие последовательности из по меньшей мере 10 последовательных нуклеотидов, являющихся уникальными для мРНК-мишени (то есть, последовательность не присутствует в других последовательностях мРНК из этого же растения); и отсутствие «рядов» из более чем трех последовательных нуклеотидов, представляющих собой гуанин (G), или более чем трех последовательных нуклеотидов, представляющих собой цитозин (C). Оценку в отношении данных критериев можно осуществлять с помощью различных методик, известных в данной области техники, например, компьютерные программы, такие как BLAST, можно применять для поиска по общедоступным базам данных, чтобы определить, является ли выбранная последовательность уникальной для мРНК-мишени. В качестве альтернативы, последовательность можно отобрать (и разработать последовательность siRNA) с помощью коммерчески доступного компьютерного программного обеспечения (например, OligoEngine, Target Finder и Design Tool для siRNA, которые являются коммерчески доступными). The target mRNA sequence is typically about 14 to about 50 nucleotides in length. Therefore, the target mRNA can be screened for regions of about 14 to about 50 nucleotides in length that preferably meet one or more of the following criteria: an A+T/G+C ratio of about 2:1 to about 1:2; the presence of an AA dinucleotide or a CA dinucleotide at the 5' end; the presence of a sequence of at least 10 consecutive nucleotides that is unique to the target mRNA (ie, the sequence is not present in other mRNA sequences from the same plant); and the absence of "strings" of more than three consecutive nucleotides representing guanine (G) or more than three consecutive nucleotides representing cytosine (C). Evaluation against these criteria can be performed using various techniques known in the art, for example, computer programs such as BLAST can be used to search public databases to determine if a selected sequence is unique to a target mRNA. Alternatively, the sequence can be selected (and the siRNA sequence designed) using commercially available computer software (eg, OligoEngine, Target Finder and Design Tool for siRNA, which are commercially available).
В одном варианте осуществления отбирают последовательности мРНК-мишени, длина которых составляет от приблизительно 14 до приблизительно 30 нуклеотидов, которые соответствуют одному или более критериям, указанным выше. В другом варианте осуществления отбирают последовательности, длина которых составляет от приблизительно 16 до приблизительно 30 нуклеотидов, которые соответствуют одному или более критериям, указанным выше. В дополнительном варианте осуществления отбирают последовательности, длина которых составляет от приблизительно 19 до приблизительно 30 нуклеотидов, которые соответствуют одному или более критериям, указанным выше. В другом варианте осуществления отбирают последовательности, длина которых составляет от приблизительно 19 до приблизительно 25 нуклеотидов, которые соответствуют одному или более критериям, указанным выше.In one embodiment, target mRNA sequences are selected that are from about 14 to about 30 nucleotides in length and that meet one or more of the criteria above. In another embodiment, sequences are selected that are from about 16 to about 30 nucleotides in length that meet one or more of the criteria above. In a further embodiment, sequences are selected that are from about 19 to about 30 nucleotides in length that meet one or more of the criteria above. In another embodiment, sequences are selected that are from about 19 to about 25 nucleotides in length that meet one or more of the criteria above.
В иллюстративном варианте осуществления молекулы siRNA содержат специфическую антисмысловую последовательность, которая комплементарна по меньшей мере 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30 или более смежным нуклеотидам из любого из полинуклеотидов, описанных в данном документе. In an exemplary embodiment, the siRNA molecules contain a specific antisense sequence that is complementary to at least 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30 or more contiguous nucleotides from any of the polynucleotides described herein.
Специфическая антисмысловая последовательность, содержащаяся в молекуле siRNA, может быть идентичной или практически идентичной комплементарной последовательности. В одном варианте осуществления специфическая антисмысловая последовательность, содержащаяся в молекуле siRNA, является на по меньшей мере приблизительно 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% или 100% идентичной последовательности, комплементарной последовательности мРНК-мишени. Способы определения идентичности последовательности известны в данной области техники, и ее можно определить, например, с помощью программы BLASTN из программного обеспечения Computer Group (GCG) Университета штата Висконсин, или предоставленной на веб-сайте NCBI. The specific antisense sequence contained in the siRNA molecule may be identical or substantially identical to the complementary sequence. In one embodiment, the specific antisense sequence contained within the siRNA molecule is at least about 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, or 100% sequence identical. , complementary to the target mRNA sequence. Methods for determining sequence identity are known in the art and can be determined, for example, using the BLASTN program from the University of Wisconsin Computer Group (GCG) software, or provided on the NCBI website.
Один способ индукции сайленсинга двунитевой РНК у растений представляет собой трансформацию с помощью генной конструкции, продуцирующей шпилечную РНК (см. Nature (2000) 407, 319-320). Такие конструкции содержат инвертированные участки последовательности целевого гена, отделенные соответствующим спейсером. Вставка функционального интронного участка растения в качестве спейсерного фрагмента дополнительно повышает эффективность индукции сайленсинга гена благодаря выработке шпилечной РНК на основе сплайсинга интрона (Plant J. (2001), 27, 581-590). Предпочтительно длина стебля составляет от приблизительно 50 нуклеотидов до приблизительно 1 тысячи нуклеотидов в длину. Способы получения шпилечной РНК на основе сплайсинга интрона хорошо описаны в данной области техники (см., например, Bioscience, Biotechnology, and Biochemistry (2008) 72, 2, 615-617). One method for inducing double-stranded RNA silencing in plants is transformation with a gene construct producing hairpin RNA (see Nature (2000) 407, 319-320). Such constructs contain inverted portions of the target gene sequence separated by an appropriate spacer. Insertion of a functional plant intron region as a spacer fragment further enhances the efficiency of gene silencing induction due to the production of hairpin RNA based on intron splicing ( Plant J. (2001), 27, 581-590). Preferably, the length of the stem is from about 50 nucleotides to about 1 thousand nucleotides in length. Methods for producing hairpin RNA based on intron splicing are well described in the art (see, for example, Bioscience, Biotechnology, and Biochemistry (2008) 72, 2, 615-617).
Молекулы интерферирующей РНК, имеющие структуру в виде дуплекса или двунитевую структуру, например двунитевая РНК или малая шпилечная РНК, могут иметь тупые концы, или могут иметь 3'- или 5'-выступы. Используемый в данном документе термин «выступ» относится к неспаренному нуклеотиду или нуклеотидам, которые выступают из структуры в виде дуплекса, если 3'-конец одной нити РНК выходит за пределы 5'-конца другой нити (3'-выступ), или наоборот (5'-выступ). Нуклеотиды, составляющие выступы, могут быть рибонуклеотидами, дезоксирибонуклеотидами или их модифицированными версиями. В одном варианте осуществления по меньшей мере одна нить молекулы интерферирующей РНК имеет 3'-выступ длиной от приблизительно 1 до приблизительно 6 нуклеотидов. В других вариантах осуществления длина 3'-выступа составляет от приблизительно 1 до приблизительно 5 нуклеотидов, от приблизительно 1 до приблизительно 3 нуклеотидов и от приблизительно 2 до приблизительно 4 нуклеотидов. Interfering RNA molecules having a duplex or double-stranded structure, such as double-stranded RNA or small hairpin RNA, may have blunt ends, or may have 3' or 5' projections. As used herein, the term "overhang" refers to an unpaired nucleotide or nucleotides that protrude from the structure as a duplex if the 3' end of one strand of RNA extends beyond the 5' end of the other strand (3' overhang), or vice versa ( 5' ledge). Nucleotides constituting the protrusions may be ribonucleotides, deoxyribonucleotides, or modified versions thereof. In one embodiment, at least one strand of the interfering RNA molecule has a 3' overhang of about 1 to about 6 nucleotides in length. In other embodiments, the 3' overhang is about 1 to about 5 nucleotides, about 1 to about 3 nucleotides, and about 2 to about 4 nucleotides in length.
Если молекула интерферирующей РНК содержит 3'-выступ на одном конце молекулы, другой конец может быть с тупым концом, или также иметь выступ (5' или 3'). Если молекула интерферирующей РНК содержит выступ с обоих концов молекулы, длина выступов может быть одинаковой или разной. В одном варианте осуществления молекула интерферирующей РНК содержит 3'-выступы, состоящие из от приблизительно 1 до приблизительно 3 нуклеотидов, на обоих концах молекулы. В дополнительном варианте осуществления молекула интерферирующей РНК представляет собой двунитевую РНК, имеющую 3'-выступ из 2 нуклеотидов с обоих концов молекулы. В еще одном варианте осуществления нуклеотиды, составляющие выступ интерферирующей РНК, являются динуклеотидами TT или динуклеотидами UU.If the interfering RNA molecule contains a 3'-protrusion at one end of the molecule, the other end may be blunt-ended, or also have a protrusion (5' or 3'). If the interfering RNA molecule contains a protrusion at both ends of the molecule, the length of the protrusions may be the same or different. In one embodiment, the interfering RNA molecule contains 3' overhangs of about 1 to about 3 nucleotides at both ends of the molecule. In a further embodiment, the interfering RNA molecule is a double stranded RNA having a 2 nucleotide 3' overhang at both ends of the molecule. In yet another embodiment, the nucleotides constituting the interfering RNA overhang are TT dinucleotides or UU dinucleotides.
Молекулы интерферирующей РНК могут содержать одну или более 5'- или 3'-кэп-структур. Термин «кэп-структура» относится к химической модификации, включенной с любого конца олигонуклеотида, которая защищает молекулу от разрушения эндонуклеазами и может также облегчать доставку или локализацию внутри клетки. Interfering RNA molecules may contain one or more 5' or 3' cap structures. The term "cap structure" refers to a chemical modification included at either end of an oligonucleotide that protects the molecule from degradation by endonucleases and may also facilitate delivery or localization within a cell.
Другой модификацией, применяемой к молекулам интерферирующей РНК, является химическое связывание с молекулой интерферирующей РНК одного или более фрагментов или конъюгатов, которые усиливают функцию, клеточное распределение, клеточный захват, биодоступность или стабильность молекулы интерферирующей РНК. Полинуклеотиды можно синтезировать или модифицировать с помощью способов, общепринятых в данной области техники. Химические модификации включают 2'-модификации, введение неприродных оснований, ковалентное присоединение лиганда и замещение фосфатных связей тиофосфатными связями. В данном варианте осуществления прочность структуры в виде дуплекса укрепляют с помощью по меньшей мере одной и, как правило, двух химических связей. Another modification applied to interfering RNA molecules is the chemical coupling to the interfering RNA molecule of one or more fragments or conjugates that enhance the function, cellular distribution, cellular uptake, bioavailability, or stability of the interfering RNA molecule. Polynucleotides can be synthesized or modified using methods conventional in the art. Chemical modifications include 2' modifications, introduction of non-natural bases, covalent attachment of a ligand, and replacement of phosphate bonds with thiophosphate bonds. In this embodiment, the strength of the duplex structure is strengthened by at least one and typically two chemical bonds.
Нуклеотиды одной или обеих из двух одинарных нитей можно модифицировать для модулирования активации клеточных ферментов, таких как, например, без ограничения определенные нуклеазы. Методики для понижения уровня или ингибирования активации клеточных ферментов известны в данной области техники и включают без ограничения 2'-аминомодификации, 2'-фтормодификации, 2'-алкилмодификации, модификации незаряженного каркаса, морфолиновые модификации, 2'-О-метилмодификации и фосфорамидат. The nucleotides of one or both of the two single strands can be modified to modulate the activation of cellular enzymes such as, for example, but not limited to, certain nucleases. Techniques for reducing or inhibiting cellular enzyme activation are known in the art and include, but are not limited to, 2'-amino modifications, 2'-fluoro modifications, 2'-alkyl modifications, uncharged backbone modifications, morpholine modifications, 2'-O-methyl modifications, and phosphoramidate.
Молекулу интерферирующей РНК можно конъюгировать с лигандами, например, для усиления ее абсорбции клеткой. В определенных вариантах осуществления гидрофобный лиганд конъюгируют с молекулой для облегчения прямого проникновения через клеточную мембрану. В определенных случаях конъюгация катионного лиганда с олигонуклеотидами часто в результате приводит к улучшению устойчивости к нуклеазам. The interfering RNA molecule can be conjugated to ligands, for example, to enhance its absorption into the cell. In certain embodiments, the hydrophobic ligand is conjugated to a molecule to facilitate direct penetration across the cell membrane. In certain instances, conjugation of the cationic ligand to oligonucleotides often results in improved nuclease resistance.
«Нацеленные индуцированные локальные повреждения в геноме» (TILLING) представляет собой еще одну технологию мутагенеза, которую можно применять для создания и/или идентификации полинуклеотидов, кодирующих полипептиды с модифицированной экспрессией, функцией и/или активностью. TILLING также обеспечивает возможность отбора растений, несущих такие мутантные варианты. В TILLING комбинируют мутагенез высокой плотности со способами высокопроизводительного скрининга. Способы осуществления TILLING хорошо известны из уровня техники (см. McCallum et al., (2000) Nat Biotechnol 18: 455-457 и Stemple (2004) Nat Rev Genet 5(2): 145-50)."Targeted induced local lesions in the genome" (TILLING) is another mutagenesis technology that can be used to create and/or identify polynucleotides encoding polypeptides with modified expression, function and/or activity. TILLING also allows selection of plants carrying such mutant variants. TILLING combines high density mutagenesis with high throughput screening methods. TILLING methods are well known in the art (see McCallum et al ., (2000) Nat Biotechnol 18: 455-457 and Stemple (2004) Nat Rev Genet 5(2): 145-50).
Различные варианты осуществления направлены на векторы экспрессии, содержащие один или более из полинуклеотидов NtSUS или конструкций интерферирующей РНК, которые содержат один или более полинуклеотидов NtSUS, описанных в данном документе. Various embodiments are directed to expression vectors containing one or more of the NtSUS polynucleotides or interfering RNA constructs that contain one or more of the NtSUS polynucleotides described herein.
Различные варианты осуществления направлены на векторы экспрессии, содержащие один или более из полинуклеотидов NtSUS или одну или более конструкций интерферирующей РНК, описанных в данном документе.Various embodiments are directed to expression vectors containing one or more of the NtSUS polynucleotides or one or more interfering RNA constructs described herein.
Различные варианты осуществления направлены на векторы экспрессии, содержащие один или более полинуклеотидов NtSUS или одну или более конструкций интерферирующей РНК, кодирующих один или более полинуклеотидов интерферирующей РНК, описанных в данном документе, которые способны к самогибридизации с образованием структуры в виде шпильки, при этом конструкция содержит (a) один или более из полинуклеотидов NtSUS, описанных в данном документе; (b) вторую последовательность, кодирующую спейсерный элемент, который образует петлю структуры в виде шпильки; и (c) третью последовательность, содержащую последовательность, обратно комплементарную первой последовательности, расположенную в той же ориентации, что и первая последовательность, где вторая последовательность расположена между первой последовательностью и третьей последовательностью, и вторая последовательность функционально связана с первой последовательностью и третьей последовательностью. Various embodiments are directed to expression vectors containing one or more NtSUS polynucleotides or one or more interfering RNA constructs encoding one or more interfering RNA polynucleotides described herein that are capable of self-hybridizing to form a hairpin structure, wherein the construct comprises (a) one or more of the NtSUS polynucleotides described herein; (b) a second sequence encoding a spacer element that forms a loop of the hairpin structure; and (c) a third sequence containing a sequence inversely complementary to the first sequence located in the same orientation as the first sequence, where the second sequence is located between the first sequence and the third sequence, and the second sequence is operably linked to the first sequence and the third sequence.
Раскрытые полинуклеотиды NtSUS можно использовать для конструирования различных полинуклеотидов, которые не образуют структуры в виде шпильки. Например, двунитевая РНК может быть образована посредством (1) транскрибирования первой цепи ДНК путем функционального связывания с первым промотором и (2) транскрибирования последовательности, обратно комплементарной фрагменту ДНК первой цепи путем функционального связывания со вторым промотором. Каждую цепь полинуклеотида можно транскрибировать из одного вектора экспрессии, или из разных векторов экспрессии. РНК-дуплекс, обладающий свойствами РНК-интерференции, можно ферментативно преобразовать в siRNA для модулирования уровней РНК. The disclosed NtSUS polynucleotides can be used to construct various polynucleotides that do not form hairpin structures. For example, a double-stranded RNA can be formed by (1) transcribing a first strand of DNA by operably linking to a first promoter and (2) transcribing a sequence reversely complementary to a DNA fragment of the first strand by operably linking to a second promoter. Each polynucleotide strand can be transcribed from a single expression vector, or from different expression vectors. An RNA duplex having RNA interference properties can be enzymatically converted to siRNA to modulate RNA levels.
Таким образом, различные варианты осуществления направлены на векторы экспрессии, содержащие один или более полинуклеотидов NtSUS или конструкций интерферирующей РНК, описанных в данном документе, кодирующих полинуклеотиды интерферирующей РНК, способные к самогибридизации, при этом конструкция содержит (a) один или более из полинуклеотидов NtSUS, описанных в данном документе; и (b) вторую последовательность, содержащую последовательность, комплементарную (например, обратно комплементарную) первой последовательности, расположенную в той же ориентации, что и первая последовательность. Thus, various embodiments are directed to expression vectors containing one or more of the NtSUS polynucleotides or interfering RNA constructs described herein encoding interfering RNA polynucleotides capable of self-hybridization, wherein the construct comprises (a) one or more of the NtSUS polynucleotides, described in this document; and (b) a second sequence containing a sequence that is complementary (eg, inversely complementary) to the first sequence in the same orientation as the first sequence.
Представлены различные композиции и способы для модулирования уровней эндогенной экспрессии одного или более из полипептидов NtSUS, описанных в данном документе (или любой их комбинации, описанной в данном документе), путем стимулирования косупрессии экспрессии гена. Various compositions and methods are provided for modulating endogenous expression levels of one or more of the NtSUS polypeptides described herein (or any combination thereof described herein) by promoting co-suppression of gene expression.
Различные композиции и способы предусмотрены для модулирования уровня экспрессии эндогенного гена путем модулирования трансляции мРНК. Клетку растения-хозяина (табака) можно трансформировать с помощью вектора экспрессии, содержащего промотор, функционально связанный с полинуклеотидом NtSUS, расположенным в антисмысловой ориентации по отношению к промотору для обеспечения возможности экспрессии полинуклеотидов РНК с последовательностью, комплементарной части мРНК. Various compositions and methods are provided for modulating the expression level of an endogenous gene by modulating mRNA translation. A host plant (tobacco) cell can be transformed with an expression vector containing a promoter operably linked to an NtSUSβ polynucleotide located in an antisense orientation with respect to the promoter to allow expression of RNA polynucleotides with a sequence complementary to the mRNA.
Различные векторы экспрессии для модулирования трансляции мРНК могут содержать промотор, функционально связанный с полинуклеотидом NtSUS, в котором последовательность расположена в антисмысловой ориентации по отношению к промотору. Длина полинуклеотидов антисмысловой РНК может варьировать и может составлять приблизительно 15-20 нуклеотидов, приблизительно 20-30 нуклеотидов, приблизительно 30-50 нуклеотидов, приблизительно 50-75 нуклеотидов, приблизительно 75-100 нуклеотидов, приблизительно 100-150 нуклеотидов, приблизительно 150-200 нуклеотидов и приблизительно 200-300 нуклеотидов.Various expression vectors for modulating mRNA translation may contain a promoter operably linked to an NtSUSβ polynucleotide in which the sequence is located in an antisense orientation relative to the promoter. The length of the antisense RNA polynucleotides can vary and can be about 15-20 nucleotides, about 20-30 nucleotides, about 30-50 nucleotides, about 50-75 nucleotides, about 75-100 nucleotides, about 100-150 nucleotides, about 150-200 nucleotides and approximately 200-300 nucleotides.
Мобильные генетические элементыMobile genetic elements
В качестве альтернативы, нацеливание для инактивации в отношении генов можно осуществлять путем введения транспозонов (например, IS-элементов) в геномы представляющих интерес растений. Данные мобильные генетические элементы можно ввести с помощью полового перекрестного опыления и мутантов со вставками можно подвергнуть скринингу в отношении потери функции полипептида. Разрушенный ген родительского растения можно ввести в другие растения путем скрещивания родительского растения с растением, не подвергнутым индуцированному транспозоном мутагенезу, например, путем полового перекрестного опыления. Можно применять любые стандартные методики селекции, известные специалистам в данной области техники. В одном варианте осуществления один или более генов можно инактивировать путем вставки одного или более транспозонов. Мутации могут привести к гомозиготному разрушению одного или более генов, к гетерозиготному разрушению одного или более генов, или к комбинации гомозиготных и гетерозиготных разрушений, если разрушен более чем один ген. Подходящие мобильные элементы включают ретротранспозоны, ретропозоны и SINE-подобные элементы. Такие способы известны специалистам в данной области техники.Alternatively, targeting for gene inactivation can be accomplished by introducing transposons (eg, IS elements) into the genomes of plants of interest. These transposable genetic elements can be introduced by sexual cross-pollination and insertion mutants can be screened for loss of polypeptide function. The disrupted gene of the parent plant can be introduced into other plants by crossing the parent plant with a plant that has not undergone transposon-induced mutagenesis, such as by sexual cross-pollination. Any standard selection techniques known to those skilled in the art can be used. In one embodiment, one or more genes can be inactivated by insertion of one or more transposons. Mutations can lead to homozygous destruction of one or more genes, to heterozygous destruction of one or more genes, or to a combination of homozygous and heterozygous destruction if more than one gene is destroyed. Suitable transposable elements include retrotransposons, retroposons, and SINE-like elements. Such methods are known to those skilled in the art.
РибозимыRibozymes
В качестве альтернативы на полинуклеотиды NtSUS можно целенаправленно воздействовать для инактивации путем введения рибозимов, полученных из ряда малых кольцевых РНК, которые способны к саморасщеплению и репликации в растениях. Данные РНК могут реплицироваться либо самостоятельно (РНК вироида), либо с участием вируса-помощника (сателлитные РНК). Примеры подходящих РНК включают полученные из вироида солнечной пятнистости авокадо и сателлитные РНК, полученные из вируса кольцевой пятнистости табака, вируса временной полосатости люцерны, вируса бархатной пятнистости табака, вируса пятнистости Solanum nodiflorum и вируса пятнистости клевера подземного. Различные специфичные к целевой РНК рибозимы известны специалистам в данной области техники.Alternatively, NtSUS polynucleotides can be targeted for inactivation by introducing ribozymes derived from a number of small circular RNAs that are capable of self-cleavage and replication in plants. These RNAs can replicate either independently (viroid RNA) or with the help of a helper virus (satellite RNA). Examples of suitable RNAs include avocado sunspot viroid-derived and satellite RNAs derived from tobacco ringspot virus, alfalfa temporary streak virus, tobacco velvet blotch virus, Solanum nodiflorum sunspot virus, and subterranean clover spot virus. Various target RNA-specific ribozymes are known to those skilled in the art.
4. Растения4. Plants
Мутантные или не встречающиеся в природе растения или клетки растений могут иметь любую комбинацию одной или более мутаций в одном или более генах NtSUS, которая приводит к модулированной экспрессии, или функции, или активности этих генов или продуктов таких генов. Например, мутантные или не встречающиеся в природе растения или клетки растений могут иметь одну мутацию в одном гене NtSUS; несколько мутаций в одном гене NtSUS; одну мутацию в двух или более, или трех или более, или четырех или более генах NtSUS; или несколько мутаций в двух или более, или трех или более, или четырех или более генах NtSUS. В качестве дополнительного примера мутантные или не встречающиеся в природе растения или клетки растений могут иметь одну или более мутаций в конкретной части гена(генов) NtSUS, например, в участке гена NtSUS, который кодирует активный сайт полипептида NtSUS или его часть. В качестве дополнительного примера мутантные или не встречающиеся в природе растения или клетки растений могут иметь одну или более мутаций в участке за пределами одного или более генов NtSUS, в таком как участок, расположенный выше или ниже гена NtSUS, который он регулирует, при условии, что они модулируют функцию или экспрессию гена(генов) NtSUS. Элементы, расположенные выше по последовательности, могут включать промоторы, энхансеры или факторы транскрипции. Некоторые элементы, такие как энхансеры, могут располагаться выше по последовательности или ниже по последовательности от гена, который они регулируют. Элемент (элементы) не обязательно расположен рядом с геном, который он регулирует, так как было обнаружено, что некоторые элементы расположены на расстоянии в несколько тысяч пар оснований выше по последовательности или ниже по последовательности от гена, который они регулируют. Мутантные или не встречающиеся в природе растения или клетки растения могут иметь одну или более мутаций, расположенных в первых 100 нуклеотидах от гена (генов), в первых 200 нуклеотидах от гена (генов), в первых 300 нуклеотидах от гена (генов), в первых 400 нуклеотидах от гена (генов), в первых 500 нуклеотидах от гена (генов), в первых 600 нуклеотидах от гена (генов), в первых 700 нуклеотидах от гена (генов), в первых 800 нуклеотидах от гена (генов), в первых 900 нуклеотидах от гена (генов), в первой 1000 нуклеотидов от гена (генов), в первых 1100 нуклеотидах от гена (генов), в первых 1200 нуклеотидах от гена (генов), в первых 1300 нуклеотидах от гена (генов), в первых 1400 нуклеотидах от гена (генов) или в первых 1500 нуклеотидах от гена (генов). Мутантные или не встречающиеся в природе растения или клетки растения могут иметь одну или более мутаций, расположенных в первом, втором, третьем, четвертом, пятом, шестом, седьмом, восьмом, девятом, десятом, одиннадцатом, двенадцатом, тринадцатом, четырнадцатом или пятнадцатом наборе из 100 нуклеотидов гена (генов) или их комбинации. Раскрыты мутантные или не встречающиеся в природе растения или клетки растения (например, мутантные, не встречающиеся в природе или трансгенные растения или клетки растения и т.п., как описано в данном документе), содержащие варианты мутантного полипептида. Mutant or non-naturally occurring plants or plant cells may have any combination of one or more mutations in one or more NtSUS genes that results in modulated expression or function or activity of those genes or products of those genes. For example, mutated or non-naturally occurring plants or plant cells may have a single mutation in a single NtSUS gene; multiple mutations in the same NtSUS gene; one mutation in two or more, or three or more, or four or more NtSUS genes; or multiple mutations in two or more, or three or more, or four or more NtSUS genes. As a further example, mutated or non-naturally occurring plants or plant cells may have one or more mutations in a particular portion of the NtSUS gene(s), for example, in the region of the NtSUS gene that encodes the active site of the NtSUS polypeptide or a portion thereof. As a further example, mutated or non-naturally occurring plants or plant cells may have one or more mutations in a region outside one or more of the NtSUS genes, such as the region upstream or downstream of the NtSUS gene it regulates, provided that they modulate the function or expression of the NtSUS gene(s). Upstream elements may include promoters, enhancers, or transcription factors. Some elements, such as enhancers, may be upstream or downstream of the gene they regulate. The element(s) are not necessarily adjacent to the gene it regulates, as some elements have been found to be several thousand base pairs upstream or downstream from the gene they regulate. Mutant or non-naturally occurring plants or plant cells may have one or more mutations located in the first 100 nucleotides from the gene(s), in the first 200 nucleotides from the gene(s), in the first 300 nucleotides from the gene(s), in the first 400 nucleotides from a gene(s), in the first 500 nucleotides from a gene(s), in the first 600 nucleotides from a gene(s), in the first 700 nucleotides from a gene(s), in the first 800 nucleotides from a gene(s), in the first 900 nucleotides from a gene(s), in the first 1000 nucleotides from a gene(s), in the first 1100 nucleotides from a gene(s), in the first 1200 nucleotides from a gene(s), in the first 1300 nucleotides from a gene(s), in the first 1400 nucleotides from the gene(s) or in the first 1500 nucleotides from the gene(s). Mutant or non-naturally occurring plants or plant cells may have one or more mutations located in the first, second, third, fourth, fifth, sixth, seventh, eighth, ninth, tenth, eleventh, twelfth, thirteenth, fourteenth, or fifteenth set of 100 nucleotides of a gene(s) or combinations thereof. Disclosed are mutant or non-naturally occurring plants or plant cells (eg, mutant, non-naturally occurring or transgenic plants or plant cells, and the like, as described herein) containing variants of the mutant polypeptide.
В одном варианте осуществления семена растений подвергают мутагенезу и затем выращивают из них мутантные растения первого поколения. Затем растениям первого поколения дают самоопылиться и из семян от растений первого поколения выращивают растения второго поколения, которые затем проверяют на наличие мутаций в их локусах. Не смотря на то, что подвергнутый мутации растительный материал можно подвергнуть скринингу на наличие мутаций, преимуществом скрининга растений второго поколения является то, что все соматические мутации соответствуют мутациям в зародышевых линиях. Специалисту в данной области техники будет понятно, что различный растительный материал, в том числе без ограничения семена, пыльцу, ткань растения или клетки растения, можно подвергнуть мутагенезу для создания мутантных растений. Однако тип растительного материала, подвергнутого мутагенезу, может иметь значение, когда полинуклеотид растения подвергают скринингу на наличие мутаций. Например, если пыльцу подвергают мутагенезу до опыления не подвергнутого мутагенезу растения, из семян, полученных при этом опылении, выращивают растения первого поколения. Каждая клетка растений первого поколения будет содержать мутации, возникшие в пыльце; таким образом, эти растения первого поколения можно затем подвергнуть скринингу на наличие мутаций вместо того, чтобы ждать появления второго поколения. In one embodiment, plant seeds are subjected to mutagenesis and then grown into first generation mutant plants. The first generation plants are then allowed to self-pollinate and the seeds from the first generation plants are grown into second generation plants which are then tested for mutations at their loci. Although mutated plant material can be screened for mutations, the advantage of screening second generation plants is that all somatic mutations correspond to mutations in the germline. One of skill in the art will appreciate that various plant material, including, without limitation, seeds, pollen, plant tissue, or plant cells, can be mutated to create mutant plants. However, the type of plant material subjected to mutagenesis may be of importance when a plant polynucleotide is screened for mutations. For example, if pollen is subjected to mutagenesis prior to pollination of an unmutated plant, first generation plants are grown from the seeds obtained from this pollination. Each cell of the first generation plants will contain mutations that originated in the pollen; thus, these first generation plants can then be screened for mutations instead of waiting for the second generation to appear.
Получение модифицированных растений, скрининг и скрещиваниеObtaining modified plants, screening and crossing
Полинуклеотиды NtSUS, полученные из отдельных растений, клеток растений или растительного материала, необязательно можно объединять, чтобы ускорить скрининг в отношении мутаций в популяции растений, происходящих из подвергнутых мутагенезу растительной ткани, клеток растений или растительного материала. Можно проверить одно или более следующих поколений растений, клеток растения или растительного материала. Размер необязательно объединенной группы зависит от чувствительности применяемого способа скрининга. NtSUSα polynucleotides derived from single plants, plant cells, or plant material can optionally be combined to expedite screening for mutations in a plant population derived from mutated plant tissue, plant cells, or plant material. One or more next generations of plants, plant cells, or plant material can be tested. The size of the optionally pooled group depends on the sensitivity of the screening method used.
После необязательного объединения образцов, их можно подвергнуть анализу с помощью методик полинуклеотид-специфичной амплификации, таких как ПЦР. Любой один или более праймеров или зондов, специфичных в отношении гена или последовательностей, непосредственно примыкающих к гену, можно применять для амплификации последовательностей в пределах необязательно объединенного образца. Предпочтительно для амплификации участков локуса, в которых с наибольшей вероятностью возникают полезные мутации, разрабатывают один или более праймеров или зондов. Наиболее предпочтительно праймер разрабатывают для выявления мутаций в участках полинуклеотида. Дополнительно, предпочтительным для праймера (праймеров) и зонда (зондов) было бы обеспечить избегание известных полиморфных сайтов для облегчения скрининга точечных мутаций. Для облегчения выявления продуктов амплификации один или более праймеров или зондов можно метить с применением любого общепринятого способа введения метки. Праймер (праймеры) или зонд (зонды) можно разрабатывать на основе последовательностей, описанных в данном документе, с помощью способов, которые хорошо известны в данной области техники. After optionally pooling the samples, they can be analyzed using polynucleotide-specific amplification techniques such as PCR. Any one or more primers or probes specific for a gene or sequences immediately adjacent to a gene can be used to amplify sequences within an optionally pooled sample. Preferably, one or more primers or probes are designed to amplify regions of the locus where beneficial mutations are most likely to occur. Most preferably, the primer is designed to detect mutations in regions of the polynucleotide. Additionally, it would be preferred for the primer(s) and probe(s) to avoid known polymorphic sites to facilitate screening for point mutations. To facilitate identification of amplification products, one or more primers or probes can be labeled using any conventional labeling method. Primer(s) or probe(s) can be designed based on the sequences described herein using methods that are well known in the art.
Для облегчения выявления продуктов амплификации праймер (праймеры) или зонд(зонды) можно метить с применением любого общепринятого способа внесения метки. Их можно разрабатывать на основе последовательностей, описанных в данном документе, с помощью способов, которые хорошо известны в данной области техники. To facilitate identification of amplification products, the primer(s) or probe(s) may be labeled using any conventional labeling method. They can be designed based on the sequences described herein using methods that are well known in the art.
Полиморфизмы можно идентифицировать с помощью средств, известных в данной области техники, и некоторых из описанных в литературе.Polymorphisms can be identified by means known in the art and some of those described in the literature.
В некоторых вариантах осуществления растение можно регенерировать или вырастить из растения, ткани растения или клетки растения. Можно применять любые подходящие способы регенерации или выращивания растения из клетки растения или ткани растения, такие как без ограничения культивирование тканей или регенерация из протопластов. Предпочтительно растения можно регенерировать путем выращивания трансформированных клеток растения на среде для индукции образования каллюса, среде для индукции образования побегов и/или среде для индукции образования корней. См., например, McCormick et al., Plant Cell Reports 5:81-84 (1986). Затем данные растения можно выращивать и либо опылять их с помощью той же трансформированной линии, либо других линий и идентифицировать получаемый в результате гибрид, характеризующийся экспрессией требуемой фенотипической характеристики. Можно выращивать два или более поколений, чтобы убедиться, что экспрессия требуемой фенотипической характеристики стабильно поддерживается и наследуется, и затем собирать семена, чтобы убедиться, что экспрессия требуемой фенотипической характеристики была достигнута. Таким образом, выражение «трансформированные семена», используемое в данном документе, относится к семенам, которые содержат нуклеотидную конструкцию, стабильно интегрированную в геном растения.In some embodiments, a plant can be regenerated or grown from a plant, plant tissue, or plant cell. Any suitable methods for regenerating or growing a plant from a plant cell or plant tissue can be used, such as, without limitation, tissue culture or regeneration from protoplasts. Preferably, plants can be regenerated by growing the transformed plant cells on callus induction medium, shoot induction medium and/or root induction medium. See, for example, McCormick et al., Plant Cell Reports 5:81-84 (1986). These plants can then be grown and either pollinated with the same transformed line or other lines and the resulting hybrid identified as expressing the desired phenotypic characteristic. You can grow two or more generations to ensure that the expression of the desired phenotypic characteristic is stably maintained and inherited, and then collect seeds to ensure that the expression of the desired phenotypic characteristic has been achieved. Thus, the expression "transformed seeds" as used herein refers to seeds that contain a nucleotide construct stably integrated into the plant genome.
Соответственно, в дополнительном аспекте предусмотрен способ получения мутантного растения. Способ включает получение по меньшей мере одной клетки растения, содержащей ген NtSUS, кодирующий функциональный полинуклеотид NtSUS, описанный в данном документе (или любую их комбинацию, описанную в данном документе). Далее эту по меньшей мере одну клетку растения обрабатывают в условиях, эффективных для модулирования функции полинуклеотида (полинуклеотидов) NtSUS, описанного (описанных) в данном документе. По меньшей мере одну мутантную клетку растения затем размножают с получением мутантного растения, где мутантное растение характеризуется модулированным уровнем описанного (описанных) полипептида (полипептидов) (или любой их комбинации, описанной в данном документе) по сравнению с уровнем у контрольного растения. В одном варианте осуществления данного способа получения мутантного растения стадия обработки включает воздействие на по меньшей мере одну клетку химическим мутагенным средством, описанным выше, и в условиях, эффективных для получения по меньшей мере одной мутантной клетки растения. В другом варианте осуществления данного способа стадия обработки включает подвергание по меньшей мере одной клетки воздействию источника ионизирующего излучения в условиях, эффективных для получения по меньшей мере одной мутантной клетки растения. Термин «мутантное растение» включает мутантные растения, у которых генотип является модифицированным по сравнению с генотипом у контрольного растения, предпочтительно с помощью способов, отличных от способов генной инженерии и генетической модификации. Accordingly, in a further aspect, a method for producing a mutant plant is provided. The method includes obtaining at least one plant cell containing the NtSUS gene encoding a functional NtSUS polynucleotide described herein (or any combination thereof described herein). This at least one plant cell is then treated under conditions effective to modulate the function of the NtSUSα polynucleotide(s) described herein. At least one mutant plant cell is then propagated to produce a mutant plant, wherein the mutant plant has modulated levels of the described polypeptide(s) (or any combination thereof described herein) compared to a control plant. In one embodiment of this method for producing a mutant plant, the step of treating includes exposing at least one cell to a chemical mutagenic agent as described above and under conditions effective to produce at least one mutant plant cell. In another embodiment of this method, the treatment step comprises exposing at least one cell to a source of ionizing radiation under conditions effective to produce at least one mutant plant cell. The term "mutant plant" includes mutant plants in which the genotype is modified from that of the control plant, preferably by methods other than genetic engineering and genetic modification.
В определенных вариантах осуществления мутантное растение, клетка мутантного растения или мутантный растительный материал может содержать одну или более мутаций, которые встречаются в природе в другом растении, клетке растения или растительном материале и обеспечивают требуемый признак. Эту мутацию можно встроить (например, путем интрогрессии) в другое растение, клетку растения или растительный материал (например, растение, клетку растения или растительный материал с генетическим фоном, отличающимся от такового у растения, из которого происходит мутация) для обеспечения у них данного признака. Таким образом, в качестве примера, мутацию, которая встречается в природе в первом растении, можно ввести во второе растение, такое как второе растение с генетическим фоном, отличающимся от такового у первого растения. Таким образом, специалист в данной области техники может осуществлять поиск и идентифицировать растение, несущее в естественных условиях в своем геноме один или более мутантных аллелей генов, описанных в данном документе, которые обеспечивают желаемый признак. Мутантный аллель (аллели), который встречается в природе, можно перенести во второе растение различными способами, включая селекцию, обратное скрещивание и интрогрессию с получением линий, разновидностей или гибридов, которые имеют одну или более мутаций в генах, описанных в данном документе. Та же методика также может быть применена для интрогрессии одной или более не встречающихся в природе мутации (мутаций) из первого растения во второе растение. Растения, демонстрирующие желаемый признак, можно отобрать из пула мутантных растений. Предпочтительно, отбор осуществляют с применением данных о полинуклеотиде, описанном в данном документе. Следовательно, можно осуществлять отбор по генетическому признаку по сравнению с контролем. Такой скрининговый подход может включать применение общепринятых методик амплификации и/или гибридизации, как обсуждалось в данном документе. Таким образом, дополнительный аспект настоящего изобретения относится к способу идентификации мутантного растения, включающему стадии: (a) получения образца, содержащего полинуклеотид NtSUS из растения; и (b) определения последовательности полинуклеотида NtSUS, где отличие в последовательности полинуклеотида NtSUS по сравнению с полинуклеотидом NtSUS из контрольного растения свидетельствует о том, что указанное растение является мутантным растением. В другом аспекте предложен способ идентификации мутантного растения, которое накапливает редуцирующий (редуцирующие) сахар(сахара) на повышенных или сниженных уровнях по сравнению с контрольным растением, включающий стадии: (a) получения образца из растения, подлежащего скринингу; (b) определения того, содержит ли указанный образец одну или более мутаций в одном или более из полинуклеотидов NtSUS, описанных в данном документе; и (c) определения уровня по меньшей мере одного редуцирующего сахара в указанном растении. Предпочтительно уровень по меньшей мере одного редуцирующего сахара определяют в зеленых листьях, листьях, подвергнутых ранним стадиям сушки, или подвергнутых сушке листьях. В другом аспекте представлен способ получения мутантного растения, которое характеризуется повышенными или сниженными уровнями по меньшей мере одного редуцирующего сахара по сравнению с контрольным растением, включающий стадии: (a) получения образца из первого растения; (b) определения того, содержит ли указанный образец одну или более мутаций в одном или более полинуклеотидах NtSUS, описанных в данном документе, которые приводят к модулированным уровням по меньшей мере одного редуцирующего сахара; и (c) переноса одной или более мутаций во второе растение. Предпочтительно уровень по меньшей мере одного редуцирующего сахара определяют в зеленых листьях, листьях, подвергнутых ранним стадиям сушки, или подвергнутых сушке листьях. Мутацию (мутации) можно перенести во второе растение с помощью различных способов, которые известны в данной области техники, например с помощью генной инженерии, манипуляции с генами, интрогрессии, селекции растений, обратного скрещивания и т.п. В одном варианте осуществления первое растение является встречающимся в природе растением. В одном варианте осуществления второе растение характеризуется генетическим фоном, отличающимся от такового у первого растения. В другом аспекте представлен способ получения мутантного растения, которое характеризуется повышенными или сниженными уровнями по меньшей мере одного редуцирующего сахара по сравнению с контрольным растением, включающий стадии: (a) получения образца из первого растения; (b) определения того, содержит ли указанный образец одну или более мутаций в одном или более из полинуклеотидов NtSUS, описанных в данном документе, которые приводят к модулированным уровням по меньшей мере одного редуцирующего сахара; и (c) интрогрессии одной или более мутаций во второе растение. Предпочтительно уровень по меньшей мере одного редуцирующего сахара определяют в зеленых листьях, листьях, подвергнутых ранним стадиям сушки, или подвергнутых сушке листьях. В одном варианте осуществления стадия интрогрессии включает селекцию растений, необязательно включая обратное скрещивание и т.п. В одном варианте осуществления первое растение является встречающимся в природе растением. В одном варианте осуществления второе растение характеризуется генетическим фоном, отличающимся от такового у первого растения. В одном варианте осуществления первое растение не является сортом или элитным сортом. В одном варианте осуществления второе растение представляет собой сорт или элитный сорт. Дополнительный аспект относится к мутантному растению (включая мутантное растение, являющееся сортом или элитным сортом), полученному или получаемому с помощью способов, описанных в данном документе. В определенных вариантах осуществления «мутантные растения» могут иметь одну или несколько мутаций, локализованных только в конкретном участке растения, например, в пределах последовательности одного или нескольких полинуклеотидов NtSUS, описанных в данном документе. Согласно данному варианту осуществления остальная геномная последовательность мутантного растения будет такой же или практически такой же, как у растения до мутагенеза. In certain embodiments, the mutant plant, mutant plant cell, or mutant plant material may contain one or more mutations that occur naturally in another plant, plant cell, or plant material and provide the desired trait. The mutation can be inserted (eg, by introgression) into another plant, plant cell, or plant material (eg, a plant, plant cell, or plant material with a different genetic background from that of the plant from which the mutation occurs) to confer the trait in them. . Thus, as an example, a mutation that occurs naturally in the first plant, can be introduced into a second plant, such as a second plant with a different genetic background from that of the first plant. Thus, a person skilled in the art can search for and identify a plant that naturally carries in its genome one or more mutant alleles of the genes described herein that provide the desired trait. The naturally occurring mutant allele(s) can be transferred to a second plant in a variety of ways, including selection, backcrossing, and introgression to produce lines, varieties, or hybrids that have one or more of the mutations in the genes described herein. The same technique can also be applied to introgression of one or more unnatural mutation(s) from a first plant to a second plant. Plants displaying the desired trait can be selected from a pool of mutant plants. Preferably, selection is made using the polynucleotide data described herein. Therefore, it is possible to carry out selection on a genetic basis in comparison with the control. Such a screening approach may include the use of conventional amplification and/or hybridization techniques as discussed herein. Thus, a further aspect of the present invention relates to a method for identifying a mutant plant, comprising the steps of: (a) obtaining a sample containing a polynucleotideNtSUS from a plant; and (b) determining the sequence of the polynucleotideNtSUS, where the difference is in the polynucleotide sequenceNtSUS compared to polynucleotideNtSUS from a control plant indicates that said plant is a mutant plant. In another aspect, a method is provided for identifying a mutant plant that accumulates reducing sugar(s) at elevated or reduced levels compared to a control plant, comprising the steps of: (a) obtaining a sample from the plant to be screened; (b) determining whether said sample contains one or more mutations in one or more of the polynucleotidesNtSUSdescribed in this document; and (c) determining the level of at least one reducing sugar in said plant. Preferably, the level of at least one reducing sugar is determined in green leaves, leaves subjected to early stages of drying, or leaves subjected to drying. In another aspect, a method is provided for obtaining a mutant plant that is characterized by increased or decreased levels of at least one reducing sugar compared to a control plant, comprising the steps of: (a) obtaining a sample from the first plant; (b) determining whether said sample contains one or more mutations in one or more polynucleotidesNtSUSdescribed in this document, which lead to modulated levels of at least one reducing sugar; and (c) transferring one or more mutations to a second plant. Preferably, the level of at least one reducing sugar is determined in green leaves, leaves subjected to early stages of drying, or leaves subjected to drying. The mutation(s) can be transferred to the second plant by various methods known in the art, such as genetic engineering, gene manipulation, introgression, plant breeding, backcrossing, and the like. In one embodiment, the first plant is a naturally occurring plant. In one embodiment, the second plant has a different genetic background than the first plant. In another aspect, a method is provided for obtaining a mutant plant that is characterized by increased or decreased levels of at least one reducing sugar compared to a control plant, comprising the steps of: (a) obtaining a sample from the first plant; (b) determining whether said sample contains one or more mutations in one or more of the polynucleotidesNtSUSdescribed in this document, which lead to modulated levels of at least one reducing sugar; and (c) introgression of one or more mutations into a second plant. Preferably, the level of at least one reducing sugar is determined in green leaves, leaves subjected to early stages of drying, or leaves subjected to drying. In one embodiment, the introgression step includes plant breeding, optionally including backcrossing and the like. In one embodiment, the first plant is a naturally occurring plant. In one embodiment, the second plant has a different genetic background than the first plant. In one embodiment, the first plant is not a cultivar or elite cultivar. In one embodiment, the second plant is a cultivar or elite cultivar. An additional aspect relates to a mutant plant (including a mutant plant that is a cultivar or elite cultivar) obtained or obtained using the methods described herein. In certain embodiments, "mutant plants" may have one or more mutations located only in a particular region of the plant, for example, within the sequence of one or more polynucleotides.NtSUSdescribed in this document. In this embodiment, the rest of the genomic sequence of the mutant plant will be the same or substantially the same as the plant prior to mutagenesis.
В определенных вариантах осуществления мутантные растения могут иметь одну или более мутаций, локализованных в более чем одном участке генома растения, например, в пределах последовательности одного или более из полинуклеотидов NtSUS, описанных в данном документе, и в одном или более дополнительных участках генома. Согласно данному варианту осуществления остальная геномная последовательность мутантного растения не будет такой же или не будет практически такой же, как у растения до мутагенеза. В определенных вариантах осуществления мутантные растения могут не иметь одну или более мутаций в одном или более, двух или более, трех или более, четырех или более или пяти или более экзонах полинуклеотида (полинуклеотидов) NtSUS, описанного (описанных) в данном документе; или могут не иметь одну или более мутаций в одном или более, двух или более, трех или более, четырех или более или пяти или более интронах полинуклеотида(полинуклеотидов) NtSUS, описанного(описанных) в данном документе; или могут не иметь одну или более мутаций в промоторе полинуклеотида(полинуклеотидов)NtSUS, описанного(описанных) в данном документе; или могут не иметь одну или более мутаций в 3'-нетранслируемом участке полинуклеотида(полинуклеотидов) NtSUS, описанного(описанных) в данном документе; или могут не иметь одну или более мутаций в 5'-нетранслируемом участке полинуклеотида(полинуклеотидов) NtSUS, описанного(описанных) в данном документе; или могут не иметь одну или более мутаций в кодирующем участке полинуклеотида(полинуклеотидов) NtSUS, описанного(описанных) в данном документе; или могут не иметь одну или более мутаций в некодирующем участке полинуклеотида(полинуклеотидов) NtSUS, описанного(описанных) в данном документе; или любую комбинацию двух или более, трех или более, четырех или более, пяти или более, или шести или более их частей.In certain embodiments, mutant plants may have one or more mutations located in more than one region of the plant genome, for example, within the sequence of one or more of the NtSUSβ polynucleotides described herein and in one or more additional regions of the genome. In this embodiment, the rest of the genomic sequence of the mutant plant will not be the same or substantially the same as the plant prior to mutagenesis. In certain embodiments, mutant plants may lack one or more mutations in one or more, two or more, three or more, four or more, or five or more exons of the NtSUSα polynucleotide(s) described herein; or may not have one or more mutations in one or more, two or more, three or more, four or more, or five or more introns of the NtSUS polynucleotide(s) described herein; or may not have one or more mutations in the promoter of the NtSUS polynucleotide(s) described herein; or may lack one or more mutations in the 3'-untranslated region of the NtSUS polynucleotide(s) described herein; or may lack one or more mutations in the 5'-untranslated region of the NtSUS polynucleotide(s) described herein; or may not have one or more mutations in the coding region of the NtSUS polynucleotide(s) described herein; or may lack one or more mutations in the non-coding region of the NtSUS polynucleotide(s) described herein; or any combination of two or more, three or more, four or more, five or more, or six or more parts thereof.
В дополнительном аспекте представлен способ идентификации растения, клетки растения или растительного материала, содержащих мутацию в гене, кодирующем полинуклеотид NtSUS, описанный в данном документе, включающий: (a) осуществление мутагенеза растения, клетки растения или растительного материала; (b) получение образца из указанного растения, клетки растения или растительного материала или их потомков и (c) определение полинуклеотидной последовательности гена NtSUS или его варианта или фрагмента, где отличие в указанной последовательности свидетельствует об одной или более мутациях в ней. Этот способ также обеспечивает отбор растений, имеющих мутацию(мутации), которая(которые) встречается(встречаются) в участках генома, которые влияют на экспрессию гена NtSUS в клетке растения, таких как сайт инициации транскрипции, стартовый кодон, участок интрона, граница экзон-интрон, терминатор или стоп-кодон.In a further aspect, a method for identifying a plant, plant cell, or plant material containing a mutation in a gene encoding an NtSUSα polynucleotide described herein is provided, comprising: (a) performing mutagenesis of the plant, plant cell, or plant material; (b) obtaining a sample from said plant, plant cell or plant material or their descendants; and (c) determining the polynucleotide sequence of the NtSUS gene or variant or fragment thereof, where a difference in said sequence is indicative of one or more mutations therein. This method also provides for the selection of plants having a mutation(s) that occurs(occurs) in regions of the genome that affect the expression of the NtSUS gene in the plant cell, such as the site of transcription initiation, start codon, intron region, exon border. intron, terminator, or stop codon.
Семейства растений, виды, сорта, семена и культура тканейPlant families, species, varieties, seeds and tissue culture
Растения, подходящие для применения в их отношении генетической модификации, включают однодольные и двудольные растения и системы клеток растений, в том числе виды из одного из следующих семейств: Acanthaceae, Alliaceae, Alstroemeriaceae, Amaryllidaceae, Apocynaceae, Arecaceae, Asteraceae, Berberidaceae, Bixaceae, Brassicaceae, Bromeliaceae, Cannabaceae, Caryophyllaceae, Cephalotaxaceae, Chenopodiaceae, Colchicaceae, Cucurbitaceae, Dioscoreaceae, Ephedraceae, Erythroxylaceae, Euphorbiaceae, Fabaceae, Lamiaceae, Linaceae, Lycopodiaceae, Malvaceae, Melanthiaceae, Musaceae, Myrtaceae, Nyssaceae, Papaveraceae, Pinaceae, Plantaginaceae, Poaceae, Rosaceae, Rubiaceae, Salicaceae, Sapindaceae, Solanaceae, Taxaceae, Theaceae или Vitaceae. Plants suitable for genetic modification to be applied to them include monocot and dicot plants and plant cell systems, including species from one of the following families: Acanthaceae, Alliaceae, Alstroemeriaceae, Amaryllidaceae, Apocynaceae, Arecaceae, Asteraceae, Berberidaceae, Bixaceae, Brassicaceae , Bromeliaceae, Cannabaceae, Caryophyllaceae, Cephalotaxaceae, Chenopodiaceae, Colchicaceae, Cucurbitaceae, Dioscoreaceae, Ephedraceae, Erythroxylaceae, Euphorbiaceae, Fabaceae, Lamiaceae, Linaceae, Lycopodiaceae, Malvaceae, Melanthiaceae, Musaceae, Myrtaceae, Nyssaceae, Papaveraceae, Pinaceae, Plantaginaceae, Poaceae, Rosaceae , Rubiaceae, Salicaceae, Sapindaceae, Solanaceae, Taxaceae, Theaceae or Vitaceae.
Подходящие виды могут включать представителей рода Abelmoschus, Abies, Acer, Agrostis, Allium, Alstroemeria, Ananas, Andrographis, Andropogon, Artemisia, Arundo, Atropa, Berberis, Beta, Bixa, Brassica, Calendula, Camellia, Camptotheca, Cannabis, Capsicum, Carthamus, Catharanthus, Cephalotaxus, Chrysanthemum, Cinchona, Citrullus, Coffea, Colchicum, Coleus, Cucumis, Cucurbita, Cynodon, Datura, Dianthus, Digitalis, Dioscorea, Elaeis, Ephedra, Erianthus, Erythroxylum, Eucalyptus, Festuca, Fragaria, Galanthus, Glycine, Gossypium, Helianthus, Hevea, Hordeum, Hyoscyamus, Jatropha, Lactuca, Linum, Lolium, Lupinus, Lycopersicon, Lycopodium, Manihot, Medicago, Mentha, Miscanthus, Musa, Nicotiana, Oryza, Panicum, Papaver, Parthenium, Pennisetum, Petunia, Phalaris, Phleum, Pinus, Poa, Poinsettia, Populus, Rauwolfia, Ricinus, Rosa, Saccharum, Salix, Sanguinaria, Scopolia, Secale, Solanum, Sorghum, Spartina, Spinacea, Tanacetum, Taxus, Theobroma, Triticosecale, Triticum, Uniola, Veratrum, Vinca, Vitis и Zea. Suitable species may include members of the genus Abelmoschus, Abies, Acer, Agrostis, Allium, Alstroemeria, Ananas, Andrographis, Andropogon, Artemisia, Arundo, Atropa, Berberis, Beta, Bixa, Brassica, Calendula, Camellia, Camptotheca, Cannabis, Capsicum, Carthamus, Catharanthus, Cephalotaxus, Chrysanthemum, Cinchona, Citrullus, Coffea, Colchicum, Coleus, Cucumis, Cucurbita, Cynodon, Datura, Dianthus, Digitalis, Dioscorea, Elaeis, Ephedra, Erianthus, Erythroxylum, Eucalyptus, Festuca, Fragaria, Galanthus, Glycine, Gossypium, Helianthus, Hevea, Hordeum, Hyoscyamus, Jatropha, Lactuca, Linum, Lolium, Lupinus, Lycopersicon, Lycopodium, Manihot, Medicago, Mentha, Miscanthus, Musa, Nicotiana, Oryza, Panicum, Papaver, Parthenium, Pennisetum, Petunia, Phalaris, Phleum, Pinus, Poa, Poinsettia, Populus, Rauwolfia, Ricinus, Rosa, Saccharum, Salix, Sanguinaria, Scopolia, Secale, Solanum, Sorghum, Spartina, Spinacea, Tanacetum, Taxus, Theobroma, Triticosecale, Triticum, Uniola, Veratrum, Vinca, Vitis and Zea.
Подходящие виды могут включать Panicum spp., Sorghum spp., Miscanthus spp., Saccharum spp., Erianthus spp., Populus spp., Andropogon gerardii (бородач Жерара), Pennisetum purpureum (слоновая трава), Phalaris arundinacea (двукисточник тростниковидны), Cynodon dactylon (свинорой пальчатый), Festuca arundinacea (овсяница тростниковая), Spartina pectinata (спартина гребешковая), Medicago sativa (люцерна), Arundo donax (арундо тростниковый), Secale cereale (рожь), Salix spp. (ива), Eucalyptus spp. (эвкалипт), Triticosecale (тритикале), бамбук, Helianthus annuus (подсолнечник), Carthamus tinctorius (сафлор красильный), Jatropha curcas (ятрофа), Ricinus communis (клещевина), Elaeis guineensis (масличная пальма), Linum usitatissimum (лен), Brassica juncea, Beta vulgaris (сахарная свекла), Manihot esculenta (маниок), Lycopersicon esculentum (томат), Lactuca sativa (латук), Musyclise alca (банан), Solanum tuberosum (картофель), Brassica oleracea (брокколи, цветная капуста, брюссельская капуста), Camellia sinensis (чай), Fragaria ananassa (земляника), Theobroma cacao (какао), Coffeycliseca (кофе), Vitis vinifera (виноград), Ananas comosus (ананас), Capsicum annum (острый и сладкий перец), Allium cepa (лук), Cucumis melo (дыня), Cucumis sativus (огурец), Cucurbita maxima (тыква гигантская), Cucurbita moschata (тыква мускатная), Spinacea oleracea (шпинат), Citrullus lanatus (арбуз), Abelmoschus esculentus (бамия), Solanum melongena (баклажан), Rosa spp. (роза), Dianthus caryophyllus (гвоздика), Petunia spp. (петуния), Poinsettia pulcherrima (пуансеттия), Lupinus albus (люпин), Uniola paniculata (овес), полевица (Agrostis spp.), Populus tremuloides (тополь осинообразный), Pinus spp. (сосна), Abies spp. (пихта), Acer spp. (клен), Hordeum vulgare (ячмень), Poa pratensis (мятлик), Lolium spp. (плевел) и Phleum pratense (тимофеевка), Panicum virgatum (просо), Sorghuycliseor (сорго, суданская трава), Miscanthus giganteus (мискантус), Saccharum sp. (сахарный тростник), Populus balsamifera (тополь), Zea mays (кукуруза), Glycine max (соя), Brassica napus (канола), Triticum aestivum (пшеница), Gossypium hirsutum (хлопчатник), Oryza sativa (рис), Helianthus annuus (подсолнечник), Medicago sativa (люцерна), Beta vulgaris (сахарная свекла) или Pennisetum glaucum (просо жемчужное). Suitable species may include Panicum spp., Sorghum spp., Miscanthus spp., Saccharum spp., Erianthus spp., Populus spp., Andropogon gerardii (Gerard's bearded vulture), Pennisetum purpureum (elephantgrass), Phalaris arundinacea (reed grass), Cynodon dactylon (piggy finger), Festuca arundinacea (cane fescue), Spartina pectinata (comb spartina), Medicago sativa (alfalfa), Arundo donax (cane arundo), Secale cereale (rye), Salix spp. (willow), Eucalyptus spp. (eucalyptus), Triticosecale (triticale), bamboo, Helianthus annuus (sunflower), Carthamus tinctorius (safflower), Jatropha curcas (jatropha), Ricinus communis (castor bean), Elaeis guineensis (oil palm), Linum usitatissimum (flax), Brassica juncea, Beta vulgaris (sugar beet), Manihot esculenta (cassava), Lycopersicon esculentum (tomato), Lactuca sativa (lettuce), Musyclise alca (banana), Solanum tuberosum (potato), Brassica oleracea (broccoli, cauliflower, Brussels sprouts) , Camellia sinensis (tea), Fragaria ananassa (strawberry), Theobroma cacao (cocoa), Coffeycliseca (coffee), Vitis vinifera (grape), Ananas comosus (pineapple), Capsicum annum (hot and sweet pepper), Allium cepa (onion) , Cucumis melo (melon), Cucumis sativus (cucumber), Cucurbita maxima (giant squash), Cucurbita moschata (nutmeg squash), Spinacea oleracea (spinach), Citrullus lanatus (watermelon), Abelmoschus esculentus (okra), Solanum melongena (eggplant) , Rosa spp. (rose), Dianthus caryophyllus (carnation), Petunia spp. (petunia), Poinsettia pulcherrima (poinsettia), Lupinus albus (lupine), Uniola paniculata (oats), bent grass (Agrostis spp.), Populus tremuloides (aspen poplar), Pinus spp. (pine), Abies spp. (fir), Acer spp. (maple), Hordeum vulgare (barley), Poa pratensis (bluegrass), Lolium spp. (chaff) and Phleum pratense (timothy), Panicum virgatum (millet), Sorghuycliseor (sorghum, Sudan grass), Miscanthus giganteus (miscanthus), Saccharum sp. (sugarcane), Populus balsamifera (poplar), Zea mays (corn), Glycine max (soybean), Brassica napus (canola), Triticum aestivum (wheat), Gossypium hirsutum (cotton), Oryza sativa (rice), Helianthus annuus ( sunflower), Medicago sativa (alfalfa), Beta vulgaris (sugar beet) or Pennisetum glaucum (pearl millet).
Различные варианты осуществления направлены на мутантный табак, не встречающийся в природе табак или трансгенные растения или клетки растения табака, модифицированные для модулирования уровней экспрессии гена, в результате чего получают растения или клетки растения, например растение или клетку растения табака, в которых уровень экспрессии полипептида модулирован в тканях, представляющих интерес, по сравнению с контролем. Раскрытые композиции и способы можно применять в отношении любого вида рода Nicotiana, включая N. rustica и N. tabacum (например, LA B21, LN KY171, TI 1406, Basma, Galpao, Perique, Beinhart 1000-1 и Petico). Другие виды включают N. acaulis, N. acuminata, N. africana, N. alata, N. ameghinoi, N. amplexicaulis, N. arentsii, N. attenuata, N. azambujae, N. benavidesii, N. benthamiana, N. bigelovii, N. bonariensis, N. cavicola, N. clevelandii, N. cordifolia, N. corymbosa, N. debneyi, N. excelsior, N. forgetiana, N. fragrans, N. glauca, N. glutinosa, N. goodspeedii, N. gossei, N. hybrid, N. ingulba, N. kawakamii, N. knightiana, N. langsdorffii, N. linearis, N. longiflora, N. maritima, N. megalosiphon, N. miersii, N. noctiflora, N. nudicaulis, N. obtusifolia, N. occidentalis, N. occidentalis subsp. hesperis, N. otophora, N. paniculata, N. pauciflora, N. petunioides, N. plumbaginifolia, N. quadrivalvis, N. raimondii, N. repanda, N. rosulata, N. rosulata subsp. ingulba, N. rotundifolia, N. setchellii, N. simulans, N. solanifolia, N. spegazzinii, N. stocktonii, N. suaveolens, N. sylvestris, N. thyrsiflora, N. tomentosa, N. tomentosiformis, N. trigonophylla, N. umbratica, N. undulata, N. velutina, N. wigandioides и N. x sanderae.В одном варианте осуществления растение представляет собой N. tabacum. Various embodiments are directed to mutant tobacco, non-naturally occurring tobacco, or transgenic tobacco plants or plant cells modified to modulate gene expression levels, resulting in plants or plant cells, such as a tobacco plant or plant cell, in which the expression level of the polypeptide is modulated. in tissues of interest compared to controls. The disclosed compositions and methods can be applied to any species of the genus Nicotiana , including N. rustica and N. tabacum (eg, LA B21, LN KY171, TI 1406, Basma, Galpao, Perique, Beinhart 1000-1 and Petico). Other species include N. acaulis , N. acuminata, N. africana, N. alata, N. ameghinoi, N. amplexicaulis, N. arentsii, N. attenuata, N. azambujae, N. benavidesii, N. benthamiana, N. bigelovii , N. bonariensis, N. cavicola, N. clevelandii, N. cordifolia, N. corymbosa, N. debneyi, N. excelsior, N. forgetiana, N. fragrans, N. glauca, N. glutinosa, N. goodspeedii, N gossei, N. hybrid, N. ingulba, N. kawakamii, N. knightiana, N. langsdorffii, N. linearis, N. longiflora, N. maritima, N. megalosiphon, N. miersii, N. noctiflora, N. nudicaulis , N. obtusifolia, N. occidentalis, N. occidentalis subsp. hesperis, N. otophora, N. paniculata, N. pauciflora, N. petunioides, N. plumbaginifolia, N. quadrivalvis, N. raimondii, N. repanda, N. rosulata, N. rosulata subsp. ingulba, N. rotundifolia, N. setchellii, N. simulans, N. solanifolia, N. spegazzinii, N. stocktonii, N. suaveolens, N. sylvestris, N. thyrsiflora, N. tomentosa, N. tomentosiformis, N. trigonophylla, N. umbratica, N. undulata, N. velutina, N. wigandioides, and N. x sanderae. In one embodiment, the plant is N. tabacum.
Применение сортов табака и элитных сортов табака также предусмотрено в данном документе. Трансгенное, не встречающееся в природе или мутантное растение, следовательно, может представлять собой разновидность табака или элитный сорт табака, которые содержат один или более трансгенов или одну или более генетических мутаций или их комбинацию. Генетическая мутация (мутации) (например, один или более полиморфизмов) могут представлять собой мутации, которые не существуют в природе в отдельной разновидности табака или сорте табака (например, элитном сорте табака), или может представлять собой генетическую мутацию (мутации), которая (которые) существует(существуют) в природе при условии, что мутация не существует в природе в отдельной разновидности табака или сорте табака (например, в элитном сорте табака). The use of tobacco varieties and elite varieties of tobacco is also contemplated in this document. A transgenic, non-naturally occurring or mutant plant, therefore, may be a variety of tobacco or an elite variety of tobacco that contains one or more transgenes or one or more genetic mutations, or a combination thereof. The genetic mutation(s) (e.g., one or more polymorphisms) may be mutations that do not naturally occur in a particular tobacco variety or tobacco variety (e.g., premium tobacco), or may be a genetic mutation(s) that ( which) exists(exists) in nature, provided that the mutation does not exist naturally in a particular variety of tobacco or variety of tobacco (for example, in an elite variety of tobacco).
Особенно применимые разновидности Nicotiana tabacum включают табак типа Берлей, табак темного типа, табак трубоогневой сушки и табак восточного типа. Неограничивающими примерами разновидностей или сортов являются: BD 64, CC 101, CC 200, CC 27, CC 301, CC 400, CC 500, CC 600, CC 700, CC 800, CC 900, Coker 176, Coker 319, Coker 371 Gold, Coker 48, CD 263, DF911, DT 538 LC табак Galpao, GL 26H, GL 350, GL 600, GL 737, GL 939, GL 973, HB 04P, HB 04P LC, HB3307PLC, гибрид 403LC, гибрид 404LC, гибрид 501 LC, K 149, K 326, K 346, K 358, K394, K 399, K 730, KDH 959, KT 200, KT204LC, KY10, KY14, KY 160, KY 17, KY 171, KY 907, KY907LC, KY14xL8 LC, Little Crittenden, McNair 373, McNair 944, msKY 14xL8, Narrow Leaf Madole, Narrow Leaf Madole LC, NBH 98, N-126, N-777LC, N-7371LC, NC 100, NC 102, NC 2000, NC 291, NC 297, NC 299, NC 3, NC 4, NC 5, NC 6, NC7, NC 606, NC 71, NC 72, NC 810, NC BH 129, NC 2002, Neal Smith Madole, OXFORD 207, PD 7302 LC, PD 7309 LC, PD 7312 LC, табак «Перик», PVH03, PVH09, PVH19, PVH50, PVH51, R 610, R 630, R 7-11, R 7-12, RG 17, RG 81, RG H51, RGH 4, RGH 51, RS 1410, Speight 168, Speight 172, Speight 179, Speight 210, Speight 220, Speight 225, Speight 227, Speight 234, Speight G-28, Speight G-70, Speight H-6, Speight H20, Speight NF3, TI 1406, TI 1269, TN 86, TN86LC, TN 90, TN 97, TN97LC, TN D94, TN D950, TR (Tom Rosson) Madole, VA 309, VA359, AA 37-1, B13P, Xanthi (Mitchell-Mor), Bel-W3, 79-615, Samsun Holmes NN, KTRDC номер 2 гибрид 49, Burley 21, KY8959, KY9, MD 609, PG01, PG04, PO1, PO2, PO3, RG11, RG 8, VA509, AS44, Banket A1, Basma Drama B84/31, Basma I Zichna ZP4/B, Basma Xanthi BX 2A, Batek, Besuki Jember, C104, Coker 347, Criollo Misionero, Delcrest, Djebel 81, DVH 405, Galpão Comum, HB04P, Hicks Broadleaf, Kabakulak Elassona, Kutsage E1, LA BU 21, NC 2326, NC 297, PVH 2110, Red Russian, Samsun, Saplak, Simmaba, Talgar 28, Wislica, Yayaldag, Prilep HC-72, Prilep P23, Prilep PB 156/1, Prilep P12-2/1, Yaka JK-48, Yaka JB 125/3, TI-1068, KDH-960, TI-1070, TW136, Basma, TKF 4028, L8, TKF 2002, GR141, Basma xanthi, GR149, GR153, Petit Havana. Также предусмотрены подразновидности вышеуказанного с низким уровнем превращения никотина в норникотин, даже если они специально не указаны в данном документе.Particularly useful varieties of Nicotiana tabacum include Burley-type tobacco, dark-type tobacco, fire-cured tobacco, and oriental-type tobacco. Non-limiting examples of varieties or varieties are: BD 64, CC 101, CC 200, CC 27, CC 301, CC 400, CC 500, CC 600, CC 700, CC 800, CC 900, Coker 176, Coker 319, Coker 371 Gold, Coker 48, CD 263, DF911, DT 538 LC tobacco Galpao, GL 26H, GL 350, GL 600, GL 737, GL 939, GL 973, HB 04P, HB 04P LC, HB3307PLC, hybrid 403LC, hybrid 404LC, hybrid 501 LC , K 149, K 326, K 346, K 358, K394, K 399, K 730, KDH 959, KT 200, KT204LC, KY10, KY14, KY 160, KY 17, KY 171, KY 907, KY907LC, KY14xL8 LC, Little Crittenden, McNair 373, McNair 944, msKY 14xL8, Narrow Leaf Madole, Narrow Leaf Madole LC, NBH 98, N-126, N-777LC, N-7371LC, NC 100, NC 102, NC 2000, NC 291, NC 297 , NC 299, NC 3, NC 4, NC 5, NC 6, NC7, NC 606, NC 71, NC 72, NC 810, NC BH 129 NC 2002 LC, PD 7312 LC, Perique Tobacco, PVH03, PVH09, PVH19, PVH50, PVH51, R 610, R 630, R 7-11, R 7-12, RG 17, RG 81, RG H51, RGH 4, RGH 51, RS 1410, Speight 168, Speight 172, Speight 179, Speight 210, Speight 220, Speight 225, Speight 227, Speight 234, Speight G-28, Speight G-70, Speight H-6, Speight H20, Speight NF3, TI 1406, TI 1269, TN 86, TN86LC, TN 90, TN 97, TN97LC, TN D94, TN D950, TR (Tom Rosson) Madole, VA 309, VA359, AA 37-1, B13P, Xanthi (Mitchell-Mor) , Bel-W3, 79-615, Samsun Holmes NN, KTRDC number 2 hybrid 49, Burley 21, KY8959, KY9, MD 609, PG01, PG04, PO1, PO2, PO3, RG11, RG 8, VA509, AS44, Banket A1 , Basma Drama B84/31, Basma I Zichna ZP4/B, Basma Xanthi BX 2A, Batek, Besuki Jember, C104, Coker 347, Criollo Misionero, Delcrest, Djebel 81, DVH 405, Galpão Comum, HB04P, Hicks Broadleaf, Kabakulak Elassona , Kutsage E1, LA BU 21, NC 2326, NC 297, PVH 2110, Red Russian, Samsun, Saplak, Simmaba, Talgar 28, Wislica, Yayaldag, Prilep HC-72, Prilep P23, Prilep PB 156/1, Prilep P12- 2/1, Yaka JK-48, Yaka JB 125/3, TI-1068, KDH-960, TI-1070, TW136, Basma, TKF 4028, L8, TKF 2002, GR141, Basma xanthi, GR149, GR153, Petit Havana . Sub-varieties of the above with low nicotine to nornicotine conversion are also contemplated, even though they are not specifically mentioned herein.
Варианты осуществления также направлены на композиции и способы получения мутантных растений, не встречающихся в природе растений, гибридных растений или трансгенных растений, которые были модифицированы для модулирования экспрессии или функции полинуклеотида (полинуклеотидов) NtSUS, описанного (описанных) в данном документе (или любой их комбинации, описанной в данном документе). Преимущественно, полученные мутантные растения, не встречающиеся в природе растения, гибридные растения или трансгенные растения могут быть сходными по общему внешнему виду с контрольными растениями или практически такими же. Различные фенотипические характеристики, такие как степень зрелости, количество листьев на растении, высоту стебля, угол врастания листьев, размер листа (ширина и длина), расстояние междоузлия и соотношение листовая пластина-главная жилка можно оценить путем полевых наблюдений. Embodiments are also directed to compositions and methods for producing mutant plants, non-naturally occurring plants, hybrid plants, or transgenic plants that have been modified to modulate the expression or function of the NtSUS polynucleotide(s) described herein (or any combination thereof). described in this document). Advantageously, the resulting mutant plants, non-naturally occurring plants, hybrid plants or transgenic plants may be similar in general appearance to control plants or substantially the same. Various phenotypic characteristics such as degree of maturity, number of leaves per plant, stem height, leaf ingrowth angle, leaf size (width and length), internode spacing, and lamina-vein ratio can be assessed by field observation.
Один аспект относится к семени мутантного растения, не встречающегося в природе растения, гибридного растения или трансгенного растения, описанного в данном документе. Предпочтительно, семя представляют собой семя табака. Дополнительный аспект относится к пыльце или семяпочке мутантного растения, не встречающегося в природе растения, гибридного растения или трансгенного растения, описанного в данном документе. Кроме того, предусмотрено мутантное растение, не встречающееся в природе растение, гибридное растение или трансгенное растение, описанное в данном документе, которое дополнительно содержит полинуклеотид, обеспечивающий развитие мужской стерильности.One aspect relates to the seed of a mutant plant, a non-naturally occurring plant, a hybrid plant, or a transgenic plant described herein. Preferably, the seed is tobacco seed. An additional aspect relates to the pollen or ovule of a mutant plant, non-naturally occurring plant, hybrid plant or transgenic plant described herein. Furthermore, a mutant plant, a non-naturally occurring plant, a hybrid plant, or a transgenic plant as described herein is provided, which further comprises a male sterility polynucleotide.
Также представлена культура тканей из регенерируемых клеток мутантного растения, не встречающегося в природе растения, гибридного растения или трансгенного растения или его части, как описано в данном документе, при этом из культуры регенерируют растения, способные экспрессировать все морфологические и физиологические характеристики родителя. Регенерируемые клетки включают клетки из листьев, пыльцы, зародышей, семядолей, гипокотилей, корней, кончиков корней, пыльников, цветков и их части, семяпочек, побегов, стеблей, черешков, сердцевины и семенных коробочек, или каллюса, или протопластов, полученных из них. Also provided is tissue culture from regenerated cells of a mutant plant, non-naturally occurring plant, hybrid plant, or transgenic plant or part thereof, as described herein, wherein plants are regenerated from the culture capable of expressing all of the morphological and physiological characteristics of the parent. Regenerated cells include cells from leaves, pollen, embryos, cotyledons, hypocotyls, roots, root tips, anthers, flowers and parts thereof, ovules, shoots, stems, petioles, pith and bolls, or callus, or protoplasts derived therefrom.
Растительный материал, описанный в данном документе, может представлять собой подвергнутый сушке табачный материал, такой как табачный материал, подвергнутый трубоогневой сушке, такой как табак типа Вирджиния, или табачный материал, подвергнутый солнечной сушке, такой как табак типа Берлей и темного типа. Растительный материал, описанный в данном документе, может представлять собой табачный материал, подвергнутый воздушной сушке, такой как табак типа Берлей и темного типа. The plant material described herein may be dried tobacco material such as tube-cured tobacco material such as Virginia type tobacco material or sun-cured tobacco material such as Burley and dark type tobacco material. The plant material described herein may be an air-dried tobacco material such as Burley and dark tobacco.
Рекомендация CORESTA в отношении сушки табака описана в справочнике CORESTA № 17, апрель 2016 г., Sustainability in Leaf Tobacco Production (Принципы устойчивого развития в производстве листового табака). The CORESTA recommendation for tobacco drying is described in CORESTA Handbook No. 17, April 2016, Sustainability in Leaf Tobacco Production.
Модулирование содержания редуцирующих сахаровModulation of reducing sugars
Одна цель заключается в получении мутантных, трансгенных или не встречающихся в природе растений или их частей, которые проявляют модулированные уровни по меньшей мере одного редуцирующего сахара в растительном материале, например, в подвергнутых сушке листьях. Соответственно, мутантные, трансгенные или не встречающиеся в природе растения или их части проявляют модулированные уровни по меньшей мере одного редуцирующего сахара по сравнению с контрольным растением. Предпочтительно, мутантные, трансгенные или не встречающиеся в природе растения или их части имеют по существу тот же внешний вид, что и контрольное растение.One goal is to provide mutant, transgenic or non-naturally occurring plants or parts thereof that exhibit modulated levels of at least one reducing sugar in plant material, such as dried leaves. Accordingly, mutant, transgenic or non-naturally occurring plants or parts thereof exhibit modulated levels of at least one reducing sugar compared to a control plant. Preferably, the mutant, transgenic, or non-naturally occurring plants, or parts thereof, have substantially the same appearance as the control plant.
Соответственно, в данном документе описаны мутантные, трансгенные или не встречающиеся в природе растения или их части или клетки растений, которые характеризуются модулированными уровнями по меньшей мере одного редуцирующего сахара по сравнению с контрольными клетками или контрольными растениями. Мутантные, трансгенные или не встречающиеся в природе растения или клетки растений были подвергнуты модификации для модулирования синтеза или функции одного или более из полипептидов NtSUS, описанных в данном документе, путем модулирования экспрессии одного или более из соответствующих полинуклеотидов NtSUS, описанных в данном документе. Соответственно, модулированные уровни по меньшей мере одного редуцирующего сахара наблюдаются в по меньшей мере зеленых листьях, соответственно, листьях, подвергнутых ранним стадиям сушки, или подвергнутых сушке листьях. В определенных вариантах осуществления можно модулировать уровень редуцирующих сахаров в растении, например, в зеленых листьях, предпочтительно листьях, подвергнутых ранним стадиям сушки, или подвергнутых сушке листьях, или подвергнутом сушке табаке. В определенных вариантах осуществления можно модулировать уровень редуцирующих сахаров в растении, например, в зеленых листьях, предпочтительно листьях, подвергнутых ранним стадиям сушки, подвергнутых сушке листьях или подвергнутом сушке табаке.Accordingly, this document describes mutant, transgenic or non-naturally occurring plants or plant parts or cells that are characterized by modulated levels of at least one reducing sugar compared to control cells or control plants. Mutant, transgenic or non-naturally occurring plants or plant cells have been modified to modulate the synthesis or function of one or more of the NtSUS polypeptides described herein by modulating the expression of one or more of the corresponding NtSUS polynucleotides described herein. Accordingly, modulated levels of at least one reducing sugar are observed in at least green leaves, respectively, leaves subjected to early stages of drying, or leaves subjected to drying. In certain embodiments, it is possible to modulate the level of reducing sugars in a plant, for example, in green leaves, preferably leaves subjected to early stages of drying, or dried leaves, or dried tobacco. In certain embodiments, it is possible to modulate the level of reducing sugars in a plant, such as green leaves, preferably early dried leaves, dried leaves, or dried tobacco.
В определенных вариантах осуществления модулируется активность и/или экспрессия одной или более из NtSUS1-S, NtSUS1-T, NtSUS2-S, NtSUS2-T, NtSUS3-S, NtSUS3-T, NtSUS4-S, NtSUS4-T, NtSUS5-S, NtSUS5-T, NtSUS6-S и NtSUS6-T. In certain embodiments, the activity and/or expression of one or more of NtSUS1-S, NtSUS1-T, NtSUS2-S, NtSUS2-T, NtSUS3-S, NtSUS3-T, NtSUS4-S, NtSUS4-T, NtSUS5-S, NtSUS5-T, NtSUS6-S and NtSUS6-T.
В определенных вариантах осуществления модулируется активность и/или экспрессия одной или более из NtSUS2-S, NtSUS2-T, NtSUS3-S, NtSUS3-T, NtSUS4-S и NtSUS4-T. In certain embodiments, the activity and/or expression of one or more of NtSUS2-S, NtSUS2-T, NtSUS3-S, NtSUS3-T, NtSUS4-S, and NtSUS4-T is modulated.
В определенных вариантах осуществления модулируется активность и/или экспрессия одной или более из NtSUS2-S, NtSUS2-T, NtSUS3-S, NtSUS3-T, NtSUS4-S и NtSUS4-T и не модулируется активность и/или экспрессия одной или более из NtSUS1-S, NtSUS1-T, NtSUS5-S, NtSUS5-T, NtSUS6-S и NtSUS6-T. In certain embodiments, the activity and/or expression of one or more of NtSUS2-S, NtSUS2-T, NtSUS3-S, NtSUS3-T, NtSUS4-S, and NtSUS4-T is modulated and the activity and/or expression of one or more of NtSUS1 is not modulated. -S, NtSUS1-T, NtSUS5-S, NtSUS5-T, NtSUS6-S, and NtSUS6-T.
В определенных вариантах осуществления модулируется активность и/или экспрессия NtSUS2-S, NtSUS2-T, NtSUS3-S, NtSUS3-T, NtSUS4-S и NtSUS4-T и не модулируется активность и/или экспрессия NtSUS1-S, NtSUS1-T, NtSUS5-S, NtSUS5-T, NtSUS6-S и NtSUS6-T. In certain embodiments, the activity and/or expression of NtSUS2-S, NtSUS2-T, NtSUS3-S, NtSUS3-T, NtSUS4-S, and NtSUS4-T is modulated and the activity and/or expression of NtSUS1-S, NtSUS1-T, NtSUS5 is not modulated -S, NtSUS5-T, NtSUS6-S and NtSUS6-T.
В определенных вариантах осуществления модулируется активность и/или экспрессия одной или более из NtSUS2-S, NtSUS3-S, NtSUS3-T и NtSUS4-S и не модулируется активность и/или экспрессия одной или более из NtSUS1-S, NtSUS1-T, NtSUS2-T, NtSUS4-T, NtSUS5-S, NtSUS5-T, NtSUS6-S и NtSUS6-T.In certain embodiments, the activity and/or expression of one or more of NtSUS2-S, NtSUS3-S, NtSUS3-T, and NtSUS4-S is modulated and the activity and/or expression of one or more of NtSUS1-S, NtSUS1-T, NtSUS2 is not modulated. -T, NtSUS4-T, NtSUS5-S, NtSUS5-T, NtSUS6-S, and NtSUS6-T.
В определенных вариантах осуществления модулируется активность и/или экспрессия NtSUS2-S, NtSUS3-S, NtSUS3-T и NtSUS4-S и не модулируется активность и/или экспрессия NtSUS1-S, NtSUS1-T, NtSUS2-T, NtSUS4-T, NtSUS5-S, NtSUS5-T, NtSUS6-S и NtSUS6-T. Дополнительный аспект относится к мутантным, не встречающимся в природе или трансгенным растению или клетке, где экспрессия или функция одного или более из полипептидов NtSUS, описанных в данном документе, является модулированной, и часть растения (например, зеленые листья, предпочтительно листья, подвергнутые ранним стадиям сушки, или подвергнутые сушке листья, или подвергнутый сушке табак) характеризуется сниженными уровнями по меньшей мере одного редуцирующего сахара на по меньшей мере 5% по сравнению с контрольным растением, в котором экспрессия или функция указанного (указанных) полипептида(полипептидов) NtSUS не была модулирована. В определенных вариантах осуществления уровень по меньшей мере одного редуцирующего сахара в растении, например, в зеленых листьях, предпочтительно листьях, подвергнутых ранним стадиям сушки, или подвергнутых сушке листьях, или подвергнутом сушке табаке, можно модулировать, например, на по меньшей мере приблизительно 5%. In certain embodiments, the activity and/or expression of NtSUS2-S, NtSUS3-S, NtSUS3-T, and NtSUS4-S is modulated and the activity and/or expression of NtSUS1-S, NtSUS1-T, NtSUS2-T, NtSUS4-T, NtSUS5 is not modulated -S, NtSUS5-T, NtSUS6-S and NtSUS6-T. An additional aspect relates to a mutant, non-naturally occurring or transgenic plant or cell, where the expression or function of one or more of the NtSUS polypeptides described herein is modulated, and the plant part (e.g., green leaves, preferably leaves subjected to early stages of drying, or dried leaves, or dried tobacco) has at least 5% reduced levels of at least one reducing sugar compared to a control plant in which expression or function of said NtSUS polypeptide(s) has not been modulated. In certain embodiments, the level of at least one reducing sugar in a plant, e.g., green leaves, preferably leaves subjected to early stages of drying, or dried leaves, or dried tobacco, can be modulated, for example, by at least about 5% .
Еще один аспект относится к подвергнутому сушке растительному материалу, такому как подвергнутый сушке лист или подвергнутый сушке табак, полученному или получаемому из мутантных, не встречающихся в природе или трансгенных растения или клетки, где экспрессия одного или более из полинуклеотидов NtSUS, описанных в данном документе, или функция полипептида NtSUS, кодируемого ими, являются модулироваными и где уровень по меньшей мере одного редуцирующего сахара модулирован на по меньшей мере 5% по сравнению с контрольным растением.Another aspect relates to dried plant material, such as dried leaf or dried tobacco, obtained or derived from mutant, non-naturally occurring or transgenic plants or cells, wherein the expression of one or more of the NtSUS polynucleotides described herein, or the function of the NtSUS polypeptide encoded by them is modulated and wherein the level of at least one reducing sugar is modulated by at least 5% compared to a control plant.
Предпочтительно, внешний вид указанного растения или его части (например, листа) является практически таким же, как у контрольного растения. Предпочтительно, растение представляет собой растение табака или кофейное растение.Preferably, the appearance of said plant or part (eg, leaf) is substantially the same as that of a control plant. Preferably, the plant is a tobacco plant or a coffee plant.
Варианты осуществления также направлены на композиции и способы получения мутантных, не встречающихся в природе или трансгенных растений или клеток растений, которые были модифицированы для модулирования экспрессии или функции одного или более из полинуклеотидов NtSUS или полипептидов NtSUS, описанных в данном документе, что может приводить к растениям или компонентам растения (например, листьям, таким как зеленые листья, или листья, подвергнутые ранним стадиям сушки, или подвергнутые сушке листья, или табак) или клеткам растений с модулированным содержанием редуцирующих сахаров. Embodiments are also directed to compositions and methods for producing mutant, non-naturally occurring, or transgenic plants or plant cells that have been modified to modulate the expression or function of one or more of the NtSUS polynucleotides or NtSUS polypeptides described herein, which can result in plants or plant components (eg, leaves, such as green leaves, or leaves subjected to early stages of drying, or dried leaves, or tobacco) or plant cells with modulated reducing sugar content.
Мутантные, не встречающиеся в природе или трансгенные растения, полученные в соответствии с настоящим изобретением, по внешнему виду могут быть подобны контрольным растениям или быть по существу такими же как контрольные растения. В одном варианте осуществления вес листьев у мутантного, не встречающегося в природе или трансгенного растения является практически таким же, как у контрольного растения. В одном варианте осуществления количество листьев у мутантного, не встречающегося в природе или трансгенного растения является практически таким же, как у контрольного растения. В одном варианте осуществления вес листьев и количество листьев у мутантного, не встречающегося в природе или трансгенного растения является практически таким же, как у контрольного растения. В одном варианте осуществления высота стебля у мутантных, не встречающихся в природе или трансгенных растений является практически такой же, как у контрольных растений, через, например, один, два или три или более месяцев после пересадки в поле или через 10, 20, 30 или 36 или более дней после обрезания верхушек. Например, высота стебля у мутантных, не встречающихся в природе или трансгенных растений не меньше, чем высота стебля у контрольных растений. В другом варианте осуществления содержание хлорофилла у мутантных, не встречающихся в природе или трансгенных растений является практически таким же, как у контрольных растений. В другом варианте осуществления высота стебля у мутантных, не встречающихся в природе или трансгенных растений является практически такой же, как у контрольных растений, и содержание хлорофилла у мутантных, не встречающихся в природе или трансгенных растений является практически таким же, как у контрольных растений. В других вариантах осуществления размер или форма или количество или окраска листьев у мутантных, не встречающихся в природе или трансгенных растений являются практически такими же, как у контрольных растений. Предпочтительно, растение представляет собой растение табака или кофейное растение. Mutant, non-naturally occurring or transgenic plants obtained in accordance with the present invention may be similar in appearance to control plants or be essentially the same as control plants. In one embodiment, the leaf weight of the mutant, non-naturally occurring, or transgenic plant is substantially the same as that of the control plant. In one embodiment, the number of leaves in the mutant, non-naturally occurring, or transgenic plant is substantially the same as the control plant. In one embodiment, the leaf weight and number of leaves of the mutant, non-naturally occurring, or transgenic plant is substantially the same as the control plant. In one embodiment, the stem height of the mutant, non-naturally occurring, or transgenic plants is substantially the same as that of control plants at, for example, one, two, or three or more months after being transplanted into the field, or at 10, 20, 30 or 36 or more days after topping. For example, the stem height of the mutant, non-naturally occurring or transgenic plants is no less than the stem height of the control plants. In another embodiment, the chlorophyll content of the mutant, non-naturally occurring, or transgenic plants is substantially the same as that of control plants. In another embodiment, the stem height of the mutant, non-naturally occurring or transgenic plants is substantially the same as the control plants, and the chlorophyll content of the mutant, non-naturally occurring or transgenic plants is substantially the same as the control plants. In other embodiments, the size or shape or number or color of the leaves of the mutant, non-naturally occurring, or transgenic plants are substantially the same as control plants. Preferably, the plant is a tobacco plant or a coffee plant.
В другом аспекте представлен способ модулирования количества по меньшей мере одного редуцирующего сахара в по меньшей мере части растения (например, листьях, таких как подвергнутые сушке листья, или в табаке), включающий стадии: (i) модулирования экспрессии или функции одного или более из полипептидов NtSUS, описанных в данном документе (или любой их комбинаций, описанной в данном документе), предпочтительно, где полипептид (полипептиды) NtSUS кодируется (кодируются) соответствующими полинуклеотидами NtSUS, описанными в данном документе; (ii) измерения уровня по меньшей мере одного редуцирующего сахара в по меньшей мере части (например, листьях, таких как подвергнутые сушке листья, или в табаке, или в дыме) мутантного, не встречающегося в природе или трансгенного растения, полученного на стадии (i); и (iii) идентификации мутантного, не встречающегося в природе или трансгенного растения, в котором уровень по меньшей мере одного редуцирующего сахара был модулирован по сравнению с контрольным растением. Предпочтительно внешний вид указанного мутантного, не встречающегося в природе или трансгенного растения является практически таким же, как у контрольного растения. Предпочтительно растение представляет собой растение табака. In another aspect, a method is provided for modulating the amount of at least one reducing sugar in at least part of a plant (e.g., leaves, such as dried leaves, or in tobacco), comprising the steps of: (i) modulating the expression or function of one or more of the polypeptides The NtSUS described herein (or any combination thereof described herein), preferably, wherein the NtSUS polypeptide(s) are encoded by the corresponding NtSUS polynucleotides described herein; (ii) measuring the level of at least one reducing sugar in at least a portion (e.g., leaves, such as dried leaves, or tobacco, or smoke) of the mutant, non-naturally occurring, or transgenic plant obtained in step (i ); and (iii) identifying a mutant, non-naturally occurring, or transgenic plant in which the level of at least one reducing sugar has been modulated compared to a control plant. Preferably, the appearance of said mutant, non-naturally occurring, or transgenic plant is substantially the same as that of the control plant. Preferably the plant is a tobacco plant.
В другом аспекте представлен способ модулирования количества по меньшей мере одного редуцирующего сахара в по меньшей мере части подвергнутого сушке растительного материала, такого как подвергнутый сушке лист, включающий стадии: (i) модулирования экспрессии или функции одного или более из полипептидов NtSUS (или любой их комбинации, описанной в данном документе), предпочтительно, где полипептид (полипептиды) NtSUS кодируется(кодируются) соответствующими полинуклеотидами NtSUS, описанными в данном документе; (ii) сбора растительного материала, такого как один или более листьев, и сушки в течение определенного периода времени; (iii) измерения уровня по меньшей мере одного редуцирующего сахара в по меньшей мере части подвергнутого сушке растительного материала, полученного на стадии (ii) или во время стадии (ii); и (iv) идентификации подвергнутого сушке растительного материала, в котором уровень по меньшей мере одного редуцирующего сахара был модулирован по сравнению с контрольным растением. In another aspect, a method is provided for modulating the amount of at least one reducing sugar in at least a portion of a dried plant material, such as a dried leaf, comprising the steps of: (i) modulating the expression or function of one or more of the NtSUS polypeptides (or any combination thereof). described herein), preferably wherein the NtSUS polypeptide(s) is(are) encoded by the corresponding NtSUS polynucleotides described herein; (ii) collecting plant material, such as one or more leaves, and drying for a specified period of time; (iii) measuring the level of at least one reducing sugar in at least a portion of the dried plant material obtained in step (ii) or during step (ii); and (iv) identifying dried plant material in which the level of at least one reducing sugar has been modulated compared to a control plant.
Повышение экспрессии по сравнению с контролем может составлять от приблизительно 5% до приблизительно 100%, или повышение составляет по меньшей мере 10%, по меньшей мере 20%, по меньшей мере 25%, по меньшей мере 30%, по меньшей мере 40%, по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 98% или 100% или более, например, 200%, 300%, 500%, 1000% или более, что включает повышение транскрипционной функции, или уровня экспрессии полинуклеотида NtSUS, или уровня экспрессии полипептида NtSUS, или их комбинацию. The increase in expression compared to the control can be from about 5% to about 100%, or the increase is at least 10%, at least 20%, at least 25%, at least 30%, at least 40%, at least 50%, at least 60%, at least 70%, at least 75%, at least 80%, at least 90%, at least 95%, at least 98% or 100% or more, for example, 200%, 300%, 500%, 1000% or more, which includes an increase in transcriptional function, or the expression level of the NtSUS polynucleotide, or the expression level of the NtSUS polypeptide, or a combination thereof.
Повышение функции или активности по сравнению с контролем может составлять от приблизительно 5% до приблизительно 100%, или повышение составляет по меньшей мере 10%, по меньшей мере 20%, по меньшей мере 25%, по меньшей мере 30%, по меньшей мере 40%, по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 98% или 100% или более, как, например, 200%, 300%, 500%, 1000% или более.The increase in function or activity compared to control can be from about 5% to about 100%, or the increase is at least 10%, at least 20%, at least 25%, at least 30%, at least 40 %, at least 50%, at least 60%, at least 70%, at least 75%, at least 80%, at least 90%, at least 95%, at least 98% or 100% or more, such as 200%, 300%, 500%, 1000% or more.
Снижение экспрессии по сравнению с контролем может составлять от приблизительно 5% до приблизительно 100%, или снижение составляет по меньшей мере 10%, по меньшей мере 20%, по меньшей мере 25%, по меньшей мере 30%, по меньшей мере 40%, по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 98% или 100%, что включает снижение транскрипционной функции, или экспрессии полинуклеотида NtSUS, или экспрессии полипептида NtSUS, или их комбинацию. The reduction in expression compared to the control may be from about 5% to about 100%, or the reduction is at least 10%, at least 20%, at least 25%, at least 30%, at least 40%, at least 50%, at least 60%, at least 70%, at least 75%, at least 80%, at least 90%, at least 95%, at least 98% or 100% which includes a decrease in transcriptional function, or the expression of an NtSUS polynucleotide, or the expression of an NtSUS polypeptide, or a combination thereof.
Понижение функции или активности по сравнению с контролем может составлять от приблизительно 5% до приблизительно 100%, или понижение составляет по меньшей мере 10%, по меньшей мере 20%, по меньшей мере 25%, по меньшей мере 30%, по меньшей мере 40%, по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 98% или 100%. The decrease in function or activity compared to control may be from about 5% to about 100%, or the decrease is at least 10%, at least 20%, at least 25%, at least 30%, at least 40 %, at least 50%, at least 60%, at least 70%, at least 75%, at least 80%, at least 90%, at least 95%, at least 98% or 100%.
Полинуклеотиды и рекомбинантные конструкции, описанные в данном документе, можно применять для модулирования экспрессии, или функции, или активности полинуклеотидов NtSUS или полипептидов NtSUS, описанных в данном документе, в представляющем интерес виде растений, предпочтительно в табаке. The polynucleotides and recombinant constructs described herein can be used to modulate the expression or function or activity of the NtSUS polynucleotides or NtSUS polypeptides described herein in a plant species of interest, preferably in tobacco.
Целый ряд способов на основе полинуклеотидов можно применять для повышения уровня экспрессии генов в растениях и клетках растений. В качестве примера, можно получать конструкцию, вектор или вектор экспрессии, совместимые с подлежащим трансформации растением, которые содержат представляющий интерес ген вместе с расположенным выше по последовательности промотором, способным к обеспечению сверхэкспрессии гена в растении или клетке растения. Иллюстративные промоторы описаны в данном документе. После трансформации и при выращивании в подходящих условиях промотор может управлять экспрессией для модулирования уровней NtSUS в растении или в его конкретной ткани. В одном иллюстративном варианте осуществления создают вектор, несущий один или более полинуклеотидов NtSUS, описанных в данном документе (или любую их комбинацию, описанную в данном документе), для сверхэкспрессии гена в растении или клетке растения. Вектор несет подходящий промотор, такой как промотор 35S вируса мозаики цветной капусты CaMV, расположенный выше по последовательности от трансгена, который запускает его конститутивную экспрессию во всех тканях растения. Вектор также несет ген устойчивости к антибиотику с целью обеспечения возможности отбора трансформированных каллюсов и линий клеток. A variety of polynucleotide-based methods can be used to increase the level of gene expression in plants and plant cells. By way of example, a construct, vector, or expression vector compatible with the plant to be transformed can be prepared that contains the gene of interest together with an upstream promoter capable of causing the gene to be overexpressed in the plant or plant cell. Exemplary promoters are described herein. After transformation and when grown under suitable conditions, the promoter can drive expression to modulate the levels of NtSUS in the plant or in a particular tissue thereof. In one exemplary embodiment, a vector carrying one or more of the NtSUS.beta. polynucleotides described herein (or any combination thereof as described herein) is created to overexpress a gene in a plant or plant cell. The vector carries a suitable promoter, such as the cauliflower mosaic virus CaMV 35S promoter upstream of the transgene, which triggers its constitutive expression in all plant tissues. The vector also carries an antibiotic resistance gene to enable selection of transformed calluses and cell lines.
Экспрессию последовательностей с промоторов можно усилить посредством включения последовательностей, обеспечивающих контроль экспрессии, в том числе энхансеров, активирующих хроматин элементов, элементов, чувствительных к факторам транскрипции и т. п. Такие последовательности, обеспечивающие контроль, могут быть конститутивными и повышать уровень транскрипции универсальным образом; или они могут быть факультативными и повышать уровень транскрипции в ответ на конкретные сигналы. Отдельно следует указать сигналы, связанные со старением, и сигналы, которые активны во время процедуры сушки.Expression of sequences from promoters can be enhanced by including expression control sequences, including enhancers, chromatin activating elements, transcription factor responsive elements, and the like. Such control sequences can be constitutive and increase transcription in a versatile manner; or they may be facultative and increase the level of transcription in response to specific signals. Separately, the signals associated with aging and the signals that are active during the drying procedure should be specified.
Таким образом, различные варианты осуществления направлены на способы модулирования уровня экспрессии одного или более полинуклеотидов NtSUS, описанных в данном документе (или любой их комбинации, описанной в данном документе), путем интеграции нескольких копий полинуклеотида NtSUS в геном растения, включающие: трансформацию клетки растения-хозяина с помощью вектора экспрессии, который содержит промотор, функционально связанный с одним или более полинуклеотидами NtSUS, описанными в данном документе. Полипептид, кодируемый рекомбинантным полинуклеотидом, может являться нативным полипептидом или может являться гетерологичным по отношению к клетке. Thus, various embodiments are directed to methods of modulating the expression level of one or more of the NtSUS polynucleotides described herein (or any combination thereof described herein) by integrating multiple copies of the NtSUS polynucleotide into the plant genome, comprising: transforming a plant cell - host with an expression vector that contains a promoter operably linked to one or more of the NtSUSα polynucleotides described herein. The polypeptide encoded by the recombinant polynucleotide may be a native polypeptide or may be heterologous to the cell.
В одном варианте осуществления растение для применения по настоящему изобретению представляет собой растение, которое подвергнуто трубоогневой сушке, поскольку такие растения характеризуются высоким содержанием редуцирующих сахаров (более приблизительно 14% от сухого веса при выращивании в поле в конце сушки). Мутантные, трансгенные или не встречающиеся в природе растения или их части, которые подвергнуты трубоогневой сушке, могут характеризоваться содержанием редуцирующих сахаров, которое составляет менее приблизительно 14% сухого веса при выращивании в поле в конце сушки, например, менее приблизительно 10% от сухого веса при выращивании в поле в конце сушки, или менее приблизительно 5% от сухого веса при выращивании в поле в конце сушки, или менее приблизительно 1% от сухого веса при выращивании в поле в конце сушки. In one embodiment, the plant for use in the present invention is a plant that has been fire-dried because such plants are high in reducing sugars (greater than about 14% dry weight when grown in the field at the end of drying). Mutant, transgenic, or non-naturally occurring plants or parts thereof that have been fire-dried may have a reducing sugar content that is less than about 14% dry weight when grown in the field at the end of drying, such as less than about 10% dry weight when grown in the field at the end of drying, or less than about 5% dry weight when grown in the field at the end of drying, or less than about 1% dry weight when grown in the field at the end of drying.
В одном варианте осуществления растение для применения по настоящему изобретению представляет собой растение, которое подвергнуто солнечной сушке, поскольку такие растения характеризуются содержанием редуцирующего сахара, составляющим более приблизительно 6,8% от сухого веса при выращивании в поле в конце сушки. Мутантные, трансгенные или не встречающиеся в природе растения или их части, которые подвергнуты солнечной сушке, могут характеризоваться содержанием редуцирующих сахаров, составляющим менее приблизительно 5% от сухого веса при выращивании в поле в конце сушки, например, менее приблизительно 2,5% от сухого веса при выращивании в поле в конце сушки, или менее приблизительно 1% от сухого веса при выращивании в поле в конце сушки. In one embodiment, the plant for use in the present invention is a plant that has been sun-dried, since such plants have a reducing sugar content of greater than about 6.8% dry weight when grown in the field at the end of drying. Mutant, transgenic, or non-naturally occurring plants or parts thereof that have been sun-dried may have a reducing sugar content of less than about 5% dry weight when grown in the field at the end of drying, such as less than about 2.5% dry weight. weight when grown in the field at the end of drying, or less than about 1% of the dry weight when grown in the field at the end of drying.
В одном варианте осуществления растение для применения по настоящему изобретению представляет собой растение, подвергнутое воздушной сушке. Такие растения характеризуются содержанием редуцирующих сахаров, составляющим более приблизительно 1,7% от сухого веса при выращивании в поле в конце сушки. Мутантные, трансгенные или не встречающиеся в природе растения или их части, которые подвергнуты солнечной сушки, могут характеризоваться содержанием редуцирующих сахаров, составляющим менее приблизительно 1,5% от сухого веса при выращивании в поле в конце сушки, например, менее приблизительно 1% от сухого веса при выращивании в поле в конце сушки, или менее приблизительно 0,5% от сухого веса при выращивании в поле в конце сушки.In one embodiment, the plant for use in the present invention is an air-dried plant. Such plants are characterized by a reducing sugar content of greater than about 1.7% dry weight when grown in the field at the end of drying. Mutant, transgenic, or non-naturally occurring plants or parts thereof that have been sun-dried may have a reducing sugar content of less than about 1.5% dry weight when grown in the field at the end of drying, such as less than about 1% dry weight. weight when grown in the field at the end of drying, or less than about 0.5% dry weight when grown in the field at the end of drying.
В определенных вариантах осуществления предпочтительно применение растения, подвергнутого трубоогневой сушке или солнечной сушке.In certain embodiments, it is preferable to use a fire-dried or sun-dried plant.
Измерение содержания свободных аминокислотMeasurement of free amino acids
Содержание аминокислот можно измерять с помощью различных способов, известных из уровня техники. Одним из таких способов является способ MP 1471 rev 5 2011, Resana, Italy: Chelab Silliker S.r.l, Mérieux NutriSciences Company. Для выявления аминокислот в листьях растения, подвергнутых сушке, после удаления средней жилки пластинки, подвергнутые сушке, при необходимости сушат при 40°C в течение 2-3 дней. Затем табачный материал измельчают в тонкодисперсный порошок (~100 мкM) перед анализом на содержание аминокислот. Другой способ измерения содержания аминокислот в растительном материале описан в UNI EN ISO 13903:2005.В определенных вариантах осуществления измерение содержания свободных аминокислот проводят в соответствии с UNI EN ISO 13903:2005.The content of amino acids can be measured using various methods known from the prior art. One such method is MP 1471 rev 5 2011, Resana, Italy: Chelab Silliker S.r.l, Mérieux NutriSciences Company. In order to detect amino acids in the dried leaves of the plant, after removal of the midrib, the dried lamellae are, if necessary, dried at 40° C. for 2-3 days. The tobacco material is then ground into a fine powder (~100 μM) prior to analysis for amino acid content. Another method for measuring amino acid content in plant material is described in UNI EN ISO 13903:2005. In certain embodiments, free amino acid content is measured in accordance with UNI EN ISO 13903:2005.
Измерение содержания редуцирующих сахаровMeasurement of reducing sugars
Содержание редуцирующих сахаров можно измерять с применением колориметрического способа с сегментированным потоком, разработанного для анализа образцов табака, адаптированного в Skalar Instrument Co (Западный Честер, Пенсильвания) и описанного в Tobacco Science 20: 139-144 (1976). Измерение содержания редуцирующих сахаров также описано в Coresta Recommended Method 38, CRM38, CRM и ISO 15154: 2003. Для определения редуцирующих сахаров в подвергнутых сушке листьях подвергнутые сушке пластинки после удаления средней жилки сушат при 40°C в течение 2-3 дней, если необходимо. Затем табачный материал измельчают в тонкодисперсный порошок (~100 мкм) перед проведением анализов на редуцирующие сахара. В определенных вариантах осуществления измерение содержания редуцирующих сахаров проводят в соответствии с ISO 15154: 2003.The content of reducing sugars can be measured using a segmented flow colorimetric method developed for the analysis of tobacco samples, adapted from Skalar Instrument Co (West Chester, PA) and described in Tobacco Science 20: 139-144 (1976). The measurement of reducing sugars is also described in Coresta Recommended Method 38, CRM38, CRM and ISO 15154: 2003. To determine the reducing sugars in dried leaves, the dried leaflets after removal of the midrib are dried at 40°C for 2-3 days, if necessary. . The tobacco material is then ground to a fine powder (~100 µm) prior to analysis for reducing sugars. In certain embodiments, the measurement of reducing sugars is carried out in accordance with ISO 15154:2003.
СелекцияSelection
Растение, несущее мутантный аллель одного или более полинуклеотидов NtSUS, описанных в данном документе (или любой их комбинации, описанной в данном документе), можно применять в программе селекции растений для создания применимых линий, сортов и гибридов. В частности, мутантный аллель интрогрессируют в коммерчески важные разновидности, описанные выше. Таким образом, предложены способы селекции растений, которые предусматривают скрещивание мутантного растения, не встречающегося в природе растения или трансгенного растения, как описано в данном документе, с растением, характеризующимся иными генетическими особенностями. Способ может дополнительно включать скрещивание растения-потомка с другим растением и необязательно повторение скрещивания до тех пор, пока не будет получено потомка с необходимыми генетическими признаками или генетическим фоном. Одной из целей, для которой подходят такие способы селекции, является введение желаемого генетического признака в другие разновидности, селекционные линии, гибриды или сорта, особенно те, которые представляют коммерческий интерес. Другой целью является облегчение накопления генетических модификаций различных генов в отдельных разновидностях, линиях, гибридах или сортах растений. Предусмотрены внутривидовые, а также межвидовые скрещивания. Растения-потомки, которые возникают в результате таких скрещиваний, также называемые селекционными линиями, являются примерами не встречающихся в природе растений по настоящему изобретению.A plant carrying a mutant allele of one or more of the NtSUSβ polynucleotides described herein (or any combination thereof described herein) can be used in a plant breeding program to create useful lines, cultivars and hybrids. In particular, the mutant allele is introgressed into the commercially important varieties described above. Thus, plant breeding methods are provided which involve crossing a mutant plant, a non-naturally occurring plant, or a transgenic plant, as described herein, with a plant having different genetic characteristics. The method may further comprise crossing the progeny plant with another plant, and optionally repeating the crossing until a progeny with the desired genetic traits or genetic background is obtained. One purpose for which such breeding methods are suitable is to introduce the desired genetic trait into other varieties, breeding lines, hybrids or varieties, especially those of commercial interest. Another purpose is to facilitate the accumulation of genetic modifications of various genes in individual varieties, lines, hybrids or plant varieties. Intraspecific as well as interspecific crosses are provided. The progeny plants that result from such crosses, also referred to as breeding lines, are examples of non-naturally occurring plants of the present invention.
В одном варианте осуществления предусмотрен способ получения не встречающегося в природе растения, включающий: (a) скрещивание мутантного или трансгенного растения со вторым растением с получением семени растения табака-потомка; (b) выращивание семени растения табака-потомка в пригодных для роста растений условиях с получением не встречающегося в природе растения. Способ может дополнительно включать: (c) скрещивание предыдущего поколения не встречающегося в природе растения с самим собою или с другим растением с получением семени растения табака-потомка; (d) выращивание семени растения табака-потомка из стадии (c) в пригодных для роста растений условиях с получением дополнительных не встречающихся в природе растений; и (e) повторение стадий скрещивания и выращивания (c) и (d) несколько раз с получением следующих поколений не встречающихся в природе растений. Способ может необязательно предусматривать перед стадией (a) стадию получения родительского растения, которое содержит охарактеризованные генетические особенности и которое не идентично мутантному или трансгенному растению. В некоторых вариантах осуществления в зависимости от программы селекции стадии скрещивания и выращивания повторяют от 0 до 2 раз, от 0 до 3 раз, от 0 до 4 раз, от 0 до 5 раз, от 0 до 6 раз, от 0 до 7 раз, от 0 до 8 раз, от 0 до 9 раз или от 0 до 10 раз для получения поколений не встречающихся в природе растений. Обратное скрещивание является примером такого способа, в котором потомка скрещивают с одним из его родителей или с другим растением, генетически сходным с его родителем, для получения растения-потомка в следующем поколении, которое имеет генетические особенности, более близкие к одному из родителей. Методики селекции растений, в частности селекции растений, хорошо известны и могут применяться в способах по настоящему изобретению. В настоящем изобретении дополнительно предложены не встречающиеся в природе растения, полученные с помощью данных способов. Определенные варианты осуществления исключают стадию отбора растения. In one embodiment, a method for producing a non-naturally occurring plant is provided, comprising: (a) crossing a mutant or transgenic plant with a second plant to produce seed from a progeny tobacco plant; (b) growing the seed of the progeny tobacco plant under conditions suitable for plant growth to produce a non-naturally occurring plant. The method may further comprise: (c) crossing a previous generation of a non-naturally occurring plant with itself or with another plant to produce seed of a progeny tobacco plant; (d) growing the seed of the progeny tobacco plant of step (c) under conditions suitable for plant growth to produce additional non-naturally occurring plants; and (e) repeating the crossing and rearing steps (c) and (d) several times to produce further generations of non-naturally occurring plants. The method may optionally include before step (a) the step of obtaining a parent plant that contains the characterized genetic features and is not identical to the mutant or transgenic plant. In some embodiments, depending on the breeding program, the crossing and rearing steps are repeated 0 to 2 times, 0 to 3 times, 0 to 4 times, 0 to 5 times, 0 to 6 times, 0 to 7 times, 0 to 8 times, 0 to 9 times, or 0 to 10 times to obtain generations of non-naturally occurring plants. Backcrossing is an example of such a method in which a progeny is crossed with one of its parents or with another plant genetically similar to its parent to produce a progeny plant in the next generation that has genetic characteristics more closely related to one of the parents. Plant breeding techniques, in particular plant breeding, are well known and can be used in the methods of the present invention. The present invention further provides non-naturally occurring plants obtained using these methods. Certain embodiments omit the plant selection step.
В некоторых вариантах осуществления способов, описанных в данном документе, линии, полученные в результате селекции и скрининга на наличие вариантных генов, оценивают в поле с применением стандартных полевых процедур. Предусмотрены контрольные генотипы, в том числе генотип исходного не подвергнутого мутагенезу родителя, и места посадки растений расположены в поле согласно рандомизированному полноблочному плану или согласно другому соответствующему планированию поля. Для табака используют стандартные агрономические методики, например, табак собирают, взвешивают и отбирают образцы для химического и другого общепринятого тестирования до и во время сушки. Статистический анализ данных выполняют для подтверждения сходства отобранных линий с родительской линией. Цитогенетические анализы отобранных растений необязательно выполняют для подтверждения взаимосвязей набора хромосом и конъюгации хромосом.In some embodiments of the methods described herein, lines resulting from selection and screening for the presence of variant genes are evaluated in the field using standard field procedures. Control genotypes are provided, including the genotype of the original non-mutated parent, and planting sites are located in the field according to a randomized block plan or other appropriate field planning. For tobacco, standard agronomic practices are used, for example, tobacco is harvested, weighed and sampled for chemical and other conventional testing before and during drying. Statistical data analysis is performed to confirm the similarity of the selected lines with the parent line. Cytogenetic analyzes of selected plants are optionally performed to confirm the relationships of chromosome set and chromosome conjugation.
ДНК-фингерпринтинг, однонуклеотидный полиморфизм, микросателлитные маркеры или подобные технологии можно применять в программе селекции с отбором с помощью маркера (MAS) для переноса или разведения мутантных аллелей гена в других растениях табака, как описано в данном документе. Например, селекционер может создать расщепляющиеся популяции при гибридизации генотипа, содержащего мутантный аллель, с необходимым с агрономической точки зрения генотипом. Растения из F2 или поколений, полученных в результате обратного скрещивания, можно подвергнуть скринингу с применением маркера, полученного из геномной последовательности или ее фрагмента, с применением одной из методик, перечисленных в данном документе. Растения, идентифицированные как обладающие мутантным аллелем, можно подвергнуть обратному скрещиванию или самоопылению для создания второй популяции, подлежащей скринингу. В зависимости от предполагаемого способа наследования или применяемой технологии MAS для отобранных растений может быть необходимым самоопыление перед каждым циклом обратного скрещивания для облегчения обнаружения необходимых отдельных растений. Обратное скрещивание или другую процедуру селекции можно повторять до тех пор, пока необходимый фенотип рекуррентного родителя не восстановится.DNA fingerprinting, single nucleotide polymorphism, microsatellite markers, or similar technologies can be used in a marker-assisted selection (MAS) breeding program to transfer or breed mutant gene alleles in other tobacco plants, as described herein. For example, a breeder can create segregated populations by hybridizing a genotype containing a mutant allele with an agronomically desired genotype. Plants from F2 or backcross generations can be screened with a marker derived from the genomic sequence or fragment thereof using one of the techniques listed herein. Plants identified as having the mutant allele can be backcrossed or selfed to create a second population to be screened. Depending on the intended mode of inheritance or the applied MAS technology, it may be necessary for the selected plants to self-pollinate before each backcrossing cycle to facilitate the discovery of the individual plants needed. Backcrossing or other selection procedure can be repeated until the desired phenotype of the recurrent parent is restored.
Согласно настоящему изобретению в программе селекции успешные скрещивания дают растения F1, которые являются фертильными. Отобранные растения F1 можно скрещивать с одним из родителей, и для растений первого поколения, полученного в результате обратного скрещивания, можно обеспечивать самоопыление с получением популяции, которую снова подвергают скринингу в отношении экспрессии вариантного гена (например, нулевой версии гена). Процесс обратного скрещивания, самоопыления и скрининга повторяют, например, по меньшей мере 4 раза до тех пор, пока при окончательном скрининге не получат растение, которое является фертильным и в достаточной степени подобным рекуррентному родителю. Это растение, при необходимости, самоопыляют и затем потомство снова подвергают скринингу, чтобы подтвердить, что растение демонстрирует экспрессию вариантного гена. В некоторых вариантах осуществления популяцию растений в поколении F2 подвергают скринингу на наличие экспрессии вариантного гена, например растение, которое не экспрессирует полипептид из-за отсутствия гена, идентифицируют согласно стандартным способам, например с помощью методики ПЦР с применением праймеров, созданных на основе информации о последовательности полинуклеотидов для полинуклеотида (полинуклеотидов), описанного в данном документе (или любой их комбинации, описанной в данном документе). According to the present invention, in a breeding program, successful crosses produce F1 plants that are fertile. Selected F1 plants can be crossed with one of the parents, and the first generation plants resulting from backcrossing can be self-pollinated to produce a population that is again screened for expression of a variant gene (eg, a null version of the gene). The process of backcrossing, selfing and screening is repeated, for example, at least 4 times until the final screening produces a plant that is fertile and sufficiently similar to the recurrent parent. This plant is self-pollinated, if necessary, and then the progeny are screened again to confirm that the plant is expressing the variant gene. In some embodiments, the F2 generation plant population is screened for expression of the variant gene, e.g., a plant that does not express the polypeptide due to the absence of the gene is identified according to standard methods, e.g., using a PCR technique using primers designed based on the sequence information. polynucleotides for the polynucleotide(s) described herein (or any combination thereof described herein).
Разновидности гибридного табака можно получить путем предотвращения самоопыления женских родительских растений (то есть родительских форм) первой разновидности, позволяя пыльце с мужских родительских растений второй разновидности оплодотворить женские родительские растения и обеспечивая образование гибридных семян F1 на женских растениях. Самоопыление женских растений можно предотвратить путем кастрации цветков на ранней стадии развития цветка. В качестве альтернативы, образование пыльцы на женских родительских растениях можно предотвратить, используя какую-либо форму мужской стерильности. Например, мужскую стерильность можно обеспечить посредством цитоплазматической мужской стерильности (CMS) или трансгенной мужской стерильности, где трансген подавляет микроспорогенез и/или образование пыльцы или вызывает самонесовместимость. Женские родительские растения, содержащие CMS, являются особенно применимыми. В вариантах осуществления, в которых женские родительские растения характеризуются CMS, пыльцу собирают с мужских фертильных растений и наносят вручную на рыльца женских родительских растений с CMS и собирают полученные семена F1. Hybrid tobacco varieties can be produced by preventing the female parent plants (ie parental forms) of the first variety from self-pollinating, allowing pollen from the male parental plants of the second variety to fertilize the female parental plants, and producing F1 hybrid seeds on the female plants. Self-pollination of female plants can be prevented by castrating the flowers early in flower development. Alternatively, pollen production on the female parent plants can be prevented using some form of male sterility. For example, male sterility can be achieved through cytoplasmic male sterility (CMS) or transgenic male sterility, where the transgene suppresses microsporogenesis and/or pollen production or causes self-incompatibility. Female parent plants containing CMS are particularly useful. In embodiments in which the female parent plants are characterized by CMS, pollen is collected from the male fertile plants and applied by hand to the stigmas of the CMS female parent plants and the resulting F1 seeds are harvested.
Разновидности и линии, описанные в данном документе, можно применять для образования простых гибридов F1 табака. В таких вариантах осуществления растения родительских разновидностей можно выращивать в виде практически однородных смежных популяций для облегчения естественного перекрестного опыления женских родительских растений мужскими родительскими растениями. Семена F1, образовавшиеся на женских родительских растениях, выборочно собирают с помощью обычных средств. Можно также вырастить две разновидности родительского растения в массе и собрать смесь гибридных F1 семян, образовавшихся на женской особи, и семян, образовавшихся на мужской особи в результате самоопыления. В качестве альтернативы, можно осуществить трехлинейное скрещивание, где простой гибрид F1 используют в качестве женской особи и скрещивают с другой мужской особью. В качестве другой альтернативы, можно создать гибриды двойного скрещивания, где потомство F1 двух разных простых гибридов скрещивают само с собой.The varieties and lines described herein can be used to form F1 tobacco simple hybrids. In such embodiments, plants of parental varieties can be grown in substantially uniform contiguous populations to facilitate natural cross-pollination of female parent plants by male parent plants. F1 seeds produced on female parent plants are selectively harvested by conventional means. It is also possible to grow two varieties of the parent plant en masse and collect a mixture of F1 hybrid seeds produced on the female and seeds produced on the male by self-pollination. Alternatively, a trilinear cross can be made where a single F1 hybrid is used as the female and crossed with another male. As another alternative, double cross hybrids can be created, where the F1 offspring of two different simple hybrids are crossed with themselves.
Популяцию мутантных, не встречающихся в природе или трансгенных растений можно подвергнуть скринингу или отбору в отношении тех представителей популяции, которые имеют необходимый признак или фенотип. Например, популяцию из потомства линии с одной трансформацией можно подвергнуть скринингу в отношении тех растений, которые имеют необходимый уровень экспрессии или функции полипептида (полипептидов), кодируемого с ее помощью. Физические и биохимические способы можно применять для выявления уровней экспрессии или активности. Они включают анализ по Саузерну или ПЦР-амплификацию для выявления полинуклеотида; нозерн-блоттинг, анализ с защитой от РНКазы S1, анализ методом удлинения праймера или RT-PCR-амплификацию для выявления РНК-транскриптов; ферментные анализы для выявления ферментативной или рибозимной функции полипептидов и полинуклеотидов; и гель-электрофорез полипептида, вестерн-блоттинг, иммунопреципитацию и иммуноферментные анализы для выявления полипептидов. Другие методики, такие как гибридизация in situ, ферментное окрашивание и иммуноокрашивание, и ферментные анализы также можно применять для выявления присутствия или экспрессии, функции или активности полипептидов NtSUS или полинуклеотидов NtSUS. A population of mutant, non-naturally occurring, or transgenic plants can be screened or selected for those members of the population that have the desired trait or phenotype. For example, a population from the progeny of a single transformation line can be screened for those plants that have the desired level of expression or function of the polypeptide(s) encoded therewith. Physical and biochemical methods can be used to detect levels of expression or activity. These include Southern analysis or PCR amplification to detect the polynucleotide; Northern blot, RNase S1 protection assay, primer extension assay, or RT-PCR amplification to detect RNA transcripts; enzyme assays to detect the enzymatic or ribozyme function of polypeptides and polynucleotides; and polypeptide gel electrophoresis, Western blotting, immunoprecipitation, and enzyme immunoassays to detect polypeptides. Other techniques such as in situ hybridization, enzyme staining and immunostaining, and enzyme assays can also be used to detect the presence or expression, function or activity of NtSUS polypeptides or NtSUS polynucleotides.
В данном документе описаны мутантные, не встречающиеся в природе или трансгенные клетки растения и растения, содержащие один или более рекомбинантных полинуклеотидов, одну или более полинуклеотидных конструкций, одну или более двунитевых РНК, один или более конъюгатов или один или более векторов/векторов экспрессии. This document describes mutant, non-naturally occurring or transgenic plant and plant cells containing one or more recombinant polynucleotides, one or more polynucleotide constructs, one or more double-stranded RNAs, one or more conjugates, or one or more vectors/expression vectors.
5. Модификация других генов5. Modification of other genes
В частности, растения и их части, описанные в данном документе, можно модифицировать либо до, либо после модулирования экспрессии, функции или активности одного или более полинуклеотидов NtSUS и/или полипептидов NtSUS в соответствии с настоящим изобретением. In particular, the plants and parts thereof described herein can be modified either before or after modulating the expression, function, or activity of one or more NtSUS polynucleotides and/or NtSUS polypeptides in accordance with the present invention.
Одна или более следующих дополнительных генетических модификаций могут присутствовать в мутантных, не встречающихся в природе или трансгенных растениях или их частях. One or more of the following additional genetic modifications may be present in mutant, non-naturally occurring or transgenic plants or parts thereof.
Один или более генов, которые вовлечены в превращение промежуточных продуктов азотного обмена могут быть модифицированы, что в результате приводит к более низким уровням по меньшей мере одного специфичного для табака нитрозамина (TSNA). Неограничивающие примеры таких генов включают гены, кодирующие никотин-деметилазу, такие как CYP82E4, CYP82E5 и CYP82E10, описанные в WO2006/091194, WO2008/070274, WO2009/064771 и WO2011/088180, а также нитратредуктазу, описанные в WO2016/046288. One or more genes that are involved in the conversion of nitrogen metabolism intermediates can be modified, resulting in lower levels of at least one tobacco-specific nitrosamine (TSNA). Non-limiting examples of such genes include genes encoding nicotine demethylase such as CYP82E4, CYP82E5 and CYP82E10 described in WO2006/091194, WO2008/070274, WO2009/064771 and WO2011/088180, as well as nitrate reductase, described listed in WO2016/046288.
Один или более генов, которые принимают участие в поглощении тяжелых металлов или транспорте тяжелых металлов, могут быть модифицированы, что в результате приводит к более низкому содержанию тяжелых металлов. Неограничивающие примеры включают семейства полипептидов, ассоциированных с множественной лекарственной устойчивостью, семейства посредников диффузии катионов (CDF), семейство Zrt-, Irt-подобных полипептидов (ZIP), семейство катионообменников (CAX), семейство транспортеров меди (COPT), семейство АТФаз тяжелых металлов (например, HMA, как описано в WO2009/074325 и WO2017/129739), семейство гомологов полипептидов макрофагов, ассоциированных с естественной устойчивостью (NRAMP), и другие члены семейства транспортеров с АТФ-связывающей кассетой (ABC) (например, MRP), как описано в WO2012/028309, которые участвуют в транспорте тяжелых металлов, таких как кадмий. One or more genes that are involved in heavy metal uptake or heavy metal transport may be modified, resulting in lower levels of heavy metals. Non-limiting examples include the polypeptide families associated with multidrug resistance, the cation diffusion mediator (CDF) families, the Zrt-, Irt-like polypeptide (ZIP) family, the cation exchanger (CAX) family, the copper transporter (COPT) family, the heavy metal ATPase family ( e.g. HMA as described in WO2009/074325 and WO2017/129739), the macrophage homologue polypeptide family associated with natural resistance (NRAMP), and other members of the ATP-binding cassette (ABC) transporter family (e.g. MRP) as described in WO2012/028309 which are involved in the transport of heavy metals such as cadmium.
Другие иллюстративные модификации могут приводить к получению растений с модулированной экспрессией или функцией изопропилмалатсинтазы, что в результате приводит к изменению композиции сложного эфира сахарозы, которая может использоваться для изменения ароматического профиля (см. WO2013/029799).Other illustrative modifications can result in plants with modulated isopropyl malate synthase expression or function, resulting in a change in sucrose ester composition that can be used to change the aroma profile (see WO2013/029799).
Другие иллюстративные модификации могут приводить к получению растений с модулированной экспрессией или функцией треонинсинтазы, при этом можно модулировать уровни метионала (см. WO2013/029800).Other exemplary modifications can result in plants with modulated threonine synthase expression or function, where methional levels can be modulated (see WO2013/029800).
Другие иллюстративные модификации могут приводить к получению растений с модулированной экспрессией или функцией одного или более из неоксантинсинтазы, ликопен-бета-циклазы и 9-цис-эпоксикаротиноиддиоксигеназы для модуляции содержания бета-дамасценона, чтобы изменить вкусоароматический профиль (см. WO2013/064499). Other exemplary modifications may result in plants with modulated expression or function of one or more of neoxanthine synthase, lycopene beta cyclase, and 9-epoxycarotenoid dioxygenase to modulate beta-damascenone content to alter flavor profile (see WO2013/064499).
Другие иллюстративные модификации могут приводить к получению растений с модулированными экспрессией или функцией членов семейства CLC хлоридных каналов для модулирования в них уровней нитратов (см. WO2014/096283 и WO2015/197727).Other exemplary modifications may result in plants with modulated expression or function of chloride channel members of the CLC family to modulate their nitrate levels (see WO2014/096283 and WO2015/197727).
Другие иллюстративные модификации могут приводить к получению растений с модулированной экспрессией или функцией одной или более аспарагинсинтетаз для модулирования уровней аспарагина в листе и обеспечения модулированных уровней акриламида в аэрозоле, полученном при нагревании или горении листа (см. WO2017/042162). Other exemplary modifications may result in plants with modulated expression or function of one or more asparagine synthetases to modulate asparagine levels in the leaf and provide modulated levels of acrylamide in the aerosol produced by heating or burning the leaf (see WO2017/042162).
Примеры других модификаций включают модуляцию переносимости гербицида, например, глифосат является активным ингредиентом множества гербицидов широкого спектра действия. Устойчивые к глифосату трансгенные растения были разработаны путем переноса гена aroA (глифосат-EPSP-синтетаза из Salmonella typhimurium и E.coli). Устойчивые к сульфонилмочевине растения были получены путем трансформации мутантного гена ALS (ацетолактатсинтетаза) из Arabidopsis. Полипептид OB фотосистемы II из мутантного Amaranthus hybridus был перенесен в растения с получением атразин-устойчивых трансгенных растений; и бромоксинил-устойчивые трансгенные растения были получены путем встраивания гена bxn из бактерии Klebsiella pneumoniae. Examples of other modifications include modulating herbicide tolerance, for example, glyphosate is an active ingredient in many broad spectrum herbicides. Glyphosate-resistant transgenic plants have been developed by gene transfer of aroA (glyphosate-EPSP synthetase from Salmonella typhimurium and E. coli ). Sulfonylurea-resistant plants were obtained by transformation of the mutant ALS (acetolactate synthetase) gene from Arabidopsis. The photosystem II OB polypeptide from the mutant Amaranthus hybridus was transferred into plants to produce atrazine-resistant transgenic plants; and bromoxynil-resistant transgenic plants were obtained by inserting the bxn gene from the bacterium Klebsiella pneumoniae.
Другие примеры модификаций приводят в результате к получению растений, которые устойчивы к насекомым. Токсины Bacillus thuringiensis(Bt) могут обеспечить эффективный путь отсрочки появления Bt-устойчивых вредителей, как недавно показано на брокколи, где гены Bt cry1Ac и cry1C в составе «пирамиды» обеспечивали контроль капустной моли, устойчивой к любому отдельному полипептиду, и существенно задерживали эволюционное развитие устойчивых насекомых. Other examples of modifications result in plants that are resistant to insects. toxinsBacillus thuringiensis(Bt) can provide an efficient path delaying the emergence of Bt-resistant pests, as recently shown on broccoli, where the Bt genescry1Ac And cry1C as part of the "pyramid" provided control of the cabbage moth, resistant to any individual polypeptide, and significantly delayed evolutionary development of resistant insects.
Другая иллюстративная модификация в результате приводит к получению растений, которые устойчивы к заболеваниям, вызванным патогенами (например, вирусами, бактериями, грибами). Были разработаны растения, экспрессирующие ген Xa21 (устойчивость к бактериальному некрозу), с растениями, экспрессирующими как ген слияния Bt, так и ген хитиназы (устойчивость к желтой огневке-травянке и выносливость в отношении ризоктониоза). Another exemplary modification results in plants that are resistant to diseases caused by pathogens (eg, viruses, bacteria, fungi). Plants expressing the Xa21 gene (bacterial necrosis resistance) have been developed, with plants expressing both the Bt fusion gene and the chitinase gene (yellow grass moth resistance and rhizoctonia tolerance).
Другая иллюстративная модификация в результате приводит к корректированию репродуктивной способности, например к мужской стерильности. Another exemplary modification results in a fertility adjustment, such as male sterility.
Другая иллюстративная модификация приводит в результате к получению растений, которые выносливы в отношении абиотического стресса (например, засухе, изменению температуры, засоленности), и выносливые трансгенные растения были получены путем переноса фермента ацилглицерол-фосфат-ацилтрансферазы из Arabidopsis; гены, кодирующие маннитол-дегидрогеназу и сорбитолдегидрогеназу, которые принимают участие в синтезе маннита и сорбита, улучшают устойчивость к засухе. Another exemplary modification results in plants that are tolerant of abiotic stress (eg, drought, temperature change, salinity), and tolerant transgenic plants were obtained by transferring the enzyme acylglycerol phosphate acyltransferase from Arabidopsis; genes encoding mannitol dehydrogenase and sorbitol dehydrogenase, which are involved in the synthesis of mannitol and sorbitol, improve drought tolerance.
Другая иллюстративная модификация приводит к растениям, в которых модулирована активность одной или нескольких эндогенных гликозилтрансфераз, таких как N-ацетилглюкозаминилтрансфераза, β(1,2)-ксилозилтрансфераза и a(1,3)-фукозилтрансфераза (см. WO2011/117249). Another exemplary modification results in plants in which the activity of one or more endogenous glycosyltransferases, such as N-acetylglucosaminyltransferase, β(1,2)-xylosyltransferase and a(1,3)-fucosyltransferase, is modulated (see WO2011/117249).
Другая иллюстративная модификация в результате приводит к получению растений, в которых активность одной или более никотин-N-деметилаз модулируют таким образом, что могут модулироваться уровни норникотина и метаболитов норникотина, которые образуются во время сушки (см. WO2015169927).Another exemplary modification results in plants in which the activity of one or more nicotine N-demethylases is modulated such that the levels of nornicotine and nornicotine metabolites that form during drying can be modulated (see WO2015169927).
Другие иллюстративные модификации могут приводить к получению растений с улучшенными характеристиками запасных полипептидов и масел, растений с повышенной эффективностью фотосинтеза, растений с длительным сроком хранения, растений с повышенным содержанием углеводов и растений, устойчивых к грибам. Также представлены трансгенные растения, в которых была подвергнута модулированию экспрессия S-аденозил-L-метионина (SAM) и/или цистатионин-гамма-синтазы (CGS). Other exemplary modifications can result in plants with improved storage polypeptide and oil characteristics, plants with increased photosynthetic efficiency, plants with a long shelf life, plants with increased carbohydrate content, and plants resistant to fungi. Also presented are transgenic plants in which the expression of S-adenosyl-L-methionine (SAM) and/or cystathionine gamma synthase (CGS) has been modulated.
Один или более генов, которые вовлечены в путь синтеза никотина, можно модифицировать с получением растений или частей растений, которые при сушке вырабатывают модулированные уровни никотина. Гены синтеза никотина могут быть выбраны из группы, состоящей из: A622, BBLa, BBLb, JRE5L1, JRE5L2, MATE1, MATE 2, MPO1, MPO2, MYC2a, MYC2b, NBB1, nic1, nic2, NUP1, NUP2, PMT1, PMT2, PMT3, PMT4 и QPT или комбинации одного или более из них. One or more genes that are involved in the nicotine synthesis pathway can be modified to produce plants or plant parts that produce modulated levels of nicotine when dried. Nicotine synthesis genes can be selected from the group consisting of: A622, BBLa, BBLb, JRE5L1, JRE5L2, MATE1, MATE 2, MPO1, MPO2, MYC2a, MYC2b , NBB1, nic1, nic2, NUP1, NUP2, PMT1, PMT2, PMT3 , PMT4 and QPT or combinations of one or more of them.
Один или более генов, которые вовлечены в регулирование количества одного или более алкалоидов, можно модифицировать с получением растений или частей растений, которые при сушке вырабатывают модулированные уровни алкалоида. Гены, обеспечивающие контроль уровня алкалоидов, могут быть выбраны из группы, состоящей из BBLa, BBLb, JRE5L1, JRE5L2, MATE1, MATE 2, MYC2a, MYC2b, nic1, nic2, NUP1 и NUP2 или комбинации двух или более из них.One or more genes that are involved in regulating the amount of one or more alkaloids can be modified to produce plants or plant parts that produce modulated alkaloid levels when dried. Alkaloid control genes may be selected from the group consisting of BBLa , BBLb, JRE5L1, JRE5L2, MATE1, MATE2, MYC2a, MYC2b, nic1, nic2, NUP1, and NUP2 , or a combination of two or more of these.
Один или более таких признаков можно интрогрессировать в мутантные, не встречающиеся в природе или трансгенные растения другого сорта или можно непосредственно трансформировать в них. One or more of these traits can be introgressed into, or directly transformed into, mutant, non-naturally occurring, or transgenic plants of another variety.
В различных вариантах осуществления предусмотрены мутантные растения, не встречающиеся в природе растения или трансгенные растения, а также биомасса, в которых уровень экспрессии одного или более полинуклеотидов в соответствии с настоящим изобретением являются модулированными для модулирования таким образом уровня полипептида(полипептидов), кодируемого ими.In various embodiments, mutant plants, non-naturally occurring plants or transgenic plants, as well as biomass, are provided in which the expression level of one or more polynucleotides of the present invention is modulated to thereby modulate the level of the polypeptide(s) encoded by them.
6. Продукты потребления6. Consumer products
Части растений, описанных в данном документе, в частности листовую пластинку и среднюю жилку данных растений, можно включить в изготовление или применять в изготовлении различных продуктов потребления, включая без ограничения материалы, образующие аэрозоль, устройства, образующие аэрозоль, курительные изделия, изделия для курения, бездымные продукты, медицинские или косметические продукты, препараты для внутривенного введения, таблетки, порошки и табачные продукты. Примеры материалов, образующих аэрозоль, включают табачные композиции, виды табака, табачный экстракт, резаный табак, резаный наполнитель, сушеный табак, взорванный табак, гомогенизированный табак, восстановленный табак и виды трубочного табака. Курительные изделия и изделия для курения являются, как правило, устройствами, образующими аэрозоль. Примеры курительных изделий или изделий для курения включают сигареты, сигариллы и сигары. Примеры бездымных продуктов включают жевательный табак и нюхательный табак. В определенных устройствах, образующих аэрозоль, вместо сгорания, табачная композиция или другой материал, образующий аэрозоль, нагревают с помощью одного или более электрических нагревательных элементов с получением аэрозоля. В другом типе нагреваемого устройства, образующего аэрозоль, аэрозоль получают путем перемещения тепла от горючего топливного элемента или источника тепла к физически отделенному материалу, образующему аэрозоль, который может быть расположен внутри, вокруг или ниже по потоку относительно источника тепла. Бездымные табачные продукты и различные табак-содержащие материалы, образующие аэрозоль, могут содержать табак в любом виде, в том числе в виде высушенных частиц, кусков, гранул, порошков или суспензии, нанесенной на, смешанной с, окруженной или иным образом комбинированной с другими ингредиентами в любом формате, таком как хлопья, пленки, таблетки, пены или шарики. Используемый в данном документе термин «дым» используют для описания типа аэрозоля, который получен с помощью курительных изделий, таких как сигареты, или при сжигании материала, образующего аэрозоль.Parts of the plants described herein, in particular the leaf blade and midrib of these plants, can be incorporated into or used in the manufacture of a variety of consumer products, including, but not limited to, aerosol generating materials, aerosol generating devices, smoking articles, smoking articles, smokeless products, medical or cosmetic products, intravenous preparations, tablets, powders and tobacco products. Examples of aerosol forming materials include tobacco compositions, tobacco species, tobacco extract, cut tobacco, cut filler, dried tobacco, exploded tobacco, homogenized tobacco, reconstituted tobacco, and pipe tobacco species. Smoking articles and smoking articles are generally aerosol generating devices. Examples of smoking or smoking articles include cigarettes, cigarillos and cigars. Examples of smokeless products include chewing tobacco and snuff. In certain aerosol generating devices, instead of combustion, the tobacco composition or other aerosol generating material is heated by one or more electrical heating elements to produce an aerosol. In another type of heated aerosol generating device, the aerosol is produced by transferring heat from a combustible fuel cell or heat source to a physically separated aerosol generating material that may be located in, around, or downstream of the heat source. Smokeless tobacco products and various aerosol-forming tobacco-containing materials may contain tobacco in any form, including dried particles, lumps, granules, powders, or a suspension applied to, mixed with, surrounded by, or otherwise combined with other ingredients. in any format such as flakes, films, tablets, foams or pellets. As used herein, the term "smoke" is used to describe the type of aerosol that is produced by smoking articles such as cigarettes or by burning an aerosol-forming material.
В одном варианте осуществления также предусмотрен растительный материал, подвергнутый сушке, из мутантных, трансгенных и не встречающихся в природе растений, описанных в данном документе. Способы сушки зеленых табачных листьев известны специалистам в данной области и включают без ограничения воздушную сушку, огневую сушку, трубоогневую сушку и солнечную сушку, как описано в данном документе. In one embodiment, dried plant material is also provided from the mutant, transgenic, and non-naturally occurring plants described herein. Methods for drying green tobacco leaves are known to those skilled in the art and include, without limitation, air drying, fire drying, fire tube drying, and sun drying, as described herein.
В другом варианте осуществления описаны табачные продукты, в том числе табаксодержащие материалы, образующие аэрозоль, содержащие растительный материал, такой как листья, предпочтительно листья, подвергнутые сушке, из мутантных растений табака, трансгенных растений табака или не встречающихся в природе растений табака, описанных в данном документе. Табачные продукты, описанные в данном документе, могут быть смешанными табачными изделиями, которые могут дополнительно содержать немодифицированный табак. In another embodiment, tobacco products are described, including aerosolized tobacco-containing materials containing plant material such as leaves, preferably dried leaves, from mutant tobacco plants, transgenic tobacco plants, or non-naturally occurring tobacco plants described herein. document. The tobacco products described herein may be blended tobacco products, which may additionally contain unmodified tobacco.
7. Продукты и способы возделывания культур и сельского хозяйства7. Products and methods of cultivation and agriculture
Для мутантных, не встречающихся в природе или трансгенных растений могут существовать другие варианты применения в, например, сельском хозяйстве. Например, мутантные, не встречающиеся в природе или трансгенные растения, описанные в данном документе, можно применять для изготовления корма для животных и продуктов питания для человека. For mutant, non-natural or transgenic plants, there may be other uses in, for example, agriculture. For example, the mutant, non-naturally occurring, or transgenic plants described herein can be used to make animal feed and human food.
В настоящем изобретении также предусмотрены способы получения семян, включающие культивирование мутантного растения, не встречающегося в природе растения или трансгенного растения, описанных в данном документе, и сбор семян культивируемых растений. Семена растений, описанных в данном документе, можно кондиционировать и упаковать в упаковочный материал с помощью средств, известных в данной области техники, с получением промышленного изделия. Упаковочный материал, такой как бумага или ткань, хорошо известен в данной области техники. Упаковка семян может иметь этикетку, например маркировку или этикетку, прикрепленную к упаковочному материалу, этикетку, напечатанную на упаковке, которая описывает происхождение содержащихся в ней семян. The present invention also provides methods for producing seeds, comprising cultivating a mutant plant, a non-naturally occurring plant, or a transgenic plant as described herein, and collecting the seeds of the cultivated plants. The seeds of the plants described herein can be conditioned and packaged in a packaging material using means known in the art to form an article of manufacture. Packaging material such as paper or cloth is well known in the art. The seed package may have a label, such as a label or label attached to the packaging material, a label printed on the package, which describes the origin of the seeds it contains.
Композиции, способы и наборы для генотипирования растений с целью идентификации, отбора или селекции могут включать средства для выявления присутствия полинуклеотида NtSUS (или любой их комбинации, описанной в данном документе) в образце полинуклеотида. Соответственно, описана композиция, содержащая один или более праймеров для специфической амплификации по меньшей мере части одного или более из полинуклеотидов NtSUS, и необязательно один или более зондов, и необязательно один или более реагентов для проведения амплификации или выявления. Compositions, methods, and kits for plant genotyping for identification, selection, or selection may include means for detecting the presence of an NtSUS polynucleotide (or any combination thereof described herein) in a polynucleotide sample. Accordingly, a composition is described comprising one or more primers for specifically amplifying at least a portion of one or more of the NtSUSα polynucleotides, and optionally one or more probes, and optionally one or more amplification or detection reagents.
Соответственно, раскрыты специфичные в отношении гена олигонуклеотидные праймеры или зонды, содержащие приблизительно 10 или более смежных полинуклеотидов, соответствующих полинуклеотиду(полинуклеотидам) NtSUS, описанному(описанным) в данном документе. Указанные праймеры или зонды могут содержать или состоять из приблизительно 15, 20, 25, 30, 40, 45 или 50 или более смежных полинуклеотидов, которые гибридизируются (например, специфически гибридизируются) с полинуклеотидом (полинуклеотидами) NtSUS, описанным (описанными) в данном документе. В некоторых вариантах осуществления праймеры или зонды могут содержать или состоять из приблизительно 10-50 смежных нуклеотидов, приблизительно 10-40 смежных нуклеотидов, приблизительно 10-30 смежных нуклеотидов или приблизительно 15-30 смежных нуклеотидов, которые можно применять в зависимых от последовательности способах идентификации гена (например, Саузерн-гибридизации), или выделения (например, гибридизации in situ бактериальных колоний или бляшек бактериофага), или обнаружения гена (например, в качестве одного или более праймеров амплификации при амплификации или обнаружении). Один или более специфических праймеров или зондов можно разработать и применять для амплификации и обнаружения части или всего полинуклеотида (полинуклеотидов). В качестве конкретного примера, два праймера можно применять в протоколе ПЦР для амплификации полинуклеотидного фрагмента. ПЦР можно также проводить с применением одного праймера, который получен из последовательности полинуклеотида, и второго праймера, который гибридизируется с последовательностью выше или ниже последовательности полинуклеотида, такой как последовательность промотора, 3'-конец мРНК-предшественника или последовательность, полученная из вектора. Примеры методик с повышением температуры и изотермических методик, применимых для амплификации полинуклеотидов in vitro, хорошо известны из уровня техники. Образец может происходить или его можно получить из растения, клетки растения, или растительного материала, или табачного продукта, изготовленных из растения, клетки растения или растительного материала, как описано в данном документе.Accordingly, gene-specific oligonucleotide primers or probes containing about 10 or more contiguous polynucleotides corresponding to the NtSUS polynucleotide(s) described herein are disclosed. Said primers or probes may contain or consist of about 15, 20, 25, 30, 40, 45, or 50 or more contiguous polynucleotides that hybridize (e.g., specifically hybridize) to the NtSUS polynucleotide(s) described herein. . In some embodiments, primers or probes may comprise or consist of about 10-50 contiguous nucleotides, about 10-40 contiguous nucleotides, about 10-30 contiguous nucleotides, or about 15-30 contiguous nucleotides, which can be used in sequence-dependent gene identification methods. (eg, Southern hybridization), or isolation (eg, in situ hybridization of bacterial colonies or bacteriophage plaques), or gene detection (eg, as one or more amplification primers in amplification or detection). One or more specific primers or probes can be designed and used to amplify and detect part or all of a polynucleotide(s). As a specific example, two primers can be used in a PCR protocol to amplify a polynucleotide fragment. PCR can also be performed using one primer that is derived from a polynucleotide sequence and a second primer that hybridizes to a sequence above or below the polynucleotide sequence, such as a promoter sequence, the 3' end of a precursor mRNA, or a sequence derived from a vector. Examples of elevated temperature and isothermal techniques useful for amplifying polynucleotides in vitro are well known in the art. The sample may originate from or be obtained from a plant, plant cell, or plant material, or a tobacco product made from a plant, plant cell, or plant material, as described herein.
В дополнительном аспекте также представлен способ выявления в образце полинуклеотида (полинуклеотидов) NtSUS, описанного(-ых) в данном документе (или любой их комбинации, описанной в данном документе), включающий стадию: (a) получения образца, содержащего или предположительно содержащего полинуклеотид; (b) приведения указанного образца в контакт с одним или более праймерами или одним или более зондами для специфического выявления по меньшей мере части полинуклеотида(-ов) NtSUS; и (c) выявления присутствия продукта амплификации, где присутствие продукта амплификации свидетельствует о присутствии полинуклеотида (полинуклеотидов) NtSUS в образце. В дополнительном аспекте также представлено применение одного или более праймеров или зондов для специфического выявления по меньшей мере части полинуклеотида (полинуклеотидов) NtSUS. Также представлены наборы для выявления по меньшей мере части полинуклеотида(полинуклеотидов) NtSUS, которые содержат один или более праймеров или зондов для специфического выявления по меньшей мере части полинуклеотида (полинуклеотидов) NtSUS. Набор может содержать реагенты для амплификации полинуклеотида, например реагенты для ПЦР, или реагенты для технологии обнаружения с применением гибридизационного зонда, такой как Саузерн-блоттинг, нозерн-блоттинг, гибридизация in situ или микрочип. Набор может содержать реагенты для технологии обнаружения связывания антител, такой как вестерн-блоттинг, ELISA, SELDI-масс-спектрометрия или тест-полоски. Набор может содержать реагенты для секвенирования ДНК. Набор может содержать реагенты и инструкции по применению набора. In a further aspect, a method is also provided for detecting in a sample the NtSUS polynucleotide(s) described herein (or any combination thereof described herein), comprising the step of: (a) obtaining a sample containing or suspected to contain a polynucleotide; (b) bringing said sample into contact with one or more primers or one or more probes to specifically detect at least a portion of the NtSUS polynucleotide(s); and (c) detecting the presence of an amplification product, wherein the presence of an amplification product is indicative of the presence of the NtSUS polynucleotide(s) in the sample. In a further aspect, the use of one or more primers or probes to specifically detect at least a portion of the NtSUS polynucleotide(s) is also provided. Also provided are kits for detecting at least a portion of an NtSUS polynucleotide(s) that contain one or more primers or probes for specifically detecting at least a portion of an NtSUS polynucleotide(s). The kit may contain polynucleotide amplification reagents, such as PCR reagents, or reagents for probe hybridization detection technology, such as Southern blot, Northern blot, in situ hybridization, or microarray. The kit may contain reagents for antibody binding detection technology such as Western blotting, ELISA, SELDI mass spectrometry, or test strips. The kit may contain reagents for DNA sequencing. The kit may contain reagents and instructions for using the kit.
В некоторых вариантах осуществления набор может содержать инструкции для одного или более описанных способов. Описанные наборы могут быть применимы для определения генетической идентичности, филогенетических исследований, генотипирования, гаплотипирования, анализа родословной или селекции растений, в частности, с количественной оценкой кодоминантных признаков.In some embodiments, the kit may contain instructions for one or more of the methods described. The disclosed kits may be useful for genetic identity determination, phylogenetic studies, genotyping, haplotyping, pedigree analysis or plant breeding, in particular for quantifying codominant traits.
В настоящем изобретении также представлен способ генотипирования растения, клетки растения или растительного материала, содержащих полинуклеотид NtSUS, описанный в данном документе. Генотипирование обеспечивает средства различения гомологов пары хромосом и может быть использовано для различения сегрегантов в популяции растений. Способы на основе применения молекулярных маркеров можно применять для филогенетических исследований, характеризующих генетические связи между разновидностями сельскохозяйственных культур, выявления гибридов или соматических гибридов, локализации хромосомных сегментов, влияющих на моногенные признаки, клонирования на основе генетических карт и изучения количественного наследования. В определенном способе генотипирования может использоваться любое количество аналитических методик с молекулярным маркером, включая такие на основе полиморфизма длин амплифицированных фрагментов (AFLP). AFLP является результатом аллельных различий между амплифицированными фрагментами, вызванных изменчивостью полинуклеотида. Таким образом, в настоящем изобретении дополнительно предложены способы отслеживания сегрегации одного или более генов или полинуклеотидов, а также хромосомных последовательностей, генетически связанных с этими генами или полинуклеотидами, с применением таких методик, как анализ AFLP.The present invention also provides a method for genotyping a plant, plant cell, or plant material containing an NtSUS.beta. polynucleotide described herein. Genotyping provides a means of distinguishing chromosome pair homologues and can be used to distinguish between segregants in a plant population. Methods based on the use of molecular markers can be used for phylogenetic studies characterizing genetic relationships between crop varieties, identifying hybrids or somatic hybrids, localizing chromosomal segments that affect monogenic traits, cloning based on genetic maps, and studying quantitative inheritance. Any number of molecular marker assays may be used in a particular genotyping method, including those based on amplified fragment length polymorphism (AFLP). AFLP is the result of allelic differences between amplified fragments caused by polynucleotide variability. Thus, the present invention further provides methods for tracking the segregation of one or more genes or polynucleotides, as well as chromosomal sequences genetically related to those genes or polynucleotides, using techniques such as AFLP analysis.
Настоящее изобретение дополнительно описано в примерах ниже, которые представлены для более подробного описания настоящего изобретения. Эти примеры, в которых изложен предпочтительный режим, предусмотренный в настоящее время для осуществления настоящего изобретения, предназначены для иллюстрации, а не для ограничения настоящего изобретения.The present invention is further described in the examples below, which are provided to describe the present invention in more detail. These examples, which set out the preferred mode currently provided for the implementation of the present invention, are intended to illustrate and not to limit the present invention.
ПРИМЕРЫEXAMPLES
Пример 1. Идентификация ключевых генов метаболизма сахарозы после сушки в листе табака Берлей, Вирджиния и восточного типаExample 1 Identification of Key Genes for Sucrose Metabolism After Drying in Burley, Virginia and Oriental Tobacco Leaf
Для идентификации ключевых функций, вносящих вклад в метаболизм сахарозы во время ранних стадий сушки листа табака Берлей, Вирджиния и восточного типа, проводили анализ преобладания в отношении функции генов, экспрессия которых повышена в подвергнутых сушке листьях после 48 часов сушки в сравнении со спелыми листьями в момент сбора урожая (log2-кратное изменение >2, скорректированное p-значение <0,05) табака Берлей, Вирджиния и восточного типа. Идентифицировали гены, задействованные в выработке редуцирующих сахаров и являющиеся активными после 48 часов сушки независимо от типов сушки и сортов табака. Идентифицировали гены табака, задействованные в выработке редуцирующих сахаров. To identify key functions contributing to sucrose metabolism during the early leaf drying stages of Burley, Virginia, and Oriental type tobacco, a dominance analysis was performed for the function of genes that are overexpressed in dried leaves after 48 hours of drying compared to mature leaves at time of drying. harvest (log2-fold change >2, adjusted p-value <0.05) of Burley, Virginia and Oriental tobacco. Identified genes involved in the production of reducing sugars and are active after 48 hours of drying, regardless of the types of drying and varieties of tobacco. Tobacco genes involved in the production of reducing sugars have been identified.
Ключевые гены, непосредственно задействованные в выработке редуцирующих сахаров во время ранних стадий сушки в листьях, относятся к семейству генов SUS. SUS, вероятно, представляет собой ключевой фермент для запуска накопления редуцирующих сахаров в подвергнутых сушке отделенных листьях. The key genes directly involved in the production of reducing sugars during the early stages of drying in leaves belong to the SUS gene family. SUS is likely to be the key enzyme to trigger the accumulation of reducing sugars in the desiccated detached leaves.
Обнаружено, что геном табака имеет 12 продуктов гена NtSUS, распределенных по 6 семействам, с одной копией S и одной копией T от каждого предка: NtSUS1-S (SEQ ID NO: 1), NtSUS1-T (SEQ ID NO: 3), NtSUS2-S (SEQ ID NO: 5), NtSUS2-T (SEQ ID NO: 7), NtSUS3-S (SEQ ID NO: 9), NtSUS3-T (SEQ ID NO: 11), NtSUS4-S (SEQ ID NO: 13), NtSUS4-T (SEQ ID NO: 15), NtSUS5-S (SEQ ID NO: 17), NtSUS5-T (SEQ ID NO: 19), NtSUS6-S (SEQ ID NO: 21) и NtSUS6-T (SEQ ID NO: 23). The tobacco genome was found to have 12 NtSUS gene products distributed across 6 families, with one S copy and one T copy from each ancestor: NtSUS1-S (SEQ ID NO: 1) , NtSUS1-T (SEQ ID NO: 3) . NtSUS2-S (SEQ ID NO: 5), NtSUS2-T (SEQ ID NO: 7) , NtSUS3-S (SEQ ID NO: 9) , NtSUS3-T (SEQ ID NO: 11) , NtSUS4-S (SEQ ID NO: 13) , NtSUS4-T (SEQ ID NO: 15) , NtSUS5-S (SEQ ID NO: 17) , NtSUS5-T (SEQ ID NO: 19) , NtSUS6-S (SEQ ID NO: 21) and NtSUS6 -T (SEQ ID NO: 23).
Транскрипты SUS происходили из геномных последовательностей NtSUS2-S (SEQ ID NO: 5), NtSUS3-S (SEQ ID NO: 9), NtSUS3-T (SEQ ID NO: 11) и NtSUS4-S (SEQ ID NO: 13). Экспрессия данных генов повышалась во время сушки листа (старения), как показано в таблице 1. Это подтверждает, что копии S, в частности, задействованы в химической модификации листьев, подвергаемых ранним стадиям сушки, и в данном конкретном случае, в повышении уровня глюкозы и фруктозы.The SUS transcripts originated from the genomic sequences NtSUS2-S (SEQ ID NO: 5), NtSUS3-S (SEQ ID NO: 9), NtSUS3-T (SEQ ID NO: 11) and NtSUS4-S (SEQ ID NO: 13). Expression of these genes increased during leaf drying (senescence) as shown in Table 1. This confirms that S copies are particularly involved in the chemical modification of leaves subjected to early drying stages and, in this particular case, in increasing glucose levels and fructose.
Хотя в подвергнутых сушке листьях табака Берлей обнаружили низкие значения уровней редуцирующих сахаров по сравнению с табаком Вирджиния и восточного типа (см. фигуру 1), тем не менее гены NtSUS являются активированными в табаке Берлей (см. таблицу 1), вероятно, как конститутивный ответ для обеспечения, в свою очередь, доступного источника углерода для синтеза аминокислот во время ранней фазы сушки. Although dried Burley tobacco leaves showed low levels of reducing sugars compared to Virginia and Oriental tobacco (see Figure 1), the NtSUS genes are nevertheless upregulated in Burley tobacco (see Table 1), probably as a constitutive response. to provide, in turn, an available carbon source for amino acid synthesis during the early drying phase.
Как в табаке Берлей (BU), так и в табаке Вирджиния (FC) NtSUS1-S и NtSUS1-T, которые не экспрессируются во время ранних стадий сушки (см. таблицу 1), в частности, экспрессируются в корне и стебле, что свидетельствует о возможной специфической функции в этих тканях, заключающейся в доставки углеводов для синтеза клеточных стенок или снабжения ресурсами углерода в условиях аноксии. С другой стороны, NtSUS3-S, NtSUS3-T, NtSUS4-S, которые индуцируются во время ранних стадий сушки листа, также экспрессируются во всех органах, тогда как NtSUS2-S и NtSUS2-T экспрессируются преимущественно в незрелых цветках и лепестках. NtSUS5-S, NtSUS5-T, NtSUS6-S и NtSUS6-T экспрессируются на низких уровнях во всех проанализированных тканях растений (см. таблицу 2).In both Burley tobacco (BU) and Virginia tobacco (FC), NtSUS1-S and NtSUS1-T , which are not expressed during the early stages of drying (see Table 1), are in particular expressed in the root and stem, indicating about a possible specific function in these tissues, which consists in the delivery of carbohydrates for the synthesis of cell walls or the supply of carbon resources under anoxic conditions. On the other hand , NtSUS3-S, NtSUS3-T, NtSUS4-S , which are induced during the early stages of leaf drying, are also expressed in all organs, while NtSUS2-S and NtSUS2-T are predominantly expressed in immature flowers and petals. NtSUS5-S, NtSUS5-T, NtSUS6-S, and NtSUS6-T are expressed at low levels in all analyzed plant tissues (see Table 2).
Для увеличения пула редуцирующих сахаров в подвергнутых сушке листьях могла бы рассматриваться сверхэкспрессия NtSUS2-S, NtSUS3-S, NtSUS3-T и/или NtSUS4-S с применением индуцируемого старением промотора, такого как SAG12 или E4 (применение конститутивного промотора может существенно изменить метаболизм растения). С другой стороны, осуществление нокаута NtSUS2-S, NtSUS3-S, NtSUS3-T и/или NtSUS4-S может внести вклад в снижение содержания редуцирующих сахаров в подвергнутых сушке листьях. Overexpression of NtSUS2-S , NtSUS3-S, NtSUS3-T, and/or NtSUS4-S using an aging-inducible promoter such as SAG12 or E4 could be considered to increase the pool of reducing sugars in desiccated leaves (use of a constitutive promoter can significantly alter plant metabolism). ). On the other hand, knocking out NtSUS2-S , NtSUS3-S, NtSUS3-T and/or NtSUS4-S may contribute to the reduction of reducing sugars in dried leaves.
Пример 2 - Сайленсинг экспрессии Example 2 - Expression Silencing NtSUSNtSUS в листе табака Вирджиния in Virginia tobacco leaf
Сайленсинг NtSUS исследовали для определения того, вносят ли эти гены вклад в снижение содержания редуцирующих сахаров в подвергнутых сушке листьях табака Вирджиния. Специфический фрагмент ДНК в пределах кодирующей последовательности обоих NtSUS клонировали с сильным промотором вируса мозаики ночной красавицы (MMV) в вектор GATEWAY. Фрагмент гена NtSUS фланкирован между MMV и 3'-терминаторной последовательностью nos гена нопалинсинтазы Agrobacterium tumefaciens. NtSUS silencing was investigated to determine if these genes contribute to the reduction of reducing sugars in dried Virginia tobacco leaves. A specific DNA fragment within the coding sequence of both NtSUS was cloned with a strong nocturnal mosaic virus (MMV) promoter into the GATEWAY vector. The NtSUS gene fragment is flanked between MMV and the nos 3'-terminator sequence of the Agrobacterium tumefaciens nopaline synthase gene.
Для обеспечения отбора растений с низким содержанием редуцирующих сахаров листья отдельных растений T0 и соответствующих контрольных линий анализировали после 60 ч сушки для определения влияния на уменьшение содержания редуцирующих сахаров. Отбирали самые лучшие линии T0, демонстрирующие самый низкий уровень редуцирующих сахаров. Семена собирали от этих самых лучших линий T0. Потомство T1 анализировали с помощью qPCR для определения эффективности событий сайленсинга NtSUS в аспекте снижения содержания редуцирующих сахаров.To ensure the selection of plants with low levels of reducing sugars, the leaves of individual T0 plants and corresponding control lines were analyzed after 60 hours of drying to determine the effect on the reduction of reducing sugars. The best T0 lines were selected, showing the lowest level of reducing sugars. Seeds were harvested from these very best T0 lines. T1 progeny were analyzed by qPCR to determine the effectiveness of NtSUS silencing events in reducing the content of reducing sugars.
Манипулирование с генами NtSUS (например, либо с применением конститутивного промотора, либо со специфического индуцируемого старением промотора, такого как SAG12 или E4) может изменять химию подвергнутых сушке листьев табака. Аналогичным образом осуществление нокаута генов NtSUS с применением стратегии редактирования гена, такой как CRISPR-Cas или отбор мутантов, может изменять химический состав аминокислот в листьях основных сортов коммерческого табака.Manipulating the NtSUS genes (eg, either using a constitutive promoter or a specific senescence-inducible promoter such as SAG12 or E4) can alter the chemistry of dried tobacco leaves. Similarly, knocking out the NtSUS genes using a gene editing strategy such as CRISPR-Cas or mutant selection can alter the amino acid chemistry in the leaves of major commercial tobacco varieties.
Любая публикация, цитируемая или описанная в данном документе, предоставляет соответствующую информацию, раскрытую до даты подачи настоящей заявки. Заявления, сделанные в данном документе, не должны истолковываться как признание того, что авторы настоящего изобретения не имеют оснований для его противопоставления как более ранним таким раскрытиям. Все публикации, упомянутые в вышеприведенном описании, включены в данный документ с помощью ссылки. Различные модификации и варианты настоящего изобретения будут очевидны специалистам в данной области без отступления от объема и сути настоящего изобретения. Несмотря на то, что настоящее изобретение было описано в связи с конкретными предпочтительными вариантами осуществления, следует понимать, что настоящее изобретение, как заявлено, не должно быть неправомерно ограничено такими конкретными вариантами осуществления. В действительности различные модификации описанных способов осуществления изобретения, которые очевидны специалистам в клеточной, молекулярной биологии и биологии растений или в смежных областях, предназначены находиться в пределах объема прилагаемой формулы изобретения.Any publication cited or described in this document provides relevant information disclosed prior to the filing date of this application. The statements made in this document should not be construed as an admission that the authors of the present invention have no reason to contrast it with earlier such disclosures. All publications mentioned in the above description are incorporated into this document by reference. Various modifications and variations of the present invention will be apparent to those skilled in the art without departing from the scope and spirit of the present invention. Although the present invention has been described in connection with specific preferred embodiments, it should be understood that the present invention, as stated, should not be unduly limited to such specific embodiments. Indeed, various modifications of the described methods of carrying out the invention, which are obvious to those skilled in cellular, molecular and plant biology or related fields, are intended to be within the scope of the appended claims.
ТАБЛИЦА 1TABLE 1
Экспрессия генов NtSUS во время ранних стадий сушки для табака Берлей (BU), Вирджиния (FC) и восточного типа (OR)Expression of NtSUS genes during the early stages of drying for Burley (BU), Virginia (FC), and Oriental (OR) tobacco
ТАБЛИЦА 2TABLE 2
Экспрессия генов NtSUS в корне, стебле, листе, расположенном в средней части стебля, незрелом цветке (незр. цветок), чашелистике и лепестке растений табака Берлей (BU) и Вирджиния (FC), выращенных в полеExpression of NtSUS genes in the root, stem, mid-stem leaf, immature flower (immature flower), sepal, and petal of Burley (BU) and Virginia (FC) tobacco plants grown in the field
ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙSEQUENCE LIST
SEQ ID NO: 1: Полинуклеотидная последовательность NtSUS1-S SEQ ID NO: 1: Polynucleotide sequence of NtSUS1-S
atggcagctagtggtcttagcattaagaaaagtttggaggaatccattttggctcatccagatgaaattttggctctcaagtcaaggtacattactacatataatgatattaagaactagaggcttatccaaggttttgttacatttttgaaattataagtttagaacctaatagtacttggtagcacttgtttccttattatctagctgttgttactgcttgttgctactgctttctgttcatctttccttgagcccggtctatcggaaacaacctctctattctcaaagtataaggtttgcgtacatactacctccccagactctacttgtggaatttactgtttttgttgtgttgttgtaatctaatatttattagaattttactgatttttcacatatatatatctatgtcccctgtcgaaaattctatagctcatgttagctaaatacattagtaccattgtttttaattgttttggttttggcacaggattgaaactgaagggaaaggggtaatgaaaccacttgatctcttgaaccatttggtttctgttactagtaagacaaatggagtaaatattgtacctagtgcacttgtggaagttctcagttgcagccaagaagctgtgattgtaccaccaaaactagcactagctgtacgtccgaggcccggtgtatgggagtacttgtcactgaatcttaagacaaagaaagtggctgaattaagcattcctgaataccttcaattgaaagagaacactgttgatgaaaggtaaagtattagtctgcgatttcgctttgtgaaattgaagtttttgttttgattcataatgttttgtgtatcaattatgttaccagtggaaacatattggagttggattttgagccatttacaacagttacaccaccaaaaacactttctgactctattggcaatggtttggagtttcttaatcgccacattgcttcgaaaatgtttcatgataaggagatttccagatgcctccttgacttcctcagaaaccataactacaaaggaaaggtaataaaaaaaagtgtttctttaaacaagttgtatgattatgtgtatatttctaagtatgttaacttgaaaacagtcattgatggtgaaagaaagcattcaaagcctagagagtttccaacttgttctgaaaaaagcagaggaacatttgtgcacattgaatccagaaactccatactccaattttgaatcaaagtttgaagagattggcttggaaagagggtggggaaacaccgctgaacgcgtgcaagacactatcagtcatcttttgcatctccttgaggctcctaacgcgtcttctttggaaaatttccttggtagaatcccattggttttcaatgttgtgattctaactccacatggttattttgctcaagataatgtcttgggctatcctgacactggtggccaggtttgtgtccaatattttgcattcttgatcaagttctttataccatttgaaccaacaatcttnaacattctttttttggttgtgaaatgttgaataggttgtttacattcttgatcaagttccagctatggagcgtgagatgcttcatcgtatgaagcttcaaggactcgatgatatcatccctcgcatccttgttgtaagtggccttaattttcctagtttcatttacacctctaaatgaaattgatcttttttgttgttttatatcaggtaacaaggctgctgcctgatgcagtaggaaccacctgtggcgagcggatggagaaagtatatggggcagaacattctcatataattcgtgttccatttagaactgagaagggaatgttgcgcaaatggatctcacgattcgaagtctggccatacatggaaactttcactgaggttggaacataaaaacaaataaaatccattggaatgttccttctgcaattgaaaatgtcttgctaactgaagacccatttttaaattgatcatcaggatgttgcagaagaacttgtcaaagaattgcaagctaaaccagacttgatcattggaaactacagtgagggaaatcttgctgcctctttgcttgcgaagaaatttggggctactcagtgtactattgctcatgccttggaaaaaactaagtatccaaactctgaccttaattggaagaagtttgatgacaagtatcatttctcaagtcagttcactgctgatctctttgccatgaatcacactgatttcatcatcaccagcactttccaagaaattgctggaaggtaaaagcaaatgcacaccatcatagtatttcatatttttacccttgtttatactatttccattcaccgaccccgacttgtttaggattgagccatagttgttgttgttgtttgtttatactatttccatttgccgaccacaacttgtttaggactgaggtatagttgttgttgttggtttgttcatattattttcattcgctaaccctaacttgtttgggactgaggcatagtagtagtagtagttgttgctattagtttatactatttccatttgccaaccccaacttgtttggtactgagacatagttgttgttgttgttgtttgtttatactatttccatttgccgaccccaacttgtttaggactgaggtatagttgttgttgttggtttgttcatattattttcattcgctaaccccaacttgtttgggactgaggcatagtagtagtagtagtagttgttgctattagtttatactatttccatttgccaaccccaacttgtttggtactgagacatagttgttgttgttgtttgtttatactatttcaatttgtcgaccccaatttgtttgggaccaaggcatggttgttgttgttgtttgtttgtttttactgtttccattgatattggaacatttgttatttgcagcaaaaacactgtaggacagtatgagagtcatactgcttttaccatgcctggattgtaccgagtagtccatggaatcgattcgtttgatccaaagttcaacattgtctcccctggggctgatatgtcaatctacttcccttacactgagaaggagaaaaggctaaccaacttccacccggaaattgaagaactcctctacagtcctgttgagaataaggaccacttgttagtctccttaatttgcttttatttcatcccatttatgatcgcttttatcccaacagatcgattaatcatttgttatcaacataaacagatgtgtgttgaaggaccggaacaagccaattctctttaccatggcaaggctagatcgcgtgaagaatctaacagggctcgtggaatggtatgctaagaatgcaaggctgagggagcttgttaaccttgtggttgtaggcggagacagaaggaaagaatccaaagatttagaagagcaagcagagatgaagaagatgtatgatcttatcgaaacctataacctgaacggccaattcaggtggatttcttcccaaatgaatcgtgtgaggaacggagaactctatcgttacattgcagacacgaggggtgctttcgttcaaccagcattctacgaggcttttggtttgacagttgtagagtctatgacttgtggtttgccaacttttgctacttgtaatggtggaccatttgagattatagtgaatggaaaatctggtttccatattgatcctaatcaaggtgacaaggctgctgatatgttggtaaatttctttgaaaaatctaaagaagatccaagttattgggatgctatttccaagggaggtctgcaacgtattcttgaaaagtaagcttttgcatttgattagcacaagtgcacaaccaagatttaacttttgaacaaactaaaactaacccttttttgtattttcttttgctaggtatacatggcaaatttattcacagaaagtgatcacactatctgggatttatggattctggaagtatgcaaccaagaatgataaagttgctagtgcaaagaagcgctatcttgagatgttttatgaacttggatttaagaaatcagtaagtgtcaattttaaaggggaaccttggatcaacggttaagttgtctttgtgcaacctataggtcaggggtttgagccgtagaagtagccactaatatttacattagggtagactgtgtacatatcacaccccttggggtacggccctttcctggatcctgtatgaacgcgggatgccttgtgcaccgggctgtatttttttttttagtgtcacttctgtattttgtttgagcttgtttataaagtttggaaatctgctgctaatttgtatatttgttggttgtgtatttcaggctgagaaagttccattggctattgatgaatagatggcagctagtggtcttagcattaagaaaagtttggaggaatccattttggctcatccagatgaaattttggctctcaagtcaaggtacattactacatataatgatattaagaactagaggcttatccaaggttttgttacatttttgaaattataagtttagaacctaatagtacttggtagcacttgtttccttattatctagctgttgttactgcttgttgctactgctttctgttcatctttccttgagcccggtctatcggaaacaacctctctattctcaaagtataaggtttgcgtacatactacctccccagactctacttgtggaatttactgtttttgttgtgttgttgtaatctaatatttattagaattttactgatttttcacatatatatatctatgtcccctgtcgaaaattctatagctcatgttagctaaatacattagtaccattgtttttaattgttttggttttggcacaggattgaaactgaagggaaaggggtaatgaaaccacttgatctcttgaaccatttggtttctgttactagtaagacaaatggagtaaatattgtacctagtgcacttgtggaagttctcagttgcagccaagaagctgtgattgtaccaccaaaactagcactagctgtacgtccgaggcccggtgtatgggagtacttgtcactgaatcttaagacaaagaaagtggctgaattaagcattcctgaataccttcaattgaaagagaacactgttgatgaaaggtaaagtattagtctgcgatttcgctttgtgaaattgaagtttttgttttgattcataatgttttgtgtatcaattatgttaccagtggaaacatattggagttggattttgagccatttacaacagttacaccaccaaaaacactttctgactctattggcaatggtttggagtttcttaatcgccacattgcttcgaaaatgtttcatgataaggagatttccagatgcctccttgacttcctcagaaaccataactacaaaggaaaggtaataaaaaaaagtgtttctttaaacaagttgtatgattatgtgtatatttctaagtatgttaacttgaaaacagtcattgatggtgaaagaaagcattcaaagcctagagagtttccaacttgttctgaaaaaagcagaggaacatttgtgcacattgaatccagaaactccatactccaattttgaatcaaagtttgaagagattggcttggaaagagggtggggaaacaccgctgaacgcgtgcaagacactatcagtcatcttttgcatctccttgaggctcctaacgcgtcttctttggaaaatttccttggtagaatcccattggttttcaatgttgtgattctaactccacatggttattttgctcaagataatgtcttgggctatcctgacactggtggccaggtttgtgtccaatattttgcattcttgatcaagttctttataccatttgaaccaacaatcttnaacattctttttttggttgtgaaatgttgaataggttgtttacattcttgatcaagttccagctatggagcgtgagatgcttcatcgtatgaagcttcaaggactcgatgatatcatccctcgcatccttgttgtaagtggccttaattttcctagtttcatttacacctctaaatgaaattgatcttttttgttgttttatatcaggtaacaaggctgctgcctgatgcagtaggaaccacctgtggcgagcggatggagaaagtatatggggcagaacattctcatataattcgtgttccatttagaactgagaagggaatgttgcgcaaatggatctcacgattcgaagtctggccatacatggaaactttcactgaggttggaacataaaaacaaataaaatccattggaatgttccttctgcaattgaaaatgtcttgctaactgaagacccatttttaaattgatcatcaggatgttgcagaagaacttgtcaaagaattgcaagctaaaccagacttgatcattggaaactacagtgagggaaatcttgctgcctctttgcttgcgaagaaatttggggctactcagtgtactattgctcatgccttggaaaaaactaagtatccaaactctgaccttaattggaagaagtttgatgacaagtatcatttctcaagtcagttcactgctgatctctttgccatgaatcacactgatttcatcatcaccagcactttccaagaaattgctggaaggtaaaagcaaatgcacaccatcatagtatttcatatttttacccttgtttatactatttccattcaccgaccccgacttgtttaggattgagccatagttgttgttgttgtttgtttatactatttccatttgccgaccacaacttgtttaggactgaggtatagttgttgttgttggtttgttcatattattttcattcgctaaccctaacttgtttgggactgaggcatagtagtagtagtagttgttgctattagtttatactatttccatttgccaaccccaacttgtttggtactgagacatagttgttgttgttgttgtttgtttatactatttccatttgccgaccccaacttgtttaggactgaggtatagttgttgttgttggtttgttcatattattttcattcgctaaccccaacttgtttgggactgaggcatagtagtagtagtagtagttgttgctattagtttatactatttccatttgccaaccccaacttgtttggtactgagacatagttgttgttgttgtttgtttatactatttcaatttgtcgaccccaatttgtttgggaccaaggcatggttgttgttgttgtttgtttgtttttactgtttccattgatattggaacatttgttatttgcagcaaaaacactgtaggacagtatgagagtcatactgcttttaccatgcctggattgtaccgagtagtccatggaatcgattcgtttgatccaaagttcaacattgtctcccctggggctgatatgtcaatctacttcccttacactgagaaggagaaaaggctaaccaacttccacccggaaattgaagaactcctctacagtcctgttgagaataaggaccacttgttagtctccttaatttgcttttatttcatcccatttatgatcgcttttatcccaacagatcgattaatcatttgttatcaacataaacagatgtgtgttgaaggaccggaacaagccaattctctttaccatggcaaggctagatcgcgtgaagaatctaacagggctcgtggaatggtatgctaagaatgcaaggctgagggagcttgttaaccttgtggttgtaggcggagacagaaggaaagaatccaaagatttagaagagcaagcagagatgaagaagatgtatgatcttatcgaaacctataacctgaacggccaattcaggtggatttcttcccaaatgaatcgtgtgaggaacggagaactctatcgttacattgcagacacgaggggtgctttcgttcaaccagcattctacgaggcttttggtttgacagttgtagagtctatgacttgtggtttgccaacttttgctacttgtaatggtggaccatttgagattatagtgaatggaaaatctggtttccatattgatcctaatcaaggtgacaaggctgctgatatgttggtaaatttctttgaaaaatctaaagaagatccaagttattgggatgctatttccaagggaggtctgcaacgtattcttgaaaagtaagcttttgcatttgattagcacaagtgcacaaccaagatttaacttttgaacaaactaaaactaacccttttttgtattttcttttgctaggtatacatggcaaatttattcacagaaagtgatcacactatctgggatttatggattctggaagtatgcaaccaagaatgataaagttgctagtgcaaagaagcgctatcttgagatgttttatgaacttggatttaagaaatcagtaagtgtcaattttaaaggggaaccttggatcaacggttaagttgtctttgtgcaacctataggtcaggggtttgagccgtagaagtagccactaatatttacattagggtagactgtgtacatatcacaccccttggggtacggccctttcctggatcctgtatgaacgcgggatgccttgtgcaccgggctgtatttttttttttagtgtcacttctgtattttgtttgagcttgtttataaagtttggaaatctgctgctaatttgtatatttgttggttgtgtatttcaggctgagaaagttccattggctattgatgaatag
SEQ ID NO: 2: Полипептидная последовательность NtSUS1-SSEQ ID NO: 2: NtSUS1-S polypeptide sequence
MAASGLSIKKSLEESILAHPDEILALKSRIETEGKGVMKPLDLLNHLVSVTSKTNGVNIVPSALVEVLSCSQEAVIVPPKLALAVRPRPGVWEYLSLNLKTKKVAELSIPEYLQLKENTVDESGNILELDFEPFTTVTPPKTLSDSIGNGLEFLNRHIASKMFHDKEISRCLLDFLRNHNYKGKSLMVKESIQSLESFQLVLKKAEEHLCTLNPETPYSNFESKFEEIGLERGWGNTAERVQDTISHLLHLLEAPNASSLENFLGRIPLVFNVVILTPHGYFAQDNVLGYPDTGGQVVYILDQVPAMEREMLHRMKLQGLDDIIPRILVVTRLLPDAVGTTCGERMEKVYGAEHSHIIRVPFRTEKGMLRKWISRFEVWPYMETFTEDVAEELVKELQAKPDLIIGNYSEGNLAASLLAKKFGATQCTIAHALEKTKYPNSDLNWKKFDDKYHFSSQFTADLFAMNHTDFIITSTFQEIAGSKNTVGQYESHTAFTMPGLYRVVHGIDSFDPKFNIVSPGADMSIYFPYTEKEKRLTNFHPEIEELLYSPVENKDHLCVLKDRNKPILFTMARLDRVKNLTGLVEWYAKNARLRELVNLVVVGGDRRKESKDLEEQAEMKKMYDLIETYNLNGQFRWISSQMNRVRNGELYRYIADTRGAFVQPAFYEAFGLTVVESMTCGLPTFATCNGGPFEIIVNGKSGFHIDPNQGDKAADMLVNFFEKSKEDPSYWDAISKGGLQRILEKYTWQIYSQKVITLSGIYGFWKYATKNDKVASAKKRYLEMFYELGFKKSAEKVPLAIDEMAASGLSIKKSLEESILAHPDEILALKSRIETEGKGVMKPLDLLNHLVSVTSKTNGVNIVPSALVEVLSCSQEAVIVPPKLALAVRPRPGVWEYLSLNLKTKKVAELSIPEYLQLKENTVDESGNILELDFEPFTTVTPPKTLSDSIGNGLEFLNRHIASKMFHDKEISRCLLDFLRNHNYKGKSLMVKESIQSLESFQLVLKKAEE HLCTLNPETPYSNFESKFEEIGLERGWGNTAERVQDTISHLLHLLEAPNASSLENFLGRIPLVFNVVILTPHGYFAQDNVLGYPDTGGQVVYILDQVPAMEREMLHRMKLQGLDDIIPRILVVTRLLPDAVGTTCGERMEKVYGAEHSHIIRVPFRTEKGMLRKWISRFEVWPYMETFTEDVAEELVKELQAKPDLIIGNYSEGNLAASLLA KKFGATQCTIAHALEKTKYPNSDLNWKKFDDKYHFSSQFTADLFAMNHTDFIITSTFQEIAGSKNTVGQYESHTAFTMPGLYRVVHGIDSFDPKFNIVSPGADMSIYFPYTEKEKRLTNFHPEIEELLYSPVENKDHLCVLKDRNKPILFTMARLDRVKNLTGLVEWYAKNARLRELVNLVVVGDRRKESKDLEEQAEMK KMYDLIETYNLNGQFRWISSQMNRVRNGELYRYIADTRGAFVQPAFYEAFGLTVVESMTCGLPTFATCNGGPFEIIVNGKSGFHIDPNQGDKAADMLVNFFEKSKEDPSYWDAISKGGLQRILEKYTWQIYSQKVITLSGIYGFWKYATKNDKVASAKKRYLEMFYELGFKKSAEKVPLAIDE
SEQ ID NO: 3: Полинуклеотидная последовательность NtSUS1-T SEQ ID NO: 3: Polynucleotide sequence of NtSUS1-T
atggcaggcagtggtcttagcattaaggaaagtttggaggaatccattttggctcatccagatgaaattttggctctcaagtcaaggtacattactgcataatgatattaagacctagaagcggatccaagattttgttacatttttgaaattataagtttagaatctaatatttgttatcgcttgtttccttattatcttgctgttgttactgcctgttgctactagtttctgttcatccttccttgagctgagtttctatcggaaacaacctctctactctcaaagtaggaataagttatgcgtacacactaccctccccagactccacttgtgtaatttactgagtttgttgttgttgttgttgtaatctaatacttgttagaattttactgatttttcacatatatatctatgacccatgtcgaaaatactatagctcatgtgctaaatacattagtaccattgttttgtaattgttttggttttggaacaggattgaaactgaagggaaaggggtaatgaaaccagttgatctcttgaaccatttggtttctgttactagtaaaacaaatggagtaaatgttgtacctagtgcacttgtggaagttctcagttgcagccaagaagctgtgattgtaccaccaaaactagcactagctgtacgtccgaggcccggtgtatgggagtacttgtcactgaatcttaagacaaagaaagtggctgaattgagcattcctgagtaccttcaattgaaagagaatactgttgatgaaaggtaaagtaatagtctgcgatttcgctttgtgaaattgaagttttttgtttgattcttaatgttttgtgtatcaattatgttaccagtggaaacatcttggagttggattttgagccatttacaactgttacaacaccaaaaacactttctgactctattggcaatggtttggagtttcttaatcgccacattgcttcgaaaatgtttcttgataaggagattgccaagtgcctccttgactttctcagaaaccataactacaaaggaaaggtagtaaaaaaagtgtttctttaaacaagttgtatgattatgtgtgtatttctaaatatgtcaatttgaaaacagtcattgatggtgaaagaaagcattcaaagcctggagagtttccaacttgttctgaaaaaagcagaggaatatttgcacacactgaatccagaaactccatactccaaatttgaatccaagtttgaagagattggcttggaaagagggtggggaaacaccgctgaacgcgtgcaagacaccattagtcatcttttgcatctccttgaggctcctaacgcgtcttccttggaaaatttccttggtagaatcccattggttttcaatgttgtgattctcaccccacatggttattttgctcaagataatgtcttgggctatcctgacactggtggccaggtttgtgtccgatataacatatcaagaaattttgcattcttgatcatgttctttataccatttgaaccaacattctttttttggttgtgaaatgttgaataggttgtttacattcttgatcaagttccagctatggagcgtgagatgcttcatcgtatgaagcttcaaggactcgacgatatcatccctcgcatccttgttgtaagtgcccttaattttcctggtttggtttacctctaaatgaaattgattttctggctttctaacttttttggattgatctttttgttgttttatatcaggtaactaggctgctgcctgatgctgtaggaaccacttgtggcgagtggatggagaaagtatatggggcagaacattctcatataattcgtgttccatttagaactgagaaaggaatgttgcgcaaatggatctcacgattcgaagtctggccatacatggaaactttcactgaggttggaacataaaaacaaataaaaatcattggaatgttcttctgcatttgaaaatgtcttgctaactaaagactcatttttaaattaatcatcaggatgttgcagaagaacttgtcaaagaattgcaagctaaaccagacttgataattggaaactacagtgagggaaatcttgctgcctcattgcttgctaagaaatttggggctactcagtgtactattgctcatgccttggaaaaaactaagtatccaaactctgaccttaattggaagaagtttgatgacaagtatcatttctcaagtcagttcactgctgatctttttgccatgaatcacactgatttcattatcaccagcactttccaagaaattgctggaaggtaaaagcaaatgcacaccatcatagtatttcatatttttaccctagtttatactatttccatttgtcaactccaacttgtttgggattgaaccatagttgttgtttgtttatactatttccattcgccgaccccaacttatttgggactgagacataattgttgttattattgtttgtttgtttatactatttccattctcagaccccaacttctttgggactgagccgtagattgttgttgttgttgttgttgttgtttgtttatgctatttccgttcaccgaccccaacttatttgggactgaggtgtagaagtagtcgttgttgtttgtttatacgacttccaattgatattcgaatgtttttatttttgcagcaagaacactgtaggacagtatgagagtcatactgcttttaccatgcctggattgtatcgagtagtccatggaatcaattcgtttgatccaaagttcaacattgtctcccctggggctgatatgtcaatctacttcccttacactgagaaggagaaaagactaaccaacttccacccggaaattgaagaactcctctacagtcctgttgagaataaggaccacttgttagtcttctttatttcattcatttttctacaccttttttttcaacagattgattgattggttcttatcaacgtaaacagatgtgtgttgaaggaccagaacaagccaattctctttaccatggcaaggctagatcgcgtgaagaatctaacagggctcgtggaatggtatgcaaagaatgcaaggctaagggagctcgttaaccttgtggttgtaggcggagacagaaggaaagaatccaaagatttagaagagcaagcagagatgaagaagatgtatgatcttatcgaaacatacaacctgaatggccaattcaggtggatttcttcccaaatgaatcgtgtgaggaacggagaactttatcgatacattgcagacacgaggggtgctttcgttcaaccagcattttatgaggcatttggtttgacagttgttgagtctatgacttgtggtttgccaacttttgctacttgtaatggtggaccatttgagattatagtgaatggaaaatctggtttccatattgatcctaatcaaggtgacaaggctgctgatatgttggttaatttcttcgaaaaatctaaagaagatccaagttattgggatactatttccaagggtggtctgcagcgtattcttgaaaagtaagcttttgcatttgattagcacaagtgtacaaccaagatttaacttatgaacaaactaaaactaaccctttttttattttcttttgctaggtatacatggcaaatttattcacagaaagtgatcacattatctgggatttatggattctggaaatatgcaaccaagaatgacaaagttgctagtgcgaagaagcgctatcttgaaatgttttatgaatttgggtttaagaaatcagtaagtgtcacttctgtattttgtttgagcttgtttgtaaagtttggcaatcttctgctaatttgtactatatttgttgacttgtgcatttcaggctgagaaagttccattggctattgatgaatagatggcaggcagtggtcttagcattaaggaaagtttggaggaatccattttggctcatccagatgaaattttggctcaagtcaaggtacattactgcataatgatattaagacctagaagcggatccaagattttgttacatttttgaaattataagtttagaatctaatatttgttatcgcttgtttccttattatcttgctgttgttactgcctgttgctactagt ttctgttcatccttccttgagctgagtttctatcggaaacaacctctctactctcaaagtaggaataagttatgcgtacacactaccctccccagactccacttgtgtaatttactgagttgttgttgttgttgttgtaatctaatacttgttagaattttactgatttttcacatatatatctatgacccatgtcgaaaatactatagctcatgtgcta aatacattagtaccattgttttgtaattgttttggttttggaacaggattgaaactgaagggaaaggggtaatgaaaccagttgatctcttgaaccatttggttctgttactagtaaaacaaatggagtaaatgttgtacctagtgcacttgtggaagttctcagttgcagccaagaagctgtgtgattgtaccaccaaaactagcactagctgtacgt ccgaggcccggtgtatgggagtacttgtcactgaatcttaagacaaagaaagtggctgaattgagcattcctgagtaccttcaattgaaagagaatactgttgatgaaaggtaaagtaatagtctgcgatttcgctttgtgaaattgaagtttttgtttgattcttaatgttttgtgtatcaattatgttaccagtggaaacatctct tggagttggattttgagccatttacaactgttacaacaccaaaaacactttctgactctattggcaatggtttggagtttcttaatcgccacattgcttcgaaaatgtttcttgataaggagattgccaagtgcctccttgactttctcagaaaccataactacaaaggaaaggtagtaaaaaaagtgtttctttaaacaagttgtatg attatgtgtgtatttctaaatatgtcaatttgaaaacagtcattgatggtgaaagaaagcattcaaagcctggagagtttccaacttgttctgaaaaagcagaggaatatttgcacacactgaatccagaaactccatactccaaatttgaatccaagtttgaagagattggcttggaaagagggtggggaaacaccgctgaacgcgtgca agacaccattagtcatcttttgcatctccttgaggctcctaacgcgtcttccttggaaaatttccttggtagaatcccattggttttcaatgttgtgattctcaccccacatggttattttgctcaagataatgtcttgggctatcctgacactggtggccaggtttgtgtccgataacatatcaagaaattttgcattcttgatcatgttctttataccat ttgaaccaacattctttttttggttgtgaaatgttgaataggttgtttacattcttgatcaagttccagctatggagcgtgagatgcttcatcgtatgaagcttcaaggactcgacgatatcatccctcgcatccttgttgtaagtgcccttaattttcctggtttggtttacctctaaatgaaattgattttctggctttctaacttttttgg attgatctttttgttgttttatcaggtaactaggctgctgcctgatgctgtaggaaccacttgtggcgagtggatggagaaagtatggggcagaacattctcatataattcgtgttccatttagaactgagaaaggaatgttgcgcaaatggatctcacgattcgaagtctggccatacatggaaactttcactgaggttggaacataaaaac aaataaaaatcattggaatgttcttctgcatttgaaaatgtcttgctaactaaagactcatttttaaattaatcatcaggatgttgcagaagaacttgtcaaagaattgcaagctaaaccagacttgataattggaaactacagtgagggaaatcttgctgcctcattgcttgctaagaaatttggggctactcagtgtactattgctcat gccttggaaaaaactaagtatccaaactctgaccttaattggaagaagtttgatgacaagtatcatttctcaagtcagttcactgctgatctttttgccatgaatcacactgatttcattatcaccagcactttccaagaaattgctggaaggtaaaagcaaatgcacaccatcatagtatttcatatttttaccctagtttatactatttccatttgtcaact ccaacttgtttgggattgaaccatagttgttgtttgtttatactatttccattcgccgaccccaacttatttgggactgagacataattgttgttattattgtttgtttgtttatactatttccattctcagaccccaacttctttgggactgagccgtagattgttgttgttgttgttgttgttgttgttgttgctatttccgttcaccgaccccaacttatt tgggactgaggtgtagaagtagtcgttgtagaagtagtcgttgttgtttgtttatacgacttccaattgatattcgaatgtttttatttttgcagcaagaacactgtaggacagtatgagagtcatactgcttttaccatgcctggattgtatcgagtagtccatggaatcaattcgtttgatccaaagttcaacattgtctcccctggggctgatatgtcaat ctacttcccttacactgagaaggagaaaagactaaccaacttccacccggaaattgaagaactcctctacagtcctgttgagaataaggaccacttgttagtctctctttttcattcatttttctacacctttttttcaacagattgattgattggttcttatcaacgtaaacagatgtgtgttgaagccagaacaagccaattctctttaccatggcaaggctag atcgcgtgaagaatctaacagggctcgtggaatggtatgcaaagaatgcaaggctaagggagctcgttaaccttgtggttgtaggcggagacagaaggaaagaatccaaagatttagaagagcaagcagagatgaagaagaagaatgtatgatcttatcgaaacatacaacctgaatggccaattcaggtggatttcttcccaaatgaatcgtgtga ggaacggagaactttatcgatacattgcagacacgaggggtgctttcgttcaaccagcattttatgaggcatttggtttgacagttgttgagtctatgacttgtggtttgccaacttttgctacttgtaatggtggaccatttgagattatagtgaatggaaaatctggtttccatattgatcctaatcaaggtgacaaggctgctgatatgttggtta atttcttcgaaaaatctaaagaagatccaagttattgggatactatttccaagggtggtgcagcgtattcttgaaaagtaagcttttgcatttgattagcacaagtgtacaaccaagatttaacttatgaacaaactaaaactaaccctttttttattttcttttgctaggtacatggcaaatttattcacagaaagtgatcacattatctggga tttatggattctggaaatatgcaaccaagaatgacaaagttgctagtgcgaagaagcgctatcttgaaatgttttatgaatttgggtttaagaaatcagtaagtgtcacttctgtattttgtttgagcttgttgtaaagtttggcaatcttctgctaatttgtactatatttgttgacttgtgcatttcaggctgagaaagttccatt ggctattgatgaatag
SEQ ID NO: 4: Полипептидная последовательность NtSUS1-TSEQ ID NO: 4: NtSUS1-T polypeptide sequence
MAGSGLSIKESLEESILAHPDEILALKSRIETEGKGVMKPVDLLNHLVSVTSKTNGVNVVPSALVEVLSCSQEAVIVPPKLALAVRPRPGVWEYLSLNLKTKKVAELSIPEYLQLKENTVDESGNILELDFEPFTTVTTPKTLSDSIGNGLEFLNRHIASKMFLDKEIAKCLLDFLRNHNYKGKSLMVKESIQSLESFQLVLKKAEEYLHTLNPETPYSKFESKFEEIGLERGWGNTAERVQDTISHLLHLLEAPNASSLENFLGRIPLVFNVVILTPHGYFAQDNVLGYPDTGGQVVYILDQVPAMEREMLHRMKLQGLDDIIPRILVVTRLLPDAVGTTCGEWMEKVYGAEHSHIIRVPFRTEKGMLRKWISRFEVWPYMETFTEDVAEELVKELQAKPDLIIGNYSEGNLAASLLAKKFGATQCTIAHALEKTKYPNSDLNWKKFDDKYHFSSQFTADLFAMNHTDFIITSTFQEIAGSKNTVGQYESHTAFTMPGLYRVVHGINSFDPKFNIVSPGADMSIYFPYTEKEKRLTNFHPEIEELLYSPVENKDHLCVLKDQNKPILFTMARLDRVKNLTGLVEWYAKNARLRELVNLVVVGGDRRKESKDLEEQAEMKKMYDLIETYNLNGQFRWISSQMNRVRNGELYRYIADTRGAFVQPAFYEAFGLTVVESMTCGLPTFATCNGGPFEIIVNGKSGFHIDPNQGDKAADMLVNFFEKSKEDPSYWDTISKGGLQRILEKYTWQIYSQKVITLSGIYGFWKYATKNDKVASAKKRYLEMFYEFGFKKSAEKVPLAIDEMAGSGLSIKESLEESILAHPDEILALKSRIETEGKGVMKPVDLLNHLVSVTSKTNGVNVVPSALVEVLSCSQEAVIVPPKLALAVRPRPGVWEYLSLNLKTKKVAELSIPEYLQLKENTVDESGNILELDFEPFTTVTTPKTLSDSIGNGLEFLNRHIASKMFLDKEIAKCLLDFLRNHNYKGKSLMVKESIQSLESFQLVLKKAE EYLHTLNPETPYSKFESKFEEIGLERGWGNTAERVQDTISHLLHLLEAPNASSLENFLGRIPLVFNVVILTPHGYFAQDNVLGYPDTGGQVVYILDQVPAMEREMLHRMKLQGLDDIIPRILVVTRLLPDAVGTTCGEWMEKVYGAEHSHIIRVPFRTEKGMLRKWISRFEVWPYMETFTEDVAEELVKELQAKPDLIIGNYSEGNLAASL LAKKFGATQCTIAHALEKTKYPNSDLNWKKFDDKYHFSSQFTADLFAMNHTDFIITSTFQEIAGSKNTVGQYESHTAFTMPGLYRVVHGINSFDPKFNIVSPGADMSIYFPYTEKEKRLTNFHPEIEELLYSPVENKDHLCVLKDQNKPILFTMARLDRVKNLTGLVEWYAKNARLRELVNLVVVGGDRRKESKDLEEQ AEMKKMYDLIETYNLNGQFRWISSQMNRVRNGELYRYIADTRGAFVQPAFYEAFGLTVVESMTCGLPTFATCNGGPFEIIVNGKSGFHIDPNQGDKAADMLVNFFEKSKEDPSYWDTISKGGLQRILEKYTWQIYSQKVITLSGIYGFWGFKYATKNDKVASAKKRYLEMFYEFKKSAEKVPLAIDE
SEQ ID NO: 5: Полинуклеотидная последовательность NtSUS2-2 SEQ ID NO: 5: Polynucleotide sequence of NtSUS2-2
atggctgaacgtgctctgactcgtgttcacagccttcgtgaacgtcttgatgccactttggctgcacatcgcaatgagatattgctgtttctttcaaggtattgcctaagtagtgttcttgtttcctacaaaagattcagttggtgttcaaaaaacgatatgtgatttgatttatctgcctaagtcttggtagtcataattatccggtacctgtgctggtgcgagttagctggttcggaaactactcttatgaaaacgagagatttagttggtgttgtctgcaattctgtagtatggactattaagcagatagatcatgtttgatatcgaaaaggaatgtatatgtgatgttacttgaactggttttggttattacaggattgaaagccatggaaaagggatcttgaaacctcaccagctattggctgagttcgatgcaattcgccaagatgacaaaaagaagctgaatgatcatgcatttgaagaactcctgaaatctactcaggtaattttgattttggctaaatgtgttaccaagctgaatgatcatgcatttgagtttgtgtccgactactacaatgatatgttataccaggaagcgattgttctgccaccttgggttgcacttgccattcgtttgaggcctggtgtgtgggaatatgtccgtgtgaatgttaatgctctagtcgttgaggagctgaccgtccctgagtatttgcattttaaggaagaacttgttgatggaacgtaagttttagtctcttatttgatactatgttagagaataggcagtggattcaatttatcagtgttgttttttacctaatgcagctccaatggaaatttcgttctcgagttggattttgagcccttcactgcatcctttcctaaaccgaccctcaccaaatctattgggaatggagttgaattcctcaataggcacctttctgcgaaaatgttccatgacaaggaaagcatgaccccgcttcttgaatttcttcgggttcacaattataagggcaaggtaactttgttattcccattcatatatatgttcagtttgtgcttatcatgcgcccaatgatgtatgaatatgtactaaaggatagatgtacgatttcgtttgcagacaatgatgctgaatgacagaatacagaatttaaccactctgcaaaatgtcctaaggaaggcagaggaataccttattatgcttccccctgaaactccattttccgaattcgaacacaagttccaagaaattggattggagaagggatggggcgacactgcggagcgcgtgctagagatgatatgcatgcttcttgatctacttgaggctcccgactcctgtactcttgagaagttcctagggagaattcctatggtgttcaacgtggttatcctttccccccatggatatttcgcccaggaaaatgtcttgggttatcccgacactggtggccaggtgcattactttagtctttgtccgtgagtctatgttgctcagatcctctacaatgccactgtacccgtgtaggatactccaaatataatgcatttttggaggatctgtcaccggtgcaatggcattttggaggtcggagcaacaaacaactgctagtatgcttctaaagcttgcttccataaatgctaaggtccttcacccgtaatgtgcaggttgtctacatattagatcaagttccagccttggagcgtgaaatgcttaaacgcctaaaggagcaaggacttgatataacaccgcgtattcttattgttagtatttcttgtacttgtaattgctgcggattacacaaaattttctctttattggcaacttatcttgatattattcccaggttactcgtctgctgcctgatgcagttggaacaacttgtggtcagcggcttgagaaggtgtatggagccgagcactcacatattcttagggtcccctttaggaccgagaagggcattgttcgcaaatggatatctcgctttgaagtgtggccatacatggagactttcactgaggtgacactaagcttccttgtatttgtctatcttctaattggtattaggaacaatttgctaattattaacgctttggcttttcgtacatcaggatgttgcaaaagaacttgctgcagaactgcaggccaagccagatttgataattggcaactatagcgagggaaatcttgtggcttcattgctggctcacaagttaggcgtaacgcaggtctgtgttatttttcacctcttataaatctgattgtatttccattagtctggaactaaaagtactaaaattttcttttcttcgctgtgttatttgccttctgcagtgcaccattgcccatgcattggagaaaacaaagtatcctgattctgacatctactggaaaaaatttgacgaaaaataccatttctcgtcccagtttaccgctgatcttattgcaatgaatcacaccgattttatcatcaccagcactttccaggagatagcaggaaggtataacatcaattgctaattcggttgcagtaacattttgttcgatttcttccccttatgcttaacctaataccctaatgaattttccagcaaggacactgtcggacagtacgagagtcaccaggcattcacaatgcctggattgtacagagtcgttcacggcattgatgtgttcgatcccaaattcaacattgtctcacctggagctgatataaacctgtatttcccatattccgagaaggaaaagagattgacagcacttcacccagaaattgaggagcttctgtacagtgatgttgagaacgaggaacatctgtaagtttctaacttactcgtaccgtcagtggcagagccagaattttcattaaaatggggtcaaaatataaagacataaattcacaaagaagccaaggggtgtcaatatgtagtataaatatattaaaaaaattacctagctacacaatgtaattttccgacaaaggggtatcggttgcacttcttgaatacatgtggctctgccactgggtacagttacaaagtcctgttacctatgtagatgagcttgtgctgaacatgttgtgattttggtaggtgtgtgctaaaggacaggaataagccaatcttattcacaatggcgagattggatcgtgtgaagaacttaaccggacttgttgagtggtacgccaagaacgcacggctaagggagttggttaaccttgttgtcgttggtggagaccgaaggaaggaatccaaagatttggaagagcaagcagagatgaagaagatgtatgagctaataaagactcacaacttaaatggccaattcagatggatttcttcacagatgaaccgagtaaggaacggcgaactctaccgatacattgccgacactaggggagctttcgtgcagcctgcattctatgaggctttcggtttgactgttgttgaggccatgacctgtggtttgcctacatttgcaactaatcatggcggtccagctgagatcatcgttaacggaaaatccggcttccatatcgatccatatcacggtgagcaagctgctgatctgctagctgatttctttgagaaatgtaagacggaaccttctcattgggaaactatttcaaccggtggcctgaagcgcatccaagagaagtaagcaactctttcttgactctagtcattcaaattaacttgggatttgaggcatagttgattgataatttatcgcgtctctactactatatacaggtacacgtggcaaatctactcggagagattattgacgttggctgctgtttacggtttctggaaacatgtttctaagcttgatcgtctagaaatccgtcgatatctagaaatgttttatgctctcaaataccggaagatggtgagttcttctgcttcctgctcttctcatagtgtttaatatacacttgattgattgcattcacttagactaagttgctcggacacgggtgtggatgtccgacacgagtgcggatctagagttcagatccttcaagatgtaaattataagattcggggatatggatcctagtacggatacgggtgcgagaatccggctaaaaataattttaaaaaaaattatctctaaattatgagatattatgtggaatacttacgtataacttgtaaagtgtagattttttttaattctcaagttgtagattagtaaatgattgatttcctagataagtatgctattttcttcaaatttactcttctgatttcgaaaatcaaattgtatctcgtctcgaatttttccgtccgttatggtcaaagtacccaaaatcgtttgaccaaatcggtacggatcccatacccacacccacactagtgtcgtattgacacgggtgccgcacctaaactgctatgtcggagcaacttagcacttagagaatcattgatgttaaattttcttaattcttgaatctgctaatgaagattttatcttggtttttgtttaggctgaagctgttccattggctgctgaatgaatggctgaacgtgctctgactcgtgttcacagccttcgtgaacgtcttgatgccactttggctgcacatcgcaatgagatattgctgtttctttcaaggtattgcctaagtagtgttcttgtttcctacaaaagattcagttggtgttcaaaaaacgatatgtgatttgatttatctgcctaagtcttggtagtcataattat ccggtacctgtgctggtgcgagttagctggttcggaaactactcttatgaaaacgagagatttagttggtgttgtctgcaattctgtagtatggactattaagcagatagatcatgtttgatatcgaaaaggaatgtatatgtgatgttacttgaactggttttggttattacaggattgaaagccatggaaaagggatcttgaaacctcaccagct attggctgagttcgatgcaattcgccaagatgacaaaaagaagctgaatgatcatgcatttgaagaactcctgaaatctactcaggtaattttgattttggctaaatgtgttaccaagctgaatgatcatgcatttgagtttgtgtccgactactactacaatgatgttataccaggaagcgattgttctgccaccttgggttgcacttgccattcgt ttgaggcctggtgtgtgggaatatgtccgtgtgaatgttaatgctctagtcgttgaggagctgaccgtccctgagtatttgcattttaaggaagaacttgttgatggaacgtaagttttagtctcttatttgatactatgttagagaataggcagtggattcaatttatcagtgttgtttttacctaatgcagctccaatggaaattt cgttctcgagttggattttgagcccttcactgcatcctttcctaaaccgaccctcaccaaatctattgggaatggagttgaattcctcaataggcacctttctgcgaaaatgttccatgacaaggaaagcatgaccccgcttcttgaatttcttcgggttcacaattataagggcaaggtaactttgtttattcccattcatatatatgttcagtttgt gcttatcatgcgcccaatgatgtatgaatatgtactaaaggatagatgtacgatttcgtttgcagacaatgatgctgaatgacagaatacagaatttaaccactctgcaaaatgtcctaaggaaggcagaggaataccttattatgcttccccctgaaactccattttccgaattcgaacacaagttccaagaaattggattggagaagggatggggc gacactgcggagcgcgtgctagagatgatatgcatgcttcttgatctacttgaggctcccgactcctgtactcttgagaagttcctagggagaattcctatggtgttcaacgtggttatcctttccccccatggatatttcgcccaggaaaatgtcttgggttatcccgacactggtggccaggtgcattactttagtctttgtccgt gagtctatgttgctcagatcctctacaatgccactgtacccgtgtaggatactccaaatataatgcatttttggaggatctgtcaccggtgcaatggcattttggaggtcggagcaacaaacaactgctagtatgcttctaaagcttgcttccataaatgctaaggtccttcacccgtaatgtgcaggttgtctacatattagatca agttccagccttggagcgtgaaatgcttaaacgcctaaaggagcaaggacttgatataacaccgcgtattcttattgttagtattctcttgtacttgtaattgctgcggattacacaaaattttctctttattggcaacttatcttgatattattcccaggttactcgtctgctgcctgatgcagttggaacaacttgtggtcagc ggcttgagaaggtgtatggagccgagcactcacatattcttagggtcccctttaggaccgagaagggcattgttcgcaaatggatatctcgctttgaagtgtggccatacatggagactttcactgaggtgacactaagcttccttgtatttgtcttcttctaattggtattaggaacaatttgctaattattaacgctttggcttttcgtacatcagg atgttgcaaaagaacttgctgcagaactgcaggccaagccagatttgataattggcaactatagcgagggaaatcttgtggcttcattgctggctcacaagttaggcgtaacgcaggtctgtgttatttttcacctcttataaatctgattgtatttccattagtctggaactaaaagtactaaaattttcttttcttcgctgtgttat ttgccttctgcagtgcaccattgcccatgcattggagaaaacaaagtatcctgattctgacatctactggaaaaaatttgacgaaaaataccatttctcgtcccagtttaccgctgatcttattgcaatgaatcacaccgattttatcatcaccagcactttccaggagatagcaggaaggtataacatcaattgctaattcggttgcagtaacattt tgttcgatttcttccccttatgcttaacctaataccctaatgaattttccagcaaggacactgtcggacagtacgagagtcaccaggcattcacaatgcctggattgtacagagtcgttcacggcattgatgtgttcgatcccaaattcaacattgtctcacctggagctgatataaacctgtatttcccatattccgagaaggaaa agagattgacagcacttcacccagaaattgaggagcttctgtacagtgatgttgagaacgaggaacatctgtaagtttctaacttactcgtaccgtcagtggcagagccagaattttcattaaaatggggtcaaaatataaagacataaattcacaaagaagccaaggggtgtcaatatgtagtaaaatatattaaaaaaattacctagctacaca atgtaattttccgacaaaaggggtatcggttgcacttcttgaatacatgtggctctgccactgggtacagttacaaagtcctgttacctatgtagatgagcttgtgctgaacatgttgtgattttggtaggtgtgtgctaaaaggacagggaataagccaatcttattcacaatggcgagattggatcgtgtgaagaacttaaccggacttg ttgagtggtacgccaagaacgcacggctaagggagttggttaaccttgttgtcgttggtggagaccgaaggaaggaatccaaagatttggaagagcaagcagagatgaagaagatgtatgagctaataaagactcacaacttaaatggccaattcagatggatttcttcacagatgaaccgagtaaggaacggcgaactctaccgatacattgccgacactag gggagctttcgtgcagcctgcattctatgaggctttcggtttgactgttgttgaggccatgacctgtggtttgcctacatttgcaactaatcatggcggtccagctgagatcatcgttaacggaaaatccggcttccatatcgatccatatcacggtgagcaagctgctgatctgctagctgatttctttgagaaatgtaagacggaac cttctcattgggaaactatttcaaccggtggcctgaagcgcatccaagagaagtaagcaactctttcttgactctagtcattcaaattaacttgggatttgaggcatagttgattgataatttatcgcgtctctactactatacaggtacacgtggcaaatctactcggagagattattgacgttggctgctgtttacggtttctggaaacatgtttctaagctt gatcgtctagaaatccgtcgatatctagaaatgttttatgctctcaaataccggaagatggtgagttcttctgcttcctgctcttctcatagtgtttaatatacacttgattgattgcattcacttagactaagttgctcggacaccgggtgtggatgtccgaccgagtgcggatctagagttcagatccttcaagatgtaaattataagatt cggggatatggatcctagtacggatacgggtgcgagaatccggctaaaaataattttaaaaaaaattatctctaaattatgagatattatgtggaatacttacgtataacttgtaaagtgtagattttttttaattctcaagttgtagattagattagtaaatgattgatttcctagataagtatgctattttcttcaaatttactcttctgatttcgaaa atcaaattgtatctcgtctcgaatttttccgtccgttatggtcaaagtacccaaaatcgtttgaccaaatcggtacggatcccatacccacacccacactagtgtcgtattgacaccggtgccgcacctaaactgctatgtcggagcaacttagcacttagagaatcattgatgttaaattttcttaattcttgaatctgctaatgaaga ttttatcttggttttgtttaggctgaagctgttccattggctgctgaatga
SEQ ID NO: 6: Полипептидная последовательность NtSUS2-2SEQ ID NO: 6: NtSUS2-2 polypeptide sequence
MAERALTRVHSLRERLDATLAAHRNEILLFLSRIESHGKGILKPHQLLAEFDAIRQDDKKKLNDHAFEELLKSTQEAIVLPPWVALAIRLRPGVWEYVRVNVNALVVEELTVPEYLHFKEELVDGTSNGNFVLELDFEPFTASFPKPTLTKSIGNGVEFLNRHLSAKMFHDKESMTPLLEFLRVHNYKGKTMMLNDRIQNLTTLQNVLRKAEEYLIMLPPETPFSEFEHKFQEIGLEKGWGDTAERVLEMICMLLDLLEAPDSCTLEKFLGRIPMVFNVVILSPHGYFAQENVLGYPDTGGQVVYILDQVPALEREMLKRLKEQGLDITPRILIVTRLLPDAVGTTCGQRLEKVYGAEHSHILRVPFRTEKGIVRKWISRFEVWPYMETFTEDVAKELAAELQAKPDLIIGNYSEGNLVASLLAHKLGVTQCTIAHALEKTKYPDSDIYWKKFDEKYHFSSQFTADLIAMNHTDFIITSTFQEIAGSKDTVGQYESHQAFTMPGLYRVVHGIDVFDPKFNIVSPGADINLYFPYSEKEKRLTALHPEIEELLYSDVENEEHLCVLKDRNKPILFTMARLDRVKNLTGLVEWYAKNARLRELVNLVVVGGDRRKESKDLEEQAEMKKMYELIKTHNLNGQFRWISSQMNRVRNGELYRYIADTRGAFVQPAFYEAFGLTVVEAMTCGLPTFATNHGGPAEIIVNGKSGFHIDPYHGEQAADLLADFFEKCKTEPSHWETISTGGLKRIQEKYTWQIYSERLLTLAAVYGFWKHVSKLDRLEIRRYLEMFYALKYRKMAEAVPLAAEMAERALTRVHSLRERLDATLAAHRNEILLFLSRIESHGKGILKPHQLLAEFDAIRQDDKKKLNDHAFEELLKSTQEAIVLPPWVALAIRLRPGVWEYVRVNVNALVVEELTVPEYLHFKEELVDGTSNGNFVLELDFEPFTASFPKPTLTKsignGVEFLNRHLSAKMFHDKESMTPLLEFLRVHNYKGKTMMLNDRIQNLTTLQNV LRKAEEYLIMLPPETPFSEFEHKFQEIGLEKGWGDTAERVLEMICMLLDLLEAPDSCTLEKFLGRIPMVFNVVILSPHGYFAQENVLGYPDTGGQVVYILDQVPALEREMLKRLKEQGLDITPRILIVTRLLPDAVGTTCGQRLEKVYGAEHSHILRVPFRTEKGIVRKWISRFEVWPYMETFTEDVAKELAAELQAKPDLIIGNYSE GNLVASLLAHKLGVTQCTIAHALEKTKYPDSDIYWKKFDEKYHFSSQFTADLIAMNHTDFIITSTFQEIAGSKDTVGQYESHQAFTMPGLYRVVHGIDVFDPKFNIVSPGADINLYFPYSEKEKRLTALHPEIEELLYSDVENEEHLCVLKDRNKPILFTMARLDRVKNLTGLVEWYAKNARLRELVNLVVVGGDRRKESKDL EEQAEMKKMYELIKTHNLNGQFRWISSQMNRVRNGELYRYIADTRGAFVQPAFYEAFGLTVVEAMTCGLPTFATNHGGPAEIIVNGKSGFHIDPYHGEQAADLLADFFEKCKTEPSHWETISTGGLKRIQEKYTWQIYSERLLTLAAVYGFWKHVSKLDRLEIRRYLEMFYALKYRKMAEAVPLAAE
SEQ ID NO: 7: Полинуклеотидная последовательность NtSUS2-T SEQ ID NO: 7: NtSUS2-T polynucleotide sequence
atgctttttatgggagtaaattttatggccggtcattcaactttgtgttcattacgcaaaagtcatttttcttggtgtttattacgcaagtcatttttcttttttttttgttacgtaaaaatcattcaactatgtgtttattatctaaaattcaattttttttttccttttgttacacaaaaatcattttactttactctatttatcacaaaagtcaccttggccagattttataataggcttttatcttttgttacacaaaaattattttactttactctatttatcacaaaagtcaccttggccagattttataataggcttttatcttttgttacacaaaaattattttactttactctatttatcacaaaagtcaccttggccagattttacaatacttttaccttaaaagactattatgcccttgacattataaatcctctcatttatataataccttctatatgatacactatataatatatttttacctaggtattttacttataattaaaataatattaaattattttatttatctattttataatatattcatacatttaattttttcatggcaaatcactttgtttaatcatatttaaacatgaacaaattttaaatatcaaaaaaataaaaaaataaaaaaaatatttatttgaaataataacaaacagatttgtttaacaaatgatagtttttttttatagtcaataaaatttttaaaaaaattcaaagatatttgtttttaatattaatatttttaaagctttatctgttaatattatttatttgaaagtattaatctgatgtgtcattgtgttaaatgtgagtattttatttattggattaatgagtatggcttggctgataaaaagctttgattttataattttcattaaaaatattttattaagctagtacctgacaaatttaatatcttgaaaattaacgttaagaaaaaattaaatataaaaatatattataaaaataataaataaataatatcaagttattttaattataaataaaatacatggttaaaaatatattatatagcatataatatagaaggtattacataaatgagatgatttaaagggcataatagacttttcaggtgaatgatttgtaaaatatggttaaagtgattattgtgataattagagcatagtaaaataatttttatgtaacaaaagaaaaaaaaaatgacttttgggtaatgaacataaatttgaataacttttacgtaacaaaagaataaaataaattttggataataaacataaaattgaatgaccacctataaaatttattatttttttgggctcttcttgatttgattttttagtttagcctttgcagtaatcttggttgtcacgcgtagcgttgtgctttcgccacataagtatttagtagacttaattaatgtcattatatcggttggtgtggttttaattacttaactgtactattatattaggtggaaggtttgaaaatttatagtagtaacattctagatcattgaaaatattggtgtttcagtgactttttagtatgtcattttcattttctaagtggttgtactaatatagtatattaaaattttgattggttgagaaacaatctctctcacctacacggtacgggtaaggtatgcgtatacgcttatcctccctacactccatttgtgggactattgttgttattttggataagctgaggtatccatcttctactaactgcactagtttattttttttgctgtttacagttgaaacaattgtctgaggatttctcacctgctgaatcaactgcaatggctgaacgtgtgctgactcgtgttcacagccttcgtgaacgtcttgatgctactttggctgctcatcgcaatgagatattactgtttctttcaaggtatagccaaagatagtattcttgttaactaaaaaagattcagttggtgttcaaaaaacgatacgtttatctgcctaagtcttggtagtcagaattatccggtacctatgctggtgtgagttagctggctaggaaaccactcttatgaaaacaagagatttagttagagttgtctgtaattctgtagtatggactatgtatgtgatgctatttgaactggttttggttattataggattgaaagccatggaaaagggatcttgaaaccgcatcagctattggctgagtttgatgcaattcgccaagatgacaaaaagaaactgaatgatcatgcatttgaagaactcctgaagtccactcaggtaatatggttttggctatatttgtcgccaacgccaagctcatatttttatattattttgagcttgtgtctgaatacgacgatgatatgttatactaggaagcaattgttctgccaccttgggttgcacttgcgattcgtttgaggcctggtgtgtgggaatatgtccgtgtgaatgtcaatgcgctagtcgttgaggagctgactgtccctgagtatttgcatttcaaggaagaacttgtcgatggaacgtaagtgttagtcttcaatttgatgctatgttagagaataggctgtggaatttattgatcaatgctgtgctttgtcctgatacagctccaatggaaatttcgttctcgagttggattttgagcccttcaccgcatcctttcctaaaccaaccctcaccaaatctatcggaaatggagttgaattcctcaataggcacctctctgcgaaaatgttccatgacaaggaaagcatgaccccgcttcttgaatttcttcgggttcacaattataagggcaaggtgacttgctatttccatttatctataggttcggtttgtgcttatcatgcgcccaatgacatatgaatatgcgctaaaggatagatatatgatttcctttgcagacaatgatgctgaacgacagaatacagaatttaaccacactgcaaaatgtcctaaggaaggcagaggaatacctcattatgcttccccctgaaactccattttccgaattcgaacacaagttccaagaaattggattggagaagggatggggcgacactgcagagcgcgtgctggagatgatatgcatgcttcttgatctcctcgaggctcccgattcctgtactcttgagaagttcttggggagaattcctatggtgttcaatgtggttatcctttccccccacggatatttcgcccaggaaaatgtcttgggttatcccgacactggtggccaggtgcattactttaatctttatccgtgagtctatgtttgttcgaatcctctagaaatgtcactgtacctatgtaggatactccaaatataatgcattttggggggatctgttatgggtgcgatggcatttttggaggtcggagcaacaaacaattgctatgtattcttctaaagcttgctttcataaatgctaaggtccttcacccttaatgtgcaggttgtctatatattagatcaagttccagccttggagcgtgaaatgcttaagcgcctaaaggagcaaggacttgatatcacaccgcgtattcttattgttagtatttcctgtacttgtaattactgcggattacacaaaatttcctttttatcttcttaacaacttatcttgatggtattcccaggttactcgtctgctacctgatgcagttggaacgacttgtggtcagcggcttgagaaggtgtatggagccgagcactcacatattctgagggtcccctttaggactgagaagggcattgttcgtaaatggatctctcgctttgaagtgtggccatatatggagactttcactgaggtgacactaaaacttccttatatttgtctatcttctaattggtattaggaataatttgttaattgttaactctttgtcttttcgtacatcaggatgtcgcaaaagaacttgctgcagaattgcaggccaagccagatttgataataggcaactatagcgagggaaatcttgtggcttcattgctcgctcataagttaggcgtaacacaggtctgtgttgtttttcactctcttaaagatctgattgcatttccattagtctggaactagaagtactaaaaagttcttttcttcactgtgttatttgccgtcggcagtgcaccatagctcatgcattggagaaaacaaagtatcctgattctgacatctactggaaaaaattcgatgaaaaataccatttctcgtcccagtttaccgctgatcttattgcaatgaatcacaccgattttatcatcaccagcactttccaggagatagcaggaaggtataacatcaatttgctacttcgactgcaacagcattgtgttcccatttctttcccttatgcttaacctaataccgtcatgaattttccagcaaggacactgtcggacagtacgagagtcatcaggcattcacaatgcccggattgtacagagttgttcacggcattgatgtgttcgaccccaaattcaacattgtctcacctggagctgacataaacctctatttcccatattccgagaaggaaaagagactgacagcacttcaccctgaaatcgaggagctgctgtacagtgacattgagaacgaggaacatctgtaagtttctaccttactcgtacagtcagtggcggagccagaattttcactaaaataaggtcaaaatataaagacataaatccacaaagaagccaagggtgtcaatatatagtataaatacattaaaaaaattacctatctacacagtgtaattttccgacaaaggggtgtcggttgacactccttgaatacatgtggctctgccactgggtacagttacaaagttctgttacctatgtagatgagcttgtgctgaacatgttgtgattttggcaggtgtgtgctaaaggacaggaataagccaatcttattcacaatggcgagattggatcgtgtgaagaatttaaccggacttgttgagtggtatgccaagaacgcacggctaagggagttggttaaccttgttgtggttggtggagatcgaaggaaagaatccaaagatttggaagagcaaacagaaatgaaaaagatgtatgagctaataaagactcacaatttaaatggccaattcagatggatttcttcacagatgaaccgagtgaggaacggtgaactctaccgatacattgctgacactagaggagctttcgtgcagcctgcattctacgaggctttcggtttgactgttgttgaggccatgacctgtggtttgcctacatttgcaactaatcatggcggtccagctgagatcatcgttaacggaaaatctggcttccacatcgatccatatcacggtgagcaagctgctgatctgctagctgatttctttgagaaatgtaagacagaaccttctcattgggaaaccatttcaacgggtggcctgaagcgcatccaagagaagtaagcaactctttcttgactctagtcattgaaattaactttcttgactctagtcattgaaattaactcgggatttgaggcgtagttgattgatattttatcgcgtctctactactgatatatacaggtacacgtggcaaatctactcggagaggctattgacattggctgctgtttacgggttctggaaacatgtttctaagcttgatcgtctagaaatccgtcgatatcttgaaatgttttatgctctcaaataccgcaagatggtgagttcctcttcttccttgcccttctcctagtgtttaagatacaatataattgattgcattatcttagagaatcattaatgttaaattttcttaattcttgaatctgttaatgaagtttttctcttggtttttgtttaggctgaagctgttccattggctgctgagtgaatgctttttatgggagtaaattttatggccggtcattcaactttgtgttcattacgcaaaagtcatttttcttggtgtttattacgcaagtcatttttcttttttttgttacgtaaaatcattcaactatgtgtttattatctaaaattcaatttttttttcctttgttacacaaaatcattttactttactctttttatcacaaa agtcaccttggccagattttataataggcttttatcttttgttacacaaaaattattttactttactctatttatcacaaaagtcaccttggccagattttataataggcttttcttttgttacacaaaaattattttactttactctatttatcacaaaagtcaccttggccagattttacaatacttttaccttaaaagactattatgcccttgacattataaatcctctcat ttatataataccttctattgatacactatataatattttttacctaggtattttacttataattaaaataatattaaattatttttttttctattttataatatattcatacatttaattttttcatggcaaatcactttgtttaatcatatttaaacatgaacaaattttaaatatatatcaaaaaaataaaaaaataaaaaaataattttttgaaataataacaaacagattt gtttaacaaatgatagtttttttttatagtcaataaaatttttaaaaaaattcaaagatatttgtttttaatattaatatttttaaagcttttatctgttaatattatttatttgaaagtattaatctgatgtgtcattgtgttaaatgtgagtattttatttattggattaatgagtatggcttggctgataaaaagctttgattttataattttcat taaaaatattttattaagctagtacctgacaaatttaatatcttgaaaattaacgttaagaaaaaattaaatataaaaatatattataaaaataataaataaataatatcaagttattttaattataaataaaatacatggttaaaaatatattatatagcatataatatagaaggtattacataaatgagatgatttaaagggcataatagacttttcaggtgaatgatttgta aaatatggttaaagtgattattgtgataattagagcatagtaaaataatttttatgtaacaaaagaaaaaaaaaatgacttttgggtaatgaacataaatttgaataactttacgtaacaaaagaataaaataaattttggataataaacataaaattgaatgaccacctataaaatttattattttttgggctcttcttgatttgattttttagtt tagcctttgcagtaatcttggttgtcacgcgtagcgttgtgctttcgccacataagtatttagtagacttaattaatgtcattatatcggttggtgtggttttaattacttaactgtactattatattaggtggaaggtttgaaaatttatagtagtaacattctagatcattgaaaattggtgtttcagtgactttttagtatgtcattttcatttt ctaagtggttgtactaatatagtatattaaaattttgattggttgagaaacaatctctctcacctacacggtacgggtaaggtatgcgtatacgcttatcctccctacactccatttgtgggactattgttgttattttggataagctgaggtatccatcttctactaactgcactagtttattttttttgctgtttacagttgaaacaattgt ctgaggatttctcacctgctgaatcaactgcaatggctgaacgtgtgctgactcgtgttcacagccttcgtgaacgtcttgatgctactttggctgctcatcgcaatgagatattactgtttctttcaaggtatagccaaagatagtattcttgttaactaaaaagattcagttggtgttcaaaaaacgatacgtttatctgcctaag tcttggtagtcagaattatccggtacctatgctggtgtgagttagctggctaggaaaccactcttatgaaaacaagagagatttagttagagttgtctgtaattctgtagtatggactatgtatgtgatgctatttgaactggttttggttattataggattgaaagccatggaaaagggatcttgaaaccgcatcagctattggctgagtttgatgca attcgccaagatgacaaaaagaaactgaatgatcatgcatttgaagaactcctgaagtccactcaggtaatatggttttggctatatttgtcgccaacgccaagctcatatttttatattattttgagcttgtgtctgaatacgacgatgatgatgttatactaggaagcaattgttctgccaccttgggttgcacttgcgattcgtttgaggcctggtgt gtgggaatatgtccgtgtgaatgtcaatgcgctagtcgttgaggagctgactgtccctgagtatttgcatttcaaggaagaacttgtcgatggaacgtaagtgttagtcttcaatttgatgctatgttagagaataggctgtggaatttattgatcaatgctgtgctttgtcctgatacagctccaatggaaatttcgtt ctcgagttggattttgagcccttcaccgcatcctttcctaaaccaaccctcaccaaatctatcggaaatggagttgaattcctcaataggcacctctctgcgaaaatgttccatgacaaggaaagcatgaccccgcttcttgaatttcttcgggttcacaattataagggcaaggtgacttgctatttccatttatctataggttcggtttgtgct tatcatgcgcccaatgacatatgaatatgcgctaaaggatagatatatgatttcctttgcagacaatgatgctgaacgacagaatacagaatttaaccacactgcaaaatgtcctaaggaaggcagaggaatacctcattatgcttccccctgaaactccattttccgaattcgaacacaagttccaagaaattggattggagaagggatggggcgacactg cagagcgcgtgctggagatgatatgcatgcttcttgatctcctcgaggctcccgattcctgtactcttgagaagttcttggggagaattcctatggtgttcaatgtggttatcctttccccccggatatttcgcccaggaaaatgtcttgggttatcccgacactggtggccaggtgcattactttaatctttatccgtgagt ctatgtttgttcgaatcctctagaaatgtcactgtacctatgtaggatactccaaatataatgcattttggggggatctgttatggggtgcgatggcatttttggaggtcggagcaacaaacaattgctatgtattcttctaaagcttgctttcataaatgctaaggtccttcacccttaatgtgcaggttgtctatatattagatcaag ttccagccttggagcgtgaaatgcttaagcgcctaaaggagcaaggacttgatatcacaccgcgtattcttattgttagtatttcctgtacttgtaattactgcggattacacaaaatttcctttttatcttcttaacaacttatcttgatggtattcccaggttactcgtctgctacctgatgcagttggaacgacttgtggtcagc ggcttgagaaggtgtatggagccgagcactcacatattctgagggtcccctttaggactgagaagggcattgttcgtaaatggatctctcgctttgaagtgtggccatatatggagactttcactgaggtgacactaaaacttccttatatttgtctatcttctaattggtattaggaataatttgttaattgttaactctttgtcttttcgta catcaggatgtcgcaaaagaacttgctgcagaattgcaggccaagccagatttgataataggcaactatagcgagggaaatcttgtggcttcattgctcgctcataagttaggcgtaacacaggtctgtgttgtttttcactctcttaaagatctgattgcatttccattagtctggaactagaagtactaaaaagttcttttcttcactgtg ttatttgccgtcggcagtgcaccatagctcatgcattggagaaaacaaagtatcctgattctgacatctactggaaaaaattcgatgaaaaataccatttctcgtcccagtttaccgctgatcttattgcaatgaatcacccgattttatcatcaccagcactttccaggagatagcaggaaggtataacatcaatttgctacttcgactgcaacagcat tgtgttcccatttctttcccttatgcttaacctaataataccgtcatgaattttccagcaaggacactgtcggacagtacgagagtcatcaggcattcacaatgcccggattgtacagagttgttcacggcattgatgtgttcgaccccaaattcaacattgtctcacctggagctgacataaacctatttcccatattcgagaaggaaaagag actgacagcacttcaccctgaaatcgaggagctgctgtacagtgacattgagaacgaggaacatctgtaagtttctaccttactcgtacagtcagtggcggagccagaattttcactaaaataaggtcaaaatataaagacataaatccacaaagaagccaagggtgtcaatatatagtataaatacattaaaaaaattacctatctacacagtgtaat tttccgacaaaggggtgtcggttgacactccttgaatacatgtggctctgccactgggtacagttacaaagttctgttacctatgtagatgagcttgtgctgaacatgttgtgattttggcaggtgtgtgctaaaggacaggaataagccaatcttattcacaatggcgagattggatcgtgtgaagaatttaaccggacttgttgagt ggtatgccaagaacgcacggctaagggagttggttaaccttgttgtggttggtggagatcgaaggaaagaatccaaagatttggaagagcaaacagaaatgaaaaagatgtatgagctaataaagactcacaatttaaatggccaattcagatggatttcttcacagatgaaccgagtgaggaacggtgaactctaccgatacattgctgacactaga ggagctttcgtgcagcctgcattctacgaggctttcggtttgactgttgttgaggccatgacctgtggtttgcctacatttgcaactaatcatggcggtccagctgagatcatcgttaacggaaaatctggcttccacatcgatccatatcacggtgagcaagctgctgatctgctagctgatttctttgagaaatgtaagacagaaccttct cattgggaaaccatttcaacgggtggcctgaagcgcatccaagagaagtaagcaactctttcttgactctagtcattgaaattaactttcttgactctagtcattgaaattaactcgggatttgaggcgtagttgattgatatttttcgcgtctctactactactgatatacaggtacacgtggcaaatctactcggagaggctattgacattggctgctgtttacggggtt ctggaaacatgtttctaagcttgatcgtctagaaatccgtcgatatcttgaaatgttttatgctctcaaataccgcaagatggtgagttcctcttcttccttgcccttctcctagtgtttaagatacaatataattgattgcattatcttagagaatcattaatgttaaattttcttaattcttgaatctgttaatgaagttttctcttgg ttttgtttaggctgaagctgttccattggctgctgagtga
SEQ ID NO: 8: Полипептидная последовательность NtSUS2-TSEQ ID NO: 8: NtSUS2-T polypeptide sequence
MLFMGLKQLSEDFSPAESTAMAERVLTRVHSLRERLDATLAAHRNEILLFLSRIESHGKGILKPHQLLAEFDAIRQDDKKKLNDHAFEELLKSTQEAIVLPPWVALAIRLRPGVWEYVRVNVNALVVEELTVPEYLHFKEELVDGTSNGNFVLELDFEPFTASFPKPTLTKSIGNGVEFLNRHLSAKMFHDKESMTPLLEFLRVHNYKGKTMMLNDRIQNLTTLQNVLRKAEEYLIMLPPETPFSEFEHKFQEIGLEKGWGDTAERVLEMICMLLDLLEAPDSCTLEKFLGRIPMVFNVVILSPHGYFAQENVLGYPDTGGQVVYILDQVPALEREMLKRLKEQGLDITPRILIVTRLLPDAVGTTCGQRLEKVYGAEHSHILRVPFRTEKGIVRKWISRFEVWPYMETFTEDVAKELAAELQAKPDLIIGNYSEGNLVASLLAHKLGVTQCTIAHALEKTKYPDSDIYWKKFDEKYHFSSQFTADLIAMNHTDFIITSTFQEIAGSKDTVGQYESHQAFTMPGLYRVVHGIDVFDPKFNIVSPGADINLYFPYSEKEKRLTALHPEIEELLYSDIENEEHLCVLKDRNKPILFTMARLDRVKNLTGLVEWYAKNARLRELVNLVVVGGDRRKESKDLEEQTEMKKMYELIKTHNLNGQFRWISSQMNRVRNGELYRYIADTRGAFVQPAFYEAFGLTVVEAMTCGLPTFATNHGGPAEIIVNGKSGFHIDPYHGEQAADLLADFFEKCKTEPSHWETISTGGLKRIQEKYTWQIYSERLLTLAAVYGFWKHVSKLDRLEIRRYLEMFYALKYRKMAEAVPLAAEMLFMGLKQLSEDFSPAESTAMAERVLTRVHSLRERLDATLAAHRNEILLFLSRIESHGKGILKPHQLLAEFDAIRQDDKKKLNDHAFEELLKSTQEAIVLPPWVALAIRLRPGVWEYVRVNVNALVVEELTVPEYLHFKEELVDGTSNGNFVLELDFEPFTASFPKPTLTKsignGVEFLNRHLSAKMFHDKESMTPLLEFLRVHNYKGK TMMLNDRIQNLTTLQNVLRKAEEYLIMLPPETPFSEFEHKFQEIGLEKGWGDTAERVLEMICMLLDLLEAPDSCTLEKFLGRIPMVFNVVILSPHGYFAQENVLGYPDTGGQVVYILDQVPALEREMLKRLKEQGLDITPRILIVTRLLPDAVGTTCGQRLEKVYGAEHSHILRVPFRTEKGIVRKWISRFEVWPYMETFTEDVA KELAAELQAKPDLIIGNYSEGNLVASSLLAHKLGVTQCTIAHALEKTKYPDSDIYWKKFDEKYHFSSQFTADLIAMNHTDFIITSTFQEIAGSKDTVGQYESHQAFTMPGLYRVVHGIDVFDPKFNIVSPGADINLYFPYSEKEKRLTALHPEIEELLYSDIENEEHLCVLKDRNKPILFTMARLDRVKNLTGLVEWYAKNARLRE LVNLVVVGGDRRKESKDLEEQTEMKKMYELIKTHNLNGQFRWISSQMNRVRNGELYRYIADTRGAFVQPAFYEAFGLTVVEAMTCGLPTFATNHGGPAEIIVNGKSGFHIDPYHGEQAADLLADFFEKCKTEPSHWETISTGGLKRIQEKYTWQIYSERLLTLAAVYGFWKHVSKLDRLEIRRYLEMFYALKYRKMAEAVPLA AE
SEQ ID NO: 9: Полинуклеотидная последовательность NtSUS3-S SEQ ID NO: 9: Polynucleotide sequence of NtSUS3-S
atggcgaatccaaagttcacaagagtacctagcatgagggagagagttgaggatactctctctgctcaccgtaaccagcttgttgctctcctctccaggtatattaataaactctatatacttgttattttctttatttttttgtctttactgataaatttaactgttttcttctttaaatcttgctttcgatgcatgatttctgttgtgttaaattgcgtaaccattttatctaaaagtttatgctgataaacacttttaaattttaatatgtaaattatattatgtctcaacatcaacatgtggatggccaaaaatataaagcttaattttcgttattttgaatgatttttctctgcgagtgttacggtttgcgtacacattacctaaacctcctccctagtccccacttgtgggaatttaattttttttttctttgtttttttttgttgttgttgttgtctgagttcaattcctaccatgttagcttggcaaaaataagttggtaaagcttgaccccaactagttttagttgatcgatttatttggtgatttatagttcaataataataattactattagagaaagttccagcagcttttctgtttgtttttccagttttagtgattgatatatgtgtatatatattctttgtttcttttaagatacgtggcgcaggggaaggggatattgcaacctcaccacttgatcgatgagttcaacaacgctgtatgtgatgacactgcttgtgagaagctcaaagatggtccctttagtgaagtcttgaaagctactcaggtatattcactaatccatgggaatcaagatgatactgtatatctttattatggtgtctttcagaaatttgacgatgatgaaatgcaacttttctctgtttgtcaccttatccagactgtttttttattttttatttttcattttttaacttgaaatgctcttaatttcctttgtttatcgataagaccggatttacaatgtatgaacggagcatcttaagaaccttctggaatgaagatataagatataaaacatggtgtccgttttctcctttgtggaatcagtgtacatatagactgttattttggtcccactttctggatcttctgatcacaccttctcatgcagaggcgagcttgatggtttcaacctttaaattcttactattgaatccatttcactttcgaaattatgagttcgaaatctaatatttgttgaaatttttgcaaatgttcacatataagtttaagctttgtgtcaagaatactgggctcaatggattccaatagaccaggctgtatccgcctctgtctccactctccctgcatccacttctttcgtgtgactaataatgcttaatgagctagaactcgttttaatgtttgaataagttgcttatatcagagcagcttttgatgtttcaatctttaacgggttatgcagtaccagcattctgcggctgaaaaacaggaatctgagatttacttgtctctggctgaatttcttgttcattttgctaacaagtactttggagttaatgcttgctctctgttgtcaaaataggaagccattgtgctgccaccatttgttgccatagcagttcgtccaaggccaggtgtttgggagtatgttcgtgttaatgtatatgatttgagcgttgaacaattgactgttcctgaatatcttcatttcaaggaagaacttgtggatggagagtaagctctttcttatttcaatacgaaacataaaaatttacagaagttgaataattaacaaatttgttgatttttaatgtatgccaggggtaataatcactttgtgcttgagctggattttgagccatttaatgcatcagttcctcgtccatctcgatcgtcatccattggcaatggagtccaattcctcaatcgtcatctttcctcaattatgtttcgcagcaaagactctctggaccccttacttgatttccttagaggacactgtcataaagggaatgtaagtaccaaaagcagttttccctttgtaaatgtctgcttgtccctgattatctactaaatctttcaacacgcgcaaccattataagaaatgtacaatacttctagttagaatttcatcatcgacaaactatctgctttactttttatttttcccatttgatggatgatagtttagtttatataacagatgatattttggttgaagggtaccatgaactttttcacaaccacttaatggatacatagttgtaatagttgacattttggaataatattgtctcacttggaaatgtttaagaagtattactacttctatttgtaagatggattgtttatctatgcaggtcttgatgttgaatgatcgtatacagcgaatctccaggctggagtctgctctttctaaagcagaggattatctctccaagctatcaccagatacatcctataatgagttcgaatacgcgtgagcttgtacacatttgttttgttttctttcaagcatatgtaatttctcaagaaaagggaaatctataggagttgaaacattctttatggaaccatgtgcatgcagattgcaagaaatgggctttgagagaggttggggtgatactgccagacgtgttttggagacgatgcatcttctttctgacattcttcaggctccggatccatcaaccttggagacatttcttggtagactacctatggtgttcaatgtcgtcatattatcccctcatggatattttggccaagcaaatgtcttgggtttgcccgacactggtggccaggtaataacaaggagaatgaggtcttgtattatgtactccctccgttccaatctatatgaacctatttgactgggtatggaaagaaatgaagacttgtaaaacttgtggttctttagaaattccaaacattacatttggttttttccctcttcctggaaattatactactgaatcatctctagatgttccagtttaacttgagacgtaagggtaaataacggaccattactctgtcctttcttgcagtaggcttggtacaatgaatatagttcgcatagttgccggaagctagagctgtgttagaaaactcaggaacattaatttggcgatgctaatcactgctaatgttactgaagcatccatggttttccttgatgttattctccttttggttgcttcacaggttgtctatatactggatcaagtgcgtgccttggaggccgaaatgcttcttagaataaagcaacaaggacttaacttcaagcctagaatccttgtcgtgagtacatatatattatgcaagctcttatttggtttgtgggattgcagttgacatcaatttgcttactctgattactaaaggtcacacggctgatacctgatgctaaaggaaccatgtgcaaccagaggttggagaggattagtggaactgaatactcgcatattttacgtgtcccttttaggacagagaagggaatccttcataaatggatatctaggtttgatgtatggccttacctggagaagttcactgaggtaacctctttgtcccttggaaattgccttttgttgctgatgtttctgctagtgtgcttaaatgacggatgttaactagtcacttgctagcgtttgcaatagcaacgggaaaagaaaggatttttgctagtttgaagtctgcctccaagaaaaattatattaaaagtttatggctagtggaaacatcagtcattcatgtaccttatttctatgcccaagttgtttaagttgaaagtaatttggccaactatgcaaattgggagaacgtgtagccaactattgtgtttgccgacatgttgatatactttttggtcctgatttatatttgttggtttgtcatactggatgaagcaattctcatgtttttctgcttatatatattggaagaagagatacttgtcgtttcatcatttttctcgacctctctattaccaacactttgccaatttaatgtttggaaatgtcttcttgaccaggatgtggcaagtgaaatgaccgctgagctccagggaaagccagatctgattattggcaactacagtgatggaaatttagttgcctcccttttggcatataaaatgggtgtcacacaggtaggaaatacatgattctttatcttgctagcactaagtcttgaggttatgtatctgcaatagaaattttacgctttgccttcatttctttttaattatttttccagtgtaccattgctcatgccttggaaaaaacaaagtatcctgattctgacatctactggaaaaagtttgaggagaaatatcatttttcatgtcagtttactgctgatctactggcaatgaataattcagatttcattatcaccagtacttatcaagagattgcaggaacgtaagtcattttaatctggtcgtttaaatctgatatttcttccctagtagtctattcaatccgaatttcagttcagtatatgatgtcatcggttgaggaactgtgattggtaaccttatcaaatccgtagctgctctataattttatttcgtaattggagaaacaattttttattattgagcttgtagtctgagctagaatttggttctttatctatcaagtagcataatactacaactattttttatgtgtggcaatttgcaatttcaattttctatttctataagttgcagcttttcttcctgttctgatcatatttacatggctgaaactcaatagaaaactaggctagttgatcaaaagtagttggatgctttaaaattagtagacgttttgctaaatgagtgaccaatgttattaaaaaaacgttcatgttttcaacccttttggcatacatttgaccactgcccaagattttggataagtacatgcagtgcttataattataaagcattttatcccaccttgtttttcattatgaaaattaagtaatttacgagtatttgtataagttacttcataaattagaagtaaatctggattgtgtaaagttattcgccccgtatatactgaaagctacttgaacaagcaaaaaaacagacaaacgtaacattctccatggattaatgagacttgtatatatatatatatatatatgtaaagagagagagagagagatttggcttgtaaccacatgtatattatgccatatggatgtgacattgatgtgactagacctaaatgttttgtttcaatgtccacgggagttttacgtagagttaagaggagaagagagtgaggaatactaatgtttgatggtaccccttggcttcttgacctggatactcagtgttcttattcatgcctatactttggtccttgatttcattctcccttttctagcttgagctgcatcaaagaaattccactgtaaaaaaaataatgctcaccatattggtgcaacatggcaaacatgtatcctatttgatgatcaatcaactttatttttctcctgttaattgacctcagtgtgtaactctctatgtatgatagcattgtaacttgtgtcatgattcataaatagggtactagaattggatggttgacatagtaaatggtcaattgatgatccacaaaatatgcacctactgattaaaatgtgatagggcaggtttatttttgtttgtggttaacacagtacttaaccctatatttaatacaatttggcttatctacaatcttttcttcagtgtttatgcgaattccttattgcacaacaatattgtctttctgagttctattctgttgttgcttacacttttattattccagtaacatagatgtgaagacattagattggttgcttgcaaattgatagccacttgtttcaggaagaatactgttggtcagtacgagagccatactgcattcaccctcccgggactatatcgcgtcgttcatggcattgatgttttcgatcccaaattcaatatagtgtctcctggagctgacatgacaatttatttcccatattctgacaaggaaaaaagactaacgtctttgcatggctcgattgaaaagttgttatttgatcctgcgcagaatgaagagcatatgtaagtggcatccgtttgtacttaatttttttggaatagatgacatattatttgcatgaatatgaaaaggagggtctgatatgattttctatagataaactaccaatgatattatttaaaaactcctggatactgtattaggagaagaagagaaccaggggtagatggcattagaatcccttaaatcttgaagagtcgtcactaacgctcccaacacttctgcctcagaccctcaactaaatactattattgttgatttctttggagaagctataagaatctctctctccttatggtgaaaattttacttggctttatacttaacttccaaggctccctcttataaaatgcaaaaactgtctgtattcactctcttggttaacaattgatccaatcaaatgcatatggaacatctttctttacgtttcttctaaagttcgtttgaggataaggagtagaatctgagaagatagactagtaggtaaccttagggacggatgtggaaattaacatatgggctcagcttttctgccgagtgcagaccatgtatatgcgttaaaaaattcactaaacaagtaaatgtttgattttgaacccagtaaatcaaatgagttgtggtagaatctcgaactcgaaccgataaagttcaaatccaggatccgcttttaggtaaactctaccttgggaagtgttatatatatgtccctgattatttctttttccgtttcctttctattttaatttttaaagttatttttagatggttttattttttgataagtggtaagttgttaatattccaaattaaatgccattgtcataactatatacatttataaagaatgattgatcctagtttctcattcctaagatccaaataaggcaataaacaatgtcttagtaattggacctgcttctggtgatcaacgcttgatcgcgtagttagttatagatgactgtaaaaactttaaccattttaatggttttgtcaaagaacaaatatcggacatattatagagaatggactattgtactttgcttctgattggtcattttattgtgatccgtaaattggctgtgactgatgtcatatctttgcttacagaggtaatctgaatgataaatcaaaacccataattttttcaatggcaaggctagaccatgttaagaacattacgggactagttgagtgctatgctaaaaatgccacattgagggaattggcgaaccttgttgtagtagctggatacaacgatgtaaagaaatccagtgatagagaagaaataacagaaattgagaagatgcatgctcttattaaggagcataaattggatgggcaattcagatgggtatcagcccaaacaaaccgggcacgtaatggtgagctctatcgctatatagctgaccagagaggtatatttgttcaggtatgctatttgtattgtattagtccaatttcattttttgcaccaaaagaaaggttgttattgtgacgtatatgtttgttttagcctgcattttatgaagcatttggactaacggtggttgaagctatgacttgtggtcttccaacatttgcaacttgccatggtggtcctaatgagatcattgaacccggtgtatctgggttccatattgatccttatcatcccgataaagctgctgaactcatgtcagaattctttcaacgctgcaaacaagatcctactcactgggaaaaaatatctgcatctggtctccgaaggattcttgagaggtctgtagttgtgtacatgtatagaagattaaagaatgctaccttgatatttatttgaatcaaaaataacaggaacatctcttttttgaacatcactcaagttcttatattaaataatttttaggtatacgtggaagatttactccgagaggctgatgactttatctggcgtatatggtttctggaagcttgtttcaaaacttgagaggcgtgaaactagacgataccttgagatgttctacattctcaaattccgcgagttggtgagtgccttttagctccttttcagttccaataaactatatatgtggtttaagtaagtattaagcataaacatgtccgtgcttggggctgtcgaaaatgctatggacatatcctgagctaaggatttttcaagaaaattgatgttagctttactctatttacaggcaaaatctgtacctctagcaattgatgacaagtgaatggcgaatccaaagttcacaagagtacctagcatgagggagagttgaggatactctctctgctcaccgtaaccagcttgttgctctcctctccaggtatattaataaactctatatacttgttattttctttattttttgtctttactgataaatttaactgttttcttctttaaatcttgctttcgatgcatgatttctgttgtgttaaattgc gtaaccattttttctaaaagttttgctgataaacacttttaaattttaatatgtaaattatattatgtctcaacatcaacatgtggatggccaaaaatataaagcttaattttcgttattttgaatgatttttctctgcgagtgttacggtttgcgtacacattacctaaacctcctccctagtccccacttgtgggaatttaatttttttt ttctttgtttttttttgttgttgttgttgtctgagttcaattcctaccatgttagcttggcaaaaataagttggtaaagcttgaccccaactagttttagttgtcgatttatttggtgatttatagttcaataataattaattactattagagaaagttccagcagctttctgtttgtttttccagttttagtgattgatatatgtgtatatatattctttg tttcttttaagatacgtggcgcaggggaaggggatattgcaacctcaccacttgatcgatgagttcaacaacgctgtatgtgatgacactgcttgtgagaagctcaaagatggtccctttagtgaagtcttgaaagctactcaggtatattcactaatccatgggaatcaagatgatactgtatctttttattatggtgtctttcagaaattt gacgatgatgaaatgcaacttttctctgtttgtcaccttatccagactgtttttttattttttatttttcattttttaacttgaaatgctcttaatttcctttgttttcgataagaccggatttacaatgtatgaacggagcatcttaagaaccttctctggaatgaagatataagatataaaacatggtgtccgttttctcctttgtggaatcagtgta catatagactgtttattttggtcccactttctggatcttcttgatcacaccttctcatgcagaggcgagcttgatggtttcaacctttaaattcttactattgaatccatttcactttcgaaattatgagttcgaaatctaatatttgttgaaatttttgcaaatgttcacatataagtttaagctttgtgtcaagaatactgggctcaatggattccaatagacca ggctgtatccgcctctgtctccactctccctgcatccacttctttcgtgtgactaataatgcttaatgagctagaactcgttttaatgtttgaataagttgcttatatcagagcagcttttgatgtttcaatctttaacgggttatgcagtaccagcattctgcggctgaaaaacaggaatctgagatttacttgtctctggctgaatttct tgttcattttgctaacaagtactttggagttaatgcttgctctctgttgtcaaaataggaagccattgtgctgccaccatttgttgccatagcagttcgtccaaggccaggtgtttgggagtatgttcgtgttaatgtatgatttgagcgttgaacaattgactgttcctgaatatcttcatttcaaggaagaacttgtggat ggagagtaagctctttcttatttcaatacgaaacataaaaatttacagaagttgaataattaattaacaaatttgttgatttttaatgtatgccaggggtaataatcactttgtgcttgagctggattttgagccatttaatgcatcagttcctcgtccatctcgatcgtcatccattggcaatggagtccaattcctcaatcgtcatctttcctcaattatgttt cgcagcaaagactctctggaccccttacttgatttccttagaggacactgtcataaagggaatgtaagtaccaaaagcagttttccctttgtaaatgtctgcttgtccctgattatctactaaatctttcaacacgcgcaaccattataagaaatgtacaatacttctagttagaatttcatcgacaaactatctgctttactttttatttttcccatttgat ggatgatagtttagtttatataacagatgatattttggttgaagggtaccatgaactttttcacaaccacttaatggatacatagttgtaatagttgacattttggaataatattgtctcacttggaaatgtttaagaagtattactacttctatttgtaagatggattgtttatctatgcaggtcttgatgttgaatgaatgatcgtatacagcgaatctccaggctggagtctg ctctttctaaagcagaggattatctctccaagctatcaccagatacatcctataatgagttcgaatacgcgtgagcttgtacacatttgttttgttttctttcaagcatatgtaatttctcaagaaaagggaaatcttaggagttgaaacattctttttggaaccatgtgcatgcagattgcaagaaatgggctttgagagaggttggggtgatactgccagacg tgttttggagacgatgcatcttctttctgacattcttcaggctccggatccatcaaccttggagacatttcttggtagactacctatggtgttcaatgtcgtcatattatcccctcatggatattttggccaagcaaatgtcttgggtttgcccgacactggtggccaggtaataacaaggagaatgaggtcttgtattatgtactccctccgttccaatctatga acctatttgactgggtatggaaagaaatgaagacttgtaaaacttgtggttctttagaaattccaaacattacatttggttttttcccttcctggaaattatactactgaatcatctctagatgttccagtttaacttgagacgtaagggtaaataacggaccattactctgtcctttcttgcagtaggcttggtacaatgaatatagttcgcatagttgccggaag ctagagctgtgttagaaaactcaggaacattaatttggcgatgctaatcactgctaatgttactgaagcatccatggttttccttgatgttattctccttttggttgcttcacaggttgtctatatactggatcaagtgcgtgccttggaggccgaaatgcttcttagaataaagcaacaaggacttaacttcaagcctagaatccttgtcgtgag tacatatatattatgcaagctcttatttggtttgtgggattgcagttgacatcaatttgcttactctgattactaaaggtcacacggctgatacctgatgctaaaggaaccatgtgcaaccagaggttggagaggattagtggaactgaatactcgcatattttacgtgtcccttttaggacagagaagggaatccttcataaatggatatctaggtttgat gtatggccttacctggagaagttcactgaggtaacctctttgtccctttggaaattgccttttgttgctgatgtttctgctagtgtgcttaaatgacggatgttaactagtcacttgctagcgtttgcaatagcaacgggaaaagaaaggattttgctagtttgaagtctgcctccaagaaaaattatattaaaagtttatggctagt ggaaacatcagtcattcatgtaccttatttctatgcccaagttgtttaagttgaaagtaatttggccaactatgcaaattgggagaacgtgtagccaactattgtgtttgccgacatgttgatatactttttggtcctgatttatatttgttggtttgtcatactggatgaagcaattctcatgttttctgcttatatatattggaagaagaagatacttgt cgtttcatcatttttctcgacctctctattaccaacactttgccaatttaatgtttggaaatgtcttcttgaccaggatgtggcaagtgaaatgaccgctgagctccagggaaagccagatctgattattggcaactacagtgatggaaatttagttgcctcccttttggcatataaaatgggtgtcacacaggtaggaaatacatgattcttttcttgctag cactaagtcttgaggttatgtatctgcaatagaaattttacgctttgccttcatttcttttaattattttccagtgtaccattgctcatgccttggaaaaaacaaagtatcctgattctgacatctactggaaaagtttgaggagaaatcatttttcatgtcagtttactgctgatctactggcaatgaataattcagatttcattatcaccagt acttatcaagagattgcaggaacgtaagtcattttaatctggtcgtttaaatctgatatttcttccctagtagtctattcaatccgaatttcagttcagtatatgatgtcatcggttgaggaactgtgattggtaaccttatcaaatccgtagctgctctataattttattcgtaatttggagaaacaatttttattattgagcttgtagtctgagct agaatttggttctttatctatcaagtagcataatactacaactattttttatgtgtggcaatttgcaatttcaattttctatttctataagttgcagcttttcttcctgttctgatcatatttacatggctgaaactcaatagaaaactaggctagttgatcaaaagtagttggatgctttaaaattagtagacgttttgctaaatgagtgaccaatgttattaaa aaaacgttcatgttttcaacccttttggcatacatttgaccactgcccaagattttggataagtacatgcagtgcttataattataaagcatttttcccaccttgtttttcattatgaaaattaagtaatttacgagtatttgtataagttacttcataaattagaagtaaatctggattgtgtaaagttattcgccccgtatatactgaaagctacttgaacaag caaaaaaacagacaaacgtaacattctccatggattaatgagacttgtatatatatatatatatatatgtaaagagagagagagagagatttggcttgtaaccacatgtatattatgccatatggatgtgacattgatgtgactagacctaaatgttttgtttcaatgtccacgggagttttacgtagagttaagaggagaagagagtgaggaatactaat gtttgatggtaccccttggcttcttgacctggatactcagtgttcttattcatgcctatactttggtccttgatttcattctcccttttctagcttgagctgcatcaaagaaattccactgtaaaaaaaataatgctcaccatattggtgcaacatggcaaacatgtatcctattgatgatcaatcaactttatttttctcctgttaattgacc tcagtgtgtaactctctatgtatgatagcattgtaacttgtgtcatgattcataaatagggtactagaattggatggttgacatagtaaatggtcaattgatgatccacaaaatatgcacctactgattaaaatgtgatagggcaggtttatttttgtttgtggttaacacagtacttaaccctatatttaatacaatttggcttatctacaatcttttt cttcagtgtttatgcgaattccttattgcacaacaatattgtctttctgagttctattctgttgttgcttacacttttttccagtaacatagatgtgaagacattagattggttgcttgcaaattgatagccacttgtttcaggaagaatactgttggtcagtacgagccatactgcattcaccctcccgggactatatcgcgtcg ttcatggcattgatgttttcgatcccaaattcaatatagtgtctcctggagctgacatgacaatttatttcccatattctgacaaggaaaaaagactaacgtctttgcatggctcgattgaaaagttgttatttgatcctgcgcagaatgaagagcatccgtttgtacttaatttttttggaatagatgacatattatttgcatgaatat gaaaaggagggtctgatatgattttctatagataaactaccaatgatattatttaaaaactcctggatactgtattaggagaagaagaagaaccaggggtagatggcattagaatcccttaaatcttgaagagtcgtcactaacgctcccaacacttctgcctcagaccctcaactaaatactattattgttgatttctttggagaagctataagaatctctctctccttatggtgaa aattttacttggctttatactacttaacttccaaggctccctcttaaaatgcaaaaactgtctgtattcactctcttggttaacaattgatccaatcaaatgcatatggaacatctttctttacgtttcttctaaaagttcgtttgaggataaggagtagaatctgagaagatagactagtaggtaaccttagggggacggatgtggaaattaacatatgggctcag cttttctgccgagtgcagaccatgtatatgcgttaaaaaattcactaaacaagtaaatgtttgattttgaacccagtaaatcaaatgagttgtggtagaatctcgaactcgaaccgataaagttcaaatccaggatccgcttttaggtaaactctaccttgggaagtgttatatatatgtccctgattatttctttttccgtttcct ttctattttaatttttaaagttatttttagatggttttattttttgataagtggtaagttgttaatattccaaattaaatgccattgtcataactatatacatttataaagaatgattgatcctagtttctcattcctaagatccaaataaggcaataaacaatgtcttagtaattggacctgcttctggtgatcaacgcttgatcgcgtagttagttatagatgactg taaaaactttaaccattttaatggttttgtcaaagaacaaatatcggacatattatagagaatggactattgtactttgcttctgattggtcattttattgtgatccgtaaattggctgtgactgtgtcatatctttgcttacagaggtaatctgaatgataaatcaaaacccataatttttcaatggcaaggctagaccatgttaagaacattacgggactag ttgagtgctatgctaaaaatgccacattgagggaattggcgaaccttgttgtagtagctggatacaacgatgtaaagaaatccagtgatagagaagaaataacagaaattgagaagatgcatgctcttattaaggagcataaattggatgggcaattcagatgggtatcagcccaaacaaaccgggcacgtaatggtgagctatcgctatatag ctgaccagagaggtatatttgttcaggtatgctatttgtattgtattagtccaatttcatttttgcaccaaaagaaaggttgttattgtgacgtatatgtttgttttagcctgcatttttgaagcatttggactaacggtggttgaagctatgacttgtggtcttccaacatttgcaacttgccatggtggtcctaatgagatcattgaacccgg tgtatctgggttccatattgatccttcatcccgataaagctgctgaactcatgtcagaattctttcaacgctgcaaacaagatcctactcactgggaaaaaatatctgcatctggtctccgaaggattcttgagggtctgtagttgtgtacatgtatagaagattaaagaatgctaccttgatatttattgaatcaaaaataacaggaacatctctt ttttgaacatcactcaagttcttatattaaataatttttaggtatacgtggaagatttactccgagaggctgatgactttatctggcgtatatggtttctggaagcttgtttcaaaacttgaggcgtgaaactagacgataccttgagatgttctacattctcaaattccgcgagttggtgagtgcctttagctccttttcagttccaataaact atatatgtggtttaagtaagtattaagcataaacatgtccgtgcttggggctgtcgaaaatgctatggacatatcctgagctaaggatttttcaagaaaattgatgttagctttactctatttacaggcaaaatctgtacctctagcaattgatgacaagtga
SEQ ID NO: 10: Полипептидная последовательность NtSUS3-SSEQ ID NO: 10: NtSUS3-S polypeptide sequence
MANPKFTRVPSMRERVEDTLSAHRNQLVALLSRYVAQGKGILQPHHLIDEFNNAVCDDTACEKLKDGPFSEVLKATQEAIVLPPFVAIAVRPRPGVWEYVRVNVYDLSVEQLTVPEYLHFKEELVDGEGNNHFVLELDFEPFNASVPRPSRSSSIGNGVQFLNRHLSSIMFRSKDSLDPLLDFLRGHCHKGNVLMLNDRIQRISRLESALSKAEDYLSKLSPDTSYNEFEYALQEMGFERGWGDTARRVLETMHLLSDILQAPDPSTLETFLGRLPMVFNVVILSPHGYFGQANVLGLPDTGGQVVYILDQVRALEAEMLLRIKQQGLNFKPRILVVTRLIPDAKGTMCNQRLERISGTEYSHILRVPFRTEKGILHKWISRFDVWPYLEKFTEDVASEMTAELQGKPDLIIGNYSDGNLVASLLAYKMGVTQCTIAHALEKTKYPDSDIYWKKFEEKYHFSCQFTADLLAMNNSDFIITSTYQEIAGTKNTVGQYESHTAFTLPGLYRVVHGIDVFDPKFNIVSPGADMTIYFPYSDKEKRLTSLHGSIEKLLFDPAQNEEHIGNLNDKSKPIIFSMARLDHVKNITGLVECYAKNATLRELANLVVVAGYNDVKKSSDREEITEIEKMHALIKEHKLDGQFRWVSAQTNRARNGELYRYIADQRGIFVQPAFYEAFGLTVVEAMTCGLPTFATCHGGPNEIIEPGVSGFHIDPYHPDKAAELMSEFFQRCKQDPTHWEKISASGLRRILERYTWKIYSERLMTLSGVYGFWKLVSKLERRETRRYLEMFYILKFRELAKSVPLAIDDKMANPKFTRVPSMRERVEDTLSAHRNQLVALLSRYVAQGKGILQPHHLIDEFNNAVCDDTACEKLKDGPFSEVLKATQEAIVLPPFVAIAVRPRPGVWEYVRVNVYDLSVEQLTVPEYLHFKEELVDGEGNNHFVLELDFEPFNASVPRPSRSSSIGNGVQFLNRHLSSIMFRSKDSLDPLLDFLRGHCHKGNVLMLNDRIQRISRLESALSK AEDYLSKLSPDTSYNEFEYALQEMGFERGWGDTARRVLETMHLLSDILQAPDPSTLETFLGRLPMVFNVVILSPHGYFGQANVLGLPDTGGQVVYILDQVRALEAEMLLRIKQQGLNFKPRILVVTRLIPDAKGTMCNQRLERISGTEYSHILRVPFRTEKGILHKWISRFDVWPYLEKFTEDVASEMTAELQGKPDLIIG NYSDGNLVASSLLAYKMGVTQCTIAHALEKTKYPDSDIYWKKFEEKYHFSCQFTADLLAMNNSDFIITSTYQEIAGTKNTVGQYESHTAFTLPGLYRVVHGIDVFDPKFNIVSPGADMTIYFPYSDKEKRLTSLHGSIEKLLFDPAQNEEHIGNLNDKSKPIIFSMARLDHVKNITGLVECYAKNATLRELANLVVVAGY NDVKKSSDREEITEIEKMHALIKEHKLDGQFRWVSAQTNRARNGELYRYIADQRGIFVQPAFYEAFGLTVVEAMTCGLPTFATCHGGPNEIIEPGVSGFHIDPYHPDKAAELMSEFFQRCKQDPTHWEKISASGLRRILERYTWKIYSERLMTLSGVYGFWKLVSKLERRETRRYLEMFYILKFRELAKSVPLAIDDK
SEQ ID NO: 11: Полинуклеотидная последовательность NtSUS3-T SEQ ID NO: 11: Polynucleotide sequence of NtSUS3-T
atgtttacatggctgaaactcaatataaaaaacaagggtaggtgatcaaaaatcgttggatgcttaaaatcagtagacgttttgctaaatgagcgaccaatgttattgaaaacgttcatgttttcaacccttttggcatacatttgagcattgcccaagattttggataagtagatgcagtgcttataattttaaagcattgtatcctgccttgtttttcattgtcaaaattaattaacttacaagtatttctataagttgcttcataaattagaagtaaatctggattgtgtaatgttattcgcctcgtaaatactgaaagctgcttgaacaagtgaaaaaacacagacaaacgtaacattctccatggattgatgagacttgtaaaatacatatatagaaatttggcttgtaaccacatgtatattatgccatatggatgtgacattgatgtgactagacctaaatgttttgtttccatgtccactggagttttacgtatagttaagaggagaaaagactgaggaatactaatgtatgatggtacccctttgcttcttgacctggatacccagtgttcctattcatgcctatactttggtccttgatttcactctcccttttctaacttgagctgcatcaaagaaatttccactgtaaaaaaataaataatgctcaccatatctctgcaacattgcaaacatgtatcccatatgattgatattggtgcgacatggcaaacatgtatcctatttgatgatcaatcaaatttatttttcccctgtcaaaatgacctcagtgtgtaattccctatgtatttgatagcattgtaactcgtgtcatgattcatgaatagggtactagaattgcatggttgacaaatattaactggtcgattgatgatccacaaaacatgcacttactgactaaaatgtgatgggacagatttatttttgtttgtgattaacacagtacttaaccctatacttaatacaatttggcctagctacaatcttttcttcagtgcaaattccttgttacacgaccaatattgtctttctgagttctattctgttgttacttacacttttattattcgaataagacattagattgcttgcatgcaaattgatagccacttgtttcaggaagaatactgttggtcagtacgagagccatactgcattcaccctcccaggactatatcgcgtcgttcatggcattgatgttttcgatcccaaattcaatatagtgtctcctggagctgacatgacaatttacttcccatattctgacaaggaaaaaagactaacgtctttgcatggctcgattgagaagttgttatttgatcctgcgcagaatgaagagcatatgtaagtgacatccatttgtacttattttaatttggaatagatgacatacttatttgcatgaatataaactgacaacccagagatttcctacattagaaaaggagggtctgatatgattttctacaaataaattcccagtgatattgttcaaaaagtcctggatactttattatgagagaaccagggatagatggcactagaatcccttaatcttgagaagtcgccacttatcgctcccaacactttctgagaccctcaagtaactactattattgtttgatatcttggagaagctataagaatctttttctccttattgtaattttttttacgtgactttaaacttaacttccaagctccttctgataaaatgcaaaaactgtctgtattcactgtcttggtttattaacaattgatccaatcaaatgcatatggaacatctttctttttgtttcttcaaaagttcgtttgaggataaggagtagaatctgagaagatagactagtaggtaaccttaggggcggatgtagaaatcaacgtatgggttcagctttgttgcagaccctgtatatgcattaaaaaaatcactaaataagtaaataattgattttgaacccagtaaatcaaaatgagttgtagtagaatcctgaactcgaaccgataaagttggatccactaccgggtaaactctaccttgagaagtgtttatatatgtccctaattatttcttttctgtttcctttctattttaattttttaagttcctttttagatggttttattttttgacaagtggtaagttgttagtattccaaattaaatgccattgccataactatatacatttataaagattgattgaccctagtttctcattcctaagatccaaataaggcaataaacaatatgtcttagtacttgaacctgcttctggtggtcaacacttgatcgcgtagttagttatagatgactgtaaaaaccttaatcattttaatggttttgtcaaagaacaaatatcggacatattatagcgaatggactattgtacttttcttctgattggtcattttattgtgatccgtaagttggctgagactgatgtcatatctttgcttacagaggtaatctgaatgataaatcaaaacccataattttttcaatggcaaggctagaccatgttaagaacattacgggactagttgagtgctatgctaaaaatgccacattgagggaattggctaaccttgttgttgtagctggatacaacgatgtaaagaaatccagtgatagagaagaaatagcagaaattgagaagatgcatgctcttattaaggagcataaattggatgggcaattcagatggatagcagcccaaacaaaccgggcacgtaatggtgagctctatcgctatatagctgacaagagaggtatatttgttcaggtacgctgtttgtattgtatttgtccacattcctttttttgcaccgaaagaaaggttgttattgtgacaaatatgtttgttttagcctgcattttatgaagcatttggactcacggtggttgaagctatgacttgtggtcttccaacatttgcaacttgccatggtggtccgaacgagatcattgaacacggtgtatctgggttccatattgatccttatcatcccgataaagctgctgaactcatggcagaattctttcaacgctgcaaacaagatcctactcactgggaaaaaatatctgcatctggtctccgaaggattcttgagaggtttgtagttgtgtacatatatagaagattaaagattgttcccttgatattatttgaatgaaaaataacagtaacatctctttttgaacatcgctcaagttcttgtgttaaataattgttaggtatacgtggaaaatttactccgagaggctgatgactttgtctggtgtatatggtttctggaagcttgtttcaaaacttgagaggcgcgaaactagacgataccttgagatgttctacattctcaaattccgcgagttggtgagtgcctttttgctcattttcagttacaatcaactatatatgtggtttaaatacgtattaagcataaacatgtccgtgattgcggctgtcgaaaatgctatggacatatcctgagctaaggagttttcaagagaattgatttggcttactctgtttacaggcaaaatctgttcctctggcaattgatgacaagtgaatgtttacatggctgaaactcaatataaaaaacaagggtaggtgatcaaaaatcgttggatgcttaaaatcagtagacgttttgctaaatgagcgaccaatgttattgaaaacgttcatgttttcaacccttttggcatacatttgagcattgcccaagattttggataagtagatgcagtgcttataattttaaagcattgtatcctgcctt gtttttcattgtcaaaattaattaattaacttacaagtatttctataagttgcttcataaattagaagtaaatctggattgtgtaatgtttattcgcctcgtaaatactgaaagctgcttgaacaagtgaaaaaacacagacaaacgtaacattctctccatggattgatgagacttgtaaaatacatatatagaaatttggcttgtaaccacatgtatatta tgccatatggatgtgacattgatgtgactagacctaaatgttttgtttccatgtccactggagttttacgtatagttaagaggagaaaagactgaggaatactaatgtatgatggtacccctttgcttcttgacctggatacccagtgttcctattcatgcctatactttggtccttgatttcactctcccttttctaacttgagctgcatcaaagaa atttccactgtaaaaaaataaataatgctcaccatatctctgcaacattgcaaacatgtatcccatatgattgatattggtgcgacatggcaaacatgtatcctatttgatgatcaatcaaatttatttttcccctgtcaaaatgacctcagtgtgtaattccctatgtatttgatagcattgtaactcgtgtcatgattcatgaataggg tactagaattgcatggttgacaaatattaactggtcgattgatgatccacaaaacatgcacttactgactaaaatgtgatggacagatttatttttgtttgtgattaacacagtacttaaccctatacttaatacaatttggcctagctacaatctttttcttcagtgcaaattccttgttacacgaccaatattgtctttctgagttctattctgttgtt acttacacttttattattcgaataagacattagattgcttgcatgcaaattgatagccacttgtttcaggaagaatactgttggtcagtacgagagccatactgcattcaccctcccaggactatatcgcgtcgttcatggcattgatgttttcgatcccaaattcaatatagtgtctcctggagctgacatgacaatttacttcccatattctgacaaggaaaa aagactaacgtctttgcatggctcgattgagaagttgttatttgatcctgcgcagaatgaagagcatatgtaagtgacatccatttgtacttattttaatttggaatagatgacatacttattgcatgaatataaactgacaacccagagatttcctacattagaaaaggagggtctgatgattttctacaaataaattcccagtgatattgttcaaaa agtcctggatactttattatgagagaaccagggatagatggcactagaatcccttaatcttgagaagtcgccacttatcgctcccaacactttctgagaccctcaagtaactactattattgtttgatatcttggagaagctataagaatctttttctccttattgtaattttttttacgtgactttaaacttaacttccaagctccttctgataaaatgcaaaaactgtctg tattcactgtcttggtttattaacaattgatccaatcaaatgcatatggaacatctttctttttgtttcttcaaaagttcgtttgaggataaggagtagaatctgagaagatagactagtaggtaaccttaggggcggatgtagaaatcaacgtatgggttcagctttgttgcagaccctgtatgcattaaaaaaatcactaaataagtaaataat tgattttgaacccagtaaatcaaaatgagttgtagtagaatcctgaactcgaaccgataaagttggatccactaccgggtaaactctaccttgagaagtgtttatatatgtccctaattatttctttctgtttcctttctattttaattttttaagttcctttttagatggtttttattttttgacaagtggtaagttgttagtattccaaattaaatgccattg ccataactatatacatttataaagattgattgaccctagtttctcattcctaagatccaaataaggcaataaacaatatgtcttagtacttgaacctgcttctggtggtcaacacttgatcgcgtagttagttatagatgactgtaaaaaccttaatcattttaatggttttgtcaaagaacaaatatcggacatattatagcgaatggactattgtacttttcttctga ttggtcattttattgtgatccgtaagttggctgagactgatgtcatatctttgcttacagaggtaatctgaatgataaatcaaaacccataattttttcaatggcaaggctagaccatgttaagaacattacgggactagttgagtgctatgctaaaaatgccacattgagggaattggctaaccttgttgttgtagctggatacaacgatgtaaagaaat ccagtgatagagaagaaaatagcagaaattgagaagatgcatgctctttattaaggagcataaattggatgggcaattcagatggatagcagcccaaacaaaccgggcacgtaatggtgagctctatcgctatatagctgacaagaggtatattgttcaggtacgctgtttgtattgtattgtccacattccttttttgcaccgaaagaaagg ttgtttattgtgacaaatatgtttgttttagcctgcattttatgaagcatttggactcacggtggttgaagctatgacttgtggtcttccaacatttgcaacttgccatggtggtccgaacgagatcattgaacacggtgtatctgggttccatattgatccttatcatcccgataaagctgctgaactcatggcagaattctttcaacgctgcaaaca agatcctactcactgggaaaaatatctgcatctggtctccgaaggattcttgagaggtttgtagttgtgtacatatatagaagattaaagattgttcccttgatattatttgaatgaaaaataacagtaacatctctttttgaacatcgctcaagttcttgtgttaaataattgttaggtatacgtggaaaatttactccgaggctgatgactttg tctggtgtatatggtttctggaagcttgtttcaaaacttgaggcgcgaaactagacgataccttgagatgttctacattctcaaattccgcgagttggtgagtgcctttttgctcattttcagttacaatcaactatatgtggtttaaatacgtattaagcataaacatgtccgtgattgcggctgtcgaaaatgct atggacatatcctgagctaaggagttttcaagagaattgatttggcttactctgtttacaggcaaaatctgttcctctggcaattgatgacaagtga
SEQ ID NO: 12: Полипептидная последовательность NtSUS3-TSEQ ID NO: 12: NtSUS3-T polypeptide sequence
MFTWLKLNIKNKGRKNTVGQYESHTAFTLPGLYRVVHGIDVFDPKFNIVSPGADMTIYFPYSDKEKRLTSLHGSIEKLLFDPAQNEEHIGNLNDKSKPIIFSMARLDHVKNITGLVECYAKNATLRELANLVVVAGYNDVKKSSDREEIAEIEKMHALIKEHKLDGQFRWIAAQTNRARNGELYRYIADKRGIFVQPAFYEAFGLTVVEAMTCGLPTFATCHGGPNEIIEHGVSGFHIDPYHPDKAAELMAEFFQRCKQDPTHWEKISASGLRRILERYTWKIYSERLMTLSGVYGFWKLVSKLERRETRRYLEMFYILKFRELAKSVPLAIDDKMFTWLKLNIKNKGRKNTVGQYESHTAFTLPGLYRVVHGIDVFDPKFNIVSPGADMTIYFPYSDKEKRLTSLHGSIEKLLFDPAQNEEHIGNLNDKSKPIIFSMARLDHVKNITGLVECYAKNATLRELANLVVVAGYNDVKKSSDREEIAEIEKMHALIKEHKLDGQFRWIAAQTNRARNGELYRYIADKRGIFVQ PAFYEAFGLTVVEAMTCGLPTFATCHGGPNEIIEHGVSGFHIDPYHPDKAAELMAEFFQRCKQDPTHWEKISASGLRRILERYTWKIYSERLMTLSGVYGFWKLVSKLERRETRRYLEMFYILKFRELAKSVPLAIDDK
SEQ ID NO: 13: Полинуклеотидная последовательность NtSUS4-S SEQ ID NO: 13: NtSUS4-S polynucleotide sequence
atggcggaacgtgtgctgactcgtgttcatagccttcgtgaacgtcttgatgctactttggctgctcatcgcaatgagattttgctgtttctttcaaggtatagtcttagcagattgttctttgatttagttgttattgccagttctaatgtatgggcttatatataaacaaagtgttgaagtatgcaaccatataaactgacagcttaaaatgcttgagagaacacacttttatttatttaattatgccttcagcacaagaagtggaacttgacgcaatggaaccataggtcacgggttcaagtcttggaacagcctgcaatctaaggctgcgtgtagtagaccctagtggtccggcccttccacatatctcgcttagtgtaccgggcccattgagtacgggttcggccgaacccagtcgctttggtccaatccatatatttgtcttaaaaatatattgaatatatacaaattgttaatttagtttaaatatgtgtatcatgggttattcatgctggttttggctgttgcaggattgaaagccatggaaaagggatactgaaacctcaccagttgctggctgaatttgattcaattcacaaagaagacaaaaacaaactgaatgatcatgcttttgaagaagtcctgaaatccactcaggtatttgtggttttagtgttaggtgatggatagcatttattgttttactaagatcacatatgtgtcagtttgtggctagtatttaaaatctggtgtattttgtcatactaggaagcaattgttttgtccccttgggttgcgcttgccattcgtctgaggcctggtgtgtgggaatacgttcgtgtgaatgtcaacgctcttgttgttgaggagcttaccgtgcctgagtatttgcaattcaaggaagaacttgttaatggaacgtaagttttaggttcgaatttgttgatttgttagataacatgttctgaactttttgattaaagttgtgtttttgactgatgcagctcgcacgataactttgttcttgagttggattttgagcccttcactgcatcatttccaaaaccaaccctcaccaaatcaattggaaatggagttgaattccttaaccgacacctctctgccaaaatgttccatgacaaggaaagcatgacccctcttctcgagtttcttcgagttcaccactacaagggcaaggtaaacttgtttttcctgtttgtctatgaatttagtttagttgttttgctccgcgaaaatttcagtggaaactgatttatgcaaccactgagtgattaatatgttcaaacttaccgacttctggttttctgtgtagacaatgatgctgaatgacagaattcaggacttaaatactctccaaaatgtcctaaggaaagctgaggaatacctcactaccctttcccctgaaacttcatactcggcatttgagcacaagttccaagaaattggcttggagaggggttggggtgacactgcggagcgtgttctagagatgatctgcatgctcctggatctcctcgaggctcctgactcgtgcacgcttgagaagttccttggtagaattccaatggtttttaatgtggtcatactttcaccccatggttatttcgcccaggaaaatgtcttgggttaccccgacactggtggccaggtgcactgcttatctgtgttcggtcttattatctctttaaaccctactgccacaagtgctgagatgaacctcctttaatttgcaggttgtctatattttggatcaagttcctgctttggagcgtgagatgctcaagcgcataaaggagcaaggacttgacatcaaaccgcgtattcttattgttcgtattcccagtaattgtgtttaaacttatgattatgcaggattttatctgttctaatacagcactcttgcttaaattctcaggttactcggctgctgcctgatgcggttggtaccacttgtggtcagaggcttgagaaagtgtttggaacagagcactcacacattcttagggtcccctttaggaccgagaagggcattgttcgcaaatggatctctcgctttgaagtctggccatacatggagacattcactgaggtgaagcaagctttctctattcatttttcaatcttccaattggttttggcagcaattttctgcttgctttgacttccgctaaaacttcggattttattgcattaggatgtggcgaaagaaattgctgcagaattgcaggctaagccagatcttatcattggcaattatagtgagggcaaccttgctgcctccttgttggctcacaaattaggtgtaacacaggtcggcaatgtttgtgacatgtaatttcatctttgcatttcctttcgtttgcaactaaaagatttaagagttctctctctcttttttttttccgtctactttgccttatgcagtgcacgatagctcatgctttggagaaaacaaaatatcctgattctgatatctacttgaagaaatttgatgaaaaataccatttctcagcccagtttactgccgatcttattgcaatgaatcacaccgatttcatcatcaccagcactttccaggagatagcgggaaggtatttttacatcagtttcccactctgattaaattacaatgtatttccctatatgattaaatactgtgtttgatcctaaatcatttctaaattttccagcaaggacactgttggacagtacgagagccacatggcgttcacaatgcctggactgtatagagttgttcacggcattgatgtgtttgaccccaaatttaacattgtgtcaccaggagctgatatgaatctctatttcccatactacgagaaggaaaagagattgacagcatatcaccctgaaattgaggagctgctgtttagtgatgttgagaatgacgaacacatgtatgttactaaactagcaatcctgctgcaaaattatggctaattatgtaaacaagtttgtactgaatagatttgttattcgatcaggtgtgtgctgaagaacaggaataagcctatcatattcactatggctagattggatcgagtgaagaacttaactggacttgtcgagctgtacgccaagaacccacggctaagggagttggttaaccttgtcgtggttggaggagaccgaaggaaagaatccaaagacttggaagaacaggcagagatgaagaagatgtacgaacttataaagactcacaatttgaacggccaattccgatggatttcttcccagatgaaccgcgtgaggaatggcgaactctacaggtacattgccgatactaggggagctttcgtgcagcctgcattttacgaggcttttggtttgactgttgttgaggccatgacctgtggtttgcctacatttgcaactaatcacggtggtccagctgagatcatcgttcacgggaaatctggtttccacattgatccataccacggggatcaggcagctgaacttctcgctgatttctttgagaaatgtaagaaagaaccttcgcactgggaagccatttccgagggcggccttaagcgtatacaggagaagtaagcaaactgctactcttttcatttttgcaaaacctactatgatcattattaagctcatttttgcaaaacctacttgctgttgttattgtttgttgcttccttttcactgttctttgagctgaaggtctatcagaaacagtctctctaccttcacaaggtaggggtaagatctgcgtgcacgttaccctcctcaaactctacttaattgtgagattacactaggtttgttgttgttgattctttgctaattaattaaaaggtacacatggcaaatatactcggatcggttgttgacactggctgctgtatatggattctggaagcatgtttccaagcttgatcgtcttgaaattcgccgttatcttgaaatgttctatgctctcaaattccgcaagctggtgagtttcattgctttctgcactcctgcaattgtatagatggcggaacgtgtgctgactcgtgttcatagccttcgtgaacgtcttgatgctactttggctgctcatcgcaatgagattttgctgtttctttcaaggtatagtcttagcagattgttctttgatttagttgttattgccagttctaatgtatgggcttatatataaacaaagtgttgaagtatgcaaccatataaactgacagctta aaatgcttgagagaacacacttttatttatttaattatgccttcagcacaagaagtggaacttgacgcaatggaaccataggtcacgggttcaagtcttggaacagcctgcaatctaaggctgcgtgtagtagaccctagtggtccggcccttccacatatctcgcttagtgtaccgggcccattgagtacgggttcggccgaacccagtcgct ttggtccaatccatatatttgtcttaaaaatatattgaatatatacaaattgttaatttagtttaaatatgtgtatcatggggttattcatgctggttttggctgttgcaggattgaaagccatggaaaagggatactgaaacctcaccagttgctggctgaatttgattcaattcacaaagaagacaaaaacaaactgaatgatcatgcttttgaagaag tcctgaaatccactcaggtatttgtggttttagtgttaggtgatggatagcatttattgttttactaagatcacatatgtgtcagtttgtggctagtatttaaaatctggtgtattttgtcatactaggaagcaattgttttgtccccttgggttgcgcttgccattcgtctgaggcctggtgtgtgggaatacgttcgtg tgaatgtcaacgctcttgttgttgaggagcttaccgtgcctgagtatttgcaattcaaggaagaacttgttaatggaacgtaagttttaggttcgaatttgttgatttgttagataacatgttctgaactttttgattaaagttgtgtttttgactgatgcagctcgcacgataactttgttcttgagttggattttgagcccttcact gcatcatttccaaaaccaaccctcaccaaatcaattggaaatggagttgaattccttaaccgacacctctgccaaaatgttccatgacaaggaaagcatgacccctcttctcgagtttcttcgagttcaccactacaagggcaaggtaaacttgttttcctgtttgtctatgaatttagtttagttgttttgctccgcgaaaatttcag tggaaactgatttatgcaaccactgagtgattaatatgttcaaacttaccgacttctggttttctgtgtagacaatgatgctgaatgacagaattcaggacttaaatactctccaaaatgtcctaaggaaagctgaggaatacctcactaccctttcccctgaaacttcatactcggcatttgagcacaagttccaagaaattggcttggagaggggttggggtg acactgcggagcgtgttctagagatgatctgcatgctcctggatctcctcgaggctcctgactcgtgcacgcttgagaagttccttggtagaattccaatggtttttaatgtggtcatactttcaccccatggttatttcgcccaggaaaatgtcttgggttaccccgacactggtggccaggtgcactgcttatctgtgttcggtct tattatctctttaaaccctactgccacaagtgctgagatgaacctcctttaatttgcaggttgtctatattttggatcaagttcctgctttggagcgtgagatgctcaagcgcataaaggagcaaggacttgacatcaaaccgcgtattcttattgttcgtattcccagtaattgtgtttaaacttatgattatgcaggattttatctgtt ctaatacagcactcttgcttaaattctcaggttactcggctgctgcctgatgcggttggtaccacttgtggtcagaggcttgagaaagtgtttggaacagagcactcacacattcttagggtcccctttaggaccgagaagggcattgttcgcaaatggatctctcgctttgaagtctggccatacatggagacattcactgaggtgaagcaagctttctct attcatttttcaatcttccaattggttttggcagcaattttctgcttgctttgacttccgctaaaacttcggattttattgcattaggatgtggcgaaagaaattgctgcagaattgcaggctaagccagatcttatcattggcaattatagtgagggcaaccttgctgcctccttgttgctcacaaattaggtgtaacacaggtcggcaatg tttgtgacatgtaatttcatctttgcatttcctttcgtttgcaactaaaagatttaagagttctctctctctttttttttccgtctactttgccttatgcagtgcacgatagctcatgctttggagaaaacaaaatatcctgattctgatatctacttgaagaaatttgatgaaaaataccatttctcagcccagtttactgccgatcttattgca atgaatcacaccgatttcatcatcaccagcactttccaggagatagcgggaaggtatttttacatcagtttcccactctgattaaattacaatgtatttccctatatgattaaatactgtgtttgatcctaaatcatttctaaattttccagcaaggacactgttggacagtacgagagccacatggcgttcacaatgcctggactgtatagagttgttcacggcattgatg tgtttgaccccaaatttaacattgtgtcaccaggagctgatatgaatctctatttttcccatactacgagaaggaaaagagattgacagcatatcaccctgaaattgaggagctgctgtttagtgatgttgagaatgacgaacacatgtatgttactaaactagcaatcctgctgcaaaattatggctaattatgtaaacaagtttgtactgaatagattt gttattcgatcaggtgtgtgctgaagaacaggaataagcctatcatattcactatggctagattggatcgagtgaagaacttaactggacttgtcgagctgtacgccaagaaccccggctaagggagttggttaaccttgtcgtggttgggaggagaccgaaggaaagaatccaaagacttggaagaacaggcagagatgaagaagaagatgtacgaacttataa agactcacaatttgaacggccaattccgatggatttcttcccagatgaaccgcgtgaggaatggcgaactctacaggtacattgccgatactaggggagctttcgtgcagcctgcattttacgaggcttttggtttgactgttgttgaggccatgacctgtggtttgcctacatttgcaactaatcacggtggtccagctgagatcatcgttc acgggaaatctggtttccacattgatccataccacggggatcaggcagctgaacttctcgctgatttctttgagaaatgtaagaaagaaccttcgcactgggaagccatttccgagggcggccttaagcgtatacaggagaagtaagcaaactgctactcttttcatttttgcaaaacctactatgatcattattaagctcatttttgcaaaacctacttgctgttg ttattgtttgttgcttccttttcactgttctttgagctgaaggtctatcagaaacagtctctctaccttcacaaggtaggggtaagatctgcgtgcacgttaccctcctcaaactctacttaattgtgagattacactaggttgttgttgttgattctttgctaattaattaattaaaaggtacacatggcaaatatactcggatcggttgttgac actggctgctgtatggattctggaagcatgtttccaagcttgaatcgtcttgaaattcgccgttatcttgaaatgttctatgctctcaaattccgcaagctggtgagtttcattgctttctgcactcctgcaattgtatag
SEQ ID NO: 14: Полипептидная последовательность NtSUS4-SSEQ ID NO: 14: NtSUS4-S polypeptide sequence
MAERVLTRVHSLRERLDATLAAHRNEILLFLSRIESHGKGILKPHQLLAEFDSIHKEDKNKLNDHAFEEVLKSTQEAIVLSPWVALAIRLRPGVWEYVRVNVNALVVEELTVPEYLQFKEELVNGTSHDNFVLELDFEPFTASFPKPTLTKSIGNGVEFLNRHLSAKMFHDKESMTPLLEFLRVHHYKGKTMMLNDRIQDLNTLQNVLRKAEEYLTTLSPETSYSAFEHKFQEIGLERGWGDTAERVLEMICMLLDLLEAPDSCTLEKFLGRIPMVFNVVILSPHGYFAQENVLGYPDTGGQVVYILDQVPALEREMLKRIKEQGLDIKPRILIVTRLLPDAVGTTCGQRLEKVFGTEHSHILRVPFRTEKGIVRKWISRFEVWPYMETFTEDVAKEIAAELQAKPDLIIGNYSEGNLAASLLAHKLGVTQCTIAHALEKTKYPDSDIYLKKFDEKYHFSAQFTADLIAMNHTDFIITSTFQEIAGSKDTVGQYESHMAFTMPGLYRVVHGIDVFDPKFNIVSPGADMNLYFPYYEKEKRLTAYHPEIEELLFSDVENDEHMCVLKNRNKPIIFTMARLDRVKNLTGLVELYAKNPRLRELVNLVVVGGDRRKESKDLEEQAEMKKMYELIKTHNLNGQFRWISSQMNRVRNGELYRYIADTRGAFVQPAFYEAFGLTVVEAMTCGLPTFATNHGGPAEIIVHGKSGFHIDPYHGDQAAELLADFFEKCKKEPSHWEAISEGGLKRIQEKYTWQIYSDRLLTLAAVYGFWKHVSKLDRLEIRRYLEMFYALKFRKLVSFIAFCTPAIV MAERVLTRVHSLRERLDATLAAHRNEILLFLSRIESHGKGILKPHQLLAEFDSIHKEDKNKLNDHAFEEVLKSTQEAIVLSPWVALAIRLRPGVWEYVRVNVNALVVEELTVPEYLQFKEELVNGTSHDNFVLELDFEPFTASFPKPTLTKSIGNGVEFLNRHLSAKMFHDKESMTPLLEFLRVHHYKGKTMMLNDRIQDLNTLQ NVLRKAEEYLTTLSPETSYSAFEHKFQEIGLERGWGDTAERVLEMICMLLDLLEAPDSCTLEKFLGRIPMVFNVVILSPHGYFAQENVLGYPDTGGQVVYILDQVPALEREMLKRIKEQGLDIKPRILIVTRLLPDAVGTTCGQRLEKVFGTEHSHILRVPFRTEKGIVRKWISRFEVWPYMETFTEDVAKEIAAELQAKPDLIIG NYSEGNLAASLLAHKLGVTQCTIAHALEKTKYPDSDIYLKKFDEKYHFSAQFTADLIAMNHTDFIITSTFQEIAGSKDTVGQYESHMAFTMPGLYRVVHGIDVFDPKFNIVSPGADMNLYFPYYEKEKRLTAYHPEIEELLFSDVENDEHMCVLKNRNKPIIFTMARLDRVKNLTGLVELYAKNPRLRELVNLVVVGDR RKESKDLEEQAEMKKMYELIKTHNLNGQFRWISSQMNRVRNGELYRYIADTRGAFVQPAFYEAFGLTVVEAMTCGLPTFATNHGGPAEIIVHGKSGFHIDPYHGDQAAELLADFFEKCKKEPSHWEAISEGGLKRIQEKYTWQIYSDRLLTLAAVYGFWKHVSKLDRLEIRRYLEMFYALKFRKLVSFIAFCTPAIV
SEQ ID NO: 15: Полинуклеотидная последовательность NtSUS4-T SEQ ID NO: 15: NtSUS4-T polynucleotide sequence
atggccgaacgtgtgctaactcgtgttcacagccttcgcgaacgtcttgatgctactttggctgctcatcgcaatgagattttgctgtttctttcaaggtatagtcttagcagattgttctttgatttagttggtgttatttgccagttctaatgtatggactaatatatgaacaaagtgcgaccatttcaactgacaacttaaaatgtttgagagaatacacgtttatttacttaattatggcttgagcataggaagtgtatcttggcgtaactcgtaaagttgacctcatgtgacaaggaggtcacggtttcgagccgtggaaacagcctcttgcagaaatgcaggtaaggctgcgtgcaatagatcgcccttccacggacccgcgcatagcgggaacttagtgcaccggttgggctgtccttttttatgtcttcagcacaaaaatttagtttaaacatgtgtatcatggattattcatgctggttttgccggttgcaggattgaaagccacggaaaagggatattgaaacctcaccagttgctggctgagtttgaatcaattcacaaagaagacaaaaacaaactgaatgatcatgcttttgaagaagtcctgaaatctactcaggtaatttgtggttttagtgttaggtgatggatagcatttattgtcttactaagatcatatatgtgtcagtttgtggctagtatttgaaaagtctggtgtggtttgtcatactaggaagcaattgtcttgtccccttgggttgcgcttgccattcgtctgcggcctggtgtgtgggaatatgttcgtgtgaatgtcaatgcacttattgtcgaggagctgactgtgcctgaatatttgcaattcaaggaagaacttgttaatggaacgtaagttttaggttcgaaatgatgatttgttaaataatatgttctgaactttttgattaatgttgtgttttcccctgatgcagctcgaacgataactttgttcttgagctggattttgagcccttcactgcatcatttcccaaaccaaccctcaccaaatcaattggaaatggagttgaattcctcaaccgacacctctctgccaaaatgttccatgacaaggaaagcatgacccctcttctcgagtttcttcgagttcatcactacaagggcaaggtaaacttgtttttcctgtttgtctatgaatttagtttctgaaagttgctttgcttcgtgaattttttagtggcaactgatttatgattttctgtgcagacaatgatgctgaatgacagagttcaggacttaaacactctccaaaatgtcctaaggaaggctgaggaatatctcactaccctttcccctgaaacttcatactcggtatttgagcacaagttccaagaaattggcctagagaggggctggggtgacaatgctgagcgtgttctagagatgatctgcatgctcctggatctcctcgaggctccagactcatgcactcttgagaagttccttggtagaattcctatggtttttaatgtggtcattctttcacctcacggatatttcgcccaggaaaatgtcttgggttaccccgatactggtggccaggtgcactgcttatttgtaacaccttacgcttttccctctgaaacttatttgcggcaagttctaaggtcctccttccttaatttgcaggttgtctatattttggatcaagttccggccttggagcgtgagatgctcaagcgcataaaggagcaaggacttgatatcaaaccgcgtattcttattgttcgtatctccaataattgcgtttaaacttatgattgtgcaggatttgatctgttcaaatctaatgactgattttcttttttttttttttttccctcaggttactcggctgctgcctgatgcggttggtaccacttgtggtcagcggcttgagaaagtgtttggaacagagcattcacatattcttagggtcccctttaggaccgagaagggcatcgttcgcaaatggatctctcgctttgaagtctggccttacatggagacattcactgaggtgaagcaagctttctctattcatttttcaatcttccaatctgttttggcagcaatttttcacttactaacactttggctttcgctaaaacttcggattttattacattaggatgtggcaaaagaaattgctgcagaactgcaggcaaagccagatcttataatcggcaactacagcgagggcaaccttgctgcctccttgttggctcacaagttaggtgtaactcaggtctgtaatgtttgtcacctgttatttcaactttgcatttcctttcatttgcaactagaagttaagagttctctctcttttatcttttccgtctattttgccttctgcagtgcaccatagctcatgcgttggagaaaacaaaatatcctgattctgatatctacttgaagaaatttgatgaaaaataccatttctcagcccagtttactgccgatcttattgcaatgaatcacaccgatttcataatcaccagcactttccaggagatagcgggaaggtattacatcacaatggatttccgatatgattaaattagttaatttaatcctacttcattgtgtttgatcctaaaacttttctaaatttcccagcaaggacactgttggacagtacgagagccacatggctttcacgatgcctggattgtatagagttgttcacggcattgatgtgttcgatcccaaattcaacattgtgtcaccaggagctgatatgaatctctatttcccctacttcgagaaggaaaagcgattgacagcatatcaccctgaaattgaggagctgctgtttagcgatgttgagaatgacgaacacatgtatgttactaaactagcaatcctgctgcaaaattgtggctaattatgtaaaaaagtttttactgaatagatttgtgcttctatcaggtgtgtgctgaaggacaggaataagccaattatattcaccatggctagattggatcgagtgaagaacttaactggacttgtggagttgtacgccaagaacccacggctaagggagttggttaaccttgtcgtggttggtggagaccgaaggaaggaatccaaagatttggaagaacaggcagagatgaagaagatgtatgaacttataaagacgcacaatttaaacggccaattccgatggatttcttcccagatgaaccgcgtgaggaatggcgaactctacaggtacattgccgatactaggggagcttttgtgcagcctgcattttacgaggcttttggtttgactgttgttgaggccatgacctgtggtttgcctacgtttgcaactaatcacggtggtccagctgagatcatcgttcacgggaagtctggttttcacattgatccataccacggcgagcaggcagctgaacttctagctgatttctttgagagatgtaagaaagaaccttcacactgggaagccatttccgagggcggccttaagcgtatacaggagaagtaagcaagctgctactcttttcatttttgcaaaacctaccatgatcattattaagctcatttttgcaaaacctacttgttattctttgttgcttccttttccctgttttttgagccgaggttttatcgaaaacatgctttctaccttcacaaggtaggggtaaggtctgcgtttgttattattgttgttgttgattctctgcgaattaattaaaaggtacacatggcaaatctactcggatcggttgttgacactggctgctgtttatggattctggaagcatgtttccaaacttgatcgtcttgaaattcgtcgttatcttgaaatgttctatgctctaaaattccgcaaactggtgagtttcactgctttctgcactcttccaattgttagttgagtgcactcatttaaactgtagctaaagctgttgtaaatcttcagttaagcagctgctaatgaagtttttatcttttgtttttggttcaggctgaagctgtcccgttggctgttgagtaaatggccgaacgtgtgctaactcgtgttcacagccttcgcgaacgtcttgatgctactttggctgctcatcgcaatgagattttgctgtttctttcaaggtatagtcttagcagattgttctttgatttagttggtgttatttgccagttctaatgtatggactaatatatgaacaaagtgcgaccatttcaactgacaacttaaaatgt ttgagagaatacacgtttatttacttaattatggcttgagcataggaagtgtatcttggcgtaactcgtaaagttgacctcatgtgacaaggaggtcacggtttcgagccgtggaaacagcctcttgcagaaatgcaggtaaggctgcgtgcaatagatcgcccttccacggacccgcgcatagcgggaacttagtgcaccggttgggg ctgtcctttttttgtcttcagcacaaaaatttagtttaaacatgtgtatcatggattattcatgctggttttgccggttgcaggattgaaagccacggaaaagggatattgaaacctcaccagttgctggctgagtttgaatcaattcacaaagaagacaaaaacaaactgaatgatcatgcttttgaagaagtcctgaaatctactactcaggtaattt gtggttttagtgttaggtgatggatagcatttattgtcttactaagatcatatatgtgtcagtttgtggctagtatttgaaaagtctggtgtggtttgtcatactaggaagcaattgtcttgtccccttgggttgcgcttgccattcgtctgcggcctggtgtgtgggaatatgttcgtgtgaatgtcaat gcacttattgtcgaggagctgactgtgcctgaatatttgcaattcaaggaagaacttgttaatggaacgtaagttttaggttcgaaatgatgatttgttaaataatatgttctgaactttttgattaatgttgtgttttcccctgatgcagctcgaacgataactttgtttgagctggattttgagcccttcactgcatcatttcccaaac caaccctcaccaaatcaattggaaatggagttgaattcctcaaccgacacctctctgccaaaatgttccatgacaaggaaagcatgacccctcttctcgagtttcttcgagttcatcactacaagggcaaggtaaacttgtttttcctgtttgtctatgaatttagtttctgaaagttgctttgcttcgtgaattttttagtggcaactga tttatgattttctgtgcagacaatgatgctgaatgacagagttcaggacttaaacactctccaaaatgtcctaaggaaggctgaggaatatctcactaccctttcccctgaaacttcatactcggtatttgagcacaagttccaagaaattggcctagagaggggctggggtgacaatgctgagcgtgttctagagatgatctgcatgctcctggatctcct cgaggctccagactcatgcactcttgagaagttccttggtagaattcctatggtttttaatgtggtcattctttcacctcacggatatttcgcccaggaaaatgtcttgggttaccccgatactggtggccaggtgcactgcttattgtaacaccttacgcttttccctctgaaacttattgcggcaagttctaaggtcctccttcctta atttgcaggttgtctatattttggatcaagttccggccttggagcgtgagatgctcaagcgcataaaggagcaaggacttgatatcaaaccgcgtattcttattgttcgtatctccaataattgcgtttaaacttatgattgtgcaggatttgatctgttcaaatctaatgactgattttctttttttttttttccctcaggttactcgg ctgctgcctgatgcggttggtaccacttgtggtcagcggcttgagaaagtgtttggaacagagcattcacatattcttagggtcccctttaggaccgagaagggcatcgttcgcaaatggatctctcgctttgaagtctggccttacatggagacattcactgaggtgaagcaagctttctctattcatttttcaatcttccaatctgttttggcagcaat ttttcacttactaacactttggctttcgctaaaacttcggattttattacattaggatgtggcaaaagaaattgctgcagaactgcaggcaaagccagatcttataatcggcaactacagcgagggcaaccttgctgcctccttgttggctcacaagttaggtgtaactcaggtctgtaatgtttgtcacctgttatttcaactttgcatttccttt catttgcaactagaagttaagagttctctctcttttatcttttccgtctattttgccttctgcagtgcaccatagctcatgcgttggagaaaacaaaatatcctgattctgatatctacttgaagaaatttgatgaaaaataccatttctcagcccagtttactgccgatcttattgcaatgaatcacaccgatttcataatcaccagcactttccaggagatag cgggaaggtattacatcacaatggatttccgatatgattaaattagttaatttaatcctacttcattgtgtttgatcctaaaacttttctaaatttcccagcaaggacactgttggacagtacgagccacatggctttcacgatgcctggattgtatagagttgttcacggcattgatgtgttcgatcccaaattcaacattgtgtcacca ggagctgatatgaatctctatttcccctacttcgagaaggacagcatatcaccctgaaattgaggagctgctgtttagcgatgttgagaatgacgaacacatgtatgttactaaactagcaatcctgctgcaaaattgtggctaattatgtaaaaaagttttactgaatagatttgtgcttctatcaggtgtgtg ctgaaggacaggaataagccaattatattcaccatggctagattggatcgagtgaagaacttaactggacttgtggagttgtacgccaagaaccccggctaagggagttggttaaccttgtcgtggttggtggagaccgaaggaaggaatccaaagatttggaagaacaggcagagatgaagaagaagaatgtatgaacttaaaagacgcacaatttaaacggccaattccgat ggatttcttcccagatgaaccgcgtgaggaatggcgaactctacaggtacattgccgatactaggggagcttttgtgcagcctgcattttacgaggcttttggtttgactgttgttgaggccatgacctgtggtttgcctacgtttgcaactaatcacggtggtccagctgagatcatcgttcacgggaagtctggttttcacattga tccataccacggcgagcaggcagctgaacttctagctgatttctttgagagatgtaagaaagaaccttcacactgggaagccatttccgagggcggccttaagcgtatacaggagaagtaagcaagctgctactcttttcatttttgcaaaacctaccatgatcattattaagctcatttttgcaaaacctacttgttattctttgttgcttccttttccctgtttt ttgagccgaggttttatcgaaaacatgctttctaccttcacaaggtaggggtaaggtctgcgtttgttattattgttgttgttgattctgcgaattaattaattaaaaggtacacatggcaaatctactcggatcggttgttgacactggctgctgtttatggattctggaagcatgtttccaaacttgatcgtcttgaaattcgtcgttat cttgaaatgttctatgctctaaaattccgcaaactggtgagtttcactgctttctgcactcttccaattgttagttgagtgcactcatttaaactgtagctaaagctgttgtaaatcttcagttaagcagctgctaatgaagtttttatcttttgttttggttcaggctgaagctgtcccgttggctgttgagtaa
SEQ ID NO: 16: Полипептидная последовательность NtSUS4-TSEQ ID NO: 16: NtSUS4-T polypeptide sequence
MAERVLTRVHSLRERLDATLAAHRNEILLFLSRIESHGKGILKPHQLLAEFESIHKEDKNKLNDHAFEEVLKSTQEAIVLSPWVALAIRLRPGVWEYVRVNVNALIVEELTVPEYLQFKEELVNGTSNDNFVLELDFEPFTASFPKPTLTKSIGNGVEFLNRHLSAKMFHDKESMTPLLEFLRVHHYKGKTMMLNDRVQDLNTLQNVLRKAEEYLTTLSPETSYSVFEHKFQEIGLERGWGDNAERVLEMICMLLDLLEAPDSCTLEKFLGRIPMVFNVVILSPHGYFAQENVLGYPDTGGQVVYILDQVPALEREMLKRIKEQGLDIKPRILIVTRLLPDAVGTTCGQRLEKVFGTEHSHILRVPFRTEKGIVRKWISRFEVWPYMETFTEDVAKEIAAELQAKPDLIIGNYSEGNLAASLLAHKLGVTQCTIAHALEKTKYPDSDIYLKKFDEKYHFSAQFTADLIAMNHTDFIITSTFQEIAGSKDTVGQYESHMAFTMPGLYRVVHGIDVFDPKFNIVSPGADMNLYFPYFEKEKRLTAYHPEIEELLFSDVENDEHMCVLKDRNKPIIFTMARLDRVKNLTGLVELYAKNPRLRELVNLVVVGGDRRKESKDLEEQAEMKKMYELIKTHNLNGQFRWISSQMNRVRNGELYRYIADTRGAFVQPAFYEAFGLTVVEAMTCGLPTFATNHGGPAEIIVHGKSGFHIDPYHGEQAAELLADFFERCKKEPSHWEAISEGGLKRIQEKYTWQIYSDRLLTLAAVYGFWKHVSKLDRLEIRRYLEMFYALKFRKLAEAVPLAVEMAERVLTRVHSLRERLDATLAAHRNEILLFLSRIESHGKGILKPHQLLAEFESIHKEDKNKLNDHAFEEVLKSTQEAIVLSPWVALAIRLRPGVWEYVRVNVNALIVEELTVPEYLQFKEELVNGTSNDNFVLELDFEPFTASFPKPTLTKSIGNGVEFLNRHLSAKMFHDKESMTPLLEFLRVHHYKGKTMMLNDRVQDLNTLQ NVLRKAEEYLTTLSPETSYSVFEHKFQEIGLERGWGDNAERVLEMICMLLDLLEAPDSCTLEKFLGRIPMVFNVVILSPHGYFAQENVLGYPDTGGQVVYILDQVPALEREMLKRIKEQGLDIKPRILIVTRLLPDAVGTTCGQRLEKVFGTEHSHILRVPFRTEKGIVRKWISRFEVWPYMETFTEDVAKEIAAELQAKPDLI IGNYSEGNLAASLLAHKLGVTQCTIAHALEKTKYPDSDIYLKKFDEKYHFSAQFTADLIAMNHTDFIITSTFQEIAGSKDTVGQYESHMAFTMPGLYRVVHGIDVFDPKFNIVSPGADMNLYFPYFEKEKRLTAYHPEIEELLFSDVENDEHMCVLKDRNKPIIFTMARLDRVKNLTGLVELYAKNPRLRELVNLVVGG DRRKESKDLEEQAEMKKMYELIKTHNLNGQFRWISSQMNRVRNGELYRYIADTRGAFVQPAFYEAFGLTVVEAMTCGLPTFATNHGGPEIIVHGKSGFHIDPYHGEQAAELLADFFERCKKEPSHWEAISEGGLKRIQEKYTWQIYSDRLLTLAAVYGFWKHVSKLDRLEIRRYLEMFYALKFRKLAEAVPLAVE
SEQ ID NO: 17: Полинуклеотидная последовательность NtSUS5-S SEQ ID NO: 17: Polynucleotide sequence of NtSUS5-S
atggcctcaacagttgctgatagcatgcctgatgctttgaaacaaagccggtatcatatgaagagatgcttcgctaggtgaacacccttcttttatgttttttcccctctacgtgtttatgtcaaatttccatgcataatgctaactacttttcttctttttgacttcaaaattggatgtgaaaggttcattgcaatgggaaggaggctaatgaagttgaaacatttaacagaagaaatagaagaaactattgaagacaaggcagaaagaaccaggattttggagggttcacttggaaaaattatgagttccacacaggtcagcaccatttaaccaacttagttgaacaggaaaaaaagaaaaagcaaaagagttattgcaaggcgtaacgattttctttgaaattttcaggaggcagctgttgttccaccttatgttgcttttgcagtaaggcacaatcctggcttctgggattatgtcaaagttaacgctgaaactctctctgtggaagctatttcagccagggaatatctcaaattcaaagagatgatctttgacgaagactggtaagtggaaaattgtatcattttaaagagaaacaattttgtaacatacaagaatagttttgatggttgaatgtgcaagcagggcaaaggatgataatgcactggaagtagattttggtgcttttgactactctaatcctcggttagccctttcctcttctgtcggaaatgggctcaactttatctcaaaagttctgtcttcaaagtttggtggaaagccagaggacgcccagcctttgcttgattacttactagctcttaatcatcaaggagaggtatgaaaatggactacctttgtttcttaaaggtattatataatgatgcgcgttataaagttcctttttaaattgaaactttgcagaatctaatgatcaatgagaatctgaatggtgttgctaagcttcaagcagcattgatagtagctgaagtttttgtatcttcctttcccaaagacacaccttataaagactttgagcataagtaagcttctcatatgcttccattgtcatatgcagtataccaatgacatgctaccgaaaagttgtttatgtttgtgacttgattatgaaaactctaggctcaaagaatggggctttgataaagggtggggtcacaatgcaggaagagtaagagagacaatgagactgctttccgagataatccaagcaccagatcccataaatatggagtcctttttcagcaagcttcctactacattcaacattgttatcttctccattcatggttactttggccaagcagatgtccttggtctgcccgatactggaggccaggtctacatatacagcaatttatctccttttgcctcatattgcttattagcgacacttgcatcattgaaatcagacttttacttcacaggttgtttatattctggatcaagtaagggctttagaggaggaaatgttacaaagaatcaagcagcaagggctaaacgtgaagcccaagattcttgtggtgagttttgcaaaaatatgcttagacaggttttgagattgatcggagaagggattaagatgatcaagatctttgtttcctgctttcatgatgtaaacaggtatctcgtctcataccagatgctcgagggacaacatgcaatcaggagatggaacctattcttaactcatcccattctcacatcctgagaattccattcaggactgagaaaggagttcttcgccaatgggtttctcggtttgatatctatccttacttggagaactatgccaaggcaagtcttctaacaaaattaccacctattcatacactttatttactttcttgaactaatcgtttggtttgtgacgtatatcattaggatgcttctgctaagatacttgagctcatggaaggtaaaccagacctcataattgggaactacactgatggaaatttagtggcatctctattggccaacaaacttggagttactcaggttccgtagctgatcatatgatcatattttctacattgtttcttgataattaaatggaaatcttattggatgataacattttagggaaccattgctcatgcattagagaaaactaagtatgaagattctgatgtgaagtggaagcagtttgatcccaagtaccacttttcttgccaatttactgccgatttattggcaatgaatgctgctgattttatcattaccagcacatatcaagaaatcgctggaaggttagcactgactctctcagtatatttggcaacttaatgaatttactgcagtggccaacactaaaagctatcattcgtccttcagcgaaactaggcctggacaatatgaaagtcacacagcatttaccatgccggggctttatagagctgtttcaggcatcaatgtatttgatccaaagttcaacattgctgctcctggggctgaacagtctacctatttccctttcactgagaaacagaaacgattcagcacatttcgtcctgctattaacgaattactttacagtaatgaggaaaacaatgagcacatgtaagtctaattgcccattttcctaatctaaccattgcttaaatcgttctgtttttaccggatgtgtggtacttatcagtaacatttttttttggatcagtggatttcttgcagaccggaaaaaaccaattatattttcaatggcgagatttgatacagtgaagaacctgtcaggcttgactgagtggtatgggaagaataagaagttgcggaacttggtaaaccttgttattgttgggggattcttcgatccatcaaaatcaaaagaccgggaggaagcagctgaaatcaagaagatgcatgaattgattgagaaataccagctcaagggacaaatgagatggatagcagctcaaactgataaatatcgaaatagtgagctataccgaactattgctgacactaagggagcttttgtccaaccggctttatatgaagcttttggactaaccgttattgaagcaatggattgtggattgcctacgtttgcaactaatcaaggtggacctgcagaaatcattgttgatggggtttcaggtttccatattgatccttacaatggggacgaatcaagcaagaaaatagctgatttctttgagaagtgtaaggttgattctaaatattggaacaggatatctgagggaggtctcaagcgcattgaagaatggtaacaaactagttccaagtttaaaaaatggaaaaaatgcttatcatgttatattttcgtggttttaagttctgcttcgatgcagttatacgtggaagatttatgcaaacaaagtgttgaatatgggatcaatctatggattttggagacaattcaatgtggggcaaaagcaggctaagcaaagatactttgagatgttttacaatcctctcttcaggaaattggtaggttgtatatgttgaatacaatttactaagatcctcaaaatgaccaagaaatatacattgactatgctacttttgtaatttcacaggccaaaagcgtgccgatcccacatgaagagccattgccacttgcaacatcagactctactcaatcccaagaattaaaactaccactaccagttccagcagcagtagctaaagttctgccattaacaaggcatgcttttaacttaattacttctctacctagagtaactggtaaagtggatgtcaagtgaatggcctcaacagttgctgatagcatgcctgatgctttgaaacaaagccggtatcatatgaagagatgcttcgctaggtgaacacccttcttttgttttttcccctctacgtgtttatgtcaaatttccatgcataatgctaactacttttcttctttttgacttcaaaattggatgtgaaaaggttcattgcaatgggaaggaggc taatgaagttgaaacatttaacagaagaaatagaagaaactattgaagacaaggcagaaagaaccaggattttggagggttcacttggaaaaaattatgagttccacacaggtcagcaccatttaaccaacttagttgaacaggaaaaaagaaaaagcaaaagagttattgcaaggcgtaacgattttctttgaaattttcaggaggcagctgttgttccacc ttatgttgcttttgcagtaaggcacaatcctggcttctgggattatgtcaaagttaacgctgaaactctctctgtggaagctatttcagccagggaatattctcaaattcaaagagatgatctttgacgaagactggtaagtggaaaattgtatcattttaaagagaaacaattttgtaacatacaagaatagttttgatggttgaatgtgcaag cagggcaaaggatgataatgcactggaagtagattttggtgcttttgactactactctaatcctcggttagccctttcctcttctgtcggaaatgggctcaactttatctcaaaagttctgtcttcaaagtttggtggaaagccagaggacgcccagcctttgcttgattacttactagctcttaatcatcaaggagaggtatgaaaatggactacct ttgtttcttaaaggtattatataatgatgcgcgtttaaagttcctttttaaattgaaactttgcagaatctaatgatcaatgagaatctgaatggtgttgctaagcttcaagcagcattgatagtagctgaagtttttgtatcttcctttcccaaagacacaccttataaagactttgagcataagtaagcttctcatatgcttccattgtcatatgca gtataccaatgacatgctaccgaaaagttgtttgtttgtgacttgattatgaaaactctaggctcaaagaatggggctttgataaagggtggggtcacaatgcaggaagagtaagagagacaatgagactgctttccgagataatccaagcaccagatcccataaatatggagtcctttttcagcaagcttcctactacattcaacattgttatcttct ccattcatggttactttggccaagcagatgtccttggtctgcccgatactggaggccaggtctacatatacagcaatttatctccttttgcctcatattgcttattagcgacacttgcatcattgaaatcagacttttacttcacaggttgtttattctggatcaagtaagggctttgaggaggaaatgttacaaagaatcaagcagcaagggctaaacgtgaag cccaagattcttgtggtgagttttgcaaaaatatgcttagacaggttttgagattgatcggagaagggattaagatgatcaagatctttgtttcctgctttcatgatgtaaacaggtatctcgtctcataccagatgctcgagggacaacatgcaatcaggagatggaacctattcttaactcatcccattctcacatcctgagaattccattcaggactgaga aaggagttcttcgccaatgggtttctcggtttgatatctatccttacttggagaactatgccaaggcaagtcttctaacaaaattaccacctattcatacactttatttactttcttgaactaatcgttggttgtgacgtatatcattaggatgcttctgctaagatacttgagctcatggaaggtaaaccagacctcataattgggaactacactgat ggaaatttagtggcatctctattggccaacaaacttggagttactcaggttccgtagctgatcatatgatcatattttctacattgtttcttgataattaattaaatggaaatcttattggatgataacattttagggaaccattgctcatgcattagagaaaactaagtaagtatgaagattctgatgtgaagtggaagcagtttgatcccaagtaccacttttcttgccaattt actgccgatttattggcaatgaatgctgctgattttatcattaccagcacatatcaagaaatcgctggaaggttagcactgactctctcagtatatttggcaacttaatgaatttactgcagtggccaacactaaaagctatcattcgtccttcagcgaaactaggcctggacaatatgaaagtcacacagcatttaccatgccggggctttatagagctgtttca ggcatcaatgtatttgatccaaagttcaacattgctgctcctggggctgaacagtctacctatttccctttcactgagaaacagaaacgattcagcacatttcgtcctgctattaacgaattactttacagtaatgaggaaaacaatgagcacatgtaagtctaattgcccattttcctaatctaaccattgcttaaatcgttctgtttttaccggatgt gtggtacttatcagtaacatttttttttggatcagtggatttcttgcagaccggaaaaaaccaattatattttcaatggcgagatttgatacagtgaagaacctgtcaggcttgactgagtggtatgggaagaataagaagttgcggaacttggtaaaccttgttattgttgggggattcttcgatccatcaaaatcaaaagaccggggaggaag cagctgaaatcaagaagatgcatgaattgattgagaaataccagctcaagggacaaatgagatggatagcagctcaaactgataaatatcgaaatagtgagctataccgaactattgctgacactaagggagcttttgtccaaccggcttttatgaagcttttggactaaccgttattgaagcaatggattgtggattgcctacgtttgcaactaat caaggtggacctgcagaaatcattgttgatggggtttcaggtttccatattgatccttacaatggggacgaatcaagcaagaaaatagctgatttctttgagaagtgtaaggttgattctaaatttggaacaggatatctgagggaggtctcaagcgcattgaagaatggtaacaaactagttccaagtttaaaaaatggaaaaaatgcttatcat gttatattttcgtggttttaagttctgcttcgatgcagttatacgtggaagatttatgcaaacaaagtgttgaatatgggatcaatctatggattttggagacaattcaatgtggggcaaaagcaggctaagcaaagatactttgagatgttttacaatcctctcttcaggaaattggtaggttgtatatgttgaatacaatttactaaga tcctcaaaatgaccaagaaatatacattgactatgctacttttgtaatttcacaggccaaaagcgtgccgatcccacatgaagagccattgccacttgcaacatcagactctactcaatcccaagaattaaaactaccactaccagttccagcagcagtagctaaagttctgccattaacaaggcatgcttttaacttaattacttctctacctagagtaactggtaaagtggat gtcaagtga
SEQ ID NO: 18: Полипептидная последовательность NtSUS5-SSEQ ID NO: 18: NtSUS5-S polypeptide sequence
MASTVADSMPDALKQSRYHMKRCFARFIAMGRRLMKLKHLTEEIEETIEDKAERTRILEGSLGKIMSSTQEAAVVPPYVAFAVRHNPGFWDYVKVNAETLSVEAISAREYLKFKEMIFDEDWAKDDNALEVDFGAFDYSNPRLALSSSVGNGLNFISKVLSSKFGGKPEDAQPLLDYLLALNHQGENLMINENLNGVAKLQAALIVAEVFVSSFPKDTPYKDFEHKLKEWGFDKGWGHNAGRVRETMRLLSEIIQAPDPINMESFFSKLPTTFNIVIFSIHGYFGQADVLGLPDTGGQVVYILDQVRALEEEMLQRIKQQGLNVKPKILVVSRLIPDARGTTCNQEMEPILNSSHSHILRIPFRTEKGVLRQWDASAKILELMEGKPDLIIGNYTDGNLVASLLANKLGVTQGTIAHALEKTKYEDSDVKWKQFDPKYHFSCQFTADLLAMNAADFIITSTYQEIAGSETRPGQYESHTAFTMPGLYRAVSGINVFDPKFNIAAPGAEQSTYFPFTEKQKRFSTFRPAINELLYSNEENNEHIGFLADRKKPIIFSMARFDTVKNLSGLTEWYGKNKKLRNLVNLVIVGGFFDPSKSKDREEAAEIKKMHELIEKYQLKGQMRWIAAQTDKYRNSELYRTIADTKGAFVQPALYEAFGLTVIEAMDCGLPTFATNQGGPAEIIVDGVSGFHIDPYNGDESSKKIADFFEKCKVDSKYWNRISEGGLKRIEECYTWKIYANKVLNMGSIYGFWRQFNVGQKQAKQRYFEMFYNPLFRKLAKSVPIPHEEPLPLATSDSTQSQELKLPLPVPAAVAKVLPLTRHAFNLITSLPRVTGKVDVKMASTVADSMPDALKQSRYHMKRCFARFIAMGRRLMKLKHLTEEIEETIEDKAERTRILEGSLGKIMSSTQEAAVVPPYVAFAVRHNPGFWDYVKVNAETLSVEAISAREYLKFKEMIFDEDWAKDDNALEVDFGAFDYSNPRLALSSSVGNGLNFISKVLSSKFGGKPEDAQPLLDYLLALNHQGENLMINENLNGVAKLQAALI VAEVFVSSFPKDTPYKDFEHKLKEWGFDKGWGHNAGRVRETMRLLSEIIQAPDPINMESFFSKLPTTFNIVIFSIHGYFGQADVLGLPDTGGQVVYILDQVRALEEEMLQRIKQQGLNVKPKILVVSRLIPDARGTTCNQEMEPILNSSHSHILRIPFRTEKGVLRQWDASAKILELMEGKPDLIIGNYTDGNLVA SLLANKLGVTQGTIAHALEKTKYEDSDVKWKQFDPKYHFSCQFTADLLAMNAADFIITSTYQEIAGSETRPGQYESHTAFTMPGLYRAVSGINVFDPKFNIAAPGAEQSTYFPFTEKQKRFSTRPAINELLYSNEENNEHILADRKKPIIFSMARFDTVKNLSGLTEWYGKNKKLRNLVNLVIVGGFFDPSKSKDREEAAEI KKMHELIEKYQLKGQMRWIAAQTDKYRNSELYRTIADTKGAFVQPALYEAFGLTVIEAMDCGLPTFATNQGGPAEIIVDGVSGFHIDPYNGDESSKKIADFFEKCKVDSKYWNRISEGGLKRIEECYTWKIYANKVLNMGSIYGFWRQFNVGQKQAKQRYFEMFYNPLFRKLAKSVPIPHEEPLPLATSDSTQSQEL KLPLPVPAAVAKVLPLTRHAFNLITSLPRVTGKVDVK
SEQ ID NO: 19: Полинуклеотидная последовательность NtSUS5-T SEQ ID NO: 19: Polynucleotide sequence of NtSUS5-T
atggcctcaactgttgctggtagcatgcctgatgctttgaaacaaagccgatatcatatgaagagatgcttcgctaggtgaacacccttcttgttctttttgttttttccctctaccatttatgtcaaatttcaatgcataatgctaactactttttttctttttgacttcaaaattggacgtgaaaggttcattgcaatgggaaggaggttgatgaagctgaaacatttaacagaagaaatagaaaaaactattgaagacaaggcagaaagaaccaagattttggagggttcacttggaaaaattatgagttccacacaggtcagcaccatttaaccaacttaattgaataggaagaaaaaaaaaagcaaaagagttattgcaaggcgtaacgatttcctttgaaattttcaggaggcagctgttgtcccaccttatgttgcttttgcagtaaggcacaatcctggcttctgggattatgtcaaagttgacgctgaaactctctctgtggaagctatttcagccagggactatctcaaattcaaagagatgatctttgatgaagattggtaactggaagattgtatcattttaaagaaacaattttttaatattcaagattagttttgatggttgaatgtgcaagcagggcaaaggatgaaaatgcactcgaagtagattttggtgcttttgactactctaatcatcggttagccctttcctcttctgtcggaaatgggctaaacttcatctcgaaagttttgtcttcaaagtttggtggaaaggcagaagatgcccagcctttgcttgattacttactagctcttaatcatcaaggagaggtatggaaatggactaccttcctttcttaaggaattatataatgatgtatgttataaagatcctttttaaacattgacactttgcagaatctaatgatcaatgagaatctgaatggcgtctctaagcttcaagcagcattgatagtagctgaagtttttgtatcttcctttcccaaagacacaccttataaagactttgagcataagtaagcttttcaaacgcttctgttatcatatgcaatataccaagaatatgttgccttttgaaaagttgtttatgtttatgacttgataatgaaaatactaggctcaaagaatggggctttgagaaagggtggggtcacaatgcaggaagagtaagagagacaatgagactgctttccgagataatccaagcgccagatcccataaatatggagtcctttttcagcaggcttcctactacattcaacattgttatcttctccattcatggttactttggccaagcagatgtccttggtttgcccgatactggaggccaggtttacatacacagcaatttatctccttttgcctcatatttacttattagcgacacttgcattattgaaatcacatttgtatttaacaggttgtttatattctggatcaagtaagagccttagaggaggaaatgttacaaagaatcaagcagcaagggttaaatgtgaagcccaagattcttgtggtgagttatgcaaaaatatgcgtagccaaggttttgaaattgttcagaggggattaagatgatcgagatatttgtttccttcttccattgatgtgtacaggtcactcgtctcattccagatgctcgagggactacatgcaatcaggagatggaacctatacttaactcgtcccattctcacatcctgagaattccattcaggacagagaaaggagttcttcgccaatgggtttctcggtttgatatctatccttacttggagaactatgccaaggcaagtctcctaccaaaattaccacctattcatacactttattcagttttttgagctaatcattctcatttgtcacgtatgtgattaggatgcttctgctaagatacttgagctcatggaaggtaaaccagacctcattattgggaactacactgatggaaatttagtggcatctctattggccaacaaacttggagttactcaggttctacagctgatcatttatctgatcagattttctacattgttttcttgataattaaacggaaatcttatgagattgtaacattttagggaaccattgctcatgcattagagaaaaccaagtatgaagattctgatgtcaagtggaagcagtttgattccaagtaccacttttcttgccaattcactgccgatttattggcaatgaatgctgctgattttatcattaccagcacatatcaagaaatcgcaggaaggttagcactgactctctcagtatatttggcaacttaatgaatgtactgcttgtggccaacactaaaagctattactcgtccttcagcgaaactaggcctggacaatatgaaagtcacacagcatttaccatgccggggctttatagagctgtttcaggcatcaatgtatttgatccaaagttcaacattgctgctcctggggctgaacagtctgcctatttccccttcactgagaaacagaaacgattcagcgcgtttcgtcctgctattgaggaactactttacagtaatgagcaaaacaacgagcacatgtaagtctaattgccccattttcctaatctaaccattgcttaaatgttctgtttttacttgatatgtggtacttatcagtgatattttttattggaacagtggatttcttgcagaccgtaaaaaaccaattatattttcaatggcaagatttgatacggtgaagaacttgtcaggcttgactgagtggtatgggaagaataagaagttgcggaacttggttaacctcgttatcgttgggggattcttcgatccatcaaaatcaaaagaccgggaggaagcagctgaaatcaagaagatgcatgaattgattgagaaatacaagctcaagggacaaatgagatggatagcagctcaaactgataaatatcaaaacagtgagctatatcgaactattgctgacactaaaggagctttcgtccaaccggctttatatgaagcttttggactaactgttattgaagcaatgaattgtggactgcctacatttgctactaatcaaggcggacctgcagaaatcattgttgatggggtttcaggcttccatattgatccttacaatggggatgaatcgagcaagaaaatagctgatttctttgagaagtgtaaggttgattctaaatattggaacaagatatgtggaggaggtctcaagcgcattgaagaatggtaaatggcctcaactgttgctggtagcatgcctgctgctttgaaacaaagccgatatcatatgaagagatgcttcgctaggtgaacacccttcttgttctttttgttttttccctctaccatttatgtcaaatttcaatgcataatgctaactactttttttctttttgacttcaaaattggacgtgaaaaggttcattgcaatgggaaggaggttgat gaagctgaaacatttaacagaagaaatagaaaaaactattgaagacaaggcagaaagaaccaagattttggagggttcacttggaaaaaattatgagttccacacaggtcagcaccatttaaccaacttaattgaataggaagaaaaaaaaaagcaaaagagttattgcaaggcgtaacgatttcctttgaaattttcaggaggcagctgttgtc ccaccttatgttgcttttgcagtaaggcacaatcctggcttctgggattatgtcaaagttgacgctgaaactctctctgtggaagctatttcagccagggactatctcaaattcaaagagatgatctttgaattggtaactggaagattgtatcattttaaagaaacaattttttaatattcaagattagttttgatggttgaatgtgcaagcaggg caaaggatgaaaatgcactcgaagtagattttggtgcttttgactactactctaatcatcggttagccctttcctcttctgtcggaaatgggctaaacttcatctcgaaagttttgtcttcaaagtttggtggaaaaggcagaagaatgcccagcctttgcttgattacttactagctcttaatcatcaaggagaggtatggaaatggactacctt cctttcttaaggaattatataatgatgtatgttataaagatcctttttaaacattgacactttgcagaatctaatgatcaatgagaatctgaatggcgtctctaagcttcaagcagcattgatagtagtagctgaagttttgtatcttcctttcccaaagacacaccttataaagactttgagcataagtaagcttttcaaacgcttctgttatcatatgcaatata ccaagaatatgttgccttttgaaaagttgtttgtttatgacttgataatgaaaatactaggctcaaagaatggggctttgagaaagggtggggtcacaatgcaggaagagtaagagagacaatgagactgctttccgagataatccaagcgccagatcccataaatatggagtcctttttcagcaggcttcctactacattcaacattgttatctctcca ttcatggttactttggccaagcagatgtccttggtttgcccgatactggaggccaggtttacatacacagcaatttatctccttttgcctcatatttacttattagcgacacttgcattattgaaatcacatttgtatttaacaggttgtttatattctggatcaagtaagagccttagaggaggaaatgttacaaagaatcaagcagcaagggttaaatgtgaagcccaaga ttcttgtggtgagttatgcaaaaatatgcgtagccaaggttttgaaattgttcagaggggattaagatgatcgagatatttgtttccttcttccattgatgtgtacaggtcactcgtctcattccagatgctcgagggactacatgcaatcaggagatggaacctatacttaactcgtcccattctcacatcctgagaattccattcaggacagaga aaggagttcttcgccaatgggtttctcggtttgatatctatccttacttggagaactatgccaaggcaagtctcctaccaaaattaccacctattcatacacttattcagttttttgagctaatcattctcatttgtcacgtatgtgattaggatgcttctgctaagatacttgagctcatggaaggtaaaccagacctcattattgggaactacactgatgga aatttagtggcatctctattggccaacaaacttggagttactcaggttctacagctgatcatttatctgatcagattttctacattgttttcttgataattaattaaacggaaatcttatgagattgtaacattttagggaaccattgctcatgcattagagaaaaccaagtatgaagattctgatgtcaagtggaagcagtttgattccaagtaccacttttcttgccaatt cactgccgatttattggcaatgaatgctgctgattttcattaccagcacatatcaagaaatcgcaggaaggttagcactgactctctcagtatatttggcaacttaatgaatgtactgcttgtggccaacactaaaagctattactcgtccttcagcgaaactaggcctggacaatatgaaagtcacacagcatttaccatgccggggctttatagagctgtt tcaggcatcaatgtatttgatccaaagttcaacattgctgctcctggggctgaacagtctgcctatttccccttcactgagaaacagaaacgattcagcgcgtttcgtcctgctattgaggaactactttacagtaatgagcaaaacaacgagcacatgtaagtctaattgccccattttcctaatctaaccattgcttaaatgttctgtt tttacttgatatgtggtacttatcagtgatattttttattggaacagtggatttctgcagaccgtaaaaaaccaattatattttcaatggcaagatttgatacggtgaagaacttgtcaggcttgactgagtggtatgggaagaataagaagttgcggaacttggttaacctcgttatcgttgggggattcttcgatccatcaaaatcaaa agaccgggaggaagcagctgaaatcaagaagatgcatgaattgattgagaaatacaagctcaagggacaaatgagatggatagcagctcaaactgataaatatcaaaacagtgagctatatcgaactattgctgacactaaaggagctttcgtccaaccggctttatgaagcttttggactaactgttattgaagcaatgaattgtggactgcctacattt gctactaatcaaggcggacctgcagaaatcattgttgatggggtttcaggcttccatattgatccttacaatggggatgaatcgagcaagaaaatagctgatttctttgagaagtgtaaggttgattctaaatattggaacaagatatgtggaggaggtctcaagcgcattgaagaatggtaa
SEQ ID NO: 20: Полипептидная последовательность NtSUS5-TSEQ ID NO: 20: NtSUS5-T polypeptide sequence
MASTVAGSMPDALKQSRYHMKRCFARFIAMGRRLMKLKHLTEEIEKTIEDKAERTKILEGSLGKIMSSTQEAAVVPPYVAFAVRHNPGFWDYVKVDAETLSVEAISARDYLKFKEMIFDEDWAKDENALEVDFGAFDYSNHRLALSSSVGNGLNFISKVLSSKFGGKAEDAQPLLDYLLALNHQGENLMINENLNGVSKLQAALIVAEVFVSSFPKDTPYKDFEHKLKEWGFEKGWGHNAGRVRETMRLLSEIIQAPDPINMESFFSRLPTTFNIVIFSIHGYFGQADVLGLPDTGGQVVYILDQVRALEEEMLQRIKQQGLNVKPKILVVTRLIPDARGTTCNQEMEPILNSSHSHILRIPFRTEKGVLRQWDASAKILELMEGKPDLIIGNYTDGNLVASLLANKLGVTQGTIAHALEKTKYEDSDVKWKQFDSKYHFSCQFTADLLAMNAADFIITSTYQEIAGSETRPGQYESHTAFTMPGLYRAVSGINVFDPKFNIAAPGAEQSAYFPFTEKQKRFSAFRPAIEELLYSNEQNNEHIGFLADRKKPIIFSMARFDTVKNLSGLTEWYGKNKKLRNLVNLVIVGGFFDPSKSKDREEAAEIKKMHELIEKYKLKGQMRWIAAQTDKYQNSELYRTIADTKGAFVQPALYEAFGLTVIEAMNCGLPTFATNQGGPAEIIVDGVSGFHIDPYNGDESSKKIADFFEKCKVDSKYWNKICGGGLKRIEEWMASTVAGSMPDALKQSRYHMKRCFARFIAMGRRLMKLKHLTEEIEKTIEDKAERTKILEGSLGKIMSSTQEAAVVPPYVAFAVRHNPGFWDYVKVDAETLSVEAISARDYLKFKEMIFDEDWAKDENALEVDFGAFDYSNHRLALSSSVGNGLNFISKVLSSKFGGKAEDAQPLLDYLLALNHQGENLMINENLNGVSKLQAALI VAEVFVSSFPKDTPYKDFEHKLKEWGFEKGWGHNAGRVRETMRLLSEIIQAPDPINMESFFSRLPTTFNIVIFSIHGYFGQADVLGLPDTGGQVVYILDQVRALEEEMLQRIKQQGLNVKPKILVVTRLIPDARGTTCNQEMEPILNSSHSHILRIPFRTEKGVLRQWDASAKILELMEGKPDLIIGNYTDGNLVASL LANKLGVTQGTIAHALEKTKYEDSDVKWKQFDSKYHFSCQFTADLLAMNAADFIITSTYQEIAGSETRPGQYESHTAFTMPGLYRAVSGINVFDPKFNIAAPGAEQSAYFPFTEKQKRFSAFRPAIEELLYSNEQNNEHIGFLADRKKPIIFSMARFDTVKNLSGLTEWYGKNKKLRNLVNLVIVGGFFDPSKSKDREEAAEI KKMHELIEKYKLKGQMRWIAAQTDKYQNSELYRTIADTKGAFVQPALYEAFGLTVIEAMNCGLPTFATNQGGPAEIIVDGVSGFHIDPYNGDESSKKIADFFEKCKVDSKYWNKICGGGLKRIEEW
SEQ ID NO: 21: Полинуклеотидная последовательность NtSUS6-S SEQ ID NO: 21: Polynucleotide sequence of NtSUS6-S
atggctactgcaccagccctaaatagatcagagtccatagctgatagcatgccagaggccttaaggcaaagccggtaccacatgaagaaatgttttgccaagtacatagagcaaggaaagaggatgatgaaacttcataacttgatggatgagttggagaaagtaattgatgatcctgctgaaaggaaccatgttttggaaggcttacttggctacatattatgcactacaatggtatagctagattcatatgtacttatgatgcccttatattgtttcctgatgtattactcttaaaaccttctttgatcaaatttacaggaggctgcagttgttcctccctacattgcctttgccacgagacagaatcctggattctgggaatatgtgaaagtgaatgctaatgatctttctgttgagggtattacagctacagaatacttgaaattcaaggaaatgatagttgatgaatgctggtatagtatacgttgcagcttatcataccttttgtggttttataacttcaatcagaaaactcatcagagttacctttgtgtgaacatgaaatgcagggcaaaagatgaatatgcactggaaattgattttggagcagtagacttctcaacgcctcgactgaccctatcctcttcaattggcaatggtctcagttatgtttccaagtttctaacttcaaagctaaatgctacctccgcgagtgcacagtgtctggttgactacttgctcactttgaatcatcaaggagatgtacgtcaacaaaaatcaaactccataagtaaacttgtcaactctaagaagaaaaaataggaaaagaagattcacgtaacaaattttctttatgttcaactgcagaaactgatgatcaatgagacactcagcactgtctcaaagcttcaggctgcactggttgtagcagaagcatctatttcctctttaccaacagatacaccatatgagagctttgagctaaggtgatttgttttttcctctacttccctccacttgtgccatgctacgtagtactaagtaacttcaattcttgtaaagattcaaacagtggggttttgagaaaggatggggtgatacagctgaaagggtcagcgacaccatgagaacactgtctgaggtgcttcaggcaccagatccattgaacattcagaagttctttggaagggttccaactgttttcaatattgtattgttctctgtccatggatactttggccaagcagatgttcttggcttgccagacactggtggtcaggtaagcatttaatagcttttacatttaacttctatgcattgacaataaaataatttttaacagtttgaccacttctgctcttgttcaacaggtagtttatgttttggatcaagttgtagcttttgaagaagaaatgctacaaagaattaaacagcaggggctcaatattaagcctcaaattcttgtggtgagttcctagacaatcgacgtgactatgcaattatgtagaggctgtttagaaaagttaatatcatatgttgattgcacagttaacccgactgattccggatgcaaaaggaacaaagtgcaaccaggaactagaaccaatcaagaatacaaaacattcacacatcctcagagttccatttaggacagaaaaaggagtgcttaatcaatgggtttcacgatttgatatctatccatatctggagagatatactcaggtatgtatttttatatcaaccttgctcatcaaagatgtgttgtttcctcaattccatttttccccttggcaaaaggatgctgctgacaaaatcgtcgagctaatggaaggcaaacctgatctaatcattggtaactacactgatgggaatctagtggcttcactaatggctagaaaacttgggataactctggtaacttttcttaatcatatttgatgttgcttcttctccaagttagttcttaatctccactgacctagaccatctttgcaacagggaactattgctcatgctttggagaagacaaaatatgaagactctgacataaaattgaaggaactcgatccgaagtaccacttctcttgccaattcacagctgatttgattgcaatgaattcagcagatttcattatcactagcacataccaagaaatagctggaaggtaagaattagagctaataagtaatgcattcatatgtatttcagcatcgctctttcaccatcatcgaatacacaccactactcagtaaatgtatttgctcaaaagtttgcaacttaatggatctcattcttgaatgcttcaacatatgcagcaaagataaaccaggacagtatgagagccatagtgcatttacccttccagggctttacagagttgcttcaggtatcaatgtctttgatccaaaatttaatattgctgcacctggggcagaccagtcggtgtatttcccttacacagaaaagcagaagcgtttgactgctttccgccctgccattgaggaactgctttttagtaaagtggacaatgacgagcacgtgtaagtctaagtgttaaacttcagcttagtgcctagaacatcccactgctctatgtattgatgtttcacttgtttcaaacagtggatatttagaagacagaaagaaacctatcctgtttaccatggcaaggctggacacagtgaagaacacatctggactaacagaatggtatggcaagaacaagaggctcagaagcttagttaaccttgttgtggttggtggttcctttgatcctacaaaatccaaggatagggaagaagcagctgaaataaaaaagatgcacatgctgatagagaaataccagcttaagggtcagattagatggatagcagctcagactgacagatacagaaatagtgaactctaccgcacaatagcagattccaaaggagcttttgtgcagcctgcattgtatgaagcatttggtctaacagtcattgaggcaatgaactgtggattaccaacctttgctaccaaccaaggtggccctgctgagattattgttgatggggtctcaggctttcatattgatccaaataatggggatgaatcaagcaacaaaattgccaactttttccaaaaatgcagggaggatcctgagtattggaacaggatttcagtccagggtctaaaccgtatatatgaatggtaactcacagataagccattcaaattgcaaagaggcacatatcttgcagaaaatttcttaatccttaaatcctaattttttgcagttacacatggaagatctatgcaaacaaggtattgaatatggggtccatctatactttttggaggacattgtacagagatcagaaacaagcaaagcaaagatacatcgagactttctacaatcttgagtttaggaacttggtatagtgctgcatgacattgacagtataccacaaacatctttatgagatgaattacttttaataaaattgtttttaacctttgcttccttaatggcacttattgcaggtaaaaaatgtgcctatcagaaaggacgaaacaccacaaggaccaaaggagagggagaaagttaagccacagatatcacaaaggcatgctctaaagcttttgcctacagtttttcaagagaccctagtatattctagtactaaattagaattatacagcatgcagcttttgctgttcacctttctaaatcaccagttgtgtcaatcaagttgacaaaatcaataaattgggattttccctttcctatgcttgattgttattactcctactttgtttatggtagtcttccttcattgttttctcctgtacttcttttactacaactgtactgacatactaattatttctgtgtaccaggcgctcacaatcaaggttgcagaagtaagattagataaaattgctactgcatgaatggctactgcaccagccctaaatagatcagagtccatagctgatagcatgccagaggccttaaggcaaagccggtaccacatgaagaaatgttttgccaagtacatagagcaaggaaagaggatgatgaaacttcataacttgatggatgagttggagaaagtaattgatgatcctgctgaaaggaaccatgttttggaaggcttacttggctacatattatgcactac aatggtatagctagattcatatgtacttatgatgcccttatattgtttcctgatgtattacttaaaaccttcttttgatcaaatttacaggaggctgcagttgttcctccctacattgcctttgccacgagacagaatcctggattctgggaatatgtgaaagtgaatgctaatgatctttctgttgagggtattacagctacagaatacttgaa attcaaggaaatgatagttgatgaatgctggtatagtatacgttgcagcttatcataccttttgtggttttataacttcaatcagaaaactcatcagagttacctttgtgtgaacatgaaatgcagggcaaaagatgaatatgcactggaaattgattttggagcagtagacttctcaacgcctcgactgaccctatcctcttcaattggcaatggt ctcagttatgtttccaagtttctaacttcaaagctaaatgctacctccgcgagtgcacagtgtctggttgactacttgctcactttgaatcatcaaggagatgtacgtcaacaaaaatcaaactccataagtaaacttgtcaactctaagaagaaaaaataggaaaagaagattcacgtaacaaattttctttatgttcaactgcagaa actgatgatcaatgagacactcagcactgtctcaaagcttcaggctgcactggttgtagcagaagcatctatttcctctttaccaacagatacaccatatgagagctttgagctaaggtgatttgttttttcctctacttccctccacttgtgccatgctacgtagtactaagtaacttcaattcttgtaaagattcaaacagtggggttttgagaaagga tggggtgatacagctgaaagggtcagcgacaccatgagaacactgtctgaggtgcttcaggcaccagatccattgaacattcagaagttctttggaagggttccaactgttttcaatattgtattgttctctgtccatggatactttggccaagcagatgttcttggcttgccagacactggtggtcaggtaagcatttaatagcttttacatttaacttctatgcat tgacaataaaataatttttaacagtttgaccacttctgctcttgttcaacaggtagtttatgttttggatcaagttgtagcttttgaagaagaaatgctacaaagaattaaacagcaggggctcaatattaagcctcaaattcttgtggtgagttcctgacaatcgacgtgactatgcaattatgtagaggctgttagaaaagttaatatcatatgttga ttgcacagttaacccgactgattccggatgcaaaaggaacaaagtgcaaccaggaactagaaccaatcaagaatacaaaacattcacacatcctcagagttccatttaggacagaaaaaggagtgcttaatcaatgggtttcacgatttgatatctatccatatctggagagatatactcaggtatgtatttttatatcaaccttgctcatcaaagatgt gttgtttcctcaattccatttttccccttggcaaaaggatgctgctgacaaaatcgtcgagctaatggaaggcaaacctgatctaatcattggtaactacactgatgggaatctagtggcttcactaatggctagaaaacttgggataactctggtaacttttcttaatcatatttgatgttgcttcttctccaagttagttcttaatctccactgacc tagaccatctttgcaacagggaactattgctcatgctttggagaagacaaaatattgaagactctgacataaaattgaaggaactcgatccgaagtaccacttctcttgccaattcacagctgatttgattgcaatgaattcagcagatttcattatcactagcacataccaagaaaatagctggaaggtaagaattagagctaataagtaatgcattcatatgtatttcagcat cgctctttcaccatcatcgaatacacaccactactcagtaaatgtatttgctcaaaagtttgcaacttaatggatctcattcttgaatgcttcaacatatgcagcaaagataaaccaggacagtgcatttacccttccaggggctttacagagttgcttcaggtatcaatgtctttgatccaaaatttaatattgctgcacctggggca gaccagtcggtgtatttcccttacacagaaaagcagaagcgtttgactgctttccgccctgccattgaggaactgctttttagtaaagtggacaatgacgagcacgtgtaagtctaagtgttaaacttcagcttagtgcctagaacatcccactgctctatgtattgatgtttcacttgtttcaaacagtggatatttagaagacaga aagaaacctatcctgtttaccatggcaaggctggacacagtgaagaacacatctggactaacagaatggtatggcaagaagaacaagaggctcagaagcttagttaaccttgttgtggttggtggttcctttgatcctacaaaatccaaggataggggaagaagcagctgaaataaaaaagatgcacatgctgatagagaaataccagcttaagggtcagattagatggatagca gctcagactgacagatacagaaatagtgaactctaccgcacaatagcagattccaaaggagcttttgtgcagcctgcattgtatgaagcatttggtctaacagtcattgaggcaatgaactgtggattaccaacctttgctaccaaccaaggtggccctgctgagattattgttgatggggtctcaggctttcatattgatccaaataatggggatgaatcaagca acaaaattgccaactttttccaaaaatgcagggaggatcctgagtattggaacaggatttcagtccagggtctaaaccgtatatatgaatggtaactcacagataagccattcaaattgcaaagaggcacatatcttgcagaaaatttcttaatccttaaatcctaattttttgcagttacacatggaagatctatgcaaacaaggtattgaat atggggtccatctatactttttggaggacattgtacagagatcagaaacaagcaaagcaaagatacatcgagactttctacaatcttgagtttaggaacttggtatagtgctgcatgacattgacagtataccacaaacatctttatgagatgaattacttttaataaaattgtttttaacctttgcttccttaatggcacttattgcaggtaaaaaatgtgcc tatcagaaaggacgaaacaccacaaggaccaaaggagggagaaagttaagccacagatatcacaaaggcatgctctaaagcttttgcctacagtttttcaagagaccctagtatattctagtactaaattagaattatacagcatgcagctttgctgttcacctttctaaatcaccagttgtgtgtcaatcaagttgacaaaatcaataaattgggatt ttccctttcctatgcttgattgttattactcctactttgtttatggtagtcttccttcattgttttctcctgtacttcttttactacaactgtactgacatactaattatttctgtgtaccaggcgctcacaatcaaggttgcagaagtaagattagataaaattgctactgcatga
SEQ ID NO: 22: Полипептидная последовательность NtSUS6-SSEQ ID NO: 22: NtSUS6-S polypeptide sequence
MATAPALNRSESIADSMPEALRQSRYHMKKCFAKYIEQGKRMMKLHNLMDELEKVIDDPAERNHVLEGLLGYILCTTMEAAVVPPYIAFATRQNPGFWEYVKVNANDLSVEGITATEYLKFKEMIVDECWAKDEYALEIDFGAVDFSTPRLTLSSSIGNGLSYVSKFLTSKLNATSASAQCLVDYLLTLNHQGDKLMINETLSTVSKLQAALVVAEASISSLPTDTPYESFELRFKQWGFEKGWGDTAERVSDTMRTLSEVLQAPDPLNIQKFFGRVPTVFNIVLFSVHGYFGQADVLGLPDTGGQVVYVLDQVVAFEEEMLQRIKQQGLNIKPQILVLTRLIPDAKGTKCNQELEPIKNTKHSHILRVPFRTEKGVLNQWVSRFDIYPYLERYTQDAADKIVELMEGKPDLIIGNYTDGNLVASLMARKLGITLGTIAHALEKTKYEDSDIKLKELDPKYHFSCQFTADLIAMNSADFIITSTYQEIAGSKDKPGQYESHSAFTLPGLYRVASGINVFDPKFNIAAPGADQSVYFPYTEKQKRLTAFRPAIEELLFSKVDNDEHVGYLEDRKKPILFTMARLDTVKNTSGLTEWYGKNKRLRSLVNLVVVGGSFDPTKSKDREEAAEIKKMHMLIEKYQLKGQIRWIAAQTDRYRNSELYRTIADSKGAFVQPALYEAFGLTVIEAMNCGLPTFATNQGGPAEIIVDGVSGFHIDPNNGDESSNKIANFFQKCREDPEYWNRISVQGLNRIYECYTWKIYANKVLNMGSIYTFWRTLYRDQKQAKQRYIETFYNLEFRNLVKNVPIRKDETPQGPKEREKVKPQISQRHALKLLPTVFQETLALTIKVAEVRLDKIATAMATAPALNRSESIADSMPEALRQSRYHMKKCFAKYIEQGKRMMKLHNLMDELEKVIDDPAERNHVLEGLLGYILCTTMEAAVVPPYIAFATRQNPGFWEYVKVNANDLSVEGITATEYLKFKEMIVDECWAKDEYALEIDFGAVDFSTPRLTLSSsignGLSYVSKFLTSKLNATSASAQCLVDYLLTLNHQGDKL MINETLSTVSKLQAALVVAEASISSLPTDTPYESFELRFKQWGFEKGWGDTAERVSDTMRTLSEVLQAPDPLNIQKFFGRVPTVFNIVLFSVHGYFGQADVLGLPDTGGQVVYVLDQVVAFEEEMLQRIKQQGLNIKPQILVLTRLIPDAKGTKCNQELEPIKNTKHSHILRVPFRTEKGVLNQWRFDIYP YLERYTQDAADKIVELMEGKPDLIIGNYTDGNLVASLMARKLGITLGTIAHALEKTKYEDSDIKLKELDPKYHFSCQFTADLIAMNSADFIITSTYQEIAGSKDKPGQYESHSAFTLPGLYRVASGINVFDPKFNIAAPGADQSVYFPYTEKQKRLTAFRPAIEELLFSKVDNDEHVGYLEDRKKPILFTMARLDTVKNTSGLTEWY GKNKRLRSLVNLVVVGGSFDPTKSKDREEAAEIKKMHMLIEKYQLKGQIRWIAAQTDRYRNSELYRTIADSKGAFVQPALYEAFGLTVIEAMNCGLPTFATNQGGPAEIIVDGVSGFHIIDPNNGDESSNKIANFFQKCREDPEYWNRISVQGLNRIYECYTWKIYANKVLNMGSIYTFWRTLYRDQKQAKQRYIE TFYNLEFRNLVKNVPIRKDETPQGPKEREKVKPQISQRHALKLLPTVFQETLALTIKVAEVRLDKIATA
SEQ ID NO: 23: Полинуклеотидная последовательность NtSUS6-T SEQ ID NO: 23: Polynucleotide sequence of NtSUS6-T
atggctactgcaccagccctgaaaagatcagagtccatagctgatagcatgccagaggccttaaggcaaagccggtaccacatgaagaaatgttttgccaagtacatagagcaaggcaagaggatgatgaaacttcataacttgatggatgaattggagaaagtaattgatgatcctgctgaaaggaaccatgttttggaaggcttacttggctacatattatgtactacaatggtatagctagattcatatgtacttatgatgtccttatattgtttccggaggcattattcttaaatccttctttgatcaaatttgtaggaggctgcagttgttcctccctatattgccttcgccacgagacagaatcctggattctgggaatatgtgaaagtcaatgctaatgatctttctgttgagggtattacagctacagattacttgaaattcaaggaaatgatagttgatgaaagctggtatagaatactttgcagcttatcataccttttgtggttttataatttcaatcagaaaactcatcagagttacctttgtgtgaacatgacatgcagggcaaaagatgaatatgcactggaaattgattttggagcagtagacttctcaacgcctcgactgaccctatcctcttcaattggaaatggtctcagttatgtttccaagtttctaacttcaaagctaaatgctacctcagcgagtgcacagtgtctggttgactacttgctcactttgaatcaccaaggagatgtacgtcaacaaaaatcaaactccataagtaaacttgtcaactctaagaagtaaaaataggaaaagaagattcatgtaacaaattttctttatgttcaactgtagaaactgatgatcaatgagacactcggcactgtctcaaagcttcaggctgcactggttgtagcagaagcatctatttcctccttaccaacagatacaccataccagagctttgagctaaggtgatttgttttttcctctacttccttccacttttggtgtgctacatagtactaagtaacttcaattcttgtaaagattcaaacagtggggttttgagaaaggatggggtgatacagctgaaagggtccgcgacaccatgagaacactttctgaggtacttcaggcgccagatccattgaacattgagaagttctttgggagggttccaactgttttcaatattgtattgttctctgttcatggatactttggccaagcaaatgttcttggcttgccagacacaggtggtcaggtaagcatctaatagcttttacatttaacttctatgcattgacaataaaataacttctacactaccaaataatttttgaaagtttgaccacttcggctcttgttcaacaggtggtttatgttttggatcaagttgtagcttttgaagaagaaatgctccaaagaattaaacagcaggggctcaatattaagcctcaaattcttgtggtgagctcctagacaatgacgtgactatgcaattaagtagaggctgtttagaaaagttaatatcatatgttgattgcacagttaacccgactgattccggacgccaaaggaacaaagtgcaaccaggaactagaaccaatcaagaatacaaaacattcacacatcctcagagttccatttaggacagaaaaaggagtgcttaatcaatgggtttcacgatttgatatctatccatatctggagagatatactcaggtgtgtatttttatatcaaccctgctcatcaaagatgtgttgtttcctcaattccatttttcgccttgacaaaaggacgctgctgacaaaatcatcgagctaatggaaggcaaacctgatctaatcattggtaactacactgatgggaatctagtggcttctctaatggctagaaagcttgggataactctggtaacttttcttatcatatttgatgttgtttcttctccaagttggttcttaatgtcaactaacccagaccatctttgtaacagggaactattgctcatgctctggagaagacaaaatatgaagactctgacatcaaattgaaggaactcgatccgaagtaccacttttcttgccaattcacagctgatttgattgcaatgaattcagcagatttcattatcacaagcacatatcaagaaatagccggaaggtaagaattggaactacggaagcagagagctaataagtagtgcactcatatatttcagcatcgctctttcgcataatcgaatacacaccactactcagtaaatgtacttgctcaaaagtttacaagtttatggatcttattcttgaatgcttcaacatatgcagcaaagataggccaggacagtatgagagccatagtgcatttacccttccagggctttacagagttgcttcaggcatcaatgtctttgatcctaaatttaatattgctgcacctggggcagaccaatcggtgtatttcccttacacagaaaagcagacgcgtttgactgctttccgccctgccattgaggaactgctttttagtaaagtggacaatgacgagcacatgtaagtcttagtgttaaacttcagctttcagcttagtgcctagaacattccactggctctatgtattaatgtttcacttgtttcaaacacagtggatatttagaagacagaaagaaacctatcctgtttaccatggcaaggctggacacagtgaagaacacatctggactaacagaatggtatggcaagaacaagaggctcagaagcttagttaaccttgttgtggttggtggttcctttgatcctacaaaatccaaggatagagaagaagcagctgaaataaaaaagatgcacatgctgatagagaaataccagcttaagggtcagatcagatggatagcagctcagactgacagatatagaaacagtgaactctaccgcacaatagcagattccaaaggagcttttgtgcagcctgcattatatgaagcatttggtctaacagtcattgaggcaatgaactgtggattaccaacctttgctaccaaccaaggtggccctgctgagattattgttgatggggtctcaggctttcatattgatccaaataatggggatgaatcaagcaacaaagttgccaactttttccaaaaatgcagggaggatcctgagtattggaacaggatttcagtccagggtctaaaccgtatatatgaatggtaactcacagataagccattcaaattgcaaagaggcacatatcttgctgaaaatttcttaatcctttaatcctaaaattttgcagttacacatggaagatctatgcaaacaaggtattgaatatggggtccatctatactttttggaggacattgtacagagatcagaaacaagcaaagcaaagatacatcgagactttctacaatcttgagtttaggaacttggtatagtgctgcatgacattgacagtataccacaaacatctttatgagatgaattacttttaataaaattgtttttaacctttgcctccttaatgacacttattgcaggtaaaaaatgtgcctatcagacaggacgaaacaccacaaggaccaaaggagaggagggagaaagttaagccacagatatcacaaaggcatgctctaaagcttttgcctatagtttttcaggagaccctagtatattctagtactaaattagaattatacagcatgcagcttgcttctgctgttcacctttctaaatcaccagttatgtcaatcaagttgacaaaatcaataaattcggcttttccctttcctatgcttgattgttattactcctacttcgtttatggtagtcttccttcattgttttctcctgtacttcttttactacaactgtactgaatggctactgcaccagccctgaaagatcagagtccatagctgatagcatgccagaggccttaaggcaaagccggtaccacatgaagaaatgttttgccaagtacatagagcaaggcaagaggatgatgaaacttcataacttgatggatgaattggagaaagtaattgatgatcctgctgaaaggaaccatgttttggaaggcttacttggctacatattatgtactac aatggtatagctagattcatatgtacttatgatgtccttatattgtttccgggaggcattattcttaaatccttctttgatcaaatttgtaggaggctgcagttgttcctccctatattgccttcgccacgagacagaatcctggattctgggaatatgtgaaagtcaatgctaatgatctttctgttgagggtattacagctacagattacttgaaattca aggaaatgatagttgatgaaagctggtatagaatactttgcagcttatcataccttttgtggttttataatttcaatcagaaaactcatcagagttacctttgtgtgaacatgacatgcagggcaaaagatgaatatgcactggaaattgattttggagcagtagacttctcaacgcctcgactgaccctatcctcttcaattggaaatggtctcagtt atgtttccaagtttctaacttcaaagctaaatgctacctcaaagctaaatgctacctcagcgagtgcacagtgtctggttgactacttgctcactttgaatcaccaaggagatgtacgtcaacaaaaatcaaactccataagtaaacttgtcaactctaagaagtaaaaataggaaaagaagattcatgtaacaaattttctttatgttcaactgtagaaactgatgat caatgagacactcggcactgtctcaaagcttcaggctgcactggttgtagcagaagagcatctatttcctccttaccaacagatacaccataccagagctttgagctaaggtgatttgttttttcctctacttccttccacttttggtgtgctacatagtactaagtaacttcaattcttgtaaagattcaaacagtggggttttgagaaaggatggggtgat acagctgaaagggtccgcgacaccatgagaacactttctgaggtacttcaggcgccagatccattgaacattgagaagttctttgggagggttccaactgttttcaatattgtattgttctctgttcatggatactttggccaagcaaatgttcttggcttgccagacacaggtggtcaggtaagcatctaatagcttttacatttaacttctatgcattgacaataaaataact tctacactaccaaataatttttgaaagtttgaccacttcggctcttgttcaacaggtggtttatgttttggatcaagttgtagcttttgaagaagaaatgctccaaagaattaaacagcaggggctcaatattaagcctcaaattcttgtggtgagctcctagacaatgacgtgactatgcaattaagtagaggctgttagaaaagttaatatcatatgttgatt gcacagttaacccgactgattccggacgccaaaggaacaaagtgcaaccaggaactagaaccaatcaagaatacaaaacattcacacatcctcagagttccatttaggacagaaaaaggagtgcttaatcaatgggtttcacgatttgatatctatccatatctggagagatatactcaggtgtgtatttttatatcaaccctgctcatcaaagatgtg ttgtttcctcaattccatttttcgccttgacaaaaggacgctgctgacaaaatcatcgagctaatggaaaggcaaacctgatctaatcattggtaactacactgatgggaatctagtggcttctctaatggctagaaagcttgggataactctggtaacttttcttatcatatttgatgttgtttcttctccaagttggttcttaatgtcaactaaccca gaccatctttgtaacagggaactattgctcatgctctggagaagacaaaatatgaagactctgacatcaaattgaaggaactcgatccgaagtaccacttttcttgccaattcacagctgatttgattgcaatgaattcagcagatttcattatcacaagcacatatcaagaaaatagccggaaaggtaagaattggaactacggaagcagagagctaataagtagtgcact catatatttcagcatcgctctttcgcataatcgaatacacaccactactcagtaaatgtacttgctcaaaagtttacaagtttatggatcttattcttgaatgcttcaacatatgcagcaaagataggccaggacagtatgagagccatagtgcatttacccttccagggctttacagagttgcttcaggcatcaatgtctttgatcctaaatttaatttgctg cacctggggcagaccaatcggtgtatttcccttacacagaaaagcagacgcgtttgactgctttccgccctgccattgaggaactgctttttagtaaagtggacaatgacgagcacatgtaagtcttagtgttaaacttcagctttcagcttagtgcctagaacattccactggctctatgtattaatgtttcacttgtttcaaacacagtgg atatttagaagacagaaagaaacctatcctgtttaccatggcaaggctggacacagtgaagaacacatctggactaacagaatggtatggcaagaacaagaggctcagaagcttagttaaccttgttgtggttggtggttcctttgatcctacaaaatccaaggatagagaagaagcagctgaaataaaaaagatgcacatgctgatagagaaataccagcttaagggtcagat cagatggatagcagctcagactgacagatatagaaacagtgaactctaccgcacaatagcagattccaaaggagcttttgtgcagcctgcattatatgaagcatttggtctaacagtcattgaggcaatgaactgtggattaccaacctttgctaccaaccaaggtggccctgctgagattattgttgatggggtctcaggctttcatattgatccaaataatgggg atgaatcaagcaacaaagttgccaactttttccaaaaatgcagggaggatcctgagtattggaacaggatttcagtccagggtctaaaccgtatatatgaatggtaactcacagataagccattcaaattgcaaagaggcacatatcttgctgaaaatttcttaatcctttaatcctaaaattttgcagttacacatggaagatctatgcaaacaa ggtattgaatatggggtccatctatactttttggaggacattgtacagagatcagaaaaagcaaagcaaagatacatcgagactttctacaatcttgagtttaggaacttggtatagtgctgcatgacattgacagtataccacaaacatcttttgagatgaattacttttaataaaattgtttttaacctttgcctccttaatgacacttattgcaggtaaaaa atgtgcctatcagacaggacgaaacaccacaaggaccaaaggagaggagggagaaagttaagccacagatatcacaaaggcatgctctaaagcttttgcctatagtttttcaggagaccctagtatattctagtactaaattagaattatacagcatgcagcttgcttctgctgttcacctttctaaatcaccagttatgtcaatcaagttgacaaaatcaata aattcggcttttccctttcctatgcttgattgttattactcctacttcgtttatggtagtcttccttcattgttttctcctgtacttcttttactacaactgtactga
SEQ ID NO: 24: Полипептидная последовательность NtSUS6-TSEQ ID NO: 24: NtSUS6-T polypeptide sequence
MATAPALKRSESIADSMPEALRQSRYHMKKCFAKYIEQGKRMMKLHNLMDELEKVIDDPAERNHVLEGLLGYILCTTMEAAVVPPYIAFATRQNPGFWEYVKVNANDLSVEGITATDYLKFKEMIVDESWAKDEYALEIDFGAVDFSTPRLTLSSSIGNGLSYVSKFLTSKLNATSASAQCLVDYLLTLNHQGDKLMINETLGTVSKLQAALVVAEASISSLPTDTPYQSFELRFKQWGFEKGWGDTAERVRDTMRTLSEVLQAPDPLNIEKFFGRVPTVFNIVLFSVHGYFGQANVLGLPDTGGQVVYVLDQVVAFEEEMLQRIKQQGLNIKPQILVLTRLIPDAKGTKCNQELEPIKNTKHSHILRVPFRTEKGVLNQWVSRFDIYPYLERYTQDAADKIIELMEGKPDLIIGNYTDGNLVASLMARKLGITLGTIAHALEKTKYEDSDIKLKELDPKYHFSCQFTADLIAMNSADFIITSTYQEIAGSKDRPGQYESHSAFTLPGLYRVASGINVFDPKFNIAAPGADQSVYFPYTEKQTRLTAFRPAIEELLFSKVDNDEHIGYLEDRKKPILFTMARLDTVKNTSGLTEWYGKNKRLRSLVNLVVVGGSFDPTKSKDREEAAEIKKMHMLIEKYQLKGQIRWIAAQTDRYRNSELYRTIADSKGAFVQPALYEAFGLTVIEAMNCGLPTFATNQGGPAEIIVDGVSGFHIDPNNGDESSNKVANFFQKCREDPEYWNRISVQGLNRIYECYTWKIYANKVLNMGSIYTFWRTLYRDQKQAKQRYIETFYNLEFRNLVKNVPIRQDETPQGPKERREKVKPQISQRHALKLLPIVFQETLVYSSTKLELYSMQLASAVHLSKSPVMSIKLTKSINSAFPFPMLDCYYSYFVYGSLPSLFSPVLLLLQLYMATAPALKRSESIADSMPEALRQSRYHMKKCFAKYIEQGKRMMKLHNLMDELEKVIDDPAERNHVLEGLLGYILCTTMEAAVVPPYIAFATRQNPGFWEYVKVNANDLSVEGITATDYLKFKEMIVDESWAKDEYALEIDFGAVDFSTPRLTLSSsignGLSYVSKFLTSKLNATSASAQCLVDYLLTLNHQGDKLM INETLGTVSKLQAALVVAEASISSLPTDTPYQSFELRFKQWGFEKGWGDTAERVRDTMRTLSEVLQAPDPLNIEKFFGRVPTVFNIVLFSVHGYFGQANVLGLPDTGGQVVYVLDQVVAFEEEMLQRIKQQGLNIKPQILVLTRLIPDAKGTKCNQELEPIKNTKHSHILRVPFRTEKGVLNQWVSRFDIYPY LERYTQDAADKIIELMEGKPDLIIGNYTDGNLVASLMARKLGITLGTIAHALEKTKYEDSDIKLKELDPKYHFSCQFTADLIAMNSADFIITSTYQEIAGSKDRPGQYESHSAFTLPGLYRVASGINVFDPKFNIAAPGADQSVYFPYTEKQTRLTAFRPAIEELLFSKVDNDEHIGYLEDRKKPILFTMARLDTVKNTSGLTEWYGKNK RLRSLVNLVVVGGSFDPTSKSKDREEAAEIKKMHMLIEKYQLKGQIRWIAAQTDRYRNSELYRTIADSKGAFVQPALYEAFGLTVIEAMNCGLPTFATNQGGPAEIIVDGVSGFHIDPNNGDESSNKVANFFQKCREDPEYWNRISVQGLNRIYECYTWKIYANKVLNMGSIYTFWRTLYRDQKQAKQRYIETFYN LEFRNLVKNVPIRQDETPQGPKERREKVKPQISQRHALKLLPIVFQETLVYSSTKLELYSMQLASAVHLSKSPVMSIKLTKSINSAFPFPMLDCYYSYFVYGSLPSLFSPVLLLQLY
--->--->
ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙSEQUENCE LIST
<110> Филип Моррис Продактс С.А.<110> Philip Morris Products S.A.
<120> МОДУЛИРОВАНИЕ СОДЕРЖАНИЯ РЕДУЦИРУЮЩИХ САХАРОВ В РАСТЕНИИ<120> MODULATION OF THE CONTENT OF REDUCING SUGAR IN THE PLANT
<130> P10505EP<130> P10505EP
<140> EP18164769.4<140>EP18164769.4
<141> 2018-03-28<141> 2018-03-28
<160> 24 <160> 24
<170> PatentIn версия 3.5<170> PatentIn version 3.5
<210> 1<210> 1
<211> 4384<211> 4384
<212> ДНКДНК<212> DNADNA
<213> Nicotiana tabacum<213> Nicotiana tabacum
<220><220>
<221> иной_признак<221> other_characteristic
<222> (1520)..(1520)<222> (1520)..(1520)
<223> n представляет собой a, c, g, или t<223> n is a, c, g, or t
<400> 1<400> 1
atggcagcta gtggtcttag cattaagaaa agtttggagg aatccatttt ggctcatcca 60atggcagcta gtggtcttag cattaagaaa agtttggagg aatccatttt ggctcatcca 60
gatgaaattt tggctctcaa gtcaaggtac attactacat ataatgatat taagaactag 120gatgaaattt tggctctcaa gtcaaggtac attactacat ataatgatat taagaactag 120
aggcttatcc aaggttttgt tacatttttg aaattataag tttagaacct aatagtactt 180aggcttatcc aaggttttgt tacatttttg aaattataag tttagaacct aatagtactt 180
ggtagcactt gtttccttat tatctagctg ttgttactgc ttgttgctac tgctttctgt 240ggtagcactt gtttccttat tatctagctg ttgttactgc ttgttgctac tgctttctgt 240
tcatctttcc ttgagcccgg tctatcggaa acaacctctc tattctcaaa gtataaggtt 300tcatctttcc ttgagcccgg tctatcggaa acaacctctc tattctcaaa gtataaggtt 300
tgcgtacata ctacctcccc agactctact tgtggaattt actgtttttg ttgtgttgtt 360tgcgtacata ctacctcccc agactctact tgtggaattt actgtttttg ttgtgttgtt 360
gtaatctaat atttattaga attttactga tttttcacat atatatatct atgtcccctg 420gtaatctaat atttattaga attttactga tttttcacat atatatatct atgtcccctg 420
tcgaaaattc tatagctcat gttagctaaa tacattagta ccattgtttt taattgtttt 480tcgaaaattc tatagctcat gttagctaaa tacattagta ccattgtttt taattgtttt 480
ggttttggca caggattgaa actgaaggga aaggggtaat gaaaccactt gatctcttga 540ggttttggca caggattgaa actgaaggga aaggggtaat gaaaccactt gatctcttga 540
accatttggt ttctgttact agtaagacaa atggagtaaa tattgtacct agtgcacttg 600accatttggt ttctgttact agtaagacaa atggagtaaa tattgtacct agtgcacttg 600
tggaagttct cagttgcagc caagaagctg tgattgtacc accaaaacta gcactagctg 660tggaagttct cagttgcagc caagaagctg tgattgtacc accaaaacta gcactagctg 660
tacgtccgag gcccggtgta tgggagtact tgtcactgaa tcttaagaca aagaaagtgg 720tacgtccgag gcccggtgta tgggagtact tgtcactgaa tcttaagaca aagaaagtgg 720
ctgaattaag cattcctgaa taccttcaat tgaaagagaa cactgttgat gaaaggtaaa 780ctgaattaag cattcctgaa taccttcaat tgaaagagaa cactgttgat gaaaggtaaa 780
gtattagtct gcgatttcgc tttgtgaaat tgaagttttt gttttgattc ataatgtttt 840gtattagtct gcgatttcgc tttgtgaaat tgaagttttt gttttgattc ataatgtttt 840
gtgtatcaat tatgttacca gtggaaacat attggagttg gattttgagc catttacaac 900gtgtatcaat tatgttacca gtggaaacat attggagttg gattttgagc catttacaac 900
agttacacca ccaaaaacac tttctgactc tattggcaat ggtttggagt ttcttaatcg 960agttacacca ccaaaaacac tttctgactc tattggcaat ggtttggagt ttcttaatcg 960
ccacattgct tcgaaaatgt ttcatgataa ggagatttcc agatgcctcc ttgacttcct 1020ccacattgct tcgaaaatgt ttcatgataa ggagatttcc agatgcctcc ttgacttcct 1020
cagaaaccat aactacaaag gaaaggtaat aaaaaaaagt gtttctttaa acaagttgta 1080cagaaaccat aactacaaag gaaaggtaat aaaaaaaagt gtttctttaa acaagttgta 1080
tgattatgtg tatatttcta agtatgttaa cttgaaaaca gtcattgatg gtgaaagaaa 11401140
gcattcaaag cctagagagt ttccaacttg ttctgaaaaa agcagaggaa catttgtgca 1200gcattcaaag cctagagagt ttccaacttg ttctgaaaaa agcagaggaa catttgtgca 1200
cattgaatcc agaaactcca tactccaatt ttgaatcaaa gtttgaagag attggcttgg 1260cattgaatcc agaaactcca tactccaatt ttgaatcaaa gtttgaagag attggcttgg 1260
aaagagggtg gggaaacacc gctgaacgcg tgcaagacac tatcagtcat cttttgcatc 1320aaagagggtg gggaaacacc gctgaacgcg tgcaagacac tatcagtcat cttttgcatc 1320
tccttgaggc tcctaacgcg tcttctttgg aaaatttcct tggtagaatc ccattggttt 1380tccttgaggc tcctaacgcg tcttctttgg aaaatttcct tggtagaatc ccattggttt 1380
tcaatgttgt gattctaact ccacatggtt attttgctca agataatgtc ttgggctatc 1440tcaatgttgt gattctaact ccacatggtt attttgctca agataatgtc ttgggctatc 1440
ctgacactgg tggccaggtt tgtgtccaat attttgcatt cttgatcaag ttctttatac 1500ctgacactgg tggccaggtt tgtgtccaat attttgcatt cttgatcaag ttctttatac 1500
catttgaacc aacaatcttn aacattcttt ttttggttgt gaaatgttga ataggttgtt 1560catttgaacc aacaatcttn aacattcttt ttttggttgt gaaatgttga ataggttgtt 1560
tacattcttg atcaagttcc agctatggag cgtgagatgc ttcatcgtat gaagcttcaa 1620tacattcttg atcaagttcc agctatggag cgtgagatgc ttcatcgtat gaagcttcaa 1620
ggactcgatg atatcatccc tcgcatcctt gttgtaagtg gccttaattt tcctagtttc 1680ggactcgatg atatcatccc tcgcatcctt gttgtaagtg gccttaattt tcctagtttc 1680
atttacacct ctaaatgaaa ttgatctttt ttgttgtttt atatcaggta acaaggctgc 1740atttacacct ctaaatgaaa ttgatctttt ttgttgtttt atatcaggta acaaggctgc 1740
tgcctgatgc agtaggaacc acctgtggcg agcggatgga gaaagtatat ggggcagaac 1800tgcctgatgc agtaggaacc acctgtggcg agcggatgga gaaagtatat ggggcagaac 1800
attctcatat aattcgtgtt ccatttagaa ctgagaaggg aatgttgcgc aaatggatct 1860attctcatat aattcgtgtt ccatttagaa ctgagaaggg aatgttgcgc aaatggatct 1860
cacgattcga agtctggcca tacatggaaa ctttcactga ggttggaaca taaaaacaaa 1920cacgattcga agtctggcca tacatggaaa ctttcactga ggttggaaca taaaaacaaa 1920
taaaatccat tggaatgttc cttctgcaat tgaaaatgtc ttgctaactg aagacccatt 1980taaaatccat tggaatgttc cttctgcaat tgaaaatgtc ttgctaactg aagacccatt 1980
tttaaattga tcatcaggat gttgcagaag aacttgtcaa agaattgcaa gctaaaccag 2040tttaaattga tcatcaggat gttgcagaag aacttgtcaa agaattgcaa gctaaaccag 2040
acttgatcat tggaaactac agtgagggaa atcttgctgc ctctttgctt gcgaagaaat 2100acttgatcat tggaaactac agtgagggaa atcttgctgc ctctttgctt gcgaagaaat 2100
ttggggctac tcagtgtact attgctcatg ccttggaaaa aactaagtat ccaaactctg 2160ttggggctac tcagtgtact attgctcatg ccttggaaaa aactaagtat ccaaactctg 2160
accttaattg gaagaagttt gatgacaagt atcatttctc aagtcagttc actgctgatc 2220accttaattg gaagaagttt gatgacaagt atcatttctc aagtcagttc actgctgatc 2220
tctttgccat gaatcacact gatttcatca tcaccagcac tttccaagaa attgctggaa 2280tctttgccat gaatcacact gatttcatca tcaccagcac tttccaagaa attgctggaa 2280
ggtaaaagca aatgcacacc atcatagtat ttcatatttt tacccttgtt tatactattt 2340ggtaaaagca aatgcacacc atcatagtat ttcatattttt tacccttgtt tatactattt 2340
ccattcaccg accccgactt gtttaggatt gagccatagt tgttgttgtt gtttgtttat 2400ccattcaccg accccgactt gtttaggatt gagccatagt tgttgttgtt gtttgtttat 2400
actatttcca tttgccgacc acaacttgtt taggactgag gtatagttgt tgttgttggt 2460actatttcca tttgccgacc acaacttgtt taggactgag gtatagttgt tgttgttggt 2460
ttgttcatat tattttcatt cgctaaccct aacttgtttg ggactgaggc atagtagtag 2520ttgttcatat tattttcatt cgctaaccct aacttgtttg ggactgaggc atagtagtag 2520
tagtagttgt tgctattagt ttatactatt tccatttgcc aaccccaact tgtttggtac 2580tagtagttgt tgctattagt ttatactatt tccatttgcc aaccccaact tgtttggtac 2580
tgagacatag ttgttgttgt tgttgtttgt ttatactatt tccatttgcc gaccccaact 2640tgagacatag ttgttgttgt tgttgtttgt ttatactatt tccatttgcc gaccccaact 2640
tgtttaggac tgaggtatag ttgttgttgt tggtttgttc atattatttt cattcgctaa 2700tgtttaggac tgaggtatag ttgttgttgt tggtttgttc atattatttt cattcgctaa 2700
ccccaacttg tttgggactg aggcatagta gtagtagtag tagttgttgc tattagttta 2760ccccaacttg tttgggactg aggcatagta gtagtagtag tagttgttgc tattagttta 2760
tactatttcc atttgccaac cccaacttgt ttggtactga gacatagttg ttgttgttgt 2820tactatttcc atttgccaac cccaacttgt ttggtactga gacatagttg ttgttgttgt 2820
ttgtttatac tatttcaatt tgtcgacccc aatttgtttg ggaccaaggc atggttgttg 2880ttgtttatac tatttcaatt tgtcgacccc aatttgtttg ggaccaaggc atggttgttg 2880
ttgttgtttg tttgttttta ctgtttccat tgatattgga acatttgtta tttgcagcaa 2940ttgttgtttg tttgttttta ctgtttccat tgatattgga acatttgtta tttgcagcaa 2940
aaacactgta ggacagtatg agagtcatac tgcttttacc atgcctggat tgtaccgagt 3000aaacactgta ggacagtatg agagtcatac tgcttttacc atgcctggat tgtaccgagt 3000
agtccatgga atcgattcgt ttgatccaaa gttcaacatt gtctcccctg gggctgatat 3060agtccatgga atcgattcgt ttgatccaaa gttcaacatt gtctcccctg gggctgatat 3060
gtcaatctac ttcccttaca ctgagaagga gaaaaggcta accaacttcc acccggaaat 3120gtcaatctac ttcccttaca ctgagaagga gaaaaggcta accaacttcc acccggaaat 3120
tgaagaactc ctctacagtc ctgttgagaa taaggaccac ttgttagtct ccttaatttg 31803180
cttttatttc atcccattta tgatcgcttt tatcccaaca gatcgattaa tcatttgtta 32403240
tcaacataaa cagatgtgtg ttgaaggacc ggaacaagcc aattctcttt accatggcaa 3300tcaacataaa cagatgtgtg ttgaaggacc ggaacaagcc aattctcttt accatggcaa 3300
ggctagatcg cgtgaagaat ctaacagggc tcgtggaatg gtatgctaag aatgcaaggc 3360ggctagatcg cgtgaagaat ctaacagggc tcgtggaatg gtatgctaag aatgcaaggc 3360
tgagggagct tgttaacctt gtggttgtag gcggagacag aaggaaagaa tccaaagatt 3420tgagggagct tgttaacctt gtggttgtag gcggagacag aaggaaagaa tccaaagatt 3420
tagaagagca agcagagatg aagaagatgt atgatcttat cgaaacctat aacctgaacg 3480tagagagca agcagagatg aagaagatgt atgatcttat cgaaacctat aacctgaacg 3480
gccaattcag gtggatttct tcccaaatga atcgtgtgag gaacggagaa ctctatcgtt 3540gccaattcag gtggatttct tcccaaatga atcgtgtgag gaacggagaa ctctatcgtt 3540
acattgcaga cacgaggggt gctttcgttc aaccagcatt ctacgaggct tttggtttga 3600acattgcaga cacgaggggt gctttcgttc aaccagcatt ctacgaggct tttggtttga 3600
cagttgtaga gtctatgact tgtggtttgc caacttttgc tacttgtaat ggtggaccat 36603660
ttgagattat agtgaatgga aaatctggtt tccatattga tcctaatcaa ggtgacaagg 3720ttgagattat agtgaatgga aaatctggtt tccatattga tcctaatcaa ggtgacaagg 3720
ctgctgatat gttggtaaat ttctttgaaa aatctaaaga agatccaagt tattgggatg 3780ctgctgatat gttggtaaat ttctttgaaa aatctaaaga agatccaagt tattgggatg 3780
ctatttccaa gggaggtctg caacgtattc ttgaaaagta agcttttgca tttgattagc 3840ctatttccaa gggaggtctg caacgtattc ttgaaaagta agcttttgca tttgattagc 3840
acaagtgcac aaccaagatt taacttttga acaaactaaa actaaccctt ttttgtattt 3900acaagtgcac aaccaagatt taacttttga acaaactaaa actaaccctt ttttgtattt 3900
tcttttgcta ggtatacatg gcaaatttat tcacagaaag tgatcacact atctgggatt 3960tcttttgcta ggtatacatg gcaaatttat tcacagaaag tgatcacact atctgggatt 3960
tatggattct ggaagtatgc aaccaagaat gataaagttg ctagtgcaaa gaagcgctat 4020tatggattct ggaagtatgc aaccaagaat gataaagttg ctagtgcaaa gaagcgctat 4020
cttgagatgt tttatgaact tggatttaag aaatcagtaa gtgtcaattt taaaggggaa 40804080
ccttggatca acggttaagt tgtctttgtg caacctatag gtcaggggtt tgagccgtag 4140ccttggatca acggttaagt tgtctttgtg caacctatag gtcaggggtt tgagccgtag 4140
aagtagccac taatatttac attagggtag actgtgtaca tatcacaccc cttggggtac 4200aagtagccac taatatttac attagggtag actgtgtaca tatcacaccc cttggggtac 4200
ggccctttcc tggatcctgt atgaacgcgg gatgccttgt gcaccgggct gtattttttt 4260ggccctttcc tggatcctgt atgaacgcgg gatgccttgt gcaccggggct gtattttttt 4260
ttttagtgtc acttctgtat tttgtttgag cttgtttata aagtttggaa atctgctgct 4320ttttagtgtc acttctgtat tttgtttgag cttgtttata aagtttggaa atctgctgct 4320
aatttgtata tttgttggtt gtgtatttca ggctgagaaa gttccattgg ctattgatga 4380aatttgtata tttgttggtt gtgtatttca ggctgagaaa gttccattgg ctattgatga 4380
atag 4384atag 4384
<210> 2<210> 2
<211> 803<211> 803
<212> БЕЛОК<212> PROTEIN
<213> Nicotiana tabacum<213> Nicotiana tabacum
<400> 2<400> 2
Met Ala Ala Ser Gly Leu Ser Ile Lys Lys Ser Leu Glu Glu Ser Ile Met Ala Ala Ser Gly Leu Ser Ile Lys Lys Ser Leu Glu Glu Ser Ile
1 5 10 15 1 5 10 15
Leu Ala His Pro Asp Glu Ile Leu Ala Leu Lys Ser Arg Ile Glu Thr Leu Ala His Pro Asp Glu Ile Leu Ala Leu Lys Ser Arg Ile Glu Thr
20 25 30 20 25 30
Glu Gly Lys Gly Val Met Lys Pro Leu Asp Leu Leu Asn His Leu Val Glu Gly Lys Gly Val Met Lys Pro Leu Asp Leu Leu Asn His Leu Val
35 40 45 35 40 45
Ser Val Thr Ser Lys Thr Asn Gly Val Asn Ile Val Pro Ser Ala Leu Ser Val Thr Ser Lys Thr Asn Gly Val Asn Ile Val Pro Ser Ala Leu
50 55 60 50 55 60
Val Glu Val Leu Ser Cys Ser Gln Glu Ala Val Ile Val Pro Pro Lys Val Glu Val Leu Ser Cys Ser Gln Glu Ala Val Ile Val Pro Pro Lys
65 70 75 80 65 70 75 80
Leu Ala Leu Ala Val Arg Pro Arg Pro Gly Val Trp Glu Tyr Leu Ser Leu Ala Leu Ala Val Arg Pro Arg Pro Gly Val Trp Glu Tyr Leu Ser
85 90 95 85 90 95
Leu Asn Leu Lys Thr Lys Lys Val Ala Glu Leu Ser Ile Pro Glu Tyr Leu Asn Leu Lys Thr Lys Lys Val Ala Glu Leu Ser Ile Pro Glu Tyr
100 105 110 100 105 110
Leu Gln Leu Lys Glu Asn Thr Val Asp Glu Ser Gly Asn Ile Leu Glu Leu Gln Leu Lys Glu Asn Thr Val Asp Glu Ser Gly Asn Ile Leu Glu
115 120 125 115 120 125
Leu Asp Phe Glu Pro Phe Thr Thr Val Thr Pro Pro Lys Thr Leu Ser Leu Asp Phe Glu Pro Phe Thr Thr Val Thr Pro Pro Lys Thr Leu Ser
130 135 140 130 135 140
Asp Ser Ile Gly Asn Gly Leu Glu Phe Leu Asn Arg His Ile Ala Ser Asp Ser Ile Gly Asn Gly Leu Glu Phe Leu Asn Arg His Ile Ala Ser
145 150 155 160 145 150 155 160
Lys Met Phe His Asp Lys Glu Ile Ser Arg Cys Leu Leu Asp Phe Leu Lys Met Phe His Asp Lys Glu Ile Ser Arg Cys Leu Leu Asp Phe Leu
165 170 175 165 170 175
Arg Asn His Asn Tyr Lys Gly Lys Ser Leu Met Val Lys Glu Ser Ile Arg Asn His Asn Tyr Lys Gly Lys Ser Leu Met Val Lys Glu Ser Ile
180 185 190 180 185 190
Gln Ser Leu Glu Ser Phe Gln Leu Val Leu Lys Lys Ala Glu Glu His Gln Ser Leu Glu Ser Phe Gln Leu Val Leu Lys Lys Ala Glu Glu His
195 200 205 195 200 205
Leu Cys Thr Leu Asn Pro Glu Thr Pro Tyr Ser Asn Phe Glu Ser Lys Leu Cys Thr Leu Asn Pro Glu Thr Pro Tyr Ser Asn Phe Glu Ser Lys
210 215 220 210 215 220
Phe Glu Glu Ile Gly Leu Glu Arg Gly Trp Gly Asn Thr Ala Glu Arg Phe Glu Glu Ile Gly Leu Glu Arg Gly Trp Gly Asn Thr Ala Glu Arg
225 230 235 240 225 230 235 240
Val Gln Asp Thr Ile Ser His Leu Leu His Leu Leu Glu Ala Pro Asn Val Gln Asp Thr Ile Ser His Leu Leu His Leu Leu Glu Ala Pro Asn
245 250 255 245 250 255
Ala Ser Ser Leu Glu Asn Phe Leu Gly Arg Ile Pro Leu Val Phe Asn Ala Ser Ser Leu Glu Asn Phe Leu Gly Arg Ile Pro Leu Val Phe Asn
260 265 270 260 265 270
Val Val Ile Leu Thr Pro His Gly Tyr Phe Ala Gln Asp Asn Val Leu Val Val Ile Leu Thr Pro His Gly Tyr Phe Ala Gln Asp Asn Val Leu
275 280 285 275 280 285
Gly Tyr Pro Asp Thr Gly Gly Gln Val Val Tyr Ile Leu Asp Gln Val Gly Tyr Pro Asp Thr Gly Gly Gln Val Val Tyr Ile Leu Asp Gln Val
290 295 300 290 295 300
Pro Ala Met Glu Arg Glu Met Leu His Arg Met Lys Leu Gln Gly Leu Pro Ala Met Glu Arg Glu Met Leu His Arg Met Lys Leu Gln Gly Leu
305 310 315 320 305 310 315 320
Asp Asp Ile Ile Pro Arg Ile Leu Val Val Thr Arg Leu Leu Pro Asp Asp Asp Ile Ile Pro Arg Ile Leu Val Val Thr Arg Leu Leu Pro Asp
325 330 335 325 330 335
Ala Val Gly Thr Thr Cys Gly Glu Arg Met Glu Lys Val Tyr Gly Ala Ala Val Gly Thr Thr Cys Gly Glu Arg Met Glu Lys Val Tyr Gly Ala
340 345 350 340 345 350
Glu His Ser His Ile Ile Arg Val Pro Phe Arg Thr Glu Lys Gly Met Glu His Ser His Ile Ile Arg Val Pro Phe Arg Thr Glu Lys Gly Met
355 360 365 355 360 365
Leu Arg Lys Trp Ile Ser Arg Phe Glu Val Trp Pro Tyr Met Glu Thr Leu Arg Lys Trp Ile Ser Arg Phe Glu Val Trp Pro Tyr Met Glu Thr
370 375 380 370 375 380
Phe Thr Glu Asp Val Ala Glu Glu Leu Val Lys Glu Leu Gln Ala Lys Phe Thr Glu Asp Val Ala Glu Glu Leu Val Lys Glu Leu Gln Ala Lys
385 390 395 400 385 390 395 400
Pro Asp Leu Ile Ile Gly Asn Tyr Ser Glu Gly Asn Leu Ala Ala Ser Pro Asp Leu Ile Ile Gly Asn Tyr Ser Glu Gly Asn Leu Ala Ala Ser
405 410 415 405 410 415
Leu Leu Ala Lys Lys Phe Gly Ala Thr Gln Cys Thr Ile Ala His Ala Leu Leu Ala Lys Lys Phe Gly Ala Thr Gln Cys Thr Ile Ala His Ala
420 425 430 420 425 430
Leu Glu Lys Thr Lys Tyr Pro Asn Ser Asp Leu Asn Trp Lys Lys Phe Leu Glu Lys Thr Lys Tyr Pro Asn Ser Asp Leu Asn Trp Lys Lys Phe
435 440 445 435 440 445
Asp Asp Lys Tyr His Phe Ser Ser Gln Phe Thr Ala Asp Leu Phe Ala Asp Asp Lys Tyr His Phe Ser Ser Gln Phe Thr Ala Asp Leu Phe Ala
450 455 460 450 455 460
Met Asn His Thr Asp Phe Ile Ile Thr Ser Thr Phe Gln Glu Ile Ala Met Asn His Thr Asp Phe Ile Ile Thr Ser Thr Phe Gln Glu Ile Ala
465 470 475 480 465 470 475 480
Gly Ser Lys Asn Thr Val Gly Gln Tyr Glu Ser His Thr Ala Phe Thr Gly Ser Lys Asn Thr Val Gly Gln Tyr Glu Ser His Thr Ala Phe Thr
485 490 495 485 490 495
Met Pro Gly Leu Tyr Arg Val Val His Gly Ile Asp Ser Phe Asp Pro Met Pro Gly Leu Tyr Arg Val Val His Gly Ile Asp Ser Phe Asp Pro
500 505 510 500 505 510
Lys Phe Asn Ile Val Ser Pro Gly Ala Asp Met Ser Ile Tyr Phe Pro Lys Phe Asn Ile Val Ser Pro Gly Ala Asp Met Ser Ile Tyr Phe Pro
515 520 525 515 520 525
Tyr Thr Glu Lys Glu Lys Arg Leu Thr Asn Phe His Pro Glu Ile Glu Tyr Thr Glu Lys Glu Lys Arg Leu Thr Asn Phe His Pro Glu Ile Glu
530 535 540 530 535 540
Glu Leu Leu Tyr Ser Pro Val Glu Asn Lys Asp His Leu Cys Val Leu Glu Leu Leu Tyr Ser Pro Val Glu Asn Lys Asp His Leu Cys Val Leu
545 550 555 560 545 550 555 560
Lys Asp Arg Asn Lys Pro Ile Leu Phe Thr Met Ala Arg Leu Asp Arg Lys Asp Arg Asn Lys Pro Ile Leu Phe Thr Met Ala Arg Leu Asp Arg
565 570 575 565 570 575
Val Lys Asn Leu Thr Gly Leu Val Glu Trp Tyr Ala Lys Asn Ala Arg Val Lys Asn Leu Thr Gly Leu Val Glu Trp Tyr Ala Lys Asn Ala Arg
580 585 590 580 585 590
Leu Arg Glu Leu Val Asn Leu Val Val Val Gly Gly Asp Arg Arg Lys Leu Arg Glu Leu Val Asn Leu Val Val Val Gly Gly Asp Arg Arg Lys
595 600 605 595 600 605
Glu Ser Lys Asp Leu Glu Glu Gln Ala Glu Met Lys Lys Met Tyr Asp Glu Ser Lys Asp Leu Glu Glu Gln Ala Glu Met Lys Lys Met Tyr Asp
610 615 620 610 615 620
Leu Ile Glu Thr Tyr Asn Leu Asn Gly Gln Phe Arg Trp Ile Ser Ser Leu Ile Glu Thr Tyr Asn Leu Asn Gly Gln Phe Arg Trp Ile Ser Ser
625 630 635 640 625 630 635 640
Gln Met Asn Arg Val Arg Asn Gly Glu Leu Tyr Arg Tyr Ile Ala Asp Gln Met Asn Arg Val Arg Asn Gly Glu Leu Tyr Arg Tyr Ile Ala Asp
645 650 655 645 650 655
Thr Arg Gly Ala Phe Val Gln Pro Ala Phe Tyr Glu Ala Phe Gly Leu Thr Arg Gly Ala Phe Val Gln Pro Ala Phe Tyr Glu Ala Phe Gly Leu
660 665 670 660 665 670
Thr Val Val Glu Ser Met Thr Cys Gly Leu Pro Thr Phe Ala Thr Cys Thr Val Val Glu Ser Met Thr Cys Gly Leu Pro Thr Phe Ala Thr Cys
675 680 685 675 680 685
Asn Gly Gly Pro Phe Glu Ile Ile Val Asn Gly Lys Ser Gly Phe His Asn Gly Gly Pro Phe Glu Ile Ile Val Asn Gly Lys Ser Gly Phe His
690 695 700 690 695 700
Ile Asp Pro Asn Gln Gly Asp Lys Ala Ala Asp Met Leu Val Asn Phe Ile Asp Pro Asn Gln Gly Asp Lys Ala Ala Asp Met Leu Val Asn Phe
705 710 715 720 705 710 715 720
Phe Glu Lys Ser Lys Glu Asp Pro Ser Tyr Trp Asp Ala Ile Ser Lys Phe Glu Lys Ser Lys Glu Asp Pro Ser Tyr Trp Asp Ala Ile Ser Lys
725 730 735 725 730 735
Gly Gly Leu Gln Arg Ile Leu Glu Lys Tyr Thr Trp Gln Ile Tyr Ser Gly Gly Leu Gln Arg Ile Leu Glu Lys Tyr Thr Trp Gln Ile Tyr Ser
740 745 750 740 745 750
Gln Lys Val Ile Thr Leu Ser Gly Ile Tyr Gly Phe Trp Lys Tyr Ala Gln Lys Val Ile Thr Leu Ser Gly Ile Tyr Gly Phe Trp Lys Tyr Ala
755 760 765 755 760 765
Thr Lys Asn Asp Lys Val Ala Ser Ala Lys Lys Arg Tyr Leu Glu Met Thr Lys Asn Asp Lys Val Ala Ser Ala Lys Lys Arg Tyr Leu Glu Met
770 775 780 770 775 780
Phe Tyr Glu Leu Gly Phe Lys Lys Ser Ala Glu Lys Val Pro Leu Ala Phe Tyr Glu Leu Gly Phe Lys Lys Ser Ala Glu Lys Val Pro Leu Ala
785 790 795 800 785 790 795 800
Ile Asp Glu Ile Asp Glu
<210> 3<210> 3
<211> 3926<211> 3926
<212> ДНК<212> DNA
<213> Nicotiana tabacum<213> Nicotiana tabacum
<400> 3<400> 3
atggcaggca gtggtcttag cattaaggaa agtttggagg aatccatttt ggctcatcca 60atggcaggca gtggtcttag cattaaggaa agtttgggagg aatccatttt ggctcatcca 60
gatgaaattt tggctctcaa gtcaaggtac attactgcat aatgatatta agacctagaa 120gatgaaattt tggctctcaa gtcaaggtac attactgcat aatgatatta agacctagaa 120
gcggatccaa gattttgtta catttttgaa attataagtt tagaatctaa tatttgttat 180gcggatccaa gattttgtta catttttgaa attataagtt tagaatctaa tatttgttat 180
cgcttgtttc cttattatct tgctgttgtt actgcctgtt gctactagtt tctgttcatc 240cgcttgtttc cttattatct tgctgttgtt actgcctgtt gctactagtt tctgttcatc 240
cttccttgag ctgagtttct atcggaaaca acctctctac tctcaaagta ggaataagtt 300cttccttgag ctgagtttct atcggaaaca acctctctac tctcaaagta ggaataagtt 300
atgcgtacac actaccctcc ccagactcca cttgtgtaat ttactgagtt tgttgttgtt 360atgcgtacac actaccctcc ccagactcca cttgtgtaat ttactgagtt tgttgttgtt 360
gttgttgtaa tctaatactt gttagaattt tactgatttt tcacatatat atctatgacc 420gttgttgtaa tctaatactt gttagaattt tactgatttt tcacatatat atctatgacc 420
catgtcgaaa atactatagc tcatgtgcta aatacattag taccattgtt ttgtaattgt 480catgtcgaaa atactatagc tcatgtgcta aatacattag taccattgtt ttgtaattgt 480
tttggttttg gaacaggatt gaaactgaag ggaaaggggt aatgaaacca gttgatctct 540tttggttttg gaacaggatt gaaactgaag ggaaaggggt aatgaaacca gttgatctct 540
tgaaccattt ggtttctgtt actagtaaaa caaatggagt aaatgttgta cctagtgcac 600tgaaccattt ggtttctgtt actagtaaaa caaatggagt aaatgttgta cctagtgcac 600
ttgtggaagt tctcagttgc agccaagaag ctgtgattgt accaccaaaa ctagcactag 660ttgtggaagt tctcagttgc agccaagaag ctgtgattgt accaccaaaa ctagcactag 660
ctgtacgtcc gaggcccggt gtatgggagt acttgtcact gaatcttaag acaaagaaag 720ctgtacgtcc gaggcccggt gtatgggagt acttgtcact gaatcttaag acaaagaaag 720
tggctgaatt gagcattcct gagtaccttc aattgaaaga gaatactgtt gatgaaaggt 780tggctgaatt gagcattcct gagtaccttc aattgaaaga gaatactgtt gatgaaaggt 780
aaagtaatag tctgcgattt cgctttgtga aattgaagtt ttttgtttga ttcttaatgt 840840 aaagtaatag tctgcgattt cgctttgtga
tttgtgtatc aattatgtta ccagtggaaa catcttggag ttggattttg agccatttac 900tttgtgtatc aattatgtta ccagtggaaa catcttggag ttggattttg agccatttac 900
aactgttaca acaccaaaaa cactttctga ctctattggc aatggtttgg agtttcttaa 960aactgttaca acaccaaaaa cactttctga ctctattggc aatggtttgg agtttcttaa 960
tcgccacatt gcttcgaaaa tgtttcttga taaggagatt gccaagtgcc tccttgactt 1020tcgccacatt gcttcgaaaa tgtttcttga taaggagatt gccaagtgcc tccttgactt 1020
tctcagaaac cataactaca aaggaaaggt agtaaaaaaa gtgtttcttt aaacaagttg 10801080
tatgattatg tgtgtatttc taaatatgtc aatttgaaaa cagtcattga tggtgaaaga 11401140
aagcattcaa agcctggaga gtttccaact tgttctgaaa aaagcagagg aatatttgca 1200aagcattcaa agcctggaga gtttccaact tgttctgaaa aaagcagagg aatatttgca 1200
cacactgaat ccagaaactc catactccaa atttgaatcc aagtttgaag agattggctt 1260cacactgaat ccagaaactc catactccaa atttgaatcc aagtttgaag agattggctt 1260
ggaaagaggg tggggaaaca ccgctgaacg cgtgcaagac accattagtc atcttttgca 1320ggaaagaggg tggggaaaca ccgctgaacg cgtgcaagac accattagtc atcttttgca 1320
tctccttgag gctcctaacg cgtcttcctt ggaaaatttc cttggtagaa tcccattggt 1380tctccttgag gctcctaacg cgtcttcctt ggaaaatttc cttggtagaa tcccattggt 1380
tttcaatgtt gtgattctca ccccacatgg ttattttgct caagataatg tcttgggcta 1440tttcaatgtt gtgattctca ccccacatgg ttatttttgct caagataatg tcttgggcta 1440
tcctgacact ggtggccagg tttgtgtccg atataacata tcaagaaatt ttgcattctt 1500tcctgacact ggtggccagg tttgtgtccg atataacata tcaagaaatt ttgcattctt 1500
gatcatgttc tttataccat ttgaaccaac attctttttt tggttgtgaa atgttgaata 15601560
ggttgtttac attcttgatc aagttccagc tatggagcgt gagatgcttc atcgtatgaa 1620ggttgtttac attcttgatc aagttccagc tatggagcgt gagatgcttc atcgtatgaa 1620
gcttcaagga ctcgacgata tcatccctcg catccttgtt gtaagtgccc ttaattttcc 1680gcttcaagga ctcgacgata tcatccctcg catccttgtt gtaagtgccc ttaattttcc 1680
tggtttggtt tacctctaaa tgaaattgat tttctggctt tctaactttt ttggattgat 17401740
ctttttgttg ttttatatca ggtaactagg ctgctgcctg atgctgtagg aaccacttgt 1800ctttttgttg ttttatatca ggtaactagg ctgctgcctg atgctgtagg aaccacttgt 1800
ggcgagtgga tggagaaagt atatggggca gaacattctc atataattcg tgttccattt 1860ggcgagtgga tggagaaagt atatggggca gaacattctc atataattcg tgttccattt 1860
agaactgaga aaggaatgtt gcgcaaatgg atctcacgat tcgaagtctg gccatacatg 1920agaactgaga aaggaatgtt gcgcaaatgg atctcacgat tcgaagtctg gccatacatg 1920
gaaactttca ctgaggttgg aacataaaaa caaataaaaa tcattggaat gttcttctgc 1980gaaactttca ctgaggttgg aacataaaaa caaataaaaa tcattggaat gttcttctgc 1980
atttgaaaat gtcttgctaa ctaaagactc atttttaaat taatcatcag gatgttgcag 2040atttgaaaat gtcttgctaa ctaaagactc atttttaaat taatcatcag gatgttgcag 2040
aagaacttgt caaagaattg caagctaaac cagacttgat aattggaaac tacagtgagg 2100aagaacttgt caaagaattg caagctaaac cagacttgat aattggaaac tacagtgagg 2100
gaaatcttgc tgcctcattg cttgctaaga aatttggggc tactcagtgt actattgctc 2160gaaatcttgc tgcctcattg cttgctaaga aatttggggc tactcagtgt actattgctc 2160
atgccttgga aaaaactaag tatccaaact ctgaccttaa ttggaagaag tttgatgaca 2220atgccttgga aaaaactaag tatccaaact ctgaccttaa ttggaagaag tttgatgaca 2220
agtatcattt ctcaagtcag ttcactgctg atctttttgc catgaatcac actgatttca 2280agtatcattt ctcaagtcag ttcactgctg atctttttgc catgaatcac actgatttca 2280
ttatcaccag cactttccaa gaaattgctg gaaggtaaaa gcaaatgcac accatcatag 2340ttatcaccag cactttccaa gaaattgctg gaaggtaaaa gcaaatgcac accatcatag 2340
tatttcatat ttttacccta gtttatacta tttccatttg tcaactccaa cttgtttggg 2400tatttcatat ttttacccta gtttatacta tttccatttg tcaactccaa cttgtttggg 2400
attgaaccat agttgttgtt tgtttatact atttccattc gccgacccca acttatttgg 2460attgaaccat agttgttgtt tgtttatact atttccattc gccgacccca acttatttgg 2460
gactgagaca taattgttgt tattattgtt tgtttgttta tactatttcc attctcagac 2520gactgagaca taattgttgt tattattgtt tgtttgttta tactatttcc attctcagac 2520
cccaacttct ttgggactga gccgtagatt gttgttgttg ttgttgttgt tgtttgttta 25802580
tgctatttcc gttcaccgac cccaacttat ttgggactga ggtgtagaag tagtcgttgt 2640tgctatttcc gttcaccgac cccaacttat ttgggactga ggtgtagaag tagtcgttgt 2640
tgtttgttta tacgacttcc aattgatatt cgaatgtttt tatttttgca gcaagaacac 2700tgtttgttta tacgacttcc aattgatatt cgaatgtttt tatttttgca gcaagaacac 2700
tgtaggacag tatgagagtc atactgcttt taccatgcct ggattgtatc gagtagtcca 2760tgtaggacag tatgagagtc atactgcttt taccatgcct ggattgtatc gagtagtcca 2760
tggaatcaat tcgtttgatc caaagttcaa cattgtctcc cctggggctg atatgtcaat 2820tggaatcaat tcgtttgatc caaagttcaa cattgtctcc cctggggctg atatgtcaat 2820
ctacttccct tacactgaga aggagaaaag actaaccaac ttccacccgg aaattgaaga 2880ctacttccct tacactgaga aggagaaaag actaaccaac ttccacccgg aaattgaaga 2880
actcctctac agtcctgttg agaataagga ccacttgtta gtcttcttta tttcattcat 2940actcctctac agtcctgttg agaataagga ccacttgtta gtcttcttta tttcattcat 2940
ttttctacac cttttttttc aacagattga ttgattggtt cttatcaacg taaacagatg 3000ttttctacac cttttttttc aacagattga ttgattggtt cttatcaacg taaacagatg 3000
tgtgttgaag gaccagaaca agccaattct ctttaccatg gcaaggctag atcgcgtgaa 3060tgtgttgaag gaccagaaca agccaattct ctttaccatg gcaaggctag atcgcgtgaa 3060
gaatctaaca gggctcgtgg aatggtatgc aaagaatgca aggctaaggg agctcgttaa 3120gaatctaaca gggctcgtgg aatggtatgc aaagaatgca aggctaaggg agctcgttaa 3120
ccttgtggtt gtaggcggag acagaaggaa agaatccaaa gatttagaag agcaagcaga 3180ccttgtggtt gtaggcggag acagaaggaa agaatccaaa gatttagaag agcaagcaga 3180
gatgaagaag atgtatgatc ttatcgaaac atacaacctg aatggccaat tcaggtggat 3240gatgaagaag atgtatgatc ttatcgaaac atacaacctg aatggccaat tcaggtggat 3240
ttcttcccaa atgaatcgtg tgaggaacgg agaactttat cgatacattg cagacacgag 3300ttcttcccaa atgaatcgtg tgaggaacgg agaactttat cgatacattg cagacacgag 3300
gggtgctttc gttcaaccag cattttatga ggcatttggt ttgacagttg ttgagtctat 3360gggtgctttc gttcaaccag cattttatga ggcatttggt ttgacagttg ttgagtctat 3360
gacttgtggt ttgccaactt ttgctacttg taatggtgga ccatttgaga ttatagtgaa 34203420
tggaaaatct ggtttccata ttgatcctaa tcaaggtgac aaggctgctg atatgttggt 3480tggaaaatct ggtttccata ttgatcctaa tcaaggtgac aaggctgctg atatgttggt 3480
taatttcttc gaaaaatcta aagaagatcc aagttattgg gatactattt ccaagggtgg 3540taatttcttc gaaaaatcta aagaagatcc aagttattgg gatactattt ccaagggtgg 3540
tctgcagcgt attcttgaaa agtaagcttt tgcatttgat tagcacaagt gtacaaccaa 3600tctgcagcgt attcttgaaa agtaagcttt tgcatttgat tagcacaagt gtacaaccaa 3600
gatttaactt atgaacaaac taaaactaac ccttttttta ttttcttttg ctaggtatac 3660gatttaacttatgaacaaac taaaactaac
atggcaaatt tattcacaga aagtgatcac attatctggg atttatggat tctggaaata 37203720
tgcaaccaag aatgacaaag ttgctagtgc gaagaagcgc tatcttgaaa tgttttatga 37803780
atttgggttt aagaaatcag taagtgtcac ttctgtattt tgtttgagct tgtttgtaaa 3840atttgggttt aagaaatcag taagtgtcac ttctgtattt tgtttgagct tgtttgtaaa 3840
gtttggcaat cttctgctaa tttgtactat atttgttgac ttgtgcattt caggctgaga 3900gtttggcaat cttctgctaa tttgtactat atttgttgac ttgtgcattt caggctgaga 3900
aagttccatt ggctattgat gaatag 3926aagttccatt ggctattgat gaatag 3926
<210> 4<210> 4
<211> 803<211> 803
<212> БЕЛОК<212> PROTEIN
<213> Nicotiana tabacum<213> Nicotiana tabacum
<400> 4<400> 4
Met Ala Gly Ser Gly Leu Ser Ile Lys Glu Ser Leu Glu Glu Ser Ile Met Ala Gly Ser Gly Leu Ser Ile Lys Glu Ser Leu Glu Glu Ser Ile
1 5 10 15 1 5 10 15
Leu Ala His Pro Asp Glu Ile Leu Ala Leu Lys Ser Arg Ile Glu Thr Leu Ala His Pro Asp Glu Ile Leu Ala Leu Lys Ser Arg Ile Glu Thr
20 25 30 20 25 30
Glu Gly Lys Gly Val Met Lys Pro Val Asp Leu Leu Asn His Leu Val Glu Gly Lys Gly Val Met Lys Pro Val Asp Leu Leu Asn His Leu Val
35 40 45 35 40 45
Ser Val Thr Ser Lys Thr Asn Gly Val Asn Val Val Pro Ser Ala Leu Ser Val Thr Ser Lys Thr Asn Gly Val Asn Val Val Pro Ser Ala Leu
50 55 60 50 55 60
Val Glu Val Leu Ser Cys Ser Gln Glu Ala Val Ile Val Pro Pro Lys Val Glu Val Leu Ser Cys Ser Gln Glu Ala Val Ile Val Pro Pro Lys
65 70 75 80 65 70 75 80
Leu Ala Leu Ala Val Arg Pro Arg Pro Gly Val Trp Glu Tyr Leu Ser Leu Ala Leu Ala Val Arg Pro Arg Pro Gly Val Trp Glu Tyr Leu Ser
85 90 95 85 90 95
Leu Asn Leu Lys Thr Lys Lys Val Ala Glu Leu Ser Ile Pro Glu Tyr Leu Asn Leu Lys Thr Lys Lys Val Ala Glu Leu Ser Ile Pro Glu Tyr
100 105 110 100 105 110
Leu Gln Leu Lys Glu Asn Thr Val Asp Glu Ser Gly Asn Ile Leu Glu Leu Gln Leu Lys Glu Asn Thr Val Asp Glu Ser Gly Asn Ile Leu Glu
115 120 125 115 120 125
Leu Asp Phe Glu Pro Phe Thr Thr Val Thr Thr Pro Lys Thr Leu Ser Leu Asp Phe Glu Pro Phe Thr Thr Val Thr Thr Pro Lys Thr Leu Ser
130 135 140 130 135 140
Asp Ser Ile Gly Asn Gly Leu Glu Phe Leu Asn Arg His Ile Ala Ser Asp Ser Ile Gly Asn Gly Leu Glu Phe Leu Asn Arg His Ile Ala Ser
145 150 155 160 145 150 155 160
Lys Met Phe Leu Asp Lys Glu Ile Ala Lys Cys Leu Leu Asp Phe Leu Lys Met Phe Leu Asp Lys Glu Ile Ala Lys Cys Leu Leu Asp Phe Leu
165 170 175 165 170 175
Arg Asn His Asn Tyr Lys Gly Lys Ser Leu Met Val Lys Glu Ser Ile Arg Asn His Asn Tyr Lys Gly Lys Ser Leu Met Val Lys Glu Ser Ile
180 185 190 180 185 190
Gln Ser Leu Glu Ser Phe Gln Leu Val Leu Lys Lys Ala Glu Glu Tyr Gln Ser Leu Glu Ser Phe Gln Leu Val Leu Lys Lys Ala Glu Glu Tyr
195 200 205 195 200 205
Leu His Thr Leu Asn Pro Glu Thr Pro Tyr Ser Lys Phe Glu Ser Lys Leu His Thr Leu Asn Pro Glu Thr Pro Tyr Ser Lys Phe Glu Ser Lys
210 215 220 210 215 220
Phe Glu Glu Ile Gly Leu Glu Arg Gly Trp Gly Asn Thr Ala Glu Arg Phe Glu Glu Ile Gly Leu Glu Arg Gly Trp Gly Asn Thr Ala Glu Arg
225 230 235 240 225 230 235 240
Val Gln Asp Thr Ile Ser His Leu Leu His Leu Leu Glu Ala Pro Asn Val Gln Asp Thr Ile Ser His Leu Leu His Leu Leu Glu Ala Pro Asn
245 250 255 245 250 255
Ala Ser Ser Leu Glu Asn Phe Leu Gly Arg Ile Pro Leu Val Phe Asn Ala Ser Ser Leu Glu Asn Phe Leu Gly Arg Ile Pro Leu Val Phe Asn
260 265 270 260 265 270
Val Val Ile Leu Thr Pro His Gly Tyr Phe Ala Gln Asp Asn Val Leu Val Val Ile Leu Thr Pro His Gly Tyr Phe Ala Gln Asp Asn Val Leu
275 280 285 275 280 285
Gly Tyr Pro Asp Thr Gly Gly Gln Val Val Tyr Ile Leu Asp Gln Val Gly Tyr Pro Asp Thr Gly Gly Gln Val Val Tyr Ile Leu Asp Gln Val
290 295 300 290 295 300
Pro Ala Met Glu Arg Glu Met Leu His Arg Met Lys Leu Gln Gly Leu Pro Ala Met Glu Arg Glu Met Leu His Arg Met Lys Leu Gln Gly Leu
305 310 315 320 305 310 315 320
Asp Asp Ile Ile Pro Arg Ile Leu Val Val Thr Arg Leu Leu Pro Asp Asp Asp Ile Ile Pro Arg Ile Leu Val Val Thr Arg Leu Leu Pro Asp
325 330 335 325 330 335
Ala Val Gly Thr Thr Cys Gly Glu Trp Met Glu Lys Val Tyr Gly Ala Ala Val Gly Thr Thr Cys Gly Glu Trp Met Glu Lys Val Tyr Gly Ala
340 345 350 340 345 350
Glu His Ser His Ile Ile Arg Val Pro Phe Arg Thr Glu Lys Gly Met Glu His Ser His Ile Ile Arg Val Pro Phe Arg Thr Glu Lys Gly Met
355 360 365 355 360 365
Leu Arg Lys Trp Ile Ser Arg Phe Glu Val Trp Pro Tyr Met Glu Thr Leu Arg Lys Trp Ile Ser Arg Phe Glu Val Trp Pro Tyr Met Glu Thr
370 375 380 370 375 380
Phe Thr Glu Asp Val Ala Glu Glu Leu Val Lys Glu Leu Gln Ala Lys Phe Thr Glu Asp Val Ala Glu Glu Leu Val Lys Glu Leu Gln Ala Lys
385 390 395 400 385 390 395 400
Pro Asp Leu Ile Ile Gly Asn Tyr Ser Glu Gly Asn Leu Ala Ala Ser Pro Asp Leu Ile Ile Gly Asn Tyr Ser Glu Gly Asn Leu Ala Ala Ser
405 410 415 405 410 415
Leu Leu Ala Lys Lys Phe Gly Ala Thr Gln Cys Thr Ile Ala His Ala Leu Leu Ala Lys Lys Phe Gly Ala Thr Gln Cys Thr Ile Ala His Ala
420 425 430 420 425 430
Leu Glu Lys Thr Lys Tyr Pro Asn Ser Asp Leu Asn Trp Lys Lys Phe Leu Glu Lys Thr Lys Tyr Pro Asn Ser Asp Leu Asn Trp Lys Lys Phe
435 440 445 435 440 445
Asp Asp Lys Tyr His Phe Ser Ser Gln Phe Thr Ala Asp Leu Phe Ala Asp Asp Lys Tyr His Phe Ser Ser Gln Phe Thr Ala Asp Leu Phe Ala
450 455 460 450 455 460
Met Asn His Thr Asp Phe Ile Ile Thr Ser Thr Phe Gln Glu Ile Ala Met Asn His Thr Asp Phe Ile Ile Thr Ser Thr Phe Gln Glu Ile Ala
465 470 475 480 465 470 475 480
Gly Ser Lys Asn Thr Val Gly Gln Tyr Glu Ser His Thr Ala Phe Thr Gly Ser Lys Asn Thr Val Gly Gln Tyr Glu Ser His Thr Ala Phe Thr
485 490 495 485 490 495
Met Pro Gly Leu Tyr Arg Val Val His Gly Ile Asn Ser Phe Asp Pro Met Pro Gly Leu Tyr Arg Val Val His Gly Ile Asn Ser Phe Asp Pro
500 505 510 500 505 510
Lys Phe Asn Ile Val Ser Pro Gly Ala Asp Met Ser Ile Tyr Phe Pro Lys Phe Asn Ile Val Ser Pro Gly Ala Asp Met Ser Ile Tyr Phe Pro
515 520 525 515 520 525
Tyr Thr Glu Lys Glu Lys Arg Leu Thr Asn Phe His Pro Glu Ile Glu Tyr Thr Glu Lys Glu Lys Arg Leu Thr Asn Phe His Pro Glu Ile Glu
530 535 540 530 535 540
Glu Leu Leu Tyr Ser Pro Val Glu Asn Lys Asp His Leu Cys Val Leu Glu Leu Leu Tyr Ser Pro Val Glu Asn Lys Asp His Leu Cys Val Leu
545 550 555 560 545 550 555 560
Lys Asp Gln Asn Lys Pro Ile Leu Phe Thr Met Ala Arg Leu Asp Arg Lys Asp Gln Asn Lys Pro Ile Leu Phe Thr Met Ala Arg Leu Asp Arg
565 570 575 565 570 575
Val Lys Asn Leu Thr Gly Leu Val Glu Trp Tyr Ala Lys Asn Ala Arg Val Lys Asn Leu Thr Gly Leu Val Glu Trp Tyr Ala Lys Asn Ala Arg
580 585 590 580 585 590
Leu Arg Glu Leu Val Asn Leu Val Val Val Gly Gly Asp Arg Arg Lys Leu Arg Glu Leu Val Asn Leu Val Val Val Gly Gly Asp Arg Arg Lys
595 600 605 595 600 605
Glu Ser Lys Asp Leu Glu Glu Gln Ala Glu Met Lys Lys Met Tyr Asp Glu Ser Lys Asp Leu Glu Glu Gln Ala Glu Met Lys Lys Met Tyr Asp
610 615 620 610 615 620
Leu Ile Glu Thr Tyr Asn Leu Asn Gly Gln Phe Arg Trp Ile Ser Ser Leu Ile Glu Thr Tyr Asn Leu Asn Gly Gln Phe Arg Trp Ile Ser Ser
625 630 635 640 625 630 635 640
Gln Met Asn Arg Val Arg Asn Gly Glu Leu Tyr Arg Tyr Ile Ala Asp Gln Met Asn Arg Val Arg Asn Gly Glu Leu Tyr Arg Tyr Ile Ala Asp
645 650 655 645 650 655
Thr Arg Gly Ala Phe Val Gln Pro Ala Phe Tyr Glu Ala Phe Gly Leu Thr Arg Gly Ala Phe Val Gln Pro Ala Phe Tyr Glu Ala Phe Gly Leu
660 665 670 660 665 670
Thr Val Val Glu Ser Met Thr Cys Gly Leu Pro Thr Phe Ala Thr Cys Thr Val Val Glu Ser Met Thr Cys Gly Leu Pro Thr Phe Ala Thr Cys
675 680 685 675 680 685
Asn Gly Gly Pro Phe Glu Ile Ile Val Asn Gly Lys Ser Gly Phe His Asn Gly Gly Pro Phe Glu Ile Ile Val Asn Gly Lys Ser Gly Phe His
690 695 700 690 695 700
Ile Asp Pro Asn Gln Gly Asp Lys Ala Ala Asp Met Leu Val Asn Phe Ile Asp Pro Asn Gln Gly Asp Lys Ala Ala Asp Met Leu Val Asn Phe
705 710 715 720 705 710 715 720
Phe Glu Lys Ser Lys Glu Asp Pro Ser Tyr Trp Asp Thr Ile Ser Lys Phe Glu Lys Ser Lys Glu Asp Pro Ser Tyr Trp Asp Thr Ile Ser Lys
725 730 735 725 730 735
Gly Gly Leu Gln Arg Ile Leu Glu Lys Tyr Thr Trp Gln Ile Tyr Ser Gly Gly Leu Gln Arg Ile Leu Glu Lys Tyr Thr Trp Gln Ile Tyr Ser
740 745 750 740 745 750
Gln Lys Val Ile Thr Leu Ser Gly Ile Tyr Gly Phe Trp Lys Tyr Ala Gln Lys Val Ile Thr Leu Ser Gly Ile Tyr Gly Phe Trp Lys Tyr Ala
755 760 765 755 760 765
Thr Lys Asn Asp Lys Val Ala Ser Ala Lys Lys Arg Tyr Leu Glu Met Thr Lys Asn Asp Lys Val Ala Ser Ala Lys Lys Arg Tyr Leu Glu Met
770 775 780 770 775 780
Phe Tyr Glu Phe Gly Phe Lys Lys Ser Ala Glu Lys Val Pro Leu Ala Phe Tyr Glu Phe Gly Phe Lys Lys Ser Ala Glu Lys Val Pro Leu Ala
785 790 795 800 785 790 795 800
Ile Asp Glu Ile Asp Glu
<210> 5<210> 5
<211> 4532<211> 4532
<212> ДНК<212> DNA
<213> Nicotiana tabacum<213> Nicotiana tabacum
<400> 5<400> 5
atggctgaac gtgctctgac tcgtgttcac agccttcgtg aacgtcttga tgccactttg 60atggctgaac gtgctctgac tcgtgttcac agccttcgtg aacgtcttga tgccactttg 60
gctgcacatc gcaatgagat attgctgttt ctttcaaggt attgcctaag tagtgttctt 120gctgcacatc gcaatgagat attgctgttt ctttcaaggt attgcctaag tagtgttctt 120
gtttcctaca aaagattcag ttggtgttca aaaaacgata tgtgatttga tttatctgcc 180gtttcctaca aaagattcag ttggtgttca aaaaacgata tgtgatttga tttatctgcc 180
taagtcttgg tagtcataat tatccggtac ctgtgctggt gcgagttagc tggttcggaa 240taagtcttgg tagtcataat tatccggtac ctgtgctggt gcgagttagc tggttcggaa 240
actactctta tgaaaacgag agatttagtt ggtgttgtct gcaattctgt agtatggact 300actactctta tgaaaacgag agatttagtt ggtgttgtct gcaattctgt agtatggact 300
attaagcaga tagatcatgt ttgatatcga aaaggaatgt atatgtgatg ttacttgaac 360attaagcaga tagatcatgt ttgatatcga aaaggaatgt atatgtgatg ttacttgaac 360
tggttttggt tattacagga ttgaaagcca tggaaaaggg atcttgaaac ctcaccagct 420tggttttgggt tattacagga ttgaaagcca tggaaaaggg atcttgaaac ctcaccagct 420
attggctgag ttcgatgcaa ttcgccaaga tgacaaaaag aagctgaatg atcatgcatt 480attggctgag ttcgatgcaa ttcgccaaga tgacaaaaag aagctgaatg atcatgcatt 480
tgaagaactc ctgaaatcta ctcaggtaat tttgattttg gctaaatgtg ttaccaagct 540tgaagaactc ctgaaatcta ctcaggtaat tttgattttg gctaaatgtg ttaccaagct 540
gaatgatcat gcatttgagt ttgtgtccga ctactacaat gatatgttat accaggaagc 600gaatgatcat gcatttgagt ttgtgtccga ctactacaat gatatgttat accaggaagc 600
gattgttctg ccaccttggg ttgcacttgc cattcgtttg aggcctggtg tgtgggaata 660660
tgtccgtgtg aatgttaatg ctctagtcgt tgaggagctg accgtccctg agtatttgca 720tgtccgtgtg aatgttaatg ctctagtcgt tgaggagctg accgtccctg agtatttgca 720
ttttaaggaa gaacttgttg atggaacgta agttttagtc tcttatttga tactatgtta 780ttttaaggaa gaacttgttg atggaacgta agttttagtc tcttatttga tactatgtta 780
gagaataggc agtggattca atttatcagt gttgtttttt acctaatgca gctccaatgg 840gagaataggc agtggattca atttatcagt gttgtttttt acctaatgca gctccaatgg 840
aaatttcgtt ctcgagttgg attttgagcc cttcactgca tcctttccta aaccgaccct 900aaatttcgtt ctcgagttgg attttgagcc cttcactgca tcctttccta aaccgaccct 900
caccaaatct attgggaatg gagttgaatt cctcaatagg cacctttctg cgaaaatgtt 960caccaaatct attgggaatg gagttgaatt cctcaatagg cacctttctg cgaaaatgtt 960
ccatgacaag gaaagcatga ccccgcttct tgaatttctt cgggttcaca attataaggg 1020ccatgacaag gaaagcatga ccccgcttct tgaatttctt cgggttcaca attataaggg 1020
caaggtaact ttgttattcc cattcatata tatgttcagt ttgtgcttat catgcgccca 1080caaggtaact ttgttattcc cattcatata tatgttcagt ttgtgcttat catgcgccca 1080
atgatgtatg aatatgtact aaaggataga tgtacgattt cgtttgcaga caatgatgct 11401140
gaatgacaga atacagaatt taaccactct gcaaaatgtc ctaaggaagg cagaggaata 1200gaatgacaga atacagaatt taaccactct gcaaaatgtc ctaaggaagg cagaggaata 1200
ccttattatg cttccccctg aaactccatt ttccgaattc gaacacaagt tccaagaaat 1260ccttattatg cttccccctg aaactccatt ttccgaattc gaacacaagt tccaagaaat 1260
tggattggag aagggatggg gcgacactgc ggagcgcgtg ctagagatga tatgcatgct 1320tggattggag aagggatggg gcgacactgc ggagcgcgtg ctagagatga tatgcatgct 1320
tcttgatcta cttgaggctc ccgactcctg tactcttgag aagttcctag ggagaattcc 1380tcttgatcta cttgaggctc ccgactcctg tactcttgag aagttcctag ggagaattcc 1380
tatggtgttc aacgtggtta tcctttcccc ccatggatat ttcgcccagg aaaatgtctt 1440tatggtgttc aacgtggtta tccttttcccc ccatggatat ttcgcccagg aaaatgtctt 1440
gggttatccc gacactggtg gccaggtgca ttactttagt ctttgtccgt gagtctatgt 1500gggttatccc gacactggtg gccaggtgca ttactttagt ctttgtccgt gagtctatgt 1500
tgctcagatc ctctacaatg ccactgtacc cgtgtaggat actccaaata taatgcattt 1560tgctcagatc ctctacaatg ccactgtacc cgtgtaggat actccaaata taatgcattt 1560
ttggaggatc tgtcaccggt gcaatggcat tttggaggtc ggagcaacaa acaactgcta 1620ttggaggatc tgtcaccggt gcaatggcat tttggaggtc ggagcaacaa acaactgcta 1620
gtatgcttct aaagcttgct tccataaatg ctaaggtcct tcacccgtaa tgtgcaggtt 1680gtatgcttct aaagcttgct tccataaatg ctaaggtcct tcacccgtaa tgtgcaggtt 1680
gtctacatat tagatcaagt tccagccttg gagcgtgaaa tgcttaaacg cctaaaggag 1740gtctacatat tagatcaagt tccagccttg gagcgtgaaa tgcttaaacg cctaaaggag 1740
caaggacttg atataacacc gcgtattctt attgttagta tttcttgtac ttgtaattgc 1800caaggacttg atataacacc gcgtattctt attgttagta tttcttgtac ttgtaattgc 1800
tgcggattac acaaaatttt ctctttattg gcaacttatc ttgatattat tcccaggtta 1860tgcggattac acaaaatttt ctctttattg gcaacttatc ttgatattat tcccaggtta 1860
ctcgtctgct gcctgatgca gttggaacaa cttgtggtca gcggcttgag aaggtgtatg 1920ctcgtctgct gcctgatgca gttggaacaa cttgtggtca gcggcttgag aaggtgtatg 1920
gagccgagca ctcacatatt cttagggtcc cctttaggac cgagaagggc attgttcgca 1980gagccgagca ctcacatatt cttagggtcc cctttaggac cgagaagggc attgttcgca 1980
aatggatatc tcgctttgaa gtgtggccat acatggagac tttcactgag gtgacactaa 2040aatggatatc tcgctttgaa gtgtggccat acatggagac tttcactgag gtgacactaa 2040
gcttccttgt atttgtctat cttctaattg gtattaggaa caatttgcta attattaacg 2100gcttccttgt atttgtctat cttctaattg gtattaggaa caatttgcta attattaacg 2100
ctttggcttt tcgtacatca ggatgttgca aaagaacttg ctgcagaact gcaggccaag 2160ctttggcttt tcgtacatca ggatgttgca aaagaacttg ctgcagaact gcaggccaag 2160
ccagatttga taattggcaa ctatagcgag ggaaatcttg tggcttcatt gctggctcac 2220ccagatttga taattggcaa ctatagcgag ggaaatcttg tggcttcatt gctggctcac 2220
aagttaggcg taacgcaggt ctgtgttatt tttcacctct tataaatctg attgtatttc 2280aagttaggcg taacgcaggt ctgtgttatt tttcacctct tataaatctg attgtatttc 2280
cattagtctg gaactaaaag tactaaaatt ttcttttctt cgctgtgtta tttgccttct 2340cattagtctg gaactaaaag tactaaaatt ttcttttctt cgctgtgtta tttgccttct 2340
gcagtgcacc attgcccatg cattggagaa aacaaagtat cctgattctg acatctactg 2400gcagtgcacc attgcccatg cattggagaa aacaaagtat cctgattctg acatctactg 2400
gaaaaaattt gacgaaaaat accatttctc gtcccagttt accgctgatc ttattgcaat 2460gaaaaaattt gacgaaaaat accatttctc gtcccagttt accgctgatc ttattgcaat 2460
gaatcacacc gattttatca tcaccagcac tttccaggag atagcaggaa ggtataacat 25202520
caattgctaa ttcggttgca gtaacatttt gttcgatttc ttccccttat gcttaaccta 2580caattgctaa ttcggttgca gtaacatttt gttcgatttc ttccccttat gcttaaccta 2580
ataccctaat gaattttcca gcaaggacac tgtcggacag tacgagagtc accaggcatt 2640ataccctaat gaattttcca gcaaggacac tgtcggacag tacgagagtc accaggcatt 2640
cacaatgcct ggattgtaca gagtcgttca cggcattgat gtgttcgatc ccaaattcaa 2700cacaatgcct ggattgtaca gagtcgttca cggcattgat gtgttcgatc ccaaattcaa 2700
cattgtctca cctggagctg atataaacct gtatttccca tattccgaga aggaaaagag 2760cattgtctca cctggagctg atataaacct gtatttccca tattccgaga aggaaaagag 2760
attgacagca cttcacccag aaattgagga gcttctgtac agtgatgttg agaacgagga 2820attgacagca cttcacccag aaattgagga gcttctgtac agtgatgttg agaacgagga 2820
acatctgtaa gtttctaact tactcgtacc gtcagtggca gagccagaat tttcattaaa 2880acatctgtaa gtttctaact tactcgtacc gtcagtggca gagccagaat tttcattaaa 2880
atggggtcaa aatataaaga cataaattca caaagaagcc aaggggtgtc aatatgtagt 2940atggggtcaa aatataaaga cataaattca caaagaagcc aaggggtgtc aatatgtagt 2940
ataaatatat taaaaaaatt acctagctac acaatgtaat tttccgacaa aggggtatcg 3000ataaatatat taaaaaaatt acctagctac acaatgtaat ttttccgacaa aggggtatcg 3000
gttgcacttc ttgaatacat gtggctctgc cactgggtac agttacaaag tcctgttacc 3060gttgcacttc ttgaatacat gtggctctgc cactgggtac agttacaaag tcctgttacc 3060
tatgtagatg agcttgtgct gaacatgttg tgattttggt aggtgtgtgc taaaggacag 31203120
gaataagcca atcttattca caatggcgag attggatcgt gtgaagaact taaccggact 3180gaataagcca atcttattca caatggcgag attggatcgt gtgaagaact taaccggact 3180
tgttgagtgg tacgccaaga acgcacggct aagggagttg gttaaccttg ttgtcgttgg 3240tgttgagtgg tacgccaaga acgcacggct aagggagttg gttaaccttg ttgtcgttgg 3240
tggagaccga aggaaggaat ccaaagattt ggaagagcaa gcagagatga agaagatgta 33003300
tgagctaata aagactcaca acttaaatgg ccaattcaga tggatttctt cacagatgaa 3360tgagctaata aagactcaca acttaaatgg ccaattcaga tggatttctt cacagatgaa 3360
ccgagtaagg aacggcgaac tctaccgata cattgccgac actaggggag ctttcgtgca 3420ccgagtaagg aacggcgaac tctaccgata cattgccgac actaggggag ctttcgtgca 3420
gcctgcattc tatgaggctt tcggtttgac tgttgttgag gccatgacct gtggtttgcc 3480gcctgcattc tatgaggctt tcggtttgac tgttgttgag gccatgacct gtggtttgcc 3480
tacatttgca actaatcatg gcggtccagc tgagatcatc gttaacggaa aatccggctt 3540tacatttgca actaatcatg gcggtccagc tgagatcatc gttaacggaa aatccggctt 3540
ccatatcgat ccatatcacg gtgagcaagc tgctgatctg ctagctgatt tctttgagaa 3600ccatatcgat ccatatcacg gtgagcaagc tgctgatctg ctagctgatt tctttgagaa 3600
atgtaagacg gaaccttctc attgggaaac tatttcaacc ggtggcctga agcgcatcca 36603660
agagaagtaa gcaactcttt cttgactcta gtcattcaaa ttaacttggg atttgaggca 3720agagaagtaa gcaactcttt cttgactcta gtcattcaaa ttaacttggg atttgaggca 3720
tagttgattg ataatttatc gcgtctctac tactatatac aggtacacgt ggcaaatcta 3780tagttgattg ataatttatc gcgtctctac tactatatac aggtacacgt ggcaaatcta 3780
ctcggagaga ttattgacgt tggctgctgt ttacggtttc tggaaacatg tttctaagct 38403840
tgatcgtcta gaaatccgtc gatatctaga aatgttttat gctctcaaat accggaagat 3900tgatcgtcta gaaatccgtc gatatctaga aatgttttat gctctcaaat accggaagat 3900
ggtgagttct tctgcttcct gctcttctca tagtgtttaa tatacacttg attgattgca 3960ggtgagttct tctgcttcct gctcttctca tagtgtttaa tatacacttg attgattgca 3960
ttcacttaga ctaagttgct cggacacggg tgtggatgtc cgacacgagt gcggatctag 4020ttcacttaga ctaagttgct cggacacggg tgtggatgtc cgacacgagt gcggatctag 4020
agttcagatc cttcaagatg taaattataa gattcgggga tatggatcct agtacggata 40804080
cgggtgcgag aatccggcta aaaataattt taaaaaaaat tatctctaaa ttatgagata 4140cgggtgcgag aatccggcta aaaataattt taaaaaaaat tatctctaaa ttatgagata 4140
ttatgtggaa tacttacgta taacttgtaa agtgtagatt ttttttaatt ctcaagttgt 4200ttatgtggaa tacttacgta taacttgtaa agtgtagatt ttttttaatt ctcaagttgt 4200
agattagtaa atgattgatt tcctagataa gtatgctatt ttcttcaaat ttactcttct 4260agattagtaa atgattgatt tcctagataa gtatgctatt ttcttcaaat ttactcttct 4260
gatttcgaaa atcaaattgt atctcgtctc gaatttttcc gtccgttatg gtcaaagtac 4320gatttcgaaa atcaaattgt atctcgtctc gaatttttcc gtccgttatg gtcaaagtac 4320
ccaaaatcgt ttgaccaaat cggtacggat cccataccca cacccacact agtgtcgtat 4380ccaaaatcgt ttgaccaaat cggtacggat cccataccca cacccacact agtgtcgtat 4380
tgacacgggt gccgcaccta aactgctatg tcggagcaac ttagcactta gagaatcatt 4440tgacacgggt gccgcaccta aactgctatg tcggagcaac ttagcactta gagaatcatt 4440
gatgttaaat tttcttaatt cttgaatctg ctaatgaaga ttttatcttg gtttttgttt 4500gatgttaaat ttttcttaatt cttgaatctg ctaatgaaga ttttatcttg gtttttgttt 4500
aggctgaagc tgttccattg gctgctgaat ga 4532aggctgaagc tgttccattg gctgctgaat ga 4532
<210> 6<210> 6
<211> 805<211> 805
<212> БЕЛОК<212> PROTEIN
<213> Nicotiana tabacum<213> Nicotiana tabacum
<400> 6<400> 6
Met Ala Glu Arg Ala Leu Thr Arg Val His Ser Leu Arg Glu Arg Leu Met Ala Glu Arg Ala Leu Thr Arg Val His Ser Leu Arg Glu Arg Leu
1 5 10 15 1 5 10 15
Asp Ala Thr Leu Ala Ala His Arg Asn Glu Ile Leu Leu Phe Leu Ser Asp Ala Thr Leu Ala Ala His Arg Asn Glu Ile Leu Leu Phe Leu Ser
20 25 30 20 25 30
Arg Ile Glu Ser His Gly Lys Gly Ile Leu Lys Pro His Gln Leu Leu Arg Ile Glu Ser His Gly Lys Gly Ile Leu Lys Pro His Gln Leu Leu
35 40 45 35 40 45
Ala Glu Phe Asp Ala Ile Arg Gln Asp Asp Lys Lys Lys Leu Asn Asp Ala Glu Phe Asp Ala Ile Arg Gln Asp Asp Lys Lys Lys Leu Asn Asp
50 55 60 50 55 60
His Ala Phe Glu Glu Leu Leu Lys Ser Thr Gln Glu Ala Ile Val Leu His Ala Phe Glu Glu Leu Leu Lys Ser Thr Gln Glu Ala Ile Val Leu
65 70 75 80 65 70 75 80
Pro Pro Trp Val Ala Leu Ala Ile Arg Leu Arg Pro Gly Val Trp Glu Pro Pro Trp Val Ala Leu Ala Ile Arg Leu Arg Pro Gly Val Trp Glu
85 90 95 85 90 95
Tyr Val Arg Val Asn Val Asn Ala Leu Val Val Glu Glu Leu Thr Val Tyr Val Arg Val Asn Val Asn Ala Leu Val Val Glu Glu Leu Thr Val
100 105 110 100 105 110
Pro Glu Tyr Leu His Phe Lys Glu Glu Leu Val Asp Gly Thr Ser Asn Pro Glu Tyr Leu His Phe Lys Glu Glu Leu Val Asp Gly Thr Ser Asn
115 120 125 115 120 125
Gly Asn Phe Val Leu Glu Leu Asp Phe Glu Pro Phe Thr Ala Ser Phe Gly Asn Phe Val Leu Glu Leu Asp Phe Glu Pro Phe Thr Ala Ser Phe
130 135 140 130 135 140
Pro Lys Pro Thr Leu Thr Lys Ser Ile Gly Asn Gly Val Glu Phe Leu Pro Lys Pro Thr Leu Thr Lys Ser Ile Gly Asn Gly Val Glu Phe Leu
145 150 155 160 145 150 155 160
Asn Arg His Leu Ser Ala Lys Met Phe His Asp Lys Glu Ser Met Thr Asn Arg His Leu Ser Ala Lys Met Phe His Asp Lys Glu Ser Met Thr
165 170 175 165 170 175
Pro Leu Leu Glu Phe Leu Arg Val His Asn Tyr Lys Gly Lys Thr Met Pro Leu Leu Glu Phe Leu Arg Val His Asn Tyr Lys Gly Lys Thr Met
180 185 190 180 185 190
Met Leu Asn Asp Arg Ile Gln Asn Leu Thr Thr Leu Gln Asn Val Leu Met Leu Asn Asp Arg Ile Gln Asn Leu Thr Thr Leu Gln Asn Val Leu
195 200 205 195 200 205
Arg Lys Ala Glu Glu Tyr Leu Ile Met Leu Pro Pro Glu Thr Pro Phe Arg Lys Ala Glu Glu Tyr Leu Ile Met Leu Pro Pro Glu Thr Pro Phe
210 215 220 210 215 220
Ser Glu Phe Glu His Lys Phe Gln Glu Ile Gly Leu Glu Lys Gly Trp Ser Glu Phe Glu His Lys Phe Gln Glu Ile Gly Leu Glu Lys Gly Trp
225 230 235 240 225 230 235 240
Gly Asp Thr Ala Glu Arg Val Leu Glu Met Ile Cys Met Leu Leu Asp Gly Asp Thr Ala Glu Arg Val Leu Glu Met Ile Cys Met Leu Leu Asp
245 250 255 245 250 255
Leu Leu Glu Ala Pro Asp Ser Cys Thr Leu Glu Lys Phe Leu Gly Arg Leu Leu Glu Ala Pro Asp Ser Cys Thr Leu Glu Lys Phe Leu Gly Arg
260 265 270 260 265 270
Ile Pro Met Val Phe Asn Val Val Ile Leu Ser Pro His Gly Tyr Phe Ile Pro Met Val Phe Asn Val Val Ile Leu Ser Pro His Gly Tyr Phe
275 280 285 275 280 285
Ala Gln Glu Asn Val Leu Gly Tyr Pro Asp Thr Gly Gly Gln Val Val Ala Gln Glu Asn Val Leu Gly Tyr Pro Asp Thr Gly Gly Gln Val Val
290 295 300 290 295 300
Tyr Ile Leu Asp Gln Val Pro Ala Leu Glu Arg Glu Met Leu Lys Arg Tyr Ile Leu Asp Gln Val Pro Ala Leu Glu Arg Glu Met Leu Lys Arg
305 310 315 320 305 310 315 320
Leu Lys Glu Gln Gly Leu Asp Ile Thr Pro Arg Ile Leu Ile Val Thr Leu Lys Glu Gln Gly Leu Asp Ile Thr Pro Arg Ile Leu Ile Val Thr
325 330 335 325 330 335
Arg Leu Leu Pro Asp Ala Val Gly Thr Thr Cys Gly Gln Arg Leu Glu Arg Leu Leu Pro Asp Ala Val Gly Thr Thr Cys Gly Gln Arg Leu Glu
340 345 350 340 345 350
Lys Val Tyr Gly Ala Glu His Ser His Ile Leu Arg Val Pro Phe Arg Lys Val Tyr Gly Ala Glu His Ser His Ile Leu Arg Val Pro Phe Arg
355 360 365 355 360 365
Thr Glu Lys Gly Ile Val Arg Lys Trp Ile Ser Arg Phe Glu Val Trp Thr Glu Lys Gly Ile Val Arg Lys Trp Ile Ser Arg Phe Glu Val Trp
370 375 380 370 375 380
Pro Tyr Met Glu Thr Phe Thr Glu Asp Val Ala Lys Glu Leu Ala Ala Pro Tyr Met Glu Thr Phe Thr Glu Asp Val Ala Lys Glu Leu Ala Ala
385 390 395 400 385 390 395 400
Glu Leu Gln Ala Lys Pro Asp Leu Ile Ile Gly Asn Tyr Ser Glu Gly Glu Leu Gln Ala Lys Pro Asp Leu Ile Ile Gly Asn Tyr Ser Glu Gly
405 410 415 405 410 415
Asn Leu Val Ala Ser Leu Leu Ala His Lys Leu Gly Val Thr Gln Cys Asn Leu Val Ala Ser Leu Leu Ala His Lys Leu Gly Val Thr Gln Cys
420 425 430 420 425 430
Thr Ile Ala His Ala Leu Glu Lys Thr Lys Tyr Pro Asp Ser Asp Ile Thr Ile Ala His Ala Leu Glu Lys Thr Lys Tyr Pro Asp Ser Asp Ile
435 440 445 435 440 445
Tyr Trp Lys Lys Phe Asp Glu Lys Tyr His Phe Ser Ser Gln Phe Thr Tyr Trp Lys Lys Phe Asp Glu Lys Tyr His Phe Ser Ser Gln Phe Thr
450 455 460 450 455 460
Ala Asp Leu Ile Ala Met Asn His Thr Asp Phe Ile Ile Thr Ser Thr Ala Asp Leu Ile Ala Met Asn His Thr Asp Phe Ile Ile Thr Ser Thr
465 470 475 480 465 470 475 480
Phe Gln Glu Ile Ala Gly Ser Lys Asp Thr Val Gly Gln Tyr Glu Ser Phe Gln Glu Ile Ala Gly Ser Lys Asp Thr Val Gly Gln Tyr Glu Ser
485 490 495 485 490 495
His Gln Ala Phe Thr Met Pro Gly Leu Tyr Arg Val Val His Gly Ile His Gln Ala Phe Thr Met Pro Gly Leu Tyr Arg Val Val His Gly Ile
500 505 510 500 505 510
Asp Val Phe Asp Pro Lys Phe Asn Ile Val Ser Pro Gly Ala Asp Ile Asp Val Phe Asp Pro Lys Phe Asn Ile Val Ser Pro Gly Ala Asp Ile
515 520 525 515 520 525
Asn Leu Tyr Phe Pro Tyr Ser Glu Lys Glu Lys Arg Leu Thr Ala Leu Asn Leu Tyr Phe Pro Tyr Ser Glu Lys Glu Lys Arg Leu Thr Ala Leu
530 535 540 530 535 540
His Pro Glu Ile Glu Glu Leu Leu Tyr Ser Asp Val Glu Asn Glu Glu His Pro Glu Ile Glu Glu Leu Leu Tyr Ser Asp Val Glu Asn Glu Glu
545 550 555 560 545 550 555 560
His Leu Cys Val Leu Lys Asp Arg Asn Lys Pro Ile Leu Phe Thr Met His Leu Cys Val Leu Lys Asp Arg Asn Lys Pro Ile Leu Phe Thr Met
565 570 575 565 570 575
Ala Arg Leu Asp Arg Val Lys Asn Leu Thr Gly Leu Val Glu Trp Tyr Ala Arg Leu Asp Arg Val Lys Asn Leu Thr Gly Leu Val Glu Trp Tyr
580 585 590 580 585 590
Ala Lys Asn Ala Arg Leu Arg Glu Leu Val Asn Leu Val Val Val Gly Ala Lys Asn Ala Arg Leu Arg Glu Leu Val Asn Leu Val Val Val Gly
595 600 605 595 600 605
Gly Asp Arg Arg Lys Glu Ser Lys Asp Leu Glu Glu Gln Ala Glu Met Gly Asp Arg Arg Lys Glu Ser Lys Asp Leu Glu Glu Gln Ala Glu Met
610 615 620 610 615 620
Lys Lys Met Tyr Glu Leu Ile Lys Thr His Asn Leu Asn Gly Gln Phe Lys Lys Met Tyr Glu Leu Ile Lys Thr His Asn Leu Asn Gly Gln Phe
625 630 635 640 625 630 635 640
Arg Trp Ile Ser Ser Gln Met Asn Arg Val Arg Asn Gly Glu Leu Tyr Arg Trp Ile Ser Ser Gln Met Asn Arg Val Arg Asn Gly Glu Leu Tyr
645 650 655 645 650 655
Arg Tyr Ile Ala Asp Thr Arg Gly Ala Phe Val Gln Pro Ala Phe Tyr Arg Tyr Ile Ala Asp Thr Arg Gly Ala Phe Val Gln Pro Ala Phe Tyr
660 665 670 660 665 670
Glu Ala Phe Gly Leu Thr Val Val Glu Ala Met Thr Cys Gly Leu Pro Glu Ala Phe Gly Leu Thr Val Val Glu Ala Met Thr Cys Gly Leu Pro
675 680 685 675 680 685
Thr Phe Ala Thr Asn His Gly Gly Pro Ala Glu Ile Ile Val Asn Gly Thr Phe Ala Thr Asn His Gly Gly Pro Ala Glu Ile Ile Val Asn Gly
690 695 700 690 695 700
Lys Ser Gly Phe His Ile Asp Pro Tyr His Gly Glu Gln Ala Ala Asp Lys Ser Gly Phe His Ile Asp Pro Tyr His Gly Glu Gln Ala Ala Asp
705 710 715 720 705 710 715 720
Leu Leu Ala Asp Phe Phe Glu Lys Cys Lys Thr Glu Pro Ser His Trp Leu Leu Ala Asp Phe Phe Glu Lys Cys Lys Thr Glu Pro Ser His Trp
725 730 735 725 730 735
Glu Thr Ile Ser Thr Gly Gly Leu Lys Arg Ile Gln Glu Lys Tyr Thr Glu Thr Ile Ser Thr Gly Gly Leu Lys Arg Ile Gln Glu Lys Tyr Thr
740 745 750 740 745 750
Trp Gln Ile Tyr Ser Glu Arg Leu Leu Thr Leu Ala Ala Val Tyr Gly Trp Gln Ile Tyr Ser Glu Arg Leu Leu Thr Leu Ala Ala Val Tyr Gly
755 760 765 755 760 765
Phe Trp Lys His Val Ser Lys Leu Asp Arg Leu Glu Ile Arg Arg Tyr Phe Trp Lys His Val Ser Lys Leu Asp Arg Leu Glu Ile Arg Arg Tyr
770 775 780 770 775 780
Leu Glu Met Phe Tyr Ala Leu Lys Tyr Arg Lys Met Ala Glu Ala Val Leu Glu Met Phe Tyr Ala Leu Lys Tyr Arg Lys Met Ala Glu Ala Val
785 790 795 800 785 790 795 800
Pro Leu Ala Ala Glu Pro Leu Ala Ala Glu
805 805
<210> 7<210> 7
<211> 5901<211> 5901
<212> ДНК<212> DNA
<213> Nicotiana tabacum<213> Nicotiana tabacum
<400> 7<400> 7
atgcttttta tgggagtaaa ttttatggcc ggtcattcaa ctttgtgttc attacgcaaa 60atgcttttta tgggagtaaa ttttatggcc ggtcattcaa ctttgtgttc attacgcaaa 60
agtcattttt cttggtgttt attacgcaag tcatttttct tttttttttg ttacgtaaaa 120120
atcattcaac tatgtgttta ttatctaaaa ttcaattttt tttttccttt tgttacacaa 180180 atcattcaac tatgtgttta ttatctaaaa
aaatcatttt actttactct atttatcaca aaagtcacct tggccagatt ttataatagg 240aaatcatttt actttactct atttatcaca aaagtcacct tggccagatt ttataatagg 240
cttttatctt ttgttacaca aaaattattt tactttactc tatttatcac aaaagtcacc 300cttttatctt ttgttacaca aaaattattt tactttactc tatttatcac aaaagtcacc 300
ttggccagat tttataatag gcttttatct tttgttacac aaaaattatt ttactttact 360ttggccagat tttataatag gcttttatct tttgttacac aaaaattatt ttactttact 360
ctatttatca caaaagtcac cttggccaga ttttacaata cttttacctt aaaagactat 420ctatttatca caaaagtcac cttggccaga tttttacaata cttttacctt aaaagactat 420
tatgcccttg acattataaa tcctctcatt tatataatac cttctatatg atacactata 480tatgcccttg acattataaa tcctctcatt tatataatac cttctatatg atacactata 480
taatatattt ttacctaggt attttactta taattaaaat aatattaaat tattttattt 540taatattattt ttacctaggt attttactta taattaaaat aatattaaat tattttattt 540
atctatttta taatatattc atacatttaa ttttttcatg gcaaatcact ttgtttaatc 600atctatttta taatatattc atacatttaa ttttttcatg gcaaatcact ttgtttaatc 600
atatttaaac atgaacaaat tttaaatatc aaaaaaataa aaaaataaaa aaaatattta 660660
tttgaaataa taacaaacag atttgtttaa caaatgatag ttttttttta tagtcaataa 720tttgaaataa taacaaacag atttgtttaa caaatgatag ttttttttta tagtcaataa 720
aatttttaaa aaaattcaaa gatatttgtt tttaatatta atatttttaa agctttatct 780aatttttaaa aaaattcaaa gatatttgtt tttaatatta atatttttaa agctttatct 780
gttaatatta tttatttgaa agtattaatc tgatgtgtca ttgtgttaaa tgtgagtatt 840840
ttatttattg gattaatgag tatggcttgg ctgataaaaa gctttgattt tataattttc 900ttatttattg gattaatgag tatggcttgg ctgataaaaa gctttgattt tataattttc 900
attaaaaata ttttattaag ctagtacctg acaaatttaa tatcttgaaa attaacgtta 960attaaaaata ttttattaag ctagtacctg acaaatttaa tatcttgaaa attaacgtta 960
agaaaaaatt aaatataaaa atatattata aaaataataa ataaataata tcaagttatt 1020agaaaaaatt aaatataaaa atatattata aaaataataa ataaataata tcaagttatt 1020
ttaattataa ataaaataca tggttaaaaa tatattatat agcatataat atagaaggta 1080ttaattataa ataaaataca tggttaaaaa tatattatat agcatataat atagaaggta 1080
ttacataaat gagatgattt aaagggcata atagactttt caggtgaatg atttgtaaaa 1140ttacataaat gagatgattt aaagggcata atagactttt caggtgaatg atttgtaaaa 1140
tatggttaaa gtgattattg tgataattag agcatagtaa aataattttt atgtaacaaa 1200tatggttaaa gtgattattg tgataattag agcatagtaa aataattttt atgtaacaaa 1200
agaaaaaaaa aatgactttt gggtaatgaa cataaatttg aataactttt acgtaacaaa 1260agaaaaaaaa aatgactttt gggtaatgaa cataaatttg aataactttt acgtaacaaa 1260
agaataaaat aaattttgga taataaacat aaaattgaat gaccacctat aaaatttatt 1320agaataaaat aaattttgga taataaacat aaaattgaat gaccacctat aaaatttatt 1320
atttttttgg gctcttcttg atttgatttt ttagtttagc ctttgcagta atcttggttg 1380atttttttgg gctcttcttg atttgatttt ttagtttagc ctttgcagta atcttggttg 1380
tcacgcgtag cgttgtgctt tcgccacata agtatttagt agacttaatt aatgtcatta 1440tcacgcgtag cgttgtgctt tcgccacata agtatttagt agacttaatt aatgtcatta 1440
tatcggttgg tgtggtttta attacttaac tgtactatta tattaggtgg aaggtttgaa 1500tatcggttgg tgtggtttta attacttaac tgtactatta tattaggtgg aaggtttgaa 1500
aatttatagt agtaacattc tagatcattg aaaatattgg tgtttcagtg actttttagt 15601560
atgtcatttt cattttctaa gtggttgtac taatatagta tattaaaatt ttgattggtt 16201620
gagaaacaat ctctctcacc tacacggtac gggtaaggta tgcgtatacg cttatcctcc 1680gagaaacaat ctctctcacc tacacggtac gggtaaggta tgcgtatacg cttatcctcc 1680
ctacactcca tttgtgggac tattgttgtt attttggata agctgaggta tccatcttct 1740ctacactcca tttgtgggac tattgttgtt attttggata agctgaggta tccatcttct 1740
actaactgca ctagtttatt ttttttgctg tttacagttg aaacaattgt ctgaggattt 1800actaactgca ctagtttatt ttttttgctg tttacagttg aaacaattgt ctgaggattt 1800
ctcacctgct gaatcaactg caatggctga acgtgtgctg actcgtgttc acagccttcg 1860ctcacctgct gaatcaactg caatggctga acgtgtgctg actcgtgttc acagccttcg 1860
tgaacgtctt gatgctactt tggctgctca tcgcaatgag atattactgt ttctttcaag 1920tgaacgtctt gatgctactt tggctgctca tcgcaatgag atattactgt ttctttcaag 1920
gtatagccaa agatagtatt cttgttaact aaaaaagatt cagttggtgt tcaaaaaacg 1980gtatagccaa agatagtatt cttgttaact aaaaaagatt cagttggtgt tcaaaaaacg 1980
atacgtttat ctgcctaagt cttggtagtc agaattatcc ggtacctatg ctggtgtgag 2040atacgtttat ctgcctaagt cttggtagtc agaattatcc ggtacctatg ctggtgtgag 2040
ttagctggct aggaaaccac tcttatgaaa acaagagatt tagttagagt tgtctgtaat 2100ttagctggct aggaaaccac tcttatgaaa acaagagatt tagttagagt tgtctgtaat 2100
tctgtagtat ggactatgta tgtgatgcta tttgaactgg ttttggttat tataggattg 21602160
aaagccatgg aaaagggatc ttgaaaccgc atcagctatt ggctgagttt gatgcaattc 2220aaagccatgg aaaagggatc ttgaaaccgc atcagctatt ggctgagttt gatgcaattc 2220
gccaagatga caaaaagaaa ctgaatgatc atgcatttga agaactcctg aagtccactc 2280gccaagatga caaaaagaaa ctgaatgatc atgcatttga agaactcctg aagtccactc 2280
aggtaatatg gttttggcta tatttgtcgc caacgccaag ctcatatttt tatattattt 23402340
tgagcttgtg tctgaatacg acgatgatat gttatactag gaagcaattg ttctgccacc 2400tgagcttgtg tctgaatacg acgatgatat gttatactag gaagcaattg ttctgccacc 2400
ttgggttgca cttgcgattc gtttgaggcc tggtgtgtgg gaatatgtcc gtgtgaatgt 2460ttgggttgca cttgcgattc gtttgaggcc tggtgtgtgg gaatatgtcc gtgtgaatgt 2460
caatgcgcta gtcgttgagg agctgactgt ccctgagtat ttgcatttca aggaagaact 2520caatgcgcta gtcgttgagg agctgactgt ccctgagtat ttgcatttca aggaagaact 2520
tgtcgatgga acgtaagtgt tagtcttcaa tttgatgcta tgttagagaa taggctgtgg 25802580
aatttattga tcaatgctgt gctttgtcct gatacagctc caatggaaat ttcgttctcg 26402640
agttggattt tgagcccttc accgcatcct ttcctaaacc aaccctcacc aaatctatcg 2700agttggattt tgagcccttc accgcatcct ttcctaaacc aaccctcacc aaatctatcg 2700
gaaatggagt tgaattcctc aataggcacc tctctgcgaa aatgttccat gacaaggaaa 2760gaaatggagt tgaattcctc aataggcacc tctctgcgaa aatgttccat gacaaggaaa 2760
gcatgacccc gcttcttgaa tttcttcggg ttcacaatta taagggcaag gtgacttgct 2820gcatgacccc gcttcttgaa tttcttcggg ttcacaatta taagggcaag gtgacttgct 2820
atttccattt atctataggt tcggtttgtg cttatcatgc gcccaatgac atatgaatat 2880atttccattt atctataggt tcggtttgtg cttatcatgc gcccaatgac atatgaatat 2880
gcgctaaagg atagatatat gatttccttt gcagacaatg atgctgaacg acagaataca 2940gcgctaaagg atagatatat gatttccttt gcagacaatg atgctgaacg acagaataca 2940
gaatttaacc acactgcaaa atgtcctaag gaaggcagag gaatacctca ttatgcttcc 3000gaatttaacc acactgcaaa atgtcctaag gaaggcagag gaatacctca ttatgcttcc 3000
ccctgaaact ccattttccg aattcgaaca caagttccaa gaaattggat tggagaaggg 3060ccctgaaact ccattttccg aattcgaaca caagttccaa gaaattggat tggagaaggg 3060
atggggcgac actgcagagc gcgtgctgga gatgatatgc atgcttcttg atctcctcga 3120atggggcgac actgcagagc gcgtgctgga gatgatatgc atgcttcttg atctcctcga 3120
ggctcccgat tcctgtactc ttgagaagtt cttggggaga attcctatgg tgttcaatgt 31803180
ggttatcctt tccccccacg gatatttcgc ccaggaaaat gtcttgggtt atcccgacac 3240ggttatcctt tccccccg gatatttcgc cggaaaat gtcttgggtt atcccgacac 3240
tggtggccag gtgcattact ttaatcttta tccgtgagtc tatgtttgtt cgaatcctct 3300tggtggccag gtgcattact ttaatcttta tccgtgagtc tatgtttgtt cgaatcctct 3300
agaaatgtca ctgtacctat gtaggatact ccaaatataa tgcattttgg ggggatctgt 3360agaaatgtca ctgtacctat gtaggatact ccaaatataa tgcattttgg ggggatctgt 3360
tatgggtgcg atggcatttt tggaggtcgg agcaacaaac aattgctatg tattcttcta 3420tatgggtgcg atggcatttt tggaggtcgg agcaacaaac aattgctatg tattcttcta 3420
aagcttgctt tcataaatgc taaggtcctt cacccttaat gtgcaggttg tctatatatt 34803480
agatcaagtt ccagccttgg agcgtgaaat gcttaagcgc ctaaaggagc aaggacttga 3540agatcaagtt ccagccttgg agcgtgaaat gcttaagcgc ctaaaggagc aaggacttga 3540
tatcacaccg cgtattctta ttgttagtat ttcctgtact tgtaattact gcggattaca 3600ttgttagtat ttcctgtact tgtaattact gcggattaca 3600
caaaatttcc tttttatctt cttaacaact tatcttgatg gtattcccag gttactcgtc 3660caaaatttcc tttttatctt cttaacaact tatcttgatg gtattcccag gttactcgtc 3660
tgctacctga tgcagttgga acgacttgtg gtcagcggct tgagaaggtg tatggagccg 3720tgctacctga tgcagttgga acgacttgtg gtcagcggct tgagaaggtg tatggagccg 3720
agcactcaca tattctgagg gtccccttta ggactgagaa gggcattgtt cgtaaatgga 3780agcactcaca tattctgagg gtccccttta ggactgagaa gggcattgtt cgtaaatgga 3780
tctctcgctt tgaagtgtgg ccatatatgg agactttcac tgaggtgaca ctaaaacttc 3840tctctcgctt tgaagtgtgg ccatatatgg agactttcac tgaggtgaca ctaaaacttc 3840
cttatatttg tctatcttct aattggtatt aggaataatt tgttaattgt taactctttg 3900cttatatttg tctatcttct aattggtatt aggaataatt tgttaattgt taactctttg 3900
tcttttcgta catcaggatg tcgcaaaaga acttgctgca gaattgcagg ccaagccaga 3960tcttttcgta catcaggatg tcgcaaaaga acttgctgca gaattgcagg ccaagccaga 3960
tttgataata ggcaactata gcgagggaaa tcttgtggct tcattgctcg ctcataagtt 4020tttgataata ggcaactata gcgagggaaa tcttgtggct tcattgctcg ctcataagtt 4020
aggcgtaaca caggtctgtg ttgtttttca ctctcttaaa gatctgattg catttccatt 4080aggcgtaaca caggtctgtg ttgtttttca ctctcttaaa gatctgattg catttccatt 4080
agtctggaac tagaagtact aaaaagttct tttcttcact gtgttatttg ccgtcggcag 4140agtctggaac tagaagtact aaaaagttct tttcttcact gtgttatttg ccgtcggcag 4140
tgcaccatag ctcatgcatt ggagaaaaca aagtatcctg attctgacat ctactggaaa 4200tgcaccatag ctcatgcatt ggagaaaaca aagtatcctg attctgacat ctactggaaa 4200
aaattcgatg aaaaatacca tttctcgtcc cagtttaccg ctgatcttat tgcaatgaat 4260aaattcgatg aaaaatacca tttctcgtcc cagtttaccg ctgatcttat tgcaatgaat 4260
cacaccgatt ttatcatcac cagcactttc caggagatag caggaaggta taacatcaat 43204320
ttgctacttc gactgcaaca gcattgtgtt cccatttctt tcccttatgc ttaacctaat 4380ttgctacttc gactgcaaca gcattgtgtt cccatttctt tcccttatgc ttaacctaat 4380
accgtcatga attttccagc aaggacactg tcggacagta cgagagtcat caggcattca 4440accgtcatga attttccagc aaggacactg tcggacagta cgagagtcat caggcattca 4440
caatgcccgg attgtacaga gttgttcacg gcattgatgt gttcgacccc aaattcaaca 4500caatgcccgg attgtacaga gttgttcacg gcattgatgt gttcgacccc aaattcaaca 4500
ttgtctcacc tggagctgac ataaacctct atttcccata ttccgagaag gaaaagagac 4560ttgtctcacc tggagctgac ataaacctct atttcccata ttccgagaag gaaaagagac 4560
tgacagcact tcaccctgaa atcgaggagc tgctgtacag tgacattgag aacgaggaac 4620tgacagcact tcaccctgaa atcgaggagc tgctgtacag tgacattgag aacgaggaac 4620
atctgtaagt ttctacctta ctcgtacagt cagtggcgga gccagaattt tcactaaaat 4680atctgtaagt ttctacctta ctcgtacagt cagtggcgga gccagaattt tcactaaaat 4680
aaggtcaaaa tataaagaca taaatccaca aagaagccaa gggtgtcaat atatagtata 4740aaggtcaaaa tataaagaca taaatccaca aagaagccaa gggtgtcaat atatagtata 4740
aatacattaa aaaaattacc tatctacaca gtgtaatttt ccgacaaagg ggtgtcggtt 4800aatacattaa aaaaattacc tatctacaca gtgtaatttt ccgacaaagg ggtgtcggtt 4800
gacactcctt gaatacatgt ggctctgcca ctgggtacag ttacaaagtt ctgttaccta 4860gacactcctt gaatacatgt ggctctgcca ctgggtacag ttacaaagtt ctgttaccta 4860
tgtagatgag cttgtgctga acatgttgtg attttggcag gtgtgtgcta aaggacagga 4920tgtagatgag cttgtgctga acatgttgtg attttggcag gtgtgtgcta aaggacagga 4920
ataagccaat cttattcaca atggcgagat tggatcgtgt gaagaattta accggacttg 4980ataagccaat cttattcaca atggcgagat tggatcgtgt gaagaattta accggacttg 4980
ttgagtggta tgccaagaac gcacggctaa gggagttggt taaccttgtt gtggttggtg 5040ttgagtggta tgccaagaac gcacggctaa gggagttggt taaccttgtt gtggttggtg 5040
gagatcgaag gaaagaatcc aaagatttgg aagagcaaac agaaatgaaa aagatgtatg 5100gagatcgaag gaaagaatcc aaagatttgg aagagcaaac agaaatgaaa aagatgtatg 5100
agctaataaa gactcacaat ttaaatggcc aattcagatg gatttcttca cagatgaacc 5160agctaataaa gactcacaat ttaaatggcc aattcagatg gatttcttca cagatgaacc 5160
gagtgaggaa cggtgaactc taccgataca ttgctgacac tagaggagct ttcgtgcagc 5220gagtgaggaa cggtgaactc taccgataca ttgctgacac tagagggagct ttcgtgcagc 5220
ctgcattcta cgaggctttc ggtttgactg ttgttgaggc catgacctgt ggtttgccta 5280ctgcattcta cgaggctttc ggtttgactg ttgttgaggc catgacctgt ggtttgccta 5280
catttgcaac taatcatggc ggtccagctg agatcatcgt taacggaaaa tctggcttcc 5340catttgcaac taatcatggc ggtccagctg agatcatcgt taacggaaaa tctggcttcc 5340
acatcgatcc atatcacggt gagcaagctg ctgatctgct agctgatttc tttgagaaat 5400acatcgatcc atatcacggt gagcaagctg ctgatctgct agctgatttc tttgagaaat 5400
gtaagacaga accttctcat tgggaaacca tttcaacggg tggcctgaag cgcatccaag 5460gtaagacaga accttctcat tgggaaacca tttcaacggg tggcctgaag cgcatccaag 5460
agaagtaagc aactctttct tgactctagt cattgaaatt aactttcttg actctagtca 5520agaagtaagc aactctttct tgactctagt cattgaaatt aactttcttg actctagtca 5520
ttgaaattaa ctcgggattt gaggcgtagt tgattgatat tttatcgcgt ctctactact 55805580
gatatataca ggtacacgtg gcaaatctac tcggagaggc tattgacatt ggctgctgtt 5640gatatataca ggtacacgtg gcaaatctac tcggagaggc tattgacatt ggctgctgtt 5640
tacgggttct ggaaacatgt ttctaagctt gatcgtctag aaatccgtcg atatcttgaa 5700tacgggttct ggaaacatgt ttctaagctt gatcgtctag aaatccgtcg atatcttgaa 5700
atgttttatg ctctcaaata ccgcaagatg gtgagttcct cttcttcctt gcccttctcc 5760atgttttatg ctctcaaata ccgcaagatg gtgagttcct cttcttcctt gcccttctcc 5760
tagtgtttaa gatacaatat aattgattgc attatcttag agaatcatta atgttaaatt 5820tagtgtttaa gatacaatat aattgattgc attatcttag agaatcatta atgttaaatt 5820
ttcttaattc ttgaatctgt taatgaagtt tttctcttgg tttttgttta ggctgaagct 5880ttcttaattc ttgaatctgt taatgaagtt ttttctcttgg tttttgttta ggctgaagct 5880
gttccattgg ctgctgagtg a 5901gttccattgg ctgctgagtg a 5901
<210> 8<210> 8
<211> 825<211> 825
<212> БЕЛОК<212> PROTEIN
<213> Nicotiana tabacum<213> Nicotiana tabacum
<400> 8<400> 8
Met Leu Phe Met Gly Leu Lys Gln Leu Ser Glu Asp Phe Ser Pro Ala Met Leu Phe Met Gly Leu Lys Gln Leu Ser Glu Asp Phe Ser Pro Ala
1 5 10 15 1 5 10 15
Glu Ser Thr Ala Met Ala Glu Arg Val Leu Thr Arg Val His Ser Leu Glu Ser Thr Ala Met Ala Glu Arg Val Leu Thr Arg Val His Ser Leu
20 25 30 20 25 30
Arg Glu Arg Leu Asp Ala Thr Leu Ala Ala His Arg Asn Glu Ile Leu Arg Glu Arg Leu Asp Ala Thr Leu Ala Ala His Arg Asn Glu Ile Leu
35 40 45 35 40 45
Leu Phe Leu Ser Arg Ile Glu Ser His Gly Lys Gly Ile Leu Lys Pro Leu Phe Leu Ser Arg Ile Glu Ser His Gly Lys Gly Ile Leu Lys Pro
50 55 60 50 55 60
His Gln Leu Leu Ala Glu Phe Asp Ala Ile Arg Gln Asp Asp Lys Lys His Gln Leu Leu Ala Glu Phe Asp Ala Ile Arg Gln Asp Asp Lys Lys
65 70 75 80 65 70 75 80
Lys Leu Asn Asp His Ala Phe Glu Glu Leu Leu Lys Ser Thr Gln Glu Lys Leu Asn Asp His Ala Phe Glu Glu Leu Leu Lys Ser Thr Gln Glu
85 90 95 85 90 95
Ala Ile Val Leu Pro Pro Trp Val Ala Leu Ala Ile Arg Leu Arg Pro Ala Ile Val Leu Pro Pro Trp Val Ala Leu Ala Ile Arg Leu Arg Pro
100 105 110 100 105 110
Gly Val Trp Glu Tyr Val Arg Val Asn Val Asn Ala Leu Val Val Glu Gly Val Trp Glu Tyr Val Arg Val Asn Val Asn Ala Leu Val Val Glu
115 120 125 115 120 125
Glu Leu Thr Val Pro Glu Tyr Leu His Phe Lys Glu Glu Leu Val Asp Glu Leu Thr Val Pro Glu Tyr Leu His Phe Lys Glu Glu Leu Val Asp
130 135 140 130 135 140
Gly Thr Ser Asn Gly Asn Phe Val Leu Glu Leu Asp Phe Glu Pro Phe Gly Thr Ser Asn Gly Asn Phe Val Leu Glu Leu Asp Phe Glu Pro Phe
145 150 155 160 145 150 155 160
Thr Ala Ser Phe Pro Lys Pro Thr Leu Thr Lys Ser Ile Gly Asn Gly Thr Ala Ser Phe Pro Lys Pro Thr Leu Thr Lys Ser Ile Gly Asn Gly
165 170 175 165 170 175
Val Glu Phe Leu Asn Arg His Leu Ser Ala Lys Met Phe His Asp Lys Val Glu Phe Leu Asn Arg His Leu Ser Ala Lys Met Phe His Asp Lys
180 185 190 180 185 190
Glu Ser Met Thr Pro Leu Leu Glu Phe Leu Arg Val His Asn Tyr Lys Glu Ser Met Thr Pro Leu Leu Glu Phe Leu Arg Val His Asn Tyr Lys
195 200 205 195 200 205
Gly Lys Thr Met Met Leu Asn Asp Arg Ile Gln Asn Leu Thr Thr Leu Gly Lys Thr Met Met Leu Asn Asp Arg Ile Gln Asn Leu Thr Thr Leu
210 215 220 210 215 220
Gln Asn Val Leu Arg Lys Ala Glu Glu Tyr Leu Ile Met Leu Pro Pro Gln Asn Val Leu Arg Lys Ala Glu Glu Tyr Leu Ile Met Leu Pro Pro
225 230 235 240 225 230 235 240
Glu Thr Pro Phe Ser Glu Phe Glu His Lys Phe Gln Glu Ile Gly Leu Glu Thr Pro Phe Ser Glu Phe Glu His Lys Phe Gln Glu Ile Gly Leu
245 250 255 245 250 255
Glu Lys Gly Trp Gly Asp Thr Ala Glu Arg Val Leu Glu Met Ile Cys Glu Lys Gly Trp Gly Asp Thr Ala Glu Arg Val Leu Glu Met Ile Cys
260 265 270 260 265 270
Met Leu Leu Asp Leu Leu Glu Ala Pro Asp Ser Cys Thr Leu Glu Lys Met Leu Leu Asp Leu Leu Glu Ala Pro Asp Ser Cys Thr Leu Glu Lys
275 280 285 275 280 285
Phe Leu Gly Arg Ile Pro Met Val Phe Asn Val Val Ile Leu Ser Pro Phe Leu Gly Arg Ile Pro Met Val Phe Asn Val Val Ile Leu Ser Pro
290 295 300 290 295 300
His Gly Tyr Phe Ala Gln Glu Asn Val Leu Gly Tyr Pro Asp Thr Gly His Gly Tyr Phe Ala Gln Glu Asn Val Leu Gly Tyr Pro Asp Thr Gly
305 310 315 320 305 310 315 320
Gly Gln Val Val Tyr Ile Leu Asp Gln Val Pro Ala Leu Glu Arg Glu Gly Gln Val Val Tyr Ile Leu Asp Gln Val Pro Ala Leu Glu Arg Glu
325 330 335 325 330 335
Met Leu Lys Arg Leu Lys Glu Gln Gly Leu Asp Ile Thr Pro Arg Ile Met Leu Lys Arg Leu Lys Glu Gln Gly Leu Asp Ile Thr Pro Arg Ile
340 345 350 340 345 350
Leu Ile Val Thr Arg Leu Leu Pro Asp Ala Val Gly Thr Thr Cys Gly Leu Ile Val Thr Arg Leu Leu Pro Asp Ala Val Gly Thr Thr Cys Gly
355 360 365 355 360 365
Gln Arg Leu Glu Lys Val Tyr Gly Ala Glu His Ser His Ile Leu Arg Gln Arg Leu Glu Lys Val Tyr Gly Ala Glu His Ser His Ile Leu Arg
370 375 380 370 375 380
Val Pro Phe Arg Thr Glu Lys Gly Ile Val Arg Lys Trp Ile Ser Arg Val Pro Phe Arg Thr Glu Lys Gly Ile Val Arg Lys Trp Ile Ser Arg
385 390 395 400 385 390 395 400
Phe Glu Val Trp Pro Tyr Met Glu Thr Phe Thr Glu Asp Val Ala Lys Phe Glu Val Trp Pro Tyr Met Glu Thr Phe Thr Glu Asp Val Ala Lys
405 410 415 405 410 415
Glu Leu Ala Ala Glu Leu Gln Ala Lys Pro Asp Leu Ile Ile Gly Asn Glu Leu Ala Ala Glu Leu Gln Ala Lys Pro Asp Leu Ile Ile Gly Asn
420 425 430 420 425 430
Tyr Ser Glu Gly Asn Leu Val Ala Ser Leu Leu Ala His Lys Leu Gly Tyr Ser Glu Gly Asn Leu Val Ala Ser Leu Leu Ala His Lys Leu Gly
435 440 445 435 440 445
Val Thr Gln Cys Thr Ile Ala His Ala Leu Glu Lys Thr Lys Tyr Pro Val Thr Gln Cys Thr Ile Ala His Ala Leu Glu Lys Thr Lys Tyr Pro
450 455 460 450 455 460
Asp Ser Asp Ile Tyr Trp Lys Lys Phe Asp Glu Lys Tyr His Phe Ser Asp Ser Asp Ile Tyr Trp Lys Lys Phe Asp Glu Lys Tyr His Phe Ser
465 470 475 480 465 470 475 480
Ser Gln Phe Thr Ala Asp Leu Ile Ala Met Asn His Thr Asp Phe Ile Ser Gln Phe Thr Ala Asp Leu Ile Ala Met Asn His Thr Asp Phe Ile
485 490 495 485 490 495
Ile Thr Ser Thr Phe Gln Glu Ile Ala Gly Ser Lys Asp Thr Val Gly Ile Thr Ser Thr Phe Gln Glu Ile Ala Gly Ser Lys Asp Thr Val Gly
500 505 510 500 505 510
Gln Tyr Glu Ser His Gln Ala Phe Thr Met Pro Gly Leu Tyr Arg Val Gln Tyr Glu Ser His Gln Ala Phe Thr Met Pro Gly Leu Tyr Arg Val
515 520 525 515 520 525
Val His Gly Ile Asp Val Phe Asp Pro Lys Phe Asn Ile Val Ser Pro Val His Gly Ile Asp Val Phe Asp Pro Lys Phe Asn Ile Val Ser Pro
530 535 540 530 535 540
Gly Ala Asp Ile Asn Leu Tyr Phe Pro Tyr Ser Glu Lys Glu Lys Arg Gly Ala Asp Ile Asn Leu Tyr Phe Pro Tyr Ser Glu Lys Glu Lys Arg
545 550 555 560 545 550 555 560
Leu Thr Ala Leu His Pro Glu Ile Glu Glu Leu Leu Tyr Ser Asp Ile Leu Thr Ala Leu His Pro Glu Ile Glu Glu Leu Leu Tyr Ser Asp Ile
565 570 575 565 570 575
Glu Asn Glu Glu His Leu Cys Val Leu Lys Asp Arg Asn Lys Pro Ile Glu Asn Glu Glu His Leu Cys Val Leu Lys Asp Arg Asn Lys Pro Ile
580 585 590 580 585 590
Leu Phe Thr Met Ala Arg Leu Asp Arg Val Lys Asn Leu Thr Gly Leu Leu Phe Thr Met Ala Arg Leu Asp Arg Val Lys Asn Leu Thr Gly Leu
595 600 605 595 600 605
Val Glu Trp Tyr Ala Lys Asn Ala Arg Leu Arg Glu Leu Val Asn Leu Val Glu Trp Tyr Ala Lys Asn Ala Arg Leu Arg Glu Leu Val Asn Leu
610 615 620 610 615 620
Val Val Val Gly Gly Asp Arg Arg Lys Glu Ser Lys Asp Leu Glu Glu Val Val Val Gly Gly Asp Arg Arg Lys Glu Ser Lys Asp Leu Glu Glu
625 630 635 640 625 630 635 640
Gln Thr Glu Met Lys Lys Met Tyr Glu Leu Ile Lys Thr His Asn Leu Gln Thr Glu Met Lys Lys Met Tyr Glu Leu Ile Lys Thr His Asn Leu
645 650 655 645 650 655
Asn Gly Gln Phe Arg Trp Ile Ser Ser Gln Met Asn Arg Val Arg Asn Asn Gly Gln Phe Arg Trp Ile Ser Ser Gln Met Asn Arg Val Arg Asn
660 665 670 660 665 670
Gly Glu Leu Tyr Arg Tyr Ile Ala Asp Thr Arg Gly Ala Phe Val Gln Gly Glu Leu Tyr Arg Tyr Ile Ala Asp Thr Arg Gly Ala Phe Val Gln
675 680 685 675 680 685
Pro Ala Phe Tyr Glu Ala Phe Gly Leu Thr Val Val Glu Ala Met Thr Pro Ala Phe Tyr Glu Ala Phe Gly Leu Thr Val Val Glu Ala Met Thr
690 695 700 690 695 700
Cys Gly Leu Pro Thr Phe Ala Thr Asn His Gly Gly Pro Ala Glu Ile Cys Gly Leu Pro Thr Phe Ala Thr Asn His Gly Gly Pro Ala Glu Ile
705 710 715 720 705 710 715 720
Ile Val Asn Gly Lys Ser Gly Phe His Ile Asp Pro Tyr His Gly Glu Ile Val Asn Gly Lys Ser Gly Phe His Ile Asp Pro Tyr His Gly Glu
725 730 735 725 730 735
Gln Ala Ala Asp Leu Leu Ala Asp Phe Phe Glu Lys Cys Lys Thr Glu Gln Ala Ala Asp Leu Leu Ala Asp Phe Phe Glu Lys Cys Lys Thr Glu
740 745 750 740 745 750
Pro Ser His Trp Glu Thr Ile Ser Thr Gly Gly Leu Lys Arg Ile Gln Pro Ser His Trp Glu Thr Ile Ser Thr Gly Gly Leu Lys Arg Ile Gln
755 760 765 755 760 765
Glu Lys Tyr Thr Trp Gln Ile Tyr Ser Glu Arg Leu Leu Thr Leu Ala Glu Lys Tyr Thr Trp Gln Ile Tyr Ser Glu Arg Leu Leu Thr Leu Ala
770 775 780 770 775 780
Ala Val Tyr Gly Phe Trp Lys His Val Ser Lys Leu Asp Arg Leu Glu Ala Val Tyr Gly Phe Trp Lys His Val Ser Lys Leu Asp Arg Leu Glu
785 790 795 800 785 790 795 800
Ile Arg Arg Tyr Leu Glu Met Phe Tyr Ala Leu Lys Tyr Arg Lys Met Ile Arg Arg Tyr Leu Glu Met Phe Tyr Ala Leu Lys Tyr Arg Lys Met
805 810 815 805 810 815
Ala Glu Ala Val Pro Leu Ala Ala Glu Ala Glu Ala Val Pro Leu Ala Ala Glu
820 825 820 825
<210> 9<210> 9
<211> 8323<211> 8323
<212> ДНК<212> DNA
<213> Nicotiana tabacum<213> Nicotiana tabacum
<400> 9<400> 9
atggcgaatc caaagttcac aagagtacct agcatgaggg agagagttga ggatactctc 60atggcgaatc caaagttcac aagagtacct agcatgaggg agagagttga ggatactctc 60
tctgctcacc gtaaccagct tgttgctctc ctctccaggt atattaataa actctatata 120tctgctcacc gtaaccagct tgttgctctc ctctccaggt atattaataa actctatata 120
cttgttattt tctttatttt tttgtcttta ctgataaatt taactgtttt cttctttaaa 180180
tcttgctttc gatgcatgat ttctgttgtg ttaaattgcg taaccatttt atctaaaagt 240tcttgctttc gatgcatgat ttctgttgtg ttaaattgcg taaccatttt atctaaaagt 240
ttatgctgat aaacactttt aaattttaat atgtaaatta tattatgtct caacatcaac 300ttatgctgat aaacactttt aaattttaat atgtaaatta tattatgtct caacatcaac 300
atgtggatgg ccaaaaatat aaagcttaat tttcgttatt ttgaatgatt tttctctgcg 360atgtggatgg ccaaaaatat aaagcttaat tttcgttatt ttgaatgatt tttctctgcg 360
agtgttacgg tttgcgtaca cattacctaa acctcctccc tagtccccac ttgtgggaat 420agtgttacgg tttgcgtaca cattacctaa acctcctccc tagtccccac ttgtgggaat 420
ttaatttttt ttttctttgt ttttttttgt tgttgttgtt gtctgagttc aattcctacc 480ttaatttttt ttttctttgt ttttttttgt tgttgttgtt gtctgagttc aattcctacc 480
atgttagctt ggcaaaaata agttggtaaa gcttgacccc aactagtttt agttgatcga 540atgttagctt ggcaaaaata agttggtaaa gcttgacccc aactagtttt agttgatcga 540
tttatttggt gatttatagt tcaataataa taattactat tagagaaagt tccagcagct 600tttatttggt gatttatagt tcaataataa taattactat tagagaaagt tccagcagct 600
tttctgtttg tttttccagt tttagtgatt gatatatgtg tatatatatt ctttgtttct 660660
tttaagatac gtggcgcagg ggaaggggat attgcaacct caccacttga tcgatgagtt 720tttaagatac gtggcgcagg ggaaggggat attgcaacct caccacttga tcgatgagtt 720
caacaacgct gtatgtgatg acactgcttg tgagaagctc aaagatggtc cctttagtga 780caacaacgct gtatgtgatg acactgcttg tgagaagctc aaagatggtc cctttagtga 780
agtcttgaaa gctactcagg tatattcact aatccatggg aatcaagatg atactgtata 840agtcttgaaa gctactcagg tatattcact aatccatggg aatcaagatg atactgtata 840
tctttattat ggtgtctttc agaaatttga cgatgatgaa atgcaacttt tctctgtttg 900tctttattat ggtgtctttc agaaatttga cgatgatgaa atgcaacttt tctctgtttg 900
tcaccttatc cagactgttt ttttattttt tatttttcat tttttaactt gaaatgctct 960tcaccttatc cagactgtttt ttttattttt tatttttcat tttttaactt gaaatgctct 960
taatttcctt tgtttatcga taagaccgga tttacaatgt atgaacggag catcttaaga 1020taatttcctt tgtttatcga taagaccggga tttacaatgt atgaacggag catcttaaga 1020
accttctgga atgaagatat aagatataaa acatggtgtc cgttttctcc tttgtggaat 1080accttctgga atgaagatat aagatataaa acatggtgtc cgttttctcc tttgtggaat 1080
cagtgtacat atagactgtt attttggtcc cactttctgg atcttctgat cacaccttct 1140cagtgtacat atagactgtt attttggtcc cactttctgg atcttctgat cacaccttct 1140
catgcagagg cgagcttgat ggtttcaacc tttaaattct tactattgaa tccatttcac 1200catgcagagg cgagcttgat ggtttcaacc tttaaattct tactattgaa tccatttcac 1200
tttcgaaatt atgagttcga aatctaatat ttgttgaaat ttttgcaaat gttcacatat 1260tttcgaaatt atgagttcga aatctaatat ttgttgaaat ttttgcaaat gttcacatat 1260
aagtttaagc tttgtgtcaa gaatactggg ctcaatggat tccaatagac caggctgtat 1320aagtttaagc tttgtgtcaa gaatactggg ctcaatggat tccaatagac caggctgtat 1320
ccgcctctgt ctccactctc cctgcatcca cttctttcgt gtgactaata atgcttaatg 1380ccgcctctgt ctccactctc cctgcatcca cttctttcgt gtgactaata atgcttaatg 1380
agctagaact cgttttaatg tttgaataag ttgcttatat cagagcagct tttgatgttt 14401440
caatctttaa cgggttatgc agtaccagca ttctgcggct gaaaaacagg aatctgagat 1500caatctttaa cgggttatgc agtaccagca ttctgcggct gaaaaacagg aatctgagat 1500
ttacttgtct ctggctgaat ttcttgttca ttttgctaac aagtactttg gagttaatgc 1560ttacttgtct ctggctgaat ttcttgttca ttttgctaac aagtactttg gagttaatgc 1560
ttgctctctg ttgtcaaaat aggaagccat tgtgctgcca ccatttgttg ccatagcagt 1620ttgctctctg ttgtcaaaat aggaagccat tgtgctgcca ccatttgttg ccatagcagt 1620
tcgtccaagg ccaggtgttt gggagtatgt tcgtgttaat gtatatgatt tgagcgttga 16801680
acaattgact gttcctgaat atcttcattt caaggaagaa cttgtggatg gagagtaagc 1740acaattgact gttcctgaat atcttcattt caaggaagaa cttgtggatg gagagtaagc 1740
tctttcttat ttcaatacga aacataaaaa tttacagaag ttgaataatt aacaaatttg 1800tctttcttat ttcaatacga aacataaaaa tttacagaag ttgaataatt aacaaatttg 1800
ttgattttta atgtatgcca ggggtaataa tcactttgtg cttgagctgg attttgagcc 1860ttgattttta atgtatgcca ggggtaataa tcactttgtg cttgagctgg attttgagcc 1860
atttaatgca tcagttcctc gtccatctcg atcgtcatcc attggcaatg gagtccaatt 1920atttaatgca tcagttcctc gtccatctcg atcgtcatcc attggcaatg gagtccaatt 1920
cctcaatcgt catctttcct caattatgtt tcgcagcaaa gactctctgg accccttact 1980cctcaatcgt catctttcct caattatgtt tcgcagcaaa gactctctgg accccttact 1980
tgatttcctt agaggacact gtcataaagg gaatgtaagt accaaaagca gttttccctt 2040tgatttcctt agaggacact gtcataaagg gaatgtaagt accaaaagca gttttccctt 2040
tgtaaatgtc tgcttgtccc tgattatcta ctaaatcttt caacacgcgc aaccattata 2100tgtaaatgtc tgcttgtccc tgattatcta ctaaatcttt caacacgcgc aaccattata 2100
agaaatgtac aatacttcta gttagaattt catcatcgac aaactatctg ctttactttt 2160agaaatgtac aatacttcta gttagaattt catcatcgac aaactatctg ctttactttt 2160
tatttttccc atttgatgga tgatagttta gtttatataa cagatgatat tttggttgaa 2220tatttttccc atttgatgga tgatagttta gtttatataa cagatgatat tttggttgaa 2220
gggtaccatg aactttttca caaccactta atggatacat agttgtaata gttgacattt 2280gggtaccatg aactttttca caaccactta atggatacat agttgtaata gttgacattt 2280
tggaataata ttgtctcact tggaaatgtt taagaagtat tactacttct atttgtaaga 2340tggaataata ttgtctcact tggaaatgtt taagaagtat tactacttct atttgtaaga 2340
tggattgttt atctatgcag gtcttgatgt tgaatgatcg tatacagcga atctccaggc 2400tggattgttt atctatgcag gtcttgatgt tgaatgatcg tatacagcga atctccaggc 2400
tggagtctgc tctttctaaa gcagaggatt atctctccaa gctatcacca gatacatcct 2460tggagtctgc tctttctaaa gcagaggatt atctctccaa gctatcacca gatacatcct 2460
ataatgagtt cgaatacgcg tgagcttgta cacatttgtt ttgttttctt tcaagcatat 2520ataatgagtt cgaatacgcg tgagcttgta cacatttgtt ttgttttctt tcaagcatat 2520
gtaatttctc aagaaaaggg aaatctatag gagttgaaac attctttatg gaaccatgtg 2580gtaatttctc aagaaaaggg aaatctatag gagttgaaac attctttatg gaaccatgtg 2580
catgcagatt gcaagaaatg ggctttgaga gaggttgggg tgatactgcc agacgtgttt 2640catgcagatt gcaagaaatg ggctttgaga gaggttgggg tgatactgcc agacgtgttt 2640
tggagacgat gcatcttctt tctgacattc ttcaggctcc ggatccatca accttggaga 2700tggagacgat gcatcttctt tctgacattc ttcaggctcc ggatccatca accttggaga 2700
catttcttgg tagactacct atggtgttca atgtcgtcat attatcccct catggatatt 2760catttcttgg tagactacct atggtgttca atgtcgtcat attatcccct catggatatt 2760
ttggccaagc aaatgtcttg ggtttgcccg acactggtgg ccaggtaata acaaggagaa 2820ttggccaagc aaatgtcttg ggtttgcccg acactggtgg ccaggtaata acaaggagaa 2820
tgaggtcttg tattatgtac tccctccgtt ccaatctata tgaacctatt tgactgggta 2880tgaggtcttg tattatgtac tccctccgtt ccaatctata tgaacctatt tgactgggta 2880
tggaaagaaa tgaagacttg taaaacttgt ggttctttag aaattccaaa cattacattt 2940tggaaagaaa tgaagacttg taaaacttgt ggttctttag aaattccaaa cattacattt 2940
ggttttttcc ctcttcctgg aaattatact actgaatcat ctctagatgt tccagtttaa 3000ggttttttcc ctcttcctgg aaattatact actgaatcat ctctagatgt tccagtttaa 3000
cttgagacgt aagggtaaat aacggaccat tactctgtcc tttcttgcag taggcttggt 3060cttgagacgt aagggtaaat aacggaccat tactctgtcc tttcttgcag taggcttggt 3060
acaatgaata tagttcgcat agttgccgga agctagagct gtgttagaaa actcaggaac 3120acaatgaata tagttcgcat agttgccgga agctagagct gtgttagaaa actcaggaac 3120
attaatttgg cgatgctaat cactgctaat gttactgaag catccatggt tttccttgat 3180attaatttgg cgatgctaat cactgctaat gttactgaag catccatggt tttccttgat 3180
gttattctcc ttttggttgc ttcacaggtt gtctatatac tggatcaagt gcgtgccttg 3240gttattctcc ttttggttgc ttcacaggtt gtctatatac tggatcaagt gcgtgccttg 3240
gaggccgaaa tgcttcttag aataaagcaa caaggactta acttcaagcc tagaatcctt 3300gaggccgaaa tgcttcttag aataaagcaa caaggactta acttcaagcc tagaatcctt 3300
gtcgtgagta catatatatt atgcaagctc ttatttggtt tgtgggattg cagttgacat 3360gtcgtgagta catatatatt atgcaagctc ttatttggtt tgtgggattg cagttgacat 3360
caatttgctt actctgatta ctaaaggtca cacggctgat acctgatgct aaaggaacca 3420caatttgctt actctgatta ctaaaggtca cacggctgat acctgatgct aaaggaacca 3420
tgtgcaacca gaggttggag aggattagtg gaactgaata ctcgcatatt ttacgtgtcc 3480tgtgcaacca gaggttggag aggattagtg gaactgaata ctcgcatatt ttacgtgtcc 3480
cttttaggac agagaaggga atccttcata aatggatatc taggtttgat gtatggcctt 3540cttttaggac agagaaggga atccttcata aatggatatc taggtttgat gtatggcctt 3540
acctggagaa gttcactgag gtaacctctt tgtcccttgg aaattgcctt ttgttgctga 3600acctggagaa gttcactgag gtaacctctt tgtcccttgg aaattgcctt ttgttgctga 3600
tgtttctgct agtgtgctta aatgacggat gttaactagt cacttgctag cgtttgcaat 3660cacttgctag cgtttgcaat 3660
agcaacggga aaagaaagga tttttgctag tttgaagtct gcctccaaga aaaattatat 37203720
taaaagttta tggctagtgg aaacatcagt cattcatgta ccttatttct atgcccaagt 3780taaaagttta tggctagtgg aaacatcagt cattcatgta ccttatttct atgcccaagt 3780
tgtttaagtt gaaagtaatt tggccaacta tgcaaattgg gagaacgtgt agccaactat 3840tgtttaagtt gaaagtaatt tggccaacta tgcaaattgg gagaacgtgt agccaactat 3840
tgtgtttgcc gacatgttga tatacttttt ggtcctgatt tatatttgtt ggtttgtcat 39003900
actggatgaa gcaattctca tgtttttctg cttatatata ttggaagaag agatacttgt 39603960
cgtttcatca tttttctcga cctctctatt accaacactt tgccaattta atgtttggaa 40204020
atgtcttctt gaccaggatg tggcaagtga aatgaccgct gagctccagg gaaagccaga 4080atgtcttctt gaccaggatg tggcaagtga aatgaccgct gagctccagg gaaagccaga 4080
tctgattatt ggcaactaca gtgatggaaa tttagttgcc tcccttttgg catataaaat 4140tctgattatt ggcaactaca gtgatggaaa tttagttgcc tcccttttgg catataaaat 4140
gggtgtcaca caggtaggaa atacatgatt ctttatcttg ctagcactaa gtcttgaggt 4200gggtgtcaca caggtaggaa atacatgatt ctttatcttg ctagcactaa gtcttgaggt 4200
tatgtatctg caatagaaat tttacgcttt gccttcattt ctttttaatt atttttccag 42604260
tgtaccattg ctcatgcctt ggaaaaaaca aagtatcctg attctgacat ctactggaaa 4320tgtaccattg ctcatgcctt ggaaaaaaca aagtatcctg attctgacat ctactggaaa 4320
aagtttgagg agaaatatca tttttcatgt cagtttactg ctgatctact ggcaatgaat 4380aagtttgagg agaaatatca ttttcatgt cagtttactg ctgatctact ggcaatgaat 4380
aattcagatt tcattatcac cagtacttat caagagattg caggaacgta agtcatttta 44404440
atctggtcgt ttaaatctga tatttcttcc ctagtagtct attcaatccg aatttcagtt 4500atctggtcgt ttaaatctga tatttcttcc ctagtagtct attcaatccg aatttcagtt 4500
cagtatatga tgtcatcggt tgaggaactg tgattggtaa ccttatcaaa tccgtagctg 45604560
ctctataatt ttatttcgta attggagaaa caatttttta ttattgagct tgtagtctga 46204620
gctagaattt ggttctttat ctatcaagta gcataatact acaactattt tttatgtgtg 4680gctagaattt ggttctttat ctatcaagta gcataatact acaactattt tttatgtgtg 4680
gcaatttgca atttcaattt tctatttcta taagttgcag cttttcttcc tgttctgatc 4740gcaatttgca atttcaattt tctatttcta taagttgcag cttttcttcc tgttctgatc 4740
atatttacat ggctgaaact caatagaaaa ctaggctagt tgatcaaaag tagttggatg 4800atatttacat ggctgaaact caatagaaaa ctaggctagt tgatcaaaag tagttggatg 4800
ctttaaaatt agtagacgtt ttgctaaatg agtgaccaat gttattaaaa aaacgttcat 4860ctttaaaatt agtagacgtt ttgctaaatg agtgaccaat gttattaaaa aaacgttcat 4860
gttttcaacc cttttggcat acatttgacc actgcccaag attttggata agtacatgca 4920gttttcaacc cttttggcat acatttgacc actgcccaag attttggata agtacatgca 4920
gtgcttataa ttataaagca ttttatccca ccttgttttt cattatgaaa attaagtaat 4980gtgcttataa ttataaagca ttttatccca ccttgttttt cattatgaaa attaagtaat 4980
ttacgagtat ttgtataagt tacttcataa attagaagta aatctggatt gtgtaaagtt 5040ttacgagtat ttgtataagt tacttcataa attagaagta aatctggatt gtgtaaagtt 5040
attcgccccg tatatactga aagctacttg aacaagcaaa aaaacagaca aacgtaacat 5100attcgccccg tatatactga aagctacttg aacaagcaaa aaaacagaca aacgtaacat 5100
tctccatgga ttaatgagac ttgtatatat atatatatat atatgtaaag agagagagag 5160tctccatgga ttaatgagac ttgtatatat atatatatat atatgtaaag agagagagag 5160
agagatttgg cttgtaacca catgtatatt atgccatatg gatgtgacat tgatgtgact 5220agagatttgg cttgtaacca catgtatatt atgccatatg gatgtgacat tgatgtgact 5220
agacctaaat gttttgtttc aatgtccacg ggagttttac gtagagttaa gaggagaaga 5280agacctaaat gttttgtttc aatgtccacg ggagttttac gtagagttaa gaggagaaga 5280
gagtgaggaa tactaatgtt tgatggtacc ccttggcttc ttgacctgga tactcagtgt 5340gagtgaggaa tactaatgtt tgatggtacc ccttggcttc ttgacctgga tactcagtgt 5340
tcttattcat gcctatactt tggtccttga tttcattctc ccttttctag cttgagctgc 5400tcttattcat gcctatactt tggtccttga tttcattctc ccttttctag cttgagctgc 5400
atcaaagaaa ttccactgta aaaaaaataa tgctcaccat attggtgcaa catggcaaac 5460atcaaagaaa ttccactgta aaaaaaataa tgctcaccat attggtgcaa catggcaaac 5460
atgtatccta tttgatgatc aatcaacttt atttttctcc tgttaattga cctcagtgtg 5520atgtatccta tttgatgatc aatcaacttt atttttctcc tgttaattga cctcagtgtg 5520
taactctcta tgtatgatag cattgtaact tgtgtcatga ttcataaata gggtactaga 5580taactctcta tgtatgatag cattgtaact tgtgtcatga ttcataaata gggtactaga 5580
attggatggt tgacatagta aatggtcaat tgatgatcca caaaatatgc acctactgat 5640attggatggt tgacatagta aatggtcaat tgatgatcca caaaatatgc acctactgat 5640
taaaatgtga tagggcaggt ttatttttgt ttgtggttaa cacagtactt aaccctatat 5700taaaatgtga tagggcaggt ttatttttgt ttgtggttaa cacagtactt aaccctatat 5700
ttaatacaat ttggcttatc tacaatcttt tcttcagtgt ttatgcgaat tccttattgc 57605760
acaacaatat tgtctttctg agttctattc tgttgttgct tacactttta ttattccagt 5820acaacaatat tgtctttctg agttctattc tgttgttgct tacactttta ttattccagt 5820
aacatagatg tgaagacatt agattggttg cttgcaaatt gatagccact tgtttcagga 5880aacatagatg tgaagacatt agattggttg cttgcaaatt gatagccact tgtttcagga 5880
agaatactgt tggtcagtac gagagccata ctgcattcac cctcccggga ctatatcgcg 5940agaatactgt tggtcagtac gagagccata ctgcattcac cctcccggga ctatatcgcg 5940
tcgttcatgg cattgatgtt ttcgatccca aattcaatat agtgtctcct ggagctgaca 6000tcgttcatgg cattgatgtt ttcgatccca aattcaatat agtgtctcct ggagctgaca 6000
tgacaattta tttcccatat tctgacaagg aaaaaagact aacgtctttg catggctcga 6060tgacaattta tttcccatat tctgacaagg aaaaaagact aacgtctttg catggctcga 6060
ttgaaaagtt gttatttgat cctgcgcaga atgaagagca tatgtaagtg gcatccgttt 61206120
gtacttaatt tttttggaat agatgacata ttatttgcat gaatatgaaa aggagggtct 61806180
gatatgattt tctatagata aactaccaat gatattattt aaaaactcct ggatactgta 6240gatatgattt tctatagata aactaccaat gatattattt aaaaactcct ggatactgta 6240
ttaggagaag aagagaacca ggggtagatg gcattagaat cccttaaatc ttgaagagtc 6300ttaggagaag aagagaacca ggggtagatg gcattagaat cccttaaatc ttgaagagtc 6300
gtcactaacg ctcccaacac ttctgcctca gaccctcaac taaatactat tattgttgat 6360gtcactaacg ctcccaacac ttctgcctca gaccctcaac taaatactat tattgttgat 6360
ttctttggag aagctataag aatctctctc tccttatggt gaaaatttta cttggcttta 6420ttctttggag aagctataag aatctctctc tccttatggt gaaaatttta cttggcttta 6420
tacttaactt ccaaggctcc ctcttataaa atgcaaaaac tgtctgtatt cactctcttg 6480tacttaactt ccaaggctcc ctcttataaa atgcaaaaac tgtctgtatt cactctcttg 6480
gttaacaatt gatccaatca aatgcatatg gaacatcttt ctttacgttt cttctaaagt 65406540
tcgtttgagg ataaggagta gaatctgaga agatagacta gtaggtaacc ttagggacgg 6600tcgtttgagg ataaggagta gaatctgaga agatagacta gtaggtaacc ttagggacgg 6600
atgtggaaat taacatatgg gctcagcttt tctgccgagt gcagaccatg tatatgcgtt 6660atgtggaaat taacatatgg gctcagcttt tctgccgagt gcagaccatg tatatgcgtt 6660
aaaaaattca ctaaacaagt aaatgtttga ttttgaaccc agtaaatcaa atgagttgtg 67206720
gtagaatctc gaactcgaac cgataaagtt caaatccagg atccgctttt aggtaaactc 6780gtagaatctc gaactcgaac cgataaagtt caaatccagg atccgctttt aggtaaactc 6780
taccttggga agtgttatat atatgtccct gattatttct ttttccgttt cctttctatt 6840taccttggga agtgttatat atatgtccct gattatttct ttttccgttt cctttctatt 6840
ttaattttta aagttatttt tagatggttt tattttttga taagtggtaa gttgttaata 6900ttaattttta aagttatttt tagatggttt tattttttga taagtggtaa gttgttaata 6900
ttccaaatta aatgccattg tcataactat atacatttat aaagaatgat tgatcctagt 6960ttccaaatta aatgccattg tcataactat atacatttat aaagaatgat tgatcctagt 6960
ttctcattcc taagatccaa ataaggcaat aaacaatgtc ttagtaattg gacctgcttc 7020ttctcattcc taagatccaa ataaggcaat aaacaatgtc ttagtaattg gacctgcttc 7020
tggtgatcaa cgcttgatcg cgtagttagt tatagatgac tgtaaaaact ttaaccattt 7080tggtgatcaa cgcttgatcg cgtagttagt tatagatgac tgtaaaaact ttaaccattt 7080
taatggtttt gtcaaagaac aaatatcgga catattatag agaatggact attgtacttt 7140taatggtttt gtcaaagaac aaatatcgga catattatag agaatggact attgtacttt 7140
gcttctgatt ggtcatttta ttgtgatccg taaattggct gtgactgatg tcatatcttt 7200gcttctgatt ggtcatttta ttgtgatccg taaattggct gtgactgatg tcatatcttt 7200
gcttacagag gtaatctgaa tgataaatca aaacccataa ttttttcaat ggcaaggcta 7260gcttacagag gtaatctgaa tgataaatca aaacccataa ttttttcaat ggcaaggcta 7260
gaccatgtta agaacattac gggactagtt gagtgctatg ctaaaaatgc cacattgagg 7320gaccatgtta agaacattac gggactagtt gagtgctatg ctaaaaatgc cacattgagg 7320
gaattggcga accttgttgt agtagctgga tacaacgatg taaagaaatc cagtgataga 7380gaattggcga accttgttgt agtagctgga tacaacgatg taaagaaatc cagtgataga 7380
gaagaaataa cagaaattga gaagatgcat gctcttatta aggagcataa attggatggg 7440gaagaaataa cagaaattga gaagatgcat gctcttatta aggagcataa attggatggg 7440
caattcagat gggtatcagc ccaaacaaac cgggcacgta atggtgagct ctatcgctat 7500caattcagat gggtatcagc ccaaacaaac cgggcacgta atggtgagct ctatcgctat 7500
atagctgacc agagaggtat atttgttcag gtatgctatt tgtattgtat tagtccaatt 7560atagctgacc agagaggtat atttgttcag gtatgctatt tgtattgtat tagtccaatt 7560
tcattttttg caccaaaaga aaggttgtta ttgtgacgta tatgtttgtt ttagcctgca 76207620
ttttatgaag catttggact aacggtggtt gaagctatga cttgtggtct tccaacattt 7680ttttatgaag catttggact aacggtggtt gaagctatga cttgtggtct tccaacattt 7680
gcaacttgcc atggtggtcc taatgagatc attgaacccg gtgtatctgg gttccatatt 7740gcaacttgcc atggtggtcc taatgagatc attgaacccg gtgtatctgg gttccatatt 7740
gatccttatc atcccgataa agctgctgaa ctcatgtcag aattctttca acgctgcaaa 7800gatccttatc atcccgataa agctgctgaa ctcatgtcag aattctttca acgctgcaaa 7800
caagatccta ctcactggga aaaaatatct gcatctggtc tccgaaggat tcttgagagg 7860caagatccta ctcactggga aaaaatatct gcatctggtc tccgaaggat tcttgagagg 7860
tctgtagttg tgtacatgta tagaagatta aagaatgcta ccttgatatt tatttgaatc 7920tctgtagttg tgtacatgta tagaagatta aagaatgcta ccttgatatt tatttgaatc 7920
aaaaataaca ggaacatctc ttttttgaac atcactcaag ttcttatatt aaataatttt 7980aaaaataaca ggaacatctc ttttttgaac atcactcaag ttcttatatt aaataatttt 7980
taggtatacg tggaagattt actccgagag gctgatgact ttatctggcg tatatggttt 8040taggtatacg tggaagattt actccgagag gctgatgact ttatctggcg tatatggttt 8040
ctggaagctt gtttcaaaac ttgagaggcg tgaaactaga cgataccttg agatgttcta 8100ctggaagctt gtttcaaaac ttgagaggcg tgaaactaga cgataccttg agatgttcta 8100
cattctcaaa ttccgcgagt tggtgagtgc cttttagctc cttttcagtt ccaataaact 8160cattctcaaa ttccgcgagt tggtgagtgc cttttagctc cttttcagtt ccaataaact 8160
atatatgtgg tttaagtaag tattaagcat aaacatgtcc gtgcttgggg ctgtcgaaaa 8220atatatgtgg tttaagtaag tattaagcat aaacatgtcc gtgcttgggg ctgtcgaaaa 8220
tgctatggac atatcctgag ctaaggattt ttcaagaaaa ttgatgttag ctttactcta 8280tgctatggac atatcctgag ctaaggattt ttcaagaaaa ttgatgttag ctttactcta 8280
tttacaggca aaatctgtac ctctagcaat tgatgacaag tga 8323tttacaggca aaatctgtac ctctagcaat tgatgacaag tga 8323
<210> 10<210> 10
<211> 810<211> 810
<212> БЕЛОК<212> PROTEIN
<213> Nicotiana tabacum<213> Nicotiana tabacum
<400> 10<400> 10
Met Ala Asn Pro Lys Phe Thr Arg Val Pro Ser Met Arg Glu Arg Val Met Ala Asn Pro Lys Phe Thr Arg Val Pro Ser Met Arg Glu Arg Val
1 5 10 15 1 5 10 15
Glu Asp Thr Leu Ser Ala His Arg Asn Gln Leu Val Ala Leu Leu Ser Glu Asp Thr Leu Ser Ala His Arg Asn Gln Leu Val Ala Leu Leu Ser
20 25 30 20 25 30
Arg Tyr Val Ala Gln Gly Lys Gly Ile Leu Gln Pro His His Leu Ile Arg Tyr Val Ala Gln Gly Lys Gly Ile Leu Gln Pro His His Leu Ile
35 40 45 35 40 45
Asp Glu Phe Asn Asn Ala Val Cys Asp Asp Thr Ala Cys Glu Lys Leu Asp Glu Phe Asn Asn Ala Val Cys Asp Asp Thr Ala Cys Glu Lys Leu
50 55 60 50 55 60
Lys Asp Gly Pro Phe Ser Glu Val Leu Lys Ala Thr Gln Glu Ala Ile Lys Asp Gly Pro Phe Ser Glu Val Leu Lys Ala Thr Gln Glu Ala Ile
65 70 75 80 65 70 75 80
Val Leu Pro Pro Phe Val Ala Ile Ala Val Arg Pro Arg Pro Gly Val Val Leu Pro Pro Phe Val Ala Ile Ala Val Arg Pro Arg Pro Gly Val
85 90 95 85 90 95
Trp Glu Tyr Val Arg Val Asn Val Tyr Asp Leu Ser Val Glu Gln Leu Trp Glu Tyr Val Arg Val Asn Val Tyr Asp Leu Ser Val Glu Gln Leu
100 105 110 100 105 110
Thr Val Pro Glu Tyr Leu His Phe Lys Glu Glu Leu Val Asp Gly Glu Thr Val Pro Glu Tyr Leu His Phe Lys Glu Glu Leu Val Asp Gly Glu
115 120 125 115 120 125
Gly Asn Asn His Phe Val Leu Glu Leu Asp Phe Glu Pro Phe Asn Ala Gly Asn Asn His Phe Val Leu Glu Leu Asp Phe Glu Pro Phe Asn Ala
130 135 140 130 135 140
Ser Val Pro Arg Pro Ser Arg Ser Ser Ser Ile Gly Asn Gly Val Gln Ser Val Pro Arg Pro Ser Arg Ser Ser Ser Ile Gly Asn Gly Val Gln
145 150 155 160 145 150 155 160
Phe Leu Asn Arg His Leu Ser Ser Ile Met Phe Arg Ser Lys Asp Ser Phe Leu Asn Arg His Leu Ser Ser Ile Met Phe Arg Ser Lys Asp Ser
165 170 175 165 170 175
Leu Asp Pro Leu Leu Asp Phe Leu Arg Gly His Cys His Lys Gly Asn Leu Asp Pro Leu Leu Asp Phe Leu Arg Gly His Cys His Lys Gly Asn
180 185 190 180 185 190
Val Leu Met Leu Asn Asp Arg Ile Gln Arg Ile Ser Arg Leu Glu Ser Val Leu Met Leu Asn Asp Arg Ile Gln Arg Ile Ser Arg Leu Glu Ser
195 200 205 195 200 205
Ala Leu Ser Lys Ala Glu Asp Tyr Leu Ser Lys Leu Ser Pro Asp Thr Ala Leu Ser Lys Ala Glu Asp Tyr Leu Ser Lys Leu Ser Pro Asp Thr
210 215 220 210 215 220
Ser Tyr Asn Glu Phe Glu Tyr Ala Leu Gln Glu Met Gly Phe Glu Arg Ser Tyr Asn Glu Phe Glu Tyr Ala Leu Gln Glu Met Gly Phe Glu Arg
225 230 235 240 225 230 235 240
Gly Trp Gly Asp Thr Ala Arg Arg Val Leu Glu Thr Met His Leu Leu Gly Trp Gly Asp Thr Ala Arg Arg Val Leu Glu Thr Met His Leu Leu
245 250 255 245 250 255
Ser Asp Ile Leu Gln Ala Pro Asp Pro Ser Thr Leu Glu Thr Phe Leu Ser Asp Ile Leu Gln Ala Pro Asp Pro Ser Thr Leu Glu Thr Phe Leu
260 265 270 260 265 270
Gly Arg Leu Pro Met Val Phe Asn Val Val Ile Leu Ser Pro His Gly Gly Arg Leu Pro Met Val Phe Asn Val Val Ile Leu Ser Pro His Gly
275 280 285 275 280 285
Tyr Phe Gly Gln Ala Asn Val Leu Gly Leu Pro Asp Thr Gly Gly Gln Tyr Phe Gly Glyn Ala Asn Val Leu Gly Leu Pro Asp Thr Gly Gly Gln
290 295 300 290 295 300
Val Val Tyr Ile Leu Asp Gln Val Arg Ala Leu Glu Ala Glu Met Leu Val Val Tyr Ile Leu Asp Gln Val Arg Ala Leu Glu Ala Glu Met Leu
305 310 315 320 305 310 315 320
Leu Arg Ile Lys Gln Gln Gly Leu Asn Phe Lys Pro Arg Ile Leu Val Leu Arg Ile Lys Gln Gln Gly Leu Asn Phe Lys Pro Arg Ile Leu Val
325 330 335 325 330 335
Val Thr Arg Leu Ile Pro Asp Ala Lys Gly Thr Met Cys Asn Gln Arg Val Thr Arg Leu Ile Pro Asp Ala Lys Gly Thr Met Cys Asn Gln Arg
340 345 350 340 345 350
Leu Glu Arg Ile Ser Gly Thr Glu Tyr Ser His Ile Leu Arg Val Pro Leu Glu Arg Ile Ser Gly Thr Glu Tyr Ser His Ile Leu Arg Val Pro
355 360 365 355 360 365
Phe Arg Thr Glu Lys Gly Ile Leu His Lys Trp Ile Ser Arg Phe Asp Phe Arg Thr Glu Lys Gly Ile Leu His Lys Trp Ile Ser Arg Phe Asp
370 375 380 370 375 380
Val Trp Pro Tyr Leu Glu Lys Phe Thr Glu Asp Val Ala Ser Glu Met Val Trp Pro Tyr Leu Glu Lys Phe Thr Glu Asp Val Ala Ser Glu Met
385 390 395 400 385 390 395 400
Thr Ala Glu Leu Gln Gly Lys Pro Asp Leu Ile Ile Gly Asn Tyr Ser Thr Ala Glu Leu Gln Gly Lys Pro Asp Leu Ile Ile Gly Asn Tyr Ser
405 410 415 405 410 415
Asp Gly Asn Leu Val Ala Ser Leu Leu Ala Tyr Lys Met Gly Val Thr Asp Gly Asn Leu Val Ala Ser Leu Leu Ala Tyr Lys Met Gly Val Thr
420 425 430 420 425 430
Gln Cys Thr Ile Ala His Ala Leu Glu Lys Thr Lys Tyr Pro Asp Ser Gln Cys Thr Ile Ala His Ala Leu Glu Lys Thr Lys Tyr Pro Asp Ser
435 440 445 435 440 445
Asp Ile Tyr Trp Lys Lys Phe Glu Glu Lys Tyr His Phe Ser Cys Gln Asp Ile Tyr Trp Lys Lys Phe Glu Glu Lys Tyr His Phe Ser Cys Gln
450 455 460 450 455 460
Phe Thr Ala Asp Leu Leu Ala Met Asn Asn Ser Asp Phe Ile Ile Thr Phe Thr Ala Asp Leu Leu Ala Met Asn Asn Ser Asp Phe Ile Ile Thr
465 470 475 480 465 470 475 480
Ser Thr Tyr Gln Glu Ile Ala Gly Thr Lys Asn Thr Val Gly Gln Tyr Ser Thr Tyr Gln Glu Ile Ala Gly Thr Lys Asn Thr Val Gly Gln Tyr
485 490 495 485 490 495
Glu Ser His Thr Ala Phe Thr Leu Pro Gly Leu Tyr Arg Val Val His Glu Ser His Thr Ala Phe Thr Leu Pro Gly Leu Tyr Arg Val Val His
500 505 510 500 505 510
Gly Ile Asp Val Phe Asp Pro Lys Phe Asn Ile Val Ser Pro Gly Ala Gly Ile Asp Val Phe Asp Pro Lys Phe Asn Ile Val Ser Pro Gly Ala
515 520 525 515 520 525
Asp Met Thr Ile Tyr Phe Pro Tyr Ser Asp Lys Glu Lys Arg Leu Thr Asp Met Thr Ile Tyr Phe Pro Tyr Ser Asp Lys Glu Lys Arg Leu Thr
530 535 540 530 535 540
Ser Leu His Gly Ser Ile Glu Lys Leu Leu Phe Asp Pro Ala Gln Asn Ser Leu His Gly Ser Ile Glu Lys Leu Leu Phe Asp Pro Ala Gln Asn
545 550 555 560 545 550 555 560
Glu Glu His Ile Gly Asn Leu Asn Asp Lys Ser Lys Pro Ile Ile Phe Glu Glu His Ile Gly Asn Leu Asn Asp Lys Ser Lys Pro Ile Ile Phe
565 570 575 565 570 575
Ser Met Ala Arg Leu Asp His Val Lys Asn Ile Thr Gly Leu Val Glu Ser Met Ala Arg Leu Asp His Val Lys Asn Ile Thr Gly Leu Val Glu
580 585 590 580 585 590
Cys Tyr Ala Lys Asn Ala Thr Leu Arg Glu Leu Ala Asn Leu Val Val Cys Tyr Ala Lys Asn Ala Thr Leu Arg Glu Leu Ala Asn Leu Val Val
595 600 605 595 600 605
Val Ala Gly Tyr Asn Asp Val Lys Lys Ser Ser Asp Arg Glu Glu Ile Val Ala Gly Tyr Asn Asp Val Lys Lys Ser Ser Asp Arg Glu Glu Ile
610 615 620 610 615 620
Thr Glu Ile Glu Lys Met His Ala Leu Ile Lys Glu His Lys Leu Asp Thr Glu Ile Glu Lys Met His Ala Leu Ile Lys Glu His Lys Leu Asp
625 630 635 640 625 630 635 640
Gly Gln Phe Arg Trp Val Ser Ala Gln Thr Asn Arg Ala Arg Asn Gly Gly Gln Phe Arg Trp Val Ser Ala Gln Thr Asn Arg Ala Arg Asn Gly
645 650 655 645 650 655
Glu Leu Tyr Arg Tyr Ile Ala Asp Gln Arg Gly Ile Phe Val Gln Pro Glu Leu Tyr Arg Tyr Ile Ala Asp Gln Arg Gly Ile Phe Val Gln Pro
660 665 670 660 665 670
Ala Phe Tyr Glu Ala Phe Gly Leu Thr Val Val Glu Ala Met Thr Cys Ala Phe Tyr Glu Ala Phe Gly Leu Thr Val Val Glu Ala Met Thr Cys
675 680 685 675 680 685
Gly Leu Pro Thr Phe Ala Thr Cys His Gly Gly Pro Asn Glu Ile Ile Gly Leu Pro Thr Phe Ala Thr Cys His Gly Gly Pro Asn Glu Ile Ile
690 695 700 690 695 700
Glu Pro Gly Val Ser Gly Phe His Ile Asp Pro Tyr His Pro Asp Lys Glu Pro Gly Val Ser Gly Phe His Ile Asp Pro Tyr His Pro Asp Lys
705 710 715 720 705 710 715 720
Ala Ala Glu Leu Met Ser Glu Phe Phe Gln Arg Cys Lys Gln Asp Pro Ala Ala Glu Leu Met Ser Glu Phe Phe Gln Arg Cys Lys Gln Asp Pro
725 730 735 725 730 735
Thr His Trp Glu Lys Ile Ser Ala Ser Gly Leu Arg Arg Ile Leu Glu Thr His Trp Glu Lys Ile Ser Ala Ser Gly Leu Arg Arg Ile Leu Glu
740 745 750 740 745 750
Arg Tyr Thr Trp Lys Ile Tyr Ser Glu Arg Leu Met Thr Leu Ser Gly Arg Tyr Thr Trp Lys Ile Tyr Ser Glu Arg Leu Met Thr Leu Ser Gly
755 760 765 755 760 765
Val Tyr Gly Phe Trp Lys Leu Val Ser Lys Leu Glu Arg Arg Glu Thr Val Tyr Gly Phe Trp Lys Leu Val Ser Lys Leu Glu Arg Arg Glu Thr
770 775 780 770 775 780
Arg Arg Tyr Leu Glu Met Phe Tyr Ile Leu Lys Phe Arg Glu Leu Ala Arg Arg Tyr Leu Glu Met Phe Tyr Ile Leu Lys Phe Arg Glu Leu Ala
785 790 795 800 785 790 795 800
Lys Ser Val Pro Leu Ala Ile Asp Asp Lys Lys Ser Val Pro Leu Ala Ile Asp Asp Lys
805 810 805 810
<210> 11<210> 11
<211> 3604<211> 3604
<212> ДНК<212> DNA
<213> Nicotiana tabacum<213> Nicotiana tabacum
<400> 11<400> 11
atgtttacat ggctgaaact caatataaaa aacaagggta ggtgatcaaa aatcgttgga 60atgtttacat ggctgaaact caatataaaa aacaagggta ggtgatcaaa aatcgttgga 60
tgcttaaaat cagtagacgt tttgctaaat gagcgaccaa tgttattgaa aacgttcatg 120120
ttttcaaccc ttttggcata catttgagca ttgcccaaga ttttggataa gtagatgcag 180ttttcaaccc ttttggcata catttgagca ttgcccaaga ttttggataa gtagatgcag 180
tgcttataat tttaaagcat tgtatcctgc cttgtttttc attgtcaaaa ttaattaact 240tgcttataat tttaaagcat tgtatcctgc cttgtttttc attgtcaaaa ttaattaact 240
tacaagtatt tctataagtt gcttcataaa ttagaagtaa atctggattg tgtaatgtta 300tacaagtatt tctataagtt gcttcataaa ttagaagtaa atctggattg tgtaatgtta 300
ttcgcctcgt aaatactgaa agctgcttga acaagtgaaa aaacacagac aaacgtaaca 360ttcgcctcgt aaatactgaa agctgcttga acaagtgaaa aaacacagac aaacgtaaca 360
ttctccatgg attgatgaga cttgtaaaat acatatatag aaatttggct tgtaaccaca 420ttctccatgg attgatgaga cttgtaaaat acatatatag aaatttggct tgtaaccaca 420
tgtatattat gccatatgga tgtgacattg atgtgactag acctaaatgt tttgtttcca 480tgtatattat gccatatgga tgtgacattg atgtgactag acctaaatgt tttgtttcca 480
tgtccactgg agttttacgt atagttaaga ggagaaaaga ctgaggaata ctaatgtatg 540tgtccactgg agttttacgt atagttaaga ggagaaaaga ctgaggaata ctaatgtatg 540
atggtacccc tttgcttctt gacctggata cccagtgttc ctattcatgc ctatactttg 600atggtacccc tttgcttctt gacctggata cccagtgttc ctattcatgc ctatactttg 600
gtccttgatt tcactctccc ttttctaact tgagctgcat caaagaaatt tccactgtaa 660gtccttgatt tcactctccc ttttctaact tgagctgcat caaagaaatt tccactgtaa 660
aaaaataaat aatgctcacc atatctctgc aacattgcaa acatgtatcc catatgattg 720aaaaataaat aatgctcacc atatctctgc aacattgcaa acatgtatcc catatgattg 720
atattggtgc gacatggcaa acatgtatcc tatttgatga tcaatcaaat ttatttttcc 780atattggtgc gacatggcaa acatgtatcc tatttgatga tcaatcaaat ttatttttcc 780
cctgtcaaaa tgacctcagt gtgtaattcc ctatgtattt gatagcattg taactcgtgt 840840
catgattcat gaatagggta ctagaattgc atggttgaca aatattaact ggtcgattga 900catgattcat gaatagggta ctagaattgc atggttgaca aatattaact ggtcgattga 900
tgatccacaa aacatgcact tactgactaa aatgtgatgg gacagattta tttttgtttg 960tgatccacaa aacatgcact tactgactaa aatgtgatgg gacagattta ttttgtttg 960
tgattaacac agtacttaac cctatactta atacaatttg gcctagctac aatcttttct 1020tgattaacac agtacttaac cctatactta atacaatttg gcctagctac aatcttttct 1020
tcagtgcaaa ttccttgtta cacgaccaat attgtctttc tgagttctat tctgttgtta 1080tcagtgcaaa ttccttgtta cacgaccaat attgtctttc tgagttctat tctgttgtta 1080
cttacacttt tattattcga ataagacatt agattgcttg catgcaaatt gatagccact 1140cttacacttt tattattcga ataagacatt agattgcttg catgcaaatt gatagccact 1140
tgtttcagga agaatactgt tggtcagtac gagagccata ctgcattcac cctcccagga 1200tgtttcagga agaatactgt tggtcagtac gagagccata ctgcattcac cctcccagga 1200
ctatatcgcg tcgttcatgg cattgatgtt ttcgatccca aattcaatat agtgtctcct 1260ctatatcgcg tcgttcatgg cattgatgtt ttcgatccca aattcaatat agtgtctcct 1260
ggagctgaca tgacaattta cttcccatat tctgacaagg aaaaaagact aacgtctttg 1320ggagctgaca tgacaattta cttcccatat tctgacaagg aaaaaagact aacgtctttg 1320
catggctcga ttgagaagtt gttatttgat cctgcgcaga atgaagagca tatgtaagtg 1380catggctcga ttgagaagtt gttatttgat cctgcgcaga atgaagagca tatgtaagtg 1380
acatccattt gtacttattt taatttggaa tagatgacat acttatttgc atgaatataa 1440acatccatt gtacttattt taatttggaa tagatgacat acttatttgc atgaatataa 1440
actgacaacc cagagatttc ctacattaga aaaggagggt ctgatatgat tttctacaaa 1500actgacaacc cagagatttc ctacattaga aaaggagggt ctgatatgat tttctacaaa 1500
taaattccca gtgatattgt tcaaaaagtc ctggatactt tattatgaga gaaccaggga 1560taaattccca gtgatattgt tcaaaaagtc ctggatactt tattatgaga gaaccaggga 1560
tagatggcac tagaatccct taatcttgag aagtcgccac ttatcgctcc caacactttc 1620tagatggcac tagaatccct taatcttgag aagtcgccac ttatcgctcc caacactttc 1620
tgagaccctc aagtaactac tattattgtt tgatatcttg gagaagctat aagaatcttt 1680tgagaccctc aagtaactac tattattgtt tgatatcttg gagaagctat aagaatcttt 1680
ttctccttat tgtaattttt tttacgtgac tttaaactta acttccaagc tccttctgat 1740ttctccttat tgtaattttt tttacgtgac tttaaactta acttccaagc tccttctgat 1740
aaaatgcaaa aactgtctgt attcactgtc ttggtttatt aacaattgat ccaatcaaat 1800aaaatgcaaa aactgtctgt attcactgtc ttggtttatt aacaattgat ccaatcaaat 1800
gcatatggaa catctttctt tttgtttctt caaaagttcg tttgaggata aggagtagaa 18601860
tctgagaaga tagactagta ggtaacctta ggggcggatg tagaaatcaa cgtatgggtt 1920tctgagaaga tagactagta ggtaacctta ggggcggatg tagaaatcaa cgtatgggtt 1920
cagctttgtt gcagaccctg tatatgcatt aaaaaaatca ctaaataagt aaataattga 1980cagctttgtt gcagaccctg tatatgcatt aaaaaaatca ctaaataagt aaataattga 1980
ttttgaaccc agtaaatcaa aatgagttgt agtagaatcc tgaactcgaa ccgataaagt 2040ttttgaaccc agtaaatcaa aatgagttgt agtagaatcc tgaactcgaa ccgataaagt 2040
tggatccact accgggtaaa ctctaccttg agaagtgttt atatatgtcc ctaattattt 2100tggatccact accgggtaaa ctctaccttg agaagtgttt atatatgtcc ctaattattt 2100
cttttctgtt tcctttctat tttaattttt taagttcctt tttagatggt tttatttttt 21602160
gacaagtggt aagttgttag tattccaaat taaatgccat tgccataact atatacattt 2220gacaagtggt aagttgttag tattccaaat taaatgccat tgccataact atatacattt 2220
ataaagattg attgacccta gtttctcatt cctaagatcc aaataaggca ataaacaata 22802280
tgtcttagta cttgaacctg cttctggtgg tcaacacttg atcgcgtagt tagttataga 23402340
tgactgtaaa aaccttaatc attttaatgg ttttgtcaaa gaacaaatat cggacatatt 2400tgactgtaaa aaccttaatc attttaatgg ttttgtcaaa gaacaaatat cggacatatt 2400
atagcgaatg gactattgta cttttcttct gattggtcat tttattgtga tccgtaagtt 2460atagcgaatg gactattgta cttttcttct gattggtcat tttattgtga tccgtaagtt 2460
ggctgagact gatgtcatat ctttgcttac agaggtaatc tgaatgataa atcaaaaccc 2520ggctgagact gatgtcatat ctttgcttac agaggtaatc tgaatgataa atcaaaaccc 2520
ataatttttt caatggcaag gctagaccat gttaagaaca ttacgggact agttgagtgc 2580ataatttttt caatggcaag gctagaccat gttaagaaca ttacgggact agttgagtgc 2580
tatgctaaaa atgccacatt gagggaattg gctaaccttg ttgttgtagc tggatacaac 2640tatgctaaaa atgccacatt gagggaattg gctaaccttg ttgttgtagc tggatacaac 2640
gatgtaaaga aatccagtga tagagaagaa atagcagaaa ttgagaagat gcatgctctt 2700gatgtaaaga aatccagtga tagagaagaa atagcagaaa ttgagaagat gcatgctctt 2700
attaaggagc ataaattgga tgggcaattc agatggatag cagcccaaac aaaccgggca 2760attaaggagc ataaattgga tgggcaattc agatggatag cagcccaaac aaaccgggca 2760
cgtaatggtg agctctatcg ctatatagct gacaagagag gtatatttgt tcaggtacgc 2820cgtaatggtg agctctatcg ctatatagct gacaagagag gtatatttgt tcaggtacgc 2820
tgtttgtatt gtatttgtcc acattccttt ttttgcaccg aaagaaaggt tgttattgtg 2880tgtttgtatt gtatttgtcc acattccttt ttttgcaccg aaagaaaggt tgttattgtg 2880
acaaatatgt ttgttttagc ctgcatttta tgaagcattt ggactcacgg tggttgaagc 2940acaaatatgt ttgttttagc ctgcatttta tgaagcattt ggactcacgg tggttgaagc 2940
tatgacttgt ggtcttccaa catttgcaac ttgccatggt ggtccgaacg agatcattga 3000tatgacttgt ggtcttccaa catttgcaac ttgccatggt ggtccgaacg agatcattga 3000
acacggtgta tctgggttcc atattgatcc ttatcatccc gataaagctg ctgaactcat 3060acacggtgta tctgggttcc atattgatcc ttatcatccc gataaagctg ctgaactcat 3060
ggcagaattc tttcaacgct gcaaacaaga tcctactcac tgggaaaaaa tatctgcatc 3120ggcagaattc tttcaacgct gcaaacaaga tcctactcac tgggaaaaaa tatctgcatc 3120
tggtctccga aggattcttg agaggtttgt agttgtgtac atatatagaa gattaaagat 31803180
tgttcccttg atattatttg aatgaaaaat aacagtaaca tctctttttg aacatcgctc 3240tgttcccttg atattatttg aatgaaaaat aacagtaaca tctctttttg aacatcgctc 3240
aagttcttgt gttaaataat tgttaggtat acgtggaaaa tttactccga gaggctgatg 3300aagttcttgt gttaaataat tgttaggtat acgtggaaaa tttactccga gaggctgatg 3300
actttgtctg gtgtatatgg tttctggaag cttgtttcaa aacttgagag gcgcgaaact 3360actttgtctg gtgtatatgg tttctggaag cttgtttcaa aacttgagag gcgcgaaact 3360
agacgatacc ttgagatgtt ctacattctc aaattccgcg agttggtgag tgcctttttg 3420agacgatacc ttgagatgtt ctacattctc aaattccgcg agttggtgag tgcctttttg 3420
ctcattttca gttacaatca actatatatg tggtttaaat acgtattaag cataaacatg 3480ctcattttca gttacaatca actatatatg tggtttaaat acgtattaag cataaacatg 3480
tccgtgattg cggctgtcga aaatgctatg gacatatcct gagctaagga gttttcaaga 3540tccgtgattg cggctgtcga aaatgctatg gacatatcct gagctaagga gttttcaaga 3540
gaattgattt ggcttactct gtttacaggc aaaatctgtt cctctggcaa ttgatgacaa 3600gaattgattt ggcttactct gtttacaggc aaaatctgtt cctctggcaa ttgatgacaa 3600
gtga 3604gtga 3604
<210> 12<210> 12
<211> 335<211> 335
<212> БЕЛОК<212> PROTEIN
<213> Nicotiana tabacum<213> Nicotiana tabacum
<400> 12<400> 12
Met Phe Thr Trp Leu Lys Leu Asn Ile Lys Asn Lys Gly Arg Lys Asn Met Phe Thr Trp Leu Lys Leu Asn Ile Lys Asn Lys Gly Arg Lys Asn
1 5 10 15 1 5 10 15
Thr Val Gly Gln Tyr Glu Ser His Thr Ala Phe Thr Leu Pro Gly Leu Thr Val Gly Gln Tyr Glu Ser His Thr Ala Phe Thr Leu Pro Gly Leu
20 25 30 20 25 30
Tyr Arg Val Val His Gly Ile Asp Val Phe Asp Pro Lys Phe Asn Ile Tyr Arg Val Val His Gly Ile Asp Val Phe Asp Pro Lys Phe Asn Ile
35 40 45 35 40 45
Val Ser Pro Gly Ala Asp Met Thr Ile Tyr Phe Pro Tyr Ser Asp Lys Val Ser Pro Gly Ala Asp Met Thr Ile Tyr Phe Pro Tyr Ser Asp Lys
50 55 60 50 55 60
Glu Lys Arg Leu Thr Ser Leu His Gly Ser Ile Glu Lys Leu Leu Phe Glu Lys Arg Leu Thr Ser Leu His Gly Ser Ile Glu Lys Leu Leu Phe
65 70 75 80 65 70 75 80
Asp Pro Ala Gln Asn Glu Glu His Ile Gly Asn Leu Asn Asp Lys Ser Asp Pro Ala Gln Asn Glu Glu His Ile Gly Asn Leu Asn Asp Lys Ser
85 90 95 85 90 95
Lys Pro Ile Ile Phe Ser Met Ala Arg Leu Asp His Val Lys Asn Ile Lys Pro Ile Ile Phe Ser Met Ala Arg Leu Asp His Val Lys Asn Ile
100 105 110 100 105 110
Thr Gly Leu Val Glu Cys Tyr Ala Lys Asn Ala Thr Leu Arg Glu Leu Thr Gly Leu Val Glu Cys Tyr Ala Lys Asn Ala Thr Leu Arg Glu Leu
115 120 125 115 120 125
Ala Asn Leu Val Val Val Ala Gly Tyr Asn Asp Val Lys Lys Ser Ser Ala Asn Leu Val Val Val Ala Gly Tyr Asn Asp Val Lys Lys Ser Ser
130 135 140 130 135 140
Asp Arg Glu Glu Ile Ala Glu Ile Glu Lys Met His Ala Leu Ile Lys Asp Arg Glu Glu Ile Ala Glu Ile Glu Lys Met His Ala Leu Ile Lys
145 150 155 160 145 150 155 160
Glu His Lys Leu Asp Gly Gln Phe Arg Trp Ile Ala Ala Gln Thr Asn Glu His Lys Leu Asp Gly Gln Phe Arg Trp Ile Ala Ala Gln Thr Asn
165 170 175 165 170 175
Arg Ala Arg Asn Gly Glu Leu Tyr Arg Tyr Ile Ala Asp Lys Arg Gly Arg Ala Arg Asn Gly Glu Leu Tyr Arg Tyr Ile Ala Asp Lys Arg Gly
180 185 190 180 185 190
Ile Phe Val Gln Pro Ala Phe Tyr Glu Ala Phe Gly Leu Thr Val Val Ile Phe Val Gln Pro Ala Phe Tyr Glu Ala Phe Gly Leu Thr Val Val
195 200 205 195 200 205
Glu Ala Met Thr Cys Gly Leu Pro Thr Phe Ala Thr Cys His Gly Gly Glu Ala Met Thr Cys Gly Leu Pro Thr Phe Ala Thr Cys His Gly Gly
210 215 220 210 215 220
Pro Asn Glu Ile Ile Glu His Gly Val Ser Gly Phe His Ile Asp Pro Pro Asn Glu Ile Ile Glu His Gly Val Ser Gly Phe His Ile Asp Pro
225 230 235 240 225 230 235 240
Tyr His Pro Asp Lys Ala Ala Glu Leu Met Ala Glu Phe Phe Gln Arg Tyr His Pro Asp Lys Ala Ala Glu Leu Met Ala Glu Phe Phe Gln Arg
245 250 255 245 250 255
Cys Lys Gln Asp Pro Thr His Trp Glu Lys Ile Ser Ala Ser Gly Leu Cys Lys Gln Asp Pro Thr His Trp Glu Lys Ile Ser Ala Ser Gly Leu
260 265 270 260 265 270
Arg Arg Ile Leu Glu Arg Tyr Thr Trp Lys Ile Tyr Ser Glu Arg Leu Arg Arg Ile Leu Glu Arg Tyr Thr Trp Lys Ile Tyr Ser Glu Arg Leu
275 280 285 275 280 285
Met Thr Leu Ser Gly Val Tyr Gly Phe Trp Lys Leu Val Ser Lys Leu Met Thr Leu Ser Gly Val Tyr Gly Phe Trp Lys Leu Val Ser Lys Leu
290 295 300 290 295 300
Glu Arg Arg Glu Thr Arg Arg Tyr Leu Glu Met Phe Tyr Ile Leu Lys Glu Arg Arg Glu Thr Arg Arg Tyr Leu Glu Met Phe Tyr Ile Leu Lys
305 310 315 320 305 310 315 320
Phe Arg Glu Leu Ala Lys Ser Val Pro Leu Ala Ile Asp Asp Lys Phe Arg Glu Leu Ala Lys Ser Val Pro Leu Ala Ile Asp Asp Lys
325 330 335 325 330 335
<210> 13<210> 13
<211> 4030<211> 4030
<212> ДНК<212> DNA
<213> Nicotiana tabacum<213> Nicotiana tabacum
<400> 13<400> 13
atggcggaac gtgtgctgac tcgtgttcat agccttcgtg aacgtcttga tgctactttg 60atggcggaac gtgtgctgac tcgtgttcat agccttcgtg aacgtcttga tgctactttg 60
gctgctcatc gcaatgagat tttgctgttt ctttcaaggt atagtcttag cagattgttc 120gctgctcatc gcaatgagat tttgctgttt ctttcaaggt atagtcttag cagattgttc 120
tttgatttag ttgttattgc cagttctaat gtatgggctt atatataaac aaagtgttga 180tttgatttag ttgttattgc cagttctaat gtatgggctt atatataaac aaagtgttga 180
agtatgcaac catataaact gacagcttaa aatgcttgag agaacacact tttatttatt 240agtatgcaac catataaact gacagcttaa aatgcttgag agaacacact tttatttatt 240
taattatgcc ttcagcacaa gaagtggaac ttgacgcaat ggaaccatag gtcacgggtt 300taattatgcc ttcagcacaa gaagtggaac ttgacgcaat ggaaccatag gtcacggggtt 300
caagtcttgg aacagcctgc aatctaaggc tgcgtgtagt agaccctagt ggtccggccc 360caagtcttgg aacagcctgc aatctaaggc tgcgtgtagt agaccctagt ggtccggccc 360
ttccacatat ctcgcttagt gtaccgggcc cattgagtac gggttcggcc gaacccagtc 420ttccacatat ctcgcttagt gtaccgggcc cattgagtac gggttcggcc gaacccagtc 420
gctttggtcc aatccatata tttgtcttaa aaatatattg aatatataca aattgttaat 480gctttggtcc aatccatata tttgtcttaa aaatatattg aatatataca aattgttaat 480
ttagtttaaa tatgtgtatc atgggttatt catgctggtt ttggctgttg caggattgaa 540540
agccatggaa aagggatact gaaacctcac cagttgctgg ctgaatttga ttcaattcac 600agccatggaa aagggatact gaaacctcac cagttgctgg ctgaatttga ttcaattcac 600
aaagaagaca aaaacaaact gaatgatcat gcttttgaag aagtcctgaa atccactcag 660aaagaagaca aaaacaaact gaatgatcat gcttttgaag aagtcctgaa atccactcag 660
gtatttgtgg ttttagtgtt aggtgatgga tagcatttat tgttttacta agatcacata 720gtatttgtgg ttttagtgtt aggtgatgga tagcatttat tgttttacta agatcacata 720
tgtgtcagtt tgtggctagt atttaaaatc tggtgtattt tgtcatacta ggaagcaatt 780tgtgtcagtt tgtggctagt atttaaaatc tggtgtattt tgtcatacta ggaagcaatt 780
gttttgtccc cttgggttgc gcttgccatt cgtctgaggc ctggtgtgtg ggaatacgtt 840gttttgtccc cttgggttgc gcttgccatt cgtctgaggc ctggtgtgtg ggaatacgtt 840
cgtgtgaatg tcaacgctct tgttgttgag gagcttaccg tgcctgagta tttgcaattc 900cgtgtgaatg tcaacgctct tgttgttgag gagcttaccg tgcctgagta tttgcaattc 900
aaggaagaac ttgttaatgg aacgtaagtt ttaggttcga atttgttgat ttgttagata 960aaggaagaac ttgttaatgg aacgtaagtt ttaggttcga atttgttgat ttgttagata 960
acatgttctg aactttttga ttaaagttgt gtttttgact gatgcagctc gcacgataac 1020acatgttctg aactttttga ttaaagttgt gtttttgact gatgcagctc gcacgataac 1020
tttgttcttg agttggattt tgagcccttc actgcatcat ttccaaaacc aaccctcacc 1080tttgttcttg agttggattt tgagcccttc actgcatcat ttccaaaacc aaccctcacc 1080
aaatcaattg gaaatggagt tgaattcctt aaccgacacc tctctgccaa aatgttccat 1140aaatcaattg gaaatggagt tgaattcctt aaccgacacc tctctgccaa aatgttccat 1140
gacaaggaaa gcatgacccc tcttctcgag tttcttcgag ttcaccacta caagggcaag 1200gacaaggaaa gcatgacccc tcttctcgag tttcttcgag ttcaccacta caagggcaag 1200
gtaaacttgt ttttcctgtt tgtctatgaa tttagtttag ttgttttgct ccgcgaaaat 1260gtaaacttgt ttttcctgtt tgtctatgaa tttagtttag ttgttttgct ccgcgaaaat 1260
ttcagtggaa actgatttat gcaaccactg agtgattaat atgttcaaac ttaccgactt 1320ttcagtggaa actgattat gcaaccactg agtgattaat atgttcaaac ttaccgactt 1320
ctggttttct gtgtagacaa tgatgctgaa tgacagaatt caggacttaa atactctcca 1380ctggttttct gtgtagacaa tgatgctgaa tgacagaatt caggacttaa atactctcca 1380
aaatgtccta aggaaagctg aggaatacct cactaccctt tcccctgaaa cttcatactc 1440aaatgtccta aggaaagctg aggaatacct cactaccctt tcccctgaaa cttcatactc 1440
ggcatttgag cacaagttcc aagaaattgg cttggagagg ggttggggtg acactgcgga 1500ggcatttgag cacaagttcc aagaaattgg cttggagagg ggttggggtg acactgcgga 1500
gcgtgttcta gagatgatct gcatgctcct ggatctcctc gaggctcctg actcgtgcac 1560gcgtgttcta gagatgatct gcatgctcct ggatctcctc gaggctcctg actcgtgcac 1560
gcttgagaag ttccttggta gaattccaat ggtttttaat gtggtcatac tttcacccca 1620gcttgagaag ttccttggta gaattccaat ggtttttaat gtggtcatac tttcacccca 1620
tggttatttc gcccaggaaa atgtcttggg ttaccccgac actggtggcc aggtgcactg 1680tggttatttc gccggaaa atgtcttggg ttaccccgac actggtggcc aggtgcactg 1680
cttatctgtg ttcggtctta ttatctcttt aaaccctact gccacaagtg ctgagatgaa 1740cttatctgtg ttcggtctta ttatctcttt aaaccctact gccacaagtg ctgagatgaa 1740
cctcctttaa tttgcaggtt gtctatattt tggatcaagt tcctgctttg gagcgtgaga 1800cctcctttaa tttgcaggtt gtctatattt tggatcaagt tcctgctttg gagcgtgaga 1800
tgctcaagcg cataaaggag caaggacttg acatcaaacc gcgtattctt attgttcgta 1860tgctcaagcg cataaaggag caaggacttg acatcaaacc gcgtattctt attgttcgta 1860
ttcccagtaa ttgtgtttaa acttatgatt atgcaggatt ttatctgttc taatacagca 1920ttcccagtaa ttgtgtttaa acttatgatt atgcaggatt ttatctgttc taatacagca 1920
ctcttgctta aattctcagg ttactcggct gctgcctgat gcggttggta ccacttgtgg 1980ctcttgctta aattctcagg ttactcggct gctgcctgat gcggttggta ccacttgtgg 1980
tcagaggctt gagaaagtgt ttggaacaga gcactcacac attcttaggg tcccctttag 2040tcagaggctt gagaaagtgt ttggaacaga gcactcacac attcttaggg tcccctttag 2040
gaccgagaag ggcattgttc gcaaatggat ctctcgcttt gaagtctggc catacatgga 2100gaccgagaag ggcattgttc gcaaatggat ctctcgcttt gaagtctggc catacatgga 2100
gacattcact gaggtgaagc aagctttctc tattcatttt tcaatcttcc aattggtttt 2160gacattcact gaggtgaagc aagctttctc tattcatttt tcaatcttcc aattggtttt 2160
ggcagcaatt ttctgcttgc tttgacttcc gctaaaactt cggattttat tgcattagga 2220ggcagcaatt ttctgcttgc tttgacttcc gctaaaactt cggattttat tgcattagga 2220
tgtggcgaaa gaaattgctg cagaattgca ggctaagcca gatcttatca ttggcaatta 2280tgtggcgaaa gaaattgctg cagaattgca ggctaagcca gatcttatca ttggcaatta 2280
tagtgagggc aaccttgctg cctccttgtt ggctcacaaa ttaggtgtaa cacaggtcgg 2340tagtgagggc aaccttgctg cctccttgtt ggctcacaaa ttaggtgtaa cacaggtcgg 2340
caatgtttgt gacatgtaat ttcatctttg catttccttt cgtttgcaac taaaagattt 24002400
aagagttctc tctctctttt ttttttccgt ctactttgcc ttatgcagtg cacgatagct 2460aagagttctc tctctctttt ttttttccgt ctactttgcc ttatgcagtg cacgatagct 2460
catgctttgg agaaaacaaa atatcctgat tctgatatct acttgaagaa atttgatgaa 2520catgctttgg agaaaacaaa atatcctgat tctgatatct acttgaagaa atttgatgaa 2520
aaataccatt tctcagccca gtttactgcc gatcttattg caatgaatca caccgatttc 2580aaataccatt tctcagccca gtttactgcc gatcttattg caatgaatca caccgatttc 2580
atcatcacca gcactttcca ggagatagcg ggaaggtatt tttacatcag tttcccactc 2640atcatcacca gcactttcca ggagatagcg ggaaggtatt tttacatcag tttcccactc 2640
tgattaaatt acaatgtatt tccctatatg attaaatact gtgtttgatc ctaaatcatt 2700tgattaaatt acaatgtatt tccctatatg attaaatact gtgtttgatc ctaaatcatt 2700
tctaaatttt ccagcaagga cactgttgga cagtacgaga gccacatggc gttcacaatg 27602760
cctggactgt atagagttgt tcacggcatt gatgtgtttg accccaaatt taacattgtg 2820cctggactgt atagagttgt tcacggcatt gatgtgtttg accccaaatt taacattgtg 2820
tcaccaggag ctgatatgaa tctctatttc ccatactacg agaaggaaaa gagattgaca 2880tcaccaggag ctgatatgaa tctctatttc ccatactacg agaaggaaaa gagattgaca 2880
gcatatcacc ctgaaattga ggagctgctg tttagtgatg ttgagaatga cgaacacatg 2940gcatatcacc ctgaaattga ggagctgctg tttagtgatg ttgagaatga cgaacacatg 2940
tatgttacta aactagcaat cctgctgcaa aattatggct aattatgtaa acaagtttgt 30003000
actgaataga tttgttattc gatcaggtgt gtgctgaaga acaggaataa gcctatcata 30603060
ttcactatgg ctagattgga tcgagtgaag aacttaactg gacttgtcga gctgtacgcc 3120ttcactatgg ctagattggga tcgagtgaag aacttaactg gacttgtcga gctgtacgcc 3120
aagaacccac ggctaaggga gttggttaac cttgtcgtgg ttggaggaga ccgaaggaaa 3180aagaacccac ggctaaggga gttggttaac cttgtcgtgg ttggaggaga ccgaaggaaa 3180
gaatccaaag acttggaaga acaggcagag atgaagaaga tgtacgaact tataaagact 3240gaatccaaag acttggaaga acaggcagag atgaagaaga tgtacgaact tataaagact 3240
cacaatttga acggccaatt ccgatggatt tcttcccaga tgaaccgcgt gaggaatggc 3300cacaatttga acggccaatt ccgatggatt tcttcccaga tgaaccgcgt gaggaatggc 3300
gaactctaca ggtacattgc cgatactagg ggagctttcg tgcagcctgc attttacgag 33603360
gcttttggtt tgactgttgt tgaggccatg acctgtggtt tgcctacatt tgcaactaat 3420gcttttggtt tgactgttgt tgaggccatg acctgtggtt tgcctacatt tgcaactaat 3420
cacggtggtc cagctgagat catcgttcac gggaaatctg gtttccacat tgatccatac 3480cacggtggtc cagctgagat catcgttcac gggaaatctg gtttccacat tgatccatac 3480
cacggggatc aggcagctga acttctcgct gatttctttg agaaatgtaa gaaagaacct 3540cacggggatc aggcagctga acttctcgct gatttctttg agaaatgtaa gaaagaacct 3540
tcgcactggg aagccatttc cgagggcggc cttaagcgta tacaggagaa gtaagcaaac 3600tcgcactggg aagccatttc cgagggcggc cttaagcgta tacaggagaa gtaagcaaac 3600
tgctactctt ttcatttttg caaaacctac tatgatcatt attaagctca tttttgcaaa 36603660
acctacttgc tgttgttatt gtttgttgct tccttttcac tgttctttga gctgaaggtc 3720acctacttgc tgttgttatt gtttgttgct tccttttcac tgttctttga gctgaaggtc 3720
tatcagaaac agtctctcta ccttcacaag gtaggggtaa gatctgcgtg cacgttaccc 3780tatcagaaac agtctctcta ccttcacaag gtaggggtaa gatctgcgtg cacgttaccc 3780
tcctcaaact ctacttaatt gtgagattac actaggtttg ttgttgttga ttctttgcta 38403840
attaattaaa aggtacacat ggcaaatata ctcggatcgg ttgttgacac tggctgctgt 3900attaattaaa aggtacacat ggcaaatata ctcggatcgg ttgttgacac tggctgctgt 3900
atatggattc tggaagcatg tttccaagct tgatcgtctt gaaattcgcc gttatcttga 3960atatggattc tggaagcatg tttccaagct tgatcgtctt gaaattcgcc gttatcttga 3960
aatgttctat gctctcaaat tccgcaagct ggtgagtttc attgctttct gcactcctgc 4020aatgttctat gctctcaaat tccgcaagct ggtgagtttc attgctttct gcactcctgc 4020
aattgtatag 4030aattgtatag 4030
<210> 14<210> 14
<211> 808<211> 808
<212> БЕЛОК<212> PROTEIN
<213> Nicotiana tabacum<213> Nicotiana tabacum
<400> 14<400> 14
Met Ala Glu Arg Val Leu Thr Arg Val His Ser Leu Arg Glu Arg Leu Met Ala Glu Arg Val Leu Thr Arg Val His Ser Leu Arg Glu Arg Leu
1 5 10 15 1 5 10 15
Asp Ala Thr Leu Ala Ala His Arg Asn Glu Ile Leu Leu Phe Leu Ser Asp Ala Thr Leu Ala Ala His Arg Asn Glu Ile Leu Leu Phe Leu Ser
20 25 30 20 25 30
Arg Ile Glu Ser His Gly Lys Gly Ile Leu Lys Pro His Gln Leu Leu Arg Ile Glu Ser His Gly Lys Gly Ile Leu Lys Pro His Gln Leu Leu
35 40 45 35 40 45
Ala Glu Phe Asp Ser Ile His Lys Glu Asp Lys Asn Lys Leu Asn Asp Ala Glu Phe Asp Ser Ile His Lys Glu Asp Lys Asn Lys Leu Asn Asp
50 55 60 50 55 60
His Ala Phe Glu Glu Val Leu Lys Ser Thr Gln Glu Ala Ile Val Leu His Ala Phe Glu Glu Val Leu Lys Ser Thr Gln Glu Ala Ile Val Leu
65 70 75 80 65 70 75 80
Ser Pro Trp Val Ala Leu Ala Ile Arg Leu Arg Pro Gly Val Trp Glu Ser Pro Trp Val Ala Leu Ala Ile Arg Leu Arg Pro Gly Val Trp Glu
85 90 95 85 90 95
Tyr Val Arg Val Asn Val Asn Ala Leu Val Val Glu Glu Leu Thr Val Tyr Val Arg Val Asn Val Asn Ala Leu Val Val Glu Glu Leu Thr Val
100 105 110 100 105 110
Pro Glu Tyr Leu Gln Phe Lys Glu Glu Leu Val Asn Gly Thr Ser His Pro Glu Tyr Leu Gln Phe Lys Glu Glu Leu Val Asn Gly Thr Ser His
115 120 125 115 120 125
Asp Asn Phe Val Leu Glu Leu Asp Phe Glu Pro Phe Thr Ala Ser Phe Asp Asn Phe Val Leu Glu Leu Asp Phe Glu Pro Phe Thr Ala Ser Phe
130 135 140 130 135 140
Pro Lys Pro Thr Leu Thr Lys Ser Ile Gly Asn Gly Val Glu Phe Leu Pro Lys Pro Thr Leu Thr Lys Ser Ile Gly Asn Gly Val Glu Phe Leu
145 150 155 160 145 150 155 160
Asn Arg His Leu Ser Ala Lys Met Phe His Asp Lys Glu Ser Met Thr Asn Arg His Leu Ser Ala Lys Met Phe His Asp Lys Glu Ser Met Thr
165 170 175 165 170 175
Pro Leu Leu Glu Phe Leu Arg Val His His Tyr Lys Gly Lys Thr Met Pro Leu Leu Glu Phe Leu Arg Val His His Tyr Lys Gly Lys Thr Met
180 185 190 180 185 190
Met Leu Asn Asp Arg Ile Gln Asp Leu Asn Thr Leu Gln Asn Val Leu Met Leu Asn Asp Arg Ile Gln Asp Leu Asn Thr Leu Gln Asn Val Leu
195 200 205 195 200 205
Arg Lys Ala Glu Glu Tyr Leu Thr Thr Leu Ser Pro Glu Thr Ser Tyr Arg Lys Ala Glu Glu Tyr Leu Thr Thr Leu Ser Pro Glu Thr Ser Tyr
210 215 220 210 215 220
Ser Ala Phe Glu His Lys Phe Gln Glu Ile Gly Leu Glu Arg Gly Trp Ser Ala Phe Glu His Lys Phe Gln Glu Ile Gly Leu Glu Arg Gly Trp
225 230 235 240 225 230 235 240
Gly Asp Thr Ala Glu Arg Val Leu Glu Met Ile Cys Met Leu Leu Asp Gly Asp Thr Ala Glu Arg Val Leu Glu Met Ile Cys Met Leu Leu Asp
245 250 255 245 250 255
Leu Leu Glu Ala Pro Asp Ser Cys Thr Leu Glu Lys Phe Leu Gly Arg Leu Leu Glu Ala Pro Asp Ser Cys Thr Leu Glu Lys Phe Leu Gly Arg
260 265 270 260 265 270
Ile Pro Met Val Phe Asn Val Val Ile Leu Ser Pro His Gly Tyr Phe Ile Pro Met Val Phe Asn Val Val Ile Leu Ser Pro His Gly Tyr Phe
275 280 285 275 280 285
Ala Gln Glu Asn Val Leu Gly Tyr Pro Asp Thr Gly Gly Gln Val Val Ala Gln Glu Asn Val Leu Gly Tyr Pro Asp Thr Gly Gly Gln Val Val
290 295 300 290 295 300
Tyr Ile Leu Asp Gln Val Pro Ala Leu Glu Arg Glu Met Leu Lys Arg Tyr Ile Leu Asp Gln Val Pro Ala Leu Glu Arg Glu Met Leu Lys Arg
305 310 315 320 305 310 315 320
Ile Lys Glu Gln Gly Leu Asp Ile Lys Pro Arg Ile Leu Ile Val Thr Ile Lys Glu Gln Gly Leu Asp Ile Lys Pro Arg Ile Leu Ile Val Thr
325 330 335 325 330 335
Arg Leu Leu Pro Asp Ala Val Gly Thr Thr Cys Gly Gln Arg Leu Glu Arg Leu Leu Pro Asp Ala Val Gly Thr Thr Cys Gly Gln Arg Leu Glu
340 345 350 340 345 350
Lys Val Phe Gly Thr Glu His Ser His Ile Leu Arg Val Pro Phe Arg Lys Val Phe Gly Thr Glu His Ser His Ile Leu Arg Val Pro Phe Arg
355 360 365 355 360 365
Thr Glu Lys Gly Ile Val Arg Lys Trp Ile Ser Arg Phe Glu Val Trp Thr Glu Lys Gly Ile Val Arg Lys Trp Ile Ser Arg Phe Glu Val Trp
370 375 380 370 375 380
Pro Tyr Met Glu Thr Phe Thr Glu Asp Val Ala Lys Glu Ile Ala Ala Pro Tyr Met Glu Thr Phe Thr Glu Asp Val Ala Lys Glu Ile Ala Ala
385 390 395 400 385 390 395 400
Glu Leu Gln Ala Lys Pro Asp Leu Ile Ile Gly Asn Tyr Ser Glu Gly Glu Leu Gln Ala Lys Pro Asp Leu Ile Ile Gly Asn Tyr Ser Glu Gly
405 410 415 405 410 415
Asn Leu Ala Ala Ser Leu Leu Ala His Lys Leu Gly Val Thr Gln Cys Asn Leu Ala Ala Ser Leu Leu Ala His Lys Leu Gly Val Thr Gln Cys
420 425 430 420 425 430
Thr Ile Ala His Ala Leu Glu Lys Thr Lys Tyr Pro Asp Ser Asp Ile Thr Ile Ala His Ala Leu Glu Lys Thr Lys Tyr Pro Asp Ser Asp Ile
435 440 445 435 440 445
Tyr Leu Lys Lys Phe Asp Glu Lys Tyr His Phe Ser Ala Gln Phe Thr Tyr Leu Lys Lys Phe Asp Glu Lys Tyr His Phe Ser Ala Gln Phe Thr
450 455 460 450 455 460
Ala Asp Leu Ile Ala Met Asn His Thr Asp Phe Ile Ile Thr Ser Thr Ala Asp Leu Ile Ala Met Asn His Thr Asp Phe Ile Ile Thr Ser Thr
465 470 475 480 465 470 475 480
Phe Gln Glu Ile Ala Gly Ser Lys Asp Thr Val Gly Gln Tyr Glu Ser Phe Gln Glu Ile Ala Gly Ser Lys Asp Thr Val Gly Gln Tyr Glu Ser
485 490 495 485 490 495
His Met Ala Phe Thr Met Pro Gly Leu Tyr Arg Val Val His Gly Ile His Met Ala Phe Thr Met Pro Gly Leu Tyr Arg Val Val His Gly Ile
500 505 510 500 505 510
Asp Val Phe Asp Pro Lys Phe Asn Ile Val Ser Pro Gly Ala Asp Met Asp Val Phe Asp Pro Lys Phe Asn Ile Val Ser Pro Gly Ala Asp Met
515 520 525 515 520 525
Asn Leu Tyr Phe Pro Tyr Tyr Glu Lys Glu Lys Arg Leu Thr Ala Tyr Asn Leu Tyr Phe Pro Tyr Tyr Glu Lys Glu Lys Arg Leu Thr Ala Tyr
530 535 540 530 535 540
His Pro Glu Ile Glu Glu Leu Leu Phe Ser Asp Val Glu Asn Asp Glu His Pro Glu Ile Glu Glu Leu Leu Phe Ser Asp Val Glu Asn Asp Glu
545 550 555 560 545 550 555 560
His Met Cys Val Leu Lys Asn Arg Asn Lys Pro Ile Ile Phe Thr Met His Met Cys Val Leu Lys Asn Arg Asn Lys Pro Ile Ile Phe Thr Met
565 570 575 565 570 575
Ala Arg Leu Asp Arg Val Lys Asn Leu Thr Gly Leu Val Glu Leu Tyr Ala Arg Leu Asp Arg Val Lys Asn Leu Thr Gly Leu Val Glu Leu Tyr
580 585 590 580 585 590
Ala Lys Asn Pro Arg Leu Arg Glu Leu Val Asn Leu Val Val Val Gly Ala Lys Asn Pro Arg Leu Arg Glu Leu Val Asn Leu Val Val Val Gly
595 600 605 595 600 605
Gly Asp Arg Arg Lys Glu Ser Lys Asp Leu Glu Glu Gln Ala Glu Met Gly Asp Arg Arg Lys Glu Ser Lys Asp Leu Glu Glu Gln Ala Glu Met
610 615 620 610 615 620
Lys Lys Met Tyr Glu Leu Ile Lys Thr His Asn Leu Asn Gly Gln Phe Lys Lys Met Tyr Glu Leu Ile Lys Thr His Asn Leu Asn Gly Gln Phe
625 630 635 640 625 630 635 640
Arg Trp Ile Ser Ser Gln Met Asn Arg Val Arg Asn Gly Glu Leu Tyr Arg Trp Ile Ser Ser Gln Met Asn Arg Val Arg Asn Gly Glu Leu Tyr
645 650 655 645 650 655
Arg Tyr Ile Ala Asp Thr Arg Gly Ala Phe Val Gln Pro Ala Phe Tyr Arg Tyr Ile Ala Asp Thr Arg Gly Ala Phe Val Gln Pro Ala Phe Tyr
660 665 670 660 665 670
Glu Ala Phe Gly Leu Thr Val Val Glu Ala Met Thr Cys Gly Leu Pro Glu Ala Phe Gly Leu Thr Val Val Glu Ala Met Thr Cys Gly Leu Pro
675 680 685 675 680 685
Thr Phe Ala Thr Asn His Gly Gly Pro Ala Glu Ile Ile Val His Gly Thr Phe Ala Thr Asn His Gly Gly Pro Ala Glu Ile Ile Val His Gly
690 695 700 690 695 700
Lys Ser Gly Phe His Ile Asp Pro Tyr His Gly Asp Gln Ala Ala Glu Lys Ser Gly Phe His Ile Asp Pro Tyr His Gly Asp Gln Ala Ala Glu
705 710 715 720 705 710 715 720
Leu Leu Ala Asp Phe Phe Glu Lys Cys Lys Lys Glu Pro Ser His Trp Leu Leu Ala Asp Phe Phe Glu Lys Cys Lys Lys Glu Pro Ser His Trp
725 730 735 725 730 735
Glu Ala Ile Ser Glu Gly Gly Leu Lys Arg Ile Gln Glu Lys Tyr Thr Glu Ala Ile Ser Glu Gly Gly Leu Lys Arg Ile Gln Glu Lys Tyr Thr
740 745 750 740 745 750
Trp Gln Ile Tyr Ser Asp Arg Leu Leu Thr Leu Ala Ala Val Tyr Gly Trp Gln Ile Tyr Ser Asp Arg Leu Leu Thr Leu Ala Ala Val Tyr Gly
755 760 765 755 760 765
Phe Trp Lys His Val Ser Lys Leu Asp Arg Leu Glu Ile Arg Arg Tyr Phe Trp Lys His Val Ser Lys Leu Asp Arg Leu Glu Ile Arg Arg Tyr
770 775 780 770 775 780
Leu Glu Met Phe Tyr Ala Leu Lys Phe Arg Lys Leu Val Ser Phe Ile Leu Glu Met Phe Tyr Ala Leu Lys Phe Arg Lys Leu Val Ser Phe Ile
785 790 795 800 785 790 795 800
Ala Phe Cys Thr Pro Ala Ile Val Ala Phe Cys Thr Pro Ala Ile Val
805 805
<210> 15<210> 15
<211> 4054<211> 4054
<212> ДНК<212> DNA
<213> Nicotiana tabacum<213> Nicotiana tabacum
<400> 15<400> 15
atggccgaac gtgtgctaac tcgtgttcac agccttcgcg aacgtcttga tgctactttg 60atggccgaac gtgtgctaac tcgtgttcac agccttcgcg aacgtcttga tgctactttg 60
gctgctcatc gcaatgagat tttgctgttt ctttcaaggt atagtcttag cagattgttc 120gctgctcatc gcaatgagat tttgctgttt ctttcaaggt atagtcttag cagattgttc 120
tttgatttag ttggtgttat ttgccagttc taatgtatgg actaatatat gaacaaagtg 180tttgatttag ttggtgttat ttgccagttc taatgtatgg actaatatat gaacaaagtg 180
cgaccatttc aactgacaac ttaaaatgtt tgagagaata cacgtttatt tacttaatta 240cgaccatttc aactgacaac ttaaaatgtt tgagagaata cacgtttatt tacttaatta 240
tggcttgagc ataggaagtg tatcttggcg taactcgtaa agttgacctc atgtgacaag 300tggcttgagc ataggaagtg tatcttggcg taactcgtaa agttgacctc atgtgacaag 300
gaggtcacgg tttcgagccg tggaaacagc ctcttgcaga aatgcaggta aggctgcgtg 360360
caatagatcg cccttccacg gacccgcgca tagcgggaac ttagtgcacc ggttgggctg 420caatagatcg cccttccacg gacccgcgca tagcgggaac ttagtgcacc ggttggggctg 420
tcctttttta tgtcttcagc acaaaaattt agtttaaaca tgtgtatcat ggattattca 480tccttttttta tgtcttcagc acaaaaattt agtttaaaca tgtgtatcat ggattattca 480
tgctggtttt gccggttgca ggattgaaag ccacggaaaa gggatattga aacctcacca 540tgctggtttt gccggttgca ggattgaaag ccacggaaaa gggatattga aacctcacca 540
gttgctggct gagtttgaat caattcacaa agaagacaaa aacaaactga atgatcatgc 600gttgctggct gagtttgaat caattcacaa agaagacaaa aacaaactga atgatcatgc 600
ttttgaagaa gtcctgaaat ctactcaggt aatttgtggt tttagtgtta ggtgatggat 660ttttgaagaa gtcctgaaat ctactcaggt aatttgtggt tttagtgtta ggtgatggat 660
agcatttatt gtcttactaa gatcatatat gtgtcagttt gtggctagta tttgaaaagt 720agcatttatt gtcttactaa gatcatatat gtgtcagttt gtggctagta tttgaaaagt 720
ctggtgtggt ttgtcatact aggaagcaat tgtcttgtcc ccttgggttg cgcttgccat 780ctggtgtggt ttgtcatact aggaagcaat tgtcttgtcc ccttgggttg cgcttgccat 780
tcgtctgcgg cctggtgtgt gggaatatgt tcgtgtgaat gtcaatgcac ttattgtcga 840tcgtctgcgg cctggtgtgt gggaatatgt tcgtgtgaat gtcaatgcac ttattgtcga 840
ggagctgact gtgcctgaat atttgcaatt caaggaagaa cttgttaatg gaacgtaagt 900ggagctgact gtgcctgaat atttgcaatt caaggaagaa cttgttaatg gaacgtaagt 900
tttaggttcg aaatgatgat ttgttaaata atatgttctg aactttttga ttaatgttgt 960tttaggttcg aaatgatgat ttgttaaata atatgttctg aactttttga ttaatgttgt 960
gttttcccct gatgcagctc gaacgataac tttgttcttg agctggattt tgagcccttc 1020gttttcccct gatgcagctc gaacgataac tttgttcttg agctggattt tgagcccttc 1020
actgcatcat ttcccaaacc aaccctcacc aaatcaattg gaaatggagt tgaattcctc 1080actgcatcat ttcccaaacc aaccctcacc aaatcaattg gaaatggagt tgaattcctc 1080
aaccgacacc tctctgccaa aatgttccat gacaaggaaa gcatgacccc tcttctcgag 1140aaccgacacc tctctgccaa aatgttccat gacaaggaaa gcatgacccc tcttctcgag 1140
tttcttcgag ttcatcacta caagggcaag gtaaacttgt ttttcctgtt tgtctatgaa 1200tttcttcgag ttcatcacta caagggcaag gtaaacttgt ttttcctgtt tgtctatgaa 1200
tttagtttct gaaagttgct ttgcttcgtg aattttttag tggcaactga tttatgattt 1260tttagtttct gaaagttgct ttgcttcgtg aattttttag tggcaactga tttatgattt 1260
tctgtgcaga caatgatgct gaatgacaga gttcaggact taaacactct ccaaaatgtc 1320tctgtgcaga caatgatgct gaatgacaga gttcaggact taaacactct ccaaaatgtc 1320
ctaaggaagg ctgaggaata tctcactacc ctttcccctg aaacttcata ctcggtattt 1380ctaaggaagg ctgaggaata tctcactacc ctttcccctg aaacttcata ctcggtattt 1380
gagcacaagt tccaagaaat tggcctagag aggggctggg gtgacaatgc tgagcgtgtt 1440gagcacaagt tccaagaaat tggcctagag aggggctggg gtgacaatgc tgagcgtgtt 1440
ctagagatga tctgcatgct cctggatctc ctcgaggctc cagactcatg cactcttgag 1500ctagagatga tctgcatgct cctggatctc ctcgaggctc cagactcatg cactcttgag 1500
aagttccttg gtagaattcc tatggttttt aatgtggtca ttctttcacc tcacggatat 1560aagttccttg gtagaattcc tatggttttt aatgtggtca ttctttcacc tcacggatat 1560
ttcgcccagg aaaatgtctt gggttacccc gatactggtg gccaggtgca ctgcttattt 1620ttcgcccagg aaaatgtctt gggttacccc gatactggtg gccaggtgca ctgcttattt 1620
gtaacacctt acgcttttcc ctctgaaact tatttgcggc aagttctaag gtcctccttc 1680gtaacacctt acgcttttcc ctctgaaact tatttgcggc aagttctaag gtcctccttc 1680
cttaatttgc aggttgtcta tattttggat caagttccgg ccttggagcg tgagatgctc 1740cttaatttgc aggttgtcta tattttggat caagttccgg ccttggagcg tgagatgctc 1740
aagcgcataa aggagcaagg acttgatatc aaaccgcgta ttcttattgt tcgtatctcc 1800aagcgcataa aggagcaagg acttgatatc aaaccgcgta ttcttattgt tcgtatctcc 1800
aataattgcg tttaaactta tgattgtgca ggatttgatc tgttcaaatc taatgactga 1860aataattgcg tttaaactta tgattgtgca ggatttgatc tgttcaaatc taatgactga 1860
ttttcttttt tttttttttt tccctcaggt tactcggctg ctgcctgatg cggttggtac 1920ttttcttttt tttttttttt tccctcaggt tactcggctg ctgcctgatg cggttggtac 1920
cacttgtggt cagcggcttg agaaagtgtt tggaacagag cattcacata ttcttagggt 1980cacttgtggt cagcggcttg agaaagtgtt tggaacagag cattcacata ttcttagggt 1980
cccctttagg accgagaagg gcatcgttcg caaatggatc tctcgctttg aagtctggcc 2040cccctttagg accgagaagg gcatcgttcg caaatggatc tctcgctttg aagtctggcc 2040
ttacatggag acattcactg aggtgaagca agctttctct attcattttt caatcttcca 2100ttacatggag acattcactg aggtgaagca agctttctct attcattttt caatcttcca 2100
atctgttttg gcagcaattt ttcacttact aacactttgg ctttcgctaa aacttcggat 2160atctgttttg gcagcaattt ttcacttact aacactttgg ctttcgctaa aacttcggat 2160
tttattacat taggatgtgg caaaagaaat tgctgcagaa ctgcaggcaa agccagatct 2220tttattacat taggatgtgg caaaagaaat tgctgcagaa ctgcaggcaa agccagatct 2220
tataatcggc aactacagcg agggcaacct tgctgcctcc ttgttggctc acaagttagg 2280tataatcggc aactacagcg agggcaacct tgctgcctcc ttgttggctc acaagttagg 2280
tgtaactcag gtctgtaatg tttgtcacct gttatttcaa ctttgcattt cctttcattt 2340tgtaactcag gtctgtaatg tttgtcacct gttatttcaa ctttgcattt cctttcattt 2340
gcaactagaa gttaagagtt ctctctcttt tatcttttcc gtctattttg ccttctgcag 2400gcaactagaa gttaagagtt ctctctcttt tatcttttcc gtctattttg ccttctgcag 2400
tgcaccatag ctcatgcgtt ggagaaaaca aaatatcctg attctgatat ctacttgaag 2460tgcaccatag ctcatgcgtt ggagaaaaca aaatatcctg attctgatat ctacttgaag 2460
aaatttgatg aaaaatacca tttctcagcc cagtttactg ccgatcttat tgcaatgaat 2520aaatttgatg aaaaatacca tttctcagcc cagtttactg ccgatcttat tgcaatgaat 2520
cacaccgatt tcataatcac cagcactttc caggagatag cgggaaggta ttacatcaca 2580cacaccgatt tcataatcac cagcactttc caggagatag cgggaaggta ttacatcaca 2580
atggatttcc gatatgatta aattagttaa tttaatccta cttcattgtg tttgatccta 2640atggatttcc gatatgatta aattagttaa tttaatccta cttcattgtg tttgatccta 2640
aaacttttct aaatttccca gcaaggacac tgttggacag tacgagagcc acatggcttt 2700aaacttttct aaatttccca gcaaggacac tgttggacag tacgagagcc acatggcttt 2700
cacgatgcct ggattgtata gagttgttca cggcattgat gtgttcgatc ccaaattcaa 2760cacgatgcct ggattgtata gagttgttca cggcattgat gtgttcgatc ccaaattcaa 2760
cattgtgtca ccaggagctg atatgaatct ctatttcccc tacttcgaga aggaaaagcg 2820cattgtgtca ccaggagctg atatgaatct ctatttcccc tacttcgaga aggaaaagcg 2820
attgacagca tatcaccctg aaattgagga gctgctgttt agcgatgttg agaatgacga 2880attgacagca tatcaccctg aaattgagga gctgctgttt agcgatgttg agaatgacga 2880
acacatgtat gttactaaac tagcaatcct gctgcaaaat tgtggctaat tatgtaaaaa 2940acacatgtat gttactaaac tagcaatcct gctgcaaaat tgtggctaat tatgtaaaaa 2940
agtttttact gaatagattt gtgcttctat caggtgtgtg ctgaaggaca ggaataagcc 3000agtttttact gaatagattt gtgcttctat caggtgtgtg ctgaaggaca ggaataagcc 3000
aattatattc accatggcta gattggatcg agtgaagaac ttaactggac ttgtggagtt 30603060
gtacgccaag aacccacggc taagggagtt ggttaacctt gtcgtggttg gtggagaccg 3120gtacgccaag aacccggc taagggagtt ggttaacctt gtcgtggttg gtggagaccg 3120
aaggaaggaa tccaaagatt tggaagaaca ggcagagatg aagaagatgt atgaacttat 31803180
aaagacgcac aatttaaacg gccaattccg atggatttct tcccagatga accgcgtgag 3240aaagacgcac aatttaaacg gccaattccg atggatttct tcccagatga accgcgtgag 3240
gaatggcgaa ctctacaggt acattgccga tactagggga gcttttgtgc agcctgcatt 3300gaatggcgaa ctctacaggt acattgccga tactagggga gcttttgtgc agcctgcatt 3300
ttacgaggct tttggtttga ctgttgttga ggccatgacc tgtggtttgc ctacgtttgc 33603360
aactaatcac ggtggtccag ctgagatcat cgttcacggg aagtctggtt ttcacattga 3420aactaatcac ggtggtccag ctgagatcat cgttcacggg aagtctggtt ttcacattga 3420
tccataccac ggcgagcagg cagctgaact tctagctgat ttctttgaga gatgtaagaa 3480tccataccac ggcgagcagg cagctgaact tctagctgat ttctttgaga gatgtaagaa 3480
agaaccttca cactgggaag ccatttccga gggcggcctt aagcgtatac aggagaagta 3540agaaccttca cactgggaag ccatttccga gggcggcctt aagcgtatac aggagaagta 3540
agcaagctgc tactcttttc atttttgcaa aacctaccat gatcattatt aagctcattt 3600agcaagctgc tactcttttc atttttgcaa aacctaccat gatcattatt aagctcattt 3600
ttgcaaaacc tacttgttat tctttgttgc ttccttttcc ctgttttttg agccgaggtt 3660ttgcaaaacc tacttgttat tctttgttgc ttccttttcc ctgttttttg agccgaggtt 3660
ttatcgaaaa catgctttct accttcacaa ggtaggggta aggtctgcgt ttgttattat 3720ttatcgaaaa catgctttct accttcacaa ggtaggggta aggtctgcgt ttgttattat 3720
tgttgttgtt gattctctgc gaattaatta aaaggtacac atggcaaatc tactcggatc 3780tgttgttgtt gattctctgc gaattaatta aaaggtacac atggcaaatc tactcggatc 3780
ggttgttgac actggctgct gtttatggat tctggaagca tgtttccaaa cttgatcgtc 3840ggttgttgac actggctgct gtttatggat tctggaagca tgtttccaaa cttgatcgtc 3840
ttgaaattcg tcgttatctt gaaatgttct atgctctaaa attccgcaaa ctggtgagtt 3900ttgaaattcg tcgttatctt gaaatgttct atgctctaaa attccgcaaa ctggtgagtt 3900
tcactgcttt ctgcactctt ccaattgtta gttgagtgca ctcatttaaa ctgtagctaa 3960tcactgcttt ctgcactctt ccaattgtta gttgagtgca ctcatttaaa ctgtagctaa 3960
agctgttgta aatcttcagt taagcagctg ctaatgaagt ttttatcttt tgtttttggt 4020agctgttgta aatcttcagt taagcagctg ctaatgaagt ttttatcttt tgtttttggt 4020
tcaggctgaa gctgtcccgt tggctgttga gtaa 4054tcaggctgaa gctgtcccgt tggctgttga gtaa 4054
<210> 16<210> 16
<211> 805<211> 805
<212> БЕЛОК<212> PROTEIN
<213> Nicotiana tabacum<213> Nicotiana tabacum
<400> 16<400> 16
Met Ala Glu Arg Val Leu Thr Arg Val His Ser Leu Arg Glu Arg Leu Met Ala Glu Arg Val Leu Thr Arg Val His Ser Leu Arg Glu Arg Leu
1 5 10 15 1 5 10 15
Asp Ala Thr Leu Ala Ala His Arg Asn Glu Ile Leu Leu Phe Leu Ser Asp Ala Thr Leu Ala Ala His Arg Asn Glu Ile Leu Leu Phe Leu Ser
20 25 30 20 25 30
Arg Ile Glu Ser His Gly Lys Gly Ile Leu Lys Pro His Gln Leu Leu Arg Ile Glu Ser His Gly Lys Gly Ile Leu Lys Pro His Gln Leu Leu
35 40 45 35 40 45
Ala Glu Phe Glu Ser Ile His Lys Glu Asp Lys Asn Lys Leu Asn Asp Ala Glu Phe Glu Ser Ile His Lys Glu Asp Lys Asn Lys Leu Asn Asp
50 55 60 50 55 60
His Ala Phe Glu Glu Val Leu Lys Ser Thr Gln Glu Ala Ile Val Leu His Ala Phe Glu Glu Val Leu Lys Ser Thr Gln Glu Ala Ile Val Leu
65 70 75 80 65 70 75 80
Ser Pro Trp Val Ala Leu Ala Ile Arg Leu Arg Pro Gly Val Trp Glu Ser Pro Trp Val Ala Leu Ala Ile Arg Leu Arg Pro Gly Val Trp Glu
85 90 95 85 90 95
Tyr Val Arg Val Asn Val Asn Ala Leu Ile Val Glu Glu Leu Thr Val Tyr Val Arg Val Asn Val Asn Ala Leu Ile Val Glu Glu Leu Thr Val
100 105 110 100 105 110
Pro Glu Tyr Leu Gln Phe Lys Glu Glu Leu Val Asn Gly Thr Ser Asn Pro Glu Tyr Leu Gln Phe Lys Glu Glu Leu Val Asn Gly Thr Ser Asn
115 120 125 115 120 125
Asp Asn Phe Val Leu Glu Leu Asp Phe Glu Pro Phe Thr Ala Ser Phe Asp Asn Phe Val Leu Glu Leu Asp Phe Glu Pro Phe Thr Ala Ser Phe
130 135 140 130 135 140
Pro Lys Pro Thr Leu Thr Lys Ser Ile Gly Asn Gly Val Glu Phe Leu Pro Lys Pro Thr Leu Thr Lys Ser Ile Gly Asn Gly Val Glu Phe Leu
145 150 155 160 145 150 155 160
Asn Arg His Leu Ser Ala Lys Met Phe His Asp Lys Glu Ser Met Thr Asn Arg His Leu Ser Ala Lys Met Phe His Asp Lys Glu Ser Met Thr
165 170 175 165 170 175
Pro Leu Leu Glu Phe Leu Arg Val His His Tyr Lys Gly Lys Thr Met Pro Leu Leu Glu Phe Leu Arg Val His His Tyr Lys Gly Lys Thr Met
180 185 190 180 185 190
Met Leu Asn Asp Arg Val Gln Asp Leu Asn Thr Leu Gln Asn Val Leu Met Leu Asn Asp Arg Val Gln Asp Leu Asn Thr Leu Gln Asn Val Leu
195 200 205 195 200 205
Arg Lys Ala Glu Glu Tyr Leu Thr Thr Leu Ser Pro Glu Thr Ser Tyr Arg Lys Ala Glu Glu Tyr Leu Thr Thr Leu Ser Pro Glu Thr Ser Tyr
210 215 220 210 215 220
Ser Val Phe Glu His Lys Phe Gln Glu Ile Gly Leu Glu Arg Gly Trp Ser Val Phe Glu His Lys Phe Gln Glu Ile Gly Leu Glu Arg Gly Trp
225 230 235 240 225 230 235 240
Gly Asp Asn Ala Glu Arg Val Leu Glu Met Ile Cys Met Leu Leu Asp Gly Asp Asn Ala Glu Arg Val Leu Glu Met Ile Cys Met Leu Leu Asp
245 250 255 245 250 255
Leu Leu Glu Ala Pro Asp Ser Cys Thr Leu Glu Lys Phe Leu Gly Arg Leu Leu Glu Ala Pro Asp Ser Cys Thr Leu Glu Lys Phe Leu Gly Arg
260 265 270 260 265 270
Ile Pro Met Val Phe Asn Val Val Ile Leu Ser Pro His Gly Tyr Phe Ile Pro Met Val Phe Asn Val Val Ile Leu Ser Pro His Gly Tyr Phe
275 280 285 275 280 285
Ala Gln Glu Asn Val Leu Gly Tyr Pro Asp Thr Gly Gly Gln Val Val Ala Gln Glu Asn Val Leu Gly Tyr Pro Asp Thr Gly Gly Gln Val Val
290 295 300 290 295 300
Tyr Ile Leu Asp Gln Val Pro Ala Leu Glu Arg Glu Met Leu Lys Arg Tyr Ile Leu Asp Gln Val Pro Ala Leu Glu Arg Glu Met Leu Lys Arg
305 310 315 320 305 310 315 320
Ile Lys Glu Gln Gly Leu Asp Ile Lys Pro Arg Ile Leu Ile Val Thr Ile Lys Glu Gln Gly Leu Asp Ile Lys Pro Arg Ile Leu Ile Val Thr
325 330 335 325 330 335
Arg Leu Leu Pro Asp Ala Val Gly Thr Thr Cys Gly Gln Arg Leu Glu Arg Leu Leu Pro Asp Ala Val Gly Thr Thr Cys Gly Gln Arg Leu Glu
340 345 350 340 345 350
Lys Val Phe Gly Thr Glu His Ser His Ile Leu Arg Val Pro Phe Arg Lys Val Phe Gly Thr Glu His Ser His Ile Leu Arg Val Pro Phe Arg
355 360 365 355 360 365
Thr Glu Lys Gly Ile Val Arg Lys Trp Ile Ser Arg Phe Glu Val Trp Thr Glu Lys Gly Ile Val Arg Lys Trp Ile Ser Arg Phe Glu Val Trp
370 375 380 370 375 380
Pro Tyr Met Glu Thr Phe Thr Glu Asp Val Ala Lys Glu Ile Ala Ala Pro Tyr Met Glu Thr Phe Thr Glu Asp Val Ala Lys Glu Ile Ala Ala
385 390 395 400 385 390 395 400
Glu Leu Gln Ala Lys Pro Asp Leu Ile Ile Gly Asn Tyr Ser Glu Gly Glu Leu Gln Ala Lys Pro Asp Leu Ile Ile Gly Asn Tyr Ser Glu Gly
405 410 415 405 410 415
Asn Leu Ala Ala Ser Leu Leu Ala His Lys Leu Gly Val Thr Gln Cys Asn Leu Ala Ala Ser Leu Leu Ala His Lys Leu Gly Val Thr Gln Cys
420 425 430 420 425 430
Thr Ile Ala His Ala Leu Glu Lys Thr Lys Tyr Pro Asp Ser Asp Ile Thr Ile Ala His Ala Leu Glu Lys Thr Lys Tyr Pro Asp Ser Asp Ile
435 440 445 435 440 445
Tyr Leu Lys Lys Phe Asp Glu Lys Tyr His Phe Ser Ala Gln Phe Thr Tyr Leu Lys Lys Phe Asp Glu Lys Tyr His Phe Ser Ala Gln Phe Thr
450 455 460 450 455 460
Ala Asp Leu Ile Ala Met Asn His Thr Asp Phe Ile Ile Thr Ser Thr Ala Asp Leu Ile Ala Met Asn His Thr Asp Phe Ile Ile Thr Ser Thr
465 470 475 480 465 470 475 480
Phe Gln Glu Ile Ala Gly Ser Lys Asp Thr Val Gly Gln Tyr Glu Ser Phe Gln Glu Ile Ala Gly Ser Lys Asp Thr Val Gly Gln Tyr Glu Ser
485 490 495 485 490 495
His Met Ala Phe Thr Met Pro Gly Leu Tyr Arg Val Val His Gly Ile His Met Ala Phe Thr Met Pro Gly Leu Tyr Arg Val Val His Gly Ile
500 505 510 500 505 510
Asp Val Phe Asp Pro Lys Phe Asn Ile Val Ser Pro Gly Ala Asp Met Asp Val Phe Asp Pro Lys Phe Asn Ile Val Ser Pro Gly Ala Asp Met
515 520 525 515 520 525
Asn Leu Tyr Phe Pro Tyr Phe Glu Lys Glu Lys Arg Leu Thr Ala Tyr Asn Leu Tyr Phe Pro Tyr Phe Glu Lys Glu Lys Arg Leu Thr Ala Tyr
530 535 540 530 535 540
His Pro Glu Ile Glu Glu Leu Leu Phe Ser Asp Val Glu Asn Asp Glu His Pro Glu Ile Glu Glu Leu Leu Phe Ser Asp Val Glu Asn Asp Glu
545 550 555 560 545 550 555 560
His Met Cys Val Leu Lys Asp Arg Asn Lys Pro Ile Ile Phe Thr Met His Met Cys Val Leu Lys Asp Arg Asn Lys Pro Ile Ile Phe Thr Met
565 570 575 565 570 575
Ala Arg Leu Asp Arg Val Lys Asn Leu Thr Gly Leu Val Glu Leu Tyr Ala Arg Leu Asp Arg Val Lys Asn Leu Thr Gly Leu Val Glu Leu Tyr
580 585 590 580 585 590
Ala Lys Asn Pro Arg Leu Arg Glu Leu Val Asn Leu Val Val Val Gly Ala Lys Asn Pro Arg Leu Arg Glu Leu Val Asn Leu Val Val Val Gly
595 600 605 595 600 605
Gly Asp Arg Arg Lys Glu Ser Lys Asp Leu Glu Glu Gln Ala Glu Met Gly Asp Arg Arg Lys Glu Ser Lys Asp Leu Glu Glu Gln Ala Glu Met
610 615 620 610 615 620
Lys Lys Met Tyr Glu Leu Ile Lys Thr His Asn Leu Asn Gly Gln Phe Lys Lys Met Tyr Glu Leu Ile Lys Thr His Asn Leu Asn Gly Gln Phe
625 630 635 640 625 630 635 640
Arg Trp Ile Ser Ser Gln Met Asn Arg Val Arg Asn Gly Glu Leu Tyr Arg Trp Ile Ser Ser Gln Met Asn Arg Val Arg Asn Gly Glu Leu Tyr
645 650 655 645 650 655
Arg Tyr Ile Ala Asp Thr Arg Gly Ala Phe Val Gln Pro Ala Phe Tyr Arg Tyr Ile Ala Asp Thr Arg Gly Ala Phe Val Gln Pro Ala Phe Tyr
660 665 670 660 665 670
Glu Ala Phe Gly Leu Thr Val Val Glu Ala Met Thr Cys Gly Leu Pro Glu Ala Phe Gly Leu Thr Val Val Glu Ala Met Thr Cys Gly Leu Pro
675 680 685 675 680 685
Thr Phe Ala Thr Asn His Gly Gly Pro Ala Glu Ile Ile Val His Gly Thr Phe Ala Thr Asn His Gly Gly Pro Ala Glu Ile Ile Val His Gly
690 695 700 690 695 700
Lys Ser Gly Phe His Ile Asp Pro Tyr His Gly Glu Gln Ala Ala Glu Lys Ser Gly Phe His Ile Asp Pro Tyr His Gly Glu Gln Ala Ala Glu
705 710 715 720 705 710 715 720
Leu Leu Ala Asp Phe Phe Glu Arg Cys Lys Lys Glu Pro Ser His Trp Leu Leu Ala Asp Phe Phe Glu Arg Cys Lys Lys Glu Pro Ser His Trp
725 730 735 725 730 735
Glu Ala Ile Ser Glu Gly Gly Leu Lys Arg Ile Gln Glu Lys Tyr Thr Glu Ala Ile Ser Glu Gly Gly Leu Lys Arg Ile Gln Glu Lys Tyr Thr
740 745 750 740 745 750
Trp Gln Ile Tyr Ser Asp Arg Leu Leu Thr Leu Ala Ala Val Tyr Gly Trp Gln Ile Tyr Ser Asp Arg Leu Leu Thr Leu Ala Ala Val Tyr Gly
755 760 765 755 760 765
Phe Trp Lys His Val Ser Lys Leu Asp Arg Leu Glu Ile Arg Arg Tyr Phe Trp Lys His Val Ser Lys Leu Asp Arg Leu Glu Ile Arg Arg Tyr
770 775 780 770 775 780
Leu Glu Met Phe Tyr Ala Leu Lys Phe Arg Lys Leu Ala Glu Ala Val Leu Glu Met Phe Tyr Ala Leu Lys Phe Arg Lys Leu Ala Glu Ala Val
785 790 795 800 785 790 795 800
Pro Leu Ala Val Glu Pro Leu Ala Val Glu
805 805
<210> 17<210> 17
<211> 3752<211> 3752
<212> ДНК<212> DNA
<213> Nicotiana tabacum<213> Nicotiana tabacum
<400> 17<400> 17
atggcctcaa cagttgctga tagcatgcct gatgctttga aacaaagccg gtatcatatg 60atggcctcaa cagttgctga tagcatgcct gatgctttga aacaaagccg gtatcatatg 60
aagagatgct tcgctaggtg aacacccttc ttttatgttt tttcccctct acgtgtttat 120120
gtcaaatttc catgcataat gctaactact tttcttcttt ttgacttcaa aattggatgt 180gtcaaatttc catgcataat gctaactact tttcttcttt ttgacttcaa aattggatgt 180
gaaaggttca ttgcaatggg aaggaggcta atgaagttga aacatttaac agaagaaata 240gaaaggttca ttgcaatggg aaggaggcta atgaagttga aacatttaac agaagaaata 240
gaagaaacta ttgaagacaa ggcagaaaga accaggattt tggagggttc acttggaaaa 300gaagaaacta ttgaagacaa ggcagaaaga accaggattt tggagggttc acttggaaaa 300
attatgagtt ccacacaggt cagcaccatt taaccaactt agttgaacag gaaaaaaaga 360attatgagtt ccacacaggt cagcaccatt taaccaactt agttgaacag gaaaaaaaga 360
aaaagcaaaa gagttattgc aaggcgtaac gattttcttt gaaattttca ggaggcagct 420aaaagcaaaa gagttattgc aaggcgtaac gattttcttt gaaattttca ggaggcagct 420
gttgttccac cttatgttgc ttttgcagta aggcacaatc ctggcttctg ggattatgtc 480gttgttccac cttatgttgc ttttgcagta aggcacaatc ctggcttctg ggattatgtc 480
aaagttaacg ctgaaactct ctctgtggaa gctatttcag ccagggaata tctcaaattc 540aaagttaacg ctgaaactct ctctgtggaa gctatttcag ccagggaata tctcaaattc 540
aaagagatga tctttgacga agactggtaa gtggaaaatt gtatcatttt aaagagaaac 600aaagagatga tctttgacga agactggtaa gtggaaaatt gtatcatttt aaagagaaac 600
aattttgtaa catacaagaa tagttttgat ggttgaatgt gcaagcaggg caaaggatga 660aattttgtaa catacaagaa tagttttgat ggttgaatgt gcaagcaggg caaaggatga 660
taatgcactg gaagtagatt ttggtgcttt tgactactct aatcctcggt tagccctttc 720taatgcactg gaagtagatt ttggtgcttt tgactactct aatcctcggt tagccctttc 720
ctcttctgtc ggaaatgggc tcaactttat ctcaaaagtt ctgtcttcaa agtttggtgg 780ctcttctgtc ggaaatggggc tcaactttat ctcaaaagtt ctgtcttcaa agtttggtgg 780
aaagccagag gacgcccagc ctttgcttga ttacttacta gctcttaatc atcaaggaga 840aaagccagag gacgcccagc ctttgcttga ttacttacta gctcttaatc atcaaggaga 840
ggtatgaaaa tggactacct ttgtttctta aaggtattat ataatgatgc gcgttataaa 900ggtatgaaaa tggactacct ttgtttctta aaggtattat ataatgatgc gcgttataaa 900
gttccttttt aaattgaaac tttgcagaat ctaatgatca atgagaatct gaatggtgtt 960gttccttttt aaattgaaac tttgcagaat ctaatgatca atgagaatct gaatggtgtt 960
gctaagcttc aagcagcatt gatagtagct gaagtttttg tatcttcctt tcccaaagac 1020gctaagcttc aagcagcatt gatagtagct gaagtttttg tatcttcctt tcccaaagac 1020
acaccttata aagactttga gcataagtaa gcttctcata tgcttccatt gtcatatgca 1080acaccttata aagactttga gcataagtaa gcttctcata tgcttccatt gtcatatgca 1080
gtataccaat gacatgctac cgaaaagttg tttatgtttg tgacttgatt atgaaaactc 1140gtataccaat gacatgctac cgaaaagttg tttatgtttg tgacttgatt atgaaaactc 1140
taggctcaaa gaatggggct ttgataaagg gtggggtcac aatgcaggaa gagtaagaga 1200taggctcaaa gaatggggct ttgataaagg gtggggtcac aatgcaggaa gagtaagaga 1200
gacaatgaga ctgctttccg agataatcca agcaccagat cccataaata tggagtcctt 1260gacaatgaga ctgctttccg agataatcca agcaccagat cccataaata tggagtcctt 1260
tttcagcaag cttcctacta cattcaacat tgttatcttc tccattcatg gttactttgg 1320tttcagcaag cttcctacta cattcaacat tgttatcttc tccattcatg gttactttgg 1320
ccaagcagat gtccttggtc tgcccgatac tggaggccag gtctacatat acagcaattt 1380ccaagcagat gtccttggtc tgcccgatac tggaggccag gtctacatat acagcaattt 1380
atctcctttt gcctcatatt gcttattagc gacacttgca tcattgaaat cagactttta 1440atctcctttt gcctcatatt gcttattagc gacacttgca tcattgaaat cagactttta 1440
cttcacaggt tgtttatatt ctggatcaag taagggcttt agaggaggaa atgttacaaa 1500cttcacaggt tgtttatatt ctggatcaag taagggcttt agaggaggaa atgttacaaa 1500
gaatcaagca gcaagggcta aacgtgaagc ccaagattct tgtggtgagt tttgcaaaaa 1560gaatcaagca gcaagggcta aacgtgaagc ccaagattct tgtggtgagt tttgcaaaaa 1560
tatgcttaga caggttttga gattgatcgg agaagggatt aagatgatca agatctttgt 16201620
ttcctgcttt catgatgtaa acaggtatct cgtctcatac cagatgctcg agggacaaca 1680ttcctgcttt catgatgtaa acaggtatct cgtctcatac cagatgctcg agggacaaca 1680
tgcaatcagg agatggaacc tattcttaac tcatcccatt ctcacatcct gagaattcca 1740tgcaatcagg agatggaacc tattcttaac tcatcccatt ctcacatcct gagaattcca 1740
ttcaggactg agaaaggagt tcttcgccaa tgggtttctc ggtttgatat ctatccttac 1800ttcaggactg agaaaggagt tcttcgccaa tgggtttctc ggtttgatat ctatccttac 1800
ttggagaact atgccaaggc aagtcttcta acaaaattac cacctattca tacactttat 1860ttggagaact atgccaaggc aagtcttcta acaaaattac cacctattca tacactttat 1860
ttactttctt gaactaatcg tttggtttgt gacgtatatc attaggatgc ttctgctaag 1920ttactttctt gaactaatcg tttggtttgt gacgtatatc attaggatgc ttctgctaag 1920
atacttgagc tcatggaagg taaaccagac ctcataattg ggaactacac tgatggaaat 1980atacttgagc tcatggaagg taaaccagac ctcataattg ggaactacac tgatggaaat 1980
ttagtggcat ctctattggc caacaaactt ggagttactc aggttccgta gctgatcata 2040ttagtggcat ctctattggc caacaaactt ggagttactc aggttccgta gctgatcata 2040
tgatcatatt ttctacattg tttcttgata attaaatgga aatcttattg gatgataaca 2100tgatcatatt ttctacattg tttcttgata attaaatgga aatcttattg gatgataaca 2100
ttttagggaa ccattgctca tgcattagag aaaactaagt atgaagattc tgatgtgaag 2160ttttagggaa ccattgctca tgcattagag aaaactaagt atgaagattc tgatgtgaag 2160
tggaagcagt ttgatcccaa gtaccacttt tcttgccaat ttactgccga tttattggca 2220tggaagcagt ttgatcccaa gtaccacttt tcttgccaat ttactgccga tttattggca 2220
atgaatgctg ctgattttat cattaccagc acatatcaag aaatcgctgg aaggttagca 2280atgaatgctg ctgattttat cattaccagc acatatcaag aaatcgctgg aaggttagca 2280
ctgactctct cagtatattt ggcaacttaa tgaatttact gcagtggcca acactaaaag 2340ctgactctct cagtatattt ggcaacttaa tgaatttact gcagtggcca acactaaaag 2340
ctatcattcg tccttcagcg aaactaggcc tggacaatat gaaagtcaca cagcatttac 2400ctatcattcg tccttcagcg aaactaggcc tggacaatat gaaagtcaca cagcatttac 2400
catgccgggg ctttatagag ctgtttcagg catcaatgta tttgatccaa agttcaacat 2460catgccgggg ctttatagag ctgtttcagg catcaatgta tttgatccaa agttcaacat 2460
tgctgctcct ggggctgaac agtctaccta tttccctttc actgagaaac agaaacgatt 2520tgctgctcct ggggctgaac agtctaccta tttccctttc actgagaaac agaaacgatt 2520
cagcacattt cgtcctgcta ttaacgaatt actttacagt aatgaggaaa acaatgagca 2580cagcacattt cgtcctgcta ttaacgaatt actttacagt aatgaggaaa acaatgagca 2580
catgtaagtc taattgccca ttttcctaat ctaaccattg cttaaatcgt tctgttttta 2640catgtaagtc taattgccca ttttcctaat ctaaccattg cttaaatcgt tctgttttta 2640
ccggatgtgt ggtacttatc agtaacattt ttttttggat cagtggattt cttgcagacc 2700ccggatgtgt ggtacttatc agtaacattt ttttttggat cagtggattt cttgcagacc 2700
ggaaaaaacc aattatattt tcaatggcga gatttgatac agtgaagaac ctgtcaggct 2760ggaaaaaacc aattatattt tcaatggcga gatttgatac agtgaagaac ctgtcaggct 2760
tgactgagtg gtatgggaag aataagaagt tgcggaactt ggtaaacctt gttattgttg 2820tgactgagtg gtatgggaag aataagaagt tgcggaactt ggtaaacctt gttattgttg 2820
ggggattctt cgatccatca aaatcaaaag accgggagga agcagctgaa atcaagaaga 2880ggggattctt cgatccatca aaatcaaaag accgggagga agcagctgaa atcaagaaga 2880
tgcatgaatt gattgagaaa taccagctca agggacaaat gagatggata gcagctcaaa 2940tgcatgaatt gattgagaaa taccagctca agggacaaat gagatggata gcagctcaaa 2940
ctgataaata tcgaaatagt gagctatacc gaactattgc tgacactaag ggagcttttg 3000ctgataaata tcgaaatagt gagctatacc gaactattgc tgacactaag ggagcttttg 3000
tccaaccggc tttatatgaa gcttttggac taaccgttat tgaagcaatg gattgtggat 3060tccaaccggc tttatatgaa gcttttggac taaccgttat tgaagcaatg gattgtggat 3060
tgcctacgtt tgcaactaat caaggtggac ctgcagaaat cattgttgat ggggtttcag 3120tgcctacgtt tgcaactaat caaggtggac ctgcagaaat cattgttgat ggggtttcag 3120
gtttccatat tgatccttac aatggggacg aatcaagcaa gaaaatagct gatttctttg 3180gtttccatat tgatccttac aatggggacg aatcaagcaa gaaaatagct gatttctttg 3180
agaagtgtaa ggttgattct aaatattgga acaggatatc tgagggaggt ctcaagcgca 3240agaagtgtaa ggttgattct aaatattgga acaggatatc tgagggaggt ctcaagcgca 3240
ttgaagaatg gtaacaaact agttccaagt ttaaaaaatg gaaaaaatgc ttatcatgtt 3300ttgaagaatg gtaacaaact agttccaagt ttaaaaaatg gaaaaaatgc ttatcatgtt 3300
atattttcgt ggttttaagt tctgcttcga tgcagttata cgtggaagat ttatgcaaac 33603360
aaagtgttga atatgggatc aatctatgga ttttggagac aattcaatgt ggggcaaaag 34203420
caggctaagc aaagatactt tgagatgttt tacaatcctc tcttcaggaa attggtaggt 34803480
tgtatatgtt gaatacaatt tactaagatc ctcaaaatga ccaagaaata tacattgact 35403540
atgctacttt tgtaatttca caggccaaaa gcgtgccgat cccacatgaa gagccattgc 3600atgctacttt tgtaatttca caggccaaaa gcgtgccgat cccacatgaa gagccattgc 3600
cacttgcaac atcagactct actcaatccc aagaattaaa actaccacta ccagttccag 3660cacttgcaac atcagactct actcaatccc aagaattaaa actaccacta ccagttccag 3660
cagcagtagc taaagttctg ccattaacaa ggcatgcttt taacttaatt acttctctac 3720cagcagtagc taaagttctg ccattaacaa ggcatgcttt taacttaatt acttctctac 3720
ctagagtaac tggtaaagtg gatgtcaagt ga 3752ctagagtaac tggtaaagtg gatgtcaagt ga 3752
<210> 18<210> 18
<211> 840<211> 840
<212> БЕЛОК<212> PROTEIN
<213> Nicotiana tabacum<213> Nicotiana tabacum
<400> 18<400> 18
Met Ala Ser Thr Val Ala Asp Ser Met Pro Asp Ala Leu Lys Gln Ser Met Ala Ser Thr Val Ala Asp Ser Met Pro Asp Ala Leu Lys Gln Ser
1 5 10 15 1 5 10 15
Arg Tyr His Met Lys Arg Cys Phe Ala Arg Phe Ile Ala Met Gly Arg Arg Tyr His Met Lys Arg Cys Phe Ala Arg Phe Ile Ala Met Gly Arg
20 25 30 20 25 30
Arg Leu Met Lys Leu Lys His Leu Thr Glu Glu Ile Glu Glu Thr Ile Arg Leu Met Lys Leu Lys His Leu Thr Glu Glu Ile Glu Glu Thr Ile
35 40 45 35 40 45
Glu Asp Lys Ala Glu Arg Thr Arg Ile Leu Glu Gly Ser Leu Gly Lys Glu Asp Lys Ala Glu Arg Thr Arg Ile Leu Glu Gly Ser Leu Gly Lys
50 55 60 50 55 60
Ile Met Ser Ser Thr Gln Glu Ala Ala Val Val Pro Pro Tyr Val Ala Ile Met Ser Ser Thr Gln Glu Ala Ala Val Val Pro Pro Tyr Val Ala
65 70 75 80 65 70 75 80
Phe Ala Val Arg His Asn Pro Gly Phe Trp Asp Tyr Val Lys Val Asn Phe Ala Val Arg His Asn Pro Gly Phe Trp Asp Tyr Val Lys Val Asn
85 90 95 85 90 95
Ala Glu Thr Leu Ser Val Glu Ala Ile Ser Ala Arg Glu Tyr Leu Lys Ala Glu Thr Leu Ser Val Glu Ala Ile Ser Ala Arg Glu Tyr Leu Lys
100 105 110 100 105 110
Phe Lys Glu Met Ile Phe Asp Glu Asp Trp Ala Lys Asp Asp Asn Ala Phe Lys Glu Met Ile Phe Asp Glu Asp Trp Ala Lys Asp Asp Asn Ala
115 120 125 115 120 125
Leu Glu Val Asp Phe Gly Ala Phe Asp Tyr Ser Asn Pro Arg Leu Ala Leu Glu Val Asp Phe Gly Ala Phe Asp Tyr Ser Asn Pro Arg Leu Ala
130 135 140 130 135 140
Leu Ser Ser Ser Val Gly Asn Gly Leu Asn Phe Ile Ser Lys Val Leu Leu Ser Ser Ser Val Gly Asn Gly Leu Asn Phe Ile Ser Lys Val Leu
145 150 155 160 145 150 155 160
Ser Ser Lys Phe Gly Gly Lys Pro Glu Asp Ala Gln Pro Leu Leu Asp Ser Ser Lys Phe Gly Gly Lys Pro Glu Asp Ala Gln Pro Leu Leu Asp
165 170 175 165 170 175
Tyr Leu Leu Ala Leu Asn His Gln Gly Glu Asn Leu Met Ile Asn Glu Tyr Leu Leu Ala Leu Asn His Gln Gly Glu Asn Leu Met Ile Asn Glu
180 185 190 180 185 190
Asn Leu Asn Gly Val Ala Lys Leu Gln Ala Ala Leu Ile Val Ala Glu Asn Leu Asn Gly Val Ala Lys Leu Gln Ala Ala Leu Ile Val Ala Glu
195 200 205 195 200 205
Val Phe Val Ser Ser Phe Pro Lys Asp Thr Pro Tyr Lys Asp Phe Glu Val Phe Val Ser Ser Phe Pro Lys Asp Thr Pro Tyr Lys Asp Phe Glu
210 215 220 210 215 220
His Lys Leu Lys Glu Trp Gly Phe Asp Lys Gly Trp Gly His Asn Ala His Lys Leu Lys Glu Trp Gly Phe Asp Lys Gly Trp Gly His Asn Ala
225 230 235 240 225 230 235 240
Gly Arg Val Arg Glu Thr Met Arg Leu Leu Ser Glu Ile Ile Gln Ala Gly Arg Val Arg Glu Thr Met Arg Leu Leu Ser Glu Ile Ile Gln Ala
245 250 255 245 250 255
Pro Asp Pro Ile Asn Met Glu Ser Phe Phe Ser Lys Leu Pro Thr Thr Pro Asp Pro Ile Asn Met Glu Ser Phe Phe Ser Lys Leu Pro Thr Thr
260 265 270 260 265 270
Phe Asn Ile Val Ile Phe Ser Ile His Gly Tyr Phe Gly Gln Ala Asp Phe Asn Ile Val Ile Phe Ser Ile His Gly Tyr Phe Gly Gln Ala Asp
275 280 285 275 280 285
Val Leu Gly Leu Pro Asp Thr Gly Gly Gln Val Val Tyr Ile Leu Asp Val Leu Gly Leu Pro Asp Thr Gly Gly Gln Val Val Tyr Ile Leu Asp
290 295 300 290 295 300
Gln Val Arg Ala Leu Glu Glu Glu Met Leu Gln Arg Ile Lys Gln Gln Gln Val Arg Ala Leu Glu Glu Glu Met Leu Gln Arg Ile Lys Gln Gln
305 310 315 320 305 310 315 320
Gly Leu Asn Val Lys Pro Lys Ile Leu Val Val Ser Arg Leu Ile Pro Gly Leu Asn Val Lys Pro Lys Ile Leu Val Val Ser Arg Leu Ile Pro
325 330 335 325 330 335
Asp Ala Arg Gly Thr Thr Cys Asn Gln Glu Met Glu Pro Ile Leu Asn Asp Ala Arg Gly Thr Thr Cys Asn Gln Glu Met Glu Pro Ile Leu Asn
340 345 350 340 345 350
Ser Ser His Ser His Ile Leu Arg Ile Pro Phe Arg Thr Glu Lys Gly Ser Ser His Ser His Ile Leu Arg Ile Pro Phe Arg Thr Glu Lys Gly
355 360 365 355 360 365
Val Leu Arg Gln Trp Asp Ala Ser Ala Lys Ile Leu Glu Leu Met Glu Val Leu Arg Gln Trp Asp Ala Ser Ala Lys Ile Leu Glu Leu Met Glu
370 375 380 370 375 380
Gly Lys Pro Asp Leu Ile Ile Gly Asn Tyr Thr Asp Gly Asn Leu Val Gly Lys Pro Asp Leu Ile Ile Gly Asn Tyr Thr Asp Gly Asn Leu Val
385 390 395 400 385 390 395 400
Ala Ser Leu Leu Ala Asn Lys Leu Gly Val Thr Gln Gly Thr Ile Ala Ala Ser Leu Leu Ala Asn Lys Leu Gly Val Thr Gln Gly Thr Ile Ala
405 410 415 405 410 415
His Ala Leu Glu Lys Thr Lys Tyr Glu Asp Ser Asp Val Lys Trp Lys His Ala Leu Glu Lys Thr Lys Tyr Glu Asp Ser Asp Val Lys Trp Lys
420 425 430 420 425 430
Gln Phe Asp Pro Lys Tyr His Phe Ser Cys Gln Phe Thr Ala Asp Leu Gln Phe Asp Pro Lys Tyr His Phe Ser Cys Gln Phe Thr Ala Asp Leu
435 440 445 435 440 445
Leu Ala Met Asn Ala Ala Asp Phe Ile Ile Thr Ser Thr Tyr Gln Glu Leu Ala Met Asn Ala Ala Asp Phe Ile Ile Thr Ser Thr Tyr Gln Glu
450 455 460 450 455 460
Ile Ala Gly Ser Glu Thr Arg Pro Gly Gln Tyr Glu Ser His Thr Ala Ile Ala Gly Ser Glu Thr Arg Pro Gly Gln Tyr Glu Ser His Thr Ala
465 470 475 480 465 470 475 480
Phe Thr Met Pro Gly Leu Tyr Arg Ala Val Ser Gly Ile Asn Val Phe Phe Thr Met Pro Gly Leu Tyr Arg Ala Val Ser Gly Ile Asn Val Phe
485 490 495 485 490 495
Asp Pro Lys Phe Asn Ile Ala Ala Pro Gly Ala Glu Gln Ser Thr Tyr Asp Pro Lys Phe Asn Ile Ala Ala Pro Gly Ala Glu Gln Ser Thr Tyr
500 505 510 500 505 510
Phe Pro Phe Thr Glu Lys Gln Lys Arg Phe Ser Thr Phe Arg Pro Ala Phe Pro Phe Thr Glu Lys Gln Lys Arg Phe Ser Thr Phe Arg Pro Ala
515 520 525 515 520 525
Ile Asn Glu Leu Leu Tyr Ser Asn Glu Glu Asn Asn Glu His Ile Gly Ile Asn Glu Leu Leu Tyr Ser Asn Glu Glu Asn Asn Glu His Ile Gly
530 535 540 530 535 540
Phe Leu Ala Asp Arg Lys Lys Pro Ile Ile Phe Ser Met Ala Arg Phe Phe Leu Ala Asp Arg Lys Lys Pro Ile Ile Phe Ser Met Ala Arg Phe
545 550 555 560 545 550 555 560
Asp Thr Val Lys Asn Leu Ser Gly Leu Thr Glu Trp Tyr Gly Lys Asn Asp Thr Val Lys Asn Leu Ser Gly Leu Thr Glu Trp Tyr Gly Lys Asn
565 570 575 565 570 575
Lys Lys Leu Arg Asn Leu Val Asn Leu Val Ile Val Gly Gly Phe Phe Lys Lys Leu Arg Asn Leu Val Asn Leu Val Ile Val Gly Gly Phe Phe
580 585 590 580 585 590
Asp Pro Ser Lys Ser Lys Asp Arg Glu Glu Ala Ala Glu Ile Lys Lys Asp Pro Ser Lys Ser Lys Asp Arg Glu Glu Ala Ala Glu Ile Lys Lys
595 600 605 595 600 605
Met His Glu Leu Ile Glu Lys Tyr Gln Leu Lys Gly Gln Met Arg Trp Met His Glu Leu Ile Glu Lys Tyr Gln Leu Lys Gly Gln Met Arg Trp
610 615 620 610 615 620
Ile Ala Ala Gln Thr Asp Lys Tyr Arg Asn Ser Glu Leu Tyr Arg Thr Ile Ala Ala Gln Thr Asp Lys Tyr Arg Asn Ser Glu Leu Tyr Arg Thr
625 630 635 640 625 630 635 640
Ile Ala Asp Thr Lys Gly Ala Phe Val Gln Pro Ala Leu Tyr Glu Ala Ile Ala Asp Thr Lys Gly Ala Phe Val Gln Pro Ala Leu Tyr Glu Ala
645 650 655 645 650 655
Phe Gly Leu Thr Val Ile Glu Ala Met Asp Cys Gly Leu Pro Thr Phe Phe Gly Leu Thr Val Ile Glu Ala Met Asp Cys Gly Leu Pro Thr Phe
660 665 670 660 665 670
Ala Thr Asn Gln Gly Gly Pro Ala Glu Ile Ile Val Asp Gly Val Ser Ala Thr Asn Gln Gly Gly Pro Ala Glu Ile Ile Val Asp Gly Val Ser
675 680 685 675 680 685
Gly Phe His Ile Asp Pro Tyr Asn Gly Asp Glu Ser Ser Lys Lys Ile Gly Phe His Ile Asp Pro Tyr Asn Gly Asp Glu Ser Ser Lys Lys Ile
690 695 700 690 695 700
Ala Asp Phe Phe Glu Lys Cys Lys Val Asp Ser Lys Tyr Trp Asn Arg Ala Asp Phe Phe Glu Lys Cys Lys Val Asp Ser Lys Tyr Trp Asn Arg
705 710 715 720 705 710 715 720
Ile Ser Glu Gly Gly Leu Lys Arg Ile Glu Glu Cys Tyr Thr Trp Lys Ile Ser Glu Gly Gly Leu Lys Arg Ile Glu Glu Cys Tyr Thr Trp Lys
725 730 735 725 730 735
Ile Tyr Ala Asn Lys Val Leu Asn Met Gly Ser Ile Tyr Gly Phe Trp Ile Tyr Ala Asn Lys Val Leu Asn Met Gly Ser Ile Tyr Gly Phe Trp
740 745 750 740 745 750
Arg Gln Phe Asn Val Gly Gln Lys Gln Ala Lys Gln Arg Tyr Phe Glu Arg Gln Phe Asn Val Gly Gln Lys Gln Ala Lys Gln Arg Tyr Phe Glu
755 760 765 755 760 765
Met Phe Tyr Asn Pro Leu Phe Arg Lys Leu Ala Lys Ser Val Pro Ile Met Phe Tyr Asn Pro Leu Phe Arg Lys Leu Ala Lys Ser Val Pro Ile
770 775 780 770 775 780
Pro His Glu Glu Pro Leu Pro Leu Ala Thr Ser Asp Ser Thr Gln Ser Pro His Glu Glu Pro Leu Pro Leu Ala Thr Ser Asp Ser Thr Gln Ser
785 790 795 800 785 790 795 800
Gln Glu Leu Lys Leu Pro Leu Pro Val Pro Ala Ala Val Ala Lys Val Gln Glu Leu Lys Leu Pro Leu Pro Val Pro Ala Ala Val Ala Lys Val
805 810 815 805 810 815
Leu Pro Leu Thr Arg His Ala Phe Asn Leu Ile Thr Ser Leu Pro Arg Leu Pro Leu Thr Arg His Ala Phe Asn Leu Ile Thr Ser Leu Pro Arg
820 825 830 820 825 830
Val Thr Gly Lys Val Asp Val Lys Val Thr Gly Lys Val Asp Val Lys
835 840 835 840
<210> 19<210> 19
<211> 3268<211> 3268
<212> ДНК<212> DNA
<213> Nicotiana tabacum<213> Nicotiana tabacum
<400> 19<400> 19
atggcctcaa ctgttgctgg tagcatgcct gatgctttga aacaaagccg atatcatatg 60atggcctcaa ctgttgctgg tagcatgcct gatgctttga aacaaagccg atatcatatg 60
aagagatgct tcgctaggtg aacacccttc ttgttctttt tgttttttcc ctctaccatt 120aagagatgct tcgctaggtg aacacccttc ttgttctttt tgttttttcc ctctaccatt 120
tatgtcaaat ttcaatgcat aatgctaact actttttttc tttttgactt caaaattgga 180tatgtcaaat ttcaatgcat aatgctaact actttttttc tttttgactt caaaattgga 180
cgtgaaaggt tcattgcaat gggaaggagg ttgatgaagc tgaaacattt aacagaagaa 240cgtgaaaggt tcattgcaat gggaaggagg ttgatgaagc tgaaacattt aacagaagaa 240
atagaaaaaa ctattgaaga caaggcagaa agaaccaaga ttttggaggg ttcacttgga 300atagaaaaaa ctattgaaga caaggcagaa agaaccaaga ttttggaggg ttcacttgga 300
aaaattatga gttccacaca ggtcagcacc atttaaccaa cttaattgaa taggaagaaa 360aaaattatga gttccacaca ggtcagcacc atttaaccaa cttaattgaa taggaagaaa 360
aaaaaaagca aaagagttat tgcaaggcgt aacgatttcc tttgaaattt tcaggaggca 420420
gctgttgtcc caccttatgt tgcttttgca gtaaggcaca atcctggctt ctgggattat 480gctgttgtcc caccttatgt tgcttttgca gtaaggcaca atcctggctt ctgggattat 480
gtcaaagttg acgctgaaac tctctctgtg gaagctattt cagccaggga ctatctcaaa 540gtcaaagttg acgctgaaac tctctctgtg gaagctattt cagccaggga ctatctcaaa 540
ttcaaagaga tgatctttga tgaagattgg taactggaag attgtatcat tttaaagaaa 600ttcaaagaga tgatctttga tgaagattgg taactggaag attgtatcat tttaaagaaa 600
caatttttta atattcaaga ttagttttga tggttgaatg tgcaagcagg gcaaaggatg 660caatttttta atattcaaga ttagttttga tggttgaatg tgcaagcagg gcaaaggatg 660
aaaatgcact cgaagtagat tttggtgctt ttgactactc taatcatcgg ttagcccttt 720aaaatgcact cgaagtagat tttggtgctt ttgactactc taatcatcgg ttagcccttt 720
cctcttctgt cggaaatggg ctaaacttca tctcgaaagt tttgtcttca aagtttggtg 780cctcttctgt cggaaatggg ctaaacttca tctcgaaagt tttgtcttca aagtttggtg 780
gaaaggcaga agatgcccag cctttgcttg attacttact agctcttaat catcaaggag 840gaaaggcaga agatgcccag cctttgcttg attacttact agctcttaat catcaaggag 840
aggtatggaa atggactacc ttcctttctt aaggaattat ataatgatgt atgttataaa 900aggtatggaa atggactacc ttccttttctt aaggaattat ataatgatgt atgttataaa 900
gatccttttt aaacattgac actttgcaga atctaatgat caatgagaat ctgaatggcg 960gatccttttt aaacattgac actttgcaga atctaatgat caatgagaat ctgaatggcg 960
tctctaagct tcaagcagca ttgatagtag ctgaagtttt tgtatcttcc tttcccaaag 1020tctctaagct tcaagcagca ttgatagtag ctgaagtttt tgtatcttcc tttcccaaag 1020
acacacctta taaagacttt gagcataagt aagcttttca aacgcttctg ttatcatatg 1080acacacctta taaagacttt gagcataagt aagcttttca aacgcttctg ttatcatatg 1080
caatatacca agaatatgtt gccttttgaa aagttgttta tgtttatgac ttgataatga 11401140
aaatactagg ctcaaagaat ggggctttga gaaagggtgg ggtcacaatg caggaagagt 1200aaatactagg ctcaaagaat ggggctttga gaaagggtgg ggtcacaatg caggaagagt 1200
aagagagaca atgagactgc tttccgagat aatccaagcg ccagatccca taaatatgga 12601260
gtcctttttc agcaggcttc ctactacatt caacattgtt atcttctcca ttcatggtta 1320gtcctttttc agcaggcttc ctactacatt caacattgtt atcttctcca ttcatggtta 1320
ctttggccaa gcagatgtcc ttggtttgcc cgatactgga ggccaggttt acatacacag 1380ctttggccaa gcagatgtcc ttggtttgcc cgatactgga ggccaggttt acatacacag 1380
caatttatct ccttttgcct catatttact tattagcgac acttgcatta ttgaaatcac 1440caatttatct ccttttgcct catatttact tattagcgac acttgcatta ttgaaatcac 1440
atttgtattt aacaggttgt ttatattctg gatcaagtaa gagccttaga ggaggaaatg 15001500
ttacaaagaa tcaagcagca agggttaaat gtgaagccca agattcttgt ggtgagttat 15601560
gcaaaaatat gcgtagccaa ggttttgaaa ttgttcagag gggattaaga tgatcgagat 1620gcaaaaatat gcgtagccaa ggttttgaaa ttgttcagag gggattaaga tgatcgagat 1620
atttgtttcc ttcttccatt gatgtgtaca ggtcactcgt ctcattccag atgctcgagg 1680atttgtttcc ttcttccatt gatgtgtaca ggtcactcgt ctcattccag atgctcgagg 1680
gactacatgc aatcaggaga tggaacctat acttaactcg tcccattctc acatcctgag 1740gactacatgc aatcaggaga tggaacctat acttaactcg tcccattctc acatcctgag 1740
aattccattc aggacagaga aaggagttct tcgccaatgg gtttctcggt ttgatatcta 1800aattccattc aggacagaga aggagttct tcgccaatgg gtttctcggt ttgatatcta 1800
tccttacttg gagaactatg ccaaggcaag tctcctacca aaattaccac ctattcatac 1860tccttacttg gagaactatg ccaaggcaag tctcctacca aaattaccac ctattcatac 1860
actttattca gttttttgag ctaatcattc tcatttgtca cgtatgtgat taggatgctt 1920actttattca gttttttgag ctaatcattc tcatttgtca cgtatgtgat taggatgctt 1920
ctgctaagat acttgagctc atggaaggta aaccagacct cattattggg aactacactg 1980ctgctaagat acttgagctc atggaaggta aaccagacct cattattggg aactacactg 1980
atggaaattt agtggcatct ctattggcca acaaacttgg agttactcag gttctacagc 2040atggaaattt agtggcatct ctattggcca acaaacttgg agttactcag gttctacagc 2040
tgatcattta tctgatcaga ttttctacat tgttttcttg ataattaaac ggaaatctta 2100tgatcattta tctgatcaga ttttctacat tgttttcttg ataattaaac ggaaatctta 2100
tgagattgta acattttagg gaaccattgc tcatgcatta gagaaaacca agtatgaaga 2160tgagattgta acattttagg gaaccattgc tcatgcatta gagaaaacca agtatgaaga 2160
ttctgatgtc aagtggaagc agtttgattc caagtaccac ttttcttgcc aattcactgc 2220ttctgatgtc aagtggaagc agtttgattc caagtaccac ttttcttgcc aattcactgc 2220
cgatttattg gcaatgaatg ctgctgattt tatcattacc agcacatatc aagaaatcgc 2280cgatttattg gcaatgaatg ctgctgattt tatcattacc agcacatatc aagaaatcgc 2280
aggaaggtta gcactgactc tctcagtata tttggcaact taatgaatgt actgcttgtg 2340aggaaggtta gcactgactc tctcagtata tttggcaact taatgaatgt actgcttgtg 2340
gccaacacta aaagctatta ctcgtccttc agcgaaacta ggcctggaca atatgaaagt 2400gccaacacta aaagctatta ctcgtccttc agcgaaacta ggcctggaca atatgaaagt 2400
cacacagcat ttaccatgcc ggggctttat agagctgttt caggcatcaa tgtatttgat 24602460
ccaaagttca acattgctgc tcctggggct gaacagtctg cctatttccc cttcactgag 2520ccaaagttca acattgctgc tcctggggct gaacagtctg cctatttccc cttcactgag 2520
aaacagaaac gattcagcgc gtttcgtcct gctattgagg aactacttta cagtaatgag 2580aaacagaaac gattcagcgc gtttcgtcct gctattgagg aactacttta cagtaatgag 2580
caaaacaacg agcacatgta agtctaattg ccccattttc ctaatctaac cattgcttaa 2640caaaacaacg agcacatgta agtctaattg ccccattttc ctaatctaac cattgcttaa 2640
atgttctgtt tttacttgat atgtggtact tatcagtgat attttttatt ggaacagtgg 2700atgttctgtt tttacttgat atgtggtact tatcagtgat attttttatt ggaacagtgg 2700
atttcttgca gaccgtaaaa aaccaattat attttcaatg gcaagatttg atacggtgaa 27602760
gaacttgtca ggcttgactg agtggtatgg gaagaataag aagttgcgga acttggttaa 2820gaacttgtca ggcttgactg agtggtatgg gaagaataag aagttgcgga acttggttaa 2820
cctcgttatc gttgggggat tcttcgatcc atcaaaatca aaagaccggg aggaagcagc 2880cctcgttatc gttgggggat tcttcgatcc atcaaaatca aaagaccgggg aggaagcagc 2880
tgaaatcaag aagatgcatg aattgattga gaaatacaag ctcaagggac aaatgagatg 2940tgaaatcaag aagatgcatg aattgattga gaaatacaag ctcaagggac aaatgagatg 2940
gatagcagct caaactgata aatatcaaaa cagtgagcta tatcgaacta ttgctgacac 3000gatagcagct caaactgata aatatcaaaa cagtgagcta tatcgaacta ttgctgacac 3000
taaaggagct ttcgtccaac cggctttata tgaagctttt ggactaactg ttattgaagc 30603060
aatgaattgt ggactgccta catttgctac taatcaaggc ggacctgcag aaatcattgt 3120aatgaattgt ggactgccta catttgctac taatcaaggc ggacctgcag aaatcattgt 3120
tgatggggtt tcaggcttcc atattgatcc ttacaatggg gatgaatcga gcaagaaaat 3180tgatggggtt tcaggcttcc atattgatcc ttacaatggg gatgaatcga gcaagaaaat 3180
agctgatttc tttgagaagt gtaaggttga ttctaaatat tggaacaaga tatgtggagg 32403240
aggtctcaag cgcattgaag aatggtaa 3268aggtctcaag cgcattgaag aatggtaa 3268
<210> 20<210> 20
<211> 732<211> 732
<212> БЕЛОК<212> PROTEIN
<213> Nicotiana tabacum<213> Nicotiana tabacum
<400> 20<400> 20
Met Ala Ser Thr Val Ala Gly Ser Met Pro Asp Ala Leu Lys Gln Ser Met Ala Ser Thr Val Ala Gly Ser Met Pro Asp Ala Leu Lys Gln Ser
1 5 10 15 1 5 10 15
Arg Tyr His Met Lys Arg Cys Phe Ala Arg Phe Ile Ala Met Gly Arg Arg Tyr His Met Lys Arg Cys Phe Ala Arg Phe Ile Ala Met Gly Arg
20 25 30 20 25 30
Arg Leu Met Lys Leu Lys His Leu Thr Glu Glu Ile Glu Lys Thr Ile Arg Leu Met Lys Leu Lys His Leu Thr Glu Glu Ile Glu Lys Thr Ile
35 40 45 35 40 45
Glu Asp Lys Ala Glu Arg Thr Lys Ile Leu Glu Gly Ser Leu Gly Lys Glu Asp Lys Ala Glu Arg Thr Lys Ile Leu Glu Gly Ser Leu Gly Lys
50 55 60 50 55 60
Ile Met Ser Ser Thr Gln Glu Ala Ala Val Val Pro Pro Tyr Val Ala Ile Met Ser Ser Thr Gln Glu Ala Ala Val Val Pro Pro Tyr Val Ala
65 70 75 80 65 70 75 80
Phe Ala Val Arg His Asn Pro Gly Phe Trp Asp Tyr Val Lys Val Asp Phe Ala Val Arg His Asn Pro Gly Phe Trp Asp Tyr Val Lys Val Asp
85 90 95 85 90 95
Ala Glu Thr Leu Ser Val Glu Ala Ile Ser Ala Arg Asp Tyr Leu Lys Ala Glu Thr Leu Ser Val Glu Ala Ile Ser Ala Arg Asp Tyr Leu Lys
100 105 110 100 105 110
Phe Lys Glu Met Ile Phe Asp Glu Asp Trp Ala Lys Asp Glu Asn Ala Phe Lys Glu Met Ile Phe Asp Glu Asp Trp Ala Lys Asp Glu Asn Ala
115 120 125 115 120 125
Leu Glu Val Asp Phe Gly Ala Phe Asp Tyr Ser Asn His Arg Leu Ala Leu Glu Val Asp Phe Gly Ala Phe Asp Tyr Ser Asn His Arg Leu Ala
130 135 140 130 135 140
Leu Ser Ser Ser Val Gly Asn Gly Leu Asn Phe Ile Ser Lys Val Leu Leu Ser Ser Ser Val Gly Asn Gly Leu Asn Phe Ile Ser Lys Val Leu
145 150 155 160 145 150 155 160
Ser Ser Lys Phe Gly Gly Lys Ala Glu Asp Ala Gln Pro Leu Leu Asp Ser Ser Lys Phe Gly Gly Lys Ala Glu Asp Ala Gln Pro Leu Leu Asp
165 170 175 165 170 175
Tyr Leu Leu Ala Leu Asn His Gln Gly Glu Asn Leu Met Ile Asn Glu Tyr Leu Leu Ala Leu Asn His Gln Gly Glu Asn Leu Met Ile Asn Glu
180 185 190 180 185 190
Asn Leu Asn Gly Val Ser Lys Leu Gln Ala Ala Leu Ile Val Ala Glu Asn Leu Asn Gly Val Ser Lys Leu Gln Ala Ala Leu Ile Val Ala Glu
195 200 205 195 200 205
Val Phe Val Ser Ser Phe Pro Lys Asp Thr Pro Tyr Lys Asp Phe Glu Val Phe Val Ser Ser Phe Pro Lys Asp Thr Pro Tyr Lys Asp Phe Glu
210 215 220 210 215 220
His Lys Leu Lys Glu Trp Gly Phe Glu Lys Gly Trp Gly His Asn Ala His Lys Leu Lys Glu Trp Gly Phe Glu Lys Gly Trp Gly His Asn Ala
225 230 235 240 225 230 235 240
Gly Arg Val Arg Glu Thr Met Arg Leu Leu Ser Glu Ile Ile Gln Ala Gly Arg Val Arg Glu Thr Met Arg Leu Leu Ser Glu Ile Ile Gln Ala
245 250 255 245 250 255
Pro Asp Pro Ile Asn Met Glu Ser Phe Phe Ser Arg Leu Pro Thr Thr Pro Asp Pro Ile Asn Met Glu Ser Phe Phe Ser Arg Leu Pro Thr Thr
260 265 270 260 265 270
Phe Asn Ile Val Ile Phe Ser Ile His Gly Tyr Phe Gly Gln Ala Asp Phe Asn Ile Val Ile Phe Ser Ile His Gly Tyr Phe Gly Gln Ala Asp
275 280 285 275 280 285
Val Leu Gly Leu Pro Asp Thr Gly Gly Gln Val Val Tyr Ile Leu Asp Val Leu Gly Leu Pro Asp Thr Gly Gly Gln Val Val Tyr Ile Leu Asp
290 295 300 290 295 300
Gln Val Arg Ala Leu Glu Glu Glu Met Leu Gln Arg Ile Lys Gln Gln Gln Val Arg Ala Leu Glu Glu Glu Met Leu Gln Arg Ile Lys Gln Gln
305 310 315 320 305 310 315 320
Gly Leu Asn Val Lys Pro Lys Ile Leu Val Val Thr Arg Leu Ile Pro Gly Leu Asn Val Lys Pro Lys Ile Leu Val Val Thr Arg Leu Ile Pro
325 330 335 325 330 335
Asp Ala Arg Gly Thr Thr Cys Asn Gln Glu Met Glu Pro Ile Leu Asn Asp Ala Arg Gly Thr Thr Cys Asn Gln Glu Met Glu Pro Ile Leu Asn
340 345 350 340 345 350
Ser Ser His Ser His Ile Leu Arg Ile Pro Phe Arg Thr Glu Lys Gly Ser Ser His Ser His Ile Leu Arg Ile Pro Phe Arg Thr Glu Lys Gly
355 360 365 355 360 365
Val Leu Arg Gln Trp Asp Ala Ser Ala Lys Ile Leu Glu Leu Met Glu Val Leu Arg Gln Trp Asp Ala Ser Ala Lys Ile Leu Glu Leu Met Glu
370 375 380 370 375 380
Gly Lys Pro Asp Leu Ile Ile Gly Asn Tyr Thr Asp Gly Asn Leu Val Gly Lys Pro Asp Leu Ile Ile Gly Asn Tyr Thr Asp Gly Asn Leu Val
385 390 395 400 385 390 395 400
Ala Ser Leu Leu Ala Asn Lys Leu Gly Val Thr Gln Gly Thr Ile Ala Ala Ser Leu Leu Ala Asn Lys Leu Gly Val Thr Gln Gly Thr Ile Ala
405 410 415 405 410 415
His Ala Leu Glu Lys Thr Lys Tyr Glu Asp Ser Asp Val Lys Trp Lys His Ala Leu Glu Lys Thr Lys Tyr Glu Asp Ser Asp Val Lys Trp Lys
420 425 430 420 425 430
Gln Phe Asp Ser Lys Tyr His Phe Ser Cys Gln Phe Thr Ala Asp Leu Gln Phe Asp Ser Lys Tyr His Phe Ser Cys Gln Phe Thr Ala Asp Leu
435 440 445 435 440 445
Leu Ala Met Asn Ala Ala Asp Phe Ile Ile Thr Ser Thr Tyr Gln Glu Leu Ala Met Asn Ala Ala Asp Phe Ile Ile Thr Ser Thr Tyr Gln Glu
450 455 460 450 455 460
Ile Ala Gly Ser Glu Thr Arg Pro Gly Gln Tyr Glu Ser His Thr Ala Ile Ala Gly Ser Glu Thr Arg Pro Gly Gln Tyr Glu Ser His Thr Ala
465 470 475 480 465 470 475 480
Phe Thr Met Pro Gly Leu Tyr Arg Ala Val Ser Gly Ile Asn Val Phe Phe Thr Met Pro Gly Leu Tyr Arg Ala Val Ser Gly Ile Asn Val Phe
485 490 495 485 490 495
Asp Pro Lys Phe Asn Ile Ala Ala Pro Gly Ala Glu Gln Ser Ala Tyr Asp Pro Lys Phe Asn Ile Ala Ala Pro Gly Ala Glu Gln Ser Ala Tyr
500 505 510 500 505 510
Phe Pro Phe Thr Glu Lys Gln Lys Arg Phe Ser Ala Phe Arg Pro Ala Phe Pro Phe Thr Glu Lys Gln Lys Arg Phe Ser Ala Phe Arg Pro Ala
515 520 525 515 520 525
Ile Glu Glu Leu Leu Tyr Ser Asn Glu Gln Asn Asn Glu His Ile Gly Ile Glu Glu Leu Leu Tyr Ser Asn Glu Gln Asn Asn Glu His Ile Gly
530 535 540 530 535 540
Phe Leu Ala Asp Arg Lys Lys Pro Ile Ile Phe Ser Met Ala Arg Phe Phe Leu Ala Asp Arg Lys Lys Pro Ile Ile Phe Ser Met Ala Arg Phe
545 550 555 560 545 550 555 560
Asp Thr Val Lys Asn Leu Ser Gly Leu Thr Glu Trp Tyr Gly Lys Asn Asp Thr Val Lys Asn Leu Ser Gly Leu Thr Glu Trp Tyr Gly Lys Asn
565 570 575 565 570 575
Lys Lys Leu Arg Asn Leu Val Asn Leu Val Ile Val Gly Gly Phe Phe Lys Lys Leu Arg Asn Leu Val Asn Leu Val Ile Val Gly Gly Phe Phe
580 585 590 580 585 590
Asp Pro Ser Lys Ser Lys Asp Arg Glu Glu Ala Ala Glu Ile Lys Lys Asp Pro Ser Lys Ser Lys Asp Arg Glu Glu Ala Ala Glu Ile Lys Lys
595 600 605 595 600 605
Met His Glu Leu Ile Glu Lys Tyr Lys Leu Lys Gly Gln Met Arg Trp Met His Glu Leu Ile Glu Lys Tyr Lys Leu Lys Gly Gln Met Arg Trp
610 615 620 610 615 620
Ile Ala Ala Gln Thr Asp Lys Tyr Gln Asn Ser Glu Leu Tyr Arg Thr Ile Ala Ala Gln Thr Asp Lys Tyr Gln Asn Ser Glu Leu Tyr Arg Thr
625 630 635 640 625 630 635 640
Ile Ala Asp Thr Lys Gly Ala Phe Val Gln Pro Ala Leu Tyr Glu Ala Ile Ala Asp Thr Lys Gly Ala Phe Val Gln Pro Ala Leu Tyr Glu Ala
645 650 655 645 650 655
Phe Gly Leu Thr Val Ile Glu Ala Met Asn Cys Gly Leu Pro Thr Phe Phe Gly Leu Thr Val Ile Glu Ala Met Asn Cys Gly Leu Pro Thr Phe
660 665 670 660 665 670
Ala Thr Asn Gln Gly Gly Pro Ala Glu Ile Ile Val Asp Gly Val Ser Ala Thr Asn Gln Gly Gly Pro Ala Glu Ile Ile Val Asp Gly Val Ser
675 680 685 675 680 685
Gly Phe His Ile Asp Pro Tyr Asn Gly Asp Glu Ser Ser Lys Lys Ile Gly Phe His Ile Asp Pro Tyr Asn Gly Asp Glu Ser Ser Lys Lys Ile
690 695 700 690 695 700
Ala Asp Phe Phe Glu Lys Cys Lys Val Asp Ser Lys Tyr Trp Asn Lys Ala Asp Phe Phe Glu Lys Cys Lys Val Asp Ser Lys Tyr Trp Asn Lys
705 710 715 720 705 710 715 720
Ile Cys Gly Gly Gly Leu Lys Arg Ile Glu Glu Trp Ile Cys Gly Gly Gly Leu Lys Arg Ile Glu Glu Trp
725 730 725 730
<210> 21<210> 21
<211> 3937<211> 3937
<212> ДНК<212> DNA
<213> Nicotiana tabacum<213> Nicotiana tabacum
<400> 21<400> 21
atggctactg caccagccct aaatagatca gagtccatag ctgatagcat gccagaggcc 60atggctactg caccagccct aaatagatca gagtccatag ctgatagcat gccagaggcc 60
ttaaggcaaa gccggtacca catgaagaaa tgttttgcca agtacataga gcaaggaaag 120ttaaggcaaa gccggtacca catgaagaaa tgttttgcca agtacataga gcaaggaaag 120
aggatgatga aacttcataa cttgatggat gagttggaga aagtaattga tgatcctgct 180aggatgatga aacttcataa cttgatggat gagttggaga aagtaattga tgatcctgct 180
gaaaggaacc atgttttgga aggcttactt ggctacatat tatgcactac aatggtatag 240gaaaggaacc atgttttgga aggcttactt ggctacatat tatgcactac aatggtatag 240
ctagattcat atgtacttat gatgccctta tattgtttcc tgatgtatta ctcttaaaac 300ctagattcat atgtacttat gatgccctta tattgtttcc tgatgtatta ctcttaaaac 300
cttctttgat caaatttaca ggaggctgca gttgttcctc cctacattgc ctttgccacg 360cttctttgat caaatttaca ggaggctgca gttgttcctc cctacattgc ctttgccacg 360
agacagaatc ctggattctg ggaatatgtg aaagtgaatg ctaatgatct ttctgttgag 420agacagaatc ctggattctg ggaatatgtg aaagtgaatg ctaatgatct ttctgttgag 420
ggtattacag ctacagaata cttgaaattc aaggaaatga tagttgatga atgctggtat 480ggtattacag ctacagaata cttgaaattc aaggaaatga tagttgatga atgctggtat 480
agtatacgtt gcagcttatc ataccttttg tggttttata acttcaatca gaaaactcat 540agtatacgtt gcagcttatc ataccttttg tggttttata acttcaatca gaaaactcat 540
cagagttacc tttgtgtgaa catgaaatgc agggcaaaag atgaatatgc actggaaatt 600cagagttacc tttgtgtgaa catgaaatgc agggcaaaag atgaatatgc actggaaatt 600
gattttggag cagtagactt ctcaacgcct cgactgaccc tatcctcttc aattggcaat 660gattttggag cagtagactt ctcaacgcct cgactgaccc tatcctcttc aattggcaat 660
ggtctcagtt atgtttccaa gtttctaact tcaaagctaa atgctacctc cgcgagtgca 720ggtctcagtt atgtttccaa gtttctaact tcaaagctaa atgctacctc cgcgagtgca 720
cagtgtctgg ttgactactt gctcactttg aatcatcaag gagatgtacg tcaacaaaaa 780cagtgtctgg ttgactactt gctcactttg aatcatcaag gagatgtacg tcaacaaaaa 780
tcaaactcca taagtaaact tgtcaactct aagaagaaaa aataggaaaa gaagattcac 840tcaaactcca taagtaaact tgtcaactct aagaagaaaa aataggaaaa gaagattcac 840
gtaacaaatt ttctttatgt tcaactgcag aaactgatga tcaatgagac actcagcact 900gtaacaaatt ttctttatgt tcaactgcag aaactgatga tcaatgagac actcagcact 900
gtctcaaagc ttcaggctgc actggttgta gcagaagcat ctatttcctc tttaccaaca 960gtctcaaagc ttcaggctgc actggttgta gcagaagcat ctatttcctc tttaccaaca 960
gatacaccat atgagagctt tgagctaagg tgatttgttt tttcctctac ttccctccac 1020gatacaccat atgagagctt tgagctaagg tgatttgttt ttttcctctac ttccctccac 1020
ttgtgccatg ctacgtagta ctaagtaact tcaattcttg taaagattca aacagtgggg 1080ttgtgccatg ctacgtagta ctaagtaact tcaattcttg taaagattca aacagtgggg 1080
ttttgagaaa ggatggggtg atacagctga aagggtcagc gacaccatga gaacactgtc 1140ttttgagaaa ggatggggtg atacagctga aagggtcagc gacaccatga gaacactgtc 1140
tgaggtgctt caggcaccag atccattgaa cattcagaag ttctttggaa gggttccaac 1200tgaggtgctt caggcaccag atccattgaa cattcagaag ttctttggaa gggttccaac 1200
tgttttcaat attgtattgt tctctgtcca tggatacttt ggccaagcag atgttcttgg 1260tgttttcaat attgtattgt tctctgtcca tggatacttt ggccaagcag atgttcttgg 1260
cttgccagac actggtggtc aggtaagcat ttaatagctt ttacatttaa cttctatgca 1320cttgccagac actggtggtc aggtaagcat ttaatagctt ttacatttaa cttctatgca 1320
ttgacaataa aataattttt aacagtttga ccacttctgc tcttgttcaa caggtagttt 13801380
atgttttgga tcaagttgta gcttttgaag aagaaatgct acaaagaatt aaacagcagg 1440atgttttgga tcaagttgta gcttttgaag aagaaatgct acaaagaatt aaacagcagg 1440
ggctcaatat taagcctcaa attcttgtgg tgagttccta gacaatcgac gtgactatgc 1500ggctcaatat taagcctcaa attcttgtgg tgagttccta gacaatcgac gtgactatgc 1500
aattatgtag aggctgttta gaaaagttaa tatcatatgt tgattgcaca gttaacccga 1560aattatgtag aggctgttta gaaaagttaa tatcatatgt tgattgcaca gttaacccga 1560
ctgattccgg atgcaaaagg aacaaagtgc aaccaggaac tagaaccaat caagaataca 1620ctgattccgg atgcaaaagg aacaaagtgc aaccaggaac tagaaccaat caagaataca 1620
aaacattcac acatcctcag agttccattt aggacagaaa aaggagtgct taatcaatgg 1680aaacattcac acatcctcag agttccattt aggacagaaa aaggagtgct taatcaatgg 1680
gtttcacgat ttgatatcta tccatatctg gagagatata ctcaggtatg tatttttata 1740gtttcacgat ttgatatcta tccatatctg gagagatata ctcaggtatg tatttttata 1740
tcaaccttgc tcatcaaaga tgtgttgttt cctcaattcc atttttcccc ttggcaaaag 1800tcaaccttgc tcatcaaaga tgtgttgttt cctcaattcc atttttcccc ttggcaaaag 1800
gatgctgctg acaaaatcgt cgagctaatg gaaggcaaac ctgatctaat cattggtaac 1860gatgctgctg acaaaatcgt cgagctaatg gaaggcaaac ctgatctaat cattggtaac 1860
tacactgatg ggaatctagt ggcttcacta atggctagaa aacttgggat aactctggta 1920tacactgatg ggaatctagt ggcttcacta atggctagaa aacttgggat aactctggta 1920
acttttctta atcatatttg atgttgcttc ttctccaagt tagttcttaa tctccactga 1980acttttctta atcatatttg atgttgcttc ttctccaagt tagttcttaa tctccactga 1980
cctagaccat ctttgcaaca gggaactatt gctcatgctt tggagaagac aaaatatgaa 2040cctagaccat ctttgcaaca gggaactatt gctcatgctt tggagaagac aaaatatgaa 2040
gactctgaca taaaattgaa ggaactcgat ccgaagtacc acttctcttg ccaattcaca 2100gactctgaca taaaattgaa ggaactcgat ccgaagtacc acttctcttg ccaattcaca 2100
gctgatttga ttgcaatgaa ttcagcagat ttcattatca ctagcacata ccaagaaata 2160gctgatttga ttgcaatgaa ttcagcagat ttcattatca ctagcacata ccaagaaata 2160
gctggaaggt aagaattaga gctaataagt aatgcattca tatgtatttc agcatcgctc 2220gctggaaggt aagaattaga gctaataagt aatgcattca tatgtatttc agcatcgctc 2220
tttcaccatc atcgaataca caccactact cagtaaatgt atttgctcaa aagtttgcaa 2280tttcaccatc atcgaataca caccactact cagtaaatgt atttgctcaa aagtttgcaa 2280
cttaatggat ctcattcttg aatgcttcaa catatgcagc aaagataaac caggacagta 2340cttaatggat ctcattcttg aatgcttcaa catatgcagc aaagataaac caggacagta 2340
tgagagccat agtgcattta cccttccagg gctttacaga gttgcttcag gtatcaatgt 2400tgagagccat agtgcattta cccttccagg gctttacaga gttgcttcag gtatcaatgt 2400
ctttgatcca aaatttaata ttgctgcacc tggggcagac cagtcggtgt atttccctta 2460ctttgatcca aaatttaata ttgctgcacc tggggcagac cagtcggtgt atttccctta 2460
cacagaaaag cagaagcgtt tgactgcttt ccgccctgcc attgaggaac tgctttttag 2520cacagaaaag cagaagcgtt tgactgcttt ccgccctgcc attgaggaac tgctttttag 2520
taaagtggac aatgacgagc acgtgtaagt ctaagtgtta aacttcagct tagtgcctag 2580taaagtggac aatgacgagc acgtgtaagt ctaagtgtta aacttcagct tagtgcctag 2580
aacatcccac tgctctatgt attgatgttt cacttgtttc aaacagtgga tatttagaag 2640aacatcccac tgctctatgt attgatgttt cacttgtttc aaacagtgga tatttagaag 2640
acagaaagaa acctatcctg tttaccatgg caaggctgga cacagtgaag aacacatctg 2700acagaaagaa acctatcctg tttaccatgg caaggctgga cacagtgaag aacacatctg 2700
gactaacaga atggtatggc aagaacaaga ggctcagaag cttagttaac cttgttgtgg 2760gactaacaga atggtatggc aagaacaaga ggctcagaag cttagttaac cttgttgtgg 2760
ttggtggttc ctttgatcct acaaaatcca aggataggga agaagcagct gaaataaaaa 2820ttggtggttc ctttgatcct acaaaatcca aggataggga agaagcagct gaaataaaaa 2820
agatgcacat gctgatagag aaataccagc ttaagggtca gattagatgg atagcagctc 2880agatgcacat gctgatagag aaataccagc ttaagggtca gattagatgg atagcagctc 2880
agactgacag atacagaaat agtgaactct accgcacaat agcagattcc aaaggagctt 2940agactgacag atacagaaat agtgaactct accgcacaat agcagattcc aaaggagctt 2940
ttgtgcagcc tgcattgtat gaagcatttg gtctaacagt cattgaggca atgaactgtg 3000ttgtgcagcc tgcattgtat gaagcatttg gtctaacagt cattgaggca atgaactgtg 3000
gattaccaac ctttgctacc aaccaaggtg gccctgctga gattattgtt gatggggtct 3060gattaccaac ctttgctacc aaccaaggtg gccctgctga gattattgtt gatggggtct 3060
caggctttca tattgatcca aataatgggg atgaatcaag caacaaaatt gccaactttt 3120caggctttca tattgatcca aataatgggg atgaatcaag caacaaaatt gccaactttt 3120
tccaaaaatg cagggaggat cctgagtatt ggaacaggat ttcagtccag ggtctaaacc 3180tccaaaaatg cagggaggat cctgagtatt ggaacaggat ttcagtccag ggtctaaacc 3180
gtatatatga atggtaactc acagataagc cattcaaatt gcaaagaggc acatatcttg 3240gtatatatga atggtaactc acagataagc cattcaaatt gcaaagaggc acatatcttg 3240
cagaaaattt cttaatcctt aaatcctaat tttttgcagt tacacatgga agatctatgc 3300cagaaaattt cttaatcctt aaatcctaat ttttgcagt tacacatgga agatctatgc 3300
aaacaaggta ttgaatatgg ggtccatcta tactttttgg aggacattgt acagagatca 33603360
gaaacaagca aagcaaagat acatcgagac tttctacaat cttgagttta ggaacttggt 3420gaaacaagca aagcaaagat acatcgagac tttctacaat cttgagttta ggaacttggt 3420
atagtgctgc atgacattga cagtatacca caaacatctt tatgagatga attactttta 3480atagtgctgc atgacattga cagtatacca caaacatctt tatgagatga attactttta 3480
ataaaattgt ttttaacctt tgcttcctta atggcactta ttgcaggtaa aaaatgtgcc 3540ataaaattgt ttttaacctt tgcttcctta atggcactta ttgcaggtaa aaaatgtgcc 3540
tatcagaaag gacgaaacac cacaaggacc aaaggagagg gagaaagtta agccacagat 3600gacgaaacac cacaaggacc aaaggagagg gagaaagtta agccacagat 3600
atcacaaagg catgctctaa agcttttgcc tacagttttt caagagaccc tagtatattc 36603660
tagtactaaa ttagaattat acagcatgca gcttttgctg ttcacctttc taaatcacca 3720tagtactaaa ttagaattat acagcatgca gcttttgctg ttcacctttc taaatcacca 3720
gttgtgtcaa tcaagttgac aaaatcaata aattgggatt ttccctttcc tatgcttgat 3780gttgtgtcaa tcaagttgac aaaatcaata aattgggatt ttccctttcc tatgcttgat 3780
tgttattact cctactttgt ttatggtagt cttccttcat tgttttctcc tgtacttctt 38403840
ttactacaac tgtactgaca tactaattat ttctgtgtac caggcgctca caatcaaggt 3900ttactacaac tgtactgaca tactaattat ttctgtgtac caggcgctca caatcaaggt 3900
tgcagaagta agattagata aaattgctac tgcatga 3937tgcagaagta agattagata aaattgctac tgcatga 3937
<210> 22<210> 22
<211> 860<211> 860
<212> БЕЛОК<212> PROTEIN
<213> Nicotiana tabacum<213> Nicotiana tabacum
<400> 22<400> 22
Met Ala Thr Ala Pro Ala Leu Asn Arg Ser Glu Ser Ile Ala Asp Ser Met Ala Thr Ala Pro Ala Leu Asn Arg Ser Glu Ser Ile Ala Asp Ser
1 5 10 15 1 5 10 15
Met Pro Glu Ala Leu Arg Gln Ser Arg Tyr His Met Lys Lys Cys Phe Met Pro Glu Ala Leu Arg Gln Ser Arg Tyr His Met Lys Lys Cys Phe
20 25 30 20 25 30
Ala Lys Tyr Ile Glu Gln Gly Lys Arg Met Met Lys Leu His Asn Leu Ala Lys Tyr Ile Glu Gln Gly Lys Arg Met Met Lys Leu His Asn Leu
35 40 45 35 40 45
Met Asp Glu Leu Glu Lys Val Ile Asp Asp Pro Ala Glu Arg Asn His Met Asp Glu Leu Glu Lys Val Ile Asp Asp Pro Ala Glu Arg Asn His
50 55 60 50 55 60
Val Leu Glu Gly Leu Leu Gly Tyr Ile Leu Cys Thr Thr Met Glu Ala Val Leu Glu Gly Leu Leu Gly Tyr Ile Leu Cys Thr Thr Met Glu Ala
65 70 75 80 65 70 75 80
Ala Val Val Pro Pro Tyr Ile Ala Phe Ala Thr Arg Gln Asn Pro Gly Ala Val Val Pro Pro Tyr Ile Ala Phe Ala Thr Arg Gln Asn Pro Gly
85 90 95 85 90 95
Phe Trp Glu Tyr Val Lys Val Asn Ala Asn Asp Leu Ser Val Glu Gly Phe Trp Glu Tyr Val Lys Val Asn Ala Asn Asp Leu Ser Val Glu Gly
100 105 110 100 105 110
Ile Thr Ala Thr Glu Tyr Leu Lys Phe Lys Glu Met Ile Val Asp Glu Ile Thr Ala Thr Glu Tyr Leu Lys Phe Lys Glu Met Ile Val Asp Glu
115 120 125 115 120 125
Cys Trp Ala Lys Asp Glu Tyr Ala Leu Glu Ile Asp Phe Gly Ala Val Cys Trp Ala Lys Asp Glu Tyr Ala Leu Glu Ile Asp Phe Gly Ala Val
130 135 140 130 135 140
Asp Phe Ser Thr Pro Arg Leu Thr Leu Ser Ser Ser Ile Gly Asn Gly Asp Phe Ser Thr Pro Arg Leu Thr Leu Ser Ser Ser Ile Gly Asn Gly
145 150 155 160 145 150 155 160
Leu Ser Tyr Val Ser Lys Phe Leu Thr Ser Lys Leu Asn Ala Thr Ser Leu Ser Tyr Val Ser Lys Phe Leu Thr Ser Lys Leu Asn Ala Thr Ser
165 170 175 165 170 175
Ala Ser Ala Gln Cys Leu Val Asp Tyr Leu Leu Thr Leu Asn His Gln Ala Ser Ala Gln Cys Leu Val Asp Tyr Leu Leu Thr Leu Asn His Gln
180 185 190 180 185 190
Gly Asp Lys Leu Met Ile Asn Glu Thr Leu Ser Thr Val Ser Lys Leu Gly Asp Lys Leu Met Ile Asn Glu Thr Leu Ser Thr Val Ser Lys Leu
195 200 205 195 200 205
Gln Ala Ala Leu Val Val Ala Glu Ala Ser Ile Ser Ser Leu Pro Thr Gln Ala Ala Leu Val Val Ala Glu Ala Ser Ile Ser Ser Leu Pro Thr
210 215 220 210 215 220
Asp Thr Pro Tyr Glu Ser Phe Glu Leu Arg Phe Lys Gln Trp Gly Phe Asp Thr Pro Tyr Glu Ser Phe Glu Leu Arg Phe Lys Gln Trp Gly Phe
225 230 235 240 225 230 235 240
Glu Lys Gly Trp Gly Asp Thr Ala Glu Arg Val Ser Asp Thr Met Arg Glu Lys Gly Trp Gly Asp Thr Ala Glu Arg Val Ser Asp Thr Met Arg
245 250 255 245 250 255
Thr Leu Ser Glu Val Leu Gln Ala Pro Asp Pro Leu Asn Ile Gln Lys Thr Leu Ser Glu Val Leu Gln Ala Pro Asp Pro Leu Asn Ile Gln Lys
260 265 270 260 265 270
Phe Phe Gly Arg Val Pro Thr Val Phe Asn Ile Val Leu Phe Ser Val Phe Phe Gly Arg Val Pro Thr Val Phe Asn Ile Val Leu Phe Ser Val
275 280 285 275 280 285
His Gly Tyr Phe Gly Gln Ala Asp Val Leu Gly Leu Pro Asp Thr Gly His Gly Tyr Phe Gly Gln Ala Asp Val Leu Gly Leu Pro Asp Thr Gly
290 295 300 290 295 300
Gly Gln Val Val Tyr Val Leu Asp Gln Val Val Ala Phe Glu Glu Glu Gly Gln Val Val Tyr Val Leu Asp Gln Val Val Ala Phe Glu Glu Glu
305 310 315 320 305 310 315 320
Met Leu Gln Arg Ile Lys Gln Gln Gly Leu Asn Ile Lys Pro Gln Ile Met Leu Gln Arg Ile Lys Gln Gln Gly Leu Asn Ile Lys Pro Gln Ile
325 330 335 325 330 335
Leu Val Leu Thr Arg Leu Ile Pro Asp Ala Lys Gly Thr Lys Cys Asn Leu Val Leu Thr Arg Leu Ile Pro Asp Ala Lys Gly Thr Lys Cys Asn
340 345 350 340 345 350
Gln Glu Leu Glu Pro Ile Lys Asn Thr Lys His Ser His Ile Leu Arg Gln Glu Leu Glu Pro Ile Lys Asn Thr Lys His Ser His Ile Leu Arg
355 360 365 355 360 365
Val Pro Phe Arg Thr Glu Lys Gly Val Leu Asn Gln Trp Val Ser Arg Val Pro Phe Arg Thr Glu Lys Gly Val Leu Asn Gln Trp Val Ser Arg
370 375 380 370 375 380
Phe Asp Ile Tyr Pro Tyr Leu Glu Arg Tyr Thr Gln Asp Ala Ala Asp Phe Asp Ile Tyr Pro Tyr Leu Glu Arg Tyr Thr Gln Asp Ala Ala Asp
385 390 395 400 385 390 395 400
Lys Ile Val Glu Leu Met Glu Gly Lys Pro Asp Leu Ile Ile Gly Asn Lys Ile Val Glu Leu Met Glu Gly Lys Pro Asp Leu Ile Ile Gly Asn
405 410 415 405 410 415
Tyr Thr Asp Gly Asn Leu Val Ala Ser Leu Met Ala Arg Lys Leu Gly Tyr Thr Asp Gly Asn Leu Val Ala Ser Leu Met Ala Arg Lys Leu Gly
420 425 430 420 425 430
Ile Thr Leu Gly Thr Ile Ala His Ala Leu Glu Lys Thr Lys Tyr Glu Ile Thr Leu Gly Thr Ile Ala His Ala Leu Glu Lys Thr Lys Tyr Glu
435 440 445 435 440 445
Asp Ser Asp Ile Lys Leu Lys Glu Leu Asp Pro Lys Tyr His Phe Ser Asp Ser Asp Ile Lys Leu Lys Glu Leu Asp Pro Lys Tyr His Phe Ser
450 455 460 450 455 460
Cys Gln Phe Thr Ala Asp Leu Ile Ala Met Asn Ser Ala Asp Phe Ile Cys Gln Phe Thr Ala Asp Leu Ile Ala Met Asn Ser Ala Asp Phe Ile
465 470 475 480 465 470 475 480
Ile Thr Ser Thr Tyr Gln Glu Ile Ala Gly Ser Lys Asp Lys Pro Gly Ile Thr Ser Thr Tyr Gln Glu Ile Ala Gly Ser Lys Asp Lys Pro Gly
485 490 495 485 490 495
Gln Tyr Glu Ser His Ser Ala Phe Thr Leu Pro Gly Leu Tyr Arg Val Gln Tyr Glu Ser His Ser Ala Phe Thr Leu Pro Gly Leu Tyr Arg Val
500 505 510 500 505 510
Ala Ser Gly Ile Asn Val Phe Asp Pro Lys Phe Asn Ile Ala Ala Pro Ala Ser Gly Ile Asn Val Phe Asp Pro Lys Phe Asn Ile Ala Ala Pro
515 520 525 515 520 525
Gly Ala Asp Gln Ser Val Tyr Phe Pro Tyr Thr Glu Lys Gln Lys Arg Gly Ala Asp Gln Ser Val Tyr Phe Pro Tyr Thr Glu Lys Gln Lys Arg
530 535 540 530 535 540
Leu Thr Ala Phe Arg Pro Ala Ile Glu Glu Leu Leu Phe Ser Lys Val Leu Thr Ala Phe Arg Pro Ala Ile Glu Glu Leu Leu Phe Ser Lys Val
545 550 555 560 545 550 555 560
Asp Asn Asp Glu His Val Gly Tyr Leu Glu Asp Arg Lys Lys Pro Ile Asp Asn Asp Glu His Val Gly Tyr Leu Glu Asp Arg Lys Lys Pro Ile
565 570 575 565 570 575
Leu Phe Thr Met Ala Arg Leu Asp Thr Val Lys Asn Thr Ser Gly Leu Leu Phe Thr Met Ala Arg Leu Asp Thr Val Lys Asn Thr Ser Gly Leu
580 585 590 580 585 590
Thr Glu Trp Tyr Gly Lys Asn Lys Arg Leu Arg Ser Leu Val Asn Leu Thr Glu Trp Tyr Gly Lys Asn Lys Arg Leu Arg Ser Leu Val Asn Leu
595 600 605 595 600 605
Val Val Val Gly Gly Ser Phe Asp Pro Thr Lys Ser Lys Asp Arg Glu Val Val Val Gly Gly Ser Phe Asp Pro Thr Lys Ser Lys Asp Arg Glu
610 615 620 610 615 620
Glu Ala Ala Glu Ile Lys Lys Met His Met Leu Ile Glu Lys Tyr Gln Glu Ala Ala Glu Ile Lys Lys Met His Met Leu Ile Glu Lys Tyr Gln
625 630 635 640 625 630 635 640
Leu Lys Gly Gln Ile Arg Trp Ile Ala Ala Gln Thr Asp Arg Tyr Arg Leu Lys Gly Gln Ile Arg Trp Ile Ala Ala Gln Thr Asp Arg Tyr Arg
645 650 655 645 650 655
Asn Ser Glu Leu Tyr Arg Thr Ile Ala Asp Ser Lys Gly Ala Phe Val Asn Ser Glu Leu Tyr Arg Thr Ile Ala Asp Ser Lys Gly Ala Phe Val
660 665 670 660 665 670
Gln Pro Ala Leu Tyr Glu Ala Phe Gly Leu Thr Val Ile Glu Ala Met Gln Pro Ala Leu Tyr Glu Ala Phe Gly Leu Thr Val Ile Glu Ala Met
675 680 685 675 680 685
Asn Cys Gly Leu Pro Thr Phe Ala Thr Asn Gln Gly Gly Pro Ala Glu Asn Cys Gly Leu Pro Thr Phe Ala Thr Asn Gln Gly Gly Pro Ala Glu
690 695 700 690 695 700
Ile Ile Val Asp Gly Val Ser Gly Phe His Ile Asp Pro Asn Asn Gly Ile Ile Val Asp Gly Val Ser Gly Phe His Ile Asp Pro Asn Asn Gly
705 710 715 720 705 710 715 720
Asp Glu Ser Ser Asn Lys Ile Ala Asn Phe Phe Gln Lys Cys Arg Glu Asp Glu Ser Ser Asn Lys Ile Ala Asn Phe Phe Gln Lys Cys Arg Glu
725 730 735 725 730 735
Asp Pro Glu Tyr Trp Asn Arg Ile Ser Val Gln Gly Leu Asn Arg Ile Asp Pro Glu Tyr Trp Asn Arg Ile Ser Val Gln Gly Leu Asn Arg Ile
740 745 750 740 745 750
Tyr Glu Cys Tyr Thr Trp Lys Ile Tyr Ala Asn Lys Val Leu Asn Met Tyr Glu Cys Tyr Thr Trp Lys Ile Tyr Ala Asn Lys Val Leu Asn Met
755 760 765 755 760 765
Gly Ser Ile Tyr Thr Phe Trp Arg Thr Leu Tyr Arg Asp Gln Lys Gln Gly Ser Ile Tyr Thr Phe Trp Arg Thr Leu Tyr Arg Asp Gln Lys Gln
770 775 780 770 775 780
Ala Lys Gln Arg Tyr Ile Glu Thr Phe Tyr Asn Leu Glu Phe Arg Asn Ala Lys Gln Arg Tyr Ile Glu Thr Phe Tyr Asn Leu Glu Phe Arg Asn
785 790 795 800 785 790 795 800
Leu Val Lys Asn Val Pro Ile Arg Lys Asp Glu Thr Pro Gln Gly Pro Leu Val Lys Asn Val Pro Ile Arg Lys Asp Glu Thr Pro Gln Gly Pro
805 810 815 805 810 815
Lys Glu Arg Glu Lys Val Lys Pro Gln Ile Ser Gln Arg His Ala Leu Lys Glu Arg Glu Lys Val Lys Pro Gln Ile Ser Gln Arg His Ala Leu
820 825 830 820 825 830
Lys Leu Leu Pro Thr Val Phe Gln Glu Thr Leu Ala Leu Thr Ile Lys Lys Leu Leu Pro Thr Val Phe Gln Glu Thr Leu Ala Leu Thr Ile Lys
835 840 845 835 840 845
Val Ala Glu Val Arg Leu Asp Lys Ile Ala Thr Ala Val Ala Glu Val Arg Leu Asp Lys Ile Ala Thr Ala
850 855 860 850 855 860
<210> 23<210> 23
<211> 3905<211> 3905
<212> ДНК<212> DNA
<213> Nicotiana tabacum<213> Nicotiana tabacum
<400> 23<400> 23
atggctactg caccagccct gaaaagatca gagtccatag ctgatagcat gccagaggcc 60atggctactg caccagccct gaaaagatca gagtccatag ctgatagcat gccagaggcc 60
ttaaggcaaa gccggtacca catgaagaaa tgttttgcca agtacataga gcaaggcaag 120ttaaggcaaa gccggtacca catgaagaaa tgttttgcca agtacataga gcaaggcaag 120
aggatgatga aacttcataa cttgatggat gaattggaga aagtaattga tgatcctgct 180aggatgatga aacttcataa cttgatggat gaattggaga aagtaattga tgatcctgct 180
gaaaggaacc atgttttgga aggcttactt ggctacatat tatgtactac aatggtatag 240gaaaggaacc atgttttgga aggcttactt ggctacatat tatgtactac aatggtatag 240
ctagattcat atgtacttat gatgtcctta tattgtttcc ggaggcatta ttcttaaatc 300ctagattcat atgtacttat gatgtcctta tattgtttcc ggaggcatta ttcttaaatc 300
cttctttgat caaatttgta ggaggctgca gttgttcctc cctatattgc cttcgccacg 360cttctttgat caaatttgta ggaggctgca gttgttcctc cctatattgc cttcgccacg 360
agacagaatc ctggattctg ggaatatgtg aaagtcaatg ctaatgatct ttctgttgag 420agacagaatc ctggattctg ggaatatgtg aaagtcaatg ctaatgatct ttctgttgag 420
ggtattacag ctacagatta cttgaaattc aaggaaatga tagttgatga aagctggtat 480ggtattacag ctacagatta cttgaaattc aaggaaatga tagttgatga aagctggtat 480
agaatacttt gcagcttatc ataccttttg tggttttata atttcaatca gaaaactcat 540agaatacttt gcagcttatc ataccttttg tggttttata atttcaatca gaaaactcat 540
cagagttacc tttgtgtgaa catgacatgc agggcaaaag atgaatatgc actggaaatt 600cagagttacc tttgtgtgaa catgacatgc agggcaaaag atgaatatgc actggaaatt 600
gattttggag cagtagactt ctcaacgcct cgactgaccc tatcctcttc aattggaaat 660gattttggag cagtagactt ctcaacgcct cgactgaccc tatcctcttc aattggaaat 660
ggtctcagtt atgtttccaa gtttctaact tcaaagctaa atgctacctc agcgagtgca 720ggtctcagtt atgtttccaa gtttctaact tcaaagctaa atgctacctc agcgagtgca 720
cagtgtctgg ttgactactt gctcactttg aatcaccaag gagatgtacg tcaacaaaaa 780cagtgtctgg ttgactactt gctcactttg aatcaccaag gagatgtacg tcaacaaaaa 780
tcaaactcca taagtaaact tgtcaactct aagaagtaaa aataggaaaa gaagattcat 840tcaaactcca taagtaaact tgtcaactct aagaagtaaa aataggaaaa gaagattcat 840
gtaacaaatt ttctttatgt tcaactgtag aaactgatga tcaatgagac actcggcact 900gtaacaaatt ttctttatgt tcaactgtag aaactgatga tcaatgagac actcggcact 900
gtctcaaagc ttcaggctgc actggttgta gcagaagcat ctatttcctc cttaccaaca 960gtctcaaagc ttcaggctgc actggttgta gcagaagcat ctatttcctc cttaccaaca 960
gatacaccat accagagctt tgagctaagg tgatttgttt tttcctctac ttccttccac 1020gatacaccat accagagctt tgagctaagg tgatttgttt ttttcctctac ttccttccac 1020
ttttggtgtg ctacatagta ctaagtaact tcaattcttg taaagattca aacagtgggg 1080ttttggtgtg ctacatagta ctaagtaact tcaattcttg taaagattca aacagtgggg 1080
ttttgagaaa ggatggggtg atacagctga aagggtccgc gacaccatga gaacactttc 1140ttttgagaaa ggatggggtg atacagctga aagggtccgc gacaccatga gaacactttc 1140
tgaggtactt caggcgccag atccattgaa cattgagaag ttctttggga gggttccaac 1200tgaggtactt caggcgccag atccattgaa cattgagaag ttctttggga gggttccaac 1200
tgttttcaat attgtattgt tctctgttca tggatacttt ggccaagcaa atgttcttgg 1260tgttttcaat attgtattgt tctctgttca tggatacttt ggccaagcaa atgttcttgg 1260
cttgccagac acaggtggtc aggtaagcat ctaatagctt ttacatttaa cttctatgca 1320cttgccagac acaggtggtc aggtaagcat ctaatagctt ttacatttaa cttctatgca 1320
ttgacaataa aataacttct acactaccaa ataatttttg aaagtttgac cacttcggct 13801380
cttgttcaac aggtggttta tgttttggat caagttgtag cttttgaaga agaaatgctc 1440cttgttcaac aggtggttta tgttttggat caagttgtag cttttgaaga agaaatgctc 1440
caaagaatta aacagcaggg gctcaatatt aagcctcaaa ttcttgtggt gagctcctag 1500caaagaatta aacagcaggg gctcaatatt aagcctcaaa ttcttgtggt gagctcctag 1500
acaatgacgt gactatgcaa ttaagtagag gctgtttaga aaagttaata tcatatgttg 1560acaatgacgt gactatgcaa ttaagtagag gctgtttaga aaagttaata tcatatgttg 1560
attgcacagt taacccgact gattccggac gccaaaggaa caaagtgcaa ccaggaacta 1620attgcacagt taacccgact gattccggac gccaaaggaa caaagtgcaa cggaacta 1620
gaaccaatca agaatacaaa acattcacac atcctcagag ttccatttag gacagaaaaa 1680gaaccaatca agaatacaaa acattcacac atcctcagag ttccatttag gacagaaaaa 1680
ggagtgctta atcaatgggt ttcacgattt gatatctatc catatctgga gagatatact 1740ggagtgctta atcaatgggt ttcacgattt gatatctatc catatctgga gagatatact 1740
caggtgtgta tttttatatc aaccctgctc atcaaagatg tgttgtttcc tcaattccat 1800caggtgtgta tttttatc aaccctgctc atcaaagatg tgttgtttcc tcaattccat 1800
ttttcgcctt gacaaaagga cgctgctgac aaaatcatcg agctaatgga aggcaaacct 1860ttttcgcctt gacaaaagga cgctgctgac aaaatcatcg agctaatgga aggcaaacct 1860
gatctaatca ttggtaacta cactgatggg aatctagtgg cttctctaat ggctagaaag 1920gatctaatca ttggtaacta cactgatggg aatctagtgg cttctctaat ggctagaaag 1920
cttgggataa ctctggtaac ttttcttatc atatttgatg ttgtttcttc tccaagttgg 1980cttgggataa ctctggtaac ttttcttatc atatttgatg ttgtttcttc tccaagttgg 1980
ttcttaatgt caactaaccc agaccatctt tgtaacaggg aactattgct catgctctgg 2040ttcttaatgt caactaaccc agaccatctt tgtaacaggg aactattgct catgctctgg 2040
agaagacaaa atatgaagac tctgacatca aattgaagga actcgatccg aagtaccact 2100agaagacaaa atatgaagac tctgacatca aattgaagga actcgatccg aagtaccact 2100
tttcttgcca attcacagct gatttgattg caatgaattc agcagatttc attatcacaa 2160tttcttgcca attcacagct gatttgattg caatgaattc agcagatttc attatcacaa 2160
gcacatatca agaaatagcc ggaaggtaag aattggaact acggaagcag agagctaata 22202220
agtagtgcac tcatatattt cagcatcgct ctttcgcata atcgaataca caccactact 2280agtagtgcac tcatatattt cagcatcgct ctttcgcata atcgaataca caccactact 2280
cagtaaatgt acttgctcaa aagtttacaa gtttatggat cttattcttg aatgcttcaa 2340cagtaaatgt acttgctcaa aagtttacaa gtttatggat cttattcttg aatgcttcaa 2340
catatgcagc aaagataggc caggacagta tgagagccat agtgcattta cccttccagg 2400catatgcagc aaagataggc caggacagta tgagagccat agtgcattta cccttccagg 2400
gctttacaga gttgcttcag gcatcaatgt ctttgatcct aaatttaata ttgctgcacc 2460gctttacaga gttgcttcag gcatcaatgt ctttgatcct aaatttaata ttgctgcacc 2460
tggggcagac caatcggtgt atttccctta cacagaaaag cagacgcgtt tgactgcttt 2520tggggcagac caatcggtgt atttccctta cacagaaaag cagacgcgtt tgactgcttt 2520
ccgccctgcc attgaggaac tgctttttag taaagtggac aatgacgagc acatgtaagt 2580ccgccctgcc attgaggaac tgctttttag taaagtggac aatgacgagc acatgtaagt 2580
cttagtgtta aacttcagct ttcagcttag tgcctagaac attccactgg ctctatgtat 2640cttagtgtta aacttcagct ttcagcttag tgcctagaac attccactgg ctctatgtat 2640
taatgtttca cttgtttcaa acacagtgga tatttagaag acagaaagaa acctatcctg 2700taatgtttca cttgtttcaa acacagtgga tatttagaag acagaaagaa acctatcctg 2700
tttaccatgg caaggctgga cacagtgaag aacacatctg gactaacaga atggtatggc 2760tttaccatgg caaggctgga cacagtgaag aacacatctg gactaacaga atggtatggc 2760
aagaacaaga ggctcagaag cttagttaac cttgttgtgg ttggtggttc ctttgatcct 2820aagaacaaga ggctcagaag cttagttaac cttgttgtgg ttggtggttc ctttgatcct 2820
acaaaatcca aggatagaga agaagcagct gaaataaaaa agatgcacat gctgatagag 2880acaaaatcca aggatagaga agaagcagct gaaataaaaa agatgcacat gctgatagag 2880
aaataccagc ttaagggtca gatcagatgg atagcagctc agactgacag atatagaaac 2940aaataccagc ttaagggtca gatcagatgg atagcagctc agactgacag atatagaaac 2940
agtgaactct accgcacaat agcagattcc aaaggagctt ttgtgcagcc tgcattatat 3000agtgaactct accgcacaat agcagattcc aaaggagctt ttgtgcagcc tgcattatat 3000
gaagcatttg gtctaacagt cattgaggca atgaactgtg gattaccaac ctttgctacc 3060gaagcatttg gtctaacagt cattgaggca atgaactgtg gattaccaac ctttgctacc 3060
aaccaaggtg gccctgctga gattattgtt gatggggtct caggctttca tattgatcca 3120aaccaaggtg gccctgctga gattattgtt gatggggtct caggctttca tattgatcca 3120
aataatgggg atgaatcaag caacaaagtt gccaactttt tccaaaaatg cagggaggat 3180aataatgggg atgaatcaag caacaaagtt gccaactttt tccaaaaatg cagggaggat 3180
cctgagtatt ggaacaggat ttcagtccag ggtctaaacc gtatatatga atggtaactc 3240cctgagtatt ggaacaggat ttcagtccag ggtctaaacc gtatatatga atggtaactc 3240
acagataagc cattcaaatt gcaaagaggc acatatcttg ctgaaaattt cttaatcctt 3300acagataagc cattcaaatt gcaaagaggc acatatcttg ctgaaaattt cttaatcctt 3300
taatcctaaa attttgcagt tacacatgga agatctatgc aaacaaggta ttgaatatgg 33603360
ggtccatcta tactttttgg aggacattgt acagagatca gaaacaagca aagcaaagat 3420ggtccatcta tactttttgg aggacattgt acagagatca gaaacaagca aagcaaagat 3420
acatcgagac tttctacaat cttgagttta ggaacttggt atagtgctgc atgacattga 3480acatcgagac tttctacaat cttgagttta ggaacttggt atagtgctgc atgacattga 3480
cagtatacca caaacatctt tatgagatga attactttta ataaaattgt ttttaacctt 35403540
tgcctcctta atgacactta ttgcaggtaa aaaatgtgcc tatcagacag gacgaaacac 3600tgcctcctta atgacactta ttgcaggtaa aaaatgtgcc tatcagacag gacgaaacac 3600
cacaaggacc aaaggagagg agggagaaag ttaagccaca gatatcacaa aggcatgctc 36603660
taaagctttt gcctatagtt tttcaggaga ccctagtata ttctagtact aaattagaat 3720taaagctttt gcctatagtt tttcaggaga ccctagtata ttctagtact aaattagaat 3720
tatacagcat gcagcttgct tctgctgttc acctttctaa atcaccagtt atgtcaatca 3780tatacagcat gcagcttgct tctgctgttc acctttctaa atcaccagtt atgtcaatca 3780
agttgacaaa atcaataaat tcggcttttc cctttcctat gcttgattgt tattactcct 38403840
acttcgttta tggtagtctt ccttcattgt tttctcctgt acttctttta ctacaactgt 3900acttcgttta tggtagtctt ccttcattgt tttctcctgt acttctttta ctacaactgt 3900
actga 3905actga 3905
<210> 24<210> 24
<211> 913<211> 913
<212> БЕЛОКБЕЛОК<212> PROTEIN
<213> Nicotiana tabacum<213> Nicotiana tabacum
<400> 24<400> 24
Met Ala Thr Ala Pro Ala Leu Lys Arg Ser Glu Ser Ile Ala Asp Ser Met Ala Thr Ala Pro Ala Leu Lys Arg Ser Glu Ser Ile Ala Asp Ser
1 5 10 15 1 5 10 15
Met Pro Glu Ala Leu Arg Gln Ser Arg Tyr His Met Lys Lys Cys Phe Met Pro Glu Ala Leu Arg Gln Ser Arg Tyr His Met Lys Lys Cys Phe
20 25 30 20 25 30
Ala Lys Tyr Ile Glu Gln Gly Lys Arg Met Met Lys Leu His Asn Leu Ala Lys Tyr Ile Glu Gln Gly Lys Arg Met Met Lys Leu His Asn Leu
35 40 45 35 40 45
Met Asp Glu Leu Glu Lys Val Ile Asp Asp Pro Ala Glu Arg Asn His Met Asp Glu Leu Glu Lys Val Ile Asp Asp Pro Ala Glu Arg Asn His
50 55 60 50 55 60
Val Leu Glu Gly Leu Leu Gly Tyr Ile Leu Cys Thr Thr Met Glu Ala Val Leu Glu Gly Leu Leu Gly Tyr Ile Leu Cys Thr Thr Met Glu Ala
65 70 75 80 65 70 75 80
Ala Val Val Pro Pro Tyr Ile Ala Phe Ala Thr Arg Gln Asn Pro Gly Ala Val Val Pro Pro Tyr Ile Ala Phe Ala Thr Arg Gln Asn Pro Gly
85 90 95 85 90 95
Phe Trp Glu Tyr Val Lys Val Asn Ala Asn Asp Leu Ser Val Glu Gly Phe Trp Glu Tyr Val Lys Val Asn Ala Asn Asp Leu Ser Val Glu Gly
100 105 110 100 105 110
Ile Thr Ala Thr Asp Tyr Leu Lys Phe Lys Glu Met Ile Val Asp Glu Ile Thr Ala Thr Asp Tyr Leu Lys Phe Lys Glu Met Ile Val Asp Glu
115 120 125 115 120 125
Ser Trp Ala Lys Asp Glu Tyr Ala Leu Glu Ile Asp Phe Gly Ala Val Ser Trp Ala Lys Asp Glu Tyr Ala Leu Glu Ile Asp Phe Gly Ala Val
130 135 140 130 135 140
Asp Phe Ser Thr Pro Arg Leu Thr Leu Ser Ser Ser Ile Gly Asn Gly Asp Phe Ser Thr Pro Arg Leu Thr Leu Ser Ser Ser Ile Gly Asn Gly
145 150 155 160 145 150 155 160
Leu Ser Tyr Val Ser Lys Phe Leu Thr Ser Lys Leu Asn Ala Thr Ser Leu Ser Tyr Val Ser Lys Phe Leu Thr Ser Lys Leu Asn Ala Thr Ser
165 170 175 165 170 175
Ala Ser Ala Gln Cys Leu Val Asp Tyr Leu Leu Thr Leu Asn His Gln Ala Ser Ala Gln Cys Leu Val Asp Tyr Leu Leu Thr Leu Asn His Gln
180 185 190 180 185 190
Gly Asp Lys Leu Met Ile Asn Glu Thr Leu Gly Thr Val Ser Lys Leu Gly Asp Lys Leu Met Ile Asn Glu Thr Leu Gly Thr Val Ser Lys Leu
195 200 205 195 200 205
Gln Ala Ala Leu Val Val Ala Glu Ala Ser Ile Ser Ser Leu Pro Thr Gln Ala Ala Leu Val Val Ala Glu Ala Ser Ile Ser Ser Leu Pro Thr
210 215 220 210 215 220
Asp Thr Pro Tyr Gln Ser Phe Glu Leu Arg Phe Lys Gln Trp Gly Phe Asp Thr Pro Tyr Gln Ser Phe Glu Leu Arg Phe Lys Gln Trp Gly Phe
225 230 235 240 225 230 235 240
Glu Lys Gly Trp Gly Asp Thr Ala Glu Arg Val Arg Asp Thr Met Arg Glu Lys Gly Trp Gly Asp Thr Ala Glu Arg Val Arg Asp Thr Met Arg
245 250 255 245 250 255
Thr Leu Ser Glu Val Leu Gln Ala Pro Asp Pro Leu Asn Ile Glu Lys Thr Leu Ser Glu Val Leu Gln Ala Pro Asp Pro Leu Asn Ile Glu Lys
260 265 270 260 265 270
Phe Phe Gly Arg Val Pro Thr Val Phe Asn Ile Val Leu Phe Ser Val Phe Phe Gly Arg Val Pro Thr Val Phe Asn Ile Val Leu Phe Ser Val
275 280 285 275 280 285
His Gly Tyr Phe Gly Gln Ala Asn Val Leu Gly Leu Pro Asp Thr Gly His Gly Tyr Phe Gly Gln Ala Asn Val Leu Gly Leu Pro Asp Thr Gly
290 295 300 290 295 300
Gly Gln Val Val Tyr Val Leu Asp Gln Val Val Ala Phe Glu Glu Glu Gly Gln Val Val Tyr Val Leu Asp Gln Val Val Ala Phe Glu Glu Glu
305 310 315 320 305 310 315 320
Met Leu Gln Arg Ile Lys Gln Gln Gly Leu Asn Ile Lys Pro Gln Ile Met Leu Gln Arg Ile Lys Gln Gln Gly Leu Asn Ile Lys Pro Gln Ile
325 330 335 325 330 335
Leu Val Leu Thr Arg Leu Ile Pro Asp Ala Lys Gly Thr Lys Cys Asn Leu Val Leu Thr Arg Leu Ile Pro Asp Ala Lys Gly Thr Lys Cys Asn
340 345 350 340 345 350
Gln Glu Leu Glu Pro Ile Lys Asn Thr Lys His Ser His Ile Leu Arg Gln Glu Leu Glu Pro Ile Lys Asn Thr Lys His Ser His Ile Leu Arg
355 360 365 355 360 365
Val Pro Phe Arg Thr Glu Lys Gly Val Leu Asn Gln Trp Val Ser Arg Val Pro Phe Arg Thr Glu Lys Gly Val Leu Asn Gln Trp Val Ser Arg
370 375 380 370 375 380
Phe Asp Ile Tyr Pro Tyr Leu Glu Arg Tyr Thr Gln Asp Ala Ala Asp Phe Asp Ile Tyr Pro Tyr Leu Glu Arg Tyr Thr Gln Asp Ala Ala Asp
385 390 395 400 385 390 395 400
Lys Ile Ile Glu Leu Met Glu Gly Lys Pro Asp Leu Ile Ile Gly Asn Lys Ile Ile Glu Leu Met Glu Gly Lys Pro Asp Leu Ile Ile Gly Asn
405 410 415 405 410 415
Tyr Thr Asp Gly Asn Leu Val Ala Ser Leu Met Ala Arg Lys Leu Gly Tyr Thr Asp Gly Asn Leu Val Ala Ser Leu Met Ala Arg Lys Leu Gly
420 425 430 420 425 430
Ile Thr Leu Gly Thr Ile Ala His Ala Leu Glu Lys Thr Lys Tyr Glu Ile Thr Leu Gly Thr Ile Ala His Ala Leu Glu Lys Thr Lys Tyr Glu
435 440 445 435 440 445
Asp Ser Asp Ile Lys Leu Lys Glu Leu Asp Pro Lys Tyr His Phe Ser Asp Ser Asp Ile Lys Leu Lys Glu Leu Asp Pro Lys Tyr His Phe Ser
450 455 460 450 455 460
Cys Gln Phe Thr Ala Asp Leu Ile Ala Met Asn Ser Ala Asp Phe Ile Cys Gln Phe Thr Ala Asp Leu Ile Ala Met Asn Ser Ala Asp Phe Ile
465 470 475 480 465 470 475 480
Ile Thr Ser Thr Tyr Gln Glu Ile Ala Gly Ser Lys Asp Arg Pro Gly Ile Thr Ser Thr Tyr Gln Glu Ile Ala Gly Ser Lys Asp Arg Pro Gly
485 490 495 485 490 495
Gln Tyr Glu Ser His Ser Ala Phe Thr Leu Pro Gly Leu Tyr Arg Val Gln Tyr Glu Ser His Ser Ala Phe Thr Leu Pro Gly Leu Tyr Arg Val
500 505 510 500 505 510
Ala Ser Gly Ile Asn Val Phe Asp Pro Lys Phe Asn Ile Ala Ala Pro Ala Ser Gly Ile Asn Val Phe Asp Pro Lys Phe Asn Ile Ala Ala Pro
515 520 525 515 520 525
Gly Ala Asp Gln Ser Val Tyr Phe Pro Tyr Thr Glu Lys Gln Thr Arg Gly Ala Asp Gln Ser Val Tyr Phe Pro Tyr Thr Glu Lys Gln Thr Arg
530 535 540 530 535 540
Leu Thr Ala Phe Arg Pro Ala Ile Glu Glu Leu Leu Phe Ser Lys Val Leu Thr Ala Phe Arg Pro Ala Ile Glu Glu Leu Leu Phe Ser Lys Val
545 550 555 560 545 550 555 560
Asp Asn Asp Glu His Ile Gly Tyr Leu Glu Asp Arg Lys Lys Pro Ile Asp Asn Asp Glu His Ile Gly Tyr Leu Glu Asp Arg Lys Lys Pro Ile
565 570 575 565 570 575
Leu Phe Thr Met Ala Arg Leu Asp Thr Val Lys Asn Thr Ser Gly Leu Leu Phe Thr Met Ala Arg Leu Asp Thr Val Lys Asn Thr Ser Gly Leu
580 585 590 580 585 590
Thr Glu Trp Tyr Gly Lys Asn Lys Arg Leu Arg Ser Leu Val Asn Leu Thr Glu Trp Tyr Gly Lys Asn Lys Arg Leu Arg Ser Leu Val Asn Leu
595 600 605 595 600 605
Val Val Val Gly Gly Ser Phe Asp Pro Thr Lys Ser Lys Asp Arg Glu Val Val Val Gly Gly Ser Phe Asp Pro Thr Lys Ser Lys Asp Arg Glu
610 615 620 610 615 620
Glu Ala Ala Glu Ile Lys Lys Met His Met Leu Ile Glu Lys Tyr Gln Glu Ala Ala Glu Ile Lys Lys Met His Met Leu Ile Glu Lys Tyr Gln
625 630 635 640 625 630 635 640
Leu Lys Gly Gln Ile Arg Trp Ile Ala Ala Gln Thr Asp Arg Tyr Arg Leu Lys Gly Gln Ile Arg Trp Ile Ala Ala Gln Thr Asp Arg Tyr Arg
645 650 655 645 650 655
Asn Ser Glu Leu Tyr Arg Thr Ile Ala Asp Ser Lys Gly Ala Phe Val Asn Ser Glu Leu Tyr Arg Thr Ile Ala Asp Ser Lys Gly Ala Phe Val
660 665 670 660 665 670
Gln Pro Ala Leu Tyr Glu Ala Phe Gly Leu Thr Val Ile Glu Ala Met Gln Pro Ala Leu Tyr Glu Ala Phe Gly Leu Thr Val Ile Glu Ala Met
675 680 685 675 680 685
Asn Cys Gly Leu Pro Thr Phe Ala Thr Asn Gln Gly Gly Pro Ala Glu Asn Cys Gly Leu Pro Thr Phe Ala Thr Asn Gln Gly Gly Pro Ala Glu
690 695 700 690 695 700
Ile Ile Val Asp Gly Val Ser Gly Phe His Ile Asp Pro Asn Asn Gly Ile Ile Val Asp Gly Val Ser Gly Phe His Ile Asp Pro Asn Asn Gly
705 710 715 720 705 710 715 720
Asp Glu Ser Ser Asn Lys Val Ala Asn Phe Phe Gln Lys Cys Arg Glu Asp Glu Ser Ser Asn Lys Val Ala Asn Phe Phe Gln Lys Cys Arg Glu
725 730 735 725 730 735
Asp Pro Glu Tyr Trp Asn Arg Ile Ser Val Gln Gly Leu Asn Arg Ile Asp Pro Glu Tyr Trp Asn Arg Ile Ser Val Gln Gly Leu Asn Arg Ile
740 745 750 740 745 750
Tyr Glu Cys Tyr Thr Trp Lys Ile Tyr Ala Asn Lys Val Leu Asn Met Tyr Glu Cys Tyr Thr Trp Lys Ile Tyr Ala Asn Lys Val Leu Asn Met
755 760 765 755 760 765
Gly Ser Ile Tyr Thr Phe Trp Arg Thr Leu Tyr Arg Asp Gln Lys Gln Gly Ser Ile Tyr Thr Phe Trp Arg Thr Leu Tyr Arg Asp Gln Lys Gln
770 775 780 770 775 780
Ala Lys Gln Arg Tyr Ile Glu Thr Phe Tyr Asn Leu Glu Phe Arg Asn Ala Lys Gln Arg Tyr Ile Glu Thr Phe Tyr Asn Leu Glu Phe Arg Asn
785 790 795 800 785 790 795 800
Leu Val Lys Asn Val Pro Ile Arg Gln Asp Glu Thr Pro Gln Gly Pro Leu Val Lys Asn Val Pro Ile Arg Gln Asp Glu Thr Pro Gln Gly Pro
805 810 815 805 810 815
Lys Glu Arg Arg Glu Lys Val Lys Pro Gln Ile Ser Gln Arg His Ala Lys Glu Arg Arg Glu Lys Val Lys Pro Gln Ile Ser Gln Arg His Ala
820 825 830 820 825 830
Leu Lys Leu Leu Pro Ile Val Phe Gln Glu Thr Leu Val Tyr Ser Ser Leu Lys Leu Leu Pro Ile Val Phe Gln Glu Thr Leu Val Tyr Ser Ser
835 840 845 835 840 845
Thr Lys Leu Glu Leu Tyr Ser Met Gln Leu Ala Ser Ala Val His Leu Thr Lys Leu Glu Leu Tyr Ser Met Gln Leu Ala Ser Ala Val His Leu
850 855 860 850 855 860
Ser Lys Ser Pro Val Met Ser Ile Lys Leu Thr Lys Ser Ile Asn Ser Ser Lys Ser Pro Val Met Ser Ile Lys Leu Thr Lys Ser Ile Asn Ser
865 870 875 880 865 870 875 880
Ala Phe Pro Phe Pro Met Leu Asp Cys Tyr Tyr Ser Tyr Phe Val Tyr Ala Phe Pro Phe Pro Met Leu Asp Cys Tyr Tyr Ser Tyr Phe Val Tyr
885 890 895 885 890 895
Gly Ser Leu Pro Ser Leu Phe Ser Pro Val Leu Leu Leu Leu Gln Leu Gly Ser Leu Pro Ser Leu Phe Ser Pro Val Leu Leu Leu Leu Gln Leu
900 905 910 900 905 910
Tyr Tyr
<---<---
Claims (28)
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EP18164769 | 2018-03-28 | ||
| EP18164769.4 | 2018-03-28 | ||
| PCT/EP2019/057703 WO2019185699A1 (en) | 2018-03-28 | 2019-03-27 | Modulating reducing sugar content in a plant |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| RU2020135056A RU2020135056A (en) | 2022-04-28 |
| RU2801948C2 true RU2801948C2 (en) | 2023-08-21 |
Family
ID=
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP2334166A2 (en) * | 2008-08-29 | 2011-06-22 | Los Alamos National Security, LLC | Transgenic plants with enhanced growth characteristics |
| WO2013029799A1 (en) * | 2011-09-02 | 2013-03-07 | Philip Morris Products S.A | Isopropylmalate synthase from nicotiana tabacum and methods and uses thereof |
| RU2015126909A (en) * | 2012-12-21 | 2017-01-27 | Филип Моррис Продактс С.А. | REDUCED TOBACCO-SPECIFIC NITROZAMINES IN PLANTS |
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP2334166A2 (en) * | 2008-08-29 | 2011-06-22 | Los Alamos National Security, LLC | Transgenic plants with enhanced growth characteristics |
| WO2013029799A1 (en) * | 2011-09-02 | 2013-03-07 | Philip Morris Products S.A | Isopropylmalate synthase from nicotiana tabacum and methods and uses thereof |
| RU2015126909A (en) * | 2012-12-21 | 2017-01-27 | Филип Моррис Продактс С.А. | REDUCED TOBACCO-SPECIFIC NITROZAMINES IN PLANTS |
Non-Patent Citations (1)
| Title |
|---|
| SIERRO N., et al., The tobacco genome sequence and its comparison with those of tomato and potato, NATURE COMMUNICATIONS, 2014, pp.1-9. * |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR102207550B1 (en) | Plants with reduced asparagine content | |
| CN109996879B (en) | Plants with reduced flowering time | |
| CN105247053B (en) | Tobacco specific nitrosamine reduction in plants | |
| JP6225108B2 (en) | Threonine synthase from Nicotiana tabacum and methods and uses thereof | |
| JP2018186820A (en) | Isopropylmalate synthase from Nicotiana tabacum and methods and uses thereof | |
| KR20170002444A (en) | Reduction of nicotine to nornicotine conversion in plants | |
| JP7463284B2 (en) | Regulation of amino acid content in plants | |
| CN107074919A (en) | The biomass in plant is adjusted by the ectopic expression of chloride channel | |
| EP3480314A1 (en) | Regulation of alkaloid content | |
| KR102826087B1 (en) | Controlling reducing sugar content in plants | |
| KR20220070305A (en) | Control of reducing sugar (INV) content in plants | |
| JP2025533986A (en) | Increasing leaf biomass and nitrogen use efficiency by regulating NTP2 | |
| US20250084427A1 (en) | Modulation of nicotine production by alteration of nicotinamidase expression or function in plants | |
| RU2801948C2 (en) | Modulation of the content of reducing sugars in the plant | |
| RU2799785C2 (en) | Modulation of the content of amino acids in the plant | |
| RU2842948C1 (en) | Modulating content of reducing sugars in a plant (inv) | |
| US20250043298A1 (en) | Increasing anatabine in tobacco leaf by regulating methyl putrescine oxidase | |
| RU2792235C2 (en) | Plants with a shorter flowering time | |
| KR20250139371A (en) | Regulation of sugar transporters | |
| KR20250139370A (en) | Regulation of the gene encoding lysine ketoglutarate reductase |