RU2811433C1 - Новый полипептид и способ получения l-лейцина с его использованием - Google Patents
Новый полипептид и способ получения l-лейцина с его использованием Download PDFInfo
- Publication number
- RU2811433C1 RU2811433C1 RU2022122595A RU2022122595A RU2811433C1 RU 2811433 C1 RU2811433 C1 RU 2811433C1 RU 2022122595 A RU2022122595 A RU 2022122595A RU 2022122595 A RU2022122595 A RU 2022122595A RU 2811433 C1 RU2811433 C1 RU 2811433C1
- Authority
- RU
- Russia
- Prior art keywords
- val
- ala
- glu
- amino acid
- gly
- Prior art date
Links
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 title claims abstract description 194
- 229920001184 polypeptide Polymers 0.000 title claims abstract description 112
- 108090000765 processed proteins & peptides Proteins 0.000 title claims abstract description 112
- 102000004196 processed proteins & peptides Human genes 0.000 title claims abstract description 112
- 238000000034 method Methods 0.000 title abstract description 19
- 229960003136 leucine Drugs 0.000 claims abstract description 103
- 239000004395 L-leucine Substances 0.000 claims abstract description 90
- 235000019454 L-leucine Nutrition 0.000 claims abstract description 90
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 68
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 68
- 239000002157 polynucleotide Substances 0.000 claims abstract description 68
- 108020004687 Malate Synthase Proteins 0.000 claims abstract description 59
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 claims abstract description 58
- 244000005700 microbiome Species 0.000 claims abstract description 58
- 102100034229 Citramalyl-CoA lyase, mitochondrial Human genes 0.000 claims abstract description 57
- 230000000694 effects Effects 0.000 claims abstract description 52
- 150000001413 amino acids Chemical group 0.000 claims abstract description 45
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 claims abstract description 31
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Natural products NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 claims abstract description 29
- 239000004475 Arginine Substances 0.000 claims abstract description 18
- 239000004471 Glycine Substances 0.000 claims abstract description 18
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 claims abstract description 18
- 235000018417 cysteine Nutrition 0.000 claims abstract description 13
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 claims abstract description 13
- 235000003704 aspartic acid Nutrition 0.000 claims abstract description 10
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 claims abstract description 10
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 claims abstract description 10
- 125000001500 prolyl group Chemical group [H]N1C([H])(C(=O)[*])C([H])([H])C([H])([H])C1([H])[H] 0.000 claims abstract description 10
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 claims abstract description 9
- 239000000203 mixture Substances 0.000 claims abstract description 7
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 claims abstract description 6
- 239000013604 expression vector Substances 0.000 claims abstract description 3
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 claims abstract description 3
- 239000013598 vector Substances 0.000 claims description 64
- 238000004519 manufacturing process Methods 0.000 claims description 23
- 239000002609 medium Substances 0.000 claims description 15
- 241000186216 Corynebacterium Species 0.000 claims description 12
- 239000001963 growth medium Substances 0.000 claims description 10
- 241000186226 Corynebacterium glutamicum Species 0.000 claims description 8
- 239000000546 pharmaceutical excipient Substances 0.000 claims description 3
- 239000000126 substance Substances 0.000 abstract description 4
- 125000003275 alpha amino acid group Chemical group 0.000 description 75
- 229940024606 amino acid Drugs 0.000 description 44
- 235000001014 amino acid Nutrition 0.000 description 44
- 210000004027 cell Anatomy 0.000 description 36
- 230000035772 mutation Effects 0.000 description 34
- 125000000539 amino acid group Chemical group 0.000 description 33
- 101150087199 leuA gene Proteins 0.000 description 33
- 108090000623 proteins and genes Proteins 0.000 description 32
- 239000002773 nucleotide Substances 0.000 description 28
- 125000003729 nucleotide group Chemical group 0.000 description 28
- 229960002429 proline Drugs 0.000 description 27
- 108020004414 DNA Proteins 0.000 description 25
- 230000000875 corresponding effect Effects 0.000 description 24
- 101710102786 ATP-dependent leucine adenylase Proteins 0.000 description 23
- 230000001965 increasing effect Effects 0.000 description 19
- 210000000349 chromosome Anatomy 0.000 description 17
- 102000004190 Enzymes Human genes 0.000 description 16
- 108090000790 Enzymes Proteins 0.000 description 16
- 229960003121 arginine Drugs 0.000 description 16
- 235000009697 arginine Nutrition 0.000 description 16
- 229960002449 glycine Drugs 0.000 description 16
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 15
- 230000005764 inhibitory process Effects 0.000 description 14
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 13
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 13
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 13
- 239000012634 fragment Substances 0.000 description 12
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 11
- 102000004169 proteins and genes Human genes 0.000 description 11
- 241001485655 Corynebacterium glutamicum ATCC 13032 Species 0.000 description 9
- 108091028043 Nucleic acid sequence Proteins 0.000 description 9
- 229960002433 cysteine Drugs 0.000 description 9
- -1 isopropyl malate Chemical compound 0.000 description 9
- 235000018102 proteins Nutrition 0.000 description 9
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 8
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 8
- XABXVVSWUVCZST-GVXVVHGQSA-N Lys-Val-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN XABXVVSWUVCZST-GVXVVHGQSA-N 0.000 description 8
- JLFKWDAZBRYCGX-ZKWXMUAHSA-N Val-Asn-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N JLFKWDAZBRYCGX-ZKWXMUAHSA-N 0.000 description 8
- 229960005261 aspartic acid Drugs 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 8
- 235000014304 histidine Nutrition 0.000 description 8
- 229960002885 histidine Drugs 0.000 description 8
- DRCOAZZDQRCGGP-GHCJXIJMSA-N Asp-Ser-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DRCOAZZDQRCGGP-GHCJXIJMSA-N 0.000 description 7
- MVJRBCJCRYGCKV-GVXVVHGQSA-N Leu-Val-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MVJRBCJCRYGCKV-GVXVVHGQSA-N 0.000 description 7
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 7
- 108010005233 alanylglutamic acid Proteins 0.000 description 7
- 108010092854 aspartyllysine Proteins 0.000 description 7
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 7
- 108010015792 glycyllysine Proteins 0.000 description 7
- 150000007523 nucleic acids Chemical group 0.000 description 7
- 108010012581 phenylalanylglutamate Proteins 0.000 description 7
- 230000006798 recombination Effects 0.000 description 7
- 108010026333 seryl-proline Proteins 0.000 description 7
- 108010071207 serylmethionine Proteins 0.000 description 7
- 238000006467 substitution reaction Methods 0.000 description 7
- KIUMMUBSPKGMOY-UHFFFAOYSA-N 3,3'-Dithiobis(6-nitrobenzoic acid) Chemical compound C1=C([N+]([O-])=O)C(C(=O)O)=CC(SSC=2C=C(C(=CC=2)[N+]([O-])=O)C(O)=O)=C1 KIUMMUBSPKGMOY-UHFFFAOYSA-N 0.000 description 6
- 108010068380 arginylarginine Proteins 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 6
- 238000012790 confirmation Methods 0.000 description 6
- 230000002255 enzymatic effect Effects 0.000 description 6
- 229930027917 kanamycin Natural products 0.000 description 6
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 6
- 229960000318 kanamycin Drugs 0.000 description 6
- 229930182823 kanamycin A Natural products 0.000 description 6
- 229940049920 malate Drugs 0.000 description 6
- BASFCYQUMIYNBI-UHFFFAOYSA-N platinum Chemical compound [Pt] BASFCYQUMIYNBI-UHFFFAOYSA-N 0.000 description 6
- 238000005215 recombination Methods 0.000 description 6
- 239000000523 sample Substances 0.000 description 6
- UGLPMYSCWHTZQU-AUTRQRHGSA-N Ala-Ala-Tyr Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UGLPMYSCWHTZQU-AUTRQRHGSA-N 0.000 description 5
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 5
- PULPZRAHVFBVTO-DCAQKATOSA-N Pro-Glu-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PULPZRAHVFBVTO-DCAQKATOSA-N 0.000 description 5
- 238000010276 construction Methods 0.000 description 5
- 239000000047 product Substances 0.000 description 5
- GANZODCWZFAEGN-UHFFFAOYSA-N 5-mercapto-2-nitro-benzoic acid Chemical compound OC(=O)C1=CC(S)=CC=C1[N+]([O-])=O GANZODCWZFAEGN-UHFFFAOYSA-N 0.000 description 4
- YAXNATKKPOWVCP-ZLUOBGJFSA-N Ala-Asn-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O YAXNATKKPOWVCP-ZLUOBGJFSA-N 0.000 description 4
- YCRAFFCYWOUEOF-DLOVCJGASA-N Ala-Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 YCRAFFCYWOUEOF-DLOVCJGASA-N 0.000 description 4
- LSMDIAAALJJLRO-XQXXSGGOSA-N Ala-Thr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LSMDIAAALJJLRO-XQXXSGGOSA-N 0.000 description 4
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 4
- BVLPIIBTWIYOML-ZKWXMUAHSA-N Ala-Val-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BVLPIIBTWIYOML-ZKWXMUAHSA-N 0.000 description 4
- YYOVLDPHIJAOSY-DCAQKATOSA-N Arg-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N YYOVLDPHIJAOSY-DCAQKATOSA-N 0.000 description 4
- KMSHNDWHPWXPEC-BQBZGAKWSA-N Arg-Asp-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KMSHNDWHPWXPEC-BQBZGAKWSA-N 0.000 description 4
- YSUVMPICYVWRBX-VEVYYDQMSA-N Arg-Asp-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YSUVMPICYVWRBX-VEVYYDQMSA-N 0.000 description 4
- KRQSPVKUISQQFS-FJXKBIBVSA-N Arg-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N KRQSPVKUISQQFS-FJXKBIBVSA-N 0.000 description 4
- PAPSMOYMQDWIOR-AVGNSLFASA-N Arg-Lys-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PAPSMOYMQDWIOR-AVGNSLFASA-N 0.000 description 4
- ASQKVGRCKOFKIU-KZVJFYERSA-N Arg-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ASQKVGRCKOFKIU-KZVJFYERSA-N 0.000 description 4
- MOGMYRUNTKYZFB-UNQGMJICSA-N Arg-Thr-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MOGMYRUNTKYZFB-UNQGMJICSA-N 0.000 description 4
- ULBHWNVWSCJLCO-NHCYSSNCSA-N Arg-Val-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N ULBHWNVWSCJLCO-NHCYSSNCSA-N 0.000 description 4
- PDQBXRSOSCTGKY-ACZMJKKPSA-N Asn-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PDQBXRSOSCTGKY-ACZMJKKPSA-N 0.000 description 4
- DNYRZPOWBTYFAF-IHRRRGAJSA-N Asn-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N)O DNYRZPOWBTYFAF-IHRRRGAJSA-N 0.000 description 4
- FAEFJTCTNZTPHX-ACZMJKKPSA-N Asn-Gln-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FAEFJTCTNZTPHX-ACZMJKKPSA-N 0.000 description 4
- SJPZTWAYTJPPBI-GUBZILKMSA-N Asn-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N SJPZTWAYTJPPBI-GUBZILKMSA-N 0.000 description 4
- FLJVGAFLZVBBNG-BPUTZDHNSA-N Asn-Trp-Arg Chemical compound N[C@@H](CC(=O)N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(=O)N[C@@H](CCCNC(=N)N)C(=O)O FLJVGAFLZVBBNG-BPUTZDHNSA-N 0.000 description 4
- WQAOZCVOOYUWKG-LSJOCFKGSA-N Asn-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CC(=O)N)N WQAOZCVOOYUWKG-LSJOCFKGSA-N 0.000 description 4
- KRXIWXCXOARFNT-ZLUOBGJFSA-N Asp-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O KRXIWXCXOARFNT-ZLUOBGJFSA-N 0.000 description 4
- XEDQMTWEYFBOIK-ACZMJKKPSA-N Asp-Ala-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XEDQMTWEYFBOIK-ACZMJKKPSA-N 0.000 description 4
- RGKKALNPOYURGE-ZKWXMUAHSA-N Asp-Ala-Val Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O RGKKALNPOYURGE-ZKWXMUAHSA-N 0.000 description 4
- NYLBGYLHBDFRHL-VEVYYDQMSA-N Asp-Arg-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NYLBGYLHBDFRHL-VEVYYDQMSA-N 0.000 description 4
- WOPJVEMFXYHZEE-SRVKXCTJSA-N Asp-Phe-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WOPJVEMFXYHZEE-SRVKXCTJSA-N 0.000 description 4
- KNDCWFXCFKSEBM-AVGNSLFASA-N Asp-Tyr-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O KNDCWFXCFKSEBM-AVGNSLFASA-N 0.000 description 4
- PLOKOIJSGCISHE-BYULHYEWSA-N Asp-Val-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PLOKOIJSGCISHE-BYULHYEWSA-N 0.000 description 4
- 206010064571 Gene mutation Diseases 0.000 description 4
- CYTSBCIIEHUPDU-ACZMJKKPSA-N Gln-Asp-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O CYTSBCIIEHUPDU-ACZMJKKPSA-N 0.000 description 4
- OFPWCBGRYAOLMU-AVGNSLFASA-N Gln-Asp-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N)O OFPWCBGRYAOLMU-AVGNSLFASA-N 0.000 description 4
- JHPFPROFOAJRFN-IHRRRGAJSA-N Gln-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)O JHPFPROFOAJRFN-IHRRRGAJSA-N 0.000 description 4
- OSCLNNWLKKIQJM-WDSKDSINSA-N Gln-Ser-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O OSCLNNWLKKIQJM-WDSKDSINSA-N 0.000 description 4
- YADSXULAFMJZRL-QEJZJMRPSA-N Gln-Trp-Cys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)N)N YADSXULAFMJZRL-QEJZJMRPSA-N 0.000 description 4
- UTKICHUQEQBDGC-ACZMJKKPSA-N Glu-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N UTKICHUQEQBDGC-ACZMJKKPSA-N 0.000 description 4
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 4
- AIGROOHQXCACHL-WDSKDSINSA-N Glu-Gly-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O AIGROOHQXCACHL-WDSKDSINSA-N 0.000 description 4
- FGSGPLRPQCZBSQ-AVGNSLFASA-N Glu-Phe-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O FGSGPLRPQCZBSQ-AVGNSLFASA-N 0.000 description 4
- BPCLDCNZBUYGOD-BPUTZDHNSA-N Glu-Trp-Glu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 BPCLDCNZBUYGOD-BPUTZDHNSA-N 0.000 description 4
- ZSIDREAPEPAPKL-XIRDDKMYSA-N Glu-Trp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCC(=O)O)N ZSIDREAPEPAPKL-XIRDDKMYSA-N 0.000 description 4
- HVKAAUOFFTUSAA-XDTLVQLUSA-N Glu-Tyr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O HVKAAUOFFTUSAA-XDTLVQLUSA-N 0.000 description 4
- LZEUDRYSAZAJIO-AUTRQRHGSA-N Glu-Val-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZEUDRYSAZAJIO-AUTRQRHGSA-N 0.000 description 4
- HQTDNEZTGZUWSY-XVKPBYJWSA-N Glu-Val-Gly Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)NCC(O)=O HQTDNEZTGZUWSY-XVKPBYJWSA-N 0.000 description 4
- QXUPRMQJDWJDFR-NRPADANISA-N Glu-Val-Ser Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXUPRMQJDWJDFR-NRPADANISA-N 0.000 description 4
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 4
- GDOZQTNZPCUARW-YFKPBYRVSA-N Gly-Gly-Glu Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O GDOZQTNZPCUARW-YFKPBYRVSA-N 0.000 description 4
- SWQALSGKVLYKDT-ZKWXMUAHSA-N Gly-Ile-Ala Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SWQALSGKVLYKDT-ZKWXMUAHSA-N 0.000 description 4
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 4
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 4
- HFPVRZWORNJRRC-UWVGGRQHSA-N Gly-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN HFPVRZWORNJRRC-UWVGGRQHSA-N 0.000 description 4
- MKIAPEZXQDILRR-YUMQZZPRSA-N Gly-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN MKIAPEZXQDILRR-YUMQZZPRSA-N 0.000 description 4
- VNNRLUNBJSWZPF-ZKWXMUAHSA-N Gly-Ser-Ile Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNNRLUNBJSWZPF-ZKWXMUAHSA-N 0.000 description 4
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 4
- CIWILNZNBPIHEU-DCAQKATOSA-N His-Arg-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O CIWILNZNBPIHEU-DCAQKATOSA-N 0.000 description 4
- OMNVOTCFQQLEQU-CIUDSAMLSA-N His-Asn-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OMNVOTCFQQLEQU-CIUDSAMLSA-N 0.000 description 4
- NOQPTNXSGNPJNS-YUMQZZPRSA-N His-Asn-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O NOQPTNXSGNPJNS-YUMQZZPRSA-N 0.000 description 4
- ASCFJMSGKUIRDU-ZPFDUUQYSA-N Ile-Arg-Gln Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O ASCFJMSGKUIRDU-ZPFDUUQYSA-N 0.000 description 4
- NULSANWBUWLTKN-NAKRPEOUSA-N Ile-Arg-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N NULSANWBUWLTKN-NAKRPEOUSA-N 0.000 description 4
- XENGULNPUDGALZ-ZPFDUUQYSA-N Ile-Asn-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N XENGULNPUDGALZ-ZPFDUUQYSA-N 0.000 description 4
- SJLVSMMIFYTSGY-GRLWGSQLSA-N Ile-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SJLVSMMIFYTSGY-GRLWGSQLSA-N 0.000 description 4
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 4
- ZUPJCJINYQISSN-XUXIUFHCSA-N Ile-Met-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)O)N ZUPJCJINYQISSN-XUXIUFHCSA-N 0.000 description 4
- OWSWUWDMSNXTNE-GMOBBJLQSA-N Ile-Pro-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N OWSWUWDMSNXTNE-GMOBBJLQSA-N 0.000 description 4
- ANTFEOSJMAUGIB-KNZXXDILSA-N Ile-Thr-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N ANTFEOSJMAUGIB-KNZXXDILSA-N 0.000 description 4
- 150000008575 L-amino acids Chemical class 0.000 description 4
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 4
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 4
- IGUOAYLTQJLPPD-DCAQKATOSA-N Leu-Asn-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IGUOAYLTQJLPPD-DCAQKATOSA-N 0.000 description 4
- VPKIQULSKFVCSM-SRVKXCTJSA-N Leu-Gln-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPKIQULSKFVCSM-SRVKXCTJSA-N 0.000 description 4
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 4
- WRLPVDVHNWSSCL-MELADBBJSA-N Leu-His-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N WRLPVDVHNWSSCL-MELADBBJSA-N 0.000 description 4
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 4
- YUTNOGOMBNYPFH-XUXIUFHCSA-N Leu-Pro-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YUTNOGOMBNYPFH-XUXIUFHCSA-N 0.000 description 4
- WQWZXKWOEVSGQM-DCAQKATOSA-N Lys-Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN WQWZXKWOEVSGQM-DCAQKATOSA-N 0.000 description 4
- CLBGMWIYPYAZPR-AVGNSLFASA-N Lys-Arg-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O CLBGMWIYPYAZPR-AVGNSLFASA-N 0.000 description 4
- LZWNAOIMTLNMDW-NHCYSSNCSA-N Lys-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N LZWNAOIMTLNMDW-NHCYSSNCSA-N 0.000 description 4
- GKFNXYMAMKJSKD-NHCYSSNCSA-N Lys-Asp-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GKFNXYMAMKJSKD-NHCYSSNCSA-N 0.000 description 4
- LPAJOCKCPRZEAG-MNXVOIDGSA-N Lys-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCCN LPAJOCKCPRZEAG-MNXVOIDGSA-N 0.000 description 4
- ISHNZELVUVPCHY-ZETCQYMHSA-N Lys-Gly-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O ISHNZELVUVPCHY-ZETCQYMHSA-N 0.000 description 4
- JZMGVXLDOQOKAH-UWVGGRQHSA-N Lys-Gly-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O JZMGVXLDOQOKAH-UWVGGRQHSA-N 0.000 description 4
- GAHJXEMYXKLZRQ-AJNGGQMLSA-N Lys-Lys-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GAHJXEMYXKLZRQ-AJNGGQMLSA-N 0.000 description 4
- DNDVVILEHVMWIS-LPEHRKFASA-N Met-Asp-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N DNDVVILEHVMWIS-LPEHRKFASA-N 0.000 description 4
- PHWSCIFNNLLUFJ-NHCYSSNCSA-N Met-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCSC)N PHWSCIFNNLLUFJ-NHCYSSNCSA-N 0.000 description 4
- LQMHZERGCQJKAH-STQMWFEESA-N Met-Gly-Phe Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 LQMHZERGCQJKAH-STQMWFEESA-N 0.000 description 4
- FBLBCGLSRXBANI-KKUMJFAQSA-N Met-Phe-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N FBLBCGLSRXBANI-KKUMJFAQSA-N 0.000 description 4
- MQASRXPTQJJNFM-JYJNAYRXSA-N Met-Pro-Phe Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MQASRXPTQJJNFM-JYJNAYRXSA-N 0.000 description 4
- BJPQKNHZHUCQNQ-SRVKXCTJSA-N Met-Pro-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCSC)N BJPQKNHZHUCQNQ-SRVKXCTJSA-N 0.000 description 4
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 4
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 4
- NJJBATPLUQHRBM-IHRRRGAJSA-N Phe-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CO)C(=O)O NJJBATPLUQHRBM-IHRRRGAJSA-N 0.000 description 4
- BSKMOCNNLNDIMU-CDMKHQONSA-N Phe-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O BSKMOCNNLNDIMU-CDMKHQONSA-N 0.000 description 4
- CYQQWUPHIZVCNY-GUBZILKMSA-N Pro-Arg-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CYQQWUPHIZVCNY-GUBZILKMSA-N 0.000 description 4
- SFECXGVELZFBFJ-VEVYYDQMSA-N Pro-Asp-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SFECXGVELZFBFJ-VEVYYDQMSA-N 0.000 description 4
- LXVLKXPFIDDHJG-CIUDSAMLSA-N Pro-Glu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O LXVLKXPFIDDHJG-CIUDSAMLSA-N 0.000 description 4
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 4
- WLJYLAQSUSIQNH-GUBZILKMSA-N Pro-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@@H]1CCCN1 WLJYLAQSUSIQNH-GUBZILKMSA-N 0.000 description 4
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 4
- KCGIREHVWRXNDH-GARJFASQSA-N Ser-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N KCGIREHVWRXNDH-GARJFASQSA-N 0.000 description 4
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 4
- NOWXWJLVGTVJKM-PBCZWWQYSA-N Thr-Asp-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O NOWXWJLVGTVJKM-PBCZWWQYSA-N 0.000 description 4
- CQNFRKAKGDSJFR-NUMRIWBASA-N Thr-Glu-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O CQNFRKAKGDSJFR-NUMRIWBASA-N 0.000 description 4
- BNGDYRRHRGOPHX-IFFSRLJSSA-N Thr-Glu-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O BNGDYRRHRGOPHX-IFFSRLJSSA-N 0.000 description 4
- XFTYVCHLARBHBQ-FOHZUACHSA-N Thr-Gly-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XFTYVCHLARBHBQ-FOHZUACHSA-N 0.000 description 4
- XOWKUMFHEZLKLT-CIQUZCHMSA-N Thr-Ile-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O XOWKUMFHEZLKLT-CIQUZCHMSA-N 0.000 description 4
- XKWABWFMQXMUMT-HJGDQZAQSA-N Thr-Pro-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XKWABWFMQXMUMT-HJGDQZAQSA-N 0.000 description 4
- NQQMWWVVGIXUOX-SVSWQMSJSA-N Thr-Ser-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NQQMWWVVGIXUOX-SVSWQMSJSA-N 0.000 description 4
- LXXCHJKHJYRMIY-FQPOAREZSA-N Thr-Tyr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O LXXCHJKHJYRMIY-FQPOAREZSA-N 0.000 description 4
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 4
- KPMIQCXJDVKWKO-IFFSRLJSSA-N Thr-Val-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KPMIQCXJDVKWKO-IFFSRLJSSA-N 0.000 description 4
- VYVBSMCZNHOZGD-RCWTZXSCSA-N Thr-Val-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O VYVBSMCZNHOZGD-RCWTZXSCSA-N 0.000 description 4
- WSGPBCAGEGHKQJ-BBRMVZONSA-N Trp-Gly-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CNC2=CC=CC=C21)N WSGPBCAGEGHKQJ-BBRMVZONSA-N 0.000 description 4
- GQNCRIFNDVFRNF-BPUTZDHNSA-N Trp-Pro-Asp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O GQNCRIFNDVFRNF-BPUTZDHNSA-N 0.000 description 4
- SCCKSNREWHMKOJ-SRVKXCTJSA-N Tyr-Asn-Ser Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O SCCKSNREWHMKOJ-SRVKXCTJSA-N 0.000 description 4
- XBWKCYFGRXKWGO-SRVKXCTJSA-N Tyr-Cys-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O XBWKCYFGRXKWGO-SRVKXCTJSA-N 0.000 description 4
- KSCVLGXNQXKUAR-JYJNAYRXSA-N Tyr-Leu-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KSCVLGXNQXKUAR-JYJNAYRXSA-N 0.000 description 4
- 108010064997 VPY tripeptide Proteins 0.000 description 4
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 4
- LABUITCFCAABSV-BPNCWPANSA-N Val-Ala-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 LABUITCFCAABSV-BPNCWPANSA-N 0.000 description 4
- LABUITCFCAABSV-UHFFFAOYSA-N Val-Ala-Tyr Natural products CC(C)C(N)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LABUITCFCAABSV-UHFFFAOYSA-N 0.000 description 4
- KKHRWGYHBZORMQ-NHCYSSNCSA-N Val-Arg-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKHRWGYHBZORMQ-NHCYSSNCSA-N 0.000 description 4
- OGNMURQZFMHFFD-NHCYSSNCSA-N Val-Asn-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N OGNMURQZFMHFFD-NHCYSSNCSA-N 0.000 description 4
- LHADRQBREKTRLR-DCAQKATOSA-N Val-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N LHADRQBREKTRLR-DCAQKATOSA-N 0.000 description 4
- VCAWFLIWYNMHQP-UKJIMTQDSA-N Val-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N VCAWFLIWYNMHQP-UKJIMTQDSA-N 0.000 description 4
- MHAHQDBEIDPFQS-NHCYSSNCSA-N Val-Glu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)C(C)C MHAHQDBEIDPFQS-NHCYSSNCSA-N 0.000 description 4
- UEHRGZCNLSWGHK-DLOVCJGASA-N Val-Glu-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UEHRGZCNLSWGHK-DLOVCJGASA-N 0.000 description 4
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 4
- KDKLLPMFFGYQJD-CYDGBPFRSA-N Val-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N KDKLLPMFFGYQJD-CYDGBPFRSA-N 0.000 description 4
- YMTOEGGOCHVGEH-IHRRRGAJSA-N Val-Lys-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O YMTOEGGOCHVGEH-IHRRRGAJSA-N 0.000 description 4
- YKNOJPJWNVHORX-UNQGMJICSA-N Val-Phe-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YKNOJPJWNVHORX-UNQGMJICSA-N 0.000 description 4
- QWCZXKIFPWPQHR-JYJNAYRXSA-N Val-Pro-Tyr Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QWCZXKIFPWPQHR-JYJNAYRXSA-N 0.000 description 4
- OFTXTCGQJXTNQS-XGEHTFHBSA-N Val-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N)O OFTXTCGQJXTNQS-XGEHTFHBSA-N 0.000 description 4
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 4
- 108010045350 alanyl-tyrosyl-alanine Proteins 0.000 description 4
- 108010044940 alanylglutamine Proteins 0.000 description 4
- 108010087924 alanylproline Proteins 0.000 description 4
- 108010062796 arginyllysine Proteins 0.000 description 4
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 4
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 4
- 108010093581 aspartyl-proline Proteins 0.000 description 4
- 108010047857 aspartylglycine Proteins 0.000 description 4
- 238000004925 denaturation Methods 0.000 description 4
- 230000036425 denaturation Effects 0.000 description 4
- 238000004520 electroporation Methods 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 238000000855 fermentation Methods 0.000 description 4
- 230000004151 fermentation Effects 0.000 description 4
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 4
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 4
- 108010049041 glutamylalanine Proteins 0.000 description 4
- 238000004128 high performance liquid chromatography Methods 0.000 description 4
- 108010040030 histidinoalanine Proteins 0.000 description 4
- 108010036413 histidylglycine Proteins 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 4
- 229960000310 isoleucine Drugs 0.000 description 4
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 4
- 108010064235 lysylglycine Proteins 0.000 description 4
- 108010034507 methionyltryptophan Proteins 0.000 description 4
- 229910052757 nitrogen Inorganic materials 0.000 description 4
- 239000013612 plasmid Substances 0.000 description 4
- 230000009467 reduction Effects 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- 108010017949 tyrosyl-glycyl-glycine Proteins 0.000 description 4
- 108010027345 wheylin-1 peptide Proteins 0.000 description 4
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 3
- 108010048295 2-isopropylmalate synthase Proteins 0.000 description 3
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 3
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 3
- JAMAWBXXKFGFGX-KZVJFYERSA-N Ala-Arg-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JAMAWBXXKFGFGX-KZVJFYERSA-N 0.000 description 3
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 3
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 3
- XMIAMUXIMWREBJ-HERUPUMHSA-N Ala-Trp-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)N)C(=O)O)N XMIAMUXIMWREBJ-HERUPUMHSA-N 0.000 description 3
- RVDVDRUZWZIBJQ-CIUDSAMLSA-N Arg-Asn-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O RVDVDRUZWZIBJQ-CIUDSAMLSA-N 0.000 description 3
- PNIGSVZJNVUVJA-BQBZGAKWSA-N Arg-Gly-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O PNIGSVZJNVUVJA-BQBZGAKWSA-N 0.000 description 3
- AFNHFVVOJZBIJD-GUBZILKMSA-N Arg-Met-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O AFNHFVVOJZBIJD-GUBZILKMSA-N 0.000 description 3
- SUMJNGAMIQSNGX-TUAOUCFPSA-N Arg-Val-Pro Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N1CCC[C@@H]1C(O)=O SUMJNGAMIQSNGX-TUAOUCFPSA-N 0.000 description 3
- KXEGPPNPXOKKHK-ZLUOBGJFSA-N Asn-Asp-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KXEGPPNPXOKKHK-ZLUOBGJFSA-N 0.000 description 3
- XOQYDFCQPWAMSA-KKHAAJSZSA-N Asn-Val-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOQYDFCQPWAMSA-KKHAAJSZSA-N 0.000 description 3
- PYXXJFRXIYAESU-PCBIJLKTSA-N Asp-Ile-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PYXXJFRXIYAESU-PCBIJLKTSA-N 0.000 description 3
- RKXVTTIQNKPCHU-KKHAAJSZSA-N Asp-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O RKXVTTIQNKPCHU-KKHAAJSZSA-N 0.000 description 3
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 3
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 3
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 3
- UBRQJXFDVZNYJP-AVGNSLFASA-N Gln-Tyr-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UBRQJXFDVZNYJP-AVGNSLFASA-N 0.000 description 3
- PBEQPAZRHDVJQI-SRVKXCTJSA-N Glu-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N PBEQPAZRHDVJQI-SRVKXCTJSA-N 0.000 description 3
- IESFZVCAVACGPH-PEFMBERDSA-N Glu-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O IESFZVCAVACGPH-PEFMBERDSA-N 0.000 description 3
- PVBBEKPHARMPHX-DCAQKATOSA-N Glu-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O PVBBEKPHARMPHX-DCAQKATOSA-N 0.000 description 3
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 3
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 3
- FZQLXNIMCPJVJE-YUMQZZPRSA-N Gly-Asp-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FZQLXNIMCPJVJE-YUMQZZPRSA-N 0.000 description 3
- IXKRSKPKSLXIHN-YUMQZZPRSA-N Gly-Cys-Leu Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O IXKRSKPKSLXIHN-YUMQZZPRSA-N 0.000 description 3
- PABFFPWEJMEVEC-JGVFFNPUSA-N Gly-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)CN)C(=O)O PABFFPWEJMEVEC-JGVFFNPUSA-N 0.000 description 3
- UTYGDAHJBBDPBA-BYULHYEWSA-N Gly-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN UTYGDAHJBBDPBA-BYULHYEWSA-N 0.000 description 3
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 3
- VAXBXNPRXPHGHG-BJDJZHNGSA-N Ile-Ala-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)O)N VAXBXNPRXPHGHG-BJDJZHNGSA-N 0.000 description 3
- DVRDRICMWUSCBN-UKJIMTQDSA-N Ile-Gln-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DVRDRICMWUSCBN-UKJIMTQDSA-N 0.000 description 3
- CNMOKANDJMLAIF-CIQUZCHMSA-N Ile-Thr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O CNMOKANDJMLAIF-CIQUZCHMSA-N 0.000 description 3
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 3
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 3
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 3
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 3
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 3
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 3
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 3
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 3
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 3
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 3
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 3
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 3
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 3
- RSFGIMMPWAXNML-MNXVOIDGSA-N Leu-Gln-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RSFGIMMPWAXNML-MNXVOIDGSA-N 0.000 description 3
- AVEGDIAXTDVBJS-XUXIUFHCSA-N Leu-Ile-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AVEGDIAXTDVBJS-XUXIUFHCSA-N 0.000 description 3
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 3
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 3
- WTZUSCUIVPVCRH-SRVKXCTJSA-N Lys-Gln-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WTZUSCUIVPVCRH-SRVKXCTJSA-N 0.000 description 3
- QBEPTBMRQALPEV-MNXVOIDGSA-N Lys-Ile-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN QBEPTBMRQALPEV-MNXVOIDGSA-N 0.000 description 3
- 239000004472 Lysine Substances 0.000 description 3
- YRAWWKUTNBILNT-FXQIFTODSA-N Met-Ala-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YRAWWKUTNBILNT-FXQIFTODSA-N 0.000 description 3
- PHURAEXVWLDIGT-LPEHRKFASA-N Met-Ser-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N PHURAEXVWLDIGT-LPEHRKFASA-N 0.000 description 3
- 108010066427 N-valyltryptophan Proteins 0.000 description 3
- CWFGECHCRMGPPT-MXAVVETBSA-N Phe-Ile-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O CWFGECHCRMGPPT-MXAVVETBSA-N 0.000 description 3
- RAGOJJCBGXARPO-XVSYOHENSA-N Phe-Thr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RAGOJJCBGXARPO-XVSYOHENSA-N 0.000 description 3
- KWYUFKZDYYNOTN-UHFFFAOYSA-M Potassium hydroxide Chemical compound [OH-].[K+] KWYUFKZDYYNOTN-UHFFFAOYSA-M 0.000 description 3
- ZLXKLMHAMDENIO-DCAQKATOSA-N Pro-Lys-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLXKLMHAMDENIO-DCAQKATOSA-N 0.000 description 3
- ZJXXCGZFYQQETF-CYDGBPFRSA-N Pro-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@@H]1CCCN1 ZJXXCGZFYQQETF-CYDGBPFRSA-N 0.000 description 3
- LZHHZYDPMZEMRX-STQMWFEESA-N Pro-Tyr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O LZHHZYDPMZEMRX-STQMWFEESA-N 0.000 description 3
- UCTIUWKCVNGEFH-OBJOEFQTSA-N Pro-Val-Gly-Pro Chemical compound N([C@@H](C(C)C)C(=O)NCC(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 UCTIUWKCVNGEFH-OBJOEFQTSA-N 0.000 description 3
- KJMOINFQVCCSDX-XKBZYTNZSA-N Ser-Gln-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KJMOINFQVCCSDX-XKBZYTNZSA-N 0.000 description 3
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 3
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 3
- 239000004473 Threonine Substances 0.000 description 3
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 3
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 3
- ZTKGDWOUYRRAOQ-ULQDDVLXSA-N Val-His-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N ZTKGDWOUYRRAOQ-ULQDDVLXSA-N 0.000 description 3
- QPJSIBAOZBVELU-BPNCWPANSA-N Val-Tyr-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N QPJSIBAOZBVELU-BPNCWPANSA-N 0.000 description 3
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 3
- 229960003767 alanine Drugs 0.000 description 3
- 235000004279 alanine Nutrition 0.000 description 3
- 108010011559 alanylphenylalanine Proteins 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 229960001230 asparagine Drugs 0.000 description 3
- 235000009582 asparagine Nutrition 0.000 description 3
- 229910052799 carbon Inorganic materials 0.000 description 3
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 3
- 235000013922 glutamic acid Nutrition 0.000 description 3
- 229960002989 glutamic acid Drugs 0.000 description 3
- 239000004220 glutamic acid Substances 0.000 description 3
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 3
- 235000004554 glutamine Nutrition 0.000 description 3
- 229960002743 glutamine Drugs 0.000 description 3
- JYPCXBJRLBHWME-UHFFFAOYSA-N glycyl-L-prolyl-L-arginine Natural products NCC(=O)N1CCCC1C(=O)NC(CCCN=C(N)N)C(O)=O JYPCXBJRLBHWME-UHFFFAOYSA-N 0.000 description 3
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 3
- 108010025801 glycyl-prolyl-arginine Proteins 0.000 description 3
- 108010085325 histidylproline Proteins 0.000 description 3
- 238000009396 hybridization Methods 0.000 description 3
- 108010000761 leucylarginine Proteins 0.000 description 3
- 235000018977 lysine Nutrition 0.000 description 3
- 229960003646 lysine Drugs 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 229930182817 methionine Natural products 0.000 description 3
- 235000006109 methionine Nutrition 0.000 description 3
- 229960004452 methionine Drugs 0.000 description 3
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 3
- 229960005190 phenylalanine Drugs 0.000 description 3
- 229910052697 platinum Inorganic materials 0.000 description 3
- 238000001556 precipitation Methods 0.000 description 3
- 239000002243 precursor Substances 0.000 description 3
- 239000013587 production medium Substances 0.000 description 3
- 108010070643 prolylglutamic acid Proteins 0.000 description 3
- 229960001153 serine Drugs 0.000 description 3
- 235000004400 serine Nutrition 0.000 description 3
- 235000008521 threonine Nutrition 0.000 description 3
- 229960002898 threonine Drugs 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 229960004799 tryptophan Drugs 0.000 description 3
- 229960004441 tyrosine Drugs 0.000 description 3
- 235000002374 tyrosine Nutrition 0.000 description 3
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 3
- 229960004295 valine Drugs 0.000 description 3
- 239000004474 valine Substances 0.000 description 3
- OHVLMTFVQDZYHP-UHFFFAOYSA-N 1-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)-2-[4-[2-[[3-(trifluoromethoxy)phenyl]methylamino]pyrimidin-5-yl]piperazin-1-yl]ethanone Chemical compound N1N=NC=2CN(CCC=21)C(CN1CCN(CC1)C=1C=NC(=NC=1)NCC1=CC(=CC=C1)OC(F)(F)F)=O OHVLMTFVQDZYHP-UHFFFAOYSA-N 0.000 description 2
- HMUNWXXNJPVALC-UHFFFAOYSA-N 1-[4-[2-(2,3-dihydro-1H-inden-2-ylamino)pyrimidin-5-yl]piperazin-1-yl]-2-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)ethanone Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)N1CCN(CC1)C(CN1CC2=C(CC1)NN=N2)=O HMUNWXXNJPVALC-UHFFFAOYSA-N 0.000 description 2
- VZSRBBMJRBPUNF-UHFFFAOYSA-N 2-(2,3-dihydro-1H-inden-2-ylamino)-N-[3-oxo-3-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)propyl]pyrimidine-5-carboxamide Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)C(=O)NCCC(N1CC2=C(CC1)NN=N2)=O VZSRBBMJRBPUNF-UHFFFAOYSA-N 0.000 description 2
- LDXJRKWFNNFDSA-UHFFFAOYSA-N 2-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)-1-[4-[2-[[3-(trifluoromethoxy)phenyl]methylamino]pyrimidin-5-yl]piperazin-1-yl]ethanone Chemical compound C1CN(CC2=NNN=C21)CC(=O)N3CCN(CC3)C4=CN=C(N=C4)NCC5=CC(=CC=C5)OC(F)(F)F LDXJRKWFNNFDSA-UHFFFAOYSA-N 0.000 description 2
- IHCCLXNEEPMSIO-UHFFFAOYSA-N 2-[4-[2-(2,3-dihydro-1H-inden-2-ylamino)pyrimidin-5-yl]piperidin-1-yl]-1-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)ethanone Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)C1CCN(CC1)CC(=O)N1CC2=C(CC1)NN=N2 IHCCLXNEEPMSIO-UHFFFAOYSA-N 0.000 description 2
- YLZOPXRUQYQQID-UHFFFAOYSA-N 3-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)-1-[4-[2-[[3-(trifluoromethoxy)phenyl]methylamino]pyrimidin-5-yl]piperazin-1-yl]propan-1-one Chemical compound N1N=NC=2CN(CCC=21)CCC(=O)N1CCN(CC1)C=1C=NC(=NC=1)NCC1=CC(=CC=C1)OC(F)(F)F YLZOPXRUQYQQID-UHFFFAOYSA-N 0.000 description 2
- QHKABHOOEWYVLI-UHFFFAOYSA-N 3-methyl-2-oxobutanoic acid Chemical compound CC(C)C(=O)C(O)=O QHKABHOOEWYVLI-UHFFFAOYSA-N 0.000 description 2
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 2
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 2
- NLXLAEXVIDQMFP-UHFFFAOYSA-N Ammonia chloride Chemical compound [NH4+].[Cl-] NLXLAEXVIDQMFP-UHFFFAOYSA-N 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- DQGIAOGALAQBGK-BWBBJGPYSA-N Cys-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N)O DQGIAOGALAQBGK-BWBBJGPYSA-N 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 2
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 2
- CSNNHWWHGAXBCP-UHFFFAOYSA-L Magnesium sulfate Chemical compound [Mg+2].[O-][S+2]([O-])([O-])[O-] CSNNHWWHGAXBCP-UHFFFAOYSA-L 0.000 description 2
- AFCARXCZXQIEQB-UHFFFAOYSA-N N-[3-oxo-3-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)propyl]-2-[[3-(trifluoromethoxy)phenyl]methylamino]pyrimidine-5-carboxamide Chemical compound O=C(CCNC(=O)C=1C=NC(=NC=1)NCC1=CC(=CC=C1)OC(F)(F)F)N1CC2=C(CC1)NN=N2 AFCARXCZXQIEQB-UHFFFAOYSA-N 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 2
- 239000002202 Polyethylene glycol Substances 0.000 description 2
- KWMZPPWYBVZIER-XGEHTFHBSA-N Pro-Ser-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWMZPPWYBVZIER-XGEHTFHBSA-N 0.000 description 2
- LCTONWCANYUPML-UHFFFAOYSA-N Pyruvic acid Chemical compound CC(=O)C(O)=O LCTONWCANYUPML-UHFFFAOYSA-N 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 238000002835 absorbance Methods 0.000 description 2
- ZSLZBFCDCINBPY-ZSJPKINUSA-N acetyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 ZSLZBFCDCINBPY-ZSJPKINUSA-N 0.000 description 2
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000007795 chemical reaction product Substances 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 238000012136 culture method Methods 0.000 description 2
- 238000012258 culturing Methods 0.000 description 2
- 235000014113 dietary fatty acids Nutrition 0.000 description 2
- 235000019441 ethanol Nutrition 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 229930195729 fatty acid Natural products 0.000 description 2
- 239000000194 fatty acid Substances 0.000 description 2
- IPCSVZSSVZVIGE-UHFFFAOYSA-N hexadecanoic acid Chemical compound CCCCCCCCCCCCCCCC(O)=O IPCSVZSSVZVIGE-UHFFFAOYSA-N 0.000 description 2
- 108010057821 leucylproline Proteins 0.000 description 2
- 239000006166 lysate Substances 0.000 description 2
- 239000001301 oxygen Substances 0.000 description 2
- 229910052760 oxygen Inorganic materials 0.000 description 2
- 229920001223 polyethylene glycol Polymers 0.000 description 2
- 238000006116 polymerization reaction Methods 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 230000003362 replicative effect Effects 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 230000014621 translational initiation Effects 0.000 description 2
- 239000011782 vitamin Substances 0.000 description 2
- 235000013343 vitamin Nutrition 0.000 description 2
- 229940088594 vitamin Drugs 0.000 description 2
- 229930003231 vitamin Natural products 0.000 description 2
- BITYXLXUCSKTJS-ZETCQYMHSA-N (2S)-2-isopropylmalic acid Chemical compound CC(C)[C@](O)(C(O)=O)CC(O)=O BITYXLXUCSKTJS-ZETCQYMHSA-N 0.000 description 1
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- NILQLFBWTXNUOE-UHFFFAOYSA-N 1-aminocyclopentanecarboxylic acid Chemical compound OC(=O)C1(N)CCCC1 NILQLFBWTXNUOE-UHFFFAOYSA-N 0.000 description 1
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 1
- PAWQVTBBRAZDMG-UHFFFAOYSA-N 2-(3-bromo-2-fluorophenyl)acetic acid Chemical compound OC(=O)CC1=CC=CC(Br)=C1F PAWQVTBBRAZDMG-UHFFFAOYSA-N 0.000 description 1
- WZFUQSJFWNHZHM-UHFFFAOYSA-N 2-[4-[2-(2,3-dihydro-1H-inden-2-ylamino)pyrimidin-5-yl]piperazin-1-yl]-1-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)ethanone Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)N1CCN(CC1)CC(=O)N1CC2=C(CC1)NN=N2 WZFUQSJFWNHZHM-UHFFFAOYSA-N 0.000 description 1
- BKAJNAXTPSGJCU-UHFFFAOYSA-N 4-methyl-2-oxopentanoic acid Chemical compound CC(C)CC(=O)C(O)=O BKAJNAXTPSGJCU-UHFFFAOYSA-N 0.000 description 1
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 1
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 1
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 1
- NJWJSLCQEDMGNC-MBLNEYKQSA-N Ala-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](C)N)O NJWJSLCQEDMGNC-MBLNEYKQSA-N 0.000 description 1
- XUCHENWTTBFODJ-FXQIFTODSA-N Ala-Met-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O XUCHENWTTBFODJ-FXQIFTODSA-N 0.000 description 1
- YYAVDNKUWLAFCV-ACZMJKKPSA-N Ala-Ser-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYAVDNKUWLAFCV-ACZMJKKPSA-N 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- ATRRKUHOCOJYRX-UHFFFAOYSA-N Ammonium bicarbonate Chemical compound [NH4+].OC([O-])=O ATRRKUHOCOJYRX-UHFFFAOYSA-N 0.000 description 1
- VHUUQVKOLVNVRT-UHFFFAOYSA-N Ammonium hydroxide Chemical compound [NH4+].[OH-] VHUUQVKOLVNVRT-UHFFFAOYSA-N 0.000 description 1
- 239000004254 Ammonium phosphate Substances 0.000 description 1
- HKRXJBBCQBAGIM-FXQIFTODSA-N Arg-Asp-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N HKRXJBBCQBAGIM-FXQIFTODSA-N 0.000 description 1
- UWFOMGUWGPRVBW-GUBZILKMSA-N Asn-Pro-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)N)N UWFOMGUWGPRVBW-GUBZILKMSA-N 0.000 description 1
- HBUJSDCLZCXXCW-YDHLFZDLSA-N Asn-Val-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HBUJSDCLZCXXCW-YDHLFZDLSA-N 0.000 description 1
- HMQDRBKQMLRCCG-GMOBBJLQSA-N Asp-Arg-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HMQDRBKQMLRCCG-GMOBBJLQSA-N 0.000 description 1
- USNJAPJZSGTTPX-XVSYOHENSA-N Asp-Phe-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O USNJAPJZSGTTPX-XVSYOHENSA-N 0.000 description 1
- UAXIKORUDGGIGA-DCAQKATOSA-N Asp-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O UAXIKORUDGGIGA-DCAQKATOSA-N 0.000 description 1
- 239000002028 Biomass Substances 0.000 description 1
- 238000009010 Bradford assay Methods 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 241000186031 Corynebacteriaceae Species 0.000 description 1
- 241001517047 Corynebacterium acetoacidophilum Species 0.000 description 1
- 241000909293 Corynebacterium alkanolyticum Species 0.000 description 1
- 241000186145 Corynebacterium ammoniagenes Species 0.000 description 1
- 241000186248 Corynebacterium callunae Species 0.000 description 1
- 241001644925 Corynebacterium efficiens Species 0.000 description 1
- 241000133018 Corynebacterium melassecola Species 0.000 description 1
- 241000337023 Corynebacterium thermoaminogenes Species 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 241000588921 Enterobacteriaceae Species 0.000 description 1
- 241000588722 Escherichia Species 0.000 description 1
- 241000620209 Escherichia coli DH5[alpha] Species 0.000 description 1
- 101001065501 Escherichia phage MS2 Lysis protein Proteins 0.000 description 1
- 229930091371 Fructose Natural products 0.000 description 1
- 239000005715 Fructose Substances 0.000 description 1
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 description 1
- LMPBBFWHCRURJD-LAEOZQHASA-N Gln-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N LMPBBFWHCRURJD-LAEOZQHASA-N 0.000 description 1
- HDUDGCZEOZEFOA-KBIXCLLPSA-N Gln-Ile-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HDUDGCZEOZEFOA-KBIXCLLPSA-N 0.000 description 1
- HWEINOMSWQSJDC-SRVKXCTJSA-N Gln-Leu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HWEINOMSWQSJDC-SRVKXCTJSA-N 0.000 description 1
- LYCDZGLXQBPNQU-WDSKDSINSA-N Glu-Gly-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CS)C(O)=O LYCDZGLXQBPNQU-WDSKDSINSA-N 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 1
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 1
- TWTPDFFBLQEBOE-IUCAKERBSA-N Gly-Leu-Gln Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O TWTPDFFBLQEBOE-IUCAKERBSA-N 0.000 description 1
- IHDKKJVBLGXLEL-STQMWFEESA-N Gly-Tyr-Met Chemical compound CSCC[C@H](NC(=O)[C@H](Cc1ccc(O)cc1)NC(=O)CN)C(O)=O IHDKKJVBLGXLEL-STQMWFEESA-N 0.000 description 1
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 1
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 1
- HIAHVKLTHNOENC-HGNGGELXSA-N His-Glu-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HIAHVKLTHNOENC-HGNGGELXSA-N 0.000 description 1
- CHIAUHSHDARFBD-ULQDDVLXSA-N His-Pro-Tyr Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 CHIAUHSHDARFBD-ULQDDVLXSA-N 0.000 description 1
- JCGMFFQQHJQASB-PYJNHQTQSA-N Ile-Val-His Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O JCGMFFQQHJQASB-PYJNHQTQSA-N 0.000 description 1
- LRQKBLKVPFOOQJ-YFKPBYRVSA-N L-norleucine Chemical compound CCCC[C@H]([NH3+])C([O-])=O LRQKBLKVPFOOQJ-YFKPBYRVSA-N 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 1
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 1
- RIMMMMYKGIBOSN-DCAQKATOSA-N Leu-Asn-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O RIMMMMYKGIBOSN-DCAQKATOSA-N 0.000 description 1
- CCQLQKZTXZBXTN-NHCYSSNCSA-N Leu-Gly-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CCQLQKZTXZBXTN-NHCYSSNCSA-N 0.000 description 1
- LCNASHSOFMRYFO-WDCWCFNPSA-N Leu-Thr-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O LCNASHSOFMRYFO-WDCWCFNPSA-N 0.000 description 1
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 1
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- 108010047562 NGR peptide Proteins 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 235000021314 Palmitic acid Nutrition 0.000 description 1
- 239000001888 Peptone Substances 0.000 description 1
- 108010080698 Peptones Proteins 0.000 description 1
- 108010002747 Pfu DNA polymerase Proteins 0.000 description 1
- PLNHHOXNVSYKOB-JYJNAYRXSA-N Phe-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CC=CC=C1)N PLNHHOXNVSYKOB-JYJNAYRXSA-N 0.000 description 1
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 1
- HJSCRFZVGXAGNG-SRVKXCTJSA-N Pro-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 HJSCRFZVGXAGNG-SRVKXCTJSA-N 0.000 description 1
- 206010038997 Retroviral infections Diseases 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- MUARUIBTKQJKFY-WHFBIAKZSA-N Ser-Gly-Asp Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MUARUIBTKQJKFY-WHFBIAKZSA-N 0.000 description 1
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 1
- UBRMZSHOOIVJPW-SRVKXCTJSA-N Ser-Leu-Lys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O UBRMZSHOOIVJPW-SRVKXCTJSA-N 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 235000019764 Soybean Meal Nutrition 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 235000021355 Stearic acid Nutrition 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 235000019486 Sunflower oil Nutrition 0.000 description 1
- OGOYMQWIWHGTGH-KZVJFYERSA-N Thr-Val-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O OGOYMQWIWHGTGH-KZVJFYERSA-N 0.000 description 1
- DVAAUUVLDFKTAQ-VHWLVUOQSA-N Trp-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N DVAAUUVLDFKTAQ-VHWLVUOQSA-N 0.000 description 1
- ZJKZLNAECPIUTL-JBACZVJFSA-N Trp-Gln-Tyr Chemical compound C([C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=C(O)C=C1 ZJKZLNAECPIUTL-JBACZVJFSA-N 0.000 description 1
- PHNBFZBKLWEBJN-BPUTZDHNSA-N Trp-Glu-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PHNBFZBKLWEBJN-BPUTZDHNSA-N 0.000 description 1
- UDNYEPLJTRDMEJ-RCOVLWMOSA-N Val-Asn-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N UDNYEPLJTRDMEJ-RCOVLWMOSA-N 0.000 description 1
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 1
- LCHZBEUVGAVMKS-RHYQMDGZSA-N Val-Thr-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)[C@@H](C)O)C(O)=O LCHZBEUVGAVMKS-RHYQMDGZSA-N 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- 125000002777 acetyl group Chemical group [H]C([H])([H])C(*)=O 0.000 description 1
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 1
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 1
- 229910021529 ammonia Inorganic materials 0.000 description 1
- 239000001099 ammonium carbonate Substances 0.000 description 1
- 235000012501 ammonium carbonate Nutrition 0.000 description 1
- 235000019270 ammonium chloride Nutrition 0.000 description 1
- 239000000908 ammonium hydroxide Substances 0.000 description 1
- 229910000148 ammonium phosphate Inorganic materials 0.000 description 1
- 235000019289 ammonium phosphates Nutrition 0.000 description 1
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 1
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 1
- 238000012870 ammonium sulfate precipitation Methods 0.000 description 1
- 235000011130 ammonium sulphate Nutrition 0.000 description 1
- 239000003674 animal food additive Substances 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 239000002518 antifoaming agent Substances 0.000 description 1
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 1
- 238000000889 atomisation Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- GUBGYTABKSRVRQ-QUYVBRFLSA-N beta-maltose Chemical compound OC[C@H]1O[C@H](O[C@H]2[C@H](O)[C@@H](O)[C@H](O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@@H]1O GUBGYTABKSRVRQ-QUYVBRFLSA-N 0.000 description 1
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 1
- 239000006172 buffering agent Substances 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 229940041514 candida albicans extract Drugs 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 239000004359 castor oil Substances 0.000 description 1
- 235000019438 castor oil Nutrition 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 239000003240 coconut oil Substances 0.000 description 1
- 235000019864 coconut oil Nutrition 0.000 description 1
- 238000009833 condensation Methods 0.000 description 1
- 230000005494 condensation Effects 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 239000013601 cosmid vector Substances 0.000 description 1
- 238000002425 crystallisation Methods 0.000 description 1
- 230000008025 crystallization Effects 0.000 description 1
- MNNHAPBLZZVQHP-UHFFFAOYSA-N diammonium hydrogen phosphate Chemical compound [NH4+].[NH4+].OP([O-])([O-])=O MNNHAPBLZZVQHP-UHFFFAOYSA-N 0.000 description 1
- ZPWVASYFFYYZEW-UHFFFAOYSA-L dipotassium hydrogen phosphate Chemical compound [K+].[K+].OP([O-])([O-])=O ZPWVASYFFYYZEW-UHFFFAOYSA-L 0.000 description 1
- 239000002270 dispersing agent Substances 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- 238000004821 distillation Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 235000020776 essential amino acid Nutrition 0.000 description 1
- 239000003797 essential amino acid Substances 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 239000011790 ferrous sulphate Substances 0.000 description 1
- 235000003891 ferrous sulphate Nutrition 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 235000011389 fruit/vegetable juice Nutrition 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 108010078144 glutaminyl-glycine Proteins 0.000 description 1
- 235000011187 glycerol Nutrition 0.000 description 1
- ZEMPKEQAKRGZGQ-XOQCFJPHSA-N glycerol triricinoleate Natural products CCCCCC[C@@H](O)CC=CCCCCCCCC(=O)OC[C@@H](COC(=O)CCCCCCCC=CC[C@@H](O)CCCCCC)OC(=O)CCCCCCCC=CC[C@H](O)CCCCCC ZEMPKEQAKRGZGQ-XOQCFJPHSA-N 0.000 description 1
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 1
- 108010050848 glycylleucine Proteins 0.000 description 1
- 108010037850 glycylvaline Proteins 0.000 description 1
- 108010092114 histidylphenylalanine Proteins 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 239000003317 industrial substance Substances 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 150000002484 inorganic compounds Chemical class 0.000 description 1
- 229910010272 inorganic material Inorganic materials 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000005342 ion exchange Methods 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- BAUYGSIQEAFULO-UHFFFAOYSA-L iron(2+) sulfate (anhydrous) Chemical compound [Fe+2].[O-]S([O-])(=O)=O BAUYGSIQEAFULO-UHFFFAOYSA-L 0.000 description 1
- 229910000359 iron(II) sulfate Inorganic materials 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 239000007951 isotonicity adjuster Substances 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- XIXADJRWDQXREU-UHFFFAOYSA-M lithium acetate Chemical compound [Li+].CC([O-])=O XIXADJRWDQXREU-UHFFFAOYSA-M 0.000 description 1
- 239000012139 lysis buffer Substances 0.000 description 1
- 108010003700 lysyl aspartic acid Proteins 0.000 description 1
- 229910052943 magnesium sulfate Inorganic materials 0.000 description 1
- 235000019341 magnesium sulphate Nutrition 0.000 description 1
- 235000013372 meat Nutrition 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 239000011785 micronutrient Substances 0.000 description 1
- 235000013369 micronutrients Nutrition 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 229910000402 monopotassium phosphate Inorganic materials 0.000 description 1
- 235000019796 monopotassium phosphate Nutrition 0.000 description 1
- WQEPLUUGTLDZJY-UHFFFAOYSA-N n-Pentadecanoic acid Natural products CCCCCCCCCCCCCCC(O)=O WQEPLUUGTLDZJY-UHFFFAOYSA-N 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- QIQXTHQIDYTFRH-UHFFFAOYSA-N octadecanoic acid Chemical compound CCCCCCCCCCCCCCCCCC(O)=O QIQXTHQIDYTFRH-UHFFFAOYSA-N 0.000 description 1
- OQCDKBAXFALNLD-UHFFFAOYSA-N octadecanoic acid Natural products CCCCCCCC(C)CCCCCCCCC(O)=O OQCDKBAXFALNLD-UHFFFAOYSA-N 0.000 description 1
- 235000014593 oils and fats Nutrition 0.000 description 1
- 150000007524 organic acids Chemical class 0.000 description 1
- 235000005985 organic acids Nutrition 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 235000019319 peptone Nutrition 0.000 description 1
- PJNZPQUBCPKICU-UHFFFAOYSA-N phosphoric acid;potassium Chemical compound [K].OP(O)(O)=O PJNZPQUBCPKICU-UHFFFAOYSA-N 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 239000011574 phosphorus Substances 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 229920000151 polyglycol Polymers 0.000 description 1
- 239000010695 polyglycol Substances 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 230000002335 preservative effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 229940107700 pyruvic acid Drugs 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000002708 random mutagenesis Methods 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 159000000000 sodium salts Chemical class 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000004455 soybean meal Substances 0.000 description 1
- 239000003549 soybean oil Substances 0.000 description 1
- 235000012424 soybean oil Nutrition 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000008117 stearic acid Substances 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 239000002600 sunflower oil Substances 0.000 description 1
- 239000000375 suspending agent Substances 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 150000003722 vitamin derivatives Chemical class 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 239000000080 wetting agent Substances 0.000 description 1
- 239000012138 yeast extract Substances 0.000 description 1
Abstract
Изобретение относится к биотехнологии. Предложен мутированный полипептид, обладающий активностью изопропилмалатсинтазы, содержащий аминокислотную последовательность SEQ ID NO:1 или SEQ ID NO: 16, где пролин в положении 247 или 212 соответственно заменен на цистеин. Также предложен мутированный полипептид, обладающий активностью изопропилмалатсинтазы, содержащий аминокислотную последовательность SEQ ID NO:1, где (1) пролин в положении 247 заменен на цистеин и (2) где аргинин в положении 558 заменен на гистидин и/или где глицин в положении 561 заменен на аспарагиновую кислоту. Также предложены полинуклеотид, кодирующий указанный мутированный полипептид, вектор экспрессии, содержащий указанный полинуклеотид, микроорганизм, обладающий способностью продуцировать L-лейцин, композиция для получения L-лейцина и способ получения L-лейцина. Изобретение позволяет получить L-лейцин с высоким выходом. 8 н. и 5 з.п. ф-лы, 10 табл., 4 пр.
Description
ОБЛАСТЬ ТЕХНИКИ
Перекрестная ссылка на родственную(ые) заявку(и)
Настоящая заявка претендует на преимущество корейской заявки на патент №10-2020-0060578, поданной 20 мая 2020 года, и полное содержание, раскрытое в документах соответствующих корейских заявок на патент, включено как часть настоящего описания изобретения.
Настоящее изобретение относится к новому мутированному полипептиду, обладающему активностью изопропилмалатсинтазы; полинуклеотиду, кодирующему его; вектору, содержащему полинуклеотид; микроорганизму, включающему мутированный полипептид, полинуклеотид, вектор или их комбинацию; и способу получения L-лейцина посредством культивирования микроорганизма.
ПРЕДШЕСТВУЮЩИЙ УРОВЕНЬ ТЕХНИКИ
L-Аминокислоты промышленно производят посредством способов ферментации с использованием продуцирующих аминокислоты бактерий, принадлежащих к коринеформным бактериям или семейству Enterobacteriaceae, которые имеют способность продуцировать L-аминокислоту. В качестве таких продуцирующих аминокислоты бактерий для повышения продуктивности используют штаммы, выделенные в природе, а также искусственные мутанты таких штаммов и рекомбинантные штаммы, в которых фермент биосинтеза L-аминокислот усилен посредством генетической рекомбинации.
Среди L-аминокислот L-лейцин является типом незаменимой аминокислоты, которая является дорогостоящей и широко используется в лекарствах, пищевых продуктах, кормовых добавках, промышленных химикатах и тому подобном. Кроме того, L-лейцин главным образом получают с использованием микроорганизмов. Ферментационное получение L-лейцина в основном осуществляют с помощью микроорганизма рода Escherichia или микроорганизма рода Corynebacterium, которые, как известно, биосинтезируют в несколько стадий 2-кетоизокапроат в качестве предшественника из пировиноградной кислоты. Однако ферменты, вовлеченные в биосинтез L-лейцина, вызывают ингибирование по типу обратной связи конечным продуктом, то есть L-лейцином или его производным, затрудняя таким образом крупномасштабное промышленное производство L-лейцина.
Таким образом, авторы настоящего изобретения обнаружили, что мутантный штамм, полученный путем изменения конкретного положения изопропилмалатсинтазы, может оптимизировать активность фермента и, таким образом, может быть использован для получения L-лейцина с высоким выходом, тем самым создав настоящее изобретение.
Литература известного уровня техники
Патентная литература
Патентная литература 1: US 2018-0251772 А1
РАСКРЫТИЕ ИЗОБРЕТЕНИЯ
Техническая задача
Задача настоящего изобретения заключается в предложении мутированного полипептида, обладающего активностью изопропилмалатсинтазы, в котором аминокислотный остаток пролина в положении 247 в аминокислотной последовательности SEQ ID NO: 1 заменен на аминокислотный остаток, отличный от пролина.
Другая задача настоящего изобретения заключается в предложении полинуклеотида, кодирующего мутированный полипептид.
Еще одна задача настоящего изобретения заключается в предложении вектора, содержащего полинуклеотид.
Еще одна задача настоящего изобретения заключается в предложении микроорганизма, содержащего по меньшей мере один из выбранных из группы, состоящей из мутированного полипептида, полинуклеотида и вектора, содержащего полинуклеотид.
Еще одна задача настоящего изобретения заключается в предложении способа получения L-лейцина, включающего стадию культивирования микроорганизма в среде.
Еще одна задача настоящего изобретения заключается в предложении композиции для получения L-лейцина, содержащей по меньшей мере один из выбранных из группы, состоящей из мутированного полипептида, полинуклеотида, кодирующего мутированный полипептид, вектора, содержащего полинуклеотид, и микроорганизма (например, мутированного полипептида по настоящему изобретению, полинуклеотида по настоящему изобретению и/или микроорганизма (рекомбинантной клетки), содержащего вектор по настоящему изобретению).
Еще одна задача настоящего изобретения заключается в том, чтобы предложить применение по меньшей мере одного из выбранных из группы, состоящей из мутированного полипептида, полинуклеотида, кодирующего мутированный полипептид, вектора, содержащего полинуклеотид, и микроорганизма (например, мутированного полипептида по настоящему изобретению, полинуклеотида по настоящему изобретению и/или микроорганизма (рекомбинантной клетки), содержащего вектор по настоящему изобретению) для получения L-лейцина.
Техническое решение
В одном аспекте настоящего изобретения предложен мутированный полипептид, обладающий активностью изопропилмалатсинтазы, в котором аминокислотный остаток в положении 247 от N-конца в аминокислотной последовательности белка изопропилмалатсинтазы SEQ ID NO: 1 или в соответствующем ему положении заменен на другой аминокислотный остаток.
В данном документе термин «изопропилмалатсинтаза (2-изопропилмалатсинтаза, а-изопропилмалатсинтаза)» относится к ферменту, который катализирует конденсацию ацетильной группы ацетил-КоА и 2-кетоизовалерата (3-метил-2-оксобутаноат, 2-экзоизовалерат) с превращением его в изопропилмалат (3-карбокси-3-гидрокси-4-метилпентаноат), который является предшественником L-лейцина. Изопропилмалатсинтаза может включать фермент, имеющий активность превращения, независимо от происхождения микроорганизма. Например, изопропилмалатсинтаза может представлять собой фермент, имеющий происхождение из микроорганизма рода Corynebacterium.
Изопропилмалатсинтаза может содержать аминокислотную последовательность SEQ ID NO: 1 или может состоять из аминокислотной последовательности SEQ ID NO: 1. Кроме того, если фермент имеет активность такую же или соответствующую изопропилмалатсинтазе, как полипептид, имеющий гомологию по меньшей мере 60% или более, 70% или более, 80% или более, 85% или более, 90% или более, 92% или более, 94% или более, 96% или более, 98% или более, или 99% или более, 99,5% или более, или 99,8% или более с аминокислотной последовательностью SEQ ID NO: 1, независимо от происхождения микроорганизма, то полипептид, имеющий аминокислотную последовательность, в которой некоторые последовательности удалены, модифицированы, заменены или добавлены в аминокислотную последовательность SEQ ID NO: 1, также может быть включен в объем настоящего изобретения в качестве изопропилмалатсинтазы.
То есть, даже если его описывают в данном документе как «полипептид (или белок), содержащий аминокислотную последовательность, представленную конкретным номером последовательности», или «полипептид (или белок), состоящий из аминокислотной последовательности, представленной конкретным номером последовательности», то полипептид (или белок), имеющий аминокислотную последовательность, в которой некоторые последовательности удалены, модифицированы, заменены или добавлены, также можно использовать в качестве белка или полипептида, подлежащего мутации в настоящем изобретении, когда он имеет такую же или соответствующую активность, что и полипептид (или белок), состоящий из аминокислотной последовательности с соответствующим номером последовательности. Например, полипептид, имеющий такую же или соответствующую активность, что и «полипептид, состоящий из аминокислотной последовательности SEQ ID NO: 1», может относиться к «полипептиду, состоящему из аминокислотной последовательности SEQ ID NO: 1».
Аминокислотная последовательность изопропилмалатсинтазы и нуклеотидная последовательность гена, кодирующего изопропилмалатсинтазу, могут быть легко получены из баз данных, известных в данной области техники, таких как Национальный центр биотехнологической информации (NCBI) и Банк данных ДНК Японии (DDBJ).
В этом описании изобретения полинуклеотид или полипептид, «содержащий конкретную последовательность нуклеиновой кислоты (нуклеотидную последовательность) или аминокислотную последовательность» может означать, что полинуклеотид или полипептид состоит или по существу содержит конкретную последовательность нуклеиновой кислоты (нуклеотидную последовательность) или аминокислотную последовательность и может интерпретироваться как содержащий последовательности, в которых конкретная последовательность нуклеиновых кислот или аминокислотная последовательность мутирована (удалена, заменена, модифицирована и/или добавлена) (или как не исключающая мутацию) в диапазоне сохранения исходной функции и/или желаемой функции полинуклеотида или полипептида. В одном воплощении полинуклеотид или полипептид, «содержащий конкретную последовательность нуклеиновых кислот (нуклеотидную последовательность) или аминокислотную последовательность» может означать, что полинуклеотид или полипептид (1) состоит из или по существу содержит конкретную последовательность нуклеиновых кислот (нуклеотидную последовательность) или аминокислотную последовательность или (2) состоит из или по существу содержит последовательность нуклеиновой кислоты или аминокислотную последовательность, имеющую гомологию 60% или более, 70% или более, 80% или более, 85% или более, 90% или более, 91% или более, 92% или более, 93% или более, 94% или более, 95% или более, 96% или более, 97% или более, 98% или более, 98% или более, 99,5% или более или 99,9% или более с конкретной последовательностью нуклеиновых кислот (нуклеотидной последовательностью) или аминокислотной последовательностью и сохраняет исходную функцию и/или желаемую функцию.
В этом описании изобретения аминокислотная последовательность изопропилмалатсинтазы, имеющей происхождение из Corynebacterium glutamicum дикого типа (например, АТСС13032), представлена под SEQ ID NO: 1, а нуклеотидная последовательность гена leuA, кодирующего изопропилмалатсинтазу, имеющую происхождение из данного штамма дикого типа, представлена под SEQ ID NO: 2. Было показано, что изопропилмалатсинтаза состоит из 616 аминокислот в SEQ ID NO: 1, но из некоторых литературных источников известно, что она состоит из 581 аминокислоты, так как кодон инициации трансляции указан после 35 аминокислот, и аминокислотная последовательность изопропилмалатсинтазы, состоящая из 581 аминокислоты, представлена под SEQ ID NO: 16. Изопропилмалатсинтаза, состоящая из 581 аминокислоты, может быть включена в объем настоящего изобретения в качестве изопропилмалатсинтазы, и в этом случае положение 247 интерпретируется как положение 212, которое, таким образом, может быть включено в объем настоящего изобретения.
Мутированный полипептид согласно одному воплощению может представлять собой полипептид, в котором:
аминокислотный остаток аргинина в положении 558 (или соответствующем ему положении) в аминокислотной последовательности SEQ ID NO: 1 заменен на аминокислотный остаток, отличный от аргинина, аминокислотный остаток глицина в положении 561 (или соответствующем ему положении) в аминокислотной последовательности SEQ ID NO: 1 заменен на аминокислотный остаток, отличный от глицина, или
полипептид дополнительно модифицирован этими двумя заменами.
В одном воплощении, в случае изопропилмалатсинтазы, состоящей из 581 аминокислоты с SEQ ID NO: 16, положение 558 интерпретируется как положение 523, а положение 561 как положение 526, которое, таким образом, входит в объем настоящего изобретения.
В этом описании изобретения термин «гомология» относится к проценту сходства между двумя полинуклеотидами или полипептидными фрагментами. Гомология между последовательностями от фрагмента до другого фрагмента может быть определена посредством методики, известной в данной области техники. Например, гомология может быть определена посредством упорядочивания информации о последовательности и непосредственного упорядочивания информации о последовательности, то есть таких параметров, как оценка, идентичность и сходство и т.д., двух полинуклеотидных молекул или двух полипептидных молекул с использованием легкодоступной компьютерной программы. Компьютерная программа может представлять собой BLAST (NCBI), CLC Main Workbench (CLC bio), Megalign (DNASTAR Inc) или тому подобные. Кроме того, гомология между полинуклеотидами может быть определена посредством гибридизации полинуклеотидов в условиях образования стабильной двойной нити между гомологичными участками, расщепления с помощью одноцепочечной специфической нуклеазы с последующим подтверждением размера расщепленных фрагментов.
Согласно одному аспекту может быть предложен мутированный полипептид, обладающий активностью изопропилмалатсинтазы, в котором аминокислотный остаток пролина в положении 247 (или соответствующем ему положении) в аминокислотной последовательности SEQ ID NO: 1 заменен на аминокислотный остаток, отличный от пролина.
Согласно другому аспекту может быть предложен мутированный полипептид, обладающий активностью изопропилмалатсинтазы, в котором аминокислотный остаток пролина в положении 212 в аминокислотной последовательности SEQ ID NO: 16 заменен на аминокислотный остаток, отличный от пролина.
В этом описании изобретения «положение ~ в аминокислотной последовательности SEQ ID NO: ~» можно использовать взаимозаменяемо с «положением ~ от N-конца полипептида, состоящего из (или содержащего) аминокислотной последовательности SEQ ID NO: ~».
Аминокислоты, отличные от пролина, могут включать аргинин, аланин, лейцин, изолейцин, валин, фенилаланин, триптофан, метионин, глицин, серии, треонин, цистеин, тирозин, аспарагин, глутамин, лизин, гистидин, аспарагиновую кислоту и глутаминовую кислоту.
Согласно одному воплощению мутированный полипептид может представлять собой полипептид, в котором пролин в положении 247 (или соответствующем ему положении) в аминокислотной последовательности SEQ ID NO: 1 заменен на цистеин.
Согласно одному воплощению мутированный полипептид может содержать аминокислотную последовательность SEQ ID NO: 3 или может состоять из аминокислотной последовательности SEQ ID NO: 3.
Мутированный полипептид согласно одному воплощению может представлять собой полипептид, в котором аминокислотный остаток в положении, соответствующем положению 247 (в случае SEQ ID NO: 16, положение 212) в аминокислотной последовательности полипептида, имеющего гомологию 60% или более, 70% или более, 80% или более, 85% или более, 90% или более, 92% или более, 94% или более, 96% или более, 98% или более, или 99% или более, 99,5% или более, или 99,8% или более с аминокислотной последовательностью SEQ ID NO: 1 (или SEQ ID NO: 16), заменен на другой аминокислотный остаток.
Мутированный полипептид согласно одному воплощению может иметь повышенную активность продуцирования L-лейцина, чем у полипептида, содержащего аминокислотную последовательность SEQ ID NO: 1 (или SEQ ID NO: 16), посредством замены пролина в положении 247 в аминокислотной последовательности SEQ ID NO: 1 (или пролина в положении 212 в аминокислотной последовательности SEQ ID NO: 16) или аминокислоты в положении, соответствующем ему, на другую аминокислоту.
Согласно одному воплощению мутированный полипептид, в котором аминокислотный остаток пролина в положении 247 или аминокислотный остаток в соответствующем ему положении в аминокислотной последовательности полипептида, имеющей гомологию 70% или более, 80% или более, 85% или более, 90% или более, 92% или более, 94% или более, 96% или более, 98% или более, или 99% или более с аминокислотной последовательностью SEQ ID NO: 1 или в аминокислотной последовательности SEQ ID NO: 1 заменен на другой аминокислотный остаток, может обладать активностью изопропилмалатсинтазы. Указанный «другой аминокислотный остаток» может означать другой тип аминокислотного остатка, отличного от аминокислоты (например пролина), который присутствовал в указанном положении (положение 247 в аминокислотной последовательности SEQ ID NO: 1 или положение, соответствующее ему) перед заменой.
Мутированный полипептид согласно одному воплощению может иметь повышенную активность продуцирования L-лейцина, чем у изопропилмалатсинтазы, имеющей происхождение из штамма дикого типа (например изопропилмалатсинтазы, содержащей (или состоящей из) аминокислотную последовательность SEQ ID NO: 1 или SEQ ID NO: 16) посредством замены пролина в положении 247 (или в положении 212) в аминокислотной последовательности SEQ ID NO: 1 (или SEQ ID NO: 16) или аминокислотного остатка в соответствующем ему положении на другой остаток.
Мутированный полипептид согласно одному воплощению может иметь повышенную ферментативную активность изопропилмалатсинтазы, чем у изопропилмалатсинтазы, имеющей происхождение из штамма дикого типа (например изопропилмалатсинтазы, состоящей из аминокислотной последовательности SEQ ID NO: 1 (или SEQ ID NO: 16)) посредством замены пролина в положении 247 (или в положении 212) в аминокислотной последовательности SEQ ID NO: 1 (или SEQ ID NO: 16) или аминокислотного остатка в соответствующем ему положении, на другой остаток.
В этом описании изобретения термин «повышение активности изопропилмалатсинтазы» относится к увеличению активности превращения в изопропилмалат. Таким образом, мутированный полипептид согласно одному воплощению может иметь более высокий уровень активности превращения в изопропилмалат по сравнению с полипептидом, имеющим активность изопропилмалатсинтазы, содержащей аминокислотную последовательность SEQ ID NO: 1 (или SEQ ID NO: 16).
В этом описании изобретения термин «повышение активности» можно использовать взаимозаменяемо с «усиленной активностью». Кроме того, изопропилмалат представляет собой один из предшественников L-лейцина, и, таким образом, использование мутированного полипептида согласно одному воплощению приводит к получению более высокого уровня L-лейцина по сравнению с полипептидом, обладающим активностью изопропилмалатсинтазы, содержащей аминокислотную последовательность SEQ ID NO: 1 (или SEQ ID NO: 16).
Активность превращения в изопропилмалат может быть непосредственно подтверждена путем измерения уровня образованного изопропилмалата или может быть подтверждена опосредованно путем измерения уровня образованного КоА. Ферментативная активность изопропилмалатсинтазы может быть измерена известным способом, например, может быть измерена согласно способу, описанному в Kohlhaw et al. (Methods in Enzymology 166:423-9 (1988)), и может быть измерено изменение поглощения при 412 нм, обусловленное тионитробензоатом (TNB), образованным из DTNB (5,5'-дитиобис-(2-нитробензойная кислота), реагент Эллмана) путем восстановления с использованием полученного КоА, посредством этого определяя активность фермента изопропилмалатсинтазы.
Мутированный полипептид согласно одному воплощению может снижать ингибирование L-лейцином и/или его производным по типу обратной связи по сравнению с изопропилмалатсинтазой, имеющей происхождение из штамма дикого типа (например, изопропилмалатсинтазой, состоящей из аминокислотной последовательности SEQ ID NO: 1), посредством замены пролина в положении 247 (или положении 212) в аминокислотной последовательности SEQ ID NO: 1 (или SEQ ID NO: 16) или аминокислотной последовательности в положении, соответствующем ему, на другую аминокислоту.
В этом описании изобретения термин «ингибирование по типу обратной связи» означает, что конечный продукт ферментативной системы ингибирует реакцию на начальной стадии ферментативной системы. Например, ингибирование по типу обратной связи может означать, что L-лейцин или его производное ингибирует активность изопропилмалатсинтазы, которая опосредует первую стадию его биосинтетического пути. Следовательно, когда ингибирование изопропилмалатсинтазы по типу обратной связи снижается (или ослабляется), продуктивность по L-лейцину может быть увеличена по сравнению со случаем, когда его нет.
В этом описании изобретения термин «производное» может относиться к соединениям, которые, как известно, способны ингибировать способность продуцировать L-лейцин из микроорганизмов посредством индукции ингибирования по типу обратной связи в отношении биосинтеза L-лейцина, который является конечным продуктом настоящего изобретения. Их примеры могут включать изолейцин, терлейцин, норлейцин и/или циклолейцин и т.д.
Согласно одному воплощению мутированный полипептид может представлять собой полипептид, в котором положение, отличное от положения 247 (или положения 212) в аминокислотной последовательности SEQ ID NO: 1 (или SEQ ID NO: 16), дополнительно мутировано, тем самым синергически усиливая один или более эффектов, выбранных из группы, состоящей из (1) увеличения активности продуцирования L-лейцина; (2) увеличения ферментативной активности изопропилмалатсинтазы; и (3) уменьшения ингибирования L-лейцином и/или его производным по типу обратной связи.
Согласно одному воплощению, мутированный полипептид может дополнительно содержать мутации, которые могут проявлять один или более эффектов, выбранных из группы, состоящей из (1) увеличения активности продуцирования L-лейцина; (2) увеличения ферментативной активности изопропилмалатсинтазы; и (3) уменьшения ингибирования L- лейцином и/или его производным по типу обратной связи.
Мутированный полипептид может представлять собой полипептид, в котором:
аминокислотный остаток аргинина в положении 558 (или соответствующем ему положении) в аминокислотной последовательности SEQ ID NO: 1 заменен на аминокислотный остаток, отличный от аргинина,
аминокислотный остаток глицина в положении 561 (или соответствующем ему положении) в аминокислотной последовательности SEQ ID NO: 1 заменен на аминокислотный остаток, отличный от глицина, или полипептид дополнительно модифицирован этими двумя заменами.
Мутированный полипептид может представлять собой полипептид, в котором:
аминокислотный остаток аргинина в положении 523 (или соответствующем ему положении) в аминокислотной последовательности SEQ ID NO: 16 заменен на аминокислотный остаток, отличный от аргинина,
аминокислотный остаток глицина в положении 526 (или соответствующем ему положении) в аминокислотной последовательности SEQ ID NO: 16 заменен на аминокислотный остаток, отличный от глицина, или полипептид дополнительно модифицирован этими двумя заменами.
Аминокислота, отличная от аргинина, может включать аланин, лейцин, изолейцин, валин, пролин, фенилаланин, триптофан, метионин, глицин, серии, треонин, цистеин, тирозин, аспарагин, глутамин, лизин, гистидин, аспарагиновую кислоту и глутаминовую кислоту; и аминокислота, отличная от глицина, может включать аланин, лейцин, изолейцин, валин, пролин, фенилаланин, триптофан, метионин, аргинин, серии, треонин, цистеин, тирозин, аспарагин, глутамин, лизин, гистидин, аспарагиновую кислоту и глутаминовую кислоту; но не ограничиваясь ими.
Согласно одному воплощению, аминокислота, отличная от аргинина, может представлять собой гистидин.
Согласно одному воплощению аминокислота, отличная от глицина, может представлять собой аспарагиновую кислоту.
Согласно одному воплощению мутированный полипептид может представлять собой полипептид, в котором:
аминокислотный остаток аргинина в положении 558 в аминокислотной последовательности SEQ ID NO: 1 заменен на аминокислотный остаток гистидина,
аминокислотный остаток глицина в положении 561 в аминокислотной последовательности SEQ ID NO: 1 заменен на аминокислотный остаток аспарагиновой кислоты, или
полипептид дополнительно модифицирован этими двумя заменами.
Согласно одному воплощению мутированный полипептид может содержать аминокислотную последовательность SEQ ID NO: 5 или может состоять из аминокислотной последовательности SEQ ID NO: 5.
Мутированный полипептид, в котором аминокислотный остаток в положении 247 (или положении 212) в аминокислотной последовательности SEQ ID NO: 1 (или SEQ ID NO: 16) заменен на аминокислотный остаток, отличный от пролина,
мутированный полипептид, в котором аминокислотный остаток аргинина в положении 558 (или положении 523) в аминокислотной последовательности SEQ ID NO: 1 (или SEQ ID NO: 16) заменен на аминокислотный остаток, отличный от аргинина, аминокислотный остаток глицина в положении 561 (или положении 526) заменен на аминокислотный остаток, отличный от глицина, или полипептид дополнительно модифицирован этими двумя заменами, может представлять собой полипептид, в котором:
по сравнению с мутированным полипептидом, в котором (1) изопропилмалатсинтаза, имеющая происхождение из штамма дикого типа (например, изопропилмалатсинтаза, содержащая аминокислотную последовательность SEQ ID NO: 1 или SEQ ID NO: 16), или (2) аминокислотный остаток пролина в положении 247 (или положении 212) в аминокислотной последовательности SEQ ID NO: 1 (или SEQ ID NO: 16) заменен на аминокислотный остаток, отличный от пролина,
один или более эффектов, выбранных из группы, состоящей из следующих (1)-(3), могут быть увеличены:
1) увеличение активности продуцирования L-лейцина;
2) увеличение ферментативной активности изопропилмалатсинтазы; и
3) уменьшение ингибирования L-лейцином и/или его производным по типу обратной связи.
Согласно одному воплощению, в зависимости от комбинации мутаций, в которых аминокислота в положениях 247, 558 и/или 561 (или положениях 212, 523 и/или 526) в аминокислотной последовательности SEQ ID NO: 1 (или SEQ ID NO: 16) заменена на другой тип аминокислоты, мутированный полипептид согласно одному воплощению может иметь синергически усиленный один или более эффектов, выбранных из группы, состоящей из следующих (1)-(3):
1) увеличение активности продуцирования L-лейцина;
2) увеличение ферментативной активности изопропилмалатсинтазы; и
3) уменьшение ингибирования L-лейцином и/или его производным по типу обратной связи.
Эффекты (1)-(3) выше являются такими, как описано выше.
Согласно другому аспекту может быть предложен полинуклеотид, кодирующий мутированный полипептид. В этом описании изобретения термин «полинуклеотид» представляет собой полимер нуклеотидов, в котором нуклеотидные мономеры ковалентно связаны в форме длинной цепи, и представляет собой цепь ДНК или РНК, имеющую определенную длину или длиннее. Более конкретно, это может означать полинуклеотидный фрагмент, кодирующий мутированный полипептид.
Мутированный полипептид является таким, как описано выше.
Полинуклеотид может содержать, без ограничения, полинуклеотидную последовательность, кодирующую мутированный полипептид по настоящему изобретению.
Согласно одному воплощению он может представлять собой полинуклеотид, кодирующий полипептид, в котором аминокислотный остаток пролина в положении 247 (или положении 212) в аминокислотной последовательности SEQ ID NO: 1 (или SEQ ID NO: 16) заменен на аминокислотный остаток, отличный от пролина, или полинуклеотид, кодирующий полипептид, который имеет гомологию 60% или более, 70% или более, 80% или более, 85% или более, 90% или более, 92% или более, 94% или более, 96% или более, 98% или более, или 99% или более, 99,5% или более, или 99,8% или более с аминокислотной последовательностью SEQ ID NO: 1 (или SEQ ID NO: 16), в котором аминокислотный остаток в положении, соответствующем положению 247 (или положению 212) в аминокислотной последовательности SEQ ID NO: 1 (или SEQ ID NO: 16), заменен на другой аминокислотный остаток, или кодирующий полипептид, в котором некоторые из последовательностей удалены, модифицированы, заменены или добавлены к ней.
Согласно одному воплощению полинуклеотид может содержать, без ограничений, если он представляет собой зонд, который может быть получен из известной последовательности гена, например, зонд, способный к гибридизации с комплементарной последовательностью для всей или части полинуклеотидной последовательности в жестких условиях и содержащий последовательность, соответствующую последовательности, кодирующей вариант белка, в котором аминокислота в положении 247 (или положении 212) или соответствующем ему в аминокислотной последовательности SEQ ID NO: 1 (или SEQ ID NO: 16) заменена на другую аминокислоту. Термин «жесткие условия» относится к условиям, при которых образуется так называемый специфический гибрид, в то время как неспецифические гибриды не образуются. Примеры таких условий включают условия, при которых гены, имеющие высокие степени гомологии, такие как гены, имеющие гомологию 60% или более, 70% или более, 80% или более, 85% или более, 90% или более, 92% или более, 94% или более, 96% или более, 98% или более, или 99% или более, 99,5% или более, или 99,8% или более, гибридизуются друг с другом, в то время как гены, имеющие низкие степени гомологии, не гибридизуются друг с другом, или условия, при которых гены промывают 1 раз, а конкретно 2 и 3 раза, при температуре и концентрации соли, эквивалентными 60°С, 1× SSC и 0,1% SDS, в частности 60°С, 0,1× SSC, и 0,1% SDS и более конкретно 68°С, 0,1× SSC и 0,1% SDS, которые представляют собой условия для промывки традиционной Саузерн-гибридизации (Sambrook et al., Molecular Cloning: A Laboratory Manual, 3rd Ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (2001)).
Зонд, используемый в гибридизации, может представлять собой часть комплементарной последовательности нуклеотидной последовательности. Такой зонд может быть сконструирован с помощью ПЦР с использованием олигонуклеотида, полученного на основе известной последовательности в качестве праймера и с использованием фрагмента гена, содержащего такую нуклеотидную последовательность в качестве матрицы. Например, фрагмент гена, имеющий длину около 300 п. н., можно использовать в качестве зонда. Более конкретно, в случае использования зонда, имеющего длину примерно 300 п. н., для условий промывки в гибридизации можно рекомендовать 50°С, 2× SSC и 0,1% SDS.
Согласно одному воплощению полинуклеотид может содержать нуклеотидную последовательность SEQ ID NO: 4 или SEQ ID NO: 6, или может состоять из нуклеотидной последовательности SEQ ID NO: 4 или SEQ ID NO: 6, и полинуклеотид, который может быть транслирован в мутированный полипептид согласно одному воплощению вследствие вырожденности кодона, также может быть включен в объем настоящего изобретения.
Согласно другому аспекту может быть предложен вектор, содержащий полинуклеотид.
В этом описании изобретения термин «вектор» относится к любому носителю для клонирования и/или переноса нуклеотидов в клетку-хозяина. Вектор может представлять собой репликон, обеспечивающий репликацию фрагментов, комбинированных с другими фрагментами ДНК. «Репликон» относится к любой генетической единице (например плазмиде, фагу, космиде, хромосоме и вирусу), действующей как самовоспроизводящаяся репликация ДНК in vivo, то есть реплицируемой путем саморегуляции.
В одном воплощении вектор может представлять собой конструкцию ДНК, содержащую полинуклеотидную последовательность, кодирующую целевой белок, который функционально связан с подходящей регуляторной последовательностью, так что целевой белок может экспрессироваться в соответствующем хозяине. Регуляторная последовательность может содержать промотор, способный инициировать транскрипцию, любую операторную последовательность для контроля транскрипции, последовательность, кодирующую соответствующий мРНК-домен связывания рибосомы, и последовательность, контролирующую терминацию транскрипции и трансляции. После трансформации в подходящую клетку-хозяина вектор может реплицироваться или функционировать независимо от генома хозяина, и он может быть интегрирован в сам геном хозяина.
В этом описании изобретения термин «функционально связанный» означает, что последовательность гена функционально связана с промоторной последовательностью, которая инициирует и опосредует транскрипцию полинуклеотида, кодирующего полипептид.
Вектор конкретно не ограничен, пока он способен реплицироваться в клетке-хозяине, и может быть использован любой вектор, известный в данной области техники. Например, вектор может представлять собой природные или рекомбинантные плазмиды, космиды, вирусы и бактериофаги. В качестве фагового вектора или космидного вектора можно использовать MBL3, MBL4, LXII, ASHII, APII, t10, t11, pWE15, М13, λEMBL3, λEMBL4, λFIXII, λDASHII, λZAPII λgt10, λgt11, Charon4A и/или Charon21A и т.д., a также в качестве плазмидного вектора можно использовать векторы pDZ, векторы на основе pBR, векторы на основе pUC, векторы на основе pBluescript II, векторы на основе pGEM, векторы на основе pTZ, векторы на основе pCL и/или векторы на основе рЕТ и т.п. Например, можно использовать векторы pCR2.1, pDC, pDZ, pACYC177, pACYC184, pCL, pECCG117, pUC19, pBR322, pMW118 и/или pCC1BAC и т.п.
Согласно другому аспекту может быть предложен микроорганизм (или рекомбинантная клетка), содержащий по меньшей мере один из выбранных из группы, состоящей из мутированного полипептида, полинуклеотида, кодирующего мутированный полипептид, и вектора, содержащего полинуклеотид.
Подробности, касающиеся мутированного полипептида, полинуклеотида и вектора являются такими, как описано выше.
Микроорганизм (или рекомбинантная клетка) может дополнительно содержать мутацию, которая увеличивает продуцирование L-лейцина, и положение мутации и/или тип гена, подлежащего мутированию, могут быть указаны без ограничений, пока они увеличивают продуцирование L-лейцина.
Микроорганизм (или рекомбинантная клетка) может дополнительно содержать мутацию, которая усиливает активность фермента, вовлеченного в биосинтез L-лейцина. Усиление активности фермента является таким, как описано выше.
Микроорганизм (рекомбинантную клетку) можно использовать без ограничений, пока он представляет собой клетку, способную к трансформации.
Микроорганизм (или рекомбинантная клетка) может иметь способность продуцировать L-лейцин. Микроорганизм (или рекомбинантная клетка) может иметь более улучшенную способность продуцировать L-лейцин или может иметь способностью продуцировать L-лейцин, которой не обладают клетка, родительский штамм и/или штамм дикого типа до рекомбинации.
Микроорганизм (или рекомбинантная клетка) может представлять собой полипептид, в котором аминокислотная последовательность, соответствующая изопропилмалатсинтазе, мутирована таким образом, чтобы повысить ее активность по сравнению со штаммом дикого типа, родительским штаммом и/или клеткой до рекомбинации, или освободить от ингибирования L-лейцина и его производного по типу обратной связи, или может быть достигнуто как увеличение активности фермента, так и освобождение от ингибирования по типу обратной связи.
Микроорганизм (или рекомбинантная клетка) может представлять собой такой, в котором полинуклеотид согласно одному воплощению интегрирован в хромосому, и, например, полинуклеотид согласно одному воплощению может быть заменен на нативный ген leuA (ген, кодирующий изопропилмалатсинтазу) в сайте гена в хромосоме или интегрирован в дополнительный сайт гена.
В этом описании изобретения «обладающий способностью продуцировать L-лейцин» относится к микроорганизмам, у которых способность продуцировать лейцин придана клеткам и/или микроорганизмам, которые не имеют способность продуцировать лейцин, или клеткам и/или микроорганизмам, которые имеют естественную способность продуцировать лейцин. Например, микроорганизмы рода Corynebacterium, имеющие способность продуцировать L-лейцин, относятся к микроорганизму рода Corynebacterium, который имеют улучшенную способность продуцировать L-лейцин в результате вставки внешнего гена, связанного с механизмом продуцирования лейцина, или усиления или инактивации активности нативного гена или самого по себе природного микроорганизма. Микроорганизм может представлять собой микроорганизм рода Corynebacterium.
Микроорганизм рода Corynebacterium может представлять собой Corynebacterium glutamicum, Corynebacterium ammoniagenes, Corynebacterium acetoacidophilum, Corynebacterium acetoglutamicum, Corynebacterium alkanolyticum, Corynebacterium callunae, Corynebacterium lilium, Corynebacterium melassecola, Corynebacterium Thermoaminogenes, Corynebacterium efficiens и/или Corynebacterium Herculis и т.д.
Микроорганизм (или рекомбинантная клетка) может быть искусственно полученным посредством трансформации и/или возникшим естественным путем. Например, микроорганизм (или рекомбинантная клетка) может быть трансформирован полинуклеотидом, кодирующим мутированный полипептид согласно одному воплощению, или вектором, содержащим его.
В этом описании изобретения термин «трансформация» относится к введению гена или полинуклеотида в клетку-хозяина так, чтобы он мог экспрессироваться в клетке-хозяине, и трансформированный ген или полинуклеотид может содержать как форму, вставленную в хромосому клетки-хозяина, так и форму, расположенную вне хромосомы, без ограничений, пока он может экспрессироваться в клетке-хозяине.
В этом описании изобретения способ трансформации включает, без ограничения, пока он представляет собой способ введения гена в клетку и может быть выполнен путем выбора подходящей стандартной методики, известной в данной области техники, в зависимости от клетки-хозяина. Например, можно использовать электропорацию, осаждение фосфатом кальция (CaPO4), осаждение хлоридом кальция (CaCl2), микроинъекцию, ретровирусную инфекцию, способ с полиэтиленгликолем (ПЭГ), способ с DEAE-декстраном, способ катионных липосом и/или способ с ацетатом лития-диметилсульфоксидом (ДМСО), но без ограничения этими.
Микроорганизм (или рекомбинантная клетка) может представлять собой тот, в котором полинуклеотидная последовательность согласно одному воплощению интегрирована в хромосому. Гомологичная рекомбинация позволяет осуществлять обмен фрагментов ДНК на хромосоме с полинуклеотидом согласно одному воплощению, который переносится вектором в клетку, наряду с использованием вектора согласно одному воплощению. Для эффективной рекомбинации между циклической молекулой ДНК вектора и ДНК-мишенью на хромосоме область обмениваемой ДНК, содержащую полинуклеотид согласно одному воплощению, обеспечивают нуклеотидной последовательностью, гомологичной сайту-мишени на конце; и это определяет сайт интеграции вектора и сайт обмена ДНК. Например, полинуклеотид согласно одному воплощению может быть заменен на нативный ген leuA в сайте нативного гена в хромосоме или может быть включен в дополнительный сайт гена.
Согласно другому аспекту может быть предложен способ получения L-лейцина, который включает стадию культивирования микроорганизма (или рекомбинантной клетки) в среде.
В одном воплощении способ может дополнительно включать стадию сбора L-лейцина из культивируемой среды или микроорганизма (или рекомбинантной клетки).
Культивирование можно выполнять в соответствии с подходящей средой и условиями культивирования, известными в данной области техники, должно соответствующим образом удовлетворять потребностям конкретного штамма и может быть подходящим образом модифицировано специалистом в данной области техники.
Способ культивирования может включать, например, периодическое культивирование, непрерывное культивирование, периодическое культивирование с подпиткой или комбинированное культивирование, но без ограничения этим.
Среда для культивирования микроорганизма (или рекомбинантной клетки) может быть известной из литературы (Manual of Methods for General Bacteriology. American Society for Bacteriology. Washington D.C., USA, 1981), но без ограничения этим.
Согласно одному воплощению, среда может содержать различные источники углерода, источники азота и компоненты микроэлементов, и рекомбинантные клетки можно культивировать при регулировании температуры и/или рН в обычной среде, содержащей соответствующий источник углерода, источник азота, аминокислоту, витамин и тому подобное. Источник углерода содержит сахара и углеводы, такие как глюкоза, сахароза, лактоза, фруктоза, мальтоза, крахмал и/или целлюлоза, масла и жиры, такие как соевое масло, подсолнечное масло, касторовое масло и/или кокосовое масло, жирные кислоты, такие как пальмитиновая кислота, стеариновая кислота и/или линолевая кислота, спирты, такие как глицерин и/или этиловый спирт, органические кислоты, такие как уксусная кислота. Эти вещества можно использовать по отдельности или в комбинации двух или более, но без ограничения этим. Источник азота, который можно использовать, может содержать пептон, дрожжевой экстракт, мясной сок, солодовый экстракт, кукурузный отвар, соевую муку и мочевину или неорганические соединения, например, сульфат аммония, хлорид аммония, фосфат аммония, карбонат аммония и нитрат аммония. Источник азота можно также использовать по отдельности или в комбинации из двух или более, но не ограничивается этим. Источник фосфора, который можно использовать, может включать дигидрофосфат калия или гидрофосфат дикалия или соответствующие натрийсодержащие соли, но без ограничения этим. Кроме того, среда может содержать соль металла, такую как сульфат магния или сульфат железа, необходимую для роста, но без ограничения этим. Кроме того, могут содержаться необходимые для роста вещества, такие как аминокислоты и витамины. Кроме того, можно использовать предшественники, подходящие для среды. Среду или отдельные компоненты можно добавлять в загрузочную партию периодическим или непрерывным образом во время процесса культивирования, но не ограничиваясь этим.
Согласно одному воплощению такие соединения, как гидроксид аммония, гидроксид калия, аммиак, фосфорная кислота и серная кислота, могут быть добавлены в культуральную среду микроорганизма соответствующим образом во время культивирования для регулирования рН культуральной среды. Кроме того, образование пузырьков может быть подавлено путем использования во время культивирования пеногасителя, такого как сложный полигликолевый эфир жирных кислот. Кроме того, с целью поддержания аэробного состояния культуральной среды в культуральную среду может быть введен кислород или кислородсодержащий газ (например, воздух). Температура питательной среды может составлять от 20°С до 45°С, от 25°С до 40°С или от 30°С до 37°С. Период культивирования может продолжаться до получения полезного вещества (например, L-лейцина) в требуемом количестве продуцирования, и может составлять, например, от 10 до 160 часов.
Стадию выделения или сбора L-лейцина из культивируемого микроорганизма (или рекомбинантной клетки) и/или культивируемой среды можно выполнять с использованием подходящего способа, известного в данной области техники, в зависимости от способа культивирования. Например, можно использовать центрифугирование, фильтрацию, экстракцию, распыление, сушку, дистилляцию, осаждение, кристаллизацию, электрофорез, фракционное растворение (например, осаждение сульфатом аммония) и/или хроматографию (например, ионообменную, аффинную, гидрофобную и эксклюзионную), но без ограничения этим. Культуральная среда относится к среде, в которой культивировали микроорганизм (или рекомбинантную клетку).
Согласно одному воплощению стадию выделения или сбора L-лейцина можно выполнять путем центрифугирования культуры при низкой скорости для удаления биомассы и выделения полученного супернатанта с помощью ионообменной хроматографии.
Способ получения L-лейцина может дополнительно включать стадию очистки L-лейцина.
Согласно другому аспекту может быть предложена композиция для получения L-лейцина, содержащая по меньшей мере один из выбранных из группы, состоящей из мутированного полипептида по настоящему изобретению, полинуклеотида, кодирующего мутированный полипептид, вектора, содержащего полинуклеотид, и микроорганизма (например, мутированного полипептида по настоящему изобретению, полинуклеотида по настоящему изобретению и/или микроорганизма (рекомбинантной клетки), содержащего вектор по настоящему изобретению).
Композиция по настоящему изобретению может дополнительно содержать любой подходящий эксципиент, обычно используемый в композициях для получения аминокислот, и эксципиент, например, может представлять собой консервант, смачивающий агент, диспергирующий агент, суспендирующий агент, буферизующий агент, стабилизирующий агент или изотонический агент, но без ограничения этим.
В композиции по настоящему изобретению мутированные полипептиды, полинуклеотиды, векторы, микроорганизмы и среды являются такими же, как те, которые описаны в других аспектах выше.
Согласно другому аспекту может быть предложено применение по меньшей мере одного из выбранных из группы, состоящей из мутированного полипептида, полинуклеотида, кодирующего мутированный полипептид, вектора, содержащего полинуклеотид, и микроорганизма (например, мутированного полипептида по настоящему изобретению, полинуклеотида по настоящему изобретению и/или микроорганизма (рекомбинантной клетки), содержащего вектор по настоящему изобретению) для продуцирования L-лейцина.
При использовании настоящего изобретения мутированные полипептиды, полинуклеотиды, векторы, микроорганизмы и среды являются такими же, как те, которые описаны в других аспектах выше.
БЛАГОПРИЯТНЫЕ ЭФФЕКТЫ
Посредством применения мутированного полипептида согласно воплощению можно получать L-лейцин с высоким выходом.
ПОДРОБНОЕ ОПИСАНИЕ ВОПЛОЩЕНИЙ
Далее настоящее изобретение будет описано более подробно со ссылкой на следующие примеры, но объем настоящего изобретения не предназначен для ограничения этими примерами.
Пример 1. Конструирование библиотеки ДНК, кодирующей мутированную изопропилмалатсинтазу
Пример 1-1. Конструирование вектора, содержащего leuA
Для того чтобы сконструировать библиотеку мутантов leuA, кодирующую вариант, обладающий активностью изопропилмалатсинтазы, сначала сконструировали рекомбинантный вектор, содержащий leuA.
Для амплификации гена leuA (SEQ ID NO: 2), кодирующего белок LeuA (2-изопропилмалатсинтаза) (SEQ ID NO: 1, код доступа Uniprot: P42455), имеющий происхождение из Corynebacterium glutamicum дикого типа, выполняли способ ПЦР, используя хромосому Corynebacterium glutamicum АТСС13032 дикого штамма в качестве матрицы и используя праймеры SEQ ID NO: 7 и 8 в следующих условиях повторяющихся 25 циклов: денатурация при 94°С в течение 1 мин, отжиг при 58°С в течение 30 сек и полимеризация при 72°С в течение 1 мин с использованием ДНК-полимеразы Pfu. Конкретные последовательности используемых праймеров приведены в Таблице 1 ниже.
Амплифицированный ПЦР-продукт клонировали в вектор Е. coli pCR2.1 с использованием набора для клонирования ТОРО (Invitrogen) в соответствии с руководством производителя с получением "pCR-leuA".
Пример 1-2. Конструирование библиотеки мутантов leuA
На основе вектора, сконструированного в Примере 1-1, была сконструирована библиотека мутантов leuA с использованием набора для ПЦР с внесением ошибок (clontech Diversify ® PCR Random Mutagenesis Kit). В условиях, когда имели место от О до 3 мутаций на 1000 п. н., реакцию ПЦР выполняли с использованием вектора pCR-leuA в качестве матрицы и с использованием праймеров SEQ ID NO: 7 и SEQ ID NO: 8. Конкретно, в качестве условия, когда имели место от 0 до 3 мутаций на 1000 п. н., реакцию ПЦР выполняли при следующих условиях: предварительный нагрев при 94°С в течение 30 секунд, и затем 25 циклов при 94°С в течение 30 секунд и 68°С в течение 1 мин и 30 сек. Полученный ПЦР-продукт использовали в качестве мегапраймера (50-125 нг), и реакцию ПЦР выполняли посредством повторяющихся 25 циклов при 95°С в течение 50 с, при 60°С в течение 50 с и при 68°С в течение 12 м с последующей обработкой DpnI. Обработанный Dpnl ПЦР-продукт трансформировали в Е. coli DH5α методом теплового шока и наносили на твердую среду LB, содержащую канамицин (25 мг/л). После отбора 20 трансформированных колоний получали плазмиды и анализировали нуклеотидную последовательность. В результате было подтверждено, что мутации были введены во взаимно отличающихся положениях с частотой 2 мутации/кб. Было взято примерно 20000 трансформированных колоний Е. coli и экстрагированы плазмиды, которые получили название "библиотека pTOPO-leuA".
Пример 2. Оценка сконструированной библиотеки и отбор вариантов
Пример 2-1. Отбор мутантных штаммов с количественно повышенном продукцией L-лейцина
Библиотеку pTOPO-leuA, сконструированную в Примере 1-2, трансформировали в Corynebacterium glutamicum дикого типа АТСС13032 с помощью обработки электропорацией, трансформированный штамм распределяли на питательной среде (Таблица 2), содержащей 25 мг/л канамицина, и отбирали колонии из 10000 штаммов, в которые был вставлен мутантный ген. Каждая отобранная колония была названа от АТСС13032/рТОРО_leuA(mt) 1 до АТСС13032/рТОРО_leuA(mt) 10000. Для идентификации колоний с количественно повышенной продукцией L-лейцина, среди 10000 полученных колоний для каждой колонии оценивали титр ферментации следующим образом.
Каждую колонию инокулировали в 250 мл колбу с угловой перегородкой, содержащую 25 мкг/мл канамицина в 25 мл стерилизованной в автоклаве среды для продуцирования (Таблица 2), используя платиновую петлю, и затем подвергали культивированию со встряхиванием при 30°С со скоростью встряхивания 200 об/мин в течение 60 часов. После завершения культивирования количество продуцируемого L-лейцина измеряли способом с использованием высокоэффективной жидкостной хроматографии (ВЭЖХ, SHIMAZDU LC20A).
Из 10000 полученных колоний был отобран один штамм (АТСС13032/ рТОРО_leuA(mt)5306), имеющий наиболее улучшенную способность продуцировать L-лейцин по сравнению со штаммом Corynebacterium glutamicum дикого типа (АТСС13032). Концентрация L-лейцина, продуцированного в отобранном штамме (АТСС13032/pTOPO_leuA(mt)5306), показана в Таблице 3 ниже.
Как показано в Таблице 3, штамм Corynebacterium glutamicum ATCC13032/pTOPO_leuA(mt) 5306, имеющий мутацию в гене leuA, увеличил способность продуцировать L-лейцин примерно в 1,5 раза по сравнению с родительским штаммом Corynebacterium glutamicum АТСС13032.
Пример 2-2. Подтверждение мутаций в мутантных штаммах с повышенным продуцированием L-лейцина Для подтверждения мутации гена leuA штамма Corynebacterium glutamicum ATCC13032/pTOPO_leuA(mt) 5306 выполняли ПЦР с использованием ДНК штамма АТСС13032/рТОРО_leuA(mt)5306 в качестве матрицы и с использованием праймеров SEQ ID NO: 9 и SEQ ID NO: 10, перечисленных в Таблице 4, в следующих условиях: денатурация при 94°С в течение 5 мин, затем 30 циклов при 94°С в течение 30 сек, при 55°С в течение 30 сек и при 72°С в течение 1 мин и 30 сек, затем при 72°С в течение 5 мин, и проводили секвенирование ДНК.
В результате секвенирования было подтверждено, что в штамме ATCC13032/pTOPO_leuA(mt)5306, СС, которые представляют собой 739-ый и 740-ой нуклеотиды гена leuA, заменены на TG. Это означает способность кодировать вариант (далее Р247С), в котором пролин, который представляет собой аминокислоту в положении 247 (положение 212, если белок LeuA состоит из 581 аминокислоты (SEQ ID NO: 16), так как кодон инициации трансляции указывают после 35 аминокислот, на основании известной литературы; далее представлено только как положение 247) белка LeuA, заменен на цистеин. Аминокислотная последовательность варианта LeuA (Р247С) и нуклеотидная последовательность варианта leuA, кодирующего его, являются такими же, как в SEQ ID NO: 3 и SEQ ID NO: 4, соответственно.
В следующих примерах была предпринята попытка подтвердить, влияет ли мутация (Р247С) на количество продуцирования L-лейцина микроорганизмом рода Corynebacterium.
Пример 3. Подтверждение способности отобранных мутантных штаммов продуцировать L-лейцин
Пример 3-1. Конструирование инсерционных векторов, содержащих мутацию leuA
В этом примере, чтобы ввести выбранную мутацию (Р247С) в штаммы с использованием метода сайт-направленного мутагенеза, была предпринята попытка сконструировать вектор для вставки. ПЦР выполняли с использованием хромосомы Corynebacterium glutamicum дикого типа (АТСС13032) в качестве матрицы и с использованием праймеров SEQ ID NO: 11 и 12 и пар праймеров SEQ ID NO: 13 и 14. Конкретно, ПЦР выполняли при следующих условиях: денатурация при 94°С в течение 5 мин, затем 30 циклов при 94°С в течение 30 сек, при 55°С в течение 30 сек и при 72°С в течение 1 мин и 30 сек, затем при 72°С в течение 5 мин. Конкретные последовательности используемых праймеров приведены в Таблице 5.
Полученный ПЦР-продукт расщепляли с помощью фермента рестрикции Smal с получением линейного вектора pDZ, и гомологичную последовательность концевого 15-го основания между фрагментами ДНК подвергали слиянию и клонировали с использованием фермента In-Fusion, посредством этого получая вектор "pDZ-leuA (Р247С)", в котором пролин (Pro), который представляет собой 247-ую аминокислоту leuA, заменен на цистеин (Cys).
Пример 3-2. Введение мутации гена leuA в штамм АТСС13032 Вектор pDZ-leuA (Р247С), сконструированный в Примере 3-1, трансформировали в АТСС13032 посредством обработки электропорацией, и штаммы, имеющие вектор, вставленный в хромосому путем рекомбинации гомологичной последовательности, отбирали в среде, содержащей 25 мг/л канамицина. Отобранный первичный штамм снова подвергали вторичному кроссинговеру, и отбирали штамм, в котором в гене leuA была введена мутация. Подтверждение того, введена или нет мутация гена leuA в конечный трансформированный штамм, осуществляли с помощью анализа нуклеотидных последовательностей после выполнения ПЦР с использованием праймеров SEQ ID NO: 9 и SEQ ID NO: 15 в следующих условиях: при 94°С в течение 5 мин, затем 30 циклов при 94°С в течение 30 сек / при 55°С в течение 30 сек / при 72°С в течение 90 сек, затем при 72°С в течение 5 мин. В результате анализа нуклеотидной последовательности было подтверждено, что СС, где 739-ый и 740-ой нуклеотиды гена leuA в хромосоме штамма был заменен на TG, и мутация leuA, кодирующего LeuA, в которой 247-ая аминокислота пролин (Pro) была заменена на цистеин (Cys), были введены в данный штамм. Полученный штамм был назван "АТСС 13032_1еиА_Р247С". Конкретные последовательности используемых праймеров приведены в Таблицах 4 и 6.
Пример 3-3. Оценка способности мутантных штаммов продуцировать L-лейцин
Чтобы оценить способность штамма АТСС13032_leuA_Р247С продуцировать L-лейцин, полученный в Примере 3-2, оценивали титр ферментации в колбе аналогично способу Примера 2. Родительские штаммы, Corynebacterium glutamicum АТСС13032 и ATCC13032_leuA_P247C, соответственно, инокулировали в 250 мл колбу с угловыми перегородками, содержащую 25 мл среды для продуцирования, используя платиновую петлю, и затем подвергали культивированию со встряхиванием при 30°С со скоростью встряхивания 200 об/мин в течение 60 часов для получения L-лейцина. После завершения культивирования измеряли количество продуцируемого L-лейцина посредством ВЭЖХ, и концентрация L-лейцина в культуральной среде для каждого штамма показана в Таблице 7 ниже.
Как показано в Таблице 7, АТСС 13032_leuA_Р 247 С повышал выход L-лейцина примерно в 1,55 раза по сравнению с исходным штаммом Corynebacterium glutamicum АТСС13032.
Пример 4. Оценка способности продуцировать лейцин у мутантных продуцирующих лейцин штаммов Так как штамм дикого типа рода Corynebacterium продуцирует следовое количество L-лейцина, был получен продуцирующий лейцин штамм, имеющий происхождение из АТСС13032, и мутацию (Р247С), отобранную в Примере 2, вводили для подтверждения способности продуцировать L-лейцин. Конкретный эксперимент проводили следующим образом.
Пример 4-1. Получение продуцирующего L-лейцин штамма (штамм CJL-8100)
В качестве штамма для получения L-лейцина с высокой концентрацией был получен штамм, имеющий происхождение из АТСС13032, содержащий следующие мутации: (1) мутацию (R558H), в которой аргинин, который представляет собой 558-ую аминокислоту белка LeuA, заменен на гистидин посредством замены G, который представляет собой 1673-ий нуклеотид гена leuA, на А, и (2) мутацию (G561D), в которой глицин, который представляет собой 561-ую аминокислоту, заменен на аспарагиновую кислоту посредством замены GC, которые представляют собой 1682-ой и 1683-ий нуклеотиды гена leuA, на AT.
Конкретно, вектор pDZ-leuA (R558H, G561D), содержащий мутацию гена leuA (KR10-2018-0077008 А), трансформировали в Corynebacterium glutamicum АТСС13032 посредством обработки электропорацией, и штамм, имеющий вектор, вставленный в хромосому путем рекомбинации гомологичной последовательности, отбирали в среде, содержащей 25 мг/л канамицина. Отобранный первичный штамм снова подвергали вторичному кроссинговеру, и отбирали штамм, в который была введена мутация гена leuA. Наконец, подтверждали, введены или не введены мутации трансформированного штамма, выполняя ПЦР с использованием праймеров SEQ ID NO: 7 и SEQ ID NO: 13 в следующих условиях: при 94°С в течение 5 мин, затем 30 циклов при 94°С в течение 30 сек/ 55°С в течение 30 секунд/ 72°С в течение 90 секунд, затем при 72°С в течение 5 минут, и анализировали нуклеотидную последовательность, тем самым подтвердив, что были введены мутации R558H и G561D. Конкретные последовательности используемых праймеров представлены в Таблицах 1 и 5. Штамм АТСС13032 leuA (R558H, G561D), трансформированный вектором pDZ-leuA (R558H, G561D), был назван "CJL-8100".
Пример 4-2. Конструирование инсерционного вектора, содержащего мутацию leuA
В этом примере, для того чтобы ввести мутацию (Р247С), отобранную в Примере 2, в CJL-8100, который представляет собой штамм, продуцирующий L-лейцин, в котором две мутации (R558H, G561D) введены в LeuA, предприняли попытку сконструировать вектор для вставки.
Выполняли ПЦР с использованием хромосомы штамма CJL-8100 в качестве матрицы и с использованием праймеров SEQ ID NO: 9 и 10 и пар праймеров SEQ ID NO: 11 и 12. ПЦР выполняли в следующих условиях: денатурация при 94°С в течение 5 мин, затем 30 циклов при 94°С в течение 30 сек, при 55°С в течение 30 сек и при 72°С в течение 1 мин и 30 сек с последующей полимеризацией при 72°С в течение 5 мин. Полученный ПЦР-продукт расщепляли ферментом рестрикции SmaI с получением линейного вектора pDZ и гомологичную последовательность концевого 15 основания между фрагментами ДНК подвергали слиянию и клонировали с использованием фермента In-Fusion, посредством этого был сконструирован вектор pDZ-leuA(P247C, R558H, G561D), который содержит мутацию leuA, кодирующую вариант LeuA, в котором аргинин, который представляет собой 558-ую аминокислоту, заменен на гистидин, и глицин, который представляет собой 561-ую аминокислоту, заменен на аспарагиновую кислоту в аминокислотной последовательности LeuA штамма дикого типа, и пролин (Pro), 247-ая аминокислота LeuA, заменена на цистеин (Cys).
Пример 4-3. Введение и оценка мутанта LeuA (Р247С) в штамме CLJ-8100 CJL-8100, который представляет собой продуцирующий L-лейцин штамм, трансформировали с помощью вектора pDZ-leuA (Р247С, R558H, G561D), полученного в Примере 4-2, и штаммы, в которых вектор был вставлен в хромосому путем рекомбинации гомологичных последовательностей, отбирали в среде, содержащей 25 мг/л из канамицина. Отобранный первичный штамм снова подвергали вторичному кроссинговеру и затем отбирали штамм, в который была введена мутация целевого гена. Подтверждение того, введена или нет мутация гена leuA у конечного трансформированного штамма, осуществляли посредством анализа нуклеотидных последовательностей после проведения ПЦР с использованием праймеров SEQ ID NO: 9 и SEQ ID NO: 15 в следующих условиях: при 94°С в течение 5 мин, затем 30 циклов при 94°С 30 сек/55°С в течение 30 секунд/72°С в течение 90 секунд, затем при 72°С в течение 5 минут. В результате анализа нуклеотидной последовательности подтверждено, что мутация leuA, кодирующей вариант LeuA (Р247С, R558H, G561D), в котором аргинин, который представляет собой 558-ую аминокислоту белка LeuA, заменен на гистидин, глицин, который представляет собой 561-ую аминокислоту, заменен на аспарагиновую кислоту, и пролин (Pro), который представляет собой 247-ую аминокислоту, заменен на цистеин (Cys) посредством замены G, который представляет собой 1673-ий нуклеотид гена leuA, на A, GC, которые представляют собой 1682-ой и 1683-ий нуклеотиды, на AT, и СС, которые представляют собой 739-ый и 740-ой нуклеотиды, на TG в хромосоме штамма, были введены в данный штамм. Полученный CJL8100 leuA Р247С назвали "СА13-8105" и депонировали в Корейский центр культур микроорганизмов (КССМ), который является международным депозитарием в соответствии с Будапештским договором, 29 апреля 2020 года под указанным номером депонирования. Аминокислотная последовательность варианта LeuA (Р247С, R558H, G561D), содержащая эти три мутации, и нуклеотидная последовательность варианта leuA, кодирующего ее, являются такими, как показано в SEQ ID NO: 5 и SEQ ID NO: 6, соответственно.
Штаммы АТСС 13032, полученные CJL-8100 и СА 13-8105, оценивали на способность продуцировать L-лейцин. Конкретно, культивирование в колбе выполняли таким же образом, как в Примере 2-2, и после завершения культивирования количество продуцирования L-лейцина родительским штаммом и мутантным штаммом измеряли посредством ВЭЖХ, и результаты представили в Таблице 8 ниже.
Как показано в Таблице 8, продуцирующий L-лейцин штамм Corynebacterium glutamicum CJL8100 улучшил способность продуцировать L-лейцин примерно на 130% по сравнению с исходным штаммом АТСС13032. Штамм СА13-8105, который дополнительно включает мутацию leuA_Р247С в штамме CJL8100, улучшил способность продуцировать L-лейцин примерно на 150% по сравнению с родительским штаммом CJL8100. На основании приведенных выше результатов можно подтвердить, что аминокислота в положении 247 в аминокислотной последовательности белка LeuA является важным положением для активности продуцирования L-лейцина.
Пример 4-4. Измерение активности изопропилмалатсинтазы в штамме с введенным вариантом LeuA
С целью измерения активности изопропилмалатсинтазы в CJL-8100 и СА13-8105, которые представляют собой продуцирующие L-лейцин штаммы, полученные в Примере 4-3, эксперимент выполняли следующим способом.
Штаммы (CJL-8100, СА13-8105) и АТСС13032 дикого типа инокулировали соответственно в колбу 250 мл с угловыми перегородками, содержащую по 25 мл каждой посевной среды (среда для продуцирования в Таблице 2), используя платиновую петлю, и затем подвергали культивированию при встряхивании при 30°С со скоростью встряхивания 200 оборотов в минуту в течение 16 часов. После завершения культивирования культуральный раствор центрифугировали, надосадочную жидкость отбрасывали и осадок суспендировали и промывали буферным раствором для лизиса, клетки разрушали с помощью шарикового гомогенизатора. Количественное определение белка в лизате основано на методе анализа Брэдфорда, и использовали лизат, содержащий 100 мкг/мл белка. Активность фермента изопропилмалатсинтазы измеряли путем измерения изменения поглощения при 412 нм, обусловленного тионитробензоатом (TNB), образованным из DTNB (5,5'-дитиобис-(2-нитробензойная кислота), реагент Эллмана) путем восстановления с использованием продуцированного на данный момент КоА.
Результаты измерения активности изопропилмалатсинтазы в каждом штамме приведены в Таблице 9 ниже.
Далее, чтобы подтвердить степень освобождения от ингибирования по типу обратной связи вышеуказанного фермента лейцином, измеряли КоА, полученный при использовании раствора, содержащего 100 мкг/л белка, в условиях, при которых добавляли 2 г/л лейцина, тем самым измеряя активность изопропилмалатсинтазы.
Результаты измерения активности изопропилмалатсинтазы в каждом штамме приведены в Таблице 10 ниже.
Как показано в Таблицах 9 и 10, было подтверждено, что продуцирующие L-лейцин штаммы CJL-8100 и СА13-8105, трансформированные вектором экспрессии мутанта LeuA, увеличили активность изопропилмалатсинтазы в 1,13 раза и 1,21 раза, соответственно, по сравнению с контрольным Corynebacterium glutamicum АТСС 13032. Кроме того, было подтверждено, что продуцирующие L-лейцин штаммы, поддерживали активность фермента изопропилмалатсинтазы на уровне 78% и 88%, соответственно, даже в условиях добавления 2 г/л лейцина, указывая на то, что ингибирование по типу обратной связи лейцином освобождалось.
На основании вышеизложенного специалист в области техники, к которой относится настоящее изобретение, сможет понять, что настоящее изобретение может быть воплощено в других конкретных формах без изменения технических концепций или существенных характеристик настоящего изобретения. В этом отношении примерные воплощения, раскрытые здесь, предназначены только для иллюстративных целей и не должны истолковываться как ограничивающие объем настоящего изобретения. Напротив, настоящее изобретение предназначено для охвата не только примерных воплощений, но также различных альтернатив, модификаций, эквивалентов и других воплощений, которые могут входить в сущность и объем настоящего изобретения, как определено в прилагаемой формуле изобретения.
Номер доступа
Название депозитария: Корейский культурный центр микроорганизмов
Номер доступа: KCCM12709P
Дата депонирования: 20200429
--->
ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ
<110> CJ CheilJedang Corporation
<120> Новый полипептид и способ получения L-лейцина с его
использованием
<130> OPP20210722KR
<150> KR 10-2020-0060578
<151> 2020-05-20
<160> 16
<170> KoPatentIn 3.0
<210> 1
<211> 616
<212> PRT
<213> Artificial Sequence
<220>
<223> LeuA AA (616 аминокислот)
<400> 1
Met Ser Pro Asn Asp Ala Phe Ile Ser Ala Pro Ala Lys Ile Glu Thr
1 5 10 15
Pro Val Gly Pro Arg Asn Glu Gly Gln Pro Ala Trp Asn Lys Gln Arg
20 25 30
Gly Ser Ser Met Pro Val Asn Arg Tyr Met Pro Phe Glu Val Glu Val
35 40 45
Glu Asp Ile Ser Leu Pro Asp Arg Thr Trp Pro Asp Lys Lys Ile Thr
50 55 60
Val Ala Pro Gln Trp Cys Ala Val Asp Leu Arg Asp Gly Asn Gln Ala
65 70 75 80
Leu Ile Asp Pro Met Ser Pro Glu Arg Lys Arg Arg Met Phe Glu Leu
85 90 95
Leu Val Gln Met Gly Phe Lys Glu Ile Glu Val Gly Phe Pro Ser Ala
100 105 110
Ser Gln Thr Asp Phe Asp Phe Val Arg Glu Ile Ile Glu Lys Gly Met
115 120 125
Ile Pro Asp Asp Val Thr Ile Gln Val Leu Val Gln Ala Arg Glu His
130 135 140
Leu Ile Arg Arg Thr Phe Glu Ala Cys Glu Gly Ala Lys Asn Val Ile
145 150 155 160
Val His Phe Tyr Asn Ser Thr Ser Ile Leu Gln Arg Asn Val Val Phe
165 170 175
Arg Met Asp Lys Val Gln Val Lys Lys Leu Ala Thr Asp Ala Ala Glu
180 185 190
Leu Ile Lys Thr Ile Ala Gln Asp Tyr Pro Asp Thr Asn Trp Arg Trp
195 200 205
Gln Tyr Ser Pro Glu Ser Phe Thr Gly Thr Glu Val Glu Tyr Ala Lys
210 215 220
Glu Val Val Asp Ala Val Val Glu Val Met Asp Pro Thr Pro Glu Asn
225 230 235 240
Pro Met Ile Ile Asn Leu Pro Ser Thr Val Glu Met Ile Thr Pro Asn
245 250 255
Val Tyr Ala Asp Ser Ile Glu Trp Met His Arg Asn Leu Asn Arg Arg
260 265 270
Asp Ser Ile Ile Leu Ser Leu His Pro His Asn Asp Arg Gly Thr Gly
275 280 285
Val Gly Ala Ala Glu Leu Gly Tyr Met Ala Gly Ala Asp Arg Ile Glu
290 295 300
Gly Cys Leu Phe Gly Asn Gly Glu Arg Thr Gly Asn Val Cys Leu Val
305 310 315 320
Thr Leu Ala Leu Asn Met Leu Thr Gln Gly Val Asp Pro Gln Leu Asp
325 330 335
Phe Thr Asp Ile Arg Gln Ile Arg Ser Thr Val Glu Tyr Cys Asn Gln
340 345 350
Leu Arg Val Pro Glu Arg His Pro Tyr Gly Gly Asp Leu Val Phe Thr
355 360 365
Ala Phe Ser Gly Ser His Gln Asp Ala Val Asn Lys Gly Leu Asp Ala
370 375 380
Met Ala Ala Lys Val Gln Pro Gly Ala Ser Ser Thr Glu Val Ser Trp
385 390 395 400
Glu Gln Leu Arg Asp Thr Glu Trp Glu Val Pro Tyr Leu Pro Ile Asp
405 410 415
Pro Lys Asp Val Gly Arg Asp Tyr Glu Ala Val Ile Arg Val Asn Ser
420 425 430
Gln Ser Gly Lys Gly Gly Val Ala Tyr Ile Met Lys Thr Asp His Gly
435 440 445
Leu Gln Ile Pro Arg Ser Met Gln Val Glu Phe Ser Thr Val Val Gln
450 455 460
Asn Val Thr Asp Ala Glu Gly Gly Glu Val Asn Ser Lys Ala Met Trp
465 470 475 480
Asp Ile Phe Ala Thr Glu Tyr Leu Glu Arg Thr Ala Pro Val Glu Gln
485 490 495
Ile Ala Leu Arg Val Glu Asn Ala Gln Thr Glu Asn Glu Asp Ala Ser
500 505 510
Ile Thr Ala Glu Leu Ile His Asn Gly Lys Asp Val Thr Val Asp Gly
515 520 525
Arg Gly Asn Gly Pro Leu Ala Ala Tyr Ala Asn Ala Leu Glu Lys Leu
530 535 540
Gly Ile Asp Val Glu Ile Gln Glu Tyr Asn Gln His Ala Arg Thr Ser
545 550 555 560
Gly Asp Asp Ala Glu Ala Ala Ala Tyr Val Leu Ala Glu Val Asn Gly
565 570 575
Arg Lys Val Trp Gly Val Gly Ile Ala Gly Ser Ile Thr Tyr Ala Ser
580 585 590
Leu Lys Ala Val Thr Ser Ala Val Asn Arg Ala Leu Asp Val Asn His
595 600 605
Glu Ala Val Leu Ala Gly Gly Val
610 615
<210> 2
<211> 1851
<212> DNA
<213> Artificial Sequence
<220>
<223> leuA NT
<400> 2
atgtctccta acgatgcatt catctccgca cctgccaaga tcgaaacccc agttgggcct
60
cgcaacgaag gccagccagc atggaataag cagcgtggct cctcaatgcc agttaaccgc
120
tacatgcctt tcgaggttga ggtagaagat atttctctgc cggaccgcac ttggccagat
180
aaaaaaatca ccgttgcacc tcagtggtgt gctgttgacc tgcgtgacgg caaccaggct
240
ctgattgatc cgatgtctcc tgagcgtaag cgccgcatgt ttgagctgct ggttcagatg
300
ggcttcaaag aaatcgaggt cggtttccct tcagcttccc agactgattt tgatttcgtt
360
cgtgagatca tcgaaaaggg catgatccct gacgatgtca ccattcaggt tctggttcag
420
gctcgtgagc acctgattcg ccgtactttt gaagcttgcg aaggcgcaaa aaacgttatc
480
gtgcacttct acaactccac ctccatcctg cagcgcaacg tggtgttccg catggacaag
540
gtgcaggtga agaagctggc taccgatgcc gctgaactaa tcaagaccat cgctcaggat
600
tacccagaca ccaactggcg ctggcagtac tcccctgagt ccttcaccgg cactgaggtt
660
gagtacgcca aggaagttgt ggacgcagtt gttgaggtca tggatccaac tcctgagaac
720
ccaatgatca tcaacctgcc ttccaccgtt gagatgatca cccctaacgt ttacgcagac
780
tccattgaat ggatgcaccg caatctaaac cgtcgtgatt ccattatcct gtccctgcac
840
ccgcacaatg accgtggcac cggcgttggc gcagctgagc tgggctacat ggctggcgct
900
gaccgcatcg aaggctgcct gttcggcaac ggcgagcgca ccggcaacgt ctgcctggtc
960
accctggcac tgaacatgct gacccagggc gttgaccctc agctggactt caccgatata
1020
cgccagatcc gcagcaccgt tgaatactgc aaccagctgc gcgttcctga gcgccaccca
1080
tacggcggtg acctggtctt caccgctttc tccggttccc accaggacgc tgtgaacaag
1140
ggtctggacg ccatggctgc caaggttcag ccaggtgcta gctccactga agtttcttgg
1200
gagcagctgc gcgacaccga atgggaggtt ccttacctgc ctatcgatcc aaaggatgtc
1260
ggtcgcgact acgaggctgt tatccgcgtg aactcccagt ccggcaaggg cggcgttgct
1320
tacatcatga agaccgatca cggtctgcag atccctcgct ccatgcaggt tgagttctcc
1380
accgttgtcc agaacgtcac cgacgctgag ggcggcgagg tcaactccaa ggcaatgtgg
1440
gatatcttcg ccaccgagta cctggagcgc accgcaccag ttgagcagat cgcgctgcgc
1500
gtcgagaacg ctcagaccga aaacgaggat gcatccatca ccgccgagct catccacaac
1560
ggcaaggacg tcaccgtcga tggccgcggc aacggcccac tggccgctta cgccaacgcg
1620
ctggagaagc tgggcatcga cgttgagatc caggaataca accagcacgc ccgcacctcg
1680
ggcgacgatg cagaagcagc cgcctacgtg ctggctgagg tcaacggccg caaggtctgg
1740
ggcgtcggca tcgctggctc catcacctac gcttcgctga aggcagtgac ctccgccgta
1800
aaccgcgcgc tggacgtcaa ccacgaggca gtcctggctg gcggcgttta a
1851
<210> 3
<211> 616
<212> PRT
<213> Artificial Sequence
<220>
<223> LeuA P247C AA (616 аминокислот)
<400> 3
Met Ser Pro Asn Asp Ala Phe Ile Ser Ala Pro Ala Lys Ile Glu Thr
1 5 10 15
Pro Val Gly Pro Arg Asn Glu Gly Gln Pro Ala Trp Asn Lys Gln Arg
20 25 30
Gly Ser Ser Met Pro Val Asn Arg Tyr Met Pro Phe Glu Val Glu Val
35 40 45
Glu Asp Ile Ser Leu Pro Asp Arg Thr Trp Pro Asp Lys Lys Ile Thr
50 55 60
Val Ala Pro Gln Trp Cys Ala Val Asp Leu Arg Asp Gly Asn Gln Ala
65 70 75 80
Leu Ile Asp Pro Met Ser Pro Glu Arg Lys Arg Arg Met Phe Glu Leu
85 90 95
Leu Val Gln Met Gly Phe Lys Glu Ile Glu Val Gly Phe Pro Ser Ala
100 105 110
Ser Gln Thr Asp Phe Asp Phe Val Arg Glu Ile Ile Glu Lys Gly Met
115 120 125
Ile Pro Asp Asp Val Thr Ile Gln Val Leu Val Gln Ala Arg Glu His
130 135 140
Leu Ile Arg Arg Thr Phe Glu Ala Cys Glu Gly Ala Lys Asn Val Ile
145 150 155 160
Val His Phe Tyr Asn Ser Thr Ser Ile Leu Gln Arg Asn Val Val Phe
165 170 175
Arg Met Asp Lys Val Gln Val Lys Lys Leu Ala Thr Asp Ala Ala Glu
180 185 190
Leu Ile Lys Thr Ile Ala Gln Asp Tyr Pro Asp Thr Asn Trp Arg Trp
195 200 205
Gln Tyr Ser Pro Glu Ser Phe Thr Gly Thr Glu Val Glu Tyr Ala Lys
210 215 220
Glu Val Val Asp Ala Val Val Glu Val Met Asp Pro Thr Pro Glu Asn
225 230 235 240
Pro Met Ile Ile Asn Leu Cys Ser Thr Val Glu Met Ile Thr Pro Asn
245 250 255
Val Tyr Ala Asp Ser Ile Glu Trp Met His Arg Asn Leu Asn Arg Arg
260 265 270
Asp Ser Ile Ile Leu Ser Leu His Pro His Asn Asp Arg Gly Thr Gly
275 280 285
Val Gly Ala Ala Glu Leu Gly Tyr Met Ala Gly Ala Asp Arg Ile Glu
290 295 300
Gly Cys Leu Phe Gly Asn Gly Glu Arg Thr Gly Asn Val Cys Leu Val
305 310 315 320
Thr Leu Ala Leu Asn Met Leu Thr Gln Gly Val Asp Pro Gln Leu Asp
325 330 335
Phe Thr Asp Ile Arg Gln Ile Arg Ser Thr Val Glu Tyr Cys Asn Gln
340 345 350
Leu Arg Val Pro Glu Arg His Pro Tyr Gly Gly Asp Leu Val Phe Thr
355 360 365
Ala Phe Ser Gly Ser His Gln Asp Ala Val Asn Lys Gly Leu Asp Ala
370 375 380
Met Ala Ala Lys Val Gln Pro Gly Ala Ser Ser Thr Glu Val Ser Trp
385 390 395 400
Glu Gln Leu Arg Asp Thr Glu Trp Glu Val Pro Tyr Leu Pro Ile Asp
405 410 415
Pro Lys Asp Val Gly Arg Asp Tyr Glu Ala Val Ile Arg Val Asn Ser
420 425 430
Gln Ser Gly Lys Gly Gly Val Ala Tyr Ile Met Lys Thr Asp His Gly
435 440 445
Leu Gln Ile Pro Arg Ser Met Gln Val Glu Phe Ser Thr Val Val Gln
450 455 460
Asn Val Thr Asp Ala Glu Gly Gly Glu Val Asn Ser Lys Ala Met Trp
465 470 475 480
Asp Ile Phe Ala Thr Glu Tyr Leu Glu Arg Thr Ala Pro Val Glu Gln
485 490 495
Ile Ala Leu Arg Val Glu Asn Ala Gln Thr Glu Asn Glu Asp Ala Ser
500 505 510
Ile Thr Ala Glu Leu Ile His Asn Gly Lys Asp Val Thr Val Asp Gly
515 520 525
Arg Gly Asn Gly Pro Leu Ala Ala Tyr Ala Asn Ala Leu Glu Lys Leu
530 535 540
Gly Ile Asp Val Glu Ile Gln Glu Tyr Asn Gln His Ala Arg Thr Ser
545 550 555 560
Gly Asp Asp Ala Glu Ala Ala Ala Tyr Val Leu Ala Glu Val Asn Gly
565 570 575
Arg Lys Val Trp Gly Val Gly Ile Ala Gly Ser Ile Thr Tyr Ala Ser
580 585 590
Leu Lys Ala Val Thr Ser Ala Val Asn Arg Ala Leu Asp Val Asn His
595 600 605
Glu Ala Val Leu Ala Gly Gly Val
610 615
<210> 4
<211> 1851
<212> DNA
<213> Artificial Sequence
<220>
<223> LeuA P247C NT
<400> 4
atgtctccta acgatgcatt catctccgca cctgccaaga tcgaaacccc agttgggcct
60
cgcaacgaag gccagccagc atggaataag cagcgtggct cctcaatgcc agttaaccgc
120
tacatgcctt tcgaggttga ggtagaagat atttctctgc cggaccgcac ttggccagat
180
aaaaaaatca ccgttgcacc tcagtggtgt gctgttgacc tgcgtgacgg caaccaggct
240
ctgattgatc cgatgtctcc tgagcgtaag cgccgcatgt ttgagctgct ggttcagatg
300
ggcttcaaag aaatcgaggt cggtttccct tcagcttccc agactgattt tgatttcgtt
360
cgtgagatca tcgaaaaggg catgatccct gacgatgtca ccattcaggt tctggttcag
420
gctcgtgagc acctgattcg ccgtactttt gaagcttgcg aaggcgcaaa aaacgttatc
480
gtgcacttct acaactccac ctccatcctg cagcgcaacg tggtgttccg catggacaag
540
gtgcaggtga agaagctggc taccgatgcc gctgaactaa tcaagaccat cgctcaggat
600
tacccagaca ccaactggcg ctggcagtac tcccctgagt ccttcaccgg cactgaggtt
660
gagtacgcca aggaagttgt ggacgcagtt gttgaggtca tggatccaac tcctgagaac
720
ccaatgatca tcaacctgtg ttccaccgtt gagatgatca cccctaacgt ttacgcagac
780
tccattgaat ggatgcaccg caatctaaac cgtcgtgatt ccattatcct gtccctgcac
840
ccgcacaatg accgtggcac cggcgttggc gcagctgagc tgggctacat ggctggcgct
900
gaccgcatcg aaggctgcct gttcggcaac ggcgagcgca ccggcaacgt ctgcctggtc
960
accctggcac tgaacatgct gacccagggc gttgaccctc agctggactt caccgatata
1020
cgccagatcc gcagcaccgt tgaatactgc aaccagctgc gcgttcctga gcgccaccca
1080
tacggcggtg acctggtctt caccgctttc tccggttccc accaggacgc tgtgaacaag
1140
ggtctggacg ccatggctgc caaggttcag ccaggtgcta gctccactga agtttcttgg
1200
gagcagctgc gcgacaccga atgggaggtt ccttacctgc ctatcgatcc aaaggatgtc
1260
ggtcgcgact acgaggctgt tatccgcgtg aactcccagt ccggcaaggg cggcgttgct
1320
tacatcatga agaccgatca cggtctgcag atccctcgct ccatgcaggt tgagttctcc
1380
accgttgtcc agaacgtcac cgacgctgag ggcggcgagg tcaactccaa ggcaatgtgg
1440
gatatcttcg ccaccgagta cctggagcgc accgcaccag ttgagcagat cgcgctgcgc
1500
gtcgagaacg ctcagaccga aaacgaggat gcatccatca ccgccgagct catccacaac
1560
ggcaaggacg tcaccgtcga tggccgcggc aacggcccac tggccgctta cgccaacgcg
1620
ctggagaagc tgggcatcga cgttgagatc caggaataca accagcacgc ccgcacctcg
1680
ggcgacgatg cagaagcagc cgcctacgtg ctggctgagg tcaacggccg caaggtctgg
1740
ggcgtcggca tcgctggctc catcacctac gcttcgctga aggcagtgac ctccgccgta
1800
aaccgcgcgc tggacgtcaa ccacgaggca gtcctggctg gcggcgttta a
1851
<210> 5
<211> 616
<212> PRT
<213> Artificial Sequence
<220>
<223> LeuA P247C R558H G561D AA (616 аминокислот)
<400> 5
Met Ser Pro Asn Asp Ala Phe Ile Ser Ala Pro Ala Lys Ile Glu Thr
1 5 10 15
Pro Val Gly Pro Arg Asn Glu Gly Gln Pro Ala Trp Asn Lys Gln Arg
20 25 30
Gly Ser Ser Met Pro Val Asn Arg Tyr Met Pro Phe Glu Val Glu Val
35 40 45
Glu Asp Ile Ser Leu Pro Asp Arg Thr Trp Pro Asp Lys Lys Ile Thr
50 55 60
Val Ala Pro Gln Trp Cys Ala Val Asp Leu Arg Asp Gly Asn Gln Ala
65 70 75 80
Leu Ile Asp Pro Met Ser Pro Glu Arg Lys Arg Arg Met Phe Glu Leu
85 90 95
Leu Val Gln Met Gly Phe Lys Glu Ile Glu Val Gly Phe Pro Ser Ala
100 105 110
Ser Gln Thr Asp Phe Asp Phe Val Arg Glu Ile Ile Glu Lys Gly Met
115 120 125
Ile Pro Asp Asp Val Thr Ile Gln Val Leu Val Gln Ala Arg Glu His
130 135 140
Leu Ile Arg Arg Thr Phe Glu Ala Cys Glu Gly Ala Lys Asn Val Ile
145 150 155 160
Val His Phe Tyr Asn Ser Thr Ser Ile Leu Gln Arg Asn Val Val Phe
165 170 175
Arg Met Asp Lys Val Gln Val Lys Lys Leu Ala Thr Asp Ala Ala Glu
180 185 190
Leu Ile Lys Thr Ile Ala Gln Asp Tyr Pro Asp Thr Asn Trp Arg Trp
195 200 205
Gln Tyr Ser Pro Glu Ser Phe Thr Gly Thr Glu Val Glu Tyr Ala Lys
210 215 220
Glu Val Val Asp Ala Val Val Glu Val Met Asp Pro Thr Pro Glu Asn
225 230 235 240
Pro Met Ile Ile Asn Leu Cys Ser Thr Val Glu Met Ile Thr Pro Asn
245 250 255
Val Tyr Ala Asp Ser Ile Glu Trp Met His Arg Asn Leu Asn Arg Arg
260 265 270
Asp Ser Ile Ile Leu Ser Leu His Pro His Asn Asp Arg Gly Thr Gly
275 280 285
Val Gly Ala Ala Glu Leu Gly Tyr Met Ala Gly Ala Asp Arg Ile Glu
290 295 300
Gly Cys Leu Phe Gly Asn Gly Glu Arg Thr Gly Asn Val Cys Leu Val
305 310 315 320
Thr Leu Ala Leu Asn Met Leu Thr Gln Gly Val Asp Pro Gln Leu Asp
325 330 335
Phe Thr Asp Ile Arg Gln Ile Arg Ser Thr Val Glu Tyr Cys Asn Gln
340 345 350
Leu Arg Val Pro Glu Arg His Pro Tyr Gly Gly Asp Leu Val Phe Thr
355 360 365
Ala Phe Ser Gly Ser His Gln Asp Ala Val Asn Lys Gly Leu Asp Ala
370 375 380
Met Ala Ala Lys Val Gln Pro Gly Ala Ser Ser Thr Glu Val Ser Trp
385 390 395 400
Glu Gln Leu Arg Asp Thr Glu Trp Glu Val Pro Tyr Leu Pro Ile Asp
405 410 415
Pro Lys Asp Val Gly Arg Asp Tyr Glu Ala Val Ile Arg Val Asn Ser
420 425 430
Gln Ser Gly Lys Gly Gly Val Ala Tyr Ile Met Lys Thr Asp His Gly
435 440 445
Leu Gln Ile Pro Arg Ser Met Gln Val Glu Phe Ser Thr Val Val Gln
450 455 460
Asn Val Thr Asp Ala Glu Gly Gly Glu Val Asn Ser Lys Ala Met Trp
465 470 475 480
Asp Ile Phe Ala Thr Glu Tyr Leu Glu Arg Thr Ala Pro Val Glu Gln
485 490 495
Ile Ala Leu Arg Val Glu Asn Ala Gln Thr Glu Asn Glu Asp Ala Ser
500 505 510
Ile Thr Ala Glu Leu Ile His Asn Gly Lys Asp Val Thr Val Asp Gly
515 520 525
Arg Gly Asn Gly Pro Leu Ala Ala Tyr Ala Asn Ala Leu Glu Lys Leu
530 535 540
Gly Ile Asp Val Glu Ile Gln Glu Tyr Asn Gln His Ala His Thr Ser
545 550 555 560
Asp Asp Asp Ala Glu Ala Ala Ala Tyr Val Leu Ala Glu Val Asn Gly
565 570 575
Arg Lys Val Trp Gly Val Gly Ile Ala Gly Ser Ile Thr Tyr Ala Ser
580 585 590
Leu Lys Ala Val Thr Ser Ala Val Asn Arg Ala Leu Asp Val Asn His
595 600 605
Glu Ala Val Leu Ala Gly Gly Val
610 615
<210> 6
<211> 1851
<212> DNA
<213> Artificial Sequence
<220>
<223> LeuA P247C R558H G561D NT
<400> 6
atgtctccta acgatgcatt catctccgca cctgccaaga tcgaaacccc agttgggcct
60
cgcaacgaag gccagccagc atggaataag cagcgtggct cctcaatgcc agttaaccgc
120
tacatgcctt tcgaggttga ggtagaagat atttctctgc cggaccgcac ttggccagat
180
aaaaaaatca ccgttgcacc tcagtggtgt gctgttgacc tgcgtgacgg caaccaggct
240
ctgattgatc cgatgtctcc tgagcgtaag cgccgcatgt ttgagctgct ggttcagatg
300
ggcttcaaag aaatcgaggt cggtttccct tcagcttccc agactgattt tgatttcgtt
360
cgtgagatca tcgaaaaggg catgatccct gacgatgtca ccattcaggt tctggttcag
420
gctcgtgagc acctgattcg ccgtactttt gaagcttgcg aaggcgcaaa aaacgttatc
480
gtgcacttct acaactccac ctccatcctg cagcgcaacg tggtgttccg catggacaag
540
gtgcaggtga agaagctggc taccgatgcc gctgaactaa tcaagaccat cgctcaggat
600
tacccagaca ccaactggcg ctggcagtac tcccctgagt ccttcaccgg cactgaggtt
660
gagtacgcca aggaagttgt ggacgcagtt gttgaggtca tggatccaac tcctgagaac
720
ccaatgatca tcaacctgtg ttccaccgtt gagatgatca cccctaacgt ttacgcagac
780
tccattgaat ggatgcaccg caatctaaac cgtcgtgatt ccattatcct gtccctgcac
840
ccgcacaatg accgtggcac cggcgttggc gcagctgagc tgggctacat ggctggcgct
900
gaccgcatcg aaggctgcct gttcggcaac ggcgagcgca ccggcaacgt ctgcctggtc
960
accctggcac tgaacatgct gacccagggc gttgaccctc agctggactt caccgatata
1020
cgccagatcc gcagcaccgt tgaatactgc aaccagctgc gcgttcctga gcgccaccca
1080
tacggcggtg acctggtctt caccgctttc tccggttccc accaggacgc tgtgaacaag
1140
ggtctggacg ccatggctgc caaggttcag ccaggtgcta gctccactga agtttcttgg
1200
gagcagctgc gcgacaccga atgggaggtt ccttacctgc ctatcgatcc aaaggatgtc
1260
ggtcgcgact acgaggctgt tatccgcgtg aactcccagt ccggcaaggg cggcgttgct
1320
tacatcatga agaccgatca cggtctgcag atccctcgct ccatgcaggt tgagttctcc
1380
accgttgtcc agaacgtcac cgacgctgag ggcggcgagg tcaactccaa ggcaatgtgg
1440
gatatcttcg ccaccgagta cctggagcgc accgcaccag ttgagcagat cgcgctgcgc
1500
gtcgagaacg ctcagaccga aaacgaggat gcatccatca ccgccgagct catccacaac
1560
ggcaaggacg tcaccgtcga tggccgcggc aacggcccac tggccgctta cgccaacgcg
1620
ctggagaagc tgggcatcga cgttgagatc caggaataca accagcacgc ccacacctcg
1680
gatgacgatg cagaagcagc cgcctacgtg ctggctgagg tcaacggccg caaggtctgg
1740
ggcgtcggca tcgctggctc catcacctac gcttcgctga aggcagtgac ctccgccgta
1800
aaccgcgcgc tggacgtcaa ccacgaggca gtcctggctg gcggcgttta a
1851
<210> 7
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> pCR-leuA_F
<400> 7
ctaatctcga ggtcacccat gtctcctaac
30
<210> 8
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> pCR-leuA_R
<400> 8
ggctggcggc gtttaaaacc ggttgat
27
<210> 9
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> leuA_секвенирование_F
<400> 9
aacacgaccg gcatcccgtc gc
22
<210> 10
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> leuA_секвенирование_R
<400> 10
aaatcatttg agaaaactcg agg
23
<210> 11
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> leuA_P247C_Up_F
<400> 11
gtgaattcga gctcggtacc caaatcattt gagaaaactc gaggc
45
<210> 12
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> leuA_P247C_Up_R
<400> 12
ggtgatcatc tcaacggtgg aacacaggtt gatgatcatt gggtt
45
<210> 13
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> leuA_P247C_Down_F
<400> 13
aacccaatga tcatcaacct gtgttccacc gttgagatga tcacc
45
<210> 14
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> leuA_P247C_Down_R
<400> 14
ggtcgactct agaggatccc caagaaggca acatcggaca gc
42
<210> 15
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> leuA_секвенирование_R
<400> 15
atccattcaa tggagtctgc g
21
<210> 16
<211> 581
<212> PRT
<213> Artificial Sequence
<220>
<223> LeuA AA (581 аминокислот)
<400> 16
Met Pro Val Asn Arg Tyr Met Pro Phe Glu Val Glu Val Glu Asp Ile
1 5 10 15
Ser Leu Pro Asp Arg Thr Trp Pro Asp Lys Lys Ile Thr Val Ala Pro
20 25 30
Gln Trp Cys Ala Val Asp Leu Arg Asp Gly Asn Gln Ala Leu Ile Asp
35 40 45
Pro Met Ser Pro Glu Arg Lys Arg Arg Met Phe Glu Leu Leu Val Gln
50 55 60
Met Gly Phe Lys Glu Ile Glu Val Gly Phe Pro Ser Ala Ser Gln Thr
65 70 75 80
Asp Phe Asp Phe Val Arg Glu Ile Ile Glu Lys Gly Met Ile Pro Asp
85 90 95
Asp Val Thr Ile Gln Val Leu Val Gln Ala Arg Glu His Leu Ile Arg
100 105 110
Arg Thr Phe Glu Ala Cys Glu Gly Ala Lys Asn Val Ile Val His Phe
115 120 125
Tyr Asn Ser Thr Ser Ile Leu Gln Arg Asn Val Val Phe Arg Met Asp
130 135 140
Lys Val Gln Val Lys Lys Leu Ala Thr Asp Ala Ala Glu Leu Ile Lys
145 150 155 160
Thr Ile Ala Gln Asp Tyr Pro Asp Thr Asn Trp Arg Trp Gln Tyr Ser
165 170 175
Pro Glu Ser Phe Thr Gly Thr Glu Val Glu Tyr Ala Lys Glu Val Val
180 185 190
Asp Ala Val Val Glu Val Met Asp Pro Thr Pro Glu Asn Pro Met Ile
195 200 205
Ile Asn Leu Pro Ser Thr Val Glu Met Ile Thr Pro Asn Val Tyr Ala
210 215 220
Asp Ser Ile Glu Trp Met His Arg Asn Leu Asn Arg Arg Asp Ser Ile
225 230 235 240
Ile Leu Ser Leu His Pro His Asn Asp Arg Gly Thr Gly Val Gly Ala
245 250 255
Ala Glu Leu Gly Tyr Met Ala Gly Ala Asp Arg Ile Glu Gly Cys Leu
260 265 270
Phe Gly Asn Gly Glu Arg Thr Gly Asn Val Cys Leu Val Thr Leu Ala
275 280 285
Leu Asn Met Leu Thr Gln Gly Val Asp Pro Gln Leu Asp Phe Thr Asp
290 295 300
Ile Arg Gln Ile Arg Ser Thr Val Glu Tyr Cys Asn Gln Leu Arg Val
305 310 315 320
Pro Glu Arg His Pro Tyr Gly Gly Asp Leu Val Phe Thr Ala Phe Ser
325 330 335
Gly Ser His Gln Asp Ala Val Asn Lys Gly Leu Asp Ala Met Ala Ala
340 345 350
Lys Val Gln Pro Gly Ala Ser Ser Thr Glu Val Ser Trp Glu Gln Leu
355 360 365
Arg Asp Thr Glu Trp Glu Val Pro Tyr Leu Pro Ile Asp Pro Lys Asp
370 375 380
Val Gly Arg Asp Tyr Glu Ala Val Ile Arg Val Asn Ser Gln Ser Gly
385 390 395 400
Lys Gly Gly Val Ala Tyr Ile Met Lys Thr Asp His Gly Leu Gln Ile
405 410 415
Pro Arg Ser Met Gln Val Glu Phe Ser Thr Val Val Gln Asn Val Thr
420 425 430
Asp Ala Glu Gly Gly Glu Val Asn Ser Lys Ala Met Trp Asp Ile Phe
435 440 445
Ala Thr Glu Tyr Leu Glu Arg Thr Ala Pro Val Glu Gln Ile Ala Leu
450 455 460
Arg Val Glu Asn Ala Gln Thr Glu Asn Glu Asp Ala Ser Ile Thr Ala
465 470 475 480
Glu Leu Ile His Asn Gly Lys Asp Val Thr Val Asp Gly Arg Gly Asn
485 490 495
Gly Pro Leu Ala Ala Tyr Ala Asn Ala Leu Glu Lys Leu Gly Ile Asp
500 505 510
Val Glu Ile Gln Glu Tyr Asn Gln His Ala Arg Thr Ser Gly Asp Asp
515 520 525
Ala Glu Ala Ala Ala Tyr Val Leu Ala Glu Val Asn Gly Arg Lys Val
530 535 540
Trp Gly Val Gly Ile Ala Gly Ser Ile Thr Tyr Ala Ser Leu Lys Ala
545 550 555 560
Val Thr Ser Ala Val Asn Arg Ala Leu Asp Val Asn His Glu Ala Val
565 570 575
Leu Ala Gly Gly Val
580
<---
Claims (16)
1. Мутированный полипептид, обладающий активностью изопропилмалатсинтазы, содержащий аминокислотную последовательность SEQ ID NO: 1 или SEQ ID NO: 16, где пролин в положении 247 или 212 соответственно заменен на цистеин.
2. Мутированный полипептид по п. 1, содержащий аминокислотную последовательность SEQ ID NO: 3.
3. Мутированный полипептид, обладающий активностью изопропилмалатсинтазы, содержащий аминокислотную последовательность SEQ ID NO: 1,
(1) где пролин в положении 247 заменен на цистеин; и
(2) где аргинин в положении 558 заменен на гистидин, и/или
где глицин в положении 561 заменен на аспарагиновую кислоту.
4. Мутированный полипептид по п. 3, содержащий аминокислотную последовательность SEQ ID NO: 5.
5. Полинуклеотид, кодирующий мутированный полипептид по любому из пп. 1-4.
6. Вектор экспрессии, содержащий полинуклеотид по п. 5.
7. Микроорганизм, обладающий способностью продуцировать L-лейцин, содержащий по меньшей мере один из выбранных из группы, состоящей из мутированного полипептида по любому из пп. 1-4, полинуклеотида, кодирующего данный мутированный полипептид, и вектора, содержащего данный полинуклеотид.
8. Микроорганизм по п. 7, представляющий собой микроорганизм рода Corynebacterium.
9. Микроорганизм по п. 8, где микроорганизм рода Corynebacterium представляет собой Corynebacterium glutamicum.
10. Способ получения L-лейцина, включающий стадию культивирования микроорганизма по п. 7 в среде.
11. Способ получения L-лейцина по п. 10, дополнительно включающий стадию сбора L-лейцина из культивируемой среды или микроорганизма.
12. Композиция для получения L-лейцина, содержащая по меньшей мере один из выбранных из группы, состоящей из мутированного полипептида по любому из пп. 1-4, полинуклеотида, кодирующего данный мутированный полипептид, вектора, содержащего данный полинуклеотид, и микроорганизма, содержащего данный полипептид, данный полинуклеотид или данный вектор; и эксципиент.
13. Применение по меньшей мере одного, выбранного из группы, состоящей из мутированного полипептида по любому из пп. 1-4, полинуклеотида, кодирующего данный мутированный полипептид, вектора, содержащего данный полинуклеотид, и микроорганизма, содержащего данный полипептид, данный полинуклеотид или данный вектор, для получения L-лейцина.
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR10-2020-0060578 | 2020-05-20 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| RU2811433C1 true RU2811433C1 (ru) | 2024-01-11 |
Family
ID=
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| RU2201454C2 (ru) * | 1999-07-09 | 2003-03-27 | Закрытое акционерное общество "Научно-исследовательский институт Аджиномото-Генетика" | Мутантная альфа-изопропилмалат синтаза (ipms), днк, кодирующая мутантную ipms, способ получения штамма escherichia coli, способ получения l-лейцина |
| WO2018124440A2 (ko) * | 2016-12-28 | 2018-07-05 | 씨제이제일제당 (주) | 신규한 이소프로필말레이트 신타제 변이체 및 이를 이용한 l-류신의 생산 방법 |
| RU2693663C1 (ru) * | 2015-08-25 | 2019-07-03 | СиДжей ЧеилДжеданг Корпорейшн | Микроорганизм, продуцирующий L-лейцин, и способ получения L-лейцина с использованием этого микроорганизма |
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| RU2201454C2 (ru) * | 1999-07-09 | 2003-03-27 | Закрытое акционерное общество "Научно-исследовательский институт Аджиномото-Генетика" | Мутантная альфа-изопропилмалат синтаза (ipms), днк, кодирующая мутантную ipms, способ получения штамма escherichia coli, способ получения l-лейцина |
| RU2693663C1 (ru) * | 2015-08-25 | 2019-07-03 | СиДжей ЧеилДжеданг Корпорейшн | Микроорганизм, продуцирующий L-лейцин, и способ получения L-лейцина с использованием этого микроорганизма |
| WO2018124440A2 (ko) * | 2016-12-28 | 2018-07-05 | 씨제이제일제당 (주) | 신규한 이소프로필말레이트 신타제 변이체 및 이를 이용한 l-류신의 생산 방법 |
Non-Patent Citations (1)
| Title |
|---|
| NCBI Reference Sequence: WP_015439406.1, 19.05.2013. 2-isopropylmalate synthase [Corynebacterium glutamicum] Найдено онлайн: https://www.ncbi.nlm.nih.gov/protein/WP_015439406.1?report=genbank&log$=prottop&blast_rank=1&RID=8C3M29DD013 Дата обращения 13.06.2023. * |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7217250B2 (ja) | 新規なイソプロピルリンゴ酸シンターゼ変異体及びそれを用いたl-ロイシンの生産方法 | |
| JP2019088322A (ja) | フィードバック抵抗性アセトヒドロキシ酸シンターゼ変異体及びそれを用いたl−バリンの生産方法 | |
| JP2025168674A (ja) | L-リジン生産能が向上したコリネバクテリウム・グルタミカム変異株およびこれを用いたl-リジンの生産方法 | |
| KR102589135B1 (ko) | 3-메틸-2-옥소뷰타노에이트 하이드록시 메틸트랜스퍼라아제의 활성이 강화된 미생물, 및 이의 용도 | |
| KR20220003476A (ko) | 3-메틸-2-옥소뷰타노에이트 하이드록시 메틸트랜스퍼라아제의 활성이 강화된 미생물, 및 이의 용도 | |
| JP7584536B2 (ja) | 新規なポリペプチドおよびこれを利用したl-ロイシンの生産方法 | |
| JP7537014B2 (ja) | L-シトルリン生産能が向上したコリネバクテリウムグルタミクム変異株およびこれを用いたl-シトルリンの生産方法 | |
| RU2811433C1 (ru) | Новый полипептид и способ получения l-лейцина с его использованием | |
| JP7766704B2 (ja) | L-リシン生産能が向上したコリネバクテリウム・グルタミカム変異株及びそれを用いたl-リシン生産方法 | |
| JP2024544690A (ja) | L-リジン生産能が向上したコリネバクテリウム・グルタミカム変異株およびこれを用いたl-リジンの生産方法 | |
| JP7683040B2 (ja) | L-リシン生産能が向上したコリネバクテリウム・グルタミカム変異株及びそれを用いたl-リシンの生産方法 | |
| JP7683041B2 (ja) | L-リシン生産能が向上したコリネバクテリウム・グルタミカム変異株及びそれを用いたl-リシンの生産方法 | |
| JP7620123B2 (ja) | L-リシン生産能が向上したコリネバクテリウム・グルタミカム変異株及びそれを用いたl-リシン生産方法 | |
| JP7475408B2 (ja) | L-アルギニンまたはl-シトルリン生産能が向上したコリネバクテリウム属微生物およびこれを用いたl-アルギニンまたはl-シトルリンの生産方法 | |
| RU2787592C1 (ru) | Новый промотор и его применение | |
| JP2024513452A (ja) | 変異型SpoTタンパク質及びそれを用いたL-アミノ酸を生産する方法 | |
| HK1258202B (en) | Novel isopropylmalate synthase mutant and production method of l-leucine using same | |
| BR122022018007B1 (pt) | Micro-organismo do gênero corynebacterium e método de preparação, composição para produzir l-leucina e método de produção |