RU2799794C2 - АМИНОАЦИЛ-тРНК-СИНТЕТАЗА ДЛЯ ЭФФЕКТИВНОГО ВВЕДЕНИЯ ПРОИЗВОДНОГО ЛИЗИНА В БЕЛОК - Google Patents
АМИНОАЦИЛ-тРНК-СИНТЕТАЗА ДЛЯ ЭФФЕКТИВНОГО ВВЕДЕНИЯ ПРОИЗВОДНОГО ЛИЗИНА В БЕЛОК Download PDFInfo
- Publication number
- RU2799794C2 RU2799794C2 RU2021130287A RU2021130287A RU2799794C2 RU 2799794 C2 RU2799794 C2 RU 2799794C2 RU 2021130287 A RU2021130287 A RU 2021130287A RU 2021130287 A RU2021130287 A RU 2021130287A RU 2799794 C2 RU2799794 C2 RU 2799794C2
- Authority
- RU
- Russia
- Prior art keywords
- ser
- leu
- lys
- ile
- arg
- Prior art date
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 67
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 63
- 150000002668 lysine derivatives Chemical class 0.000 title claims abstract description 35
- 108010092041 Lysine-tRNA Ligase Proteins 0.000 claims abstract description 115
- 102000017737 Lysine-tRNA Ligase Human genes 0.000 claims abstract description 114
- 150000001413 amino acids Chemical group 0.000 claims abstract description 39
- 235000001014 amino acid Nutrition 0.000 claims abstract description 38
- 229940024606 amino acid Drugs 0.000 claims abstract description 36
- 230000035772 mutation Effects 0.000 claims abstract description 32
- 230000014509 gene expression Effects 0.000 claims abstract description 28
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 28
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 28
- 239000002157 polynucleotide Substances 0.000 claims abstract description 28
- 239000013598 vector Substances 0.000 claims abstract description 24
- 239000004475 Arginine Substances 0.000 claims abstract description 6
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 claims abstract description 6
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 claims abstract description 6
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 claims abstract description 6
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 claims abstract description 5
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 claims abstract description 5
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 claims abstract description 5
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 claims abstract description 5
- 239000004473 Threonine Substances 0.000 claims abstract description 5
- 235000018417 cysteine Nutrition 0.000 claims abstract description 5
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 claims abstract description 5
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 claims abstract description 5
- 229960000310 isoleucine Drugs 0.000 claims abstract description 5
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 claims abstract description 5
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 18
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 14
- 150000007523 nucleic acids Chemical group 0.000 claims description 12
- 229920001184 polypeptide Polymers 0.000 claims description 11
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 11
- 108020004705 Codon Proteins 0.000 claims description 8
- 238000003780 insertion Methods 0.000 abstract description 9
- 230000037431 insertion Effects 0.000 abstract description 9
- 230000000694 effects Effects 0.000 abstract description 4
- 239000000126 substance Substances 0.000 abstract description 3
- 210000004027 cell Anatomy 0.000 description 62
- 102200052312 rs3218773 Human genes 0.000 description 31
- 239000013612 plasmid Substances 0.000 description 30
- 125000003275 alpha amino acid group Chemical group 0.000 description 29
- 235000018102 proteins Nutrition 0.000 description 29
- 108020004566 Transfer RNA Proteins 0.000 description 27
- 238000000034 method Methods 0.000 description 26
- 241000880493 Leptailurus serval Species 0.000 description 24
- 108010013835 arginine glutamate Proteins 0.000 description 24
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 22
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 18
- HYSVGEAWTGPMOA-IHRRRGAJSA-N Lys-Pro-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O HYSVGEAWTGPMOA-IHRRRGAJSA-N 0.000 description 16
- 108010021466 Mutant Proteins Proteins 0.000 description 16
- 102000008300 Mutant Proteins Human genes 0.000 description 16
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 16
- BRKHVZNDAOMAHX-BIIVOSGPSA-N Ser-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N BRKHVZNDAOMAHX-BIIVOSGPSA-N 0.000 description 16
- JGUWRQWULDWNCM-FXQIFTODSA-N Ser-Val-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O JGUWRQWULDWNCM-FXQIFTODSA-N 0.000 description 16
- 108010077515 glycylproline Proteins 0.000 description 16
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 16
- 239000013604 expression vector Substances 0.000 description 15
- 241000588724 Escherichia coli Species 0.000 description 14
- 108020001507 fusion proteins Proteins 0.000 description 14
- 239000002609 medium Substances 0.000 description 14
- 102000052866 Amino Acyl-tRNA Synthetases Human genes 0.000 description 13
- 108700028939 Amino Acyl-tRNA Synthetases Proteins 0.000 description 13
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 13
- 239000012634 fragment Substances 0.000 description 13
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 12
- 102000037865 fusion proteins Human genes 0.000 description 12
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 11
- 108020004414 DNA Proteins 0.000 description 11
- 239000004472 Lysine Substances 0.000 description 11
- 239000001888 Peptone Substances 0.000 description 10
- 108010080698 Peptones Proteins 0.000 description 10
- -1 alkynyloxycarbonyl lysine derivative Chemical class 0.000 description 10
- 230000003834 intracellular effect Effects 0.000 description 10
- 235000019319 peptone Nutrition 0.000 description 10
- 102000004190 Enzymes Human genes 0.000 description 9
- 108090000790 Enzymes Proteins 0.000 description 9
- MLADEWAIYAPAAU-IHRRRGAJSA-N Val-Lys-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N MLADEWAIYAPAAU-IHRRRGAJSA-N 0.000 description 9
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 8
- QHASENCZLDHBGX-ONGXEEELSA-N Ala-Gly-Phe Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QHASENCZLDHBGX-ONGXEEELSA-N 0.000 description 8
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 8
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 8
- FFZJHQODAYHGPO-KZVJFYERSA-N Ala-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N FFZJHQODAYHGPO-KZVJFYERSA-N 0.000 description 8
- DBKNLHKEVPZVQC-LPEHRKFASA-N Arg-Ala-Pro Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O DBKNLHKEVPZVQC-LPEHRKFASA-N 0.000 description 8
- HJAICMSAKODKRF-GUBZILKMSA-N Arg-Cys-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O HJAICMSAKODKRF-GUBZILKMSA-N 0.000 description 8
- RKRSYHCNPFGMTA-CIUDSAMLSA-N Arg-Glu-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O RKRSYHCNPFGMTA-CIUDSAMLSA-N 0.000 description 8
- HAVKMRGWNXMCDR-STQMWFEESA-N Arg-Gly-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HAVKMRGWNXMCDR-STQMWFEESA-N 0.000 description 8
- CVXXSWQORBZAAA-SRVKXCTJSA-N Arg-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N CVXXSWQORBZAAA-SRVKXCTJSA-N 0.000 description 8
- JJIBHAOBNIFUEL-SRVKXCTJSA-N Arg-Pro-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCCN=C(N)N)N JJIBHAOBNIFUEL-SRVKXCTJSA-N 0.000 description 8
- JOTRDIXZHNQYGP-DCAQKATOSA-N Arg-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N JOTRDIXZHNQYGP-DCAQKATOSA-N 0.000 description 8
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 8
- ASQKVGRCKOFKIU-KZVJFYERSA-N Arg-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ASQKVGRCKOFKIU-KZVJFYERSA-N 0.000 description 8
- DDBMKOCQWNFDBH-RHYQMDGZSA-N Arg-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O DDBMKOCQWNFDBH-RHYQMDGZSA-N 0.000 description 8
- KXFCBAHYSLJCCY-ZLUOBGJFSA-N Asn-Asn-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O KXFCBAHYSLJCCY-ZLUOBGJFSA-N 0.000 description 8
- HCAUEJAQCXVQQM-ACZMJKKPSA-N Asn-Glu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HCAUEJAQCXVQQM-ACZMJKKPSA-N 0.000 description 8
- ACKNRKFVYUVWAC-ZPFDUUQYSA-N Asn-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ACKNRKFVYUVWAC-ZPFDUUQYSA-N 0.000 description 8
- NJSNXIOKBHPFMB-GMOBBJLQSA-N Asn-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)N)N NJSNXIOKBHPFMB-GMOBBJLQSA-N 0.000 description 8
- JBDLMLZNDRLDIX-HJGDQZAQSA-N Asn-Thr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O JBDLMLZNDRLDIX-HJGDQZAQSA-N 0.000 description 8
- DATSKXOXPUAOLK-KKUMJFAQSA-N Asn-Tyr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DATSKXOXPUAOLK-KKUMJFAQSA-N 0.000 description 8
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 8
- QRULNKJGYQQZMW-ZLUOBGJFSA-N Asp-Asn-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QRULNKJGYQQZMW-ZLUOBGJFSA-N 0.000 description 8
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 8
- XWSIYTYNLKCLJB-CIUDSAMLSA-N Asp-Lys-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O XWSIYTYNLKCLJB-CIUDSAMLSA-N 0.000 description 8
- LTCKTLYKRMCFOC-KKUMJFAQSA-N Asp-Phe-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LTCKTLYKRMCFOC-KKUMJFAQSA-N 0.000 description 8
- JUWISGAGWSDGDH-KKUMJFAQSA-N Asp-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=CC=C1 JUWISGAGWSDGDH-KKUMJFAQSA-N 0.000 description 8
- GUKYYUFHWYRMEU-WHFBIAKZSA-N Cys-Gly-Asp Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O GUKYYUFHWYRMEU-WHFBIAKZSA-N 0.000 description 8
- RWVBNRYBHAGYSG-GUBZILKMSA-N Cys-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CS)N RWVBNRYBHAGYSG-GUBZILKMSA-N 0.000 description 8
- NNQHEEQNPQYPGL-FXQIFTODSA-N Gln-Ala-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O NNQHEEQNPQYPGL-FXQIFTODSA-N 0.000 description 8
- BJPPYOMRAVLXBY-YUMQZZPRSA-N Gln-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N BJPPYOMRAVLXBY-YUMQZZPRSA-N 0.000 description 8
- ARYKRXHBIPLULY-XKBZYTNZSA-N Gln-Thr-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ARYKRXHBIPLULY-XKBZYTNZSA-N 0.000 description 8
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 8
- CGYDXNKRIMJMLV-GUBZILKMSA-N Glu-Arg-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O CGYDXNKRIMJMLV-GUBZILKMSA-N 0.000 description 8
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 8
- ILGFBUGLBSAQQB-GUBZILKMSA-N Glu-Glu-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ILGFBUGLBSAQQB-GUBZILKMSA-N 0.000 description 8
- YLJHCWNDBKKOEB-IHRRRGAJSA-N Glu-Glu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YLJHCWNDBKKOEB-IHRRRGAJSA-N 0.000 description 8
- DVLZZEPUNFEUBW-AVGNSLFASA-N Glu-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N DVLZZEPUNFEUBW-AVGNSLFASA-N 0.000 description 8
- ITBHUUMCJJQUSC-LAEOZQHASA-N Glu-Ile-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O ITBHUUMCJJQUSC-LAEOZQHASA-N 0.000 description 8
- IRXNJYPKBVERCW-DCAQKATOSA-N Glu-Leu-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IRXNJYPKBVERCW-DCAQKATOSA-N 0.000 description 8
- ZQYZDDXTNQXUJH-CIUDSAMLSA-N Glu-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(=O)O)N ZQYZDDXTNQXUJH-CIUDSAMLSA-N 0.000 description 8
- ZTNHPMZHAILHRB-JSGCOSHPSA-N Glu-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)NCC(O)=O)=CNC2=C1 ZTNHPMZHAILHRB-JSGCOSHPSA-N 0.000 description 8
- VIPDPMHGICREIS-GVXVVHGQSA-N Glu-Val-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VIPDPMHGICREIS-GVXVVHGQSA-N 0.000 description 8
- FMNHBTKMRFVGRO-FOHZUACHSA-N Gly-Asn-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CN FMNHBTKMRFVGRO-FOHZUACHSA-N 0.000 description 8
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 8
- PMNHJLASAAWELO-FOHZUACHSA-N Gly-Asp-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PMNHJLASAAWELO-FOHZUACHSA-N 0.000 description 8
- VNBNZUAPOYGRDB-ZDLURKLDSA-N Gly-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)CN)O VNBNZUAPOYGRDB-ZDLURKLDSA-N 0.000 description 8
- HAXARWKYFIIHKD-ZKWXMUAHSA-N Gly-Ile-Ser Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HAXARWKYFIIHKD-ZKWXMUAHSA-N 0.000 description 8
- ULZCYBYDTUMHNF-IUCAKERBSA-N Gly-Leu-Glu Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ULZCYBYDTUMHNF-IUCAKERBSA-N 0.000 description 8
- MHXKHKWHPNETGG-QWRGUYRKSA-N Gly-Lys-Leu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O MHXKHKWHPNETGG-QWRGUYRKSA-N 0.000 description 8
- AKAPKBNIVNPIPO-KKUMJFAQSA-N His-His-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1NC=NC=1)C1=CN=CN1 AKAPKBNIVNPIPO-KKUMJFAQSA-N 0.000 description 8
- AIPUZFXMXAHZKY-QWRGUYRKSA-N His-Leu-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AIPUZFXMXAHZKY-QWRGUYRKSA-N 0.000 description 8
- TWROVBNEHJSXDG-IHRRRGAJSA-N His-Leu-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O TWROVBNEHJSXDG-IHRRRGAJSA-N 0.000 description 8
- QSPLUJGYOPZINY-ZPFDUUQYSA-N Ile-Asp-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QSPLUJGYOPZINY-ZPFDUUQYSA-N 0.000 description 8
- HGNUKGZQASSBKQ-PCBIJLKTSA-N Ile-Asp-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N HGNUKGZQASSBKQ-PCBIJLKTSA-N 0.000 description 8
- JDAWAWXGAUZPNJ-ZPFDUUQYSA-N Ile-Glu-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N JDAWAWXGAUZPNJ-ZPFDUUQYSA-N 0.000 description 8
- YBGTWSFIGHUWQE-MXAVVETBSA-N Ile-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CN=CN1 YBGTWSFIGHUWQE-MXAVVETBSA-N 0.000 description 8
- AXNGDPAKKCEKGY-QPHKQPEJSA-N Ile-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N AXNGDPAKKCEKGY-QPHKQPEJSA-N 0.000 description 8
- GAZGFPOZOLEYAJ-YTFOTSKYSA-N Ile-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N GAZGFPOZOLEYAJ-YTFOTSKYSA-N 0.000 description 8
- MLSUZXHSNRBDCI-CYDGBPFRSA-N Ile-Pro-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)O)N MLSUZXHSNRBDCI-CYDGBPFRSA-N 0.000 description 8
- YKZAMJXNJUWFIK-JBDRJPRFSA-N Ile-Ser-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(=O)O)N YKZAMJXNJUWFIK-JBDRJPRFSA-N 0.000 description 8
- PZWBBXHHUSIGKH-OSUNSFLBSA-N Ile-Thr-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PZWBBXHHUSIGKH-OSUNSFLBSA-N 0.000 description 8
- DTPGSUQHUMELQB-GVARAGBVSA-N Ile-Tyr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 DTPGSUQHUMELQB-GVARAGBVSA-N 0.000 description 8
- REXAUQBGSGDEJY-IGISWZIWSA-N Ile-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N REXAUQBGSGDEJY-IGISWZIWSA-N 0.000 description 8
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 8
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 8
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 8
- WGNOPSQMIQERPK-GARJFASQSA-N Leu-Asn-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N WGNOPSQMIQERPK-GARJFASQSA-N 0.000 description 8
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 8
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 8
- QCSFMCFHVGTLFF-NHCYSSNCSA-N Leu-Asp-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O QCSFMCFHVGTLFF-NHCYSSNCSA-N 0.000 description 8
- KAFOIVJDVSZUMD-DCAQKATOSA-N Leu-Gln-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-DCAQKATOSA-N 0.000 description 8
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 8
- HPBCTWSUJOGJSH-MNXVOIDGSA-N Leu-Glu-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HPBCTWSUJOGJSH-MNXVOIDGSA-N 0.000 description 8
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 8
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 8
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 8
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 8
- WQWZXKWOEVSGQM-DCAQKATOSA-N Lys-Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN WQWZXKWOEVSGQM-DCAQKATOSA-N 0.000 description 8
- OVIVOCSURJYCTM-GUBZILKMSA-N Lys-Asp-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O OVIVOCSURJYCTM-GUBZILKMSA-N 0.000 description 8
- KEPWSUPUFAPBRF-DKIMLUQUSA-N Lys-Ile-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KEPWSUPUFAPBRF-DKIMLUQUSA-N 0.000 description 8
- WAIHHELKYSFIQN-XUXIUFHCSA-N Lys-Ile-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O WAIHHELKYSFIQN-XUXIUFHCSA-N 0.000 description 8
- ALGGDNMLQNFVIZ-SRVKXCTJSA-N Lys-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ALGGDNMLQNFVIZ-SRVKXCTJSA-N 0.000 description 8
- LNMKRJJLEFASGA-BZSNNMDCSA-N Lys-Phe-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LNMKRJJLEFASGA-BZSNNMDCSA-N 0.000 description 8
- WZVSHTFTCYOFPL-GARJFASQSA-N Lys-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCCCN)N)C(=O)O WZVSHTFTCYOFPL-GARJFASQSA-N 0.000 description 8
- WGBMNLCRYKSWAR-DCAQKATOSA-N Met-Asp-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN WGBMNLCRYKSWAR-DCAQKATOSA-N 0.000 description 8
- SLQDSYZHHOKQSR-QXEWZRGKSA-N Met-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCSC SLQDSYZHHOKQSR-QXEWZRGKSA-N 0.000 description 8
- WXJXYMFUTRXRGO-UWVGGRQHSA-N Met-His-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CNC=N1 WXJXYMFUTRXRGO-UWVGGRQHSA-N 0.000 description 8
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 8
- 108010079364 N-glycylalanine Proteins 0.000 description 8
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 8
- LJUUGSWZPQOJKD-JYJNAYRXSA-N Phe-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O LJUUGSWZPQOJKD-JYJNAYRXSA-N 0.000 description 8
- LXUJDHOKVUYHRC-KKUMJFAQSA-N Phe-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CC=CC=C1)N LXUJDHOKVUYHRC-KKUMJFAQSA-N 0.000 description 8
- GRVMHFCZUIYNKQ-UFYCRDLUSA-N Phe-Phe-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O GRVMHFCZUIYNKQ-UFYCRDLUSA-N 0.000 description 8
- YKQNVTOIYFQMLW-IHRRRGAJSA-N Pro-Cys-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 YKQNVTOIYFQMLW-IHRRRGAJSA-N 0.000 description 8
- FKVNLUZHSFCNGY-RVMXOQNASA-N Pro-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 FKVNLUZHSFCNGY-RVMXOQNASA-N 0.000 description 8
- HFNPOYOKIPGAEI-SRVKXCTJSA-N Pro-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 HFNPOYOKIPGAEI-SRVKXCTJSA-N 0.000 description 8
- MHHQQZIFLWFZGR-DCAQKATOSA-N Pro-Lys-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O MHHQQZIFLWFZGR-DCAQKATOSA-N 0.000 description 8
- LGMBKOAPPTYKLC-JYJNAYRXSA-N Pro-Phe-Arg Chemical compound C([C@@H](C(=O)N[C@@H](CCCNC(=N)N)C(O)=O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 LGMBKOAPPTYKLC-JYJNAYRXSA-N 0.000 description 8
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 8
- NLQUOHDCLSFABG-GUBZILKMSA-N Ser-Arg-Arg Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NLQUOHDCLSFABG-GUBZILKMSA-N 0.000 description 8
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 8
- KJMOINFQVCCSDX-XKBZYTNZSA-N Ser-Gln-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KJMOINFQVCCSDX-XKBZYTNZSA-N 0.000 description 8
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 8
- WSTIOCFMWXNOCX-YUMQZZPRSA-N Ser-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N WSTIOCFMWXNOCX-YUMQZZPRSA-N 0.000 description 8
- KCNSGAMPBPYUAI-CIUDSAMLSA-N Ser-Leu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KCNSGAMPBPYUAI-CIUDSAMLSA-N 0.000 description 8
- BYCVMHKULKRVPV-GUBZILKMSA-N Ser-Lys-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O BYCVMHKULKRVPV-GUBZILKMSA-N 0.000 description 8
- WGDYNRCOQRERLZ-KKUMJFAQSA-N Ser-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N WGDYNRCOQRERLZ-KKUMJFAQSA-N 0.000 description 8
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 8
- JCLAFVNDBJMLBC-JBDRJPRFSA-N Ser-Ser-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JCLAFVNDBJMLBC-JBDRJPRFSA-N 0.000 description 8
- SZRNDHWMVSFPSP-XKBZYTNZSA-N Ser-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N)O SZRNDHWMVSFPSP-XKBZYTNZSA-N 0.000 description 8
- DWYAUVCQDTZIJI-VZFHVOOUSA-N Thr-Ala-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DWYAUVCQDTZIJI-VZFHVOOUSA-N 0.000 description 8
- SKHPKKYKDYULDH-HJGDQZAQSA-N Thr-Asn-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SKHPKKYKDYULDH-HJGDQZAQSA-N 0.000 description 8
- YAAPRMFURSENOZ-KATARQTJSA-N Thr-Cys-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N)O YAAPRMFURSENOZ-KATARQTJSA-N 0.000 description 8
- LHEZGZQRLDBSRR-WDCWCFNPSA-N Thr-Glu-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LHEZGZQRLDBSRR-WDCWCFNPSA-N 0.000 description 8
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 8
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 8
- KBBRNEDOYWMIJP-KYNKHSRBSA-N Thr-Gly-Thr Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KBBRNEDOYWMIJP-KYNKHSRBSA-N 0.000 description 8
- KRDSCBLRHORMRK-JXUBOQSCSA-N Thr-Lys-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O KRDSCBLRHORMRK-JXUBOQSCSA-N 0.000 description 8
- XNTVWRJTUIOGQO-RHYQMDGZSA-N Thr-Met-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O XNTVWRJTUIOGQO-RHYQMDGZSA-N 0.000 description 8
- NQQMWWVVGIXUOX-SVSWQMSJSA-N Thr-Ser-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NQQMWWVVGIXUOX-SVSWQMSJSA-N 0.000 description 8
- XZUBGOYOGDRYFC-XGEHTFHBSA-N Thr-Ser-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O XZUBGOYOGDRYFC-XGEHTFHBSA-N 0.000 description 8
- KIMOCKLJBXHFIN-YLVFBTJISA-N Trp-Ile-Gly Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O)=CNC2=C1 KIMOCKLJBXHFIN-YLVFBTJISA-N 0.000 description 8
- GFZQWWDXJVGEMW-ULQDDVLXSA-N Tyr-Arg-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O GFZQWWDXJVGEMW-ULQDDVLXSA-N 0.000 description 8
- GZWPQZDVTBZVEP-BZSNNMDCSA-N Tyr-Tyr-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O GZWPQZDVTBZVEP-BZSNNMDCSA-N 0.000 description 8
- CFSSLXZJEMERJY-NRPADANISA-N Val-Gln-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CFSSLXZJEMERJY-NRPADANISA-N 0.000 description 8
- VPGCVZRRBYOGCD-AVGNSLFASA-N Val-Lys-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O VPGCVZRRBYOGCD-AVGNSLFASA-N 0.000 description 8
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 8
- LTTQCQRTSHJPPL-ZKWXMUAHSA-N Val-Ser-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N LTTQCQRTSHJPPL-ZKWXMUAHSA-N 0.000 description 8
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 8
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 8
- 108010005233 alanylglutamic acid Proteins 0.000 description 8
- 108010044940 alanylglutamine Proteins 0.000 description 8
- 108010038633 aspartylglutamate Proteins 0.000 description 8
- 229940041514 candida albicans extract Drugs 0.000 description 8
- 210000003527 eukaryotic cell Anatomy 0.000 description 8
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 8
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 8
- 108010050848 glycylleucine Proteins 0.000 description 8
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 8
- 108010054155 lysyllysine Proteins 0.000 description 8
- 108010012581 phenylalanylglutamate Proteins 0.000 description 8
- 239000000843 powder Substances 0.000 description 8
- 108010090894 prolylleucine Proteins 0.000 description 8
- 108010005652 splenotritin Proteins 0.000 description 8
- 108010073969 valyllysine Proteins 0.000 description 8
- 239000012138 yeast extract Substances 0.000 description 8
- BSBNNPICFPXDNH-SRVKXCTJSA-N Asn-Phe-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N BSBNNPICFPXDNH-SRVKXCTJSA-N 0.000 description 7
- VAZZOGXDUQSVQF-NUMRIWBASA-N Glu-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)O VAZZOGXDUQSVQF-NUMRIWBASA-N 0.000 description 7
- XDUVMJCBYUKNFJ-MXAVVETBSA-N Ile-Lys-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N XDUVMJCBYUKNFJ-MXAVVETBSA-N 0.000 description 7
- 108090001061 Insulin Proteins 0.000 description 7
- 102000004877 Insulin Human genes 0.000 description 7
- VQBCMLMPEWPUTB-ACZMJKKPSA-N Ser-Glu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VQBCMLMPEWPUTB-ACZMJKKPSA-N 0.000 description 7
- 125000000539 amino acid group Chemical group 0.000 description 7
- 229960005091 chloramphenicol Drugs 0.000 description 7
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 229940125396 insulin Drugs 0.000 description 7
- 238000003752 polymerase chain reaction Methods 0.000 description 7
- 101710123256 Pyrrolysine-tRNA ligase Proteins 0.000 description 6
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 6
- 238000004587 chromatography analysis Methods 0.000 description 6
- 229930027917 kanamycin Natural products 0.000 description 6
- 229960000318 kanamycin Drugs 0.000 description 6
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 6
- 229930182823 kanamycin A Natural products 0.000 description 6
- 239000007788 liquid Substances 0.000 description 6
- 239000002773 nucleotide Substances 0.000 description 6
- 125000003729 nucleotide group Chemical group 0.000 description 6
- 102220273027 rs1555734913 Human genes 0.000 description 6
- 239000011780 sodium chloride Substances 0.000 description 6
- 238000006467 substitution reaction Methods 0.000 description 6
- DQUHYEDEGRNAFO-QMMMGPOBSA-N (2s)-6-amino-2-[(2-methylpropan-2-yl)oxycarbonylamino]hexanoic acid Chemical class CC(C)(C)OC(=O)N[C@H](C(O)=O)CCCCN DQUHYEDEGRNAFO-QMMMGPOBSA-N 0.000 description 5
- GOWZVQXTHUCNSQ-NHCYSSNCSA-N Arg-Glu-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GOWZVQXTHUCNSQ-NHCYSSNCSA-N 0.000 description 5
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 5
- LHXFNWBNRBWMNV-DCAQKATOSA-N Met-Ser-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N LHXFNWBNRBWMNV-DCAQKATOSA-N 0.000 description 5
- 241000205274 Methanosarcina mazei Species 0.000 description 5
- 238000005119 centrifugation Methods 0.000 description 5
- 238000012258 culturing Methods 0.000 description 5
- 239000003623 enhancer Substances 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 210000001236 prokaryotic cell Anatomy 0.000 description 5
- 241000894006 Bacteria Species 0.000 description 4
- 102000003670 Carboxypeptidase B Human genes 0.000 description 4
- 108090000087 Carboxypeptidase B Proteins 0.000 description 4
- 241000196324 Embryophyta Species 0.000 description 4
- 101000976075 Homo sapiens Insulin Proteins 0.000 description 4
- 102000004142 Trypsin Human genes 0.000 description 4
- 108090000631 Trypsin Proteins 0.000 description 4
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 4
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 4
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 4
- 235000011130 ammonium sulphate Nutrition 0.000 description 4
- 239000002299 complementary DNA Substances 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 4
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- 238000001962 electrophoresis Methods 0.000 description 4
- 238000006047 enzymatic hydrolysis reaction Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 238000000855 fermentation Methods 0.000 description 4
- 230000004151 fermentation Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 125000000524 functional group Chemical group 0.000 description 4
- PBGKTOXHQIOBKM-FHFVDXKLSA-N insulin (human) Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H]1CSSC[C@H]2C(=O)N[C@H](C(=O)N[C@@H](CO)C(=O)N[C@H](C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3C=CC(O)=CC=3)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3NC=NC=3)NC(=O)[C@H](CO)NC(=O)CNC1=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O)=O)CSSC[C@@H](C(N2)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)[C@@H](C)CC)[C@@H](C)O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(C)C)C1=CN=CN1 PBGKTOXHQIOBKM-FHFVDXKLSA-N 0.000 description 4
- 238000001840 matrix-assisted laser desorption--ionisation time-of-flight mass spectrometry Methods 0.000 description 4
- 229920002401 polyacrylamide Polymers 0.000 description 4
- 239000000758 substrate Substances 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- 230000014616 translation Effects 0.000 description 4
- 239000012588 trypsin Substances 0.000 description 4
- 229920001817 Agar Polymers 0.000 description 3
- 102220555324 Caspase-4_H29K_mutation Human genes 0.000 description 3
- STWGDDDFLUFCCA-GVXVVHGQSA-N His-Glu-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O STWGDDDFLUFCCA-GVXVVHGQSA-N 0.000 description 3
- 239000006142 Luria-Bertani Agar Substances 0.000 description 3
- XPVCDCMPKCERFT-GUBZILKMSA-N Met-Ser-Arg Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XPVCDCMPKCERFT-GUBZILKMSA-N 0.000 description 3
- 108700026244 Open Reading Frames Proteins 0.000 description 3
- 238000012408 PCR amplification Methods 0.000 description 3
- 108020004511 Recombinant DNA Proteins 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- 241000700605 Viruses Species 0.000 description 3
- 239000008272 agar Substances 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 230000013595 glycosylation Effects 0.000 description 3
- 238000006206 glycosylation reaction Methods 0.000 description 3
- 108010028295 histidylhistidine Proteins 0.000 description 3
- 238000009396 hybridization Methods 0.000 description 3
- 230000002209 hydrophobic effect Effects 0.000 description 3
- 230000006698 induction Effects 0.000 description 3
- 210000004962 mammalian cell Anatomy 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 239000002243 precursor Substances 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 238000003259 recombinant expression Methods 0.000 description 3
- 238000005215 recombination Methods 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 102200006436 rs17183814 Human genes 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- 241000203069 Archaea Species 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 2
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 2
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 2
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 2
- SRBFZHDQGSBBOR-HWQSCIPKSA-N L-arabinopyranose Chemical compound O[C@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-HWQSCIPKSA-N 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- 241000205284 Methanosarcina acetivorans Species 0.000 description 2
- 108090000445 Parathyroid hormone Proteins 0.000 description 2
- 102000003982 Parathyroid hormone Human genes 0.000 description 2
- 102000035195 Peptidases Human genes 0.000 description 2
- 108091005804 Peptidases Proteins 0.000 description 2
- 101710146427 Probable tyrosine-tRNA ligase, cytoplasmic Proteins 0.000 description 2
- 239000004365 Protease Substances 0.000 description 2
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 2
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 2
- 108700025695 Suppressor Genes Proteins 0.000 description 2
- 108020005038 Terminator Codon Proteins 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- 102000018378 Tyrosine-tRNA ligase Human genes 0.000 description 2
- 101710107268 Tyrosine-tRNA ligase, mitochondrial Proteins 0.000 description 2
- 238000007792 addition Methods 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 2
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 239000004202 carbamide Substances 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 239000012141 concentrate Substances 0.000 description 2
- 239000013530 defoamer Substances 0.000 description 2
- 235000014113 dietary fatty acids Nutrition 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- ZPWVASYFFYYZEW-UHFFFAOYSA-L dipotassium hydrogen phosphate Chemical compound [K+].[K+].OP([O-])([O-])=O ZPWVASYFFYYZEW-UHFFFAOYSA-L 0.000 description 2
- 229910000396 dipotassium phosphate Inorganic materials 0.000 description 2
- 235000019797 dipotassium phosphate Nutrition 0.000 description 2
- BNIILDVGGAEEIG-UHFFFAOYSA-L disodium hydrogen phosphate Chemical compound [Na+].[Na+].OP([O-])([O-])=O BNIILDVGGAEEIG-UHFFFAOYSA-L 0.000 description 2
- 229910000397 disodium phosphate Inorganic materials 0.000 description 2
- 235000019800 disodium phosphate Nutrition 0.000 description 2
- 238000004090 dissolution Methods 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 238000010828 elution Methods 0.000 description 2
- 230000007071 enzymatic hydrolysis Effects 0.000 description 2
- DNJIEGIFACGWOD-UHFFFAOYSA-N ethyl mercaptane Natural products CCS DNJIEGIFACGWOD-UHFFFAOYSA-N 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 229930195729 fatty acid Natural products 0.000 description 2
- 239000000194 fatty acid Substances 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 239000005090 green fluorescent protein Substances 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 239000004026 insulin derivative Substances 0.000 description 2
- 238000004811 liquid chromatography Methods 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 238000005374 membrane filtration Methods 0.000 description 2
- 230000000696 methanogenic effect Effects 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 102000039446 nucleic acids Human genes 0.000 description 2
- 108020004707 nucleic acids Proteins 0.000 description 2
- 235000015097 nutrients Nutrition 0.000 description 2
- 229960001319 parathyroid hormone Drugs 0.000 description 2
- 239000000199 parathyroid hormone Substances 0.000 description 2
- 239000008188 pellet Substances 0.000 description 2
- LWIHDJKSTIGBAC-UHFFFAOYSA-K potassium phosphate Substances [K+].[K+].[K+].[O-]P([O-])([O-])=O LWIHDJKSTIGBAC-UHFFFAOYSA-K 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 239000003488 releasing hormone Substances 0.000 description 2
- 238000004007 reversed phase HPLC Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000003248 secreting effect Effects 0.000 description 2
- 239000001488 sodium phosphate Substances 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 239000007858 starting material Substances 0.000 description 2
- 238000001308 synthesis method Methods 0.000 description 2
- 241000701161 unidentified adenovirus Species 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 210000005253 yeast cell Anatomy 0.000 description 2
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 2
- UVAJCDOUVGWEFK-UHFFFAOYSA-N 1-methyl-2,3-dihydropyrrole Chemical group CN1CCC=C1 UVAJCDOUVGWEFK-UHFFFAOYSA-N 0.000 description 1
- NOIIUHRQUVNIDD-UHFFFAOYSA-N 3-[[oxo(pyridin-4-yl)methyl]hydrazo]-N-(phenylmethyl)propanamide Chemical compound C=1C=CC=CC=1CNC(=O)CCNNC(=O)C1=CC=NC=C1 NOIIUHRQUVNIDD-UHFFFAOYSA-N 0.000 description 1
- 239000000275 Adrenocorticotropic Hormone Substances 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- YXVAESUIQFDBHN-SRVKXCTJSA-N Asn-Phe-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O YXVAESUIQFDBHN-SRVKXCTJSA-N 0.000 description 1
- 108010079882 Bax protein (53-86) Proteins 0.000 description 1
- 102000055006 Calcitonin Human genes 0.000 description 1
- 108060001064 Calcitonin Proteins 0.000 description 1
- 102400000739 Corticotropin Human genes 0.000 description 1
- 101800000414 Corticotropin Proteins 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 230000033616 DNA repair Effects 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 108010000437 Deamino Arginine Vasopressin Proteins 0.000 description 1
- GJKXGJCSJWBJEZ-XRSSZCMZSA-N Deslorelin Chemical compound CCNC(=O)[C@@H]1CCCN1C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H]1NC(=O)CC1)CC1=CNC2=CC=CC=C12 GJKXGJCSJWBJEZ-XRSSZCMZSA-N 0.000 description 1
- 108700034637 EC 3.2.-.- Proteins 0.000 description 1
- 241000701959 Escherichia virus Lambda Species 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 108010011459 Exenatide Proteins 0.000 description 1
- HTQBXNHDCUEHJF-XWLPCZSASA-N Exenatide Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(=O)NCC(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CO)C(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=CC=C1 HTQBXNHDCUEHJF-XWLPCZSASA-N 0.000 description 1
- 229920001917 Ficoll Polymers 0.000 description 1
- 108700012941 GNRH1 Proteins 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- RDDSZZJOKDVPAE-ACZMJKKPSA-N Glu-Asn-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDDSZZJOKDVPAE-ACZMJKKPSA-N 0.000 description 1
- 102000051325 Glucagon Human genes 0.000 description 1
- 108060003199 Glucagon Proteins 0.000 description 1
- 108010088406 Glucagon-Like Peptides Proteins 0.000 description 1
- 102000051366 Glycosyltransferases Human genes 0.000 description 1
- 108700023372 Glycosyltransferases Proteins 0.000 description 1
- 239000000579 Gonadotropin-Releasing Hormone Substances 0.000 description 1
- 102000018997 Growth Hormone Human genes 0.000 description 1
- 108010051696 Growth Hormone Proteins 0.000 description 1
- 239000000095 Growth Hormone-Releasing Hormone Substances 0.000 description 1
- 101000825742 Homo sapiens Somatoliberin Proteins 0.000 description 1
- 108010057186 Insulin Glargine Proteins 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- COCFEDIXXNGUNL-RFKWWTKHSA-N Insulin glargine Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H]1CSSC[C@H]2C(=O)N[C@H](C(=O)N[C@@H](CO)C(=O)N[C@H](C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3C=CC(O)=CC=3)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3NC=NC=3)NC(=O)[C@H](CO)NC(=O)CNC1=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C(=O)NCC(O)=O)=O)CSSC[C@@H](C(N2)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)[C@@H](C)CC)[C@@H](C)O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(C)C)C1=CN=CN1 COCFEDIXXNGUNL-RFKWWTKHSA-N 0.000 description 1
- 108010070716 Intercellular Signaling Peptides and Proteins Proteins 0.000 description 1
- 102000005755 Intercellular Signaling Peptides and Proteins Human genes 0.000 description 1
- 102000014150 Interferons Human genes 0.000 description 1
- 108010050904 Interferons Proteins 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- ZFOMKMMPBOQKMC-KXUCPTDWSA-N L-pyrrolysine Chemical compound C[C@@H]1CC=N[C@H]1C(=O)NCCCC[C@H]([NH3+])C([O-])=O ZFOMKMMPBOQKMC-KXUCPTDWSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 108010000817 Leuprolide Proteins 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- YSDQQAXHVYUZIW-QCIJIYAXSA-N Liraglutide Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCNC(=O)CC[C@H](NC(=O)CCCCCCCCCCCCCCC)C(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=C(O)C=C1 YSDQQAXHVYUZIW-QCIJIYAXSA-N 0.000 description 1
- 108010019598 Liraglutide Proteins 0.000 description 1
- 102100035529 Lysine-tRNA ligase Human genes 0.000 description 1
- 241000205276 Methanosarcina Species 0.000 description 1
- 241000205275 Methanosarcina barkeri Species 0.000 description 1
- 101710118186 Neomycin resistance protein Proteins 0.000 description 1
- BZQFBWGGLXLEPQ-UHFFFAOYSA-N O-phosphoryl-L-serine Natural products OC(=O)C(N)COP(O)(O)=O BZQFBWGGLXLEPQ-UHFFFAOYSA-N 0.000 description 1
- 244000131316 Panax pseudoginseng Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 241000293869 Salmonella enterica subsp. enterica serovar Typhimurium Species 0.000 description 1
- 108010086019 Secretin Proteins 0.000 description 1
- 102100037505 Secretin Human genes 0.000 description 1
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 1
- 102100022831 Somatoliberin Human genes 0.000 description 1
- 108010056088 Somatostatin Proteins 0.000 description 1
- 102000005157 Somatostatin Human genes 0.000 description 1
- 241000187747 Streptomyces Species 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- 108010022394 Threonine synthase Proteins 0.000 description 1
- 102000006601 Thymidine Kinase Human genes 0.000 description 1
- 108020004440 Thymidine kinase Proteins 0.000 description 1
- 108010050144 Triptorelin Pamoate Proteins 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 102000055135 Vasoactive Intestinal Peptide Human genes 0.000 description 1
- 108010003205 Vasoactive Intestinal Peptide Proteins 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 238000005377 adsorption chromatography Methods 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 230000003698 anagen phase Effects 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 108010055460 bivalirudin Proteins 0.000 description 1
- 229960001500 bivalirudin Drugs 0.000 description 1
- OIRCOABEOLEUMC-GEJPAHFPSA-N bivalirudin Chemical compound C([C@@H](C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@H](CC(N)=O)NC(=O)CNC(=O)CNC(=O)CNC(=O)CNC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 OIRCOABEOLEUMC-GEJPAHFPSA-N 0.000 description 1
- 229960004015 calcitonin Drugs 0.000 description 1
- BBBFJLBPOGFECG-VJVYQDLKSA-N calcitonin Chemical compound N([C@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(N)=O)C(C)C)C(=O)[C@@H]1CSSC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1 BBBFJLBPOGFECG-VJVYQDLKSA-N 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 244000309466 calf Species 0.000 description 1
- 230000021523 carboxylation Effects 0.000 description 1
- 238000006473 carboxylation reaction Methods 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000001311 chemical methods and process Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000000975 co-precipitation Methods 0.000 description 1
- 229960000765 corticorelin Drugs 0.000 description 1
- IDLFZVILOHSSID-OVLDLUHVSA-N corticotropin Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](C(C)C)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)NC(=O)[C@@H](N)CO)C1=CC=C(O)C=C1 IDLFZVILOHSSID-OVLDLUHVSA-N 0.000 description 1
- 229960000258 corticotropin Drugs 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000008021 deposition Effects 0.000 description 1
- 238000010511 deprotection reaction Methods 0.000 description 1
- 108700025485 deslorelin Proteins 0.000 description 1
- 229960005408 deslorelin Drugs 0.000 description 1
- NFLWUMRGJYTJIN-NXBWRCJVSA-N desmopressin Chemical compound C([C@H]1C(=O)N[C@H](C(N[C@@H](CC(N)=O)C(=O)N[C@@H](CSSCCC(=O)N[C@@H](CC=2C=CC(O)=CC=2)C(=O)N1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(N)=O)=O)CCC(=O)N)C1=CC=CC=C1 NFLWUMRGJYTJIN-NXBWRCJVSA-N 0.000 description 1
- 229960004281 desmopressin Drugs 0.000 description 1
- 229950006137 dexfosfoserine Drugs 0.000 description 1
- 102000004419 dihydrofolate reductase Human genes 0.000 description 1
- 239000002552 dosage form Substances 0.000 description 1
- 229960001519 exenatide Drugs 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000012268 genome sequencing Methods 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 101150024902 glnS gene Proteins 0.000 description 1
- 229960004666 glucagon Drugs 0.000 description 1
- MASNOZXLGMXCHN-ZLPAWPGGSA-N glucagon Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)O)C1=CC=CC=C1 MASNOZXLGMXCHN-ZLPAWPGGSA-N 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 239000000122 growth hormone Substances 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 230000014726 immortalization of host cell Effects 0.000 description 1
- 229960002869 insulin glargine Drugs 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 229940079322 interferon Drugs 0.000 description 1
- VBUWHHLIZKOSMS-RIWXPGAOSA-N invicorp Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC=1NC=NC=1)C(C)C)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=C(O)C=C1 VBUWHHLIZKOSMS-RIWXPGAOSA-N 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- GFIJNRVAKGFPGQ-LIJARHBVSA-N leuprolide Chemical compound CCNC(=O)[C@@H]1CCCN1C(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](CC(C)C)NC(=O)[C@@H](NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC=1N=CNC=1)NC(=O)[C@H]1NC(=O)CC1)CC1=CC=C(O)C=C1 GFIJNRVAKGFPGQ-LIJARHBVSA-N 0.000 description 1
- 229960004338 leuprorelin Drugs 0.000 description 1
- 229960002701 liraglutide Drugs 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000010297 mechanical methods and process Methods 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 239000002808 molecular sieve Substances 0.000 description 1
- QEEJLLNYQOBRRM-KSHGRFHLSA-N ovine crf Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(N)=O)NC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1N(CCC1)C(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO)[C@@H](C)CC)[C@@H](C)O)C(C)C)[C@@H](C)O)C1=CN=CN1 QEEJLLNYQOBRRM-KSHGRFHLSA-N 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 239000000825 pharmaceutical preparation Substances 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- BZQFBWGGLXLEPQ-REOHCLBHSA-N phosphoserine Chemical compound OC(=O)[C@@H](N)COP(O)(O)=O BZQFBWGGLXLEPQ-REOHCLBHSA-N 0.000 description 1
- USRGIUJOYOXOQJ-GBXIJSLDSA-N phosphothreonine Chemical compound OP(=O)(O)O[C@H](C)[C@H](N)C(O)=O USRGIUJOYOXOQJ-GBXIJSLDSA-N 0.000 description 1
- DCWXELXMIBXGTH-UHFFFAOYSA-N phosphotyrosine Chemical compound OC(=O)C(N)CC1=CC=C(OP(O)(O)=O)C=C1 DCWXELXMIBXGTH-UHFFFAOYSA-N 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 230000017854 proteolysis Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 229960002101 secretin Drugs 0.000 description 1
- OWMZNFCDEHGFEP-NFBCVYDUSA-N secretin human Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(N)=O)[C@@H](C)O)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)C1=CC=CC=C1 OWMZNFCDEHGFEP-NFBCVYDUSA-N 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- WGWPRVFKDLAUQJ-MITYVQBRSA-N sermorelin Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(N)=O)C1=CC=C(O)C=C1 WGWPRVFKDLAUQJ-MITYVQBRSA-N 0.000 description 1
- 229960002758 sermorelin Drugs 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 239000013605 shuttle vector Substances 0.000 description 1
- URGAHOPLAPQHLN-UHFFFAOYSA-N sodium aluminosilicate Chemical compound [Na+].[Al+3].[O-][Si]([O-])=O.[O-][Si]([O-])=O URGAHOPLAPQHLN-UHFFFAOYSA-N 0.000 description 1
- 229960002090 somatorelin Drugs 0.000 description 1
- JAHCMOSSKRAPEL-IBFVROBCSA-N somatorelin Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(N)=O)C1=CC=C(O)C=C1 JAHCMOSSKRAPEL-IBFVROBCSA-N 0.000 description 1
- 229960000553 somatostatin Drugs 0.000 description 1
- NHXLMOGPVYXJNR-ATOGVRKGSA-N somatostatin Chemical compound C([C@H]1C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CSSC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CC=2C3=CC=CC=C3NC=2)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(=O)N1)[C@@H](C)O)NC(=O)CNC(=O)[C@H](C)N)C(O)=O)=O)[C@H](O)C)C1=CC=CC=C1 NHXLMOGPVYXJNR-ATOGVRKGSA-N 0.000 description 1
- 108010073046 teduglutide Proteins 0.000 description 1
- 229960002444 teduglutide Drugs 0.000 description 1
- CILIXQOJUNDIDU-ASQIGDHWSA-N teduglutide Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O)[C@@H](C)CC)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)[C@@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)CC)C1=CC=CC=C1 CILIXQOJUNDIDU-ASQIGDHWSA-N 0.000 description 1
- 125000005931 tert-butyloxycarbonyl group Chemical group [H]C([H])([H])C(OC(*)=O)(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 238000003151 transfection method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 229960004824 triptorelin Drugs 0.000 description 1
- VXKHXGOKWPXYNA-PGBVPBMZSA-N triptorelin Chemical compound C([C@@H](C(=O)N[C@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N1[C@@H](CCC1)C(=O)NCC(N)=O)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC=1N=CNC=1)NC(=O)[C@H]1NC(=O)CC1)C1=CC=C(O)C=C1 VXKHXGOKWPXYNA-PGBVPBMZSA-N 0.000 description 1
- 238000005199 ultracentrifugation Methods 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 229960002811 ziconotide Drugs 0.000 description 1
- BPKIMPVREBSLAJ-QTBYCLKRSA-N ziconotide Chemical compound C([C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]2C(=O)N[C@@H]3C(=O)N[C@H](C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CSSC2)C(N)=O)=O)CSSC[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@H](C)NC(=O)CNC(=O)[C@H](CCCCN)NC(=O)CNC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CSSC3)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(N1)=O)CCSC)[C@@H](C)O)C1=CC=C(O)C=C1 BPKIMPVREBSLAJ-QTBYCLKRSA-N 0.000 description 1
Abstract
Группа изобретений относится к биотехнологии. Предложена мутантная лизил-тРНК-синтетаза, имеющая мутацию в позиции 19 аргинина (R) и/или позиции 29 гистидина (H) в аминокислотной последовательности, соответствующей лизил-тРНК-синтетазе дикого типа, причем такая мутантная лизил-тРНК-синтетаза необязательно включает в себя мутацию на сайте, выбранном из группы, состоящей из изолейцина (I) в позиции 26, треонина (T) в позиции 122, лейцина (L) в позиции 309, цистеина (C) в позиции 348, тирозина (Y) в позиции 384 и их комбинации. Кроме того, предложены: изолированный полинуклеотид, кодирующий мутантную лизил-тРНК-синтетазу; вектор для экспрессии мутантной лизил-тРНК-синтетазы; клетка-хозяин для экспрессии мутантной лизил-тРНК-синтетазы; система экспрессии; набор для получения целевого белка, содержащего неприродную аминокислоту, а также их применения для получения целевого белка, содержащего неприродную аминокислоту. Изобретения позволяют значительно увеличить количество инсерций производных лизина и количество целевого белка, содержащего производные лизина. 7 н. и 2 з.п. ф-лы, 1 ил., 1 табл., 3 пр.
Description
Область техники
Настоящее изобретение относится к области биотехнологии, в частности к аминоацил-тРНК синтетазе, которая эффективно вводит в белок производное лизина.
Уровень техники
Интегральный белок неприродной аминокислоты (цельный белок), полученный путем замены аминокислотного остатка в требуемом месте белка аминокислотами, отличающимися от тех 20 типов, которые участвуют в синтезе обычного белка (неприродные аминокислоты), можно использовать в качестве эффективного средства для анализа структуры и функции белка. Путем применения пар аминоацил-тРНК синтетаза (aaRS)/тРНК, происходящих от различных биологических видов, было синтезировано более 30 типов цельных белков. Системой с наиболее длительной историей применения для введения многих полезных неприродных аминокислот является пара мутантной тирозил-тРНК синтетазы (TyrRS) и ген амбер-супрессора тРНКTyr. Что касается данного способа, ключевым является его ортогональное соотношение, то есть aaRS в двух группах эубактерий, архей и эукариот аминоацилирует тРНК в своих соответствующих группах, но при этом не могут быть аминоацилированы тРНК других групп.
С другой стороны, пирролизил-тРНК синтетаза (PylRS) и ген амбер-супрессора tRNAPyl, полученный из Methanosarcina mazei, в клетках Е. coli функционируют как ортогональная пара aaRS/тРНК. Пирролизин представляет собой производное лизина с объемным метилпирролиновым фрагментом в боковой цепи. PylRS дикого типа в Е. coli может связывать Nε-Boc-L-лизин с tRNAPyl. Однако, поскольку LysRS имеет точное распознавание лизина, было затруднительно сайт-специфичным образом вводить в белки производные лизина, имеющие функциональные группы различного размера и формы.
Следовательно, специалистам в данной области необходимо модифицировать лизил-тРНК-синтетазу дикого типа и разработать аминоацил-тРНК-синтетазу, которая эффективно вводит производные лизина в белок.
Сущность изобретения
Целью настоящего изобретения является предложение аминоацил-тРНК синтетазы и способа эффективного введения производных лизина в белки.
В первом объекте настоящего изобретения предложена мутантная лизил-тРНК-синтетаза, причем такая мутантная лизил-тРНК-синтетаза имеет мутацию в позиции 19 аргинина (R) и/или позиции 29 гистидина (Н) в аминокислотной последовательности, соответствующей лизил-тРНК синтетазе дикого типа.
В другом предпочтительном варианте осуществления лизил-тРНК-синтетаза дикого типа получена из Methanosarcina mazei, Methanosarcina barken или Methanosarcina acetivorans, относящихся к метаногенным археям.
В другом предпочтительном варианте осуществления аминокислотная последовательность лизил-тРНК синтетазы дикого типа показана в SEQ ID NO: 1.
В другом предпочтительном варианте осуществления аминокислотная последовательность лизил-тРНК синтетазы дикого типа показана в SEQ ID NO: 2.
В другом предпочтительном варианте осуществления аргинин (R) в позиции 19 мутирован на гистидин (Н) или лизин (K); и/или
гистидин (Н) в позиции 29 мутирован на аргинин (R) или лизин (K).
В другом предпочтительном варианте осуществления мутация мутантной лизил-тРНК синтетазы выбрана из группы, состоящей из R19H, R19K, H29R, Н29K и их комбинации.
В другом предпочтительном варианте осуществления мутантная лизил-тРНК синтетаза дополнительно включает в себя мутацию на сайте, выбранном из группы, состоящей из изолейцина (I) в позиции 26, треонина (Т) в позиции 122, лейцина (L) в позиции 309, цистеина (С) в позиции 348, тирозина (Y) в позиции 384 и их комбинации.
В другом предпочтительном варианте осуществления сайт мутации мутантной лизил-тРНК синтетазы дополнительно включает в себя изолейцин (I) в позиции 26; предпочтительно, изолейцин (I) в позиции 26 мутирован на валин (V).
В другом предпочтительном варианте осуществления сайт мутации мутантной лизил-тРНК синтетазы дополнительно включает в себя треонин (Т) в позиции 122; предпочтительно, треонин (Т) в позиции 122 мутирован на триптофан (S).
В другом предпочтительном варианте осуществления сайт мутации мутантной лизил-тРНК синтетазы дополнительно включает в себя лейцин (I) в позиции 309; предпочтительно, лейцин (L) в позиции 309 мутирован на аланин (А).
В другом предпочтительном варианте осуществления сайт мутации мутантной лизил-тРНК синтетазы дополнительно включает в себя цистеин (С) в позиции 348; предпочтительно, цистеин (С) в позиции 348 мутирован на триптофан (S).
В другом предпочтительном варианте осуществления сайт мутации мутантной лизил-тРНК синтетазы дополнительно включает в себя тирозин (Y) в позиции 384; предпочтительно, тирозин (Y) в позиции 384 мутирован на фенилаланин (F).
В другом предпочтительном варианте осуществления мутантная лизил-тРНК синтетаза дополнительно включает в себя мутацию, выбранную из группы, состоящей из: I26V, T122S, L309A, C348S, Y384F и их комбинаций.
В другом предпочтительном варианте осуществления мутантная лизил-тРНК синтетаза включает в себя мутацию, выбранную из группы, состоящей из R19H и H29R.
В другом предпочтительном варианте осуществления мутантная лизил-тРНК синтетаза включает в себя мутацию, выбранную из группы, состоящей из R19K и H29R.
В другом предпочтительном варианте осуществления мутантная лизил-тРНК синтетаза включает в себя мутацию, выбранную из группы, состоящей из R19H и Н29К.
В другом предпочтительном варианте осуществления мутантная лизил-тРНК синтетаза включает в себя мутацию, выбранную из группы, состоящей из R19K и Н29К.
В другом предпочтительном варианте осуществления мутантная лизил-тРНК синтетаза включает в себя мутацию, выбранную из группы, состоящей из R19H, I26V и H29R.
В другом предпочтительном варианте осуществления мутантная лизил-тРНК синтетаза включает в себя мутацию, выбранную из группы, состоящей из R19H, H29R, T122S и Y384F.
В другом предпочтительном варианте осуществления мутантная лизил-тРНК синтетаза включает в себя мутацию, выбранную из группы, состоящей из R19H, H29R, L309A и C348S.
В другом предпочтительном варианте осуществления, за исключением мутации (такой как в позиции 19 и/или 29 и, необязательно, позиции 26, 122, 309, 348 и/или 384), другие аминокислоты мутантной лизил-тРНК синтетазы являются такими же или практически такими же, как последовательность, показанная в SEQ ID NO: 1 или SEQ ID NO: 2.
В другом предпочтительном варианте осуществления «практически такие же» означает, что отличаются самое большее 50 (предпочтительно 1-20, более предпочтительно 1-10) аминокислот, причем такое отличие включает в себя замещение, делецию или добавление аминокислоты, а мутантный белок все еще имеет активность лизил-тРНК синтетазы.
В другом предпочтительном варианте осуществления по сравнению с SEQ ID NO. 1 или SEQ ID NO: 2, последовательность аминокислоты мутантной лизил-тРНК синтетазы имеет, по меньшей мере, 70%, предпочтительно, по меньшей мере, 75%, 80%), 85%о, 90% и, более предпочтительно, по меньшей мере, 95%о, 96%о, 97%о, 98%, 99% идентичность последовательности.
В другом предпочтительном варианте осуществления мутантная лизил-тРНК синтетаза образована путем мутирования лизил-тРНК-синтетазы дикого типа, как показано в SEQ ID NO.: 1 или SEQ ID NO: 2.
В другом предпочтительном варианте осуществления мутантная лизил-тРНК синтетаза выбрана из группы, состоящей из:
(1) полипептида, имеющего аминокислотную последовательность, показанную в любой из SEQ ID NO.: 3-8; или
(2) полипептида, образованного замещением, делецией или добавлением к аминокислотной последовательности одного или нескольких (предпочтительно 1-20, более предпочтительно 1-15, более предпочтительно 1-10, более предпочтительно 1-8, более предпочтительно 1-3, наиболее предпочтительно 1) аминокислотных остатков, как показано в любой из SEQ ID NO.: 3-8, и полученного из полипептида, имеющего аминокислотную последовательность, показанную в любой из SEQ ID NO.: 3-8, имеющей функцию полипептида, как описано в (1).
В другом предпочтительном варианте осуществления аминокислотная последовательность мутантной лизил-тРНК синтетазы показана в любой из SEQ ID NO.: 3-8.
В другом предпочтительном варианте осуществления мутантная лизил-тРНК синтетаза представляет собой неприродный белок.
В другом предпочтительном варианте осуществления мутантную лизил-тРНК синтетазу используют для введения в целевой белок производных лизина.
В другом предпочтительном варианте осуществления мутантная лизил-тРНК синтетаза имеет следующие характеристики:
по сравнению с лизил-тРНК синтетазой дикого типа, в белки могут быть введены производные лизина с большими функциональными группами.
Во втором объекте настоящего изобретения предложен изолированный полинуклеотид, кодирующий мутантную лизил-тРНК синтетазу согласно первому объекту настоящего изобретения.
В другом предпочтительном варианте осуществления такой полинуклеотид кодирует полипептид, как показано в любой из SEQ ID NO.: 3-8.
В другом предпочтительном варианте осуществления такой полинуклеотид включает в себя последовательность ДНК, последовательность РНК и их комбинации.
В другом предпочтительном варианте осуществления такой полинуклеотид дополнительно содержит вспомогательный элемент, выбранный из группы, состоящей из сигнального пептида, секреторного пептида, последовательности метки (такой как 6His) и их комбинации на фланкировании открытой рамки считывания (ОРС) мутантной лизил-тРНК синтетазы.
В третьем объекте настоящего изобретения предложен вектор, содержащий полинуклеотид согласно второму объекту настоящего изобретения.
В другом предпочтительном варианте осуществления такой вектор включает в себя вектор экспрессии, челночный вектор и интегративный вектор.
В другом предпочтительном варианте осуществления такой вектор выбран из группы, состоящей из рЕТ, pCW, pUC, pPIC9k, рМА5 и их комбинаций.
В другом предпочтительном варианте осуществления такой вектор представляет собой вектор pEvol и/или вектор pBAD.
В другом предпочтительном варианте осуществления такой вектор используется для экспрессирования мутантной лизил-тРНК синтетазы.
В третьем объекте настоящего изобретения предложена клетка-хозяин, которая содержит вектор согласно третьему объекту настоящего изобретения, или ее геном, который интегрирует полинуклеотид согласно второму объекту настоящего изобретения.
В другом предпочтительном варианте осуществления, клетка-хозяин выбрана из группы, состоящей из прокариотической клетки, эукариотической клетки и их комбинации.
В другом предпочтительном варианте осуществления клетка-хозяин представляет собой эукариотическую клетку, такую как дрожжевая клетка, растительная клетка или клетка животного происхождения (такая как клетка млекопитающего).
В другом предпочтительном варианте осуществления клетка-хозяин представляет собой прокариотическую клетку, такую как Escherichia coli.
В другом предпочтительном варианте осуществления клетка-хозяин представляет собой Тор10 или BL21 Е. coli.
В другом предпочтительном варианте осуществления клетка-хозяин содержит:
(a) мутантную лизил-тРНК синтетазу согласно первому объекту настоящего изобретения; а также
(b) ортогональную тРНК, способную связываться с производным лизина в присутствии мутантной лизил-тРНК синтетазы; и, не обязательно
(c) последовательность целевой нуклеиновой кислоты, кодирующая целевой белок, которая включает в себя кодон, распознаваемый ортогональной тРНК в позиции для введения производного лизина.
В другом предпочтительном варианте осуществления клетка-хозяин дополнительно содержит:
(d) производное лизина.
В другом предпочтительном варианте осуществления производное лизина представляет собой субстрат мутантной лизил-тРНК синтетазы.
В другом предпочтительном варианте осуществления производное лизина выбрано из группы, состоящей из производного алкинилоксикарбониллизина, производного ВОС-лизина (трет-бутилоксикарборил-L-лизин), лизина, ацилированного с помощью жирных кислот, и их комбинации.
В другом предпочтительном варианте осуществления структура алкинилоксикарбониллизина показана в Формуле I:
где n представляет собой 0-8.
В другом предпочтительном варианте осуществления ортогональная тРНК является супрессором тРНК, предпочтительно амбер-супрессором тРНК.
В другом предпочтительном варианте осуществления кодирующая аминокислотная последовательность ортогональной тРНК показана в SEQ ID NO.: 9.
GGAAACCTGATCATGTAGATCGAATGGACTCTAAATCCGTTCAGCCGGGTTAGATTCCCGGGGTTTCCGCCA (SEQ ID NO.: 9)
В другом предпочтительном варианте осуществления кодон, распознаваемый ортогональной тРНК, представляет собой амбер-кодон.
В другом предпочтительном варианте осуществления клетка-хозяин представляет собой прокариотическую клетку или эукариотическую клетку, предпочтительно Escherichia coli.
Пятый объект настоящего изобретения предлагает систему экспрессии, при этом такая система экспрессии содержит:
(a) мутантную лизил-тРНК синтетазу согласно первому объекту настоящего изобретения; а также
(b) ортогональную тРНК, способную связываться с производным лизина в присутствии мутантной лизил-тРНК синтетазы; и, не обязательно
(c) последовательность целевой нуклеиновой кислоты, кодирующая целевой белок, которая включает в себя кодон, распознаваемый ортогональной тРНК в позиции для введения производного лизина.
В другом предпочтительном варианте осуществления система экспрессии дополнительно содержит:
(d) производное лизина.
В другом предпочтительном варианте осуществления производное лизина выбрано из группы, состоящей из производного алкинилоксикарбониллизина, производного ВОС-лизина (трет-бутилоксикарборил-L-лизин), лизина, ацилированного с помощью жирных кислот, и их комбинации.
В другом предпочтительном варианте осуществления структура алкинилоксикарбониллизина показана в Формуле I:
где n представляет собой 0-8.
В другом предпочтительном варианте осуществления ортогональная тРНК является супрессором тРНК, предпочтительно амбер-супрессором тРНК.
В другом предпочтительном варианте осуществления аминокислотная последовательность ортогональной тРНК показана в SEQ ID NO.: 9.
В другом предпочтительном варианте осуществления кодон, распознаваемый ортогональной тРНК, представляет собой амбер-кодон.
В другом предпочтительном варианте осуществления система экспрессии представляет собой клетку или клеточный экстракт.
В другом предпочтительном варианте осуществления система экспрессии применяется для введения алкинилоксикарбониллизина в целевой белок или для получения целевого белка, содержащего неприродную аминокислоту.
В шестом объекте настоящего изобретения предложен способ введения неприродной аминокислоты в целевой белок, включающий в себя следующие этапы:
(1) обеспечение клетки-хозяина согласно четвертому объекту настоящего изобретения или системы экспрессии согласно пятому объекту настоящего изобретения; и
(2) в присутствии производного лизина целевой белок экспрессируется в клетке-хозяине или системе экспрессии.
В другом предпочтительном варианте осуществления целевой белок выбран из группы, состоящей из: белка-предшественника человеческого инсулина, белка-предшественника лиспро-инсулина, белка-предшественника инсулина гларгина, паратироидного гормона, кортикорелина, кальцитонина, бивалирудина, глюкагоноподобного пептида и его производных, экзенатида и лираглутида, зиконотида, серморелина, соматорелина, секретина, тедуглутида, гирудина, гормона роста, фактор роста, фактора высвобождения гормона роста, адренокортикотропного гормона, фактора высвобождения, дезлорелина, десмопрессина, элкатонина, глюкагона, лейпрорелина, лютеинизирующего гормона-гормона высвобождения, соматостатина, тиротропин-
высвобождающего гормона, трипторелина, вазоактивного кишечного пептида, интерферона, паратироидного гормон, пептида ВН3, амилоидного пептида или фрагмента указанного выше пептида, и их комбинации.
В другом предпочтительном варианте осуществления неприродная аминокислота представляет собой производное лизина.
В другом предпочтительном варианте осуществления способ включает в себя этапы:
(1) обеспечение клетки или клеточного экстракта, экспрессирующего мутантную лизил-тРНК синтетазу, ортогональную тРНК и последовательность целевой нуклеиновой кислоты согласно первому объекту настоящего изобретения; и
(2) культивирование клетки или клеточного экстракта в присутствии производного лизина, и, как следствие, введение производного лизина в целевой белок посредством пары ортогональной тРНК-синтетазы и ортогональной тРНК.
В седьмом объекте настоящего изобретения предложен набор, содержащий (а) контейнер и (б) мутантную лизил-тРНК синтетазу согласно первому объекту настоящего изобретения или полинуклеотид согласно второму объекту настоящего изобретения, содержащиеся в контейнере.
В другом предпочтительном варианте осуществления такой набор включает в себя:
(i) первую последовательность нуклеиновой кислоты, содержащую первую кассету экспрессии для экспрессирования мутантной лизил-тРНК синтетазы; и/или
(ii) вторую последовательность нуклеиновой кислоты, содержащую вторую кассету экспрессии для экспрессирования ортогональной тРНК, причем ортогональная тРНК может быть объединена с производным лизина в присутствии мутантной лизил-тРНК синтетазы; и/или
(iii) третью последовательность нуклеиновой кислоты, содержащую третью кассету экспрессии для экспрессирования целевого белка, и кодирующую последовательность целевого белка, которая включает в себя кодон, распознаваемый ортогональной тРНК в позиции для введения производного лизина.
В другом предпочтительном варианте осуществления такой набор дополнительно включает в себя клеточный экстракт.
В другом предпочтительном варианте осуществления соответствующие последовательности нуклеиновой кислоты находятся в одном или разных контейнерах.
В другом предпочтительном варианте осуществления каждая последовательность нуклеиновой кислоты расположена на другом векторе.
В восьмом объекте настоящего изобретения предложена система трансляции, при этом такая система трансляции содержит:
(a) мутантную лизил-тРНК синтетазу согласно первому объекту настоящего изобретения;
(b) ортогональную тРНК, способную связываться с производным лизина в присутствии мутантной лизил-тРНК синтетазы; и
(c) производное лизина.
В девятом объекте настоящего изобретения предлагается применение мутантной лизил-тРНК синтетазы в соответствии с первым объектом настоящего изобретения, или клетки-хозяина в соответствии с четвертым объектом настоящего изобретения, или системы экспрессии в соответствии с пятый объектом настоящего изобретения или набора в соответствии с седьмым объектом настоящего изобретения, для внедрения неприродной аминокислоты в целевой белок или для получения целевого белка, содержащего неприродную аминокислоту.
В десятом объекте настоящего изобретения предлагается способ получения целевого белка, содержащего неприродную аминокислоту, включающий в себя этапы:
(1) обеспечение клетки-хозяина согласно четвертому объекту настоящего изобретения или системы экспрессии согласно пятому объекту настоящего изобретения; и
(2) в присутствии производного лизина целевой белок экспрессируется в клетке-хозяине или системе экспрессии.
В одиннадцатом объекте настоящего изобретения предложен способ получения мутантной лизил-тРНК синтетазы согласно первому объекту настоящего изобретения, содержащий этапы: (i) культивирование клетки-хозяина согласно четвертому объекту настоящего изобретения, и, посредством этого, экспрессирование мутантной лизил-тРНК синтетазы.
В двенадцатом объекте настоящего изобретения предложен ферментный препарат, содержащий мутантную лизил-тРНК синтетазу согласно первому объекту настоящего изобретения.
В другом предпочтительном варианте осуществления лекарственная форма фармацевтического препарата включает в себя: лиофилизированный препарат, жидкий препарат и их комбинацию.
Следует понимать, что в пределах объема настоящего изобретения вышеупомянутые технические признаки настоящего изобретения и технические признаки, конкретно описанные ниже (такие как варианты осуществления), могут быть объединены друг с другом для образования нового или предпочтительного технического решения. Из-за ограничения по объему я не буду повторять их в данном документе один за другим.
Описание чертежей
На Фиг. 1 показана карта плазмиды pEvol-pylRs(R19H, H29R)-pylT.
Подробное описание
После обширных и углубленных исследований и обширного скрининга изобретатели неожиданно получили мутантную лизил-тРНК синтетазу. По сравнению с лизил-тРНК-синтетазой дикого типа мутантная лизил-тРНК-синтетаза по настоящему изобретению может значительно увеличить количество инсерций неприродных аминокислот и количество целевого белка, содержащего неприродные аминокислоты. Кроме того, мутантная лизил-тРНК синтетаза по настоящему изобретению также может улучшать стабильность целевого белка так, что его не удается легко разрушить. На этом основании изобретатели совершили настоящее изобретение.
Термины
Чтобы облегчить понимание настоящего описания, сначала определим некоторые термины. При использовании в данной заявке, если явно не указано иное, каждый из следующих терминов имеет значение, указанное ниже. Другие определения приводятся по мере применения.
Термин «около» может относиться к значению или составу в пределах допустимого диапазона погрешности конкретного значения или состава, определенного специалистом в данной области техники, которые частично будут зависеть от того, каким образом такое значение или состав измеряют или определяют. Например, используемое здесь выражение «около 100» включает в себя все значения между 99 и 101 (такие как 99,1; 99,2; 99,3; 99,4 и т.д.).
Используемый в данном документе термин «содержащий» или «включающий в себя» могут подразумевать открытое, полуоткрытое и закрытое множество. Другими словами, такой термин также включает в себя «по существу, состоящий из» или «состоящий из».
Идентичность последовательности (или ее гомологичность) определяют путем сравнения двух выровненных последовательностей в пределах заданного окна сравнения (это может быть 50%, 60%, 70%, 80%, 90%, 95% или 100% длины эталонной нуклеотидной последовательности или белка) и определения количества позиций, в которых появляется один и тот же остаток. Как правило, этот показатель выражают в процентах. Измерение идентичности нуклеотидных последовательностей является способом, который хорошо известен специалистам в данной области.
В данном документе термины «аминоацил-тРНК-синтетаза» и «лизил-тРНК-синтетаза» используются как взаимозаменяемые.
Лизил-тРНК-синтетаза дикого типа
Используемый в данном документе термин «лизил-тРНК-синтетаза дикого типа» относится к встречающейся в природе аминоацил-тРНК-синтетазе, которая не была модифицирована искусственным путем, а ее нуклеотиды могут быть получены с помощью технологий генной инженерии, таких как секвенирование генома, полимеразная цепная реакция (ПЦР) и т.д., при этом из нуклеотидной последовательности может быть выведена аминокислотная последовательность. Источник лизил-тРНК синтетазы дикого типа не имеет конкретного ограничения. Предпочтительным источником являются организмы Methanosarcina mazei, Methanosarcina barkeri и Methanosarcina acetivorans из метаногенных архей, но не ограничен только ими.
В предпочтительном варианте осуществления настоящего изобретения аминокислотная последовательность лизил-тРНК синтетазы дикого типа показана в SEQ ID NO: 1.
MDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSATRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDESLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL (SEQ ID NO.: 1)
В предпочтительном варианте осуществления настоящего изобретения аминокислотная последовательность лизил-тРНК синтетазы дикого типа показана в SEQ ID NO: 2.
MDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSGSYYNGISTNL (SEQ ID NO.: 2)
Мутантная лизил-тРНК синтетаза
Используемые в данном документе термины «мутантный белок», «мутантный белок по настоящему изобретению», «мутантная аминоацил-тРНК-синтетаза по настоящему изобретению», «мутантная лизил-тРНК-синтетаза», «мутантный фермент», «мутанты аминоил-тРНК синтаза» могут использоваться взаимозаменяемо, и все относятся к неприродной мутантной аминоацил-тРНК-синтетазе, при этом мутантная аминоацил-тРНК-синтетаза представляет собой белок, искусственно модифицированный полипептидом, как показано в SEQ ID NO.: 1 или SEQ ID NO: 2. В частности, мутантная аминоацил-тРНК синтетаза представляет собой ту, которая описана в первом объекте настоящего изобретения.
Следует понимать, что нумерация аминокислот в мутантной лизил-тРНК-синтетазе по настоящему изобретению основана на лизил-тРНК-синтетазе дикого типа (предпочтительно, SEQ ID NO.: 1 или SEQ ID NO: 2). Когда конкретный мутантный белок имеет 80% или более гомологии с последовательностью, показанной в SEQ ID NO.: 1 или SEQ ID NO: 2, номер аминокислоты мутантного белка может быть смещен относительно нумерации аминокислоты с SEQ ID NO.: 1 или SEQ ID NO: 2, как, например, несовпадение позиций 1-5 с N-концом или С-концом аминокислоты с использованием традиционных в данной области методик выравнивания последовательностей, при этом специалисты в данной области техники в целом должны понимать, что такое несовпадение находится в разумных пределах и мутеины с 80%) гомологией и аналогичной или подобной активностью гликозилтрансферазы не следует исключать из охвата мутантного белка по настоящему изобретению из-за неправильной нумерации аминокислот.
Мутантный белок по настоящему изобретению представляет собой синтетический белок или рекомбинантный белок, то есть он может быть химически синтезированным продуктом или может быть получен от прокариотического или эукариотического хозяина (например, бактерий, дрожжей и растений) с использованием рекомбинантной технологии. В зависимости от хозяина, используемого в протоколе рекомбинантного получения, мутеин по настоящему изобретению может быть гликозилированным или негликозилированным. Мутеин по настоящему изобретению может также включать в себя исходный остаток метионина или не включать его.
Настоящее изобретение также включает в себя фрагменты, производные и аналоги мутеина. Используемые в данном документе термины «фрагмент», «производное» и «аналог» относятся к белку, который по существу сохраняет ту же биологическую функцию или активность, что и мутеин.
Фрагмент, производное или аналог мутеина по настоящему изобретению может быть (i) мутеином, в котором заменены один или несколько консервативных или неконсервативных аминокислотных остатков (предпочтительно консервативных аминокислотных остатков), причем такие замещенные аминокислотные остатки могут быть кодированы или не кодированы генетическим кодоном, или (ii) мутеином с замещающей группой в одном или нескольких аминокислотных остатках, или (iii) мутеином, образованным путем слияния зрелого мутеина с другим соединением (таким как соединение, которое продлевает длительность периода полураспада мутеина, таким как полиэтиленгликоль), или (iv) мутеином, образованным путем слияния дополнительной аминокислотной последовательности с данной последовательностью мутеина (такой как лидерная последовательность или секреторная последовательность, или последовательность, используемая для очистки данного мутантного белка или последовательности пробелка, или белком слияния, образованным с фрагментом антигена IgG). Согласно изложенному в данном документе принципу, эти фрагменты, производные и аналоги находятся в пределах компетенции специалистов в данной области. В настоящем изобретении консервативно замещенные аминокислоты предпочтительно получают путем аминокислотных замещений согласно таблице I.
Распознание аминокислотного субстрата PylRS связано со стереохимической структурой каталитически активного функционального домена. Величина производных лизина, которые могут быть активированы PylRS дикого типа, ограничена, и производные лизина с большими функциональными группами не могут быть введены в белки. Следовательно, улучшить эффект можно путем мутации сайта PylRS, избегая стерических несоответствий связывающего субстрата или взаимодействия мутантной аминокислоты с аминокислотой субстрата или частью основной цепи.
Предпочтительно, мутеин представляет собой такой, как показан в любой
из SEQ ID NO.: 3-8.
MDKKPLNTLISATGLWMSHTGTIHKVKHREVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL (SEQ ID NO.: 3)
MDKKPLNTLISATGLWMSHTGTIHKIKHREVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENSEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL (SEQ ID NO.: 4)
MDKKPLNTLISATGLWMSHTGTIHKIKHREVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYARKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFSQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL (SEQ ID NO.: 5)
MDKKPLNTLISATGLWMSHTGTIHKIKHREVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL (SEQ ID NO.: 6)
MDKKPLNTLISATGLWMSHTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL (SEQ ID NO.: 7)
MDKKPLNTLISATGLWMSRTGTIHKIKHREVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL (SEQ ID NO.: 8)
Следует понимать, что по сравнению с последовательностью, показанной в SEQ ID NO.: 1 или SEQ ID NO: 2, мутеин по настоящему изобретению обычно имеет более высокую гомологию (идентичность). Предпочтительно гомология между мутантным белком и последовательностью, показанной в SEQ ID NO.: 1 или SEQ ID NO: 2, составляет, по меньшей мере, 80%, предпочтительно, по меньшей мере, 85-90%), более предпочтительно, по меньшей мере, 95%, более предпочтительно, по меньшей мере, 98%) и, наиболее предпочтительно, по меньшей мере, 99%.
Кроме того, мутантный белок по настоящему изобретению также может быть модифицирован. Модифицированные (обычно не изменяющие первичную структуру) формы включают в себя: формы мутеина in vivo или in vitro, полученные химическим способом, таким как ацетилирование или карбоксилирование. Модификации также включают в себя гликозилирование, такое как то, с помощью которого производят модификации гликозилирования во время синтеза и процессинга мутантного белка или во время следующих этапов процессинга. Эта модификация может быть осуществлена путем воздействия на мутеин фермента, который выполняет гликозилирование (например, гликозилазы или дегликозилазы млекопитающих).
Модифицированные формы также включают в себя последовательности с фосфорилированными аминокислотными остатками (такими как фосфотирозин, фосфосерин, фосфотреонин). Они также включают в себя мутантные белки, которые были модифицированы для повышения их устойчивости к протеолизу или оптимизации их растворимости.
Термин «полинуклеотид, кодирующий мутантную лизил-тРНК-синтетазу» может включать в себя полинуклеотид, кодирующий мутантную лизил-тРНК-синтетазу по настоящему изобретению, или также может быть полинуклеотидом, который включает в себя дополнительные кодирующие и/или некодирующие последовательности.
Настоящее изобретение также относится к вариантам вышеуказанных полинуклеотидов, которые кодируют фрагменты, аналоги и производные полипептидов или мутеинов, имеющих такую же аминокислотную последовательность, что и в настоящем изобретении. Эти варианты нуклеотидов включают в себя варианты замещения, варианты делеции и варианты инсерции. Как известно в данной области, аллельный вариант представляет собой альтернативную форму полинуклеотида. Это может быть замещение, делеция или инсерция одного или нескольких нуклеотидов, но не приводящие к существенному изменению функции кодируемого мутантного белка.
Настоящее изобретение также относится к полинуклеотидам, которые гибридизуются с вышеупомянутыми последовательностями и имеют, по меньшей мере, 50%, предпочтительно, по меньшей мере, 70% и, более предпочтительно, по меньшей мере, 80%) идентичность между двумя последовательностями. Настоящее изобретение, в частности, относится к полинуклеотидам, которые могут гибридизоваться с полинуклеотидом по настоящему изобретению в строгих условиях (или обязательных условиях). В настоящем изобретении «строгие условия» относятся к: (1) гибридизации и элюции при пониженной ионной силе и более высокой температуре, такой как 0,2 × SSC, 0,1% SDS, 60°С; или (2) добавлению денатурирующего агента во время гибридизации, такого как 50%) (об./ об.) формамида, 0,1% телячьей сыворотки/0,1% фиколла, 42°С и т.д.; или (3) гибридизации, происходящей только тогда, когда идентичность между двумя последовательностями составляет, по меньшей мере, 90% или более, а более предпочтительно 95% или более.
Мутеины и полинуклеотиды по настоящему изобретению предпочтительно предоставляют в изолированной форме и, более предпочтительно, очищенными до гомогенности.
Полноразмерную последовательность полинуклеотида по настоящему изобретению обычно можно получить способом ПЦР-амплификации, способом рекомбинации или способом искусственного синтеза. Для способа ПЦР-амплификации праймеры могут быть сконструированы в соответствии с соответствующей нуклеотидной последовательностью, описанной в настоящем изобретении, особенно с последовательностью открытой рамки считывания, и с использованием в качестве шаблона для амплификации соответствующей последовательности библиотеки кДНК, имеющейся в коммерческом доступе, или библиотеки кДНК, подготовленной обычным способом, который известен специалистам, в данной области техники. Если последовательность является длинной, часто необходимо выполнить две или более ПЦР-амплификаций, а затем все амплифицированные фрагменты сплайсируют вместе в правильном порядке.
Как только соответствующая последовательность получена, для получения соответствующей последовательности в больших количествах можно использовать способ рекомбинации. Обычно это делается путем клонирования в вектор с последующим переносом в клетку и последующим выделением соответствующей последовательности из пролиферированной клетки-хозяина обычными способами.
Кроме того, способы искусственного синтеза также можно использовать для синтеза родственных последовательностей, особенно при незначительной длине фрагмента. Обычно сначала синтезируют несколько небольших фрагментов, а затем лигируют их для получения фрагментов с очень длинными последовательностями.
В настоящее время последовательность ДНК, кодирующая белок (или его фрагмент или производное) по настоящему изобретению, может быть полностью получена с помощью химического синтеза. Затем последовательность ДНК может быть введена в разнообразные существующие молекулы ДНК (или такие, как векторы) и клетки, известные в данной области. Кроме того, мутации также могут быть введены в последовательность белка по настоящему изобретению путем химического синтеза.
Способ использования технологии ПЦР для амплификации ДНК/РНК предпочтительно используют для получения полинуклеотида по настоящему изобретению. В особенности в тех случаях, когда затруднительно получить из библиотеки полноразмерную кДНК, предпочтительно может быть использован способ RACE (способ быстрой амплификации конца кДНК), а праймеры, используемые для ПЦР, могут быть выбраны надлежащим образом в соответствии с информацией о последовательности по настоящему изобретению, содержащейся в данном описании, и могут быть синтезированы обычными способами. Амплифицированные фрагменты ДНК/РНК могут быть разделены и очищены обычными способами, такими как гель-электрофорез.
Вектор экспрессии
Настоящее изобретение также относится к вектору, содержащему полинуклеотид по настоящему изобретению, к клетке-хозяину, полученной с помощью генной инженерии с использованием вектора по настоящему изобретению или кодирующей последовательности мутантного белка по настоящему изобретению, и к способу получения полипептида по настоящему изобретению с помощью рекомбинантной технологии.
Посредством общепринятой технологии рекомбинантной ДНК полинуклеотидная последовательность по настоящему изобретению может быть использована для экспрессии или получения рекомбинантного мутеина. В общем случае, предусмотрены следующие этапы:
(1) применение полинуклеотида (или варианта) по настоящему изобретению, кодирующего мутантный белок по настоящему изобретению, или применение рекомбинантного вектора экспрессии, содержащего полинуклеотид, для трансформации или трансдукции подходящей клетки-хозяина;
(2) клетка-хозяин, культивируемая в подходящей среде;
(3) отделение и очистка белка от среды культивирования или клеток.
В настоящем изобретении полинуклеотидная последовательность, кодирующая мутантный белок, может быть вставлена в рекомбинантный вектор экспрессии. Термин «рекомбинантный вектор экспрессии» относится к бактериальным плазмидам, бактериофагам, дрожжевым плазмидам, вирусам растительных клеток, вирусам клеток млекопитающих, таким как аденовирус, ретровирус или другим векторам, хорошо известным в данной области. Могут быть использованы любая плазмида или вектор, если они могут быть реплицированы и стабилизированы в хозяине. Важной особенностью вектора экспрессии является то, что он обычно содержит точку начала репликации, промотор, маркерный ген и элементы управления трансляцией.
Для конструирования вектора экспрессии, содержащего последовательность ДНК, кодирующую мутеин по настоящему изобретению, и соответствующие сигналы управления транскрипцией/трансляцией, могут быть использованы способы, хорошо известные специалистам в данной области. Эти способы включают в себя технологию рекомбинантной ДНК in vitro, технологию синтеза ДНК и технологию рекомбинации in vivo. Для направления синтеза мРНК последовательность ДНК может быть эффективно связана в векторе экспрессии с подходящим промотором. Типичными примерами таких промоторов являются: Промотор Escherichia coli lac или trp; промотор фага лямбда PL; эукариотические промоторы, включая промотор немедленного ответа CMV, промотор тимидинкиназы HSV, ранний и поздний промоторы SV40, ретровирусные LTR и некоторые другие известные промоторы, которые могут управлять экспрессией генов в прокариотических или эукариотических клетках или вирусах. Вектор экспрессии также включает в себя сайт связывания рибосомы для инициации трансляции и терминатор транскрипции.
Кроме того, вектор экспрессии предпочтительно содержит один или несколько селективных маркерных генов для обеспечения фенотипических признаков отбора трансформированных клеток-хозяев, таких как дигидрофолатредуктаза для культуры эукариотических клеток, устойчивость к неомицину и зеленый флуоресцентный белок (GFP), или устойчивость к тетрациклину или ампициллину для Е. coli.
Вектор, содержащий вышеупомянутую подходящую последовательность ДНК и соответствующий промотор или управляющую последовательность, можно использовать для трансформации подходящей клетки-хозяина так, чтобы она могла экспрессировать упомянутый белок.
Клетка-хозяин может представлять собой прокариотическую клетку, такую как бактериальная клетка; или низшую эукариотическую клетку, такую как дрожжевая клетка; или высшую эукариотическую клетку, такую как клетка млекопитающего. Типичные примеры включают в себя: Escherichia coli, Streptomyces; бактериальные клетки Salmonella typhimurium; грибковые клетки, такие как дрожжевые и растительные клетки (например, клетки женьшеня).
Когда полинуклеотид по настоящему изобретению экспрессируют в клетках высших эукариот, вставка в вектор энхансерной последовательности обеспечит усиление транскрипции. Энхансеры - это цис-действующие факторы ДНК, обычно имеющие от 10 до 300 пар оснований, воздействующие на промоторы для усиления транскрипции генов. Примеры включают от 100 до 270 пар оснований энхансера SV40 на поздней стороне точки инициации репликации, энхансера полиомы на поздней стороне точки инициации репликации, энхансеры аденовируса и т.п.
Специалистам в данной области известно, как выбрать подходящие векторы, промоторы, энхансеры и клетки-хозяева.
Трансформация клеток-хозяев рекомбинантной ДНК может осуществляться обычными способами, хорошо известными специалистам в данной области. Когда хозяином является прокариот, такой как Escherichia coli, компетентные клетки, которые способны абсорбировать ДНК, могут быть собраны после фазы экспоненциального роста и обработаны способом СаСl2. Применяемые этапы хорошо известны в данной области техники. Другим способом является использование MgCl2. При необходимости трансформация также может быть выполнена путем электропорации. Если хозяином является эукариот, могут быть выбраны следующие способы трансфекции ДНК: способ совместного осаждения фосфатом кальция, обычные механические способы, такие как микроинъекция, электропорация, липосомная упаковка и т.д.
Для экспрессии полипептида, кодируемого геном по настоящему изобретению, полученные трансформанты можно культивировать обычными способами. В зависимости от используемой клетки-хозяина среда, используемая для культивирования среда может быть выбрана из разнообразных обычных сред. Культивирование проводят в условиях, подходящих для роста клетки-хозяина. После того, как клетки-хозяева вырастут до приемлемой плотности клеток, выбранный промотор индуцируют подходящим способом (таким как температурное преобразование или химическая индукция), а клетки культивируют в течение определенного периода времени.
Рекомбинантный полипептид в указанном выше способе может быть экспрессирован в клетке или на клеточной мембране или секретирован из клетки. При необходимости, используя физические, химические и другие характеристики, можно отделить и очистить рекомбинантный белок с помощью различных способов разделения. Эти способы хорошо известны специалистам в этой области техники. Примеры этих способов включают в себя, но не ограничиваются перечисленным: обычная обработка ренатурацией, обработка агентом осаждения белка (способ высаливания), центрифугирование, разрушение бактерий посредством осмоса, ультраобработка, ультрацентрифугирование, хроматография на молекулярных ситах (гель-фильтрация), адсорбционная хроматография, ионообменная хроматография, высокоэффективная жидкостная хроматография (ВЭЖХ) и различные другие технологии жидкостной хроматографии и их комбинации.
По сравнению с предшествующим уровнем техники настоящее изобретение имеет следующие преимущества:
После большого количества скринингов и модификаций в настоящем изобретении впервые было обнаружено, что мутация аргинина (R) в позиции 19 и/или гистидина (Н) в позиции 29, соответствующая лизил-тРНК синтетазе дикого типа (такой как SEQ ID NO.: 1 или 2), полученная мутантная лизил-тРНК синтетаза способна вводить в белки производные лизина с большими функциональными группами.
По сравнению с лизил-тРНК-синтетазой дикого типа мутантная лизил-тРНК-синтетаза по настоящему изобретению может значительно увеличить количество инсерций неприродных аминокислот и количество целевого белка, содержащего неприродные аминокислоты. Кроме того, мутантная лизил-тРНК синтетаза по настоящему изобретению также может улучшать стабильность целевого белка так, что его не удается легко разрушить.
В настоящем изобретении также оказалось, что мутация одной или нескольких аминокислот в других позициях лизил-тРНК-синтетазы, таких как позиции 26, 122, 309, 348 и/или 384 аллелей, может дополнительно повысить величину инсерций неприродных аминокислот, количество целевого белка, содержащего неприродные аминокислоты, и/или стабильность целевого белка.
Настоящее изобретение будет дополнительно разъяснено ниже на конкретных вариантах осуществления. Следует понимать, что эти варианты осуществления предназначены только для иллюстрирования данного изобретения, а не для ограничения его объема. В следующих примерах не указаны подробно условия экспериментальных способов, обычно соответствующих общепринятым условиям, такими как условия, описанные в «Руководстве по лабораторному молекулярному клонированию» (перевод Хуанг Пейтанг и др., Пекин: Science Press, 2002) издательства Sambrook. J et al., или в соответствии с условиями, рекомендованными производителем (например, в технических описаниях продуктов). Если не указано иное, процентные доли и части рассчитывают по массе.
Материалы и реагенты для экспериментов, используемые в последующих примерах, могут быть получены по коммерческим каналам, если не указано иное.
Пример 1 Конструирование мутантов
В соответствии с аминокислотной последовательностью 1 (SEQ ID NO.: 1) лизил-тРНК синтетазы дикого типа pylRs, она была клонирована в сайт Spel-Sall ниже промотора araBAD плазмиды вектора экспрессии pEvol-pBpF (приобретена у компании NTCC, устойчива к хлорамфениколу), причем сайт рестрикции Spel был увеличен с помощью ПЦР, а сайт SalI принадлежал самому вектору. Сохранение исходного промотора глутамина glnS плазмиды вектора экспрессии pEvol-pBpF. Ниже промотора рroK плазмиды вектора экспрессии pEvol-pBpF последовательность ДНК (SEQ ID NO.: 9) тРНК (pylTcua) лизил-тРНК синтетазы вставляли с помощью ПЦР. Эта плазмида была названа pEvol-pylRs-pylT.
В соответствии с аминокислотной последовательностью (SEQ ID NO.: 1) лизил-тРНК синтетазы дикого типа pylRs, вводили мутацию R19H для получения мутантной лизил-тРНК синтетазы pylRs (R19H) с аминокислотной последовательностью, как показано в SEQ ID NO.: 7. В соответствии с аминокислотной последовательностью (SEQ ID NO.: 1) лизил-тРНК синтетазы дикого типа pylRs, вводили мутацию H29R для получения мутантной лизил-тРНК синтетазы pylRs (H29R) с аминокислотной последовательностью, как показано в SEQ ID NO.: 8. В соответствии с аминокислотной последовательностью (SEQ ID NO.: 1) лизил-тРНК синтетазы дикого типа pylRs, вводили мутации R19H, H29R и получали мутантную лизил-тРНК синтетазу pylRs (R19H, H29R), как показано в SEQ ID NO.: 6. В соответствии с аминокислотной последовательностью (SEQ ID NO.: 1) лизил-тРНК синтетазы дикого типа pylRs, вводили мутации R19H, I26V, H29R для получения мутантной лизил-тРНК синтетазы pylRs (R19H, 126V, H29R), как показано в SEQ ID NO.: 3. В соответствии с аминокислотной последовательностью (SEQ ID NO.: 1) лизил-тРНК синтетазы дикого типа pylRs, вводили мутации R19H, H29R, T122S, Y384F и получали аминокислотную последовательность мутантной лизил-тРНК синтетазы pylRs (R19H, H29R, T122S, Y384F), как показано в SEQ ID NO.: 4. В соответствии с аминокислотной последовательностью (SEQ ID NO.: 1) лизил-тРНК синтетазы дикого типа pylRs, вводили мутации R19H, H29R, L309A, C348S и получали аминокислотную последовательность мутантной лизил-тРНК синтетазы pylRs (R19H, H29R, L309A, C348S), как показано в SEQ ID NO.: 5.
Используя плазмиду pEvol-pylRs-pylT в качестве шаблона, конструировали праймеры, см. SEQ ID NO.: 10 и SEQ ID NO.: 11, и вводили сайт-направленную мутацию R19H. Продукты ПЦР обрабатывали Dpnl, разделяли с помощью электрофореза нуклеиновых кислот, экстрагировали с помощью набора для восстановления ДНК из агарозного геля, лигировали ДНК-лигазой Т4 и трансформировали в большие компетентные клетки E.coli Тор10 химическим способом (способ СаСl2). Трансформированные клетки культивировали на агаровой среде LB (10 г/л дрожжевого пептона, 5 г/л порошка дрожжевого экстракта, 10 г/л NaCl, 1,5% агар), содержащей хлорамфеникол, при температуре 37°С в течение ночи. Отбирали единичную живую колонию и культивировали в жидкой среде LB (10 г/л дрожжевого пептона, 5 г/л порошка дрожжевого экстракта, 10 г/л NaCl), содержащей хлорамфеникол, при 37°С и при 220 об/мин в течение ночи. Полученную плазмиду экстрагировали с помощью набора Plasmid Mini Extraction Kit и назвали pEvol-pylRs(R19H)-pylT;
Используя плазмиду pEvol-pylRs-pylT в качестве шаблона, конструировали праймеры, см. SEQ ID NO.: 12 и SEQ ID NO.: 13, вводили сайт-направленную мутацию H29R, а результирующая плазмида была названа pEvol-pylRs(H29R)-pylT;
Используя плазмиду pEvol-pylRs(R19H)-pylT в качестве шаблона, конструировали праймеры, см. SEQ ID NO.: 12 и SEQ ID NO.: 13, вводили сайт-направленную мутацию H29R, а результирующая плазмида была названа pEvol-pylRs(R19H, H29R)-pylT. Карта плазмиды показана на Фиг. 1.
5'-ATACCGGCACCATCCACAAG-3' (SEQ ID NO.: 10)
5'-GGCTCATCCACAGACCAGTT-3' (SEQ ID NO.: 11)
5'-GCGAGGTTTCCCGTAGCAAA-3' (SEQ ID NO.: 12)
5'-GGTGTTTGATCTTGTGGATGGT-3' (SEQ ID NO.: 13)
Использовали описанные выше способы для раздельного конструирования pEvol-pylRs (R19H, I26V, H29R)-pylT, плазмиды pEvol-pylRs (R19H, H29R, T122S, Y384F)-pylT и плазмиды pEvol-pylRs (R19H, H29R, L309A, C348S)-pylT.
Пример 2 Конструирование штамма и экспрессия высокой плотности белка слияния, модифицированного трет-бутоксикарбонилом (Вое)
Плазмида pEvol-pylRs-pylT, плазмида pEvol-pylRs(R19H)-pylT, плазмида pEvol-pylRs (H29R)-pylT, плазмида pEvol-pylRs(R19H, H29R)-pylT, плазмида pEvol-pylRs(R19H, I26V, H29R)-pylT и плазмида pEvol-pylRs(R19H, H29R, T122S, Y384F)-pylT были соответственно совместно трансформированы вектором экспрессии белка слияния инсулина pBAD-INS (устойчив к канамицину) в компетентные клетки E.coli Тор10 (компетентные клетки приобретены у компании Thermo) химическим способом (способ СаСl2). Трансформированные клетки в течение ночи культивировали на агаровой среде LB (10 г/л дрожжевого пептона, 5 г/л порошка дрожжевого экстракта, 10 г/л NaCl, 1,5% агар), содержащей 25 мкг/мл канамицина и 17 мкг/мл хлорамфеникола, при температуре 37°С. Отбирали единичную живую колонию и в течение ночи культивировали в жидкой среде LB (10 г/л дрожжевого пептона, 5 г/л порошка дрожжевого экстракта, 10 г/л NaCl), содержащей 25 мкг/мл канамицина и 17 мкг/мл хлорамфеникола, при 37°С и при 220 об/мин. К окончательному концентрату добавляли 20% глицерол для сохранения штамма.
Каждый штамм инокулировали в жидкую среду LB при 37°С и 220 об/мин в течение ночи, инокуляцию осуществляли в емкости с 1% (об./об.) ферментационной средой (12 г/л дрожжевого пептона, 24 г/л порошка дрожжевого экстракта, 4 мл/л глицерина, 12,8 г/л двузамещенного фосфорнокислого натрия, 3 г/л однозамещенного фосфорнокислого калия и 0,3%о пеногасителя), культивировали при 35 (±3)°С, при 200-1000 об/мин и расходе воздуха 2-6 л/мин. После культивирования в течение 3-10 часов до конца ферментации со ступенчатым расходом подавали питательную среду, содержащую глицерин и дрожжевой пептон. После культивирования, пока показатель OD600 не достигал 25-80, для индукции добавляли конечную концентрацию 0,25% L-ara и конечную концентрацию 5 ммоль/л Boc-Lys. Продолжали культивировать, пока показатель OD600 не достигал 180-220, после чего емкость извлекали. Затем штамм собирали центрифугированием (5000 об/мин, 30 мин, 25°С). Для выявления экспрессии Вос-модифицированных лизинсодержащих белков слияния в целых клетках различных штаммов использовали электрофорез в SDS-полиакриламиде.
Белок слияния экспрессирован в форме нерастворимого «внутриклеточного тельца». Чтобы высвободить внутриклеточное тельце, клетки Е. coli разрушали с помощью гомогенизатора высокого давления. Нуклеиновые кислоты, остатки клеток и растворимые белки удаляли центрифугированием при 10000 g. Внутриклеточные тельца, содержащие белок слияния, промывали чистой водой, и полученный осадок внутриклеточного тельца использовали в качестве исходного материала для укладки.
Уровни экспрессии белков слияния различных мутантных ферментов являются следующими:
Для повторной укладки белка слияния внутриклеточные тельца растворяли в 7,5 моль/л растворе мочевины с рН 10,5, содержащем 2-10 ммоль/л меркаптоэтанола так, чтобы общая концентрация белка после растворения составляла 10-25 мг/мл. Образец разбавляли в 5-10 раз, и обычную укладку выполняли в течение 16-30 часов при температуре от 4 до 8°С и рН от 10,5 до 11,7. При температуре 18-25°С значение рН поддерживали на уровне 8,0-9,5 и использовали трипсин и карбоксипептидазу В для гидролиза гибридной протеазы в течение 10-20 часов, а затем для прекращения реакции ферментативного гидролиза добавляли 0,45 моль/л сульфата аммония. Результаты анализа обращенно-фазовой ВЭЖХ показывают, что выход на этой стадии ферментативного гидролиза превышает 90%. Аналог инсулина, полученный после разложения с помощью трипсина и карбоксипептидазы В, называется ВОС-лизиновый инсулин. Вос-лизиновый инсулин не может быть гидролизирован с помощью ферментов в указанных выше условиях. Образец осветляли мембранной фильтрацией, используя в качестве буфера раствор сульфата аммония 0,45 ммоль/л, и первоначально очищали гидрофобной хроматографией. Чистота после электрофореза в полиакриламидных гелях с использованием додецилсульфата натрия (SDS) достигает 90%, а полученный Вос-инсулин человека проанализировали с помощью времяпролетной масс-спектрометрии с матрично-активированной лазерной десорбцией/ионизацией (MALDI-TOF), и было обнаружено, что его молекулярная масса соответствует теоретической молекулярной массе в 5907,7 Да. Образцы собирали путем элюирования гидрофобной хроматографией и добавляли соляную кислоту для проведения реакции снятия защитных групп с Вос-инсулина человека. Для регулирования рН до уровня 2,8-3,2 и для прекращения реакции добавляли раствор гидроксида натрия. После двух этапов обращенно-фазовой хроматографии под высоким давлением выход рекомбинантного инсулина человека превышает 85%.
Уровни экспрессии рекомбинантного инсулина человека для различных мутантных ферментов являются следующими:
Результаты показывают, что использование мутантного фермента по настоящему изобретению для получения целевого белка, содержащего Вос-лизин, может значительно увеличить объем инсерций неприродных аминокислот и количество целевого белка, содержащего неприродные аминокислоты.
Пример 3 Конструирование штамма и экспрессия высокой плотности белка слияния, модифицированного бутиноксикарбонилом
Плазмида pEvol-pylRs-pylT, плазмида pEvol-pylRs(R19H)-pylT, плазмида pEvol-pylRs(H29R)-pylT, плазмида pEvol-pylRs(R19H, H29R)-pylT, плазмида pEvol-pylRs(R19H29, I26V, H29R))-pylT и плазмида pEvol-pylRs(R19H, H29R, L309A, C348S)-pylT, были соответственно совместно трансформированы вектором экспрессии белка слияния инсулина pBAD-INS (плазмида, сконструированная нашей компанией, устойчивая к канамицину) химическим способом (способ СаСl2) в большие компетентные клетки E.coli Тор10 (компетентные клетки приобретены у компании Thermo). Трансформированные клетки в течение ночи культивировали на агаровой среде LB (10 г/л дрожжевого пептона, 5 г/л порошка дрожжевого экстракта, 10 г/л NaCl, 1,5% агар), содержащей 25 мкг/мл канамицина и 17 мкг/мл хлорамфеникола, при температуре 37°С. Отбирали единичную живую колонию и помещали на ночь в жидкую среду LB (10 г/л дрожжевого пептона, 5 г/л порошка дрожжевого экстракта, 10 г/л NaCl), содержащую 25 мкг/мл канамицина и 17 мкг/мл хлорамфеникола, при 37°С и при 220 об/мин. К окончательному концентрату добавляли 20% глицерол для сохранения штамма.
Каждый штамм инокулировали в жидкую среду LB при 37°С и 220 об/мин в течение ночи, инокуляцию осуществляли в емкости с 1% (об./об.) ферментационной средой (12 г/л дрожжевого пептона, 24 г/л порошка дрожжевого экстракта, 4 мл/л глицерина, 12,8 г/л двузамещенного фосфорнокислого натрия, 3 г/л однозамещенного фосфорнокислого калия и 0,3% пеногасителя), культивировали при 35 (±3)°С, при 200-1000 об/мин и расходе воздуха 2-6 л/мин. После культивирования в течение 3-10 часов до конца ферментации со ступенчатым расходом подавали питательную среду, содержащую глицерин и дрожжевой пептон. После культивирования, пока показатель OD600 не достигал 25-80, для индукции добавляли конечную концентрацию 0,25% L-ara и конечную концентрацию 5 ммоль/л бутинилоксикарбонила-Lys. Продолжали культивировать, пока показатель OD600 не достигал 180-220, после чего емкость извлекали. Затем штамм собирали центрифугированием (5000 об/мин, 30 мин, 25°С). Для выявления экспрессии модифицированного бутинилоксикарбонилом белка слияния лизина в целых клетках различных штаммов использовали электрофорез в SDS-полиакриламиде
Белок слияния экспрессирован в форме нерастворимого «внутриклеточного тельца». Чтобы высвободить внутриклеточное тельце, клетки Е. coli разрушали с помощью гомогенизатора высокого давления. Нуклеиновые кислоты, остатки клеток и растворимые белки удаляли центрифугированием при 10000 g. Внутриклеточные тельца, содержащие белок слияния, промывали чистой водой, и полученный осадок внутриклеточного тельца использовали в качестве исходного материала для укладки. Для повторной укладки белка слияния внутриклеточные тельца растворяли в 7,5 моль/л растворе мочевины с рН 10,5, содержащем 2-10 ммоль/л меркаптоэтанола так, чтобы общая концентрация белка после растворения составляла 10-25 мг/мл. Образец разбавляли в 5-10 раз, и обычную укладку выполняли в течение 16-30 часов при температуре от 4 до 8°С и рН от 10,5 до 11,7. При температуре 18-25°С значение рН поддерживали на уровне 8,0-9,5 и использовали трипсин и карбоксипептидазу В для гидролиза гибридной протеазы в течение 10-20 часов, а затем для прекращения реакции ферментативного гидролиза добавляли 0,45 моль/л сульфата аммония. Результаты анализа обращенно-фазовой ВЭЖХ показывают, что выход на этой стадии ферментативного гидролиза превышает 90%. Аналог инсулина, полученный после разложения с помощью трипсина и карбоксипептидазы В, называется бутинилоксикарбонил-лизиновый инсулин. Бутинилоксикарбонил-лизиновый инсулин не может быть гидролизирован с помощью ферментов в указанных выше условиях. Образец осветляли мембранной фильтрацией, используя в качестве буфера раствор сульфата аммония 0,45 ммоль/л, и первоначально очищали гидрофобной хроматографией. Чистота после электрофореза в полиакриламидных гелях с использованием додецилсульфата натрия (SDS) достигает 90%, а полученный бутиноксикарбонил-инсулин человека проанализировали с помощью времяпролетной масс-спектрометрии с матрично-активированной лазерной десорбцией/ионизацией (MALDI-TOF), и было обнаружено, что его молекулярная масса соответствует теоретической молекулярной массе в 5907,7 Да.
Результаты показывают, что использование мутантного фермента по настоящему изобретению для получения модифицированного бутиноксикарбонилом целевого белка может значительно увеличить объем инсерций неприродной аминокислоты и количество целевого белка, содержащего неприродную аминокислоту.
Все документы, упомянутые в настоящем изобретении, включены в данный документ посредством ссылки, как если бы каждый документ был включен с помощью отдельной ссылки. Кроме того, следует понимать, что после изучения вышеизложенного описания изобретения специалистами в данной области в изобретение могут быть внесены различные изменения или модификации, и что эти аналоги в равной степени попадают в пределы объема формулы изобретения, приложенной к этой заявке.
--->
ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ
<110> НИНГБО КУНПЕНГ БИОТЕКХ КО, ЛТД.
<120> АМИНОАЦИЛ-тРНК СИНТЕТАЗА ДЛЯ ЭФФЕКТИВНОГО ВВЕДЕНИЯ ПРОИЗВОДНОГО
ЛИЗИНА В
БЕЛОК
<130> P2020-0085
<150> CN201910209626.6
<151> 2019-03-19
<160> 13
<170> PatentIn version 3.5
<210> 1
<211> 454
<212> ПРТ
<213> Methanosarcina mazei
<400> 1
Met Asp Lys Lys Pro Leu Asn Thr Leu Ile Ser Ala Thr Gly Leu Trp
1 5 10 15
Met Ser Arg Thr Gly Thr Ile His Lys Ile Lys His His Glu Val Ser
20 25 30
Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val
35 40 45
Asn Asn Ser Arg Ser Ser Arg Thr Ala Arg Ala Leu Arg His His Lys
50 55 60
Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Leu Asn
65 70 75 80
Lys Phe Leu Thr Lys Ala Asn Glu Asp Gln Thr Ser Val Lys Val Lys
85 90 95
Val Val Ser Ala Pro Thr Arg Thr Lys Lys Ala Met Pro Lys Ser Val
100 105 110
Ala Arg Ala Pro Lys Pro Leu Glu Asn Thr Glu Ala Ala Gln Ala Gln
115 120 125
Pro Ser Gly Ser Lys Phe Ser Pro Ala Ile Pro Val Ser Thr Gln Glu
130 135 140
Ser Val Ser Val Pro Ala Ser Val Ser Thr Ser Ile Ser Ser Ile Ser
145 150 155 160
Thr Gly Ala Thr Ala Ser Ala Leu Val Lys Gly Asn Thr Asn Pro Ile
165 170 175
Thr Ser Met Ser Ala Pro Val Gln Ala Ser Ala Pro Ala Leu Thr Lys
180 185 190
Ser Gln Thr Asp Arg Leu Glu Val Leu Leu Asn Pro Lys Asp Glu Ile
195 200 205
Ser Leu Asn Ser Gly Lys Pro Phe Arg Glu Leu Glu Ser Glu Leu Leu
210 215 220
Ser Arg Arg Lys Lys Asp Leu Gln Gln Ile Tyr Ala Glu Glu Arg Glu
225 230 235 240
Asn Tyr Leu Gly Lys Leu Glu Arg Glu Ile Thr Arg Phe Phe Val Asp
245 250 255
Arg Gly Phe Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Leu Glu Tyr
260 265 270
Ile Glu Arg Met Gly Ile Asp Asn Asp Thr Glu Leu Ser Lys Gln Ile
275 280 285
Phe Arg Val Asp Lys Asn Phe Cys Leu Arg Pro Met Leu Ala Pro Asn
290 295 300
Leu Tyr Asn Tyr Leu Arg Lys Leu Asp Arg Ala Leu Pro Asp Pro Ile
305 310 315 320
Lys Ile Phe Glu Ile Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys
325 330 335
Glu His Leu Glu Glu Phe Thr Met Leu Asn Phe Cys Gln Met Gly Ser
340 345 350
Gly Cys Thr Arg Glu Asn Leu Glu Ser Ile Ile Thr Asp Phe Leu Asn
355 360 365
His Leu Gly Ile Asp Phe Lys Ile Val Gly Asp Ser Cys Met Val Tyr
370 375 380
Gly Asp Thr Leu Asp Val Met His Gly Asp Leu Glu Leu Ser Ser Ala
385 390 395 400
Val Val Gly Pro Ile Pro Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro
405 410 415
Trp Ile Gly Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Lys His
420 425 430
Asp Phe Lys Asn Ile Lys Arg Ala Ala Arg Ser Glu Ser Tyr Tyr Asn
435 440 445
Gly Ile Ser Thr Asn Leu
450
<210> 2
<211> 454
<212> ПРТ
<213> Methanosarcina mazei
<400> 2
Met Asp Lys Lys Pro Leu Asn Thr Leu Ile Ser Ala Thr Gly Leu Trp
1 5 10 15
Met Ser Arg Thr Gly Thr Ile His Lys Ile Lys His His Glu Val Ser
20 25 30
Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val
35 40 45
Asn Asn Ser Arg Ser Ser Arg Thr Ala Arg Ala Leu Arg His His Lys
50 55 60
Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Leu Asn
65 70 75 80
Lys Phe Leu Thr Lys Ala Asn Glu Asp Gln Thr Ser Val Lys Val Lys
85 90 95
Val Val Ser Ala Pro Thr Arg Thr Lys Lys Ala Met Pro Lys Ser Val
100 105 110
Ala Arg Ala Pro Lys Pro Leu Glu Asn Thr Glu Ala Ala Gln Ala Gln
115 120 125
Pro Ser Gly Ser Lys Phe Ser Pro Ala Ile Pro Val Ser Thr Gln Glu
130 135 140
Ser Val Ser Val Pro Ala Ser Val Ser Thr Ser Ile Ser Ser Ile Ser
145 150 155 160
Thr Gly Ala Thr Ala Ser Ala Leu Val Lys Gly Asn Thr Asn Pro Ile
165 170 175
Thr Ser Met Ser Ala Pro Val Gln Ala Ser Ala Pro Ala Leu Thr Lys
180 185 190
Ser Gln Thr Asp Arg Leu Glu Val Leu Leu Asn Pro Lys Asp Glu Ile
195 200 205
Ser Leu Asn Ser Gly Lys Pro Phe Arg Glu Leu Glu Ser Glu Leu Leu
210 215 220
Ser Arg Arg Lys Lys Asp Leu Gln Gln Ile Tyr Ala Glu Glu Arg Glu
225 230 235 240
Asn Tyr Leu Gly Lys Leu Glu Arg Glu Ile Thr Arg Phe Phe Val Asp
245 250 255
Arg Gly Phe Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Leu Glu Tyr
260 265 270
Ile Glu Arg Met Gly Ile Asp Asn Asp Thr Glu Leu Ser Lys Gln Ile
275 280 285
Phe Arg Val Asp Lys Asn Phe Cys Leu Arg Pro Met Leu Ala Pro Asn
290 295 300
Leu Tyr Asn Tyr Leu Arg Lys Leu Asp Arg Ala Leu Pro Asp Pro Ile
305 310 315 320
Lys Ile Phe Glu Ile Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys
325 330 335
Glu His Leu Glu Glu Phe Thr Met Leu Asn Phe Cys Gln Met Gly Ser
340 345 350
Gly Cys Thr Arg Glu Asn Leu Glu Ser Ile Ile Thr Asp Phe Leu Asn
355 360 365
His Leu Gly Ile Asp Phe Lys Ile Val Gly Asp Ser Cys Met Val Tyr
370 375 380
Gly Asp Thr Leu Asp Val Met His Gly Asp Leu Glu Leu Ser Ser Ala
385 390 395 400
Val Val Gly Pro Ile Pro Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro
405 410 415
Trp Ile Gly Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Lys His
420 425 430
Asp Phe Lys Asn Ile Lys Arg Ala Ala Arg Ser Gly Ser Tyr Tyr Asn
435 440 445
Gly Ile Ser Thr Asn Leu
450
<210> 3
<211> 454
<212> ПРТ
<213> искусственная последовательность
<220>
<223> мутантная лизил-тРНК-синтетаза
<400> 3
Met Asp Lys Lys Pro Leu Asn Thr Leu Ile Ser Ala Thr Gly Leu Trp
1 5 10 15
Met Ser His Thr Gly Thr Ile His Lys Val Lys His Arg Glu Val Ser
20 25 30
Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val
35 40 45
Asn Asn Ser Arg Ser Ser Arg Thr Ala Arg Ala Leu Arg His His Lys
50 55 60
Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Leu Asn
65 70 75 80
Lys Phe Leu Thr Lys Ala Asn Glu Asp Gln Thr Ser Val Lys Val Lys
85 90 95
Val Val Ser Ala Pro Thr Arg Thr Lys Lys Ala Met Pro Lys Ser Val
100 105 110
Ala Arg Ala Pro Lys Pro Leu Glu Asn Thr Glu Ala Ala Gln Ala Gln
115 120 125
Pro Ser Gly Ser Lys Phe Ser Pro Ala Ile Pro Val Ser Thr Gln Glu
130 135 140
Ser Val Ser Val Pro Ala Ser Val Ser Thr Ser Ile Ser Ser Ile Ser
145 150 155 160
Thr Gly Ala Thr Ala Ser Ala Leu Val Lys Gly Asn Thr Asn Pro Ile
165 170 175
Thr Ser Met Ser Ala Pro Val Gln Ala Ser Ala Pro Ala Leu Thr Lys
180 185 190
Ser Gln Thr Asp Arg Leu Glu Val Leu Leu Asn Pro Lys Asp Glu Ile
195 200 205
Ser Leu Asn Ser Gly Lys Pro Phe Arg Glu Leu Glu Ser Glu Leu Leu
210 215 220
Ser Arg Arg Lys Lys Asp Leu Gln Gln Ile Tyr Ala Glu Glu Arg Glu
225 230 235 240
Asn Tyr Leu Gly Lys Leu Glu Arg Glu Ile Thr Arg Phe Phe Val Asp
245 250 255
Arg Gly Phe Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Leu Glu Tyr
260 265 270
Ile Glu Arg Met Gly Ile Asp Asn Asp Thr Glu Leu Ser Lys Gln Ile
275 280 285
Phe Arg Val Asp Lys Asn Phe Cys Leu Arg Pro Met Leu Ala Pro Asn
290 295 300
Leu Tyr Asn Tyr Leu Arg Lys Leu Asp Arg Ala Leu Pro Asp Pro Ile
305 310 315 320
Lys Ile Phe Glu Ile Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys
325 330 335
Glu His Leu Glu Glu Phe Thr Met Leu Asn Phe Cys Gln Met Gly Ser
340 345 350
Gly Cys Thr Arg Glu Asn Leu Glu Ser Ile Ile Thr Asp Phe Leu Asn
355 360 365
His Leu Gly Ile Asp Phe Lys Ile Val Gly Asp Ser Cys Met Val Tyr
370 375 380
Gly Asp Thr Leu Asp Val Met His Gly Asp Leu Glu Leu Ser Ser Ala
385 390 395 400
Val Val Gly Pro Ile Pro Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro
405 410 415
Trp Ile Gly Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Lys His
420 425 430
Asp Phe Lys Asn Ile Lys Arg Ala Ala Arg Ser Glu Ser Tyr Tyr Asn
435 440 445
Gly Ile Ser Thr Asn Leu
450
<210> 4
<211> 454
<212> ПРТ
<213> искусственная последовательность
<220>
<223> мутантная лизил-тРНК-синтетаза
<400> 4
Met Asp Lys Lys Pro Leu Asn Thr Leu Ile Ser Ala Thr Gly Leu Trp
1 5 10 15
Met Ser His Thr Gly Thr Ile His Lys Ile Lys His Arg Glu Val Ser
20 25 30
Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val
35 40 45
Asn Asn Ser Arg Ser Ser Arg Thr Ala Arg Ala Leu Arg His His Lys
50 55 60
Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Leu Asn
65 70 75 80
Lys Phe Leu Thr Lys Ala Asn Glu Asp Gln Thr Ser Val Lys Val Lys
85 90 95
Val Val Ser Ala Pro Thr Arg Thr Lys Lys Ala Met Pro Lys Ser Val
100 105 110
Ala Arg Ala Pro Lys Pro Leu Glu Asn Ser Glu Ala Ala Gln Ala Gln
115 120 125
Pro Ser Gly Ser Lys Phe Ser Pro Ala Ile Pro Val Ser Thr Gln Glu
130 135 140
Ser Val Ser Val Pro Ala Ser Val Ser Thr Ser Ile Ser Ser Ile Ser
145 150 155 160
Thr Gly Ala Thr Ala Ser Ala Leu Val Lys Gly Asn Thr Asn Pro Ile
165 170 175
Thr Ser Met Ser Ala Pro Val Gln Ala Ser Ala Pro Ala Leu Thr Lys
180 185 190
Ser Gln Thr Asp Arg Leu Glu Val Leu Leu Asn Pro Lys Asp Glu Ile
195 200 205
Ser Leu Asn Ser Gly Lys Pro Phe Arg Glu Leu Glu Ser Glu Leu Leu
210 215 220
Ser Arg Arg Lys Lys Asp Leu Gln Gln Ile Tyr Ala Glu Glu Arg Glu
225 230 235 240
Asn Tyr Leu Gly Lys Leu Glu Arg Glu Ile Thr Arg Phe Phe Val Asp
245 250 255
Arg Gly Phe Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Leu Glu Tyr
260 265 270
Ile Glu Arg Met Gly Ile Asp Asn Asp Thr Glu Leu Ser Lys Gln Ile
275 280 285
Phe Arg Val Asp Lys Asn Phe Cys Leu Arg Pro Met Leu Ala Pro Asn
290 295 300
Leu Tyr Asn Tyr Leu Arg Lys Leu Asp Arg Ala Leu Pro Asp Pro Ile
305 310 315 320
Lys Ile Phe Glu Ile Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys
325 330 335
Glu His Leu Glu Glu Phe Thr Met Leu Asn Phe Cys Gln Met Gly Ser
340 345 350
Gly Cys Thr Arg Glu Asn Leu Glu Ser Ile Ile Thr Asp Phe Leu Asn
355 360 365
His Leu Gly Ile Asp Phe Lys Ile Val Gly Asp Ser Cys Met Val Phe
370 375 380
Gly Asp Thr Leu Asp Val Met His Gly Asp Leu Glu Leu Ser Ser Ala
385 390 395 400
Val Val Gly Pro Ile Pro Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro
405 410 415
Trp Ile Gly Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Lys His
420 425 430
Asp Phe Lys Asn Ile Lys Arg Ala Ala Arg Ser Glu Ser Tyr Tyr Asn
435 440 445
Gly Ile Ser Thr Asn Leu
450
<210> 5
<211> 454
<212> ПРТ
<213> искусственная последовательность
<220>
<223> мутантная лизил-тРНК-синтетаза
<400> 5
Met Asp Lys Lys Pro Leu Asn Thr Leu Ile Ser Ala Thr Gly Leu Trp
1 5 10 15
Met Ser His Thr Gly Thr Ile His Lys Ile Lys His Arg Glu Val Ser
20 25 30
Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val
35 40 45
Asn Asn Ser Arg Ser Ser Arg Thr Ala Arg Ala Leu Arg His His Lys
50 55 60
Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Leu Asn
65 70 75 80
Lys Phe Leu Thr Lys Ala Asn Glu Asp Gln Thr Ser Val Lys Val Lys
85 90 95
Val Val Ser Ala Pro Thr Arg Thr Lys Lys Ala Met Pro Lys Ser Val
100 105 110
Ala Arg Ala Pro Lys Pro Leu Glu Asn Thr Glu Ala Ala Gln Ala Gln
115 120 125
Pro Ser Gly Ser Lys Phe Ser Pro Ala Ile Pro Val Ser Thr Gln Glu
130 135 140
Ser Val Ser Val Pro Ala Ser Val Ser Thr Ser Ile Ser Ser Ile Ser
145 150 155 160
Thr Gly Ala Thr Ala Ser Ala Leu Val Lys Gly Asn Thr Asn Pro Ile
165 170 175
Thr Ser Met Ser Ala Pro Val Gln Ala Ser Ala Pro Ala Leu Thr Lys
180 185 190
Ser Gln Thr Asp Arg Leu Glu Val Leu Leu Asn Pro Lys Asp Glu Ile
195 200 205
Ser Leu Asn Ser Gly Lys Pro Phe Arg Glu Leu Glu Ser Glu Leu Leu
210 215 220
Ser Arg Arg Lys Lys Asp Leu Gln Gln Ile Tyr Ala Glu Glu Arg Glu
225 230 235 240
Asn Tyr Leu Gly Lys Leu Glu Arg Glu Ile Thr Arg Phe Phe Val Asp
245 250 255
Arg Gly Phe Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Leu Glu Tyr
260 265 270
Ile Glu Arg Met Gly Ile Asp Asn Asp Thr Glu Leu Ser Lys Gln Ile
275 280 285
Phe Arg Val Asp Lys Asn Phe Cys Leu Arg Pro Met Leu Ala Pro Asn
290 295 300
Leu Tyr Asn Tyr Ala Arg Lys Leu Asp Arg Ala Leu Pro Asp Pro Ile
305 310 315 320
Lys Ile Phe Glu Ile Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys
325 330 335
Glu His Leu Glu Glu Phe Thr Met Leu Asn Phe Ser Gln Met Gly Ser
340 345 350
Gly Cys Thr Arg Glu Asn Leu Glu Ser Ile Ile Thr Asp Phe Leu Asn
355 360 365
His Leu Gly Ile Asp Phe Lys Ile Val Gly Asp Ser Cys Met Val Tyr
370 375 380
Gly Asp Thr Leu Asp Val Met His Gly Asp Leu Glu Leu Ser Ser Ala
385 390 395 400
Val Val Gly Pro Ile Pro Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro
405 410 415
Trp Ile Gly Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Lys His
420 425 430
Asp Phe Lys Asn Ile Lys Arg Ala Ala Arg Ser Glu Ser Tyr Tyr Asn
435 440 445
Gly Ile Ser Thr Asn Leu
450
<210> 6
<211> 454
<212> ПРТ
<213> искусственная последовательность
<220>
<223> мутантная лизил-тРНК-синтетаза
<400> 6
Met Asp Lys Lys Pro Leu Asn Thr Leu Ile Ser Ala Thr Gly Leu Trp
1 5 10 15
Met Ser His Thr Gly Thr Ile His Lys Ile Lys His Arg Glu Val Ser
20 25 30
Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val
35 40 45
Asn Asn Ser Arg Ser Ser Arg Thr Ala Arg Ala Leu Arg His His Lys
50 55 60
Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Leu Asn
65 70 75 80
Lys Phe Leu Thr Lys Ala Asn Glu Asp Gln Thr Ser Val Lys Val Lys
85 90 95
Val Val Ser Ala Pro Thr Arg Thr Lys Lys Ala Met Pro Lys Ser Val
100 105 110
Ala Arg Ala Pro Lys Pro Leu Glu Asn Thr Glu Ala Ala Gln Ala Gln
115 120 125
Pro Ser Gly Ser Lys Phe Ser Pro Ala Ile Pro Val Ser Thr Gln Glu
130 135 140
Ser Val Ser Val Pro Ala Ser Val Ser Thr Ser Ile Ser Ser Ile Ser
145 150 155 160
Thr Gly Ala Thr Ala Ser Ala Leu Val Lys Gly Asn Thr Asn Pro Ile
165 170 175
Thr Ser Met Ser Ala Pro Val Gln Ala Ser Ala Pro Ala Leu Thr Lys
180 185 190
Ser Gln Thr Asp Arg Leu Glu Val Leu Leu Asn Pro Lys Asp Glu Ile
195 200 205
Ser Leu Asn Ser Gly Lys Pro Phe Arg Glu Leu Glu Ser Glu Leu Leu
210 215 220
Ser Arg Arg Lys Lys Asp Leu Gln Gln Ile Tyr Ala Glu Glu Arg Glu
225 230 235 240
Asn Tyr Leu Gly Lys Leu Glu Arg Glu Ile Thr Arg Phe Phe Val Asp
245 250 255
Arg Gly Phe Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Leu Glu Tyr
260 265 270
Ile Glu Arg Met Gly Ile Asp Asn Asp Thr Glu Leu Ser Lys Gln Ile
275 280 285
Phe Arg Val Asp Lys Asn Phe Cys Leu Arg Pro Met Leu Ala Pro Asn
290 295 300
Leu Tyr Asn Tyr Leu Arg Lys Leu Asp Arg Ala Leu Pro Asp Pro Ile
305 310 315 320
Lys Ile Phe Glu Ile Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys
325 330 335
Glu His Leu Glu Glu Phe Thr Met Leu Asn Phe Cys Gln Met Gly Ser
340 345 350
Gly Cys Thr Arg Glu Asn Leu Glu Ser Ile Ile Thr Asp Phe Leu Asn
355 360 365
His Leu Gly Ile Asp Phe Lys Ile Val Gly Asp Ser Cys Met Val Tyr
370 375 380
Gly Asp Thr Leu Asp Val Met His Gly Asp Leu Glu Leu Ser Ser Ala
385 390 395 400
Val Val Gly Pro Ile Pro Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro
405 410 415
Trp Ile Gly Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Lys His
420 425 430
Asp Phe Lys Asn Ile Lys Arg Ala Ala Arg Ser Glu Ser Tyr Tyr Asn
435 440 445
Gly Ile Ser Thr Asn Leu
450
<210> 7
<211> 454
<212> ПРТ
<213> искусственная последовательность
<220>
<223> мутантная лизил-тРНК-синтетаза
<400> 7
Met Asp Lys Lys Pro Leu Asn Thr Leu Ile Ser Ala Thr Gly Leu Trp
1 5 10 15
Met Ser His Thr Gly Thr Ile His Lys Ile Lys His His Glu Val Ser
20 25 30
Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val
35 40 45
Asn Asn Ser Arg Ser Ser Arg Thr Ala Arg Ala Leu Arg His His Lys
50 55 60
Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Leu Asn
65 70 75 80
Lys Phe Leu Thr Lys Ala Asn Glu Asp Gln Thr Ser Val Lys Val Lys
85 90 95
Val Val Ser Ala Pro Thr Arg Thr Lys Lys Ala Met Pro Lys Ser Val
100 105 110
Ala Arg Ala Pro Lys Pro Leu Glu Asn Thr Glu Ala Ala Gln Ala Gln
115 120 125
Pro Ser Gly Ser Lys Phe Ser Pro Ala Ile Pro Val Ser Thr Gln Glu
130 135 140
Ser Val Ser Val Pro Ala Ser Val Ser Thr Ser Ile Ser Ser Ile Ser
145 150 155 160
Thr Gly Ala Thr Ala Ser Ala Leu Val Lys Gly Asn Thr Asn Pro Ile
165 170 175
Thr Ser Met Ser Ala Pro Val Gln Ala Ser Ala Pro Ala Leu Thr Lys
180 185 190
Ser Gln Thr Asp Arg Leu Glu Val Leu Leu Asn Pro Lys Asp Glu Ile
195 200 205
Ser Leu Asn Ser Gly Lys Pro Phe Arg Glu Leu Glu Ser Glu Leu Leu
210 215 220
Ser Arg Arg Lys Lys Asp Leu Gln Gln Ile Tyr Ala Glu Glu Arg Glu
225 230 235 240
Asn Tyr Leu Gly Lys Leu Glu Arg Glu Ile Thr Arg Phe Phe Val Asp
245 250 255
Arg Gly Phe Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Leu Glu Tyr
260 265 270
Ile Glu Arg Met Gly Ile Asp Asn Asp Thr Glu Leu Ser Lys Gln Ile
275 280 285
Phe Arg Val Asp Lys Asn Phe Cys Leu Arg Pro Met Leu Ala Pro Asn
290 295 300
Leu Tyr Asn Tyr Leu Arg Lys Leu Asp Arg Ala Leu Pro Asp Pro Ile
305 310 315 320
Lys Ile Phe Glu Ile Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys
325 330 335
Glu His Leu Glu Glu Phe Thr Met Leu Asn Phe Cys Gln Met Gly Ser
340 345 350
Gly Cys Thr Arg Glu Asn Leu Glu Ser Ile Ile Thr Asp Phe Leu Asn
355 360 365
His Leu Gly Ile Asp Phe Lys Ile Val Gly Asp Ser Cys Met Val Tyr
370 375 380
Gly Asp Thr Leu Asp Val Met His Gly Asp Leu Glu Leu Ser Ser Ala
385 390 395 400
Val Val Gly Pro Ile Pro Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro
405 410 415
Trp Ile Gly Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Lys His
420 425 430
Asp Phe Lys Asn Ile Lys Arg Ala Ala Arg Ser Glu Ser Tyr Tyr Asn
435 440 445
Gly Ile Ser Thr Asn Leu
450
<210> 8
<211> 454
<212> ПРТ
<213> искусственная последовательность
<220>
<223> мутантная лизил-тРНК синтетаза
<400> 8
Met Asp Lys Lys Pro Leu Asn Thr Leu Ile Ser Ala Thr Gly Leu Trp
1 5 10 15
Met Ser Arg Thr Gly Thr Ile His Lys Ile Lys His Arg Glu Val Ser
20 25 30
Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val
35 40 45
Asn Asn Ser Arg Ser Ser Arg Thr Ala Arg Ala Leu Arg His His Lys
50 55 60
Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Leu Asn
65 70 75 80
Lys Phe Leu Thr Lys Ala Asn Glu Asp Gln Thr Ser Val Lys Val Lys
85 90 95
Val Val Ser Ala Pro Thr Arg Thr Lys Lys Ala Met Pro Lys Ser Val
100 105 110
Ala Arg Ala Pro Lys Pro Leu Glu Asn Thr Glu Ala Ala Gln Ala Gln
115 120 125
Pro Ser Gly Ser Lys Phe Ser Pro Ala Ile Pro Val Ser Thr Gln Glu
130 135 140
Ser Val Ser Val Pro Ala Ser Val Ser Thr Ser Ile Ser Ser Ile Ser
145 150 155 160
Thr Gly Ala Thr Ala Ser Ala Leu Val Lys Gly Asn Thr Asn Pro Ile
165 170 175
Thr Ser Met Ser Ala Pro Val Gln Ala Ser Ala Pro Ala Leu Thr Lys
180 185 190
Ser Gln Thr Asp Arg Leu Glu Val Leu Leu Asn Pro Lys Asp Glu Ile
195 200 205
Ser Leu Asn Ser Gly Lys Pro Phe Arg Glu Leu Glu Ser Glu Leu Leu
210 215 220
Ser Arg Arg Lys Lys Asp Leu Gln Gln Ile Tyr Ala Glu Glu Arg Glu
225 230 235 240
Asn Tyr Leu Gly Lys Leu Glu Arg Glu Ile Thr Arg Phe Phe Val Asp
245 250 255
Arg Gly Phe Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Leu Glu Tyr
260 265 270
Ile Glu Arg Met Gly Ile Asp Asn Asp Thr Glu Leu Ser Lys Gln Ile
275 280 285
Phe Arg Val Asp Lys Asn Phe Cys Leu Arg Pro Met Leu Ala Pro Asn
290 295 300
Leu Tyr Asn Tyr Leu Arg Lys Leu Asp Arg Ala Leu Pro Asp Pro Ile
305 310 315 320
Lys Ile Phe Glu Ile Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys
325 330 335
Glu His Leu Glu Glu Phe Thr Met Leu Asn Phe Cys Gln Met Gly Ser
340 345 350
Gly Cys Thr Arg Glu Asn Leu Glu Ser Ile Ile Thr Asp Phe Leu Asn
355 360 365
His Leu Gly Ile Asp Phe Lys Ile Val Gly Asp Ser Cys Met Val Tyr
370 375 380
Gly Asp Thr Leu Asp Val Met His Gly Asp Leu Glu Leu Ser Ser Ala
385 390 395 400
Val Val Gly Pro Ile Pro Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro
405 410 415
Trp Ile Gly Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Lys His
420 425 430
Asp Phe Lys Asn Ile Lys Arg Ala Ala Arg Ser Glu Ser Tyr Tyr Asn
435 440 445
Gly Ile Ser Thr Asn Leu
450
<210> 9
<211> 72
<212> ДНК
<213> искусственная последовательность
<220>
<223> кодирующая аминокислотная последовательность ортогональной тРНК
<400> 9
ggaaacctga tcatgtagat cgaatggact ctaaatccgt tcagccgggt tagattcccg
60
gggtttccgc ca
72
<210> 10
<211> 20
<212> ДНК
<213> искусственная последовательность
<220>
<223> праймер
<400> 10
ataccggcac catccacaag
20
<210> 11
<211> 20
<212> ДНК
<213> искусственная последовательность
<220>
<223> праймер
<400> 11
ggctcatcca cagaccagtt
20
<210> 12
<211> 20
<212> ДНК
<213> искусственная последовательность
<220>
<223> праймер
<400> 12
gcgaggtttc ccgtagcaaa
20
<210> 13
<211> 22
<212> ДНК
<213> искусственная последовательность
<220>
<223> праймер
<400> 13
ggtgtttgat cttgtggatg gt
22
<---
Claims (15)
1. Мутантная лизил-тРНК-синтетаза, где мутантная лизил-тРНК-синтетаза имеет мутацию в позиции 19 аргинина (R) и/или позиции 29 гистидина (H) в аминокислотной последовательности, соответствующей лизил-тРНК-синтетазе дикого типа, причем такая мутантная лизил-тРНК-синтетаза необязательно включает в себя мутацию на сайте, выбранном из группы, состоящей из изолейцина (I) в позиции 26, треонина (T) в позиции 122, лейцина (L) в позиции 309, цистеина (C) в позиции 348, тирозина (Y) в позиции 384 и их комбинации.
2. Мутантная лизил-тРНК-синтетаза по п. 1, причем такая мутантная лизил-тРНК-синтетаза представляет собой полипептид, имеющий аминокислотную последовательность, показанную в любой из SEQ ID NO: 3-8.
3. Изолированный полинуклеотид, кодирующий мутантную лизил-тРНК-синтетазу по п. 1.
4. Вектор для экспрессии мутантной лизил-тРНК-синтетазы, содержащий полинуклеотид по п. 3.
5. Клетка-хозяин для экспрессии мутантной лизил-тРНК-синтетазы, содержащая вектор по п. 4.
6. Клетка-хозяин по п. 5, причем такая клетка-хозяин содержит:
(а) мутантную лизил-тРНК-синтетазу по п. 1; и
(b) ортогональную тРНК, способную связываться с производным лизина в присутствии мутантной лизил-тРНК-синтетазы; и, необязательно,
(c) последовательность целевой нуклеиновой кислоты, кодирующую целевой белок, которая включает в себя кодон, распознаваемый ортогональной тРНК в позиции для введения производного лизина.
7. Система экспрессии, содержащая:
(а) мутантную лизил-тРНК-синтетазу по п. 1; и
(b) ортогональную тРНК, способную связываться с производным лизина в присутствии мутантной лизил-тРНК-синтетазы; и, необязательно,
(c) последовательность целевой нуклеиновой кислоты, кодирующую целевой белок, которая включает в себя кодон, распознаваемый ортогональной тРНК в позиции для введения производного лизина.
8. Набор для получения целевого белка, содержащего неприродную аминокислоту, содержащий (a) контейнер и (b) мутантную лизил-тРНК-синтетазу по п. 1, или полинуклеотид по п. 3, или вектор по п. 4, находящиеся в контейнере.
9. Применение мутантной лизил-тРНК-синтетазы по п. 1, или клетки-хозяина по п. 5, или системы экспрессии по п. 7, или набора по п. 8 для получения целевого белка, содержащего неприродную аминокислоту.
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201910209626.6 | 2019-03-19 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| RU2021130287A RU2021130287A (ru) | 2023-04-19 |
| RU2799794C2 true RU2799794C2 (ru) | 2023-07-11 |
Family
ID=
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| SU1195649A1 (ru) * | 1984-05-29 | 1987-04-30 | Институт биохимии им.А.В.Палладина | Способ получени лизил-тРНК-синтетазы |
| WO1997039016A1 (en) * | 1996-04-18 | 1997-10-23 | Smithkline Beecham Corporation | NOVEL LysS PROTEINS FROM STREPTOCOCCUS PNEUMONIAE |
| WO2019010164A1 (en) * | 2017-07-06 | 2019-01-10 | President And Fellows Of Harvard College | Evolution of trna synthetases |
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| SU1195649A1 (ru) * | 1984-05-29 | 1987-04-30 | Институт биохимии им.А.В.Палладина | Способ получени лизил-тРНК-синтетазы |
| WO1997039016A1 (en) * | 1996-04-18 | 1997-10-23 | Smithkline Beecham Corporation | NOVEL LysS PROTEINS FROM STREPTOCOCCUS PNEUMONIAE |
| WO2019010164A1 (en) * | 2017-07-06 | 2019-01-10 | President And Fellows Of Harvard College | Evolution of trna synthetases |
Non-Patent Citations (1)
| Title |
|---|
| YANAGISAWA T. ET AL. Multistep Engineering of Pyrrolysyl-tRNA Synthetase to Genetically Encode Nɛ-(o-Azidobenzyloxycarbonyl) lysine for Site-Specific Protein Modification. CHEM BIOL. 2008, v.15, n.11, pp.1187-1197. NEUMANN H. ET AL. Genetically encoding Nε-acetyllysine in recombinant proteins. NATURE CHEMICAL BIOLOGY. 2008, v.4, n.4, pp.232-234. * |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7621001B2 (ja) | リシン誘導体を効率的に導入するアミノアシル-tRNAシンテターゼ | |
| AU2020242724B2 (en) | Aminoacyl-tRNA synthetase for efficiently introducing lysine derivative in protein | |
| CN111718949B (zh) | 利用双质粒系统在蛋白中引入非天然氨基酸 | |
| CN108239633B (zh) | 一种催化活性得到提高的d-阿洛酮糖-3-差向异构酶的突变体及其应用 | |
| CN110408635B (zh) | 一种含有链霉亲和素元件的核酸构建物在蛋白质表达、纯化中的应用 | |
| CN111850020B (zh) | 利用质粒系统在蛋白中引入非天然氨基酸 | |
| JP7266325B2 (ja) | 蛍光タンパク質フラグメントを含む融合タンパク質およびその用途 | |
| RU2799794C2 (ru) | АМИНОАЦИЛ-тРНК-СИНТЕТАЗА ДЛЯ ЭФФЕКТИВНОГО ВВЕДЕНИЯ ПРОИЗВОДНОГО ЛИЗИНА В БЕЛОК | |
| CN109136209B (zh) | 肠激酶轻链突变体及其应用 | |
| RU2790662C1 (ru) | АМИНОАЦИЛ-тРНК-СИНТЕТАЗА, ЭФФЕКТИВНОЕ ВВЕДЕНИЕ ПРОИЗВОДНЫХ ЛИЗИНА | |
| CN103382496B (zh) | 一种制备s-腺苷甲硫氨酸的方法 | |
| CN103282490B (zh) | 在酵母中产生肠激酶的组合物和方法 | |
| CN115701451B (zh) | 高效引入赖氨酸衍生物的氨酰基-tRNA合成酶及其应用 | |
| JP2023528996A (ja) | インスリンアスパルト誘導体およびその製造方法と使用 | |
| WO2025104126A1 (en) | Tags for enhanced expression of recombinant proteins | |
| WO2025163019A1 (en) | Tags for enhanced expression of recombinant proteins | |
| WO2025066687A1 (zh) | 人重组白细胞介素-15的表达纯化方法 | |
| WO2025168666A1 (en) | Improved method of rna production in fungi | |
| CN119931980A (zh) | 高活性且高人源化率的尿酸氧化酶突变体 |