RU2796061C2 - T7 rna polymerase variants - Google Patents
T7 rna polymerase variants Download PDFInfo
- Publication number
- RU2796061C2 RU2796061C2 RU2020103726A RU2020103726A RU2796061C2 RU 2796061 C2 RU2796061 C2 RU 2796061C2 RU 2020103726 A RU2020103726 A RU 2020103726A RU 2020103726 A RU2020103726 A RU 2020103726A RU 2796061 C2 RU2796061 C2 RU 2796061C2
- Authority
- RU
- Russia
- Prior art keywords
- rna polymerase
- polypeptide sequence
- ala
- amino acid
- seq
- Prior art date
Links
- 101710137500 T7 RNA polymerase Proteins 0.000 title claims description 161
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 225
- 229920001184 polypeptide Polymers 0.000 claims abstract description 221
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 221
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 claims abstract description 106
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 claims abstract description 106
- 238000006467 substitution reaction Methods 0.000 claims abstract description 84
- 125000003275 alpha amino acid group Chemical group 0.000 claims abstract description 80
- 239000013604 expression vector Substances 0.000 claims abstract description 21
- 102000040430 polynucleotide Human genes 0.000 claims description 90
- 108091033319 polynucleotide Proteins 0.000 claims description 90
- 239000002157 polynucleotide Substances 0.000 claims description 90
- 210000004027 cell Anatomy 0.000 claims description 81
- 238000000034 method Methods 0.000 claims description 67
- 108090000623 proteins and genes Proteins 0.000 claims description 54
- 102000004169 proteins and genes Human genes 0.000 claims description 36
- 230000014509 gene expression Effects 0.000 claims description 33
- 239000000203 mixture Substances 0.000 claims description 32
- 238000006243 chemical reaction Methods 0.000 claims description 29
- 238000004519 manufacturing process Methods 0.000 claims description 14
- 239000001226 triphosphate Substances 0.000 claims description 11
- OGHAROSJZRTIOK-KQYNXXCUSA-O 7-methylguanosine Chemical compound C1=2N=C(N)NC(=O)C=2[N+](C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OGHAROSJZRTIOK-KQYNXXCUSA-O 0.000 claims description 10
- 235000011178 triphosphate Nutrition 0.000 claims description 8
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 claims description 8
- 238000012258 culturing Methods 0.000 claims description 6
- 239000012536 storage buffer Substances 0.000 claims description 5
- 102000009617 Inorganic Pyrophosphatase Human genes 0.000 claims description 4
- 108010009595 Inorganic Pyrophosphatase Proteins 0.000 claims description 4
- 230000002103 transcriptional effect Effects 0.000 claims description 4
- 210000001236 prokaryotic cell Anatomy 0.000 claims description 2
- 230000014621 translational initiation Effects 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 38
- 238000000338 in vitro Methods 0.000 abstract description 22
- 239000000126 substance Substances 0.000 abstract description 8
- 230000005026 transcription initiation Effects 0.000 abstract description 7
- 238000010348 incorporation Methods 0.000 abstract description 4
- 235000001014 amino acid Nutrition 0.000 description 86
- 229940024606 amino acid Drugs 0.000 description 65
- 150000001413 amino acids Chemical class 0.000 description 60
- 102000053602 DNA Human genes 0.000 description 49
- 108020004414 DNA Proteins 0.000 description 49
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 49
- 229920002477 rna polymer Polymers 0.000 description 47
- 108010065920 Insulin Lispro Proteins 0.000 description 42
- 230000035897 transcription Effects 0.000 description 34
- 238000013518 transcription Methods 0.000 description 34
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 31
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 31
- PGNNQOJOEGFAOR-KWQFWETISA-N Ala-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 PGNNQOJOEGFAOR-KWQFWETISA-N 0.000 description 30
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 30
- 235000018102 proteins Nutrition 0.000 description 30
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 29
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 29
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 29
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 29
- VYVBSMCZNHOZGD-RCWTZXSCSA-N Thr-Val-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O VYVBSMCZNHOZGD-RCWTZXSCSA-N 0.000 description 29
- 102000004190 Enzymes Human genes 0.000 description 28
- 108090000790 Enzymes Proteins 0.000 description 28
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 28
- 229940088598 enzyme Drugs 0.000 description 28
- 108010037850 glycylvaline Proteins 0.000 description 28
- 108020004999 messenger RNA Proteins 0.000 description 28
- 150000007523 nucleic acids Chemical class 0.000 description 28
- 108091026890 Coding region Proteins 0.000 description 21
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 21
- 125000000539 amino acid group Chemical group 0.000 description 21
- 125000003729 nucleotide group Chemical group 0.000 description 21
- 239000000047 product Substances 0.000 description 21
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 20
- 239000002773 nucleotide Substances 0.000 description 20
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 19
- 238000012217 deletion Methods 0.000 description 19
- 239000013598 vector Substances 0.000 description 19
- 238000003780 insertion Methods 0.000 description 18
- 230000037431 insertion Effects 0.000 description 18
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 17
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 17
- 239000000758 substrate Substances 0.000 description 17
- SPQWWEZBHXHUJN-KBIXCLLPSA-N Ile-Glu-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O SPQWWEZBHXHUJN-KBIXCLLPSA-N 0.000 description 16
- 241000880493 Leptailurus serval Species 0.000 description 16
- GZBKRJVCRMZAST-XKBZYTNZSA-N Ser-Glu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZBKRJVCRMZAST-XKBZYTNZSA-N 0.000 description 16
- 230000037430 deletion Effects 0.000 description 16
- 108010054155 lysyllysine Proteins 0.000 description 16
- CWFMWBHMIMNZLN-NAKRPEOUSA-N (2s)-1-[(2s)-2-[[(2s,3s)-2-amino-3-methylpentanoyl]amino]propanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CWFMWBHMIMNZLN-NAKRPEOUSA-N 0.000 description 15
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 15
- IFKQPMZRDQZSHI-GHCJXIJMSA-N Ala-Ile-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O IFKQPMZRDQZSHI-GHCJXIJMSA-N 0.000 description 15
- QJABSQFUHKHTNP-SYWGBEHUSA-N Ala-Ile-Trp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O QJABSQFUHKHTNP-SYWGBEHUSA-N 0.000 description 15
- NINQYGGNRIBFSC-CIUDSAMLSA-N Ala-Lys-Ser Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CO)C(O)=O NINQYGGNRIBFSC-CIUDSAMLSA-N 0.000 description 15
- BDQNLQSWRAPHGU-DLOVCJGASA-N Ala-Phe-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)O)N BDQNLQSWRAPHGU-DLOVCJGASA-N 0.000 description 15
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 15
- OZNSCVPYWZRQPY-CIUDSAMLSA-N Arg-Asp-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OZNSCVPYWZRQPY-CIUDSAMLSA-N 0.000 description 15
- KBBKCNHWCDJPGN-GUBZILKMSA-N Arg-Gln-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KBBKCNHWCDJPGN-GUBZILKMSA-N 0.000 description 15
- NXDXECQFKHXHAM-HJGDQZAQSA-N Arg-Glu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NXDXECQFKHXHAM-HJGDQZAQSA-N 0.000 description 15
- FRMQITGHXMUNDF-GMOBBJLQSA-N Arg-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FRMQITGHXMUNDF-GMOBBJLQSA-N 0.000 description 15
- UHFUZWSZQKMDSX-DCAQKATOSA-N Arg-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UHFUZWSZQKMDSX-DCAQKATOSA-N 0.000 description 15
- VYZBPPBKFCHCIS-WPRPVWTQSA-N Arg-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N VYZBPPBKFCHCIS-WPRPVWTQSA-N 0.000 description 15
- QUAWOKPCAKCHQL-SRVKXCTJSA-N Asn-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N QUAWOKPCAKCHQL-SRVKXCTJSA-N 0.000 description 15
- NKLRWRRVYGQNIH-GHCJXIJMSA-N Asn-Ile-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O NKLRWRRVYGQNIH-GHCJXIJMSA-N 0.000 description 15
- UYCPJVYQYARFGB-YDHLFZDLSA-N Asn-Phe-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O UYCPJVYQYARFGB-YDHLFZDLSA-N 0.000 description 15
- QYRMBFWDSFGSFC-OLHMAJIHSA-N Asn-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QYRMBFWDSFGSFC-OLHMAJIHSA-N 0.000 description 15
- KQBVNNAPIURMPD-PEFMBERDSA-N Asp-Ile-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KQBVNNAPIURMPD-PEFMBERDSA-N 0.000 description 15
- HXVILZUZXFLVEN-DCAQKATOSA-N Asp-Met-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O HXVILZUZXFLVEN-DCAQKATOSA-N 0.000 description 15
- RPUYTJJZXQBWDT-SRVKXCTJSA-N Asp-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N RPUYTJJZXQBWDT-SRVKXCTJSA-N 0.000 description 15
- CXEFNHOVIIDHFU-IHPCNDPISA-N Asp-Trp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CC(=O)O)N CXEFNHOVIIDHFU-IHPCNDPISA-N 0.000 description 15
- 108020004705 Codon Proteins 0.000 description 15
- GFLNKSQHOBOMNM-AVGNSLFASA-N Gln-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)N)N GFLNKSQHOBOMNM-AVGNSLFASA-N 0.000 description 15
- PIUPHASDUFSHTF-CIUDSAMLSA-N Gln-Pro-Asn Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)N)N)C(=O)N[C@@H](CC(=O)N)C(=O)O PIUPHASDUFSHTF-CIUDSAMLSA-N 0.000 description 15
- FHPXTPQBODWBIY-CIUDSAMLSA-N Glu-Ala-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHPXTPQBODWBIY-CIUDSAMLSA-N 0.000 description 15
- VTTSANCGJWLPNC-ZPFDUUQYSA-N Glu-Arg-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VTTSANCGJWLPNC-ZPFDUUQYSA-N 0.000 description 15
- IESFZVCAVACGPH-PEFMBERDSA-N Glu-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O IESFZVCAVACGPH-PEFMBERDSA-N 0.000 description 15
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 15
- QXDXIXFSFHUYAX-MNXVOIDGSA-N Glu-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O QXDXIXFSFHUYAX-MNXVOIDGSA-N 0.000 description 15
- QMOSCLNJVKSHHU-YUMQZZPRSA-N Glu-Met-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O QMOSCLNJVKSHHU-YUMQZZPRSA-N 0.000 description 15
- CBEUFCJRFNZMCU-SRVKXCTJSA-N Glu-Met-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O CBEUFCJRFNZMCU-SRVKXCTJSA-N 0.000 description 15
- WXONSNSSBYQGNN-AVGNSLFASA-N Glu-Ser-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O WXONSNSSBYQGNN-AVGNSLFASA-N 0.000 description 15
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 15
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 15
- LBDXVCBAJJNJNN-WHFBIAKZSA-N Gly-Ser-Cys Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(O)=O LBDXVCBAJJNJNN-WHFBIAKZSA-N 0.000 description 15
- NVTPVQLIZCOJFK-FOHZUACHSA-N Gly-Thr-Asp Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O NVTPVQLIZCOJFK-FOHZUACHSA-N 0.000 description 15
- JYGYNWYVKXENNE-OALUTQOASA-N Gly-Tyr-Trp Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JYGYNWYVKXENNE-OALUTQOASA-N 0.000 description 15
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 15
- WYWBYSPRCFADBM-GARJFASQSA-N His-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O WYWBYSPRCFADBM-GARJFASQSA-N 0.000 description 15
- JUIOPCXACJLRJK-AVGNSLFASA-N His-Lys-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N JUIOPCXACJLRJK-AVGNSLFASA-N 0.000 description 15
- SACHLUOUHCVIKI-GMOBBJLQSA-N Ile-Arg-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N SACHLUOUHCVIKI-GMOBBJLQSA-N 0.000 description 15
- YPQDTQJBOFOTJQ-SXTJYALSSA-N Ile-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N YPQDTQJBOFOTJQ-SXTJYALSSA-N 0.000 description 15
- FJWYJQRCVNGEAQ-ZPFDUUQYSA-N Ile-Asn-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N FJWYJQRCVNGEAQ-ZPFDUUQYSA-N 0.000 description 15
- UQXADIGYEYBJEI-DJFWLOJKSA-N Ile-His-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N UQXADIGYEYBJEI-DJFWLOJKSA-N 0.000 description 15
- GLYJPWIRLBAIJH-FQUUOJAGSA-N Ile-Lys-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N GLYJPWIRLBAIJH-FQUUOJAGSA-N 0.000 description 15
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 15
- IITVUURPOYGCTD-NAKRPEOUSA-N Ile-Pro-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IITVUURPOYGCTD-NAKRPEOUSA-N 0.000 description 15
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 15
- PRTZQMBYUZFSFA-XEGUGMAKSA-N Ile-Tyr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)NCC(=O)O)N PRTZQMBYUZFSFA-XEGUGMAKSA-N 0.000 description 15
- YJRSIJZUIUANHO-NAKRPEOUSA-N Ile-Val-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(=O)O)N YJRSIJZUIUANHO-NAKRPEOUSA-N 0.000 description 15
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 15
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 15
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 15
- POJPZSMTTMLSTG-SRVKXCTJSA-N Leu-Asn-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N POJPZSMTTMLSTG-SRVKXCTJSA-N 0.000 description 15
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 15
- ZTLGVASZOIKNIX-DCAQKATOSA-N Leu-Gln-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZTLGVASZOIKNIX-DCAQKATOSA-N 0.000 description 15
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 15
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 15
- MJTOYIHCKVQICL-ULQDDVLXSA-N Leu-Met-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N MJTOYIHCKVQICL-ULQDDVLXSA-N 0.000 description 15
- WSXTWLJHTLRFLW-SRVKXCTJSA-N Lys-Ala-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O WSXTWLJHTLRFLW-SRVKXCTJSA-N 0.000 description 15
- IRNSXVOWSXSULE-DCAQKATOSA-N Lys-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN IRNSXVOWSXSULE-DCAQKATOSA-N 0.000 description 15
- NQCJGQHHYZNUDK-DCAQKATOSA-N Lys-Arg-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CCCN=C(N)N NQCJGQHHYZNUDK-DCAQKATOSA-N 0.000 description 15
- NRQRKMYZONPCTM-CIUDSAMLSA-N Lys-Asp-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O NRQRKMYZONPCTM-CIUDSAMLSA-N 0.000 description 15
- YWJQHDDBFAXNIR-MXAVVETBSA-N Lys-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCCN)N YWJQHDDBFAXNIR-MXAVVETBSA-N 0.000 description 15
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 15
- YUTZYVTZDVZBJJ-IHPCNDPISA-N Lys-Trp-Lys Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 YUTZYVTZDVZBJJ-IHPCNDPISA-N 0.000 description 15
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 15
- QRHWTCJBCLGYRB-FXQIFTODSA-N Met-Ala-Cys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(O)=O QRHWTCJBCLGYRB-FXQIFTODSA-N 0.000 description 15
- IRVONVRHHJXWTK-RWMBFGLXSA-N Met-Lys-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N IRVONVRHHJXWTK-RWMBFGLXSA-N 0.000 description 15
- FBLBCGLSRXBANI-KKUMJFAQSA-N Met-Phe-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N FBLBCGLSRXBANI-KKUMJFAQSA-N 0.000 description 15
- LQTGGXSOMDSWTQ-UNQGMJICSA-N Met-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCSC)N)O LQTGGXSOMDSWTQ-UNQGMJICSA-N 0.000 description 15
- VQILILSLEFDECU-GUBZILKMSA-N Met-Pro-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O VQILILSLEFDECU-GUBZILKMSA-N 0.000 description 15
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 15
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 15
- 108010066427 N-valyltryptophan Proteins 0.000 description 15
- 108010047562 NGR peptide Proteins 0.000 description 15
- 108091028043 Nucleic acid sequence Proteins 0.000 description 15
- HPECNYCQLSVCHH-BZSNNMDCSA-N Phe-Cys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N HPECNYCQLSVCHH-BZSNNMDCSA-N 0.000 description 15
- UAMFZRNCIFFMLE-FHWLQOOXSA-N Phe-Glu-Tyr Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N UAMFZRNCIFFMLE-FHWLQOOXSA-N 0.000 description 15
- NHCKESBLOMHIIE-IRXDYDNUSA-N Phe-Gly-Phe Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 NHCKESBLOMHIIE-IRXDYDNUSA-N 0.000 description 15
- ZLAKUZDMKVKFAI-JYJNAYRXSA-N Phe-Pro-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O ZLAKUZDMKVKFAI-JYJNAYRXSA-N 0.000 description 15
- BAONJAHBAUDJKA-BZSNNMDCSA-N Phe-Tyr-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=CC=C1 BAONJAHBAUDJKA-BZSNNMDCSA-N 0.000 description 15
- SGCZFWSQERRKBD-BQBZGAKWSA-N Pro-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 SGCZFWSQERRKBD-BQBZGAKWSA-N 0.000 description 15
- ZVEQWRWMRFIVSD-HRCADAONSA-N Pro-Phe-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N3CCC[C@@H]3C(=O)O ZVEQWRWMRFIVSD-HRCADAONSA-N 0.000 description 15
- IOVHBRCQOGWAQH-ZKWXMUAHSA-N Ser-Gly-Ile Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOVHBRCQOGWAQH-ZKWXMUAHSA-N 0.000 description 15
- GVMUJUPXFQFBBZ-GUBZILKMSA-N Ser-Lys-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GVMUJUPXFQFBBZ-GUBZILKMSA-N 0.000 description 15
- XKFJENWJGHMDLI-QWRGUYRKSA-N Ser-Phe-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O XKFJENWJGHMDLI-QWRGUYRKSA-N 0.000 description 15
- DKGRNFUXVTYRAS-UBHSHLNASA-N Ser-Ser-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O DKGRNFUXVTYRAS-UBHSHLNASA-N 0.000 description 15
- NFMPFBCXABPALN-OWLDWWDNSA-N Thr-Ala-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O NFMPFBCXABPALN-OWLDWWDNSA-N 0.000 description 15
- AQAMPXBRJJWPNI-JHEQGTHGSA-N Thr-Gly-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AQAMPXBRJJWPNI-JHEQGTHGSA-N 0.000 description 15
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 15
- OFNPHOGOJLNVLL-KCTSRDHCSA-N Trp-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N OFNPHOGOJLNVLL-KCTSRDHCSA-N 0.000 description 15
- UDCHKDYNMRJYMI-QEJZJMRPSA-N Trp-Glu-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UDCHKDYNMRJYMI-QEJZJMRPSA-N 0.000 description 15
- BXJQKVDPRMLGKN-PMVMPFDFSA-N Tyr-Trp-Leu Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(O)=O)C1=CC=C(O)C=C1 BXJQKVDPRMLGKN-PMVMPFDFSA-N 0.000 description 15
- UEOOXDLMQZBPFR-ZKWXMUAHSA-N Val-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N UEOOXDLMQZBPFR-ZKWXMUAHSA-N 0.000 description 15
- LABUITCFCAABSV-UHFFFAOYSA-N Val-Ala-Tyr Natural products CC(C)C(N)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LABUITCFCAABSV-UHFFFAOYSA-N 0.000 description 15
- YCMXFKWYJFZFKS-LAEOZQHASA-N Val-Gln-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCMXFKWYJFZFKS-LAEOZQHASA-N 0.000 description 15
- XGJLNBNZNMVJRS-NRPADANISA-N Val-Glu-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O XGJLNBNZNMVJRS-NRPADANISA-N 0.000 description 15
- BEGDZYNDCNEGJZ-XVKPBYJWSA-N Val-Gly-Gln Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O BEGDZYNDCNEGJZ-XVKPBYJWSA-N 0.000 description 15
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 15
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 15
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 15
- KTEZUXISLQTDDQ-NHCYSSNCSA-N Val-Lys-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KTEZUXISLQTDDQ-NHCYSSNCSA-N 0.000 description 15
- QPPZEDOTPZOSEC-RCWTZXSCSA-N Val-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N)O QPPZEDOTPZOSEC-RCWTZXSCSA-N 0.000 description 15
- DLLRRUDLMSJTMB-GUBZILKMSA-N Val-Ser-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)O)N DLLRRUDLMSJTMB-GUBZILKMSA-N 0.000 description 15
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 15
- MNSSBIHFEUUXNW-RCWTZXSCSA-N Val-Thr-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N MNSSBIHFEUUXNW-RCWTZXSCSA-N 0.000 description 15
- QPJSIBAOZBVELU-BPNCWPANSA-N Val-Tyr-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N QPJSIBAOZBVELU-BPNCWPANSA-N 0.000 description 15
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 15
- 108010036999 aspartyl-alanyl-histidyl-lysine Proteins 0.000 description 15
- 108010092854 aspartyllysine Proteins 0.000 description 15
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 15
- 108010062266 glycyl-glycyl-argininal Proteins 0.000 description 15
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 15
- 108010010096 glycyl-glycyl-tyrosine Proteins 0.000 description 15
- 108010089804 glycyl-threonine Proteins 0.000 description 15
- 108010020688 glycylhistidine Proteins 0.000 description 15
- 108010050848 glycylleucine Proteins 0.000 description 15
- 108010015792 glycyllysine Proteins 0.000 description 15
- 108010036413 histidylglycine Proteins 0.000 description 15
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 15
- 108010076756 leucyl-alanyl-phenylalanine Proteins 0.000 description 15
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 15
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 15
- 108010043322 lysyl-tryptophyl-alpha-lysine Proteins 0.000 description 15
- 108010022588 methionyl-lysyl-proline Proteins 0.000 description 15
- 102000039446 nucleic acids Human genes 0.000 description 15
- 108020004707 nucleic acids Proteins 0.000 description 15
- 108010070643 prolylglutamic acid Proteins 0.000 description 15
- 108010026333 seryl-proline Proteins 0.000 description 15
- 108010029384 tryptophyl-histidine Proteins 0.000 description 15
- 108010005834 tyrosyl-alanyl-glycine Proteins 0.000 description 15
- 108010051110 tyrosyl-lysine Proteins 0.000 description 15
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 15
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 15
- 108010073969 valyllysine Proteins 0.000 description 15
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 14
- CVGNCMIULZNYES-WHFBIAKZSA-N Ala-Asn-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CVGNCMIULZNYES-WHFBIAKZSA-N 0.000 description 14
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 14
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 14
- GSCLWXDNIMNIJE-ZLUOBGJFSA-N Ala-Asp-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GSCLWXDNIMNIJE-ZLUOBGJFSA-N 0.000 description 14
- CSAHOYQKNHGDHX-ACZMJKKPSA-N Ala-Gln-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CSAHOYQKNHGDHX-ACZMJKKPSA-N 0.000 description 14
- BEMGNWZECGIJOI-WDSKDSINSA-N Ala-Gly-Glu Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O BEMGNWZECGIJOI-WDSKDSINSA-N 0.000 description 14
- OKIKVSXTXVVFDV-MMWGEVLESA-N Ala-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N OKIKVSXTXVVFDV-MMWGEVLESA-N 0.000 description 14
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 14
- PMQXMXAASGFUDX-SRVKXCTJSA-N Ala-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCCN PMQXMXAASGFUDX-SRVKXCTJSA-N 0.000 description 14
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 14
- RAAWHFXHAACDFT-FXQIFTODSA-N Ala-Met-Asn Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CC(N)=O)C(O)=O RAAWHFXHAACDFT-FXQIFTODSA-N 0.000 description 14
- KYDYGANDJHFBCW-DRZSPHRISA-N Ala-Phe-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N KYDYGANDJHFBCW-DRZSPHRISA-N 0.000 description 14
- GCTANJIJJROSLH-GVARAGBVSA-N Ala-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C)N GCTANJIJJROSLH-GVARAGBVSA-N 0.000 description 14
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 14
- OVVUNXXROOFSIM-SDDRHHMPSA-N Arg-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O OVVUNXXROOFSIM-SDDRHHMPSA-N 0.000 description 14
- PHHRSPBBQUFULD-UWVGGRQHSA-N Arg-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N PHHRSPBBQUFULD-UWVGGRQHSA-N 0.000 description 14
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 14
- AWMAZIIEFPFHCP-RCWTZXSCSA-N Arg-Pro-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O AWMAZIIEFPFHCP-RCWTZXSCSA-N 0.000 description 14
- KSHJMDSNSKDJPU-QTKMDUPCSA-N Arg-Thr-His Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 KSHJMDSNSKDJPU-QTKMDUPCSA-N 0.000 description 14
- MSBDSTRUMZFSEU-PEFMBERDSA-N Asn-Glu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MSBDSTRUMZFSEU-PEFMBERDSA-N 0.000 description 14
- DMLSCRJBWUEALP-LAEOZQHASA-N Asn-Glu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O DMLSCRJBWUEALP-LAEOZQHASA-N 0.000 description 14
- MDDXKBHIMYYJLW-FXQIFTODSA-N Asn-Met-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N MDDXKBHIMYYJLW-FXQIFTODSA-N 0.000 description 14
- HCZQKHSRYHCPSD-IUKAMOBKSA-N Asn-Thr-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HCZQKHSRYHCPSD-IUKAMOBKSA-N 0.000 description 14
- UXHYOWXTJLBEPG-GSSVUCPTSA-N Asn-Thr-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UXHYOWXTJLBEPG-GSSVUCPTSA-N 0.000 description 14
- XCBKBPRFACFFOO-AQZXSJQPSA-N Asn-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O XCBKBPRFACFFOO-AQZXSJQPSA-N 0.000 description 14
- HRGGPWBIMIQANI-GUBZILKMSA-N Asp-Gln-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HRGGPWBIMIQANI-GUBZILKMSA-N 0.000 description 14
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 14
- SWTQDYFZVOJVLL-KKUMJFAQSA-N Asp-His-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC(=O)O)N)O SWTQDYFZVOJVLL-KKUMJFAQSA-N 0.000 description 14
- VMVUDJUXJKDGNR-FXQIFTODSA-N Asp-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N VMVUDJUXJKDGNR-FXQIFTODSA-N 0.000 description 14
- BRRPVTUFESPTCP-ACZMJKKPSA-N Asp-Ser-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O BRRPVTUFESPTCP-ACZMJKKPSA-N 0.000 description 14
- DRCOAZZDQRCGGP-GHCJXIJMSA-N Asp-Ser-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DRCOAZZDQRCGGP-GHCJXIJMSA-N 0.000 description 14
- AEJSNWMRPXAKCW-WHFBIAKZSA-N Cys-Ala-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O AEJSNWMRPXAKCW-WHFBIAKZSA-N 0.000 description 14
- RRIJEABIXPKSGP-FXQIFTODSA-N Cys-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CS RRIJEABIXPKSGP-FXQIFTODSA-N 0.000 description 14
- XZKJEOMFLDVXJG-KATARQTJSA-N Cys-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CS)N)O XZKJEOMFLDVXJG-KATARQTJSA-N 0.000 description 14
- YJIUYQKQBBQYHZ-ACZMJKKPSA-N Gln-Ala-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YJIUYQKQBBQYHZ-ACZMJKKPSA-N 0.000 description 14
- ZNZPKVQURDQFFS-FXQIFTODSA-N Gln-Glu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZNZPKVQURDQFFS-FXQIFTODSA-N 0.000 description 14
- XKBASPWPBXNVLQ-WDSKDSINSA-N Gln-Gly-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XKBASPWPBXNVLQ-WDSKDSINSA-N 0.000 description 14
- LKVCNGLNTAPMSZ-JYJNAYRXSA-N Gln-His-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)N)N LKVCNGLNTAPMSZ-JYJNAYRXSA-N 0.000 description 14
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 14
- JNVGVECJCOZHCN-DRZSPHRISA-N Gln-Phe-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O JNVGVECJCOZHCN-DRZSPHRISA-N 0.000 description 14
- WBYHRQBKJGEBQJ-CIUDSAMLSA-N Gln-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)N)N)C(=O)N[C@@H](CS)C(=O)O WBYHRQBKJGEBQJ-CIUDSAMLSA-N 0.000 description 14
- UWMDGPFFTKDUIY-HJGDQZAQSA-N Gln-Pro-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O UWMDGPFFTKDUIY-HJGDQZAQSA-N 0.000 description 14
- NCWOMXABNYEPLY-NRPADANISA-N Glu-Ala-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O NCWOMXABNYEPLY-NRPADANISA-N 0.000 description 14
- PVBBEKPHARMPHX-DCAQKATOSA-N Glu-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O PVBBEKPHARMPHX-DCAQKATOSA-N 0.000 description 14
- QQLBPVKLJBAXBS-FXQIFTODSA-N Glu-Glu-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QQLBPVKLJBAXBS-FXQIFTODSA-N 0.000 description 14
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 14
- LGYCLOCORAEQSZ-PEFMBERDSA-N Glu-Ile-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O LGYCLOCORAEQSZ-PEFMBERDSA-N 0.000 description 14
- AQNYKMCFCCZEEL-JYJNAYRXSA-N Glu-Lys-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AQNYKMCFCCZEEL-JYJNAYRXSA-N 0.000 description 14
- BRFJMRSRMOMIMU-WHFBIAKZSA-N Gly-Ala-Asn Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O BRFJMRSRMOMIMU-WHFBIAKZSA-N 0.000 description 14
- LJXWZPHEMJSNRC-KBPBESRZSA-N Gly-Gln-Trp Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O LJXWZPHEMJSNRC-KBPBESRZSA-N 0.000 description 14
- MOJKRXIRAZPZLW-WDSKDSINSA-N Gly-Glu-Ala Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MOJKRXIRAZPZLW-WDSKDSINSA-N 0.000 description 14
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 14
- HKSNHPVETYYJBK-LAEOZQHASA-N Gly-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)CN HKSNHPVETYYJBK-LAEOZQHASA-N 0.000 description 14
- PDUHNKAFQXQNLH-ZETCQYMHSA-N Gly-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)NCC(O)=O PDUHNKAFQXQNLH-ZETCQYMHSA-N 0.000 description 14
- IHDKKJVBLGXLEL-STQMWFEESA-N Gly-Tyr-Met Chemical compound CSCC[C@H](NC(=O)[C@H](Cc1ccc(O)cc1)NC(=O)CN)C(O)=O IHDKKJVBLGXLEL-STQMWFEESA-N 0.000 description 14
- HDXNWVLQSQFJOX-SRVKXCTJSA-N His-Arg-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HDXNWVLQSQFJOX-SRVKXCTJSA-N 0.000 description 14
- TVRMJKNELJKNRS-GUBZILKMSA-N His-Glu-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N TVRMJKNELJKNRS-GUBZILKMSA-N 0.000 description 14
- KNNSUUOHFVVJOP-GUBZILKMSA-N His-Glu-Ser Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N KNNSUUOHFVVJOP-GUBZILKMSA-N 0.000 description 14
- GHAFKUCRIVBLDJ-IHRRRGAJSA-N His-His-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CN=CN2)N GHAFKUCRIVBLDJ-IHRRRGAJSA-N 0.000 description 14
- SKYULSWNBYAQMG-IHRRRGAJSA-N His-Leu-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SKYULSWNBYAQMG-IHRRRGAJSA-N 0.000 description 14
- PLCAEMGSYOYIPP-GUBZILKMSA-N His-Ser-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 PLCAEMGSYOYIPP-GUBZILKMSA-N 0.000 description 14
- ZNTSGDNUITWTRA-WDSOQIARSA-N His-Trp-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(O)=O ZNTSGDNUITWTRA-WDSOQIARSA-N 0.000 description 14
- CGAMSLMBYJHMDY-ONGXEEELSA-N His-Val-Gly Chemical compound CC(C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N CGAMSLMBYJHMDY-ONGXEEELSA-N 0.000 description 14
- DMAPKBANYNZHNR-ULQDDVLXSA-N His-Val-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N DMAPKBANYNZHNR-ULQDDVLXSA-N 0.000 description 14
- DCQMJRSOGCYKTR-GHCJXIJMSA-N Ile-Asp-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O DCQMJRSOGCYKTR-GHCJXIJMSA-N 0.000 description 14
- JDAWAWXGAUZPNJ-ZPFDUUQYSA-N Ile-Glu-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N JDAWAWXGAUZPNJ-ZPFDUUQYSA-N 0.000 description 14
- NURNJECQNNCRBK-FLBSBUHZSA-N Ile-Thr-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NURNJECQNNCRBK-FLBSBUHZSA-N 0.000 description 14
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 14
- XIRYQRLFHWWWTC-QEJZJMRPSA-N Leu-Ala-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XIRYQRLFHWWWTC-QEJZJMRPSA-N 0.000 description 14
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 14
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 14
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 14
- FIYMBBHGYNQFOP-IUCAKERBSA-N Leu-Gly-Gln Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N FIYMBBHGYNQFOP-IUCAKERBSA-N 0.000 description 14
- HYMLKESRWLZDBR-WEDXCCLWSA-N Leu-Gly-Thr Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HYMLKESRWLZDBR-WEDXCCLWSA-N 0.000 description 14
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 14
- PKKMDPNFGULLNQ-AVGNSLFASA-N Leu-Met-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O PKKMDPNFGULLNQ-AVGNSLFASA-N 0.000 description 14
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 14
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 14
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 14
- GCMWRRQAKQXDED-IUCAKERBSA-N Lys-Glu-Gly Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)N[C@@H](CCC([O-])=O)C(=O)NCC([O-])=O GCMWRRQAKQXDED-IUCAKERBSA-N 0.000 description 14
- QZONCCHVHCOBSK-YUMQZZPRSA-N Lys-Gly-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O QZONCCHVHCOBSK-YUMQZZPRSA-N 0.000 description 14
- NKKFVJRLCCUJNA-QWRGUYRKSA-N Lys-Gly-Lys Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN NKKFVJRLCCUJNA-QWRGUYRKSA-N 0.000 description 14
- ZMMDPRTXLAEMOD-BZSNNMDCSA-N Lys-His-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZMMDPRTXLAEMOD-BZSNNMDCSA-N 0.000 description 14
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 14
- RIJCHEVHFWMDKD-SRVKXCTJSA-N Lys-Lys-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O RIJCHEVHFWMDKD-SRVKXCTJSA-N 0.000 description 14
- QQPSCXKFDSORFT-IHRRRGAJSA-N Lys-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN QQPSCXKFDSORFT-IHRRRGAJSA-N 0.000 description 14
- WWEWGPOLIJXGNX-XUXIUFHCSA-N Lys-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCCCN)N WWEWGPOLIJXGNX-XUXIUFHCSA-N 0.000 description 14
- LMGNWHDWJDIOPK-DKIMLUQUSA-N Lys-Phe-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LMGNWHDWJDIOPK-DKIMLUQUSA-N 0.000 description 14
- JHNOXVASMSXSNB-WEDXCCLWSA-N Lys-Thr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JHNOXVASMSXSNB-WEDXCCLWSA-N 0.000 description 14
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 14
- RXWPLVRJQNWXRQ-IHRRRGAJSA-N Met-His-His Chemical compound C([C@H](NC(=O)[C@@H](N)CCSC)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CNC=N1 RXWPLVRJQNWXRQ-IHRRRGAJSA-N 0.000 description 14
- OVTOTTGZBWXLFU-QXEWZRGKSA-N Met-Val-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O OVTOTTGZBWXLFU-QXEWZRGKSA-N 0.000 description 14
- AGYXCMYVTBYGCT-ULQDDVLXSA-N Phe-Arg-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O AGYXCMYVTBYGCT-ULQDDVLXSA-N 0.000 description 14
- YYRCPTVAPLQRNC-ULQDDVLXSA-N Phe-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CC1=CC=CC=C1 YYRCPTVAPLQRNC-ULQDDVLXSA-N 0.000 description 14
- WGXOKDLDIWSOCV-MELADBBJSA-N Phe-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O WGXOKDLDIWSOCV-MELADBBJSA-N 0.000 description 14
- HTKNPQZCMLBOTQ-XVSYOHENSA-N Phe-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N)O HTKNPQZCMLBOTQ-XVSYOHENSA-N 0.000 description 14
- PTLMYJOMJLTMCB-KKUMJFAQSA-N Phe-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N PTLMYJOMJLTMCB-KKUMJFAQSA-N 0.000 description 14
- ODGNUUUDJONJSC-UFYCRDLUSA-N Phe-Pro-Tyr Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O ODGNUUUDJONJSC-UFYCRDLUSA-N 0.000 description 14
- LHALYDBUDCWMDY-CIUDSAMLSA-N Pro-Glu-Ala Chemical compound C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O LHALYDBUDCWMDY-CIUDSAMLSA-N 0.000 description 14
- VPEVBAUSTBWQHN-NHCYSSNCSA-N Pro-Glu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O VPEVBAUSTBWQHN-NHCYSSNCSA-N 0.000 description 14
- BWCZJGJKOFUUCN-ZPFDUUQYSA-N Pro-Ile-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O BWCZJGJKOFUUCN-ZPFDUUQYSA-N 0.000 description 14
- XYHMFGGWNOFUOU-QXEWZRGKSA-N Pro-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 XYHMFGGWNOFUOU-QXEWZRGKSA-N 0.000 description 14
- HFNPOYOKIPGAEI-SRVKXCTJSA-N Pro-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 HFNPOYOKIPGAEI-SRVKXCTJSA-N 0.000 description 14
- ULWBBFKQBDNGOY-RWMBFGLXSA-N Pro-Lys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N2CCC[C@@H]2C(=O)O ULWBBFKQBDNGOY-RWMBFGLXSA-N 0.000 description 14
- APIAILHCTSBGLU-JYJNAYRXSA-N Pro-Met-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@@H]2CCCN2 APIAILHCTSBGLU-JYJNAYRXSA-N 0.000 description 14
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 14
- IYCBDVBJWDXQRR-FXQIFTODSA-N Ser-Ala-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O IYCBDVBJWDXQRR-FXQIFTODSA-N 0.000 description 14
- KNCJWSPMTFFJII-ZLUOBGJFSA-N Ser-Cys-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O KNCJWSPMTFFJII-ZLUOBGJFSA-N 0.000 description 14
- KCGIREHVWRXNDH-GARJFASQSA-N Ser-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N KCGIREHVWRXNDH-GARJFASQSA-N 0.000 description 14
- OWCVUSJMEBGMOK-YUMQZZPRSA-N Ser-Lys-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O OWCVUSJMEBGMOK-YUMQZZPRSA-N 0.000 description 14
- CRJZZXMAADSBBQ-SRVKXCTJSA-N Ser-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO CRJZZXMAADSBBQ-SRVKXCTJSA-N 0.000 description 14
- NQZFFLBPNDLTPO-DLOVCJGASA-N Ser-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CO)N NQZFFLBPNDLTPO-DLOVCJGASA-N 0.000 description 14
- YBXMGKCLOPDEKA-NUMRIWBASA-N Thr-Asp-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YBXMGKCLOPDEKA-NUMRIWBASA-N 0.000 description 14
- UBDDORVPVLEECX-FJXKBIBVSA-N Thr-Gly-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O UBDDORVPVLEECX-FJXKBIBVSA-N 0.000 description 14
- XTCNBOBTROGWMW-RWRJDSDZSA-N Thr-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XTCNBOBTROGWMW-RWRJDSDZSA-N 0.000 description 14
- AHOLTQCAVBSUDP-PPCPHDFISA-N Thr-Ile-Lys Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)[C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O AHOLTQCAVBSUDP-PPCPHDFISA-N 0.000 description 14
- YJCVECXVYHZOBK-KNZXXDILSA-N Thr-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H]([C@@H](C)O)N YJCVECXVYHZOBK-KNZXXDILSA-N 0.000 description 14
- REJRKTOJTCPDPO-IRIUXVKKSA-N Thr-Tyr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O REJRKTOJTCPDPO-IRIUXVKKSA-N 0.000 description 14
- MQVGIFJSFFVGFW-XEGUGMAKSA-N Trp-Ala-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MQVGIFJSFFVGFW-XEGUGMAKSA-N 0.000 description 14
- SCQBNMKLZVCXNX-ZFWWWQNUSA-N Trp-Arg-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(=O)O)N SCQBNMKLZVCXNX-ZFWWWQNUSA-N 0.000 description 14
- VTHNLRXALGUDBS-BPUTZDHNSA-N Trp-Gln-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N VTHNLRXALGUDBS-BPUTZDHNSA-N 0.000 description 14
- RRVUOLRWIZXBRQ-IHPCNDPISA-N Trp-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N RRVUOLRWIZXBRQ-IHPCNDPISA-N 0.000 description 14
- SEXRBCGSZRCIPE-LYSGOOTNSA-N Trp-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O SEXRBCGSZRCIPE-LYSGOOTNSA-N 0.000 description 14
- DWJQKEZKLQCHKO-SRVKXCTJSA-N Tyr-Asn-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N)O DWJQKEZKLQCHKO-SRVKXCTJSA-N 0.000 description 14
- HKYTWJOWZTWBQB-AVGNSLFASA-N Tyr-Glu-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HKYTWJOWZTWBQB-AVGNSLFASA-N 0.000 description 14
- JAGGEZACYAAMIL-CQDKDKBSSA-N Tyr-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CC=C(C=C1)O)N JAGGEZACYAAMIL-CQDKDKBSSA-N 0.000 description 14
- ZOBLBMGJKVJVEV-BZSNNMDCSA-N Tyr-Lys-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O ZOBLBMGJKVJVEV-BZSNNMDCSA-N 0.000 description 14
- JOQSQZFKFYJKKJ-GUBZILKMSA-N Val-Arg-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N JOQSQZFKFYJKKJ-GUBZILKMSA-N 0.000 description 14
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 14
- CFSSLXZJEMERJY-NRPADANISA-N Val-Gln-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CFSSLXZJEMERJY-NRPADANISA-N 0.000 description 14
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 14
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 14
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 14
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 14
- PDASTHRLDFOZMG-JYJNAYRXSA-N Val-Tyr-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=C(O)C=C1 PDASTHRLDFOZMG-JYJNAYRXSA-N 0.000 description 14
- JSOXWWFKRJKTMT-WOPDTQHZSA-N Val-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N JSOXWWFKRJKTMT-WOPDTQHZSA-N 0.000 description 14
- 108010047495 alanylglycine Proteins 0.000 description 14
- 108010011559 alanylphenylalanine Proteins 0.000 description 14
- 108010089442 arginyl-leucyl-alanyl-arginine Proteins 0.000 description 14
- 108010062796 arginyllysine Proteins 0.000 description 14
- 108010077245 asparaginyl-proline Proteins 0.000 description 14
- 108010049041 glutamylalanine Proteins 0.000 description 14
- 108010087823 glycyltyrosine Proteins 0.000 description 14
- 108010028295 histidylhistidine Proteins 0.000 description 14
- 108010018006 histidylserine Proteins 0.000 description 14
- 150000002500 ions Chemical class 0.000 description 14
- 108010057821 leucylproline Proteins 0.000 description 14
- 108010073101 phenylalanylleucine Proteins 0.000 description 14
- 108010048818 seryl-histidine Proteins 0.000 description 14
- 108010080629 tryptophan-leucine Proteins 0.000 description 14
- 108010045269 tryptophyltryptophan Proteins 0.000 description 14
- LKVKODXGSAFOFY-VEVYYDQMSA-N Asp-Met-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LKVKODXGSAFOFY-VEVYYDQMSA-N 0.000 description 13
- 238000000746 purification Methods 0.000 description 13
- 108010076504 Protein Sorting Signals Proteins 0.000 description 12
- 239000012634 fragment Substances 0.000 description 12
- SIEBDTCABMZCLF-XGEHTFHBSA-N Ser-Val-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SIEBDTCABMZCLF-XGEHTFHBSA-N 0.000 description 11
- 238000009396 hybridization Methods 0.000 description 11
- KBJVTFWQWXCYCQ-IUKAMOBKSA-N Asp-Thr-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KBJVTFWQWXCYCQ-IUKAMOBKSA-N 0.000 description 10
- RBSKVTZUFMIWFU-XEGUGMAKSA-N Gln-Trp-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O RBSKVTZUFMIWFU-XEGUGMAKSA-N 0.000 description 10
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 10
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 10
- 239000011780 sodium chloride Substances 0.000 description 10
- GXXWTNKNFFKTJB-NAKRPEOUSA-N Arg-Ile-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O GXXWTNKNFFKTJB-NAKRPEOUSA-N 0.000 description 9
- WUAYFMZULZDSLB-ACZMJKKPSA-N Gln-Ala-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O WUAYFMZULZDSLB-ACZMJKKPSA-N 0.000 description 9
- LAGPXKYZCCTSGQ-JYJNAYRXSA-N Leu-Glu-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LAGPXKYZCCTSGQ-JYJNAYRXSA-N 0.000 description 9
- ALEVUGKHINJNIF-QEJZJMRPSA-N Lys-Phe-Ala Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 ALEVUGKHINJNIF-QEJZJMRPSA-N 0.000 description 9
- HGAJNEWOUHDUMZ-SRVKXCTJSA-N Met-Leu-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O HGAJNEWOUHDUMZ-SRVKXCTJSA-N 0.000 description 9
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 9
- LVVBAKCGXXUHFO-ZLUOBGJFSA-N Ser-Ala-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O LVVBAKCGXXUHFO-ZLUOBGJFSA-N 0.000 description 9
- 230000002255 enzymatic effect Effects 0.000 description 9
- 239000006166 lysate Substances 0.000 description 9
- 230000014616 translation Effects 0.000 description 9
- 239000004382 Amylase Substances 0.000 description 8
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 8
- UYTPUPDQBNUYGX-UHFFFAOYSA-N Guanine Natural products O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 8
- 238000003776 cleavage reaction Methods 0.000 description 8
- 238000002703 mutagenesis Methods 0.000 description 8
- 231100000350 mutagenesis Toxicity 0.000 description 8
- 239000013612 plasmid Substances 0.000 description 8
- 241000588724 Escherichia coli Species 0.000 description 7
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 7
- 229910052799 carbon Inorganic materials 0.000 description 7
- 239000002777 nucleoside Substances 0.000 description 7
- 230000008488 polyadenylation Effects 0.000 description 7
- 230000007017 scission Effects 0.000 description 7
- 238000003786 synthesis reaction Methods 0.000 description 7
- 238000013519 translation Methods 0.000 description 7
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 6
- 108010065511 Amylases Proteins 0.000 description 6
- 102000013142 Amylases Human genes 0.000 description 6
- HRVQDZOWMLFAOD-BIIVOSGPSA-N Asp-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N)C(=O)O HRVQDZOWMLFAOD-BIIVOSGPSA-N 0.000 description 6
- 235000019418 amylase Nutrition 0.000 description 6
- 239000003153 chemical reaction reagent Substances 0.000 description 6
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 6
- 229960005091 chloramphenicol Drugs 0.000 description 6
- 150000001875 compounds Chemical class 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 6
- 230000002538 fungal effect Effects 0.000 description 6
- -1 guanine nucleoside Chemical class 0.000 description 6
- 239000000463 material Substances 0.000 description 6
- 230000035772 mutation Effects 0.000 description 6
- 240000006439 Aspergillus oryzae Species 0.000 description 5
- 235000002247 Aspergillus oryzae Nutrition 0.000 description 5
- QNAYBMKLOCPYGJ-UWTATZPHSA-N D-alanine Chemical compound C[C@@H](N)C(O)=O QNAYBMKLOCPYGJ-UWTATZPHSA-N 0.000 description 5
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 5
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 5
- 108010022181 Phosphopyruvate Hydratase Proteins 0.000 description 5
- RWTFCAMQLFNPTK-UMPQAUOISA-N Trp-Val-Thr Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)=CNC2=C1 RWTFCAMQLFNPTK-UMPQAUOISA-N 0.000 description 5
- 241000700605 Viruses Species 0.000 description 5
- 230000002378 acidificating effect Effects 0.000 description 5
- 238000001042 affinity chromatography Methods 0.000 description 5
- 238000003556 assay Methods 0.000 description 5
- 238000000876 binomial test Methods 0.000 description 5
- 239000000872 buffer Substances 0.000 description 5
- 238000004128 high performance liquid chromatography Methods 0.000 description 5
- 230000000977 initiatory effect Effects 0.000 description 5
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 125000003835 nucleoside group Chemical group 0.000 description 5
- 239000012071 phase Substances 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 239000000523 sample Substances 0.000 description 5
- 238000012216 screening Methods 0.000 description 5
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 4
- WXVGISRWSYGEDK-KKUMJFAQSA-N Asn-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N WXVGISRWSYGEDK-KKUMJFAQSA-N 0.000 description 4
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 4
- 241000701022 Cytomegalovirus Species 0.000 description 4
- QNAYBMKLOCPYGJ-UHFFFAOYSA-N D-alpha-Ala Natural products CC([NH3+])C([O-])=O QNAYBMKLOCPYGJ-UHFFFAOYSA-N 0.000 description 4
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 4
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 4
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 4
- FNAJNWPDTIXYJN-CIUDSAMLSA-N Gln-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O FNAJNWPDTIXYJN-CIUDSAMLSA-N 0.000 description 4
- OXEMJGCAJFFREE-FXQIFTODSA-N Glu-Gln-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O OXEMJGCAJFFREE-FXQIFTODSA-N 0.000 description 4
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 4
- OVPYIUNCVSOVNF-ZPFDUUQYSA-N Ile-Gln-Pro Natural products CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O OVPYIUNCVSOVNF-ZPFDUUQYSA-N 0.000 description 4
- 108060001084 Luciferase Proteins 0.000 description 4
- 239000005089 Luciferase Substances 0.000 description 4
- 239000006137 Luria-Bertani broth Substances 0.000 description 4
- 108091034117 Oligonucleotide Proteins 0.000 description 4
- 229910019142 PO4 Inorganic materials 0.000 description 4
- ACJULKNZOCRWEI-ULQDDVLXSA-N Phe-Met-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O ACJULKNZOCRWEI-ULQDDVLXSA-N 0.000 description 4
- 102000012288 Phosphopyruvate Hydratase Human genes 0.000 description 4
- 239000004365 Protease Substances 0.000 description 4
- IDCKUIWEIZYVSO-WFBYXXMGSA-N Ser-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C)C(O)=O)=CNC2=C1 IDCKUIWEIZYVSO-WFBYXXMGSA-N 0.000 description 4
- 208000037065 Subacute sclerosing leukoencephalitis Diseases 0.000 description 4
- 206010042297 Subacute sclerosing panencephalitis Diseases 0.000 description 4
- 229960003767 alanine Drugs 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- XHMJOUIAFHJHBW-VFUOTHLCSA-N glucosamine 6-phosphate Chemical compound N[C@H]1[C@H](O)O[C@H](COP(O)(O)=O)[C@H](O)[C@@H]1O XHMJOUIAFHJHBW-VFUOTHLCSA-N 0.000 description 4
- 239000008103 glucose Substances 0.000 description 4
- 229940029575 guanosine Drugs 0.000 description 4
- 230000002209 hydrophobic effect Effects 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 4
- 230000005405 multipole Effects 0.000 description 4
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 239000011541 reaction mixture Substances 0.000 description 4
- 230000010076 replication Effects 0.000 description 4
- 239000001488 sodium phosphate Substances 0.000 description 4
- 229910000162 sodium phosphate Inorganic materials 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 4
- 239000011534 wash buffer Substances 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- 210000005253 yeast cell Anatomy 0.000 description 4
- 108010037870 Anthranilate Synthase Proteins 0.000 description 3
- 241000351920 Aspergillus nidulans Species 0.000 description 3
- 101000757144 Aspergillus niger Glucoamylase Proteins 0.000 description 3
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 3
- LXJXRIRHZLFYRP-VKHMYHEASA-N D-glyceraldehyde 3-phosphate Chemical compound O=C[C@H](O)COP(O)(O)=O LXJXRIRHZLFYRP-VKHMYHEASA-N 0.000 description 3
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 3
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 3
- 241000282414 Homo sapiens Species 0.000 description 3
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 3
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 3
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 3
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 3
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 3
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 3
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 3
- SBKRTALNRRAOJP-BWSIXKJUSA-N N-[(2S)-4-amino-1-[[(2S,3R)-1-[[(2S)-4-amino-1-oxo-1-[[(3S,6S,9S,12S,15R,18R,21S)-6,9,18-tris(2-aminoethyl)-15-benzyl-3-[(1R)-1-hydroxyethyl]-12-(2-methylpropyl)-2,5,8,11,14,17,20-heptaoxo-1,4,7,10,13,16,19-heptazacyclotricos-21-yl]amino]butan-2-yl]amino]-3-hydroxy-1-oxobutan-2-yl]amino]-1-oxobutan-2-yl]-6-methylheptanamide (6S)-N-[(2S)-4-amino-1-[[(2S,3R)-1-[[(2S)-4-amino-1-oxo-1-[[(3S,6S,9S,12S,15R,18R,21S)-6,9,18-tris(2-aminoethyl)-15-benzyl-3-[(1R)-1-hydroxyethyl]-12-(2-methylpropyl)-2,5,8,11,14,17,20-heptaoxo-1,4,7,10,13,16,19-heptazacyclotricos-21-yl]amino]butan-2-yl]amino]-3-hydroxy-1-oxobutan-2-yl]amino]-1-oxobutan-2-yl]-6-methyloctanamide sulfuric acid Chemical compound OS(O)(=O)=O.CC(C)CCCCC(=O)N[C@@H](CCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCN)C(=O)N[C@H]1CCNC(=O)[C@@H](NC(=O)[C@H](CCN)NC(=O)[C@H](CCN)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](Cc2ccccc2)NC(=O)[C@@H](CCN)NC1=O)[C@@H](C)O.CC[C@H](C)CCCCC(=O)N[C@@H](CCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCN)C(=O)N[C@H]1CCNC(=O)[C@@H](NC(=O)[C@H](CCN)NC(=O)[C@H](CCN)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](Cc2ccccc2)NC(=O)[C@@H](CCN)NC1=O)[C@@H](C)O SBKRTALNRRAOJP-BWSIXKJUSA-N 0.000 description 3
- 239000004695 Polyether sulfone Substances 0.000 description 3
- 108010093965 Polymyxin B Proteins 0.000 description 3
- 229920001213 Polysorbate 20 Polymers 0.000 description 3
- 108020004511 Recombinant DNA Proteins 0.000 description 3
- 108091028664 Ribonucleotide Proteins 0.000 description 3
- 108020004422 Riboswitch Proteins 0.000 description 3
- ZIFYDQAFEMIZII-GUBZILKMSA-N Ser-Leu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZIFYDQAFEMIZII-GUBZILKMSA-N 0.000 description 3
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 3
- 239000013504 Triton X-100 Substances 0.000 description 3
- 229920004890 Triton X-100 Polymers 0.000 description 3
- GEGYPBOPIGNZIF-CWRNSKLLSA-N Trp-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O GEGYPBOPIGNZIF-CWRNSKLLSA-N 0.000 description 3
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 3
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 3
- 239000002253 acid Substances 0.000 description 3
- 238000005119 centrifugation Methods 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 3
- 230000001186 cumulative effect Effects 0.000 description 3
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical group NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 3
- 238000011033 desalting Methods 0.000 description 3
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 3
- 235000011180 diphosphates Nutrition 0.000 description 3
- 210000003527 eukaryotic cell Anatomy 0.000 description 3
- 239000007789 gas Substances 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 3
- 235000011187 glycerol Nutrition 0.000 description 3
- 239000001963 growth medium Substances 0.000 description 3
- 230000007935 neutral effect Effects 0.000 description 3
- 239000010452 phosphate Substances 0.000 description 3
- 229920006393 polyether sulfone Polymers 0.000 description 3
- 229960003548 polymyxin b sulfate Drugs 0.000 description 3
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 3
- 230000004481 post-translational protein modification Effects 0.000 description 3
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 3
- 238000003259 recombinant expression Methods 0.000 description 3
- 239000002336 ribonucleotide Substances 0.000 description 3
- 125000002652 ribonucleotide group Chemical group 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 239000011734 sodium Substances 0.000 description 3
- 239000002904 solvent Substances 0.000 description 3
- 239000006228 supernatant Substances 0.000 description 3
- 238000011282 treatment Methods 0.000 description 3
- 238000005406 washing Methods 0.000 description 3
- OSJPPGNTCRNQQC-UWTATZPHSA-N 3-phospho-D-glyceric acid Chemical compound OC(=O)[C@H](O)COP(O)(O)=O OSJPPGNTCRNQQC-UWTATZPHSA-N 0.000 description 2
- LRFVTYWOQMYALW-UHFFFAOYSA-N 9H-xanthine Chemical compound O=C1NC(=O)NC2=C1NC=N2 LRFVTYWOQMYALW-UHFFFAOYSA-N 0.000 description 2
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 2
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 2
- 102100034044 All-trans-retinol dehydrogenase [NAD(+)] ADH1B Human genes 0.000 description 2
- 101710193111 All-trans-retinol dehydrogenase [NAD(+)] ADH4 Proteins 0.000 description 2
- 101100014154 Arabidopsis thaliana RACK1A gene Proteins 0.000 description 2
- 239000004475 Arginine Substances 0.000 description 2
- IVPNEDNYYYFAGI-GARJFASQSA-N Asp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N IVPNEDNYYYFAGI-GARJFASQSA-N 0.000 description 2
- 101000690713 Aspergillus niger Alpha-glucosidase Proteins 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 102000010911 Enzyme Precursors Human genes 0.000 description 2
- 108010062466 Enzyme Precursors Proteins 0.000 description 2
- 241000223221 Fusarium oxysporum Species 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 102100034343 Integrase Human genes 0.000 description 2
- 102100027612 Kallikrein-11 Human genes 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 2
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- 239000004367 Lipase Substances 0.000 description 2
- 239000006142 Luria-Bertani Agar Substances 0.000 description 2
- GQFDWEDHOQRNLC-QWRGUYRKSA-N Lys-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN GQFDWEDHOQRNLC-QWRGUYRKSA-N 0.000 description 2
- 108010014251 Muramidase Proteins 0.000 description 2
- 102000016943 Muramidase Human genes 0.000 description 2
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 2
- XJLXINKUBYWONI-NNYOXOHSSA-N NADP zwitterion Chemical compound NC(=O)C1=CC=C[N+]([C@H]2[C@@H]([C@H](O)[C@@H](COP([O-])(=O)OP(O)(=O)OC[C@@H]3[C@H]([C@@H](OP(O)(O)=O)[C@@H](O3)N3C4=NC=NC(N)=C4N=C3)O)O2)O)=C1 XJLXINKUBYWONI-NNYOXOHSSA-N 0.000 description 2
- PXHVJJICTQNCMI-UHFFFAOYSA-N Nickel Chemical compound [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 2
- FGWUALWGCZJQDJ-URLPEUOOSA-N Phe-Thr-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGWUALWGCZJQDJ-URLPEUOOSA-N 0.000 description 2
- FZHBZMDRDASUHN-NAKRPEOUSA-N Pro-Ala-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1)C(O)=O FZHBZMDRDASUHN-NAKRPEOUSA-N 0.000 description 2
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 2
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 2
- 101100273253 Rhizopus niveus RNAP gene Proteins 0.000 description 2
- 102000006382 Ribonucleases Human genes 0.000 description 2
- 108010083644 Ribonucleases Proteins 0.000 description 2
- KYKKKSWGEPFUMR-NAKRPEOUSA-N Ser-Arg-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KYKKKSWGEPFUMR-NAKRPEOUSA-N 0.000 description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 description 2
- 102000039471 Small Nuclear RNA Human genes 0.000 description 2
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 2
- 239000004473 Threonine Substances 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- 108700009124 Transcription Initiation Site Proteins 0.000 description 2
- 101710152431 Trypsin-like protease Proteins 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- SYFHQHYTNCQCCN-MELADBBJSA-N Tyr-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O SYFHQHYTNCQCCN-MELADBBJSA-N 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- 206010046865 Vaccinia virus infection Diseases 0.000 description 2
- IXKSXJFAGXLQOQ-XISFHERQSA-N WHWLQLKPGQPMY Chemical compound C([C@@H](C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CNC=N1 IXKSXJFAGXLQOQ-XISFHERQSA-N 0.000 description 2
- 108010048241 acetamidase Proteins 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 235000004279 alanine Nutrition 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 2
- 125000003118 aryl group Chemical group 0.000 description 2
- 108010047857 aspartylglycine Proteins 0.000 description 2
- 238000003149 assay kit Methods 0.000 description 2
- 201000003639 autosomal recessive cerebellar ataxia Diseases 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 2
- 238000012219 cassette mutagenesis Methods 0.000 description 2
- 230000003197 catalytic effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000004587 chromatography analysis Methods 0.000 description 2
- 238000011109 contamination Methods 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000002405 diagnostic procedure Methods 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 238000010828 elution Methods 0.000 description 2
- 239000012149 elution buffer Substances 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 125000000524 functional group Chemical group 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 239000003112 inhibitor Substances 0.000 description 2
- 238000002347 injection Methods 0.000 description 2
- 239000007924 injection Substances 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 2
- 229960003136 leucine Drugs 0.000 description 2
- 239000003446 ligand Substances 0.000 description 2
- 238000011068 loading method Methods 0.000 description 2
- 239000012139 lysis buffer Substances 0.000 description 2
- 229960000274 lysozyme Drugs 0.000 description 2
- 239000004325 lysozyme Substances 0.000 description 2
- 235000010335 lysozyme Nutrition 0.000 description 2
- 108010064235 lysylglycine Proteins 0.000 description 2
- 210000004962 mammalian cell Anatomy 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 239000002609 medium Substances 0.000 description 2
- 229910052751 metal Inorganic materials 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 239000002679 microRNA Substances 0.000 description 2
- 231100000219 mutagenic Toxicity 0.000 description 2
- 230000003505 mutagenic effect Effects 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N nitrogen Substances N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 2
- 210000004940 nucleus Anatomy 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 239000008188 pellet Substances 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 2
- 150000008300 phosphoramidites Chemical class 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 102000054765 polymorphisms of proteins Human genes 0.000 description 2
- 230000001124 posttranscriptional effect Effects 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000001243 protein synthesis Methods 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 239000002342 ribonucleoside Substances 0.000 description 2
- 102220129017 rs199651321 Human genes 0.000 description 2
- 102220059647 rs370499060 Human genes 0.000 description 2
- 102220083823 rs863224587 Human genes 0.000 description 2
- 230000003248 secreting effect Effects 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 108091029842 small nuclear ribonucleic acid Proteins 0.000 description 2
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 2
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 238000001890 transfection Methods 0.000 description 2
- 125000002264 triphosphate group Chemical group [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 2
- 208000007089 vaccinia Diseases 0.000 description 2
- 230000002477 vacuolizing effect Effects 0.000 description 2
- 239000004474 valine Substances 0.000 description 2
- 229960004295 valine Drugs 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- LXJXRIRHZLFYRP-VKHMYHEASA-L (R)-2-Hydroxy-3-(phosphonooxy)-propanal Natural products O=C[C@H](O)COP([O-])([O-])=O LXJXRIRHZLFYRP-VKHMYHEASA-L 0.000 description 1
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- SNTGWXAZMZPJPH-UHFFFAOYSA-N 1-(2,5-dioxopyrrolidin-1-yl)oxypyrrolidine-2,5-dione Chemical compound O=C1CCC(=O)N1ON1C(=O)CCC1=O SNTGWXAZMZPJPH-UHFFFAOYSA-N 0.000 description 1
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 1
- 101710163881 5,6-dihydroxyindole-2-carboxylic acid oxidase Proteins 0.000 description 1
- BZTDTCNHAFUJOG-UHFFFAOYSA-N 6-carboxyfluorescein Chemical compound C12=CC=C(O)C=C2OC2=CC(O)=CC=C2C11OC(=O)C2=CC=C(C(=O)O)C=C21 BZTDTCNHAFUJOG-UHFFFAOYSA-N 0.000 description 1
- 102100022900 Actin, cytoplasmic 1 Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 1
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 1
- YBPLKDWJFYCZSV-ZLUOBGJFSA-N Ala-Asn-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N YBPLKDWJFYCZSV-ZLUOBGJFSA-N 0.000 description 1
- BGNLUHXLSAQYRQ-FXQIFTODSA-N Ala-Glu-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O BGNLUHXLSAQYRQ-FXQIFTODSA-N 0.000 description 1
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 1
- AJBVYEYZVYPFCF-CIUDSAMLSA-N Ala-Lys-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O AJBVYEYZVYPFCF-CIUDSAMLSA-N 0.000 description 1
- XSTZMVAYYCJTNR-DCAQKATOSA-N Ala-Met-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O XSTZMVAYYCJTNR-DCAQKATOSA-N 0.000 description 1
- BFMIRJBURUXDRG-DLOVCJGASA-N Ala-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 BFMIRJBURUXDRG-DLOVCJGASA-N 0.000 description 1
- IORKCNUBHNIMKY-CIUDSAMLSA-N Ala-Pro-Glu Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O IORKCNUBHNIMKY-CIUDSAMLSA-N 0.000 description 1
- PHQXWZGXKAFWAZ-ZLIFDBKOSA-N Ala-Trp-Lys Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 PHQXWZGXKAFWAZ-ZLIFDBKOSA-N 0.000 description 1
- CLOMBHBBUKAUBP-LSJOCFKGSA-N Ala-Val-His Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N CLOMBHBBUKAUBP-LSJOCFKGSA-N 0.000 description 1
- 244000291564 Allium cepa Species 0.000 description 1
- 235000002732 Allium cepa var. cepa Nutrition 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- 241000180579 Arca Species 0.000 description 1
- 241001421757 Arcas Species 0.000 description 1
- KWKQGHSSNHPGOW-BQBZGAKWSA-N Arg-Ala-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)NCC(O)=O KWKQGHSSNHPGOW-BQBZGAKWSA-N 0.000 description 1
- BHSYMWWMVRPCPA-CYDGBPFRSA-N Arg-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCCN=C(N)N BHSYMWWMVRPCPA-CYDGBPFRSA-N 0.000 description 1
- XTGGTAWGUFXJSV-NAKRPEOUSA-N Arg-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCCN=C(N)N)N XTGGTAWGUFXJSV-NAKRPEOUSA-N 0.000 description 1
- SNBHMYQRNCJSOJ-CIUDSAMLSA-N Arg-Gln-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SNBHMYQRNCJSOJ-CIUDSAMLSA-N 0.000 description 1
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 1
- HQIZDMIGUJOSNI-IUCAKERBSA-N Arg-Gly-Arg Chemical compound N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O HQIZDMIGUJOSNI-IUCAKERBSA-N 0.000 description 1
- GMFAGHNRXPSSJS-SRVKXCTJSA-N Arg-Leu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GMFAGHNRXPSSJS-SRVKXCTJSA-N 0.000 description 1
- NPAVRDPEFVKELR-DCAQKATOSA-N Arg-Lys-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NPAVRDPEFVKELR-DCAQKATOSA-N 0.000 description 1
- INXWADWANGLMPJ-JYJNAYRXSA-N Arg-Phe-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)CC1=CC=CC=C1 INXWADWANGLMPJ-JYJNAYRXSA-N 0.000 description 1
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 1
- ICRHGPYYXMWHIE-LPEHRKFASA-N Arg-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ICRHGPYYXMWHIE-LPEHRKFASA-N 0.000 description 1
- ANAHQDPQQBDOBM-UHFFFAOYSA-N Arg-Val-Tyr Natural products CC(C)C(NC(=O)C(N)CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O ANAHQDPQQBDOBM-UHFFFAOYSA-N 0.000 description 1
- SPIPSJXLZVTXJL-ZLUOBGJFSA-N Asn-Cys-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O SPIPSJXLZVTXJL-ZLUOBGJFSA-N 0.000 description 1
- DDPXDCKYWDGZAL-BQBZGAKWSA-N Asn-Gly-Arg Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N DDPXDCKYWDGZAL-BQBZGAKWSA-N 0.000 description 1
- NLRJGXZWTKXRHP-DCAQKATOSA-N Asn-Leu-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NLRJGXZWTKXRHP-DCAQKATOSA-N 0.000 description 1
- JEEFEQCRXKPQHC-KKUMJFAQSA-N Asn-Leu-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JEEFEQCRXKPQHC-KKUMJFAQSA-N 0.000 description 1
- XMHFCUKJRCQXGI-CIUDSAMLSA-N Asn-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O XMHFCUKJRCQXGI-CIUDSAMLSA-N 0.000 description 1
- KRXIWXCXOARFNT-ZLUOBGJFSA-N Asp-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O KRXIWXCXOARFNT-ZLUOBGJFSA-N 0.000 description 1
- XJQRWGXKUSDEFI-ACZMJKKPSA-N Asp-Glu-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XJQRWGXKUSDEFI-ACZMJKKPSA-N 0.000 description 1
- HOBNTSHITVVNBN-ZPFDUUQYSA-N Asp-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N HOBNTSHITVVNBN-ZPFDUUQYSA-N 0.000 description 1
- LIVXPXUVXFRWNY-CIUDSAMLSA-N Asp-Lys-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O LIVXPXUVXFRWNY-CIUDSAMLSA-N 0.000 description 1
- MYLZFUMPZCPJCJ-NHCYSSNCSA-N Asp-Lys-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MYLZFUMPZCPJCJ-NHCYSSNCSA-N 0.000 description 1
- KGHLGJAXYSVNJP-WHFBIAKZSA-N Asp-Ser-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O KGHLGJAXYSVNJP-WHFBIAKZSA-N 0.000 description 1
- LEYKQPDPZJIRTA-AQZXSJQPSA-N Asp-Trp-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LEYKQPDPZJIRTA-AQZXSJQPSA-N 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 102000035101 Aspartic proteases Human genes 0.000 description 1
- 108091005502 Aspartic proteases Proteins 0.000 description 1
- 241000228245 Aspergillus niger Species 0.000 description 1
- 101000950981 Bacillus subtilis (strain 168) Catabolic NAD-specific glutamate dehydrogenase RocG Proteins 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 102100030981 Beta-alanine-activating enzyme Human genes 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 108010059892 Cellulase Proteins 0.000 description 1
- 101710199851 Copy number protein Proteins 0.000 description 1
- 241000699802 Cricetulus griseus Species 0.000 description 1
- WXKWQSDHEXKKNC-ZKWXMUAHSA-N Cys-Asp-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N WXKWQSDHEXKKNC-ZKWXMUAHSA-N 0.000 description 1
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 1
- 102000018832 Cytochromes Human genes 0.000 description 1
- 108010052832 Cytochromes Proteins 0.000 description 1
- 150000008574 D-amino acids Chemical group 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 244000000626 Daucus carota Species 0.000 description 1
- 235000002767 Daucus carota Nutrition 0.000 description 1
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 241000701832 Enterobacteria phage T3 Species 0.000 description 1
- 241001302584 Escherichia coli str. K-12 substr. W3110 Species 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 101150108358 GLAA gene Proteins 0.000 description 1
- 241000287826 Gallus Species 0.000 description 1
- REJJNXODKSHOKA-ACZMJKKPSA-N Gln-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N REJJNXODKSHOKA-ACZMJKKPSA-N 0.000 description 1
- GMGKDVVBSVVKCT-NUMRIWBASA-N Gln-Asn-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GMGKDVVBSVVKCT-NUMRIWBASA-N 0.000 description 1
- JHPFPROFOAJRFN-IHRRRGAJSA-N Gln-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)O JHPFPROFOAJRFN-IHRRRGAJSA-N 0.000 description 1
- HYPVLWGNBIYTNA-GUBZILKMSA-N Gln-Leu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HYPVLWGNBIYTNA-GUBZILKMSA-N 0.000 description 1
- VUVKKXPCKILIBD-AVGNSLFASA-N Gln-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N VUVKKXPCKILIBD-AVGNSLFASA-N 0.000 description 1
- IIMZHVKZBGSEKZ-SZMVWBNQSA-N Gln-Trp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(C)C)C(O)=O IIMZHVKZBGSEKZ-SZMVWBNQSA-N 0.000 description 1
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 1
- RSUVOPBMWMTVDI-XEGUGMAKSA-N Glu-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCC(O)=O)C)C(O)=O)=CNC2=C1 RSUVOPBMWMTVDI-XEGUGMAKSA-N 0.000 description 1
- CGYDXNKRIMJMLV-GUBZILKMSA-N Glu-Arg-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O CGYDXNKRIMJMLV-GUBZILKMSA-N 0.000 description 1
- SVZIKUHLRKVZIF-GUBZILKMSA-N Glu-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N SVZIKUHLRKVZIF-GUBZILKMSA-N 0.000 description 1
- AFODTOLGSZQDSL-PEFMBERDSA-N Glu-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N AFODTOLGSZQDSL-PEFMBERDSA-N 0.000 description 1
- HNVFSTLPVJWIDV-CIUDSAMLSA-N Glu-Glu-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HNVFSTLPVJWIDV-CIUDSAMLSA-N 0.000 description 1
- XMPAXPSENRSOSV-RYUDHWBXSA-N Glu-Gly-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XMPAXPSENRSOSV-RYUDHWBXSA-N 0.000 description 1
- UGSVSNXPJJDJKL-SDDRHHMPSA-N Glu-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UGSVSNXPJJDJKL-SDDRHHMPSA-N 0.000 description 1
- MRWYPDWDZSLWJM-ACZMJKKPSA-N Glu-Ser-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O MRWYPDWDZSLWJM-ACZMJKKPSA-N 0.000 description 1
- DAHLWSFUXOHMIA-FXQIFTODSA-N Glu-Ser-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O DAHLWSFUXOHMIA-FXQIFTODSA-N 0.000 description 1
- RFTVTKBHDXCEEX-WDSKDSINSA-N Glu-Ser-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RFTVTKBHDXCEEX-WDSKDSINSA-N 0.000 description 1
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 1
- 102000016901 Glutamate dehydrogenase Human genes 0.000 description 1
- AIJAPFVDBFYNKN-WHFBIAKZSA-N Gly-Asn-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN)C(=O)N AIJAPFVDBFYNKN-WHFBIAKZSA-N 0.000 description 1
- JVWPPCWUDRJGAE-YUMQZZPRSA-N Gly-Asn-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JVWPPCWUDRJGAE-YUMQZZPRSA-N 0.000 description 1
- JUGQPPOVWXSPKJ-RYUDHWBXSA-N Gly-Gln-Phe Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JUGQPPOVWXSPKJ-RYUDHWBXSA-N 0.000 description 1
- STVHDEHTKFXBJQ-LAEOZQHASA-N Gly-Glu-Ile Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STVHDEHTKFXBJQ-LAEOZQHASA-N 0.000 description 1
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 1
- CLNSYANKYVMZNM-UWVGGRQHSA-N Gly-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N CLNSYANKYVMZNM-UWVGGRQHSA-N 0.000 description 1
- WDEHMRNSGHVNOH-VHSXEESVSA-N Gly-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)CN)C(=O)O WDEHMRNSGHVNOH-VHSXEESVSA-N 0.000 description 1
- FJWSJWACLMTDMI-WPRPVWTQSA-N Gly-Met-Val Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O FJWSJWACLMTDMI-WPRPVWTQSA-N 0.000 description 1
- MKIAPEZXQDILRR-YUMQZZPRSA-N Gly-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN MKIAPEZXQDILRR-YUMQZZPRSA-N 0.000 description 1
- XHVONGZZVUUORG-WEDXCCLWSA-N Gly-Thr-Lys Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN XHVONGZZVUUORG-WEDXCCLWSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 101150009006 HIS3 gene Proteins 0.000 description 1
- 101100295959 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) arcB gene Proteins 0.000 description 1
- 101100246753 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) pyrF gene Proteins 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- GUXQAPACZVVOKX-AVGNSLFASA-N His-Lys-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N GUXQAPACZVVOKX-AVGNSLFASA-N 0.000 description 1
- ZFDKSLBEWYCOCS-BZSNNMDCSA-N His-Phe-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1NC=NC=1)C1=CC=CC=C1 ZFDKSLBEWYCOCS-BZSNNMDCSA-N 0.000 description 1
- HYWZHNUGAYVEEW-KKUMJFAQSA-N His-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N HYWZHNUGAYVEEW-KKUMJFAQSA-N 0.000 description 1
- 101000773364 Homo sapiens Beta-alanine-activating enzyme Proteins 0.000 description 1
- 101000664737 Homo sapiens Somatotropin Proteins 0.000 description 1
- 241001480714 Humicola insolens Species 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- ATXGFMOBVKSOMK-PEDHHIEDSA-N Ile-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N ATXGFMOBVKSOMK-PEDHHIEDSA-N 0.000 description 1
- RPZFUIQVAPZLRH-GHCJXIJMSA-N Ile-Asp-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)O)N RPZFUIQVAPZLRH-GHCJXIJMSA-N 0.000 description 1
- JRYQSFOFUFXPTB-RWRJDSDZSA-N Ile-Gln-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N JRYQSFOFUFXPTB-RWRJDSDZSA-N 0.000 description 1
- KIMHKBDJQQYLHU-PEFMBERDSA-N Ile-Glu-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KIMHKBDJQQYLHU-PEFMBERDSA-N 0.000 description 1
- LPXHYGGZJOCAFR-MNXVOIDGSA-N Ile-Glu-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N LPXHYGGZJOCAFR-MNXVOIDGSA-N 0.000 description 1
- PDTMWFVVNZYWTR-NHCYSSNCSA-N Ile-Gly-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](CCCCN)C(O)=O PDTMWFVVNZYWTR-NHCYSSNCSA-N 0.000 description 1
- JNLSTRPWUXOORL-MMWGEVLESA-N Ile-Ser-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N JNLSTRPWUXOORL-MMWGEVLESA-N 0.000 description 1
- HJDZMPFEXINXLO-QPHKQPEJSA-N Ile-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N HJDZMPFEXINXLO-QPHKQPEJSA-N 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 241000235058 Komagataella pastoris Species 0.000 description 1
- SNDPXSYFESPGGJ-BYPYZUCNSA-N L-2-aminopentanoic acid Chemical compound CCC[C@H](N)C(O)=O SNDPXSYFESPGGJ-BYPYZUCNSA-N 0.000 description 1
- QUOGESRFPZDMMT-UHFFFAOYSA-N L-Homoarginine Natural products OC(=O)C(N)CCCCNC(N)=N QUOGESRFPZDMMT-UHFFFAOYSA-N 0.000 description 1
- AHLPHDHHMVZTML-BYPYZUCNSA-N L-Ornithine Chemical compound NCCC[C@H](N)C(O)=O AHLPHDHHMVZTML-BYPYZUCNSA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- QUOGESRFPZDMMT-YFKPBYRVSA-N L-homoarginine Chemical compound OC(=O)[C@@H](N)CCCCNC(N)=N QUOGESRFPZDMMT-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- SNDPXSYFESPGGJ-UHFFFAOYSA-N L-norVal-OH Natural products CCCC(N)C(O)=O SNDPXSYFESPGGJ-UHFFFAOYSA-N 0.000 description 1
- KVRKAGGMEWNURO-CIUDSAMLSA-N Leu-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(C)C)N KVRKAGGMEWNURO-CIUDSAMLSA-N 0.000 description 1
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 1
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 1
- IWTBYNQNAPECCS-AVGNSLFASA-N Leu-Glu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IWTBYNQNAPECCS-AVGNSLFASA-N 0.000 description 1
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 1
- KWLWZYMNUZJKMZ-IHRRRGAJSA-N Leu-Pro-Leu Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O KWLWZYMNUZJKMZ-IHRRRGAJSA-N 0.000 description 1
- SBANPBVRHYIMRR-GARJFASQSA-N Leu-Ser-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N SBANPBVRHYIMRR-GARJFASQSA-N 0.000 description 1
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 1
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 1
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 1
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 1
- 102000004882 Lipase Human genes 0.000 description 1
- 108090001060 Lipase Proteins 0.000 description 1
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 1
- YIBOAHAOAWACDK-QEJZJMRPSA-N Lys-Ala-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YIBOAHAOAWACDK-QEJZJMRPSA-N 0.000 description 1
- WXJKFRMKJORORD-DCAQKATOSA-N Lys-Arg-Ala Chemical compound NC(=N)NCCC[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CCCCN WXJKFRMKJORORD-DCAQKATOSA-N 0.000 description 1
- ZTPWXNOOKAXPPE-DCAQKATOSA-N Lys-Arg-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N ZTPWXNOOKAXPPE-DCAQKATOSA-N 0.000 description 1
- 108010062166 Lys-Asn-Asp Proteins 0.000 description 1
- LZWNAOIMTLNMDW-NHCYSSNCSA-N Lys-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N LZWNAOIMTLNMDW-NHCYSSNCSA-N 0.000 description 1
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 1
- YXPJCVNIDDKGOE-MELADBBJSA-N Lys-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N)C(=O)O YXPJCVNIDDKGOE-MELADBBJSA-N 0.000 description 1
- PLDJDCJLRCYPJB-VOAKCMCISA-N Lys-Lys-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PLDJDCJLRCYPJB-VOAKCMCISA-N 0.000 description 1
- XFANQCRHTMOEAP-WDSOQIARSA-N Lys-Pro-Trp Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O XFANQCRHTMOEAP-WDSOQIARSA-N 0.000 description 1
- CAVRAQIDHUPECU-UVOCVTCTSA-N Lys-Thr-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAVRAQIDHUPECU-UVOCVTCTSA-N 0.000 description 1
- RQILLQOQXLZTCK-KBPBESRZSA-N Lys-Tyr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O RQILLQOQXLZTCK-KBPBESRZSA-N 0.000 description 1
- MDDUIRLQCYVRDO-NHCYSSNCSA-N Lys-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN MDDUIRLQCYVRDO-NHCYSSNCSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 101150068888 MET3 gene Proteins 0.000 description 1
- IHITVQKJXQQGLJ-LPEHRKFASA-N Met-Asn-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N IHITVQKJXQQGLJ-LPEHRKFASA-N 0.000 description 1
- HDNOQCZWJGGHSS-VEVYYDQMSA-N Met-Asn-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HDNOQCZWJGGHSS-VEVYYDQMSA-N 0.000 description 1
- MNNKPHGAPRUKMW-BPUTZDHNSA-N Met-Asp-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCSC)C(O)=O)=CNC2=C1 MNNKPHGAPRUKMW-BPUTZDHNSA-N 0.000 description 1
- PHWSCIFNNLLUFJ-NHCYSSNCSA-N Met-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCSC)N PHWSCIFNNLLUFJ-NHCYSSNCSA-N 0.000 description 1
- FZUNSVYYPYJYAP-NAKRPEOUSA-N Met-Ile-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O FZUNSVYYPYJYAP-NAKRPEOUSA-N 0.000 description 1
- KBTQZYASLSUFJR-KKUMJFAQSA-N Met-Phe-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N KBTQZYASLSUFJR-KKUMJFAQSA-N 0.000 description 1
- IHRFZLQEQVHXFA-RHYQMDGZSA-N Met-Thr-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCCN IHRFZLQEQVHXFA-RHYQMDGZSA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 101100022915 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) cys-11 gene Proteins 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 108090000913 Nitrate Reductases Proteins 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- AHLPHDHHMVZTML-UHFFFAOYSA-N Orn-delta-NH2 Natural products NCCCC(N)C(O)=O AHLPHDHHMVZTML-UHFFFAOYSA-N 0.000 description 1
- UTJLXEIPEHZYQJ-UHFFFAOYSA-N Ornithine Natural products OC(=O)C(C)CCCN UTJLXEIPEHZYQJ-UHFFFAOYSA-N 0.000 description 1
- 102000007981 Ornithine carbamoyltransferase Human genes 0.000 description 1
- 108700006307 Ornithine carbamoyltransferases Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 102000002508 Peptide Elongation Factors Human genes 0.000 description 1
- 108010068204 Peptide Elongation Factors Proteins 0.000 description 1
- LSXGADJXBDFXQU-DLOVCJGASA-N Phe-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 LSXGADJXBDFXQU-DLOVCJGASA-N 0.000 description 1
- BBDSZDHUCPSYAC-QEJZJMRPSA-N Phe-Ala-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BBDSZDHUCPSYAC-QEJZJMRPSA-N 0.000 description 1
- GDBOREPXIRKSEQ-FHWLQOOXSA-N Phe-Gln-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GDBOREPXIRKSEQ-FHWLQOOXSA-N 0.000 description 1
- RFEXGCASCQGGHZ-STQMWFEESA-N Phe-Gly-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O RFEXGCASCQGGHZ-STQMWFEESA-N 0.000 description 1
- KRYSMKKRRRWOCZ-QEWYBTABSA-N Phe-Ile-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KRYSMKKRRRWOCZ-QEWYBTABSA-N 0.000 description 1
- 108010010677 Phosphodiesterase I Proteins 0.000 description 1
- 108091036407 Polyadenylation Proteins 0.000 description 1
- FYQSMXKJYTZYRP-DCAQKATOSA-N Pro-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 FYQSMXKJYTZYRP-DCAQKATOSA-N 0.000 description 1
- OZAPWFHRPINHND-GUBZILKMSA-N Pro-Cys-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O OZAPWFHRPINHND-GUBZILKMSA-N 0.000 description 1
- KIDXAAQVMNLJFQ-KZVJFYERSA-N Pro-Thr-Ala Chemical compound C[C@@H](O)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](C)C(O)=O KIDXAAQVMNLJFQ-KZVJFYERSA-N 0.000 description 1
- CHYAYDLYYIJCKY-OSUNSFLBSA-N Pro-Thr-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CHYAYDLYYIJCKY-OSUNSFLBSA-N 0.000 description 1
- QHSSUIHLAIWXEE-IHRRRGAJSA-N Pro-Tyr-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O QHSSUIHLAIWXEE-IHRRRGAJSA-N 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- 108010003201 RGH 0205 Proteins 0.000 description 1
- 108010065868 RNA polymerase SP6 Proteins 0.000 description 1
- 239000013614 RNA sample Substances 0.000 description 1
- 230000007022 RNA scission Effects 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 1
- 241000235403 Rhizomucor miehei Species 0.000 description 1
- 101100394989 Rhodopseudomonas palustris (strain ATCC BAA-98 / CGA009) hisI gene Proteins 0.000 description 1
- 241000235070 Saccharomyces Species 0.000 description 1
- 101100022918 Schizosaccharomyces pombe (strain 972 / ATCC 24843) sua1 gene Proteins 0.000 description 1
- ULVMNZOKDBHKKI-ACZMJKKPSA-N Ser-Gln-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ULVMNZOKDBHKKI-ACZMJKKPSA-N 0.000 description 1
- BKZYBLLIBOBOOW-GHCJXIJMSA-N Ser-Ile-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O BKZYBLLIBOBOOW-GHCJXIJMSA-N 0.000 description 1
- BEAFYHFQTOTVFS-VGDYDELISA-N Ser-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N BEAFYHFQTOTVFS-VGDYDELISA-N 0.000 description 1
- IUXGJEIKJBYKOO-SRVKXCTJSA-N Ser-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N IUXGJEIKJBYKOO-SRVKXCTJSA-N 0.000 description 1
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 1
- 241001479493 Sousa Species 0.000 description 1
- 241000256248 Spodoptera Species 0.000 description 1
- 101100370749 Streptomyces coelicolor (strain ATCC BAA-471 / A3(2) / M145) trpC1 gene Proteins 0.000 description 1
- 108700005078 Synthetic Genes Proteins 0.000 description 1
- 241000223258 Thermomyces lanuginosus Species 0.000 description 1
- IMULJHHGAUZZFE-MBLNEYKQSA-N Thr-Gly-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IMULJHHGAUZZFE-MBLNEYKQSA-N 0.000 description 1
- KRGDDWVBBDLPSJ-CUJWVEQBSA-N Thr-His-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O KRGDDWVBBDLPSJ-CUJWVEQBSA-N 0.000 description 1
- NHQVWACSJZJCGJ-FLBSBUHZSA-N Thr-Thr-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NHQVWACSJZJCGJ-FLBSBUHZSA-N 0.000 description 1
- BGHVVGPELPHRCI-HZTRNQAASA-N Thr-Trp-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)O)N)O BGHVVGPELPHRCI-HZTRNQAASA-N 0.000 description 1
- KZTLZZQTJMCGIP-ZJDVBMNYSA-N Thr-Val-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KZTLZZQTJMCGIP-ZJDVBMNYSA-N 0.000 description 1
- 102000004357 Transferases Human genes 0.000 description 1
- 108090000992 Transferases Proteins 0.000 description 1
- 108700019146 Transgenes Proteins 0.000 description 1
- 108700015934 Triose-phosphate isomerases Proteins 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- WBZOZLNLXVBCNW-LTHWPDAASA-N Trp-Thr-Ile Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)CC)C(O)=O)[C@@H](C)O)=CNC2=C1 WBZOZLNLXVBCNW-LTHWPDAASA-N 0.000 description 1
- IELISNUVHBKYBX-XDTLVQLUSA-N Tyr-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 IELISNUVHBKYBX-XDTLVQLUSA-N 0.000 description 1
- GFZQWWDXJVGEMW-ULQDDVLXSA-N Tyr-Arg-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O GFZQWWDXJVGEMW-ULQDDVLXSA-N 0.000 description 1
- ZRPLVTZTKPPSBT-AVGNSLFASA-N Tyr-Glu-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZRPLVTZTKPPSBT-AVGNSLFASA-N 0.000 description 1
- KSCVLGXNQXKUAR-JYJNAYRXSA-N Tyr-Leu-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KSCVLGXNQXKUAR-JYJNAYRXSA-N 0.000 description 1
- SBLZVFCEOCWRLS-BPNCWPANSA-N Tyr-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=C(C=C1)O)N SBLZVFCEOCWRLS-BPNCWPANSA-N 0.000 description 1
- NZBSVMQZQMEUHI-WZLNRYEVSA-N Tyr-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NZBSVMQZQMEUHI-WZLNRYEVSA-N 0.000 description 1
- 101150050575 URA3 gene Proteins 0.000 description 1
- 108091023045 Untranslated Region Proteins 0.000 description 1
- LABUITCFCAABSV-BPNCWPANSA-N Val-Ala-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 LABUITCFCAABSV-BPNCWPANSA-N 0.000 description 1
- NMANTMWGQZASQN-QXEWZRGKSA-N Val-Arg-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N NMANTMWGQZASQN-QXEWZRGKSA-N 0.000 description 1
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 1
- XXROXFHCMVXETG-UWVGGRQHSA-N Val-Gly-Val Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXROXFHCMVXETG-UWVGGRQHSA-N 0.000 description 1
- ZRSZTKTVPNSUNA-IHRRRGAJSA-N Val-Lys-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(O)=O ZRSZTKTVPNSUNA-IHRRRGAJSA-N 0.000 description 1
- DOFAQXCYFQKSHT-SRVKXCTJSA-N Val-Pro-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DOFAQXCYFQKSHT-SRVKXCTJSA-N 0.000 description 1
- RLVTVHSDKHBFQP-ULQDDVLXSA-N Val-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=C(O)C=C1 RLVTVHSDKHBFQP-ULQDDVLXSA-N 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 108010041407 alanylaspartic acid Proteins 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- 102000004139 alpha-Amylases Human genes 0.000 description 1
- 108090000637 alpha-Amylases Proteins 0.000 description 1
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 1
- 229940024171 alpha-amylase Drugs 0.000 description 1
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 101150008194 argB gene Proteins 0.000 description 1
- 108010060035 arginylproline Proteins 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229940009098 aspartate Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 1
- 235000020054 awamori Nutrition 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 108010028263 bacteriophage T3 RNA polymerase Proteins 0.000 description 1
- 108010051210 beta-Fructofuranosidase Proteins 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 238000002306 biochemical method Methods 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 239000003139 biocide Substances 0.000 description 1
- 239000012620 biological material Substances 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 239000006143 cell culture medium Substances 0.000 description 1
- 239000006285 cell suspension Substances 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000013375 chromatographic separation Methods 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 238000005352 clarification Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 239000013599 cloning vector Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 239000012228 culture supernatant Substances 0.000 description 1
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000000326 densiometry Methods 0.000 description 1
- 239000005549 deoxyribonucleoside Substances 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 230000009483 enzymatic pathway Effects 0.000 description 1
- 210000002950 fibroblast Anatomy 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 210000003811 finger Anatomy 0.000 description 1
- 239000005350 fused silica glass Substances 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 102000054767 gene variant Human genes 0.000 description 1
- 229930195712 glutamate Natural products 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- 108010078144 glutaminyl-glycine Proteins 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- 102000006602 glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 229910001385 heavy metal Inorganic materials 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 238000004191 hydrophobic interaction chromatography Methods 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 108010002685 hygromycin-B kinase Proteins 0.000 description 1
- 230000016784 immunoglobulin production Effects 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 1
- 238000011005 laboratory method Methods 0.000 description 1
- 108010034529 leucyl-lysine Proteins 0.000 description 1
- 235000019421 lipase Nutrition 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 101150039489 lysZ gene Proteins 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 201000001441 melanoma Diseases 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 238000007481 next generation sequencing Methods 0.000 description 1
- 101150095344 niaD gene Proteins 0.000 description 1
- 229910052759 nickel Inorganic materials 0.000 description 1
- 229930027945 nicotinamide-adenine dinucleotide Natural products 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000005580 one pot reaction Methods 0.000 description 1
- 229960003104 ornithine Drugs 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 239000008194 pharmaceutical composition Substances 0.000 description 1
- JTJMJGYZQZDUJJ-UHFFFAOYSA-N phencyclidine Chemical compound C1CCCCN1C1(C=2C=CC=CC=2)CCCCC1 JTJMJGYZQZDUJJ-UHFFFAOYSA-N 0.000 description 1
- 108010018625 phenylalanylarginine Proteins 0.000 description 1
- 108010012581 phenylalanylglutamate Proteins 0.000 description 1
- 235000021317 phosphate Nutrition 0.000 description 1
- 108010082527 phosphinothricin N-acetyltransferase Proteins 0.000 description 1
- KCRZDTROFIOPBP-UHFFFAOYSA-N phosphono 2,3-dihydroxypropanoate Chemical compound OCC(O)C(=O)OP(O)(O)=O KCRZDTROFIOPBP-UHFFFAOYSA-N 0.000 description 1
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 238000007747 plating Methods 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 229920000136 polysorbate Polymers 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 150000003109 potassium Chemical class 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 108010015796 prolylisoleucine Proteins 0.000 description 1
- 108060006633 protein kinase Proteins 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 230000017854 proteolysis Effects 0.000 description 1
- 230000002797 proteolythic effect Effects 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- 238000010926 purge Methods 0.000 description 1
- 239000012521 purified sample Substances 0.000 description 1
- 101150054232 pyrG gene Proteins 0.000 description 1
- 238000002708 random mutagenesis Methods 0.000 description 1
- 230000035484 reaction time Effects 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 238000004366 reverse phase liquid chromatography Methods 0.000 description 1
- 238000003757 reverse transcription PCR Methods 0.000 description 1
- 238000004007 reversed phase HPLC Methods 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 102200027487 rs56170584 Human genes 0.000 description 1
- 238000005185 salting out Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 1
- 238000012807 shake-flask culturing Methods 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000010532 solid phase synthesis reaction Methods 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 239000007921 spray Substances 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 239000008223 sterile water Substances 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 229920002994 synthetic fiber Polymers 0.000 description 1
- 238000010189 synthetic method Methods 0.000 description 1
- 108010061238 threonyl-glycine Proteins 0.000 description 1
- 210000003813 thumb Anatomy 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 101150016309 trpC gene Proteins 0.000 description 1
- 230000001810 trypsinlike Effects 0.000 description 1
- 238000005199 ultracentrifugation Methods 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
- 239000003643 water by type Substances 0.000 description 1
- 229940075420 xanthine Drugs 0.000 description 1
Images
Abstract
Description
[1] Настоящей заявке испрашивается приоритет по предварительной патентной заявке США с серийным номером №62/527764, поданной 30 июня 2017 года, и предварительной патентной заявке США с серийным номером №62/528846, поданной 5 июля 2017 года, обе из которых включены в настоящее описание в качестве ссылок в полном объеме для любых целей. [1] This application claims priority over U.S. Provisional Application Serial No. 62/527764, filed June 30, 2017, and U.S. Provisional Patent Application Serial No. 62/528846, filed July 5, 2017, both of which are included in this description as a reference in its entirety for any purpose.
ОБЛАСТЬ ИЗОБРЕТЕНИЯFIELD OF THE INVENTION
[2] Настоящее изобретение относится сконструированным вариантам РНК-полимеразы и к их композициям, содержащим эти варианты. Кроме того, настоящее изобретение относится к сконструированным вариантам РНК-полимеразы T7 и к композициям, содержащим эти варианты. Эти варианты изменены для селективного включения аналога кэпа m7G(5')ppp(5')m7G относительно GTP при инициации транскрипции in vitro. Настоящее изобретение также относится к способам применения вариантов, описанных в настоящем описании. Кроме того, настоящее изобретение относится к применению композиций, описанных в настоящем описании. [2] The present invention relates to engineered variants of RNA polymerase and their compositions containing these variants. In addition, the present invention relates to engineered variants of T7 RNA polymerase and compositions containing these variants. These variants are modified to selectively include the m7G(5')ppp(5')m7G cap analog relative to GTP upon in vitro transcription initiation. The present invention also relates to methods of using the options described in the present description. In addition, the present invention relates to the use of the compositions described in the present description.
УКАЗАНИЕ НА СПИСОК ПОСЛЕДОВАТЕЛЬНОСТЕЙ, ТАБЛИЦУ ИЛИ КОМПЬЮТЕРНУЮ ПРОГРАММУINDICATION TO A SEQUENCE LIST, TABLE OR COMPUTER PROGRAM
[3] Официальная копия списка последовательностей предоставлена одновременно с описанием в качестве текстового файла в формате ASCII через EFS-Web, с названием файла "CX8-168CUSP1_ST25.txt", датой создания 5 июля 2017 года и размером 184,320 байт. Список последовательностей, предоставленный через EFS-Web, является частью описания и включен в настоящее описание в качестве ссылки в полном объеме. [3] An official copy of the sequence listing is provided along with the description as an ASCII text file via EFS-Web, with the file name "CX8-168CUSP1_ST25.txt", creation date July 5, 2017, and size 184,320 bytes. The sequence listing provided via EFS-Web is part of the description and is incorporated herein by reference in its entirety.
УРОВЕНЬ ТЕХНИКИ, К КОТОРОМУ ОТНОСИТСЯ ИЗОБРЕТЕНИЕSTATE OF THE ART TO which THE INVENTION RELATES
[4] РНК-полимераза T7 (E.C. 2.7.7.6) представляет собой мономерную кодируемую бактериофагом DNA-направляемую РНК-полимеразу, которая катализирует образование РНК в направлении от 5' к 3'. В процессе инициации транскрипции РНК-полимераза T7 распознает конкретную промоторную последовательность (т.е. промотор T7). Встречающаяся в природе РНК-полимераза T7 содержит 883 аминокислоты. Она является высокогомологичной РНК-полимеразе T3 и в некоторой степени гомологичной РНК-полимеразе SP6. T7 содержит несколько доменов, включая N-концевой домен, "большой палец", "ладонь" и "пальцы" (см., например, Sousa and Mukherjee, Prog. Nucl. Acid Res. Mol. Biol., 73:1-41 [2003] и патент США №9193959). Конформация N-концевого домена меняется между фазами инициации и элонгации функционирующего фермента. [4] T7 RNA polymerase (EC 2.7.7.6) is a monomeric bacteriophage-encoded DNA-directed RNA polymerase that catalyzes the formation of RNA in the 5' to 3' direction. During transcription initiation, T7 RNA polymerase recognizes a specific promoter sequence (i.e., the T7 promoter). The naturally occurring T7 RNA polymerase contains 883 amino acids. It is highly homologous to T3 RNA polymerase and somewhat homologous to SP6 RNA polymerase. T7 contains several domains, including the N-terminal domain, "thumb", "palm" and "fingers" (see, for example, Sousa and Mukherjee, Prog. Nucl. Acid Res. Mol. Biol., 73:1-41 [2003] and US patent No. 9193959). The conformation of the N-terminal domain changes between the initiation and elongation phases of a functioning enzyme.
[5] Описано клонирование и экспрессия гена, кодирующего РНК-полимеразу T7 (см., например, патент США №4952496). Вследствие ее специфичности к промотору и высокой активности РНК-полимеразы, T7 используется для различных применений. Также она является пригодной для экспрессии на высоком уровне рекомбинантных генов в E. coli (См., Studier and Moffat, J. Mol. Biol., 18:113-130 [1986]). T7 также используется в различных способах амплификации нуклеиновых кислот, включая те, которые используются в диагностических способах. Поскольку стабильность и термостабильность часто являются важными факторами, которые должны учитываться при разработке компонентов диагностических способов, описана работа по повышению термостабильности и стабильности T7 (см., например, патенты США №9193959, 8551752 и 7507567 и т.д.). Тем не менее в данной области остается потребность в вариантах ферментов T7, которые демонстрируют улучшенные свойства по сравнению со встречающимся в природе ферментом. [5] The cloning and expression of a gene encoding T7 RNA polymerase has been described (see, for example, US Pat. No. 4,952,496). Due to its promoter specificity and high RNA polymerase activity, T7 is used for various applications. It is also suitable for high-level expression of recombinant genes in E. coli (See, Studier and Moffat, J. Mol. Biol., 18:113-130 [1986]). T7 is also used in various nucleic acid amplification methods, including those used in diagnostic methods. Because stability and thermal stability are often important factors to consider when developing components for diagnostic methods, work has been described to improve T7 thermal stability and stability (see, for example, US Pat. However, there remains a need in the art for variants of T7 enzymes that exhibit improved properties over the naturally occurring enzyme.
СУЩНОСТЬ ИЗОБРЕТЕНИЯSUMMARY OF THE INVENTION
[6] Настоящее изобретение относится сконструированным вариантам РНК-полимеразы T7 и их композициям. Эти варианты изменены для селективного включения симметричного кэпированного аналога GTP относительно GTP при инициации транскрипции in vitro. Настоящее изобретение также относится к способам применения вариантов, описанных в настоящем описании. Кроме того, настоящее изобретение относится к применению композиций, описанных в настоящем описании. [6] The present invention relates to engineered variants of T7 RNA polymerase and compositions thereof. These variants are modified to selectively include a symmetrically capped GTP analog relative to GTP when initiating transcription in vitro . The present invention also relates to methods of using the options described in the present description. In addition, the present invention relates to the use of the compositions described in the present description.
[7] Настоящее изобретение относится сконструированным РНК-полимеразам, содержащим полипептидные последовательности, обладающие по меньшей мере 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более идентичностью последовательности с эталонной последовательностью SEQ ID NO: 4 и/или 15, или их функциональным фрагментам, где сконструированные РНК-полимеразы содержат по меньшей мере одну замену или набор замен в полипептидных последовательностях и где аминокислотные положения полипептидных последовательностей пронумерованы относительно SEQ ID NO: 4 или 15. [7] The present invention relates to engineered RNA polymerases containing polypeptide sequences having at least 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99 % or more sequence identity with the reference sequence of SEQ ID NO: 4 and/or 15, or functional fragments thereof, where the engineered RNA polymerases contain at least one substitution or set of substitutions in the polypeptide sequences and where the amino acid positions of the polypeptide sequences are numbered relative to SEQ ID NO: 4 or 15.
[8] В некоторых вариантах осуществления сконструированные РНК-полимеразы содержат по меньшей мере одну замену или набор замен, которые выбраны из 32/357, 49/642, 97/357, 136, 137, 160/643, 167/514, 250, 302/513, 314/401, 357, 392, 393, 394, 397, 401, 404, 444, 446, 478, 513, 514, 582, 635, 636, 637, 639, 642, 643, 645, 653, 656, 660, 660/806, 661 и 664, и/или любых их комбинаций, где положения аминокислот пронумерованы в соответствии с SEQ ID NO: 4. В некоторых других вариантах осуществления сконструированные РНК-полимеразы содержат по меньшей мере одну замену или набор замен, которые выбраны из 32V/357I, 49G/642L, 97D/357G, 136E/I, 137W, 160L/643S, 167N/514L, 250D, 302V/513G, 314C/401V, 357G/K/L/M/N/Q/R/S/T/V/W, 392D, 393L/Y, 394A/L/R, 397F/M/Q/W, 401A/I/L/S/V, 404E/Y, 444F/H/I/V, 446W/Y, 478F/M/W, 513C/F/K/L/R/T/W, 514F/I/L/Y, 582N, 635W, 636L, 637G/P/S, 639H, 642L, 643A, 645V, 653C, 656F/W, 660A/C/M/S/T/W, 660N/806Y, 661E/Y и 664W, и/или любых их комбинаций, где положения аминокислот пронумерованы в соответствии с SEQ ID NO: 4. В некоторых дополнительных вариантах осуществления сконструированные РНК-полимеразы содержат по меньшей мере одну замену или набор замен, которые выбраны из A32V/E357I, E49G/M642L, E97D/E357G, A136E/I, D137W, R160L/T643S, K167N/S514L, T250D, A302V/D513G, R314C/R401V, E357G/K/L/M/N/Q/R/S/T/V/W, Y392D, R393L/Y, K394A/L/R, A397F/M/Q/W, R401A/I/L/S/V, S404E/Y, N444F/H/I/V, M446W/Y, D478F/M/W, D513C/F/K/L/R/T/W, S514F/I/L/Y, A582N, S635W, V636L, T637G/P/S, R639H, M642L, T643A, A645V, F653C, Q656F/W, D660A/C/M/S/T/W, D660N/H806Y, T661E/Y и P664W, и/или любых их комбинаций, где положения аминокислот пронумерованы в соответствии с SEQ ID NO: 4. [8] In some embodiments, the engineered RNA polymerases contain at least one substitution or set of substitutions that are selected from 32/357, 49/642, 97/357, 136, 137, 160/643, 167/514, 250, 302/513, 314/401, 357, 392, 393, 394, 397, 401, 404, 444, 446, 478, 513, 514, 582, 635, 636, 637, 639, 642, 643, 645, 653 , 656, 660, 660/806, 661, and 664, and/or any combination thereof, wherein the amino acid positions are numbered according to SEQ ID NO: 4. In some other embodiments, the engineered RNA polymerases contain at least one substitution or set of substitutions which are selected from 32V/357I, 49G/642L, 97D/357G, 136E/I, 137W, 160L/643S, 167N/514L, 250D, 302V/513G, 314C/401V, 357G/K/L/M/N/ Q/R/S/T/V/W, 392D, 393L/Y, 394A/L/R, 397F/M/Q/W, 401A/I/L/S/V, 404E/Y, 444F/H/ I/V, 446W/Y, 478F/M/W, 513C/F/K/L/R/T/W, 514F/I/L/Y, 582N, 635W, 636L, 637G/P/S, 639H, 642L, 643A, 645V, 653C, 656F/W, 660A/C/M/S/T/W, 660N/806Y, 661E/Y and 664W, and/or any combination thereof, where amino acid positions are numbered according to SEQ ID NO: 4. In some additional embodiments, the engineered RNA polymerases contain at least one substitution or set of substitutions that are selected from A32V/E357I, E49G/M642L, E97D/E357G, A136E/I, D137W, R160L/T643S, K167N/ S514L, T250D, A302V/D513G, R314C/R401V, E357G/K/L/M/N/Q/R/S/T/V/W, Y392D, R393L/Y, K394A/L/R, A397F/M/ Q/W, R401A/I/L/S/V, S404E/Y, N444F/H/I/V, M446W/Y, D478F/M/W, D513C/F/K/L/R/T/W, S514F/I/L/Y, A582N, S635W, V636L, T637G/P/S, R639H, M642L, T643A, A645V, F653C, Q656F/W, D660A/C/M/S/T/W, D660N/H806Y, T661E/Y and P664W, and/or any combination thereof, wherein the amino acid positions are numbered according to SEQ ID NO: 4.
[9] В некоторых вариантах осуществления сконструированные РНК-полимеразы содержат по меньшей мере одну замену или набор замен, которые выбраны из 397/513/635, 397/513/635/660, 513/660/664, 513/635/660, 513/635/664, 513/660/664 и 660/664, и/или любых их комбинаций, где положения аминокислот пронумерованы в соответствии с SEQ ID NO: 4. В некоторых других вариантах осуществления сконструированные РНК-полимеразы содержат по меньшей мере одну замену или набор замен, которые выбраны из 397F/513W/635W, 397F/513Y/635W, 397W/513Y/635W, 397W/513W/635W, 397W/513Y/635W/660F, 397W/513W/635W/660W, 397Y/513W/635W/660F, 475V/513W/635W/660Y, 513F/660W/664Y, 513W/635W/660F, 513W/635W/664W, 513Y/635W/660F, 513Y/635W/660Y, 513Y/660W/664W и 660Y/664W, и/или любых их комбинаций, где положения аминокислот пронумерованы в соответствии с SEQ ID NO: 4. В некоторых дополнительных вариантах осуществления сконструированные РНК полимеразы содержат по меньшей мере одну замену или набор замен, которые выбраны из A397F/D513W/S635W, A397F/D513Y/S635W, A397W/D513Y/S635W, A397W/D513W/S635W, A397W/D513Y/S635W/D660F, A397W/D513W/S635W/D660W, A397Y/D513W/S635W/D660F, A475V/D513W/S635W/D660Y, D513F/D660W/P664Y, D513W/S635W/D660F, D513W/S635W/P664W, D513Y/S635W/D660F, D513Y/S635W/D660Y, D513Y/D660W/P664W и D660Y/P664W, и/или любых их комбинаций, где положения аминокислот пронумерованы в соответствии с SEQ ID NO: 4. [9] In some embodiments, the engineered RNA polymerases contain at least one substitution or set of substitutions that are selected from 397/513/635, 397/513/635/660, 513/660/664, 513/635/660, 513/635/664, 513/660/664, and 660/664, and/or any combination thereof, wherein the amino acid positions are numbered according to SEQ ID NO: 4. In some other embodiments, the engineered RNA polymerases comprise at least one Replacement or set replacements selected from 397f/513W/635W, 397F/513Y/635W, 397W/513Y/635W, 397W/513W/635W, 397W/513Y/635W/660F, 397W/513W/635W/660W, 397y/397y/397y/397y/397y/397y/397y/397y/397y/397y/397y/397y 513W/635W/660F 475V/513W/635W/660Y 513F/660W/664Y 513W/635W/660F 513W/635W/664W 513Y/635W/660F 513Y/635W/660Y 513Y /660W/664W and 660Y/664W, and/or any combination thereof, wherein the amino acid positions are numbered according to SEQ ID NO: 4. In some additional embodiments, the engineered RNA polymerases contain at least one substitution or set of substitutions that are selected from A397F/D513W/S635W A397W/D513Y/S635W/D660F, A397W/D513W/S635W/D660W, A397Y/D513W/S635W/ D660F, A475V/D513W/S635W/D660Y D513Y/S635W/D660F, D513Y/S635W/D660Y, D513Y/D660W/P664W and D660Y/P664W, and/or any combination thereof, where the provisions amino acids are numbered according to SEQ ID NO: 4.
[10] В некоторых вариантах осуществления сконструированные РНК-полимеразы содержат по меньшей мере одну замену или набор замен, которые выбраны из 397, 397/513, 397/513/635, 397/513/635, 397/513/635/656, 397/513/635/656/660, 397/513/635/656/660/664, 397/513/635/656/664, 397/513/635/660, 397/513/635/660/664, 397/513/635/664, 397/513/656/660, 397/513/660, 397/513/660/664, 397/513/664, 397/513, 397/635, 397/635/656/660/664, 397/635/656/664, 397/635/660, 397/635/664, 397/635/664/850, 397/660, 397/664, 397/660/664, 397/837, 399/635/660, 475/513/635/660, 513, 513/635, 513/635/656, 513/635/656/660, 513/635/656/664, 513/635/660, 513/635/660/664, 513/635/664, 513/656/660, 513/656/664, 513/660, 513/660/664, 513/664, 635, 635/656, 635/656/664, 635/660, 635/660/664, 635/664, 656/660/664, 658, 660, 660/664 и 664, и/или любых их комбинаций, где положения аминокислот пронумерованы в соответствии с SEQ ID NO: 4. В некоторых других вариантах осуществления сконструированные РНК-полимеразы содержат по меньшей мере одну замену или набор замен, которые выбраны из 397F, 397F/513F, 397F/513F/635F, 397F/513F/635W, 397F/513F/635W/660W, 397F/513W/635W, 397F/513W/635W/656F/664F, 397F/513W/664W, 397F/513Y, 397F/513Y/635W, 397F/513Y/635W/656W, 397F/513Y/635W/664F, 37F/513Y/656H/660W, 397F/635F/660W, 397F/635W, 397F/660W, 397F/664W, 397W, 397W/513F, 397W/513F/635F/656F/660F/664W, 397W/513F/635F/660W, 397W/513F/635W, 397W/513F/660F, 397W/513F/660W, 397W/513F/660Y/664F, 397W/513W, 397W/513W/635F, 397W/513W/635F/656W/660F, 397W/513W/635W, 397W/513W/635W/656Y, 397W/513W/635W/660W, 397W/513W/635W/660W/664Y, 397W/513W/635W/660Y/664Y, 397W/513W/660W, 397W/513W/660W/664Y, 397W/513W/664F, 397W/513W/664W, 397W/513Y/635F, 397W/513Y/635W/656Y/660W/664W, 397W/513Y/635W, 397W/513Y/635W/656Y/664Y, 397W/513Y/635W/660F, 397W/635F, 397W/635F/664F, 397W/635W, 397W/635W/656F/664F, 397W/635W/656F/664W, 397W/635W/656F/664Y, 397W/635W/660W, 397W/635W/660Y, 397W/635W/664F, 397W/635W/664W/850T, 397W/660F/664F, 397W/660F/664Y, 397W/660W, 397W/837K, 397Y, 397Y/513F/635W/656F/660W/664F, 397Y/513F/635W/664W, 397Y/513W/635F/664Y, 397Y/513W/635W/660F, 397Y/513W/656W/660W, 397Y/513Y, 397Y/513Y/635W, 397Y/635F, 397Y/635F/660W, 397Y/635W, 397Y/635W/656F/660Y/664W, 397Y/635W/660F, 397Y/660F/664W, 397Y/664F, 399E/635F/660W, 475V/513W/635W/660Y, 513F, 513F/635F, 513F/635W, 513F/635W/656W, 513F/635W/664W, 513F/660W, 513F/660W/664F, 513F/660W/664Y, 513W, 513W/635F, 513W/635W, 513Y/635F/660F/664Y, 513W/635W/656W/660F, 513W/635W/660F, 513W/635W/664W, 513W/656W/664W, 513W/656Y/660W, 513W/660F, 513W/660W, 513Y/635F, 513Y/635F/664W, 513Y/635R/656F/664Y, 513Y/635W, 513Y/635W/660F, 513Y/635W/660Y, 513Y/635W/660Y/664F, 513Y/660W, 513Y/660W/664W, 513Y/660Y/664F, 513Y/664Y, 635F/656F/664Y, 635F/656Y/664W, 635F/660W/664F, 635W, 635W/656W, 635W/660F, 635W/660W, 635W/664W, 656W/660F/664Y, 656W/660W/664Y, 658P, 660F, 660F/664F, 660F/664Y, 660W/664F, 660Y/664W, 664F и 664W, и/или любых их комбинаций, где положения аминокислот пронумерованы в соответствии с SEQ ID NO: 4. В некоторых дополнительных вариантах осуществления сконструированные РНК-полимеразы содержат по меньшей мере одну замену или набор замен, которые выбраны из A397F, A397F/D513F, A397F/D513F/S635F, A397F/D513F/S635W, A397F/D513F/S635W/D660W, A397F/D513W/S635W, A397F/D513W/S635W/Q656F/P664F, A397F/D513W/P664W, A397F/D513Y, A397F/D513Y/S635W, A397F/D513Y/S635W/Q656W, A397F/D513Y/S635W/P664F, A397F/D513Y/Q656H/D660W, A397F/S635F/D660W, A397F/S635W, A397F/D660W, A397F/P664W, A397W, A397W/D513F, A397W/D513F/S635F/Q656F/D660F/P664W, A397W/D513F/S635F/D660W, A397W/D513F/S635W, A397W/D513F/D660F, A397W/D513F/D660W, A397W/D513F/D660Y/P664F, A397W/D513W, A397W/D513W/S635F, A397W/D513W/S635F/Q656W/D660F, A397W/D513W/S635W, A397W/D513W/S635W/Q656Y, A397W/D513W/S635W/D660W, A397W/D513W/S635W/D660W/P664Y, A397W/D513W/S635W/D660Y/P664Y, A397W/D513W/D660W, A397W/D513W/P664F, A397W/D513W/D660W/P664Y, A397W/D513W/P664W, A397W/D513Y/S635F, A397W/D513Y/S635W/Q656Y/D660W/P664W, A397W/D513Y/S635W, A397W/D513Y/S635W/Q656Y/P664Y, A397W/D513Y/S635W/D660F, A397W/S635F, A397W/S635F/P664F, A397W/S635W, A397W/S635W/Q656F/P664F, A397W/S635W/Q656F/P664W, A397W/S635W/Q656F/P664Y, A397W/S635W/D660W, A397W/S635W/D660Y, A397W/S635W/P664F, A397W/S635W/P664W/A850T, A397W/D660F/P664F, A397W/D660F/P664Y, A397W/D660W, A397W/E837K, A397Y, A397Y/D513F/S635W/Q656F/D660W/P664F, A397Y/D513F/S635W/P664W, A397Y/D513W/S635F/P664Y, A397Y/D513W/S635W/D660F, A397Y/D513W/Q656W/D660W, A397Y/D513Y, A397Y/D513Y/S635W, A397Y/S635F, A397Y/S635F/D660W, A397Y/S635W, A397Y/S635W/Q656F/D660Y/P664W, A397Y/S635W/D660F, A397Y/D660F/P664W, A397Y/P664F, K399E/S635F/D660W, A475V/D513W/S635W/D660Y, D513F, D513F/S635F, D513F/S635W, D513F/S635W/Q656W, D513F/S635W/P664W, D513F/D660W, D513F/D660W/P664F, D513F/D660W/P664Y, D513W, D513W/S635F, D513W/S635W, D513Y/S635F/D660F/P664Y, D513W/S635W/Q656W/D660F, D513W/S635W/D660F, D513W/S635W/P664W, D513W/Q656W/P664W, D513W/Q656Y/D660W, D513W/D660F, D513W/D660W, D513Y/S635F, D513Y/S635F/P664W, D513Y/S635R/Q656F/P664Y, D513Y/S635W, D513Y/S635W/D660F, D513Y/S635W/D660Y, D513Y/S635W/D660Y/P664F, D513Y/D660W, D513Y/D660W/P664W, D513Y/D660Y/P664F, D513Y/P664Y, S635F/Q656F/P664Y, S635F/Q656Y/P664W, S635F/D660W/P664F, S635W, S635W/Q656W, S635W/D660F, S635W/D660W, S635W/P664W, Q656W/D660F/P664Y, Q656W/D660W/P664Y, L658P, D660F, D660F/P664F, D660F/P664Y, D660W/P664F, D660Y/P664W, P664F/W и/или любых их комбинаций, где положения аминокислот пронумерованы в соответствии с SEQ ID NO: 4. [10] In some embodiments, engineered RNA polymerases contain at least one substitution or set of substitutions that are selected from 397, 397/513, 397/513/635, 397/513/635, 397/513/635/656, 397/513/635/656/660, 397/513/635/656/660/664, 397/513/635/656/664 397/513/635/664, 397/513/656/660, 397/513/660, 397/513/660/664 397/635/656/664 397/635/660 397/635/664 397/635/664/850 397/660 397/664 397/660/664 399/635/660 475/513/635/660 513 513/635 513/635/656 513/635/656/660 513/635/656/664 513/635/660 513/ 635/660/664 513/635/664 513/656/660 513/656/664 513/660 513/660/664 513/664 635 635/660, 635/660/664, 635/664, 656/660/664, 658, 660, 660/664 and 664, and/or any combination thereof, where the amino acid positions are numbered according to SEQ ID NO: 4. In some other embodiments, the engineered RNA polymerases contain at least one substitution or set of substitutions that are selected from 397F, 397F/513F, 397F/513F/635F, 397F/513F/635W, 397F/513F/635W/660W, 397F/ 397F/513Y/635W, 397F/513Y/635W/656W, 397F/513Y/635W/664F, 397F/513Y/635W/664F, 37F/513Y/ 397F/664W, 397W/513F, 397W/513F/635F/656F/660F/664W, 397W/513F/635 F/660W, 397W/ 397W/513W/635F, 397W/513W/635F/656W/660F, 397W /513W/635W, 397W/513W/635W/656Y, 397W/513W/635W/660W, 397W/513W/635W/660W/664Y 60W/664Y 397W/513W/664F, 397W/513W/664W, 397W/513Y/635F, 397W/513Y/635W/656Y/660W/664W 397W/513Y/ 397W/635W/656F/664W, 397W/635W/656F/664Y, 397W/635W /660W, 397W/ 635W/660Y, 397W/635W/664F, 397W/635W/664W/850T, 397W/660F/664F, 397W/660F/664Y, 397W/660W, 397W/837K W/656F/660W/ 664F 397Y/513F/635W/664W 397Y/513W/635F/664Y 397Y/513W/635W/660F /635F, 397Y/ 635F/660W 397Y/635W 397Y/635W/656F/660Y/664W 397Y/635W/660F 397Y/660F/664W /660Y, 513F, 513F/635F 513F/635W 513F/635W/656W 513F/635W/664W 513F/660W 513F/660W/664F 513F/660W/664Y 513W 513W/635F 513W/63 5W, 513Y/635F/ 660F/664Y 513W/635W/656W/660F 513W/635W/660F 513W/635W/664W 513W/656W/664W 513W/656Y/660W 513W/660F 513W/660W Y/635F, 513Y/ 513Y/635W/660Y, 513Y/635W/660Y/664F, 513Y/660W, 513Y/660W/664W , 513Y/660Y/ 664F, 513Y/664Y, 635F/656F/664Y, 635F/656Y/664W 60F/664Y, 656W/ 660W/664Y, 658P, 660F, 660F/664F, 660F/664Y, 660W/664F, 660Y/664W, 664F and 664W, and/or any combination thereof, where the amino acid positions are numbered according to SEQ ID NO: 4. In some in additional embodiments, engineered RNA polymerases contain at least one substitution or set of substitutions that are selected from A397F, A397F/D513F, A397F/D513F/S635F, A397F/D513F/S635W, A397F/D513F/S635W/D660W, A397F/D513W/ A397F/D513Y/S635W, A397F/D513Y/S635W, A397F/D513Y/S635W/Q656W, A397F/D513Y/S6 35W/P664F, A397F/D513Y/Q656H/ A397W/D513F/S635F/Q656F/D660F/P664W, A397W/D5 13F/S635F/D660W, A397W/D513F/ S635W A397W/D513F/D660F A397W/D513F/D660W A397W/D513F/D660Y/P664F A397W/D513W A397W/D513W/S635F 60F, A397W/D513W/S635W, A397W/ A397W/D513W/S635W/D660W/P664Y, A397W/D513W/S635W/D660Y/P664Y, A397W/D513W/D660W, A3 97W/D513W/P664F, A397W/D513W/ A397W/D513Y/S635W/Q656Y/D660W/P664W, A397W/D513Y/S635W, A397W/D513Y/S635W/Q6 56Y/P664Y, A397W/D513Y/S635W/ A397W/S635W/Q656F/P664F, A397W/S635W/Q656F/P664W, A397W/S635W/Q656F/P664Y, A3 97W/S635W/D660W, A397W/S635W/ A397W/D660F/P664Y, A397W/D660W, A397W/E837K, A397Y, A397Y/D5 13F/S635W/Q656F/D660W/P664F, A397Y/D513F/S635W/P664W A397Y/D513W/S635F/P664Y A397Y/D513W/S635W/D660F 35W, A397Y/S635F, A397Y/S635F/ A397Y/D660F/P664W, A397Y/P664F, K399E/S635F/D660W, A475V/D5 13W/S635W/D660Y, D513F, D513F/ S635F D513F/S635W D513F/S635W/Q656W D513F/S635W/P664W D513F/D660W D513F/D660W/P664F D513F/D660W/P664Y D513W D513W/S635F D5 13W/S635W, D513Y/S635F/D660F/ D513W/S635W/P664W, D513W/Q656W/P664W, D513W/Q656Y/D660W, D513W/D660F, D513W/D6 60W, D513Y/S635F, D513Y/S635F/ P664W D513Y/S635R/Q656F/P664Y D513Y/S635W D513Y/S635W/D660F D513Y/S635W/D660Y D513Y/S635W/D660Y/P664F D513Y/D660W D513Y/D6 60W/P664W, D513Y/D660Y/P664F, D513Y/P664Y, S635F/Q656F/P664Y, S635F/Q656Y/P664W, S635F/D660W/P664F, S635W, S635W/Q656W, S635W/D660F, S635W/D660W, S635W/P664W, Q6 56W/D660F/P664Y, Q656W/D660W/ P664Y, L658P, D660F, D660F/P664F, D660F/P664Y, D660W/P664F, D660Y/P664W, P664F/W and/or any combination thereof, where amino acid positions are numbered according to SEQ ID NO: 4.
[11] В некоторых вариантах осуществления сконструированные РНК-полимеразы содержат по меньшей мере одну замену или набор замен, которые выбраны из 113/137/513, 136/357/404/514, 136/357/514, 136/394/404/446, 136/401, 136/401/404, 136/404/446, 136/404/514, 136/446, 136/514, 137, 137/401, 137/401/513, 137/401/513, 137/513, 137/513/621, 137/635, 137/656, 357/394/401/404/514, 357/394/446/514, 357/514, 394/446/514, 401/404, 401/404/514, 401/513/635, 401/635, 513/635, 513/635/656, 513/660, 635/656, 635/660 и 660, и/или любых их комбинаций, где положения аминокислот пронумерованы в соответствии с SEQ ID NO: 15. В некоторых других вариантах осуществления сконструированные РНК-полимеразы содержат по меньшей мере одну замену или набор замен, которые выбраны из 113M/137W/513R,136E/357I/404Y/514I, 136I/357I/514F, 136I/357K/514F, 136I/394R/404Y/446W, 136I/401V, 136I/401V/404Y, 136E/404Y/446W, 136E/404Y/514F, 136I/446W, 136E/514F, 136I/514I, 137W, 137W/401I, 137W/401S, 137W/401S/513R, 137W/401S/513W, 137W/401V, 137W/513W, 137W/513R/621R, 137W/635W, 137W/656F, 357N/394R/446W/514I, 357R/394R/401V/404Y/514L, 357R/514F, 394R/446W/514I, 401S/513R/635W, 401S/635W, 401V/404Y, 401V/404Y/514L, 513L/635W, 513L/660W, 513R/635W/656F, 635W/656F, 635W/660T и 660S/T, и/или любых их комбинаций, где положения аминокислот пронумерованы в соответствии с SEQ ID NO: 15. В некоторых дополнительных вариантах осуществления сконструированные РНК-полимеразы содержат по меньшей мере одну замену или набор замен, которые выбраны из L113M/D137W/D513R, A136E/E357I/S404Y/S514I, A136E/S404Y/M446W, A136E/S404Y/S514F, A136E/S514F, A136I/E357I/S514F, A136I/E357K/S514F, A136I/K394R/S404Y/M446W, A136I/R401V, A136I/R401V/S404Y, A136I/M446W, A136I/S514I, D137W, D137W/R401I, D137W/R401S, D137W/R401S/D513R, D137W/R401S/D513W, D137W/R401V, D137W/D513W, D137W/D513R/K621R, D137W/S635W, D137W/Q656F, E357N/K394R/M446W/S514I, E357R/K394R/R401V/S404Y/S514L, E357R/S514F, K394R/M446W/S514I, R401S/D513R/S635W, R401S/S635W, R401V/S404Y, R401V/S404Y/S514L, D513L/S635W, D513L/D660W, D513R/S635W/Q656F, S635W/Q656F, S635W/D660T и D660S/T, и/или любых их комбинаций, где положения аминокислот пронумерованы в соответствии с SEQ ID NO: 15. [11] In some embodiments, the engineered RNA polymerases contain at least one substitution or set of substitutions that are selected from 113/137/513, 136/357/404/514, 136/357/514, 136/394/404/ 446 136/401 136/401/404 136/404/446 136/404/514 136/446 136/514 137 137/401 137/401/513 137/513 137/513/621 137/635 137/656 357/394/401/404/514 357/394/446/514 357/514 394/446/514 401/404/514, 401/513/635, 401/635, 513/635, 513/635/656, 513/660, 635/656, 635/660 and 660, and/or any combination thereof, where the amino acid positions numbered according to SEQ ID NO: 15. In some other embodiments, the engineered RNA polymerases contain at least one substitution or set of substitutions that are selected from 113M/137W/513R,136E/357I/404Y/514I, 136I/357I/ 136I/401V/404Y, 136I/404Y/446W, 136E/404Y/514F, 136I/446W, 136E/514 F, 136I/514I, 137W 137W/401I 137W/401S 137W/401S/513R 137W/401S/513W 137W/401V 137W/513W 57N/394R/446W/ 401S/513R/635W, 401S/635W, 401V/404Y, 401V/404Y/514L, 513L/635 W, 513L/660W, 513R/635W/656F, 635W/656F, 635W/660T, and 660S/T, and/or any combination thereof, wherein the amino acid positions are numbered according to SEQ ID NO: 15. In some additional embodiments, the engineered RNA polymerases comprise at least at least one replacement or a set of replacements that are selected from L113M/D137W/D513R, A136E/E357I/S404Y/S514I, A136E/S404Y/M446W, A136E/S404Y/S514F, A136E/S514F, A136I/E357I/S514F, A1 36I/E357K/ S514F A136I/K394R/S404Y/M446W A136I/R401V A136I/R401V/S404Y A136I/M446W A136I/S514I D137W D137W/R401I D137W/R401S 01S/D513R, D137W/R401S/D513W, D137W/R401V, D137W/D513W, D137W/D513R/K621R, D137W/S635W, D137W/Q656F, E357N/K394R/M446W/S514I, E357R/K394R/R401V/S404Y/S514L, E3 57R/S514F, K394R/M446W/S514I, R401S/D513R/S635W, R401S/S635W, R401V/S404Y, R401V/S404Y/S514L, D513L/S635W, D513L/D660W, D513R/S635W/Q656F, S635W/Q656F, S635W/D6 60T and D660S/T, and/or any combinations thereof, where the amino acid positions are numbered according to SEQ ID NO: 15.
[12] В некоторых дополнительных вариантах осуществления сконструированные РНК-полимеразы содержат полипептидные последовательности, по меньшей мере на 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более идентичные последовательности по меньшей мере одного варианта сконструированной РНК-полимеразы, указанного в таблице 5.3, 5.4, 5.5 и/или 5.6. В некоторых дополнительных вариантах осуществления сконструированная РНК-полимераза представляет собой вариант сконструированной полимеразы, представленный в таблице 5.3, 5.4, 5.5 и/или 5.6. [12] In some additional embodiments, the engineered RNA polymerases contain polypeptide sequences of at least 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% or more sequence identical to at least one engineered RNA polymerase variant listed in Table 5.3, 5.4, 5.5 and/or 5.6. In some additional embodiments, the engineered RNA polymerase is the engineered polymerase variant shown in Table 5.3, 5.4, 5.5, and/or 5.6.
[13] В следующих дополнительных вариантах осуществления сконструированная РНК-полимераза содержит полипептидную последовательность, которая по меньшей мере на 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более идентична последовательности по меньшей мере одного варианта сконструированной РНК-полимеразы, указанного в SEQ ID NO: 4, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37 и/или 39. В некоторых других вариантах осуществления сконструированная РНК-полимераза представляет собой вариант сконструированной полимеразы, указанный в SEQ ID NO: 4, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37 или 39. [13] In the following additional embodiments, the engineered RNA polymerase contains a polypeptide sequence that is at least 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% , 99% or more identical to the sequence of at least one variant of the engineered RNA polymerase specified in SEQ ID NO: 4, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37 and/ or 39. In some other embodiments, the engineered RNA polymerase is the engineered polymerase variant set forth in SEQ ID NOs: 4, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, or 39.
[14] В некоторых других вариантах осуществления сконструированная полимераза имеет по меньшей мере одно улучшенное свойство по сравнению с РНК-полимеразой T7 дикого типа. В некоторых следующих вариантах осуществления сконструированная РНК-полимераза демонстрирует по меньшей мере одно улучшенное свойство, выбранное из увеличенной селективности в отношении аналога кэпа относительно GTP в ходе инициации транскрипции, увеличенной экспрессии белка, увеличенной стабильности в буфере для хранения и увеличенной стабильности в условиях реакции. В некоторых дополнительных вариантах осуществления сконструированная РНК-полимераза сохраняет выход РНК, точность транскрипции, термостабильность, экспрессию белка, стабильность при -20°C или стабильность в условиях реакции, эквивалентных РНК-полимеразе T7 дикого типа. В некоторых дополнительных вариантах осуществления сконструированная РНК-полимераза является очищенной. В некоторых других вариантах осуществления настоящее изобретение относится к композициям, содержащим по меньшей мере одну сконструированную РНК-полимеразу, описанную в настоящем описании. [14] In some other embodiments, the engineered polymerase has at least one improved property over wild-type T7 RNA polymerase. In some of the following embodiments, the engineered RNA polymerase exhibits at least one improved property selected from increased cap analog selectivity for GTP during transcription initiation, increased protein expression, increased stability in storage buffer, and increased stability under reaction conditions. In some additional embodiments, the engineered RNA polymerase retains RNA yield, transcriptional fidelity, thermal stability, protein expression, stability at -20°C, or stability under reaction conditions equivalent to wild-type T7 RNA polymerase. In some additional embodiments, the engineered RNA polymerase is purified. In some other embodiments, the implementation of the present invention relates to compositions containing at least one engineered RNA polymerase described in the present description.
[15] Настоящее изобретение также относится к полинуклеотидным последовательностям, кодирующим по меньшей мере одну сконструированную РНК-полимеразу, описанную в настоящем описании. В некоторых вариантах осуществления полинуклеотидные последовательности, кодирующие по меньшей мере одну сконструированную РНК-полимеразу, обладают по меньшей мере 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более идентичностью последовательности с эталонной последовательностью SEQ ID NO: 4 и/или 15, или их функциональным фрагментом, где сконструированная РНК-полимераза содержит по меньшей мере одну замену по меньшей мере в одном или более положениях аминокислот. В некоторых следующих вариантах осуществления полинуклеотидные последовательности, кодирующие сконструированные РНК-полимеразы, описанные в настоящем описании, обладают по меньшей мере 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более идентичностью последовательности с SEQ ID NO: 4, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37 и/или 39, или их функциональным фрагментом. В некоторых следующих вариантах осуществления полинуклеотидные последовательности, кодирующие по меньшей мере одну сконструированную РНК-полимеразу, обладают по меньшей мере 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более идентичностью последовательности с SEQ ID NO: 3, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36 и/или 38. В некоторых дополнительных вариантах осуществления полинуклеотидные последовательности функционально связаны с контрольной последовательностью. В некоторых других вариантах осуществления полинуклеотидные последовательности являются кодон-оптимизированными. [15] The present invention also relates to polynucleotide sequences encoding at least one engineered RNA polymerase described in the present description. In some embodiments, polynucleotide sequences encoding at least one engineered RNA polymerase have at least 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% , 99% or more sequence identity with the reference sequence SEQ ID NO: 4 and/or 15, or a functional fragment thereof, where the designed RNA polymerase contains at least one substitution in at least one or more amino acid positions. In some of the following embodiments, the polynucleotide sequences encoding the engineered RNA polymerases described herein have at least 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% or more sequence identity with SEQ ID NO: 4, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37 and/or 39, or a functional fragment thereof. In some of the following embodiments, polynucleotide sequences encoding at least one engineered RNA polymerase have at least 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98 %, 99% or more sequence identity with SEQ ID NOs: 3, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, and/or 38. In some further embodiments, polynucleotide sequences functionally linked to the control sequence. In some other embodiments, the polynucleotide sequences are codon-optimized.
[16] Настоящее изобретение также относится к экспрессирующим векторам, содержащим по меньшей мере одну полинуклеотидную последовательность, описанную в настоящем описании. Кроме того, настоящее изобретение относится к клеткам-хозяевам, содержащим по меньшей мере один экспрессирующий вектор, описанный в настоящем описании. Настоящее изобретение также относится к способам продуцирования сконструированной РНК-полимеразы в клетке-хозяине, включающим культивирование клетки-хозяина, описанной в настоящем описании, в подходящих условиях культивирования, чтобы продуцировалась по меньшей мере одна сконструированная РНК-полимераза. В некоторых вариантах осуществления способы дополнительно включают выделение по меньшей мере одной сконструированной РНК-полимеразы из культуры и/или клетки-хозяина. В некоторых дополнительных вариантах осуществления способы дополнительно включают стадию очистки по меньшей мере одной сконструированной РНК-полимеразы. [16] The present invention also relates to expression vectors containing at least one polynucleotide sequence described in the present description. In addition, the present invention relates to host cells containing at least one expression vector described in the present description. The present invention also provides methods for producing an engineered RNA polymerase in a host cell, comprising culturing the host cell described herein under suitable culture conditions such that at least one engineered RNA polymerase is produced. In some embodiments, the methods further comprise isolating at least one engineered RNA polymerase from a culture and/or host cell. In some additional embodiments, the methods further include the step of purifying at least one engineered RNA polymerase.
[17] Настоящее изобретение также относится к способам продуцирования кэпированных РНК-транскриптов, включающим предоставление композиции, содержащей: i) по меньшей мере одну сконструированную РНК-полимеразу, описанную в настоящем описании, динуклеотидный аналог кэпа, и ii) ДНК-матрицу; воздействие на ДНК-матрицу композиции в таких условиях, чтобы сконструированная РНК-полимераза продуцировала кэпированный РНК-транскрипт. В некоторых вариантах осуществления способов, динуклеотидный аналог кэпа представляет собой альфа, гамма-бис(N7-метилгуанозин)трифосфат (m7G(5')ppp(5')m7G) или антиреверсный аналог кэпа 3'-O-Me-m7G(5')ppp(5')G. В некоторых других вариантах осуществления способов динуклеотидный аналог кэпа представляет собой альфа, гамма-бис(N7-метилгуанозин)трифосфат. В некоторых дополнительных вариантах осуществления способов в реакционную смесь добавляют неорганическую пирофосфатазу. [17] The present invention also provides methods for producing capped RNA transcripts, comprising providing a composition comprising: i) at least one engineered RNA polymerase described herein, a cap dinucleotide analog, and ii) a DNA template; exposing the DNA template to the composition under such conditions that the engineered RNA polymerase produces a capped RNA transcript. In some embodiments of the methods, the dinucleotide cap analog is alpha, gamma-bis(N7-methylguanosine) triphosphate (m7G(5')ppp(5')m7G) or anti-reverse cap analog 3'-O-Me-m 7 G( 5')ppp(5')G. In some other embodiments of the methods, the dinucleotide analog of the cap is alpha,gamma-bis(N7-methylguanosine)triphosphate. In some additional embodiments of the methods, an inorganic pyrophosphatase is added to the reaction mixture.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙBRIEF DESCRIPTION OF THE DRAWINGS
[18] На фиг.1 представлена химическая структура "m7G(5')ppp(5')m7G", также обозначаемого как "альфа, гамма-бис(N7-метилгуанозин)трифосфат", "кэпированный GTP", "симметричный аналог кэпа" или "кэп". [18] Figure 1 shows the chemical structure of "m7G(5')ppp(5')m7G", also referred to as "alpha, gamma-bis(N7-methylguanosine)triphosphate", "capped GTP", "symmetrical cap analog " or "cap".
ОПИСАНИЕ ИЗОБРЕТЕНИЯDESCRIPTION OF THE INVENTION
[19] Настоящее изобретение относится сконструированным вариантам РНК-полимеразы T7 и их композициям. Эти варианты изменены для селективного включения аналога кэпа m7G(5')ppp(5')m7G относительно GTP при инициации транскрипции in vitro. Настоящее изобретение также относится к способам применения вариантов, описанных в настоящем описании. Кроме того, настоящее изобретение относится к композициям, описанным в настоящем описании. Настоящее изобретение относится к композициям и способам для эффективного получения кэпированной РНК. Большинство мРНК-транскриптов эукариотических клеток и большинство мРНК-транскриптов вирусов эукариот, а также другие формы эукариотический РНК (например, малая ядреная РНК [мяРНК] и пре-микроРНК [пре-мкРНК]) блокированы или "кэпированы" на их 5'-концах (см., например, патент США №8846348, включенный в настоящее описание в качестве ссылки в полном объеме). Кэп представляет собой гуаниновый нуклеозид, который связан через его 5'-углерод с трифосфатной группой, которая связана с 5'-углеродом самого крайнего 5'-нуклеотида первичного мРНК-транскрипта. В большинстве эукариот азот в 7 положении гуанина в нуклеотиде кэпа является метилированным. [19] The present invention relates to engineered variants of T7 RNA polymerase and compositions thereof. These variants are modified to selectively include the m7G(5')ppp(5')m7G cap analog relative to GTP upon in vitro transcription initiation. The present invention also relates to methods of using the options described in the present description. In addition, the present invention relates to the compositions described in the present description. The present invention relates to compositions and methods for the efficient production of capped RNA. Most mRNA transcripts of eukaryotic cells and most mRNA transcripts of eukaryotic viruses, as well as other forms of eukaryotic RNA (for example, small nuclear RNA [snRNA] and pre-miRNA [pre-miRNA]) are blocked or "capped" at their 5' ends (See, for example, US patent No. 8846348, included in the present description by reference in its entirety). The cap is a guanine nucleoside that is linked through its 5' carbon to a triphosphate group that is linked to the 5' carbon of the outermost 5' nucleotide of the primary mRNA transcript. In most eukaryotes, the nitrogen at position 7 of the guanine in the cap nucleotide is methylated.
[20] 5'-кэпы этих молекул РНК играют важные роли в стабильности и процессинге РНК. Кэп играет очень важную роль в метаболизме мРНК и требуется для процессинга и созревания РНК-транскриптов в ядре, транспорта мРНК из ядра в цитоплазму, стабильности мРНК и эффективной трансляции мРНК в белок (см., например, Lewis et al., Eur. J. Biochem., 247:461-9 [1997].). Структура 5'-кэпа вовлечена в инициацию синтеза белка эукариотических и вирусных мРНК. 5'-кэп также обеспечивает резистентность к 5'-экзонуклеазной активности и его отсутствие приводит к быстрой деградации мРНК (см., например, патент США №8836348; и Furiichi et al., Nat., 266:235-9 [1997]). Вследствие преимуществ, обеспечиваемых кэпированием, эффективный синтез кэпированных РНК-транскриптов имеет большое значение для различных функций, включая, но не ограничиваясь ими, синтез белков in vitro и in vivo. [20] The 5' caps of these RNA molecules play important roles in the stability and processing of RNA. The cap plays a very important role in mRNA metabolism and is required for the processing and maturation of RNA transcripts in the nucleus, transport of mRNA from the nucleus to the cytoplasm, mRNA stability, and efficient translation of mRNA into protein (see, e.g., Lewis et al., Eur. J. Biochem., 247:461-9 [1997].). The 5'-cap structure is involved in the initiation of protein synthesis of eukaryotic and viral mRNAs. The 5'-cap also provides resistance to 5'-exonuclease activity and its absence leads to rapid mRNA degradation (see, for example, US patent No. 8836348; and Furiichi et al., Nat., 266:235-9 [1997]) . Because of the benefits provided by capping, the efficient synthesis of capped RNA transcripts is of great importance for various functions, including, but not limited to, in vitro and in vivo protein synthesis.
[21] Синтез in vitro кэпированной РНК практически можно проводить посредством одного из двух ферментативных путей. Кэпирующий фермент вируса коровьей оспы имеет две субъединицы и три вида ферментативной активности, которые присоединяют структуру 7-метилгуанозинового кэпа к 5'-фосфату транскрибируемой in vitro РНК (см., Mao and Shuman, J. Biol. Chem., 269:24472-9 [1994]). [21]Synthesis in vitro capped RNA can practically be carried out via one of two enzymatic pathways. The vaccinia capping enzyme has two subunits and three enzyme activities that attach the 7-methylguanosine cap structure to the 5'-phosphate of the transcribedin vitro RNA (see, Mao and Shuman, J. Biol. Chem., 269:24472-9 [1994]).
[22] Альтернативным способом синтеза in vitro кэпированной РНК является встраивание структуры кэпа в ходе транскрипции in vitro с использованием аналога кэпа. Эти 7-метилгуанозин-содержащие динуклеотиды содержат 5'-5'-трифосфатную связь и включаются в участок инициации транскрипции, что приводит к кэпированному 7-метилгуанозином РНК-продукту. РНК-полимераза T7 естественным образом инициирует транскрипцию включением гуанозина напротив остатка цитозина на матрице. Для достижения высокой эффективности кэпирования аналог гуанозинового кэпа должен присутствовать в реакции транскрипции in vitro в высокой концентрации относительно GTP, с которым он конкурирует за включение в первое положение мРНК. Одним полезным признаком котранскрипционного кэпирования in vitro является то, что, поскольку встраивание кэпа достигается в ходе инициации, конечная последовательность или вторичная структура полноразмерной мРНК не влияет на степень кэпирования. Кроме того, этот процесс требует использования только одного фермента (РНК-полимераза) в одностадийной реакции. Использование химически синтезированного аналога кэпа также повышает адаптируемость к использованию альтернативных структур нуклеотидных кэпов, которые не являются хорошо распознаваемыми для метилирования кэпирующим ферментом коровьей оспы. Однако аналог кэпа является дорогостоящим относительно нуклеотидов и других компонентов реакции и должен присутствовать в реакционной смеси в высокой концентрации. Настоящее изобретение относится к вариантам РНК-полимеразы T7, которые являются селективными в отношении включении аналогов кэпа относительно GTP при инициации транскрипции для обеспечения эффективного кэпирования при использовании сниженной концентрации аналога кэпа, обеспечивающей более экономичный и масштабируемый процесс продуцирования кэпированной РНК. [22] An alternative method for in vitro synthesis of capped RNA is the insertion of a cap structure during in vitro transcription using a cap analog. These 7-methylguanosine-containing dinucleotides contain a 5'-5'-triphosphate bond and are incorporated into the transcription initiation site, resulting in a 7-methylguanosine-capped RNA product. T7 RNA polymerase naturally initiates transcription by incorporating a guanosine opposite a cytosine residue on the template. To achieve high capping efficiency, the guanosine cap analog must be present in the in vitro transcription reaction at a high concentration relative to GTP, with which it competes for incorporation into the first position of the mRNA. One useful feature of in vitro co-transcriptional capping is that since cap insertion is achieved during initiation, the final sequence or secondary structure of the full-length mRNA does not affect the degree of capping. In addition, this process requires the use of only one enzyme (RNA polymerase) in a one-step reaction. The use of a chemically synthesized cap analog also increases adaptability to the use of alternative nucleotide cap structures that are not well recognized for methylation by the vaccinia capping enzyme. However, the cap analog is expensive relative to nucleotides and other reaction components and must be present in the reaction mixture at a high concentration. The present invention relates to variants of T7 RNA polymerase that are selective for incorporation of cap analogs over GTP at transcription initiation to allow for efficient capping at a reduced concentration of the cap analog, allowing for a more economical and scalable production of capped RNA.
[23] В некоторых вариантах осуществления изобретения неорганическая пирофосфатаза присутствует в ходе реакции транскрипции in vitro для деградации пирофосфата, ингибитора продукта транскрипции РНК-полимеразой, в ортофосфат. [23] In some embodiments, an inorganic pyrophosphatase is present during the in vitro transcription reaction to degrade pyrophosphate, an RNA polymerase transcription product inhibitor, into orthophosphate.
Сокращенные обозначения и определения:Abbreviations and definitions:
[24] Если не определено иначе, все технические и научные термины, используемые в настоящем описании, как правило обладают тем же значением, которое обычно подразумевает средний специалист в области, к которой настоящее изобретение относится. Как правило, номенклатура, используемая в настоящем описании, и лабораторные методики культивирования клеток, молекулярной генетики, микробиологии, биохимии, органической химии, аналитической химии и химии нуклеиновых кислот, описанные ниже, представляют собой номенклатуру и методики, хорошо известные и часто используемые в данной области. Такие способы хорошо известны и описаны в многочисленных пособиях и справочниках, хорошо известных специалистам в данной области. Для химического синтеза и химического анализа используются стандартные способы или их модификации. Все патенты, патентные заявки, статьи и публикации, упомянутые в настоящем описании, как выше, так и ниже, включены в настоящее описание в качестве ссылки в полном объеме. [24] Unless otherwise defined, all technical and scientific terms used in the present description, as a rule, have the same meaning, which usually means the average specialist in the field to which the present invention relates. In general, the nomenclature used herein and the cell culture, molecular genetics, microbiology, biochemistry, organic chemistry, analytical chemistry, and nucleic acid chemistry laboratory techniques described below are nomenclature and techniques well known and commonly used in the art. . Such methods are well known and are described in numerous manuals and reference books well known to those skilled in the art. For chemical synthesis and chemical analysis, standard methods or their modifications are used. All patents, patent applications, articles and publications mentioned in the present description, both above and below, are incorporated herein by reference in their entirety.
[25] Хотя для применения настоящего изобретения на практике применимы любые подходящие способы и материалы, сходные или эквивалентные тем, что описаны в настоящем описании, некоторые способы и материалы описаны в настоящем описании. Следует понимать, что настоящее изобретение не ограничивается конкретной описанной методологией, протоколами и реагентами, поскольку они могут варьироваться в зависимости от контекста, в котором они используются специалистами в данной области. Таким образом, термины, определенные непосредственно ниже, более полно описаны посредством заявки в целом. Все патенты, патентные заявки, статьи и публикации, упомянутые в настоящем описании, как выше, так и ниже, включены в настоящее описание в качестве ссылок в полном объеме. [25] Although any suitable methods and materials similar or equivalent to those described in the present description are applicable for the practice of the present invention, some methods and materials are described in the present description. It should be understood that the present invention is not limited to the specific methodology, protocols, and reagents described, as they may vary depending on the context in which they are used by those skilled in the art. Thus, the terms defined immediately below are more fully described by the application as a whole. All patents, patent applications, articles and publications mentioned in the present description, both above and below, are incorporated herein by reference in their entirety.
[26] Так же, как используют в рамках изобретения, форма единственного числа включает форму множественного числа упоминаемых объектов, если контекст явно не указывает на иное. [26] As used herein, the singular form includes the plural form of the entities referred to, unless the context clearly indicates otherwise.
[27] Числовые диапазоны являются охватывающими числа, определяющие диапазон. Таким образом, каждый числовой диапазон, описанный в настоящем описании, охватывает каждый более узкий числовой диапазон, который входит в такой более широкий числовой диапазон, как если бы все такие более узкие числовые диапазоны были прямо указаны в настоящем описании. Также подразумевается, что каждое максимальное (или минимальное) числовое ограничение, описанное в настоящем описании, включает каждое более низкое (или более высокое) числовое ограничение, как если бы такие более низкие (или более высокие) числовые ограничения были прямо указаны в настоящем описании. [27] Numerical ranges are enclosing the numbers that define the range. Thus, each numerical range described herein encompasses every narrower numerical range that falls within such broader numerical range, as if all such narrower numerical ranges were expressly stated herein. Each maximum (or minimum) numeric limit described herein is also intended to include every lower (or higher) numeric limit, as if such lower (or higher) numeric limit were expressly stated herein.
[28] Термин "приблизительно" означает допустимую погрешность конкретной величины. В некоторых случаях "приблизительно" означает в пределах 0,05%, 0,5%, 1,0% или 2,0% от данного числового диапазона. В некоторых случаях "приблизительно" означает в пределах 1, 2, 3 или 4 стандартных отклонений от данной величины. [28] The term "approximately" means the allowable error of a particular value. In some cases, "about" means within 0.05%, 0.5%, 1.0%, or 2.0% of a given numerical range. In some cases, "about" means within 1, 2, 3, or 4 standard deviations of a given value.
[29] Более того, заголовки, приведенные в настоящем описании, не являются ограничением различных аспектов или вариантов осуществления изобретения, которые могут быть отнесены к заявке в целом. [29] Moreover, the headings given in the present description are not intended to limit the various aspects or embodiments of the invention that may be referred to the application as a whole.
[30] Таким образом, термины, определенные непосредственно ниже, более полно определяются рассмотрением заявки в целом. Тем не менее для облегчения понимания изобретения ряд терминов определен ниже. [30] Thus, the terms defined immediately below are more fully defined by consideration of the application as a whole. However, to facilitate understanding of the invention, a number of terms are defined below.
[31] Если нет иных указаний, нуклеиновые кислоты приводятся слева направо в ориентации от 5' к 3'; аминокислотные последовательности приводятся слева направо в ориентации от амино к карбокси, соответственно. [31] Unless otherwise indicated, nucleic acids are listed from left to right in a 5' to 3'orientation; amino acid sequences are given from left to right in the amino to carboxy orientation, respectively.
[32] Как используют в рамках изобретения, термин "содержащий" и родственные ему термины используются в их включающем значении (т.е. эквивалентно термину "включающий" и его соответствующим родственным терминам). [32] As used herein, the term "comprising" and related terms are used in their inclusive meaning (ie , equivalent to the term "including" and its corresponding related terms).
[33] Номер "EC" относится к Номенклатуре фермента Комитета по номенклатуре Международного союза биохимии и молекулярной биологии (NC-IUBMB). Биохимическая классификация IUBMB представляет собой систему числовой классификации для ферментов на основе химических реакций, которые они катализируют. [33] The "EC" number refers to the Enzyme Nomenclature of the Committee on Nomenclature of the International Union of Biochemistry and Molecular Biology (NC-IUBMB). The IUBMB biochemical classification is a numerical classification system for enzymes based on the chemical reactions they catalyze.
[34] "ATCC" относится к Американской коллекции типовых культур, чье хранилище биологических материалов включает гены и штаммы. [34] "ATCC" refers to the American Type Culture Collection, whose repository of biological materials includes genes and strains.
[35] "NCBI" относится к Национальному центру биологической информации и базам данных, представленным в нем. [35] "NCBI" refers to the National Center for Biological Information and the databases provided therein.
[36] Как используют в рамках изобретения, "РНК-полимераза T7" относится к мономерной кодируемой бактериофагом T7 ДНК-направляемой РНК-полимеразе, которая катализирует образование РНК в направлении от 5' к 3'. [36] As used herein, "T7 RNA polymerase" refers to a monomeric bacteriophage T7-encoded DNA-directed RNA polymerase that catalyzes the formation of RNA in the 5' to 3' direction.
[37] Как используют в рамках изобретения, термин "кэп" относится к гуаниновому нуклеозиду, который связан через его 5'-углерод с трифосфатной группой, которая в свою очередь связана с 5'-углеродов самого крайнего 5'-нуклеотида мРНК-транскрипта. В некоторых вариантах осуществления азот в положении 7 гуанина в кэпе является метилированным. [37] As used herein, the term "cap" refers to a guanine nucleoside that is linked through its 5' carbon to a triphosphate group, which in turn is linked to the 5' carbons of the outermost 5' nucleotide of an mRNA transcript. In some embodiments, the nitrogen at position 7 of the guanine in the cap is methylated.
[38] Как используют в рамках изобретения, термины "кэпированная РНК", "5'-кэпированная РНК" и "кэпированная мРНК" относятся к РНК и мРНК, соответственно, которые содержат кэп. [38] As used herein, the terms "capped RNA", "5'-capped RNA" and "capped mRNA" refer to RNA and mRNA, respectively, that contain a cap.
[39] Как используют в рамках изобретения, "полинуклеотид" и "нуклеиновая кислота" относятся к двум или более нуклеозидам, которые ковалентно связаны друг с другом. Полинуклеотид может полностью состоять из рибонуклеотидов (т.е. РНК), полностью состоять из 2'-дезоксирибонуклеотидов (т.е. ДНК) или состоять из смесей рибо- и 2'-дезоксирибонуклеотидов. В то время как нуклеозиды, как правило, связаны между собой стандартными фосфодиэфирными связями, полинуклеотиды могут включать одну или более нестандартных связей. Полинуклеотид может быть одноцепочечным или двухцепочечным, или может включать как одноцепочечные области, так и двухцепочечные области. Более того, в то время как полинуклеотид обычно состоит из встречающихся в природе кодирующих нуклеиновых оснований (т.е. аденин, гуанин, урацил, тимин и цитозин), он может включать одно или более модифицированных и/или синтетических нуклеиновых оснований, например, таких как инозин, ксантин, гипоксантин и т.д. В некоторых вариантах осуществления такие модифицированные или синтетические нуклеиновые основания представляют собой нуклеиновые основания, кодирующие аминокислотные последовательности. [39] As used herein, "polynucleotide" and "nucleic acid" refer to two or more nucleosides that are covalently linked to each other. A polynucleotide may be composed entirely of ribonucleotides (ie RNA), entirely composed of 2'-deoxyribonucleotides (ie DNA), or composed of mixtures of ribo- and 2'-deoxyribonucleotides. While nucleosides are typically linked together by standard phosphodiester bonds, polynucleotides may include one or more non-standard bonds. The polynucleotide may be single-stranded or double-stranded, or may include both single-stranded regions and double-stranded regions. Moreover, while a polynucleotide typically consists of naturally occurring coding nucleobases (i.e., adenine, guanine, uracil, thymine, and cytosine), it may include one or more modified and/or synthetic nucleobases, such as like inosine, xanthine, hypoxanthine, etc. In some embodiments, such modified or synthetic nucleobases are nucleobases encoding amino acid sequences.
[40] "Белок", "полипептид" и "пептид" используются в настоящем описании взаимозаменяемо для обозначения полимера по меньшей мере из двух аминокислот, ковалентно связанных амидной связью, независимо от длины и посттрансляционной модификации (например, гликозилирование или фосфорилирование). [40] "Protein", "polypeptide" and "peptide" are used interchangeably herein to refer to a polymer of at least two amino acids covalently linked by an amide bond, regardless of length and post-translational modification (eg, glycosylation or phosphorylation).
[41] "Аминокислоты" обозначаются в настоящем описании посредством либо их широко известных трехбуквенных обозначений, либо посредством однобуквенных обозначений, рекомендованных Комиссией по биохимической номенклатуре IUPAC-IUB. Нуклеотиды, аналогично, могут обозначаться их общепринятыми однобуквенными кодами. [41] "Amino acids" are referred to herein by either their commonly known three-letter designations or by the one-letter designations recommended by the IUPAC-IUB Commission on Biochemical Nomenclature. Nucleotides, likewise, may be referred to by their common single-letter codes.
[42] Сокращения, используемые для генетически кодируемых аминокислот, являются общепринятыми и таковы: аланин (Ala или A), аргинин (Are или R), аспарагин (Asn или N), аспартат (Asp или D), цистеин (Cys или C), глутамат (Glu или E), глутамин (Gln или Q), гистидин (His или H), изолейцин (Ile или I), лейцин (Leu или L), лизин (Lys или K), метионин (Met или M), фенилаланин (Phe или F), пролин (Pro или P), серин (Ser или S), треонин (Thr или T), триптофан (Trp или W), тирозин (Tyr или Y) и валин (Val или V). [42] The abbreviations used for genetically encoded amino acids are generally accepted and are: alanine (Ala or A), arginine (Are or R), asparagine (Asn or N), aspartate (Asp or D), cysteine (Cys or C) , glutamate (Glu or E), glutamine (Gln or Q), histidine (His or H), isoleucine (Ile or I), leucine (Leu or L), lysine (Lys or K), methionine (Met or M), phenylalanine (Phe or F), proline (Pro or P), serine (Ser or S), threonine (Thr or T), tryptophan (Trp or W), tyrosine (Tyr or Y), and valine (Val or V).
[43] Когда используют трехбуквенные сокращенные обозначения, если только конкретно не предшествует "L" или "D" или если не очевидно из контекста, в котором используется сокращенное обозначение, аминокислота может быть либо в L-, либо в D-конфигурации у α-углерода (Cα). Например, в то время как "Ala" обозначает аланин без уточнения конфигурации у α-углерода, "D-Ala" и "L-Ala" обозначают D-аланин и L-аланин, соответственно. Когда используется однобуквенные сокращенные обозначения, прописные буквы обозначают аминокислоты в L-конфигурации у α-углерода и строчные буквы обозначают аминокислоты в D-конфигурации у α-углерода. Например, "A" обозначает L-аланин и "a" обозначает D-аланин. Когда полипептидные последовательности представлены в качестве нити однобуквенных или трехбуквенных сокращенных обозначений (или их смесей), последовательности приведены в направлении от амино (N) к карбокси (C) в соответствии с общими правилами. [43] When three-letter abbreviations are used, unless specifically preceded by "L" or "D" or unless it is clear from the context in which the abbreviation is used, the amino acid may be in either the L- or D-configuration of α- carbon ( Cα ). For example, while "Ala" refers to alanine without specifying the configuration at the α-carbon, "D-Ala" and "L-Ala" refer to D-alanine and L-alanine, respectively. When one-letter abbreviations are used, uppercase letters denote amino acids in the L-configuration at the α-carbon and lowercase letters denote amino acids in the D-configuration at the α-carbon. For example, "A" is L-alanine and "a" is D-alanine. When polypeptide sequences are presented as a strand of one-letter or three-letter abbreviations (or mixtures thereof), the sequences are given in the direction from amino (N) to carboxy (C) in accordance with the general rules.
[44] Сокращенные обозначения, используемые для генетически кодируемых нуклеозидов, являются общепринятыми и таковы: аденозин (A); гуанозин (G); цитидин (C); тимидин (T) и уридин (U). Если не указано конкретно, сокращенно обозначаемые нуклеозиды могут представлять собой либо рибонуклеозиды, либо 2'-дезоксирабонуклеозиды. Уточнение в отношении того, являются ли нуклеозиды рибонуклеозидами или 2'-дезоксирибонуклеозидами приводится индивидуально или в совокупности. Когда последовательности нуклеиновых кислот приведены в качестве нити из однобуквенных сокращенных обозначений, последовательности приводятся в направлении от 5' к 3' в соответствии с общими правилами, и фосфаты не указываются. [44] The abbreviations used for genetically encoded nucleosides are generally accepted and are: adenosine (A); guanosine (G); cytidine (C); thymidine (T) and uridine (U). Unless otherwise stated, abbreviated nucleosides may be either ribonucleosides or 2'-deoxyrabonucleosides. Clarification as to whether the nucleosides are ribonucleosides or 2'-deoxyribonucleosides is given individually or collectively. When nucleic acid sequences are given as a string of single letter abbreviations, the sequences are given in the 5' to 3' direction according to the general rules, and phosphates are not given.
[45] Термины "сконструированный", "рекомбинантный", "не встречающийся в природе" и "вариантный", когда их используют в отношении клетки, полинуклеотида или полипептида, относится к материалу, соответствующему природной или нативной форме материала, модифицированному так, что он в ином случае не встречался бы в природе, или идентичному ему, но полученному или происходящему из синтетических материалов и/или путем манипуляции с использованием рекомбинантных способов. [45] The terms "engineered", "recombinant", "non-naturally occurring" and "variant", when used in relation to a cell, polynucleotide or polypeptide, refers to a material corresponding to the natural or native form of the material, modified so that it would not otherwise occur in nature, or be identical to it, but derived from or derived from synthetic materials and/or by manipulation using recombinant methods.
[46] Как используют в рамках изобретения, "дикий тип" и "встречающийся в природе" относятся к форме, встречающейся в природе. Например, последовательность полипептида или полинуклеотида представляет собой последовательность, присутствующую в организме, которая может быть выделена из источника в природе и которая преднамеренно модифицирована путем манипулирования человеком. [46] As used herein, "wild type" and "naturally occurring" refer to the naturally occurring form. For example, a polypeptide or polynucleotide sequence is a sequence present in an organism that can be isolated from a source in nature and that is deliberately modified by human manipulation.
[47] "Кодирующая последовательность" относится к той части нуклеиновой кислоты (например, гена), которая кодирует аминокислотную последовательность белка. [47] "Coding sequence" refers to that portion of a nucleic acid (eg, gene) that encodes the amino acid sequence of a protein.
[48] Термин "процентная (%) идентичность последовательностей" используют в настоящем описании для обозначения сравнений полинуклеотидов и полипептидов, и ее определяют путем сравнения двух оптимально выровненных последовательностей на протяжении окна сравнения, где часть последовательности полинуклеотида или полипептида в окне сравнения может включать вставки или делеции (т.е. пропуски) по сравнению с эталонной последовательностью для оптимального выравнивания двух последовательностей. Процент можно вычислять путем определения числа положений, в которых идентичные основания нуклеиновых кислот или аминокислотные остатки встречаются в обеих последовательностях с получением количества совпавших положений, деления количества совпавших положений на общее число положений в окне сравнения и умножения результата на 100 с получением процентной идентичности последовательностей. Альтернативно процент можно вычислять путем определения числа положений, в которых либо идентичные основания нуклеиновых кислот или аминокислотные остатки встречаются в обеих последовательностях, либо основания нуклеиновых кислот или аминокислотные остатки выравниваются с использованием пропуска с получением количества совпавших положений, деления количества совпавших положений на общее количество положений в окне сравнения и умножения результата на 100 с получением процента идентичности последовательностей. Специалистам в данной области будет понятно, что существует множество общепризнанных алгоритмов, доступных для выравнивания двух последовательностей. Оптимальное выравнивание последовательностей для сравнения можно проводить, например, с использованием алгоритма локальной гомологии Smith и Waterman (Smith and Waterman, Adv. Appl. Math., 2:482 [1981]), с использование алгоритма выравнивания гомологии Needleman и Wunsch (Needleman and Wunsch, J. Mol. Biol., 48:443 [1970), с использованием способа поиска сходства Pearson и Lipman (Pearson and Lipman, Proc. Natl. Acad. Sci. USA 85:2444 [1988]), с использованием компьютеризованных реализаций этих алгоритмов (например, GAP, BESTFIT, FASTA и TFASTA в GCG Wisconsin Software Package) или посредством визуального исследования, как известно в данной области. Примеры алгоритмов, которые пригодны для определения процентной идентичности последовательностей и сходства последовательностей, включают, но не ограничиваются ими, алгоритмы BLAST и BLAST 2.0, которые описаны Altschul et al. (см. Altschul et al., J. Mol. Biol., 215: 403-410 [1990] и Altschul et al., Nucleic Acids Res., 25:3389-3402 [1977], соответственно). Программное обеспечение для проведения анализов BLAST является общедоступным через web-сайт Национального центра по биотехнологической информации. Этот алгоритм вовлекает идентификацию сначала пар последовательностей с высокой оценкой (HSP) путем идентификации коротких слов длиной W в последовательности запроса, которые либо совпадают, либо удовлетворяют некоторому пороговому показателю T при выравнивании со словом той же длины в последовательности базы данных. T обозначает пороговое значение для соседнего слова (см., Altschul et al., выше). Эти первоначальные наилучшие совпадения для соседних слов выступают в качестве основ для инициации поиска более длинных HSP, содержащих их. Затем наилучшие совпадения удлиняют в обоих направлениях вдоль каждой последовательности насколько, насколько может быть увеличен совокупный показатель выравнивания. Совокупные показатели вычисляют с использованием, для нуклеотидных последовательностей, параметров M (показатель вознаграждения за пару совпавших остатков всегда >0) и N (показатель штрафа за не совпавшие остатки; всегда <0). Для аминокислотных последовательностей для вычисления совокупного показателя используют оценочную матрицу. Удлинение слов с наилучшим совпадением останавливается, когда: совокупный показатель выравнивания снижается на величину X от его максимальной достигнутой величины; совокупный показатель достигает нуля или ниже, вследствие накопления одного или более выравниваний остатков с отрицательной оценкой; или достигается конец любой из последовательностей. Параметры алгоритма BLAST W, T и X определяют чувствительность и скорость выравнивания. Программа BLASTN (для нуклеотидных последовательностей) использует в качестве параметров по умолчанию длину слова (W) 11, ожидание (E) 10, M=5, N=-4, и сравнение обеих цепей. Для аминокислотных последовательностей программа BLASTP использует в качестве параметров по умолчанию длину слова (W) 3, ожидание (E) 10 и оценочную матрицу BLOSUM62 (см., Henikoff и Henikoff, Proc. Natl. Acad. Sci. USA 89:10915 [1989]). Для иллюстративного проведения выравнивания последовательностей и определение % идентичности последовательностей можно использовать программы BESTFIT или GAP в пакете программ GCG Wisconsin Software (Accelrys, Madison WI) с использованием предоставленных параметров по умолчанию. [48] The term "percent (%) sequence identity" is used herein to refer to comparisons of polynucleotides and polypeptides, and is determined by comparing two optimally aligned sequences over a comparison window, where the portion of the polynucleotide or polypeptide sequence in the comparison window may include inserts or deletions (ie gaps) compared to the reference sequence for optimal alignment of the two sequences. The percentage can be calculated by determining the number of positions at which identical nucleic acid bases or amino acid residues occur in both sequences to obtain the number of matched positions, dividing the number of matched positions by the total number of positions in the comparison window, and multiplying the result by 100 to obtain percent sequence identity. Alternatively, the percentage can be calculated by determining the number of positions at which either identical nucleic acid bases or amino acid residues occur in both sequences, or nucleic acid bases or amino acid residues align using a skip to give the number of positions that matched, dividing the number of positions that matched by the total number of positions in comparison window and multiplying the result by 100 to get the percent sequence identity. Those skilled in the art will appreciate that there are many well-established algorithms available for aligning two sequences. Optimal sequence alignment for comparison can be performed, for example, using Smith and Waterman's local homology algorithm (Smith and Waterman, Adv. Appl. Math., 2:482 [1981]), using Needleman and Wunsch's homology alignment algorithm (Needleman and Wunsch , J. Mol. Biol., 48:443 [1970), using the Pearson and Lipman similarity search method (Pearson and Lipman, Proc. Natl. Acad. Sci. USA 85:2444 [1988]), using computerized implementations of these algorithms (eg, GAP, BESTFIT , FASTA, and TFASTA in the GCG Wisconsin Software Package) or through visual inspection, as is known in the art. Examples of algorithms that are suitable for determining percent sequence identity and sequence similarity include, but are not limited to, the BLAST and BLAST 2.0 algorithms as described by Altschul et al. (See Altschul et al . , J. Mol. Biol., 215: 403-410 [1990] and Altschul et al . , Nucleic Acids Res., 25:3389-3402 [1977], respectively). The BLAST analysis software is publicly available through the National Center for Biotechnology Information website. This algorithm involves identifying high scoring sequence pairs (HSPs) first by identifying short words of length W in the query sequence that either match or satisfy some threshold T when aligned with a word of the same length in the database sequence. T denotes the neighbor word threshold (see Altschul et al., supra). These initial best matches for adjacent words act as bases to initiate a search for longer HSPs containing them. The best matches are then lengthened in both directions along each sequence as much as the total alignment score can be increased. Aggregate scores are calculated using, for nucleotide sequences, the parameters M (reward score for a pair of matching residues always >0) and N (penalty score for mismatched residues; always <0). For amino acid sequences, a score matrix is used to calculate the cumulative score. The extension of the best matching words stops when: the cumulative alignment score falls by X from its maximum achieved value; the cumulative score reaches zero or below due to the accumulation of one or more negative-scoring residual alignments; or the end of either sequence is reached. The BLAST algorithm parameters W, T and X determine the sensitivity and speed of the alignment. The BLASTN program (for nucleotide sequences) uses as default parameters word length (W) 11, expectation (E) 10, M=5, N=-4, and comparison of both strands. For amino acid sequences, BLASTP uses word length (W) 3, expectation (E) 10, and BLOSUM62 scoring matrix as default parameters (see, Henikoff and Henikoff, Proc. Natl. Acad. Sci. USA 89:10915 [1989] ). To illustratively perform sequence alignment and determine % sequence identity, the BESTFIT or GAP programs in the GCG Wisconsin Software (Accelrys, Madison WI) can be used using the default parameters provided.
[49] "Эталонная последовательность" относится к определенной последовательности, используемой в качестве основы для сравнения последовательностей. Эталонная последовательность может представлять собой разновидность более крупной последовательности, например, сегмент полноразмерного гена или полипептидную последовательность. Как правило, эталонная последовательность имеет длину по меньшей мере 20 нуклеотидных или аминокислотных остатков, по меньшей мере 25 остатков, по меньшей мере 50 остатков, по меньшей мере 100 остатков или имеет полную длину нуклеиновой кислоты или полипептида. Поскольку каждый из двух полинуклеотидов или полипептидов может (1) содержать последовательность (т.е. часть полной последовательности), которая является сходной между двумя последовательности, и (2) может дополнительно содержать последовательность, которая различается между двумя последовательности, сравнение последовательностей двух (или более) полинуклеотидов или полипептидов обычно проводят путем сравнения последовательностей двух полинуклеотидов или полипептидов на протяжении "окна сравнения" для идентификации и сравнения локальных областей сходства последовательностей. В некоторых вариантах осуществления "эталонная последовательность" может быть основана на первичной аминокислотной последовательности, где эталонная последовательность представляет собой последовательность, которая может иметь одно или более изменений в первичной последовательности. [49] "Reference sequence" refers to a specific sequence used as a basis for comparing sequences. The reference sequence may be a subset of a larger sequence, such as a full length gene segment or a polypeptide sequence. Typically, the reference sequence is at least 20 nucleotide or amino acid residues, at least 25 residues, at least 50 residues, at least 100 residues, or the full length of the nucleic acid or polypeptide. Since each of the two polynucleotides or polypeptides may (1) contain a sequence (i.e., part of the total sequence) that is similar between the two sequences, and (2) may additionally contain a sequence that differs between the two sequences, comparing the sequences of the two (or more) polynucleotides or polypeptides is usually carried out by comparing the sequences of two polynucleotides or polypeptides over a "comparison window" to identify and compare local areas of sequence similarity. In some embodiments, a "reference sequence" may be based on a primary amino acid sequence, where the reference sequence is a sequence that may have one or more changes to the primary sequence.
[50] "Окно сравнения" относится к схематичному сегменту из по меньшей мере приблизительно 20 последовательных нуклеотидных положений или аминокислотных остатков, где последовательность может быть сравнена с эталонной последовательностью из по меньшей мере 20 последовательных нуклеотидов или аминокислот и где часть последовательности в окне сравнения может включать вставки или делеции (т.е. пропуски), составляющие 20 процентов или менее по сравнению с эталонной последовательностью (которая не включает вставок или делеций) для оптимального выравнивания двух последовательностей. Окно сравнения может составлять более 20 последовательно расположенных остатков и включает, необязательно 30, 40, 50, 100 или более длинные окна. [50] "Comparison window" refers to a schematic segment of at least about 20 consecutive nucleotide positions or amino acid residues, where the sequence can be compared to a reference sequence of at least 20 consecutive nucleotides or amino acid residues, and where the portion of the sequence in the comparison window can include insertions or deletions (ie, gaps) of 20 percent or less compared to a reference sequence (which does not include insertions or deletions) to optimally align the two sequences. The comparison window may be more than 20 consecutive residues and optionally includes 30, 40, 50, 100 or longer windows.
[51] "Согласно с", "по сравнению с" или "относительно" при использовании в контексте нумерации данной аминокислотной или полинуклеотидной последовательности относится к нумерации остатков определенной эталонной последовательности, когда данную аминокислотную или полинуклеотидную последовательность сравнивают с эталонной последовательностью. Иными словами, номер остатка или положение остатка данного полимера обозначают относительно эталонной последовательности, а не фактического числового положения остатка в данной аминокислотной или полинуклеотидной последовательности. Например, данную аминокислотную последовательность, такую как аминокислотная последовательность сконструированной РНК-полимеразы T7, можно выравнивать с эталонной последовательностью путем внесения пропусков для оптимизации соответствий остатков между двумя последовательностями. В этих случаях, хотя присутствуют пропуски, нумерацию остатка в данной аминокислотной или полинуклеотидной последовательности проводят относительно эталонной последовательности, с которой ее выравнивают. [51] "According to", "compared to", or "relative to" when used in the context of numbering a given amino acid or polynucleotide sequence refers to the numbering of residues of a particular reference sequence when the given amino acid or polynucleotide sequence is compared to a reference sequence. In other words, the residue number or residue position of a given polymer is relative to a reference sequence, not the actual numerical position of the residue in a given amino acid or polynucleotide sequence. For example, a given amino acid sequence, such as the amino acid sequence of engineered T7 RNA polymerase, can be aligned with a reference sequence by introducing gaps to optimize residue matches between the two sequences. In these cases, although gaps are present, the numbering of the residue in a given amino acid or polynucleotide sequence is relative to the reference sequence with which it is aligned.
[52] "Различие аминокислот" или "различие остатков" относится к отличию аминокислотных остатков в положении полипептидной последовательности относительно аминокислотных остатков в соответствующих положениях в эталонной последовательности. Положения различий аминокислот обычно обозначают в настоящем описании как "Xn", где n относится к соответствующему положению в эталонной последовательности, на котором основано различие остатков. Например, "различие остатков в положении X93 по сравнению с SEQ ID NO: 2" относится к различию аминокислотных остатков в положении полипептида, соответствующем положению 93 SEQ ID NO: 2. Таким образом, если эталонный полипептид SEQ ID NO: 2 имеет серин в положении 93, тогда "отличие остатка в положении X93 по сравнению с SEQ ID NO: 2" представляет собой аминокислотную замену в любом остатке, отличном от серина, в положении полипептида, соответствующем положению 93 SEQ ID NO: 2. В большинстве случаев, описанных в настоящем описании, конкретное различие аминокислотных остатков в данном положении обозначается как "XnY", где "Xn" обозначает соответствующее положение, как описано выше, и "Y" представляет собой однобуквенный идентификатор аминокислоты, находящейся в сконструированном полипептиде (т.е. остаток, отличный от эталонного полипептида). В некоторых случаях (например, в таблицах, приведенных в примерах настоящего описания), настоящее изобретение также относится к конкретным аминокислотным различиям, обозначаемым посредством общепринятого обозначения "AnB", где A представляет собой однобуквенный идентификатор остатка в эталонной последовательности, "n" представляет собой количество положений остатков в эталонной последовательности и B представляет собой однобуквенный идентификатор замены остатков в последовательности сконструированного полипептида. В некоторых случаях полипептид по настоящему изобретению может включать одно или более отличий аминокислотных остатков относительно эталонной последовательности, которые указываются посредством перечня указанных положений, где присутствуют различия остатков относительно эталонной последовательности. В некоторых вариантах осуществления, когда более одной аминокислоты может использоваться в конкретном положении остатка полипептида, различные аминокислотные остатки, которые могут использоваться, разделены "/" (например, X10H/X10P или X10H/P). В некоторых вариантах осуществления варианты ферментов включают более одной замены. Эти замены разделены слешем для простоты прочтения (например, C14A/K122A). Настоящая заявка включает сконструированные полипептидные последовательности, содержащие одно или более аминокислотных различий, которые включают либо консервативные, либо неконсервативные аминокислотные замены, или и те, и другие. [52] "Amino acid difference" or "residue difference" refers to the difference between amino acid residues at a position in a polypeptide sequence relative to amino acid residues at corresponding positions in a reference sequence. Amino acid difference positions are generally referred to herein as "Xn", where n refers to the corresponding position in the reference sequence on which the residue difference is based. For example, "residue difference at position X93 compared to SEQ ID NO: 2" refers to the difference in amino acid residues at the position of the polypeptide corresponding to position 93 of SEQ ID NO: 2. Thus, if the reference polypeptide of SEQ ID NO: 2 has a serine at position 93, then "residue difference at position X93 compared to SEQ ID NO: 2" is an amino acid substitution at any residue other than serine at the position of the polypeptide corresponding to position 93 of SEQ ID NO: 2. In most cases described herein description, a particular difference in amino acid residues at a given position is referred to as "XnY", where "Xn" denotes the corresponding position as described above, and "Y" is the single letter identifier for the amino acid found in the engineered polypeptide (i.e., a residue other than reference polypeptide). In some cases (for example, in the tables given in the examples of the present description), the present invention also refers to specific amino acid differences, denoted by the common designation "AnB", where A is a one-letter identifier of the residue in the reference sequence, "n" is the number the positions of the residues in the reference sequence; and B is the single letter identifier for the substitution of residues in the sequence of the constructed polypeptide. In some instances, a polypeptide of the present invention may include one or more amino acid residue differences relative to a reference sequence, which are indicated by a list of said positions where residue differences relative to a reference sequence are present. In some embodiments, when more than one amino acid may be used at a particular position of a polypeptide residue, the various amino acid residues that may be used are separated by "/" (eg, X10H/X10P or X10H/P). In some embodiments, the enzyme variants include more than one substitution. These substitutions are separated by a slash for ease of reading (eg C14A/K122A). The present application includes engineered polypeptide sequences containing one or more amino acid differences that include either conservative or non-conservative amino acid substitutions, or both.
[53] "Консервативная аминокислотная замена" относится к замене остатка отличающимся остатком, имеющим сходную боковую цепь и, таким образом, она обычно вовлекает замену аминокислоты в полипептиде аминокислотами в пределах одного и того же или сходного определенного класса аминокислот. В качестве неограничивающего примера, аминокислота с алифатической боковой цепью может быть заменена другой алифатической аминокислотой (например, аланин, валин, лейцин и изолейцин); аминокислота с гидроксильной боковой цепью заменена другой аминокислотой с гидрофильной боковой цепью (например, серином и треонином); аминокислоты, имеющие ароматические боковые цепи, заменены другой аминокислотой, имеющей ароматическую боковую цепь (например, фенилаланин, тирозин, триптофан и гистидин); аминокислота с основной боковой цепью заменена другой аминокислотой с основной боковой цепью (например, лизин и аргинин); аминокислота с кислотной боковой цепью заменена другой аминокислотой с кислотной боковой цепью (например, аспарагиновая кислота или глутаминовая кислота); и/или гидрофобная или гидрофильная аминокислота заменена другой гидрофобной или гидрофильной аминокислотой, соответственно. [53] "Conservative amino acid substitution" refers to the replacement of a residue with a different residue having a similar side chain and thus typically involves the substitution of an amino acid in a polypeptide with amino acids within the same or a similar defined class of amino acids. As a non-limiting example, an amino acid with an aliphatic side chain may be replaced with another aliphatic amino acid (eg, alanine, valine, leucine, and isoleucine); an amino acid with a hydroxyl side chain is replaced with another amino acid with a hydrophilic side chain (eg, serine and threonine); amino acids having aromatic side chains are replaced with another amino acid having an aromatic side chain (eg phenylalanine, tyrosine, tryptophan and histidine); a main side chain amino acid is replaced with another main side chain amino acid (eg, lysine and arginine); an acidic side chain amino acid is replaced with another acidic side chain amino acid (eg, aspartic acid or glutamic acid); and/or the hydrophobic or hydrophilic amino acid is replaced by another hydrophobic or hydrophilic amino acid, respectively.
[54] "Неконсервативная замена" относится к замене аминокислоты в пептиде аминокислотой со значительно отличающимися свойствами боковой цепи. В случае неконсервативных замен могут использоваться аминокислоты между, а не в пределах, определенными группами, и они влияют на (a) структуру пептидного остова в области замещения (например, пролин на глицин) (b) заряд или гидрофобность или (c) объем боковой цепи. В качестве неограничивающего примера иллюстративная неконсервативная замена может представлять собой кислотную аминокислоту, замещенную основной или алифатической аминокислотой; ароматическую аминокислоту, замещенную небольшой аминокислотой; и гидрофобную аминокислоту, замещенную гидрофобной аминокислотой. [54] "Non-conservative substitution" refers to the replacement of an amino acid in a peptide with an amino acid with significantly different side chain properties. In the case of non-conservative substitutions, amino acids between, rather than within, certain groups can be used and affect (a) the structure of the peptide backbone at the site of substitution (e.g., proline to glycine) (b) charge or hydrophobicity, or (c) side chain volume . As a non-limiting example, an illustrative non-conservative substitution may be an acidic amino acid substituted with a basic or aliphatic amino acid; an aromatic amino acid substituted with a small amino acid; and a hydrophobic amino acid substituted with a hydrophobic amino acid.
[55] "Делеция" относится к модификации полипептида путем удаления одной или более аминокислот из эталонного полипептида. Делеции могут включать удаление на 1 или более аминокислот, 2 или более аминокислот, 5 или более аминокислот, 10 или более аминокислот, 15 или более аминокислоты, или 20 или более аминокислот, вплоть до 10% от общего количества аминокислот, или вплоть до 20% от общего количества аминокислот, составляющих эталонный фермент, при сохранении ферментативной активности и/или сохранении усовершенствованных свойств сконструированного фермента. Делеции могут быть направлены на внутренние части и/или концевые части полипептида. В различных вариантах осуществления делеция может включать непрерывный сегмент или может прерываться. [55] "Deletion" refers to the modification of a polypeptide by removing one or more amino acids from a reference polypeptide. Deletions can include deletions of 1 or more amino acids, 2 or more amino acids, 5 or more amino acids, 10 or more amino acids, 15 or more amino acids, or 20 or more amino acids, up to 10% of the total amino acids, or up to 20% from the total number of amino acids that make up the reference enzyme, while maintaining the enzymatic activity and/or maintaining the improved properties of the engineered enzyme. Deletions may be directed to the interior and/or terminal portions of the polypeptide. In various embodiments, the implementation of the deletion may include a continuous segment or may be interrupted.
[56] "Инсерция" относится к модификации полипептида путем присоединения одной или более аминокислот из эталонного полипептида. Инсерции могут быть проведены во внутренних частях полипептида или на C-конце или N-конце. Инсерции, как используют в рамках изобретения, включают слитые белки, как известно в данной области. Инсерция может представлять собой непрерывный сегмент из аминокислот или может быть разделена одной или более аминокислотами встречающегося в природе полипептида. [56] "Insertion" refers to the modification of a polypeptide by adding one or more amino acids from a reference polypeptide. Insertions can be made in the internal parts of the polypeptide or at the C-terminus or N-terminus. Insertions, as used within the scope of the invention, include fusion proteins, as is known in the art. An insertion may be a continuous segment of amino acids or may be separated by one or more amino acids of a naturally occurring polypeptide.
[57] "Выделенный полипептид" относится к полипептиду, который по существу отделен от других компонентов, которые обычно сопровождают его (например, белок, липиды и полинуклеотиды). Термин охватывает полипептиды, которые извлечены или очищены из их встречающегося в природе окружения или экспрессирующей системы (например, клетка-хозяин или синтез in vitro). Рекомбинантные полипептиды РНК-полимеразы T7 могут присутствовать в клетке, могут присутствовать в клеточной среде или могут быть получены в различных формах, таких как лизаты или выделенные препараты. По существу, в некоторых вариантах осуществления рекомбинантные полипептиды РНК-полимеразы T7 могут представлять собой выделенные полипептиды. [57] "Isolated polypeptide" refers to a polypeptide that is substantially separated from other components that normally accompany it (eg, protein, lipids, and polynucleotides). The term encompasses polypeptides that are extracted or purified from their naturally occurring environment or expression system (eg, host cell or in vitro synthesis). The recombinant T7 RNA polymerase polypeptides may be present in the cell, may be present in the cellular environment, or may be prepared in various forms such as lysates or isolated preparations. As such, in some embodiments, the recombinant T7 RNA polymerase polypeptides may be isolated polypeptides.
[58] "По существу чистый полипептид" относится к композиции, в которой полипептидный компонент представляет собой преобладающий присутствующий компонент (т.е. на молярной или весовой основе он присутствует в большем количестве, чем любой другой отдельный макромолекулярный компонент в композиции), и обычно представляет собой по существу очищенную композицию, когда данный компонент составляет по меньшей мере приблизительно 50 процентов макромолекулярных компонентов на молярной основе или в % по массе. Как правило, по существу чистая композиция РНК-полимеразы T7 содержит 60% или более, приблизительно 70% или более, приблизительно 80% или более, приблизительно 90% или более, приблизительно 95% или более, и приблизительно 98% или всех макромолекулярных компонентов на молярной основе или в % по массе, присутствующих в композиции. В некоторых вариантах осуществления рассматриваемый компонент очищают по существу до однородности (т.е. загрязняющие компоненты не могут быть обнаружены общепринятыми способами детекции), где композиция по существу состоит из одного макромолекулярного компонента. Компоненты растворителей, низкомолекулярные соединения (<500 Дальтон) и компоненты в виде элементарных ионов не считаются макромолекулярными компонентами. В некоторых вариантах осуществления выделенные рекомбинантные полипептиды РНК-полимеразы T7 представляют собой по существу чистые полипептидные композиции. [58] "Substantially pure polypeptide" refers to a composition in which the polypeptide component is the predominant component present (i.e., on a molar or weight basis, it is present in greater amounts than any other single macromolecular component in the composition), and usually is a substantially purified composition when the component is at least about 50 percent of the macromolecular components on a molar basis or in % by weight. Typically, a substantially pure T7 RNA polymerase composition contains 60% or more, about 70% or more, about 80% or more, about 90% or more, about 95% or more, and about 98% or more of the macromolecular components per on a molar basis or in % by weight present in the composition. In some embodiments, the component in question is purified to substantially uniformity (ie, contaminants cannot be detected by conventional detection methods), where the composition essentially consists of a single macromolecular component. Solvent components, low molecular weight compounds (<500 Daltons) and elemental ion components are not considered macromolecular components. In some embodiments, the isolated recombinant T7 RNA polymerase polypeptides are substantially pure polypeptide compositions.
[59] "Усовершенствованное свойство фермента" РНК-полимеразы T7 относится к сконструированному полипептиду РНК-полимеразы T7, который демонстрирует улучшение какого-либо ферментного свойства по сравнению с эталонным полипептидом РНК-полимеразы T7 и/или полипептидом РНК-полимеразы T7 дикого типа и/или другим сконструированным полипептидом РНК-полимеразы T7. Усовершенствованные свойства включают, но не ограничиваются ими, такие свойства, как увеличенная селективность в отношении аналога кэпа относительно GTP, увеличенная точность репликации, увеличенный выход РНК, увеличенная экспрессия белка, увеличенная термоактивность, увеличенная термостабильность, увеличенная зависимая от pH активность, увеличенная стабильность, увеличенная ферментативная активность, увеличенная субстратная специфичность или аффинность, увеличенная удельная активность, увеличенная резистентность к субстрату или ингибирование конечного продукта (включая пирофосфат), увеличенная химическая стабильность, увеличенная стабильность в растворителях, увеличенная толерантность к кислотным или основным значениям pH, увеличенная толерантность к протеолитической активности (т.е. сниженная чувствительность к протеолизу), сниженная агрегация, увеличенная растворимость и измененный профиль температур. [59] "Improved enzyme property" of T7 RNA polymerase refers to an engineered T7 RNA polymerase polypeptide that exhibits an improvement in any enzymatic property compared to a reference T7 RNA polymerase polypeptide and/or a wild-type T7 RNA polymerase polypeptide and/ or another engineered T7 RNA polymerase polypeptide. Improved properties include, but are not limited to, increased cap analog selectivity for GTP, increased replication fidelity, increased RNA yield, increased protein expression, increased thermal activity, increased thermal stability, increased pH dependent activity, increased stability, increased enzymatic activity, increased substrate specificity or affinity, increased specific activity, increased substrate resistance or end product inhibition (including pyrophosphate), increased chemical stability, increased solvent stability, increased tolerance to acidic or basic pH values, increased tolerance to proteolytic activity ( ie reduced sensitivity to proteolysis), reduced aggregation, increased solubility and altered temperature profile.
[60] "Увеличенная ферментативная активность" или "усиленная каталитическая активность" относится к улучшенному свойству сконструированной РНК-полимеразы T7, которое может отражаться увеличением удельной активности (например, продуцированный продукт/время/масса белка) или увеличением процентного конвертирования субстрата в продукт (например, процентное конвертирование исходного количества субстрата в продут за определенный период времени с использованием определенного количества варианта РНК-полимеразы T7 по сравнению с эталонной РНК-полимеразой T7. Иллюстративные способы определения ферментативной активности приведены в примерах. Может изменяться любое свойство, касающееся ферментативной активности. [60] "Increased enzymatic activity" or "enhanced catalytic activity" refers to an improved property of the engineered T7 RNA polymerase, which may be reflected by an increase in specific activity (e.g., product produced/time/protein weight) or an increase in percentage conversion of substrate to product (e.g. , percent conversion of initial amount of substrate to products over a given period of time using a given amount of T7 RNA polymerase variant compared to a reference T7 RNA polymerase.
[61] "Жесткость гибридизации" относится к условиям гибридизации, таким как условия промывания, при гибридизации нуклеиновых кислот. Как правило, реакции гибридизации проводят в условиях более низкой жесткости, после чего проводят промывания варьирующей, но более высокой жесткости. Термин "умеренно жесткая гибридизация" относится к условиям, которые позволяют ДНК-мишени связать комплементарную нуклеиновую кислоту, которая обладает приблизительно 60% идентичностью, предпочтительно приблизительно 75% идентичностью, приблизительно 85% идентичностью с ДНК-мишенью, с более чем приблизительно 90% идентичностью с полинуклеотидом-мишенью. Иллюстративные условия умеренной жесткости представляют собой условия, эквивалентные гибридизации в 50% формамиде, 5× растворе Денхарта, 5×SSPE, 0,2% SDS при 42°C, с последующим промыванием в 0,2×SSPE, 0,2% SDS, при 42°C. "Гибридизация высокой жесткости" относится, главным образом, к условиям, которые приблизительно на 10°C или менее ниже температуры плавления T m при определении в условиях раствора для определенной полинуклеотидной последовательности. В некоторых вариантах осуществления условия высокой жесткости относятся к условиям, которые позволяют гибридизацию только тех последовательностей нуклеиновых кислот, которые образуют стабильные гибриды в 0,018 M NaCl при 65°C (т.е. если гибрид не является стабильным в 0,018 M NaCl при 65°C, предусматривается, что он не будет стабильным в условиях высокой жесткости). Условия высокой жесткости могут быть обеспечены, например, гибридизацией в условиях, эквивалентных 50% формамиду, 5× раствору Денхарта, 5×SSPE, 0,2% SDS при 42°C, с последующим промыванием в 0,1×SSPE и 0,1% SDS при 65°C. Другими условиями высокой жесткости является гибридизация в условиях, эквивалентных гибридизации в 5X SSC, содержащем 0,1% (масс.:об.) SDS, при 65°C, и промывание в 0,1x SSC, содержащем 0,1% SDS, при 65°C. Другие условиях гибридизации высокой жесткости, а также условия умеренной жесткости, описаны в ссылках, цитированных выше. [61] "Hybridization stringency" refers to hybridization conditions, such as washing conditions, when nucleic acids are hybridized. Typically, hybridization reactions are carried out under conditions of lower stringency followed by washes of varying but higher stringency. The term "moderately stringent hybridization" refers to conditions that allow the target DNA to bind a complementary nucleic acid that has about 60% identity, preferably about 75% identity, about 85% identity with the target DNA, with more than about 90% identity with target polynucleotide. Exemplary moderate stringency conditions are equivalent to hybridization in 50% formamide, 5× Denhart's solution, 5×SSPE, 0.2% SDS at 42° C., followed by a wash in 0.2×SSPE, 0.2% SDS, at 42°C. "High stringency hybridization" refers primarily to conditions that are about 10° C. or less below the melting point T m when determined under solution conditions for a particular polynucleotide sequence. In some embodiments, high stringency conditions refer to conditions that allow hybridization of only those nucleic acid sequences that form stable hybrids in 0.018 M NaCl at 65°C (i.e. , if the hybrid is not stable in 0.018 M NaCl at 65°C , it is envisaged that it will not be stable under conditions of high rigidity). High stringency conditions can be achieved, for example, by hybridization under conditions equivalent to 50% formamide, 5× Denhart's solution, 5×SSPE, 0.2% SDS at 42°C, followed by washing in 0.1×SSPE and 0.1 % SDS at 65°C. Other high stringency conditions are hybridization under conditions equivalent to hybridization in 5X SSC containing 0.1% (w:v) SDS at 65° C. and washing in 0.1x SSC containing 0.1% SDS at 65°C. Other high stringency hybridization conditions, as well as moderate stringency conditions, are described in the references cited above.
[62] "Кодон-оптимизированный" относится к изменениям в кодонах полинуклеотида, кодирующего белок, на кодоны, предпочтительно используемые в конкретном организме, так что кодируемый белок более эффективно экспрессируется в представляющем интерес организме. Хотя генетический код является вырожденным ввиду того, что большинству аминокислот соответствует несколько кодонов, называемых "синонимами" или "синонимическими" кодонами, хорошо известно, что использование кодонов конкретными организмами является неслучайным и предпочтительным с точки зрения конкретных кодоновых триплетов. Это предпочтение использования кодонов может быть более высоким для данного гена, генов с общей функцией или происхождением, высоко экспрессируемых белков против белков с низким числом копий, и составные области, кодирующие белки, генома организма. В некоторых вариантах осуществления полинуклеотиды, кодирующие ферменты РНК-полимеразы T7, могут быть кодон-оптимизированными для оптимального продуцирования из организма-хозяина, выбранного для экспрессии. [62] "Codon-optimized" refers to changes in the codons of a polynucleotide encoding a protein to codons preferably used in a particular organism, so that the encoded protein is more efficiently expressed in the organism of interest. Although the genetic code is degenerate due to the fact that most amino acids correspond to several codons, called "synonyms" or "synonymous" codons, it is well known that the use of codons by specific organisms is non-random and preferable in terms of specific codon triplets. This preference for codon use may be higher for a given gene, genes with a common function or origin, highly expressed proteins versus low copy number proteins, and component protein-coding regions of an organism's genome. In some embodiments, polynucleotides encoding T7 RNA polymerase enzymes may be codon-optimized for optimal production from the host organism selected for expression.
[63] "Последовательность контроля" относится в настоящем описании ко всем компонентам, которые являются необходимыми или преимущественными для экспрессии полинуклеотида и/или полипептида, описанного в настоящей заявке. Каждая последовательность контроля может быть нативной или чужеродной для последовательности нуклеиновой кислоты, кодирующей полипептид. Такие последовательности контроля включают, но не ограничиваются ими, лидерную последовательность, последовательность полиаденилирования, последовательность пропептида, промоторную последовательность, последовательность сигнального пептида, последовательность инициации и терминатор транскрипции. Как минимум, последовательности контроля включают промотор и стоп-сигналы транскрипции и трансляции. Последовательности контроля могут быть предоставлены с линкерами для внесения специальных участков рестрикции, облегчающих лигирование последовательностей контроля с кодирующей областью последовательности нуклеиновой кислоты, кодирующей полипептид. [63] "Control sequence" refers in the present description to all components that are necessary or advantageous for the expression of the polynucleotide and/or polypeptide described in this application. Each control sequence may be native or foreign to the nucleic acid sequence encoding the polypeptide. Such control sequences include, but are not limited to, a leader sequence, a polyadenylation sequence, a propeptide sequence, a promoter sequence, a signal peptide sequence, an initiation sequence, and a transcription terminator. At a minimum, control sequences include a promoter and transcriptional and translational stop signals. Control sequences can be provided with linkers to introduce special restriction sites to facilitate ligation of the control sequences to the coding region of a nucleic acid sequence encoding a polypeptide.
[64] "Функционально связанный" определяют в настоящем описании как конфигурацию, в которой последовательность контроля соответствующим образом помещена (т.е. в функциональной взаимосвязи) в таком положении относительно представляющего интерес полинуклеотида, что последовательность контроля направляет или регулирует экспрессию представляющего интерес полинуклеотида и/или полипептида. [64] "Operably linked" is defined herein as a configuration in which the control sequence is appropriately placed (i.e., in operative relationship) in such a position relative to the polynucleotide of interest that the control sequence directs or regulates the expression of the polynucleotide of interest and/ or a polypeptide.
[65] "Промоторная последовательность" относится к последовательности нуклеиновой кислоты, которая распознается клеткой-хозяином для экспрессии представляющего интерес полинуклеотида, такого как кодирующая последовательность. Промоторная последовательность содержит последовательности контроля транскрипции, которые опосредуют экспрессию представляющего интерес полинуклеотида. Промотор может представлять собой любую последовательность нуклеиновой кислоты, которая демонстрирует транскрипционную активность в выбранной клетке-хозяине, включая мутантный, укороченный и гибридный промотор, и может быть получена из генов, кодирующих внеклеточные или внутриклеточные полипептиды, либо гомологичные, либо гетерологичные для клетки-хозяина. [65] "Promoter sequence" refers to a nucleic acid sequence that is recognized by a host cell for expression of a polynucleotide of interest, such as a coding sequence. The promoter sequence contains transcription control sequences that mediate the expression of the polynucleotide of interest. A promoter can be any nucleic acid sequence that exhibits transcriptional activity in the host cell of choice, including mutant, truncated, and hybrid promoters, and can be derived from genes encoding extracellular or intracellular polypeptides, either homologous or heterologous to the host cell.
[66] "Подходящие условия реакции" относятся к условиям в реакционном растворе для ферментативного превращения (например, диапазоны загрузки фермента, загрузки субстрата, температура, pH, буферы, сорастворители и т.д.), в которых полипептид РНК-полимеразы T7, описанный в настоящей заявке, способен конвертировать субстрат в требуемое соединение-продукт. [66] "Suitable reaction conditions" refers to the conditions in the reaction solution for enzymatic conversion (e.g., enzyme loading ranges, substrate loadings, temperature, pH, buffers, co-solvents, etc.) under which the T7 RNA polymerase polypeptide described in this application, is capable of converting the substrate to the desired product compound.
[67] "Субстрат" в контексте процесса ферментативной реакции конвертирования относится к соединению или молекуле, на которую действует полипептид РНК-полимеразы T7. [67] "Substrate" in the context of an enzymatic conversion reaction process refers to a compound or molecule that is acted upon by a T7 RNA polymerase polypeptide.
[68] "Продукт" в контексте процесса ферментативного превращения относится к соединению или молекуле, образующимся в результате действия полипептида РНК-полимеразы T7 на субстрат. [68] "Product" in the context of an enzymatic conversion process refers to a compound or molecule resulting from the action of a T7 RNA polymerase polypeptide on a substrate.
[69] Как используют в рамках изобретения термин "культивирование" относится к выращиванию популяции микробных клеток в любых подходящих условиях (например, с использованием жидкости, геля или твердой среды). [69] As used herein, the term "culturing" refers to growing a population of microbial cells under any suitable conditions (eg, liquid, gel, or solid medium).
[70] Рекомбинантные полипептиды можно получать любыми подходящими способами, известными в данной области. Гены, кодирующие представляющий интерес полипептид дикого типа, можно клонировать в векторы, такие как плазмиды, и экспрессировать в желаемых хозяевах, таких как E. coli, S. Cerevisiae и т.д. Варианты рекомбинантных полипептидов можно получать различными способами, известными в данной области. Действительно, существует широкое множество различных способов мутагенеза, хорошо известных специалистам в данной области. Кроме того, также доступны наборы для мутагенеза от множества коммерческих молекулярно-биологических поставщиков. Доступны способы для проведения конкретных замен в определенных аминокислотах (сайт-направленных), конкретных или случайных мутаций в локализованной области гена (региоспецифических) или случайного мутагенеза по всему гена (например, насыщающий мутагенез). Специалистам в данной области хорошо известны многочисленные подходящие способы получения вариантов ферментов, включая, но не ограничиваясь ими, сайт-направленный мутагенез одноцепочечной ДНК или двухцепочечной ДНК с использованием ПЦР, кассетного мутагенеза, синтеза генов, ПЦР с пониженной точностью, шаффлинга и химического насыщающего мутагенеза, или любого другого подходящего способа, известного в данной области. Неограничивающие примеры способов, используемых для инженерии ДНК и белков, приведены в следующих патентах: патент США №6117679; патент США №6420175; патент США №6376246; патент США №6586182; патент США №7747391; патент США №7747393; патент США №7783428 и патент США №8383346. После получения вариантов их можно подвергать скринингу в отношении любого желаемого свойства (например, высокая или увеличенная активность, или низкая или сниженная активность, увеличенная термическая активность, увеличенная термическая стабильность и/или стабильность при кислых значениях pH и т.д.). [70] Recombinant polypeptides can be obtained by any suitable methods known in this field. Genes encoding a wild-type polypeptide of interest can be cloned into vectors such as plasmids and expressed in desired hosts such as E. coli, S. cerevisiae , etc. Variants of recombinant polypeptides can be obtained by various methods known in this field. Indeed, there are a wide variety of different mutagenesis methods well known to those skilled in the art. In addition, mutagenesis kits are also available from a variety of commercial molecular biology suppliers. Methods are available for making specific substitutions in certain amino acids (site-directed), specific or random mutations in a localized region of a gene (regiospecific), or random mutagenesis throughout the gene (eg, saturation mutagenesis). Numerous suitable methods for producing enzyme variants are well known to those skilled in the art, including, but not limited to, site-directed mutagenesis of single-stranded DNA or double-stranded DNA using PCR, cassette mutagenesis, gene synthesis, reduced precision PCR, shuffling, and chemical saturation mutagenesis, or any other suitable method known in the art. Non-limiting examples of methods used for engineering DNA and proteins are given in the following patents: US patent No. 6117679; US patent No. 6420175; US patent No. 6376246; US patent No. 6586182; US patent No. 7747391; US patent No. 7747393; US patent No. 7783428 and US patent No. 8383346. Once variants have been generated, they can be screened for any desired property (eg, high or increased activity, or low or decreased activity, increased thermal activity, increased thermal stability and/or stability at acidic pH values, etc.).
[71] В некоторых вариантах осуществления пригодными являются "рекомбинантные полипептиды РНК-полимеразы T7" (также обозначаемые в настоящем описании как "сконструированные полипептиды РНК-полимеразы T7", "варианты ферментов РНК-полимераз T7" и "варианты РНК-полимераз T7"). [71] In some embodiments, "recombinant T7 RNA polymerase polypeptides" (also referred to herein as "engineered T7 RNA polymerase polypeptides", "T7 RNA polymerase enzyme variants" and "T7 RNA polymerase variants") are useful. .
[72] Как используют в рамках изобретения, "вектор" представляет собой конструкцию ДНК для введения последовательности ДНК в клетку. В некоторых вариантах осуществления вектор представляет собой экспрессирующий вектор, который функционально связан с подходящей последовательностью контроля, способной обеспечивать экспрессию в подходящем хозяине полипептида, кодируемого в последовательности ДНК. В некоторых вариантах осуществления "экспрессирующий вектор" имеет промоторную последовательность, функционально связанную с последовательностью ДНК (например, трансгеном) для запуска экспрессии в клетке-хозяине и в некоторых вариантах осуществления также содержит последовательность терминатора транскрипции. [72] As used herein, a "vector" is a DNA construct for introducing a DNA sequence into a cell. In some embodiments, the vector is an expression vector that is operably linked to a suitable control sequence capable of allowing expression in a suitable host of the polypeptide encoded in the DNA sequence. In some embodiments, an "expression vector" has a promoter sequence operably linked to a DNA sequence (eg, a transgene) to drive expression in a host cell, and in some embodiments also contains a transcription terminator sequence.
[73] Как используют в рамках изобретения, термин "экспрессия" включает любую стадию, вовлеченную в продуцирование полипептида, включая, но не ограничиваясь ими, транскрипцию, посттранскрипционную модификацию, трансляцию и посттрансляционную модификацию. В некоторых вариантах осуществления термин также охватывает секрецию полипептида из клетки. [73] As used herein, the term "expression" includes any step involved in the production of a polypeptide, including, but not limited to, transcription, post-transcriptional modification, translation, and post-translational modification. In some embodiments, the implementation of the term also covers the secretion of the polypeptide from the cell.
[74] Как используют в рамках изобретения, термин "продуцирует" относится к продуцированию белков и/или других соединений клетками. Подразумевается, что термин охватывает любую стадию, вовлеченную в продуцирование полипептидов, включая, но не ограничиваясь ими, транскрипцию, посттранскрипционную модификацию, трансляцию и посттрансляционную модификацию. В некоторых вариантах осуществления термин также охватывает секрецию полипептида из клетки. [74] As used herein, the term "produces" refers to the production of proteins and/or other compounds by cells. The term is intended to cover any step involved in the production of polypeptides, including, but not limited to, transcription, post-transcriptional modification, translation, and post-translational modification. In some embodiments, the implementation of the term also covers the secretion of the polypeptide from the cell.
[75] Как используют в рамках изобретения, аминокислотная или нуклеотидная последовательность (например, промоторная последовательность, сигнальный пептид, терминаторная последовательность и т.д.) является "гетерологичной" для другой последовательности, с которой она функционально связана, если эти две последовательности не ассоциированы в природе. [75] As used herein, an amino acid or nucleotide sequence (e.g., promoter sequence, signal peptide, terminator sequence, etc.) is "heterologous" to another sequence to which it is operably linked if the two sequences are not associated. in nature.
[76] Как используют в рамках изобретения, термины "клетка-хозяин" и "штамм-хозяин" относятся к подходящим хозяевам для экспрессирующих векторов, содержащих ДНК, описанную в настоящем описании (например, полинуклеотиды, кодирующие варианты РНК-полимеразы T7). В некоторых вариантах осуществления клетки-хозяева представляют собой прокариотические или эукариотические клетки, трансформированные или трансфицированные векторами, сконструированными с использованием способов рекомбинантных ДНК, известных в данной области. [76] As used herein, the terms "host cell" and "host strain" refer to suitable hosts for expression vectors containing the DNA described herein (eg, polynucleotides encoding variants of T7 RNA polymerase). In some embodiments, the host cells are prokaryotic or eukaryotic cells transformed or transfected with vectors constructed using recombinant DNA methods known in the art.
[77] Термин "аналог", когда его используют в отношении полипептида, означает полипептид, обладающий более чем 70% идентичностью последовательности, но менее чем 100% идентичностью последовательности (например, более чем 75%, 78%, 80%, 83%, 85%, 88%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% идентичностью последовательности) с эталонным полипептидом. В некоторых вариантах осуществления аналог означает полипептиды, которые содержат один или более не встречающихся в природе аминокислотных остатков, включая, но не ограничиваясь ими, гомоаргинин, орнитин и норвалин, а также встречающиеся в природе аминокислоты. В некоторых вариантах осуществления аналог также включает один или более остатков D-аминокислот и непептидных связей между двумя или более аминокислотными остатками. [77] The term "analogue", when used in relation to a polypeptide, means a polypeptide having more than 70% sequence identity, but less than 100% sequence identity (for example, more than 75%, 78%, 80%, 83%, 85%, 88%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% sequence identity) with the reference polypeptide. In some embodiments, analogue means polypeptides that contain one or more non-naturally occurring amino acid residues, including, but not limited to, homoarginine, ornithine, and norvaline, as well as naturally occurring amino acids. In some embodiments, the analog also includes one or more D-amino acid residues and non-peptide bonds between two or more amino acid residues.
[78] Термин "эффективное количество" означает количество, достаточное для достижения желаемого результата. Специалист в данной области может определить эффективное количество с использованием стандартного экспериментирования. [78] The term "effective amount" means an amount sufficient to achieve the desired result. One of skill in the art can determine the effective amount using standard experimentation.
[79] Термины "выделенный" и "очищенный" используют для обозначения молекулы (например, выделенная нуклеиновая кислота, полипептид и т.д.) или другого компонента, который отделен от по меньшей мере одного другого компонента, с которым он ассоциирован в природе. Термин "очищенный" не требует абсолютной чистоты, скорее он предполагает относительное определение. [79] The terms "isolated" and "purified" are used to refer to a molecule (eg, isolated nucleic acid, polypeptide, etc.) or other component that is separated from at least one other component with which it is naturally associated. The term "purified" does not require absolute purity, rather it suggests a relative definition.
[80] Как используют в рамках изобретения, "композиция" и "состав" охватывают продукты, содержащие по меньшей мере одну сконструированную РНК-полимеразу T7 по настоящему изобретению, предназначенную для любого подходящего применения (например, научная деятельность, диагностика и т.д.). [80] As used herein, "composition" and "formulation" encompass products containing at least one engineered T7 RNA polymerase of the present invention for any suitable application (e.g., science, diagnostics, etc.). ).
[81] Термин "транскрипция" используют для обозначения процесса, в котором часть ДНК-матрицы копируется в РНК под действием фермента РНК-полимеразы. [81] The term "transcription" is used to refer to the process in which a portion of the DNA template is copied into RNA by the action of the enzyme RNA polymerase.
[82] Термин "ДНК-матрица" используют для обозначения двухцепочечной или одноцепочечной молекулы ДНК, включающей промоторную последовательность и последовательность, кодирующую РНК-продукт транскрипции. [82] The term "DNA template" is used to refer to a double-stranded or single-stranded DNA molecule comprising a promoter sequence and a sequence encoding an RNA transcript product.
[83] Термин "промотор" используют для обозначения последовательности ДНК, которая распознается РНК-полимеразой в качестве участка начала транскрипции. Промотор привлекает РНК-полимеразу и в случае РНК-полимеразы T7 определяет участок начала транскрипции. [83] The term "promoter" is used to refer to a DNA sequence that is recognized by RNA polymerase as the site of the start of transcription. The promoter attracts RNA polymerase and, in the case of T7 RNA polymerase, determines the transcription start site.
[84] Термин "РНК-полимераза" используют для обозначения ДНК-направленной РНК-полимеразы, которая копирует ДНК-матрицу в РНК-полинуклеотид, путем пошагового включения нуклеотидтрифосфатов в растущий полимер РНК. [84] The term "RNA polymerase" is used to refer to a DNA-directed RNA polymerase that copies a DNA template into an RNA polynucleotide by stepwise incorporation of nucleotide triphosphates into the growing RNA polymer.
[85] Термины "матричная РНК" и "мРНК" используют для обозначения молекул РНК, которые кодируют белок. Этот белок декодируется в ходе трансляции. [85] The terms "messenger RNA" and "mRNA" are used to refer to RNA molecules that encode a protein. This protein is decoded during translation.
[86] Термины "7-метилгуанозиновый кэп", "7meG", "кэп five-prime" и "5'-кэп" используют в отношении определенной модифицированной нуклеотидной структуры, присутствующей на 5'-конце эукариотических мРНК. Структура 7-метилгуанозинового кэпа связывается через 5'-5'-трифосфатную связь с первым нуклеотидом в мРНК. In vivo эта структура кэпа присоединяется к 5'-концу образующейся мРНК посредством последовательной активности множества ферментов. In vitro кэп может быть включен прямо при начале транскрипции РНК-полимеразой с использованием аналога кэпа. [86] The terms "7-methylguanosine cap", "7meG", "five-prime cap" and "5'-cap" are used in relation to a specific modified nucleotide structure present at the 5' end of eukaryotic mRNAs. The structure of the 7-methylguanosine cap is linked via a 5'-5'-triphosphate bond to the first nucleotide in the mRNA. In vivo , this cap structure is attached to the 5' end of the nascent mRNA through the sequential activity of multiple enzymes. In vitro , the cap can be turned on directly at the start of transcription by RNA polymerase using a cap analog.
[87] Термин "аналог кэпа" относится к динуклеотиду, содержащему 5'-5' ди-, три- или тетра-фосфатную связь. Один конец динуклеотида терминируется либо остатком гуанозина, либо остатком замещенного гуанозина; именно с этой формы конца РНК-полимераза будет инициировать транскрипцию путем удлинения от 3'-гидроксила. Другой конец динуклеотида представляет собой гуанозин, который имитирует структуру эукариотического кэпа и, как правило, имеет замещение 7-метилом, 7-бензилом или 7-этилом и/или замещение 7-аминометилом или 7-аминоэтилом. В некоторых случаях этот нуклеотид также является метоксизамещенным на 3'-гидроксильной группе для предупреждения инициации транскрипции с конца кэпа молекулы. [87] The term "cap analog" refers to a dinucleotide containing a 5'-5' di-, tri-, or tetra-phosphate bond. One end of the dinucleotide is terminated by either a guanosine residue or a substituted guanosine residue; it is from this end shape that RNA polymerase will initiate transcription by extending from the 3'-hydroxyl. The other end of the dinucleotide is a guanosine which mimics the structure of a eukaryotic cap and typically has a 7-methyl, 7-benzyl or 7-ethyl substitution and/or a 7-aminomethyl or 7-aminoethyl substitution. In some cases, this nucleotide is also methoxy-substituted on the 3'-hydroxyl group to prevent transcription initiation from the end of the cap of the molecule.
[88] Термины "ARCA" и "антиреверсный аналог кэпа" относятся к химически модифицированным формам аналогов кэпа, предназначенным для максимизации эффективной трансляции in vitro путем обеспечения надлежащего включения аналога кэпа в транскрипт в правильной ориентации. Эти аналоги применимы для усиления трансляции. В некоторых вариантах осуществления применимы ARCA, известные в данной области (например, Peng et al., Org. Lett., 4:161-164 [2002]). [88] The terms "ARCA" and "anti-reverse cap analog" refer to chemically modified forms of cap analogs designed to maximize efficient translation in vitro by ensuring that the cap analog is properly incorporated into the transcript in the correct orientation. These analogs are applicable to enhance translation. In some embodiments, ARCAs known in the art are applicable (eg, Peng et al., Org. Lett., 4:161-164 [2002]).
[89] Термин "рибопереключатель" используют для обозначения аутокаталитического РНК-фермента, который расщепляет сам себя или другую РНК в присутствии лиганда. [89] The term "riboswitch" is used to refer to an autocatalytic RNA enzyme that cleaves itself or another RNA in the presence of a ligand.
[90] Термин "точность" используют для обозначения безошибочности РНК-полимеразы при транскрибировании или копировании ДНК-матрицы в РНК-полинуклеотид. Неточная транскрипция может приводить к однонуклеотидным полиморфизмам (SNP) или инсерциям-делециям. [90] The term "accuracy" is used to refer to the infallibility of an RNA polymerase when transcribing or copying a DNA template into an RNA polynucleotide. Inaccurate transcription can lead to single nucleotide polymorphisms (SNPs) or insertions and deletions.
[91] Термины "однонуклеотидный полиморфизм" или "SNP" относятся к изменению нуклеотида, присутствующего в единичном положении полинуклеотида. В контексте транскрипции SNP могут быть результатом неправильного включения некомплементарного рибонуклеотида (A, C, G или U) РНК-полимеразой в некотором положении на ДНК-матрице. [91] The terms "single nucleotide polymorphism" or "SNP" refer to a change in the nucleotide present at a single position of a polynucleotide. In the context of transcription, SNPs may be the result of misincorporation of a non-complementary ribonucleotide (A, C, G, or U) by RNA polymerase at some position on the DNA template.
[92] Термин "инсерция-делеция" используют для обозначения инсерции или делеции одного или более полинуклеотидов. В контексте транскрипции РНК-полимеразой ошибки инсерций-делеций могут возникать в результате присоединения одного или более дополнительных рибонуклеотидов или не включения одного или более нуклеотидов в некотором положении на ДНК-матрице. [92] The term "insertion-deletion" is used to refer to the insertion or deletion of one or more polynucleotides. In the context of transcription by RNA polymerase, insertion-deletion errors can result from the addition of one or more additional ribonucleotides or from the omission of one or more nucleotides at a position on the DNA template.
[93] Термин "селективность" используют для обозначения признака наличия у фермента более высокой активности против одного субстрата по сравнению с другим субстратом в ходе катализируемой реакции. В контексте котранскрипционного кэпирования РНК-полимераза может иметь высокую или низкую селективность в отношении аналога кэпа относительно GTP. [93] The term "selectivity" is used to denote a sign that an enzyme has higher activity against one substrate compared to another substrate during the catalyzed reaction. In the context of co-transcriptional capping, an RNA polymerase may have high or low selectivity for the cap analog over GTP.
[94] Термин "неорганическая пирофосфатаза" используют для обозначения фермента, который деградирует неорганический пирофосфат в ортофосфат. [94] The term "inorganic pyrophosphatase" is used to refer to an enzyme that degrades inorganic pyrophosphate to orthophosphate.
Активность сконструированной РНК-полимеразы T7:Activity of engineered T7 RNA polymerase:
[95] В некоторых вариантах осуществления сконструированная РНК-полимераза T7, которая демонстрирует усовершенствованное свойство, обладает по меньшей мере приблизительно 85%, по меньшей мере приблизительно 88%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или приблизительно 100% идентичностью аминокислотной последовательности с SEQ ID NO: 4 и/или 15, и различием аминокислотных остатков по сравнению с SEQ ID NO: 4 и/или 15, в одном или более положениях аминокислот (как например, в 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 20 или более положениях аминокислот по сравнению с SEQ ID NO: 4 и/или 15, или последовательностью, обладающей по меньшей мере 85%, по меньшей мере 88%, по меньшей мере 90%, по меньшей мере 91%, по меньшей мере 92%, по меньшей мере 93%, по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98%, по меньшей мере 99% или более идентичностью аминокислотной последовательности с SEQ ID NO: 4 и/или 15). В некоторых вариантах осуществления различие остатков по сравнению с SEQ ID NO: 4 в одном или более положениях включает по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более консервативных аминокислотных замен. В некоторых вариантах осуществления сконструированный полипептид РНК-полимеразы T7 представляет собой полипептид, приведенный в таблице 5.3, 5.5 и/или 5.6. В некоторых вариантах осуществления сконструированный полипептид РНК-полимеразы T7 выбран из SEQ ID NO: 4, 15, 17, 19, 21, 23, 25, 27, 29, 32, 33, 35, 37 и/или 39. В некоторых вариантах осуществления различие остатков по сравнению с SEQ ID NO: 15 в одном или более положениях может включать по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более консервативных аминокислотных замен. В некоторых вариантах осуществления сконструированный полипептид РНК-полимеразы T7 представляет собой полипептид, приведенный в таблице 5.4. В некоторых вариантах осуществления сконструированный полипептид РНК-полимеразы T7 выбран из SEQ ID NO: 4, 15, 17, 19, 21, 23, 25, 27, 29, 32, 33, 35, 37 и/или 39. [95] In some embodiments, the engineered T7 RNA polymerase that exhibits the improved property has at least about 85%, at least about 88%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99% or approximately 100% amino acid sequence identity with SEQ ID NO: 4 and/or 15, and amino acid residue difference compared to SEQ ID NO: 4 and/or 15, at one or more amino acid positions (such as 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 20 or more amino acid positions compared to SEQ ID NO: 4 and/or 15, or a sequence having at least at least 85%, at least 88%, at least 90%, at least 91%, at least 92%, at least 93%, at least 94%, at least 95%, at least 96 %, at least 97%, at least 98%, at least 99% or more amino acid sequence identity with SEQ ID NO: 4 and/or 15). In some embodiments, the residue difference from SEQ ID NO: 4 at one or more positions includes at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 or more conservative amino acid substitutions. In some embodiments, the engineered T7 RNA polymerase polypeptide is the polypeptide shown in Table 5.3, 5.5 and/or 5.6. In some embodiments, the engineered T7 RNA polymerase polypeptide is selected from SEQ ID NOs: 4, 15, 17, 19, 21, 23, 25, 27, 29, 32, 33, 35, 37, and/or 39. In some embodiments, residue differences from SEQ ID NO: 15 at one or more positions may include at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 or more conservative amino acid substitutions. In some embodiments, the engineered T7 RNA polymerase polypeptide is the polypeptide shown in Table 5.4. In some embodiments, the engineered T7 RNA polymerase polypeptide is selected from SEQ ID NOs: 4, 15, 17, 19, 21, 23, 25, 27, 29, 32, 33, 35, 37, and/or 39.
[96] В некоторых вариантах осуществления сконструированный полипептид РНК-полимеразы T7 включает функциональный фрагмент сконструированного полипептида РНК-полимеразы T7, охватываемый изобретением. Функциональные фрагменты обладают по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99% активности сконструированного полипептида РНК-полимеразы T7, из которого они происходят (т.е. исходной сконструированной РНК-полимеразы T7). Функциональный фрагмент содержит по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% и даже 99% исходной последовательности сконструированной РНК-полимеразы T7. В некоторых вариантах осуществления функциональный фрагмент укорочен менее чем на 5, менее чем на 10, менее чем на 15, менее чем на 10, менее чем на 25, менее чем на 30, менее чем на 35, менее чем на 40, менее чем на 45 и менее чем на 50 аминокислот. [96] In some embodiments, the engineered T7 RNA polymerase polypeptide comprises a functional fragment of the engineered T7 RNA polymerase polypeptide encompassed by the invention. Functional fragments possess at least 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94% , 95%, 96%, 97%, 98%, or 99% of the activity of the engineered T7 RNA polymerase polypeptide from which they are derived (i.e., the original engineered T7 RNA polymerase). The functional fragment contains at least 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94% , 95%, 96%, 97%, 98% and even 99% of the original sequence of the engineered T7 RNA polymerase. In some embodiments, the functional fragment is shortened by less than 5, less than 10, less than 15, less than 10, less than 25, less than 30, less than 35, less than 40, less than 45 and less than 50 amino acids.
Полинуклеотиды, кодирующие сконструированные полипептиды, экспрессирующие векторы и клетки-хозяева:Polynucleotides encoding engineered polypeptides, expression vectors and host cells:
[97] Настоящее изобретение относится к полинуклеотидам, кодирующим сконструированные полипептиды РНК-полимеразы T7, описанные в настоящем описании. В некоторых вариантах осуществления полинуклеотиды функционально связаны с одной или более гетерологичными регуляторными последовательностями, которые контролируют экспрессию генов, с образованием рекомбинантного полинуклеотида, способного экспрессировать полипептид. Экспрессирующие конструкции, содержащие гетерологичный полинуклеотид, кодирующий сконструированные полипептиды РНК-полимеразы T7, можно вводить в соответствующие клетки-хозяева для экспрессии соответствующего полипептида РНК-полимеразы T7. [97] The present invention provides polynucleotides encoding the engineered T7 RNA polymerase polypeptides described herein. In some embodiments, the polynucleotides are operably linked to one or more heterologous regulatory sequences that control gene expression to form a recombinant polynucleotide capable of expressing the polypeptide. Expression constructs containing a heterologous polynucleotide encoding the engineered T7 RNA polymerase polypeptides can be introduced into appropriate host cells to express the corresponding T7 RNA polymerase polypeptide.
[98] Как будет понятно специалисту в данной области, доступность белковой последовательности и знание кодонов, соответствующих различным аминокислотам, обеспечивают описание всех полинуклеотидов, способных кодировать рассматриваемые полипептиды. Вырожденность генетического когда, где одни и те же аминокислоты кодируются альтернативными или синонимическими кодонами, позволяет получение чрезвычайно большого количества нуклеиновых кислот, все из которых кодируют сконструированный полипептид РНК-полимеразы T7. Таким образом, зная конкретную аминокислотную последовательность, специалисты в данной области могут получить любое количество различных нуклеиновых кислот, просто модифицируя последовательность одного или более кодонов так, чтобы аминокислотная последовательность белка не изменялась. В этом отношении настоящее изобретение конкретно предусматривает каждый возможный вариант полинуклеотидов, который может быть сконструирован так, чтобы он кодировал полипептиды, описанные в настоящем описании, посредством выбора комбинаций на основе выбора возможных кодонов, и все такие варианты считаются конкретно раскрытыми для любого полипептида, описанного в настоящем описании, включая варианты, приведенные в таблицах 5.3, 5.4, 5.5 и/или 5.6. [98] As will be appreciated by one of skill in the art, the availability of the protein sequence and knowledge of the codons corresponding to the various amino acids provide a description of all polynucleotides capable of encoding the polypeptides in question. The degeneracy of the genetic when, where the same amino acids are encoded by alternative or synonymous codons, allows the production of an extremely large number of nucleic acids, all of which encode the engineered T7 RNA polymerase polypeptide. Thus, knowing a particular amino acid sequence, those skilled in the art can make any number of different nucleic acids simply by modifying the sequence of one or more codons so that the amino acid sequence of the protein does not change. In this regard, the present invention specifically contemplates each possible polynucleotide variant that can be engineered to encode the polypeptides described herein by selecting combinations based on the choice of possible codons, and all such variants are considered to be specifically disclosed for any polypeptide described in this description, including the options given in tables 5.3, 5.4, 5.5 and/or 5.6.
[99] В различных вариантах осуществления кодоны предпочтительно выбирают так, чтобы они были подходящими для клетки-хозяина, в которой будет продуцироваться белок. Например, для экспрессии в бактериях используют предпочтительные кодоны, используемые бактериями. Следовательно, кодон-оптимизированные полинуклеотиды, кодирующие сконструированные полипептиды РНК-полимеразы T7, содержат предпочтительные кодоны в приблизительно 40%, 50%, 60%, 70%, 80% или более 90% положений кодонов полноразмерной кодирующей области. [99] In various embodiments, the codons are preferably chosen to be suitable for the host cell in which the protein will be produced. For example, for expression in bacteria, the preferred codons used by the bacteria are used. Therefore, codon-optimized polynucleotides encoding engineered T7 RNA polymerase polypeptides contain preferred codons at about 40%, 50%, 60%, 70%, 80%, or more than 90% of the codon positions of the full length coding region.
[100] В некоторых вариантах осуществления, как описано выше, полинуклеотид кодирует сконструированный полипептид, обладающий активностью РНК-полимеразы T7, со свойствами, описанными в настоящем описании, где полипептид содержит аминокислотную последовательность, обладающую по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более идентичностью с эталонной последовательностью, выбранной из SEQ ID NO: 4 и 15, или аминокислотную последовательность любого варианта, как описано в таблицах 5.3, 5.4., 5.5 и/или 5.6, и одно или более различий остатков по сравнению с эталонным полипептидом SEQ ID NO: 17, 19, 21, 23, 25, 27, 29, 32, 33, 35, 37 и/или 39, или аминокислотную последовательность любого варианта, как описано в таблицах 5.3, 5.4, 5.5 и/или 5.6 (например 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более положений аминокислотных остатков). В некоторых вариантах осуществления эталонная последовательность выбрана из SEQ ID NO: 4 и/или 15. В некоторых вариантах осуществления полинуклеотид кодирует сконструированный полипептид, обладающий активностью РНК-полимеразы T7, со свойствами, описанными в настоящем описании, где полипептид содержит аминокислотную последовательность, обладающую по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более идентичностью последовательности с эталонной последовательностью SEQ ID NO: 4 и/или 15, и одно или более отличий остатков по сравнению с SEQ ID NO: 4 и/или 15 в положениях остатков, выбранных из положений остатков, приведенных в таблицах 5.3, 5.4, 5.5 и/или 5.6 при оптимальном выравнивании с полипептидом SEQ ID NO: 4 и/или 15. [100] In some embodiments, as described above, the polynucleotide encodes an engineered polypeptide having T7 RNA polymerase activity with the properties described herein, wherein the polypeptide contains an amino acid sequence having at least 80%, 81%, 82% , 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99 % or more identity with a reference sequence selected from SEQ ID NOs: 4 and 15, or an amino acid sequence of any variant as described in Tables 5.3, 5.4., 5.5 and/or 5.6, and one or more residue differences compared to the reference polypeptide SEQ ID NOs: 17, 19, 21, 23, 25, 27, 29, 32, 33, 35, 37 and/or 39, or the amino acid sequence of any variant as described in Tables 5.3, 5.4, 5.5 and/or 5.6 ( eg 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 or more amino acid residue positions). In some embodiments, the reference sequence is selected from SEQ ID NO: 4 and/or 15. In some embodiments, the polynucleotide encodes an engineered polypeptide having T7 RNA polymerase activity with the properties described herein, wherein the polypeptide contains an amino acid sequence having at least 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% or more sequence identity with the reference sequence of SEQ ID NO: 4 and/or 15, and one or more residue differences compared to SEQ ID NO: 4 and/or 15 in residue positions, selected from the positions of the residues shown in tables 5.3, 5.4, 5.5 and/or 5.6 in optimal alignment with the polypeptide of SEQ ID NO: 4 and/or 15.
[101] В некоторых вариантах осуществления полинуклеотид, кодирующий сконструированные полипептиды РНК-полимеразы T7, содержит полинуклеотидную последовательность, выбранную из полинуклеотидной последовательности, кодирующей SEQ ID NO: 4, 15, 17, 19, 21, 23, 25, 27, 29, 32, 33, 35, 37 и 39. В некоторых вариантах осуществления полинуклеотид, кодирующий сконструированный полипептид РНК-полимеразы T7, обладает по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 93%, 95%, 96%, 97%, 98%, 99% идентичностью нуклеотидных остатков с SEQ ID NO: 3, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36 и 38. В некоторых вариантах осуществления полинуклеотид, кодирующий сконструированные полипептиды РНК-полимеразы T7, содержит полинуклеотидную последовательность, выбранную из SEQ ID NO: 3, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36 и 38. [101] In some embodiments, the polynucleotide encoding the engineered T7 RNA polymerase polypeptides comprises a polynucleotide sequence selected from the polynucleotide sequence encoding SEQ ID NOs: 4, 15, 17, 19, 21, 23, 25, 27, 29, 32 , 33, 35, 37, and 39. In some embodiments, the polynucleotide encoding the engineered T7 RNA polymerase polypeptide has at least 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87% , 88%, 89%, 90%, 93%, 95%, 96%, 97%, 98%, 99% identical nucleotide residues with SEQ ID NO: 3, 14, 16, 18, 20, 22, 24, 26 , 28, 30, 32, 34, 36, and 38. In some embodiments, the polynucleotide encoding the engineered T7 RNA polymerase polypeptides comprises a polynucleotide sequence selected from SEQ ID NOs: 3, 14, 16, 18, 20, 22, 24 , 26, 28, 30, 32, 34, 36 and 38.
[102] В некоторых вариантах осуществления полинуклеотиды способные гибридизоваться в условиях высокой жесткости с эталонной полинуклеотидной последовательностью, выбранной из SEQ ID NO: 3 и/или 14, или комплементарной ей последовательностью, или полинуклеотидной последовательностью, кодирующей любой из вариантов полипептидов РНК-полимеразы T7, описанных в настоящем описании. В некоторых вариантах осуществления полинуклеотид, способный гибридизоваться в условиях высокой жесткости, кодирует полипептид РНК-полимеразы T7, содержащий аминокислотную последовательность, которая обладает одним или более различиями остатков по сравнению с SEQ ID NO: 4 и/или 15 в положениях остатков, выбранных из любых положений, как указано в таблице 5.3, 5.4, 5.5 и/или 5.6. [102] In some embodiments, polynucleotides capable of hybridizing under high stringency conditions to a reference polynucleotide sequence selected from SEQ ID NO: 3 and/or 14, or its complementary sequence, or a polynucleotide sequence encoding any of the T7 RNA polymerase polypeptide variants, described in the present description. In some embodiments, a polynucleotide capable of hybridizing under high stringency conditions encodes a T7 RNA polymerase polypeptide comprising an amino acid sequence that has one or more residue differences from SEQ ID NO: 4 and/or 15 at residue positions selected from any provisions as indicated in Table 5.3, 5.4, 5.5 and/or 5.6.
[103] В некоторых вариантах осуществления выделенный полинуклеотид, кодирующий любой из сконструированных полипептидов РНК-полимеразы T7, описанных в настоящем описании, подвергают различным манипуляциям для обеспечения экспрессии полипептида. В некоторых вариантах осуществления полинуклеотиды, кодирующие полипептиды, предоставляют в качестве экспрессирующих векторов, в которых присутствует одна или более последовательностей контроля для регуляции экспрессии полинуклеотидов и/или полипептидов. Манипулирование выделенным полинуклеотидом перед его встраиванием в вектор может быть желательным или необходимым в зависимости от экспрессирующего вектора. Способы модификации полинуклеотидов и последовательностей нуклеиновых кислот с использованием способов рекомбинантных ДНК хорошо известны в данной области. [103] In some embodiments, an isolated polynucleotide encoding any of the engineered T7 RNA polymerase polypeptides described herein is subjected to various manipulations to allow expression of the polypeptide. In some embodiments, polynucleotides encoding polypeptides are provided as expression vectors in which one or more control sequences are present to regulate expression of the polynucleotides and/or polypeptides. Manipulation of the isolated polynucleotide prior to insertion into the vector may be desirable or necessary, depending on the expression vector. Methods for modifying polynucleotides and nucleic acid sequences using recombinant DNA techniques are well known in the art.
[104] В некоторых вариантах осуществления последовательности контроля включают, среди прочих последовательностей, промоторы, лидерные последовательности, последовательности полиаденилирования, последовательности пропептидов, последовательности сигнальных пептидов и терминаторы транскрипции. Как известно в данной области, подходящие промоторы могут быть выбраны, исходя из используемых клеток-хозяев. Иллюстративные промоторы для клеток-хозяев в виде нитчатых грибов включают промоторы, полученные из генов для амилазы TAKA Aspergillus oryzae, аспарагиновой протеазы Rhizomucor miehei, нейтральной альфа-амилазы Aspergillus niger, устойчивой к кислотам альфа-амилазы Aspergillus niger, глюкоамилазы Aspergillus niger или Aspergillus awamori (glaA), липазы Rhizomucor miehei, щелочной протеазы Aspergillus oryzae, триозофосфатизомеразы Aspergillus oryzae, ацетамидазы Aspergillus nidulans и трипсин-подобной протеазы Fusarium oxysporum (см., например, WO 96/00787), а также промотор NA2-tpi (гибрид промоторов из генов нейтральной альфа-амилазы Aspergillus niger и триозофосфатизомеразы Aspergillus oryzae), и их мутантных, укороченных и гибридных промоторов. Иллюстративные промоторы дрожжевых клеток могут представлять собой промоторы из генов энолазы Saccharomyces cerevisiae (ENO-1), галактокиназы Saccharomyces cerevisiae (GAL1), алкогольдегидрогеназы/глицеральдегид-3-фосфатдегидрогеназы Saccharomyces cerevisiae (ADH2/GAP) и 3-фосфоглицераткиназы Saccharomyces cerevisiae. В данной области известны другие пригодные промоторы для дрожжевых клеток (см., например, Romanos et al., Yeast 8:423-488 [1992]). Иллюстративные промоторы для применения в клетках млекопитающих включают, но не ограничиваются ими, промоторы из цитомегаловируса (CMV), вакуолизирующего вируса обезьян 40 (SV40), из фосфоглицераткиназы Homo sapiens, бета-актина, фактора элонгации 1a или глицеральдегид-3-фосфатдегидрогеназы, или из β-актина Gallus gallus. [104]In some embodiments, control sequences include, among other sequences, promoters, leader sequences, polyadenylation sequences, propeptide sequences, signal peptide sequences, and transcription terminators. As is known in the art, suitable promoters can be selected based on the host cells used. Exemplary promoters for filamentous fungal host cells include promoters derived from genes for TAKA amylase.Aspergillus oryzae, aspartic proteaseRhizomucor miehei, neutral alpha-amylaseAspergillus niger, acid-resistant alpha-amylaseAspergillus niger, glucoamylaseAspergillus niger orAspergillus awamori (glaA), lipasesRhizomucor miehei, alkaline proteaseAspergillus oryzae, triose phosphate isomeraseAspergillus oryzae, acetamidaseAspergillus nidulans and trypsin-like proteaseFusarium oxysporum (see, for example, WO 96/00787), as well as the NA2-tpi promoter (a hybrid of promoters from the neutral alpha-amylase genesAspergillus niger and triose phosphate isomeraseAspergillus oryzae), and their mutant, truncated and hybrid promoters. Exemplary yeast cell promoters may be promoters from enolase genes.Saccharomyces cerevisiae (ENO-1), galactokinaseSaccharomyces cerevisiae (GAL1), alcohol dehydrogenase/glyceraldehyde-3-phosphate dehydrogenaseSaccharomyces cerevisiae (ADH2/GAP) and 3-phosphoglycerate kinaseSaccharomyces cerevisiae. Other suitable promoters for yeast cells are known in the art (see, for example, Romanos et al., Yeast 8:423-488 [1992]). Exemplary promoters for use in mammalian cells include, but are not limited to, promoters from cytomegalovirus (CMV), simian vacuolating virus 40 (SV40), from phosphoglycerate kinaseHomo sapiens, beta-actin, elongation factor 1a or glyceraldehyde-3-phosphate dehydrogenase, or from β-actinGallus gallus.
[105] В некоторых вариантах осуществления последовательность контроля представляет собой подходящую последовательность терминатора транскрипции - последовательность, распознаваемую клеткой-хозяином для терминации транскрипции. Последовательность терминатора функционально связана с 3'-концом последовательности нуклеиновой кислоты, кодирующей полипептид. В рамках настоящего изобретения применим любой терминатор, который является функциональным в клетке-хозяине. Например, иллюстративные терминаторы транскрипции для клеток-хозяев в виде нитчатых грибов могут быть получены из генов амилазы TAKA Aspergillus oryzae, глюкоамилазы Aspergillus niger, антранилатсинтазы Aspergillus nidulans, альфа-глюкозидазы Aspergillus niger и трипсин-подобной протеазы Fusarium oxysporum. Иллюстративные терминаторы для дрожжевых клеток-хозяев могут быть получены из генов энолазы Saccharomyces cerevisiae, цитохрома С Saccharomyces cerevisiae (CYC1) и глицеральдегид-3-фосфатдегидрогеназы Saccharomyces cerevisiae. Другие пригодные терминаторы для дрожжевых клеток-хозяев известны в данной области (см., например, Romanos et al., выше). Иллюстративные терминаторы для клеток млекопитающих включают, но не ограничиваются ими, терминаторы из цитомегаловируса (CMV), вакуолизирующего вируса обезьян 40 (SV40) или из гормона роста Homo sapiens. [105] In some embodiments, the control sequence is a suitable transcription terminator sequence, a sequence recognized by the host cell to terminate transcription. The terminator sequence is operably linked to the 3' end of the nucleic acid sequence encoding the polypeptide. Any terminator that is functional in the host cell is applicable within the scope of the present invention. For example, exemplary transcription terminators for filamentous fungal host cells can be derived from the genes for Aspergillus oryzae TAKA amylase, Aspergillus niger glucoamylase, Aspergillus nidulans anthranilate synthase, Aspergillus niger alpha-glucosidase, and Fusarium oxysporum trypsin-like protease. Exemplary yeast host cell terminators can be derived from the Saccharomyces cerevisiae enolase, Saccharomyces cerevisiae cytochrome C (CYC1) and Saccharomyces cerevisiae glyceraldehyde-3-phosphate dehydrogenase genes. Other suitable terminators for yeast host cells are known in the art (see, for example, Romanos et al., supra). Illustrative terminators for mammalian cells include, but are not limited to, terminators from cytomegalovirus (CMV), simian vacuolating virus 40 (SV40), or from Homo sapiens growth hormone.
[106] В некоторых вариантах осуществления последовательность контроля представляет собой подходящую лидерную последовательность - нетранслируемую область мРНК, которая важна для трансляции клеткой-хозяином. Лидерная последовательность функционально связана с 5'-концом последовательности нуклеиновой кислоты, кодирующей полипептид. Можно использовать любую лидерную последовательность, которая функциональна в выбранной клетке-хозяине. Иллюстративные лидерные последовательности для клеток-хозяев в виде нитчатых грибов получают из генов амилазы TAKA Aspergillus oryzae и триозофосфатизомеразы Aspergillus nidulans. Подходящие лидерные последовательности для дрожжевых клеток-хозяев включают, но не ограничиваются ими, лидерные последовательности, полученные из генов энолазы Saccharomyces cerevisiae (ENO-1), 3-фосфоглицераткиназы Saccharomyces cerevisiae, альфа-фактора Saccharomyces cerevisiae и алкогольдегидрогеназы/глицеральдегид-3-фосфатдегидрогеназа Saccharomyces cerevisiae (ADH2/GAP). [106] In some embodiments, the control sequence is a suitable leader sequence, an untranslated region of mRNA that is important for translation by the host cell. The leader sequence is operably linked to the 5' end of the nucleic acid sequence encoding the polypeptide. You can use any leader sequence that is functional in the selected host cell. Exemplary leader sequences for filamentous fungal host cells are derived from the Aspergillus oryzae TAKA amylase and Aspergillus nidulans triose phosphate isomerase genes. Suitable leader sequences for yeast host cells include, but are not limited to, leader sequences derived from Saccharomyces cerevisiae enolase (ENO-1), Saccharomyces cerevisiae 3-phosphoglycerate kinase, Saccharomyces cerevisiae alpha-factor, and Saccharomyces alcohol dehydrogenase/glyceraldehyde-3-phosphate dehydrogenase genes . cerevisiae (ADH2/GAP).
[107] Последовательность контроля также может представлять собой последовательность полиаденилирования - последовательность, функционально связанную с 3'-концом последовательности нуклеиновой кислоты и которая при транскрипции распознается клеткой-хозяином в качестве сигнала для присоединения остатков полиаденозина к транскрибируемой мРНК. В рамках настоящего изобретения можно использовать любую последовательность полиаденилирования, которая является функциональной в выбранной клетке-хозяине. Иллюстративные последовательности полиаденилирования для клеток-хозяев в виде нитчатых грибов включают, но не ограничиваются ими, последовательности полиаденилирования из генов амилазы TAKA Aspergillus oryzae, глюкоамилазы Aspergillus niger, антранилатсинтазы Aspergillus nidulans, трипсин-подобной протеазы Fusarium oxysporum и альфа-глюкозидазы Aspergillus niger. Пригодные последовательности полиаденилирования для дрожжевых клеток-хозяев также известны в данной области (см., например, Guo and Sherman, Mol. Cell. Bio., 15:5983-5990 [1995]). [107] The control sequence can also be a polyadenylation sequence - a sequence operably linked to the 3' end of the nucleic acid sequence and which upon transcription is recognized by the host cell as a signal for the attachment of polyadenosine residues to the transcribed mRNA. Any polyadenylation sequence that is functional in the selected host cell can be used within the scope of the present invention. Exemplary polyadenylation sequences for filamentous fungal host cells include, but are not limited to, polyadenylation sequences from the Aspergillus oryzae TAKA amylase, Aspergillus niger glucoamylase, Aspergillus nidulans anthranilate synthase, Fusarium oxysporum trypsin-like protease, and Aspergillus niger alpha-glucosidase genes. . Suitable polyadenylation sequences for yeast host cells are also known in the art (see, for example, Guo and Sherman, Mol. Cell. Bio., 15:5983-5990 [1995]).
[108] В некоторых вариантах осуществления последовательность контроля представляет собой кодирующую область сигнального пептида, которая кодирует аминокислотную последовательность, связанную с N-концом полипептида, и направляет кодируемый полипептид на секреторный путь клетки. 5'-конец кодирующей последовательности в последовательности нуклеиновой кислоты может по своей природе содержать область, кодирующую сигнальный пептид, естественным образом связанную в рамке считывания с сегментом кодирующей области, который кодирует секретируемый полипептид. Альтернативно 5'-конец кодирующей последовательности может содержать кодирующую область сигнального пептида, которая является чужеродной для кодирующей последовательности. Любая кодирующая область сигнального пептида, который направляет экспрессируемый полипептид на секреторный путь выбранной клетки-хозяина, является применимой для экспрессии сконструированных полипептидов РНК-полимеразы T7, описанных в настоящем описании. Эффективные кодирующие области сигнальных пептидов для клеток-хозяев в виде нитчатых дрожжей включают, но не ограничиваются ими, кодирующие области сигнальных пептидов, получаемые из генов амилазы TAKA Aspergillus oryzae, нейтральной амилазы Aspergillus niger, глюкоамилазы Aspergillus niger, аспарагиновой протеазы Rhizomucor miehei, целлюлазы Humicola insolens и липазы Humicola lanuginosa. Пригодные сигнальные пептиды для дрожжевых клеток-хозяев включают, но не ограничиваются ими, клетки-хозяева из генов альфа-фактора Saccharomyces cerevisiae и инвертазы Saccharomyces cerevisiae. Пригодные сигнальные пептиды для клеток-хозяев млекопитающих включают, но не ограничиваются ими, сигнальные пептиды из генов для иммуноглобулина-гамма (IgG). [108] In some embodiments, the control sequence is a signal peptide coding region that encodes the amino acid sequence associated with the N-terminus of the polypeptide and directs the encoded polypeptide to the secretory pathway of the cell. The 5' end of a coding sequence in a nucleic acid sequence may inherently contain a signal peptide coding region naturally linked in frame to a segment of the coding region that encodes a secreted polypeptide. Alternatively, the 5' end of the coding sequence may contain a signal peptide coding region that is foreign to the coding sequence. Any signal peptide coding region that directs the expressed polypeptide to the secretory pathway of the selected host cell is useful for expressing the engineered T7 RNA polymerase polypeptides described herein. Effective signal peptide coding regions for filamentous yeast host cells include, but are not limited to, signal peptide coding regions derived from Aspergillus oryzae TAKA amylase, Aspergillus niger neutral amylase, Aspergillus niger glucoamylase, Rhizomucor miehei aspartic protease, Humicola insolens cellulase genes. and Humicola lanuginosa lipase. Suitable signal peptides for yeast host cells include, but are not limited to, host cells from the Saccharomyces cerevisiae alpha factor and Saccharomyces cerevisiae invertase genes. Suitable signal peptides for mammalian host cells include, but are not limited to, signal peptides from immunoglobulin-gamma (IgG) genes.
[109] В некоторых вариантах осуществления последовательность контроля представляет собой область, кодирующую пропептид, которая кодирует аминокислотную последовательность, находящуюся на N-конце полипептида. Полученный пептид в некоторых случаях называют "проферментом", "прополипептидом" или "зимогеном". Прополипептид может конвертироваться в зрелый активный полипептид посредством каталитического или аутокаталитического отщепления пропептида от пропролипептида. [109] In some embodiments, the control sequence is a propeptide coding region that encodes an amino acid sequence located at the N-terminus of the polypeptide. The resulting peptide is sometimes referred to as a "proenzyme", "propolypeptide" or "zymogen". The propolypeptide can be converted to the mature active polypeptide by catalytic or autocatalytic cleavage of the propeptide from the proprolipid.
[110] В другом аспекте настоящее изобретение также относится к рекомбинантному экспрессирующему вектору, содержащему полинуклеотид, кодирующий сконструированный полипептид РНК-полимеразы T7, и одну или более областей, регулирующих экспрессию, таких как промотор и терминатор, ориджин репликации и т.д., в зависимости от типа хозяев, в которых его вводят. В некоторых вариантах осуществления различные последовательности нуклеиновых кислот и последовательности контроля, описанные выше, связаны вместе с получением рекомбинантного экспрессирующего вектора, который включает один или более удобных участков рестрикции для обеспечения инсерции или замещения последовательности нуклеиновой кислоты, кодирующей вариант полипептида РНК-полимеразы T7 в таких участках. Альтернативно последовательность(и) полинуклеотида по настоящему изобретению экспрессируют путем встраивания последовательности полинуклеотида или конструкции нуклеиновой кислоты, содержащей последовательность полинуклеотида в надлежащий вектор для экспрессии. При конструировании экспрессирующего вектора кодирующую последовательность размещают в векторе так, чтобы кодирующая последовательность была функционально связана с надлежащими последовательностями контроля для экспрессии. [110] In another aspect, the present invention also provides a recombinant expression vector comprising a polynucleotide encoding an engineered T7 RNA polymerase polypeptide and one or more expression control regions such as a promoter and terminator, an origin of replication, etc., in depending on the type of hosts in which it is administered. In some embodiments, the various nucleic acid sequences and control sequences described above are linked together to produce a recombinant expression vector that includes one or more convenient restriction sites to allow insertion or replacement of a nucleic acid sequence encoding a T7 RNA polymerase variant polypeptide at such sites. . Alternatively, the polynucleotide sequence(s) of the present invention are expressed by inserting the polynucleotide sequence or a nucleic acid construct containing the polynucleotide sequence into an appropriate expression vector. When constructing an expression vector, a coding sequence is placed in the vector such that the coding sequence is operably linked to the appropriate control sequences for expression.
[111] Рекомбинантный экспрессирующий вектор может представлять собой любой вектор (например, плазмиду или вирус), который удобно подвергать способам рекомбинантных ДНК и который может обеспечивать экспрессию варианта последовательности полинуклеотида РНК-полимеразы T7. Выбор вектора, как правило, зависит от совместимости вектора с клеткой-хозяином, в которую намереваются вводить вектор. Векторы могут представлять собой линейные или замкнутые кольцевые плазмиды. [111] The recombinant expression vector can be any vector (eg, plasmid or virus) that is conveniently subjected to recombinant DNA techniques and that can express a T7 RNA polymerase polynucleotide sequence variant. The choice of vector generally depends on the compatibility of the vector with the host cell into which the vector is to be introduced. The vectors can be linear or closed circular plasmids.
[112] В некоторых вариантах осуществления экспрессирующий вектор представляет собой автономно реплицирующийся вектор (т.е. вектор, который существует в качестве внехромосомной структуры, репликация которой не зависит от хромосомной репликации, такой как плазмида, внехромосомный элемент, минихромосома или искусственная хромосома). Вектор может содержать любые средства для обеспечения саморепликации. В некоторых альтернативных вариантах осуществления вектор может представлять собой вектор, который при введении в клетку-хозяина встраивается в геном и реплицируется вместе с хромосомой(ами), в которую он встроился. Более того, можно использовать единый вектор или плазмиду или два или более векторов или плазмид, которые вместе содержат всю ДНК, подлежащую встраиванию в геном клетки-хозяина, или транспозон. [112] In some embodiments, the expression vector is an autonomously replicating vector (i.e., a vector that exists as an extrachromosomal structure whose replication is independent of chromosomal replication, such as a plasmid, extrachromosomal element, minichromosome, or artificial chromosome). The vector may contain any means to ensure self-replication. In some alternative embodiments, the vector may be a vector that, when introduced into a host cell, integrates into the genome and replicates along with the chromosome(s) into which it is inserted. Moreover, a single vector or plasmid, or two or more vectors or plasmids, which together contain all of the DNA to be inserted into the host cell's genome, or transposon, may be used.
[113] В некоторых вариантах осуществления экспрессирующий вектор предпочтительно содержит один или более селективных маркеров, которые позволяют простую селекцию трансформированных клеток. "Селективный маркер" представляет собой ген, продукт которого обеспечивает резистентность к биоциду или вирусу, резистентность к тяжелым металлам, прототрофию ауксотрофам и т.п. Подходящие маркеры для дрожжевых клеток включают, но не ограничиваются ими, ADE2, HIS3, LEU2, LYS2, MET3, TRP1 и URA3. Селективные маркеры для применения в клетках-хозяевах в виде нитчатых грибов включают, но не ограничиваются ими, amdS (ацетамидаза), argB (орнитинкарбамоилтрансферазы), bar (фосфинотрицинацетилтрансфераза), hph (гигромицинфосфотрансфераза), niaD (нитратредуктаза), pyrG (оротидин-5'-фосфатдекарбоксилаза), sC (сульфатаденилтрансфераза) и trpC (антранилатсинтаза), а также их эквиваленты. В другом аспекте настоящее изобретение относится клетке-хозяину, содержащей полинуклеотид, кодирующий по меньшей мере один сконструированный полипептид РНК-полимеразы T7, описанный в настоящей заявке, причем полинуклеотид функционально связан с одной или более последовательностями контроля для экспрессии сконструированного фермента(ов) РНК-полимеразы T7 в клетке-хозяине. Клетки-хозяева для экспрессии полипептидов, кодируемых экспрессирующими векторами по настоящему изобретению, хорошо известны в данной области и включают, но не ограничиваются ими, клетки грибов, такие как дрожжевые клетки (например, Saccharomyces cerevisiae и Pichia pastoris [например, номер доступа ATCC №201178]); клетки насекомых (например, клетки Drosophila S2 и Spodoptera Sf9), клетки растений, клетки животных (например, CHO, COS и BHK) и клетки человека (например, клеточные линии HEK293T, фибробластов человека, THP-1, Jurkat и меланомы Bowes). [113] In some embodiments, the expression vector preferably contains one or more selectable markers that allow easy selection of transformed cells. A "selectable marker" is a gene whose product provides biocide or virus resistance, heavy metal resistance, prototrophy to auxotrophs, and the like. Suitable markers for yeast cells include, but are not limited to, ADE2, HIS3, LEU2, LYS2, MET3, TRP1, and URA3. Selectable markers for use in filamentous fungal host cells include, but are not limited to, amdS (acetamidase), argB (ornithine carbamoyltransferases), bar (phosphinothricin acetyltransferase), hph (hygromycin phosphotransferase), niaD (nitrate reductase), pyrG (orotidin-5' -phosphate decarboxylase), sC (sulfate adenyl transferase) and trpC (anthranilate synthase), as well as their equivalents. In another aspect, the present invention provides a host cell comprising a polynucleotide encoding at least one engineered T7 RNA polymerase polypeptide described herein, wherein the polynucleotide is operably linked to one or more control sequences for expression of the engineered RNA polymerase enzyme(s). T7 in the host cell. Host cells for expression of the polypeptides encoded by the expression vectors of the present invention are well known in the art and include, but are not limited to, fungal cells such as yeast cells (e.g., Saccharomyces cerevisiae and Pichia pastoris [e.g., ATCC accession number 201178 ]); insect cells (eg, Drosophila S2 and Spodoptera Sf9 cells), plant cells, animal cells (eg, CHO, COS, and BHK), and human cells (eg, HEK293T, human fibroblast, THP-1, Jurkat, and Bowes melanoma cell lines).
[114] Таким образом, в другом аспекте настоящее изобретение относится к способам получения сконструированных полипептидов РНК-полимеразы T7, где способы включают культивирование клетки-хозяина, способной экспрессировать полинуклеотид, кодирующий сконструированный полипептид РНК-полимеразы T7, в условиях, пригодных для экспрессии полипептида. В некоторых вариантах осуществления способы дополнительно включают стадии выделения и/или очистки полипептидов РНК-полимеразы T7, как описано в настоящем описании. [114] Thus, in another aspect, the present invention relates to methods for producing engineered T7 RNA polymerase polypeptides, wherein the methods comprise culturing a host cell capable of expressing a polynucleotide encoding an engineered T7 RNA polymerase polypeptide under conditions suitable for expression of the polypeptide. In some embodiments, the methods further comprise the steps of isolating and/or purifying T7 RNA polymerase polypeptides as described herein.
[115] Надлежащие культуральные среды и условия выращивания описанных выше клеток-хозяев хорошо известны в данной области. Полинуклеотиды для экспрессии полипептидов РНК-полимеразы T7 можно вводить в клетки различными способами, известными в данной области. Способы включают, среди прочих, электропорацию, бомбардировку биолистическими частицами, опосредуемую липосомами трансфекцию, трансфекцию с хлоридом кальция и слияние протопластов. [115] Proper culture media and growing conditions for the host cells described above are well known in the art. Polynucleotides for expressing T7 RNA polymerase polypeptides can be introduced into cells by various methods known in the art. Methods include electroporation, biolistic particle bombardment, liposome-mediated transfection, calcium chloride transfection, and protoplast fusion, among others.
[116] Сконструированную РНК-полимеразу T7 со свойствами, описанными в настоящим описании, можно получать, подвергая полинуклеотид, кодирующий встречающийся в природе или сконструированный полипептид РНК-полимеразы T7, способам мутагенеза и/или направленной эволюции, известным в данной области, и как описано в настоящем описании. Иллюстративным способом направленной эволюции является мутагенез и/или шаффлинг ДНК (см., например, Stemmer, Proc. Natl. Acad. Sci. USA 91:10747-10751 [1994]; WO 95/22625; WO 97/0078; WO 97/35966; WO 98/27230; WO 00/42651; WO 01/75767 и патент США 6537746). Другие способы направленной эволюции, которые можно использовать, включают, среди прочих, способ ступенчатой достройки (StEP), рекомбинацию in vitro (см., например, Zhao et al., Nat. Biotechnol., 16:258-261 [1998]), мутагенную ПЦР (см., например, Caldwell et al., PCR Methods Appl., 3:S136-S140 [1994]) и кассетный мутагенез (см., например, Black et al., Proc. Natl. Acad. Sci. USA 93:3525-3529 [1996]). [116] An engineered T7 RNA polymerase with the properties described herein can be obtained by subjecting a polynucleotide encoding a naturally occurring or engineered T7 RNA polymerase polypeptide to mutagenesis and/or directed evolution methods known in the art and as described in this description. An exemplary method of directed evolution is DNA mutagenesis and/or shuffling (see, e.g., Stemmer, Proc. Natl. Acad. Sci. USA 91:10747-10751 [1994]; WO 95/22625; WO 97/0078; WO 97/ 35966; WO 98/27230; WO 00/42651; WO 01/75767 and US Patent 6,537,746). Other directed evolution methods that can be used include, among others, stepwise completion (StEP), in vitro recombination (see, for example, Zhao et al., Nat. Biotechnol., 16:258-261 [1998]), mutagenic PCR (see, for example, Caldwell et al., PCR Methods Appl., 3:S136-S140 [1994]) and cassette mutagenesis (see, for example, Black et al., Proc. Natl. Acad. Sci. USA 93:3525-3529 [1996]).
[117] Например, способы мутагенеза и направленной эволюции можно без труда применять в отношении полинуклеотидов для получения вариантов библиотек, которые можно экспрессировать, подвергать скринингу и оценивать. Способы мутагенеза и направленной эволюции хорошо известны в данной области (см., например, патенты США №5605793, 5811238, 5830721, 5834252, 5837458, 5928905, 6096548, 6117679, 6132970, 6165793, 6180406, 6251674, 6277638, 6287861, 6287862, 6291242, 6297053, 6303344, 6309883, 6319713, 6319714, 6323030, 6326204, 6335160, 6335198, 6344356, 6352859, 6355484, 6358740, 6358742, 6365377, 6365408, 6368861, 6372497, 6376246, 6379964, 6387702, 6391552, 6391640, 6395547, 6406855, 6406910, 6413745, 6413774, 6420175, 6423542, 6426224, 6436675, 6444468, 6455253, 6479652, 6482647, 6489146, 6506602, 6506603, 6519065, 6521453, 6528311, 6537746, 6573098, 6576467, 6579678, 6586182, 6602986, 6613514, 6653072, 6716631, 6777218, 6917882, 6946296, 6961664, 6995017, 7024312, 7058515, 7105297, 7148054, 7288375, 7421347, 7430477, 7534564, 7620500, 7620502, 7629170, 7702464, 7747391, 7747393, 7751986, 7776598, 7783428, 7795030, 7853410, 7868138, 7873477, 7873499, 7904249, 7957912, 8014961, 8029988, 8058001, 8076138, 8018150, 8170806, 8377681, 8383346, 8457903, 8504498, 8589085, 8762066, 8849575, 8876066, 8768871, 9593326, 9665694 и все родственные аналоги, происходящие из США и не США; Ling et al., Anal. Biochem., 254(2):157-78 [1997]; Dale et al., Meth. Mol. Biol., 57:369-74 [1996]; Smith, Ann. Rev. Genet., 19:423-462 [1985]; Botstein et al., Science, 229:1193-1201 [1985]; Carter, Biochem. J., 237:1-7 [1986]; Kramer et al., Cell, 38:879-887 [1984]; Wells et al., Gene, 34:315-323 [1985]; Minshull et al., Curr. Op. Chem. Biol., 3:284-290 [1999]; Christians et al., Nat. Biotechnol., 17:259-264 [1999]; Crameri et al., Nature, 391:288-291 [1998]; Crameri, et al., Nat. Biotechnol., 15:436-438 [1997]; Zhang et al., Proc. Nat. Acad. Sci. U.S.A., 94:4504-4509 [1997]; Crameri et al., Nat. Biotechnol., 14:315-319 [1996]; Stemmer, Nature, 370:389-391 [1994]; Stemmer, Proc. Nat. Acad. Sci. USA, 91:10747-10751 [1994]; публикации патентных заявок США №2008/0220990, US 2009/0312196, US 2014/0005057, US 2014/0214391, US 2014/0221216; US 2015/0050658, US 2015/0133307, US 2015/0134315 и все родственные аналоги, происходящие из США и не США; WO 95/22625, WO 97/0078, WO 97/35966, WO 98/27230, WO 00/42651, WO 01/75767 и WO 2009/152336; все из которых включены в настоящее описание в качестве ссылок). [117] For example, mutagenesis and directed evolution techniques can be readily applied to polynucleotides to generate library variants that can be expressed, screened, and evaluated. Methods for mutagenesis and directed evolution are well known in the art (see, for example , US Pat. Nos. 5,605,793; 5,811,238; 406, 6251674, 6277638, 6287861, 6287862, 6291242 6323030, 6326204, 6335160, 6335198, 6344356, 6352859, 6355484, 6358740, 63 6365377, 6365408, 6368861, 6372497, 6376246, 6379964, 6387702, 6391552, 6391640, 6395547, 6406855 6406910 6413745 6413774 6420175 6423542 6426224 6436675 6444468 6455253 6479652 6482647 6489146 6506602 65 6521453, 6528311, 6537746, 6573098, 6576467, 6579678, 6586182, 6602986, 6613514, 6653072 , 6716631 6777218 6917882 6946296 6961664 6995017 7024312 7058515 7105297 7148054 7288375 7421347 7430477 75 34564, 7620500, 7620502, 7629170, 7702464, 7747391, 7747393, 7751986, 7776598, 7783428, 7795030, 7853410 , 7868138 7873477 7873499 7904249 7957912 8014961 8029988 8058001 8076138 8018150 8170806 8377681 57903, 8504498, 8589085, 8762066, 8849575, 8876066, 8768871, 9593326, 9665694 and all related analogues originating from the USA and not the USA; Ling et al ., Anal. Biochem . , 254(2):157-78 [1997]; Dale et al ., Meth. Mol. biol . , 57:369-74 [1996]; Smith, Ann. Rev. Genet . , 19:423-462 [1985]; Botstein et al ., Science, 229:1193-1201 [1985]; Carter, Biochem. J. , 237:1-7 [1986]; Kramer et al ., Cell, 38:879-887 [1984]; Wells et al ., Gene, 34:315-323 [1985]; Minshull et al ., Curr. Op. Chem. Biol., 3:284-290 [1999]; Christians et al ., Nat. Biotechnol., 17:259-264 [1999]; Crameri et al ., Nature, 391:288-291 [1998]; Crameri, et al ., Nat. Biotechnol., 15:436-438 [1997]; Zhang et al ., Proc. Nat. Acad. sci. USA . 94:4504-4509 [1997]; Crameri et al ., Nat. Biotechnol. , 14:315-319 [1996]; Stemmer, Nature, 370:389-391 [1994]; Stemmer, Proc. Nat. Acad. sci. USA 91:10747-10751 [1994]; US Patent Application Publication No. 2008/0220990, US 2009/0312196, US 2014/0005057, US 2014/0214391, US 2014/0221216; US 2015/0050658, US 2015/0133307, US 2015/0134315 and all related US and non-US origins; WO 95/22625, WO 97/0078, WO 97/35966, WO 98/27230, WO 00/42651, WO 01/75767 and WO 2009/152336; all of which are incorporated herein by reference).
[118] В некоторых вариантах осуществления варианты ферментов, полученные после мутагенной обработки, подвергают скринингу, подвергая варианты ферментов воздействию определенной температуры (или других условиях анализа) и измеряя величину ферментативной активности после термической обработки или других условий анализа. Затем ДНК, содержащую полинуклеотид, кодирующий полипептид РНК-полимеразы T7, выделяют из клетки-хозяина, секвенируют для идентификации изменений нуклеотидной последовательности (при наличии) и используют для экспрессии фермента в отличающейся или той же клетке-хозяине. Определение ферментативной активности в экспрессирующих библиотеках можно проводить с использованием любого подходящего способа, известного в данной области (например, стандартные способы биохимии, таки как анализ с использованием ВЭЖХ). [118] In some embodiments, enzyme variants obtained after mutagenic treatment are screened by exposing the enzyme variants to a certain temperature (or other assay conditions) and measuring the amount of enzymatic activity after heat treatment or other assay conditions. DNA containing a polynucleotide encoding a T7 RNA polymerase polypeptide is then isolated from a host cell, sequenced to identify nucleotide sequence changes (if any), and used to express the enzyme in a different or the same host cell. Determination of enzyme activity in expression libraries can be performed using any suitable method known in the art (eg, standard biochemistry methods such as HPLC analysis).
[119] Для сконструированных полипептидов известной последовательности полинуклеотиды, кодирующие фермент, можно получать стандартными твердофазными способами в соответствии с известными способами синтеза. В некоторых вариантах осуществления фрагменты длиной вплоть до приблизительно 100 оснований можно синтезировать по отдельности, а затем соединять (например, способами ферментативного или химического лигирования или опосредуемыми полимеразами способами) с получением любой желаемой непрерывной последовательности. Например, полинуклеотиды и олигонуклеотиды, описанные в настоящем описании, можно получать посредством химического синтеза с использованием классического способа с фосфорамидитом (cм., например, Beaucage et al., Tetra. Lett., 22:1859-69 [1981]; и Matthes et al., EMBO J., 3:801-05 [1984]), поскольку он обычно применяется на практике в автоматизированных способах синтеза. В соответствии со способом с фосфорамидитом олигонуклеотиды синтезируют (например, в автоматизированном устройстве для синтеза ДНК), очищают, подвергают отжигу, лигируют и клонируют в подходящие векторы. [119] For engineered polypeptides of known sequence, polynucleotides encoding the enzyme can be prepared by standard solid phase methods according to known synthetic methods. In some embodiments, fragments up to about 100 bases in length can be individually synthesized and then joined (eg, by enzymatic or chemical ligation methods or polymerase-mediated methods) to produce any desired contiguous sequence. For example, the polynucleotides and oligonucleotides described herein can be prepared by chemical synthesis using the classic phosphoramidite method (see, e.g., Beaucage et al., Tetra. Lett., 22:1859-69 [1981]; and Matthes et al., EMBO J., 3:801-05 [1984]), since it is commonly practiced in automated synthesis methods. According to the phosphoramidite method, oligonucleotides are synthesized (eg in an automated DNA synthesis machine), purified, annealed, ligated and cloned into appropriate vectors.
[120] Таким образом, в некоторых вариантах осуществления способ получения сконструированного полипептида РНК-полимеразы T7 может включать: (a) синтез полинуклеотида, кодирующего полипептид, содержащий аминокислотную последовательность, выбранную из аминокислотной последовательности любого варианта, приведенного в таблице 5.3, 5.4, 5.5 и/или 5.6, а также SEQ ID NO: 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37 и 39, и (b) экспрессию полипептида РНК-полимеразы T7, кодируемого полинуклеотидом. В некоторых вариантах осуществления способа аминокислотная последовательность, кодируемая полинуклеотидом, необязательно может иметь одну или более (например, вплоть до 3, 4, 5 или вплоть 10) делеций, инсерций и/или замен аминокислотных остатков. В некоторых вариантах осуществления аминокислотная последовательность необязательно имеет 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 1-15, 1-20, 1-21, 1-22, 1-23, 1-24, 1-25, 1-30, 1-35, 1-40, 1-45 или 1-50 делеций, инсерций и/или замен аминокислотных остатков. В некоторых вариантах осуществления аминокислотная последовательность имеет необязательно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 30, 35, 40, 45 или 50 делеций, инсерций и/или замен аминокислотных остатков. В некоторых вариантах осуществления аминокислотная последовательность имеет необязательно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18, 20, 21, 22, 23, 24 или 25 делеций, инсерций и/или замен аминокислотных остатков. В некоторых вариантах осуществления замены могут представлять собой консервативные или неконсервативные замены. [120] Thus, in some embodiments, a method for producing a T7 RNA polymerase engineered polypeptide may include: (a) synthesizing a polynucleotide encoding a polypeptide containing an amino acid sequence selected from the amino acid sequence of any of the variants shown in Tables 5.3, 5.4, 5.5, and /or 5.6, as well as SEQ ID NOs: 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37 and 39, and (b) expression of the T7 RNA polymerase polypeptide encoded by the polynucleotide. In some embodiments of the method, the amino acid sequence encoded by the polynucleotide may optionally have one or more (eg, up to 3, 4, 5, or up to 10) deletions, insertions, and/or substitutions of amino acid residues. In some embodiments, the amino acid sequence optionally has 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 1-15, 1- 20, 1-21, 1-22, 1-23, 1-24, 1-25, 1-30, 1-35, 1-40, 1-45 or 1-50 deletions, insertions and/or substitutions of amino acid residues . In some embodiments, the amino acid sequence is optionally 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 30, 35, 40, 45 or 50 deletions, insertions and/or substitutions of amino acid residues. In some embodiments, the amino acid sequence is optionally 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18, 20, 21, 22, 23, 24 or 25 deletions, insertions and/or substitutions of amino acid residues. In some embodiments, the substitutions may be conservative or non-conservative substitutions.
[121] Экспрессируемый сконструированный полипептид РНК-полимеразы T7 можно оценивать в отношении любого желаемого усовершенствованного свойства (например, активность, селективность, стабильность, устойчивость к действию кислот, чувствительность к протеазам и т.д.), с использованием любого подходящего способа анализа, известного в данной области, включая, но не ограничиваясь ими способы анализа и условия, описанные в настоящем описании. [121] An expressed engineered T7 RNA polymerase polypeptide can be assessed for any desired improved property (e.g., activity, selectivity, stability, acid resistance, protease sensitivity, etc.) using any suitable assay method known in the art. in this field, including, but not limited to, the methods of analysis and conditions described in the present description.
[122] В некоторых вариантах осуществления любой из сконструированных полипептидов РНК-полимеразы T7, экспрессируемых в клетке-хозяине, выделяют из клеток и/или культуральной среды с использованием любого одного или более из хорошо известных способов очистки белков, включая, среди прочих, обработку лизоцимом, обработку ультразвуком, фильтрацию, высаливание, ультрацентрифугирование и хроматографию. [122] In some embodiments, any of the engineered T7 RNA polymerase polypeptides expressed in the host cell are isolated from the cells and/or culture medium using any one or more of the well-known protein purification methods, including but not limited to lysozyme treatment. , sonication, filtration, salting out, ultracentrifugation and chromatography.
[123] Хроматографические способы выделения полипептидов T7 РНК-полимеразы включают, среди прочих, обращено-фазовую хроматографию, высокоэффективную жидкостную хроматографию, ионообменную хроматографию, хроматографию гидрофобного взаимодействия, гель-электрофорез и аффинную хроматографию. Условия для очистки конкретных ферментов зависят, частично, от таких факторов, как суммарный заряд, гидрофобность, гидрофильность, молекулярная масса, молекулярная форма и т.д., и станут понятными специалистам в данной области. В некоторых вариантах осуществления аффинные способы можно использовать для выделения усовершенствованных вариантов ферментов РНК-полимеразы. В некоторых вариантах осуществления, в которых используется очистка посредством аффинной хроматографии, может использоваться любое антитело, которое специфически связывает вариант полипептида РНК-полимеразы T7. В некоторых вариантах осуществления, в которых используется очистка посредством аффинной хроматографии, могут использоваться белки, которые связываются с гликанами, ковалентно связанными с РНК-полимеразой T7. В других вариантах осуществления, в которых используется очистка посредством аффинной хроматографии, может использоваться любое низкомолекулярное соединение, которое связывается с активным центром РНК-полимеразы T7. Для продуцирования антител различных животных-хозяев, включая, но не ограничиваясь ими, кроликов, мышей, крыс и т.д., иммунизируют посредством инъекции полипептида РНК-полимеразы T7 (например, варианта РНК-полимеразы T7) или его фрагмента. В некоторых вариантах осуществления полипептид РНК-полимераза T7 или его фрагмент связан с подходящим носителем, таким как BSA, через функциональную группу боковой цепи или линкеры, связанные с функциональной группой боковой цепи. [123] Chromatographic methods for isolating T7 RNA polymerase polypeptides include reverse phase chromatography, high performance liquid chromatography, ion exchange chromatography, hydrophobic interaction chromatography, gel electrophoresis, and affinity chromatography, among others. Conditions for purification of particular enzymes depend, in part, on factors such as net charge, hydrophobicity, hydrophilicity, molecular weight, molecular shape, etc., and will be understood by those skilled in the art. In some embodiments, affinity methods can be used to isolate improved variants of RNA polymerase enzymes. In some embodiments that use affinity chromatography purification, any antibody that specifically binds a variant T7 RNA polymerase polypeptide can be used. In some embodiments that use affinity chromatography purification, proteins can be used that bind to glycans covalently linked to T7 RNA polymerase. In other embodiments that use affinity chromatography purification, any small molecular weight compound that binds to the active site of T7 RNA polymerase can be used. For antibody production, various host animals, including but not limited to rabbits, mice, rats, etc., are immunized by injection of a T7 RNA polymerase polypeptide (eg, a T7 RNA polymerase variant) or fragment thereof. In some embodiments, the T7 RNA polymerase polypeptide or fragment thereof is linked to a suitable carrier, such as BSA, via a side chain functional group or linkers linked to the side chain functional group.
[124] В некоторых вариантах осуществления сконструированный полипептид РНК-полимеразы T7 продуцируют в клетке-хозяине способом, включающим культивирование клетки-хозяина (например, S. cerevisiae, Daucus carota, Nicotiana tabacum, H. sapiens (например, HEK293T) или Cricetulus griseus (например, CHO)), содержащей последовательность полинуклеотида, кодирующую сконструированный полипептид РНК-полимеразы T7, как описано в настоящем описании, в условиях, способствующих продуцированию сконструированного полипептида РНК-полимеразы T7, и выделение сконструированного полипептида РНК-полимеразы T7 из клеток и/или культуральной среды. [124] In some embodiments, the engineered T7 RNA polymerase polypeptide is produced in a host cell by a method comprising culturing the host cell (e.g., S. cerevisiae, Daucus carota, Nicotiana tabacum, H. sapiens (e.g., HEK293T) or Cricetulus griseus ( e.g., CHO)) containing a polynucleotide sequence encoding an engineered T7 RNA polymerase polypeptide as described herein under conditions conducive to the production of the engineered T7 RNA polymerase polypeptide, and isolating the engineered T7 RNA polymerase polypeptide from cells and/or culture media. environment.
[125] В некоторых вариантах осуществления изобретение охватывает способ продуцирования сконструированного полипептида РНК-полимеразы T7, включающий культивирование рекомбинантной эукариотической клетки, содержащей последовательность полинуклеотида, кодирующего сконструированный полипептид РНК-полимеразы T7, обладающую по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 95%, 96%, 97%, 98%, 99% или 100% идентичностью последовательности с эталонными последовательностями SEQ ID NO: 4 и/или 15, и одно или более отличий аминокислотных остатков по сравнению с SEQ ID NO: 4 и/или 15, выбранных из различий, приведенных в таблицах 5.3, 5.4, 5.5 и/или 5.6, и/или их комбинаций при оптимальном выравнивании с аминокислотной последовательностью SEQ ID NO: 4 и/или 15 в подходящих условиях культивирования для обеспечения продуцирования сконструированного полипептида РНК-полимеразы T7, и необязательно выделение сконструированного полипептида РНК-полимеразы T7 из культуры и/или культивируемых бактериальных клеток. [125] In some embodiments, the invention encompasses a method for producing an engineered T7 RNA polymerase polypeptide, comprising culturing a recombinant eukaryotic cell containing a polynucleotide sequence encoding an engineered T7 RNA polymerase polypeptide having at least 80%, 81%, 82%, 83 %, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 95%, 96%, 97%, 98%, 99% or 100% sequence identity with reference sequences SEQ ID NO: 4 and/or 15, and one or more differences in amino acid residues compared to SEQ ID NO: 4 and/or 15, selected from the differences shown in tables 5.3, 5.4, 5.5 and/or 5.6, and/or combinations thereof in optimal alignment with the amino acid sequence of SEQ ID NO: 4 and/or 15 under suitable culture conditions to allow production of the engineered T7 RNA polymerase polypeptide, and optionally isolating the engineered T7 RNA polymerase polypeptide from culture and/or cultured bacterial cells.
[126] В некоторых вариантах осуществления после выделения сконструированных полипептидов РНК-полимеразы T7 из рекомбинантных клеток-хозяев или среды для культивирования клеток, их далее очищают любым подходящим способом(ами), известным в данной области. В некоторых дополнительных вариантах осуществления очищенные полипептиды РНК-полимеразы T7 комбинируют с другими ингредиентами и соединениями для обеспечения композиций и составов, содержащих сконструированный полипептид РНК-полимеразы T7, надлежащим образом для различных способов использования и применений (например, фармацевтические композиции). В некоторых дополнительных вариантах осуществления очищенные полипептиды РНК-полимеразы T7 или составленные полипептиды РНК-полимеразы T7 являются лиофилизированными. [126] In some embodiments, after isolation of engineered T7 RNA polymerase polypeptides from recombinant host cells or cell culture media, they are further purified by any suitable method(s) known in the art. In some additional embodiments, the purified T7 RNA polymerase polypeptides are combined with other ingredients and compounds to provide compositions and formulations containing the engineered T7 RNA polymerase polypeptide appropriately for various uses and applications (eg, pharmaceutical compositions). In some additional embodiments, the purified T7 RNA polymerase polypeptides or formulated T7 RNA polymerase polypeptides are lyophilized.
Композиции:Compositions:
[127] Настоящее изобретение относится к различным композициям и форматам, включая, но не ограничиваясь ими, композиции и форматы, описанные ниже. В некоторых вариантах осуществления настоящее изобретение относится сконструированным полипептидам РНК-полимеразы T7, пригодным для применения в композициях для диагностических целей. [127] The present invention relates to various compositions and formats, including, but not limited to, the compositions and formats described below. In some embodiments, the present invention provides engineered T7 RNA polymerase polypeptides suitable for use in compositions for diagnostic purposes.
ЭКСПЕРИМЕНТАЛЬНАЯ ЧАСТЬEXPERIMENTAL PART
[128] Следующие примеры, включая эксперименты и достигнутые результаты, предоставлены только для иллюстративных целей, и их не следует истолковывать как ограничивающие настоящее изобретение. [128] The following examples, including experiments and results achieved, are provided for illustrative purposes only and should not be construed as limiting the present invention.
[129] В описании экспериментальной части ниже используются следующие сокращенные обозначения: м.д. (части на миллион); M (молярный); мМ (миллимолярный), мкМ (микромолярный); нМ (наномолярный); моль (количество моль); г (граммы); мг (миллиграммы); мкг (микрограммы); л (литры); мл (миллилитры); см (сантиметры); мм (миллиметры); мкм (микрометры); с (секунды); мин (минута(ы)); ч (час(ы)); Е (единицы); ММ (молекулярная масса); об/мин (обороты в минуту); rcf (относительная центробежная сила); °C (градусы Цельсия); CDS (кодирующая последовательность); ДНК (дезоксирибонуклеиновая кислота); РНК (рибонуклеиновая кислота); E. coli W3110 (часто используемый лабораторный штамм E. coli, доступный от Coli Genetic Stock Center [CGSC], New Haven, CT); ВЭЖХ (жидкостная хроматография высокого давления); MWCO (предел молекулярной массы); SDS-PAGE (полиакриламидный гель-электрофорез с додецилсульфатом натрия); T7RNAP (РНК-полимераза T7); PES (полиэфирсульфон); CFSE (сукцинимидиловый эфир карбоксифлуоресцеина); IPTG (изопропил β-D-1-тиогалактопиранозид); PMBS (сульфат полимиксина B); NADPH (никотинамидадениндинуклеотидфосфат); GIDH (глутаматдегидрогеназа); FIOPC (кратность улучшения относительно положительного контроля); LB (бульон Луриа); MeOH (метанол); Athens Research (Athens Research Technology, Athens, GA); NEB (New England Biolabs, Ipswich, MA); Ion Torrent (Ion Torrent, Gilford, NH); ProSpec (ProSpec Tany Technogene, East Brunswick, NJ); Sigma-Aldrich (Sigma-Aldrich, St. Louis, MO); Ram Scientific (Ram Scientific, Inc., Yonkers, NY); Pall Corp. (Pall, Corp., Pt. Washington, NY); Millipore (Millipore, Corp., Billerica MA); Difco (Difco Laboratories, BD Diagnostic Systems, Detroit, MI); Molecular Devices (Molecular Devices, LLC, Sunnyvale, CA); Kuhner (Adolf Kuhner, AG, Basel, Switzerland); Axygen (Axygen, Inc., Union City, CA); Toronto Research Chemicals (Toronto Research Chemicals Inc., Toronto, Ontario, Canada); Cambridge Isotope Laboratories, (Cambridge Isotope Laboratories, Inc., Tewksbury, MA); Applied Biosystems (Applied Biosystems, part of Life Technologies, Corp., Grand Island, NY), Agilent (Agilent Technologies, Inc., Santa Clara, CA); Thermo Scientific (part of Thermo Fisher Scientific, Waltham, MA); Ion Torrent NGS (Ion Torrent Next Generation Sequencing); Li-COR (Li-COR, Lincoln, NE); UVP (UVP, Upland, CA); Biotium (Biotium, Inc., Fremont, CA); Corning (Corning, Inc., Palo Alto, CA); Megazyme (Megazyme International, Wicklow, Ireland); Enzo (Enzo Life Sciences, Inc., Farmingdale, NY); GE Healthcare (GE Healthcare Bio-Sciences, Piscataway, NJ); Pierce (Pierce Biotechnology (now part of Thermo Fisher Scientific), Rockford, IL); LI-COR (LI-COR Biotechnology, Lincoln, NE); Amicus (Amicus Therapeutics, Cranbury, NJ); Phenomenex (Phenomenex, Inc., Torrance, CA); Optimal (Optimal Biotech Group, Belmont, CA); и Bio-Rad (Bio-Rad Laboratories, Hercules, CA). [129]In the description of the experimental part below, the following abbreviations are used: ppm. (parts per million); M (molar); mM (millimolar), µM (micromolar); nM (nanomolar); mole (number of moles); g (grams); mg (milligrams); mcg (micrograms); l (liters); ml (milliliters); cm (centimeters); mm (millimeters); µm (micrometers); s (seconds); min (minute(s)); h (hour(s)); E (units); MM (molecular weight); rpm (revolutions per minute); rcf (relative centrifugal force); °C (degrees Celsius); CDS (coding sequence); DNA (deoxyribonucleic acid); RNA (ribonucleic acid);E. coli W3110 (commonly used laboratory strainE. coli, available from Coli Genetic Stock Center [CGSC], New Haven, CT); HPLC (high pressure liquid chromatography); MWCO (molecular weight limit); SDS-PAGE (polyacrylamide gel electrophoresis with sodium dodecyl sulfate); T7RNAP (T7 RNA polymerase); PES (polyethersulfone); CFSE (carboxyfluorescein succinimidyl ether); IPTG (isopropyl β-D-1-thiogalactopyranoside); PMBS (polymyxin B sulfate); NADPH (nicotinamide adenine dinucleotide phosphate); GIDH (glutamate dehydrogenase); FIOPC (fold improvement relative to positive control); LB (Luria broth); MeOH (methanol); Athens Research (Athens Research Technology, Athens, GA); NEB (New England Biolabs, Ipswich, MA); Ion Torrent (Ion Torrent, Gilford, NH); ProSpec (ProSpec Tany Technogene, East Brunswick, NJ); Sigma-Aldrich (Sigma-Aldrich, St. Louis, MO); Ram Scientific (Ram Scientific, Inc., Yonkers, NY); Pal Corp. (Pall, Corp., Pt. Washington, NY); Millipore (Millipore, Corp., Billerica MA); Difco (Difco Laboratories, BD Diagnostic Systems, Detroit, MI); Molecular Devices (Molecular Devices, LLC, Sunnyvale, CA); Kuhner (Adolf Kuhner, AG, Basel, Switzerland); Axygen (Axygen, Inc., Union City, CA); Toronto Research Chemicals (Toronto Research Chemicals Inc., Toronto, Ontario, Canada); Cambridge Isotope Laboratories, (Cambridge Isotope Laboratories, Inc., Tewksbury, MA); Applied Biosystems (Applied Biosystems, part of Life Technologies, Corp., Grand Island, NY), Agilent (Agilent Technologies, Inc., Santa Clara, CA); Thermo Scientific (part of Thermo Fisher Scientific, Waltham, MA); Ion Torrent NGS (Ion Torrent Next Generation Sequencing); Li-COR (Li-COR, Lincoln, N.E.); UVP (UVP, Upland, CA); Biotium (Biotium, Inc., Fremont, Calif.); Corning (Corning, Inc., Palo Alto, CA); Megazyme (Megazyme International, Wicklow, Ireland); Enzo (Enzo Life Sciences, Inc., Farmingdale, NY); GE Healthcare (GE Healthcare Bio-Sciences, Piscataway, NJ); Pierce (Pierce Biotechnology (now part of Thermo Fisher Scientific), Rockford, IL); LI-COR (LI-COR Biotechnology, Lincoln, NE); Amicus (Amicus Therapeutics, Cranbury, NJ); Phenomenex (Phenomenex, Inc., Torrance, CA); Optimal (Optimal Biotech Group, Belmont, CA); and Bio-Rad (Bio-Rad Laboratories, Hercules, CA).
[130] Следующие полинуклеотидные или полипептидные последовательности применимы в рамках настоящего изобретения. В некоторых случаях (как показано ниже) после полинуклеотидной последовательности следует кодируемый полипептид. [130] The following polynucleotide or polypeptide sequences are applicable within the scope of the present invention. In some cases (as shown below), the polynucleotide sequence is followed by the encoded polypeptide.
ПРИМЕР 1EXAMPLE 1
Получение гена РНК-полимеразы T7 и конструирование экспрессирующих векторовGeneration of the T7 RNA polymerase gene and construction of expression vectors
[131] Фермент РНК-полимераза T7 дикого типа (WT) (SEQ ID NO: 2) кодируется геномом бактериофага T7 (SEQ ID NO: 1). Синтетический ген (SEQ ID NO: 3), кодирующий меченную 6-гистидином версию РНК-полимеразы T7 (SEQ ID NO: 4), конструировали и субклонировали в экспрессирующий вектор Escherichia coli pCK100900i (см., например, патент США №7629157 и публикацию патентной заявки США №2016/0244787, обе из которых включены в настоящее описание в качестве ссылок). Эти плазмидные конструкции трансформировали в штамм E. Coli, происходящий из W3110. Способы направленной эволюции, общеизвестные специалистам в данной области, использовали для получения библиотек вариантов генов из этих плазмид (см., например, патент США №8383346 и WO 2010/144103, оба из которых включены в настоящее описание в качестве ссылок). Замены в вариантах ферментов, описанных в настоящем описании, указаны относительно фермента 6His-меченной РНК-полимеразы T7 WT (т.е. SEQ ID NO: 4) или их вариантов, как указано. [131] The wild-type (WT) T7 RNA polymerase enzyme (SEQ ID NO: 2) is encoded by the bacteriophage T7 genome (SEQ ID NO: 1). A synthetic gene (SEQ ID NO: 3) encoding a 6-histidine labeled version of T7 RNA polymerase (SEQ ID NO: 4) was constructed and subcloned into the Escherichia coli pCK100900i expression vector (see, for example, US Patent No. 7,629,157 and Patent Publication US Application No. 2016/0244787, both of which are incorporated herein by reference). These plasmid constructs were transformed into an E. coli strain derived from W3110. Guided evolution methods well known to those skilled in the art have been used to generate libraries of gene variants from these plasmids (see, for example, US Pat. No. 8,383,346 and WO 2010/144103, both of which are incorporated herein by reference). Substitutions in the enzyme variants described herein are relative to the WT 6His-labeled T7 RNA polymerase enzyme (ie, SEQ ID NO: 4) or variants thereof, as indicated.
ПРИМЕР 2EXAMPLE 2
Высокопроизводительная (HTP) экспрессия и очистка РНК-полимеразы T7High throughput (HTP) expression and purification of T7 RNA polymerase
[132] В этом примере описаны эксперименты, проведенные в отношении экспрессии и очистки РНК-полимеразы T7 и ее вариантов. [132] This example describes the experiments carried out in relation to the expression and purification of T7 RNA polymerase and its variants.
Высокопроизводительное (HTP) выращивание ДНК-полимеразы T7 и вариантовHigh Throughput (HTP) Growth of T7 DNA Polymerase and Variants
[133] Трансформированные клетки E. coli подвергали селекции путем посева на чашки с агаром LB, содержавшие 1% глюкозу и 30 мкг/мл хлорамфеникола. После инкубации в течение ночи при 37°C, колонии помещали в лунки 96-луночных неглубоких планшетов с плоским дном NUNC™ (Thermo-Scientific), заполненных 180 мкл/лунка средой LB, дополненной 1% глюкозой и 30 мкг/мл хлорамфеникола. Культурам позволяли расти ночью в течение 18-20 часов в устройстве для встряхивания (200 об/мин, 30°C и относительная влажность 85%; Kuhner). Образцы, подвергнутые выращиванию в течение ночи (20 мкл), переносили в 96-луночные глубоки планшеты Costar, заполненные 380 мкл среды Terrific Broth, дополненной 30 мкг/мл хлорамфеникола. Планшеты инкубировали в течение 120 минут в устройстве для встряхивания (250 об/мин, 30°C и относительная влажность 85%; Kuhner) до достижения OD600 0,4-0,8. Затем клетки индуцировали посредством 40 мкл 10 мМ IPTG в стерильной воде и инкубировали в течение ночи в течение 18-20 часов в устройстве для встряхивания (250 об/мин, 30°C и относительная влажность 85%; Kuhner). Клетки осаждали (4000 об/мин×20 мин), супернатанты удаляли и клетки замораживали при -80°C перед анализом. [133] Transformed E. coli cells were selected by plating on LB agar plates containing 1% glucose and 30 μg/ml chloramphenicol. After overnight incubation at 37° C., colonies were plated in wells of NUNC™ 96-well shallow flat bottom plates (Thermo-Scientific) filled with 180 μl/well LB medium supplemented with 1% glucose and 30 μg/ml chloramphenicol. The cultures were allowed to grow overnight for 18-20 hours in a shaker (200 rpm, 30° C. and 85% relative humidity; Kuhner). Overnight grown samples (20 μl) were transferred to Costar 96-well deep plates filled with 380 μl Terrific Broth supplemented with 30 μg/ml chloramphenicol. The plates were incubated for 120 minutes in a shaker (250 rpm, 30° C. and 85% relative humidity; Kuhner) until an OD 600 of 0.4-0.8 was reached. The cells were then induced with 40 μl of 10 mM IPTG in sterile water and incubated overnight for 18-20 hours in a shaker (250 rpm, 30° C. and 85% relative humidity; Kuhner). Cells were pelleted (4000 rpm×20 min), supernatants were removed and cells were frozen at -80°C prior to analysis.
Лизис осадков HTPHTP precipitation lysis
[134] Клеточные осадки ресуспендировали в 400 мкл лизирующего буфера (20 мМ Tris, pH 7,5, 1 MgSO4, 1 мг/мл лизоцима и 0,5 мг/мл сульфата полимиксина B) и встряхивали в течение 1,5 ч при комнатной температуре. Затем лизаты осаждали (4000 об/мин×5 мин) и отделенные от примесей супернатанты сохраняли для очистки. [134] Cell pellets were resuspended in 400 μl of lysis buffer (20 mM Tris, pH 7.5, 1 MgSO 4 , 1 mg/ml lysozyme and 0.5 mg/ml polymyxin B sulfate) and shaken for 1.5 h at room temperature. Then the lysates were precipitated (4000 rpm×5 min) and the supernatants separated from impurities were stored for purification.
Очистка HTP T7RNAP из неочищенных лизатовPurification of HTP T7RNAP from crude lysates
[135] T7RNAP очищали из отделенных от примесей лизатов E. coli посредством металл-аффинной хроматографии с использованием покрытых никелем планшетов HIS-Select® большого объема (HC) (Sigma) в соответствии с инструкциями изготовителя. Планшеты HIS-Select® уравновешивали всего 800 мкл промывочного буфера (50 мМ фосфат натрия, pH 7,5, 300 мМ NaCl, 25 мМ имидазол, 0,1% об./об. реагента TWEEN-20® [Sigma]) на лунку. Затем 200 мкл лизата HTP, содержавшего T7RNAP, и 200 мкл промывочного буфера перемешивали, помещали в планшет и центрифугировали в течение 1 мин при относительной центробежной силе 2000 (rcf) и 4°C. Планшет промывали два раза 600 мкл промывочного буфера на лунку с центрифугированием в течение 3 мин при 3000 rcf и 4°C для каждого промывания. Образцы ферментов элюировали добавлением 200 мкл элюирующего буфера (50 мМ фосфат натрия, pH 7,5, 300 мМ NaCl, 250 мМ имидазола, 0,1% об./об. реагента TWEEN®-20) посредством центрифугирования в течение 1 мин при 3000 rcf при 4°C. [135] T7RNAP was purified from contaminant-free E. coli lysates by metal affinity chromatography using nickel plated HIS-Select® high volume (HC) plates (Sigma) according to the manufacturer's instructions. HIS-Select® plates were equilibrated with a total of 800 µl wash buffer (50 mM sodium phosphate, pH 7.5, 300 mM NaCl, 25 mM imidazole, 0.1% v/v TWEEN- 20® reagent [Sigma]) per well . Then 200 μl of HTP lysate containing T7RNAP and 200 μl of wash buffer were mixed, placed in a plate and centrifuged for 1 min at a relative centrifugal force of 2000 (rcf) and 4°C. The plate was washed twice with 600 μl of wash buffer per well with centrifugation for 3 min at 3000 rcf and 4°C for each wash. Enzyme samples were eluted by adding 200 µl of elution buffer (50 mM sodium phosphate, pH 7.5, 300 mM NaCl, 250 mM imidazole, 0.1% v/v TWEEN ® -20 reagent) by centrifugation for 1 min at 3000 rcf at 4°C.
[136] Элюаты подвергали замене буфера с использованием обессоливающих планшетов Zeba™ Spin (Thermo Fisher). В кратком изложении, планшеты уравновешивали два раза посредством 375 мкл 2× буфера для хранения T7RNAP (100 мМ Tris.HCl, pH 8,0, 200 мМ NaCl, 2 мМ DTT, 2 мМ EDTA, 0,2% масс./об. Triton X-100) на лукну и центрифугировали в течение 2 мин при 1100 xg при 4°C. В обессоливающие планшеты помещали 100 мкл элюата с планшета для образца HIS-Select® и центрифугировали в течение 2 мин при 1100 rcf при 4°C. Элюат с обессоливающего планшета сохраняли и смешивали с равным объемом глицерина для конечной концентрации буфера для хранения, содержавшего 50 мМ Tris HCl pH 8,0, 100 мМ NaCl, 1 мМ DTT, 1 мМ EDTA, 0,1% об./об. Triton X-100 и 50% глицерин (об./об.). [136] The eluates were buffer exchanged using Zeba™ Spin desalting plates (Thermo Fisher). Briefly, the plates were equilibrated two times with 375 μl of 2x T7RNAP storage buffer (100 mM Tris.HCl, pH 8.0, 200 mM NaCl, 2 mM DTT, 2 mM EDTA, 0.2% w/v Triton X-100) on onion and centrifuged for 2 min at 1100 xg at 4°C. 100 μl of eluate from the HIS-Select® sample plate was placed in desalting plates and centrifuged for 2 min at 1100 rcf at 4°C. The eluate from the desalting plate was saved and mixed with an equal volume of glycerol for final concentration of storage buffer containing 50 mM Tris HCl pH 8.0, 100 mM NaCl, 1 mM DTT, 1 mM EDTA, 0.1% v/v. Triton X-100 and 50% glycerin (v/v).
[137] Отсутствие контаминации РНК-азой в очищенных образцах подтверждали с использованием анализа RNase Alert (IDT, Life Technologies). Анализ SDS-PAGE для образцов T7RNAP продемонстрировал отсутствие поддающихся обнаружению соответствующих контаминации полос для большинства образцов. [137] The absence of RNase contamination in the purified samples was confirmed using the RNase Alert assay (IDT, Life Technologies). SDS-PAGE analysis of T7RNAP samples showed no detectable bands corresponding to contamination for most of the samples.
[138] Для реакций транскрипции in vitro с использованием HTP-очищенной T7RNAP, очищенную полимеразу добавляли до конечной концентрации 10% общего объема реакции (5% для фермента из культур во вращающихся флаконах). [138] For in vitro transcription reactions using HTP-purified T7RNAP, purified polymerase was added to a final concentration of 10% of the total reaction volume (5% for enzyme from shake flask cultures).
ПРИМЕР 3EXAMPLE 3
Экспрессия во вращающихся флаконах и очистка РНК-полимеразы T7Roller flask expression and purification of T7 RNA polymerase
[139] В этом примере описаны эксперименты, вовлекающие экспрессию во вращающихся флаконах и очистку T7RNAP. [139] This example describes experiments involving spin flask expression and purification of T7RNAP.
Экспрессия во вращающихся флаконахExpression in spinner flasks
[140] Отобранные культуры HTP, выращенные как описано в примере 2, высевали на чашки с агаром LB с 1% глюкозой и 30 мкг/мл хлорамфеникола и выращивали в течение ночи при 37°C. Единичную колонию из каждой культуры переносили в 6 мл бульона LB с 1% глюкозой и 30 мкг/мл хлорамфеникола. Культуры выращивали в течение 18 ч при 30°C, 250 об/мин и субкультивировали при разведении приблизительно 1:10 в 250 мл среды Terrific Broth с 30 мкг/мл хлорамфеникола до конечной OD600 0,2. Культуры инкубировали в течение приблизительно 3 часов при 30°C, 250 об/мин, до OD600 0,6-0,8, а затем индуцировали добавлением IPTG в конечной концентрации 1 мМ. Индуцированные культуры инкубировали в течение 20 ч при 30°C, 250 об/мин. После этого периода инкубации культуры центрифугировали при 4000 об/мин×10 мин. Культуральный супернатант удаляли и осадки ресуспендировали в 35 мл лизирующего буфера (50 мМ NaH2PO4, pH 7,5, 500 мМ NaCl, 0,1% Tween-20, 10 мМ имидазол). Эту клеточную суспензию охлаждали на ледяной бане и лизировали с использованием устройства для разрушения клеток Microfluidizer (Microfluidics M‐110L). Неочищенный лизат осаждали центрифугированием (16000 об/мин в течение 60 мин при 4°C), а затем супернатант фильтровали через 0,2-мкм мембрану PES для дальнейшей очистки лизата. [140] Selected HTP cultures grown as described in Example 2 were plated on LB agar plates with 1% glucose and 30 μg/ml chloramphenicol and grown overnight at 37°C. A single colony from each culture was transferred to 6 ml LB broth with 1% glucose and 30 μg/ml chloramphenicol. Cultures were grown for 18 hours at 30°C, 250 rpm and subcultured at a dilution of approximately 1:10 in 250 ml Terrific Broth with 30 μg/ml chloramphenicol to a final OD 600 of 0.2. Cultures were incubated for approximately 3 hours at 30°C, 250 rpm, to an OD 600 of 0.6-0.8, and then induced by adding IPTG at a final concentration of 1 mm. The induced cultures were incubated for 20 h at 30°C, 250 rpm. After this incubation period, the cultures were centrifuged at 4000 rpm x 10 min. The culture supernatant was removed and the pellets were resuspended in 35 ml of lysis buffer (50 mM NaH 2 PO 4 , pH 7.5, 500 mM NaCl, 0.1% Tween-20, 10 mM imidazole). This cell suspension was cooled in an ice bath and lysed using a Microfluidizer cell disruptor (Microfluidics M-110L). The crude lysate was precipitated by centrifugation (16,000 rpm for 60 min at 4°C) and then the supernatant was filtered through a 0.2 μm PES membrane for further purification of the lysate.
Очистка РНК-полимеразы T7 из лизатов из вращающихся флаконовPurification of T7 RNA polymerase from spinner vial lysates
[141] Лизаты T7RNAP очищали с использованием системы для очистки AKTA Start и 5-мл колонки HisTrap FF (GE Healthcare) с использованием условий AC Step HiF (рабочие параметры приведены ниже). Промывочный буфер SF содержал 50 мМ фосфат натрия, pH 7,5, 500 мМ NaCl, 0,1% об./об. реагента TWEEN-20® (Sigma) и 25 мМ имидазол. Элюирующий буфер SF содержал 50 мМ фосфат натрия, pH 7,5, 500 мМ NaCl, 0,1% об./об. реагента TWEEN-20® (Sigma) и 300 мМ имидазол. [141]Lysates T7RNAP was purified using the AKTA Start purification system and a 5 ml HisTrap FF column (GE Healthcare) using AC Step HiF conditions (operating parameters are shown below). Wash buffer SF contained 50 mM sodium phosphate, pH 7.5, 500 mM NaCl, 0.1% v/v. TWEEN-20 reagent® (Sigma) and 25 mM imidazole. The SF elution buffer contained 50 mM sodium phosphate, pH 7.5, 500 mM NaCl, 0.1% v/v. TWEEN-20 reagent® (Sigma) and 300 mM imidazole.
[142] Пять единичных наиболее концентрированных 3-мл фракций идентифицировали посредством УФ-поглощения (A280) и подвергали диализу в течение ночи в 2× буфере для хранения T7RNAP (100 мМ Tris HCl pH 8,0, 200 мМ NaCl, 2 мМ DTT, 2 мМ EDTA, 0,2% об./об. Triton X-100) в течение ночи в кассете для диализа 10K Slide-A-Lyzer™ (Thermo Fisher) для замены буфера в течение 16 часов, за которой следовала вторая замена буфера на 24 часа. К подвергнутому диализу материалу добавляли равный объем глицерина. Концентрации ферментов в препаратах количественно определяли посредством денситометрии на геле и по поглощению при 280 нм. [142] The five single most concentrated 3 ml fractions were identified by UV absorption (A280) and dialyzed overnight in 2× T7RNAP storage buffer (100 mM Tris HCl pH 8.0, 200 mM NaCl, 2 mM DTT, 2 mM EDTA, 0.2% v/v Triton X-100) overnight in a 10K Slide-A-Lyzer™ dialysis cassette (Thermo Fisher) for buffer exchange within 16 hours followed by a second buffer exchange for 24 hours. An equal volume of glycerol was added to the dialyzed material. Enzyme concentrations in preparations were quantified by gel densitometry and by absorbance at 280 nm.
ПРИМЕР 4EXAMPLE 4
Реакции транскрипцииTranscription reactions
[143] Реакции транскрипции проводили с аналогом кэпа альфа, гамма-бис(N7-метилгуанозин)трифосфатом (также обозначаемым в настоящем описании как "m7G(5')ppp(5')m7G," "кэпированный GTP" или "Cap") (см., Grudzien et. al., RNA, 10:1479-87 [2004]). Сконструированная ДНК-матрица для транскрипции GlmS-16A (SEQ ID NO: 5) включает промоторную последовательность T7RNAP, связанную с кодирующей последовательностью для рибопереключателя GlmS Bacillus anthracis (SEQ ID NO: 6). При индукции посредством его лиганда глюкозамин-6-фосфата рибопереключатель GlmS подвергается саморасщеплению и высвобождает 16-мерный РНК-нуклеотид (SEQ ID NO: 7) с 5'-конца транскрипта, который включает структуру кэпа или некэпированный 5'-фосфат. Этот небольшой 16-мерный продукт расщепления РНК-олигонуклеотида подвергали ионизации и анализу посредством LC-MS, который использовали, чтобы отличить кэпированные и некэпированные типы. [143]Transcription reactions were performed with the alpha cap analog, gamma-bis(N7-methylguanosine)triphosphate (also referred to herein as "m7G(5')ppp(5')m7G," "capped GTP" or "Cap") (see , Grudzienet. al.,RNA, 10:1479-87 [2004]). The engineered DNA template for GlmS-16A transcription (SEQ ID NO: 5) includes a T7RNAP promoter sequence linked to a coding sequence for the GlmS riboswitchBacillus anthracis(SEQ ID NO: 6). When induced by its glucosamine-6-phosphate ligand, the GlmS riboswitch undergoes self-cleavage and releases a 16-mer RNA nucleotide (SEQ ID NO: 7) from the 5' end of the transcript, which includes a cap structure or an uncapped 5'-phosphate. This small 16mer RNA oligonucleotide digest was ionized and analyzed by LC-MS, which was used to distinguish between capped and uncapped types.
[144] Реакции (30 мкл) проводили с конечными концентрациями 50 мМ Tris HCl pH 7,9, 30 мМ MgCl2, 10 мМ DTT, 6 мМ ATP, 6 мМ CTP, 6 мМ UTP, 4,8 мМ GTP, 1,2 мМ m7G(5')ppp(5')m7G, 50 нг/мкл матрицы транкрипции GlmS-16A, 1 Е/мкл ингибитора RNasin, и 6,4 мМ глюкозамин-6-фосфат. Глюкозамин-6-фосфат включали в начале реакции и расщеплению рибопереключателя позволяли протекать в ходе транскрипции in vitro в течение 4 часов. Для HTP-скрининга реакционные смеси гасили равным (30 мкл) объемом 40 мМ EDTA. Общее количество m7G(5')ppp(5')m7G и GTP поддерживали на уровне 6 мМ. [144] Reactions (30 µl) were performed with final concentrations of 50 mM Tris HCl pH 7.9, 30 mM MgCl 2 , 10 mM DTT, 6 mM ATP, 6 mM CTP, 6 mM UTP, 4.8 mM GTP, 1, 2 mM m7G(5')ppp(5')m7G, 50 ng/µl GlmS-16A transcription template, 1 U/µl RNasin inhibitor, and 6.4 mM glucosamine-6-phosphate. Glucosamine-6-phosphate was included at the start of the reaction and riboswitch cleavage was allowed to proceed during in vitro transcription for 4 hours. For HTP screening, reaction mixtures were quenched with an equal (30 μl) volume of 40 mM EDTA. The total amount of m7G(5')ppp(5')m7G and GTP was maintained at 6 mM.
ПРИМЕР 5EXAMPLE 5
Анализ активности LC-MSLC-MS Activity Analysis
[145] В этом примере описан способ LC-MS, разработанный для разделения фрагментов РНК меньшего размера с использованием системы Thermo LTQ MS для анализа более коротких кэпированных 5'- и некэпированных 5'-трифосфатных продуктов расщепления. [145] This example describes an LC-MS method designed to separate smaller RNA fragments using the Thermo LTQ MS system to analyze shorter capped 5' and uncapped 5' triphosphate cleavages.
[146] Кэпированные 7meG и 5'-трифосфатные некэпированные 16-мерные продукты расщепления (SEQ ID NO: 7) подвергали хроматографическому разделению (cм. фиг.1) от реагентов и более высокомолекулярных РНК с использованием способа обращено-фазовой ВЭЖХ с образованием ионных пар с использованием колонки C18 и подвижной фазы HFIP, обычно используемой для разделения олигонуклеотидов посредством масс-спектрометрии (см. таблицу 5.1). [146] Capped 7meG and 5'-triphosphate non-capped 16-mer cleavage products (SEQ ID NO: 7) were subjected to chromatographic separation (see FIG. 1) from reagents and higher molecular weight RNAs using a reversed-phase HPLC method with the formation of ion pairs using a C18 column and an HFIP mobile phase commonly used to separate oligonucleotides by mass spectrometry (see Table 5.1).
Таблица 5.1 Способ LC-MS, использованный для детекции кэпированных и некэпированных 16-мерных продуктов расщепленияTable 5.1 LC-MS Method Used to Detect Capped and Uncapped 16-mer Cleavages
(взвесить HFIP, медленно растворить добавляемую TEA)
B: 200 мМ HFIP, ~8,15 мМ TEA в смеси вода/метанол 50/50 (использовать A для получения B)A: 400 mM HFIP, ~16.3 mM* TEA in water, pH 7.9 (*TEA adjusted to desired pH)
(weigh HFIP, slowly dissolve added TEA)
B: 200 mM HFIP, ~8.15 mM TEA in water/methanol 50/50 (use A to make B)
Экстрагированные ионы BP для:
- Некэпированного 16-мерного продукта=903,8, 1084,6, 1355,9, 1361,4, 1808,1, 1815,6, 1820,8
- Кэпированного 16-мерного продукта=952,7, 1143,4, 1429,2, 1438,7, 1906,1, 1918,6, 1931,3LTQ; flow diversion from MS between 0-2 min and again between 5.5-7.5 min.
Extracted BP ions for:
- Uncapped 16-dimensional product = 903.8, 1084.6, 1355.9, 1361.4, 1808.1, 1815.6, 1820.8
- Capped 16-dimensional product = 952.7, 1143.4, 1429.2, 1438.7, 1906.1, 1918.6, 1931.3
[147] Определение основных пиков для кэпированных и некэпированных 16-мерных продуктов расщепления проводили с использованием семи ионов для каждого типа, включая множество отрицательных заряженных ионов и аддуктов металлов. Интенсивность пика для этих семи ионов использовали для получения сигнала для каждого из кэпированных и некэпированных 16-мерных продуктов расщепления. Эти оны включают множество заряженных состояний, а также аддукты натрия и калия (см. таблицу 5.2). Все ионы наблюдали в пределах 1 единицы массы от ожидаемых величин. [147] The determination of the main peaks for capped and uncapped 16-mer cleavage products was performed using seven ions for each type, including many negative charged ions and metal adducts. The peak intensity for these seven ions was used to generate a signal for each of the capped and uncapped 16-mer cleavage products. These ones include many charged states, as well as sodium and potassium adducts (see Table 5.2). All ions were observed within 1 mass unit of the expected values.
Таблица 5.2 Ионы, подвергнутые определению для масс-спектрометрической интеграцииTable 5.2 Ions determined for mass spectrometric integration
[148] Эффективность кэпирования в отношении WT T7RNAP (т.е "кратность улучшения относительно исходной молекулы" или "FIOP") вычисляли путем деления отношений интенсивности пиков кэпированных/некэпированных молекул для каждого образца на отношения, вычисленные для исходных контролей WT, присутствующих в каждом планшете (n=6-10). Величину FIOP использовали для ранжирования эффективности вариантов относительно WT T7RNAP или исходной молекулы из библиотеки, которые были включены в каждый планшет в качестве контролей. С использованием этого способа относительного количественного определения было возможным нивелирование различий в ионизации, которые присущи кэпированным и некэпированным молекулам, а также вариаций сигнала, обеспечиваемых партией подвижной фазы HFIP и концентрацией EDTA. [148] Capping efficiency against T7RNAP WT (i.e., "fold improvement over parent molecule" or "FIOP") was calculated by dividing the peak intensity ratios of the capped/uncapped molecules for each sample by the ratios calculated for the original WT controls present in each tablet (n=6-10). The FIOP value was used to rank the potency of the variants relative to WT T7RNAP or the original molecule from the library, which were included in each plate as controls. Using this relative quantitation method, it was possible to level out the differences in ionization that are inherent in capped and uncapped molecules, as well as the signal variations provided by the HFIP mobile phase batch and EDTA concentration.
Реакции транскрипции in vitro проводили, как описано в примере 4, с временем реакции и концентрациями m7G(5')ppp(5')m7G, как указано в таблицах, которые приведены ниже. В таблице 5.3, 5.4 и 5.5 представлено среднее увеличение активности для 3-6 реплик. В таблице 5.6 представлено среднее улучшение активности для вариантов, где была доступна информация для реплик. In vitro transcription reactions were carried out as described in Example 4 with reaction times and concentrations of m7G(5')ppp(5')m7G as indicated in the tables below. Tables 5.3, 5.4 and 5.5 show the average increase in activity for 3-6 replicas. Table 5.6 shows the average improvement in activity for cases where replica information was available.
Таблица 5.3 Увеличение активности вариантов T7RNAP Table 5.3 Increase in activity of T7RNAP variants
Таблица 5.4Table 5.4 Увеличение активности вариантаIncreasing variant activity T7RNAPT7RNAP
[149] Отмечалось, что вариант 85 имел не поддающиеся обнаружению уровни некэпированной мРНК в анализе LC-MS. [149] Option 85 was noted to have undetectable levels of uncapped mRNA in LC-MS analysis.
Таблица 5.5 Увеличение активности варианта T7RNAPTable 5.5 Increase in T7RNAP variant activity
Таблица 5.6 Увеличение активности варианта T7RNAPTable 5.6 Increase in T7RNAP variant activity
SEQ ID NO: 4amino acid changes relative to
SEQ ID NO: 4
+++ = ≥15
++ = 7-14,9
+ = 2-6,9Screening with 1 mM m7G(5')ppp(5')m7G, 5 mM GTP. The level of activity was determined relative to the reference polypeptide SEQ ID NO: 4. The increase in activity values correspond to:
+++ = ≥15
++ = 7-14.9
+=2-6.9
ПРИМЕР 6EXAMPLE 6
Определение выхода РНКDetermination of RNA yield
[150] Реакции транскрипции in vitro проводили, как описано в примере 4, но с использованием матрицы люциферазы (SEQ ID NO: 10). Выход мРНК из реакций транскрипции in vitro определяли в соответствии с протоколом изготовителя набора Quant-iT РНК Assay kit (широкий диапазон, Q-33140, Thermo Fisher). Содержание мРНК вычисляли с использованием стандартной кривой, построенной для стандартов мРНК, предоставленных с набором для анализа. [150]Transcription reactions in vitro was performed as described in Example 4, but using a luciferase template (SEQ ID NO: 10). mRNA release from transcription reactionsin vitro determined according to the manufacturer's protocol for the Quant-iT RNA Assay kit (wide range, Q-33140, Thermo Fisher). The mRNA content was calculated using a standard curve generated from the mRNA standards provided with the assay kit.
++ = > выход РНК 1,8 мг/мл, The reported output values correspond to:
++ => RNA yield 1.8 mg/ml,
ПРИМЕР 7EXAMPLE 7
Определение точности транскрипции варианта T7RNAPDetermination of Transcription Accuracy of the T7RNAP Variant
[151] Точность полимеразы определяли на основе прямого секвенирования большого количества клонов ОТ-ПЦР, полученных из мРНК, транскрибированной с варианта полимеразы. Реакции транскрипции in vitro проводили, как описано в примере 4, с использованием 0,5 мМ m7G(5')ppp(5')m7G, 5,5 мМ GTP и без использования глюкозамин-6-фосфата. Включение m7G(5')ppp(5')m7G позволяло количественное определение вклада этого аналога кэпа (при его наличии) в уровень погрешности для WT и вариантов полимераз в связанных со способом условиях. ДНК-матрица люциферазы размером 1,7 т.п.н. (SEQ ID NO: 8) служила в качестве ДНК-матрицы для транскрипции с использованием RNAP T7 дикого типа и вариантов RNAP T7 для получения полноразмерных мРНК-транскриптов. РНК выделяли с использованием набора Zymo RNA Clean and concentrator-25 (Zymo Research) и остаточную ДНК удаляли из образцов РНК посредством двух последовательных обработок набором DNA-free DNAase I (Ambion/ Thermo Fisher). Образцы подвергали обратной транскрипции и использованием обратной транскриптазы Accuprime (Agilent) с использованием олиго-(dT)25 праймера (SEQ ID NO: 40), гибридизующегося с поли(A)-хвостовой частью на матрице люциферазы. Затем реакционную смесь RT подвергали амплификации с использованием высокоточной ДНК-полимеразы PHUSION® с использованием буфера HF (New England Biolabs) посредством ПЦР с получением ампликона размером 1675 п.н. с использованием специфических для гена праймеров (SEQ ID NO: 12, SEQ ID NO: 13), гибридизующихся с кодирующей последовательностью люциферазы. Амплифицированные фрагменты расщепляли посредством BglI (New England Biolabs), лигировали в клонирующий вектор и трансформировали с получением единичных клонов в E. coli. [151] The accuracy of the polymerase was determined based on direct sequencing of a large number of RT-PCR clones obtained from mRNA transcribed from a polymerase variant. In vitro transcription reactions were performed as described in Example 4 using 0.5 mM m7G(5')ppp(5')m7G, 5.5 mM GTP and no glucosamine-6-phosphate. The inclusion of m7G(5')ppp(5')m7G allowed the quantification of the contribution of this cap analog (if present) to the error rate for WT and polymerase variants under method-related conditions. Luciferase DNA template 1.7 kb. (SEQ ID NO: 8) served as template DNA for transcription using wild-type T7 RNAP and T7 RNAP variants to generate full-length mRNA transcripts. RNA was isolated using the Zymo RNA Clean and concentrator-25 kit (Zymo Research) and residual DNA was removed from the RNA samples by two consecutive treatments with the DNA-free DNAase I kit (Ambion/Thermo Fisher). Samples were reverse transcribed using Accuprime reverse transcriptase (Agilent) using an oligo-(dT) 25 primer (SEQ ID NO: 40) hybridizing to the poly(A) tail on a luciferase template. The RT reaction mixture was then amplified using PHUSION® high fidelity DNA polymerase using HF buffer (New England Biolabs) by PCR to obtain a 1675 bp amplicon. using gene-specific primers (SEQ ID NO: 12, SEQ ID NO: 13) hybridizing to the luciferase coding sequence. The amplified fragments were digested with BglI (New England Biolabs), ligated into a cloning vector, and transformed into single clones in E. coli .
[152] Индивидуальные клоны отбирали и секвенировали с использованием стратегии мультиплексного баркодирования на платформе Ion Torrent PGM (Thermo Fisher). Баркодированные считанные последовательности подвергали обратной свертке, а затем последовательности индивидуальных клонов вновь собирали против предполагаемой последовательности матрицы для области размером 1632 п.н. между SEQ ID NO: 12 и SEQ ID NO: 13. Мутации, включая небольшие инсерции, делеции (т.е. инсерции-делеции) и однонуклеотидные полиморфизмы, регистрировали. Большинство мутаций представляли собой замены, хотя также наблюдались инсерции и делеции. Общее количество мутаций на пару оснований отсеквенированных происходящих из мРНК клонов вычисляли, и оно представлено в таблицах 7.1 и 7.2. Ожидаемые общие частоты мутаций на пару оснований, исходя из литературных данных, представляют собой сумму ошибок вследствие T7RNAP (1×10-4) (Huang et al., Biochem., 39:11571-11580 [2000]), обратной транскриптазы Accuscript (6×10-5) (Agilent; См., product literature) и ДНК-полимеразы Phusion (1,2×10-5) (20 циклов; см. литературу о продукте NEB) или в общем 1,72×10-4. Большинство вариантов полимераз продемонстрировали показатели ошибок, близкие к описанной в литературе величине для T7RNAP, даже в присутствии 0,5 мМ m7G(5')ppp(5')m7G. [152] Individual clones were selected and sequenced using a multiplex barcoding strategy on the Ion Torrent PGM platform (Thermo Fisher). The barcoded read sequences were defolded and then the individual clone sequences were reassembled against the predicted template sequence for the 1632 bp region. between SEQ ID NO: 12 and SEQ ID NO: 13. Mutations, including small insertions, deletions (ie insertions-deletions) and single nucleotide polymorphisms, were recorded. Most of the mutations were substitutions, although insertions and deletions were also observed. The total number of mutations per base pair of sequenced mRNA-derived clones was calculated and is presented in Tables 7.1 and 7.2. The expected total mutation rates per base pair, based on the literature data, are the sum of errors due to T7RNAP (1×10 -4 ) (Huang et al., Biochem., 39:11571-11580 [2000]), Accuscript reverse transcriptase (6 x10-5) (Agilent; See product literature) and Phusion DNA polymerase (1.2 x 10-5) (20 cycles; see NEB product literature) or 1.72 x 10 -4 in total. Most of the polymerase variants showed error rates close to those reported in the literature for T7RNAP, even in the presence of 0.5 mM m7G(5')ppp(5')m7G.
[153] Односторонний (правосторонний) биноминальный критерий использовали для вычисления случайности выборки для наблюдаемого количества ошибок (или более), учитывая количество отсеквенированных оснований, если фактический уровень ошибки в эксперименте равен наблюдаемой общей частоте ошибок для T7RNAP-WT в отдельных экспериментах, представленных в таблицах 7.1 и 7.2. Точность данного варианта считалась неотличимой от WT T7RNAP в этом анализе для величин p более 0,05. В таблице 7.1 "+" составляет менее 1,7*10-4, и "-" превышает 1,7*10-4 в столбце результата "наблюдаемая частота ошибок", в то время как "+" представляет собой p > 0,05 и "-" представляет собой 0< 0,05 в столбце результата "биномиальный критерий". В таблице 7.2 "+" составляет менее 1,5×10-4 и "-" превышает 1,5×10-4 в столбце результата "наблюдаемая частота ошибок", в то время как "+" представляет собой p > 0,05 и "-" представляет собой p < 0,05 в столбце результата "биномиальный критерий". [153] A one-tailed (right-tailed) binomial test was used to calculate the randomness of sampling for the observed number of errors (or more) given the number of sequenced bases, if the actual error rate in the experiment is equal to the observed total error rate for T7RNAP-WT in the individual experiments presented in the tables. 7.1 and 7.2. The accuracy of this variant was considered indistinguishable from WT T7RNAP in this assay for p-values greater than 0.05. In Table 7.1, "+" is less than 1.7*10 -4 and "-" is greater than 1.7*10 -4 in the result column "observed error rate", while "+" represents p > 0, 05 and "-" represents 0<0.05 in the "binomial test" result column. In Table 7.2, "+" is less than 1.5×10 -4 and "-" is greater than 1.5×10 -4 in the result column "observed error rate", while "+" is p > 0.05 and "-" represents p < 0.05 in the result column "binomial test".
Таблица 7.1 Частоты ошибок для некоторых вариантов T7RNAP Table 7.1 Error rates for some T7RNAP variants
Таблица 7.2 Частоты ошибок для некоторых вариантов T7RNAPTable 7.2 Error rates for some T7RNAP variants
[154] Хотя изобретение описано применительно к конкретным вариантам осуществления, могут быть осуществлены различные изменения и эквиваленты могут быть заменены для приспособления к конкретной мутации, материалу, композиции, процессу, стадии или стадиям процесса, тем самым обеспечивая пользу изобретения без отклонения от объема формулы изобретения. [154] While the invention has been described in terms of specific embodiments, various changes may be made and equivalents may be substituted to suit a particular mutation, material, composition, process, process step or steps, thereby providing the benefit of the invention without departing from the scope of the claims. .
[155] Для всех целей в США каждая публикация и патентный документ, цитированные в настоящем описании, включены в настоящее описание в качестве ссылок, как если бы было конкретно и индивидуально указано, что каждая такая публикация включена в настоящее описание в качестве ссылки. Цитирование публикаций и патентных документов не предназначено для указания на то, что какой-либо из таких документов является соответствующим документом уровня техники, а также не является допущение в отношении его содержания или даты. [155] For all US purposes, each publication and patent document cited herein is incorporated herein by reference, as if it were specifically and individually indicated that each such publication is incorporated herein by reference. The citation of publications and patent documents is not intended to indicate that any such document is a relevant prior art document, nor is it an admission as to its content or date.
--->--->
СПИСОК ПОСЛЕДОВАТЕЛЬНОСТЕЙSEQUENCE LIST
<110> CODEXIS, INC.<110> CODEXIS, INC.
ALEXION PHARMACEUTICALS, INC. ALEXION PHARMACEUTICALS, INC.
<120> ВАРИАНТЫ РНК-ПОЛИМЕРАЗЫ T7<120> T7 RNA POLYMERASE VARIANTS
<130> CX8-168USP1<130>CX8-168USP1
<140> ЕЩЕ НЕ ПРИСВОЕН<140> NOT YET ASSIGNED
<141> ПРИГАЛАЕТСЯ СЮДА<141> COMES HERE
<160> 40<160> 40
<210> 1<210> 1
<211> 2649<211> 2649
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> T7РНКP дикого типа<223> Wild-type T7RNAP
<400> 1<400> 1
atgaacacga ttaacatcgc taagaacgac ttctctgaca tcgaactggc tgctatcccg 60atgaacacga ttaacatcgc taagaacgac ttctctgaca tcgaactggc tgctatcccg 60
ttcaacactc tggctgacca ttacggtgag cgtttagctc gcgaacagtt ggcccttgag 120ttcaacactc tggctgacca ttacggtgag cgtttagctc gcgaacagtt ggcccttgag 120
catgagtctt acgagatggg tgaagcacgc ttccgcaaga tgtttgagcg tcaacttaaa 180catgagtctt acgagatggg tgaagcacgc ttccgcaaga tgtttgagcg tcaacttaaa 180
gctggtgagg ttgcggataa cgctgccgcc aagcctctca tcactaccct actccctaag 240gctggtgagg ttgcggataa cgctgccgcc aagcctctca tcactaccct actccctaag 240
atgattgcac gcatcaacga ctggtttgag gaagtgaaag ctaagcgcgg caagcgcccg 300atgattgcac gcatcaacga ctggtttgag gaagtgaaag ctaagcgcgg caagcgcccg 300
acagccttcc agttcctgca agaaatcaag ccggaagccg tagcgtacat caccattaag 360acagccttcc agttcctgca agaaatcaag ccggaagccg tagcgtacat caccattaag 360
accactctgg cttgcctaac cagtgctgac aatacaaccg ttcaggctgt agcaagcgca 420accactctgg cttgcctaac cagtgctgac aatacaaccg ttcaggctgt agcaagcgca 420
atcggtcggg ccattgagga cgaggctcgc ttcggtcgta tccgtgacct tgaagctaag 480atcggtcggg ccattgagga cgaggctcgc ttcggtcgta tccgtgacct tgaagctaag 480
cacttcaaga aaaacgttga ggaacaactc aacaagcgcg tagggcacgt ctacaagaaa 540cacttcaaga aaaacgttga ggaacaactc aacaagcgcg tagggcacgt ctacaagaaa 540
gcatttatgc aagttgtcga ggctgacatg ctctctaagg gtctactcgg tggcgaggcg 600gcatttatgc aagttgtcga ggctgacatg ctctctaagg gtctactcgg tggcgaggcg 600
tggtcttcgt ggcataagga agactctatt catgtaggag tacgctgcat cgagatgctc 660tggtcttcgt ggcataagga agactctatt catgtaggag tacgctgcat cgagatgctc 660
attgagtcaa ccggaatggt tagcttacac cgccaaaatg ctggcgtagt aggtcaagac 720attgagtcaa ccggaatggt tagcttacac cgccaaaatg ctggcgtagt aggtcaagac 720
tctgagacta tcgaactcgc acctgaatac gctgaggcta tcgcaacccg tgcaggtgcg 780tctgagacta tcgaactcgc acctgaatac gctgaggcta tcgcaacccg tgcaggtgcg 780
ctggctggca tctctccgat gttccaacct tgcgtagttc ctcctaagcc gtggactggc 840ctggctggca tctctccgat gttccaacct tgcgtagttc ctcctaagcc gtggactggc 840
attactggtg gtggctattg ggctaacggt cgtcgtcctc tggcgctggt gcgtactcac 900attactggtg gtggctattg ggctaacggt cgtcgtcctc tggcgctggt gcgtactcac 900
agtaagaaag cactgatgcg ctacgaagac gtttacatgc ctgaggtgta caaagcgatt 960agtaagaaag cactgatgcg ctacgaagac gtttacatgc ctgaggtgta caaagcgatt 960
aacattgcgc aaaacaccgc atggaaaatc aacaagaaag tcctagcggt cgccaacgta 1020aacattgcgc aaaacaccgc atggaaaatc aacaagaaag tcctagcggt cgccaacgta 1020
atcaccaagt ggaagcattg tccggtcgag gacatccctg cgattgagcg tgaagaactc 1080atcaccaagt ggaagcattg tccggtcgag gacatccctg cgattgagcg tgaagaactc 1080
ccgatgaaac cggaagacat cgacatgaat cctgaggctc tcaccgcgtg gaaacgtgct 1140ccgatgaaac cggaagacat cgacatgaat cctgaggctc tcaccgcgtg gaaacgtgct 1140
gccgctgctg tgtaccgcaa ggacaaggct cgcaagtctc gccgtatcag ccttgagttc 1200gccgctgctg tgtaccgcaa ggacaaggct cgcaagtctc gccgtatcag ccttgagttc 1200
atgcttgagc aagccaataa gtttgctaac cataaggcca tctggttccc ttacaacatg 1260atgcttgagc aagccaataa gtttgctaac cataaggcca tctggttccc ttacaacatg 1260
gactggcgcg gtcgtgttta cgctgtgtca atgttcaacc cgcaaggtaa cgatatgacc 1320gactggcgcg gtcgtgttta cgctgtgtca atgttcaacc cgcaaggtaa cgatatgacc 1320
aaaggactgc ttacgctggc gaaaggtaaa ccaatcggta aggaaggtta ctactggctg 1380aaaggactgc ttacgctggc gaaaggtaaa ccaatcggta aggaaggtta ctactggctg 1380
aaaatccacg gtgcaaactg tgcgggtgtc gataaggttc cgttccctga gcgcatcaag 14401440
ttcattgagg aaaaccacga gaacatcatg gcttgcgcta agtctccact ggagaacact 1500ttcattgagg aaaaccacga gaacatcatg gcttgcgcta agtctccact ggagaacact 1500
tggtgggctg agcaagattc tccgttctgc ttccttgcgt tctgctttga gtacgctggg 1560tggtgggctg agcaagattc tccgttctgc ttccttgcgt tctgctttga gtacgctggg 1560
gtacagcacc acggcctgag ctataactgc tcccttccgc tggcgtttga cgggtcttgc 1620gtacagcacc acggcctgag ctataactgc tcccttccgc tggcgtttga cgggtcttgc 1620
tctggcatcc agcacttctc cgcgatgctc cgagatgagg taggtggtcg cgcggttaac 1680tctggcatcc agcacttctc cgcgatgctc cgagatgagg taggtggtcg cgcggttaac 1680
ttgcttccta gtgaaaccgt tcaggacatc tacgggattg ttgctaagaa agtcaacgag 1740ttgcttccta gtgaaaccgt tcaggacatc tacgggattg ttgctaagaa agtcaacgag 1740
attctacaag cagacgcaat caatgggacc gataacgaag tagttaccgt gaccgatgag 1800attctacaag cagacgcaat caatgggacc gataacgaag tagttaccgt gaccgatgag 1800
aacactggtg aaatctctga gaaagtcaag ctgggcacta aggcactggc tggtcaatgg 1860aacactggtg aaatctctga gaaagtcaag ctgggcacta aggcactggc tggtcaatgg 1860
ctggcttacg gtgttactcg cagtgtgact aagcgttcag tcatgacgct ggcttacggg 1920ctggcttacg gtgttactcg cagtgtgact aagcgttcag tcatgacgct ggcttacggg 1920
tccaaagagt tcggcttccg tcaacaagtg ctggaagata ccattcagcc agctattgat 1980tccaaagagt tcggcttccg tcaacaagtg ctggaagata ccattcagcc agctattgat 1980
tccggcaagg gtctgatgtt cactcagccg aatcaggctg ctggatacat ggctaagctg 2040tccggcaagg gtctgatgtt cactcagccg aatcaggctg ctggatacat ggctaagctg 2040
atttgggaat ctgtgagcgt gacggtggta gctgcggttg aagcaatgaa ctggcttaag 2100atttgggaat ctgtgagcgt gacggtggta gctgcggttg aagcaatgaa ctggcttaag 2100
tctgctgcta agctgctggc tgctgaggtc aaagataaga agactggaga gattcttcgc 2160tctgctgcta agctgctggc tgctgaggtc aaagataaga agactggaga gattcttcgc 2160
aagcgttgcg ctgtgcattg ggtaactcct gatggtttcc ctgtgtggca ggaatacaag 2220aagcgttgcg ctgtgcattg ggtaactcct gatggtttcc ctgtgtggca ggaatacaag 2220
aagcctattc agacgcgctt gaacctgatg ttcctcggtc agttccgctt acagcctacc 2280aagcctattc agacgcgctt gaacctgatg ttcctcggtc agttccgctt acagcctacc 2280
attaacacca acaaagatag cgagattgat gcacacaaac aggagtctgg tatcgctcct 2340attaacacca acaaagatag cgagattgat gcacacaaac aggagtctgg tatcgctcct 2340
aactttgtac acagccaaga cggtagccac cttcgtaaga ctgtagtgtg ggcacacgag 2400aactttgtac acagccaaga cggtagccac cttcgtaaga ctgtagtgtg ggcacacgag 2400
aagtacggaa tcgaatcttt tgcactgatt cacgactcct tcggtaccat tccggctgac 2460aagtacggaa tcgaatcttt tgcactgatt cacgactcct tcggtaccat tccggctgac 2460
gctgcgaacc tgttcaaagc agtgcgcgaa actatggttg acacatatga gtcttgtgat 2520gctgcgaacc tgttcaaagc agtgcgcgaa actatggttg acacatatga gtcttgtgat 2520
gtactggctg atttctacga ccagttcgct gaccagttgc acgagtctca attggacaaa 2580gtactggctg atttctacga ccagttcgct gaccagttgc acgagtctca attggacaaa 2580
atgccagcac ttccggctaa aggtaacttg aacctccgtg acatcttaga gtcggacttc 2640atgccagcac ttccggctaa aggtaacttg aacctccgtg acatcttaga gtcggacttc 2640
gcgttcgcg 2649gcgttcgcg 2649
<210> 2<210> 2
<211> 883<211> 883
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> T7РНКP дикого типа<223> Wild-type T7RNAP
<400> 2<400> 2
Met Asn Thr Ile Asn Ile Ala Lys Asn Asp Phe Ser Asp Ile Glu Leu Met Asn Thr Ile Asn Ile Ala Lys Asn Asp Phe Ser Asp Ile Glu Leu
1 5 10 15 1 5 10 15
Ala Ala Ile Pro Phe Asn Thr Leu Ala Asp His Tyr Gly Glu Arg Leu Ala Ala Ile Pro Phe Asn Thr Leu Ala Asp His Tyr Gly Glu Arg Leu
20 25 30 20 25 30
Ala Arg Glu Gln Leu Ala Leu Glu His Glu Ser Tyr Glu Met Gly Glu Ala Arg Glu Gln Leu Ala Leu Glu His Glu Ser Tyr Glu Met Gly Glu
35 40 45 35 40 45
Ala Arg Phe Arg Lys Met Phe Glu Arg Gln Leu Lys Ala Gly Glu Val Ala Arg Phe Arg Lys Met Phe Glu Arg Gln Leu Lys Ala Gly Glu Val
50 55 60 50 55 60
Ala Asp Asn Ala Ala Ala Lys Pro Leu Ile Thr Thr Leu Leu Pro Lys Ala Asp Asn Ala Ala Ala Lys Pro Leu Ile Thr Thr Leu Leu Pro Lys
65 70 75 80 65 70 75 80
Met Ile Ala Arg Ile Asn Asp Trp Phe Glu Glu Val Lys Ala Lys Arg Met Ile Ala Arg Ile Asn Asp Trp Phe Glu Glu Val Lys Ala Lys Arg
85 90 95 85 90 95
Gly Lys Arg Pro Thr Ala Phe Gln Phe Leu Gln Glu Ile Lys Pro Glu Gly Lys Arg Pro Thr Ala Phe Gln Phe Leu Gln Glu Ile Lys Pro Glu
100 105 110 100 105 110
Ala Val Ala Tyr Ile Thr Ile Lys Thr Thr Leu Ala Cys Leu Thr Ser Ala Val Ala Tyr Ile Thr Ile Lys Thr Thr Leu Ala Cys Leu Thr Ser
115 120 125 115 120 125
Ala Asp Asn Thr Thr Val Gln Ala Val Ala Ser Ala Ile Gly Arg Ala Ala Asp Asn Thr Thr Val Gln Ala Val Ala Ser Ala Ile Gly Arg Ala
130 135 140 130 135 140
Ile Glu Asp Glu Ala Arg Phe Gly Arg Ile Arg Asp Leu Glu Ala Lys Ile Glu Asp Glu Ala Arg Phe Gly Arg Ile Arg Asp Leu Glu Ala Lys
145 150 155 160 145 150 155 160
His Phe Lys Lys Asn Val Glu Glu Gln Leu Asn Lys Arg Val Gly His His Phe Lys Lys Asn Val Glu Glu Gln Leu Asn Lys Arg Val Gly His
165 170 175 165 170 175
Val Tyr Lys Lys Ala Phe Met Gln Val Val Glu Ala Asp Met Leu Ser Val Tyr Lys Lys Ala Phe Met Gln Val Val Glu Ala Asp Met Leu Ser
180 185 190 180 185 190
Lys Gly Leu Leu Gly Gly Glu Ala Trp Ser Ser Trp His Lys Glu Asp Lys Gly Leu Leu Gly Gly Glu Ala Trp Ser Ser Trp His Lys Glu Asp
195 200 205 195 200 205
Ser Ile His Val Gly Val Arg Cys Ile Glu Met Leu Ile Glu Ser Thr Ser Ile His Val Gly Val Arg Cys Ile Glu Met Leu Ile Glu Ser Thr
210 215 220 210 215 220
Gly Met Val Ser Leu His Arg Gln Asn Ala Gly Val Val Gly Gln Asp Gly Met Val Ser Leu His Arg Gln Asn Ala Gly Val Val Gly Gln Asp
225 230 235 240 225 230 235 240
Ser Glu Thr Ile Glu Leu Ala Pro Glu Tyr Ala Glu Ala Ile Ala Thr Ser Glu Thr Ile Glu Leu Ala Pro Glu Tyr Ala Glu Ala Ile Ala Thr
245 250 255 245 250 255
Arg Ala Gly Ala Leu Ala Gly Ile Ser Pro Met Phe Gln Pro Cys Val Arg Ala Gly Ala Leu Ala Gly Ile Ser Pro Met Phe Gln Pro Cys Val
260 265 270 260 265 270
Val Pro Pro Lys Pro Trp Thr Gly Ile Thr Gly Gly Gly Tyr Trp Ala Val Pro Pro Lys Pro Trp Thr Gly Ile Thr Gly Gly Gly Tyr Trp Ala
275 280 285 275 280 285
Asn Gly Arg Arg Pro Leu Ala Leu Val Arg Thr His Ser Lys Lys Ala Asn Gly Arg Arg Pro Leu Ala Leu Val Arg Thr His Ser Lys Lys Ala
290 295 300 290 295 300
Leu Met Arg Tyr Glu Asp Val Tyr Met Pro Glu Val Tyr Lys Ala Ile Leu Met Arg Tyr Glu Asp Val Tyr Met Pro Glu Val Tyr Lys Ala Ile
305 310 315 320 305 310 315 320
Asn Ile Ala Gln Asn Thr Ala Trp Lys Ile Asn Lys Lys Val Leu Ala Asn Ile Ala Gln Asn Thr Ala Trp Lys Ile Asn Lys Lys Val Leu Ala
325 330 335 325 330 335
Val Ala Asn Val Ile Thr Lys Trp Lys His Cys Pro Val Glu Asp Ile Val Ala Asn Val Ile Thr Lys Trp Lys His Cys Pro Val Glu Asp Ile
340 345 350 340 345 350
Pro Ala Ile Glu Arg Glu Glu Leu Pro Met Lys Pro Glu Asp Ile Asp Pro Ala Ile Glu Arg Glu Glu Leu Pro Met Lys Pro Glu Asp Ile Asp
355 360 365 355 360 365
Met Asn Pro Glu Ala Leu Thr Ala Trp Lys Arg Ala Ala Ala Ala Val Met Asn Pro Glu Ala Leu Thr Ala Trp Lys Arg Ala Ala Ala Ala Val
370 375 380 370 375 380
Tyr Arg Lys Asp Lys Ala Arg Lys Ser Arg Arg Ile Ser Leu Glu Phe Tyr Arg Lys Asp Lys Ala Arg Lys Ser Arg Arg Ile Ser Leu Glu Phe
385 390 395 400 385 390 395 400
Met Leu Glu Gln Ala Asn Lys Phe Ala Asn His Lys Ala Ile Trp Phe Met Leu Glu Gln Ala Asn Lys Phe Ala Asn His Lys Ala Ile Trp Phe
405 410 415 405 410 415
Pro Tyr Asn Met Asp Trp Arg Gly Arg Val Tyr Ala Val Ser Met Phe Pro Tyr Asn Met Asp Trp Arg Gly Arg Val Tyr Ala Val Ser Met Phe
420 425 430 420 425 430
Asn Pro Gln Gly Asn Asp Met Thr Lys Gly Leu Leu Thr Leu Ala Lys Asn Pro Gln Gly Asn Asp Met Thr Lys Gly Leu Leu Thr Leu Ala Lys
435 440 445 435 440 445
Gly Lys Pro Ile Gly Lys Glu Gly Tyr Tyr Trp Leu Lys Ile His Gly Gly Lys Pro Ile Gly Lys Glu Gly Tyr Tyr Trp Leu Lys Ile His Gly
450 455 460 450 455 460
Ala Asn Cys Ala Gly Val Asp Lys Val Pro Phe Pro Glu Arg Ile Lys Ala Asn Cys Ala Gly Val Asp Lys Val Pro Phe Pro Glu Arg Ile Lys
465 470 475 480 465 470 475 480
Phe Ile Glu Glu Asn His Glu Asn Ile Met Ala Cys Ala Lys Ser Pro Phe Ile Glu Glu Asn His Glu Asn Ile Met Ala Cys Ala Lys Ser Pro
485 490 495 485 490 495
Leu Glu Asn Thr Trp Trp Ala Glu Gln Asp Ser Pro Phe Cys Phe Leu Leu Glu Asn Thr Trp Trp Ala Glu Gln Asp Ser Pro Phe Cys Phe Leu
500 505 510 500 505 510
Ala Phe Cys Phe Glu Tyr Ala Gly Val Gln His His Gly Leu Ser Tyr Ala Phe Cys Phe Glu Tyr Ala Gly Val Gln His His Gly Leu Ser Tyr
515 520 525 515 520 525
Asn Cys Ser Leu Pro Leu Ala Phe Asp Gly Ser Cys Ser Gly Ile Gln Asn Cys Ser Leu Pro Leu Ala Phe Asp Gly Ser Cys Ser Gly Ile Gln
530 535 540 530 535 540
His Phe Ser Ala Met Leu Arg Asp Glu Val Gly Gly Arg Ala Val Asn His Phe Ser Ala Met Leu Arg Asp Glu Val Gly Gly Arg Ala Val Asn
545 550 555 560 545 550 555 560
Leu Leu Pro Ser Glu Thr Val Gln Asp Ile Tyr Gly Ile Val Ala Lys Leu Leu Pro Ser Glu Thr Val Gln Asp Ile Tyr Gly Ile Val Ala Lys
565 570 575 565 570 575
Lys Val Asn Glu Ile Leu Gln Ala Asp Ala Ile Asn Gly Thr Asp Asn Lys Val Asn Glu Ile Leu Gln Ala Asp Ala Ile Asn Gly Thr Asp Asn
580 585 590 580 585 590
Glu Val Val Thr Val Thr Asp Glu Asn Thr Gly Glu Ile Ser Glu Lys Glu Val Val Thr Val Thr Asp Glu Asn Thr Gly Glu Ile Ser Glu Lys
595 600 605 595 600 605
Val Lys Leu Gly Thr Lys Ala Leu Ala Gly Gln Trp Leu Ala Tyr Gly Val Lys Leu Gly Thr Lys Ala Leu Ala Gly Gln Trp Leu Ala Tyr Gly
610 615 620 610 615 620
Val Thr Arg Ser Val Thr Lys Arg Ser Val Met Thr Leu Ala Tyr Gly Val Thr Arg Ser Val Thr Lys Arg Ser Val Met Thr Leu Ala Tyr Gly
625 630 635 640 625 630 635 640
Ser Lys Glu Phe Gly Phe Arg Gln Gln Val Leu Glu Asp Thr Ile Gln Ser Lys Glu Phe Gly Phe Arg Gln Gln Val Leu Glu Asp Thr Ile Gln
645 650 655 645 650 655
Pro Ala Ile Asp Ser Gly Lys Gly Leu Met Phe Thr Gln Pro Asn Gln Pro Ala Ile Asp Ser Gly Lys Gly Leu Met Phe Thr Gln Pro Asn Gln
660 665 670 660 665 670
Ala Ala Gly Tyr Met Ala Lys Leu Ile Trp Glu Ser Val Ser Val Thr Ala Ala Gly Tyr Met Ala Lys Leu Ile Trp Glu Ser Val Ser Val Thr
675 680 685 675 680 685
Val Val Ala Ala Val Glu Ala Met Asn Trp Leu Lys Ser Ala Ala Lys Val Val Ala Ala Val Glu Ala Met Asn Trp Leu Lys Ser Ala Ala Lys
690 695 700 690 695 700
Leu Leu Ala Ala Glu Val Lys Asp Lys Lys Thr Gly Glu Ile Leu Arg Leu Leu Ala Ala Glu Val Lys Asp Lys Lys Thr Gly Glu Ile Leu Arg
705 710 715 720 705 710 715 720
Lys Arg Cys Ala Val His Trp Val Thr Pro Asp Gly Phe Pro Val Trp Lys Arg Cys Ala Val His Trp Val Thr Pro Asp Gly Phe Pro Val Trp
725 730 735 725 730 735
Gln Glu Tyr Lys Lys Pro Ile Gln Thr Arg Leu Asn Leu Met Phe Leu Gln Glu Tyr Lys Lys Pro Ile Gln Thr Arg Leu Asn Leu Met Phe Leu
740 745 750 740 745 750
Gly Gln Phe Arg Leu Gln Pro Thr Ile Asn Thr Asn Lys Asp Ser Glu Gly Gln Phe Arg Leu Gln Pro Thr Ile Asn Thr Asn Lys Asp Ser Glu
755 760 765 755 760 765
Ile Asp Ala His Lys Gln Glu Ser Gly Ile Ala Pro Asn Phe Val His Ile Asp Ala His Lys Gln Glu Ser Gly Ile Ala Pro Asn Phe Val His
770 775 780 770 775 780
Ser Gln Asp Gly Ser His Leu Arg Lys Thr Val Val Trp Ala His Glu Ser Gln Asp Gly Ser His Leu Arg Lys Thr Val Val Trp Ala His Glu
785 790 795 800 785 790 795 800
Lys Tyr Gly Ile Glu Ser Phe Ala Leu Ile His Asp Ser Phe Gly Thr Lys Tyr Gly Ile Glu Ser Phe Ala Leu Ile His Asp Ser Phe Gly Thr
805 810 815 805 810 815
Ile Pro Ala Asp Ala Ala Asn Leu Phe Lys Ala Val Arg Glu Thr Met Ile Pro Ala Asp Ala Ala Asn Leu Phe Lys Ala Val Arg Glu Thr Met
820 825 830 820 825 830
Val Asp Thr Tyr Glu Ser Cys Asp Val Leu Ala Asp Phe Tyr Asp Gln Val Asp Thr Tyr Glu Ser Cys Asp Val Leu Ala Asp Phe Tyr Asp Gln
835 840 845 835 840 845
Phe Ala Asp Gln Leu His Glu Ser Gln Leu Asp Lys Met Pro Ala Leu Phe Ala Asp Gln Leu His Glu Ser Gln Leu Asp Lys Met Pro Ala Leu
850 855 860 850 855 860
Pro Ala Lys Gly Asn Leu Asn Leu Arg Asp Ile Leu Glu Ser Asp Phe Pro Ala Lys Gly Asn Leu Asn Leu Arg Asp Ile Leu Glu Ser Asp Phe
865 870 875 880 865 870 875 880
Ala Phe Ala Ala Phe Ala
<210> 3<210> 3
<211> 2673<211> 2673
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> 6His-T7РНКP <223> 6His-T7RNAP
<400> 3<400> 3
atgcaccatc accatcacca tatgaacacg attaacatcg ctaagaacga cttctctgac 60atgcaccatc accatcacca tatgaacacg attaacatcg ctaagaacga cttctctgac 60
atcgaactgg ctgctatccc gttcaacact ctggctgacc attacggtga gcgtttagct 120atcgaactgg ctgctatccc gttcaacact ctggctgacc attacggtga gcgtttagct 120
cgcgaacagt tggcccttga gcatgagtct tacgagatgg gtgaagcacg cttccgcaag 180cgcgaacagt tggcccttga gcatgagtct tacgagatgg gtgaagcacg cttccgcaag 180
atgtttgagc gtcaacttaa agctggtgag gttgcggata acgctgccgc caagcctctc 240atgtttgagc gtcaacttaa agctggtgag gttgcggata acgctgccgc caagcctctc 240
atcactaccc tactccctaa gatgattgca cgcatcaacg actggtttga ggaagtgaaa 300atcactaccc tactccctaa gatgattgca cgcatcaacg actggtttga ggaagtgaaa 300
gctaagcgcg gcaagcgccc gacagccttc cagttcctgc aagaaatcaa gccggaagcc 360gctaagcgcg gcaagcgccc gacagccttc cagttcctgc aagaaatcaa gccggaagcc 360
gtagcgtaca tcaccattaa gaccactctg gcttgcctaa ccagtgctga caatacaacc 420gtagcgtaca tcaccattaa gaccactctg gcttgcctaa ccagtgctga caatacaacc 420
gttcaggctg tagcaagcgc aatcggtcgg gccattgagg acgaggctcg cttcggtcgt 480gttcaggctg tagcaagcgc aatcggtcgg gccattgagg acgaggctcg cttcggtcgt 480
atccgtgacc ttgaagctaa gcacttcaag aaaaacgttg aggaacaact caacaagcgc 540atccgtgacc ttgaagctaa gcacttcaag aaaaacgttg aggaacaact caacaagcgc 540
gtagggcacg tctacaagaa agcatttatg caagttgtcg aggctgacat gctctctaag 600gtagggcacg tctacaagaa agcatttatg caagttgtcg aggctgacat gctctctaag 600
ggtctactcg gtggcgaggc gtggtcttcg tggcataagg aagactctat tcatgtagga 660ggtctactcg gtggcgaggc gtggtcttcg tggcataagg aagactctat tcatgtagga 660
gtacgctgca tcgagatgct cattgagtca accggaatgg ttagcttaca ccgccaaaat 720gtacgctgca tcgagatgct cattgagtca accggaatgg ttagcttaca ccgccaaaat 720
gctggcgtag taggtcaaga ctctgagact atcgaactcg cacctgaata cgctgaggct 780gctggcgtag taggtcaaga ctctgagact atcgaactcg cacctgaata cgctgaggct 780
atcgcaaccc gtgcaggtgc gctggctggc atctctccga tgttccaacc ttgcgtagtt 840atcgcaaccc gtgcaggtgc gctggctggc atctctccga tgttccaacc ttgcgtagtt 840
cctcctaagc cgtggactgg cattactggt ggtggctatt gggctaacgg tcgtcgtcct 900cctcctaagc cgtggactgg cattactggt ggtggctatt gggctaacgg tcgtcgtcct 900
ctggcgctgg tgcgtactca cagtaagaaa gcactgatgc gctacgaaga cgtttacatg 960ctggcgctgg tgcgtactca cagtaagaaa gcactgatgc gctacgaaga cgtttacatg 960
cctgaggtgt acaaagcgat taacattgcg caaaacaccg catggaaaat caacaagaaa 10201020
gtcctagcgg tcgccaacgt aatcaccaag tggaagcatt gtccggtcga ggacatccct 1080gtcctagcgg tcgccaacgt aatcaccaag tggaagcatt gtccggtcga ggacatccct 1080
gcgattgagc gtgaagaact cccgatgaaa ccggaagaca tcgacatgaa tcctgaggct 1140gcgattgagc gtgaagaact cccgatgaaa ccggaagaca tcgacatgaa tcctgaggct 1140
ctcaccgcgt ggaaacgtgc tgccgctgct gtgtaccgca aggacaaggc tcgcaagtct 1200ctcaccgcgt ggaaacgtgc tgccgctgct gtgtaccgca aggacaaggc tcgcaagtct 1200
cgccgtatca gccttgagtt catgcttgag caagccaata agtttgctaa ccataaggcc 1260cgccgtatca gccttgagtt catgcttgag caagccaata agtttgctaa ccataaggcc 1260
atctggttcc cttacaacat ggactggcgc ggtcgtgttt acgctgtgtc aatgttcaac 1320atctggttcc cttacaacat ggactggcgc ggtcgtgttt acgctgtgtc aatgttcaac 1320
ccgcaaggta acgatatgac caaaggactg cttacgctgg cgaaaggtaa accaatcggt 1380ccgcaaggta acgatatgac caaaggactg cttacgctgg cgaaaggtaa accaatcggt 1380
aaggaaggtt actactggct gaaaatccac ggtgcaaact gtgcgggtgt cgataaggtt 1440aaggaaggtt actactggct gaaaatccac ggtgcaaact gtgcgggtgt cgataaggtt 1440
ccgttccctg agcgcatcaa gttcattgag gaaaaccacg agaacatcat ggcttgcgct 1500ccgttccctg agcgcatcaa gttcattgag gaaaaccacg agaacatcat ggcttgcgct 1500
aagtctccac tggagaacac ttggtgggct gagcaagatt ctccgttctg cttccttgcg 1560aagtctccac tggagaacac ttggtgggct gagcaagatt ctccgttctg cttccttgcg 1560
ttctgctttg agtacgctgg ggtacagcac cacggcctga gctataactg ctcccttccg 1620ttctgctttg agtacgctgg ggtacagcac cacggcctga gctataactg ctcccttccg 1620
ctggcgtttg acgggtcttg ctctggcatc cagcacttct ccgcgatgct ccgagatgag 1680ctggcgtttg acgggtcttg ctctggcatc cagcacttct ccgcgatgct ccgagatgag 1680
gtaggtggtc gcgcggttaa cttgcttcct agtgaaaccg ttcaggacat ctacgggatt 1740gtaggtggtc gcgcggttaa cttgcttcct agtgaaaccg ttcaggacat ctacgggatt 1740
gttgctaaga aagtcaacga gattctacaa gcagacgcaa tcaatgggac cgataacgaa 1800gttgctaaga aagtcaacga gattctacaa gcagacgcaa tcaatgggac cgataacgaa 1800
gtagttaccg tgaccgatga gaacactggt gaaatctctg agaaagtcaa gctgggcact 1860gtagttaccg tgaccgatga gaacactggt gaaatctctg agaaagtcaa gctgggcact 1860
aaggcactgg ctggtcaatg gctggcttac ggtgttactc gcagtgtgac taagcgttca 1920aaggcactgg ctggtcaatg gctggcttac ggtgttactc gcagtgtgac taagcgttca 1920
gtcatgacgc tggcttacgg gtccaaagag ttcggcttcc gtcaacaagt gctggaagat 1980gtcatgacgc tggcttacgg gtccaaagag ttcggcttcc gtcaacaagt gctggaagat 1980
accattcagc cagctattga ttccggcaag ggtctgatgt tcactcagcc gaatcaggct 2040accattcagc cagctattga ttccggcaag ggtctgatgt tcactcagcc gaatcaggct 2040
gctggataca tggctaagct gatttgggaa tctgtgagcg tgacggtggt agctgcggtt 2100gctggataca tggctaagct gatttgggaa tctgtgagcg tgacggtggt agctgcggtt 2100
gaagcaatga actggcttaa gtctgctgct aagctgctgg ctgctgaggt caaagataag 2160gaagcaatga actggcttaa gtctgctgct aagctgctgg ctgctgaggt caaagataag 2160
aagactggag agattcttcg caagcgttgc gctgtgcatt gggtaactcc tgatggtttc 2220aagactggag agattcttcg caagcgttgc gctgtgcatt gggtaactcc tgatggtttc 2220
cctgtgtggc aggaatacaa gaagcctatt cagacgcgct tgaacctgat gttcctcggt 2280cctgtgtggc aggaatacaa gaagcctatt cagacgcgct tgaacctgat gttcctcggt 2280
cagttccgct tacagcctac cattaacacc aacaaagata gcgagattga tgcacacaaa 2340cagttccgct tacagcctac cattaacacc aacaaagata gcgagattga tgcacacaaa 2340
caggagtctg gtatcgctcc taactttgta cacagccaag acggtagcca ccttcgtaag 2400caggagtctg gtatcgctcc taactttgta cacagccaag acggtagcca ccttcgtaag 2400
actgtagtgt gggcacacga gaagtacgga atcgaatctt ttgcactgat tcacgactcc 2460actgtagtgt gggcacacga gaagtacgga atcgaatctt ttgcactgat tcacgactcc 2460
ttcggtacca ttccggctga cgctgcgaac ctgttcaaag cagtgcgcga aactatggtt 2520ttcggtacca ttccggctga cgctgcgaac ctgttcaaag cagtgcgcga aactatggtt 2520
gacacatatg agtcttgtga tgtactggct gatttctacg accagttcgc tgaccagttg 2580gacacatatg agtcttgtga tgtactggct gatttctacg accagttcgc tgaccagttg 2580
cacgagtctc aattggacaa aatgccagca cttccggcta aaggtaactt gaacctccgt 2640cacgagtctc aattggacaa aatgccagca cttccggcta aaggtaactt gaacctccgt 2640
gacatcttag agtcggactt cgcgttcgcg taa 2673gacatcttag agtcggactt cgcgttcgcg taa 2673
<210> 4<210> 4
<211> 890<211> 890
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> 6His-T7РНКP<223> 6His-T7RNAP
<400> 4<400> 4
Met His His His His His His Met Asn Thr Ile Asn Ile Ala Lys Asn Met His His His His His His Met Asn Thr Ile Asn Ile Ala Lys Asn
1 5 10 15 1 5 10 15
Asp Phe Ser Asp Ile Glu Leu Ala Ala Ile Pro Phe Asn Thr Leu Ala Asp Phe Ser Asp Ile Glu Leu Ala Ala Ile Pro Phe Asn Thr Leu Ala
20 25 30 20 25 30
Asp His Tyr Gly Glu Arg Leu Ala Arg Glu Gln Leu Ala Leu Glu His Asp His Tyr Gly Glu Arg Leu Ala Arg Glu Gln Leu Ala Leu Glu His
35 40 45 35 40 45
Glu Ser Tyr Glu Met Gly Glu Ala Arg Phe Arg Lys Met Phe Glu Arg Glu Ser Tyr Glu Met Gly Glu Ala Arg Phe Arg Lys Met Phe Glu Arg
50 55 60 50 55 60
Gln Leu Lys Ala Gly Glu Val Ala Asp Asn Ala Ala Ala Lys Pro Leu Gln Leu Lys Ala Gly Glu Val Ala Asp Asn Ala Ala Ala Lys Pro Leu
65 70 75 80 65 70 75 80
Ile Thr Thr Leu Leu Pro Lys Met Ile Ala Arg Ile Asn Asp Trp Phe Ile Thr Thr Leu Leu Pro Lys Met Ile Ala Arg Ile Asn Asp Trp Phe
85 90 95 85 90 95
Glu Glu Val Lys Ala Lys Arg Gly Lys Arg Pro Thr Ala Phe Gln Phe Glu Glu Val Lys Ala Lys Arg Gly Lys Arg Pro Thr Ala Phe Gln Phe
100 105 110 100 105 110
Leu Gln Glu Ile Lys Pro Glu Ala Val Ala Tyr Ile Thr Ile Lys Thr Leu Gln Glu Ile Lys Pro Glu Ala Val Ala Tyr Ile Thr Ile Lys Thr
115 120 125 115 120 125
Thr Leu Ala Cys Leu Thr Ser Ala Asp Asn Thr Thr Val Gln Ala Val Thr Leu Ala Cys Leu Thr Ser Ala Asp Asn Thr Thr Val Gln Ala Val
130 135 140 130 135 140
Ala Ser Ala Ile Gly Arg Ala Ile Glu Asp Glu Ala Arg Phe Gly Arg Ala Ser Ala Ile Gly Arg Ala Ile Glu Asp Glu Ala Arg Phe Gly Arg
145 150 155 160 145 150 155 160
Ile Arg Asp Leu Glu Ala Lys His Phe Lys Lys Asn Val Glu Glu Gln Ile Arg Asp Leu Glu Ala Lys His Phe Lys Lys Asn Val Glu Glu Gln
165 170 175 165 170 175
Leu Asn Lys Arg Val Gly His Val Tyr Lys Lys Ala Phe Met Gln Val Leu Asn Lys Arg Val Gly His Val Tyr Lys Lys Ala Phe Met Gln Val
180 185 190 180 185 190
Val Glu Ala Asp Met Leu Ser Lys Gly Leu Leu Gly Gly Glu Ala Trp Val Glu Ala Asp Met Leu Ser Lys Gly Leu Leu Gly Gly Glu Ala Trp
195 200 205 195 200 205
Ser Ser Trp His Lys Glu Asp Ser Ile His Val Gly Val Arg Cys Ile Ser Ser Trp His Lys Glu Asp Ser Ile His Val Gly Val Arg Cys Ile
210 215 220 210 215 220
Glu Met Leu Ile Glu Ser Thr Gly Met Val Ser Leu His Arg Gln Asn Glu Met Leu Ile Glu Ser Thr Gly Met Val Ser Leu His Arg Gln Asn
225 230 235 240 225 230 235 240
Ala Gly Val Val Gly Gln Asp Ser Glu Thr Ile Glu Leu Ala Pro Glu Ala Gly Val Val Gly Gln Asp Ser Glu Thr Ile Glu Leu Ala Pro Glu
245 250 255 245 250 255
Tyr Ala Glu Ala Ile Ala Thr Arg Ala Gly Ala Leu Ala Gly Ile Ser Tyr Ala Glu Ala Ile Ala Thr Arg Ala Gly Ala Leu Ala Gly Ile Ser
260 265 270 260 265 270
Pro Met Phe Gln Pro Cys Val Val Pro Pro Lys Pro Trp Thr Gly Ile Pro Met Phe Gln Pro Cys Val Val Pro Pro Lys Pro Trp Thr Gly Ile
275 280 285 275 280 285
Thr Gly Gly Gly Tyr Trp Ala Asn Gly Arg Arg Pro Leu Ala Leu Val Thr Gly Gly Gly Tyr Trp Ala Asn Gly Arg Arg Pro Leu Ala Leu Val
290 295 300 290 295 300
Arg Thr His Ser Lys Lys Ala Leu Met Arg Tyr Glu Asp Val Tyr Met Arg Thr His Ser Lys Lys Ala Leu Met Arg Tyr Glu Asp Val Tyr Met
305 310 315 320 305 310 315 320
Pro Glu Val Tyr Lys Ala Ile Asn Ile Ala Gln Asn Thr Ala Trp Lys Pro Glu Val Tyr Lys Ala Ile Asn Ile Ala Gln Asn Thr Ala Trp Lys
325 330 335 325 330 335
Ile Asn Lys Lys Val Leu Ala Val Ala Asn Val Ile Thr Lys Trp Lys Ile Asn Lys Lys Val Leu Ala Val Ala Asn Val Ile Thr Lys Trp Lys
340 345 350 340 345 350
His Cys Pro Val Glu Asp Ile Pro Ala Ile Glu Arg Glu Glu Leu Pro His Cys Pro Val Glu Asp Ile Pro Ala Ile Glu Arg Glu Glu Leu Pro
355 360 365 355 360 365
Met Lys Pro Glu Asp Ile Asp Met Asn Pro Glu Ala Leu Thr Ala Trp Met Lys Pro Glu Asp Ile Asp Met Asn Pro Glu Ala Leu Thr Ala Trp
370 375 380 370 375 380
Lys Arg Ala Ala Ala Ala Val Tyr Arg Lys Asp Lys Ala Arg Lys Ser Lys Arg Ala Ala Ala Ala Val Tyr Arg Lys Asp Lys Ala Arg Lys Ser
385 390 395 400 385 390 395 400
Arg Arg Ile Ser Leu Glu Phe Met Leu Glu Gln Ala Asn Lys Phe Ala Arg Arg Ile Ser Leu Glu Phe Met Leu Glu Gln Ala Asn Lys Phe Ala
405 410 415 405 410 415
Asn His Lys Ala Ile Trp Phe Pro Tyr Asn Met Asp Trp Arg Gly Arg Asn His Lys Ala Ile Trp Phe Pro Tyr Asn Met Asp Trp Arg Gly Arg
420 425 430 420 425 430
Val Tyr Ala Val Ser Met Phe Asn Pro Gln Gly Asn Asp Met Thr Lys Val Tyr Ala Val Ser Met Phe Asn Pro Gln Gly Asn Asp Met Thr Lys
435 440 445 435 440 445
Gly Leu Leu Thr Leu Ala Lys Gly Lys Pro Ile Gly Lys Glu Gly Tyr Gly Leu Leu Thr Leu Ala Lys Gly Lys Pro Ile Gly Lys Glu Gly Tyr
450 455 460 450 455 460
Tyr Trp Leu Lys Ile His Gly Ala Asn Cys Ala Gly Val Asp Lys Val Tyr Trp Leu Lys Ile His Gly Ala Asn Cys Ala Gly Val Asp Lys Val
465 470 475 480 465 470 475 480
Pro Phe Pro Glu Arg Ile Lys Phe Ile Glu Glu Asn His Glu Asn Ile Pro Phe Pro Glu Arg Ile Lys Phe Ile Glu Glu Asn His Glu Asn Ile
485 490 495 485 490 495
Met Ala Cys Ala Lys Ser Pro Leu Glu Asn Thr Trp Trp Ala Glu Gln Met Ala Cys Ala Lys Ser Pro Leu Glu Asn Thr Trp Trp Ala Glu Gln
500 505 510 500 505 510
Asp Ser Pro Phe Cys Phe Leu Ala Phe Cys Phe Glu Tyr Ala Gly Val Asp Ser Pro Phe Cys Phe Leu Ala Phe Cys Phe Glu Tyr Ala Gly Val
515 520 525 515 520 525
Gln His His Gly Leu Ser Tyr Asn Cys Ser Leu Pro Leu Ala Phe Asp Gln His His Gly Leu Ser Tyr Asn Cys Ser Leu Pro Leu Ala Phe Asp
530 535 540 530 535 540
Gly Ser Cys Ser Gly Ile Gln His Phe Ser Ala Met Leu Arg Asp Glu Gly Ser Cys Ser Gly Ile Gln His Phe Ser Ala Met Leu Arg Asp Glu
545 550 555 560 545 550 555 560
Val Gly Gly Arg Ala Val Asn Leu Leu Pro Ser Glu Thr Val Gln Asp Val Gly Gly Arg Ala Val Asn Leu Leu Pro Ser Glu Thr Val Gln Asp
565 570 575 565 570 575
Ile Tyr Gly Ile Val Ala Lys Lys Val Asn Glu Ile Leu Gln Ala Asp Ile Tyr Gly Ile Val Ala Lys Lys Val Asn Glu Ile Leu Gln Ala Asp
580 585 590 580 585 590
Ala Ile Asn Gly Thr Asp Asn Glu Val Val Thr Val Thr Asp Glu Asn Ala Ile Asn Gly Thr Asp Asn Glu Val Val Thr Val Thr Asp Glu Asn
595 600 605 595 600 605
Thr Gly Glu Ile Ser Glu Lys Val Lys Leu Gly Thr Lys Ala Leu Ala Thr Gly Glu Ile Ser Glu Lys Val Lys Leu Gly Thr Lys Ala Leu Ala
610 615 620 610 615 620
Gly Gln Trp Leu Ala Tyr Gly Val Thr Arg Ser Val Thr Lys Arg Ser Gly Gln Trp Leu Ala Tyr Gly Val Thr Arg Ser Val Thr Lys Arg Ser
625 630 635 640 625 630 635 640
Val Met Thr Leu Ala Tyr Gly Ser Lys Glu Phe Gly Phe Arg Gln Gln Val Met Thr Leu Ala Tyr Gly Ser Lys Glu Phe Gly Phe Arg Gln Gln
645 650 655 645 650 655
Val Leu Glu Asp Thr Ile Gln Pro Ala Ile Asp Ser Gly Lys Gly Leu Val Leu Glu Asp Thr Ile Gln Pro Ala Ile Asp Ser Gly Lys Gly Leu
660 665 670 660 665 670
Met Phe Thr Gln Pro Asn Gln Ala Ala Gly Tyr Met Ala Lys Leu Ile Met Phe Thr Gln Pro Asn Gln Ala Ala Gly Tyr Met Ala Lys Leu Ile
675 680 685 675 680 685
Trp Glu Ser Val Ser Val Thr Val Val Ala Ala Val Glu Ala Met Asn Trp Glu Ser Val Ser Val Thr Val Val Ala Ala Val Glu Ala Met Asn
690 695 700 690 695 700
Trp Leu Lys Ser Ala Ala Lys Leu Leu Ala Ala Glu Val Lys Asp Lys Trp Leu Lys Ser Ala Ala Lys Leu Leu Ala Ala Glu Val Lys Asp Lys
705 710 715 720 705 710 715 720
Lys Thr Gly Glu Ile Leu Arg Lys Arg Cys Ala Val His Trp Val Thr Lys Thr Gly Glu Ile Leu Arg Lys Arg Cys Ala Val His Trp Val Thr
725 730 735 725 730 735
Pro Asp Gly Phe Pro Val Trp Gln Glu Tyr Lys Lys Pro Ile Gln Thr Pro Asp Gly Phe Pro Val Trp Gln Glu Tyr Lys Lys Pro Ile Gln Thr
740 745 750 740 745 750
Arg Leu Asn Leu Met Phe Leu Gly Gln Phe Arg Leu Gln Pro Thr Ile Arg Leu Asn Leu Met Phe Leu Gly Gln Phe Arg Leu Gln Pro Thr Ile
755 760 765 755 760 765
Asn Thr Asn Lys Asp Ser Glu Ile Asp Ala His Lys Gln Glu Ser Gly Asn Thr Asn Lys Asp Ser Glu Ile Asp Ala His Lys Gln Glu Ser Gly
770 775 780 770 775 780
Ile Ala Pro Asn Phe Val His Ser Gln Asp Gly Ser His Leu Arg Lys Ile Ala Pro Asn Phe Val His Ser Gln Asp Gly Ser His Leu Arg Lys
785 790 795 800 785 790 795 800
Thr Val Val Trp Ala His Glu Lys Tyr Gly Ile Glu Ser Phe Ala Leu Thr Val Val Trp Ala His Glu Lys Tyr Gly Ile Glu Ser Phe Ala Leu
805 810 815 805 810 815
Ile His Asp Ser Phe Gly Thr Ile Pro Ala Asp Ala Ala Asn Leu Phe Ile His Asp Ser Phe Gly Thr Ile Pro Ala Asp Ala Ala Asn Leu Phe
820 825 830 820 825 830
Lys Ala Val Arg Glu Thr Met Val Asp Thr Tyr Glu Ser Cys Asp Val Lys Ala Val Arg Glu Thr Met Val Asp Thr Tyr Glu Ser Cys Asp Val
835 840 845 835 840 845
Leu Ala Asp Phe Tyr Asp Gln Phe Ala Asp Gln Leu His Glu Ser Gln Leu Ala Asp Phe Tyr Asp Gln Phe Ala Asp Gln Leu His Glu Ser Gln
850 855 860 850 855 860
Leu Asp Lys Met Pro Ala Leu Pro Ala Lys Gly Asn Leu Asn Leu Arg Leu Asp Lys Met Pro Ala Leu Pro Ala Lys Gly Asn Leu Asn Leu Arg
865 870 875 880 865 870 875 880
Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala
885 890 885 890
<210> 5<210> 5
<211> 3060<211> 3060
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> ДНК-матрица<223> DNA template
<400> 5<400> 5
gatcttcttg agatcctttt tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac 60gatcttcttg agatcctttt tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac 60
cgctaccagc ggtggtttgt ttgccggatc aagagctacc aactcttttt ccgaaggtaa 120cgctaccagc ggtggtttgt ttgccggatc aagagctacc aactcttttt ccgaaggtaa 120
ctggcttcag cagagcgcag ataccaaata ctgttcttct agtgtagccg tagttagccc 180ctggcttcag cagagcgcag ataccaaata ctgttcttct agtgtagccg tagttagccc 180
accacttcaa gaactctgta gcaccgccta catacctcgc tctgctaatc ctgttaccag 240accacttcaa gaactctgta gcaccgccta catacctcgc tctgctaatc ctgttaccag 240
tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac 300tggctgctgc cagtggcgat aagtcgtgtc ttaccggggtt ggactcaaga cgatagttac 300
cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc agcttggagc 360cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc agcttggagc 360
gaacgaccta caccgaactg agatacctac agcgtgagct atgagaaagc gccacgcttc 420gaacgaccta caccgaactg agatacctac agcgtgagct atgagaaagc gccacgcttc 420
ccgaagggag aaaggcggac aggtatccgg taagcggcag ggtcggaaca ggagagcgca 480ccgaagggag aaaggcggac aggtatccgg taagcggcag ggtcggaaca ggagagcgca 480
cgagggagct tccaggggga aacgcctggt atctttatag tcctgtcggg tttcgccacc 540cgagggagct tccaggggga aacgcctggt atctttatag tcctgtcggg tttcgccacc 540
tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg 600tctgacttga gcgtcgattt ttgtgatgct cgtcagggggg gcggagccta tggaaaaacg 600
ccagcaacgc ggccttttta cggttcctgg ccttttgctg gccttttgct cacatgttct 660ccagcaacgc ggccttttta cggttcctgg ccttttgctg gccttttgct cacatgttct 660
ttcctgcgtt atcccctgat tctgtggata accgtattac cgcctttgag tgagctgata 720ttcctgcgtt atcccctgat tctgtggata accgtattac cgcctttgag tgagctgata 720
ccgctcgccg cagccgaacg accgagcgca gcgagtcagt gagcgaggaa gcggaaggcg 780ccgctcgccg cagccgaacg accgagcgca gcgagtcagt gagcgaggaa gcggaaggcg 780
agagtaggga actgccaggc atcaaactaa gcagaaggcc cctgacggat ggcctttttg 840aggtaggga actgccaggc atcaaactaa gcagaaggcc cctgacggat ggcctttttg 840
cgtttctaca aactctttct gtgttgtaaa acgacggcca gtcttaagct cgggccccct 900cgtttctaca aactctttct gtgttgtaaa acgacggcca gtcttaagct cgggccccct 900
gggcggttct gataacgagt aatcgttaat ccgcaaataa cgtaaaaacc cgcttcggcg 960gggcggttct gataacgagt aatcgttaat ccgcaaataa cgtaaaaacc cgcttcggcg 960
ggttttttta tggggggagt ttagggaaag agcatttgtc agaatattta agggcgcctg 1020ggttttttta tggggggagt ttagggaaag agcatttgtc agaatattta agggcgcctg 1020
tcactttgct tgatatatga gaattattta accttataaa tgagaaaaaa gcaacgcact 1080tcactttgct tgatatatga gaattattta accttataaa tgagaaaaaa gcaacgcact 1080
ttaaataaga tacgttgctt tttcgattga tgaacaccta taattaaact attcatctat 1140ttaaataaga tacgttgctt tttcgattga tgaacaccta taattaaact attcatctat 1140
tatttatgat tttttgtata tacaatattt ctagtttgtt aaagagaatt aagaaaataa 1200tatttatgat tttttgtata tacaatattt ctagtttgtt aaagagaatt aagaaaataa 1200
atctcgaaaa taataaaggg aaaatcagtt tttgatatca aaattataca tgtcaacgat 1260atctcgaaaa taataaaggg 1260
aatacaaaat ataatacaaa ctataagatg ttatcagtat ttattatgca tttagaataa 13201320
attttgtgtc gcccttgtac ttagtcgctg aataatacga ctcactatag cggaacccaa 1380attttgtgtc gcccttgtac ttagtcgctg aataatacga ctcactatag cggaacccaa 1380
gctaagcgcc agaactggca ccttcgggtg ccagttgacg aggtggggtt tatcgagatt 14401440
tcggcggatg actcccggtt gttcatcaca accgcaagct tttacttaaa tcattaaggt 1500tcggcggatg actcccggtt gttcatcaca accgcaagct tttacttaaa tcattaaggt 1500
gacttagtgg acaaaggtga aagtgtgatg aaacccgacc tggacggagg cgcgcccgag 15601560
atgagtaggc tgtcccatca ggggaggaat cggggacggc tgaaaggcga gggcgccgaa 1620atgagtaggc tgtcccatca ggggaggaat cggggacggc tgaaaggcga gggcgccgaa 1620
gcgagcagag ttcctcccgc tctgcttggc tgggggtgag gggaataccc ttaccactgt 16801680
cgcgaaagcg gagagccgtc caggatcccg tcaaaagggc gacaccccat aattagcccg 1740cgcgaaagcg gagagccgtc caggatcccg tcaaaagggc gacaccccat aattagcccg 1740
ggcgaaaggc ccagtctttc gactgagcct ttcgttttat ttgatgcctg gcagttccct 1800ggcgaaaggc ccagtctttc gactgagcct ttcgttttat ttgatgcctg gcagttccct 1800
actctcgcat ggggagtccc cacactacca tcggcgctac ggcgtttcac ttctgagttc 1860actctcgcat ggggagtccc cacactacca tcggcgctac ggcgtttcac ttctgagttc 1860
ggcatggggt caggtgggac caccgcgcta ctgccgccag gcaaacaagg ggtgttatga 1920ggcatggggt caggtgggac caccgcgcta ctgccgccag gcaaacaagg ggtgttatga 1920
gccatattca ggtataaatg ggctcgcgat aatgttcaga attggttaat tggttgtaac 1980gccatattca ggtataaatg ggctcgcgat aatgttcaga attggttaat tggttgtaac 1980
actgacccct atttgtttat ttttctaaat acattcaaat atgtatccgc tcatgagaca 2040actgacccct atttgtttat ttttctaaat acattcaaat atgtatccgc tcatgagaca 2040
ataaccctga taaatgcttc aataatattg aaaaaggaag aatatgagta ttcaacattt 2100ataaccctga taaatgcttc aataatattg aaaaaggaag aatatgagta ttcaacattt 2100
ccgtgtcgcc cttattccct tttttgcggc attttgcctt cctgtttttg ctcacccaga 2160ccgtgtcgcc cttattccct ttttgcggc attttgcctt cctgtttttg ctcacccaga 2160
aacgctggtg aaagtaaaag atgctgaaga tcagttgggt gcacgagtgg gttacatcga 2220aacgctggtg aaagtaaaag atgctgaaga tcagttggggt gcacgagtgg gttacatcga 2220
actggatctc aacagcggta agatccttga gagttttcgc cccgaagaac gttttccaat 2280actggatctc aacagcggta agatccttga gagttttcgc cccgaagaac gttttccaat 2280
gatgagcact tttaaagttc tgctatgtgg cgcggtatta tcccgtattg acgccgggca 2340gatgagcact tttaaagttc tgctatgtgg cgcggtatta tcccgtattg acgccgggca 2340
agagcaactc ggtcgccgca tacactattc tcagaatgac ttggttgagt actcaccagt 2400agagcaactc ggtcgccgca tacactattc tcagaatgac ttggttgagt actcaccagt 2400
cacagaaaag catcttacgg atggcatgac agtaagagaa ttatgcagtg ctgccataac 2460cacagaaaag catcttacgg atggcatgac agtaagagaa ttatgcagtg ctgccataac 2460
catgagtgat aacactgcgg ccaacttact tctgacaacg atcggaggac cgaaggagct 2520catgagtgat aacactgcgg ccaacttact tctgacaacg atcggaggac cgaaggagct 2520
aaccgctttt ttgcacaaca tgggggatca tgtaactcgc cttgatcgtt gggaaccgga 2580aaccgctttt ttgcacaaca tgggggatca tgtaactcgc cttgatcgtt gggaaccgga 2580
gctgaatgaa gccataccaa acgacgagcg tgacaccacg atgcctgtag cgatggcaac 2640gctgaatgaa gccataccaa acgacgagcg tgacaccacg atgcctgtag cgatggcaac 2640
aacgttgcgc aaactattaa ctggcgaact acttactcta gcttcccggc aacaattaat 2700aacgttgcgc aaactattaa ctggcgaact acttactcta gcttcccggc aacaattaat 2700
agactggatg gaggcggata aagttgcagg accacttctg cgctcggccc ttccggctgg 2760agactggatg gaggcggata aagttgcagg accacttctg cgctcggccc ttccggctgg 2760
ctggtttatt gctgataaat ccggagccgg tgagcgtggt tctcgcggta tcatcgcagc 2820ctggtttatt gctgataaat ccggagccgg tgagcgtggt tctcgcggta tcatcgcagc 2820
gctggggcca gatggtaagc cctcccgtat cgtagttatc tacacgacgg ggagtcaggc 2880gctggggcca gatggtaagc cctcccgtat cgtagttatc tacacgacgg ggagtcaggc 2880
aactatggat gaacgaaata gacagatcgc tgagataggt gcctcactga ttaagcattg 2940aactatggat gaacgaaata gacagatcgc tgagataggt gcctcactga ttaagcattg 2940
gtaaaagcag agcattacgc tgacttgacg ggacggcgca agctcatgac caaaatccct 3000gtaaaagcag agcattacgc tgacttgacg ggacggcgca agctcatgac caaaatccct 3000
taacgtgagt tacgcgcgcg tcgttccact gagcgtcaga ccccgtagaa aagatcaaag 3060taacgtgagt tacgcgcgcg tcgttccact gagcgtcaga ccccgtagaa aagatcaaag 3060
<210> 6<210> 6
<211> 334<211> 334
<212> РНК<212> RNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> РНК-транскрипт<223> RNA transcript
<400> 6<400> 6
gcggaaccca agcuaagcgc cagaacuggc accuucgggu gccaguugac gagguggggu 60gcggaaccca agcuaagcgc cagaacuggc accuucgggu gccaguugac gagguggggu 60
uuaucgagau uucggcggau gacucccggu uguucaucac aaccgcaagc uuuuacuuaa 120120
aucauuaagg ugacuuagug gacaaaggug aaagugugau gaaacccgac cuggacggag 180aucauuaagg ugacuuagug gacaaaggug aaagugugau gaaacccgac cuggacggag 180
gcgcgcccga gaugaguagg cugucccauc aggggaggaa ucggggacgg cugaaaggcg 240gcgcgcccga gaugaguagg cugucccauc aggggaggaa ucggggacgg cugaaaggcg 240
agggcgccga agcgagcaga guuccucccg cucugcuugg cuggggguga ggggaauacc 300agggcgccga agcgagcaga guuccuccg cucugcuugg cuggggguga ggggaauacc 300
cuuaccacug ucgcgaaagc ggagagccgu ccag 334cuuaccacug ucgcgaaagc ggagagccgu ccag 334
<210> 7<210> 7
<211> 16<211> 16
<212> РНК<212> RNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Продукт расщепления РНК<223> RNA cleavage product
<400> 7<400> 7
gcggaaccca agcuaa 16gcggaaccca agcuaa 16
<210> 8<210> 8
<211> 4671<211> 4671
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Субстрат и т.д.<223> Substrate, etc.
<400> 8<400> 8
gagttacgcg cgcgtcgttc cactgagcgt cagaccccgt agaaaagatc aaaggatctt 60gagttacgcg cgcgtcgttc cactgagcgt cagaccccgt agaaaagatc aaaggatctt 60
cttgagatcc tttttttctg cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac 120cttgagatcc ttttttttctg cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac 120
cagcggtggt ttgtttgccg gatcaagagc taccaactct ttttccgaag gtaactggct 180cagcggtggt ttgtttgccg gatcaagagc taccaactct ttttccgaag gtaactggct 180
tcagcagagc gcagatacca aatactgttc ttctagtgta gccgtagtta gcccaccact 240tcagcagagc gcagatacca aatactgttc ttctagtgta gccgtagtta gcccaccact 240
tcaagaactc tgtagcaccg cctacatacc tcgctctgct aatcctgtta ccagtggctg 300tcaagaactc tgtagcaccg cctacatacc tcgctctgct aatcctgtta ccagtggctg 300
ctgccagtgg cgataagtcg tgtcttaccg ggttggactc aagacgatag ttaccggata 360ctgccagtgg cgataagtcg tgtcttaccg ggttggactc aagacgatag ttaccggata 360
aggcgcagcg gtcgggctga acggggggtt cgtgcacaca gcccagcttg gagcgaacga 420aggcgcagcg gtcgggctga acggggggtt cgtgcacaca gcccagcttg gagcgaacga 420
cctacaccga actgagatac ctacagcgtg agctatgaga aagcgccacg cttcccgaag 480cctacaccga actgagatac ctacagcgtg agctatgaga aagcgccacg cttcccgaag 480
ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg 540ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg aacaggag cgcacgaggg 540
agcttccagg gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc cacctctgac 600agcttccagg gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc cacctctgac 600
ttgagcgtcg atttttgtga tgctcgtcag gggggcggag cctatggaaa aacgccagca 660ttgagcgtcg atttttgtga tgctcgtcag gggggcggag cctatggaaa aacgccagca 660
acgcggcctt tttacggttc ctggcctttt gctggccttt tgctcacatg ttctttcctg 720acgcggcctt tttacggttc ctggcctttt gctggccttt tgctcacatg ttctttcctg 720
cgttatcccc tgattctgtg gataaccgta ttaccgcctt tgagtgagct gataccgctc 780cgttatcccc tgattctgtg gataaccgta ttaccgcctt tgagtgagct gataccgctc 780
gccgcagccg aacgaccgag cgcagcgagt cagtgagcga ggaagcggaa ggcgagagta 840gccgcagccg aacgaccgag cgcagcgagt cagtgagcga ggaagcggaa ggcgagagta 840
gggaactgcc aggcatcaaa ctaagcagaa ggcccctgac ggatggcctt tttgcgtttc 900gggaactgcc aggcatcaaa ctaagcagaa ggcccctgac ggatggcctt tttgcgtttc 900
tacaaactct ttctgtgttg taaaacgacg gccagtctta agctcgggcc ccctgggcgg 960tacaaactct ttctgtgttg taaaacgacg gccagtctta agctcgggcc ccctgggcgg 960
ttctgataac gagtaatcgt taatccgcaa ataacgtaaa aacccgcttc ggcgggtttt 1020ttctgataac gagtaatcgt taatccgcaa ataacgtaaa aacccgcttc ggcggggtttt 1020
tttatggggg gagtttaggg aaagagcatt tgtcagaata tttaagggcg cctgtcactt 1080tttatggggg gagtttaggg aaagagcatt tgtcagaata tttaagggcg cctgtcactt 1080
tgcttgatat atgagaatta tttaacctta taaatgagaa aaaagcaacg cactttaaat 1140tgcttgatat atgagaatta tttaacctta taaatgagaa aaaagcaacg cactttaaat 1140
aagatacgtt gctttttcga ttgatgaaca cctataatta aactattcat ctattattta 1200aagatacgtt gctttttcga ttgatgaaca cctataatta aactattcat ctattattta 1200
tgattttttg tatatacaat atttctagtt tgttaaagag aattaagaaa ataaatctcg 12601260
aaaataataa agggaaaatc agtttttgat atcaaaatta tacatgtcaa cgataataca 1320aaaataataa agggaaaatc agtttttgat atcaaaatta tacatgtcaa cgataataca 1320
aaatataata caaactataa gatgttatca gtatttatta tgcatttaga atacgtactc 1380aaatataata caaactataa gatgttatca gtatttatta tgcatttaga atacgtactc 1380
agcgtctggg ttccccatcg gtgatgtcgt ataagagacg tataggagac ctatagtgtc 1440agcgtctggg ttccccatcg gtgatgtcgt ataagagacg tataggagac ctatagtgtc 1440
ttcggggtaa tacgactcac tatagcggaa cccaagcttg gcattccggt actgttggta 1500ttcggggtaa tacgactcac tatagcggaa cccaagcttg gcattccggt actgttggta 1500
aagccaccat ggaagatgcg aagaacataa agaaaggtcc cgccccattt tacccactcg 15601560
aggatggaac agctggggag caactgcaca aggccatgaa gcgctatgcg ttggtgccgg 1620aggatggaac agctggggag caactgcaca aggccatgaa gcgctatgcg ttggtgccgg 1620
gaaccatcgc gttcaccgac gcacacatcg aagtgaacat cacttacgcc gagtactttg 1680gaaccatcgc gttcaccgac gcacacatcg aagtgaacat cacttacgcc gagtactttg 1680
agatgagcgt caggctggcc gaggctatga agcgatacgg tctgaacacc aaccaccgga 1740agatgagcgt caggctggcc gaggctatga agcgatacgg tctgaacacc aaccaccggga 1740
tcgtggtctg ctctgaaaac agcctgcagt tcttcatgcc ggtcctgggg gccctgttca 1800tcgtggtctg ctctgaaaac agcctgcagt tcttcatgcc ggtcctgggg gccctgttca 1800
tcggcgtggc cgtggcaccc gccaacgata tctacaacga gagagaattg ctgaactcga 1860tcggcgtggc cgtggcaccc gccaacgata tctacaacga gagagaattg ctgaactcga 1860
tgaacatctc ccagcctacc gtggtgttcg tgtcgaagaa ggggttgcag aagatcctga 1920tgaacatctc ccagcctacc gtggtgttcg tgtcgaagaa ggggttgcag aagatcctga 1920
acgtgcagaa gaagctgccc atcattcaaa agattatcat tatggattcc aaaaccgact 1980acgtgcagaa gaagctgccc atcattcaaa agattatcat tatggattcc aaaaccgact 1980
accagggttt ccagtcaatg tataccttcg tgacctccca tctgccccct ggcttcaacg 2040accagggttt ccagtcaatg tataccttcg tgacctccca tctgccccct ggcttcaacg 2040
aatacgactt cgtgcctgaa agcttcgacc gcgacaagac gatcgccctc atcatgaact 2100aatacgactt cgtgcctgaa agcttcgacc gcgacaagac gatcgccctc atcatgaact 2100
cgtccggctc gaccgggctg cccaaaggag tggccctgcc acaccggacc gcttgcgtgc 2160cgtccggctc gaccgggctg cccaaaggag tggccctgcc acaccggacc gcttgcgtgc 2160
ggttctccca cgcccgggac cctattttcg gcaatcagat cattccggac actgccatcc 2220ggttctccca cgcccgggac cctattttcg gcaatcagat cattccggac actgccatcc 2220
tgagcgtggt ccccttccat cacgggtttg ggatgtttac cactctgggc tacctcatct 2280tgagcgtggt ccccttccat cacgggtttg ggatgtttac cactctgggc tacctcatct 2280
gcggattcag ggtggtgctg atgtaccggt tcgaggaaga acttttcctg cggagcctgc 2340gcggattcag ggtggtgctg atgtaccggt tcgaggaaga acttttcctg cggagcctgc 2340
aggattacaa gatccagtcc gccctcctcg tgccaaccct cttctcattc ttcgctaagt 2400aggattacaa gatccagtcc gccctcctcg tgccaaccct cttctcattc ttcgctaagt 2400
ccactctcat cgataagtac gacctgtcga atctccacga aattgcgtcc ggtggtgcac 2460ccactctcat cgataagtac gacctgtcga atctccacga aattgcgtcc ggtggtgcac 2460
cgctgtccaa ggaggtcggc gaagccgtgg ccaagcgctt ccacctcccg ggaatacgcc 2520cgctgtccaa ggaggtcggc gaagccgtgg ccaagcgctt ccacctcccg ggaatacgcc 2520
agggatacgg cctgactgaa acgaccagcg cgattctgat caccccggag ggcgacgaca 2580agggatacgg cctgactgaa acgaccagcg cgattctgat caccccggag ggcgacgaca 2580
agccgggtgc cgtggggaaa gtggtgccgt tcttcgaagc aaaggtcgtg gatctggata 2640agccgggtgc cgtggggaaa gtggtgccgt tcttcgaagc aaaggtcgtg gatctggata 2640
ccggaaagac tctgggcgtg aaccagagag gggaactttg tgtgcgcgga ccgatgatta 2700ccggaaagac tctgggcgtg aaccagagag gggaactttg tgtgcgcgga ccgatgatta 2700
tgtccggata tgtcaacaac cccgaggcca ctaatgccct gatcgacaag gacggatggt 2760tgtccggata tgtcaacaac cccgaggcca ctaatgccct gatcgacaag gacggatggt 2760
tgcatagcgg cgacatcgca tactgggacg aggacgagca ctttttcatt gtggatcggc 2820tgcatagcgg cgacatcgca tactgggacg aggacgagca ctttttcatt gtggatcggc 2820
tcaagtccct gatcaagtac aagggatacc aggtcgcccc tgccgaactt gagtccatcc 2880tcaagtccct gatcaagtac aagggatacc aggtcgcccc tgccgaactt gagtccatcc 2880
tgctgcaaca tccgaacatt ttcgacgcgg gcgtcgctgg ccttcctgat gatgacgccg 2940tgctgcaaca tccgaacatt ttcgacgcgg gcgtcgctgg ccttcctgat gatgacgccg 2940
gagagctgcc cgcggccgtg gtggtgctcg aacacggaaa aactatgacc gagaaggaaa 3000gagagctgcc cgcggccgtg gtggtgctcg aacacggaaa aactatgacc gagaaggaaa 3000
tcgtggacta cgtggcgtca caagtcacca ctgccaagaa actgcgcggc ggagtcgtgt 3060tcgtggacta cgtggcgtca caagtcacca ctgccaagaa actgcgcggc ggagtcgtgt 3060
tcgtggacga ggtgcccaag ggcctgaccg gaaagctgga cgctagaaag atccgggaga 31203120
tcctgattaa ggccaagaag ggaggaaagt ccaagctctg agatctagag ggccctattc 3180tcctgattaa ggccaagaag ggaggaaagt ccaagctctg agatctagag ggccctattc 3180
tatagtgtca cctaaatgct aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 32403240
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 33003300
gaattcaaaa gaagaccata tacgtctcct ataggtctcg tatactgctt cctatacgac 3360gaattcaaaa gaagaccata tacgtctcct ataggtctcg tatactgctt cctatacgac 3360
atcaccgatg gggaacacga agcgatccag ccccccttat tagcccgggc gaaaggccca 3420atcaccgatg gggaacacga agcgatccag ccccccttat tagcccgggc gaaaggccca 3420
gtctttcgac tgagcctttc gttttatttg atgcctggca gttccctact ctcgcatggg 3480gtctttcgac tgagcctttc gttttatttg atgcctggca gttccctact ctcgcatggg 3480
gagtccccac actaccatcg gcgctacggc gtttcacttc tgagttcggc atggggtcag 3540gagtccccac actaccatcg gcgctacggc gtttcacttc tgagttcggc atggggtcag 3540
gtgggaccac cgcgctactg ccgccaggca aacaaggggt gttatgagcc atattcaggt 3600gtgggaccac cgcgctactg ccgccaggca aacaaggggt gttatgagcc atattcaggt 3600
ataaatgggc tcgcgataat gttcagaatt ggttaattgg ttgtaacact gacccctatt 3660ataaatgggc tcgcgataat gttcagaatt ggttaattgg ttgtaacact gacccctatt 3660
tgtttatttt tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa 37203720
atgcttcaat aatattgaaa aaggaagaat atgagtattc aacatttccg tgtcgccctt 3780atgcttcaat aatattgaaa aaggaagaat atgagtattc aacatttccg tgtcgccctt 3780
attccctttt ttgcggcatt ttgccttcct gtttttgctc acccagaaac gctggtgaaa 3840attccctttt ttgcggcatt ttgccttcct gtttttgctc acccagaaac gctggtgaaa 3840
gtaaaagatg ctgaagatca gttgggtgca cgagtgggtt acatcgaact ggatctcaac 3900gtaaaagatg ctgaagatca gttgggtgca cgagtgggtt acatcgaact ggatctcaac 3900
agcggtaaga tccttgagag ttttcgcccc gaagaacgtt ttccaatgat gagcactttt 39603960
aaagttctgc tatgtggcgc ggtattatcc cgtattgacg ccgggcaaga gcaactcggt 4020aaagttctgc tatgtggcgc ggtattatcc cgtattgacg cggggcaaga gcaactcggt 4020
cgccgcatac actattctca gaatgacttg gttgagtact caccagtcac agaaaagcat 4080cgccgcatac actattctca gaatgacttg gttgagtact caccagtcac agaaaagcat 4080
cttacggatg gcatgacagt aagagaatta tgcagtgctg ccataaccat gagtgataac 4140cttacggatg gcatgacagt aagagaatta tgcagtgctg ccataaccat gagtgataac 4140
actgcggcca acttacttct gacaacgatc ggaggaccga aggagctaac cgcttttttg 4200actgcggcca acttacttct gacaacgatc ggaggaccga aggagctaac cgcttttttg 4200
cacaacatgg gggatcatgt aactcgcctt gatcgttggg aaccggagct gaatgaagcc 4260cacaacatgg gggatcatgt aactcgcctt gatcgttggg aaccggagct gaatgaagcc 4260
ataccaaacg acgagcgtga caccacgatg cctgtagcga tggcaacaac gttgcgcaaa 4320ataccaaacg acgagcgtga caccacgatg cctgtagcga tggcaacaac gttgcgcaaa 4320
ctattaactg gcgaactact tactctagct tcccggcaac aattaataga ctggatggag 4380ctattaactg gcgaactact tactctagct tcccggcaac aattaataga ctggatggag 4380
gcggataaag ttgcaggacc acttctgcgc tcggcccttc cggctggctg gtttattgct 4440gcggataaag ttgcaggacc acttctgcgc tcggcccttc cggctggctg gtttattgct 4440
gataaatccg gagccggtga gcgtggttct cgcggtatca tcgcagcgct ggggccagat 4500gataaatccg gagccggtga gcgtggttct cgcggtatca tcgcagcgct ggggccagat 4500
ggtaagccct cccgtatcgt agttatctac acgacgggga gtcaggcaac tatggatgaa 4560ggtaagccct cccgtatcgt agttatctac acgacgggga gtcaggcaac tatggatgaa 4560
cgaaatagac agatcgctga gataggtgcc tcactgatta agcattggta agcagagcat 4620cgaaatagac agatcgctga gataggtgcc tcactgatta agcattggta agcagagcat 4620
tacgctgact tgacgggacg gcgcaagctc atgaccaaaa tcccttaacg t 4671tacgctgact tgacgggacg gcgcaagctc atgaccaaaa tcccttaacg t 4671
<210> 9<210> 9
<211> 1697<211> 1697
<212> РНК<212> RNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Субстрат и т.д.<223> Substrate, etc.
<400> 9<400> 9
gcggaaccca agcuuggcau uccgguacug uugguaaagc caccauggaa gaugcgaaga 60gcggaaccca agcuuggcau uccgguacug uugguaaagc caccauggaa gaugcgaaga 60
acauaaagaa aggucccgcc ccauuuuacc cacucgagga uggaacagcu ggggagcaac 120acauaaagaa aggucccgcc ccauuuuacc cacucgagga uggaacagcu ggggagcaac 120
ugcacaaggc caugaagcgc uaugcguugg ugccgggaac caucgcguuc accgacgcac 180ugcacaaggc caugaagcgc uaugcguugg ugccgggaac caucgcguuc accgacgcac 180
acaucgaagu gaacaucacu uacgccgagu acuuugagau gagcgucagg cuggccgagg 240acaucgaagu gaacaucacu uacgccgagu acuuugagau gagcgucagg cuggccgagg 240
cuaugaagcg auacggucug aacaccaacc accggaucgu ggucugcucu gaaaacagcc 300cuaugaagcg auacggucug aacaccaacc accggaucgu ggucugcucu gaaaacagcc 300
ugcaguucuu caugccgguc cugggggccc uguucaucgg cguggccgug gcacccgcca 360ugcaguucuu caugccgguc cugggggccc uguucaucgg cguggccgug gcacccgcca 360
acgauaucua caacgagaga gaauugcuga acucgaugaa caucucccag ccuaccgugg 420acgauaucua caacgagaga gaauugcuga acucgaugaa caucucccag ccuaccgugg 420
uguucguguc gaagaagggg uugcagaaga uccugaacgu gcagaagaag cugcccauca 480uguucguguc gaagaagggg uugcagaaga uccugaacgu gcagaagaag cugcccauca 480
uucaaaagau uaucauuaug gauuccaaaa ccgacuacca ggguuuccag ucaauguaua 540uucaaaagau uaucauuaug gauuccaaaa ccgacuacca ggguuuccag ucaauguaua 540
ccuucgugac cucccaucug cccccuggcu ucaacgaaua cgacuucgug ccugaaagcu 600ccuucgugac cucccaucug cccccuggcu ucaacgaaua cgacuucgug ccugaaagcu 600
ucgaccgcga caagacgauc gcccucauca ugaacucguc cggcucgacc gggcugccca 660ucgaccgcga caagacgauc gcccucauca ugaacucguc cggcucgacc gggcugccca 660
aaggaguggc ccugccacac cggaccgcuu gcgugcgguu cucccacgcc cgggacccua 720aaggaguggc ccugccacac cggaccgcuu gcgugcgguu cucccacgcc cgggacccua 720
uuuucggcaa ucagaucauu ccggacacug ccauccugag cguggucccc uuccaucacg 780uuuucggcaa ucagaucauu ccggacacug ccauccugag cguggucccc uuccaucacg 780
gguuugggau guuuaccacu cugggcuacc ucaucugcgg auucagggug gugcugaugu 840gguuugggau guuuaccacu cugggcuacc ucaucugcgg auucagggug gugcugaugu 840
accgguucga ggaagaacuu uuccugcgga gccugcagga uuacaagauc caguccgccc 900accgguucga ggaagaacuu uuccugcgga gccugcagga uuacaagauc caguccgccc 900
uccucgugcc aacccucuuc ucauucuucg cuaaguccac ucucaucgau aaguacgacc 960uccucgugcc aacccucuuc ucauucuucg cuaaguccac ucucaucgau aaguacgacc 960
ugucgaaucu ccacgaaauu gcguccggug gugcaccgcu guccaaggag gucggcgaag 1020ugucgaaucu ccacgaaauu gcguccggug gugcaccgcu guccaaggag gucggcgaag 1020
ccguggccaa gcgcuuccac cucccgggaa uacgccaggg auacggccug acugaaacga 1080ccgggccaa gcgcuuccac cucccgggaa uacgccaggg auacggccug acugaaacga 1080
ccagcgcgau ucugaucacc ccggagggcg acgacaagcc gggugccgug gggaaagugg 1140ccagcgcgau ucugaucacc ccggagggcg acgacaagcc gggugccgug gggaaagugg 1140
ugccguucuu cgaagcaaag gucguggauc uggauaccgg aaagacucug ggcgugaacc 1200ugccguucuu cgaagcaaag gucguggauc uggauaccgg aaagacucug ggcgugaacc 1200
agagagggga acuuugugug cgcggaccga ugauuauguc cggauauguc aacaaccccg 1260agagagggga acuuugugug cgcggaccga ugauuauguc cggauauuguc aacaaccccg 1260
aggccacuaa ugcccugauc gacaaggacg gaugguugca uagcggcgac aucgcauacu 13201320
gggacgagga cgagcacuuu uucauugugg aucggcucaa gucccugauc aaguacaagg 1380gggacgagga cgagcacuuu uucauugugg aucggcucaa gucccugauc aaguacaagg 1380
gauaccaggu cgccccugcc gaacuugagu ccauccugcu gcaacauccg aacauuuucg 1440gauaccaggu cgccccugcc gaacuugagu ccauccugcu gcaacauccg aacauuuucg 1440
acgcgggcgu cgcuggccuu ccugaugaug acgccggaga gcugcccgcg gccguggugg 1500acgcgggcgu cgcuggccuu ccugaugaug acgccggaga gcugcccgcg gccguggugg 1500
ugcucgaaca cggaaaaacu augaccgaga aggaaaucgu ggacuacgug gcgucacaag 1560ugcucgaaca cggaaaaacu augaccgaga aggaaaucgu ggacuacgug gcgucacaag 1560
ucaccacugc caagaaacug cgcggcggag ucguguucgu ggacgaggug cccaagggcc 1620ucaccacugc caagaaacug cgcggcggag ucguguucgu ggacgaggug cccaagggcc 1620
ugaccggaaa gcuggacgcu agaaagaucc gggagauccu gauuaaggcc aagaagggag 1680ugaccggaaa gcuggacgcu agaaagaucc gggagauccu gauuaaggcc aagaagggag 1680
gaaaguccaa gcucuga 1697gaaaguccaa gcucuga 1697
<210> 10<210> 10
<211> 4945<211> 4945
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Субстрат и т.д.<223> Substrate, etc.
<400> 10<400> 10
ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat 60ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat 60
agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc 120agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc 120
cagcgctgcg atgataccgc gagaaccacg ctcaccggct ccggatttat cagcaataaa 180cagcgctgcg atgataccgc gagaaccacg ctcaccggct ccggatttat cagcaataaa 180
ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca 240ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca 240
gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa 300gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa 300
cgttgttgcc atcgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt 360cgttgttgcc atcgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt 360
cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc 420cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc 420
ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact 480ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact 480
catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc 540catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc 540
tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg 600tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg 600
ctcttgcccg gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct 660ctcttgcccg gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct 660
catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc 720catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc 720
cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag 780cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag 780
cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac 840840
acggaaatgt tgaatactca tattcttcct ttttcaatat tattgaagca tttatcaggg 900acggaaatgt tgaatactca tattcttcct ttttcaatat tattgaagca tttatcaggg 900
ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt 960ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt 960
cagtgttaca accaattaac caattctgaa cattatcgcg agcccattta tacctgaata 1020cagtgttaca accaattaac caattctgaa cattatcgcg agcccattta tacctgaata 1020
tggctcataa caccccttgt ttgcctggcg gcagtagcgc ggtggtccca cctgacccca 1080tggctcataa caccccttgt ttgcctggcg gcagtagcgc ggtggtccca cctgacccca 1080
tgccgaactc agaagtgaaa cgccgtagcg ccgatggtag tgtggggact ccccatgcga 1140tgccgaactc agaagtgaaa cgccgtagcg ccgatggtag tgtggggact ccccatgcga 1140
gagtagggaa ctgccaggca tcaaataaaa cgaaaggctc agtcgaaaga ctgggccttt 12001200
cgcccgggct aattatgggg tgtcgccctt cgctgaaggg gtaatacgac tcactatagg 1260cgcccgggct aattatgggg tgtcgccctt cgctgaaggg gtaatacgac tcactatagg 1260
gaaataagag agaaaagaag agtaagaaga aatataagag ccaccatgga agatgcgaag 1320gaaataagag agaaaagaag agtaagaaga aatataagag ccaccatgga agatgcgaag 1320
aacataaaga aaggtcccgc cccattttac ccactcgagg atggaacagc tggggagcaa 13801380
ctgcacaagg ccatgaagcg ctatgcgttg gtgccgggaa ccatcgcgtt caccgacgca 1440ctgcacaagg ccatgaagcg ctatgcgttg gtgccgggaa ccatcgcgtt caccgacgca 1440
cacatcgaag tgaacatcac ttacgccgag tactttgaga tgagcgtcag gctggccgag 1500cacatcgaag tgaacatcac ttacgccgag tactttgaga tgagcgtcag gctggccgag 1500
gctatgaagc gatacggtct gaacaccaac caccggatcg tggtctgctc tgaaaacagc 1560gctatgaagc gatacggtct gaacaccaac caccggatcg tggtctgctc tgaaaacagc 1560
ctgcagttct tcatgccggt cctgggggcc ctgttcatcg gcgtggccgt ggcacccgcc 1620ctgcagttct tcatgccggt cctgggggcc ctgttcatcg gcgtggccgt ggcacccgcc 1620
aacgatatct acaacgagag agaattgctg aactcgatga acatctccca gcctaccgtg 1680aacgatatct acaacgagag agaattgctg aactcgatga acatctccca gcctaccgtg 1680
gtgttcgtgt cgaagaaggg gttgcagaag atcctgaacg tgcagaagaa gctgcccatc 1740gtgttcgtgt cgaagaaggg gttgcagaag atcctgaacg tgcagaagaa gctgcccatc 1740
attcaaaaga ttatcattat ggattccaaa accgactacc agggtttcca gtcaatgtat 1800attcaaaaga ttatcattat ggattccaaa accgactacc agggtttcca gtcaatgtat 1800
accttcgtga cctcccatct gccccctggc ttcaacgaat acgacttcgt gcctgaaagc 1860accttcgtga cctcccatct gccccctggc ttcaacgaat acgacttcgt gcctgaaagc 1860
ttcgaccgcg acaagacgat cgccctcatc atgaactcgt ccggctcgac cgggctgccc 1920ttcgaccgcg acaagacgat cgccctcatc atgaactcgt ccggctcgac cgggctgccc 1920
aaaggagtgg ccctgccaca ccggaccgct tgcgtgcggt tctcccacgc ccgggaccct 19801980
attttcggca atcagatcat tccggacact gccatcctga gcgtggtccc cttccatcac 2040attttcggca atcagatcat tccggacact gccatcctga gcgtggtccc cttccatcac 2040
gggtttggga tgtttaccac tctgggctac ctcatctgcg gattcagggt ggtgctgatg 2100gggtttggga tgtttaccac tctgggctac ctcatctgcg gattcaggggt ggtgctgatg 2100
taccggttcg aggaagaact tttcctgcgg agcctgcagg attacaagat ccagtccgcc 2160taccggttcg aggaagaact tttcctgcgg agcctgcagg attacaagat ccagtccgcc 2160
ctcctcgtgc caaccctctt ctcattcttc gctaagtcca ctctcatcga taagtacgac 2220ctcctcgtgc caaccctctt ctcattcttc gctaagtcca ctctcatcga taagtacgac 2220
ctgtcgaatc tccacgaaat tgcgtccggt ggtgcaccgc tgtccaagga ggtcggcgaa 2280ctgtcgaatc tccacgaaat tgcgtccggt ggtgcaccgc tgtccaagga ggtcggcgaa 2280
gccgtggcca agcgcttcca cctcccggga attcgccagg gatacggcct gactgaaacg 2340gccgtggcca agcgcttcca cctcccggga attcgccagg gatacggcct gactgaaacg 2340
accagcgcga ttctgatcac cccggagggc gacgacaagc cgggtgccgt ggggaaagtg 2400accagcgcga ttctgatcac cccggagggc gacgacaagc cgggtgccgt ggggaaagtg 2400
gtgccgttct tcgaagcaaa ggtcgtggat ctggataccg gaaagactct gggcgtgaac 2460gtgccgttct tcgaagcaaa ggtcgtggat ctggataccg gaaagactct gggcgtgaac 2460
cagagagggg aactttgtgt gcgcggaccg atgattatgt ccggatatgt caacaacccc 2520cagagagggg aactttgtgt gcgcggaccg atgattatgt ccggatatgt caacaacccc 2520
gaggccacta atgccctgat cgacaaggac ggatggttgc atagcggcga catcgcatac 2580gaggcacta atgccctgat cgacaaggac ggatggttgc atagcggcga catcgcatac 2580
tgggacgagg acgagcactt tttcattgtg gatcggctca agtccctgat caagtacaag 2640tgggacgagg acgagcactt tttcattgtg gatcggctca agtccctgat caagtacaag 2640
ggataccagg tcgcccctgc cgaacttgag tccatcctgc tgcaacatcc gaacattttc 2700ggataccagg tcgcccctgc cgaacttgag tccatcctgc tgcaacatcc gaacattttc 2700
gacgcgggcg tcgctggcct tcctgatgat gacgccggag agctgcccgc ggccgtggtg 2760gacgcgggcg tcgctggcct tcctgatgat gacgccggag agctgcccgc ggccgtggtg 2760
gtgctcgaac acggaaaaac tatgaccgag aaggaaatcg tggactacgt ggcgtcacaa 28202820
gtcaccactg ccaagaaact gcgcggcgga gtcgtgttcg tggacgaggt gcccaagggc 2880gtcaccactg ccaagaaact gcgcggcgga gtcgtgttcg tggacgaggt gcccaagggc 2880
ctgaccggaa agctggacgc tagaaagatc cgggagatcc tgattaaggc caagaaggga 2940ctgaccggaa agctggacgc tagaaagatc cgggagatcc tgattaaggc caagaaggga 2940
ggaaagtcca agctctgaat ctgctgcctt ctgcggggct tgccttctgg ccatgccctt 3000ggaaagtcca agctctgaat ctgctgcctt ctgcggggct tgccttctgg ccatgccctt 3000
cttctctccc ttgcacctgt acctcttggt ctttgaataa agcctgagta ggaagtgagg 3060cttctctccc ttgcacctgt acctcttggt ctttgaataa agcctgagta ggaagtgagg 3060
gaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 31203120
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaagga agagcgctgc 31803180
ctccttcaga gtctgctcac gagctcggtc tcggatcccc tatacgacat caccgatggg 3240ctccttcaga gtctgctcac gagctcggtc tcggatcccc tatacgacat caccgatggg 3240
gaacacgaag cgatccagcc ccccttatta gcccgggcga aaggcccagt ctttcgactg 3300gaacacgaag cgatccagcc ccccttatta gcccgggcga aaggcccagt ctttcgactg 3300
agcctttcgt tttatttgat gcctggcagt tccctactct cgcatgggga gtccccacac 3360agcctttcgt tttatttgat gcctggcagt tccctactct cgcatgggga gtccccacac 3360
taccatcggc gctacggcgt ttcacttctg agttcggcat ggggtcaggt gggaccaccg 3420taccatcggc gctacggcgt ttcacttctg agttcggcat ggggtcaggt gggaccaccg 3420
cgctactgcc gccaggcaaa caaggggtgt tatgagccat attcaggtat aaatgggctc 3480cgctactgcc gccaggcaaa caaggggtgt tatgagccat attcaggtat aaatgggctc 3480
gcgaaaacgt caaaagggcg acacaaaatt tattctaaat gcataataaa tactgataac 3540tactgataac 3540
atcttatagt ttgtattata ttttgtatta tcgttgacat gtataatttt gatatcaaaa 36003600
actgattttc cctttattat tttcgagatt tattttctta attctcttta acaaactaga 3660actgattttc cctttattat tttcgagatt tattttctta attctcttta acaaactaga 3660
aatattgtat atacaaaaaa tcataaataa tagatgaata gtttaattat aggtgttcat 3720aatattgtat atacaaaaaa tcataaataa tagatgaata gtttaattat aggtgttcat 3720
caatcgaaaa agcaacgtat cttatttaaa gtgcgttgct tttttctcat ttataaggtt 37803780
aaataattct catatatcaa gcaaagtgac aggcgccctt aaatattctg acaaatgctc 3840aaataattct catatatcaa gcaaagtgac aggcgccctt aaatattctg acaaatgctc 3840
tttccctaaa ctccccccat aaaaaaaccc gccgaagcgg gtttttacgt tatttgcgga 3900ttttccctaaa ctccccccat aaaaaaaccc gccgaagcgg gtttttacgt tatttgcgga 3900
ttaacgatta ctcgttatca gaaccgccca gggggcccga gcttaagact ggccgtcgtt 39603960
ttacaacaca gaaagagttt gtagaaacgc aaaaaggcca tccgtcaggg gccttctgct 4020ttacaacaca gaaagagttt gtagaaacgc aaaaaggcca tccgtcaggg gccttctgct 4020
tagtttgatg cctggcagtt ccctactctc gccttccgct tcctcgctca ctgactcgct 40804080
gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt 4140gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt 4140
atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc 4200atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc 4200
caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga 4260caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga 4260
gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata 4320gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata 4320
ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac 4380ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac 4380
cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg 4440cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg 4440
taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc 4500taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc 4500
cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag 4560cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag 4560
acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt 4620acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt 4620
aggcggtgct acagagttct tgaagtggtg ggctaactac ggctacacta gaagaacagt 4680aggcggtgct acagagttct tgaagtggtg ggctaactac ggctacacta gaagaacagt 4680
atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg 4740atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg 4740
atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac 4800atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac 4800
gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca 4860gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca 4860
gtggaacgac gcgcgcgtaa ctcacgttaa gggattttgg tcatgagctt gcgccgtccc 4920gtggaacgac gcgcgcgtaa ctcacgttaa gggattttgg tcatgagctt gcgccgtccc 4920
gtcaagtcag cgtaatgctc tgctt 4945gtcaagtcag cgtaatgctc tgctt 4945
<210> 11<210> 11
<211> 1955<211> 1955
<212> РНК<212> RNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Субстрат и т.д.<223> Substrate, etc.
<400> 11<400> 11
gggaaauaag agagaaaaga agaguaagaa gaaauauaag agccaccaug gaagaugcga 60gggaaauaag agagaaaaga agaguaagaa gaaauauaag agccaccaug gaagaugcga 60
agaacauaaa gaaagguccc gccccauuuu acccacucga ggauggaaca gcuggggagc 120agaacauaaa gaaagguccc gccccauuuu acccacucga ggauggaaca gcuggggagc 120
aacugcacaa ggccaugaag cgcuaugcgu uggugccggg aaccaucgcg uucaccgacg 180aacugcacaa ggccaugaag cgcuaugcgu uggugccggg aaccaucgcg uucaccgacg 180
cacacaucga agugaacauc acuuacgccg aguacuuuga gaugagcguc aggcuggccg 240cacacaucga agugaacauc acuuacgccg aguacuuuga gaugagcguc aggcuggccg 240
aggcuaugaa gcgauacggu cugaacacca accaccggau cguggucugc ucugaaaaca 300aggcuaugaa gcgauacggu cugaacacca accaccggau cguggucugc ucugaaaaca 300
gccugcaguu cuucaugccg guccuggggg cccuguucau cggcguggcc guggcacccg 360gccugcaguu cuucaugccg guccuggggg cccuguucau cggcguggcc guggcacccg 360
ccaacgauau cuacaacgag agagaauugc ugaacucgau gaacaucucc cagccuaccg 420ccaacgauau cuacaacgag agagaauugc ugaacucgau gaacaucucc cagccuaccg 420
ugguguucgu gucgaagaag ggguugcaga agauccugaa cgugcagaag aagcugccca 480ugguguucgu gucgaagaag ggguugcaga agauccugaa cgugcagaag aagcugccca 480
ucauucaaaa gauuaucauu auggauucca aaaccgacua ccaggguuuc cagucaaugu 540ucauucaaaa gauuaucauu auggauucca aaaccgacua ccaggguuuc cagucaaugu 540
auaccuucgu gaccucccau cugcccccug gcuucaacga auacgacuuc gugccugaaa 600auaccuucgu gaccucccau cugcccccug gcuucaacga auacgacuuc gugccugaaa 600
gcuucgaccg cgacaagacg aucgcccuca ucaugaacuc guccggcucg accgggcugc 660gcuucgaccg cgacaagacg aucgcccuca ucaugaacuc guccggcucg accgggcugc 660
ccaaaggagu ggcccugcca caccggaccg cuugcgugcg guucucccac gcccgggacc 720ccaaaggagu ggccugcca caccggaccg cuugcgugcg guucucccac gcccgggacc 720
cuauuuucgg caaucagauc auuccggaca cugccauccu gagcgugguc cccuuccauc 780cuauuuucgg caaucagauc auuccggaca cugccauccu gagcgugguc cccuuccauc 780
acggguuugg gauguuuacc acucugggcu accucaucug cggauucagg guggugcuga 840acggguuugg gauguuuacc acucugggcu accucaucug cggauucagg guggugcuga 840
uguaccgguu cgaggaagaa cuuuuccugc ggagccugca ggauuacaag auccaguccg 900uguaccgguu cgaggaagaa cuuuuccugc ggagccugca ggauuacaag auccaguccg 900
cccuccucgu gccaacccuc uucucauucu ucgcuaaguc cacucucauc gauaaguacg 960cccuccucgu gccaacccuc uucucauucu ucgcuaaguc cacucucauc gauaaguacg 960
accugucgaa ucuccacgaa auugcguccg guggugcacc gcuguccaag gaggucggcg 1020accugucgaa ucuccacgaa auugcguccg guggugcacc gcuguccaag gaggucggcg 1020
aagccguggc caagcgcuuc caccucccgg gaauucgcca gggauacggc cugacugaaa 1080aagccguggc caagcgcuuc caccucccgg gaauucgcca gggauacggc cugacugaaa 1080
cgaccagcgc gauucugauc accccggagg gcgacgacaa gccgggugcc guggggaaag 1140cgaccagcgc gauucugauc accccgggagg gcgacgacaa gccgggugcc guggggaaag 1140
uggugccguu cuucgaagca aaggucgugg aucuggauac cggaaagacu cugggcguga 1200uggugccguu cuucgaagca aaggucgugg aucuggauac cggaaagacu cugggcguga 1200
accagagagg ggaacuuugu gugcgcggac cgaugauuau guccggauau gucaacaacc 1260accagagagg ggaacuuugu gugcgcggac cgaugauuau guccggauau gucaacaacc 1260
ccgaggccac uaaugcccug aucgacaagg acggaugguu gcauagcggc gacaucgcau 1320ccgaggccac uaaugccug aucgacaagg acggaugguu gcauagcggc gacaucgcau 1320
acugggacga ggacgagcac uuuuucauug uggaucggcu caagucccug aucaaguaca 1380acugggacga ggacgagcac uuuuucauug uggaucggcu caagucccug aucaaguaca 1380
agggauacca ggucgccccu gccgaacuug aguccauccu gcugcaacau ccgaacauuu 1440agggauacca ggucgccccu gccgaacuug aguccauccu gcugcaacau ccgaacauuu 1440
ucgacgcggg cgucgcuggc cuuccugaug augacgccgg agagcugccc gcggccgugg 1500ucgacgcggg cgucgcuggc cuuccugaug augacgccgg agagcugccc gcggccgugg 1500
uggugcucga acacggaaaa acuaugaccg agaaggaaau cguggacuac guggcgucac 1560uggugcucga acacggaaaa acuaugaccg agaaggaaau cguggacuac guggcgucac 1560
aagucaccac ugccaagaaa cugcgcggcg gagucguguu cguggacgag gugcccaagg 1620aagucaccac ugccaagaaa cugcgcggcg gagucguguu cguggacgag gugcccaagg 1620
gccugaccgg aaagcuggac gcuagaaaga uccgggagau ccugauuaag gccaagaagg 1680gccugaccgg aaagcuggac gcuagaaaga uccgggagau ccugauuaag gccaagaagg 1680
gaggaaaguc caagcucuga aucugcugcc uucugcgggg cuugccuucu ggccaugccc 1740gaggaaaguc caagcucuga aucugcugcc uucugcgggg cuugccuucu ggccaugccc 1740
uucuucucuc ccuugcaccu guaccucuug gucuuugaau aaagccugag uaggaaguga 1800uucuucucuc ccuugcaccu guaccucuug gucuuugaau aaagccugag uaggaaguga 1800
gggaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 18601860
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaag gaagagcgcu 19201920
gccuccuuca gagucugcuc acgagcucgg ucucg 1955gccuccuuca gagucugcuc acgagcucgg ucucg 1955
<210> 12<210> 12
<211> 57<211> 57
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Субстрат и т.д.<223> Substrate, etc.
<400> 12<400> 12
tctagaggcc agcctggcca taaggagata tacatcggta ctgttggtaa agccacc 57tctagaggcc agcctggcca taaggagata tacatcggta ctgttggtaa agccacc 57
<210> 13<210> 13
<211> 50<211> 50
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Субстрат и т.д.<223> Substrate, etc.
<400> 13<400> 13
taatgaggcc aaactggcca ccatcaccat cagagcttgg actttcctcc 50taatgaggcc aaactggcca ccatcaccat cagagcttgg actttcctcc 50
<210> 14<210> 14
<211> 2673<211> 2673
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Вариант T7РНКP<223> T7RNAP variant
<400> 14<400> 14
atgcaccatc accatcacca tatgaacacg attaacatcg ctaagaacga cttctctgac 60atgcaccatc accatcacca tatgaacacg attaacatcg ctaagaacga cttctctgac 60
atcgaactgg ctgctatccc gttcaacact ctggctgacc attacggtga gcgtttagct 120atcgaactgg ctgctatccc gttcaacact ctggctgacc attacggtga gcgtttagct 120
cgcgaacagt tggcccttga gcatgagtct tacgagatgg gtgaagcacg cttccgcaag 180cgcgaacagt tggcccttga gcatgagtct tacgagatgg gtgaagcacg cttccgcaag 180
atgtttgagc gtcaacttaa agctggtgag gttgcggata acgctgccgc caagcctctc 240atgtttgagc gtcaacttaa agctggtgag gttgcggata acgctgccgc caagcctctc 240
atcactaccc tactccctaa gatgattgca cgcatcaacg actggtttga ggaagtgaaa 300atcactaccc tactccctaa gatgattgca cgcatcaacg actggtttga ggaagtgaaa 300
gctaagcgcg gcaagcgccc gacagccttc cagttcctgc aagaaatcaa gccggaagcc 360gctaagcgcg gcaagcgccc gacagccttc cagttcctgc aagaaatcaa gccggaagcc 360
gtagcgtaca tcaccattaa gaccactctg gcttgcctaa ccagtgctga caatacaacc 420gtagcgtaca tcaccattaa gaccactctg gcttgcctaa ccagtgctga caatacaacc 420
gttcaggctg tagcaagcgc aatcggtcgg gccattgagg acgaggctcg cttcggtcgt 480gttcaggctg tagcaagcgc aatcggtcgg gccattgagg acgaggctcg cttcggtcgt 480
atccgtgacc ttgaagctaa gcacttcaag aaaaacgttg aggaacaact caacaagcgc 540atccgtgacc ttgaagctaa gcacttcaag aaaaacgttg aggaacaact caacaagcgc 540
gtagggcacg tctacaagaa agcatttatg caagttgtcg aggctgacat gctctctaag 600gtagggcacg tctacaagaa agcatttatg caagttgtcg aggctgacat gctctctaag 600
ggtctactcg gtggcgaggc gtggtcttcg tggcataagg aagactctat tcatgtagga 660ggtctactcg gtggcgaggc gtggtcttcg tggcataagg aagactctat tcatgtagga 660
gtacgctgca tcgagatgct cattgagtca accggaatgg ttagcttaca ccgccaaaat 720gtacgctgca tcgagatgct cattgagtca accggaatgg ttagcttaca ccgccaaaat 720
gctggcgtag taggtcaaga ctctgagact atcgaactcg cacctgaata cgctgaggct 780gctggcgtag taggtcaaga ctctgagact atcgaactcg cacctgaata cgctgaggct 780
atcgcaaccc gtgcaggtgc gctggctggc atctctccga tgttccaacc ttgcgtagtt 840atcgcaaccc gtgcaggtgc gctggctggc atctctccga tgttccaacc ttgcgtagtt 840
cctcctaagc cgtggactgg cattactggt ggtggctatt gggctaacgg tcgtcgtcct 900cctcctaagc cgtggactgg cattactggt ggtggctatt gggctaacgg tcgtcgtcct 900
ctggcgctgg tgcgtactca cagtaagaaa gcactgatgc gctacgaaga cgtttacatg 960ctggcgctgg tgcgtactca cagtaagaaa gcactgatgc gctacgaaga cgtttacatg 960
cctgaggtgt acaaagcgat taacattgcg caaaacaccg catggaaaat caacaagaaa 10201020
gtcctagcgg tcgccaacgt aatcaccaag tggaagcatt gtccggtcga ggacatccct 1080gtcctagcgg tcgccaacgt aatcaccaag tggaagcatt gtccggtcga ggacatccct 1080
gcgattgagc gtgaagaact cccgatgaaa ccggaagaca tcgacatgaa tcctgaggct 1140gcgattgagc gtgaagaact cccgatgaaa ccggaagaca tcgacatgaa tcctgaggct 1140
ctcaccgcgt ggaaacgtgc tgccgctgct gtgtaccgca aggacaaggc tcgcaagtct 1200ctcaccgcgt ggaaacgtgc tgccgctgct gtgtaccgca aggacaaggc tcgcaagtct 1200
cgccgtatca gccttgagtt catgcttgag caagccaata agtttgctaa ccataaggcc 1260cgccgtatca gccttgagtt catgcttgag caagccaata agtttgctaa ccataaggcc 1260
atctggttcc cttacaacat ggactggcgc ggtcgtgttt acgctgtgtc aatgttcaac 1320atctggttcc cttacaacat ggactggcgc ggtcgtgttt acgctgtgtc aatgttcaac 1320
ccgcaaggta acgatatgac caaaggactg cttacgctgg cgaaaggtaa accaatcggt 1380ccgcaaggta acgatatgac caaaggactg cttacgctgg cgaaaggtaa accaatcggt 1380
aaggaaggtt actactggct gaaaatccac ggtgcaaact gtgcgggtgt cgataaggtt 1440aaggaaggtt actactggct gaaaatccac ggtgcaaact gtgcgggtgt cgataaggtt 1440
ccgttccctg agcgcatcaa gttcattgag gaaaaccacg agaacatcat ggcttgcgct 1500ccgttccctg agcgcatcaa gttcattgag gaaaaccacg agaacatcat ggcttgcgct 1500
aagtctccac tggagaacac ttggtgggct gagcaagatt ctccgttctg cttccttgcg 1560aagtctccac tggagaacac ttggtgggct gagcaagatt ctccgttctg cttccttgcg 1560
ttctgctttg agtacgctgg ggtacagcac cacggcctga gctataactg ctcccttccg 1620ttctgctttg agtacgctgg ggtacagcac cacggcctga gctataactg ctcccttccg 1620
ctggcgtttg acgggtcttg ctctggcatc cagcacttct ccgcgatgct ccgagatgag 1680ctggcgtttg acgggtcttg ctctggcatc cagcacttct ccgcgatgct ccgagatgag 1680
gtaggtggtc gcgcggttaa cttgcttcct agtgaaaccg ttcaggacat ctacgggatt 1740gtaggtggtc gcgcggttaa cttgcttcct agtgaaaccg ttcaggacat ctacgggatt 1740
gttgctaaga aagtcaacga gattctacaa gcagacgcaa tcaatgggac cgataacgaa 1800gttgctaaga aagtcaacga gattctacaa gcagacgcaa tcaatgggac cgataacgaa 1800
gtagttaccg tgaccgatga gaacactggt gaaatctctg agaaagtcaa gctgggcact 1860gtagttaccg tgaccgatga gaacactggt gaaatctctg agaaagtcaa gctgggcact 1860
aaggcactgg ctggtcaatg gctggcttac ggtgttactc gcagtgtgac taagcgttca 1920aaggcactgg ctggtcaatg gctggcttac ggtgttactc gcagtgtgac taagcgttca 1920
gtcatgacgc tggcttacgg gtccaaagag ttcggcttcc gtcaacaagt gctggaagat 1980gtcatgacgc tggcttacgg gtccaaagag ttcggcttcc gtcaacaagt gctggaagat 1980
accattcagt gggctattga ttccggcaag ggtctgatgt tcactcagcc gaatcaggct 2040accattcagt gggctattga ttccggcaag ggtctgatgt tcactcagcc gaatcaggct 2040
gctggataca tggctaagct gatttgggaa tctgtgagcg tgacggtggt agctgcggtt 2100gctggataca tggctaagct gatttgggaa tctgtgagcg tgacggtggt agctgcggtt 2100
gaagcaatga actggcttaa gtctgctgct aagctgctgg ctgctgaggt caaagataag 2160gaagcaatga actggcttaa gtctgctgct aagctgctgg ctgctgaggt caaagataag 2160
aagactggag agattcttcg caagcgttgc gctgtgcatt gggtaactcc tgatggtttc 2220aagactggag agattcttcg caagcgttgc gctgtgcatt gggtaactcc tgatggtttc 2220
cctgtgtggc aggaatacaa gaagcctatt cagacgcgct tgaacctgat gttcctcggt 2280cctgtgtggc aggaatacaa gaagcctatt cagacgcgct tgaacctgat gttcctcggt 2280
cagttccgct tacagcctac cattaacacc aacaaagata gcgagattga tgcacacaaa 2340cagttccgct tacagcctac cattaacacc aacaaagata gcgagattga tgcacacaaa 2340
caggagtctg gtatcgctcc taactttgta cacagccaag acggtagcca ccttcgtaag 2400caggagtctg gtatcgctcc taactttgta cacagccaag acggtagcca ccttcgtaag 2400
actgtagtgt gggcacacga gaagtacgga atcgaatctt ttgcactgat tcacgactcc 2460actgtagtgt gggcacacga gaagtacgga atcgaatctt ttgcactgat tcacgactcc 2460
ttcggtacca ttccggctga cgctgcgaac ctgttcaaag cagtgcgcga aactatggtt 2520ttcggtacca ttccggctga cgctgcgaac ctgttcaaag cagtgcgcga aactatggtt 2520
gacacatatg agtcttgtga tgtactggct gatttctacg accagttcgc tgaccagttg 2580gacacatatg agtcttgtga tgtactggct gatttctacg accagttcgc tgaccagttg 2580
cacgagtctc aattggacaa aatgccagca cttccggcta aaggtaactt gaacctccgt 2640cacgagtctc aattggacaa aatgccagca cttccggcta aaggtaactt gaacctccgt 2640
gacatcttag agtcggactt cgcgttcgcg taa 2673gacatcttag agtcggactt cgcgttcgcg taa 2673
<210> 15<210> 15
<211> 890<211> 890
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Вариант T7РНКP<223> T7RNAP variant
<400> 15<400> 15
Met His His His His His His Met Asn Thr Ile Asn Ile Ala Lys Asn Met His His His His His His Met Asn Thr Ile Asn Ile Ala Lys Asn
1 5 10 15 1 5 10 15
Asp Phe Ser Asp Ile Glu Leu Ala Ala Ile Pro Phe Asn Thr Leu Ala Asp Phe Ser Asp Ile Glu Leu Ala Ala Ile Pro Phe Asn Thr Leu Ala
20 25 30 20 25 30
Asp His Tyr Gly Glu Arg Leu Ala Arg Glu Gln Leu Ala Leu Glu His Asp His Tyr Gly Glu Arg Leu Ala Arg Glu Gln Leu Ala Leu Glu His
35 40 45 35 40 45
Glu Ser Tyr Glu Met Gly Glu Ala Arg Phe Arg Lys Met Phe Glu Arg Glu Ser Tyr Glu Met Gly Glu Ala Arg Phe Arg Lys Met Phe Glu Arg
50 55 60 50 55 60
Gln Leu Lys Ala Gly Glu Val Ala Asp Asn Ala Ala Ala Lys Pro Leu Gln Leu Lys Ala Gly Glu Val Ala Asp Asn Ala Ala Ala Lys Pro Leu
65 70 75 80 65 70 75 80
Ile Thr Thr Leu Leu Pro Lys Met Ile Ala Arg Ile Asn Asp Trp Phe Ile Thr Thr Leu Leu Pro Lys Met Ile Ala Arg Ile Asn Asp Trp Phe
85 90 95 85 90 95
Glu Glu Val Lys Ala Lys Arg Gly Lys Arg Pro Thr Ala Phe Gln Phe Glu Glu Val Lys Ala Lys Arg Gly Lys Arg Pro Thr Ala Phe Gln Phe
100 105 110 100 105 110
Leu Gln Glu Ile Lys Pro Glu Ala Val Ala Tyr Ile Thr Ile Lys Thr Leu Gln Glu Ile Lys Pro Glu Ala Val Ala Tyr Ile Thr Ile Lys Thr
115 120 125 115 120 125
Thr Leu Ala Cys Leu Thr Ser Ala Asp Asn Thr Thr Val Gln Ala Val Thr Leu Ala Cys Leu Thr Ser Ala Asp Asn Thr Thr Val Gln Ala Val
130 135 140 130 135 140
Ala Ser Ala Ile Gly Arg Ala Ile Glu Asp Glu Ala Arg Phe Gly Arg Ala Ser Ala Ile Gly Arg Ala Ile Glu Asp Glu Ala Arg Phe Gly Arg
145 150 155 160 145 150 155 160
Ile Arg Asp Leu Glu Ala Lys His Phe Lys Lys Asn Val Glu Glu Gln Ile Arg Asp Leu Glu Ala Lys His Phe Lys Lys Asn Val Glu Glu Gln
165 170 175 165 170 175
Leu Asn Lys Arg Val Gly His Val Tyr Lys Lys Ala Phe Met Gln Val Leu Asn Lys Arg Val Gly His Val Tyr Lys Lys Ala Phe Met Gln Val
180 185 190 180 185 190
Val Glu Ala Asp Met Leu Ser Lys Gly Leu Leu Gly Gly Glu Ala Trp Val Glu Ala Asp Met Leu Ser Lys Gly Leu Leu Gly Gly Glu Ala Trp
195 200 205 195 200 205
Ser Ser Trp His Lys Glu Asp Ser Ile His Val Gly Val Arg Cys Ile Ser Ser Trp His Lys Glu Asp Ser Ile His Val Gly Val Arg Cys Ile
210 215 220 210 215 220
Glu Met Leu Ile Glu Ser Thr Gly Met Val Ser Leu His Arg Gln Asn Glu Met Leu Ile Glu Ser Thr Gly Met Val Ser Leu His Arg Gln Asn
225 230 235 240 225 230 235 240
Ala Gly Val Val Gly Gln Asp Ser Glu Thr Ile Glu Leu Ala Pro Glu Ala Gly Val Val Gly Gln Asp Ser Glu Thr Ile Glu Leu Ala Pro Glu
245 250 255 245 250 255
Tyr Ala Glu Ala Ile Ala Thr Arg Ala Gly Ala Leu Ala Gly Ile Ser Tyr Ala Glu Ala Ile Ala Thr Arg Ala Gly Ala Leu Ala Gly Ile Ser
260 265 270 260 265 270
Pro Met Phe Gln Pro Cys Val Val Pro Pro Lys Pro Trp Thr Gly Ile Pro Met Phe Gln Pro Cys Val Val Pro Pro Lys Pro Trp Thr Gly Ile
275 280 285 275 280 285
Thr Gly Gly Gly Tyr Trp Ala Asn Gly Arg Arg Pro Leu Ala Leu Val Thr Gly Gly Gly Tyr Trp Ala Asn Gly Arg Arg Pro Leu Ala Leu Val
290 295 300 290 295 300
Arg Thr His Ser Lys Lys Ala Leu Met Arg Tyr Glu Asp Val Tyr Met Arg Thr His Ser Lys Lys Ala Leu Met Arg Tyr Glu Asp Val Tyr Met
305 310 315 320 305 310 315 320
Pro Glu Val Tyr Lys Ala Ile Asn Ile Ala Gln Asn Thr Ala Trp Lys Pro Glu Val Tyr Lys Ala Ile Asn Ile Ala Gln Asn Thr Ala Trp Lys
325 330 335 325 330 335
Ile Asn Lys Lys Val Leu Ala Val Ala Asn Val Ile Thr Lys Trp Lys Ile Asn Lys Lys Val Leu Ala Val Ala Asn Val Ile Thr Lys Trp Lys
340 345 350 340 345 350
His Cys Pro Val Glu Asp Ile Pro Ala Ile Glu Arg Glu Glu Leu Pro His Cys Pro Val Glu Asp Ile Pro Ala Ile Glu Arg Glu Glu Leu Pro
355 360 365 355 360 365
Met Lys Pro Glu Asp Ile Asp Met Asn Pro Glu Ala Leu Thr Ala Trp Met Lys Pro Glu Asp Ile Asp Met Asn Pro Glu Ala Leu Thr Ala Trp
370 375 380 370 375 380
Lys Arg Ala Ala Ala Ala Val Tyr Arg Lys Asp Lys Ala Arg Lys Ser Lys Arg Ala Ala Ala Ala Val Tyr Arg Lys Asp Lys Ala Arg Lys Ser
385 390 395 400 385 390 395 400
Arg Arg Ile Ser Leu Glu Phe Met Leu Glu Gln Ala Asn Lys Phe Ala Arg Arg Ile Ser Leu Glu Phe Met Leu Glu Gln Ala Asn Lys Phe Ala
405 410 415 405 410 415
Asn His Lys Ala Ile Trp Phe Pro Tyr Asn Met Asp Trp Arg Gly Arg Asn His Lys Ala Ile Trp Phe Pro Tyr Asn Met Asp Trp Arg Gly Arg
420 425 430 420 425 430
Val Tyr Ala Val Ser Met Phe Asn Pro Gln Gly Asn Asp Met Thr Lys Val Tyr Ala Val Ser Met Phe Asn Pro Gln Gly Asn Asp Met Thr Lys
435 440 445 435 440 445
Gly Leu Leu Thr Leu Ala Lys Gly Lys Pro Ile Gly Lys Glu Gly Tyr Gly Leu Leu Thr Leu Ala Lys Gly Lys Pro Ile Gly Lys Glu Gly Tyr
450 455 460 450 455 460
Tyr Trp Leu Lys Ile His Gly Ala Asn Cys Ala Gly Val Asp Lys Val Tyr Trp Leu Lys Ile His Gly Ala Asn Cys Ala Gly Val Asp Lys Val
465 470 475 480 465 470 475 480
Pro Phe Pro Glu Arg Ile Lys Phe Ile Glu Glu Asn His Glu Asn Ile Pro Phe Pro Glu Arg Ile Lys Phe Ile Glu Glu Asn His Glu Asn Ile
485 490 495 485 490 495
Met Ala Cys Ala Lys Ser Pro Leu Glu Asn Thr Trp Trp Ala Glu Gln Met Ala Cys Ala Lys Ser Pro Leu Glu Asn Thr Trp Trp Ala Glu Gln
500 505 510 500 505 510
Asp Ser Pro Phe Cys Phe Leu Ala Phe Cys Phe Glu Tyr Ala Gly Val Asp Ser Pro Phe Cys Phe Leu Ala Phe Cys Phe Glu Tyr Ala Gly Val
515 520 525 515 520 525
Gln His His Gly Leu Ser Tyr Asn Cys Ser Leu Pro Leu Ala Phe Asp Gln His His Gly Leu Ser Tyr Asn Cys Ser Leu Pro Leu Ala Phe Asp
530 535 540 530 535 540
Gly Ser Cys Ser Gly Ile Gln His Phe Ser Ala Met Leu Arg Asp Glu Gly Ser Cys Ser Gly Ile Gln His Phe Ser Ala Met Leu Arg Asp Glu
545 550 555 560 545 550 555 560
Val Gly Gly Arg Ala Val Asn Leu Leu Pro Ser Glu Thr Val Gln Asp Val Gly Gly Arg Ala Val Asn Leu Leu Pro Ser Glu Thr Val Gln Asp
565 570 575 565 570 575
Ile Tyr Gly Ile Val Ala Lys Lys Val Asn Glu Ile Leu Gln Ala Asp Ile Tyr Gly Ile Val Ala Lys Lys Val Asn Glu Ile Leu Gln Ala Asp
580 585 590 580 585 590
Ala Ile Asn Gly Thr Asp Asn Glu Val Val Thr Val Thr Asp Glu Asn Ala Ile Asn Gly Thr Asp Asn Glu Val Val Thr Val Thr Asp Glu Asn
595 600 605 595 600 605
Thr Gly Glu Ile Ser Glu Lys Val Lys Leu Gly Thr Lys Ala Leu Ala Thr Gly Glu Ile Ser Glu Lys Val Lys Leu Gly Thr Lys Ala Leu Ala
610 615 620 610 615 620
Gly Gln Trp Leu Ala Tyr Gly Val Thr Arg Ser Val Thr Lys Arg Ser Gly Gln Trp Leu Ala Tyr Gly Val Thr Arg Ser Val Thr Lys Arg Ser
625 630 635 640 625 630 635 640
Val Met Thr Leu Ala Tyr Gly Ser Lys Glu Phe Gly Phe Arg Gln Gln Val Met Thr Leu Ala Tyr Gly Ser Lys Glu Phe Gly Phe Arg Gln Gln
645 650 655 645 650 655
Val Leu Glu Asp Thr Ile Gln Trp Ala Ile Asp Ser Gly Lys Gly Leu Val Leu Glu Asp Thr Ile Gln Trp Ala Ile Asp Ser Gly Lys Gly Leu
660 665 670 660 665 670
Met Phe Thr Gln Pro Asn Gln Ala Ala Gly Tyr Met Ala Lys Leu Ile Met Phe Thr Gln Pro Asn Gln Ala Ala Gly Tyr Met Ala Lys Leu Ile
675 680 685 675 680 685
Trp Glu Ser Val Ser Val Thr Val Val Ala Ala Val Glu Ala Met Asn Trp Glu Ser Val Ser Val Thr Val Val Ala Ala Val Glu Ala Met Asn
690 695 700 690 695 700
Trp Leu Lys Ser Ala Ala Lys Leu Leu Ala Ala Glu Val Lys Asp Lys Trp Leu Lys Ser Ala Ala Lys Leu Leu Ala Ala Glu Val Lys Asp Lys
705 710 715 720 705 710 715 720
Lys Thr Gly Glu Ile Leu Arg Lys Arg Cys Ala Val His Trp Val Thr Lys Thr Gly Glu Ile Leu Arg Lys Arg Cys Ala Val His Trp Val Thr
725 730 735 725 730 735
Pro Asp Gly Phe Pro Val Trp Gln Glu Tyr Lys Lys Pro Ile Gln Thr Pro Asp Gly Phe Pro Val Trp Gln Glu Tyr Lys Lys Pro Ile Gln Thr
740 745 750 740 745 750
Arg Leu Asn Leu Met Phe Leu Gly Gln Phe Arg Leu Gln Pro Thr Ile Arg Leu Asn Leu Met Phe Leu Gly Gln Phe Arg Leu Gln Pro Thr Ile
755 760 765 755 760 765
Asn Thr Asn Lys Asp Ser Glu Ile Asp Ala His Lys Gln Glu Ser Gly Asn Thr Asn Lys Asp Ser Glu Ile Asp Ala His Lys Gln Glu Ser Gly
770 775 780 770 775 780
Ile Ala Pro Asn Phe Val His Ser Gln Asp Gly Ser His Leu Arg Lys Ile Ala Pro Asn Phe Val His Ser Gln Asp Gly Ser His Leu Arg Lys
785 790 795 800 785 790 795 800
Thr Val Val Trp Ala His Glu Lys Tyr Gly Ile Glu Ser Phe Ala Leu Thr Val Val Trp Ala His Glu Lys Tyr Gly Ile Glu Ser Phe Ala Leu
805 810 815 805 810 815
Ile His Asp Ser Phe Gly Thr Ile Pro Ala Asp Ala Ala Asn Leu Phe Ile His Asp Ser Phe Gly Thr Ile Pro Ala Asp Ala Ala Asn Leu Phe
820 825 830 820 825 830
Lys Ala Val Arg Glu Thr Met Val Asp Thr Tyr Glu Ser Cys Asp Val Lys Ala Val Arg Glu Thr Met Val Asp Thr Tyr Glu Ser Cys Asp Val
835 840 845 835 840 845
Leu Ala Asp Phe Tyr Asp Gln Phe Ala Asp Gln Leu His Glu Ser Gln Leu Ala Asp Phe Tyr Asp Gln Phe Ala Asp Gln Leu His Glu Ser Gln
850 855 860 850 855 860
Leu Asp Lys Met Pro Ala Leu Pro Ala Lys Gly Asn Leu Asn Leu Arg Leu Asp Lys Met Pro Ala Leu Pro Ala Lys Gly Asn Leu Asn Leu Arg
865 870 875 880 865 870 875 880
Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala
885 890 885 890
<210> 16<210> 16
<211> 2673<211> 2673
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Вариант T7РНКP<223> T7RNAP variant
<400> 16<400> 16
atgcaccatc accatcacca tatgaacacg attaacatcg ctaagaacga cttctctgac 60atgcaccatc accatcacca tatgaacacg attaacatcg ctaagaacga cttctctgac 60
atcgaactgg ctgctatccc gttcaacact ctggctgacc attacggtga gcgtttagct 120atcgaactgg ctgctatccc gttcaacact ctggctgacc attacggtga gcgtttagct 120
cgcgaacagt tggcccttga gcatgagtct tacgagatgg gtgaagcacg cttccgcaag 180cgcgaacagt tggcccttga gcatgagtct tacgagatgg gtgaagcacg cttccgcaag 180
atgtttgagc gtcaacttaa agctggtgag gttgcggata acgctgccgc caagcctctc 240atgtttgagc gtcaacttaa agctggtgag gttgcggata acgctgccgc caagcctctc 240
atcactaccc tactccctaa gatgattgca cgcatcaacg actggtttga ggaagtgaaa 300atcactaccc tactccctaa gatgattgca cgcatcaacg actggtttga ggaagtgaaa 300
gctaagcgcg gcaagcgccc gacagccttc cagttcctgc aagaaatcaa gccggaagcc 360gctaagcgcg gcaagcgccc gacagccttc cagttcctgc aagaaatcaa gccggaagcc 360
gtagcgtaca tcaccattaa gaccactctg gcttgcctaa ccagtgctga taatacaacc 420gtagcgtaca tcaccattaa gaccactctg gcttgcctaa ccagtgctga taatacaacc 420
gttcaggctg tagcaagcgc aatcggtcgg gccattgagg acgaggctcg cttcggtcgt 480gttcaggctg tagcaagcgc aatcggtcgg gccattgagg acgaggctcg cttcggtcgt 480
atccgtgacc ttgaagctaa gcacttcaag aaaaacgttg aggaacaact caacaagcgc 540atccgtgacc ttgaagctaa gcacttcaag aaaaacgttg aggaacaact caacaagcgc 540
gtagggcacg tctacaagaa agcatttatg caagttgtcg aggctgacat gctctctaag 600gtagggcacg tctacaagaa agcatttatg caagttgtcg aggctgacat gctctctaag 600
ggtctactcg gtggcgaggc gtggtcttcg tggcataagg aagactctat tcatgtagga 660ggtctactcg gtggcgaggc gtggtcttcg tggcataagg aagactctat tcatgtagga 660
gtacgctgca tcgagatgct cattgagtca accggaatgg ttagcttaca ccgccaaaat 720gtacgctgca tcgagatgct cattgagtca accggaatgg ttagcttaca ccgccaaaat 720
gctggcgtag taggtcaaga ctctgagact atcgaactcg cacctgaata cgctgaggct 780gctggcgtag taggtcaaga ctctgagact atcgaactcg cacctgaata cgctgaggct 780
atcgcaaccc gtgcaggtgc gctggctggc atctctccga tgttccaacc ttgcgtagtt 840atcgcaaccc gtgcaggtgc gctggctggc atctctccga tgttccaacc ttgcgtagtt 840
cctcctaagc cgtggactgg cattactggt ggtggctatt gggctaacgg tcgtcgtcct 900cctcctaagc cgtggactgg cattactggt ggtggctatt gggctaacgg tcgtcgtcct 900
ctggcgctgg tgcgtactca cagtaagaaa gcactgatgc gctacgaaga cgtttacatg 960ctggcgctgg tgcgtactca cagtaagaaa gcactgatgc gctacgaaga cgtttacatg 960
cctgaggtgt acaaagcgat taacattgcg caaaacaccg catggaaaat caacaagaaa 10201020
gtcctagcgg tcgccaacgt aatcaccaag tggaagcatt gtccggtcga ggacatccct 1080gtcctagcgg tcgccaacgt aatcaccaag tggaagcatt gtccggtcga ggacatccct 1080
gcgattgagc gtgaagaact cccgatgaaa ccggaagaca tcgacatgaa tcctgaggct 1140gcgattgagc gtgaagaact cccgatgaaa ccggaagaca tcgacatgaa tcctgaggct 1140
ctcaccgcgt ggaaacgtgc tgccgctgct gtgtaccgca aggacaaggc tcgcaagtct 1200ctcaccgcgt ggaaacgtgc tgccgctgct gtgtaccgca aggacaaggc tcgcaagtct 1200
agacgtatca gccttgagtt catgcttgag caagccaata agtttgctaa ccataaggcc 1260agacgtatca gccttgagtt catgcttgag caagccaata agtttgctaa ccataaggcc 1260
atctggttcc cttacaacat ggactggcgc ggtcgtgttt acgctgtgtc aatgttcaac 1320atctggttcc cttacaacat ggactggcgc ggtcgtgttt acgctgtgtc aatgttcaac 1320
ccgcaaggta acgatatgac caaaggactg cttacgctgg cgaaaggtaa accaatcggt 1380ccgcaaggta acgatatgac caaaggactg cttacgctgg cgaaaggtaa accaatcggt 1380
aaggaaggtt actactggct gaaaatccac ggtgcaaact gtgcgggtgt cgataaggtt 1440aaggaaggtt actactggct gaaaatccac ggtgcaaact gtgcgggtgt cgataaggtt 1440
ccgttccctg agcgcatcaa gttcattgag gaaaaccacg agaacatcat ggcttgcgct 1500ccgttccctg agcgcatcaa gttcattgag gaaaaccacg agaacatcat ggcttgcgct 1500
aagtctccac tggagaacac ttggtgggct gagcaagatt ctccgttctg cttccttgcg 1560aagtctccac tggagaacac ttggtgggct gagcaagatt ctccgttctg cttccttgcg 1560
ttctgctttg agtacgctgg ggtacagcac cacggcctga gctataactg ctcccttccg 1620ttctgctttg agtacgctgg ggtacagcac cacggcctga gctataactg ctcccttccg 1620
ctggcgtttg acgggtcttg ctctggcatc cagcacttct ccgcgatgct ccgagatgag 1680ctggcgtttg acgggtcttg ctctggcatc cagcacttct ccgcgatgct ccgagatgag 1680
gtaggtggtc gcgcggttaa cttgcttcct agtgaaaccg ttcaggacat ctacgggatt 1740gtaggtggtc gcgcggttaa cttgcttcct agtgaaaccg ttcaggacat ctacgggatt 1740
gttgctaaga aagtcaacga gattctacaa gcagacgcaa tcaatgggac cgataacgaa 1800gttgctaaga aagtcaacga gattctacaa gcagacgcaa tcaatgggac cgataacgaa 1800
gtagttaccg tgaccgatga gaacactggt gaaatctctg agaaagtcaa gctgggcact 1860gtagttaccg tgaccgatga gaacactggt gaaatctctg agaaagtcaa gctgggcact 1860
aaggcactgg ctggtcaatg gctggcttac ggtgttactc gctgggtgac aaagcgttca 1920aaggcactgg ctggtcaatg gctggcttac ggtgttactc gctgggtgac aaagcgttca 1920
gtcatgacgc tggcttacgg gtccaaagag ttcggcttcc gtcaacaagt gctggaaacc 1980gtcatgacgc tggcttacgg gtccaaagag ttcggcttcc gtcaacaagt gctggaaacc 1980
accattcagt gggctattga ttccggcaag ggtctgatgt tcactcagcc gaatcaggct 2040accattcagt gggctattga ttccggcaag ggtctgatgt tcactcagcc gaatcaggct 2040
gctggataca tggctaagct gatttgggaa tctgtgagcg tgacggtggt agctgcggtt 2100gctggataca tggctaagct gatttgggaa tctgtgagcg tgacggtggt agctgcggtt 2100
gaagcaatga actggcttaa gtctgctgct aagctgctgg ctgctgaggt caaagataag 2160gaagcaatga actggcttaa gtctgctgct aagctgctgg ctgctgaggt caaagataag 2160
aagactggag agattcttcg caagcgttgc gctgtgcatt gggtaactcc tgatggtttc 2220aagactggag agattcttcg caagcgttgc gctgtgcatt gggtaactcc tgatggtttc 2220
cctgtgtggc aggaatacaa gaagcctatt cagacgcgct tgaacctgat gttcctcggt 2280cctgtgtggc aggaatacaa gaagcctatt cagacgcgct tgaacctgat gttcctcggt 2280
cagttccgct tacagcctac cattaacacc aacaaagata gcgagattga tgcacacaaa 2340cagttccgct tacagcctac cattaacacc aacaaagata gcgagattga tgcacacaaa 2340
caggagtctg gtatcgctcc taactttgta cacagccaag acggtagcca ccttcgtaag 2400caggagtctg gtatcgctcc taactttgta cacagccaag acggtagcca ccttcgtaag 2400
actgtagtgt gggcacacga gaagtacgga atcgaatctt ttgcactgat tcacgactcc 2460actgtagtgt gggcacacga gaagtacgga atcgaatctt ttgcactgat tcacgactcc 2460
ttcggtacca ttccggctga cgctgcgaac ctgttcaaag cagtgcgcga aactatggtt 2520ttcggtacca ttccggctga cgctgcgaac ctgttcaaag cagtgcgcga aactatggtt 2520
gacacatatg agtcttgtga tgtactggct gatttctacg accagttcgc tgaccagttg 2580gacacatatg agtcttgtga tgtactggct gatttctacg accagttcgc tgaccagttg 2580
cacgagtctc aattggacaa aatgccagca cttccggcta aaggtaactt gaacctccgt 2640cacgagtctc aattggacaa aatgccagca cttccggcta aaggtaactt gaacctccgt 2640
gacatcttag agtcggactt cgcgttcgcg taa 2673gacatcttag agtcggactt cgcgttcgcg taa 2673
<210> 17<210> 17
<211> 890<211> 890
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Вариант T7РНКP<223> T7RNAP variant
<400> 17<400> 17
Met His His His His His His Met Asn Thr Ile Asn Ile Ala Lys Asn Met His His His His His His Met Asn Thr Ile Asn Ile Ala Lys Asn
1 5 10 15 1 5 10 15
Asp Phe Ser Asp Ile Glu Leu Ala Ala Ile Pro Phe Asn Thr Leu Ala Asp Phe Ser Asp Ile Glu Leu Ala Ala Ile Pro Phe Asn Thr Leu Ala
20 25 30 20 25 30
Asp His Tyr Gly Glu Arg Leu Ala Arg Glu Gln Leu Ala Leu Glu His Asp His Tyr Gly Glu Arg Leu Ala Arg Glu Gln Leu Ala Leu Glu His
35 40 45 35 40 45
Glu Ser Tyr Glu Met Gly Glu Ala Arg Phe Arg Lys Met Phe Glu Arg Glu Ser Tyr Glu Met Gly Glu Ala Arg Phe Arg Lys Met Phe Glu Arg
50 55 60 50 55 60
Gln Leu Lys Ala Gly Glu Val Ala Asp Asn Ala Ala Ala Lys Pro Leu Gln Leu Lys Ala Gly Glu Val Ala Asp Asn Ala Ala Ala Lys Pro Leu
65 70 75 80 65 70 75 80
Ile Thr Thr Leu Leu Pro Lys Met Ile Ala Arg Ile Asn Asp Trp Phe Ile Thr Thr Leu Leu Pro Lys Met Ile Ala Arg Ile Asn Asp Trp Phe
85 90 95 85 90 95
Glu Glu Val Lys Ala Lys Arg Gly Lys Arg Pro Thr Ala Phe Gln Phe Glu Glu Val Lys Ala Lys Arg Gly Lys Arg Pro Thr Ala Phe Gln Phe
100 105 110 100 105 110
Leu Gln Glu Ile Lys Pro Glu Ala Val Ala Tyr Ile Thr Ile Lys Thr Leu Gln Glu Ile Lys Pro Glu Ala Val Ala Tyr Ile Thr Ile Lys Thr
115 120 125 115 120 125
Thr Leu Ala Cys Leu Thr Ser Ala Asp Asn Thr Thr Val Gln Ala Val Thr Leu Ala Cys Leu Thr Ser Ala Asp Asn Thr Thr Val Gln Ala Val
130 135 140 130 135 140
Ala Ser Ala Ile Gly Arg Ala Ile Glu Asp Glu Ala Arg Phe Gly Arg Ala Ser Ala Ile Gly Arg Ala Ile Glu Asp Glu Ala Arg Phe Gly Arg
145 150 155 160 145 150 155 160
Ile Arg Asp Leu Glu Ala Lys His Phe Lys Lys Asn Val Glu Glu Gln Ile Arg Asp Leu Glu Ala Lys His Phe Lys Lys Asn Val Glu Glu Gln
165 170 175 165 170 175
Leu Asn Lys Arg Val Gly His Val Tyr Lys Lys Ala Phe Met Gln Val Leu Asn Lys Arg Val Gly His Val Tyr Lys Lys Ala Phe Met Gln Val
180 185 190 180 185 190
Val Glu Ala Asp Met Leu Ser Lys Gly Leu Leu Gly Gly Glu Ala Trp Val Glu Ala Asp Met Leu Ser Lys Gly Leu Leu Gly Gly Glu Ala Trp
195 200 205 195 200 205
Ser Ser Trp His Lys Glu Asp Ser Ile His Val Gly Val Arg Cys Ile Ser Ser Trp His Lys Glu Asp Ser Ile His Val Gly Val Arg Cys Ile
210 215 220 210 215 220
Glu Met Leu Ile Glu Ser Thr Gly Met Val Ser Leu His Arg Gln Asn Glu Met Leu Ile Glu Ser Thr Gly Met Val Ser Leu His Arg Gln Asn
225 230 235 240 225 230 235 240
Ala Gly Val Val Gly Gln Asp Ser Glu Thr Ile Glu Leu Ala Pro Glu Ala Gly Val Val Gly Gln Asp Ser Glu Thr Ile Glu Leu Ala Pro Glu
245 250 255 245 250 255
Tyr Ala Glu Ala Ile Ala Thr Arg Ala Gly Ala Leu Ala Gly Ile Ser Tyr Ala Glu Ala Ile Ala Thr Arg Ala Gly Ala Leu Ala Gly Ile Ser
260 265 270 260 265 270
Pro Met Phe Gln Pro Cys Val Val Pro Pro Lys Pro Trp Thr Gly Ile Pro Met Phe Gln Pro Cys Val Val Pro Pro Lys Pro Trp Thr Gly Ile
275 280 285 275 280 285
Thr Gly Gly Gly Tyr Trp Ala Asn Gly Arg Arg Pro Leu Ala Leu Val Thr Gly Gly Gly Tyr Trp Ala Asn Gly Arg Arg Pro Leu Ala Leu Val
290 295 300 290 295 300
Arg Thr His Ser Lys Lys Ala Leu Met Arg Tyr Glu Asp Val Tyr Met Arg Thr His Ser Lys Lys Ala Leu Met Arg Tyr Glu Asp Val Tyr Met
305 310 315 320 305 310 315 320
Pro Glu Val Tyr Lys Ala Ile Asn Ile Ala Gln Asn Thr Ala Trp Lys Pro Glu Val Tyr Lys Ala Ile Asn Ile Ala Gln Asn Thr Ala Trp Lys
325 330 335 325 330 335
Ile Asn Lys Lys Val Leu Ala Val Ala Asn Val Ile Thr Lys Trp Lys Ile Asn Lys Lys Val Leu Ala Val Ala Asn Val Ile Thr Lys Trp Lys
340 345 350 340 345 350
His Cys Pro Val Glu Asp Ile Pro Ala Ile Glu Arg Glu Glu Leu Pro His Cys Pro Val Glu Asp Ile Pro Ala Ile Glu Arg Glu Glu Leu Pro
355 360 365 355 360 365
Met Lys Pro Glu Asp Ile Asp Met Asn Pro Glu Ala Leu Thr Ala Trp Met Lys Pro Glu Asp Ile Asp Met Asn Pro Glu Ala Leu Thr Ala Trp
370 375 380 370 375 380
Lys Arg Ala Ala Ala Ala Val Tyr Arg Lys Asp Lys Ala Arg Lys Ser Lys Arg Ala Ala Ala Ala Val Tyr Arg Lys Asp Lys Ala Arg Lys Ser
385 390 395 400 385 390 395 400
Arg Arg Ile Ser Leu Glu Phe Met Leu Glu Gln Ala Asn Lys Phe Ala Arg Arg Ile Ser Leu Glu Phe Met Leu Glu Gln Ala Asn Lys Phe Ala
405 410 415 405 410 415
Asn His Lys Ala Ile Trp Phe Pro Tyr Asn Met Asp Trp Arg Gly Arg Asn His Lys Ala Ile Trp Phe Pro Tyr Asn Met Asp Trp Arg Gly Arg
420 425 430 420 425 430
Val Tyr Ala Val Ser Met Phe Asn Pro Gln Gly Asn Asp Met Thr Lys Val Tyr Ala Val Ser Met Phe Asn Pro Gln Gly Asn Asp Met Thr Lys
435 440 445 435 440 445
Gly Leu Leu Thr Leu Ala Lys Gly Lys Pro Ile Gly Lys Glu Gly Tyr Gly Leu Leu Thr Leu Ala Lys Gly Lys Pro Ile Gly Lys Glu Gly Tyr
450 455 460 450 455 460
Tyr Trp Leu Lys Ile His Gly Ala Asn Cys Ala Gly Val Asp Lys Val Tyr Trp Leu Lys Ile His Gly Ala Asn Cys Ala Gly Val Asp Lys Val
465 470 475 480 465 470 475 480
Pro Phe Pro Glu Arg Ile Lys Phe Ile Glu Glu Asn His Glu Asn Ile Pro Phe Pro Glu Arg Ile Lys Phe Ile Glu Glu Asn His Glu Asn Ile
485 490 495 485 490 495
Met Ala Cys Ala Lys Ser Pro Leu Glu Asn Thr Trp Trp Ala Glu Gln Met Ala Cys Ala Lys Ser Pro Leu Glu Asn Thr Trp Trp Ala Glu Gln
500 505 510 500 505 510
Asp Ser Pro Phe Cys Phe Leu Ala Phe Cys Phe Glu Tyr Ala Gly Val Asp Ser Pro Phe Cys Phe Leu Ala Phe Cys Phe Glu Tyr Ala Gly Val
515 520 525 515 520 525
Gln His His Gly Leu Ser Tyr Asn Cys Ser Leu Pro Leu Ala Phe Asp Gln His His Gly Leu Ser Tyr Asn Cys Ser Leu Pro Leu Ala Phe Asp
530 535 540 530 535 540
Gly Ser Cys Ser Gly Ile Gln His Phe Ser Ala Met Leu Arg Asp Glu Gly Ser Cys Ser Gly Ile Gln His Phe Ser Ala Met Leu Arg Asp Glu
545 550 555 560 545 550 555 560
Val Gly Gly Arg Ala Val Asn Leu Leu Pro Ser Glu Thr Val Gln Asp Val Gly Gly Arg Ala Val Asn Leu Leu Pro Ser Glu Thr Val Gln Asp
565 570 575 565 570 575
Ile Tyr Gly Ile Val Ala Lys Lys Val Asn Glu Ile Leu Gln Ala Asp Ile Tyr Gly Ile Val Ala Lys Lys Val Asn Glu Ile Leu Gln Ala Asp
580 585 590 580 585 590
Ala Ile Asn Gly Thr Asp Asn Glu Val Val Thr Val Thr Asp Glu Asn Ala Ile Asn Gly Thr Asp Asn Glu Val Val Thr Val Thr Asp Glu Asn
595 600 605 595 600 605
Thr Gly Glu Ile Ser Glu Lys Val Lys Leu Gly Thr Lys Ala Leu Ala Thr Gly Glu Ile Ser Glu Lys Val Lys Leu Gly Thr Lys Ala Leu Ala
610 615 620 610 615 620
Gly Gln Trp Leu Ala Tyr Gly Val Thr Arg Trp Val Thr Lys Arg Ser Gly Gln Trp Leu Ala Tyr Gly Val Thr Arg Trp Val Thr Lys Arg Ser
625 630 635 640 625 630 635 640
Val Met Thr Leu Ala Tyr Gly Ser Lys Glu Phe Gly Phe Arg Gln Gln Val Met Thr Leu Ala Tyr Gly Ser Lys Glu Phe Gly Phe Arg Gln Gln
645 650 655 645 650 655
Val Leu Glu Thr Thr Ile Gln Trp Ala Ile Asp Ser Gly Lys Gly Leu Val Leu Glu Thr Thr Ile Gln Trp Ala Ile Asp Ser Gly Lys Gly Leu
660 665 670 660 665 670
Met Phe Thr Gln Pro Asn Gln Ala Ala Gly Tyr Met Ala Lys Leu Ile Met Phe Thr Gln Pro Asn Gln Ala Ala Gly Tyr Met Ala Lys Leu Ile
675 680 685 675 680 685
Trp Glu Ser Val Ser Val Thr Val Val Ala Ala Val Glu Ala Met Asn Trp Glu Ser Val Ser Val Thr Val Val Ala Ala Val Glu Ala Met Asn
690 695 700 690 695 700
Trp Leu Lys Ser Ala Ala Lys Leu Leu Ala Ala Glu Val Lys Asp Lys Trp Leu Lys Ser Ala Ala Lys Leu Leu Ala Ala Glu Val Lys Asp Lys
705 710 715 720 705 710 715 720
Lys Thr Gly Glu Ile Leu Arg Lys Arg Cys Ala Val His Trp Val Thr Lys Thr Gly Glu Ile Leu Arg Lys Arg Cys Ala Val His Trp Val Thr
725 730 735 725 730 735
Pro Asp Gly Phe Pro Val Trp Gln Glu Tyr Lys Lys Pro Ile Gln Thr Pro Asp Gly Phe Pro Val Trp Gln Glu Tyr Lys Lys Pro Ile Gln Thr
740 745 750 740 745 750
Arg Leu Asn Leu Met Phe Leu Gly Gln Phe Arg Leu Gln Pro Thr Ile Arg Leu Asn Leu Met Phe Leu Gly Gln Phe Arg Leu Gln Pro Thr Ile
755 760 765 755 760 765
Asn Thr Asn Lys Asp Ser Glu Ile Asp Ala His Lys Gln Glu Ser Gly Asn Thr Asn Lys Asp Ser Glu Ile Asp Ala His Lys Gln Glu Ser Gly
770 775 780 770 775 780
Ile Ala Pro Asn Phe Val His Ser Gln Asp Gly Ser His Leu Arg Lys Ile Ala Pro Asn Phe Val His Ser Gln Asp Gly Ser His Leu Arg Lys
785 790 795 800 785 790 795 800
Thr Val Val Trp Ala His Glu Lys Tyr Gly Ile Glu Ser Phe Ala Leu Thr Val Val Trp Ala His Glu Lys Tyr Gly Ile Glu Ser Phe Ala Leu
805 810 815 805 810 815
Ile His Asp Ser Phe Gly Thr Ile Pro Ala Asp Ala Ala Asn Leu Phe Ile His Asp Ser Phe Gly Thr Ile Pro Ala Asp Ala Ala Asn Leu Phe
820 825 830 820 825 830
Lys Ala Val Arg Glu Thr Met Val Asp Thr Tyr Glu Ser Cys Asp Val Lys Ala Val Arg Glu Thr Met Val Asp Thr Tyr Glu Ser Cys Asp Val
835 840 845 835 840 845
Leu Ala Asp Phe Tyr Asp Gln Phe Ala Asp Gln Leu His Glu Ser Gln Leu Ala Asp Phe Tyr Asp Gln Phe Ala Asp Gln Leu His Glu Ser Gln
850 855 860 850 855 860
Leu Asp Lys Met Pro Ala Leu Pro Ala Lys Gly Asn Leu Asn Leu Arg Leu Asp Lys Met Pro Ala Leu Pro Ala Lys Gly Asn Leu Asn Leu Arg
865 870 875 880 865 870 875 880
Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala
885 890 885 890
<210> 18<210> 18
<211> 2673<211> 2673
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Вариант T7РНКP<223> T7RNAP variant
<400> 18<400> 18
atgcaccatc accatcacca tatgaacacg attaacatcg ctaagaacga cttctctgac 60atgcaccatc accatcacca tatgaacacg attaacatcg ctaagaacga cttctctgac 60
atcgaactgg ctgctatccc gttcaacact ctggctgacc attacggtga gcgtttagct 120atcgaactgg ctgctatccc gttcaacact ctggctgacc attacggtga gcgtttagct 120
cgcgaacagt tggcccttga gcatgagtct tacgagatgg gtgaagcacg cttccgcaag 180cgcgaacagt tggcccttga gcatgagtct tacgagatgg gtgaagcacg cttccgcaag 180
atgtttgagc gtcaacttaa agctggtgag gttgcggata acgctgccgc caagcctctc 240atgtttgagc gtcaacttaa agctggtgag gttgcggata acgctgccgc caagcctctc 240
atcactaccc tactccctaa gatgattgca cgcatcaacg actggtttga ggaagtgaaa 300atcactaccc tactccctaa gatgattgca cgcatcaacg actggtttga ggaagtgaaa 300
gctaagcgcg gcaagcgccc gacagccttc cagttcctgc aagaaatcaa gccggaagcc 360gctaagcgcg gcaagcgccc gacagccttc cagttcctgc aagaaatcaa gccggaagcc 360
gtagcgtaca tcaccattaa gaccactctg gcttgcctaa ccagtgctga taatacaacc 420gtagcgtaca tcaccattaa gaccactctg gcttgcctaa ccagtgctga taatacaacc 420
gttcaggctg tagcaagcgc aatcggtcgg gccattgagg acgaggctcg cttcggtcgt 480gttcaggctg tagcaagcgc aatcggtcgg gccattgagg acgaggctcg cttcggtcgt 480
atccgtgacc ttgaagctaa gcacttcaag aaaaacgttg aggaacaact caacaagcgc 540atccgtgacc ttgaagctaa gcacttcaag aaaaacgttg aggaacaact caacaagcgc 540
gtagggcacg tctacaagaa agcatttatg caagttgtcg aggctgacat gctctctaag 600gtagggcacg tctacaagaa agcatttatg caagttgtcg aggctgacat gctctctaag 600
ggtctactcg gtggcgaggc gtggtcttcg tggcataagg aagactctat tcatgtagga 660ggtctactcg gtggcgaggc gtggtcttcg tggcataagg aagactctat tcatgtagga 660
gtacgctgca tcgagatgct cattgagtca accggaatgg ttagcttaca ccgccaaaat 720gtacgctgca tcgagatgct cattgagtca accggaatgg ttagcttaca ccgccaaaat 720
gctggcgtag taggtcaaga ctctgagact atcgaactcg cacctgaata cgctgaggct 780gctggcgtag taggtcaaga ctctgagact atcgaactcg cacctgaata cgctgaggct 780
atcgcaaccc gtgcaggtgc gctggctggc atctctccga tgttccaacc ttgcgtagtt 840atcgcaaccc gtgcaggtgc gctggctggc atctctccga tgttccaacc ttgcgtagtt 840
cctcctaagc cgtggactgg cattactggt ggtggctatt gggctaacgg tcgtcgtcct 900cctcctaagc cgtggactgg cattactggt ggtggctatt gggctaacgg tcgtcgtcct 900
ctggcgctgg tgcgtactca cagtaagaaa gcactgatgc gctacgaaga cgtttacatg 960ctggcgctgg tgcgtactca cagtaagaaa gcactgatgc gctacgaaga cgtttacatg 960
cctgaggtgt acaaagcgat taacattgcg caaaacaccg catggaaaat caacaagaaa 10201020
gtcctagcgg tcgccaacgt aatcaccaag tggaagcatt gtccggtcga ggacatccct 1080gtcctagcgg tcgccaacgt aatcaccaag tggaagcatt gtccggtcga ggacatccct 1080
gcgattgagc gtgaagaact cccgatgaaa ccggaagaca tcgacatgaa tcctgaggct 1140gcgattgagc gtgaagaact cccgatgaaa ccggaagaca tcgacatgaa tcctgaggct 1140
ctcaccgcgt ggaaacgtgc tgccgctgct gtgtaccgca aggacaaggc tcgcaagtct 1200ctcaccgcgt ggaaacgtgc tgccgctgct gtgtaccgca aggacaaggc tcgcaagtct 1200
cgccgtatca gccttgagtt catgcttgag caagccaata agtttgctaa ccataaggcc 1260cgccgtatca gccttgagtt catgcttgag caagccaata agtttgctaa ccataaggcc 1260
atctggttcc cttacaacat ggactggcgc ggtcgtgttt acgctgtgtc aatgttcaac 1320atctggttcc cttacaacat ggactggcgc ggtcgtgttt acgctgtgtc aatgttcaac 1320
ccgcaaggta acgatatgac caaaggactg cttacgctgg cgaaaggtaa accaatcggt 1380ccgcaaggta acgatatgac caaaggactg cttacgctgg cgaaaggtaa accaatcggt 1380
aaggaaggtt actactggct gaaaatccac ggtgcaaact gtgcgggtgt cgataaggtt 1440aaggaaggtt actactggct gaaaatccac ggtgcaaact gtgcgggtgt cgataaggtt 1440
ccgttccctg agcgcatcaa gttcattgag gaaaaccacg agaacatcat ggcttgcgct 1500ccgttccctg agcgcatcaa gttcattgag gaaaaccacg agaacatcat ggcttgcgct 1500
aagtctccac tggagaacac ttggtgggct gagcaattgt ctccgttctg cttccttgcg 1560aagtctccac tggagaacac ttggtgggct gagcaattgt ctccgttctg cttccttgcg 1560
ttctgctttg agtacgctgg ggtacagcac cacggcctga gctataactg ctcccttccg 1620ttctgctttg agtacgctgg ggtacagcac cacggcctga gctataactg ctcccttccg 1620
ctggcgtttg acgggtcttg ctctggcatc cagcacttct ccgcgatgct ccgagatgag 1680ctggcgtttg acgggtcttg ctctggcatc cagcacttct ccgcgatgct ccgagatgag 1680
gtaggtggtc gcgcggttaa cttgcttcct agtgaaaccg ttcaggacat ctacgggatt 1740gtaggtggtc gcgcggttaa cttgcttcct agtgaaaccg ttcaggacat ctacgggatt 1740
gttgctaaga aagtcaacga gattctacaa gcagacgcaa tcaatgggac cgataacgaa 1800gttgctaaga aagtcaacga gattctacaa gcagacgcaa tcaatgggac cgataacgaa 1800
gtagttaccg tgaccgatga gaacactggt gaaatctctg agaaagtcaa gctgggcact 1860gtagttaccg tgaccgatga gaacactggt gaaatctctg agaaagtcaa gctgggcact 1860
aaggcactgg ctggtcaatg gctggcttac ggtgttactc gcagtgtgac taagcgttca 1920aaggcactgg ctggtcaatg gctggcttac ggtgttactc gcagtgtgac taagcgttca 1920
gtcatgacgc tggcttacgg gtccaaagag ttcggcttcc gtcaacaagt gctggaatgg 1980gtcatgacgc tggcttacgg gtccaaagag ttcggcttcc gtcaacaagt gctggaatgg 1980
accattcagt gggctattga ttccggcaag ggtctgatgt tcactcagcc gaatcaggct 2040accattcagt gggctattga ttccggcaag ggtctgatgt tcactcagcc gaatcaggct 2040
gctggataca tggctaagct gatttgggaa tctgtgagcg tgacggtggt agctgcggtt 2100gctggataca tggctaagct gatttgggaa tctgtgagcg tgacggtggt agctgcggtt 2100
gaagcaatga actggcttaa gtctgctgct aagctgctgg ctgctgaggt caaagataag 2160gaagcaatga actggcttaa gtctgctgct aagctgctgg ctgctgaggt caaagataag 2160
aagactggag agattcttcg caagcgttgc gctgtgcatt gggtaactcc tgatggtttc 2220aagactggag agattcttcg caagcgttgc gctgtgcatt gggtaactcc tgatggtttc 2220
cctgtgtggc aggaatacaa gaagcctatt cagacgcgct tgaacctgat gttcctcggt 2280cctgtgtggc aggaatacaa gaagcctatt cagacgcgct tgaacctgat gttcctcggt 2280
cagttccgct tacagcctac cattaacacc aacaaagata gcgagattga tgcacacaaa 2340cagttccgct tacagcctac cattaacacc aacaaagata gcgagattga tgcacacaaa 2340
caggagtctg gtatcgctcc taactttgta cacagccaag acggtagcca ccttcgtaag 2400caggagtctg gtatcgctcc taactttgta cacagccaag acggtagcca ccttcgtaag 2400
actgtagtgt gggcacacga gaagtacgga atcgaatctt ttgcactgat tcacgactcc 2460actgtagtgt gggcacacga gaagtacgga atcgaatctt ttgcactgat tcacgactcc 2460
ttcggtacca ttccggctga cgctgcgaac ctgttcaaag cagtgcgcga aactatggtt 2520ttcggtacca ttccggctga cgctgcgaac ctgttcaaag cagtgcgcga aactatggtt 2520
gacacatatg agtcttgtga tgtactggct gatttctacg accagttcgc tgaccagttg 2580gacacatatg agtcttgtga tgtactggct gatttctacg accagttcgc tgaccagttg 2580
cacgagtctc aattggacaa aatgccagca cttccggcta aaggtaactt gaacctccgt 2640cacgagtctc aattggacaa aatgccagca cttccggcta aaggtaactt gaacctccgt 2640
gacatcttag agtcggactt cgcgttcgcg taa 2673gacatcttag agtcggactt cgcgttcgcg taa 2673
<210> 19<210> 19
<211> 890<211> 890
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Вариант T7РНКP<223> T7RNAP variant
<400> 19<400> 19
Met His His His His His His Met Asn Thr Ile Asn Ile Ala Lys Asn Met His His His His His His Met Asn Thr Ile Asn Ile Ala Lys Asn
1 5 10 15 1 5 10 15
Asp Phe Ser Asp Ile Glu Leu Ala Ala Ile Pro Phe Asn Thr Leu Ala Asp Phe Ser Asp Ile Glu Leu Ala Ala Ile Pro Phe Asn Thr Leu Ala
20 25 30 20 25 30
Asp His Tyr Gly Glu Arg Leu Ala Arg Glu Gln Leu Ala Leu Glu His Asp His Tyr Gly Glu Arg Leu Ala Arg Glu Gln Leu Ala Leu Glu His
35 40 45 35 40 45
Glu Ser Tyr Glu Met Gly Glu Ala Arg Phe Arg Lys Met Phe Glu Arg Glu Ser Tyr Glu Met Gly Glu Ala Arg Phe Arg Lys Met Phe Glu Arg
50 55 60 50 55 60
Gln Leu Lys Ala Gly Glu Val Ala Asp Asn Ala Ala Ala Lys Pro Leu Gln Leu Lys Ala Gly Glu Val Ala Asp Asn Ala Ala Ala Lys Pro Leu
65 70 75 80 65 70 75 80
Ile Thr Thr Leu Leu Pro Lys Met Ile Ala Arg Ile Asn Asp Trp Phe Ile Thr Thr Leu Leu Pro Lys Met Ile Ala Arg Ile Asn Asp Trp Phe
85 90 95 85 90 95
Glu Glu Val Lys Ala Lys Arg Gly Lys Arg Pro Thr Ala Phe Gln Phe Glu Glu Val Lys Ala Lys Arg Gly Lys Arg Pro Thr Ala Phe Gln Phe
100 105 110 100 105 110
Leu Gln Glu Ile Lys Pro Glu Ala Val Ala Tyr Ile Thr Ile Lys Thr Leu Gln Glu Ile Lys Pro Glu Ala Val Ala Tyr Ile Thr Ile Lys Thr
115 120 125 115 120 125
Thr Leu Ala Cys Leu Thr Ser Ala Asp Asn Thr Thr Val Gln Ala Val Thr Leu Ala Cys Leu Thr Ser Ala Asp Asn Thr Thr Val Gln Ala Val
130 135 140 130 135 140
Ala Ser Ala Ile Gly Arg Ala Ile Glu Asp Glu Ala Arg Phe Gly Arg Ala Ser Ala Ile Gly Arg Ala Ile Glu Asp Glu Ala Arg Phe Gly Arg
145 150 155 160 145 150 155 160
Ile Arg Asp Leu Glu Ala Lys His Phe Lys Lys Asn Val Glu Glu Gln Ile Arg Asp Leu Glu Ala Lys His Phe Lys Lys Asn Val Glu Glu Gln
165 170 175 165 170 175
Leu Asn Lys Arg Val Gly His Val Tyr Lys Lys Ala Phe Met Gln Val Leu Asn Lys Arg Val Gly His Val Tyr Lys Lys Ala Phe Met Gln Val
180 185 190 180 185 190
Val Glu Ala Asp Met Leu Ser Lys Gly Leu Leu Gly Gly Glu Ala Trp Val Glu Ala Asp Met Leu Ser Lys Gly Leu Leu Gly Gly Glu Ala Trp
195 200 205 195 200 205
Ser Ser Trp His Lys Glu Asp Ser Ile His Val Gly Val Arg Cys Ile Ser Ser Trp His Lys Glu Asp Ser Ile His Val Gly Val Arg Cys Ile
210 215 220 210 215 220
Glu Met Leu Ile Glu Ser Thr Gly Met Val Ser Leu His Arg Gln Asn Glu Met Leu Ile Glu Ser Thr Gly Met Val Ser Leu His Arg Gln Asn
225 230 235 240 225 230 235 240
Ala Gly Val Val Gly Gln Asp Ser Glu Thr Ile Glu Leu Ala Pro Glu Ala Gly Val Val Gly Gln Asp Ser Glu Thr Ile Glu Leu Ala Pro Glu
245 250 255 245 250 255
Tyr Ala Glu Ala Ile Ala Thr Arg Ala Gly Ala Leu Ala Gly Ile Ser Tyr Ala Glu Ala Ile Ala Thr Arg Ala Gly Ala Leu Ala Gly Ile Ser
260 265 270 260 265 270
Pro Met Phe Gln Pro Cys Val Val Pro Pro Lys Pro Trp Thr Gly Ile Pro Met Phe Gln Pro Cys Val Val Pro Pro Lys Pro Trp Thr Gly Ile
275 280 285 275 280 285
Thr Gly Gly Gly Tyr Trp Ala Asn Gly Arg Arg Pro Leu Ala Leu Val Thr Gly Gly Gly Tyr Trp Ala Asn Gly Arg Arg Pro Leu Ala Leu Val
290 295 300 290 295 300
Arg Thr His Ser Lys Lys Ala Leu Met Arg Tyr Glu Asp Val Tyr Met Arg Thr His Ser Lys Lys Ala Leu Met Arg Tyr Glu Asp Val Tyr Met
305 310 315 320 305 310 315 320
Pro Glu Val Tyr Lys Ala Ile Asn Ile Ala Gln Asn Thr Ala Trp Lys Pro Glu Val Tyr Lys Ala Ile Asn Ile Ala Gln Asn Thr Ala Trp Lys
325 330 335 325 330 335
Ile Asn Lys Lys Val Leu Ala Val Ala Asn Val Ile Thr Lys Trp Lys Ile Asn Lys Lys Val Leu Ala Val Ala Asn Val Ile Thr Lys Trp Lys
340 345 350 340 345 350
His Cys Pro Val Glu Asp Ile Pro Ala Ile Glu Arg Glu Glu Leu Pro His Cys Pro Val Glu Asp Ile Pro Ala Ile Glu Arg Glu Glu Leu Pro
355 360 365 355 360 365
Met Lys Pro Glu Asp Ile Asp Met Asn Pro Glu Ala Leu Thr Ala Trp Met Lys Pro Glu Asp Ile Asp Met Asn Pro Glu Ala Leu Thr Ala Trp
370 375 380 370 375 380
Lys Arg Ala Ala Ala Ala Val Tyr Arg Lys Asp Lys Ala Arg Lys Ser Lys Arg Ala Ala Ala Ala Val Tyr Arg Lys Asp Lys Ala Arg Lys Ser
385 390 395 400 385 390 395 400
Arg Arg Ile Ser Leu Glu Phe Met Leu Glu Gln Ala Asn Lys Phe Ala Arg Arg Ile Ser Leu Glu Phe Met Leu Glu Gln Ala Asn Lys Phe Ala
405 410 415 405 410 415
Asn His Lys Ala Ile Trp Phe Pro Tyr Asn Met Asp Trp Arg Gly Arg Asn His Lys Ala Ile Trp Phe Pro Tyr Asn Met Asp Trp Arg Gly Arg
420 425 430 420 425 430
Val Tyr Ala Val Ser Met Phe Asn Pro Gln Gly Asn Asp Met Thr Lys Val Tyr Ala Val Ser Met Phe Asn Pro Gln Gly Asn Asp Met Thr Lys
435 440 445 435 440 445
Gly Leu Leu Thr Leu Ala Lys Gly Lys Pro Ile Gly Lys Glu Gly Tyr Gly Leu Leu Thr Leu Ala Lys Gly Lys Pro Ile Gly Lys Glu Gly Tyr
450 455 460 450 455 460
Tyr Trp Leu Lys Ile His Gly Ala Asn Cys Ala Gly Val Asp Lys Val Tyr Trp Leu Lys Ile His Gly Ala Asn Cys Ala Gly Val Asp Lys Val
465 470 475 480 465 470 475 480
Pro Phe Pro Glu Arg Ile Lys Phe Ile Glu Glu Asn His Glu Asn Ile Pro Phe Pro Glu Arg Ile Lys Phe Ile Glu Glu Asn His Glu Asn Ile
485 490 495 485 490 495
Met Ala Cys Ala Lys Ser Pro Leu Glu Asn Thr Trp Trp Ala Glu Gln Met Ala Cys Ala Lys Ser Pro Leu Glu Asn Thr Trp Trp Ala Glu Gln
500 505 510 500 505 510
Leu Ser Pro Phe Cys Phe Leu Ala Phe Cys Phe Glu Tyr Ala Gly Val Leu Ser Pro Phe Cys Phe Leu Ala Phe Cys Phe Glu Tyr Ala Gly Val
515 520 525 515 520 525
Gln His His Gly Leu Ser Tyr Asn Cys Ser Leu Pro Leu Ala Phe Asp Gln His His Gly Leu Ser Tyr Asn Cys Ser Leu Pro Leu Ala Phe Asp
530 535 540 530 535 540
Gly Ser Cys Ser Gly Ile Gln His Phe Ser Ala Met Leu Arg Asp Glu Gly Ser Cys Ser Gly Ile Gln His Phe Ser Ala Met Leu Arg Asp Glu
545 550 555 560 545 550 555 560
Val Gly Gly Arg Ala Val Asn Leu Leu Pro Ser Glu Thr Val Gln Asp Val Gly Gly Arg Ala Val Asn Leu Leu Pro Ser Glu Thr Val Gln Asp
565 570 575 565 570 575
Ile Tyr Gly Ile Val Ala Lys Lys Val Asn Glu Ile Leu Gln Ala Asp Ile Tyr Gly Ile Val Ala Lys Lys Val Asn Glu Ile Leu Gln Ala Asp
580 585 590 580 585 590
Ala Ile Asn Gly Thr Asp Asn Glu Val Val Thr Val Thr Asp Glu Asn Ala Ile Asn Gly Thr Asp Asn Glu Val Val Thr Val Thr Asp Glu Asn
595 600 605 595 600 605
Thr Gly Glu Ile Ser Glu Lys Val Lys Leu Gly Thr Lys Ala Leu Ala Thr Gly Glu Ile Ser Glu Lys Val Lys Leu Gly Thr Lys Ala Leu Ala
610 615 620 610 615 620
Gly Gln Trp Leu Ala Tyr Gly Val Thr Arg Ser Val Thr Lys Arg Ser Gly Gln Trp Leu Ala Tyr Gly Val Thr Arg Ser Val Thr Lys Arg Ser
625 630 635 640 625 630 635 640
Val Met Thr Leu Ala Tyr Gly Ser Lys Glu Phe Gly Phe Arg Gln Gln Val Met Thr Leu Ala Tyr Gly Ser Lys Glu Phe Gly Phe Arg Gln Gln
645 650 655 645 650 655
Val Leu Glu Trp Thr Ile Gln Trp Ala Ile Asp Ser Gly Lys Gly Leu Val Leu Glu Trp Thr Ile Gln Trp Ala Ile Asp Ser Gly Lys Gly Leu
660 665 670 660 665 670
Met Phe Thr Gln Pro Asn Gln Ala Ala Gly Tyr Met Ala Lys Leu Ile Met Phe Thr Gln Pro Asn Gln Ala Ala Gly Tyr Met Ala Lys Leu Ile
675 680 685 675 680 685
Trp Glu Ser Val Ser Val Thr Val Val Ala Ala Val Glu Ala Met Asn Trp Glu Ser Val Ser Val Thr Val Val Ala Ala Val Glu Ala Met Asn
690 695 700 690 695 700
Trp Leu Lys Ser Ala Ala Lys Leu Leu Ala Ala Glu Val Lys Asp Lys Trp Leu Lys Ser Ala Ala Lys Leu Leu Ala Ala Glu Val Lys Asp Lys
705 710 715 720 705 710 715 720
Lys Thr Gly Glu Ile Leu Arg Lys Arg Cys Ala Val His Trp Val Thr Lys Thr Gly Glu Ile Leu Arg Lys Arg Cys Ala Val His Trp Val Thr
725 730 735 725 730 735
Pro Asp Gly Phe Pro Val Trp Gln Glu Tyr Lys Lys Pro Ile Gln Thr Pro Asp Gly Phe Pro Val Trp Gln Glu Tyr Lys Lys Pro Ile Gln Thr
740 745 750 740 745 750
Arg Leu Asn Leu Met Phe Leu Gly Gln Phe Arg Leu Gln Pro Thr Ile Arg Leu Asn Leu Met Phe Leu Gly Gln Phe Arg Leu Gln Pro Thr Ile
755 760 765 755 760 765
Asn Thr Asn Lys Asp Ser Glu Ile Asp Ala His Lys Gln Glu Ser Gly Asn Thr Asn Lys Asp Ser Glu Ile Asp Ala His Lys Gln Glu Ser Gly
770 775 780 770 775 780
Ile Ala Pro Asn Phe Val His Ser Gln Asp Gly Ser His Leu Arg Lys Ile Ala Pro Asn Phe Val His Ser Gln Asp Gly Ser His Leu Arg Lys
785 790 795 800 785 790 795 800
Thr Val Val Trp Ala His Glu Lys Tyr Gly Ile Glu Ser Phe Ala Leu Thr Val Val Trp Ala His Glu Lys Tyr Gly Ile Glu Ser Phe Ala Leu
805 810 815 805 810 815
Ile His Asp Ser Phe Gly Thr Ile Pro Ala Asp Ala Ala Asn Leu Phe Ile His Asp Ser Phe Gly Thr Ile Pro Ala Asp Ala Ala Asn Leu Phe
820 825 830 820 825 830
Lys Ala Val Arg Glu Thr Met Val Asp Thr Tyr Glu Ser Cys Asp Val Lys Ala Val Arg Glu Thr Met Val Asp Thr Tyr Glu Ser Cys Asp Val
835 840 845 835 840 845
Leu Ala Asp Phe Tyr Asp Gln Phe Ala Asp Gln Leu His Glu Ser Gln Leu Ala Asp Phe Tyr Asp Gln Phe Ala Asp Gln Leu His Glu Ser Gln
850 855 860 850 855 860
Leu Asp Lys Met Pro Ala Leu Pro Ala Lys Gly Asn Leu Asn Leu Arg Leu Asp Lys Met Pro Ala Leu Pro Ala Lys Gly Asn Leu Asn Leu Arg
865 870 875 880 865 870 875 880
Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala
885 890 885 890
<210> 20<210> 20
<211> 2673<211> 2673
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Вариант T7РНКP<223> T7RNAP variant
<400> 20<400> 20
atgcaccatc accatcacca tatgaacacg attaacatcg ctaagaacga cttctctgac 60atgcaccatc accatcacca tatgaacacg attaacatcg ctaagaacga cttctctgac 60
atcgaactgg ctgctatccc gttcaacact ctggctgacc attacggtga gcgtttagct 120atcgaactgg ctgctatccc gttcaacact ctggctgacc attacggtga gcgtttagct 120
cgcgaacagt tggcccttga gcatgagtct tacgagatgg gtgaagcacg cttccgcaag 180cgcgaacagt tggcccttga gcatgagtct tacgagatgg gtgaagcacg cttccgcaag 180
atgtttgagc gtcaacttaa agctggtgag gttgcggata acgctgccgc caagcctctc 240atgtttgagc gtcaacttaa agctggtgag gttgcggata acgctgccgc caagcctctc 240
atcactaccc tactccctaa gatgattgca cgcatcaacg actggtttga ggaagtgaaa 300atcactaccc tactccctaa gatgattgca cgcatcaacg actggtttga ggaagtgaaa 300
gctaagcgcg gcaagcgccc gacagccttc cagttcctgc aagaaatcaa gccggaagcc 360gctaagcgcg gcaagcgccc gacagccttc cagttcctgc aagaaatcaa gccggaagcc 360
gtagcgtaca tcaccattaa gaccactctg gcttgcctaa ccagtgcttg gaatacaacc 420gtagcgtaca tcaccattaa gaccactctg gcttgcctaa ccagtgcttg gaatacaacc 420
gttcaggctg tagcaagcgc aatcggtcgg gccattgagg acgaggctcg cttcggtcgt 480gttcaggctg tagcaagcgc aatcggtcgg gccattgagg acgaggctcg cttcggtcgt 480
atccgtgacc ttgaagctaa gcacttcaag aaaaacgttg aggaacaact caacaagcgc 540atccgtgacc ttgaagctaa gcacttcaag aaaaacgttg aggaacaact caacaagcgc 540
gtagggcacg tctacaagaa agcatttatg caagttgtcg aggctgacat gctctctaag 600gtagggcacg tctacaagaa agcatttatg caagttgtcg aggctgacat gctctctaag 600
ggtctactcg gtggcgaggc gtggtcttcg tggcataagg aagactctat tcatgtagga 660ggtctactcg gtggcgaggc gtggtcttcg tggcataagg aagactctat tcatgtagga 660
gtacgctgca tcgagatgct cattgagtca accggaatgg ttagcttaca ccgccaaaat 720gtacgctgca tcgagatgct cattgagtca accggaatgg ttagcttaca ccgccaaaat 720
gctggcgtag taggtcaaga ctctgagact atcgaactcg cacctgaata cgctgaggct 780gctggcgtag taggtcaaga ctctgagact atcgaactcg cacctgaata cgctgaggct 780
atcgcaaccc gtgcaggtgc gctggctggc atctctccga tgttccaacc ttgcgtagtt 840atcgcaaccc gtgcaggtgc gctggctggc atctctccga tgttccaacc ttgcgtagtt 840
cctcctaagc cgtggactgg cattactggt ggtggctatt gggctaacgg tcgtcgtcct 900cctcctaagc cgtggactgg cattactggt ggtggctatt gggctaacgg tcgtcgtcct 900
ctggcgctgg tgcgtactca cagtaagaaa gcactgatgc gctacgaaga cgtttacatg 960ctggcgctgg tgcgtactca cagtaagaaa gcactgatgc gctacgaaga cgtttacatg 960
cctgaggtgt acaaagcgat taacattgcg caaaacaccg catggaaaat caacaagaaa 10201020
gtcctagcgg tcgccaacgt aatcaccaag tggaagcatt gtccggtcga ggacatccct 1080gtcctagcgg tcgccaacgt aatcaccaag tggaagcatt gtccggtcga ggacatccct 1080
gcgattgagc gtgaagaact cccgatgaaa ccggaagaca tcgacatgaa tcctgaggct 1140gcgattgagc gtgaagaact cccgatgaaa ccggaagaca tcgacatgaa tcctgaggct 1140
ctcaccgcgt ggaaacgtgc tgccgctgct gtgtaccgca aggacaaggc tcgcaagtct 1200ctcaccgcgt ggaaacgtgc tgccgctgct gtgtaccgca aggacaaggc tcgcaagtct 1200
agtcgtatca gccttgagtt catgcttgag caagccaata agtttgctaa ccataaggcc 1260agtcgtatca gccttgagtt catgcttgag caagccaata agtttgctaa ccataaggcc 1260
atctggttcc cttacaacat ggactggcgc ggtcgtgttt acgctgtgtc aatgttcaac 1320atctggttcc cttacaacat ggactggcgc ggtcgtgttt acgctgtgtc aatgttcaac 1320
ccgcaaggta acgatatgac caaaggactg cttacgctgg cgaaaggtaa accaatcggt 1380ccgcaaggta acgatatgac caaaggactg cttacgctgg cgaaaggtaa accaatcggt 1380
aaggaaggtt actactggct gaaaatccac ggtgcaaact gtgcgggtgt cgataaggtt 1440aaggaaggtt actactggct gaaaatccac ggtgcaaact gtgcgggtgt cgataaggtt 1440
ccgttccctg agcgcatcaa gttcattgag gaaaaccacg agaacatcat ggcttgcgct 1500ccgttccctg agcgcatcaa gttcattgag gaaaaccacg agaacatcat ggcttgcgct 1500
aagtctccac tggagaacac ttggtgggct gagcaacggt ctccgttctg cttccttgcg 1560aagtctccac tggagaacac ttggtgggct gagcaacggt ctccgttctg cttccttgcg 1560
ttctgctttg agtacgctgg ggtacagcac cacggcctga gctataactg ctcccttccg 1620ttctgctttg agtacgctgg ggtacagcac cacggcctga gctataactg ctcccttccg 1620
ctggcgtttg acgggtcttg ctctggcatc cagcacttct ccgcgatgct ccgagatgag 1680ctggcgtttg acgggtcttg ctctggcatc cagcacttct ccgcgatgct ccgagatgag 1680
gtaggtggtc gcgcggttaa cttgcttcct agtgaaaccg ttcaggacat ctacgggatt 1740gtaggtggtc gcgcggttaa cttgcttcct agtgaaaccg ttcaggacat ctacgggatt 1740
gttgctaaga aagtcaacga gattctacaa gcagacgcaa tcaatgggac cgataacgaa 1800gttgctaaga aagtcaacga gattctacaa gcagacgcaa tcaatgggac cgataacgaa 1800
gtagttaccg tgaccgatga gaacactggt gaaatctctg agaaagtcaa gctgggcact 1860gtagttaccg tgaccgatga gaacactggt gaaatctctg agaaagtcaa gctgggcact 1860
aaggcactgg ctggtcaatg gctggcttac ggtgttactc gcagtgtgac taagcgttca 1920aaggcactgg ctggtcaatg gctggcttac ggtgttactc gcagtgtgac taagcgttca 1920
gtcatgacgc tggcttacgg gtccaaagag ttcggcttcc gtcaacaagt gctggaagat 1980gtcatgacgc tggcttacgg gtccaaagag ttcggcttcc gtcaacaagt gctggaagat 1980
accattcagt gggctattga ttccggcaag ggtctgatgt tcactcagcc gaatcaggct 2040accattcagt gggctattga ttccggcaag ggtctgatgt tcactcagcc gaatcaggct 2040
gctggataca tggctaagct gatttgggaa tctgtgagcg tgacggtggt agctgcggtt 2100gctggataca tggctaagct gatttgggaa tctgtgagcg tgacggtggt agctgcggtt 2100
gaagcaatga actggcttaa gtctgctgct aagctgctgg ctgctgaggt caaagataag 2160gaagcaatga actggcttaa gtctgctgct aagctgctgg ctgctgaggt caaagataag 2160
aagactggag agattcttcg caagcgttgc gctgtgcatt gggtaactcc tgatggtttc 2220aagactggag agattcttcg caagcgttgc gctgtgcatt gggtaactcc tgatggtttc 2220
cctgtgtggc aggaatacaa gaagcctatt cagacgcgct tgaacctgat gttcctcggt 2280cctgtgtggc aggaatacaa gaagcctatt cagacgcgct tgaacctgat gttcctcggt 2280
cagttccgct tacagcctac cattaacacc aacaaagata gcgagattga tgcacacaaa 2340cagttccgct tacagcctac cattaacacc aacaaagata gcgagattga tgcacacaaa 2340
caggagtctg gtatcgctcc taactttgta cacagccaag acggtagcca ccttcgtaag 2400caggagtctg gtatcgctcc taactttgta cacagccaag acggtagcca ccttcgtaag 2400
actgtagtgt gggcacacga gaagtacgga atcgaatctt ttgcactgat tcacgactcc 2460actgtagtgt gggcacacga gaagtacgga atcgaatctt ttgcactgat tcacgactcc 2460
ttcggtacca ttccggctga cgctgcgaac ctgttcaaag cagtgcgcga aactatggtt 2520ttcggtacca ttccggctga cgctgcgaac ctgttcaaag cagtgcgcga aactatggtt 2520
gacacatatg agtcttgtga tgtactggct gatttctacg accagttcgc tgaccagttg 2580gacacatatg agtcttgtga tgtactggct gatttctacg accagttcgc tgaccagttg 2580
cacgagtctc aattggacaa aatgccagca cttccggcta aaggtaactt gaacctccgt 2640cacgagtctc aattggacaa aatgccagca cttccggcta aaggtaactt gaacctccgt 2640
gacatcttag agtcggactt cgcgttcgcg taa 2673gacatcttag agtcggactt cgcgttcgcg taa 2673
<210> 21<210> 21
<211> 890<211> 890
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Вариант T7РНКP<223> T7RNAP variant
<400> 21<400> 21
Met His His His His His His Met Asn Thr Ile Asn Ile Ala Lys Asn Met His His His His His His Met Asn Thr Ile Asn Ile Ala Lys Asn
1 5 10 15 1 5 10 15
Asp Phe Ser Asp Ile Glu Leu Ala Ala Ile Pro Phe Asn Thr Leu Ala Asp Phe Ser Asp Ile Glu Leu Ala Ala Ile Pro Phe Asn Thr Leu Ala
20 25 30 20 25 30
Asp His Tyr Gly Glu Arg Leu Ala Arg Glu Gln Leu Ala Leu Glu His Asp His Tyr Gly Glu Arg Leu Ala Arg Glu Gln Leu Ala Leu Glu His
35 40 45 35 40 45
Glu Ser Tyr Glu Met Gly Glu Ala Arg Phe Arg Lys Met Phe Glu Arg Glu Ser Tyr Glu Met Gly Glu Ala Arg Phe Arg Lys Met Phe Glu Arg
50 55 60 50 55 60
Gln Leu Lys Ala Gly Glu Val Ala Asp Asn Ala Ala Ala Lys Pro Leu Gln Leu Lys Ala Gly Glu Val Ala Asp Asn Ala Ala Ala Lys Pro Leu
65 70 75 80 65 70 75 80
Ile Thr Thr Leu Leu Pro Lys Met Ile Ala Arg Ile Asn Asp Trp Phe Ile Thr Thr Leu Leu Pro Lys Met Ile Ala Arg Ile Asn Asp Trp Phe
85 90 95 85 90 95
Glu Glu Val Lys Ala Lys Arg Gly Lys Arg Pro Thr Ala Phe Gln Phe Glu Glu Val Lys Ala Lys Arg Gly Lys Arg Pro Thr Ala Phe Gln Phe
100 105 110 100 105 110
Leu Gln Glu Ile Lys Pro Glu Ala Val Ala Tyr Ile Thr Ile Lys Thr Leu Gln Glu Ile Lys Pro Glu Ala Val Ala Tyr Ile Thr Ile Lys Thr
115 120 125 115 120 125
Thr Leu Ala Cys Leu Thr Ser Ala Trp Asn Thr Thr Val Gln Ala Val Thr Leu Ala Cys Leu Thr Ser Ala Trp Asn Thr Thr Val Gln Ala Val
130 135 140 130 135 140
Ala Ser Ala Ile Gly Arg Ala Ile Glu Asp Glu Ala Arg Phe Gly Arg Ala Ser Ala Ile Gly Arg Ala Ile Glu Asp Glu Ala Arg Phe Gly Arg
145 150 155 160 145 150 155 160
Ile Arg Asp Leu Glu Ala Lys His Phe Lys Lys Asn Val Glu Glu Gln Ile Arg Asp Leu Glu Ala Lys His Phe Lys Lys Asn Val Glu Glu Gln
165 170 175 165 170 175
Leu Asn Lys Arg Val Gly His Val Tyr Lys Lys Ala Phe Met Gln Val Leu Asn Lys Arg Val Gly His Val Tyr Lys Lys Ala Phe Met Gln Val
180 185 190 180 185 190
Val Glu Ala Asp Met Leu Ser Lys Gly Leu Leu Gly Gly Glu Ala Trp Val Glu Ala Asp Met Leu Ser Lys Gly Leu Leu Gly Gly Glu Ala Trp
195 200 205 195 200 205
Ser Ser Trp His Lys Glu Asp Ser Ile His Val Gly Val Arg Cys Ile Ser Ser Trp His Lys Glu Asp Ser Ile His Val Gly Val Arg Cys Ile
210 215 220 210 215 220
Glu Met Leu Ile Glu Ser Thr Gly Met Val Ser Leu His Arg Gln Asn Glu Met Leu Ile Glu Ser Thr Gly Met Val Ser Leu His Arg Gln Asn
225 230 235 240 225 230 235 240
Ala Gly Val Val Gly Gln Asp Ser Glu Thr Ile Glu Leu Ala Pro Glu Ala Gly Val Val Gly Gln Asp Ser Glu Thr Ile Glu Leu Ala Pro Glu
245 250 255 245 250 255
Tyr Ala Glu Ala Ile Ala Thr Arg Ala Gly Ala Leu Ala Gly Ile Ser Tyr Ala Glu Ala Ile Ala Thr Arg Ala Gly Ala Leu Ala Gly Ile Ser
260 265 270 260 265 270
Pro Met Phe Gln Pro Cys Val Val Pro Pro Lys Pro Trp Thr Gly Ile Pro Met Phe Gln Pro Cys Val Val Pro Pro Lys Pro Trp Thr Gly Ile
275 280 285 275 280 285
Thr Gly Gly Gly Tyr Trp Ala Asn Gly Arg Arg Pro Leu Ala Leu Val Thr Gly Gly Gly Tyr Trp Ala Asn Gly Arg Arg Pro Leu Ala Leu Val
290 295 300 290 295 300
Arg Thr His Ser Lys Lys Ala Leu Met Arg Tyr Glu Asp Val Tyr Met Arg Thr His Ser Lys Lys Ala Leu Met Arg Tyr Glu Asp Val Tyr Met
305 310 315 320 305 310 315 320
Pro Glu Val Tyr Lys Ala Ile Asn Ile Ala Gln Asn Thr Ala Trp Lys Pro Glu Val Tyr Lys Ala Ile Asn Ile Ala Gln Asn Thr Ala Trp Lys
325 330 335 325 330 335
Ile Asn Lys Lys Val Leu Ala Val Ala Asn Val Ile Thr Lys Trp Lys Ile Asn Lys Lys Val Leu Ala Val Ala Asn Val Ile Thr Lys Trp Lys
340 345 350 340 345 350
His Cys Pro Val Glu Asp Ile Pro Ala Ile Glu Arg Glu Glu Leu Pro His Cys Pro Val Glu Asp Ile Pro Ala Ile Glu Arg Glu Glu Leu Pro
355 360 365 355 360 365
Met Lys Pro Glu Asp Ile Asp Met Asn Pro Glu Ala Leu Thr Ala Trp Met Lys Pro Glu Asp Ile Asp Met Asn Pro Glu Ala Leu Thr Ala Trp
370 375 380 370 375 380
Lys Arg Ala Ala Ala Ala Val Tyr Arg Lys Asp Lys Ala Arg Lys Ser Lys Arg Ala Ala Ala Ala Val Tyr Arg Lys Asp Lys Ala Arg Lys Ser
385 390 395 400 385 390 395 400
Ser Arg Ile Ser Leu Glu Phe Met Leu Glu Gln Ala Asn Lys Phe Ala Ser Arg Ile Ser Leu Glu Phe Met Leu Glu Gln Ala Asn Lys Phe Ala
405 410 415 405 410 415
Asn His Lys Ala Ile Trp Phe Pro Tyr Asn Met Asp Trp Arg Gly Arg Asn His Lys Ala Ile Trp Phe Pro Tyr Asn Met Asp Trp Arg Gly Arg
420 425 430 420 425 430
Val Tyr Ala Val Ser Met Phe Asn Pro Gln Gly Asn Asp Met Thr Lys Val Tyr Ala Val Ser Met Phe Asn Pro Gln Gly Asn Asp Met Thr Lys
435 440 445 435 440 445
Gly Leu Leu Thr Leu Ala Lys Gly Lys Pro Ile Gly Lys Glu Gly Tyr Gly Leu Leu Thr Leu Ala Lys Gly Lys Pro Ile Gly Lys Glu Gly Tyr
450 455 460 450 455 460
Tyr Trp Leu Lys Ile His Gly Ala Asn Cys Ala Gly Val Asp Lys Val Tyr Trp Leu Lys Ile His Gly Ala Asn Cys Ala Gly Val Asp Lys Val
465 470 475 480 465 470 475 480
Pro Phe Pro Glu Arg Ile Lys Phe Ile Glu Glu Asn His Glu Asn Ile Pro Phe Pro Glu Arg Ile Lys Phe Ile Glu Glu Asn His Glu Asn Ile
485 490 495 485 490 495
Met Ala Cys Ala Lys Ser Pro Leu Glu Asn Thr Trp Trp Ala Glu Gln Met Ala Cys Ala Lys Ser Pro Leu Glu Asn Thr Trp Trp Ala Glu Gln
500 505 510 500 505 510
Arg Ser Pro Phe Cys Phe Leu Ala Phe Cys Phe Glu Tyr Ala Gly Val Arg Ser Pro Phe Cys Phe Leu Ala Phe Cys Phe Glu Tyr Ala Gly Val
515 520 525 515 520 525
Gln His His Gly Leu Ser Tyr Asn Cys Ser Leu Pro Leu Ala Phe Asp Gln His His Gly Leu Ser Tyr Asn Cys Ser Leu Pro Leu Ala Phe Asp
530 535 540 530 535 540
Gly Ser Cys Ser Gly Ile Gln His Phe Ser Ala Met Leu Arg Asp Glu Gly Ser Cys Ser Gly Ile Gln His Phe Ser Ala Met Leu Arg Asp Glu
545 550 555 560 545 550 555 560
Val Gly Gly Arg Ala Val Asn Leu Leu Pro Ser Glu Thr Val Gln Asp Val Gly Gly Arg Ala Val Asn Leu Leu Pro Ser Glu Thr Val Gln Asp
565 570 575 565 570 575
Ile Tyr Gly Ile Val Ala Lys Lys Val Asn Glu Ile Leu Gln Ala Asp Ile Tyr Gly Ile Val Ala Lys Lys Val Asn Glu Ile Leu Gln Ala Asp
580 585 590 580 585 590
Ala Ile Asn Gly Thr Asp Asn Glu Val Val Thr Val Thr Asp Glu Asn Ala Ile Asn Gly Thr Asp Asn Glu Val Val Thr Val Thr Asp Glu Asn
595 600 605 595 600 605
Thr Gly Glu Ile Ser Glu Lys Val Lys Leu Gly Thr Lys Ala Leu Ala Thr Gly Glu Ile Ser Glu Lys Val Lys Leu Gly Thr Lys Ala Leu Ala
610 615 620 610 615 620
Gly Gln Trp Leu Ala Tyr Gly Val Thr Arg Ser Val Thr Lys Arg Ser Gly Gln Trp Leu Ala Tyr Gly Val Thr Arg Ser Val Thr Lys Arg Ser
625 630 635 640 625 630 635 640
Val Met Thr Leu Ala Tyr Gly Ser Lys Glu Phe Gly Phe Arg Gln Gln Val Met Thr Leu Ala Tyr Gly Ser Lys Glu Phe Gly Phe Arg Gln Gln
645 650 655 645 650 655
Val Leu Glu Asp Thr Ile Gln Trp Ala Ile Asp Ser Gly Lys Gly Leu Val Leu Glu Asp Thr Ile Gln Trp Ala Ile Asp Ser Gly Lys Gly Leu
660 665 670 660 665 670
Met Phe Thr Gln Pro Asn Gln Ala Ala Gly Tyr Met Ala Lys Leu Ile Met Phe Thr Gln Pro Asn Gln Ala Ala Gly Tyr Met Ala Lys Leu Ile
675 680 685 675 680 685
Trp Glu Ser Val Ser Val Thr Val Val Ala Ala Val Glu Ala Met Asn Trp Glu Ser Val Ser Val Thr Val Val Ala Ala Val Glu Ala Met Asn
690 695 700 690 695 700
Trp Leu Lys Ser Ala Ala Lys Leu Leu Ala Ala Glu Val Lys Asp Lys Trp Leu Lys Ser Ala Ala Lys Leu Leu Ala Ala Glu Val Lys Asp Lys
705 710 715 720 705 710 715 720
Lys Thr Gly Glu Ile Leu Arg Lys Arg Cys Ala Val His Trp Val Thr Lys Thr Gly Glu Ile Leu Arg Lys Arg Cys Ala Val His Trp Val Thr
725 730 735 725 730 735
Pro Asp Gly Phe Pro Val Trp Gln Glu Tyr Lys Lys Pro Ile Gln Thr Pro Asp Gly Phe Pro Val Trp Gln Glu Tyr Lys Lys Pro Ile Gln Thr
740 745 750 740 745 750
Arg Leu Asn Leu Met Phe Leu Gly Gln Phe Arg Leu Gln Pro Thr Ile Arg Leu Asn Leu Met Phe Leu Gly Gln Phe Arg Leu Gln Pro Thr Ile
755 760 765 755 760 765
Asn Thr Asn Lys Asp Ser Glu Ile Asp Ala His Lys Gln Glu Ser Gly Asn Thr Asn Lys Asp Ser Glu Ile Asp Ala His Lys Gln Glu Ser Gly
770 775 780 770 775 780
Ile Ala Pro Asn Phe Val His Ser Gln Asp Gly Ser His Leu Arg Lys Ile Ala Pro Asn Phe Val His Ser Gln Asp Gly Ser His Leu Arg Lys
785 790 795 800 785 790 795 800
Thr Val Val Trp Ala His Glu Lys Tyr Gly Ile Glu Ser Phe Ala Leu Thr Val Val Trp Ala His Glu Lys Tyr Gly Ile Glu Ser Phe Ala Leu
805 810 815 805 810 815
Ile His Asp Ser Phe Gly Thr Ile Pro Ala Asp Ala Ala Asn Leu Phe Ile His Asp Ser Phe Gly Thr Ile Pro Ala Asp Ala Ala Asn Leu Phe
820 825 830 820 825 830
Lys Ala Val Arg Glu Thr Met Val Asp Thr Tyr Glu Ser Cys Asp Val Lys Ala Val Arg Glu Thr Met Val Asp Thr Tyr Glu Ser Cys Asp Val
835 840 845 835 840 845
Leu Ala Asp Phe Tyr Asp Gln Phe Ala Asp Gln Leu His Glu Ser Gln Leu Ala Asp Phe Tyr Asp Gln Phe Ala Asp Gln Leu His Glu Ser Gln
850 855 860 850 855 860
Leu Asp Lys Met Pro Ala Leu Pro Ala Lys Gly Asn Leu Asn Leu Arg Leu Asp Lys Met Pro Ala Leu Pro Ala Lys Gly Asn Leu Asn Leu Arg
865 870 875 880 865 870 875 880
Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala
885 890 885 890
<210> 22<210> 22
<211> 2673<211> 2673
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Вариант T7РНКP<223> T7RNAP variant
<400> 22<400> 22
atgcaccatc accatcacca tatgaacacg attaacatcg ctaagaacga cttctctgac 60atgcaccatc accatcacca tatgaacacg attaacatcg ctaagaacga cttctctgac 60
atcgaactgg ctgctatccc gttcaacact ctggctgacc attacggtga gcgtttagct 120atcgaactgg ctgctatccc gttcaacact ctggctgacc attacggtga gcgtttagct 120
cgcgaacagt tggcccttga gcatgagtct tacgagatgg gtgaagcacg cttccgcaag 180cgcgaacagt tggcccttga gcatgagtct tacgagatgg gtgaagcacg cttccgcaag 180
atgtttgagc gtcaacttaa agctggtgag gttgcggata acgctgccgc caagcctctc 240atgtttgagc gtcaacttaa agctggtgag gttgcggata acgctgccgc caagcctctc 240
atcactaccc tactccctaa gatgattgca cgcatcaacg actggtttga ggaagtgaaa 300atcactaccc tactccctaa gatgattgca cgcatcaacg actggtttga ggaagtgaaa 300
gctaagcgcg gcaagcgccc gacagccttc cagttcctgc aagaaatcaa gccggaagcc 360gctaagcgcg gcaagcgccc gacagccttc cagttcctgc aagaaatcaa gccggaagcc 360
gtagcgtaca tcaccattaa gaccactctg gcttgcctaa ccagtgcttg gaatacaacc 420gtagcgtaca tcaccattaa gaccactctg gcttgcctaa ccagtgcttg gaatacaacc 420
gttcaggctg tagcaagcgc aatcggtcgg gccattgagg acgaggctcg cttcggtcgt 480gttcaggctg tagcaagcgc aatcggtcgg gccattgagg acgaggctcg cttcggtcgt 480
atccgtgacc ttgaagctaa gcacttcaag aaaaacgttg aggaacaact caacaagcgc 540atccgtgacc ttgaagctaa gcacttcaag aaaaacgttg aggaacaact caacaagcgc 540
gtagggcacg tctacaagaa agcatttatg caagttgtcg aggctgacat gctctctaag 600gtagggcacg tctacaagaa agcatttatg caagttgtcg aggctgacat gctctctaag 600
ggtctactcg gtggcgaggc gtggtcttcg tggcataagg aagactctat tcatgtagga 660ggtctactcg gtggcgaggc gtggtcttcg tggcataagg aagactctat tcatgtagga 660
gtacgctgca tcgagatgct cattgagtca accggaatgg ttagcttaca ccgccaaaat 720gtacgctgca tcgagatgct cattgagtca accggaatgg ttagcttaca ccgccaaaat 720
gctggcgtag taggtcaaga ctctgagact atcgaactcg cacctgaata cgctgaggct 780gctggcgtag taggtcaaga ctctgagact atcgaactcg cacctgaata cgctgaggct 780
atcgcaaccc gtgcaggtgc gctggctggc atctctccga tgttccaacc ttgcgtagtt 840atcgcaaccc gtgcaggtgc gctggctggc atctctccga tgttccaacc ttgcgtagtt 840
cctcctaagc cgtggactgg cattactggt ggtggctatt gggctaacgg tcgtcgtcct 900cctcctaagc cgtggactgg cattactggt ggtggctatt gggctaacgg tcgtcgtcct 900
ctggcgctgg tgcgtactca cagtaagaaa gcactgatgc gctacgaaga cgtttacatg 960ctggcgctgg tgcgtactca cagtaagaaa gcactgatgc gctacgaaga cgtttacatg 960
cctgaggtgt acaaagcgat taacattgcg caaaacaccg catggaaaat caacaagaaa 10201020
gtcctagcgg tcgccaacgt aatcaccaag tggaagcatt gtccggtcga ggacatccct 1080gtcctagcgg tcgccaacgt aatcaccaag tggaagcatt gtccggtcga ggacatccct 1080
gcgattgagc gtgaagaact cccgatgaaa ccggaagaca tcgacatgaa tcctgaggct 1140gcgattgagc gtgaagaact cccgatgaaa ccggaagaca tcgacatgaa tcctgaggct 1140
ctcaccgcgt ggaaacgtgc tgccgctgct gtgtaccgca aggacaaggc tcgcaagtct 1200ctcaccgcgt ggaaacgtgc tgccgctgct gtgtaccgca aggacaaggc tcgcaagtct 1200
agacgtatca gccttgagtt catgcttgag caagccaata agtttgctaa ccataaggcc 1260agacgtatca gccttgagtt catgcttgag caagccaata agtttgctaa ccataaggcc 1260
atctggttcc cttacaacat ggactggcgc ggtcgtgttt acgctgtgtc aatgttcaac 1320atctggttcc cttacaacat ggactggcgc ggtcgtgttt acgctgtgtc aatgttcaac 1320
ccgcaaggta acgatatgac caaaggactg cttacgctgg cgaaaggtaa accaatcggt 1380ccgcaaggta acgatatgac caaaggactg cttacgctgg cgaaaggtaa accaatcggt 1380
aaggaaggtt actactggct gaaaatccac ggtgcaaact gtgcgggtgt cgataaggtt 1440aaggaaggtt actactggct gaaaatccac ggtgcaaact gtgcgggtgt cgataaggtt 1440
ccgttccctg agcgcatcaa gttcattgag gaaaaccacg agaacatcat ggcttgcgct 1500ccgttccctg agcgcatcaa gttcattgag gaaaaccacg agaacatcat ggcttgcgct 1500
aagtctccac tggagaacac ttggtgggct gagcaatggt ctccgttctg cttccttgcg 1560aagtctccac tggagaacac ttggtgggct gagcaatggt ctccgttctg cttccttgcg 1560
ttctgctttg agtacgctgg ggtacagcac cacggcctga gctataactg ctcccttccg 1620ttctgctttg agtacgctgg ggtacagcac cacggcctga gctataactg ctcccttccg 1620
ctggcgtttg acgggtcttg ctctggcatc cagcacttct ccgcgatgct ccgagatgag 1680ctggcgtttg acgggtcttg ctctggcatc cagcacttct ccgcgatgct ccgagatgag 1680
gtaggtggtc gcgcggttaa cttgcttcct agtgaaaccg ttcaggacat ctacgggatt 1740gtaggtggtc gcgcggttaa cttgcttcct agtgaaaccg ttcaggacat ctacgggatt 1740
gttgctaaga aagtcaacga gattctacaa gcagacgcaa tcaatgggac cgataacgaa 1800gttgctaaga aagtcaacga gattctacaa gcagacgcaa tcaatgggac cgataacgaa 1800
gtagttaccg tgaccgatga gaacactggt gaaatctctg agaaagtcaa gctgggcact 1860gtagttaccg tgaccgatga gaacactggt gaaatctctg agaaagtcaa gctgggcact 1860
aaggcactgg ctggtcaatg gctggcttac ggtgttactc gcagtgtgac taagcgttca 1920aaggcactgg ctggtcaatg gctggcttac ggtgttactc gcagtgtgac taagcgttca 1920
gtcatgacgc tggcttacgg gtccaaagag ttcggcttcc gtcaacaagt gctggaagat 1980gtcatgacgc tggcttacgg gtccaaagag ttcggcttcc gtcaacaagt gctggaagat 1980
accattcagt gggctattga ttccggcaag ggtctgatgt tcactcagcc gaatcaggct 2040accattcagt gggctattga ttccggcaag ggtctgatgt tcactcagcc gaatcaggct 2040
gctggataca tggctaagct gatttgggaa tctgtgagcg tgacggtggt agctgcggtt 2100gctggataca tggctaagct gatttgggaa tctgtgagcg tgacggtggt agctgcggtt 2100
gaagcaatga actggcttaa gtctgctgct aagctgctgg ctgctgaggt caaagataag 2160gaagcaatga actggcttaa gtctgctgct aagctgctgg ctgctgaggt caaagataag 2160
aagactggag agattcttcg caagcgttgc gctgtgcatt gggtaactcc tgatggtttc 2220aagactggag agattcttcg caagcgttgc gctgtgcatt gggtaactcc tgatggtttc 2220
cctgtgtggc aggaatacaa gaagcctatt cagacgcgct tgaacctgat gttcctcggt 2280cctgtgtggc aggaatacaa gaagcctatt cagacgcgct tgaacctgat gttcctcggt 2280
cagttccgct tacagcctac cattaacacc aacaaagata gcgagattga tgcacacaaa 2340cagttccgct tacagcctac cattaacacc aacaaagata gcgagattga tgcacacaaa 2340
caggagtctg gtatcgctcc taactttgta cacagccaag acggtagcca ccttcgtaag 2400caggagtctg gtatcgctcc taactttgta cacagccaag acggtagcca ccttcgtaag 2400
actgtagtgt gggcacacga gaagtacgga atcgaatctt ttgcactgat tcacgactcc 2460actgtagtgt gggcacacga gaagtacgga atcgaatctt ttgcactgat tcacgactcc 2460
ttcggtacca ttccggctga cgctgcgaac ctgttcaaag cagtgcgcga aactatggtt 2520ttcggtacca ttccggctga cgctgcgaac ctgttcaaag cagtgcgcga aactatggtt 2520
gacacatatg agtcttgtga tgtactggct gatttctacg accagttcgc tgaccagttg 2580gacacatatg agtcttgtga tgtactggct gatttctacg accagttcgc tgaccagttg 2580
cacgagtctc aattggacaa aatgccagca cttccggcta aaggtaactt gaacctccgt 2640cacgagtctc aattggacaa aatgccagca cttccggcta aaggtaactt gaacctccgt 2640
gacatcttag agtcggactt cgcgttcgcg taa 2673gacatcttag agtcggactt cgcgttcgcg taa 2673
<210> 23<210> 23
<211> 890<211> 890
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Вариант T7РНКP<223> T7RNAP variant
<400> 23<400> 23
Met His His His His His His Met Asn Thr Ile Asn Ile Ala Lys Asn Met His His His His His His Met Asn Thr Ile Asn Ile Ala Lys Asn
1 5 10 15 1 5 10 15
Asp Phe Ser Asp Ile Glu Leu Ala Ala Ile Pro Phe Asn Thr Leu Ala Asp Phe Ser Asp Ile Glu Leu Ala Ala Ile Pro Phe Asn Thr Leu Ala
20 25 30 20 25 30
Asp His Tyr Gly Glu Arg Leu Ala Arg Glu Gln Leu Ala Leu Glu His Asp His Tyr Gly Glu Arg Leu Ala Arg Glu Gln Leu Ala Leu Glu His
35 40 45 35 40 45
Glu Ser Tyr Glu Met Gly Glu Ala Arg Phe Arg Lys Met Phe Glu Arg Glu Ser Tyr Glu Met Gly Glu Ala Arg Phe Arg Lys Met Phe Glu Arg
50 55 60 50 55 60
Gln Leu Lys Ala Gly Glu Val Ala Asp Asn Ala Ala Ala Lys Pro Leu Gln Leu Lys Ala Gly Glu Val Ala Asp Asn Ala Ala Ala Lys Pro Leu
65 70 75 80 65 70 75 80
Ile Thr Thr Leu Leu Pro Lys Met Ile Ala Arg Ile Asn Asp Trp Phe Ile Thr Thr Leu Leu Pro Lys Met Ile Ala Arg Ile Asn Asp Trp Phe
85 90 95 85 90 95
Glu Glu Val Lys Ala Lys Arg Gly Lys Arg Pro Thr Ala Phe Gln Phe Glu Glu Val Lys Ala Lys Arg Gly Lys Arg Pro Thr Ala Phe Gln Phe
100 105 110 100 105 110
Leu Gln Glu Ile Lys Pro Glu Ala Val Ala Tyr Ile Thr Ile Lys Thr Leu Gln Glu Ile Lys Pro Glu Ala Val Ala Tyr Ile Thr Ile Lys Thr
115 120 125 115 120 125
Thr Leu Ala Cys Leu Thr Ser Ala Trp Asn Thr Thr Val Gln Ala Val Thr Leu Ala Cys Leu Thr Ser Ala Trp Asn Thr Thr Val Gln Ala Val
130 135 140 130 135 140
Ala Ser Ala Ile Gly Arg Ala Ile Glu Asp Glu Ala Arg Phe Gly Arg Ala Ser Ala Ile Gly Arg Ala Ile Glu Asp Glu Ala Arg Phe Gly Arg
145 150 155 160 145 150 155 160
Ile Arg Asp Leu Glu Ala Lys His Phe Lys Lys Asn Val Glu Glu Gln Ile Arg Asp Leu Glu Ala Lys His Phe Lys Lys Asn Val Glu Glu Gln
165 170 175 165 170 175
Leu Asn Lys Arg Val Gly His Val Tyr Lys Lys Ala Phe Met Gln Val Leu Asn Lys Arg Val Gly His Val Tyr Lys Lys Ala Phe Met Gln Val
180 185 190 180 185 190
Val Glu Ala Asp Met Leu Ser Lys Gly Leu Leu Gly Gly Glu Ala Trp Val Glu Ala Asp Met Leu Ser Lys Gly Leu Leu Gly Gly Glu Ala Trp
195 200 205 195 200 205
Ser Ser Trp His Lys Glu Asp Ser Ile His Val Gly Val Arg Cys Ile Ser Ser Trp His Lys Glu Asp Ser Ile His Val Gly Val Arg Cys Ile
210 215 220 210 215 220
Glu Met Leu Ile Glu Ser Thr Gly Met Val Ser Leu His Arg Gln Asn Glu Met Leu Ile Glu Ser Thr Gly Met Val Ser Leu His Arg Gln Asn
225 230 235 240 225 230 235 240
Ala Gly Val Val Gly Gln Asp Ser Glu Thr Ile Glu Leu Ala Pro Glu Ala Gly Val Val Gly Gln Asp Ser Glu Thr Ile Glu Leu Ala Pro Glu
245 250 255 245 250 255
Tyr Ala Glu Ala Ile Ala Thr Arg Ala Gly Ala Leu Ala Gly Ile Ser Tyr Ala Glu Ala Ile Ala Thr Arg Ala Gly Ala Leu Ala Gly Ile Ser
260 265 270 260 265 270
Pro Met Phe Gln Pro Cys Val Val Pro Pro Lys Pro Trp Thr Gly Ile Pro Met Phe Gln Pro Cys Val Val Pro Pro Lys Pro Trp Thr Gly Ile
275 280 285 275 280 285
Thr Gly Gly Gly Tyr Trp Ala Asn Gly Arg Arg Pro Leu Ala Leu Val Thr Gly Gly Gly Tyr Trp Ala Asn Gly Arg Arg Pro Leu Ala Leu Val
290 295 300 290 295 300
Arg Thr His Ser Lys Lys Ala Leu Met Arg Tyr Glu Asp Val Tyr Met Arg Thr His Ser Lys Lys Ala Leu Met Arg Tyr Glu Asp Val Tyr Met
305 310 315 320 305 310 315 320
Pro Glu Val Tyr Lys Ala Ile Asn Ile Ala Gln Asn Thr Ala Trp Lys Pro Glu Val Tyr Lys Ala Ile Asn Ile Ala Gln Asn Thr Ala Trp Lys
325 330 335 325 330 335
Ile Asn Lys Lys Val Leu Ala Val Ala Asn Val Ile Thr Lys Trp Lys Ile Asn Lys Lys Val Leu Ala Val Ala Asn Val Ile Thr Lys Trp Lys
340 345 350 340 345 350
His Cys Pro Val Glu Asp Ile Pro Ala Ile Glu Arg Glu Glu Leu Pro His Cys Pro Val Glu Asp Ile Pro Ala Ile Glu Arg Glu Glu Leu Pro
355 360 365 355 360 365
Met Lys Pro Glu Asp Ile Asp Met Asn Pro Glu Ala Leu Thr Ala Trp Met Lys Pro Glu Asp Ile Asp Met Asn Pro Glu Ala Leu Thr Ala Trp
370 375 380 370 375 380
Lys Arg Ala Ala Ala Ala Val Tyr Arg Lys Asp Lys Ala Arg Lys Ser Lys Arg Ala Ala Ala Ala Val Tyr Arg Lys Asp Lys Ala Arg Lys Ser
385 390 395 400 385 390 395 400
Arg Arg Ile Ser Leu Glu Phe Met Leu Glu Gln Ala Asn Lys Phe Ala Arg Arg Ile Ser Leu Glu Phe Met Leu Glu Gln Ala Asn Lys Phe Ala
405 410 415 405 410 415
Asn His Lys Ala Ile Trp Phe Pro Tyr Asn Met Asp Trp Arg Gly Arg Asn His Lys Ala Ile Trp Phe Pro Tyr Asn Met Asp Trp Arg Gly Arg
420 425 430 420 425 430
Val Tyr Ala Val Ser Met Phe Asn Pro Gln Gly Asn Asp Met Thr Lys Val Tyr Ala Val Ser Met Phe Asn Pro Gln Gly Asn Asp Met Thr Lys
435 440 445 435 440 445
Gly Leu Leu Thr Leu Ala Lys Gly Lys Pro Ile Gly Lys Glu Gly Tyr Gly Leu Leu Thr Leu Ala Lys Gly Lys Pro Ile Gly Lys Glu Gly Tyr
450 455 460 450 455 460
Tyr Trp Leu Lys Ile His Gly Ala Asn Cys Ala Gly Val Asp Lys Val Tyr Trp Leu Lys Ile His Gly Ala Asn Cys Ala Gly Val Asp Lys Val
465 470 475 480 465 470 475 480
Pro Phe Pro Glu Arg Ile Lys Phe Ile Glu Glu Asn His Glu Asn Ile Pro Phe Pro Glu Arg Ile Lys Phe Ile Glu Glu Asn His Glu Asn Ile
485 490 495 485 490 495
Met Ala Cys Ala Lys Ser Pro Leu Glu Asn Thr Trp Trp Ala Glu Gln Met Ala Cys Ala Lys Ser Pro Leu Glu Asn Thr Trp Trp Ala Glu Gln
500 505 510 500 505 510
Trp Ser Pro Phe Cys Phe Leu Ala Phe Cys Phe Glu Tyr Ala Gly Val Trp Ser Pro Phe Cys Phe Leu Ala Phe Cys Phe Glu Tyr Ala Gly Val
515 520 525 515 520 525
Gln His His Gly Leu Ser Tyr Asn Cys Ser Leu Pro Leu Ala Phe Asp Gln His His Gly Leu Ser Tyr Asn Cys Ser Leu Pro Leu Ala Phe Asp
530 535 540 530 535 540
Gly Ser Cys Ser Gly Ile Gln His Phe Ser Ala Met Leu Arg Asp Glu Gly Ser Cys Ser Gly Ile Gln His Phe Ser Ala Met Leu Arg Asp Glu
545 550 555 560 545 550 555 560
Val Gly Gly Arg Ala Val Asn Leu Leu Pro Ser Glu Thr Val Gln Asp Val Gly Gly Arg Ala Val Asn Leu Leu Pro Ser Glu Thr Val Gln Asp
565 570 575 565 570 575
Ile Tyr Gly Ile Val Ala Lys Lys Val Asn Glu Ile Leu Gln Ala Asp Ile Tyr Gly Ile Val Ala Lys Lys Val Asn Glu Ile Leu Gln Ala Asp
580 585 590 580 585 590
Ala Ile Asn Gly Thr Asp Asn Glu Val Val Thr Val Thr Asp Glu Asn Ala Ile Asn Gly Thr Asp Asn Glu Val Val Thr Val Thr Asp Glu Asn
595 600 605 595 600 605
Thr Gly Glu Ile Ser Glu Lys Val Lys Leu Gly Thr Lys Ala Leu Ala Thr Gly Glu Ile Ser Glu Lys Val Lys Leu Gly Thr Lys Ala Leu Ala
610 615 620 610 615 620
Gly Gln Trp Leu Ala Tyr Gly Val Thr Arg Ser Val Thr Lys Arg Ser Gly Gln Trp Leu Ala Tyr Gly Val Thr Arg Ser Val Thr Lys Arg Ser
625 630 635 640 625 630 635 640
Val Met Thr Leu Ala Tyr Gly Ser Lys Glu Phe Gly Phe Arg Gln Gln Val Met Thr Leu Ala Tyr Gly Ser Lys Glu Phe Gly Phe Arg Gln Gln
645 650 655 645 650 655
Val Leu Glu Asp Thr Ile Gln Trp Ala Ile Asp Ser Gly Lys Gly Leu Val Leu Glu Asp Thr Ile Gln Trp Ala Ile Asp Ser Gly Lys Gly Leu
660 665 670 660 665 670
Met Phe Thr Gln Pro Asn Gln Ala Ala Gly Tyr Met Ala Lys Leu Ile Met Phe Thr Gln Pro Asn Gln Ala Ala Gly Tyr Met Ala Lys Leu Ile
675 680 685 675 680 685
Trp Glu Ser Val Ser Val Thr Val Val Ala Ala Val Glu Ala Met Asn Trp Glu Ser Val Ser Val Thr Val Val Ala Ala Val Glu Ala Met Asn
690 695 700 690 695 700
Trp Leu Lys Ser Ala Ala Lys Leu Leu Ala Ala Glu Val Lys Asp Lys Trp Leu Lys Ser Ala Ala Lys Leu Leu Ala Ala Glu Val Lys Asp Lys
705 710 715 720 705 710 715 720
Lys Thr Gly Glu Ile Leu Arg Lys Arg Cys Ala Val His Trp Val Thr Lys Thr Gly Glu Ile Leu Arg Lys Arg Cys Ala Val His Trp Val Thr
725 730 735 725 730 735
Pro Asp Gly Phe Pro Val Trp Gln Glu Tyr Lys Lys Pro Ile Gln Thr Pro Asp Gly Phe Pro Val Trp Gln Glu Tyr Lys Lys Pro Ile Gln Thr
740 745 750 740 745 750
Arg Leu Asn Leu Met Phe Leu Gly Gln Phe Arg Leu Gln Pro Thr Ile Arg Leu Asn Leu Met Phe Leu Gly Gln Phe Arg Leu Gln Pro Thr Ile
755 760 765 755 760 765
Asn Thr Asn Lys Asp Ser Glu Ile Asp Ala His Lys Gln Glu Ser Gly Asn Thr Asn Lys Asp Ser Glu Ile Asp Ala His Lys Gln Glu Ser Gly
770 775 780 770 775 780
Ile Ala Pro Asn Phe Val His Ser Gln Asp Gly Ser His Leu Arg Lys Ile Ala Pro Asn Phe Val His Ser Gln Asp Gly Ser His Leu Arg Lys
785 790 795 800 785 790 795 800
Thr Val Val Trp Ala His Glu Lys Tyr Gly Ile Glu Ser Phe Ala Leu Thr Val Val Trp Ala His Glu Lys Tyr Gly Ile Glu Ser Phe Ala Leu
805 810 815 805 810 815
Ile His Asp Ser Phe Gly Thr Ile Pro Ala Asp Ala Ala Asn Leu Phe Ile His Asp Ser Phe Gly Thr Ile Pro Ala Asp Ala Ala Asn Leu Phe
820 825 830 820 825 830
Lys Ala Val Arg Glu Thr Met Val Asp Thr Tyr Glu Ser Cys Asp Val Lys Ala Val Arg Glu Thr Met Val Asp Thr Tyr Glu Ser Cys Asp Val
835 840 845 835 840 845
Leu Ala Asp Phe Tyr Asp Gln Phe Ala Asp Gln Leu His Glu Ser Gln Leu Ala Asp Phe Tyr Asp Gln Phe Ala Asp Gln Leu His Glu Ser Gln
850 855 860 850 855 860
Leu Asp Lys Met Pro Ala Leu Pro Ala Lys Gly Asn Leu Asn Leu Arg Leu Asp Lys Met Pro Ala Leu Pro Ala Lys Gly Asn Leu Asn Leu Arg
865 870 875 880 865 870 875 880
Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala
885 890 885 890
<210> 24<210> 24
<211> 2673<211> 2673
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Вариант T7РНКP<223> T7RNAP variant
<400> 24<400> 24
atgcaccatc accatcacca tatgaacacg attaacatcg ctaagaacga cttctctgac 60atgcaccatc accatcacca tatgaacacg attaacatcg ctaagaacga cttctctgac 60
atcgaactgg ctgctatccc gttcaacact ctggctgacc attacggtga gcgtttagct 120atcgaactgg ctgctatccc gttcaacact ctggctgacc attacggtga gcgtttagct 120
cgcgaacagt tggcccttga gcatgagtct tacgagatgg gtgaagcacg cttccgcaag 180cgcgaacagt tggcccttga gcatgagtct tacgagatgg gtgaagcacg cttccgcaag 180
atgtttgagc gtcaacttaa agctggtgag gttgcggata acgctgccgc caagcctctc 240atgtttgagc gtcaacttaa agctggtgag gttgcggata acgctgccgc caagcctctc 240
atcactaccc tactccctaa gatgattgca cgcatcaacg actggtttga ggaagtgaaa 300atcactaccc tactccctaa gatgattgca cgcatcaacg actggtttga ggaagtgaaa 300
gctaagcgcg gcaagcgccc gacagccttc cagttcctgc aagaaatcaa gccggaagcc 360gctaagcgcg gcaagcgccc gacagccttc cagttcctgc aagaaatcaa gccggaagcc 360
gtagcgtaca tcaccattaa gaccactctg gcttgcctaa ccagtgcttg gaatacaacc 420gtagcgtaca tcaccattaa gaccactctg gcttgcctaa ccagtgcttg gaatacaacc 420
gttcaggctg tagcaagcgc aatcggtcgg gccattgagg acgaggctcg cttcggtcgt 480gttcaggctg tagcaagcgc aatcggtcgg gccattgagg acgaggctcg cttcggtcgt 480
atccgtgacc ttgaagctaa gcacttcaag aaaaacgttg aggaacaact caacaagcgc 540atccgtgacc ttgaagctaa gcacttcaag aaaaacgttg aggaacaact caacaagcgc 540
gtagggcacg tctacaagaa agcatttatg caagttgtcg aggctgacat gctctctaag 600gtagggcacg tctacaagaa agcatttatg caagttgtcg aggctgacat gctctctaag 600
ggtctactcg gtggcgaggc gtggtcttcg tggcataagg aagactctat tcatgtagga 660ggtctactcg gtggcgaggc gtggtcttcg tggcataagg aagactctat tcatgtagga 660
gtacgctgca tcgagatgct cattgagtca accggaatgg ttagcttaca ccgccaaaat 720gtacgctgca tcgagatgct cattgagtca accggaatgg ttagcttaca ccgccaaaat 720
gctggcgtag taggtcaaga ctctgagact atcgaactcg cacctgaata cgctgaggct 780gctggcgtag taggtcaaga ctctgagact atcgaactcg cacctgaata cgctgaggct 780
atcgcaaccc gtgcaggtgc gctggctggc atctctccga tgttccaacc ttgcgtagtt 840atcgcaaccc gtgcaggtgc gctggctggc atctctccga tgttccaacc ttgcgtagtt 840
cctcctaagc cgtggactgg cattactggt ggtggctatt gggctaacgg tcgtcgtcct 900cctcctaagc cgtggactgg cattactggt ggtggctatt gggctaacgg tcgtcgtcct 900
ctggcgctgg tgcgtactca cagtaagaaa gcactgatgc gctacgaaga cgtttacatg 960ctggcgctgg tgcgtactca cagtaagaaa gcactgatgc gctacgaaga cgtttacatg 960
cctgaggtgt acaaagcgat taacattgcg caaaacaccg catggaaaat caacaagaaa 10201020
gtcctagcgg tcgccaacgt aatcaccaag tggaagcatt gtccggtcga ggacatccct 1080gtcctagcgg tcgccaacgt aatcaccaag tggaagcatt gtccggtcga ggacatccct 1080
gcgattgagc gtgaagaact cccgatgaaa ccggaagaca tcgacatgaa tcctgaggct 1140gcgattgagc gtgaagaact cccgatgaaa ccggaagaca tcgacatgaa tcctgaggct 1140
ctcaccgcgt ggaaacgtgc tgccgctgct gtgtaccgca aggacaaggc tcgcaagtct 1200ctcaccgcgt ggaaacgtgc tgccgctgct gtgtaccgca aggacaaggc tcgcaagtct 1200
agtcgtatca gccttgagtt catgcttgag caagccaata agtttgctaa ccataaggcc 1260agtcgtatca gccttgagtt catgcttgag caagccaata agtttgctaa ccataaggcc 1260
atctggttcc cttacaacat ggactggcgc ggtcgtgttt acgctgtgtc aatgttcaac 1320atctggttcc cttacaacat ggactggcgc ggtcgtgttt acgctgtgtc aatgttcaac 1320
ccgcaaggta acgatatgac caaaggactg cttacgctgg cgaaaggtaa accaatcggt 1380ccgcaaggta acgatatgac caaaggactg cttacgctgg cgaaaggtaa accaatcggt 1380
aaggaaggtt actactggct gaaaatccac ggtgcaaact gtgcgggtgt cgataaggtt 1440aaggaaggtt actactggct gaaaatccac ggtgcaaact gtgcgggtgt cgataaggtt 1440
ccgttccctg agcgcatcaa gttcattgag gaaaaccacg agaacatcat ggcttgcgct 1500ccgttccctg agcgcatcaa gttcattgag gaaaaccacg agaacatcat ggcttgcgct 1500
aagtctccac tggagaacac ttggtgggct gagcaatggt ctccgttctg cttccttgcg 1560aagtctccac tggagaacac ttggtgggct gagcaatggt ctccgttctg cttccttgcg 1560
ttctgctttg agtacgctgg ggtacagcac cacggcctga gctataactg ctcccttccg 1620ttctgctttg agtacgctgg ggtacagcac cacggcctga gctataactg ctcccttccg 1620
ctggcgtttg acgggtcttg ctctggcatc cagcacttct ccgcgatgct ccgagatgag 1680ctggcgtttg acgggtcttg ctctggcatc cagcacttct ccgcgatgct ccgagatgag 1680
gtaggtggtc gcgcggttaa cttgcttcct agtgaaaccg ttcaggacat ctacgggatt 1740gtaggtggtc gcgcggttaa cttgcttcct agtgaaaccg ttcaggacat ctacgggatt 1740
gttgctaaga aagtcaacga gattctacaa gcagacgcaa tcaatgggac cgataacgaa 1800gttgctaaga aagtcaacga gattctacaa gcagacgcaa tcaatgggac cgataacgaa 1800
gtagttaccg tgaccgatga gaacactggt gaaatctctg agaaagtcaa gctgggcact 1860gtagttaccg tgaccgatga gaacactggt gaaatctctg agaaagtcaa gctgggcact 1860
aaggcactgg ctggtcaatg gctggcttac ggtgttactc gcagtgtgac taagcgttca 1920aaggcactgg ctggtcaatg gctggcttac ggtgttactc gcagtgtgac taagcgttca 1920
gtcatgacgc tggcttacgg gtccaaagag ttcggcttcc gtcaacaagt gctggaagat 1980gtcatgacgc tggcttacgg gtccaaagag ttcggcttcc gtcaacaagt gctggaagat 1980
accattcagt gggctattga ttccggcaag ggtctgatgt tcactcagcc gaatcaggct 2040accattcagt gggctattga ttccggcaag ggtctgatgt tcactcagcc gaatcaggct 2040
gctggataca tggctaagct gatttgggaa tctgtgagcg tgacggtggt agctgcggtt 2100gctggataca tggctaagct gatttgggaa tctgtgagcg tgacggtggt agctgcggtt 2100
gaagcaatga actggcttaa gtctgctgct aagctgctgg ctgctgaggt caaagataag 2160gaagcaatga actggcttaa gtctgctgct aagctgctgg ctgctgaggt caaagataag 2160
aagactggag agattcttcg caagcgttgc gctgtgcatt gggtaactcc tgatggtttc 2220aagactggag agattcttcg caagcgttgc gctgtgcatt gggtaactcc tgatggtttc 2220
cctgtgtggc aggaatacaa gaagcctatt cagacgcgct tgaacctgat gttcctcggt 2280cctgtgtggc aggaatacaa gaagcctatt cagacgcgct tgaacctgat gttcctcggt 2280
cagttccgct tacagcctac cattaacacc aacaaagata gcgagattga tgcacacaaa 2340cagttccgct tacagcctac cattaacacc aacaaagata gcgagattga tgcacacaaa 2340
caggagtctg gtatcgctcc taactttgta cacagccaag acggtagcca ccttcgtaag 2400caggagtctg gtatcgctcc taactttgta cacagccaag acggtagcca ccttcgtaag 2400
actgtagtgt gggcacacga gaagtacgga atcgaatctt ttgcactgat tcacgactcc 2460actgtagtgt gggcacacga gaagtacgga atcgaatctt ttgcactgat tcacgactcc 2460
ttcggtacca ttccggctga cgctgcgaac ctgttcaaag cagtgcgcga aactatggtt 2520ttcggtacca ttccggctga cgctgcgaac ctgttcaaag cagtgcgcga aactatggtt 2520
gacacatatg agtcttgtga tgtactggct gatttctacg accagttcgc tgaccagttg 2580gacacatatg agtcttgtga tgtactggct gatttctacg accagttcgc tgaccagttg 2580
cacgagtctc aattggacaa aatgccagca cttccggcta aaggtaactt gaacctccgt 2640cacgagtctc aattggacaa aatgccagca cttccggcta aaggtaactt gaacctccgt 2640
gacatcttag agtcggactt cgcgttcgcg taa 2673gacatcttag agtcggactt cgcgttcgcg taa 2673
<210> 25<210> 25
<211> 890<211> 890
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Вариант T7РНКP<223> T7RNAP variant
<400> 25<400> 25
Met His His His His His His Met Asn Thr Ile Asn Ile Ala Lys Asn Met His His His His His His Met Asn Thr Ile Asn Ile Ala Lys Asn
1 5 10 15 1 5 10 15
Asp Phe Ser Asp Ile Glu Leu Ala Ala Ile Pro Phe Asn Thr Leu Ala Asp Phe Ser Asp Ile Glu Leu Ala Ala Ile Pro Phe Asn Thr Leu Ala
20 25 30 20 25 30
Asp His Tyr Gly Glu Arg Leu Ala Arg Glu Gln Leu Ala Leu Glu His Asp His Tyr Gly Glu Arg Leu Ala Arg Glu Gln Leu Ala Leu Glu His
35 40 45 35 40 45
Glu Ser Tyr Glu Met Gly Glu Ala Arg Phe Arg Lys Met Phe Glu Arg Glu Ser Tyr Glu Met Gly Glu Ala Arg Phe Arg Lys Met Phe Glu Arg
50 55 60 50 55 60
Gln Leu Lys Ala Gly Glu Val Ala Asp Asn Ala Ala Ala Lys Pro Leu Gln Leu Lys Ala Gly Glu Val Ala Asp Asn Ala Ala Ala Lys Pro Leu
65 70 75 80 65 70 75 80
Ile Thr Thr Leu Leu Pro Lys Met Ile Ala Arg Ile Asn Asp Trp Phe Ile Thr Thr Leu Leu Pro Lys Met Ile Ala Arg Ile Asn Asp Trp Phe
85 90 95 85 90 95
Glu Glu Val Lys Ala Lys Arg Gly Lys Arg Pro Thr Ala Phe Gln Phe Glu Glu Val Lys Ala Lys Arg Gly Lys Arg Pro Thr Ala Phe Gln Phe
100 105 110 100 105 110
Leu Gln Glu Ile Lys Pro Glu Ala Val Ala Tyr Ile Thr Ile Lys Thr Leu Gln Glu Ile Lys Pro Glu Ala Val Ala Tyr Ile Thr Ile Lys Thr
115 120 125 115 120 125
Thr Leu Ala Cys Leu Thr Ser Ala Trp Asn Thr Thr Val Gln Ala Val Thr Leu Ala Cys Leu Thr Ser Ala Trp Asn Thr Thr Val Gln Ala Val
130 135 140 130 135 140
Ala Ser Ala Ile Gly Arg Ala Ile Glu Asp Glu Ala Arg Phe Gly Arg Ala Ser Ala Ile Gly Arg Ala Ile Glu Asp Glu Ala Arg Phe Gly Arg
145 150 155 160 145 150 155 160
Ile Arg Asp Leu Glu Ala Lys His Phe Lys Lys Asn Val Glu Glu Gln Ile Arg Asp Leu Glu Ala Lys His Phe Lys Lys Asn Val Glu Glu Gln
165 170 175 165 170 175
Leu Asn Lys Arg Val Gly His Val Tyr Lys Lys Ala Phe Met Gln Val Leu Asn Lys Arg Val Gly His Val Tyr Lys Lys Ala Phe Met Gln Val
180 185 190 180 185 190
Val Glu Ala Asp Met Leu Ser Lys Gly Leu Leu Gly Gly Glu Ala Trp Val Glu Ala Asp Met Leu Ser Lys Gly Leu Leu Gly Gly Glu Ala Trp
195 200 205 195 200 205
Ser Ser Trp His Lys Glu Asp Ser Ile His Val Gly Val Arg Cys Ile Ser Ser Trp His Lys Glu Asp Ser Ile His Val Gly Val Arg Cys Ile
210 215 220 210 215 220
Glu Met Leu Ile Glu Ser Thr Gly Met Val Ser Leu His Arg Gln Asn Glu Met Leu Ile Glu Ser Thr Gly Met Val Ser Leu His Arg Gln Asn
225 230 235 240 225 230 235 240
Ala Gly Val Val Gly Gln Asp Ser Glu Thr Ile Glu Leu Ala Pro Glu Ala Gly Val Val Gly Gln Asp Ser Glu Thr Ile Glu Leu Ala Pro Glu
245 250 255 245 250 255
Tyr Ala Glu Ala Ile Ala Thr Arg Ala Gly Ala Leu Ala Gly Ile Ser Tyr Ala Glu Ala Ile Ala Thr Arg Ala Gly Ala Leu Ala Gly Ile Ser
260 265 270 260 265 270
Pro Met Phe Gln Pro Cys Val Val Pro Pro Lys Pro Trp Thr Gly Ile Pro Met Phe Gln Pro Cys Val Val Pro Pro Lys Pro Trp Thr Gly Ile
275 280 285 275 280 285
Thr Gly Gly Gly Tyr Trp Ala Asn Gly Arg Arg Pro Leu Ala Leu Val Thr Gly Gly Gly Tyr Trp Ala Asn Gly Arg Arg Pro Leu Ala Leu Val
290 295 300 290 295 300
Arg Thr His Ser Lys Lys Ala Leu Met Arg Tyr Glu Asp Val Tyr Met Arg Thr His Ser Lys Lys Ala Leu Met Arg Tyr Glu Asp Val Tyr Met
305 310 315 320 305 310 315 320
Pro Glu Val Tyr Lys Ala Ile Asn Ile Ala Gln Asn Thr Ala Trp Lys Pro Glu Val Tyr Lys Ala Ile Asn Ile Ala Gln Asn Thr Ala Trp Lys
325 330 335 325 330 335
Ile Asn Lys Lys Val Leu Ala Val Ala Asn Val Ile Thr Lys Trp Lys Ile Asn Lys Lys Val Leu Ala Val Ala Asn Val Ile Thr Lys Trp Lys
340 345 350 340 345 350
His Cys Pro Val Glu Asp Ile Pro Ala Ile Glu Arg Glu Glu Leu Pro His Cys Pro Val Glu Asp Ile Pro Ala Ile Glu Arg Glu Glu Leu Pro
355 360 365 355 360 365
Met Lys Pro Glu Asp Ile Asp Met Asn Pro Glu Ala Leu Thr Ala Trp Met Lys Pro Glu Asp Ile Asp Met Asn Pro Glu Ala Leu Thr Ala Trp
370 375 380 370 375 380
Lys Arg Ala Ala Ala Ala Val Tyr Arg Lys Asp Lys Ala Arg Lys Ser Lys Arg Ala Ala Ala Ala Val Tyr Arg Lys Asp Lys Ala Arg Lys Ser
385 390 395 400 385 390 395 400
Ser Arg Ile Ser Leu Glu Phe Met Leu Glu Gln Ala Asn Lys Phe Ala Ser Arg Ile Ser Leu Glu Phe Met Leu Glu Gln Ala Asn Lys Phe Ala
405 410 415 405 410 415
Asn His Lys Ala Ile Trp Phe Pro Tyr Asn Met Asp Trp Arg Gly Arg Asn His Lys Ala Ile Trp Phe Pro Tyr Asn Met Asp Trp Arg Gly Arg
420 425 430 420 425 430
Val Tyr Ala Val Ser Met Phe Asn Pro Gln Gly Asn Asp Met Thr Lys Val Tyr Ala Val Ser Met Phe Asn Pro Gln Gly Asn Asp Met Thr Lys
435 440 445 435 440 445
Gly Leu Leu Thr Leu Ala Lys Gly Lys Pro Ile Gly Lys Glu Gly Tyr Gly Leu Leu Thr Leu Ala Lys Gly Lys Pro Ile Gly Lys Glu Gly Tyr
450 455 460 450 455 460
Tyr Trp Leu Lys Ile His Gly Ala Asn Cys Ala Gly Val Asp Lys Val Tyr Trp Leu Lys Ile His Gly Ala Asn Cys Ala Gly Val Asp Lys Val
465 470 475 480 465 470 475 480
Pro Phe Pro Glu Arg Ile Lys Phe Ile Glu Glu Asn His Glu Asn Ile Pro Phe Pro Glu Arg Ile Lys Phe Ile Glu Glu Asn His Glu Asn Ile
485 490 495 485 490 495
Met Ala Cys Ala Lys Ser Pro Leu Glu Asn Thr Trp Trp Ala Glu Gln Met Ala Cys Ala Lys Ser Pro Leu Glu Asn Thr Trp Trp Ala Glu Gln
500 505 510 500 505 510
Trp Ser Pro Phe Cys Phe Leu Ala Phe Cys Phe Glu Tyr Ala Gly Val Trp Ser Pro Phe Cys Phe Leu Ala Phe Cys Phe Glu Tyr Ala Gly Val
515 520 525 515 520 525
Gln His His Gly Leu Ser Tyr Asn Cys Ser Leu Pro Leu Ala Phe Asp Gln His His Gly Leu Ser Tyr Asn Cys Ser Leu Pro Leu Ala Phe Asp
530 535 540 530 535 540
Gly Ser Cys Ser Gly Ile Gln His Phe Ser Ala Met Leu Arg Asp Glu Gly Ser Cys Ser Gly Ile Gln His Phe Ser Ala Met Leu Arg Asp Glu
545 550 555 560 545 550 555 560
Val Gly Gly Arg Ala Val Asn Leu Leu Pro Ser Glu Thr Val Gln Asp Val Gly Gly Arg Ala Val Asn Leu Leu Pro Ser Glu Thr Val Gln Asp
565 570 575 565 570 575
Ile Tyr Gly Ile Val Ala Lys Lys Val Asn Glu Ile Leu Gln Ala Asp Ile Tyr Gly Ile Val Ala Lys Lys Val Asn Glu Ile Leu Gln Ala Asp
580 585 590 580 585 590
Ala Ile Asn Gly Thr Asp Asn Glu Val Val Thr Val Thr Asp Glu Asn Ala Ile Asn Gly Thr Asp Asn Glu Val Val Thr Val Thr Asp Glu Asn
595 600 605 595 600 605
Thr Gly Glu Ile Ser Glu Lys Val Lys Leu Gly Thr Lys Ala Leu Ala Thr Gly Glu Ile Ser Glu Lys Val Lys Leu Gly Thr Lys Ala Leu Ala
610 615 620 610 615 620
Gly Gln Trp Leu Ala Tyr Gly Val Thr Arg Ser Val Thr Lys Arg Ser Gly Gln Trp Leu Ala Tyr Gly Val Thr Arg Ser Val Thr Lys Arg Ser
625 630 635 640 625 630 635 640
Val Met Thr Leu Ala Tyr Gly Ser Lys Glu Phe Gly Phe Arg Gln Gln Val Met Thr Leu Ala Tyr Gly Ser Lys Glu Phe Gly Phe Arg Gln Gln
645 650 655 645 650 655
Val Leu Glu Asp Thr Ile Gln Trp Ala Ile Asp Ser Gly Lys Gly Leu Val Leu Glu Asp Thr Ile Gln Trp Ala Ile Asp Ser Gly Lys Gly Leu
660 665 670 660 665 670
Met Phe Thr Gln Pro Asn Gln Ala Ala Gly Tyr Met Ala Lys Leu Ile Met Phe Thr Gln Pro Asn Gln Ala Ala Gly Tyr Met Ala Lys Leu Ile
675 680 685 675 680 685
Trp Glu Ser Val Ser Val Thr Val Val Ala Ala Val Glu Ala Met Asn Trp Glu Ser Val Ser Val Thr Val Val Ala Ala Val Glu Ala Met Asn
690 695 700 690 695 700
Trp Leu Lys Ser Ala Ala Lys Leu Leu Ala Ala Glu Val Lys Asp Lys Trp Leu Lys Ser Ala Ala Lys Leu Leu Ala Ala Glu Val Lys Asp Lys
705 710 715 720 705 710 715 720
Lys Thr Gly Glu Ile Leu Arg Lys Arg Cys Ala Val His Trp Val Thr Lys Thr Gly Glu Ile Leu Arg Lys Arg Cys Ala Val His Trp Val Thr
725 730 735 725 730 735
Pro Asp Gly Phe Pro Val Trp Gln Glu Tyr Lys Lys Pro Ile Gln Thr Pro Asp Gly Phe Pro Val Trp Gln Glu Tyr Lys Lys Pro Ile Gln Thr
740 745 750 740 745 750
Arg Leu Asn Leu Met Phe Leu Gly Gln Phe Arg Leu Gln Pro Thr Ile Arg Leu Asn Leu Met Phe Leu Gly Gln Phe Arg Leu Gln Pro Thr Ile
755 760 765 755 760 765
Asn Thr Asn Lys Asp Ser Glu Ile Asp Ala His Lys Gln Glu Ser Gly Asn Thr Asn Lys Asp Ser Glu Ile Asp Ala His Lys Gln Glu Ser Gly
770 775 780 770 775 780
Ile Ala Pro Asn Phe Val His Ser Gln Asp Gly Ser His Leu Arg Lys Ile Ala Pro Asn Phe Val His Ser Gln Asp Gly Ser His Leu Arg Lys
785 790 795 800 785 790 795 800
Thr Val Val Trp Ala His Glu Lys Tyr Gly Ile Glu Ser Phe Ala Leu Thr Val Val Trp Ala His Glu Lys Tyr Gly Ile Glu Ser Phe Ala Leu
805 810 815 805 810 815
Ile His Asp Ser Phe Gly Thr Ile Pro Ala Asp Ala Ala Asn Leu Phe Ile His Asp Ser Phe Gly Thr Ile Pro Ala Asp Ala Ala Asn Leu Phe
820 825 830 820 825 830
Lys Ala Val Arg Glu Thr Met Val Asp Thr Tyr Glu Ser Cys Asp Val Lys Ala Val Arg Glu Thr Met Val Asp Thr Tyr Glu Ser Cys Asp Val
835 840 845 835 840 845
Leu Ala Asp Phe Tyr Asp Gln Phe Ala Asp Gln Leu His Glu Ser Gln Leu Ala Asp Phe Tyr Asp Gln Phe Ala Asp Gln Leu His Glu Ser Gln
850 855 860 850 855 860
Leu Asp Lys Met Pro Ala Leu Pro Ala Lys Gly Asn Leu Asn Leu Arg Leu Asp Lys Met Pro Ala Leu Pro Ala Lys Gly Asn Leu Asn Leu Arg
865 870 875 880 865 870 875 880
Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala
885 890 885 890
<210> 26<210> 26
<211> 2673<211> 2673
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Вариант T7РНКP<223> T7RNAP variant
<400> 26<400> 26
atgcaccatc accatcacca tatgaacacg attaacatcg ctaagaacga cttctctgac 60atgcaccatc accatcacca tatgaacacg attaacatcg ctaagaacga cttctctgac 60
atcgaactgg ctgctatccc gttcaacact ctggctgacc attacggtga gcgtttagct 120atcgaactgg ctgctatccc gttcaacact ctggctgacc attacggtga gcgtttagct 120
cgcgaacagt tggcccttga gcatgagtct tacgagatgg gtgaagcacg cttccgcaag 180cgcgaacagt tggcccttga gcatgagtct tacgagatgg gtgaagcacg cttccgcaag 180
atgtttgagc gtcaacttaa agctggtgag gttgcggata acgctgccgc caagcctctc 240atgtttgagc gtcaacttaa agctggtgag gttgcggata acgctgccgc caagcctctc 240
atcactaccc tactccctaa gatgattgca cgcatcaacg actggtttga ggaagtgaaa 300atcactaccc tactccctaa gatgattgca cgcatcaacg actggtttga ggaagtgaaa 300
gctaagcgcg gcaagcgccc gacagccttc cagttcctgc aagaaatcaa gccggaagcc 360gctaagcgcg gcaagcgccc gacagccttc cagttcctgc aagaaatcaa gccggaagcc 360
gtagcgtaca tcaccattaa gaccactctg gcttgcctaa ccagtgcttg gaatacaacc 420gtagcgtaca tcaccattaa gaccactctg gcttgcctaa ccagtgcttg gaatacaacc 420
gttcaggctg tagcaagcgc aatcggtcgg gccattgagg acgaggctcg cttcggtcgt 480gttcaggctg tagcaagcgc aatcggtcgg gccattgagg acgaggctcg cttcggtcgt 480
atccgtgacc ttgaagctaa gcacttcaag aaaaacgttg aggaacaact caacaagcgc 540atccgtgacc ttgaagctaa gcacttcaag aaaaacgttg aggaacaact caacaagcgc 540
gtagggcacg tctacaagaa agcatttatg caagttgtcg aggctgacat gctctctaag 600gtagggcacg tctacaagaa agcatttatg caagttgtcg aggctgacat gctctctaag 600
ggtctactcg gtggcgaggc gtggtcttcg tggcataagg aagactctat tcatgtagga 660ggtctactcg gtggcgaggc gtggtcttcg tggcataagg aagactctat tcatgtagga 660
gtacgctgca tcgagatgct cattgagtca accggaatgg ttagcttaca ccgccaaaat 720gtacgctgca tcgagatgct cattgagtca accggaatgg ttagcttaca ccgccaaaat 720
gctggcgtag taggtcaaga ctctgagact atcgaactcg cacctgaata cgctgaggct 780gctggcgtag taggtcaaga ctctgagact atcgaactcg cacctgaata cgctgaggct 780
atcgcaaccc gtgcaggtgc gctggctggc atctctccga tgttccaacc ttgcgtagtt 840atcgcaaccc gtgcaggtgc gctggctggc atctctccga tgttccaacc ttgcgtagtt 840
cctcctaagc cgtggactgg cattactggt ggtggctatt gggctaacgg tcgtcgtcct 900cctcctaagc cgtggactgg cattactggt ggtggctatt gggctaacgg tcgtcgtcct 900
ctggcgctgg tgcgtactca cagtaagaaa gcactgatgc gctacgaaga cgtttacatg 960ctggcgctgg tgcgtactca cagtaagaaa gcactgatgc gctacgaaga cgtttacatg 960
cctgaggtgt acaaagcgat taacattgcg caaaacaccg catggaaaat caacaagaaa 10201020
gtcctagcgg tcgccaacgt aatcaccaag tggaagcatt gtccggtcga ggacatccct 1080gtcctagcgg tcgccaacgt aatcaccaag tggaagcatt gtccggtcga ggacatccct 1080
gcgattgagc gtgaagaact cccgatgaaa ccggaagaca tcgacatgaa tcctgaggct 1140gcgattgagc gtgaagaact cccgatgaaa ccggaagaca tcgacatgaa tcctgaggct 1140
ctcaccgcgt ggaaacgtgc tgccgctgct gtgtaccgca aggacaaggc tcgcaagtct 1200ctcaccgcgt ggaaacgtgc tgccgctgct gtgtaccgca aggacaaggc tcgcaagtct 1200
atacgtatca gccttgagtt catgcttgag caagccaata agtttgctaa ccataaggcc 1260atacgtatca gccttgagtt catgcttgag caagccaata agtttgctaa ccataaggcc 1260
atctggttcc cttacaacat ggactggcgc ggtcgtgttt acgctgtgtc aatgttcaac 1320atctggttcc cttacaacat ggactggcgc ggtcgtgttt acgctgtgtc aatgttcaac 1320
ccgcaaggta acgatatgac caaaggactg cttacgctgg cgaaaggtaa accaatcggt 1380ccgcaaggta acgatatgac caaaggactg cttacgctgg cgaaaggtaa accaatcggt 1380
aaggaaggtt actactggct gaaaatccac ggtgcaaact gtgcgggtgt cgataaggtt 1440aaggaaggtt actactggct gaaaatccac ggtgcaaact gtgcgggtgt cgataaggtt 1440
ccgttccctg agcgcatcaa gttcattgag gaaaaccacg agaacatcat ggcttgcgct 1500ccgttccctg agcgcatcaa gttcattgag gaaaaccacg agaacatcat ggcttgcgct 1500
aagtctccac tggagaacac ttggtgggct gagcaagatt ctccgttctg cttccttgcg 1560aagtctccac tggagaacac ttggtgggct gagcaagatt ctccgttctg cttccttgcg 1560
ttctgctttg agtacgctgg ggtacagcac cacggcctga gctataactg ctcccttccg 1620ttctgctttg agtacgctgg ggtacagcac cacggcctga gctataactg ctcccttccg 1620
ctggcgtttg acgggtcttg ctctggcatc cagcacttct ccgcgatgct ccgagatgag 1680ctggcgtttg acgggtcttg ctctggcatc cagcacttct ccgcgatgct ccgagatgag 1680
gtaggtggtc gcgcggttaa cttgcttcct agtgaaaccg ttcaggacat ctacgggatt 1740gtaggtggtc gcgcggttaa cttgcttcct agtgaaaccg ttcaggacat ctacgggatt 1740
gttgctaaga aagtcaacga gattctacaa gcagacgcaa tcaatgggac cgataacgaa 1800gttgctaaga aagtcaacga gattctacaa gcagacgcaa tcaatgggac cgataacgaa 1800
gtagttaccg tgaccgatga gaacactggt gaaatctctg agaaagtcaa gctgggcact 1860gtagttaccg tgaccgatga gaacactggt gaaatctctg agaaagtcaa gctgggcact 1860
aaggcactgg ctggtcaatg gctggcttac ggtgttactc gcagtgtgac taagcgttca 1920aaggcactgg ctggtcaatg gctggcttac ggtgttactc gcagtgtgac taagcgttca 1920
gtcatgacgc tggcttacgg gtccaaagag ttcggcttcc gtcaacaagt gctggaagat 1980gtcatgacgc tggcttacgg gtccaaagag ttcggcttcc gtcaacaagt gctggaagat 1980
accattcagt gggctattga ttccggcaag ggtctgatgt tcactcagcc gaatcaggct 2040accattcagt gggctattga ttccggcaag ggtctgatgt tcactcagcc gaatcaggct 2040
gctggataca tggctaagct gatttgggaa tctgtgagcg tgacggtggt agctgcggtt 2100gctggataca tggctaagct gatttgggaa tctgtgagcg tgacggtggt agctgcggtt 2100
gaagcaatga actggcttaa gtctgctgct aagctgctgg ctgctgaggt caaagataag 2160gaagcaatga actggcttaa gtctgctgct aagctgctgg ctgctgaggt caaagataag 2160
aagactggag agattcttcg caagcgttgc gctgtgcatt gggtaactcc tgatggtttc 2220aagactggag agattcttcg caagcgttgc gctgtgcatt gggtaactcc tgatggtttc 2220
cctgtgtggc aggaatacaa gaagcctatt cagacgcgct tgaacctgat gttcctcggt 2280cctgtgtggc aggaatacaa gaagcctatt cagacgcgct tgaacctgat gttcctcggt 2280
cagttccgct tacagcctac cattaacacc aacaaagata gcgagattga tgcacacaaa 2340cagttccgct tacagcctac cattaacacc aacaaagata gcgagattga tgcacacaaa 2340
caggagtctg gtatcgctcc taactttgta cacagccaag acggtagcca ccttcgtaag 2400caggagtctg gtatcgctcc taactttgta cacagccaag acggtagcca ccttcgtaag 2400
actgtagtgt gggcacacga gaagtacgga atcgaatctt ttgcactgat tcacgactcc 2460actgtagtgt gggcacacga gaagtacgga atcgaatctt ttgcactgat tcacgactcc 2460
ttcggtacca ttccggctga cgctgcgaac ctgttcaaag cagtgcgcga aactatggtt 2520ttcggtacca ttccggctga cgctgcgaac ctgttcaaag cagtgcgcga aactatggtt 2520
gacacatatg agtcttgtga tgtactggct gatttctacg accagttcgc tgaccagttg 2580gacacatatg agtcttgtga tgtactggct gatttctacg accagttcgc tgaccagttg 2580
cacgagtctc aattggacaa aatgccagca cttccggcta aaggtaactt gaacctccgt 2640cacgagtctc aattggacaa aatgccagca cttccggcta aaggtaactt gaacctccgt 2640
gacatcttag agtcggactt cgcgttcgcg taa 2673gacatcttag agtcggactt cgcgttcgcg taa 2673
<210> 27<210> 27
<211> 890<211> 890
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Вариант T7РНКP<223> T7RNAP variant
<400> 27<400> 27
Met His His His His His His Met Asn Thr Ile Asn Ile Ala Lys Asn Met His His His His His His Met Asn Thr Ile Asn Ile Ala Lys Asn
1 5 10 15 1 5 10 15
Asp Phe Ser Asp Ile Glu Leu Ala Ala Ile Pro Phe Asn Thr Leu Ala Asp Phe Ser Asp Ile Glu Leu Ala Ala Ile Pro Phe Asn Thr Leu Ala
20 25 30 20 25 30
Asp His Tyr Gly Glu Arg Leu Ala Arg Glu Gln Leu Ala Leu Glu His Asp His Tyr Gly Glu Arg Leu Ala Arg Glu Gln Leu Ala Leu Glu His
35 40 45 35 40 45
Glu Ser Tyr Glu Met Gly Glu Ala Arg Phe Arg Lys Met Phe Glu Arg Glu Ser Tyr Glu Met Gly Glu Ala Arg Phe Arg Lys Met Phe Glu Arg
50 55 60 50 55 60
Gln Leu Lys Ala Gly Glu Val Ala Asp Asn Ala Ala Ala Lys Pro Leu Gln Leu Lys Ala Gly Glu Val Ala Asp Asn Ala Ala Ala Lys Pro Leu
65 70 75 80 65 70 75 80
Ile Thr Thr Leu Leu Pro Lys Met Ile Ala Arg Ile Asn Asp Trp Phe Ile Thr Thr Leu Leu Pro Lys Met Ile Ala Arg Ile Asn Asp Trp Phe
85 90 95 85 90 95
Glu Glu Val Lys Ala Lys Arg Gly Lys Arg Pro Thr Ala Phe Gln Phe Glu Glu Val Lys Ala Lys Arg Gly Lys Arg Pro Thr Ala Phe Gln Phe
100 105 110 100 105 110
Leu Gln Glu Ile Lys Pro Glu Ala Val Ala Tyr Ile Thr Ile Lys Thr Leu Gln Glu Ile Lys Pro Glu Ala Val Ala Tyr Ile Thr Ile Lys Thr
115 120 125 115 120 125
Thr Leu Ala Cys Leu Thr Ser Ala Trp Asn Thr Thr Val Gln Ala Val Thr Leu Ala Cys Leu Thr Ser Ala Trp Asn Thr Thr Val Gln Ala Val
130 135 140 130 135 140
Ala Ser Ala Ile Gly Arg Ala Ile Glu Asp Glu Ala Arg Phe Gly Arg Ala Ser Ala Ile Gly Arg Ala Ile Glu Asp Glu Ala Arg Phe Gly Arg
145 150 155 160 145 150 155 160
Ile Arg Asp Leu Glu Ala Lys His Phe Lys Lys Asn Val Glu Glu Gln Ile Arg Asp Leu Glu Ala Lys His Phe Lys Lys Asn Val Glu Glu Gln
165 170 175 165 170 175
Leu Asn Lys Arg Val Gly His Val Tyr Lys Lys Ala Phe Met Gln Val Leu Asn Lys Arg Val Gly His Val Tyr Lys Lys Ala Phe Met Gln Val
180 185 190 180 185 190
Val Glu Ala Asp Met Leu Ser Lys Gly Leu Leu Gly Gly Glu Ala Trp Val Glu Ala Asp Met Leu Ser Lys Gly Leu Leu Gly Gly Glu Ala Trp
195 200 205 195 200 205
Ser Ser Trp His Lys Glu Asp Ser Ile His Val Gly Val Arg Cys Ile Ser Ser Trp His Lys Glu Asp Ser Ile His Val Gly Val Arg Cys Ile
210 215 220 210 215 220
Glu Met Leu Ile Glu Ser Thr Gly Met Val Ser Leu His Arg Gln Asn Glu Met Leu Ile Glu Ser Thr Gly Met Val Ser Leu His Arg Gln Asn
225 230 235 240 225 230 235 240
Ala Gly Val Val Gly Gln Asp Ser Glu Thr Ile Glu Leu Ala Pro Glu Ala Gly Val Val Gly Gln Asp Ser Glu Thr Ile Glu Leu Ala Pro Glu
245 250 255 245 250 255
Tyr Ala Glu Ala Ile Ala Thr Arg Ala Gly Ala Leu Ala Gly Ile Ser Tyr Ala Glu Ala Ile Ala Thr Arg Ala Gly Ala Leu Ala Gly Ile Ser
260 265 270 260 265 270
Pro Met Phe Gln Pro Cys Val Val Pro Pro Lys Pro Trp Thr Gly Ile Pro Met Phe Gln Pro Cys Val Val Pro Pro Lys Pro Trp Thr Gly Ile
275 280 285 275 280 285
Thr Gly Gly Gly Tyr Trp Ala Asn Gly Arg Arg Pro Leu Ala Leu Val Thr Gly Gly Gly Tyr Trp Ala Asn Gly Arg Arg Pro Leu Ala Leu Val
290 295 300 290 295 300
Arg Thr His Ser Lys Lys Ala Leu Met Arg Tyr Glu Asp Val Tyr Met Arg Thr His Ser Lys Lys Ala Leu Met Arg Tyr Glu Asp Val Tyr Met
305 310 315 320 305 310 315 320
Pro Glu Val Tyr Lys Ala Ile Asn Ile Ala Gln Asn Thr Ala Trp Lys Pro Glu Val Tyr Lys Ala Ile Asn Ile Ala Gln Asn Thr Ala Trp Lys
325 330 335 325 330 335
Ile Asn Lys Lys Val Leu Ala Val Ala Asn Val Ile Thr Lys Trp Lys Ile Asn Lys Lys Val Leu Ala Val Ala Asn Val Ile Thr Lys Trp Lys
340 345 350 340 345 350
His Cys Pro Val Glu Asp Ile Pro Ala Ile Glu Arg Glu Glu Leu Pro His Cys Pro Val Glu Asp Ile Pro Ala Ile Glu Arg Glu Glu Leu Pro
355 360 365 355 360 365
Met Lys Pro Glu Asp Ile Asp Met Asn Pro Glu Ala Leu Thr Ala Trp Met Lys Pro Glu Asp Ile Asp Met Asn Pro Glu Ala Leu Thr Ala Trp
370 375 380 370 375 380
Lys Arg Ala Ala Ala Ala Val Tyr Arg Lys Asp Lys Ala Arg Lys Ser Lys Arg Ala Ala Ala Ala Val Tyr Arg Lys Asp Lys Ala Arg Lys Ser
385 390 395 400 385 390 395 400
Ile Arg Ile Ser Leu Glu Phe Met Leu Glu Gln Ala Asn Lys Phe Ala Ile Arg Ile Ser Leu Glu Phe Met Leu Glu Gln Ala Asn Lys Phe Ala
405 410 415 405 410 415
Asn His Lys Ala Ile Trp Phe Pro Tyr Asn Met Asp Trp Arg Gly Arg Asn His Lys Ala Ile Trp Phe Pro Tyr Asn Met Asp Trp Arg Gly Arg
420 425 430 420 425 430
Val Tyr Ala Val Ser Met Phe Asn Pro Gln Gly Asn Asp Met Thr Lys Val Tyr Ala Val Ser Met Phe Asn Pro Gln Gly Asn Asp Met Thr Lys
435 440 445 435 440 445
Gly Leu Leu Thr Leu Ala Lys Gly Lys Pro Ile Gly Lys Glu Gly Tyr Gly Leu Leu Thr Leu Ala Lys Gly Lys Pro Ile Gly Lys Glu Gly Tyr
450 455 460 450 455 460
Tyr Trp Leu Lys Ile His Gly Ala Asn Cys Ala Gly Val Asp Lys Val Tyr Trp Leu Lys Ile His Gly Ala Asn Cys Ala Gly Val Asp Lys Val
465 470 475 480 465 470 475 480
Pro Phe Pro Glu Arg Ile Lys Phe Ile Glu Glu Asn His Glu Asn Ile Pro Phe Pro Glu Arg Ile Lys Phe Ile Glu Glu Asn His Glu Asn Ile
485 490 495 485 490 495
Met Ala Cys Ala Lys Ser Pro Leu Glu Asn Thr Trp Trp Ala Glu Gln Met Ala Cys Ala Lys Ser Pro Leu Glu Asn Thr Trp Trp Ala Glu Gln
500 505 510 500 505 510
Asp Ser Pro Phe Cys Phe Leu Ala Phe Cys Phe Glu Tyr Ala Gly Val Asp Ser Pro Phe Cys Phe Leu Ala Phe Cys Phe Glu Tyr Ala Gly Val
515 520 525 515 520 525
Gln His His Gly Leu Ser Tyr Asn Cys Ser Leu Pro Leu Ala Phe Asp Gln His His Gly Leu Ser Tyr Asn Cys Ser Leu Pro Leu Ala Phe Asp
530 535 540 530 535 540
Gly Ser Cys Ser Gly Ile Gln His Phe Ser Ala Met Leu Arg Asp Glu Gly Ser Cys Ser Gly Ile Gln His Phe Ser Ala Met Leu Arg Asp Glu
545 550 555 560 545 550 555 560
Val Gly Gly Arg Ala Val Asn Leu Leu Pro Ser Glu Thr Val Gln Asp Val Gly Gly Arg Ala Val Asn Leu Leu Pro Ser Glu Thr Val Gln Asp
565 570 575 565 570 575
Ile Tyr Gly Ile Val Ala Lys Lys Val Asn Glu Ile Leu Gln Ala Asp Ile Tyr Gly Ile Val Ala Lys Lys Val Asn Glu Ile Leu Gln Ala Asp
580 585 590 580 585 590
Ala Ile Asn Gly Thr Asp Asn Glu Val Val Thr Val Thr Asp Glu Asn Ala Ile Asn Gly Thr Asp Asn Glu Val Val Thr Val Thr Asp Glu Asn
595 600 605 595 600 605
Thr Gly Glu Ile Ser Glu Lys Val Lys Leu Gly Thr Lys Ala Leu Ala Thr Gly Glu Ile Ser Glu Lys Val Lys Leu Gly Thr Lys Ala Leu Ala
610 615 620 610 615 620
Gly Gln Trp Leu Ala Tyr Gly Val Thr Arg Ser Val Thr Lys Arg Ser Gly Gln Trp Leu Ala Tyr Gly Val Thr Arg Ser Val Thr Lys Arg Ser
625 630 635 640 625 630 635 640
Val Met Thr Leu Ala Tyr Gly Ser Lys Glu Phe Gly Phe Arg Gln Gln Val Met Thr Leu Ala Tyr Gly Ser Lys Glu Phe Gly Phe Arg Gln Gln
645 650 655 645 650 655
Val Leu Glu Asp Thr Ile Gln Trp Ala Ile Asp Ser Gly Lys Gly Leu Val Leu Glu Asp Thr Ile Gln Trp Ala Ile Asp Ser Gly Lys Gly Leu
660 665 670 660 665 670
Met Phe Thr Gln Pro Asn Gln Ala Ala Gly Tyr Met Ala Lys Leu Ile Met Phe Thr Gln Pro Asn Gln Ala Ala Gly Tyr Met Ala Lys Leu Ile
675 680 685 675 680 685
Trp Glu Ser Val Ser Val Thr Val Val Ala Ala Val Glu Ala Met Asn Trp Glu Ser Val Ser Val Thr Val Val Ala Ala Val Glu Ala Met Asn
690 695 700 690 695 700
Trp Leu Lys Ser Ala Ala Lys Leu Leu Ala Ala Glu Val Lys Asp Lys Trp Leu Lys Ser Ala Ala Lys Leu Leu Ala Ala Glu Val Lys Asp Lys
705 710 715 720 705 710 715 720
Lys Thr Gly Glu Ile Leu Arg Lys Arg Cys Ala Val His Trp Val Thr Lys Thr Gly Glu Ile Leu Arg Lys Arg Cys Ala Val His Trp Val Thr
725 730 735 725 730 735
Pro Asp Gly Phe Pro Val Trp Gln Glu Tyr Lys Lys Pro Ile Gln Thr Pro Asp Gly Phe Pro Val Trp Gln Glu Tyr Lys Lys Pro Ile Gln Thr
740 745 750 740 745 750
Arg Leu Asn Leu Met Phe Leu Gly Gln Phe Arg Leu Gln Pro Thr Ile Arg Leu Asn Leu Met Phe Leu Gly Gln Phe Arg Leu Gln Pro Thr Ile
755 760 765 755 760 765
Asn Thr Asn Lys Asp Ser Glu Ile Asp Ala His Lys Gln Glu Ser Gly Asn Thr Asn Lys Asp Ser Glu Ile Asp Ala His Lys Gln Glu Ser Gly
770 775 780 770 775 780
Ile Ala Pro Asn Phe Val His Ser Gln Asp Gly Ser His Leu Arg Lys Ile Ala Pro Asn Phe Val His Ser Gln Asp Gly Ser His Leu Arg Lys
785 790 795 800 785 790 795 800
Thr Val Val Trp Ala His Glu Lys Tyr Gly Ile Glu Ser Phe Ala Leu Thr Val Val Trp Ala His Glu Lys Tyr Gly Ile Glu Ser Phe Ala Leu
805 810 815 805 810 815
Ile His Asp Ser Phe Gly Thr Ile Pro Ala Asp Ala Ala Asn Leu Phe Ile His Asp Ser Phe Gly Thr Ile Pro Ala Asp Ala Ala Asn Leu Phe
820 825 830 820 825 830
Lys Ala Val Arg Glu Thr Met Val Asp Thr Tyr Glu Ser Cys Asp Val Lys Ala Val Arg Glu Thr Met Val Asp Thr Tyr Glu Ser Cys Asp Val
835 840 845 835 840 845
Leu Ala Asp Phe Tyr Asp Gln Phe Ala Asp Gln Leu His Glu Ser Gln Leu Ala Asp Phe Tyr Asp Gln Phe Ala Asp Gln Leu His Glu Ser Gln
850 855 860 850 855 860
Leu Asp Lys Met Pro Ala Leu Pro Ala Lys Gly Asn Leu Asn Leu Arg Leu Asp Lys Met Pro Ala Leu Pro Ala Lys Gly Asn Leu Asn Leu Arg
865 870 875 880 865 870 875 880
Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala
885 890 885 890
<210> 28<210> 28
<211> 2673<211> 2673
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Вариант T7РНКP<223> T7RNAP variant
<400> 28<400> 28
atgcaccatc accatcacca tatgaacacg attaacatcg ctaagaacga cttctctgac 60atgcaccatc accatcacca tatgaacacg attaacatcg ctaagaacga cttctctgac 60
atcgaactgg ctgctatccc gttcaacact ctggctgacc attacggtga gcgtttagct 120atcgaactgg ctgctatccc gttcaacact ctggctgacc attacggtga gcgtttagct 120
cgcgaacagt tggcccttga gcatgagtct tacgagatgg gtgaagcacg cttccgcaag 180cgcgaacagt tggcccttga gcatgagtct tacgagatgg gtgaagcacg cttccgcaag 180
atgtttgagc gtcaacttaa agctggtgag gttgcggata acgctgccgc caagcctctc 240atgtttgagc gtcaacttaa agctggtgag gttgcggata acgctgccgc caagcctctc 240
atcactaccc tactccctaa gatgattgca cgcatcaacg actggtttga ggaagtgaaa 300atcactaccc tactccctaa gatgattgca cgcatcaacg actggtttga ggaagtgaaa 300
gctaagcgcg gcaagcgccc gacagccttc cagttcctgc aagaaatcaa gccggaagcc 360gctaagcgcg gcaagcgccc gacagccttc cagttcctgc aagaaatcaa gccggaagcc 360
gtagcgtaca tcaccattaa gaccactctg gcttgcctaa ccagtataga caatacaacc 420gtagcgtaca tcaccattaa gaccactctg gcttgcctaa ccagtataga caatacaacc 420
gttcaggctg tagcaagcgc aatcggtcgg gccattgagg acgaggctcg cttcggtcgt 480gttcaggctg tagcaagcgc aatcggtcgg gccattgagg acgaggctcg cttcggtcgt 480
atccgtgacc ttgaagctaa gcacttcaag aaaaacgttg aggaacaact caacaagcgc 540atccgtgacc ttgaagctaa gcacttcaag aaaaacgttg aggaacaact caacaagcgc 540
gtagggcacg tctacaagaa agcatttatg caagttgtcg aggctgacat gctctctaag 600gtagggcacg tctacaagaa agcatttatg caagttgtcg aggctgacat gctctctaag 600
ggtctactcg gtggcgaggc gtggtcttcg tggcataagg aagactctat tcatgtagga 660ggtctactcg gtggcgaggc gtggtcttcg tggcataagg aagactctat tcatgtagga 660
gtacgctgca tcgagatgct cattgagtca accggaatgg ttagcttaca ccgccaaaat 720gtacgctgca tcgagatgct cattgagtca accggaatgg ttagcttaca ccgccaaaat 720
gctggcgtag taggtcaaga ctctgagact atcgaactcg cacctgaata cgctgaggct 780gctggcgtag taggtcaaga ctctgagact atcgaactcg cacctgaata cgctgaggct 780
atcgcaaccc gtgcaggtgc gctggctggc atctctccga tgttccaacc ttgcgtagtt 840atcgcaaccc gtgcaggtgc gctggctggc atctctccga tgttccaacc ttgcgtagtt 840
cctcctaagc cgtggactgg cattactggt ggtggctatt gggctaacgg tcgtcgtcct 900cctcctaagc cgtggactgg cattactggt ggtggctatt gggctaacgg tcgtcgtcct 900
ctggcgctgg tgcgtactca cagtaagaaa gcactgatgc gctacgaaga cgtttacatg 960ctggcgctgg tgcgtactca cagtaagaaa gcactgatgc gctacgaaga cgtttacatg 960
cctgaggtgt acaaagcgat taacattgcg caaaacaccg catggaaaat caacaagaaa 10201020
gtcctagcgg tcgccaacgt aatcaccaag tggaagcatt gtccggtcga agacatccct 1080gtcctagcgg tcgccaacgt aatcaccaag tggaagcatt gtccggtcga agacatccct 1080
gcgattgagc gtgaagaact cccgatgaaa ccggaagaca tcgacatgaa tcctgaggct 1140gcgattgagc gtgaagaact cccgatgaaa ccggaagaca tcgacatgaa tcctgaggct 1140
ctcaccgcgt ggaaacgtgc tgccgctgct gtgtaccgca gagacaaggc tcgcaagtct 1200ctcaccgcgt ggaaacgtgc tgccgctgct gtgtaccgca gagacaaggc tcgcaagtct 1200
cgccgtatct atcttgagtt catgcttgag caagccaata agtttgctaa ccataaggcc 1260cgccgtatct atcttgagtt catgcttgag caagccaata agtttgctaa ccataaggcc 1260
atctggttcc cttacaacat ggactggcgc ggtcgtgttt acgctgtgtc aatgttcaac 1320atctggttcc cttacaacat ggactggcgc ggtcgtgttt acgctgtgtc aatgttcaac 1320
ccgcaaggta acgattggac caaaggactg cttacgctgg cgaaaggtaa accaatcggt 1380ccgcaaggta acgattggac caaaggactg cttacgctgg cgaaaggtaa accaatcggt 1380
aaggaaggtt actactggct gaaaatccac ggtgcaaact gtgcgggtgt cgataaggtt 1440aaggaaggtt actactggct gaaaatccac ggtgcaaact gtgcgggtgt cgataaggtt 1440
ccgttccctg agcgcatcaa gttcattgag gaaaaccacg agaacatcat ggcttgcgct 1500ccgttccctg agcgcatcaa gttcattgag gaaaaccacg agaacatcat ggcttgcgct 1500
aagtctccac tggagaacac ttggtgggct gagcaagatt ccccgttctg cttccttgcg 1560aagtctccac tggagaacac ttggtgggct gagcaagatt ccccgttctg cttccttgcg 1560
ttctgctttg agtacgctgg ggtacagcac cacggcctga gctataactg ctcccttccg 1620ttctgctttg agtacgctgg ggtacagcac cacggcctga gctataactg ctcccttccg 1620
ctggcgtttg acgggtcttg ctctggcatc cagcacttct ccgcgatgct ccgagatgag 1680ctggcgtttg acgggtcttg ctctggcatc cagcacttct ccgcgatgct ccgagatgag 1680
gtaggtggtc gcgcggttaa cttgcttcct agtgaaaccg ttcaggacat ctacgggatt 1740gtaggtggtc gcgcggttaa cttgcttcct agtgaaaccg ttcaggacat ctacgggatt 1740
gttgctaaga aagtcaacga gattctacaa gcagacgcaa tcaatgggac cgataacgaa 1800gttgctaaga aagtcaacga gattctacaa gcagacgcaa tcaatgggac cgataacgaa 1800
gtagttaccg tgaccgatga gaacactggt gaaatctctg agaaagtcaa gctgggcact 1860gtagttaccg tgaccgatga gaacactggt gaaatctctg agaaagtcaa gctgggcact 1860
aaggcactgg ctggtcaatg gctggcttac ggtgttactc gcagtgtgac taagcgttca 1920aaggcactgg ctggtcaatg gctggcttac ggtgttactc gcagtgtgac taagcgttca 1920
gtcatgacgc tggcttacgg gtccaaagag ttcggcttcc gtcaacaagt gctggaagat 1980gtcatgacgc tggcttacgg gtccaaagag ttcggcttcc gtcaacaagt gctggaagat 1980
accattcagt gggctattga ttccggcaag ggtctgatgt tcactcagcc gaatcaggct 2040accattcagt gggctattga ttccggcaag ggtctgatgt tcactcagcc gaatcaggct 2040
gctggataca tggctaagct gatttgggaa tctgtgagcg tgacggtggt agctgcggtt 2100gctggataca tggctaagct gatttgggaa tctgtgagcg tgacggtggt agctgcggtt 2100
gaagcaatga actggcttaa gtctgctgct aagctgctgg ctgctgaggt caaagataag 2160gaagcaatga actggcttaa gtctgctgct aagctgctgg ctgctgaggt caaagataag 2160
aagactggag agattcttcg caagcgttgc gctgtgcatt gggtaactcc tgatggtttc 2220aagactggag agattcttcg caagcgttgc gctgtgcatt gggtaactcc tgatggtttc 2220
cctgtgtggc aggaatacaa gaagcctatt cagacgcgct tgaacctgat gttcctcggt 2280cctgtgtggc aggaatacaa gaagcctatt cagacgcgct tgaacctgat gttcctcggt 2280
cagttccgct tacagcctac cattaacacc aacaaagata gcgagattga tgcacacaaa 2340cagttccgct tacagcctac cattaacacc aacaaagata gcgagattga tgcacacaaa 2340
caggagtctg gtatcgctcc taactttgta cacagccaag acggtagcca ccttcgtaag 2400caggagtctg gtatcgctcc taactttgta cacagccaag acggtagcca ccttcgtaag 2400
actgtagtgt gggcacacga gaagtacgga atcgaatctt ttgcactgat tcacgactcc 2460actgtagtgt gggcacacga gaagtacgga atcgaatctt ttgcactgat tcacgactcc 2460
ttcggtacca ttccggctga cgctgcgaac ctgttcaaag cagtgcgcga aactatggtt 2520ttcggtacca ttccggctga cgctgcgaac ctgttcaaag cagtgcgcga aactatggtt 2520
gacacatatg agtcttgtga tgtactggct gatttctacg accagttcgc tgaccagttg 2580gacacatatg agtcttgtga tgtactggct gatttctacg accagttcgc tgaccagttg 2580
cacgagtctc aattggacaa aatgccagca cttccggcta aaggtaactt gaacctccgt 2640cacgagtctc aattggacaa aatgccagca cttccggcta aaggtaactt gaacctccgt 2640
gacatcttag agtcggactt cgcgttcgcg taa 2673gacatcttag agtcggactt cgcgttcgcg taa 2673
<210> 29<210> 29
<211> 890<211> 890
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Вариант T7РНКP<223> T7RNAP variant
<400> 29<400> 29
Met His His His His His His Met Asn Thr Ile Asn Ile Ala Lys Asn Met His His His His His His Met Asn Thr Ile Asn Ile Ala Lys Asn
1 5 10 15 1 5 10 15
Asp Phe Ser Asp Ile Glu Leu Ala Ala Ile Pro Phe Asn Thr Leu Ala Asp Phe Ser Asp Ile Glu Leu Ala Ala Ile Pro Phe Asn Thr Leu Ala
20 25 30 20 25 30
Asp His Tyr Gly Glu Arg Leu Ala Arg Glu Gln Leu Ala Leu Glu His Asp His Tyr Gly Glu Arg Leu Ala Arg Glu Gln Leu Ala Leu Glu His
35 40 45 35 40 45
Glu Ser Tyr Glu Met Gly Glu Ala Arg Phe Arg Lys Met Phe Glu Arg Glu Ser Tyr Glu Met Gly Glu Ala Arg Phe Arg Lys Met Phe Glu Arg
50 55 60 50 55 60
Gln Leu Lys Ala Gly Glu Val Ala Asp Asn Ala Ala Ala Lys Pro Leu Gln Leu Lys Ala Gly Glu Val Ala Asp Asn Ala Ala Ala Lys Pro Leu
65 70 75 80 65 70 75 80
Ile Thr Thr Leu Leu Pro Lys Met Ile Ala Arg Ile Asn Asp Trp Phe Ile Thr Thr Leu Leu Pro Lys Met Ile Ala Arg Ile Asn Asp Trp Phe
85 90 95 85 90 95
Glu Glu Val Lys Ala Lys Arg Gly Lys Arg Pro Thr Ala Phe Gln Phe Glu Glu Val Lys Ala Lys Arg Gly Lys Arg Pro Thr Ala Phe Gln Phe
100 105 110 100 105 110
Leu Gln Glu Ile Lys Pro Glu Ala Val Ala Tyr Ile Thr Ile Lys Thr Leu Gln Glu Ile Lys Pro Glu Ala Val Ala Tyr Ile Thr Ile Lys Thr
115 120 125 115 120 125
Thr Leu Ala Cys Leu Thr Ser Ile Asp Asn Thr Thr Val Gln Ala Val Thr Leu Ala Cys Leu Thr Ser Ile Asp Asn Thr Thr Val Gln Ala Val
130 135 140 130 135 140
Ala Ser Ala Ile Gly Arg Ala Ile Glu Asp Glu Ala Arg Phe Gly Arg Ala Ser Ala Ile Gly Arg Ala Ile Glu Asp Glu Ala Arg Phe Gly Arg
145 150 155 160 145 150 155 160
Ile Arg Asp Leu Glu Ala Lys His Phe Lys Lys Asn Val Glu Glu Gln Ile Arg Asp Leu Glu Ala Lys His Phe Lys Lys Asn Val Glu Glu Gln
165 170 175 165 170 175
Leu Asn Lys Arg Val Gly His Val Tyr Lys Lys Ala Phe Met Gln Val Leu Asn Lys Arg Val Gly His Val Tyr Lys Lys Ala Phe Met Gln Val
180 185 190 180 185 190
Val Glu Ala Asp Met Leu Ser Lys Gly Leu Leu Gly Gly Glu Ala Trp Val Glu Ala Asp Met Leu Ser Lys Gly Leu Leu Gly Gly Glu Ala Trp
195 200 205 195 200 205
Ser Ser Trp His Lys Glu Asp Ser Ile His Val Gly Val Arg Cys Ile Ser Ser Trp His Lys Glu Asp Ser Ile His Val Gly Val Arg Cys Ile
210 215 220 210 215 220
Glu Met Leu Ile Glu Ser Thr Gly Met Val Ser Leu His Arg Gln Asn Glu Met Leu Ile Glu Ser Thr Gly Met Val Ser Leu His Arg Gln Asn
225 230 235 240 225 230 235 240
Ala Gly Val Val Gly Gln Asp Ser Glu Thr Ile Glu Leu Ala Pro Glu Ala Gly Val Val Gly Gln Asp Ser Glu Thr Ile Glu Leu Ala Pro Glu
245 250 255 245 250 255
Tyr Ala Glu Ala Ile Ala Thr Arg Ala Gly Ala Leu Ala Gly Ile Ser Tyr Ala Glu Ala Ile Ala Thr Arg Ala Gly Ala Leu Ala Gly Ile Ser
260 265 270 260 265 270
Pro Met Phe Gln Pro Cys Val Val Pro Pro Lys Pro Trp Thr Gly Ile Pro Met Phe Gln Pro Cys Val Val Pro Pro Lys Pro Trp Thr Gly Ile
275 280 285 275 280 285
Thr Gly Gly Gly Tyr Trp Ala Asn Gly Arg Arg Pro Leu Ala Leu Val Thr Gly Gly Gly Tyr Trp Ala Asn Gly Arg Arg Pro Leu Ala Leu Val
290 295 300 290 295 300
Arg Thr His Ser Lys Lys Ala Leu Met Arg Tyr Glu Asp Val Tyr Met Arg Thr His Ser Lys Lys Ala Leu Met Arg Tyr Glu Asp Val Tyr Met
305 310 315 320 305 310 315 320
Pro Glu Val Tyr Lys Ala Ile Asn Ile Ala Gln Asn Thr Ala Trp Lys Pro Glu Val Tyr Lys Ala Ile Asn Ile Ala Gln Asn Thr Ala Trp Lys
325 330 335 325 330 335
Ile Asn Lys Lys Val Leu Ala Val Ala Asn Val Ile Thr Lys Trp Lys Ile Asn Lys Lys Val Leu Ala Val Ala Asn Val Ile Thr Lys Trp Lys
340 345 350 340 345 350
His Cys Pro Val Glu Asp Ile Pro Ala Ile Glu Arg Glu Glu Leu Pro His Cys Pro Val Glu Asp Ile Pro Ala Ile Glu Arg Glu Glu Leu Pro
355 360 365 355 360 365
Met Lys Pro Glu Asp Ile Asp Met Asn Pro Glu Ala Leu Thr Ala Trp Met Lys Pro Glu Asp Ile Asp Met Asn Pro Glu Ala Leu Thr Ala Trp
370 375 380 370 375 380
Lys Arg Ala Ala Ala Ala Val Tyr Arg Arg Asp Lys Ala Arg Lys Ser Lys Arg Ala Ala Ala Ala Val Tyr Arg Arg Asp Lys Ala Arg Lys Ser
385 390 395 400 385 390 395 400
Arg Arg Ile Tyr Leu Glu Phe Met Leu Glu Gln Ala Asn Lys Phe Ala Arg Arg Ile Tyr Leu Glu Phe Met Leu Glu Gln Ala Asn Lys Phe Ala
405 410 415 405 410 415
Asn His Lys Ala Ile Trp Phe Pro Tyr Asn Met Asp Trp Arg Gly Arg Asn His Lys Ala Ile Trp Phe Pro Tyr Asn Met Asp Trp Arg Gly Arg
420 425 430 420 425 430
Val Tyr Ala Val Ser Met Phe Asn Pro Gln Gly Asn Asp Trp Thr Lys Val Tyr Ala Val Ser Met Phe Asn Pro Gln Gly Asn Asp Trp Thr Lys
435 440 445 435 440 445
Gly Leu Leu Thr Leu Ala Lys Gly Lys Pro Ile Gly Lys Glu Gly Tyr Gly Leu Leu Thr Leu Ala Lys Gly Lys Pro Ile Gly Lys Glu Gly Tyr
450 455 460 450 455 460
Tyr Trp Leu Lys Ile His Gly Ala Asn Cys Ala Gly Val Asp Lys Val Tyr Trp Leu Lys Ile His Gly Ala Asn Cys Ala Gly Val Asp Lys Val
465 470 475 480 465 470 475 480
Pro Phe Pro Glu Arg Ile Lys Phe Ile Glu Glu Asn His Glu Asn Ile Pro Phe Pro Glu Arg Ile Lys Phe Ile Glu Glu Asn His Glu Asn Ile
485 490 495 485 490 495
Met Ala Cys Ala Lys Ser Pro Leu Glu Asn Thr Trp Trp Ala Glu Gln Met Ala Cys Ala Lys Ser Pro Leu Glu Asn Thr Trp Trp Ala Glu Gln
500 505 510 500 505 510
Asp Ser Pro Phe Cys Phe Leu Ala Phe Cys Phe Glu Tyr Ala Gly Val Asp Ser Pro Phe Cys Phe Leu Ala Phe Cys Phe Glu Tyr Ala Gly Val
515 520 525 515 520 525
Gln His His Gly Leu Ser Tyr Asn Cys Ser Leu Pro Leu Ala Phe Asp Gln His His Gly Leu Ser Tyr Asn Cys Ser Leu Pro Leu Ala Phe Asp
530 535 540 530 535 540
Gly Ser Cys Ser Gly Ile Gln His Phe Ser Ala Met Leu Arg Asp Glu Gly Ser Cys Ser Gly Ile Gln His Phe Ser Ala Met Leu Arg Asp Glu
545 550 555 560 545 550 555 560
Val Gly Gly Arg Ala Val Asn Leu Leu Pro Ser Glu Thr Val Gln Asp Val Gly Gly Arg Ala Val Asn Leu Leu Pro Ser Glu Thr Val Gln Asp
565 570 575 565 570 575
Ile Tyr Gly Ile Val Ala Lys Lys Val Asn Glu Ile Leu Gln Ala Asp Ile Tyr Gly Ile Val Ala Lys Lys Val Asn Glu Ile Leu Gln Ala Asp
580 585 590 580 585 590
Ala Ile Asn Gly Thr Asp Asn Glu Val Val Thr Val Thr Asp Glu Asn Ala Ile Asn Gly Thr Asp Asn Glu Val Val Thr Val Thr Asp Glu Asn
595 600 605 595 600 605
Thr Gly Glu Ile Ser Glu Lys Val Lys Leu Gly Thr Lys Ala Leu Ala Thr Gly Glu Ile Ser Glu Lys Val Lys Leu Gly Thr Lys Ala Leu Ala
610 615 620 610 615 620
Gly Gln Trp Leu Ala Tyr Gly Val Thr Arg Ser Val Thr Lys Arg Ser Gly Gln Trp Leu Ala Tyr Gly Val Thr Arg Ser Val Thr Lys Arg Ser
625 630 635 640 625 630 635 640
Val Met Thr Leu Ala Tyr Gly Ser Lys Glu Phe Gly Phe Arg Gln Gln Val Met Thr Leu Ala Tyr Gly Ser Lys Glu Phe Gly Phe Arg Gln Gln
645 650 655 645 650 655
Val Leu Glu Asp Thr Ile Gln Trp Ala Ile Asp Ser Gly Lys Gly Leu Val Leu Glu Asp Thr Ile Gln Trp Ala Ile Asp Ser Gly Lys Gly Leu
660 665 670 660 665 670
Met Phe Thr Gln Pro Asn Gln Ala Ala Gly Tyr Met Ala Lys Leu Ile Met Phe Thr Gln Pro Asn Gln Ala Ala Gly Tyr Met Ala Lys Leu Ile
675 680 685 675 680 685
Trp Glu Ser Val Ser Val Thr Val Val Ala Ala Val Glu Ala Met Asn Trp Glu Ser Val Ser Val Thr Val Val Ala Ala Val Glu Ala Met Asn
690 695 700 690 695 700
Trp Leu Lys Ser Ala Ala Lys Leu Leu Ala Ala Glu Val Lys Asp Lys Trp Leu Lys Ser Ala Ala Lys Leu Leu Ala Ala Glu Val Lys Asp Lys
705 710 715 720 705 710 715 720
Lys Thr Gly Glu Ile Leu Arg Lys Arg Cys Ala Val His Trp Val Thr Lys Thr Gly Glu Ile Leu Arg Lys Arg Cys Ala Val His Trp Val Thr
725 730 735 725 730 735
Pro Asp Gly Phe Pro Val Trp Gln Glu Tyr Lys Lys Pro Ile Gln Thr Pro Asp Gly Phe Pro Val Trp Gln Glu Tyr Lys Lys Pro Ile Gln Thr
740 745 750 740 745 750
Arg Leu Asn Leu Met Phe Leu Gly Gln Phe Arg Leu Gln Pro Thr Ile Arg Leu Asn Leu Met Phe Leu Gly Gln Phe Arg Leu Gln Pro Thr Ile
755 760 765 755 760 765
Asn Thr Asn Lys Asp Ser Glu Ile Asp Ala His Lys Gln Glu Ser Gly Asn Thr Asn Lys Asp Ser Glu Ile Asp Ala His Lys Gln Glu Ser Gly
770 775 780 770 775 780
Ile Ala Pro Asn Phe Val His Ser Gln Asp Gly Ser His Leu Arg Lys Ile Ala Pro Asn Phe Val His Ser Gln Asp Gly Ser His Leu Arg Lys
785 790 795 800 785 790 795 800
Thr Val Val Trp Ala His Glu Lys Tyr Gly Ile Glu Ser Phe Ala Leu Thr Val Val Trp Ala His Glu Lys Tyr Gly Ile Glu Ser Phe Ala Leu
805 810 815 805 810 815
Ile His Asp Ser Phe Gly Thr Ile Pro Ala Asp Ala Ala Asn Leu Phe Ile His Asp Ser Phe Gly Thr Ile Pro Ala Asp Ala Ala Asn Leu Phe
820 825 830 820 825 830
Lys Ala Val Arg Glu Thr Met Val Asp Thr Tyr Glu Ser Cys Asp Val Lys Ala Val Arg Glu Thr Met Val Asp Thr Tyr Glu Ser Cys Asp Val
835 840 845 835 840 845
Leu Ala Asp Phe Tyr Asp Gln Phe Ala Asp Gln Leu His Glu Ser Gln Leu Ala Asp Phe Tyr Asp Gln Phe Ala Asp Gln Leu His Glu Ser Gln
850 855 860 850 855 860
Leu Asp Lys Met Pro Ala Leu Pro Ala Lys Gly Asn Leu Asn Leu Arg Leu Asp Lys Met Pro Ala Leu Pro Ala Lys Gly Asn Leu Asn Leu Arg
865 870 875 880 865 870 875 880
Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala
885 890 885 890
<210> 30<210> 30
<211> 2673<211> 2673
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Вариант T7РНКP<223> T7RNAP variant
<400> 30<400> 30
atgcaccatc accatcacca tatgaacacg attaacatcg ctaagaacga cttctctgac 60atgcaccatc accatcacca tatgaacacg attaacatcg ctaagaacga cttctctgac 60
atcgaactgg ctgctatccc gttcaacact ctggctgacc attacggtga gcgtttagct 120atcgaactgg ctgctatccc gttcaacact ctggctgacc attacggtga gcgtttagct 120
cgcgaacagt tggcccttga gcatgagtct tacgagatgg gtgaagcacg cttccgcaag 180cgcgaacagt tggcccttga gcatgagtct tacgagatgg gtgaagcacg cttccgcaag 180
atgtttgagc gtcaacttaa agctggtgag gttgcggata acgctgccgc caagcctctc 240atgtttgagc gtcaacttaa agctggtgag gttgcggata acgctgccgc caagcctctc 240
atcactaccc tactccctaa gatgattgca cgcatcaacg actggtttga ggaagtgaaa 300atcactaccc tactccctaa gatgattgca cgcatcaacg actggtttga ggaagtgaaa 300
gctaagcgcg gcaagcgccc gacagccttc cagttcctgc aagaaatcaa gccggaagcc 360gctaagcgcg gcaagcgccc gacagccttc cagttcctgc aagaaatcaa gccggaagcc 360
gtagcgtaca tcaccattaa gaccactctg gcttgcctaa ccagtgctga caatacaacc 420gtagcgtaca tcaccattaa gaccactctg gcttgcctaa ccagtgctga caatacaacc 420
gttcaggctg tagcaagcgc aatcggtcgg gccattgagg acgaggctcg cttcggtcgt 480gttcaggctg tagcaagcgc aatcggtcgg gccattgagg acgaggctcg cttcggtcgt 480
atccgtgacc ttgaagctaa gcacttcaag aaaaacgttg aggaacaact caacaagcgc 540atccgtgacc ttgaagctaa gcacttcaag aaaaacgttg aggaacaact caacaagcgc 540
gtagggcacg tctacaagaa agcatttatg caagttgtcg aggctgacat gctctctaag 600gtagggcacg tctacaagaa agcatttatg caagttgtcg aggctgacat gctctctaag 600
ggtctactcg gtggcgaggc gtggtcttcg tggcataagg aagactctat tcatgtagga 660ggtctactcg gtggcgaggc gtggtcttcg tggcataagg aagactctat tcatgtagga 660
gtacgctgca tcgagatgct cattgagtca accggaatgg ttagcttaca ccgccaaaat 720gtacgctgca tcgagatgct cattgagtca accggaatgg ttagcttaca ccgccaaaat 720
gctggcgtag taggtcaaga ctctgagact atcgaactcg cacctgaata cgctgaggct 780gctggcgtag taggtcaaga ctctgagact atcgaactcg cacctgaata cgctgaggct 780
atcgcaaccc gtgcaggtgc gctggctggc atctctccga tgttccaacc ttgcgtagtt 840atcgcaaccc gtgcaggtgc gctggctggc atctctccga tgttccaacc ttgcgtagtt 840
cctcctaagc cgtggactgg cattactggt ggtggctatt gggctaacgg tcgtcgtcct 900cctcctaagc cgtggactgg cattactggt ggtggctatt gggctaacgg tcgtcgtcct 900
ctggcgctgg tgcgtactca cagtaagaaa gcactgatgc gctacgaaga cgtttacatg 960ctggcgctgg tgcgtactca cagtaagaaa gcactgatgc gctacgaaga cgtttacatg 960
cctgaggtgt acaaagcgat taacattgcg caaaacaccg catggaaaat caacaagaaa 10201020
gtcctagcgg tcgccaacgt aatcaccaag tggaagcatt gtccggtcga ggacatccct 1080gtcctagcgg tcgccaacgt aatcaccaag tggaagcatt gtccggtcga ggacatccct 1080
gcgattgagc gtgaagaact cccgatgaaa ccggaagaca tcgacatgaa tcctgaggct 1140gcgattgagc gtgaagaact cccgatgaaa ccggaagaca tcgacatgaa tcctgaggct 1140
ctcaccgcgt ggaaacgtgc tgccgctgct gtgtaccgca aggacaaggc gcgcaagtct 1200ctcaccgcgt ggaaacgtgc tgccgctgct gtgtaccgca aggacaaggc gcgcaagtct 1200
cgccgtatca gccttgagtt catgcttgag caagccaata agtttgctaa ccataaggcc 1260cgccgtatca gccttgagtt catgcttgag caagccaata agtttgctaa ccataaggcc 1260
atctggttcc cttacaacat ggactggcgc ggtcgtgttt acgctgtgtc aatgttcaac 1320atctggttcc cttacaacat ggactggcgc ggtcgtgttt acgctgtgtc aatgttcaac 1320
ccgcaaggta acgatatgac caaaggactg cttacgctgg cgaaaggtaa accaatcggt 1380ccgcaaggta acgatatgac caaaggactg cttacgctgg cgaaaggtaa accaatcggt 1380
aaggaaggtt actactggct gaaaatccac ggtgcaaact gtgcgggtgt cgataaggtt 1440aaggaaggtt actactggct gaaaatccac ggtgcaaact gtgcgggtgt cgataaggtt 1440
ccgttccctg agcgcatcaa gttcattgag gaaaaccacg agaacatcat ggcttgcgct 1500ccgttccctg agcgcatcaa gttcattgag gaaaaccacg agaacatcat ggcttgcgct 1500
aagtctccac tggagaacac ttggtgggct gagcaatggt ctccgttctg cttccttgcg 1560aagtctccac tggagaacac ttggtgggct gagcaatggt ctccgttctg cttccttgcg 1560
ttctgctttg agtacgctgg ggtacagcac cacggcctga gctataactg ctcccttccg 1620ttctgctttg agtacgctgg ggtacagcac cacggcctga gctataactg ctcccttccg 1620
ctggcgtttg acgggtcttg ctctggcatc cagcacttct ccgcgatgct ccgagatgag 1680ctggcgtttg acgggtcttg ctctggcatc cagcacttct ccgcgatgct ccgagatgag 1680
gtaggtggtc gcgcggttaa cttgcttcct agtgaaaccg ttcaggacat ctacgggatt 1740gtaggtggtc gcgcggttaa cttgcttcct agtgaaaccg ttcaggacat ctacgggatt 1740
gttgctaaga aagtcaacga gattctacaa gcagacgcaa tcaatgggac cgataacgaa 1800gttgctaaga aagtcaacga gattctacaa gcagacgcaa tcaatgggac cgataacgaa 1800
gtagttaccg tgaccgatga gaacactggt gaaatctctg agaaagtcaa gctgggcact 1860gtagttaccg tgaccgatga gaacactggt gaaatctctg agaaagtcaa gctgggcact 1860
aaggcactgg ctggtcaatg gctggcttac ggtgttactc gctgggtgac taagcgttca 1920aaggcactgg ctggtcaatg gctggcttac ggtgttactc gctgggtgac taagcgttca 1920
gtcatgacgc tggcttacgg gtccaaagag ttcggcttcc gtcaacaagt gctggaattc 1980gtcatgacgc tggcttacgg gtccaaagag ttcggcttcc gtcaacaagt gctggaattc 1980
accattcagc ctgctattga ttccggcaag ggtctgatgt tcactcagcc gaatcaggct 2040accattcagc ctgctattga ttccggcaag ggtctgatgt tcactcagcc gaatcaggct 2040
gctggataca tggctaagct gatttgggaa tctgtgagcg tgacggtggt agctgcggtt 2100gctggataca tggctaagct gatttgggaa tctgtgagcg tgacggtggt agctgcggtt 2100
gaagcaatga actggcttaa gtctgctgct aagctgctgg ctgctgaggt caaagataag 2160gaagcaatga actggcttaa gtctgctgct aagctgctgg ctgctgaggt caaagataag 2160
aagactggag agattcttcg caagcgttgc gctgtgcatt gggtaactcc tgatggtttc 2220aagactggag agattcttcg caagcgttgc gctgtgcatt gggtaactcc tgatggtttc 2220
cctgtgtggc aggaatacaa gaagcctatt cagacgcgct tgaacctgat gttcctcggt 2280cctgtgtggc aggaatacaa gaagcctatt cagacgcgct tgaacctgat gttcctcggt 2280
cagttccgct tacagcctac cattaacacc aacaaagata gcgagattga tgcacacaaa 2340cagttccgct tacagcctac cattaacacc aacaaagata gcgagattga tgcacacaaa 2340
caggagtctg gtatcgctcc taactttgta cacagccaag acggtagcca ccttcgtaag 2400caggagtctg gtatcgctcc taactttgta cacagccaag acggtagcca ccttcgtaag 2400
actgtagtgt gggcacacga gaagtacgga atcgaatctt ttgcactgat tcacgactcc 2460actgtagtgt gggcacacga gaagtacgga atcgaatctt ttgcactgat tcacgactcc 2460
ttcggtacca ttccggctga cgctgcgaac ctgttcaaag cagtgcgcga aactatggtt 2520ttcggtacca ttccggctga cgctgcgaac ctgttcaaag cagtgcgcga aactatggtt 2520
gacacatatg agtcttgtga tgtactggct gatttctacg accagttcgc tgaccagttg 2580gacacatatg agtcttgtga tgtactggct gatttctacg accagttcgc tgaccagttg 2580
cacgagtctc aattggacaa aatgccagca cttccggcta aaggtaactt gaacctccgt 2640cacgagtctc aattggacaa aatgccagca cttccggcta aaggtaactt gaacctccgt 2640
gacatcttag agtcggactt cgcgttcgcg taa 2673gacatcttag agtcggactt cgcgttcgcg taa 2673
<210> 31<210> 31
<211> 890<211> 890
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Вариант T7РНКP<223> T7RNAP variant
<400> 31<400> 31
Met His His His His His His Met Asn Thr Ile Asn Ile Ala Lys Asn Met His His His His His His Met Asn Thr Ile Asn Ile Ala Lys Asn
1 5 10 15 1 5 10 15
Asp Phe Ser Asp Ile Glu Leu Ala Ala Ile Pro Phe Asn Thr Leu Ala Asp Phe Ser Asp Ile Glu Leu Ala Ala Ile Pro Phe Asn Thr Leu Ala
20 25 30 20 25 30
Asp His Tyr Gly Glu Arg Leu Ala Arg Glu Gln Leu Ala Leu Glu His Asp His Tyr Gly Glu Arg Leu Ala Arg Glu Gln Leu Ala Leu Glu His
35 40 45 35 40 45
Glu Ser Tyr Glu Met Gly Glu Ala Arg Phe Arg Lys Met Phe Glu Arg Glu Ser Tyr Glu Met Gly Glu Ala Arg Phe Arg Lys Met Phe Glu Arg
50 55 60 50 55 60
Gln Leu Lys Ala Gly Glu Val Ala Asp Asn Ala Ala Ala Lys Pro Leu Gln Leu Lys Ala Gly Glu Val Ala Asp Asn Ala Ala Ala Lys Pro Leu
65 70 75 80 65 70 75 80
Ile Thr Thr Leu Leu Pro Lys Met Ile Ala Arg Ile Asn Asp Trp Phe Ile Thr Thr Leu Leu Pro Lys Met Ile Ala Arg Ile Asn Asp Trp Phe
85 90 95 85 90 95
Glu Glu Val Lys Ala Lys Arg Gly Lys Arg Pro Thr Ala Phe Gln Phe Glu Glu Val Lys Ala Lys Arg Gly Lys Arg Pro Thr Ala Phe Gln Phe
100 105 110 100 105 110
Leu Gln Glu Ile Lys Pro Glu Ala Val Ala Tyr Ile Thr Ile Lys Thr Leu Gln Glu Ile Lys Pro Glu Ala Val Ala Tyr Ile Thr Ile Lys Thr
115 120 125 115 120 125
Thr Leu Ala Cys Leu Thr Ser Ala Asp Asn Thr Thr Val Gln Ala Val Thr Leu Ala Cys Leu Thr Ser Ala Asp Asn Thr Thr Val Gln Ala Val
130 135 140 130 135 140
Ala Ser Ala Ile Gly Arg Ala Ile Glu Asp Glu Ala Arg Phe Gly Arg Ala Ser Ala Ile Gly Arg Ala Ile Glu Asp Glu Ala Arg Phe Gly Arg
145 150 155 160 145 150 155 160
Ile Arg Asp Leu Glu Ala Lys His Phe Lys Lys Asn Val Glu Glu Gln Ile Arg Asp Leu Glu Ala Lys His Phe Lys Lys Asn Val Glu Glu Gln
165 170 175 165 170 175
Leu Asn Lys Arg Val Gly His Val Tyr Lys Lys Ala Phe Met Gln Val Leu Asn Lys Arg Val Gly His Val Tyr Lys Lys Ala Phe Met Gln Val
180 185 190 180 185 190
Val Glu Ala Asp Met Leu Ser Lys Gly Leu Leu Gly Gly Glu Ala Trp Val Glu Ala Asp Met Leu Ser Lys Gly Leu Leu Gly Gly Glu Ala Trp
195 200 205 195 200 205
Ser Ser Trp His Lys Glu Asp Ser Ile His Val Gly Val Arg Cys Ile Ser Ser Trp His Lys Glu Asp Ser Ile His Val Gly Val Arg Cys Ile
210 215 220 210 215 220
Glu Met Leu Ile Glu Ser Thr Gly Met Val Ser Leu His Arg Gln Asn Glu Met Leu Ile Glu Ser Thr Gly Met Val Ser Leu His Arg Gln Asn
225 230 235 240 225 230 235 240
Ala Gly Val Val Gly Gln Asp Ser Glu Thr Ile Glu Leu Ala Pro Glu Ala Gly Val Val Gly Gln Asp Ser Glu Thr Ile Glu Leu Ala Pro Glu
245 250 255 245 250 255
Tyr Ala Glu Ala Ile Ala Thr Arg Ala Gly Ala Leu Ala Gly Ile Ser Tyr Ala Glu Ala Ile Ala Thr Arg Ala Gly Ala Leu Ala Gly Ile Ser
260 265 270 260 265 270
Pro Met Phe Gln Pro Cys Val Val Pro Pro Lys Pro Trp Thr Gly Ile Pro Met Phe Gln Pro Cys Val Val Pro Pro Lys Pro Trp Thr Gly Ile
275 280 285 275 280 285
Thr Gly Gly Gly Tyr Trp Ala Asn Gly Arg Arg Pro Leu Ala Leu Val Thr Gly Gly Gly Tyr Trp Ala Asn Gly Arg Arg Pro Leu Ala Leu Val
290 295 300 290 295 300
Arg Thr His Ser Lys Lys Ala Leu Met Arg Tyr Glu Asp Val Tyr Met Arg Thr His Ser Lys Lys Ala Leu Met Arg Tyr Glu Asp Val Tyr Met
305 310 315 320 305 310 315 320
Pro Glu Val Tyr Lys Ala Ile Asn Ile Ala Gln Asn Thr Ala Trp Lys Pro Glu Val Tyr Lys Ala Ile Asn Ile Ala Gln Asn Thr Ala Trp Lys
325 330 335 325 330 335
Ile Asn Lys Lys Val Leu Ala Val Ala Asn Val Ile Thr Lys Trp Lys Ile Asn Lys Lys Val Leu Ala Val Ala Asn Val Ile Thr Lys Trp Lys
340 345 350 340 345 350
His Cys Pro Val Glu Asp Ile Pro Ala Ile Glu Arg Glu Glu Leu Pro His Cys Pro Val Glu Asp Ile Pro Ala Ile Glu Arg Glu Glu Leu Pro
355 360 365 355 360 365
Met Lys Pro Glu Asp Ile Asp Met Asn Pro Glu Ala Leu Thr Ala Trp Met Lys Pro Glu Asp Ile Asp Met Asn Pro Glu Ala Leu Thr Ala Trp
370 375 380 370 375 380
Lys Arg Ala Ala Ala Ala Val Tyr Arg Lys Asp Lys Ala Arg Lys Ser Lys Arg Ala Ala Ala Ala Val Tyr Arg Lys Asp Lys Ala Arg Lys Ser
385 390 395 400 385 390 395 400
Arg Arg Ile Ser Leu Glu Phe Met Leu Glu Gln Ala Asn Lys Phe Ala Arg Arg Ile Ser Leu Glu Phe Met Leu Glu Gln Ala Asn Lys Phe Ala
405 410 415 405 410 415
Asn His Lys Ala Ile Trp Phe Pro Tyr Asn Met Asp Trp Arg Gly Arg Asn His Lys Ala Ile Trp Phe Pro Tyr Asn Met Asp Trp Arg Gly Arg
420 425 430 420 425 430
Val Tyr Ala Val Ser Met Phe Asn Pro Gln Gly Asn Asp Met Thr Lys Val Tyr Ala Val Ser Met Phe Asn Pro Gln Gly Asn Asp Met Thr Lys
435 440 445 435 440 445
Gly Leu Leu Thr Leu Ala Lys Gly Lys Pro Ile Gly Lys Glu Gly Tyr Gly Leu Leu Thr Leu Ala Lys Gly Lys Pro Ile Gly Lys Glu Gly Tyr
450 455 460 450 455 460
Tyr Trp Leu Lys Ile His Gly Ala Asn Cys Ala Gly Val Asp Lys Val Tyr Trp Leu Lys Ile His Gly Ala Asn Cys Ala Gly Val Asp Lys Val
465 470 475 480 465 470 475 480
Pro Phe Pro Glu Arg Ile Lys Phe Ile Glu Glu Asn His Glu Asn Ile Pro Phe Pro Glu Arg Ile Lys Phe Ile Glu Glu Asn His Glu Asn Ile
485 490 495 485 490 495
Met Ala Cys Ala Lys Ser Pro Leu Glu Asn Thr Trp Trp Ala Glu Gln Met Ala Cys Ala Lys Ser Pro Leu Glu Asn Thr Trp Trp Ala Glu Gln
500 505 510 500 505 510
Trp Ser Pro Phe Cys Phe Leu Ala Phe Cys Phe Glu Tyr Ala Gly Val Trp Ser Pro Phe Cys Phe Leu Ala Phe Cys Phe Glu Tyr Ala Gly Val
515 520 525 515 520 525
Gln His His Gly Leu Ser Tyr Asn Cys Ser Leu Pro Leu Ala Phe Asp Gln His His Gly Leu Ser Tyr Asn Cys Ser Leu Pro Leu Ala Phe Asp
530 535 540 530 535 540
Gly Ser Cys Ser Gly Ile Gln His Phe Ser Ala Met Leu Arg Asp Glu Gly Ser Cys Ser Gly Ile Gln His Phe Ser Ala Met Leu Arg Asp Glu
545 550 555 560 545 550 555 560
Val Gly Gly Arg Ala Val Asn Leu Leu Pro Ser Glu Thr Val Gln Asp Val Gly Gly Arg Ala Val Asn Leu Leu Pro Ser Glu Thr Val Gln Asp
565 570 575 565 570 575
Ile Tyr Gly Ile Val Ala Lys Lys Val Asn Glu Ile Leu Gln Ala Asp Ile Tyr Gly Ile Val Ala Lys Lys Val Asn Glu Ile Leu Gln Ala Asp
580 585 590 580 585 590
Ala Ile Asn Gly Thr Asp Asn Glu Val Val Thr Val Thr Asp Glu Asn Ala Ile Asn Gly Thr Asp Asn Glu Val Val Thr Val Thr Asp Glu Asn
595 600 605 595 600 605
Thr Gly Glu Ile Ser Glu Lys Val Lys Leu Gly Thr Lys Ala Leu Ala Thr Gly Glu Ile Ser Glu Lys Val Lys Leu Gly Thr Lys Ala Leu Ala
610 615 620 610 615 620
Gly Gln Trp Leu Ala Tyr Gly Val Thr Arg Trp Val Thr Lys Arg Ser Gly Gln Trp Leu Ala Tyr Gly Val Thr Arg Trp Val Thr Lys Arg Ser
625 630 635 640 625 630 635 640
Val Met Thr Leu Ala Tyr Gly Ser Lys Glu Phe Gly Phe Arg Gln Gln Val Met Thr Leu Ala Tyr Gly Ser Lys Glu Phe Gly Phe Arg Gln Gln
645 650 655 645 650 655
Val Leu Glu Phe Thr Ile Gln Pro Ala Ile Asp Ser Gly Lys Gly Leu Val Leu Glu Phe Thr Ile Gln Pro Ala Ile Asp Ser Gly Lys Gly Leu
660 665 670 660 665 670
Met Phe Thr Gln Pro Asn Gln Ala Ala Gly Tyr Met Ala Lys Leu Ile Met Phe Thr Gln Pro Asn Gln Ala Ala Gly Tyr Met Ala Lys Leu Ile
675 680 685 675 680 685
Trp Glu Ser Val Ser Val Thr Val Val Ala Ala Val Glu Ala Met Asn Trp Glu Ser Val Ser Val Thr Val Val Ala Ala Val Glu Ala Met Asn
690 695 700 690 695 700
Trp Leu Lys Ser Ala Ala Lys Leu Leu Ala Ala Glu Val Lys Asp Lys Trp Leu Lys Ser Ala Ala Lys Leu Leu Ala Ala Glu Val Lys Asp Lys
705 710 715 720 705 710 715 720
Lys Thr Gly Glu Ile Leu Arg Lys Arg Cys Ala Val His Trp Val Thr Lys Thr Gly Glu Ile Leu Arg Lys Arg Cys Ala Val His Trp Val Thr
725 730 735 725 730 735
Pro Asp Gly Phe Pro Val Trp Gln Glu Tyr Lys Lys Pro Ile Gln Thr Pro Asp Gly Phe Pro Val Trp Gln Glu Tyr Lys Lys Pro Ile Gln Thr
740 745 750 740 745 750
Arg Leu Asn Leu Met Phe Leu Gly Gln Phe Arg Leu Gln Pro Thr Ile Arg Leu Asn Leu Met Phe Leu Gly Gln Phe Arg Leu Gln Pro Thr Ile
755 760 765 755 760 765
Asn Thr Asn Lys Asp Ser Glu Ile Asp Ala His Lys Gln Glu Ser Gly Asn Thr Asn Lys Asp Ser Glu Ile Asp Ala His Lys Gln Glu Ser Gly
770 775 780 770 775 780
Ile Ala Pro Asn Phe Val His Ser Gln Asp Gly Ser His Leu Arg Lys Ile Ala Pro Asn Phe Val His Ser Gln Asp Gly Ser His Leu Arg Lys
785 790 795 800 785 790 795 800
Thr Val Val Trp Ala His Glu Lys Tyr Gly Ile Glu Ser Phe Ala Leu Thr Val Val Trp Ala His Glu Lys Tyr Gly Ile Glu Ser Phe Ala Leu
805 810 815 805 810 815
Ile His Asp Ser Phe Gly Thr Ile Pro Ala Asp Ala Ala Asn Leu Phe Ile His Asp Ser Phe Gly Thr Ile Pro Ala Asp Ala Ala Asn Leu Phe
820 825 830 820 825 830
Lys Ala Val Arg Glu Thr Met Val Asp Thr Tyr Glu Ser Cys Asp Val Lys Ala Val Arg Glu Thr Met Val Asp Thr Tyr Glu Ser Cys Asp Val
835 840 845 835 840 845
Leu Ala Asp Phe Tyr Asp Gln Phe Ala Asp Gln Leu His Glu Ser Gln Leu Ala Asp Phe Tyr Asp Gln Phe Ala Asp Gln Leu His Glu Ser Gln
850 855 860 850 855 860
Leu Asp Lys Met Pro Ala Leu Pro Ala Lys Gly Asn Leu Asn Leu Arg Leu Asp Lys Met Pro Ala Leu Pro Ala Lys Gly Asn Leu Asn Leu Arg
865 870 875 880 865 870 875 880
Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala
885 890 885 890
<210> 32<210> 32
<211> 2673<211> 2673
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Вариант T7РНКP<223> T7RNAP variant
<400> 32<400> 32
atgcaccatc accatcacca tatgaacacg attaacatcg ctaagaacga cttctctgac 60atgcaccatc accatcacca tatgaacacg attaacatcg ctaagaacga cttctctgac 60
atcgaactgg ctgctatccc gttcaacact ctggctgacc attacggtga gcgtttagct 120atcgaactgg ctgctatccc gttcaacact ctggctgacc attacggtga gcgtttagct 120
cgcgaacagt tggcccttga gcatgagtct tacgagatgg gtgaagcacg cttccgcaag 180cgcgaacagt tggcccttga gcatgagtct tacgagatgg gtgaagcacg cttccgcaag 180
atgtttgagc gtcaacttaa agctggtgag gttgcggata acgctgccgc caagcctctc 240atgtttgagc gtcaacttaa agctggtgag gttgcggata acgctgccgc caagcctctc 240
atcactaccc tactccctaa gatgattgca cgcatcaacg actggtttga ggaagtgaaa 300atcactaccc tactccctaa gatgattgca cgcatcaacg actggtttga ggaagtgaaa 300
gctaagcgcg gcaagcgccc gacagccttc cagttcctgc aagaaatcaa gccggaagcc 360gctaagcgcg gcaagcgccc gacagccttc cagttcctgc aagaaatcaa gccggaagcc 360
gtagcgtaca tcaccattaa gaccactctg gcttgcctaa ccagtgctga caatacaacc 420gtagcgtaca tcaccattaa gaccactctg gcttgcctaa ccagtgctga caatacaacc 420
gttcaggctg tagcaagcgc aatcggtcgg gccattgagg acgaggctcg cttcggtcgt 480gttcaggctg tagcaagcgc aatcggtcgg gccattgagg acgaggctcg cttcggtcgt 480
atccgtgacc ttgaagctaa gcacttcaag aaaaacgttg aggaacaact caacaagcgc 540atccgtgacc ttgaagctaa gcacttcaag aaaaacgttg aggaacaact caacaagcgc 540
gtagggcacg tctacaagaa agcatttatg caagttgtcg aggctgacat gctctctaag 600gtagggcacg tctacaagaa agcatttatg caagttgtcg aggctgacat gctctctaag 600
ggtctactcg gtggcgaggc gtggtcttcg tggcataagg aagactctat tcatgtagga 660ggtctactcg gtggcgaggc gtggtcttcg tggcataagg aagactctat tcatgtagga 660
gtacgctgca tcgagatgct cattgagtca accggaatgg ttagcttaca ccgccaaaat 720gtacgctgca tcgagatgct cattgagtca accggaatgg ttagcttaca ccgccaaaat 720
gctggcgtag taggtcaaga ctctgagact atcgaactcg cacctgaata cgctgaggct 780gctggcgtag taggtcaaga ctctgagact atcgaactcg cacctgaata cgctgaggct 780
atcgcaaccc gtgcaggtgc gctggctggc atctctccga tgttccaacc ttgcgtagtt 840atcgcaaccc gtgcaggtgc gctggctggc atctctccga tgttccaacc ttgcgtagtt 840
cctcctaagc cgtggactgg cattactggt ggtggctatt gggctaacgg tcgtcgtcct 900cctcctaagc cgtggactgg cattactggt ggtggctatt gggctaacgg tcgtcgtcct 900
ctggcgctgg tgcgtactca cagtaagaaa gcactgatgc gctacgaaga cgtttacatg 960ctggcgctgg tgcgtactca cagtaagaaa gcactgatgc gctacgaaga cgtttacatg 960
cctgaggtgt acaaagcgat taacattgcg caaaacaccg catggaaaat caacaagaaa 10201020
gtcctagcgg tcgccaacgt aatcaccaag tggaagcatt gtccggtcga ggacatccct 1080gtcctagcgg tcgccaacgt aatcaccaag tggaagcatt gtccggtcga ggacatccct 1080
gcgattgagc gtgaagaact cccgatgaaa ccggaagaca tcgacatgaa tcctgaggct 1140gcgattgagc gtgaagaact cccgatgaaa ccggaagaca tcgacatgaa tcctgaggct 1140
ctcaccgcgt ggaaacgtgc tgccgctgct gtgtaccgca aggacaaggc gcgcaagtct 1200ctcaccgcgt ggaaacgtgc tgccgctgct gtgtaccgca aggacaaggc gcgcaagtct 1200
cgccgtatca gccttgagtt catgcttgag caagccaata agtttgctaa ccataaggcc 1260cgccgtatca gccttgagtt catgcttgag caagccaata agtttgctaa ccataaggcc 1260
atctggttcc cttacaacat ggactggcgc ggtcgtgttt acgctgtgtc aatgttcaac 1320atctggttcc cttacaacat ggactggcgc ggtcgtgttt acgctgtgtc aatgttcaac 1320
ccgcaaggta acgatatgac caaaggactg cttacgctgg cgaaaggtaa accaatcggt 1380ccgcaaggta acgatatgac caaaggactg cttacgctgg cgaaaggtaa accaatcggt 1380
aaggaaggtt actactggct gaaaatccac ggtgcaaact gtgcgggtgt cgataaggtt 1440aaggaaggtt actactggct gaaaatccac ggtgcaaact gtgcgggtgt cgataaggtt 1440
ccgttccctg agcgcatcaa gttcattgag gaaaaccacg agaacatcat ggcttgcgct 1500ccgttccctg agcgcatcaa gttcattgag gaaaaccacg agaacatcat ggcttgcgct 1500
aagtctccac tggagaacac ttggtgggct gagcaatatt ctccgttctg cttccttgcg 1560aagtctccac tggagaacac ttggtgggct gagcaatatt ctccgttctg cttccttgcg 1560
ttctgctttg agtacgctgg ggtacagcac cacggcctga gctataactg ctcccttccg 1620ttctgctttg agtacgctgg ggtacagcac cacggcctga gctataactg ctcccttccg 1620
ctggcgtttg acgggtcttg ctctggcatc cagcacttct ccgcgatgct ccgagatgag 1680ctggcgtttg acgggtcttg ctctggcatc cagcacttct ccgcgatgct ccgagatgag 1680
gtaggtggtc gcgcggttaa cttgcttcct agtgaaaccg ttcaggacat ctacgggatt 1740gtaggtggtc gcgcggttaa cttgcttcct agtgaaaccg ttcaggacat ctacgggatt 1740
gttgctaaga aagtcaacga gattctacaa gcagacgcaa tcaatgggac cgataacgaa 1800gttgctaaga aagtcaacga gattctacaa gcagacgcaa tcaatgggac cgataacgaa 1800
gtagttaccg tgaccgatga gaacactggt gaaatctctg agaaagtcaa gctgggcact 1860gtagttaccg tgaccgatga gaacactggt gaaatctctg agaaagtcaa gctgggcact 1860
aaggcactgg ctggtcaatg gctggcttac ggtgttactc gctgggtgac taagcgttca 1920aaggcactgg ctggtcaatg gctggcttac ggtgttactc gctgggtgac taagcgttca 1920
gtcatgacgc tggcttacgg gtccaaagag ttcggcttcc gtcaacaagt gctggaatac 1980gtcatgacgc tggcttacgg gtccaaagag ttcggcttcc gtcaacaagt gctggaatac 1980
accattcagc ctgctattga ttccggcaag ggtctgatgt tcactcagcc gaatcaggct 2040accattcagc ctgctattga ttccggcaag ggtctgatgt tcactcagcc gaatcaggct 2040
gctggataca tggctaagct gatttgggaa tctgtgagcg tgacggtggt agctgcggtt 2100gctggataca tggctaagct gatttgggaa tctgtgagcg tgacggtggt agctgcggtt 2100
gaagcaatga actggcttaa gtctgctgct aagctgctgg ctgctgaggt caaagataag 2160gaagcaatga actggcttaa gtctgctgct aagctgctgg ctgctgaggt caaagataag 2160
aagactggag agattcttcg caagcgttgc gctgtgcatt gggtaactcc tgatggtttc 2220aagactggag agattcttcg caagcgttgc gctgtgcatt gggtaactcc tgatggtttc 2220
cctgtgtggc aggaatacaa gaagcctatt cagacgcgct tgaacctgat gttcctcggt 2280cctgtgtggc aggaatacaa gaagcctatt cagacgcgct tgaacctgat gttcctcggt 2280
cagttccgct tacagcctac cattaacacc aacaaagata gcgagattga tgcacacaaa 2340cagttccgct tacagcctac cattaacacc aacaaagata gcgagattga tgcacacaaa 2340
caggagtctg gtatcgctcc taactttgta cacagccaag acggtagcca ccttcgtaag 2400caggagtctg gtatcgctcc taactttgta cacagccaag acggtagcca ccttcgtaag 2400
actgtagtgt gggcacacga gaagtacgga atcgaatctt ttgcactgat tcacgactcc 2460actgtagtgt gggcacacga gaagtacgga atcgaatctt ttgcactgat tcacgactcc 2460
ttcggtacca ttccggctga cgctgcgaac ctgttcaaag cagtgcgcga aactatggtt 2520ttcggtacca ttccggctga cgctgcgaac ctgttcaaag cagtgcgcga aactatggtt 2520
gacacatatg agtcttgtga tgtactggct gatttctacg accagttcgc tgaccagttg 2580gacacatatg agtcttgtga tgtactggct gatttctacg accagttcgc tgaccagttg 2580
cacgagtctc aattggacaa aatgccagca cttccggcta aaggtaactt gaacctccgt 2640cacgagtctc aattggacaa aatgccagca cttccggcta aaggtaactt gaacctccgt 2640
gacatcttag agtcggactt cgcgttcgcg taa 2673gacatcttag agtcggactt cgcgttcgcg taa 2673
<210> 33<210> 33
<211> 890<211> 890
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Вариант T7РНКP<223> T7RNAP variant
<400> 33<400> 33
Met His His His His His His Met Asn Thr Ile Asn Ile Ala Lys Asn Met His His His His His His Met Asn Thr Ile Asn Ile Ala Lys Asn
1 5 10 15 1 5 10 15
Asp Phe Ser Asp Ile Glu Leu Ala Ala Ile Pro Phe Asn Thr Leu Ala Asp Phe Ser Asp Ile Glu Leu Ala Ala Ile Pro Phe Asn Thr Leu Ala
20 25 30 20 25 30
Asp His Tyr Gly Glu Arg Leu Ala Arg Glu Gln Leu Ala Leu Glu His Asp His Tyr Gly Glu Arg Leu Ala Arg Glu Gln Leu Ala Leu Glu His
35 40 45 35 40 45
Glu Ser Tyr Glu Met Gly Glu Ala Arg Phe Arg Lys Met Phe Glu Arg Glu Ser Tyr Glu Met Gly Glu Ala Arg Phe Arg Lys Met Phe Glu Arg
50 55 60 50 55 60
Gln Leu Lys Ala Gly Glu Val Ala Asp Asn Ala Ala Ala Lys Pro Leu Gln Leu Lys Ala Gly Glu Val Ala Asp Asn Ala Ala Ala Lys Pro Leu
65 70 75 80 65 70 75 80
Ile Thr Thr Leu Leu Pro Lys Met Ile Ala Arg Ile Asn Asp Trp Phe Ile Thr Thr Leu Leu Pro Lys Met Ile Ala Arg Ile Asn Asp Trp Phe
85 90 95 85 90 95
Glu Glu Val Lys Ala Lys Arg Gly Lys Arg Pro Thr Ala Phe Gln Phe Glu Glu Val Lys Ala Lys Arg Gly Lys Arg Pro Thr Ala Phe Gln Phe
100 105 110 100 105 110
Leu Gln Glu Ile Lys Pro Glu Ala Val Ala Tyr Ile Thr Ile Lys Thr Leu Gln Glu Ile Lys Pro Glu Ala Val Ala Tyr Ile Thr Ile Lys Thr
115 120 125 115 120 125
Thr Leu Ala Cys Leu Thr Ser Ala Asp Asn Thr Thr Val Gln Ala Val Thr Leu Ala Cys Leu Thr Ser Ala Asp Asn Thr Thr Val Gln Ala Val
130 135 140 130 135 140
Ala Ser Ala Ile Gly Arg Ala Ile Glu Asp Glu Ala Arg Phe Gly Arg Ala Ser Ala Ile Gly Arg Ala Ile Glu Asp Glu Ala Arg Phe Gly Arg
145 150 155 160 145 150 155 160
Ile Arg Asp Leu Glu Ala Lys His Phe Lys Lys Asn Val Glu Glu Gln Ile Arg Asp Leu Glu Ala Lys His Phe Lys Lys Asn Val Glu Glu Gln
165 170 175 165 170 175
Leu Asn Lys Arg Val Gly His Val Tyr Lys Lys Ala Phe Met Gln Val Leu Asn Lys Arg Val Gly His Val Tyr Lys Lys Ala Phe Met Gln Val
180 185 190 180 185 190
Val Glu Ala Asp Met Leu Ser Lys Gly Leu Leu Gly Gly Glu Ala Trp Val Glu Ala Asp Met Leu Ser Lys Gly Leu Leu Gly Gly Glu Ala Trp
195 200 205 195 200 205
Ser Ser Trp His Lys Glu Asp Ser Ile His Val Gly Val Arg Cys Ile Ser Ser Trp His Lys Glu Asp Ser Ile His Val Gly Val Arg Cys Ile
210 215 220 210 215 220
Glu Met Leu Ile Glu Ser Thr Gly Met Val Ser Leu His Arg Gln Asn Glu Met Leu Ile Glu Ser Thr Gly Met Val Ser Leu His Arg Gln Asn
225 230 235 240 225 230 235 240
Ala Gly Val Val Gly Gln Asp Ser Glu Thr Ile Glu Leu Ala Pro Glu Ala Gly Val Val Gly Gln Asp Ser Glu Thr Ile Glu Leu Ala Pro Glu
245 250 255 245 250 255
Tyr Ala Glu Ala Ile Ala Thr Arg Ala Gly Ala Leu Ala Gly Ile Ser Tyr Ala Glu Ala Ile Ala Thr Arg Ala Gly Ala Leu Ala Gly Ile Ser
260 265 270 260 265 270
Pro Met Phe Gln Pro Cys Val Val Pro Pro Lys Pro Trp Thr Gly Ile Pro Met Phe Gln Pro Cys Val Val Pro Pro Lys Pro Trp Thr Gly Ile
275 280 285 275 280 285
Thr Gly Gly Gly Tyr Trp Ala Asn Gly Arg Arg Pro Leu Ala Leu Val Thr Gly Gly Gly Tyr Trp Ala Asn Gly Arg Arg Pro Leu Ala Leu Val
290 295 300 290 295 300
Arg Thr His Ser Lys Lys Ala Leu Met Arg Tyr Glu Asp Val Tyr Met Arg Thr His Ser Lys Lys Ala Leu Met Arg Tyr Glu Asp Val Tyr Met
305 310 315 320 305 310 315 320
Pro Glu Val Tyr Lys Ala Ile Asn Ile Ala Gln Asn Thr Ala Trp Lys Pro Glu Val Tyr Lys Ala Ile Asn Ile Ala Gln Asn Thr Ala Trp Lys
325 330 335 325 330 335
Ile Asn Lys Lys Val Leu Ala Val Ala Asn Val Ile Thr Lys Trp Lys Ile Asn Lys Lys Val Leu Ala Val Ala Asn Val Ile Thr Lys Trp Lys
340 345 350 340 345 350
His Cys Pro Val Glu Asp Ile Pro Ala Ile Glu Arg Glu Glu Leu Pro His Cys Pro Val Glu Asp Ile Pro Ala Ile Glu Arg Glu Glu Leu Pro
355 360 365 355 360 365
Met Lys Pro Glu Asp Ile Asp Met Asn Pro Glu Ala Leu Thr Ala Trp Met Lys Pro Glu Asp Ile Asp Met Asn Pro Glu Ala Leu Thr Ala Trp
370 375 380 370 375 380
Lys Arg Ala Ala Ala Ala Val Tyr Arg Lys Asp Lys Ala Arg Lys Ser Lys Arg Ala Ala Ala Ala Val Tyr Arg Lys Asp Lys Ala Arg Lys Ser
385 390 395 400 385 390 395 400
Arg Arg Ile Ser Leu Glu Phe Met Leu Glu Gln Ala Asn Lys Phe Ala Arg Arg Ile Ser Leu Glu Phe Met Leu Glu Gln Ala Asn Lys Phe Ala
405 410 415 405 410 415
Asn His Lys Ala Ile Trp Phe Pro Tyr Asn Met Asp Trp Arg Gly Arg Asn His Lys Ala Ile Trp Phe Pro Tyr Asn Met Asp Trp Arg Gly Arg
420 425 430 420 425 430
Val Tyr Ala Val Ser Met Phe Asn Pro Gln Gly Asn Asp Met Thr Lys Val Tyr Ala Val Ser Met Phe Asn Pro Gln Gly Asn Asp Met Thr Lys
435 440 445 435 440 445
Gly Leu Leu Thr Leu Ala Lys Gly Lys Pro Ile Gly Lys Glu Gly Tyr Gly Leu Leu Thr Leu Ala Lys Gly Lys Pro Ile Gly Lys Glu Gly Tyr
450 455 460 450 455 460
Tyr Trp Leu Lys Ile His Gly Ala Asn Cys Ala Gly Val Asp Lys Val Tyr Trp Leu Lys Ile His Gly Ala Asn Cys Ala Gly Val Asp Lys Val
465 470 475 480 465 470 475 480
Pro Phe Pro Glu Arg Ile Lys Phe Ile Glu Glu Asn His Glu Asn Ile Pro Phe Pro Glu Arg Ile Lys Phe Ile Glu Glu Asn His Glu Asn Ile
485 490 495 485 490 495
Met Ala Cys Ala Lys Ser Pro Leu Glu Asn Thr Trp Trp Ala Glu Gln Met Ala Cys Ala Lys Ser Pro Leu Glu Asn Thr Trp Trp Ala Glu Gln
500 505 510 500 505 510
Tyr Ser Pro Phe Cys Phe Leu Ala Phe Cys Phe Glu Tyr Ala Gly Val Tyr Ser Pro Phe Cys Phe Leu Ala Phe Cys Phe Glu Tyr Ala Gly Val
515 520 525 515 520 525
Gln His His Gly Leu Ser Tyr Asn Cys Ser Leu Pro Leu Ala Phe Asp Gln His His Gly Leu Ser Tyr Asn Cys Ser Leu Pro Leu Ala Phe Asp
530 535 540 530 535 540
Gly Ser Cys Ser Gly Ile Gln His Phe Ser Ala Met Leu Arg Asp Glu Gly Ser Cys Ser Gly Ile Gln His Phe Ser Ala Met Leu Arg Asp Glu
545 550 555 560 545 550 555 560
Val Gly Gly Arg Ala Val Asn Leu Leu Pro Ser Glu Thr Val Gln Asp Val Gly Gly Arg Ala Val Asn Leu Leu Pro Ser Glu Thr Val Gln Asp
565 570 575 565 570 575
Ile Tyr Gly Ile Val Ala Lys Lys Val Asn Glu Ile Leu Gln Ala Asp Ile Tyr Gly Ile Val Ala Lys Lys Val Asn Glu Ile Leu Gln Ala Asp
580 585 590 580 585 590
Ala Ile Asn Gly Thr Asp Asn Glu Val Val Thr Val Thr Asp Glu Asn Ala Ile Asn Gly Thr Asp Asn Glu Val Val Thr Val Thr Asp Glu Asn
595 600 605 595 600 605
Thr Gly Glu Ile Ser Glu Lys Val Lys Leu Gly Thr Lys Ala Leu Ala Thr Gly Glu Ile Ser Glu Lys Val Lys Leu Gly Thr Lys Ala Leu Ala
610 615 620 610 615 620
Gly Gln Trp Leu Ala Tyr Gly Val Thr Arg Trp Val Thr Lys Arg Ser Gly Gln Trp Leu Ala Tyr Gly Val Thr Arg Trp Val Thr Lys Arg Ser
625 630 635 640 625 630 635 640
Val Met Thr Leu Ala Tyr Gly Ser Lys Glu Phe Gly Phe Arg Gln Gln Val Met Thr Leu Ala Tyr Gly Ser Lys Glu Phe Gly Phe Arg Gln Gln
645 650 655 645 650 655
Val Leu Glu Tyr Thr Ile Gln Pro Ala Ile Asp Ser Gly Lys Gly Leu Val Leu Glu Tyr Thr Ile Gln Pro Ala Ile Asp Ser Gly Lys Gly Leu
660 665 670 660 665 670
Met Phe Thr Gln Pro Asn Gln Ala Ala Gly Tyr Met Ala Lys Leu Ile Met Phe Thr Gln Pro Asn Gln Ala Ala Gly Tyr Met Ala Lys Leu Ile
675 680 685 675 680 685
Trp Glu Ser Val Ser Val Thr Val Val Ala Ala Val Glu Ala Met Asn Trp Glu Ser Val Ser Val Thr Val Val Ala Ala Val Glu Ala Met Asn
690 695 700 690 695 700
Trp Leu Lys Ser Ala Ala Lys Leu Leu Ala Ala Glu Val Lys Asp Lys Trp Leu Lys Ser Ala Ala Lys Leu Leu Ala Ala Glu Val Lys Asp Lys
705 710 715 720 705 710 715 720
Lys Thr Gly Glu Ile Leu Arg Lys Arg Cys Ala Val His Trp Val Thr Lys Thr Gly Glu Ile Leu Arg Lys Arg Cys Ala Val His Trp Val Thr
725 730 735 725 730 735
Pro Asp Gly Phe Pro Val Trp Gln Glu Tyr Lys Lys Pro Ile Gln Thr Pro Asp Gly Phe Pro Val Trp Gln Glu Tyr Lys Lys Pro Ile Gln Thr
740 745 750 740 745 750
Arg Leu Asn Leu Met Phe Leu Gly Gln Phe Arg Leu Gln Pro Thr Ile Arg Leu Asn Leu Met Phe Leu Gly Gln Phe Arg Leu Gln Pro Thr Ile
755 760 765 755 760 765
Asn Thr Asn Lys Asp Ser Glu Ile Asp Ala His Lys Gln Glu Ser Gly Asn Thr Asn Lys Asp Ser Glu Ile Asp Ala His Lys Gln Glu Ser Gly
770 775 780 770 775 780
Ile Ala Pro Asn Phe Val His Ser Gln Asp Gly Ser His Leu Arg Lys Ile Ala Pro Asn Phe Val His Ser Gln Asp Gly Ser His Leu Arg Lys
785 790 795 800 785 790 795 800
Thr Val Val Trp Ala His Glu Lys Tyr Gly Ile Glu Ser Phe Ala Leu Thr Val Val Trp Ala His Glu Lys Tyr Gly Ile Glu Ser Phe Ala Leu
805 810 815 805 810 815
Ile His Asp Ser Phe Gly Thr Ile Pro Ala Asp Ala Ala Asn Leu Phe Ile His Asp Ser Phe Gly Thr Ile Pro Ala Asp Ala Ala Asn Leu Phe
820 825 830 820 825 830
Lys Ala Val Arg Glu Thr Met Val Asp Thr Tyr Glu Ser Cys Asp Val Lys Ala Val Arg Glu Thr Met Val Asp Thr Tyr Glu Ser Cys Asp Val
835 840 845 835 840 845
Leu Ala Asp Phe Tyr Asp Gln Phe Ala Asp Gln Leu His Glu Ser Gln Leu Ala Asp Phe Tyr Asp Gln Phe Ala Asp Gln Leu His Glu Ser Gln
850 855 860 850 855 860
Leu Asp Lys Met Pro Ala Leu Pro Ala Lys Gly Asn Leu Asn Leu Arg Leu Asp Lys Met Pro Ala Leu Pro Ala Lys Gly Asn Leu Asn Leu Arg
865 870 875 880 865 870 875 880
Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala
885 890 885 890
<210> 34<210> 34
<211> 2673<211> 2673
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Вариант T7РНКP<223> T7RNAP variant
<400> 34<400> 34
atgcaccatc accatcacca tatgaacacg attaacatcg ctaagaacga cttctctgac 60atgcaccatc accatcacca tatgaacacg attaacatcg ctaagaacga cttctctgac 60
atcgaactgg ctgctatccc gttcaacact ctggctgacc attacggtga gcgtttagct 120atcgaactgg ctgctatccc gttcaacact ctggctgacc attacggtga gcgtttagct 120
cgcgaacagt tggcccttga gcatgagtct tacgagatgg gtgaagcacg cttccgcaag 180cgcgaacagt tggcccttga gcatgagtct tacgagatgg gtgaagcacg cttccgcaag 180
atgtttgagc gtcaacttaa agctggtgag gttgcggata acgctgccgc caagcctctc 240atgtttgagc gtcaacttaa agctggtgag gttgcggata acgctgccgc caagcctctc 240
atcactaccc tactccctaa gatgattgca cgcatcaacg actggtttga ggaagtgaaa 300atcactaccc tactccctaa gatgattgca cgcatcaacg actggtttga ggaagtgaaa 300
gctaagcgcg gcaagcgccc gacagccttc cagttcctgc aagaaatcaa gccggaagcc 360gctaagcgcg gcaagcgccc gacagccttc cagttcctgc aagaaatcaa gccggaagcc 360
gtagcgtaca tcaccattaa gaccactctg gcttgcctaa ccagtgcgga caatacaacc 420gtagcgtaca tcaccattaa gaccactctg gcttgcctaa ccagtgcgga caatacaacc 420
gttcaggctg tagcaagcgc aatcggtcgg gccattgagg acgaggctcg cttcggtcgt 480gttcaggctg tagcaagcgc aatcggtcgg gccattgagg acgaggctcg cttcggtcgt 480
atccgtgacc ttgaagctaa gcacttcaag aaaaacgttg aggaacaact caacaagcgc 540atccgtgacc ttgaagctaa gcacttcaag aaaaacgttg aggaacaact caacaagcgc 540
gtagggcacg tctacaagaa agcatttatg caagttgtcg aggctgacat gctctctaag 600gtagggcacg tctacaagaa agcatttatg caagttgtcg aggctgacat gctctctaag 600
ggtctactcg gtggcgaggc gtggtcttcg tggcataagg aagactctat tcatgtagga 660ggtctactcg gtggcgaggc gtggtcttcg tggcataagg aagactctat tcatgtagga 660
gtacgctgca tcgagatgct cattgagtca accggaatgg ttagcttaca ccgccaaaat 720gtacgctgca tcgagatgct cattgagtca accggaatgg ttagcttaca ccgccaaaat 720
gctggcgtag taggtcaaga ctctgagact atcgaactcg cacctgaata cgctgaggct 780gctggcgtag taggtcaaga ctctgagact atcgaactcg cacctgaata cgctgaggct 780
atcgcaaccc gtgcaggtgc gctggctggc atctctccga tgttccaacc ttgcgtagtt 840atcgcaaccc gtgcaggtgc gctggctggc atctctccga tgttccaacc ttgcgtagtt 840
cctcctaagc cgtggactgg cattactggt ggtggctatt gggctaacgg tcgtcgtcct 900cctcctaagc cgtggactgg cattactggt ggtggctatt gggctaacgg tcgtcgtcct 900
ctggcgctgg tgcgtactca cagtaagaaa gcactgatgc gctacgaaga cgtttacatg 960ctggcgctgg tgcgtactca cagtaagaaa gcactgatgc gctacgaaga cgtttacatg 960
cctgaggtgt acaaagcgat taacattgcg caaaacaccg catggaaaat caacaagaaa 10201020
gtcctagcgg tcgccaacgt aatcaccaag tggaagcatt gtccggtcga ggacatccct 1080gtcctagcgg tcgccaacgt aatcaccaag tggaagcatt gtccggtcga ggacatccct 1080
gcgattgagc gtgaagaact cccgatgaaa ccggaagaca tcgacatgaa tcctgaggct 1140gcgattgagc gtgaagaact cccgatgaaa ccggaagaca tcgacatgaa tcctgaggct 1140
ctcaccgcgt ggaaacgtgc tgccgctgct gtgtaccgca aggacaaggc tcgcaagtct 1200ctcaccgcgt ggaaacgtgc tgccgctgct gtgtaccgca aggacaaggc tcgcaagtct 1200
gttcgtatct atcttgagtt catgcttgag caagccaata agtttgctaa ccataaggcc 1260gttcgtatct atcttgagtt catgcttgag caagccaata agtttgctaa ccataaggcc 1260
atctggttcc cttacaacat ggactggcgc ggtcgtgttt acgctgtgtc aatgttcaac 1320atctggttcc cttacaacat ggactggcgc ggtcgtgttt acgctgtgtc aatgttcaac 1320
ccgcaaggta acgatatgac caaaggactg cttacgctgg cgaaaggtaa accaatcggt 1380ccgcaaggta acgatatgac caaaggactg cttacgctgg cgaaaggtaa accaatcggt 1380
aaggaaggtt actactggct gaaaatccac ggtgcaaact gtgcgggtgt cgataaggtt 1440aaggaaggtt actactggct gaaaatccac ggtgcaaact gtgcgggtgt cgataaggtt 1440
ccgttccctg agcgcatcaa gttcattgag gaaaaccacg agaacatcat ggcttgcgct 1500ccgttccctg agcgcatcaa gttcattgag gaaaaccacg agaacatcat ggcttgcgct 1500
aagtctccac tggagaacac ttggtgggct gagcaagatc tcccgttctg cttccttgcg 1560aagtctccac tggagaacac ttggtgggct gagcaagatc tcccgttctg cttccttgcg 1560
ttctgctttg agtacgctgg ggtacagcac cacggcctga gctataactg ctcccttccg 1620ttctgctttg agtacgctgg ggtacagcac cacggcctga gctataactg ctcccttccg 1620
ctggcgtttg acgggtcttg ctctggcatc cagcacttct ccgcgatgct ccgagatgag 1680ctggcgtttg acgggtcttg ctctggcatc cagcacttct ccgcgatgct ccgagatgag 1680
gtaggtggtc gcgcggttaa cttgcttcct agtgaaaccg ttcaggacat ctacgggatt 1740gtaggtggtc gcgcggttaa cttgcttcct agtgaaaccg ttcaggacat ctacgggatt 1740
gttgctaaga aagtcaacga gattctacaa gcagacgcaa tcaatgggac cgataacgaa 1800gttgctaaga aagtcaacga gattctacaa gcagacgcaa tcaatgggac cgataacgaa 1800
gtagttaccg tgaccgatga gaacactggt gaaatctctg agaaagtcaa gctgggcact 1860gtagttaccg tgaccgatga gaacactggt gaaatctctg agaaagtcaa gctgggcact 1860
aaggcactgg ctggtcaatg gctggcttac ggtgttactc gcagtgtgac taagcgttca 1920aaggcactgg ctggtcaatg gctggcttac ggtgttactc gcagtgtgac taagcgttca 1920
gtcatgacgc tggcttacgg gtccaaagag ttcggcttcc gtcaacaagt gctggaagac 1980gtcatgacgc tggcttacgg gtccaaagag ttcggcttcc gtcaacaagt gctggaagac 1980
accattcagt gggctattga ttccggcaag ggtctgatgt tcactcagcc gaatcaggct 2040accattcagt gggctattga ttccggcaag ggtctgatgt tcactcagcc gaatcaggct 2040
gctggataca tggctaagct gatttgggaa tctgtgagcg tgacggtggt agctgcggtt 2100gctggataca tggctaagct gatttgggaa tctgtgagcg tgacggtggt agctgcggtt 2100
gaagcaatga actggcttaa gtctgctgct aagctgctgg ctgctgaggt caaagataag 2160gaagcaatga actggcttaa gtctgctgct aagctgctgg ctgctgaggt caaagataag 2160
aagactggag agattcttcg caagcgttgc gctgtgcatt gggtaactcc tgatggtttc 2220aagactggag agattcttcg caagcgttgc gctgtgcatt gggtaactcc tgatggtttc 2220
cctgtgtggc aggaatacaa gaagcctatt cagacgcgct tgaacctgat gttcctcggt 2280cctgtgtggc aggaatacaa gaagcctatt cagacgcgct tgaacctgat gttcctcggt 2280
cagttccgct tacagcctac cattaacacc aacaaagata gcgagattga tgcacacaaa 2340cagttccgct tacagcctac cattaacacc aacaaagata gcgagattga tgcacacaaa 2340
caggagtctg gtatcgctcc taactttgta cacagccaag acggtagcca ccttcgtaag 2400caggagtctg gtatcgctcc taactttgta cacagccaag acggtagcca ccttcgtaag 2400
actgtagtgt gggcacacga gaagtacgga atcgaatctt ttgcactgat tcacgactcc 2460actgtagtgt gggcacacga gaagtacgga atcgaatctt ttgcactgat tcacgactcc 2460
ttcggtacca ttccggctga cgctgcgaac ctgttcaaag cagtgcgcga aactatggtt 2520ttcggtacca ttccggctga cgctgcgaac ctgttcaaag cagtgcgcga aactatggtt 2520
gacacatatg agtcttgtga tgtactggct gatttctacg accagttcgc tgaccagttg 2580gacacatatg agtcttgtga tgtactggct gatttctacg accagttcgc tgaccagttg 2580
cacgagtctc aattggacaa aatgccagca cttccggcta aaggtaactt gaacctccgt 2640cacgagtctc aattggacaa aatgccagca cttccggcta aaggtaactt gaacctccgt 2640
gacatcttag agtcggactt cgcgttcgcg taa 2673gacatcttag agtcggactt cgcgttcgcg taa 2673
<210> 35<210> 35
<211> 890<211> 890
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Вариант T7РНКP<223> T7RNAP variant
<400> 35<400> 35
Met His His His His His His Met Asn Thr Ile Asn Ile Ala Lys Asn Met His His His His His His Met Asn Thr Ile Asn Ile Ala Lys Asn
1 5 10 15 1 5 10 15
Asp Phe Ser Asp Ile Glu Leu Ala Ala Ile Pro Phe Asn Thr Leu Ala Asp Phe Ser Asp Ile Glu Leu Ala Ala Ile Pro Phe Asn Thr Leu Ala
20 25 30 20 25 30
Asp His Tyr Gly Glu Arg Leu Ala Arg Glu Gln Leu Ala Leu Glu His Asp His Tyr Gly Glu Arg Leu Ala Arg Glu Gln Leu Ala Leu Glu His
35 40 45 35 40 45
Glu Ser Tyr Glu Met Gly Glu Ala Arg Phe Arg Lys Met Phe Glu Arg Glu Ser Tyr Glu Met Gly Glu Ala Arg Phe Arg Lys Met Phe Glu Arg
50 55 60 50 55 60
Gln Leu Lys Ala Gly Glu Val Ala Asp Asn Ala Ala Ala Lys Pro Leu Gln Leu Lys Ala Gly Glu Val Ala Asp Asn Ala Ala Ala Lys Pro Leu
65 70 75 80 65 70 75 80
Ile Thr Thr Leu Leu Pro Lys Met Ile Ala Arg Ile Asn Asp Trp Phe Ile Thr Thr Leu Leu Pro Lys Met Ile Ala Arg Ile Asn Asp Trp Phe
85 90 95 85 90 95
Glu Glu Val Lys Ala Lys Arg Gly Lys Arg Pro Thr Ala Phe Gln Phe Glu Glu Val Lys Ala Lys Arg Gly Lys Arg Pro Thr Ala Phe Gln Phe
100 105 110 100 105 110
Leu Gln Glu Ile Lys Pro Glu Ala Val Ala Tyr Ile Thr Ile Lys Thr Leu Gln Glu Ile Lys Pro Glu Ala Val Ala Tyr Ile Thr Ile Lys Thr
115 120 125 115 120 125
Thr Leu Ala Cys Leu Thr Ser Ala Asp Asn Thr Thr Val Gln Ala Val Thr Leu Ala Cys Leu Thr Ser Ala Asp Asn Thr Thr Val Gln Ala Val
130 135 140 130 135 140
Ala Ser Ala Ile Gly Arg Ala Ile Glu Asp Glu Ala Arg Phe Gly Arg Ala Ser Ala Ile Gly Arg Ala Ile Glu Asp Glu Ala Arg Phe Gly Arg
145 150 155 160 145 150 155 160
Ile Arg Asp Leu Glu Ala Lys His Phe Lys Lys Asn Val Glu Glu Gln Ile Arg Asp Leu Glu Ala Lys His Phe Lys Lys Asn Val Glu Glu Gln
165 170 175 165 170 175
Leu Asn Lys Arg Val Gly His Val Tyr Lys Lys Ala Phe Met Gln Val Leu Asn Lys Arg Val Gly His Val Tyr Lys Lys Ala Phe Met Gln Val
180 185 190 180 185 190
Val Glu Ala Asp Met Leu Ser Lys Gly Leu Leu Gly Gly Glu Ala Trp Val Glu Ala Asp Met Leu Ser Lys Gly Leu Leu Gly Gly Glu Ala Trp
195 200 205 195 200 205
Ser Ser Trp His Lys Glu Asp Ser Ile His Val Gly Val Arg Cys Ile Ser Ser Trp His Lys Glu Asp Ser Ile His Val Gly Val Arg Cys Ile
210 215 220 210 215 220
Glu Met Leu Ile Glu Ser Thr Gly Met Val Ser Leu His Arg Gln Asn Glu Met Leu Ile Glu Ser Thr Gly Met Val Ser Leu His Arg Gln Asn
225 230 235 240 225 230 235 240
Ala Gly Val Val Gly Gln Asp Ser Glu Thr Ile Glu Leu Ala Pro Glu Ala Gly Val Val Gly Gln Asp Ser Glu Thr Ile Glu Leu Ala Pro Glu
245 250 255 245 250 255
Tyr Ala Glu Ala Ile Ala Thr Arg Ala Gly Ala Leu Ala Gly Ile Ser Tyr Ala Glu Ala Ile Ala Thr Arg Ala Gly Ala Leu Ala Gly Ile Ser
260 265 270 260 265 270
Pro Met Phe Gln Pro Cys Val Val Pro Pro Lys Pro Trp Thr Gly Ile Pro Met Phe Gln Pro Cys Val Val Pro Pro Lys Pro Trp Thr Gly Ile
275 280 285 275 280 285
Thr Gly Gly Gly Tyr Trp Ala Asn Gly Arg Arg Pro Leu Ala Leu Val Thr Gly Gly Gly Tyr Trp Ala Asn Gly Arg Arg Pro Leu Ala Leu Val
290 295 300 290 295 300
Arg Thr His Ser Lys Lys Ala Leu Met Arg Tyr Glu Asp Val Tyr Met Arg Thr His Ser Lys Lys Ala Leu Met Arg Tyr Glu Asp Val Tyr Met
305 310 315 320 305 310 315 320
Pro Glu Val Tyr Lys Ala Ile Asn Ile Ala Gln Asn Thr Ala Trp Lys Pro Glu Val Tyr Lys Ala Ile Asn Ile Ala Gln Asn Thr Ala Trp Lys
325 330 335 325 330 335
Ile Asn Lys Lys Val Leu Ala Val Ala Asn Val Ile Thr Lys Trp Lys Ile Asn Lys Lys Val Leu Ala Val Ala Asn Val Ile Thr Lys Trp Lys
340 345 350 340 345 350
His Cys Pro Val Glu Asp Ile Pro Ala Ile Glu Arg Glu Glu Leu Pro His Cys Pro Val Glu Asp Ile Pro Ala Ile Glu Arg Glu Glu Leu Pro
355 360 365 355 360 365
Met Lys Pro Glu Asp Ile Asp Met Asn Pro Glu Ala Leu Thr Ala Trp Met Lys Pro Glu Asp Ile Asp Met Asn Pro Glu Ala Leu Thr Ala Trp
370 375 380 370 375 380
Lys Arg Ala Ala Ala Ala Val Tyr Arg Lys Asp Lys Ala Arg Lys Ser Lys Arg Ala Ala Ala Ala Val Tyr Arg Lys Asp Lys Ala Arg Lys Ser
385 390 395 400 385 390 395 400
Val Arg Ile Tyr Leu Glu Phe Met Leu Glu Gln Ala Asn Lys Phe Ala Val Arg Ile Tyr Leu Glu Phe Met Leu Glu Gln Ala Asn Lys Phe Ala
405 410 415 405 410 415
Asn His Lys Ala Ile Trp Phe Pro Tyr Asn Met Asp Trp Arg Gly Arg Asn His Lys Ala Ile Trp Phe Pro Tyr Asn Met Asp Trp Arg Gly Arg
420 425 430 420 425 430
Val Tyr Ala Val Ser Met Phe Asn Pro Gln Gly Asn Asp Met Thr Lys Val Tyr Ala Val Ser Met Phe Asn Pro Gln Gly Asn Asp Met Thr Lys
435 440 445 435 440 445
Gly Leu Leu Thr Leu Ala Lys Gly Lys Pro Ile Gly Lys Glu Gly Tyr Gly Leu Leu Thr Leu Ala Lys Gly Lys Pro Ile Gly Lys Glu Gly Tyr
450 455 460 450 455 460
Tyr Trp Leu Lys Ile His Gly Ala Asn Cys Ala Gly Val Asp Lys Val Tyr Trp Leu Lys Ile His Gly Ala Asn Cys Ala Gly Val Asp Lys Val
465 470 475 480 465 470 475 480
Pro Phe Pro Glu Arg Ile Lys Phe Ile Glu Glu Asn His Glu Asn Ile Pro Phe Pro Glu Arg Ile Lys Phe Ile Glu Glu Asn His Glu Asn Ile
485 490 495 485 490 495
Met Ala Cys Ala Lys Ser Pro Leu Glu Asn Thr Trp Trp Ala Glu Gln Met Ala Cys Ala Lys Ser Pro Leu Glu Asn Thr Trp Trp Ala Glu Gln
500 505 510 500 505 510
Asp Leu Pro Phe Cys Phe Leu Ala Phe Cys Phe Glu Tyr Ala Gly Val Asp Leu Pro Phe Cys Phe Leu Ala Phe Cys Phe Glu Tyr Ala Gly Val
515 520 525 515 520 525
Gln His His Gly Leu Ser Tyr Asn Cys Ser Leu Pro Leu Ala Phe Asp Gln His His Gly Leu Ser Tyr Asn Cys Ser Leu Pro Leu Ala Phe Asp
530 535 540 530 535 540
Gly Ser Cys Ser Gly Ile Gln His Phe Ser Ala Met Leu Arg Asp Glu Gly Ser Cys Ser Gly Ile Gln His Phe Ser Ala Met Leu Arg Asp Glu
545 550 555 560 545 550 555 560
Val Gly Gly Arg Ala Val Asn Leu Leu Pro Ser Glu Thr Val Gln Asp Val Gly Gly Arg Ala Val Asn Leu Leu Pro Ser Glu Thr Val Gln Asp
565 570 575 565 570 575
Ile Tyr Gly Ile Val Ala Lys Lys Val Asn Glu Ile Leu Gln Ala Asp Ile Tyr Gly Ile Val Ala Lys Lys Val Asn Glu Ile Leu Gln Ala Asp
580 585 590 580 585 590
Ala Ile Asn Gly Thr Asp Asn Glu Val Val Thr Val Thr Asp Glu Asn Ala Ile Asn Gly Thr Asp Asn Glu Val Val Thr Val Thr Asp Glu Asn
595 600 605 595 600 605
Thr Gly Glu Ile Ser Glu Lys Val Lys Leu Gly Thr Lys Ala Leu Ala Thr Gly Glu Ile Ser Glu Lys Val Lys Leu Gly Thr Lys Ala Leu Ala
610 615 620 610 615 620
Gly Gln Trp Leu Ala Tyr Gly Val Thr Arg Ser Val Thr Lys Arg Ser Gly Gln Trp Leu Ala Tyr Gly Val Thr Arg Ser Val Thr Lys Arg Ser
625 630 635 640 625 630 635 640
Val Met Thr Leu Ala Tyr Gly Ser Lys Glu Phe Gly Phe Arg Gln Gln Val Met Thr Leu Ala Tyr Gly Ser Lys Glu Phe Gly Phe Arg Gln Gln
645 650 655 645 650 655
Val Leu Glu Asp Thr Ile Gln Trp Ala Ile Asp Ser Gly Lys Gly Leu Val Leu Glu Asp Thr Ile Gln Trp Ala Ile Asp Ser Gly Lys Gly Leu
660 665 670 660 665 670
Met Phe Thr Gln Pro Asn Gln Ala Ala Gly Tyr Met Ala Lys Leu Ile Met Phe Thr Gln Pro Asn Gln Ala Ala Gly Tyr Met Ala Lys Leu Ile
675 680 685 675 680 685
Trp Glu Ser Val Ser Val Thr Val Val Ala Ala Val Glu Ala Met Asn Trp Glu Ser Val Ser Val Thr Val Val Ala Ala Val Glu Ala Met Asn
690 695 700 690 695 700
Trp Leu Lys Ser Ala Ala Lys Leu Leu Ala Ala Glu Val Lys Asp Lys Trp Leu Lys Ser Ala Ala Lys Leu Leu Ala Ala Glu Val Lys Asp Lys
705 710 715 720 705 710 715 720
Lys Thr Gly Glu Ile Leu Arg Lys Arg Cys Ala Val His Trp Val Thr Lys Thr Gly Glu Ile Leu Arg Lys Arg Cys Ala Val His Trp Val Thr
725 730 735 725 730 735
Pro Asp Gly Phe Pro Val Trp Gln Glu Tyr Lys Lys Pro Ile Gln Thr Pro Asp Gly Phe Pro Val Trp Gln Glu Tyr Lys Lys Pro Ile Gln Thr
740 745 750 740 745 750
Arg Leu Asn Leu Met Phe Leu Gly Gln Phe Arg Leu Gln Pro Thr Ile Arg Leu Asn Leu Met Phe Leu Gly Gln Phe Arg Leu Gln Pro Thr Ile
755 760 765 755 760 765
Asn Thr Asn Lys Asp Ser Glu Ile Asp Ala His Lys Gln Glu Ser Gly Asn Thr Asn Lys Asp Ser Glu Ile Asp Ala His Lys Gln Glu Ser Gly
770 775 780 770 775 780
Ile Ala Pro Asn Phe Val His Ser Gln Asp Gly Ser His Leu Arg Lys Ile Ala Pro Asn Phe Val His Ser Gln Asp Gly Ser His Leu Arg Lys
785 790 795 800 785 790 795 800
Thr Val Val Trp Ala His Glu Lys Tyr Gly Ile Glu Ser Phe Ala Leu Thr Val Val Trp Ala His Glu Lys Tyr Gly Ile Glu Ser Phe Ala Leu
805 810 815 805 810 815
Ile His Asp Ser Phe Gly Thr Ile Pro Ala Asp Ala Ala Asn Leu Phe Ile His Asp Ser Phe Gly Thr Ile Pro Ala Asp Ala Ala Asn Leu Phe
820 825 830 820 825 830
Lys Ala Val Arg Glu Thr Met Val Asp Thr Tyr Glu Ser Cys Asp Val Lys Ala Val Arg Glu Thr Met Val Asp Thr Tyr Glu Ser Cys Asp Val
835 840 845 835 840 845
Leu Ala Asp Phe Tyr Asp Gln Phe Ala Asp Gln Leu His Glu Ser Gln Leu Ala Asp Phe Tyr Asp Gln Phe Ala Asp Gln Leu His Glu Ser Gln
850 855 860 850 855 860
Leu Asp Lys Met Pro Ala Leu Pro Ala Lys Gly Asn Leu Asn Leu Arg Leu Asp Lys Met Pro Ala Leu Pro Ala Lys Gly Asn Leu Asn Leu Arg
865 870 875 880 865 870 875 880
Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala
885 890 885 890
<210> 36<210> 36
<211> 2673<211> 2673
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Вариант T7РНКP<223> T7RNAP variant
<400> 36<400> 36
atgcaccatc accatcacca tatgaacacg attaacatcg ctaagaacga cttctctgac 60atgcaccatc accatcacca tatgaacacg attaacatcg ctaagaacga cttctctgac 60
atcgaactgg ctgctatccc gttcaacact ctggctgacc attacggtga gcgtttagct 120atcgaactgg ctgctatccc gttcaacact ctggctgacc attacggtga gcgtttagct 120
cgcgaacagt tggcccttga gcatgagtct tacgagatgg gtgaagcacg cttccgcaag 180cgcgaacagt tggcccttga gcatgagtct tacgagatgg gtgaagcacg cttccgcaag 180
atgtttgagc gtcaacttaa agctggtgag gttgcggata acgctgccgc caagcctctc 240atgtttgagc gtcaacttaa agctggtgag gttgcggata acgctgccgc caagcctctc 240
atcactaccc tactccctaa gatgattgca cgcatcaacg actggtttga ggaagtgaaa 300atcactaccc tactccctaa gatgattgca cgcatcaacg actggtttga ggaagtgaaa 300
gctaagcgcg gcaagcgccc gacagccttc cagttcctgc aagaaatcaa gccggaagcc 360gctaagcgcg gcaagcgccc gacagccttc cagttcctgc aagaaatcaa gccggaagcc 360
gtagcgtaca tcaccattaa gaccactctg gcttgcctaa ccagtgcgga caatacaacc 420gtagcgtaca tcaccattaa gaccactctg gcttgcctaa ccagtgcgga caatacaacc 420
gttcaggctg tagcaagcgc aatcggtcgg gccattgagg acgaggctcg cttcggtcgt 480gttcaggctg tagcaagcgc aatcggtcgg gccattgagg acgaggctcg cttcggtcgt 480
atccgtgacc ttgaagctaa gcacttcaag aaaaacgttg aggaacaact caacaagcgc 540atccgtgacc ttgaagctaa gcacttcaag aaaaacgttg aggaacaact caacaagcgc 540
gtagggcacg tctacaagaa agcatttatg caagttgtcg aggctgacat gctctctaag 600gtagggcacg tctacaagaa agcatttatg caagttgtcg aggctgacat gctctctaag 600
ggtctactcg gtggcgaggc gtggtcttcg tggcataagg aagactctat tcatgtagga 660ggtctactcg gtggcgaggc gtggtcttcg tggcataagg aagactctat tcatgtagga 660
gtacgctgca tcgagatgct cattgagtca accggaatgg ttagcttaca ccgccaaaat 720gtacgctgca tcgagatgct cattgagtca accggaatgg ttagcttaca ccgccaaaat 720
gctggcgtag taggtcaaga ctctgagact atcgaactcg cacctgaata cgctgaggct 780gctggcgtag taggtcaaga ctctgagact atcgaactcg cacctgaata cgctgaggct 780
atcgcaaccc gtgcaggtgc gctggctggc atctctccga tgttccaacc ttgcgtagtt 840atcgcaaccc gtgcaggtgc gctggctggc atctctccga tgttccaacc ttgcgtagtt 840
cctcctaagc cgtggactgg cattactggt ggtggctatt gggctaacgg tcgtcgtcct 900cctcctaagc cgtggactgg cattactggt ggtggctatt gggctaacgg tcgtcgtcct 900
ctggcgctgg tgcgtactca cagtaagaaa gcactgatgc gctacgaaga cgtttacatg 960ctggcgctgg tgcgtactca cagtaagaaa gcactgatgc gctacgaaga cgtttacatg 960
cctgaggtgt acaaagcgat taacattgcg caaaacaccg catggaaaat caacaagaaa 10201020
gtcctagcgg tcgccaacgt aatcaccaag tggaagcatt gtccggtccg ggacatccct 1080gtcctagcgg tcgccaacgt aatcaccaag tggaagcatt gtccggtccg ggacatccct 1080
gcgattgagc gtgaagaact cccgatgaaa ccggaagaca tcgacatgaa tcctgaggct 1140gcgattgagc gtgaagaact cccgatgaaa ccggaagaca tcgacatgaa tcctgaggct 1140
ctcaccgcgt ggaaacgtgc tgccgctgct gtgtaccgca gagacaaggc tcgcaagtct 1200ctcaccgcgt ggaaacgtgc tgccgctgct gtgtaccgca gagacaaggc tcgcaagtct 1200
gttcgtatct atcttgagtt catgcttgag caagccaata agtttgctaa ccataaggcc 1260gttcgtatct atcttgagtt catgcttgag caagccaata agtttgctaa ccataaggcc 1260
atctggttcc cttacaacat ggactggcgc ggtcgtgttt acgctgtgtc aatgttcaac 1320atctggttcc cttacaacat ggactggcgc ggtcgtgttt acgctgtgtc aatgttcaac 1320
ccgcaaggta acgatatgac caaaggactg cttacgctgg cgaaaggtaa accaatcggt 1380ccgcaaggta acgatatgac caaaggactg cttacgctgg cgaaaggtaa accaatcggt 1380
aaggaaggtt actactggct gaaaatccac ggtgcaaact gtgcgggtgt cgataaggtt 1440aaggaaggtt actactggct gaaaatccac ggtgcaaact gtgcgggtgt cgataaggtt 1440
ccgttccctg agcgcatcaa gttcattgag gaaaaccacg agaacatcat ggcttgcgct 1500ccgttccctg agcgcatcaa gttcattgag gaaaaccacg agaacatcat ggcttgcgct 1500
aagtctccac tggagaacac ttggtgggct gagcaagatc tcccgttctg cttccttgcg 1560aagtctccac tggagaacac ttggtgggct gagcaagatc tcccgttctg cttccttgcg 1560
ttctgctttg agtacgctgg ggtacagcac cacggcctga gctataactg ctcccttccg 1620ttctgctttg agtacgctgg ggtacagcac cacggcctga gctataactg ctcccttccg 1620
ctggcgtttg acgggtcttg ctctggcatc cagcacttct ccgcgatgct ccgagatgag 1680ctggcgtttg acgggtcttg ctctggcatc cagcacttct ccgcgatgct ccgagatgag 1680
gtaggtggtc gcgcggttaa cttgcttcct agtgaaaccg ttcaggacat ctacgggatt 1740gtaggtggtc gcgcggttaa cttgcttcct agtgaaaccg ttcaggacat ctacgggatt 1740
gttgctaaga aagtcaacga gattctacaa gcagacgcaa tcaatgggac cgataacgaa 1800gttgctaaga aagtcaacga gattctacaa gcagacgcaa tcaatgggac cgataacgaa 1800
gtagttaccg tgaccgatga gaacactggt gaaatctctg agaaagtcaa gctgggcact 1860gtagttaccg tgaccgatga gaacactggt gaaatctctg agaaagtcaa gctgggcact 1860
aaggcactgg ctggtcaatg gctggcttac ggtgttactc gcagtgtgac taagcgttca 1920aaggcactgg ctggtcaatg gctggcttac ggtgttactc gcagtgtgac taagcgttca 1920
gtcatgacgc tggcttacgg gtccaaagag ttcggcttcc gtcaacaagt gctggaagat 1980gtcatgacgc tggcttacgg gtccaaagag ttcggcttcc gtcaacaagt gctggaagat 1980
actattcagt gggctattga ttccggcaag ggtctgatgt tcactcagcc gaatcaggct 2040actattcagt gggctattga ttccggcaag ggtctgatgt tcactcagcc gaatcaggct 2040
gctggataca tggctaagct gatttgggaa tctgtgagcg tgacggtggt agctgcggtt 2100gctggataca tggctaagct gatttgggaa tctgtgagcg tgacggtggt agctgcggtt 2100
gaagcaatga actggcttaa gtctgctgct aagctgctgg ctgctgaggt caaagataag 2160gaagcaatga actggcttaa gtctgctgct aagctgctgg ctgctgaggt caaagataag 2160
aagactggag agattcttcg caagcgttgc gctgtgcatt gggtaactcc tgatggtttc 2220aagactggag agattcttcg caagcgttgc gctgtgcatt gggtaactcc tgatggtttc 2220
cctgtgtggc aggaatacaa gaagcctatt cagacgcgct tgaacctgat gttcctcggt 2280cctgtgtggc aggaatacaa gaagcctatt cagacgcgct tgaacctgat gttcctcggt 2280
cagttccgct tacagcctac cattaacacc aacaaagata gcgagattga tgcacacaaa 2340cagttccgct tacagcctac cattaacacc aacaaagata gcgagattga tgcacacaaa 2340
caggagtctg gtatcgctcc taactttgta cacagccaag acggtagcca ccttcgtaag 2400caggagtctg gtatcgctcc taactttgta cacagccaag acggtagcca ccttcgtaag 2400
actgtagtgt gggcacacga gaagtacgga atcgaatctt ttgcactgat tcacgactcc 2460actgtagtgt gggcacacga gaagtacgga atcgaatctt ttgcactgat tcacgactcc 2460
ttcggtacca ttccggctga cgctgcgaac ctgttcaaag cagtgcgcga aactatggtt 2520ttcggtacca ttccggctga cgctgcgaac ctgttcaaag cagtgcgcga aactatggtt 2520
gacacatatg agtcttgtga tgtactggct gatttctacg accagttcgc tgaccagttg 2580gacacatatg agtcttgtga tgtactggct gatttctacg accagttcgc tgaccagttg 2580
cacgagtctc aattggacaa aatgccagca cttccggcta aaggtaactt gaacctccgt 2640cacgagtctc aattggacaa aatgccagca cttccggcta aaggtaactt gaacctccgt 2640
gacatcttag agtcggactt cgcgttcgcg taa 2673gacatcttag agtcggactt cgcgttcgcg taa 2673
<210> 37<210> 37
<211> 890<211> 890
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Вариант T7РНКP<223> T7RNAP variant
<400> 37<400> 37
Met His His His His His His Met Asn Thr Ile Asn Ile Ala Lys Asn Met His His His His His His Met Asn Thr Ile Asn Ile Ala Lys Asn
1 5 10 15 1 5 10 15
Asp Phe Ser Asp Ile Glu Leu Ala Ala Ile Pro Phe Asn Thr Leu Ala Asp Phe Ser Asp Ile Glu Leu Ala Ala Ile Pro Phe Asn Thr Leu Ala
20 25 30 20 25 30
Asp His Tyr Gly Glu Arg Leu Ala Arg Glu Gln Leu Ala Leu Glu His Asp His Tyr Gly Glu Arg Leu Ala Arg Glu Gln Leu Ala Leu Glu His
35 40 45 35 40 45
Glu Ser Tyr Glu Met Gly Glu Ala Arg Phe Arg Lys Met Phe Glu Arg Glu Ser Tyr Glu Met Gly Glu Ala Arg Phe Arg Lys Met Phe Glu Arg
50 55 60 50 55 60
Gln Leu Lys Ala Gly Glu Val Ala Asp Asn Ala Ala Ala Lys Pro Leu Gln Leu Lys Ala Gly Glu Val Ala Asp Asn Ala Ala Ala Lys Pro Leu
65 70 75 80 65 70 75 80
Ile Thr Thr Leu Leu Pro Lys Met Ile Ala Arg Ile Asn Asp Trp Phe Ile Thr Thr Leu Leu Pro Lys Met Ile Ala Arg Ile Asn Asp Trp Phe
85 90 95 85 90 95
Glu Glu Val Lys Ala Lys Arg Gly Lys Arg Pro Thr Ala Phe Gln Phe Glu Glu Val Lys Ala Lys Arg Gly Lys Arg Pro Thr Ala Phe Gln Phe
100 105 110 100 105 110
Leu Gln Glu Ile Lys Pro Glu Ala Val Ala Tyr Ile Thr Ile Lys Thr Leu Gln Glu Ile Lys Pro Glu Ala Val Ala Tyr Ile Thr Ile Lys Thr
115 120 125 115 120 125
Thr Leu Ala Cys Leu Thr Ser Ala Asp Asn Thr Thr Val Gln Ala Val Thr Leu Ala Cys Leu Thr Ser Ala Asp Asn Thr Thr Val Gln Ala Val
130 135 140 130 135 140
Ala Ser Ala Ile Gly Arg Ala Ile Glu Asp Glu Ala Arg Phe Gly Arg Ala Ser Ala Ile Gly Arg Ala Ile Glu Asp Glu Ala Arg Phe Gly Arg
145 150 155 160 145 150 155 160
Ile Arg Asp Leu Glu Ala Lys His Phe Lys Lys Asn Val Glu Glu Gln Ile Arg Asp Leu Glu Ala Lys His Phe Lys Lys Asn Val Glu Glu Gln
165 170 175 165 170 175
Leu Asn Lys Arg Val Gly His Val Tyr Lys Lys Ala Phe Met Gln Val Leu Asn Lys Arg Val Gly His Val Tyr Lys Lys Ala Phe Met Gln Val
180 185 190 180 185 190
Val Glu Ala Asp Met Leu Ser Lys Gly Leu Leu Gly Gly Glu Ala Trp Val Glu Ala Asp Met Leu Ser Lys Gly Leu Leu Gly Gly Glu Ala Trp
195 200 205 195 200 205
Ser Ser Trp His Lys Glu Asp Ser Ile His Val Gly Val Arg Cys Ile Ser Ser Trp His Lys Glu Asp Ser Ile His Val Gly Val Arg Cys Ile
210 215 220 210 215 220
Glu Met Leu Ile Glu Ser Thr Gly Met Val Ser Leu His Arg Gln Asn Glu Met Leu Ile Glu Ser Thr Gly Met Val Ser Leu His Arg Gln Asn
225 230 235 240 225 230 235 240
Ala Gly Val Val Gly Gln Asp Ser Glu Thr Ile Glu Leu Ala Pro Glu Ala Gly Val Val Gly Gln Asp Ser Glu Thr Ile Glu Leu Ala Pro Glu
245 250 255 245 250 255
Tyr Ala Glu Ala Ile Ala Thr Arg Ala Gly Ala Leu Ala Gly Ile Ser Tyr Ala Glu Ala Ile Ala Thr Arg Ala Gly Ala Leu Ala Gly Ile Ser
260 265 270 260 265 270
Pro Met Phe Gln Pro Cys Val Val Pro Pro Lys Pro Trp Thr Gly Ile Pro Met Phe Gln Pro Cys Val Val Pro Pro Lys Pro Trp Thr Gly Ile
275 280 285 275 280 285
Thr Gly Gly Gly Tyr Trp Ala Asn Gly Arg Arg Pro Leu Ala Leu Val Thr Gly Gly Gly Tyr Trp Ala Asn Gly Arg Arg Pro Leu Ala Leu Val
290 295 300 290 295 300
Arg Thr His Ser Lys Lys Ala Leu Met Arg Tyr Glu Asp Val Tyr Met Arg Thr His Ser Lys Lys Ala Leu Met Arg Tyr Glu Asp Val Tyr Met
305 310 315 320 305 310 315 320
Pro Glu Val Tyr Lys Ala Ile Asn Ile Ala Gln Asn Thr Ala Trp Lys Pro Glu Val Tyr Lys Ala Ile Asn Ile Ala Gln Asn Thr Ala Trp Lys
325 330 335 325 330 335
Ile Asn Lys Lys Val Leu Ala Val Ala Asn Val Ile Thr Lys Trp Lys Ile Asn Lys Lys Val Leu Ala Val Ala Asn Val Ile Thr Lys Trp Lys
340 345 350 340 345 350
His Cys Pro Val Arg Asp Ile Pro Ala Ile Glu Arg Glu Glu Leu Pro His Cys Pro Val Arg Asp Ile Pro Ala Ile Glu Arg Glu Glu Leu Pro
355 360 365 355 360 365
Met Lys Pro Glu Asp Ile Asp Met Asn Pro Glu Ala Leu Thr Ala Trp Met Lys Pro Glu Asp Ile Asp Met Asn Pro Glu Ala Leu Thr Ala Trp
370 375 380 370 375 380
Lys Arg Ala Ala Ala Ala Val Tyr Arg Arg Asp Lys Ala Arg Lys Ser Lys Arg Ala Ala Ala Ala Val Tyr Arg Arg Asp Lys Ala Arg Lys Ser
385 390 395 400 385 390 395 400
Val Arg Ile Tyr Leu Glu Phe Met Leu Glu Gln Ala Asn Lys Phe Ala Val Arg Ile Tyr Leu Glu Phe Met Leu Glu Gln Ala Asn Lys Phe Ala
405 410 415 405 410 415
Asn His Lys Ala Ile Trp Phe Pro Tyr Asn Met Asp Trp Arg Gly Arg Asn His Lys Ala Ile Trp Phe Pro Tyr Asn Met Asp Trp Arg Gly Arg
420 425 430 420 425 430
Val Tyr Ala Val Ser Met Phe Asn Pro Gln Gly Asn Asp Met Thr Lys Val Tyr Ala Val Ser Met Phe Asn Pro Gln Gly Asn Asp Met Thr Lys
435 440 445 435 440 445
Gly Leu Leu Thr Leu Ala Lys Gly Lys Pro Ile Gly Lys Glu Gly Tyr Gly Leu Leu Thr Leu Ala Lys Gly Lys Pro Ile Gly Lys Glu Gly Tyr
450 455 460 450 455 460
Tyr Trp Leu Lys Ile His Gly Ala Asn Cys Ala Gly Val Asp Lys Val Tyr Trp Leu Lys Ile His Gly Ala Asn Cys Ala Gly Val Asp Lys Val
465 470 475 480 465 470 475 480
Pro Phe Pro Glu Arg Ile Lys Phe Ile Glu Glu Asn His Glu Asn Ile Pro Phe Pro Glu Arg Ile Lys Phe Ile Glu Glu Asn His Glu Asn Ile
485 490 495 485 490 495
Met Ala Cys Ala Lys Ser Pro Leu Glu Asn Thr Trp Trp Ala Glu Gln Met Ala Cys Ala Lys Ser Pro Leu Glu Asn Thr Trp Trp Ala Glu Gln
500 505 510 500 505 510
Asp Leu Pro Phe Cys Phe Leu Ala Phe Cys Phe Glu Tyr Ala Gly Val Asp Leu Pro Phe Cys Phe Leu Ala Phe Cys Phe Glu Tyr Ala Gly Val
515 520 525 515 520 525
Gln His His Gly Leu Ser Tyr Asn Cys Ser Leu Pro Leu Ala Phe Asp Gln His His Gly Leu Ser Tyr Asn Cys Ser Leu Pro Leu Ala Phe Asp
530 535 540 530 535 540
Gly Ser Cys Ser Gly Ile Gln His Phe Ser Ala Met Leu Arg Asp Glu Gly Ser Cys Ser Gly Ile Gln His Phe Ser Ala Met Leu Arg Asp Glu
545 550 555 560 545 550 555 560
Val Gly Gly Arg Ala Val Asn Leu Leu Pro Ser Glu Thr Val Gln Asp Val Gly Gly Arg Ala Val Asn Leu Leu Pro Ser Glu Thr Val Gln Asp
565 570 575 565 570 575
Ile Tyr Gly Ile Val Ala Lys Lys Val Asn Glu Ile Leu Gln Ala Asp Ile Tyr Gly Ile Val Ala Lys Lys Val Asn Glu Ile Leu Gln Ala Asp
580 585 590 580 585 590
Ala Ile Asn Gly Thr Asp Asn Glu Val Val Thr Val Thr Asp Glu Asn Ala Ile Asn Gly Thr Asp Asn Glu Val Val Thr Val Thr Asp Glu Asn
595 600 605 595 600 605
Thr Gly Glu Ile Ser Glu Lys Val Lys Leu Gly Thr Lys Ala Leu Ala Thr Gly Glu Ile Ser Glu Lys Val Lys Leu Gly Thr Lys Ala Leu Ala
610 615 620 610 615 620
Gly Gln Trp Leu Ala Tyr Gly Val Thr Arg Ser Val Thr Lys Arg Ser Gly Gln Trp Leu Ala Tyr Gly Val Thr Arg Ser Val Thr Lys Arg Ser
625 630 635 640 625 630 635 640
Val Met Thr Leu Ala Tyr Gly Ser Lys Glu Phe Gly Phe Arg Gln Gln Val Met Thr Leu Ala Tyr Gly Ser Lys Glu Phe Gly Phe Arg Gln Gln
645 650 655 645 650 655
Val Leu Glu Asp Thr Ile Gln Trp Ala Ile Asp Ser Gly Lys Gly Leu Val Leu Glu Asp Thr Ile Gln Trp Ala Ile Asp Ser Gly Lys Gly Leu
660 665 670 660 665 670
Met Phe Thr Gln Pro Asn Gln Ala Ala Gly Tyr Met Ala Lys Leu Ile Met Phe Thr Gln Pro Asn Gln Ala Ala Gly Tyr Met Ala Lys Leu Ile
675 680 685 675 680 685
Trp Glu Ser Val Ser Val Thr Val Val Ala Ala Val Glu Ala Met Asn Trp Glu Ser Val Ser Val Thr Val Val Ala Ala Val Glu Ala Met Asn
690 695 700 690 695 700
Trp Leu Lys Ser Ala Ala Lys Leu Leu Ala Ala Glu Val Lys Asp Lys Trp Leu Lys Ser Ala Ala Lys Leu Leu Ala Ala Glu Val Lys Asp Lys
705 710 715 720 705 710 715 720
Lys Thr Gly Glu Ile Leu Arg Lys Arg Cys Ala Val His Trp Val Thr Lys Thr Gly Glu Ile Leu Arg Lys Arg Cys Ala Val His Trp Val Thr
725 730 735 725 730 735
Pro Asp Gly Phe Pro Val Trp Gln Glu Tyr Lys Lys Pro Ile Gln Thr Pro Asp Gly Phe Pro Val Trp Gln Glu Tyr Lys Lys Pro Ile Gln Thr
740 745 750 740 745 750
Arg Leu Asn Leu Met Phe Leu Gly Gln Phe Arg Leu Gln Pro Thr Ile Arg Leu Asn Leu Met Phe Leu Gly Gln Phe Arg Leu Gln Pro Thr Ile
755 760 765 755 760 765
Asn Thr Asn Lys Asp Ser Glu Ile Asp Ala His Lys Gln Glu Ser Gly Asn Thr Asn Lys Asp Ser Glu Ile Asp Ala His Lys Gln Glu Ser Gly
770 775 780 770 775 780
Ile Ala Pro Asn Phe Val His Ser Gln Asp Gly Ser His Leu Arg Lys Ile Ala Pro Asn Phe Val His Ser Gln Asp Gly Ser His Leu Arg Lys
785 790 795 800 785 790 795 800
Thr Val Val Trp Ala His Glu Lys Tyr Gly Ile Glu Ser Phe Ala Leu Thr Val Val Trp Ala His Glu Lys Tyr Gly Ile Glu Ser Phe Ala Leu
805 810 815 805 810 815
Ile His Asp Ser Phe Gly Thr Ile Pro Ala Asp Ala Ala Asn Leu Phe Ile His Asp Ser Phe Gly Thr Ile Pro Ala Asp Ala Ala Asn Leu Phe
820 825 830 820 825 830
Lys Ala Val Arg Glu Thr Met Val Asp Thr Tyr Glu Ser Cys Asp Val Lys Ala Val Arg Glu Thr Met Val Asp Thr Tyr Glu Ser Cys Asp Val
835 840 845 835 840 845
Leu Ala Asp Phe Tyr Asp Gln Phe Ala Asp Gln Leu His Glu Ser Gln Leu Ala Asp Phe Tyr Asp Gln Phe Ala Asp Gln Leu His Glu Ser Gln
850 855 860 850 855 860
Leu Asp Lys Met Pro Ala Leu Pro Ala Lys Gly Asn Leu Asn Leu Arg Leu Asp Lys Met Pro Ala Leu Pro Ala Lys Gly Asn Leu Asn Leu Arg
865 870 875 880 865 870 875 880
Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala
885 890 885 890
<210> 38<210> 38
<211> 2673<211> 2673
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Вариант T7РНКP<223> T7RNAP variant
<400> 38<400> 38
atgcaccatc accatcacca tatgaacacg attaacatcg ctaagaacga cttctctgac 60atgcaccatc accatcacca tatgaacacg attaacatcg ctaagaacga cttctctgac 60
atcgaactgg ctgctatccc gttcaacact ctggctgacc attacggtga gcgtttagct 120atcgaactgg ctgctatccc gttcaacact ctggctgacc attacggtga gcgtttagct 120
cgcgaacagt tggcccttga gcatgagtct tacgagatgg gtgaagcacg cttccgcaag 180cgcgaacagt tggcccttga gcatgagtct tacgagatgg gtgaagcacg cttccgcaag 180
atgtttgagc gtcaacttaa agctggtgag gttgcggata acgctgccgc caagcctctc 240atgtttgagc gtcaacttaa agctggtgag gttgcggata acgctgccgc caagcctctc 240
atcactaccc tactccctaa gatgattgca cgcatcaacg actggtttga ggaagtgaaa 300atcactaccc tactccctaa gatgattgca cgcatcaacg actggtttga ggaagtgaaa 300
gctaagcgcg gcaagcgccc gacagccttc cagttcctgc aagaaatcaa gccggaagcc 360gctaagcgcg gcaagcgccc gacagccttc cagttcctgc aagaaatcaa gccggaagcc 360
gtagcgtaca tcaccattaa gaccactctg gcttgcctaa ccagtgctga caatacaacc 420gtagcgtaca tcaccattaa gaccactctg gcttgcctaa ccagtgctga caatacaacc 420
gttcaggctg tagcaagcgc aatcggtcgg gccattgagg acgaggctcg cttcggtcgt 480gttcaggctg tagcaagcgc aatcggtcgg gccattgagg acgaggctcg cttcggtcgt 480
atccgtgacc ttgaagctaa gcacttcaag aaaaacgttg aggaacaact caacaagcgc 540atccgtgacc ttgaagctaa gcacttcaag aaaaacgttg aggaacaact caacaagcgc 540
gtagggcacg tctacaagaa agcatttatg caagttgtcg aggctgacat gctctctaag 600gtagggcacg tctacaagaa agcatttatg caagttgtcg aggctgacat gctctctaag 600
ggtctactcg gtggcgaggc gtggtcttcg tggcataagg aagactctat tcatgtagga 660ggtctactcg gtggcgaggc gtggtcttcg tggcataagg aagactctat tcatgtagga 660
gtacgctgca tcgagatgct cattgagtca accggaatgg ttagcttaca ccgccaaaat 720gtacgctgca tcgagatgct cattgagtca accggaatgg ttagcttaca ccgccaaaat 720
gctggcgtag taggtcaaga ctctgagact atcgaactcg cacctgaata cgctgaggct 780gctggcgtag taggtcaaga ctctgagact atcgaactcg cacctgaata cgctgaggct 780
atcgcaaccc gtgcaggtgc gctggctggc atctctccga tgttccaacc ttgcgtagtt 840atcgcaaccc gtgcaggtgc gctggctggc atctctccga tgttccaacc ttgcgtagtt 840
cctcctaagc cgtggactgg cattactggt ggtggctatt gggctaacgg tcgtcgtcct 900cctcctaagc cgtggactgg cattactggt ggtggctatt gggctaacgg tcgtcgtcct 900
ctggcgctgg tgcgtactca cagtaagaaa gcactgatgc gctacgaaga cgtttacatg 960ctggcgctgg tgcgtactca cagtaagaaa gcactgatgc gctacgaaga cgtttacatg 960
cctgaggtgt acaaagcgat taacattgcg caaaacaccg catggaaaat caacaagaaa 10201020
gtcctagcgg tcgccaacgt aatcaccaag tggaagcatt gtccggtcga ggacatccct 1080gtcctagcgg tcgccaacgt aatcaccaag tggaagcatt gtccggtcga ggacatccct 1080
gcgattgagc gtgaagaact cccgatgaaa ccggaagaca tcgacatgaa tcctgaggct 1140gcgattgagc gtgaagaact cccgatgaaa ccggaagaca tcgacatgaa tcctgaggct 1140
ctcaccgcgt ggaaacgtgc tgccgctgct gtgtaccgca aggacaaggc gcgcaagtct 1200ctcaccgcgt ggaaacgtgc tgccgctgct gtgtaccgca aggacaaggc gcgcaagtct 1200
cgccgtatca gccttgagtt catgcttgag caagccaata agtttgctaa ccataaggcc 1260cgccgtatca gccttgagtt catgcttgag caagccaata agtttgctaa ccataaggcc 1260
atctggttcc cttacaacat ggactggcgc ggtcgtgttt acgctgtgtc aatgttcaac 1320atctggttcc cttacaacat ggactggcgc ggtcgtgttt acgctgtgtc aatgttcaac 1320
ccgcaaggta acgatatgac caaaggactg cttacgctgg cgaaaggtaa accaatcggt 1380ccgcaaggta acgatatgac caaaggactg cttacgctgg cgaaaggtaa accaatcggt 1380
aaggaaggtt actactggct gaaaatccac ggtgcaaact gtgcgggtgt cgataaggtt 1440aaggaaggtt actactggct gaaaatccac ggtgcaaact gtgcgggtgt cgataaggtt 1440
ccgttccctg agcgcatcaa gttcattgag gaaaaccacg agaacatcat ggcttgcgct 1500ccgttccctg agcgcatcaa gttcattgag gaaaaccacg agaacatcat ggcttgcgct 1500
aagtctccac tggagaacac ttggtgggct gagcaatatt ctccgttctg cttccttgcg 1560aagtctccac tggagaacac ttggtgggct gagcaatatt ctccgttctg cttccttgcg 1560
ttctgctttg agtacgctgg ggtacagcac cacggcctga gctataactg ctcccttccg 1620ttctgctttg agtacgctgg ggtacagcac cacggcctga gctataactg ctcccttccg 1620
ctggcgtttg acgggtcttg ctctggcatc cagcacttct ccgcgatgct ccgagatgag 1680ctggcgtttg acgggtcttg ctctggcatc cagcacttct ccgcgatgct ccgagatgag 1680
gtaggtggtc gcgcggttaa cttgcttcct agtgaaaccg ttcaggacat ctacgggatt 1740gtaggtggtc gcgcggttaa cttgcttcct agtgaaaccg ttcaggacat ctacgggatt 1740
gttgctaaga aagtcaacga gattctacaa gcagacgcaa tcaatgggac cgataacgaa 1800gttgctaaga aagtcaacga gattctacaa gcagacgcaa tcaatgggac cgataacgaa 1800
gtagttaccg tgaccgatga gaacactggt gaaatctctg agaaagtcaa gctgggcact 1860gtagttaccg tgaccgatga gaacactggt gaaatctctg agaaagtcaa gctgggcact 1860
aaggcactgg ctggtcaatg gctggcttac ggtgttactc gctgggtgac taagcgttca 1920aaggcactgg ctggtcaatg gctggcttac ggtgttactc gctgggtgac taagcgttca 1920
gtcatgacgc tggcttacgg gtccaaagag ttcggcttcc gtcaacaagt gctggaattc 1980gtcatgacgc tggcttacgg gtccaaagag ttcggcttcc gtcaacaagt gctggaattc 1980
accattcagc ctgctattga ttccggcaag ggtctgatgt tcactcagcc gaatcaggct 2040accattcagc ctgctattga ttccggcaag ggtctgatgt tcactcagcc gaatcaggct 2040
gctggataca tggctaagct gatttgggaa tctgtgagcg tgacggtggt agctgcggtt 2100gctggataca tggctaagct gatttgggaa tctgtgagcg tgacggtggt agctgcggtt 2100
gaagcaatga actggcttaa gtctgctgct aagctgctgg ctgctgaggt caaagataag 2160gaagcaatga actggcttaa gtctgctgct aagctgctgg ctgctgaggt caaagataag 2160
aagactggag agattcttcg caagcgttgc gctgtgcatt gggtaactcc tgatggtttc 2220aagactggag agattcttcg caagcgttgc gctgtgcatt gggtaactcc tgatggtttc 2220
cctgtgtggc aggaatacaa gaagcctatt cagacgcgct tgaacctgat gttcctcggt 2280cctgtgtggc aggaatacaa gaagcctatt cagacgcgct tgaacctgat gttcctcggt 2280
cagttccgct tacagcctac cattaacacc aacaaagata gcgagattga tgcacacaaa 2340cagttccgct tacagcctac cattaacacc aacaaagata gcgagattga tgcacacaaa 2340
caggagtctg gtatcgctcc taactttgta cacagccaag acggtagcca ccttcgtaag 2400caggagtctg gtatcgctcc taactttgta cacagccaag acggtagcca ccttcgtaag 2400
actgtagtgt gggcacacga gaagtacgga atcgaatctt ttgcactgat tcacgactcc 2460actgtagtgt gggcacacga gaagtacgga atcgaatctt ttgcactgat tcacgactcc 2460
ttcggtacca ttccggctga cgctgcgaac ctgttcaaag cagtgcgcga aactatggtt 2520ttcggtacca ttccggctga cgctgcgaac ctgttcaaag cagtgcgcga aactatggtt 2520
gacacatatg agtcttgtga tgtactggct gatttctacg accagttcgc tgaccagttg 2580gacacatatg agtcttgtga tgtactggct gatttctacg accagttcgc tgaccagttg 2580
cacgagtctc aattggacaa aatgccagca cttccggcta aaggtaactt gaacctccgt 2640cacgagtctc aattggacaa aatgccagca cttccggcta aaggtaactt gaacctccgt 2640
gacatcttag agtcggactt cgcgttcgcg taa 2673gacatcttag agtcggactt cgcgttcgcg taa 2673
<210> 39<210> 39
<211> 890<211> 890
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Вариант T7РНКP<223> T7RNAP variant
<400> 39<400> 39
Met His His His His His His Met Asn Thr Ile Asn Ile Ala Lys Asn Met His His His His His His Met Asn Thr Ile Asn Ile Ala Lys Asn
1 5 10 15 1 5 10 15
Asp Phe Ser Asp Ile Glu Leu Ala Ala Ile Pro Phe Asn Thr Leu Ala Asp Phe Ser Asp Ile Glu Leu Ala Ala Ile Pro Phe Asn Thr Leu Ala
20 25 30 20 25 30
Asp His Tyr Gly Glu Arg Leu Ala Arg Glu Gln Leu Ala Leu Glu His Asp His Tyr Gly Glu Arg Leu Ala Arg Glu Gln Leu Ala Leu Glu His
35 40 45 35 40 45
Glu Ser Tyr Glu Met Gly Glu Ala Arg Phe Arg Lys Met Phe Glu Arg Glu Ser Tyr Glu Met Gly Glu Ala Arg Phe Arg Lys Met Phe Glu Arg
50 55 60 50 55 60
Gln Leu Lys Ala Gly Glu Val Ala Asp Asn Ala Ala Ala Lys Pro Leu Gln Leu Lys Ala Gly Glu Val Ala Asp Asn Ala Ala Ala Lys Pro Leu
65 70 75 80 65 70 75 80
Ile Thr Thr Leu Leu Pro Lys Met Ile Ala Arg Ile Asn Asp Trp Phe Ile Thr Thr Leu Leu Pro Lys Met Ile Ala Arg Ile Asn Asp Trp Phe
85 90 95 85 90 95
Glu Glu Val Lys Ala Lys Arg Gly Lys Arg Pro Thr Ala Phe Gln Phe Glu Glu Val Lys Ala Lys Arg Gly Lys Arg Pro Thr Ala Phe Gln Phe
100 105 110 100 105 110
Leu Gln Glu Ile Lys Pro Glu Ala Val Ala Tyr Ile Thr Ile Lys Thr Leu Gln Glu Ile Lys Pro Glu Ala Val Ala Tyr Ile Thr Ile Lys Thr
115 120 125 115 120 125
Thr Leu Ala Cys Leu Thr Ser Ala Asp Asn Thr Thr Val Gln Ala Val Thr Leu Ala Cys Leu Thr Ser Ala Asp Asn Thr Thr Val Gln Ala Val
130 135 140 130 135 140
Ala Ser Ala Ile Gly Arg Ala Ile Glu Asp Glu Ala Arg Phe Gly Arg Ala Ser Ala Ile Gly Arg Ala Ile Glu Asp Glu Ala Arg Phe Gly Arg
145 150 155 160 145 150 155 160
Ile Arg Asp Leu Glu Ala Lys His Phe Lys Lys Asn Val Glu Glu Gln Ile Arg Asp Leu Glu Ala Lys His Phe Lys Lys Asn Val Glu Glu Gln
165 170 175 165 170 175
Leu Asn Lys Arg Val Gly His Val Tyr Lys Lys Ala Phe Met Gln Val Leu Asn Lys Arg Val Gly His Val Tyr Lys Lys Ala Phe Met Gln Val
180 185 190 180 185 190
Val Glu Ala Asp Met Leu Ser Lys Gly Leu Leu Gly Gly Glu Ala Trp Val Glu Ala Asp Met Leu Ser Lys Gly Leu Leu Gly Gly Glu Ala Trp
195 200 205 195 200 205
Ser Ser Trp His Lys Glu Asp Ser Ile His Val Gly Val Arg Cys Ile Ser Ser Trp His Lys Glu Asp Ser Ile His Val Gly Val Arg Cys Ile
210 215 220 210 215 220
Glu Met Leu Ile Glu Ser Thr Gly Met Val Ser Leu His Arg Gln Asn Glu Met Leu Ile Glu Ser Thr Gly Met Val Ser Leu His Arg Gln Asn
225 230 235 240 225 230 235 240
Ala Gly Val Val Gly Gln Asp Ser Glu Thr Ile Glu Leu Ala Pro Glu Ala Gly Val Val Gly Gln Asp Ser Glu Thr Ile Glu Leu Ala Pro Glu
245 250 255 245 250 255
Tyr Ala Glu Ala Ile Ala Thr Arg Ala Gly Ala Leu Ala Gly Ile Ser Tyr Ala Glu Ala Ile Ala Thr Arg Ala Gly Ala Leu Ala Gly Ile Ser
260 265 270 260 265 270
Pro Met Phe Gln Pro Cys Val Val Pro Pro Lys Pro Trp Thr Gly Ile Pro Met Phe Gln Pro Cys Val Val Pro Pro Lys Pro Trp Thr Gly Ile
275 280 285 275 280 285
Thr Gly Gly Gly Tyr Trp Ala Asn Gly Arg Arg Pro Leu Ala Leu Val Thr Gly Gly Gly Tyr Trp Ala Asn Gly Arg Arg Pro Leu Ala Leu Val
290 295 300 290 295 300
Arg Thr His Ser Lys Lys Ala Leu Met Arg Tyr Glu Asp Val Tyr Met Arg Thr His Ser Lys Lys Ala Leu Met Arg Tyr Glu Asp Val Tyr Met
305 310 315 320 305 310 315 320
Pro Glu Val Tyr Lys Ala Ile Asn Ile Ala Gln Asn Thr Ala Trp Lys Pro Glu Val Tyr Lys Ala Ile Asn Ile Ala Gln Asn Thr Ala Trp Lys
325 330 335 325 330 335
Ile Asn Lys Lys Val Leu Ala Val Ala Asn Val Ile Thr Lys Trp Lys Ile Asn Lys Lys Val Leu Ala Val Ala Asn Val Ile Thr Lys Trp Lys
340 345 350 340 345 350
His Cys Pro Val Glu Asp Ile Pro Ala Ile Glu Arg Glu Glu Leu Pro His Cys Pro Val Glu Asp Ile Pro Ala Ile Glu Arg Glu Glu Leu Pro
355 360 365 355 360 365
Met Lys Pro Glu Asp Ile Asp Met Asn Pro Glu Ala Leu Thr Ala Trp Met Lys Pro Glu Asp Ile Asp Met Asn Pro Glu Ala Leu Thr Ala Trp
370 375 380 370 375 380
Lys Arg Ala Ala Ala Ala Val Tyr Arg Lys Asp Lys Ala Arg Lys Ser Lys Arg Ala Ala Ala Ala Val Tyr Arg Lys Asp Lys Ala Arg Lys Ser
385 390 395 400 385 390 395 400
Arg Arg Ile Ser Leu Glu Phe Met Leu Glu Gln Ala Asn Lys Phe Ala Arg Arg Ile Ser Leu Glu Phe Met Leu Glu Gln Ala Asn Lys Phe Ala
405 410 415 405 410 415
Asn His Lys Ala Ile Trp Phe Pro Tyr Asn Met Asp Trp Arg Gly Arg Asn His Lys Ala Ile Trp Phe Pro Tyr Asn Met Asp Trp Arg Gly Arg
420 425 430 420 425 430
Val Tyr Ala Val Ser Met Phe Asn Pro Gln Gly Asn Asp Met Thr Lys Val Tyr Ala Val Ser Met Phe Asn Pro Gln Gly Asn Asp Met Thr Lys
435 440 445 435 440 445
Gly Leu Leu Thr Leu Ala Lys Gly Lys Pro Ile Gly Lys Glu Gly Tyr Gly Leu Leu Thr Leu Ala Lys Gly Lys Pro Ile Gly Lys Glu Gly Tyr
450 455 460 450 455 460
Tyr Trp Leu Lys Ile His Gly Ala Asn Cys Ala Gly Val Asp Lys Val Tyr Trp Leu Lys Ile His Gly Ala Asn Cys Ala Gly Val Asp Lys Val
465 470 475 480 465 470 475 480
Pro Phe Pro Glu Arg Ile Lys Phe Ile Glu Glu Asn His Glu Asn Ile Pro Phe Pro Glu Arg Ile Lys Phe Ile Glu Glu Asn His Glu Asn Ile
485 490 495 485 490 495
Met Ala Cys Ala Lys Ser Pro Leu Glu Asn Thr Trp Trp Ala Glu Gln Met Ala Cys Ala Lys Ser Pro Leu Glu Asn Thr Trp Trp Ala Glu Gln
500 505 510 500 505 510
Tyr Ser Pro Phe Cys Phe Leu Ala Phe Cys Phe Glu Tyr Ala Gly Val Tyr Ser Pro Phe Cys Phe Leu Ala Phe Cys Phe Glu Tyr Ala Gly Val
515 520 525 515 520 525
Gln His His Gly Leu Ser Tyr Asn Cys Ser Leu Pro Leu Ala Phe Asp Gln His His Gly Leu Ser Tyr Asn Cys Ser Leu Pro Leu Ala Phe Asp
530 535 540 530 535 540
Gly Ser Cys Ser Gly Ile Gln His Phe Ser Ala Met Leu Arg Asp Glu Gly Ser Cys Ser Gly Ile Gln His Phe Ser Ala Met Leu Arg Asp Glu
545 550 555 560 545 550 555 560
Val Gly Gly Arg Ala Val Asn Leu Leu Pro Ser Glu Thr Val Gln Asp Val Gly Gly Arg Ala Val Asn Leu Leu Pro Ser Glu Thr Val Gln Asp
565 570 575 565 570 575
Ile Tyr Gly Ile Val Ala Lys Lys Val Asn Glu Ile Leu Gln Ala Asp Ile Tyr Gly Ile Val Ala Lys Lys Val Asn Glu Ile Leu Gln Ala Asp
580 585 590 580 585 590
Ala Ile Asn Gly Thr Asp Asn Glu Val Val Thr Val Thr Asp Glu Asn Ala Ile Asn Gly Thr Asp Asn Glu Val Val Thr Val Thr Asp Glu Asn
595 600 605 595 600 605
Thr Gly Glu Ile Ser Glu Lys Val Lys Leu Gly Thr Lys Ala Leu Ala Thr Gly Glu Ile Ser Glu Lys Val Lys Leu Gly Thr Lys Ala Leu Ala
610 615 620 610 615 620
Gly Gln Trp Leu Ala Tyr Gly Val Thr Arg Trp Val Thr Lys Arg Ser Gly Gln Trp Leu Ala Tyr Gly Val Thr Arg Trp Val Thr Lys Arg Ser
625 630 635 640 625 630 635 640
Val Met Thr Leu Ala Tyr Gly Ser Lys Glu Phe Gly Phe Arg Gln Gln Val Met Thr Leu Ala Tyr Gly Ser Lys Glu Phe Gly Phe Arg Gln Gln
645 650 655 645 650 655
Val Leu Glu Phe Thr Ile Gln Pro Ala Ile Asp Ser Gly Lys Gly Leu Val Leu Glu Phe Thr Ile Gln Pro Ala Ile Asp Ser Gly Lys Gly Leu
660 665 670 660 665 670
Met Phe Thr Gln Pro Asn Gln Ala Ala Gly Tyr Met Ala Lys Leu Ile Met Phe Thr Gln Pro Asn Gln Ala Ala Gly Tyr Met Ala Lys Leu Ile
675 680 685 675 680 685
Trp Glu Ser Val Ser Val Thr Val Val Ala Ala Val Glu Ala Met Asn Trp Glu Ser Val Ser Val Thr Val Val Ala Ala Val Glu Ala Met Asn
690 695 700 690 695 700
Trp Leu Lys Ser Ala Ala Lys Leu Leu Ala Ala Glu Val Lys Asp Lys Trp Leu Lys Ser Ala Ala Lys Leu Leu Ala Ala Glu Val Lys Asp Lys
705 710 715 720 705 710 715 720
Lys Thr Gly Glu Ile Leu Arg Lys Arg Cys Ala Val His Trp Val Thr Lys Thr Gly Glu Ile Leu Arg Lys Arg Cys Ala Val His Trp Val Thr
725 730 735 725 730 735
Pro Asp Gly Phe Pro Val Trp Gln Glu Tyr Lys Lys Pro Ile Gln Thr Pro Asp Gly Phe Pro Val Trp Gln Glu Tyr Lys Lys Pro Ile Gln Thr
740 745 750 740 745 750
Arg Leu Asn Leu Met Phe Leu Gly Gln Phe Arg Leu Gln Pro Thr Ile Arg Leu Asn Leu Met Phe Leu Gly Gln Phe Arg Leu Gln Pro Thr Ile
755 760 765 755 760 765
Asn Thr Asn Lys Asp Ser Glu Ile Asp Ala His Lys Gln Glu Ser Gly Asn Thr Asn Lys Asp Ser Glu Ile Asp Ala His Lys Gln Glu Ser Gly
770 775 780 770 775 780
Ile Ala Pro Asn Phe Val His Ser Gln Asp Gly Ser His Leu Arg Lys Ile Ala Pro Asn Phe Val His Ser Gln Asp Gly Ser His Leu Arg Lys
785 790 795 800 785 790 795 800
Thr Val Val Trp Ala His Glu Lys Tyr Gly Ile Glu Ser Phe Ala Leu Thr Val Val Trp Ala His Glu Lys Tyr Gly Ile Glu Ser Phe Ala Leu
805 810 815 805 810 815
Ile His Asp Ser Phe Gly Thr Ile Pro Ala Asp Ala Ala Asn Leu Phe Ile His Asp Ser Phe Gly Thr Ile Pro Ala Asp Ala Ala Asn Leu Phe
820 825 830 820 825 830
Lys Ala Val Arg Glu Thr Met Val Asp Thr Tyr Glu Ser Cys Asp Val Lys Ala Val Arg Glu Thr Met Val Asp Thr Tyr Glu Ser Cys Asp Val
835 840 845 835 840 845
Leu Ala Asp Phe Tyr Asp Gln Phe Ala Asp Gln Leu His Glu Ser Gln Leu Ala Asp Phe Tyr Asp Gln Phe Ala Asp Gln Leu His Glu Ser Gln
850 855 860 850 855 860
Leu Asp Lys Met Pro Ala Leu Pro Ala Lys Gly Asn Leu Asn Leu Arg Leu Asp Lys Met Pro Ala Leu Pro Ala Lys Gly Asn Leu Asn Leu Arg
865 870 875 880 865 870 875 880
Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala
885 890 885 890
<210> 40<210> 40
<211> 25<211> 25
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Субстрат и т.д.<223> Substrate, etc.
<400> 40<400> 40
tttttttttt tttttttttt ttttt 25tttttttttt tttttttttt tttttt 25
<---<---
Claims (52)
Applications Claiming Priority (5)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201762527764P | 2017-06-30 | 2017-06-30 | |
| US62/527,764 | 2017-06-30 | ||
| US201762528846P | 2017-07-05 | 2017-07-05 | |
| US62/528,846 | 2017-07-05 | ||
| PCT/US2018/038288 WO2019005540A1 (en) | 2017-06-30 | 2018-06-19 | T7 rna polymerase variants |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| RU2020103726A RU2020103726A (en) | 2021-07-30 |
| RU2020103726A3 RU2020103726A3 (en) | 2022-04-07 |
| RU2796061C2 true RU2796061C2 (en) | 2023-05-16 |
Family
ID=
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| RU2295568C2 (en) * | 2002-07-04 | 2007-03-20 | Каунсил Оф Сайентифик Энд Индастриал Рисерч | Simple, effective and fast method for enzymatic modification and synthesis of nucleic acid in vitro using microwave irradiation |
| EP2316934A1 (en) * | 2008-08-08 | 2011-05-04 | Tosoh Corporation | Rna polymerase mutant with improved functions |
| EP2377938A1 (en) * | 2010-04-16 | 2011-10-19 | Eukarys | Capping-prone RNA polymerase enzymes and their applications |
| US20130224793A1 (en) * | 2012-02-24 | 2013-08-29 | University Of Massachusetts | Modified t7-related rna polymerases and methods of use thereof |
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| RU2295568C2 (en) * | 2002-07-04 | 2007-03-20 | Каунсил Оф Сайентифик Энд Индастриал Рисерч | Simple, effective and fast method for enzymatic modification and synthesis of nucleic acid in vitro using microwave irradiation |
| EP2316934A1 (en) * | 2008-08-08 | 2011-05-04 | Tosoh Corporation | Rna polymerase mutant with improved functions |
| EP2377938A1 (en) * | 2010-04-16 | 2011-10-19 | Eukarys | Capping-prone RNA polymerase enzymes and their applications |
| US20130224793A1 (en) * | 2012-02-24 | 2013-08-29 | University Of Massachusetts | Modified t7-related rna polymerases and methods of use thereof |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR102773542B1 (en) | T7 RNA polymerase mutant | |
| KR20200023454A (en) | T7 RNA Polymerase Variants | |
| US7083980B2 (en) | Tn5 transposase mutants and the use thereof | |
| KR0157983B1 (en) | Amidation enzyme expression system | |
| US20060040355A1 (en) | Mutated Tn5 transposase proteins and the use thereof | |
| CN113767168B (en) | Efficient introduction of aminoacyl-tRNA synthetases into lysine derivatives | |
| AU2020242724B2 (en) | Aminoacyl-tRNA synthetase for efficiently introducing lysine derivative in protein | |
| CN110914414A (en) | Methods and means for genetically altering genomes using designed DNA recombinases | |
| JP4892474B2 (en) | Method for producing protein having triple helical structure | |
| RU2796061C2 (en) | T7 rna polymerase variants | |
| TWI282370B (en) | Improved method for the recombinant production of polypeptides | |
| CN110564742B (en) | Recombinant strain modified by yebN gene and construction method and application thereof | |
| JP3095183B2 (en) | Novel enzyme and DNA encoding it | |
| JP6991423B2 (en) | Glucose oxidase CnGODA and its genes and their use | |
| WO2009119876A1 (en) | Plasmid vector | |
| JP5099881B2 (en) | Highly efficient cell-free protein synthesis system | |
| KR20220035370A (en) | Mammalian Expression Vectors | |
| EP4202035A1 (en) | Improved expression of peptides | |
| CN116515793A (en) | Nicotinamide mononucleotide adenyltransferase mutant and preparation method and application thereof | |
| JPH0630771A (en) | Production of bacterial transglutaminase and related material | |
| WO2018087760A1 (en) | Highly efficient and tunable system for the incorporation of unnatural amino acids into proteins in escherichia coli | |
| RU2813283C2 (en) | Recombinant strain based on escherichia coli, a method of its construction and use | |
| RU2813511C2 (en) | Recombinant strain based on escherichia coli and method of its construction and use | |
| JPH06292584A (en) | E1 protein gene of variant pyruvic acid dehydrogenase complex and e1 protein of variant pyruvic acid dehydorgenase complex | |
| RU2790662C1 (en) | AMINOACIL-tRNA SYNTHASE, EFFECTIVE INTRODUCTION OF LYSINE DERIVATIVES |