RU2825102C2 - Recombinant proteins with ccn domains and fusion proteins - Google Patents
Recombinant proteins with ccn domains and fusion proteins Download PDFInfo
- Publication number
- RU2825102C2 RU2825102C2 RU2021125671A RU2021125671A RU2825102C2 RU 2825102 C2 RU2825102 C2 RU 2825102C2 RU 2021125671 A RU2021125671 A RU 2021125671A RU 2021125671 A RU2021125671 A RU 2021125671A RU 2825102 C2 RU2825102 C2 RU 2825102C2
- Authority
- RU
- Russia
- Prior art keywords
- seq
- ser
- val
- pro
- protein
- Prior art date
Links
- 102000037865 fusion proteins Human genes 0.000 title claims abstract description 217
- 108020001507 fusion proteins Proteins 0.000 title claims abstract description 201
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 title abstract description 105
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 title abstract description 89
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 417
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 409
- 150000001413 amino acids Chemical class 0.000 claims abstract description 156
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 128
- 101000934220 Homo sapiens CCN family member 5 Proteins 0.000 claims abstract description 119
- 102100025215 CCN family member 5 Human genes 0.000 claims abstract description 117
- 230000004927 fusion Effects 0.000 claims abstract description 68
- 230000000694 effects Effects 0.000 claims abstract description 58
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 52
- 229920001184 polypeptide Polymers 0.000 claims abstract description 39
- 206010028980 Neoplasm Diseases 0.000 claims abstract description 23
- 102000006998 CCN Intercellular Signaling Proteins Human genes 0.000 claims abstract description 22
- 108010072756 CCN Intercellular Signaling Proteins Proteins 0.000 claims abstract description 22
- 201000011510 cancer Diseases 0.000 claims abstract description 21
- 206010016654 Fibrosis Diseases 0.000 claims abstract description 18
- 230000004761 fibrosis Effects 0.000 claims abstract description 18
- 108060008245 Thrombospondin Proteins 0.000 claims abstract description 16
- 102000002938 Thrombospondin Human genes 0.000 claims abstract description 16
- 230000002401 inhibitory effect Effects 0.000 claims abstract description 12
- 210000002966 serum Anatomy 0.000 claims abstract description 4
- 235000018102 proteins Nutrition 0.000 claims description 390
- 210000004027 cell Anatomy 0.000 claims description 239
- 235000001014 amino acid Nutrition 0.000 claims description 174
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 104
- 108010091135 Immunoglobulin Fc Fragments Proteins 0.000 claims description 96
- 102000018071 Immunoglobulin Fc Fragments Human genes 0.000 claims description 96
- 241000282414 Homo sapiens Species 0.000 claims description 57
- 230000014509 gene expression Effects 0.000 claims description 50
- 230000035772 mutation Effects 0.000 claims description 41
- 239000013604 expression vector Substances 0.000 claims description 37
- 239000013598 vector Substances 0.000 claims description 36
- 108010076504 Protein Sorting Signals Proteins 0.000 claims description 31
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 claims description 23
- 108020004414 DNA Proteins 0.000 claims description 21
- 108091005804 Peptidases Proteins 0.000 claims description 19
- 239000004365 Protease Substances 0.000 claims description 19
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 claims description 18
- 102000007562 Serum Albumin Human genes 0.000 claims description 16
- 108010071390 Serum Albumin Proteins 0.000 claims description 16
- 102000004338 Transferrin Human genes 0.000 claims description 14
- 239000012642 immune effector Substances 0.000 claims description 14
- 229940121354 immunomodulator Drugs 0.000 claims description 14
- 230000001965 increasing effect Effects 0.000 claims description 14
- 239000012581 transferrin Substances 0.000 claims description 14
- 102000028416 insulin-like growth factor binding Human genes 0.000 claims description 8
- 108091022911 insulin-like growth factor binding Proteins 0.000 claims description 8
- 239000002773 nucleotide Substances 0.000 claims description 8
- 125000003729 nucleotide group Chemical group 0.000 claims description 8
- 101000766307 Gallus gallus Ovotransferrin Proteins 0.000 claims description 7
- 229960003067 cystine Drugs 0.000 claims description 7
- 230000000717 retained effect Effects 0.000 claims description 7
- 230000000087 stabilizing effect Effects 0.000 claims description 6
- LEVWYRKDKASIDU-QWWZWVQMSA-N D-cystine Chemical compound OC(=O)[C@H](N)CSSC[C@@H](N)C(O)=O LEVWYRKDKASIDU-QWWZWVQMSA-N 0.000 claims description 5
- 102000053602 DNA Human genes 0.000 claims description 5
- 230000002265 prevention Effects 0.000 claims description 4
- 108010047303 von Willebrand Factor Proteins 0.000 claims description 4
- 102100036537 von Willebrand factor Human genes 0.000 claims description 4
- 229960001134 von willebrand factor Drugs 0.000 claims description 4
- 210000004962 mammalian cell Anatomy 0.000 claims description 3
- 230000009471 action Effects 0.000 claims description 2
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 claims 1
- 239000012634 fragment Substances 0.000 abstract description 23
- 238000004519 manufacturing process Methods 0.000 abstract description 13
- 239000003814 drug Substances 0.000 abstract description 12
- 230000017854 proteolysis Effects 0.000 abstract description 11
- 230000004071 biological effect Effects 0.000 abstract description 10
- 239000000178 monomer Substances 0.000 abstract description 8
- 239000000126 substance Substances 0.000 abstract description 4
- 229940024606 amino acid Drugs 0.000 description 165
- 108091028043 Nucleic acid sequence Proteins 0.000 description 87
- 102100031168 CCN family member 2 Human genes 0.000 description 61
- 108010039419 Connective Tissue Growth Factor Proteins 0.000 description 61
- 230000026731 phosphorylation Effects 0.000 description 40
- 238000006366 phosphorylation reaction Methods 0.000 description 40
- 239000013612 plasmid Substances 0.000 description 39
- 108010016616 cysteinylglycine Proteins 0.000 description 34
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 32
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 29
- 239000006143 cell culture medium Substances 0.000 description 29
- 201000005202 lung cancer Diseases 0.000 description 29
- 208000020816 lung neoplasm Diseases 0.000 description 29
- 229910052717 sulfur Inorganic materials 0.000 description 29
- 239000000872 buffer Substances 0.000 description 28
- 238000001890 transfection Methods 0.000 description 28
- ODKSFYDXXFIFQN-BYPYZUCNSA-N L-arginine Chemical compound OC(=O)[C@@H](N)CCCN=C(N)N ODKSFYDXXFIFQN-BYPYZUCNSA-N 0.000 description 26
- 238000000034 method Methods 0.000 description 26
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 24
- TUYWCHPXKQTISF-LPEHRKFASA-N Pro-Cys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N2CCC[C@@H]2C(=O)O TUYWCHPXKQTISF-LPEHRKFASA-N 0.000 description 24
- 229930064664 L-arginine Natural products 0.000 description 23
- 235000014852 L-arginine Nutrition 0.000 description 23
- 238000010828 elution Methods 0.000 description 23
- 238000005185 salting out Methods 0.000 description 23
- 102000009027 Albumins Human genes 0.000 description 22
- 108010088751 Albumins Proteins 0.000 description 22
- 102100031170 CCN family member 3 Human genes 0.000 description 22
- 238000004587 chromatography analysis Methods 0.000 description 22
- 229910052757 nitrogen Inorganic materials 0.000 description 22
- 150000007523 nucleic acids Chemical class 0.000 description 22
- 101150036984 CCN3 gene Proteins 0.000 description 21
- 230000006870 function Effects 0.000 description 21
- 239000011534 wash buffer Substances 0.000 description 21
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 20
- 108700024729 Nephroblastoma Overexpressed Proteins 0.000 description 20
- HQVPQXMCQKXARZ-FXQIFTODSA-N Pro-Cys-Ser Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O HQVPQXMCQKXARZ-FXQIFTODSA-N 0.000 description 20
- 238000002835 absorbance Methods 0.000 description 20
- YBYRMVIVWMBXKQ-UHFFFAOYSA-N phenylmethanesulfonyl fluoride Chemical compound FS(=O)(=O)CC1=CC=CC=C1 YBYRMVIVWMBXKQ-UHFFFAOYSA-N 0.000 description 20
- 238000006467 substitution reaction Methods 0.000 description 20
- 108020004705 Codon Proteins 0.000 description 19
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 19
- 239000000203 mixture Substances 0.000 description 19
- 102000035195 Peptidases Human genes 0.000 description 18
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 18
- 230000028327 secretion Effects 0.000 description 18
- 108091006905 Human Serum Albumin Proteins 0.000 description 17
- 102000008100 Human Serum Albumin Human genes 0.000 description 17
- 241000880493 Leptailurus serval Species 0.000 description 17
- 230000004048 modification Effects 0.000 description 17
- 238000012986 modification Methods 0.000 description 17
- 239000002953 phosphate buffered saline Substances 0.000 description 17
- FOQFHANLUJDQEE-GUBZILKMSA-N Arg-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCCN=C(N)N)N)C(=O)N[C@@H](CS)C(=O)O FOQFHANLUJDQEE-GUBZILKMSA-N 0.000 description 16
- KRKNYBCHXYNGOX-UHFFFAOYSA-K Citrate Chemical compound [O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O KRKNYBCHXYNGOX-UHFFFAOYSA-K 0.000 description 16
- IHCXPSYCHXFXKT-DCAQKATOSA-N Pro-Arg-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O IHCXPSYCHXFXKT-DCAQKATOSA-N 0.000 description 16
- RXUOAOOZIWABBW-XGEHTFHBSA-N Ser-Thr-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RXUOAOOZIWABBW-XGEHTFHBSA-N 0.000 description 16
- 102000004887 Transforming Growth Factor beta Human genes 0.000 description 16
- 108090001012 Transforming Growth Factor beta Proteins 0.000 description 16
- PQSNETRGCRUOGP-KKHAAJSZSA-N Val-Thr-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O PQSNETRGCRUOGP-KKHAAJSZSA-N 0.000 description 16
- 235000004279 alanine Nutrition 0.000 description 16
- 230000001419 dependent effect Effects 0.000 description 16
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 16
- 230000002797 proteolythic effect Effects 0.000 description 16
- 108010026333 seryl-proline Proteins 0.000 description 16
- ZRKFYGHZFMAOKI-QMGMOQQFSA-N tgfbeta Chemical compound C([C@H](NC(=O)[C@H](C(C)C)NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CC(C)C)NC(=O)CNC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCSC)C(C)C)[C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O)C1=CC=C(O)C=C1 ZRKFYGHZFMAOKI-QMGMOQQFSA-N 0.000 description 16
- 108010052774 valyl-lysyl-glycyl-phenylalanyl-tyrosine Proteins 0.000 description 16
- 102100025175 Cellular communication network factor 6 Human genes 0.000 description 15
- 101000934310 Homo sapiens Cellular communication network factor 6 Proteins 0.000 description 15
- JDMKQHSHKJHAHR-UHFFFAOYSA-N Phe-Phe-Leu-Tyr Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)CC1=CC=CC=C1 JDMKQHSHKJHAHR-UHFFFAOYSA-N 0.000 description 15
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 15
- 108010013768 glutamyl-aspartyl-proline Proteins 0.000 description 15
- 239000002609 medium Substances 0.000 description 15
- 239000011780 sodium chloride Substances 0.000 description 15
- 239000006228 supernatant Substances 0.000 description 15
- 102100031171 CCN family member 1 Human genes 0.000 description 14
- 108010019961 Cysteine-Rich Protein 61 Proteins 0.000 description 14
- VPEVBAUSTBWQHN-NHCYSSNCSA-N Pro-Glu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O VPEVBAUSTBWQHN-NHCYSSNCSA-N 0.000 description 14
- 238000002955 isolation Methods 0.000 description 14
- 229910052698 phosphorus Inorganic materials 0.000 description 14
- 108010070643 prolylglutamic acid Proteins 0.000 description 14
- 230000035945 sensitivity Effects 0.000 description 14
- 229910052727 yttrium Inorganic materials 0.000 description 14
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 13
- NIUDXSFNLBIWOB-DCAQKATOSA-N Arg-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NIUDXSFNLBIWOB-DCAQKATOSA-N 0.000 description 13
- 108091006020 Fc-tagged proteins Proteins 0.000 description 13
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 13
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 13
- 108010060035 arginylproline Proteins 0.000 description 13
- 238000003556 assay Methods 0.000 description 13
- 238000005119 centrifugation Methods 0.000 description 13
- 239000012149 elution buffer Substances 0.000 description 13
- 239000000499 gel Substances 0.000 description 13
- 239000001963 growth medium Substances 0.000 description 13
- 230000005764 inhibitory process Effects 0.000 description 13
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 13
- 108010064235 lysylglycine Proteins 0.000 description 13
- LFFOJBOTZUWINF-ZANVPECISA-N Ala-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O)=CNC2=C1 LFFOJBOTZUWINF-ZANVPECISA-N 0.000 description 12
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 12
- 241000699800 Cricetinae Species 0.000 description 12
- STHSGOZLFLFGSS-SUSMZKCASA-N Gln-Thr-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STHSGOZLFLFGSS-SUSMZKCASA-N 0.000 description 12
- MWTGQXBHVRTCOR-GLLZPBPUSA-N Glu-Thr-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MWTGQXBHVRTCOR-GLLZPBPUSA-N 0.000 description 12
- PABFFPWEJMEVEC-JGVFFNPUSA-N Gly-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)CN)C(=O)O PABFFPWEJMEVEC-JGVFFNPUSA-N 0.000 description 12
- 102000018120 Recombinases Human genes 0.000 description 12
- 108010091086 Recombinases Proteins 0.000 description 12
- TZQWJCGVCIJDMU-HEIBUPTGSA-N Thr-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)O)N)O TZQWJCGVCIJDMU-HEIBUPTGSA-N 0.000 description 12
- GSCPHMSPGQSZJT-JYBASQMISA-N Trp-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O GSCPHMSPGQSZJT-JYBASQMISA-N 0.000 description 12
- 230000005754 cellular signaling Effects 0.000 description 12
- 239000012636 effector Substances 0.000 description 12
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 12
- 108010031719 prolyl-serine Proteins 0.000 description 12
- 239000000725 suspension Substances 0.000 description 12
- 230000014616 translation Effects 0.000 description 12
- 102100031173 CCN family member 4 Human genes 0.000 description 11
- 241000588724 Escherichia coli Species 0.000 description 11
- 101000777560 Homo sapiens CCN family member 4 Proteins 0.000 description 11
- DSLHSTIUAPKERR-XGEHTFHBSA-N Thr-Cys-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O DSLHSTIUAPKERR-XGEHTFHBSA-N 0.000 description 11
- XTDDIVQWDXMRJL-IHRRRGAJSA-N Val-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N XTDDIVQWDXMRJL-IHRRRGAJSA-N 0.000 description 11
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 11
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 11
- 108010060199 cysteinylproline Proteins 0.000 description 11
- 238000012217 deletion Methods 0.000 description 11
- 230000037430 deletion Effects 0.000 description 11
- 108010049041 glutamylalanine Proteins 0.000 description 11
- 230000007757 pro-survival signaling Effects 0.000 description 11
- 238000013519 translation Methods 0.000 description 11
- DIBLBAURNYJYBF-XLXZRNDBSA-N (2s)-2-[[(2s)-2-[[2-[[(2s)-6-amino-2-[[(2s)-2-amino-3-methylbutanoyl]amino]hexanoyl]amino]acetyl]amino]-3-phenylpropanoyl]amino]-3-(4-hydroxyphenyl)propanoic acid Chemical compound C([C@H](NC(=O)CNC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 DIBLBAURNYJYBF-XLXZRNDBSA-N 0.000 description 10
- LGCVSPFCFXWUEY-IHPCNDPISA-N Asn-Trp-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N LGCVSPFCFXWUEY-IHPCNDPISA-N 0.000 description 10
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 10
- ZXCAQANTQWBICD-DCAQKATOSA-N Cys-Lys-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CS)N ZXCAQANTQWBICD-DCAQKATOSA-N 0.000 description 10
- DHNWZLGBTPUTQQ-QEJZJMRPSA-N Gln-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N DHNWZLGBTPUTQQ-QEJZJMRPSA-N 0.000 description 10
- GLWXKFRTOHKGIT-ACZMJKKPSA-N Glu-Asn-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GLWXKFRTOHKGIT-ACZMJKKPSA-N 0.000 description 10
- HNVFSTLPVJWIDV-CIUDSAMLSA-N Glu-Glu-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HNVFSTLPVJWIDV-CIUDSAMLSA-N 0.000 description 10
- GRIRDMVMJJDZKV-RCOVLWMOSA-N Gly-Asn-Val Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O GRIRDMVMJJDZKV-RCOVLWMOSA-N 0.000 description 10
- WMKXFMUJRCEGRP-SRVKXCTJSA-N His-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N WMKXFMUJRCEGRP-SRVKXCTJSA-N 0.000 description 10
- 108010065920 Insulin Lispro Proteins 0.000 description 10
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 10
- XNKDCYABMBBEKN-IUCAKERBSA-N Lys-Gly-Gln Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O XNKDCYABMBBEKN-IUCAKERBSA-N 0.000 description 10
- MSHZERMPZKCODG-ACRUOGEOSA-N Phe-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 MSHZERMPZKCODG-ACRUOGEOSA-N 0.000 description 10
- PCWLNNZTBJTZRN-AVGNSLFASA-N Pro-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 PCWLNNZTBJTZRN-AVGNSLFASA-N 0.000 description 10
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 10
- VGNYHOBZJKWRGI-CIUDSAMLSA-N Ser-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO VGNYHOBZJKWRGI-CIUDSAMLSA-N 0.000 description 10
- GZSZPKSBVAOGIE-CIUDSAMLSA-N Ser-Lys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O GZSZPKSBVAOGIE-CIUDSAMLSA-N 0.000 description 10
- BEZTUFWTPVOROW-KJEVXHAQSA-N Thr-Tyr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O BEZTUFWTPVOROW-KJEVXHAQSA-N 0.000 description 10
- RIVVDNTUSRVTQT-IRIUXVKKSA-N Tyr-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O RIVVDNTUSRVTQT-IRIUXVKKSA-N 0.000 description 10
- ZLNYBMWGPOKSLW-LSJOCFKGSA-N Val-Val-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLNYBMWGPOKSLW-LSJOCFKGSA-N 0.000 description 10
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 10
- 108010092854 aspartyllysine Proteins 0.000 description 10
- 230000015572 biosynthetic process Effects 0.000 description 10
- 238000011097 chromatography purification Methods 0.000 description 10
- 201000010099 disease Diseases 0.000 description 10
- BNIILDVGGAEEIG-UHFFFAOYSA-L disodium hydrogen phosphate Chemical compound [Na+].[Na+].OP([O-])([O-])=O BNIILDVGGAEEIG-UHFFFAOYSA-L 0.000 description 10
- 229910000397 disodium phosphate Inorganic materials 0.000 description 10
- 235000019800 disodium phosphate Nutrition 0.000 description 10
- 239000012091 fetal bovine serum Substances 0.000 description 10
- 108010050848 glycylleucine Proteins 0.000 description 10
- 238000003384 imaging method Methods 0.000 description 10
- 210000004072 lung Anatomy 0.000 description 10
- 235000019799 monosodium phosphate Nutrition 0.000 description 10
- AJPJDKMHJJGVTQ-UHFFFAOYSA-M sodium dihydrogen phosphate Chemical compound [Na+].OP(O)([O-])=O AJPJDKMHJJGVTQ-UHFFFAOYSA-M 0.000 description 10
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 10
- 229910000162 sodium phosphate Inorganic materials 0.000 description 10
- IESDGNYHXIOKRW-YXMSTPNBSA-N (2s)-2-[[(2s)-1-[(2s)-6-amino-2-[[(2s,3r)-2-amino-3-hydroxybutanoyl]amino]hexanoyl]pyrrolidine-2-carbonyl]amino]-5-(diaminomethylideneamino)pentanoic acid Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IESDGNYHXIOKRW-YXMSTPNBSA-N 0.000 description 9
- KASDBWKLWJKTLJ-GUBZILKMSA-N Glu-Glu-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O KASDBWKLWJKTLJ-GUBZILKMSA-N 0.000 description 9
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 9
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 9
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 9
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 9
- 239000012515 MabSelect SuRe Substances 0.000 description 9
- CDNPIRSCAFMMBE-SRVKXCTJSA-N Phe-Asn-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CDNPIRSCAFMMBE-SRVKXCTJSA-N 0.000 description 9
- IIEOLPMQYRBZCN-SRVKXCTJSA-N Phe-Ser-Cys Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O IIEOLPMQYRBZCN-SRVKXCTJSA-N 0.000 description 9
- ZLXKLMHAMDENIO-DCAQKATOSA-N Pro-Lys-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLXKLMHAMDENIO-DCAQKATOSA-N 0.000 description 9
- GOMUXSCOIWIJFP-GUBZILKMSA-N Pro-Ser-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GOMUXSCOIWIJFP-GUBZILKMSA-N 0.000 description 9
- GMJDSFYVTAMIBF-FXQIFTODSA-N Pro-Ser-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GMJDSFYVTAMIBF-FXQIFTODSA-N 0.000 description 9
- SEZGGSHLMROBFX-CIUDSAMLSA-N Pro-Ser-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O SEZGGSHLMROBFX-CIUDSAMLSA-N 0.000 description 9
- BDGBHYCAZJPLHX-HJGDQZAQSA-N Thr-Lys-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O BDGBHYCAZJPLHX-HJGDQZAQSA-N 0.000 description 9
- VTHNLRXALGUDBS-BPUTZDHNSA-N Trp-Gln-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N VTHNLRXALGUDBS-BPUTZDHNSA-N 0.000 description 9
- SINRIKQYQJRGDQ-MEYUZBJRSA-N Tyr-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 SINRIKQYQJRGDQ-MEYUZBJRSA-N 0.000 description 9
- RWOKVQUCENPXGE-IHRRRGAJSA-N Tyr-Ser-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RWOKVQUCENPXGE-IHRRRGAJSA-N 0.000 description 9
- QHDXUYOYTPWCSK-RCOVLWMOSA-N Val-Asp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N QHDXUYOYTPWCSK-RCOVLWMOSA-N 0.000 description 9
- JXGWQYWDUOWQHA-DZKIICNBSA-N Val-Gln-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N JXGWQYWDUOWQHA-DZKIICNBSA-N 0.000 description 9
- 230000027455 binding Effects 0.000 description 9
- 238000004113 cell culture Methods 0.000 description 9
- 238000001976 enzyme digestion Methods 0.000 description 9
- 210000002950 fibroblast Anatomy 0.000 description 9
- 238000001502 gel electrophoresis Methods 0.000 description 9
- 229960000310 isoleucine Drugs 0.000 description 9
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 9
- 108091008146 restriction endonucleases Proteins 0.000 description 9
- 108010080629 tryptophan-leucine Proteins 0.000 description 9
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 8
- OILNWMNBLIHXQK-ZLUOBGJFSA-N Ala-Cys-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O OILNWMNBLIHXQK-ZLUOBGJFSA-N 0.000 description 8
- SLKLLQWZQHXYSV-CIUDSAMLSA-N Asn-Ala-Lys Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O SLKLLQWZQHXYSV-CIUDSAMLSA-N 0.000 description 8
- AHWRSSLYSGLBGD-CIUDSAMLSA-N Asp-Pro-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AHWRSSLYSGLBGD-CIUDSAMLSA-N 0.000 description 8
- OHLLDUNVMPPUMD-DCAQKATOSA-N Cys-Leu-Val Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CS)N OHLLDUNVMPPUMD-DCAQKATOSA-N 0.000 description 8
- RWVBNRYBHAGYSG-GUBZILKMSA-N Cys-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CS)N RWVBNRYBHAGYSG-GUBZILKMSA-N 0.000 description 8
- MBRWOKXNHTUJMB-CIUDSAMLSA-N Cys-Pro-Glu Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O MBRWOKXNHTUJMB-CIUDSAMLSA-N 0.000 description 8
- 102000005593 Endopeptidases Human genes 0.000 description 8
- 108010059378 Endopeptidases Proteins 0.000 description 8
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 8
- ALMBZBOCGSVSAI-ACZMJKKPSA-N Glu-Ser-Asn Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ALMBZBOCGSVSAI-ACZMJKKPSA-N 0.000 description 8
- MFYLRRCYBBJYPI-JYJNAYRXSA-N Glu-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O MFYLRRCYBBJYPI-JYJNAYRXSA-N 0.000 description 8
- GWCRIHNSVMOBEQ-BQBZGAKWSA-N Gly-Arg-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O GWCRIHNSVMOBEQ-BQBZGAKWSA-N 0.000 description 8
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 8
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 8
- WQDKIVRHTQYJSN-DCAQKATOSA-N Lys-Ser-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N WQDKIVRHTQYJSN-DCAQKATOSA-N 0.000 description 8
- TVOOGUNBIWAURO-KATARQTJSA-N Lys-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N)O TVOOGUNBIWAURO-KATARQTJSA-N 0.000 description 8
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 8
- SLQDSYZHHOKQSR-QXEWZRGKSA-N Met-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCSC SLQDSYZHHOKQSR-QXEWZRGKSA-N 0.000 description 8
- KBUAPZAZPWNYSW-SRVKXCTJSA-N Pro-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KBUAPZAZPWNYSW-SRVKXCTJSA-N 0.000 description 8
- PRKWBYCXBBSLSK-GUBZILKMSA-N Pro-Ser-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O PRKWBYCXBBSLSK-GUBZILKMSA-N 0.000 description 8
- OYEDZGNMSBZCIM-XGEHTFHBSA-N Ser-Arg-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OYEDZGNMSBZCIM-XGEHTFHBSA-N 0.000 description 8
- ZOHGLPQGEHSLPD-FXQIFTODSA-N Ser-Gln-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZOHGLPQGEHSLPD-FXQIFTODSA-N 0.000 description 8
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 8
- ASJDFGOPDCVXTG-KATARQTJSA-N Thr-Cys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O ASJDFGOPDCVXTG-KATARQTJSA-N 0.000 description 8
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 8
- CVUDMNSZAIZFAE-UHFFFAOYSA-N Val-Arg-Pro Natural products NC(N)=NCCCC(NC(=O)C(N)C(C)C)C(=O)N1CCCC1C(O)=O CVUDMNSZAIZFAE-UHFFFAOYSA-N 0.000 description 8
- 238000010367 cloning Methods 0.000 description 8
- 235000018417 cysteine Nutrition 0.000 description 8
- 108010079547 glutamylmethionine Proteins 0.000 description 8
- 108010051242 phenylalanylserine Proteins 0.000 description 8
- 229910052700 potassium Inorganic materials 0.000 description 8
- 230000002206 pro-fibrotic effect Effects 0.000 description 8
- 238000010561 standard procedure Methods 0.000 description 8
- 210000001519 tissue Anatomy 0.000 description 8
- 238000003146 transient transfection Methods 0.000 description 8
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 8
- OLVIPTLKNSAYRJ-YUMQZZPRSA-N Asn-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N OLVIPTLKNSAYRJ-YUMQZZPRSA-N 0.000 description 7
- 102000039854 CCN family Human genes 0.000 description 7
- 108091068251 CCN family Proteins 0.000 description 7
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 7
- CSMHMEATMDCQNY-DZKIICNBSA-N Gln-Val-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CSMHMEATMDCQNY-DZKIICNBSA-N 0.000 description 7
- ZALGPUWUVHOGAE-GVXVVHGQSA-N Glu-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZALGPUWUVHOGAE-GVXVVHGQSA-N 0.000 description 7
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 7
- AUNMOHYWTAPQLA-XUXIUFHCSA-N Leu-Met-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AUNMOHYWTAPQLA-XUXIUFHCSA-N 0.000 description 7
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 7
- HWLKHNDRXWTFTN-GUBZILKMSA-N Pro-Pro-Cys Chemical compound C1C[C@H](NC1)C(=O)N2CCC[C@H]2C(=O)N[C@@H](CS)C(=O)O HWLKHNDRXWTFTN-GUBZILKMSA-N 0.000 description 7
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 7
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 7
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 7
- 108090000901 Transferrin Proteins 0.000 description 7
- RKIGNDAHUOOIMJ-BQFCYCMXSA-N Val-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 RKIGNDAHUOOIMJ-BQFCYCMXSA-N 0.000 description 7
- SBJCTAZFSZXWSR-AVGNSLFASA-N Val-Met-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N SBJCTAZFSZXWSR-AVGNSLFASA-N 0.000 description 7
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 7
- 230000002776 aggregation Effects 0.000 description 7
- 238000004220 aggregation Methods 0.000 description 7
- 238000003776 cleavage reaction Methods 0.000 description 7
- 108010015792 glycyllysine Proteins 0.000 description 7
- 229910052739 hydrogen Inorganic materials 0.000 description 7
- 239000011159 matrix material Substances 0.000 description 7
- 238000010899 nucleation Methods 0.000 description 7
- 102000039446 nucleic acids Human genes 0.000 description 7
- 108020004707 nucleic acids Proteins 0.000 description 7
- 230000002018 overexpression Effects 0.000 description 7
- 208000005069 pulmonary fibrosis Diseases 0.000 description 7
- 230000002829 reductive effect Effects 0.000 description 7
- 230000007017 scission Effects 0.000 description 7
- 238000012360 testing method Methods 0.000 description 7
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 7
- 108010051110 tyrosyl-lysine Proteins 0.000 description 7
- COEXAQSTZUWMRI-STQMWFEESA-N (2s)-1-[2-[[(2s)-2-amino-3-(4-hydroxyphenyl)propanoyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound C([C@H](N)C(=O)NCC(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=C(O)C=C1 COEXAQSTZUWMRI-STQMWFEESA-N 0.000 description 6
- IORKCNUBHNIMKY-CIUDSAMLSA-N Ala-Pro-Glu Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O IORKCNUBHNIMKY-CIUDSAMLSA-N 0.000 description 6
- GRNOCLDFUNCIDW-ACZMJKKPSA-N Cys-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N GRNOCLDFUNCIDW-ACZMJKKPSA-N 0.000 description 6
- RRIJEABIXPKSGP-FXQIFTODSA-N Cys-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CS RRIJEABIXPKSGP-FXQIFTODSA-N 0.000 description 6
- 102100037362 Fibronectin Human genes 0.000 description 6
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 6
- XHUCVVHRLNPZSZ-CIUDSAMLSA-N Glu-Gln-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XHUCVVHRLNPZSZ-CIUDSAMLSA-N 0.000 description 6
- BPCLDCNZBUYGOD-BPUTZDHNSA-N Glu-Trp-Glu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 BPCLDCNZBUYGOD-BPUTZDHNSA-N 0.000 description 6
- 102100026120 IgG receptor FcRn large subunit p51 Human genes 0.000 description 6
- SJRQWEDYTKYHHL-SLFFLAALSA-N Phe-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O SJRQWEDYTKYHHL-SLFFLAALSA-N 0.000 description 6
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 6
- DJACUBDEDBZKLQ-KBIXCLLPSA-N Ser-Ile-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O DJACUBDEDBZKLQ-KBIXCLLPSA-N 0.000 description 6
- 239000012505 Superdex™ Substances 0.000 description 6
- 102000004142 Trypsin Human genes 0.000 description 6
- 108090000631 Trypsin Proteins 0.000 description 6
- 108010047857 aspartylglycine Proteins 0.000 description 6
- 239000003638 chemical reducing agent Substances 0.000 description 6
- 208000035475 disorder Diseases 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 6
- 238000011534 incubation Methods 0.000 description 6
- 230000035790 physiological processes and functions Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 108010077112 prolyl-proline Proteins 0.000 description 6
- 238000000746 purification Methods 0.000 description 6
- 239000000758 substrate Substances 0.000 description 6
- 239000012588 trypsin Substances 0.000 description 6
- 238000000825 ultraviolet detection Methods 0.000 description 6
- 206010006187 Breast cancer Diseases 0.000 description 5
- 208000026310 Breast neoplasm Diseases 0.000 description 5
- 102000010834 Extracellular Matrix Proteins Human genes 0.000 description 5
- 108010037362 Extracellular Matrix Proteins Proteins 0.000 description 5
- RFDHKPSHTXZKLL-IHRRRGAJSA-N Glu-Gln-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N RFDHKPSHTXZKLL-IHRRRGAJSA-N 0.000 description 5
- QOXDAWODGSIDDI-GUBZILKMSA-N Glu-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N QOXDAWODGSIDDI-GUBZILKMSA-N 0.000 description 5
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 5
- GMTXWRIDLGTVFC-IUCAKERBSA-N Gly-Lys-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMTXWRIDLGTVFC-IUCAKERBSA-N 0.000 description 5
- 201000009794 Idiopathic Pulmonary Fibrosis Diseases 0.000 description 5
- DFJJAVZIHDFOGQ-MNXVOIDGSA-N Ile-Glu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DFJJAVZIHDFOGQ-MNXVOIDGSA-N 0.000 description 5
- 108060003951 Immunoglobulin Proteins 0.000 description 5
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 5
- RKIIYGUHIQJCBW-SRVKXCTJSA-N Met-His-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RKIIYGUHIQJCBW-SRVKXCTJSA-N 0.000 description 5
- FWAHLGXNBLWIKB-NAKRPEOUSA-N Met-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCSC FWAHLGXNBLWIKB-NAKRPEOUSA-N 0.000 description 5
- UAYHMOIGIQZLFR-NHCYSSNCSA-N Pro-Gln-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UAYHMOIGIQZLFR-NHCYSSNCSA-N 0.000 description 5
- QPFJSHSJFIYDJZ-GHCJXIJMSA-N Ser-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO QPFJSHSJFIYDJZ-GHCJXIJMSA-N 0.000 description 5
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 5
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 5
- OACSGBOREVRSME-NHCYSSNCSA-N Val-His-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CC(N)=O)C(O)=O OACSGBOREVRSME-NHCYSSNCSA-N 0.000 description 5
- RYHUIHUOYRNNIE-NRPADANISA-N Val-Ser-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N RYHUIHUOYRNNIE-NRPADANISA-N 0.000 description 5
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 5
- 230000015556 catabolic process Effects 0.000 description 5
- 239000003153 chemical reaction reagent Substances 0.000 description 5
- 239000003636 conditioned culture medium Substances 0.000 description 5
- 238000006731 degradation reaction Methods 0.000 description 5
- 230000003176 fibrotic effect Effects 0.000 description 5
- 229910052731 fluorine Inorganic materials 0.000 description 5
- 102000018358 immunoglobulin Human genes 0.000 description 5
- 208000036971 interstitial lung disease 2 Diseases 0.000 description 5
- 210000004379 membrane Anatomy 0.000 description 5
- 239000012528 membrane Substances 0.000 description 5
- 229960000485 methotrexate Drugs 0.000 description 5
- 230000036961 partial effect Effects 0.000 description 5
- 229920001223 polyethylene glycol Polymers 0.000 description 5
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 5
- 108010053725 prolylvaline Proteins 0.000 description 5
- 230000001225 therapeutic effect Effects 0.000 description 5
- 230000035899 viability Effects 0.000 description 5
- 238000001262 western blot Methods 0.000 description 5
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 4
- MQIGTEQXYCRLGK-BQBZGAKWSA-N Ala-Gly-Pro Chemical compound C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O MQIGTEQXYCRLGK-BQBZGAKWSA-N 0.000 description 4
- DPNZTBKGAUAZQU-DLOVCJGASA-N Ala-Leu-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N DPNZTBKGAUAZQU-DLOVCJGASA-N 0.000 description 4
- OINVDEKBKBCPLX-JXUBOQSCSA-N Ala-Lys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OINVDEKBKBCPLX-JXUBOQSCSA-N 0.000 description 4
- DPXDVGDLWJYZBH-GUBZILKMSA-N Arg-Asn-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DPXDVGDLWJYZBH-GUBZILKMSA-N 0.000 description 4
- CVXXSWQORBZAAA-SRVKXCTJSA-N Arg-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N CVXXSWQORBZAAA-SRVKXCTJSA-N 0.000 description 4
- HRCIIMCTUIAKQB-XGEHTFHBSA-N Arg-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O HRCIIMCTUIAKQB-XGEHTFHBSA-N 0.000 description 4
- ZJBUILVYSXQNSW-YTWAJWBKSA-N Arg-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ZJBUILVYSXQNSW-YTWAJWBKSA-N 0.000 description 4
- BVLIJXXSXBUGEC-SRVKXCTJSA-N Asn-Asn-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BVLIJXXSXBUGEC-SRVKXCTJSA-N 0.000 description 4
- LUVODTFFSXVOAG-ACZMJKKPSA-N Asn-Cys-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)N)N LUVODTFFSXVOAG-ACZMJKKPSA-N 0.000 description 4
- WQLJRNRLHWJIRW-KKUMJFAQSA-N Asn-His-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC(=O)N)N)O WQLJRNRLHWJIRW-KKUMJFAQSA-N 0.000 description 4
- HNXWVVHIGTZTBO-LKXGYXEUSA-N Asn-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O HNXWVVHIGTZTBO-LKXGYXEUSA-N 0.000 description 4
- KBQOUDLMWYWXNP-YDHLFZDLSA-N Asn-Val-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC(=O)N)N KBQOUDLMWYWXNP-YDHLFZDLSA-N 0.000 description 4
- YNQIDCRRTWGHJD-ZLUOBGJFSA-N Asp-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(O)=O YNQIDCRRTWGHJD-ZLUOBGJFSA-N 0.000 description 4
- UGIBTKGQVWFTGX-BIIVOSGPSA-N Asp-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O UGIBTKGQVWFTGX-BIIVOSGPSA-N 0.000 description 4
- WSGVTKZFVJSJOG-RCOVLWMOSA-N Asp-Gly-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O WSGVTKZFVJSJOG-RCOVLWMOSA-N 0.000 description 4
- CUQDCPXNZPDYFQ-ZLUOBGJFSA-N Asp-Ser-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O CUQDCPXNZPDYFQ-ZLUOBGJFSA-N 0.000 description 4
- YUELDQUPTAYEGM-XIRDDKMYSA-N Asp-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC(=O)O)N YUELDQUPTAYEGM-XIRDDKMYSA-N 0.000 description 4
- 108091026890 Coding region Proteins 0.000 description 4
- UPJGYXRAPJWIHD-CIUDSAMLSA-N Cys-Asn-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UPJGYXRAPJWIHD-CIUDSAMLSA-N 0.000 description 4
- VIRYODQIWJNWNU-NRPADANISA-N Cys-Glu-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CS)N VIRYODQIWJNWNU-NRPADANISA-N 0.000 description 4
- ZFHXNNXMNLWKJH-HJPIBITLSA-N Cys-Tyr-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZFHXNNXMNLWKJH-HJPIBITLSA-N 0.000 description 4
- ALTQTAKGRFLRLR-GUBZILKMSA-N Cys-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CS)N ALTQTAKGRFLRLR-GUBZILKMSA-N 0.000 description 4
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 4
- 108010067306 Fibronectins Proteins 0.000 description 4
- XXLBHPPXDUWYAG-XQXXSGGOSA-N Gln-Ala-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XXLBHPPXDUWYAG-XQXXSGGOSA-N 0.000 description 4
- IPHGBVYWRKCGKG-FXQIFTODSA-N Gln-Cys-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O IPHGBVYWRKCGKG-FXQIFTODSA-N 0.000 description 4
- MFLMFRZBAJSGHK-ACZMJKKPSA-N Gln-Cys-Ser Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N MFLMFRZBAJSGHK-ACZMJKKPSA-N 0.000 description 4
- XEZWLWNGUMXAJI-QEJZJMRPSA-N Gln-Cys-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CS)NC(=O)[C@H](CCC(N)=O)N)C(O)=O)=CNC2=C1 XEZWLWNGUMXAJI-QEJZJMRPSA-N 0.000 description 4
- WBYHRQBKJGEBQJ-CIUDSAMLSA-N Gln-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)N)N)C(=O)N[C@@H](CS)C(=O)O WBYHRQBKJGEBQJ-CIUDSAMLSA-N 0.000 description 4
- HMIXCETWRYDVMO-GUBZILKMSA-N Gln-Pro-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O HMIXCETWRYDVMO-GUBZILKMSA-N 0.000 description 4
- FITIQFSXXBKFFM-NRPADANISA-N Gln-Val-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FITIQFSXXBKFFM-NRPADANISA-N 0.000 description 4
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 4
- RDDSZZJOKDVPAE-ACZMJKKPSA-N Glu-Asn-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDDSZZJOKDVPAE-ACZMJKKPSA-N 0.000 description 4
- CKOFNWCLWRYUHK-XHNCKOQMSA-N Glu-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O CKOFNWCLWRYUHK-XHNCKOQMSA-N 0.000 description 4
- FLQAKQOBSPFGKG-CIUDSAMLSA-N Glu-Cys-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FLQAKQOBSPFGKG-CIUDSAMLSA-N 0.000 description 4
- UJMNFCAHLYKWOZ-DCAQKATOSA-N Glu-Lys-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O UJMNFCAHLYKWOZ-DCAQKATOSA-N 0.000 description 4
- AAJHGGDRKHYSDH-GUBZILKMSA-N Glu-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O AAJHGGDRKHYSDH-GUBZILKMSA-N 0.000 description 4
- DXMOIVCNJIJQSC-QEJZJMRPSA-N Glu-Trp-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N DXMOIVCNJIJQSC-QEJZJMRPSA-N 0.000 description 4
- SFKMXFWWDUGXRT-NWLDYVSISA-N Glu-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCC(=O)O)N)O SFKMXFWWDUGXRT-NWLDYVSISA-N 0.000 description 4
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 4
- JSLVAHYTAJJEQH-QWRGUYRKSA-N Gly-Ser-Phe Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JSLVAHYTAJJEQH-QWRGUYRKSA-N 0.000 description 4
- 239000004471 Glycine Substances 0.000 description 4
- MKWSZEHGHSLNPF-NAKRPEOUSA-N Ile-Ala-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O)N MKWSZEHGHSLNPF-NAKRPEOUSA-N 0.000 description 4
- OVPYIUNCVSOVNF-ZPFDUUQYSA-N Ile-Gln-Pro Natural products CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O OVPYIUNCVSOVNF-ZPFDUUQYSA-N 0.000 description 4
- JODPUDMBQBIWCK-GHCJXIJMSA-N Ile-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O JODPUDMBQBIWCK-GHCJXIJMSA-N 0.000 description 4
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 4
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 4
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 4
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 4
- ZGUMORRUBUCXEH-AVGNSLFASA-N Leu-Lys-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZGUMORRUBUCXEH-AVGNSLFASA-N 0.000 description 4
- UHNQRAFSEBGZFZ-YESZJQIVSA-N Leu-Phe-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N UHNQRAFSEBGZFZ-YESZJQIVSA-N 0.000 description 4
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 4
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 4
- YKIRNDPUWONXQN-GUBZILKMSA-N Lys-Asn-Gln Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YKIRNDPUWONXQN-GUBZILKMSA-N 0.000 description 4
- KWUKZRFFKPLUPE-HJGDQZAQSA-N Lys-Asp-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWUKZRFFKPLUPE-HJGDQZAQSA-N 0.000 description 4
- CTJUSALVKAWFFU-CIUDSAMLSA-N Lys-Ser-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N CTJUSALVKAWFFU-CIUDSAMLSA-N 0.000 description 4
- CAVRAQIDHUPECU-UVOCVTCTSA-N Lys-Thr-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAVRAQIDHUPECU-UVOCVTCTSA-N 0.000 description 4
- BIWVMACFGZFIEB-VFAJRCTISA-N Lys-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCCCN)N)O BIWVMACFGZFIEB-VFAJRCTISA-N 0.000 description 4
- GILLQRYAWOMHED-DCAQKATOSA-N Lys-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN GILLQRYAWOMHED-DCAQKATOSA-N 0.000 description 4
- LQMHZERGCQJKAH-STQMWFEESA-N Met-Gly-Phe Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 LQMHZERGCQJKAH-STQMWFEESA-N 0.000 description 4
- 206010027476 Metastases Diseases 0.000 description 4
- 239000002202 Polyethylene glycol Substances 0.000 description 4
- XZONQWUEBAFQPO-HJGDQZAQSA-N Pro-Gln-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XZONQWUEBAFQPO-HJGDQZAQSA-N 0.000 description 4
- ULWBBFKQBDNGOY-RWMBFGLXSA-N Pro-Lys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N2CCC[C@@H]2C(=O)O ULWBBFKQBDNGOY-RWMBFGLXSA-N 0.000 description 4
- VPBQDHMASPJHGY-JYJNAYRXSA-N Pro-Trp-Ser Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CO)C(=O)O VPBQDHMASPJHGY-JYJNAYRXSA-N 0.000 description 4
- KHRLUIPIMIQFGT-AVGNSLFASA-N Pro-Val-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHRLUIPIMIQFGT-AVGNSLFASA-N 0.000 description 4
- UEJYSALTSUZXFV-SRVKXCTJSA-N Rigin Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O UEJYSALTSUZXFV-SRVKXCTJSA-N 0.000 description 4
- HZWAHWQZPSXNCB-BPUTZDHNSA-N Ser-Arg-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O HZWAHWQZPSXNCB-BPUTZDHNSA-N 0.000 description 4
- OBXVZEAMXFSGPU-FXQIFTODSA-N Ser-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)CN=C(N)N OBXVZEAMXFSGPU-FXQIFTODSA-N 0.000 description 4
- VAUMZJHYZQXZBQ-WHFBIAKZSA-N Ser-Asn-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O VAUMZJHYZQXZBQ-WHFBIAKZSA-N 0.000 description 4
- BLPYXIXXCFVIIF-FXQIFTODSA-N Ser-Cys-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CO)N)CN=C(N)N BLPYXIXXCFVIIF-FXQIFTODSA-N 0.000 description 4
- MOVJSUIKUNCVMG-ZLUOBGJFSA-N Ser-Cys-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N)O MOVJSUIKUNCVMG-ZLUOBGJFSA-N 0.000 description 4
- JCLAFVNDBJMLBC-JBDRJPRFSA-N Ser-Ser-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JCLAFVNDBJMLBC-JBDRJPRFSA-N 0.000 description 4
- ZWSZBWAFDZRBNM-UBHSHLNASA-N Ser-Trp-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O ZWSZBWAFDZRBNM-UBHSHLNASA-N 0.000 description 4
- RCOUFINCYASMDN-GUBZILKMSA-N Ser-Val-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O RCOUFINCYASMDN-GUBZILKMSA-N 0.000 description 4
- HNDMFDBQXYZSRM-IHRRRGAJSA-N Ser-Val-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HNDMFDBQXYZSRM-IHRRRGAJSA-N 0.000 description 4
- MQBTXMPQNCGSSZ-OSUNSFLBSA-N Thr-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N MQBTXMPQNCGSSZ-OSUNSFLBSA-N 0.000 description 4
- VFEHSAJCWWHDBH-RHYQMDGZSA-N Thr-Arg-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VFEHSAJCWWHDBH-RHYQMDGZSA-N 0.000 description 4
- LAFLAXHTDVNVEL-WDCWCFNPSA-N Thr-Gln-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O LAFLAXHTDVNVEL-WDCWCFNPSA-N 0.000 description 4
- IMULJHHGAUZZFE-MBLNEYKQSA-N Thr-Gly-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IMULJHHGAUZZFE-MBLNEYKQSA-N 0.000 description 4
- FQPDRTDDEZXCEC-SVSWQMSJSA-N Thr-Ile-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O FQPDRTDDEZXCEC-SVSWQMSJSA-N 0.000 description 4
- FIFDDJFLNVAVMS-RHYQMDGZSA-N Thr-Leu-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O FIFDDJFLNVAVMS-RHYQMDGZSA-N 0.000 description 4
- MROIJTGJGIDEEJ-RCWTZXSCSA-N Thr-Pro-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 MROIJTGJGIDEEJ-RCWTZXSCSA-N 0.000 description 4
- NBIIPOKZPUGATB-BWBBJGPYSA-N Thr-Ser-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N)O NBIIPOKZPUGATB-BWBBJGPYSA-N 0.000 description 4
- 208000003721 Triple Negative Breast Neoplasms Diseases 0.000 description 4
- SSSDKJMQMZTMJP-BVSLBCMMSA-N Trp-Tyr-Val Chemical compound C([C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CC=C(O)C=C1 SSSDKJMQMZTMJP-BVSLBCMMSA-N 0.000 description 4
- GZUIDWDVMWZSMI-KKUMJFAQSA-N Tyr-Lys-Cys Chemical compound NCCCC[C@@H](C(=O)N[C@@H](CS)C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GZUIDWDVMWZSMI-KKUMJFAQSA-N 0.000 description 4
- PWKMJDQXKCENMF-MEYUZBJRSA-N Tyr-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O PWKMJDQXKCENMF-MEYUZBJRSA-N 0.000 description 4
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 4
- QPZMOUMNTGTEFR-ZKWXMUAHSA-N Val-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N QPZMOUMNTGTEFR-ZKWXMUAHSA-N 0.000 description 4
- SCBITHMBEJNRHC-LSJOCFKGSA-N Val-Asp-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N SCBITHMBEJNRHC-LSJOCFKGSA-N 0.000 description 4
- UEHRGZCNLSWGHK-DLOVCJGASA-N Val-Glu-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UEHRGZCNLSWGHK-DLOVCJGASA-N 0.000 description 4
- IJGPOONOTBNTFS-GVXVVHGQSA-N Val-Lys-Glu Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O IJGPOONOTBNTFS-GVXVVHGQSA-N 0.000 description 4
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 4
- BGTDGENDNWGMDQ-KJEVXHAQSA-N Val-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N)O BGTDGENDNWGMDQ-KJEVXHAQSA-N 0.000 description 4
- 238000001042 affinity chromatography Methods 0.000 description 4
- 108010044940 alanylglutamine Proteins 0.000 description 4
- 230000003510 anti-fibrotic effect Effects 0.000 description 4
- 108010008355 arginyl-glutamine Proteins 0.000 description 4
- 229960000074 biopharmaceutical Drugs 0.000 description 4
- 210000004899 c-terminal region Anatomy 0.000 description 4
- 230000009787 cardiac fibrosis Effects 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 229940079593 drug Drugs 0.000 description 4
- 230000007705 epithelial mesenchymal transition Effects 0.000 description 4
- 210000002744 extracellular matrix Anatomy 0.000 description 4
- 239000008103 glucose Substances 0.000 description 4
- 108010010147 glycylglutamine Proteins 0.000 description 4
- 230000002998 immunogenetic effect Effects 0.000 description 4
- 230000006698 induction Effects 0.000 description 4
- 108010027338 isoleucylcysteine Proteins 0.000 description 4
- 108010057821 leucylproline Proteins 0.000 description 4
- 238000011068 loading method Methods 0.000 description 4
- 239000012516 mab select resin Substances 0.000 description 4
- 208000030159 metabolic disease Diseases 0.000 description 4
- 108010073101 phenylalanylleucine Proteins 0.000 description 4
- 230000035755 proliferation Effects 0.000 description 4
- 230000001105 regulatory effect Effects 0.000 description 4
- 108010005652 splenotritin Proteins 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- 208000022679 triple-negative breast carcinoma Diseases 0.000 description 4
- 108010084932 tryptophyl-proline Proteins 0.000 description 4
- 229910052721 tungsten Inorganic materials 0.000 description 4
- 108010027345 wheylin-1 peptide Proteins 0.000 description 4
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 3
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 3
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 3
- OLVCTPPSXNRGKV-GUBZILKMSA-N Ala-Pro-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OLVCTPPSXNRGKV-GUBZILKMSA-N 0.000 description 3
- 239000004475 Arginine Substances 0.000 description 3
- NYGILGUOUOXGMJ-YUMQZZPRSA-N Asn-Lys-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O NYGILGUOUOXGMJ-YUMQZZPRSA-N 0.000 description 3
- DPNWSMBUYCLEDG-CIUDSAMLSA-N Asp-Lys-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O DPNWSMBUYCLEDG-CIUDSAMLSA-N 0.000 description 3
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 3
- 208000023275 Autoimmune disease Diseases 0.000 description 3
- 208000006545 Chronic Obstructive Pulmonary Disease Diseases 0.000 description 3
- AQPZYBSRDRZBAG-AVGNSLFASA-N Gln-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N AQPZYBSRDRZBAG-AVGNSLFASA-N 0.000 description 3
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 description 3
- QDMVXRNLOPTPIE-WDCWCFNPSA-N Glu-Lys-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QDMVXRNLOPTPIE-WDCWCFNPSA-N 0.000 description 3
- YHOJJFFTSMWVGR-HJGDQZAQSA-N Glu-Met-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YHOJJFFTSMWVGR-HJGDQZAQSA-N 0.000 description 3
- HAOUOFNNJJLVNS-BQBZGAKWSA-N Gly-Pro-Ser Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O HAOUOFNNJJLVNS-BQBZGAKWSA-N 0.000 description 3
- MAABHGXCIBEYQR-XVYDVKMFSA-N His-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N MAABHGXCIBEYQR-XVYDVKMFSA-N 0.000 description 3
- HIAHVKLTHNOENC-HGNGGELXSA-N His-Glu-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HIAHVKLTHNOENC-HGNGGELXSA-N 0.000 description 3
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 3
- JHNJNTMTZHEDLJ-NAKRPEOUSA-N Ile-Ser-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JHNJNTMTZHEDLJ-NAKRPEOUSA-N 0.000 description 3
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 3
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 3
- BKTXKJMNTSMJDQ-AVGNSLFASA-N Leu-His-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BKTXKJMNTSMJDQ-AVGNSLFASA-N 0.000 description 3
- LINKCQUOMUDLKN-KATARQTJSA-N Leu-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(C)C)N)O LINKCQUOMUDLKN-KATARQTJSA-N 0.000 description 3
- WSXTWLJHTLRFLW-SRVKXCTJSA-N Lys-Ala-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O WSXTWLJHTLRFLW-SRVKXCTJSA-N 0.000 description 3
- ODUQLUADRKMHOZ-JYJNAYRXSA-N Lys-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N)O ODUQLUADRKMHOZ-JYJNAYRXSA-N 0.000 description 3
- YKBSXQFZWFXFIB-VOAKCMCISA-N Lys-Thr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O YKBSXQFZWFXFIB-VOAKCMCISA-N 0.000 description 3
- GODBLDDYHFTUAH-CIUDSAMLSA-N Met-Asp-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O GODBLDDYHFTUAH-CIUDSAMLSA-N 0.000 description 3
- 239000002033 PVDF binder Substances 0.000 description 3
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 3
- 108020004511 Recombinant DNA Proteins 0.000 description 3
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 3
- 201000009594 Systemic Scleroderma Diseases 0.000 description 3
- 206010042953 Systemic sclerosis Diseases 0.000 description 3
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 3
- 239000004473 Threonine Substances 0.000 description 3
- QYSBJAUCUKHSLU-JYJNAYRXSA-N Tyr-Arg-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O QYSBJAUCUKHSLU-JYJNAYRXSA-N 0.000 description 3
- AHHJARQXFFGOKF-NRPADANISA-N Val-Glu-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N AHHJARQXFFGOKF-NRPADANISA-N 0.000 description 3
- 238000007792 addition Methods 0.000 description 3
- 108010047495 alanylglycine Proteins 0.000 description 3
- 108010087924 alanylproline Proteins 0.000 description 3
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 230000003042 antagnostic effect Effects 0.000 description 3
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 3
- 235000009697 arginine Nutrition 0.000 description 3
- 235000009582 asparagine Nutrition 0.000 description 3
- 229960001230 asparagine Drugs 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 3
- 239000012501 chromatography medium Substances 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 239000000539 dimer Substances 0.000 description 3
- 208000016097 disease of metabolism Diseases 0.000 description 3
- 239000011521 glass Substances 0.000 description 3
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 3
- 230000012010 growth Effects 0.000 description 3
- 238000004128 high performance liquid chromatography Methods 0.000 description 3
- 230000001976 improved effect Effects 0.000 description 3
- 208000027866 inflammatory disease Diseases 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 210000004185 liver Anatomy 0.000 description 3
- 108010009298 lysylglutamic acid Proteins 0.000 description 3
- 230000009401 metastasis Effects 0.000 description 3
- 108010068617 neonatal Fc receptor Proteins 0.000 description 3
- 230000003472 neutralizing effect Effects 0.000 description 3
- 230000001575 pathological effect Effects 0.000 description 3
- 229920002981 polyvinylidene fluoride Polymers 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 230000006337 proteolytic cleavage Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 3
- 238000002741 site-directed mutagenesis Methods 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 238000002560 therapeutic procedure Methods 0.000 description 3
- 208000001072 type 2 diabetes mellitus Diseases 0.000 description 3
- 238000012800 visualization Methods 0.000 description 3
- PRDFBSVERLRRMY-UHFFFAOYSA-N 2'-(4-ethoxyphenyl)-5-(4-methylpiperazin-1-yl)-2,5'-bibenzimidazole Chemical compound C1=CC(OCC)=CC=C1C1=NC2=CC=C(C=3NC4=CC(=CC=C4N=3)N3CCN(C)CC3)C=C2N1 PRDFBSVERLRRMY-UHFFFAOYSA-N 0.000 description 2
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 2
- FWBHETKCLVMNFS-UHFFFAOYSA-N 4',6-Diamino-2-phenylindol Chemical compound C1=CC(C(=N)N)=CC=C1C1=CC2=CC=C(C(N)=N)C=C2N1 FWBHETKCLVMNFS-UHFFFAOYSA-N 0.000 description 2
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 2
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 2
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 2
- GIMTZGADWZTZGV-DCAQKATOSA-N Arg-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N GIMTZGADWZTZGV-DCAQKATOSA-N 0.000 description 2
- ZUVMUOOHJYNJPP-XIRDDKMYSA-N Arg-Trp-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZUVMUOOHJYNJPP-XIRDDKMYSA-N 0.000 description 2
- SRUUBQBAVNQZGJ-LAEOZQHASA-N Asn-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N SRUUBQBAVNQZGJ-LAEOZQHASA-N 0.000 description 2
- WONGRTVAMHFGBE-WDSKDSINSA-N Asn-Gly-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N WONGRTVAMHFGBE-WDSKDSINSA-N 0.000 description 2
- QNNBHTFDFFFHGC-KKUMJFAQSA-N Asn-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QNNBHTFDFFFHGC-KKUMJFAQSA-N 0.000 description 2
- PDECQIHABNQRHN-GUBZILKMSA-N Asp-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(O)=O PDECQIHABNQRHN-GUBZILKMSA-N 0.000 description 2
- XXAMCEGRCZQGEM-ZLUOBGJFSA-N Asp-Ser-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O XXAMCEGRCZQGEM-ZLUOBGJFSA-N 0.000 description 2
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 2
- WAEDSQFVZJUHLI-BYULHYEWSA-N Asp-Val-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WAEDSQFVZJUHLI-BYULHYEWSA-N 0.000 description 2
- 206010005003 Bladder cancer Diseases 0.000 description 2
- 208000003174 Brain Neoplasms Diseases 0.000 description 2
- 101150042405 CCN1 gene Proteins 0.000 description 2
- 101100283604 Caenorhabditis elegans pigk-1 gene Proteins 0.000 description 2
- 206010008342 Cervix carcinoma Diseases 0.000 description 2
- TVYMKYUSZSVOAG-ZLUOBGJFSA-N Cys-Ala-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O TVYMKYUSZSVOAG-ZLUOBGJFSA-N 0.000 description 2
- HNNGTYHNYDOSKV-FXQIFTODSA-N Cys-Cys-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CS)N HNNGTYHNYDOSKV-FXQIFTODSA-N 0.000 description 2
- LYSHSHHDBVKJRN-JBDRJPRFSA-N Cys-Ile-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CS)N LYSHSHHDBVKJRN-JBDRJPRFSA-N 0.000 description 2
- OTXLNICGSXPGQF-KBIXCLLPSA-N Cys-Ile-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTXLNICGSXPGQF-KBIXCLLPSA-N 0.000 description 2
- PDRMRVHPAQKTLT-NAKRPEOUSA-N Cys-Ile-Val Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O PDRMRVHPAQKTLT-NAKRPEOUSA-N 0.000 description 2
- NDNZRWUDUMTITL-FXQIFTODSA-N Cys-Ser-Val Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NDNZRWUDUMTITL-FXQIFTODSA-N 0.000 description 2
- NVEASDQHBRZPSU-BQBZGAKWSA-N Gln-Gln-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O NVEASDQHBRZPSU-BQBZGAKWSA-N 0.000 description 2
- CGVWDTRDPLOMHZ-FXQIFTODSA-N Gln-Glu-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O CGVWDTRDPLOMHZ-FXQIFTODSA-N 0.000 description 2
- SNLOOPZHAQDMJG-CIUDSAMLSA-N Gln-Glu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SNLOOPZHAQDMJG-CIUDSAMLSA-N 0.000 description 2
- KCJJFESQRXGTGC-BQBZGAKWSA-N Gln-Glu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O KCJJFESQRXGTGC-BQBZGAKWSA-N 0.000 description 2
- ZEEPYMXTJWIMSN-GUBZILKMSA-N Gln-Lys-Ser Chemical compound NCCCC[C@@H](C(=O)N[C@@H](CO)C(O)=O)NC(=O)[C@@H](N)CCC(N)=O ZEEPYMXTJWIMSN-GUBZILKMSA-N 0.000 description 2
- WZZSKAJIHTUUSG-ACZMJKKPSA-N Glu-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O WZZSKAJIHTUUSG-ACZMJKKPSA-N 0.000 description 2
- OJGLIOXAKGFFDW-SRVKXCTJSA-N Glu-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N OJGLIOXAKGFFDW-SRVKXCTJSA-N 0.000 description 2
- OWVURWCRZZMAOZ-XHNCKOQMSA-N Glu-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N)C(=O)O OWVURWCRZZMAOZ-XHNCKOQMSA-N 0.000 description 2
- WLIPTFCZLHCNFD-LPEHRKFASA-N Glu-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O WLIPTFCZLHCNFD-LPEHRKFASA-N 0.000 description 2
- QQLBPVKLJBAXBS-FXQIFTODSA-N Glu-Glu-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QQLBPVKLJBAXBS-FXQIFTODSA-N 0.000 description 2
- UHVIQGKBMXEVGN-WDSKDSINSA-N Glu-Gly-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O UHVIQGKBMXEVGN-WDSKDSINSA-N 0.000 description 2
- BFEZQZKEPRKKHV-SRVKXCTJSA-N Glu-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O BFEZQZKEPRKKHV-SRVKXCTJSA-N 0.000 description 2
- YQPFCZVKMUVZIN-AUTRQRHGSA-N Glu-Val-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQPFCZVKMUVZIN-AUTRQRHGSA-N 0.000 description 2
- MFVQGXGQRIXBPK-WDSKDSINSA-N Gly-Ala-Glu Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFVQGXGQRIXBPK-WDSKDSINSA-N 0.000 description 2
- SYOJVRNQCXYEOV-XVKPBYJWSA-N Gly-Val-Glu Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SYOJVRNQCXYEOV-XVKPBYJWSA-N 0.000 description 2
- 239000007995 HEPES buffer Substances 0.000 description 2
- 206010019280 Heart failures Diseases 0.000 description 2
- SDTPKSOWFXBACN-GUBZILKMSA-N His-Glu-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O SDTPKSOWFXBACN-GUBZILKMSA-N 0.000 description 2
- CCUSLCQWVMWTIS-IXOXFDKPSA-N His-Thr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O CCUSLCQWVMWTIS-IXOXFDKPSA-N 0.000 description 2
- CSTDQOOBZBAJKE-BWAGICSOSA-N His-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CN=CN2)N)O CSTDQOOBZBAJKE-BWAGICSOSA-N 0.000 description 2
- 101000777555 Homo sapiens CCN family member 3 Proteins 0.000 description 2
- 101001027128 Homo sapiens Fibronectin Proteins 0.000 description 2
- 101000766306 Homo sapiens Serotransferrin Proteins 0.000 description 2
- FFAUOCITXBMRBT-YTFOTSKYSA-N Ile-Lys-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FFAUOCITXBMRBT-YTFOTSKYSA-N 0.000 description 2
- PELCGFMHLZXWBQ-BJDJZHNGSA-N Ile-Ser-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)O)N PELCGFMHLZXWBQ-BJDJZHNGSA-N 0.000 description 2
- VGSPNSSCMOHRRR-BJDJZHNGSA-N Ile-Ser-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N VGSPNSSCMOHRRR-BJDJZHNGSA-N 0.000 description 2
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 2
- TYYLDKGBCJGJGW-UHFFFAOYSA-N L-tryptophan-L-tyrosine Natural products C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 TYYLDKGBCJGJGW-UHFFFAOYSA-N 0.000 description 2
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 2
- BTNXKBVLWJBTNR-SRVKXCTJSA-N Leu-His-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O BTNXKBVLWJBTNR-SRVKXCTJSA-N 0.000 description 2
- OVZLLFONXILPDZ-VOAKCMCISA-N Leu-Lys-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OVZLLFONXILPDZ-VOAKCMCISA-N 0.000 description 2
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 2
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 2
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 2
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 2
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 2
- CFVQPNSCQMKDPB-CIUDSAMLSA-N Lys-Cys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)O)N CFVQPNSCQMKDPB-CIUDSAMLSA-N 0.000 description 2
- MWVUEPNEPWMFBD-SRVKXCTJSA-N Lys-Cys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCCCN MWVUEPNEPWMFBD-SRVKXCTJSA-N 0.000 description 2
- DRCILAJNUJKAHC-SRVKXCTJSA-N Lys-Glu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DRCILAJNUJKAHC-SRVKXCTJSA-N 0.000 description 2
- GQFDWEDHOQRNLC-QWRGUYRKSA-N Lys-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN GQFDWEDHOQRNLC-QWRGUYRKSA-N 0.000 description 2
- LUTDBHBIHHREDC-IHRRRGAJSA-N Lys-Pro-Lys Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O LUTDBHBIHHREDC-IHRRRGAJSA-N 0.000 description 2
- IEVXCWPVBYCJRZ-IXOXFDKPSA-N Lys-Thr-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IEVXCWPVBYCJRZ-IXOXFDKPSA-N 0.000 description 2
- 108010000684 Matrix Metalloproteinases Proteins 0.000 description 2
- 102000002274 Matrix Metalloproteinases Human genes 0.000 description 2
- DJJBHQHOZLUBCN-WDSOQIARSA-N Met-Lys-Trp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O DJJBHQHOZLUBCN-WDSOQIARSA-N 0.000 description 2
- IHRFZLQEQVHXFA-RHYQMDGZSA-N Met-Thr-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCCN IHRFZLQEQVHXFA-RHYQMDGZSA-N 0.000 description 2
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 2
- 208000035327 Oestrogen receptor positive breast cancer Diseases 0.000 description 2
- 206010033128 Ovarian cancer Diseases 0.000 description 2
- 206010061535 Ovarian neoplasm Diseases 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 2
- ULECEJGNDHWSKD-QEJZJMRPSA-N Phe-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 ULECEJGNDHWSKD-QEJZJMRPSA-N 0.000 description 2
- JOXIIFVCSATTDH-IHPCNDPISA-N Phe-Asn-Trp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N JOXIIFVCSATTDH-IHPCNDPISA-N 0.000 description 2
- ZJPGOXWRFNKIQL-JYJNAYRXSA-N Phe-Pro-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=CC=C1 ZJPGOXWRFNKIQL-JYJNAYRXSA-N 0.000 description 2
- MCIXMYKSPQUMJG-SRVKXCTJSA-N Phe-Ser-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MCIXMYKSPQUMJG-SRVKXCTJSA-N 0.000 description 2
- 102100032543 Phosphatidylinositol 3,4,5-trisphosphate 3-phosphatase and dual-specificity protein phosphatase PTEN Human genes 0.000 description 2
- LCWXSALTPTZKNM-CIUDSAMLSA-N Pro-Cys-Glu Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)O)C(=O)O LCWXSALTPTZKNM-CIUDSAMLSA-N 0.000 description 2
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 2
- FDMKYQQYJKYCLV-GUBZILKMSA-N Pro-Pro-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 FDMKYQQYJKYCLV-GUBZILKMSA-N 0.000 description 2
- 206010060862 Prostate cancer Diseases 0.000 description 2
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 2
- 241000219061 Rheum Species 0.000 description 2
- KNCJWSPMTFFJII-ZLUOBGJFSA-N Ser-Cys-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O KNCJWSPMTFFJII-ZLUOBGJFSA-N 0.000 description 2
- XUDRHBPSPAPDJP-SRVKXCTJSA-N Ser-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO XUDRHBPSPAPDJP-SRVKXCTJSA-N 0.000 description 2
- QJKPECIAWNNKIT-KKUMJFAQSA-N Ser-Lys-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QJKPECIAWNNKIT-KKUMJFAQSA-N 0.000 description 2
- RHAPJNVNWDBFQI-BQBZGAKWSA-N Ser-Pro-Gly Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O RHAPJNVNWDBFQI-BQBZGAKWSA-N 0.000 description 2
- 208000005718 Stomach Neoplasms Diseases 0.000 description 2
- 101710172711 Structural protein Proteins 0.000 description 2
- KWQBJOUOSNJDRR-XAVMHZPKSA-N Thr-Cys-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N)O KWQBJOUOSNJDRR-XAVMHZPKSA-N 0.000 description 2
- XKWABWFMQXMUMT-HJGDQZAQSA-N Thr-Pro-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XKWABWFMQXMUMT-HJGDQZAQSA-N 0.000 description 2
- ZESGVALRVJIVLZ-VFCFLDTKSA-N Thr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O ZESGVALRVJIVLZ-VFCFLDTKSA-N 0.000 description 2
- 229920004890 Triton X-100 Polymers 0.000 description 2
- 239000013504 Triton X-100 Substances 0.000 description 2
- UDCHKDYNMRJYMI-QEJZJMRPSA-N Trp-Glu-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UDCHKDYNMRJYMI-QEJZJMRPSA-N 0.000 description 2
- XGFGVFMXDXALEV-XIRDDKMYSA-N Trp-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N XGFGVFMXDXALEV-XIRDDKMYSA-N 0.000 description 2
- UMSZZGTXGKHTFJ-SRVKXCTJSA-N Tyr-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 UMSZZGTXGKHTFJ-SRVKXCTJSA-N 0.000 description 2
- SQUMHUZLJDUROQ-YDHLFZDLSA-N Tyr-Val-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O SQUMHUZLJDUROQ-YDHLFZDLSA-N 0.000 description 2
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 description 2
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 description 2
- 108091008605 VEGF receptors Proteins 0.000 description 2
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 2
- HJSLDXZAZGFPDK-ULQDDVLXSA-N Val-Phe-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C(C)C)N HJSLDXZAZGFPDK-ULQDDVLXSA-N 0.000 description 2
- KISFXYYRKKNLOP-IHRRRGAJSA-N Val-Phe-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N KISFXYYRKKNLOP-IHRRRGAJSA-N 0.000 description 2
- KSFXWENSJABBFI-ZKWXMUAHSA-N Val-Ser-Asn Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KSFXWENSJABBFI-ZKWXMUAHSA-N 0.000 description 2
- BZDGLJPROOOUOZ-XGEHTFHBSA-N Val-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N)O BZDGLJPROOOUOZ-XGEHTFHBSA-N 0.000 description 2
- PDDJTOSAVNRJRH-UNQGMJICSA-N Val-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](C(C)C)N)O PDDJTOSAVNRJRH-UNQGMJICSA-N 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 239000000654 additive Substances 0.000 description 2
- 108010081667 aflibercept Proteins 0.000 description 2
- 229960002833 aflibercept Drugs 0.000 description 2
- 206010064930 age-related macular degeneration Diseases 0.000 description 2
- 206010002026 amyotrophic lateral sclerosis Diseases 0.000 description 2
- 230000008485 antagonism Effects 0.000 description 2
- 230000006907 apoptotic process Effects 0.000 description 2
- 108010062796 arginyllysine Proteins 0.000 description 2
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000000975 bioactive effect Effects 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 2
- 210000000988 bone and bone Anatomy 0.000 description 2
- 229940098773 bovine serum albumin Drugs 0.000 description 2
- 210000004900 c-terminal fragment Anatomy 0.000 description 2
- 230000021164 cell adhesion Effects 0.000 description 2
- 210000003855 cell nucleus Anatomy 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 201000010881 cervical cancer Diseases 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 208000019425 cirrhosis of liver Diseases 0.000 description 2
- 239000011248 coating agent Substances 0.000 description 2
- 238000000576 coating method Methods 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 238000012258 culturing Methods 0.000 description 2
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 2
- 108010004073 cysteinylcysteine Proteins 0.000 description 2
- LEVWYRKDKASIDU-IMJSIDKUSA-N cystine group Chemical group C([C@@H](C(=O)O)N)SSC[C@@H](C(=O)O)N LEVWYRKDKASIDU-IMJSIDKUSA-N 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 229910052805 deuterium Inorganic materials 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 201000007281 estrogen-receptor positive breast cancer Diseases 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 239000013613 expression plasmid Substances 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 206010017758 gastric cancer Diseases 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 2
- 229910052737 gold Inorganic materials 0.000 description 2
- 239000010931 gold Substances 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 210000002216 heart Anatomy 0.000 description 2
- 210000000777 hematopoietic system Anatomy 0.000 description 2
- 239000000710 homodimer Substances 0.000 description 2
- 229920001519 homopolymer Polymers 0.000 description 2
- 102000046724 human CCN5 Human genes 0.000 description 2
- 238000007654 immersion Methods 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 230000002757 inflammatory effect Effects 0.000 description 2
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 2
- 125000000741 isoleucyl group Chemical group [H]N([H])C(C(C([H])([H])[H])C([H])([H])C([H])([H])[H])C(=O)O* 0.000 description 2
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 2
- 108010091871 leucylmethionine Proteins 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 201000007270 liver cancer Diseases 0.000 description 2
- 208000014018 liver neoplasm Diseases 0.000 description 2
- 239000012139 lysis buffer Substances 0.000 description 2
- 108010003700 lysyl aspartic acid Proteins 0.000 description 2
- 108010017391 lysylvaline Proteins 0.000 description 2
- 230000003211 malignant effect Effects 0.000 description 2
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 230000005012 migration Effects 0.000 description 2
- 238000013508 migration Methods 0.000 description 2
- 230000001617 migratory effect Effects 0.000 description 2
- 230000001613 neoplastic effect Effects 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 201000002528 pancreatic cancer Diseases 0.000 description 2
- 208000008443 pancreatic carcinoma Diseases 0.000 description 2
- 230000006320 pegylation Effects 0.000 description 2
- 230000003285 pharmacodynamic effect Effects 0.000 description 2
- 108010074082 phenylalanyl-alanyl-lysine Proteins 0.000 description 2
- 102000040430 polynucleotide Human genes 0.000 description 2
- 108091033319 polynucleotide Proteins 0.000 description 2
- 239000002157 polynucleotide Substances 0.000 description 2
- 125000001500 prolyl group Chemical group [H]N1C([H])(C(=O)[*])C([H])([H])C([H])([H])C1([H])[H] 0.000 description 2
- 230000004952 protein activity Effects 0.000 description 2
- 108020001580 protein domains Proteins 0.000 description 2
- XNSAINXGIQZQOO-SRVKXCTJSA-N protirelin Chemical compound NC(=O)[C@@H]1CCCN1C(=O)[C@@H](NC(=O)[C@H]1NC(=O)CC1)CC1=CN=CN1 XNSAINXGIQZQOO-SRVKXCTJSA-N 0.000 description 2
- 238000003753 real-time PCR Methods 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 230000013878 renal filtration Effects 0.000 description 2
- 230000008943 replicative senescence Effects 0.000 description 2
- 206010039073 rheumatoid arthritis Diseases 0.000 description 2
- 102000034285 signal transducing proteins Human genes 0.000 description 2
- 108091006024 signal transducing proteins Proteins 0.000 description 2
- 230000019491 signal transduction Effects 0.000 description 2
- 238000001542 size-exclusion chromatography Methods 0.000 description 2
- 210000003491 skin Anatomy 0.000 description 2
- 210000002460 smooth muscle Anatomy 0.000 description 2
- 238000010186 staining Methods 0.000 description 2
- 230000000638 stimulation Effects 0.000 description 2
- 201000011549 stomach cancer Diseases 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 108010044292 tryptophyltyrosine Proteins 0.000 description 2
- 201000005112 urinary bladder cancer Diseases 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- PKOHVHWNGUHYRE-ZFWWWQNUSA-N (2s)-1-[2-[[(2s)-2-amino-3-(1h-indol-3-yl)propanoyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound O=C([C@H](CC=1C2=CC=CC=C2NC=1)N)NCC(=O)N1CCC[C@H]1C(O)=O PKOHVHWNGUHYRE-ZFWWWQNUSA-N 0.000 description 1
- 101150020966 Acta2 gene Proteins 0.000 description 1
- 208000009304 Acute Kidney Injury Diseases 0.000 description 1
- 208000024893 Acute lymphoblastic leukemia Diseases 0.000 description 1
- 208000014697 Acute lymphocytic leukaemia Diseases 0.000 description 1
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 1
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 1
- WDIYWDJLXOCGRW-ACZMJKKPSA-N Ala-Asp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WDIYWDJLXOCGRW-ACZMJKKPSA-N 0.000 description 1
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 1
- APKFDSVGJQXUKY-KKGHZKTASA-N Amphotericin-B Natural products O[C@H]1[C@@H](N)[C@H](O)[C@@H](C)O[C@H]1O[C@H]1C=CC=CC=CC=CC=CC=CC=C[C@H](C)[C@@H](O)[C@@H](C)[C@H](C)OC(=O)C[C@H](O)C[C@H](O)CC[C@@H](O)[C@H](O)C[C@H](O)C[C@](O)(C[C@H](O)[C@H]2C(O)=O)O[C@H]2C1 APKFDSVGJQXUKY-KKGHZKTASA-N 0.000 description 1
- MCYJBCKCAPERSE-FXQIFTODSA-N Arg-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N MCYJBCKCAPERSE-FXQIFTODSA-N 0.000 description 1
- OZNSCVPYWZRQPY-CIUDSAMLSA-N Arg-Asp-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OZNSCVPYWZRQPY-CIUDSAMLSA-N 0.000 description 1
- HPSVTWMFWCHKFN-GARJFASQSA-N Arg-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O HPSVTWMFWCHKFN-GARJFASQSA-N 0.000 description 1
- NXDXECQFKHXHAM-HJGDQZAQSA-N Arg-Glu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NXDXECQFKHXHAM-HJGDQZAQSA-N 0.000 description 1
- UPKMBGAAEZGHOC-RWMBFGLXSA-N Arg-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O UPKMBGAAEZGHOC-RWMBFGLXSA-N 0.000 description 1
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 1
- JEOCWTUOMKEEMF-RHYQMDGZSA-N Arg-Leu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEOCWTUOMKEEMF-RHYQMDGZSA-N 0.000 description 1
- AFNHFVVOJZBIJD-GUBZILKMSA-N Arg-Met-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O AFNHFVVOJZBIJD-GUBZILKMSA-N 0.000 description 1
- ICRHGPYYXMWHIE-LPEHRKFASA-N Arg-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ICRHGPYYXMWHIE-LPEHRKFASA-N 0.000 description 1
- HUZGPXBILPMCHM-IHRRRGAJSA-N Asn-Arg-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HUZGPXBILPMCHM-IHRRRGAJSA-N 0.000 description 1
- VWJFQGXPYOPXJH-ZLUOBGJFSA-N Asn-Cys-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)C(=O)N VWJFQGXPYOPXJH-ZLUOBGJFSA-N 0.000 description 1
- RCFGLXMZDYNRSC-CIUDSAMLSA-N Asn-Lys-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O RCFGLXMZDYNRSC-CIUDSAMLSA-N 0.000 description 1
- JTXVXGXTRXMOFJ-FXQIFTODSA-N Asn-Pro-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O JTXVXGXTRXMOFJ-FXQIFTODSA-N 0.000 description 1
- ZELQAFZSJOBEQS-ACZMJKKPSA-N Asp-Asn-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZELQAFZSJOBEQS-ACZMJKKPSA-N 0.000 description 1
- DGKCOYGQLNWNCJ-ACZMJKKPSA-N Asp-Glu-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O DGKCOYGQLNWNCJ-ACZMJKKPSA-N 0.000 description 1
- KTTCQQNRRLCIBC-GHCJXIJMSA-N Asp-Ile-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O KTTCQQNRRLCIBC-GHCJXIJMSA-N 0.000 description 1
- ORRJQLIATJDMQM-HJGDQZAQSA-N Asp-Leu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O ORRJQLIATJDMQM-HJGDQZAQSA-N 0.000 description 1
- DRCOAZZDQRCGGP-GHCJXIJMSA-N Asp-Ser-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DRCOAZZDQRCGGP-GHCJXIJMSA-N 0.000 description 1
- QOJJMJKTMKNFEF-ZKWXMUAHSA-N Asp-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O QOJJMJKTMKNFEF-ZKWXMUAHSA-N 0.000 description 1
- 201000001320 Atherosclerosis Diseases 0.000 description 1
- 208000035913 Atypical hemolytic uremic syndrome Diseases 0.000 description 1
- 206010004664 Biliary fibrosis Diseases 0.000 description 1
- 239000002028 Biomass Substances 0.000 description 1
- 108010006654 Bleomycin Proteins 0.000 description 1
- 206010005949 Bone cancer Diseases 0.000 description 1
- 208000018084 Bone neoplasm Diseases 0.000 description 1
- 238000007809 Boyden Chamber assay Methods 0.000 description 1
- 101150008656 COL1A1 gene Proteins 0.000 description 1
- 206010007572 Cardiac hypertrophy Diseases 0.000 description 1
- 208000006029 Cardiomegaly Diseases 0.000 description 1
- 208000031229 Cardiomyopathies Diseases 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 108010078791 Carrier Proteins Proteins 0.000 description 1
- 101150091877 Ccn2 gene Proteins 0.000 description 1
- 108010001857 Cell Surface Receptors Proteins 0.000 description 1
- 102000000844 Cell Surface Receptors Human genes 0.000 description 1
- 208000000668 Chronic Pancreatitis Diseases 0.000 description 1
- 206010063209 Chronic allograft nephropathy Diseases 0.000 description 1
- 208000032544 Cicatrix Diseases 0.000 description 1
- 206010009900 Colitis ulcerative Diseases 0.000 description 1
- 102000008186 Collagen Human genes 0.000 description 1
- 108010035532 Collagen Proteins 0.000 description 1
- 102100033601 Collagen alpha-1(I) chain Human genes 0.000 description 1
- 206010009944 Colon cancer Diseases 0.000 description 1
- 208000001333 Colorectal Neoplasms Diseases 0.000 description 1
- 206010052358 Colorectal cancer metastatic Diseases 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- 208000011231 Crohn disease Diseases 0.000 description 1
- 201000001200 Crouzon syndrome-acanthosis nigricans syndrome Diseases 0.000 description 1
- QFMCHXSGIZPBKG-ZLUOBGJFSA-N Cys-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N QFMCHXSGIZPBKG-ZLUOBGJFSA-N 0.000 description 1
- HYKFOHGZGLOCAY-ZLUOBGJFSA-N Cys-Cys-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O HYKFOHGZGLOCAY-ZLUOBGJFSA-N 0.000 description 1
- UDPSLLFHOLGXBY-FXQIFTODSA-N Cys-Glu-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDPSLLFHOLGXBY-FXQIFTODSA-N 0.000 description 1
- LBOLGUYQEPZSKM-YUMQZZPRSA-N Cys-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CS)N LBOLGUYQEPZSKM-YUMQZZPRSA-N 0.000 description 1
- WVLZTXGTNGHPBO-SRVKXCTJSA-N Cys-Leu-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O WVLZTXGTNGHPBO-SRVKXCTJSA-N 0.000 description 1
- SMEYEQDCCBHTEF-FXQIFTODSA-N Cys-Pro-Ala Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O SMEYEQDCCBHTEF-FXQIFTODSA-N 0.000 description 1
- KSMSFCBQBQPFAD-GUBZILKMSA-N Cys-Pro-Pro Chemical compound SC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 KSMSFCBQBQPFAD-GUBZILKMSA-N 0.000 description 1
- DQGIAOGALAQBGK-BWBBJGPYSA-N Cys-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N)O DQGIAOGALAQBGK-BWBBJGPYSA-N 0.000 description 1
- VIOQRFNAZDMVLO-NRPADANISA-N Cys-Val-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VIOQRFNAZDMVLO-NRPADANISA-N 0.000 description 1
- LPBUBIHAVKXUOT-FXQIFTODSA-N Cys-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N LPBUBIHAVKXUOT-FXQIFTODSA-N 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 241000702421 Dependoparvovirus Species 0.000 description 1
- 208000007342 Diabetic Nephropathies Diseases 0.000 description 1
- 206010012689 Diabetic retinopathy Diseases 0.000 description 1
- 102100024746 Dihydrofolate reductase Human genes 0.000 description 1
- 206010013801 Duchenne Muscular Dystrophy Diseases 0.000 description 1
- 239000012591 Dulbecco’s Phosphate Buffered Saline Substances 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 206010071309 Epidural fibrosis Diseases 0.000 description 1
- 208000000461 Esophageal Neoplasms Diseases 0.000 description 1
- 108010008165 Etanercept Proteins 0.000 description 1
- 108050001049 Extracellular proteins Proteins 0.000 description 1
- 108010087819 Fc receptors Proteins 0.000 description 1
- 102000009109 Fc receptors Human genes 0.000 description 1
- 108010049003 Fibrinogen Proteins 0.000 description 1
- 102000008946 Fibrinogen Human genes 0.000 description 1
- 102000003973 Fibroblast growth factor 21 Human genes 0.000 description 1
- 108090000376 Fibroblast growth factor 21 Proteins 0.000 description 1
- 101150099704 Fn1 gene Proteins 0.000 description 1
- 102100025101 GATA-type zinc finger protein 1 Human genes 0.000 description 1
- 229930182566 Gentamicin Natural products 0.000 description 1
- CEAZRRDELHUEMR-URQXQFDESA-N Gentamicin Chemical compound O1[C@H](C(C)NC)CC[C@@H](N)[C@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](NC)[C@@](C)(O)CO2)O)[C@H](N)C[C@@H]1N CEAZRRDELHUEMR-URQXQFDESA-N 0.000 description 1
- 208000010412 Glaucoma Diseases 0.000 description 1
- PRBLYKYHAJEABA-SRVKXCTJSA-N Gln-Arg-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O PRBLYKYHAJEABA-SRVKXCTJSA-N 0.000 description 1
- QFTRCUPCARNIPZ-XHNCKOQMSA-N Gln-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)N)N)C(=O)O QFTRCUPCARNIPZ-XHNCKOQMSA-N 0.000 description 1
- DUGYCMAIAKAQPB-GLLZPBPUSA-N Gln-Thr-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DUGYCMAIAKAQPB-GLLZPBPUSA-N 0.000 description 1
- CVPXINNKRTZBMO-CIUDSAMLSA-N Glu-Arg-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)CN=C(N)N CVPXINNKRTZBMO-CIUDSAMLSA-N 0.000 description 1
- MLCPTRRNICEKIS-FXQIFTODSA-N Glu-Asn-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MLCPTRRNICEKIS-FXQIFTODSA-N 0.000 description 1
- MXPBQDFWIMBACQ-ACZMJKKPSA-N Glu-Cys-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(O)=O MXPBQDFWIMBACQ-ACZMJKKPSA-N 0.000 description 1
- ZXQPJYWZSFGWJB-AVGNSLFASA-N Glu-Cys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N ZXQPJYWZSFGWJB-AVGNSLFASA-N 0.000 description 1
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 1
- CQGBSALYGOXQPE-HTUGSXCWSA-N Glu-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O CQGBSALYGOXQPE-HTUGSXCWSA-N 0.000 description 1
- YPHPEHMXOYTEQG-LAEOZQHASA-N Glu-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O YPHPEHMXOYTEQG-LAEOZQHASA-N 0.000 description 1
- 208000002705 Glucose Intolerance Diseases 0.000 description 1
- 108010070675 Glutathione transferase Proteins 0.000 description 1
- 102000005720 Glutathione transferase Human genes 0.000 description 1
- MXXXVOYFNVJHMA-IUCAKERBSA-N Gly-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN MXXXVOYFNVJHMA-IUCAKERBSA-N 0.000 description 1
- MHHUEAIBJZWDBH-YUMQZZPRSA-N Gly-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN MHHUEAIBJZWDBH-YUMQZZPRSA-N 0.000 description 1
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 1
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 1
- DBJYVKDPGIFXFO-BQBZGAKWSA-N Gly-Met-Ala Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O DBJYVKDPGIFXFO-BQBZGAKWSA-N 0.000 description 1
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 1
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 1
- 102000003886 Glycoproteins Human genes 0.000 description 1
- 108090000288 Glycoproteins Proteins 0.000 description 1
- HTTJABKRGRZYRN-UHFFFAOYSA-N Heparin Chemical compound OC1C(NC(=O)C)C(O)OC(COS(O)(=O)=O)C1OC1C(OS(O)(=O)=O)C(O)C(OC2C(C(OS(O)(=O)=O)C(OC3C(C(O)C(O)C(O3)C(O)=O)OS(O)(=O)=O)C(CO)O2)NS(O)(=O)=O)C(C(O)=O)O1 HTTJABKRGRZYRN-UHFFFAOYSA-N 0.000 description 1
- FYVHHKMHFPMBBG-GUBZILKMSA-N His-Gln-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N FYVHHKMHFPMBBG-GUBZILKMSA-N 0.000 description 1
- OEROYDLRVAYIMQ-YUMQZZPRSA-N His-Gly-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O OEROYDLRVAYIMQ-YUMQZZPRSA-N 0.000 description 1
- PUFNQIPSRXVLQJ-IHRRRGAJSA-N His-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N PUFNQIPSRXVLQJ-IHRRRGAJSA-N 0.000 description 1
- 108091016366 Histone-lysine N-methyltransferase EHMT1 Proteins 0.000 description 1
- 101001108634 Homo sapiens 60S ribosomal protein L10 Proteins 0.000 description 1
- 101001067189 Homo sapiens Plexin-A1 Proteins 0.000 description 1
- 101000881168 Homo sapiens SPARC Proteins 0.000 description 1
- 206010061218 Inflammation Diseases 0.000 description 1
- 208000022559 Inflammatory bowel disease Diseases 0.000 description 1
- 108090001061 Insulin Proteins 0.000 description 1
- 102000004877 Insulin Human genes 0.000 description 1
- 206010022489 Insulin Resistance Diseases 0.000 description 1
- 102100037852 Insulin-like growth factor I Human genes 0.000 description 1
- 208000002260 Keloid Diseases 0.000 description 1
- 241000235058 Komagataella pastoris Species 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 1
- FOEHRHOBWFQSNW-KATARQTJSA-N Leu-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(C)C)N)O FOEHRHOBWFQSNW-KATARQTJSA-N 0.000 description 1
- BOFAFKVZQUMTID-AVGNSLFASA-N Leu-Gln-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N BOFAFKVZQUMTID-AVGNSLFASA-N 0.000 description 1
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 1
- UBZGNBKMIJHOHL-BZSNNMDCSA-N Leu-Leu-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 UBZGNBKMIJHOHL-BZSNNMDCSA-N 0.000 description 1
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 1
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 1
- SBANPBVRHYIMRR-GARJFASQSA-N Leu-Ser-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N SBANPBVRHYIMRR-GARJFASQSA-N 0.000 description 1
- VUBIPAHVHMZHCM-KKUMJFAQSA-N Leu-Tyr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 VUBIPAHVHMZHCM-KKUMJFAQSA-N 0.000 description 1
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 1
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 1
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 1
- PNPYKQFJGRFYJE-GUBZILKMSA-N Lys-Ala-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNPYKQFJGRFYJE-GUBZILKMSA-N 0.000 description 1
- QUYCUALODHJQLK-CIUDSAMLSA-N Lys-Asp-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUYCUALODHJQLK-CIUDSAMLSA-N 0.000 description 1
- ZAWOJFFMBANLGE-CIUDSAMLSA-N Lys-Cys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCCCN)N ZAWOJFFMBANLGE-CIUDSAMLSA-N 0.000 description 1
- HWMZUBUEOYAQSC-DCAQKATOSA-N Lys-Gln-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O HWMZUBUEOYAQSC-DCAQKATOSA-N 0.000 description 1
- OIQSIMFSVLLWBX-VOAKCMCISA-N Lys-Leu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OIQSIMFSVLLWBX-VOAKCMCISA-N 0.000 description 1
- ODTZHNZPINULEU-KKUMJFAQSA-N Lys-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N ODTZHNZPINULEU-KKUMJFAQSA-N 0.000 description 1
- MSSJJDVQTFTLIF-KBPBESRZSA-N Lys-Phe-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O MSSJJDVQTFTLIF-KBPBESRZSA-N 0.000 description 1
- JCVOHUKUYSYBAD-DCAQKATOSA-N Lys-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCCCN)N)C(=O)N[C@@H](CS)C(=O)O JCVOHUKUYSYBAD-DCAQKATOSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 206010027406 Mesothelioma Diseases 0.000 description 1
- VHGIWFGJIHTASW-FXQIFTODSA-N Met-Ala-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O VHGIWFGJIHTASW-FXQIFTODSA-N 0.000 description 1
- 208000001145 Metabolic Syndrome Diseases 0.000 description 1
- 101710143123 Mothers against decapentaplegic homolog 2 Proteins 0.000 description 1
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 1
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 1
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 1
- 108010025020 Nerve Growth Factor Proteins 0.000 description 1
- 102000007072 Nerve Growth Factors Human genes 0.000 description 1
- 206010030155 Oesophageal carcinoma Diseases 0.000 description 1
- 206010053159 Organ failure Diseases 0.000 description 1
- 108010011536 PTEN Phosphohydrolase Proteins 0.000 description 1
- 206010033649 Pancreatitis chronic Diseases 0.000 description 1
- 208000000733 Paroxysmal Hemoglobinuria Diseases 0.000 description 1
- 206010034665 Peritoneal fibrosis Diseases 0.000 description 1
- CYZBFPYMSJGBRL-DRZSPHRISA-N Phe-Ala-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CYZBFPYMSJGBRL-DRZSPHRISA-N 0.000 description 1
- LJUUGSWZPQOJKD-JYJNAYRXSA-N Phe-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O LJUUGSWZPQOJKD-JYJNAYRXSA-N 0.000 description 1
- MPFGIYLYWUCSJG-AVGNSLFASA-N Phe-Glu-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MPFGIYLYWUCSJG-AVGNSLFASA-N 0.000 description 1
- 101710132081 Phosphatidylinositol 3,4,5-trisphosphate 3-phosphatase and dual-specificity protein phosphatase PTEN Proteins 0.000 description 1
- 102100036050 Phosphatidylinositol N-acetylglucosaminyltransferase subunit A Human genes 0.000 description 1
- 239000004793 Polystyrene Substances 0.000 description 1
- 101000621511 Potato virus M (strain German) RNA silencing suppressor Proteins 0.000 description 1
- 208000006664 Precursor Cell Lymphoblastic Leukemia-Lymphoma Diseases 0.000 description 1
- VCYJKOLZYPYGJV-AVGNSLFASA-N Pro-Arg-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VCYJKOLZYPYGJV-AVGNSLFASA-N 0.000 description 1
- NXEYSLRNNPWCRN-SRVKXCTJSA-N Pro-Glu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXEYSLRNNPWCRN-SRVKXCTJSA-N 0.000 description 1
- ZTVCLZLGHZXLOT-ULQDDVLXSA-N Pro-Glu-Trp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O ZTVCLZLGHZXLOT-ULQDDVLXSA-N 0.000 description 1
- KWMUAKQOVYCQJQ-ZPFDUUQYSA-N Pro-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@@H]1CCCN1 KWMUAKQOVYCQJQ-ZPFDUUQYSA-N 0.000 description 1
- RMODQFBNDDENCP-IHRRRGAJSA-N Pro-Lys-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O RMODQFBNDDENCP-IHRRRGAJSA-N 0.000 description 1
- RPLMFKUKFZOTER-AVGNSLFASA-N Pro-Met-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@@H]1CCCN1 RPLMFKUKFZOTER-AVGNSLFASA-N 0.000 description 1
- MKGIILKDUGDRRO-FXQIFTODSA-N Pro-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 MKGIILKDUGDRRO-FXQIFTODSA-N 0.000 description 1
- 238000010802 RNA extraction kit Methods 0.000 description 1
- 230000004570 RNA-binding Effects 0.000 description 1
- 208000033626 Renal failure acute Diseases 0.000 description 1
- 206010038848 Retinal detachment Diseases 0.000 description 1
- 208000017442 Retinal disease Diseases 0.000 description 1
- 208000031472 Retinal fibrosis Diseases 0.000 description 1
- 206010038923 Retinopathy Diseases 0.000 description 1
- 102100037599 SPARC Human genes 0.000 description 1
- SRTCFKGBYBZRHA-ACZMJKKPSA-N Ser-Ala-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SRTCFKGBYBZRHA-ACZMJKKPSA-N 0.000 description 1
- WTUJZHKANPDPIN-CIUDSAMLSA-N Ser-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N WTUJZHKANPDPIN-CIUDSAMLSA-N 0.000 description 1
- QEDMOZUJTGEIBF-FXQIFTODSA-N Ser-Arg-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O QEDMOZUJTGEIBF-FXQIFTODSA-N 0.000 description 1
- YUSRGTQIPCJNHQ-CIUDSAMLSA-N Ser-Arg-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O YUSRGTQIPCJNHQ-CIUDSAMLSA-N 0.000 description 1
- HQTKVSCNCDLXSX-BQBZGAKWSA-N Ser-Arg-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O HQTKVSCNCDLXSX-BQBZGAKWSA-N 0.000 description 1
- BCKYYTVFBXHPOG-ACZMJKKPSA-N Ser-Asn-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N BCKYYTVFBXHPOG-ACZMJKKPSA-N 0.000 description 1
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 1
- RFBKULCUBJAQFT-BIIVOSGPSA-N Ser-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CO)N)C(=O)O RFBKULCUBJAQFT-BIIVOSGPSA-N 0.000 description 1
- HMRAQFJFTOLDKW-GUBZILKMSA-N Ser-His-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O HMRAQFJFTOLDKW-GUBZILKMSA-N 0.000 description 1
- GJFYFGOEWLDQGW-GUBZILKMSA-N Ser-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GJFYFGOEWLDQGW-GUBZILKMSA-N 0.000 description 1
- IUXGJEIKJBYKOO-SRVKXCTJSA-N Ser-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N IUXGJEIKJBYKOO-SRVKXCTJSA-N 0.000 description 1
- RRVFEDGUXSYWOW-BZSNNMDCSA-N Ser-Phe-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RRVFEDGUXSYWOW-BZSNNMDCSA-N 0.000 description 1
- XJDMUQCLVSCRSJ-VZFHVOOUSA-N Ser-Thr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O XJDMUQCLVSCRSJ-VZFHVOOUSA-N 0.000 description 1
- ZKOKTQPHFMRSJP-YJRXYDGGSA-N Ser-Thr-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKOKTQPHFMRSJP-YJRXYDGGSA-N 0.000 description 1
- YEDSOSIKVUMIJE-DCAQKATOSA-N Ser-Val-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O YEDSOSIKVUMIJE-DCAQKATOSA-N 0.000 description 1
- 208000000453 Skin Neoplasms Diseases 0.000 description 1
- 102000007374 Smad Proteins Human genes 0.000 description 1
- 108010007945 Smad Proteins Proteins 0.000 description 1
- 102000057208 Smad2 Human genes 0.000 description 1
- 208000000102 Squamous Cell Carcinoma of Head and Neck Diseases 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- KEGBFULVYKYJRD-LFSVMHDDSA-N Thr-Ala-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KEGBFULVYKYJRD-LFSVMHDDSA-N 0.000 description 1
- JNQZPAWOPBZGIX-RCWTZXSCSA-N Thr-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N JNQZPAWOPBZGIX-RCWTZXSCSA-N 0.000 description 1
- QILPDQCTQZDHFM-HJGDQZAQSA-N Thr-Gln-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QILPDQCTQZDHFM-HJGDQZAQSA-N 0.000 description 1
- SHOMROOOQBDGRL-JHEQGTHGSA-N Thr-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SHOMROOOQBDGRL-JHEQGTHGSA-N 0.000 description 1
- PRNGXSILMXSWQQ-OEAJRASXSA-N Thr-Leu-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PRNGXSILMXSWQQ-OEAJRASXSA-N 0.000 description 1
- WFAUDCSNCWJJAA-KXNHARMFSA-N Thr-Lys-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(O)=O WFAUDCSNCWJJAA-KXNHARMFSA-N 0.000 description 1
- BKVICMPZWRNWOC-RHYQMDGZSA-N Thr-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O BKVICMPZWRNWOC-RHYQMDGZSA-N 0.000 description 1
- 108010022394 Threonine synthase Proteins 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- DQDXHYIEITXNJY-BPUTZDHNSA-N Trp-Gln-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N DQDXHYIEITXNJY-BPUTZDHNSA-N 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 1
- 102000000852 Tumor Necrosis Factor-alpha Human genes 0.000 description 1
- SEFNTZYRPGBDCY-IHRRRGAJSA-N Tyr-Arg-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N)O SEFNTZYRPGBDCY-IHRRRGAJSA-N 0.000 description 1
- GIOBXJSONRQHKQ-RYUDHWBXSA-N Tyr-Gly-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O GIOBXJSONRQHKQ-RYUDHWBXSA-N 0.000 description 1
- AZGZDDNKFFUDEH-QWRGUYRKSA-N Tyr-Gly-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AZGZDDNKFFUDEH-QWRGUYRKSA-N 0.000 description 1
- JJNXZIPLIXIGBX-HJPIBITLSA-N Tyr-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N JJNXZIPLIXIGBX-HJPIBITLSA-N 0.000 description 1
- PHKQVWWHRYUCJL-HJOGWXRNSA-N Tyr-Phe-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PHKQVWWHRYUCJL-HJOGWXRNSA-N 0.000 description 1
- ZSXJENBJGRHKIG-UWVGGRQHSA-N Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ZSXJENBJGRHKIG-UWVGGRQHSA-N 0.000 description 1
- KWKJGBHDYJOVCR-SRVKXCTJSA-N Tyr-Ser-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N)O KWKJGBHDYJOVCR-SRVKXCTJSA-N 0.000 description 1
- 201000006704 Ulcerative Colitis Diseases 0.000 description 1
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 1
- CVUDMNSZAIZFAE-TUAOUCFPSA-N Val-Arg-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N CVUDMNSZAIZFAE-TUAOUCFPSA-N 0.000 description 1
- SDSCOOZQQGUQFC-GVXVVHGQSA-N Val-His-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N SDSCOOZQQGUQFC-GVXVVHGQSA-N 0.000 description 1
- ZIGZPYJXIWLQFC-QTKMDUPCSA-N Val-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](C(C)C)N)O ZIGZPYJXIWLQFC-QTKMDUPCSA-N 0.000 description 1
- HPANGHISDXDUQY-ULQDDVLXSA-N Val-Lys-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N HPANGHISDXDUQY-ULQDDVLXSA-N 0.000 description 1
- IOETTZIEIBVWBZ-GUBZILKMSA-N Val-Met-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CS)C(=O)O)N IOETTZIEIBVWBZ-GUBZILKMSA-N 0.000 description 1
- QTPQHINADBYBNA-DCAQKATOSA-N Val-Ser-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN QTPQHINADBYBNA-DCAQKATOSA-N 0.000 description 1
- 102000009484 Vascular Endothelial Growth Factor Receptors Human genes 0.000 description 1
- 102100033177 Vascular endothelial growth factor receptor 2 Human genes 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 208000000208 Wet Macular Degeneration Diseases 0.000 description 1
- 108700020987 Wnt-1 Proteins 0.000 description 1
- 102000052547 Wnt-1 Human genes 0.000 description 1
- 101000678336 Xenopus laevis Actin, alpha skeletal muscle 2 Proteins 0.000 description 1
- 101100082060 Xenopus laevis pou5f1.1 gene Proteins 0.000 description 1
- 101000678338 Xenopus tropicalis Actin, alpha cardiac muscle 2 Proteins 0.000 description 1
- 201000000690 abdominal obesity-metabolic syndrome Diseases 0.000 description 1
- 230000001594 aberrant effect Effects 0.000 description 1
- 108010076089 accutase Proteins 0.000 description 1
- 108010011164 acein 1 Proteins 0.000 description 1
- 201000011040 acute kidney failure Diseases 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 239000002998 adhesive polymer Substances 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 108010029483 alpha 1 Chain Collagen Type I Proteins 0.000 description 1
- 210000002821 alveolar epithelial cell Anatomy 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- APKFDSVGJQXUKY-INPOYWNPSA-N amphotericin B Chemical compound O[C@H]1[C@@H](N)[C@H](O)[C@@H](C)O[C@H]1O[C@H]1/C=C/C=C/C=C/C=C/C=C/C=C/C=C/[C@H](C)[C@@H](O)[C@@H](C)[C@H](C)OC(=O)C[C@H](O)C[C@H](O)CC[C@@H](O)[C@H](O)C[C@H](O)C[C@](O)(C[C@H](O)[C@H]2C(O)=O)O[C@H]2C1 APKFDSVGJQXUKY-INPOYWNPSA-N 0.000 description 1
- 229960003942 amphotericin b Drugs 0.000 description 1
- 230000001772 anti-angiogenic effect Effects 0.000 description 1
- 230000001093 anti-cancer Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 206010003246 arthritis Diseases 0.000 description 1
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 1
- 108010038633 aspartylglutamate Proteins 0.000 description 1
- 239000012298 atmosphere Substances 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 230000008267 autocrine signaling Effects 0.000 description 1
- 239000007640 basal medium Substances 0.000 description 1
- 210000000013 bile duct Anatomy 0.000 description 1
- 229940125385 biologic drug Drugs 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 229960001561 bleomycin Drugs 0.000 description 1
- OYVAGSVQBOHSSS-UAPAGMARSA-O bleomycin A2 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC=C(N=1)C=1SC=C(N=1)C(=O)NCCC[S+](C)C)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C OYVAGSVQBOHSSS-UAPAGMARSA-O 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004204 blood vessel Anatomy 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 210000000481 breast Anatomy 0.000 description 1
- 210000000233 bronchiolar non-ciliated Anatomy 0.000 description 1
- 206010006475 bronchopulmonary dysplasia Diseases 0.000 description 1
- 230000009400 cancer invasion Effects 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 230000000747 cardiac effect Effects 0.000 description 1
- 230000008209 cardiovascular development Effects 0.000 description 1
- 230000003915 cell function Effects 0.000 description 1
- 230000012292 cell migration Effects 0.000 description 1
- 239000013553 cell monolayer Substances 0.000 description 1
- 239000006285 cell suspension Substances 0.000 description 1
- 238000012054 celltiter-glo Methods 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 230000033077 cellular process Effects 0.000 description 1
- 208000020832 chronic kidney disease Diseases 0.000 description 1
- 229920001436 collagen Polymers 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000001472 cytotoxic effect Effects 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 208000033679 diabetic kidney disease Diseases 0.000 description 1
- 238000011026 diafiltration Methods 0.000 description 1
- 230000009274 differential gene expression Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 102000004419 dihydrofolate reductase Human genes 0.000 description 1
- 108020001096 dihydrofolate reductase Proteins 0.000 description 1
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 1
- 108010005794 dulaglutide Proteins 0.000 description 1
- 229960002224 eculizumab Drugs 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000013020 embryo development Effects 0.000 description 1
- 229940066758 endopeptidases Drugs 0.000 description 1
- 210000002889 endothelial cell Anatomy 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 229940088598 enzyme Drugs 0.000 description 1
- 239000006167 equilibration buffer Substances 0.000 description 1
- 201000004101 esophageal cancer Diseases 0.000 description 1
- 229960000403 etanercept Drugs 0.000 description 1
- 230000029142 excretion Effects 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 230000008622 extracellular signaling Effects 0.000 description 1
- 210000001508 eye Anatomy 0.000 description 1
- 208000010706 fatty liver disease Diseases 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 229940012952 fibrinogen Drugs 0.000 description 1
- 230000019305 fibroblast migration Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 210000003953 foreskin Anatomy 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- 230000030279 gene silencing Effects 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 229960002518 gentamicin Drugs 0.000 description 1
- 208000005017 glioblastoma Diseases 0.000 description 1
- 239000003877 glucagon like peptide 1 receptor agonist Substances 0.000 description 1
- 229930195712 glutamate Natural products 0.000 description 1
- 108010078144 glutaminyl-glycine Proteins 0.000 description 1
- 108010040856 glutamyl-cysteinyl-alanine Proteins 0.000 description 1
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 1
- 201000005787 hematologic cancer Diseases 0.000 description 1
- 208000024200 hematopoietic and lymphoid system neoplasm Diseases 0.000 description 1
- 229960002897 heparin Drugs 0.000 description 1
- 229920000669 heparin Polymers 0.000 description 1
- 210000000208 hepatic perisinusoidal cell Anatomy 0.000 description 1
- 206010073071 hepatocellular carcinoma Diseases 0.000 description 1
- 231100000844 hepatocellular carcinoma Toxicity 0.000 description 1
- 108010092114 histidylphenylalanine Proteins 0.000 description 1
- 238000002868 homogeneous time resolved fluorescence Methods 0.000 description 1
- 208000027706 hormone receptor-positive breast cancer Diseases 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 238000004191 hydrophobic interaction chromatography Methods 0.000 description 1
- -1 i.e. Proteins 0.000 description 1
- 229940027941 immunoglobulin g Drugs 0.000 description 1
- 238000009169 immunotherapy Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000000099 in vitro assay Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000004054 inflammatory process Effects 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- 229940125396 insulin Drugs 0.000 description 1
- 102000006495 integrins Human genes 0.000 description 1
- 108010044426 integrins Proteins 0.000 description 1
- 230000010039 intracellular degradation Effects 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 210000001117 keloid Anatomy 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 108010053037 kyotorphin Proteins 0.000 description 1
- 108010034529 leucyl-lysine Proteins 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 231100000053 low toxicity Toxicity 0.000 description 1
- 210000005265 lung cell Anatomy 0.000 description 1
- 208000002780 macular degeneration Diseases 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 230000004563 mammosphere formation Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000010534 mechanism of action Effects 0.000 description 1
- 201000001441 melanoma Diseases 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 238000010232 migration assay Methods 0.000 description 1
- 238000012434 mixed-mode chromatography Methods 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 230000003387 muscular Effects 0.000 description 1
- 210000004165 myocardium Anatomy 0.000 description 1
- 210000000651 myofibroblast Anatomy 0.000 description 1
- 210000004898 n-terminal fragment Anatomy 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 229910052754 neon Inorganic materials 0.000 description 1
- GKAOGPIIYCISHV-UHFFFAOYSA-N neon atom Chemical compound [Ne] GKAOGPIIYCISHV-UHFFFAOYSA-N 0.000 description 1
- 208000008338 non-alcoholic fatty liver disease Diseases 0.000 description 1
- 206010053219 non-alcoholic steatohepatitis Diseases 0.000 description 1
- 231100000590 oncogenic Toxicity 0.000 description 1
- 230000002246 oncogenic effect Effects 0.000 description 1
- 238000001543 one-way ANOVA Methods 0.000 description 1
- 201000002740 oral squamous cell carcinoma Diseases 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 201000008968 osteosarcoma Diseases 0.000 description 1
- 230000002611 ovarian Effects 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 210000000496 pancreas Anatomy 0.000 description 1
- 201000008129 pancreatic ductal adenocarcinoma Diseases 0.000 description 1
- 230000014306 paracrine signaling Effects 0.000 description 1
- 201000003045 paroxysmal nocturnal hemoglobinuria Diseases 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000001991 pathophysiological effect Effects 0.000 description 1
- 230000007310 pathophysiology Effects 0.000 description 1
- 210000004303 peritoneum Anatomy 0.000 description 1
- 239000008194 pharmaceutical composition Substances 0.000 description 1
- 230000006461 physiological response Effects 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 229920006254 polymer film Polymers 0.000 description 1
- 229920002223 polystyrene Polymers 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 238000010149 post-hoc-test Methods 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 230000001323 posttranslational effect Effects 0.000 description 1
- 230000003389 potentiating effect Effects 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 201000009104 prediabetes syndrome Diseases 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 239000013587 production medium Substances 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 210000002307 prostate Anatomy 0.000 description 1
- 235000004252 protein component Nutrition 0.000 description 1
- 230000002685 pulmonary effect Effects 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 201000002793 renal fibrosis Diseases 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000004264 retinal detachment Effects 0.000 description 1
- 238000001223 reverse osmosis Methods 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000013341 scale-up Methods 0.000 description 1
- 231100000241 scar Toxicity 0.000 description 1
- 230000037387 scars Effects 0.000 description 1
- 238000007790 scraping Methods 0.000 description 1
- 208000011571 secondary malignant neoplasm Diseases 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 1
- 108010048818 seryl-histidine Proteins 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 210000002027 skeletal muscle Anatomy 0.000 description 1
- 230000012488 skeletal system development Effects 0.000 description 1
- 201000000849 skin cancer Diseases 0.000 description 1
- 210000000329 smooth muscle myocyte Anatomy 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000008093 supporting effect Effects 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- 238000002877 time resolved fluorescence resonance energy transfer Methods 0.000 description 1
- 208000037816 tissue injury Diseases 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 229910052722 tritium Inorganic materials 0.000 description 1
- 230000010245 tubular reabsorption Effects 0.000 description 1
- 208000037999 tubulointerstitial fibrosis Diseases 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 210000003932 urinary bladder Anatomy 0.000 description 1
- 108010073969 valyllysine Proteins 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
- 230000029663 wound healing Effects 0.000 description 1
Abstract
Description
ОБЛАСТЬ ТЕХНИКИAREA OF TECHNOLOGY
Настоящее изобретение относится к рекомбинантным белкам, имеющим последовательность аминокислот, соответствующую или родственную домену гомологии к повторам тромбоспондина I типа (домен III) представителя семейства белков CCN, и их применению, в том числе, в частности, таким белкам, который усечены и/или содержат определенные модификации аминокислот. Кроме того, настоящее изобретение относится к слитым белкам, содержащим последовательность аминокислот, соответствующую или родственную домену гомологии к повторам тромбоспондина I типа представителя семейства белков CCN, скомбинированную с партнером для слияния, необязательно посредством линкерного пептида. В частности, партнер для слияния представляет собой мономерный белок, и указанные слитые белки являются мономерными.The present invention relates to recombinant proteins having an amino acid sequence corresponding to or related to the thrombospondin type I repeat homology domain (domain III) of a member of the CCN protein family and their use, including in particular such proteins that are truncated and/or contain certain amino acid modifications. Furthermore, the present invention relates to fusion proteins comprising an amino acid sequence corresponding to or related to the thrombospondin type I repeat homology domain of a member of the CCN protein family, combined with a fusion partner, optionally via a linker peptide. In particular, the fusion partner is a monomeric protein, and said fusion proteins are monomeric.
Также в настоящей заявке раскрыты новые устойчивые к протеазам Fc-фрагменты.Also disclosed in the present application are novel protease-resistant Fc fragments.
УРОВЕНЬ ТЕХНИКИLEVEL OF TECHNOLOGY
Белки CCN представляют собой семейство секретируемых гликопротеинов. Изначально для обозначения CCN была выбрана аббревиатура, происходящая от первых трех идентифицированных представителей указанного семейства генов; Cyr61, CTGF и NOV. Однако недавно смысл указанной аббревиатура был адаптирован и теперь она представляет собой сокращение от «факторов сети клеточной коммуникации» («Cellular Communication Network»), ратифицированное Комитетом по номенклатуре генов HUGO (Perbal В, Tweedie S and Bruford E, J Cell Commun Signal. 2019 Sep; 13(3):435). Указанные белки часто классифицируют как матриклеточные белки, ассоциированные с внеклеточным матриксом (ВКМ). Белки CCN не участвуют в выполнении функций скаффолда, организующих клетки в ткани, а считаются сигнальными белками и могут функционировать в качестве независимых аутокринных или паракринных сигнальных факторов, или в качестве модификаторов других внеклеточных сигнальных белков. Наряду с группой из трех белков Wnt-индуцируемого сигнального пути (WISP1/CCN4, WISP2/CCN5 и WISP3/CCN6) они включают семейство из шести гомологичных богатых цистеином белков у млекопитающих, которые были переименованы в CCN1-6.The CCN proteins are a family of secreted glycoproteins. The initial acronym chosen for CCN was derived from the first three identified members of this gene family; Cyr61, CTGF, and NOV. However, the acronym has recently been adapted to stand for "Cellular Communication Network" as ratified by the HUGO Gene Nomenclature Committee (Perbal B, Tweedie S and Bruford E, J Cell Commun Signal. 2019 Sep; 13(3):435). These proteins are often classified as extracellular matrix (ECM)-associated proteins. CCN proteins do not function as scaffolds that organize cells into tissues but are considered signaling proteins and may function as independent autocrine or paracrine signaling factors, or as modifiers of other extracellular signaling proteins. Along with a group of three Wnt-inducible signaling pathway proteins (WISP1/CCN4, WISP2/CCN5, and WISP3/CCN6), they include a family of six homologous cysteine-rich proteins in mammals that have been renamed CCN1-6.
Исходные представители семейства CCN отличает общая модульная структура, где за N-концевым сигнальным пептидом для секреции следуют четыре консервативных домена. Первый домен демонстрирует гомологию последовательностей относительно связывающих инсулиноподобный фактор роста белков (IGFBP) и, соответственно, известен как гомологичный IGF-связывающим белкам домен, хотя он и имеет пренебрежимо малую аффинность к IGF. Второй домен известен как домен гомологии с повторами фактора фон Виллебранда типа С (VWC), часто встречающийся в белках внеклеточного матрикса (ВКМ). Третий домен известен как домен гомологии с повторами тромбоспондина типа I (TSP-1), который может быть вовлечен в прикрепление белков CCN к интегринам. Четвертый домен представляет собой богатый цистеином С-концевой повтор или домен гомологии к цистиновому узлу, домен, который, как сообщалось, связывает гепарин. Пятый представитель семейства белков CCN, WISP2 (белок Wnt1-индуцируемого сигнального пути 2), также известный как CCN5, атипичен, поскольку не содержит карбокси-концевого домена цистинового узла (домена 4). Домены гомологии с TSP-1 семейства белков CCN характеризуются 34% идентичности последовательностей аминокислот и 25% сходства последовательностей (по результатам анализа ClustalOmega, см. источник ниже). Четырехдоменные белки CCN содержат 38 консервативных остатка цистеина по длине первичной последовательности, за исключением CCN6, где 4 цистеина в домене гомологии к VWC не сохраняются относительно других представителей семейства. Также, в CCN5, где отсутствует карбоксиконцевой домен гомологии к цистиновому узлу, все цистеины доменов гомологии к IGFBP, VWC и TSP-1 консервативны относительно других представителей семейства CCN.The original members of the CCN family share a common modular structure, with an N-terminal secretion signal peptide followed by four conserved domains. The first domain shows sequence homology to insulin-like growth factor binding proteins (IGFBPs) and is thus known as the IGF-binding protein homology domain, although it has negligible affinity for IGF. The second domain is known as the von Willebrand factor type C repeat homology (VWC) domain, which is commonly found in extracellular matrix (ECM) proteins. The third domain is known as the thrombospondin type I repeat homology (TSP-1) domain, which may be involved in the attachment of CCN proteins to integrins. The fourth domain is a cysteine-rich C-terminal repeat or cystine knot homology domain, a domain that has been reported to bind heparin. The fifth member of the CCN protein family, WISP2 (Wnt1-induced signaling pathway protein 2), also known as CCN5, is atypical in that it lacks a carboxy-terminal cystine knot domain (domain 4). The TSP-1 homology domains of the CCN protein family share 34% amino acid sequence identity and 25% sequence similarity (as analyzed by ClustalOmega, see source below). The four-domain CCN proteins contain 38 conserved cysteine residues along the length of the primary sequence, with the exception of CCN6, where the four cysteines in the VWC homology domain are not conserved relative to other family members. Also, in CCN5, which lacks a carboxy-terminal cystine knot homology domain, all cysteines in the IGFBP, VWC, and TSP-1 homology domains are conserved relative to other CCN family members.
Неконсервативная чувствительная к протеазам центральная область, часто называемая шарнирной областью, рассекает белки на две половины. Экспрессия белков CCN регулируется на транскрипционном, посттранскрипционном и трансляционном уровнях в ответ на изменения стимулов среды.A non-conserved protease-sensitive central region, often referred to as the hinge region, bisects the proteins. Expression of CCN proteins is regulated at the transcriptional, post-transcriptional, and translational levels in response to changing environmental stimuli.
Информацию относительно доменной организации семейства белков CCN можно найти, например, в источнике: Liu et al., 2017, Journal of Diabetes, 9, pp. 462-474.Information on the domain organization of the CCN protein family can be found, for example, in: Liu et al., 2017, Journal of Diabetes, 9, pp. 462-474.
На клеточном уровне белки CCN могут играть разнообразные регуляторные роли на границе внеклеточного матрикса и поверхности клеток. Белки CCN могут регулировать клеточную адгезию, миграцию, пролиферацию, дифференцировку, апоптоз, выживание, старение и генную экспрессию. Модулируя один или более аспектов указанных клеточных функций специфичным для типа клеток способом, CCN координируют сложные биологические процессы, в том числе развитие сердечно-сосудистой и скелетной систем во время эмбриогенеза, а также воспаление, заживление ран, и повреждение и восстановление тканей у взрослых. В общем случае, 4-доменные CCN 1-4 и CCN6 (в частности, CCN1, CCN2 и CCN4) могут проявлять профибротическую активность, тогда как CCN5, который содержит только 3 домена I-III, обладает антифибротической активностью.At the cellular level, CCN proteins can play a variety of regulatory roles at the extracellular matrix–cell surface interface. CCN proteins can regulate cell adhesion, migration, proliferation, differentiation, apoptosis, survival, aging, and gene expression. By modulating one or more aspects of these cellular functions in a cell type-specific manner, CCNs coordinate complex biological processes, including cardiovascular and skeletal development during embryogenesis, as well as inflammation, wound healing, and tissue injury and repair in adults. In general, the 4-domain CCNs 1–4 and CCN6 (specifically CCN1, CCN2, and CCN4) can exhibit profibrotic activity, whereas CCN5, which contains only 3 domains I–III, has antifibrotic activity.
Белки CCN также вовлечены в разнообразные патологические состояния, такие как недостаточность органов в результате прогрессирующего фиброза, например, фиброза печени и идиопатического фиброза легких, и в инвазию и метастазирование рака. Соответствующую информацию можно найти в источнике: Jun and Lau, 2011, Nat. Rev. Drug. Discovery, 10(12), pp. 945-963. Также было показано, что, в общем случае, 4-доменные белки CCN, в частности, CCN2, вовлечены в механизмы различных фиброзных заболеваний, тогда как в доклинических моделях таких заболеваний, напротив, было показано, что повышенные уровни CCN5 могут быть благоприятными.CCN proteins have also been implicated in a variety of pathological conditions, such as organ failure due to progressive fibrosis, such as liver fibrosis and idiopathic pulmonary fibrosis, and cancer invasion and metastasis. For more information, see Jun and Lau, 2011, Nat. Rev. Drug. Discovery, 10(12), pp. 945-963. In general, 4-domain CCN proteins, particularly CCN2, have also been shown to be involved in the mechanisms of various fibrotic diseases, while in contrast, elevated CCN5 levels have been shown to be beneficial in preclinical models of such diseases.
В источнике: et al., J. Biol. Chem, 293:46, pp. 17953-17970, сообщается, что фактор роста соединительной ткани (CTGF), также известный как CCN2, синтезируется и секретируется в виде неактивного препробелка, который требует протеолитического расщепления для высвобождения биологически активного CCN2, и что гомодимер С-концевого фрагмента, состоящий из доменов III-IV, представляет собой биологически полностью активную форму CCN2, и, наконец, что все основные описанные виды активности CCN2 могут быть воспроизведены гомодимером С-концевых фрагментов доменов III-IV. Анализы активности, описанные с соавторами, показывают, что ни непроцессированный полноразмерный CCN2, ни N-концевой фрагмент, состоящий из доменов I-II, не были биологически активными. Кроме того, было обнаружено, что протеолитический процессинг полноразмерного CCN2 в результате активности матриксной металл о протеиназы (ММР) высвобождал его латентную активность. В совокупности, данные, полученные с соавторами, подразумевают, что препро-CCN2 аутоингибируют N-концевые домены I и II. Было также обнаружено, что C-концевых доменов III и IV фрагмента CCN1 и CCN3 было достаточно для активации быстрой клеточной сигнализации и стимуляции физиологических ответов клеток. Однако неизвестно, в какой степени эндопептидазное расщепление шарнирной области CCN1 и/или CCN3, или любого другого представителя семейства белков CCN, необходимо для высвобождения биологической активности.In the source: et al., J. Biol. Chem., 293:46, pp. 17953-17970, report that connective tissue growth factor (CTGF), also known as CCN2, is synthesized and secreted as an inactive preprotein that requires proteolytic cleavage to release biologically active CCN2, and that the homodimer of the C-terminal fragment of domains III-IV represents the biologically fully active form of CCN2, and finally that all of the major reported activities of CCN2 can be reproduced by the homodimer of the C-terminal fragments of domains III-IV. The activity assays described et al., showed that neither unprocessed full-length CCN2 nor the N-terminal fragment consisting of domains I–II were biologically active. Furthermore, it was found that proteolytic processing of full-length CCN2 by matrix metalloproteinase (MMP) activity released its latent activity. Collectively, the data obtained et al. imply that prepro-CCN2 is autoinhibited by the N-terminal domains I and II. It was also found that the C-terminal domains III and IV of CCN1 and CCN3 were sufficient to activate rapid cell signaling and stimulate physiological responses in cells. However, it is unknown to what extent endopeptidase cleavage of the hinge region of CCN1 and/or CCN3, or any other member of the CCN protein family, is required to release biological activity.
Известно, что CCN2 экспрессируется на высоком уровне в ходе развития, при различных патологических состояниях, включающих усиленный фиброгенез и фиброз тканей, и при некоторых видах рака (Jun and Lau, 2011, выше). Тот факт, что белки CCN вовлечены в широкий спектр патологических состояний, представляют собой внеклеточные белки, механистически вовлеченные в развитие фиброза, и демонстрируют ограниченную экспрессию в здоровых организмах, делает их привлекательными терапевтическими мишенями.CCN2 is known to be highly expressed during development, in a variety of pathological conditions including increased fibrogenesis and tissue fibrosis, and in some cancers (Jun and Lau, 2011, supra). The fact that CCN proteins are involved in a wide range of pathological conditions, represent extracellular proteins mechanistically involved in fibrosis, and exhibit limited expression in healthy organisms makes them attractive therapeutic targets.
В источнике: Jeong et al., 2016, J. American College of Cardiology, 67: 13, pp. 1557-1568, описано исследование, направленное на изучение роли опосредованного аденоассоциированным вирусом переноса генов CCN5 в сердца мышей после экспериментально индуцированной перегрузки сердца давлением. В исследовании сделан вывод, что CCN5 может обращать вспять развившийся фиброз сердца за счет ингибирования образования и повышения апоптоза миофибробластов в миокарде, что позволяет предположить, что CCN5 может служить платформой для разработки средств терапии фиброза сердца.In the source: Jeong et al., 2016, J. American College of Cardiology, 67: 13, pp. 1557-1568, a study was reported to investigate the role of adeno-associated virus-mediated gene transfer of CCN5 in mouse hearts after experimentally induced cardiac pressure overload. The study concluded that CCN5 could reverse established cardiac fibrosis by inhibiting the formation and increasing the apoptosis of myofibroblasts in the myocardium, suggesting that CCN5 may serve as a platform for the development of therapeutics for cardiac fibrosis.
В US 2008/0207489 раскрыт способ лечения расстройства, основанного на пролиферации гладких мышц, включающий экспрессию CCN5 или введение белка CCN5 в гладкомышечные клетки.US 2008/0207489 discloses a method for treating a disorder based on smooth muscle proliferation, comprising expressing CCN5 or introducing CCN5 protein into smooth muscle cells.
В ЕР 2556839 предложена композиция, содержащая генетический носитель, содержащий последовательность нуклеотидов, кодирующую полноразмерный CCN5 или CCN2ACT, и высказано предположение о его роли в лечении сердечной недостаточности. CCN2ACT в ЕР 2556839 определен как последовательность аминокислот CCN2, усеченная после K251 (нумерация Uniprot).EP 2556839 proposes a composition comprising a genetic carrier comprising a nucleotide sequence encoding full-length CCN5 or CCN2ACT and suggests a role in the treatment of heart failure. CCN2ACT in EP 2556839 is defined as the amino acid sequence CCN2 truncated after K251 (Uniprot numbering).
Хотя было описано, что избыточная экспрессия CCN5 в некоторых экспериментальных системах приводит к фенотипу, противоположному наблюдаемому при избыточной экспрессии CCN2 (Jeong et al. выше, Yoon et al., J Mol Cell Cardiol, 49 (2), 294-303 Aug 2010), о прямом антагонизме CCN5 с четырехдоменными белками CCN5, насколько известно авторам настоящего изобретения, сообщений не было. В частности, структурная основа CCN5/WISP2-опосредованного антагонизма других представителей семейства CCN была неизвестна до исследования, представленного в настоящей заявке.Although overexpression of CCN5 has been described in some experimental systems to result in a phenotype opposite to that observed with overexpression of CCN2 (Jeong et al. supra, Yoon et al., J Mol Cell Cardiol, 49 (2), 294-303 Aug 2010), direct antagonism of CCN5 with four-domain CCN5 proteins has not been reported to the best of our knowledge. In particular, the structural basis for CCN5/WISP2-mediated antagonism of other CCN family members was unknown prior to the study reported herein.
Авторы настоящего изобретения на более ранней стадии показали, что полноразмерный CCN2 (FL-CCN2) представляет собой препробелок, неактивный предшественник, и что фрагмент, содержащий домены III и IV, по-видимому, осуществляет все биологически релевантные виды активности CCN2. Остается неизвестным, в какой степени белки CCN, в целом, секретируются как неактивные препробелки, которые требуют протеолитической активации. Тем не менее чувствительность полноразмерных белков CCN к нескольким протеазам, как продемонстрировано авторами настоящего изобретения ( et al., J. Biol. Chem. (2018) 293(46) 17953-17970) и другими авторами (Butler, G.S. et al. Matrix Biol 59, 23-38 (2017) и Guillon-Munos, A. et al. J Biol Chem 286, 25505- 25518 (2011)), подразумевает, что немодифицированные полноразмерные белки CCN были бы крайне неподходящими для применения в качестве лекарственных средств по причинам стабильности, как в ходе производства рекомбинантного белка, так и после введения in vivo. Указанная непригодность для применения немодифицированных полноразмерных белков CCN в качестве терапевтических белков также относится к слитым белкам полноразмерных белков CCN, например, согласно описанию для полноразмерного CCN1 (Schutze, N. et al. (2005) Protein Expr Purif 42, 219-225) и полноразмерного CCN6 (Schutze, N. et al. (2007) BMC Cell Biol 8, 45). В области техники, относящейся к белкам CCN, хорошо известно, что чувствительность указанных белков к протеолизу является одной из причин, объясняющих значительную сложность получения рекомбинантных белков CCN. Кроме того, на основании новых данных, полученных с соавторами ( et al. J Biol Chem 2018; 293(46):17953-17970), рекомбинантные полноразмерные белки CCN могут быть далеко не идеальными биологическими лекарственными средствами, поскольку их активность может зависеть от предшествующего протеолитического процессинга, что делает фармакокинетику и фармакодинамику непредсказуемыми. Кроме того, в случае слитых белков с Fc наряду с протеолитической чувствительностью компонентов, например, пептидного линкера, CCN-фрагмента и Fc-фрагмента, была показана также важность расположения компонентов для эффективности и мощности рекомбинантных слитых белков. Один из подтверждающих это примеров описан в работе, опубликованной авторами настоящего изобретения ( et al. (2018)), где было обнаружено, что варианты слитых белков с Fc, содержащих домены III-IV CCN2, имеют активность, варьирующую в широком диапазоне и не являющуюся заранее легко предсказуемой.The present inventors have shown at an earlier stage that full-length CCN2 (FL-CCN2) is a preproprotein, an inactive precursor, and that the fragment containing domains III and IV appears to carry out all the biologically relevant activities of CCN2. It remains unknown to what extent CCN proteins, in general, are secreted as inactive preproproteins that require proteolytic activation. However, the sensitivity of full-length CCN proteins to several proteases, as demonstrated by the present inventors ( et al., J. Biol. Chem. (2018) 293(46) 17953-17970) and other authors (Butler, GS et al. Matrix Biol 59, 23-38 (2017) and Guillon-Munos, A. et al. J Biol Chem 286, 25505- 25518 (2011)), implies that unmodified full-length CCN proteins would be highly unsuitable for use as drugs for stability reasons, both during recombinant protein production and after in vivo administration. The above-mentioned unsuitability for the use of unmodified full-length CCN proteins as therapeutic proteins also applies to fusion proteins of full-length CCN proteins, such as those described for full-length CCN1 (Schutze, N. et al. (2005) Protein Expr Purif 42, 219-225) and full-length CCN6 (Schutze, N. et al. (2007) BMC Cell Biol 8, 45). It is well known in the technical field relating to CCN proteins that the sensitivity of these proteins to proteolysis is one of the reasons for the considerable difficulty in obtaining recombinant CCN proteins. Furthermore, based on new data obtained with co-authors ( et al. J Biol Chem 2018; 293(46):17953–17970), recombinant full-length CCN proteins may be less than ideal biologic drugs, as their activity may depend on prior proteolytic processing, making pharmacokinetics and pharmacodynamics unpredictable. Furthermore, in the case of Fc fusion proteins, in addition to the proteolytic sensitivity of the components, such as the peptide linker, CCN fragment, and Fc fragment, the importance of the arrangement of the components for the efficacy and potency of recombinant fusion proteins has been shown. One example supporting this is described in a paper published by the present inventors ( et al. (2018)), where variants of Fc fusion proteins containing CCN2 domains III–IV were found to have activities that varied widely and were not readily predictable in advance.
Была описана чувствительность действий белков CCN к антагонизирующим эффектам высоких концентраций синтетических пептидов, происходящих из первичных последовательностей белков CCN. Одним из примеров является ингибирование фосфорилирования АКТ, стимулированного рекомбинантным CCN2 в фибробластах Rat2, пептидами, происходящими из домена I, домена гомологии к IGFBP, и в меньшей степени пептидами, происходящими из домена III, домена гомологии к повторам TSP-1, CCN2 (Мое et al., J. Cell Commun. Signal. (2013) 7:31-47). Другим примером является ингибирование стимулированной CCN2 (домен IV) адгезии жиронакапливающих клеток печени пептидом, происходящим из домена IV, домена гомологии к цистиновому узлу, из CCN2 (Gao R and Brigstock DR., J Biol Chem. 2004 Mar 5; 279(10):8848-55). Кроме того, сообщалось, что пептиды из домена III CCN1 (Leu et al. J. Biol. Chem, 2003, Vol. 278, NO: 36, Issue of September 5, pp. 33801-33808, 2003) и домена III CCN1, CCN2, CCN3, CCN5 и CCN6 (Karagiannis EG and Popel, The International Journal of Biochemistry & Cell Biology 39 (2007) 2314 2323) оказывают некоторые анти-ангиогенные эффекты в анализах in vitro на клетках HUVEC (Leu et al. J. Biol. Chem, 2003, и Karagiannis EG and Popel, Int J Biochem Cell Biol 39 (2007)) и анти-адгезионные эффекты на 1064SK фибробласты крайней плоти человека (Leu et al. J. Biol. Chem, 2003), указанные пептиды содержат только один (Leu et al. J. Biol. Chem, 2003) или два (Karagiannis EG and Popel, Int J Biochem Cell Biol 39, 2007) из консервативных цистеинов, которые играют центральную роль в изобретении, описанном в настоящей заявке. Цистеины в домене III белков CCN, как известно, образуют дисульфидные мостики, как продемонстрировано для CCN2, эндогенно экспрессируемого клетками HUVEC (Lu, S et al. (2015) Nat methods 12, 329-331), и очищенного рекомбинантного CCN2 ( et al., J. Biol. Chem. 2018). Дисульфидные мостики, продемонстрированные для CCN2, захватывающие С199-С228 (нумерация Uniprot), обеспечивают комплексную трехмерную структуру, в которой аминокислотная цепь сворачивается с образованием складки. Это подразумевает, что нельзя ожидать воспроизведения полного домена III белка CCN короткими пептидами, которые структурно не ограничены дисульфидными мостиками между цистеинами, как в полном домене III белков CCN, продуцируемых в эукариотических системах. Кроме того, ингибирование активности CCN2 пептидами, происходящими из первичных последовательностей доменов I, III и IV, иллюстрирует отсутствие знаний в данной области относительно того, могут ли пептиды, происходящие из конкретного домена CCN2, обеспечивать способность к ингибированию четырехдоменным белкам CCN.The sensitivity of the actions of CCN proteins to the antagonizing effects of high concentrations of synthetic peptides derived from the primary sequences of CCN proteins has been described. One example is the inhibition of AKT phosphorylation stimulated by recombinant CCN2 in Rat2 fibroblasts by peptides derived from domain I, the IGFBP homology domain, and to a lesser extent by peptides derived from domain III, the TSP-1 repeat homology domain, of CCN2 (Moe et al., J. Cell Commun. Signal. (2013) 7:31–47). Another example is the inhibition of CCN2 (domain IV)-stimulated liver fat-storing cell adhesion by a peptide derived from domain IV, the cystine knot homology domain, of CCN2 (Gao R and Brigstock DR., J Biol Chem. 2004 Mar 5; 279(10):8848-55). Furthermore, peptides from domain III of CCN1 (Leu et al. J. Biol. Chem, 2003, Vol. 278, NO: 36, Issue of September 5, pp. 33801-33808, 2003) and domain III of CCN1, CCN2, CCN3, CCN5, and CCN6 (Karagiannis EG and Popel, The International Journal of Biochemistry & Cell Biology 39 (2007) 2314 2323) have been reported to exert some anti-angiogenic effects in in vitro assays on HUVEC cells (Leu et al. J. Biol. Chem, 2003, and Karagiannis EG and Popel, Int J Biochem Cell Biol 39 (2007)) and anti-adhesion effects on 1064SK human foreskin fibroblasts (Leu et al. J. Biol. Chem, 2003), these peptides contain only one (Leu et al. J. Biol. Chem, 2003) or two (Karagiannis EG and Popel, Int J Biochem Cell Biol 39, 2007) of the conserved cysteines that play a central role in the invention described in the present application. Cysteines in domain III of CCN proteins are known to form disulfide bridges, as demonstrated for CCN2 endogenously expressed by HUVEC cells (Lu, S et al. (2015) Nat methods 12, 329-331) and purified recombinant CCN2 ( et al., J. Biol. Chem. 2018). The disulfide bridges demonstrated for CCN2 spanning C199-C228 (Uniprot numbering) provide a complex three-dimensional structure in which the amino acid chain folds to form a fold. This implies that one cannot expect to recapitulate the complete domain III of a CCN protein with short peptides that are not structurally constrained by disulfide bridges between cysteines, as in the complete domain III of CCN proteins produced in eukaryotic systems. Furthermore, the inhibition of CCN2 activity by peptides derived from the primary sequences of domains I, III, and IV illustrates the lack of knowledge in the field regarding whether peptides derived from a specific domain of CCN2 can confer inhibitory capacity to four-domain CCN proteins.
В настоящей работе авторы настоящего изобретения на основании структурно-функционального анализа белков семейства CCN и наблюдения, что CCN2 нуждается в протеолитическом процессинге, чтобы стать биологически активным, обнаружили, что биологически активная часть белка CCN5 представлена доменом III, доменом гомологии к повторам тромбоспондина типа I. Эти новые данные привели к получению биоактивных структур на основе домена III CCN5, а также домена III других представителей семейства белков CCN.In the present work, the present inventors, based on the structure-function analysis of the CCN family proteins and the observation that CCN2 requires proteolytic processing to become biologically active, discovered that the biologically active part of the CCN5 protein is represented by domain III, the thrombospondin type I repeat homology domain. These new data led to the preparation of bioactive structures based on domain III of CCN5, as well as domain III of other members of the CCN protein family.
КРАТКОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯBRIEF DESCRIPTION OF THE INVENTION
Обнаруженная авторами настоящего изобретения взаимосвязь структуры и активности CCN5 и других белков CCN позволила получить новые биологически активные рекомбинантные белки, которые воспроизводят клеточную сигнализацию и физиологические функции клеток, приписываемые CCN-сигнализации, а также способные противодействовать другим четырехдоменным белкам CCN (Cyr61 (также известен как CCN1), CTGF (также известен как CCN2), NOV (также известен как CCN3), WISP1 (также известен как CCN4) и WISP3 (также известен как CCN6)). Другими словами, предложены белки, в том числе в форме слитых белков, на основе домена III, домена гомологии с TSP-1, белка CCN, которые воспроизводят или имеют биологическую активность CCN5, и способны антагонизировать или ингибировать эффекты 4-доменных белков CCN, CCN1-4 или CCN6. В частности, белки согласно настоящей заявке имеют антифибротическую активность и могут также осуществлять прямую противораковую активность.The relationship between the structure and activity of CCN5 and other CCN proteins discovered by the present inventors made it possible to obtain new biologically active recombinant proteins that reproduce cellular signaling and physiological functions of cells attributed to CCN signaling, and are also capable of counteracting other four-domain CCN proteins (Cyr61 (also known as CCN1), CTGF (also known as CCN2), NOV (also known as CCN3), WISP1 (also known as CCN4) and WISP3 (also known as CCN6)). In other words, proteins, including in the form of fusion proteins, based on domain III, the TSP-1 homology domain, of the CCN protein are provided, which reproduce or have the biological activity of CCN5, and are capable of antagonizing or inhibiting the effects of the 4-domain CCN proteins, CCN1-4 or CCN6. In particular, the proteins according to the present application have antifibrotic activity and may also exert direct anticancer activity.
Как отмечалось выше, было неожиданно обнаружено, что домен III (домен гомологии с TSP-1) других белков CCN, а именно, 4-доменных белков CCN, когда он представлен отдельным доменом в отсутствие других доменов CCN, достаточен для воспроизведения описанных видов активности CCN5. Соответственно, другими словами, домен III 4-доменных белков CCN, когда он представлен отдельным доменом в отсутствие других доменов CCN (т.е. в виде выделенного домена), имеет такую же активность, как и CCN5, или, говоря иначе, как домен III/домен гомологии с TSP-1 CNN5 (то есть активность, противоположную активности полноразмерных 4-доменных белков CCN). Соответственно, из экспериментов, раскрытых в указанной заявке, ясно, что выделенный домен гомологии с TSP-1 любого белка CCN может осуществлять ту же активность, что и домен гомологии с TSP-1 CCN5. За исключением CCN5, указанные виды активности могут быть иными, чем осуществляемые полноразмерным белком CCN.As noted above, it has been unexpectedly found that domain III (the TSP-1 homology domain) of other CCN proteins, namely, the 4-domain CCN proteins, when present as a single domain in the absence of other CCN domains, is sufficient to reproduce the disclosed activities of CCN5. Accordingly, in other words, domain III of the 4-domain CCN proteins, when present as a single domain in the absence of other CCN domains (i.e., as an isolated domain), has the same activity as CCN5, or, in other words, as domain III/TSP-1 homology domain of CNN5 (i.e., an activity opposite to the activity of the full-length 4-domain CCN proteins). Accordingly, it is clear from the experiments disclosed in this application that an isolated TSP-1 homology domain of any CCN protein can exert the same activity as the TSP-1 homology domain of CCN5. With the exception of CCN5, the activities reported may be different from those carried out by the full-length CCN protein.
Было обнаружено, что мономерные слитые белки, отличающиеся тем, что домен III белка CCN слит с мономерным партнером для слияния, обладают особенными преимуществами и полезностью в соответствии с настоящим изобретением и описанием в настоящей заявке.It has been found that monomeric fusion proteins characterized in that domain III of the CCN protein is fused to a monomeric fusion partner have particular advantages and utility in accordance with the present invention and the description herein.
В соответствии с первым аспектом в настоящем изобретении предложен мономерный слитый белок, содержащий:According to a first aspect, the present invention provides a monomeric fusion protein comprising:
(i) полипептид, соответствующий по меньшей мере части домена гомологии к повторам тромбоспондина типа 1 (TSP-1) белка семейства CCN;(i) a polypeptide corresponding to at least a portion of the thrombospondin type 1 repeat homology domain (TSP-1) of a CCN family protein;
(ii) мономерный партнер для слияния, слитый на N- или С-конце с последовательностью аминокислот по (i); и(ii) a monomeric fusion partner fused at the N- or C-terminus to the amino acid sequence of (i); and
(iii) необязательно, пептидный линкер между полипептидом по (i) и мономерным партнером для слияния по (ii),(iii) optionally, a peptide linker between the polypeptide of (i) and the monomeric fusion partner of (ii),
где полипептид по (i) имеет длину от 40 до 60 аминокислот и содержит последовательность аминокислот, выбранную из SEQ ID NO: 37 или 2 6, или последовательность, по меньшей мере на 80% идентичную последовательности, выбранной из SEQ ID NO: 37 или 2-6, причем все остатки цистеина в указанной последовательности, выбранной из SEQ ID NO: 37 или 2-6, сохранены, а мономерный партнер для слияния по (ii) и пептидный линкер по (iii) не представляют собой или не содержат домен гомологии со связывающим IGF белком, домен гомологии с повторами фактора фон Виллебранда типа С или домен цистинового узла белка семейства CCN.wherein the polypeptide of (i) is from 40 to 60 amino acids in length and comprises an amino acid sequence selected from SEQ ID NO: 37 or 2-6, or a sequence at least 80% identical to a sequence selected from SEQ ID NO: 37 or 2-6, wherein all cysteine residues in said sequence selected from SEQ ID NO: 37 or 2-6 are retained, and the monomeric fusion partner of (ii) and the peptide linker of (iii) do not represent or do not comprise an IGF binding protein homology domain, a von Willebrand factor type C repeat homology domain, or a cystine knot domain of a CCN family protein.
Как описано более подробно ниже, SEQ ID NO: 37 и 2-6 представляют усеченные фрагменты из 44 аминокислот домена III CCN5, CCN3, CCN2, CCN1, CCN4 и CCN6, соответственно, которые содержат 6 консервативных остатков цистеина указанного домена. В частности, указанные фрагменты фланкированы первым и последним остатками цистеина указанного домена. Было обнаружено, что такие фрагменты, в частности, эффективны и устойчивы к протеолитическому разложению.As described in more detail below, SEQ ID NOs: 37 and 2-6 represent truncated 44 amino acid fragments of domain III of CCN5, CCN3, CCN2, CCN1, CCN4 and CCN6, respectively, which contain 6 conserved cysteine residues of said domain. In particular, said fragments are flanked by the first and last cysteine residues of said domain. Such fragments were found to be particularly effective and resistant to proteolytic degradation.
Согласно варианту реализации полипептид по (i) содержит или состоит из:According to an embodiment, the polypeptide according to (i) comprises or consists of:
(a) последовательности аминокислот, выбранной из SEQ ID NO: 1 или 8-12; или(a) an amino acid sequence selected from SEQ ID NO: 1 or 8-12; or
(b) последовательности аминокислот, по меньшей мере на 80% идентичной последовательности, выбранной из SEQ ID NO: 1 или 8-12; или(b) an amino acid sequence that is at least 80% identical to a sequence selected from SEQ ID NO: 1 or 8-12; or
(c) части последовательности аминокислот по (а) или (b), отличающейся тем, что указанная часть содержит по меньшей мере последовательность из 44 аминокислот из SEQ ID NO: 37, 6, 2, 3, 4 или 5, соответственно, или последовательность, по меньшей мере на 80% идентичную последовательности, выбранной из SEQ ID NO: 37, 6, 2, 3, 4 или 5, соответственно.(c) a part of the amino acid sequence according to (a) or (b), characterized in that said part comprises at least a sequence of 44 amino acids from SEQ ID NO: 37, 6, 2, 3, 4 or 5, respectively, or a sequence that is at least 80% identical to a sequence selected from SEQ ID NO: 37, 6, 2, 3, 4 or 5, respectively.
SEQ ID NO: 1 и 8-12 представляют незначительно более длинные усеченные по N-концу фрагменты домена III CCN5, CCN6, CCN3, CCN2, CCN1 и CCN4, соответственно. Указанные фрагменты содержат соответствующие последовательности SEQ ID NO: 37, 6, 2, 3, 4 и 5, соответственно, с какой-либо дополнительной C-концевой последовательностью из соответствующего домена III.SEQ ID NOS: 1 and 8-12 represent slightly longer N-terminally truncated fragments of domain III of CCN5, CCN6, CCN3, CCN2, CCN1 and CCN4, respectively. These fragments comprise the corresponding sequences of SEQ ID NOS: 37, 6, 2, 3, 4 and 5, respectively, with any additional C-terminal sequence from the corresponding domain III.
Согласно дополнительному варианту реализации полипептид по (i) содержит остаток аланина в положении, соответствующем положению 2 указанной последовательности, выбранной из SEQ ID NO: 37 или 2-6, или SEQ ID NO: 1 или 8-12. Согласно некоторым вариантам реализации последовательность аминокислот по (i) содержит последовательность аминокислот, выбранную из SEQ ID NO: 38 или 42 46, или последовательность аминокислот, по меньшей мере на 80% идентичную указанной. Согласно другому варианту реализации последовательность аминокислот по (i) содержит последовательность аминокислот, выбранную из SEQ ID NO: 7, или 47-51, или последовательность аминокислот, по меньшей мере на 80% идентичную указанной. В этом отношении было обнаружено, что замена указанного остатка в положении 2 полезна для повышения стабильности белка.According to a further embodiment, the polypeptide according to (i) comprises an alanine residue at a position corresponding to position 2 of said sequence selected from SEQ ID NO: 37 or 2-6, or SEQ ID NO: 1 or 8-12. According to some embodiments, the amino acid sequence according to (i) comprises an amino acid sequence selected from SEQ ID NO: 38 or 42-46, or an amino acid sequence at least 80% identical thereto. According to another embodiment, the amino acid sequence according to (i) comprises an amino acid sequence selected from SEQ ID NO: 7 or 47-51, or an amino acid sequence at least 80% identical thereto. In this regard, it has been found that substitution of said residue at position 2 is useful for increasing protein stability.
В соответствии с дополнительным аспектом настоящего изобретения мономерный слитый белок имеет последовательность аминокислот, выбранную из группы, состоящей из SEQ ID NO: 84, 85, 88, 89, 97, 98, 102, 103, 106, 107, ПО, 111, или последовательность аминокислот, на 80% идентичную указанной.According to a further aspect of the present invention, the monomeric fusion protein has an amino acid sequence selected from the group consisting of SEQ ID NO: 84, 85, 88, 89, 97, 98, 102, 103, 106, 107, 111, or an amino acid sequence 80% identical thereto.
Во вариантах реализации указанных аспектов мономерный партнер для слияния выбирают из сывороточного альбумина, трансферрина и мономерных Fc-фрагментов, в частности, мономерных Fc-фрагментов IgG, более конкретно - IgG человека.In embodiments of the above aspects, the monomeric fusion partner is selected from serum albumin, transferrin, and monomeric Fc fragments, in particular monomeric Fc fragments of IgG, more particularly human IgG.
Как отмечалось выше, замена положения 2 во фрагментах домена III согласно настоящему изобретению улучшает стабильность фрагмента, в частности, устойчивость к разложению протеазами. Считается и предполагается в настоящей заявке, что такие варианты фрагментов домена III с модифицированной последовательностью сами по себе являются полезными белками, без связывания с партнером для слияния.As noted above, the substitution of position 2 in the domain III fragments of the present invention improves the stability of the fragment, in particular resistance to protease degradation. It is believed and suggested in the present application that such sequence-modified variants of domain III fragments are useful proteins in their own right, without binding to a fusion partner.
Соответственно, согласно другому аспекту настоящего изобретения также предложен белок длиной от 40 до 60 аминокислот, который содержит последовательность, или белок, который состоит из последовательности аминокислот, представленной в SEQ ID NO: 7, 38, 42 46, или 47-51, или последовательности, по меньшей мере на 80% идентичной указанной, причем указанный белок содержит остаток аланина в положении, соответствующем положению 2 указанной последовательности из SEQ ID NO: 7, 38, 42-16, 47-51, и все остатки цистеина в указанной последовательности сохранены.Accordingly, according to another aspect of the present invention, there is also provided a protein of 40 to 60 amino acids in length, which comprises a sequence, or a protein, which consists of the amino acid sequence presented in SEQ ID NO: 7, 38, 42-46, or 47-51, or a sequence at least 80% identical thereto, wherein said protein comprises an alanine residue at a position corresponding to position 2 of said sequence from SEQ ID NO: 7, 38, 42-16, 47-51, and all cysteine residues in said sequence are preserved.
Другие белки и слитые белки также предложены в качестве дополнительных аспектов настоящих изобретений, согласно подробному описанию ниже.Other proteins and fusion proteins are also provided as further aspects of the present inventions, as described in detail below.
В соответствии с дополнительным аспектом настоящего изобретению предложен рекомбинантный белок, состоящий из формулы (I)According to a further aspect of the present invention, there is provided a recombinant protein consisting of formula (I)
гдеWhere
А представляет собой пептид формулы IIA is a peptide of formula II
где А1 выбран из группы, состоящей из Р, А, V, I и L; А2 выбран из группы, состоящей из Е, D, A, I, L, и V; A3 выбран из группы, состоящей из G, Q, Y, S, N, W, F; А4 выбран из группы, состоящей из A, I, L, V, S, Т; А5 представляет собой аминокислоту, выбранную из группы, состоящей из Т, Y, N, G, Q и S; А6 представляет собой аминокислоту, выбранную из группы, состоящей из А, V, I, L, Р, S, Е, D, К, R и Н; А7 представляет собой W; А8 выбран из группы, состоящей из G, Т, S, Q, Y, N, Р, А, V, I и L; А9 представляет собой аминокислоту, выбранную из группы, состоящей из А, Р, L, I, V, Q; иwherein A1 is selected from the group consisting of P, A, V, I, and L; A2 is selected from the group consisting of E, D, A, I, L, and V; A3 is selected from the group consisting of G, Q, Y, S, N, W, F; A4 is selected from the group consisting of A, I, L, V, S, T; A5 is an amino acid selected from the group consisting of T, Y, N, G, Q, and S; A6 is an amino acid selected from the group consisting of A, V, I, L, P, S, E, D, K, R, and H; A7 is W; A8 is selected from the group consisting of G, T, S, Q, Y, N, P, A, V, I, and L; A9 is an amino acid selected from the group consisting of A, P, L, I, V, Q; and
В представляет собой пептид формулы III B is a peptide of formula III
где В1 представляет собой аминокислоту, выбранную из группы, состоящей из G, Q, N, S, Y и Т; В2 представляет собой аминокислоту, выбранную из группы, состоящей из, Т, S, N, F, Q, Н, R и K; В3 представляет собой аминокислоту, выбранную из группы, состоящей из G, Q, N, S, Y, Т; при этом один из В1-В3 отсутствует; иwherein B1 is an amino acid selected from the group consisting of G, Q, N, S, Y and T; B2 is an amino acid selected from the group consisting of T, S, N, F, Q, H, R and K; B3 is an amino acid selected from the group consisting of G, Q, N, S, Y, T; wherein one of B1-B3 is absent; and
С представляет собой пептид формулы IVC is a peptide of formula IV
где С1 представляет собой аминокислоту, выбранную из группы, состоящей из G, Q, N, S, Y и Т; С2 представляет собой аминокислоту, выбранную из группы, состоящей из K, R, Н, М, Т, S, A, L, I и V; С3 представляет собой аминокислоту, выбранную из группы, состоящей из G, Q, N, S, Y и Т; С4 представляет собой аминокислоту, выбранную из группы, состоящей из М, F, A, I, L, V и W; С5 представляет собой аминокислоту, выбранную из группы, состоящей из G, Q, N, S, Т, Y, A, I, L и V; С6 представляет собой аминокислоту, выбранную из группы, состоящей из G, Q, N, S и Т; С7 представляет собой аминокислоту, выбранную из группы, состоящей из Н, R и L; С8 представляет собой аминокислоту, выбранную из группы, состоящей из A, L, I, и V; С9 представляет собой аминокислоту, выбранную из группы, состоящей из G, Q, N, S, Т и Y; С10 представляет собой аминокислоту, выбранную из группы, состоящей из G, Q, N, S, Т, Y (предпочтительно N); С11 представляет собой аминокислоту, выбранную из группы, состоящей из V, Р, A, I, L, G, Q, N, S, Т, Y, R, K, D и Е; С12 представляет собой аминокислоту, выбранную из группы, состоящей из G, Q, N, S, Y и Т; С13 представляет собой аминокислоту, выбранную из группы, состоящей из Н, K, R, A, L, I, V, Р, G, Q, N, S, Y и Т; С14 представляет собой аминокислоту, выбранную из группы, состоящей из F, Р, W, G, Q, N, S, Y, Т, Е и D; иwherein C1 is an amino acid selected from the group consisting of G, Q, N, S, Y and T; C2 is an amino acid selected from the group consisting of K, R, H, M, T, S, A, L, I and V; C3 is an amino acid selected from the group consisting of G, Q, N, S, Y and T; C4 is an amino acid selected from the group consisting of M, F, A, I, L, V and W; C5 is an amino acid selected from the group consisting of G, Q, N, S, T, Y, A, I, L and V; C6 is an amino acid selected from the group consisting of G, Q, N, S and T; C7 is an amino acid selected from the group consisting of H, R and L; C8 is an amino acid selected from the group consisting of A, L, I, and V; C9 is an amino acid selected from the group consisting of G, Q, N, S, T and Y; C10 is an amino acid selected from the group consisting of G, Q, N, S, T, Y (preferably N); C11 is an amino acid selected from the group consisting of V, P, A, I, L, G, Q, N, S, T, Y, R, K, D and E; C12 is an amino acid selected from the group consisting of G, Q, N, S, Y and T; C13 is an amino acid selected from the group consisting of H, K, R, A, L, I, V, P, G, Q, N, S, Y and T; C14 is an amino acid selected from the group consisting of F, P, W, G, Q, N, S, Y, T, E and D; and
D представляет собой пептид формулы V D is a peptide of formula V
где D1 представляет собой аминокислоту, выбранную из группы, состоящей из R, K, Н, D, Е, W, Р; D2 представляет собой аминокислоту, выбранную из группы, состоящей из Р, А, L, I, V, М, W, D и Е; D3 представляет собой аминокислоту, выбранную из группы, состоящей из D, Е, A, L, I, V, R, K и Н; D4 представляет собой аминокислоту, выбранную из группы, состоящей из G, Q, S, Y, Т, R, L, K и Н; D5 представляет собой аминокислоту, выбранную из группы, состоящей из G, Q, N, S, Y, Т, D и Е; D6 представляет собой аминокислоту, выбранную из группы, состоящей из Н, R; K, G, Q, N, S, Y и Т; D7 представляет собой аминокислоту, выбранную из группы, состоящей из L, Н и R; D8 представляет собой аминокислоту, выбранную из группы, состоящей из A, L, I и V; иwherein D1 is an amino acid selected from the group consisting of R, K, H, D, E, W, P; D2 is an amino acid selected from the group consisting of P, A, L, I, V, M, W, D and E; D3 is an amino acid selected from the group consisting of D, E, A, L, I, V, R, K and H; D4 is an amino acid selected from the group consisting of G, Q, S, Y, T, R, L, K and H; D5 is an amino acid selected from the group consisting of G, Q, N, S, Y, T, D and E; D6 is an amino acid selected from the group consisting of H, R; K, G, Q, N, S, Y and T; D7 is an amino acid selected from the group consisting of L, H and R; D8 is an amino acid selected from the group consisting of A, L, I and V; and
Е представляет собой пептид формулы VI E is a peptide of formula VI
отличающийся тем, что Е1 представляет собой аминокислоту, выбранную из группы, состоящей из Р, A, L, I, V, М, W, G, Q, N, S, Т, Y, D и Е; Е2 представляет собой аминокислоту, выбранную из группы, состоящей из; Р, A, L, I, V, М, W, G, Q, N, S, Т, Y; Е3 представляет собой аминокислоту, выбранную из группы, состоящей из, R, K, Н, G, Q, N, S, Т и Y; Е4 представляет собой аминокислоту, выбранную из группы, состоящей из Р, A, L, I и V; F отсутствует или представляет собой последовательность аминокислот длиной до приблизительно 13 аминокислот,characterized in that E1 is an amino acid selected from the group consisting of P, A, L, I, V, M, W, G, Q, N, S, T, Y, D and E; E2 is an amino acid selected from the group consisting of; P, A, L, I, V, M, W, G, Q, N, S, T, Y; E3 is an amino acid selected from the group consisting of, R, K, H, G, Q, N, S, T and Y; E4 is an amino acid selected from the group consisting of P, A, L, I and V; F is absent or is a sequence of amino acids up to about 13 amino acids in length,
где рекомбинантный белок содержит от 40 до 60 аминокислот.where the recombinant protein contains from 40 to 60 amino acids.
В соответствии с одним вариантом реализации вышеописанного аспекта предложен рекомбинантный белок формулы (I), отличающийся тем, чтоAccording to one embodiment of the above-described aspect, a recombinant protein of formula (I) is proposed, characterized in that
А1 выбран из группы, состоящей из Р, I и L; А2 выбран из группы, состоящей из Е, V, и А; A3 выбран из группы, состоящей из W, Q, и Y; А4 выбран из группы, состоящей из S, Т, и А; А5 представляет собой аминокислоту, выбранную из группы, состоящей из Т и S; А6 представляет собой аминокислоту, выбранную из группы, состоящей из А, Е, Р, S и K; А7 представляет собой W; А8 выбран из группы, состоящей из G, S и Т; А9 представляет собой аминокислоту, выбранную из группы, состоящей из Р, Q и А; иA1 is selected from the group consisting of P, I, and L; A2 is selected from the group consisting of E, V, and A; A3 is selected from the group consisting of W, Q, and Y; A4 is selected from the group consisting of S, T, and A; A5 is an amino acid selected from the group consisting of T and S; A6 is an amino acid selected from the group consisting of A, E, P, S, and K; A7 is W; A8 is selected from the group consisting of G, S, and T; A9 is an amino acid selected from the group consisting of P, Q, and A; and
В1 представляет собой серии (S); В2 представляет собой аминокислоту, выбранную из группы, состоящей из Т, K и R; В3 представляет собой аминокислоту, выбранную из группы, состоящей из Т и S; иB1 is a series (S); B2 is an amino acid selected from the group consisting of T, K, and R; B3 is an amino acid selected from the group consisting of T and S; and
С1 представляет собой аминокислоту G; С2 представляет собой аминокислоту, выбранную из группы, состоящей из Т, L и М; С3 представляет собой G; С4 представляет собой аминокислоту, выбранную из группы, состоящей из М, F, I и V; С5 представляет собой аминокислоту, выбранную из группы, состоящей из S и А; С6 представляет собой аминокислоту, выбранную из группы, состоящей из Т и N; С7 представляет собой R; С8 представляет собой аминокислоту, выбранную из группы, состоящей из V, и I; С9 представляет собой аминокислоту, выбранную из группы, состоящей из S и Т; С10 представляет собой аспарагин N; С11 представляет собой аминокислоту, выбранную из группы, состоящей из Q, R, D, V и Е; С12 представляет собой аспарагин N; С13 представляет собой аминокислоту, выбранную из группы, состоящей из R, А, Р, и S; С14 представляет собой аминокислоту, выбранную из группы, состоящей из F, Q, S, Е и N; иC1 is an amino acid G; C2 is an amino acid selected from the group consisting of T, L, and M; C3 is G; C4 is an amino acid selected from the group consisting of M, F, I, and V; C5 is an amino acid selected from the group consisting of S and A; C6 is an amino acid selected from the group consisting of T and N; C7 is R; C8 is an amino acid selected from the group consisting of V and I; C9 is an amino acid selected from the group consisting of S and T; C10 is asparagine N; C11 is an amino acid selected from the group consisting of Q, R, D, V, and E; C12 is asparagine N; C13 is an amino acid selected from the group consisting of R, A, P, and S; C14 is an amino acid selected from the group consisting of F, Q, S, E, and N; and
D1 представляет собой аминокислоту, выбранную из группы, состоящей из R, Е и W; D2 представляет собой аминокислоту, выбранную из группы, состоящей из L, М и Р; D3 представляет собой аминокислоту, выбранную из группы, состоящей из Е, L, V и R; D4 представляет собой аминокислоту, выбранную из группы, состоящей из Т, K и Q; D5 представляет собой аминокислоту, выбранную из группы, состоящей из Q и Е; D6 представляет собой аминокислоту, выбранную из группы, состоящей из R, Т, S и K; D7 представляет собой аргинин (R); D8 представляет собой аминокислоту, выбранную из группы, состоящей из L и I; иD1 is an amino acid selected from the group consisting of R, E and W; D2 is an amino acid selected from the group consisting of L, M and P; D3 is an amino acid selected from the group consisting of E, L, V and R; D4 is an amino acid selected from the group consisting of T, K and Q; D5 is an amino acid selected from the group consisting of Q and E; D6 is an amino acid selected from the group consisting of R, T, S and K; D7 is arginine (R); D8 is an amino acid selected from the group consisting of L and I; and
Е1 представляет собой аминокислоту, выбранную из группы, состоящей из L, М, Е, N и Y; Е2 представляет собой аминокислоту, выбранную из группы, состоящей из; S, V, L и I; Е3 представляет собой аминокислоту, выбранную из группы, состоящей из, Q и R; Е4 представляет собой Р; F отсутствует или представляет собой пептид длиной до 13 аминокислот и содержащий последовательность аминокислот, выбранную из группы, состоящей из PPSRGRSPQNSAF, GQPVYSSL, EADLEEN, EQEPEQPTD, DVDIHTLI и DSNILKTIKIP,E1 is an amino acid selected from the group consisting of L, M, E, N and Y; E2 is an amino acid selected from the group consisting of; S, V, L and I; E3 is an amino acid selected from the group consisting of, Q and R; E4 is P; F is absent or is a peptide up to 13 amino acids in length and comprising an amino acid sequence selected from the group consisting of PPSRGRSPQNSAF, GQPVYSSL, EADLEEN, EQEPEQPTD, DVDIHTLI and DSNILKTIKIP,
где рекомбинантный белок содержит в общей сложности от 44 до 57 аминокислот.where the recombinant protein contains a total of 44 to 57 amino acids.
В соответствии с еще одним вариантом реализации вышеописанного аспекта предложен рекомбинантный белок формулы I, где F полностью отсутствует, частично отсутствует, или представляет собой пептид длиной приблизительно 13 аминокислот, содержащий последовательность аминокислот PPSRGRSPQNSAF.According to another embodiment of the above-described aspect, there is provided a recombinant protein of formula I, wherein F is completely absent, partially absent, or is a peptide of approximately 13 amino acids in length comprising the amino acid sequence PPSRGRSPQNSAF.
Более конкретно, предложен рекомбинантный белок, отличающийся тем, что указанный белок содержит последовательность аминокислот, выбранную из группы, состоящей из SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6 и SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 37, SEQ ID NO: 38; и ее фрагменты или варианты с более чем 50% идентичностью последовательностей последовательностям аминокислот SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6 и SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 37, SEQ ID NO: 38.More specifically, a recombinant protein is proposed, characterized in that said protein comprises an amino acid sequence selected from the group consisting of SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6 and SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 37, SEQ ID NO: 38; and fragments or variants thereof with more than 50% sequence identity to the amino acid sequences of SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6 and SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 37, SEQ ID NO: 38.
В соответствии с другим аспектом настоящего изобретения предложены рекомбинантные белки согласно определению выше, отличающиеся тем, что указанный белок пегилирован.According to another aspect of the present invention, there are provided recombinant proteins as defined above, characterized in that said protein is PEGylated.
Согласно другому аспекту настоящего изобретения предложен слитый белок, содержащийAccording to another aspect of the present invention, there is provided a fusion protein comprising
(i) домен гомологии к повторам тромбоспондина типа 1 (TSP-1) белка семейства CCN;(i) the thrombospondin type 1 repeat homology domain (TSP-1) of the CCN family protein;
(ii) партнер для слияния слит на N- или С-конце с доменом гомологии к повторам TSP-1 по (i), при этом указанный партнер для слияния выбран из группы, состоящей из сывороточного альбумина, трансферрина и Fc-фрагмента IgG человека;(ii) the fusion partner is fused at the N- or C-terminus to the TSP-1 repeat homology domain of (i), wherein said fusion partner is selected from the group consisting of serum albumin, transferrin and the Fc portion of human IgG;
(iii) необязательно, пептидный линкер между доменом гомологии к повторам TSP-1 и Fc-фрагментом (слитый на N- или С-конце с доменом гомологии к повторам TSP-1 по (i)).(iii) optionally, a peptide linker between the TSP-1 repeat homology domain and the Fc fragment (fused at the N- or C-terminus to the TSP-1 repeat homology domain of (i)).
В соответствии с вариантом реализации вышеописанного аспекта предложены слитые белки, содержащие рекомбинантный белок в соответствии с настоящим изобретением согласно описанию выше, в качестве дополнительного аспекта настоящего изобретения.According to an embodiment of the above-described aspect, fusion proteins comprising a recombinant protein according to the present invention as described above are provided as a further aspect of the present invention.
Партнер для слияния слитого белка согласно настоящему изобретению соответствует одному из вариантов реализации, выбранных из группы, состоящей из Fc-фрагментом IgG1, IgG2 или IgG4, сывороточного альбумина и трансферрина.The fusion partner of the fusion protein according to the present invention corresponds to one of the embodiments selected from the group consisting of the Fc fragment of IgG1, IgG2 or IgG4, serum albumin and transferrin.
В соответствии с дополнительным вариантом реализации предложен слитый белок, отличающийся тем, что партнер для слияния (ii) представляет собой Fc-фрагмент IgG1, IgG2 или IgG4, содержащий стабилизирующий дисульфидный мостик. Такие мутации могут повышать термическую стабильность белка. Стабилизирующие мутации известны и были описаны в данной области техники.According to a further embodiment, a fusion protein is provided, characterized in that the fusion partner (ii) is an Fc fragment of IgG1, IgG2 or IgG4 containing a stabilizing disulfide bridge. Such mutations can increase the thermal stability of the protein. Stabilizing mutations are known and have been described in the art.
В соответствии с еще одним дополнительным вариантом реализации предложен слитый белок, отличающийся тем, что партнер для слияния (ii) представляет собой Fc-фрагмент IgG1, IgG2 или IgG4, содержащий одну или более мутаций, выбранных из группы, состоящей из S228P (относится к IgG4), Е233Р (относится к IgG1 и IgG4), F234A (относится к IgG4), L234A (относится к IgG1), L234V (относится к IgG1), F234V (относится к IgG4), L235A (относится к IgG1 и IgG4), AG236 (относится к IgG1 и IgG4) и ΔK447 (относится к IgG1, IgG2 и IgG4).According to yet another additional embodiment, a fusion protein is provided, characterized in that the fusion partner (ii) is an Fc fragment of IgG1, IgG2 or IgG4 comprising one or more mutations selected from the group consisting of S228P (relates to IgG4), E233P (relates to IgG1 and IgG4), F234A (relates to IgG4), L234A (relates to IgG1), L234V (relates to IgG1), F234V (relates to IgG4), L235A (relates to IgG1 and IgG4), AG236 (relates to IgG1 and IgG4) and ΔK447 (relates to IgG1, IgG2 and IgG4).
Согласно другому варианту реализации слитый белок может содержать Fc-фрагмент, выбранный из группы, состоящей из SEQ ID NO: 15, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18 и SEQ ID NO: 19.According to another embodiment, the fusion protein may comprise an Fc region selected from the group consisting of SEQ ID NO: 15, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, and SEQ ID NO: 19.
Согласно другому варианту реализации слитый белок содержит линкер, выбранный из группы, состоящей из SEQ ID NO: 20; SEQ ID NO: 21; SEQ ID NO: 22, SEQ ID NO: 23, SEQ ID NO: 24, SEQ ID NO: 25 и SEQ ID NO: 39.According to another embodiment, the fusion protein comprises a linker selected from the group consisting of SEQ ID NO: 20; SEQ ID NO: 21; SEQ ID NO: 22, SEQ ID NO: 23, SEQ ID NO: 24, SEQ ID NO: 25, and SEQ ID NO: 39.
В соответствии с одним вариантом реализации указанный линкер содержит последовательность аминокислот (EAAAK)n, где n равен по меньшей мере 4, предпочтительно n равен 8.According to one embodiment, said linker comprises the amino acid sequence (EAAAK)n, where n is at least 4, preferably n is 8.
Согласно другому варианту реализации указанный слитый белок содержит последовательность аминокислот, выбранную из группы, состоящей из SEQ ID NO: 26, SEQ ID NO: 27; SEQ ID NO: 28, SEQ ID NO: 29, SEQ ID NO: 30, SEQ ID NO: 31, SEQ ID NO: 40 и SEQ ID NO: 41.According to another embodiment, said fusion protein comprises an amino acid sequence selected from the group consisting of SEQ ID NO: 26, SEQ ID NO: 27; SEQ ID NO: 28, SEQ ID NO: 29, SEQ ID NO: 30, SEQ ID NO: 31, SEQ ID NO: 40 and SEQ ID NO: 41.
Согласно другому варианту реализации указанный партнер для слияния по (ii) представляет собой сывороточный альбумин.According to another embodiment, said fusion partner according to (ii) is serum albumin.
В соответствии с другим вариантом реализации второго аспекта настоящего изобретения партнер для слияния по (ii) представляет собой трансферрин.According to another embodiment of the second aspect of the present invention, the fusion partner for (ii) is transferrin.
Также согласно настоящему изобретению, в соответствии с еще одним дополнительным аспектом, предложена молекула нуклеиновой кислоты (например, ДНК), кодирующая рекомбинантный белок, белок или слитый белок в соответствии с настоящим изобретением.Also according to the present invention, in accordance with a further additional aspect, there is provided a nucleic acid molecule (eg, DNA) encoding a recombinant protein, protein or fusion protein according to the present invention.
В соответствии с одним вариантом реализации указанного аспекта предложена последовательность ДНК, содержащая последовательность нуклеиновой кислоты, представленную в SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 36 или SEQ ID NO: 86, 87, 90, 91, 99, 100, 104, 105, 108, 109, 112 или 113, и последовательностях нуклеиновых кислот, приблизительно на 80% идентичных SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 36 или SEQ ID NO: 86, 87, 90, 91, 99, 100, 104, 105, 108, 109, 112 или 113.According to one embodiment of this aspect, there is provided a DNA sequence comprising a nucleic acid sequence as presented in SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 36 or SEQ ID NO: 86, 87, 90, 91, 99, 100, 104, 105, 108, 109, 112 or 113, and nucleic acid sequences that are approximately 80% identical to SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 36 or SEQ ID NO: 86, 87, 90, 91, 99, 100, 104, 105, 108, 109, 112 or 113.
Кроме того, в соответствии с другим аспектом настоящего изобретения предложен экспрессионный вектор, содержащий последовательность ДНК в соответствии с настоящим изобретением. Также предложена клетка-хозяин, содержащая экспрессионный вектор в соответствии с настоящим изобретением.Furthermore, according to another aspect of the present invention, there is provided an expression vector comprising a DNA sequence according to the present invention. There is also provided a host cell comprising an expression vector according to the present invention.
Наконец, предложен домен гомологии к повторам тромбоспондина типа 1 (TSP-1) белка семейства CCN, белок и слитый белок согласно определению выше для применения в качестве медикамента для лечения или предотвращения расстройств путем ингибирования или противодействия клеточной сигнализации и физиологических функций клетки, приписываемым четырехдоменным белкам семейства CCN.Finally, a thrombospondin type 1 (TSP-1) repeat homology domain of a CCN family protein, protein and fusion protein as defined above is provided for use as a medicament for the treatment or prevention of disorders by inhibiting or antagonizing cell signaling and physiological functions of the cell attributed to four-domain proteins of the CCN family.
Согласно одному аспекту предложен слитый белок или белок согласно определению в настоящей заявке для применения в терапии.According to one aspect, there is provided a fusion protein or a protein as defined herein for use in therapy.
Указанный слитый белок или белок может быть предназначен для применения при лечении состояния, ассоциированного с активностью 4-доменного белка CCN, в частности, нежелательной или аберрантной активности 4-доменного белка CCN. Указанная активность может быть ассоциирована с фибротическим эффектом. Указанная активность может представлять собой профибротическую активность.Said fusion protein or protein may be intended for use in the treatment of a condition associated with CCN 4-domain protein activity, in particular, undesirable or aberrant CCN 4-domain protein activity. Said activity may be associated with a fibrotic effect. Said activity may be a pro-fibrotic activity.
Согласно другому аспекту предложен слитый белок или белок согласно определению в настоящей заявке для применения при лечении или предотвращении фиброза, или любого состояния, при котором наблюдается фиброз (т.е. фибротического состояния или заболевания). Согласно дополнительному аспекту предложен слитый белок или белок согласно определению в настоящей заявке для применения при лечении рака. Также предложен слитый белок или белок согласно определению в настоящей заявке для применения при лечении воспалительных или аутоиммунных заболеваний, или метаболических заболеваний.According to another aspect, there is provided a fusion protein or protein as defined herein for use in the treatment or prevention of fibrosis, or any condition in which fibrosis occurs (i.e., a fibrotic condition or disease). According to a further aspect, there is provided a fusion protein or protein as defined herein for use in the treatment of cancer. There is also provided a fusion protein or protein as defined herein for use in the treatment of inflammatory or autoimmune diseases, or metabolic diseases.
Также в соответствии с такими аспектами настоящего изобретения предложено применение белка или слитого белка согласно определению в настоящей заявке для изготовления медикамента для лечения или предотвращения состояния или заболевания согласно определению или описанию в настоящей заявке.Also according to such aspects of the present invention there is provided the use of a protein or fusion protein as defined herein for the manufacture of a medicament for the treatment or prevention of a condition or disease as defined or described herein.
Такие аспекты также включают композицию (например, фармацевтическую композицию), содержащую белок или слитый белок согласно определению в настоящей заявке для применения при лечении или предотвращении состояния или заболевания согласно определению или описанию в настоящей заявке.Such aspects also include a composition (e.g., a pharmaceutical composition) comprising a protein or fusion protein as defined herein for use in treating or preventing a condition or disease as defined or described herein.
Такие аспекты также включают способ лечения или предотвращения состояния или заболевания согласно определению или описанию в настоящей заявке, отличающийся тем, что указанный способ включает введение нуждающемуся в этом субъекту белка или слитого белка согласно определению в настоящей заявке, в частности, эффективного количества указанного белка или слитого белка.Such aspects also include a method of treating or preventing a condition or disease as defined or described herein, characterized in that said method comprises administering to a subject in need thereof a protein or fusion protein as defined herein, in particular an effective amount of said protein or fusion protein.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙBRIEF DESCRIPTION OF DRAWINGS
На Фиг. 1 показаны клеточные физиологические процессы и клеточная сигнализация CCN5(dIII)-Fcv2 (вариант реализации настоящего изобретения согласно определенному в последовательности SEQ ID NO: 28).Fig. 1 shows the cellular physiological processes and cellular signaling of CCN5(dIII)-Fcv2 (an embodiment of the present invention as defined in SEQ ID NO: 28).
A) показано, что слитый белок CCN5(dIII)-Fcv2 из SEQ ID NO: 28 вызывает зависимое от концентрации ингибирование фосфорилирования АКТ (серин-473) в клетках рака легкого А549.A) The CCN5(dIII)-Fcv2 fusion protein of SEQ ID NO: 28 was shown to cause concentration-dependent inhibition of AKT (serine 473) phosphorylation in A549 lung cancer cells.
B) показано, что слитый белок CCN5(dIII)-Fcv2 из SEQ ID. NO: 28 ингибирует пролиферацию линии клеток фибробластов легкого человека, IMR90.B) The CCN5(dIII)-Fcv2 fusion protein of SEQ ID. NO: 28 was shown to inhibit proliferation of the human lung fibroblast cell line, IMR90.
C) показано, что слитый белок CCN5(dIII)-Fcv2 из SEQ ID NO: 28 ингибирует сферообразующую способность (независимый от подложки рост) линии положительных по рецептору эстрогена рака молочной железы клеток MCF-7 и линии клеток рака молочной железы с тройным негативным фенотипом MDA-MB-231.C) The CCN5(dIII)-Fcv2 fusion protein of SEQ ID NO: 28 was shown to inhibit the sphere-forming ability (substrate-independent growth) of the estrogen receptor-positive breast cancer cell line MCF-7 and the triple-negative breast cancer cell line MDA-MB-231.
D) показано, что слитый белок CCN5(dIII)-Fcv2 из SEQ ID NO: 28 дозозависимо ингибирует индуцированную ТФР-β SMAD репортерную активность (белки SMAD представляют собой канонические регулируемые ТФР-β транскрипционные факторы).D) The CCN5(dIII)-Fcv2 fusion protein of SEQ ID NO: 28 was shown to dose-dependently inhibit TGF-β-induced SMAD reporter activity (SMAD proteins are canonical TGF-β-regulated transcription factors).
Все планки погрешностей отражают SD. Статистическая значимость вычислена с использованием однофакторного дисперсионного анализа ANOVA с апостериорным тестом Даннета (р<0,05 отмечено символом *).All error bars represent SD. Statistical significance was calculated using one-way ANOVA with Dunnett's post hoc test (p<0.05 marked with *).
На Фиг. 2 показан эффект разных вариантов шарнирной области Fc-фрагмента на чувствительность к протеазе вариантов реализации настоящего изобретения, где CCN5(dIII) слит с Fc-фрагментом IgG, когда тестируемый слитый белок содержит последовательность, представленную в SEQ ID NO: 28; SEQ ID NO: 29 и SEQ ID NO: 30, соответственно, см. Пример 6 ниже.Fig. 2 shows the effect of different Fc hinge region variants on the protease sensitivity of embodiments of the present invention wherein CCN5(dIII) is fused to an IgG Fc region, wherein the fusion protein tested comprises the sequence shown in SEQ ID NO: 28; SEQ ID NO: 29 and SEQ ID NO: 30, respectively, see Example 6 below.
На Фиг. 3 показана склонность к агрегации варианта реализации настоящего изобретения в зависимости от структуры пептидного линкера, соединяющего CCN5(dIII) с Fc-фрагментом IgG, когда тестируемый слитый белок содержит последовательность, представленную в SEQ ID NO: 30 и SEQ ID NO: 31.Fig. 3 shows the aggregation propensity of an embodiment of the present invention depending on the structure of the peptide linker connecting CCN5(dIII) to the Fc region of IgG, when the test fusion protein comprises the sequence presented in SEQ ID NO: 30 and SEQ ID NO: 31.
На Фиг. 4 показан слитый белок в соответствии с настоящим изобретением, содержащий домен гомологии к повторам TSP-1, который соединен на С-конце с пептидным линкером, и соединен посредством Fc-шарнира с Fc-фрагментом.Fig. 4 shows a fusion protein according to the present invention comprising a TSP-1 repeat homology domain that is linked at the C-terminus to a peptide linker and linked via an Fc hinge to an Fc fragment.
На Фиг. 5 показана сниженная чувствительность к расщеплению эндопептидазой в том случае, когда вариант реализации настоящего изобретения содержит мутацию пролин-195 домена гомологии к повторам TSP-1 CCN5, представленного в SEQ ID NO: 7 (Fc-HLn8-CCN5(dIII)-P195A, SEQ ID NO: 41), относительно варианта P195 дикого типа домена гомологии к повторам TSP-1 CCN5 (Fc-HLn8-CCN5(dIII), SEQ ID NO: 40).Fig. 5 shows reduced sensitivity to endopeptidase cleavage when an embodiment of the present invention comprises a proline-195 mutation of the TSP-1 CCN5 repeat homology domain shown in SEQ ID NO: 7 (Fc-HLn8-CCN5(dIII)-P195A, SEQ ID NO: 41) relative to the wild-type P195 variant of the TSP-1 CCN5 repeat homology domain (Fc-HLn8-CCN5(dIII), SEQ ID NO: 40).
На Фиг. 6 показано получение белка, соответствующего SEQ ID NO: 58, очищенного путем хроматографии с захватом на белке А. Видно, что в отсутствие восстанавливающего агента бета-меркаптоэтанола присутствует димер ((-) дорожка). Однако в присутствии бета-меркаптоэтанола ((+) дорожка), как можно видеть, первичный продукт представляет собой фрагмент после расщепления, состоящий только из Fc-фрагмента, а не интактный слитый белок, содержащий все части, кодируемые SEQ ID NO: 58 (домен гомологии с TSP-1 фрагмент, пептидный линкер и Fc-фрагмент).Fig. 6 shows the preparation of the protein corresponding to SEQ ID NO: 58 purified by protein A capture chromatography. It can be seen that in the absence of the reducing agent beta-mercaptoethanol, a dimer is present ((-) lane). However, in the presence of beta-mercaptoethanol ((+) lane), it can be seen that the primary product is a fragment after cleavage consisting of only the Fc fragment, and not an intact fusion protein containing all parts encoded by SEQ ID NO: 58 (the TSP-1 homology domain fragment, the peptide linker and the Fc fragment).
На Фиг. 7 показано получение белка, соответствующего SEQ ID NO: 27, имеющего усеченную C-концевую часть, очищенного путем хроматографии с захватом на белке А. Видно, что указанный белок значимо более устойчив к разложению протеазой, чем белок, соответствующий SEQ ID NO: 58, который включает C-концевую часть.Fig. 7 shows the preparation of the protein corresponding to SEQ ID NO: 27, having a truncated C-terminal portion, purified by protein A capture chromatography. It is seen that said protein is significantly more resistant to protease degradation than the protein corresponding to SEQ ID NO: 58, which includes the C-terminal portion.
На Фиг. 8 показано получение белка, соответствующего SEQ ID NO: 73, аналогичного белку, соответствующему SEQ ID NO: 27, очищенного путем хроматографии с захватом на белке А. В этом случае также, как можно видеть, в присутствии бета-меркаптоэтанола ((+) дорожка) указанный белок более устойчив к разложению протеазой, чем белок, соответствующий SEQ ID NO: 58.Fig. 8 shows the production of the protein corresponding to SEQ ID NO: 73, similar to the protein corresponding to SEQ ID NO: 27, purified by protein A capture chromatography. In this case, too, it can be seen that in the presence of beta-mercaptoethanol ((+) lane), said protein is more resistant to protease degradation than the protein corresponding to SEQ ID NO: 58.
На Фиг. 9 представлены результаты анализа для измерения уровней фосфо-AKT (Ser-473) в клетках рака легкого А549 после введения варьирующих концентраций белка, соответствующего SEQ ID NO: 41, продуцируемого в стабильно трансфицированных клетках. Видно, что указанный белок не демонстрирует ингибирования фосфорилирования AKT.Fig. 9 shows the results of an assay for measuring phospho-AKT (Ser-473) levels in A549 lung cancer cells following administration of varying concentrations of the protein corresponding to SEQ ID NO: 41 produced in stably transfected cells. It is seen that this protein does not show inhibition of AKT phosphorylation.
На Фиг. 10 представлены результаты анализа для измерения уровней фосфо-AKT (Ser-473) в клетках рака легкого А549 после введения варьирующих концентраций белка, соответствующего SEQ ID NO: 80, продуцируемого в стабильно трансфицированных клетках. Видно, что указанный белок не демонстрирует значимого ингибирования фосфорилирования AKT и, фактически, даже может приводить к повышению уровня фосфо-AKT при более высокой концентрации.Fig. 10 shows the results of an assay for measuring phospho-AKT (Ser-473) levels in A549 lung cancer cells following administration of varying concentrations of the protein corresponding to SEQ ID NO: 80 produced in stably transfected cells. It is seen that said protein does not show significant inhibition of AKT phosphorylation and, in fact, may even lead to an increase in phospho-AKT levels at higher concentrations.
На Фиг. 11 представлены результаты анализа для измерения уровней фосфо-AKT (Ser-473) в клетках рака легкого А549 после введения варьирующих концентраций белка, соответствующего SEQ ID NO: 80, продуцируемого в транзиентно трансфицированных клетках. Можно видеть, что при продуцировании в транзиентно трансфицированных клетках указанный белок характеризуется зависимой от концентрации ингибиторной активностью в отношении фосфорилирования AKT.Fig. 11 shows the results of an assay for measuring phospho-AKT (Ser-473) levels in A549 lung cancer cells after administration of varying concentrations of the protein corresponding to SEQ ID NO: 80 produced in transiently transfected cells. It can be seen that when produced in transiently transfected cells, said protein is characterized by a concentration-dependent inhibitory activity with respect to AKT phosphorylation.
На Фиг. 12 представлены результаты анализа для измерения уровней фосфо-AKT (Ser-473) в клетках рака легкого А549 после введения варьирующих концентраций белков, соответствующих SEQ ID NO: 84, 94 и 106. Видно, что каждый из указанных белков характеризуется зависимой от концентрации ингибиторной активностью в отношении фосфорилирования AKT.Fig. 12 shows the results of an assay for measuring phospho-AKT (Ser-473) levels in A549 lung cancer cells after administration of varying concentrations of proteins corresponding to SEQ ID NOs: 84, 94, and 106. It is evident that each of these proteins is characterized by a concentration-dependent inhibitory activity on AKT phosphorylation.
На Фиг. 13 представлены результаты анализа для измерения уровней фосфо-AKT (Ser-473) в клетках рака легкого А549 после введения варьирующих концентраций белка, соответствующего SEQ ID NO: 88. Видно, что указанный белок способен ингибировать фосфорилирование АКТ в концентрациях выше 10 мкг/мл.Fig. 13 shows the results of an assay for measuring phospho-AKT (Ser-473) levels in A549 lung cancer cells after administration of varying concentrations of the protein corresponding to SEQ ID NO: 88. It is evident that this protein is capable of inhibiting AKT phosphorylation at concentrations above 10 μg/ml.
На Фиг. 14 представлены результаты анализа для измерения уровней фосфо-AKT (Ser-473) в клетках рака легкого А549 после введения варьирующих концентраций белков, соответствующих SEQ ID NO: 102 и 97. Видно, что оба белка характеризуются зависимой от концентрации ингибиторной активностью в отношении фосфорилирования AKT.Fig. 14 shows the results of an assay for measuring phospho-AKT (Ser-473) levels in A549 lung cancer cells after administration of varying concentrations of proteins corresponding to SEQ ID NOs: 102 and 97. It is evident that both proteins are characterized by a concentration-dependent inhibitory activity on AKT phosphorylation.
На Фиг. 15 представлены результаты анализа для измерения уровней фосфо-AKT в клетках рака легкого А549 после введения варьирующих концентраций белка, соответствующего SEQ ID NO: 110. Видно, что указанный белок характеризуется зависимой от концентрации ингибиторной активностью в отношении фосфорилирования AKT.Fig. 15 shows the results of an assay for measuring phospho-AKT levels in A549 lung cancer cells after administration of varying concentrations of the protein corresponding to SEQ ID NO: 110. It is seen that the protein has a concentration-dependent inhibitory activity against AKT phosphorylation.
На Фиг. 16 представлены результаты ряда экспериментов, включающих белок, соответствующий SEQ ID NO: 106.Fig. 16 shows the results of a series of experiments involving the protein corresponding to SEQ ID NO: 106.
A) показывает, что указанный белок ингибирует миграцию фибробластов легких человека, индуцированную как ТФР-бета, так и CCN2.A) shows that the protein inhibits human lung fibroblast migration induced by both TGF-beta and CCN2.
B) показывает, что указанный белок ингибирует зарастание царапины, индуцированное как ТФР-бета, так и CCN2.B) shows that the protein inhibits scratch closure induced by both TGF-beta and CCN2.
C) показывает, что указанный белок обеспечивает частичное ингибирование индукции ТФР-бета экспрессии гена COL1A1, который, как известно, является профибротическим.C) shows that the protein in question provides partial inhibition of TGF-beta induction of COL1A1 gene expression, which is known to be profibrotic.
D) показывает, что указанный белок обеспечивает частичное ингибирование индукции ТФР-бета экспрессии гена FN1, который, как известно, является профибротическим.D) shows that the protein in question provides partial inhibition of TGF-beta induction of FN1 gene expression, which is known to be profibrotic.
E) показывает, что указанный белок обеспечивает частичное ингибирование индукции ТФР-бета экспрессии гена АСТА2, который, как известно, является профибротическим.E) shows that the protein in question provides partial inhibition of TGF-beta induction of ACTA2 gene expression, which is known to be profibrotic.
F) показывает, что указанный белок обеспечивает частичное ингибирование индукции ТФР-бета экспрессии гена CCN2, который, как известно, является профибротическим.F) shows that the protein in question provides partial inhibition of TGF-beta induction of CCN2 gene expression, which is known to be profibrotic.
ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯDETAILED DESCRIPTION OF THE INVENTION
Настоящее изобретение, как уже упоминалось, основано на неожиданном открытии того, что домен гомологии к повторам тромбоспондина типа 1 (TSP-1) CCN5 представляет собой полностью активную структуру, обеспечивающую функции клеточной сигнализации CCN5/WISP2. На основании указанных новых данных относительно активности домена гомологии к повторам TSP-1 CCN5 авторы настоящего изобретения предлагают белки, рекомбинантные белки и слитые белки в соответствии с настоящим изобретением, которые могут быть использованы для ингибирования или противодействия клеточной сигнализации и физиологическим функциям клетки, приписываемым четырехдоменным белкам CCN, т.е. CCN1, CCN2, CCN3, CCN4 и CCN6. Указанные новые данные, как считается, предположительно, критически важны для обеспечения формирования стабильной, гомогенной лекарствоподобной молекулы на основе CCN5, поскольку ранее не было установлено, какая часть полноразмерного CCN5 необходима для воспроизведения активности CCN5, и поскольку полноразмерные молекулы CCN очень восприимчивы к протеолизу и их трудно получить в активном гомогенном виде. Кроме того, эти данные, подразумевающие, что конкретная часть CCN5 может быть достаточной для воспроизводства активности, наблюдаемой, например, при транзиентной сверхэкспрессии полноразмерного белка, также противоречат преобладающему в данной области мнению, что белки CCN функционируют как матриклеточные белки. Преобладающее мнение о механизме действия белков CCN и матриклеточных белков в целом заключается в том, что разные сегменты белков CCN взаимодействует с различными другими белками ВКМ и рецепторами клеточной поверхности, таким образом, модулируя их активность, а не работают как прямые модуляторы клеточной сигнализации. Новая информация об активности домена гомологии к повторам TSP-1 CCN5, а также информация о структурной близости с другими представителями семейства белков CCN предполагает, что и домены гомологии к повторам TSP-1 других белков семейства CCN могут также быть использованы для ингибирования функций клеточной сигнализации четырехдоменных белков семейства CCN. Согласно одному аспекту рекомбинантные белки и слитые белки согласно настоящему изобретению ингибируют фосфорилирование АКТ (Ser473) в клетках А549.The present invention, as already mentioned, is based on the unexpected discovery that the thrombospondin type 1 repeat homology (TSP-1) domain of CCN5 is a fully active structure that mediates the CCN5/WISP2 cell signaling functions. Based on these new findings regarding the activity of the TSP-1 repeat homology domain of CCN5, the present inventors provide proteins, recombinant proteins and fusion proteins according to the present invention that can be used to inhibit or counteract the cell signaling and physiological functions of the cell attributed to the four-domain CCN proteins, i.e., CCN1, CCN2, CCN3, CCN4 and CCN6. These new data are believed to be critical to the development of a stable, homogeneous CCN5-based drug-like molecule, since it has not been previously established what portion of full-length CCN5 is required to reproduce CCN5 activity, and since full-length CCN molecules are highly susceptible to proteolysis and difficult to obtain in an active, homogeneous form. Furthermore, these data, by implying that a specific portion of CCN5 may be sufficient to reproduce the activity observed, for example, upon transient overexpression of the full-length protein, also contradict the prevailing view in the field that CCN proteins function as matricellular proteins. The prevailing view of the mechanism of action of CCN proteins, and matricellular proteins in general, is that different segments of CCN proteins interact with various other ECM proteins and cell surface receptors, thereby modulating their activity, rather than acting as direct modulators of cell signaling. New information on the activity of the TSP-1 repeat homology domain of CCN5, as well as information on the structural similarity to other members of the CCN protein family, suggests that the TSP-1 repeat homology domains of other CCN family proteins may also be used to inhibit the cell signaling functions of four-domain CCN family proteins. In one aspect, the recombinant proteins and fusion proteins of the present invention inhibit phosphorylation of AKT (Ser473) in A549 cells.
Ингибирование указанной клеточной сигнализации имеет значение при лечении различных расстройств. CCN2, например, вовлечен в ряд заболеваний, в частности, заболеваний, при которых усиленный фиброгенез и тканевой фиброз представляют собой характерный патофизиологический признак.Inhibition of this cellular signaling has implications for the treatment of various disorders. CCN2, for example, has been implicated in a number of diseases, particularly those in which increased fibrogenesis and tissue fibrosis are a characteristic pathophysiological feature.
Например, было показано, что избыточная экспрессия CCN2 сама по себе достаточна для индуцирования фиброза в легком (см. Sonnylal et el., Arthritis Rheum 62, 1523-1532 (2010)). Также было обнаружено, что CCN2 необходим для индуцированного блеомицином фиброза легких (Bonniaud, P. et al. Am J Respir Cell Mol Biol 31, 510-516 (2004)), радиационно-индуцированного фиброза легких (Bickelhaupt, S. et al. J Natl Cancer Inst 109 (2017) и фиброза легких в результате утраты экспрессии PTEN (гомолога фосфатазы и тензина) (Parapuram, S.K. et al. Matrix Biol 43, 35-41 (2015)). Кроме того, было обнаружено, что в отсутствие других стимулирующих агентов CCN2 индуцирует фиброз легких при экспрессии и секреции легочными клетками Клара (Wu, S. et al. Am J Respir Cell Mol Biol 42, 552-563 (2010)), альвеолярными эпителиальными клетками II типа (Chen, S. et al. Am J Physiol Lung Cell Mol Physiol 300, L330-340), при экспрессии со специфичного для фибробластов промотора (Sonnylal et al (2010), выше, Sonnylal, S. et al., J Cell Sci 126, 2164-2175 (2013)) или доставке аденовирусом (Bonniaud, P. et al., Am J Respir Crit Care Med 168, 770-778 (2003)). Соответственно, все имеющиеся сообщения подтверждают вывод о том, что CCN2 не только достаточен для стимуляции фиброза в коже или легком, однако также необходим для полного фиброзного фенотипа в нескольких моделях заболеваний. Фиброз легких представляет собой признак заболевания человека идиопатического фиброза легких (ИФЛ), однако это также возникает при хронической обструктивной болезни легких (ХОБЛ) (Jang, J.H. et al., COPD 14, 228-237 (2017)) и системном склерозе. На самом деле фиброз легких регистрируется как первичная причина смерти до 40% пациентов с системным склерозом (Tyndall AJ et al., Ann Rheum Dis. 2010 Oct; 69(10):1809-15). Показано, что CCN2 и другие белки CCN, такие как WISP1, также вовлечены в патофизиологию ИФЛ (Konigshoff, М. et al., J Clin Invest 119, 772-787 (2009) и ХОБЛ (Jang et al, выше) у пациентов-людей.For example, overexpression of CCN2 by itself has been shown to be sufficient to induce fibrosis in the lung (see Sonnylal et al., Arthritis Rheum 62, 1523–1532 (2010)). CCN2 has also been found to be required for bleomycin-induced pulmonary fibrosis (Bonniaud, P. et al. Am J Respir Cell Mol Biol 31, 510-516 (2004)), radiation-induced pulmonary fibrosis (Bickelhaupt, S. et al. J Natl Cancer Inst 109 (2017)), and pulmonary fibrosis resulting from loss of PTEN (phosphatase and tensin homolog) expression (Parapuram, S. K. et al. Matrix Biol 43, 35-41 (2015)). Furthermore, in the absence of other stimulatory agents, CCN2 has been found to induce pulmonary fibrosis when expressed and secreted by pulmonary Clara cells (Wu, S. et al. Am J Respir Cell Mol Biol 42, 552-563 (2010)), alveolar epithelial cells type II (Chen, S. et al. Am J Physiol Lung Cell Mol Physiol 300, L330-340), when expressed from a fibroblast-specific promoter (Sonnylal et al (2010), supra, Sonnylal, S. et al., J Cell Sci 126, 2164-2175 (2013)) or delivered by adenovirus (Bonniaud, P. et al., Am J Respir Crit Care Med 168, 770-778 (2003)). Accordingly, all available reports support the conclusion that CCN2 is not only sufficient to promote fibrosis in skin or lung, but is also required for the full fibrotic phenotype in several disease models. Pulmonary fibrosis is a hallmark of the human disease idiopathic pulmonary fibrosis (IPF), but it also occurs in chronic obstructive pulmonary disease (COPD) (Jang, J.H. et al., COPD 14, 228-237 (2017)) and systemic sclerosis. In fact, pulmonary fibrosis has been reported as a primary cause of death in up to 40% of patients with systemic sclerosis (Tyndall AJ et al., Ann Rheum Dis. 2010 Oct; 69(10):1809-15). CCN2 and other CCN proteins such as WISP1 have also been shown to be involved in the pathophysiology of IPF (Konigshoff, M. et al., J Clin Invest 119, 772-787 (2009)) and COPD (Jang et al, supra) in human patients.
Другой пример представлен неопластическими расстройствами. Например, в условиях рака молочной железы CCN2, как было показано, вносит вклад в метастазирование в кости в модели рака молочной железы с тройным негативным фенотипом (MDA-MB-231) (Kang, Y. et al., Cancer Cell 3, 537-549 (2003)). Кроме того, нокдаун CCN2 в клетках рака молочной железы с тройным негативным фенотипом (MDA-MB-231), линии клеток, которая экспрессирует высокие уровни CCN2 (Chen, P.S. et al., J Cell Sci 120, 2053-2065 (2007)), снижал способность указанных клеток к миграции, тогда как избыточная экспрессия CCN2 в положительных по рецепторам гормона клетках линии рака молочной железы MCF-7, при низкой эндогенной экспрессии CCN2 (Chen et al., выше), повышала способность последних к миграции (Chen et al., выше, Chien, W. et al., Int J Oncol 38, 1741-1747 (2011)). В более позднем отчете также было описано, что избыточная экспрессия CCN2 в клетках MCF-7 увеличивает хеморезистентность, тогда как нокдаун CCN2 в клетках MDA-MB-231 снижает хеморезистентность (Wang, M.Y. et al., Cancer Res 69, 3482-3491 (2009)). Сообщалось также об увеличении хеморезистентности, вызываемой CCN2, других клеток рака молочной железы (Lai, D et al., Cancer Res 71, 2728-2738 (2011)). Кроме того, с помощью исследований сверхэкспрессии или нокдауна было также показано, что CCN2 вносит вклад в эпителиально-мезенхимальный переход (ЕМТ) и увеличивает способность к независимому от подложки росту (образованию маммосфер) клеток рака молочной железы (Chen et al., выше, Zhu, X. et al., Oncotarget 6, 25320-25338 (2015)). Обнаружение как повышенной хеморезистентности, так и усиления ЕМТ, индуцируемых CCN2, согласуется со связью, установленной между ЕМТ и хеморезистентностью и при других типах рака (Fischer, K.R. et al., Nature 527, 472-476 (2015), Zheng, X. et al., Nature 527, 525-530 (2015)).Another example is provided by neoplastic disorders. For example, in the setting of breast cancer, CCN2 has been shown to contribute to bone metastasis in a triple-negative breast cancer model (MDA-MB-231) (Kang, Y. et al., Cancer Cell 3, 537-549 (2003)). Furthermore, knockdown of CCN2 in triple-negative breast cancer cells (MDA-MB-231), a cell line that expresses high levels of CCN2 (Chen, P.S. et al., J Cell Sci 120, 2053–2065 (2007)), reduced the migratory capacity of these cells, whereas overexpression of CCN2 in hormone receptor-positive breast cancer cells MCF-7, a cell line with low endogenous CCN2 expression (Chen et al., supra), increased the migratory capacity of the latter (Chen et al., supra, Chien, W. et al., Int J Oncol 38, 1741–1747 (2011)). A later report also described that CCN2 overexpression in MCF-7 cells increased chemoresistance, whereas CCN2 knockdown in MDA-MB-231 cells decreased chemoresistance (Wang, M.Y. et al., Cancer Res 69, 3482-3491 (2009)). Increased CCN2-induced chemoresistance has also been reported in other breast cancer cells (Lai, D et al., Cancer Res 71, 2728-2738 (2011)). Furthermore, CCN2 has also been shown to contribute to epithelial-mesenchymal transition (EMT) and enhance the substrate-independent growth capacity (mammosphere formation) of breast cancer cells using overexpression or knockdown studies (Chen et al., supra, Zhu, X. et al., Oncotarget 6, 25320–25338 (2015)). The finding of both increased chemoresistance and increased EMT induced by CCN2 is consistent with the association established between EMT and chemoresistance in other cancer types as well (Fischer, K.R. et al., Nature 527, 472–476 (2015), Zheng, X. et al., Nature 527, 525–530 (2015)).
Согласно конкретному аспекту настоящего изобретения предложен мономерный слитый белок согласно определению выше, содержащий полипептид, соответствующий по меньшей мере части домена гомологии к повторам тромбоспондина типа 1 (TSP-1) белка семейства CCN, причем последовательность указанного домен гомологии с TSP-1 может быть усечена и/или модифицирована, однако при этом остатки цистеина указанного домена сохранены. Указанный полипептид для удобства может быть назван в настоящей заявке «полипептидом TSP-1», и указанный термин, соответственно, следует понимать как не обуславливающий или не подразумевающий каких-либо ограничений до исключительно конкретной природной последовательности домена гомологии с TSP-1. Термин «полипептид TSP-1» может использоваться как синоним или взаимозаменяемо с «белком домена TSP-1» или «последовательностью домена TSP-1».According to a particular aspect of the present invention, there is provided a monomeric fusion protein as defined above, comprising a polypeptide corresponding to at least a portion of the thrombospondin type 1 repeat homology domain (TSP-1) of a CCN family protein, wherein the sequence of said TSP-1 homology domain may be truncated and/or modified, however, the cysteine residues of said domain are retained. Said polypeptide may be referred to herein for convenience as a "TSP-1 polypeptide", and said term should accordingly be understood as not stipulating or implying any limitation to only a particular natural sequence of the TSP-1 homology domain. The term "TSP-1 polypeptide" may be used synonymously or interchangeably with "TSP-1 domain protein" or "TSP-1 domain sequence".
Как продемонстрировано в приведенных ниже примерах, неожиданным образом было обнаружено, что мономерные партнеры для слияния предпочтительнее для получения активных и стабильных белков по сравнению с димерными партнерами для слияния, такими как Fc-фрагменты, происходящие из IgG-белков, которые формируют димерные слитые белки. Мономерные слитые белки сохраняют активность полипептида домена TSP-1, который они содержат. Кроме того, указанные белки стабильны, в том числе применительно к протеолитическому разложению. Как подробнее описано ниже, устойчивость к протеолитическому разложению может быть повышена путем введения модификаций в последовательность аминокислот полипептида TSP-1, в том числе, в частности, замены Ala, упомянутой выше.As demonstrated in the examples below, it has been surprisingly found that monomeric fusion partners are preferred for producing active and stable proteins compared to dimeric fusion partners, such as Fc fragments derived from IgG proteins, which form dimeric fusion proteins. The monomeric fusion proteins retain the activity of the TSP-1 domain polypeptide that they contain. In addition, these proteins are stable, including with respect to proteolytic degradation. As described in more detail below, resistance to proteolytic degradation can be improved by introducing modifications to the amino acid sequence of the TSP-1 polypeptide, including, in particular, the Ala substitution mentioned above.
Соответственно, полипептид компонента (i) слитого белка может содержать инсерции, делеции, замены, мутации или любую их комбинацию относительно указанной последовательности SEQ ID NO: 37 или 2-6, или последовательности, выбранной из SEQ ID NO: 1 или 8 12, при условии, что полипептид сохраняет по меньшей мере 80% идентичности последовательностей указанной последовательности, и все остатки цистеина в указанной последовательности сохранены.Accordingly, the polypeptide of component (i) of the fusion protein may comprise insertions, deletions, substitutions, mutations, or any combination thereof relative to said sequence of SEQ ID NO: 37 or 2-6, or a sequence selected from SEQ ID NO: 1 or 8-12, provided that the polypeptide retains at least 80% sequence identity of said sequence and all cysteine residues in said sequence are retained.
Согласно другому аспекту настоящего изобретения предложен белок (например, рекомбинантный белок), который состоит из полипептида или содержит полипептид, соответствующий по меньшей мере части домена гомологии к повторам тромбоспондина типа 1 (TSP-1) белка семейства CCN, но не в контексте слитого белка, где последовательность домена TSP-1 может быть усечена и/или модифицирована и содержит замену Ala в положении, соответствующем положению 2 SEQ ID NO: 37 или 2-6, или SEQ ID NO: 1 или 8-12, однако при этом остатки цистеина указанного домена сохранены. Иными словами, белок домена TSP-1 может быть предоставлен без другого компонента, такого как партнер для слияния, или независимо от него. Соответственно, белок домена TSP-1 не сливают или не соединяют с другим белковым доменом или компонентом, или другой функциональной или структурной последовательностью белка. Для удобства такие белки могут называться «белками с заменой на Ala».According to another aspect of the present invention, there is provided a protein (e.g., a recombinant protein) that consists of or comprises a polypeptide corresponding to at least a portion of the thrombospondin type 1 repeat homology domain (TSP-1) of a CCN family protein, but not in the context of a fusion protein, wherein the TSP-1 domain sequence may be truncated and/or modified and comprises an Ala substitution at a position corresponding to position 2 of SEQ ID NO: 37 or 2-6, or SEQ ID NO: 1 or 8-12, but wherein the cysteine residues of said domain are retained. In other words, the TSP-1 domain protein may be provided without or independently of another component, such as a fusion partner. Accordingly, the TSP-1 domain protein is not fused or linked to another protein domain or component, or another functional or structural protein sequence. For convenience, such proteins may be referred to as "Ala-substitution proteins."
В настоящей заявке термин «консервативный» означает, что остаток в определенной последовательности не делетирован или не заменен. Иными словами, термин «консервативный» используется как синоним (и взаимозаменяемо) с термином «сохраненный». Он просто означает, что остатки цистеина не удалены из последовательности. Соответственно, в описанном выше контексте это означает, что остатки цистеина в последовательности, выбранной из SEQ ID NO: 37 или 2-6 или 1 или 8-12, не делетированы и не удалены. Отметим, что инсерция дополнительных остатков между консервативными остатками (например, между консервативными остатками цистеина) или делеция неконсервативных остатков (например, остатков, не являющихся цистеином) может изменять положение консервативных остатков в последовательности полипептида относительно их положения в исходной референсной последовательности (например, последовательности, выбранной из SEQ ID NO: 37 или 2-6). Однако такие остатки все же считают «консервативными» согласно определению в настоящей заявке. Соответственно, термин «консервативный» не подразумевает какого-либо сужения или ограничения положения (или, более конкретно, номера положения) остатков цистеина.In the present application, the term "conserved" means that a residue in a certain sequence is not deleted or substituted. In other words, the term "conserved" is used synonymously (and interchangeably) with the term "conserved". It simply means that cysteine residues are not deleted from the sequence. Accordingly, in the above-described context, it means that cysteine residues in a sequence selected from SEQ ID NO: 37 or 2-6 or 1 or 8-12 are not deleted or removed. It is noted that the insertion of additional residues between conserved residues (e.g., between conserved cysteine residues) or the deletion of non-conserved residues (e.g., residues other than cysteine) may change the position of the conserved residues in the polypeptide sequence relative to their position in the original reference sequence (e.g., a sequence selected from SEQ ID NO: 37 or 2-6). However, such residues are still considered "conserved" as defined in this application. Accordingly, the term "conserved" does not imply any narrowing or limitation of the position (or, more specifically, the position number) of the cysteine residues.
Согласно некоторым вариантам реализации полипептид по (i) содержит или состоит из:According to some embodiments, the polypeptide of (i) comprises or consists of:
(а) последовательности аминокислот, выбранной из SEQ ID NO: 1 или 8-12; или(a) an amino acid sequence selected from SEQ ID NO: 1 or 8-12; or
b) последовательности аминокислот, по меньшей мере на 80% идентичной последовательности, выбранной из SEQ ID NO: 1 или 8-12; илиb) an amino acid sequence at least 80% identical to a sequence selected from SEQ ID NO: 1 or 8-12; or
c) части последовательности аминокислот по (а) или (b), отличающейся тем, что указанная часть содержит по меньшей мере последовательность из 44 аминокислот из SEQ ID NO: 37, 6, 2, 3, 4 или 5, соответственно, или последовательность, по меньшей мере на 80% идентичную последовательности, выбранной из SEQ ID NO: 37, 6, 2, 3, 4 или 5, соответственно.c) a part of the amino acid sequence according to (a) or (b), characterized in that said part comprises at least a sequence of 44 amino acids from SEQ ID NO: 37, 6, 2, 3, 4 or 5, respectively, or a sequence that is at least 80% identical to a sequence selected from SEQ ID NO: 37, 6, 2, 3, 4 or 5, respectively.
Как отмечалось выше, мономерный партнер для слияния по (ii) и пептидный линкер по (iii) не представляют собой домен или не содержат домена гомологии со связывающим IGF белком, домена гомологии с повторами фактора фон Виллебранда типа С или домена цистинового узла белка семейства CCN. Иными словами, единственный домен белка семейства CCN, который может присутствовать в слитом белке согласно настоящему изобретению, представляет собой домен гомологии с TSP-1.As noted above, the monomeric fusion partner of (ii) and the peptide linker of (iii) do not constitute or comprise an IGF binding protein homology domain, a von Willebrand factor type C repeat homology domain, or a CCN family protein cystine knot domain. In other words, the only CCN family protein domain that may be present in the fusion protein of the present invention is the TSP-1 homology domain.
Сходным и аналогичным образом, в контексте белков с заменой на Ala, которые не являются слитыми белками, указанный белок не содержит каких-либо других доменов CCN (помимо белка домена TSP-1).Similarly and analogously, in the context of Ala-substituted proteins that are not fusion proteins, the protein does not contain any other CCN domains (other than the TSP-1 domain protein).
Согласно некоторым вариантам реализации полипептид по (i) или белок с заменой на Ala, может содержать только часть домена гомологии с TSP-1 согласно определению выше. Авторы настоящего изобретения обнаружили, что минимальный требуемый фрагмент домена TSP-1 представлен последовательностью из 44 аминокислот из SEQ ID NO: 37, 6, 2, 3, 4 или 5. Соответственно, согласно некоторым вариантам реализации длина полипептида по (i) составляет по меньшей мере 44 аминокислот. Согласно некоторым вариантам реализации полипептид по (i) имеет длину от 44 до 57 аминокислот. Однако, как отмечалось выше, в минимальном фрагменте из 44 аминокислот может присутствовать одна или более делеций аминокислот, которые расположены между остатками цистеина. Соответственно, согласно некоторым вариантам реализации длина полипептида TSP-1 может составлять менее 44 остатков, т.е. 40-43 остатка.In some embodiments, the polypeptide of (i) or the Ala substitution protein may comprise only a portion of the TSP-1 homology domain as defined above. The present inventors have found that the minimal required fragment of the TSP-1 domain is represented by the 44 amino acid sequence of SEQ ID NO: 37, 6, 2, 3, 4 or 5. Accordingly, in some embodiments, the polypeptide of (i) is at least 44 amino acids long. In some embodiments, the polypeptide of (i) is 44 to 57 amino acids long. However, as noted above, the minimal fragment of 44 amino acids may include one or more amino acid deletions that are located between cysteine residues. Accordingly, in some embodiments, the TSP-1 polypeptide may be less than 44 residues long, i.e., 40 to 43 residues.
Согласно некоторым вариантам реализации полипептид по (i) состоит из последовательности аминокислот, выбранной из SEQ ID NO: 37 или 2-6, или последовательность, по меньшей мере на 80% идентичную последовательности, выбранной из SEQ ID NO: 37 или 2-6.In some embodiments, the polypeptide of (i) consists of an amino acid sequence selected from SEQ ID NO: 37 or 2-6, or a sequence that is at least 80% identical to a sequence selected from SEQ ID NO: 37 or 2-6.
Согласно описанию выше, белки согласно настоящему изобретению, в том числе слитые белки, проявляют (или, другими словами, демонстрируют или имеют) активность CCN5, более конкретно - биологическую активность CCN5. Согласно варианту реализации указанные белки могут сохранять, или проявлять, или иметь активность домена гомологии с TSP-1 CCN5. Как вариант, указанные белки могут быть определены как проявляющие (или демонстрирующие, или имеющие) активность, в частности, биологическую активность выделенного домена гомологии с TSP-1 белка CCN. Сказанное выше может относиться к любой активности указанного домена, а также к конкретным видам активности, отражающим антифибротический эффект указанного домена гомологии с TSP-1. Такая активность может быть проанализирована (или протестирована, или детектирована) с применением любого удобного анализа или способа на основе любого конкретного биологического эффекта указанного домена.As described above, the proteins of the present invention, including fusion proteins, exhibit (or in other words, display or have) a CCN5 activity, more particularly a CCN5 biological activity. According to an embodiment, said proteins may retain, or display, or have the activity of a TSP-1 homology domain of CCN5. Alternatively, said proteins may be defined as exhibiting (or displaying, or having) an activity, in particular the biological activity of an isolated TSP-1 homology domain of a CCN protein. The above may refer to any activity of said domain, as well as to specific activities reflecting the anti-fibrotic effect of said TSP-1 homology domain. Such activity may be assayed (or tested, or detected) using any convenient assay or method based on any specific biological effect of said domain.
Отметим, что активность определенного белка может удобным образом быть оценена путем анализа эффекта белка на фосфорилирование AKT. В частности, определенный белок может быть проанализирован на способность ингибировать фосфорилирование AKT (Ser-473) в клетках рака легкого человека А549, согласно описанию в Примере 2. Специалисту будет понятно, что другие аналогичные анализы могут быть разработаны для оценки этой же активности или для оценки других родственных видов антифибротической активности.Note that the activity of a particular protein can conveniently be assessed by assaying the effect of the protein on AKT phosphorylation. In particular, a particular protein can be assayed for its ability to inhibit AKT (Ser-473) phosphorylation in A549 human lung cancer cells, as described in Example 2. It will be appreciated by those skilled in the art that other similar assays can be developed to assess this same activity or to assess other related antifibrotic activities.
Как отмечалось выше, согласно другим аспектам настоящего изобретения предложены рекомбинантные белки, которые ингибируют или противодействуют клеточной сигнализации и физиологическим функциям клетки, приписываемым четырехдоменным белкам CCN, содержащие последовательность аминокислот в соответствии с приведенной выше формулой I.As noted above, other aspects of the present invention provide recombinant proteins that inhibit or counteract cell signaling and cellular physiological functions attributed to four-domain CCN proteins comprising an amino acid sequence according to formula I above.
где А, В, С, D, Е и F соответствуют определению выше и в прилагаемой формуле изобретения.where A, B, C, D, E and F correspond to the definition above and in the attached claims.
Формула I представляет собой результат выравнивания домена гомологии к повторам TSP-1 структурно родственных белков семейства CCN (CCN 1 - CCN6), все из которых содержат 6 консервативных остатков цистеина, с учетом того, что аминокислоты могут быть заменены так, чтобы это не влияло на активность указанного белка (консервативные замены, как подробнее обсуждается ниже). Положение первого консервативного остатка цистеина домена гомологии к повторам TSP1 других белков CCN определяют как положение №1 рекомбинантного белка формулы I.Formula I is an alignment of the TSP-1 repeat homology domain of structurally related CCN family proteins (CCN 1 - CCN6), all of which contain 6 conserved cysteine residues, with the understanding that amino acids can be substituted without affecting the activity of the protein (conservative substitutions, as discussed in more detail below). The position of the first conserved cysteine residue of the TSP-1 repeat homology domain of the other CCN proteins is defined as position #1 of the recombinant protein of Formula I.
Пять сегментов между консервативными цистеинами обозначены как А, В, С, D и Е, соответственно.The five segments between the conserved cysteines are designated A, B, C, D, and E, respectively.
Первый сегмент А определяет формула где А1-А9 соответствует определению выше. Аминокислота в положении №7 (А7) сегмента А представляет собой триптофан (W) у всех представителей семейства белков CCN и считается консервативной.The first segment A is determined by the formula where A1-A9 correspond to the definition above. The amino acid at position 7 (A7) of segment A is tryptophan (W) in all members of the CCN protein family and is considered conserved.
Второй сегмент В определяет формула В1-В2-В3, где В1-В3 соответствует определению выше. В соответствии с одним вариантом реализации В1 и В3 представляет собой либо серии, либо треонин.The second segment B is defined by the formula B1-B2-B3, where B1-B3 corresponds to the definition above. According to one embodiment, B1 and B3 are either serine or threonine.
Третий сегмент С определяет формула где аминокислоты С1-С14 соответствуют определению выше. В соответствии с одним вариантом реализации аминокислоты С1 и С3 представляют собой глицин (G).The third segment C is determined by the formula wherein amino acids C1-C14 are as defined above. According to one embodiment, amino acids C1 and C3 are glycine (G).
Согласно другому варианту реализации С7 представляет собой аргинин (R), оба из С10 и С12 представляют собой аспарагин (N).According to another embodiment, C7 is arginine (R), both C10 and C12 are asparagine (N).
Четвертый сегмент D определяет формула где аминокислоты D1-D8 соответствуют определению выше. В соответствии с одним вариантом реализации D7 представляет собой аргинин (R).The fourth segment D is determined by the formula wherein amino acids D1-D8 are as defined above. According to one embodiment, D7 is arginine (R).
Пятый сегмент Е определяет формула где аминокислоты Е1-Е4 соответствуют определению выше. В соответствии с одним вариантом реализации настоящего изобретения Е4 представляет собой пролин.The fifth segment E is determined by the formula wherein amino acids E1-E4 are as defined above. According to one embodiment of the present invention, E4 is proline.
После последнего остатка цистеина расположен карбоксиконцевой пептидный сегмент вариабельной длины (F), содержащий от 0 до 13 аминокислот.Following the last cysteine residue is a carboxyl-terminal peptide segment of variable length (F), containing from 0 to 13 amino acids.
F может быть делетирован или укорочен по сравнению с последовательностями аминокислот домена гомологии к повторам TSP-1 семейства белков CCN. В соответствии с одним вариантом реализации F отсутствует. Согласно другому варианту реализации F состоит из пептида, выбранного из группы, состоящей из PPSRGRSPQNSAF, GQPVYSSL, EADLEEN, EQEPEQPTD, DVDIHTLI и DSNILKTIKIP. В соответствии с одним аспектом указанного варианта реализации рекомбинантные белки могут принимать форму последовательности аминокислот, представленную в SEQ ID NO: 8-12.F may be deleted or truncated relative to the amino acid sequences of the TSP-1 repeat homology domain of the CCN protein family. According to one embodiment, F is absent. According to another embodiment, F consists of a peptide selected from the group consisting of PPSRGRSPQNSAF, GQPVYSSL, EADLEEN, EQEPEQPTD, DVDIHTLI and DSNILKTIKIP. According to one aspect of this embodiment, the recombinant proteins may take the form of an amino acid sequence as set forth in SEQ ID NO: 8-12.
Согласно другому аспекту настоящего изобретения предложены рекомбинантные белки, содержащие последовательность аминокислот, выбранную из группы, состоящей из SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6 и SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 37, SEQ ID NO: 38; и их фрагментов или вариантов по меньшей мере с 50% идентичностью последовательностей последовательностям аминокислот SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6 и SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 37, SEQ ID NO: 38.According to another aspect of the present invention, there are provided recombinant proteins comprising an amino acid sequence selected from the group consisting of SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6 and SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 37, SEQ ID NO: 38; and fragments or variants thereof with at least 50% sequence identity to the amino acid sequences of SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6 and SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 37, SEQ ID NO: 38.
Согласно одному аспекту предложен рекомбинантный белок, состоящий из последовательности аминокислот, выбранной из группы, состоящей из SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, и SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 37, SEQ ID NO: 38; и их фрагментов или вариантов с более чем 50% идентичностью последовательностей последовательностям аминокислот SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, и SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 37, SEQ ID NO: 38.According to one aspect, a recombinant protein is provided, consisting of an amino acid sequence selected from the group consisting of SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, and SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 37, SEQ ID NO: 38; and fragments or variants thereof with more than 50% sequence identity to the amino acid sequences of SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, and SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 37, SEQ ID NO: 38.
«Рекомбинантные белки» в настоящей заявке представляют собой белки, кодируемые рекомбинантными нуклеиновыми кислотами. Они экспрессируются с рекомбинантных нуклеиновых кислот в клетке-хозяине как подробнее описано ниже."Recombinant proteins" in the present application are proteins encoded by recombinant nucleic acids. They are expressed from recombinant nucleic acids in a host cell as described in more detail below.
«Рекомбинантная нуклеиновая кислота» в настоящей заявке описывает молекулу нуклеиновой кислоты, которая, ввиду происхождения или в результате манипуляций, не связана с полным полинуклеотидом или с частью полинуклеотида, с которым связана в природе, и/или соединена не с тем полинуклеотидом, с которым соединена в природе, как подробнее описано ниже."Recombinant nucleic acid" as used herein describes a nucleic acid molecule that, by origin or manipulation, is not linked to all or part of a polynucleotide to which it is linked in nature and/or is linked to a different polynucleotide than to which it is linked in nature, as described in more detail below.
Специалисту будет понятно, что может быть введена модификация последовательности аминокислот рекомбинантных белков и слитых белков в соответствии с настоящим изобретением без изменения активности указанного белка. Аминокислоты обычно классифицируют как гидрофобные или гидрофильные и/или имеющие полярные или неполярные боковые цепи. Замены одной аминокислоты на другую, имеющую те же биохимические характеристики, общеизвестны как консервативные замены.It will be understood by the skilled person that modification of the amino acid sequence of the recombinant proteins and fusion proteins according to the present invention can be introduced without changing the activity of said protein. Amino acids are generally classified as hydrophobic or hydrophilic and/or having polar or non-polar side chains. Substitutions of one amino acid for another having the same biochemical characteristics are commonly known as conservative substitutions.
Консервативные замены аминокислот включают взаимные замены аминокислот внутри следующих групп:Conservative amino acid substitutions include mutual substitutions of amino acids within the following groups:
• MILV• MILV
• FYW• FYW
• KRH• KRH
• AG• AG
• ST• ST
• QN• QN
• ED• ED
Обычно «консервативная замена аминокислоты» относится к замене аминокислоты, которая не изменяет характеристик относительного заряда или размера белка, в котором осуществляют замену аминокислоты, и, соответственно, редко изменяет структуру белка, поэтому биологическая активность также значимо не изменяется.Generally, a "conservative amino acid substitution" refers to an amino acid substitution that does not change the relative charge or size characteristics of the protein in which the amino acid substitution is made, and thus rarely changes the protein structure, so that biological activity is also not significantly changed.
Специалисту будет понятно, что биологическая активность белка также может быть сохранена, если одна или несколько аминокислот делетированы, инсертированы или добавлены к последовательности аминокислот, при условии сохранения структурных и физико-химических свойств.It will be clear to the skilled person that the biological activity of a protein can also be retained if one or more amino acids are deleted, inserted or added to the amino acid sequence, provided that the structural and physicochemical properties are retained.
Символ «Δ» в настоящей заявке перед аминокислотой относится к делеции указанной аминокислоты, например, ΔК447 следует понимать как белок, в котором отсутствует К447. Также в настоящей заявке делецию конкретной аминокислоты, как вариант, обозначают символом «-», например, К447- также следует понимать как белок, в котором отсутствует К447.The symbol "Δ" in the present application before an amino acid refers to a deletion of the said amino acid, for example, ΔK447 should be understood as a protein in which K447 is missing. Also in the present application, a deletion of a specific amino acid is alternatively denoted by the symbol "-", for example, K447- should also be understood as a protein in which K447 is missing.
Соответственно, следует понимать, что настоящим изобретением охвачены рекомбинантные белки и слитые белки согласно описанию в прилагаемой формуле изобретения, в которые могут быть введены такие модификации согласно описанию выше (замены, делеции, инсерции и добавления аминокислот) по существу без изменения их биологической активности, т.е. способности ингибировать или противодействовать клеточной сигнализации и физиологическим функциям клетки, приписываемым четырехдоменным белкам семейства CCN; CCN1, CCN2, CCN3, CCN4 и CCN6.Accordingly, it is to be understood that the present invention encompasses recombinant proteins and fusion proteins as described in the appended claims, into which such modifications as described above (substitutions, deletions, insertions and additions of amino acids) can be introduced without substantially changing their biological activity, i.e. the ability to inhibit or counteract cellular signaling and physiological functions of the cell, attributed to the four-domain proteins of the CCN family; CCN1, CCN2, CCN3, CCN4 and CCN6.
В настоящем описании упоминаются последовательности аминокислот. В настоящем описании применительно к последовательностям аминокислот иногда упоминается модификация рассматриваемой последовательности аминокислот или белка со ссылкой на «нумерацию Uniprot» или Eu-нумерацию. Нумерация Uniprot относится к нумерации, используемой в базе данных Uniprot (Uniprot Consortium, Nucleic Acids Res. 2019 Jan 8;47(D1):D506-D515). Нумерацию Uniprot используют для нумерации аминокислот белков CCN. Eu-нумерация относится к нумерации антитела Eu (Edelman et al., 1969, Proc Natl Acad Sci USA 63:78-85), и ее используют в отношении аминокислот в Fc-фрагментах подклассов IgG человека с мутациями или без мутаций, или химерах, отличных от дикого типа. Система нумерации Ей доступна, например, в международной информационной системе iMMunoGeneTics (IMGT) ресурса IMGT Scientific chart. Система IMGT описана в источнике: Lefranc М-Р, Biomolecules. 2014 Dec; 4(4): 1102- 1139.Reference is made to amino acid sequences throughout the present specification. Reference is sometimes made to amino acid sequences in the present specification when referring to a modification of the amino acid sequence or protein in question by reference to "Uniprot numbering" or Eu numbering. Uniprot numbering refers to the numbering used in the Uniprot database (Uniprot Consortium, Nucleic Acids Res. 2019 Jan 8;47(D1):D506-D515). Uniprot numbering is used to number the amino acids of CCN proteins. Eu numbering refers to the numbering of the Eu antibody (Edelman et al., 1969, Proc Natl Acad Sci USA 63:78-85) and is used for amino acids in the Fc portions of human IgG subclasses, with or without mutations, or chimeras other than the wild type. The numbering system is available, for example, in the international information system iMMunoGeneTics (IMGT) of the IMGT Scientific chart resource. The IMGT system is described in the source: Lefranc M-R, Biomolecules. 2014 Dec; 4(4): 1102- 1139.
В контексте настоящего описания, когда речь идет об «идентичности последовательности», последовательность по меньшей мере с х% идентичностью второй последовательности означает, что х% соответствует числу аминокислот в первой последовательности, идентичных соответствующим им аминокислотам второй последовательности при проведении оптимального выравнивания последовательностей путем глобального выравнивания по всей длине второй последовательности аминокислот. Оптимальное выравнивание обеих последовательностей выполнено, если х максимален. Выравнивание и определение процента идентичности может проводиться вручную или автоматически.In the context of the present description, when speaking of "sequence identity", a sequence with at least x% identity to a second sequence means that x% corresponds to the number of amino acids in the first sequence that are identical to the corresponding amino acids of the second sequence when performing an optimal sequence alignment by global alignment over the entire length of the second amino acid sequence. An optimal alignment of both sequences is achieved if x is maximal. The alignment and determination of the percent identity can be performed manually or automatically.
Выравнивание с целью определения процента идентичности аминокислот может быть достигнуто различными путями в пределах компетенции специалиста в данной области техники, например, с использованием открытого компьютерного обеспечения, такого как ClustalOmega (Sievers F, Higgins DG (2018) Protein Sci 27:135-145), Protein BLAST (от Национального центра биотехнологической информации (NCBI), США) или коммерческого программного обеспечения, такого как программное обеспечение Megalign (DNASTAR). Специалисты в данной области техники могут определить подходящие показатели для измерения выравнивания, в том числе любые алгоритмы, необходимые для достижения максимального выравнивания на протяжении полной длины сравниваемых последовательностей. NCBI BLAST представляет собой другой пример программного обеспечения для определения идентичности последовательности аминокислот (MacWilliam et al., Nucleic Acids Res.2013 Jul; 41(Web Server issue): W597-W600).Alignment for the purpose of determining percent amino acid identity can be achieved in a variety of ways within the skill of the art, for example using open source software such as ClustalOmega (Sievers F, Higgins DG (2018) Protein Sci 27:135-145), Protein BLAST (from the National Center for Biotechnology Information (NCBI), USA), or commercial software such as Megalign (DNASTAR) software. Those skilled in the art can determine suitable metrics for measuring alignment, including any algorithms needed to achieve maximum alignment over the full length of the sequences being compared. NCBI BLAST is another example of software for determining amino acid sequence identity (MacWilliam et al., Nucleic Acids Res. 2013 Jul; 41(Web Server issue): W597-W600).
В соответствии с одним аспектом настоящего изобретения предложен рекомбинантный белок, содержащий последовательность аминокислот, выбранную из группы, состоящей из SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 37 и SEQ ID NO: 38; и ее фрагменты или варианты по меньшей мере с 50% идентичностью последовательностей последовательностям аминокислот SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 37 и SEQ ID NO: 38.According to one aspect of the present invention, there is provided a recombinant protein comprising an amino acid sequence selected from the group consisting of SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 37 and SEQ ID NO: 38; and fragments or variants thereof with at least 50% sequence identity to the amino acid sequences of SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 37 and SEQ ID NO: 38.
Согласно другому аспекту предложен рекомбинантный белок, содержащий последовательность аминокислот по меньшей мере с 60%, 70%, 80%, 90%, или 95% идентичностью последовательностей последовательности аминокислот, выбранной из группы, состоящей из SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 37 и SEQ ID NO: 38.According to another aspect, a recombinant protein is provided, comprising an amino acid sequence with at least 60%, 70%, 80%, 90%, or 95% sequence identity to an amino acid sequence selected from the group consisting of SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 37 and SEQ ID NO: 38.
Биологически активные белки и пептиды играют важную роль в клиническом лечении заболеваний человека. Однако со многими белками и пептидами возникают затруднения из-за их далеко не идеальных фармакокинетических свойств, поскольку они элиминируются в результате фильтрации почками из-за малого размера и/или протеолитического метаболизма. Такие факторы могут налагать ограничения или приводить к затруднениям при введении лекарства субъектному нуждающемуся в лечении, например, необходимость проведения постоянных инфузий или частых подкожных введений для поддержания циркулирующих концентраций белка или пептида на эффективном терапевтическом уровне. Необходимость постоянного или очень частого введения лекарственного средства клинически нежелательна из-за очевидных проблем и неудобства как для пациента, так и для лечащего врача.Biologically active proteins and peptides play an important role in the clinical treatment of human diseases. However, many proteins and peptides are hampered by their less than ideal pharmacokinetic properties, as they are eliminated by renal filtration due to their small size and/or proteolytic metabolism. Such factors may impose limitations or lead to difficulties in administering the drug to the subject requiring treatment, such as the need for continuous infusions or frequent subcutaneous administration to maintain circulating concentrations of the protein or peptide at an effective therapeutic level. The need for continuous or very frequent administration of a drug is clinically undesirable due to the obvious problems and inconvenience to both the patient and the treating physician.
Одна из стратегий увеличения времени полужизни биологически активного пептида или белка состоит в том, чтобы связать группу полиэтиленгликоля (ПЭГ) с пептидом или белком, представляющим интерес, с помощью процесса, называемого пегилированием (см., например, Dozie et al. (2015), Int. J. Mot Sci, 16(10) 25831-25864). Общая стратегия пегилирования белков состоит в проведении реакции функциональной группы на белке с комплементарной группой на молекуле ПЭГ с образованием конъюгата белка и ПЭГ. ПЭГ-фрагмент обеспечивает ряд преимуществ для увеличения стабильности белка и времени полужизни в кровотоке благодаря его гибкости, гидрофильности, вариабельному размеру и низкой токсичности.One strategy to increase the half-life of a biologically active peptide or protein is to link a polyethyleneglycol (PEG) group to the peptide or protein of interest through a process called PEGylation (see, e.g., Dozie et al. (2015) Int. J. Mot Sci, 16(10) 25831–25864). A general strategy for protein PEGylation is to react a functional group on the protein with a complementary group on a PEG molecule to form a protein-PEG conjugate. The PEG moiety offers a number of advantages for increasing protein stability and circulating half-life due to its flexibility, hydrophilicity, variable size, and low toxicity.
Согласно одному варианту реализации настоящего изобретения, соответственно, предложен рекомбинантный белок согласно описанию выше, отличающийся тем, что указанный указанный белок пегилирован. Слитые белки в соответствии с настоящим изобретением могут также быть пегилированными.According to one embodiment of the present invention, accordingly, there is provided a recombinant protein according to the description above, characterized in that said said protein is PEGylated. Fusion proteins according to the present invention can also be PEGylated.
Слитые белкиFused proteins
Другой способ избежать затруднений, связанных с медицинским применением пептидов и белков, заключается в продлении времени полужизни биоактивного белка или пептида путем получения слитых белков, (см. например Valeria et al. (2017), «А New Approach to Drag Therapy: Fc-Fusion Technology), Prim Health Care, 7:255, doi: 10.4172/2167-1079.1000255). Путем ковалентного слияния белка или пептида с белком-носителем посредством генетической рекомбинации можно увеличить молекулярную массу белка, представляющего интерес, до приблизительно 60-70 кДа, что соответствует порогу для фильтрации почками.Another way to avoid the difficulties associated with the medical use of peptides and proteins is to extend the half-life of the bioactive protein or peptide by producing fusion proteins (see, for example, Valeria et al. (2017), “A New Approach to Drag Therapy: Fc-Fusion Technology,” Prim Health Care, 7:255, doi: 10.4172/2167-1079.1000255). By covalently fusing a protein or peptide to a carrier protein through genetic recombination, the molecular weight of the protein of interest can be increased to approximately 60-70 kDa, which is within the threshold for renal filtration.
В настоящем изобретении предложен слитый белок, содержащийThe present invention provides a fusion protein comprising
(i) Домен гомологии к повторам тромбоспондина типа 1 (TSP-1) белка семейства CCN;(i) The thrombospondin type 1 repeat homology domain (TSP-1) of the CCN family protein;
(ii) партнер для слияния, слитый на N- или С-конце с доменом гомологии к повторам TSP-1 по (i), причем указанный партнер для слияния выбран из группы, состоящей из сывороточного альбумина, трансферрина и Fc-фрагмента иммуноглобулина.(ii) a fusion partner fused at the N- or C-terminus to the TSP-1 repeat homology domain of (i), wherein said fusion partner is selected from the group consisting of serum albumin, transferrin and the Fc portion of an immunoglobulin.
(iii) необязательно, пептидный линкер между доменом гомологии к повторам TSP-1 и Fc-фрагментом (слитым на N- или С-конце с доменом гомологии к повторам TSP-1) по (i).(iii) optionally, a peptide linker between the TSP-1 repeat homology domain and the Fc fragment (fused at the N- or C-terminus to the TSP-1 repeat homology domain) of (i).
В настоящем описании домен гомологии к повторам TSP-I также может называться доменом III и относиться к домену III, то есть третьему домену белков семейства CCN.In the present description, the TSP-I repeat homology domain may also be referred to as domain III and refers to domain III, i.e., the third domain of the CCN family of proteins.
В одном предпочтительном аспекте партнер для слияния представляет собой мономерный партнер для слияния и приводит к получению мономерного слитого белка. Такие слитые белки и, в частности, их домены TSP-1, определены выше и подробнее описаны ниже.In one preferred aspect, the fusion partner is a monomeric fusion partner and results in a monomeric fusion protein. Such fusion proteins, and in particular their TSP-1 domains, are defined above and described in more detail below.
Однако настоящее изобретение также включает другие варианты реализации, как применительно к компоненту белку домена TSP-1, так и к компоненту партнеру для слияния.However, the present invention also includes other embodiments, both with respect to the TSP-1 domain protein component and to the fusion partner component.
В соответствии с одним таким вариантом реализации домен гомологии к повторам TSP-1 представляет собой рекомбинантный белок формулы I согласно определению выше.According to one such embodiment, the TSP-1 repeat homology domain is a recombinant protein of formula I as defined above.
Домен гомологии к повторам TSP-1 в соответствии с другим вариантом реализации представляет собой рекомбинантный белок, имеющий последовательность аминокислот согласно определению в любой из последовательностей, представленных в SEQ ID NO: 1-12, 37 и 38, или рекомбинантный белок формулы I согласно определению выше.The TSP-1 repeat homology domain according to another embodiment is a recombinant protein having an amino acid sequence as defined in any of the sequences presented in SEQ ID NOs: 1-12, 37 and 38, or a recombinant protein of formula I as defined above.
В соответствии с одним вариантом реализации домен гомологии к повторам TSP-1 представляет собой рекомбинантный белок, содержащий последовательность аминокислот по меньшей мере с 50%, 60%, 70%, 80%, 90% или 95% идентичностью последовательностей последовательности аминокислот, выбранной из группы, состоящей из SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 37 и SEQ ID NO: 38.According to one embodiment, the TSP-1 repeat homology domain is a recombinant protein comprising an amino acid sequence with at least 50%, 60%, 70%, 80%, 90% or 95% sequence identity to an amino acid sequence selected from the group consisting of SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 37 and SEQ ID NO: 38.
Белки по своей природе чувствительны к разложению протеазами. Для предотвращения разложения протеазами рекомбинантных белков и слитых белков в соответствии с настоящим изобретением в последовательность аминокислот могут быть введены модификации, например, с помощью направленного мутагенеза, чтобы получить устойчивые к протеазам рекомбинантные белки и слитые белки. Например, точечная мутация может быть введена в домен гомологии к повторам тромбоспондина типа 1 (TSP-1) белка семейства CCN согласно определению в SEQ ID NO: 1-12, 37 или 38, или, более конкретно, в белок согласно определению в любой из SEQ ID NO: 1-6, 8-12 или 37, слитый белок или рекомбинантный белок. В соответствии с одним вариантом реализации вводят точечную мутацию, снижающую чувствительность к протеолитическому разложению. Неограничивающий пример точечной мутации, которая приводит к меньшему протеолизу рекомбинантных белков и слитых белков согласно настоящему изобретению, заключается во введении точечной мутации, соответствующей замене пролина на аланин в положении 195 (Р195А) домена III CCN5, такой, как показана в SEQ ID NO: 7. Аналогичная мутация может также быть введена в последовательности аминокислот, происходящие из домена III других представителей семейства CCN. SEQ ID NO: 38 соответствует усеченной последовательности из 44 аминокислот домена TSP-1 CCN5, содержащей замену на Ala. SEQ ID NO: 42-46 соответствуют усеченным последовательностям из 44 аминокислот доменов гомологии с TSP-1 CCN1, 2, 3, 4 и 6, соответственно, содержащим замену на Ala. SEQ ID NO: 47-51 соответствуют более длинным последовательностям гомологии с TSP-1 CCN1, 2, 3, 4 и 6, соответственно, содержащим замену Ala. Любая такая последовательность, или последовательность, по меньшей мере на 80% ей идентичная, может применяться в соответствии с настоящим изобретением.Proteins are inherently susceptible to degradation by proteases. To prevent protease degradation of recombinant proteins and fusion proteins according to the present invention, modifications can be introduced into the amino acid sequence, for example, by site-directed mutagenesis, to obtain protease-resistant recombinant proteins and fusion proteins. For example, a point mutation can be introduced into the thrombospondin type 1 repeat homology domain (TSP-1) of a CCN family protein as defined in SEQ ID NOs: 1-12, 37 or 38, or more specifically, into a protein as defined in any of SEQ ID NOs: 1-6, 8-12 or 37, a fusion protein or a recombinant protein. According to one embodiment, a point mutation is introduced that reduces sensitivity to proteolytic degradation. A non-limiting example of a point mutation that results in less proteolysis of the recombinant proteins and fusion proteins of the present invention is the introduction of a point mutation corresponding to a proline to alanine substitution at position 195 (P195A) of domain III of CCN5, such as shown in SEQ ID NO: 7. A similar mutation can also be introduced into amino acid sequences derived from domain III of other CCN family members. SEQ ID NO: 38 corresponds to a truncated 44-amino acid sequence of the TSP-1 CCN5 domain containing an Ala substitution. SEQ ID NOs: 42-46 correspond to truncated 44-amino acid sequences of the TSP-1 homology domains of CCN1, 2, 3, 4 and 6, respectively, containing an Ala substitution. SEQ ID NOs: 47-51 correspond to longer sequences of homology to TSP-1 CCN1, 2, 3, 4 and 6, respectively, containing the Ala substitution. Any such sequence, or a sequence at least 80% identical thereto, can be used according to the present invention.
Как отмечалось выше, согласно предпочтительному варианту реализации указанный партнер для слияния (ii) слитого белка в соответствии с настоящим изобретением является мономерным. Может применяться любой мономерный партнер для слияния. Соответственно, партнер для слияния может представлять собой любой белок или его часть (например, домен белка), который возникает и остается в мономерной форме при слиянии с компонентом белком с доменом гомологии с TSP-1. Соответственно, слитый белок, содержащий мономерный партнер для слияния и белок с доменом гомологии с TSP-1, остается мономером. Это означает, что он не димеризуется и не образует сам с собой мультимеры более высоких порядков.As noted above, according to a preferred embodiment, said fusion partner (ii) of the fusion protein according to the present invention is monomeric. Any monomeric fusion partner may be used. Accordingly, the fusion partner may be any protein or part thereof (e.g., a protein domain) that is formed and remains in a monomeric form when fused with a component protein with a TSP-1 homology domain. Accordingly, the fusion protein comprising a monomeric fusion partner and a protein with a TSP-1 homology domain remains monomeric. This means that it does not dimerize and does not form higher order multimers with itself.
Известны различные белки, подходящие в качестве возможные партнеров для слияния, они могут включать природные белки, или их фрагменты или варианты с модифицированной последовательностью аминокислот, а также синтетические белки или гомополимеры аминокислот. Такие белки включают, в частности, Fc-фрагменты IgG, сывороточный альбумин или трансферрин.Various proteins are known to be suitable as possible fusion partners, and may include natural proteins or fragments or variants thereof with modified amino acid sequences, as well as synthetic proteins or amino acid homopolymers. Such proteins include, in particular, Fc fragments of IgG, serum albumin or transferrin.
Партнер для слияния в настоящей заявке определен в широком смысле как второй полипептид (или вторая последовательность аминокислот), который не присутствует в комбинации (например, не расположен смежно, или не связан, прямо или непрямо) с первым полипептидом CCN с гомологией TSP-1 в природе, и соединен с первым полипептидом CCN с гомологией TSP-1 в синтетической или искусственной комбинации. Соответственно, слитый белок содержит не встречающуюся в природе комбинацию по меньшей мере двух последовательностей аминокислот или полипептидов, соединенных или слитых вместе.A fusion partner in the present application is broadly defined as a second polypeptide (or second amino acid sequence) that is not present in combination (e.g., not adjacent to, or not linked, directly or indirectly) with a first CCN polypeptide with homology to TSP-1 in nature, and is linked to the first CCN polypeptide with homology to TSP-1 in a synthetic or artificial combination. Accordingly, a fusion protein comprises a non-naturally occurring combination of at least two amino acid sequences or polypeptides linked or fused together.
Партнером для слияния может быть последовательность аминокислот длиной по меньшей мере 6, 8, 9, 10, 15, 20, 25, 30, 40 или 50 или более аминокислот. Как правило, партнер для слияния представляет собой функциональный полипептид, или, другими словами, он представляет собой полипептид, который обеспечивает функцию или свойство слитого белка, например, стабилизирует слитый белок (делая первый полипептид более стабильным) или увеличивает время его полужизни в сыворотке. Соответственно, партнер для слияния может представлять собой структурный белок или иметь структурную функцию, или он может обеспечивать активность или свойство слитого белка, например, связывающую активность (например, партнер для слияния может быть членом связывающейся пары, или может быть партнером для аффинного связывания, и т.п.). В репрезентативных примерах партнером для слияния может быть альбумин (в частности, сывороточный альбумин), фибриноген, глутатион-S-трансфераза, трансферрин, стрептавидин или стрептавидино-подобный белок, или иммуноглобулин, или его часть, в частности, Fc-часть иммуноглобулина (например IgG1, IgG2, IgG3 или IgG4), или ее часть или модифицированный вариант. Подходящие сывороточные альбумины включают бычий сывороточный альбумин (БСА), сывороточный альбумин мыши (МСА) и, в особенности, сывороточный альбумин человека (ЧСА). Другие возможные партнеры для слияния включают полипептиды, которые могут действовать, улучшая фармакокинетические свойства слитого белка, например, синтетические полипептиды, такие как гомополимер аминокислоты, пролин-аланин-сериновый полимер или эластиноподобный пептид, например, согласно описанию в источнике: Strohl, 2015, BioDrugs 29, 215-239. Может применяться любой партнер для слияния для применения с терапевтическими белками, известный в данной области техники.The fusion partner may be an amino acid sequence of at least 6, 8, 9, 10, 15, 20, 25, 30, 40 or 50 or more amino acids in length. Typically, the fusion partner is a functional polypeptide, or in other words, it is a polypeptide that provides a function or property of the fusion protein, such as stabilizing the fusion protein (making the first polypeptide more stable) or increasing its serum half-life. Accordingly, the fusion partner may be a structural protein or have a structural function, or it may provide an activity or property of the fusion protein, such as binding activity (e.g., the fusion partner may be a member of a binding pair, or may be an affinity binding partner, etc.). In representative examples, the fusion partner may be an albumin (particularly serum albumin), fibrinogen, glutathione-S-transferase, transferrin, streptavidin or streptavidin-like protein, or an immunoglobulin or a portion thereof, particularly the Fc portion of an immunoglobulin (e.g., IgG1, IgG2, IgG3, or IgG4), or a portion or modified version thereof. Suitable serum albumins include bovine serum albumin (BSA), mouse serum albumin (MSA), and, in particular, human serum albumin (HSA). Other possible fusion partners include polypeptides that can act to improve the pharmacokinetic properties of the fusion protein, such as synthetic polypeptides such as an amino acid homopolymer, a proline-alanine-serine polymer, or an elastin-like peptide, such as those described in Strohl, 2015, BioDrugs 29, 215-239. Any fusion partner known in the art for use with therapeutic proteins can be used.
Согласно варианту реализации партнером для слияния (ii) слитого белка в соответствии с настоящим изобретением может быть Fc-фрагмент IgG (любого подкласса или химеры любых подклассов), сывороточный альбумин или трансферрин.According to an embodiment, the fusion partner (ii) of the fusion protein according to the present invention may be the Fc fragment of IgG (of any subclass or a chimera of any subclasses), serum albumin or transferrin.
Партнер для слияния может быть сопряжен на N- или С-конце с компонентом - белком с доменом гомологии с TSP-1 слитого белка, например, с доменом гомологии к повторам TSP-1 CCN5 или любых других белков CCN согласно определению в настоящей заявке. Он может быть присоединен прямо или непрямо, посредством линкера, как подробнее описано ниже.The fusion partner may be fused at the N- or C-terminus to a component protein with a TSP-1 homology domain of the fusion protein, such as a TSP-1 repeat homology domain of CCN5 or any other CCN proteins as defined herein. It may be attached directly or indirectly via a linker, as described in more detail below.
Fc-фрагменты склонны образовывать димеры, и при использовании в слитых белках конструкция слитого белка проявляет склонность к включению двух копий слитого белка. Однако в данной области техники известно, что могут быть получены мономерные Fc-фрагменты и содержащие их мономерные слитые белки.Fc fragments tend to form dimers, and when used in fusion proteins, the fusion protein design tends to include two copies of the fusion protein. However, it is known in the art that monomeric Fc fragments and monomeric fusion proteins containing them can be prepared.
Соответственно, если партнер для слияния представляет собой Fc-фрагмент, он предпочтительно представляет собой мономерный Fc-фрагмент, такой как мономерный Fc-фрагмент IgG человека любого класса. Предусмотрены химерные Fc-фрагменты, содержащие части Fc-областей из разных классов, а также Fc-фрагменты с модифицированными последовательностями.Accordingly, if the fusion partner is an Fc fragment, it is preferably a monomeric Fc fragment, such as a monomeric Fc fragment of human IgG of any class. Chimeric Fc fragments containing portions of Fc regions from different classes, as well as Fc fragments with modified sequences, are contemplated.
Слитые с Fc белки представляют растущий класс белковых терапевтических средств на основе химерных белков, состоящих из эффекторного домена, сопряженного с Fc-фрагментом IgG-изотипа. Типичным примером биофармацевтического продукта является этанерцепт (рецептор ФНО-α, связанный с Fc-фрагментом), используемый при лечении, например, ревматоидного артрита. Другим примером биофармацевтического белка слияния Fc является афлиберцепт. Афлиберцепт, слитый с Fc белок рецептора ФРЭС, используется в лечении влажной формы макулярной дегенерации и метастатического рака ободочной и прямой кишки. Основным обоснованием для получения слитых белков с Fc-фрагментом является продление времени полужизни за счет увеличения молекулярной массы, достаточного для исключения почечной экскреции и усиления почечной проксимальной канальцевой реабсорбции через неонатальный Fc-рецептор. Также рН-зависимое связывание слитых с Fc белков с неонатальным рецептором Fc (FcRn) на эндотелиальных клетках позволяет слитым белкам на основе Fc, которые в противном случае подверглись бы эндоцитозу и последующему лизосомному разложению, проходить рециклинг и попадать обратно в кровоток.Fc fusion proteins are a growing class of protein therapeutics based on chimeric proteins consisting of an effector domain linked to the Fc region of an IgG isotype. A typical example of a biopharmaceutical product is etanercept (a TNF-α receptor linked to an Fc region), used in the treatment of, for example, rheumatoid arthritis. Another example of a biopharmaceutical Fc fusion protein is aflibercept. Aflibercept, a fusion protein of the VEGF receptor Fc protein, is used in the treatment of wet macular degeneration and metastatic colorectal cancer. The primary rationale for producing Fc fusion proteins is to prolong half-life by increasing molecular weight sufficiently to eliminate renal excretion and enhance renal proximal tubular reabsorption via the neonatal Fc receptor. Also, pH-dependent binding of Fc fusion proteins to the neonatal Fc receptor (FcRn) on endothelial cells allows Fc-based fusion proteins, which would otherwise be endocytosed and subsequently lysosomally degraded, to be recycled and released back into the circulation.
В соответствии с одним вариантом реализации предложен слитый белок, отличающийся тем, что партнер для слияния (ii) представляет собой Fc-фрагмент из IgG человека (иммуноглобулин G, также известный как иммуноглобулин γ), включая любые подклассы IgG человека. В соответствии с еще одним вариантом реализации настоящего изобретения предложен слитый белок, отличающийся тем, что партнер для слияния представляет собой Fc-фрагмент IgG1, IgG2 или IgG4. Предпочтительно, Fc-фрагмент IgG человека относится к подклассу IgG4 (SEQ ID. NO 13) или IgG2 (SEQ ID. NO 14).According to one embodiment, there is provided a fusion protein, characterized in that the fusion partner (ii) is an Fc region from human IgG (immunoglobulin G, also known as immunoglobulin γ), including any subclasses of human IgG. According to another embodiment of the present invention, there is provided a fusion protein, characterized in that the fusion partner is an Fc region of IgG1, IgG2 or IgG4. Preferably, the Fc region of human IgG is of the IgG4 (SEQ ID. NO 13) or IgG2 (SEQ ID. NO 14) subclass.
IgG1, IgG2 и IgG4 часто предпочтительнее, чем IgG3, ввиду более длительного времени полужизни, составляющего приблизительно 3 недели. Специалисту будет понятно, что выбор изотипа IgG конкретного подкласса в качестве Fc-партнера для слияния зависит от требуемого продления времени полужизни и уровня цитотоксической активности итогового соединения. Терапевтические антитела, предназначенные для лечения рака или аутоиммунных заболеваний, принадлежат, по большей части, к подклассу IgG1 ввиду высокой аффинности к Fc-рецепторам и мощной способности стимулировать иммунные эффекторные функции. IgG2 и IgG4, с другой стороны, являются предпочтительными подклассами IgG для применения в качестве остова кандидатного терапевтического средства, когда требуется отсутствие иммунных эффекторных функций, поскольку иммунные эффекторные функции могут быть причиной нежелательных явлений. Склонность Fc-фрагмента к активации иммунных эффекторных функций зависит от изотипа и подкласса Ig и варьирует для разных иммунных эффекторных функций. Помимо выбора Fc-фрагмента подходящего подкласса IgG последовательность аминокислот указанного подкласса IgG может быть модифицирована, например, путем направленного мутагенеза, для снижения способности Fc-фрагментов активировать иммунные эффекторные функции.IgG1, IgG2 and IgG4 are often preferred over IgG3 due to their longer half-life of approximately 3 weeks. One skilled in the art will appreciate that the choice of a particular subclass of IgG isotype as an Fc fusion partner depends on the desired prolongation of half-life and the level of cytotoxic activity of the resulting compound. Therapeutic antibodies intended for the treatment of cancer or autoimmune diseases belong, for the most part, to the IgG1 subclass due to their high affinity for Fc receptors and their potent ability to stimulate immune effector functions. IgG2 and IgG4, on the other hand, are the preferred IgG subclasses for use as the backbone of a candidate therapeutic agent when the absence of immune effector functions is desired, since immune effector functions may be the cause of undesirable effects. The propensity of an Fc fragment to activate immune effector functions depends on the Ig isotype and subclass and varies for different immune effector functions. In addition to selecting an Fc fragment of an appropriate IgG subclass, the amino acid sequence of a given IgG subclass can be modified, for example by site-directed mutagenesis, to reduce the ability of Fc fragments to activate immune effector functions.
Могут быть выбраны Fc-фрагменты, которые образуют мономеры, или, точнее, которые сохраняют или имеют мономерную форму или могут быть модифицированы путем введения мутаций, которые позволяют или облегчают получение мономерной структуры. Такие мутации в настоящей заявке называются «мутациями, обеспечивающими образование мономеров» Примеры Fc-фрагментов, которые содержат мутации, обеспечивающие образование мономеров, представлены SEQ ID NO: 54 и 55. Специалист в данной области техники знает, как ввести такие мутации и выбрать мономерные Fc-мутанты.Fc fragments that form monomers, or more precisely, that retain or have a monomeric form, or can be modified by introducing mutations that allow or facilitate the formation of a monomeric structure, can be selected. Such mutations are referred to in this application as "mutations that provide for the formation of monomers." Examples of Fc fragments that contain mutations that provide for the formation of monomers are provided by SEQ ID NOs: 54 and 55. A person skilled in the art knows how to introduce such mutations and select monomeric Fc mutants.
Избегание функции активации иммунных эффекторов Fc-фрагментамиEvasion of immune effector activation function by Fc fragments
Например, в биофармацевтический слитый белок дулаглутид (Трулисити, Trulicity™), слитый белок с агонистом GLP-1 и Fc-фрагментом, используемый один раз в неделю при лечении типа 2 диабета, вводят хорошо охарактеризованные мутации F234A и L235A в шарнирную область Fc-фрагмента IgG4 для снижения его способности активировать иммунные эффекторные функции.For example, the biopharmaceutical fusion protein dulaglutide (Trulicity™), a GLP-1 agonist and Fc-region fusion protein used once weekly to treat type 2 diabetes, introduces well-characterized F234A and L235A mutations into the hinge region of the Fc-region of IgG4 to reduce its ability to activate immune effector functions.
В соответствии с одним вариантом реализации настоящего изобретения Fc-партнер для слияния представляет собой Fc-фрагмент IgG4, отличающийся тем, что указанный IgG4 Fc-фрагмент модифицирован так, чтобы избежать иммунных эффекторных функций, например, он содержит вышеуказанные мутации F234A и L235A.According to one embodiment of the present invention, the Fc fusion partner is an IgG4 Fc fragment, characterized in that said IgG4 Fc fragment is modified so as to avoid immune effector functions, for example, it contains the above-mentioned F234A and L235A mutations.
Fc-фрагменты, устойчивые к протеазеProtease-resistant Fc fragments
Другой фактор, который может уменьшить и выход в процессе изготовления, и биологический период полужизни - это расщепление слитого белка эндопептидазой. Для снижения или элиминации риска протеолитического разложения в последовательности аминокислот Fc-фрагмента могут быть введены модификации, в частности, путем введения мутации в сайты, чувствительные к протеолитическому расщеплению. В заявке на патент ЕР ЕР2654780 В1 Fc-домен константной области IgG1 был модифицирован путем замены E233-L234-L235-G236 на P233-V234-A235 (делеция G236) (нумерация ЕС) для придания итоговому модифицированному Fc-содержащему белку устойчивости к протеолитическому разложению.Another factor that can reduce both the manufacturing yield and the biological half-life is the cleavage of the fusion protein by endopeptidase. To reduce or eliminate the risk of proteolytic degradation, modifications can be introduced into the amino acid sequence of the Fc fragment, in particular by introducing a mutation into sites susceptible to proteolytic cleavage. In the EP patent application EP2654780 B1, the Fc domain of the constant region of IgG1 was modified by replacing E233-L234-L235-G236 with P233-V234-A235 (deletion of G236) (EU numbering) to render the resulting modified Fc-containing protein resistant to proteolytic degradation.
Включение модификации аминокислот, раскрытой в ЕР2654780 В1, в Fc-фрагмент IgG4, сопряженный с доменом III CCN5, было признано неспособным обеспечить достаточную устойчивость к эндопептидазам. Однако улучшение устойчивости к протеазам было достигнуто путем дополнительных модификаций подтипа IgG, используемого в качестве партнер для слияния в соответствии с настоящим изобретением.Incorporation of the amino acid modification disclosed in EP2654780 B1 into the Fc region of IgG4 coupled to domain III of CCN5 was found to be incapable of providing sufficient resistance to endopeptidases. However, improvement in resistance to proteases was achieved by additional modifications of the IgG subtype used as a fusion partner according to the present invention.
Более конкретно, было обнаружено, что слитые белки, содержащие полную шарнирную область IgG2 и константные тяжелые цепи 2 и 3 IgG4, проявляют превосходную протеолитическую устойчивость.More specifically, fusion proteins containing the complete hinge region of IgG2 and constant heavy chains 2 and 3 of IgG4 were found to exhibit excellent proteolytic stability.
В источнике: Mueller JP et al., Mol. Immunol. (1997), 34(6), pp.441-452, раскрыто применение химер IgG2/IG4 в антителах IgG. Другое биофармацевтическое моноклональное антитело, экулизумаб, который используют в лечении ночной пароксизмальной гемоглобинурии и атипичного гемолитического уремического синдрома, как было показано, может подходить для применения, например, чтобы устранить способность IgG4 активировать FcγR-зависимый иммунный эффекторный ответ. Кроме того, показано, что константные домены 2 и 3 IgG4 такого химерного Fc-фрагмента также устраняют способность IgG2 активировать комплемент-зависимые иммунные эффекторные функции. Информация на эту тему приведена в отчетах Rother et al., (2007), см. Nat. Biotechnol., 25(11), pp. 1256-1264 и Mueller JP et al., выше.In the source: Mueller JP et al., Mol. Immunol. (1997), 34(6), pp.441-452, the use of IgG2/IG4 chimeras in IgG antibodies is disclosed. Another biopharmaceutical monoclonal antibody, eculizumab, which is used in the treatment of paroxysmal nocturnal hemoglobinuria and atypical hemolytic uremic syndrome, was shown to be suitable for use, for example, to abolish the ability of IgG4 to activate the FcγR-dependent immune effector response. In addition, it was shown that constant domains 2 and 3 of IgG4 of such a chimeric Fc fragment also abolish the ability of IgG2 to activate complement-dependent immune effector functions. Information on this topic is reported by Rother et al., (2007), see Nat. Biotechnol., 25(11), pp. 1256-1264 and Mueller JP et al., above.
Также в источнике: Borrok et al. (2017), J. Pharm. Sci. 106; 1008-1017 описано введение модификаций в Fc-фрагмент для исследования его эффекта на иммунные эффекторные функции антител (мутации FQQ-YTE). В WO 2017158426A1 раскрыты модификации антител путем введения мутаций в Fc-фрагмент для продления времени полужизни антител. В частности, раскрыты модификации в одном или более положениях 311, 434, 428, 438 и 435 в Fc-области иммуноглобулина.Also in the source: Borrok et al. (2017), J. Pharm. Sci. 106; 1008-1017, the introduction of modifications into the Fc fragment to study its effect on the immune effector functions of antibodies (FQQ-YTE mutations) is described. WO 2017158426A1 discloses modifications of antibodies by introducing mutations into the Fc fragment to extend the half-life of antibodies. In particular, modifications are disclosed at one or more positions 311, 434, 428, 438 and 435 in the Fc region of an immunoglobulin.
Кроме того, Kinder et al. J Biol Chem. 2013 Oct 25; 288(43):30843-54 сообщают, что мутации в нижнем шарнире IgGl (т.е. Е233Р, L234V, L235A, G236-, Eu-нумерация) приводили к получению устойчивых к протеазам антител IgG1.In addition, Kinder et al. J Biol Chem. 2013 Oct 25; 288(43):30843-54 reported that mutations in the lower hinge of IgG1 (i.e., E233P, L234V, L235A, G236-, Eu-numbering) resulted in protease-resistant IgG1 antibodies.
В соответствии с одним вариантом реализации Fc-фрагмент слитого белка в соответствии с настоящим изобретением состоит из Fc-фрагмента подкласса IgG4, включающего следующие мутации: S228P, F234A, L235A, К447-, Eu-нумерация, см. SEQ ID NO:15.According to one embodiment, the Fc region of the fusion protein according to the present invention consists of an Fc region of the IgG4 subclass comprising the following mutations: S228P, F234A, L235A, K447-, Eu-numbering, see SEQ ID NO:15.
В источнике: Jacobsen et al. J Biol Chem. 2017 Feb 3;292(5): 1865-1875 сообщается, что мутация Asn297 приводит к получению агликозилированного Fc-фрагмента, что в дальнейшем приводит к отсутствию эффекторных функций IgG. Jacobsen также обнаружил, что некоторые варианты (N297G) приводили к получению антител с лучшей стабильностью и пригодностью для разработки по сравнению с другими вариантами (N297Q или N297A). Также вводили дополнительные модификации (дисульфидные мостики), что приводило к лучшей стабильности, чем у исходного IgG1.Jacobsen et al. J Biol Chem. 2017 Feb 3;292(5): 1865-1875 reported that the Asn297 mutation resulted in an aglycosylated Fc fragment, which further resulted in the absence of IgG effector functions. Jacobsen also found that some variants (N297G) resulted in antibodies with better stability and development suitability compared to other variants (N297Q or N297A). They also introduced additional modifications (disulfide bridges), which resulted in better stability than the original IgG1.
В соответствии с настоящим изобретением, когда партнер для слияния представляет собой Fc-фрагмент, он может быть агликозилирован, без стабилизирующего дисульфидного мостика или со стабилизирующим дисульфидным мостиком, как, например, в SEQ ID NO: 16.According to the present invention, when the fusion partner is an Fc fragment, it may be aglycosylated, without a stabilizing disulfide bridge or with a stabilizing disulfide bridge, such as in SEQ ID NO: 16.
Насколько известно авторам настоящего изобретения, Fc-фрагмент, состоящий из полной шарнирной области IgG2 и константных тяжелых цепей 2 и 3 IgG4, ранее не использовался для получения слитых белков путем соединения указанного Fc-фрагмента с эффекторным белком.To the best of the knowledge of the present inventors, an Fc fragment consisting of the complete hinge region of IgG2 and constant heavy chains 2 and 3 of IgG4 has not previously been used to produce fusion proteins by linking said Fc fragment to an effector protein.
В соответствии с одним вариантом реализации партнер для слияния предложенного слитого белка представляет собой Fc-фрагмент IgG1, который агликозилирован и стабилизирован дисульфидным мостиком, и отличается тем, что в нижний шарнир введены следующие мутации: Е233Р, L234V, L235A, G236- (Eu-нумерация) (SEQ ID NO: 17).According to one embodiment, the fusion partner of the proposed fusion protein is an Fc fragment of IgG1 that is aglycosylated and stabilized by a disulfide bridge, and is characterized in that the following mutations are introduced into the lower hinge: E233P, L234V, L235A, G236- (Eu numbering) (SEQ ID NO: 17).
В соответствии с одним вариантом реализации партнер для слияния слитого белка, содержащего домен гомологии к повторам TSP-1 белка семейства CCN, представляет собой Fc-фрагмент IgG4, и отличается тем, что в нижний шарнир введены следующие мутации: Е233Р, L234V, L235A, G236- (Eu-нумерация) наряду с мутациями S228P и К477- (SEQ ID NO: 18).According to one embodiment, the fusion partner of the fusion protein comprising the TSP-1 repeat homology domain of the CCN family protein is the Fc fragment of IgG4, and is characterized in that the following mutations are introduced into the lower hinge: E233P, L234V, L235A, G236- (Eu numbering) along with the mutations S228P and K477- (SEQ ID NO: 18).
Согласно одному предпочтительному варианту реализации указанный Fc-фрагмент представляет собой химеру шарнирной области IgG2 (216 ERKCCVECPPCPAPPVA-GP 238, Eu-нумерация) и любого другого из подклассов IgG. Наиболее предпочтительно Fc-фрагмент представляет собой химеру шарнирной области IgG2 и константных доменов тяжелой цепи 2 и 3 IgG4 с делецией карбоксиконцевого К477 (Eu-нумерация), представленную в SEQ ID. NO: 19. Указанный вариант реализации настоящего изобретения, как было показано, имеет улучшенные характеристики устойчивости к протеазам (см. Пример 6).According to one preferred embodiment, said Fc fragment is a chimera of the hinge region of IgG2 (216 ERKCCVECPPCPAPPVA-GP 238, Eu numbering) and any other IgG subclass. Most preferably, the Fc fragment is a chimera of the hinge region of IgG2 and the constant domains of the heavy chain 2 and 3 of IgG4 with a deletion of the carboxy-terminal K477 (Eu numbering), as shown in SEQ ID. NO: 19. Said embodiment of the present invention has been shown to have improved protease resistance characteristics (see Example 6).
Согласно одному варианту реализации партнер для слияния мономерного слитого белка согласно настоящему изобретению представляет собой Fc-фрагмент IgGl, стабилизированный дисульфидным мостиком (R292C, V302C), агликозилированный (N297G) и содержащий мутации, обеспечивающие образование мономеров (C220Q, C226Q, C229Q, T366R, L368H, Р395К, К409Т, M428L), Eu-нумерация), как представлено в SEQ ID NO: 54.According to one embodiment, the fusion partner of the monomeric fusion protein of the present invention is an IgG1 Fc fragment stabilized by a disulfide bridge (R292C, V302C), aglycosylated (N297G) and containing mutations that allow the formation of monomers (C220Q, C226Q, C229Q, T366R, L368H, P395K, K409T, M428L, Eu numbering), as shown in SEQ ID NO: 54.
Согласно дополнительному варианту реализации партнер для слияния мономерного слитого белка согласно настоящему изобретению представляет собой Fc-фрагмент, представляющий собой химеру шарнирной области IgG2 и константных доменов тяжелой цепи 2 и 3 IgG4 с делецией карбоксиконцевого К477- и с мутациями, обеспечивающими образование мономеров (C219Q, C220Q, C226Q, C229Q, L351F, T366R, Р395К, F405R, Y407E), и продлевающими время полужизни мутациями (M252Y, S254T, Т256Е) (Eu-нумерация), как представлено в SEQ ID NO: 55.According to a further embodiment, the fusion partner of the monomeric fusion protein of the present invention is an Fc fragment which is a chimera of the hinge region of IgG2 and the constant domains of the heavy chain 2 and 3 of IgG4 with a deletion of the carboxy-terminal K477- and with mutations allowing the formation of monomers (C219Q, C220Q, C226Q, C229Q, L351F, T366R, P395K, F405R, Y407E) and half-life extending mutations (M252Y, S254T, T256E) (Eu numbering), as shown in SEQ ID NO: 55.
Хотя в примере слитого белка в соответствии с настоящим изобретением использован Fc-фрагмент, состоящий из полной шарнирной области IgG2, константных тяжелых цепей 2 и 3 IgG4, и домена III представителя семейства белков CCN, считается, что благоприятная устойчивость к протеазам также достигается, когда такой химерный Fc-фрагмент сопряжен с другими эффекторными молекулами, например, такими как VEGFR, FGF- 21 или GLP1. Эффекторная молекула является частью слитого с Fc белка, которая обеспечивает требуемые фармакодинамические свойства, тогда как Fc-фрагмент вносит вклад в фармакокинетические свойства.Although the example of a fusion protein according to the present invention uses an Fc fragment consisting of the entire hinge region of IgG2, constant heavy chains 2 and 3 of IgG4, and domain III of a member of the CCN protein family, it is believed that favorable protease resistance is also achieved when such a chimeric Fc fragment is coupled to other effector molecules, such as, for example, VEGFR, FGF-21, or GLP1. The effector molecule is the part of the Fc fusion protein that provides the desired pharmacodynamic properties, while the Fc fragment contributes to the pharmacokinetic properties.
Сывороточный альбумин в качестве партнера для слиянияSerum albumin as a fusion partner
Альтернативная стратегия для продления времени полужизни пептидов и белков заключается в использовании сывороточного альбумина (СА) в качестве партнера для слияния. IgG и СА имеют продолжительное время полужизни, равное приблизительно 19 дней, по сравнению с несколькими днями или менее для большинства других циркулирующих белков. СА также имеет аффинность к неонатальному рецептору Fc (FcRn) и избегает внутриклеточного разложения (см. Andersen et al. (2014), J Biol Chem, 289(19); pp. 13492- 13502).An alternative strategy for extending the half-life of peptides and proteins is to use serum albumin (SA) as a fusion partner. IgG and SA have long half-lives of approximately 19 days, compared with a few days or less for most other circulating proteins. SA also has affinity for the neonatal Fc receptor (FcRn) and avoids intracellular degradation (see Andersen et al. (2014) J Biol Chem 289(19); pp. 13492–13502).
Согласно одному варианту реализации настоящего изобретения предложен слитый белок согласно описанию выше, отличающийся тем, что партнером для слияния является сывороточный альбумин, предпочтительно сывороточный альбумин человека.According to one embodiment of the present invention, there is provided a fusion protein as described above, characterized in that the fusion partner is serum albumin, preferably human serum albumin.
Согласно одному варианту реализации предложен мономерный слитый белок согласно описанию выше, отличающийся тем, что указанный слитый белок содержит аминокислоты 25 606 сывороточного альбумина человека, как представлено в SEQ ID NO: 101.According to one embodiment, a monomeric fusion protein as described above is provided, characterized in that said fusion protein comprises amino acids 25,606 of human serum albumin, as presented in SEQ ID NO: 101.
Согласно дополнительному варианту реализации настоящего изобретения указанный альбумин, например, сывороточный альбумин человека, модифицированный, например, для увеличения или уменьшения времени полужизни за счет изменения его аффинности к FcRn, с зависимостью или без зависимости от рН, что приводит к увеличению или уменьшению периода полужизни.According to a further embodiment of the present invention, said albumin, for example human serum albumin, is modified, for example, to increase or decrease half-life by changing its affinity for FcRn, with or without pH dependence, which results in an increase or decrease in half-life.
Трансферрин как партнер для слиянияTransferrin as a fusion partner
Также альтернативной стратегией продления времени полужизни пептидов и белков является применение трансферрина в качестве партнера для слияния с использованием естественного длительного времени полужизни трансферрина (Strohl W. FJioDrugs. 2015; 29(4): 215 239). Трансферрин может быть использован в гликозилированной или негликозилированной форме.Another alternative strategy to extend the half-life of peptides and proteins is to use transferrin as a fusion partner, taking advantage of the naturally long half-life of transferrin (Strohl W. FJioDrugs. 2015; 29(4): 215 239). Transferrin can be used in glycosylated or non-glycosylated form.
Согласно одному варианту реализации настоящего изобретения предложен слитый белок согласно описанию выше, отличающийся тем, что партнером для слияния является трансферрин, предпочтительно трансферрин человека.According to one embodiment of the present invention, there is provided a fusion protein as described above, characterized in that the fusion partner is transferrin, preferably human transferrin.
Согласно одному варианту реализации предложен мономерный слитый белок согласно описанию выше, отличающийся тем, что указанный слитый белок содержит аминокислоты 20-698 трансферрина человека, как представлено в SEQ ID NO: 53.According to one embodiment, a monomeric fusion protein as described above is provided, characterized in that said fusion protein comprises amino acids 20-698 of human transferrin, as presented in SEQ ID NO: 53.
ЛинкерLinker
Согласно другому варианту реализации слитые белки в соответствии с настоящим изобретением могут необязательно содержать пептидный линкер между партнером для слияния и эффекторной молекулой, т.е. линкер слит на N- или С-конце с доменом гомологии к повторам TSP-1 белка CCN (белок/полипептид с доменом TSP-1).According to another embodiment, the fusion proteins according to the present invention may optionally comprise a peptide linker between the fusion partner and the effector molecule, i.e. the linker is fused at the N- or C-terminus to the TSP-1 repeat homology domain of the CCN protein (TSP-1 domain protein/polypeptide).
Может применяться любой пептидный линкер (при условии, что он не является последовательностью белка CCN), многие из которых известны и описаны в данной области техники. Линкер может представлять собой последовательность гибкого линкера (которая может включать повторы мотива последовательности гибкого линкера). Типичные линкеры, известные в данной области техники, богаты небольшими неполярными остатками (например, глицина) или полярными остатками (например, серина или треонина), и обычно состоят из отрезков остатков глицина и серина (GS), или остатков других аминокислот, таких как аланин, лизин и/или глутамат (А, K, и/или Е), или, фактически, любых аминокислот. Часто используемым линкером является линкер (GGGGS) (SEQ ID NO: 121), который может быть предоставлен в виде повторяющихся единиц линкера (как (GGGGS) n, где количество копий n может быть скорректировано, например от 1-10, 1-6, 1-4 и т.п.). Длина линкера может составлять 1-50, 1-45, 1-40, 1-30, 1-25, 1-20, 1-15, 1-12, 1-10, например, 1-8, 1-6, 1-5, или 1-4 аминокислоты. Различные отличающиеся линкеры описаны и использованы в примерах, представленных ниже, и любые из них могут применяться в любых слитых белках согласно настоящему изобретению.Any peptide linker (provided that it is not a CCN protein sequence) may be used, many of which are known and described in the art. The linker may be a flexible linker sequence (which may include repeats of a flexible linker sequence motif). Typical linkers known in the art are rich in small non-polar residues (e.g., glycine) or polar residues (e.g., serine or threonine), and typically consist of stretches of glycine and serine (GS) residues, or other amino acid residues such as alanine, lysine, and/or glutamate (A, K, and/or E), or, in fact, any amino acid. A frequently used linker is the (GGGGS) linker (SEQ ID NO: 121), which can be provided as repeating units of the linker (such as (GGGGS) n, wherein the copy number n can be adjusted, such as from 1-10, 1-6, 1-4, etc.). The length of the linker can be 1-50, 1-45, 1-40, 1-30, 1-25, 1-20, 1-15, 1-12, 1-10, such as 1-8, 1-6, 1-5, or 1-4 amino acids. Various different linkers are described and used in the examples provided below, and any of them can be used in any of the fusion proteins of the present invention.
Согласно некоторым вариантам реализации указанный линкер содержит не более 50 аминокислот.According to some embodiments, said linker comprises no more than 50 amino acids.
Свойства пептидного линкера могут дополнительно улучшать сохранение эффекторных функций. Однако пептидные линкеры могут быть восприимчивы к расщеплению эндопептидазой и элиминации слитого белка. Пептидные линкеры с глицином, с остатками или без остатков серина часто используются, однако указанный дизайн не всегда дает слитые белки с требуемыми видами активности и устойчивости к эндопептидазе. В US20180273603, раскрывающем нейротрофин-связывающий белок-Fс-слитый белок, предлагается применение а-спиральных линкеров, предусматривающих повторы последовательности А (ЕАААК) A (SEQ ID NO: 14 в указанном источнике). Кроме того, в US2018/0127478 раскрыто применение аминокислотного линкера, состоящего из одного-трех повторов последовательности ЕАААK, в слитом белке с Fc.The properties of the peptide linker may further improve the retention of effector functions. However, peptide linkers may be susceptible to endopeptidase cleavage and elimination of the fusion protein. Peptide linkers with glycine, with or without serine residues are often used, but this design does not always result in fusion proteins with the desired activities and endopeptidase resistance. US20180273603, which discloses a neurotrophin binding protein-Fc fusion protein, proposes the use of a-helical linkers comprising repeats of the sequence A(EAAAK)A (SEQ ID NO: 14 in the reference). In addition, US2018/0127478 discloses the use of an amino acid linker consisting of one to three repeats of the sequence EAAAK in a fusion protein with Fc.
В соответствии с настоящим изобретением линкер, состоящий из пептидной последовательности ЕАААK (SEQ ID NO: 21 в настоящей заявке), может также быть вставлен между доменом гомологии с TSP-1 и партнером для слияния (Fc-фрагментом). Более предпочтительно линкер состоит из повторяющейся последовательности аминокислот ЕАААK.According to the present invention, a linker consisting of the peptide sequence EAAAK (SEQ ID NO: 21 in the present application) can also be inserted between the TSP-1 homology domain and the fusion partner (Fc fragment). More preferably, the linker consists of a repeating amino acid sequence EAAAK.
Если линкер включен в слитый белок согласно настоящему изобретению, указанный линкер находится между партнером для слияния и эффекторной молекулой, т.е. доменом III белка CCN. Линкер может быть введен на С-конце или N-конце домена III белка CCN.If a linker is included in the fusion protein according to the present invention, said linker is located between the fusion partner and the effector molecule, i.e. domain III of the CCN protein. The linker can be introduced at the C-terminus or N-terminus of domain III of the CCN protein.
Кроме того, спиральный линкер был устойчив к расщеплению эндопептидазой после экспрессии рекомбинантного белка в суспензии клеток СНО. Это важно как для целей изготовления, так и для in vivo эффективности. Кроме того, показано, что включение α-спирального линкера между Fc-фрагментом и эффекторным доменом в слитом с Fc белке снижает склонность к агрегации указанного слитого с Fc белка.In addition, the helical linker was resistant to endopeptidase cleavage following expression of the recombinant protein in CHO cell suspension. This is important for both manufacturing purposes and in vivo efficacy. Furthermore, inclusion of an α-helical linker between the Fc fragment and the effector domain in the Fc-fusion protein was shown to reduce the aggregation propensity of the Fc-fusion protein.
Хотя указанные результаты обнаружены для слитого белка, содержащего домен III белка CCN в качестве эффекторного белка, считается, что благоприятная пониженная склонность к агрегации и эффекты устойчивости к протеазам также достигаются, если объединить другие эффекторные молекулы с Fc-фрагментом α-спиральным линкером в соответствии с настоящим изобретением.Although the above results were found for a fusion protein containing domain III of the CCN protein as an effector protein, it is believed that the beneficial reduced aggregation propensity and protease resistance effects are also achieved by combining other effector molecules with the Fc fragment of the α-helical linker according to the present invention.
Согласно настоящему изобретению, соответственно, предложен слитый с Fc белок, содержащий Fc-фрагмент, который содержит последовательность пептидного линкера формулы АK1-АK2-(ЕАААK)n-АK3-АK4-АK5, где n≥4, между Fc-фрагментом и эффекторной молекулой, и где аминокислоты АK1, АK2, АK3, АK4, АK5 независимым образом отсутствуют или представляют собой аминокислоту. Линкер может быть размещен на N-конце или С-конце Fc-фрагмента. В соответствии с одним вариантом реализации n равен 8. Согласно другому варианту реализации АK1 представляет собой треонин (Т), АK1, АK2, АK3, АK4 и АK5 представляют собой Ala (А). В соответствии с одним вариантом реализации линкер для вышеуказанного Fc-слитого белка выбран из группы, состоящей из SEQ ID NO: 22, SEQ ID NO: 23, SEQ ID NO: 24 и SEQ ID NO: 25. В частности, было показано, что применение слитого белка в соответствии с настоящим изобретением, содержащего линкер, состоящий из (ЕАААK)-повтора, т.е. такой как (ЕАААK)n, где n равен 8, благоприятным образом приводит к меньшей агрегации.According to the present invention, there is accordingly provided an Fc fusion protein comprising an Fc fragment which comprises a peptide linker sequence of the formula AK1-AK2-(EAAAK)n-AK3-AK4-AK5, where n≥4, between the Fc fragment and the effector molecule, and wherein the amino acids AK1, AK2, AK3, AK4, AK5 are independently absent or represent an amino acid. The linker can be located at the N-terminus or the C-terminus of the Fc fragment. According to one embodiment, n is 8. According to another embodiment, AK1 is threonine (T), AK1, AK2, AK3, AK4 and AK5 are Ala (A). According to one embodiment, the linker for the above-mentioned Fc fusion protein is selected from the group consisting of SEQ ID NO: 22, SEQ ID NO: 23, SEQ ID NO: 24 and SEQ ID NO: 25. In particular, it has been shown that the use of a fusion protein according to the present invention comprising a linker consisting of an (EAAAK) repeat, i.e. such as (EAAAK)n, where n is 8, advantageously leads to less aggregation.
Альтернативный линкер, который можно применять в соответствии с настоящим изобретением, представляет собой линкер с последовательностью аминокислот, представленной в SEQ ID NO: 20 (TEGRMD).An alternative linker that can be used in accordance with the present invention is a linker with the amino acid sequence shown in SEQ ID NO: 20 (TEGRMD).
Согласно одному варианту реализации настоящее изобретение может, соответственно, предусматривать включение линкерного пептида между партнером для слияния и доменом III на CCN5 (например, SEQ ID NO: 1 - SEQ ID NO: 12, 37 или 38). Неограничивающие примеры слитых белков, содержащих линкер из SEQ ID NO: 20, представлены в SEQ ID NO: 28, SEQ ID NO: 29 и SEQ ID NO: 30, соответственно.According to one embodiment, the present invention may accordingly provide for the inclusion of a linker peptide between the fusion partner and domain III of CCN5 (e.g., SEQ ID NO: 1 to SEQ ID NO: 12, 37, or 38). Non-limiting examples of fusion proteins comprising the linker of SEQ ID NO: 20 are provided in SEQ ID NO: 28, SEQ ID NO: 29, and SEQ ID NO: 30, respectively.
В том случае, когда согласно изобретению используют вариант реализации домена III CCN5, генетически слитый на N-конце с пептидным линкером (как в SEQ ID NO 20) и Fc-фрагментом IgG подтипа IgG4, включающим следующие мутации (S228P, F234A, L235A, K447-, Eu-нумерация) (как в SEQ ID NO 15), полная последовательность соответствует SEQ ID NO: 28, также обозначаемой CCN5(dIII)-Fcv2.In the case where the invention uses a variant of the implementation of domain III of CCN5, genetically fused at the N-terminus with a peptide linker (as in SEQ ID NO 20) and an Fc fragment of IgG of the IgG4 subtype, comprising the following mutations (S228P, F234A, L235A, K447-, Eu-numbering) (as in SEQ ID NO 15), the complete sequence corresponds to SEQ ID NO: 28, also designated CCN5(dIII)-Fcv2.
В том случае, когда согласно изобретению используют вариант реализации домена III CCN5, генетически слитый на N-конце с пептидным линкером (как в SEQ ID NO: 20) и Fc-фрагментом IgG подтипа IgG4, включающим следующие мутации (S228P, Е233Р, F234V, L235A, G236-, K447-, Eu-нумерация), представленным в SEQ ID NO: 18, итоговая последовательность соответствует SEQ ID NO: 29, также обозначаемой CCN5(dIII)-Fcv2.1.In the case where the invention uses a variant of the implementation of domain III of CCN5, genetically fused at the N-terminus with a peptide linker (as in SEQ ID NO: 20) and an Fc fragment of IgG of the IgG4 subtype, comprising the following mutations (S228P, E233P, F234V, L235A, G236-, K447-, Eu-numbering), presented in SEQ ID NO: 18, the resulting sequence corresponds to SEQ ID NO: 29, also designated CCN5(dIII)-Fcv2.1.
В том случае, когда согласно изобретению используют вариант реализации домена III CCN5, генетически слитый на N-конце с пептидным линкером (как в SEQ ID NO: 20) и химерным Fc-фрагментом подтипа IgG IgG2/4, представленным в SEQ ID NO: 19, итоговая последовательность соответствует SEQ ID NO: 30, также обозначаемой CCN5(dIII)-Fcv2.3.In the case where the invention uses a variant of the implementation of domain III of CCN5, genetically fused at the N-terminus with a peptide linker (as in SEQ ID NO: 20) and a chimeric Fc fragment of the IgG subtype IgG2/4, presented in SEQ ID NO: 19, the resulting sequence corresponds to SEQ ID NO: 30, also designated CCN5(dIII)-Fcv2.3.
В том случае, когда согласно изобретению используют вариант реализации домена III CCN5 (как в SEQ ID NO: 1), генетически слитый на N-конце с пептидным линкером (как в SEQ ID NO: 25) и химерным Fc-фрагментом подтипа IgG IgG2/4, представленным в SEQ ID NO: 19, итоговая последовательность соответствует SEQ ID NO: 31, также обозначаемой CCN5(dIII)-HLn8-Fcv2.3.In the case where the invention uses a variant of the embodiment of domain III of CCN5 (as in SEQ ID NO: 1), genetically fused at the N-terminus with a peptide linker (as in SEQ ID NO: 25) and a chimeric Fc fragment of the IgG subtype IgG2/4, presented in SEQ ID NO: 19, the resulting sequence corresponds to SEQ ID NO: 31, also designated CCN5(dIII)-HLn8-Fcv2.3.
В соответствии с предпочтительным вариантом реализации настоящего изобретения предложен слитый белок в соответствии с настоящим изобретением, содержащий:According to a preferred embodiment of the present invention, there is provided a fusion protein according to the present invention comprising:
1) точечную мутацию в домене III белка семейства CCN, в частности, CCN5 (см. SEQ ID NO: 7, которая приводит к пониженной протеолитической чувствительности указанного домена III;1) a point mutation in domain III of a CCN family protein, in particular CCN5 (see SEQ ID NO: 7), which results in reduced proteolytic sensitivity of said domain III;
2) сконструированную химеру Fc-фрагмента IgG4 человека и IgG2 человека (SEQ ID NO: 19, которая уменьшает протеолитическую чувствительность относительно ранее описанных остовов на основе Fc-фрагмента, используемых в слитых с Fc белках; и2) an engineered chimera of the Fc region of human IgG4 and human IgG2 (SEQ ID NO: 19, which has reduced proteolytic sensitivity relative to previously described Fc region-based scaffolds used in Fc fusion proteins; and
3) содержащий оптимизированную композицию пептидного линкера (см. SEQ ID NO: 21-25), который уменьшает протеолитическую чувствительность, усиливает биологическую активность слитого белка и уменьшает склонность к агрегации слитого белка.3) comprising an optimized peptide linker composition (see SEQ ID NO: 21-25) that reduces proteolytic sensitivity, enhances the biological activity of the fusion protein, and reduces the aggregation tendency of the fusion protein.
Согласно некоторым вариантам реализации пептидный линкер между последовательностью аминокислот по (i) и мономерным партнером для слияния имеет последовательность аминокислот, выбранную из группы, состоящей из SEQ ID NO: 20-25 или 39, или последовательность аминокислот, на 80% идентичную указанной.In some embodiments, the peptide linker between the amino acid sequence of (i) and the monomeric fusion partner has an amino acid sequence selected from the group consisting of SEQ ID NO: 20-25 or 39, or an amino acid sequence that is 80% identical thereto.
Альтернативные линкерные последовательности, которые могут применяться в соответствии с настоящим изобретением, представлены в SEQ ID NO: 57, 63, 65, 67 и 121.Alternative linker sequences that may be used in accordance with the present invention are shown in SEQ ID NOs: 57, 63, 65, 67 and 121.
Рекомбинантная экспрессияRecombinant expression
Рекомбинантные белки и слитые белки в соответствии с настоящим изобретением могут быть получены путем культивирования клетки-хозяина, позволяющей экспрессию последовательностей нуклеотидов, кодирующих указанные белки. Специалист хорошо знаком с различными доступными биотехнологическими методиками, обеспечивающими экспрессию выделенных последовательностей нуклеиновых кислот для получения рекомбинантных белков путем гетерологичной экспрессии в различных системах клеток-хозяев с применением общедоступных методик генетического конструирования и систем экспрессии рекомбинантной ДНК, см. например, источники: «Recombinant Gene Expression Protocols, Methods in Molecular Biology, 1997, Ed. Rocky S Tuan, Human Press (ISSN 1064-3745) или Sambrook et al., Molecular Cloning: A laboratory Manual (third edition), 2001, CSHL Press, (ISBN 978-087969577-4). Например, последовательности нуклеиновых кислот, кодирующие рекомбинантные белки в соответствии с настоящим изобретением, могут быть инсертированы в подходящие экспрессионные векторы, содержащие все необходимые транскрипционные и трансляционные регуляторные последовательности, специально адаптированные для направления экспрессии кодирующей последовательности нуклеиновой кислоты требуемого белка в подходящей клетке-хозяине. Подходящие экспрессионные векторы представляют собой, например, плазмиды, космиды, вирусы или искусственные дрожжевые хромосомы (YAC).The recombinant proteins and fusion proteins according to the present invention can be obtained by culturing a host cell allowing expression of nucleotide sequences encoding said proteins. The person skilled in the art is well aware of the various available biotechnological techniques providing expression of isolated nucleic acid sequences for the production of recombinant proteins by heterologous expression in various host cell systems using publicly available genetic engineering techniques and recombinant DNA expression systems, see for example the sources: "Recombinant Gene Expression Protocols, Methods in Molecular Biology, 1997, Ed. Rocky S Tuan, Human Press (ISSN 1064-3745) or Sambrook et al., Molecular Cloning: A laboratory Manual (third edition), 2001, CSHL Press, (ISBN 978-087969577-4). For example, nucleic acid sequences encoding recombinant proteins according to the present invention can be inserted into suitable expression vectors containing all necessary transcriptional and translational regulatory sequences, specially adapted to direct the expression of the coding nucleic acid sequence of the desired protein in a suitable host cell. Suitable expression vectors are, for example, plasmids, cosmids, viruses or yeast artificial chromosomes (YAC).
Последовательности ДНК, кодирующие рекомбинантные белки согласно настоящему изобретению, могут быть синтезированы с применением способов, хорошо известных специалисту, или синтезированы коммерческими поставщиками, хорошо известными специалисту, например, Genscript, Thermo Fisher Scientific и т.п.DNA sequences encoding recombinant proteins according to the present invention can be synthesized using methods well known to the skilled person or synthesized by commercial suppliers well known to the skilled person, for example, Genscript, Thermo Fisher Scientific, etc.
В соответствии с одним вариантом реализации указанного аспекта предложена молекула ДНК, содержащая последовательность нуклеиновой кислоты, представленную в SEQ ID NO: 86, 87, 90, 91, 99, 100, 104, 105, 108, 109, 112 или 113, или последовательность, по меньшей мере на 80% идентичную любой вышеупомянутой последовательности. Также предложены экспрессионные векторы, содержащие такие молекулы ДНК. В соответствии с другим вариантом реализации указанного аспекта также предложены клетки-хозяева, содержащие такие векторы.According to one embodiment of this aspect, there is provided a DNA molecule comprising a nucleic acid sequence as presented in SEQ ID NO: 86, 87, 90, 91, 99, 100, 104, 105, 108, 109, 112 or 113, or a sequence at least 80% identical to any of the above sequences. Expression vectors comprising such DNA molecules are also provided. According to another embodiment of this aspect, host cells comprising such vectors are also provided.
Последовательности ДНК для экспрессии и применения для получения рекомбинантных белков могут быть инсертированы в векторы, общеизвестные как входящие векторы, с применением системы клонирования Gateway (Esposito et al, 2009, "Gateway Cloning for Protein Expression", Methods in Molecular Biology, 498, pp.31-54). Гены, клонированные во входящий вектор, могут легко быть введены в различные экспрессионные векторы путем рекомбинации. Например, синтезированная последовательность, кодирующая рекомбинантный белок или слитый белок в соответствии с настоящим изобретением, может быть рекомбинирована путем рекомбиназного клонирования BP Gateway с получением входящего вектора, который может быть использован для размножения плазмид в подходящей клетке-хозяине, например, клетках Е. coli. Согласно предпочтительному варианту реализации используют клетки E.coli, мутированные таким образом, чтобы они позволяли эффективное размножение плазмид, такие как, например, клетки One Shot Top 10™.DNA sequences for expression and use in the production of recombinant proteins can be inserted into vectors, commonly known as entry vectors, using the Gateway cloning system (Esposito et al, 2009, "Gateway Cloning for Protein Expression", Methods in Molecular Biology, 498, pp. 31-54). Genes cloned into an entry vector can be easily introduced into various expression vectors by recombination. For example, a synthesized sequence encoding a recombinant protein or fusion protein according to the present invention can be recombined by BP Gateway recombinase cloning to obtain an entry vector that can be used to propagate plasmids in a suitable host cell, such as E. coli cells. According to a preferred embodiment, E. coli cells mutated in such a way that they allow efficient propagation of plasmids are used, such as, for example, One Shot Top 10™ cells.
В соответствии с одним вариантом реализации настоящего изобретения получают экспрессионный вектор, содержащий последовательность ДНК, кодирующую рекомбинантный белок или слитый белок в соответствии с настоящим изобретением, функционально связанный с промотором. Специалисту будет понятно, что «промотор» в настоящей заявке относится к области ДНК, расположенной выше (в направлении 5') относительно кодирующей последовательности ДНК, которая контролирует и инициирует транскрипцию конкретного гена. Промотор контролирует распознавание и связывание РНК-полимеразы и других белков для инициации транскрипции. «Функционально связанный» относится к функциональной связи между промотором и второй последовательностью, когда последовательность промотора инициирует и опосредует транскрипцию последовательности ДНК, соответствующих второй последовательности. В общем случае «функционально связанный» означает, что связанные последовательности нуклеиновых кислот расположены непрерывно.According to one embodiment of the present invention, an expression vector is provided comprising a DNA sequence encoding a recombinant protein or fusion protein of the present invention operably linked to a promoter. It will be understood by one skilled in the art that a "promoter" as used herein refers to a region of DNA located upstream (in the 5' direction) of a coding DNA sequence that controls and initiates transcription of a particular gene. A promoter controls the recognition and binding of RNA polymerase and other proteins to initiate transcription. "Operably linked" refers to a functional relationship between a promoter and a second sequence wherein the promoter sequence initiates and mediates transcription of a DNA sequence corresponding to the second sequence. In general, "operably linked" means that the linked nucleic acid sequences are contiguous.
Входящий вектор, а также экспрессионный вектор, такой как полученный из принимающего вектора, упоминаемого ниже, может быть выделен с применением стандартных методик выделения плазмид, хорошо известных специалисту, например, с применением набора QIAprep™ Spin Miniprep от Qiagen™ или набора QIAGEN™ Plasmid Plus Maxi Kit.The input vector, as well as the expression vector, such as that derived from the receiving vector mentioned below, can be isolated using standard plasmid isolation techniques well known to those skilled in the art, for example using the QIAprep™ Spin Miniprep Kit from Qiagen™ or the QIAGEN™ Plasmid Plus Maxi Kit.
Если используют входящий вектор, содержащий последовательность ДНК, кодирующую рекомбинантный белок или слитый белок в соответствии с настоящим изобретением, указанный входящий вектор может быть дополнительно рекомбинирован с принимающим вектором с применением рекомбиназы LR Gateway для получения экспрессионного вектора. Экспрессионный вектор может затем быть использован для экспрессии кодирующей белок последовательности ДНК в подходящей клетке-хозяине. Неограничивающий пример применимого принимающего вектора представлен, например, pUCOE-DHFR-DEST согласно описанию в источнике: et al., J. Biol. Chem, 293:46, pp.17953-17970.If an input vector containing a DNA sequence encoding a recombinant protein or fusion protein according to the present invention is used, said input vector can be further recombined with a host vector using LR Gateway recombinase to obtain an expression vector. The expression vector can then be used to express the protein-encoding DNA sequence in a suitable host cell. A non-limiting example of a suitable host vector is, for example, pUCOE-DHFR-DEST as described in the source: et al., J. Biol. Chem, 293:46, pp.17953-17970.
Также итоговый экспрессионный вектор может быть верифицирован с использованием стандартного анализа с расщеплением рестрикционными ферментами и гель-электрофорезаThe final expression vector can also be verified using standard restriction enzyme digestion and gel electrophoresis analysis.
ДНК.DNA.
В соответствии с одним аспектом настоящего изобретения предложен экспрессионный вектор, содержащий последовательность нуклеиновой кислоты, кодирующую рекомбинантный белок формулы (I). В соответствии с еще одним аспектом настоящего изобретения предложен экспрессионный вектор, содержащий последовательность нуклеиновой кислоты, кодирующую белок, содержащий последовательность аминокислот, выбранную из группы, состоящей из SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7 и SEQ ID NO: 8-12, 37, 38, 84, 85, 88, 89, 97, 98, 102, 103, 106, 107, 110 и 111; и их фрагментов или вариантов по меньшей мере с 50% идентичностью последовательностей последовательностям аминокислот SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, и SEQ ID NO: 7, SEQ ID NO:8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 37 и SEQ ID NO: 38; и SEQ ID NO: 84,85, 88, 89, 97,98, 102, 103, 106, 107, 110 и 111.According to one aspect of the present invention, there is provided an expression vector comprising a nucleic acid sequence encoding a recombinant protein of formula (I). According to another aspect of the present invention, there is provided an expression vector comprising a nucleic acid sequence encoding a protein comprising an amino acid sequence selected from the group consisting of SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7 and SEQ ID NO: 8-12, 37, 38, 84, 85, 88, 89, 97, 98, 102, 103, 106, 107, 110 and 111; and fragments or variants thereof with at least 50% sequence identity to the amino acid sequences of SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, and SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 37 and SEQ ID NO: 38; and SEQ ID NO: 84, 85, 88, 89, 97, 98, 102, 103, 106, 107, 110 and 111.
Согласно другому аспекту предложен экспрессионный вектор, кодирующий рекомбинантный белок, содержащий последовательность аминокислот по меньшей мере с 60%, 70%, 80%, 90% или 95% идентичностью последовательностей последовательности аминокислот, выбранной из группы, состоящей из SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 37 и SEQ ID NO: 38, и SEQ ID NO: 84, 85, 88, 89, 97, 98, 102, 103, 106, 107, ПО и 111.According to another aspect, there is provided an expression vector encoding a recombinant protein comprising an amino acid sequence with at least 60%, 70%, 80%, 90% or 95% sequence identity to an amino acid sequence selected from the group consisting of SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 37 and SEQ ID NO: 38, and SEQ ID NO: 84, 85, 88, 89, 97, 98, 102, 103, 106, 107, 111 and 111.
В соответствии с вариантом реализации настоящего изобретения предложены экспрессионные векторы, кодирующие слитый белок в соответствии с настоящим изобретением.According to an embodiment of the present invention, expression vectors encoding a fusion protein according to the present invention are provided.
Специалисту хорошо известно о вырожденности генетического кода, и предпочтительном использовании конкретных кодонов в различных организмах. Соответственно, в зависимости от выбора клетки-хозяина, последовательность нуклеиновой кислоты, кодирующая рекомбинантный белок и слитые белки согласно настоящему изобретению, может быть адаптирована так, чтобы содержать предпочтительные для клетки-хозяина кодоны. Соответственно, аминокислоты белков согласно настоящему изобретению может кодировать любая комбинация кодонов из представленных в таблице ниже:The skilled person is well aware of the degeneracy of the genetic code and the preferred use of specific codons in different organisms. Accordingly, depending on the choice of host cell, the nucleic acid sequence encoding the recombinant protein and fusion proteins according to the present invention can be adapted to contain codons preferred by the host cell. Accordingly, the amino acids of the proteins according to the present invention can be encoded by any combination of codons from those presented in the table below:
Предпочтительно указанные кодоны дополнительно оптимизированы для высоких уровней экспрессии в соответствии с выбранной клеткой-хозяином.Preferably, said codons are further optimized for high expression levels in accordance with the selected host cell.
Для экспрессии белков с помощью технологии рекомбинантной ДНК, в дополнение к конкретному варианту реализации настоящего изобретения к N-концу последовательности белка предпочтительно добавляют последовательность ДНК, кодирующую сигнальный пептид. Сигнальный пептид может служить для направленной локализации слитого белка во время и/или после синтеза в клетке-хозяине. Он может, соответственно, представлять собой последовательность, направляющую секрецию слитого белка. Применение таких последовательностей сигнальных пептидов хорошо известно в данной области техники. Сигнальный пептид может быть представлен любой формой, например, может представлять собой сигнальный пептид IgGk-цепи, или может представлять собой сигнальный пептид из сывороточного альбумина человека (SEQ ID. NO 32).For the expression of proteins by recombinant DNA technology, in addition to a particular embodiment of the present invention, a DNA sequence encoding a signal peptide is preferably added to the N-terminus of the protein sequence. The signal peptide may serve to direct the localization of the fusion protein during and/or after synthesis in the host cell. It may accordingly be a sequence directing the secretion of the fusion protein. The use of such signal peptide sequences is well known in the art. The signal peptide may be in any form, for example, it may be a signal peptide of an IgGk chain, or it may be a signal peptide from human serum albumin (SEQ ID. NO 32).
В том случае, когда сигнальным пептидом из сывороточного альбумина человека (SEQ ID №32) дополнен N-конец SEQ ID NO: 28, последовательность белка для экспрессии может соответствовать SEQ ID NO: 33 или SEQ ID NO: 85, 89, 98, 103, 107 или 111.In the case where the signal peptide from human serum albumin (SEQ ID NO: 32) is added to the N-terminus of SEQ ID NO: 28, the protein sequence for expression may correspond to SEQ ID NO: 33 or SEQ ID NO: 85, 89, 98, 103, 107 or 111.
Кроме того, для экспрессии белка с помощью технологии рекомбинантной ДНК, в соответствии с одним конкретным вариантом реализации настоящего изобретения, белком, имеющим последовательность аминокислот, представленную в SEQ ID NO: 33, может применяться последовательность нуклеотидов, представленная в SEQ ID NO: 34 или SEQ ID NO: 86, 90, 99, 104, 108 или 112, где 3'-конец кодирующей последовательности дополнен трансляционным стоп-кодоном.In addition, for the expression of a protein using recombinant DNA technology, according to one specific embodiment of the present invention, a protein having the amino acid sequence presented in SEQ ID NO: 33 can be expressed using a nucleotide sequence presented in SEQ ID NO: 34 or SEQ ID NO: 86, 90, 99, 104, 108 or 112, wherein the 3' end of the coding sequence is supplemented with a translational stop codon.
В том случае, когда вариантом реализации изобретения является последовательность нуклеотидов из SEQ ID. NO: 34, указанная последовательность нуклеотидов предпочтительно дополнена непосредственно на 5'-конце кодирующей последовательности последовательностью KOZAK, например, GCCACC, как в SEQ ID NO: 35 или SEQ ID NO: 86, 90, 99, 104, 108 или 112. Последовательность ДНК может дополнительно быть фланкирована ДНК-элементами, позволяющими субклонирование, например, такими как рекомбиназные сайты attB Gateway. Однако для получения последовательности ДНК и облегчения субклонирования в экспрессионный вектор могут быть использована любая стратегия клонирования или синтеза. В том случае, когда последовательность ДНК включает рекомбиназные сайты Gateway, позволяющие субклонирование, последовательность нуклеотидов может соответствовать представленной в SEQ ID NO 36 или SEQ ID NO: 87, 91, 100, 105, 109 или 113.In the case where the embodiment of the invention is the nucleotide sequence of SEQ ID NO: 34, said nucleotide sequence is preferably complemented immediately at the 5' end of the coding sequence by a KOZAK sequence, for example GCCACC, as in SEQ ID NO: 35 or SEQ ID NO: 86, 90, 99, 104, 108 or 112. The DNA sequence may further be flanked by DNA elements allowing subcloning, such as, for example, the attB Gateway recombinase sites. However, any cloning or synthetic strategy may be used to obtain the DNA sequence and facilitate subcloning into an expression vector. In the case where the DNA sequence includes Gateway recombinase sites allowing subcloning, the nucleotide sequence may correspond to that presented in SEQ ID NO 36 or SEQ ID NO: 87, 91, 100, 105, 109 or 113.
Полученный экспрессионный вектор, включающий последовательность нуклеиновой кислоты, кодирующую рекомбинантный белок или слитый белок согласно настоящему изобретению, может быть введен в подходящие клетки-хозяева для продуцирования требуемого белка. Могут применяться различные коммерчески доступные или самостоятельно полученные клетки-хозяева. Например, экспрессионный вектор может быть перенесен в эукариотические клетки-хозяева, такие как клетки СНО, например, адаптированные к суспензионной культуре клетки СНО DG44 DHFR (дигидрофолатредуктаза-/-). Трансфекция клеток-хозяев экспрессионным вектором может быть выполнена с применением способов, хорошо известных специалисту, например, с применением электропорации.The resulting expression vector comprising a nucleic acid sequence encoding a recombinant protein or fusion protein according to the present invention can be introduced into suitable host cells to produce the desired protein. Various commercially available or home-made host cells can be used. For example, the expression vector can be transferred to eukaryotic host cells such as CHO cells, for example, suspension culture-adapted CHO DG44 DHFR (dihydrofolate reductase -/- ) cells. Transfection of host cells with the expression vector can be performed using methods well known to those skilled in the art, for example, using electroporation.
При культивировании клеток-хозяев в подходящей культуральной среде будут продуцироваться рекомбинантные белки или слитые белки в соответствии с настоящим изобретением, кодируемые экспрессионным вектором в клетка-хозяине, и итоговый белок может быть собран и очищенный с применением способов, хорошо известных специалисту.Upon culturing the host cells in a suitable culture medium, the recombinant proteins or fusion proteins of the present invention encoded by the expression vector will be produced in the host cell, and the resulting protein can be collected and purified using methods well known to those skilled in the art.
Экспрессионный вектор может включать сигнальные последовательности, общеизвестные как «сигнальный пептид», для секреции экспрессированного белка или слитого белка в культуральную среду.The expression vector may include signal sequences, commonly known as a "signal peptide," for secretion of the expressed protein or fusion protein into the culture medium.
Для выделения и очищения секретированного рекомбинантного белка из клеточной культуральной среды обычно проводят один или более этапов предварительной обработки или очищения, в первую очередь для удаления больших частиц и биомассы. Неограничивающие примеры применимых этапов предварительной обработки представлены, например, обратным осмосом, центрифугированием, методами фильтрации и диафильтрации, или их комбинацией. Затем полученный белок обычно очищают с помощью одного или более из различных хроматографических методов, хорошо известных специалисту, например, аффинной хроматографии, ионообменной хроматографии, хроматографии со смешанным режимом, хроматографии гидрофобного взаимодействия, эксклюзионной хроматографии или других хроматографических техник, или их комбинации.To isolate and purify the secreted recombinant protein from the cell culture medium, one or more pretreatment or purification steps are typically performed, primarily to remove large particles and biomass. Non-limiting examples of suitable pretreatment steps include, for example, reverse osmosis, centrifugation, filtration and diafiltration methods, or a combination thereof. The resulting protein is then typically purified using one or more of a variety of chromatographic techniques well known to those skilled in the art, such as affinity chromatography, ion exchange chromatography, mixed mode chromatography, hydrophobic interaction chromatography, size exclusion chromatography, or other chromatographic techniques, or a combination thereof.
Например, рекомбинантный белок или слитый белок, экспрессируемый подходящей клеткой-хозяином, может быть очищен с применением метода аффинной хроматографии, например, с применением сред MabSelect™ SuRe™, например, на колонке на 5 мл HiTrap MabSelect™ SuRe™, установленной в систему для высокопроизводительной жидкостной хроматографии, например, систему BioRad NGC Discover™ 10 Pro, оснащенную проточной кюветой для УФ-детекции с длиной оптического пути 5 мм. После загрузки образца, содержащего белок для очищения, колонку обычно промывают один или более раз одним или более применимыми промывочными буферами, после чего белок элюируют с использованием подходящего элюирующего буфера. Полученный белок может быть дополнительно очищен одним или более из перечисленных выше хроматографических способов.For example, a recombinant protein or fusion protein expressed by a suitable host cell can be purified using an affinity chromatography method, such as using MabSelect™ SuRe™ media, such as on a 5 ml HiTrap MabSelect™ SuRe™ column mounted on a high performance liquid chromatography system, such as a BioRad NGC Discover™ 10 Pro system equipped with a 5 mm pathlength UV detection flow cell. After loading a sample containing the protein to be purified, the column is typically washed one or more times with one or more suitable wash buffers, after which the protein is eluted using a suitable elution buffer. The resulting protein can be further purified using one or more of the chromatographic methods listed above.
Следует понимать, что различные модификации могут быть введены в последовательности нуклеиновых кислот, кодирующие рекомбинантные белки согласно настоящему изобретению, с использованием методик, хорошо известных специалисту, например, для облегчения экспрессии. Путем применения направленного мутагенеза можно ввести модификацию для адаптации кодирующей последовательности к нужному хозяину, используемому для экспрессии последовательности и, соответственно, продуцирования рекомбинантного белка. Специалисту хорошо известно о существовании специфичных для хозяев кодонов, и о том, что адаптация гетерологичной последовательности нуклеиновой кислоты с включением специфичных для хозяев кодонов повышает эффективность экспрессии, как упоминалось выше. Могут также быть введены другие модификации, например, для облегчения выделения и очищения, т.е. путем добавления последовательности, кодирующей пептид или белок, подходящие для таких целей. Также к последовательностям нуклеиновых кислот согласно настоящему изобретению могут быть дополнительно присоединены последовательности нуклеиновых кислот, кодирующие сигнальный пептид, обеспечивающий секрецию требуемого рекомбинантного белка из клетки-хозяина.It will be appreciated that various modifications can be introduced into the nucleic acid sequences encoding the recombinant proteins of the present invention using techniques well known to those skilled in the art, for example to facilitate expression. By using site-directed mutagenesis, a modification can be introduced to adapt the coding sequence to the desired host used to express the sequence and, accordingly, produce the recombinant protein. The existence of host-specific codons is well known to those skilled in the art and that adaptation of a heterologous nucleic acid sequence to include host-specific codons increases the expression efficiency, as mentioned above. Other modifications can also be introduced, for example to facilitate isolation and purification, i.e. by adding a sequence encoding a peptide or protein suitable for such purposes. Also, nucleic acid sequences encoding a signal peptide that ensures the secretion of the desired recombinant protein from the host cell can be additionally linked to the nucleic acid sequences of the present invention.
Согласно настоящему изобретению также предложена клетка-хозяин, подходящая для продуцирования рекомбинантного белка или слитого белка в соответствии с настоящим изобретением. Могут применяться различные коммерчески доступные клетки-хозяева, конкретным образом адаптированные для продуцирования рекомбинантных белков, как прокариотические клетки-хозяева, так и эукариотические клетки-хозяева. Неограничивающими примерами подходящих клеток-хозяев являются, например, клетки СНО, клетки НЕК293, клетки Pichia pastoris, клетки NS0 или клетки Е. coli.The present invention also provides a host cell suitable for producing a recombinant protein or a fusion protein according to the present invention. Various commercially available host cells specifically adapted for producing recombinant proteins can be used, both prokaryotic host cells and eukaryotic host cells. Non-limiting examples of suitable host cells are, for example, CHO cells, HEK293 cells, Pichia pastoris cells, NS0 cells or E. coli cells.
Наконец, настоящее изобретение также относится к домену гомологии к повторам тромбоспондина типа 1 (TSP-1) белка семейства CCN, и к слитому белку, содержащему указанный домен гомологии к повторам TSP-1 для применения в качестве медикамента для лечения или предотвращения расстройств путем ингибирования или противодействия клеточной сигнализации и физиологическим функциям клетки, приписываемым белкам семейства CCN.Finally, the present invention also relates to a thrombospondin type 1 (TSP-1) repeat homology domain of a CCN family protein, and to a fusion protein comprising said TSP-1 repeat homology domain for use as a medicament for treating or preventing disorders by inhibiting or counteracting cell signaling and physiological functions of a cell attributed to CCN family proteins.
Согласно одному аспекту настоящего изобретения предложен белок, например, слитый белок согласно определению в настоящей заявке, для применения в терапии.According to one aspect of the present invention, there is provided a protein, for example a fusion protein as defined herein, for use in therapy.
Согласно некоторым аспектам указанный белок, например, слитый белок, может быть предназначен для применения при лечении или предотвращении фиброза, или любого состояния, при котором наблюдается фиброз (т.е. любого фибротического состояния или расстройства). Фиброз может влиять на любую ткань или орган, в том числе, например, на легкие, глаз, сердце, скелетные мышцы, брюшину, почки, печень, поджелудочную железу, желчные протоки, кожу, кровеносные сосуды или более глобальные системы. В частности, состояние, при котором проявляется фиброз, может быть выбрано из фиброза легких, который может быть любой этиологии, в том числе идиопатического фиброза легких, бронхолегочной дисплазии, фиброза сетчатки, диабетической ретинопатии, возрастной макулярной дегенерации, отслоения сетчатки, индуцированной кислородом ретинопатии, глаукомы, сердечного фиброза, фиброза трансплантата после трансплантации, ассоциированного с кардиомиопатией фиброза, мышечного фиброза, мышечной дистрофии Дюшенна, перитонеального фиброза, диабетической нефропатии, хронической болезни почек (фиброза почек), острого повреждения почек, тубулоинтерстициального фиброза, хронической нефропатии аллотрансплантата, фиброза печени, неалкогольного стеатогепатита, жировой болезни печени, хронического панкреатита, билиарного фиброза, келоидов, рубцов, системного склероза, атеросклероза, эпидурального фиброза.In some aspects, the protein, such as a fusion protein, may be for use in treating or preventing fibrosis, or any condition in which fibrosis occurs (i.e., any fibrotic condition or disorder). Fibrosis may affect any tissue or organ, including, for example, the lungs, eye, heart, skeletal muscle, peritoneum, kidney, liver, pancreas, bile ducts, skin, blood vessels, or more global systems. In particular, the condition in which fibrosis is manifested may be selected from pulmonary fibrosis, which may be of any etiology, including idiopathic pulmonary fibrosis, bronchopulmonary dysplasia, retinal fibrosis, diabetic retinopathy, age-related macular degeneration, retinal detachment, oxygen-induced retinopathy, glaucoma, cardiac fibrosis, post-transplant graft fibrosis, cardiomyopathy-associated fibrosis, muscular fibrosis, Duchenne muscular dystrophy, peritoneal fibrosis, diabetic nephropathy, chronic kidney disease (renal fibrosis), acute kidney injury, tubulointerstitial fibrosis, chronic allograft nephropathy, liver fibrosis, non-alcoholic steatohepatitis, fatty liver disease, chronic pancreatitis, biliary fibrosis, keloids, scars, systemic sclerosis, atherosclerosis, epidural fibrosis.
В контексте сердечного фиброза состояния, подлежащие лечению или предотвращению, могут включать гипертрофию сердца и сердечную недостаточность с сохраненной фракцией выброса или без нее.In the context of cardiac fibrosis, conditions to be treated or prevented may include cardiac hypertrophy and heart failure with or without preserved ejection fraction.
Согласно дополнительному аспекту настоящего изобретения предложен белок, например, слитый белок согласно определению в настоящей заявке, для применения в лечении воспалительного или аутоиммунного заболевания. Согласно некоторым вариантам реализации указанное воспалительное заболевание выбрано из ревматоидного артрита, амиотрофического бокового склероза (ALS), воспалительного заболевания кишечника, язвенного колита, болезни Крона.According to a further aspect of the present invention, there is provided a protein, for example a fusion protein as defined herein, for use in the treatment of an inflammatory or autoimmune disease. According to some embodiments, said inflammatory disease is selected from rheumatoid arthritis, amyotrophic lateral sclerosis (ALS), inflammatory bowel disease, ulcerative colitis, Crohn's disease.
Согласно дополнительному аспекту настоящего изобретения предложен белок, например, слитый белок согласно определению в настоящей заявке, для применения при лечении рака. В этом отношении известно, что 4-доменные белки CCN могут как вызывать онкогенные ответы в выделенных раковых клетках, так и способствовать метастазированию, хеморезистентности и устойчивости к иммунотерапии, воздействуя прямо на раковые клетки или на строму опухоли. Активность белков согласно настоящему изобретению, относящаяся к ингибированию эффекта или активности 4-доменного белка CCN, соответственно, является обоснованием для их применения в лечении рака. Рак может представлять собой любое злокачественное или предзлокачественное неопластическое состояние. Это может быть рак любой ткани или любого органа. В одном из вариантов реализации рак может проявляться в виде солидных опухолей. Согласно другому варианту реализации рак может представлять собой рак системы кроветворения или находиться в системе кроветворения. Он может представлять собой первичный рак или вторичный рак, или метастазы. Рак может, соответственно, представлять собой рак поджелудочной железы, молочной железы, предстательной железы, шейки матки, яичников, печени, мочевого пузыря, мозга, крови, костей, кожи, легких или желудка. Согласно некоторым вариантам реализации рак выбран из рака поджелудочной железы, аденокарциномы протоков поджелудочной железы, рака молочной железы, рака предстательной железы, рака шейки матки, рака яичника, рака печени, гепатоцеллюлярной карциномы, уротелиального рака мочевого пузыря, рака головного мозга, глиобластомы, острого лимфобластного лейкоза, остеосаркомы, меланомы, мезотелиомы, рака желудка, плоскоклеточной карциномы полости рта, рака пищевода, рака ободочной и прямой кишки, рака легкого.According to a further aspect of the present invention, there is provided a protein, for example a fusion protein as defined herein, for use in the treatment of cancer. In this regard, it is known that CCN 4-domain proteins can both induce oncogenic responses in isolated cancer cells and promote metastasis, chemoresistance and resistance to immunotherapy by acting directly on cancer cells or on the tumor stroma. The activity of the proteins according to the present invention related to the inhibition of the effect or activity of a CCN 4-domain protein, respectively, is the rationale for their use in the treatment of cancer. Cancer can be any malignant or pre-malignant neoplastic condition. It can be a cancer of any tissue or any organ. In one embodiment, cancer can manifest itself as solid tumors. According to another embodiment, cancer can be a cancer of the hematopoietic system or be in the hematopoietic system. It can be a primary cancer or a secondary cancer, or metastases. The cancer may, respectively, be a pancreatic, breast, prostate, cervical, ovarian, liver, bladder, brain, blood, bone, skin, lung, or stomach cancer. According to some embodiments, the cancer is selected from pancreatic cancer, pancreatic duct adenocarcinoma, breast cancer, prostate cancer, cervical cancer, ovarian cancer, liver cancer, hepatocellular carcinoma, urothelial bladder cancer, brain cancer, glioblastoma, acute lymphoblastic leukemia, osteosarcoma, melanoma, mesothelioma, gastric cancer, oral squamous cell carcinoma, esophageal cancer, colorectal cancer, lung cancer.
Согласно дополнительному аспекту настоящего изобретения предложен белок, например, слитый белок согласно определению в настоящей заявке, для применения при лечении метаболического заболевания. Указанное метаболическое заболевание может представлять собой или может быть ассоциировано с инсулинорезистентностью или нарушением толерантности к глюкозе. Согласно некоторым вариантам реализации указанное метаболическое заболевание выбрано из диабета 2 типа и метаболического синдрома.According to a further aspect of the present invention, there is provided a protein, for example a fusion protein as defined herein, for use in the treatment of a metabolic disease. Said metabolic disease may be or may be associated with insulin resistance or impaired glucose tolerance. According to some embodiments, said metabolic disease is selected from type 2 diabetes and metabolic syndrome.
Слитый белок согласно настоящему изобретению может также применяться согласно описанным выше способам лечения состояний. Аналогичным образом, слитый белок согласно настоящему изобретению может применяться в способах изготовления медикамента для применения в лечении состояний, описанных выше.The fusion protein of the present invention may also be used in the above-described methods for treating conditions. Similarly, the fusion protein of the present invention may be used in methods for preparing a medicament for use in treating the conditions described above.
ПРИМЕРЫEXAMPLES
Пример 1Example 1
Экспрессия слитого белка в соответствии с настоящим изобретениемExpression of a fusion protein according to the present invention
В этом примере описано получение слитого белка, содержащего аминокислоты 194-246 CCN5 (SEQ ID NO: 1), слитого на N-конце с пептидным линкером (SEQ ID NO: 20) и Fc-фрагментом IgG подкласса IgG4 из SEQ ID NO: 15 (S228P, F234A, L235A, K447-, Eu-нумерация) (CCN5(dIII)-Fcv2) (т.е. слитого белка в соответствии с SEQ ID NO: 28). Указанный слитый белок также был дополнен N-концевой сигнальной последовательностью, происходящей из альбумина из SEQ ID NO: 32, и экспрессирован в клетках млекопитающих согласно описанию ниже.This example describes the production of a fusion protein comprising amino acids 194-246 of CCN5 (SEQ ID NO: 1) fused at the N-terminus to a peptide linker (SEQ ID NO: 20) and the Fc fragment of IgG subclass IgG4 of SEQ ID NO: 15 (S228P, F234A, L235A, K447-, Eu-numbering) (CCN5(dIII)-Fcv2) (i.e., the fusion protein according to SEQ ID NO: 28). Said fusion protein was also supplemented with an N-terminal signal sequence derived from albumin of SEQ ID NO: 32 and expressed in mammalian cells as described below.
Последовательность ДНК, представленную в последовательности SEQ ID NO: 36, синтезировал и верифицировал коммерческий поставщик. Синтезированная последовательность была рекомбинирована с pDonrZeo путем рекомбиназного клонирования BP Gateway для создания входящего вектора. После трансфекции компетентных E.coli, мутированных так, чтобы позволять эффективное размножение плазмид (клетки One Shot Тор10™), выделяли входящий вектор с помощью стандартных методик выделения плазмид с применением набора QIAprep™ Spin Miniprep от Qiagen™. После выделения плазмиды входящий вектор верифицировали путем расщепления рестрикционными ферментами с последующим гель-электрофорезом ДНК в соответствии со стандартными методиками, хорошо известными специалисту.The DNA sequence shown as SEQ ID NO: 36 was synthesized and verified by a commercial supplier. The synthesized sequence was recombined with pDonrZeo by BP Gateway recombinase cloning to generate the entry vector. Following transfection of competent E. coli mutated to allow efficient plasmid propagation (One Shot Top10™ cells), the entry vector was isolated using standard plasmid isolation techniques using the QIAprep™ Spin Miniprep Kit from Qiagen™. Following plasmid isolation, the entry vector was verified by restriction enzyme digestion followed by DNA gel electrophoresis according to standard techniques well known to those skilled in the art.
Затем входящий вектор, содержащий последовательность SEQ ID NO: 35, рекомбинировали с принимающим вектором с применением рекомбиназы LR Gateway. Использовали принимающий вектор pUCOE-DHFR-DEST согласно описанию Kaasb0ll и соавторов, 2018, см. выше.The input vector containing the sequence SEQ ID NO: 35 was then recombined with the receiving vector using LR Gateway recombinase. The receiving vector used was pUCOE-DHFR-DEST as described by Kaasb0ll et al., 2018, see above.
После трансфекции компетентных E.coli, мутированных так, чтобы позволять эффективное размножение плазмид (клетки One Shot Top 10™), экспрессионный вектор выделяли с помощью стандартных методик выделения плазмид с применением набора QIAGEN™ Plasmid Plus Maxi Kit. Итоговый экспрессионный вектор верифицировали с помощью стандартного расщепления рестрикционными ферментами и гель-электрофореза ДНК в соответствии со стандартными методиками, хорошо известными специалисту. Итоговый экспрессионный вектор затем переносили в адаптированные к суспензионной культуре клетки СНО ExpiCHO в соответствии с протоколом «Мах Titer» от изготовителя набора для трансфекции СНО Expifectamine™ (Gibco кат. №: А29129) и кратким описанием и соавторов, 2018, выше. Клетки осаждали через 6 дней после трансфекции центрифугированием при 4750g в течение 20 минут при 4°С и собирали супернатант клеточной культуральной среды. Добавляли 0,1М ПМСФ в 100% изопропаноле до концентрации 1 мМ и 0,5М ЭДТК до концентрации 2 мМ. Затем добавляли 96% этанол до конечной концентрации приблизительно 3%. Перед хроматографическим очищением добавляли 1М TrisHCl с рН 7,4 до конечной концентрации 25 мМ.Following transfection of competent E. coli mutated to allow efficient propagation of the plasmids (One Shot Top 10™ cells), the expression vector was isolated using standard plasmid isolation techniques using the QIAGEN™ Plasmid Plus Maxi Kit. The resulting expression vector was verified by standard restriction enzyme digestion and DNA gel electrophoresis according to standard techniques well known to those skilled in the art. The resulting expression vector was then transformed into suspension-adapted CHO ExpiCHO cells according to the Max Titer protocol from the manufacturer of the CHO Expifectamine™ Transfection Kit (Gibco Cat. No.: A29129) and a brief description of the et al., 2018, supra. Cells were pelleted 6 days post-transfection by centrifugation at 4750g for 20 min at 4°C, and the cell culture medium supernatant was collected. 0.1 M PMSF in 100% isopropanol was added to a concentration of 1 mM and 0.5 M EDTA to a concentration of 2 mM. Then 96% ethanol was added to a final concentration of approximately 3%. Before chromatographic purification, 1 M TrisHCl, pH 7.4, was added to a final concentration of 25 mM.
Этап захвата при очищении выполняли путем аффинной хроматографии на хроматографической среде с белком А. В этом эксперименте использовали среду rProtein А FF (GE Healthcare). Колонку HiTrap ™ rProtein A FF на 5 мл (GE Healthcare) использовали для очищения экспрессированного рекомбинантного белка из 60 мл клеточной культуральной среды, собранной и дополненной согласно описанию, см. выше. Колонку HiTrap ™ rProtein А FF устанавливали в систему скоростной высокопроизводительной жидкостной хроматографии (систему BioRad NGC Discover™ 10 Pro), оснащенную проточной кюветой для УФ-детекции с длиной оптического пути 5 мм, и уравновешивали буфером, содержащим 25 мМ TrisHCl, рН 7,4, 25 мМ NaCl и 3% этанола. Собранную клеточную культуральную среду, содержащую рекомбинантный белок, загружали с помощью пробоотборного насоса со скоростью 2,5 мл/мин, с последующим промыванием промывочным буфером в количестве 6 объемов колонки (25 мМ TrisHCl рН 7,4, 25 мМ NaCl и 3% этанола)) до элюирования 0,1М цитратом Na, рН 3,0, в 3% этаноле. Элюат с показателем поглощения УФ на 280 нм, превышающим 100 мЕОП, собирали фракциями по 3 мл в пробирки с низким связыванием белков, предварительно заполненные 1 мл 1М TrisHCl, рН 9,0. Фракцию, содержащую пик поглощения УФ, концентрировали до 500 мкл с использованием концентратора Vivaspin® 20 мл, с номинальным отсечением по молекулярной массе 30 кДа. После концентрирования образец загружали в контур для загрузки образцов системы скоростной высокопроизводительной жидкостной хроматографии (FPLC) (система BioRad NGC Discover™ 10 Pro). Система FPLC-хроматографии была оснащена колонкой Superdex® 200 Increase 10/300 GL (GE Healthcare), которую уравновешивали 50 мМ NaCl, 20 мМ HEPES, рН 7,0. Вводили образец и колонку перфузировали буфером для предварительного уравновешивания (50 мМ NaCl, 20 мМ HEPES, рН 7,0) со скоростью потока 0,25 мл/мин. Было обнаружено, что основной пик поглощения УФ на 280 нм содержит очищенный рекомбинантный белок (CCN5(dIII)-Fcv2, SEQ ID NO: 28). Образцы собранных фракций объемом 10 мкл подвергали ДСН-ПААГ, используя готовые гели Mini-PROTEAN® TGX Stain-Free™ и выделенные рекомбинантные белки визуализировали с использованием системы визуализации ChemiDoc™ (BioRad).The capture step of the purification was performed by affinity chromatography on Protein A chromatography medium. The medium used in this experiment was rProtein A FF (GE Healthcare). A 5 ml HiTrap™ rProtein A FF column (GE Healthcare) was used to purify the expressed recombinant protein from 60 ml of cell culture medium collected and supplemented as described above. The HiTrap™ rProtein A FF column was installed on a fast high-performance liquid chromatography system (BioRad NGC Discover™ 10 Pro System) equipped with a 5 mm pathlength UV detection flow cell and equilibrated with a buffer containing 25 mM TrisHCl, pH 7.4, 25 mM NaCl, and 3% ethanol. The harvested cell culture medium containing the recombinant protein was loaded using a sample pump at 2.5 ml/min, followed by washing with 6 column volumes of wash buffer (25 mM TrisHCl pH 7.4, 25 mM NaCl and 3% ethanol) before elution with 0.1 M Na citrate, pH 3.0, in 3% ethanol. The eluate with a UV absorbance at 280 nm greater than 100 mOEDP was collected in 3 ml fractions into low protein binding tubes pre-filled with 1 ml of 1 M TrisHCl, pH 9.0. The fraction containing the UV absorbance peak was concentrated to 500 µl using a Vivaspin® 20 ml concentrator with a nominal molecular weight cut-off of 30 kDa. After concentration, the sample was loaded into the sample loading loop of a fast FPLC system (BioRad NGC Discover™ 10 Pro System). The FPLC system was equipped with a Superdex® 200 Increase 10/300 GL column (GE Healthcare) equilibrated with 50 mM NaCl, 20 mM HEPES, pH 7.0. The sample was injected and the column was perfused with pre-equilibration buffer (50 mM NaCl, 20 mM HEPES, pH 7.0) at a flow rate of 0.25 mL/min. The major UV absorbance peak at 280 nm was found to contain the purified recombinant protein (CCN5(dIII)-Fcv2, SEQ ID NO: 28). Samples of 10 µl of pooled fractions were subjected to SDS-PAGE using Mini-PROTEAN® TGX Stain-Free™ precast gels and isolated recombinant proteins were visualized using the ChemiDoc™ imaging system (BioRad).
Специалистам хорошо известно, что рекомбинантные белки могут быть получены в различных экспрессионных системах и очищены с помощью различных хроматографических способов с аналогичными результатами.It is well known to those skilled in the art that recombinant proteins can be produced in a variety of expression systems and purified using a variety of chromatographic methods with similar results.
Пример 2Example 2
Последовательность ДНК, кодирующую слитый белок, содержащий аминокислоты 194 246 CCN5 (SEQ ID NO: 1), слитый на N-конце с пептидным линкером (SEQ ID NO: 20) и Fc-фрагментом IgG подкласса IgG4 из SEQ ID NO: 15 (S228P, F234A, L235A, K447-, Eu-нумерация) (CCN5(dIII)-Fcv2) экспрессировали для продуцирования рекомбинантного белка в соответствии с SEQ ID NO: 28.A DNA sequence encoding a fusion protein comprising amino acids 194,246 of CCN5 (SEQ ID NO: 1) fused at the N-terminus to a peptide linker (SEQ ID NO: 20) and the Fc fragment of IgG subclass IgG4 from SEQ ID NO: 15 (S228P, F234A, L235A, K447-, Eu-numbering) (CCN5(dIII)-Fcv2) was expressed to produce the recombinant protein according to SEQ ID NO: 28.
Полученный белок тестировали на способность ингибировать способствующую выживанию сигнализацию (фосфорилирование серина-473 в AKT) в клетках рака легкого человека А549 (Фиг. 1А). Обработанные для культивирования тканей 96-луночные стерильные полистироловые планшеты Corning Incorporated Costar® покрывали фибронектином (Sigma, кат. № F1141, разведен до 10 мкг/мл забуференным фосфатом солевым раствором по Дульбекко BioWhittaker® (Lonza, кат. №17-512F, в дальнейшем называемый ФСБ)). Раствор для покрытия, содержащий фибронектин, распределяли по лункам в объеме 100 мкл/лунку, инкубировали в течение 1 часа при комнатной температуре, затем декантировали раствор для покрытия, распределяли в покрытые фибронектином лунки по 100 мкл ФСБ, и также декантировали. Клетки А549, субкультивированные для поддержания плотности с максимальной конфлюентностью 80%, разделяли путем обработки ферментом (Аккутаза®, кат. № L0950-100 от Biowest®), разведенным в модифицированной по Дульбекко среде Игла с высоким содержанием глюкозы (Gibco кат. №: 41965-039), добавляли 10% инактивированную нагреванием фетальную бычью сыворотку (ФБС) (флаконы на 500 мл с ФБС (кат. №16000-044 от Gibco), уравновешивали до комнатной температуры, инкубировали в воде с температурой 60°С при перемешивании в течение 30 минут) и с 50 мкг/мл генсумицина (Sanofi)) до концентрации 110000 клеток/мл, и по 100 мкл раствора клеток распределяли в покрытые фибронектином лунки. Все инкубации клеток проводили в инкубаторах для клеточных культур при поддержании температуры 37°С, во влажной атмосфере с комнатным воздухом и 5% СО2. После инкубации в течение ночи клетки А549 двукратно промывали ФСБ и 90 мкл модифицированной по Дульбекко среды Игла с высоким содержанием глюкозы (DMEM, Gibco кат. №: 41965-039), и в лунки распределяли по 50 мкг/мл генсумицина (Sanofi) без ФБС. Через 18 часов инкубации в среде без ФБС клетки стимулировали 10 мкл раствора рассматриваемого рекомбинантного белка. После стимуляции в течение 60 среду декантировали и клетки собирали путем добавления 50 мкл буфера для лизиса с блокирующим реагентом, в соответствии с набором для фосфо-AKT от Cisbio (Ser473) (Cisbio Inc, кат. №: 64AKSPEG). После добавления буфера для лизиса с блокирующим реагентом 96-луночный планшет инкубируют в течение 60 минут на планшетном шейкере PST-60HL Plus (ThermoFisher) при 500 об/мин. После перемешивания лизированные образцы растирали, после чего переносили по 16 мкл из каждой лунки в белые 96-луночные малообъемные HTRF-планшеты (Cisbio Inc., кат. №: 66PL96025). Для анализа количества фосфорилированной AKT (Ser473) в каждую лунку добавляли 4 мкл смеси меченых антител (50/50 об/об смесь антител, AT к фосфо-AKT d2 и меченое криптатом AT к фосфо-AKT от Cisbio bic, кат. №: 64AKSPEG) (в отрицательные контрольные лунки добавляли только антитело с криптатом), планшеты запечатывали клейкой полимерной пленкой и инкубировали при 4°С в течение ночи, после чего считывали на планшет-ридере PolarStar Omega (BMG Labtech, Германия), оснащенном регистратором TR-FRET и эмиссионным фильтром на 337 нм и фильтрами возбуждения на 615 нм и 665 нм. Соотношение между зарегистрированными показателями возбуждения на 665 нм и 615 нм корректировали по холостым пробам, и значения для рекомбинантного белка из стимулированных лунок выражали через процент относительно стимулированных носителем лунок.The resulting protein was tested for its ability to inhibit pro-survival signaling (phosphorylation of serine-473 in AKT) in human lung cancer A549 cells (Fig. 1A). Tissue culture-treated 96-well Corning Incorporated Costar® sterile polystyrene plates were coated with fibronectin (Sigma, Cat. #F1141, diluted to 10 μg/mL in BioWhittaker® Dulbecco's Phosphate Buffered Saline (Lonza, Cat. #17-512F, hereafter referred to as PBS)). The coating solution containing fibronectin was dispensed into wells at a volume of 100 μl/well, incubated for 1 hour at room temperature, then the coating solution was decanted, 100 μl of PBS was dispensed into fibronectin-coated wells, and also decanted. A549 cells, subcultured to maintain a density of 80% maximum confluency, were split by enzyme treatment (Accutase®, Cat# L0950-100 from Biowest®) diluted in Dulbecco's modified Eagle's medium high glucose (Gibco Cat# 41965-039), 10% heat-inactivated fetal bovine serum (FBS) (500 mL FBS flasks (Cat# 16000-044 from Gibco), equilibrated to room temperature, incubated in 60°C water with shaking for 30 minutes) and 50 μg/mL gensumycin (Sanofi)) to a concentration of 110,000 cells/mL, and 100 μL of the cell solution were dispensed into fibronectin-coated wells. All cell incubations were performed in cell culture incubators maintained at 37°C, in a humidified atmosphere with room air and 5% CO2. After overnight incubation, A549 cells were washed twice with PBS and 90 µl Dulbecco's modified Eagle's medium high glucose (DMEM, Gibco cat. # 41965-039), and 50 µg/ml gensumycin (Sanofi) without FBS were dispensed into the wells. After 18 h of incubation in the medium without FBS, the cells were stimulated with 10 µl of the recombinant protein in question. After stimulation for 60 min, the medium was decanted and the cells were harvested by adding 50 μl of lysis buffer with blocking reagent according to the Cisbio phospho-AKT kit (Ser473) (Cisbio Inc, Cat#: 64AKSPEG). After adding the lysis buffer with blocking reagent, the 96-well plate was incubated for 60 min on a PST-60HL Plus plate shaker (ThermoFisher) at 500 rpm. After mixing, the lysed samples were ground and 16 μl from each well was transferred into white 96-well low-volume HTRF plates (Cisbio Inc., Cat#: 66PL96025). To analyze the amount of phosphorylated AKT (Ser473), 4 μl of a mixture of labeled antibodies (50/50 v/v mixture of antibodies, AB to phospho-AKT d2 and cryptate-labeled AB to phospho-AKT from Cisbio bic, cat. no.: 64AKSPEG) were added to each well (only cryptate-labeled antibody was added to negative control wells), the plates were sealed with adhesive polymer film and incubated at 4°C overnight, after which they were read on a PolarStar Omega plate reader (BMG Labtech, Germany) equipped with a TR-FRET recorder and an emission filter at 337 nm and excitation filters at 615 nm and 665 nm. The ratio between the recorded excitation values at 665 nm and 615 nm was corrected for blanks, and the values for recombinant protein from stimulated wells were expressed as a percentage relative to vehicle-stimulated wells.
Пример 3Example 3
Последовательность ДНК, кодирующую слитый белок, содержащий аминокислоты 194-246 CCN5 (SEQ ID. NO: 1), слитый на N-конце с пептидным линкером (SEQ ID NO: 20) и Fc-фрагментом IgG подкласса IgG4 из SEQ ID NO: 15 (S228P, F234A, L235A, K447-, Eu-нумерация) (CCN5(dIII)-Fcv2), экспрессировали для получения рекомбинантного белка в соответствии с SEQ ID NO: 28.A DNA sequence encoding a fusion protein comprising amino acids 194-246 of CCN5 (SEQ ID NO: 1) fused at the N-terminus to a peptide linker (SEQ ID NO: 20) and the Fc fragment of IgG subclass IgG4 from SEQ ID NO: 15 (S228P, F234A, L235A, K447-, Eu-numbering) (CCN5(dIII)-Fcv2) was expressed to produce the recombinant protein according to SEQ ID NO: 28.
Полученный белок тестировали на способность ингибировать профибротическую стимулированную ТФР-β транскрипцию (со связывающих SMAD2/3 цис-элементов) в фибробластах легких человека IMR90 (Фиг. 1D). Анализ проводили в техническом отношении согласно описанию Kaasbell et al. (2018) выше, за исключением использования 2500 фибробластов легких IMR90 /лунку вместо клеток Rat2. Для стимуляции использовали белки, указанные на Фиг. 1D. Клетки IMR90 перед применением субкультивировали согласно описанию для клеток А549, см. выше. Клетки IMR90 использовали до 20 пересева, т.е. до достижения репликативного старения.The resulting protein was tested for its ability to inhibit pro-fibrotic TGF-β-stimulated transcription (from SMAD2/3 binding cis-elements) in IMR90 human lung fibroblasts (Fig. 1D). The assay was technically performed as described by Kaasbell et al. (2018) above, except for using 2500 IMR90 lung fibroblasts/well instead of Rat2 cells. The proteins used for stimulation were as described in Fig. 1D. IMR90 cells were subcultured prior to use as described for A549 cells, see above. IMR90 cells were used up to passage 20, i.e., until replicative senescence was reached.
Пример 4Example 4
Последовательность ДНК, кодирующую слитый белок, содержащий аминокислоты 194-246 CCN5 (SEQ ID. NO: 1), слитый на N-конце с пептидным линкером (SEQ ID NO: 20) и Fc-фрагментом IgG подкласса IgG4 из SEQ ID NO: 15 (S228P, F234A, L235A, K447-, Eu-нумерация) (CCN5(dIII)-Fcv2), экспрессировали для продуцирования рекомбинантного белка в соответствии с SEQ ID NO: 28.A DNA sequence encoding a fusion protein comprising amino acids 194-246 of CCN5 (SEQ ID NO: 1) fused at the N-terminus to a peptide linker (SEQ ID NO: 20) and the Fc fragment of IgG subclass IgG4 from SEQ ID NO: 15 (S228P, F234A, L235A, K447-, Eu-numbering) (CCN5(dIII)-Fcv2) was expressed to produce the recombinant protein according to SEQ ID NO: 28.
Полученный белок тестировали на способность ингибировать пролиферацию клеток линии фибробластов легких человека IMR90 (Фиг. 1В). Клетки IMR90 субкультивировали согласно описанию для клеток А549 перед применением, выше. Клетки IMR90 использовали до пересева 20, т.е. до достижения репликативного старения. Для экспериментов клетки IMR90 собирали согласно описанию для клеток А549, выше, промывали ФСБ, разводили DMEM с 1% ФБС и генсумицином согласно описанию для эксперимента 2, выше, и высевали в планшеты для измерения импеданса xCELLigence с плотностью 12000 кл./лунку. Через 2 часа клетки стимулировали 10 мкл раствора рассматриваемого рекомбинантного белка или ФБС и инкубировали в течение еще 72 часов, после чего собирали данные с использованием CellTiter-Glo® (Promega Inc.) согласно описанию в и соавторов, (2018), выше.The resulting protein was tested for its ability to inhibit proliferation of the human lung fibroblast cell line IMR90 (Fig. 1B). IMR90 cells were subcultured as described for A549 cells before use, above. IMR90 cells were used until passage 20, i.e., until replicative senescence was reached. For experiments, IMR90 cells were harvested as described for A549 cells, above, washed with PBS, diluted with DMEM with 1% FBS and gensumycin as described for Experiment 2, above, and seeded into xCELLigence impedance plates at a density of 12,000 cells/well. After 2 h, cells were stimulated with 10 µl of the recombinant protein in question or FBS and incubated for an additional 72 h, after which data were collected using the CellTiter-Glo® (Promega Inc.) as described in et al., (2018), supra.
Пример 5Example 5
Последовательность ДНК, кодирующую слитый белок, содержащий аминокислоты 194-246 CCN5 (SEQ ID. NO: 1), слитый на N-конце с пептидным линкером (SEQ ID NO: 20) и Fc-фрагментом IgG подкласса IgG4 из SEQ ID NO: 15 (S228P, F234A, L235A, K447-, Eu-нумерация) (CCN5(dIII)-Fcv2), экспрессировали для продуцирования рекомбинантного белка в соответствии с SEQ ID NO: 28.A DNA sequence encoding a fusion protein comprising amino acids 194-246 of CCN5 (SEQ ID NO: 1) fused at the N-terminus to a peptide linker (SEQ ID NO: 20) and the Fc fragment of IgG subclass IgG4 from SEQ ID NO: 15 (S228P, F234A, L235A, K447-, Eu-numbering) (CCN5(dIII)-Fcv2) was expressed to produce the recombinant protein according to SEQ ID NO: 28.
Полученный белок тестировали на способность ингибировать сферообразующую способность (независимый от подложки рост) клеток положительной по рецептору эстрогена линии рака молочной железы MCF-7 и клеток линии рака молочной железы с тройным негативным фенотипом MDA-MB-231 (Фиг. 1С) согласно описанию и соавторов, выше. Клетки MDA-MB-231 обрабатывали согласно описанию для линии клеток MCF-7 и соавторов, выше. Клетки линий MCF-7 и MDA-MB-231 субкультивировали согласно описанию для линии клеток А549, выше.The resulting protein was tested for its ability to inhibit the sphere-forming ability (substrate-independent growth) of estrogen receptor-positive breast cancer cell line MCF-7 and triple-negative breast cancer cell line MDA-MB-231 (Fig. 1C) as described et al., supra. MDA-MB-231 cells were treated as described for the MCF-7 cell line and co-authors, above. MCF-7 and MDA-MB-231 cell lines were subcultured as described for the A549 cell line, above.
Пример 6Example 6
Последовательности ДНК, кодирующие слитый белок, содержащий аминокислоты 194 246 CCN5 (SEQ ID. NO: 1), слитый на N-конце с пептидным линкером (SEQ ID NO: 20) и либо Fc-фрагментом IgG подкласса IgG4 из SEQ ID NO: 15 (S228P, F234A, L235A, К447-, Eu-нумерация) (CCN5(dIII)-Fcv2), либо Fc-фрагментом IgG подкласса IgG4 из SEQ ID NO: 18 (S228P, E233P, F234V, L235A, G236-, K447-, Eu-нумерация) (CCN5(dIII)-Fcv2.1), либо химерным Fc-фрагментом подклассов IgG2/4 (SEQ ID NO: 19) (CCN5(dIII)-Fcv2.3), экспрессировали для продуцирования рекомбинантного белка в соответствии с SEQ ID NO: 28 (CCN5(dIII)-Fcv2), SEQ ID NO: 29 (CCN5(dIII)- Fcv2.1) и SEQ ID NO: 30 (CCN5(dIII)-Fcv2.3).DNA sequences encoding a fusion protein comprising amino acids 194,246 of CCN5 (SEQ ID NO: 1) fused at the N-terminus to a peptide linker (SEQ ID NO: 20) and either the IgG subclass IgG4 Fc fragment of SEQ ID NO: 15 (S228P, F234A, L235A, K447-, Eu numbering) (CCN5(dIII)-Fcv2) or the IgG subclass IgG4 Fc fragment of SEQ ID NO: 18 (S228P, E233P, F234V, L235A, G236-, K447-, Eu numbering) (CCN5(dIII)-Fcv2.1) or a chimeric IgG2/4 subclass Fc fragment (SEQ ID NO: 19) (CCN5(dIII)-Fcv2.3) was expressed to produce recombinant protein according to SEQ ID NO: 28 (CCN5(dIII)-Fcv2), SEQ ID NO: 29 (CCN5(dIII)-Fcv2.1) and SEQ ID NO: 30 (CCN5(dIII)-Fcv2.3).
В частности, экспрессионными векторами для экспрессии SEQ ID NO: 28 (CCN5(dIII)-Fcv2), SEQ ID NO: 29 (CCN5(dIII)-Fcv2.1) и SEQ ID NO: 30 (CCN5(dIII)-Fcv2.3) трансфицировали адаптированные к суспензионной культуре клетки СНО ExpiCHO в соответствии с протоколом «Мах Titer» от изготовителя набора для трансфекции СНО Expifectamine™ (Gibco, кат. №: A29129) и кратким описанием и соавторов, выше. Клетки осаждали через 6 дней после трансфекции центрифугированием при 13000 об/мин в настольной центрифуге Heraeus Biofuge Pico в течение 5 минут и собирали супернатант клеточной культуральной среды. Образцы собранных супернатантов клеточной культуральной среды разделяли в ДСН-ПААГ с использованием готовых гелей Mini-PROTEAN® TGX Stain-Free™, и визуализировали рекомбинантные белки с использованием системы визуализации ChemiDoc™ (BioRad). Разделенные белки затем переносили на ПВДФ-мембраны с применением Trans-Blot Turbo, системы полусухого блоттинга (Bio-Rad) для анализа методом вестерн-блоттинга. Блот зондировали антителом против IgG4 человека, конъюгированным с пероксидазой хрена (Invitrogen, кат. №: А10654), которое использовали в сочетании с субстратом SuperSignal™ West Femto Maximum Sensitivity Substrate (ThermoFisherScientific) и системой визуализации ChemiDoc™ (BioRad) для визуализации.In particular, the expression vectors for the expression of SEQ ID NO: 28 (CCN5(dIII)-Fcv2), SEQ ID NO: 29 (CCN5(dIII)-Fcv2.1) and SEQ ID NO: 30 (CCN5(dIII)-Fcv2.3) were transfected into suspension culture-adapted CHO ExpiCHO cells according to the Max Titer protocol from the manufacturer of the CHO Expifectamine™ transfection kit (Gibco, Cat. No.: A29129) and a brief description of the et al., supra. Cells were pelleted 6 days post-transfection by centrifugation at 13,000 rpm in a Heraeus Biofuge Pico benchtop centrifuge for 5 min, and cell culture medium supernatant was collected. Samples of the collected cell culture medium supernatants were separated by SDS-PAGE using Mini-PROTEAN® TGX Stain-Free™ precast gels, and recombinant proteins were visualized using the ChemiDoc™ Imaging System (BioRad). Separated proteins were then transferred to PVDF membranes using the Trans-Blot Turbo Semi-Dry Blotting System (Bio-Rad) for Western blot analysis. The blot was probed with horseradish peroxidase-conjugated anti-human IgG4 antibody (Invitrogen, Cat. #: A10654), which was used in combination with SuperSignal™ West Femto Maximum Sensitivity Substrate (ThermoFisherScientific) and the ChemiDoc™ Imaging System (BioRad) for visualization.
На Фиг. 2 приведены данные, демонстрирующие улучшенную устойчивость к протеазам остова на основе Fc-фрагмента, состоящего из химеры IgG2/4 (показан на SEQ ID NO: 19).Fig. 2 shows data demonstrating improved protease resistance of the Fc-based backbone consisting of the IgG2/4 chimera (shown in SEQ ID NO: 19).
CCN5/WISP2 (домен III) слитый с Fc-фрагментом IgG4 либо с помощью шарнира IgG4 с сайленсингом иммунных эффекторных функций (согласно определению в SEQ ID NO: 28); CCN5 (домен III)-Fcv2, где тот же остов IgG4 включает мутации на основе IgG2 (согласно определению в SEQ ID. NO: 29); CCN5 (домен III)-Fcv2.1, или тот же остов IgG4 с полной шарнирной областью IgG2 (согласно определению в SEQ ID NO: 30); CCN5 (домен III)-Fcv2.3 экспрессировали в системе ExpiCHO и собирали кондиционированную среду (СМ) через 6 дней. Вестерн-блоттинг и окрашивание на тотальный белок гелей ДСН-ПААГ показали, что вариант CCN5 (домен III)-Fcv2.3 наименее чувствителен к протеазам, присутствующим при культивировании. Обратим внимание, что иммунореактивность антитела против IgG4 по отношению к Fc-фрагменту частично утрачивается при замене на последовательности IgG2, и, соответственно, оценка уровня указанного белка на основании окрашивания общего белка занижена.CCN5/WISP2 (domain III) fused to the IgG4 Fc fragment either via the IgG4 hinge with silencing of immune effector functions (as defined in SEQ ID NO: 28); CCN5 (domain III)-Fcv2, where the same IgG4 backbone includes IgG2-based mutations (as defined in SEQ ID NO: 29); CCN5 (domain III)-Fcv2.1, or the same IgG4 backbone with the complete IgG2 hinge region (as defined in SEQ ID NO: 30); CCN5 (domain III)-Fcv2.3 were expressed in the ExpiCHO system and the conditioned medium (CM) was collected after 6 days. Western blotting and total protein staining of SDS-PAGE gels showed that the CCN5 (domain III)-Fcv2.3 variant is the least sensitive to proteases present during cultivation. Note that the immunoreactivity of the anti-IgG4 antibody to the Fc fragment is partially lost when replaced by IgG2 sequences, and, accordingly, the assessment of the level of this protein based on total protein staining is underestimated.
Пример 7Example 7
Последовательности ДНК, кодирующие слитый белок, содержащий аминокислоты 194 246 CCN5 (SEQ ID NO: 1), слитые на N-конце с пептидным линкером, описанным в SEQ ID NO: 20, и химерным Fc-фрагментом подклассов IgG2/4 (SEQ ID NO: 19) (CCN5(dIII)-Fcv2.3), или с пептидным линкером, описанным в SEQ ID NO: 25 и химерным Fc-фрагментом подклассов IgG2/4 (SEQ ID NO: 19) (CCN5(dIII)-HLn8-Fcv2.3), экспрессировали для продуцирования рекомбинантного белка в соответствии с SEQ ID NO: 30 (CCN5(dIII)-Fcv2.3) и SEQ ID NO: 31 (CCN5(dIII)-HLn8-Fcv2.3).DNA sequences encoding a fusion protein comprising amino acids 194,246 of CCN5 (SEQ ID NO: 1) fused at the N-terminus to the peptide linker described in SEQ ID NO: 20 and the chimeric Fc fragment of the IgG2/4 subclasses (SEQ ID NO: 19) (CCN5(dIII)-Fcv2.3), or to the peptide linker described in SEQ ID NO: 25 and the chimeric Fc fragment of the IgG2/4 subclasses (SEQ ID NO: 19) (CCN5(dIII)-HLn8-Fcv2.3), were expressed to produce a recombinant protein according to SEQ ID NO: 30 (CCN5(dIII)-Fcv2.3) and SEQ ID NO: 31 (CCN5(dIII)-HLn8-Fcv2.3).
В частности, экспрессионными векторами для экспрессии SEQ ID NO: 30 (CCN5(dIII)-Fcv2.3) и SEQ ID NO: 31 (CCN5(dIII)-HLn8-Fcv2.3) трансфицировали адаптированные к суспензионной культуре клетки СНО ExpiCHO в соответствии с протоколом «Мах Titer» от изготовителя набора для трансфекции СНО Expifectamine™ (Gibco, кат. №: А29129) и кратким описанием и соавторов, выше. Клетки осаждали через 4 дня после трансфекции центрифугированием при 13000 об/мин в настольной центрифуге Heraeus Biofuge Pico в течение 5 минут и собирали супернатант клеточной культуральной среды. Образцы собранного супернатанта клеточной культуральной среды разделяли с помощью ДСН-ПААГ с использованием готовых гелей Mini-PROTEAN® TGX Stain-Free™. Разделенные белки переносили на ПВДФ-мембраны с применением Trans-Blot Turbo, системы полусухого блоттинга (Bio-Rad) для анализа методом вестерн-блоттинга. Блот зондировали антителом против IgG4 человека, конъюгированным с пероксидазой хрена (Invitrogen, кат. №: А10654), которое использовали для визуализации в сочетании с субстратом SuperSignal™ West Femto Maximum Sensitivity Substrate (ThermoFisherScientific) и системой визуализации ChemiDoc™ (BioRad).In particular, the expression vectors for expression of SEQ ID NO: 30 (CCN5(dIII)-Fcv2.3) and SEQ ID NO: 31 (CCN5(dIII)-HLn8-Fcv2.3) were transfected into suspension culture-adapted CHO ExpiCHO cells according to the Max Titer protocol from the manufacturer of the CHO Expifectamine™ transfection kit (Gibco, Cat. No.: A29129) and a brief description of the et al., supra. Cells were pelleted 4 days post-transfection by centrifugation at 13,000 rpm in a Heraeus Biofuge Pico tabletop centrifuge for 5 min, and the cell culture medium supernatant was collected. Samples of the collected cell culture medium supernatant were separated by SDS-PAGE using Mini-PROTEAN® TGX Stain-Free™ precast gels. Separated proteins were transferred to PVDF membranes using the Trans-Blot Turbo Semi-Dry Blotting System (Bio-Rad) for Western blot analysis. The blot was probed with horseradish peroxidase-conjugated anti-human IgG4 antibody (Invitrogen, Cat.#: A10654), which was used for visualization in combination with SuperSignal™ West Femto Maximum Sensitivity Substrate (ThermoFisherScientific) and the ChemiDoc™ Imaging System (BioRad).
На Фиг. 3 приведены данные, отражающие сниженную склонность к агрегации в тех случаях, когда вариант реализации настоящего изобретения включает пептидный линкер, представленный в SEQ ID NO: 25.Fig. 3 shows data reflecting a reduced tendency to aggregation in cases where an embodiment of the present invention includes a peptide linker as shown in SEQ ID NO: 25.
Невосстанавливающий ДСН-ПААГ СМ из транзиентно трансфицированных суспензионных клеток СНО, экспрессирующих CCN5 (домен III), слитый с аминоконцом химерного Fc-фрагмента IgG2/4 посредством различных пептидных линкеров. Вестерн-блоттинг показывает, что слитый белок с последовательностью аминокислот, показанной в SEQ ID NO: 31; (dIII)-HLn8-Fcv2.3, имеет меньшую склонность к агрегации, чем слитый белок согласно настоящему изобретению, имеющий последовательность аминокислот, представленную в SEQ ID NO: 30; CCN5 (домен III)-Fcv2.3. Этот результат показывает, что пептидный линкер согласно определению в последовательности SEQ ID NO: 25, обеспечивает меньшую склонность к агрегации слитого белка по сравнению со слитым белком, содержащим пептидный линкер согласно определению в последовательности SEQ ID NO: 20.Non-reducing SDS-PAGE of CM from transiently transfected CHO suspension cells expressing CCN5 (domain III) fused to the amino terminus of a chimeric IgG2/4 Fc fragment via different peptide linkers. Western blotting shows that the fusion protein with the amino acid sequence shown in SEQ ID NO: 31; (dIII)-HLn8-Fcv2.3 has a lower propensity to aggregate than the fusion protein of the present invention having the amino acid sequence shown in SEQ ID NO: 30; CCN5 (domain III)-Fcv2.3. This result demonstrates that the peptide linker as defined in SEQ ID NO: 25 provides a lower propensity for aggregation of the fusion protein compared to a fusion protein containing the peptide linker as defined in SEQ ID NO: 20.
Пример 8Example 8
Последовательности ДНК, кодирующие слитый белок, содержащий либо аминокислоты 194-246 CCN5 (SEQ ID. NO: 1), либо аминокислоты 194-246 CCN5 (SEQ ID. NO: 7), где аминокислота в положении 195 (пролин) заменена на аланин, слитый на С-конце с пептидным линкером (SEQ ID NO: 39) и Fc-фрагментом IgG подтипа IgG4 из SEQ ID NO: 15 (S228P, F234A, L235A, K447-, Eu-нумерация), экспрессировали для продуцирования рекомбинантного белка в соответствии с SEQ ID NO: 40 (Fc-HLn8-CCN5(dIII)) или SEQ ID NO:: 41 (Fc-HLn8-CCN5(dIII)-P195A).DNA sequences encoding a fusion protein comprising either amino acids 194-246 of CCN5 (SEQ ID. NO: 1) or amino acids 194-246 of CCN5 (SEQ ID. NO: 7) where the amino acid at position 195 (proline) is replaced by alanine, fused at the C-terminus to a peptide linker (SEQ ID NO: 39) and the Fc fragment of IgG subtype IgG4 of SEQ ID NO: 15 (S228P, F234A, L235A, K447-, Eu-numbering) were expressed to produce the recombinant protein according to SEQ ID NO: 40 (Fc-HLn8-CCN5(dIII)) or SEQ ID NO: 41 (Fc-HLn8-CCN5(dIII)-P195A).
В частности, экспрессионными векторами для экспрессии SEQ ID NO: 40 (Fc-HLn8-CCN5(dIII)) и SEQ ID NO: 41 (Fc-HLn8-CCN5(dIII)-P195A) трансфицировали адаптированные к суспензионной культуре клетки СНО ExpiCHO в соответствии с протоколом «Мах Titer» от изготовителя набора для трансфекции СНО Expifectamine™ (Gibco, кат. №: А29129) и кратким описанием и соавторов, выше. Клетки осаждали через 3 дня после трансфекции центрифугированием при 13000 об/мин в настольной центрифуге Heraeus Biofuge Pico в течение 5 минут и собирали супернатант клеточной культуральной среды. Образцы собранного супернатанта клеточной культуральной среды разделяли с помощью ДСН-ПААГ с использованием готовых гелей Mini-PROTEAN® TGX Stain-Free™. Разделенные белки переносили на ПВДФ-мембраны с применением Trans-Blot Turbo, системы полусухого блоттинга (Bio-Rad), для анализа методом вестерн-блоттинга. Блот зондировали антителом против IgG4 человека, конъюгированным с пероксидазой хрена (Invitrogen, кат. №: А10654), которое использовали в сочетании с субстратом SuperSignal™ West Femto Maximum Sensitivity Substrate (ThermoFisherScientific) и системой визуализации ChemiDoc™ (BioRad) для визуализации.In particular, the expression vectors for the expression of SEQ ID NO: 40 (Fc-HLn8-CCN5(dIII)) and SEQ ID NO: 41 (Fc-HLn8-CCN5(dIII)-P195A) were transfected into suspension culture-adapted CHO ExpiCHO cells in accordance with the Max Titer protocol from the manufacturer of the CHO Expifectamine™ transfection kit (Gibco, Cat. No.: A29129) and a brief description et al., supra. Cells were pelleted 3 days post-transfection by centrifugation at 13,000 rpm in a Heraeus Biofuge Pico tabletop centrifuge for 5 min, and the cell culture medium supernatant was collected. Samples of the collected cell culture medium supernatant were separated by SDS-PAGE using Mini-PROTEAN® TGX Stain-Free™ precast gels. Separated proteins were transferred to PVDF membranes using the Trans-Blot Turbo semi-dry blotting system (Bio-Rad) for Western blotting analysis. The blot was probed with horseradish peroxidase-conjugated anti-human IgG4 antibody (Invitrogen, Cat. #: A10654), which was used in combination with SuperSignal™ West Femto Maximum Sensitivity Substrate (ThermoFisherScientific) and the ChemiDoc™ Imaging System (BioRad) for visualization.
На Фиг. 5 приведены данные, отражающие пониженную чувствительность к расщеплению эндопептидазой в тех случаях, когда вариант реализации настоящего изобретения включает мутацию пролин-195 в домене гомологии к повторам TSP-1 CCN5, представленную в SEQ ID NO: 7.Fig. 5 shows data reflecting reduced sensitivity to endopeptidase cleavage when an embodiment of the present invention includes the proline-195 mutation in the TSP-1 repeat homology domain of CCN5 shown in SEQ ID NO: 7.
Восстанавливающий ДСН-ПААГ СМ из транзиентно трансфицированных суспензионных клеток СНО, экспрессирующих CCN5(домен III), слитый с карбоксильным концом Fc-фрагмента IgG4 согласно описанию в SEQ ID NO: 15, либо включающий мутацию Р195А (Fc-HLn8-CCN5(dIII)-P195A), либо экспрессирующих вариант дикого типа Р195 домена гомологии к повторам TSP-1 CCN5 (Fc-HLn8-CCN5(dIII)). Указанный блот демонстрирует, что мутация Р195А обеспечивает протеолитическую устойчивость домена гомологии к повторам TSP-1 CCN5.Reducing SDS-PAGE of CM from transiently transfected CHO suspension cells expressing CCN5(domain III) fused to the carboxyl terminus of the IgG4 Fc fragment as described in SEQ ID NO: 15, either incorporating the P195A mutation (Fc-HLn8-CCN5(dIII)-P195A) or expressing the wild-type P195 variant of the TSP-1 repeat homology domain of CCN5 (Fc-HLn8-CCN5(dIII)). This blot demonstrates that the P195A mutation confers proteolytic resistance to the TSP-1 repeat homology domain of CCN5.
Пример 9Example 9
Раскрыт слитый белок, содержащий аминокислоты 194-250 CCN5 человека (SEQ ID NO: 56), слитый на N-конце с пептидным линкером (SEQ ID NO: 57) и Fc-фрагментом IgG человека, подкласса IgG4, из SEQ ID NO: 15 (S228P, F234A, L235A, K447-, Eu-нумерация), с получением последовательности белка, соответствующего SEQ ID NO: 58 (CCN5(dIII)-SL-Fcv0). К указанному слитому белку была дополнительно добавлена N-концевая сигнальная последовательность для секреции, происходящая из альбумина из SEQ ID NO: 32, для получения слитого белка, соответствующего SEQ ID NO: 59, и он был экспрессирован в клетках млекопитающих, как описано ниже.A fusion protein comprising amino acids 194-250 of human CCN5 (SEQ ID NO: 56) fused at the N-terminus to a peptide linker (SEQ ID NO: 57) and the Fc portion of human IgG, subclass IgG4, of SEQ ID NO: 15 (S228P, F234A, L235A, K447-, Eu-numbering) to produce a protein sequence according to SEQ ID NO: 58 (CCN5(dIII)-SL-Fcv0) is disclosed. An N-terminal secretion signal sequence derived from albumin of SEQ ID NO: 32 was further added to said fusion protein to produce a fusion protein according to SEQ ID NO: 59, and it was expressed in mammalian cells as described below.
Последовательность ДНК, кодирующую слитый белок из SEQ ID NO: 59, кодон-оптимизировали для экспрессии белка в клетках хомяка (используя алгоритм коммерческого поставщика), присоединяли последовательность KOZAK для трансляции на 5'-конце и вводили стоп-кодон на 3'-конце, получая последовательность ДНК из SEQ ID NO: 60. Указанную последовательность ДНК также дополняли на обоих концах сайтами attB Gateway, получая последовательность ДНК из SEQ ID NO: 61. Последовательность из SEQ ID NO: 61 синтезировал и верифицировал коммерческий поставщик. Синтезированную последовательность рекомбинировали с pDonrZeo путем рекомбиназного клонирования BP Gateway для получения входящего вектора. После трансфекции компетентных E.coli, мутированных так, чтобы позволять эффективное размножение плазмид (клетки One Shot Тор10™), входящий вектор выделяли с помощью стандартных методик выделения плазмид с использованием набора QIAprep™ Spin Miniprep от Qiagen™. После выделения плазмиды входящий вектор верифицировали путем расщепления рестрикционными ферментами с последующим гель-электрофорезом ДНК в соответствии со стандартными методиками, хорошо известными специалисту.The DNA sequence encoding the fusion protein of SEQ ID NO: 59 was codon-optimized for protein expression in hamster cells (using a commercial supplier's algorithm), a KOZAK sequence was added for translation at the 5' end, and a stop codon was introduced at the 3' end, yielding the DNA sequence of SEQ ID NO: 60. This DNA sequence was also complemented at both ends with Gateway attB sites, yielding the DNA sequence of SEQ ID NO: 61. The sequence of SEQ ID NO: 61 was synthesized and verified by the commercial supplier. The synthesized sequence was recombined into pDonrZeo by BP Gateway recombinase cloning to generate the entry vector. Following transfection of competent E. coli mutated to allow efficient propagation of the plasmids (One Shot Top10™ cells), the input vector was isolated using standard plasmid isolation techniques using the QIAprep™ Spin Miniprep Kit from Qiagen™. Following plasmid isolation, the input vector was verified by restriction enzyme digestion followed by DNA gel electrophoresis according to standard techniques well known to those skilled in the art.
Входящий вектор, содержащий последовательность SEQ ID NO: 60, дополнительно рекомбинировали с принимающим вектором с применением рекомбиназы LR Gateway. Использовали принимающий вектор pUCOE-DHFR-DEST согласно описанию в источнике: et al., 2018, J. Biol. Chem, 293:46, pp. 17953-17970.The input vector containing the sequence SEQ ID NO: 60 was further recombined with the receiving vector using LR Gateway recombinase. The receiving vector pUCOE-DHFR-DEST was used as described in the source: et al., 2018, J. Biol. Chem, 293:46, pp. 17953-17970.
После трансфекции компетентных E.coli, мутированных так, чтобы позволять эффективное размножение плазмид (клетки One Shot Top10™), экспрессионный вектор выделяли с помощью стандартных методик выделения плазмид с применением набора QIAGEN™ Plasmid Plus Maxi Kit. Итоговый экспрессионный вектор верифицировали с помощью стандартного расщепления рестрикционными ферментами и гель-электрофореза ДНК в соответствии со стандартными методиками, хорошо известными специалисту. Итоговый экспрессионным вектором затем трансфицировали адаптированные для суспензионной культуры клетки ExpiCHO в соответствии с протоколом «Мах Titer» от изготовителя набора для трансфекции СНО Expifectamine™ (Gibco, кат. №: А29129) и кратким описанием и соавторов, 2018, выше. Клетки осаждали через 4 дня после трансфекции центрифугированием при 4750xg в течение 20 минут при 4°С и собирали супернатант клеточной культуральной среды. Добавляли ОДМ ПМСФ в 100% изопропаноле до концентрации 1 мМ и добавляли 0,5М ЭДТК до концентрации 2 мМ. Затем добавляли 96% этанол до конечной концентрации приблизительно 3%. Добавляли 1М TrisHCl рН 7,4 до конечной концентрации 25 мМ перед хроматографическим очищением.Following transfection of competent E. coli mutated to allow efficient propagation of the plasmids (One Shot Top10™ cells), the expression vector was isolated using standard plasmid isolation techniques using the QIAGEN™ Plasmid Plus Maxi Kit. The resulting expression vector was verified by standard restriction enzyme digestion and DNA gel electrophoresis according to standard techniques well known to those skilled in the art. The resulting expression vector was then transfected into suspension-adapted ExpiCHO cells according to the Max Titer protocol from the manufacturer of the Expifectamine™ CHO Transfection Kit (Gibco, Cat. No.: A29129) and a brief description of the et al., 2018, supra. Cells were pelleted 4 days post-transfection by centrifugation at 4750xg for 20 min at 4°C and the cell culture medium supernatant was collected. ODM PMSF in 100% isopropanol was added to a concentration of 1 mM and 0.5 M EDTA was added to a concentration of 2 mM. Then 96% ethanol was added to a final concentration of approximately 3%. 1 M TrisHCl pH 7.4 was added to a final concentration of 25 mM before chromatographic purification.
Белок очищали аффинной хроматографией с использованием хроматографической среды с белком А. В этом эксперименте использовали хроматографическую среду rProtein А FF (GE Healthcare). Использовали колонку HiTrap ™ rProtein A FF (GE Healthcare) на 5 мл для очищения экспрессированного рекомбинантного белка из 120 мл клеточной культуральной среды, собранной и дополненной согласно описанию, см. выше. Колонку HiTrap ™ rProtein А FF устанавливали в систему скоростной высокопроизводительной жидкостной хроматографии (система BioRad NGC Discover™ 10 Pro), оснащенную проточной кюветой для УФ-детекции с длиной оптического пути 5 мм и уравновешивали буфером, содержащим 25 мМ TrisHCl рН 7,4, 25 мМ NaCl и 3% этанола. Собранную клеточную культуральную среду, содержащую рекомбинантный белок, загружали с помощью пробоотборного насоса со скоростью 2,5 мл/мин, с последующим промыванием 10 объемами колонки промывочного буфера (25 мМ TrisHCl рН 7,4, 25 мМ NaCl и 3% этанола)) до элюирования ОДМ цитратом Na, рН 3,0, в 3% этаноле. Элюированные фракции объемом 3 мл собирали в пробирки с низким связыванием белков, предварительно наполненные 1 мл 1М TrisHCl, рН 9,0. Элюирование белка отслеживали по поглощению УФ на 280 нм, и образцы объединенных фракций объемом 10 мкл, содержащих пик поглощения УФ на 280 нм, подвергали ДСН-ПААГ с использованием готовых гелей Mini-PROTEAN® TGX Stain-Free™ в присутствии или в отсутствие восстанавливающего агента β-меркаптоэтанола, и выделенные рекомбинантные белки визуализировали с использованием системы визуализации ChemiDoc™ (BioRad).The protein was purified by affinity chromatography using Protein A chromatography medium. The chromatography medium used in this experiment was rProtein A FF (GE Healthcare). A 5 ml HiTrap™ rProtein A FF column (GE Healthcare) was used to purify the expressed recombinant protein from 120 ml of cell culture medium collected and supplemented as described above. The HiTrap™ rProtein A FF column was mounted on a fast high-performance liquid chromatography system (BioRad NGC Discover™ 10 Pro System) equipped with a 5 mm pathlength UV detection flow cell and equilibrated with a buffer containing 25 mM TrisHCl pH 7.4, 25 mM NaCl and 3% ethanol. The collected cell culture medium containing the recombinant protein was loaded using a sample pump at 2.5 ml/min, followed by washing with 10 column volumes of wash buffer (25 mM TrisHCl pH 7.4, 25 mM NaCl and 3% ethanol) before elution with ODM Na citrate, pH 3.0, in 3% ethanol. Eluted fractions of 3 ml were collected in low protein binding tubes pre-filled with 1 ml of 1 M TrisHCl, pH 9.0. Protein elution was monitored by UV absorbance at 280 nm, and 10 µl samples of pooled fractions containing a UV absorbance peak at 280 nm were subjected to SDS-PAGE using Mini-PROTEAN® TGX Stain-Free™ precast gels in the presence or absence of the reducing agent β-mercaptoethanol, and the isolated recombinant proteins were visualized using the ChemiDoc™ imaging system (BioRad).
Специалисту в данной области техники хорошо известно, что рекомбинантные белки могут быть получены в различных экспрессионных системах и очищены различными хроматографическими способами с получением аналогичных результатов.It is well known to those skilled in the art that recombinant proteins can be produced in various expression systems and purified by various chromatographic methods to obtain similar results.
На Фиг. 6 показана, что экспрессия и очищение белка, соответствующего SEQ ID NO: 58, действительно приводят к получению белка, мигрирующего выше ожидаемого уровня в отсутствие восстанавливающего агента β-меркаптоэтанола, что, соответственно, указывает на формирование димеров. Однако, как можно видеть по дорожке, которая содержит очищенный белок, в присутствии восстанавливающего агента β-меркаптоэтанола экспрессия и очищение белка, соответствующего SEQ ID NO: 58, приводит в первую очередь к получению расщепленных фрагментов, а не интактного белка.Fig. 6 shows that expression and purification of the protein corresponding to SEQ ID NO: 58 does result in protein that migrates above the expected level in the absence of the reducing agent β-mercaptoethanol, thus indicating dimer formation. However, as can be seen in the lane containing purified protein, in the presence of the reducing agent β-mercaptoethanol, expression and purification of the protein corresponding to SEQ ID NO: 58 primarily results in cleaved fragments rather than intact protein.
Пример 10Example 10
Получали несколько вариантов последовательности SEQ ID NO: 58 с целью повысить протеолитическую устойчивость белка, соответствующего SEQ ID NO: 58. Последовательности ДНК синтезировал и верифицировал коммерческий поставщик перед субклонированием для получения плазмид согласно описанию в Примере 9, и экспрессировали белки согласно описанию в Примере 9. Указанные варианты включают белки с модификациями, представленные ниже:Several variants of the sequence of SEQ ID NO: 58 were prepared in order to increase the proteolytic stability of the protein corresponding to SEQ ID NO: 58. The DNA sequences were synthesized and verified by a commercial supplier before subcloning to produce plasmids as described in Example 9, and the proteins were expressed as described in Example 9. These variants include proteins with the modifications shown below:
1) N-концевая сигнальная последовательность, происходящая из альбумина из SEQ ID NO: 32, со стороны аминоконца фрагмента CCN5, состоящего из аминокислот 194-249, включающего мутацию (P245L), соответствующего SEQ ID NO: 62, в комбинации с усеченным пептидным линкером, соответствующим SEQ ID NO: 63, и Fc-фрагментом SEQ ID NO: 15, с получением последовательности, соответствующей SEQ ID NO: 64,1) an N-terminal signal sequence derived from albumin of SEQ ID NO: 32, from the amino terminus of the CCN5 fragment consisting of amino acids 194-249, including the mutation (P245L), corresponding to SEQ ID NO: 62, in combination with a truncated peptide linker corresponding to SEQ ID NO: 63 and the Fc fragment of SEQ ID NO: 15, to obtain a sequence corresponding to SEQ ID NO: 64,
2) N-концевая сигнальная последовательность, происходящая из альбумина из SEQ ID NO: 32, со стороны аминоконца фрагмента CCN5, состоящего из аминокислот 194-246, соответствующего SEQ ID NO: 1, в комбинации с вариантом пептидного линкера, соответствующим SEQ ID NO: 65, и Fc-фрагментом из SEQ ID NO: 15, с получением последовательности, соответствующей SEQ ID NO: 66,2) an N-terminal signal sequence derived from the albumin of SEQ ID NO: 32, at the amino terminus of the CCN5 fragment consisting of amino acids 194-246, corresponding to SEQ ID NO: 1, in combination with a peptide linker variant corresponding to SEQ ID NO: 65 and the Fc fragment of SEQ ID NO: 15, to obtain a sequence corresponding to SEQ ID NO: 66,
3) N-концевая сигнальная последовательность, происходящая из альбумина из SEQ ID NO: 32, со стороны аминоконца фрагмента CCN5, состоящего из аминокислот 194-246, соответствующего SEQ ID NO: 1, в комбинации с вариантом пептидного линкера, соответствующим SEQ ID NO: 67, и Fc-фрагментом из SEQ ID NO: 15, с получением последовательности, соответствующей SEQ ID NO: 68,3) an N-terminal signal sequence derived from the albumin of SEQ ID NO: 32, at the amino terminus of the CCN5 fragment consisting of amino acids 194-246, corresponding to SEQ ID NO: 1, in combination with a peptide linker variant corresponding to SEQ ID NO: 67 and the Fc fragment of SEQ ID NO: 15, to obtain a sequence corresponding to SEQ ID NO: 68,
4) N-концевая сигнальная последовательность, происходящая из альбумина из SEQ ID NO: 32, со стороны аминоконца фрагмента CCN5, состоящего из аминокислот 194-246, соответствующего SEQ ID NO: 1, в комбинации с вариантом пептидного линкера, соответствующим SEQ ID NO: 65, и Fc-фрагментом из SEQ ID NO: 19, с получением последовательности, соответствующей SEQ ID NO: 69.4) an N-terminal signal sequence derived from the albumin of SEQ ID NO: 32, from the amino terminus of the CCN5 fragment consisting of amino acids 194-246, corresponding to SEQ ID NO: 1, in combination with a peptide linker variant corresponding to SEQ ID NO: 65 and the Fc fragment of SEQ ID NO: 19, to obtain a sequence corresponding to SEQ ID NO: 69.
Указанные версии (1-4, выше) белка, раскрытого в Примере 12, действительно показали некоторое повышение устойчивости к протеолитическому расщеплению во время экспрессии в системе ExpiCHO, проведенной согласно описанию в Примере 9. Однако при экспрессии белков, соответствующих SEQ ID NO: 64, SEQ ID. NO 66, SEQ ID NO: 68 и SEQ ID 69, обнаружилось, что степень протеолитической устойчивости все же была недостаточной, чтобы обеспечить получение интактных очищенных белков.The versions (1-4, above) of the protein disclosed in Example 12 did show some increase in resistance to proteolytic cleavage when expressed in the ExpiCHO system as described in Example 9. However, when expressing proteins corresponding to SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68 and SEQ ID 69, it was found that the degree of proteolytic resistance was still insufficient to ensure the production of intact purified proteins.
Пример 11Example 11
Получали слитый белок, содержащий аминокислоты 194-237 CCN5, где аминокислота в положении 195 (пролин) заменена на аланин (SEQ ID NO: 38), слитый на N-конце с пептидным линкером (SEQ ID NO: 21) и химерным Fc-фрагментом IgG подтипа IgG2/4 с делецией карбоксиконцевого K477- (Eu-нумерация) (SEQ ID NO: 19), с получением SEQ ID NO: 27. К слитому белку дополнительно добавляли N-концевую сигнальную последовательность для секреции, происходящую из альбумина SEQ ID NO: 32, с получением слитого белка, соответствующего SEQ ID NO: 70. Последовательность ДНК, кодирующая слитый белок из SEQ ID NO: 70, была кодон-оптимизирована для экспрессии белка в клетках хомяка (с использованием алгоритма коммерческого поставщика), последовательность KOZAK для трансляции присоединяли на 5'-конце, а стоп-кодон вводили на 3'-конце, получая последовательность ДНК из SEQ ID NO: 71. Указанную последовательность ДНК также дополняли на обоих концах сайтами attB Gateway, получая последовательность ДНК из SEQ ID NO: 72.A fusion protein was obtained containing amino acids 194-237 of CCN5, where the amino acid at position 195 (proline) was replaced with alanine (SEQ ID NO: 38), fused at the N-terminus with a peptide linker (SEQ ID NO: 21) and a chimeric Fc fragment of IgG subtype IgG2/4 with a deletion of the carboxy-terminal K477- (Eu numbering) (SEQ ID NO: 19), to obtain SEQ ID NO: 27. An N-terminal secretion signal sequence derived from albumin SEQ ID NO: 32 was additionally added to the fusion protein, to obtain a fusion protein corresponding to SEQ ID NO: 70. The DNA sequence encoding the fusion protein of SEQ ID NO: 70 was codon-optimized for protein expression in hamster cells. (using a commercial supplier's algorithm), a KOZAK sequence for translation was added at the 5' end and a stop codon was introduced at the 3' end, yielding the DNA sequence of SEQ ID NO: 71. This DNA sequence was also complemented at both ends with attB Gateway sites, yielding the DNA sequence of SEQ ID NO: 72.
Последовательности ДНК синтезировал и верифицировал коммерческий поставщик перед субклонированием с получением плазмид согласно описанию в Примере 9, и белок, соответствующий SEQ ID NO: 70 экспрессировали путем транзиентной трансфекции клеток ExpiCHO согласно описанию в Примере 9.The DNA sequences were synthesized and verified by a commercial supplier before subcloning to produce plasmids as described in Example 9, and the protein corresponding to SEQ ID NO: 70 was expressed by transient transfection of ExpiCHO cells as described in Example 9.
Клетки осаждали через 6 дней после трансфекции центрифугированием при 4750xg в течение 20 минут при 4°С и собирали супернатант клеточной культуральной среды. Добавляли 0,1М ПМСФ в 100% изопропаноле до концентрации 0,1 мМ. Добавляли 1М цитрат Na, рН 5,5 до конечной концентрации 30 мМ перед хроматографическим очищением.Cells were pelleted 6 days post-transfection by centrifugation at 4750 x g for 20 min at 4°C and the cell culture medium supernatant was collected. 0.1 M PMSF in 100% isopropanol was added to a concentration of 0.1 mM. 1 M Na citrate, pH 5.5, was added to a final concentration of 30 mM before chromatographic purification.
Белок очищали тандемной хроматографией, состоящей из этапа захвата на колонке HiTrap ™ MabSelectSuRe™ 1 мл (GE Healthcare) непосредственно за которым следовало высаливание на колонке BioScale™ Mini Bio-Gel® Р-6 10 мл (BioRad). Колонки устанавливали в систему FPLC-хроматографии (система BioRad NGC Discover™ 10 Pro), оснащенную проточной кюветой для УФ-детекции с длиной оптического пути 5 мм. Колонку MabSelectSuRe™ устанавливали на первый клапан для переключения колонки и уравновешивали буфером, состоящим из 30 мМ цитрата Na, рН 5,5, а колонку Bio-Gel® устанавливали на второй клапан для переключения колонки и уравновешивали буфером А2 (100 мМ NaH2PO4/Na2HPO4 рН 6,5). При установленном в положение для обхода втором клапане для переключения колонки, содержащем колонку Bio-Gel®, 140 мл собранной клеточной культуральной среды, содержащей рекомбинантный белок, загружали на колонку MabSelectSuRe™ с помощью пробоотборного насоса со скоростью 2,0 мл/мин, с последующим промыванием 5 объемами колонки промывочного буфера А1 (30 мМ цитрат Na, рН 5,5), а затем 5 объемами колонки промывочного буфера A3 (30 мМ цитрат Na, 0,5М NaCl, рН 5,5), и затем 3 объемами колонки промывочного буфера А1. До элюирования элюирующим буфером (30 мМ лимонная кислота, рН 3,4) колонку Bio-Gel®, установленную на второй клапан для переключения колонки, устанавливали в положение для подключения к проточному каналу. После элюирования 2 мл элюирующего буфера колонку MabSelectSuRe™ отключали от проточного канала и очищенный белок элюировали с колонки Bio-Gel® буфером А2. Элюирование белка отслеживали по поглощению УФ при 280 нм и запускали сбор, когда показатель поглощения превышал 100 мЕОП. Собранные фракции объединяли и образец 10 мкл подвергали ДСН-ПААГ с использованием готовых гелей Mini-PROTEAN® TGX Stain-Free™ в присутствии восстанавливающего агента β-меркаптоэтанола, и выделенные рекомбинантные белки визуализировали с использованием системы визуализации ChemiDoc™ (BioRad).The protein was purified by tandem chromatography consisting of a capture step on a 1 ml HiTrap™ MabSelectSuRe™ column (GE Healthcare) immediately followed by salting out on a 10 ml BioScale™ Mini Bio-Gel® P-6 column (BioRad). The columns were installed on an FPLC system (BioRad NGC Discover™ 10 Pro system) equipped with a 5 mm pathlength UV detection flow cell. The MabSelectSuRe™ column was installed on the first column switching valve and equilibrated with a buffer consisting of 30 mM Na citrate, pH 5.5, and the Bio-Gel® column was installed on the second column switching valve and equilibrated with buffer A2 (100 mM NaH 2 PO4/Na 2 HPO4 pH 6.5). With the second column switching valve containing the Bio-Gel® column set to the bypass position, 140 mL of harvested cell culture medium containing the recombinant protein was loaded onto the MabSelectSuRe™ column using the sample pump at a flow rate of 2.0 mL/min, followed by a wash with 5 column volumes of Wash Buffer A1 (30 mM Na citrate, pH 5.5), then 5 column volumes of Wash Buffer A3 (30 mM Na citrate, 0.5 M NaCl, pH 5.5), and then 3 column volumes of Wash Buffer A1. Before elution with the elution buffer (30 mM citric acid, pH 3.4), the Bio-Gel® column set on the second column switching valve was set to the flow channel position. After elution with 2 ml of elution buffer, the MabSelectSuRe™ column was disconnected from the flow channel and the purified protein was eluted from the Bio-Gel® column with buffer A2. Protein elution was monitored by UV absorbance at 280 nm and collection was initiated when the absorbance was greater than 100 mOOP. The collected fractions were pooled and a 10 µl sample was subjected to SDS-PAGE using Mini-PROTEAN® TGX Stain-Free™ precast gels in the presence of the reducing agent β-mercaptoethanol and the isolated recombinant proteins were visualized using the ChemiDoc™ Imaging System (BioRad).
На Фиг. 7 показано, что экспрессия и очищение белка, соответствующего SEQ ID NO: 27, где карбоксиконцевой фрагмент CCN5 усеченный, по существу более протеолитически устойчивы, чем варианты, где присутствуют все карбоксиконцевые аминокислоты CCN5 (как в SEQ ID NO: 58, 64, 66, 68 и 69), даже несмотря на то, что клеточную культуральную среду собирали позже на 2 дня после субкультивирования по сравнению с Примером 9 (Фиг. 6).Fig. 7 shows that the expression and purification of the protein corresponding to SEQ ID NO: 27, where the carboxy-terminal fragment of CCN5 is truncated, is substantially more proteolytically stable than variants where all carboxy-terminal amino acids of CCN5 are present (as in SEQ ID NOs: 58, 64, 66, 68 and 69), even though the cell culture medium was harvested 2 days later after subculture compared to Example 9 (Fig. 6).
Пример 12Example 12
Получали слитый белок, содержащий аминокислоты 206-249 CCN3, где аминокислота в положении 207 (изолейцин) заменена на аланин (SEQ ID NO: 44), слитый на N-конце с пептидным линкером (SEQ ID NO: 21) и химерным Fc-фрагментом IgG подтипа IgG2/4 с делецией карбоксиконцевого K477- (Eu-нумерация) (SEQ ID NO: 19), с получением слитого белка из SEQ ID NO: 73. К слитому белку дополнительно добавляли N-концевую сигнальную последовательность для секреции, происходящую из альбумина SEQ ID NO: 32, с получением слитого белка, соответствующего SEQ ID NO: 74. Последовательность ДНК, кодирующая слитый белок из SEQ ID NO: 74, была кодон-оптимизирована для экспрессии белка в клетках хомяка (с использованием алгоритма коммерческого поставщика), последовательность KOZAK для трансляции присоединяли на 5'-конце, а стоп-кодон вводили на 3'-конце, получая последовательность ДНК из SEQ ID NO: 75. Последовательность ДНК также дополняли на обоих концах сайтами attB Gateway, получая последовательность ДНК из SEQ ID NO: 76.A fusion protein was prepared comprising amino acids 206-249 of CCN3, where the amino acid at position 207 (isoleucine) was replaced with alanine (SEQ ID NO: 44), fused at the N-terminus to a peptide linker (SEQ ID NO: 21) and a chimeric Fc fragment of IgG subtype IgG2/4 with a deletion of the carboxy-terminal K477- (Eu numbering) (SEQ ID NO: 19), to obtain the fusion protein of SEQ ID NO: 73. An N-terminal secretion signal sequence derived from albumin of SEQ ID NO: 32 was further added to the fusion protein, to obtain the fusion protein corresponding to SEQ ID NO: 74. The DNA sequence encoding the fusion protein of SEQ ID NO: 74 was codon-optimized for protein expression in hamster cells (using a commercial supplier's algorithm), a KOZAK sequence for translation was added at the 5' end and a stop codon was introduced at the 3' end, yielding the DNA sequence of SEQ ID NO: 75. The DNA sequence was also complemented at both ends with attB Gateway sites, yielding the DNA sequence of SEQ ID NO: 76.
Последовательности ДНК синтезировал и верифицировал коммерческий поставщик перед субклонированием с получением плазмид согласно описанию в Примере 9, и белок, соответствующий SEQ ID NO: 74, экспрессировали путем транзиентной трансфекции клеток ExpiCHO согласно описанию в Примере 9.The DNA sequences were synthesized and verified by a commercial supplier before subcloning to produce plasmids as described in Example 9, and the protein corresponding to SEQ ID NO: 74 was expressed by transient transfection of ExpiCHO cells as described in Example 9.
Клетки осаждали через 5 дней после трансфекции центрифугированием при 4750xg в течение 20 минут при 4°С и собирали супернатант клеточной культуральной среды. Добавляли 0,1М ПМСФ в 100% изопропаноле до концентрации 0,1 мМ. Добавляли 1М цитрат Na, рН 5,5 до конечной концентрации 30 мМ перед хроматографическим очищением.Cells were pelleted 5 days post-transfection by centrifugation at 4750xg for 20 min at 4°C and the cell culture medium supernatant was collected. 0.1 M PMSF in 100% isopropanol was added to a concentration of 0.1 mM. 1 M Na citrate, pH 5.5, was added to a final concentration of 30 mM before chromatographic purification.
Белок очищали тандемной хроматографией, состоящей из этапа захвата на колонке HiTrap™ MabSelectSuRe™ 5 мл (GE Healthcare), непосредственно за которым следовало высаливание на высаливающей колонке 53 мл HiPrep™ 26/10 (GE Healthcare). Колонки устанавливали в систему FPLC-хроматографии (система BioRad NGC Discover™ 10 Pro), оснащенную проточной кюветой для УФ-детекции с длиной оптического пути 5 мм. Колонку MabSelectSuRe™ устанавливали на первый клапан для переключения колонки и уравновешивали буфером, состоящим из 30 мМ цитрата Na, рН 5,5, а колонку HiPrep™ устанавливали на второй клапан для переключения колонки и уравновешивали буфером А2 (100 мМ NaH2PO4/Na2HPO4 рН 6,5). При установленном в положение для обхода втором клапане для переключения колонки, содержащем колонку HiPrep™, 260 мл собранной клеточной культуральной среды, содержащей рекомбинантный белок, загружали на колонку MabSelectSuRe™ с помощью пробоотборного насоса со скоростью 3,5 мл/мин, с последующим промыванием 5 объемами колонки промывочного буфера А1 (30 мМ цитрат Na, рН 5,5), затем 5 объемами колонки промывочного буфера A3 (30 мМ цитрат Na, 0,5М NaCl, рН 5,5), и затем 2 объемами колонки промывочного буфера А1. До элюирования элюирующим буфером (30 мМ лимонная кислота, рН 3,4) колонку HiPrep™, установленную на второй клапан для переключения колонки, устанавливали в положение для подключения к проточному каналу. После элюирования 10 мл элюирующего буфера колонку MabSelectSuRe™ отключали от проточного канала, и очищенный белок элюировали с колонки HiPrep™ буфером А2. Элюирование белка отслеживали по поглощению УФ при 280 нм и запускали сбор, когда показатель поглощения превышал 100 мЕОП. Собранные фракции объединяли и образец объемом 10 мкл подвергали ДСН-ПААГ с использованием готовых гелей Mini-PROTEAN® TGX Stain-Free™ в присутствии или в отсутствие восстанавливающего агента β-меркаптоэтанола и выделенные рекомбинантные белки визуализировали с использованием системы визуализации ChemiDoc™ (BioRad).The protein was purified by tandem chromatography consisting of a capture step on a 5 ml HiTrap™ MabSelectSuRe™ column (GE Healthcare) immediately followed by salting out on a 53 ml HiPrep™ 26/10 salting out column (GE Healthcare). The columns were mounted on an FPLC system (BioRad NGC Discover™ 10 Pro system) equipped with a 5 mm pathlength UV flow cell. The MabSelectSuRe™ column was mounted on the first switching valve and equilibrated with 30 mM Na citrate, pH 5.5 buffer, and the HiPrep™ column was mounted on the second switching valve and equilibrated with Buffer A2 (100 mM NaH 2 PO4/Na 2 HPO4 pH 6.5). With the second column switching valve containing the HiPrep™ column set to the bypass position, 260 mL of harvested cell culture medium containing the recombinant protein was loaded onto the MabSelectSuRe™ column using the sample pump at a flow rate of 3.5 mL/min, followed by a wash with 5 column volumes of Wash Buffer A1 (30 mM Na citrate, pH 5.5), then 5 column volumes of Wash Buffer A3 (30 mM Na citrate, 0.5 M NaCl, pH 5.5), and then 2 column volumes of Wash Buffer A1. Prior to elution with the elution buffer (30 mM citric acid, pH 3.4), the HiPrep™ column, mounted on the second column switching valve, was set to the flow channel position. After elution with 10 ml of elution buffer, the MabSelectSuRe™ column was disconnected from the flow channel and the purified protein was eluted from the HiPrep™ column with buffer A2. Protein elution was monitored by UV absorbance at 280 nm and collection was initiated when the absorbance was greater than 100 mODU. The collected fractions were pooled and a 10 µl sample was subjected to SDS-PAGE using Mini-PROTEAN® TGX Stain-Free™ precast gels in the presence or absence of the reducing agent β-mercaptoethanol and the isolated recombinant proteins were visualized using the ChemiDoc™ Imaging System (BioRad).
На Фиг. 8 можно видеть, что слитый белок, содержащий аминокислоты, происходящие из CCN3/NOv (домен III/домен гомологии с TSP-1), согласно описанию в SEQ ID NO: 73, аналогичный слитому белку, содержащему аминокислоты, происходящие из гомологичного CCN5 (домен III/домен гомологии с TSP-1), согласно описанию в SEQ ID NO: 27, обладает аналогичной или лучшей устойчивостью к протеолизу, чем слитый белок, содержащий аминокислоты, происходящие из CCN5, согласно описанию в Примере 11 и на Фиг. 7.In Fig. 8, it can be seen that the fusion protein comprising amino acids derived from CCN3/NOv (domain III/TSP-1 homology domain) as described in SEQ ID NO: 73, similar to the fusion protein comprising amino acids derived from homologous CCN5 (domain III/TSP-1 homology domain) as described in SEQ ID NO: 27, has a similar or better resistance to proteolysis than the fusion protein comprising amino acids derived from CCN5 as described in Example 11 and in Fig. 7.
Пример 13Example 13
Слитый белок, содержащий аминокислоты 194-246 CCN5, где аминокислота в положении 195 (пролин) заменена на аланин (SEQ ID NO: 7), слитый на С-конце с пептидным линкером (SEQ ID NO: 39) и Fc-фрагментом IgG подкласса IgG4 из SEQ ID NO: 15 (S228P, F234A, L235A, K447-, Eu-нумерация), с получением последовательности белка, соответствующего SEQ ID NO: 41, дополняли N-концевой сигнальной последовательностью для секреции, происходящей из альбумина из SEQ ID NO: 32, с получением слитого белка, соответствующего SEQ ID NO: 77. Последовательность ДНК, кодирующая слитый белок из SEQ ID NO: 77, была кодон-оптимизирована для экспрессии белка в клетках хомяка (с использованием алгоритма коммерческого поставщика), последовательность KOZAK для трансляции присоединяли на 5'-конце, а стоп-кодон вводили на 3'-конце, получая последовательность ДНК из SEQ ID NO: 78. Последовательность ДНК также дополняли на обоих концах сайтами attB Gateway, получая последовательность ДНК из SEQ ID NO: 79.A fusion protein comprising amino acids 194-246 of CCN5, wherein the amino acid at position 195 (proline) is replaced by alanine (SEQ ID NO: 7), fused at the C-terminus with a peptide linker (SEQ ID NO: 39) and the Fc fragment of IgG subclass IgG4 from SEQ ID NO: 15 (S228P, F234A, L235A, K447-, Eu-numbering), to yield the protein sequence corresponding to SEQ ID NO: 41, was complemented with the N-terminal signal sequence for secretion derived from albumin from SEQ ID NO: 32, to yield the fusion protein corresponding to SEQ ID NO: 77. The DNA sequence encoding the fusion protein of SEQ ID NO: 77 was codon-optimized for protein expression in hamster cells (using a commercial supplier's algorithm), a KOZAK sequence for translation was added at the 5' end and a stop codon was introduced at the 3' end, yielding the DNA sequence of SEQ ID NO: 78. The DNA sequence was also complemented at both ends with attB Gateway sites, yielding the DNA sequence of SEQ ID NO: 79.
Последовательность из SEQ ID NO: 79 синтезировал и верифицировал коммерческий поставщик. Синтезированную последовательность рекомбинировали с pDonrZeo путем рекомбиназного клонирования BP Gateway для получения входящего вектора. После трансфекции компетентных E.coli, мутированных так, чтобы позволять эффективное размножение плазмид (клетки One Shot Top10™), входящий вектор выделяли с помощью стандартных методик выделения плазмид с использованием набора QIAprep™ Spin Miniprep от Qiagen™. После выделения плазмиды входящий вектор верифицировали путем расщепления рестрикционными ферментами с последующим гель-электрофорезом ДНК в соответствии со стандартными методиками, хорошо известными специалисту.The sequence of SEQ ID NO: 79 was synthesized and verified by a commercial supplier. The synthesized sequence was recombined into pDonrZeo by BP Gateway recombinase cloning to generate the entry vector. Following transfection of competent E. coli mutated to allow efficient plasmid propagation (One Shot Top10™ cells), the entry vector was isolated using standard plasmid isolation techniques using the QIAprep™ Spin Miniprep Kit from Qiagen™. Following plasmid isolation, the entry vector was verified by restriction enzyme digestion followed by DNA gel electrophoresis according to standard techniques well known to those skilled in the art.
Входящий вектор, содержащий последовательность SEQ ID NO: 78, дополнительно рекомбинировали с принимающим вектором с применением рекомбиназы LR Gateway. Использовали принимающий вектор pUCOE-DHFR-DEST, согласно описанию в источнике: et al., 2018, J. Biol. Chem, 293:46, pp. 17953 - 17970.The input vector containing the sequence SEQ ID NO: 78 was further recombined with the receiving vector using LR Gateway recombinase. The receiving vector used was pUCOE-DHFR-DEST, as described in the source: et al., 2018, J. Biol. Chem, 293:46, pp. 17953 - 17970.
После трансфекции компетентных E.coli, мутированных так, чтобы позволять эффективное размножение плазмид (клетки One Shot Top10™), экспрессионный вектор выделяли с помощью стандартных методик выделения плазмид с применением набора QIAGEN™ Plasmid Plus Maxi Kit. Итоговый экспрессионный вектор верифицировали с помощью стандартного расщепления рестрикционными ферментами и гель-электрофореза ДНК в соответствии со стандартными методиками, хорошо известными специалисту. Затем итоговый экспрессионный вектор переносили в адаптированные к суспензионной культуре клетки СНО DG44 путем электропорации с использованием системы трансфекции Neon (ThermoFisherScientilic).Following transfection of competent E. coli mutated to allow efficient propagation of the plasmids (One Shot Top10™ cells), the expression vector was isolated using standard plasmid isolation techniques using the QIAGEN™ Plasmid Plus Maxi Kit. The resulting expression vector was verified using standard restriction enzyme digestion and DNA gel electrophoresis according to standard techniques well known to those skilled in the art. The resulting expression vector was then transferred into suspension-adapted CHO DG44 cells by electroporation using the Neon Transfection System (ThermoFisherScientilic).
Клетки поддерживали в вентилируемых колбах Эрленмейера в инкубаторах для клеточных культур при 37°С с 8% CO2 на шейкерной платформе (согласно описанию Kaasbøll и соавторов, выше). Трансфицированные клетки выдерживали в течение ночи в среде CD для клеток DG44 (Gibco, кат. №12610-010) до перенесения в среду HyClone ™ ActiPro™ (без гипоксантина и тимидина, GE Healthcare), и субкультивировали до 80% жизнеспособности, в этот момент в среду добавляли 0,1 мкМ метотрексат. После добавления 0,1 мкМ метотрексата клетки субкультивировали до повторного достижения 80% жизнеспособности, в этот момент в среду добавляли 1 мкМ метотрексат. Клетки снова субкультивировали до превышения 98% жизнеспособности и снижения времени удвоения до менее чем 26 часов, после чего пул клеток считали стабильно трансфицированным. После получения стабильного пула клеток объем клеточной культуры увеличивали, чтобы обеспечить заселение стабильно трансфицированными клетками для продуцирования с плотностью, составляющей 1*106 клеток/мл. В культуры клеток добавляли 4/0,4% по объему HyClone™ Cell Boost™ 7a/7b ежедневно, начиная с 3 дня после субкультивирования. Через 10 дней клетки осаждали центрифугированием при 4750xg в течение 20 минут при 4°С и собирали супернатант клеточной культуральной среды. Добавляли 0,1 М ПМСФ в 100% изопропаноле до концентрации 0,1 мМ. Добавляли 1М цитрат Na, рН 5,5 до конечной концентрации 30 мМ перед хроматографическим очищением.Cells were maintained in ventilated Erlenmeyer flasks in cell culture incubators at 37°C with 8% CO2 on a shaking platform (as described by Kaasbøll et al., above). Transfected cells were maintained overnight in DG44 CD medium (Gibco, cat. #12610-010) before being transferred to HyClone™ ActiPro™ medium (hypoxanthine- and thymidine-free, GE Healthcare) and subcultured to 80% viability, at which point 0.1 μM methotrexate was added to the medium. After addition of 0.1 μM methotrexate, cells were subcultured until 80% viability was again reached, at which point 1 μM methotrexate was added to the medium. The cells were again subcultured until viability exceeded 98% and the doubling time decreased to less than 26 h, at which point the cell pool was considered stably transfected. Once a stable cell pool was obtained, the cell culture volume was expanded to ensure seeding with stably transfected cells for production at a density of 1 x 10 6 cells/mL. Cell cultures were supplemented with 4/0.4% (v/v) HyClone™ Cell Boost™ 7a/7b daily starting on day 3 after subculture. After 10 days, cells were pelleted by centrifugation at 4750 x g for 20 min at 4°C and the cell culture medium supernatant was collected. 0.1 M PMSF in 100% isopropanol was added to a concentration of 0.1 mM. 1 M Na citrate, pH 5.5, was added to a final concentration of 30 mM before chromatographic purification.
Белок очищали тандемной хроматографией, состоящей из этапа захвата на колонке HiTrap™ MabSelectSuRe™ 5 мл (GE Healthcare), непосредственно за которым следовало высаливание на высаливающей колонке HiPrep™ 26/10 53 мл (GE Healthcare), согласно описанию в Примере 15. Очищенный белковый состав (без наблюдаемых признаков протеолитического процессинга) затем тестировали на способность ингибировать способствующую выживанию сигнализацию (фосфорилирование серина-473 AKT) в клетках рака легкого человека А549 согласно описанию в Примере 2. Как можно видеть на Фиг. 9, очищенный белок, соответствующий SEQ ID NO: 41, продуцированный стабильно трансфицированным пулом суспензионных клеток СНО, неожиданным образом не показал признаков способности ингибировать фосфорилирование AKT (серии 473).The protein was purified by tandem chromatography consisting of a capture step on a HiTrap™ MabSelectSuRe™ 5 ml column (GE Healthcare) immediately followed by salting out on a HiPrep™ 26/10 53 ml salting out column (GE Healthcare), as described in Example 15. The purified protein composition (with no observable signs of proteolytic processing) was then tested for the ability to inhibit pro-survival signaling (AKT serine 473 phosphorylation) in A549 human lung cancer cells as described in Example 2. As can be seen in Fig. 9, the purified protein corresponding to SEQ ID NO: 41, produced by the stably transfected pool of CHO suspension cells, unexpectedly showed no signs of the ability to inhibit AKT phosphorylation (serine 473).
Пример 14Example 14
Получали слитый белок, содержащий аминокислоты 206-249 CCN3 (SEQ ID NO: 44), где аминокислота в положении 207 (изолейцин) заменена на аланин, слитый на N-конце с пептидным линкером (SEQ ID NO: 22) и химерным Fc-фрагментом IgG подтипа IgG2/4 (SEQ ID NO: 19), с получением последовательности белка, соответствующего SEQ ID NO: 80, которую дополняли N-концевой сигнальной последовательностью для секреции, происходящей из альбумина из SEQ ID NO: 32, с получением слитого белка, соответствующего SEQ ID NO: 81. Последовательность ДНК, кодирующая слитый белок из SEQ ID NO: 81, была кодон-оптимизирована для экспрессии белка в клетках хомяка (с использованием алгоритма коммерческого поставщика), последовательность KOZAK для трансляции присоединяли на 5'-конце, а стоп-кодон вводили на 3'-конце, получая последовательность ДНК из SEQ ID NO: 82. Последовательность ДНК также дополняли на обоих концах сайтами attB Gateway, получая последовательность ДНК из SEQ ID NO: 83.A fusion protein was prepared containing amino acids 206-249 of CCN3 (SEQ ID NO: 44), where the amino acid at position 207 (isoleucine) was replaced with alanine, fused at the N-terminus to a peptide linker (SEQ ID NO: 22) and a chimeric Fc fragment of IgG subtype IgG2/4 (SEQ ID NO: 19), to yield the protein sequence corresponding to SEQ ID NO: 80, which was complemented with the N-terminal signal sequence for secretion derived from albumin from SEQ ID NO: 32, to yield the fusion protein corresponding to SEQ ID NO: 81. The DNA sequence encoding the fusion protein of SEQ ID NO: 81 was codon-optimized for expression of the protein in hamster cells (using a commercial supplier's algorithm), the KOZAK sequence for translation was added at the 5' end, and a stop codon was introduced at the 3' end, yielding the DNA sequence of SEQ ID NO: 82. The DNA sequence was also complemented at both ends with attB Gateway sites, yielding the DNA sequence of SEQ ID NO: 83.
Последовательность из SEQ ID NO: 83 синтезировал и верифицировал коммерческий поставщик. Синтезированную последовательность рекомбинировали с pDonrZeo путем рекомбиназного клонирования BP Gateway для получения входящего вектора. После трансфекции компетентных E.coli, мутированных так, чтобы позволять эффективное размножение плазмид (клетки One Shot Top10™), входящий вектор выделяли с помощью стандартных методик выделения плазмид с использованием набора QIAprep™ Spin Miniprep от Qiagen™. После выделения плазмиды входящий вектор верифицировали путем расщепления рестрикционными ферментами с последующим гель-электрофорезом ДНК в соответствии со стандартными методиками, хорошо известными специалисту.The sequence of SEQ ID NO: 83 was synthesized and verified by a commercial supplier. The synthesized sequence was recombined into pDonrZeo by BP Gateway recombinase cloning to generate the entry vector. Following transfection of competent E. coli mutated to allow efficient plasmid propagation (One Shot Top10™ cells), the entry vector was isolated using standard plasmid isolation techniques using the QIAprep™ Spin Miniprep Kit from Qiagen™. Following plasmid isolation, the entry vector was verified by restriction enzyme digestion followed by DNA gel electrophoresis according to standard techniques well known to those skilled in the art.
Входящий вектор, содержащий последовательность SEQ ID NO: 82, дополнительно рекомбинировали с принимающим вектором с применением рекомбиназы LR Gateway. Использовали принимающий вектор pUCOE-DHFR-DEST, согласно описанию в источнике: et al., 2018, J. Biol. Chem, 293:46, pp.17953-17970.The input vector containing the sequence SEQ ID NO: 82 was further recombined with the receiving vector using LR Gateway recombinase. The receiving vector used was pUCOE-DHFR-DEST, as described in the source: et al., 2018, J. Biol. Chem, 293:46, pp.17953-17970.
После трансфекции компетентных E.coli, мутированных так, чтобы позволять эффективное размножение плазмид (клетки One Shot Top10™), экспрессионный вектор выделяли с помощью стандартных методик выделения плазмид с применением набора QIAGEN™ Plasmid Plus Maxi Kit. Итоговый экспрессионный вектор верифицировали с помощью стандартного расщепления рестрикционными ферментами и гель-электрофореза ДНК в соответствии со стандартными методиками, хорошо известными специалисту. Затем итоговый экспрессионный вектор переносили в адаптированные к суспензионной культуре клетки СНО ExpiCHO в соответствии с протоколом «Создания и масштабирования стабильной клеточной линии с использованием продуктов ExpiCHO™» от изготовителя среды для продуцирования ExpiCHO™ Stable Production Medium (Gibco, кат. №:A3711001). Клетки поддерживали в вентилируемых колбах Эрленмейера в инкубаторах для клеточных культур при 37°С с 8% CO2 на шейкерной платформе (согласно описанию Kaasbøll и соавторов, выше). Трансфицированные клетки выдерживали в течение ночи в среде для экспрессии в клетках ExpiCHO™ до перенесения на среду для экспрессии в клетках ExpiCHO™ с добавлением 0,1 мкМ метотрексата. Затем клетки субкультивировали до повторного достижения 80% жизнеспособности, в этот момент в среду добавляли 1 мкМ метотрексат. Клетки снова субкультивировали до превышения 95% жизнеспособности и снижения времени удвоения до менее чем 20 часов, после чего пул клеток считали стабильно трансфицированным. После получения стабильного пула клеток объем клеточной культуры увеличивали, чтобы обеспечить заселение стабильно трансфицированными клетками для продуцирования с плотностью, составляющей 1*10∧6 клеток/мл. Через 5 дней клетки осаждали центрифугированием при 4750xg в течение 20 минут при 4°С и собирали супернатант клеточной культуральной среды. Добавляли 0,1М ПМСФ в 100% изопропаноле до концентрации 0,1 мМ. Добавляли 1М цитрат Na, рН 5,5 до конечной концентрации 30 мМ и добавляли 2М L-аргинин, рН 4,0 до конечной концентрации 100 мМ перед хроматографическим очищением.Following transfection of competent E. coli mutated to allow efficient propagation of the plasmids (One Shot Top10™ cells), the expression vector was isolated using standard plasmid isolation techniques using the QIAGEN™ Plasmid Plus Maxi Kit. The resulting expression vector was verified using standard restriction enzyme digestion and DNA gel electrophoresis according to standard techniques well known to those skilled in the art. The resulting expression vector was then transformed into suspension-adapted CHO ExpiCHO cells according to the protocol “Establishment and Scale-up of a Stable Cell Line Using ExpiCHO™ Products” from the manufacturer of ExpiCHO™ Stable Production Medium (Gibco, Cat.#:A3711001). Cells were maintained in ventilated Erlenmeyer flasks in cell culture incubators at 37°C with 8% CO2 on a shaking platform (as described by Kaasbøll et al., above). Transfected cells were maintained overnight in ExpiCHO™ Cell Expression Medium before being transferred to ExpiCHO™ Cell Expression Medium supplemented with 0.1 μM methotrexate. Cells were then subcultured until viability again reached 80%, at which point 1 μM methotrexate was added to the medium. Cells were again subcultured until viability exceeded 95% and doubling time decreased to less than 20 hours, at which point the cell pool was considered stably transfected. After obtaining a stable cell pool, the cell culture volume was expanded to ensure seeding with stably transfected production cells at a density of 1*10 ∧ 6 cells/ml. After 5 days, the cells were pelleted by centrifugation at 4750 x g for 20 min at 4°C and the cell culture medium supernatant was collected. 0.1 M PMSF in 100% isopropanol was added to a concentration of 0.1 mM. 1 M Na citrate, pH 5.5 was added to a final concentration of 30 mM and 2 M L-arginine, pH 4.0, was added to a final concentration of 100 mM before chromatographic purification.
Белок очищали тандемной хроматографией, состоящей из этапа захвата на колонке HiTrap™ MabSelect PrismA™ 5 мл (GE Healthcare), непосредственно за которым следовало высаливание на высаливающей колонке HiPrep™ 26/10 53 мл (GE Healthcare), с использованием протокола согласно описанию в Примере 12, за исключением добавления 100 мМ L-Аргинина в буфер A1, А2, A3 и В1. Затем очищенный белковый состав (не проявляющий признаков протеолитического процессинга) тестировали на способность ингибировать способствующую выживанию сигнализацию (фосфорилирование серина-473 AKT) в клетках рака легкого человека А549 согласно описанию в Примере 2. Как можно видеть на Фиг. 10, очищенный белок, соответствующий SEQ ID NO: 80, продуцированный стабильно трансфицированным пулом суспензионных клеток СНО, неожиданным образом не показал признаков способности ингибировать фосфорилирование AKT (серина 473) демонстрируя, что ни один из составов интактных димерных слитых с Fc белков, содержащих аминокислоты, происходящие из CCN5 (SEQ ID NO: 41, Пример 13, Фиг. 9) или аминокислоты, происходящие из CCN3 (SEQ ID NO: 80) не является биологически активным.The protein was purified by tandem chromatography consisting of a capture step on a HiTrap™ MabSelect PrismA™ 5 ml column (GE Healthcare) immediately followed by a salting out step on a HiPrep™ 26/10 53 ml salting out column (GE Healthcare), using the protocol described in Example 12, except for the addition of 100 mM L-Arginine to buffers A1, A2, A3 and B1. The purified protein composition (showing no evidence of proteolytic processing) was then tested for the ability to inhibit pro-survival signaling (phosphorylation of serine-473 by AKT) in A549 human lung cancer cells as described in Example 2. As can be seen in Fig. 10, the purified protein corresponding to SEQ ID NO: 80, produced by a stably transfected pool of CHO suspension cells, unexpectedly showed no evidence of the ability to inhibit AKT (serine 473) phosphorylation, demonstrating that neither of the intact dimeric Fc fusion protein formulations containing amino acids derived from CCN5 (SEQ ID NO: 41, Example 13, Fig. 9) or amino acids derived from CCN3 (SEQ ID NO: 80) are biologically active.
Пример 15Example 15
Экспрессионную плазмиду, описанную в Примере 14, содержащую SEQ ID NO: 82, кодирующую слитый белок, содержащий аминокислоты 206-249 CCN3 (SEQ ID NO: 44), где аминокислота в положении 207 (изолейцин) заменена на аланин, слитый на N-конце с пептидным линкером (SEQ ID NO: 22) и химерным Fc-фрагментом IgG подтипа IgG2/4 (SEQ ID NO: 19) с получением последовательности белка, соответствующего SEQ ID NO: 80, также дополненной N-концевой сигнальной последовательностью для секреции, происходящей из альбумина из SEQ ID NO: 32 и соответствующей SEQ ID NO: 81, экспрессировали путем транзиентной трансфекции клеток ExpiCHO™ согласно описанию в Примере 9. Клетки осаждали, согласно описанию в Примере 14, через 6 дней после трансфекции, и в среду вносили добавки согласно описанию в Примере 14. Белок очищали тандемной хроматографией, состоящей из этапа захвата на колонке HiTrap™ MabSelect PrismA™ 5 мл (GE Healthcare), непосредственно за которым следовало высаливание на высаливающей колонке HiPrep™ 26/10 53 мл (GE Healthcare), согласно описанию в Примере 14.The expression plasmid described in Example 14, comprising SEQ ID NO: 82 encoding a fusion protein comprising amino acids 206-249 of CCN3 (SEQ ID NO: 44), wherein the amino acid at position 207 (isoleucine) is replaced by alanine, fused at the N-terminus to a peptide linker (SEQ ID NO: 22) and a chimeric Fc fragment of IgG of the IgG2/4 subtype (SEQ ID NO: 19) to yield a protein sequence corresponding to SEQ ID NO: 80, also complemented by the N-terminal signal sequence for secretion derived from albumin of SEQ ID NO: 32 and corresponding to SEQ ID NO: 81, was expressed by transient transfection of ExpiCHO™ cells as described in Example 9. The cells were pelleted as described in In Example 14, 6 days after transfection, the medium was supplemented as described in Example 14. The protein was purified by tandem chromatography consisting of a capture step on a HiTrap™ MabSelect PrismA™ 5 ml column (GE Healthcare) immediately followed by salting out on a HiPrep™ 26/10 53 ml salting out column (GE Healthcare), as described in Example 14.
Очищенный белковый состав (который был частично протеолитически процессирован) затем тестировали на способность ингибировать способствующую выживанию сигнализацию (фосфорилирование серина-473 AKT) в клетках рака легкого человека А549 согласно описанию в Примере 2. Как можно видеть на Фиг. 11, очищенный белок, соответствующий SEQ ID NO: 80, продуцированный транзиентно трансфицированными клетками ExpiCHO™, проявлял зависимую от концентрации способность ингибировать фосфорилирование AKT (серии 473), демонстрируя, что экспрессионная система, используемая для получения слитого белка, соответствующего SEQ ID NO: 80, и, следовательно, степень наблюдаемого протеолитического процессинга существенно влияют на активность или отсутствие активности итогового белкового состава.The purified protein composition (which had been partially proteolytically processed) was then tested for the ability to inhibit pro-survival signaling (AKT serine-473 phosphorylation) in A549 human lung cancer cells as described in Example 2. As can be seen in Fig. 11, the purified protein corresponding to SEQ ID NO: 80 produced by transiently transfected ExpiCHO™ cells exhibited a concentration-dependent ability to inhibit AKT phosphorylation (series 473), demonstrating that the expression system used to produce the fusion protein corresponding to SEQ ID NO: 80, and thus the extent of proteolytic processing observed, significantly impacts the activity or inactivity of the resulting protein composition.
Пример 16Example 16
Слитый белок, содержащий аминокислоты 206-249 CCN3 (SEQ ID NO: 44), где аминокислота в положении 207 (изолейцин) заменена на аланин, слитый на N-конце с пептидным линкером (SEQ ID NO: 21) и Fc-фрагментом с индуцирующими образование мономеров и продлевающими время полужизни мутациями (SEQ ID NO: 55), с получением последовательности белка, соответствующего SEQ ID NO: 84, был дополнен N-концевой сигнальной последовательностью для секреции, происходящей из альбумина из SEQ ID NO: 32, с получением слитого белка, соответствующего SEQ ID NO: 85. Последовательность ДНК, кодирующая слитый белок из SEQ ID NO: 85, была кодон-оптимизирована для экспрессии белка в клетках хомяка (с использованием алгоритма коммерческого поставщика), последовательность KOZAK для трансляции присоединяли на 5'-конце, а стоп-кодон вводили на 3'-конце, получая последовательность ДНК из SEQ ID NO: 86. Последовательность ДНК также дополняли на обоих концах сайтами attB Gateway, получая последовательность ДНК из SEQ ID NO: 86. Последовательности ДНК синтезировал и верифицировал коммерческий поставщик перед субклонированием с получением плазмид согласно описанию в Примере 9, и их экспрессировали путем транзиентной трансфекции клеток ExpiCHO™ согласно описанию в Примере 9. Клетки осаждали, согласно описанию в Примере 14, через 5 дней после трансфекции и в среду вносили добавки согласно описанию в Примере 14. Белок очищали тандемной хроматографией, состоящей из этапа захвата на колонке HiTrap™ MabSelect PrismA™ 5 мл (GE Healthcare), непосредственно за которым следовало высаливание на высаливающей колонке HiPrep™ 26/10 53 мл (GE Healthcare) согласно описанию в Примере 14.A fusion protein comprising amino acids 206-249 of CCN3 (SEQ ID NO: 44), wherein the amino acid at position 207 (isoleucine) is replaced by alanine, fused at the N-terminus to a peptide linker (SEQ ID NO: 21) and an Fc fragment with monomer formation-inducing and half-life-extending mutations (SEQ ID NO: 55), to yield the protein sequence corresponding to SEQ ID NO: 84, was complemented with the N-terminal signal sequence for albumin-derived secretion from SEQ ID NO: 32, to yield the fusion protein corresponding to SEQ ID NO: 85. The DNA sequence encoding the fusion protein of SEQ ID NO: 85 was codon-optimized for protein expression in hamster cells (using a commercial supplier's algorithm), the KOZAK sequence for translation were added at the 5' end and a stop codon was introduced at the 3' end, yielding the DNA sequence of SEQ ID NO: 86. The DNA sequence was also complemented at both ends with attB Gateway sites, yielding the DNA sequence of SEQ ID NO: 86. The DNA sequences were synthesized and verified by a commercial supplier before being subcloned to generate plasmids as described in Example 9 and expressed by transient transfection of ExpiCHO™ cells as described in Example 9. Cells were pelleted as described in Example 14 5 days post-transfection and the medium was supplemented as described in Example 14. The protein was purified by tandem chromatography consisting of a capture step on a HiTrap™ MabSelect PrismA™ 5 ml column (GE Healthcare) immediately followed by salting out on a salting out column HiPrep™ 26/10 53 ml (GE Healthcare) as described in Example 14.
Очищенный белковый состав, который демонстрировал ожидаемую мономерную форму, затем тестировали на способность ингибировать способствующую выживанию сигнализацию (фосфорилирование серина-473 AKT) в клетках рака легкого человека А549 согласно описанию в Примере 2. Как можно видеть на Фиг. 12, очищенный белок, соответствующий SEQ ID NO: 84, проявлял зависимую от концентрации способность ингибировать фосфорилирование AKT (серии 473), демонстрируя, что другой мономерный слитый белок, содержащий аминокислоты из домена III/домена гомологии с TSP-1 белка CCN, обладал способностью ингибировать фосфорилирование AKT (серин-473) в клетках рака легкого человека А549.The purified protein composition, which exhibited the expected monomeric form, was then tested for the ability to inhibit pro-survival signaling (AKT serine-473 phosphorylation) in A549 human lung cancer cells as described in Example 2. As can be seen in Fig. 12, the purified protein corresponding to SEQ ID NO: 84 exhibited a concentration-dependent ability to inhibit AKT phosphorylation (series 473), demonstrating that another monomeric fusion protein containing amino acids from domain III/TSP-1 homology domain of CCN protein had the ability to inhibit AKT phosphorylation (serine-473) in A549 human lung cancer cells.
Пример 17Example 17
Слитый белок, содержащий аминокислоты 206-249 CCN3 (SEQ ID. NO: 44), где аминокислота в положении 207 (изолейцин) заменена на аланин, слитый на N-конце с пептидным линкером (SEQ ID NO: 21) и Fc-фрагментом с индуцирующими образование мономеров и стабильность мутациями (SEQ ID NO: 54), с получением последовательности белка, соответствующего SEQ ID NO: 88, был дополнен N-концевой сигнальной последовательностью для секреции, происходящей из альбумина из SEQ ID NO: 32 с получением слитого белка, соответствующего SEQ ID NO: 89. Последовательность ДНК, кодирующая слитый белок из SEQ ID NO: 89, была кодон-оптимизирована для экспрессии белка в клетках хомяка (с использованием алгоритма коммерческого поставщика), последовательность KOZAK для трансляции присоединяли на 5'-конце, а стоп-кодон вводили на 3'-конце, получая последовательность ДНК из SEQ ID NO: 90. Последовательность ДНК также дополняли на обоих концах сайтами attB Gateway, получая последовательность ДНК из SEQ ID NO: 91. Последовательности ДНК синтезировал и верифицировал коммерческий поставщик перед субклонированием с получением плазмид согласно описанию в Примере 9 и их экспрессировали путем транзиентной трансфекции клеток ExpiCHO™ согласно описанию в Примере 9. Клетки осаждали, согласно описанию в Примере 14, через 6 дней после трансфекции и в среду вносили добавки согласно описанию в Примере 14. Белок очищали тандемной хроматографией, состоящей из этапа захвата на колонке HiTrap™ MabSelect PrismA™ 5 мл (GE Healthcare), непосредственно за которым следовало высаливание на высаливающей колонке HiPrep™ 26/10 53 мл (GE Healthcare), согласно описанию в Примере 14.A fusion protein comprising amino acids 206-249 of CCN3 (SEQ ID NO: 44), where the amino acid at position 207 (isoleucine) is replaced by alanine, fused at the N-terminus to a peptide linker (SEQ ID NO: 21) and an Fc fragment with monomer formation and stability-inducing mutations (SEQ ID NO: 54), to yield the protein sequence corresponding to SEQ ID NO: 88, was supplemented with the N-terminal signal sequence for secretion derived from albumin from SEQ ID NO: 32 to yield the fusion protein corresponding to SEQ ID NO: 89. The DNA sequence encoding the fusion protein of SEQ ID NO: 89 was codon-optimized for protein expression in hamster cells (using a commercial supplier's algorithm), the KOZAK sequence for translation was added to 5' end and a stop codon was introduced at the 3' end, yielding the DNA sequence of SEQ ID NO: 90. The DNA sequence was also complemented at both ends with attB Gateway sites, yielding the DNA sequence of SEQ ID NO: 91. The DNA sequences were synthesized and verified by a commercial supplier before being subcloned to generate plasmids as described in Example 9 and expressed by transient transfection of ExpiCHO™ cells as described in Example 9. Cells were pelleted as described in Example 14 6 days post-transfection and the medium was supplemented as described in Example 14. The protein was purified by tandem chromatography consisting of a capture step on a HiTrap™ MabSelect PrismA™ 5 ml column (GE Healthcare) immediately followed by salting out on a HiPrep™ salting out column 26/10 53 ml (GE Healthcare), as described in Example 14.
Очищенный белковый состав, который в основном демонстрировал ожидаемую мономерную форму, затем тестировали на способность ингибировать способствующую выживанию сигнализацию (фосфорилирование серина-473 AKT) в клетках рака легкого человека А549 согласно описанию в Примере 2. Как можно видеть на Фиг. 13, очищенный белок, соответствующий SEQ ID NO: 88, проявлял зависимую от концентрации способность ингибировать фосфорилирование AKT (серии 473), демонстрируя, что другой мономерный слитый белок, содержащий аминокислоты из домена III/домен гомологии с TSP-1 белка CCN, обладал способностью ингибировать фосфорилирование AKT (серин-473) в клетках рака легкого человека А549.The purified protein composition, which exhibited primarily the expected monomeric form, was then tested for the ability to inhibit pro-survival signaling (AKT serine-473 phosphorylation) in A549 human lung cancer cells as described in Example 2. As can be seen in Fig. 13, the purified protein corresponding to SEQ ID NO: 88 exhibited a concentration-dependent ability to inhibit AKT phosphorylation (series 473), demonstrating that another monomeric fusion protein containing amino acids from domain III/TSP-1 homology domain of CCN protein had the ability to inhibit AKT phosphorylation (serine-473) in A549 human lung cancer cells.
Пример 18Example 18
Слитый белок, содержащий аминокислоты 206-249 CCN3 (SEQ ID NO: 44), где аминокислота в положении 207 (изолейцин) заменена на аланин, слитый на N-конце с пептидным линкером (SEQ ID NO: 93) и многофункциональной меткой, включающей метку 6xHis, HaloTag и элементы Sumo* (SEQ ID NO: 92), с получением последовательности белка, соответствующего SEQ ID NO: 94, был дополнен N-концевой сигнальной последовательностью для секреции, происходящей из альбумина из SEQ ID NO: 32, с получением слитого белка, соответствующего SEQ ID NO: 114. Последовательность ДНК, кодирующая слитый белок из SEQ ID NO: 114, была кодон-оптимизирована для экспрессии белка в клетках хомяка (с использованием алгоритма коммерческого поставщика), последовательность KOZAK для трансляции присоединяли на 5'-конце, а стоп-кодон вводили на 3'-конце, получая последовательность ДНК из SEQ ID NO: 95. Последовательность ДНК также дополняли на обоих концах сайтами attB Gateway, получая последовательность ДНК из SEQ ID NO: 96. Последовательности ДНК синтезировал и верифицировал коммерческий поставщик перед субклонированием с получением плазмид согласно описанию в Примере 9, и их экспрессировали путем транзиентной трансфекции клеток ExpiCHO™ согласно описанию в Примере 15. Клетки осаждали, согласно описанию в Примере 14, через 5 дней после трансфекции. Добавляли 0,1М ПМСФ в 100% изопропаноле до концентрации 0,1 мМ, добавляли 1М цитрат Na, рН 5,5 до конечной концентрации 30 мМ и 2М L-аргинин, рН 4,0 до конечной концентрации 0,1М; и добавляли имидазол до конечной концентрации 5 мМ перед хроматографическим очищением.A fusion protein comprising amino acids 206-249 of CCN3 (SEQ ID NO: 44), wherein the amino acid at position 207 (isoleucine) is replaced with alanine, fused at the N-terminus to a peptide linker (SEQ ID NO: 93) and a multifunctional tag comprising a 6xHis tag, HaloTag and Sumo* elements (SEQ ID NO: 92), to yield the protein sequence corresponding to SEQ ID NO: 94, was complemented with the N-terminal signal sequence for secretion derived from albumin from SEQ ID NO: 32, to yield the fusion protein corresponding to SEQ ID NO: 114. The DNA sequence encoding the fusion protein of SEQ ID NO: 114 was codon-optimized for protein expression in hamster cells (using a commercial supplier's algorithm), the KOZAK sequence for translation was added at the 5' end and a stop codon was introduced at the 3' end, yielding the DNA sequence of SEQ ID NO: 95. The DNA sequence was also complemented at both ends with attB Gateway sites, yielding the DNA sequence of SEQ ID NO: 96. The DNA sequences were synthesized and verified by a commercial supplier before being subcloned to generate plasmids as described in Example 9 and expressed by transient transfection of ExpiCHO™ cells as described in Example 15. The cells were pelleted as described in Example 14 5 days after transfection. 0.1 M PMSF in 100% isopropanol was added to a final concentration of 0.1 mM, 1 M Na citrate, pH 5.5, was added to a final concentration of 30 mM, and 2 M L-arginine, pH 4.0, was added to a final concentration of 0.1 M; and imidazole was added to a final concentration of 5 mM before chromatographic purification.
Белок очищали тандемной хроматографией, состоящей из этапа захвата на колонке HiTrap™ HisTrap™ Excel 5 мл (GE Healthcare), непосредственно за которым следовало высаливание на высаливающей колонке HiPrep™ 26/10 53 мл (GE Healthcare). Колонки устанавливали в систему FPLC-хроматографии (BioRad NGC Discover™ 10 Pro система), оснащенную проточной кюветой для УФ-детекции с длиной оптического пути 5 мм. Колонку HisTrap™ устанавливали на первый клапан для переключения колонки и уравновешивали буфером А1, состоящим из 5 мМ имидазола, 50 мМ NaCl, 100 мМ L-аргинина, а колонку HiPrep™ устанавливали на второй клапан для переключения колонки и уравновешивали буфером А2 (100 мМ NaH2PO4/Na2HPO4, 100 мМ L-аргинин, рН 6,5). При установленном в положение для обхода втором клапане для переключения колонки, содержащем колонку HiPrep™, 250 мл собранной клеточной культуральной среды, содержащей рекомбинантный белок, загружали на колонку HisTrap™ с помощью пробоотборного насоса со скоростью 3,5 мл/мин, с последующим промыванием 5 объемами колонки промывочного буфера А1, затем 5 объемами колонки промывочного буфера A3 (5 мМ Имидазол, 0,5М NaCl, 100 мМ L-Аргинин), и затем 2 объемами колонки промывочного буфера А1. До элюирования элюирующим буфером (250 мМ Имидазол, 50 мМ NaCl, 100 мМ L-Аргинин) колонку HiPrep™, установленную на второй клапан для переключения колонки, устанавливали в положение для подключения к проточному каналу. После элюирования 10 мл элюирующего буфера колонку HisTrap™ отключали от проточного канала и очищенный белок элюировали с колонки HiPrep™ буфером А2. Элюирование белка отслеживали по поглощению УФ при 280 нм и запускали сбор, когда показатель поглощения превышал 60 мЕОП.The protein was purified by tandem chromatography consisting of a capture step on a HiTrap™ HisTrap™ Excel 5 ml column (GE Healthcare) immediately followed by salting out on a HiPrep™ 26/10 53 ml salting out column (GE Healthcare). The columns were installed on an FPLC chromatography system (BioRad NGC Discover™ 10 Pro system) equipped with a 5 mm path length UV detection flow cell. The HisTrap™ column was installed on the first column switching valve and equilibrated with buffer A1 consisting of 5 mM imidazole, 50 mM NaCl, 100 mM L-arginine, and the HiPrep™ column was installed on the second column switching valve and equilibrated with buffer A2 (100 mM NaH2PO4/Na2HPO4, 100 mM L-arginine, pH 6.5). With the second column switching valve containing the HiPrep™ column set to the bypass position, 250 mL of harvested cell culture medium containing the recombinant protein was loaded onto the HisTrap™ column using the sample pump at a flow rate of 3.5 mL/min, followed by a wash with 5 column volumes of Wash Buffer A1, then 5 column volumes of Wash Buffer A3 (5 mM Imidazole, 0.5 M NaCl, 100 mM L-Arginine), and then 2 column volumes of Wash Buffer A1. Prior to elution with the elution buffer (250 mM Imidazole, 50 mM NaCl, 100 mM L-Arginine), the HiPrep™ column mounted on the second column switching valve was set to the flow channel position. After elution with 10 ml of elution buffer, the HisTrap™ column was disconnected from the flow channel and the purified protein was eluted from the HiPrep™ column with buffer A2. Protein elution was monitored by UV absorbance at 280 nm and collection was initiated when the absorbance exceeded 60 mOOP.
Очищенный белковый состав, который демонстрировал ожидаемую мономерную форму, затем тестировали на способность ингибировать способствующую выживанию сигнализацию (фосфорилирование серина-473 AKT) в клетках рака легкого человека А549 согласно описанию в Примере 2. Как можно видеть на Фиг. 12, очищенный белок, соответствующий SEQ ID NO: 94, проявлял зависимую от концентрации способность ингибировать фосфорилирование AKT (серии 473), демонстрируя, что другой мономерный слитый белок, содержащий аминокислоты из домена III/домена гомологии с TSP-1 белка CCN, обладал способностью ингибировать фосфорилирование AKT (серин-473) в клетках рака легкого человека А549.The purified protein composition, which exhibited the expected monomeric form, was then tested for the ability to inhibit pro-survival signaling (AKT serine-473 phosphorylation) in A549 human lung cancer cells as described in Example 2. As can be seen in Fig. 12, the purified protein corresponding to SEQ ID NO: 94 exhibited a concentration-dependent ability to inhibit AKT phosphorylation (series 473), demonstrating that another monomeric fusion protein containing amino acids from domain III/TSP-1 homology domain of CCN protein had the ability to inhibit AKT phosphorylation (serine-473) in A549 human lung cancer cells.
Пример 19Example 19
Слитый белок, содержащий аминокислоты 194-237 CCN5, где аминокислота в положении 195 (пролин) заменена на аланин (SEQ ID NO: 38), слитый на N-конце с пептидным линкером (SEQ ID NO: 21), и аминокислоты 25-609 сывороточного альбумина человека (SEQ ID NO: 52), с получением SEQ ID NO: 97, был дополнен N-концевой сигнальной последовательностью для секреции, происходящей из альбумина из SEQ ID NO: 32, с получением слитого белка, соответствующего SEQ ID NO: 98. Последовательность ДНК, кодирующая слитый белок из SEQ ID NO: 98, была кодон-оптимизирована для экспрессии белка в клетках хомяка (с использованием алгоритма коммерческого поставщика), последовательность KOZAK для трансляции присоединяли на 5'-конце, а стоп-кодон вводили на 3'-конце, получая последовательность ДНК из SEQ ID NO: 99. Последовательность ДНК также дополняли на обоих концах сайтами attB Gateway, получая последовательность ДНК из SEQ ID NO: 100.A fusion protein comprising amino acids 194-237 of CCN5, where the amino acid at position 195 (proline) is replaced by alanine (SEQ ID NO: 38), fused at the N-terminus to a peptide linker (SEQ ID NO: 21), and amino acids 25-609 of human serum albumin (SEQ ID NO: 52), to yield SEQ ID NO: 97, was supplemented with the N-terminal albumin-derived secretion signal sequence of SEQ ID NO: 32, to yield the fusion protein corresponding to SEQ ID NO: 98. The DNA sequence encoding the fusion protein of SEQ ID NO: 98 was codon-optimized for expression of the protein in hamster cells (using a commercial supplier's algorithm), a KOZAK sequence for translation was added at the 5' end, and a stop codon was introduced at the 3' end, yielding the DNA sequence of SEQ ID NO: 99. The DNA sequence was also complemented at both ends with attB Gateway sites, yielding the DNA sequence of SEQ ID NO: 100.
Последовательности ДНК синтезировал и верифицировал коммерческий поставщик перед субклонированием с получением плазмид согласно описанию в Примере 9, а суспензионные клетки СНО DG44, сконструированные для экспрессии конститутивно активной формы AKT, использовали для получения стабильного пула суспензионных клеток СНО, экспрессирующих белок из SEQ ID NO: 98 согласно описанию в Примере 13. После получения стабильного пула клеток объем клеточной культуры увеличивали, чтобы обеспечить заселение стабильно трансфицированными клетками для продуцирования с плотностью, составляющей 1*106 клеток/мл. Через 6 дней клетки осаждали центрифугированием при 4750xg в течение 20 минут при 4°С и собирали супернатант клеточной культуральной среды, добавляли ОДМ ПМСФ в 100% изопропаноле до концентрации 0,1 мМ, добавляли 0,5М ЭДТК до конечной концентрации 2 мМ, добавляли 1М цитрат Na, рН 5,5 до конечной концентрации 30 мМ и добавляли 2М L-аргинин, рН 4,0 до конечной концентрации ОДМ перед хроматографическим очищением.DNA sequences were synthesized and verified by a commercial supplier prior to subcloning to generate plasmids as described in Example 9, and CHO DG44 suspension cells engineered to express a constitutively active form of AKT were used to generate a stable pool of CHO suspension cells expressing the protein of SEQ ID NO: 98 as described in Example 13. Once a stable pool of cells was generated, the cell culture volume was expanded to ensure seeding with stably transfected cells for production at a density of 1* 106 cells/mL. After 6 days, the cells were pelleted by centrifugation at 4750 x g for 20 min at 4°C and the cell culture medium supernatant was collected, ODM PMSF in 100% isopropanol was added to a concentration of 0.1 mM, 0.5 M EDTA was added to a final concentration of 2 mM, 1 M Na citrate, pH 5.5 was added to a final concentration of 30 mM and 2 M L-arginine, pH 4.0 was added to a final concentration of ODM before chromatographic purification.
Белок очищали тандемной хроматографией, состоящей из этапа захвата на колонке Tricorn (GE Healthcare) заполненная 3 мл матрицы для очищения альбумина человека Capture Select™ Human Albumin Affinity Matrix (ThermoFisherScientific), непосредственно за которым следовало высаливание на высаливающей колонке HiPrep™ 26/10 53 мл (GE Healthcare). Колонки устанавливали в систему FPLC-хроматографии (система BioRad NGC Discover™ 10 Pro), оснащенную проточной кюветой для УФ-детекции с длиной оптического пути 5 мм. Содержащую CaptureSelect™ колонку устанавливали на первый клапан для переключения колонки и уравновешивали буфером А1, состоящим из 100 мМ NaH2PO4/Na2HPO4, 100 мМ L-аргинина, рН 6,5, а колонку HiPrep™ устанавливали на второй клапан для переключения колонки и уравновешивали буфером А1 (100 мМ NaH2PO4/Na2HPO4, 100 мМ L-аргинина, рН 6,5). При установленном в положение для обхода втором клапане для переключения колонки, содержащем колонку HiPrep™, 500 мл собранной клеточной культуральной среды, содержащей рекомбинантный белок, загружали на содержащую CaptureSelect™ колонку с помощью пробоотборного насоса со скоростью 2,0 мл/мин, с последующим промыванием 5 объемами колонки промывочного буфера А1, затем 5 объемами колонки промывочного буфера А2 (100 мМ NaH2PO4/Na2HPO4, 100 мМ L-Аргинин, 0,25М NaCl, рН 6,5), и затем 5 объемами колонки промывочного буфера А1. До элюирования элюирующим буфером (30 мМ лимонная кислота, рН 3,5+0,5М L-аргинин) колонку HiPrep™, установленную на второй клапан для переключения колонки, устанавливали в положение для подключения к проточному каналу. После элюирования 10 мл элюирующего буфера содержащую CaptureSelect™ колонку отключали от проточного канала и очищенный белок элюировали с колонки HiPrep™ буфером А1. Элюирование белка отслеживали по поглощению УФ при 280 нм и запускали сбор, когда показатель поглощения превышал 100 мЕОП.The protein was purified by tandem chromatography consisting of a capture step on a Tricorn column (GE Healthcare) filled with 3 ml of Capture Select™ Human Albumin Affinity Matrix (ThermoFisherScientific) immediately followed by salting out on a HiPrep™ 26/10 53 ml salting out column (GE Healthcare). The columns were mounted on a FPLC system (BioRad NGC Discover™ 10 Pro system) equipped with a 5 mm pathlength UV detection flow cell. The CaptureSelect™ column was mounted on the first column switching valve and equilibrated with buffer A1 consisting of 100 mM NaH2PO4 / Na2HPO4 , 100 mM L-arginine, pH 6.5 , and the HiPrep™ column was mounted on the second column switching valve and equilibrated with buffer A1 (100 mM NaH2PO4/Na2HPO4 , 100 mM L-arginine, pH 6.5). With the second column switching valve containing the HiPrep™ column set to the bypass position, 500 mL of harvested cell culture medium containing the recombinant protein was loaded onto the CaptureSelect™ column using the sample pump at a flow rate of 2.0 mL/min, followed by a wash with 5 column volumes of Wash Buffer A1, then 5 column volumes of Wash Buffer A2 (100 mM NaH 2 PO 4 /Na 2 HPO 4 , 100 mM L-Arginine, 0.25 M NaCl, pH 6.5), and then 5 column volumes of Wash Buffer A1. Prior to elution with elution buffer (30 mM citric acid, pH 3.5 + 0.5 M L-arginine), the HiPrep™ column, mounted on the second column switching valve, was positioned for connection to the flow channel. After elution with 10 ml of elution buffer, the CaptureSelect™ column was disconnected from the flow channel and the purified protein was eluted from the HiPrep™ column with buffer A1. Protein elution was monitored by UV absorbance at 280 nm and collection was initiated when the absorbance was greater than 100 mOOP.
Очищенный белковый состав, который демонстрировал ожидаемую мономерную форму, затем тестировали на способность ингибировать способствующую выживанию сигнализацию (фосфорилирование серина-473 AKT) в клетках рака легкого человека А549 согласно описанию в Примере 2. Как можно видеть на Фиг. 14, очищенный белок, соответствующий SEQ ID NO: 97, проявлял зависимую от концентрации способность ингибировать фосфорилирование AKT (серии 473) демонстрируя, что другой мономерный слитый белок, содержащий аминокислоты из домена III/домена гомологии с TSP-1 белка CCN, обладал способностью ингибировать фосфорилирование AKT (серин-473) в клетках рака легкого человека А549.The purified protein composition, which exhibited the expected monomeric form, was then tested for the ability to inhibit pro-survival signaling (AKT serine-473 phosphorylation) in A549 human lung cancer cells as described in Example 2. As can be seen in Fig. 14, the purified protein corresponding to SEQ ID NO: 97 exhibited a concentration-dependent ability to inhibit AKT phosphorylation (serine-473) demonstrating that another monomeric fusion protein containing amino acids from domain III/TSP-1 homology domain of CCN protein was able to inhibit AKT phosphorylation (serine-473) in A549 human lung cancer cells.
Пример 20Example 20
Слитый белок сывороточного альбумина человека (аминокислоты 25-606, SEQ ID NO: 101) сливали на С-конце с пептидным линкером (SEQ ID NO: 22), соединенным с аминокислотами 194-246 CCN5 человека, где аминокислота в положении 195 (пролин) заменена на аланин (SEQ ID NO: 7), с получением SEQ ID NO: 103. Слитый белок, соответствующий SEQ ID NO: 102, был дополнен N-концевой сигнальной последовательностью для секреции, происходящей из альбумина из SEQ ID NO: 32, с получением слитого белка, соответствующего SEQ ID NO: 103. Последовательность ДНК, кодирующая слитый белок из SEQ ID NO: 103, была кодон-оптимизирована для экспрессии белка в клетках хомяка (с использованием алгоритма коммерческого поставщика), последовательность KOZAK для трансляции присоединяли на 5'-конце, а стоп-кодон вводили на 3'-конце, получая последовательность ДНК из SEQ ID NO: 104. Последовательность ДНК также дополняли на обоих концах сайтами attB Gateway, получая последовательность ДНК из SEQ ID NO: 105.The human serum albumin fusion protein (amino acids 25-606, SEQ ID NO: 101) was fused at the C-terminus to a peptide linker (SEQ ID NO: 22) linked to amino acids 194-246 of human CCN5, wherein the amino acid at position 195 (proline) was replaced by alanine (SEQ ID NO: 7), to yield SEQ ID NO: 103. The fusion protein corresponding to SEQ ID NO: 102 was complemented with the N-terminal albumin-derived secretion signal sequence of SEQ ID NO: 32, to yield the fusion protein corresponding to SEQ ID NO: 103. The DNA sequence encoding the fusion protein of SEQ ID NO: 103 was codon-optimized for protein expression in hamster cells (using a commercial supplier's algorithm), the KOZAK sequence for translational sites were added at the 5' end and a stop codon was introduced at the 3' end, yielding the DNA sequence of SEQ ID NO: 104. The DNA sequence was also complemented at both ends with attB Gateway sites, yielding the DNA sequence of SEQ ID NO: 105.
Последовательности ДНК синтезировал и верифицировал коммерческий поставщик перед субклонированием с получением плазмид согласно описанию в Примере 9 и DG44 суспензионные клетки СНО, сконструированные для экспрессии конститутивно активной формы AKT, использовали для получения стабильного пула суспензионных клеток СНО, экспрессирующих указанный белок из SEQ ID NO: 104 согласно описанию в Примере 13. После получения стабильного пула клеток объем клеточной культуры увеличивали, чтобы обеспечить заселение стабильно трансфицированными клетками для продуцирования с плотностью, составляющей 1*106 клеток/мл. Через 6 дней клетки осаждали центрифугированием при 4750xg в течение 20 минут при 4°С и собирали супернатант клеточной культуральной среды. Добавляли 0,1М ПМСФ в 100% изопропаноле до концентрации 0,1 мМ, добавляли 0,5М ЭДТК до конечной концентрации 2 мМ, добавляли 1М цитрат Na, рН 5,5 до конечной концентрации 30 мМ и добавляли 2М L-аргинин, рН 4,0 до конечной концентрации 0,1М перед хроматографическим очищением.DNA sequences were synthesized and verified by a commercial supplier prior to subcloning to generate plasmids as described in Example 9 and DG44 CHO suspension cells engineered to express a constitutively active form of AKT were used to generate a stable pool of CHO suspension cells expressing the designated protein of SEQ ID NO: 104 as described in Example 13. Once a stable pool of cells was generated, the cell culture volume was expanded to ensure seeding with stably transfected cells for production at a density of 1* 106 cells/mL. After 6 days, the cells were pelleted by centrifugation at 4750xg for 20 min at 4°C and the cell culture medium supernatant was collected. 0.1 M PMSF in 100% isopropanol was added to a final concentration of 0.1 mM, 0.5 M EDTA was added to a final concentration of 2 mM, 1 M Na citrate, pH 5.5 was added to a final concentration of 30 mM, and 2 M L-arginine, pH 4.0 was added to a final concentration of 0.1 M before chromatographic purification.
Белок очищали тандемной хроматографией, состоящей из этапа захвата на колонке Tricorn (GE Healthcare), заполненной 3 мл матрицы CaptureSelect™ Human Albumin Affinity Matrix (ThermoFisherScientific), непосредственно за которым следовало высаливание на высаливающей колонке HiPrep™ 26/10 53 мл (GE Healthcare) согласно описанию в Примере 19, за исключением того, что скорость загрузки образцов составляла 0,37 мл/мин вместо 2,0 мл/мин.The protein was purified by tandem chromatography consisting of a capture step on a Tricorn column (GE Healthcare) packed with 3 mL of CaptureSelect™ Human Albumin Affinity Matrix (ThermoFisherScientific) immediately followed by salting out on a HiPrep™ 26/10 53 mL salting out column (GE Healthcare) as described in Example 19, except that the sample loading rate was 0.37 mL/min instead of 2.0 mL/min.
Очищенный белковый состав, который демонстрировал ожидаемую мономерную форму, затем тестировали на способность ингибировать способствующую выживанию сигнализацию (фосфорилирование серина-473 AKT) в клетках рака легкого человека А549 согласно описанию в Примере 2. Как можно видеть на Фиг. 14, очищенный белок, соответствующий SEQ ID NO: 102, проявлял зависимую от концентрации способность ингибировать фосфорилирование AKT (серии 473) демонстрируя, что другой мономерный слитый белок, содержащий аминокислоты из домена III/домен гомологии с TSP-1 белка CCN, обладал способностью ингибировать фосфорилирование AKT (серин-473) в клетках рака легкого человека А549.The purified protein composition, which exhibited the expected monomeric form, was then tested for the ability to inhibit pro-survival signaling (AKT serine-473 phosphorylation) in A549 human lung cancer cells as described in Example 2. As can be seen in Fig. 14, the purified protein corresponding to SEQ ID NO: 102 exhibited a concentration-dependent ability to inhibit AKT phosphorylation (serine-473) demonstrating that another monomeric fusion protein containing amino acids from domain III/TSP-1 homology domain of CCN protein was able to inhibit AKT phosphorylation (serine-473) in A549 human lung cancer cells.
Пример 21Example 21
Слитый белок, содержащий аминокислоты 206-249 CCN3, где аминокислота в положении 207 (изолейцин) заменена на аланин (SEQ ID NO: 44), слитый на N-конце с пептидным линкером (SEQ ID NO: 21) и аминокислотами 25 609 сывороточного альбумина человека (SEQ ID NO: 52) с получением SEQ ID NO: 106, был дополнен N-концевой сигнальной последовательностью для секреции, происходящей из альбумина из SEQ ID NO: 32, с получением слитого белка, соответствующего SEQ ID NO: 107. Последовательность ДНК, кодирующая слитый белок из SEQ ID NO: 107, была кодон-оптимизирована для экспрессии белка в клетках хомяка (с использованием алгоритма коммерческого поставщика), последовательность KOZAK для трансляции присоединяли на 5'-конце, а стоп-кодон вводили на 3'-конце, получая последовательность ДНК из SEQ ID NO: 108. Последовательность ДНК также дополняли на обоих концах сайтами attB Gateway, получая последовательность ДНК из SEQ ID NO: 109.A fusion protein comprising amino acids 206-249 of CCN3, wherein the amino acid at position 207 (isoleucine) is replaced with alanine (SEQ ID NO: 44), fused at the N-terminus to a peptide linker (SEQ ID NO: 21) and amino acids 25,609 of human serum albumin (SEQ ID NO: 52) to yield SEQ ID NO: 106, was supplemented with the N-terminal albumin-derived secretion signal sequence of SEQ ID NO: 32 to yield the fusion protein corresponding to SEQ ID NO: 107. The DNA sequence encoding the fusion protein of SEQ ID NO: 107 was codon-optimized for protein expression in hamster cells (using a commercial supplier's algorithm), a KOZAK sequence for translation was added at the 5' end, and a stop codon was introduced at the 3' end, yielding the DNA sequence of SEQ ID NO: 108. The DNA sequence was also complemented at both ends with attB Gateway sites, yielding the DNA sequence of SEQ ID NO: 109.
Последовательности ДНК синтезировал и верифицировал коммерческий поставщик перед субклонированием с получением плазмид согласно описанию в Примере 9, и их экспрессировали путем транзиентной трансфекции клеток ExpiCHO™ согласно описанию в Примере 9. Клетки осаждали, согласно описанию в Примере 14, через 6 дней после трансфекции, и в среду вносили добавки согласно описанию в Примере 19. Белок очищали тандемной хроматографией, состоящей из этапа захвата на колонке Tricorn (GE Healthcare), заполненной 10 мл матрицы CaptureSelect™ Human Albumin Affinity Matrix (ThermoFisherScientific), непосредственно за которым следовало высаливание на высаливающей колонке HiPrep™ 26/10 53 мл (GE Healthcare). Колонки устанавливали в систему FPLC-хроматографии (система BioRad NGC Discover™ 10 Pro), оснащенную проточной кюветой для УФ-детекции с длиной оптического пути 5 мм. Содержащую CaptureSelect™ колонку устанавливали на первый клапан для переключения колонки и уравновешивали буфером А1, состоящим из 100 мМ NaH2PO4/Na2HPO4, 100 мМ L-аргинина, рН 6,5, а колонку HiPrep™ устанавливали на второй клапан для переключения колонки и уравновешивали буфером А1 (100 мМ NaH2PO4/Na2HPO4, 100 мМ L-аргинин, рН 6,5). При установленном в положение для обхода втором клапане для переключения колонки, содержащем колонку HiPrep™, 500 мл собранной клеточной культуральной среды, содержащей рекомбинантный белок, загружали на содержащую CaptureSelect™ колонку с помощью пробоотборного насоса со скоростью 1,0 мл/мин, с последующим промыванием 3 объемами колонки промывочного буфера А1, затем 2 объемами колонки промывочного буфера А2 (100 мМ NaH2PO4/Na2HPO4, 100 мМ L-Аргинин, 0,25М NaCl, рН 6,5), и затем 3 объемами колонки промывочного буфера А1. До элюирования элюирующим буфером (30 мМ лимонная кислота, рН 3,5+0,1М L-аргинин) колонку HiPrep™, установленную на второй клапан для переключения колонки, устанавливали в положение для подключения к проточному каналу. После элюирования 15 мл элюирующего буфера содержащую Capture Select™ колонку отключали от проточного канала и очищенный белок элюировали с колонки HiPrep™ буфером А1. Элюирование белка отслеживали по поглощению УФ при 280 нм и запускали сбор, когда показатель поглощения превышал 100 мЕОП.DNA sequences were synthesized and verified by a commercial supplier before subcloning to generate plasmids as described in Example 9 and expressed by transient transfection of ExpiCHO™ cells as described in Example 9. Cells were pelleted as described in Example 14 6 days post-transfection and the medium was supplemented as described in Example 19. Protein was purified by tandem chromatography consisting of a capture step on a Tricorn column (GE Healthcare) packed with 10 ml CaptureSelect™ Human Albumin Affinity Matrix (ThermoFisherScientific) immediately followed by salting out on a HiPrep™ 26/10 53 ml salting out column (GE Healthcare). The columns were loaded onto an FPLC system (BioRad NGC Discover™ 10 Pro System) equipped with a 5 mm pathlength UV flow cell. The CaptureSelect™ column was loaded onto the first column switching valve and equilibrated with buffer A1 consisting of 100 mM NaH2PO4 / Na2HPO4 , 100 mM L-arginine, pH 6.5, and the HiPrep™ column was loaded onto the second column switching valve and equilibrated with buffer A1 (100 mM NaH2PO4 / Na2HPO4 , 100 mM L- arginine , pH 6.5). With the second column switching valve containing the HiPrep™ column set to the bypass position, 500 mL of harvested cell culture medium containing the recombinant protein was loaded onto the CaptureSelect™ column using the sample pump at a flow rate of 1.0 mL/min, followed by a wash with 3 column volumes of Wash Buffer A1, then 2 column volumes of Wash Buffer A2 (100 mM NaH 2 PO 4 /Na 2 HPO 4 , 100 mM L-Arginine, 0.25 M NaCl, pH 6.5), and then 3 column volumes of Wash Buffer A1. Prior to elution with elution buffer (30 mM citric acid, pH 3.5 + 0.1 M L-arginine), the HiPrep™ column, mounted on the second column switching valve, was positioned for connection to the flow channel. After elution with 15 ml of elution buffer, the Capture Select™ column was disconnected from the flow channel and the purified protein was eluted from the HiPrep™ column with buffer A1. Protein elution was monitored by UV absorbance at 280 nm and collection was initiated when the absorbance was greater than 100 mOOP.
Затем очищенный белковый состав, который содержал ожидаемую мономерную форму, тестировали на способность ингибировать способствующую выживанию сигнализацию (фосфорилирование серина-473 AKT) в клетках рака легкого человека А549 согласно описанию в Примере 2. Как можно видеть на Фиг. 12, очищенный белок, соответствующий SEQ ID NO: 106, проявлял зависимую от концентрации способность ингибировать фосфорилирование AKT (серии 473), демонстрируя, что другой мономерный слитый белок, содержащий аминокислоты из домена III/домена гомологии с TSP-1 белка CCN, обладал способностью ингибировать фосфорилирование AKT (серин-473) в клетках рака легкого человека А549.The purified protein composition, which contained the expected monomeric form, was then tested for the ability to inhibit pro-survival signaling (AKT serine-473 phosphorylation) in A549 human lung cancer cells as described in Example 2. As can be seen in Fig. 12, the purified protein corresponding to SEQ ID NO: 106 exhibited a concentration-dependent ability to inhibit AKT phosphorylation (series 473), demonstrating that another monomeric fusion protein containing amino acids from domain III/TSP-1 homology domain of CCN protein had the ability to inhibit AKT phosphorylation (serine-473) in A549 human lung cancer cells.
Пример 22Example 22
Слитый белок, содержащий аминокислоты 206-249 CCN3, где аминокислота в положении 207 (изолейцин) заменена на аланин (SEQ ID NO: 44), слитый на N-конце с пептидным линкером (SEQ ID NO: 22) и аминокислот 25-609 сывороточного альбумина человека (SEQ ID NO: 52) с получением SEQ ID NO: 110, был дополнен N-концевой сигнальной последовательностью для секреции, происходящей из альбумина из SEQ ID NO: 32, с получением слитого белка, соответствующего SEQ ID NO: 111. Последовательность ДНК, кодирующая слитый белок из SEQ ID NO: 111, была кодон-оптимизирована для экспрессии белка в клетках хомяка (с использованием алгоритма коммерческого поставщика), последовательность KOZAK для трансляции присоединяли на 5'-конце, а стоп-кодон вводили на 3'-конце, получая последовательность ДНК из SEQ ID NO: 112. Последовательность ДНК также дополняли на обоих концах сайтами attB Gateway, получая последовательность ДНК из SEQ ID NO: 113.A fusion protein comprising amino acids 206-249 of CCN3, where the amino acid at position 207 (isoleucine) is replaced with alanine (SEQ ID NO: 44), fused at the N-terminus to a peptide linker (SEQ ID NO: 22) and amino acids 25-609 of human serum albumin (SEQ ID NO: 52) to yield SEQ ID NO: 110, was supplemented with the N-terminal albumin-derived secretion signal sequence of SEQ ID NO: 32 to yield the fusion protein corresponding to SEQ ID NO: 111. The DNA sequence encoding the fusion protein of SEQ ID NO: 111 was codon-optimized for expression of the protein in hamster cells (using a commercial supplier's algorithm), a KOZAK sequence for translation was added at the 5' end, and a stop codon was introduced at the 3' end, yielding the DNA sequence of SEQ ID NO: 112. The DNA sequence was also complemented at both ends with attB Gateway sites, yielding the DNA sequence of SEQ ID NO: 113.
Последовательности ДНК синтезировал и верифицировал коммерческий поставщик перед субклонированием с получением плазмид согласно описанию в Примере 9, и их экспрессировали путем транзиентной трансфекции клеток ExpiCHO™ согласно описанию в Примере 9. Клетки осаждали, согласно описанию в Примере 14, через 6 дней после трансфекции, и в среду вносили добавки согласно описанию в Примере 19. Белок очищали тандемной хроматографией, состоящей из этапа захвата на колонке Tricorn (GE Healthcare), заполненной 10 мл матрицы CaptureSelect™ Human Albumin Affinity Matrix (ThermoFisherScientific), непосредственно за которым следовало высаливание на высаливающей колонке HiPrep™ 26/10 53 мл (GE Healthcare). Колонки устанавливали в систему FPLC-хроматографии (система BioRad NGC Discover™ 10 Pro), оснащенную проточной кюветой для УФ-детекции с длиной оптического пути 5 мм. Содержащую CaptureSelect™ колонку устанавливали на первый клапан для переключения колонки и уравновешивали буфером А1, состоящим из 100 мМ NaH2PO4/Na2HPO4, 100 мМ L-аргинина, рН 6,5, а колонку HiPrep™ устанавливали на второй клапан для переключения колонки и уравновешивали буфером А1 (100 мМ NaH2PO4/Na2HPO4, 100 мМ L-аргинин, рН 6,5). При установленном в положение для обхода втором клапане для переключения колонки, содержащем колонку HiPrep™, 300 мл собранной клеточной культуральной среды, содержащей рекомбинантный белок, загружали на содержащую CaptureSelect™ колонку с помощью пробоотборного насоса со скоростью 1,0 мл/мин, с последующим промыванием 3 объемами колонки промывочного буфера А1, затем 2 объемами колонки промывочного буфера А2 (100 мМ NaH2PO4/Na2HPO4, 100 мМ L-Аргинин, 0,25М NaCl, рН 6,5), и затем 3 объемами колонки промывочного буфера А1. До элюирования элюирующим буфером (30 мМ лимонная кислота, рН 3,5+0,5М L-аргинин) колонку HiPrep™, установленную на второй клапан для переключения колонки, устанавливали в положение для подключения к проточному каналу. После элюирования 15 мл элюирующего буфера содержащую CaptureSelect™ колонку отключали от проточного канала и очищенный белок элюировали с колонки HiPrep™ буфером А1. Элюирование белка отслеживали по поглощению УФ при 280 нм и запускали сбор, когда показатель поглощения превышал 100 мЕОП.DNA sequences were synthesized and verified by a commercial supplier before subcloning to generate plasmids as described in Example 9 and expressed by transient transfection of ExpiCHO™ cells as described in Example 9. Cells were pelleted as described in Example 14 6 days post-transfection and the medium was supplemented as described in Example 19. Protein was purified by tandem chromatography consisting of a capture step on a Tricorn column (GE Healthcare) packed with 10 ml CaptureSelect™ Human Albumin Affinity Matrix (ThermoFisherScientific) immediately followed by salting out on a HiPrep™ 26/10 53 ml salting out column (GE Healthcare). The columns were loaded onto an FPLC system (BioRad NGC Discover™ 10 Pro System) equipped with a 5 mm pathlength UV flow cell. The CaptureSelect™ column was loaded onto the first column switching valve and equilibrated with buffer A1 consisting of 100 mM NaH2PO4 / Na2HPO4 , 100 mM L-arginine, pH 6.5, and the HiPrep™ column was loaded onto the second column switching valve and equilibrated with buffer A1 (100 mM NaH2PO4 / Na2HPO4 , 100 mM L- arginine , pH 6.5). With the second column switching valve containing the HiPrep™ column set to the bypass position, 300 mL of harvested cell culture medium containing the recombinant protein was loaded onto the CaptureSelect™ column using the sample pump at a flow rate of 1.0 mL/min, followed by a wash with 3 column volumes of Wash Buffer A1, then 2 column volumes of Wash Buffer A2 (100 mM NaH 2 PO 4 /Na 2 HPO 4 , 100 mM L-Arginine, 0.25 M NaCl, pH 6.5), and then 3 column volumes of Wash Buffer A1. Prior to elution with elution buffer (30 mM citric acid, pH 3.5 + 0.5 M L-arginine), the HiPrep™ column, mounted on the second column switching valve, was positioned for connection to the flow channel. After elution with 15 ml of elution buffer, the CaptureSelect™ column was disconnected from the flow channel and the purified protein was eluted from the HiPrep™ column with buffer A1. Protein elution was monitored by UV absorbance at 280 nm and collection was initiated when the absorbance was greater than 100 mOOP.
Затем очищенный белковый состав, который содержал ожидаемую мономерную форму, тестировали на способность ингибировать способствующую выживанию сигнализацию (фосфорилирование серина-473 AKT) в клетках рака легкого человека А549 согласно описанию в Примере 2. Как можно видеть на Фиг. 15, очищенный белок, соответствующий SEQ ID NO: 110, проявлял зависимую от концентрации способность ингибировать фосфорилирование AKT (серии 473), демонстрируя, что другой мономерный слитый белок, содержащий аминокислоты из домена III/домена гомологии с TSP-1 белка CCN, обладал способностью ингибировать фосфорилирование AKT (серин-473) в клетках рака легкого человека А549.The purified protein composition, which contained the expected monomeric form, was then tested for the ability to inhibit pro-survival signaling (AKT serine-473 phosphorylation) in A549 human lung cancer cells as described in Example 2. As can be seen in Fig. 15, the purified protein corresponding to SEQ ID NO: 110 exhibited a concentration-dependent ability to inhibit AKT phosphorylation (series 473), demonstrating that another monomeric fusion protein containing amino acids from domain III/TSP-1 homology domain of CCN protein had the ability to inhibit AKT phosphorylation (serine-473) in A549 human lung cancer cells.
Пример 23Example 23
Экспрессионная плазмида, описанная в Примере 21, содержащая SEQ ID NO: 108, кодирующую слитый белок, содержащий аминокислоты 206-249 CCN3, где аминокислота в положении 207 (изолейцин) заменена на аланин (SEQ ID NO: 44), слитый на N-конце с пептидным линкером (SEQ ID NO: 21), и аминокислоты 25-609 сывороточного альбумина человека (SEQ ID NO: 52), также дополненный N-концевой сигнальной последовательностью для секреции, происходящей из альбумина из SEQ ID NO: 32 и соответствующей SEQ ID NO: 107, использовали для получения пула стабильно трансфицированных клеток ExpiCHO™ согласно описанию в Примере 14. Для получения партии кондиционированной среды, содержащей секретируемый белок, соответствующий SEQ ID NO: 106, пул стабильно трансфицированных клеток размножали, чтобы обеспечить заселение объема 250 мл стабильно трансфицированными клетками с плотностью 1*106 клеток/мл. В культуры клеток добавляли 5% по объему 2Х EfficientFeed™ С+(Gibco™) через день, начиная с 2 дня после субкультивирования, 3% глюкозы (10% масса/объем) на 2 день после субкультивирования и 5% глюкозы (10% масса/объем) на 6 день после субкультивирования. Через 9 дней клетки осаждали центрифугированием при 4750xg в течение 20 минут при 4°С и собирали супернатант клеточной культуральной среды. Добавляли 0,1М ПМСФ в 100% изопропаноле до концентрации 0,1 мМ. Добавляли 1М цитрат Na, рН 5,5 до конечной концентрации 30 мМ, и 2М L-аргинин, рН 4,0 до конечной концентрации 100 мМ перед хроматографическим очищением.The expression plasmid described in Example 21, comprising SEQ ID NO: 108, encoding a fusion protein comprising amino acids 206-249 of CCN3, wherein the amino acid at position 207 (isoleucine) is replaced with alanine (SEQ ID NO: 44), fused at the N-terminus to a peptide linker (SEQ ID NO: 21), and amino acids 25-609 of human serum albumin (SEQ ID NO: 52), also supplemented with the N-terminal signal sequence for albumin-derived secretion from SEQ ID NO: 32 and corresponding to SEQ ID NO: 107, was used to generate a pool of stably transfected ExpiCHO™ cells as described in Example 14. To generate a batch of conditioned medium containing the secreted protein corresponding to SEQ ID NO: 106, the pool of stably transfected cells were expanded to ensure that 250 ml of culture medium was populated with stably transfected cells at a density of 1*10 6 cells/ml. The cell cultures were supplemented with 5% (v/v) 2X EfficientFeed™ C+ (Gibco™) every other day starting on day 2 after subculturing, 3% glucose (10% w/v) on day 2 after subculturing, and 5% glucose (10% w/v) on day 6 after subculturing. After 9 days, the cells were pelleted by centrifugation at 4750 x g for 20 min at 4°C and the supernatant of the cell culture medium was collected. 0.1 M PMSF in 100% isopropanol was added to a concentration of 0.1 mM. 1 M Na citrate, pH 5.5 to a final concentration of 30 mM, and 2 M L-arginine, pH 4.0 to a final concentration of 100 mM were added before chromatographic purification.
Белок очищали 20-хроматографией, состоящей из этапа захвата на колонке Tricorn (GE Healthcare), заполненной 10 мл матрицы CaptureSelect™ Human Albumin Affinity Matrix (ThermoFisherScientific), непосредственно за которым следовала эксклюзионная хроматография на двух последовательно соединенных колонках Superdex 200 Increase 10/300 GL (GE Healthcare). Колонки были установлены в систему FPLC-хроматографии (система BioRad NGC Discover™ 10 Pro), оснащенную проточной кюветой для УФ-детекции с длиной оптического пути 5 мм и выходным клапаном, соединенным с контуром для образцов на 5 мл. Содержащую CaptureSelect™ колонку устанавливали на первый клапан для переключения колонки и уравновешивали буфером А1, состоящим из 100 мМ NaH2PO4/Na2HPO4, 100 мМ L-аргинина, рН 6,5, а колонки Superdex 200 Increase устанавливали на второй клапан для переключения колонки и уравновешивали буфером А1 (100 мМ NaH2PO4/Na2HPO4, 100 мМ L-аргинин, рН 6,5). При установленном в положение для обхода втором клапане для переключения колонки, содержащем колонки Superdex 200 Increase, 120 мл собранной клеточной культуральной среды, содержащей рекомбинантный белок, загружали на содержащую CaptureSelect™ колонку с помощью пробоотборного насоса со скоростью 3,9 мл/мин. После загрузки собранную клеточную культуральную среду, содержащую рекомбинантный белок, на содержащую CaptureSelect™ колонку, ее промывали 3 объемами колонки буфера А1, затем 2 объемами колонки буфера А2 (100 мМ NaH2PO4/Na2HPO4, 100 мМ L-Аргинин, 0,25М NaCl, рН 6,5), и затем 3 объемами колонки буфера А1. Проводили элюирование содержащей CaptureSelect™ колонки 15 мл буфера В1 (30 мМ лимонная кислота, 0,5М L-аргинин, рН 3,5), при этом которого система была настроена на сбор элюата с показателями поглощения выше 1200 мЕОП, в контур для образцов. После элюирования содержащей CaptureSelect™ колонки, соединенной с первым клапаном для переключения колонки, ее отключали от проточного канала, а второй клапан для переключения колонки устанавливали в положение для подключения колонок, содержащих Superdex 200 Increase, к проточному каналу. Затем элюат с содержащей CaptureSelect™ колонки, содержащий элюировавший белок, загружали на колонки, содержащие Superdex 200 Increase, с буфером А1 со скоростью 0,5 мл/мин. Элюирование белка отслеживали по поглощению УФ при 280 нм и запускали сбор, когда показатель поглощения превышал 200 мЕОП. Затем очищенный белковый состав, который содержал ожидаемую мономерную форму, тестировали на способность ингибировать индуцированные ТФР-β и активным CCN2 виды активности нормальных фибробластов легких человека (NHLF) (Lonza Bioscience, Кат. №: СС-2512). NHLF субкультивировали в полной ростовой среде (Lonza Bioscience BulletKit (Кат. №: СС-3132) со всеми добавками (2% фетальной бычьей сыворотки, инсулин, hFGF-B, гентамицин/амфотерицин-В)) для поддержания плотности с максимальной конфлюентностью 80% в соответствии с инструкциями продавца (Lonza Bioscience). Активный CCN2 состоял из доменов 3-4 CCN2, и был продуцирован и очищен согласно описанию у и соавторов, 2018, выше.Protein was purified by 20-D chromatography consisting of a capture step on a Tricorn column (GE Healthcare) packed with 10 mL of CaptureSelect™ Human Albumin Affinity Matrix (ThermoFisherScientific) immediately followed by size exclusion chromatography on two Superdex 200 Increase 10/300 GL columns (GE Healthcare) in series. The columns were mounted on an FPLC system (BioRad NGC Discover™ 10 Pro system) equipped with a 5 mm pathlength UV flow cell and an outlet valve connected to a 5 mL sample loop. The CaptureSelect™ column was mounted on the first switching valve and equilibrated with buffer A1 consisting of 100 mM NaH2PO4 / Na2HPO4 , 100 mM L-arginine, pH 6.5 , and the Superdex 200 Increase columns were mounted on the second switching valve and equilibrated with buffer A1 (100 mM NaH2PO4 / Na2HPO4 , 100 mM L-arginine, pH 6.5). With the second switching valve containing the Superdex 200 Increase columns in the bypass position, 120 mL of harvested cell culture medium containing the recombinant protein was loaded onto the CaptureSelect™ column using a sample pump at a flow rate of 3.9 mL/min. After loading the harvested cell culture medium containing the recombinant protein onto the CaptureSelect™ column, it was washed with 3 column volumes of buffer A1, then with 2 column volumes of buffer A2 (100 mM NaH2PO4 / Na2HPO4 , 100 mM L- Arginine , 0.25 M NaCl, pH 6.5), and then with 3 column volumes of buffer A1. The CaptureSelect™ column was eluted with 15 mL of buffer B1 (30 mM citric acid, 0.5 M L-arginine, pH 3.5), with the system set to collect eluate with absorbance values greater than 1200 mODU into the sample loop. After elution of the CaptureSelect™ column connected to the first column switching valve, it was disconnected from the flow channel and the second column switching valve was set to connect the columns containing Superdex 200 Increase to the flow channel. The eluate from the CaptureSelect™ column containing the eluted protein was then loaded onto the columns containing Superdex 200 Increase with buffer A1 at a flow rate of 0.5 ml/min. Protein elution was monitored by UV absorbance at 280 nm and collection was initiated when the absorbance was greater than 200 mODU. The purified protein formulation, which contained the expected monomeric form, was then tested for its ability to inhibit TGF-β and active CCN2-induced activities of normal human lung fibroblasts (NHLF) (Lonza Bioscience, Cat.#: CC-2512). NHLF were subcultured in complete growth medium (Lonza Bioscience BulletKit (Cat.#: CC-3132) with all supplements (2% fetal bovine serum, insulin, hFGF-B, gentamicin/amphotericin-B)) to maintain density at a maximum confluency of 80% according to the instructions of the vendor (Lonza Bioscience). Active CCN2 consisted of domains 3-4 of CCN2, and was produced and purified as described by et al., 2018, supra.
Для тестирования эффекта белка, соответствующего SEQ ID NO: 106, на индуцированную активным CCN2 и ТФР-β миграцию клеток NHLF (анализ в системе Transwell/модифицированный анализ в камере Бойдена), клетки сначала рассоединяли трипсином/ЭДТК, нейтрализовали реагентами для нейтрализации трипсина (Lonza Bioscience, Кат. № СС-5034) и ресуспендировали в базальных ростовых средах (Базальная среда для фибробластов (LonzaBioscience Кат. №: СС-3131, без каких-либо добавок, кроме генсумицина (50 мкг/мл))), после чего высевали 30000 клеток в объеме 100 мкл на лунку с верхней стороны вкладышей Transwell с размером пор 5 мкм (24-луночный планшет, Corning® Transwell®, Кат. № CLS3402-48EA от SigmaAldrich (Merck KGaA)). Нижняя камера лунок содержала тестируемые вещества или контрольный носитель, растворенные в 500 мкл базальной ростовой среды без каких-либо добавок, кроме генсумицина. Через 20 часов инкубации вкладыши убирали из лунок, дважды промывали, погружая в забуференный фосфатом солевой раствор (ФСБ, Lonza Bioscience, Кат. №: 17-512F), после чего фиксировали в 4% формальдегиде (Solveco, Швеция, Кат. №: 621092) в течение 15 минут при 37°С. Клетки пермеабилизировали обработкой 0,1% Triton Х-100 в ФСБ в течение 10 минут, после чего дважды промывали ФСБ. Немигрировавшие клетки на верхней стороне вкладышей удаляли, соскабливая ватным тампоном, после чего мембрану оставляли для высыхания. Ядра мигрировавших клеток на обратной стороне вкладышей окрашивали раствором Hoechst 33342 20 мМ (1:5000 в ФСБ, ThermoFisherScientific, Кат. №: 62249) в течение 15 минут в темноте, после чего дважды промывали, погружая в ФСБ. Мембрану вырезали из вкладыша Transwell и монтировали на предметных стеклах, стороной с мигрировавшими клетками к стеклу, покрытому одной каплей Pro Long™ Gold Antifade (ThermoFisherScientific, Кат. №: P36934), закрывали стеклянным покровным стеклом, и по 5-10 изображений каждой лунки захватывали с помощью системы визуализации Zeiss Axio Observer Z.1. Изображения анализировали полуавтоматически с использованием программного обеспечения ImageJ v1.51k, Rasband, WS, ImageJ, от Национальных институтов здравоохранения США, Бетесда, Мэриленд, США, https://imagej.nih.gov/ij/, 1997-2018 гг..). Как можно видеть на Фиг. 16А, белок, соответствующий SEQ ID NO: 106, ингибирует миграцию, индуцированную как ТФР-β, так и активным CCN2.To test the effect of the protein corresponding to SEQ ID NO: 106 on active CCN2 and TGF-β-induced NHLF cell migration (Transwell assay/modified Boyden chamber assay), cells were first dissociated with trypsin/EDTA, neutralized with trypsin neutralizing reagents (Lonza Bioscience, Cat. No. CC-5034) and resuspended in basal growth media (Fibroblast Basal Medium (LonzaBioscience Cat. No. CC-3131, without any additives except gensumycin (50 μg/mL))), followed by seeding of 30,000 cells in a volume of 100 μL per well on the top side of 5 μm pore size Transwell inserts (24-well plate, Corning® Transwell®, Cat. No. CLS3402-48EA from SigmaAldrich (Merck KGaA)). The lower chamber of the wells contained test substances or vehicle control dissolved in 500 μl of basal growth medium without any additives except gensumycin. After 20 h of incubation, the inserts were removed from the wells, washed twice by immersion in phosphate-buffered saline (PBS, Lonza Bioscience, Cat. No.: 17-512F), and then fixed in 4% formaldehyde (Solveco, Sweden, Cat. No.: 621092) for 15 min at 37°C. Cells were permeabilized by treatment with 0.1% Triton X-100 in PBS for 10 min, and then washed twice with PBS. Non-migrated cells on the upper side of the inserts were removed by scraping with a cotton swab and the membrane was allowed to dry. Migrated cell nuclei on the back of the inserts were stained with Hoechst 33342 20 mM (1:5000 in PBS, ThermoFisherScientific, Cat# 62249) for 15 min in the dark and then washed twice by immersion in PBS. The membrane was cut out of the Transwell insert and mounted on glass slides with the migrated cell side facing the glass coated with one drop of Pro Long™ Gold Antifade (ThermoFisherScientific, Cat# P36934), covered with a glass coverslip and 5-10 images of each well were captured using a Zeiss Axio Observer Z.1 imaging system. Images were analyzed semi-automatically using ImageJ v1.51k, Rasband, WS, ImageJ software from the US National Institutes of Health, Bethesda, MD, USA, https://imagej.nih.gov/ij/, 1997-2018). As can be seen in Fig. 16A, the protein corresponding to SEQ ID NO: 106 inhibits migration induced by both TGF-β and active CCN2.
Для тестирования эффекта белка, соответствующего SEQ ID NO: 106, на индуцированные активным CCN2 и ТФР-β результаты анализа зарастания царапины, NHLF рассоединяли трипсином/ЭДТК, нейтрализовали реагентами для нейтрализации трипсина (Lonza Bioscience, Кат. № СС-5034), после чего высевали 100000 клеток в объеме 1 мл в обработанные для культивирования тканей 12-луночные планшеты (Corning Costar®, Кат. № 3513). На следующий день после высевания клетки двукратно промывали 0,9% NaCl и полную ростовую среду заменяли на базальную ростовую среду. После инкубации в базальной ростовой среде в течение 16-20 часов на монослой клеток наносили царапину стерильным наконечником для пипетки на 12,5 мкл (ThermoFisherScientific, Кат. №: 94420053), клетки однократно промывали ФСБ, после чего инкубировали в 1 мл базальной ростовой среды совместно с тестируемыми веществами или носителем. Клетки инкубировали в течение дополнительных 24 часов до троекратного промывания ФСБ до фиксации в течение 15 минут при 37°С в 4% формальдегиде. После фиксации клетки снова промывали в течение 3x3 минут в ФСБ, осторожно встряхивая, пермеабилизировали 0,1% Triton Х-100 в ФСБ в течение 10 минут, осторожно встряхивая. Ядра клеток окрашивали 20 мМ раствором Hoechst 33342 (1:5000, разведенный в ФСБ), ThermoFisherScientific, Кат. №: 62249) в течение 15 минут в темноте, после чего промывали 3x5 минут в ФСБ, осторожно встряхивая. Наносили 1 каплю Pro Long™ Gold Antifade (ThermoFisherScientific, Кат. №: P36934) до монтировки препаратов и захватывали по 5 изображений, с центром на остающемся зазоре в каждой лунке, с помощью системы визуализации Zeiss Axio Observer Z.1. Изображения анализировали путем измерения размера оставшегося зазора после нанесения царапины через 3 фиксированных интервала вдоль всей длины царапины. Вычисляли среднее для всех измерений на всех изображениях из каждой лунки и засчитывали как один биологический репликат. Как можно видеть на Фиг. 16 В, белок, соответствующий SEQ ID NO: 106, ингибирует зарастание царапины, индуцированное как ТФР-β, так и активным CCN2.To test the effect of the protein corresponding to SEQ ID NO: 106 on active CCN2 and TGF-β-induced scratch closure assay results, NHLF were dissociated with trypsin/EDTA, neutralized with trypsin neutralizing reagents (Lonza Bioscience, Cat.# CC-5034), and 100,000 cells were seeded in 1 ml in tissue culture-treated 12-well plates (Corning Costar®, Cat.# 3513). The day after seeding, cells were washed twice with 0.9% NaCl and complete growth medium was replaced with basal growth medium. After incubation in basal growth medium for 16-20 h, the cell monolayer was scratched with a sterile 12.5 µl pipette tip (ThermoFisherScientific, Cat# 94420053), the cells were washed once with PBS and then incubated in 1 ml basal growth medium plus test substances or vehicle. The cells were incubated for an additional 24 h before being washed three times with PBS before fixation for 15 min at 37°C in 4% formaldehyde. After fixation, the cells were washed again for 3 x 3 min in PBS with gentle shaking, permeabilized with 0.1% Triton X-100 in PBS for 10 min with gentle shaking. Cell nuclei were stained with 20 mM Hoechst 33342 (1:5000, diluted in PBS), ThermoFisherScientific, Cat#: 62249) for 15 min in the dark, followed by 3 x 5 min washes in PBS with gentle shaking. 1 drop of Pro Long™ Gold Antifade (ThermoFisherScientific, Cat#: P36934) was applied before mounting the slides and 5 images were captured centered on the remaining gap in each well using a Zeiss Axio Observer Z.1 imaging system. Images were analyzed by measuring the size of the remaining gap after the scratch was made at 3 fixed intervals along the length of the scratch. The average of all measurements across all images from each well was calculated and counted as one biological replicate. As can be seen in Fig. 16 B, the protein corresponding to SEQ ID NO: 106 inhibits scratch closure induced by both TGF-β and active CCN2.
Для тестирования эффекта белка, соответствующего SEQ ID NO: 106, на индуцированную ТФР-β регуляцию генов, NHLF рассоединяли трипсином/ЭДТК, нейтрализовали реагентами для нейтрализации трипсина (Lonza Bioscience, Кат. № СС-5034), после чего высевали 100000 клеток в объеме 1 мл в обработанные для культивирования тканей 12-луночные планшеты (Corning Costar®, Кат. № 3513). На следующий день после высевания клетки двукратно промывали 0,9% NaCl и полную ростовую среду заменяли на базальную ростовую среду с добавлением 0,1% инактивированной нагреванием фетальной бычьей сыворотки (Кат. № 16000-044 от Gibco™, термоинактивацию проводили согласно описанию в Примере 2). После инкубации в базальной ростовой среде с 0,1% фетальной бычьей сыворотки в течение 6 часов добавляли в лунки тестируемые вещества или контрольный носитель. Через 96 часов лунки двукратно промывали в ФСБ и экстрагировали РНК с использованием набора для экстракции РНК Qiagen RNeasy (Кат. № 74106) в соответствии с протоколом изготовителя. Концентрации РНК количественно определяли с помощью спектрофотометра NanoDrop® ND-1000 (NanoDrop Technologies, США), разводили водой без нуклеаз до конечной концентрации РНК 50 нг/мкл перед использованием 200 нг РНК из каждого репликата для получения кДНК с помощью набора для обратной транскрипции TaqMan™ (Кат. № N8080234) в соответствии с протоколом производителя. Дифференциальную генную экспрессию анализировали в полученных образцах кДНК с применением соответствующих анализов TaqMan™ и мастер-микса TaqMan Fast Advanced Master Mix (ThermoFisherScientific Кат. № 4444557). (ThermoFisherScientific Кат. № 4444557). Реакции ПЦР в реальном времени TaqMan™ проводили с получением технических трипликатов для каждого образца, используя систему ПЦР в реальном времени Applied Biosystems StepOnePlus Real Time PCR в соответствии с протоколами изготовителя. Относительные количества разных транскриптов вычисляли по стандартной кривой до усреднения данных технических трипликатов для получения единственного значения для каждого образца. Все результаты генной экспрессии сопоставляли с уровнями мРНК ГАФДГ (ThermoFisherScientific, Кат. № Hs02786624_g1) и нормировали, выражая в виде показателя кратности относительно среднего значения для лунок, стимулированных контролем-носителем. Как можно видеть на Фиг. 19C-F, белок, соответствующий SEQ ID NO: 107, обеспечивает частичное ингибирование индуцированных ТФР-β генов; COL1A1 («коллаген типа 1 α-1», ThermoFisherScientific, Кат. № Hs00164004_m1), FN1 («фибронектин 1», ThermoFisherScientific, Кат. № Hs01549976_m1), АСТА2 («гладкомышечный актин α-2», ThermoFisherScientific, Кат. № Hs00426835_g1) и CCN2 (ThermoFisherScientific, Кат. № Hs00170014_m1), которые обычно рассматривают как профибротические гены.To test the effect of the protein corresponding to SEQ ID NO: 106 on TGF-β-induced gene regulation, NHLF was cleaved with trypsin/EDTA, neutralized with trypsin neutralizing reagents (Lonza Bioscience, Cat.# CC-5034), and 100,000 cells were seeded in 1 ml in tissue culture-treated 12-well plates (Corning Costar®, Cat.# 3513). The day after seeding, cells were washed twice with 0.9% NaCl and complete growth medium was replaced with basal growth medium supplemented with 0.1% heat-inactivated fetal bovine serum (Cat.# 16000-044 from Gibco™, heat inactivated as described in Example 2). After incubation in basal growth medium with 0.1% fetal bovine serum for 6 h, test substances or vehicle control were added to the wells. After 96 h, the wells were washed twice in PBS and RNA was extracted using the Qiagen RNeasy RNA Extraction Kit (Cat. No. 74106) according to the manufacturer's protocol. RNA concentrations were quantified using a NanoDrop® ND-1000 spectrophotometer (NanoDrop Technologies, USA), diluted with nuclease-free water to a final RNA concentration of 50 ng/µl before using 200 ng RNA from each replicate to prepare cDNA using the TaqMan™ Reverse Transcription Kit (Cat. No. N8080234) according to the manufacturer's protocol. Differential gene expression was analyzed in the resulting cDNA samples using appropriate TaqMan™ assays and the TaqMan Fast Advanced Master Mix (ThermoFisherScientific Cat. #4444557). (ThermoFisherScientific Cat. #4444557). TaqMan™ real-time PCR reactions were performed to generate technical triplicates for each sample using the Applied Biosystems StepOnePlus Real Time PCR System according to the manufacturer's protocols. Relative amounts of different transcripts were calculated from a standard curve before the technical triplicate data were averaged to generate a single value for each sample. All gene expression results were compared with GAPDH mRNA levels (ThermoFisherScientific, Cat.# Hs02786624_g1) and normalized as a fold change relative to the mean of vehicle control-stimulated wells. As can be seen in Fig. 19C-F, the protein corresponding to SEQ ID NO: 107 provides partial inhibition of TGF-β-induced genes; COL1A1 ('collagen type 1 α-1', ThermoFisherScientific, Cat# Hs00164004_m1), FN1 ('fibronectin 1', ThermoFisherScientific, Cat# Hs01549976_m1), ASTA2 ('smooth muscle actin α-2', ThermoFisherScientific, Cat# Hs00426835_g1) and CCN2 (ThermoFisherScientific, Cat# Hs00170014_m1), which are generally considered pro-fibrotic genes.
Нумерация белков CCN: в соответствии с базой данных Uniprot, согласно описанию в разделе «Подробное описание изобретения», выше. Нумерация Fc-фрагментов: в соответствии с системой нумерации Ей согласно описанию в разделе «Подробное описание изобретения», выше.Numbering of CCN proteins: according to the Uniprot database, as described in the Detailed Description of the Invention section above. Numbering of Fc fragments: according to the Ei numbering system, as described in the Detailed Description of the Invention section above.
--->--->
ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙSEQUENCE LIST
<110> Oslo Universitetssykehus HF/ Осло Университетссикехус ХФ<110> Oslo University College HF/ Oslo University College HF
<120> Recombinant CCN domain proteins and fusion proteins/<120> Recombinant CCN domain proteins and fusion proteins/
РЕКОМБИНАНТНЫЕ БЕЛКИ И СЛИТЫЕ БЕЛКИ С ДОМЕНАМИ CCN RECOMBINANT PROTEINS AND FUSION PROTEINS WITH CCN DOMAINS
<130> 27.11.145331/01<130> 27.11.145331/01
<150> EP 19163970.7<150>EP 19163970.7
<151> 2019-03-20<151> 2019-03-20
<160> 121 <160> 121
<170> PatentIn, версия 3.5<170> PatentIn, version 3.5
<210> 1<210> 1
<211> 53<211> 53
<212> PRT/Белок<212> PRT/Protein
<213> Homo sapiens<213> Homo sapiens
<400> 1<400> 1
Cys Pro Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr Cys Gly Cys Pro Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr Cys Gly
1 5 10 15 1 5 10 15
Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys Arg Leu Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys Arg Leu
20 25 30 20 25 30
Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Pro Pro Ser Arg Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Pro Pro Ser Arg
35 40 45 35 40 45
Gly Arg Ser Pro Gln Gly Arg Ser Pro Gln
50 50
<210> 2<210> 2
<211> 44<211> 44
<212> PRT/Белок<212> PRT/Protein
<213> Homo sapiens<213> Homo sapiens
<400> 2<400> 2
Cys Ile Glu Gln Thr Thr Glu Trp Thr Ala Cys Ser Lys Ser Cys Gly Cys Ile Glu Gln Thr Thr Glu Trp Thr Ala Cys Ser Lys Ser Cys Gly
1 5 10 15 1 5 10 15
Met Gly Phe Ser Thr Arg Val Thr Asn Arg Asn Arg Gln Cys Glu Met Met Gly Phe Ser Thr Arg Val Thr Asn Arg Asn Arg Gln Cys Glu Met
20 25 30 20 25 30
Leu Lys Gln Thr Arg Leu Cys Met Val Arg Pro Cys Leu Lys Gln Thr Arg Leu Cys Met Val Arg Pro Cys
35 40 35 40
<210> 3<210> 3
<211> 44<211> 44
<212> PRT/Белок<212> PRT/Protein
<213> Homo sapiens<213> Homo sapiens
<400> 3<400> 3
Cys Leu Val Gln Thr Thr Glu Trp Ser Ala Cys Ser Lys Thr Cys Gly Cys Leu Val Gln Thr Thr Glu Trp Ser Ala Cys Ser Lys Thr Cys Gly
1 5 10 15 1 5 10 15
Met Gly Ile Ser Thr Arg Val Thr Asn Asp Asn Ala Ser Cys Arg Leu Met Gly Ile Ser Thr Arg Val Thr Asn Asp Asn Ala Ser Cys Arg Leu
20 25 30 20 25 30
Glu Lys Gln Ser Arg Leu Cys Met Val Arg Pro Cys Glu Lys Gln Ser Arg Leu Cys Met Val Arg Pro Cys
35 40 35 40
<210> 4<210> 4
<211> 44<211> 44
<212> PRT/Белок<212> PRT/Protein
<213> Homo sapiens<213> Homo sapiens
<400> 4<400> 4
Cys Ile Val Gln Thr Thr Ser Trp Ser Gln Cys Ser Lys Thr Cys Gly Cys Ile Val Gln Thr Thr Ser Trp Ser Gln Cys Ser Lys Thr Cys Gly
1 5 10 15 1 5 10 15
Thr Gly Ile Ser Thr Arg Val Thr Asn Asp Asn Pro Glu Cys Arg Leu Thr Gly Ile Ser Thr Arg Val Thr Asn Asp Asn Pro Glu Cys Arg Leu
20 25 30 20 25 30
Val Lys Glu Thr Arg Ile Cys Glu Val Arg Pro Cys Val Lys Glu Thr Arg Ile Cys Glu Val Arg Pro Cys
35 40 35 40
<210> 5<210> 5
<211> 44<211> 44
<212> PRT/Белок<212> PRT/Protein
<213> Homo sapiens<213> Homo sapiens
<400> 5<400> 5
Cys Ile Ala Tyr Thr Ser Pro Trp Ser Pro Cys Ser Thr Ser Cys Gly Cys Ile Ala Tyr Thr Ser Pro Trp Ser Pro Cys Ser Thr Ser Cys Gly
1 5 10 15 1 5 10 15
Leu Gly Val Ser Thr Arg Ile Ser Asn Val Asn Ala Gln Cys Trp Pro Leu Gly Val Ser Thr Arg Ile Ser Asn Val Asn Ala Gln Cys Trp Pro
20 25 30 20 25 30
Glu Gln Glu Ser Arg Leu Cys Asn Leu Arg Pro Cys Glu Gln Glu Ser Arg Leu Cys Asn Leu Arg Pro Cys
35 40 35 40
<210> 6<210> 6
<211> 44<211> 44
<212> PRT/Белок<212> PRT/Protein
<213> Homo sapiens<213> Homo sapiens
<400> 6<400> 6
Cys Leu Val Gln Ala Thr Lys Trp Thr Pro Cys Ser Arg Thr Cys Gly Cys Leu Val Gln Ala Thr Lys Trp Thr Pro Cys Ser Arg Thr Cys Gly
1 5 10 15 1 5 10 15
Met Gly Ile Ser Asn Arg Val Thr Asn Glu Asn Ser Asn Cys Glu Met Met Gly Ile Ser Asn Arg Val Thr Asn Glu Asn Ser Asn Cys Glu Met
20 25 30 20 25 30
Arg Lys Glu Lys Arg Leu Cys Tyr Ile Gln Pro Cys Arg Lys Glu Lys Arg Leu Cys Tyr Ile Gln Pro Cys
35 40 35 40
<210> 7<210> 7
<211> 53<211> 53
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Модифицированная последовательность CCN5<223> Modified CCN5 sequence
<400> 7<400> 7
Cys Ala Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr Cys Gly Cys Ala Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr Cys Gly
1 5 10 15 1 5 10 15
Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys Arg Leu Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys Arg Leu
20 25 30 20 25 30
Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Pro Pro Ser Arg Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Pro Pro Ser Arg
35 40 45 35 40 45
Gly Arg Ser Pro Gln Gly Arg Ser Pro Gln
50 50
<210> 8<210> 8
<211> 55<211> 55
<212> PRT/Белок<212> PRT/Protein
<213> Homo sapiens<213> Homo sapiens
<400> 8<400> 8
Cys Leu Val Gln Ala Thr Lys Trp Thr Pro Cys Ser Arg Thr Cys Gly Cys Leu Val Gln Ala Thr Lys Trp Thr Pro Cys Ser Arg Thr Cys Gly
1 5 10 15 1 5 10 15
Met Gly Ile Ser Asn Arg Val Thr Asn Glu Asn Ser Asn Cys Glu Met Met Gly Ile Ser Asn Arg Val Thr Asn Glu Asn Ser Asn Cys Glu Met
20 25 30 20 25 30
Arg Lys Glu Lys Arg Leu Cys Tyr Ile Gln Pro Cys Asp Ser Asn Ile Arg Lys Glu Lys Arg Leu Cys Tyr Ile Gln Pro Cys Asp Ser Asn Ile
35 40 45 35 40 45
Leu Lys Thr Ile Lys Ile Pro Leu Lys Thr Ile Lys Ile Pro
50 55 50 55
<210> 9<210> 9
<211> 53<211> 53
<212> PRT/Белок<212> PRT/Protein
<213> Homo sapiens<213> Homo sapiens
<400> 9<400> 9
Cys Ile Glu Gln Thr Thr Glu Trp Thr Ala Cys Ser Lys Ser Cys Gly Cys Ile Glu Gln Thr Thr Glu Trp Thr Ala Cys Ser Lys Ser Cys Gly
1 5 10 15 1 5 10 15
Met Gly Phe Ser Thr Arg Val Thr Asn Arg Asn Arg Gln Cys Glu Met Met Gly Phe Ser Thr Arg Val Thr Asn Arg Asn Arg Gln Cys Glu Met
20 25 30 20 25 30
Leu Lys Gln Thr Arg Leu Cys Met Val Arg Pro Cys Glu Gln Glu Pro Leu Lys Gln Thr Arg Leu Cys Met Val Arg Pro Cys Glu Gln Glu Pro
35 40 45 35 40 45
Glu Gln Pro Thr Asp Glu Gln Pro Thr Asp
50 50
<210> 10<210> 10
<211> 52<211> 52
<212> PRT/Белок<212> PRT/Protein
<213> Homo sapiens<213> Homo sapiens
<400> 10<400> 10
Cys Leu Val Gln Thr Thr Glu Trp Ser Ala Cys Ser Lys Thr Cys Gly Cys Leu Val Gln Thr Thr Glu Trp Ser Ala Cys Ser Lys Thr Cys Gly
1 5 10 15 1 5 10 15
Met Gly Ile Ser Thr Arg Val Thr Asn Asp Asn Ala Ser Cys Arg Leu Met Gly Ile Ser Thr Arg Val Thr Asn Asp Asn Ala Ser Cys Arg Leu
20 25 30 20 25 30
Glu Lys Gln Ser Arg Leu Cys Met Val Arg Pro Cys Glu Ala Asp Leu Glu Lys Gln Ser Arg Leu Cys Met Val Arg Pro Cys Glu Ala Asp Leu
35 40 45 35 40 45
Glu Glu Asn Ile Glu Glu Asn Ile
50 50
<210> 11<210> 11
<211> 52<211> 52
<212> PRT/Белок<212> PRT/Protein
<213> Homo sapiens<213> Homo sapiens
<400> 11<400> 11
Cys Ile Val Gln Thr Thr Ser Trp Ser Gln Cys Ser Lys Thr Cys Gly Cys Ile Val Gln Thr Thr Ser Trp Ser Gln Cys Ser Lys Thr Cys Gly
1 5 10 15 1 5 10 15
Thr Gly Ile Ser Thr Arg Val Thr Asn Asp Asn Pro Glu Cys Arg Leu Thr Gly Ile Ser Thr Arg Val Thr Asn Asp Asn Pro Glu Cys Arg Leu
20 25 30 20 25 30
Val Lys Glu Thr Arg Ile Cys Glu Val Arg Pro Cys Gly Gln Pro Val Val Lys Glu Thr Arg Ile Cys Glu Val Arg Pro Cys Gly Gln Pro Val
35 40 45 35 40 45
Tyr Ser Ser Leu Tyr Ser Ser Leu
50 50
<210> 12<210> 12
<211> 52<211> 52
<212> PRT/Белок<212> PRT/Protein
<213> Homo sapiens<213> Homo sapiens
<400> 12<400> 12
Cys Ile Ala Tyr Thr Ser Pro Trp Ser Pro Cys Ser Thr Ser Cys Gly Cys Ile Ala Tyr Thr Ser Pro Trp Ser Pro Cys Ser Thr Ser Cys Gly
1 5 10 15 1 5 10 15
Leu Gly Val Ser Thr Arg Ile Ser Asn Val Asn Ala Gln Cys Trp Pro Leu Gly Val Ser Thr Arg Ile Ser Asn Val Asn Ala Gln Cys Trp Pro
20 25 30 20 25 30
Glu Gln Glu Ser Arg Leu Cys Asn Leu Arg Pro Cys Asp Val Asp Ile Glu Gln Glu Ser Arg Leu Cys Asn Leu Arg Pro Cys Asp Val Asp Ile
35 40 45 35 40 45
His Thr Leu Ile His Thr Leu Ile
50 50
<210> 13<210> 13
<211> 229<211> 229
<212> PRT/Белок<212> PRT/Protein
<213> Homo sapiens<213> Homo sapiens
<400> 13<400> 13
Glu Ser Lys Tyr Gly Pro Pro Cys Pro Ser Cys Pro Ala Pro Glu Phe Glu Ser Lys Tyr Gly Pro Pro Cys Pro Ser Cys Pro Ala Pro Glu Phe
1 5 10 15 1 5 10 15
Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr
20 25 30 20 25 30
Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val
35 40 45 35 40 45
Ser Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Ser Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val
50 55 60 50 55 60
Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser
65 70 75 80 65 70 75 80
Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu
85 90 95 85 90 95
Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser
100 105 110 100 105 110
Ser Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Ser Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro
115 120 125 115 120 125
Gln Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Gln Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln
130 135 140 130 135 140
Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala
145 150 155 160 145 150 155 160
Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr
165 170 175 165 170 175
Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu
180 185 190 180 185 190
Thr Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Thr Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser
195 200 205 195 200 205
Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser
210 215 220 210 215 220
Leu Ser Leu Gly Lys Leu Ser Leu Gly Lys
225 225
<210> 14<210> 14
<211> 228<211> 228
<212> PRT/Белок<212> PRT/Protein
<213> Homo sapiens<213> Homo sapiens
<400> 14<400> 14
Glu Arg Lys Cys Cys Val Glu Cys Pro Pro Cys Pro Ala Pro Pro Val Glu Arg Lys Cys Cys Val Glu Cys Pro Pro Cys Pro Ala Pro Pro Val
1 5 10 15 1 5 10 15
Ala Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Ala Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu
20 25 30 20 25 30
Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser
35 40 45 35 40 45
His Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu His Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu
50 55 60 50 55 60
Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Thr Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Thr
65 70 75 80 65 70 75 80
Phe Arg Val Val Ser Val Leu Thr Val Val His Gln Asp Trp Leu Asn Phe Arg Val Val Ser Val Leu Thr Val Val His Gln Asp Trp Leu Asn
85 90 95 85 90 95
Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ala Pro Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ala Pro
100 105 110 100 105 110
Ile Glu Lys Thr Ile Ser Lys Thr Lys Gly Gln Pro Arg Glu Pro Gln Ile Glu Lys Thr Ile Ser Lys Thr Lys Gly Gln Pro Arg Glu Pro Gln
115 120 125 115 120 125
Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val
130 135 140 130 135 140
Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ser Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ser Val
145 150 155 160 145 150 155 160
Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro
165 170 175 165 170 175
Pro Met Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Pro Met Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr
180 185 190 180 185 190
Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val
195 200 205 195 200 205
Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu
210 215 220 210 215 220
Ser Pro Gly Lys Ser Pro Gly Lys
225 225
<210> 15<210> 15
<211> 228<211> 228
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Модифицированный Fc-фрагмент<223> Modified Fc fragment
<400> 15<400> 15
Glu Ser Lys Tyr Gly Pro Pro Cys Pro Pro Cys Pro Ala Pro Glu Ala Glu Ser Lys Tyr Gly Pro Pro Cys Pro Pro Cys Pro Ala Pro Glu Ala
1 5 10 15 1 5 10 15
Ala Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Ala Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr
20 25 30 20 25 30
Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val
35 40 45 35 40 45
Ser Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Ser Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val
50 55 60 50 55 60
Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser
65 70 75 80 65 70 75 80
Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu
85 90 95 85 90 95
Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser
100 105 110 100 105 110
Ser Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Ser Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro
115 120 125 115 120 125
Gln Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Gln Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln
130 135 140 130 135 140
Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala
145 150 155 160 145 150 155 160
Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr
165 170 175 165 170 175
Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu
180 185 190 180 185 190
Thr Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Thr Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser
195 200 205 195 200 205
Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser
210 215 220 210 215 220
Leu Ser Leu Gly Leu Ser Leu Gly
225 225
<210> 16<210> 16
<211> 232<211> 232
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Модифицированный Fc-фрагмент<223> Modified Fc fragment
<400> 16<400> 16
Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala
1 5 10 15 1 5 10 15
Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro
20 25 30 20 25 30
Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val
35 40 45 35 40 45
Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val
50 55 60 50 55 60
Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Cys Glu Glu Gln Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Cys Glu Glu Gln
65 70 75 80 65 70 75 80
Tyr Gly Ser Thr Tyr Arg Cys Val Ser Val Leu Thr Val Leu His Gln Tyr Gly Ser Thr Tyr Arg Cys Val Ser Val Leu Thr Val Leu His Gln
85 90 95 85 90 95
Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala
100 105 110 100 105 110
Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro
115 120 125 115 120 125
Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr
130 135 140 130 135 140
Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser
145 150 155 160 145 150 155 160
Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr
165 170 175 165 170 175
Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr
180 185 190 180 185 190
Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe
195 200 205 195 200 205
Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys
210 215 220 210 215 220
Ser Leu Ser Leu Ser Pro Gly Lys Ser Leu Ser Leu Ser Pro Gly Lys
225 230 225 230
<210> 17<210> 17
<211> 231<211> 231
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Модифицированный Fc-фрагмент<223> Modified Fc fragment
<400> 17<400> 17
Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala
1 5 10 15 1 5 10 15
Pro Pro Val Ala Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Pro Pro Val Ala Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys
20 25 30 20 25 30
Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val
35 40 45 35 40 45
Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp
50 55 60 50 55 60
Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Cys Glu Glu Gln Tyr Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Cys Glu Glu Gln Tyr
65 70 75 80 65 70 75 80
Gly Ser Thr Tyr Arg Cys Val Ser Val Leu Thr Val Leu His Gln Asp Gly Ser Thr Tyr Arg Cys Val Ser Val Leu Thr Val Leu His Gln Asp
85 90 95 85 90 95
Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu
100 105 110 100 105 110
Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg
115 120 125 115 120 125
Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys
130 135 140 130 135 140
Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp
145 150 155 160 145 150 155 160
Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys
165 170 175 165 170 175
Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser
180 185 190 180 185 190
Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser
195 200 205 195 200 205
Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser
210 215 220 210 215 220
Leu Ser Leu Ser Pro Gly Lys Leu Ser Leu Ser Pro Gly Lys
225 230 225 230
<210> 18<210> 18
<211> 227<211> 227
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Модифицированный Fc-фрагмент<223> Modified Fc fragment
<400> 18<400> 18
Glu Ser Lys Tyr Gly Pro Pro Cys Pro Pro Cys Pro Ala Pro Pro Val Glu Ser Lys Tyr Gly Pro Pro Cys Pro Pro Cys Pro Ala Pro Pro Val
1 5 10 15 1 5 10 15
Ala Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Ala Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu
20 25 30 20 25 30
Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser
35 40 45 35 40 45
Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu
50 55 60 50 55 60
Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Thr Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Thr
65 70 75 80 65 70 75 80
Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn
85 90 95 85 90 95
Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Ser Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Ser
100 105 110 100 105 110
Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln
115 120 125 115 120 125
Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Val Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Val
130 135 140 130 135 140
Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val
145 150 155 160 145 150 155 160
Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro
165 170 175 165 170 175
Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu Thr Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu Thr
180 185 190 180 185 190
Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Val Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Val
195 200 205 195 200 205
Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu
210 215 220 210 215 220
Ser Leu Gly Ser Leu Gly
225 225
<210> 19<210> 19
<211> 227<211> 227
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Модифицированный Fc-фрагмент<223> Modified Fc fragment
<400> 19<400> 19
Glu Arg Lys Cys Cys Val Glu Cys Pro Pro Cys Pro Ala Pro Pro Val Glu Arg Lys Cys Cys Val Glu Cys Pro Pro Cys Pro Ala Pro Pro Val
1 5 10 15 1 5 10 15
Ala Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Ala Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu
20 25 30 20 25 30
Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser
35 40 45 35 40 45
Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu
50 55 60 50 55 60
Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Thr Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Thr
65 70 75 80 65 70 75 80
Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn
85 90 95 85 90 95
Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Ser Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Ser
100 105 110 100 105 110
Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln
115 120 125 115 120 125
Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Val Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Val
130 135 140 130 135 140
Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val
145 150 155 160 145 150 155 160
Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro
165 170 175 165 170 175
Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu Thr Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu Thr
180 185 190 180 185 190
Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Val Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Val
195 200 205 195 200 205
Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu
210 215 220 210 215 220
Ser Leu Gly Ser Leu Gly
225 225
<210> 20<210> 20
<211> 6<211> 6
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Линкер<223> Linker
<400> 20<400> 20
Thr Glu Gly Arg Met Asp Thr Glu Gly Arg Met Asp
1 5 1 5
<210> 21<210> 21
<211> 5<211> 5
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Линкер<223> Linker
<400> 21<400> 21
Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys
1 5 1 5
<210> 22<210> 22
<211> 40<211> 40
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Линкер<223> Linker
<400> 22<400> 22
Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu
1 5 10 15 1 5 10 15
Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala
20 25 30 20 25 30
Ala Ala Lys Glu Ala Ala Ala Lys Ala Ala Lys Glu Ala Ala Ala Lys
35 40 35 40
<210> 23<210> 23
<211> 42<211> 42
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Линкер<223> Linker
<400> 23<400> 23
Thr Ala Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Thr Ala Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala
1 5 10 15 1 5 10 15
Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys
20 25 30 20 25 30
Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys
35 40 35 40
<210> 24<210> 24
<211> 43<211> 43
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Линкер<223> Linker
<400> 24<400> 24
Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu
1 5 10 15 1 5 10 15
Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala
20 25 30 20 25 30
Ala Ala Lys Glu Ala Ala Ala Lys Ala Ala Ala Ala Ala Lys Glu Ala Ala Ala Lys Ala Ala Ala
35 40 35 40
<210> 25<210> 25
<211> 45<211> 45
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Линкер<223> Linker
<400> 25<400> 25
Thr Ala Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Thr Ala Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala
1 5 10 15 1 5 10 15
Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys
20 25 30 20 25 30
Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Ala Ala Ala Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Ala Ala Ala
35 40 45 35 40 45
<210> 26<210> 26
<211> 276<211> 276
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 26<400> 26
Cys Pro Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr Cys Gly Cys Pro Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr Cys Gly
1 5 10 15 1 5 10 15
Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys Arg Leu Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys Arg Leu
20 25 30 20 25 30
Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Glu Ala Ala Ala Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Glu Ala Ala Ala
35 40 45 35 40 45
Lys Glu Arg Lys Cys Cys Val Glu Cys Pro Pro Cys Pro Ala Pro Pro Lys Glu Arg Lys Cys Cys Val Glu Cys Pro Pro Cys Pro Ala Pro Pro
50 55 60 50 55 60
Val Ala Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Val Ala Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr
65 70 75 80 65 70 75 80
Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val
85 90 95 85 90 95
Ser Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Ser Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val
100 105 110 100 105 110
Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser
115 120 125 115 120 125
Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu
130 135 140 130 135 140
Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser
145 150 155 160 145 150 155 160
Ser Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Ser Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro
165 170 175 165 170 175
Gln Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Gln Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln
180 185 190 180 185 190
Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala
195 200 205 195 200 205
Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr
210 215 220 210 215 220
Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu
225 230 235 240 225 230 235 240
Thr Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Thr Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser
245 250 255 245 250 255
Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser
260 265 270 260 265 270
Leu Ser Leu Gly Leu Ser Leu Gly
275 275
<210> 27<210> 27
<211> 276<211> 276
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 27<400> 27
Cys Ala Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr Cys Gly Cys Ala Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr Cys Gly
1 5 10 15 1 5 10 15
Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys Arg Leu Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys Arg Leu
20 25 30 20 25 30
Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Glu Ala Ala Ala Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Glu Ala Ala Ala
35 40 45 35 40 45
Lys Glu Arg Lys Cys Cys Val Glu Cys Pro Pro Cys Pro Ala Pro Pro Lys Glu Arg Lys Cys Cys Val Glu Cys Pro Pro Cys Pro Ala Pro Pro
50 55 60 50 55 60
Val Ala Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Val Ala Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr
65 70 75 80 65 70 75 80
Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val
85 90 95 85 90 95
Ser Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Ser Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val
100 105 110 100 105 110
Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser
115 120 125 115 120 125
Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu
130 135 140 130 135 140
Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser
145 150 155 160 145 150 155 160
Ser Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Ser Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro
165 170 175 165 170 175
Gln Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Gln Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln
180 185 190 180 185 190
Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala
195 200 205 195 200 205
Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr
210 215 220 210 215 220
Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu
225 230 235 240 225 230 235 240
Thr Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Thr Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser
245 250 255 245 250 255
Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser
260 265 270 260 265 270
Leu Ser Leu Gly Leu Ser Leu Gly
275 275
<210> 28<210> 28
<211> 287<211> 287
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 28<400> 28
Cys Pro Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr Cys Gly Cys Pro Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr Cys Gly
1 5 10 15 1 5 10 15
Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys Arg Leu Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys Arg Leu
20 25 30 20 25 30
Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Pro Pro Ser Arg Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Pro Pro Ser Arg
35 40 45 35 40 45
Gly Arg Ser Pro Gln Thr Glu Gly Arg Met Asp Glu Ser Lys Tyr Gly Gly Arg Ser Pro Gln Thr Glu Gly Arg Met Asp Glu Ser Lys Tyr Gly
50 55 60 50 55 60
Pro Pro Cys Pro Pro Cys Pro Ala Pro Glu Ala Ala Gly Gly Pro Ser Pro Pro Cys Pro Pro Cys Pro Ala Pro Glu Ala Ala Gly Gly Pro Ser
65 70 75 80 65 70 75 80
Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg
85 90 95 85 90 95
Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser Gln Glu Asp Pro Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser Gln Glu Asp Pro
100 105 110 100 105 110
Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala
115 120 125 115 120 125
Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Thr Tyr Arg Val Val Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Thr Tyr Arg Val Val
130 135 140 130 135 140
Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr
145 150 155 160 145 150 155 160
Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Ser Ile Glu Lys Thr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Ser Ile Glu Lys Thr
165 170 175 165 170 175
Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu
180 185 190 180 185 190
Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys
195 200 205 195 200 205
Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser
210 215 220 210 215 220
Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp
225 230 235 240 225 230 235 240
Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu Thr Val Asp Lys Ser Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu Thr Val Asp Lys Ser
245 250 255 245 250 255
Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala
260 265 270 260 265 270
Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Leu Gly Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Leu Gly
275 280 285 275 280 285
<210> 29<210> 29
<211> 286<211> 286
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 29<400> 29
Cys Pro Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr Cys Gly Cys Pro Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr Cys Gly
1 5 10 15 1 5 10 15
Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys Arg Leu Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys Arg Leu
20 25 30 20 25 30
Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Pro Pro Ser Arg Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Pro Pro Ser Arg
35 40 45 35 40 45
Gly Arg Ser Pro Gln Thr Glu Gly Arg Met Asp Glu Ser Lys Tyr Gly Gly Arg Ser Pro Gln Thr Glu Gly Arg Met Asp Glu Ser Lys Tyr Gly
50 55 60 50 55 60
Pro Pro Cys Pro Pro Cys Pro Ala Pro Pro Val Ala Gly Pro Ser Val Pro Pro Cys Pro Pro Cys Pro Ala Pro Pro Val Ala Gly Pro Ser Val
65 70 75 80 65 70 75 80
Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr
85 90 95 85 90 95
Pro Glu Val Thr Cys Val Val Val Asp Val Ser Gln Glu Asp Pro Glu Pro Glu Val Thr Cys Val Val Val Asp Val Ser Gln Glu Asp Pro Glu
100 105 110 100 105 110
Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys
115 120 125 115 120 125
Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Thr Tyr Arg Val Val Ser Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Thr Tyr Arg Val Val Ser
130 135 140 130 135 140
Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys
145 150 155 160 145 150 155 160
Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Ser Ile Glu Lys Thr Ile Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Ser Ile Glu Lys Thr Ile
165 170 175 165 170 175
Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro
180 185 190 180 185 190
Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu
195 200 205 195 200 205
Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn
210 215 220 210 215 220
Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser
225 230 235 240 225 230 235 240
Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu Thr Val Asp Lys Ser Arg Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu Thr Val Asp Lys Ser Arg
245 250 255 245 250 255
Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu
260 265 270 260 265 270
His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Leu Gly His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Leu Gly
275 280 285 275 280 285
<210> 30<210> 30
<211> 286<211> 286
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 30<400> 30
Cys Pro Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr Cys Gly Cys Pro Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr Cys Gly
1 5 10 15 1 5 10 15
Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys Arg Leu Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys Arg Leu
20 25 30 20 25 30
Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Pro Pro Ser Arg Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Pro Pro Ser Arg
35 40 45 35 40 45
Gly Arg Ser Pro Gln Thr Glu Gly Arg Met Asp Glu Arg Lys Cys Cys Gly Arg Ser Pro Gln Thr Glu Gly Arg Met Asp Glu Arg Lys Cys Cys
50 55 60 50 55 60
Val Glu Cys Pro Pro Cys Pro Ala Pro Pro Val Ala Gly Pro Ser Val Val Glu Cys Pro Pro Cys Pro Ala Pro Pro Val Ala Gly Pro Ser Val
65 70 75 80 65 70 75 80
Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr
85 90 95 85 90 95
Pro Glu Val Thr Cys Val Val Val Asp Val Ser Gln Glu Asp Pro Glu Pro Glu Val Thr Cys Val Val Val Asp Val Ser Gln Glu Asp Pro Glu
100 105 110 100 105 110
Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys
115 120 125 115 120 125
Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Thr Tyr Arg Val Val Ser Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Thr Tyr Arg Val Val Ser
130 135 140 130 135 140
Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys
145 150 155 160 145 150 155 160
Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Ser Ile Glu Lys Thr Ile Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Ser Ile Glu Lys Thr Ile
165 170 175 165 170 175
Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro
180 185 190 180 185 190
Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu
195 200 205 195 200 205
Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn
210 215 220 210 215 220
Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser
225 230 235 240 225 230 235 240
Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu Thr Val Asp Lys Ser Arg Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu Thr Val Asp Lys Ser Arg
245 250 255 245 250 255
Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu
260 265 270 260 265 270
His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Leu Gly His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Leu Gly
275 280 285 275 280 285
<210> 31<210> 31
<211> 325<211> 325
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 31<400> 31
Cys Pro Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr Cys Gly Cys Pro Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr Cys Gly
1 5 10 15 1 5 10 15
Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys Arg Leu Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys Arg Leu
20 25 30 20 25 30
Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Pro Pro Ser Arg Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Pro Pro Ser Arg
35 40 45 35 40 45
Gly Arg Ser Pro Gln Thr Ala Glu Ala Ala Ala Lys Glu Ala Ala Ala Gly Arg Ser Pro Gln Thr Ala Glu Ala Ala Ala Lys Glu Ala Ala Ala
50 55 60 50 55 60
Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys
65 70 75 80 65 70 75 80
Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Ala Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Ala
85 90 95 85 90 95
Ala Ala Glu Arg Lys Cys Cys Val Glu Cys Pro Pro Cys Pro Ala Pro Ala Ala Glu Arg Lys Cys Cys Val Glu Cys Pro Pro Cys Pro Ala Pro
100 105 110 100 105 110
Pro Val Ala Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Pro Val Ala Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp
115 120 125 115 120 125
Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp
130 135 140 130 135 140
Val Ser Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Ser Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly
145 150 155 160 145 150 155 160
Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn
165 170 175 165 170 175
Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp
180 185 190 180 185 190
Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro
195 200 205 195 200 205
Ser Ser Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Ser Ser Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu
210 215 220 210 215 220
Pro Gln Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Pro Gln Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn
225 230 235 240 225 230 235 240
Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile
245 250 255 245 250 255
Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr
260 265 270 260 265 270
Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg
275 280 285 275 280 285
Leu Thr Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Leu Thr Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys
290 295 300 290 295 300
Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu
305 310 315 320 305 310 315 320
Ser Leu Ser Leu Gly Ser Leu Ser Leu Gly
325 325
<210> 32<210> 32
<211> 18<211> 18
<212> PRT/Белок<212> PRT/Protein
<213> Homo sapiens<213> Homo sapiens
<400> 32<400> 32
Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala
1 5 10 15 1 5 10 15
Tyr Ser Tyr Ser
<210> 33<210> 33
<211> 305<211> 305
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 33<400> 33
Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala
1 5 10 15 1 5 10 15
Tyr Ser Cys Pro Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr Tyr Ser Cys Pro Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr
20 25 30 20 25 30
Cys Gly Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys Cys Gly Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys
35 40 45 35 40 45
Arg Leu Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Pro Pro Arg Leu Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Pro Pro
50 55 60 50 55 60
Ser Arg Gly Arg Ser Pro Gln Thr Glu Gly Arg Met Asp Glu Ser Lys Ser Arg Gly Arg Ser Pro Gln Thr Glu Gly Arg Met Asp Glu Ser Lys
65 70 75 80 65 70 75 80
Tyr Gly Pro Pro Cys Pro Pro Cys Pro Ala Pro Glu Ala Ala Gly Gly Tyr Gly Pro Pro Cys Pro Pro Cys Pro Ala Pro Glu Ala Ala Gly Gly
85 90 95 85 90 95
Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile
100 105 110 100 105 110
Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser Gln Glu Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser Gln Glu
115 120 125 115 120 125
Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu Val His
130 135 140 130 135 140
Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Thr Tyr Arg Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Thr Tyr Arg
145 150 155 160 145 150 155 160
Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys
165 170 175 165 170 175
Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Ser Ile Glu Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Ser Ile Glu
180 185 190 180 185 190
Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr
195 200 205 195 200 205
Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Val Ser Leu
210 215 220 210 215 220
Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp
225 230 235 240 225 230 235 240
Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val
245 250 255 245 250 255
Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu Thr Val Asp Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu Thr Val Asp
260 265 270 260 265 270
Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Val Met His Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Val Met His
275 280 285 275 280 285
Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Leu Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Leu
290 295 300 290 295 300
Gly Gly
305 305
<210> 34<210> 34
<211> 915<211> 915
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 34<400> 34
atgaaatggg tcacctttat ctccctgctg ttcctgttct cctccgccta ctcttgccct 60atgaaatggg tcacctttat ctccctgctg ttcctgttct cctccgccta ctcttgccct 60
gagtggtcta cagcttgggg cccttgctct accacctgtg gactcggcat ggccaccaga 120gagtggtcta cagcttgggg cccttgctct accacctgtg gactcggcat ggccaccaga 120
gtgtctaacc agaacagatt ctgccggctg gaaacccagc ggagactgtg cctgtctaga 180gtgtctaacc agaacagatt ctgccggctg gaaacccagc ggagactgtg cctgtctaga 180
ccctgtcctc ctagcagagg cagatcccct cagaccgagg gcagaatgga cgagtctaag 240ccctgtcctc ctagcagagg cagatcccct cagaccgagg gcagaatgga cgagtctaag 240
tacggccctc cttgtcctcc atgtcctgct ccagaagctg ctggcggccc ttccgtgttt 300tacggccctc cttgtcctcc atgtcctgct ccagaagctg ctggcggccc ttccgtgttt 300
ctgttccctc caaagcctaa ggacaccctg atgatctctc ggacccctga agtgacctgc 360ctgttccctc caaagcctaa ggacaccctg atgatctctc ggacccctga agtgacctgc 360
gtggtggtgg atgtgtccca agaggatccc gaggtgcagt tcaattggta cgtggacggc 420gtggtggtgg atgtgtccca agaggatccc gaggtgcagt tcaattggta cgtggacggc 420
gtggaagtgc acaacgccaa gaccaagcct agagaggaac agttcaactc cacctacaga 480gtggaagtgc acaacgccaa gaccaagcct agagaggaac agttcaactc cacctacaga 480
gtggtgtccg tgctgaccgt gctgcaccag gattggctga acggcaaaga gtacaagtgc 540gtggtgtccg tgctgaccgt gctgcaccag gattggctga acggcaaaga gtacaagtgc 540
aaggtgtcca acaagggcct gccttccagc atcgaaaaga ccatctccaa ggccaagggc 600aaggtgtcca acaagggcct gccttccagc atcgaaaaga ccatctccaa ggccaagggc 600
cagcctaggg aaccccaggt ttacaccctg cctccaagcc aagaggaaat gaccaagaac 660cagcctaggg aaccccaggt ttacaccctg cctccaagcc aagaggaaat gaccaagaac 660
caggtgtccc tgacctgcct ggtcaagggc ttctaccctt ccgatatcgc cgtggaatgg 720caggtgtccc tgacctgcct ggtcaagggc ttctaccctt ccgatatcgc cgtggaatgg 720
gagagcaatg gccagcctga gaacaactac aagaccacac ctcctgtgct ggactccgac 780gagagcaatg gccagcctga gaacaactac aagaccacac ctcctgtgct ggactccgac 780
ggctccttct ttctgtactc ccgcctgacc gtggacaagt ccagatggca agagggcaac 840ggctccttct ttctgtactc ccgcctgacc gtggacaagt ccagatggca agagggcaac 840
gtgttctcct gctccgtgat gcacgaggcc ctgcacaatc actacaccca gaagtccctg 900gtgttctcct gctccgtgat gcacgaggcc ctgcacaatc actacaccca gaagtccctg 900
tctctgtccc tgggc 915tctctgtccc tgggc 915
<210> 35<210> 35
<211> 924<211> 924
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 35<400> 35
gccaccatga aatgggtcac ctttatctcc ctgctgttcc tgttctcctc cgcctactct 60gccaccatga aatgggtcac ctttatctcc ctgctgttcc tgttctcctc cgcctactct 60
tgccctgagt ggtctacagc ttggggccct tgctctacca cctgtggact cggcatggcc 120tgccctgagt ggtctacagc ttggggccct tgctctacca cctgtggact cggcatggcc 120
accagagtgt ctaaccagaa cagattctgc cggctggaaa cccagcggag actgtgcctg 180accagagtgt ctaaccagaa cagattctgc cggctggaaa cccagcggag actgtgcctg 180
tctagaccct gtcctcctag cagaggcaga tcccctcaga ccgagggcag aatggacgag 240tctagaccct gtcctcctag cagaggcaga tcccctcaga ccgagggcag aatggacgag 240
tctaagtacg gccctccttg tcctccatgt cctgctccag aagctgctgg cggcccttcc 300tctaagtacg gccctccttg tcctccatgt cctgctccag aagctgctgg cggcccttcc 300
gtgtttctgt tccctccaaa gcctaaggac accctgatga tctctcggac ccctgaagtg 360gtgtttctgt tccctccaaa gcctaaggac accctgatga tctctcggac ccctgaagtg 360
acctgcgtgg tggtggatgt gtcccaagag gatcccgagg tgcagttcaa ttggtacgtg 420acctgcgtgg tggtggatgt gtcccaagag gatcccgagg tgcagttcaa ttggtacgtg 420
gacggcgtgg aagtgcacaa cgccaagacc aagcctagag aggaacagtt caactccacc 480gacggcgtgg aagtgcacaa cgccaagacc aagcctagag aggaacagtt caactccacc 480
tacagagtgg tgtccgtgct gaccgtgctg caccaggatt ggctgaacgg caaagagtac 540tacagagtgg tgtccgtgct gaccgtgctg caccaggatt ggctgaacgg caaagagtac 540
aagtgcaagg tgtccaacaa gggcctgcct tccagcatcg aaaagaccat ctccaaggcc 600aagtgcaagg tgtccaacaa gggcctgcct tccagcatcg aaaagaccat ctccaaggcc 600
aagggccagc ctagggaacc ccaggtttac accctgcctc caagccaaga ggaaatgacc 660aagggccagc ctagggaacc ccaggtttac accctgcctc caagccaaga ggaaatgacc 660
aagaaccagg tgtccctgac ctgcctggtc aagggcttct acccttccga tatcgccgtg 720aagaaccagg tgtccctgac ctgcctggtc aagggcttct acccttccga tatcgccgtg 720
gaatgggaga gcaatggcca gcctgagaac aactacaaga ccacacctcc tgtgctggac 780gaatggggaga gcaatggcca gcctgagaac aactacaaga cccacctcc tgtgctggac 780
tccgacggct ccttctttct gtactcccgc ctgaccgtgg acaagtccag atggcaagag 840tccgacggct ccttctttct gtactcccgc ctgaccgtgg acaagtccag atggcaagag 840
ggcaacgtgt tctcctgctc cgtgatgcac gaggccctgc acaatcacta cacccagaag 900ggcaacgtgt tctcctgctc cgtgatgcac gaggccctgc acaatcacta cacccagaag 900
tccctgtctc tgtccctggg ctaa 924tccctgtctc tgtccctggg ctaa 924
<210> 36<210> 36
<211> 997<211> 997
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 36<400> 36
ggggacaagt ttgtacaaaa aagcaggcta tggtaccgcc accatgaaat gggtcacctt 60ggggacaagt ttgtacaaaa aagcaggcta tggtaccgcc accatgaaat gggtcacctt 60
tatctccctg ctgttcctgt tctcctccgc ctactcttgc cctgagtggt ctacagcttg 120tatctccctg ctgttcctgt tctcctccgc ctactcttgc cctgagtggt ctacagcttg 120
gggcccttgc tctaccacct gtggactcgg catggccacc agagtgtcta accagaacag 180gggcccttgc tctaccacct gtggactcgg catggccacc agagtgtcta accagaacag 180
attctgccgg ctggaaaccc agcggagact gtgcctgtct agaccctgtc ctcctagcag 240attctgccgg ctggaaaccc agcggagact gtgcctgtct agaccctgtc ctcctagcag 240
aggcagatcc cctcagaccg agggcagaat ggacgagtct aagtacggcc ctccttgtcc 300aggcagatcc cctcagaccg agggcagaat ggacgagtct aagtacggcc ctccttgtcc 300
tccatgtcct gctccagaag ctgctggcgg cccttccgtg tttctgttcc ctccaaagcc 360tccatgtcct gctccagaag ctgctggcgg cccttccgtg tttctgttcc ctccaaagcc 360
taaggacacc ctgatgatct ctcggacccc tgaagtgacc tgcgtggtgg tggatgtgtc 420taaggacacc ctgatgatct ctcggacccc tgaagtgacc tgcgtggtgg tggatgtgtc 420
ccaagaggat cccgaggtgc agttcaattg gtacgtggac ggcgtggaag tgcacaacgc 480ccaagaggat cccgaggtgc agttcaattg gtacgtggac ggcgtggaag tgcacaacgc 480
caagaccaag cctagagagg aacagttcaa ctccacctac agagtggtgt ccgtgctgac 540caagaccaag cctagagagg aacagttcaa ctccacctac agagtggtgt ccgtgctgac 540
cgtgctgcac caggattggc tgaacggcaa agagtacaag tgcaaggtgt ccaacaaggg 600cgtgctgcac caggattggc tgaacggcaa agagtacaag tgcaaggtgt ccaacaaggg 600
cctgccttcc agcatcgaaa agaccatctc caaggccaag ggccagccta gggaacccca 660cctgccttcc agcatcgaaa agaccatctc caaggccaag ggccagccta gggaacccca 660
ggtttacacc ctgcctccaa gccaagagga aatgaccaag aaccaggtgt ccctgacctg 720ggtttacacc ctgcctccaa gccaagagga aatgaccaag aaccaggtgt ccctgacctg 720
cctggtcaag ggcttctacc cttccgatat cgccgtggaa tgggagagca atggccagcc 780cctggtcaag ggcttctacc cttccgatat cgccgtggaa tggggagagca atggccagcc 780
tgagaacaac tacaagacca cacctcctgt gctggactcc gacggctcct tctttctgta 840tgagaacaac tacaagacca cacctcctgt gctggactcc gacggctcct tctttctgta 840
ctcccgcctg accgtggaca agtccagatg gcaagagggc aacgtgttct cctgctccgt 900ctcccgcctg accgtggaca agtccagatg gcaagagggc aacgtgttct cctgctccgt 900
gatgcacgag gccctgcaca atcactacac ccagaagtcc ctgtctctgt ccctgggcta 960gatgcacgag gccctgcaca atcactacac ccagaagtcc ctgtctctgt ccctgggcta 960
atctagaaac ccagctttct tgtacaaagt ggtcccc 997atctagaaac ccagctttct tgtacaaagt ggtcccc 997
<210> 37<210> 37
<211> 44<211> 44
<212> PRT/Белок<212> PRT/Protein
<213> Homo sapiens<213> Homo sapiens
<400> 37<400> 37
Cys Pro Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr Cys Gly Cys Pro Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr Cys Gly
1 5 10 15 1 5 10 15
Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys Arg Leu Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys Arg Leu
20 25 30 20 25 30
Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys
35 40 35 40
<210> 38<210> 38
<211> 44<211> 44
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Модифицированная последовательность CCN5<223> Modified CCN5 sequence
<400> 38<400> 38
Cys Ala Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr Cys Gly Cys Ala Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr Cys Gly
1 5 10 15 1 5 10 15
Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys Arg Leu Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys Arg Leu
20 25 30 20 25 30
Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys
35 40 35 40
<210> 39<210> 39
<211> 44<211> 44
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Линкер<223> Linker
<400> 39<400> 39
Ala Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Ala Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys
1 5 10 15 1 5 10 15
Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu
20 25 30 20 25 30
Ala Ala Ala Lys Glu Ala Ala Ala Lys Ala Ala Ala Ala Ala Ala Lys Glu Ala Ala Ala Lys Ala Ala Ala
35 40 35 40
<210> 40<210> 40
<211> 325<211> 325
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 40<400> 40
Glu Ser Lys Tyr Gly Pro Pro Cys Pro Pro Cys Pro Ala Pro Glu Ala Glu Ser Lys Tyr Gly Pro Pro Cys Pro Pro Cys Pro Ala Pro Glu Ala
1 5 10 15 1 5 10 15
Ala Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Ala Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr
20 25 30 20 25 30
Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val
35 40 45 35 40 45
Ser Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Ser Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val
50 55 60 50 55 60
Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser
65 70 75 80 65 70 75 80
Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu
85 90 95 85 90 95
Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser
100 105 110 100 105 110
Ser Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Ser Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro
115 120 125 115 120 125
Gln Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Gln Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln
130 135 140 130 135 140
Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala
145 150 155 160 145 150 155 160
Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr
165 170 175 165 170 175
Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu
180 185 190 180 185 190
Thr Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Thr Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser
195 200 205 195 200 205
Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser
210 215 220 210 215 220
Leu Ser Leu Gly Ala Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Leu Ser Leu Gly Ala Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu
225 230 235 240 225 230 235 240
Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala
245 250 255 245 250 255
Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Ala Ala Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Ala Ala Ala
260 265 270 260 265 270
Cys Pro Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr Cys Gly Cys Pro Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr Cys Gly
275 280 285 275 280 285
Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys Arg Leu Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys Arg Leu
290 295 300 290 295 300
Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Pro Pro Ser Arg Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Pro Pro Ser Arg
305 310 315 320 305 310 315 320
Gly Arg Ser Pro Gln Gly Arg Ser Pro Gln
325 325
<210> 41<210> 41
<211> 325<211> 325
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 41<400> 41
Glu Ser Lys Tyr Gly Pro Pro Cys Pro Pro Cys Pro Ala Pro Glu Ala Glu Ser Lys Tyr Gly Pro Pro Cys Pro Pro Cys Pro Ala Pro Glu Ala
1 5 10 15 1 5 10 15
Ala Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Ala Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr
20 25 30 20 25 30
Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val
35 40 45 35 40 45
Ser Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Ser Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val
50 55 60 50 55 60
Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser
65 70 75 80 65 70 75 80
Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu
85 90 95 85 90 95
Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser
100 105 110 100 105 110
Ser Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Ser Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro
115 120 125 115 120 125
Gln Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Gln Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln
130 135 140 130 135 140
Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala
145 150 155 160 145 150 155 160
Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr
165 170 175 165 170 175
Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu
180 185 190 180 185 190
Thr Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Thr Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser
195 200 205 195 200 205
Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser
210 215 220 210 215 220
Leu Ser Leu Gly Ala Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Leu Ser Leu Gly Ala Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu
225 230 235 240 225 230 235 240
Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala
245 250 255 245 250 255
Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Ala Ala Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Ala Ala Ala
260 265 270 260 265 270
Cys Ala Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr Cys Gly Cys Ala Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr Cys Gly
275 280 285 275 280 285
Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys Arg Leu Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys Arg Leu
290 295 300 290 295 300
Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Pro Pro Ser Arg Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Pro Pro Ser Arg
305 310 315 320 305 310 315 320
Gly Arg Ser Pro Gln Gly Arg Ser Pro Gln
325 325
<210> 42<210> 42
<211> 44<211> 44
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Модифицированная последовательность CCN1<223> Modified CCN1 sequence
<400> 42<400> 42
Cys Ala Val Gln Thr Thr Ser Trp Ser Gln Cys Ser Lys Thr Cys Gly Cys Ala Val Gln Thr Thr Ser Trp Ser Gln Cys Ser Lys Thr Cys Gly
1 5 10 15 1 5 10 15
Thr Gly Ile Ser Thr Arg Val Thr Asn Asp Asn Pro Glu Cys Arg Leu Thr Gly Ile Ser Thr Arg Val Thr Asn Asp Asn Pro Glu Cys Arg Leu
20 25 30 20 25 30
Val Lys Glu Thr Arg Ile Cys Glu Val Arg Pro Cys Val Lys Glu Thr Arg Ile Cys Glu Val Arg Pro Cys
35 40 35 40
<210> 43<210> 43
<211> 44<211> 44
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Модифицированная последовательность CCN2<223> Modified CCN2 sequence
<400> 43<400> 43
Cys Ala Val Gln Thr Thr Glu Trp Ser Ala Cys Ser Lys Thr Cys Gly Cys Ala Val Gln Thr Thr Glu Trp Ser Ala Cys Ser Lys Thr Cys Gly
1 5 10 15 1 5 10 15
Met Gly Ile Ser Thr Arg Val Thr Asn Asp Asn Ala Ser Cys Arg Leu Met Gly Ile Ser Thr Arg Val Thr Asn Asp Asn Ala Ser Cys Arg Leu
20 25 30 20 25 30
Glu Lys Gln Ser Arg Leu Cys Met Val Arg Pro Cys Glu Lys Gln Ser Arg Leu Cys Met Val Arg Pro Cys
35 40 35 40
<210> 44<210> 44
<211> 44<211> 44
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Модифицированная последовательность CCN3<223> Modified CCN3 sequence
<400> 44<400> 44
Cys Ala Glu Gln Thr Thr Glu Trp Thr Ala Cys Ser Lys Ser Cys Gly Cys Ala Glu Gln Thr Thr Glu Trp Thr Ala Cys Ser Lys Ser Cys Gly
1 5 10 15 1 5 10 15
Met Gly Phe Ser Thr Arg Val Thr Asn Arg Asn Arg Gln Cys Glu Met Met Gly Phe Ser Thr Arg Val Thr Asn Arg Asn Arg Gln Cys Glu Met
20 25 30 20 25 30
Leu Lys Gln Thr Arg Leu Cys Met Val Arg Pro Cys Leu Lys Gln Thr Arg Leu Cys Met Val Arg Pro Cys
35 40 35 40
<210> 45<210> 45
<211> 44<211> 44
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Модифицированная последовательность CCN4<223> Modified CCN4 sequence
<400> 45<400> 45
Cys Ala Ala Tyr Thr Ser Pro Trp Ser Pro Cys Ser Thr Ser Cys Gly Cys Ala Ala Tyr Thr Ser Pro Trp Ser Pro Cys Ser Thr Ser Cys Gly
1 5 10 15 1 5 10 15
Leu Gly Val Ser Thr Arg Ile Ser Asn Val Asn Ala Gln Cys Trp Pro Leu Gly Val Ser Thr Arg Ile Ser Asn Val Asn Ala Gln Cys Trp Pro
20 25 30 20 25 30
Glu Gln Glu Ser Arg Leu Cys Asn Leu Arg Pro Cys Glu Gln Glu Ser Arg Leu Cys Asn Leu Arg Pro Cys
35 40 35 40
<210> 46<210> 46
<211> 44<211> 44
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Модифицированная последовательность CCN6<223> Modified CCN6 sequence
<400> 46<400> 46
Cys Ala Val Gln Ala Thr Lys Trp Thr Pro Cys Ser Arg Thr Cys Gly Cys Ala Val Gln Ala Thr Lys Trp Thr Pro Cys Ser Arg Thr Cys Gly
1 5 10 15 1 5 10 15
Met Gly Ile Ser Asn Arg Val Thr Asn Glu Asn Ser Asn Cys Glu Met Met Gly Ile Ser Asn Arg Val Thr Asn Glu Asn Ser Asn Cys Glu Met
20 25 30 20 25 30
Arg Lys Glu Lys Arg Leu Cys Tyr Ile Gln Pro Cys Arg Lys Glu Lys Arg Leu Cys Tyr Ile Gln Pro Cys
35 40 35 40
<210> 47<210> 47
<211> 52<211> 52
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Модифицированная последовательность CCN1<223> Modified CCN1 sequence
<400> 47<400> 47
Cys Ala Val Gln Thr Thr Ser Trp Ser Gln Cys Ser Lys Thr Cys Gly Cys Ala Val Gln Thr Thr Ser Trp Ser Gln Cys Ser Lys Thr Cys Gly
1 5 10 15 1 5 10 15
Thr Gly Ile Ser Thr Arg Val Thr Asn Asp Asn Pro Glu Cys Arg Leu Thr Gly Ile Ser Thr Arg Val Thr Asn Asp Asn Pro Glu Cys Arg Leu
20 25 30 20 25 30
Val Lys Glu Thr Arg Ile Cys Glu Val Arg Pro Cys Gly Gln Pro Val Val Lys Glu Thr Arg Ile Cys Glu Val Arg Pro Cys Gly Gln Pro Val
35 40 45 35 40 45
Tyr Ser Ser Leu Tyr Ser Ser Leu
50 50
<210> 48<210> 48
<211> 52<211> 52
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Модифицированная последовательность CCN2<223> Modified CCN2 sequence
<400> 48<400> 48
Cys Ala Val Gln Thr Thr Glu Trp Ser Ala Cys Ser Lys Thr Cys Gly Cys Ala Val Gln Thr Thr Glu Trp Ser Ala Cys Ser Lys Thr Cys Gly
1 5 10 15 1 5 10 15
Met Gly Ile Ser Thr Arg Val Thr Asn Asp Asn Ala Ser Cys Arg Leu Met Gly Ile Ser Thr Arg Val Thr Asn Asp Asn Ala Ser Cys Arg Leu
20 25 30 20 25 30
Glu Lys Gln Ser Arg Leu Cys Met Val Arg Pro Cys Glu Ala Asp Leu Glu Lys Gln Ser Arg Leu Cys Met Val Arg Pro Cys Glu Ala Asp Leu
35 40 45 35 40 45
Glu Glu Asn Ile Glu Glu Asn Ile
50 50
<210> 49<210> 49
<211> 53<211> 53
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Модифицированная последовательность CCN3<223> Modified CCN3 sequence
<400> 49<400> 49
Cys Ala Glu Gln Thr Thr Glu Trp Thr Ala Cys Ser Lys Ser Cys Gly Cys Ala Glu Gln Thr Thr Glu Trp Thr Ala Cys Ser Lys Ser Cys Gly
1 5 10 15 1 5 10 15
Met Gly Phe Ser Thr Arg Val Thr Asn Arg Asn Arg Gln Cys Glu Met Met Gly Phe Ser Thr Arg Val Thr Asn Arg Asn Arg Gln Cys Glu Met
20 25 30 20 25 30
Leu Lys Gln Thr Arg Leu Cys Met Val Arg Pro Cys Glu Gln Glu Pro Leu Lys Gln Thr Arg Leu Cys Met Val Arg Pro Cys Glu Gln Glu Pro
35 40 45 35 40 45
Glu Gln Pro Thr Asp Glu Gln Pro Thr Asp
50 50
<210> 50<210> 50
<211> 52<211> 52
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Модифицированная последовательность CCN4<223> Modified CCN4 sequence
<400> 50<400> 50
Cys Ala Ala Tyr Thr Ser Pro Trp Ser Pro Cys Ser Thr Ser Cys Gly Cys Ala Ala Tyr Thr Ser Pro Trp Ser Pro Cys Ser Thr Ser Cys Gly
1 5 10 15 1 5 10 15
Leu Gly Val Ser Thr Arg Ile Ser Asn Val Asn Ala Gln Cys Trp Pro Leu Gly Val Ser Thr Arg Ile Ser Asn Val Asn Ala Gln Cys Trp Pro
20 25 30 20 25 30
Glu Gln Glu Ser Arg Leu Cys Asn Leu Arg Pro Cys Asp Val Asp Ile Glu Gln Glu Ser Arg Leu Cys Asn Leu Arg Pro Cys Asp Val Asp Ile
35 40 45 35 40 45
His Thr Leu Ile His Thr Leu Ile
50 50
<210> 51<210> 51
<211> 55<211> 55
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Модифицированная последовательность CCN6<223> Modified CCN6 sequence
<400> 51<400> 51
Cys Ala Val Gln Ala Thr Lys Trp Thr Pro Cys Ser Arg Thr Cys Gly Cys Ala Val Gln Ala Thr Lys Trp Thr Pro Cys Ser Arg Thr Cys Gly
1 5 10 15 1 5 10 15
Met Gly Ile Ser Asn Arg Val Thr Asn Glu Asn Ser Asn Cys Glu Met Met Gly Ile Ser Asn Arg Val Thr Asn Glu Asn Ser Asn Cys Glu Met
20 25 30 20 25 30
Arg Lys Glu Lys Arg Leu Cys Tyr Ile Gln Pro Cys Asp Ser Asn Ile Arg Lys Glu Lys Arg Leu Cys Tyr Ile Gln Pro Cys Asp Ser Asn Ile
35 40 45 35 40 45
Leu Lys Thr Ile Lys Ile Pro Leu Lys Thr Ile Lys Ile Pro
50 55 50 55
<210> 52<210> 52
<211> 585<211> 585
<212> PRT/Белок<212> PRT/Protein
<213> Homo sapiens<213> Homo sapiens
<400> 52<400> 52
Asp Ala His Lys Ser Glu Val Ala His Arg Phe Lys Asp Leu Gly Glu Asp Ala His Lys Ser Glu Val Ala His Arg Phe Lys Asp Leu Gly Glu
1 5 10 15 1 5 10 15
Glu Asn Phe Lys Ala Leu Val Leu Ile Ala Phe Ala Gln Tyr Leu Gln Glu Asn Phe Lys Ala Leu Val Leu Ile Ala Phe Ala Gln Tyr Leu Gln
20 25 30 20 25 30
Gln Cys Pro Phe Glu Asp His Val Lys Leu Val Asn Glu Val Thr Glu Gln Cys Pro Phe Glu Asp His Val Lys Leu Val Asn Glu Val Thr Glu
35 40 45 35 40 45
Phe Ala Lys Thr Cys Val Ala Asp Glu Ser Ala Glu Asn Cys Asp Lys Phe Ala Lys Thr Cys Val Ala Asp Glu Ser Ala Glu Asn Cys Asp Lys
50 55 60 50 55 60
Ser Leu His Thr Leu Phe Gly Asp Lys Leu Cys Thr Val Ala Thr Leu Ser Leu His Thr Leu Phe Gly Asp Lys Leu Cys Thr Val Ala Thr Leu
65 70 75 80 65 70 75 80
Arg Glu Thr Tyr Gly Glu Met Ala Asp Cys Cys Ala Lys Gln Glu Pro Arg Glu Thr Tyr Gly Glu Met Ala Asp Cys Cys Ala Lys Gln Glu Pro
85 90 95 85 90 95
Glu Arg Asn Glu Cys Phe Leu Gln His Lys Asp Asp Asn Pro Asn Leu Glu Arg Asn Glu Cys Phe Leu Gln His Lys Asp Asp Asn Pro Asn Leu
100 105 110 100 105 110
Pro Arg Leu Val Arg Pro Glu Val Asp Val Met Cys Thr Ala Phe His Pro Arg Leu Val Arg Pro Glu Val Asp Val Met Cys Thr Ala Phe His
115 120 125 115 120 125
Asp Asn Glu Glu Thr Phe Leu Lys Lys Tyr Leu Tyr Glu Ile Ala Arg Asp Asn Glu Glu Thr Phe Leu Lys Lys Tyr Leu Tyr Glu Ile Ala Arg
130 135 140 130 135 140
Arg His Pro Tyr Phe Tyr Ala Pro Glu Leu Leu Phe Phe Ala Lys Arg Arg His Pro Tyr Phe Tyr Ala Pro Glu Leu Leu Phe Phe Ala Lys Arg
145 150 155 160 145 150 155 160
Tyr Lys Ala Ala Phe Thr Glu Cys Cys Gln Ala Ala Asp Lys Ala Ala Tyr Lys Ala Ala Phe Thr Glu Cys Cys Gln Ala Ala Asp Lys Ala Ala
165 170 175 165 170 175
Cys Leu Leu Pro Lys Leu Asp Glu Leu Arg Asp Glu Gly Lys Ala Ser Cys Leu Leu Pro Lys Leu Asp Glu Leu Arg Asp Glu Gly Lys Ala Ser
180 185 190 180 185 190
Ser Ala Lys Gln Arg Leu Lys Cys Ala Ser Leu Gln Lys Phe Gly Glu Ser Ala Lys Gln Arg Leu Lys Cys Ala Ser Leu Gln Lys Phe Gly Glu
195 200 205 195 200 205
Arg Ala Phe Lys Ala Trp Ala Val Ala Arg Leu Ser Gln Arg Phe Pro Arg Ala Phe Lys Ala Trp Ala Val Ala Arg Leu Ser Gln Arg Phe Pro
210 215 220 210 215 220
Lys Ala Glu Phe Ala Glu Val Ser Lys Leu Val Thr Asp Leu Thr Lys Lys Ala Glu Phe Ala Glu Val Ser Lys Leu Val Thr Asp Leu Thr Lys
225 230 235 240 225 230 235 240
Val His Thr Glu Cys Cys His Gly Asp Leu Leu Glu Cys Ala Asp Asp Val His Thr Glu Cys Cys His Gly Asp Leu Leu Glu Cys Ala Asp Asp
245 250 255 245 250 255
Arg Ala Asp Leu Ala Lys Tyr Ile Cys Glu Asn Gln Asp Ser Ile Ser Arg Ala Asp Leu Ala Lys Tyr Ile Cys Glu Asn Gln Asp Ser Ile Ser
260 265 270 260 265 270
Ser Lys Leu Lys Glu Cys Cys Glu Lys Pro Leu Leu Glu Lys Ser His Ser Lys Leu Lys Glu Cys Cys Glu Lys Pro Leu Leu Glu Lys Ser His
275 280 285 275 280 285
Cys Ile Ala Glu Val Glu Asn Asp Glu Met Pro Ala Asp Leu Pro Ser Cys Ile Ala Glu Val Glu Asn Asp Glu Met Pro Ala Asp Leu Pro Ser
290 295 300 290 295 300
Leu Ala Ala Asp Phe Val Glu Ser Lys Asp Val Cys Lys Asn Tyr Ala Leu Ala Ala Asp Phe Val Glu Ser Lys Asp Val Cys Lys Asn Tyr Ala
305 310 315 320 305 310 315 320
Glu Ala Lys Asp Val Phe Leu Gly Met Phe Leu Tyr Glu Tyr Ala Arg Glu Ala Lys Asp Val Phe Leu Gly Met Phe Leu Tyr Glu Tyr Ala Arg
325 330 335 325 330 335
Arg His Pro Asp Tyr Ser Val Val Leu Leu Leu Arg Leu Ala Lys Thr Arg His Pro Asp Tyr Ser Val Val Leu Leu Leu Arg Leu Ala Lys Thr
340 345 350 340 345 350
Tyr Glu Thr Thr Leu Glu Lys Cys Cys Ala Ala Ala Asp Pro His Glu Tyr Glu Thr Thr Leu Glu Lys Cys Cys Ala Ala Ala Asp Pro His Glu
355 360 365 355 360 365
Cys Tyr Ala Lys Val Phe Asp Glu Phe Lys Pro Leu Val Glu Glu Pro Cys Tyr Ala Lys Val Phe Asp Glu Phe Lys Pro Leu Val Glu Glu Pro
370 375 380 370 375 380
Gln Asn Leu Ile Lys Gln Asn Cys Glu Leu Phe Glu Gln Leu Gly Glu Gln Asn Leu Ile Lys Gln Asn Cys Glu Leu Phe Glu Gln Leu Gly Glu
385 390 395 400 385 390 395 400
Tyr Lys Phe Gln Asn Ala Leu Leu Val Arg Tyr Thr Lys Lys Val Pro Tyr Lys Phe Gln Asn Ala Leu Leu Val Arg Tyr Thr Lys Lys Val Pro
405 410 415 405 410 415
Gln Val Ser Thr Pro Thr Leu Val Glu Val Ser Arg Asn Leu Gly Lys Gln Val Ser Thr Pro Thr Leu Val Glu Val Ser Arg Asn Leu Gly Lys
420 425 430 420 425 430
Val Gly Ser Lys Cys Cys Lys His Pro Glu Ala Lys Arg Met Pro Cys Val Gly Ser Lys Cys Cys Lys His Pro Glu Ala Lys Arg Met Pro Cys
435 440 445 435 440 445
Ala Glu Asp Tyr Leu Ser Val Val Leu Asn Gln Leu Cys Val Leu His Ala Glu Asp Tyr Leu Ser Val Val Leu Asn Gln Leu Cys Val Leu His
450 455 460 450 455 460
Glu Lys Thr Pro Val Ser Asp Arg Val Thr Lys Cys Cys Thr Glu Ser Glu Lys Thr Pro Val Ser Asp Arg Val Thr Lys Cys Cys Thr Glu Ser
465 470 475 480 465 470 475 480
Leu Val Asn Arg Arg Pro Cys Phe Ser Ala Leu Glu Val Asp Glu Thr Leu Val Asn Arg Arg Pro Cys Phe Ser Ala Leu Glu Val Asp Glu Thr
485 490 495 485 490 495
Tyr Val Pro Lys Glu Phe Asn Ala Glu Thr Phe Thr Phe His Ala Asp Tyr Val Pro Lys Glu Phe Asn Ala Glu Thr Phe Thr Phe His Ala Asp
500 505 510 500 505 510
Ile Cys Thr Leu Ser Glu Lys Glu Arg Gln Ile Lys Lys Gln Thr Ala Ile Cys Thr Leu Ser Glu Lys Glu Arg Gln Ile Lys Lys Gln Thr Ala
515 520 525 515 520 525
Leu Val Glu Leu Val Lys His Lys Pro Lys Ala Thr Lys Glu Gln Leu Leu Val Glu Leu Val Lys His Lys Pro Lys Ala Thr Lys Glu Gln Leu
530 535 540 530 535 540
Lys Ala Val Met Asp Asp Phe Ala Ala Phe Val Glu Lys Cys Cys Lys Lys Ala Val Met Asp Asp Phe Ala Ala Phe Val Glu Lys Cys Cys Lys
545 550 555 560 545 550 555 560
Ala Asp Asp Lys Glu Thr Cys Phe Ala Glu Glu Gly Lys Lys Leu Val Ala Asp Asp Lys Glu Thr Cys Phe Ala Glu Glu Gly Lys Lys Leu Val
565 570 575 565 570 575
Ala Ala Ser Gln Ala Ala Leu Gly Leu Ala Ala Ser Gln Ala Ala Leu Gly Leu
580 585 580 585
<210> 53<210> 53
<211> 679<211> 679
<212> PRT/Белок<212> PRT/Protein
<213> Homo sapiens<213> Homo sapiens
<400> 53<400> 53
Val Pro Asp Lys Thr Val Arg Trp Cys Ala Val Ser Glu His Glu Ala Val Pro Asp Lys Thr Val Arg Trp Cys Ala Val Ser Glu His Glu Ala
1 5 10 15 1 5 10 15
Thr Lys Cys Gln Ser Phe Arg Asp His Met Lys Ser Val Ile Pro Ser Thr Lys Cys Gln Ser Phe Arg Asp His Met Lys Ser Val Ile Pro Ser
20 25 30 20 25 30
Asp Gly Pro Ser Val Ala Cys Val Lys Lys Ala Ser Tyr Leu Asp Cys Asp Gly Pro Ser Val Ala Cys Val Lys Lys Ala Ser Tyr Leu Asp Cys
35 40 45 35 40 45
Ile Arg Ala Ile Ala Ala Asn Glu Ala Asp Ala Val Thr Leu Asp Ala Ile Arg Ala Ile Ala Ala Asn Glu Ala Asp Ala Val Thr Leu Asp Ala
50 55 60 50 55 60
Gly Leu Val Tyr Asp Ala Tyr Leu Ala Pro Asn Asn Leu Lys Pro Val Gly Leu Val Tyr Asp Ala Tyr Leu Ala Pro Asn Asn Leu Lys Pro Val
65 70 75 80 65 70 75 80
Val Ala Glu Phe Tyr Gly Ser Lys Glu Asp Pro Gln Thr Phe Tyr Tyr Val Ala Glu Phe Tyr Gly Ser Lys Glu Asp Pro Gln Thr Phe Tyr Tyr
85 90 95 85 90 95
Ala Val Ala Val Val Lys Lys Asp Ser Gly Phe Gln Met Asn Gln Leu Ala Val Ala Val Val Lys Lys Asp Ser Gly Phe Gln Met Asn Gln Leu
100 105 110 100 105 110
Arg Gly Lys Lys Ser Cys His Thr Gly Leu Gly Arg Ser Ala Gly Trp Arg Gly Lys Lys Ser Cys His Thr Gly Leu Gly Arg Ser Ala Gly Trp
115 120 125 115 120 125
Asn Ile Pro Ile Gly Leu Leu Tyr Cys Asp Leu Pro Glu Pro Arg Lys Asn Ile Pro Ile Gly Leu Leu Tyr Cys Asp Leu Pro Glu Pro Arg Lys
130 135 140 130 135 140
Pro Leu Glu Lys Ala Val Ala Asn Phe Phe Ser Gly Ser Cys Ala Pro Pro Leu Glu Lys Ala Val Ala Asn Phe Phe Ser Gly Ser Cys Ala Pro
145 150 155 160 145 150 155 160
Cys Ala Asp Gly Thr Asp Phe Pro Gln Leu Cys Gln Leu Cys Pro Gly Cys Ala Asp Gly Thr Asp Phe Pro Gln Leu Cys Gln Leu Cys Pro Gly
165 170 175 165 170 175
Cys Gly Cys Ser Thr Leu Asn Gln Tyr Phe Gly Tyr Ser Gly Ala Phe Cys Gly Cys Ser Thr Leu Asn Gln Tyr Phe Gly Tyr Ser Gly Ala Phe
180 185 190 180 185 190
Lys Cys Leu Lys Asp Gly Ala Gly Asp Val Ala Phe Val Lys His Ser Lys Cys Leu Lys Asp Gly Ala Gly Asp Val Ala Phe Val Lys His Ser
195 200 205 195 200 205
Thr Ile Phe Glu Asn Leu Ala Asn Lys Ala Asp Arg Asp Gln Tyr Glu Thr Ile Phe Glu Asn Leu Ala Asn Lys Ala Asp Arg Asp Gln Tyr Glu
210 215 220 210 215 220
Leu Leu Cys Leu Asp Asn Thr Arg Lys Pro Val Asp Glu Tyr Lys Asp Leu Leu Cys Leu Asp Asn Thr Arg Lys Pro Val Asp Glu Tyr Lys Asp
225 230 235 240 225 230 235 240
Cys His Leu Ala Gln Val Pro Ser His Thr Val Val Ala Arg Ser Met Cys His Leu Ala Gln Val Pro Ser His Thr Val Val Ala Arg Ser Met
245 250 255 245 250 255
Gly Gly Lys Glu Asp Leu Ile Trp Glu Leu Leu Asn Gln Ala Gln Glu Gly Gly Lys Glu Asp Leu Ile Trp Glu Leu Leu Asn Gln Ala Gln Glu
260 265 270 260 265 270
His Phe Gly Lys Asp Lys Ser Lys Glu Phe Gln Leu Phe Ser Ser Pro His Phe Gly Lys Asp Lys Ser Lys Glu Phe Gln Leu Phe Ser Ser Pro
275 280 285 275 280 285
His Gly Lys Asp Leu Leu Phe Lys Asp Ser Ala His Gly Phe Leu Lys His Gly Lys Asp Leu Leu Phe Lys Asp Ser Ala His Gly Phe Leu Lys
290 295 300 290 295 300
Val Pro Pro Arg Met Asp Ala Lys Met Tyr Leu Gly Tyr Glu Tyr Val Val Pro Pro Arg Met Asp Ala Lys Met Tyr Leu Gly Tyr Glu Tyr Val
305 310 315 320 305 310 315 320
Thr Ala Ile Arg Asn Leu Arg Glu Gly Thr Cys Pro Glu Ala Pro Thr Thr Ala Ile Arg Asn Leu Arg Glu Gly Thr Cys Pro Glu Ala Pro Thr
325 330 335 325 330 335
Asp Glu Cys Lys Pro Val Lys Trp Cys Ala Leu Ser His His Glu Arg Asp Glu Cys Lys Pro Val Lys Trp Cys Ala Leu Ser His His Glu Arg
340 345 350 340 345 350
Leu Lys Cys Asp Glu Trp Ser Val Asn Ser Val Gly Lys Ile Glu Cys Leu Lys Cys Asp Glu Trp Ser Val Asn Ser Val Gly Lys Ile Glu Cys
355 360 365 355 360 365
Val Ser Ala Glu Thr Thr Glu Asp Cys Ile Ala Lys Ile Met Asn Gly Val Ser Ala Glu Thr Thr Glu Asp Cys Ile Ala Lys Ile Met Asn Gly
370 375 380 370 375 380
Glu Ala Asp Ala Met Ser Leu Asp Gly Gly Phe Val Tyr Ile Ala Gly Glu Ala Asp Ala Met Ser Leu Asp Gly Gly Phe Val Tyr Ile Ala Gly
385 390 395 400 385 390 395 400
Lys Cys Gly Leu Val Pro Val Leu Ala Glu Asn Tyr Asn Lys Ser Asp Lys Cys Gly Leu Val Pro Val Leu Ala Glu Asn Tyr Asn Lys Ser Asp
405 410 415 405 410 415
Asn Cys Glu Asp Thr Pro Glu Ala Gly Tyr Phe Ala Ile Ala Val Val Asn Cys Glu Asp Thr Pro Glu Ala Gly Tyr Phe Ala Ile Ala Val Val
420 425 430 420 425 430
Lys Lys Ser Ala Ser Asp Leu Thr Trp Asp Asn Leu Lys Gly Lys Lys Lys Lys Ser Ala Ser Asp Leu Thr Trp Asp Asn Leu Lys Gly Lys Lys
435 440 445 435 440 445
Ser Cys His Thr Ala Val Gly Arg Thr Ala Gly Trp Asn Ile Pro Met Ser Cys His Thr Ala Val Gly Arg Thr Ala Gly Trp Asn Ile Pro Met
450 455 460 450 455 460
Gly Leu Leu Tyr Asn Lys Ile Asn His Cys Arg Phe Asp Glu Phe Phe Gly Leu Leu Tyr Asn Lys Ile Asn His Cys Arg Phe Asp Glu Phe Phe
465 470 475 480 465 470 475 480
Ser Glu Gly Cys Ala Pro Gly Ser Lys Lys Asp Ser Ser Leu Cys Lys Ser Glu Gly Cys Ala Pro Gly Ser Lys Lys Asp Ser Ser Leu Cys Lys
485 490 495 485 490 495
Leu Cys Met Gly Ser Gly Leu Asn Leu Cys Glu Pro Asn Asn Lys Glu Leu Cys Met Gly Ser Gly Leu Asn Leu Cys Glu Pro Asn Asn Lys Glu
500 505 510 500 505 510
Gly Tyr Tyr Gly Tyr Thr Gly Ala Phe Arg Cys Leu Val Glu Lys Gly Gly Tyr Tyr Gly Tyr Thr Gly Ala Phe Arg Cys Leu Val Glu Lys Gly
515 520 525 515 520 525
Asp Val Ala Phe Val Lys His Gln Thr Val Pro Gln Asn Thr Gly Gly Asp Val Ala Phe Val Lys His Gln Thr Val Pro Gln Asn Thr Gly Gly
530 535 540 530 535 540
Lys Asn Pro Asp Pro Trp Ala Lys Asn Leu Asn Glu Lys Asp Tyr Glu Lys Asn Pro Asp Pro Trp Ala Lys Asn Leu Asn Glu Lys Asp Tyr Glu
545 550 555 560 545 550 555 560
Leu Leu Cys Leu Asp Gly Thr Arg Lys Pro Val Glu Glu Tyr Ala Asn Leu Leu Cys Leu Asp Gly Thr Arg Lys Pro Val Glu Glu Tyr Ala Asn
565 570 575 565 570 575
Cys His Leu Ala Arg Ala Pro Asn His Ala Val Val Thr Arg Lys Asp Cys His Leu Ala Arg Ala Pro Asn His Ala Val Val Thr Arg Lys Asp
580 585 590 580 585 590
Lys Glu Ala Cys Val His Lys Ile Leu Arg Gln Gln Gln His Leu Phe Lys Glu Ala Cys Val His Lys Ile Leu Arg Gln Gln Gln His Leu Phe
595 600 605 595 600 605
Gly Ser Asn Val Thr Asp Cys Ser Gly Asn Phe Cys Leu Phe Arg Ser Gly Ser Asn Val Thr Asp Cys Ser Gly Asn Phe Cys Leu Phe Arg Ser
610 615 620 610 615 620
Glu Thr Lys Asp Leu Leu Phe Arg Asp Asp Thr Val Cys Leu Ala Lys Glu Thr Lys Asp Leu Leu Phe Arg Asp Asp Thr Val Cys Leu Ala Lys
625 630 635 640 625 630 635 640
Leu His Asp Arg Asn Thr Tyr Glu Lys Tyr Leu Gly Glu Glu Tyr Val Leu His Asp Arg Asn Thr Tyr Glu Lys Tyr Leu Gly Glu Glu Tyr Val
645 650 655 645 650 655
Lys Ala Val Gly Asn Leu Arg Lys Cys Ser Thr Ser Ser Leu Leu Glu Lys Ala Val Gly Asn Leu Arg Lys Cys Ser Thr Ser Ser Leu Leu Glu
660 665 670 660 665 670
Ala Cys Thr Phe Arg Arg Pro Ala Cys Thr Phe Arg Arg Pro
675 675
<210> 54<210> 54
<211> 232<211> 232
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Модифицированный Fc-фрагмент<223> Modified Fc fragment
<400> 54<400> 54
Glu Pro Lys Ser Gln Asp Lys Thr His Thr Gln Pro Pro Gln Pro Ala Glu Pro Lys Ser Gln Asp Lys Thr His Thr Gln Pro Pro Gln Pro Ala
1 5 10 15 1 5 10 15
Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro
20 25 30 20 25 30
Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val
35 40 45 35 40 45
Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val
50 55 60 50 55 60
Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Cys Glu Glu Gln Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Cys Glu Glu Gln
65 70 75 80 65 70 75 80
Tyr Gly Ser Thr Tyr Arg Cys Val Ser Val Leu Thr Val Leu His Gln Tyr Gly Ser Thr Tyr Arg Cys Val Ser Val Leu Thr Val Leu His Gln
85 90 95 85 90 95
Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala
100 105 110 100 105 110
Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro
115 120 125 115 120 125
Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr
130 135 140 130 135 140
Lys Asn Gln Val Ser Leu Arg Cys His Val Lys Gly Phe Tyr Pro Ser Lys Asn Gln Val Ser Leu Arg Cys His Val Lys Gly Phe Tyr Pro Ser
145 150 155 160 145 150 155 160
Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr
165 170 175 165 170 175
Lys Thr Thr Lys Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Lys Thr Thr Lys Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr
180 185 190 180 185 190
Ser Thr Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Thr Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe
195 200 205 195 200 205
Ser Cys Ser Val Leu His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Cys Ser Val Leu His Glu Ala Leu His Asn His Tyr Thr Gln Lys
210 215 220 210 215 220
Ser Leu Ser Leu Ser Pro Gly Lys Ser Leu Ser Leu Ser Pro Gly Lys
225 230 225 230
<210> 55<210> 55
<211> 227<211> 227
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Модифицированный Fc-фрагмент<223> Modified Fc fragment
<400> 55<400> 55
Glu Arg Lys Gln Gln Val Glu Gln Pro Pro Gln Pro Ala Pro Pro Val Glu Arg Lys Gln Gln Val Glu Gln Pro Pro Gln Pro Ala Pro Pro Val
1 5 10 15 1 5 10 15
Ala Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Ala Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu
20 25 30 20 25 30
Tyr Ile Thr Arg Glu Pro Glu Val Thr Cys Val Val Val Asp Val Ser Tyr Ile Thr Arg Glu Pro Glu Val Thr Cys Val Val Val Asp Val Ser
35 40 45 35 40 45
Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu
50 55 60 50 55 60
Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Thr Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Thr
65 70 75 80 65 70 75 80
Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn
85 90 95 85 90 95
Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Ser Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Ser
100 105 110 100 105 110
Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln
115 120 125 115 120 125
Val Tyr Thr Phe Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Val Val Tyr Thr Phe Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Val
130 135 140 130 135 140
Ser Leu Arg Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Ser Leu Arg Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val
145 150 155 160 145 150 155 160
Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Lys Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Lys
165 170 175 165 170 175
Pro Val Leu Asp Ser Asp Gly Ser Phe Arg Leu Glu Ser Arg Leu Thr Pro Val Leu Asp Ser Asp Gly Ser Phe Arg Leu Glu Ser Arg Leu Thr
180 185 190 180 185 190
Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Val Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Val
195 200 205 195 200 205
Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu
210 215 220 210 215 220
Ser Leu Gly Ser Leu Gly
225 225
<210> 56<210> 56
<211> 57<211> 57
<212> PRT/Белок<212> PRT/Protein
<213> Homo sapiens<213> Homo sapiens
<400> 56<400> 56
Cys Pro Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr Cys Gly Cys Pro Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr Cys Gly
1 5 10 15 1 5 10 15
Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys Arg Leu Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys Arg Leu
20 25 30 20 25 30
Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Pro Pro Ser Arg Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Pro Pro Ser Arg
35 40 45 35 40 45
Gly Arg Ser Pro Gln Asn Ser Ala Phe Gly Arg Ser Pro Gln Asn Ser Ala Phe
50 55 50 55
<210> 57<210> 57
<211> 6<211> 6
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Линкер<223> Linker
<400> 57<400> 57
Ile Glu Gly Arg Met Asp Ile Glu Gly Arg Met Asp
1 5 1 5
<210> 58<210> 58
<211> 291<211> 291
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 58<400> 58
Cys Pro Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr Cys Gly Cys Pro Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr Cys Gly
1 5 10 15 1 5 10 15
Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys Arg Leu Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys Arg Leu
20 25 30 20 25 30
Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Pro Pro Ser Arg Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Pro Pro Ser Arg
35 40 45 35 40 45
Gly Arg Ser Pro Gln Asn Ser Ala Phe Ile Glu Gly Arg Met Asp Glu Gly Arg Ser Pro Gln Asn Ser Ala Phe Ile Glu Gly Arg Met Asp Glu
50 55 60 50 55 60
Ser Lys Tyr Gly Pro Pro Cys Pro Pro Cys Pro Ala Pro Glu Ala Ala Ser Lys Tyr Gly Pro Pro Cys Pro Pro Cys Pro Ala Pro Glu Ala Ala
65 70 75 80 65 70 75 80
Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu
85 90 95 85 90 95
Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser
100 105 110 100 105 110
Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu
115 120 125 115 120 125
Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Thr Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Thr
130 135 140 130 135 140
Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn
145 150 155 160 145 150 155 160
Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Ser Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Ser
165 170 175 165 170 175
Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln
180 185 190 180 185 190
Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Val Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Val
195 200 205 195 200 205
Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val
210 215 220 210 215 220
Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro
225 230 235 240 225 230 235 240
Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu Thr Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu Thr
245 250 255 245 250 255
Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Val Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Val
260 265 270 260 265 270
Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu
275 280 285 275 280 285
Ser Leu Gly Ser Leu Gly
290 290
<210> 59<210> 59
<211> 309<211> 309
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 59<400> 59
Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala
1 5 10 15 1 5 10 15
Tyr Ser Cys Pro Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr Tyr Ser Cys Pro Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr
20 25 30 20 25 30
Cys Gly Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys Cys Gly Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys
35 40 45 35 40 45
Arg Leu Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Pro Pro Arg Leu Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Pro Pro
50 55 60 50 55 60
Ser Arg Gly Arg Ser Pro Gln Asn Ser Ala Phe Ile Glu Gly Arg Met Ser Arg Gly Arg Ser Pro Gln Asn Ser Ala Phe Ile Glu Gly Arg Met
65 70 75 80 65 70 75 80
Asp Glu Ser Lys Tyr Gly Pro Pro Cys Pro Pro Cys Pro Ala Pro Glu Asp Glu Ser Lys Tyr Gly Pro Pro Cys Pro Pro Cys Pro Ala Pro Glu
85 90 95 85 90 95
Ala Ala Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Ala Ala Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp
100 105 110 100 105 110
Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp
115 120 125 115 120 125
Val Ser Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Ser Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly
130 135 140 130 135 140
Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn
145 150 155 160 145 150 155 160
Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp
165 170 175 165 170 175
Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro
180 185 190 180 185 190
Ser Ser Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Ser Ser Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu
195 200 205 195 200 205
Pro Gln Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Pro Gln Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn
210 215 220 210 215 220
Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile
225 230 235 240 225 230 235 240
Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr
245 250 255 245 250 255
Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg
260 265 270 260 265 270
Leu Thr Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Leu Thr Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys
275 280 285 275 280 285
Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu
290 295 300 290 295 300
Ser Leu Ser Leu Gly Ser Leu Ser Leu Gly
305 305
<210> 60<210> 60
<211> 936<211> 936
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 60<400> 60
gccaccatga aatgggtcac ctttatctcc ctgctgttcc tgttctcctc cgcctactct 60gccaccatga aatgggtcac ctttatctcc ctgctgttcc tgttctcctc cgcctactct 60
tgccctgagt ggtctacagc ttggggccct tgctctacca cctgtggact cggcatggcc 120tgccctgagt ggtctacagc ttggggccct tgctctacca cctgtggact cggcatggcc 120
accagagtgt ctaaccagaa cagattctgc cggctggaaa cccagcggag actgtgtctg 180accagagtgt ctaaccagaa cagattctgc cggctggaaa cccagcggag actgtgtctg 180
tccagacctt gtcctcctag ccggggcaga tcccctcaga actctgcctt tatcgagggc 240tccagacctt gtcctcctag ccggggcaga tcccctcaga actctgcctt tatcgaggc 240
agaatggacg agtctaagta cggccctcct tgtccaccat gtcctgctcc agaagctgct 300agaatggacg agtctaagta cggccctcct tgtccaccat gtcctgctcc agaagctgct 300
ggcggccctt ccgtgtttct gttccctcca aagcctaagg acaccctgat gatctctcgg 360ggcggccctt ccgtgtttct gttccctcca aagcctaagg acaccctgat gatctctcgg 360
acccctgaag tgacctgcgt ggtggtggat gtgtcccaag aggatcccga ggtgcagttc 420acccctgaag tgacctgcgt ggtggtggat gtgtcccaag aggatcccga ggtgcagttc 420
aattggtacg tggacggcgt ggaagtgcac aacgccaaga ccaagcctag agaggaacag 480aattggtacg tggacggcgt ggaagtgcac aacgccaaga ccaagcctag agaggaacag 480
ttcaactcca cctacagagt ggtgtccgtg ctgaccgtgc tgcaccagga ttggctgaac 540ttcaactcca cctacagagt ggtgtccgtg ctgaccgtgc tgcaccagga ttggctgaac 540
ggcaaagagt acaagtgcaa ggtgtccaac aagggcctgc cttccagcat cgaaaagacc 600ggcaaagagt acaagtgcaa ggtgtccaac aagggcctgc cttccagcat cgaaaagacc 600
atctccaagg ccaagggcca gcctagggaa ccccaggttt acaccctgcc tccaagccaa 660atctccaagg ccaagggcca gcctagggaa ccccaggttt acaccctgcc tccaagccaa 660
gaggaaatga ccaagaacca ggtgtccctg acctgcctgg tcaagggctt ctacccttcc 720gaggaaatga ccaagaacca ggtgtccctg acctgcctgg tcaagggctt ctacccttcc 720
gatatcgccg tggaatggga gagcaatggc cagcctgaga acaactacaa gaccacacct 780gatatcgccg tggaatggga gagcaatggc cagcctgaga acaactacaa gaccacacct 780
cctgtgctgg actccgacgg ctccttcttt ctgtactccc gcctgaccgt ggacaagtcc 840cctgtgctgg actccgacgg ctccttcttt ctgtactccc gcctgaccgt ggacaagtcc 840
agatggcaag agggcaacgt gttctcctgc tccgtgatgc acgaggccct gcacaatcac 900agatggcaag agggcaacgt gttctcctgc tccgtgatgc acgaggccct gcacaatcac 900
tacacccaga agtccctgtc tctgtccctg ggctaa 936tacacccaga agtccctgtc tctgtccctg ggctaa 936
<210> 61<210> 61
<211> 1009<211> 1009
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 61<400> 61
ggggacaagt ttgtacaaaa aagcaggcta tggtaccgcc accatgaaat gggtcacctt 60ggggacaagt ttgtacaaaa aagcaggcta tggtaccgcc accatgaaat gggtcacctt 60
tatctccctg ctgttcctgt tctcctccgc ctactcttgc cctgagtggt ctacagcttg 120tatctccctg ctgttcctgt tctcctccgc ctactcttgc cctgagtggt ctacagcttg 120
gggcccttgc tctaccacct gtggactcgg catggccacc agagtgtcta accagaacag 180gggcccttgc tctaccacct gtggactcgg catggccacc agagtgtcta accagaacag 180
attctgccgg ctggaaaccc agcggagact gtgtctgtcc agaccttgtc ctcctagccg 240attctgccgg ctggaaaccc agcggagact gtgtctgtcc agaccttgtc ctcctagccg 240
gggcagatcc cctcagaact ctgcctttat cgagggcaga atggacgagt ctaagtacgg 300gggcagatcc cctcagaact ctgcctttat cgagggcaga atggacgagt ctaagtacgg 300
ccctccttgt ccaccatgtc ctgctccaga agctgctggc ggcccttccg tgtttctgtt 360ccctccttgt ccaccatgtc ctgctccaga agctgctggc ggcccttccg tgtttctgtt 360
ccctccaaag cctaaggaca ccctgatgat ctctcggacc cctgaagtga cctgcgtggt 420ccctccaaag cctaaggaca ccctgatgat ctctcggacc cctgaagtga cctgcgtggt 420
ggtggatgtg tcccaagagg atcccgaggt gcagttcaat tggtacgtgg acggcgtgga 480ggtggatgtg tcccaagagg atcccgaggt gcagttcaat tggtacgtgg acggcgtgga 480
agtgcacaac gccaagacca agcctagaga ggaacagttc aactccacct acagagtggt 540agtgcacaac gccaagacca agcctagaga ggaacagttc aactccacct acagagtggt 540
gtccgtgctg accgtgctgc accaggattg gctgaacggc aaagagtaca agtgcaaggt 600gtccgtgctg accgtgctgc accaggattg gctgaacggc aaagagtaca agtgcaaggt 600
gtccaacaag ggcctgcctt ccagcatcga aaagaccatc tccaaggcca agggccagcc 660gtccaacaag ggcctgcctt ccagcatcga aaagaccatc tccaaggcca agggccagcc 660
tagggaaccc caggtttaca ccctgcctcc aagccaagag gaaatgacca agaaccaggt 720tagggaaccc caggtttaca ccctgcctcc aagccaagag gaaatgacca agaaccaggt 720
gtccctgacc tgcctggtca agggcttcta cccttccgat atcgccgtgg aatgggagag 780gtccctgacc tgcctggtca agggcttcta cccttccgat atcgccgtgg aatggggagag 780
caatggccag cctgagaaca actacaagac cacacctcct gtgctggact ccgacggctc 840caatggccag cctgagaaca actacaagac cacacctcct gtgctggact ccgacggctc 840
cttctttctg tactcccgcc tgaccgtgga caagtccaga tggcaagagg gcaacgtgtt 900cttctttctg tactcccgcc tgaccgtgga caagtccaga tggcaagagg gcaacgtgtt 900
ctcctgctcc gtgatgcacg aggccctgca caatcactac acccagaagt ccctgtctct 960ctcctgctcc gtgatgcacg aggccctgca caatcactac acccagaagt ccctgtctct 960
gtccctgggc taatctagaa acccagcttt cttgtacaaa gtggtcccc 1009gtccctgggc taatctagaa acccagcttt cttgtacaaa gtggtcccc 1009
<210> 62<210> 62
<211> 56<211> 56
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Модифицированная последовательность CCN5<223> Modified CCN5 sequence
<400> 62<400> 62
Cys Pro Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr Cys Gly Cys Pro Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr Cys Gly
1 5 10 15 1 5 10 15
Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys Arg Leu Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys Arg Leu
20 25 30 20 25 30
Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Pro Pro Ser Arg Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Pro Pro Ser Arg
35 40 45 35 40 45
Gly Arg Ser Leu Gln Asn Ser Ala Gly Arg Ser Leu Gln Asn Ser Ala
50 55 50 55
<210> 63<210> 63
<211> 4<211> 4
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Линкер<223> Linker
<400> 63<400> 63
Gly Arg Met Asp Gly Arg Met Asp
1 1
<210> 64<210> 64
<211> 306<211> 306
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 64<400> 64
Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala
1 5 10 15 1 5 10 15
Tyr Ser Cys Pro Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr Tyr Ser Cys Pro Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr
20 25 30 20 25 30
Cys Gly Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys Cys Gly Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys
35 40 45 35 40 45
Arg Leu Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Pro Pro Arg Leu Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Pro Pro
50 55 60 50 55 60
Ser Arg Gly Arg Ser Leu Gln Asn Ser Ala Gly Arg Met Asp Glu Ser Ser Arg Gly Arg Ser Leu Gln Asn Ser Ala Gly Arg Met Asp Glu Ser
65 70 75 80 65 70 75 80
Lys Tyr Gly Pro Pro Cys Pro Pro Cys Pro Ala Pro Glu Ala Ala Gly Lys Tyr Gly Pro Pro Cys Pro Pro Cys Pro Ala Pro Glu Ala Ala Gly
85 90 95 85 90 95
Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met
100 105 110 100 105 110
Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser Gln Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser Gln
115 120 125 115 120 125
Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu Val Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu Val
130 135 140 130 135 140
His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Thr Tyr His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Thr Tyr
145 150 155 160 145 150 155 160
Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly
165 170 175 165 170 175
Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Ser Ile Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Ser Ile
180 185 190 180 185 190
Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val
195 200 205 195 200 205
Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Val Ser Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Val Ser
210 215 220 210 215 220
Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu
225 230 235 240 225 230 235 240
Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro
245 250 255 245 250 255
Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu Thr Val Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu Thr Val
260 265 270 260 265 270
Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Val Met Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Val Met
275 280 285 275 280 285
His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser
290 295 300 290 295 300
Leu Gly Leu Gly
305 305
<210> 65<210> 65
<211> 6<211> 6
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Линкер<223> Linker
<400> 65<400> 65
Thr Glu Gly Arg Met Asp Thr Glu Gly Arg Met Asp
1 5 1 5
<210> 66<210> 66
<211> 305<211> 305
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 66<400> 66
Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala
1 5 10 15 1 5 10 15
Tyr Ser Cys Pro Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr Tyr Ser Cys Pro Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr
20 25 30 20 25 30
Cys Gly Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys Cys Gly Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys
35 40 45 35 40 45
Arg Leu Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Pro Pro Arg Leu Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Pro Pro
50 55 60 50 55 60
Ser Arg Gly Arg Ser Pro Gln Thr Glu Gly Arg Met Asp Glu Ser Lys Ser Arg Gly Arg Ser Pro Gln Thr Glu Gly Arg Met Asp Glu Ser Lys
65 70 75 80 65 70 75 80
Tyr Gly Pro Pro Cys Pro Pro Cys Pro Ala Pro Glu Ala Ala Gly Gly Tyr Gly Pro Pro Cys Pro Pro Cys Pro Ala Pro Glu Ala Ala Gly Gly
85 90 95 85 90 95
Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile
100 105 110 100 105 110
Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser Gln Glu Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser Gln Glu
115 120 125 115 120 125
Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu Val His
130 135 140 130 135 140
Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Thr Tyr Arg Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Thr Tyr Arg
145 150 155 160 145 150 155 160
Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys
165 170 175 165 170 175
Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Ser Ile Glu Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Ser Ile Glu
180 185 190 180 185 190
Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr
195 200 205 195 200 205
Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Val Ser Leu
210 215 220 210 215 220
Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp
225 230 235 240 225 230 235 240
Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val
245 250 255 245 250 255
Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu Thr Val Asp Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu Thr Val Asp
260 265 270 260 265 270
Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Val Met His Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Val Met His
275 280 285 275 280 285
Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Leu Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Leu
290 295 300 290 295 300
Gly Gly
305 305
<210> 67<210> 67
<211> 8<211> 8
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Линкер<223> Linker
<400> 67<400> 67
Thr Ala Glu Ala Ala Ala Lys Ala Thr Ala Glu Ala Ala Ala Lys Ala
1 5 1 5
<210> 68<210> 68
<211> 307<211> 307
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 68<400> 68
Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala
1 5 10 15 1 5 10 15
Tyr Ser Cys Pro Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr Tyr Ser Cys Pro Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr
20 25 30 20 25 30
Cys Gly Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys Cys Gly Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys
35 40 45 35 40 45
Arg Leu Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Pro Pro Arg Leu Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Pro Pro
50 55 60 50 55 60
Ser Arg Gly Arg Ser Pro Gln Thr Ala Glu Ala Ala Ala Lys Ala Glu Ser Arg Gly Arg Ser Pro Gln Thr Ala Glu Ala Ala Ala Lys Ala Glu
65 70 75 80 65 70 75 80
Ser Lys Tyr Gly Pro Pro Cys Pro Pro Cys Pro Ala Pro Glu Ala Ala Ser Lys Tyr Gly Pro Pro Cys Pro Pro Cys Pro Ala Pro Glu Ala Ala
85 90 95 85 90 95
Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu
100 105 110 100 105 110
Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser
115 120 125 115 120 125
Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu
130 135 140 130 135 140
Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Thr Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Thr
145 150 155 160 145 150 155 160
Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn
165 170 175 165 170 175
Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Ser Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Ser
180 185 190 180 185 190
Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln
195 200 205 195 200 205
Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Val Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Val
210 215 220 210 215 220
Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val
225 230 235 240 225 230 235 240
Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro
245 250 255 245 250 255
Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu Thr Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu Thr
260 265 270 260 265 270
Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Val Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Val
275 280 285 275 280 285
Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu
290 295 300 290 295 300
Ser Leu Gly Ser Leu Gly
305 305
<210> 69<210> 69
<211> 304<211> 304
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 69<400> 69
Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala
1 5 10 15 1 5 10 15
Tyr Ser Cys Pro Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr Tyr Ser Cys Pro Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr
20 25 30 20 25 30
Cys Gly Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys Cys Gly Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys
35 40 45 35 40 45
Arg Leu Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Pro Pro Arg Leu Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Pro Pro
50 55 60 50 55 60
Ser Arg Gly Arg Ser Pro Gln Thr Glu Gly Arg Met Asp Glu Arg Lys Ser Arg Gly Arg Ser Pro Gln Thr Glu Gly Arg Met Asp Glu Arg Lys
65 70 75 80 65 70 75 80
Cys Cys Val Glu Cys Pro Pro Cys Pro Ala Pro Pro Val Ala Gly Pro Cys Cys Val Glu Cys Pro Pro Cys Pro Ala Pro Pro Val Ala Gly Pro
85 90 95 85 90 95
Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser
100 105 110 100 105 110
Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser Gln Glu Asp Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser Gln Glu Asp
115 120 125 115 120 125
Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn
130 135 140 130 135 140
Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Thr Tyr Arg Val Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Thr Tyr Arg Val
145 150 155 160 145 150 155 160
Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu
165 170 175 165 170 175
Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Ser Ile Glu Lys Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Ser Ile Glu Lys
180 185 190 180 185 190
Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr
195 200 205 195 200 205
Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr
210 215 220 210 215 220
Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu
225 230 235 240 225 230 235 240
Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu
245 250 255 245 250 255
Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu Thr Val Asp Lys Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu Thr Val Asp Lys
260 265 270 260 265 270
Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Val Met His Glu
275 280 285 275 280 285
Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Leu Gly Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Leu Gly
290 295 300 290 295 300
<210> 70<210> 70
<211> 294<211> 294
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 70<400> 70
Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala
1 5 10 15 1 5 10 15
Tyr Ser Cys Ala Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr Tyr Ser Cys Ala Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr
20 25 30 20 25 30
Cys Gly Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys Cys Gly Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys
35 40 45 35 40 45
Arg Leu Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Glu Ala Arg Leu Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Glu Ala
50 55 60 50 55 60
Ala Ala Lys Glu Arg Lys Cys Cys Val Glu Cys Pro Pro Cys Pro Ala Ala Ala Lys Glu Arg Lys Cys Cys Val Glu Cys Pro Pro Cys Pro Ala
65 70 75 80 65 70 75 80
Pro Pro Val Ala Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Pro Pro Val Ala Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys
85 90 95 85 90 95
Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val
100 105 110 100 105 110
Asp Val Ser Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Asp Val Ser Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp
115 120 125 115 120 125
Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe
130 135 140 130 135 140
Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp
145 150 155 160 145 150 155 160
Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu
165 170 175 165 170 175
Pro Ser Ser Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Pro Ser Ser Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg
180 185 190 180 185 190
Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys
195 200 205 195 200 205
Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp
210 215 220 210 215 220
Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys
225 230 235 240 225 230 235 240
Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser
245 250 255 245 250 255
Arg Leu Thr Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Arg Leu Thr Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser
260 265 270 260 265 270
Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser
275 280 285 275 280 285
Leu Ser Leu Ser Leu Gly Leu Ser Leu Ser Leu Gly
290 290
<210> 71<210> 71
<211> 891<211> 891
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 71<400> 71
gccaccatga aatgggtcac ctttatctcc ctgctgttcc tgttctcctc cgcctactct 60gccaccatga aatgggtcac ctttatctcc ctgctgttcc tgttctcctc cgcctactct 60
tgcgccgagt ggtctacagc ttggggccct tgttctacca cctgtggcct cggcatggcc 120tgcgccgagt ggtctacagc ttggggccct tgttctacca cctgtggcct cggcatggcc 120
accagagtgt ccaaccagaa cagattctgc cggctggaaa cccagcggag actgtgtttg 180accagagtgt ccaaccagaa cagattctgc cggctggaaa cccagcggag actgtgtttg 180
tccagacctt gcgaggccgc tgccaaagaa agaaagtgct gcgtggaatg ccctccttgt 240tccagacctt gcgaggccgc tgccaaagaa agaaagtgct gcgtggaatg ccctccttgt 240
cctgctcctc ctgtggctgg cccttccgtg tttctgttcc ctccaaagcc taaggacacc 300cctgctcctc ctgtggctgg cccttccgtg tttctgttcc ctccaaagcc taaggacacc 300
ctgatgatct ctcggacccc tgaagtgacc tgcgtggtgg tggatgtgtc ccaagaggat 360ctgatgatct ctcggacccc tgaagtgacc tgcgtggtgg tggatgtgtc ccaagaggat 360
cccgaggtgc agttcaattg gtacgtggac ggcgtggaag tgcacaacgc caagaccaag 420cccgaggtgc agttcaattg gtacgtggac ggcgtggaag tgcacaacgc caagaccaag 420
cctagagagg aacagttcaa ctccacctac agagtggtgt ccgtgctgac cgtgctgcac 480cctagagagg aacagttcaa ctccacctac agagtggtgt ccgtgctgac cgtgctgcac 480
caggattggc tgaacggcaa agagtacaag tgcaaggtgt ccaacaaggg actgccctcc 540caggattggc tgaacggcaa agagtacaag tgcaaggtgt ccaacaaggg actgccctcc 540
agcatcgaaa agaccatctc caaggccaag ggacagccca gagaacccca ggtgtacaca 600agcatcgaaa agaccatctc caaggccaag ggacagccca gagaacccca ggtgtacaca 600
ctgcctccaa gccaagagga aatgaccaag aaccaggtgt ccctgacctg cctggtcaag 660ctgcctccaa gccaagagga aatgaccaag aaccaggtgt ccctgacctg cctggtcaag 660
ggcttctacc cttccgatat cgccgtggaa tgggagtcca atggccagcc tgagaacaac 720ggcttctacc cttccgatat cgccgtggaa tgggagtcca atggccagcc tgagaacaac 720
tacaagacca cacctccagt gctggactcc gacggctcct tctttctgta ctcccgcctg 780tacaagacca cacctccagt gctggactcc gacggctcct tctttctgta ctcccgcctg 780
accgtggaca agtccagatg gcaagagggc aacgtgttct cctgctccgt gatgcacgag 840accgtggaca agtccagatg gcaagagggc aacgtgttct cctgctccgt gatgcacgag 840
gccctgcaca atcactacac ccagaagtcc ctgtctctgt ccctgggcta a 891gccctgcaca atcactacac ccagaagtcc ctgtctctgt ccctgggcta a 891
<210> 72<210> 72
<211> 964<211> 964
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 72<400> 72
ggggacaagt ttgtacaaaa aagcaggcta tggtaccgcc accatgaaat gggtcacctt 60ggggacaagt ttgtacaaaa aagcaggcta tggtaccgcc accatgaaat gggtcacctt 60
tatctccctg ctgttcctgt tctcctccgc ctactcttgc gccgagtggt ctacagcttg 120tatctccctg ctgttcctgt tctcctccgc ctactcttgc gccgagtggt ctacagcttg 120
gggcccttgt tctaccacct gtggcctcgg catggccacc agagtgtcca accagaacag 180gggcccttgt tctaccacct gtggcctcgg catggccacc agagtgtcca accagaacag 180
attctgccgg ctggaaaccc agcggagact gtgtttgtcc agaccttgcg aggccgctgc 240attctgccgg ctggaaaccc agcggagact gtgtttgtcc agaccttgcg aggccgctgc 240
caaagaaaga aagtgctgcg tggaatgccc tccttgtcct gctcctcctg tggctggccc 300caaagaaaga aagtgctgcg tggaatgccc tccttgtcct gctcctcctg tggctggccc 300
ttccgtgttt ctgttccctc caaagcctaa ggacaccctg atgatctctc ggacccctga 360ttccgtgttt ctgttccctc caaagcctaa ggacaccctg atgatctctc ggacccctga 360
agtgacctgc gtggtggtgg atgtgtccca agaggatccc gaggtgcagt tcaattggta 420agtgacctgc gtggtggtgg atgtgtccca agaggatccc gaggtgcagt tcaattggta 420
cgtggacggc gtggaagtgc acaacgccaa gaccaagcct agagaggaac agttcaactc 480cgtggacggc gtggaagtgc acaacgccaa gaccaagcct agagaggaac agttcaactc 480
cacctacaga gtggtgtccg tgctgaccgt gctgcaccag gattggctga acggcaaaga 540cacctacaga gtggtgtccg tgctgaccgt gctgcaccag gattggctga acggcaaaga 540
gtacaagtgc aaggtgtcca acaagggact gccctccagc atcgaaaaga ccatctccaa 600gtacaagtgc aaggtgtcca acaagggact gccctccagc atcgaaaaga ccatctccaa 600
ggccaaggga cagcccagag aaccccaggt gtacacactg cctccaagcc aagaggaaat 660ggccaaggga cagcccagag aaccccaggt gtacacactg cctccaagcc aagaggaaat 660
gaccaagaac caggtgtccc tgacctgcct ggtcaagggc ttctaccctt ccgatatcgc 720gaccaagaac caggtgtccc tgacctgcct ggtcaagggc ttctaccctt ccgatatcgc 720
cgtggaatgg gagtccaatg gccagcctga gaacaactac aagaccacac ctccagtgct 780cgtggaatgg gagtccaatg gccagcctga gaacaactac aagaccacac ctccagtgct 780
ggactccgac ggctccttct ttctgtactc ccgcctgacc gtggacaagt ccagatggca 840ggactccgac ggctccttct ttctgtactc ccgcctgacc gtggacaagt ccagatggca 840
agagggcaac gtgttctcct gctccgtgat gcacgaggcc ctgcacaatc actacaccca 900agagggcaac gtgttctcct gctccgtgat gcacgaggcc ctgcacaatc actacaccca 900
gaagtccctg tctctgtccc tgggctaatc tagaaaccca gctttcttgt acaaagtggt 960gaagtccctg tctctgtccc tgggctaatc tagaaaccca gctttcttgt acaaagtggt 960
cccc 964cccc 964
<210> 73<210> 73
<211> 276<211> 276
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 73<400> 73
Cys Ala Glu Gln Thr Thr Glu Trp Thr Ala Cys Ser Lys Ser Cys Gly Cys Ala Glu Gln Thr Thr Glu Trp Thr Ala Cys Ser Lys Ser Cys Gly
1 5 10 15 1 5 10 15
Met Gly Phe Ser Thr Arg Val Thr Asn Arg Asn Arg Gln Cys Glu Met Met Gly Phe Ser Thr Arg Val Thr Asn Arg Asn Arg Gln Cys Glu Met
20 25 30 20 25 30
Leu Lys Gln Thr Arg Leu Cys Met Val Arg Pro Cys Glu Ala Ala Ala Leu Lys Gln Thr Arg Leu Cys Met Val Arg Pro Cys Glu Ala Ala Ala
35 40 45 35 40 45
Lys Glu Arg Lys Cys Cys Val Glu Cys Pro Pro Cys Pro Ala Pro Pro Lys Glu Arg Lys Cys Cys Val Glu Cys Pro Pro Cys Pro Ala Pro Pro
50 55 60 50 55 60
Val Ala Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Val Ala Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr
65 70 75 80 65 70 75 80
Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val
85 90 95 85 90 95
Ser Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Ser Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val
100 105 110 100 105 110
Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser
115 120 125 115 120 125
Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu
130 135 140 130 135 140
Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser
145 150 155 160 145 150 155 160
Ser Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Ser Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro
165 170 175 165 170 175
Gln Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Gln Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln
180 185 190 180 185 190
Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala
195 200 205 195 200 205
Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr
210 215 220 210 215 220
Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu
225 230 235 240 225 230 235 240
Thr Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Thr Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser
245 250 255 245 250 255
Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser
260 265 270 260 265 270
Leu Ser Leu Gly Leu Ser Leu Gly
275 275
<210> 74<210> 74
<211> 294<211> 294
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 74<400> 74
Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala
1 5 10 15 1 5 10 15
Tyr Ser Cys Ala Glu Gln Thr Thr Glu Trp Thr Ala Cys Ser Lys Ser Tyr Ser Cys Ala Glu Gln Thr Thr Glu Trp Thr Ala Cys Ser Lys Ser
20 25 30 20 25 30
Cys Gly Met Gly Phe Ser Thr Arg Val Thr Asn Arg Asn Arg Gln Cys Cys Gly Met Gly Phe Ser Thr Arg Val Thr Asn Arg Asn Arg Gln Cys
35 40 45 35 40 45
Glu Met Leu Lys Gln Thr Arg Leu Cys Met Val Arg Pro Cys Glu Ala Glu Met Leu Lys Gln Thr Arg Leu Cys Met Val Arg Pro Cys Glu Ala
50 55 60 50 55 60
Ala Ala Lys Glu Arg Lys Cys Cys Val Glu Cys Pro Pro Cys Pro Ala Ala Ala Lys Glu Arg Lys Cys Cys Val Glu Cys Pro Pro Cys Pro Ala
65 70 75 80 65 70 75 80
Pro Pro Val Ala Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Pro Pro Val Ala Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys
85 90 95 85 90 95
Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val
100 105 110 100 105 110
Asp Val Ser Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Asp Val Ser Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp
115 120 125 115 120 125
Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe
130 135 140 130 135 140
Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp
145 150 155 160 145 150 155 160
Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu
165 170 175 165 170 175
Pro Ser Ser Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Pro Ser Ser Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg
180 185 190 180 185 190
Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys
195 200 205 195 200 205
Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp
210 215 220 210 215 220
Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys
225 230 235 240 225 230 235 240
Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser
245 250 255 245 250 255
Arg Leu Thr Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Arg Leu Thr Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser
260 265 270 260 265 270
Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser
275 280 285 275 280 285
Leu Ser Leu Ser Leu Gly Leu Ser Leu Ser Leu Gly
290 290
<210> 75<210> 75
<211> 891<211> 891
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 75<400> 75
gccaccatga aatgggtcac ctttatctcc ctgctgttcc tgttctcctc cgcctactct 60gccaccatga aatgggtcac ctttatctcc ctgctgttcc tgttctcctc cgcctactct 60
tgtgccgagc agaccacaga gtggaccgcc tgctctaagt cttgcggcat gggcttctcc 120tgtgccgagc agaccacaga gtggaccgcc tgctctaagt cttgcggcat gggcttctcc 120
accagagtga ccaaccggaa cagacagtgc gagatgctga agcagacccg gctgtgtatg 180accagagtga ccaaccggaa cagacagtgc gagatgctga agcagacccg gctgtgtatg 180
gttcgacctt gcgaggccgc tgccaaagaa agaaagtgct gcgtggaatg ccctccttgt 240gttcgacctt gcgaggccgc tgccaaagaa agaaagtgct gcgtggaatg ccctccttgt 240
cctgctcctc ctgtggctgg cccttccgtg tttctgttcc ctccaaagcc taaggacacc 300cctgctcctc ctgtggctgg cccttccgtg tttctgttcc ctccaaagcc taaggacacc 300
ctgatgatct ctcggacccc tgaagtgacc tgcgtggtgg tggatgtgtc ccaagaggat 360ctgatgatct ctcggacccc tgaagtgacc tgcgtggtgg tggatgtgtc ccaagaggat 360
cccgaggtgc agttcaattg gtacgtggac ggcgtggaag tgcacaacgc caagaccaag 420cccgaggtgc agttcaattg gtacgtggac ggcgtggaag tgcacaacgc caagaccaag 420
cctagagagg aacagttcaa ctccacctac agagtggtgt ccgtgctgac cgtgctgcac 480cctagagagg aacagttcaa ctccacctac agagtggtgt ccgtgctgac cgtgctgcac 480
caggattggc tgaacggcaa agagtacaag tgcaaggtgt ccaacaaggg cctgccttcc 540caggattggc tgaacggcaa agagtacaag tgcaaggtgt ccaacaaggg cctgccttcc 540
agcatcgaaa agaccatctc caaggccaag ggacagccca gagaacccca ggtgtacaca 600agcatcgaaa agaccatctc caaggccaag ggacagccca gagaacccca ggtgtacaca 600
ctgcctccaa gccaagagga aatgaccaag aaccaggtgt ccctgacctg cctggtcaag 660ctgcctccaa gccaagagga aatgaccaag aaccaggtgt ccctgacctg cctggtcaag 660
ggcttctacc cttccgatat cgccgtggaa tgggagtcca atggccagcc tgagaacaac 720ggcttctacc cttccgatat cgccgtggaa tgggagtcca atggccagcc tgagaacaac 720
tacaagacca cacctccagt gctggactcc gacggctcct tctttctgta ctcccgcctg 780tacaagacca cacctccagt gctggactcc gacggctcct tctttctgta ctcccgcctg 780
accgtggaca agtccagatg gcaagagggc aacgtgttct cctgctccgt gatgcacgag 840accgtggaca agtccagatg gcaagagggc aacgtgttct cctgctccgt gatgcacgag 840
gccctgcaca atcactacac ccagaagtcc ctgtctctgt ccctgggcta a 891gccctgcaca atcactacac ccagaagtcc ctgtctctgt ccctgggcta a 891
<210> 76<210> 76
<211> 964<211> 964
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 76<400> 76
ggggacaagt ttgtacaaaa aagcaggcta tggtaccgcc accatgaaat gggtcacctt 60ggggacaagt ttgtacaaaa aagcaggcta tggtaccgcc accatgaaat gggtcacctt 60
tatctccctg ctgttcctgt tctcctccgc ctactcttgt gccgagcaga ccacagagtg 120tatctccctg ctgttcctgt tctcctccgc ctactcttgt gccgagcaga ccacagagtg 120
gaccgcctgc tctaagtctt gcggcatggg cttctccacc agagtgacca accggaacag 180gaccgcctgc tctaagtctt gcggcatggg cttctccacc agagtgacca accggaacag 180
acagtgcgag atgctgaagc agacccggct gtgtatggtt cgaccttgcg aggccgctgc 240acagtgcgag atgctgaagc agacccggct gtgtatggtt cgaccttgcg aggccgctgc 240
caaagaaaga aagtgctgcg tggaatgccc tccttgtcct gctcctcctg tggctggccc 300caaagaaaga aagtgctgcg tggaatgccc tccttgtcct gctcctcctg tggctggccc 300
ttccgtgttt ctgttccctc caaagcctaa ggacaccctg atgatctctc ggacccctga 360ttccgtgttt ctgttccctc caaagcctaa ggacaccctg atgatctctc ggacccctga 360
agtgacctgc gtggtggtgg atgtgtccca agaggatccc gaggtgcagt tcaattggta 420agtgacctgc gtggtggtgg atgtgtccca agaggatccc gaggtgcagt tcaattggta 420
cgtggacggc gtggaagtgc acaacgccaa gaccaagcct agagaggaac agttcaactc 480cgtggacggc gtggaagtgc acaacgccaa gaccaagcct agagaggaac agttcaactc 480
cacctacaga gtggtgtccg tgctgaccgt gctgcaccag gattggctga acggcaaaga 540cacctacaga gtggtgtccg tgctgaccgt gctgcaccag gattggctga acggcaaaga 540
gtacaagtgc aaggtgtcca acaagggcct gccttccagc atcgaaaaga ccatctccaa 600gtacaagtgc aaggtgtcca acaagggcct gccttccagc atcgaaaaga ccatctccaa 600
ggccaaggga cagcccagag aaccccaggt gtacacactg cctccaagcc aagaggaaat 660ggccaaggga cagcccagag aaccccaggt gtacacactg cctccaagcc aagaggaaat 660
gaccaagaac caggtgtccc tgacctgcct ggtcaagggc ttctaccctt ccgatatcgc 720gaccaagaac caggtgtccc tgacctgcct ggtcaagggc ttctaccctt ccgatatcgc 720
cgtggaatgg gagtccaatg gccagcctga gaacaactac aagaccacac ctccagtgct 780cgtggaatgg gagtccaatg gccagcctga gaacaactac aagaccacac ctccagtgct 780
ggactccgac ggctccttct ttctgtactc ccgcctgacc gtggacaagt ccagatggca 840ggactccgac ggctccttct ttctgtactc ccgcctgacc gtggacaagt ccagatggca 840
agagggcaac gtgttctcct gctccgtgat gcacgaggcc ctgcacaatc actacaccca 900agagggcaac gtgttctcct gctccgtgat gcacgaggcc ctgcacaatc actacaccca 900
gaagtccctg tctctgtccc tgggctaatc tagaaaccca gctttcttgt acaaagtggt 960gaagtccctg tctctgtccc tgggctaatc tagaaaccca gctttcttgt acaaagtggt 960
cccc 964cccc 964
<210> 77<210> 77
<211> 343<211> 343
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 77<400> 77
Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala
1 5 10 15 1 5 10 15
Tyr Ser Glu Ser Lys Tyr Gly Pro Pro Cys Pro Pro Cys Pro Ala Pro Tyr Ser Glu Ser Lys Tyr Gly Pro Pro Cys Pro Pro Cys Pro Ala Pro
20 25 30 20 25 30
Glu Ala Ala Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Glu Ala Ala Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys
35 40 45 35 40 45
Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val
50 55 60 50 55 60
Asp Val Ser Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Asp Val Ser Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp
65 70 75 80 65 70 75 80
Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe
85 90 95 85 90 95
Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp
100 105 110 100 105 110
Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu
115 120 125 115 120 125
Pro Ser Ser Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Pro Ser Ser Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg
130 135 140 130 135 140
Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys
145 150 155 160 145 150 155 160
Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp
165 170 175 165 170 175
Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys
180 185 190 180 185 190
Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser
195 200 205 195 200 205
Arg Leu Thr Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Arg Leu Thr Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser
210 215 220 210 215 220
Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser
225 230 235 240 225 230 235 240
Leu Ser Leu Ser Leu Gly Ala Glu Ala Ala Ala Lys Glu Ala Ala Ala Leu Ser Leu Ser Leu Gly Ala Glu Ala Ala Ala Lys Glu Ala Ala Ala
245 250 255 245 250 255
Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys
260 265 270 260 265 270
Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Ala Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Ala
275 280 285 275 280 285
Ala Ala Cys Ala Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr Ala Ala Cys Ala Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr
290 295 300 290 295 300
Cys Gly Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys Cys Gly Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys
305 310 315 320 305 310 315 320
Arg Leu Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Pro Pro Arg Leu Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Pro Pro
325 330 335 325 330 335
Ser Arg Gly Arg Ser Pro Gln Ser Arg Gly Arg Ser Pro Gln
340 340
<210> 78<210> 78
<211> 1038<211> 1038
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 78<400> 78
gccaccatga aatgggtcac ctttatctcc ctgctgttcc tgttctccag cgcctactcc 60gccaccatga aatgggtcac ctttatctcc ctgctgttcc tgttctccag cgcctactcc 60
gagtctaagt acggccctcc ttgtcctcca tgtcctgctc cagaagctgc tggcggccct 120gagtctaagt acggccctcc ttgtcctcca tgtcctgctc cagaagctgc tggcggccct 120
tccgtgtttc tgttccctcc aaagcctaag gacaccctga tgatctctcg gacccctgaa 180tccgtgtttc tgttccctcc aaagcctaag gacaccctga tgatctctcg gacccctgaa 180
gtgacctgcg tggtggtgga tgtgtcccaa gaggatcccg aggtgcagtt caattggtac 240gtgacctgcg tggtggtgga tgtgtcccaa gaggatcccg aggtgcagtt caattggtac 240
gtggacggcg tggaagtgca caacgccaag accaagccta gagaggaaca gttcaactcc 300gtggacggcg tggaagtgca caacgccaag accaagccta gagaggaaca gttcaactcc 300
acctacagag tggtgtccgt gctgaccgtg ctgcaccagg attggctgaa cggcaaagag 360acctacagag tggtgtccgt gctgaccgtg ctgcaccagg attggctgaa cggcaaagag 360
tacaagtgca aggtgtccaa caagggcctg ccttccagca tcgaaaagac catctccaag 420tacaagtgca aggtgtccaa caagggcctg ccttccagca tcgaaaagac catctccaag 420
gccaagggcc agcctaggga accccaggtt tacaccctgc ctccaagcca agaggaaatg 480gccaagggcc agcctaggga accccaggtt tacaccctgc ctccaagcca agaggaaatg 480
accaagaacc aggtgtccct gacctgcctg gtcaagggct tctacccttc cgatatcgcc 540accaagaacc aggtgtccct gacctgcctg gtcaagggct tctacccttc cgatatcgcc 540
gtggaatggg agagcaatgg ccagcctgag aacaactaca agaccacacc tcctgtgctg 600gtggaatggg agagcaatgg ccagcctgag aacaactaca agaccacacc tcctgtgctg 600
gactccgacg gctccttctt tctgtactcc cgcctgaccg tggacaagtc cagatggcaa 660gactccgacg gctccttctt tctgtactcc cgcctgaccg tggacaagtc cagatggcaa 660
gagggcaacg tgttctcctg ctccgtgatg cacgaggccc tgcacaatca ctacacccag 720gagggcaacg tgttctcctg ctccgtgatg cacgaggccc tgcacaatca ctacacccag 720
aagtccctgt ctctgtccct gggagctgag gccgctgcta aagaagctgc cgctaaagag 780aagtccctgt ctctgtccct gggagctgag gccgctgcta aagaagctgc cgctaaagag 780
gccgcagcca aagaggcagc cgccaaagaa gccgctgcaa aagaggctgc tgcaaaagaa 840gccgcagcca aagaggcagc cgccaaagaa gccgctgcaa aagaggctgc tgcaaaagaa 840
gcagcagcta aagaagctgc tgccaaggcc gctgcttgtg ccgaatggtc tacagcttgg 900gcagcagcta aagaagctgc tgccaaggcc gctgcttgtg ccgaatggtc tacagcttgg 900
ggcccttgct ctaccacctg tggactcggc atggccacca gagtgtctaa ccagaacaga 960ggcccttgct ctaccacctg tggactcggc atggccacca gagtgtctaa ccagaacaga 960
ttctgccggc tggaaaccca gcggagactg tgcctgtcta gaccctgtcc tcctagcaga 1020ttctgccggc tggaaaccca gcggagactg tgcctgtcta gaccctgtcc tcctagcaga 1020
ggcagatccc ctcagtga 1038ggcagatccc ctcagtga 1038
<210> 79<210> 79
<211> 1111<211> 1111
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 79<400> 79
ggggacaagt ttgtacaaaa aagcaggcta tggtaccgcc accatgaaat gggtcacctt 60ggggacaagt ttgtacaaaa aagcaggcta tggtaccgcc accatgaaat gggtcacctt 60
tatctccctg ctgttcctgt tctccagcgc ctactccgag tctaagtacg gccctccttg 120tatctccctg ctgttcctgt tctccagcgc ctactccgag tctaagtacg gccctccttg 120
tcctccatgt cctgctccag aagctgctgg cggcccttcc gtgtttctgt tccctccaaa 180tcctccatgt cctgctccag aagctgctgg cggcccttcc gtgtttctgt tccctccaaa 180
gcctaaggac accctgatga tctctcggac ccctgaagtg acctgcgtgg tggtggatgt 240gcctaaggac accctgatga tctctcggac ccctgaagtg acctgcgtgg tggtggatgt 240
gtcccaagag gatcccgagg tgcagttcaa ttggtacgtg gacggcgtgg aagtgcacaa 300gtcccaagag gatcccgagg tgcagttcaa ttggtacgtg gacggcgtgg aagtgcacaa 300
cgccaagacc aagcctagag aggaacagtt caactccacc tacagagtgg tgtccgtgct 360cgccaagacc aagcctagag aggaacagtt caactccacc tacagagtgg tgtccgtgct 360
gaccgtgctg caccaggatt ggctgaacgg caaagagtac aagtgcaagg tgtccaacaa 420gaccgtgctg caccaggatt ggctgaacgg caaagagtac aagtgcaagg tgtccaacaa 420
gggcctgcct tccagcatcg aaaagaccat ctccaaggcc aagggccagc ctagggaacc 480gggcctgcct tccagcatcg aaaagaccat ctccaaggcc aagggccagc ctagggaacc 480
ccaggtttac accctgcctc caagccaaga ggaaatgacc aagaaccagg tgtccctgac 540ccaggtttac accctgcctc caagccaaga ggaaatgacc aagaaccagg tgtccctgac 540
ctgcctggtc aagggcttct acccttccga tatcgccgtg gaatgggaga gcaatggcca 600ctgcctggtc aagggcttct acccttccga tatcgccgtg gaatgggaga gcaatggcca 600
gcctgagaac aactacaaga ccacacctcc tgtgctggac tccgacggct ccttctttct 660gcctgagaac aactacaaga ccacacctcc tgtgctggac tccgacggct ccttctttct 660
gtactcccgc ctgaccgtgg acaagtccag atggcaagag ggcaacgtgt tctcctgctc 720gtactcccgc ctgaccgtgg acaagtccag atggcaagag ggcaacgtgt tctcctgctc 720
cgtgatgcac gaggccctgc acaatcacta cacccagaag tccctgtctc tgtccctggg 780cgtgatgcac gaggccctgc acaatcacta cacccagaag tccctgtctc tgtccctggg 780
agctgaggcc gctgctaaag aagctgccgc taaagaggcc gcagccaaag aggcagccgc 840agctgaggcc gctgctaaag aagctgccgc taaagaggcc gcagccaaag aggcagccgc 840
caaagaagcc gctgcaaaag aggctgctgc aaaagaagca gcagctaaag aagctgctgc 900caaagaagcc gctgcaaaag aggctgctgc aaaagaagca gcagctaaag aagctgctgc 900
caaggccgct gcttgtgccg aatggtctac agcttggggc ccttgctcta ccacctgtgg 960caaggccgct gcttgtgccg aatggtctac agcttggggc ccttgctcta ccacctgtgg 960
actcggcatg gccaccagag tgtctaacca gaacagattc tgccggctgg aaacccagcg 1020actcggcatg gccaccagag tgtctaacca gaacagattc tgccggctgg aaacccagcg 1020
gagactgtgc ctgtctagac cctgtcctcc tagcagaggc agatcccctc agtgatctag 1080gagactgtgc ctgtctagac cctgtcctcc tagcagaggc agatcccctc agtgatctag 1080
aaacccagct ttcttgtaca aagtggtccc c 1111aaacccagct ttcttgtaca aagtggtccc c 1111
<210> 80<210> 80
<211> 311<211> 311
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 80<400> 80
Cys Ala Glu Gln Thr Thr Glu Trp Thr Ala Cys Ser Lys Ser Cys Gly Cys Ala Glu Gln Thr Thr Glu Trp Thr Ala Cys Ser Lys Ser Cys Gly
1 5 10 15 1 5 10 15
Met Gly Phe Ser Thr Arg Val Thr Asn Arg Asn Arg Gln Cys Glu Met Met Gly Phe Ser Thr Arg Val Thr Asn Arg Asn Arg Gln Cys Glu Met
20 25 30 20 25 30
Leu Lys Gln Thr Arg Leu Cys Met Val Arg Pro Cys Glu Ala Ala Ala Leu Lys Gln Thr Arg Leu Cys Met Val Arg Pro Cys Glu Ala Ala Ala
35 40 45 35 40 45
Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys
50 55 60 50 55 60
Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu
65 70 75 80 65 70 75 80
Ala Ala Ala Lys Glu Arg Lys Cys Cys Val Glu Cys Pro Pro Cys Pro Ala Ala Ala Lys Glu Arg Lys Cys Cys Val Glu Cys Pro Pro Cys Pro
85 90 95 85 90 95
Ala Pro Pro Val Ala Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Ala Pro Pro Val Ala Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro
100 105 110 100 105 110
Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val
115 120 125 115 120 125
Val Asp Val Ser Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Val Asp Val Ser Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val
130 135 140 130 135 140
Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln
145 150 155 160 145 150 155 160
Phe Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Phe Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln
165 170 175 165 170 175
Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly
180 185 190 180 185 190
Leu Pro Ser Ser Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Leu Pro Ser Ser Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro
195 200 205 195 200 205
Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr
210 215 220 210 215 220
Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser
225 230 235 240 225 230 235 240
Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr
245 250 255 245 250 255
Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr
260 265 270 260 265 270
Ser Arg Leu Thr Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Arg Leu Thr Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe
275 280 285 275 280 285
Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys
290 295 300 290 295 300
Ser Leu Ser Leu Ser Leu Gly Ser Leu Ser Leu Ser Leu Gly
305 310 305 310
<210> 81<210> 81
<211> 329<211> 329
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 81<400> 81
Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala
1 5 10 15 1 5 10 15
Tyr Ser Cys Ala Glu Gln Thr Thr Glu Trp Thr Ala Cys Ser Lys Ser Tyr Ser Cys Ala Glu Gln Thr Thr Glu Trp Thr Ala Cys Ser Lys Ser
20 25 30 20 25 30
Cys Gly Met Gly Phe Ser Thr Arg Val Thr Asn Arg Asn Arg Gln Cys Cys Gly Met Gly Phe Ser Thr Arg Val Thr Asn Arg Asn Arg Gln Cys
35 40 45 35 40 45
Glu Met Leu Lys Gln Thr Arg Leu Cys Met Val Arg Pro Cys Glu Ala Glu Met Leu Lys Gln Thr Arg Leu Cys Met Val Arg Pro Cys Glu Ala
50 55 60 50 55 60
Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala
65 70 75 80 65 70 75 80
Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala
85 90 95 85 90 95
Lys Glu Ala Ala Ala Lys Glu Arg Lys Cys Cys Val Glu Cys Pro Pro Lys Glu Ala Ala Ala Lys Glu Arg Lys Cys Cys Val Glu Cys Pro Pro
100 105 110 100 105 110
Cys Pro Ala Pro Pro Val Ala Gly Pro Ser Val Phe Leu Phe Pro Pro Cys Pro Ala Pro Pro Val Ala Gly Pro Ser Val Phe Leu Phe Pro Pro
115 120 125 115 120 125
Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys
130 135 140 130 135 140
Val Val Val Asp Val Ser Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Val Val Val Asp Val Ser Gln Glu Asp Pro Glu Val Gln Phe Asn Trp
145 150 155 160 145 150 155 160
Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu
165 170 175 165 170 175
Glu Gln Phe Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu Glu Gln Phe Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu
180 185 190 180 185 190
His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn
195 200 205 195 200 205
Lys Gly Leu Pro Ser Ser Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Lys Gly Leu Pro Ser Ser Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly
210 215 220 210 215 220
Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu
225 230 235 240 225 230 235 240
Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr
245 250 255 245 250 255
Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn
260 265 270 260 265 270
Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe
275 280 285 275 280 285
Leu Tyr Ser Arg Leu Thr Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Leu Tyr Ser Arg Leu Thr Val Asp Lys Ser Arg Trp Gln Glu Gly Asn
290 295 300 290 295 300
Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr
305 310 315 320 305 310 315 320
Gln Lys Ser Leu Ser Leu Ser Leu Gly Gln Lys Ser Leu Ser Leu Ser Leu Gly
325 325
<210> 82<210> 82
<211> 996<211> 996
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 82<400> 82
gccaccatga aatgggtcac ctttatctcc ctgctgttcc tgttctcctc cgcctactct 60gccaccatga aatgggtcac ctttatctcc ctgctgttcc tgttctcctc cgcctactct 60
tgtgccgagc agaccacaga gtggaccgcc tgctctaagt cttgcggcat gggcttctcc 120tgtgccgagc agaccacaga gtggaccgcc tgctctaagt cttgcggcat gggcttctcc 120
accagagtga ccaaccggaa cagacagtgc gagatgctga agcagacccg gctgtgtatg 180accagagtga ccaaccggaa cagacagtgc gagatgctga agcagacccg gctgtgtatg 180
gttcgacctt gcgaggccgc tgccaaagag gctgctgcta aagaagccgc cgcaaaagag 240gttcgacctt gcgaggccgc tgccaaagag gctgctgcta aagaagccgc cgcaaaagag 240
gcagcagcaa aagaggctgc cgccaaagag gccgcagcca aagaagcagc agctaaagag 300gcagcagcaa aagaggctgc cgccaaagag gccgcagcca aagaagcagc agctaaagag 300
gccgctgcaa aagaacggaa gtgctgcgtg gaatgccctc cttgtcctgc tcctcctgtg 360gccgctgcaa aagaacggaa gtgctgcgtg gaatgccctc cttgtcctgc tcctcctgtg 360
gctggccctt ccgtgtttct gttccctcca aagcctaagg acaccctgat gatctctcgg 420gctggccctt ccgtgtttct gttccctcca aagcctaagg acaccctgat gatctctcgg 420
acccctgaag tgacctgcgt ggtggtggat gtgtcccaag aggatcccga ggtgcagttc 480acccctgaag tgacctgcgt ggtggtggat gtgtcccaag aggatcccga ggtgcagttc 480
aattggtacg tggacggcgt ggaagtgcac aacgccaaga ccaagcctag agaggaacag 540aattggtacg tggacggcgt ggaagtgcac aacgccaaga ccaagcctag agaggaacag 540
ttcaactcca cctacagagt ggtgtccgtg ctgaccgtgc tgcaccagga ttggctgaac 600ttcaactcca cctacagagt ggtgtccgtg ctgaccgtgc tgcaccagga ttggctgaac 600
ggcaaagagt acaagtgcaa ggtgtccaac aagggcctgc cttccagcat cgaaaagacc 660ggcaaagagt acaagtgcaa ggtgtccaac aagggcctgc cttccagcat cgaaaagacc 660
atctccaagg ccaagggaca gcccagagaa ccccaggtgt acacactgcc tccaagccaa 720atctccaagg ccaagggaca gcccagagaa ccccaggtgt acacactgcc tccaagccaa 720
gaggaaatga ccaagaacca ggtgtccctg acctgcctgg tcaagggctt ctacccttcc 780gaggaaatga ccaagaacca ggtgtccctg acctgcctgg tcaagggctt ctacccttcc 780
gatatcgccg tggaatggga gtccaatggc cagcctgaga acaactacaa gaccacacct 840gatatcgccg tggaatggga gtccaatggc cagcctgaga acaactacaa gaccacacct 840
ccagtgctgg actccgacgg ctccttcttt ctgtactccc gcctgaccgt ggacaagtcc 900ccagtgctgg actccgacgg ctccttcttt ctgtactccc gcctgaccgt ggacaagtcc 900
agatggcaag agggcaacgt gttctcctgc tccgtgatgc acgaggccct gcacaatcac 960agatggcaag agggcaacgt gttctcctgc tccgtgatgc acgaggccct gcacaatcac 960
tacacccaga agtccctgtc tctgtccctg ggctaa 996tacacccaga agtccctgtc tctgtccctg ggctaa 996
<210> 83<210> 83
<211> 1069<211> 1069
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 83<400> 83
ggggacaagt ttgtacaaaa aagcaggcta tggtaccgcc accatgaaat gggtcacctt 60ggggacaagt ttgtacaaaa aagcaggcta tggtaccgcc accatgaaat gggtcacctt 60
tatctccctg ctgttcctgt tctcctccgc ctactcttgt gccgagcaga ccacagagtg 120tatctccctg ctgttcctgt tctcctccgc ctactcttgt gccgagcaga ccacagagtg 120
gaccgcctgc tctaagtctt gcggcatggg cttctccacc agagtgacca accggaacag 180gaccgcctgc tctaagtctt gcggcatggg cttctccacc agagtgacca accggaacag 180
acagtgcgag atgctgaagc agacccggct gtgtatggtt cgaccttgcg aggccgctgc 240acagtgcgag atgctgaagc agacccggct gtgtatggtt cgaccttgcg aggccgctgc 240
caaagaggct gctgctaaag aagccgccgc aaaagaggca gcagcaaaag aggctgccgc 300caaagaggct gctgctaaag aagccgccgc aaaagaggca gcagcaaaag aggctgccgc 300
caaagaggcc gcagccaaag aagcagcagc taaagaggcc gctgcaaaag aacggaagtg 360caaagaggcc gcagccaaag aagcagcagc taaagaggcc gctgcaaaag aacggaagtg 360
ctgcgtggaa tgccctcctt gtcctgctcc tcctgtggct ggcccttccg tgtttctgtt 420ctgcgtggaa tgccctcctt gtcctgctcc tcctgtggct ggcccttccg tgtttctgtt 420
ccctccaaag cctaaggaca ccctgatgat ctctcggacc cctgaagtga cctgcgtggt 480ccctccaaag cctaaggaca ccctgatgat ctctcggacc cctgaagtga cctgcgtggt 480
ggtggatgtg tcccaagagg atcccgaggt gcagttcaat tggtacgtgg acggcgtgga 540ggtggatgtg tcccaagagg atcccgaggt gcagttcaat tggtacgtgg acggcgtgga 540
agtgcacaac gccaagacca agcctagaga ggaacagttc aactccacct acagagtggt 600agtgcacaac gccaagacca agcctagaga ggaacagttc aactccacct acagagtggt 600
gtccgtgctg accgtgctgc accaggattg gctgaacggc aaagagtaca agtgcaaggt 660gtccgtgctg accgtgctgc accaggattg gctgaacggc aaagagtaca agtgcaaggt 660
gtccaacaag ggcctgcctt ccagcatcga aaagaccatc tccaaggcca agggacagcc 720gtccaacaag ggcctgcctt ccagcatcga aaagaccatc tccaaggcca agggacagcc 720
cagagaaccc caggtgtaca cactgcctcc aagccaagag gaaatgacca agaaccaggt 780cagagaaccc caggtgtaca cactgcctcc aagccaagag gaaatgacca agaaccaggt 780
gtccctgacc tgcctggtca agggcttcta cccttccgat atcgccgtgg aatgggagtc 840gtccctgacc tgcctggtca agggcttcta cccttccgat atcgccgtgg aatgggagtc 840
caatggccag cctgagaaca actacaagac cacacctcca gtgctggact ccgacggctc 900caatggccag cctgagaaca actacaagac cacacctcca gtgctggact ccgacggctc 900
cttctttctg tactcccgcc tgaccgtgga caagtccaga tggcaagagg gcaacgtgtt 960cttctttctg tactcccgcc tgaccgtgga caagtccaga tggcaagagg gcaacgtgtt 960
ctcctgctcc gtgatgcacg aggccctgca caatcactac acccagaagt ccctgtctct 1020ctcctgctcc gtgatgcacg aggccctgca caatcactac acccagaagt ccctgtctct 1020
gtccctgggc taatctagaa acccagcttt cttgtacaaa gtggtcccc 1069gtccctgggc taatctagaa acccagcttt cttgtacaaa gtggtcccc 1069
<210> 84<210> 84
<211> 276<211> 276
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 84<400> 84
Cys Ala Glu Gln Thr Thr Glu Trp Thr Ala Cys Ser Lys Ser Cys Gly Cys Ala Glu Gln Thr Thr Glu Trp Thr Ala Cys Ser Lys Ser Cys Gly
1 5 10 15 1 5 10 15
Met Gly Phe Ser Thr Arg Val Thr Asn Arg Asn Arg Gln Cys Glu Met Met Gly Phe Ser Thr Arg Val Thr Asn Arg Asn Arg Gln Cys Glu Met
20 25 30 20 25 30
Leu Lys Gln Thr Arg Leu Cys Met Val Arg Pro Cys Glu Ala Ala Ala Leu Lys Gln Thr Arg Leu Cys Met Val Arg Pro Cys Glu Ala Ala Ala
35 40 45 35 40 45
Lys Glu Arg Lys Gln Gln Val Glu Gln Pro Pro Gln Pro Ala Pro Pro Lys Glu Arg Lys Gln Gln Val Glu Gln Pro Pro Gln Pro Ala Pro Pro
50 55 60 50 55 60
Val Ala Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Val Ala Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr
65 70 75 80 65 70 75 80
Leu Tyr Ile Thr Arg Glu Pro Glu Val Thr Cys Val Val Val Asp Val Leu Tyr Ile Thr Arg Glu Pro Glu Val Thr Cys Val Val Val Asp Val
85 90 95 85 90 95
Ser Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Ser Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val
100 105 110 100 105 110
Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser
115 120 125 115 120 125
Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu
130 135 140 130 135 140
Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser
145 150 155 160 145 150 155 160
Ser Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Ser Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro
165 170 175 165 170 175
Gln Val Tyr Thr Phe Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Gln Val Tyr Thr Phe Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln
180 185 190 180 185 190
Val Ser Leu Arg Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Ser Leu Arg Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala
195 200 205 195 200 205
Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr
210 215 220 210 215 220
Lys Pro Val Leu Asp Ser Asp Gly Ser Phe Arg Leu Glu Ser Arg Leu Lys Pro Val Leu Asp Ser Asp Gly Ser Phe Arg Leu Glu Ser Arg Leu
225 230 235 240 225 230 235 240
Thr Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Thr Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser
245 250 255 245 250 255
Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser
260 265 270 260 265 270
Leu Ser Leu Gly Leu Ser Leu Gly
275 275
<210> 85<210> 85
<211> 294<211> 294
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 85<400> 85
Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala
1 5 10 15 1 5 10 15
Tyr Ser Cys Ala Glu Gln Thr Thr Glu Trp Thr Ala Cys Ser Lys Ser Tyr Ser Cys Ala Glu Gln Thr Thr Glu Trp Thr Ala Cys Ser Lys Ser
20 25 30 20 25 30
Cys Gly Met Gly Phe Ser Thr Arg Val Thr Asn Arg Asn Arg Gln Cys Cys Gly Met Gly Phe Ser Thr Arg Val Thr Asn Arg Asn Arg Gln Cys
35 40 45 35 40 45
Glu Met Leu Lys Gln Thr Arg Leu Cys Met Val Arg Pro Cys Glu Ala Glu Met Leu Lys Gln Thr Arg Leu Cys Met Val Arg Pro Cys Glu Ala
50 55 60 50 55 60
Ala Ala Lys Glu Arg Lys Gln Gln Val Glu Gln Pro Pro Gln Pro Ala Ala Ala Lys Glu Arg Lys Gln Gln Val Glu Gln Pro Pro Gln Pro Ala
65 70 75 80 65 70 75 80
Pro Pro Val Ala Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Pro Pro Val Ala Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys
85 90 95 85 90 95
Asp Thr Leu Tyr Ile Thr Arg Glu Pro Glu Val Thr Cys Val Val Val Asp Thr Leu Tyr Ile Thr Arg Glu Pro Glu Val Thr Cys Val Val Val
100 105 110 100 105 110
Asp Val Ser Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Asp Val Ser Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp
115 120 125 115 120 125
Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe
130 135 140 130 135 140
Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp
145 150 155 160 145 150 155 160
Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu
165 170 175 165 170 175
Pro Ser Ser Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Pro Ser Ser Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg
180 185 190 180 185 190
Glu Pro Gln Val Tyr Thr Phe Pro Pro Ser Gln Glu Glu Met Thr Lys Glu Pro Gln Val Tyr Thr Phe Pro Pro Ser Gln Glu Glu Met Thr Lys
195 200 205 195 200 205
Asn Gln Val Ser Leu Arg Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Asn Gln Val Ser Leu Arg Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp
210 215 220 210 215 220
Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys
225 230 235 240 225 230 235 240
Thr Thr Lys Pro Val Leu Asp Ser Asp Gly Ser Phe Arg Leu Glu Ser Thr Thr Lys Pro Val Leu Asp Ser Asp Gly Ser Phe Arg Leu Glu Ser
245 250 255 245 250 255
Arg Leu Thr Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Arg Leu Thr Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser
260 265 270 260 265 270
Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser
275 280 285 275 280 285
Leu Ser Leu Ser Leu Gly Leu Ser Leu Ser Leu Gly
290 290
<210> 86<210> 86
<211> 891<211> 891
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 86<400> 86
gccaccatga aatgggtcac ctttatctcc ctgctgttcc tgttctcctc cgcctactct 60gccaccatga aatgggtcac ctttatctcc ctgctgttcc tgttctcctc cgcctactct 60
tgtgccgagc agaccacaga gtggaccgcc tgctctaagt cttgcggcat gggcttctcc 120tgtgccgagc agaccacaga gtggaccgcc tgctctaagt cttgcggcat gggcttctcc 120
accagagtga ccaaccggaa cagacagtgc gagatgctga agcagacccg gctgtgtatg 180accagagtga ccaaccggaa cagacagtgc gagatgctga agcagacccg gctgtgtatg 180
gttcgacctt gcgaggccgc tgccaaagaa agaaagcagc aggtcgagca gcctcctcag 240gttcgacctt gcgaggccgc tgccaaagaa agaaagcagc aggtcgagca gcctcctcag 240
cctgctcctc ctgttgctgg cccttccgtg tttctgttcc ctccaaagcc taaggacacc 300cctgctcctc ctgttgctgg cccttccgtg tttctgttcc ctccaaagcc taaggacacc 300
ctgtacatca cccgcgagcc tgaagtgacc tgcgtggtgg tggatgtgtc ccaagaggat 360ctgtacatca cccgcgagcc tgaagtgacc tgcgtggtgg tggatgtgtc ccaagaggat 360
cccgaggtgc agttcaattg gtacgtggac ggcgtggaag tgcacaacgc caagaccaag 420cccgaggtgc agttcaattg gtacgtggac ggcgtggaag tgcacaacgc caagaccaag 420
cctagagagg aacagttcaa ctccacctac agagtggtgt ccgtgctgac cgtgctgcac 480cctagagagg aacagttcaa ctccacctac agagtggtgt ccgtgctgac cgtgctgcac 480
caggattggc tgaacggcaa agagtacaag tgcaaggtgt ccaacaaggg cctgccttcc 540caggattggc tgaacggcaa agagtacaag tgcaaggtgt ccaacaaggg cctgccttcc 540
agcatcgaaa agaccatctc caaggccaag ggacagccca gagaacccca ggtgtacaca 600agcatcgaaa agaccatctc caaggccaag ggacagccca gagaacccca ggtgtacaca 600
ttccctccat ctcaagagga aatgaccaag aaccaggtgt ccctgcggtg cctggtcaag 660ttccctccat ctcaagagga aatgaccaag aaccaggtgt ccctgcggtg cctggtcaag 660
ggcttctacc cttctgatat cgccgtggaa tgggagtcca acggccagcc tgagaacaac 720ggcttctacc cttctgatat cgccgtggaa tgggagtcca acggccagcc tgagaacaac 720
tacaagacca ccaagcctgt gctggactcc gacggctcct tccggcttga atctagactg 780tacaagacca ccaagcctgt gctggactcc gacggctcct tccggcttga atctagactg 780
accgtggaca agtcccggtg gcaagagggc aacgtgttct cctgctctgt gatgcacgag 840accgtggaca agtcccggtg gcaagagggc aacgtgttct cctgctctgt gatgcacgag 840
gccctgcaca accactacac ccagaagtcc ctgtctctgt ccctgggcta a 891gccctgcaca accactacac ccagaagtcc ctgtctctgt ccctgggcta a 891
<210> 87<210> 87
<211> 964<211> 964
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 87<400> 87
ggggacaagt ttgtacaaaa aagcaggcta tggtaccgcc accatgaaat gggtcacctt 60ggggacaagt ttgtacaaaa aagcaggcta tggtaccgcc accatgaaat gggtcacctt 60
tatctccctg ctgttcctgt tctcctccgc ctactcttgt gccgagcaga ccacagagtg 120tatctccctg ctgttcctgt tctcctccgc ctactcttgt gccgagcaga ccacagagtg 120
gaccgcctgc tctaagtctt gcggcatggg cttctccacc agagtgacca accggaacag 180gaccgcctgc tctaagtctt gcggcatggg cttctccacc agagtgacca accggaacag 180
acagtgcgag atgctgaagc agacccggct gtgtatggtt cgaccttgcg aggccgctgc 240acagtgcgag atgctgaagc agacccggct gtgtatggtt cgaccttgcg aggccgctgc 240
caaagaaaga aagcagcagg tcgagcagcc tcctcagcct gctcctcctg ttgctggccc 300caaagaaaga aagcagcagg tcgagcagcc tcctcagcct gctcctcctg ttgctggccc 300
ttccgtgttt ctgttccctc caaagcctaa ggacaccctg tacatcaccc gcgagcctga 360ttccgtgttt ctgttccctc caaagcctaa ggacaccctg tacatcaccc gcgagcctga 360
agtgacctgc gtggtggtgg atgtgtccca agaggatccc gaggtgcagt tcaattggta 420agtgacctgc gtggtggtgg atgtgtccca agaggatccc gaggtgcagt tcaattggta 420
cgtggacggc gtggaagtgc acaacgccaa gaccaagcct agagaggaac agttcaactc 480cgtggacggc gtggaagtgc acaacgccaa gaccaagcct agagaggaac agttcaactc 480
cacctacaga gtggtgtccg tgctgaccgt gctgcaccag gattggctga acggcaaaga 540cacctacaga gtggtgtccg tgctgaccgt gctgcaccag gattggctga acggcaaaga 540
gtacaagtgc aaggtgtcca acaagggcct gccttccagc atcgaaaaga ccatctccaa 600gtacaagtgc aaggtgtcca acaagggcct gccttccagc atcgaaaaga ccatctccaa 600
ggccaaggga cagcccagag aaccccaggt gtacacattc cctccatctc aagaggaaat 660ggccaaggga cagcccagag aaccccaggt gtacacattc cctccatctc aagaggaaat 660
gaccaagaac caggtgtccc tgcggtgcct ggtcaagggc ttctaccctt ctgatatcgc 720gaccaagaac caggtgtccc tgcggtgcct ggtcaagggc ttctaccctt ctgatatcgc 720
cgtggaatgg gagtccaacg gccagcctga gaacaactac aagaccacca agcctgtgct 780cgtggaatgg gagtccaacg gccagcctga gaacaactac aagaccacca agcctgtgct 780
ggactccgac ggctccttcc ggcttgaatc tagactgacc gtggacaagt cccggtggca 840ggactccgac ggctccttcc ggcttgaatc tagactgacc gtggacaagt cccggtggca 840
agagggcaac gtgttctcct gctctgtgat gcacgaggcc ctgcacaacc actacaccca 900agagggcaac gtgttctcct gctctgtgat gcacgaggcc ctgcacaacc actacaccca 900
gaagtccctg tctctgtccc tgggctaatc tagaaaccca gctttcttgt acaaagtggt 960gaagtccctg tctctgtccc tgggctaatc tagaaaccca gctttcttgt acaaagtggt 960
cccc 964cccc 964
<210> 88<210> 88
<211> 281<211> 281
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 88<400> 88
Cys Ala Glu Gln Thr Thr Glu Trp Thr Ala Cys Ser Lys Ser Cys Gly Cys Ala Glu Gln Thr Thr Glu Trp Thr Ala Cys Ser Lys Ser Cys Gly
1 5 10 15 1 5 10 15
Met Gly Phe Ser Thr Arg Val Thr Asn Arg Asn Arg Gln Cys Glu Met Met Gly Phe Ser Thr Arg Val Thr Asn Arg Asn Arg Gln Cys Glu Met
20 25 30 20 25 30
Leu Lys Gln Thr Arg Leu Cys Met Val Arg Pro Cys Glu Ala Ala Ala Leu Lys Gln Thr Arg Leu Cys Met Val Arg Pro Cys Glu Ala Ala Ala
35 40 45 35 40 45
Lys Glu Pro Lys Ser Gln Asp Lys Thr His Thr Gln Pro Pro Gln Pro Lys Glu Pro Lys Ser Gln Asp Lys Thr His Thr Gln Pro Pro Gln Pro
50 55 60 50 55 60
Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys
65 70 75 80 65 70 75 80
Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val
85 90 95 85 90 95
Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr
100 105 110 100 105 110
Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Cys Glu Glu Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Cys Glu Glu
115 120 125 115 120 125
Gln Tyr Gly Ser Thr Tyr Arg Cys Val Ser Val Leu Thr Val Leu His Gln Tyr Gly Ser Thr Tyr Arg Cys Val Ser Val Leu Thr Val Leu His
130 135 140 130 135 140
Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys
145 150 155 160 145 150 155 160
Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln
165 170 175 165 170 175
Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu
180 185 190 180 185 190
Thr Lys Asn Gln Val Ser Leu Arg Cys His Val Lys Gly Phe Tyr Pro Thr Lys Asn Gln Val Ser Leu Arg Cys His Val Lys Gly Phe Tyr Pro
195 200 205 195 200 205
Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn
210 215 220 210 215 220
Tyr Lys Thr Thr Lys Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Lys Thr Thr Lys Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu
225 230 235 240 225 230 235 240
Tyr Ser Thr Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Tyr Ser Thr Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val
245 250 255 245 250 255
Phe Ser Cys Ser Val Leu His Glu Ala Leu His Asn His Tyr Thr Gln Phe Ser Cys Ser Val Leu His Glu Ala Leu His Asn His Tyr Thr Gln
260 265 270 260 265 270
Lys Ser Leu Ser Leu Ser Pro Gly Lys Lys Ser Leu Ser Leu Ser Pro Gly Lys
275 280 275 280
<210> 89<210> 89
<211> 299<211> 299
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 89<400> 89
Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala
1 5 10 15 1 5 10 15
Tyr Ser Cys Ala Glu Gln Thr Thr Glu Trp Thr Ala Cys Ser Lys Ser Tyr Ser Cys Ala Glu Gln Thr Thr Glu Trp Thr Ala Cys Ser Lys Ser
20 25 30 20 25 30
Cys Gly Met Gly Phe Ser Thr Arg Val Thr Asn Arg Asn Arg Gln Cys Cys Gly Met Gly Phe Ser Thr Arg Val Thr Asn Arg Asn Arg Gln Cys
35 40 45 35 40 45
Glu Met Leu Lys Gln Thr Arg Leu Cys Met Val Arg Pro Cys Glu Ala Glu Met Leu Lys Gln Thr Arg Leu Cys Met Val Arg Pro Cys Glu Ala
50 55 60 50 55 60
Ala Ala Lys Glu Pro Lys Ser Gln Asp Lys Thr His Thr Gln Pro Pro Ala Ala Lys Glu Pro Lys Ser Gln Asp Lys Thr His Thr Gln Pro Pro
65 70 75 80 65 70 75 80
Gln Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Gln Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro
85 90 95 85 90 95
Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr
100 105 110 100 105 110
Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn
115 120 125 115 120 125
Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Cys Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Cys
130 135 140 130 135 140
Glu Glu Gln Tyr Gly Ser Thr Tyr Arg Cys Val Ser Val Leu Thr Val Glu Glu Gln Tyr Gly Ser Thr Tyr Arg Cys Val Ser Val Leu Thr Val
145 150 155 160 145 150 155 160
Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser
165 170 175 165 170 175
Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys
180 185 190 180 185 190
Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp
195 200 205 195 200 205
Glu Leu Thr Lys Asn Gln Val Ser Leu Arg Cys His Val Lys Gly Phe Glu Leu Thr Lys Asn Gln Val Ser Leu Arg Cys His Val Lys Gly Phe
210 215 220 210 215 220
Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu
225 230 235 240 225 230 235 240
Asn Asn Tyr Lys Thr Thr Lys Pro Val Leu Asp Ser Asp Gly Ser Phe Asn Asn Tyr Lys Thr Thr Lys Pro Val Leu Asp Ser Asp Gly Ser Phe
245 250 255 245 250 255
Phe Leu Tyr Ser Thr Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Phe Leu Tyr Ser Thr Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly
260 265 270 260 265 270
Asn Val Phe Ser Cys Ser Val Leu His Glu Ala Leu His Asn His Tyr Asn Val Phe Ser Cys Ser Val Leu His Glu Ala Leu His Asn His Tyr
275 280 285 275 280 285
Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
290 295 290 295
<210> 90<210> 90
<211> 906<211> 906
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 90<400> 90
gccaccatga aatgggtcac ctttatctcc ctgctgttcc tgttctcctc cgcctactct 60gccaccatga aatgggtcac ctttatctcc ctgctgttcc tgttctcctc cgcctactct 60
tgtgccgagc agaccacaga gtggaccgcc tgctctaagt cttgcggcat gggcttctcc 120tgtgccgagc agaccacaga gtggaccgcc tgctctaagt cttgcggcat gggcttctcc 120
accagagtga ccaaccggaa cagacagtgc gagatgctga agcagacccg gctgtgtatg 180accagagtga ccaaccggaa cagacagtgc gagatgctga agcagacccg gctgtgtatg 180
gttcgacctt gcgaggccgc tgccaaagag cctaagagcc aggacaagac ccacacacag 240gttcgacctt gcgaggccgc tgccaaagag cctaagagcc aggacaagac ccacacacag 240
cctccacagc ctgctccaga attgctcgga ggcccttccg tgtttctgtt ccctccaaag 300cctccacagc ctgctccaga attgctcgga ggcccttccg tgtttctgtt ccctccaaag 300
cctaaggaca ccctgatgat ctctcggacc cctgaagtga cctgcgtggt ggtggatgtg 360cctaaggaca ccctgatgat ctctcggacc cctgaagtga cctgcgtggt ggtggatgtg 360
tctcacgagg atcccgaagt gaagttcaat tggtacgtgg acggcgtgga agtgcacaac 420tctcacgagg atcccgaagt gaagttcaat tggtacgtgg acggcgtgga agtgcacaac 420
gccaagacaa agccctgcga ggaacagtac ggctccacct acagatgcgt gtccgtgctg 480gccaagacaa agccctgcga ggaacagtac ggctccacct acagatgcgt gtccgtgctg 480
acagtgctgc accaggattg gctgaacggc aaagagtaca agtgcaaggt gtccaacaag 540acagtgctgc accaggattg gctgaacggc aaagagtaca agtgcaaggt gtccaacaag 540
gccctgcctg ctcctatcga aaagaccatc tccaaggcca agggccagcc tagagaaccc 600gccctgcctg ctcctatcga aaagaccatc tccaaggcca agggccagcc tagagaaccc 600
caggtgtaca cactgccacc ttctagggac gagctgacca agaaccaggt gtccctgaga 660caggtgtaca cactgccacc ttctagggac gagctgacca agaaccaggt gtccctgaga 660
tgccacgtga agggcttcta cccctccgat atcgccgtgg aatgggagtc taatggacag 720tgccacgtga agggcttcta cccctccgat atcgccgtgg aatgggagtc taatggacag 720
cccgagaaca actacaagac caccaagcct gtgctggact ccgacggctc cttcttcctg 780cccgagaaca actacaagac caccaagcct gtgctggact ccgacggctc cttcttcctg 780
tactctaccc tgaccgtgga caagtccaga tggcagcagg gcaacgtgtt ctcctgctct 840tactctaccc tgaccgtgga caagtccaga tggcagcagg gcaacgtgtt ctcctgctct 840
gtgctgcacg aggccctgca caatcactac acccagaagt ccctgtctct gtcccctggc 900gtgctgcacg aggccctgca caatcactac acccagaagt ccctgtctct gtcccctggc 900
aagtga 906aagtga 906
<210> 91<210> 91
<211> 979<211> 979
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 91<400> 91
ggggacaagt ttgtacaaaa aagcaggcta tggtaccgcc accatgaaat gggtcacctt 60ggggacaagt ttgtacaaaa aagcaggcta tggtaccgcc accatgaaat gggtcacctt 60
tatctccctg ctgttcctgt tctcctccgc ctactcttgt gccgagcaga ccacagagtg 120tatctccctg ctgttcctgt tctcctccgc ctactcttgt gccgagcaga ccacagagtg 120
gaccgcctgc tctaagtctt gcggcatggg cttctccacc agagtgacca accggaacag 180gaccgcctgc tctaagtctt gcggcatggg cttctccacc agagtgacca accggaacag 180
acagtgcgag atgctgaagc agacccggct gtgtatggtt cgaccttgcg aggccgctgc 240acagtgcgag atgctgaagc agacccggct gtgtatggtt cgaccttgcg aggccgctgc 240
caaagagcct aagagccagg acaagaccca cacacagcct ccacagcctg ctccagaatt 300caaagagcct aagagccagg acaagacca cacacagcct ccacagcctg ctccagaatt 300
gctcggaggc ccttccgtgt ttctgttccc tccaaagcct aaggacaccc tgatgatctc 360gctcggaggc ccttccgtgt ttctgttccc tccaaagcct aaggacaccc tgatgatctc 360
tcggacccct gaagtgacct gcgtggtggt ggatgtgtct cacgaggatc ccgaagtgaa 420tcggacccct gaagtgacct gcgtggtggt ggatgtgtct cacgaggatc ccgaagtgaa 420
gttcaattgg tacgtggacg gcgtggaagt gcacaacgcc aagacaaagc cctgcgagga 480gttcaattgg tacgtggacg gcgtggaagt gcacaacgcc aagacaaagc cctgcgagga 480
acagtacggc tccacctaca gatgcgtgtc cgtgctgaca gtgctgcacc aggattggct 540acagtacggc tccacctaca gatgcgtgtc cgtgctgaca gtgctgcacc aggattggct 540
gaacggcaaa gagtacaagt gcaaggtgtc caacaaggcc ctgcctgctc ctatcgaaaa 600gaacggcaaa gagtacaagt gcaaggtgtc caacaaggcc ctgcctgctc ctatcgaaaa 600
gaccatctcc aaggccaagg gccagcctag agaaccccag gtgtacacac tgccaccttc 660gaccatctcc aaggccaagg gccagcctag agaaccccag gtgtacacac tgccaccttc 660
tagggacgag ctgaccaaga accaggtgtc cctgagatgc cacgtgaagg gcttctaccc 720tagggacgag ctgaccaaga accaggtgtc cctgagatgc cacgtgaagg gcttctaccc 720
ctccgatatc gccgtggaat gggagtctaa tggacagccc gagaacaact acaagaccac 780ctccgatatc gccgtggaat gggagtctaa tggacagccc gagaacaact acaagaccac 780
caagcctgtg ctggactccg acggctcctt cttcctgtac tctaccctga ccgtggacaa 840caagcctgtg ctggactccg acggctcctt cttcctgtac tctaccctga ccgtggacaa 840
gtccagatgg cagcagggca acgtgttctc ctgctctgtg ctgcacgagg ccctgcacaa 900gtccagatgg cagcagggca acgtgttctc ctgctctgtg ctgcacgagg ccctgcacaa 900
tcactacacc cagaagtccc tgtctctgtc ccctggcaag tgatctagaa acccagcttt 960tcactacacc cagaagtccc tgtctctgtc ccctggcaag tgatctagaa acccagcttt 960
cttgtacaaa gtggtcccc 979cttgtacaaa gtggtcccc 979
<210> 92<210> 92
<211> 402<211> 402
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитая метка<223> Merged Label
<400> 92<400> 92
Gly His His His His His His Gly Ser Glu Ile Gly Thr Gly Phe Pro Gly His His His His His Gly Ser Glu Ile Gly Thr Gly Phe Pro
1 5 10 15 1 5 10 15
Phe Asp Pro His Tyr Val Glu Val Leu Gly Glu Arg Met His Tyr Val Phe Asp Pro His Tyr Val Glu Val Leu Gly Glu Arg Met His Tyr Val
20 25 30 20 25 30
Asp Val Gly Pro Arg Asp Gly Thr Pro Val Leu Phe Leu His Gly Asn Asp Val Gly Pro Arg Asp Gly Thr Pro Val Leu Phe Leu His Gly Asn
35 40 45 35 40 45
Pro Thr Ser Ser Tyr Val Trp Arg Asn Ile Ile Pro His Val Ala Pro Pro Thr Ser Ser Tyr Val Trp Arg Asn Ile Ile Pro His Val Ala Pro
50 55 60 50 55 60
Thr His Arg Cys Ile Ala Pro Asp Leu Ile Gly Met Gly Lys Ser Asp Thr His Arg Cys Ile Ala Pro Asp Leu Ile Gly Met Gly Lys Ser Asp
65 70 75 80 65 70 75 80
Lys Pro Asp Leu Gly Tyr Phe Phe Asp Asp His Val Arg Phe Met Asp Lys Pro Asp Leu Gly Tyr Phe Phe Asp Asp His Val Arg Phe Met Asp
85 90 95 85 90 95
Ala Phe Ile Glu Ala Leu Gly Leu Glu Glu Val Val Leu Val Ile His Ala Phe Ile Glu Ala Leu Gly Leu Glu Glu Val Val Leu Val Ile His
100 105 110 100 105 110
Asp Trp Gly Ser Ala Leu Gly Phe His Trp Ala Lys Arg Asn Pro Glu Asp Trp Gly Ser Ala Leu Gly Phe His Trp Ala Lys Arg Asn Pro Glu
115 120 125 115 120 125
Arg Val Lys Gly Ile Ala Phe Met Glu Phe Ile Arg Pro Ile Pro Thr Arg Val Lys Gly Ile Ala Phe Met Glu Phe Ile Arg Pro Ile Pro Thr
130 135 140 130 135 140
Trp Asp Glu Trp Pro Glu Phe Ala Arg Glu Thr Phe Gln Ala Phe Arg Trp Asp Glu Trp Pro Glu Phe Ala Arg Glu Thr Phe Gln Ala Phe Arg
145 150 155 160 145 150 155 160
Thr Thr Asp Val Gly Arg Lys Leu Ile Ile Asp Gln Asn Val Phe Ile Thr Thr Asp Val Gly Arg Lys Leu Ile Ile Asp Gln Asn Val Phe Ile
165 170 175 165 170 175
Glu Gly Thr Leu Pro Met Gly Val Val Arg Pro Leu Thr Glu Val Glu Glu Gly Thr Leu Pro Met Gly Val Val Arg Pro Leu Thr Glu Val Glu
180 185 190 180 185 190
Met Asp His Tyr Arg Glu Pro Phe Leu Asn Pro Val Asp Arg Glu Pro Met Asp His Tyr Arg Glu Pro Phe Leu Asn Pro Val Asp Arg Glu Pro
195 200 205 195 200 205
Leu Trp Arg Phe Pro Asn Glu Leu Pro Ile Ala Gly Glu Pro Ala Asn Leu Trp Arg Phe Pro Asn Glu Leu Pro Ile Ala Gly Glu Pro Ala Asn
210 215 220 210 215 220
Ile Val Ala Leu Val Glu Glu Tyr Met Asp Trp Leu His Gln Ser Pro Ile Val Ala Leu Val Glu Glu Tyr Met Asp Trp Leu His Gln Ser Pro
225 230 235 240 225 230 235 240
Val Pro Lys Leu Leu Phe Trp Gly Thr Pro Gly Val Leu Ile Pro Pro Val Pro Lys Leu Leu Phe Trp Gly Thr Pro Gly Val Leu Ile Pro Pro
245 250 255 245 250 255
Ala Glu Ala Ala Arg Leu Ala Lys Ser Leu Pro Asn Cys Lys Ala Val Ala Glu Ala Ala Arg Leu Ala Lys Ser Leu Pro Asn Cys Lys Ala Val
260 265 270 260 265 270
Asp Ile Gly Pro Gly Leu Asn Leu Leu Gln Glu Asp Asn Pro Asp Leu Asp Ile Gly Pro Gly Leu Asn Leu Leu Gln Glu Asp Asn Pro Asp Leu
275 280 285 275 280 285
Ile Gly Ser Glu Ile Ala Arg Trp Leu Ser Thr Leu Glu Ile Ser Gly Ile Gly Ser Glu Ile Ala Arg Trp Leu Ser Thr Leu Glu Ile Ser Gly
290 295 300 290 295 300
Leu Gln Asp Ser Glu Val Asn Gln Glu Ala Lys Pro Glu Val Lys Pro Leu Gln Asp Ser Glu Val Asn Gln Glu Ala Lys Pro Glu Val Lys Pro
305 310 315 320 305 310 315 320
Glu Val Lys Pro Glu Thr His Ile Asn Leu Lys Val Ser Asp Gly Ser Glu Val Lys Pro Glu Thr His Ile Asn Leu Lys Val Ser Asp Gly Ser
325 330 335 325 330 335
Ser Glu Ile Phe Phe Lys Ile Lys Lys Thr Thr Pro Leu Arg Arg Leu Ser Glu Ile Phe Phe Lys Ile Lys Lys Thr Thr Pro Leu Arg Arg Leu
340 345 350 340 345 350
Met Glu Ala Phe Ala Lys Arg Gln Gly Lys Glu Met Asp Ser Leu Thr Met Glu Ala Phe Ala Lys Arg Gln Gly Lys Glu Met Asp Ser Leu Thr
355 360 365 355 360 365
Phe Leu Tyr Asp Gly Ile Glu Ile Gln Ala Asp Gln Thr Pro Glu Asp Phe Leu Tyr Asp Gly Ile Glu Ile Gln Ala Asp Gln Thr Pro Glu Asp
370 375 380 370 375 380
Leu Asp Met Glu Asp Asn Asp Ile Ile Glu Ala His Arg Glu Gln Ile Leu Asp Met Glu Asp Asn Asp Ile Ile Glu Ala His Arg Glu Gln Ile
385 390 395 400 385 390 395 400
Gly Gly Gly Gly
<210> 93<210> 93
<211> 20<211> 20
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Линкер<223> Linker
<400> 93<400> 93
Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Ser Gly Gly
1 5 10 15 1 5 10 15
Gly Ser Ser Gly Gly Ser Ser Gly
20 20
<210> 94<210> 94
<211> 466<211> 466
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 94<400> 94
Gly His His His His His His Gly Ser Glu Ile Gly Thr Gly Phe Pro Gly His His His His His Gly Ser Glu Ile Gly Thr Gly Phe Pro
1 5 10 15 1 5 10 15
Phe Asp Pro His Tyr Val Glu Val Leu Gly Glu Arg Met His Tyr Val Phe Asp Pro His Tyr Val Glu Val Leu Gly Glu Arg Met His Tyr Val
20 25 30 20 25 30
Asp Val Gly Pro Arg Asp Gly Thr Pro Val Leu Phe Leu His Gly Asn Asp Val Gly Pro Arg Asp Gly Thr Pro Val Leu Phe Leu His Gly Asn
35 40 45 35 40 45
Pro Thr Ser Ser Tyr Val Trp Arg Asn Ile Ile Pro His Val Ala Pro Pro Thr Ser Ser Tyr Val Trp Arg Asn Ile Ile Pro His Val Ala Pro
50 55 60 50 55 60
Thr His Arg Cys Ile Ala Pro Asp Leu Ile Gly Met Gly Lys Ser Asp Thr His Arg Cys Ile Ala Pro Asp Leu Ile Gly Met Gly Lys Ser Asp
65 70 75 80 65 70 75 80
Lys Pro Asp Leu Gly Tyr Phe Phe Asp Asp His Val Arg Phe Met Asp Lys Pro Asp Leu Gly Tyr Phe Phe Asp Asp His Val Arg Phe Met Asp
85 90 95 85 90 95
Ala Phe Ile Glu Ala Leu Gly Leu Glu Glu Val Val Leu Val Ile His Ala Phe Ile Glu Ala Leu Gly Leu Glu Glu Val Val Leu Val Ile His
100 105 110 100 105 110
Asp Trp Gly Ser Ala Leu Gly Phe His Trp Ala Lys Arg Asn Pro Glu Asp Trp Gly Ser Ala Leu Gly Phe His Trp Ala Lys Arg Asn Pro Glu
115 120 125 115 120 125
Arg Val Lys Gly Ile Ala Phe Met Glu Phe Ile Arg Pro Ile Pro Thr Arg Val Lys Gly Ile Ala Phe Met Glu Phe Ile Arg Pro Ile Pro Thr
130 135 140 130 135 140
Trp Asp Glu Trp Pro Glu Phe Ala Arg Glu Thr Phe Gln Ala Phe Arg Trp Asp Glu Trp Pro Glu Phe Ala Arg Glu Thr Phe Gln Ala Phe Arg
145 150 155 160 145 150 155 160
Thr Thr Asp Val Gly Arg Lys Leu Ile Ile Asp Gln Asn Val Phe Ile Thr Thr Asp Val Gly Arg Lys Leu Ile Ile Asp Gln Asn Val Phe Ile
165 170 175 165 170 175
Glu Gly Thr Leu Pro Met Gly Val Val Arg Pro Leu Thr Glu Val Glu Glu Gly Thr Leu Pro Met Gly Val Val Arg Pro Leu Thr Glu Val Glu
180 185 190 180 185 190
Met Asp His Tyr Arg Glu Pro Phe Leu Asn Pro Val Asp Arg Glu Pro Met Asp His Tyr Arg Glu Pro Phe Leu Asn Pro Val Asp Arg Glu Pro
195 200 205 195 200 205
Leu Trp Arg Phe Pro Asn Glu Leu Pro Ile Ala Gly Glu Pro Ala Asn Leu Trp Arg Phe Pro Asn Glu Leu Pro Ile Ala Gly Glu Pro Ala Asn
210 215 220 210 215 220
Ile Val Ala Leu Val Glu Glu Tyr Met Asp Trp Leu His Gln Ser Pro Ile Val Ala Leu Val Glu Glu Tyr Met Asp Trp Leu His Gln Ser Pro
225 230 235 240 225 230 235 240
Val Pro Lys Leu Leu Phe Trp Gly Thr Pro Gly Val Leu Ile Pro Pro Val Pro Lys Leu Leu Phe Trp Gly Thr Pro Gly Val Leu Ile Pro Pro
245 250 255 245 250 255
Ala Glu Ala Ala Arg Leu Ala Lys Ser Leu Pro Asn Cys Lys Ala Val Ala Glu Ala Ala Arg Leu Ala Lys Ser Leu Pro Asn Cys Lys Ala Val
260 265 270 260 265 270
Asp Ile Gly Pro Gly Leu Asn Leu Leu Gln Glu Asp Asn Pro Asp Leu Asp Ile Gly Pro Gly Leu Asn Leu Leu Gln Glu Asp Asn Pro Asp Leu
275 280 285 275 280 285
Ile Gly Ser Glu Ile Ala Arg Trp Leu Ser Thr Leu Glu Ile Ser Gly Ile Gly Ser Glu Ile Ala Arg Trp Leu Ser Thr Leu Glu Ile Ser Gly
290 295 300 290 295 300
Leu Gln Asp Ser Glu Val Asn Gln Glu Ala Lys Pro Glu Val Lys Pro Leu Gln Asp Ser Glu Val Asn Gln Glu Ala Lys Pro Glu Val Lys Pro
305 310 315 320 305 310 315 320
Glu Val Lys Pro Glu Thr His Ile Asn Leu Lys Val Ser Asp Gly Ser Glu Val Lys Pro Glu Thr His Ile Asn Leu Lys Val Ser Asp Gly Ser
325 330 335 325 330 335
Ser Glu Ile Phe Phe Lys Ile Lys Lys Thr Thr Pro Leu Arg Arg Leu Ser Glu Ile Phe Phe Lys Ile Lys Lys Thr Thr Pro Leu Arg Arg Leu
340 345 350 340 345 350
Met Glu Ala Phe Ala Lys Arg Gln Gly Lys Glu Met Asp Ser Leu Thr Met Glu Ala Phe Ala Lys Arg Gln Gly Lys Glu Met Asp Ser Leu Thr
355 360 365 355 360 365
Phe Leu Tyr Asp Gly Ile Glu Ile Gln Ala Asp Gln Thr Pro Glu Asp Phe Leu Tyr Asp Gly Ile Glu Ile Gln Ala Asp Gln Thr Pro Glu Asp
370 375 380 370 375 380
Leu Asp Met Glu Asp Asn Asp Ile Ile Glu Ala His Arg Glu Gln Ile Leu Asp Met Glu Asp Asn Asp Ile Ile Glu Ala His Arg Glu Gln Ile
385 390 395 400 385 390 395 400
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Ser
405 410 415 405 410 415
Gly Gly Gly Ser Ser Gly Cys Ala Glu Gln Thr Thr Glu Trp Thr Ala Gly Gly Gly Ser Ser Gly Cys Ala Glu Gln Thr Thr Glu Trp Thr Ala
420 425 430 420 425 430
Cys Ser Lys Ser Cys Gly Met Gly Phe Ser Thr Arg Val Thr Asn Arg Cys Ser Lys Ser Cys Gly Met Gly Phe Ser Thr Arg Val Thr Asn Arg
435 440 445 435 440 445
Asn Arg Gln Cys Glu Met Leu Lys Gln Thr Arg Leu Cys Met Val Arg Asn Arg Gln Cys Glu Met Leu Lys Gln Thr Arg Leu Cys Met Val Arg
450 455 460 450 455 460
Pro Cys Pro Cys
465 465
<210> 95<210> 95
<211> 1461<211> 1461
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 95<400> 95
gccaccatga aatgggtcac ctttatctcc ctgctgttcc tgttctcctc cgcctactct 60gccaccatga aatgggtcac ctttatctcc ctgctgttcc tgttctcctc cgcctactct 60
ggccaccacc atcaccatca cggctccgag atcggaaccg gctttccttt cgaccctcac 120ggccaccacc atcaccatca cggctccgag atcggaaccg gctttccttt cgaccctcac 120
tacgtggaag tgctgggcga gagaatgcac tatgtggacg tgggccccag agatggaacc 180tacgtggaag tgctgggcga gagaatgcac tatgtggacg tgggccccag agatggaacc 180
cctgtgctgt ttctgcacgg caaccctacc tccagctacg tgtggcggaa catcatccct 240cctgtgctgt ttctgcacgg caaccctacc tccagctacg tgtggcggaa catcatccct 240
cacgtggccc ctacacacag atgtatcgcc cctgacctga tcggcatggg caagtctgac 300cacgtggccc ctacacacag atgtatcgcc cctgacctga tcggcatggg caagtctgac 300
aagcctgacc tgggctactt cttcgacgac cacgtgcggt tcatggacgc ctttatcgag 360aagcctgacc tgggctactt cttcgacgac cacgtgcggt tcatggacgc ctttatcgag 360
gctctgggcc tcgaagaggt ggtgctggtc atccatgatt ggggctctgc cctgggcttt 420gctctgggcc tcgaagaggt ggtgctggtc atccatgatt ggggctctgc cctgggcttt 420
cactgggcca agagaaaccc cgagagagtg aagggaatcg ccttcatgga attcatccgg 480cactgggcca agagaaaccc cgagagagtg aagggaatcg ccttcatgga attcatccgg 480
cctattccta cctgggacga gtggcctgag ttcgccagag agacattcca ggccttcaga 540cctattccta cctgggacga gtggcctgag ttcgccagag agacattcca ggccttcaga 540
accaccgacg tgggcagaaa gctgatcatc gaccagaacg tgttcatcga gggcaccctg 600accaccgacg tgggcagaaa gctgatcatc gaccagaacg tgttcatcga gggcaccctg 600
cctatgggag tcgtcagacc tctgaccgag gtggaaatgg accactacag agagcccttt 660cctatgggag tcgtcagacc tctgaccgag gtggaaatgg accactacag agagcccttt 660
ctgaaccccg tggaccggga acctctttgg agattcccta acgagctgcc tatcgctggc 720ctgaaccccg tggaccggga acctctttgg agattcccta acgagctgcc tatcgctggc 720
gagcctgcca atattgtggc cctggtggaa gagtacatgg actggctgca tcagagcccc 780gagcctgcca atattgtggc cctggtggaa gagtacatgg actggctgca tcagagcccc 780
gtgcctaagc tgctgttttg gggaacaccc ggcgtgctga ttcctcctgc tgaagctgct 840gtgcctaagc tgctgttttg gggaacaccc ggcgtgctga ttcctcctgc tgaagctgct 840
agactggcca agagcctgcc taactgcaag gccgtggata tcggccctgg cctgaatctg 900agactggcca agagcctgcc taactgcaag gccgtggata tcggccctgg cctgaatctg 900
ctgcaagagg acaaccccga tctgatcgga tctgagatcg cccggtggct gagcaccctg 960ctgcaagagg acaaccccga tctgatcgga tctgagatcg cccggtggct gagcaccctg 960
gaaatcagtg gactgcagga ctccgaagtg aatcaagagg ccaagcctga agtgaagccc 1020gaaatcagtg gactgcagga ctccgaagtg aatcaagagg ccaagcctga agtgaagccc 1020
gaagtcaagc ctgagacaca catcaacctg aaggtgtccg acggctccag cgagatcttc 1080gaagtcaagc ctgagacaca catcaacctg aaggtgtccg acggctccag cgagatcttc 1080
ttcaagatca agaaaaccac acctctgcgg cggctgatgg aagcctttgc caagagacag 1140ttcaagatca agaaaaccac acctctgcgg cggctgatgg aagcctttgc caagagacag 1140
ggcaaagaga tggactccct gaccttcctg tacgacggca tcgagatcca ggccgatcag 1200ggcaaagaga tggactccct gaccttcctg tacgacggca tcgagatcca ggccgatcag 1200
acccctgagg acctggacat ggaagataac gacatcattg aggcccacag agagcagatc 1260acccctgagg acctggacat ggaagataac gacatcattg aggcccacag agagcagatc 1260
ggcggctctg gtggtagcgg aggttctggt ggatctggtg gttcttctgg cggcggatct 1320ggcggctctg gtggtagcgg aggttctggt ggatctggtg gttcttctgg cggcggatct 1320
tctggctgtg ctgagcagac aaccgagtgg accgcctgct ctaagtcttg tggcatgggc 1380tctggctgtg ctgagcagac aaccgagtgg accgcctgct ctaagtcttg tggcatgggc 1380
ttctccacca gagtgaccaa ccggaacaga cagtgcgaga tgctgaagca gacccggctg 1440ttctccacca gagtgaccaa ccggaacaga cagtgcgaga tgctgaagca gacccggctg 1440
tgtatggtcc gaccttgcta a 1461tgtatggtcc gaccttgcta a 1461
<210> 96<210> 96
<211> 1552<211> 1552
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 96<400> 96
ggggacaagt ttgtacaaaa aagcaggcta taagcttgct gccaccatga aatgggtcac 60ggggacaagt ttgtacaaaa aagcaggcta taagcttgct gccaccatga aatgggtcac 60
ctttatctcc ctgctgttcc tgttctcctc cgcctactct ggccaccacc atcaccatca 120ctttatctcc ctgctgttcc tgttctcctc cgcctactct ggccaccacc atcaccatca 120
cggctccgag atcggaaccg gctttccttt cgaccctcac tacgtggaag tgctgggcga 180cggctccgag atcggaaccg gctttccttt cgaccctcac tacgtggaag tgctgggcga 180
gagaatgcac tatgtggacg tgggccccag agatggaacc cctgtgctgt ttctgcacgg 240gagaatgcac tatgtggacg tgggccccag agatggaacc cctgtgctgt ttctgcacgg 240
caaccctacc tccagctacg tgtggcggaa catcatccct cacgtggccc ctacacacag 300caaccctacc tccagctacg tgtggcggaa catcatccct cacgtggccc ctacacacag 300
atgtatcgcc cctgacctga tcggcatggg caagtctgac aagcctgacc tgggctactt 360atgtatcgcc cctgacctga tcggcatggg caagtctgac aagcctgacc tgggctactt 360
cttcgacgac cacgtgcggt tcatggacgc ctttatcgag gctctgggcc tcgaagaggt 420cttcgacgac cacgtgcggt tcatggacgc ctttatcgag gctctgggcc tcgaagaggt 420
ggtgctggtc atccatgatt ggggctctgc cctgggcttt cactgggcca agagaaaccc 480ggtgctggtc atccatgatt ggggctctgc cctgggcttt cactgggcca agagaaaccc 480
cgagagagtg aagggaatcg ccttcatgga attcatccgg cctattccta cctgggacga 540cgagagagtg aagggaatcg ccttcatgga attcatccgg cctattccta cctgggacga 540
gtggcctgag ttcgccagag agacattcca ggccttcaga accaccgacg tgggcagaaa 600gtggcctgag ttcgccagag agacattcca ggccttcaga accaccgacg tgggcagaaa 600
gctgatcatc gaccagaacg tgttcatcga gggcaccctg cctatgggag tcgtcagacc 660gctgatcatc gaccagaacg tgttcatcga gggcaccctg cctatgggag tcgtcagacc 660
tctgaccgag gtggaaatgg accactacag agagcccttt ctgaaccccg tggaccggga 720tctgaccgag gtggaaatgg accactacag agagcccttt ctgaaccccg tggaccggga 720
acctctttgg agattcccta acgagctgcc tatcgctggc gagcctgcca atattgtggc 780acctctttgg agattcccta acgagctgcc tatcgctggc gagcctgcca atattgtggc 780
cctggtggaa gagtacatgg actggctgca tcagagcccc gtgcctaagc tgctgttttg 840cctggtggaa gagtacatgg actggctgca tcagagcccc gtgcctaagc tgctgttttg 840
gggaacaccc ggcgtgctga ttcctcctgc tgaagctgct agactggcca agagcctgcc 900gggaacaccc ggcgtgctga ttcctcctgc tgaagctgct agactggcca agagcctgcc 900
taactgcaag gccgtggata tcggccctgg cctgaatctg ctgcaagagg acaaccccga 960taactgcaag gccgtggata tcggccctgg cctgaatctg ctgcaagagg acaaccccga 960
tctgatcgga tctgagatcg cccggtggct gagcaccctg gaaatcagtg gactgcagga 1020tctgatcgga tctgagatcg cccggtggct gagcaccctg gaaatcagtg gactgcagga 1020
ctccgaagtg aatcaagagg ccaagcctga agtgaagccc gaagtcaagc ctgagacaca 1080ctccgaagtg aatcaagagg ccaagcctga agtgaagccc gaagtcaagc ctgagacaca 1080
catcaacctg aaggtgtccg acggctccag cgagatcttc ttcaagatca agaaaaccac 1140catcaacctg aaggtgtccg acggctccag cgagatcttc ttcaagatca agaaaaccac 1140
acctctgcgg cggctgatgg aagcctttgc caagagacag ggcaaagaga tggactccct 1200acctctgcgg cggctgatgg aagcctttgc caagagacag ggcaaagaga tggactccct 1200
gaccttcctg tacgacggca tcgagatcca ggccgatcag acccctgagg acctggacat 1260gaccttcctg tacgacggca tcgagatcca ggccgatcag acccctgagg acctggacat 1260
ggaagataac gacatcattg aggcccacag agagcagatc ggcggctctg gtggtagcgg 1320ggaagataac gacatcattg aggcccacag agagcagatc ggcggctctg gtggtagcgg 1320
aggttctggt ggatctggtg gttcttctgg cggcggatct tctggctgtg ctgagcagac 1380aggttctggt ggatctggtg gttcttctgg cggcggatct tctggctgtg ctgagcagac 1380
aaccgagtgg accgcctgct ctaagtcttg tggcatgggc ttctccacca gagtgaccaa 1440aaccgagtgg accgcctgct ctaagtcttg tggcatgggc ttctccacca gagtgaccaa 1440
ccggaacaga cagtgcgaga tgctgaagca gacccggctg tgtatggtcc gaccttgcta 1500ccggaacaga cagtgcgaga tgctgaagca gacccggctg tgtatggtcc gaccttgcta 1500
aatctagagc ggccgcggta ccaacccagc tttcttgtac aaagtggtcc cc 1552aatctagagc ggccgcggta ccaacccagc tttcttgtac aaagtggtcc cc 1552
<210> 97<210> 97
<211> 634<211> 634
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 97<400> 97
Cys Ala Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr Cys Gly Cys Ala Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr Cys Gly
1 5 10 15 1 5 10 15
Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys Arg Leu Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys Arg Leu
20 25 30 20 25 30
Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Glu Ala Ala Ala Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Glu Ala Ala Ala
35 40 45 35 40 45
Lys Asp Ala His Lys Ser Glu Val Ala His Arg Phe Lys Asp Leu Gly Lys Asp Ala His Lys Ser Glu Val Ala His Arg Phe Lys Asp Leu Gly
50 55 60 50 55 60
Glu Glu Asn Phe Lys Ala Leu Val Leu Ile Ala Phe Ala Gln Tyr Leu Glu Glu Asn Phe Lys Ala Leu Val Leu Ile Ala Phe Ala Gln Tyr Leu
65 70 75 80 65 70 75 80
Gln Gln Cys Pro Phe Glu Asp His Val Lys Leu Val Asn Glu Val Thr Gln Gln Cys Pro Phe Glu Asp His Val Lys Leu Val Asn Glu Val Thr
85 90 95 85 90 95
Glu Phe Ala Lys Thr Cys Val Ala Asp Glu Ser Ala Glu Asn Cys Asp Glu Phe Ala Lys Thr Cys Val Ala Asp Glu Ser Ala Glu Asn Cys Asp
100 105 110 100 105 110
Lys Ser Leu His Thr Leu Phe Gly Asp Lys Leu Cys Thr Val Ala Thr Lys Ser Leu His Thr Leu Phe Gly Asp Lys Leu Cys Thr Val Ala Thr
115 120 125 115 120 125
Leu Arg Glu Thr Tyr Gly Glu Met Ala Asp Cys Cys Ala Lys Gln Glu Leu Arg Glu Thr Tyr Gly Glu Met Ala Asp Cys Cys Ala Lys Gln Glu
130 135 140 130 135 140
Pro Glu Arg Asn Glu Cys Phe Leu Gln His Lys Asp Asp Asn Pro Asn Pro Glu Arg Asn Glu Cys Phe Leu Gln His Lys Asp Asp Asn Pro Asn
145 150 155 160 145 150 155 160
Leu Pro Arg Leu Val Arg Pro Glu Val Asp Val Met Cys Thr Ala Phe Leu Pro Arg Leu Val Arg Pro Glu Val Asp Val Met Cys Thr Ala Phe
165 170 175 165 170 175
His Asp Asn Glu Glu Thr Phe Leu Lys Lys Tyr Leu Tyr Glu Ile Ala His Asp Asn Glu Glu Thr Phe Leu Lys Lys Tyr Leu Tyr Glu Ile Ala
180 185 190 180 185 190
Arg Arg His Pro Tyr Phe Tyr Ala Pro Glu Leu Leu Phe Phe Ala Lys Arg Arg His Pro Tyr Phe Tyr Ala Pro Glu Leu Leu Phe Phe Ala Lys
195 200 205 195 200 205
Arg Tyr Lys Ala Ala Phe Thr Glu Cys Cys Gln Ala Ala Asp Lys Ala Arg Tyr Lys Ala Ala Phe Thr Glu Cys Cys Gln Ala Ala Asp Lys Ala
210 215 220 210 215 220
Ala Cys Leu Leu Pro Lys Leu Asp Glu Leu Arg Asp Glu Gly Lys Ala Ala Cys Leu Leu Pro Lys Leu Asp Glu Leu Arg Asp Glu Gly Lys Ala
225 230 235 240 225 230 235 240
Ser Ser Ala Lys Gln Arg Leu Lys Cys Ala Ser Leu Gln Lys Phe Gly Ser Ser Ala Lys Gln Arg Leu Lys Cys Ala Ser Leu Gln Lys Phe Gly
245 250 255 245 250 255
Glu Arg Ala Phe Lys Ala Trp Ala Val Ala Arg Leu Ser Gln Arg Phe Glu Arg Ala Phe Lys Ala Trp Ala Val Ala Arg Leu Ser Gln Arg Phe
260 265 270 260 265 270
Pro Lys Ala Glu Phe Ala Glu Val Ser Lys Leu Val Thr Asp Leu Thr Pro Lys Ala Glu Phe Ala Glu Val Ser Lys Leu Val Thr Asp Leu Thr
275 280 285 275 280 285
Lys Val His Thr Glu Cys Cys His Gly Asp Leu Leu Glu Cys Ala Asp Lys Val His Thr Glu Cys Cys His Gly Asp Leu Leu Glu Cys Ala Asp
290 295 300 290 295 300
Asp Arg Ala Asp Leu Ala Lys Tyr Ile Cys Glu Asn Gln Asp Ser Ile Asp Arg Ala Asp Leu Ala Lys Tyr Ile Cys Glu Asn Gln Asp Ser Ile
305 310 315 320 305 310 315 320
Ser Ser Lys Leu Lys Glu Cys Cys Glu Lys Pro Leu Leu Glu Lys Ser Ser Ser Lys Leu Lys Glu Cys Cys Glu Lys Pro Leu Leu Glu Lys Ser
325 330 335 325 330 335
His Cys Ile Ala Glu Val Glu Asn Asp Glu Met Pro Ala Asp Leu Pro His Cys Ile Ala Glu Val Glu Asn Asp Glu Met Pro Ala Asp Leu Pro
340 345 350 340 345 350
Ser Leu Ala Ala Asp Phe Val Glu Ser Lys Asp Val Cys Lys Asn Tyr Ser Leu Ala Ala Asp Phe Val Glu Ser Lys Asp Val Cys Lys Asn Tyr
355 360 365 355 360 365
Ala Glu Ala Lys Asp Val Phe Leu Gly Met Phe Leu Tyr Glu Tyr Ala Ala Glu Ala Lys Asp Val Phe Leu Gly Met Phe Leu Tyr Glu Tyr Ala
370 375 380 370 375 380
Arg Arg His Pro Asp Tyr Ser Val Val Leu Leu Leu Arg Leu Ala Lys Arg Arg His Pro Asp Tyr Ser Val Val Leu Leu Leu Arg Leu Ala Lys
385 390 395 400 385 390 395 400
Thr Tyr Glu Thr Thr Leu Glu Lys Cys Cys Ala Ala Ala Asp Pro His Thr Tyr Glu Thr Thr Leu Glu Lys Cys Cys Ala Ala Ala Asp Pro His
405 410 415 405 410 415
Glu Cys Tyr Ala Lys Val Phe Asp Glu Phe Lys Pro Leu Val Glu Glu Glu Cys Tyr Ala Lys Val Phe Asp Glu Phe Lys Pro Leu Val Glu Glu
420 425 430 420 425 430
Pro Gln Asn Leu Ile Lys Gln Asn Cys Glu Leu Phe Glu Gln Leu Gly Pro Gln Asn Leu Ile Lys Gln Asn Cys Glu Leu Phe Glu Gln Leu Gly
435 440 445 435 440 445
Glu Tyr Lys Phe Gln Asn Ala Leu Leu Val Arg Tyr Thr Lys Lys Val Glu Tyr Lys Phe Gln Asn Ala Leu Leu Val Arg Tyr Thr Lys Lys Val
450 455 460 450 455 460
Pro Gln Val Ser Thr Pro Thr Leu Val Glu Val Ser Arg Asn Leu Gly Pro Gln Val Ser Thr Pro Thr Leu Val Glu Val Ser Arg Asn Leu Gly
465 470 475 480 465 470 475 480
Lys Val Gly Ser Lys Cys Cys Lys His Pro Glu Ala Lys Arg Met Pro Lys Val Gly Ser Lys Cys Cys Lys His Pro Glu Ala Lys Arg Met Pro
485 490 495 485 490 495
Cys Ala Glu Asp Tyr Leu Ser Val Val Leu Asn Gln Leu Cys Val Leu Cys Ala Glu Asp Tyr Leu Ser Val Val Leu Asn Gln Leu Cys Val Leu
500 505 510 500 505 510
His Glu Lys Thr Pro Val Ser Asp Arg Val Thr Lys Cys Cys Thr Glu His Glu Lys Thr Pro Val Ser Asp Arg Val Thr Lys Cys Cys Thr Glu
515 520 525 515 520 525
Ser Leu Val Asn Arg Arg Pro Cys Phe Ser Ala Leu Glu Val Asp Glu Ser Leu Val Asn Arg Arg Pro Cys Phe Ser Ala Leu Glu Val Asp Glu
530 535 540 530 535 540
Thr Tyr Val Pro Lys Glu Phe Asn Ala Glu Thr Phe Thr Phe His Ala Thr Tyr Val Pro Lys Glu Phe Asn Ala Glu Thr Phe Thr Phe His Ala
545 550 555 560 545 550 555 560
Asp Ile Cys Thr Leu Ser Glu Lys Glu Arg Gln Ile Lys Lys Gln Thr Asp Ile Cys Thr Leu Ser Glu Lys Glu Arg Gln Ile Lys Lys Gln Thr
565 570 575 565 570 575
Ala Leu Val Glu Leu Val Lys His Lys Pro Lys Ala Thr Lys Glu Gln Ala Leu Val Glu Leu Val Lys His Lys Pro Lys Ala Thr Lys Glu Gln
580 585 590 580 585 590
Leu Lys Ala Val Met Asp Asp Phe Ala Ala Phe Val Glu Lys Cys Cys Leu Lys Ala Val Met Asp Asp Phe Ala Ala Phe Val Glu Lys Cys Cys
595 600 605 595 600 605
Lys Ala Asp Asp Lys Glu Thr Cys Phe Ala Glu Glu Gly Lys Lys Leu Lys Ala Asp Asp Lys Glu Thr Cys Phe Ala Glu Glu Gly Lys Lys Leu
610 615 620 610 615 620
Val Ala Ala Ser Gln Ala Ala Leu Gly Leu Val Ala Ala Ser Gln Ala Ala Leu Gly Leu
625 630 625 630
<210> 98<210> 98
<211> 652<211> 652
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 98<400> 98
Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala
1 5 10 15 1 5 10 15
Tyr Ser Cys Ala Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr Tyr Ser Cys Ala Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr
20 25 30 20 25 30
Cys Gly Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys Cys Gly Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys
35 40 45 35 40 45
Arg Leu Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Glu Ala Arg Leu Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Glu Ala
50 55 60 50 55 60
Ala Ala Lys Asp Ala His Lys Ser Glu Val Ala His Arg Phe Lys Asp Ala Ala Lys Asp Ala His Lys Ser Glu Val Ala His Arg Phe Lys Asp
65 70 75 80 65 70 75 80
Leu Gly Glu Glu Asn Phe Lys Ala Leu Val Leu Ile Ala Phe Ala Gln Leu Gly Glu Glu Asn Phe Lys Ala Leu Val Leu Ile Ala Phe Ala Gln
85 90 95 85 90 95
Tyr Leu Gln Gln Cys Pro Phe Glu Asp His Val Lys Leu Val Asn Glu Tyr Leu Gln Gln Cys Pro Phe Glu Asp His Val Lys Leu Val Asn Glu
100 105 110 100 105 110
Val Thr Glu Phe Ala Lys Thr Cys Val Ala Asp Glu Ser Ala Glu Asn Val Thr Glu Phe Ala Lys Thr Cys Val Ala Asp Glu Ser Ala Glu Asn
115 120 125 115 120 125
Cys Asp Lys Ser Leu His Thr Leu Phe Gly Asp Lys Leu Cys Thr Val Cys Asp Lys Ser Leu His Thr Leu Phe Gly Asp Lys Leu Cys Thr Val
130 135 140 130 135 140
Ala Thr Leu Arg Glu Thr Tyr Gly Glu Met Ala Asp Cys Cys Ala Lys Ala Thr Leu Arg Glu Thr Tyr Gly Glu Met Ala Asp Cys Cys Ala Lys
145 150 155 160 145 150 155 160
Gln Glu Pro Glu Arg Asn Glu Cys Phe Leu Gln His Lys Asp Asp Asn Gln Glu Pro Glu Arg Asn Glu Cys Phe Leu Gln His Lys Asp Asp Asn
165 170 175 165 170 175
Pro Asn Leu Pro Arg Leu Val Arg Pro Glu Val Asp Val Met Cys Thr Pro Asn Leu Pro Arg Leu Val Arg Pro Glu Val Asp Val Met Cys Thr
180 185 190 180 185 190
Ala Phe His Asp Asn Glu Glu Thr Phe Leu Lys Lys Tyr Leu Tyr Glu Ala Phe His Asp Asn Glu Glu Thr Phe Leu Lys Lys Tyr Leu Tyr Glu
195 200 205 195 200 205
Ile Ala Arg Arg His Pro Tyr Phe Tyr Ala Pro Glu Leu Leu Phe Phe Ile Ala Arg Arg His Pro Tyr Phe Tyr Ala Pro Glu Leu Leu Phe Phe
210 215 220 210 215 220
Ala Lys Arg Tyr Lys Ala Ala Phe Thr Glu Cys Cys Gln Ala Ala Asp Ala Lys Arg Tyr Lys Ala Ala Phe Thr Glu Cys Cys Gln Ala Ala Asp
225 230 235 240 225 230 235 240
Lys Ala Ala Cys Leu Leu Pro Lys Leu Asp Glu Leu Arg Asp Glu Gly Lys Ala Ala Cys Leu Leu Pro Lys Leu Asp Glu Leu Arg Asp Glu Gly
245 250 255 245 250 255
Lys Ala Ser Ser Ala Lys Gln Arg Leu Lys Cys Ala Ser Leu Gln Lys Lys Ala Ser Ser Ala Lys Gln Arg Leu Lys Cys Ala Ser Leu Gln Lys
260 265 270 260 265 270
Phe Gly Glu Arg Ala Phe Lys Ala Trp Ala Val Ala Arg Leu Ser Gln Phe Gly Glu Arg Ala Phe Lys Ala Trp Ala Val Ala Arg Leu Ser Gln
275 280 285 275 280 285
Arg Phe Pro Lys Ala Glu Phe Ala Glu Val Ser Lys Leu Val Thr Asp Arg Phe Pro Lys Ala Glu Phe Ala Glu Val Ser Lys Leu Val Thr Asp
290 295 300 290 295 300
Leu Thr Lys Val His Thr Glu Cys Cys His Gly Asp Leu Leu Glu Cys Leu Thr Lys Val His Thr Glu Cys Cys His Gly Asp Leu Leu Glu Cys
305 310 315 320 305 310 315 320
Ala Asp Asp Arg Ala Asp Leu Ala Lys Tyr Ile Cys Glu Asn Gln Asp Ala Asp Asp Arg Ala Asp Leu Ala Lys Tyr Ile Cys Glu Asn Gln Asp
325 330 335 325 330 335
Ser Ile Ser Ser Lys Leu Lys Glu Cys Cys Glu Lys Pro Leu Leu Glu Ser Ile Ser Ser Lys Leu Lys Glu Cys Cys Glu Lys Pro Leu Leu Glu
340 345 350 340 345 350
Lys Ser His Cys Ile Ala Glu Val Glu Asn Asp Glu Met Pro Ala Asp Lys Ser His Cys Ile Ala Glu Val Glu Asn Asp Glu Met Pro Ala Asp
355 360 365 355 360 365
Leu Pro Ser Leu Ala Ala Asp Phe Val Glu Ser Lys Asp Val Cys Lys Leu Pro Ser Leu Ala Ala Asp Phe Val Glu Ser Lys Asp Val Cys Lys
370 375 380 370 375 380
Asn Tyr Ala Glu Ala Lys Asp Val Phe Leu Gly Met Phe Leu Tyr Glu Asn Tyr Ala Glu Ala Lys Asp Val Phe Leu Gly Met Phe Leu Tyr Glu
385 390 395 400 385 390 395 400
Tyr Ala Arg Arg His Pro Asp Tyr Ser Val Val Leu Leu Leu Arg Leu Tyr Ala Arg Arg His Pro Asp Tyr Ser Val Val Leu Leu Leu Arg Leu
405 410 415 405 410 415
Ala Lys Thr Tyr Glu Thr Thr Leu Glu Lys Cys Cys Ala Ala Ala Asp Ala Lys Thr Tyr Glu Thr Thr Leu Glu Lys Cys Cys Ala Ala Ala Asp
420 425 430 420 425 430
Pro His Glu Cys Tyr Ala Lys Val Phe Asp Glu Phe Lys Pro Leu Val Pro His Glu Cys Tyr Ala Lys Val Phe Asp Glu Phe Lys Pro Leu Val
435 440 445 435 440 445
Glu Glu Pro Gln Asn Leu Ile Lys Gln Asn Cys Glu Leu Phe Glu Gln Glu Glu Pro Gln Asn Leu Ile Lys Gln Asn Cys Glu Leu Phe Glu Gln
450 455 460 450 455 460
Leu Gly Glu Tyr Lys Phe Gln Asn Ala Leu Leu Val Arg Tyr Thr Lys Leu Gly Glu Tyr Lys Phe Gln Asn Ala Leu Leu Val Arg Tyr Thr Lys
465 470 475 480 465 470 475 480
Lys Val Pro Gln Val Ser Thr Pro Thr Leu Val Glu Val Ser Arg Asn Lys Val Pro Gln Val Ser Thr Pro Thr Leu Val Glu Val Ser Arg Asn
485 490 495 485 490 495
Leu Gly Lys Val Gly Ser Lys Cys Cys Lys His Pro Glu Ala Lys Arg Leu Gly Lys Val Gly Ser Lys Cys Cys Lys His Pro Glu Ala Lys Arg
500 505 510 500 505 510
Met Pro Cys Ala Glu Asp Tyr Leu Ser Val Val Leu Asn Gln Leu Cys Met Pro Cys Ala Glu Asp Tyr Leu Ser Val Val Leu Asn Gln Leu Cys
515 520 525 515 520 525
Val Leu His Glu Lys Thr Pro Val Ser Asp Arg Val Thr Lys Cys Cys Val Leu His Glu Lys Thr Pro Val Ser Asp Arg Val Thr Lys Cys Cys
530 535 540 530 535 540
Thr Glu Ser Leu Val Asn Arg Arg Pro Cys Phe Ser Ala Leu Glu Val Thr Glu Ser Leu Val Asn Arg Arg Pro Cys Phe Ser Ala Leu Glu Val
545 550 555 560 545 550 555 560
Asp Glu Thr Tyr Val Pro Lys Glu Phe Asn Ala Glu Thr Phe Thr Phe Asp Glu Thr Tyr Val Pro Lys Glu Phe Asn Ala Glu Thr Phe Thr Phe
565 570 575 565 570 575
His Ala Asp Ile Cys Thr Leu Ser Glu Lys Glu Arg Gln Ile Lys Lys His Ala Asp Ile Cys Thr Leu Ser Glu Lys Glu Arg Gln Ile Lys Lys
580 585 590 580 585 590
Gln Thr Ala Leu Val Glu Leu Val Lys His Lys Pro Lys Ala Thr Lys Gln Thr Ala Leu Val Glu Leu Val Lys His Lys Pro Lys Ala Thr Lys
595 600 605 595 600 605
Glu Gln Leu Lys Ala Val Met Asp Asp Phe Ala Ala Phe Val Glu Lys Glu Gln Leu Lys Ala Val Met Asp Asp Phe Ala Ala Phe Val Glu Lys
610 615 620 610 615 620
Cys Cys Lys Ala Asp Asp Lys Glu Thr Cys Phe Ala Glu Glu Gly Lys Cys Cys Lys Ala Asp Asp Lys Glu Thr Cys Phe Ala Glu Glu Gly Lys
625 630 635 640 625 630 635 640
Lys Leu Val Ala Ala Ser Gln Ala Ala Leu Gly Leu Lys Leu Val Ala Ala Ser Gln Ala Ala Leu Gly Leu
645 650 645 650
<210> 99<210> 99
<211> 1965<211> 1965
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 99<400> 99
gccaccatga aatgggtcac ctttatctcc ctgctgttcc tgttctcctc cgcctactct 60gccaccatga aatgggtcac ctttatctcc ctgctgttcc tgttctcctc cgcctactct 60
tgcgccgagt ggtctacagc ttggggccct tgttctacca cctgtggcct cggcatggcc 120tgcgccgagt ggtctacagc ttggggccct tgttctacca cctgtggcct cggcatggcc 120
accagagtgt ccaaccagaa cagattctgc cggctggaaa cccagcggag actgtgcttg 180accagagtgt ccaaccagaa cagattctgc cggctggaaa cccagcggag actgtgcttg 180
tctagacctt gcgaggccgc tgccaaggac gctcataagt ctgaggtggc ccaccggttc 240tctagacctt gcgaggccgc tgccaaggac gctcataagt ctgaggtggc ccaccggttc 240
aaggacctgg gcgaagagaa cttcaaggcc ctggtgctga tcgccttcgc tcagtacttg 300aaggacctgg gcgaagagaa cttcaaggcc ctggtgctga tcgccttcgc tcagtacttg 300
cagcagtgcc ccttcgagga ccacgtgaag ctggtcaacg aagtgaccga gttcgccaag 360cagcagtgcc ccttcgagga ccacgtgaag ctggtcaacg aagtgaccga gttcgccaag 360
acctgcgtgg ccgatgagtc tgccgagaac tgcgacaagt ctctgcacac cctgttcggc 420acctgcgtgg ccgatgagtc tgccgagaac tgcgacaagt ctctgcacac cctgttcggc 420
gacaagctgt gtaccgtggc taccctgaga gaaacctacg gcgagatggc cgactgctgc 480gacaagctgt gtaccgtggc taccctgaga gaaacctacg gcgagatggc cgactgctgc 480
gctaagcaag agcccgagag aaacgagtgc ttcctgcagc acaaggacga caaccctaac 540gctaagcaag agcccgagag aaacgagtgc ttcctgcagc acaaggacga caaccctaac 540
ctgcctagac tcgtgcggcc tgaggtggac gtgatgtgta ccgccttcca cgacaacgag 600ctgcctagac tcgtgcggcc tgaggtggac gtgatgtgta ccgccttcca cgacaacgag 600
gaaaccttcc tgaagaagta cctgtacgag atcgccagac ggcaccccta cttttacgcc 660gaaaccttcc tgaagaagta cctgtacgag atcgccagac ggcaccccta cttttacgcc 660
cctgagctgc tgttcttcgc caagcggtac aaggccgcct tcaccgagtg ttgtcaggcc 720cctgagctgc tgttcttcgc caagcggtac aaggccgcct tcaccgagtg ttgtcaggcc 720
gctgataagg ccgcttgcct gctgcctaaa ctggacgagc tgagagatga aggcaaggcc 780gctgataagg ccgcttgcct gctgcctaaa ctggacgagc tgagagatga aggcaaggcc 780
tccagcgcca agcagagact gaagtgtgcc agcctgcaga agttcggcga gagagccttt 840tccagcgcca agcagagact gaagtgtgcc agcctgcaga agttcggcga gagagccttt 840
aaggcctggg ccgtcgctag actgtcccag agatttccca aggccgagtt tgccgaggtg 900aaggcctggg ccgtcgctag actgtcccag agatttccca aggccgagtt tgccgaggtg 900
tccaagctgg ttaccgacct gaccaaggtg cacaccgaat gctgtcacgg cgacctgctg 960tccaagctgg ttaccgacct gaccaaggtg cacaccgaat gctgtcacgg cgacctgctg 960
gaatgcgccg atgatagagc cgatctggcc aagtacatct gcgagaacca ggactccatc 1020gaatgcgccg atgatagagc cgatctggcc aagtacatct gcgagaacca ggactccatc 1020
tcctccaagc tgaaagagtg ctgcgagaag cctctgctgg aaaagtccca ctgtatcgcc 1080tcctccaagc tgaaagagtg ctgcgagaag cctctgctgg aaaagtccca ctgtatcgcc 1080
gaggtggaaa acgacgagat gcctgccgat ctgccttctc tggccgccga cttcgtggaa 1140gaggtggaaa acgacgagat gcctgccgat ctgccttctc tggccgccga cttcgtggaa 1140
tctaaggacg tgtgcaagaa ctacgccgag gctaaggatg tgttcctggg catgtttctg 1200tctaaggacg tgtgcaagaa ctacgccgag gctaaggatg tgttcctggg catgtttctg 1200
tacgagtacg ctcggcggca ccccgactat tctgttgtgc tgctgctgag actggctaag 1260tacgagtacg ctcggcggca ccccgactat tctgttgtgc tgctgctgag actggctaag 1260
acctacgaga caaccctcga gaagtgctgt gccgccgctg atcctcacga gtgttacgcc 1320acctacgaga caaccctcga gaagtgctgt gccgccgctg atcctcacga gtgttacgcc 1320
aaggtgttcg acgagttcaa gccactggtg gaagaacccc agaacctgat caagcagaat 1380aaggtgttcg acgagttcaa gccactggtg gaagaacccc agaacctgat caagcagaat 1380
tgcgagctgt tcgagcagct gggcgagtac aagttccaga acgccctgct cgtgcggtac 1440tgcgagctgt tcgagcagct gggcgagtac aagttccaga acgccctgct cgtgcggtac 1440
accaagaaag tgccccaggt gtccacacct acactggttg aggtgtcccg gaacctgggc 1500accaagaaag tgccccaggt gtccacacct acactggttg aggtgtcccg gaacctgggc 1500
aaagtgggct ctaagtgctg caagcacccc gaggccaaga gaatgccttg tgccgaggac 1560aaagtgggct ctaagtgctg caagcacccc gaggccaaga gaatgccttg tgccgaggac 1560
tacctgtccg tggtgctgaa ccagctgtgc gtgctgcacg aaaagacccc tgtgtccgac 1620tacctgtccg tggtgctgaa ccagctgtgc gtgctgcacg aaaagacccc tgtgtccgac 1620
agagtgacca agtgctgtac cgagagcctg gtcaacagac ggccttgctt ctctgccctg 1680agagtgacca agtgctgtac cgagagcctg gtcaacagac ggccttgctt ctctgccctg 1680
gaagtggacg agacatacgt gcccaaagag ttcaacgccg agacattcac cttccacgcc 1740gaagtggacg agacatacgt gcccaaagag ttcaacgccg agacattcac cttccacgcc 1740
gacatctgca ccctgtccga gaaagagcgg cagatcaaga aacagaccgc tctggtggaa 1800gacatctgca ccctgtccga gaaagagcgg cagatcaaga aacagaccgc tctggtggaa 1800
ctggtcaagc acaagcccaa ggccaccaaa gaacagctga aggccgtgat ggacgacttc 1860ctggtcaagc acaagcccaa ggccaccaaa gaacagctga aggccgtgat ggacgacttc 1860
gccgcctttg tggaaaagtg ttgcaaggcc gacgacaaag agacatgctt cgccgaagag 1920gccgcctttg tggaaaagtg ttgcaaggcc gacgacaaag agacatgctt cgccgaagag 1920
ggcaagaaac tggtggccgc ttctcaggct gctctgggac tttaa 1965ggcaagaaac tggtggccgc ttctcaggct gctctgggac tttaa 1965
<210> 100<210> 100
<211> 2038<211> 2038
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 100<400> 100
ggggacaagt ttgtacaaaa aagcaggcta tggtaccgcc accatgaaat gggtcacctt 60ggggacaagt ttgtacaaaa aagcaggcta tggtaccgcc accatgaaat gggtcacctt 60
tatctccctg ctgttcctgt tctcctccgc ctactcttgc gccgagtggt ctacagcttg 120tatctccctg ctgttcctgt tctcctccgc ctactcttgc gccgagtggt ctacagcttg 120
gggcccttgt tctaccacct gtggcctcgg catggccacc agagtgtcca accagaacag 180gggcccttgt tctaccacct gtggcctcgg catggccacc agagtgtcca accagaacag 180
attctgccgg ctggaaaccc agcggagact gtgcttgtct agaccttgcg aggccgctgc 240attctgccgg ctggaaaccc agcggagact gtgcttgtct agaccttgcg aggccgctgc 240
caaggacgct cataagtctg aggtggccca ccggttcaag gacctgggcg aagagaactt 300caaggacgct cataagtctg aggtggccca ccggttcaag gacctgggcg aagagaactt 300
caaggccctg gtgctgatcg ccttcgctca gtacttgcag cagtgcccct tcgaggacca 360caaggccctg gtgctgatcg ccttcgctca gtacttgcag cagtgcccct tcgaggacca 360
cgtgaagctg gtcaacgaag tgaccgagtt cgccaagacc tgcgtggccg atgagtctgc 420cgtgaagctg gtcaacgaag tgaccgagtt cgccaagacc tgcgtggccg atgagtctgc 420
cgagaactgc gacaagtctc tgcacaccct gttcggcgac aagctgtgta ccgtggctac 480cgagaactgc gacaagtctc tgcacaccct gttcggcgac aagctgtgta ccgtggctac 480
cctgagagaa acctacggcg agatggccga ctgctgcgct aagcaagagc ccgagagaaa 540cctgagagaa acctacggcg agatggccga ctgctgcgct aagcaagagc ccgagagaaa 540
cgagtgcttc ctgcagcaca aggacgacaa ccctaacctg cctagactcg tgcggcctga 600cgagtgcttc ctgcagcaca aggacgacaa ccctaacctg cctagactcg tgcggcctga 600
ggtggacgtg atgtgtaccg ccttccacga caacgaggaa accttcctga agaagtacct 660ggtggacgtg atgtgtaccg ccttccacga caacgaggaa accttcctga agaagtacct 660
gtacgagatc gccagacggc acccctactt ttacgcccct gagctgctgt tcttcgccaa 720gtacgagatc gccagacggc acccctactt ttacgcccct gagctgctgt tcttcgccaa 720
gcggtacaag gccgccttca ccgagtgttg tcaggccgct gataaggccg cttgcctgct 780gcggtacaag gccgccttca ccgagtgttg tcaggccgct gataaggccg cttgcctgct 780
gcctaaactg gacgagctga gagatgaagg caaggcctcc agcgccaagc agagactgaa 840gcctaaactg gacgagctga gagatgaagg caaggcctcc agcgccaagc agagactgaa 840
gtgtgccagc ctgcagaagt tcggcgagag agcctttaag gcctgggccg tcgctagact 900gtgtgccagc ctgcagaagt tcggcgagag agcctttaag gcctgggccg tcgctagact 900
gtcccagaga tttcccaagg ccgagtttgc cgaggtgtcc aagctggtta ccgacctgac 960gtcccagaga tttcccaagg ccgagtttgc cgaggtgtcc aagctggtta ccgacctgac 960
caaggtgcac accgaatgct gtcacggcga cctgctggaa tgcgccgatg atagagccga 1020caaggtgcac accgaatgct gtcacggcga cctgctggaa tgcgccgatg atagagccga 1020
tctggccaag tacatctgcg agaaccagga ctccatctcc tccaagctga aagagtgctg 1080tctggccaag tacatctgcg agaaccagga ctccatctcc tccaagctga aagagtgctg 1080
cgagaagcct ctgctggaaa agtcccactg tatcgccgag gtggaaaacg acgagatgcc 1140cgagaagcct ctgctggaaa agtcccactg tatcgccgag gtggaaaacg acgagatgcc 1140
tgccgatctg ccttctctgg ccgccgactt cgtggaatct aaggacgtgt gcaagaacta 1200tgccgatctg ccttctctgg ccgccgactt cgtggaatct aaggacgtgt gcaagaacta 1200
cgccgaggct aaggatgtgt tcctgggcat gtttctgtac gagtacgctc ggcggcaccc 1260cgccgaggct aaggatgtgt tcctgggcat gtttctgtac gagtacgctc ggcggcaccc 1260
cgactattct gttgtgctgc tgctgagact ggctaagacc tacgagacaa ccctcgagaa 1320cgactattct gttgtgctgc tgctgagact ggctaagacc tacgagacaa ccctcgagaa 1320
gtgctgtgcc gccgctgatc ctcacgagtg ttacgccaag gtgttcgacg agttcaagcc 1380gtgctgtgcc gccgctgatc ctcacgagtg ttacgccaag gtgttcgacg agttcaagcc 1380
actggtggaa gaaccccaga acctgatcaa gcagaattgc gagctgttcg agcagctggg 1440actggtggaa gaaccccaga acctgatcaa gcagaattgc gagctgttcg agcagctggg 1440
cgagtacaag ttccagaacg ccctgctcgt gcggtacacc aagaaagtgc cccaggtgtc 1500cgagtacaag ttccagaacg ccctgctcgt gcggtacacc aagaaagtgc cccaggtgtc 1500
cacacctaca ctggttgagg tgtcccggaa cctgggcaaa gtgggctcta agtgctgcaa 1560cacacctaca ctggttgagg tgtcccggaa cctgggcaaa gtgggctcta agtgctgcaa 1560
gcaccccgag gccaagagaa tgccttgtgc cgaggactac ctgtccgtgg tgctgaacca 1620gcaccccgag gccaagagaa tgccttgtgc cgaggactac ctgtccgtgg tgctgaacca 1620
gctgtgcgtg ctgcacgaaa agacccctgt gtccgacaga gtgaccaagt gctgtaccga 1680gctgtgcgtg ctgcacgaaa agacccctgt gtccgacaga gtgaccaagt gctgtaccga 1680
gagcctggtc aacagacggc cttgcttctc tgccctggaa gtggacgaga catacgtgcc 1740gagcctggtc aacagacggc cttgcttctc tgccctggaa gtggacgaga catacgtgcc 1740
caaagagttc aacgccgaga cattcacctt ccacgccgac atctgcaccc tgtccgagaa 1800caaagagttc aacgccgaga cattcacctt ccacgccgac atctgcaccc tgtccgagaa 1800
agagcggcag atcaagaaac agaccgctct ggtggaactg gtcaagcaca agcccaaggc 1860agagcggcag atcaagaaac agaccgctct ggtggaactg gtcaagcaca agcccaaggc 1860
caccaaagaa cagctgaagg ccgtgatgga cgacttcgcc gcctttgtgg aaaagtgttg 1920caccaaagaa cagctgaagg ccgtgatgga cgacttcgcc gcctttgtgg aaaagtgttg 1920
caaggccgac gacaaagaga catgcttcgc cgaagagggc aagaaactgg tggccgcttc 1980caaggccgac gacaaagaga catgcttcgc cgaagagggc aagaaactgg tggccgcttc 1980
tcaggctgct ctgggacttt aatctagaaa cccagctttc ttgtacaaag tggtcccc 2038tcaggctgct ctgggacttt aatctagaaa cccagctttc ttgtacaaag tggtcccc 2038
<210> 101<210> 101
<211> 582<211> 582
<212> PRT/Белок<212> PRT/Protein
<213> Homo sapiens<213> Homo sapiens
<400> 101<400> 101
Asp Ala His Lys Ser Glu Val Ala His Arg Phe Lys Asp Leu Gly Glu Asp Ala His Lys Ser Glu Val Ala His Arg Phe Lys Asp Leu Gly Glu
1 5 10 15 1 5 10 15
Glu Asn Phe Lys Ala Leu Val Leu Ile Ala Phe Ala Gln Tyr Leu Gln Glu Asn Phe Lys Ala Leu Val Leu Ile Ala Phe Ala Gln Tyr Leu Gln
20 25 30 20 25 30
Gln Cys Pro Phe Glu Asp His Val Lys Leu Val Asn Glu Val Thr Glu Gln Cys Pro Phe Glu Asp His Val Lys Leu Val Asn Glu Val Thr Glu
35 40 45 35 40 45
Phe Ala Lys Thr Cys Val Ala Asp Glu Ser Ala Glu Asn Cys Asp Lys Phe Ala Lys Thr Cys Val Ala Asp Glu Ser Ala Glu Asn Cys Asp Lys
50 55 60 50 55 60
Ser Leu His Thr Leu Phe Gly Asp Lys Leu Cys Thr Val Ala Thr Leu Ser Leu His Thr Leu Phe Gly Asp Lys Leu Cys Thr Val Ala Thr Leu
65 70 75 80 65 70 75 80
Arg Glu Thr Tyr Gly Glu Met Ala Asp Cys Cys Ala Lys Gln Glu Pro Arg Glu Thr Tyr Gly Glu Met Ala Asp Cys Cys Ala Lys Gln Glu Pro
85 90 95 85 90 95
Glu Arg Asn Glu Cys Phe Leu Gln His Lys Asp Asp Asn Pro Asn Leu Glu Arg Asn Glu Cys Phe Leu Gln His Lys Asp Asp Asn Pro Asn Leu
100 105 110 100 105 110
Pro Arg Leu Val Arg Pro Glu Val Asp Val Met Cys Thr Ala Phe His Pro Arg Leu Val Arg Pro Glu Val Asp Val Met Cys Thr Ala Phe His
115 120 125 115 120 125
Asp Asn Glu Glu Thr Phe Leu Lys Lys Tyr Leu Tyr Glu Ile Ala Arg Asp Asn Glu Glu Thr Phe Leu Lys Lys Tyr Leu Tyr Glu Ile Ala Arg
130 135 140 130 135 140
Arg His Pro Tyr Phe Tyr Ala Pro Glu Leu Leu Phe Phe Ala Lys Arg Arg His Pro Tyr Phe Tyr Ala Pro Glu Leu Leu Phe Phe Ala Lys Arg
145 150 155 160 145 150 155 160
Tyr Lys Ala Ala Phe Thr Glu Cys Cys Gln Ala Ala Asp Lys Ala Ala Tyr Lys Ala Ala Phe Thr Glu Cys Cys Gln Ala Ala Asp Lys Ala Ala
165 170 175 165 170 175
Cys Leu Leu Pro Lys Leu Asp Glu Leu Arg Asp Glu Gly Lys Ala Ser Cys Leu Leu Pro Lys Leu Asp Glu Leu Arg Asp Glu Gly Lys Ala Ser
180 185 190 180 185 190
Ser Ala Lys Gln Arg Leu Lys Cys Ala Ser Leu Gln Lys Phe Gly Glu Ser Ala Lys Gln Arg Leu Lys Cys Ala Ser Leu Gln Lys Phe Gly Glu
195 200 205 195 200 205
Arg Ala Phe Lys Ala Trp Ala Val Ala Arg Leu Ser Gln Arg Phe Pro Arg Ala Phe Lys Ala Trp Ala Val Ala Arg Leu Ser Gln Arg Phe Pro
210 215 220 210 215 220
Lys Ala Glu Phe Ala Glu Val Ser Lys Leu Val Thr Asp Leu Thr Lys Lys Ala Glu Phe Ala Glu Val Ser Lys Leu Val Thr Asp Leu Thr Lys
225 230 235 240 225 230 235 240
Val His Thr Glu Cys Cys His Gly Asp Leu Leu Glu Cys Ala Asp Asp Val His Thr Glu Cys Cys His Gly Asp Leu Leu Glu Cys Ala Asp Asp
245 250 255 245 250 255
Arg Ala Asp Leu Ala Lys Tyr Ile Cys Glu Asn Gln Asp Ser Ile Ser Arg Ala Asp Leu Ala Lys Tyr Ile Cys Glu Asn Gln Asp Ser Ile Ser
260 265 270 260 265 270
Ser Lys Leu Lys Glu Cys Cys Glu Lys Pro Leu Leu Glu Lys Ser His Ser Lys Leu Lys Glu Cys Cys Glu Lys Pro Leu Leu Glu Lys Ser His
275 280 285 275 280 285
Cys Ile Ala Glu Val Glu Asn Asp Glu Met Pro Ala Asp Leu Pro Ser Cys Ile Ala Glu Val Glu Asn Asp Glu Met Pro Ala Asp Leu Pro Ser
290 295 300 290 295 300
Leu Ala Ala Asp Phe Val Glu Ser Lys Asp Val Cys Lys Asn Tyr Ala Leu Ala Ala Asp Phe Val Glu Ser Lys Asp Val Cys Lys Asn Tyr Ala
305 310 315 320 305 310 315 320
Glu Ala Lys Asp Val Phe Leu Gly Met Phe Leu Tyr Glu Tyr Ala Arg Glu Ala Lys Asp Val Phe Leu Gly Met Phe Leu Tyr Glu Tyr Ala Arg
325 330 335 325 330 335
Arg His Pro Asp Tyr Ser Val Val Leu Leu Leu Arg Leu Ala Lys Thr Arg His Pro Asp Tyr Ser Val Val Leu Leu Leu Arg Leu Ala Lys Thr
340 345 350 340 345 350
Tyr Glu Thr Thr Leu Glu Lys Cys Cys Ala Ala Ala Asp Pro His Glu Tyr Glu Thr Thr Leu Glu Lys Cys Cys Ala Ala Ala Asp Pro His Glu
355 360 365 355 360 365
Cys Tyr Ala Lys Val Phe Asp Glu Phe Lys Pro Leu Val Glu Glu Pro Cys Tyr Ala Lys Val Phe Asp Glu Phe Lys Pro Leu Val Glu Glu Pro
370 375 380 370 375 380
Gln Asn Leu Ile Lys Gln Asn Cys Glu Leu Phe Glu Gln Leu Gly Glu Gln Asn Leu Ile Lys Gln Asn Cys Glu Leu Phe Glu Gln Leu Gly Glu
385 390 395 400 385 390 395 400
Tyr Lys Phe Gln Asn Ala Leu Leu Val Arg Tyr Thr Lys Lys Val Pro Tyr Lys Phe Gln Asn Ala Leu Leu Val Arg Tyr Thr Lys Lys Val Pro
405 410 415 405 410 415
Gln Val Ser Thr Pro Thr Leu Val Glu Val Ser Arg Asn Leu Gly Lys Gln Val Ser Thr Pro Thr Leu Val Glu Val Ser Arg Asn Leu Gly Lys
420 425 430 420 425 430
Val Gly Ser Lys Cys Cys Lys His Pro Glu Ala Lys Arg Met Pro Cys Val Gly Ser Lys Cys Cys Lys His Pro Glu Ala Lys Arg Met Pro Cys
435 440 445 435 440 445
Ala Glu Asp Tyr Leu Ser Val Val Leu Asn Gln Leu Cys Val Leu His Ala Glu Asp Tyr Leu Ser Val Val Leu Asn Gln Leu Cys Val Leu His
450 455 460 450 455 460
Glu Lys Thr Pro Val Ser Asp Arg Val Thr Lys Cys Cys Thr Glu Ser Glu Lys Thr Pro Val Ser Asp Arg Val Thr Lys Cys Cys Thr Glu Ser
465 470 475 480 465 470 475 480
Leu Val Asn Arg Arg Pro Cys Phe Ser Ala Leu Glu Val Asp Glu Thr Leu Val Asn Arg Arg Pro Cys Phe Ser Ala Leu Glu Val Asp Glu Thr
485 490 495 485 490 495
Tyr Val Pro Lys Glu Phe Asn Ala Glu Thr Phe Thr Phe His Ala Asp Tyr Val Pro Lys Glu Phe Asn Ala Glu Thr Phe Thr Phe His Ala Asp
500 505 510 500 505 510
Ile Cys Thr Leu Ser Glu Lys Glu Arg Gln Ile Lys Lys Gln Thr Ala Ile Cys Thr Leu Ser Glu Lys Glu Arg Gln Ile Lys Lys Gln Thr Ala
515 520 525 515 520 525
Leu Val Glu Leu Val Lys His Lys Pro Lys Ala Thr Lys Glu Gln Leu Leu Val Glu Leu Val Lys His Lys Pro Lys Ala Thr Lys Glu Gln Leu
530 535 540 530 535 540
Lys Ala Val Met Asp Asp Phe Ala Ala Phe Val Glu Lys Cys Cys Lys Lys Ala Val Met Asp Asp Phe Ala Ala Phe Val Glu Lys Cys Cys Lys
545 550 555 560 545 550 555 560
Ala Asp Asp Lys Glu Thr Cys Phe Ala Glu Glu Gly Lys Lys Leu Val Ala Asp Asp Lys Glu Thr Cys Phe Ala Glu Glu Gly Lys Lys Leu Val
565 570 575 565 570 575
Ala Ala Ser Gln Ala Ala Ala Ala Ser Gln Ala Ala
580 580
<210> 102<210> 102
<211> 675<211> 675
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 102<400> 102
Asp Ala His Lys Ser Glu Val Ala His Arg Phe Lys Asp Leu Gly Glu Asp Ala His Lys Ser Glu Val Ala His Arg Phe Lys Asp Leu Gly Glu
1 5 10 15 1 5 10 15
Glu Asn Phe Lys Ala Leu Val Leu Ile Ala Phe Ala Gln Tyr Leu Gln Glu Asn Phe Lys Ala Leu Val Leu Ile Ala Phe Ala Gln Tyr Leu Gln
20 25 30 20 25 30
Gln Cys Pro Phe Glu Asp His Val Lys Leu Val Asn Glu Val Thr Glu Gln Cys Pro Phe Glu Asp His Val Lys Leu Val Asn Glu Val Thr Glu
35 40 45 35 40 45
Phe Ala Lys Thr Cys Val Ala Asp Glu Ser Ala Glu Asn Cys Asp Lys Phe Ala Lys Thr Cys Val Ala Asp Glu Ser Ala Glu Asn Cys Asp Lys
50 55 60 50 55 60
Ser Leu His Thr Leu Phe Gly Asp Lys Leu Cys Thr Val Ala Thr Leu Ser Leu His Thr Leu Phe Gly Asp Lys Leu Cys Thr Val Ala Thr Leu
65 70 75 80 65 70 75 80
Arg Glu Thr Tyr Gly Glu Met Ala Asp Cys Cys Ala Lys Gln Glu Pro Arg Glu Thr Tyr Gly Glu Met Ala Asp Cys Cys Ala Lys Gln Glu Pro
85 90 95 85 90 95
Glu Arg Asn Glu Cys Phe Leu Gln His Lys Asp Asp Asn Pro Asn Leu Glu Arg Asn Glu Cys Phe Leu Gln His Lys Asp Asp Asn Pro Asn Leu
100 105 110 100 105 110
Pro Arg Leu Val Arg Pro Glu Val Asp Val Met Cys Thr Ala Phe His Pro Arg Leu Val Arg Pro Glu Val Asp Val Met Cys Thr Ala Phe His
115 120 125 115 120 125
Asp Asn Glu Glu Thr Phe Leu Lys Lys Tyr Leu Tyr Glu Ile Ala Arg Asp Asn Glu Glu Thr Phe Leu Lys Lys Tyr Leu Tyr Glu Ile Ala Arg
130 135 140 130 135 140
Arg His Pro Tyr Phe Tyr Ala Pro Glu Leu Leu Phe Phe Ala Lys Arg Arg His Pro Tyr Phe Tyr Ala Pro Glu Leu Leu Phe Phe Ala Lys Arg
145 150 155 160 145 150 155 160
Tyr Lys Ala Ala Phe Thr Glu Cys Cys Gln Ala Ala Asp Lys Ala Ala Tyr Lys Ala Ala Phe Thr Glu Cys Cys Gln Ala Ala Asp Lys Ala Ala
165 170 175 165 170 175
Cys Leu Leu Pro Lys Leu Asp Glu Leu Arg Asp Glu Gly Lys Ala Ser Cys Leu Leu Pro Lys Leu Asp Glu Leu Arg Asp Glu Gly Lys Ala Ser
180 185 190 180 185 190
Ser Ala Lys Gln Arg Leu Lys Cys Ala Ser Leu Gln Lys Phe Gly Glu Ser Ala Lys Gln Arg Leu Lys Cys Ala Ser Leu Gln Lys Phe Gly Glu
195 200 205 195 200 205
Arg Ala Phe Lys Ala Trp Ala Val Ala Arg Leu Ser Gln Arg Phe Pro Arg Ala Phe Lys Ala Trp Ala Val Ala Arg Leu Ser Gln Arg Phe Pro
210 215 220 210 215 220
Lys Ala Glu Phe Ala Glu Val Ser Lys Leu Val Thr Asp Leu Thr Lys Lys Ala Glu Phe Ala Glu Val Ser Lys Leu Val Thr Asp Leu Thr Lys
225 230 235 240 225 230 235 240
Val His Thr Glu Cys Cys His Gly Asp Leu Leu Glu Cys Ala Asp Asp Val His Thr Glu Cys Cys His Gly Asp Leu Leu Glu Cys Ala Asp Asp
245 250 255 245 250 255
Arg Ala Asp Leu Ala Lys Tyr Ile Cys Glu Asn Gln Asp Ser Ile Ser Arg Ala Asp Leu Ala Lys Tyr Ile Cys Glu Asn Gln Asp Ser Ile Ser
260 265 270 260 265 270
Ser Lys Leu Lys Glu Cys Cys Glu Lys Pro Leu Leu Glu Lys Ser His Ser Lys Leu Lys Glu Cys Cys Glu Lys Pro Leu Leu Glu Lys Ser His
275 280 285 275 280 285
Cys Ile Ala Glu Val Glu Asn Asp Glu Met Pro Ala Asp Leu Pro Ser Cys Ile Ala Glu Val Glu Asn Asp Glu Met Pro Ala Asp Leu Pro Ser
290 295 300 290 295 300
Leu Ala Ala Asp Phe Val Glu Ser Lys Asp Val Cys Lys Asn Tyr Ala Leu Ala Ala Asp Phe Val Glu Ser Lys Asp Val Cys Lys Asn Tyr Ala
305 310 315 320 305 310 315 320
Glu Ala Lys Asp Val Phe Leu Gly Met Phe Leu Tyr Glu Tyr Ala Arg Glu Ala Lys Asp Val Phe Leu Gly Met Phe Leu Tyr Glu Tyr Ala Arg
325 330 335 325 330 335
Arg His Pro Asp Tyr Ser Val Val Leu Leu Leu Arg Leu Ala Lys Thr Arg His Pro Asp Tyr Ser Val Val Leu Leu Leu Arg Leu Ala Lys Thr
340 345 350 340 345 350
Tyr Glu Thr Thr Leu Glu Lys Cys Cys Ala Ala Ala Asp Pro His Glu Tyr Glu Thr Thr Leu Glu Lys Cys Cys Ala Ala Ala Asp Pro His Glu
355 360 365 355 360 365
Cys Tyr Ala Lys Val Phe Asp Glu Phe Lys Pro Leu Val Glu Glu Pro Cys Tyr Ala Lys Val Phe Asp Glu Phe Lys Pro Leu Val Glu Glu Pro
370 375 380 370 375 380
Gln Asn Leu Ile Lys Gln Asn Cys Glu Leu Phe Glu Gln Leu Gly Glu Gln Asn Leu Ile Lys Gln Asn Cys Glu Leu Phe Glu Gln Leu Gly Glu
385 390 395 400 385 390 395 400
Tyr Lys Phe Gln Asn Ala Leu Leu Val Arg Tyr Thr Lys Lys Val Pro Tyr Lys Phe Gln Asn Ala Leu Leu Val Arg Tyr Thr Lys Lys Val Pro
405 410 415 405 410 415
Gln Val Ser Thr Pro Thr Leu Val Glu Val Ser Arg Asn Leu Gly Lys Gln Val Ser Thr Pro Thr Leu Val Glu Val Ser Arg Asn Leu Gly Lys
420 425 430 420 425 430
Val Gly Ser Lys Cys Cys Lys His Pro Glu Ala Lys Arg Met Pro Cys Val Gly Ser Lys Cys Cys Lys His Pro Glu Ala Lys Arg Met Pro Cys
435 440 445 435 440 445
Ala Glu Asp Tyr Leu Ser Val Val Leu Asn Gln Leu Cys Val Leu His Ala Glu Asp Tyr Leu Ser Val Val Leu Asn Gln Leu Cys Val Leu His
450 455 460 450 455 460
Glu Lys Thr Pro Val Ser Asp Arg Val Thr Lys Cys Cys Thr Glu Ser Glu Lys Thr Pro Val Ser Asp Arg Val Thr Lys Cys Cys Thr Glu Ser
465 470 475 480 465 470 475 480
Leu Val Asn Arg Arg Pro Cys Phe Ser Ala Leu Glu Val Asp Glu Thr Leu Val Asn Arg Arg Pro Cys Phe Ser Ala Leu Glu Val Asp Glu Thr
485 490 495 485 490 495
Tyr Val Pro Lys Glu Phe Asn Ala Glu Thr Phe Thr Phe His Ala Asp Tyr Val Pro Lys Glu Phe Asn Ala Glu Thr Phe Thr Phe His Ala Asp
500 505 510 500 505 510
Ile Cys Thr Leu Ser Glu Lys Glu Arg Gln Ile Lys Lys Gln Thr Ala Ile Cys Thr Leu Ser Glu Lys Glu Arg Gln Ile Lys Lys Gln Thr Ala
515 520 525 515 520 525
Leu Val Glu Leu Val Lys His Lys Pro Lys Ala Thr Lys Glu Gln Leu Leu Val Glu Leu Val Lys His Lys Pro Lys Ala Thr Lys Glu Gln Leu
530 535 540 530 535 540
Lys Ala Val Met Asp Asp Phe Ala Ala Phe Val Glu Lys Cys Cys Lys Lys Ala Val Met Asp Asp Phe Ala Ala Phe Val Glu Lys Cys Cys Lys
545 550 555 560 545 550 555 560
Ala Asp Asp Lys Glu Thr Cys Phe Ala Glu Glu Gly Lys Lys Leu Val Ala Asp Asp Lys Glu Thr Cys Phe Ala Glu Glu Gly Lys Lys Leu Val
565 570 575 565 570 575
Ala Ala Ser Gln Ala Ala Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Ala Ala Ser Gln Ala Ala Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys
580 585 590 580 585 590
Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu
595 600 605 595 600 605
Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Cys Ala Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Cys Ala
610 615 620 610 615 620
Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr Cys Gly Leu Gly Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr Cys Gly Leu Gly
625 630 635 640 625 630 635 640
Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys Arg Leu Glu Thr Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys Arg Leu Glu Thr
645 650 655 645 650 655
Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Pro Pro Ser Arg Gly Arg Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Pro Pro Ser Arg Gly Arg
660 665 670 660 665 670
Ser Pro Gln Ser Pro Gln
675 675
<210> 103<210> 103
<211> 693<211> 693
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 103<400> 103
Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala
1 5 10 15 1 5 10 15
Tyr Ser Asp Ala His Lys Ser Glu Val Ala His Arg Phe Lys Asp Leu Tyr Ser Asp Ala His Lys Ser Glu Val Ala His Arg Phe Lys Asp Leu
20 25 30 20 25 30
Gly Glu Glu Asn Phe Lys Ala Leu Val Leu Ile Ala Phe Ala Gln Tyr Gly Glu Glu Asn Phe Lys Ala Leu Val Leu Ile Ala Phe Ala Gln Tyr
35 40 45 35 40 45
Leu Gln Gln Cys Pro Phe Glu Asp His Val Lys Leu Val Asn Glu Val Leu Gln Gln Cys Pro Phe Glu Asp His Val Lys Leu Val Asn Glu Val
50 55 60 50 55 60
Thr Glu Phe Ala Lys Thr Cys Val Ala Asp Glu Ser Ala Glu Asn Cys Thr Glu Phe Ala Lys Thr Cys Val Ala Asp Glu Ser Ala Glu Asn Cys
65 70 75 80 65 70 75 80
Asp Lys Ser Leu His Thr Leu Phe Gly Asp Lys Leu Cys Thr Val Ala Asp Lys Ser Leu His Thr Leu Phe Gly Asp Lys Leu Cys Thr Val Ala
85 90 95 85 90 95
Thr Leu Arg Glu Thr Tyr Gly Glu Met Ala Asp Cys Cys Ala Lys Gln Thr Leu Arg Glu Thr Tyr Gly Glu Met Ala Asp Cys Cys Ala Lys Gln
100 105 110 100 105 110
Glu Pro Glu Arg Asn Glu Cys Phe Leu Gln His Lys Asp Asp Asn Pro Glu Pro Glu Arg Asn Glu Cys Phe Leu Gln His Lys Asp Asp Asn Pro
115 120 125 115 120 125
Asn Leu Pro Arg Leu Val Arg Pro Glu Val Asp Val Met Cys Thr Ala Asn Leu Pro Arg Leu Val Arg Pro Glu Val Asp Val Met Cys Thr Ala
130 135 140 130 135 140
Phe His Asp Asn Glu Glu Thr Phe Leu Lys Lys Tyr Leu Tyr Glu Ile Phe His Asp Asn Glu Glu Thr Phe Leu Lys Lys Tyr Leu Tyr Glu Ile
145 150 155 160 145 150 155 160
Ala Arg Arg His Pro Tyr Phe Tyr Ala Pro Glu Leu Leu Phe Phe Ala Ala Arg Arg His Pro Tyr Phe Tyr Ala Pro Glu Leu Leu Phe Phe Ala
165 170 175 165 170 175
Lys Arg Tyr Lys Ala Ala Phe Thr Glu Cys Cys Gln Ala Ala Asp Lys Lys Arg Tyr Lys Ala Ala Phe Thr Glu Cys Cys Gln Ala Ala Asp Lys
180 185 190 180 185 190
Ala Ala Cys Leu Leu Pro Lys Leu Asp Glu Leu Arg Asp Glu Gly Lys Ala Ala Cys Leu Leu Pro Lys Leu Asp Glu Leu Arg Asp Glu Gly Lys
195 200 205 195 200 205
Ala Ser Ser Ala Lys Gln Arg Leu Lys Cys Ala Ser Leu Gln Lys Phe Ala Ser Ser Ala Lys Gln Arg Leu Lys Cys Ala Ser Leu Gln Lys Phe
210 215 220 210 215 220
Gly Glu Arg Ala Phe Lys Ala Trp Ala Val Ala Arg Leu Ser Gln Arg Gly Glu Arg Ala Phe Lys Ala Trp Ala Val Ala Arg Leu Ser Gln Arg
225 230 235 240 225 230 235 240
Phe Pro Lys Ala Glu Phe Ala Glu Val Ser Lys Leu Val Thr Asp Leu Phe Pro Lys Ala Glu Phe Ala Glu Val Ser Lys Leu Val Thr Asp Leu
245 250 255 245 250 255
Thr Lys Val His Thr Glu Cys Cys His Gly Asp Leu Leu Glu Cys Ala Thr Lys Val His Thr Glu Cys Cys His Gly Asp Leu Leu Glu Cys Ala
260 265 270 260 265 270
Asp Asp Arg Ala Asp Leu Ala Lys Tyr Ile Cys Glu Asn Gln Asp Ser Asp Asp Arg Ala Asp Leu Ala Lys Tyr Ile Cys Glu Asn Gln Asp Ser
275 280 285 275 280 285
Ile Ser Ser Lys Leu Lys Glu Cys Cys Glu Lys Pro Leu Leu Glu Lys Ile Ser Ser Lys Leu Lys Glu Cys Cys Glu Lys Pro Leu Leu Glu Lys
290 295 300 290 295 300
Ser His Cys Ile Ala Glu Val Glu Asn Asp Glu Met Pro Ala Asp Leu Ser His Cys Ile Ala Glu Val Glu Asn Asp Glu Met Pro Ala Asp Leu
305 310 315 320 305 310 315 320
Pro Ser Leu Ala Ala Asp Phe Val Glu Ser Lys Asp Val Cys Lys Asn Pro Ser Leu Ala Ala Asp Phe Val Glu Ser Lys Asp Val Cys Lys Asn
325 330 335 325 330 335
Tyr Ala Glu Ala Lys Asp Val Phe Leu Gly Met Phe Leu Tyr Glu Tyr Tyr Ala Glu Ala Lys Asp Val Phe Leu Gly Met Phe Leu Tyr Glu Tyr
340 345 350 340 345 350
Ala Arg Arg His Pro Asp Tyr Ser Val Val Leu Leu Leu Arg Leu Ala Ala Arg Arg His Pro Asp Tyr Ser Val Val Leu Leu Leu Arg Leu Ala
355 360 365 355 360 365
Lys Thr Tyr Glu Thr Thr Leu Glu Lys Cys Cys Ala Ala Ala Asp Pro Lys Thr Tyr Glu Thr Thr Leu Glu Lys Cys Cys Ala Ala Ala Asp Pro
370 375 380 370 375 380
His Glu Cys Tyr Ala Lys Val Phe Asp Glu Phe Lys Pro Leu Val Glu His Glu Cys Tyr Ala Lys Val Phe Asp Glu Phe Lys Pro Leu Val Glu
385 390 395 400 385 390 395 400
Glu Pro Gln Asn Leu Ile Lys Gln Asn Cys Glu Leu Phe Glu Gln Leu Glu Pro Gln Asn Leu Ile Lys Gln Asn Cys Glu Leu Phe Glu Gln Leu
405 410 415 405 410 415
Gly Glu Tyr Lys Phe Gln Asn Ala Leu Leu Val Arg Tyr Thr Lys Lys Gly Glu Tyr Lys Phe Gln Asn Ala Leu Leu Val Arg Tyr Thr Lys Lys
420 425 430 420 425 430
Val Pro Gln Val Ser Thr Pro Thr Leu Val Glu Val Ser Arg Asn Leu Val Pro Gln Val Ser Thr Pro Thr Leu Val Glu Val Ser Arg Asn Leu
435 440 445 435 440 445
Gly Lys Val Gly Ser Lys Cys Cys Lys His Pro Glu Ala Lys Arg Met Gly Lys Val Gly Ser Lys Cys Cys Lys His Pro Glu Ala Lys Arg Met
450 455 460 450 455 460
Pro Cys Ala Glu Asp Tyr Leu Ser Val Val Leu Asn Gln Leu Cys Val Pro Cys Ala Glu Asp Tyr Leu Ser Val Val Leu Asn Gln Leu Cys Val
465 470 475 480 465 470 475 480
Leu His Glu Lys Thr Pro Val Ser Asp Arg Val Thr Lys Cys Cys Thr Leu His Glu Lys Thr Pro Val Ser Asp Arg Val Thr Lys Cys Cys Thr
485 490 495 485 490 495
Glu Ser Leu Val Asn Arg Arg Pro Cys Phe Ser Ala Leu Glu Val Asp Glu Ser Leu Val Asn Arg Arg Pro Cys Phe Ser Ala Leu Glu Val Asp
500 505 510 500 505 510
Glu Thr Tyr Val Pro Lys Glu Phe Asn Ala Glu Thr Phe Thr Phe His Glu Thr Tyr Val Pro Lys Glu Phe Asn Ala Glu Thr Phe Thr Phe His
515 520 525 515 520 525
Ala Asp Ile Cys Thr Leu Ser Glu Lys Glu Arg Gln Ile Lys Lys Gln Ala Asp Ile Cys Thr Leu Ser Glu Lys Glu Arg Gln Ile Lys Lys Gln
530 535 540 530 535 540
Thr Ala Leu Val Glu Leu Val Lys His Lys Pro Lys Ala Thr Lys Glu Thr Ala Leu Val Glu Leu Val Lys His Lys Pro Lys Ala Thr Lys Glu
545 550 555 560 545 550 555 560
Gln Leu Lys Ala Val Met Asp Asp Phe Ala Ala Phe Val Glu Lys Cys Gln Leu Lys Ala Val Met Asp Asp Phe Ala Ala Phe Val Glu Lys Cys
565 570 575 565 570 575
Cys Lys Ala Asp Asp Lys Glu Thr Cys Phe Ala Glu Glu Gly Lys Lys Cys Lys Ala Asp Asp Lys Glu Thr Cys Phe Ala Glu Glu Gly Lys Lys
580 585 590 580 585 590
Leu Val Ala Ala Ser Gln Ala Ala Glu Ala Ala Ala Lys Glu Ala Ala Leu Val Ala Ala Ser Gln Ala Ala Glu Ala Ala Ala Lys Glu Ala Ala
595 600 605 595 600 605
Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala
610 615 620 610 615 620
Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys
625 630 635 640 625 630 635 640
Cys Ala Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr Cys Gly Cys Ala Glu Trp Ser Thr Ala Trp Gly Pro Cys Ser Thr Thr Cys Gly
645 650 655 645 650 655
Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys Arg Leu Leu Gly Met Ala Thr Arg Val Ser Asn Gln Asn Arg Phe Cys Arg Leu
660 665 670 660 665 670
Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Pro Pro Ser Arg Glu Thr Gln Arg Arg Leu Cys Leu Ser Arg Pro Cys Pro Pro Ser Arg
675 680 685 675 680 685
Gly Arg Ser Pro Gln Gly Arg Ser Pro Gln
690 690
<210> 104<210> 104
<211> 2088<211> 2088
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 104<400> 104
gccaccatga aatgggtcac ctttatctcc ctgctgttcc tgttctcctc cgcctactct 60gccaccatga aatgggtcac ctttatctcc ctgctgttcc tgttctcctc cgcctactct 60
gacgcccaca agtctgaggt ggcccacaga ttcaaggacc tgggcgaaga gaacttcaag 120gacgcccaca agtctgaggt ggcccacaga ttcaaggacc tgggcgaaga gaacttcaag 120
gccctggtgc tgatcgcctt cgctcagtac ttgcagcagt gccccttcga ggaccacgtg 180gccctggtgc tgatcgcctt cgctcagtac ttgcagcagt gccccttcga ggaccacgtg 180
aagctggtca acgaagtgac cgagttcgcc aagacctgcg tggccgatga gtctgccgag 240aagctggtca acgaagtgac cgagttcgcc aagacctgcg tggccgatga gtctgccgag 240
aactgcgaca agtctctgca caccctgttc ggcgacaagc tgtgtaccgt ggctaccctg 300aactgcgaca agtctctgca caccctgttc ggcgacaagc tgtgtaccgt ggctaccctg 300
agagaaacct acggcgagat ggccgactgc tgcgctaagc aagagcccga gagaaacgag 360agagaaacct acggcgagat ggccgactgc tgcgctaagc aagagcccga gagaaacgag 360
tgcttcctgc agcacaagga cgacaaccct aacctgccta gactcgtgcg gcctgaggtg 420tgcttcctgc agcacaagga cgacaaccct aacctgccta gactcgtgcg gcctgaggtg 420
gacgtgatgt gtaccgcctt ccacgacaac gaggaaacct tcctgaagaa gtacctgtac 480gacgtgatgt gtaccgcctt ccacgacaac gaggaaacct tcctgaagaa gtacctgtac 480
gagatcgcca gacggcaccc ctacttttac gcccctgagc tgctgttctt cgccaagcgg 540gagatcgcca gacggcaccc ctacttttac gcccctgagc tgctgttctt cgccaagcgg 540
tacaaggccg ccttcaccga gtgttgtcag gccgctgata aggccgcttg cctgctgcct 600tacaaggccg ccttcaccga gtgttgtcag gccgctgata aggccgcttg cctgctgcct 600
aaactggacg agctgagaga tgaaggcaag gcctccagcg ccaagcagag actgaagtgt 660aaactggacg agctgagaga tgaaggcaag gcctccagcg ccaagcagag actgaagtgt 660
gccagcctgc agaagttcgg cgagagagcc tttaaggcct gggccgtcgc tagactgtcc 720gccagcctgc agaagttcgg cgagagagcc tttaaggcct gggccgtcgc tagactgtcc 720
cagagatttc ccaaggccga gtttgccgag gtgtccaagc tggttaccga cctgaccaag 780cagagatttc ccaaggccga gtttgccgag gtgtccaagc tggttaccga cctgaccaag 780
gtgcacaccg aatgctgtca cggcgacctg ctggaatgcg ccgatgatag agccgatctg 840gtgcacaccg aatgctgtca cggcgacctg ctggaatgcg ccgatgatag agccgatctg 840
gccaagtaca tctgcgagaa ccaggactcc atctcctcca agctgaaaga gtgctgcgag 900gccaagtaca tctgcgagaa ccaggactcc atctcctcca agctgaaaga gtgctgcgag 900
aagcctctgc tggaaaagtc ccactgtatc gccgaggtgg aaaacgacga gatgcctgcc 960aagcctctgc tggaaaagtc ccactgtatc gccgaggtgg aaaacgacga gatgcctgcc 960
gatctgcctt ctctggccgc cgacttcgtg gaatctaagg acgtgtgcaa gaactacgcc 1020gatctgcctt ctctggccgc cgacttcgtg gaatctaagg acgtgtgcaa gaactacgcc 1020
gaggccaagg atgtgttcct gggcatgttt ctgtacgagt acgctcggcg gcaccccgac 1080gaggccaagg atgtgttcct gggcatgttt ctgtacgagt acgctcggcg gcaccccgac 1080
tattctgttg tgctgctgct gagactggct aagacctacg agacaaccct cgagaagtgc 1140tattctgttg tgctgctgct gagactggct aagacctacg agacaaccct cgagaagtgc 1140
tgtgccgccg ctgatcctca cgagtgttac gccaaggtgt tcgacgagtt caagccactg 1200tgtgccgccg ctgatcctca cgagtgttac gccaaggtgt tcgacgagtt caagccactg 1200
gtggaagaac cccagaacct gatcaagcag aattgcgagc tgttcgagca gctgggcgag 1260gtggaagaac cccagaacct gatcaagcag aattgcgagc tgttcgagca gctgggcgag 1260
tacaagttcc agaacgccct gctcgtgcgg tacaccaaga aagtgcccca ggtgtccaca 1320tacaagttcc agaacgccct gctcgtgcgg tacaccaaga aagtgcccca ggtgtccaca 1320
cctacactgg ttgaggtgtc ccggaacctg ggcaaagtgg gctctaagtg ctgcaagcac 1380cctacactgg ttgaggtgtc ccggaacctg ggcaaagtgg gctctaagtg ctgcaagcac 1380
cctgaggcca agagaatgcc ttgcgccgag gactacctgt ccgtggtgct gaatcagctg 1440cctgaggcca agagaatgcc ttgcgccgag gactacctgt ccgtggtgct gaatcagctg 1440
tgcgtgctgc acgaaaagac ccctgtgtcc gacagagtga ccaagtgctg taccgagagc 1500tgcgtgctgc acgaaaagac ccctgtgtcc gacagagtga ccaagtgctg taccgagagc 1500
ctggtcaaca gacggccttg cttctctgcc ctggaagtgg acgagacata cgtgcccaaa 1560ctggtcaaca gacggccttg cttctctgcc ctggaagtgg acgagacata cgtgcccaaa 1560
gagttcaacg ccgagacatt caccttccac gccgacatct gcaccctgtc cgagaaagag 1620gagttcaacg ccgagacatt caccttccac gccgacatct gcaccctgtc cgagaaagag 1620
cggcagatca agaaacagac cgctctggtg gaactggtca agcacaagcc caaggccacc 1680cggcagatca agaaacagac cgctctggtg gaactggtca agcacaagcc caaggccacc 1680
aaagaacagc tgaaggccgt gatggacgac ttcgccgcct ttgtggaaaa gtgttgcaag 1740aaagaacagc tgaaggccgt gatggacgac ttcgccgcct ttgtggaaaa gtgttgcaag 1740
gccgacgaca aagagacatg cttcgccgaa gagggcaaga aactggtggc cgcttctcag 1800gccgacgaca aagagacatg cttcgccgaa gagggcaaga aactggtggc cgcttctcag 1800
gctgctgagg ccgctgctaa agaggctgcc gctaaagaag ccgcagccaa agaggcagct 1860gctgctgagg ccgctgctaa agaggctgcc gctaaagaag ccgcagccaa agaggcagct 1860
gcaaaagaag ctgctgcaaa agaggcagcc gccaaagagg ccgctgctaa agaagcagcc 1920gcaaaagaag ctgctgcaaa agaggcagcc gccaaagagg ccgctgctaa agaagcagcc 1920
gccaagtgtg ctgagtggtc tacagcttgg ggcccctgct ctacaacctg tggactcggc 1980gccaagtgtg ctgagtggtc tacagcttgg ggcccctgct ctacaacctg tggactcggc 1980
atggccacca gagtgtctaa ccagaacaga ttctgccggc tggaaaccca gcggagactg 2040atggccacca gagtgtctaa ccagaacaga ttctgccggc tggaaaccca gcggagactg 2040
tgcctgtcta gaccctgtcc tcctagcaga ggcagatccc ctcagtga 2088tgcctgtcta gaccctgtcc tcctagcaga ggcagatccc ctcagtga 2088
<210> 105<210> 105
<211> 2161<211> 2161
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 105<400> 105
ggggacaagt ttgtacaaaa aagcaggcta tggtaccgcc accatgaaat gggtcacctt 60ggggacaagt ttgtacaaaa aagcaggcta tggtaccgcc accatgaaat gggtcacctt 60
tatctccctg ctgttcctgt tctcctccgc ctactctgac gcccacaagt ctgaggtggc 120tatctccctg ctgttcctgt tctcctccgc ctactctgac gcccacaagt ctgaggtggc 120
ccacagattc aaggacctgg gcgaagagaa cttcaaggcc ctggtgctga tcgccttcgc 180ccacagattc aaggacctgg gcgaagagaa cttcaaggcc ctggtgctga tcgccttcgc 180
tcagtacttg cagcagtgcc ccttcgagga ccacgtgaag ctggtcaacg aagtgaccga 240tcagtacttg cagcagtgcc ccttcgagga ccacgtgaag ctggtcaacg aagtgaccga 240
gttcgccaag acctgcgtgg ccgatgagtc tgccgagaac tgcgacaagt ctctgcacac 300gttcgccaag acctgcgtgg ccgatgagtc tgccgagaac tgcgacaagt ctctgcacac 300
cctgttcggc gacaagctgt gtaccgtggc taccctgaga gaaacctacg gcgagatggc 360cctgttcggc gacaagctgt gtaccgtggc taccctgaga gaaacctacg gcgagatggc 360
cgactgctgc gctaagcaag agcccgagag aaacgagtgc ttcctgcagc acaaggacga 420cgactgctgc gctaagcaag agcccgagag aaacgagtgc ttcctgcagc acaaggacga 420
caaccctaac ctgcctagac tcgtgcggcc tgaggtggac gtgatgtgta ccgccttcca 480caaccctaac ctgcctagac tcgtgcggcc tgaggtggac gtgatgtgta ccgccttcca 480
cgacaacgag gaaaccttcc tgaagaagta cctgtacgag atcgccagac ggcaccccta 540cgacaacgag gaaaccttcc tgaagaagta cctgtacgag atcgccagac ggcaccccta 540
cttttacgcc cctgagctgc tgttcttcgc caagcggtac aaggccgcct tcaccgagtg 600cttttacgcc cctgagctgc tgttcttcgc caagcggtac aaggccgcct tcaccgagtg 600
ttgtcaggcc gctgataagg ccgcttgcct gctgcctaaa ctggacgagc tgagagatga 660ttgtcaggcc gctgataagg ccgcttgcct gctgcctaaa ctggacgagc tgagagatga 660
aggcaaggcc tccagcgcca agcagagact gaagtgtgcc agcctgcaga agttcggcga 720aggcaaggcc tccagcgcca agcagagact gaagtgtgcc agcctgcaga agttcggcga 720
gagagccttt aaggcctggg ccgtcgctag actgtcccag agatttccca aggccgagtt 780gagagccttt aaggcctggg ccgtcgctag actgtcccag agatttccca aggccgagtt 780
tgccgaggtg tccaagctgg ttaccgacct gaccaaggtg cacaccgaat gctgtcacgg 840tgccgaggtg tccaagctgg ttaccgacct gaccaaggtg cacaccgaat gctgtcacgg 840
cgacctgctg gaatgcgccg atgatagagc cgatctggcc aagtacatct gcgagaacca 900cgacctgctg gaatgcgccg atgatagagc cgatctggcc aagtacatct gcgagaacca 900
ggactccatc tcctccaagc tgaaagagtg ctgcgagaag cctctgctgg aaaagtccca 960ggactccatc tcctccaagc tgaaagagtg ctgcgagaag cctctgctgg aaaagtccca 960
ctgtatcgcc gaggtggaaa acgacgagat gcctgccgat ctgccttctc tggccgccga 1020ctgtatcgcc gaggtggaaa acgacgagat gcctgccgat ctgccttctc tggccgccga 1020
cttcgtggaa tctaaggacg tgtgcaagaa ctacgccgag gccaaggatg tgttcctggg 1080cttcgtggaa tctaaggacg tgtgcaagaa ctacgccgag gccaaggatg tgttcctggg 1080
catgtttctg tacgagtacg ctcggcggca ccccgactat tctgttgtgc tgctgctgag 1140catgtttctg tacgagtacg ctcggcggca ccccgactat tctgttgtgc tgctgctgag 1140
actggctaag acctacgaga caaccctcga gaagtgctgt gccgccgctg atcctcacga 1200actggctaag acctacgaga caaccctcga gaagtgctgt gccgccgctg atcctcacga 1200
gtgttacgcc aaggtgttcg acgagttcaa gccactggtg gaagaacccc agaacctgat 1260gtgttacgcc aaggtgttcg acgagttcaa gccactggtg gaagaacccc agaacctgat 1260
caagcagaat tgcgagctgt tcgagcagct gggcgagtac aagttccaga acgccctgct 1320caagcagaat tgcgagctgt tcgagcagct gggcgagtac aagttccaga acgccctgct 1320
cgtgcggtac accaagaaag tgccccaggt gtccacacct acactggttg aggtgtcccg 1380cgtgcggtac accaagaaag tgccccaggt gtccacacct acactggttg aggtgtcccg 1380
gaacctgggc aaagtgggct ctaagtgctg caagcaccct gaggccaaga gaatgccttg 1440gaacctgggc aaagtgggct ctaagtgctg caagcaccct gaggccaaga gaatgccttg 1440
cgccgaggac tacctgtccg tggtgctgaa tcagctgtgc gtgctgcacg aaaagacccc 1500cgccgaggac tacctgtccg tggtgctgaa tcagctgtgc gtgctgcacg aaaagacccc 1500
tgtgtccgac agagtgacca agtgctgtac cgagagcctg gtcaacagac ggccttgctt 1560tgtgtccgac agagtgacca agtgctgtac cgagagcctg gtcaacagac ggccttgctt 1560
ctctgccctg gaagtggacg agacatacgt gcccaaagag ttcaacgccg agacattcac 1620ctctgccctg gaagtggacg agacatacgt gcccaaagag ttcaacgccg agacattcac 1620
cttccacgcc gacatctgca ccctgtccga gaaagagcgg cagatcaaga aacagaccgc 1680cttccacgcc gacatctgca ccctgtccga gaaagagcgg cagatcaaga aacagaccgc 1680
tctggtggaa ctggtcaagc acaagcccaa ggccaccaaa gaacagctga aggccgtgat 1740tctggtggaa ctggtcaagc acaagcccaa ggccaccaaa gaacagctga aggccgtgat 1740
ggacgacttc gccgcctttg tggaaaagtg ttgcaaggcc gacgacaaag agacatgctt 1800ggacgacttc gccgcctttg tggaaaagtg ttgcaaggcc gacgacaaag agacatgctt 1800
cgccgaagag ggcaagaaac tggtggccgc ttctcaggct gctgaggccg ctgctaaaga 1860cgccgaagag ggcaagaaac tggtggccgc ttctcaggct gctgaggccg ctgctaaaga 1860
ggctgccgct aaagaagccg cagccaaaga ggcagctgca aaagaagctg ctgcaaaaga 1920ggctgccgct aaagaagccg cagccaaaga ggcagctgca aaagaagctg ctgcaaaaga 1920
ggcagccgcc aaagaggccg ctgctaaaga agcagccgcc aagtgtgctg agtggtctac 1980ggcagccgcc aaagaggccg ctgctaaaga agcagccgcc aagtgtgctg agtggtctac 1980
agcttggggc ccctgctcta caacctgtgg actcggcatg gccaccagag tgtctaacca 2040agcttggggc ccctgctcta caacctgtgg actcggcatg gccaccagag tgtctaacca 2040
gaacagattc tgccggctgg aaacccagcg gagactgtgc ctgtctagac cctgtcctcc 2100gaacagattc tgccggctgg aaacccagcg gagactgtgc ctgtctagac cctgtcctcc 2100
tagcagaggc agatcccctc agtgatctag aaacccagct ttcttgtaca aagtggtccc 2160tagcagaggc agatcccctc agtgatctag aaacccagct ttcttgtaca aagtggtccc 2160
c 2161c 2161
<210> 106<210> 106
<211> 634<211> 634
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 106<400> 106
Cys Ala Glu Gln Thr Thr Glu Trp Thr Ala Cys Ser Lys Ser Cys Gly Cys Ala Glu Gln Thr Thr Glu Trp Thr Ala Cys Ser Lys Ser Cys Gly
1 5 10 15 1 5 10 15
Met Gly Phe Ser Thr Arg Val Thr Asn Arg Asn Arg Gln Cys Glu Met Met Gly Phe Ser Thr Arg Val Thr Asn Arg Asn Arg Gln Cys Glu Met
20 25 30 20 25 30
Leu Lys Gln Thr Arg Leu Cys Met Val Arg Pro Cys Glu Ala Ala Ala Leu Lys Gln Thr Arg Leu Cys Met Val Arg Pro Cys Glu Ala Ala Ala
35 40 45 35 40 45
Lys Asp Ala His Lys Ser Glu Val Ala His Arg Phe Lys Asp Leu Gly Lys Asp Ala His Lys Ser Glu Val Ala His Arg Phe Lys Asp Leu Gly
50 55 60 50 55 60
Glu Glu Asn Phe Lys Ala Leu Val Leu Ile Ala Phe Ala Gln Tyr Leu Glu Glu Asn Phe Lys Ala Leu Val Leu Ile Ala Phe Ala Gln Tyr Leu
65 70 75 80 65 70 75 80
Gln Gln Cys Pro Phe Glu Asp His Val Lys Leu Val Asn Glu Val Thr Gln Gln Cys Pro Phe Glu Asp His Val Lys Leu Val Asn Glu Val Thr
85 90 95 85 90 95
Glu Phe Ala Lys Thr Cys Val Ala Asp Glu Ser Ala Glu Asn Cys Asp Glu Phe Ala Lys Thr Cys Val Ala Asp Glu Ser Ala Glu Asn Cys Asp
100 105 110 100 105 110
Lys Ser Leu His Thr Leu Phe Gly Asp Lys Leu Cys Thr Val Ala Thr Lys Ser Leu His Thr Leu Phe Gly Asp Lys Leu Cys Thr Val Ala Thr
115 120 125 115 120 125
Leu Arg Glu Thr Tyr Gly Glu Met Ala Asp Cys Cys Ala Lys Gln Glu Leu Arg Glu Thr Tyr Gly Glu Met Ala Asp Cys Cys Ala Lys Gln Glu
130 135 140 130 135 140
Pro Glu Arg Asn Glu Cys Phe Leu Gln His Lys Asp Asp Asn Pro Asn Pro Glu Arg Asn Glu Cys Phe Leu Gln His Lys Asp Asp Asn Pro Asn
145 150 155 160 145 150 155 160
Leu Pro Arg Leu Val Arg Pro Glu Val Asp Val Met Cys Thr Ala Phe Leu Pro Arg Leu Val Arg Pro Glu Val Asp Val Met Cys Thr Ala Phe
165 170 175 165 170 175
His Asp Asn Glu Glu Thr Phe Leu Lys Lys Tyr Leu Tyr Glu Ile Ala His Asp Asn Glu Glu Thr Phe Leu Lys Lys Tyr Leu Tyr Glu Ile Ala
180 185 190 180 185 190
Arg Arg His Pro Tyr Phe Tyr Ala Pro Glu Leu Leu Phe Phe Ala Lys Arg Arg His Pro Tyr Phe Tyr Ala Pro Glu Leu Leu Phe Phe Ala Lys
195 200 205 195 200 205
Arg Tyr Lys Ala Ala Phe Thr Glu Cys Cys Gln Ala Ala Asp Lys Ala Arg Tyr Lys Ala Ala Phe Thr Glu Cys Cys Gln Ala Ala Asp Lys Ala
210 215 220 210 215 220
Ala Cys Leu Leu Pro Lys Leu Asp Glu Leu Arg Asp Glu Gly Lys Ala Ala Cys Leu Leu Pro Lys Leu Asp Glu Leu Arg Asp Glu Gly Lys Ala
225 230 235 240 225 230 235 240
Ser Ser Ala Lys Gln Arg Leu Lys Cys Ala Ser Leu Gln Lys Phe Gly Ser Ser Ala Lys Gln Arg Leu Lys Cys Ala Ser Leu Gln Lys Phe Gly
245 250 255 245 250 255
Glu Arg Ala Phe Lys Ala Trp Ala Val Ala Arg Leu Ser Gln Arg Phe Glu Arg Ala Phe Lys Ala Trp Ala Val Ala Arg Leu Ser Gln Arg Phe
260 265 270 260 265 270
Pro Lys Ala Glu Phe Ala Glu Val Ser Lys Leu Val Thr Asp Leu Thr Pro Lys Ala Glu Phe Ala Glu Val Ser Lys Leu Val Thr Asp Leu Thr
275 280 285 275 280 285
Lys Val His Thr Glu Cys Cys His Gly Asp Leu Leu Glu Cys Ala Asp Lys Val His Thr Glu Cys Cys His Gly Asp Leu Leu Glu Cys Ala Asp
290 295 300 290 295 300
Asp Arg Ala Asp Leu Ala Lys Tyr Ile Cys Glu Asn Gln Asp Ser Ile Asp Arg Ala Asp Leu Ala Lys Tyr Ile Cys Glu Asn Gln Asp Ser Ile
305 310 315 320 305 310 315 320
Ser Ser Lys Leu Lys Glu Cys Cys Glu Lys Pro Leu Leu Glu Lys Ser Ser Ser Lys Leu Lys Glu Cys Cys Glu Lys Pro Leu Leu Glu Lys Ser
325 330 335 325 330 335
His Cys Ile Ala Glu Val Glu Asn Asp Glu Met Pro Ala Asp Leu Pro His Cys Ile Ala Glu Val Glu Asn Asp Glu Met Pro Ala Asp Leu Pro
340 345 350 340 345 350
Ser Leu Ala Ala Asp Phe Val Glu Ser Lys Asp Val Cys Lys Asn Tyr Ser Leu Ala Ala Asp Phe Val Glu Ser Lys Asp Val Cys Lys Asn Tyr
355 360 365 355 360 365
Ala Glu Ala Lys Asp Val Phe Leu Gly Met Phe Leu Tyr Glu Tyr Ala Ala Glu Ala Lys Asp Val Phe Leu Gly Met Phe Leu Tyr Glu Tyr Ala
370 375 380 370 375 380
Arg Arg His Pro Asp Tyr Ser Val Val Leu Leu Leu Arg Leu Ala Lys Arg Arg His Pro Asp Tyr Ser Val Val Leu Leu Leu Arg Leu Ala Lys
385 390 395 400 385 390 395 400
Thr Tyr Glu Thr Thr Leu Glu Lys Cys Cys Ala Ala Ala Asp Pro His Thr Tyr Glu Thr Thr Leu Glu Lys Cys Cys Ala Ala Ala Asp Pro His
405 410 415 405 410 415
Glu Cys Tyr Ala Lys Val Phe Asp Glu Phe Lys Pro Leu Val Glu Glu Glu Cys Tyr Ala Lys Val Phe Asp Glu Phe Lys Pro Leu Val Glu Glu
420 425 430 420 425 430
Pro Gln Asn Leu Ile Lys Gln Asn Cys Glu Leu Phe Glu Gln Leu Gly Pro Gln Asn Leu Ile Lys Gln Asn Cys Glu Leu Phe Glu Gln Leu Gly
435 440 445 435 440 445
Glu Tyr Lys Phe Gln Asn Ala Leu Leu Val Arg Tyr Thr Lys Lys Val Glu Tyr Lys Phe Gln Asn Ala Leu Leu Val Arg Tyr Thr Lys Lys Val
450 455 460 450 455 460
Pro Gln Val Ser Thr Pro Thr Leu Val Glu Val Ser Arg Asn Leu Gly Pro Gln Val Ser Thr Pro Thr Leu Val Glu Val Ser Arg Asn Leu Gly
465 470 475 480 465 470 475 480
Lys Val Gly Ser Lys Cys Cys Lys His Pro Glu Ala Lys Arg Met Pro Lys Val Gly Ser Lys Cys Cys Lys His Pro Glu Ala Lys Arg Met Pro
485 490 495 485 490 495
Cys Ala Glu Asp Tyr Leu Ser Val Val Leu Asn Gln Leu Cys Val Leu Cys Ala Glu Asp Tyr Leu Ser Val Val Leu Asn Gln Leu Cys Val Leu
500 505 510 500 505 510
His Glu Lys Thr Pro Val Ser Asp Arg Val Thr Lys Cys Cys Thr Glu His Glu Lys Thr Pro Val Ser Asp Arg Val Thr Lys Cys Cys Thr Glu
515 520 525 515 520 525
Ser Leu Val Asn Arg Arg Pro Cys Phe Ser Ala Leu Glu Val Asp Glu Ser Leu Val Asn Arg Arg Pro Cys Phe Ser Ala Leu Glu Val Asp Glu
530 535 540 530 535 540
Thr Tyr Val Pro Lys Glu Phe Asn Ala Glu Thr Phe Thr Phe His Ala Thr Tyr Val Pro Lys Glu Phe Asn Ala Glu Thr Phe Thr Phe His Ala
545 550 555 560 545 550 555 560
Asp Ile Cys Thr Leu Ser Glu Lys Glu Arg Gln Ile Lys Lys Gln Thr Asp Ile Cys Thr Leu Ser Glu Lys Glu Arg Gln Ile Lys Lys Gln Thr
565 570 575 565 570 575
Ala Leu Val Glu Leu Val Lys His Lys Pro Lys Ala Thr Lys Glu Gln Ala Leu Val Glu Leu Val Lys His Lys Pro Lys Ala Thr Lys Glu Gln
580 585 590 580 585 590
Leu Lys Ala Val Met Asp Asp Phe Ala Ala Phe Val Glu Lys Cys Cys Leu Lys Ala Val Met Asp Asp Phe Ala Ala Phe Val Glu Lys Cys Cys
595 600 605 595 600 605
Lys Ala Asp Asp Lys Glu Thr Cys Phe Ala Glu Glu Gly Lys Lys Leu Lys Ala Asp Asp Lys Glu Thr Cys Phe Ala Glu Glu Gly Lys Lys Leu
610 615 620 610 615 620
Val Ala Ala Ser Gln Ala Ala Leu Gly Leu Val Ala Ala Ser Gln Ala Ala Leu Gly Leu
625 630 625 630
<210> 107<210> 107
<211> 652<211> 652
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 107<400> 107
Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala
1 5 10 15 1 5 10 15
Tyr Ser Cys Ala Glu Gln Thr Thr Glu Trp Thr Ala Cys Ser Lys Ser Tyr Ser Cys Ala Glu Gln Thr Thr Glu Trp Thr Ala Cys Ser Lys Ser
20 25 30 20 25 30
Cys Gly Met Gly Phe Ser Thr Arg Val Thr Asn Arg Asn Arg Gln Cys Cys Gly Met Gly Phe Ser Thr Arg Val Thr Asn Arg Asn Arg Gln Cys
35 40 45 35 40 45
Glu Met Leu Lys Gln Thr Arg Leu Cys Met Val Arg Pro Cys Glu Ala Glu Met Leu Lys Gln Thr Arg Leu Cys Met Val Arg Pro Cys Glu Ala
50 55 60 50 55 60
Ala Ala Lys Asp Ala His Lys Ser Glu Val Ala His Arg Phe Lys Asp Ala Ala Lys Asp Ala His Lys Ser Glu Val Ala His Arg Phe Lys Asp
65 70 75 80 65 70 75 80
Leu Gly Glu Glu Asn Phe Lys Ala Leu Val Leu Ile Ala Phe Ala Gln Leu Gly Glu Glu Asn Phe Lys Ala Leu Val Leu Ile Ala Phe Ala Gln
85 90 95 85 90 95
Tyr Leu Gln Gln Cys Pro Phe Glu Asp His Val Lys Leu Val Asn Glu Tyr Leu Gln Gln Cys Pro Phe Glu Asp His Val Lys Leu Val Asn Glu
100 105 110 100 105 110
Val Thr Glu Phe Ala Lys Thr Cys Val Ala Asp Glu Ser Ala Glu Asn Val Thr Glu Phe Ala Lys Thr Cys Val Ala Asp Glu Ser Ala Glu Asn
115 120 125 115 120 125
Cys Asp Lys Ser Leu His Thr Leu Phe Gly Asp Lys Leu Cys Thr Val Cys Asp Lys Ser Leu His Thr Leu Phe Gly Asp Lys Leu Cys Thr Val
130 135 140 130 135 140
Ala Thr Leu Arg Glu Thr Tyr Gly Glu Met Ala Asp Cys Cys Ala Lys Ala Thr Leu Arg Glu Thr Tyr Gly Glu Met Ala Asp Cys Cys Ala Lys
145 150 155 160 145 150 155 160
Gln Glu Pro Glu Arg Asn Glu Cys Phe Leu Gln His Lys Asp Asp Asn Gln Glu Pro Glu Arg Asn Glu Cys Phe Leu Gln His Lys Asp Asp Asn
165 170 175 165 170 175
Pro Asn Leu Pro Arg Leu Val Arg Pro Glu Val Asp Val Met Cys Thr Pro Asn Leu Pro Arg Leu Val Arg Pro Glu Val Asp Val Met Cys Thr
180 185 190 180 185 190
Ala Phe His Asp Asn Glu Glu Thr Phe Leu Lys Lys Tyr Leu Tyr Glu Ala Phe His Asp Asn Glu Glu Thr Phe Leu Lys Lys Tyr Leu Tyr Glu
195 200 205 195 200 205
Ile Ala Arg Arg His Pro Tyr Phe Tyr Ala Pro Glu Leu Leu Phe Phe Ile Ala Arg Arg His Pro Tyr Phe Tyr Ala Pro Glu Leu Leu Phe Phe
210 215 220 210 215 220
Ala Lys Arg Tyr Lys Ala Ala Phe Thr Glu Cys Cys Gln Ala Ala Asp Ala Lys Arg Tyr Lys Ala Ala Phe Thr Glu Cys Cys Gln Ala Ala Asp
225 230 235 240 225 230 235 240
Lys Ala Ala Cys Leu Leu Pro Lys Leu Asp Glu Leu Arg Asp Glu Gly Lys Ala Ala Cys Leu Leu Pro Lys Leu Asp Glu Leu Arg Asp Glu Gly
245 250 255 245 250 255
Lys Ala Ser Ser Ala Lys Gln Arg Leu Lys Cys Ala Ser Leu Gln Lys Lys Ala Ser Ser Ala Lys Gln Arg Leu Lys Cys Ala Ser Leu Gln Lys
260 265 270 260 265 270
Phe Gly Glu Arg Ala Phe Lys Ala Trp Ala Val Ala Arg Leu Ser Gln Phe Gly Glu Arg Ala Phe Lys Ala Trp Ala Val Ala Arg Leu Ser Gln
275 280 285 275 280 285
Arg Phe Pro Lys Ala Glu Phe Ala Glu Val Ser Lys Leu Val Thr Asp Arg Phe Pro Lys Ala Glu Phe Ala Glu Val Ser Lys Leu Val Thr Asp
290 295 300 290 295 300
Leu Thr Lys Val His Thr Glu Cys Cys His Gly Asp Leu Leu Glu Cys Leu Thr Lys Val His Thr Glu Cys Cys His Gly Asp Leu Leu Glu Cys
305 310 315 320 305 310 315 320
Ala Asp Asp Arg Ala Asp Leu Ala Lys Tyr Ile Cys Glu Asn Gln Asp Ala Asp Asp Arg Ala Asp Leu Ala Lys Tyr Ile Cys Glu Asn Gln Asp
325 330 335 325 330 335
Ser Ile Ser Ser Lys Leu Lys Glu Cys Cys Glu Lys Pro Leu Leu Glu Ser Ile Ser Ser Lys Leu Lys Glu Cys Cys Glu Lys Pro Leu Leu Glu
340 345 350 340 345 350
Lys Ser His Cys Ile Ala Glu Val Glu Asn Asp Glu Met Pro Ala Asp Lys Ser His Cys Ile Ala Glu Val Glu Asn Asp Glu Met Pro Ala Asp
355 360 365 355 360 365
Leu Pro Ser Leu Ala Ala Asp Phe Val Glu Ser Lys Asp Val Cys Lys Leu Pro Ser Leu Ala Ala Asp Phe Val Glu Ser Lys Asp Val Cys Lys
370 375 380 370 375 380
Asn Tyr Ala Glu Ala Lys Asp Val Phe Leu Gly Met Phe Leu Tyr Glu Asn Tyr Ala Glu Ala Lys Asp Val Phe Leu Gly Met Phe Leu Tyr Glu
385 390 395 400 385 390 395 400
Tyr Ala Arg Arg His Pro Asp Tyr Ser Val Val Leu Leu Leu Arg Leu Tyr Ala Arg Arg His Pro Asp Tyr Ser Val Val Leu Leu Leu Arg Leu
405 410 415 405 410 415
Ala Lys Thr Tyr Glu Thr Thr Leu Glu Lys Cys Cys Ala Ala Ala Asp Ala Lys Thr Tyr Glu Thr Thr Leu Glu Lys Cys Cys Ala Ala Ala Asp
420 425 430 420 425 430
Pro His Glu Cys Tyr Ala Lys Val Phe Asp Glu Phe Lys Pro Leu Val Pro His Glu Cys Tyr Ala Lys Val Phe Asp Glu Phe Lys Pro Leu Val
435 440 445 435 440 445
Glu Glu Pro Gln Asn Leu Ile Lys Gln Asn Cys Glu Leu Phe Glu Gln Glu Glu Pro Gln Asn Leu Ile Lys Gln Asn Cys Glu Leu Phe Glu Gln
450 455 460 450 455 460
Leu Gly Glu Tyr Lys Phe Gln Asn Ala Leu Leu Val Arg Tyr Thr Lys Leu Gly Glu Tyr Lys Phe Gln Asn Ala Leu Leu Val Arg Tyr Thr Lys
465 470 475 480 465 470 475 480
Lys Val Pro Gln Val Ser Thr Pro Thr Leu Val Glu Val Ser Arg Asn Lys Val Pro Gln Val Ser Thr Pro Thr Leu Val Glu Val Ser Arg Asn
485 490 495 485 490 495
Leu Gly Lys Val Gly Ser Lys Cys Cys Lys His Pro Glu Ala Lys Arg Leu Gly Lys Val Gly Ser Lys Cys Cys Lys His Pro Glu Ala Lys Arg
500 505 510 500 505 510
Met Pro Cys Ala Glu Asp Tyr Leu Ser Val Val Leu Asn Gln Leu Cys Met Pro Cys Ala Glu Asp Tyr Leu Ser Val Val Leu Asn Gln Leu Cys
515 520 525 515 520 525
Val Leu His Glu Lys Thr Pro Val Ser Asp Arg Val Thr Lys Cys Cys Val Leu His Glu Lys Thr Pro Val Ser Asp Arg Val Thr Lys Cys Cys
530 535 540 530 535 540
Thr Glu Ser Leu Val Asn Arg Arg Pro Cys Phe Ser Ala Leu Glu Val Thr Glu Ser Leu Val Asn Arg Arg Pro Cys Phe Ser Ala Leu Glu Val
545 550 555 560 545 550 555 560
Asp Glu Thr Tyr Val Pro Lys Glu Phe Asn Ala Glu Thr Phe Thr Phe Asp Glu Thr Tyr Val Pro Lys Glu Phe Asn Ala Glu Thr Phe Thr Phe
565 570 575 565 570 575
His Ala Asp Ile Cys Thr Leu Ser Glu Lys Glu Arg Gln Ile Lys Lys His Ala Asp Ile Cys Thr Leu Ser Glu Lys Glu Arg Gln Ile Lys Lys
580 585 590 580 585 590
Gln Thr Ala Leu Val Glu Leu Val Lys His Lys Pro Lys Ala Thr Lys Gln Thr Ala Leu Val Glu Leu Val Lys His Lys Pro Lys Ala Thr Lys
595 600 605 595 600 605
Glu Gln Leu Lys Ala Val Met Asp Asp Phe Ala Ala Phe Val Glu Lys Glu Gln Leu Lys Ala Val Met Asp Asp Phe Ala Ala Phe Val Glu Lys
610 615 620 610 615 620
Cys Cys Lys Ala Asp Asp Lys Glu Thr Cys Phe Ala Glu Glu Gly Lys Cys Cys Lys Ala Asp Asp Lys Glu Thr Cys Phe Ala Glu Glu Gly Lys
625 630 635 640 625 630 635 640
Lys Leu Val Ala Ala Ser Gln Ala Ala Leu Gly Leu Lys Leu Val Ala Ala Ser Gln Ala Ala Leu Gly Leu
645 650 645 650
<210> 108<210> 108
<211> 1965<211> 1965
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 108<400> 108
gccaccatga aatgggtcac ctttatctcc ctgctgttcc tgttctcctc cgcctactct 60gccaccatga aatgggtcac ctttatctcc ctgctgttcc tgttctcctc cgcctactct 60
tgtgccgagc agaccacaga gtggaccgcc tgctctaagt cttgcggcat gggcttctcc 120tgtgccgagc agaccacaga gtggaccgcc tgctctaagt cttgcggcat gggcttctcc 120
accagagtga ccaaccggaa cagacagtgc gagatgctga agcagacccg gctgtgtatg 180accagagtga ccaaccggaa cagacagtgc gagatgctga agcagacccg gctgtgtatg 180
gttcgacctt gcgaggccgc tgccaaggat gctcataagt ctgaggtggc ccaccggttc 240gttcgacctt gcgaggccgc tgccaaggat gctcataagt ctgaggtggc ccaccggttc 240
aaggacctgg gcgaagagaa cttcaaggcc ctggtgctga tcgccttcgc tcagtacttg 300aaggacctgg gcgaagagaa cttcaaggcc ctggtgctga tcgccttcgc tcagtacttg 300
cagcagtgcc ccttcgagga ccacgtgaag ctggtcaacg aagtgaccga gttcgccaag 360cagcagtgcc ccttcgagga ccacgtgaag ctggtcaacg aagtgaccga gttcgccaag 360
acctgcgtgg ccgatgagtc tgccgagaac tgcgacaagt ctctgcacac cctgttcggc 420acctgcgtgg ccgatgagtc tgccgagaac tgcgacaagt ctctgcacac cctgttcggc 420
gacaagctgt gtaccgtggc taccctgaga gaaacctacg gcgagatggc cgactgctgc 480gacaagctgt gtaccgtggc taccctgaga gaaacctacg gcgagatggc cgactgctgc 480
gctaagcaag agcccgagag aaacgagtgc ttcctgcagc acaaggacga caaccctaac 540gctaagcaag agcccgagag aaacgagtgc ttcctgcagc acaaggacga caaccctaac 540
ctgcctagac tcgtgcggcc tgaggtggac gtgatgtgta ccgccttcca cgacaacgag 600ctgcctagac tcgtgcggcc tgaggtggac gtgatgtgta ccgccttcca cgacaacgag 600
gaaaccttcc tgaagaagta cctgtacgag atcgccagac ggcaccccta cttttacgcc 660gaaaccttcc tgaagaagta cctgtacgag atcgccagac ggcaccccta cttttacgcc 660
cctgagctgc tgttcttcgc caagcggtac aaggccgcct tcaccgagtg ttgtcaggcc 720cctgagctgc tgttcttcgc caagcggtac aaggccgcct tcaccgagtg ttgtcaggcc 720
gctgataagg ccgcttgcct gctgcctaaa ctggacgagc tgagagatga aggcaaggcc 780gctgataagg ccgcttgcct gctgcctaaa ctggacgagc tgagagatga aggcaaggcc 780
tccagcgcca agcagagact gaagtgtgcc agcctgcaga agttcggcga gagagccttt 840tccagcgcca agcagagact gaagtgtgcc agcctgcaga agttcggcga gagagccttt 840
aaggcctggg ccgtcgctag actgtcccag agatttccca aggccgagtt tgccgaggtg 900aaggcctggg ccgtcgctag actgtcccag agatttccca aggccgagtt tgccgaggtg 900
tccaagctgg ttaccgacct gaccaaggtg cacaccgaat gctgtcacgg cgacctgctg 960tccaagctgg ttaccgacct gaccaaggtg cacaccgaat gctgtcacgg cgacctgctg 960
gaatgcgccg atgatagagc cgatctggcc aagtacatct gcgagaacca ggactccatc 1020gaatgcgccg atgatagagc cgatctggcc aagtacatct gcgagaacca ggactccatc 1020
tcctccaagc tgaaagagtg ctgcgagaag cctctgctgg aaaagtccca ctgtatcgcc 1080tcctccaagc tgaaagagtg ctgcgagaag cctctgctgg aaaagtccca ctgtatcgcc 1080
gaggtggaaa acgacgagat gcctgccgat ctgccttctc tggccgccga cttcgtggaa 1140gaggtggaaa acgacgagat gcctgccgat ctgccttctc tggccgccga cttcgtggaa 1140
tctaaggacg tgtgcaagaa ctacgccgag gctaaggatg tgttcctggg catgtttctg 1200tctaaggacg tgtgcaagaa ctacgccgag gctaaggatg tgttcctggg catgtttctg 1200
tacgagtacg ctcggcggca ccccgattat agtgtggtgc tgctgctgag actggctaag 1260tacgagtacg ctcggcggca ccccgattat agtgtggtgc tgctgctgag actggctaag 1260
acctacgaga caaccctcga gaagtgctgt gccgccgctg atcctcacga gtgttacgcc 1320acctacgaga caaccctcga gaagtgctgt gccgccgctg atcctcacga gtgttacgcc 1320
aaggtgttcg acgagttcaa gccactggtg gaagaacccc agaacctgat caagcagaat 1380aaggtgttcg acgagttcaa gccactggtg gaagaacccc agaacctgat caagcagaat 1380
tgcgagctgt tcgagcagct gggcgagtac aagttccaga acgccctgct cgtgcggtac 1440tgcgagctgt tcgagcagct gggcgagtac aagttccaga acgccctgct cgtgcggtac 1440
accaagaaag tgccccaggt gtccacacct acactggttg aggtgtcccg gaacctgggc 1500accaagaaag tgccccaggt gtccacacct acactggttg aggtgtcccg gaacctgggc 1500
aaagtgggct ctaagtgctg caagcacccc gaggccaaga gaatgccttg cgccgaggat 1560aaagtgggct ctaagtgctg caagcacccc gaggccaaga gaatgccttg cgccgaggat 1560
tacctgtccg tggtgctgaa ccagctgtgc gtgctgcacg aaaagacccc tgtgtccgac 1620tacctgtccg tggtgctgaa ccagctgtgc gtgctgcacg aaaagacccc tgtgtccgac 1620
cgcgtgacca agtgctgtac agagtccctg gtcaacagac ggccctgctt ctctgccctg 1680cgcgtgacca agtgctgtac agagtccctg gtcaacagac ggccctgctt ctctgccctg 1680
gaagtggacg agacatacgt gcccaaagag ttcaacgccg agacattcac cttccacgcc 1740gaagtggacg agacatacgt gcccaaagag ttcaacgccg agacattcac cttccacgcc 1740
gacatctgca ccctgtccga gaaagagcgg cagatcaaga aacagaccgc tctggtcgaa 1800gacatctgca ccctgtccga gaaagagcgg cagatcaaga aacagaccgc tctggtcgaa 1800
ctggtcaagc acaagcccaa ggccaccaaa gaacagctga aggccgtgat ggacgacttc 1860ctggtcaagc acaagcccaa ggccaccaaa gaacagctga aggccgtgat ggacgacttc 1860
gccgcctttg tggaaaagtg ttgcaaggcc gacgacaaag agacatgctt cgccgaagag 1920gccgcctttg tggaaaagtg ttgcaaggcc gacgacaaag agacatgctt cgccgaagag 1920
ggcaagaaac tggtggccgc ttctcaggct gctctgggac tttaa 1965ggcaagaaac tggtggccgc ttctcaggct gctctgggac tttaa 1965
<210> 109<210> 109
<211> 2038<211> 2038
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 109<400> 109
ggggacaagt ttgtacaaaa aagcaggcta tggtaccgcc accatgaaat gggtcacctt 60ggggacaagt ttgtacaaaa aagcaggcta tggtaccgcc accatgaaat gggtcacctt 60
tatctccctg ctgttcctgt tctcctccgc ctactcttgt gccgagcaga ccacagagtg 120tatctccctg ctgttcctgt tctcctccgc ctactcttgt gccgagcaga ccacagagtg 120
gaccgcctgc tctaagtctt gcggcatggg cttctccacc agagtgacca accggaacag 180gaccgcctgc tctaagtctt gcggcatggg cttctccacc agagtgacca accggaacag 180
acagtgcgag atgctgaagc agacccggct gtgtatggtt cgaccttgcg aggccgctgc 240acagtgcgag atgctgaagc agacccggct gtgtatggtt cgaccttgcg aggccgctgc 240
caaggatgct cataagtctg aggtggccca ccggttcaag gacctgggcg aagagaactt 300caaggatgct cataagtctg aggtggccca ccggttcaag gacctgggcg aagagaactt 300
caaggccctg gtgctgatcg ccttcgctca gtacttgcag cagtgcccct tcgaggacca 360caaggccctg gtgctgatcg ccttcgctca gtacttgcag cagtgcccct tcgaggacca 360
cgtgaagctg gtcaacgaag tgaccgagtt cgccaagacc tgcgtggccg atgagtctgc 420cgtgaagctg gtcaacgaag tgaccgagtt cgccaagacc tgcgtggccg atgagtctgc 420
cgagaactgc gacaagtctc tgcacaccct gttcggcgac aagctgtgta ccgtggctac 480cgagaactgc gacaagtctc tgcacaccct gttcggcgac aagctgtgta ccgtggctac 480
cctgagagaa acctacggcg agatggccga ctgctgcgct aagcaagagc ccgagagaaa 540cctgagagaa acctacggcg agatggccga ctgctgcgct aagcaagagc ccgagagaaa 540
cgagtgcttc ctgcagcaca aggacgacaa ccctaacctg cctagactcg tgcggcctga 600cgagtgcttc ctgcagcaca aggacgacaa ccctaacctg cctagactcg tgcggcctga 600
ggtggacgtg atgtgtaccg ccttccacga caacgaggaa accttcctga agaagtacct 660ggtggacgtg atgtgtaccg ccttccacga caacgaggaa accttcctga agaagtacct 660
gtacgagatc gccagacggc acccctactt ttacgcccct gagctgctgt tcttcgccaa 720gtacgagatc gccagacggc acccctactt ttacgcccct gagctgctgt tcttcgccaa 720
gcggtacaag gccgccttca ccgagtgttg tcaggccgct gataaggccg cttgcctgct 780gcggtacaag gccgccttca ccgagtgttg tcaggccgct gataaggccg cttgcctgct 780
gcctaaactg gacgagctga gagatgaagg caaggcctcc agcgccaagc agagactgaa 840gcctaaactg gacgagctga gagatgaagg caaggcctcc agcgccaagc agagactgaa 840
gtgtgccagc ctgcagaagt tcggcgagag agcctttaag gcctgggccg tcgctagact 900gtgtgccagc ctgcagaagt tcggcgagag agcctttaag gcctgggccg tcgctagact 900
gtcccagaga tttcccaagg ccgagtttgc cgaggtgtcc aagctggtta ccgacctgac 960gtcccagaga tttcccaagg ccgagtttgc cgaggtgtcc aagctggtta ccgacctgac 960
caaggtgcac accgaatgct gtcacggcga cctgctggaa tgcgccgatg atagagccga 1020caaggtgcac accgaatgct gtcacggcga cctgctggaa tgcgccgatg atagagccga 1020
tctggccaag tacatctgcg agaaccagga ctccatctcc tccaagctga aagagtgctg 1080tctggccaag tacatctgcg agaaccagga ctccatctcc tccaagctga aagagtgctg 1080
cgagaagcct ctgctggaaa agtcccactg tatcgccgag gtggaaaacg acgagatgcc 1140cgagaagcct ctgctggaaa agtcccactg tatcgccgag gtggaaaacg acgagatgcc 1140
tgccgatctg ccttctctgg ccgccgactt cgtggaatct aaggacgtgt gcaagaacta 1200tgccgatctg ccttctctgg ccgccgactt cgtggaatct aaggacgtgt gcaagaacta 1200
cgccgaggct aaggatgtgt tcctgggcat gtttctgtac gagtacgctc ggcggcaccc 1260cgccgaggct aaggatgtgt tcctgggcat gtttctgtac gagtacgctc ggcggcaccc 1260
cgattatagt gtggtgctgc tgctgagact ggctaagacc tacgagacaa ccctcgagaa 1320cgattatagt gtggtgctgc tgctgagact ggctaagacc tacgagacaa ccctcgagaa 1320
gtgctgtgcc gccgctgatc ctcacgagtg ttacgccaag gtgttcgacg agttcaagcc 1380gtgctgtgcc gccgctgatc ctcacgagtg ttacgccaag gtgttcgacg agttcaagcc 1380
actggtggaa gaaccccaga acctgatcaa gcagaattgc gagctgttcg agcagctggg 1440actggtggaa gaaccccaga acctgatcaa gcagaattgc gagctgttcg agcagctggg 1440
cgagtacaag ttccagaacg ccctgctcgt gcggtacacc aagaaagtgc cccaggtgtc 1500cgagtacaag ttccagaacg ccctgctcgt gcggtacacc aagaaagtgc cccaggtgtc 1500
cacacctaca ctggttgagg tgtcccggaa cctgggcaaa gtgggctcta agtgctgcaa 1560cacacctaca ctggttgagg tgtcccggaa cctgggcaaa gtgggctcta agtgctgcaa 1560
gcaccccgag gccaagagaa tgccttgcgc cgaggattac ctgtccgtgg tgctgaacca 1620gcaccccgag gccaagagaa tgccttgcgc cgaggattac ctgtccgtgg tgctgaacca 1620
gctgtgcgtg ctgcacgaaa agacccctgt gtccgaccgc gtgaccaagt gctgtacaga 1680gctgtgcgtg ctgcacgaaa agacccctgt gtccgaccgc gtgaccaagt gctgtacaga 1680
gtccctggtc aacagacggc cctgcttctc tgccctggaa gtggacgaga catacgtgcc 1740gtccctggtc aacagacggc cctgcttctc tgccctggaa gtggacgaga catacgtgcc 1740
caaagagttc aacgccgaga cattcacctt ccacgccgac atctgcaccc tgtccgagaa 1800caaagagttc aacgccgaga cattcacctt ccacgccgac atctgcaccc tgtccgagaa 1800
agagcggcag atcaagaaac agaccgctct ggtcgaactg gtcaagcaca agcccaaggc 1860agagcggcag atcaagaaac agaccgctct ggtcgaactg gtcaagcaca agcccaaggc 1860
caccaaagaa cagctgaagg ccgtgatgga cgacttcgcc gcctttgtgg aaaagtgttg 1920caccaaagaa cagctgaagg ccgtgatgga cgacttcgcc gcctttgtgg aaaagtgttg 1920
caaggccgac gacaaagaga catgcttcgc cgaagagggc aagaaactgg tggccgcttc 1980caaggccgac gacaaagaga catgcttcgc cgaagagggc aagaaactgg tggccgcttc 1980
tcaggctgct ctgggacttt aatctagaaa cccagctttc ttgtacaaag tggtcccc 2038tcaggctgct ctgggacttt aatctagaaa cccagctttc ttgtacaaag tggtcccc 2038
<210> 110<210> 110
<211> 669<211> 669
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 110<400> 110
Cys Ala Glu Gln Thr Thr Glu Trp Thr Ala Cys Ser Lys Ser Cys Gly Cys Ala Glu Gln Thr Thr Glu Trp Thr Ala Cys Ser Lys Ser Cys Gly
1 5 10 15 1 5 10 15
Met Gly Phe Ser Thr Arg Val Thr Asn Arg Asn Arg Gln Cys Glu Met Met Gly Phe Ser Thr Arg Val Thr Asn Arg Asn Arg Gln Cys Glu Met
20 25 30 20 25 30
Leu Lys Gln Thr Arg Leu Cys Met Val Arg Pro Cys Glu Ala Ala Ala Leu Lys Gln Thr Arg Leu Cys Met Val Arg Pro Cys Glu Ala Ala Ala
35 40 45 35 40 45
Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys
50 55 60 50 55 60
Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu
65 70 75 80 65 70 75 80
Ala Ala Ala Lys Asp Ala His Lys Ser Glu Val Ala His Arg Phe Lys Ala Ala Ala Lys Asp Ala His Lys Ser Glu Val Ala His Arg Phe Lys
85 90 95 85 90 95
Asp Leu Gly Glu Glu Asn Phe Lys Ala Leu Val Leu Ile Ala Phe Ala Asp Leu Gly Glu Glu Asn Phe Lys Ala Leu Val Leu Ile Ala Phe Ala
100 105 110 100 105 110
Gln Tyr Leu Gln Gln Cys Pro Phe Glu Asp His Val Lys Leu Val Asn Gln Tyr Leu Gln Gln Cys Pro Phe Glu Asp His Val Lys Leu Val Asn
115 120 125 115 120 125
Glu Val Thr Glu Phe Ala Lys Thr Cys Val Ala Asp Glu Ser Ala Glu Glu Val Thr Glu Phe Ala Lys Thr Cys Val Ala Asp Glu Ser Ala Glu
130 135 140 130 135 140
Asn Cys Asp Lys Ser Leu His Thr Leu Phe Gly Asp Lys Leu Cys Thr Asn Cys Asp Lys Ser Leu His Thr Leu Phe Gly Asp Lys Leu Cys Thr
145 150 155 160 145 150 155 160
Val Ala Thr Leu Arg Glu Thr Tyr Gly Glu Met Ala Asp Cys Cys Ala Val Ala Thr Leu Arg Glu Thr Tyr Gly Glu Met Ala Asp Cys Cys Ala
165 170 175 165 170 175
Lys Gln Glu Pro Glu Arg Asn Glu Cys Phe Leu Gln His Lys Asp Asp Lys Gln Glu Pro Glu Arg Asn Glu Cys Phe Leu Gln His Lys Asp Asp
180 185 190 180 185 190
Asn Pro Asn Leu Pro Arg Leu Val Arg Pro Glu Val Asp Val Met Cys Asn Pro Asn Leu Pro Arg Leu Val Arg Pro Glu Val Asp Val Met Cys
195 200 205 195 200 205
Thr Ala Phe His Asp Asn Glu Glu Thr Phe Leu Lys Lys Tyr Leu Tyr Thr Ala Phe His Asp Asn Glu Glu Thr Phe Leu Lys Lys Tyr Leu Tyr
210 215 220 210 215 220
Glu Ile Ala Arg Arg His Pro Tyr Phe Tyr Ala Pro Glu Leu Leu Phe Glu Ile Ala Arg Arg His Pro Tyr Phe Tyr Ala Pro Glu Leu Leu Phe
225 230 235 240 225 230 235 240
Phe Ala Lys Arg Tyr Lys Ala Ala Phe Thr Glu Cys Cys Gln Ala Ala Phe Ala Lys Arg Tyr Lys Ala Ala Phe Thr Glu Cys Cys Gln Ala Ala
245 250 255 245 250 255
Asp Lys Ala Ala Cys Leu Leu Pro Lys Leu Asp Glu Leu Arg Asp Glu Asp Lys Ala Ala Cys Leu Leu Pro Lys Leu Asp Glu Leu Arg Asp Glu
260 265 270 260 265 270
Gly Lys Ala Ser Ser Ala Lys Gln Arg Leu Lys Cys Ala Ser Leu Gln Gly Lys Ala Ser Ser Ala Lys Gln Arg Leu Lys Cys Ala Ser Leu Gln
275 280 285 275 280 285
Lys Phe Gly Glu Arg Ala Phe Lys Ala Trp Ala Val Ala Arg Leu Ser Lys Phe Gly Glu Arg Ala Phe Lys Ala Trp Ala Val Ala Arg Leu Ser
290 295 300 290 295 300
Gln Arg Phe Pro Lys Ala Glu Phe Ala Glu Val Ser Lys Leu Val Thr Gln Arg Phe Pro Lys Ala Glu Phe Ala Glu Val Ser Lys Leu Val Thr
305 310 315 320 305 310 315 320
Asp Leu Thr Lys Val His Thr Glu Cys Cys His Gly Asp Leu Leu Glu Asp Leu Thr Lys Val His Thr Glu Cys Cys His Gly Asp Leu Leu Glu
325 330 335 325 330 335
Cys Ala Asp Asp Arg Ala Asp Leu Ala Lys Tyr Ile Cys Glu Asn Gln Cys Ala Asp Asp Arg Ala Asp Leu Ala Lys Tyr Ile Cys Glu Asn Gln
340 345 350 340 345 350
Asp Ser Ile Ser Ser Lys Leu Lys Glu Cys Cys Glu Lys Pro Leu Leu Asp Ser Ile Ser Ser Lys Leu Lys Glu Cys Cys Glu Lys Pro Leu Leu
355 360 365 355 360 365
Glu Lys Ser His Cys Ile Ala Glu Val Glu Asn Asp Glu Met Pro Ala Glu Lys Ser His Cys Ile Ala Glu Val Glu Asn Asp Glu Met Pro Ala
370 375 380 370 375 380
Asp Leu Pro Ser Leu Ala Ala Asp Phe Val Glu Ser Lys Asp Val Cys Asp Leu Pro Ser Leu Ala Ala Asp Phe Val Glu Ser Lys Asp Val Cys
385 390 395 400 385 390 395 400
Lys Asn Tyr Ala Glu Ala Lys Asp Val Phe Leu Gly Met Phe Leu Tyr Lys Asn Tyr Ala Glu Ala Lys Asp Val Phe Leu Gly Met Phe Leu Tyr
405 410 415 405 410 415
Glu Tyr Ala Arg Arg His Pro Asp Tyr Ser Val Val Leu Leu Leu Arg Glu Tyr Ala Arg Arg His Pro Asp Tyr Ser Val Val Leu Leu Leu Arg
420 425 430 420 425 430
Leu Ala Lys Thr Tyr Glu Thr Thr Leu Glu Lys Cys Cys Ala Ala Ala Leu Ala Lys Thr Tyr Glu Thr Thr Leu Glu Lys Cys Cys Ala Ala Ala
435 440 445 435 440 445
Asp Pro His Glu Cys Tyr Ala Lys Val Phe Asp Glu Phe Lys Pro Leu Asp Pro His Glu Cys Tyr Ala Lys Val Phe Asp Glu Phe Lys Pro Leu
450 455 460 450 455 460
Val Glu Glu Pro Gln Asn Leu Ile Lys Gln Asn Cys Glu Leu Phe Glu Val Glu Glu Pro Gln Asn Leu Ile Lys Gln Asn Cys Glu Leu Phe Glu
465 470 475 480 465 470 475 480
Gln Leu Gly Glu Tyr Lys Phe Gln Asn Ala Leu Leu Val Arg Tyr Thr Gln Leu Gly Glu Tyr Lys Phe Gln Asn Ala Leu Leu Val Arg Tyr Thr
485 490 495 485 490 495
Lys Lys Val Pro Gln Val Ser Thr Pro Thr Leu Val Glu Val Ser Arg Lys Lys Val Pro Gln Val Ser Thr Pro Thr Leu Val Glu Val Ser Arg
500 505 510 500 505 510
Asn Leu Gly Lys Val Gly Ser Lys Cys Cys Lys His Pro Glu Ala Lys Asn Leu Gly Lys Val Gly Ser Lys Cys Cys Lys His Pro Glu Ala Lys
515 520 525 515 520 525
Arg Met Pro Cys Ala Glu Asp Tyr Leu Ser Val Val Leu Asn Gln Leu Arg Met Pro Cys Ala Glu Asp Tyr Leu Ser Val Val Leu Asn Gln Leu
530 535 540 530 535 540
Cys Val Leu His Glu Lys Thr Pro Val Ser Asp Arg Val Thr Lys Cys Cys Val Leu His Glu Lys Thr Pro Val Ser Asp Arg Val Thr Lys Cys
545 550 555 560 545 550 555 560
Cys Thr Glu Ser Leu Val Asn Arg Arg Pro Cys Phe Ser Ala Leu Glu Cys Thr Glu Ser Leu Val Asn Arg Arg Pro Cys Phe Ser Ala Leu Glu
565 570 575 565 570 575
Val Asp Glu Thr Tyr Val Pro Lys Glu Phe Asn Ala Glu Thr Phe Thr Val Asp Glu Thr Tyr Val Pro Lys Glu Phe Asn Ala Glu Thr Phe Thr
580 585 590 580 585 590
Phe His Ala Asp Ile Cys Thr Leu Ser Glu Lys Glu Arg Gln Ile Lys Phe His Ala Asp Ile Cys Thr Leu Ser Glu Lys Glu Arg Gln Ile Lys
595 600 605 595 600 605
Lys Gln Thr Ala Leu Val Glu Leu Val Lys His Lys Pro Lys Ala Thr Lys Gln Thr Ala Leu Val Glu Leu Val Lys His Lys Pro Lys Ala Thr
610 615 620 610 615 620
Lys Glu Gln Leu Lys Ala Val Met Asp Asp Phe Ala Ala Phe Val Glu Lys Glu Gln Leu Lys Ala Val Met Asp Asp Phe Ala Ala Phe Val Glu
625 630 635 640 625 630 635 640
Lys Cys Cys Lys Ala Asp Asp Lys Glu Thr Cys Phe Ala Glu Glu Gly Lys Cys Cys Lys Ala Asp Asp Lys Glu Thr Cys Phe Ala Glu Glu Gly
645 650 655 645 650 655
Lys Lys Leu Val Ala Ala Ser Gln Ala Ala Leu Gly Leu Lys Lys Leu Val Ala Ala Ser Gln Ala Ala Leu Gly Leu
660 665 660 665
<210> 111<210> 111
<211> 687<211> 687
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 111<400> 111
Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala
1 5 10 15 1 5 10 15
Tyr Ser Cys Ala Glu Gln Thr Thr Glu Trp Thr Ala Cys Ser Lys Ser Tyr Ser Cys Ala Glu Gln Thr Thr Glu Trp Thr Ala Cys Ser Lys Ser
20 25 30 20 25 30
Cys Gly Met Gly Phe Ser Thr Arg Val Thr Asn Arg Asn Arg Gln Cys Cys Gly Met Gly Phe Ser Thr Arg Val Thr Asn Arg Asn Arg Gln Cys
35 40 45 35 40 45
Glu Met Leu Lys Gln Thr Arg Leu Cys Met Val Arg Pro Cys Glu Ala Glu Met Leu Lys Gln Thr Arg Leu Cys Met Val Arg Pro Cys Glu Ala
50 55 60 50 55 60
Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala
65 70 75 80 65 70 75 80
Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala
85 90 95 85 90 95
Lys Glu Ala Ala Ala Lys Asp Ala His Lys Ser Glu Val Ala His Arg Lys Glu Ala Ala Ala Lys Asp Ala His Lys Ser Glu Val Ala His Arg
100 105 110 100 105 110
Phe Lys Asp Leu Gly Glu Glu Asn Phe Lys Ala Leu Val Leu Ile Ala Phe Lys Asp Leu Gly Glu Glu Asn Phe Lys Ala Leu Val Leu Ile Ala
115 120 125 115 120 125
Phe Ala Gln Tyr Leu Gln Gln Cys Pro Phe Glu Asp His Val Lys Leu Phe Ala Gln Tyr Leu Gln Gln Cys Pro Phe Glu Asp His Val Lys Leu
130 135 140 130 135 140
Val Asn Glu Val Thr Glu Phe Ala Lys Thr Cys Val Ala Asp Glu Ser Val Asn Glu Val Thr Glu Phe Ala Lys Thr Cys Val Ala Asp Glu Ser
145 150 155 160 145 150 155 160
Ala Glu Asn Cys Asp Lys Ser Leu His Thr Leu Phe Gly Asp Lys Leu Ala Glu Asn Cys Asp Lys Ser Leu His Thr Leu Phe Gly Asp Lys Leu
165 170 175 165 170 175
Cys Thr Val Ala Thr Leu Arg Glu Thr Tyr Gly Glu Met Ala Asp Cys Cys Thr Val Ala Thr Leu Arg Glu Thr Tyr Gly Glu Met Ala Asp Cys
180 185 190 180 185 190
Cys Ala Lys Gln Glu Pro Glu Arg Asn Glu Cys Phe Leu Gln His Lys Cys Ala Lys Gln Glu Pro Glu Arg Asn Glu Cys Phe Leu Gln His Lys
195 200 205 195 200 205
Asp Asp Asn Pro Asn Leu Pro Arg Leu Val Arg Pro Glu Val Asp Val Asp Asp Asn Pro Asn Leu Pro Arg Leu Val Arg Pro Glu Val Asp Val
210 215 220 210 215 220
Met Cys Thr Ala Phe His Asp Asn Glu Glu Thr Phe Leu Lys Lys Tyr Met Cys Thr Ala Phe His Asp Asn Glu Glu Thr Phe Leu Lys Lys Tyr
225 230 235 240 225 230 235 240
Leu Tyr Glu Ile Ala Arg Arg His Pro Tyr Phe Tyr Ala Pro Glu Leu Leu Tyr Glu Ile Ala Arg Arg His Pro Tyr Phe Tyr Ala Pro Glu Leu
245 250 255 245 250 255
Leu Phe Phe Ala Lys Arg Tyr Lys Ala Ala Phe Thr Glu Cys Cys Gln Leu Phe Phe Ala Lys Arg Tyr Lys Ala Ala Phe Thr Glu Cys Cys Gln
260 265 270 260 265 270
Ala Ala Asp Lys Ala Ala Cys Leu Leu Pro Lys Leu Asp Glu Leu Arg Ala Ala Asp Lys Ala Ala Cys Leu Leu Pro Lys Leu Asp Glu Leu Arg
275 280 285 275 280 285
Asp Glu Gly Lys Ala Ser Ser Ala Lys Gln Arg Leu Lys Cys Ala Ser Asp Glu Gly Lys Ala Ser Ser Ala Lys Gln Arg Leu Lys Cys Ala Ser
290 295 300 290 295 300
Leu Gln Lys Phe Gly Glu Arg Ala Phe Lys Ala Trp Ala Val Ala Arg Leu Gln Lys Phe Gly Glu Arg Ala Phe Lys Ala Trp Ala Val Ala Arg
305 310 315 320 305 310 315 320
Leu Ser Gln Arg Phe Pro Lys Ala Glu Phe Ala Glu Val Ser Lys Leu Leu Ser Gln Arg Phe Pro Lys Ala Glu Phe Ala Glu Val Ser Lys Leu
325 330 335 325 330 335
Val Thr Asp Leu Thr Lys Val His Thr Glu Cys Cys His Gly Asp Leu Val Thr Asp Leu Thr Lys Val His Thr Glu Cys Cys His Gly Asp Leu
340 345 350 340 345 350
Leu Glu Cys Ala Asp Asp Arg Ala Asp Leu Ala Lys Tyr Ile Cys Glu Leu Glu Cys Ala Asp Asp Arg Ala Asp Leu Ala Lys Tyr Ile Cys Glu
355 360 365 355 360 365
Asn Gln Asp Ser Ile Ser Ser Lys Leu Lys Glu Cys Cys Glu Lys Pro Asn Gln Asp Ser Ile Ser Ser Lys Leu Lys Glu Cys Cys Glu Lys Pro
370 375 380 370 375 380
Leu Leu Glu Lys Ser His Cys Ile Ala Glu Val Glu Asn Asp Glu Met Leu Leu Glu Lys Ser His Cys Ile Ala Glu Val Glu Asn Asp Glu Met
385 390 395 400 385 390 395 400
Pro Ala Asp Leu Pro Ser Leu Ala Ala Asp Phe Val Glu Ser Lys Asp Pro Ala Asp Leu Pro Ser Leu Ala Ala Asp Phe Val Glu Ser Lys Asp
405 410 415 405 410 415
Val Cys Lys Asn Tyr Ala Glu Ala Lys Asp Val Phe Leu Gly Met Phe Val Cys Lys Asn Tyr Ala Glu Ala Lys Asp Val Phe Leu Gly Met Phe
420 425 430 420 425 430
Leu Tyr Glu Tyr Ala Arg Arg His Pro Asp Tyr Ser Val Val Leu Leu Leu Tyr Glu Tyr Ala Arg Arg His Pro Asp Tyr Ser Val Val Leu Leu
435 440 445 435 440 445
Leu Arg Leu Ala Lys Thr Tyr Glu Thr Thr Leu Glu Lys Cys Cys Ala Leu Arg Leu Ala Lys Thr Tyr Glu Thr Thr Leu Glu Lys Cys Cys Ala
450 455 460 450 455 460
Ala Ala Asp Pro His Glu Cys Tyr Ala Lys Val Phe Asp Glu Phe Lys Ala Ala Asp Pro His Glu Cys Tyr Ala Lys Val Phe Asp Glu Phe Lys
465 470 475 480 465 470 475 480
Pro Leu Val Glu Glu Pro Gln Asn Leu Ile Lys Gln Asn Cys Glu Leu Pro Leu Val Glu Glu Pro Gln Asn Leu Ile Lys Gln Asn Cys Glu Leu
485 490 495 485 490 495
Phe Glu Gln Leu Gly Glu Tyr Lys Phe Gln Asn Ala Leu Leu Val Arg Phe Glu Gln Leu Gly Glu Tyr Lys Phe Gln Asn Ala Leu Leu Val Arg
500 505 510 500 505 510
Tyr Thr Lys Lys Val Pro Gln Val Ser Thr Pro Thr Leu Val Glu Val Tyr Thr Lys Lys Val Pro Gln Val Ser Thr Pro Thr Leu Val Glu Val
515 520 525 515 520 525
Ser Arg Asn Leu Gly Lys Val Gly Ser Lys Cys Cys Lys His Pro Glu Ser Arg Asn Leu Gly Lys Val Gly Ser Lys Cys Cys Lys His Pro Glu
530 535 540 530 535 540
Ala Lys Arg Met Pro Cys Ala Glu Asp Tyr Leu Ser Val Val Leu Asn Ala Lys Arg Met Pro Cys Ala Glu Asp Tyr Leu Ser Val Val Leu Asn
545 550 555 560 545 550 555 560
Gln Leu Cys Val Leu His Glu Lys Thr Pro Val Ser Asp Arg Val Thr Gln Leu Cys Val Leu His Glu Lys Thr Pro Val Ser Asp Arg Val Thr
565 570 575 565 570 575
Lys Cys Cys Thr Glu Ser Leu Val Asn Arg Arg Pro Cys Phe Ser Ala Lys Cys Cys Thr Glu Ser Leu Val Asn Arg Arg Pro Cys Phe Ser Ala
580 585 590 580 585 590
Leu Glu Val Asp Glu Thr Tyr Val Pro Lys Glu Phe Asn Ala Glu Thr Leu Glu Val Asp Glu Thr Tyr Val Pro Lys Glu Phe Asn Ala Glu Thr
595 600 605 595 600 605
Phe Thr Phe His Ala Asp Ile Cys Thr Leu Ser Glu Lys Glu Arg Gln Phe Thr Phe His Ala Asp Ile Cys Thr Leu Ser Glu Lys Glu Arg Gln
610 615 620 610 615 620
Ile Lys Lys Gln Thr Ala Leu Val Glu Leu Val Lys His Lys Pro Lys Ile Lys Lys Gln Thr Ala Leu Val Glu Leu Val Lys His Lys Pro Lys
625 630 635 640 625 630 635 640
Ala Thr Lys Glu Gln Leu Lys Ala Val Met Asp Asp Phe Ala Ala Phe Ala Thr Lys Glu Gln Leu Lys Ala Val Met Asp Asp Phe Ala Ala Phe
645 650 655 645 650 655
Val Glu Lys Cys Cys Lys Ala Asp Asp Lys Glu Thr Cys Phe Ala Glu Val Glu Lys Cys Cys Lys Ala Asp Asp Lys Glu Thr Cys Phe Ala Glu
660 665 670 660 665 670
Glu Gly Lys Lys Leu Val Ala Ala Ser Gln Ala Ala Leu Gly Leu Glu Gly Lys Lys Leu Val Ala Ala Ser Gln Ala Ala Leu Gly Leu
675 680 685 675 680 685
<210> 112<210> 112
<211> 2070<211> 2070
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 112<400> 112
gccaccatga aatgggtcac ctttatctcc ctgctgttcc tgttctcctc cgcctactct 60gccaccatga aatgggtcac ctttatctcc ctgctgttcc tgttctcctc cgcctactct 60
tgtgccgagc agaccacaga gtggaccgcc tgctctaagt cttgcggcat gggcttctcc 120tgtgccgagc agaccacaga gtggaccgcc tgctctaagt cttgcggcat gggcttctcc 120
accagagtga ccaaccggaa cagacagtgc gagatgctga agcagacccg gctgtgtatg 180accagagtga ccaaccggaa cagacagtgc gagatgctga agcagacccg gctgtgtatg 180
gttcgacctt gcgaggccgc tgccaaagag gctgctgcta aagaagccgc cgcaaaagag 240gttcgacctt gcgaggccgc tgccaaagag gctgctgcta aagaagccgc cgcaaaagag 240
gcagcagcaa aagaggctgc cgccaaagag gccgcagcca aagaagcagc agctaaagag 300gcagcagcaa aagaggctgc cgccaaagag gccgcagcca aagaagcagc agctaaagag 300
gccgctgcta aggacgccca caagtctgaa gtggcccacc ggtttaagga cctgggcgaa 360gccgctgcta aggacgccca caagtctgaa gtggcccacc ggtttaagga cctgggcgaa 360
gagaacttca aggccctggt gctgatcgcc ttcgctcagt acttgcagca gtgccccttc 420gagaacttca aggccctggt gctgatcgcc ttcgctcagt acttgcagca gtgccccttc 420
gaggaccacg tgaagctggt caacgaagtg accgagttcg ccaagacctg cgtggccgat 480gaggaccacg tgaagctggt caacgaagtg accgagttcg ccaagacctg cgtggccgat 480
gagtctgccg agaactgcga caagtctctg cacaccctgt tcggcgacaa gctgtgtacc 540gagtctgccg agaactgcga caagtctctg cacaccctgt tcggcgacaa gctgtgtacc 540
gtggctaccc tgagagaaac ctacggcgag atggccgact gctgcgctaa gcaagagccc 600gtggctaccc tgagagaaac ctacggcgag atggccgact gctgcgctaa gcaagagccc 600
gagagaaacg agtgcttcct gcagcacaag gacgacaacc ctaacctgcc tagactcgtg 660gagagaaacg agtgcttcct gcagcacaag gacgacaacc ctaacctgcc tagactcgtg 660
cggcctgagg tggacgtgat gtgtaccgcc ttccacgaca acgaggaaac cttcctgaag 720cggcctgagg tggacgtgat gtgtaccgcc ttccacgaca acgaggaaac cttcctgaag 720
aagtacctgt acgagatcgc cagacggcac ccctactttt acgcccctga gctgctgttt 780aagtacctgt acgagatcgc cagacggcac ccctactttt acgcccctga gctgctgttt 780
ttcgccaagc ggtacaaggc cgccttcacc gagtgttgtc aggccgccga taaggccgct 840ttcgccaagc ggtacaaggc cgccttcacc gagtgttgtc aggccgccga taaggccgct 840
tgtctgctgc ctaaactgga cgagctgcgc gacgaaggca aggcctcttc tgctaagcag 900tgtctgctgc ctaaactgga cgagctgcgc gacgaaggca aggcctcttc tgctaagcag 900
cggctgaagt gcgccagcct gcagaagttt ggcgagagag ccttcaaggc ttgggccgtc 960cggctgaagt gcgccagcct gcagaagttt ggcgagagag ccttcaaggc ttgggccgtc 960
gctagactgt cccagagatt tcccaaggcc gagtttgccg aggtgtccaa gctggttacc 1020gctagactgt cccagagatt tcccaaggcc gagtttgccg aggtgtccaa gctggttacc 1020
gacctgacca aggtgcacac cgaatgctgt cacggcgacc tgctggaatg cgccgatgat 1080gacctgacca aggtgcacac cgaatgctgt cacggcgacc tgctggaatg cgccgatgat 1080
agagccgatc tggccaagta catctgcgag aaccaggact ccatctcctc caagctgaaa 1140agagccgatc tggccaagta catctgcgag aaccaggact ccatctcctc caagctgaaa 1140
gagtgctgcg agaagcctct gctggaaaag tcccactgta tcgccgaggt ggaaaacgac 1200gagtgctgcg agaagcctct gctggaaaag tcccactgta tcgccgaggt ggaaaacgac 1200
gagatgcctg ccgatctgcc ttctctggcc gccgacttcg tggaatctaa ggacgtgtgc 1260gagatgcctg ccgatctgcc ttctctggcc gccgacttcg tggaatctaa ggacgtgtgc 1260
aagaactacg ccgaggccaa ggatgtgttc ctgggcatgt ttctgtacga gtacgctcgg 1320aagaactacg ccgaggccaa ggatgtgttc ctgggcatgt ttctgtacga gtacgctcgg 1320
cggcaccccg attatagtgt ggtgctgctg ctgagactgg ctaagaccta cgagacaacc 1380cggcaccccg attatagtgt ggtgctgctg ctgagactgg ctaagaccta cgagacaacc 1380
ctcgagaagt gctgtgccgc cgctgatcct cacgagtgtt acgccaaggt gttcgacgag 1440ctcgagaagt gctgtgccgc cgctgatcct cacgagtgtt acgccaaggt gttcgacgag 1440
ttcaagccac tggtggaaga accccagaac ctgatcaagc agaattgcga gctgttcgag 1500ttcaagccac tggtggaaga accccagaac ctgatcaagc agaattgcga gctgttcgag 1500
cagctgggcg agtacaagtt ccagaacgcc ctgctcgtgc ggtacaccaa gaaagtgccc 1560cagctgggcg agtacaagtt ccagaacgcc ctgctcgtgc ggtacaccaa gaaagtgccc 1560
caggtgtcca cacctacact ggttgaggtg tcccggaacc tgggcaaagt gggctctaag 1620caggtgtcca cacctacact ggttgaggtg tcccggaacc tgggcaaagt gggctctaag 1620
tgctgcaagc accctgaggc caagagaatg ccttgcgccg aggactacct gtccgtggtg 1680tgctgcaagc accctgaggc caagagaatg ccttgcgccg aggactacct gtccgtggtg 1680
ctgaatcagc tgtgcgtgct gcacgaaaag acccctgtgt ccgaccgcgt gaccaagtgc 1740ctgaatcagc tgtgcgtgct gcacgaaaag acccctgtgt ccgaccgcgt gaccaagtgc 1740
tgtacagagt ccctggtcaa cagacggccc tgcttctctg ccctggaagt ggacgagaca 1800tgtacagagt ccctggtcaa cagacggccc tgcttctctg ccctggaagt ggacgagaca 1800
tacgtgccca aagagttcaa cgccgagaca ttcaccttcc acgccgacat ctgcaccctg 1860tacgtgccca aagagttcaa cgccgagaca ttcaccttcc acgccgacat ctgcaccctg 1860
tccgagaaag agcggcagat caagaaacag accgctctgg tcgagctggt taagcacaag 1920tccgagaaag agcggcagat caagaaacag accgctctgg tcgagctggt taagcacaag 1920
cccaaggcca ccaaagaaca gctgaaggcc gtgatggacg acttcgccgc ctttgtggaa 1980cccaaggcca ccaaagaaca gctgaaggcc gtgatggacg acttcgccgc ctttgtggaa 1980
aagtgttgca aggccgacga caaagagaca tgcttcgccg aagagggcaa gaaactggtg 2040aagtgttgca aggccgacga caaagagaca tgcttcgccg aagagggcaa gaaactggtg 2040
gccgcttctc aggctgctct gggactttaa 2070gccgcttctc aggctgctct gggactttaa 2070
<210> 113<210> 113
<211> 2143<211> 2143
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 113<400> 113
ggggacaagt ttgtacaaaa aagcaggcta tggtaccgcc accatgaaat gggtcacctt 60ggggacaagt ttgtacaaaa aagcaggcta tggtaccgcc accatgaaat gggtcacctt 60
tatctccctg ctgttcctgt tctcctccgc ctactcttgt gccgagcaga ccacagagtg 120tatctccctg ctgttcctgt tctcctccgc ctactcttgt gccgagcaga ccacagagtg 120
gaccgcctgc tctaagtctt gcggcatggg cttctccacc agagtgacca accggaacag 180gaccgcctgc tctaagtctt gcggcatggg cttctccacc agagtgacca accggaacag 180
acagtgcgag atgctgaagc agacccggct gtgtatggtt cgaccttgcg aggccgctgc 240acagtgcgag atgctgaagc agacccggct gtgtatggtt cgaccttgcg aggccgctgc 240
caaagaggct gctgctaaag aagccgccgc aaaagaggca gcagcaaaag aggctgccgc 300caaagaggct gctgctaaag aagccgccgc aaaagaggca gcagcaaaag aggctgccgc 300
caaagaggcc gcagccaaag aagcagcagc taaagaggcc gctgctaagg acgcccacaa 360caaagaggcc gcagccaaag aagcagcagc taaagaggcc gctgctaagg acgcccacaa 360
gtctgaagtg gcccaccggt ttaaggacct gggcgaagag aacttcaagg ccctggtgct 420gtctgaagtg gcccaccggt ttaaggacct gggcgaagag aacttcaagg ccctggtgct 420
gatcgccttc gctcagtact tgcagcagtg ccccttcgag gaccacgtga agctggtcaa 480gatcgccttc gctcagtact tgcagcagtg ccccttcgag gaccacgtga agctggtcaa 480
cgaagtgacc gagttcgcca agacctgcgt ggccgatgag tctgccgaga actgcgacaa 540cgaagtgacc gagttcgcca agacctgcgt ggccgatgag tctgccgaga actgcgacaa 540
gtctctgcac accctgttcg gcgacaagct gtgtaccgtg gctaccctga gagaaaccta 600gtctctgcac accctgttcg gcgacaagct gtgtaccgtg gctaccctga gagaaaccta 600
cggcgagatg gccgactgct gcgctaagca agagcccgag agaaacgagt gcttcctgca 660cggcgagatg gccgactgct gcgctaagca agagcccgag agaaacgagt gcttcctgca 660
gcacaaggac gacaacccta acctgcctag actcgtgcgg cctgaggtgg acgtgatgtg 720gcacaaggac gacaacccta acctgcctag actcgtgcgg cctgaggtgg acgtgatgtg 720
taccgccttc cacgacaacg aggaaacctt cctgaagaag tacctgtacg agatcgccag 780taccgccttc cacgacaacg aggaaacctt cctgaagaag tacctgtacg agatcgccag 780
acggcacccc tacttttacg cccctgagct gctgtttttc gccaagcggt acaaggccgc 840acggcacccc tacttttacg cccctgagct gctgtttttc gccaagcggt acaaggccgc 840
cttcaccgag tgttgtcagg ccgccgataa ggccgcttgt ctgctgccta aactggacga 900cttcaccgag tgttgtcagg ccgccgataa ggccgcttgt ctgctgccta aactggacga 900
gctgcgcgac gaaggcaagg cctcttctgc taagcagcgg ctgaagtgcg ccagcctgca 960gctgcgcgac gaaggcaagg cctcttctgc taagcagcgg ctgaagtgcg ccagcctgca 960
gaagtttggc gagagagcct tcaaggcttg ggccgtcgct agactgtccc agagatttcc 1020gaagtttggc gagagagcct tcaaggcttg ggccgtcgct agactgtccc agagatttcc 1020
caaggccgag tttgccgagg tgtccaagct ggttaccgac ctgaccaagg tgcacaccga 1080caaggccgag tttgccgagg tgtccaagct ggttaccgac ctgaccaagg tgcacaccga 1080
atgctgtcac ggcgacctgc tggaatgcgc cgatgataga gccgatctgg ccaagtacat 1140atgctgtcac ggcgacctgc tggaatgcgc cgatgataga gccgatctgg ccaagtacat 1140
ctgcgagaac caggactcca tctcctccaa gctgaaagag tgctgcgaga agcctctgct 1200ctgcgagaac caggactcca tctcctccaa gctgaaagag tgctgcgaga agcctctgct 1200
ggaaaagtcc cactgtatcg ccgaggtgga aaacgacgag atgcctgccg atctgccttc 1260ggaaaagtcc cactgtatcg ccgaggtgga aaacgacgag atgcctgccg atctgccttc 1260
tctggccgcc gacttcgtgg aatctaagga cgtgtgcaag aactacgccg aggccaagga 1320tctggccgcc gacttcgtgg aatctaagga cgtgtgcaag aactacgccg aggccaagga 1320
tgtgttcctg ggcatgtttc tgtacgagta cgctcggcgg caccccgatt atagtgtggt 1380tgtgttcctg ggcatgtttc tgtacgagta cgctcggcgg caccccgatt atagtgtggt 1380
gctgctgctg agactggcta agacctacga gacaaccctc gagaagtgct gtgccgccgc 1440gctgctgctg agactggcta agacctacga gacaaccctc gagaagtgct gtgccgccgc 1440
tgatcctcac gagtgttacg ccaaggtgtt cgacgagttc aagccactgg tggaagaacc 1500tgatcctcac gagtgttacg ccaaggtgtt cgacgagttc aagccactgg tggaagaacc 1500
ccagaacctg atcaagcaga attgcgagct gttcgagcag ctgggcgagt acaagttcca 1560ccagaacctg atcaagcaga attgcgagct gttcgagcag ctgggcgagt acaagttcca 1560
gaacgccctg ctcgtgcggt acaccaagaa agtgccccag gtgtccacac ctacactggt 1620gaacgccctg ctcgtgcggt acaccaagaa agtgccccag gtgtccacac ctacactggt 1620
tgaggtgtcc cggaacctgg gcaaagtggg ctctaagtgc tgcaagcacc ctgaggccaa 1680tgaggtgtcc cggaacctgg gcaaagtggg ctctaagtgc tgcaagcacc ctgaggccaa 1680
gagaatgcct tgcgccgagg actacctgtc cgtggtgctg aatcagctgt gcgtgctgca 1740gagaatgcct tgcgccgagg actacctgtc cgtggtgctg aatcagctgt gcgtgctgca 1740
cgaaaagacc cctgtgtccg accgcgtgac caagtgctgt acagagtccc tggtcaacag 1800cgaaaagacc cctgtgtccg accgcgtgac caagtgctgt acagagtccc tggtcaacag 1800
acggccctgc ttctctgccc tggaagtgga cgagacatac gtgcccaaag agttcaacgc 1860acggccctgc ttctctgccc tggaagtgga cgagacatac gtgcccaaag agttcaacgc 1860
cgagacattc accttccacg ccgacatctg caccctgtcc gagaaagagc ggcagatcaa 1920cgagacattc accttccacg ccgacatctg caccctgtcc gagaaagagc ggcagatcaa 1920
gaaacagacc gctctggtcg agctggttaa gcacaagccc aaggccacca aagaacagct 1980gaaacagacc gctctggtcg agctggttaa gcacaagccc aaggccacca aagaacagct 1980
gaaggccgtg atggacgact tcgccgcctt tgtggaaaag tgttgcaagg ccgacgacaa 2040gaaggccgtg atggacgact tcgccgcctt tgtggaaaag tgttgcaagg ccgacgacaa 2040
agagacatgc ttcgccgaag agggcaagaa actggtggcc gcttctcagg ctgctctggg 2100agagacatgc ttcgccgaag agggcaagaa actggtggcc gcttctcagg ctgctctggg 2100
actttaatct agaaacccag ctttcttgta caaagtggtc ccc 2143actttaatct agaaacccag ctttcttgta caaagtggtc ccc 2143
<210> 114<210> 114
<211> 484<211> 484
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Слитый белок<223> Fused protein
<400> 114<400> 114
Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala
1 5 10 15 1 5 10 15
Tyr Ser Gly His His His His His His Gly Ser Glu Ile Gly Thr Gly Tyr Ser Gly His His His His His Gly Ser Glu Ile Gly Thr Gly
20 25 30 20 25 30
Phe Pro Phe Asp Pro His Tyr Val Glu Val Leu Gly Glu Arg Met His Phe Pro Phe Asp Pro His Tyr Val Glu Val Leu Gly Glu Arg Met His
35 40 45 35 40 45
Tyr Val Asp Val Gly Pro Arg Asp Gly Thr Pro Val Leu Phe Leu His Tyr Val Asp Val Gly Pro Arg Asp Gly Thr Pro Val Leu Phe Leu His
50 55 60 50 55 60
Gly Asn Pro Thr Ser Ser Tyr Val Trp Arg Asn Ile Ile Pro His Val Gly Asn Pro Thr Ser Ser Tyr Val Trp Arg Asn Ile Ile Pro His Val
65 70 75 80 65 70 75 80
Ala Pro Thr His Arg Cys Ile Ala Pro Asp Leu Ile Gly Met Gly Lys Ala Pro Thr His Arg Cys Ile Ala Pro Asp Leu Ile Gly Met Gly Lys
85 90 95 85 90 95
Ser Asp Lys Pro Asp Leu Gly Tyr Phe Phe Asp Asp His Val Arg Phe Ser Asp Lys Pro Asp Leu Gly Tyr Phe Phe Asp Asp His Val Arg Phe
100 105 110 100 105 110
Met Asp Ala Phe Ile Glu Ala Leu Gly Leu Glu Glu Val Val Leu Val Met Asp Ala Phe Ile Glu Ala Leu Gly Leu Glu Glu Val Val Leu Val
115 120 125 115 120 125
Ile His Asp Trp Gly Ser Ala Leu Gly Phe His Trp Ala Lys Arg Asn Ile His Asp Trp Gly Ser Ala Leu Gly Phe His Trp Ala Lys Arg Asn
130 135 140 130 135 140
Pro Glu Arg Val Lys Gly Ile Ala Phe Met Glu Phe Ile Arg Pro Ile Pro Glu Arg Val Lys Gly Ile Ala Phe Met Glu Phe Ile Arg Pro Ile
145 150 155 160 145 150 155 160
Pro Thr Trp Asp Glu Trp Pro Glu Phe Ala Arg Glu Thr Phe Gln Ala Pro Thr Trp Asp Glu Trp Pro Glu Phe Ala Arg Glu Thr Phe Gln Ala
165 170 175 165 170 175
Phe Arg Thr Thr Asp Val Gly Arg Lys Leu Ile Ile Asp Gln Asn Val Phe Arg Thr Thr Asp Val Gly Arg Lys Leu Ile Ile Asp Gln Asn Val
180 185 190 180 185 190
Phe Ile Glu Gly Thr Leu Pro Met Gly Val Val Arg Pro Leu Thr Glu Phe Ile Glu Gly Thr Leu Pro Met Gly Val Val Arg Pro Leu Thr Glu
195 200 205 195 200 205
Val Glu Met Asp His Tyr Arg Glu Pro Phe Leu Asn Pro Val Asp Arg Val Glu Met Asp His Tyr Arg Glu Pro Phe Leu Asn Pro Val Asp Arg
210 215 220 210 215 220
Glu Pro Leu Trp Arg Phe Pro Asn Glu Leu Pro Ile Ala Gly Glu Pro Glu Pro Leu Trp Arg Phe Pro Asn Glu Leu Pro Ile Ala Gly Glu Pro
225 230 235 240 225 230 235 240
Ala Asn Ile Val Ala Leu Val Glu Glu Tyr Met Asp Trp Leu His Gln Ala Asn Ile Val Ala Leu Val Glu Glu Tyr Met Asp Trp Leu His Gln
245 250 255 245 250 255
Ser Pro Val Pro Lys Leu Leu Phe Trp Gly Thr Pro Gly Val Leu Ile Ser Pro Val Pro Lys Leu Leu Phe Trp Gly Thr Pro Gly Val Leu Ile
260 265 270 260 265 270
Pro Pro Ala Glu Ala Ala Arg Leu Ala Lys Ser Leu Pro Asn Cys Lys Pro Pro Ala Glu Ala Ala Arg Leu Ala Lys Ser Leu Pro Asn Cys Lys
275 280 285 275 280 285
Ala Val Asp Ile Gly Pro Gly Leu Asn Leu Leu Gln Glu Asp Asn Pro Ala Val Asp Ile Gly Pro Gly Leu Asn Leu Leu Gln Glu Asp Asn Pro
290 295 300 290 295 300
Asp Leu Ile Gly Ser Glu Ile Ala Arg Trp Leu Ser Thr Leu Glu Ile Asp Leu Ile Gly Ser Glu Ile Ala Arg Trp Leu Ser Thr Leu Glu Ile
305 310 315 320 305 310 315 320
Ser Gly Leu Gln Asp Ser Glu Val Asn Gln Glu Ala Lys Pro Glu Val Ser Gly Leu Gln Asp Ser Glu Val Asn Gln Glu Ala Lys Pro Glu Val
325 330 335 325 330 335
Lys Pro Glu Val Lys Pro Glu Thr His Ile Asn Leu Lys Val Ser Asp Lys Pro Glu Val Lys Pro Glu Thr His Ile Asn Leu Lys Val Ser Asp
340 345 350 340 345 350
Gly Ser Ser Glu Ile Phe Phe Lys Ile Lys Lys Thr Thr Pro Leu Arg Gly Ser Ser Glu Ile Phe Phe Lys Ile Lys Lys Thr Thr Pro Leu Arg
355 360 365 355 360 365
Arg Leu Met Glu Ala Phe Ala Lys Arg Gln Gly Lys Glu Met Asp Ser Arg Leu Met Glu Ala Phe Ala Lys Arg Gln Gly Lys Glu Met Asp Ser
370 375 380 370 375 380
Leu Thr Phe Leu Tyr Asp Gly Ile Glu Ile Gln Ala Asp Gln Thr Pro Leu Thr Phe Leu Tyr Asp Gly Ile Glu Ile Gln Ala Asp Gln Thr Pro
385 390 395 400 385 390 395 400
Glu Asp Leu Asp Met Glu Asp Asn Asp Ile Ile Glu Ala His Arg Glu Glu Asp Leu Asp Met Glu Asp Asn Asp Ile Ile Glu Ala His Arg Glu
405 410 415 405 410 415
Gln Ile Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Gln Ile Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly
420 425 430 420 425 430
Ser Ser Gly Gly Gly Ser Ser Gly Cys Ala Glu Gln Thr Thr Glu Trp Ser Ser Gly Gly Gly Ser Ser Gly Cys Ala Glu Gln Thr Thr Glu Trp
435 440 445 435 440 445
Thr Ala Cys Ser Lys Ser Cys Gly Met Gly Phe Ser Thr Arg Val Thr Thr Ala Cys Ser Lys Ser Cys Gly Met Gly Phe Ser Thr Arg Val Thr
450 455 460 450 455 460
Asn Arg Asn Arg Gln Cys Glu Met Leu Lys Gln Thr Arg Leu Cys Met Asn Arg Asn Arg Gln Cys Glu Met Leu Lys Gln Thr Arg Leu Cys Met
465 470 475 480 465 470 475 480
Val Arg Pro Cys Val Arg Pro Cys
<210> 115<210> 115
<211> 13<211> 13
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> часть рекомбинантного белка<223> part of a recombinant protein
<400> 115<400> 115
Pro Pro Ser Arg Gly Arg Ser Pro Gln Asn Ser Ala Phe Pro Pro Ser Arg Gly Arg Ser Pro Gln Asn Ser Ala Phe
1 5 10 1 5 10
<210> 116<210> 116
<211> 8<211> 8
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> часть рекомбинантного белка<223> part of a recombinant protein
<400> 116<400> 116
Gly Gln Pro Val Tyr Ser Ser Leu Gly Gln Pro Val Tyr Ser Ser Leu
1 5 1 5
<210> 117<210> 117
<211> 7<211> 7
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> часть рекомбинантного белка<223> part of a recombinant protein
<400> 117<400> 117
Glu Ala Asp Leu Glu Glu Asn Glu Ala Asp Leu Glu Glu Asn
1 5 1 5
<210> 118<210> 118
<211> 9<211> 9
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> часть рекомбинантного белка<223> part of a recombinant protein
<400> 118<400> 118
Glu Gln Gln Pro Glu Gln Pro Thr Asp Glu Gln Gln Pro Glu Gln Pro Thr Asp
1 5 1 5
<210> 119<210> 119
<211> 8<211> 8
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> часть рекомбинантного белка<223> part of a recombinant protein
<400> 119<400> 119
Asp Val Asp Ile His Thr Leu Ile Asp Val Asp Ile His Thr Leu Ile
1 5 1 5
<210> 120<210> 120
<211> 11<211> 11
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> часть рекомбинантного белка<223> part of a recombinant protein
<400> 120<400> 120
Asp Ser Asn Ile Leu Lys Thr Ile Lys Ile Pro Asp Ser Asn Ile Leu Lys Thr Ile Lys Ile Pro
1 5 10 1 5 10
<210> 121<210> 121
<211> 5<211> 5
<212> PRT/Белок<212> PRT/Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Линкер<223> Linker
<400> 121<400> 121
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
1 5 1 5
<---<---
Claims (29)
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EP19163970.7 | 2019-03-20 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| RU2021125671A RU2021125671A (en) | 2023-04-20 |
| RU2825102C2 true RU2825102C2 (en) | 2024-08-20 |
Family
ID=
Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20020165185A1 (en) * | 1998-03-19 | 2002-11-07 | Trustees Of Tufts College | Novel Heparin-induced CCN-like molecules and uses therefor |
| FR2858234A1 (en) * | 2003-08-01 | 2005-02-04 | Centre Nat Rech Scient | NOVEL ANTI-ANGIOGENIC AGENT AND ITS USE, IN PARTICULAR IN THE TREATMENT OF CANCERS |
| WO2007066823A1 (en) * | 2005-12-07 | 2007-06-14 | Nosan Corporation | Antibody against connective tissue growth factor or composition containing the same |
| CN105396136A (en) * | 2015-11-23 | 2016-03-16 | 上海交通大学医学院附属第九人民医院 | Application of CCN1(Cyr61) to treatment of diseases related to skin injuries and atrophoderma |
| WO2017121842A1 (en) * | 2016-01-13 | 2017-07-20 | Affiris Ag | Alpha chain of the high-affinity ige receptor (fceria) |
| KR20180099537A (en) * | 2017-02-28 | 2018-09-05 | 주식회사 파이안바이오테크놀로지 | Pharmaceutical formulation for treatment of fibrosis caused by pathological activation of myofibroblast |
Patent Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20020165185A1 (en) * | 1998-03-19 | 2002-11-07 | Trustees Of Tufts College | Novel Heparin-induced CCN-like molecules and uses therefor |
| FR2858234A1 (en) * | 2003-08-01 | 2005-02-04 | Centre Nat Rech Scient | NOVEL ANTI-ANGIOGENIC AGENT AND ITS USE, IN PARTICULAR IN THE TREATMENT OF CANCERS |
| WO2007066823A1 (en) * | 2005-12-07 | 2007-06-14 | Nosan Corporation | Antibody against connective tissue growth factor or composition containing the same |
| CN105396136A (en) * | 2015-11-23 | 2016-03-16 | 上海交通大学医学院附属第九人民医院 | Application of CCN1(Cyr61) to treatment of diseases related to skin injuries and atrophoderma |
| WO2017121842A1 (en) * | 2016-01-13 | 2017-07-20 | Affiris Ag | Alpha chain of the high-affinity ige receptor (fceria) |
| KR20180099537A (en) * | 2017-02-28 | 2018-09-05 | 주식회사 파이안바이오테크놀로지 | Pharmaceutical formulation for treatment of fibrosis caused by pathological activation of myofibroblast |
Non-Patent Citations (2)
| Title |
|---|
| KESKIN O. et al., A new, structurally nonredundant, diverse data set of protein-protein interfaces and its implications, Protein Sci., 2004, v.13, n.4, p.1043-1055. SHEN J. et al., Single variable domain-IgG fusion: a novel recombinant approach to Fc domain-containing bispecific antibodies, Journal of Biological Chemistry, 2006, v. 281, n. 16, p.10706-10714. CHEN X. et al., Fusion protein linkers: property, design and functionality, Advanced drug delivery reviews, 2013, v. 65, n. 10, p.1357-1369. MAEDA Y. et al., Engineering of functional chimeric protein G-Vargula Luciferase, Analytical biochemistry, 1997, V. 249, N. 2, p.147-152. GLAESNER W. et al., Engineering and characterization of the long-acting glucagon-like peptide-1 analogue LY2189265, an Fc fusion protein, Diabetes/metabolism research and reviews, 2010, v. 26, n. 4, p.287-296. KAASBOLL O.J. et al., Connective tissue growth factor (CCN2) is a matricellular preproprotein controlled by proteolytic activation, J Biol Chem., 2018 * |
| КУЗНЕЦОВА С.А. и др., ИММУНОРЕГУЛЯТОРНЫЕ СВОЙСТВА ТРОМБОСПОНДИНА-1, КОМПОНЕНТА ВНЕКЛЕТОЧНОГО МАТРИКСА И ИНГИБИТОРА АНГИОГЕНЕЗА, Медицинская Иммунология, 2008, т. 10, н. 6, с. 499-506. KONTERMANN R.E. et al., Bispecific antibodies, Drug Discovery Today, 2015, v. 7, n. 20, p.838-847. YAMPOLSKY L.Y. et al., 1, The exchangeability of amino acids in proteins, Genetics, 2005,v.170, n.4, p.1459-1472. PAKULA A.A. et al., Genetic analysis of protein stability and function. Anna. Rev. Genet. 1989, v.23, p.289-310. TOKURIKI N. et al., Stability effects of mutations and protein evolvability, Curr. Opin. Struct. Biol., 2009, v.19, n.5, p.596-604. * |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP2858662B1 (en) | Fibroblast growth factor 21 proteins | |
| AU2014296107B2 (en) | Growth differentiation factor 15 (GDF-15) constructs | |
| CN110225924B (en) | Relaxin fusion polypeptides and uses thereof | |
| KR20140125803A (en) | Growth differentiation factor 15(gdf-15) polypeptides | |
| CN105837680A (en) | Methods of treating FGF21-associated disorders | |
| KR101179678B1 (en) | Growth factor complexes and modulation of cell migration and growth | |
| EP3060235B1 (en) | Endoglin peptides to treat fibrotic diseases | |
| TW201107471A (en) | Polypeptides selective for αvβ3 integrin conjugated with a variant of human serum albumin (HSA) and pharmaceutical uses thereof | |
| JP2018535964A (en) | Treatment of steroid-induced hyperglycemia with fibroblast growth factor (FGF) 1 analog | |
| AU2020243073B2 (en) | Recombinant CCN domain proteins and fusion proteins | |
| US20180280474A1 (en) | Treatment of bile acid disorders | |
| CN116134049A (en) | Variant ACTRIIB protein and uses thereof | |
| KR20140093942A (en) | Human notch1 decoys | |
| WO2016102580A1 (en) | Alpha-1-antitrypsin (a1at) fusion proteins and uses thereof | |
| RU2825102C2 (en) | Recombinant proteins with ccn domains and fusion proteins | |
| EP2162463B1 (en) | Vegf-d mutants and their use | |
| KR20220006013A (en) | Fusion protein comprising complement pathway inhibitor and use thereof | |
| EA046387B1 (en) | DESIGNS BASED ON DIFFERENTIATION AND GROWTH FACTOR 15 (GDF15) | |
| HK1228288A1 (en) | Endoglin peptides to treat fibrotic diseases | |
| HK1228288B (en) | Endoglin peptides to treat fibrotic diseases |