PT669394E - Variantes de uroquinase bifuncionais com propriedades fibrinoliticas melhoradas e actividade inibidora de trombina - Google Patents
Variantes de uroquinase bifuncionais com propriedades fibrinoliticas melhoradas e actividade inibidora de trombina Download PDFInfo
- Publication number
- PT669394E PT669394E PT94108872T PT94108872T PT669394E PT 669394 E PT669394 E PT 669394E PT 94108872 T PT94108872 T PT 94108872T PT 94108872 T PT94108872 T PT 94108872T PT 669394 E PT669394 E PT 669394E
- Authority
- PT
- Portugal
- Prior art keywords
- gly
- leu
- pro
- ser
- glu
- Prior art date
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/48—Hydrolases (3) acting on peptide bonds (3.4)
- C12N9/50—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/48—Hydrolases (3) acting on peptide bonds (3.4)
- C12N9/50—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
- C12N9/64—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue
- C12N9/6421—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue from mammals
- C12N9/6424—Serine endopeptidases (3.4.21)
- C12N9/6456—Plasminogen activators
- C12N9/6462—Plasminogen activators u-Plasminogen activator (3.4.21.73), i.e. urokinase
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P7/00—Drugs for disorders of the blood or the extracellular fluid
- A61P7/02—Antithrombotic agents; Anticoagulants; Platelet aggregation inhibitors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y304/00—Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
- C12Y304/21—Serine endopeptidases (3.4.21)
- C12Y304/21073—Serine endopeptidases (3.4.21) u-Plasminogen activator (3.4.21.73), i.e. urokinase
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Medicinal Chemistry (AREA)
- Microbiology (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Public Health (AREA)
- Pharmacology & Pharmacy (AREA)
- Hematology (AREA)
- Animal Behavior & Ethology (AREA)
- Diabetes (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Veterinary Medicine (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Enzymes And Modification Thereof (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Peptides Or Proteins (AREA)
Description
83 886 ΕΡ Ο 669 394/ΡΤ DESCRICÃO "Variantes de uroquinase bifuncionais com propriedades fibrinolíticas melhoradas e actividade inibidora de trombina" O presente invento refere-se a variantes de uroquinase bifuncionais com propriedades fibrinolíticas melhoradas e actividade inibidora de trombina, a plasmídeos para a obtenção destes polipéptidos, assim como a agentes trombolíticos contendo, como substância activa, uma variante de uroquinase bifuncional.
Uma característica importante do sangue humano é a sua capacidade de fechar lesões dos vasos sanguíneos através da formação de trombos. A coagulação do sangue é provocada por uma série de enzimas presentes no sangue as quais são responsáveis, em última análise, na chamada "cascata de coagulação", pela transformação proteolítica, da proteína precursora, fibrinogénio, em fibrina, pela enzima trombina. A fibrina polimeriza-se incluindo trombócitos, eritrócitos e outros componentes do sangue no local da lesão, formando um trombo.
Além disso, o sangue contém também uma série de enzimas que têm um efeito contrário à coagulação e asseguram o fluxo de sangue depois da regeneração das paredes dos vasos. A enzima mais importante para a trombólise é a plasmina, que ataca o tecido de fibrina proteoliticamente e provoca, desta maneira, a dissolução dos trombos. A plasmina é formada através de cisão proteolítica da proteína precursora inactiva, o plasminogénio. Esta activação é provocada por activadores de plasminogénio, através de cisão proteolítica do plasminogénio. Conhecem-se dois activadores de plasminogénio endógenos humanos: a uroquinase, um activador de plasminogénio existente na urina, e o activador de plasminogénio tissular. O enfarte cardíaco e o enfarte cerebral estão estreitamente ligados à formação patológica de trombos. Em ambas as formas de enfarte formam-se, na maior parte das vezes em consequência de alterações arterioscleróticas das artérias, sob determinadas condições, trombos nas paredes dos vasos. Estes trombos estorvam o fluxo sanguíneo nas artérias, sendo a consequência disso 2 83 886 ΕΡ Ο 669 394/ΡΤ que ο tecido já não pode ser alimentado suficientemente com oxigénio. Isto provoca, no caso do enfarte cardíaco, a necrose parcial ou total do músculo cardíaco. De modo análogo o bloqueio de artérias cerebrais provoca lesões graves no tecido cerebral.
Para a terapia de pacientes de enfarte são utilizados activadores de plasminogénio como agentes trombolíticos que dão início à dissolução dos trombos através da plasmina. Actualmente dispõe-se, para estas terapias, de estreptoquinase, APSAC {Anisolated Plasminogen Streptokinase Activator Complex), uroquinase de duas cadeias (UK), uroquinase recombinante de uma só cadeia (pro-uroquinase recombinante) e do activador de plasminogénio tissular (tPA) (Collen e Lijnen, Blood 28, 3114-3124 (1991)). A estreptoquinase é uma proteína de estreptococos hemolíticos. A estreptoquinase activa o plasminogénio, formando um complexo com o plasminogénio e transformando assim o plasminogénio numa estrutura activa. Este próprio complexo transforma plasminogénio livre em plasmina a qual, por sua vez, cinde o plasminogénio complexado com a estreptoquinase. Um aperfeiçoamento da estreptoquinase é o APSAC, um complexo fabricado in vitro, de estreptoquinase e plasminogénio humano. Devido a uma modificação química do local activo do plasminogénio, o APSAC possui uma semi-vida biológica superior à da estreptoquinase. A uroquinase é uma proteína humana que pode ser obtida como proteína com actividade proteolítica, a partir da urina, sob duas formas diferentes: a uroquinase de elevado peso molecular (HUK) e a uroquinase de baixo peso molecular (LUK) (Stump et a!., J. Biol. Chem. 261. 1267-1273 (1986)). HUK e LUK são moléculas de duas cadeias. A uroquinase é formada sob a forma de uroquinase de uma só cadeia (pro-uroquinase) em tecidos diferentes e pode ser detectada, sob a forma proenzima, em quantidades pequenas no sangue humano (Wun et a!., J. Biol. Chem. 257. 3276-3283 (1982)). A forma activada da pro-uroquinase tem, sob a forma de HUK, um peso molecular de 54 quilodalton e consiste em 3 domínios: o domínio amino-terminal de growth factor, o "Kringle" e um domínio de serina-protease (Gúnzler et al., Hoppe-Seyler's Z. Physiol. Chem. 363. 1155-1165 (1982); Steffens et al., Hoppe-Seyler's Z. Physiol. Chem. 363. 1043-1058 (1982)). Embora a pro-uroquinase e o plasminogénio estejam presentes sob a forma de proenzimas, a pro-uroquinase consegue, devido a uma actividade intrínseca, transformar 3 83 886 ΕΡ Ο 669 394/ΡΤ plasminogénio em plasmina activa. Este activador de plasminogénio, no entanto, apenas fica com a sua actividade completa depois da plasmina formada, por sua vez, ter cindido a pro-uroquinase entre 158lisina e 159lsoleucina (Lijnen et a/., J. Biol. Chem. 261. 1253-1258 (1986)). A obtenção de uroquinase através de métodos da tecnologia genética, em Escherichia coli foi descrita, pela primeira vez, por Heyneker (Proceedings of the IVth International Symposium on Genetics of Industrial Microorganisms 1982). Pro-uroquinase não glicosilada (Saruplase) é fabricada utilizando um gene sintético (Brigelius-Flohé et ai, Appl. Microbiol. Biotech. 36, 640-649 (1992)). O activador de plasminogénio tissular é uma proteína que existe no sangue e nos tecidos, com um peso molecular de 72 quilodalton. Este activador de plasminogénio consiste em 5 domínios: o domínio amino-terminal “finger", o domínio de growth factor, o "Kringle" 1, o "Kringle" 2 e um domínio de serina-protease. Ao contrário da pro-uroquinase, o tPA é capaz de cindir o plasminogénio só depois de ligação à fibrina. Como a pro-uroquinase, o tPA é transformado na forma activa através de uma cisão catalisada por plasmina, entre o "Kringle" 2 e o domínio de serina-protease. O activador de plasminogénio tissular liga-se, neste caso, à fibrina mas não ao fibrinogénio, sendo desta maneira o plasminogénio activado de forma específica do trombo. Ao contrário da uroquinase de duas cadeias, uma activação geral de plasminogénio é amplamente evitada (Collen e Lijnen, Blood 78, 3114-3124 (1991)).
Desde o início dos anos 80, o tratamento activo do enfarte do miocárdio com medicamentos trombolíticos tem-se mostrado eficaz e eficiente. Numa série de estudos foi demonstrado que o tratamento de pacientes de enfarte cardíaco com estreptoquinase, APSAC, UK, pro-uroquinase recombinante ou tPA, reduz significativamente a mortalidade em comparação com pacientes não tratados. Para melhorar a eficácia destas substâncias na terapia, foram fabricados, utilizando métodos de tecnologia genética, uma série de derivados do activador de plasminogénio tissular e da pro-uroquinase. No centro do interesse está, além de um aumento da actividade fibrinolítica e da redução dos efeitos secundários, o desenvolvimento de formas que sejam apropriadas para aplicação de bolus. Um resumo das tentativas de melhoramento dos activadores 4 83 886 ΕΡ Ο 669 394/ΡΤ de plasminogénio encontra-se em Thrombosis and Haemostasis 66, 88-110 (1991), assim como em Trends in Biotech. 9, 86-90 (1991).
Para melhorar a eficácia dos activadores de plasminogénio na terapia de lise e, especialmente, para aumentar a sua semi-vida biológica, foram fabricadas variantes, por deleção ou substituição, do activador de plasminogénio tissular, no quais foram removidos, por exemplo, o domínio “finger" e o domínio de growth factor ou em que o domínio de serina-protease foi substituído pelo domínio de serina-protease da uroquinase (Collen et ai., Thromb. Haemostasis 65. 174-180 (1991); Fromage et a!., Fibrinolysis 5, 187-190 (1991); Lu et ai., Blood 78, 125-131 (1991)). Mostrou-se, efectivamente, que a deleção dos domínios “finger" e de growth factor aumentava a semi-vida biológica das variantes de tPA (Lijnen e Collen, Thromb. Haemostasis 66, 94-95 (1991)). Uma variante obtida por deleção e substituição consistindo em ambos os domínios "Kringle" do tPA e no domínio da serina-protease da UK, era, na trombólise, superior aos activadores de plasminogénio originais, isto é não modificados, devido a uma semi-vida nitidamente superior. Estas variantes de activadores de plasminogénio, no entanto, possuíam apenas uma reduzida especificidade para fibrina (Lu et ai., Blood 78, 125-131 (1991)).
Foram realizadas várias tentativas para fabricar activadores de plasminogénio com maior especificidade para a fibrina. Para reduzir o risco de hemorragias, as substâncias activas deste género deveriam activar, se possível, plasminogénio exclusivamente na proximidade do trombo, sem provocarem uma activação sistémica do plasminogénio. Assim, por exemplo, conhece-se uma variante de tPA em que o "Kringle" 1 foi substituído pelo "Kringle" 2 da molécula original. É certo que esta variante possui uma maior afinidade para os resíduos lisina N-terminais, mas não para a fibrina. Relativamente à trombólise, esta variante não foi mais eficaz em modelos animais do que o activador de plasminogénio tissular original (Collen et ai., Thromb. Haemostasis 65, 174-180 (1991)). Outras variantes conhecidas, variantes essas que consistem em fusões entre um anticorpo específico para trombos e um activador de plasminogénio, são mais eficazes em modelos animais do que os activadores de plasminogénio originais (Lijnen e Collen, Thromb. Haemostasis 66, 88-110 (1991)). Um activador de plasminogénio que foi isolado do morcego Desmodus retundus possui uma especificidade muito elevada para a fibrina (Gardell et ai., J. Biol. 83 886 ΕΡ Ο 669 394/ΡΤ 5
Chem. 264. 17947-17952 (1989)). Este activador de plasminogénio apresenta, no modelo animal, uma trombólise melhorada em relação ao tPA, com uma semi-vida maior e uma activação sistémica de plasminogénio reduzida (Gardell et ai, Circulation 84, 244 a 253 (1991); Mellott et al., Arterioscl. Thromb. 12. 212 a 221 (1992)). O êxito de um tratamento de pacientes de enfarte com activadores de plasminogénio, no entanto, depende não só da trombólise como também do grau com que se consegue impedir um nova obstrução dos vasos sanguíneos que foram desentupidos. Vários diagnósticos indicam que, na trombólise, a trombina ligada nos trombos é outra vez libertada sob a forma de enzima activa e pode provocar novamente a obstrução de vasos (Szczeklik et a!., Arterioscl. Thromb. T2, 548 a 553 (1992); Eisenberg, Circulation 84, 2601-2603 (1991)). Com efeito, o efeito de agentes trombolíticos é melhorado através da administração simultânea ou anterior do inibidor de trombina heparina. Também através da administração de Argatroban, Hirugen ou proteína C é possível reduzir a reocorrência de obstruções na terapia de lise (Schneider, Thromb. Res. 64, 677-689 (1990); Yao et al., Am. Physiol. 262 (Heart Circ. Physiol. 31, H 374-H 379 (1992); Gruber et al., Circulation 84, 2454-2462 (1991). Além disso é sabido que a mortalidade de pacientes de enfarte é reduzida significativamente através da administração prévia de heparina e aplicação subsequente de pro-uroquinase, em relação a um grupo de controlo (aplicação de pro-uroquinase sem administração prévia de heparina) (Tebbe et al., Z. Kardiol. 80, Suppl 3, 32 (1991)).
Um dos inibidores de trombina mais potentes é a hirudina, isolada da sanguessuga Hirudo medicinales, a qual se liga com a sua parte carboxi-terminal especificamente ao local chamado local de ligação de aniões da trombina. Determinados aminoácidos da parte amino-terminal da molécula de hirudina bloqueiam o acesso à bolsa de ligação ao substrato da trombina (Rydel et a/., Science 249. 277-280 (1990)). Além disso sabe-se que a trombina pode também ser inibida por derivados mais pequenos da hirudina, devendo sublinhar-se especialmente as moléculas Hirulog (Krstenansky et ai, J. Med. Chem. 30, 1688-1691 (1987); Yue et ai, Protein Engineering 5, 77-85 (1992)). 6 83 886 ΕΡ Ο 669 394/ΡΤ A utilização de hirudina em combinação com um activador de plasminogénio, para o tratamento de doenças vasculares provocadas por tromboses é descrita nos pedidos de patente europeia EP 328 957 e EP 365 468. Do pedido internacional de patente WO 91/01142 conhece-se a utilização terapêutica de derivados da hirudina em combinação com um agente trombolítico.
No pedido internacional de patente WO 92/18139 são descritas moléculas quiméricas com uma parte activadora de plasminogénio que não se liga à fibrina e uma parte com afinidade em relação a componentes de placas arterioscleróticas que não de fibrina, por exemplo uma parte inibidora de trombina. Ambas as partes podem estar ligadas uma à outra através de um 12-mero consistindo em alanina ou contendo principalmente alanina. Num 1 2-mero rico em alanina podem estar substituídos 2 ou 3 resíduos de alanina por lisina ou arginina.
Do pedido internacional de patente WO 91/09125 conhecem-se proteínas de fusão, com um local de cisão entre a primeira e a segunda sequência, que possuem uma actividade fibrinolítica e/ou antitrombótica. A actividade fibrinolítica e/ou antitrombótica completa é obtida apenas depois da cisão, podendo esta ser provocada especialmente através de trombina. Isto tem, no entanto, a consequência de o inibidor de trombina libertado através da cisão inibir a trombina, o que impede uma continuação da cisão provocada por trombina. A trombina pode também ser inibida por um péptido derivado da sequência amino-terminal do receptor de trombina humano (Vu et a/., Nature 253. 674-677 (1991)). O receptor de trombina contém, na região amino-terminal, uma sequência que se liga à trombina, próxima de um local de cisão para trombina. A região do receptor que se liga à trombina, assemelha-se muito, na sua estrutura, ao domínio carboxi-terminal da hirudina. O receptor é activado por trombina através da cisão da sequência do receptor. Imitando a interacção que existe entre o receptor e a trombina, um fragmento do receptor com a região de ligação e um local de cisão modificado, actua como inibidor de trombina.
Da mesma maneira, a trombina pode ser inibida por um péptido derivado dos aminoácidos 41 a 57 da hemodina (Strube et ai, J. Biol. Chem. 268. 8590-8595 (1993)). O problema em que o presente invento assenta consistia no desenvolvimento de substâncias activas para o tratamento de obstruções vasculares causadas por tromboses, que conseguissem num espaço de tempo muito curto uma trombólise completa e impedissem ao mesmo tempo uma nova obstrução dos vasos após uma trombólise inicialmente bem sucedida. Além disso pretende-se evitar, com estas substâncias activas, uma activação sistémica do plasminogénio.
Verificou-se agora que estas rigorosas exigências para novas substâncias activas deste género, são cumpridas por determinadas variantes de uroquinase bifuncionais.
Em conformidade, o presente invento refere-se a variantes de uroquinase bifuncionais, de fórmula geral I M4-X1-Y1 em que M4 significa a sequência de aminoácidos 47Ser a 411 Leu da pro-uroquinase não glicosilada, de acordo com a figura 1 (SEQ ID NO: 21 e 22),
Xt é uma ligação directa entre M4 e Y, ou representa um péptido de sequência Ser-Pro-Pro-Ser-Pro-Pro-Gly-Gly-Phe ou
Ser-Pro-Pro-Ser-Pro-Pro-Ser-Pro-Pro-Gly-Gly-Phe ou
Ser-Pro-Pro-Ser-Pro-Pro-Ser-Pro-Pro-Gly-Gly-Phe-Gly ou
uma sequência peptídica de fórmula geral II 8 83 886 ΕΡ Ο 669 394/ΡΤ
Ser-X2-X3-X4-X5-X6-X7 em que Χ2 significa Pro ou Leu, X3 significa Vai ou Pro, X4 significa Lys, Vai, Arg, Gly ou Glu, X5 significa Ala, Vai, Gly, Leu ou lie, X6 significa Phe, Trp, Tyr ou Vai, e X7 significa Gly ou uma ligação directa entre X6 e Y1# e
Yt representa um péptido de sequência Y2-Arg-Pro-Y3-Gly-Gly-Gly-Gly-Asn-Gly-Asp-Phe-Glu-Glu-lle-Pro-Glu-Glu-Tyr-Leu-Y4 ou Y2-Arg-Pro-Phe-Leu-Leu-Arg-Asn-Pro-Asn-Asp-Lys-Tyr-Glu-Pro-Phe-Trp-Glu-Asp-
Glu-Glu-Lys-Asn-Glu ou Y2-Arg-Pro-Ser-Ser-Glu-Phe-Glu-Glu-Phe-Glu-lle-Asp-Glu-Glu-Glu-Lys, > onde Y2 é Pro ou Vai, Y3 é Leu ou uma ligação directa entre Pro e Gly, e Y4é Gin ou um grupo hidroxilo.
Em variantes de uroquinase bifuncionais de fórmula geral I em que Y, representa um péptido com a sequência Y2-Arg-Pro-Y3-Gly-Gly-Gly-Gly-Asn-Gly-Asp-Phe-Glu-Glu-lle-Pro-Glu-Glu-Tyr-Leu-Y4
em que Y2 significa Pro ou Vai, Y3 significa Leu ou uma ligação directa entre Pro e Gly, e Y4 significa Gin ou um grupo hidroxilo, XΛ é, de preferência, uma sequência peptídica de fórmula geral II
Ser-X2-X3-X4-X5-X6-X7 em que X2 significa Pro ou Leu, X3 significa Val, X4 significa Lys, Val ou Arg, X5 significa Ala, Val ou Gly, X6 significa Phe, Trp, Tyr ou Val, e X7 significa Gly ou uma ligação directa entre X6 e Y,. Nestas variantes de uroquinase bifuncionais preferem*se particularmente sequências peptídicas de fórmula geral II em que X2 significa Pro ou Leu, X3 significa Val, X4 significa Lys ou Val, X5 significa Ala ou
83 886 ΕΡ Ο 669 394/ΡΤ 9
Vai, Χ6 significa Phe, Trp ou Tyr, e X7 significa Gly ou uma ligação directa entre X6 e Yv especialmente em que X7 significa uma ligação directa entre X6eY,.
Em variantes de uroquinase bifuncionais de fórmula geral I, em que Y^ representa um péptido com a sequência .Y2-Arg-Pro-Phe-Leu-Leu-Arg-Asn-Pro-Asn-Asp-Lys-Tyr-Glu-Pro-Phe-Trp-Glu-Asp-
Glu-Glu-Lys-Asn-Glu,
Onde Y2 é Pro ou Vai, X^ é, de preferência, uma sequência peptídica de fórmula geral II,
Ser-X2-X3-X4-X5-X6-X7, em que X2 significa Pro ou Leu, X3 significa Vai, X4 significa Lys ou Vai, X5 significa Ala ou Vai, X6 significa Phe ou Trp, e X7 significa uma ligação directa entre X6eY,.
Em comparação com os activadores de plasminogénio que se conhecem e com as misturas, de um activador de plasminogénio e de um inibidor de trombina, que se conhecem, as variantes de uroquinase bifuncionais de acordo com o invento distinguem-se por uma actividade fibrinolítica mais forte e, simultaneamente, boas características, não previsíveis, de inibição de trombina. Além disso, os polipéptidos de acordo com o invento consomem, inesperadamente, fibrinogénio plasmático em quantidades nitidamente mais baixas. A especificidade para fibrina significativamente mais elevada que daí resulta, especialmente também em comparação com as misturas de um activador de plasminogénio e de um inibidor de trombina que se conhecem, tem como efeito a capacidade de coagulação do sangue ser pouco influenciada e o risco de hemorragias incontroladas, como complicação potencial de uma degradação sistémica do fibrinogénio, ser minimizado. A elevada especificidade para a fibrina das variantes de uroquinase de acordo com o invento torna portanto possíveis aplicações de bolus com um risco de ocorrência de hemorragias nitidamente reduzido em comparação com as aplicações de bolus de agentes trombolíticos conhecidos. 10 83 886 ΕΡ Ο 669 394/ΡΤ
As variantes de uroquinase bifuncionais de fórmula geral I são toxicologicamente inofensivas, podendo por isso ser administradas como tal, em preparações farmacêuticas adequadas, a pacientes com obstruções vasculares causadas por trombos.
Em conformidade, um outro objectivo do invento consiste em agentes trombolíticos contendo como substância activa uma variante de uroquinase bifuncional de fórmula geral I.
Para o tratamento de obstruções vasculares causadas por trombos, por exemplo enfarte cardíaco, enfarte cerebral, obstrução aguda de artérias periféricas, embolia pulmonar e trombose das veias profundas da perna e da bacia, são necessários 0,1 a 1 mg/kg de um polipéptido de acordo com o invento. As variantes de uroquinase bifuncionais podem ser administradas de forma intravenosa e, particularmente, através de injecção de bolus.
Os agentes trombolíticos de acordo com o invento contêm além de, pelo menos, uma variante de uroquinase bifuncional, aditivos auxiliares, como por exemplo materiais de transportadores, solventes, diluentes, corantes e aglutinantes. A escolha dos aditivos auxiliares, assim como das quantidades a aplicar, depende da forma prevista para a aplicação do medicamento, e não constitui nenhum problema para o perito. A produção das variantes de uroquinase bifuncionais é realizada através de métodos de tecnologia genética. Em conformidade, são também um objectivo do invento, plasmídeos para serem utilizados na obtenção de variantes de uroquinase bifuncionais de fórmula geral I contendo um operão com um promotor regulável, uma sequência de Shine-Dalgarno que actua como local de ligação ao ribossoma, um códão de iniciação, um gene estrutural sintético para uma variante de uroquinase bifuncional de fórmula geral I e, a jusante do gene estrutural, um ou dois terminadores.
Um promotor regulável particularmente apropriado é o promotor trp ou o promotor tac. Como terminador utiliza-se, de preferência, o terminador trp A e/ou o terminador tet A/orf L de Tn 10. 11 83 886 ΕΡ Ο 669 394/ΡΤ
Na região de controlo dos plasmídeos de acordo com o invento, a distância entre a sequência de Shine-Dalgarno e o códão de iniciação é de 6-12, de preferência 8-10 nucleótidos. A expressão dos plasmídeos de acordo com o invento é realizada em estirpes de Escherichia coli, especialmente em estirpes de Escheríchia coli do grupo K12, por exemplo E.coli K12 JM 101 (ATCC 33876), E.coli K12 JM 103 (ATCC 39403), E.coli K12 JM 105 (DSM 4162) e E.coli K12 DH 1 (ATCC 33849). As variantes de uroquinase bifuncionais de fórmula geral I de acordo com o invento são obtidas na célula bacteriana com elevado rendimento, em corpos de inclusão nos quais a proteína existe sob a forma desnaturada. Após o isolamento dos corpos de inclusão, a proteína desnaturada é redobrada na estrutura terciária desejada utilizando técnicas químicas usuais para proteínas, envolvendo um sistema redox,.
Exemplos 1) Preparação, isolamento e purificação de variantes de uroquinase bifuncionais de acordo com o invento a) Métodos de clonagem
Os plasmídeos de expressão para a produção, através de métodos de tecnologia genética, dos polipéptidos de acordo com o invento em Escherichia co/i, foram produzidos de modo conhecido. A ordem sequencial dos passos individuais da produção está representada nas figuras 2 e 2a a 2p. Os produtos de partida para a produção dos plasmídeos foram os plasmídeos pBluescriptKSII + (Stratagene, Heidelberg), pUC8 (Pharmacia, Freiburg) e pGR201. O pGR201 é idêntico ao plasmídeo pBF1 60 descrito em EP 408 945 e Appl. Microbiol. Biotechn. 36, 640-649 (1992). As endonucleases de restrição Banll, BamHI, Clal, Hindlll, Ncol, Ndel, Nhel e Notl, assim como as enzimas modificadoras de ADN, como a fosfatase alcalina, a ligase de T4, a quinase de T4 e a polimerase de T4, foram compradas a Pharmacia, Stratagene, Boehringer (Mannheim) e Gibco (Eggenstein). As modificações dos plasmídeos durante a sua fabricação foram controladas através de análise de restrição e sequenciação do ADN. A sequenciação do ADN foi realizada de acordo com as 12 83 886 ΕΡ Ο 669 394/ΡΤ recomendações do fabricante, com um conjunto de reagentes de Pharmacia. Na produção dos plasmídeos utilizaram-se diferentes oligodesoxirribonucleótidos (oligos) cujas sequências estão indicadas, juntamente com as respectivas designações, na tabela 1 seguinte.
Tabela 1:
Designação do oligo Sequência do oligo (de 5' para 3') 0105 TATGAGCAAAACTTGCTACGAAGGTAACGGTCACTTCTA SEQ ID NO:49 CCGTGGTAAGGCTTCTACCGACAC 0106 CATGGTGT C GGTAGAAGC C TTAC CACGGTAGAAGTGAC C SEQ ID N0:50 GTTACCTTCGTAGCAAGTTTTGCTCA 0220 CGGTTAAGGCTTTCCCGAGGCCTGGTGGTGGTGGTAACG SEQ ID NO:51 GTGACTTCGAAGAAATCCCGGAAGAGTACCTGTGATAGG ATCAA 0221 CTAGTTGATCCTATCACAGGTACTCTTCCGGGATTTCTT SEQ ID NO:52 CGAAGTCACCGTTACCACCACCACCAGGCCTCGGGAAAG CCTTAACCGGGCT 0222 CGCCGAGCCCGCCGAGCCCGCCGGGTGGTTTCCCGAGGC SEQ ID NO:53 CTGGTGGTGGTGGTAACGGTGACTTCGAAGAAATCCCGG AAGAGTACCTGTGATAGGATCAA 0223 CTAGTTGATCCTATCACAGGTACTCTTCCGGGATTTCTT SEQ ID NO:54 CGAAGTCACCGTTACCACCACCACCAGGCCTCGGGAAAC CACCCGGCGGGCTCGGCGGGCTCGGCGGCT 0224 CGCCGGGTGGTTTCCCGAGGCCTGGTGGTGGTGGTAACG SEQ ID NO:55 GTGACTTCGAAGAAATCCCGGAAGAGTACCTGTGATAGG ATCAA 0225 CTAGTTGATCCTATCACAGGTACTCTTCCGGGATTTCTT SEQ ID NO:56 CGAAGTCACCGTTACCACCACCACCAGGCCTCGGGAAAC CACCCGGCGGGCT 0226 CGCCGAGCCCGCCGAGCCCGCCGGGTGGTTTCGGTCCGA SEQ ID NO:57 GGCCTGGTGGTGGTGGTAACGGTGACTTCGAAGAAATCC C GGAAGAGTAC C TGTGATAGGAT CAA
Designação do oligo Sequência do oligo (de 5' para 3') 0227 CTAGTTGATCCTATCACAGGTACTCTTCCGGGATTTCTT SEQ ID NO:58 CGAAGTCACCGTTACCACCACCACCAGGCCTCGGACCGA AACCACCCGGCGGGCTCGGCGGGCTCGGCGGGCT 0265 CACCCGGCGGAGACGGCGGGCTCAGAGCCAGACCGTTTT SEQ ID NO:59 CTTCTTTGGTGTGAGAACG 0281 CGTCCGGGTGGTGGTGGTAACGGTGACTTCGAAGAAATC SEQ ID N0:60 CCGGAAGAATACCTGTAAG 0282 GATCCGTTCTCACACCAAAGAAGAAAACGGTCTGGCTCT SEQ ID NO:61 GAGCCCGCCGTCTCCGCCGGGTGGTTTCCCG 0283 CTAGCTTACAGGTATTCTTCCGGGATTTCTTCGAAGTCA SEQ ID NO:62 CCGTTACCACCACCACCCGGACGCGGGAAAC 0329 SEQ ID NO:63 AAGAAAT C C C GGAAGAAT AC CTGCAATAAG 0330 CGGTTAAGGCTTGGGGACCGCGGCCGCTGGGTGGTGGTG SEQ ID NO:64 GTAACGGTGACTTCG 0331 ACCACCACCCAGCGGCCGCGGTCCCCAAGCCTTAACCGG SEQ ID NO:65 GCT 0332 CTAGCTTATTGCAGGTATTCTTCCGGGATTTCTTCGAAG SEQ ID NO:66 TCACCGTTACC 0333 SEQ ID NO:67 CGGTTAAGGCTTT6 CGGACCGC 0334 SEQ ID NO:68 GGCCGCGGTCCGAAAGCCTTAACCGGGCT 0335 SEQ ID NO:69 CGGTTCGGGCTTTCGGTCCGC 0336 SEQ ID N0:70 GGCCGCGGACCGAAAGCCCGAACCGGGCT 0337 SEQ ID NO:71 CGGTTAAGGCTTACGGACCGC 0338 SEQ ID NO:72 GGCCGCGGTCCGTAAGCCTTAACCGGGCT 14 83 886 ΕΡ Ο 669 394/ΡΤ
Designação do oligo Sequência do oligo (de 5' para 3') 0339 SEQ ID NO:73 CGGTTGTTGCTTTCGGTCCGC 0340 SEQ ID NO:74 GGCCGCGGACCGAAAGCAACAACCGGGCT 0341 SEQ ID NO:75 CGGTTCGGGCTTTCCCGC 0342 SEQ ID NO:76 GGCCGCGGGAAAGCCCGAACCGGGCT 0343 SEQ ID NO:77 CGGTTAAGGCTTACCCGC 0344 SEQ ID NO:78 GGCCGCGGGTAAGCCTTAACCGGGCT 0347 SEQ ID NO:79 CGGTTGTTGCTTTCCCGC 0348 SEQ ID N0:80 GGCCGCGGGAAAGCAACAACCGGGCT 0381 SEQ ID NO:81 CGGTTAAGGCTTGGCCGC 0383 SEQ ID NO:82 GGCCGCGGCCAAGCCTTAACCGGGCT 0384 SEQ ID NO:83 CGGTTAAGGCTTTCCCGC 0385 SEQ ID NO:84 GGCCGCGGGAAAGCCTTAACCGGGCT 0386 SEQ ID NO:85 CGGTTGTAGTTTTCCCGC 0387 SEQ ID NO:86 CGGTTGAAGTTTTCCCGC 0388 SEQ ID NO:87 GGCCGCACTACAACTACAACCGGGCT
83 886 ΕΡ Ο 669 394/ΡΤ 15
Designação do oligo Sequência do oligo (de 5’ para 3') 0389 SEQ ID NO:88 CGGTTGTAGTTGTAGTGC 0390 SEQ ID NO:89 GGCCGCGGGAAAACTTCAACCGGGCT 0391 SEQ ID N0:90 GGCCGCGGGAAAACTACAACCGGGCT 0392 CTAGCTTATTCGTTTTTTTCTTCGTCTTCCCAGAACGGT SEQ ID NO:91 TCGTATTTGTCGTTCGGGTTCCGCAGCAGGAAC 0393 GGCCGTTCCTGCTGCGGAACCCGAACGACAAATACGAAC SEQ ID NO:92 CGTTCTGGGAAGACGAAGAAAAAAACGAATAAG 0453 SEQ ID NO:93 TGGTTAAAGCTTTCCCGC 0454 SEQ ID NO:94 GGCCGCGGGAAAGCTTTAACCAGGCT 0455 SEQ ID NO:95 TGGTTGTTGCTTTCCCGC 0456 SEQ ID NO:96 GGCCGCGGGAAAGCAACAACCAGGCT 0465 GGCCGCGGGAACAGAGCCAGACCGTTTTCTTCTTTGGTG SEQ ID NO:97 TGAGAACG 0466 GATCCGTTCTCACACCAAAGAAGAAAACGGTCTGGCTCT SEQ ID NO:98 GTTCCCGC 0467 SEQ ID NO:99 CGGTTAAGGCTTTCCCGCGGCCGTTCCTGCTGCGGAAC 0468 TTTGTCGTTCGGGTTCCGCAGCAGGAACGGCCGCGGGAA SEQ ID N0:100 AGCCTTAACCGGGCT 0469 CTAGCTTATTCGTTTTTTTCTTCGTCTTCCCAGAACGGT SEQ ID NO:101 TCGTA 0470 CCGAACGACAAATACGAACCGTTCTGGGAAGACGAAGAA SEQ ID NO: 102 AAAAACGAATAAG
Os oligodesoxirribonucleótidos foram fabricados sob a forma destritilada à escala de 0,1 /ymole num sintetizador (Modelo 391) de Applied Biosystems (Weiterstadt), de acordo com as indicações do fabricante, utilizando di-isopropilaminofosfoamidatos protegidos com b-cianoetilo. Fosforilaram-se 100 pmol de oligodesoxirribonucleótido de cada vez, em tri-(hidroximetil)-aminometano/HCI (tris/HCI) 50 mM, cloreto de magnésio 10 mM e ditiotreitol 5 mM, a um valor de pH 7,5, com uma unidade de enzima quinase de T4 na presença de adenosina-trifosfato 10 mM e a seguir, no mesmo tampão, transformaram-se em moléculas de ADN de cadeia dupla. As moléculas sintéticas de ADN de cadeia dupla obtidas foram purificadas através de electroforese num gel de poliacrilamida (poliacrilamida a 5%) e, a seguir, foram utilizadas para ligação com os plasmídeos adequadamente preparados. A preparação dos plasmídeos através de digestão com enzimas de restrição, isolamento dos respectivos fragmentos de restrição e desfosforilação dos terminais 5', a ligação subsequente e a transformação em E.coli K12 JM103, assim como todas as operações de tecnologia genética seguintes foram realizadas de modo convencional e estão descritas em Sambrook et al. "Molecular Cloning: A Laboratory Manual", 2a. edição, Cold Spring Harbor Laboratory Press, Cold Spring Harbour, USA, 1989. b) Produção de culturas permanentes e fermentação
Os plasmídeos de expressão recombinantes pSJ69, pSJ76, pSJ77, pSJ78, pSJ79, pSJ81, pSJ83, pSJ90, pSJ91, pSJ92, pSJ93, pSJ94, pSJ95, pSJ101, pSJ102, pSJ103, pSJ104, pSJ105, pSJ106, pSJ109, pSJ111, pSJ114 e pSJ113 foram inseridos em E.coli K12 JM103 (ATCC39403) e espalhados em ágar padrão I (150 mg/l de ampicilina) (Sambrook et aí. "Molecular Cloning: A Laboratory Manual"). Colónias individuais de cada transformação, respectivamente, foi cultivada no meio padrão I (pH 7,0; 150 mg/l de ampicilina) a 20°C até à densidade óptica (DO) de 1 a 578 nm, e congelaram-se 5 porções de 2 ml, sob a forma de cultura permanente com adição de dimetilsulfóxido (DMSO) (concentração final de 7,5%) em azoto líquido e conservada a -70°C. Para obter as variantes de uroquinase bífuncionais suspendeu-se 1 ml, respectivamente, de cada cultura permanente 17 83 886 ΕΡ Ο 669 394/ΡΤ em 20 ml de meio padrão I (pH 7,0; 1 50 mg/l de ampicilina) e cultivou-se a 37°C até à DO de 1 a 578 nm. A seguir, suspendeu-se a quantidade total da cultura obtida em 1 I de meio padrão I (pH 7,0; 150 mg/l de ampicilina) e fermentou-se em balões de agitação a 37°C. A indução foi realizada por adição de 2 ml de solução de ácido indoloacrílico (60 mg em 2 ml de etanol) a uma DO de 0,5 a 1 a 578 nm. c) Teste de expressão
Para verificar a taxa de expressão (unidades Ploug por DO por ml) separaram-se por centrifugação, imediatamente antes da indução e de hora a hora depois da indução (6 horas no total) células correspondendo a 1 ml de uma suspensão celular com uma DO de 1 a 578 nm. As células centrifugadas foram lisadas com lisozima (1 mg de lisozima por ml em tampão tris/HCI 50 mM, pH 8,0, ácido etilenodiaminotetra-acético (EDTA) 50 mM e sacarose a 15% em volume). As células lisadas foram solubilizadas em solução 4-5 M de cloridrato de guanidina e, após diluição até 1,2 M de cloridrato de guanidina, submetidas, por adição de um agente redutor (glutationa ou cisteína) durante 2-5 horas, à reacção de redobragem (Winkler et a!., Biochemistry 25 4041 a 4045 (1986)). As variantes de uroquinase bifuncionais de uma só cadeia obtidas foram transformadas, através da adição de plasmina, nas respectivas variantes de uroquinase de duas cadeias, cuja actividade foi determinada com o substrato cromogénico piro-Glu-Gly-Arg-p-nitroanilida, que é cindido só por uroquinases activas de duas cadeias. A activação das variantes de uroquinase bifuncionais de acordo com o invento, com plasmina, foi realizada em tampão tris/HCI 50 mM, cloreto de sódio 12 mM, Tween 80 a 0,02%, a um pH 7,4 e 37°C. A relação entre a variante de uroquinase bifuncional e a plasmina era cerca de 100-1500 para 1, relação molar, ou cerca de 8 000-36 000 para 1 relação de unidades de enzima. A incubação de teste foi realizada em tampão tris/HCI 50 mM e cloreto de sódio 38 mM, a um pH 8,8, na presença de aprotinina 0,36 μΜ (para inibição da plasmina) e substrato piro-Glu-Gly-Arg-p-nitroanilida 0,27 mM, a 37°C. Em função da concentração de variante de uroquinase bifuncional, a reacção foi feita parar após uma incubação de 5 a 60 minutos, através da adição de ácido acético a 50%, e foi medida a extinção a 405 nm. Ao proceder desta maneira, uma alteração da extinção de 0,05 por minuto a 405 nm 18 83 886 ΕΡ Ο 669 394/ΡΤ corresponde, de acordo com as indicações do fabricante do substrato (Kabi Vitrum, Suécia), a uma actividade de uroquinase de 25 unidades Ploug por ml de solução de teste. As variantes de uroquinase bifuncionais de acordo com o invento apresentavam actividades específicas entre 120 000 e 155 000 unidades Ploug por mg de proteína purificada. O teor de proteína das soluções foi determinado através do ensaio BCA da Pierce. d) Isolamento e purificação 5 a 6 horas após a indução foi terminada a fermentação realizada sob as condições descritas em 1b) (densidade 5-6 DO a 578 nm). As células foram separadas por centrifugação. As células precipitadas foram ressuspensas em 200 ml de água e lisadas no homogeneizador de alta pressão. A seguir a uma nova centrifugação o precipitado, que continha toda a quantidade da variante de uroquinase bifuncional de uma só cadeia, foi dissolvido em 500 ml de cioridrato de guanidina 5 M, cisteína 40 mM, EDTA 1 mM, a um valor de pH 8,0, e diluído com 2000 ml de tris/HCI 25 mM com um valor de pH 9,0. A reacção de redobragem ficou concluída ao fim de cerca de 12 horas.
Após a adição de 8 g de gel de sílica, as variantes de uroquinase bifuncionais obtidas foram ligadas totalmente ao gel de sílica através de uma agitação de 2 horas. O gel de sílica carregado foi separado e lavado com tampão acetato (pH 4,0). As variantes de uroquinase foram eluídas com cloreto de tetrametilamónio (TMAC) 0,5 M em tampão de acetato 0,1 M (pH 4). Após duas separações cromatográficas (coluna de quelato de cobre e permuta iónica), as variantes de uroquinase foram obtidas sob a forma pura. Através de análise de sequenciação do terminal N provou-se, por um lado, a existência de uma só cadeia e, por outro lado, a que a sequência amino-terminal era a desejada. A caracterização através de métodos químicos usual para as proteínas, do domínio carboxi-terminal modificado das variantes individuais, foi obtida depois de cisão da proteína com CNBr (dissolvida em 1 ml de ácido fórmico a 90% e 1 ml de ácido heptafluorobutírico), ocorrendo a cisão da cadeia peptídica a seguir a resíduos triptofano. O péptido carboxi-terminal foi separado e purificado, antes da análise de sequênciação, através de HPLC (High Pressure Liquid Chromatography). 19 83 886 ΕΡ Ο 669 394/ΡΤ
Todas as variantes de uroquinase bifuncionais isoladas e listadas na tabela 2 não apresentavam, num teste de actividade directo com o substrato cromogénico para uroquinase, nenhuma actividade ou apenas uma actividade muito reduzida (inferior a 1200 unidades Ploug por mg de proteína purificada). Só depois de cisão com plasmina (as condições estão indicadas no ponto 1c)), foi obtida uma actividade enzimática entre as 120 000 e 155 000 unidades Ploug por mg de proteína purificada. De acordo com isto, todas as variantes de uroquinase foram expressas em E.coli K12 JM103 sob a forma de proteínas de uma só cadeia.
Tabela 2: Variantes de uroquinase bifuncionais (bU) de acordo com o invento de fórmula geral I, INM^-Y, bU Xi Yi M11 Ser-Pro-Pro-Ser-Pro- Pro-Gly-Gly-Phe A11 com Y2 = Pro, Y3 = ligação directa entre Pro e Gly, Y4 = OH M12 Ser-Pro-Val-Lys-Ala- Phe A1) com Y2 = Pro, Y3 = ligação directa entre Pro e Gly, Y4 = OH M13 Ser-Pro-Pro-Ser-Pro- Pro-Ser-Pro-Pro-Gly- Gly-Phe A11 com Y2 = Pro, Y3 = ligação directa entre Pro e Gly, Y4 = OH M14 Ser-Pro-Pro-Gly-Gly- Phe A" com Y2 = Pro, Y3 = ligação directa entre Pro e Gly, Y4 = OH M15 Ser-Pro-Pro-Ser-Pro- Pro-Ser-Pro-Pro-Gly- Gly-Phe-Gly A11 com Y2 = Pro, Y3 = ligação directa entre Pro e Gly, Y4 = OH M16 Ser-Pro-Val-Lys-Ala- Trp-Gly A1) com Y2 = Pro, Y3 = Leu, Y4 = Gin M17 Ser-Pro-Val-Lys-Ala- Phe-Gly A1) com Y2 = Pro, Y3 = Leu, Y4 = Gin M18 Ser-Pro-Val-Arg-Ala- Phe-Gly A11 com Y2 = Pro, Y3 = Leu, Y4 = Gin M19 Ser-Pro-Val-Lys-Ala- Tyr-Gly A1’ com Y2 = Pro, Y3 = Leu, Y4 = Gin
bU Xl Yl M20 Ser-Pro-Val-Val-Ala- Phe-Gly A1> com Y2 = Pro, Y3 = Leu, Y4 = Gin M21 Ser-Pro-Val-Arg-Ala- Phe A11 com Y2 = Pro, Y3 = Leu, Y4 = Gin M22 Ser-Pro-Val-Lys-Ala- Tyr A1) com Y2 = Pro, Y3 = Leu, Y4 = Gin M23 Ser-Pro-Val-Val-Ala- Phe A1) com Y2 = Pro, Y3 = Leu, Y4 = Gin M24 Ser-Pro-Val-Lys-Ala- Trp A11 com Y2 = Pro, Y3 = Leu, Y4 = Gin M25 Ser-Pro-Val-Lys-Ala- Phe A11 com Y2 = Pro, Y3 = Leu, Y4 = Gin M26 Ser-Pro-Val-Val-Val- Phe A11 com Y2 = Pro, Y3 = Leu, Y4 = Gin M27 Ser-Pro-Val-Glu-Val- Phe A11 com Y2 = Pro, Y3 = Leu, Y4 = Gin M28 Ser-Pro-Val-Val-Val- Val A1’ com Y2 = Vai, Y3 = Leu, Y4 = Gin M29 Ser-Pro-Val-Val-Ala- Phe B21 com Y2 = Pro M30 Ser-Leu-Val-Val-Ala- Phe A1) com Y2 = Pro, Y3 = Leu, Y4 = Gin M31 Ser-Leu-Val-Lys-Ala- Phe A1) com Y2 = Pro, Y3 = Leu, Y4 = Gin M32 Ser-Pro-Val-Lys-Ala- Phe B2> com Y2 - Pro M33 ligação directa entre M4 e Y, A1) com Y2 = Pro, Y3 = Leu, Y4 = Gin 1) A = Y2-Arg-Pro-Y3-Gly-Gly-Gly-Gly-Asn-Gly-Asp-Phe-Glu-Glu-lle-Pro-Glu-Glu-Tyr-I_eu-Y4 21 B = Y2-Arg-Pro-Phe-Leu-Leu-Arg-Asn-Pro-Asn-Asp-Lys-Tyr-Glu-Pro-Phe-Trp-Glu-Asp-Glu-Glu-Lys-Asn-Glu
83 886 ΕΡ Ο 669 394/ΡΤ 21 2) Análises farmacológicas
Determinação da actividade inibidora de trombina A actividade inibidora das variantes de uroquinase bifuncionais de acordo com o invento foi determinada através de medição do tempo de trombina, misturando 200 μΙ de uma diluição de 1:10 de plasma de citrato humano num tampão de veronal, com 50 μΙ de solução de trombina (0,2 unidades) e 50 μΙ de uma solução aquosa contendo 0,5-50 μ9 de uma variante de uroquinase bifuncional. A seguir mediu-se o tempo decorrido até à formação de um tecido de fibrina. Na tabela 3 estão indicados os factores de inibição medidos, os quais indicam, em cada caso, o aumento do tempo de trombina na presença de 10 pg de uma variante de uroquinase bifuncional de acordo com o invento. O aumento do tempo de trombina em função da concentração foi também determinado e está representado graficamente na figura 3, para as variantes de uroquinase bifuncionais M12, M23, M29, M32, M33 e, a título de comparação, M4. Ao contrário das variantes de uroquinase bifuncionais de acordo com o invento, o tempo decorrido até à coagulação não foi prolongado nem por M4, isto é, a sequência de aminoácidos 47Ser a 411 Leu da pro-uroquinase não glicosilada de acordo com a figura 1, nem pela pro-uroquinase não glicosilada (Saruplase), nem pela LUK em doses de 1 mg. (Segue Tabela)
Tabela 3: Aumento do tempo de trombina por de variantes de uroquinase bifuncionais de acordo com o invento de fórmula geral I ΜΦΧτ-Υτ
Variante de uroquinase bifuncional Factor de inibição” M11 (SEQ ID NO: 23 e 24) 1,8 M12 (SEQ ID NO: 25 e 26) 4.6 M13 (SEQ ID NO: 27 e 28) 1,7 M14 (SEQ ID NO: 29 e 30) 1,8 M15 (SEQ ID NO: 31 e 32) 2,5 M16 (SEQ ID NO: 33 e 34) 3,2 M17 (SEQ ID NO: 35 e 36) 3,1 M18 (SEQ ID NO: 37 e 38) 2,9 M19 (SEQ ID NO: 39 e 40) 2,0 M20 (SEQ ID NO: 41 e 42) 2,2 M21 (SEQ ID NO: 43 e 44) 2,3 M22 (SEQ ID NO: 45 e 46) 3,7 M23 (SEQ ID NO: 47 e 48) 5,3 M24 (SEQ ID NO: 1 e 2) 6,2 M25 (SEQ ID NO: 3 e 4) 2,9 M26 (SEQ ID NO: 5 e 6) 3,2 M27 (SEQ ID NO: 7 e 8) 2,0 M28 (SEQ ID NO: 9 e 10) 2,1 M29 (SEQ ID NO: 11 e 12) 2,6 M30 (SEQ ID NO: 13 e 14) 3,4 M31 (SEQ ID NO: 15 e 16) 2,0 M32 (SEQ ID NO: 19 e 20) 3,0 M33 (SEQ ID NO: 17 e 18) 2,0 1) em relação ao efeito de 10 μς de proteína;
Factor de inibição = quociente entre o tempo de trombina na presença de um inibidor, e o tempo de trombina na ausência de um inibidor 23 83 886 ΕΡ Ο 669 394/ΡΤ
Características farmacológicas das variantes de uroauinase bifuncionais M12 e M23 num ensaio em animais
Num modelo farmacológico in vivo foi ensaiado o efeito das variantes de uroquinase bifuncionais M12 e M23 na trombólise de obstruções vasculares arteriais, em comparação com Sarupiase (pro-uroquinase não glicosilada). Para este efeito injectou-se localmente, em coelhos anestesiados, num segmento da artéria femural temporariamente isolado, de cerca de 1 cm, através de um ramo lateral, trombina e fibrinogénio humano marcados com 125l. Em consequência, formou-se um trombo que deu origem a uma obstrução vascular completa. O tamanho do trombo formado foi determinado através da radioactividade incorporada na fibrina humana, utilizando um detector de raios gama extracorporal. A medição electromagnética do fluxo de sangue e o registo da radioactividade do trombo foram realizados continuamente durante todo o período do ensaio. A actividade fibrinolítica foi portanto quantificada não apenas como reperfusão do vaso obstruído pelo trombo, como também através da degradação da fibrina incorporada, marcada radioactivamente, do trombo. Antes da aplicação das variantes de uroquinase bifuncionais de acordo com o invento, assim como 30, 60 e 90 minutos depois da aplicação das variantes de uroquinase, foram recolhidas amostras de sangue nas quais se determinaram as concentrações de fibrinogénio no plasma. Foram aplicados, sob a forma de injecções de bo/us intravenosas, respectivamente, 6 mg/kg de M12, M23 e Sarupiase. Dado que M12 e M23 possuem além disso, e ao contrário da Sarupiase, um efeito anticoagulante, combinou-se num 4o grupo de ensaio, Sarupiase com o anticoagulante heparina (150 U/kg de bolus i.v. Cada grupo continha 6 animais.
Durante os 90 minutos de duração do ensaio, a trombólise da fibrina marcada do trombo foi de 46±11 % para M1 2, 43+1 2% para M23, 22±5% para Sarupiase e 39±15% para a combinação de Sarupiase-heparina. As aplicações de bolus de M12 e M23 resultaram, em todos os 6 animais, na desobstrução do vaso obstruído pelo trombo; através da aplicação de Sarupiase foi possível a reperfusão do vaso em 5 de 6 animais e, através da aplicação de Sarupiase e heparina, em 4 de 6 animais. O valor máximo do fluxo de reperfusão (em % do valor inicial) foi de 95±10% para M12 e 82±9% para M23, e diferiu significativamente do valor máximo do fluxo de reperfusão, de 43±12%, para 24 83 886 ΕΡ Ο 669 394/ΡΤ
Saruplase. Ο valor máximo do fluxo de reperfusão, de 58±8%, no tratamento com Saruplase e heparina, encontrava-se entre os resultados de M12 e M23, por um lado, e Saruplase, por outro lado, e não difere significativamente em relação aos dois lados. A actividade fibrinolítica total foi determinada sob a forma da área do fluxo de reperfusão (como % do fluxo inicial) ao longo dos 90 minutos de duração do ensaio. Esta actividade total foi de 4502±1127%-min para M12 e 4270±885%-min para M23 e, para ambas as variantes de uroquinase de acordo com o invento, foi significativamente superior ao valor de 1519±643%*min para Saruplase. Com o tratamento combinado com Saruplase-heparina foi medida uma actividade total de 2217±761 %-min, que não foi significativamente melhor do que o valor obtido no tratamento exclusivamente com Saruplase e se encontrava nitidamente abaixo dos resultados obtidos com M12 e M23. Os resultados estão resumidos na tabela 4.
Tabela 4: Actividade trombolítica após uma aplicação de bo/us i.v.; trombose arterial femural, coelho anestesiado.
Polipéptido Dose 125l-fibrinólise Fluxo de reperfusão máximo (% do valor prévio) Fluxo de reperfusão cumulativo (% · min) M12 6 mg/kg 46+11 95 + 10* 4502 ±1127 M23 6 mg/kg 43 ± 12 82 ± 9* 4270± 885* Saruplase 6 mg/kg 22 ± 5 43 ± 12 1519 + 643 Saruplase + heparina 6 mg/kg 150 U/kg 39 ± 15 58 ± 8 2217 ± 761 * p <0.05 vs Saruplase
Inesperadamente verificou-se que não apenas após a aplicação de boíus de M12 como também após a aplicação de bo/us de M23, as concentrações de fibrinogénio no plasma diminuíram significativamente menos do que após a aplicação de bo/us de Saruplase. Os resultados encontram-se resumidos na tabela 5. 25 83 886 ΕΡ Ο 669 394/ΡΤ
Tabela 5: Efeito das aplicações de bo/us de M12 e M23 em comparação com a Saruplase, sem e com heparina, na diminuição da concentração de fibrinogénio no plasma; coelhos anestesiados
Polipéptido Dose Diminuição de fibrinogénio no plasma (alteração em % em relação ao valor inicial) Tempo após a aplicação 30 min 60 min 90 min M12 6 mg/kg -19 ± 9 -20 ± 9* -19 ± 9* M23 6 mg/kg -20 ± 11 * -21 ±11* -20 ± 11 * Saruplase 6 mg/kg -64 ± 7 -66 ± 6 -67 ± 6 Saruplase + heparina 6 mg/kg 150 U/kg n.d.1’ -46 ± 8 -45 ± 9 * p <0,05 vs Saruplase 11 n.d. = não determinada
Os resultados mostram que as variantes de uroquinase bifuncionais de acordo com o invento, M12 e M23, dissolvem trombos arteriais que provocam uma obstrução vascular completa, restaurando o fluxo sanguíneo nos vasos obstruídos pelo trombo. Este efeito foi obtido através de uma aplicação única de bo/us de M12 ou M23, respectivamente, em animais não heparinizados. Inesperadamente, esta actividade fibrinolítica mais forte de M12 e M23 em comparação com Saruplase foi acompanhado por um consumo mais baixo de fibrinogénio do plasma. Isto significa que M12 e M23 apresentam uma especificidade para a fibrina significativamente mais elevada em comparação com a Saruplase. A melhor preservação de fibrinogénio do plasma de M12 e M23 em comparação com a Saruplase, significa que a capacidade de coagulação do sangue é mantida em melhores condições, o que reduz o risco de hemorragias incontroladas como complicações possíveis de uma degradação sistémica de fibrinogénio. M12 e M23 devem portanto ser classificadas como mais seguros do que Saruplase em relação ao risco de efeitos secundários hemostaseológicos.
83 886 ΕΡ Ο 669 394/ΡΤ 26
LISTAGEM DE SEQUÊNCIAS (1) INFORMAÇÃO GERAL: (i) REQUERENTE:
(A) NOME: Gruenenthal GmbH (B) RUA: Zieglerstrasse 6 (C) CIDADE: Aachen (E) PAÍS: Alemanha (F) CÓDIGO POSTAL (ZIP): 52078 (ii) TÍTULO DO INVENTO: Variantes de uroquinase bifuncionais com propriedades fibrinolíticas melhoradas e actividade inibidora de trombina (iii) NÚMERO DE SEQUÊNCIAS: 102 (iv) FORMA LEGÍVEL EM COMPUTADOR:
(A) TIPO DE MEIO: Disquete, 3,5”, DS, 1,44 MB
(B) COMPUTADOR: Compatível com PC da IBM
(C) SISTEMA OPERATIVO: PC-DOS/MS-DOS (D) SUPORTE LÓGICO: Patentln Release #1.0, Versão #1.30 (v) DADOS DO PEDIDO ACTUAL: NÚMERO DO PEDIDO: EP 94 108 872.6-1270 (2) INFORMAÇÃO PARA SEQ ID NO:1: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1182 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico 27 83 886 ΕΡ Ο 669 394/ΡΤ (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (ix) CARACTERÍSTICA:
(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1..1182 (D) OUTRA INFORMAÇÃO: /function= "metionina N-terminal é separada proteoliticamente em E.coli" /product= "gene sintético para a proteína M24 (pSJ101)" <xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 1: ATG AGC AAA ACT TGC TAC GAA GGT AAC GGT CAC TTC TAC CGT GGT AAG 48 Mec Ser Lys Xíur Cys Tyr Glu Gly Asn Gly His Phe Tvr Arg Glv Lys 1 5 1Õ 15 GCT TCT ACC GAC ACC ATG GGT CGT CCG TGC CTG CCG TGG AAC TCT GCT 95 Ala Ser Thr Aso Thr Met Gly Arg Pro Cys. Leu Pro Trp Asn Ser Ala 20 25 30 AC C GTT CTG CAG CAG ACC TAC CAC GCT CAC CGT TCT GAT GCA TTG CAG 144 Thr Vai Leu Gin Gin Thr Tyr His Ala His Arg Ser Aso Ala Leu Gin 3 5 40 4*5 CTG GGT CTG GGT AAA CAC AAC TAC TGC CGT AAC CCG GAC AAC CGT CGT 192 Lau Glv Leu Gly Lys His Asn Tvt Cys Arg Asn Pro Asp Asn Arg Arg = Ô 55 50 CGT CCG HJVJ TGC TAC GTT CAG GGT CTG AAA CCG V- A Λ GTT CAG GAA 240 .Arg Pro Trp Cys Tyr Vai Gin vai Gly Leu Lvs Pr3 Leu Ί ãx Gin Glu 55 70 *75 30 TC-C ATG s**T*tr* Ci i CAC GAC TGC GCT GAC GGT AAA AAA tct. CCG CCG 233 Cvs Mec Vâi His Aso Cys Ala Asp Gly Lys Lys ?rc Ser Ser Pro Pro 85 90 95 GAA C-AG CTC AAA TTC CAG TGC \s\sL· CAA AAA ACC CTA CGT CGT TTT 335 Glu Glu Leu Lys Phe Gin Cys Gly Gin Lvs Thr Leu Arg Pro Arg Phe 100 105 110 AAA ATC ATC GGT GGT GAG TTC * Λ'*-'— ACC ATC GAA AAC CAG CCG TGG ., f-Ύ 384 Lys Ile 'lie Gly Gly Glu Phe Thr lie Glu Asn Gin Pro Trp 115 120 125 GCT GCT ATC TAC CGT CAC CGT GGT GGT TCT GTT ACC TAC /*^11 1 Ui- TGC 432 Ala Ala Ile Tyr Arg Arg His Arg Gly Gly Ser Vai Thr Tyr Val Cys 130 135 140 GGT GGT mpm 1 V·. CTG Â1W CCG TGC íUvj 5: x ATC TCT GCT ACC CAC TGC 480 Gly Gly Ser Leu Ile Ser Pro Cys Trp Val Ile Ser Ala Thr His Cvs 145 150 155 150 ATC GAC TAC CCG AAA AAA GAA GAC TAC ATC 1IM 11 TAC CTC Lzxjv» CGT 52 S ?he Ile Asp Tyr Pro 1S5 Lys Lys Glu As? Tyr 170 lie Val Tyr Leu Glv 175
83 886 ΕΡ Ο 669 394/ΡΤ 28 mf*rη 1 L CGT TTA AAC TCT. AAC ACC CAG GGT GAA ATG AAA TTC GAA GTT GAA 575 Ser Arg Leu Asn 130 Ser Asn Thr Gin Glv Glu 135 Met Lys Phe Glu 190 Vai Glu AAC CTG ATC CTG CAC AAA GAC TAC TCT GCT GAC ACC CTG GCT CAC CAC 524 As η Leu lie 195 Leu His Lvs Asn Tvr 200 Ser Ala Asp Thr Leu 205 Ala His sis AAC GAC ATC GCT CTG CTA AAA ATC AAA GAA GGT f*r*rr* wCi> TGC cv. 572 As η Asn 210 Ile Ala Leu Leu Lvs Ile 215 Arg Ser Lvs Giu 220 Gly Arg Cys CAG CCG CGT ACC ATC CAG ACC CTG CCG ATG TAC AAC 720 Gin. 225 ?ro Ser Arg Thr Ile 230 Gin Thr Ile Cys Leu 235 Pro Ser Met Tyr Asn 240 GAC CCG CAG TTC GGT ACC TCT TGC GAA ATC aLw GGT TTC GGT AAA GAA 758 Asp Pro Gin Phe Gly 245 Thr Ser Cys Glu lie 250 Th.r Gly Phe Gly Lvs 255 Glu AAC TCT ACC GAC TAC CTG TAC CCG GAA CAG CTG AAA ATG ACC GTT 815 Asn Ser Thr Asn 2SÔ Tyr Leu Tyr Pro Glu Gin 255 Leu Lys Met Thr 270 Vai Vai AAA CTG ATC TCT CAC CGT GAA TGC CAG CAG CCG CAC TAC TAC GGT M v Ι·Ι· 854 Lys Leu Ile 275 Ser His Arg Glu Cys 280 Gin Gin Pro His Tyr 235 Tyr Qiy Ser GAA GTT ACC ACC AAA ATG CTG TGC GCT GCT GAC CCG CAG TGG AAA ACC 912 Giu Vai 290 Tlir Thr Lys Met Leu Cvs 295 Ala Ala Asp Pro 300 Gin Tro Lys 'Th·** GAC TGC CAA GGT. GAC TCT vjXj i. GGT CCA CTA GTT TGC CTC CAG 960 Aso Ser Cvs Gin Gly Aso Ser Gly Gly Pro Leu Vai Cys Ser Leu Gin 305 310 315 320 GGT CGT ATG ACC CTG ACC GGT ATT GTT TCT TGG GGT /-»* m r* wvJ L * 11 W TGC r* **+**+ 1008 Gly Arg Met Thr Leu ^hr Gly ZL.Ô Vai Ser Trp Gly Arg /-»1 - + Cys A*.cl 325 330 335 CTG AAA GAC AAA CCG GGT GTT TAC ACC CGT GTT CAC TTC CTG CCG 1055 Leu Lys Asp Lys Pro Gly Vai Tt/^· Thr Arg Vai Ser KiS Phe Leu Pro 340 345 350 TGG ATC CGT TCT CAC ACC AAA GAA GAA AAC GGT CTG GCT CTG AGC Lwu 1104 Trp Ile Arg Ser His Thr Lys Giu Glu Asn Gly Leu Ala Leu Ser Pro 355 350 355 GTT AAG GCT TGG CCG CGG CCG CTG GGT GGT GGT GGT AAC GGT GAC TTC 1152 Vai Lys Ala Trp Pro Arg Pro Leu Gly Gly Gly Gly Asn Gly Asp Phe 370 375 380 GAA GAA ATC CCG GAA GAA TAC CTG CAA TAA 1182 Glu Glu Ile Pro Glu Glu Tyr Leu Gin * 385 390 83 886 ΕΡ Ο 669 394/ΡΤ 29
(2) INFORMAÇÃO PARA SEQ ID NO: 2: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 394 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 2:
Met 1 Ser Lys Thr Cys 5 Tyr Glu Gly Asn Glv 1Ò His Phe Tyr Arg Gly 15 Lys Ala Ser Thr Aso 20 Thr Met Gly Arg Pro 25 Cys Leu Pro Tro Asn Ser 30 Ai a Thr Vai Leu 35 Gin Gin Thr Tyr His 40 Ala His Arg Ser Asp Ala Leu 45 Gin Leu Gly 50 Leu Gly Lys His Asn 55 Tvr Cys Arg Asn Pro Aso Asn Arg SO Arg Arg 55 Pro Trp Cys Tyr Vai 70 Gin Vai Gly Leu Lys 75 Pro Leu Vai Gin Glu 80 Cys Met Vai His Aso 85 Cys Ala Asp Gly Lvs 90 Lys Pro Ser Ser Pro 95 Pro Glu Glu Leu Lys 100 Phe Gin Cys Gly Gin 105 Lys Thr Leu Arg Pro Arg 110 Phe Lys Zls Ile 115 Gly Gly Glu Phe Thr 120 Thr Ile Glu Asn Gin Pro Tro 125 Phe Ala Ala 130 Ile Tyr Arg Arg His 135 Arg Gly Gly Ser Vai Thr Tyr Vai 140 Cys Gly Gly 145 Ser Leu Ile Ser 150 Pro Cys Trp Vai Ile 155 Ser Ala Thr His Cys ISO ?he Ile Asp TyT Pro 155 Lys Lys Glu Asp Tyr 170 Ile Vai Tyr Leu Gly 175 Arg Ser Arg Leu Asn 180 Ser Asn Thr Gin Glv 185 Glu Met Lys Phe Glu Vai 190 Glu Asn Leu Ile 195 Leu His Lys Asp Tyr 200 Ser Ala Asp Thr Leu Ala His 205 His Asn Aso 210 Ile Ala Leu Leu Lvs 215 Ile Arg Ser Lys Glu Gly Ara Cvs 220 Ala Gin 225 Pro Ser Arg Thr Ile 230 Gin Thr lie Cys Leu 235 Pro Ser Met Tyr Asn 240 30 83 886 ΕΡ Ο 669 394/ΡΤ ASO Pro Gin Phe Giy 245 Thr Ser Cys Glu Ile 250 Thr GLy p£iô Giy Lys Giu 255 Asn Ser Thr Aso 250 Tvr Leu Tyr Pro Glu 255 C-ln Leu Lys Msc TS ** 270 Vai Vai Lys Leu lie 275 Ser His Arg Glu Cvs Gin 280 Gin Pro His Tyr 23 5 Tvr Giy Ser Giu Vai 290 Thr TÍ12T Lys Met Leu 295 Cys Ala Ala Asp Pro 300 Gin Lys Thr Aso 305 Ser Cys Gin Giy Aso 310 Ser Giy Giy Pro Leu 315 Vai Cys Ser Leu Gin 320 Giy Arg Met Leu 325 Thr Giy Ile Vai Ser 320 Trp Giy Arg Glv Cvs Ala 335 Leu .Lys Asp Lys 340 Pro Giy Vai Tyr Thr 345 Arg Vai Ser His Phe 350 Leu Pro Tro Ile Arcr 355 Ser His Thr Lys Glu Glu 360 Asn Giy Leu Ala 365 Leu Ser Pro vai Lys 270 Ala Tm Pro Arg Pro 375 Leu Giy Giy Giy Glv 38Õ Asn Giy Asp Phe Glu Giu Ile Pro Glu Glu Tvr Leu Gin ★ 385 390 (2) INFORMAÇÃO PARA SEQ ID NO: 3: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1182 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (ix) CARACTERÍSTICA:
(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1..1182 (D) OUTRA INFORMAÇÃO: /function= "metionina N-terminal é separada proteoliticamente em E.coli" /product= "gene sintético para a proteína M25 (pSJ102)" 83 886 ΕΡ Ο 669 394/ΡΤ 31
(xi) DESCRICÃO DA SEQUÊNCIA: SEQ ID NO: 3: ATG AGC AAA ACT TGC TAC GAA GGT AAC GGT CAC TTC TAC CGT GGT AAG Met Ser Lvs Thr Cys Tyr Glu Giv Asn Gly Kis Phe Tyr Arg Glv Lys 1 * S IÒ 13 GCT TCT ACC GAC ACC ATG GGT CGT CCG TGC CTG CCG TGG AAC TCT GCT Ala Ser Thr Aso Thr Met Gly Arg Pro Cys Leu Pro Trp Asn Ser Ala 20 23 30 ACC GTT CTG CAG CAG ACC TAC CAC GCT CAC CGT TCT GAT GCA TTG CAG Thr Vai Leu Gin Gin Thr Tyr His Ala Kis Arg Ser Asp Ala Leu Gin 35 - 40 45 CTG GGT CTG GGT AAA CAC AAC TAC TGC CGT AAC CCG GAC AAC CGT CGT Leu Glv Leu Gly Lvs Kis Asn Tyr Cys Arg Asn Pro Asp Asn Arg Arg 50 * 55 S0 CGT CCG TGG TGC TAC GTT CAG GTT GGT CTG AAA CCG CTA GTT CAG GAA Arg Pro Tro Cys Tyr Vai Gin Vai Gly Leu Lys Pro Leu Vai Gin Glu S3 70 * 75 30 TGC ATG GTT CAC GAC TGC GCT GAC GGT AAA AAA CCG TCT TCT CCG CCG Cvs Met Vai His Aso Cys Ala Asp Gly Lys Lys Pro Ser Ser Pro Pro 85 90 95 43 96 192 240
ί 3 S GAA GAG CTC AAA TTC CAG TGC GGT CAA AAA ACC CTA CGT CCG CGT Glu Glu Leu Lys Phe Gin Cvs Giv Gin Lys Thr Leu Arg Pro Arg Phe 100 105 110 AAA ATC ATC GGT GGT GAG TTC ACC ACC ATC GAA AAC CAG CCG TGG TTC Lys Ile Ile Gly Gly Glu Phe Thr Thr Ile Glu Asn Gin Pro Trp Phe 115 * * 120 125 GCT GCT ATC TAC CGT CGT CAC CGT GGT GGT TCT GTT ACC TAC GTT TGC Ala Ala lie Tyr Arg Arg His Arg Gly Gly Ser Vai Thr Tyr Vai Cys 130 135 * 140 GGT GGT TCT CTG ATC TCT CCG TGC TGG GTT ATC TCT GCT ACC CAC TGC Gly Gly Ser Leu Ile Ser Pro Cys Trp Vai Ile Ser Ala Thr His Cys 145 150 ' 155 ISO TTC ATC GAC TAC CCG AAA AAA GAA GAC TAC ATC GTT TAC CTC GGC CGT Phe Ile Aso Tyr Pro Lys Lys Glu Aso Tyr Ile Vai Tyr Leu Gly Arg 165 * 170 175 TCT CGT TTA AAC" TCT AAC ACC CAG GGT GAA ATG AAA TTC GAA GTT GAA Ser Arg Leu Asn Ser Asn Thr Gin Gly Glu Met Lys Phe Glu Vai Glu 180 185 190 AAC CTG ATC CTG CAC AAA GAC TAC TCT GCT GAC ACC CTG GCT CAC CAC Asn Leu Ile Leu His Lys Asp Tyr Ser Ala Asp Thr Leu Ala His His 195 200 205 384 432 480 528 576 624 32 83 886 ΕΡ Ο 669 394/ΡΤ AAC GAC ATC GCT CTG CTA AAA ATC CGT TCT AAA <"» Λ ^ r***<+* >ΪΛΛ vJVJi CGT TGC GCT 572 Asn Asp lie Ai a Leu- Leu Lys Ile Arg Ser Lys Giu Giv Arg CVS Ala 21*0 215 220 CAG CCG TCT CGT ACC ATC CAG ACC ATC TGC CTG .uc TAC AAC 720 Gin ?rc Ser Arg Thr Ile Gin Thr lie Cys Leu Prc Ser Mec Tyr Asn 225 230 235 240 GAC CCG CAG A i. V- GGT ACC TGC GAA Λ. w ACC GGT TTC GGT AAA GAA 753 Asp Pro Gin Phe Giy Thr Ser Cys Glu ϋΧβ -"U — Giy Phe Giy Lys Giu 245 250 255 AAC ACC GAC TAC CTG TAC CCG GAA CAG CTG AAA ATG ACC GTT G· · 816 Asn Ser Thr Aso Tyr Leu Tyr Pro Glu Gin Leu Lvs Met Vai Vai 260 255 270 AAA ATC TCT CAC CGT GAA TGC CAG CAG CAC TAC TAC «·*<'·!» 864 Lys Leu Ile Ser His Arg Glu Cys Gin Gin Pro His Tyr Tyr Gly Ser 275 230 235 GAA Ul A ACC ACC AAA ATG CTG TGC GCT GCT GAC CCG CAG «TV··.»-* AAA nUu 912 Giu Vai Th- Thr Lys Met Leu Cys Ala Ala Asp Pro Gin ~ - — •rp Lys 290 295 300 GAC TCT TGC CAA GGT GAC GGT CCA CTA GTT TGC CTC CAG 960 Asc Ser Cys Gin Gly Aso Ser Gly Giy Pro Leu Vai Cys 5er Leu Gin 305 310 315 320 GGT CGT ATG ACC CTG ACC GGT ATT GTT TCT r»—· GGT CGT GGT TGC GCT 1003 Gly Arg Met Thr Leu Thr Giy lie Vai Ser Gly Arg Giy Cys Ala 325 330 335 CTG AAA GAC AAA CCG GGT GTT TAC ACC WsJ- TCT CAC ΙΤ»Φ^ CTG 1056 Leu Lys Asp Lys Pro Gly vai Tvr Thr Arg Vai Ser His Phe Leu 340 345 350 TGG ATC CGT TCT CAC ACC AAA GAA GAA AAC GGT CTG GCT CTG AGC 1104 lis Arg Ser His Thr Lys Glu r*'*' ,, Asn Gly _ieu Aia Leu Ser r^TO 353 350 365 GTT AAG GCT TTC CGG CCG CTG GGT GGT GGT GGT AAC GGT GAC TTC 1152 Vai Lys Ala Phe Pro Arg Pro Leu Gly Gly ^-7 Gly Asn Gly Asp pVa 370 375 330 GAA GAA ATC CCG GAA GAA TAC CTG CAA . TAA 1132 Glu Giu lie Pro Glu Glu Tyr Leu Gin * 335 390 (2) INFORMAÇÃO PARA SEQ ID NO: 4: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 394 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 4: 33 83 886 ΕΡ Ο 669 394/ΡΤ
Met 1 Ser Lys Thr Cvs * 5 Tyr Glu Gly Asn Gly His 10 Phe Tyr Arg Gly 15 Lvs Ala Ser Thr Asp 20 Thr Met Gly Arg Pro 25 Cys Leu Pro Trp Asn 30 Ser Ala Thr val Leu 35 Gin Gin Tyr His 40 Ala His Arg Ser Asp Λ Τ’ ** 3 Ala Leu Gin Leu Glv 50 Leu Gly Lys His Asn 55 Cys Arg Asn Pro SO Asp Asn Arg Arg 6 5 Pro Trp Cys Tyr Val 70 Gin vai Gly Leu Lys 75 Pro Leu Vai Gin Glu 30 Cys Met Val His Aso 85 Cys Ala ASO Gly Lys Lys 90 Pro Ser Ser Pro 95 pro Glu Glu Leu Lys 100 Phe Gin Cys Gly Gin 105 Lys Thr Leu Arg ir — w 110 Arg Phe Lys Ile Ile 115 Gly Gly Glu Phe Thr 120 Thr Ile Glu Asn Gin Pro Trp Phe A-LE Ala 130 Ile Tyr Arg Arg His 135 Arg Gly Gly Ser Val 140 Tyr Vai Cys Gly 145 Gly Ser Leu Ile Ser 150 Pro Cys Tro Vai lie 155 Ser Ala Thr His CVS ISO P*is Ile Asp Tyr Pro 1S5 Lys Lys Glu Asp Tvr Ile 170 Vai Tyr Leu Gly « ff i / 2 Arg Ser Arg Leu Asn 130 Ser Asn Gin Gly 135 Glu Met Lys Phe Glu 190 Val Glu Asn Leu Ile 195 Leu His Lys Asp 2*00 Ser Ala Asp Thr Leu 205 Ala His His Asn Asp 21*0 Ile Ala Leu Leu Lvs 215 TTa Arg Ser Lys Glu 220 Gly Arg Cys Ala Gin 225 Pro Ser Arg Thr Ile 230 Gin "V“ Ile Cvs Leu 235 Pro Ser Met Tyr Asn 240 Asp Pro GIn Phe Gly 245 Thr Ser Cys Glu Ile Thr 250 Gly Gly Lvs 255 Gj.u Asn Ser Thr Aso 2SÔ Tyr Leu Tyr Pro Glu 2S5 Gin Leu Lys Met Thr 270 Vai Val Lys Leu Ile 275 Ser His Arg Glu Cys 280 Gin Gin Pro Kis Tvr Tyr 285 Gly Ser Glu Val 290 Thr Thr Lys Met Leu 295 Cys Ala Ala Asp Pro 300 Gin Trp Lys Thr Aso 305 Ser Cys Gin Gly Asp 310 Ser Gly Gly Pro Leu 315 Vai Cys Ser Leu Gin 320
Gly Arg Met Thr Leu 325 Thr Gly Ile Vai Ser 330 Trp Gly Arg Gly Cvs 335 Ala Leu Lys Asp Lys 340 Pro Gly Vai Tvr Thr 345 Arg Vai Ser His Phe 350 Leu Pro Tm Ile Arg 355 Ser His Thr Lys Glu 3S0 Glu Asn Gly Leu Ala 3S5 Leu Ser 'Pro Vai Lvs 370 Ala Phe Pro Arg Pro 375 Leu Gly Gly Gly Gly 3 30 Asn Gly Asp Phe Glu 335 Glu Ile Prc n Glu 390 Tyr Leu Gin •w (2) INFORMAÇÃO PARA SEQ ID NO: 5: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1182 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (ix) CARACTERÍSTICA:
(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1..1182 (D) OUTRA INFORMAÇÃO: /function= "metionina N-terminal é separada proteoliticamente em E.coli" /product= "gene sintético para a proteína M26 (pSJ103)" (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 5: ATG AGC AAA ACT TGC TAC GAA GGT AAC GGT CAC TTC TAC CGT GGT AAC*
Met Ser Lys Thr Cvs Tyr Glu Gly Asn Glv His Phe Tvr Arg Gly Lys
1 * 5 1Õ IS
C-CT TCT ACC GAC ACC ATG GGT CGT CCG TGC CTG CCG TGG AAC TCT GCT
Ala Ser Thr Asp Thr Met Gly Arg Pro Cys Leu Pro Trp Asn Ser Ala 20 * 25 30
ACC GTT CTG CAG CAG ACC TAC CAC GCT CAC CGT GAT GCA CAC- 144 Thr Vai Leu 35 Gin Gin Thr Tyr His 40 Ala His Arg Ser Asp 45 Ala Leu Gln CTG GGT CTG GGT AAA CAC AAC TAC TGC CGT AAC LwO GAC AAC CGT CGT 192 Leu Gly SO Leu Gly· Lys His Asn 55 Tv*r Cys Arg Asn Pro 60 Asp Asn Arg Arg CGT CCG TGG TGC TAC GTT CAG GTT GGT CTG AAA CCG CTA GTT CAG GAA 240 Arg 65 Pro Trp Cys Tvr Vai 70 Gin Val Gly Leu Lys 75 Pro Leu Vai Gin Glu 30 TGC ATG GTT CAC GAC TGC GCT GAC GGT AAA AAA CCG TCT CCG CCG 233 Cys Met Vai His Aso 85 Cys Ala Asp Gly Lys 90 Lys Pro Ser Ser Pro 95 Pro GAA GAC- CTC AAA .V. CAG TGC GGT CAA AAA ACC CTA CGT CCG CGT T^'rT 3 3 5 Glu Giu Leu Lys 100 Phe Gin Cys Gly Gin 105 Lys Thr Leu Arg Pro 110 Arg Phe AAA ATC ATC GGT GGT GAG TTC ACC ACC ATC GAA AAC CAG CCG TGG TTC 334 Lys Ile Ile 115 Gly Gly Glu Phe Thr 120 Thr Ile Glu Asn Gin 125 Pro Trp Phe GCT GCT ATC TAC CGT CGT CAC CGT GGT GGT TCT GTT ACC TAC GTT TGC 432 Ala Ala 130 Ile Tyr Arg Arg His 135 Arg Gly Gly Ser Val 140 Thr Tyr Val Cys GGT GGT i. U i CTG ATC CCG TGC ty+r+sm GTT ATC GCT ACC CAC TGC 4ac Gly Gly 145 Ser Leu Ile Ser 150 Pro Cys Trs Val Ile 155 Ser Ai. a Thr His Cys 150 ATC GAC TAC CCG AAA AAA GAA GAC TAC ATC íji - TAC CTC GGC (•«J 1. 523 ?he Ile Asp Tyr Pro 165 Lys Lys Glu Asp Tyr 170 *’ a Val Tyr Leu Glv 175 TCT CGT TTA AAC TCT AAC ACC CAG GGT GAA ATG AAA GAA GTT GAA 575 Ser Arg Leu Asn 180 Ser Asn Thr Gin Gly ias Glu Met Lys Phe Glu 190 Vai Glu AAC CTG ATC CTG CAC AAA GAC TAC -LW- GCT GAC ACC CTG r*r**w* CAC CAC 624 Asn Leu ZXs 195 Leu His Lys Asp Tvr 200 Ser Ala Asp Thr Leu 205 Ala His HlS AAC GAC ATC GCT CTG CTA AAA ATC CGT • W · AAA GAA GGT CGT 'TV-'.» ^<111 · SÍV. A 572 Asn Asn 210 Ile Ala Leu Leu Lys 215 Ile Arg Ser Lys Glu 220 Gly Arg Cys Ala CAG CCG TCT CGT ACC ATC CAG ACC ATC TGC CTG CCG TCT ATG TAC AAC 720 Gin 225 Pro Ser Arg Thr Ile 230 Gin Thr Ile Cys Leu 235 Pro Ser MeC Tvr Asn 240 GAC CCG CAG TTC GGT ACC TCT TGC GAA ATC ACC GGT GGT AAA GAA 768 Asp Pro Gin Phe Gly Thr 245 Ser Cys Glu ZXs 250 Thr Gly Phe Gly Lys 255 Glu AAC ACC GAC TAC CTG TAC CCG GAA CAG CTG AAA ACC GTT 315 Asn Ser Thr Asp 260 Tyr Leu Τγττ Pro Glu 265 Gin Leu Lys Met Thr 270 Val Val AAA CTG ATC TCT CAC CGT GAA TGC CAG CAG CCG CAC TAC TAC GGT 354 Lys Leu He 275 His Arg Glu Cvs 230 C-ln Gin His Tyr Tyr 235 Gly Ser l<
GAA GTT ACC ACC AAA ATG CTG TGC GCT GCT GAC CCG CAG TGG AAA ACC 912 Glu Vai Thr Thr Lys MeC Leu Cys Ala Ala Asp Pro Gin Trp Lys Thr 290 295 300 GAC T-ÇT CAA GGT GAC TCT GGT GGT CCA TCT CTC wva 950 Aso Ser Cys Gin Gly Aso Ser Gly Gly Pro Leu Vai Cys Ser Leu Gin 305 310 315 320 GGT CGT ATG ACC CTG ACC GGT ATT GTT TGG GGT CGT GGT TGC GCT iooa Gly Arg Met Thr Leu Thr Gly Ile Vai Ser Trp Gly Arg Gly Cvs Ala 325 330 335 CTG AAA GAC AAA r****r+ Luc GGT GTT TAC ACC CGT GTT TCT CAC TTC CTG CCG 1056 Leu Lys Asp Lys Pro Gly Vai Tyr Thr Arg Vai Ser His Phe Leu Pro 340 345 350 TGG ATC CGT CAC ACC AAA GAA GAA AAC GGT CTG GCT CTG AGC 1104 Trp Ile Arg Ser His Thr Lys Glu Glu Asn Gly Leu Ala Leu Ser Pro 355 360 365 GTT GTA GTT TTC CCG CGG CCG CTG GGT GGT GGT GGT AAC GGT GAC 1152 Vai Vai Vai Phe Pro Arg Pro Leu Gly Gly Gly Gly Asn Gly Asp Phe 370 375 380 GAA GAA ATC CCG GAA GAA TAC CTG CAA TAA 1132 Glu Glu Ile ?ro Glu Glu Tyr Leu Gin * 385 390 (2) INFORMAÇÃO PARA SEQ ID NO: 6: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 394 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRICÃO DA SEQUÊNCIA: SEQ ID NO: 6:
Met Ser Lys Thr Cys 5 Tyr Glu Gly Ala Ser Thr Aso 20 Thr Met Gly Arg Thr Vai Leu 35 Gin Gin Thr Tyr His 40 Leu Glv 5*0 Leu Gly Lys His Asn 55 Tyr
Asn Gly 1Ò His Phe Tyr Arg Gly 15 Lys Pro 25 Cys Leu Pro Trp Asn 30 Ser Ala Ala Kis Arg Ser Asp 45 Ala Leu Gin Cys Arg Asn Pro . 60 Asp Asn Arg Arg
83 886 ΕΡ Ο 669 394/ΡΤ
Arg 65 Pro Trp Cys Tyr Vai 70 Gin Ver Glv Leu Lvs Pro Leu 75 Vai Gin G1U 30 cys Mec Vai His Asn 35 Cys Ala As? Glv Lvs Lvs Pro Ser 90 Ser Prc 95 ?ro Qiu Glu leu Lys 100 Phe Gin Cys Gly Gin Lys Thr leu Arg 105 Pro Arg 110 ?ha Lys Ile 115 Glv Gly Glu Phe Thr 120 Thr Ile Glu Asn Gin 125· Pro Trp ?he Ala 13 0 Ile Tvr Arg Arg His 135 Arg Gly Glv Ser Vai Thr 140 Tyr Vai Cys Glv 145 Glv Ser Leu Ile Ser 150 Pro cys Tm Vai lie Ser Ala 155 Thr His Cys ISO ?he Asp Tyr Pro 165 Lys Lys Glu Asn Tyr Ile Vai Tyr 170 Leu Gly Aro 175 Ser * -u-«m «rg Leu Asn ISO Ser Asn Thr Gin Glv Glu Mec Lys Phe 135 Glu Vai 190 Glu As n lau Ile 195 Leu His Lys Asp Tyr 200 Ser Ala Asn Thr Leu 205 Ala His His Asn Asn 210 Ile Ala Leu leu Lvs 215 Ile Arg Ser Lys Glu Gly 220 Arg Cys Ala Gin 225 Pro Ser Arg Thr Ile 230 Gin Thr 11e Cys Leu Pro Ser 23 5 Met. Tyr Asn 240 Asp Pro Gin Phe Gly 245 Thr Ser Cys Glu Ile Thr Glv Phe 250 Gly Lvs 255 Glu Asn Ser Thr Asn 2SÕ Tyr leu Tyr Pro Glu Gin Leu Lys Mec 2SS Thr Vai 270 Vai lvs leu lie 275 Ser His Glu Cys 2 30 Gin Gin Pro His Tvr 285 Tyr Gly Ser Glu Vai 290 Thr Thr lys Mec Leu 295 Cys Ala Ala Asn Pro Gin 300 Trp Lys Τ'"* Asn 305 Ser Cys Gin Gly Asp 310 Ser Gly Gly Pro Leu Vai Cys 315 Ser Leu Gin 320 Glv Arg Mec Thr Leu 325 Thr Gly lie Vai Ser Tm Glv Arg 330 Gly Cys 335 Ala leu Lys Asp Lys 340 Pro Gly Vai Thr Arg Vai Ser His 345 Phe Leu 350 Pro Trp Ile Arg 355 Ser His Thr Lys Glu 360 Glu Asn Glv Leu Ala 365 Leu Ser Pro Vai Vai 370 Vai Phe Pro Arg Pro 375 Leu Gly Gly Gly Gly Asn 3 30 Gly Asn Phe Glu Glu Ile Pro Glu Glu TV^· Leu Gin * 335· 390
83 886 ΕΡ Ο 669 394/ΡΤ 38 (2) INFORMAÇÃO PARA SEQ ID NO: 7: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1182 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (ix) CARACTERÍSTICA:
(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1..1182 (D) OUTRA INFORMAÇÃO: /function= "metionina N-terminal é separada proteoliticamente em E.coli" /product= "gene sintético para a proteína M27 (pSJ104)" (ix) CARACTERÍSTICA:
(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1..1182 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 7: ATG AGC AAA ACT TGC TAC GAA GGT AAC GGT CAC TTC TAC CGT GGT AAC- 4 3
Met Ser Lys Thr Cys Tyr Giu Gly Asn Giy His Phe Tyr Arg Gly Lys 1 5 10 is
GCT TCT ACC GAC ACC ATG GGT CGT CCG TGC CTG CCG TGG AAC TCT GCT
Ala Ser Thr Asp Thr Met Gly Arg Pro Cvs Leu Pro Tm Asn Ser Ala 20 25 " 30 96 39 83 886 ΕΡ Ο 669 394/ΡΤ ACC GTT CTG CAG CAG ACC TAC CAC GCT CAC CGT TCT GAT GCA TTG CAG 144 Thr Vai Leu 35 Gin Gin· Thr Tyr His 40 Ala His Arg Ser Asp 45 Ala Leu Gin CTG GGT CTG GGT AAA CAC AAC TAC TGC CGT AAC GAC AAC CGT CGT 192 Leu Gly 50 Leu Gly Lys His Asn Tyr 55 Cys Arg Asn Pro 60 Asp Asn Arg Arg CGT CCG TGG TGC TAC GTT CAG GTT GGT CTG AAA CCG CTA GTT CAG GAA 240 Arg €5 Pro Trp Cys Tyr Vai 70 Gin Vai Gly Leu Lys 75 Pro Leu Vai Gin Glu 80 TGC ATG GTT CAC GAC TGC GCT GAC GGT AAA AAA CCG TCT TCT CCG CCG 288 Cys Met Vai His Asp 85 Cys Ala Asp Gly Lys 90 Lys Pro Ser Ser Pro 9S Pro GAA GAG CTC AAA TTC CAG TGC GGT CAA AAA ACC CTA CGT CCG CGT χττ 336 Glu Glu. Leu Lys 100 Phe Gin Cys Gly Gin 105 Lys Thr Leu Arg Pro 110 Arg Phe AAA ATC ATC GGT GGT GAG TTC ACC ACC ATC GAA AAC CAG CCG TGG MNpQ 384 Lys Ile Ile 115 Gly Gly Glu Phe Thr 120 Thr Ile Glu Asn Gin 125 Pro Trp Phe GCT GCT ATC TAC CGT CGT CAC CGT GGT GGT TCT GTT ACC TAC GTT TGC 432 Ala Ala 130 Ile Tyr Arg Arg His 135 Arg Gly Gly Ser Vai 140 Thr Tyr Vai Cys GGT GGT TCT CTG ATC TCT CCG TGC TGG GTT ATC TCT GCT ACC CAC TGC 480 Gly 145 Gly Ser Leu Ile Ser 150 Pro Cys Trp Vai Ile 155 Ser Ala Thr His Cys 160 ATC GAC TAC CCG AAA AAA GAA GAC TAC ATC GTT TAC CTC GGC CGT 528 Phe Ile Asp Tyr Pro 165 Lys Lys Glu Asp Tyr 170 Ile Vai Tyr Leu Gly 175 Arg TCT CGT TTA AAC TCT AAC ACC CAG GGT GAA ATG AAA TTC GAA GTT GAA 576 Ser Arg Leu Asn 180 Ser Asn Thr Gin Gly 185 Glu Met Lys Phe Glu 190 Vai Glu AAC CTG ATC CTG CAC AAA GAC TAC TCT GCT GAC ACC CTG GCT CAC CAC 624 Asn Leu Ile 195 Leu His Lys Asp Tyr 200 Ser Ala Asp Thr Leu 205 Ala His His AAC GAC ATC GCT CTG CTA AAA ATC CGT TCT AAA GAA GGT CGT TGC GCT 672 Asn Asp 210 Ile Ala Leu Leu Lys 215 Ile Arg Ser Lys Glu 220 Gly Arg Cys Ala CAG CCG TCT CGT ACC ATC CAG ACC ATC TGC CTG CCG TCT ATG TAC AAC 720 Gin 225 Pro Ser Arg Thr Ile 230 Gin Thr Ile Cys Leu 235 Pro Ser Met Tyr Asn 240 GAC CCG CAG TTC GGT ACC TCT TGC GAA ATC ACC GGT TTC GGT AAA GAA 768 Asp Pro Gin Phe Gly 245 Thr Ser Cys Glu Ile 250 Thr Gly Phe Gly Lys 255 Glu AAC TCT ACC GAC TAC CTG TAC CCG GAA CAG CTG AAA ATG ACC GTT GTT 815 Asn Ser Thr Asp 260 Tyr Leu Tyr Pro Glu 265 Gin Leu Lys Met Thr ' 270 yai Vai AAA CTG ATC TCT CAC CGT GAA TGC CAG CAG CCG CAC TAC TAC GGT TCT 864 Lys Leu Ile 275 Ser His Arg Glu Cys 280 Gin Gin Pro His Tyr Tyr 285 Gly Ser 40 83 886 ΕΡ 0 669 394/ΡΤ GAA GTT ACC ACC AAA ATG CTG TGC GCT GCT GAC CCG CAG TjG AAA ACC 912 Glu Vai Thr Thr Lys. Met Leu Cys Ala Ala Asp Pro Gin Tm Lys Thr 290 295 300 GAC TGC CAA GGT GAC TCT GGT GGT CCA CTA GTT TGC CTC CAG 950 Asd Ser Cys Gin Gly Aso Ser Gly Gly Pro Leu Val Cys Ser Leu Gin 30*5 310 315 320 GGT CGT ATG ACC CTG ACC GGT ATT GTT TGG GGT CGT GGT ****** r* GCT ioo a Gly Arg Met Thr Leu Thr Gly llâ Vai Ser Tto Gly Arg Gly Cvs Ala 325 330 335 AAA GAC AAA CCG GGT GTT TAC ACC Lai GTT i.C- CAC •vrç CTG CCG 1056 Leu Lys Asp Lys Pro Gly Vai '7*** Thr Arg Val Ser Kis Phe Leu Pro 340 345 350 TGG ATC CG7 iC j. CAC ACC AAA GAA GAA AAC GGT CTG GCT CTG AGC CCG 1104 Trp Ile Arg Ser Kis Thr Lys Glu Glu Asn Gly Leu Ala Leu Ser '3 55 350 365 GAA GTT CCG CGG CCG CTG GGT t-*r**T* \Z\3L· GGT AAC GGT GAC TTC i. ^ Va£ Glu Vai Phe Pro Arg Pro Leu Gly Gly Gly Glv Asn Gly Asp Phe 3 70 375 330 GAA GAA ATC CCG GAA GAA TAC CTG CAA TAA 1132 Glu Glu lie Pro Glu Glu Tyr Leu Gin ★ 385 390 (2) INFORMAÇÃO PARA SEQ ID NO: 8: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 394 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUENCIA: SEQ ID NO: 8:
Met 1 Ser Lys Thr Cys 5 Tyr Glu Gly Asn Gly 10 His Phe Tyr Arg Gly 15 Lys Ala Ser Thr Asp 20 Thr Met Gly Arg Pro 25 Cys Leu Pro Trp Asn 30 Ser Ala Thr Val Leu 35 Gin Gin Thr Tyr His 40 Ala His Arg Ser Aso 45 Ala Leu Gin Leu Gly 50 Leu Gly Lys Kis Asn 55 Tyr Cys Arg Asn Pro 60 Asp Asn Arg Arg Arg 6 5 Pro Trp Cys Tyr Val 70 Gin Val Gly Leu Lys 75 Pro Leu Val Gin Glu 30 41 83 886 ΕΡ Ο 669 394/ΡΤ Cys Met Vai His p,tn Cys Ala Asp Gly Lvs 90 Lys Pro Ser Ser Pro 95 Pro Glu Glu Leu Lys 100 ΌΚ 0 Gin Cys Gly Gin 105 Lys Thr Leu Arg ?ro Arg 110 Phe Lys lie Ile 115 Gly Gly Glu Phe Thr 120 Thr Ile Glu Asn Gin 125 Pro Tro Phe Ai a Ala 130 Ile Tyr Arg Arg His 135 Arg Gly Gly Ser Vai 140 Thr Tyr Vai Cys Gly 145 Gly Ser Leu Ile Ser 150 Cys Vai lie 155 Ser Ala Thr His Cys ISO Phe Ile Asp Tyr Pro 165 Lys Lys Glu Asp Xvr 170 He Vai Tyr Leu Gly · “T jj ·> Ser Arg Leu Asn 130 Ser Asn Thr Gin Gly 135 Glu Met Lys Phe Glu Vai 190 Glu Asn Leu Ile 195 Leu HiS Lys Asp 200 Ser Ala Asp Leu 205 Ala His His Asn Asn 210 Ile Ala Leu Leu Lys 215 Ile Arg Ser Lvs Glu 220 Gly Arg Cys Ai a Gin Pro ' Ser Arg Thr Gin Ile Cys Leu Pro Ser Mec Tyr Asn 225 230 235 240 Asp Pro Gin Phe Gly 245 Thr Ser Cys Glu Ile 250 Thr Gly Phe 7 * * Lvs 255 Glu Asn Ser T*V -v- Aso 2SÕ Tyr Leu Pro Glu 263 Gin Leu Lys MeC 270 Val Vai Lys Leu Ile 275 Ser His Arg Glu CVS 230 Gin Gin His 2*35 Tyr Gly Ser Glu Vai 290 Thr Thr Lys Met Leu 295 Cys Ala Ala Asp 300 Gin ?rp Lys Aso 305 Ser Cys Gin Gly Aso 310 Ser Gly Gly Pro Leu 315 Vai Cys Ser Leu Gin 220 Gly Arg Mec Thr Leu 325 Thr Gly ris Vai Ser 330 Tro C-iy Arg Gly Cvs 335 Ala Leu Lys Asp Lys 340 Pro Gly Vai Tyr Thr 345 Arg Val Ser His 350 Leu Pro Tro Ile Arg 355 Ser His Thr Lys Glu 360 Glu Asn Gly Leu Ala 3 65 Leu Ser Pro Vai Glu 370 Vai Phe Pro Arg Pro 375 Leu Gly Gly Gly Gly 380 Asn Gly Asp Phe Glu Glu Ile Pro Glu Glu Tyr Leu Gin * -385 390
83 886 ΕΡ Ο 669 394/ΡΤ 42 (2) INFORMAÇÃO PARA SEQ ID ΝΟ: 9: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1182 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (ix) CARACTERÍSTICA:
(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1..1182 (D) OUTRA INFORMAÇÃO: /function= "metionina N-terminal é separada proteoliticamente em E.coli" /product= "gene sintético para a proteína M28 (pSJ105)" (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 9: ATG AGC AAA ACT TGC TAC GAA GGT AAC GGT CAC TAC CGT GGT AAG 43 Met 1 Ser Lys Thr Cys 5 Tyr Glu Gly Asn Gly 1*0 His Phe Tyr Arg Gly 15 Lys GCT ACC GAC ACC ATG GGT CGT CCG TGC CTG CCG TGG AAC TCT - 96 Ala Ser Thr Asp 20 Thr Mec Gly Arg Pro 25 Cys Leu Pro Tro Asn 30 Ser ACC CTG CAG CAG ACC TAC CAC GCT CAC CGT GAT GCA CAG 144 Thr Vai Leu 35 Gin Gin Thr Tvtt His 40 Ala His Arg Ser Asp 45 Ala Leu Gin CTG GGT CTG GGT AAA CAC AAC TAC TGC CGT AAC CCG GAC AAC CGT CGT 192 Leu Glv SÓ Leu Gly Lys His Asn 55 Tyr Cys Arg Asn Pro 60 Asp Asn Arg Arg CGT CCG TGG TGC TAC GTT CAG GTT GGT CTG AAA CCG CTA GTT CAG GAA 240 Arg 65 Pro Trp Cys Tyr Vai 70 Gin Vai Gly Leu Lys 75 Pro Leu Vai Gin Glu 80 TGC ATG GTT CAC GAC TGC GCT GAC GGT AAA AAA CCG TCT TCT ****** W vC 238 Cys Mec Vai His Asp 85 Cys Ala Asp Gly Lys 90 Lys Pro Ser Ser Pro 95 Pro 83 886 ΕΡ Ο 669 394/ΡΤ 43
GAA GAG CTC AAA TTC CAG TGC GGT CAA AAA ACC CTA CGT CCG CGT 335 Glu Glu Leu Lys 100 Phe Gin Cys Gly Gin 105 Lvs Thr Leu Arg Pro 110 Arg Phe AAA A7C ATC Lzvj i. GGT GAG TTC ACC ACC ATC GAA AAC CAG CCG TGG 334 Lvs Ile Ile Gly Gly Glu 115 Phe 120 Thr Ile Glu Asn Gin 125 Pro Trp Phe GCT GCT ATC TAC CGT CGT CAC CGT GGT GGT XCT* ACC TAC GTT TGC 432 Ala Ala 130 Ile Tvr Arg Arg His 135 Arg Gly Gly Ser Vai 140 Thr Tyr Vai Cys GGT GGT TCT CTG ATC TCT CCG TGC TGG GTT ATC TCT GCT ACC CAC TGC 430 Gly Gly 145 Ser Leu Ile Ser ISO Pro Cys Trp Vai Ile 155 Ser Ala Thr His Cys ISO TTC ATC GAC TAC CCG AAA AAA GAA GAC TAC ATC GTT TAC CTC GGC CGT 52 3 Phe Ile Asp Tyr Pro 155 Lys Lys Glu Asp Tyr 170 Ile Vai Tyr Leu Gly 175 Arg τΌ'τ' CGT TTA AAC TCT AAC ACC CAG GGT GAA ATG AAA TTC GAA GTT GAA 575 Ser Arg Leu Asn ISO Ser Asn Thr Gin Gly Glu 135 Met LVS Phe Glu 190 Vai Glu AAC CTG ATC CTG CAC AAA GAC TAC TCT GCT GAC ACC CTG GCT CAC CAC 524 Asn Leu Ile 195 Leu HiS Lys Asp Tyr 200 Ser Ala Asp Thr Leu 205 Ala His His AAC GAC ATC GCT CTG CTA AAA ATC CGT AAA GAA GGT CGT TGC GCT 572 Asn Asp 210 TLs Ala Leu Leu Lys 215 T " a Arg Ser Lys Glu 220 Gly Arg Cys Ala CAG CGT ACC ATC CAG ACC ATC TGC CTG ATG TAC AAC 720 Gin 225 Pro Ser Arg Thr lie 230 Gin ·> _ XXâ Cys Leu 233 Pro Ser Met Tyr Asn 240 GAC CCG CAG TTC GGT ACC TCT TGC GAA ATC ACC —GT nq* r* fm*·*"* \2\Z - AAA GAA 753 Asp Pro Gin Phe Gly 245 Thr Ser Cys Glu Γ Xô 250 T*V^ /-· Ί . „ VíiV Phe Glv Lys 255 AAC ACC GAC TAC CTG TAC CCG GAA CAG CTG AAA ATG ACC GTT 315 Asn Ser Thr Aso 250 Tyr Leu Tyr Pro Glu 255 GIn Leu Lys Met Thr 270 Vai Vai AAA CTG ATC TCT CAC CGT GAA TGC CAG CAG CCG CAC TAC TAC GGT i W — 354 Lys Leu Ile 275 Ser HiS Arg Glu Cvs 230 Gin Gin Pro His TV 23 5 Tyr Gly Ser GAA GTT ACC ACC AAA ATG CTG TGC GCT GCT GAC CCG CAG TGG AAA ACC 912 Glu Vai 290 Thr Thr Lys Met Leu 295 Cys Ala Ala Asp Pro 300 Gin i—i* Lvs GAC TCT TGC CAA GGT GAC TCT VJVJA GGT CCA CTA GTT TGC TCT V.1U CAG 950 Asn 305 Ser Cys Gin Gly Aso 31Õ Ser Glv Glv Pro Leu 315 Vai Cys Ser Leu Gin 320 GGT Jrt.±\3 ACC CTG ACC GGT Λι ^ TQT U. OVJ GGT CGT GGT TGC Gv-- 1003 Gly Arg Meu Thr Leu 325 Thr Gly Ile Vai Ser 330 Trp Gly Arg Gly Cys 3 3 5 Ala AAA GAC AAA - GTT TAC ACC CGT GTT f» CAC CTG 1055 Leu Lys Asp Lys 340 Pro Gly Vai Tyr Thr 345 Arg Vai Ser His Phe 350 Leu 44 83 886 ΕΡ Ο 669 394/ΡΤ TGG ATC CGT TCT CAC ACC AAA C-AA Tm lie Arg 355 Ser His Thr Lys Glu 350 GTT GTA GTA GTG CGG z»*r*f* Cwj CTG Vai Vai 370 Vai Vai Vai Are ?ro 375 Leu r* ·Λ λ λ ν;ΛΛ jnA ATC CCG GAA GAA TAC CTG Glu Giu 385 lie Pro- Glu Glu 350 Leu GAA AAC GGT CTG GCT CTG AGC CCG Giu As η Gly Leu Aia Leu Ser ?ro 3 ο Ξ GGT GGT GGT GGT AAC GGT GAC TTC Gly Gly Gly Glv Asn Glv Aso Phe 3 30 CAA TAA Gin * (2) INFORMAÇÃO PARA SEQ ID NO: 10: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 394 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA:.SEQ ID NO: 10:
Me- Ser Lys Thr Cys 5 Tyr Glu Gly Asn Gly 1Õ His Phe Tyr Arg Gly 15 Lys Aia Ser ThT‘ Aso 20 Thr Mec Gly Arg Pro 25 Cys Leu Pro Trp Asn 30 Ser Ala Thr Vai Leu 35 Gin Gin Thr Tyr His 40 Ala His Arg Ser Aso 45 Ala Gin Lau Gly 50 Leu Gly Lys His Asn S5 Cys Arg Asn Pro *50 As? Asn Arg Arg Arg 55 Pro Tm Cys Tyr Vai 70 Gin Vai Gly Leu Lvs 75 pro Leu Vai Gin Giu 30 Cys Met Vai His Asn 85 Cys Ala As? Gly Lvs *90 Lys pro Ser Ser Pro 95 Pro 45 83 886 ΕΡ Ο 669 394/ΡΤ
Glu Glu Leu Lys 100 Phe Gin Cys Giy Gin 105 Lys Thr Leu Arg Pro 110 Arg Phe Lys Ils lis 115 Gly Gly Glu Phe Thr 120 rrt-1 ·*- Ile Giu Asn Gin 125 Pro Trp Phe Ala Ala 130 lie Arg Arg His 135 Arg Giy Gly Ser Vai Thr 140 Tyr Vai Cys Gly 145 Gly Ser Leu lie Ser 150 Pro Cys Trn Vai Z L 3 155 Ser Ala '"U »- His CVS 160 Phe Ile Asp Tvr Pro 165 Lys Lys Giu Asp Tyr 170 Ile Vai Tyr Leu Gly 175 Arg Ser Arg Leu Asn 180 Ser Asn Thr Gin Glv 185 Glu Met Lys Phe Glu 150 vai Giu Asn Leu lie 155 Leu His Lys Asp 'TVy’"*’* 200 Ser Ala Asp Thr Leu 205 Ala His His Asn Asn 210 lie Ala Leu Leu Lys 215 T ^ Λ Arg Ser Lys Glu Gly 220 Arg Cys Ala
Gin 225 Pro Ser Arg Thr Ile 230 Gin Thr ZÍ3 Cys Leu 235 Prc Ser Met Tvr Asn 240 Asp Pro Gin Phe Gly Thr 245 Ser Cys Giu ?*! A 250 TV'· Gly Phe Gly ivs 255 Glu Asn Ser Thr Asn 260 Leu Tyx Pro Glu 265 Gin Leu Lys Met Thr 270 Vai Vai Lys Leu Ile 275 Ser His Arg Glu Cys 230 Gin Gin Pro His Tyr Tyr Gly 235 Ser Glu Vai 290 Thr Thr Lys Met Leu 295 Cys Ala Ara Asp Pro 300 Gin Trp Lys Thr Asn 305 Ser Cys Gin Gly Asn 31*0 Ser Gly Gly Pro Leu 315 Vai Cys Ser Leu Gin 320 Gly Arg Met Thr Leu 325 Thr Gly lie Vai Ser 330 Gly Arg Gly Cys 335 Ala Leu Lys Asp Lys 340 Pro Gly Vai Tyr Thr 345 Arg Vai Ser His Phe· 350 Leu Pro Trp Ile Arg 355 Ser Eis Thr Lys Glu 360 Glu Asn Gly Leu Ala 365 Leu Ser Pro Vai Vai 370 Vai Vai Vai Arg Pro 375 Leu Gly Giy Gly Giy 380 Asn Gly Asn Phe
Tyr Leu Gin
Glu Glu lis Pro Glu Glu 395 390
(2) INFORMAÇÃO PARA SEQ ID NO: 11: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1191 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (ix) CARACTERÍSTICA:
(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1..1191 (D) OUTRA INFORMAÇÃO: /function= "metionina N-terminal é separada proteoliticamente em E.coii" /product= "gene sintético para a proteína M29 (pSJ106)" (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 11: A-G AGC AAA ACT TGC TAC GAA «JW - AAC GGT CAC • «V· TAC GGT AAG 43 Mec 1 Ser Lys Thr Cys 5 Tvr Glu Gly Asn Gly 10 His Phe Tyr· Arg Gly 15 Lys GCT TCT ACC GAC ACC ATG GGT CGT CTG CCG AAC GCT 9o Ala Ser Thr Aso 20 Thr Mec Gly Arg Pro 25 Cys Leu Pro Tro Asn 30 Ser Ala ACC GTT CAG CAG ACC TAC CAC GCT CAC CGT GAT GCA CAG 1¾¾ Thr Vai Leu 35 Gin Gin Thr Tyr His 40 Ala His Arg Ser Aso 45 Ala Leu Gin CTG GGT CTG GGT AAA CAC AAC TAC TGC *t* - AAC CCG GAC AAC r*r**r* CGT 192 Lau Gly 50 Leu Gly Lys His Asn 55 Tyr Cys Arg Asn Pro so Asp Asn Arg Arg CGT CCG TGG TGC TAC GTT CAG GTT GGT CTG AAA CCG CTA GTT CAG GAA 240 Arg 65 Pro Trp Cys Tyr Vai 70 Gin Vai Gly Leu Lys 75 Pro Leu Vai Gin Glu 30 TGC ATG GTT CAC GAC TGC GCT GAC GGT AAA AAA CCG TCT TCT CCG CCG 238 Cys Mec Vai Kis Aso 8*5 Cys Ala Asp Gly Lys 90 Lys Pro Ser Ser Pro 95 Pro
83 886 ΕΡ Ο 669 394/ΡΤ 47
GAA GAG CTC AAA CAG TGC GGT CAA AAA ACC f · li·* Lia CGT CCG CGT TTT Glu Glu Leu Lys Phe Gin Cys Gly Gin Lys Thr Leu Arg Pro £rg Phe 100 105 110 AAA ATC ATC GGT GGT GAG TTC ACC ACC ATC GAA AAC CAG CCG TGG TTC Lys Ile Ile Gly Gly Glu Phe Thr Thr Ile Glu Asn Gin Pro Trp Phe 115 120 125 GCT GCT ATC TAC CGT CAC CGT GGT GGT TCT ACC TAC GTT iCjc Ala Ala Ile Tyr Arg Arg Kis Arg Gly Gly Ser Vai Thr Tt/T* Vai Cys 130 135 140 GGT GGT (W/ M !'l x\_ i CTG ATC CCG TGG VJ1 . ATC TCT GCT ACC CAC XU\- Gly Gly Ser Leu Ile Ser Pro Cys Trp Vai 11 θ Ser Ala Thr His Cys 14*5 150 155 150 TTC ATC GAC TAC CCG AAA AAA GAA GAC TAC ATC GTT TAC CTC CGT Phe Ile Asp Tyr ?ro Lys Lys Glu Asp Tvr- Ile Vai Leu Gly Arg 165 170 175 CGT TTA AAC TCT AAC. ACC CAG GGT GAA ATG AAA GAA GTT GAA Ser Arg Leu Asn 130 Ser Asn Thr Gin Gly 13*5 Glu Met Lys Phe Glu 190 Vai Glu AAC CTG ATC CTG CAC AAA GAC TAC X s— X GCT GAC ACC CTG GCT CAC CAC Asn Leu Ile 195 Leu His Lys Asp T** 200 Ser Ajl a Asp Leu 205 Ala His His AAC GAC ATC GCT CTG CTA AAA ATC CGT TCT AAA '^ΛΛ GGT CGT TGC GCT Asn Aso 210 T * 3 Ala Leu Leu Lys 215 Ile Arg Ser Lys Glu 220 Gly Arg Cys Ala CAG CCG TCT CGT ACC ATC CAG ACC ATC TGC CTG TCT ATG TAC AAC Gin 225 Pro Ser Arg Thr Ile 230 Gin Thr Ile Cvs Leu 235 Pro S02T Met Tyr Asn 240 GAC CCG CAG x GGT ACC TCT TGC GAA ATC ACC GGT GGT AAA GAA Asp Pro Gin Phe Glv 245 Thr Ser Cys Glu Ile Thr 250 Gly Phe Gly Lvs 255 Glu AAC X ACC GAC TAC CTG TAC CCG GAA CAG CTG AAA ATG ACC ZIM 1# 1 1 Cll Asn Ser Thr Aso 260 Tyr Leu Tyr Pro Glu 265 Gin Leu Lys Met Thr 270 Vai Vai AAA CTG ATC TCT CAC CGT GAA TGC CAG CAG CCG CAC TAC TAC GGT TCT Lys Leu Ile 275 Ser His Arg Glu Cvs 230 Gin Gin Pro His 285 Tyr Gly Ser GAA GTT ACC ACC AAA ATG CTG (jW X GCT GAC CCG CAG TGG AAA ACC Glu Vai 290 Thr Thr Lys Met Leu 295 Cys Ala Ala Asp Pro 300 Gin Trp Lys TVr· GAC TCT TGC CAA GGT GAC TCT GGT GGT CCA CTA i η n TGC TCT CTC CAG Aso 3 05 Ser Cys Gin.Gly Asp 310 Ser Gly Gly Pro Leu 315 Vai Cys Ser Leu Gin 320 GGT CGT ATG ACC CTG ACC GGT ATT GTT TCT TGG GGT CGT GGT TGC GCT Gly Arg Met Thr Leu 325 Thr Gly Ile Vai Ser Trp 330 Gly Arg Gly Cys 335 Ala 3 36. 394 432 430 523 576 624 672 720 763 325 364 912 960 1003
48 CTG AAA GAC AAA CCG GGT GTT TAC ACC CGT GTT TCT CAC TTC CTG CCG 105o Leu Lys Asp Lys Pro Gly Vai Thr Arg Vai Ser Kis Phe Leu Pro 340 345 350 TGG ATC CGT TCT CAC ACC AAA GAA GAA AAC GGT CTG GCT CTG AGC CCG 1104 Trp Ile Arg Ser Kis Thr Lys Glu Glu Asn Gly Leu Ala Leu Ser Fro 355 350 365 /*/**m Lju X TTC CCG CGG CCG TTC CTG CTG CGG AAC CCG AAC GAC AAA 1152 Vai Vai Ala Phe Pro Arg Pro Phe Leu Leu Arg Asn Pro Asn Asp Lys 370 375 380 TAC GAA CCG TGG GAA GAC GAA GAA AAA AAC GAA TAA 11 91 Tyr Glu Pro Phe Trp Glu Asp Glu Glu Lys Asn Glu k 385 390 395 (2) INFORMAÇÃO PARA SEQ ID NO: 12: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 397 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 12:
Mec Ser Lys Thr Cvs * 5 Glu Gly Asn Glv 1Ò Kis Phe Tvr Arg Gly 15 Lys Ala Ser Thr Aso 20 Thr Met Gly Arg Pro 25 Cys Leu Pro Trp Asn 30 Ser Ala Thr Vai Leu 35 Gin Gin TV··*- Tyr Kis 40 Ala His Arg Ser Aso 45 Ala Leu Gin Leu Gly 50 Leu Gly Lys Kis Asn 55 Tyr Cys Arg Asn Pro 60 Asp Asn Arg Arg Arg 65 Pro Trp Cys Tyr Val 70 Gin Val Gly Leu Lys 75 Pro Leu Val GIn Glu 30 Cys Mec Vai Kis Aso 85 Cys Ala Asp Gly Lys 90 Lys Pro Ser Ser Pro 95 Prc Glu Glu Leu Lys 100 Phe Gin Cys Gly C-ln 105 Lys Thr Leu Arg Pro 110 Arg Phe Lys Ile Ile 115 Gly Gly Glu Phe Thr 120 Thr Ile Glu Asn Gin 125 Pro Tro Phe Ala Ala 130 Ile Tyr Arg Arg Kis 135 Arg Gly Gly Ser Val 140 Thr Tyr Val Cys Glv 145 Gly Ser Leu Ile Ser 150 Pro Cys Trp Val 155 Ser Ala Thr Kis Cys 160
83 886 ΕΡ Ο 669 394/ΡΤ 49
Phe Ile Asp Tyr Pro 165 Lys Lys Glu Asp Tyr Ile 170 Vai Tyr Leu Glv 175 Arg Ser Arg Leu Asn 180 Ser Asn Thr Gin Gly Glu Met 185 Lys Phe Glu 190 Vai Glu Asn Leu Ile 195 Leu Kis Lys Asp Tvr 200 Ser Ala Asp Thr Leu 205 Ala His His Asn Aso 210 Ile Ala Leu Leu Lvs 215 ZXâ Arg Ser Lys Glu Gly 220 Arg Cys Ala Gin. 225 Pro Ser Arg Thr Ile Gin 230 »T*V*^* lie Cys Leu 23S Pro Ser Met. Tyr Asn 240 Asp Pro Gin Phe Gly 245 Thr Ser Cys Glu Ile Thr 250 Gly Phe Gly Lvs 255 Glu Asn Ser Thr Aso 260 Tyr Leu Tyr Pro Glu 265 Gin Leu Lys Met Thr 270 Vai Vai Lvs Leu Ile 275 Ser His Arg Glu Cys 280 Gin Gin Pro His Tyr 235 Tyr Gly Ser Giu Vai 290 Thr Thr Lys Met Leu 295 Cys Ala Ala Asp pro Gin 300 Tro Lys T^·*· Aso 3 05 Ser Cys Gin Gly Aso Ser 310 Gly Gly Pro Leu 315 Vai Cys Ser Leu Gin 320 Gly Arg Met Thr Leu 325 Thr Gly ZI.S Vai Ser Trp 330 Gly Arg Gly Cys 335 Ala Leu Lvs Asp Lys 340 Pro Gly Vai Tvr Thr 345 Arg Vai Ser His Phe 350 Leu Pro Trp Ile Arg 355 Ser His Thr Lys Glu 360 Glu Asn Gly Leu Ala 365 Leu Ser Pro Vai Vai 370 Ala Phe Pro Aro Pro 375 ?ílw Leu Leu Arg Asn Pro 380 Asn Asp Lys Tvr 385 Giu Pro Phe Trp Glu Aso 390 Glu Glu Lvs Asn 395 Glu * (2) INFORMAÇÃO PARA SEQ ID ΝΟ: 13: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1182 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico 50 83 886 ΕΡ Ο 669 394/ΡΤ (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (ix) CARACTERISTICA:
(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1..1182 (D) OUTRA INFORMAÇÃO: /function= "metionina N-terminal é separada proteoliticamente em E.coli” /product= "gene sintético para a proteína M30 (pSJ109)" (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 13:
ATG AGC AAA ACT TGC TAC GAA GGT AAC GGT CAC TAC CGT GGT AAG 43 Met Ser Lys Thr. Cys 5 Tyr Glu Gly Asn Gly 10 His Phe Tyr Arg Gly 15 Lys GCT ACC GAC ACC ATG GGT CGT CCG TGC CTG CCG TC-G AAC TCT GCT 96 Ara Ser Thr Aso 20 T>! Met Gly Arg Pro 25 Cys Leu Pro Trp Asn 30 Ser Ala ACC GTT CTG CAG CAG ACC TAC CAC GCT CAC CGT 1 1 GAT GCA TTG CAG 144 Thr Vai Leu 35 Gin Gin Thr His 40 Ala His Arg Ser Asp 45 Ai. a Leu Gin CTG GGT CTG GGT AAA CAC AAC TAC TGC CGT AAC CCG GAC AAC CGT CGT 192 Leu Gly 50 Leu Gly Lys His Asn 55 'Γ’νΤ Cys Arg Asn Pro 6 0 Asp Asn Arg CGT CCG TGG TGC TAC Q‘T""P CAG GTT GGT η'Τ'Γί v- _ o AAA CCG CTA X · CAG GAA 240 Arg 65 ?rc Tro Cys Tyr Val 70 Gin Val Gly Leu Lys 75 Pro Leu Val C-ln 30 TGC ATG GTT CAC GAC TGC GCT GAC GGT AAA AAA CCG r+r**· 233 Cys Mec Vai His Asp 35 Cys Ala Asp Gly Lvs 90 Lys Pro Ser Ser Pro 95 Pro GAA GAG CTC AAA CAG TGC Ljvjx CAA AAA ACC CTA CGT CCG CGT 326 Giu Glu Leu Lys 100 Phe Gin Cys Gly Gin 105 Lys Thr Leu Arg Pro 110 a·*·'» A-3 Phe AAA ATC ATC GGT LjVí X GAG TTC ACC ACC - w GAA AAC CAG CCG TGG 334 Lys Ile ZXs 115 Gly Gly Glu Phe Thr 120 Thr Ile Glu Asn Gin 125 Pro Trp Phe GCT GCT ATC TAC CGT CGT CAC CGT GGT GGT TCT GTT ACC TAC GTT TGC 432 Ala Ala 130 Ile Tyr Arg Arg His 135 Arg Gly Gly Ser Vai 140 Thr Tyr Val Cys GGT GGT TCT CTG ATC "l»l CCG TGC TGG GTT ATC q-»£iT* GCT ACC CAC TGC 430 Gly 145 Glv Ser Leu ile Ser 150 Pro Cys Trp Val Ile 155 Ser Ala Thr His Cvs ISO
fTMtp ATC GAC TAC CCG AAA AAA GAA GAC TAC ATC GTT TAC CTC GGC 523 ?he Ile Asp Tyr Pro 165 Lys Lys Glu Asp Tyr IIe 170 Vai Tvx Leu Gly 175 Arg *T»/ MM XV..* CGT TTA AAC TCT AAC ACC GAG GGT GAA ATG AAA GAA GTT GAA 576 Ser Arg Leu Asn 130 Ser Asn Thr Gin Glv Glu Mec 135 Lys Phe Glu 190 Val Glu AAC CTG ATC CTG CAC AAA GAC TAC TCT GCT GAC ACC CTG GCT CAC CAC 624 Asn Leu 195 Leu Kis Lys Asp 200 Ser Ala Asp Thr Leu 205 Ala Kis Kis AAC GAC ATC GCT CTG CTA AAA ATC CGT TCT AAA GAA (jvj X CGT TGC GCT 672 Asn Asp 210 Ile Ala Leu Leu Lvs 215 Ile Arg Ser Lys Glu 220 Gly Arg Cys Ala CAG VaWVj TCT CGT ACC ATC CAG ACC ATC TGC CTG CCG TCT ATG TAC AAC 720 Gin 225 Ρ2ΓΟ Ser Arg Thr Ile 230 Gin Thr Ile Cvs Leu 235 Pro Ser Met Tyr Asn 240 GAC CCG CAG TTC GGT ACC TGC GAA ATC ACC GGT TTC GGT AAA GAA 763 Asp ?ro Gin Phe Gly Thr 245 Ser Cys Glu Ile Thr 250 Gly Phe Gly Lys 255 Glu AAC ACC GAC TAC CTG TAC CCG GAA CAG CTG AAA ATG ACC GTT 316. Asn Ser Thr Asn 260 Tyr Leu Tyr Pro Glu Gin Leu 265 Lys Met Thr 270 Va£ Vai AAA CTG ATC TCT CAC CGT GAA TGC CAG CAG CCG CAC TAC TAC GGT 364 Lys Leu Ile 275 Ser Kis Arg Glu Cvs 230 Gin Gin Pro Kis Tyr Tyr Gly 285 Ser GAA GTT ACC ACC AAA ATG CTG TGC GCT GCT GAC CCG CAG TGG AAA ACC 912 Glu Vai 290 Thr Thr Lys Mec Leu 295 Cys Ala Ala Asp Pro 300 Gin Trp Lys —►v *- GAC T'wi TGC CAA GGT GAC TCT GGT GGT CCA CTA Vw X X TC-C iC - CTC — 960 Asn 30*5 Ser Cys Gin Gly Aso 31*0 Ser Gly Gly Pro Leu 315 Val Cys Ser Leu 320 GGT CGT ATG ACC CTG ACC GGT ATT GTT TCT TGG GGi CGT GGT TGC GCT 10 CS Glv Arg Mec Thr Leu 325 Thr Gly Ile Vai Ser Tro 330 Gly Arg Gly Cvs 335 • **"* CTG AAA GAC AAA CCG •sJVJX GTT TAC ACC CGT GTT CAC TTC CTG CCG 1055 Leu Lys Asp Lys 340 Pro Gly Val Tyr Thr Arg Val 345 Ser Kis Phe 3S0 Leu ?rc TGG ATC CGT CAC ACC AAA GAA GAA AAC GGT CTG GCT CTG AGC 1104 Trp Ile Arcr 355 Ser Kis Thr Lys Glu 360 Glu Asn Gly Leu Ala 365 Leu Ser Ί S — GTT Cjx x GCT TTC CCG CGG f+r**"* CTG GGT GGT GGT GGT AAC GGT GAC TTC 1152 Vai GAA Glu Val Ala 370 GAA ATC Glu lie Phe CCG Pro Pro Arg GAA GAA Glu Glu Pro 375 TAC Tyr Leu CTG Leu Glv Glv Gly Gly 330 CAA TAA Gin * Asn Glv Asp prg 1132 385 390 i 52 83 886 ΕΡ Ο 669 394/ΡΤ (2) INFORMAÇÃO PARA SEQ ID NO: 14: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 394 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 1 4.
Mec Ser Lys Thr Cys 5 Tyr Glu Gly Asn Giv 10 His TV"2T Arg Giv 15 Lys Ala Ser Thr Ase 2*0 Thr Mec Gly Arg ?rc Cvs 25 Leu ?ro Trp Asn 30 Ser Ala Thr Vai Leu 35 Gin. Gin Thr Tyr His 40 Ala His Arg Ser Asp 45 Ala Leu Gin Leu Gly 50 Leu Gly Lys His Asn 55 Tyr Cys Arg Asn Pro 60 Asp Asn Arg Arg Arg 65 Fro Trp Cys Tyr Vai 70 Gin Vai Gly Leu Lys 75 Pro Leu Vai Gin Glu ao Cys Mec Vai Kis Ase as Cys Ala Ase Gly Lys 90 Lvs Pro Ser Ser Pro 95 Pro Glu Glu Leu Lys 1Ò0 ?he Gin Cys Gly Gin Lys 105 Thr Leu Arg Pro 110 Arg Phe Lys Ile Ile 115 Gly Gly Glu Phe Thr 120 Thr Ile Glu Asn Gin 12 5 Pro Tro Phe 53 83 886 ΕΡ Ο 669 394/ΡΤ
Ala A.L0 130 Ile Tyr Arg Arg His 135 Arg Gly Gly Ser Val 140 Thr TV i» y — Vai Cys Gly 145 Gly Ser Leu - 3 Ser 150 Pro Cys Tm Vai Γ L 0 155 Ser Ala Thr His Cys 150 Phe Ile Asp Tyr Pro 155 Lys Lys Glu Asn Tyr 170 ZLs Val Tyr Leu Gly 175 Arg Ser Leu Asn 180 Ser Asn Thr Gin Gly Glu 185 Met Lys Phe Glu 190 Vai Giu Asn Leu Ile 195 Leu His Lys Asp Tyr 200 Ser Ala Asp Thr Leu 205 Ala His His Asrx Asn 210 Ile Ala Leu Leu Lys 215 Ile Arg Ser Lys Glu 220 Gly Arg Cys Ala Gin 225 Pro Ser Arg Thr Ile 230 Gin Thr Ile Cys Leu 235 Pro Ser Met Tvr Asn 240 Asp Pro Gin Phe Gly 245 Thr Ser Cys Glu Ile 250 Gly Phe Gly Lvs 255 Giu Asn Ser Thr Asn 260 Tyr Leu Tyr Pro Glu 265 Gin Leu Lys Met Thr 270 Val Val Lvs Leu lie 275 Ser His Arg Glu Cys 280 Gin Gin Pro His TV/r· 235 Tyr Glv Ser Glu Vai 290 Thr 'ΠΧ,γ. Lys Met Leu 295 Cys Ala Ala Asp 300 Gin Lys Thr Aso 305 Se: Cys Gin Gly Asn 310 Ser Gly Gly Pro Leu 315 Val Cys Ser Leu Gin 320 Gly Arg Met Thr Leu 325 Thr Gly lia Vai Ser 330 Tm Gly Arg Gly Cys 335 Ala Leu Lvs Asp Lys 340 Pro Gly Vai 'TV/'·· Thr 345 Arg val Ser ri .13 Phe 350 Leu Pro Tm Ile Axc 355 Ser His Thr Lys Glu 360 Glu Asn Gly Leu Ala 365 Leu Sô· Vai Vai Vai 370 Ala Phe Pro Arg Pro 375 Leu Gly Gly Gly Gly 380 Asn Gly Asp Phe
Glu Giu Ile Pro Glu Glu Tyr Leu Gin * 385 390 (2) INFORMAÇÃO PARA SEQ ID NO: 15: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1182 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (iii) HIPOTÉTICO: não 54 83 886 ΕΡ Ο 669 394/ΡΤ (iv) ANTI-SENTIDO: não (ix) CARACTERÍSTICA:
(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1..1182 separada (D) OUTRA INFORMAÇÃO: /function= "metionina N-terminal é proteoliticamente em E.coli" /product= "gene sintético para a proteína M31 (pSJ111)” (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 15: ATG AGC AAA ACT TGC TAC GAA GGT AAC GGT CAC TTC TAC CGT GGT AAG Met Ser 7 Lys Thr Cys 5 Tvr Glu Gly Asn Giv 1Ò His Phe Tvr· Arg Gly 15 Lys GCT TCT ACC GAC ACC ATG GGT CGT CCG TGC CCG TGG AAC GCT Ala Ser Thr Aso 20 Thr Met Gly Arg Pro 25 Cys Leu Ο V·—S ' ' Asn 30 Ser Ala ACC GTT CTG CAG CAG ACC TAC CAC GCT CAC CGT TCT GAT r**T*r* -'sJ CAG Thr Vai Leu 35 Gin Gin Thr Tyr His 40 Ala His Arg Ser Asp 4 s Ala Leu Gin CTG GGT CTG GGT AAA CAC AAC TAC TGC AAC CCG GAC AAC CGT Leu Giv 50 Leu Gly Lys His Asn Tyr 55 Cys Arg Asn Pro Aso 60 Asn Arg Arg CGT CCG TGC TAC GTT CAG GTT GGT CTG AAA GTT CAG GAA Aro Pro 6 5 Cys Vai 70 Gin Val Gly Leu Lvs 75 Pro Leu Val Gin Glu 3C TGC ATG GTT CAC GAC TGC GCT GAC Ljvj 1 AAA AAA CCG TCT CCG CCG Cys Met Val His Aso 85 Cys Ala Asp Giv Lvs 90 Lys Pro Ser Ser Pro 95 Pro GAA GAG CTC AAA TTC CAG TGC GGT CAA AAA A.CC CCG CGT 'Τ'Τ"’' Glu Glu Leu Lys 100 Phe Gin Cys Giv Gin 105 Lys TVl v* Leu Arg Pro 110 Arg Phe AAA ATC ATC GGT GGT GAG TTC ACC ACC ATC GAA AAC CAG CCG TGG J. Lys Ile Ile 115 Gly Gly Glu Phe Thr 120 Thr Ile Glu Asn Gin 125 Pro Trp Phs GCT GCT ATC TAC CGT CGT CAC CGT GGT GGT TCT GTT ACC TAC GTT TGC Ala Ala 130 lie Tyr Arg Arg His Arg Gly Giv 135 Ser Vál Thr 140 Tyr Val Cys GGT GGT TCT CTG ATC TCT CCG TGC TGG GTT ATC TCT GCT ACC CAC TGC Gly Gly 145 Ser Leu Ile Ser 150 Pro Cys Trp Val Ile 155 Ser Ala Thr His Cys 160 TTC ATC GAC TAC CCG AAA AAA GAA GAC TAC ATC GTT TAC CTC GGC CGT Phe Ile Asp Tvr Pro 165 Lys Lys Glu Asp Tyr 170 Ile Val Tyr Leu Gly Arg 175 TCT CGT TTA AAC TCT AAC ACC CAG GGT GAA ATG AAA TTC GAA GTT GAA Ser Arg Leu Asn Ser Asn Thr C-ln Gly Glu Met Lys Phe Glu Val Glu 180 185 190 48 96 144 240 233 33 6 334 432 430 528 576
AAC CTG ATC CTG CAC AAA GAC TAC ^,CT GCT GAC ACC GCT CAC CAC 524 Asn Leu lie Leu His Lys Asp Tvr Ser Ai a Asp t\* v Leu Ala His His 195 200 205 AAC GAC ATC GCT CTG CTA AAA ATC CGT is—· AAA GAA GGT TGC GCT 572 Asn Asp lie Ai a Leu Leu Lys lie Arg Ser Lys Glu Giy Arg Cys Ala 210 215 220 CAG CCG TCT CGT ACC ATC CAG * ATC TGC CTG ATG TAC AAC 720 Gin ?2TO Ser Arg Thr Ile Gin v lie Cys Leu Pro Ser Met Tyr Asn 225 230 235 240 GAC CCG CAG TTC GGT ACC TGC GAA ATC ACC GGT 11 Ç* GGT AAA GAA 753 Asp ?ro Gin ?he Giy Thr Ser Cys Glu XI» s Thr Giy Phe Giy Lys Giu 245 250 255 AAC TCT ACC GAC TAC CTG TAC CCG GAA CAG CTG AAA Λ ****** ACC GTT GTT 315 Asn Ser Thr Asn Tyr Leu Tvr Pro Glu Gin Leu Lys Met Thr Vai Vai 25*0 255 270 AAA CTG ATC TCT CAC CGT GAA TGC CAG CAG CCG CAC TAC TAC GGT 354 Lys Leu lie Ser His Arg Glu Cys Gin Gin Pro His Tvr Tvr Giy Ser 275 230 285 GAA GTT ACC ACC AAA ATG CTG TGC GCT GCT GAC ****** CAG TGG AAA ACC 912 Giu Vai Thr Thr Lys Met Leu Cys Ala Ai a Asp Pro Gin Trp Lys Thr 290 295 300 GAC TGC CAA GGT GAC mQfpi \S\3 L· GGT CCA CTA GTT TGC *m^** CAG 960 Asn Ser Cys Gin Giy Asn Ser ** 1 . - vj —y Giy Prc Leu XI CL-1 Cys Ser Leu Gin 30*5 310 315 320 A ****^ WsJ* ATG ACC CTG ACC ATT GTT • W A <*)>!»< CGT GGT f^*m** GCT 1003 Giy Arg Met Thr Leu Thr Giy Ile Vai Ser Trp Giy Ãrg Giy Cys Ala 325 330 33 5 CTG AAA GAC AAA CCG GGT GTT TAC ACC CGT CAC φ>*1^ **^** 1055 Leu Lys Asp Lys Pro Giy Vai Tyr Thr Arg Vai Ser -13 Leu Pro 340 345 350 TGG ATC CGT '»* ( CAC ACC AAA GAA GAA AAC GGT CTG GCT CTC- AGC CTG 1104 Trp Arg Ser His Thr Lys Glu Glu Asn Giy Leu Ala Leu Ser Leu 355 350 355 GTT AAA GCT TTC CCG CGG CCG CTG GGT GGT GGT GGT AAC GGT GAC 1152 Vai Lys Ala Phe Pro Arg Pro Leu Giy Giy Giy Giy Asn Giy As? Phe 370 375 380 GAA . GAA . ATC CCG GAA GAA . TAC CTG CAA TAA 1182 Glu Glu . Ile Pro Glu Glu Tyr Leu Gin * 385 390 (2) INFORMAÇÃO PARA SEQ ID NO: 16: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 394 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína 56 83 886 ΕΡ Ο 669 394/ΡΤ íxi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 16:
Met 1 Ser Lys Thr Cys Tyr Glu 5 Gly Asn Gly 1Ò His Phe Tyr Arg Gly Lys 15 Ala Ser Thr Aso 20 Thr Met Gly Arg Pro Cvs 25 Leu Pro Tro Asn 30 Ser Ala Thr Vai Leu 35 Gin Gin Thr Tvr His Aia His 40 Λ—^ Ser Asp Ala 45 Leu Gin Leu Gly Leu 50 Gly Lys His Asn 55 Tyr Cys Arg Asn Pro 50 Aso Asn l ·*·.«» i—cr Arg 65 Pro Trp Cys Tvr Vai Gin 70 Vai Gly Leu Lvs 75 Pro Leu Vai Gin Glu 30 Cys Met Vai His Aso Cys Ala 8 5 Aso Glv Lvs 90 Lys Pro Ser Ser Pro Pro 95 Glu Glu Leu Lys 100 Phe Gin Cys Gly Gin Lys 105 Thr Leu Arg Pro 110 Arg Phe Lys Ile Ile 115 Gly Gly Glu Phe Tii^r Tixzr x X 0 120 Glu Asn Gin Pro 125 Tro Phe Ala Ala Ile 130 Tvr Arg Arg His 13 5 Arg Gly Gly Ser vai 140 Ti!2f TV^T Vai Cys Gly 145 Gly Ser Leu Ile Ser Pro 150 Cys Trp Vai Gle 155 Ser Ala Thr His Cvs 160 Phe Ile Asp Pro Lys Lys 165 Glu Asp Tyr 170 Ile Vai Tyr Leu Glv Arg 175 Ser Arg Leu Asn 130 Ser Asn Thr Gin Glv Glu 135 Met Lys Phe Glu 190 Vai Glu Asn Leu Ile 195 Leu His Lys Asp Tyr Ser Ala 200 Asp Thr Leu Ala 205 His His Asn Aso Ile 21*0 Ala Leu Leu Lys 215 lie Arg Ser Lys Glu 220 Gly Arg Cys Ala Gin 225 Pro Ser Arg Thr Ile Gin 230 Thr Ile Cys Leu 235 Pro Ser Met Tvr Asn 240
Aso Pro Gin Phe Gly Thr Ser Cys Glu Ile Thr Gly Phe Gly Lys Glu 245 250 255
Asn Ser Thr Aso Tyr Leu Tyr Pro Glu Gin Leu Lys Met Thr Vai Vai 260 265 270
Lys Leu Ile Ser His Arg Glu Cys Gin Gin Prc His Tyr Tyr Gly Ser 275 230 285
Glu Vai Thr Thr Lys Met Leu Cys Ala Ala Asp Pro Gin Trp Lys Thr 290 295 300
Asp Ser Cys Gin Gly Asp Ser Gly Gly Pro Leu Vai Cys Ser Leu Gin 305 * 310 315 320
Glv Arg Met Thr Leu Thr Glv Ile Vai Ser Trp Gly Arg Gly Cys Ala 325 * 330 335 57 83 886 ΕΡ Ο 669 394/ΡΤ
Leu Lys Asp Lys 340 Pro Gly Val Tvr Thr 343 Arg Val Ser His Phe 350 Leu Pro Trp lie Arg 355 Ser His Thr Lys Glu 350 Glu Asn Gly Leu Ala 355 Leu Ser Leu Val Lvs 370 Ala Phe Pro Arg Pro 375 Leu Gly Gly Gly Giv 330 Asn Gly Asp Phe Glu 385 Glu 7' a Pro Glu Glu 390 Leu Gin ★ (2) INFORMAÇÃO PARA SEQ ID NO: 17: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1167 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (ix) CARACTERÍSTICA:
(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1..1167 (D) OUTRA INFORMAÇÃO: /function= "metionina N-terminal é separada proteoliticamente em E.coli” /product= "gene sintético para a proteína M33 (pSJ113)" (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 17: ATG AGC AAA ACT TGC TAC GAA GGT AAC GGT CAC TTC TAC CGT GGT AAG 4 8
Me“ Ser Lvs Thr Cys Tyr Glu Gly Asn Gly His Phe Tyr Arg Gly Lys 1*5" 10 13 GCT TCT ACC GAC ACC ATG GGT CGT CCG TGC CTG CCG TGG AAC TCT GCT 96
Ala Ser Thr Asp Thr Met Gly Arg Pro Cys Leu Pro Trp Asn Ser Ala 20 25 30 ACC GTT CTG CAG CAG ACC TAC CAC GCT CAC CGT TCT GAT GCA TTG CAG 144,
Thr Vai Leu Gin Gin Thr Tyr His Ala His Arg Ser Asp Ala Leu Gin 35 40 45 CTG GGT CTG GGT AAA CAC AAC TAC TGC CGT AAC CCG GAC AAC CGT CGT 192.
Leu Gly Leu Gly Lys His Asn Tyr Cys Arg Asn Pro Asp Asn Arg Arg 50 55 60 CGT CCG TGG TGC TAC GTT CAG GTT GGT CTG AAA CCG CTA GTT CAG GAA 240
Arg Pro Tm Cys Tyr Vai Gin Vai Gly Leu Lys Pro Leu Vai Gin Glu 55 * 70 75 30 TGC ATG GTT CAC GAC TGC GCT GAC GGT AAA AAA CCG TCT TCT CCG CCG 2|g
Cys Mec Vai His Aso Cys Ala Asp Gly Lys Lys Pro Ser Ser Pro Pro 85 ' 90 95
GAA GAG CTC AAA TTC CAG TGC GGT CAA AAA ACC CTA CGT CCG CGT ί·4 336 Glu Glu Leu Lys 100 Phe Gin Cys Gly Gin 105 Lys Thr Leu Arg Pro 110 Arg Phe AAA ATC ATC GGT GGT GAG TTC ACC ACC ATC GAA AAC CAG CCG TGG 384 Lys Ile Ile 115 Gly Gly Glu Phe Thr 120 Th.-** lie Glu Asn Gin 125 Pro Tro Phe GCT cv* · ATC TAC CGT CGT CAC CGT GGT GGT fT./*·<*!. i GTT ACC TAC TGC 432 Ai. 3. Ala 130 Ile Tyr Arg Arg His 135 Arg Gly Gly Ser Vai 140 Thr Vai Cys GGT GGT TCT CTG ATC TCT CCG TGC TGG GTT ATC GCT ACC CAC TGC 4SC Gly 145 Gly Ser Leu He Ser 150 Pro Cys Tro Vai Ile 155 Ser Ala Thr His Cvs 1=0 A GAC TAC CCG AAA AAA GAA GAC TAC ATC TAC CTC 528 Phe Ile . .Asp Tyr Pro 165 Lys Lys Glu Asp T-/r 170 lie Vai Tyr Leu Glv 175 Arcr rri^w·» CGT TTA AAC TCT AAC ACC CAG GGT GAA ATG AAA TTC GAA GAA 576 Ser Arg Leu Asn iao Ser Asn Thr Gin Gly 185 Glu Mec Lys Phe Glu 190 Vai Gi.il AAC CTG ATC CTG CAC AAA GAC TAC GCT GAC ACC CTG GCT CAC CAC 624 Asn Leu Ile 195 Leu His Lys Asp Tvr 200 Ser Ala Asp Leu 205 Ala His His AAC GAC ATC GCT CTG CTA AAA ATC CGT AAA GAA vjsa j. TGC 672 Asn Aso 210 Ile Ala Leu Leu Lvs 215 lie Arg Ser Lys Glu 220 Gly Arg Cys Ala CAG CCG TCT CGT ACC ATC CAG ACC iTV**”* CTG w TAC * * 72 C Gin 225 Pro Ser Arg Thr Ile 230 Gin Thr He Cys Leu 235 Pro Ser Mec Asn 240 GAC CCG CAG TTC GGT ACC TGC GAA ATC ACC GGT AAA GAA 768 Asp Pro Gin Phe Gly 245 Thr Ser Cys Glu Ile 250 Thr Gly Phe Gly Lys 235 Glu AAC ACC GAC TAC CTG TAC CCG GAA CAG CTG AAA ATG ACC GTT GTT 316 Asn Ser Thr Aso 2S0 Tyr Leu Tyr Pro Glu 265 Gin Leu Lys Mec Thr 270 Vai Vâ— AAA CTG ATC TCT CAC CGT GAA TGC CAG CAG CCG CAC TAC TAC GGT TCT 864 Lys Leu Ile 275 Ser His Arg Glu Cys 230 Gin Gin Pro His Tyr Tyr Gly Ser 285 GAA GTT ACC ACC AAA ATG CTG TGC GCT GCT GAC CCG CAG TGG AAA ACC 912 Glu Vai 290 Thr Thr Lys MeC Leu 295 Cys Ala Ala Asp Pro 300 Gin Trp Lys Thr GAC TCT TGC CAA GGT GAC TCT GGT GGT CCA CTA TGC TCT CTC CAC- 96C Aso 30*5 Ser Cys Gin Gly Aso 310 Ser Gly Gly Pro Leu 315 Va£ Cys Ser Leu Gln 320 GGT CGT ATG ACC CTG ACC GGT ATT GTT TCT TGG GGT CGT GGT TGC GCT 100?
Gly Arg Mec Thr Leu Thr Gly Ile Vai Ser Trp Gly Arg Gly Cys Ala 325 330 333 105c CTG AAA GAC AAA CCG GGT GTT TAC ACC CGT GTT TCT CAC TTC CTG CCG Leu Lvs Aso Lys Pro Gly Vai Tyr Thr Arg Vai Ser His Phe Leu Pro 340 345 350 59 83 886 ΕΡ Ο 669 394/ΡΤ TGG ATC CGT TCT CAC ACC AAA GAA GAA AAC GGT CTG GCT CTG TTC CCG Trp Ile Arg Ser His Thr Lys Glu Glu Asn Gly Leu Ala Leu Phe ?ro 355 3 o 0 365 CGG CCG CTG GGT GGT GGT GGT AAC r*r+*+* i. GAC GAA GAA ATC CCG GAA Arg ?ro Leu Gly Gly Gly Gly Asn Gly Asp Phe Glu Glu Ile Pro Glu 370 375 380 GAA TAC CTG CAA TAA Glu Tyr Leu Gin * 385 (2) INFORMAÇÃO PARA SEQ ID NO: 18: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 389 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 18: MôC 1 Ser Lys Thr Cys Tvt Glu 5 Gly Asn Gly His 10 Phe Tvr Arg Gly 15 Lys Ala Ser Thr Aso 20 Thr Met Gly Arg Pro 25 Cys Leu ?rc Ttq Asn 30 Ser Ala Thr t;. "! J CL — Leu 35 Gin Gin Thr Tyr His Ala 40 His Arg Ser Asp 45 Ala Leu Gin Leu Gly SÓ Leu Gly Lys His Asn 55 Tyr Cys Arg Asn Prc 60 Asp Asn Arg Arg Aro 65 Pro Cys Tvr Vai Gin 70 Vai Gly Leu Lvs 75 Pro Leu Val Gin Glu 80 Cys Mer Val His Aso Cys Ala 85 Asp Gly Lvs Lvs 90 Pro Ser Ser Pro 95 Pro Glu Glu Leu Lys 100 Phe Gin Cys Gly Gin 105 Lys Thr Leu Arg Pro 110 Arg Phe Lys Ile Ile 115 Gly Gly Glu Phe Thr Thr 120 Ile Glu Asn Gin 125 Pro Trp Phe Ala Ala 130 Ile Tyr Arg Arg His 135 Arg Gly Gly Ser Val 140 Thr Tyr Val Cys Glv 145 Gly Ser Leu Ile Ser Pro 150 Cys Trp Val Ile 155 Ser Ala Thr His Cys 160 Phe Ile Asp Tyr Pro Lys Lys 165 Glu Asp Tyr Ile 170 Val Tyr Leu Gly Arg 175 Ser Arg Leu Asn 180 Ser Asn Thr Gin Gly 185 Glu Mec Lys Phe Glu 190 Val Glu Asn Leu Ile 195 Leu His Lys Asp Tyr Ser 200 Ala Asp Thr Leu 205 Ala His His
Asn Aso Ile Ala Leu Leu Lvs Ile Arg Ser Lys Glu Gly Arg Cys Ala 210 215 220 83 886ΕΡ Ο 669 394/ΡΤ 60
Gin 225 Pro Ser Arg Thr Ile 230 C-ln Thr Asp Pro Gin Phe Gly 245 Thr Ser Cys Asn Ser Thr Asp 260 Tyr Leu Tyr Pro Lys Leu lie 275 Ser His Arg Glu Cvs 230 Glu Vai 290 Thr Thr Lys Mec Leu Cys 295 Aso 305 Ser Cys Gin Gly Asp 310 Ser Gly Gly Arg Met Thr Leu 325 Glv Ile Leu Lys Asp Lys 340 Pro Gly Vai Tyr Trp Ile Arg 355 Ser His Thr Lvs Glu 3 60
Ile Cvs Leu 235 Pro Ser Me- Tyr Asn 240 Glu Ile Thr 250 Gly Phe Gly cys Gj.u 2 55 Glu Gin Leu 265 Lys Met Thr 270 Val Vai Gin Gin Pro His Tyr Tyr 285 Gly Ser Ala Ala Asp Pro 300 Gin Trp Lys Thr Glv Pro Leu 315 Vai Cys Ser Leu Gin 320 Vai Ser Tro 330 Gly Arg Gly Cys Ala 335 Thr Arg Vai 345 Ser His Phe 350 Leu Pro Glu Asn Gly Leu Ala Leu 3 63 Phe Pro Gly Asp Phe Glu 380 Glu Ile Pro Glu 370
Glu Tyr Leu Gin * 385 2) INFORMAÇÃO PARA SEQ ID NO: 19: (i) CARACTERlSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1191 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples ID) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (ix) CARACTERÍSTICA: (A) NOME/CHAVE: CDS (B| LOCALIZAÇÃO: 1..1191 (D) OUTRA INFORMAÇÃO: /function= "metionina N-terminal é separada proteoliticamente em E.coli" /product= "gene sintético para a proteína M32 (pSJ114)" (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 19: ATG AGC AAA ACT TGC TAC GAA GGT AAC GGT CAC TTC TAC CGT GGT AAG'
Met Ser Lys Thr Cys Tyr Glu Gly Asn Gly His Phe Tyr Arg Gly Lvs 1 5 10 15
GCT TCT ACC GAC ACC ATG GGT CCG TGC CTG CCG TGG AAC TCT GCT QC Ala Ser Thr Asp Thr.· Met Gly Arg Pro Cvs Leu Pro Tm Asn Ser Ala 20 25 30 ACC GTT CTG CAG CAG ACC TAC CAC GCT CAC CGT TCT GAT GCA TTG CAG 144 Thr Vai Leu Gin Gin Thr Tyr His Ala His Arg Ser Asp Ala Leu Gin 35 40 45 CTG CTG GGT AAA CAC AAC TAC TGC CGT AAC CCG GAC AAC CGT CGT 152 Leu Glv Leu Gly Lys His Asn Tvr 4 Cys Arg Asn Pro Asn Asn Arg Λ—~ 5*0 55 60 CGT CCG TGG TGC TAC GTT CAG <71 « GGT CTG AAA CCG CTA GTT CAG Arg Pro Trp Cys Tyr Vai Gin Vai Glv Leu Lvs Pro Leu Vai Gin 'j-. u. 65 70 75 30 TGC ATG CAC GAC TGC GCT GAC GGT AAA AAA VwO .Li CCG 23 c Cys Mac . Vai Sis Asd Cys Ala Asp Gly Lys Lys Pro Ser Ser Pro • » a» 85 90 95 GAA GAG CTC AAA TTC CAG TGC \J · CAA AAA ACC LiA CGT J tl | l| φ 3 3c Glu Glu Leu Lys Phe Gin Cys Glv Gin Lvs Thr Leu Arg Pro Arg Phe 100 105 110 AAA ATC ATC GGT GGT GAG TTC ACC ACC ATC GAA AAC CAG CCG -[wVJ ιτν«Λ 384 Lys He Ile Gly Gly Glu Phe Thr Thr lie Glu Asn Gin Pro Phe 115 120 125 GCT GCT ATC TAC CGT CGT CAC CGT GTT ACC TAC A» A A ivV. 432 Ala Ala Ile Tvr Arg Arg His Arg Gly Gly Ser Vai Thr Tyr Vai Cys 130 135 140 GGT GGT TCT CTG ATC CCG - GC TGG GTT ATC TCT GCT ACC CAC TGC 43C Gly Gly Ser Leu Ile Ser Pro Cys Trp Vai Ile Ser ALa Thr His Cys 145 150 155 ISO ATC GAC TAC CCG AAA AAA GAA GAC TAC ATC \J i · A At W « A. 3 Ap C Phe T * a Asp Tvr Pro Lys Lys Glu Asn Tyr Ile Vai Tyr Leu Gly Arz 165 170 Í Z AV. « A ÍA AAC AAC ACC CAG GGT GAA ATG ^ ^ Λ /»»φ ΛΛΛ A a v- ^ΛΛ GTT ν£ΛΛ 57o Ser Arg Leu Asn Ser Asn Thr Gin Gly Glu Met Lys Phe Glu Val Glu 130 135 190 AAC CTG ATC CTG CAC AAA GAC TAC TCT GCT GAC ACC CTG GCT CAC CAC 624 Asn Leu Ile Leu His Lys Asp Tyr Ser Ala Asp Thr Leu Ala His HZ. 3 195 200 205 AAC GAC ATC GCT CTG CTA AAA ATC CGT TCT AAA GAA GGT CGT TGC GCT 572 Asn Aso Ile Ala Leu Leu Lys Ile Arg Ser Lys Glu Gly Arg Cys Ala 210 215 220 CAG CCG TCT CGT ACC ATC CAG ACC ATC TGC CTG CCG TCT ATG TAC AAC 720 Gin Pro Ser Arg Thr Ile Gin Thr Ile Cys Leu Pro Ser Met Asn 225 * 230 235 240 GAC CCG CAG GGT ACC TCT TGC GAA ATC ACC GGT TTC GGT AAA GAA 763 Asp Pro Gin ?»e Gly Ser Cys Glu Ile Thr Gly Phe Gly Lys Glu 245 250 255 81o AAC TCT ACC GAC TAC CTG TAC CCG GAA CAG CTG AAA ATG ACC GTT GTT Asn Ser Thr Aso Tyr Leu Tyr Pro Glu Gin Leu Lys Met Thr Vai Vai 260 265 270
AAA CTG ATC TCT CAC CGT GAA TGC CAG CAG CCG CAC TAC TAC GGT TCT 364 Lys Leu Ile Sér Kis Arg Glu Cys Gin Gin Pro Kis Tyr Tyr Gly Ser 275 230 2 35 GAA GTT ACC ACC AAA ATG CTG TGC GCT GCT GAC CCG CAG • CLJ AAA ACC 912 Giu Vai Thr Thr Lys Met Leu Cys Ala Ala Asp Pro Gin Tm Lys TV"· 290 295 300 GAC iv.: TGC CAA ΟΌ X GAC GGT GGT CCA CTA GTT TGC CTC CAG 960 Aso Ser Cys Gin Gly Asp Ser Gly Gly Pro Leu Val Cys Ser Leu Gin 305 310 315 320 GGT 1 ATG ACC CTG ACC \j\JX ATT TGG GGT CGT GGT TGC vJV-. X 1003 Gly Arg Met Thr Leu Thr Gly Ile Val Ser Trp Gly Arg Gly Cys Ala 325 330 335 CTG AAA GAC AAA CCG GGT GTT TAC ACC CGT Ql Ml f 1 Mn CAC (fWPP X .· V· CTG UwJ 1056 Leu Lvs Asp Lys Pro Gly Val Tyr Thr Arg Val Ser Kis Phe Leu Pro 340 345 - 350 TGG ATC CGT TCT CAC ACC AAA GAA GAA AAÇ GGT CTG GCT C^g AGC CCG 1104 Trp Ile Arg Ser His Thr Lys Glu Glu Asn Gly Leu Ala Leu Ser Pro 355 360 365 QTT AAG GCT TTC CCG CGG CCG CTG CTG CGG AAC CCG AAC GAC AAA 1152 Vai Lvs Ala Phe Pro Arg Pro Phe Leu Leu Arg Asn Pro Asn Asp Lys 370 375 330 TAC GAA C CG TTC TGG GAA GAC GAA GAA AAA AAC GAA TAA 1131 Tvr Glu Pro Phe Trp Glu Asp Glu Glu Lys Asn Glu # 335 390 395 (2) INFORMAÇÃO PARA SEQ ID NO: 20: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 397 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 20:
Met Ser Lys Thr Cys 5 Tyr Glu Gly Asn Gly 10 Kis Arg Gly 2.5 Lys Ala Ser Thr Aso 20 Thr Met Gly Arg Pro 25 Cys Leu Pro Tm Asn 30 Ser Ala Thr Val Leu 35 Gin Gin Thr Tyr Kis 40 Ala Kis Arg Ser Aso 45 Ala Leu Gin Leu Glv 50 Leu Gly Lys His Asn 55 Tyr Cys Arg Asn Pro 50 Asp Asn Arg Arg Arg 65 Pro Trp Cys Tyr Val 70 Gin Val Gly Leu Lys 75 Pro Leu Val Gin Glu 80 Cys Met Val His Aso 85 Cys Ala Asp Gly Lvs 90 Lys Pro Ser Ser Pro 95 Pro Giu Glu Leu Lys Phe Gin Cys Gly Gin Lys Thr Leu Arg Pro Arg Phe 100 10S 110
Lys Ile Ile 115 Gly Gly Glu ?he Thr 120 Thr Ile Glu Asn C-ln 125 Prc Trp Phe Ala Ala 130 Ile Tyr Arg Arg His 13 5 Arg Gly Gly Ser Vai 140 —s — Tyr Vai Cys Glv 145 Gly Ser Leu Ile Ser 150 Pro Cys Trp Vai T ' a 15 5 Ser A-a Thr His Cvs ISO Phe Tis Asp T^/v· ?ro 1S5 Lys Lys Glu Asp Tyr 170 Ile Vai Tyr Leu Gly 175 Arg Ser Arg Leu Asn 130 Ser Asn Thr Gin Gly 135 Glu Mec Lys Phe Glu 190 Val Glu Asn Leu T T A 195 Leu His Lys Asp Tvr 2*00 Ser Ala Asp TU Leu 205 Ai a His His Asn Asn 210 τ 1 λ Ala Leu Leu Lys 215 Ile Arg Ser Lys Glu 220 Gly Arg Cys Ala Gin 225 Pro Ser Arg τ 3 23 0 Gin Thr Xis Cys Leu 235 Pro Ser Met Tyr Asn 240
Asp Pro Gin Phe Gly Thr Ser Cys Glu Ile Gly Phe Gly Lvs Glu 245 250 255 Asn Ser Thr Asn Tyr Leu T^/X Pro Glu Gin Leu Lys Met Thr Vai Val 2 60 2S5 270 Lys Leu Ξ1 s Ser His Arg Glu Cys Gin ?rc His Tv*'* Gly Ser 275 230 235 Glu Val wVf Lys Met Leu Cys Ala Ala Asp Pro Gin Tm Lys ml, ^ J. 290 295 300 Asn Ser Cys Gin Gly Asn Ser Gly Gly Pro Leu Vau Cys Ser Leu Gin 30*5 310 315 320 Gly Arg Mec Thr Leu ml, «· Gly Ile Val Ser Gly Arg Gly Cys Ala 325 330 335 Leu Lys Asp Lys Pro Gly Val Tyr Thr Arg Val Ser His Phe Leu Pro 340 345 350 Ile Arg Ser His Thr Lys Glu Glu Asn Gly Leu Ala Leu Ser Pro 355 3S0 3S5 Val Lvs Ala Phe Pro Arg Pro Phe Leu Leu Arg Asn Pro Asn Asp Lys 370 375 330 Tyr Glu Pro Phe Trp Glu Asp Glu Glu Lys Asn Glu * 3*85 390 395 (2) INFORMAÇÃO PARA SEQ ID NO: 21: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1098 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico 64 83 886 ΕΡ Ο 669 394/ΡΤ (iii) HIPOTÉTICO: não <iv) ANTI-SENTIDO: não (ix) CARACTERÍSTICA:
(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1..1098 (D) OUTRA INFORMAÇÃO: /function= "metionina N-terminal é separada proteoliticamente em E.coli" /product= "gene sintético para a proteína M4 (pSJ41)" (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 21: ATG AGC AAA ACT TGC TAC GAA GGT AAC GGT CAC i '1 N | If* TAC CGT GGT AAG 43 Mec Ser Lys Thr Cys Tyr 5 Glu Λ1 *. \j-Ly Asn Glv 1Ò His Phe Tyr Arg Glv 15 i-»VS GCT TCT ACC GAC ACC ATG GGT i. LVaVj TGC TGG AAC GCT 96 Ala Ser Thr Aso 20 Thr Met Gly Arg Pro 25 Cys Leu Pro Tro Asn 30 Ser A-a ACC GTT CTG CAG CAG ACC TAC CAC GCT CAC CGT GAT GCA TTG CAC- 144 Vai Leu 35 Gin Gin Thr Tyr His 40 Ala His Arg Ser Aso 4S Ala Leu Gln GGT CTG GGT AAA CAC AAC TAC TGC CGT AAC GAC AAC CGT CGT 192 Leu Gly Leu 50 Gly Lys His Asn 55 Tvr Cys Arg Asn ?ro ou Asp Asn Arg Arg CGT TGC TAC GTT CAG » 1 GGT CTG AAA w>ww j 11111« GTT CAG GAA 240 Arg 55 ?ro Tro Cys Tyr Vai 70 Gin Vai Gly Leu Lvs 75 Pro Leu Vai Gin Glu 30 r**r·** • UV- ATG GTT CAC GAC TGC GCT GAC GGT AAA AAA CCG TCT TCT CCG ^ 233 Cys Met Vai His Aso Cys 85 Ala As? Gly Lys 90 Lys Pro Ser Ser Pro 95 Pro GAA GAG CTG AAA TTC CAG TGC GGT CAA AAA ACC CTA CGT CCG CGT 3 3 5 Glu Glu Leu Lys 100 Phe Gin Cys Gly Gin 105 Lys Thr laâLL Arg Pro 110 Arg Phe AAA ATC ATC GGT GGT GAG ACC ACC ATC GAA AAC CAG CCG TGG 1 »M ! ir·* .•V» 334 Lvs Ile lie 115 Gly· Gly Glu Phe Thr 120 Thr Ile Glu Asn Gin 125 Pro Trp Phe GCT GCT ATC TAC CGT CGT CAC CGT GGT GGT TCT GTT ACC TAC Gii. TGC 432 Ala Ala lie 130 Tyr Arg Arg Kis 135 Arg Gly Gly Ser Vai 140 Thr Tyr Vai Cys GGT GGT TCT CTG ATC TCT CCG TGC TGG GTT ATC TÇT GCT ACC CAC TGC 430 Glv 145 Gly Ser Leu Ile Ser 150 Pro Cys Trp Vai Ile 155 Ser Ala Thr His Cys 160 TTC ATC GAC TAC CCG AAA AAA GAA GAC TAC ATC GTT TAC CTC CGT 523 Ile As? Tyr Pro Lys 165 Lys Glu Asp Tyr 170 Ile Vai Tyr Leu Gly Arg 175 TCT CGT TTA AAC TCT AAC ACC CAG GGT GAA ATG AAA TTC GAA GTT C-AA 576 Ser Arg Leu Asn Ser Asn Thr Gin Gly Glu Met Lys Phe Glu Vai Glu 180 185 190 65 83 886 ΕΡ Ο 669 394/ΡΤ AAC CTG ATC CTG CAC AAA GAC TAC TCT GCT GAC ACC CTG GCT CAC CAC 624 Asn Leu Ile Leu His Lys Asp Ser Aia Asp Thr Leu Ala His His 195 2*00 205 AAC GAC ATC GCT CTG CTA AAA ATC CGT TCT AAA GAA GGT CGT TGC GCT 572 Asn Asp T * a Ala Leu Leu Lys Ile Arg Ser Lys Glu Gly Arg Cys Ala 210 215 220 CAG CCG TCT CGT ACC ATC CAG ACC ATC TGC CTG WwsJ TCT ATG TAC AAC 720 Gin Pro Ser Arg Thr Ile Gin Thr Ile Cys Leu Pro Ser Mec Asn 225 230 235 240 GAC CCG CAG *TMT*£« GGT ACC TCT TGC GAA ATC ACC GGT TTC .ASO A AAA GAA 763 Asp Pro Gin ?he Gly Thr Ser Cys Glu Ile Thr Gly Phe Giy Lys Glu 245 250 255 AAC ACC GAC TAC CTG TAC CCG GAA CAG CTG AAA ATG ACC GTT QlWIW 315 Asn Ser TV-ít- Aso Tyr Leu Tyr Pro Glu Gin Leu Lys Mec Thr Vai Vai 26*0 265 270 AAA CTG ATC CAC CGT GAA TGC CAG CAG CCG CAC TAC TAC GGT — s- À 364 Lys Leu Ile Ser His Arg Glu Cys Gin Gin Pro His hV Giy Ser 275 230 235 GAA GTT ACC ACC AAA ATG CTG TGC GCT GCT GAC CCG CAG TGG AAA ACC 912 Glu Vai Thr Thr Lys Mec Leu Cys Ala Ala Asp Pro Gin Trp Lys Thr 290 295 300 GAC TGC CAA GGT GAC TCT GGT CCA CTA GTT mr·»/-» A wA TCT CTC CAG 960 Asm Ser Cys Gin Glv Aso Ser Giy Gly Pro Leu Vai Cys Ser Leu Gin 305 310 215 320 GGT L ATG ACC CTG ACC GGT GTT TCT GGT /-'/"'•rr* A GGT TGC 1008 Gly Arg Meu Thr Leu Thr Glv Ile Vai Ser Trp Gly Arg Gly Cys ^ τ — ΛΑΟ. 325 330 335 CTG AAA GAC AAA CCG GGT GTT TAC TCT CAC TTC CCS 1055 Leu Lys Asp Lvs Pro Giy Vai Tyr Th.^* Arg Vai Ser His Phe Leu ?rc 340 345 350 !·*/*·>** CGT CAC ACC AAA GAA GAA AAC GGT CTG GCT CTG 1093 a Arg Ser His Thr Lys Glu Glu Asn Gly Leu Ala Leu 355 360 365 (2) INFORMAÇÃO PARA SEQ ID NO: 22: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 366 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 22:
Mec Ser Lys Thr Cys Tyr Glu Gly Asn Glv Kis Phe Tvr Aro Giy Lvs 1 5 1Ô 15
Ala Ser Thr Asp Thr Mec Gly Arg Pro Cys Leu Pro Trp Asn. Ser Ala 20 25 * 30 83 886 ΕΡ Ο 669 394/ΡΤ
Asn Ser Thr Asp 260 Lvs Leu Ile Ser 275 Glu Vai Thr Thr 290 Aso Ser Cys Gin 305 Gly Arg Met Thr
Leu Lvs Aso Lys 340 Tro Ile Arg Ser 355 66 Gin Thr Tyr His 40 Ala His Arg Ser Tyr Cys Arg Asn Pro 60 Vai Gly Leu Lvs *75 Pro Asp Gly Lys Lys Pro Asp Ala Leu Glr. 45 Asp Asn Arg Arg Leu Vai Gin uíU 30 90
Glv Gin Lys Thr Leu 105
Ala Ala Aso Pro 300 Gly Pro Leu Val 315 Val Ser Tro Gly 330 Thr Arg Val Ser 345 Glu Asn Gly Leu
Thr Vai Leu Gin 35
Leu Gly Leu Gly 50
Arg Pro Trp Cys 6 5
Cys Mec Vai His
Glu Giu Leu Lys 100
Lys Ile Ile Gly 115
Ala Ala Ile Tyr 130
Gly Gly Ser Leu 145
Phe Ile Asp Tyr
Ser Arg Leu Asn 130
Asn Leu lie Leu 155
Asn Aso lie Ala 210
Gin Pro Ser Arg 225
Asp Pro Gin Phe
Lys His Asn 55
Tvr Val Gin 70
Aso Cys Ala 35
Phe Gin Cys 120
Arg Aro· His Arg 135 lie Ser Pro Cys 150
Pro Lvs Lys Glu 165
Ser Asn Thr Gin
His Lvs Aso Tvr 2ÕG
Leu Leu Lvs Ile 215
Thr lie Gin Thr 230
Gly Thr Ser Cys 245
Tyr Leu Tyr Pro
His Arg Glu Cys 280
Lys Met Leu Cys 295
Gly Aso Ser Gly 310
Leu Thr Gly Ile 325
Pro Gly Vai Tyr
His Thr Lvs Glu 360
Gly Gly Ser Vai 140
Tro Val Ile Ser 155
Aso Tvr Ile Val 170
Gly Giu Met Lys 135
Ser Ala Asp Thr
Arg Ser Lvs Glu 220
Ile Cys Leu Pro 235
Glu Ile Thr Gly 250
Glu Gin Leu Lvs 265
Gin Gin Pro His
Ser Ser Pro Pro 95
Aro Pro Arg Phe 110
Gin ?ro Trp Phe 125
Thr Tvr Val Cys \·> a "hr His Cvs 150
Tvr Leu Gly Arg 175
Phe Glu Val Glu 190
Leu Ala His His 205
Gly Arg Cys Ala
Ser Met Tyr Asn 240
Phe Gly Lys Glu 255
Met Thr Val Val 270
Tyr Tyr Gly Ser 285
Gin Trp Lys Thr
Cys Ser Leu Gin 320
Arg Gly Cvs Ala 335
His Phe Leu Pro 350
Ala Leu 365 67 83 886 ΕΡ Ο 669 394/ΡΤ (2) INFORMAÇÃO PARA SEQ ID NO: 23: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1185 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (ix) CARACTERÍSTICA:
(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1..1185 (D) OUTRA INFORMAÇÃO: /function= "metionina N-terminal é separada proteoliticamente em E.coli" /product= "gene sintético para a proteína M11 (pSJ69)" (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 23: ATG AGC AAA ACT TGC TAC GAA GGT AAC GGT CAC TTC TAC CGT GGT AAG 43 Met Ser Lys Thr Cys Tyr Glu Gly Asn Gly His Phe Tyr Arg Gly Lys 1 5 10 15 GCT ACC GAC ACC ATG GGT CGT CCG TGC CTG CCG TGG AAC TCT GCT Ala Ser Aso Thr Met Gly Arg Pro Cys Leu Pro Tro Asn Ser A-a 20 25 30 ACC Vji - CTG CAG CAG ílWW TAC CAC GCT CAC GAT GCA rf*lj*r* CAG • Λ * Vai Leu Gin Gin Thr Tvr His Ala His Arg Ser Aso Ala Leu Gin 35 40 45 CTG GGT CTG GGT AAA CAC AAC AAC CCG GAC AAC CGT CGT 132 Leu Gly Leu Gly Lys His Asn Tyr Cys Arg Asn Pro Asp Asn Arg A-3 50 55 60 CGT CCG TGG TGC TAC GTT CAG GTT GGT CTG AAA CCG CTA GTT CAG GAA 240 Arg ?ro Tro Cys Tyr Vai Gin Vai Gly Leu Lvs Pro Leu Vai Gin Glu 65 70 75 30 TGC ATG GTT CAC GAC TGC GCT GAC GGT AAA AAA CCG TCT TCT CCG CCG 233 Cys Met Vai His Asp Cys Ala Aso Gly Lys Lys Pro Ser Ser Pro Pro 85 90 95 GAA GAG CTC AAA TTC CAG TGC GGT CAA AAA ACC CTA CGT CCG CGT TTT 336 Glu Glu Leu Lvs Phe Gin Cys Gly Gin Lys Thr Leu Arg Pro Arg Phe 1Ô0 105 110 AAA ATC ATC GGT GGT GAG TTC ACC ACC ATC GAA AAC CAG CCG TGG 3S4 Lys Ile Ile Gly Gly Glu Phe Thr Thr Ile Glu Asn Gin Pro Trp Phe 115 120 125 GCT GCT ATC TAC CGT CGT CAC CGT GGT GGT TCT GTT ACC TAC GTT TGC 432 Ala Ala Ile Tyr Arg Arg His Arg Gly Gly Ser Vai Thr Tyr Vai Cys 130 135 140 68 83 886 ΕΡ Ο 669 394/ΡΤ GGT GGT TCT CTG ATC TCT TGG GTT ATC TCT GCT ACC CAC TGC Gly Giv Ser Leu lie Ser Prc Cys Trp Vai lie Ser Ala Thr KiS Cys 145 150 i 150 uu A.C GAC TAC CCG AAA AAA GAA GAC TAC ATC GTT TAC CTC WO L Ile Asp Tvt Pro Lys Lys Glu Aso Tvr lie Vai Tyr Leu Giy 2^-fr, 155 170 175 TCT CGT - -Λ AAC TCT AAC ACC CAG GGT GAA ATG AAA L A GAA GTT GAA Ser Arg Leu Asn Ser Asn Thr Gin Giy Giu Mec Lvs Phe Glu V a_ . r ♦ 130 133 190 AAC CTG ATC CTG CAC AAA GAC TAC TCT GCT GAC ACC CTG /m ***** UV» — CAC CAC Asn Leu lie Leu Kr s Lys Asn Tvr Ser Ala Asp Thr Leu Ala Kis 195 2Ô0 205 AAC GAC ATC GCT C-VJ CTA AAA ATC CGT TCT AAA GAA GGT /<(•1 ^ s_sj - v^CT Asn Asn lie Ala Leu Leu Lvs lie Arg Ser uys Glu Gly Arg Cys 210 215 220 CAG CCG TCT CGT ACC ATC CAG ACC ATC TGC CTG CCG TCT ATG TAC •AAC Gin Pro Ser Arg Thr Xis Gin Thr lie Cvs Leu Pro Ser Met Asn 225 230 235 240 . GAC CCG CAG GGT ACC TCT TGC GAA ATC ACC GGT AAA GAA Asp Pro Gin Phe Gly Thr Ser Cys Giu lie Thr Gly Phe Gly Lys Glu 245 250 255 AAC TCT ACC GAC TAC CTG TAC CCG GAA CAG CTG AAA ATG ACC GTT GTT Asn Ser Thr Asp Tyr Leu Tyr Pro Glu Gin Leu Lys Mec Vai Vai 250 255 270 AAA CTG ATC CAC CGT 1^ΛΛ CAG CAG CCG CAC TAC TAC GGT Lvs Leu Τ’ A Ser Kis Arg Glu Cvs Gin Gin Pro Kis Tvr Tyr Giy Ser 275 230 235 GAA G7T ACC ACC AAA ATG / im<* r* U · ^ · sj>w GCT GCT GAC CCG CAG 'TV··'** AAA ACC Giu Vai Thr Lys Met Leu Cys Ala Ala Asn Pro Gin Tto Lys Thr 290 295 300 GAC TCT TGC CAA GGT GAC TCT GGT GGT CCA CTA GTT TGC CTC CAG Asn Ser Cys Gin Gly Asn Ser Gly Giv Pro Leu Vai Cys Ser Leu 305 310 315 320 GGT CGT ATG ACC CTG ACC GGT ATT GTT TCT TGG GGT CGT GGT TGC GCT Gly Arg Met Thr Leu Thr Gly Ile Vai Ser Trp Gly Arg Gly Cys AXâ 325 330 335 CTG AAA GAC AAA . CCG GGT GTT TAC ACC CGT GTT TCT CAC TTC CTG CCG Leu Lys Asp Lys Pro Gly Vai Tyr Thr Arg Vai Ser His Phe Leu d·*—, • * w 340 343 350
TGG ATC CGT TCT CAC ACC ΑΑΑ GAA GAA AAC GGT CTG GCT CTG AGC CCG
Tm lie Arg Ser His Thr Lys Glu Glu Asn Gly Leu Ala Leu Ser Pro 355 3S0 355
CCG TCT CCG CCG GGT GGT TTC CCG CGT CCG GGT GGT GGT GGT AAC GGT
Pro Ser Pro Pro Gly Gly Phe Pro Arg Pro Gly Gly Gly Gly Asn Giv 370 375 330
GAC TTC GAA GAA ATC CCG GAA GAA TAC CTG TAA
Asn Phe Glu Glu Ile Pro Glu Glu Tyr Leu * 335 390 395 69 83 886 ΕΡ Ο 669 394/ΡΤ (2) INFORMAÇÃO PARA SEQ ID NO: 24: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 395 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 24:
Met 1 Ser Lys Thr Cvs * 5 Tyr Glu Gly Asn Gly K-3 lô oj-g —*<r— xzc GIv Lvs ~ " 15 Ala Ser Thr Aso 20 Thr Met Gly Arg Pro 25 Cys Leu o-o Tro ASh Ser Ala ' 30 Thr Vai Leu 35 Gin Gin Thr Kis 40 Ala His Arg Ser Asp Ala leu Gin 1 ^ Leu Gly 50 Leu Gly Lys His Asn 55 Tyr Cys Arg Asn P—o Aso Asr. Arg Arg 60 Arg 65 Pro Trp Cys Tyr Vai 70 Gin Vai GIv Leu Lvs 75 o—Q r.gi^ Vsi Gj.n Glu 30 Cys Met Vai His Asp 35 Cys Ala Asp Gly Lvs Lys 90 3rc Ser Ser Pro Pro 95 Glu Glu Leu Lys 1Ô0 Phe Gin Cys vj-í. y Gin 105 Lys Thr Leu Aro ?r= Arg Phe 110 Lys TI* T * λ 115 Gly Gly Glu Phe —t-»— 120 Thr Glu Asn Gin ?ro Trp Phe 125 Ala Ala 130 He Tvtt Arg Arg His 135 Arg Gly Gly Ser Var ^hr TV- Tal Cys 140 Gly 145 Gly Ser Leu Ile Ser 150 Pro Cys Vai He 15 5 Ser Ala Thr His Cys 150 Píie lie Asp Tyr Pro 165 Lys Lys Glu ASO T*,Λ"" * 1 3 170 Va1 '"v** Leu Gly Arg 175 Ser Arg Leu Asn 180 Ser Asn Thr C-In Gly Glu Met 135 Lvs Phe Glu var Glu 190 Asn Leu He 195 Leu His Lys Asp Tyr 200 Ser Ala Asp Thr Leu Ala His Kis 205 Asn Aso 210 He Ala Leu Leu Lys 215 Ile Arg Ser Lys Glu Gly Arg Cys Ala 220 Gin 225 Pro Ser ' Arg Thr lie 230 Gin , Thr He Cys Leu 235 Pro Ser Met Tyr Asn 240
Ase Gin Phe Gly Thr Ser Cvs Glu lie Thr Gly Phe Gly Lys Gíu * “ 245 * 250 255
Asn Ser Thr Ase Tyr Leu Tyr Pro Glu Gin Leu Lys Mec Thr Vai Vai 250 265 270
Lys Leu Ile Ser His Arg Glu Cys Gin Gin Pro Kis Tyr Tyr Gly Ser 275 230 285 70 83 886 ΕΡ Ο 669 394/ΡΤ
Glu Vai 290 Thr Thr Lys MeC Leu 295 Cys Ala Ala Asp Pro 300 Gin Tro Lys Thr Aso 3 05 Ser Cys Gin Gly Aso 310 Ser Gly Gly Pro Leu 315 Vai Cys Ser Leu Gin 320 Gly Arg Met r^r Leu 325 Thr Gly ZLe Vai Ser Tro 330 Gly Arg Gly Cvs 335 Ala Leu Lys Asp Lys 340 Pro Gly Vai Tyr Th>* 345 Arg 7a r Ser His Phe 350 Leu Pro Trp Ile Arg 355 Ser His Thr Lys Glu 360 Glu Asn Gly Leu Ala 365 Leu Ser Pro Pro Ser 370 Pro Pro Gly Gly Phe 375 Pro Arg Pro Gly Gly 330 Gly Gly Asn Gly ASO ?he Glu Glu lie Pro Glu Glu Tyr Leu * 38S 3 90 395 (2) INFORMAÇÃO PARA SEQ ID NO: 25: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1176 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (ix) CARACTERÍSTlCA:
(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1..1176 (D) OUTRA INFORMAÇÃO: /function= "metionina N-terminal é separada proteoliticamente em E.coli" /product= "gene sintético para a proteína M12 (pSJ76)" (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 25: ATG AGC AAA ACT TGC TAC GAA GGT AAC GGT CAC TTC TAC CGT GGT AAG Mec 1 Ser Lys Thr Cys 5 Tyr Glu Gly Asn Gly 10 His Phe Tyr Arg Gly Lys 15 GCT TCT ACC GAC ACC ATG GGT CGT CCG TGC CTG TGG AAC TCT MM Ala Ser Thr Asp 20 Thr Mec Gly Arg Pro 25 Cys Leu Pro Trp Asn 30 Ser Ala ACC GTT CTG CAG CAG ACC TAC CAC GCT CAC CGT TCT GAT GCA TTG CAG Thr Vai Leu 35 Gin Gin Thr Tyr His 40 Ala Kis Arg Ser ASO 45 Ala Leu Gin CTG GGT CTG GGT AAA CAC AAC TAC TGC CGT AAC CCG GAC AAC CGT CGT Leu Gly 50 Leu Gly Lys Kis Asn 55 Tyr Cys Arg Asn Pro 60 Asp Asn Arg Arg 71 83 886 ΕΡ Ο 669 394/ΡΤ CGT CCG TGG TGC TAC GTT CAG GTT Arç 65 Prc Trp Cys Tvr Vai 70 Gin Vai TGC ATG GTT CAC GAC TGC GCT GAC Cys Mec Vai His Asn 85 Cys Ala Asp GAA GAG CTC AAA 1 iL CAG TGC GGT Glu Glu Leu Lvs 1*00 Phe Gin Cys Gly AAA ATC ATC GGT GGT GAG TTC ACC Lys He lie 115 Gly Gly Glu Phe Tiir 120 GCT GCT ATC TAC CGT UsJ -L CAC CGT Ala Ala lie '130 Tyr Arg Arg His 135 Arç GGT TCT CTG ATC CCG TGC Glv 14*5 Gly Ser Leu Ile Ser 150 Pro Cys ATC GAC TAC UwO· AAA AAA GAA Phe lie Asp Tyr Pro 165 Lys Lys Glu TCT CGT TTA AAC AAC ACC CAG Ser Arç Leu Asn Ser Asn Thr Gin 180 AAC CTG ATC CTG CAC AAA GAC TAC Asn Leu Ile Leu His Lvs Asp Tvr 195 200 AAC GAC ATC GCT CTG CTA AAA ATC Asn Aso lie Ala Leu Leu Lys Ils 210 215 CAG CCG TCT CGT ACC ATC CAG ACC Gin Pro Ser Arç Thr Ile Gin 225 230 GAC CCG CAG TTC GGT ACC TCT TGC Asp Pro Gin Phe Gly Thr 245 Ser Cys AAC TCT ACC GAC TAC CTG TAC CCG Asn Ser Thr ASO Tyr Leu Tyr Pro 260 AAA CTG ATC TCT CAC CGT GAA TGC Lys Leu lie Ser His Arg Glu Cys 275 280 GAA GTT ACC ACC AAA ATG CTG TGC Glu Vai Thr Thr Lys Mec Leu Cys 290 295 GAC TCT TGC CAA GGT GAC TCT GGT Asp Ser Cys Gin Glv Aso Ser Gly 305 310 GGT CTG AAA CCG CTA GTT CAG GAA Gly Leu Lvs Pro Leu Val Gin Glu 75 aG GGT AAA AAA CCG TCT TCT CCG CCG Gly Lvs Lys Pro Ser Ser Pro Pro *90 95 CAA AAA ACC CTA W'J 4. CCG CGT i. * - Gin Lys Thr Leu Arg Pro Ar=r Phe 105 110 ACC ATC GAA AAC CAG CCG TGG Thr ZLs Glu Asn Gin ?ro Tro Phe 125 GGT kjVJX J.L-. GTT ACC TAC GTT TGC Gly Gly Ser Vai Thr Tyr Val Cys 140 TGG GTT ATC bu: ACC CAC TGC Tro Vai lie Ser Ala Thr His Cys 155 160 GAC TAC ATC Cii i TAC CTC GGC CGT Asp Tvr Ile Val Tvr Leu Gly >* 1*70 175 GGT GAA ATG AAA GAA GTT bAft Glv Glu Mec Lys phe Glu Val Glu 135 150 Tf"**7* ,^>·ιΐί> __ GAC ACC CTG GCT CAC CAC Ser Ala Asp Thr Leu Ala His Π—3 205 CGT *ψι,-ι 1— i AAA GAA GGT CGT TGC GCT Arç Ser Lys Glu Gly Arç Cys Ala 220 ATC TGC CTG CCG TCT ATG TAC AAC Ile Cys Leu Pro Ser Met Tyr Asn 235 240 GAA ATC ACC GGT GGT AAA GAA Glu Ile Thr Gly Phe Gly Lys Glu 250 255 GAA CAG CTG AAA ATG ACC GTT GTT Glu Gin Leu Lys Mec Thr Val Val 265 270 : CAG CAG CCG CAC TAC TAC GGT TCT Gin C-ln Pro His Tyr Tyr Gly Ser 235 : GCT GCT GAC r*r*r* CAG TGG AAA ACC ; Ala Ala Asp Pro Gin Trp- Lys Thr 300 GGT CCA CTA GTT TGC TCT CTC CAG Glv Pro Leu Vai Cys Ser Leu Gin 315 * 320 1009 72 83 886 ΕΡ Ο 669 394/ΡΤ GGT CGT ATG ACC CTG. ACC GGT ATT GTT TCT TGG GGT CGT GGT TGC GCT Gly Arg Met Thr Leu Thr Gly Vai Ser Trp Gly Arg Gly Cys Ala 325 330 335 CTG AAA GAC AAA CCG GGT GTT TAC ACC CGT GTT TCT CAC i c CTG Leu Lys Aso Lvs Pro Glv Vai Tvr Thr Arg Vai Ser His Phe Leu Pro 340 345 350 TGG ATC CGT TCT CAC ACC AAA GAA GAA AAC GGT GCT CTG AGC Trp Ile Arg Ser Kis Thr Lvs Glu Glu Asn Gly Leu Ala Leu Ser Pro 355 350 355 GTT AAG GCT TTC CCG AGG CCT GGT GGT GGT GGT AAC GGT GAC TTC GAA Vai Lys Ala Phe Pro Arg Pro Gly Gly Gly Gly Asn Gly Asp Phe Glu 370 375 330 GAA ATC CCG GAA GAA TAC CTG TGA Glu Ile 'Pro Glu Glu Tyr Leu ★ 335 390 (2) INFORMAÇÃO PARA SEQ ID NO: 26: 1035 .04 : o (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 392 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 26:
Mec Ser Lys Thr Cys 5 Glu Gly Asn Glv 10 Hrs Phe Arg Gly 15 Lys Ala Ser Aso 20 Thr Mec Gly Arc Pro Cys 25 Leu Pro Asn 30 Ser Ala Thr Vai Leu 3 5 Gin Gin Tyr His Ala His 40 Arg Ser Asp 45 Ala Leu Gin Leu Gly 50 Leu Gly Lys His Asn Tyr Cvs Arc 55 Asn Pro 50 Asp Asn Arg Arc Aro 55 Pro Trp Cys Tyr Vai 70 Gin Vai Gly Leu Lys -r — t 2 Pro Leu Val Gin Glu ao Cys Mec Vai Kis ASO as Cys Ala Asp Gly Lvs 90 Lys Pro Ser Ser Pro 95 Pro Glu Glu Leu Lys 100 Phe Gin Cys Glv Gin Lys 105 Thr Leu Arg Pro 110 Arg Phe Lys Ile Ile 115 Gly Gly Glu Phe Thr Thr Ile 120 Glu Asn Gin 125 Pro Trp Phe Ala Ala Ile Tyr Arg Arg His Arg Gly Gly Ser Val Thr Tyr Val Cys 130 135 140
Gly Gly Ser Leu lie Ser Pro Cys Trp Vai Ile Ser Ala Thr His Cys 145 150 135 150
Phe Ile Aso Tyr Pro Lys Lys Glu Asq Tyr Ile Vai Tyr Leu Gly Arg 155 170 175 73 83 886 ΕΡ Ο 669 394/ΡΤ
Ser Arg Leu Asn 130 Ser Asn Thr Gin Gly 185 Glu Met Lys Píie Glu 190 Vai C-iu Asn Leu Ile 195 Leu His Lys Asp Tyr 200 Ser Ala Asp Thr Leu 205 Ala His His Asn Aso 210 Ile Ala Leu Leu Lvs 215 Zi-S Arg Ser Lys Glu 220 Gly Cys Ala Gin 225 Prc Ser Arg Thr Ile 230 Gin Thr Ile Cys Leu 235 Prc Ser Met Asn 240 Asp ?ro Gin ?he Gly 245 Thr Ser Cys Glu lie 250 Thr Gly Phe Gly Lvs 255 Glu Asn Ser Thr Aso 260 Tyr Leu Tv*2T Pro Glu 265 Gin Leu Lys Met 270 Vai Vai Lys Leu Ile 275 Ser His Arg Glu Cvs 290 Gin Gin Pro His 23 5 Tyr Gly Ser Glu Vai 290 Thr Thr Lys Met Leu 295 Cys Ai 3, Ala Asp Pro 300 Gin Tro Lys Thr Asn 30 5 Ser Cys Gin Gly Asp 310 Ser Gly Gly Pro Leu 315 Vai Cys Ser Leu Gin 320 Gly Arg Met Thr Leu 325 Thr Gly Ile Vai Ser 330 Trp Gly Arg Gly Cvs 335 Ala Leu Lys Asp Lys 340 Prc Gly Vai Tyr *7 Vi"* 345 Arg Vai Ser H.1.3 350 Leu ί’ΓΟ Trp ZXâ Arg 355 Ser HiS Lys Glu 360 Glu Asn Gly Leu Ala 365 Leu Ser Pro Vai Lvs 370 Ala Phe Pro Arg Pro 375 C-ly NJÍ / Gly VJ-/ Asn 380 Gly Asp Phe C-iu Glu 335 T T A Oi*o Glu Gi.il Tyr 390 Leu * (2) INFORMAÇÃO PARA SEQ ID NO: 27: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1194 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (iii) HIPOTÉTICO: não (iv) ANTl-SENTIDO: não (ix) CARACTERÍSTICA:
(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1..1194 (D) OUTRA INFORMAÇÃO: /function= "metionina N-terminal é separada proteoliticamente em E.coli" /product= "gene sintético para a proteína M13 (pSJ77)" 43 74 83 886 ΕΡ Ο 669 394/ΡΤ (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 27: ATG AGC AAA ACT TGC TAC GAA GGT AAC GGT CAC TAC CGT GGT AAG Mec 1 Ser Lys Thr Cys 5 Tyr Glu Gly Asn Gly 10 His Phe Tyr Arg Glv 15 Lvs TCT ACC GAC ACC ATG r*r·*"* TGC CTG CCG TGG AAC TCT GCT Ala Ser Thr Aso 20 Thr Mec Gly Arg Pro 25 Cys Leu Pro Tm Asn 30 Ser Ala ACC GTT CTG CAG CAG ACC TAC CAC GCT CAC CGT τ IV.. GAT GCA TTG CAG Vai Leu 35 Gin Gin Thr Tyr His 40 Ala His Arg Ser Asn Ala 45 Leu Gin CTG GGT CTG GGT AAA CAC AAC TAC TGC CGT AAC CCG GAC AAC CGT CGT Leu Gly Leu 50 Gly Lys His Asn Tyr 55 Cys Arg Asn Pro 60 Asn Asn Arg Arg CGT CCG TGG TGC TAC GTT CAG GTT GGT CTG AAA CTA GTT CAG GAA Arg 65 ?ro Trp Cys Tyr Vai 70 Gin Vai Gly Leu Lys 75 ?2TO Leu Vai Gin Glu 30 TGC ATG GTT CA C GAC TGC GCT GAC GGT AAA AAA CCG TCT TCT Cys Met Vai His Asn 35 Cys Ala Asp Gly Lvs 90 Lys Pro Ser Ser Pro 95 Pro GAA GAG CTC AAA TTC CAG TGC GGT CAA AAA ACC CTA CGT CCG CGT IWWIII Glu Glu Leu Lys 100 Phe Gin Cys Gly Gin 105 Lys Thr Leu Arg r*ro 110 A*. 3 pWa AAA ATC ATC GGT GGT GAG TTC ACC ACC ATC GAA AAC CAG CCG TGG lys T'A 115 Gly Gly Glu Phe Thr 120 Thr XXô .. VíiU. Asn Gin Pro 125 GCT GCT ATC TAC CGT CGT CAC CGT GGT GGT rpçrp ACC TAC GTT TGC Ala Ala Ile 130 Tvr Arg Arg His Arg 135 Gly Gly Ser Vai 140 Thr Tyr Vai Cys GGT GGT TCT CTG ATC TGG GTT ATC GCT ACC CAC TGC Gly 143 Gly Ser Leu Ile Ser 150 Pro Cys Trp Vai T* A 155 Ser Ala Thr His Cvs 1*50 T^C ATC GAC TAC CCG AAA AAA GAA GAC TAC ATC GTT TAC CTC GGC CGT Phe Ile Asp Tyr Pro 165 Lys Lys Glu Asp Tyr 170 Ile Vai Tyr Leu Gly 175 Arg TCT CGT TTA AAC TCT AAC ACC CAG GGT GAA ATG AAA TTC GAA GTT GAA Ser Arg Leu Asn ISO Ser Asn Thr Gin Gly Glu 185 Mec Lys Phe Glu 190 Vai Glu AAC CTG ATC CTG CAC AAA GAC TAC TCT GCT GAC ACC CTG GCT CAC CAC Asn Leu Ile 195 Leu His Lys Asn Tyr 200 Ser Ala Asp Thr Leu Ala 205 His His AAC GAC ATC GCT CTG CTA AAA ATC CGT TCT AAA GAA GGT CGT TGC GCT Asn Asp Ile 210 Ala Leu Leu Lys Ile 215 Arg Ser Lys Glu Gly Arg 220 Cys Ala CAG CCG TCT CGT ACC ATC CAG ACC ATC TGC CTG CCG TCT ATG TAC AAC Gin 225 Pro Ser Arg Thr Ile 230 Gin Thr Ile Cys Leu 235 Pro Ser Met Tyr Asn 240 96 144 192 240 288 336 334 432 480 Ξ28 576 624 672 720 75 83 886 ΕΡ Ο 669 394/ΡΤ GAC CCG CAG GGT ACC TCT TGC GAA ATC ACC GGT *7**T*f* i * w GGT AAA GAA Asp ?ro Gin Phe Gly Thr Ser Cys Glu Ile Thr Gly Phe Gly Lvs Glu. 245 250 25 5 AAC • v· * ACC GAC TAC CTG TAC CCG GAA CAG CTG AAA ATG ACC GTT Vj* L Asn Ser Thr Aso Tvr Leu Tyr Pro Glu Gin Leu Lys Met Thr Val Val 250 255 δ / 0 AAA CTG ATC TQm CAC CGT GAA TGC CAG CAG CCG CAC TAC TAC GGT * w - Lys Lau Ila Ser His Arg Glu Cys Gin Gin Pro His *TV_,***» TS/*** Gly Ser 275 280 285 GAA GTT ACC ACC AAA ATG CTG TGC GCT GCT GAC CAG •T***** AAA ACC Glu Vai Thr Thr Lys Mec Leu Cys Ala Ala Asp Prc Gin Lys 'fU*· 290 295 300 GAC CAA GGT GAC TCT GGT GGT CCA CTA Gi - LLJV». » CAG Aso 305 Ser Cys Gin Gly Aso 310 Ser Gly Gly Pro Leu 315 Val Cys Ser Leu Gin 320 GGT W*J « ATG ACC CTG ACC GGT ATT ^*1 MIM TGG GGT CGT GGT TGC VJ\- - Gly Arg Met Thr Leu 325 Thr Gly Ile Vai Ser 330 Trp Gly Arg Gly Cvs 335 A^3, CTG AAA GAC AAA GGT GTT TAC ACC CGT CAC i -\— CTG Lau Lys Asp Lys Prc Gly Vai Tvr Thr Arg Vai Ser His Phe Leu Pro 340 345 350 JVJ ATC CGT TCT CAC ACC AAA GAA GAA AAC GGT CTG GCT CTG AGC rv*.J Trp ™ X S Arg Ser Kis Τ'ν·' r· Lys Glu Glu Asr* Gly Leu Ala Leu Ser Pro 355 350 365 CCG AGC CCG CCG AGC CCG CCG GGT GGT 1^1 II <» I CCG AGG CCT GGT GGT Cr-r i Pro Ser Pro Pro Ser Pro Pro Gly Gly Phe Pro Arg Pro Gly Gly Gly 370 375 330 GGT AAC /wiwm GAC IP#T*Q GAA GAA ATC GAA GAG TAC CTG TGA Giv Asr. Gly Asp Phe Glu Glu Ile Pro Glu Glu Tvr ' Leu * 235 390 395 (2) INFORMAÇÃO PARA SEQ ID NO: 28: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 398 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 28:
Met 1 Ser Lys Thr Cys 5 Tyr Glu Gly Asn Gly 10 His Phe Tyr Arg Gly Lys 15 Ala Ser Thr Aso 20 Thr Met Gly Arg Pro 25 Cys Leu Prc Tro Asn 30 Ser Ala Thr Val Leu 35 Gin Gin Thr Tyr His 40 Ala His Arg Ser Asp 45 Ala Leu Gin Leu Gly 50 Leu Gly Lys His Asn 55 Tyr Cys Arg Asn Pro 50 Asp Asn Arg Arg 76 76 Gly Leu Lys Pro Leu Vai Gin Glu 75 80 Gly Lys Lys Pro 'Ser Ser Pro Pro 90 95 Gin Lys Thr Leu Arg Pro Arg Phe 105 * 110 Thr Ile Glu Asn Gin Pro Tro Phe 125 Gly Gly Ser Vai Thr Tyr Vai Cys 140 Trp Vai Ile Ser Ala Thr His Cys 155 160 Aso Tyr Ile Vai Tyr Leu Glv Arg 170 ‘ 175 Gly Glu Met Lys Phe Glu Vai Glu 185 190 Ser Ala Aso Thr Leu Ala His His 205 Arg Ser Lvs Glu Gly Arg Cys Ala 220 Ile Cvs Leu Pro Ser Met Tvr Asn 235 ‘ 240 Glu Ile Thr Gly Phe Gly Lys Glu 250 255 Glu Gin Leu Lys Met Thr Vai Vai 265 270 Gin Gin Pro His Tyr Tvr Gly Ser 285 Ala Ala Aso Pro Gin Tro Lys Thr 300 Gly Pro Leu Vai Cys Ser Leu Gin 315 320 Vai Ser Trp Gly Arg Gly Cys Ala 330 335 Thr Arg Vai Ser His Phe Leu Pro 345 350 Glu Asn Gly Leu Ala Leu Ser Pro 365 Gly Phe Pro Arg Pro Gly Gly Gly 380 Pro Glu Glu Tyr Leu 395 83 886 ΕΡ Ο 669 394/ΡΤ
Arg Pro Trp Cys Tyr Vai Gin Vai 65 · 70
Cys Met Vai His Aso Cys Ala Asp 85
Glu Glu Leu Lys Phe Gin Cys Gly 100
Lys Ile 11« Gly Gly Glu Phe Thr 11S 120
Ala Ala Ile Tyr Arg Arg His Arg • 130 135
Gly Gly Ser Leu Ile Ser Pro Cvs 145 150
Phe' Ile Aso Tyr Pro Lys Lys Glu 165
Ser Arg Leu Asn Ser Asn Thr Gin 180
Ash Leu Ile Leu His Lvs Asp Tvr 195 * 200
Asn Asp Ile Ala Leu Leu Lys- Ile 210 215
Gin Pro Ser Arg Thr Ile Gin Thr 225 230
Aso Pro Gin Phe Gly Thr Ser Cys 245
Asn Ser Thr Aso Tyr Leu Tyr Pro 260
Lys Leu Ile Ser His Arg Glu Cys 275 280
Glu Vai Thr Thr Lys Met Leu Cys 290 295
Aso Ser Cys Gin Gly Asp Ser Gly 305 310
Gly Arg Met Thr Leu Thr Gly Ile 325
Leu Lys Asp Lys Pro Gly Vai Tyr 340
Tro Ile Arg Ser His Thr Lys Glu 355 360
Pro Ser Pro Pro Ser Pro Pro Gly 370 375
Gly Asn Gly Asp Phe Glu Glu Ile 385 390 * 77 83 886 ΕΡ Ο 669 394/ΡΤ (2) INFORMAÇÃO PARA SEQ ID NO: 29: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1176 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (ix) CARACTERÍSTICA:
(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1..1176 (D) OUTRA INFORMAÇÃO: /function= "metionina N-terminal é separada proteoliticamente em E.coli" /product= "gene sintético para a proteína M14 (pSJ78)" (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 29: ATG AGC AAA ACT TGC TAC GAA GGT AAC GGT CAC TAC CGT GGT AAG 43 Mec Ser Lys Thr Cys Tyr Glu Gly Asn Gly His Phe Arg Gly Lys 5 10 15 /1f W Cav-- - “w - ACC GAC ACC Λ rmr* Λ- ir* ONJ A CTG CCG «""»*«· í··* -VjNJ AAC TC'7' '0'-- 95 «l Ser Thr Aso Thr Mer Gly Ãrg Pro Cys Leu Pro Trp Asn Ser 20 25 30 ACC GTT CTG CAG CAG ACC TAC GCT CAC CGT TCT GAT TTG CAG 1 <1 — Vai Leu Gin. Gin Thr Tyr His Ai. 3. Λ—5 Arg Ser Asp Ala Leu Gin 35 40 45 ****** GGT CTG GGT AAA CAC AAC TAC TGC CGT AAC CCG GAC AAC CGT CGT 192 Leu Glv Leu Gly Lys His Asn Cys Arg Asn Pro Asp Asn Arg Arg SÓ 55 50 CGT CCG TGG TGC TAC GTT CAG GGT CTG AAA CCG CTA J 1« 1 1 CAG GAA 240 Arg ?ro Trp Cys Tyr Vai Gin Vai Gly Leu Lys Pro Leu Vai Gin Glu 55 70 75 80 TGC ATG GTT CAC GAC TGC GCT GAC GGT AAA AAA CCG TCT TCT CCG CCG 288 Cys Met Vai His ASO Cys Ala Asp Gly Lys Lys Pro Ser Ser Pro Pro 85 90 9S GAA GAG CTC AAA TTC CAG TGC GGT CAA AAA ACC CTA CGT CCG CGT 335 Glu Glu Leu Lys Phe Gin Cys Gly Gin Lys Thr Leu Arg Pro Arg Phe 100 105 110 AAA ATC ATC GGT GGT GAG TTC ACC ACC ATC GAA AAC CAG CCG TGG TTC 384 Lys lie lie Gly Gly Glu Phe Thr Thr He Glu Asn Gin Pro Trp pV> A 115 120 125 GCT GCT ATC TAC CGT CGT CAC CGT GGT GGT GTT ACC TAC GTT TGC 432 A. a Ala Ile Tyr Arg His Arg Gly Gly Ser Vai Thr Tyr Vai Cys 130 135 140 78 83 886 ΕΡ Ο 669 394/ΡΤ GGT GGT TCT CTG ATC TCT CCG TGC TGG GTT ATC TCT GCT ACC CAC TGC 430 Gly Gly 145 Ser Leu Ile Ser Pro 150 Cys Trp Vai Ile 155 Ser Ala His Cys 150 TTC ATC GAC TAC CCG AAA AAA GAA GAC TAC ATC GTT TAC CTC GGC CGT 523 Phe Ile Asp Tyr Pro 1S5 Lys Lys Glu Asp Tyr 1*70 Tl a Vai Tyr Leu Gly 175 Arg TCT CGT TTA AAC TCT AAC ACC CAG CjSJ i. GAA ATG AAA GAA GTT GAA 575 Ser Arg Leu Asn 130 Ser Asn Thr Gin Glv 135 Glu Met Lys Phe Glu 190 Vai /-· 1 ,, AAC CTG ATC CTG CAC AAA GAC TAC TCT GCT GAC ACC CTG CAC CAC 524 Asn Leu Ile 195 Leu His Lys Asp ivr 20 0 Ser Ala Asp Thr Leu 205 Ala His His AAC GAC ATC GCT CTG CTA AAA ATC CGT TCT AAA GAA GGT TGC GCT 572 Asn Asp 210 Ile Ala Leu Leu Lys 215 Xis Arg Ser Lys Glu 220 Glv Arg Cys A ±.3. CAG CCG TCT CGT ACC ATC CAG ACC ATC TGC CTG CCG ATG TAC AAC 720 Gin 225 Pro Ser Arg Thr Ile Gin 230 Thr Ile Cys Leu 235 Ser Mec Tyr Asn 240 GAC CCG CAG GGT ACC TCT TGC GAA ATC ACC GGT AAA GAA 753 Asp Pro Gin Phe Gly 245 Thr Ser Cys Glu Ile 250 Thr Gly Phe Gly Lvs 255 Glu AAC TCT ACC GAC TAC CTG TAC /* ***««* LwsJ GAA CAG CTG AAA ATG ACC Qrn fr* QIWW 315 Asn Ser Thr Aso 26*0 Tyr Leu Tyr Pro Glu 2S5 Gin Leu Lys Met Thr 270 Vai Vai AAA CTG ATC TCT CAC CGT GAA TGC CAG CAG CCG CAC TAC TAC GGT 354 Lys Leu Xis 275 Ser His Arg Glu Cvs 230 Gin Gin Pro H-S 235 Tyr Gly Ser GAA GTT ACC ACC AAA ATG CTG GCT Z HM GAC nr*rz CAG TGG AAA ACC 912 Glu Vai « il* Thr Lys Mec Leu Cys Ala Ala Asp Pro Gin Trp Lys Tiix 290 295 300 GAC TCT TGC CAA GGT GAC GGT VíG J. CCA CTA GTT TGC i w « CTC CAG = 60 Aso Ser Cys Gin Gly Aso Ser Gly Gly Leu Vai Cys Ser Léu Gin 305 310 315 320 GGT CGT ATG ACC CTG ACC GGT ATT GTT TCT TGG GGT CGT GGT TGC GCT 100 3 Glv Arg Met Thr Leu Thr Gly Ile Vai Ser Trp Gly Arg Gly Cys Ala 325 330 335 CTG AAA GAC AAA CCG GGT GTT TAC ACC CGT GTT TCT CAC CTG CCG 1056 Leu Lvs Asp Lys Pro Gly Vai Tyr Thr Arg Vai Ser His Phe Leu 340 345 350 TGG ATC CGT TCT CAC ACC AAA GAA GAA AAC GGT CTG GCT CTG AGC CCG 1104 Trp lie Arg Ser His Thr Lys Glu Glu Asn Gly Leu Ala Leu Ser Pro 355 360 365 CCG Visj 1 GGT TTC CCG AGG CCT GGT GGT GGT GGT AAC GGT GAC TTC GAA 1152 Prc C-ly Gly Phe Pro Arg Pro Gly Gly Gly Gly Asn Gly Asp Phe C-Iu 370 375 330 GAA ATC CCG GAA GAG TAC CTG TGA 1176 Glu lie Pro Glu Glu Tyr Leu * 335 390 79 83 886 ΕΡ Ο 669 394/ΡΤ (2) INFORMAÇÃO PARA SEQ ID NO: 30: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 392 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear <ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 30:
Met Ser 1 Lys Thr Cvs * 5 Tyr Glu Gly Asu Glv 1Ò Kis Phe Tyr Arg G*y Lys Ala Ser Thr Asn 20 Thr Met Gly Arg Pro Cys 25 Leu Tro Asn Ser Ala 30 Thr Vai Leu 35 Gin Gin Thr Tyr Kis 40 Ala Kis Arg Ser Asp Ala Leu Gin 45 Leu Glv 50 Leu Gly Lys Kis Asn 55 Cys Arg Asn Pro Asp Asu Arg Arg 50 Aro Pro 65 Trp Cys Tyr Vai Glu 70 Vai Glv Leu LVS 75 Leu Vai Glu Glu ao Cys Met Vai His Asn 85 Cys Ala Asp Glv Lvs 90 Lys Prc Ser Ser Pro Pro 3 = Glu Glu Leu Lys 100 Phe Glu Cys Gly Glu Lvs 105 Leu Arg Pro Arg Phe 110 Lvs Ile Ile 115 Gly Gly Glu Phe Th.r* 120 Thr Ile Glu Asn Gin Prc Tm Phe 125 Ala Ala 130 Ile Tyr Arg Arg Kis 13 5 Arg Gly Gly Ser Vai Thr Tyr Vai Cys 140 Glv Gly 145 Ser Leu Ser Pro 150 Cys Trp Vai Ile Ser Ala Thr Kis Cvs 160 ?he Ile Asp Tyr ?2TO 155 Lys Lys Glu Asp Tyr 170 lie Vai Tyr Leu Gly Arg 175 Ser Arg Leu Asn 130 Ser Asn Thr Glu Gly Glu 135 Met Lys Phe Glu Vai Glu ISO Asn Leu Ile 195 Leu His Lys Asp Tyr 200 Ser Ala Asp Thr Leu Ala Kis His 205 Asn Aso 210 Ile Ala Leu Leu Lys 215 Ile Arg Ser Lys Glu Glv Arg Cvs Ala 220 Glu Pro 225 Ser Arg Thr Ile Glu 230 Thr Ile Cys Leu 235 Pro Ser Met Tvr Asu 240 Asp Pro Glu Phe Gly 245 Thr Ser Cys Glu Ile 250 Thr Gly Phe Gly Lvs Glu 255 Asu Ser Thr Asn 260 Tyr Leu Tyr Pro Glu Glu 255 Leu Lys Met Thr Vai Vai 270 Lys Leu Ile 275 Ser Kis Arg Glu Cvs 230 Glu Glu Pro Kis Tyr Tvr Glv Ser 235 80 83 886 ΕΡ Ο 669 394/ΡΤ
Glu Vai 290 Thr Thr Lys Mec Leu 29S Cys Ala Ala Asp Pro 300 Gin Trp Lys Thr Asp 305 Ser Cys Gin Gly Aso 310 Ser Gly Gly Pro Leu 315 Vai Cys Ser Leu Glrl 320 Gly Arg Thr Leu 325 Thr Gly Ile Vai Ser 330 Tro Gly Arg Gly Cys 335 Ala Leu Lys Asp Lys 340 Pro Gly Vai Tyr Thr 343 Arg Vai Ser His Phe 350 Leu Pro Tra Ile Arg 355 Ser His Thr Lys Glu 360 Glu Asn Gly Leu Ala 3 65 Leu Ser Pro ?ro Gly 3 70 Gly Phe Prc Arg Pro 375 Gly Gly Gly Gly Asn 380 Gly Asp Phe Glu Glu 335 Ile Pro Glu Glu Tvx 390 Leu ★ (2) INFORMAÇÃO PARA SEQ ID NO: 31: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1197 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (ix) CARACTERÍSTICA:
(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1..1197 (D) OUTRA INFORMAÇÃO: /function= "metionina N-terminal é separada proteoliticamente em E.coli" /product= "gene sintético para a proteína M15 (pSJ79)" (xi) DESCRIÇÃO. DA SEQUÊNCIA: SEQ ID NO: 31: ATG AGC AAA ACT TGC TAC GAA GGT AAC GGT CAC j. i W TAC CGT GGT AAG MeC 1 Ser Lys Thr Cys 5 Tyr Glu Gly Asn Gly His 10 Phe Tyr Arg Gly 15 Lys GCT TCT ACC GAC ACC ATG GGT CGT CCG TGC CTG CCG TGG AAC TCT GCT Ala Ser Thr Asp 20 Thr MeC Gly Arg Pro 25 Cys Leu Pro Tro Asn 30 Ser Ala ACC GTT CTG CAG CAG ACC TAC CAC GCT CAC CGT TCT GAT GCA TTG CAC- Thr Vai Leu 35 Gin Gin Thr Tyr His 40 Ala His Arg Ser Asp 45 Ala Leu Gln CTG GGT CTG GGT AAA CAC AAC TAC TGC CGT AAC CCG GAC AAC CGT CGT Leu Gly 50 Leu Gly Lys His Asn 55 Tyr Cys Arg Asn Pro 60 Asp Asn Arg Arg 43 95 144 192 81 83 886 ΕΡ Ο 669 394/ΡΤ CGT CCG TGG TGC Arg Pro Trp Cys 63 TGC ATG GTT CAC Cys Met Vai His GAA GAG CTC AAA Glu Glu Leu Lys 100 AAA ATC ATC GGT Lys !le Ile Gly 115 GCT GCT ATC TAC Ala Ala ile Tyr 130 GGT GGT TCT CTG Gly Gly Ser Leu 145 TTC ATC GAC TAC Phe Ile Asp Tyr TAC GTT CAG GTT Tyr Vai Gin Vai 70 GAC TGC GCT GAC Asp Cys Ala Aso 85 TTC CAG TGC GGT Phe Gin Cys Gly GGT GAG TTC ACC Gly Glu Phe Thr 120 CGT CGT CAC CGT Arg Arg His Arg 135 ATC'TCT CCG TGC Ile Ser Pro Cvs 150 CCG AAA AAA GAA Pro Lys Lys Glu 165 GGT CTG AAA CCG Gly Leu Lys Pro 75 GGT AAA AAA CCG Glv Lvs Lys Pro 90 CAA AAA ACC CTA Gin Lvs Thr Leu 105 ACC ATC GAA AAC Thr lie Glu Asn
Gly Gly Ser Vai 140 TGG GTT ATC TCT Tro Vai Ile Ser 155 GAC TAC ATC GTT Aso Tyr IIe Vai 170 CTA GTT CAG GAA Leu Vai Gin Glu 80 TCT TCT CCG Ser Ser Pro 95 CGT CGT TTT Arg Pro 110 Arg ?hâ CAG CCG TGG Gin 125 Pro Trp Phe ACC TAC GTT TGC Thr Tyr Vai Cys GCT ACC CAC TGC Ala Thr His Cvs 1*50 TAC CTC GGC CGT Tyr Leu Gly 175 Arg GGT GAA ATG AAA TTC GAA GTT GAA Gly Glu Mec Lys Phe Glu Vai Glu ias * 190 TCT GCT GAC ACC CTG GCT GAC CAC Ser Ala Aso Thr Leu Ala His His 205 CGT TCT AAA GAA GGT CGT TGC GCT Arg Ser Lvs Glu Gly Arg Cys Ala 220 ATC TGC CTG CCG TCT ATG TAC AAC Ile Cys Leu Pro Ser Mec Tyr Asn 235 240 GAA ATC ACC GGT TTC GGT AAA GAA Glu Ile Thr Gly Phe Gly Lys Glu 250 255 GAA CAG CTG AAA ATG ACC GTT GTT Glu Gin Leu Lys Met Thr Vai Vai 265 270 CAG CAG CCG CAC TAC TAC GGT TCT Gin Gin Pro His Tyr Tyr Gly Ser 285 GCT GCT GAC CCG CAG TGG AAA ACC Ala Ala Asp Pro Gin Trp Lys Thr 300 GGT CCA CTA GTT TGC TCT CTC CAG Gly Pro Leu Vai Cys Ser Leu Gin 315 320 TCT CGT TTA AAC TCT AAC ACC CAG Ser Arg Leu Asn Ser Asn Thr Gin 180
AAC CTG ATC CTG CAC AAA GAC TAC
Asn Leu lie Leu His Lys Aso Tvr 195 " 200
AAC GAC ATC GCT CTG CTA AAA ATC
Asn Asp lie Ala Leu Leu Lys Ile 210 215
CAG CCG TCT CGT ACC ATC CAG ACC
Gin Pro Ser Arg Thr lie Gin Thr 225 230 GAC CCG CAG TTC-GGT ACC TCT TGC Aso Pro Gin Phe Gly Thr Ser Cys 245 AAC TCT ACC GAC TAC CTG TAC CCG Asn Ser Thr Aso Tyr Leu Tyr Pro 26*0 AAA CTG ATC TCT CAC CGT GAA TGC Lys Leu Ile Ser His Arg Glu Cys 275 280 GAA GTT ACC ACC AAA ATG CTG TGC Glu Vai Thr Thr Lys Met Leu Cys 290 295 GAC TCT TGC CAA GGT GAC TCT GGT Aso Ser Cys Gin Gly Asp Ser Gly 305 310 82 83 886 ΕΡ Ο 669 394/ΡΤ GGT CGT ATG ACC CTG ACC GGT ATT GTT TCT TGG GGT CGT GGT TGC GCT 1003 Glv Arg Met Thr Leu Thr Gly Ila Vai Ser Gly Arg Glv Cvs Ala 325 330 335 CTG AAA GAC AAA CCG GGT GTT TAC ACC CGT GTT TCT CAC CTG CCG 10 56 Leu Lys Asp Lys Pro Gly Vai Ύγτ Thr Arg Vai Ser His Phe Leu Pro 340 345 350 TGG ATC CGT TCT CAC ACC AAA GAA GAA AAC GGT CTG GCT CTG AGC 1104 Tro Ile Arg Ser His Thr Lys Glu Glu Asn Gly Leu Ala Leu SS2T Pro 355 3S0 365 CCG AGC CCG CCG AGC CCG CCG GGT GGT TTC GGT CCG AGG Uv* « GGT GGT 1152 Pro Ser Pro Pro Ser Pro Pro Gly Gly Phe Gly Pro Arg Pro Gly Gly 370 375 380 GGT GGT AAC GGT GAC GAA GAA ATC CCG GAA GAG TAC CTG TGA 1197 Glv Gly Asn Gly Aso Phe Glu Glu Ile Pro Glu Glu Tyr Leu ▼ 335 390 395 (2) INFORMAÇÃO PARA SEQ ID NO: 32: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 399 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ.ID NO: 32:
Mec 1 Ser Lys Thr Cys Tyr Glu Gly Asn Gly 10 His Phe Tyr Arg Gly Lys Ala Ser Thr Asp 20 Thr Met Gly Arg Pro Cys 25 Leu Pro Trp Asn 30 Ser Ala Thr Vai Leu 35 Gin Gin Thr Tyr His 40 Ala His Arg Ser Asp 45 Ala Leu Gin Leu Gly 50 Leu Gly Lys His Asn 55 Tysr Cys Arg Asn Pro 50 Asp Asn * Arg Arg 65 Pro Trp Cys Tyr Vai 70 Gin Val Gly Leu Lys 75 Pro Leu Val Gin Glu SO Cys Met Vai His Aso 85 Cys Ala Asp Gly Lys 90 Lys Pro Ser Ser Pro 95 Pro Glu Glu Leu Lys 100 Phe Gin Cys Gly Gin Lys 105 Thr Leu Arg Pro 110 Arg Phe Lys Ile Ile 115 Gly Gly Glu Phe Thr 120 Thr Ile Glu Asn Gin 125 Pro Trp Phe Ala Ala 130 Ile Tyr Arg Arg His 135 Arg Gly Gly Ser Val 140 Thr Tyr Val Cys Glv 145 Gly Ser Leu Ile Ser 150 Pro Cys Trp Val Ile 155 Ser Ala Thr His Cys 160 Phe Ile Asp Tyr Pro Lys Lys Glu Asp Tyr Ile Val Tyr Leu Gly Arg 165 170 175 83 83 886 ΕΡ Ο 669 394/ΡΤ
Ser Arg Leu Asn 180 Ser Asn. Thr Gin Gly 195 Glu Met Lys Phe Glu 190 Vai Glu Asr. Leu lie 195 Leu His Lys Asp Tyr 200 Ser Ala Asp Thr Leu 205 Ai cL His íti3 Asn Ase 210 lie Ala Leu Leu Lys Ile 215 Arg Ser Lys Glu 220 Gly Arg Cys Ala Gin. Pro 225 Ser Arg Thr lie 230 Gin Thr lie Cys Leu 235 Pro Ser Met Tyr Asn 240 Asp Pro Gin Phe Gly Thr 245 Ser Cys Glu Ile Thr 250 Gly Phe Gly Lys 255 Glu Asn. Ser Asp 260 Tyr Leu Tyr Pro Glu 265 Gin Leu Lys Met Thr 270 Vai Vai Lys Leu Ile 275 Ser His Arg Glu Cvs 230 Gin Gin Pro. His Tvr 235 Tyr Gly Ser Glu Vâ-290 Thr Thr Lys Met Leu Cys 295 Ala Ala Asp Pro 300 Gin Trp Lys Aso Ser 305 Cys Gin Gly Aso 310 Ser Gly Gly Pro Leu 315 Vai Cys Ser Leu Gin 320 Gly Arg Met Thr Leu 325 Giv ile Vai Ser Tro 330 Gly Arg Gly Cys 335 Ala Leu Lys Aso Lvs 340 Pro Gly Vai Tyr ΤΊ- y, * A Ç Arg Vai Ser His Phe 350 Leu Pro Trp lie Arg 355 Ser His Thr Lys Glu 3 60 Glu Asn Gly Leu Ai 3. 3 o 5 Leu Ser Pro Pro Ser 370 Pro Pro Ser Pro Pro Gly Gly Phe Gly Pro 380 Ajtc Pro Gly Gly Giv GIv 385 Asn Gly Asp Phe 390 Glu Glu Ile Pro Glu 395 Glu Tyr Leu * (2) INFORMAÇÃO PARA SEQ ID NO: 33: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1185 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não 84 83 886 ΕΡ Ο 669 394/ΡΤ (ix} CARACTERÍSTICA: (A) NOME/CHAVE: CDS (Β) LOCALIZAÇÃO: 1..1185 (D) OUTRA INFORMAÇÃO: /function= "metionina N-terminal é separada proteoliticamente em E.coli" /product= "gene sintético para a proteína M16 (pSJ81)" (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 33: ATG AGC AAA ACT TGC TAC GAA GGT AAC GGT CAC TTC TAC CGT GGT AAG 43 Met' 1 Ser Lys Thr Cys 5 Tyr Glu Gly Asn Gly 10 His Phe Tyr Arg Giv 15 Lys GCT TCT ACC GAC ACC ATG GGT CGT CCG TGC CTG CCG TGG AAC GCT 96 Ala Ser Thr Aso Thr 20 Met Gly Arg Pro 25 Cys Leu Pro Trp Asn 30 Ser Ala ACC GTT CTG CAG CAG ACC TAC CAC GCT CAC L· w « GAT GCA TTQ CAG 144 Thr Vai Leu 35 Gin Gin Thr Tyr His 40 Ala HÍS Arg Ser Aso Ala 45 Leu Gin - CTG GGT CTG GGT AAA CAC AAC TAC TGC CGT AAC GAC AAC CGT 192 Leu Gly 50 Leu Gly Lys His Asn Tyr 55 Cys Arg Asn Pro 60 Asp Asn Arg Arg CGT CCG TGG TGC TAC GTT CAG GTT CTG AAA CCG CTA GTT CAG GAA 240 Arg 65 Pro Trp Cys Tyr Vai 70 Gin Vai Gly Leu Lvs 75 Pro Leu Vai Gin Glu 80 m*·* <>* GTT CAC GAC TGC GCT GAC r*rr* \JVSíí AAA AAA TCT TCT CCG 233 Cys Met Vai His Aso 35 Cys Ala Asp Gly ijVS 90 Lys Pro Ser Ser Pro 95 Pro GAA GAG CTC AAA TTC CAG TGC GGT CAA AAA ACC CTA i Lee CGT ITT 336 Glu Glu Leu Lys Phe 100 Gin Cys Gly Gin 105 Lys Leu Arg Pro 110 Arg Phe AAA ATC ATC GGT GGT GAG rprn^ ACC ATC GAA AAC CAG CCG TGG 334 Lys lie lie 115 Gly Gly Glu Phe Thr 12 0 Thr Ile Glu Asn Gin Pro 125 Trp Phe GCT «V- . ATC TAC CGT CGT CAC CGT GGT GGT TCT GTT ACC TAC GTT TGC 432 Ala Ala lie Tyr Arg Arg His Arg Gly Gly Ser Vai Thr Tyr Vai Cys 130 135 140 GGT GGT TCT CTG ATC TCT CCG TGC TGG GTT ATC TCT GCT ACG CAC TGC 430
Gly Gly Ser Leu Ile Ser Pro Cys Trp Vai Ile Ser Ala Thr His Cys
145 150 ' 155 ISO TTC ATC GAC TAC CCG AAA AAA GAA GAC TAC ATC GTT TAC CTC GGC CGT 523
Phe Ile Asp Tyr Pro Lys Lys Glu Aso Tyr Ile Vai Tyr Leu Gly Arg 165 ' 170 175 TCT CGT TTA AAC TCT AAC ACC CAG GGT GAA ATG AAA TTC GAA GTT GAA 576
Ser Arg Leu Asn Ser Asn Thr Gin Gly Glu Met Lys Phe Glu Vai Glu 130 135 190
AAC CTG ATC CTG CAC AAA GAC TAC TCT GCT GAC ACC CTG GCT CAC CAC
Asn Leu Ile Leu Kis Lys Asp Tyr Ser Ala Asp Thr Leu Ala His His 195 * 200 205 624
83 886ΕΡ Ο 669 394/ΡΤ 85 AAC GAC ATC GCT CTG CTA AAA ATC CGT AAA GAA GGT CGT TGC GCT Asn Aso Ile Ala Leu Leu Lys Ile Arg Ser Lys Glu Gly Arg Cys Ala 210 215 220 CAG CCG CGT ACC ATC CAG ACC ATC TGC CTG CCG *τ*£*γ* ATG TAC AAC Gin Pro Ser Arg Thr Ile Gin Thr Ile Cys Leu Pro Ser Met Tyr Asn 225 230 235 240 GAC CCG CAG TTC GGT ACC TCT TGC GAA ATC ACC GGT GGT AAA GAA Aso Pro Gin Phe Glv Thr Ser Cys Glu Ile Gly Phe Gly Lvs Glu 245 250 255 AAC TCT ACC GAC TAC CTG TAC CCG GAA CAG CTG AAA ATG ACC QmwT' • l||»n O- . Asn Ser Thr ASO Tyr Leu Tyr Pro Glu Gin Leu Lys Met Thr Vai Vai 260 265 270 AAA CTG ATC TCT CAC CGT GAA TGC CAG CAG CCG CAC TAC TAC TCT lys Leu ·?* â Ser His Arg Glu Cys Gin Gin Pro llã Tvr Tvr Gly Ser 275 230 28 5 ί}ΛΛ 'J i - ACC ACC AAA ATG CTG TGC GCT GÇT GAC CCG CAG TGG AAA ACC Glu Vdi Thr Thr Lys Met Leu Cys Ala Ala Asp Pro Gin Tro Lys mt, 290 295 300 GAC TCT TGC CAA VJVJ A GAC TCT GGT CCA CTA GTT TGC CTC CAG Aso Ser Cys Gin Gly ASO Ser Gly Gly Pro Leu Vai Cys Ser Leu Gin 305 310 315 320 GGT CGT ATG ACC CTG ACC GTT GGT CGT GGT TGC GCT Gly Arg Met Thr Leu -Ui Gly Ile Vai Ser Trp Gly Aro Gly Cys Ala 325 330 335 CTG AAA GAC AAA CCG GGT GTT TAC ACC CGT GTT CAC CTG CCG Leu Lys Asp Lys Pro Gly Vai Tyr Thr Arg Vai Ser His Phe Leu « « w 340 345 350 CGT TCT CAC ACC AAA GAA GAA AAC GGT CTG GCT CTG AGC CCG Trp Ile Aro Ser His Thr Lys Glu Glu Asn Gly Leu Ala Leu Ser Pro 355 360 3 55 GTT AAG GCT TGG GGA CGG CCG CTG GGT GGT GGT GGT AAC GGT GAC Vai Lys Ala Trp Pro Gly Arg Pro Leu Gly Glv Gly Gly Asn Gly Asp 370 375 330
720 753 315 364 912 960 1008 ' 1055 1104 1152 TTC C-AA GAA ATC CCG GAA GAA TAC CTG CAA ΤΑΑ 1135
Phe Glu Glu Ile ' Pro Glu Glu Tyr leu Gin. * 385 390 395 (2) INFORMAÇÃO PARA SEQ ID NO: 34: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 395 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 34:
Met Ser Lvs Thr Cys Tvr Glu Gly Asn Gly His Phe Tyr Arg Gly Lys 1*5* 10 15
Ala Ser Thr Aso Thr Met Gly Arg Pro Cys Leu Pro Tm Asn Ser Ala 20 25 ‘ 30 86 83 886 ΕΡ Ο 669 394/ΡΤ
Thr Vai Leu 35 Gin Gin. Thr Tyr His 40 Ala His Arg Ser Asp 45 Ala Leu GIn Leu Gly 50 Leu Gly Lys His Asn 55 Tvr Cys Arg Asn Pro 6 0 Asp Asn Arg Arg Ar=r 65 Pro Tm Cys Tyr Vai 70 Gin Vai Gly Leu Lys 75 Pro Leu Vai Gin Glu 30 Cys Met Vai His Aso 85 Cys Ala Asp Gly Lys 90 Lys Pro Ser Ser Pro 95 o—, • — W Glu Glu Leu Lys 100 Phe Gin Cys Gly Gin 105 Lys Thr Leu Arg Pro 110 Arg pK 0 Lys Ile Ile 115 Gly Gly Glu Phe Thr 120 Thr Ile C-iu Asn Gin 125 Pro Trp Phs Ala Ala 130 Ile Tyr Arg Arg His 135 Arg Gly Gly Ser Vai 140 Thr Vai Cys Gly 145 Gly Ser Leu Ile Ser 150 Pro Cys Tm Vai Ile 155 Ser Ala rhr His Cys 160 Phe Ile Asp Tyr Pro 165 Lys Lys Glu Asp Tv*'1'" 170 Z X s Vai Tyr Leu Gly 175 Arg Ser Arg Leu Asn ião Ser Asn Thr Gin Gly 135 Glu Met Lys Phe Glu 190 Vai Glu Asn Leu He 195 Leu His Lys Asp Tvr 200 Ser Ala Asp PpU Leu 205 Ala His His Asn Aso 210 Ile Ala Leu Leu Lys 215 Ile Arg Ser Lys Glu 220 Gly Arg Cys Ala Gin 225 Pro Ser Arg Thr ZXs 230 Gin Ile Cys Leu 235 Pro Ser Met Tyr Asn 240 Asp Pro Gin Phe Glv 245 Thr Ser Cys Glu He 250 Thr Gly Phe Gly Lys 255 Glu Asn Ser Thr Asp 260 Tyr Leu Tyr Pro Glu 265 Gin Leu Lys Met Thr 270 Vai Vai Lys Leu Ile 275 Ser His Arg Glu Cys 230 Gin Gin Pro His Tyr 285 Tyr Gly Ser Glu Vai 290 Thr Thr Lys Met Leu Cys 295 Ala Ala Asp Pro 300 Gin Tro Lys Thr
Aso Ser Cys Gin Gly Asp Ser Gly Gly Pro Leu Vai Cys Ser Leu Gin 305 * 310 315 320
Glv Arg Met Thr Leu Thr Gly Ile Vai Ser Tm Gly Arg Gly Cys Ala 325 330 335
Leu Lys Asp Lys Pro Gly Vai Tyr Thr Arg Vai Ser His Phe Leu Pro 340 * 345 350
Tm Ile Arg Ser His Thr Lys Glu Glu Asn Gly Leu Ala Leu Ser Pro 355 360 365 87 83 886 ΕΡ Ο 669 394/ΡΤ
Vai Lvs 370 Ala Trp Pro Gly Arg Pro 375 leu Gly Gly Gly Gly Asn Gly Asp 380 385 Glu Glu Ile Pro Glu 390 Glu Tyr leu Gin * 395 (2) INFORMAÇÃO PARA SEQ ID NO: 35: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1185 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (ix) CARACTERÍSTICA:
(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1..1185 (D) OUTRA INFORMAÇÃO: /function= "metionina N-terminal é separada proteoliticamente em E.coli" /product= "gene sintético para a proteína M17 (pSJ83)” (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 35: ATG AGC AAA ACT m/-» TAC GAA GGT AAC GGT CAC 1 J TI w TAC GGT AAG 43 Met 1 Ser Lys Thr Cys 5 Glu Gly Asn Glv 10 His Piis Tyr Aro Gly Lvs GCT TCT ACC GAC ACC ATG GGT CGT CCG TGC CTG TGG AAC 96 Ala Ser Thr Asp 20 Thr Mec Gly Arg Pro 25 Cys Leu Pro Trp Asn 30 Ser Ala ACC CTG CAG CAG ACC TAC CAC GCT CAC CGT GAT GCA TTG CAG 144 Thr Vai Leu 35 Gin Gin Thr Tyr His 40 Ala His Arg Ser Aso 45 Ala Leu Gin CTG GGT CTG GGT AAA CAC AAC TAC TGC CGT AAC GAC AAC CGT CGT 192 Leu Gly Leu Gly Lvs 50 Sis Asn 55 Tyr Cys Arg Asn Pro 60 Asp Asn Arg Arg CGT CCG TGG TGC TAC GTT CAG GTT CTG AAA CCG CTA GTT CAG GAA 240 Arg 65 Pro Trp Cys Tyr Vai 70 Gin Vai Gly Leu Lys 75 Pro Leu Vai Gin Glu 80 TGC ATG GTT CAC GAC TGC GCT GAC GGT AAA AAA CCG TCT TCT CCG CCG 238 Cys MeC Vai Kis Aso 35 Cys Ala Asp Gly Lys 90 Lys Pro Ser Ser Pro 95 Pro GAA GAG CTC AAA CAG TGC GGT CAA AAA ACC CTA CGT CCG CGT 3 3 6. Glu Glu Leu Lvs Phe Gin Cys Gly Gin Lys Thr Leu Arg Pro Arg Phe 100 105 110
ΑΛΑ ATC ATC GGT GGT GAG TTC ACC ACC ATC GAA AAC CAG CCG TGG TTC
Lys Ile Ile Gly Gly Glu Phe Thr Thr He Glu Asn Gin Pro Trp Phe 115 ‘ ‘ 120 125 384 83 886 ΕΡ Ο 669 394/ΡΤ
88 GCT GCT ATC TAC CGT CGT CAC CGT GGT GGT TCT GTT ACC TAC GTT TGC Ala Ala Ile Tyr Arg Arg His Arg Gly Gly Ser Vai Thr Tvr Vai Cys 130 135 140 GGT GGT TCT CTG ATC TCT CCG TGC auvj ATC TCT GCT ACC CAC TGC Glv Gly Ser Leu T 1_0 Ser Pro Cys Trp Vai lie Ser Ala Thr His Cvs 14*5 150 155 ISO λ A W ATC GAC TAC CCG AAA AAA GAA GAC TAC ATC GTT TAC CTC GGC CGT Phe Ile Asp Tyr Pro Lys Lys Glu Asc Tvr Ile Vai Leu Gly Arg 155 170 175 CGT TTA AAC TCT AAC ACC CAG GGT GAA ATG AAA TTC GAA GTT GAA Ser Arg Leu Asn Ser Asn Thr Gin Gly Glu Met Lys Phe Glu Vai Glu 180 185 190 AAC CTG ATC CTG CAC AAA GAC TAC TCT GCT GAC ACC CTG GCT CAC CAC Asn Leu Ile Leu His Lys Asp Ser Ala Asp Thr Leu Ala His His 195 2Ó0 206 AAC GAC ATC GCT CTG CTA AAA ATC CGT TCT AAA GAA GGT CGT TGC GCT Asn Asp Ile Ala Leu Leu Lys Ile Arg Ser Lys Glu Gly Arg Cys Ala 210 215. 220 CAG L.W.J TCT CGT ACC ATC CAG ACC ATC TGC CTG CCG TCT ATG TAC AAC Gin Pro Ser Arg Thr Ile Gin Thr lie Cys Leu Pro Ser Met Tyr Asn 225 230 235 240 GAC CCG CAG TTC GGT ACC TCT TGC GAA ATC ACC GGT AAA CAA Asp Pro Gin Phe Gly Thr Ser Cys Glu Ile Thr Gly Phe Gly Lys Glu 245 250 255 AAC ACC GAC TAC CTG TAC GAA CAG CTG AAA ^ «T A-.^ ACC GTT / ·»< M Asn Ser Thr Aso Tyir Leu Tvr Pro Glu Gin Leu Lys Met T^2T Vai Vai 250 265 270 AAA CTG ATC TCT CAC CGT GAA CAG CAG CCG CAC TAC TAC GGT T*r·^ — s*. ·» Lys Leu Ile Ser His Arg Glu Cvs Gin Gin Pro His Ty^r Tyr Gly Ser 275 230 235 GAA GTT ACC ACC AAA . ATG CTG TGC GCT GCT GAC CCG CAG ^ AAA ACC Glu Vai Thr Thr Lys Met Leu Cys Aia Ala Asp Pro Gin "P·—w·. A W w Lys Thr 290 295 300 432 430 523 572 720 753 815 354 912
GAC TCT TGC CAA GGT GAC TCT GGT GGT CCA CTA GTT TGC TCT CTC CAG
Aso Ser Cvs Gin Gly Asp Ser Gly Gly Pro Leu Vai Cys Ser Leu Gin 305 ' 310 315 320
GGT CGT ATG ACC CTG ACC GGT ATT GTT TCT TGG GGT CGT GGT TGC GCT
Glv Arg Met Thr Leu Thr Gly Ile Vai Ser Tn Gly Arg Gly Cys Ala 325 330 * 335
CTG AAA GAC AAA CCG GGT GTT TAC ACC CGT GTT TCT CAC TTC CTG CCG
Leu Lys Aso Lys Pro Gly Vai Tyr Thr Arg Vai Ser Kis Phe Leu Pro 340 345 350
TGG ATC CGT TCT CAC ACC AAA GAA GAA AAC GGT CTG GCT CTG AGC CCG
Tro Ile Arg Ser His Thr Lys Glu Glu Asn Gly Leu Ala Leu Ser Pro 355 3S0 3S5
GTT AAG GCT TTC GGA CCG CGG CCG CTG GGT GGT GGT GGT AAC GGT GAC
Vai Lvs Ala Phe Gly Pro Arg Pro Leu Gly Gly Gly Gly Asn Gly Asp 370 375 380 950 1008 1055 1104 1152
TTC GAA GAA ATC CCG GAA GAA TAC C7G Phe Giu Glu Ile ?ro Glu Glu Tyr Leu 385 390 CAA TAA Gin. * 395 i. 135 (2) INFORMAÇÃO PARA SEQ ID NO: 36: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 395 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 36:
Met Ser Lys Thr Cys Tyr 5 Glu Gly Asn Glv 1Ò His Phe Arg Gly 15 Lys Ala Ser Thr Aso 20 Thr Met Gly Arg Pro 25 Cys Leu Pro Asn 30 Ser Ala Thr Vai Leu 35 Gin Gin Thr Tyr His 40 Ala His Arg Ser Aso 45 Ala Leu Gin Leu Glv 50 Leu Gly Lys His Asn 55 Tyr Cys Arg Asn Prc 60 Asp Asn Arg Arg Arg S Ξ Pro Trp Cys Tyr Val 70 Gin Val Gly Leu Lvs 75 Pro Leu Val Gin Glu 30 Cys Met Val His Aso Cvs 35 Ala .-.sp Gly Lys 90 Lys Pro Ser Ser Pro 93 Pro Glu Glu Leu Lvs 100 Phe Gin Cys Gly Gin 105 Lys Thr Leu Arg Pro 110 Arg Phe Lys Ile Ile Gly Gly Glu Phe 'T'hr 120 Thr Ile Glu Asn Gin 125 Pro Tro Ala A1.3* 130 Ile Arg Arg Kis 135 Arg Gly Gly Ser Val 140 Thr Tyr Vai Cys Glv 145 Gly Ser Leu Ile Ser 150 Pro Cys Trp Vai Ile 155 Ser Ala Thr His Cys ISO Phe Ile Asp Tyr Pro Lvs 155 Lys Glu Asp Tyr 170 Ile Val Tyr Leu Gly 175 Aro Ser Arg Leu Asn 180 Ser Asn Thr Gin Gly Glu 135 Met Lys Phe Glu 190 Val Glu Asn Leu Ile 195 Leu Kis Lys Asp Tvr 200 Ser Ala Asp Thr Leu 205 Ala His His Asn Asn 210 Ile Ala Leu Leu Lys 215 Tl g Arg Ser Lys Glu Gly Arg Cys 220 Ala Gin 225 Prc Ser Arg Thr Ile 230 Gin TV* r· Ile Cys Leu 235 Pro Ser Met Tyr Asn 240 As? Pro Gin Phe Gly Thr 243 Ser cys Glu Ile 250 Thr Gly Phe Gly Lvs 255 Glu 90 83 886 ΕΡ Ο 669 394/ΡΤ
Asn Ser Thr Asp 260 Tvr Leu Tysr Pro Glu 265 Glu Leu Lys Mec Thr 270 Val Vai Lvs Leu lie 275 Ser His Arg r* τ vj—U Cvs 230 Glu Glu Pro His Tvr Tyr 235 Gly Ser Glu Vai 290 Thr Thr Lys MeC Leu 295 Cys Ala Ala Asp 300 Glu Tro Lys Thr Asn 305 Ser Cys Glu Gly Aso 31Õ Ser Gly Gly Pro Leu 315 Vai Cys Ser Leu Glu 320 Gly Arg Mec Thr Leu 325 Thr Gly Ile Vai Ser 330 Tro Gly Arg Gly Cys 335 Ala Lau Lys Asp Lys 340 Pro Gly Vai Thr 345 Arg Vai Ser His Phe 350 Leu Pro Cm T 1 A Arg 355 Ser His Thr Lys Glu 350 Glu Asu Gly Leu Ala Leu 365 Ser Pro Vai Lvs 370 Ala Phe Gly Pro Arg 375 Pro Leu Gly Giv Glv 380 Gly Asn. Gly Asp Phe 385 Glu Glu Ile Pro Glu 390 Glu Leu Glu ★ 395 (2) INFORMAÇÃO PARA SEQ ID NO: 37: (i) CARACTERÍST1CAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1185 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (ix) CARACTERÍSTICA:
(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1..1185 (D) OUTRA INFORMAÇÃO: /function= "metionina N-terminal é separada proteoliticamente em E.coli" /product= "gene sintético para a proteína M18 (pSJ90)" (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 37: ATG AGC AAA ACT TGC TAC GAA GGT AAC GGT CAC TTC TAC CGT GGT AAG Met 1 Ser Lys Thr Cys 5 Tyr Glu Gly Asn Glv 1Ô His Phe Tyr Arg Glv 15 Lys GCT TCT ACC GAC ACC ATG GGT CGT CCG TGC CTG CCG TGG AAC TCT GCT Ala Ser Thr Aso 20 Thr Met Gly Arg Pro 25 Cys Leu Pro Trp Asn 30 Ser Ala ACC GTT CTG CAG CAG ACC TAC CAC GCT CAC CGT TCT GAT GCA TTG CAG Thr Vai Leu 35 Gin Gin Thr Tyr His 40 Ala His Arg Ser Asp 45 Ala Leu Gin 144 91 83 886 ΕΡ Ο 669 394/ΡΤ CTG GGT CTG GGT AAA CAC AAC TAC TGC CGT AAC CCG GAC AAC CGT CGT 192 Leu Gly Leu Gly Lys His Asn Tyr Cys Arg Asn Pro Asp Asn Arg Arg 50 55 5 0 CGT CCG TGG TGC TAC GTT CAG GTT GGT CTG AAA CCG CTA GTT CAG GAA 240 Arg ?ro Tr? Cys Tyr Vai Gin Vai Gly Leu Lvs Pro Leu Vai Gin Glu a 5 70 75 30 TGC ATG GTT CAC GAC TGC GCT C-AC GGT AAA AAA CCG i i. CCG CCG 233 Cys Met Vai His Asn Cys Ala Asp Gly Lvs Lys Pro Ser Ser Pro Pro 35 90 95 GAA GAG CTC AAA TTC CAG TGC GGT CAA AAA ACC CTA CGT CCG CGT TTT 235 Giu Giu Leu Lys Phe Gin Cys Gly Gin Lys Thr Leu Arg Pro Arg 100 105 110 AAA ATC ATC GGT GGT GAG TTC ACC ACC ATC GAA AAC CAG CCG TGG TTC 234 Lvs Ile Ile Gly Gly Glu Phe Thr Ile Glu Asn Gin Pro Tro Phe 115 120 125 GCT GCT ATC TAC CGT CGT CAC LsJJ. Lrvr j» GGT ACC TAC s3 « i. -vJV- 422 Ala Ala Ile Tyr Arg Arg His Arg C-iy Gly Ser Vai Vai Cys 130 135 140 GGT GGT TCT CTG ATC TCT CCG TGC TGG ATC CAC TGC 430 Gly Gly Ser Leu Ile Ser Pro Cys Trp Vai lie Ser Ala Thr His Cys 145 ISO 155 160 TTC ATC GAC TAC CCG AAA AAA GAA GAC TAC ATC GTT TAC CTC CGT 523 Phe lie Asp Tyr Pro Lys Lys Giu Asp Tvr ZXâ Vai Tyr Leu Giy Arg 165 170 175 TCT CGT TTA AAC TCT AAC ACC CAG GAA ATG AAA TTC GAA Qmm GAA 576 Ser Arg Leu Asn Ser -Asn Thr Gin Gly Giu Met Lys Phe Glu Vai Glu ISO 135 190 AAC CTG ATC CTG CAC AAA GAC TAC GCT GAC ACC CAC CAC 624 Asn Leu Ile Leu His Lys Asp Tyr Ser Ala Asp TV — Leu Ala His ."ÍI.3 195 200 5 AC ^ w S AAC GAC ATC GCT CTG CTA AAA ATC CGT TCT AAA GAA i» LC X TGC GCT 672 Asn Asn lie Ala Leu Leu Lys Ila Â2TC. Ser ijVS Giu Giy Arg Cys 210 215 220 CAG CCG TCT CGT ACC ATC CAG ACC ATC TGC CTG TCT ATG TAC AAC 720 Gin Pro Ser Arg Thr Ile Gin Thr Ile Cys Leu Pro Ser Met Tyx Asn 225 230 23S 240 GAC CCG CAG TTC GGT ACC TCT TGC GAA ATC ACC GGT TTC GGT AAA GAA 763 Asp Pro Gin Piie Gly Thr Ser Cys Glu Ile Thr Gly Phe Gly Lys Glu 245 250 255 AAC TCT ACC GAC TAC CTG TAC CCG GAA CAG CTG AAA ATG ACC GTT GTT 316 Asn Ser Thr Aso Tyr Leu Tyr Pro Glu Gin Leu Lys Met Thr Vai Vai 260 265 270 AAA CTG ATC TCT CAC CGT GAA , TGC CAG CAG CCG CAC TAC TAC GGT TCT 864 Lvs Leu lie Ser ' His Arg Glu Cys Gin Gin Pro His Tyr Tyr Gly Ser 275 230 235 GAA GTT ACC ACC : AAA ATG : CTG : TGC GCT GCT GAC CCG CAG TGG AAA . ACC 912 Glu Vai Thr Thr ' Lys : Met Leu . Cys Ala Ala Asp Pro Gin Trp Lys Thr 290 295 300 960 92 83 886 ΕΡ Ο 669 394/ΡΤ GAC TCT TGC CAA GGT GAC TCT GGT GGT CCA CTA GTT TGC TCT CTC CAG Aso Ser Cvs Gin Giv Aso Ser Gly Gly Pro Leu Vai Cys Ser Leu Gin 3 05 310 315 320 GGT CGT ATG ACC CTG ACC GGT ·»»Τ 1 GTT • u - TGG GGT CGT GGT TGC Gly Arg Met Thr Leu Thr Gly Ile Vai Ser Tro Gly Arg Gly Cvs Ala 325 330 335 CTG AAA GAC AAA GGT GTT TAC ACC CGT GTT CAC TTC η’Γ'ζ CCG Leu Lvs Asp Lys Pro Gly Vai Tvr Thr Arg Vai Ser His Phe Leu 340 345 350 TGG ATC CGT TCT CAC ACC AAA GAA GAA AAC GGT CTG ****** CTG AGC Trp lie Arg Ser His Thr Lys Glu Glu Asn Gly Leu Ala Leu Ser Pro 355 360 3 65 GTT L»jvj TTC GGA CCG CGG CCG CTG vJV3 1 GGT GGT AAC GGT GAC Vai Arg Ala Phe Gly Pro Arg Prc Leu Gly Gly Gly Gly Asn Gly Asp 370 375 3 80 TTC GAA GAA ATC CCG GAA GAA TAC CTG CAA TAA Phe Giu Giu Ile O*»*-* Glu Glu Tyr Leu Gin * 385 390 395 100
Ca 1055 (2) INFORMAÇÃO PARA SEQ ID NO: 38: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 395 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 38:
Met Ser Lys Thr Cys 5 Tvr Giu Gly Asn Gly 10 His Phe Τ’*/*·· Arg Gly Lys Ala Ser Thr Aso 20 Thr Met Gly Arg Pro 25 Cys Leu Pro Tro Asn 30 Ser Ai a Thr Vai Leu 35 Gin Gin 'TV» *** His 40 Ala His Arg Ser Aso 45 Ala Leu Gin Leu Gly 50 Leu Gly Lys His Asn 55 Tvr Cys Arg Asn Pro 60 Asp Asn Arg Arg Arg 65 Pro Trp Cys Tyr Vai Gin 70 Val Gly Leu Lys 75 Pro Leu Val Gin Giu 80 Cys Met Vai His Aso 8*5 Cys Ala Asp Gly Lvs 90 Lys Pro Ser Ser Pro 95 ?ro Glu Glu Leu Lys 1Ô0 Phe Gin Cys Gly Gin 105 Lys Thr Leu Arg Pro 110 Arg Phe Lys Ile Ile 115 Gly Gly Glu Phe Thr 120 Thr Xis Glu Asn Gin 125 Pro Trp Píiô Ala Ala 130 Ile Tvr Arg Arg His 135 Arg Gly Gly Ser Val 14Ó Thr Tyr Val Cys
Giv Gly Ser Leu lie Ser Pro Cys Trp Vai lie Ser Ala Thr His Cys 145 150 155 160
83 886 ΕΡ Ο 669 394/ΡΤ 93
Phe lie Asp Tyr Pro 1S5 Lys Lys Glu Asp Tvr Ile 170 Vai Tyr Leu Glv 175 Arg Ser Arg Leu Asn 130 Ser Asn Thr Gin Glv 135 Glu Mec Lys Phe Glu Vai 190 Glu Asn ueu Ile 195 Leu His Lys Asp Tyr Ser 200 Ala Asp Thr Leu 205 Ala His His Asn Asp 210 Ile Ala1Leu Leu Lys 215 Ile Arg Ser Lys Glu 220 Gly Arg Cys Ala Gin Pro 225 Ser Arg Thr Ile 230 Gin Thr Ile Cvs Leu 235 Pro Ser Met. T/r Asn 240 Asp ?ro Gin Phe Gly 245 Thr Ser Cys Glu Ile Thr 250 Giy Phe Gly Lys 255 Glu Asn Ser Thr Asn 260 Tvr Leu Tvr Pro Glu 2S5 Gin Leu Lys Mec Thr Vai 270 Vai Lys Leu Ile 275 Ser His Arg Glu Cys Gin 230 Gin Pro His Tyr 295 Tyr Gly Ser Glu Vai 290 Thr Thr Lys MeC Leu 295 Cys Ala Ala Asp 300 Gin Trp Lys Thr Asn Ser 305 Cys Gin Gly Asn 31*0 Ser Gly Gly Pro Leu 315 Vai Cys Ser Leu Gin 320 Giy Arg Met -v- Leu 325 Gly Ile Vai Ser Tm 330 Gly Arg Giy Cvs 335 Ala Leu Lys Asp Lys 340 Pro Gly Vai Tvr Thr 345 Arg Vai Ser His Phe Leu 350 Pro Tm Ile Arg 355 Ser His yu — Lys Glu Glu 360 Asn Gly Leu Ala 355 Leu Ser Pro Vai Arg 370 Ala Phe Gly Pro Arg 375 Pro Leu Giy Giy Glv 3 80 Gly Asn Gly Asn ?he Glu Glu Ile Pro Glu Glu Tyr Leu Gin * 335 390 395 (2) INFORMAÇÃO PARA SEQ ID NO: 39: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1185 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não
83 886 ΕΡ Ο 669 394/ΡΤ 94 (ix) CARACTERÍSTICA: (A) NOME/CHAVE: CDS (Β) LOCALIZAÇÃO: 1..1185 (D) OUTRA INFORMAÇÃO: /function= "metionina N-terminal é separada proteoliticamente em E.coli" /product= "gene sintético para a proteína M19 (pSJ91)" (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 39: ATG AGC AAA ACT TGC TAC GAA GGT AAC GGT CAC TTC TAC CGT GGT AAG 43
Mec Ser Lvs Thr Cvs Tyr Glu Gly Asn Gly His Fhe Tyr Arg Gly Lys 1*5 10 15 GCT TCT ACC GAC ACC ATG GGT CGT CCG TGC CTG CCG TGG AAC TCT GCT 96
Ala Ser Thr Asp Thr Met Gly Arg Pro Cvs Leu Pro Trp Asn Ser Ala 20 25 * 30 ACC GTT CTG CAG CAG ACC TAC CAC GCT CAC CGT TCT GAT GCA TTG CAG 144
Thr Vai Leu Gin. Gin Thr Tyr His Ala His Arg Ser Asp Ala Leu Gin 35 40 45 CTG GGT CTG GGT AAA CAC AAC TAC TGC CGT AAC CCG GAC AAC CGT CGT 192
Leu Gly Leu Gly Lys His Asn Tyr Cvs Arg Asn Pro Asp Asn Arg Arg 50 * 55 o0 CGT CCG TGG TGC TAC GTT CAG GTT GGT CTG AAA CCG CTA GTT CAG GAA 240
Arg Pro Tro Cys Tyr Vai Gin Vai Gly Leu Lvs Pro Leu Vai Gin Giu 65 * 70 75 30 TGC ATG GTT CAC GAC TGC GCT 'GAC GGT AAA AAA CCG TCT TCT CCG CCG 233
Cys Mec Vai His Aso Cys Ala Aso Gly Lvs Lvs Pro Ser Ser Pro Pro 3*5 * *90 * 95 GAA GAG CTC AAA TTC CAG TGC GGT CAA AAA ACC CTA CGT CCG CGT TTT 23 6
Giu Glu Leu Lys Phe Gin Cys Gly Gin Lys Thr Leu Arg Pro Arg Pie 100 ' * 105 110 AAA ATC ATC GGT GGT GAG TTC ACC ACC ATC GAA AAC CAG CCG TGG TTC 3 34
Lys lie lie Gly Gly Glu Phe Thr Thr Ile Glu Asn Gin Pro Trp Pie 115 120 125 GCT GCT ATC TAC CGT CGT CAC CGT GGT GGT TCT GTT ACC TAC GTT TGC 432
Ala Ala Ile Tyr Arg Arg His Arg Gly Gly Ser Vai Thr Tyr Vai Cys 130 135 140 GGT GGT TCT CTG ATC TCT CCG TGC TGG GTT ATC TCT GCT ACC CAC TGC 430
Gly Gly Ser Leu Ile Ser Pro Cys Trp Vai Ile Ser Ala Thr His Cys 145 150 * 155 ISO TTC ATC GAC TAC CCG AAA AAA GAA GAC TAC ATC GTT TAC CTC GGC CGT 523
Phe Ile Aso Tyr Pro Lys Lys Glu Aso Tyr Ile Vai Tyr Leu Gly Aro 165 ‘ 170 175
TCT CGT TTA AAC TCT AAC ACC CAG GGT GAA ATG AAA TTC GAA GTT GAA 57S
Ser Arg Leu Asn Ser Asn Thr Gin Gly Glu Met Lys Phe Glu Vai Glu 130 185 190 AAC CTG ATC CTG CAC AAA GAC TAC TCT GCT GAC ACC CTG GCT CAC CAC Asn Leu Ile Leu His Lys Asp Tyr Ser Ala Aso Thr Leu Ala His His 195 * 200 ‘ 205 624 95 83 886 ΕΡ Ο 669 394/ΡΤ AAC GAC ATC GCT CTG CTA AAA ATC CGT TCT AAA GAA GGT CGT TGC GCT 672 Asn. Asp lie Ala Leu Leu Lys Ile Aro Ser Lys Glu Gly Arg Cys Ala 210 215 220 CAG CCG TCT CGT ACC ATC CAG ACC ATC TGC CTG xL. - ATG TAC AAC 720 Gin Pro Ser Arg Thr Ile Gin Thr Ile Cys Leu Pro Ser Mec A V ^ Asn 225 230 235 240 GAC CCG CAG TTC GGT ACC TCT iVJN- GAA ATC ACC GGT i‘m GGT AAA GAA 753 As? Pro Gin Phe Gly Thr Ser Cys Glu ZLâ Thr Gly Phe Gly Lvs Glu 245 250 255 AAC TCT ACC GAC TAC CTG TAC CCG GAA CAG CTG AAA ATG ACC GTT 316 Asn Ser Thr Aso Tvr Leu Tyr Pro Glu Gin Leu Lys Mec Thr Val Vai 260 265 270 AAA CTG ATC TCT CAC CGT GAA TGC CAG CAG CCG CAC TAC TAC GGT 364 Lvs Leu Ile Ser His Arg Glu Cvs Gin Gin Pro His Tyr Tyr Gly Ser 275 280 235 GAA GTT ACC ACC AAA ATG CTG TGC GCT GCT GAC CCG CAG TGG AAA ACC 912 Glu Vai Thr Thr Lys Met Leu Cys Ala Ala Asp Pro Gin Trp Lys «h·*- 290 295 300 GAC TCT TGC CAA GGT GAC TCT GGT GGT CCA CTA GTT TGC TCT CTC CAG 960 Aso Ser Cys Gin Gly Aso Ser Giy Gly Pro Leu Val Cys Ser Leu Gin 305 310 315 320 GGT CGT ATG ACC CTG ACC GGT ATT GTT fr*/**r* GGT L.<ji /-./-tfr» LjAj-x TGC GCT 1008 Gly Arg Mec Thr Leu Thr Gly Ile Vai Ser ^r? Gly Arg Glv Cys Ala 325 330 3 3 5 CTG AAA GAC AAA GGT GTT TAC ACC CGT ^jTT CAC CTG CCG 1055 Leu Lvs Asp Lys Pro Gly Vai Thr Arg Val Ser His Phe Leu 340 345 350 TGG ATC CGT TCT CAC ACC AAA GAA GAA AAC GGT CTG GCT CTG AGC CCG 1104 Trp Ile Arg Ser His Thr Lys Glu Glu Asn Gly Leu Ala Leu Ser Pro 355 360 365 GTT AAG GCT TAC GGA CCG CGG CCC- A GGT GGT GGT AAC GGT GAC 1152 Vai Lys Ala Tyr Gly Pro Arg Pro Leu Gly Gly Gly Gly Asn Giy Asp 370 375 380 TTC GAA GAA ATC : CCG GAA GAA TAC CTG CAA TAA 1135 Phe Glu Glu Ile Pro Glu Glu Tyr Leu Gin ★ 335 390 395 (2) INFORMAÇÃO PARA SEQ ID NO: 40: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 395 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 40:
Mec Ser Lys Thr Cys Tyr Glu Gly Asn Giy His Phe Tvr Arg Gly Lvs 1 5 1Ò ' is
Ala Ser Thr Asp Thr MeC Gly Arg ?ro Cys Leu Pro Trp Asn Ser Ala 20 25 30 96 83 886 ΕΡ Ο 669 394/ΡΤ
Thr Vai Leu 35 Gin Gin Thr Tyr His 40 Ala HiS Arg Ser Aso 4*5 Ala Leu Gin Leu Gly 50 Leu Gly Lys Kis Asn 55 Tyr Cys Arg Asn Pro 50 AS? Asn Arg Arg Arg 55 Pro Trp Cys Tyr Val 70 Gin Vai Gly Leu Lvs 75 Pro Leu Vai Gin Glu 80 Cvs Met Val His Asn 85 Cys Ala As? Gly Lys *90 Lys a·*-/-, . — w Ser Ser Pro 95 Glu. Glu Leu Lys 100 Phe Gin Cys Gly Gin 105 Lys Thr Leu Arg Pro 110 Arg Phe Lys Ile Ile 115 Gly Gly Glu Phe Thr 120 Thr lie Glu Asn Gin 125 Pro Tro Phe Ala Ala 13 0 Ile Tyr Arg Arg His 135 Arg Gly Gly Ser Val 140 Val Cys Glv 145 Gly Ser Leu Ile Ser 150 Pro Cys Tr? val T0 155 Ser Ala His Cvs 1*50
Phe Ile Asp Tyr Pro 155 Lys Lys Glu Asp TV27 170 Ile Val Tyr Leu Glv 175 Arg Ser Arg Leu Asn 180 Ser Asn Thr Gin Gly 135 Glu Met Lys Phe Glu 190 Val Glu Asn Leu Ile 195 Leu Kis Lys Aso Tyr 200 Ser Ala Asp Thr Leu Ala 205 His Hz.s Asn Aso 210 Ile Ala Leu Leu Lys Ile 215 Arg Ser Lvs Glu 220 Gly Arg Cys Ala Gin 225 Pro Ser Arg Thr Ile 230 Gin Thr Ile Cys Leu 235 Pro Ser Meo Τγττ Asn 240 Asp Pro Gin Phe Glv 245 Thr Ser Cys Glu T]_e 250 Thr Gly Phe Gly Lvs 255 Glu Asn Ser Thr Aso 250 Tyr Leu Tyr Pro Glu 265 Gin Leu Lys Met Thr 270 Val Vai Lys Leu Ile 275 Ser His Arg Glu Cys 280 Gin Gin Pro His Tvr Tyr 2*85 Gly Ser Glu Val 290 Thr Thr Lys Met Leu Cys 295 Ala Ala Asp Pro 300 Gin Trp Lys Thr Aso 305 Ser Cys Gin Gly Aso 310 Ser Gly Gly Pro Leu 315 Val Cys Ser Leu Gin 320 Gly Arg Met Thr Leu 325 Thr Gly Ile Val Ser 330 Trp Gly Arg Gly Cys 335 Ala Leu Lys Asp Lys 340 Pro Gly Val Tyr Thr 345 Arg Val Ser His Phe 350 Leu Pro Trp Ile Arg Ser Kis Thr Lys Glu Glu Asn Gly Leu Ala Leu Ser Pro 355 360 3S5
83 886 ΕΡ Ο 669 394/ΡΤ 97
Vai Lvs 370 Ala Tyr Gly Pro Arg 375 Pro Leu Gly Gly Giy Glv Asn Giv Aso 330 Phe 335 Giu Giu Ile Prc Glu 390 Glu Tyr Leu Gin * 395 (2) INFORMAÇÃO PARA SEQ ID NO: 41: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1185 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (ix) CARACTERÍSTICA:
(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1..1185 (D) OUTRA INFORMAÇÃO: /function= "metionina N-terminal é separada proteoliticamente em E.coli" /product= "gene sintético para a proteína M20 (pSJ92)" (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 41: ^ mr* Λ*'- AGC AAA ACT TGC TAC GAA GGT AAC GGT CAC I1' UI<Q TAC CGT GGT AAG 43 Mec Λ Ser Lys Thr Cys 5 Tyr Giu Gly Asn Gly His 1Ò Phe Tyr Arg Giy 15 Lys GCT ACC GAC ACC •K l'l<^ Aívj ·«i wVJ1A CC — TGC CTG CCG TGG AAC TCT 96 Ala Ser Thr Aso 20 Thr Mec Gly Arg Pro 25 Cys Leu Pro Tro Asn Ser 30 Ala ACC QW«'n CTG CAG CAG ACC TAC CAC GCT CAC CGT GA? GCA TTG CAG 144 • rrU·^ Vai Leu 35 Gin Gin Thr Tyr His 40 Ala His Arg Ser Aso Ala Leu 45 Gin CTG GGT CTG GGT AAA CAC AAC TAC TGC CGT AAC CCG GAC AAC CGT /*<**<n 192 Leu Gly 50 Leu Gly Lys His Asn Tyr 55 Cys Arg Asn Pro 60 Asp Asn Arg Arg CGT CCG TGG TGC TAC GTT CAG GTT GGT CTG AAA CCG CTA GTT CAG GAA 240 Arg 65 Pro Trp Cys Tyr Vai 70 Gin Vai Gly Leu Lvs 75 Pro Leu Vai Gin Glu 80 TGC ATG GTT CAC GAC TGC GCT GAC GGT AAA AAA TCT TCT CCG CCG 233 Cys Mec Vai His Aso 85 Cys Ala Asp Gly Lys Lvs 90 Pro Ser Ser Pro 95 Pro GAA GAG CTC AAA CAG TGC GGT CAA AAA ACC CTA CGT CCG CGT j^iíj Τ’ 336 Glu Glu Leu Lys Phe Gin Cys Gly Gin Lys Thr Leu Arg Pro Arg Phe· 100 105 110 AAA ATC ATC GGT GGT GAG TTC ACC ACC ATC GAA AAC CAG CCG TGG TTC Lvs lie Ile Gly Gly Giu Phe Thr Thr lie Glu Asn Gin Pro Trp Phe 115 120 125 334 98 422 83 886 ΕΡ Ο 669 394/ΡΤ GCT GCT ATC TAC CGT CGT CAC CGT GGT TCT GTT ACC TAC GTT TGC Ala Ala 130 Ile Tvr Arg Arg His 135 Arg Gly Gly Ser Vai 140 TÍ12T Tyr Vai Cys GGT TCT CTG ATC CCG TGC TGG GTT ATC *mr**r· - w - GCT ACC CAC TGC Gly 145 Gly Ser Leu Ile Ser 150 Pro Cys Tro Vai X Ls 155 Ser Ala -ον — * His Cys la 0 ATC GAC TAC CCG AAA AAA GAA GAC TAC ATC GTT TAC CTC Cjvjv— - Phe Ile Asp Tyr Pro 155 Lys Lys Glu Asp Tvr 170 Ile Vai TS/Tf Leu Gly 175 Arg
Usj L· TTA AAC TCT AAC ACC CAG GGT GAA ATG AAA TTC GAA GTT GAA 575 Ser Arg Leu Asn 180 Ser Asn Thr Gin Gly 135 Glu Met Lys Phe Glu 190 Vai Glu AAC CTG ATC CTG CAC AAA GAC TAC GCT GAC ACC CTG GCT CAC CAC 624 Asn Leu Ile 195 Leu His Lys Asp 200 Ser Ala Asp Thr Leu 205 Ala His His AAC GAC ATC GCT CTG CTA AAA ATC CGT TCT AAA GAA GGT TGC GCT 672 Asn Aso 210 Ile Ala Leu Leu Lys 215 Ile Arg Ser Lys Glu 220 Gly Arg Cys Ala CAG CCG TCT CGT ACC ATC CAG ACC ATC TGC CTG CCG TCT ATG TAC AAC 720 Gin 225 Pro Ser Arg Thr Ile 230 Gin Thr Ile Cys Leu 235 Pro Ser Met Tyr Asn 240 GAC CCG CAG TTC GGT ACC TCT GAA ATC ACC GGT Wi AAA GAA 753 Asp Pro Gin Phe Gly 245 Thr Ser Cys Glu Ile 250 Thr Gly Phe Gly Lys 255 Glu AAC TCT ACC GAC TAC CTG TAC GAA CAG CTG AAA ATG ACC Qmni - 315 Asn Ser Thr Aso 260 Tyr Leu Tyr Pro Glu 255 Gin Leu Lys Met TV!·»· 270 Val Vã— AAA CTG ATC TCT CAC CGT GAA TGC CAG CAG CCG CAC TAC TAC GGT TCT 364 Lys Leu Ile 275 Ser His Arg Glu Cvs 230 Gin Gin Pro His 285 -J— Glv Ser GAA Gii ACC ACC AAA ATG CTG TGC GCT GCT GAC CAG TGG AAA ACC 912 Glu Vai 290 Thr Thr Lys Met Leu 295 Cys Ala A* a Asp Pro 300 Gin Trp Lys TV,_ GAC TGC CAA GGT GAC TCT GGT GGT CCA CTA GTT TGC TCT CTC CAG 950 Aso 305 Ser Cys Gin'Gly Aso 310 Ser Gly Gly Pro Leu 315 Vaí Cys Ser Leu Gin 320 GGT CGT ATG ACC CTG ACC GGT ATT GTT TCT TGG GGT CGT GGT TGC GCT 1008 Gly Arg Met Thr Leu 325 Thr Gly Ile Vai Ser 330 Trp Gly Arg Gly Cys 335 Ala CTG AAA GAC AAA CCG GGT GTT TAC ACC CGT GTT CAC TTC CTG CCG 1056 Leu Lys Asp Lys 340 Pro Gly Vai Tyr Thr 345 Arg Vai Ser His Phe 350 Leu Prc TGG ATC CGT TCT CAC ACC AAA GAA GAA AAC GGT CTG GCT CTG AGC CCG 1104 Trp Ile Arg Ser 355 His Thr Lys Glu 360 Glu Asn Gly Leu Ala 365 Leu Ser Pro GTT GTT GCT TTC GGA CCG CGG CCG CTG GGT GGT GGT GGT AAC GGT GAC 1152 Vai Vai Ala Phe Gly Pro Arg Pro Leu Gly Gly Gly Gly Asn Gly Asp 370 375 380 99 83 886 ΕΡ Ο 669 394/ΡΤ TTC GAA GAA ATC CCG GAA GAA TAC CTG CAA ΤΑΑ Phe Giu Glu Ile ?ro Glu Glu Tyr Leu Gin * 385 390 * 395 (2) INFORMAÇÃO PARA SEQ ID NO: 42: (i> CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 395 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 42:
Met X Ser Lys Thr Cys 5 Tyr Glu Gly Asn Gly His 1Ò Phe Arg /"•T T vjj.y 15 Lys Ala Ser Thr Aso 20 Thr Met Gly Arc Pro 25 Cys Leu Pro Trp Asn 30 Ser Ala TV·» Vai Leu 35 Gin Gin Thr Tyr His Ala 40 His Arg Ser Aso 4*5 Ala Leu Gin Leu Gly 50 Leu Gly Lys His Asn 55 Tyr Cys Arg Asn Pro 60 Asp Asn Arg A* Arg 65 Pro Tro Cys Tyr Vai 70 Gin Vai Gly Leu Lvs 75 Pro Leu Vai Gin Glu 30 Cys Met Vai His Aso 3*5 Cys Ala Asp Gly Lvs Lys 90 Pro Ser Ser Pro 35 Glu Glu Leu Lys 100 Phe Gin Cys Glv Gin 105 Lys Thr Leu Arg Pro 110 Arg Lys Ile Ile 115 Gly Gly Glu Phe Thr Thr 120 lie Giu Asn Gin Tro "ha Ala Ala 130 Ile Tyr Arg Arg His 135 Arg Gly Gly Ser Vai 140 Thr Tyr Vai Cys Gly 145 Gly Ser Leu Ile Ser 150 Pro Cys Trp Vai lie 155 Ser Ala His Cvs 150
Phe Ile Aso Tyr Pro Lvs Lys Glu Asp Tyr Ile Vai Tyr Leu Gly Arg 165 * 170 I75
Ser Arg Leu Asn Ser Asn Thr Gin Gly Glu Met Lys Phe Glu Vai Glu 180 135 190
Asn Leu Ile Leu His Lys Aso Tyr Ser Ala Asp Thr Leu Ala His His 195 * * 200 205
Asn Aso Ile Ala Leu Leu Lys Ile Arc Ser Lys Glu Gly Arg Cys Ala 210 215 " 220
Gin Pro Ser Arg Thr Ile Gin Thr Ile Cys Leu Pro Ser Met Tyr Asn 225 230 235 240
Asp Pro Gin Phe Glv Thr Ser Cys Glu Ile Thr Gly Phe Gly Lys Glu 245 250 255
83 886 ΕΡ Ο 669 394/ΡΤ 100
Asn Ser Thr Asp 260 Tyr Leu Tyr Pro Glu 265 Gin Leu Lys Met Thr 270 Vai Vai Lys Leu Ile 275 Ser His Arg Glu Cvs 280 Gin Gin Pro His Tyr 235 Tyr Gly 5er Glu Vai 290 Thr Thr Lys Met Leu 295 Cys Ai a Ala Asp Pro 300 Gin Trp Lys Th- Asp 3 05 Ser Cys Gin Gly Aso 310 Ser Gly Gly Pro Leu 315 Vai Cys Ser Leu Gis 320 Gly Arg Met Thr Leu 325 Gly Ile Vai Ser 330 Trp Gly Arg Glv Cvs 335 Ala Leu Lys Asp Lys 340 Pro Gly Vai Tyr Thr 345 Arg Val Ser His Phe 350 Leu pr o Trp Ile Arg 355 Ser His Thr Lys Glu 360 Glu Asn Gly Leu Aj.3. 365 Leu Ser pro Vai Vai 370 Ala Phe Gly Pro Arg 375 Pro Leu Gly Gly Gly 380 Gly Asn Gly AS? Phe 385 Glu Glu Ile Pro Glu 3 90 Glu Tyr Leu Gin ir 395 (2) INFORMAÇÃO PARA SEQ ID NO: 43: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1182 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (ix) CARACTERÍSTICA:
(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1..1182 (D) OUTRA INFORMAÇÃO: /function= "metionina N-terminal é separada proteoliticamente em E.coli" /product= "gene sintético para a proteína M21 (pSJ93)" (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 43: ATG AGC AAA ACT TGC TAC GAA GGT AAC GGT CAC TTC TAC CGT GGT AAG 43
Met Ser Lys Thr Cys Tyr Glu Gly Asn Gly His Phe Tyr Arg Gly Lys
1 S 10 IS GCT TCT ACC GAC ACC ATG GGT CGT CCG TGC CTG CCG TGG AAC TCT GCT 96
Ala Ser Thr Aso Thr Met Gly Arg Pro Cys Leu Pro Trp Asn Ser Ala 20 25 30
ACC GTT CTG CAG CAG ACC TAC CAC GCT CAC CGT TCT GAT GCA TTG CAG
Thr Vai Leu Gin Gin Thr Tyr His Ala His Arg Ser Asp Ala Leu Gin 35 40 45 144 192 101 83 886 ΕΡ Ο 669 394/ΡΤ CTG GGT CTG GGT AAA CAC AAC TAC TGC CGT AAC CCG GAC AAC CGT CGT Leu Gly 50 Leu Gly Lys Kis Asn Tyr 55 Cvs Arg Asn Pro 50 Asp Asn Arg Arg CGT CCG TGG TGC TAC GTT CAG GTT GGT CTG AAA CCG Λ»'Ι|Ι CAG GAA Arg /·* “ O 2 Cys Tyr ‘VcL-L 70 Gin Val Gly Leu Lys 75 Pro Leu '/ã— Gin Glu 30 TGC ATG GTT CAC GAC TGC GCT GAC GGT AAA AAA CCG TCT CCG CCG Cys Mec Val His Aso 85 Cys Ala Asp Gly Lys 90 Lys Pro Ser Ser Pro 95 Pro 240 283 GAA GAG CTC AAA TTC CAG TGC GGT CAA AAA ACC CTA CCG CGT TTT Glu Glu Leu Lys 100 Phe Gin Cys Gly Gin 105 Lys Thr Leu Arg Pro 110 Arg Phe AAA ATC ATC GGT GGT GAG TTC ACC ACC ATC GAA AAC CAG CCG TGG 1 wmn Lys Ile Ile Gly Gly Glu 115 Phe Thr 120 Thr Ile Glu Asn Gin 125 Pro Trp Phe GCT GCT ATC TAC CGT CGT CAC CGT GGT GQT TCT ACC TAC QfWIII TGC Ala Ala Ile Tyr 13 0 Arg Arg His Arg 135 Gly Gly Ser Val 140 Thr Tyr Val Cys GGT GGT TCT CTG ATC CCG TGC TGG GTT ATC GCT ACC CAC Gly Gly Ser Leu 145 Ile Ser 150 Pro Cys Trp Val Ile 153 Ser Ala Thr His Cys 150 ATC GAC TAC CCG AAA AAA GAA GAC TAC ATC TAC CTC GGC phe Ile Asp Tyr Pro 165 Lys Lys Glu Asp Tyr 170 Ile vãl Tvr Leu Glv 175 Arg J.C.L CGT TTA AAC TCT AAC ACC CAG GGT GAA ATG AAA GAA GTT GAA Ser Arg Leu Asn 130 Ser Asn Thr Gin Gly 185 Glu Met Lys Phe Glu 190 Val Glu AAC L. - L. . w CAC AAA GAC TAC TCT GCT GAC ACC CTG GCT CAC CAC Asn Leu Ile Leu 195 His Lys Aso Tyr 200 Ser Ala Asp Thr Leu 205 Ala His His AAC GAC ATC GCT CTG CTA AAA ATC CGT iLi AAA GAA GGT CGT TGC GCT Asn Aso Ile Ala 210 Leu Leu Lys Ile Arg 215 Ser Lys Glu 220 Gly Arg Cys Ala CAG CCG TCT CGT ACC ATC CAG ACC ATC TGC CTG CCG ATG TAC AAC Gin 225 Pro Ser Arg Thr Ile 230 Gin Thr Ile Cys Leu 235 Pro Ser Met Tyr Asn 240 GAC CCG CAG TTC GGT ACC TCT TGC GAA ATC ACC GGT TTC GGT AAA GAA Asp Prc Gin Phe Gly Thr 245 Ser Cys Glu Ile 250 Thr Gly Phe Gly Lys 255 Glu AAC TCT ACC GAC TAC CTG TAC CCG GAA CAG CTG AAA ATG ACC GTT GTT Asn Ser Thr Asp Tyr Leu Tyr Pro Glu Gin Leu Lys Met Thr Vai Val 2S0 265 270 33 5 334 432 480 523 AAA CTG ATC TCT CAC CGT GAA TGC CAG CAG CCG CAC TAC TAC GGT TCT Lys Leu Ile Ser His Arg Glu Cys Gin Gin Pro His Tyr Tyr Gly Ser 275 280 285 GAA GTT ACC ACC AAA ATG CTG TGC GCT GCT GAC CCG CAG TGG AAA ACC Glu Vai Thr Thr Lys Met Leu Cvs Ala Ala Aso Pro Gin. Trp Lys Tkr 290 295 * * 300 524 572 720 768 816 864. 912 102 83 886 ΕΡ Ο 669 394/ΡΤ GAC TCT TGC CAA GGT GAC TCT GGT GGT CCA CTA GTT TGC CTC CAG 960 Asp Ser Cys Gin Gly Aso Ser Gly Gly p^-a Leu Vai Cys Ser Leu Gin 305 310 315 320 . GGT ATG ACC CTG ACC GGT ATT GTT TCT TGG GGT f^r*· GGT TGC GCT 1003 Glv A-TÇj Met Thr Leu Thr Gly lie Vai Ser Trp Gly Arg Gly Cys Ala 325 330 335 CTG AAA GAC AAA CCG GTT TAC ACC CGT GTT CAC TTC CTG CCG 10 Ξ o Leu Lvs ASO Lys Pro Gly Vai Tyr Thr Arg Vai Ser His Phe Leu Pro 340 345 350 TGG ATC CGT TCT CAC ACC AAA GAA GAA AAC GGT CTG GCT CTG AGC 1104 Tro lie Arg Ser His Thr Lys Glu Glu Asn Gly Leu Ala Leu Ser Pro 355 360 365 GTT l-w'U GCT TTC CCG CG G CCG CTG GGT GGT GGT AAC GGT GAC rp»r*£ 1152 Vai Arg Ala Phe Pro Arg Pro Leu Gly Gly Gly Glv Asn Gly Asp 370 375 3 80 GAA GAA ATC CCG GAA GAA TAC CTG CAA TAA 1132 Glu Giu Ile O-i-o Glu Glu Tyr Leu Gin ★ 385 390 (2) INFORMAÇÃO PARA SEQ ID NO: 44: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 394 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 44:
Met Ser Lys Thr Cys Tyr Giu Gly Asn Gly His Phe Tyr Arg Giv Lys 15 1Ô 15
Ala Ser Thr Aso Thr Met Gly Arcr Pro Cvs Leu Pro Tro Asn Ser Ala 20 25 * 30
Thr Vai Leu Gin Gin Thr Tyr Kis Ala His Arg Ser Asp Ala Leu Gin 35 * 40 45
Leu Glv Leu Gly Lys His Asn Tvr Cys Arg Asn Pro Asp Asn Arg Arg 50 55 60
Arg Pro Trp Cys Tyr Vai Gin Vai Gly Leu Lys Pro Leu Vai Gin Glu 65 70 75 80
Cys Met Vai His Aso Cvs Ala Aso Gly Lys Lys Pro Ser Ser Pro Pro 85 90 95
Glu Glu Leu Lys Phe Gin Cys Gly Gin Lys Thr Leu Arg Pro Arg Phe 100 105 110
Lvs Ile Ile Gly Gly Glu Phe Thr Thr Ile Glu Asn Gin Pro Trp Phe 115 120 125
Ala Ala Ile Tyr Arg Arg His Arg Gly Gly Ser Vai Thr Tyr Vai Cys 130 135 140
Glv Gly Ser Leu Ile Ser Pro Cys Tro Vai Ile Ser Ala Thr His Cys
145 ISO ‘ 155 ISO 83 886 ΕΡ Ο 669 394/ΡΤ 103
Phe Ha xyr Pro Lvs Lys Glu 165
Ser Arg Leu Asn Ser Asn Thr Gin 130
Asn Leu lia Leu His Lys Asp Tyr 195 * 200
Asn Asd lie Ala Leu Leu Lys Ile 210 215
Gin ?ro Ser Arg Thr Ile Gin Thr 225 230
Asp Pro Gin Phe Gly Thr Ser Cys 245
Asn Ser Thr Aso Tyr Leu Tyr Pro 260
Lys Leu Ile Ser His Arg Glu Cys 275 230
Glu Vai Thr Thr Lys Met Leu Cvs 290 295
Asp Ser Cvs Gin Glv Aso Ser Glv 305 ' ' 31Õ
Gly Arcr Mec Thr Leu Thr Glv Ile 32 =
Leu Lys Aso Lys Pro Glv Vai Tvr 340
Trp Ile Arg Ser His Thr Lvs Glu 355 * 360
Vai Arg Ala Phe Pro Arg Pro Leu 370 " 375
Glu Glu lie Pro Glu Glu Tyr Leu 335 390 (2) INFORMAÇÃO PARA SEQ ID NO: 45: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1182 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não
Asp Tyr Ile 170 Vai Tyr Leu Glv 175 Glv 135 Glu Met Lys Phe Glu 190 Vai Glu Ser Ala Asp Leu 205 Ala His His Arg Ser Lys Glu 220 Gly Arg Cys Ala Ile Cys Leu 235 Pro Ser Met 'TV/**· Asn 240 Glu Ile Thr 250 Gly Phe Gly Lvs 255 Glu Glu 265 Gin Leu Lys Mec Thr 270 Vai Vai Gin Gin Pro His Tvr 235 Gly Ser Ala Ala Asp Pro 300 Gin Trp Lys Thr Gly Pro Leu 315 Vai Cys Ser Leu Gin 320 Vai Ser Trp 330 Gly Arg Gly Cvs 335 Ala 345 Arg Vai Ser His Phe 350 Leu Pro Glu Asn Gly Leu A—3. 365 Leu Ser Pro Gly Gin Gly Gly ★ Gly 330 Asn Gly Asp Phe 83 886 ΕΡ Ο 669 394/ΡΤ 104 (ix) CARACTERÍSTICA: (A) NOME/CHAVE: CDS (Β) LOCALIZAÇÃO: 1..1182 (D) OUTRA INFORMAÇÃO: /function= "metionina N-terminal é proteoliticamente em E.coli" /product= "gene sintético para a proteína M22 (pSJ94)" (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 45:
separada 43 96 144 192 240 2S8 336 334 432 430 523 576 ATG AGC AAA ACT TGC TAC GAA GGT AAC GGT CAC « ww TAC CGT GGT AAG Met •1 Ser Lvs Thr Cys Tvr 5 Glu Gly Asn Gly 10 His Phe Tyr Arg Gly Lys GCT ACC GAC ACC ATG GGT CGT CCG TGC CTG TGG AAC 'Γξ'Γ Ala Ser Thr Aso 20 Thr Met Gly Arg Pro 25 Cys Leu Pro Tro Asn 30 Ser Ala ACC GTT CTG CAG CAG ACC TAC CAC GCT CAC CGT GAT TTG CAG Thr Vai Leu 35 Gin Gin Thr Tyr His Ala 40 His Arg Ser ASO 45 Ala Leu Gin CTG GGT CTG GGT AAA CAC AAC TAC TGC lGi AAC GAC AAC Λ/'·"' /*^/^*t* ± WvJ A Leu Glv 50 Leu Gly Lys Kis Asn 55 Tyr Cys Arg Asn Pro 60 Asp Asn Arg Arg CGT CCG TGG TGC TAC GTT CAG GTT GGT CTG AAA CCG CTA Η* Π Vj A, - CAG GAA Arg 65 Pro Trp Cys Tyr Vai 70 Gin Vai Gly Leu Lys 75 Pro Leu Vai Gin Glu 30 Λ GTT CAC GAC TGC GCT GAC GGT AAA AAA CCG TCT Cys Met Vai His Asn Cvs 85 Ala Asp Gly Lys 90 Lys Pro Ser Ser Pro Pro 95 GAA GAG CTC AAA TTC CAG TGC GGT CAA AAA ACC CTA CCG J» A i i Glu Glu Leu Lys 100 Phe Gin Cys Gly Gin 105 Lys Thr Leu Arg Pro 110 Arg Phe AAA ATC ATC GGT GGT GAG ACC ACC * AlV. GAA AAC CAG CCG TGG TTC Lvs Ile Ile 115 Gly Gly Glu Phe Thr Thr 120 Ile Glu Asn Gin 125 Pro Tro Phe GCT GCT ATC TAC CGT CGT CAC CGT GGT GGT GTT ACC TAC GTT TGC Ala Ala 130 Ile Tyr Arg Arg His 135 Arg Gly Gly Ser Vai 140 Thr Tyr Vai Cys GGT GGT tct CTG ATC TCT CCG TGC TGG GTT ATC TCT GCT ACC CAC TGC Gly Gly Ser 145 Leu Ile Ser 150 Pro Cys Trp Vai Ile 155 Ser Ala Thr His Cys 160 TTC ATC GAC TAC CCG AAA AAA GAA GAC TAC ATC GTT TAC CTC GGC CGT Phe Ile Asp Tyr Pro Lys 165 Lys Glu Asp Tyr 170 Ile Vai Tyr Leu Gly Arg 175 CGT ΤΤΑ AAC TCT AAC ACC CAG GGT GAA ATG AAA TTC GAA GTT GAA Ser Arg Leu Asn 130 Ser Asn Thr Gin Gly 185 Glu Met Lys Phe Glu 190 Vai Glu AAC CTG ATC CTG CAC AAA GAC TAC TCT GCT GAC ACC CTG GCT CAC CAC Asn Leu Ile Leu His Lys Asp Tyr Ser Ala Asp Thr Leu , Ala His His 195 200 205 624 105 83 886 ΕΡ Ο 669 394/ΡΤ AAC GAC ATC GCT CTG CTA AAA ATC CGT TCT AAA GAA GGT CGT TGC GCT 672 Asn. Asp 11 e Al a Leu Leu Lys Ile Arg Ser Lys Glu Gly Arg Cys Ala 21*0 215 220 CAG CCG TCT CGT ACC ATC CAG ACC ATC TGC CTG CCG ATG TAC AAC 720 Gin Pro Ser Arg Thr Ile Gin Thr Ile Cvs Leu Pro Ser Met Tyr Asn 225 230 235 240 GAC CCG CAG TTC GGT ACC TCT TGC GAA ATC ACC GGT TTC GGT AAA GAA 753 Asp Pro Gin Phe Gly Thr Ser Cys Glu Ile Thr Gly Phe Giv Lys Glu 245 250 255 AAC TCT ACC GAC TAC CTG TAC CCG GAA CAG CTG AAA ATG ACC GTT GTT 315 Asn Ser Thr Asp Tyr Leu Tyr Pro Glu Gin Leu Lys Met Thr Vai Vai 260 265 270 AAA CTG ATC TCT CAC CGT GAA TGC CAG CAG CCG CAC TAC TAC GGT TCT 354 Lys Leu ' Ile Ser His Arg Glu Cys Gin Gin Pro His Tyr Tyr Gly Ser 275 230 235 GAA GTT ACC ACC AAA ATG CTG TGC GCT GCT GAC CAG TGG AAA ACC 912 Glu Vai Thr Thr Lys Met Leu Cys Ala Ala Asp Pro Gin Trp Lys TV··*. 290 295 200 GAC ivju UaA GGT GAC GGT GGT CCA CTA GTT TGC CAG 960 Asn Ser Cys Gin Gly Asp Ser Gly Gly Pro Leu Vai Cvs Ser Leu Gin 305 310 215 320 GGT CGT ATG ACC Liu ACC GGT ATT GTT TCT TGG /•í MM CGT GGT TGC GCT 1008 Gly Arg Met Thr Leu Thr Gly Ile Vai Ser Tro Gly Arg Gly Cys Ala 325 230 235 AAA GAC AAA CCG GGT GTT TAC ACC CGT GTT • WX CAC ttq (yr*G CCG 1056 Leu Lys Asp Lys Pro Gly Vai Tvtt Thr Arg Vai Ser His Phe Leu Pro 340 345 350 ATC CAC ACC AAA GAA GAA AAC GGT CTG GCT CTG AGC CCG 1104 Τγό X Le Arg Ser His Thr Lys Glu Glu Asn Gly Leu Ala Leu Ser Pro 355 360 365 AAA GCT TAC CCG CGG CCG CTG GGT GGT GGT AAC GGT GAC 1152 Vai Lvs Ala Tyr Pro Arg Pro Leu Gly Gly Gly Giv Asn Gly Asp ?«e 370 375 3 30 GAA GAA ATC CCG GAA GAA . TAC CTG CAA TAA 1132 Glu Glu Ile Pro Glu Glu Tyr Leu Gin * 335 390 (2) INFORMAÇÃO PARA SEQ ID NO: 46: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 394 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 46:
Met Ser Lys Thr Cys Tvr Glu Gly Asn Gly His Phe Tyr Arcr Gly Lvs 1 5 10 15
Ser Ala
Ala Ser Thr Asp Thr Met Gly Arg Pro Cys Leu Pro Tro Asn. 20 25 * 30 106 83 886 ΕΡ Ο 669 394/ΡΤ
Thr ' Vai Leu < 35 Gin Gin Thr Tyr His 40 Ala His Arg Ser Aso 45 Ala Leu Gin Leu Glv 50 Leu Gly Lys His Asn 55 Cys Arg Asn Pro Aso 60 Asn Arg Arg Arg 65 ?ro Tro Cys Tvr Vai 70 Gin Vai Glv Leu Lys 75 Pro Leu Vai Glu 80 Cys Met Vai His Asd Cys 8 5 Ala Asp Glv Lvs Lys 90 Pro Ser Ser Pro 95 Pro Glu Glu Leu Lys 100 Phe Gin Cys Gly Gin Lys Thr 105 Leu Arg Pro 110 Arg Phe Lys rle Ile 115 Gly Gly Glu Phe Thr 120 Thr Ile Glu Asn Gin 125 Pro Tro Phe Ala Ala 130 Ile Tyr Arg Arg His 135 Arg Gly Gly Ser Vai Thr 140 Vai Cys Glv 145 Gly Ser Leu Ile Ser 150 Pro Cys Tro Vai Ile 155 Ser Ala Thr His Cys 150 Phe lie Asp Tyr Pro Lys 165 Lys Glu Aso Tyr Ile 170 Vai Tyr Leu Gly 175 Arg Ser Arg Leu Asn 180 Ser Asn Thr Gin Glv Glu Mec 185 Lys Phe Glu 190 Vai Glu Asn Leu Ile 195 Leu His Lys Asp Tvr 200 Ser Ala Asp Thr Leu 205 Ala His His Asn Aso 210 Ile Ala Leu Leu Lys 215 Ile Arg Ser Lys Glu Gly 220 Arg Cys Ala Gin 225 Pro Ser Arg Thr Ile 230 Gin Ile Cys Leu 235 Pro Ser Met Asn 240 Asp ?ro Gin Phe Gly Thr 245 Ser Cys Glu Ile Thr 250 Gly Phe Gly Lvs 255 Glu Asa Ser Thr Aso 250 Tyr Leu Tyr Pro Glu Gin Leu 255 Lys Met Thr 270 val Val Lys Leu Ile 275 Ser His Arg Glu Cys 280 Gin Gin Pro His Tyr Tyr 285 Gly Ser Glu Vai 290 Thr Thr Lys Met Leu Cys 295 Ala Ala Asp Pro Gin Trp 300 Lys Thr Aso 305 Ser Cys Gin Gly Aso 310 Ser Gly Glv Pro Leu 315 Vai Cys Ser Leu Gin 320 Gly Arg Met Thr Leu Thr Gly 325 lie Vai Ser Trp Gly Arg Gly Cys 330 335 Ala Leu Lys Asp Lys 340 Pro Gly Vai Tyr Thr Arg Vai 345 Ser His Phe 350 Leu Pro Trp Ile Arg 355 Ser His Thr Lys Glu 360 Glu Asn Gly Leu Ala 365 Leu Ser Pro 107 83 886 ΕΡ Ο 669 394/ΡΤ
Vai Lvs 3 70 Ala Tyr <a »1 o Arg Pro 375 Leu Gly Gly Gly Gly Asn Glv Aso Pb® 380 Glu 335 Glu Glu 390 Tyr Leu Gin. * (2) INFORMAÇÃO PARA SEQ ID NO: 47: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1182 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (ix) CARACTERÍSTICA:
(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1..1182 (D) OUTRA INFORMAÇÃO: /function= "metionina N-terminal é separada proteoliticamente em E.coli" /product= "gene sintético para a proteína M23 (pSJ95)" (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 47: ATG AGC AAA ACT TGC TAC GAA GGT AAC GGT CAC TTC TAC L· AAG 4 3 Mec Ser Lys Thr Cys 5 Tyr Glu Gly Asn Glv 1Õ Jií.3 Phe Tyr Arg vi iV 15 Lys GCT TCT ACC GAC ACC GGT CGT CCG TGC /-»<-»<" TGG AAC Λ^ΙΙΙΙ .IV- i CV- 95 Ala Ssr Thr Asn 20 Thr Mar Glv Arg p-V-Q 25 Cys Leu Pro Tm Asn 30 Côr Ala ACC GTT CTG CAG CAG ACC TAC CAC GCT CAC CGT TCT GAT GCA TTG CAG Thr Vai Leu Gin 35 Gin Thr Tyr His 40 Ala His Arg Ser Asn 45. Ala Leu Gin GGT CTG GGT AAA CAC AAC TAC TGC CGT AAC CCG GAC AAC CGT CGT 132 Leu Gly Leu Gly 50 Lys His Asn 55 Tyr Cys Arg Asn Pro so Asp Asn Arg Arg CGT CCG TGG TGC TAC GTT CAG t «M l· H (jli GGT CTG AAA CCG CTA GTT CAG GAA 240 Arg S5 Pro Trp Cys Tyr Vai 70 Gin Val Gly Leu Lys 75 Pro Leu Val Gin Glu 30 TGC ATG GTT CAC GAC TGC GCT GAC GGT AAA AAA CCG TCT TCT CCG CCG 233 Cys Met Vai His Asn 35 Cys Ala Asp Gly Lys 90 Lys Pro Ser Ser Pro 95 Pro GAA GAG CTC AAA TTC CAG TGC GGT CAA AAA ACC CTA CGT CCG CGT 1 | H | 1 335. Glu Glu Leu Lys 100 Phe Gin Cys Glv Gin 105 Lys Thr Leu Arg Pro 110 Arg Phe AAA ATC ATC GGT GGT GAG TTC ACC ACC ATC GAA AAC CAG CCG TGG 334 Lvs Ile Ile Gly 115 Gly Glu Phe Thr 120 Thr Ile Glu Asn Gin 125 Pro Trp Phe 108 83 886 ΕΡ Ο 669 394/ΡΤ GCT GCT ATC TAC CGT CGT CAC CGT GGT GGT TCT GTT ACC TAC GTT TGC '432 Ala Axã Ile Tyr Arg Arg His Arg Gxy Gly Ser Val Thr Tyr Val Cys 13 0 135 140 GGT GGT TCT CTG ATC TCT CCG TGC TGG GTT ATC (jV- X ACC CAC TGC 430 Gly Gly Ser Leu Ile Ser Pro Cys Trp Val Ile Ser Ala Thr His Cys 145 150 155 ISO T7C ATC GAC TAC Lwu AAA AAA GAA GAC TAC ATC GTT TAC CTC GGC CGT 523 Phe Ile Asp Tyr Prc Lvs Lys Glu Asp Tyr Ile Val Leu Gly Arg 165 170 175 TCT CGT TTA AAC AAC ACC CAG GGT GAA ATG AAA TTC GAA GTT GAA 576 Ser Arg Leu Asn Ser Asn Thr Gin Gly Glu Met Lys Phe Glu Val Glu ião 135 190 AAC CTG ATC CTG CAC AAA GAC TAC GCT GAC ACC CTG GCT CAC CAC 524 Asn Leu Ile Leu His Lys Asn Tyr Ser A-.cl Asp Thr Leu Ala His His 195 200 205 AAC GAC ATC GCT CTG CTA AAA ATC CGT AAA GAA vovjI TGC GCT 572 Asn Asn Ile Ala Leu Leu Lys Ile Arg Ser Lys Glu Gly Arg Cys Axa 210 215 220 CAG CCG tct* CGT ACC ATC CAG ACC ATC TGC CTG CCG ATG TAC AAC 720 Gin Pro Ser Arg Thr Ile Gin Thr Ile Cys Leu Pro Ser Met Tyr Asn 225 230 235 240 GAC CCG CAG rV9TQ GGT ACC TCT TGC GAA ATC ACC GGT TTC GGT AAA GAA 753 Asp Pro Gin Phe Glv Thr Ser Cys Glu Ile Thr Gly Phe Gly Lys Glu 245 250 255 AAC ACC GAC TAC CTG TAC CCG GAA CAG CTG AAA ATG ACC GTT GTT 315 Asn Ser Thr Asn Tyr Leu Tyr Pro Glu Gin Leu Lys Met Thr Val \ CÍ-. 250 255 270 AAA ATC CAC CGT GAA TGC CAG CAG V»wVJ CAC TAC TAC GGT J.U. 364 Lys Leu Ile Ser Hi.s Arg Glu Cys Gin Gin ?2TO His Tyr Gly Çôr 275 230 235 GAA ^»1» It H ACC ACC AAA ATG CTG TGC GCT GCT GAC CCG CAG TGG AAA ACC 912 Glu Vai Thr Thr Lys Met Leu Cvs Ala Ala Asp Pro Gin Tro Lys Thr 290 295 300 GAC TCT TGC CAA GGT GAC TCT GGT GGT CCA CTA TGC TCT CTC CAG 950 Asn Ser Cys Gin Gly Asp Ser Gly Gly Pro Leu Val Cys Ser Leu Gin 305 310 315 320 GGT CGT ATG ACC CTG ACC GGT ATT GTT TCT TGG GGT CGT GGT TGC GCT 1003 Gly Arg Met Thr Leu Thr Gly Ile Val Ser Trp Gly Arg Gly Cys Ala 325 330 335 CTG AAA GAC AAA CCG GGT GTT TAC ACC CGT GTT TCT CAC TTC CTG Lxc 1055 Leu Lys Asp Lys Pro Gly Val Tyr Thr Arg Val Ser His Phe Leu Pro 340 345 350 TGG ATC CGT TCT CAC ACC AAA GAA GAA AAC GGT CTG GCT CTG AGC CCG 1104 Trp Ile Arg Ser His Thr Lvs Glu Glu Asn Gly Leu Ala Leu Ser Pro 355 350 365 1 GTT GCT TTC CCG CGG CCG CTG GGT 1 GGT GGT 1 GGT AAC GGT GAC TTC 1152 Val Val Ala . Phe Pro Arg Pro Leu Gly Gly Gly Gly Asn Gly Asp Phe 370 375 380 109 83 886 ΕΡ Ο 669 394/ΡΤ GAA GAA ATC CCG GAA GAA TAC CTG CAA ΤΑΑ Giu GIu lie Pro Glu Glu Tvr Leu Gin * 335 390 (2) INFORMAÇÃO PARA SEQ ID NO: 48: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 394 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 48:
Me- Ser Lvs Thr Cys Tyr Glu Gly Asn Gly His Phe Tyr Arg Glv Lys 1 5 * 10 -5
Ala Ser Thr Aso Thr Mec Glv Ar~ ?ro Cvs Leu Pro Trp Asn. Ser Ala 20 25 30
Thr Vai Leu Gin Gin Thr Tyr His Ala His Arg Ser Asp Ala Leu Gin 35 * 40 45
Leu Gly Leu Gly Lys His Asn Tyr Cys Arg Asn Pro Asp Asn Arg Arg 50 * 55 50
Arg Pro Trp Cys Tyr Vai Gin Vai Gly Leu Lys Pro Leu Vai Gin Glu 55 ' * * 70 75 30
Cvs Mec Vai His Aso Cvs Ala Aso Glv Lvs Lys Pro Ser Ser Pro Pro 85 90 35
Glu Glu Leu Lys Phe Gin Cys Glv Gin Lys Thr Leu Arg Pro Arg Phe 100 105 Í10
Lys lie Ile Gly Gly Glu Phe Thr Thr lie Giu Asn Gin Pro Trp Phe 115 120 125
Ala Ala Ile Tyr Arg Arg His Arg Gly Gly Ser Vai Thr Tyr Vai Cys 130 135 “ * 140 C-ly Gly Ser Leu Ile Ser Pro Cys Trp Vai Ile Ser Ala Thr His Cys
145 150 155 ISO
Phe Ile Aso Tvr Pro Lys Lys Glu Asd Tyr Ile Vai Tyr Leu Gly Arg 1S5 ‘ 170 175
Ser Arg Leu Asn Ser Asn Thr Gin Gly Glu Met Lys Phe Glu Vai Glu 180 18*5 190
Asn Leu Ile Leu His Lys Asp Tyr Ser Ala Asp Thr Leu Ala His His 195 200 205
Asn Aso Ile Ala Leu Leu Lys Ile Arg Ser Lys Glu Gly Arg Cys Ala 210 215 220
Gin Pro Ser Arg Thr Ile Gin Thr Ile Cys Leu Pro Ser Met Tyr Asn 225 230 235 240
Aso Pro Gin Phe Gly Thr Ser Cys Glu Ile Thr Gly Phe Gly Lys Glu 245 250 255
Asn Ser Thr Asp 2 6*0 Tyr Leu Tyr Pro Glu 265 Gin Leu Lys Met Thr 270 Vai Vai Lys Leu Ile 275 Ser His Arg Glu Cvs 230 Gin Gin Pro His T/r 235 T/r Gly Ser Glu Vai Thr 290 Thr Lys Met Leu 295 Cys Ala Ala Asp Pro 300 Gin Tm _ys Aso 305 Ser Cys Gin Gly Aso 310 Ser Gly Gly Pro Leu 315 Vai Cys Ser Leu Gin 320 Gly Arg Met Thr Leu 325 Thr Gly Ile Vai Ser 330 Tm Gly Arg Gly Cys 335 Ala Leu Lys Asp Lys 340 Pro Gly Vai Thr 345 Arg Vai Ser His Phe 350 Leu Trp Ile Arg 355 Ser His Thr Lys Glu 3 50 Glu Asn C-ly Leu Aj.£L 365 Leu Ser Pro Vai Vai Ala 370 Phe Pro Arg Pro 375 Leu Gly Gly Gly Gly 330 Asn Gly Asp Phe Glu Glu Ile Pro Glu Glu Tyr Leu Gin ★ 335 390 (2) INFORMAÇÃO PARA SEQ ID NO: 49: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 63 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descricão: /desc = "ADN sintético; sequência nucleotídica para o oligo 0105” (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 49 TATGAGCAAA ACTTGCTACG AAGGTAACGG T CACTT CTAC CGTGGTAAGG CTTCTACCGA 60 CAC 63 (2) INFORMAÇÃO PARA SEQ ID NO: 50: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 65 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição: /desc = "ADN sintético; sequência nucleotídica para o oliao 0106" a
83 886 ΕΡ Ο 669 394/ΡΤ 111 (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não xi) Descrição da sequência: SEQ ID NO: 50: CATGGTGTCG GTAGAAGCCT TACCACGGTA GAAGTGACCG TTACCTTCGT AGCAAGTTTT 60 GCTCA 65 (2) INFORMAÇÃO PARA SEQ ID NO: 51: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 83 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descricão: /desc = "ADN sintético; sequência nucleotídica para o oligo 0220" (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (xi) Descrição da sequência: SEQ ID NO: 51: CGGTTAAGGC TTTCCCGAGG CCTGGTGGTG GTGGTAACGG TGACTTCGAA GAAATCCCGG 60 AAGAGTACCT GTGATAGGAT CAA 83 (2) INFORMAÇÃO PARA SEQ ID NO: 52: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 91 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição: /desc = "ADN sintético; sequência nucleotídica para o oligo 0221" (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (xi) Descrição da sequência: SEQ ID NO: 52: CTAGTTGATC CTATCACAGG TACTCTTCCG GGATTTCTTC GAAGTCACCG TTACCACCAC 60 CAC CAGGCCT CGGGAAAGCC TTAACCGGGC T 91 (2) INFORMAÇÃO PARA SEQ ID NO: 53: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 101 pares de bases 83 886 ΕΡ Ο 669 394/ΡΤ 112
(Β) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição: /desc = "ADN sintético; sequência nucleotídica para o oligo 0222" (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (xi) Descrição da sequência: SEQ ID NO: 53: CGCCGAGCCC GCCGAGCCCG CCGGGTGGTT TCCCGAGGCC TGGTGGTGGT GGTAACGGTG 60 ACTTCGAAGA AATCCCGGAA GAGTACCTGT GATAGGATCA A 101 (2) INFORMAÇÃO PARA SEQ ID NO: 54: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 109 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição: /desc = "ADN sintético; sequência nucleotídica para o oligo 0223" (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (xi) Descrição da sequência: SEQ ID NO: 54: CTAGTTGATC CTATCACAGG TACTCTTCCG GGATTTCTTC GAAGTCACCG TTACCACCAC 60 CACCAGGCCT CGGGAAACCA CCCGGCGGGC TCGGCGGGCT CGGCGGGCT 109 (2) INFORMAÇÃO PARA SEQ ID NO: 55: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 83 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição: /desc = "ADN sintético; sequência nucleotídica para o oligo 0224" (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (xi) Descrição da sequência: SEQ ID NO: 55:
CGCCGGGTGG TTTCCCGAGG CCTGGTGGTG GTGGTAACGG TGACTTCGAA GAAATCCCGG 60 AAGAGTACCT GTGATAGGAT CAA 83 (2) INFORMAÇÃO PARA SEQ ID NO: 56: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 91 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição: /desc = "ADN sintético; sequência nucleotídica para o oligo 0225" (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (xi) Descrição da sequência: SEQ ID NO: 56: CTAGTTGATC CTATCACAGG TACTCTTCCG GGATTTCTTC GAAGTCACCG TTACCACCAC 60 CACCAGGCCT CGGGAAACCA CCCGGCGGGC T 91 (2) INFORMAÇÃO PARA SEQ ID NO: 57: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 104 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição: /desc = "ADN sintético; sequência nucleotídica para o oligo 0226" (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não 114 83 886 ΕΡ Ο 669 394/ΡΤ (xi) Descrição da sequência: SEQ ID NO: 57: CGCCGAGCCC GCCGAGCCCG CCGGGTGGTT TCGGTCCGAG GCCTGGTGGT GGTGGTAACG 60 GTGACTTCGA AGAAATCCCG GAAGAGTACC TGTGATAGGA TCAA 104 (2) INFORMAÇÃO PARA SEQ ID NO: 58: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 11 2 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição: /desc = "ADN sintético; sequência nucleotídica para o oligo 0227” (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (xi) Descrição da sequência: SEQ ID NO: 58: CTAGTTGATC CTATCACAGG TACTCTTCCG GGATTTCTTC GAAGTCACCG TTACCACCAC 60 CACCAGGCCT CGGACCGAAA CCACCCGGCG GGCTCGGCGG GCTCGGCGGG CT 112 (2) INFORMAÇÃO PARA SEQ ID NO: 59: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 58 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição: /desc = "ADN sintético; sequência nucleotídica para o oligo 0265" (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não 83 886 ΕΡ Ο 669 394/ΡΤ 115
(xi) Descrição da sequência: SEQ ID NO: 59: CACCCGGCGG AGACGGCGGG CTCAGAGCCA GACCGTTTTC TTCTTTGGTG TGAGAACG 58 (2) INFORMAÇÃO PARA SEQ ID NO: 60: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 58 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição: /desc = "ADN sintético; sequência nucleotídica para o oligo 0281" (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (xi) Descrição da sequência: SEQ ID NO: 60: CGTCCGGGTG GTGGTGGTAA CGGTGACTTC GAAGAAATCC CGGAAGAATA CCTGTAAG 58 (2) INFORMAÇÃO PARA SEQ ID NO: 61: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 70 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição: /desc = "ADN sintético; sequência nucleotídica para o oligo 0282” (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (xi) Descrição da sequência: SEQ ID NO: 61: 60 70
GATCCGTTCT CACACCAAAG AAGAAAACGG TCTGGCTCTG AGCCCGCCGT CTCCGCCGGG TGGTTTCCCG 83 886 ΕΡ Ο 669 394/ΡΤ 116
(2) INFORMAÇÃO PARA SEQ ID NO: 62: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 70 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição: /desc = "ADN sintético; sequência nucleotídica para o oligo 0283" (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (xi) Descrição da sequência: SEQ ID NO: 62: CTAGCTTACA GGTATTCTTC CGGGATTTCT TCGAAGTCAC CGTTACCACC ACCACCCGGA 60 CGCGGGAAAC 70 (2) INFORMAÇÃO PARA SEQ ID NO: 63: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 30 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição: /desc = "ADN sintético; sequência nucleotídica para o oligo 0329" (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (xi) Descrição da sequência: SEQ ID NO: 63: 30
AAGAAATCCC GGAAGAATAC CTGCAATAAG 117 83 886 ΕΡ Ο 669 394/ΡΤ (2) INFORMAÇÃO PARA SEQ ID NO: 64: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 54 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição: /desc = "ADN sintético; sequência nucleotídica para o oligo 0330" (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (xi) Descrição da sequência: SEQ ID NO: 64: CGGTTAAGGC TTGGGGACCG CGGCCGCTGG GTGGTGGTGG TAACGGTGAC TTCG 54 (2) INFORMAÇÃO PARA SEQ ID NO: 65: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 42 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição: /desc = "ADN sintético; sequência nucleotídica para o oligo 0331" (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (xi) Descrição da sequência: SEQ ID NO: 65: ACCACCACCC AGCGGCCGCG GTCCCCAAGC CTTAACCGGG CT 42 (2) INFORMAÇÃO PARA SEQ ID NO: 66: (i) CARACTERÍSTICAS DA SEQUÊNCIA:
(A) COMPRIMENTO: 50 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição: /desc = "ADN sintético; sequência nucleotídica para o oligo 0332" (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (xi) Descrição da sequência: SEQ ID NO: 66: CTAGCTTATT GCAGGTATTC TTCCGGGATT TCTTCGAAGT CACCGTTACC 50 (2) INFORMAÇÃO PARA SEQ ID NO: 67: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 21 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição; /desc = "ADN sintético; sequência nucleotídica para o oligo 0333” (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (xi) Descrição da sequência: SEQ ID NO: 67: CGGTTAAGGC TTTCGGACCG C 21 (2) INFORMAÇÃO PARA SEQ ID NO: 68: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 29 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição: /desc = "ADN sintético; sequência nucleotídica para o oligo 0334" (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (xi) Descrição da sequência: SEQ ID NO: 68: GGCCGCGGTC CGAAAGCCTT AACCGGGCT 29 (2) INFORMAÇÃO PARA SEQ ID NO: 69: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 21 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição: /desc = "ADN sintético; sequência nucleotídica para o oligo 0335" (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (xi) Descrição da sequência: SEQ ID NO: 69: CGGTTCGGGC TTTCGGTCCG C 21 (2) INFORMAÇÃO PARA SEQ ID NO: 70: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 29 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição: /desc = "ADN sintético; sequência nucleotídica para o oligo 0336"
83 886 ΕΡ Ο 669 394/ΡΤ 121
(χί) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 72: 29
GGCCGCGGTC CGTAAGCCTT AACCGGGCT (2) INFORMAÇÃO PARA SEQ ID NO: 73: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 21 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ií) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição: /desc = "ADN sintético; sequência nucleotídica para o oligo 0339" (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 73: CGGTTGTTGC TTTCGGTCCG C 21 (2) INFORMAÇÃO PARA SEQ ID NO: 74: li) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 29 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição: /desc = "ADN sintético; sequência nucleotídica para o oligo 0340" (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 74: j GGCCGCGGAC CGAAAGCAAC AACCGGGCT 29
(2) INFORMAÇÃO PARA SEQ ID NO: 75: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 18 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição: /desc = "ADN sintético; sequência nucleotídica para o oligo 0341" (iii) HIPOTÉTICO: não {iv) ANTI-SENTIDO: não (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 75: CGGTTCGGGC TTTCCCGC 18 (2) INFORMAÇÃO PARA SEQ ID NO: 76: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 26 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição: /desc = "ADN sintético; sequência nucleotídica para o oligo 0342" (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 76: GGCCGCGGGA AAGCCCGAAC CGGGCT 26 (2) INFORMAÇÃO PARA SEQ ID NO: 77: (i) CARACTERÍSTICAS DA SEQUÊNCIA:
83 886 ΕΡ Ο 669 394/ΡΤ 123
(A) COMPRIMENTO: 18 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição: /desc = "ADN sintético; sequência nucleotídica para o oligo 0343" (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 77: CGGTTAAGGC TTACCCGC 18 (2) INFORMAÇÃO PARA SEQ ID NO: 78: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 26 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição: /desc = "ADN sintético; sequência nucleotídica para o oligo 0344 (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 78: GGCCGCGGGT AAGCCTTAAC CGGGCT (2) INFORMAÇÃO PARA SEQ ID NO: 79: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 18 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear 26 124 83 886 ΕΡ Ο 669 394/ΡΤ (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição: /desc = "ADN sintético; sequência nucleotídica para o oligo 0347” (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 79: CGGTTGTTGC TTTCCCGC 18 (2) INFORMAÇÃO PARA SEQ ID NO: 80: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 26 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição: /desc = "ADN sintético; sequência nucleotídica para o oligo 0348" (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 80: GGCCGCGGGA AAGCAACAAC CGGGCT 26 (2) INFORMAÇÃO PARA SEQ ID NO: 81: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 18 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição: /desc = "ADN sintético; sequência nucleotídica para o oligo 0381"
(iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 81: CGGTTAAGGC TTGGCCGC 18 (2) INFORMAÇÃO PARA SEQ ID NO: 82: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 26 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição: /desc = "ADN sintético; sequência nucleotídica para o oligo 0383" (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 82: GGCCGCGGCC AAGCCTTAAC CGGGCT 26 (2) INFORMAÇÃO PARA SEQ ID NO: 83: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 18 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição: /desc = "ADN sintético; sequência nucleotídica para o oligo 0384" (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não
83 886 ΕΡ Ο 669 394/ΡΤ 126
<χϊ) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 83: 18
CGGTTAAGGC TTTCCCGC (2) INFORMAÇÃO PARA SEQ ID NO: 84: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 26 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição: /desc = "ADN sintético; sequência nucleotídica para o oligo 0385" (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 84: GGCCGCGGGA AAGCCTTAAC CGGGCT 26 (2) INFORMAÇÃO PARA SEQ ID NO: 85: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 18 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição: /desc = "ADN sintético; sequência nucleotídica para o oligo 0386" (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 85: CGGTTGTAGT TTTCCCGC 18
83 886 ΕΡ Ο 669 394/ΡΤ
127 (2) INFORMAÇÃO PARA SEQ ID NO: 86: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 18 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição: /desc = "ADN sintético; sequência nucleotídica para o oligo 0387 (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não íxi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 86: 18
CGGTTGAAGT TTTCCCGC (2) INFORMAÇÃO PARA SEQ ID NO: 87: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 26 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição: /desc = "ADN sintético; sequência nucleotídica para o oligo 0388 (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 87: GGCCGCACTA CAACTACAAC CGGGCT (2) INFORMAÇÃO PARA SEQ ID NO: 88: 26
(i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 18 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição: /desc = "ADN sintético; sequência nucleotídica para o oligo 0389" (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 88: CGGTTGTAGT TGTAGTGC 18 (2) INFORMAÇÃO PARA SEQ ID NO: 89: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 26 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição: /desc = "ADN sintético; sequência nucleotídica para o oligo 0390" (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 89: GGCCGCGGGA AAACTTCAAC CGGGCT 26 (2) INFORMAÇÃO PARA SEQ ID NO: 90: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 26 pares de bases (B) TIPO: nucleótido 129 83 886 ΕΡ Ο 669 394/ΡΤ (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição: /desc = "ADN sintético; sequência nucleotídica para o oligo 0391" (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 90: GGCCGCGGGA AAACTACAAC CGGGCT 2 6 (2) INFORMAÇÃO PARA SEQ ID NO: 91: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 72 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição: /desc = "ADN sintético; sequência nucleotídica para o oligo 0392” (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 91: CTAGCTTATT CGTTTTTTTC TTCGTCTTCC CAGAACGGTT CGTATTTGTC GTTCGGGTTC 60 CGCAGCAGGA AC 72 (2) INFORMAÇÃO PARA SEQ ID NO: 92: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 72 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear 130 83 886 ΕΡ Ο 669 394/ΡΤ (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição: /desc = "ADN sintético; sequência nucleotídica para o oligo 0393" (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 92: GGCCGTTCCT GCTGCGGAAC CCGAACGACA AATACGAACC GTTCTGGGAA GACGAAGAAA 60 AAAACGAATA AG 72 (2) INFORMAÇÃO PARA SEQ ID NO: 93: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1 8 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição: /desc = "ADN sintético; sequência nucleotídica para o oligo 0453” (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 93: TGGTTAAAGC TTTCCCGC 18 (2) INFORMAÇÃO PARA SEQ ID NO: 94: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 26 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição: /desc = "ADN sintético; sequência nucleotídica para o oligo 0454"
(iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 94: GGCCGCGGGA AAGCTTTAAC CAGGCT 26 (2) INFORMAÇÃO PARA SEQ ID NO: 95: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 18 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição: /desc = "ADN sintético; sequência nucleotídica para o oligo 0455" (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 95: TGGTTGTTGC TTTCCCGC 18 (2) INFORMAÇÃO PARA SEQ ID NO: 96: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 26 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição: /desc = "ADN sintético; sequência nucleotídica para o oligo 0456" (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não
132 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 96: GGCCGCGGGA AAGCAACAAC CAGGCT 26 (2) INFORMAÇÃO PARA SEQ ID NO: 97: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 47 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição: /desc = "ADN sintético; sequência nucleotídica para o oligo 0465" (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 97: GGCCGCGGGA ACAGAGCCAG ACCGTTTTCT TCTTTGGTGT GAGAACG 47 (2) INFORMAÇÃO PARA SEQ ID NO: 98: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 47 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição: /desc = "ADN sintético; sequência nucleotídica para o oligo 0466" (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não
(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 98: GATCCGTTCT CACACCAAAG AAGAAAACGG TCTGGCTCTG TTCCCGC 47 (2) INFORMAÇÃO PARA SEQ ID NO: 99: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 38 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição: /desc = "ADN sintético; sequência nucleotídica para o oligo 0467” (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 99: CGGTTAAGGC TTTCCCGCGG CCGTTCCTGC TGCGGAAC 38 (2) INFORMAÇÃO PARA SEQ ID NO: 100: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 54 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição: /desc = "ADN sintético; sequência nucleotídica para o oligo 0468" (iii) HIPOTÉTICO: não (iv) ANTI-SENTIDO: não (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 100: 54
TTTGTCGTTC GGGTTCCGCA GCAGGAACGG CCGCGGGAAA GCCTTAACCG GGCT 134 83 886 ΕΡ Ο 669 394/ΡΤ (2) INFORMAÇÃO PARA SEQ ID NO: 101: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 44 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição: /desc = "ADN sintético; sequência nucleotídica para o oligo 0469" (iii) HIPOTÉTICO: não (iv) ANTl-SENTIDO: não íxi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 101: CTAGCTTATT CGTTTTTTTC TTCGTCTTCC CAGAACGGTT CGTA 44 (2) INFORMAÇÃO PARA SEQ ID NO: 102: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 52 pares de bases (B) TIPO: nucleótido (C) TIPO DE CADEIA: cadeia simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: outro ácido nucleico (A) Descrição: /desc = "ADN sintético; sequência nucleotídica para o oligo 0470” (iii) HIPOTÉTICO: não (iv) ANTl-SENTIDO: não (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 102: CCGAACGACA AATACGAACC GTTCTGGGAA GACGAAGAAA AAAACGAATA AG 52
Lisboa, 26. M 2000
Por GRLJNENTHAL GmbH - O AGENTE OFICIAL -
Claims (16)
- 83 886 ΕΡ Ο 669 394/ΡΤ 1/4REIVINDICAÇÕES 1. Variante de uroquinase bifuncional, de fórmula geral M4-X,-Y em que M4 significa a sequência de aminoácidos 47Ser a 411 Leu da pro-uroquinase não glicosilada, de acordo com a figura 1 (SEQ ID NO: 21 e 22), ΧΊ é uma ligação directa entre M4 e Y, ou representa um péptido de sequência Ser-Pro-Pro-Ser-Pro-Pro-Gly-Gly-Phe ou Ser-Pro-Pro-Ser-Pro-Pro-Ser-Pro-Pro-Gly-Gly-Phe ou Ser-Pro-Pro-Ser-Pro-Pro-Ser-Pro-Pro-Gly-Gly-Phe-Gly ou uma sequência peptídica de fórmula geral IIem que X2 significa Pro ou Leu, X3 significa Val ou Pro, X4 significa Lys, Vai, Arg, Gly ou Glu, X5 significa Ala, Val, Gly, Leu ou lie, X6 significa Phe, Trp, Tyr ou Val, e X7 significa Gly ou uma ligação directa entre X6 e Y,, e Y, representa um péptido de sequência Y2-Arg-Pro-Y3-Gly-Gly-Gly-Gly-Asn-Gly-Asp-Phe-Glu-Glu-lle-Pro-Glu-Glu-Tyr-Leu-Y483 886 ΕΡ Ο 669 394/ΡΤ 2/4 OU Y2-Arg-Pro-Phe-Leu-Leu-Arg-Asn-Pro-Asn-Asp-Lys-Tyr-Glu-Pro-Phe-Trp-Glu-Asp- Glu-Glu-Lys-Asn-Glu ou Y2-Arg-Pro-Ser-Ser-Glu-Phe-Glu-Glu-Phe-Glu-lle-Asp-Glu-Glu-Glu-Lys, onde Y2 significa Pro ou Vai, Y3 significa Leu ou uma ligação directa entre Pro e Gly, e Y4 significa Gin ou um grupo hidroxilo.
- 2. Variante de uroquinase de acordo com a reivindicação 1, caracterizada por Y, significar um péptido de sequência Y2-Arg-Pro-Y3-Gly-Gly-Gly-Gly-Asn-Gly-Asp-Phe-Glu-Glu-lle-Pro-Glu-Glu-Tyr-Leu-Y4.
- 3. Variante de uroquinase de acordo com a reivindicação 1, caracterizada por Y, significar um péptido da sequência Y2-Arg-Pro-Phe-Leu-Leu-Arg-Asn-Pro-Asn-Asp-Lys-Tyr-Glu-Pro-Phe-Trp-Glu-Asp- Glu-Glu-Lys-Asn-Glu.
- 4. Variante de uroquinase de acordo com a reivindicação 1 e/ou a reivindicação 2, caracterizada por X, representar uma sequência peptídica de fórmula geral II em que X2 significa Pro ou Leu, X3 significa Vai, X4 significa Lys, Vai ou Arg, X5 significa Ala, Vai ou Gly, X6 significa Phe, Trp, Tyr ou Vai, e X7 significa Gly ou uma ligação directa entre X6 e Y,.
- 5. Variante de uroquinase de acordo com a reivindicação 4, caracterizada por X4 significar Lys ou Vai, X5 significar Ala ou Vai, X6 significar Phe, Trp ou Tyr, e X7 significar Gly ou uma ligação directa entre X6 e Y,.
- 6. Variante de uroquinase de acordo com a reivindicação 4 e/ou a reivindicação 5, caracterizada por X7 ser uma ligação directa entre X6eYv
- 7. Variante de uroquinase de acordo com a reivindicação 1 e/ou a reivindicação 3, caracterizada por X, representar uma sequência peptídica de83 886 ΕΡ Ο 669 394/ΡΤ 3/4 fórmula geral II em que X2 significa Pro ou Leu, X3 significa Vai, X4 significa Lys ou Vai, X5 significa Ala ou Vai, X6 significa Phe ou Trp, e X7 significa uma ligação directa entre X6 e
- 8. Plasmídeo para a utilização na obtenção de uma variante de uroquinase bifuncional de acordo com as reivindicações 1 a 7, caracterizado por o operão apresentar um promotor regulável, uma sequência de Shine-Dalgarno que actua como local de ligação de ribossomas, um códão de iniciação, um gene estrutural sintético para uma variante de uroquinase bifuncional de fórmula geral I de acordo com as reivindicações 1 a 7 e, a jusante do gene estrutural, 1 ou 2 terminadores, e por o plasmídeo ser apropriado para a expressão da variante de uroquinase bifuncional em estirpes de Escherichia coli.
- 9. Plasmídeo de acordo com a reivindicação 8, caracterizado por a distância entre a sequência de Shine-Dalgarno e o codão de iniciação ser de 6-12, de preferência 8-10 nucleótidos.
- 10. Plasmídeo de acordo com a reivindicação 8 e/ou a reivindicação 9, seleccionado de entre o grupo que consiste em pSJ 69, pSJ 76, pSJ 77, pSJ 78, pSJ 79, pSJ 81, pSJ 83, pSJ 90, pSJ 91, pSJ 92, pSJ 93, pSJ 94, pSJ 95, pSJ 101, pSJ 102, pSJ 103, pSJ 104, pSJ 105, pSJ 106, pSJ 109, pSJ 111, pSJ 114epSJ 113.
- 11. Plasmídeo de acordo com a reivindicação 10, seleccionado de entre o grupo que consiste em pSJ 76, pSJ 81, pSJ 83, pSJ 90, pSJ 91, pSJ 92, pSJ 93, pSJ 94, pSJ 95, pSJ 101, pSJ 102, pSJ 103, pSJ 105, pSJ 106, pSJ 109, pSJ 111 e pSJ 114.
- 12. Plasmídeo de acordo com a reivindicação 10 e/ou a reivindicação 11, seleccionado de entre o grupo que consiste em pSJ 76, pSJ 81, pSJ 83, pSJ 91, pSJ 92, pSJ 94, pSJ 95, pSJ 101, pSJ 102, pSJ 103, pSJ 106, pSJ 109, pSJ 111 e pSJ 114.
- 13. Plasmídeo de acordo com uma ou várias das reivindicações 10 a 12, seleccionado de entre o grupo que consiste em pSJ 76, pSJ 94, pSJ 95, pSJ 101, pSJ 102, pSJ 103, pSJ 106, pSJ 109, pSJ 111 e pSJ 114. 83 886 ΕΡ Ο 669 394/ΡΤ 4/4
- 14.Processo para a produção de plasmídeos de acordo com as reivindicações 8 a 13, caracterizado por se obter os plasmídeos pBluescriptKSII + , pUC 8 e pGR 201, de acordo com as figuras 2 e 2a a 2p. 5.Utilização de um plasmídeo de acordo com as reivindicações 8 a 13 na obtenção de uma variante de uroquinase bifuncional de fórmula geral I de acordo com as reivindicações 1 a 7, caracterizada por se transformar com um plasmídeo, de maneira em princípio usual, uma estirpe de Escherichia coli, por se induzir a expressão do gene estrutural, por se separar a proteína precursora formada, da variante de uroquinase bifuncional de fórmula geral I, do meio e das células bacterianas lisadas, por se solubilizar a proteína precursora e por se redobrar esta a seguir, por acção de um sistema redox, no polipéptido de fórmula geral I.
- 16. Agente trombolítico contendo como substância activa uma variante de uroquinase bifuncional de fórmula geral I de acordo com as reivindicações 1 a 7.
- 17. Agente trombolítico trombolítico de acordo com a reivindicação 16, caracterizado por ser apropriado para aplicação em bo/us. Lisboa, 26. áSR. 2000 Por GRÚNENTHAL GmbH - O AGENTE OFICIAL -
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DE4323754A DE4323754C1 (de) | 1993-07-15 | 1993-07-15 | Bifunktionelle Urokinasevarianten mit verbesserten fibrinolytischen Eigenschaften und thrombinhemmender Wirkung |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| PT669394E true PT669394E (pt) | 2000-07-31 |
Family
ID=6492909
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| PT94108872T PT669394E (pt) | 1993-07-15 | 1994-06-09 | Variantes de uroquinase bifuncionais com propriedades fibrinoliticas melhoradas e actividade inibidora de trombina |
Country Status (26)
| Country | Link |
|---|---|
| US (2) | US5681721A (pt) |
| EP (1) | EP0669394B1 (pt) |
| JP (1) | JPH07143878A (pt) |
| KR (1) | KR960014346A (pt) |
| CN (1) | CN1057124C (pt) |
| AT (1) | ATE189261T1 (pt) |
| AU (1) | AU679512B2 (pt) |
| CA (1) | CA2127897A1 (pt) |
| CZ (1) | CZ288536B6 (pt) |
| DE (2) | DE4323754C1 (pt) |
| DK (1) | DK0669394T3 (pt) |
| ES (1) | ES2145075T3 (pt) |
| FI (1) | FI943354L (pt) |
| GR (1) | GR3032488T3 (pt) |
| HR (1) | HRP940366B1 (pt) |
| HU (1) | HU217101B (pt) |
| IL (1) | IL109107A0 (pt) |
| NO (1) | NO941561L (pt) |
| NZ (1) | NZ260991A (pt) |
| PL (1) | PL176971B1 (pt) |
| PT (1) | PT669394E (pt) |
| RU (1) | RU2143490C1 (pt) |
| SI (1) | SI0669394T1 (pt) |
| SK (1) | SK281586B6 (pt) |
| UA (1) | UA27132C2 (pt) |
| ZA (1) | ZA944202B (pt) |
Families Citing this family (12)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE4440892A1 (de) * | 1994-11-17 | 1996-05-23 | Gruenenthal Gmbh | Proteine mit fibrinolytischen und gerinnungshemmenden Eigenschaften |
| DE4442665A1 (de) * | 1994-11-30 | 1996-06-05 | Gruenenthal Gmbh | Chimäre Proteine mit fibrinolytischen und thrombinhemmenden Eigenschaften |
| CN1057125C (zh) * | 1996-04-26 | 2000-10-04 | 南京大学 | 五种尿激酶变体基因及在大肠杆菌中的表达 |
| CN1111739C (zh) * | 1997-02-04 | 2003-06-18 | 许文俊 | 凝血、纤溶功能动态测定试剂 |
| WO1999037149A1 (en) * | 1998-01-27 | 1999-07-29 | Brigham & Women's Hospital | Methods of treating cytotoxic damage |
| US7498310B1 (en) | 1998-08-13 | 2009-03-03 | Beiersdorf Ag | Cosmetic or dermatological preparations comprising oligopeptides for lightening the skin of age marks and/or for preventing tanning of the skin, in particular tanning of the skin caused by UV radiation |
| WO2001097752A2 (en) * | 2000-06-20 | 2001-12-27 | The Trustees Of The University Of Pennsylvania | Compositions comprising urokinase for modulating muscle contractility and angiogenisis |
| US7361493B1 (en) | 2004-05-26 | 2008-04-22 | The United States Of America As Represented By The Secretary Of The Department Of Veterans Affairs | Production of urokinase in a three-dimensional cell culture |
| WO2006045503A1 (en) | 2004-10-19 | 2006-05-04 | Lonza Ag | Method for solid phase peptide synthesis |
| CN104193807B (zh) * | 2014-09-28 | 2016-06-15 | 广州贝奥吉因生物科技有限公司 | 凝血酶抑制多肽及其制备方法、应用 |
| CN105385617A (zh) * | 2015-09-23 | 2016-03-09 | 河北省科学院生物研究所 | 一株产纤溶酶的海洋放线菌株、用途以及由其制备的纤溶酶及纤溶酶的应用 |
| EP3555116A4 (en) * | 2016-12-16 | 2020-07-22 | The University Of Sydney | THROMBIN INHIBITORS FOR THE TREATMENT OF CEREBRAL VASCULAR ACCIDENT AND RELATED BLEEDING DISORDERS |
Family Cites Families (18)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US3930944A (en) * | 1975-03-31 | 1976-01-06 | Abbott Laboratories | Urokinase production |
| DE3445517C2 (de) * | 1984-12-13 | 1993-11-18 | Ciba Geigy | Für ein Hirudin-ähnliches Protein codierende DNA-Sequenz und Verfahren zur Herstellung eines Hirudin-ähnlichen Proteins |
| US4751180A (en) * | 1985-03-28 | 1988-06-14 | Chiron Corporation | Expression using fused genes providing for protein product |
| US5002887A (en) * | 1986-01-31 | 1991-03-26 | Genetics Institute, Inc. | Truncated thrombolytic proteins |
| DE3886517T2 (de) * | 1987-08-19 | 1994-04-21 | Central Glass Co Ltd | Menschlicher Prourokinase ähnliches Polypeptid. |
| DE3804600A1 (de) * | 1988-02-13 | 1989-08-24 | Basf Ag | Mischung aus einer thrombolytisch wirkenden und einer antithrombotischen substanz |
| GB8822147D0 (en) * | 1988-09-21 | 1988-10-26 | Ciba Geigy Ag | Pharmaceutically active combination |
| US5256770A (en) * | 1990-04-09 | 1993-10-26 | Schering Ag | Oxidation resistant thrombomodulin analogs |
| CA2064231A1 (en) * | 1989-07-20 | 1991-01-21 | John M. Maraganore | Combinations and methods for treating or preventing thrombotic diseases |
| GB8927722D0 (en) * | 1989-12-07 | 1990-02-07 | British Bio Technology | Proteins and nucleic acids |
| US5328898A (en) * | 1990-06-22 | 1994-07-12 | Duke University | Factor XIIIA fibrin binding fragments |
| GB9015369D0 (en) * | 1990-07-12 | 1990-08-29 | Erba Carlo Spa | Amidated fibrinolytic enzymes and their precursors,and processes for their preparation |
| US5242810A (en) * | 1990-12-07 | 1993-09-07 | Biogen, Inc. | Bifunctional inhibitors of thrombin and platelet activation |
| US5688768A (en) * | 1991-02-19 | 1997-11-18 | Cor Therapeutics, Inc. | Recombinant thrombin receptor and related pharmaceuticals |
| WO1992018139A1 (en) * | 1991-04-09 | 1992-10-29 | Brigham And Women's Hospital | Chimeric molecule with plasminogen activator activity and affinity for atherosclerotic plaques |
| US5376367A (en) * | 1991-11-22 | 1994-12-27 | Immunex Corporation | Fusion proteins comprising MGF and IL-3 |
| US5571708A (en) * | 1993-04-19 | 1996-11-05 | Bristol-Myers Squibb Company | Thrombin-activatable plasminogen activator |
| RU2061043C1 (ru) * | 1993-11-16 | 1996-05-27 | Научно-производственная фирма "Нарт" | Способ повышения устойчивости урокиназы к нагреванию |
-
1993
- 1993-07-15 DE DE4323754A patent/DE4323754C1/de not_active Expired - Fee Related
- 1993-07-20 US US08/093,741 patent/US5681721A/en not_active Expired - Fee Related
-
1994
- 1994-03-24 IL IL10910794A patent/IL109107A0/xx unknown
- 1994-04-28 NO NO941561A patent/NO941561L/no not_active Application Discontinuation
- 1994-06-03 AU AU64525/94A patent/AU679512B2/en not_active Ceased
- 1994-06-09 AT AT94108872T patent/ATE189261T1/de not_active IP Right Cessation
- 1994-06-09 ES ES94108872T patent/ES2145075T3/es not_active Expired - Lifetime
- 1994-06-09 DK DK94108872T patent/DK0669394T3/da active
- 1994-06-09 DE DE59409104T patent/DE59409104D1/de not_active Expired - Fee Related
- 1994-06-09 EP EP94108872A patent/EP0669394B1/de not_active Expired - Lifetime
- 1994-06-09 SI SI9430300T patent/SI0669394T1/xx unknown
- 1994-06-09 PT PT94108872T patent/PT669394E/pt unknown
- 1994-06-14 ZA ZA944202A patent/ZA944202B/xx unknown
- 1994-06-23 HR HRP4323754.1 patent/HRP940366B1/xx not_active IP Right Cessation
- 1994-07-08 UA UA94075621A patent/UA27132C2/uk unknown
- 1994-07-11 HU HU9402063A patent/HU217101B/hu not_active IP Right Cessation
- 1994-07-12 RU RU94026095A patent/RU2143490C1/ru active
- 1994-07-12 CN CN94108262A patent/CN1057124C/zh not_active Expired - Fee Related
- 1994-07-13 NZ NZ260991A patent/NZ260991A/xx unknown
- 1994-07-13 CA CA002127897A patent/CA2127897A1/en not_active Abandoned
- 1994-07-13 KR KR1019940016792A patent/KR960014346A/ko not_active Ceased
- 1994-07-14 FI FI943354A patent/FI943354L/fi unknown
- 1994-07-14 CZ CZ19941706A patent/CZ288536B6/cs not_active IP Right Cessation
- 1994-07-14 SK SK845-94A patent/SK281586B6/sk unknown
- 1994-07-14 PL PL94304290A patent/PL176971B1/pl unknown
- 1994-07-14 JP JP6162445A patent/JPH07143878A/ja active Pending
-
1996
- 1996-09-27 US US08/720,012 patent/US5747291A/en not_active Expired - Fee Related
-
2000
- 2000-01-27 GR GR20000400181T patent/GR3032488T3/el not_active IP Right Cessation
Also Published As
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| DE3613390C2 (de) | Einkettige Human-Gewebeplasminogen-Aktivator (t-PA)-Mutanten, kodierende DNA, Expressionsvektor, Mikroorganismus, Zellkultur und pharmazeutische Zusammensetzung | |
| US5759542A (en) | Compositions and methods for the delivery of drugs by platelets for the treatment of cardiovascular and other diseases | |
| FI88932B (fi) | Framstaellning av funktionellt maenskligt urokinasprotein | |
| JP2559538B2 (ja) | 組織プラスミノーゲン活性化因子の誘導体 | |
| PT669394E (pt) | Variantes de uroquinase bifuncionais com propriedades fibrinoliticas melhoradas e actividade inibidora de trombina | |
| US5232847A (en) | Human tissue plasminogen activator analogue having substitutions at amino acid positions 66, 67 and 68 | |
| CA2163925A1 (en) | Chimeric proteins having fibrinolytic and thrombin-inhibiting properties | |
| JPH1080271A (ja) | 血管障害治療のための改良法 | |
| CA2162986A1 (en) | Proteins having fibrinolytic and coagulation-inhibiting properties | |
| JPH04252185A (ja) | アミド化繊維素溶解酵素及びその前駆体並びにその製造方法 | |
| JPH0327286A (ja) | 組織プラスミノーゲン活性化因子の誘導体 | |
| WO1993024624A1 (fr) | Modification du tpa | |
| JPWO1993020194A1 (ja) | t−PA類似体 | |
| HK1010111A (en) | Chimera proteins with fibrinolytic and coagulation inhibiting characteristics | |
| HU210529A9 (hu) | Zimogén vagy fibrinspecifikus tulajdonságokkal rendelkező szöveti plazminogén aktivátor Az átmeneti oltalom az 1-7. igénypontra vonatkozik. |